본문 바로가기
HOME> 논문 > 논문 검색상세

논문 상세정보

일본어 합성기에서 유동 Break를 이용한 합성단위 선택 방법
A Unit Selection Methods using Flexible Break in a Japanese TTS

송영환   (숭실대학교 정보통신 전자공학부UU0000851  ); 나덕수   (보이스웨어 기술연구소CC0052920  ); 김종국   (숭실대학교 정보통신 전자공학부UU0000851  ); 배명진   (숭실대학교 정보통신 전자공학부UU0000851  ); 이종석   (보이스웨어 기술연구소CC0052920  );
  • 초록

    대용량 코퍼스를 이용하는 합성단위 선택(unit selection) 기반 합성기에서 break는 자연성 및 명료성에 큰 영향을 미치는 파라미터로 unit selection 과정에서 음소 정보와 함께 중요한 특징으로 사용된다. 일본어는 피치의 상대적 높낮이로 표현되는 악센트를 가지는 언어이고, 악센트의 변화에 따라 AP(Accentual Phrase)가 결정되고 AP 경계에서 break가 형성된다. break는 규칙 기반 방식이나 통계적 방식인 J-ToBI를 이용하여 예측 할 수 있으나 다양성으로 인해 정확한 예측이 어렵다. 따라서 본 논문에서는 다양한 운율 정보를 포함하고 있는 대용량 코퍼스의 장점을 이용하기 위해 break를 고정 break와 유동 break로 나누어 합성단위 검색을 수행한다. 실험 결과 제안한 합성단위 선택 방법으로 합성음의 자연성을 향상 시킬 수 있었다.


    In a large corpus-based speech synthesizer, a break, which is a parameter influencing the naturalness and intelligibility, is used as an important feature during a unit selection process. Japanese is a language having intonations, which ate indicated by the relative differences in pitch heights and the APs(Accentual Phrases) are placed according to the changes of the accents while a break occurs on a boundary of the APs. Although a break can be predicted by using J-ToBI(Japanese-Tones and Break Indices), which is a rule-based or statistical approach, it is very difficult to predict a break exactly due to the flexibility. Therefore, in this paper, a method is to conduct a unit search by dividing breaks into two types, such as a fixed break and a flexible break, in order to use the advantages of a large-scale corpus, which includes various types of prosodies. As a result of an experiment, the proposed unit selection method contributed itself to enhance the naturalness of synthesized speeches.


  • 주제어

    일본어 음성합성 .   합성단위 선택.  

  • 참고문헌 (7)

    1. R. E. Donovan, Trainable speech synthesis, PhD. Thesis, (Cambridge University, Engineering Department, 1996) pp.1-28 
    2. J. Venditti, Japanese ToBI labeling guidelines, (OSU Working Papers in Linguistics, 1997) pp. 127-162 
    3. 전성용, 일본어의 발음과 악센트, (1st ED, Japanese Technical Publishing Company, 2002) pp. 5-11 
    4. 나덕수, 이종석, 김종국, 배면진, '일본어 합성기에서 악센트 정보가 결합된 발음기호를 이용한 Break 예측 방법,' 대한음성학회, 말소리, 62, pp.69-84, 2007 
    5. Technical Standardization Committee on Speech Input/Output Systems, 'Speech Synthesis System Performance Evaluation Methods,' JEITA IT-4001, 42-45, 2003 
    6. A. Conkie, M. C. Beutnagel, A. K. Syrdal, P. E. Brown, 'Preselection of candidate units in a unit selection-based text-to-speech synthesis system,' Proc. ICSLP, 3, 314-317, 2000 
    7. 나덕수, 민소연, 이광형, 이종석, 배명진, '일본어 악센트 특징을 이용한 합성단위 선택 기반 일본어 TTS의 후보 합성단위의 사전선택 방법,' 한국음향학회지 26-4, pp.159-165, 2007     

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역

원문보기

무료다운로드
  • NDSL :
유료다운로드
  • 원문이 없습니다.

유료 다운로드의 경우 해당 사이트의 정책에 따라 신규 회원가입, 로그인, 유료 구매 등이 필요할 수 있습니다. 해당 사이트에서 발생하는 귀하의 모든 정보활동은 NDSL의 서비스 정책과 무관합니다.

원문복사신청을 하시면, 일부 해외 인쇄학술지의 경우 외국학술지지원센터(FRIC)에서
무료 원문복사 서비스를 제공합니다.

NDSL에서는 해당 원문을 복사서비스하고 있습니다. 위의 원문복사신청 또는 장바구니 담기를 통하여 원문복사서비스 이용이 가능합니다.

이 논문과 함께 출판된 논문 + 더보기