본문 바로가기
HOME> 논문 > 논문 검색상세

논문 상세정보

韓國컴퓨터情報學會論文誌 = Journal of the Korea Society of Computer and Information v.15 no.1=no.70, 2010년, pp.177 - 183   피인용횟수: 11
본 등재정보는 저널의 등재정보를 참고하여 보여주는 베타서비스로 정확한 논문의 등재여부는 등재기관에 확인하시기 바랍니다.

공유모델 인식 성능 향상을 위한 효율적인 연속 어휘 군집화 모델링
Efficient Continuous Vocabulary Clustering Modeling for Tying Model Recognition Performance Improvement

안찬식    (광운대학교 컴퓨터공학과   ); 오상엽    (경원대학교 IT대학 컴퓨터미디어학과  );
  • 초록

    연속 어휘 인식 시스템에서는 통계적 방법에 의한 어휘 인식을 수행하기 위하여 확률분포를 이용하며 이는 음소 단위의클러스터링을사용하여모델링하여샘플들을기반으로 확률 파라미터를 추정한다. 어휘 검색 시 추정된 확률 파라미터로부터 인식 결과를 나타내는데 미리 정의되지 않은 음소와 추가되어진 음소로부터 인식률이 저하되는 문제점이 발생하며, 하나의 클러스터링으로 모델링하므로 가우시안 모델이 정확성을 확보하지 못한다는 단점이 있다. 이를 개선하기 위하여 확률 분포의 혼합 가우시안 모델을 최적화하여 유사도를 기반으로 Euclidean과 Bhattacharyya 거리 측정 방법을 혼합한 군집화 모델을 제안하고, 군집화된 모델에서 음소 단위로 확률 모델을 탐색할 수 있는 시스템을 모델링하였다. 본 논문에서 제안한 시스템을 적용한 결과 시스템 성능에서 어휘 종속 인식률은 98.63%, 어휘 독립 인식률은 97.91%의 인식률을 나타내었다.


    In continuous vocabulary recognition system by statistical method vocabulary recognition to be performed using probability distribution it also modeling using phoneme clustering for based sample probability parameter presume. When vocabulary search that low recognition rate problem happened in express vocabulary result from presumed probability parameter by not defined phoneme and insert phoneme and it has it's bad points of gaussian model the accuracy unsecure for one clustering modeling. To improve suggested probability distribution mixed gaussian model to optimized for based resemble Euclidean and Bhattacharyya distance measurement method mixed clustering modeling that system modeling for be searching phoneme probability model in clustered model. System performance as a result of represent vocabulary dependence recognition rate of 98.63%, vocabulary independence recognition rate of 97.91%.


  • 주제어

    군집화 모델링 .   음소 모델링 .   모델 공유 .   가우시안 모델 .   어휘 인식.  

  • 참고문헌 (20)

    1. 김동주, 김한우, "문맥가중치가반영된문장유사도척도," 전자공학회논문지, 제43권, 제6호, 496-504쪽, 2006년. 3월 
    2. 김기백, 최종호, "음성인식 기반 컨텐츠 네비게이션 시스템," 한국컴퓨터정보학회지, 제 15권, 제 1호, 99-102쪽, 2007년 6월. 
    3. S. Ortmanns, A. Eiden, H. Ney, and N. Coenen, "Look-ahead Techniques for Fast Beam Search," InProc. IEEE ICASSP-1997, pp. 1783-1786, 1997. 
    4. Kris Demuynck, Tom Laureys, Dirk van Compernolle, and Hugo van Hamme, "FLaVor:a flexible architecture for LVCSR," In EUROSPEECH - 2003, pp.1973-1976, 2003. 
    5. Justin Zobel and Philip Dart, "Phonetic String Matching: Lessons from Information Retrival," SIGIR'96, pp.166-173, 1996. 
    6. T. Jitsuhiro, S. Takatoshi, and K. Aikawa, "Rejection of out-of-vocabulary words using phoneme confidence likelihood," ICASSP, pp. 217-220, 1998. 
    7. L. R. Bahl, P. V. deSouza, P. S. Gopalakrishnan, D. Nahamoo, and M. Picheny, "A Fast Match for Continuous Speech Recognition Using Allophonic Models," In Proc. IEEE ICASSP-92, Vol.1, pp.17-21, 1992. 
    8. W. Daelemans, S. Buchholz, and J. Veenstra, "Memorybased shallow parsing," in Proc. CoNLL, pp.53-60, 1999. 
    9. S. Young, D. Kershaw, J. Odell, D. Ollason, Valtcher, P. Woodland, "The HTK Book," Cambridge University Engineering Department, 2002. 
    10. L. R. Rabiner, B. H. Juang, "Fundamentals of speech recognition," Prentice Hall, 1993. 
    11. 안태옥, "혼합 가우시안 군집화를 이용한 상태공유 음향모델 최적화," 대한전자공학회논문지, 제 42권, SP편 제 6호, 167-176쪽, 2005년 11월. 
    12. D. Jurafsky and J. H. Martin, "Speech and Language Processing," Prentice-Hall, 2000. 
    13. 우인성, 신좌철, 강흥순, 김석동, "다양한 연속밀도 함수를 갖는 HMM에 대한 우리말 음성인식에 관한 연구," 전기전자학회 논문지, 제11권, 제2호, 89-94쪽, 2007년 6월. 
    14. 이호웅, 정희석, "지능형 홈네트워크 시스템을 위한 가변어휘 연속음성인식시스템에 관한 연구," 한국ITS학회 논문지, 제7권, 제2호, 37-42쪽, 2008년 4월. 
    15. K. Demuynck, J. Duchateau, and D. Van Compernolle, "A static lexicon network repre- sentation for cross-word context dependent phones," In Proc. EUROSPEECH, Vol.1, pp.143-146, 1997. 
    16. 조영수, 이기정, 김광태, 홍재근, "HMM을 이용한 한국어 음소인식," 대한전자공학회 학술발표회 논문집, 제 16권,제 1호, 81-84쪽, 1994년. 6월. 
    17. M. F. Gales, "Model-based techniques for nosie robust speech recognition," Ph. D. dissertation, University of Cambridge, Sept, 1995. 
    18. 안찬식, 오상엽, "MLHF 모델을 적용한 어휘 인식 탐색 최적화 시스템," 한국컴퓨터정보논문지, 제14권, 제10호, 217-223쪽, 2009년 10월. 
    19. A. S. Manos and V. W. Zue, "Astudy on out-of-vocabulary word modeling for a segment- based keyword spotting system," Master Thesis, MIT, 1996. 
    20. 김광호, 임민규, 김지환, "지식베이스를 이용한 임베디드용 연속음성인식의 어휘 적용률 개선," 대한음성학회지, 말소리, 제68호, 115-126쪽, 2008년 12월. 
  • 이 논문을 인용한 문헌 (11)

    1. Ahn, Chan-Shik ; Oh, Sang-Yeob 2010. "Key-word Error Correction System using Syllable Restoration Algorithm" 韓國컴퓨터情報學會論文誌 = Journal of the Korea Society of Computer and Information, 15(10): 165~172     
    2. Ahn, Chan-Shik ; Oh, Sang-Yeob 2010. "In Out-of Vocabulary Rejection Algorithm by Measure of Normalized improvement using Optimization of Gaussian Model Confidence" 韓國컴퓨터情報學會論文誌 = Journal of the Korea Society of Computer and Information, 15(12): 125~132     
    3. Ahn, Chan-Shik ; Oh, Sang-Yeob 2010. "Vocabulary Recognition Post-Processing System using Phoneme Similarity Error Correction" 韓國컴퓨터情報學會論文誌 = Journal of the Korea Society of Computer and Information, 15(7): 83~90     
    4. Oh, Sang-Yeob 2011. "Improving Phoneme Recognition based on Gaussian Model using Bhattacharyya Distance Measurement Method" 멀티미디어학회논문지 = Journal of Korea Multimedia Society, 14(1): 85~93     
    5. Lee, Byungwook 2013. "Improvement of the Semantic Information Retrieval using Ontology and Spearman Correlation Coefficients" 디지털정책연구 = The Journal of digital policy & management, 11(11): 351~357     
    6. Lee, Jong-Sub ; Oh, Sang-Yeob 2013. "Vocabulary Retrieve System using Improve Levenshtein Distance algorithm" 디지털정책연구 = The Journal of digital policy & management, 11(11): 367~372     
    7. Oh, Sang Yeon 2014. "Bayesian Method Recognition Rates Improvement using HMM Vocabulary Recognition Model Optimization" 디지털융복합연구 = Journal of digital convergence, 12(7): 273~278     
    8. Oh, Sang-Yeob 2015. "Vocabulary Recognition Model using a convergence of Likelihood Principla Bayesian methode and Bhattacharyya Distance Measurement based on Vector Model" 디지털융복합연구 = Journal of digital convergence, 13(11): 165~170     
    9. Oh, Sang-Yeob 2015. "Noise Removal using a Convergence of the posteriori probability of the Bayesian techniques vocabulary recognition model to solve the problems of the prior probability based on HMM" 디지털융복합연구 = Journal of digital convergence, 13(8): 295~300     
    10. Oh, Sang-Yeob 2015. "Vocabulary Recognition Performance Improvement using a convergence of Bayesian Method for Parameter Estimation and Bhattacharyya Algorithm Model" 디지털융복합연구 = Journal of digital convergence, 13(10): 353~358     
    11. Hwang, Jae-Chun 2016. "Voice Recognition Performance Improvement using the Convergence of Bayesian method and Selective Speech Feature" 한국융합학회논문지 = Journal of the Korea Convergence Society, 7(6): 7~11     

 저자의 다른 논문

  • 안찬식 (19)

    1. 2006 "A New Least Mean Square Algorithm Using a Running Average Process for Speech Enhancement" The journal of the Acoustical Society of Korea 25 (e3): 123~130    
    2. 2009 "MLHF 모델을 적용한 어휘 인식 탐색 최적화 시스템" 韓國컴퓨터情報學會論文誌 = Journal of the Korea Society of Computer and Information 14 (10): 217~223    
    3. 2010 "음절 복원 알고리즘을 이용한 핵심어 오류 보정 시스템" 韓國컴퓨터情報學會論文誌 = Journal of the Korea Society of Computer and Information 15 (10): 165~172    
    4. 2010 "미등록어 거절 알고리즘에서 가우시안 모델 최적화를 이용한 신뢰도 정규화 향상" 韓國컴퓨터情報學會論文誌 = Journal of the Korea Society of Computer and Information 15 (12): 125~132    
    5. 2010 "의미 분석과 형태소 분석을 이용한 핵심어 인식 시스템" 멀티미디어학회논문지 = Journal of Korea Multimedia Society 13 (11): 1586~1593    
    6. 2010 "스피어만 장관계수를 이용한 사용자 상황 및 특성 처리 개선" 멀티미디어학회논문지 = Journal of Korea Multimedia Society 13 (10): 1444~1452    
    7. 2010 "형상 형성 제어를 이용한 어휘인식 공유 모델의 가우시안 최적화" 韓國컴퓨터情報學會論文誌 = Journal of the Korea Society of Computer and Information 15 (2): 127~134    
    8. 2010 "바타챠랴 거리 측정법을 이용한 음소 유사율 오류 보정 개선 시스템" 韓國컴퓨터情報學會論文誌 = Journal of the Korea Society of Computer and Information 15 (6): 73~80    
    9. 2010 "상태 공유와 결정트리 방법을 이용한 효율적인 문맥 종속 프로세스 모델링" 멀티미디어학회논문지 = Journal of Korea Multimedia Society 13 (3): 369~377    
    10. 2010 "음향학적 및 언어적 탐색을 이용한 어휘 인식 최적화" 멀티미디어학회논문지 = Journal of Korea Multimedia Society 13 (4): 496~503    

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역

원문보기

무료다운로드
유료다운로드

유료 다운로드의 경우 해당 사이트의 정책에 따라 신규 회원가입, 로그인, 유료 구매 등이 필요할 수 있습니다. 해당 사이트에서 발생하는 귀하의 모든 정보활동은 NDSL의 서비스 정책과 무관합니다.

원문복사신청을 하시면, 일부 해외 인쇄학술지의 경우 외국학술지지원센터(FRIC)에서
무료 원문복사 서비스를 제공합니다.

NDSL에서는 해당 원문을 복사서비스하고 있습니다. 위의 원문복사신청 또는 장바구니 담기를 통하여 원문복사서비스 이용이 가능합니다.

이 논문과 함께 출판된 논문 + 더보기