본문 바로가기
HOME> 논문 > 논문 검색상세

논문 상세정보

혼합정규분포의 모수 추정에서 구간도수 EM 알고리즘의 실행 속도 개선
Speedup of EM Algorithm by Binning Data for Normal Mixtures

오창혁   (영남대학교 통계학과UU0000951  );
  • 초록

    혼합정규분포로부터 얻은 자료의 크기가 크면 EM 알고리즘으로 모수를 추정하는 경우 추정에 많은 시간이 걸리며 이는 실시간 음성인식 분야등에서는 적용이 어렵게 되는 문제가 발생한다. 대용량 자료를 구간도수로 요약하여 구간도수 EM 알고리즘을 적용하면 표준 EM 알고리즘에 비해 실행속도가 획기적으로 개선되며 더욱이 구간도수 EM 알고리즘에서의 추정치의 효율성이 표준 EM 알고리즘에 근접함을 시뮬레이션 실험을 통하여 보였다.


    For a large data set the high computational cost of estimating the parameters of normal mixtures with the conventional EM algorithm is crucially impedimental in applying the algorithm to the areas requiring high speed computation such as real-time speech recognition. Simulations show that the binned EM algorithm, being compared to the standard one, significantly reduces the cost of computation without loss in accuracy of the final estimates.


  • 주제어

    구간도수 EM 알고리즘 .   모의 실험 .   실행 속도 .   혼합정규분포.  

  • 참고문헌 (10)

    1. Stuttle, M. N. and Gales, M. J. F. (2001). A mixture of Gaussians front end for speech recognition. In Proceedings Eurospeech 2001 
    2. Zolfaghari, P. and Robinson, T. (1996). Formant analysis using mixtures of Gaussians. In Proceedings ICSLP 96: Fourth International Conference on Spoken Language Processing 
    3. Zolfaghari, P. and Robinson, T. (1997). A segmental formant vocoder based on linearly varying mixture of Gaussians. In Proceedings Eurospeech '97 
    4. McLachlan, G. J. and Krishnan, T. (1997). The EM Algorithm and Extensions. John Wiley & Sons, New York 
    5. Rabiner, L. and Juang, B. (1993). Fundamentals of Speech Recognition, Prentice Hall, New Jersey 
    6. Same, A., Ambroise, C. and Govaert, G. (2006). A classification EM algorithm for binned data. Computational Statistics & Data Analysis, 51, 466-480 
    7. Dempster, A. P., Laird, N. M. and Rubin, D. B. (1977). Maximum likelihood from incomplete data via the EM algorithm. Journal of the Royal Statistical Society, Ser. B, 39, 1-38 
    8. Fu, Z., Yang, J., Hu, W. and Tan, T. (2004). Mixture clustering using multidi- mensional histogram for skin detection. In Proceedings of the 17th International Conference on Pattern Recognition, 4, 549-552 
    9. Cadez, I. V., McLachlan, G. J. and McLaren, C. E. (2002). Maximum likelihood estimation of mixture densities for binned and truncated multivariate data. Machine Learning, 47, 7-34 
    10. McLachlan, G. J. and Jones, P. N. (1988). Fitting mixture models to grouped and truncated data via the EM algorithm. Biometrics, 44, 571-578 

 저자의 다른 논문

  • 오창혁 (21)

    1. 1994 "퍼지확률회귀모형(確率回歸模型)" Journal of statistical theory & methods = 統計理論方法硏究 5 (1): 49~57    
    2. 1996 "'통계이론방법연구'의 편집에 관한 소고와 원고 작성 요령" Journal of statistical theory & methods = 統計理論方法硏究 7 (1): 161~170    
    3. 1999 "Design of a Statistical Package for Hidden Markov Models and it's Construction" 한국통계학회 논문집 = Communications of the Korean Statistical Society 6 (3): 861~870    
    4. 2002 "Implementaion and Use of a COM Component for Distribution Number Generation" Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지 13 (1): 17~23    
    5. 2006 "A Web-based SAS System for Lab Statistics" Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지 17 (2): 395~400    
    6. 2006 "Estimation in Mixture of Shifted Poisson Distributions with Known Shift Parameters" Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지 17 (3): 785~794    
    7. 2006 "Estimation in Mixture of Shifted Poisson Distributions" Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지 17 (4): 1209~1217    
    8. 2007 "A Smoothing Method for Stock Price Prediction with Hidden Markov Models" Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지 18 (4): 945~953    
    9. 2008 "숨은마코프모형을 이용하는 음성 끝점 검출을 위한 이산 특징벡터" 응용통계연구 = The Korean journal of applied statistics 21 (6): 959~967    
    10. 2008 "숨은마코프모형을 이용하는 음성구간 추출을 위한 특징벡터" 한국통계학회 논문집 = Communications of the Korean Statistical Society 15 (2): 293~302    

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역

원문보기

무료다운로드
  • NDSL :
  • 한국통계학회 : 저널
유료다운로드

유료 다운로드의 경우 해당 사이트의 정책에 따라 신규 회원가입, 로그인, 유료 구매 등이 필요할 수 있습니다. 해당 사이트에서 발생하는 귀하의 모든 정보활동은 NDSL의 서비스 정책과 무관합니다.

원문복사신청을 하시면, 일부 해외 인쇄학술지의 경우 외국학술지지원센터(FRIC)에서
무료 원문복사 서비스를 제공합니다.

NDSL에서는 해당 원문을 복사서비스하고 있습니다. 위의 원문복사신청 또는 장바구니 담기를 통하여 원문복사서비스 이용이 가능합니다.

이 논문과 함께 출판된 논문 + 더보기