본문 바로가기
HOME> 논문 > 논문 검색상세

논문 상세정보

성별 구별방법에 의한 자동차 내 음성 인식 성능 향상
Improving the Performance of a Speech Recognition System in a Vehicle by Distinguishing Male/Female Voice

양진우   (춘천기능대학 전자과UU0001292  ); 김순협   (광운대학교 컴퓨터공학과UU0000194  );
  • 초록

    본 논문은 주행중인 자동차 환경에서 운전자의 안전성 및 편의성의 동시 확보를 위하여, 보조적인 스위치 조작 없이 상시 음성의 입, 출력이 가능한 시스템을 제안하였다. 이대 잡음에 강인한 threshold 값을 구하기 위하여, 1.5초마다 기준 에너지와 영 교차율을 변경하였으며 대역 통과 여과기를 이용하여 1차, 2차로 나누어 실시간 상태에서 자동으로, 정확하게 끝점 검출을 처리하였다. 또한 남성, 여성을 피치검출로 구분하여 모델을 선택하게 하였고, 주행중인 자동차 속도에 따라 가장 적합한 모델을 사용하기 위하여 Idle-40km, 40-80km, 80-100km로 구분하여 남성, 여성 모델을 각각 구분하여 인식할 수 있게 하였다. 그리고, 음성의 특징 벡터와 인식 알고리즘은 PLP 13차와 OSDP(one-Stage Dynamic Programming)을 사용하였다. 본 실험은 서울시내 도로 및 내부 순환도로에서 각각 속도별로 구분하여 화자독립 인식 실험을 한 결과 40-80km 상태에서 남자는 96.8%, 여자는 95.1%, 80-100km 상태에서는 남자 91.6%, 여자는 90.6%의 인식결과를 얻을 수 있었고, 화자종속 인식실험 결과 40-80km 상태에서 남자는 98%, 여자는 96%, 80-100km 상태에서는 남자는 96%, 여자는 94%의 높은 인식률을 얻었으므로, system의 유효성을 입증하였다.


  • 참고문헌 (15)

    1. 이기철, '차량소음에 강한 고립단어 음성인식에 관한 연구', MS Thesis, KAIST, 1995 
    2. A. Noll, 'Problem of Speech Recognition in Mobile Environments,' ICSLP90, Vol.2, pp.1133-1136, 1990 
    3. Chafic MOKBEL, Ge'rard CHOLLET, 'An Improved Noise Compensation Algorithm for Word Recognition in the Car,' ICASSP91, Vol.2, pp.925-928, May 14-17 
    4. L.R. Rabiner, M. R. Sambur, 'An Algorithm for Determining the Endpoints of Isoated Utterances,' The Bell System Technical Journal, Vol.54, No.2, PP.297-315, Feb. 1975 
    5. L.R. Rabiner, 'On the use of Autocorrelation Analysis for Pitch Detection,' J. Acoust., Speech, Signal processing, Vol. ASSP-25, pp.24-33, Feb. 1977 
    6. H. Herrnanskv, 'Perceptual Linear Predictive (PLP) Analysis of Speech,' J. Acoust. Soc. Am. 87(4), pp.1738-1752, Apr. 1990 
    7. H. Ney, 'The Use of a One-Stage Dynamic Programming Algorithm for Connected Word Recognition,' IEEE Transaction on Acoustics, Speech, and Signal Processing, Vol. ASSP-32, No.2, pp.263-271 Apr. 1984 
    8. 변용규, 'DMS 모델을 이용한 단독어 인식에 관한 연구' 박사학위 논문, 광운대학교, 1990, 12 
    9. L.R. Rabiner, B.H. Juang, 'Fundamentals of Speech Recognition,' Prentice Hall, 1993 
    10. H.G. Hirsch, P. Meyer and H.W. Ruehl, 'Improved Speech Recognition Using High-Pass filtering of Subband Envelopes,' EUROSPEECH91, Vol.2, pp.413-416, Sep. 1991 
    11. P. Lockwood, C. Baiilargeat, J.M. Gillot, J. Boudy, G. Faucon, 'Noise Reduction for Speech Enhancement in Cars: Non-Linear Spectrl Subtraction/ Kalman Filtering,' EUROSPEECH91, pp, 83-86, Vol.1, Sep. 1991 
    12. L.R. Rabiner, M.R. Sarnbur, 'An Algorithm for Determining the EndPoints of Isolated Utterances,' The Bell System Technical Journal, Vol.54, No.2, pp.297-315, Feb. 1975 
    13. 배명진, 이상효 '디지탈 음성분석,' 동영출판사. 1998 
    14. 이정기,남동선,양진우,김순협 '실시간 윈도우 환경에서 DMS모델을 이용한 자동 음성 제어 시스템에 관한 연구', 한국음향학회지, 19권 3호,pp.51-56,Apr 2000     
    15. 양진우,김순협 '주행중인 자동차 환경에서의 음성인식 연구' 한국음향학회지,19권 5호,pp.3-8,July 2000     

 저자의 다른 논문

  • 양진우 (3)

    1. 2000 "실시간 윈도우 환경에서 DMS모델을 이용한 자동 음성 제어 시스템에 관한 연구" 한국음향학회지= The journal of the acoustical society of Korea 19 (3): 51~56    
    2. 2000 "주행중인 자동차 환경에서의 음성인식 연구" 한국음향학회지= The journal of the acoustical society of Korea 19 (5): 3~8    
    3. 2001 "1/3-옥타브 대역통과필터를 이용한 음상정위기법 성능 향상" 한국음향학회지= The journal of the acoustical society of Korea 20 (3): 98~103    
  • Kim, Soon-Hyob (59)

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역

원문보기

무료다운로드
  • NDSL :
유료다운로드

유료 다운로드의 경우 해당 사이트의 정책에 따라 신규 회원가입, 로그인, 유료 구매 등이 필요할 수 있습니다. 해당 사이트에서 발생하는 귀하의 모든 정보활동은 NDSL의 서비스 정책과 무관합니다.

원문복사신청을 하시면, 일부 해외 인쇄학술지의 경우 외국학술지지원센터(FRIC)에서
무료 원문복사 서비스를 제공합니다.

NDSL에서는 해당 원문을 복사서비스하고 있습니다. 위의 원문복사신청 또는 장바구니 담기를 통하여 원문복사서비스 이용이 가능합니다.

이 논문과 함께 이용한 콘텐츠
이 논문과 함께 출판된 논문 + 더보기