본문 바로가기
HOME> 논문 > 논문 검색상세

학위논문 상세정보

HMM을 이용한 화자인증 시스템의 구현 원문보기
Implementation of Speaker Verification System using HMM

  • 저자

    박진영

  • 학위수여기관

    東亞大學校 大學院

  • 학위구분

    국내석사

  • 학과

    전자공학과

  • 지도교수

  • 발행년도

    2004

  • 총페이지

    ix, 65p.

  • 키워드

    HMM 화자인증시스템 전자공학;

  • 언어

    kor

  • 원문 URL

    http://www.riss.kr/link?id=T10067260&outLink=K  

  • 초록

    음성은 인간의 가장 자연스럽고 편리한 의사소통 수단이다. 이러한 음성데이터를 이용한 Man-Machine Interface에 대한 연구가 활발히 진행되고 있으며, 다양한 구현 방법들이 제안되고 있다. 음성신호처리는 음성분석, 음성인식, 화자인식, 음성합성 등으로 분류할 수 있고 그 중에서 화자인식 분야는 화자인증과 화자식별, 화자검출 등으로 분류할 수 있다. 음성인식은 일반성을 추구하기 때문에 임의의 단어에 대한 특징이 모든 사람에게서 동일하게 추출되도록 특징을 추출하고 음성의 독특한 성분을 누그러뜨리는 방향으로 음성을 모델링한다. 반면 화자인식은 개인성을 추구하기 때문에 임의의 단어에 대한 특징이 각 개인의 차이를 나타낼 수 있도록 특징을 추출하고 가능한 독특한 성분을 살리는 방향으로 음성을 모델링한다. 본 논문에서 구현하고자 하는 화자인증(Speaker Authentication)기술은 각 개인이 독특하게 지니고 있는 음성의 특징을 이용하여 입력된 음성이 지정된 화자의 음성인지를 구별하고 그 동일성 여부를 인증하는 기술이다. 화자인증 기술은 음성파형으로부터 수집된 정보들을 암호로 사용하므로 불법 도용이 불가능한 첨단 보안 기술이라 할 수 있으며 입력되는 음성이 지정된 화자의 음성인지를 판정할 수 있기 때문에 신분확인, 출입통제, 전화를 이용한 은행거래 등 보안 application으로 사용되어질 수 있다. 본 논문에서는 각 화자의 음성 특징 파라메터로 MFCC(Mel-Frequency Cepstral Coefficient)를 사용하였고 이 음성 특징 파라메터의 훈련에 사용되는 학습 알고리즘 및 탐색 알고리즘으로 HMM(Hidden Markov Model)을 사용하였으며 화자인증의 방법으로 문맥종속방법(Text-dependent Method)을 사용하였다. PC를 이용한 학습 과정을 통해 HMM 학습 Table을 생성하고 실시간으로 테스트 화자의 발성을 입력받아 특징을 추출한다. 입력된 데이터의 특징을 참조 패턴과 비교/분석하여 지정화자(True Speaker) 또는 사칭자(Imposter)를 구별하는 화자인증 시스템을 구현하였다. 화자인증 시스템의 성능 평가를 위해 일반적으로 많이 사용되는 DET(Detection Error Trade-off) curve, ROC(Receiver Operating Characteristic) curve, EER(Equal Error Rate) 등을 구현된 시스템의 평가 방법으로 사용했다.


    Speech is the most natural and convenient communication means of human. Recently, Many Researchers are concerned about Man-Machine Interface using speech data and have proposed various methods. Speech signal processing has several research areas such as speech analysis, speech recognition, speaker recognition, speech synthesis, etc. Speaker recognition, one of those areas, can be divided into speaker verification, speaker identification and speaker detection. Speech recognition for many users is accomplished by extracting feature parameter having general characteristics from people and makes speech to some modeling to relieve exceptional components. On the other hand, speaker recognition for certain persons is accomplished by extracting feature parameter having distinctive characteristics and makes speech to some modeling to stress unique components. This dissertation is about speaker verification that determine whose speech from input data originated from certain persons. Because it takes a use of the password based on speech signal, this technique can be said to up-to-date technology not to allow illegal uses. Moreover, it can make decisions whether input speech is a true speaker or not. Therefore, this method is available to a security application such as identification, rejection, phone banking. This dissertation dealt with MFCC(feature parameter), HMM(learning and recognition algorithm), and text-dependent method for speaker verification. I formed learning tables through HMM by PC and made feature parameters from real-time input speech. Thus, I made speaker verification systems that classify true speaker and imposter between input and reference patterns. Performance of those systems is evaluated by universal measures like DET curve, ROC curve, and EER.


 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역