본문 바로가기
HOME> 논문 > 논문 검색상세

논문 상세정보

에너지 라벨링 그룹화를 이용한 고속 음성인식시스템
Fast Speech Recognition System using Classification of Energy Labeling

한수영   (안양대학교 컴퓨터학과UU0000920  ); 김홍렬   (동서울대학 컴퓨터정보과UU0000473  ); 이기희   (동서울대학 컴퓨터정보과UU0000473  );
  • 초록

    본 논문에서는 입력된 음성의 음소단위로 추출된 에너지 파라미터를 이용하여 에너지를 라벨링(energy labeling)하고 라벨링된 값에 따라 입력 음성을 그룹화하였다. 그리고 동적패턴정합 수행 시 입력된 실험음성에서 검출된 에너지의 크기에 따라 선택된 라벨의 그룹 내에서 DTW를 수행시켜 처리시간을 단축시켜 저가형 프로세서에서도 고속으로 동작할 수 있게 하고자 하였다. 본 논문의 음성 라벨링 단계는 음성의 구간 검출 및 에너지 파라미터의 추출 단계에서 정확한 파라미터의 검출을 전제로 하기 때문에 이를 보완하기 위해 피치의 주기에 따른 가변윈도우를 사용하였다. 피치주기를 먼저 구하고 그 주기에 200 프레임에서 300프레임 사이에서 윈도우의 크기를 결정함으로써 윈도우의 영향이 제거된 에너지를 구하는 방법을 제안하였다. 실험결과 제안된 방법이 약 $25\%$ 정도의 연산량을 감소시켰다.


    In this paper, the Classification of Energy Labeling has been proposed. Energy parameters of input signal which are extracted from each phoneme are labelled. And groups of labelling according to detected energies of input signals are detected. Next. DTW processes in a selected group of labeling. This leads to DTW processing faster than a previous algorithm. In this Method, because an accurate detection of parameters is necessary on the assumption in steps of a detection of speeching duration and a detection of energy parameters, variable windows which are decided by pitch period are used. A pitch period is detected firstly : next window scale is decided between 200 frames and 300 frames. The proposed method makes it possible to cancel an influence of windows and reduces the computational complexity by $25\%$ .


  • 주제어

    speech recognition .   pattern classification .   pitch detection.  

 저자의 다른 논문

  • 김홍렬 (7)

    1. 2002 "계수분할을 이용한 개선된 워이블릿 패킷 영상 부호화 알고리듬" 한국OA학회논문지 = Journal of The Korean Institute of Office Automation 7 (1): 112~119    
    2. 2004 "가변형 교통 표지판의 서브 컨트롤부 구현" 전기학회논문지. The Transactions of the Korean Institute of Electrical Engineers. P 53 (1): 7~13    
    3. 2005 "PIM과 2D 바코드를 이용한 워터마킹 알고리즘" 韓國컴퓨터情報學會論文誌 = Journal of the Korea Society of Computer and Information 10 (5): 103~108    
    4. 2006 "탠덤크로스포인터 멀티캐스트 ATM 스위치 연구" 韓國컴퓨터情報學會論文誌 = Journal of the Korea Society of Computer and Information 11 (1): 157~165    
    5. 2008 "디지털 미디어 콘텐츠 방송 시스템 구현" 전기학회논문지 = The Transactions of the Korean Institute of Electrical Engineers 57 (10): 1883~1887    
    6. 2011 "네트워크 보안 기능을 갖는 패킷처리 기반의 링크 통합 장비 설계" 전기학회논문지. The Transactions of the Korean Institute of Electrical Engineers. P 60 (3): 150~154    
    7. 2013 "IP 기반의 다채널 엘리베이터 영상감시 시스템" 전기학회논문지. The Transactions of the Korean Institute of Electrical Engineers. P 62 (4): 164~168    
  • 이기희 (5)

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역

원문보기

무료다운로드
유료다운로드

유료 다운로드의 경우 해당 사이트의 정책에 따라 신규 회원가입, 로그인, 유료 구매 등이 필요할 수 있습니다. 해당 사이트에서 발생하는 귀하의 모든 정보활동은 NDSL의 서비스 정책과 무관합니다.

원문복사신청을 하시면, 일부 해외 인쇄학술지의 경우 외국학술지지원센터(FRIC)에서
무료 원문복사 서비스를 제공합니다.

NDSL에서는 해당 원문을 복사서비스하고 있습니다. 위의 원문복사신청 또는 장바구니 담기를 통하여 원문복사서비스 이용이 가능합니다.

이 논문과 함께 출판된 논문 + 더보기