본문 바로가기
HOME> 논문 > 논문 검색상세

논문 상세정보

인접 조건 검사에 의한 초고속 한국어 형태소 분석
High Speed Korean Morphological Analysis based on Adjacency Condition Check

심광섭   (성신여자대학교 컴퓨터정보학부UU0000771  ); 양재형   (강남대학교 컴퓨터미디어공학부UU0016050  );
  • 초록

    본 논문에서는 코드 변환 과정과 축약, 탈락, 불규칙 활용 둥으로 변형된 형태소의 원형을 복원하고 분석 후보를 생성하는 등의 과정을 거치지 않고 형태소 사전에서 제공되는 인접 조건에 대한 검사만으로 형태소 분석을 하는 방법을 제안한다. 인접 조건 검사는 복잡한 연산을 하지 않고 단순한 비트 연산만으로 할 수 있기 때문에 제안된 방법은 초고속 형태소 분석기 구현에 적합하다. 본 논문에서 제안한 방법에 따라 구현된 한국어 형태소 분석기 MACH는 1.13 GHz Pentium III 개인용 컴퓨터에서 대략 5분/GB의 분석 속도를 보였으며, 분석 정확도는 99.2 %로 기존의 다른 분석기와 큰 차이가 없었다.


    This paper proposes a morphological analysis method that enables morphological analysis by checking conditions between two adjacent morphemes. These conditions are fed from a dictionary. This method eliminates a code conversion module and the application of transformational rules for candidate generation. The method claims that very high speed morphological analysis is attainable through simple bit operations for adjacency condition check. MACH, an implementation of the proposed method, is a supersonic Korean morphological analyzer which is able to analyze a document of 1 GB in 5 minutes on a PC with 1.13 GHz Pentium III CPU. The analysis accuracy of MACH is 99.2 %.


  • 주제어

    인접 .   조건 .   비트 .   연산 .   초고속 .   한국어 .   형태소 .   분석.  

  • 참고문헌 (12)

    1. 김철수, 배우정, 이용석, 청강순일, '이중 배열 트라이 구조를 이용한 한국어 전자 사전의 구축', 정보과학회 논문지(B) 23권, 1호, pp.85-94, 1996 
    2. 이도길, 류원호, 임해창, '분석 배제 정보와 후절어를 이용한 한국어 명사 추출', 제12회 한글 및 한국어 정보 처리 학술대회 논문집, pp.19-25, 2000     
    3. 양승현, 김영섬, '부분 어절의 기분석에 기반한 고속 한국어 형태소 분석방법', 정보과학회 논문지 : 소프트웨어 및 응용, 27권, 3호, pp.290-301, 2000     
    4. Kwangseob Shim and Jaehyung Yang, 'MACH:A Supersonic Korean Morphological Analyzer,' Proceedings of the 19th International Conference on Computational Linguistics (COLING-2002), pp. 939-945, 2002 
    5. 강승식, '음절 정보와 복수어 단위 정보를 이용한 한국어 형태소 분석', 서울대학교 공학박사 학위 논문, 1993 
    6. 임희석, 윤보현, 임해창, '배제 정보를 이용한 효율적인 한국어 형태소 분석기', 한국정보과학회 논문지, 제22권 제6호, pp.957-964, 1995 
    7. 최재혁, 이상조, '양방향 최장일치법에 의한 한국어 형태소 분석기에서의 사전 횟수 감소 방안', 정보과학회논문지, 20권, 10호, pp.1497-1507, 1993 
    8. 백대호, 이호, 임해창, 'Finite State Transducer를 이용한 한국어 전자 사전의 구조', 제7회 한글 및 한국어정보처리 학술발표 논문집, pp.181-187, 1995     
    9. 김재한, 옥철영, '어절 사전을 이용한 한국어 형태소 분석', 한국정보과학회 봄 학술발표 논문집, 21권 1호, pp.813-816, 1994 
    10. Hyuk-Chul Kwon, Young-Soog Chae, 'A Dictionary-Based Morphological Analysis,' Proc. of Natural language processing, Pacific Rim Symposium '91, Singapore, pp.178-185, 1991 
    11. 은종진, 박선영, '고성능 한국어 형태소 분석을 위한 어미 분류', 제12회 한글 및 한국어 정보처리 학술대회 논문집, pp.41-47, 2000 
    12. 김영관, 박민식, 최진석, 권혁철, '사전 성능 개선을 통한 한국어 형태소 분석기의 분석 속도 향상', 제11회 한글 및 한국어 정보처리 학술대회 논문집, pp.479-483, 1999 
  • 이 논문을 인용한 문헌 (10)

    1. 2004. "High Speed Korean Morphological Analysis based on Adjacency Condition Check" 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용, 31(1): 89~99     
    2. 2004. "High Speed Korean Morphological Analysis based on Adjacency Condition Check" 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용, 31(1): 89~99     
    3. Myung, Jae-Seok ; Lee, Dong-Joo ; Lee, Sang-Goo 2008. "A Korean Product Review Analysis System Using a Semi-Automatically Constructed Semantic Dictionary" 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용, 35(6): 392~403     
    4. Park, In-Cheol 2011. "Semi-Automatic Construction of Morphological Pattern Dictionary using the Method of Morphological Synthesis" 한국산학기술학회논문지 = Journal of the Korea Academia-Industrial cooperation Society, 12(11): 5278~5283     
    5. Hong, Cho-Hee ; Kim, Hark-Soo 2012. "Comparative Study of Various Machine-learning Features for Tweets Sentiment Classification" 한국콘텐츠학회논문지 = The Journal of the Korea Contents Association, 12(12): 471~478     
    6. Koo, Yun-Mo ; Lee, Jeong-Jin ; Seo, Jin-Wook 2012. "A Visual Analytics System for Analyzing Social Networking Patterns among Microbloggers" 한국게임학회 논문지 = Journal of Korea Game Society, 12(3): 77~86     
    7. Shim, Kwangseob 2014. "Syllable-based Probabilistic Models for Korean Morphological Analysis" 정보과학회논문지 = Journal of KIISE, 41(9): 642~651     
    8. Kim, Dongyoung ; Park, Jeawon ; Choi, Jaehyun 2014. "A Comparative Study between Stock Price Prediction Models Using Sentiment Analysis and Machine Learning Based on SNS and News Articles" 한국IT서비스학회지 = Journal of Information Technology Services, 13(3): 221~233     
    9. Song, Eun-Jee 2015. "The Sensitivity Analysis for Customer Feedback on Social Media" 한국정보통신학회논문지 = Journal of the Korea Institute of Information and Communication Engineering, 19(4): 780~786     
    10. Hong, Jinju ; Kim, Sehan ; Park, Jeawon ; Choi, Jaehyun 2016. "A Malicious Comments Detection Technique on the Internet using Sentiment Analysis and SVM" 한국정보통신학회논문지 = Journal of the Korea Institute of Information and Communication Engineering, 20(2): 260~267     

 저자의 다른 논문

  • 심광섭 (14)

    1. 1999 "시로러스와 하위범주와 사전을 이용한 격모호성 해결" 정보과학회논문지. Journal of KISS (b):software and applications. B 26 (9): 1132~1140    
    2. 2004 "중한번역에서 구 묶음을 이용한 파싱 효율 개선" 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용 31 (8): 1083~1091    
    3. 2004 "자질 기반 구 구조 문법을 위한 문법 개발 환경" 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용 31 (10): 1418~1429    
    4. 2004 "통계 정보를 이용한 전치사 최적 번역어 결정 모델" 언어와 정보 = Language and information 8 (1): 101~116    
    5. 2007 "MADE : 형태소 분석기 개발환경" 인터넷정보학회논문지 = Journal of Korean Society for Internet Information 8 (4): 159~171    
    6. 2009 "소규모 문맥 자유 문법에 대한 Left-Corner / Look-Ahead 차트 파싱 알고리즘의 성능 평가" 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용 36 (7): 571~579    
    7. 2010 "임의 순서 차트 파싱 알고리즘" 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용 37 (6): 446~454    
    8. 2011 "CRF를 이용한 한국어 자동 띄어쓰기" 인지과학 = Korean journal of cognitive science 22 (2): 217~233    
    9. 2011 "형태소 분석기 사용을 배제한 음절 단위의 한국어 품사 태깅" 인지과학 = Korean journal of cognitive science 22 (3): 327~345    
    10. 2013 "품사 태깅 말뭉치에서 추출한 n-gram을 이용한 음절 단위의 한국어 형태소 분석" 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용 40 (12): 869~876    
  • 양재형 (4)

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역

원문보기

무료다운로드
  • NDSL :
유료다운로드

유료 다운로드의 경우 해당 사이트의 정책에 따라 신규 회원가입, 로그인, 유료 구매 등이 필요할 수 있습니다. 해당 사이트에서 발생하는 귀하의 모든 정보활동은 NDSL의 서비스 정책과 무관합니다.

원문복사신청을 하시면, 일부 해외 인쇄학술지의 경우 외국학술지지원센터(FRIC)에서
무료 원문복사 서비스를 제공합니다.

NDSL에서는 해당 원문을 복사서비스하고 있습니다. 위의 원문복사신청 또는 장바구니 담기를 통하여 원문복사서비스 이용이 가능합니다.

이 논문과 함께 이용한 콘텐츠
이 논문과 함께 출판된 논문 + 더보기