본문 바로가기
HOME> 논문 > 논문 검색상세

논문 상세정보

한국어 구문분석의 효율성을 개선하기 위한 구문제약규칙의 학습
Loaming Syntactic Constraints for Improving the Efficiency of Korean Parsing

박소영   (고려대학교 컴퓨터학과UU0000159  ); 곽용재   (고려대학교 컴퓨터학과UU0000159  ); 정후중   (고려대학교 컴퓨터학과UU0000159  ); 황영숙   (고려대학교 컴퓨터학과UU0000159  ); 임해창   (고려대학교 컴퓨터학과UU0000159  );
  • 초록

    본 논문에서는 한국어 구문분석에 적합한 다양한 구문정보에 대해 살펴보고, 이를 바탕으로 학습한 제약규칙을 이용하여 구문분석모델의 효율성을 개선시키는 방법을 제안한다. 제안하는 방법의 특징은 다음과 같다. 첫째, 제약규칙을 이용하여 불필요한 중간결과물의 생성을 제약하므로, 구문분석의 효율성이 향상된다. 둘째, 제약규칙의 학습에 이용되는 구문정보가 한국어의 특성을 적절히 반영하고 있으므로, 한국어 문장에 대해 비교적 견고하게 분석할 수 있다. 셋째, 제약규칙은 결정트리 학습알고리즘에 의해 말뭉치에서 자동으로 학습되므로, 제약규칙의 획득이 용이하다. 제약규칙을 이용하여 실험한 결과 구문분석모델의 과생성이 1/2~1/3로 줄고 처리속도가 2~3배 빨라졌다.


    In this paper, we observe various syntactic information for Korean parsing and propose a method to learn constraints and improve the efficiency of a parsing model by using the constraints. The proposed method has the following three characteristics. First, it improves the parsing efficiency since we use constraints that can prevent the parser from generating unsuitable candidates. Second, it is robust on a given Korean sentence because the attributes for the constraints are selected based on the syntactic and lexical idiosyncrasy of Korean. Third, it is easy to acquire constraints automatically from a treebank by using a decision tree learning algorithm. The experimental results show that the parser using acquired constraints can reduce the number of overgenerated candidates up to 1/2~1/3 of candidates and it runs 2~3 times faster than the one without any constraints.


  • 주제어

    한국어 구문분석 .   제약규칙 .   결정트리 학습 알고리즘.  

  • 참고문헌 (21)

    1. Joshua Goodman, 'Parsing Algorithms and Metrics,' Proceedings of the 34th Anuual Meeting of the Association for Computational Linguistics, pp.177-183, 1996 
    2. Yong-Jae Kwak, Young-Sook Hwang, Hoo-Jung Chung, So-Young Park, Sang-Zoo Lee, and Hae-Chang Rim, GLR Parser with Conditional Action Model(CAM), Proc. of the 6th Natural Language Processing Pacific Rim Symposium, pp.359-366, 2001 
    3. J. Ross Quinlan, 'C4.5: Programs for Machine Learning,' Morgan Kaufmann Publishers, 1993 
    4. Masaru Tomita, 'Efficient Parsing for Natural Languge: A Fast Algorithm for Practical Systems,' Kluwer Academic Publishers, 1986 
    5. 박소영, 황영숙, 임해창, 'X-바 이론의 중심어 개념을 도입한 형태소 단위의 한국어 자질기반 문법,' 한국정보학회 논문지(B), 제26권, 제10호, pp.1247-1259, 1999 
    6. 권혜진, 이원일, 이근배, 이종혁, '범주문법에 기반한 한국어의 의미분석,' 한국정보과학회 봄 학술발표 논문집, pp.915-918, 1996 
    7. J. T. Maxwell, R. M. Kaplan, 'The interface between phrasal and functional constraints,' Computational Linguistics, Vol.19, Num.4, pp.571-590, 1993 
    8. Kentaro Torisawa, Kenji Nishida, Yusuke Miyao, Jun-Ichi Tsujii, 'An HPSG Parser with CFG filtering,' Natural Language Engineering, Vol. 6, Part 1, pp.63-80, 2000 
    9. Ezra Black, Fred Jelinek, John Lafferty, David M. Magerman, Robert Mercer, Salim Roukos, 'Towards History-based Grammars: Using Richer Models for Probabilistic Parsing,' In Proceedings of the 31st Annual Meeting of the Association for Comptational Linguistics, pp.31-37, 1993 
    10. Bernd Kiefer, Hans-Uirich Krieger, John Carroll, Rob Malouf, 'A bag of useful techniques for efficient and robust parsing,' In Proceedings of the 37th Annual Meeting of the Association for Computational Linguistics, pp.473-480, 1999 
    11. David M. Magerman, Carl Weir, 'Efficiency, Robustness and Accuracy in Picky Chart Parsing,' In Proceedings of the 30th Annual Meeting of the Association for Computational Linguistics, pp.40-47, 1992 
    12. 조정미, 서정연, 김길창, '말뭉치로부터 자동 추출된 문맥 반영 구문규칙을 이용한 영어 구문 분석,' 한국정보과학회논문지, 제21권, 제9호, pp.1702-1710, 1994 
    13. 김학수, 서정연, '어휘 의존 정보에 기반한 한국어 통계적 구문분석기,' 한국정보과학회 인공지능 연구회 봄 학술발표 논문집, pp.61-65, 1997 
    14. Michael Collins, 'Head-Driven Statistical Models for Natural Language Parsing,' Ph.D. Thesis, University of Pennsylvania, 1999 
    15. 이공주, '언어특성에 기반한 한국어의 확률적 구문분석,' 한국과학기술원 박사학위 논문, 1997 
    16. A. Voutilainen, 'Three Studies of Grammar-Based Surface Parsing of Unrestricted English Text,' PhD thesis, University of Helsinki, 1994 
    17. David M. Magerman, 'Statistical Decision-Tree Models for Parsing,' In Proceedings of the 33rd Annual Meeting of the Association for Computational Linguistics, pp.276-283, 1995 
    18. 서정연, 김창현, '통계적 방법을 이용한 구문분석,' 한국정보과학회지, 제14권, 제7호, pp.58-70, 1996     
    19. Wolfgang Menzel, Ingo Schoder, 'Decision Procedures for Dependency Parsing Using Graded Constraints,' In Proceedings of COLLING-ACL Workshop on Processing of Dependency Grammars, pp.78-87, 1998 
    20. 나동렬, '한국어 파싱에 대한 고찰', 한국정보과학회지, 제12권, 제8호, pp.33-46, 1994 
    21. Nicola Cancedda, Christer Samuelsson, 'Experiments with Corpus-based LFG Specialization,' Proceedings of the Sixth Applied Natural Language Processing Conference, pp.204-209, 2000 
  • 이 논문을 인용한 문헌 (1)

    1. Cho, Dal-Ho ; Lee, Yong-Ho ; Kim, Jin-Hyung ; Park, So-Young ; Rhee, Dae-Woong 2011. "NPC Control Model for Defense in Soccer Game Applying the Decision Tree Learning Algorithm" 한국게임학회 논문지 = Journal of Korea Game Society, 11(6): 61~70     

 저자의 다른 논문

  • 곽용재 (3)

    1. 2002 "자질집합선택 기반의 기계학습을 통한 한국어 기본구 인식의 성능향상" 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용 29 (9): 654~668    
    2. 2003 "표층 구문 타입을 사용한 조건부 연산 모델의 일반화 LR 파서" 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용 30 (1): 81~92    
  • 정후중 (3)

  • 황영숙 (5)

  • 임해창 (33)

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역

원문보기

무료다운로드
  • NDSL :
유료다운로드

유료 다운로드의 경우 해당 사이트의 정책에 따라 신규 회원가입, 로그인, 유료 구매 등이 필요할 수 있습니다. 해당 사이트에서 발생하는 귀하의 모든 정보활동은 NDSL의 서비스 정책과 무관합니다.

원문복사신청을 하시면, 일부 해외 인쇄학술지의 경우 외국학술지지원센터(FRIC)에서
무료 원문복사 서비스를 제공합니다.

NDSL에서는 해당 원문을 복사서비스하고 있습니다. 위의 원문복사신청 또는 장바구니 담기를 통하여 원문복사서비스 이용이 가능합니다.

이 논문과 함께 출판된 논문 + 더보기