본문 바로가기
HOME> 논문 > 논문 검색상세

논문 상세정보

결정 트리를 이용한 지시 표현 '것'의 구별
Distinguishing Referential Expression 'Geot' Using Decision Tree

조은경    ((주)다음커뮤니케이션   ); 김학수    (강원대학교 IT특성화학부(대학) 컴퓨터정보통신공학   ); 서정연    (서강대학교 컴퓨터학과  );
  • 초록

    지시 표현 '것'은 한국어 대화에서 자주 등장하는 표현이지만, 그 자체로서 대명사나 한정 명사구와 같은 지시 표현이 아니고, 비지시적인 표현으로 쓰이는 '것'과 구별되지 못했기 때문에 지시 해석(reference resolution)에 관한 기존 연구에서 제대로 다루어지지 못했다. 이러한 문제를 해결하기 위해 '것'이 가지고 있는 언어학적 속성과 담화 상의 속성을 기반으로 하여 자질 집합을 설정하고, 결정트리를 이용하여 '것'을 구별하는 방법을 제안한다. 이 방법에 의한 시스템은 비지시 표현의 것에 대해 92%, 지시표현의 것에 대해 82%의 F-measure를 보였으며, 전체적인 분류 성능은 89%였다. 이는 패턴에 따른 규칙을 적용한 분류 성능에 비해 약 15% 가량 향상된 결과이다.


    Referential expression 'Geot' is often occurred in Korean dialogues. However, it has not been properly dealt with by the previous researchers of reference resolution, since it is not by itself the referential expression like pronoun and definite noun phrases, and it has never been discriminated from non-referring 'geot'. To resolve this problem, we establish a feature set which is based on the linguistic property of 'geot' and the discourse property of its text, and propose a method to identify referential 'geot' from non-referring 'geot' using decision tree. In the experiment, our system achieved the F-measures of 92.3% for non-referring geot and of 82.2% for referential geot and the total classification performance of 89.27%, and outperformed the classification system based on pattern rules.


  • 주제어

    지시 표현 .   조응어 구별 .   조응성 .   지시 표현 해석.  

  • 참고문헌 (20)

    1. David L. Bean and Ellen Riloff., 'Corpus-Based Identification of Non-Anaphoric Noun Phrases', In the proceedings of ACL. (1999) 
    2. Antonio Ferrandez and Lidia Moreno 'A computational approach to pronominal anaphora, oneanaphora and surface count anaphora,' In the proceedings of Discourse Anaphora and Anaphora Resolution (1998) 
    3. Joseph F. McCarthy and Wendy G. Lehnert, 'Using Decision Trees for Coreference Resolution,' In the proceedings of International Joint Conference on Artificial Intelligence (1995) 
    4. 양명희, 현대국어 대용어에 대한 연구, 국어학총서33, 국어학회, 태학사, 1998 
    5. 이상호, 미등록어를 고려한 한국어 품사 태깅 시스템 구현, 석사학위논문, 한국과학기술원, 1995 
    6. Lluis Marquez, 'Machine Learning and Natural Language Processing,' Technical Report LSI00-45-R, Departament de Llenguatges i Sistemes Informatics (LSI), Universitat Politecnica de Catalunya (UPC), Barcelona, Spain (2000) 
    7. Shalom Lappin and Herbert J. Leass, 'An Algorithm for Pronominal Anaphora Resolution,' Computational Linguistics, volume 20, number 4. (1994) 
    8. Renata Vieira and Massimo Poesio, 'Processing definite descriptions in corpora,' Corpus-based and computational approaches to discourse anaphora. Simon Botley and Anthony Mark McEnery.(ed.) Benjamins Pub. 2000 
    9. MAK Halliday and Ruqaiya Hasan, Cohesion in English, Longman, 1976 
    10. Vincent Ng and Claire Cardie 'Learning Noun Phrase Anaphoricity to Improve Coreference Resolution-Issues in Representation and Optimization,' In the proceedings of ACL. (2004) 
    11. Quinlan R. J., C4.5: Programs for Machine Learning, Morgan Kaufmann, San Mateo, CA, 1993 
    12. 남기심, '불완전명사 '것'의 쓰임', 국어의 이해와 인식, 한국문화사, 1991 
    13. 조은경, 이민행, '지시 해석을 위한 것의 구별과 쓰임에 관한 연구', 한국어학 제 31집, 한국어학회, 2006 
    14. Richard Evans, 'Applying Machine Learning Toward an Automatic Classification of It,' Literary and Linguistic Computing (2001) 
    15. Ian H. Witten and Eibe Frank, Morgan Kaufmann. Data Mining: Practical machine learning tools and techniques, San Francisco, 2005 
    16. 노현철, 이근배, 이종혁, 박재득, '한국어 담화 특성에 기반한 영역 독립 생략 및 대용 처리', 정보과학회논문지(B) 제25권 제12호, pp. 1845-1857. (1998) 
    17. Michael Strube and Christoph Muller, 'A Machine Learning Approach to Pronoun Resolution in Spoken dialogue,' In the proceedings of ACL. (2003) 
    18. 김학수, 다중모드 대화 시스템에서의 명사 대용어구 처리, 석사학위논문, 서강대학교, 1997 
    19. Vincent Ng and Claire Cardie, 'Identifying Anaphoric and Non-Anaphoric Noun Phrases to Improve Coreference Resolution,' In the proceedings of COLING. (2002) 
    20. Didier Baltazart and Laurence Kister, 'Is it possible to predetermine a referent included in a French N De N structure?,' Corpus-based and computational approaches to discourse anaphora. Simon Botley and Anthony Mark McEnery.(ed.) Benjamins Pub, 2000 
  • 이 논문을 인용한 문헌 (1)

    1. Kim, Kye-Sung ; Park, Seong-Bae ; Park, Se-Young ; Lee, Sang-Jo 2010. "Anaphoricity Determination of Zero Pronouns for Intra-sentential Zero Anaphora Resolution" 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용, 37(12): 928~935     

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역

원문보기

무료다운로드
  • NDSL :
유료다운로드

유료 다운로드의 경우 해당 사이트의 정책에 따라 신규 회원가입, 로그인, 유료 구매 등이 필요할 수 있습니다. 해당 사이트에서 발생하는 귀하의 모든 정보활동은 NDSL의 서비스 정책과 무관합니다.

원문복사신청을 하시면, 일부 해외 인쇄학술지의 경우 외국학술지지원센터(FRIC)에서
무료 원문복사 서비스를 제공합니다.

NDSL에서는 해당 원문을 복사서비스하고 있습니다. 위의 원문복사신청 또는 장바구니 담기를 통하여 원문복사서비스 이용이 가능합니다.

이 논문과 함께 이용한 콘텐츠
이 논문과 함께 출판된 논문 + 더보기