본문 바로가기
HOME> 논문 > 논문 검색상세

논문 상세정보

저자 식별을 위한 자질 비교
Features for Author Disambiguation

강인수   (한국과학기술정보연구원 정보서비스연구팀CC0007658  ); 이승우   (한국과학기술정보연구원 정보서비스연구팀CC0007658  ); 정한민   (한국과학기술정보연구원 정보서비스연구팀CC0007658  ); 김평   (한국과학기술정보연구원 정보서비스연구팀CC0007658  ); 구희관   (한국과학기술정보연구원 정보서비스연구팀CC0007658  ); 이미경   (한국과학기술정보연구원 정보서비스연구팀CC0007658  ); 성원경   (한국과학기술정보연구원 정보서비스연구팀CC0007658  ); 박동인   (한국과학기술정보연구원 정보서비스연구팀CC0007658  );
  • 초록

    학술 정보에서 저자는, 실세계의 한 저자가 형태적으로 둘 이상의 저자명으로 출현할 수 있으며, 서로 다른 저자들이 동일한 저자명을 공유하기도 한다. 이는 각각 학술 정보에 대한 검색 및 탐색에 있어, 재현율과 정확률을 저하시키는 요인이다. 이 연구에서는 후자에 해당하는 저자의 동명이인 문제에 있어, 그 중의성 해소를 위한 자질의 특성에 집중하고자 한다. 최근까지, 저자 식별을 위한 자질로, 공저자, 논문 제목, 게재지명과 같은 서지 내적 자질과, 논문 원문 텍스트로부터 획득되는 전자메일주소, 소속기관, 논문의 토픽 등과 같은 서지 외적 자질이 사용되어 왔다. 그러나, 이러한 자질들이 저자 식별에 미치는 영향에 대한 비교 분석 연구는 찾아 보기 힘들다. 이 연구에서는, 한글 저자명에 대해 원문과 연계된 대용량 저자 식별 평가 셋을 구축하여, 동명 저자 중의성 해소에 있어 다양한 자질들의 특성을 비교한다.


    There exists a many-to-many mapping relationship between persons and their names. A person may have multiple names, and different persons may share the same name. These synonymous and homonymous names may severely deteriorate the recall and precision of the person search, respectively. This study addresses the characteristics of features for resolving homonymous author names appearing in citation data. As disambiguation features, previous works have employed citation-internal features such as co-authorship, titles of articles, titles of publications as well as citation-external features such as emails, affiliations, Web evidences. To the best of our knowledge, however, there has been no literature to deal with the influences of features on author disambiguation. This study analyzes the effect of individual features on author resolution using a large-scale test set for Korean.


  • 주제어

    저자 식별 .   동명이인 .   자질 분석.  

  • 참고문헌 (10)

    1. N. Aswani, K. Bontcheva, and H. Cunningham, Mining information for instance unification, ISWC-2006, pp.329-342, 2006. 
    2. A. Culotta, P. Kanani, R. Hall, M. Wick, and A. McCallum, Author disambiguation using error-driven machine learning with a ranking loss function, IIWeb-2007, 2007. 
    3. R. Guha, A. Garg, Disambiguating people in search, WWW-2004, 2004. 
    4. H. Han, C. L. Giles, and H. Zha, A model-based k-means algorithm for name disambiguation, Semantic Web Technologies for Searching and Retrieving Scientific Data, 2003. 
    5. H. Han, C. L. Giles, H. Zha, C. Li, and K. Tsioutsiouliklis, Two supervised learning approaches for name disambiguation in author citations, JCDL-2004, 2004. 
    6. J. Huang, S. Ertekin, and C. L. Giles, Efficient name disambiguation for large scale databases, PKDD-2006, pp.536-544, 2006. 
    7. P. Kanani, A. McCallum, and C. Pal, Improving author coreference by resource-bounded information gathering from the Web, IJCAI-2007, 2007. 
    8. Y. Song, J. Huang, I. Councill, J. Li, and C. L. Giles, Efficient topic-based unsupervised name disambiguation, JCDL-2007, 2007. 
    9. V. I. Torvik, M. Weeber, D. R. Swanson, and N. R. Smalheiser, "A probabilistic similarity metric for Medline records: a model for author name disambiguation," JASIST, Vol.56, No.2, pp.140-158, 2005. 
    10. W. E. Winkler, Overview of record linkage and current research directions, Research Report Series #2006-2, Statistical Research Division, U.S. Census Bureau., 2006. 
  • 이 논문을 인용한 문헌 (7)

    1. Kang, In-Su 2009. "Exploration of Hierarchical Techniques for Clustering Korean Author Names" 정보관리연구 = Journal of information management, 40(2): 95~115     
    2. Kang, In-Su 2011. "Author Graph Generation based on Author Disambiguation" 정보관리연구 = Journal of information management, 42(1): 47~62     
    3. Kang, In-Su 2011. "Disambiguation of Author Names Using Co-citation" 정보관리연구 = Journal of information management, 42(3): 167~186     
    4. Jeong, Do-Heon ; Hwang, Myunggwon ; Cho, Minhee ; Jung, Hanmin ; Yoon, Soyoung ; Kim, Kyungsun ; Kim, Pyung 2012. "Ontology and Text Mining-based Advanced Historical People Finding Service" 인터넷정보학회논문지 = Journal of Korean Society for Internet Information, 13(5): 33~43     
    5. Kim, Song-Ie ; Chung, Yeon Kyoung 2014. "A Comparative Study on Authority Records for Japanese Writers in Japan and the United States of America" 한국문헌정보학회지 = Journal of the Korean Society for Library and Information Science, 48(1): 149~170     
    6. 2015. "" International journal of contents, 11(1): 52~61     
    7. Kim, Jinyoung ; Lee, Seok-Hyong ; Suh, Dongjun ; Kim, Kwang-Young 2016. "A Study on the Method and System for Organization's Name Authorization of Korean Science and Technology Contents" 디지털콘텐츠학회 논문지 = Journal of Digital Contents Society, 17(6): 555~563     

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역

원문보기

무료다운로드
유료다운로드

유료 다운로드의 경우 해당 사이트의 정책에 따라 신규 회원가입, 로그인, 유료 구매 등이 필요할 수 있습니다. 해당 사이트에서 발생하는 귀하의 모든 정보활동은 NDSL의 서비스 정책과 무관합니다.

원문복사신청을 하시면, 일부 해외 인쇄학술지의 경우 외국학술지지원센터(FRIC)에서
무료 원문복사 서비스를 제공합니다.

NDSL에서는 해당 원문을 복사서비스하고 있습니다. 위의 원문복사신청 또는 장바구니 담기를 통하여 원문복사서비스 이용이 가능합니다.

이 논문과 함께 출판된 논문 + 더보기