본문 바로가기
HOME> 논문 > 논문 검색상세

논문 상세정보

TFIDF를 이용한 키워드 추출 시스템 설계
Design of Keyword Extraction System Using TFIDF

이말례   (여수대학교 멀티미디어학부UU0000929  ); 배환국   ((주)소프트캠프CC0097153  );
  • 초록

    본 논문에서는 먼저 Anchor Text의 단어들이 키워드로 적합한지 TFIDF를 이용하여 테스트하였다. 그 결과는 가중치가 높아서 키워드로 적합한 단어가 있었는가 하면. 아예 문서에 나오지도 않는 단어가 있어 키워드로 적합하지 않은 단어도 있었다. 이를 해결하기 위하여 새로운 키워드 추출 방법을 제시하였다. 본 논문에서는 적합하지 않은 키워드를 제거함으로써 새로운 키워드를 만들어 내고 TFIDF값을 각 키워드의 가중치로 이용하여 Ranking이 가능하게 하였다. 이렇게 추출된 키워드는 기존의 방법보다 정확도가 높아졌음 증명했다.


    In this paper, a test was performed to determine whether words in Anchor Text were appropriate as key words. As a result of the test. there were proper words of high weighting factor, while some others did not even appear in the text. therefore, were not appropriate as key words. In order to resolve this problem. a new method was proposed to extract key words. Using the proposed method, inappropriate key words can be removed so that new key words be set, and then, ranking becomes possible with the TFIDF value as a weighting factor of the key word. It was verified that the new method has higher accuracy compared to the previous methods.


  • 주제어

    에이전트 .   개념 그래프 .   검색엔진.  

  • 참고문헌 (8)

    1. Term weighting approaches in automatic text retrieval , Salton. G.;Buckley. C. , Tech Report 87-881 Dept. of Computer Science / v.,pp.,
    2. WebWatcher: A Learning Apprentice for the World Web , Armstrong. R.;Fritag. D.;Joachims. T.;Michell. T. , AAAI 1195 Spring Symposium on Information Gathering from Heterogeneous / v.,pp.,
    3. William. B.;Frakes;Ricardo;Baeza/Yates , Information Retrieval DataStructure and Algorithms / v.,pp.,
    4. Developments in automatic text retrieval , G. Salton , Science / v.253,pp.974-979,
    5. CiteSeer: An Automous Web Agent for Automatic Retrieval' and Identification of Interesting Publications , Kuet D. Bollacker;Steve Lawence;C. Lee Giles , Agents '98 / v.,pp.,
    6. The Anatomy of a Large-Scale Hypertextual Web Search Engine , Sergey Brin;Lawrence Page , Proceeding of the 7th International World Wide Web Conference(WWW7) / v.,pp.,
    7. A Vector Space Model for Automatic Indexing , Salton G.;A.Wong;C.S. Yang , Communications of the AMC / v.18,pp.613-620,
    8. Gerald Kowalski , Intermation Retrieval Systems Theory and Implementaion / v.,pp.,

 저자의 다른 논문

  • 이말례 (6)

    1. 2000 "인터넷에서 정보 서비스를 위한 검색 시스템" 한국멀티미디어학회지 4 (1): 29~36    
    2. 2000 "멀티미디어 통신에 있어서 멀티슬롯 할당을 이용한 적응변조방식에 관한 성능해석" 멀티미디어학회논문지 = Journal of Korea Multimedia Society 3 (6): 625~632    
    3. 2001 "학습기법을 이용한 멀티 에이전트 시스템 자동 조정 모델" 정보처리학회논문지. The KIPS transactions. Part B. Part B b8 (6): 587~594    
    4. 2002 "정보추출을 이용한 학습기반의 웹 인터페이스 에이전트" 정보관리학회지 = Journal of the Korean society for information management 19 (1): 5~22    
    5. 2002 "신경 논리 망을 기반으로 한 퍼지 추론 망 구성" 인지과학 = Korean journal of cognitive science 13 (1): 13~21    
  • 배환국 (0)

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역

원문보기

무료다운로드
  • NDSL :
유료다운로드

유료 다운로드의 경우 해당 사이트의 정책에 따라 신규 회원가입, 로그인, 유료 구매 등이 필요할 수 있습니다. 해당 사이트에서 발생하는 귀하의 모든 정보활동은 NDSL의 서비스 정책과 무관합니다.

원문복사신청을 하시면, 일부 해외 인쇄학술지의 경우 외국학술지지원센터(FRIC)에서
무료 원문복사 서비스를 제공합니다.

NDSL에서는 해당 원문을 복사서비스하고 있습니다. 위의 원문복사신청 또는 장바구니 담기를 통하여 원문복사서비스 이용이 가능합니다.

이 논문과 함께 이용한 콘텐츠
이 논문과 함께 출판된 논문 + 더보기