본문 바로가기
HOME> 논문 > 논문 검색상세

논문 상세정보

Shannon의 정보이론과 문헌정보
Shannon's Information Theory and Document Indexing

정영미   (연세대학교 도서관학과UU0000936  );
  • 초록

    Information storage and retrieval is a part of general communication process. In the Shannon's information theory, information contained in a message is a measure of -uncertainty about information source and the amount of information is measured by entropy. Indexing is a process of reducing entropy of information source since document collection is divided into many smaller groups according to the subjects documents deal with. Significant concepts contained in every document are mapped into the set of all sets of index terms. Thus index itself is formed by paired sets of index terms and documents. Without indexing the entropy of document collection consisting of N documents is $log_2\;N$ , whereas the average entropy of smaller groups $(W_1,\;W_2,...W_m)$ is as small $(as\;(\sum\limits^m_{i=1}\;H(W_i))/m$ . Retrieval efficiency is a measure of information system's performance, which is largely affected by goodness of index. If all and only documents evaluated relevant to user's query can be retrieved, the information system is said $100\%$ efficient. Document file W may be potentially classified into two sets of relevant documents and non-relevant documents to a specific query. After retrieval, the document file W' is reclassified into four sets of relevant-retrieved, relevant-not retrieved, non-relevant-retrieved and non-relevant-not retrieved. It is shown in the paper that the difference in two entropies of document file Wand document file W' is a proper measure of retrieval efficiency.


 저자의 다른 논문

  • 정영미 (53)

    1. 1977 "정보학의 영역과 현황" 정보관리연구 = Journal of information management 10 (3): 65~70    
    2. 1981 "국립중앙도서관 자료관리의 전산화연구 -기계가독목록의 개발과 활용-" 도서관학 = Journal of the Korean Library Science Society 8 (): 3~72    
    3. 1982 "자동색인의 통계적기법과 한국어 문헌의 실험" 도서관학 = Journal of the Korean Library Science Society 9 (): 99~118    
    4. 1987 "도서관$\cdot$정보학에서의 인공지능의 응용에 관한 고찰" 도서관학 = Journal of the Korean Library Science Society 14 (): 67~92    
    5. 1987 "우리말 신문기사 검색을 위한 질문응답시스템 구현에 관한 연구" 정보관리학회지 = Journal of the Korean society for information management 4 (1): 3~23    
    6. 1989 "하이퍼텍스트의 개념과 응용에 관한 고찰" 정보관리학회지 = Journal of the Korean society for information management 6 (2): 3~20    
    7. 1989 "온라인목록 주제접근점 확장을 위한 분류표 지식베이스 설계에 관한 연구" 정보관리학회지 = Journal of the Korean society for information management 6 (2): 87~103    
    8. 1990 "문헌정보학 영역 지식기반시스템에서의 지식표현" 정보관리학회지 = Journal of the Korean society for information management 7 (2): 35~57    
    9. 1991 "용어간 관계를 이용한 검색문헌의 순위부여에 관한 연구" 정보관리학회지 = Journal of the Korean society for information management 8 (1): 100~116    
    10. 1993 "신문 시소러스 개발의 이론과 실제" 한국문헌정보학회지 = Journal of the Korean Society for Library and Information Science 25 (): 51~82    

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역

원문보기

무료다운로드
  • NDSL :
유료다운로드

유료 다운로드의 경우 해당 사이트의 정책에 따라 신규 회원가입, 로그인, 유료 구매 등이 필요할 수 있습니다. 해당 사이트에서 발생하는 귀하의 모든 정보활동은 NDSL의 서비스 정책과 무관합니다.

원문복사신청을 하시면, 일부 해외 인쇄학술지의 경우 외국학술지지원센터(FRIC)에서
무료 원문복사 서비스를 제공합니다.

NDSL에서는 해당 원문을 복사서비스하고 있습니다. 위의 원문복사신청 또는 장바구니 담기를 통하여 원문복사서비스 이용이 가능합니다.

이 논문과 함께 이용한 콘텐츠
이 논문과 함께 출판된 논문 + 더보기