본문 바로가기
HOME> 논문 > 논문 검색상세

학위논문 상세정보

전력 시소러스를 이용한 정보검색 질의확장에 관한 연구 원문보기
Query expansion using power electric thesaurus in information retrieval

  • 저자

    이인태

  • 학위수여기관

    高麗大學校 경영정보대학원

  • 학위구분

    국내석사

  • 학과

    전산정보시스템전공

  • 지도교수

    박대희

  • 발행년도

    2014

  • 총페이지

    iv, 34장

  • 키워드

    시소러스 Thesaurus 정보검색 Information Retrieval 벡터모델 VSM 검색평가 Information Retrieval Evaluation;

  • 언어

    kor

  • 원문 URL

    http://www.riss.kr/link?id=T13542636&outLink=K  

  • 초록

    본 논문에서는 한전 및 전력그룹사간 체계적 정보관리 및 정보공유를 위해 전력시소러스를 구축하고 전력기술정보 포털 시스템을 테스트 베드로 검색효율을 향상시키기 위해 시소러스를 이용한 질의확장 수행하였다. 먼저 전력 시소러스 구축을 위해 기술 분야별 3단계 구축 계획 수립하고, 전력 기술을 포괄하는 전력기술용어 분류체계를 대분류, 중분류, 소분류로 수립하였다. 전력 시소러스 구축 계획에 따라 용어사전, 논문, 특허, 절차서, 보고서 등 대용량 어휘집으로부터 용어 후보를 30,000개를 추출하여 선정하였다. 시소러스 구축 표준에 따라 수집된 용어에 대해 어휘통제를 수행하고, ISO 2788에 의거 NT, BT, RT 등 주요 시소러스 관계를 설정하였다. 최종 구축된 전력시소러스는 우선어 기준으로 71,595개이다. 정보검색의 효율성을 실증하기 전력기술정보 포털 시스템을 테스트 베드로 전력분야의 특성을 반영한 테스트 컬렉션을 구성하였다. 전체 컬렉션은 전력연구원의 14년간 논문 데이터베이스 12,468건을 대상으로 하였다. 10개 질의에 대해 질의확장을 수행하였고 질의확장 대상은 전력시소러스의 ENG, USE/UF 관계에 대해 사용자의 개입 없이 자동으로 수행하였다. 질의확장 시 확장된 질의어의 가중치 계산은 벡터모델의 tf․idf 문헌 용어간 가중치 계산 방식을 적용하였다. 전력 시소러스를 이용한 질의 확장 실험을 통하여 질의확장 전과 후의 검색성능을 비교 평가하였다. 비교 실험결과 전력 시소러스를 이용해 질의확장한 경우 정확률과 MAP에서 질의확장 전보다 검색성능 면에서 더욱 좋은 결과를 보였다.


 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역