본문 바로가기
HOME> 보고서 > 보고서 검색상세

보고서 상세정보

한국어에 기반한 인터넷 지식정보의 지능적 통합기술 개발

  • 사업명

    중소기업기술혁신개발

  • 과제명

    한국어에 기반한 인터넷 지식 정보의 지능적 통합 기술개발

  • 주관연구기관

    (주)나라인포테크

  • 연구책임자

    권혁철

  • 보고서유형

    최종보고서

  • 발행국가

    대한민국

  • 언어

    한국어

  • 발행년월

    2003-05

  • 과제시작년도

    2002

  • 주관부처

    중소기업청

  • 사업 관리 기관

    한국산업기술평가원

  • 등록번호

    TRKO201000015579

  • 과제고유번호

    1420018885

  • 키워드

    인터넷.한국어.색인.정보검색.정보추출.정보가공.정보통합.자연언어.질의 처리.인터넷 로봇.Ontology.

  • DB 구축일자

    2013-04-18

  • 초록 


    ...


    가. 한국어 정보 추출을 위한 기술 개발
    한국어 문장에서 응용 분야별 전문 용어인 키워드(Keyword)를 중심으로 지식을 추출하는 기법을 개발함으로써 정형화되지 않은 문장에서 능동적으로 한국어 지식을 추출하는 방법을 개발한다...

    가. 한국어 정보 추출을 위한 기술 개발
    한국어 문장에서 응용 분야별 전문 용어인 키워드(Keyword)를 중심으로 지식을 추출하는 기법을 개발함으로써 정형화되지 않은 문장에서 능동적으로 한국어 지식을 추출하는 방법을 개발한다. 이를 위해 응용 분야별 전문 용어 사전을 구축했으며, 부분 문장 분석 기술을 활용한다.
    나. 정보 검색 시스템 성능 개선
    기존 정보 검색 시스템에 능동적인 정보 수집 능력을 부여하기 위하여 정보 검색 시스템 중 로봇 시스템의 성능을 확장, 개선한다. 정보 검색홈페이지의 특성에 따라 정보 갱신(Update) 주기와 특성을 학습하여 예측함으로써 최신의 정보 입수할 수 있게 하며, 중복 문서 제거와 불필요한 내용의 제거 기법을 개발했다.
    다. 인터넷 문서 중 지식 정보 추출
    홈페이지의 구조적 특성과 한국어 정보 추출을 위한 기술을 결합하여 정형화한 지식을 추출하는 기술을 개발한다. 이를 위하여 HTML문서 중 의미 있는 정보인 제목, 링크 정보, anchor정보, 표를 HTML tag를 이용하여 분리한다. 그 중 표는 특별한 HTML문서 구조 정보로 표에 대한 정보 추출과 가공 방법을 집중적으로 연구하였다.
    라. Ontology에 기반한 전문 용어 사전 구축
    계층적 의미 관계에 기반한 Ontology사전을 위한 구조를 정의하고, 전자상거래에서 사용될 수 있는 전문 용어를 중심으로 계층화된 Ontology 사전을 구축했다. 이를 위하여 문서 내 단어들의 통계적 정보를 활용했다.


  • 목차(Contents) 

    1. 표지 ...1
    2. 제출문 ...2
    3. 요약서(초록) ...3
    4. 목차 ...6
    5. 제1장 서 론 ...7
    6. 제1절 기술 개발의 개요 ...7
    7. 제2절 기존 기술의 문제점과 기술 개발의 필요성 ...7
    8. 제3절 기술 개발 목표 ...10
    9. 제4절 사업 추진 현...
    1. 표지 ...1
    2. 제출문 ...2
    3. 요약서(초록) ...3
    4. 목차 ...6
    5. 제1장 서 론 ...7
    6. 제1절 기술 개발의 개요 ...7
    7. 제2절 기존 기술의 문제점과 기술 개발의 필요성 ...7
    8. 제3절 기술 개발 목표 ...10
    9. 제4절 사업 추진 현황 ...11
    10. 제2장 한국어 정보 추출을 위한 기술 개발 ...14
    11. 제1절 개요 ...14
    12. 제2절 한국어 정보 추출을 위한 기술 구성 ...15
    13. 제3절 한국어 형태소 분석기의 성능 개선 ...16
    14. 제4절 한국어 태깅 성능 개선을 위한 부분 문장 분석 ...18
    15. 제3장 인터넷 문서 정보 추출 기술 ...23
    16. 제1절 인터넷 문서 중 표 정보 추출 ...23
    17. 제2절 문서 구조 분석 기술 개선 ...44
    18. 제3절 이미지에 대한 처리 기술 개선 ...46
    19. 제4장 인터넷 정보 검색 시스템 성능 개선 ...50
    20. 제1절 인터넷 로봇 시스템 확장 및 개선 ...50
    21. 제2절 인터넷 멀티미디어 정보의 검색 기능 ...52
    22. 제3절 자연 언어 질의 처리 기술의 개선 ...59
    23. 제5장 전문분야를 위한 Ontology 사전 구축 ...64
    24. 제1절 개요 ...64
    25. 제2절 전문 용어에 대한 의존 관계 사전 구축 ...64
    26. 제3절 의존 관계 사전의 적용 ...68
    27. 제4절 Perfect Hashing 기법의 이용 ...69
    28. 제6장 기대 효과 및 활용 방안 ...71
    29. 제1절 기대 효과 ...71
    30. 제2절 제품의 사업화 방법 ...72
  • 참고문헌

    1. 전체(0)
    2. 논문(0)
    3. 특허(0)
    4. 보고서(0)

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역