본문 바로가기
HOME> 논문 > 논문 검색상세

학위논문 상세정보

2단계 샘플 방식을 수정한 연관규칙 데이터 마이닝 원문보기
Improved Association Rule Mining Based on FAST(Finding Associations from Sampled Transactions) Algorithm

  • 저자

    이문환

  • 학위수여기관

    고려대학교 대학원

  • 학위구분

    국내석사

  • 학과

    전기공학과

  • 지도교수

  • 발행년도

    2004

  • 총페이지

    50p.

  • 키워드

    샘플방식 연관규칙 데이터마이닝;

  • 언어

    kor

  • 원문 URL

    http://www.riss.kr/link?id=T10072037&outLink=K  

  • 초록

    수십 내지 수백 메가바이트(Mega Byte)이상 되는 대규모 데이터를 빠른 시간 내에 분석하기 위해 샘플 방식의 연관규칙 알고리즘들이 발표되었다. 그중에 FAST(Finding Associations from Sampled Transactions) 알고리즘은 축소된 샘플 데이터만 가지고도 전체 데이터베이스 내의 연관규칙을 추정해 내는 알고리즘이다. FAST 알고리즘은 아웃라이어(outlier) 트랜잭션을 가려낼 때 빈발 1항목 집합(frequent 1-itemsets)만 비교하였기 때문에 2항목 이상의 빈발 항목 집합에 대해서는 정확도가 떨어지는 단점이 있다. 본 논문은 빈발 1항목 집합뿐만 아니라 빈발 2항목 집합까지 비교하고 아웃라이어를 제거하는 IFAST(Improved FAST) 알고리즘을 제안한다. 알고리즘을 통해 찾아낸 빈발항목 집합의 품질(quality)을 측정한 결과 IFAST 알고리즘이 2항목 집합 이상의 긴 패턴에 대해서도 보다 정확한 연관규칙을 찾아내기 때문에 FAST 알고리즘보다 우수한 것을 확인 하였다.


    FAST(Finding Associations from Sampled Transactions) algorithm has been proposed to discover frequent patterns in whole data based on the small sample data. Since FAST does not reflect bigger itemset information, the quality of the mining may not be quite satisfactory. The objective of this thesis is solve the problem, thus, a revised algorithm called IFAST(Improved FAST) is developed. IFAST compares not only 1-itemsets but also 2-itemsets to trim the outliers. Experimental results show some improvement of the quality of the mining result even with a fraction of the sampled data without the lost of the execution-time performance.


 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역