본문 바로가기
HOME> 논문 > 논문 검색상세

논문 상세정보

WebPR :빈발 순회패턴 탐사에 기반한 동적 웹페이지 추천 알고리즘
WebPR : A Dynamic Web Page Recommendation Algorithm Based on Mining Frequent Traversal Patterns

윤선희   (미림 전산고등학교UU0015094  ); 김삼근   (한경대학교 컴퓨터공학과UU0001369  ); 이창훈   (한경대학교 컴퓨터공학과UU0001369  );
  • 초록

    월드 와이드 웹(World-Wide Web)은 가장 커다란 분산된 정보저장소로서 계속하여 빠른 속도로 성장해왔다. 그러나 비록 웹이 빠른 속도로 성장하고 있다 할지라도, 웹의 정보를 읽고 이해하는 데는 본질적으로 한계가 있다. 웹 사용자 입장에서 보면 웹의 정보 폭발, 꾸준하게 변화하는 환경, 사용자 요구에 대한 이해 부족 둥으로 오히려 혼란을 겪을 수 있다. 웹의 이러한 환경에서 사용자의 순회패턴(traversal patterns)을 탐사하는 것은 시스템 설계나 정보서비스 제공 측면에서 중요한 문제이다. 순회패턴 탐사에 관한 기존의 연구들은 세션(sessions)에 나타나는 페이지들간의 연관성 정보를 충분히 활용하지 못한다. 본 논문에서는 세션에 나타나는 페이지들간의 연관성 정보를 활용하여 빈발 k-페이지집합을 탐사하고, 이를 기반으로 하여 추천 페이지집합을 생성함으로써 효율적인 웹 정보서비스를 제공할 수 있는 Web Page Recommend(WebPR) 알고리즘들을 제안한다. 제안한 WebPR 알고리즘은 웹 사이트를 방문한 사용자에게 추천 페이지집합을 포함하는 새로운 페이지뷰(pageview)를 제공함으로써 궁극적으로 찾고자하는 목표 페이지에 효과적으로 접근할 수 있도록 해준다. 기존 연구들과의 가장 큰 차이점은 페이지들간의 연관성 정보를 활용하는 방법들을 일관성 있게 고려하고 있다는 점과 가장 효율적인 트리모델을 제안한다는 점이다. 두개의 실제 웹로그(Weblog) 데이터에 대한 실험은 제안한 방법이 기존의 방법들보다 성능이 우수함을 보여준다.


    The World-Wide Web is the largest distributed Information space and has grown to encompass diverse information resources. However, although Web is growing exponentially, the individual's capacity to read and digest contents is essentially fixed. From the view point of Web users, they can be confused by explosion of Web information, by constantly changing Web environments, and by lack of understanding needs of Web users. In these Web environments, mining traversal patterns is an important problem in Web mining with a host of application domains including system design and Information services. Conventional traversal pattern mining systems use the inter-pages association in sessions with only a very restricted mechanism (based on vector or matrix) for generating frequent k-Pagesets. We develop a family of novel algorithms (termed WebPR - Web Page Recommend) for mining frequent traversal patterns and then pageset to recommend. Our algorithms provide Web users with new page views, which Include pagesets to recommend, so that users can effectively traverse its Web site. The main distinguishing factors are both a point consistently spanning schemes applying inter-pages association for mining frequent traversal patterns and a point proposing the most efficient tree model. Our experimentation with two real data sets, including Lady Asiana and KBS media server site, clearly validates that our method outperforms conventional methods.


  • 주제어

    순회패턴 .   빈발 k-페이지 집합 .   페이지간 연관관계 .   웹추천.  

  • 참고문헌 (11)

    1. L. Catledge and J. Pitkow, 'Characterization browsing behaviors on the world wide web,' Computer Networks and ISDN Systems, 27(6), 1995 
    2. C. Shahabi, F. Banaei-Kashani, J. Faruque and A. Faisal, 'Feature Matrices : A Model for Efficient and Anonymous Web Usage Mining,' EC-Web 2001, Germany, September, 2001 
    3. A. Buchner and M. D. Mulvenna, 'Discovering internet marketing intelligence through online analytical Web usage mining,' SIGMOD Record, 27(4), 1999 
    4. B. M. Sarwar, G. Karypis, J. A. Konstan and J. Riedl, 'Analysis of recommender algorithms for e-commerce,' ACM E-Commerce'00 Conference, Mineapolis, MN, pp.158-167, 2000 
    5. T. W. Yan, M. Jacobsen, H. G. Molina and U. Dayal, 'From User Access Patterns to Dynamic Hypertext Linking,' The 5th Int'l World Wide Web Conf., Paris, France, May, 1996 
    6. J. Han and M. Kamber, 'Data Mining : Concepts and Techniques,' Morgan Kaufmann publishers, pp. 349-351, 2001 
    7. M. Spilipoulou, 'Web usage mining for site evaluation : making a site better fit its users,' Communications of ACM, 43, pp.127-134, 2000 
    8. M. C. Drott, 'Using web server logs to improve site design,' Proceedings on the Sixteenth Annual International Conference on Computer Documentation, Quebec, Canada, pp.43-50, 1998 
    9. M. Perkowitz and O. Etzioni, 'Towards adaptive Web sites : Conceptual framework and case study,' Artificial Intelligence, Vol.118, pp.245-275, 2000 
    10. W3C Web Characterization Activity, http://www.w3.org/WCA/, 2003 
    11. J. E. Pitkow, 'Summary of WWW characterizations,' Web Journal, 2, pp.3-13, 1998 

 저자의 다른 논문

  • 윤선희 (6)

    1. 2001 "웹마이닝 시스템을 위한 페이지 로깅 시스템" 정보처리학회논문지. The KIPS transactions. Part C Part C c8 (6): 847~854    
    2. 2003 "익명 웹로그 탐사에 기반한 동적 링크 추천" 정보처리학회논문지. The KIPS transactions. Part C Part C c10 (5): 647~656    
    3. 2005 "빈발 순회패턴 탐사에 기반한 확장된 동적 웹페이지 추천 알고리즘" 멀티미디어학회논문지 = Journal of Korea Multimedia Society 8 (9): 1163~1176    
    4. 2005 "얼굴 분석과 유사도 비교를 이용한 사용자 인증 시스템" 멀티미디어학회논문지 = Journal of Korea Multimedia Society 8 (11): 1439~1448    
    5. 2006 "자동 인덱싱 에이전트를 이용한 의미기반 비디오 검색 시스템" 멀티미디어학회논문지 = Journal of Korea Multimedia Society 9 (1): 127~137    
    6. 2006 "멀티 에이전트를 이용한 인터넷 채용 협상 시스템의 구현" 韓國컴퓨터情報學會論文誌 = Journal of the Korea Society of Computer and Information 11 (2): 341~349    
  • 김삼근 (13)

  • 이창훈 (10)

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역

원문보기

무료다운로드
  • NDSL :
유료다운로드

유료 다운로드의 경우 해당 사이트의 정책에 따라 신규 회원가입, 로그인, 유료 구매 등이 필요할 수 있습니다. 해당 사이트에서 발생하는 귀하의 모든 정보활동은 NDSL의 서비스 정책과 무관합니다.

원문복사신청을 하시면, 일부 해외 인쇄학술지의 경우 외국학술지지원센터(FRIC)에서
무료 원문복사 서비스를 제공합니다.

NDSL에서는 해당 원문을 복사서비스하고 있습니다. 위의 원문복사신청 또는 장바구니 담기를 통하여 원문복사서비스 이용이 가능합니다.

이 논문과 함께 출판된 논문 + 더보기