본문 바로가기
HOME> 논문 > 논문 검색상세

논문 상세정보

행렬 전치를 이용한 효율적인 NaiveBayes 알고리즘
An Efficient Algorithm for NaiveBayes with Matrix Transposition

이재문   (한성대학교 컴퓨터공학부UU0001508  );
  • 초록

    본 논문은 NaiveBayes에서 정확도의 손실 없이 효율적으로 동작하는 NaiveBayes에 대한 새로운 알고리즘을 제안한다. 제안된 방법은 분류 벡터에 대한 행렬 전치를 사용하여 NaiveBayes의 확률 계산 량을 최소화하는 것이다. 제안된 방법을 문서 분류 프레임 인 AI::Categorizer 상에서 구현하였으며, 잘 알려진 로이터-21578 데이터를 사용하여 기존의 NaiveBayes 방법과 비교하였다. 성능 비교의 결과로부터 제안된 방법이 기존의 NaiveBayes 방법보다 실행 속도측면에서 약 2배 정도의 성능 개선 효과가 있음을 알 수 있었다. 수 있었다.


    This paper proposes an efficient algorithm of NaiveBayes without loss of its accuracy. The proposed method uses the transposition of category vectors, and minimizes the computation of the probability of NaiveBayes. The proposed method was implemented on the existing framework of the text categorization, so called, AI::Categorizer and it was compared with the conventional NaiveBayes with the well-known data, Router-21578. The comparisons show that the proposed method outperforms NaiveBayes about two times with respect to the executing time.


  • 주제어

    문서 관류 .   학습 문서 .   시험 문서 .   문서 벡터.  

  • 참고문헌 (13)

    1. Reuters-21578 Document Collection, http://about.reuters.com/researchandstandards/corpus 
    2. Sebastiani, F., 'Machine learning in automated text categorization,' ACM Computing Surveys, 34(1), pp.1-47, 2002 
    3. Williams, K. and R. A. Calvo, 'A Framework for Text Categorization', 7th Australian Document Computing Symposium, Dec., 2002 
    4. 김한준, '텍스트 마이닝 기술을 적용한 대용량 온라인 문서 데이터의 계층적 조직화 기법', 서울대학교 대학원 박사학위 논문, 2002 
    5. Calvo, R. A. and J. M. Lee, 'Coping with the News : the machine learning way', The 9th Australian World Wide Web Conference(AUSWEB 03), 2003 
    6. 이재문, '휴리스틱을 이용한 kNN의 효율성 개선', 정보처리학회논문지B, 제10-B권 제6호, 2003     
    7. Y. Yang, 'Expert Network : Effective and efficient learning from human decisions in text categorization and retrieval,' In 17th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, 1994 
    8. S. T. Dumais, J. Platt, D. Heckerman, and M. Sahami, 'Inductive learning algorithms and representations for text categorization,' In CIKM, 1998 
    9. Y. Yang and X. Liu, 'A re-examination of text categorization methods,' In 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, Berkley, August, 1999 
    10. Calvo, R. A. and H. A. Ceccatto, 'Intelligent Document Classification,' Intelligent Data Analysis, 4(5), 2000 
    11. Calvo R. A., 'Classifying financial news with neural networks,' In 6th Australian Document Symposium, page 6, Dec., 2001 
    12. Tom Ault and Y. Yang, 'kNN, Rocchio and Metrics for Information Filtering at TREC-10,' In The 10th Text Retrieval Conference(TREC-10), NIST, 2001 
    13. Y. Yang, 'A Study on Thresholding Strategies for Text Categorization,' In 24th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, New York, 2001 

 저자의 다른 논문

  • 이재문 (23)

    1. 1995 "일관성에 기초한 적응 부하 평형" 정보처리논문지 = The transactions of the Korea Information Processing Society 2 (3): 288~298    
    2. 1999 "복합 해쉬트리를 이용한 효율적인 연관규칙 탐사 알고리즘" 정보과학회논문지. Journal of KISS (b):software and applications. B 26 (3): 343~352    
    3. 2001 "대화형 환경에서 효율적인 연관 규칙 알고리즘" 정보처리학회논문지. The KIPS transactions. Part D. Part D d8 (4): 339~346    
    4. 2003 "휴리스틱을 이용한 kNN의 효율성 개선" 정보처리학회논문지. The KIPS transactions. Part B. Part B b10 (6): 719~724    
    5. 2004 "효율적인 kNN 알고리즘" 정보처리학회논문지. The KIPS transactions. Part B. Part B b11 (7): 849~854    
    6. 2006 "빈발단어집합을 이용한 NaiveBayes의 정확도 개선" 인터넷정보학회논문지 = Journal of Korean Society for Internet Information 7 (3): 169~178    
    7. 2006 "기계학습 기법을 사용한 캐릭터 제어 엔진의 설계 및 구현" 한국게임학회 논문지 = Journal of Korea Game Society 6 (4): 79~87    
    8. 2008 "대표 보이드를 이용한 대규모 무리의 효율적인 무리짓기" 한국게임학회 논문지 = Journal of Korea Game Society 8 (3): 87~95    
    9. 2009 "이전 k 개의 가장 가까운 이웃을 이용한 무리 짓기에 대한 공간분할 방법의 개선" 한국게임학회 논문지 = Journal of Korea Game Society 9 (2): 115~123    
    10. 2009 "다중 에이전트에 기반한 집단행동의 기술 동향" 한국멀티미디어학회지 13 (1): 1~13    

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역

원문보기

무료다운로드
  • NDSL :
유료다운로드

유료 다운로드의 경우 해당 사이트의 정책에 따라 신규 회원가입, 로그인, 유료 구매 등이 필요할 수 있습니다. 해당 사이트에서 발생하는 귀하의 모든 정보활동은 NDSL의 서비스 정책과 무관합니다.

원문복사신청을 하시면, 일부 해외 인쇄학술지의 경우 외국학술지지원센터(FRIC)에서
무료 원문복사 서비스를 제공합니다.

NDSL에서는 해당 원문을 복사서비스하고 있습니다. 위의 원문복사신청 또는 장바구니 담기를 통하여 원문복사서비스 이용이 가능합니다.

이 논문과 함께 이용한 콘텐츠
이 논문과 함께 출판된 논문 + 더보기