본문 바로가기
HOME> 논문 > 논문 검색상세

논문 상세정보

Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지 v.21 no.2, 2010년, pp.263 - 270   피인용횟수: 6
본 등재정보는 저널의 등재정보를 참고하여 보여주는 베타서비스로 정확한 논문의 등재여부는 등재기관에 확인하시기 바랍니다.

올바른 연관성 규칙 생성을 위한 의사결정과정의 제안
Decision process for right association rule generation

박희창    (창원대학교 통계학과  );
  • 초록

    데이터마이닝은 방대한 양의 데이터 속에서 쉽게 드러나지 않는 유용한 정보를 체계적이고도 자동적으로 찾아내는 기법이다. 데이터마이닝의 중요한 목표 중의 하나는 여러 변수들 간의 관계를 발견하고 결정하는 것이다. 연관성 규칙은 항목 집합으로 표현된 트랜잭션에서 각 항목간의 연관성을 반영하는 규칙으로서, 항목 집합간의 관계를 지지도, 신뢰도, 순수 신뢰도 등과 같은 흥미도 측도에 의해 명확히 수치화함으로써 두 개 이상의 항목집합간의 관련성을 표시해주기 때문에 현업에서 많이 활용되고 있다. 본 논문에서는 기존에 많이 활용되고 있는 흥미도 측도인 신뢰도와 순수 신뢰도의 문제점을 보완하여 연관성 규칙을 올바르게 생성하기 위한 새로운 의사결정과정을 제안하고자 한다. 본 논문에서 제안하는 의사결정과정은 특히 스트리밍 데이터베이스에서의 연관성 규칙을 탐색하는 데 효율적이다.


    Data mining is the process of sorting through large amounts of data and picking out useful information. An important goal of data mining is to discover, define and determine the relationship between several variables. Association rule mining is an important research topic in data mining. An association rule technique finds the relation among each items in massive volume database. Association rule technique consists of two steps: finding frequent itemsets and then extracting interesting rules from the frequent itemsets. Some interestingness measures have been developed in association rule mining. Interestingness measures are useful in that it shows the causes for pruning uninteresting rules statistically or logically. This paper explores some problems for two interestingness measures, confidence and net confidence, and then propose a decision process for right association rule generation using these interestingness measures.


  • 주제어

    데이터마이닝 .   순수 신뢰도 .   신뢰도 .   연관성 규칙 .   흥미도 측도.  

  • 참고문헌 (24)

    1. 안광일, 김성집 (2003). 연관규칙 탐색에서의 새로운 흥미도 척도의 제안. <대한산업공학회지>, 29, 41-48.     
    2. Agrawal, R., Imielinski R. and Swami, A. (1993). Mining association rules between sets of items in large databases. Proceedings of the ACM SIGMOD Conference on Management of Data, 207-216. 
    3. Agrawal, R. and Srikant, R. (1994). Fast algorithms for mining association rules. Proceedings of the 20th VLDB Conference, 487-499. 
    4. Bayardo, R. J. (1998). Efficiently mining long patterns from databases. Proceedings of ACM SIGMOD Conference on Management of Data, 85-93. 
    5. Bing, Liu, B., Hsu, W., Chen, S. and Ma, Y. (2000). Analyzing the subjective interestingness of association rules. IEEE Intelligent Systems, 15, 47-55. 
    6. Cai, C. H., Fu, A. W. C., Cheng, C. H. and Kwong, W. W. (1998). Mining association rules with weighted items. Proceedings of International Database Engineering and Applications Symposium, 68-77. 
    7. Cho, K. H. and Park, H. C. (2007). Association rule mining by environmental data fusion. Journal of the Korean Data & Information Science Society, 18, 279-287.     
    8. Cho, K. H. and Park, H. C. (2008). A study of association rule application using self-organizing map for fused data. Journal of the Korean Data & Information Science Society, 19, 95-104. 
    9. Choi, J. H. and Park, H. C. (2008). Comparative study of quantitative data binning methods in association rule. Journal of the Korean Data & Information Science Society, 19, 903-910.     
    10. Freitas, A. (1999). On rule interestingness measures. Knowledge-based System, 12, 309-315. 
    11. Han, J. and Fu, Y. (1999). Mining multiple-level association rules in large da tabases. IEEE Transactionson Knowledge and Data Engineering, 11, 68-77. 
    12. Han, J., Pei, J. and Yin, Y. (2000). Mining frequent patterns without candidate generation. Proceedings of ACM SIGMOD Conference on Management of Data, 1-12. 
    13. Hilderman, R. J. and Hamilton H. J. (2000). Applying objective interestingness measures in data mining systems. Proceedings of the 4th European Conference on Principles of Data Mining and Knowledge Discovery, 432-439. 
    14. Lee, K. W. and Park, H. C. (2008). Application of k-means clustering for association rule using measure of association. Journal of the Korean Data & Information Science Society, 19, 925-935.     
    15. Liu, B., Hsu, W. and Ma, Y. (1999). Mining association rules with multiple minimum supports. Proceedings of the 5th Int. Conference on Knowledge Discovery and Data Mining, 337-241. 
    16. Park, H. C. (2008). The proposition of conditionally pure confidence in association rule mining. Journal of the Korean Data & Information Science Society, 19, 1141-1151.     
    17. Park, H. C. and Song, K. M. (2002). Statistical decision making of association threshold in association rule data mining. Journal of the Korean Data & Information Science Society, 13, 115-128.     
    18. Park, J. S., Chen M. S. and Philip S. Y. (1995). An effective hash-based algorithms for mining association rules. Proceedings of ACM SIGMOD Conference on Management of Data, 175-186. 
    19. Pasquier, N., Bastide, Y., Taouil, R. and Lakhal, L. (1999). Discovering frequent closed itemsets for association rules. Proceedings of the 7th International Conference on Database Theory, 398-416. 
    20. Pei, J., Han, J. and Mao, R. (2000). CLOSET: An efficient algorithm for mining frequent closed itemsets. Proceedings of ACM SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery, 21-30. 
    21. Srikant, R. and Agrawal, R. (1995). Mining generalized association rules. Proceedings of the 21st VLDB Conference, 407-419. 
    22. Tan, P. N., Kumar, V. and Srivastava, J. (2002). Selecting the right interestingness measure for association patterns. Proceedings of the eighth ACM SIGKDD international conference on Knowledge discovery and data mining, 32-41. 
    23. Toivonen, H. (1996). Sampling large database for association rules. Proceedings of the 22nd VLDB Conference, 134-145. 
    24. Silberschatz, A. and Tuzhilin, A. (1996). What makes patterns interesting in knowledge discovery systems. IEEE transactions on Knowledge Data Engineering, 8, 970-974. 
  • 이 논문을 인용한 문헌 (6)

    1. Park, Cheol-Yong ; Kim, Yoon-Nyun ; Choi, Hyun-Seok ; Shin, A-Mi 2010. "Deveolping clinical pathways of acute appendicitis patients in emergency room" Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지, 21(3): 427~435     
    2. Park, Hee-Chang 2011. "Association rule thresholds of similarity measures considering negative co-occurrence frequencies" Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지, 22(6): 1113~1121     
    3. Choi, Kyoung-Ho ; Lee, Yong-Wook 2011. "The deduction of objective linguistic information using statistical methods - The grouping of the possibility of interdisciplinary research" Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지, 22(1): 49~55     
    4. Park, Cheol-Yong 2011. "Order selection based on scaled lift" Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지, 22(2): 227~234     
    5. Cho, Kwang-Hyun ; Park, Hee-Chang 2012. "A study on association rule creation by marginally conditional variables" Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지, 23(1): 121~129     
    6. Park, Hee-Chang 2012. "Association rule thresholds considering the number of possible rules of interest items" Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지, 23(4): 717~725     

 저자의 다른 논문

  • Park, Hee-Chang (143)

    1. 1995 "다수의 부품으로 구성된 직렬형 시스템의 부분적 고정충격 수명검사에 관한 최적계획" 한국통계학회 논문집 = Communications of the Korean Statistical Society 2 (2): 395~403    
    2. 1995 "절단된 자료가 있는 병렬형 시스템의 단계적 충격수명검사" 品質經營學會誌 = Journal of the Korean Society for Quality Management 23 (1): 15~28    
    3. 1996 "병렬형 시스템의 고정충격 수명검사에 관한 최적계획" 한국통계학회 논문집 = Communications of the Korean Statistical Society 3 (3): 103~111    
    4. 1996 "병렬형 시스템의 부분적 가속수명검사를 위한 최적계획" 品質經營學會誌 = Journal of the Korean Society for Quality Management 24 (4): 14~28    
    5. 1998 "공유환경효과를 고려한 수리가능한 시스템의 수명과 고장회수의 결합모형 개발" 品質經營學會誌 = Journal of the Korean Society for Quality Management 26 (4): 111~123    
    6. 1998 "공변량을 포함한 환자의 수명과 치료횟수의 모형화를 위한 개별환경효과의 적용" 한국통계학회 논문집 = Communications of the Korean Statistical Society 5 (2): 447~458    
    7. 1998 "환경효과를 고려한 수명검사의 최적계획" 한국통계학회 논문집 = Communications of the Korean Statistical Society 5 (3): 793~802    
    8. 1998 "공변량을 포함한 사망시간과 치료횟수의 결합모형의 개발" Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지 9 (2): 149~158    
    9. 1998 "공변량을 포함한 사망시간과 치료횟수의 모형화를 위한 주변환경효과모형의 적용" Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지 9 (2): 311~322    
    10. 1999 "델파이를 이용한 회귀진단 툴 개발" Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지 10 (1): 173~191    

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역

원문보기

무료다운로드
  • NDSL :
  • 한국데이터정보과학회 : 저널
유료다운로드

유료 다운로드의 경우 해당 사이트의 정책에 따라 신규 회원가입, 로그인, 유료 구매 등이 필요할 수 있습니다. 해당 사이트에서 발생하는 귀하의 모든 정보활동은 NDSL의 서비스 정책과 무관합니다.

원문복사신청을 하시면, 일부 해외 인쇄학술지의 경우 외국학술지지원센터(FRIC)에서
무료 원문복사 서비스를 제공합니다.

NDSL에서는 해당 원문을 복사서비스하고 있습니다. 위의 원문복사신청 또는 장바구니 담기를 통하여 원문복사서비스 이용이 가능합니다.

이 논문과 함께 출판된 논문 + 더보기