본문 바로가기
HOME> 논문 > 논문 검색상세

논문 상세정보

정보과학회논문지. Journal of KIISE. 컴퓨팅의 실제 및 레터 v.16 no.3, 2010년, pp.356 - 360   피인용횟수: 1
본 등재정보는 저널의 등재정보를 참고하여 보여주는 베타서비스로 정확한 논문의 등재여부는 등재기관에 확인하시기 바랍니다.

시계열 데이터의 프라이버시 보호 클러스터링에서 노이즈 평준화 효과
Noise Averaging Effect on Privacy-Preserving Clustering of Time-Series Data

문양세    (강원대학교 컴퓨터과학과   ); 김혜숙    (강원대학교 컴퓨터과학과  );
  • 초록

    최근, 개인 데이터의 프라이버시 보호에 대한 문제가 대두됨에 따라 대용량 데이터를 대상으로 하는 데이터 마이닝 분야에서도 프라이버시 보호 문제에 대한 활발한 연구가 진행되고 있다. 데이터 마이닝에서의 프라이버시 보호 문제는 정보제공자에 의해 제공된 정보 중 민감한 개인 정보의 노출이 없이도 가능한 정확한 마이닝 결과를 얻는 것이다. 데이터 마이닝의 프라이버시 보호 기법에서는 데이터의 보호뿐만 아니라 결과의 정확도 또한 중요한 요인이다. 이에 따라, 본 논문에서는 시계열 데이터 클러스터링을 기반으로 랜덤 데이터 교란 기법에서 결과의 정확도를 높이는 기법으로 노이즈 평준화 개념을 제시한다. 기존의 랜덤 데이터 교란 기법은 데이터의 프라이버시는 잘 보호하지만 시계열간의 거리-순서가 보존되지 않아 결과의 정확도가 크게 떨어지는 문제점을 가진다. 이를 위해, 본 논문에서는 PAA를 기반으로 하는 노이즈 평준화 개념을 제시하고, 구체적인 예를 통해, 제안한 노이즈 평준화 개념이 랜덤 데이터 교란 기법에서 클러스터링 결과의 정확도를 높일 수 있음을 체계적으로 설명한다.


    Recently, there have been many research efforts on privacy-preserving data mining. In privacy-preserving data mining, accuracy preservation of mining results is as important as privacy preservation. Random perturbation privacy-preserving data mining technique is known to well preserve privacy. However, it has a problem that it destroys distance orders among time-series. In this paper, we propose a notion of the noise averaging effect of piecewise aggregate approximation(PAA), which can be preserved the clustering accuracy as high as possible in time-series data clustering. Based on the noise averaging effect, we define the PAA distance in computing distance. And, we show that our PAA distance can alleviate the problem of destroying distance orders in random perturbing time series.


  • 주제어

    시계열 데이터 .   프라이버시 보호 .   클러스터링.  

  • 참고문헌 (9)

    1. R. Agrawal and R. Srikant, "Privacy Preserving Data Mining," In Proc. of the Int'l Conf. on Management of Data, Dallas, Texas, pp.439-450, May 2000. 
    2. Y. Lindell and B. Pinkas, "Privacy Preserving Data Mining," Advances in Cryptology, vol.1807, pp.35-53, Dec. 2000. 
    3. A. V. Evfimievski, R. Srikant, R. Agrawal, and J. Gehrke, "Privacy Preserving Mining of Association Rules," In Proc. of the 8th Int'l Conf. on Knowledge Discovery and Data Mining, Edmonton, Canada, pp.217-228, July 2002. 
    4. W.-S. Han, J. Lee, Y.-S. Moon, H. Jiang, "Ranked Subsequence Matching in Time-Series Databases," In Proc. of the 33th Int'l Conf. on Very Large Data Bases, Vienna, Austria, pp.423-434, Sept. 2007. 
    5. H.-S. Kim, Y.-S. Moon, "Privacy-Preserving Clustering on Time-Series Data Using Fourier Magnitudes," Journal of KIISE: Databases, vol.35, no.6, pp.481-494, Dec. 2008. (in Korean)     
    6. S. Rizvi and J. R. Haritsa, "Maintaining Data Privacy in Association Rule Mining," In Proc. of the 28th Int'l Conf. on Very Large Data Bases, Hong Kong, China, pp.682-693, Sept. 2002. 
    7. S. Papadimitriou, F. Li, G. Kollios, and P. S. Yu, "Time Series Compressibility and Privacy," In Proc. of the 33th Int'l Conf. on Very Large Data Bases, Vienna, Austria, pp.459-470, Sept. 2007. 
    8. J. Vaidya and C. Clifton, "Privacy-Preserving k-Means Clustering over Vertically Partitioned Data," In Proc. of the 9th Int'l Conf. on Knowledge Discovery and Data Mining, Washington D.C., pp.24-27, Aug. 2003. 
    9. S. Mukherjee and Z. Chen, "A Privacy-Preserving Technique for Euclidean Distance-based Mining Algorithms Using Fourier-Related Transforms," The VLDB Journal, vol.15, no.4, pp.293-315, Nov. 2006. 
  • 이 논문을 인용한 문헌 (1)

    1. Hong, Sun-Kyong ; Hong, Junho ; Moon, Yang-Sae 2013. "Correlation-aware Noise Generation on Time-Series Databases" 정보과학회논문지. Journal of KIISE. 데이타베이스, 40(5): 319~327     

 저자의 다른 논문

  • 문양세 (23)

    1. 2006 "정규화 변환을 지원하는 스트리밍 시계열 매칭 알고리즘" 정보과학회논문지. Journal of KIISE. 데이타베이스 33 (6): 600~619    
    2. 2006 "MBR-Safe 변환 : 유사 시퀀스 매칭에서 고차원 MBR의 저차원 변환" 정보과학회논문지. Journal of KIISE. 데이타베이스 33 (7): 693~707    
    3. 2006 "단일 색인을 사용한 임의 계수의 이동평균 변환 지원 시계열 서브시퀀스 매칭" 정보과학회논문지. Journal of KIISE. 데이타베이스 33 (1): 42~55    
    4. 2006 "시계열 데이터베이스에서 단일 색인을 사용한 정규화 변환 지원 서브시퀀스 매칭" 정보처리학회논문지. The KIPS transactions. Part D. Part D d13 (4): 513~524    
    5. 2006 "통신이력 데이타에 기반한 교우관계 분석" 정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용 33 (8): 730~740    
    6. 2006 "시계열 스트림 데이터 상에서 핸드헬드 디바이스를 위한 효율적인 스트림 시퀀스 매칭 알고리즘" 한국통신학회논문지. The Journal of Korea Information and Communications Society. 네트워크 및 서비스 31 (b8): 736~744    
    7. 2007 "부분 집계 근사법의 MBR-안전 성질을 이용한 효율적인 시계열 서브시퀀스 매칭" 정보과학회논문지. Journal of KIISE. 데이타베이스 34 (6): 503~517    
    8. 2008 "시계열 데이타 클러스터링에서 푸리에 진폭 기반의 프라이버시 보호" 정보과학회논문지. Journal of KIISE. 데이타베이스 35 (6): 481~494    
    9. 2013 "HybridFTW를 사용한 효율적인 k-NN 검색" 정보과학회논문지. Journal of KIISE. 데이타베이스 40 (6): 386~396    
    10. 2014 "시계열 데이터 기반의 부분 노이즈 제거 윤곽선 이미지 매칭" 정보과학회논문지 = Journal of KIISE 41 (11): 943~957    
  • 김혜숙 (1)

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역

원문보기

무료다운로드
  • NDSL :
  • 한국정보과학회 : 저널
유료다운로드

유료 다운로드의 경우 해당 사이트의 정책에 따라 신규 회원가입, 로그인, 유료 구매 등이 필요할 수 있습니다. 해당 사이트에서 발생하는 귀하의 모든 정보활동은 NDSL의 서비스 정책과 무관합니다.

원문복사신청을 하시면, 일부 해외 인쇄학술지의 경우 외국학술지지원센터(FRIC)에서
무료 원문복사 서비스를 제공합니다.

NDSL에서는 해당 원문을 복사서비스하고 있습니다. 위의 원문복사신청 또는 장바구니 담기를 통하여 원문복사서비스 이용이 가능합니다.

이 논문과 함께 출판된 논문 + 더보기