본문 바로가기
HOME> 논문 > 논문 검색상세

논문 상세정보

감시 시스템에서의 비정상 소리 탐지 및 식별
Abnormal Sound Detection and Identification in Surveillance System

오승근    (고려대학교 컴퓨터정보학과   ); 이종욱    (고려대학교 전산학과   ); 이한성    (ETRI 휴먼인식기술연구팀   ); 정용화    (고려대학교 컴퓨터정보학과   ); 박대희    (고려대학교 컴퓨터정보학과  );
  • 초록

    본 논문에서는 CCTV 등과 같은 감시 카메라 환경에서 실시간으로 유입되는 소리 정보를 이용하여, 비정상 상황을 탐지 및 식별하는 프로토타입 시스템을 제안한다. 제안된 시스템의 첫 번째 계층에서는 단일 클래스 SVM인 SVDD로 비정상 소리를 신속하게 탐지하여 관리자에게 알람 경고하고, 두 번째 계층의 SRC는 탐지된 비정상 소리를 'gun', 'scream', 'Siren', 'crash', 'bomb' 등으로 세분화 식별하여 관리자에게 보고함으로써 관리자의 위기 상황 대처 능력을 돕는다. 본 논문에서 제안하는 SVDD와 SRC를 혼합한 계층적 구조는 다음과 같은 특성을 갖는다. 첫째, 정상 소리 데이터만으로 학습한 SVDD를 이용하여 비정상 소리를 빠르게 탐지함으로써, 정상 소리에 대한 불필요한 비정상 소리 식별 연산을 수행하지 않는다. 둘째, 최근 얼굴 인식 분야에서 성공적인 업적을 보여주고 있는 강인한 SRC를 이용하여 비정상 소리를 식별함으로써, 안정적인 보안 감시 시스템 운용을 보장한다. 셋째, SRC 고유의 특성상 새로운 비정상 소리가 추가되더라도 전체 시스템을 재학습시킬 필요가 없는 시스템의 점증적 갱신이 가능하다. 정성적 분석을 포함한 실험 결과로 제안된 시스템의 효능을 밝힌다.


    In this paper, we propose a prototype system for abnormal sound detection and identification which detects and recognizes the abnormal situations by means of analyzing audio information coming in real time from CCTV cameras under surveillance environment. The proposed system is composed of two layers: The first layer is an one-class support vector machine, i.e., support vector data description (SVDD) that performs rapid detection of abnormal situations and alerts to the manager. The second layer classifies the detected abnormal sound into predefined class such as 'gun', 'scream', 'siren', 'crash', 'bomb' via a sparse representation classifier (SRC) to cope with emergency situations. The proposed system is designed in a hierarchical manner via a mixture of SVDD and SRC, which has desired characteristics as follows: 1) By fast detecting abnormal sound using SVDD trained with only normal sound, it does not perform the unnecessary classification for normal sound. 2) It ensures a reliable system performance via a SRC that has been successfully applied in the field of face recognition. 3) With the intrinsic incremental learning capability of SRC, it can actively adapt itself to the change of a sound database. The experimental results with the qualitative analysis illustrate the efficiency of the proposed method.


  • 주제어

    비정상 소리 탐지 및 식별 .   서베일런스 시스템 .   SVDD .   SRC .   Abnormal audio detection and identification .   Surveillance system.  

  • 참고문헌 (25)

    1. L. Qiao, S. Chen, X. Tan, "Sparsity Preserving Projections with Applications to Face Recognition," Journal of Pattern Recognition, vol.43, no.1 , pp.331 - 341, 2010. 
    2. Y. Li, T. Lin, X. Tan, "Mahalanobis Distance Based Non-negative Sparse Representation for Face Recognition," International Conference on Machine Learning and Applications, pp.41 - 46, 2009. 
    3. J. Wright, A. Yang, A. Ganesh, S. Sastry, M. Yi, "Robust Face Recognition via Sparse Representation," IEEE Transactions on Pattern Analysis and Machine Intelligent, vol.31, no.2, pp.201-227, 2009. 
    4. http://www.grsites.com/ 
    5. http://sound-effects - Iibrary.com/ 
    6. http://tosa.mri.co.jp/ sounddb/ indexe.htm.2000 
    7. http://www.leonardosoft.com 
    8. J C. Clavel, T. Ehrette, G. Richard, "Event Detection for an Audio- Based Surveillance System," IEEE International Conference on Multimedia and Expo (ICME 2005), pp.1306-1309, 2005. 
    9. G. Valenzise, L. Gerosa, M. Tagliasacchi, F. Antonacci, A. Sarti, "Scream and Gunshot Detection and Localization for Audio Surveillance System," IEEE International Conference on Advanced Video and Signal Based Surveillance (VSS 2007), pp.21-26, 2007 . 
    10. S. Ntalampiras, I. Potarnitis, N. Fakotakis, "On Acoustic Surveillance of Hazardous Situations," ICASSP 2009, pp.165-168, 2009. 
    11. J . Rouas, J. Louradour, S. Ambellouis, "Audio Events Detection in Public Transport Vehicle," 2006 IEEE Intelligent Transportation Systems Conference (ITSC'06), pp.733-738, 2006. 
    12. X. Wu, H. Gong, P. Chen, Z. Zhong, Y. Xu, "Surveillance Robot Utilizing Video and Audio Information," Journal of Intelligent Robot System, vol.55, no.4-5, pp.403-421, 2009. 
    13. A. Rabaou, M. Davy, S. Rossignol. N. Ellouze, "Using One- Class SVMs and Waveletes for Audio Surveillance," IEEE Transactions on Information Forensics and Security, vol.3, no.4, pp.763- 775, 2008. 
    14. Y. joo, E. Lee, ]. Kim, S. Oh, D. Park, "Abnormal Sound Detection and Identification in Surveillance System," The 34th KIPS Fall Conference 2010, vol.l7, no.2, pp.592-595, 2010. (in Korean) 
    15. H. Woo, Y. jung, ]. Kim, ]. Seo, "Environmentally Robust Motion Detection for Video Surveillance," IEEE Transactions on Image Processing, vol.l9, no.11, 2010. 
    16. R. Mehra, A. Oyama, M. Shah, "Abnormal Crowd Behavior Detection Using Social Force Model," IEEE International Conference on Computer Vision and Pattern Recognition (CVPR 2009), pp.2921- 2928, 2009. 
    17. M. Popa, L. Rothkrantz, Z. Yang, P. Wiggers, "Analysis of Shopping Behavior based on Surveillance System," IEEE International Conference on Systems Man and Cybernetics (SMC 2010), pp.2512- 2519, 2010. 
    18. Y. Cho, S. Jang, "Implementation of Intelligent Speech Recognition System according to CCTV Emergency Information," Journal of Korea Intelli gent Information System Sociely 2009, vol.19, no.3, pp.415- 420, 2009. (in Korean) 
    19. T. Lim, K. Bae, C. Hwang, H. Lee, "Classification of Underwater Transient Signals Using MFCC Feature Vector," Information & Communications Magazine, vol.32, no.8, pp. 675-680, 2007. (in Korean) 
    20. T. Lim, K. Bae, C. Hwang, H. Lee, "Classification of Underwater Transient Signals Using MFCC Feature Vector," KICS 2007, vol.32, no.8, pp.675-680, 2007. (in Korean) 
    21. T. Lim, K. Bae, C. Hwang, "Classification of Underwater Transient Signals using Binary Pattern Image of MFCC," Proceeding of ITC-CSCC 2007, vol.1, pp.19- 20, 2007. 
    22. J. Song, H. Lee, Y. Im, D. Park, "Real- time Face Detection System Using Cascade Structure and SVDD," KCC 2005, vol.32, no.1 , 2005. (in Korean) 
    23. J. jeon, J. Park, I. Kang, T. Ahn, G. Park, "A Study on Object Detection Algorithm for Abandoned and Removed Objects for Real- time Intelligent Surveillance System," Journal of KIIS, vol.35, no.1 , pp.24-32, 2009. (in Korean) 
    24. J. Lai, S. Haung, C. Tseng, "Image- Based Vehicle Tracking and Classification on the Highway," Green Circuits and Systems (ICGGS 2010) International Conference, pp.666-670, 2010. 
    25. J. W. Hsieh, Y. T. Hsu, H. Liao, C. C. Chen, "Video- Based Human Movement Analysis and Its Application to Surveillance Systems," IEEE Transactions on Multimedia, vol.30, no.7, pp.1198-1211, 2008. 
  • 이 논문을 인용한 문헌 (1)

    1. Park, Ju-Hyun ; Seo, Ji-Hun ; Lee, Seok-Pil 2014. "Analysis on Scream and Ambient Noise for Security System with Audio Capability" 전기학회논문지 = The Transactions of the Korean Institute of Electrical Engineers, 63(6): 804~809     

 활용도 분석

  • 상세보기

    amChart 영역
  • 원문보기

    amChart 영역

원문보기

무료다운로드
  • NDSL :
유료다운로드

유료 다운로드의 경우 해당 사이트의 정책에 따라 신규 회원가입, 로그인, 유료 구매 등이 필요할 수 있습니다. 해당 사이트에서 발생하는 귀하의 모든 정보활동은 NDSL의 서비스 정책과 무관합니다.

원문복사신청을 하시면, 일부 해외 인쇄학술지의 경우 외국학술지지원센터(FRIC)에서
무료 원문복사 서비스를 제공합니다.

NDSL에서는 해당 원문을 복사서비스하고 있습니다. 위의 원문복사신청 또는 장바구니 담기를 통하여 원문복사서비스 이용이 가능합니다.

이 논문과 함께 출판된 논문 + 더보기