KR101022516B1 - System and method for sound recognition using spectral peak, and method for measuring sound spectral similarity used thereto - Google Patents

System and method for sound recognition using spectral peak, and method for measuring sound spectral similarity used thereto Download PDF

Info

Publication number
KR101022516B1
KR101022516B1 KR1020090031511A KR20090031511A KR101022516B1 KR 101022516 B1 KR101022516 B1 KR 101022516B1 KR 1020090031511 A KR1020090031511 A KR 1020090031511A KR 20090031511 A KR20090031511 A KR 20090031511A KR 101022516 B1 KR101022516 B1 KR 101022516B1
Authority
KR
South Korea
Prior art keywords
sound
band
peak
recognition
spectrum
Prior art date
Application number
KR1020090031511A
Other languages
Korean (ko)
Other versions
KR20100112957A (en
Inventor
육동석
유인철
Original Assignee
고려대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 산학협력단 filed Critical 고려대학교 산학협력단
Priority to KR1020090031511A priority Critical patent/KR101022516B1/en
Publication of KR20100112957A publication Critical patent/KR20100112957A/en
Application granted granted Critical
Publication of KR101022516B1 publication Critical patent/KR101022516B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

본 발명은 음향 인식 기술에 관한 것으로서, 본 발명에 따른 스펙트럼 피크를 이용한 음향 인식 시스템은, 인식대상 음향의 스펙트럼에서 특징 피크가 위치한 피크 대역을 획득하여 상기 인식대상 음향을 등록하는 음향 등록부; 및 입력 음향의 스펙트럼에서 상기 등록 음향의 상기 피크 대역에 대응하는 대응 대역 및 상기 대응 대역을 제외한 비대응 대역의 평균에너지를 이용하여 상기 입력 음향을 상기 등록 음향으로 인식하거나 인식 거부하는 음향 인식부를 포함하는 것을 특징으로 하여, 잡음 환경에서 단일 음향 및 다중 음향에 대한 인식률을 개선함은 물론, 연산량을 감소시키는 이점을 제공한다.The present invention relates to a sound recognition technology, and an acoustic recognition system using a spectral peak according to the present invention includes: a sound register for acquiring a peak band in which a feature peak is located in a spectrum of a sound to be recognized; And a sound recognizing unit that recognizes or rejects the input sound as the registered sound by using an average energy of a corresponding band corresponding to the peak band of the registered sound in the spectrum of the input sound and a non-corresponding band except the corresponding band. It is characterized in that to improve the recognition rate for a single sound and multiple sounds in a noisy environment, as well as to provide an advantage of reducing the amount of calculation.

Description

스펙트럼 피크를 이용한 음향 인식 시스템 및 방법과 이에 사용되는 음향 스펙트럼 유사도 측정 방법{System and method for sound recognition using spectral peak, and method for measuring sound spectral similarity used thereto}System and method for sound recognition using spectral peak, and method for measuring sound spectral similarity used sir}

본 발명은 음향 인식 기술에 관한 것으로서, 더욱 상세하게는 스펙트럼 피크를 이용하여 잡음 환경에서 단일 음향 및 다중 음향에 대한 인식률을 개선함은 물론, 연산량을 감소시켜 자원제약적 환경에 용이하게 적용할 수 있는 음향 인식 시스템 및 방법과 이에 사용되는 음향 스펙트럼 유사도 측정 방법에 관한 것이다.The present invention relates to a sound recognition technology, and more particularly, by using spectral peaks to improve the recognition rate for a single sound and multiple sounds in a noise environment, as well as to reduce the amount of computation can be easily applied to resource-constrained environments A sound recognition system and method and methods for measuring acoustic spectral similarity used therein.

현재, 청각 장애인의 정확한 인구는 알려진 바 없지만 전 세계적으로 5억 명에 이르는 인구가 청각 장애로 고통받고 있는 것으로 추산되고 있다. 청각 장애인들은 선천적 또는 후천적인 이유로 청각 기관이 손상되어 일상 생활에서 필요한 소리를 인지하는데 많은 불편을 겪고 있다. 예컨대, 청각 장애인들은 초인종 소리, 전화벨 소리, 물 끓는 소리, 화재경보 소리, 자동차 경적 소리 등, 소리의 발생시 정확한 상황 판단과 적절한 대응 조치가 필요한 경우라도 해당 소리를 인지하기 매우 곤란하며, 나아가 상황에 따른 적절한 대응을 할 수 없어 위험한 상황을 맞을 수도 있다.Currently, the exact population of the deaf is unknown, but it is estimated that nearly 500 million people worldwide suffer from hearing impairment. Hearing impaired people have a lot of inconvenience in perceiving the impaired hearing organs due to congenital or acquired reasons. For example, hearing impaired people are very difficult to recognize the sound of the doorbell, telephone ringing, boiling water, fire alarm, car horn, etc. You may not be able to respond appropriately, and you may face dangerous situations.

이러한 청각 장애인들의 일상 생활에 도움을 주기 위해, 훈련된 보조견 등을 이용하기도 하지만, 훈련된 보조견을 키워내기 위해서는 많은 비용과 시간이 필요하며, 현실적으로 청각 장애인들의 수요를 충족시키지 못하고 있는 실정이다. 따라서, 청각 장애인을 위한 음향 인식 시스템에 대한 연구 및 개발이 절실히 요구되고 있다.In order to help the deaf people's daily lives, trained dogs may be used, but training and training dogs require a lot of money and time, and in reality, they do not meet the needs of the deaf. Therefore, there is an urgent need for research and development of acoustic recognition systems for the hearing impaired.

한편, 음향 인식(sound recognition) 기술은 가정용 전자기기, 휴대폰, 보안 및 인증 등 다양한 분야에 적용되고 있으며, 그 적용분야 및 수요는 더욱 급속히 증가할 전망이다.Meanwhile, sound recognition technology has been applied to various fields such as home appliances, mobile phones, security and authentication, and its application field and demand are expected to increase more rapidly.

이러한 음향 인식 기술에 있어서, 연구·개발시의 실험실 환경은 물론 다양한 잡음이 존재하는 실제 생활 환경에서 높은 인식률 내지 정확도를 유지할 수 있는지 여부는 매우 중요한 문제이다.In such acoustic recognition technology, it is very important to be able to maintain high recognition rate or accuracy in a laboratory environment during research and development as well as in a real life environment in which various noises exist.

그러나, 기존의 음향 인식 시스템들의 경우 제한된 실험실 환경에서는 높은 인식률을 보이는 반면, 실제 생활 환경, 예컨대 집 또는 사무실 등에서는 인식률의 급격한 저하를 보인다는 전형적인 문제점이 있다.However, the conventional acoustic recognition systems have a typical problem of showing a high recognition rate in a limited laboratory environment, but a sharp decrease in the recognition rate in a real living environment such as a home or an office.

이러한 기존 음향 인식 시스템의 성능 저하를 초래하는 주된 요인으로는 크게 두 가지를 들 수 있다.There are two main factors that cause the degradation of the conventional acoustic recognition system.

한 가지 요인은, 배경 잡음(background noise) 및 실내 잔향(room reverberation) 등에 기인한 신호 손상(signal corruption)이다. 이러한 신호 손상은 동일한 음향인 경우라도 음향 인식 시스템의 학습시 사용되는 깨끗한 음향 신호 와 실제 환경에서 입력되는 잡음이 포함된 음향 신호 간에 매칭을 곤란하게 한다.One factor is signal corruption due to background noise and room reverberation. This signal impairment makes it difficult to match between a clean sound signal used in learning the acoustic recognition system and a sound signal including noise input in a real environment even in the same sound.

그러나, 상기 신호 손상 문제를 해결하려는 기존의 연구들은, 단지 특정 조건들 하에서만 상기 신호 손상의 영향을 어느 정도 감소시킬 수 있을 뿐, 실제 생활 사용되는 기기들에 적용되었을 때 일관되고 신뢰성 있는 성능을 보여줄 수 없었다. 그 이유는, 실제 생활 환경에서 발생할 수 있는 배경 잡음은 매우 다양하여 모든 배경 잡음을 예상할 수 없을 뿐 아니라, 배경 잡음의 특성도 시간에 따라 변화한다는 점에 기인한다. 따라서, S. F. Boll이, "Suppression of acoustic noise in speech using spectral subtraction"(IEEE Transactions on Acoustics, Speech, and Signal Processing, ASSP-27(2), pp. 113-120, 1979.)에서 소개한 바와 같이 배경 잡음을 추정하는 알고리즘들을 적용하여 신호 손상 문제를 해결하는 것은 한계가 있다.However, existing studies to solve the signal corruption problem can only reduce the effect of the signal damage to some extent only under certain conditions, and provide consistent and reliable performance when applied to real-life devices. Couldn't show The reason is that background noise that can occur in a real life environment is so diverse that not only all background noise can be predicted, but also that the characteristics of the background noise change with time. Thus, as SF Boll introduced in "Suppression of acoustic noise in speech using spectral subtraction" (IEEE Transactions on Acoustics, Speech, and Signal Processing, ASSP-27 (2), pp. 113-120, 1979.). Solving the signal impairment problem by applying algorithms for estimating background noise is limited.

다른 한 가지 요인은, 음향 인식 시스템으로 하여금 학습하지 않은 미등록 음향 신호를 식별하여 미등록 음향을 이미 학습한 등록 음향으로 인식하지 않도록 하는 오픈-셋(open-set) 문제이다.Another factor is an open-set problem that allows the acoustic recognition system to identify unregistered unregistered acoustic signals and not recognize unregistered sounds as already learned registered sounds.

기존의 기술 중, 특히 음성 인식에 있어서의 VAD(Voice Activity Detection) 기반 방식들은 음성 신호들의 고유 특징들을 사용하여 인식 단계 전에 음성과 비음성 잡음들을 구별하고자 하는 것이다. 반면, CM(Confidence Measure) 기반 방식들은 인식 결과의 신뢰도를 결정하여 미등록 키워드들을 인식 거부하고자 하는 것이다. 이러한 미등록 음향의 인식 거부 처리는 인식 단계 전·후에 수행될 수 있다.Among the existing techniques, voice activity detection (VAD) based methods in speech recognition, in particular, attempt to distinguish between speech and non-voice noises using the inherent features of speech signals. On the other hand, CM (Confidence Measure) based methods are to determine the reliability of the recognition result to reject the unregistered keywords. The recognition rejection processing of the unregistered sound may be performed before or after the recognition step.

그러나, 상기 오픈-셋 문제를 해결하려는 기존의 연구들은, 실제 생활 환경 에서 신뢰할 만한 성능을 달성할 수 없었다. 그 이유는, 실제 생활 환경에서 이러한 미등록 음향들의 종류는 매우 다양하며, 사전에 이러한 미등록 음향들의 특징들을 아는 것은 사실상 불가능하기 때문이다.However, existing studies to solve the open-set problem have not been able to achieve reliable performance in a real life environment. The reason is that in the real life environment, these kinds of unregistered sounds are very diverse, and it is virtually impossible to know the characteristics of these unregistered sounds in advance.

요컨대, 기존 기술은 다양한 잡음이 발생하는 실제 생활 환경에서 신호 손상 및 오픈-셋 문제를 해결하여 안정된 인식률을 제공할 수 있는 직접적인 해결책을 제시하지 못하고 있다는 문제점이 있다.In short, the existing technology does not provide a direct solution that can provide stable recognition rate by solving signal corruption and open-set problems in a real life environment in which various noises occur.

또한, 기존 기술은 음향 인식 처리시 정보 처리 및 연산량을 감소시켜 오늘날 급속도로 발전하고 있는 이동 통신 시스템, USN(Ubiquitous Sensor Network) 등 자원제약적 환경에 용이하게 적용할 수 있는 음향 인식 기술을 제시하지 못하고 있다는 문제점이 있다.In addition, the existing technology cannot reduce the amount of information processing and computation during the acoustic recognition process, and thus cannot provide a sound recognition technology that can be easily applied to resource-constrained environments such as the mobile communication system and the USN (Ubiquitous Sensor Network). There is a problem.

따라서, 본 발명이 해결하고자 하는 첫 번째 기술적 과제는, 잡음 환경에서 단일 음향 및 다중 음향에 대한 인식률을 개선함은 물론, 연산량을 감소시켜 자원제약적 환경에 용이하게 적용할 수 있는 음향 인식 시스템을 제공하는 것이다.Accordingly, the first technical problem to be solved by the present invention is to provide a sound recognition system that can be easily applied to resource-constrained environments by reducing the amount of computation as well as improving the recognition rate for single and multiple sounds in a noisy environment. It is.

본 발명이 해결하고자 하는 두 번째 기술적 과제는, 잡음 환경에서 단일 음향 및 다중 음향에 대한 인식률을 개선함은 물론, 연산량을 감소시켜 자원제약적 환경에 용이하게 적용할 수 있는 음향 인식 방법을 제공하는 것이다.The second technical problem to be solved by the present invention is to provide a sound recognition method that can be easily applied to resource-constrained environments by reducing the amount of computation as well as improving the recognition rate for single and multiple sounds in a noisy environment. .

본 발명이 해결하고자 하는 세 번째 기술적 과제는, 상기 음향 인식 시스템 및 방법에 사용되는 음향 스펙트럼의 유사도 측정 방법을 제공하는 것이다.The third technical problem to be solved by the present invention is to provide a method for measuring the similarity of the acoustic spectrum used in the acoustic recognition system and method.

상기와 같은 첫 번째 기술적 과제를 해결하기 위하여 본 발명은, 인식대상 음향의 스펙트럼에서 특징 피크가 위치한 피크 대역을 획득하여 상기 인식대상 음향을 등록하는 음향 등록부; 및 입력 음향의 스펙트럼에서 상기 등록 음향의 상기 피크 대역에 대응하는 대응 대역 및 상기 대응 대역을 제외한 비대응 대역의 평균에너지를 이용하여 상기 입력 음향을 상기 등록 음향으로 인식하거나 인식 거부하는 음향 인식부를 포함하는 스펙트럼 피크를 이용한 음향 인식 시스템을 제공한다.In order to solve the first technical problem as described above, the present invention includes: a sound register for acquiring a peak band in which a feature peak is located in a spectrum of a sound to be recognized; And a sound recognizing unit that recognizes or rejects the input sound as the registered sound by using an average energy of a corresponding band corresponding to the peak band of the registered sound in the spectrum of the input sound and a non-corresponding band except the corresponding band. A sound recognition system using spectral peaks is provided.

일 실시예에 있어서, 상기 음향 등록부는, 상기 인식대상 음향의 스펙트럼 피크들 중 미리 결정된 문턱값(threshold)보다 큰 에너지를 지니는 피크를 특징 피크로 추출하는 특징피크 추출부; 및 상기 추출된 특징 피크가 상기 인식대상 음향 의 스펙트럼에서 위치한 피크 대역을 나타내는 특징정보를 생성하는 특징정보 생성부를 포함한다.The sound register may include: a feature peak extracting unit extracting a peak having an energy greater than a predetermined threshold among spectral peaks of the sound to be recognized as a feature peak; And a feature information generator for generating feature information indicating a peak band in which the extracted feature peak is located in the spectrum of the sound to be recognized.

일 실시예에 있어서, 상기 특징정보 생성부는, 인식대상 음향들의 특징 피크가 위치한 대역들 간에 중첩 대역이 있는 경우 상기 중첩 대역을 제외한 대역을 상기 인식대상 음향의 상기 피크 대역으로 하여 상기 특징정보를 생성한다.The feature information generation unit may generate the feature information by setting a band except the overlap band as the peak band of the recognition target sound when there is an overlap band between bands in which feature peaks of the recognition target sounds are located. do.

일 실시예에 있어서, 상기 음향 인식부는, 상기 입력 음향의 스펙트럼에서, 상기 등록 음향의 상기 피크 대역에 대응하는 대응 대역 및 상기 대응 대역을 제외한 비대응 대역의 평균에너지를 산출하는 평균에너지 산출부; 및 상기 대응 대역 및 상기 비대응 대역 간의 평균에너지 비를 이용하여 상기 등록 음향 및 상기 입력 음향 간 스펙트럼 유사도를 측정하는 유사도 측정부를 포함한다.The sound recognition unit may include: an average energy calculator configured to calculate an average energy of a corresponding band corresponding to the peak band of the registered sound and a non-compliant band except the corresponding band in the spectrum of the input sound; And a similarity measurer that measures the spectral similarity between the registered sound and the input sound using an average energy ratio between the corresponding band and the non-compliant band.

일 실시예에 있어서, 상기 유사도 측정부는, 상기 비대응 대역에 대한 상기 대응 대역의 평균에너지 비를 나타내는 PDR(Peak Domination Ratio) 값을 이용하여 상기 스펙트럼 유사도를 측정한다.In example embodiments, the similarity measurer measures the spectral similarity using a peak domination ratio (PDR) value representing an average energy ratio of the corresponding band to the non-compliant band.

일 실시예에 있어서, 상기 유사도 측정부는, 상기 등록 음향의 스펙트럼에서 상기 피크 대역 이외의 밸리 대역에 대한 상기 피크 대역의 평균에너지 비에 의해 상기 PDR 값을 정규화한 NPDR(Normalized PDR) 값을 이용하여 상기 스펙트럼 유사도를 측정한다.In one embodiment, the similarity measuring unit, using the normalized PDR (NPDR) value that normalized the PDR value by the average energy ratio of the peak band to the valley band other than the peak band in the spectrum of the registered sound The spectral similarity is measured.

일 실시예에 있어서, 상기 음향 인식부는, 상기 PDR 값이 미리 결정된 임계값보다 큰 경우 상기 입력 음향을 상기 등록 음향으로 인식한다.The sound recognition unit recognizes the input sound as the registered sound when the PDR value is greater than a predetermined threshold.

일 실시예에 있어서, 상기 음향 인식부는, 상기 음향 등록부에 의한 등록 음 향들에 대하여 상기 PDR 값을 산출하고, 상기 산출된 PDR 값 중 최대 PDR 값이 상기 임계값보다 큰 경우 상기 입력 음향을 상기 최대 PDR 값에 대응하는 등록 음향으로 인식한다.In an embodiment, the sound recognizing unit calculates the PDR value for the registered sounds by the sound registration unit and sets the input sound when the maximum PDR value is greater than the threshold value among the calculated PDR values. Recognizes as a registered sound corresponding to the PDR value.

상기와 같은 두 번째 기술적 과제를 해결하기 위하여 본 발명은, 음향 인식 시스템(sound recognition system)에서 주파수 스펙트럼의 피크(peak)를 이용하여 상기 시스템에 입력되는 입력 음향을 인식하는 방법에 있어서, 인식대상 음향의 스펙트럼에서 특징 피크가 위치한 피크 대역을 획득하여 상기 인식대상 음향을 등록하는 등록 단계; 및 입력 음향의 스펙트럼에서 상기 등록 음향의 상기 피크 대역에 대응하는 대응 대역 및 상기 대응 대역을 제외한 비대응 대역의 평균에너지를 이용하여 상기 입력 음향을 상기 등록 음향으로 인식하거나 인식 거부하는 인식 단계를 포함하는 스펙트럼 피크를 이용한 음향 인식 방법을 제공한다.In order to solve the second technical problem as described above, the present invention, in the method of recognizing the input sound input to the system using the peak (peak) of the frequency spectrum in the sound recognition system (sound recognition system), Registering the sound to be recognized by acquiring a peak band in which a feature peak is located in a spectrum of sound; And a recognition step of recognizing or rejecting the input sound as the registered sound using the average energy of the corresponding band corresponding to the peak band of the registered sound and the non-corresponding band except the corresponding band in the spectrum of the input sound. A sound recognition method using spectral peaks is provided.

상기와 같은 세 번째 기술적 과제를 해결하기 위하여 본 발명은, 음향 인식 시스템(sound recognition system)에서 사전 등록된 등록 음향 및 상기 시스템에 입력되는 입력 음향 간 주파수 스펙트럼의 유사도(similarity)를 측정하는 방법에 있어서, 상기 입력 음향의 스펙트럼에서, 상기 등록 음향의 스펙트럼 상 특징 피크가 위치한 피크 대역에 대응하는 대응 대역 및 상기 대응 대역을 제외한 비대응 대역의 평균에너지를 산출하는 단계; 및 상기 대응 대역 및 상기 비대응 대역 간의 평균에너지 비를 이용하여 상기 등록 음향 및 상기 입력 음향 간 스펙트럼 유사도를 측정하는 단계를 포함하는 음향 스펙트럼 유사도 측정 방법을 제공한다.In order to solve the third technical problem as described above, the present invention provides a method for measuring the similarity (similarity) of the frequency spectrum between the pre-registered registration sound in the sound recognition system and the input sound input to the system. Calculating an average energy of a corresponding band corresponding to the peak band in which the characteristic peak of the registered sound of the registered sound is located and the non-corresponding band excluding the corresponding band from the input sound spectrum; And measuring spectral similarity between the registered sound and the input sound using an average energy ratio between the corresponding band and the non-compliant band.

본 발명은, 잡음에 의해 손상된 입력 음향 신호에 대한 특징 추출 과정 없이 사전 학습된 등록 음향 신호의 스펙트럼 피크 정보를 이용하여 두 음향 간 매칭을 수행함으로써, 다양한 잡음이 발생하는 실제 생활 환경에서 배경 잡음에 무관하게 안정된 인식률을 제공하는 이점을 제공한다. The present invention performs matching between two sounds by using spectral peak information of a pre-learned registered sound signal without extracting a feature of an input sound signal damaged by noise, thereby reducing background noise in a real life environment in which various noises occur. It provides the advantage of providing a stable recognition rate regardless.

또한, 단일 음향은 물론 다중 음향에 대한 인식률까지 개선하는 이점을 제공한다.In addition, it provides the advantage of improving the recognition rate for a single sound as well as multiple sounds.

나아가, 음향 인식 과정에서 정보 처리 및 연산량을 감소시켜 오늘날 급속도로 발전하고 있는 이동단말기기, USN의 센서노드 등 자원제약적 환경에 용이하게 적용할 수 있다는 이점을 제공한다.Furthermore, by reducing the amount of information processing and computation in the sound recognition process, it provides an advantage that it can be easily applied to resource-constrained environments such as mobile terminal devices and USN sensor nodes that are rapidly developing today.

본 발명에 관한 구체적인 내용의 설명에 앞서 이해의 편의를 위해 본 발명이 해결하고자 하는 기술적 과제의 개요를 우선 제시한다.Prior to the description of the specific contents of the present invention, for the sake of understanding, an outline of the technical problem to be solved by the present invention is first presented.

도 1에는 본 발명에 따른 스펙트럼 피크를 이용한 음향 인식 방법의 기본 원리가 도시되어 있다.1 shows a basic principle of a sound recognition method using spectral peaks according to the present invention.

도 1을 참조하면, 본 발명은 기존 기술의 신호 손상(signal corruption) 및 오픈-셋(open-set) 문제를 해결하기 위해, 음향 인식 과정에 있어서 잡음 왜곡이 발생한 입력 음향 신호로부터 특징을 추출하는 과정 없이, 학습 단계(110)를 통해 사전 학습된 잡음없는 등록 음향 신호(112)로부터 스펙트럼 특징(114)을 추출하고, 인식 단계(120)에서 상기 추출된 스펙트럼 특징(114)을 이용하여 상기 등록 음향 신호(112) 및 잡음 왜곡이 발생한 입력 음향 신호(122) 간의 매칭을 수행하도록 한 다. 그 이유는, 기존 기술의 신호 손상 및 오픈-셋 문제가 바로 잡음에 의해 왜곡된 입력 음향 신호(122)로부터 추출된 특징(124)을 이용하여 소정의 매칭을 수행함으로써 초래되는 것이기 때문이다.Referring to FIG. 1, the present invention extracts features from an input acoustic signal in which noise distortion occurs in a sound recognition process in order to solve signal corruption and open-set problems of the prior art. Without the process, the spectral feature 114 is extracted from the pre-learned noise-free registration sound signal 112 through the learning step 110 and the registration using the extracted spectral feature 114 in the recognition step 120. Matching is performed between the acoustic signal 112 and the input acoustic signal 122 where the noise distortion has occurred. The reason is that signal corruption and open-set problems of the prior art are caused by performing certain matching using features 124 extracted from the input acoustic signal 122 distorted by noise.

따라서, 본 발명은 등록 음향의 스펙트럼 특징만을 추출하여 등록 음향 신호 및 입력 음향 신호 간 매칭을 수행하며, 이를 위해 PDR(Peak Domination Ratio)이라는 새로운 유사도(similarity) 측정 기준을 도입한다.Accordingly, the present invention extracts only the spectral features of the registered sound to perform matching between the registered sound signal and the input sound signal, and introduces a new similarity measure (Peak Domination Ratio) for this purpose.

이하, 본 발명의 기술적 과제의 해결 방안을 명확화하기 위해 첨부한 도면을 참조하여 본 발명의 바람직한 실시예를 상세하게 설명한다. 다만, 본 발명을 설명함에 있어서 관련된 공지기술 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불명료하게 할 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자 등의 의도 또는 관례 등에 따라 달라질 수 있을 것이다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings in order to clarify the solutions of the technical problems of the present invention. However, in describing the present invention, when it is determined that the detailed description of the related known technology or configuration may make the gist of the present invention unclear, the detailed description thereof will be omitted. In addition, terms to be described later are terms defined in consideration of functions in the present invention, which may vary according to intention or custom of a user, an operator, or the like. Therefore, the definition should be based on the contents throughout this specification.

도 2에는 본 발명에 따른 스펙트럼 피크를 이용한 음향 인식 시스템의 일례가 블록도로 도시되어 있다.2 shows an example of a sound recognition system using spectral peaks in accordance with the present invention.

도 3에는 본 발명에 따른 스펙트럼 피크를 이용한 음향 인식 방법의 일례가 흐름도로 도시되어 있다.3 is a flowchart illustrating an example of a sound recognition method using spectral peaks according to the present invention.

도 2 및 도 3을 참조하면, 우선 본 발명에 따른 음향 인식 시스템(sound recognition system: 200)은, 음향 등록부(210) 및 음향 인식부(220)를 포함하며, 음향 수신부(230), 스펙트럼 분석부(240), 저장부(250) 및 출력부(260)를 더 포함 할 수 있다.2 and 3, first, a sound recognition system 200 according to the present invention includes a sound register 210 and a sound recognizer 220, a sound receiver 230, and spectrum analysis. The unit 240 may further include a storage unit 250 and an output unit 260.

상기 음향 등록부(210)는, 학습에 의한 인식대상 음향(target sound)의 등록(registration) 단계에서, 인식대상 음향 스펙트럼의 특징 피크(charateristic peak)가 위치한 피크 대역(peak band)을 획득함으로써 상기 인식대상 음향을 등록한다(S310 내지 S330).The sound register 210 acquires a peak band at which a characteristic peak of a recognition sound spectrum is located in a registration step of recognizing a target sound by learning. The target sound is registered (S310 to S330).

더욱 구체적으로 설명하면, 상기 음향 등록부(210)는 상기 인식대상 음향의 등록 단계를 수행하기 위해 특징피크 추출부(212) 및 특징정보 생성부(214)를 포함할 수 있다.In more detail, the sound register 210 may include a feature peak extractor 212 and a feature information generator 214 to perform a registration step of the recognition target sound.

상기 특징피크 추출부(212)는, 상기 인식대상 음향의 스펙트럼에서 상기 특징 피크를 추출한다(S310). 이 경우, 다양한 형태의 추출 방식을 적용하여 상기 특징 피크를 추출할 수 있으며, 일 실시예에 있어서 상기 특징피크 추출부(212)는 연산의 단순화를 위해 상기 인식대상 음향의 스펙트럼 피크들 중 미리 결정된 문턱값(threshold)보다 큰 에너지를 지니는 피크를 특징 피크로 추출할 수 있다.The feature peak extractor 212 extracts the feature peak from the spectrum of the sound to be recognized (S310). In this case, the feature peak may be extracted by applying various types of extraction methods, and in one embodiment, the feature peak extractor 212 may be configured to predetermine the spectral peaks of the recognition sound to simplify the calculation. Peaks with energy greater than the threshold can be extracted as feature peaks.

일반적으로, 일상 생활에서 인간이 인식할 필요가 있는 음향들은 각각 고유한 주파수 스펙트럼 형태를 지니며, 이러한 스펙트럼에는 특징적인 피크들이 존재한다. 특히, 초인종 소리, 물 끓는 주전자 소리, 전화벨 소리 등과 같이 기계적 음향들은 스펙트럼 상에서 명확하게 구별되는 특징 피크들을 지니고 있다.In general, the sounds that humans need to recognize in everyday life each have a unique frequency spectrum form, and there are characteristic peaks in these spectra. In particular, mechanical sounds, such as doorbell sounds, boiling kettle sounds, telephone rings, etc., have distinctive feature peaks on the spectrum.

도 4에는 기계적 음향의 주파수 스펙트럼들이 도시되어 있다.4 shows frequency spectra of mechanical sound.

도 4를 참조하면, 각각의 음향 스펙트럼에는 고유한 특징 피크들이 존재함을 알 수 있다. 예컨대, 도 4에 도시된 바와 같이 문턱값(threshold)를 설정하는 경 우, 초인종 소리(410)에는 4개, 물 끓는 주전자 소리(420)에는 2개, 그리고 전화벨 소리(430)에는 7개의 특징 피크가 존재하게 된다. 상기 특징피크 추출부(212)는 이러한 특징 피크들을 추출하는 것이다. 물론, 상술한 바와 같이, 단순한 에너지 기반 피크 추출 방식뿐만 아니라, 더욱 복잡한 알고리즘들이 사용될 수도 있다.Referring to FIG. 4, it can be seen that there are unique feature peaks in each sound spectrum. For example, when the threshold is set as shown in FIG. 4, four doorbell sounds 410, two water boiling kettle sounds 420, seven phone ringing sounds 430, and seven features. There will be a peak. The feature peak extractor 212 extracts these feature peaks. Of course, as described above, not only simple energy-based peak extraction schemes, but also more complex algorithms may be used.

상기 특징정보 생성부(214)는, 상기 추출된 특징 피크가 상기 인식대상 음향의 스펙트럼에서 상기 특징 피크가 위치한 피크 대역을 나타내는 특징정보를 생성한다(S320).The feature information generator 214 generates feature information indicating that the extracted feature peak indicates a peak band in which the feature peak is located in the spectrum of the sound to be recognized (S320).

도 5에는 상기 특징정보 생성 과정이 도시되어 있다.5 shows a process of generating the feature information.

도 5를 참조하면, 상기 특징피크 추출부(212)가 예컨대 초인종 음향 스펙트럼(510)에서 4개의 특징 피크를 추출한 경우, 상기 특징정보 생성부(214)는 상기 4개의 특징 피크들이 위치한 4개의 피크 대역들을 나타내는 특징정보(520)를 생성한다.Referring to FIG. 5, when the feature peak extractor 212 extracts four feature peaks from, for example, a doorbell acoustic spectrum 510, the feature information generator 214 may include four peaks at which the four feature peaks are located. Generate feature information 520 representing the bands.

일 실시예에 있어서, 상기 특징정보(520)는 피크 특징 벡터(peak signature vector) 형태로 생성될 수 있다. 즉, 상기 인식대상 음향 신호에 관한 학습 데이터로부터 얻어진 N 차원(N dimension)의 평균 스펙트럼으로부터 상기 특징피크 추출부(212)가 상기 문턱값 이상의 특징 피크를 추출하면, 상기 특징정보 생성부(214)는 상기 특징 피크가 위치한 피크 대역에 해당하는 각각의 차원에 1을 할당하고 상기 피크 대역 이외의 대역인 밸리 대역(vallley band)에 해당하는 각각의 차원에 0을 할당하여 N 차원의 피크 특징 벡터를 생성할 수 있다.In one embodiment, the feature information 520 may be generated in the form of a peak signature vector. That is, when the feature peak extractor 212 extracts a feature peak equal to or greater than the threshold value from the N-dimensional average spectrum obtained from the training data about the acoustic signal to be recognized, the feature information generator 214. Is assigned to each dimension corresponding to the peak band where the feature peak is located, and 0 is assigned to each dimension corresponding to a valley band, which is a band other than the peak band, to obtain an N-dimensional peak feature vector. Can be generated.

일 실시예에 있어서, 상기 특징정보 생성부(214)는 인식대상 음향들의 특징 피크가 위치한 대역들 간에 중첩 대역이 있는 경우 상기 중첩 대역을 제외한 대역을 상기 인식대상 음향의 상기 피크 대역으로 하여 상기 특징정보를 생성할 수 있다.In one embodiment, the feature information generation unit 214 is characterized in that the band except for the overlapping band as the peak band of the recognition target sound when there is an overlapping band between bands in which feature peaks of the recognition target sounds are located. Information can be generated.

도 6a 및 도 6b에는 인식대상 음향들의 피크 대역 간에 중첩 대역이 존재하는 경우 상기 특징정보를 생성하는 과정이 도시되어 있다.6A and 6B illustrate a process of generating the feature information when overlapping bands exist between peak bands of sound to be recognized.

도 6a에 도시된 바와 같이, 인식대상 음향들의 피크 대역 간에 중첩 대역이 존재하는 경우 그에 대응하는 각각의 특징정보(피크 특징 벡터)들 간에도 중첩 부분이 존재하게 된다. 즉, 제1 특징정보(610) 및 제3 특징정보(630) 간에는 B 대역 부분이 중첩되고, 제2 특징정보(620) 및 제3 특징정보(630) 간에는 A 대역 부분이 중첩된다.As shown in FIG. 6A, when an overlapping band exists between peak bands of sound to be recognized, an overlapping portion exists between respective feature information (peak feature vectors) corresponding thereto. That is, the B band portion overlaps between the first feature information 610 and the third feature information 630, and the A band portion overlaps between the second feature information 620 and the third feature information 630.

이러한 경우, 도 6b에 도시된 바와 같이, 상기 특징정보 생성부(214)는 중첩 대역 부분(A, B)을 제외한 대역만을 상기 인식대상 음향들의 피크 대역으로 보고 상기 특징정보를 생성한다.In this case, as shown in FIG. 6B, the feature information generation unit 214 generates only the bands excluding the overlap band portions A and B as peak bands of the sound to be recognized and generate the feature information.

아래에서 다시 설명하겠지만, 이와 같이 상기 특징정보를 생성함으로써 각각의 음향들에 대한 인식률을 개선함은 물론, 동시 발생하는 다중 음향(multiple sound)에 대한 인식률까지 개선할 수 있게 된다.As will be described again below, by generating the feature information as described above, the recognition rate of each sound can be improved, as well as the recognition rate of multiple sounds that occur simultaneously.

그 다음, 상기 특징정보 생성부(214)는 상기 특징정보를 상기 저장부(250)에 저장함으로써 상기 인식대상음향을 등록 음향으로서 등록하게 된다(S330). 상기 저장부(250)는, 상기 음향 등록부(210)에 통합되어 구성될 수 있으며, 상기 음향 등록부(210)의 외부에 구성될 수도 있다.Next, the feature information generation unit 214 registers the recognition target sound as a registration sound by storing the feature information in the storage unit 250 (S330). The storage unit 250 may be configured to be integrated with the sound register unit 210 or may be configured outside the sound register unit 210.

또한, 상기 음향 등록부(210)에 의한 등록 단계(S310 내지 S330)는 생산자 내지 제조자의 의도 등에 따라 음향 인식 시스템의 생산 내지 제작시에 수행될 수 있지만, 사용자 또는 운용자의 용도에 따라 커스터마이징(customizing)이 가능하도록 구성할 수 있다. 즉, 사용자 또는 운용자는 입력 음향의 인식 전, 잡음없는 환경에서 상기 음향 인식 시스템을 통해 인식하고자 하는 인식대상 음향을 등록할 수 있다. 이러한 경우, 상기 음향 수신부(230)가 웨이브폼(waveform)의 인식대상 음향 신호를 수신하여 상기 스펙트럼 분석부(240)로 전달하면, 상기 스펙트럼 분석부(240)는 주파수 분석을 통해 상기 인식대상 음향 신호를 스펙트럼 벡터로 변경하여 상기 음향 등록부(210)로 전달하도록 구성할 수 있다.In addition, the registration step (S310 to S330) by the sound registration unit 210 may be performed at the time of production or production of the acoustic recognition system according to the intention of the producer or manufacturer, but customizing according to the use of the user or operator This can be configured to be possible. That is, the user or the operator may register the recognition target sound to be recognized through the sound recognition system in a noise-free environment before the recognition of the input sound. In this case, when the sound receiver 230 receives a recognition target sound signal of a waveform and transmits it to the spectrum analyzer 240, the spectrum analyzer 240 performs the frequency analysis to recognize the sound. The signal may be converted into a spectrum vector and transmitted to the sound register 210.

그 다음, 상기 음향 인식부(220)는, 입력 음향에 대한 인식(recognition) 단계에서, 입력 음향의 스펙트럼 상 상기 등록 음향의 피크 대역에 대응하는 대응 대역(relevant band) 및 상기 입력 음향의 스펙트럼 상 상기 대응 대역을 제외한 비대응 대역(irrelevant band)의 평균에너지(average energy)를 이용하여 상기 입력 음향을 상기 등록 음향으로 인식하거나 또는 인식 거부(reject)한다(S340 내지 S380).Next, the sound recognizing unit 220, in the step of recognizing the input sound, a relevant band corresponding to the peak band of the registered sound on the spectrum of the input sound and the spectrum of the input sound The input sound is recognized as the registered sound or rejected using the average energy of an irrelevant band excluding the corresponding band (S340 to S380).

더욱 구체적으로 설명하면, 상기 음향 인식부(220)는 상기 입력 음향에 대한 인식 단계를 수행하기 위해, 평균에너지 산출부(222) 및 유사도 측정부(224)를 포함할 수 있다.In more detail, the sound recognizer 220 may include an average energy calculator 222 and a similarity measurer 224 to perform the recognition of the input sound.

우선, 상기 음향 수신부(230)가 웨이브폼의 입력음향 신호를 수신하여 상기 스펙트럼 분석부(240)로 전달하면, 상기 스펙트럼 분석부(240)는 주파수 분석 과정 을 통해 상기 입력음향 신호를 스펙트럼 벡터로 변경한다(S340). 상기 스펙트럼 분석부(240)는 DFT(Discrete Fourier Transform) 등을 이용하여 상기 주파수 분석을 수행할 수 있다.First, when the sound receiver 230 receives an input sound signal of a waveform and transmits it to the spectrum analyzer 240, the spectrum analyzer 240 converts the input sound signal into a spectrum vector through a frequency analysis process. To change (S340). The spectrum analyzer 240 may perform the frequency analysis by using a Discrete Fourier Transform (DFT).

상기 평균에너지 산출부(222)는, 상기 대응 대역 및 상기 비대응 대역의 단위 대역 당 평균에너지를 산출한다(S350).The average energy calculator 222 calculates average energy per unit band of the corresponding band and the non-compliant band (S350).

그 다음, 상기 유사도 측정부(224)는, 상기 대응 대역 및 상기 비대응 대역 간의 평균에너지 비를 이용하여 상기 등록 음향 및 상기 입력 음향 간 스펙트럼 유사도(similarity)를 측정한다(S360).Next, the similarity measurer 224 measures the spectral similarity between the registered sound and the input sound using an average energy ratio between the corresponding band and the non-compliant band (S360).

본 발명에 의한 인식대상 음향들, 특히 초인종 소리와 같은 기계적 음향들은 특징적인 스펙트럼 피크를 지닌다. 그 이유는, 스펙트럼의 날카로운 피크들이 바로 비프(beep)음 등과 같은 고유한 기계음을 생성하기 때문이다. 따라서, 각각의 음향 스펙트럼의 대역은 상기 특징 피크가 위치한 피크 대역(peak band)과 상기 피크 대역 이외의 대역인 밸리 대역(valley band)으로 구분될 수 있다.Recognized sounds according to the invention, in particular mechanical sounds such as doorbell sounds, have characteristic spectral peaks. The reason is that the sharp peaks in the spectrum produce unique mechanical sounds, such as beep sounds. Accordingly, the band of each acoustic spectrum may be divided into a peak band in which the feature peak is located and a valley band which is a band other than the peak band.

특히 주목할 점은, 상기 밸리 대역은 상기 피크 대역에 비해 상당히 넓다는 것이다. 즉, 상기 피크 대역은 좁은 대역에 음향 에너지가 집중되어 있는 대역에 해당하는 반면, 상기 밸리 대역은 매우 넓은 대역에 음향 에너지가 산재되어 있는 대역에 해당한다. 그 결과, 상기 피크 대역의 평균에너지는 상대적으로 큰 값을 나타내고, 상기 밸리 대역의 평균에너지는 상대적으로 작은 값을 나타낸다.Of particular note is that the valley band is considerably wider than the peak band. That is, the peak band corresponds to a band in which acoustic energy is concentrated in a narrow band, whereas the valley band corresponds to a band in which acoustic energy is scattered in a very wide band. As a result, the average energy of the peak band represents a relatively large value, and the average energy of the valley band represents a relatively small value.

마찬가지로, 상기 입력 음향이 상기 등록 음향과 동일 음향에 해당한다면, 잡음의 존재에 무관하게 상기 입력 음향 스펙트럼에서 상기 대응 대역의 평균에너 지는 상대적으로 큰 값을 나타내고, 상기 비대응 대역의 평균에너지는 작은 값을 나타내게 된다.Similarly, if the input sound corresponds to the same sound as the registered sound, the average energy of the corresponding band in the input sound spectrum shows a relatively large value regardless of the presence of noise, and the average energy of the non-corresponding band is small. Will display the value.

따라서, 본 발명은 상기 대응 대역 및 상기 비대응 대역의 평균에너지를 이용하여 상기 등록 음향 및 상기 입력 음향 간 유사도를 측정하고자 하는 것이다.Accordingly, the present invention intends to measure the similarity between the registered sound and the input sound using the average energy of the corresponding band and the non-compliant band.

일 실시예에 있어서, 상기 유사도 측정부(224)는 상기 비대응 대역 대한 상기 대응 대역의 평균에너지 비를 나타내는 PDR(Peak Domination Ratio) 값을 이용하여 상기 스펙트럼 유사도를 측정할 수 있다.In one embodiment, the similarity measurer 224 may measure the spectral similarity using a peak domination ratio (PDR) value representing an average energy ratio of the corresponding band to the non-compliant band.

상기 PDR은 상기 등록 음향의 피크 특징 벡터(S) 및 상기 입력 음향의 스펙트럼(X)만을 이용하여 유사도를 측정할 수 있도록 한다.The PDR makes it possible to measure the similarity using only the peak feature vector (S) of the registered sound and the spectrum (X) of the input sound.

상기 PDR 값은 수학식 1과 같이 나타낼 수 있다.The PDR value may be represented as in Equation 1.

Figure 112009021898607-pat00001
Figure 112009021898607-pat00001

상기 수학식 1은 구체적으로 수학식 2와 같이 산출될 수 있다.Equation 1 may be specifically calculated as Equation 2.

Figure 112009021898607-pat00002
Figure 112009021898607-pat00002

상기 수학식 2에서, N은 상기 S 및 X의 차원을 나타내고, X[k]는 상기 입력 음향 스펙트럼(X)의 k 차원 에너지를 나타내고, S[k]는 상기 피크 특징 벡터(S)의 k 차원 이진값을 나타낸다. 즉, S[k]는 상기 등록 음향의 상기 피크 대역에 대해 이진값 1을, 그리고 상기 밸리 지역에 대해 이진값 0을 지닌다.In Equation 2, N represents the dimensions of the S and X, X [k] represents the k-dimensional energy of the input acoustic spectrum (X), S [k] is k of the peak feature vector (S) Represents a dimensional binary value. That is, S [k] has a binary value 1 for the peak band of the registered sound and a binary value 0 for the valley area.

상기 음향 인식부(220)는, 상기 PDR 값이 미리 결정된 임계값 이상인 경우(S362), 상기 입력 음향을 상기 등록 음향으로 인식한다(S370). 그러나, 상기 PDR 값이 상기 임계값보다 작은 경우(S362), 상기 입력 음향을 잡음 또는 미등록 음향으로 판단하여 인식을 거부(reject)한다(S372).If the PDR value is equal to or greater than a predetermined threshold value (S362), the sound recognition unit 220 recognizes the input sound as the registered sound (S370). However, when the PDR value is smaller than the threshold (S362), the input sound is judged as noise or unregistered sound and rejected recognition (S372).

도 7a 및 도 7b에는 잡음 왜곡이 발생한 입력 음향의 스펙트럼이 도시되어 있다.7A and 7B show the spectrum of the input sound with noise distortion.

도 7a에는 배경 잡음에 의해 손상된 초인종 소리의 스펙트럼이 도시되어 있다.7A shows the spectrum of a buzzer sound damaged by background noise.

도 7a에 도시된 바와 같이, 채널 왜곡(channel distortion)들, 예컨대 잔향(reverberation) 등 배경 잡음들로 인해 음향 스펙트럼의 일부 피크들이 묻혀버리는 경우는 물론, 배경 잡음에 불구하고 입력 음향 스펙트럼 상에 여전히 초인종 소리의 특징적인 스펙트럼 피크들이 존재하는 경우라도, 기존 기술은 상기 입력 음향 스펙트럼으로부터 특징을 추출하여 등록 음향과의 유사성을 판단하기 때문에 오인식을 초래하게 된다. 그 이유는, 기존 기술에서 좁은 대역에 존재하는 피크들의 유사성 여부는 상대적으로 매우 넓은 대역에 걸쳐 존재하는 밸리들의 유사성 여부에 따라 무의미해 질 수 있기 때문이다. 특히, 스펙트럼 대역 전체에 대해 동일한 가중치로 유사성을 판단하는 방식, 예컨대 유클리디안 거리(euclidean distance) 기반의 방식은 이러한 배경 잡음들에 의해 왜곡된 결과를 나타내기 쉽다.As shown in FIG. 7A, some peaks in the acoustic spectrum are buried due to background distortions such as channel distortions, such as reverberation, as well as still on the input acoustic spectrum despite background noise. Even when there are characteristic spectral peaks of the buzzer sound, the existing technology causes misrecognition because it extracts a feature from the input sound spectrum to determine similarity with a registered sound. The reason is that the similarity of peaks existing in a narrow band in the existing technology may be meaningless depending on the similarity of valleys existing in a relatively very wide band. In particular, a method of determining similarity with the same weight over the entire spectral band, such as an Euclidean distance based method, tends to show a result distorted by these background noises.

도 7b에는 배경 잡음 및 숏 버스트(short burst) 잡음에 의해 손상된 초인종 소리의 스펙트럼이 도시되어 있다.FIG. 7B shows the spectrum of the doorbell sound damaged by background noise and short burst noise.

도 7b에 도시된 바와 같이, 문 닫는 소리 등 숏 버스트 잡음들로 인해 입력 음향의 스펙트럼 상에 전혀 관련없는 피크들이 나타날 수 있다. 스펙트럼 피크 기반 방법들의 주요 문제점들 중 하나는 이러한 비관련 피크들의 추가로 인해 쉽게 오인식이 발생할 수 있다는 것이다.As shown in FIG. 7B, unrelated peaks may appear in the spectrum of the input sound due to short burst noises such as door closing sounds. One of the major problems with spectral peak based methods is that misrecognition can easily occur due to the addition of these unrelated peaks.

결국, 기존 기술에 있어서 배경 잡음에 의한 스펙트럼 피크들의 상대적 크기 변화 및 비관련 피크들의 추가는 입력 음향 신호의 특징을 왜곡시켜 급격한 성능 저하를 초래하게 된다.As a result, in the existing technology, the change in the relative magnitude of the spectral peaks and the addition of unrelated peaks due to the background noise distorts the characteristics of the input acoustic signal, resulting in a sudden decrease in performance.

도 8a 내지 도 8c에는 입력 음향 스펙트럼의 대응 대역 및 비대응 대역의 상대적 평균에너지가 히스토그램으로 도시되어 있다.8A to 8C show the histograms of the relative average energy of the corresponding and non-corresponding bands of the input acoustic spectrum.

도 8a 및 도 8b에 도시된 바와 같이, 입력 음향에 배경 잡음이 존재하는 경우뿐만 아니라 추가적 피크들이 존재하는 경우에도 상기 입력 음향이 상기 등록 음향과 동일한 음향이라면, 상기 입력 음향의 스펙트럼에서 상기 대응 대역의 평균에너지(black bar)가 상기 비대응 대역의 평균에너지(white bar)에 비해 상대적으로 큰 값을 지님을 알 수 있다. 그러나, 도 8c에 도시된 바와 같이, 상기 입력 음향이 잡음에 불과하다면 상기 입력 음향의 스펙트럼에서 상기 대응 대역 및 상기 비대응 대역 간에 평균에너지 차가 크지 않음을 알 수 있다.As shown in Figs. 8A and 8B, if the input sound is the same sound as the registered sound, not only when there is background noise in the input sound but also when there are additional peaks, the corresponding band in the spectrum of the input sound. It can be seen that the average energy (black bar) of has a relatively large value compared to the average energy (white bar) of the non-corresponding band. However, as shown in FIG. 8C, if the input sound is only noise, it can be seen that the average energy difference between the corresponding band and the non-compliant band is not large in the spectrum of the input sound.

따라서, 본 발명은 에너지 기반의 유사도 측정 방식, 즉 상기 PDR 기반의 유 사도 측정 방식을 통해 오인식 발생의 원인이 되는 입력 음향 신호로부터의 특징 추출 과정을 제거하고, 등록 음향 및 입력 음향 간 유사도 측정에 있어서 특정 관련 대역에 집중할 수 있도록 한다. 그 결과, 본 발명은 잡음 또는 미등록 음향이 등록 음향으로 오인식되는 경우뿐만 아니라 등록 음향이 다른 등록 음향으로 오인식되는 경우를 방지할 수 있다. 이러한 결과는, 오직 등록 음향의 특징 피크들이 입력 음향의 스펙트럼 상에 나타나는 경우에만 상기 PDR 값이 상대적으로 크게 나타나기 때문이다.Accordingly, the present invention eliminates the feature extraction process from the input acoustic signal that causes misrecognition through the energy-based similarity measuring method, that is, the PDR-based similarity measuring method, and measures the similarity between the registered sound and the input sound. This allows you to focus on specific related bands. As a result, the present invention can prevent not only the case where the noise or the unregistered sound is mistaken as the registered sound, but also the case where the registered sound is mistaken as the other registered sound. This result is because the PDR value appears relatively large only when the characteristic peaks of the registered sound appear on the spectrum of the input sound.

일 실시예에 있어서, 상기 음향 등록부(210)에 의한 등록 음향들이 복수인 경우 상기 음향 인식부(220)는, 각각의 등록 음향들에 대하여 상기 PDR 값을 산출하고, 상기 산출된 PDR 값 중 최대 PDR 값이 상기 임계값보다 큰 경우, 상기 입력 음향을 상기 최대 PDR 값에 대응하는 등록 음향으로 인식할 수 있다.In one embodiment, when there are a plurality of registration sounds by the sound registration unit 210, the sound recognition unit 220 calculates the PDR value for each of the registration sounds, the maximum of the calculated PDR value When the PDR value is larger than the threshold value, the input sound may be recognized as a registered sound corresponding to the maximum PDR value.

또한, 상기 음향 인식부(220)는, 다양한 수준의 PDR 값을 나타내는 음향들에 대해 단일한 임계값을 사용하여 인식 과정을 수행함으로써 연산의 단순화 및 효율화를 도모하기 위해, 상기 PDR 값을 정규화하여 사용할 수 있다.In addition, the sound recognition unit 220 normalizes the PDR value to simplify the calculation and efficiency by performing a recognition process using a single threshold value for sounds representing various levels of PDR values. Can be used.

일 실시예에 있어서, 상기 음향 인식부(220)의 상기 유사도 측정부(224)는, 상기 등록 음향의 스펙트럼에서 상기 밸리 대역에 대한 상기 피크 대역의 평균에너지 비(self PDR)에 의해 상기 PDR 값을 정규화한 NPDR(Normalized PDR) 값을 이용하여 상기 스펙트럼 유사도를 측정할 수 있다. 즉, i 번째 등록 음향 스펙트럼(Ri) 및 입력 음향 스펙트럼(X) 간의 유사도 측정을 위한 NPDR 값은 수학식 3과 같이 산 출될 수 있다.In one embodiment, the similarity measuring unit 224 of the sound recognition unit 220, the PDR value by the average energy ratio (self PDR) of the peak band to the valley band in the spectrum of the registered sound. The spectral similarity may be measured using a normalized PDR (NPDR) value normalized to. That is, NPDR value for the similarity measurement between the i-th registered sound spectrum (R i) and the input sound spectrum (X) may be invoked acid as shown in Equation 3.

Figure 112009021898607-pat00003
Figure 112009021898607-pat00003

상기 수학식 3에서, Si는 해당 등록 스펙트럼(Ri)의 피크 특징 벡터(peak signature vector)이다. 일 실시예에 있어서, 상기 음향 등록부(210)에 의한 등록 단계에서 각각의 등록 음향에 관한 상기 self PDR 값을 생성하여 상기 저장부(250)에 저장하고, 상기 음향 인식부(220)에 의한 인식 단계에서 상기 저장부(250)에 저장된 상기 특징정보 및 상기 self PDR 값을 사용하여 상기 NPDR 값을 산출하도록 구성할 수 있다.In Equation 3, S i is a feature vector peak (peak signature vector) of the registered spectrum (R i). In one embodiment, in the registration step by the sound registration unit 210, the self PDR value for each registered sound is generated and stored in the storage unit 250, the recognition by the sound recognition unit 220 In the step, the NPDR value may be calculated using the feature information and the self PDR value stored in the storage unit 250.

한편, 본 발명의 음향 스펙트럼 유사도 측정에 있어서, 등록 음향과 관련없는 입력 음향 스펙트럼의 비관련 피크들이 관련 피크(등록 음향의 특징 피크에 대응하는 피크)에 비해 적은 영향을 미친다는 특징은, 동시에 발생하는 다중 음향(multiple sound)에 대한 인식에 있어서도 인식률 개선하는 이점을 제공한다.On the other hand, in the acoustic spectral similarity measurement of the present invention, the characteristic that unrelated peaks of the input acoustic spectrum not related to the registered sound have less influence than the related peak (peak corresponding to the characteristic peak of the registered sound) occurs simultaneously. Also, the recognition rate is improved in recognition of multiple sounds.

도 9에는 다중 음향의 주파수 스펙트럼이 도시되어 있다.9 shows the frequency spectrum of multiple sounds.

도 9에 도시된 바와 같이, 상기 다중 음향은 동시 발생한 초인종 소리 및 전화벨 소리로 구성되어 있다. 예컨대, 등록 음향들 중 초인종 소리에 대한 NPDR을 연산하는 경우에는, 상기 전화벨 소리의 특징 피크들보다 상기 초인종 소리의 특징 피크들이 상기 NPDR 값에 더 많은 영향을 미치게 된다. 즉, 다중 음향 신호는 상기 전화벨 소리에 불구하고 상기 초인종 소리에 대하여 높은 NPDR 값을 나타내게 된 다. 물론, 이러한 원리는 전화벨 소리에 대한 NPDR을 연산하는 경우에도 동일하게 적용된다. 일 실시예에 있어서, 상기 음향 인식부(220)는 상기 다중 음향이 특정 등록 음향들에 대하여 모두 일정치 이상의 NPDR 값을 나타내는 경우 상기 등록 음향들이 모두 존재하는 것으로 인식할 수 있다. 따라서, 본 발명에 의한 음향 인식 시스템은 다중 음향 신호에서 각각의 구성 음향 신호들을 모두 인식할 수 있게 된다.As shown in Fig. 9, the multiple sound is composed of a simultaneous doorbell sound and a telephone ringing sound. For example, when calculating the NPDR for the doorbell sound among the registered sounds, the feature peaks of the doorbell sound have more influence on the NPDR value than the feature peaks of the ringtone sound. That is, the multi-acoustic signal shows a high NPDR value for the doorbell sound despite the ringing tone. Of course, this principle applies equally to the calculation of NPDR for ringing tones. In one embodiment, the sound recognition unit 220 may recognize that all of the registered sounds are present when the multiple sound represents an NPDR value of a predetermined value or more for a specific registration sound. Therefore, the acoustic recognition system according to the present invention can recognize all the respective acoustic signals in the multiple acoustic signals.

이러한 다중 음향 인식에 있어서, 각각의 구성 음향 신호들이 동일 대역에 존재하는 스펙트럼 피크들을 지니고 있는 경우 오인식 문제가 발생할 수 있다. 예컨대, 상기 초인종 소리 및 전화벨 소리가 동일 대역에 특징 피크들을 지니고 있는 경우, 상기 전화벨 소리에 대한 인식임에도 초인종 소리에 대한 NPDR 값이 높게 나타날 수 있다. 마찬가지로, 상기 초인종 소리에 대한 인식임에도 상기 전화벨 소리에 대한 NPDR 값이 높게 나타날 수 있다.In such multiple acoustic recognition, a misrecognition problem may occur when each component acoustic signal has spectral peaks present in the same band. For example, when the doorbell sound and the ringtone sound have feature peaks in the same band, the NPDR value for the doorbell sound may appear high even though the ringtone sound is recognized. Similarly, the NPDR value for the ringing tone may be high even when the doorbell sound is recognized.

따라서, 본 발명은 이러한 문제점을 해결하기 위해, 앞서 도 6a 및 도 6b를 참조하여 상술한 바와 같이 인식대상 음향에 관한 상기 특징정보(예컨대, 피크 특징 벡터) 생성시 상기 피크 대역에서 공통 피크 대역을 제외한다. 그 결과, 등록 음향에 대한 특징정보들은 각각 고유한 피크 대역을 나타낼 수 있게 되고, 상기 공통 피크 대역이 상기 NPDR 값에 미치는 영향을 제거할 수 있게 된다.Accordingly, in order to solve this problem, the present invention provides a common peak band in the peak band when generating the feature information (eg, peak feature vector) related to the sound to be recognized as described above with reference to FIGS. 6A and 6B. Exclude. As a result, the characteristic information on the registered sound can each exhibit a unique peak band, and it is possible to eliminate the influence of the common peak band on the NPDR value.

그 다음, 상기 음향 인식 시스템에 입력되는 후속 입력 음향이 존재하는 경우, 상술한 음향 인식 과정을 반복한다(S380).Then, when there is a subsequent input sound input to the sound recognition system, the above-described sound recognition process is repeated (S380).

상기 출력부(260)는, 상기 입력 음향이 상기 등록 음향으로 인식되는 경우, 다양한 형태로 인식 결과를 출력한다. 일 실시예에 있어서, 상기 출력부(260)는, 각종 디스플레이 장치, 음향 장치, 햅틱 인터페이스 등을 포함할 수 있다.When the input sound is recognized as the registered sound, the output unit 260 outputs a recognition result in various forms. In one embodiment, the output unit 260 may include a variety of display devices, sound devices, haptic interface, and the like.

또한, 본 발명은 컴퓨터로 판독할 수 있는 기록매체에 컴퓨터가 읽어들일 수 있는 프로그램 코드로서 구현하는 것이 가능하다. 본 발명이 소프트웨어를 통해 실행될 때, 본 발명의 구성 수단들은 필요한 작업을 실행하는 코드 세그먼트들이다. 프로그램 또는 코드 세그먼트들은 프로세서 판독 가능 매체에 저장되거나 전송 매체 또는 통신망에서 반송파와 결합된 컴퓨터 데이터 신호에 의하여 전송될 수 있다.The present invention can also be embodied as computer readable program code on a computer readable recording medium. When the present invention is executed through software, the constituent means of the present invention are code segments for performing necessary tasks. The program or code segments may be stored on a processor readable medium or transmitted by a computer data signal coupled with a carrier on a transmission medium or network.

컴퓨터가 판독할 수 있는 기록매체에는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 판독할 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광데이터 저장장치 등이 있다. 또한, 컴퓨터가 판독할 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽어들일 수 있는 코드가 저장되고 실행될 수 있다.The computer-readable recording medium includes all kinds of recording devices for storing data that can be read by a computer system. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disks, optical data storage devices, and the like. The computer readable recording medium can also be distributed over network coupled computer systems so that the computer readable code is stored and executed in a distributed fashion.

이하, 본 발명의 현저한 효과를 검증한다.Hereinafter, the significant effects of the present invention are verified.

본 발명의 성능평가를 위해 테스트 데이터로서 초인종, 물 끓는 주전자, 및 전화벨 음향을 사용하여 등록 및 인식을 수행하였다. 각각의 음향은 16kHz로 샘플링하였고, 128ms 블록은 각각 64ms 오버랩으로 처리하였다. 해밍 윈도우(Hamming window)를 통해 푸리에 분석을 적용하여 각각의 블록에 대하여 1024차원의 스펙트럼 벡터를 얻었다. 또한, 각각의 음향에 대한 벡터들을 모두 평균화하여 평균 스펙 트럼을 얻었다.Registration and recognition were performed using a doorbell, a boiling kettle, and a telephone ring sound as test data for performance evaluation of the present invention. Each sound was sampled at 16 kHz, and 128 ms blocks were each processed with a 64 ms overlap. Fourier analysis was applied through a Hamming window to obtain 1024 spectral vectors for each block. In addition, all vectors for each sound were averaged to obtain an average spectrum.

또한, 본 발명의 성능 비교 대상으로는 전체 스펙트럼 대역을 비교하는 유클리디안 거리(euclidean distance) 기반 방식을 선택하였다. 학습 데이터와 실험 데이터의 에너지 레벨이 다를 수 있기 때문에, 유클리디안 거리 계산 전에 각각의 스펙트럼 벡터들에 대하여 벡터 정규화(vector normalization)를 적용하였다.In addition, the Euclidean distance based method for comparing the entire spectral band was selected as a performance comparison target of the present invention. Since the energy levels of the training data and the experimental data may be different, vector normalization was applied to each of the spectral vectors before calculating the Euclidean distance.

도 10에는 근거리 테스트 데이터의 SNR에 따른 본 발명의 인식성능 실험 결과가 그래프로 도시되어 있다.10 is a graph showing the recognition performance test results of the present invention according to the SNR of the short-range test data.

본 발명의 근거리 테스트 데이터에 대한 인식 성능을 증명하기 위해, 잡음없는 환경에서 초인종, 주전자, 및 전화벨 소리를 10회 레코딩하고 10dB에서 -20dB까지의 SNR 레벨을 지니는 배경 잡음들을 혼합하여 테스트 데이터를 생성하였다. 상기 배경 잡음들로는 화이트 노이즈(white noise), 핑크 노이즈(pink noise), 그리고 오로라-2 코퍼스(Aurora-2 corpus)에서의 8개 잡음, 즉 공항, 전람회, 식당, 거리, 지하절, 자동차, 기차, 그리고 다중 누화(babble) 잡음을 사용하였다. 즉, 2400개(2400=음향종류(3)×레코딩횟수(10)×SNR레벨(8)×잡음종류(10))의 테스트 데이터를 사용하였다.To demonstrate the recognition performance of the short range test data of the present invention, the doorbell, kettle, and ringtones are recorded 10 times in a noise-free environment, and the test data is generated by mixing the background noises having an SNR level of 10 dB to -20 dB. It was. The background noises include white noise, pink noise, and eight noises at Aurora-2 corpus, ie airports, exhibitions, restaurants, streets, underground passages, cars, trains. And multiple crosstalk noise. That is, test data of 2400 pieces (2400 = sound type (3) x recording number (10) x SNR level (8) x noise type (10)) was used.

도 10에 도시된 바와 같이, 본 발명(NPDR)은 유클리디안 거리 기반 방식(Normalized Euclidean)과는 달리, 잡음없는 신호에서는 물론 잡음있는 신호에서도 만족할 만한 성능을 보임을 알 수 있다. 이는 본 발명의 유사도 측정 방법이 결과적으로 넓은 밸리 대역에 비해 관련 피크 대역에 가중치를 두게 되어 전체 스펙트럼 대역에 퍼져있는 배경 잡음의 효과를 최소화하기 때문이다. 상기 유클리디안 거리 기반 방식은 SNR 레벨이 -15dB 이하인 경우 정확성이 33.3%로 현저히 감소하며, 이는 임의 선택과 다를 바 없는 것이다.As shown in FIG. 10, the present invention (NPDR), unlike the Euclidean distance-based method (Normalized Euclidean), can be seen that satisfactory performance in a noisy signal as well as a noisy signal. This is because the similarity measuring method of the present invention weights the related peak band as compared to the wide valley band, thereby minimizing the effect of background noise spread over the entire spectral band. The Euclidean distance based scheme significantly reduces the accuracy to 33.3% when the SNR level is -15 dB or less, which is no different from random selection.

도 11a에는 등록 음향 및 미등록 음향에 관한 원거리 테스트 데이터의 유클리디안 거리가 히스토그램으로 도시되어 있다.In Fig. 11A, the Euclidean distance of far-field test data for registered and unregistered sounds is shown as a histogram.

도 11b에는 등록 음향 및 미등록 음향에 관한 원거리 테스트 데이터의 NPDR 값이 히스토그램으로 도시되어 있다.In FIG. 11B, NPDR values of far-field test data relating to registered and unregistered sounds are shown as histograms.

원거리 테스트 데이터에 대한 본 발명의 인식 성능을 증명하기 위해, 실내 구조(예컨대, 일반 가정, 사무실 등), 음원 및 마이크로폰의 위치가 상이한 90개의 구성으로, 상기 3종류의 음원에 대해 10회 레코딩을 수행하였다. 즉, 2700개(2700=음향종류(3)×레코딩횟수(10)×구성종류(90))의 테스트 데이터를 사용하였다.In order to prove the recognition performance of the present invention for remote test data, 10 recordings of the three types of sound sources were performed in 90 configurations in which the indoor structure (for example, home, office, etc.), the sound source, and the microphone positions are different. Was performed. That is, 2700 test data (2700 = sound type (3) x recording frequency (10) x composition type (90)) were used.

도 11a에 도시된 바와 같이, 유클리디안 거리 기반 방식의 경우, 등록 음향의 유클리디안 거리(black bar)가 미등록 음향의 유클리드 거리(white bar)와 많이 오버랩되어 있음을 알 수 있다. 이러한 결과는, 유클리디안 거리가 미등록 음향을 인식 거부하기 위한 효과적인 기준치로서 사용될 수 없음을 나타내는 것이다.As shown in FIG. 11A, in the case of the Euclidean distance-based scheme, it can be seen that the Euclidean distance (black bar) of the registered sound overlaps a lot with the Euclidean distance (white bar) of the unregistered sound. This result indicates that the Euclidean distance cannot be used as an effective reference value for rejecting recognition of unregistered sounds.

반면, 도 11b에 도시된 바와 같이, 본 발명의 경우, 등록 음향의 NPDR 값이 미등록 음향의 NPDR 값과 명확히 구분되어 있다. 이러한 결과는, 본 발명의 NPDR 값이 주어진 음향의 등록 음향 해당 여부를 결정하는 효과적인 기준치임을 분명히 나타내는 것이다.On the other hand, as shown in Figure 11b, in the present invention, the NPDR value of the registered sound is clearly distinguished from the NPDR value of the unregistered sound. These results clearly indicate that the NPDR value of the present invention is an effective reference value for determining whether a given sound corresponds to a registered sound.

이와 같이, 유클리디안 거리는 등록 음향에 대한 출력과 미등록 음향에 대한 출력이 높은 수준으로 오버랩되기 때문에, 유클리디안 거리 방식의 EER(Equal Error Rate)은 63.5%로 상당히 높은 수준이다. 반면, 본 발명의 EER은 단지 0.2%에 그친다.As described above, since the Euclidean distance overlaps the output of the registered sound with the output of the unregistered sound at a high level, the Equal Error Rate (EER) of the Euclidean distance method is 63.5%, which is quite high. In contrast, the EER of the present invention is only 0.2%.

도 12에는 단일 음향 및 다중 음향 데이터에 대한 본 발명의 인식성능 실험 결과가 도시되어 있다.Figure 12 shows the results of the recognition performance test of the present invention for the single acoustic and multi-acoustic data.

동시 발생하는 다중 음향에 대한 본 발명의 인식성능을 증명하기 위해, 60가지의 실내 환경에서 각각 4종류(초인종+주전자, 초인종+전화, 주전자+전화, 초인종+주전자+전화)의 혼합 신호에 대해 10회 레코딩을 수행하였다. 즉, 2400개(2400=혼합신호(4)×레코딩횟수(10)×구성종류(60))의 테스트 데이터를 사용하였다.In order to prove the recognition performance of the present invention with respect to multiple sounds simultaneously occurring, four kinds of mixed signals (buzzer + kettle, doorbell + telephone, kettle + telephone, doorbell + kettle + telephone) in 60 indoor environments are provided. Ten recordings were performed. That is, 2400 pieces of test data (2400 = mixed signal 4 x recording number 10 x configuration type 60) were used.

도 12에 도시된 바와 같이, 각각의 사용된 입력 음향(INPUT)에 대한 본 발명의 인식결과(OUTPUT)는 매우 높은 정확도를 보이고 있음을 알 수 있다. 즉, 단일 음향 인식의 정확도는 97.5%, 다중 음향 인식의 정확도는 92.8%, 그리고 미등록 음향 인식 거부의 정확도는 98.9%에 이르고 있다.As shown in FIG. 12, it can be seen that the recognition result OUTPUT of the present invention for each used input sound INPUT shows a very high accuracy. That is, the accuracy of single acoustic recognition is 97.5%, the accuracy of multiple acoustic recognition is 92.8%, and the accuracy of rejection of unregistered acoustic recognition is 98.9%.

특히 주목할 점은, 본 발명은 다중 음향 인식에 있어서도 매우 높은 정확도를 보인다는 점과, 다중 음향을 구성하는 음향 전부를 인식하지 못하는 경우라도 적어도 그 일부 구성 음향들은 높은 정확도로 인식할 수 있다는 점이다.It is particularly noteworthy that the present invention exhibits very high accuracy even in multi-acoustic recognition, and that at least some of the constituent sounds can be recognized with high accuracy even when not all the sounds constituting the multi-sound are recognized. .

상술한 바와 같이, 본 발명은 잡음에 의해 손상된 입력 음향 신호에 대한 특징 추출 과정 없이 사전 학습된 등록 음향 신호의 스펙트럼 피크 정보를 이용하여 두 음향 간 매칭을 수행함으로써, 다양한 잡음이 발생하는 실제 생활 환경에서 배경 잡음에 무관하게 안정된 인식률을 제공하는 이점을 제공한다. 또한, 단일 음향은 물론 다중 음향에 대한 인식률까지 개선하는 이점을 제공한다. 나아가, 음향 인 식 과정에서 정보 처리 및 연산량을 감소시켜 오늘날 급속도록 발전하고 있는 이동단말기기, USN의 센서노드 등 자원제약적 환경에 용이하게 적용할 수 있다는 이점을 제공한다.As described above, the present invention provides a real life environment in which various noises are generated by performing matching between two sounds using spectral peak information of a pre-learned registered sound signal without a feature extraction process for an input sound signal damaged by noise. Provides the advantage of providing a stable recognition rate independent of background noise. In addition, it provides the advantage of improving the recognition rate for a single sound as well as multiple sounds. Furthermore, it reduces the amount of information processing and computation in the acoustic recognition process, and provides the advantage that it can be easily applied to resource-constrained environments such as mobile terminal devices and USN sensor nodes that are rapidly developing today.

지금까지 본 발명에 대해 실시예들을 참고하여 설명하였다. 그러나 당업자라면 본 발명의 본질적인 기술적 사상으로부터 벗어나지 않는 범위에서 본 발명이 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 즉, 본 발명의 진정한 기술적 범위는 첨부된 특허청구범위에 나타나 있으며, 그와 균등범위 내에 있는 모든 차이점은 본 발명에 포함되는 것으로 해석되어야 할 것이다.So far, the present invention has been described with reference to the embodiments. However, one of ordinary skill in the art will appreciate that the present invention can be implemented in a modified form without departing from the essential technical spirit of the present invention. Therefore, the disclosed embodiments should be considered in an illustrative rather than a restrictive sense. That is, the true technical scope of the present invention is shown in the appended claims, and all differences within the equivalent scope will be construed as being included in the present invention.

도 1은 본 발명에 따른 스펙트럼 피크를 이용한 음향 인식 방법의 기본 원리를 나타낸 도면이다.1 is a view showing the basic principle of the acoustic recognition method using the spectral peak according to the present invention.

도 2는 본 발명에 따른 스펙트럼 피크를 이용한 음향 인식 시스템의 일례를 나타낸 블록도이다.2 is a block diagram showing an example of an acoustic recognition system using spectral peaks according to the present invention.

도 3은 본 발명에 따른 스펙트럼 피크를 이용한 음향 인식 방법의 일례를 나타낸 흐름도이다.3 is a flowchart illustrating an example of a sound recognition method using spectral peaks according to the present invention.

도 4는 기계적 음향의 주파수 스펙트럼들을 나타낸 도면이다.4 shows frequency spectra of mechanical sound.

도 5는 본 발명의 특징정보 생성 과정을 나타낸 도면이다.5 is a diagram illustrating a process of generating feature information of the present invention.

도 6a 및 도 6b는 인식대상 음향들의 피크 대역 간에 중첩 대역이 존재하는 경우 본 발명의 특징정보를 생성하는 과정을 나타낸 도면이다.6A and 6B illustrate a process of generating feature information of the present invention when there is an overlapping band between peak bands of sound to be recognized.

도 7a 및 도 7b는 잡음 왜곡이 발생한 입력 음향의 주파수 스펙트럼을 나타낸 도면이다.7A and 7B are diagrams illustrating a frequency spectrum of input sound in which noise distortion occurs.

도 8a 내지 도 8c는 입력 음향 스펙트럼의 대응 대역 및 비대응 대역의 상대적 평균에너지를 히스토그램으로 나타낸 도면이다.8A to 8C are histograms showing relative average energies of corresponding and non-corresponding bands of the input acoustic spectrum.

도 9는 다중 음향의 주파수 스펙트럼을 나타낸 도면이다.9 is a diagram illustrating a frequency spectrum of multiple sounds.

도 10은 근거리 테스트 데이터의 SNR에 따른 본 발명의 인식성능 실험 결과를 나타낸 그래프이다.10 is a graph showing the recognition performance test results of the present invention according to the SNR of the short-range test data.

도 11a는 등록 음향 및 미등록 음향에 관한 원거리 테스트 데이터의 유클리디안 거리를 히스토그램으로 나타낸 도면이다.FIG. 11A is a diagram showing a histogram of Euclidean distance of far-field test data regarding a registered sound and an unregistered sound. FIG.

도 11b는 등록 음향 및 미등록 음향에 관한 원거리 테스트 데이터의 NPDR 값을 히스토그램으로 나타낸 도면이다.FIG. 11B is a histogram of NPDR values of remote test data relating to registered and unregistered sounds. FIG.

도 12는 단일 음향 및 다중 음향 데이터에 대한 본 발명의 인식성능 실험 결과를 나타낸 도면이다.12 is a view showing the results of the recognition performance test of the present invention for the single acoustic and multi-acoustic data.

Claims (20)

인식대상 음향의 스펙트럼에서 특징 피크가 위치한 피크 대역을 획득하여 상기 인식대상 음향을 등록하는 음향 등록부; 및A sound register for acquiring a peak band at which a feature peak is located in a spectrum of a recognition sound and registering the recognition sound; And 입력 음향의 스펙트럼에서 상기 등록 음향의 상기 피크 대역에 대응하는 대응 대역 및 상기 대응 대역을 제외한 비대응 대역의 평균에너지를 이용하여 상기 입력 음향을 상기 등록 음향으로 인식하거나 인식 거부하는 음향 인식부를 포함하고,A sound recognition unit that recognizes or rejects the input sound as the registered sound using an average energy of a corresponding band corresponding to the peak band of the registered sound in the spectrum of the input sound and a non-corresponding band except the corresponding band; , 상기 음향 등록부는 상기 인식대상 음향의 특징 피크들의 중첩 대역을 제외함으로써 동시 발생하는 다중 음향들 각각을 인식하는 것을 특징으로 하는 스펙트럼 피크를 이용한 음향 인식 시스템.And the sound register recognizes each of the multiple sounds simultaneously generated by excluding overlapping bands of feature peaks of the sound to be recognized. 제1항에 있어서,The method of claim 1, 상기 음향 등록부는,The sound registration unit, 상기 인식대상 음향의 스펙트럼 피크들 중 미리 결정된 문턱값(threshold)보다 큰 에너지를 지니는 피크를 특징 피크로 추출하는 특징피크 추출부; 및A feature peak extracting unit extracting a peak having an energy greater than a predetermined threshold among the spectral peaks of the recognition sound as a feature peak; And 상기 추출된 특징 피크가 상기 인식대상 음향의 스펙트럼에서 위치한 피크 대역을 나타내는 특징정보를 생성하는 특징정보 생성부를 포함하는 것을 특징으로 하는 스펙트럼 피크를 이용한 음향 인식 시스템.And a feature information generator configured to generate feature information indicating a peak band in which the extracted feature peak is located in the spectrum of the sound to be recognized. 제2항에 있어서,The method of claim 2, 상기 특징정보 생성부는, 인식대상 음향들의 특징 피크가 위치한 대역들 간에 중첩 대역이 있는 경우 상기 중첩 대역을 제외한 대역을 상기 인식대상 음향의 상기 피크 대역으로 하여 상기 특징정보를 생성하는 것을 특징으로 하는 스펙트럼 피크를 이용한 음향 인식 시스템.The feature information generator, when there is an overlap band between bands in which feature peaks of recognition sounds are located, generates the feature information by setting a band except the overlap band as the peak band of the recognition sound. Acoustic Recognition System Using Peaks. 제1항에 있어서,The method of claim 1, 상기 음향 인식부는,The sound recognition unit, 상기 입력 음향의 스펙트럼에서, 상기 등록 음향의 상기 피크 대역에 대응하는 대응 대역 및 상기 대응 대역을 제외한 비대응 대역의 평균에너지를 산출하는 평균에너지 산출부; 및An average energy calculator configured to calculate an average energy of a corresponding band corresponding to the peak band of the registered sound and a non-compliant band except the corresponding band in the spectrum of the input sound; And 상기 대응 대역 및 상기 비대응 대역 간의 평균에너지 비를 이용하여 상기 등록 음향 및 상기 입력 음향 간 스펙트럼 유사도를 측정하는 유사도 측정부를 포함하는 것을 특징으로 하는 스펙트럼 피크를 이용한 음향 인식 시스템.And a similarity measurer for measuring the spectral similarity between the registered sound and the input sound using an average energy ratio between the corresponding band and the non-compliant band. 제4항에 있어서,The method of claim 4, wherein 상기 유사도 측정부는, 상기 비대응 대역에 대한 상기 대응 대역의 평균에너지 비를 나타내는 PDR(Peak Domination Ratio) 값을 이용하여 상기 스펙트럼 유사도를 측정하는 것을 특징으로 하는 스펙트럼 피크를 이용한 음향 인식 시스템.And the similarity measurer measures the spectral similarity using a peak domination ratio (PDR) value representing an average energy ratio of the corresponding band to the non-compliant band. 제5항에 있어서,The method of claim 5, 상기 유사도 측정부는, 상기 등록 음향의 스펙트럼에서 상기 피크 대역 이외의 밸리 대역에 대한 상기 피크 대역의 평균에너지 비에 의해 상기 PDR 값을 정규 화한 NPDR(Normalized PDR) 값을 이용하여 상기 스펙트럼 유사도를 측정하는 것을 특징으로 하는 스펙트럼 피크를 이용한 음향 인식 시스템.The similarity measuring unit measures the spectral similarity using a normalized PDR (NPDR) value in which the PDR value is normalized by an average energy ratio of the peak band to a valley band other than the peak band in the spectrum of the registered sound. A sound recognition system using spectral peaks, characterized in that. 제5항에 있어서,The method of claim 5, 상기 음향 인식부는, 상기 PDR 값이 미리 결정된 임계값보다 큰 경우 상기 입력 음향을 상기 등록 음향으로 인식하는 것을 특징으로 하는 스펙트럼 피크를 이용한 음향 인식 시스템.And the sound recognition unit recognizes the input sound as the registered sound when the PDR value is larger than a predetermined threshold value. 제7항에 있어서,The method of claim 7, wherein 상기 음향 인식부는, 상기 음향 등록부에 의한 등록 음향들에 대하여 상기 PDR 값을 산출하고, 상기 산출된 PDR 값 중 최대 PDR 값이 상기 임계값보다 큰 경우 상기 입력 음향을 상기 최대 PDR 값에 대응하는 등록 음향으로 인식하는 것을 특징으로 하는 스펙트럼 피크를 이용한 음향 인식 시스템.The sound recognition unit calculates the PDR value for the registered sounds by the sound registration unit, and registers the input sound corresponding to the maximum PDR value when the maximum PDR value among the calculated PDR values is greater than the threshold value. An acoustic recognition system using spectral peaks, characterized in that the recognition by sound. 음향 인식 시스템(sound recognition system)에서 음향 스펙트럼의 피크(peak)를 이용하여 상기 시스템에 입력되는 입력 음향을 인식하는 방법에 있어서,In a method of recognizing an input sound input to the system using a peak of the sound spectrum in a sound recognition system, 인식대상 음향의 스펙트럼에서 특징 피크가 위치한 피크 대역을 획득하여 상기 인식대상 음향을 등록하는 등록 단계; 및Registering the sound to be acquired by acquiring a peak band in which a feature peak is located in a spectrum of the sound to be recognized; And 입력 음향의 스펙트럼에서 상기 등록 음향의 상기 피크 대역에 대응하는 대응 대역 및 상기 대응 대역을 제외한 비대응 대역의 평균에너지를 이용하여 상기 입력 음향을 상기 등록 음향으로 인식하거나 인식 거부하는 인식 단계를 포함하고,A recognition step of recognizing or rejecting the input sound as the registered sound using an average energy of a corresponding band corresponding to the peak band of the registered sound in the spectrum of the input sound and a non-corresponding band except the corresponding band; , 상기 등록 단계는 상기 인식대상 음향의 특징 피크들의 중첩 대역을 제외함으로써 동시 발생하는 다중 음향들 각각을 인식하는 것을 특징으로 하는 스펙트럼 피크를 이용한 음향 인식 방법.And the registering step recognizes each of the multiple sounds simultaneously generated by excluding overlapping bands of the feature peaks of the recognition target sound. 제9항에 있어서,10. The method of claim 9, 상기 등록 단계는,The registration step, 상기 인식대상 음향의 스펙트럼 피크들 중 미리 결정된 문턱값(threshold)보다 큰 에너지를 지니는 피크를 특징 피크로 추출하는 단계; 및Extracting, as a characteristic peak, a peak having an energy larger than a predetermined threshold among spectral peaks of the recognition sound; And 상기 추출된 특징 피크가 상기 인식대상 음향의 스펙트럼에서 위치한 피크 대역을 나타내는 특징정보를 생성하는 단계를 포함하는 것을 특징으로 하는 스펙트럼 피크를 이용한 음향 인식 방법.And generating feature information indicating a peak band in which the extracted feature peaks are located in the spectrum of the recognition target sound. 제10항에 있어서,The method of claim 10, 상기 특징정보 생성 단계는, 인식대상 음향들의 특징 피크가 위치한 대역들 간에 중첩 대역이 있는 경우 상기 중첩 대역을 제외한 대역을 상기 인식대상 음향의 상기 피크 대역으로 하여 상기 특징정보를 생성하는 단계인 것을 특징으로 하는 스펙트럼 피크를 이용한 음향 인식 방법.The generating of the characteristic information may include generating the characteristic information by using a band except the overlapping band as the peak band of the recognition target sound when there is an overlapping band between bands in which feature peaks of the recognition target sounds are located. A sound recognition method using spectral peaks. 제9항에 있어서,10. The method of claim 9, 상기 인식 단계는,The recognition step, 상기 입력 음향의 스펙트럼에서, 상기 등록 음향의 상기 피크 대역에 대응하는 대응 대역 및 상기 대응 대역을 제외한 비대응 대역의 평균에너지를 산출하는 단계; 및Calculating an average energy of a corresponding band corresponding to the peak band of the registered sound and a non-corresponding band excluding the corresponding band from the spectrum of the input sound; And 상기 대응 대역 및 상기 비대응 대역 간의 평균에너지 비를 이용하여 상기 등록 음향 및 상기 입력 음향 간 스펙트럼 유사도를 측정하는 단계를 포함하는 것을 특징으로 하는 스펙트럼 피크를 이용한 음향 인식 방법.And measuring spectral similarity between the registered sound and the input sound using an average energy ratio between the corresponding band and the non-compliant band. 제12항에 있어서,The method of claim 12, 상기 유사도 측정 단계는, 상기 비대응 대역에 대한 상기 대응 대역의 평균에너지 비를 나타내는 PDR(Peak Domination Ratio) 값을 이용하여 상기 스펙트럼 유사도를 측정하는 단계인 것을 특징으로 하는 스펙트럼 피크를 이용한 음향 인식 방법.The measuring similarity may include measuring the spectral similarity using a peak domination ratio (PDR) value representing an average energy ratio of the corresponding band to the non-compliant band. . 제13항에 있어서,The method of claim 13, 상기 유사도 측정 단계는, 상기 등록 음향의 스펙트럼에서 상기 피크 대역 이외의 밸리 대역에 대한 상기 피크 대역의 평균에너지 비에 의해 상기 PDR 값을 정규화한 NPDR(Normalized PDR) 값을 이용하여 상기 스펙트럼 유사도를 측정하는 단계인 것을 특징으로 하는 스펙트럼 피크를 이용한 음향 인식 방법.In the similarity measuring step, the spectral similarity is measured using a normalized PDR (NPDR) value in which the PDR value is normalized by an average energy ratio of the peak band to a valley band other than the peak band in the spectrum of the registered sound. Sound recognition method using a spectral peak, characterized in that the step of. 제13항에 있어서,The method of claim 13, 상기 인식 단계는, 상기 PDR 값이 미리 결정된 임계값보다 큰 경우 상기 입력 음향을 상기 등록 음향으로 인식하는 단계인 것을 특징으로 하는 스펙트럼 피크를 이용한 음향 인식 방법.And the recognizing step is recognizing the input sound as the registered sound when the PDR value is larger than a predetermined threshold. 제15항에 있어서,The method of claim 15, 상기 인식 단계는, 상기 등록 단계에 의한 등록 음향들에 대하여 상기 PDR 값을 산출하고, 상기 산출된 PDR 값 중 최대 PDR 값이 상기 임계값보다 큰 경우 상기 입력 음향을 상기 최대 PDR 값에 대응하는 등록 음향으로 인식하는 단계인 것을 특징으로 하는 스펙트럼 피크를 이용한 음향 인식 방법.In the recognizing step, the PDR value is calculated for the registered sounds according to the registration step, and when the maximum PDR value among the calculated PDR values is greater than the threshold value, the input sound corresponds to the maximum PDR value. A sound recognition method using spectral peaks, characterized in that the step of recognizing the sound. 음향 인식 시스템(sound recognition system)에서 사전 등록된 등록 음향 및 상기 시스템에 입력되는 입력 음향 간 주파수 스펙트럼의 유사도(similarity)를 측정하는 방법에 있어서,A method for measuring the similarity (similarity) of a frequency spectrum between a registered sound registered in advance in a sound recognition system and an input sound input to the system, 상기 입력 음향의 스펙트럼에서, 상기 등록 음향의 스펙트럼 상 특징 피크가 위치한 피크 대역에 대응하는 대응 대역 및 상기 대응 대역을 제외한 비대응 대역의 평균에너지를 산출하는 단계; 및Calculating an average energy of a corresponding band corresponding to the peak band in which the characteristic peak of the registered sound is located in the spectrum of the input sound and a non-corresponding band excluding the corresponding band; And 상기 대응 대역 및 상기 비대응 대역 간의 평균에너지 비를 이용하여 상기 등록 음향 및 상기 입력 음향 간 스펙트럼 유사도를 측정하는 단계를 포함하고,Measuring a spectral similarity between the registered sound and the input sound using an average energy ratio between the corresponding band and the non-compliant band, 상기 등록 음향의 스펙트럼은 동시 발생하는 다중 음향들의 특징 피크들 간의 중첩 대역이 제외된 스펙트럼인 것을 특징으로 하는 음향 스펙트럼 유사도 측정 방법.The spectrum of the registered sound is a spectrum spectral similarity measurement method, characterized in that the spectrum except the overlapping band between the characteristic peaks of the multiple sounds occurring at the same time. 제17항에 있어서,The method of claim 17, 상기 유사도 측정 단계는, 상기 비대응 대역에 대한 상기 대응 대역의 평균에너지 비를 나타내는 PDR(Peak Domination Ratio) 값을 이용하여 상기 스펙트럼 유사도를 측정하는 단계인 것을 특징으로 하는 음향 스펙트럼 유사도 측정 방법.The similarity measuring step is measuring the spectral similarity by using a peak domination ratio (PDR) value representing the average energy ratio of the corresponding band to the non-corresponding band. 제18항에 있어서,The method of claim 18, 상기 유사도 측정 단계는, 상기 등록 음향의 스펙트럼에서 상기 피크 대역 이외의 밸리 대역에 대한 상기 피크 대역의 평균에너지 비에 의해 상기 PDR 값을 정규화한 NPDR(Normalized PDR) 값을 이용하여 상기 스펙트럼 유사도를 측정하는 단계인 것을 특징으로 하는 음향 스펙트럼 유사도 측정 방법.In the similarity measuring step, the spectral similarity is measured using a normalized PDR (NPDR) value in which the PDR value is normalized by an average energy ratio of the peak band to a valley band other than the peak band in the spectrum of the registered sound. A method of measuring acoustic spectral similarity, characterized in that the step of. 제9항 내지 제19항 중 어느 한 항에 따른 방법을 컴퓨터로 실행하기 위한 프로그램이 기록된 컴퓨터 판독가능 기록매체.A computer-readable recording medium having recorded thereon a program for executing a method according to any one of claims 9 to 19 with a computer.
KR1020090031511A 2009-04-10 2009-04-10 System and method for sound recognition using spectral peak, and method for measuring sound spectral similarity used thereto KR101022516B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090031511A KR101022516B1 (en) 2009-04-10 2009-04-10 System and method for sound recognition using spectral peak, and method for measuring sound spectral similarity used thereto

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090031511A KR101022516B1 (en) 2009-04-10 2009-04-10 System and method for sound recognition using spectral peak, and method for measuring sound spectral similarity used thereto

Publications (2)

Publication Number Publication Date
KR20100112957A KR20100112957A (en) 2010-10-20
KR101022516B1 true KR101022516B1 (en) 2011-03-16

Family

ID=43132716

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090031511A KR101022516B1 (en) 2009-04-10 2009-04-10 System and method for sound recognition using spectral peak, and method for measuring sound spectral similarity used thereto

Country Status (1)

Country Link
KR (1) KR101022516B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101270074B1 (en) 2011-05-31 2013-05-31 삼성에스디에스 주식회사 Apparatus and method for recognizing situation by audio-visual space map

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101523696B1 (en) * 2014-12-22 2015-05-28 세종대학교산학협력단 System and method for analyzing of pavement damages using impact sound, and record media recorded program for implement thereof

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070069631A (en) * 2005-12-28 2007-07-03 삼성전자주식회사 Method of segmenting phoneme in a vocal signal and the system thereof
KR20080022558A (en) * 2008-02-14 2008-03-11 (주) 펄스피어 Apparatus and method for detecting a crashing sound and rhythm

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070069631A (en) * 2005-12-28 2007-07-03 삼성전자주식회사 Method of segmenting phoneme in a vocal signal and the system thereof
KR20080022558A (en) * 2008-02-14 2008-03-11 (주) 펄스피어 Apparatus and method for detecting a crashing sound and rhythm

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101270074B1 (en) 2011-05-31 2013-05-31 삼성에스디에스 주식회사 Apparatus and method for recognizing situation by audio-visual space map

Also Published As

Publication number Publication date
KR20100112957A (en) 2010-10-20

Similar Documents

Publication Publication Date Title
CN106486131B (en) A kind of method and device of speech de-noising
US8428945B2 (en) Acoustic signal classification system
Reynolds An overview of automatic speaker recognition technology
US20160111112A1 (en) Speaker change detection device and speaker change detection method
US9959886B2 (en) Spectral comb voice activity detection
CN112712809B (en) Voice detection method and device, electronic equipment and storage medium
CA2492204A1 (en) Similar speaking recognition method and system using linear and nonlinear feature extraction
CN113823293B (en) Speaker recognition method and system based on voice enhancement
KR101022519B1 (en) System and method for voice activity detection using vowel characteristic, and method for measuring sound spectral similarity used thereto
Yoo et al. Automatic sound recognition for the hearing impaired
Yoo et al. Robust voice activity detection using the spectral peaks of vowel sounds
JP2016095434A (en) Notification sound detection/identification device, notification sound detection/identification method, and notification sound detection/identification program
KR101022516B1 (en) System and method for sound recognition using spectral peak, and method for measuring sound spectral similarity used thereto
Singh et al. Linear Prediction Residual based Short-term Cepstral Features for Replay Attacks Detection.
Chen et al. InQSS: a speech intelligibility assessment model using a multi-task learning network
Alex et al. Variational autoencoder for prosody‐based speaker recognition
CN116312561A (en) Method, system and device for voice print recognition, authentication, noise reduction and voice enhancement of personnel in power dispatching system
Dov et al. Voice activity detection in presence of transients using the scattering transform
Araki et al. Speaker indexing and speech enhancement in real meetings/conversations
McLoughlin The use of low-frequency ultrasound for voice activity detection
CN114512133A (en) Sound object recognition method, sound object recognition device, server and storage medium
CN106887229A (en) A kind of method and system for lifting the Application on Voiceprint Recognition degree of accuracy
Lee et al. Space-time voice activity detection
JP2015087557A (en) Utterance mode detection device, and utterance mode detection method
McLoughlin et al. Low frequency ultrasonic voice activity detection using convolutional neural networks

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140120

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150108

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee