KR100952894B1 - 음향 판정 방법 및 음향 판정 장치 - Google Patents

음향 판정 방법 및 음향 판정 장치 Download PDF

Info

Publication number
KR100952894B1
KR100952894B1 KR1020070122628A KR20070122628A KR100952894B1 KR 100952894 B1 KR100952894 B1 KR 100952894B1 KR 1020070122628 A KR1020070122628 A KR 1020070122628A KR 20070122628 A KR20070122628 A KR 20070122628A KR 100952894 B1 KR100952894 B1 KR 100952894B1
Authority
KR
South Korea
Prior art keywords
sound
signal
frequency
acoustic
determination
Prior art date
Application number
KR1020070122628A
Other languages
English (en)
Other versions
KR20080071479A (ko
Inventor
쇼지 하야카와
Original Assignee
후지쯔 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후지쯔 가부시끼가이샤 filed Critical 후지쯔 가부시끼가이샤
Publication of KR20080071479A publication Critical patent/KR20080071479A/ko
Application granted granted Critical
Publication of KR100952894B1 publication Critical patent/KR100952894B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Telephone Function (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

근방 음원으로부터의 음향 신호를 고정밀도로 특정하는 음향 판정 방법, 음향 판정 장치 및 컴퓨터 프로그램을 제공한다. 음향 판정 장치(1)는, 복수의 음향 접수부에서, 각각 음향 신호를 받아들여(S101), 소정 시간 길이의 프레임을 생성한다(S103). 음향 판정 장치(1)는, 프레임 단위의 음향 신호를 FFT 처리하여 주파수 축상의 신호인 위상 스펙트럼 및 진폭 스펙트럼으로 변환하고(S104), 각 음향 신호간의 주파수마다의 위상 스펙트럼의 차를 위상차로서 산출하며(S106), 처리의 대상으로 하는 주파수를 선택한다(S107). 음향 판정 장치(1)는, 선택한 주파수의 위상차의 절대치가, 제 1 역치 이상인 주파수의 비율을 산출하며(S111), 산출한 비율이 제 2 역치 이하인 경우(S112: YES), 해당 프레임에 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정한다(S113).
Figure R1020070122628
근방 음원, 음향 신호, 프레임, FFT 처리, 위상 스펙트럼, 진폭 스펙트럼, 위상차, 절대치, 역치

Description

음향 판정 방법 및 음향 판정 장치{SOUND DETERMINATION METHOD AND SOUND DETERMINATION APPARATUS}
본 발명은, 복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 음향 신호에 근거해서, 특정 음향 신호의 유무를 판정하는 음향 판정 방법 및 이 음향 판정 방법을 적용한 음향 판정 장치에 관한 것이며, 특히 음향 접수 수단으로부터 최근방의 음원으로부터의 음향 신호를 특정하기 위한 음향 판정 방법 및 음향 판정 장치에 관한 것이다.
요즘의 컴퓨터 기술의 발전에 의해, 대량의 연산 처리를 요구하는 음향 신호 처리이더라도 실용적인 처리 속도로 실행할 수 있게 되어 왔다. 이와 같은 정보로부터, 복수의 마이크로 폰을 이용한 멀티 채널의 음향 처리 기능의 실용화가 기대되고 있다. 그 한 예로서, 잡음 억제 기술이 있다. 잡음 억제 기술에서는, 목적으로 하는 음원, 예를 들면, 근방 음원으로부터의 음을 특정하여, 입사각 또는 입사각으로부터 결정되는 각각의 마이크로 폰으로의 음의 도달 시간차를 변수로 한 동기(同期) 가산, 동기 감산 등의 연산에 의해, 특정 음원으로부터의 음을 강조하고, 또한 특정 음원 이외로부터의 음을 억압함으로써 목적으로 하는 음을 강조하 고, 다른 음을 억제한다. 그리고 목적으로 하는 근방 음원이 이동하고 있는 경우, 동기 가산에 의한 입사각을 변수로 한 파워 분포를 구하며, 그 분포 중에서 파워가 강한 각도에 음원이 있는 것으로 추정하며, 그 각도로부터의 음을 강조하며, 또한 그 각도 이외의 음을 억압하는 것이 일반적이다.
또한 목적의 근방 음원으로부터의 음이 연속해서 발생하지 않고 있는 경우, 미리 결정한 배경 잡음의 파워와 현재의 파워의 비(比) 또는 차(差)를 이용하여, 목적으로 하는 근방 음원으로부터의 음이 발생하고 있는 시간 구간을 검출하는 것이 일반적이다.
더욱이, 예를 들면, 미국 특허 제 6,243,322 호 명세서에서는, 동기 가산에 의해 구해지는 입사각을 변수로 하는 파워 분포의 피크 값과, 그 이외의 각도의 값의 비율로, 입사한 음이 목적으로 하는 근방(近方) 음원으로부터의 음인지 원방(遠方) 음원으로부터의 음인지를 판정하는 방법이 개시되어 있다.
그러나 동기 가산에 의한 입사각을 변수로 한 파워 분포는, 배경 잡음, 비정상 잡음 등의 잡음이 발생하고 있는 환경에 있어서, 복수의 피크가 출현하거나, 피크가 브로드(broad)화하기 때문에, 목적으로 하는 근방 음원을 특정하는 것이 곤란하다고 하는 문제가 있다.
또한 목적으로 하는 근방 음원으로부터의 음이 연속적으로 일정의 강도로 발생하고 있지 않은 경우, 배경 잡음에 의해 피크가 무딘 파워 분포로 되기 때문에, 목적의 음원으로부터의 음이 발생하고 있는 시간 구간의 검출이 더더욱 곤란해진다고 하는 문제가 있다.
더욱이, 예를 들면, 미국 특허 제 6,243,322 호 명세서에 개시된 방법으로는, S/N비가 나쁜 대역을 포함하는 전(全) 대역을 사용하기 때문에, 잡음 환경하에 있어서, 근방 음원으로부터의 음이 도래(到來)하는 각도에 있어서의 피크가 무디어져 정확하게 근방 음원으로부터 도래하는 음을 판정하는 것이 곤란하다고 하는 문제가 있다.
본 발명은 이와 같은 사정을 감안하여 안출된 것으로, 복수의 마이크로 폰이 받아들인 각각의 음향 신호의 위상차를 산출하며, 산출한 위상차가 소정의 역치 이하인 경우에, 특정 대상이 되는 최근방의 음향 신호를 포함하는 것으로 판정함으로써, 잡음 환경하에서도 목적으로 하는 음원으로부터의 음의 발생 구간을 용이하게 특정하는 것이 가능한 음향 판정 방법 및 이 음향 판정 방법을 적용한 음향 판정 장치의 제공을 주요 목적으로 한다.
또한 본 발명에서는, S/N비가 소정의 역치 이하인 경우, 목적으로 하는 음원으로부터의 음향 신호를 포함하지 않는 것으로 판단함으로써, 목적으로 하는 음원으로부터의 음의 발생 구간을 특정하는 정밀도를 향상시키는 음향 판정 장치 등의 제공을 다른 목적으로 한다.
또한 본 발명에서는, S/N비, 배경 잡음, 필터 특성, 음성 특성 등의 요인에 따라서 판정에 이용하는 주파수를 취사 선택함으로써, 목적으로 하는 음원으로부터의 음의 발생 구간을 특정하는 정밀도를 향상시키는 음향 판정 장치 등의 제공을 또 다른 목적으로 한다.
제 1 발명에 따른 음향 판정 방법은, 복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 아날로그 음향 신호에 근거하여, 특정 음향 신호의 유무를 판정하는 음향 판정 장치를 이용한 음향 판정 방법에 있어서, 상기 음향 판정 장치 는 각 음향 접수 수단이 받아들인 각각의 음향 신호를 디지털 신호로 변환하며, 디지털 신호로 변환한 각각의 음향 신호를 주파수 축상의 신호로 변환하며, 주파수 축상의 신호로 변환한 각 음향 신호간의 주파수마다의 위상차를 산출하며, 산출한 위상차가 소정의 역치 이하인 경우에, 음향 접수 수단으로부터 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정하며, 판정한 결과에 근거한 출력을 행하는 것을 특징으로 한다.
제 2 발명에 따른 음향 판정 장치는, 복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 아날로그 음향 신호에 근거해서, 특정 음향 신호의 유무를 판정하는 음향 판정 장치에 있어서, 각 음향 접수 수단이 받아들인 각각의 음향 신호를 디지털 신호로 변환하는 수단과, 디지털 신호로 변환한 각각의 음향 신호를 주파수 축상의 신호로 변환하는 수단과, 주파수 축상의 신호로 변환한 각 음향 신호간의 주파수마다의 위상 성분의 차를 위상차로서 산출하는 수단과, 산출한 위상차가 소정의 역치 이하인 경우에, 특정 대상이 되는 음향 신호를 포함하는 것으로 판정하는 판정 수단과, 판정한 결과에 근거한 출력을 행하는 수단을 구비하는 것을 특징으로 한다.
제 3 발명에 따른 음향 판정 장치는, 복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 아날로그 음향 신호에 근거해서, 상기 음향 접수 수단으로부터 최근방의 음원으로부터의 음향 신호의 유무를 판정하는 음향 판정 장치에 있어서, 각 음향 접수 수단이 받아들인 각각의 음향 신호를 디지털 신호로 변환하는 수단과, 디지털 신호로 변환한 각각의 음향 신호로부터 소정 시간 길이의 프레임을 각각 생성하는 수단과, 생성한 프레임 단위의 각 음향 신호를 주파수 축상의 신호로 각각 변환하는 수단과 주파수 축상의 신호로 변환한 각 음향 신호간의 주파수마다의 위상 성분의 차를 위상차로서 산출하는 수단과, 산출한 위상차가 제 1 역치 이상으로 되는 주파수의 비율 또는 수가, 제 2 역치 이하인 경우, 생성한 프레임에 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정하는 판정 수단을 구비하는 것을 특징으로 한다.
제 4 발명에 따른 음향 판정 장치는, 제 2 발명 또는, 제 3 발명에 있어서, 주파수 축상의 신호로 변환한 음향 신호의 진폭 성분에 근거해서, 신호 대(對) 잡음비를 산출하는 수단을 더 구비하며, 상기 판정 수단은, 산출한 신호 대 잡음비가 소정의 역치 이하인 경우, 위상차에 상관없이, 특정 대상으로 되는 음향 신호를 포함하지 않는 것으로 판정하도록 구성하고 있는 것을 특징으로 한다.
제 5 발명에 따른 음향 판정 장치는, 제 2 발명 내지 제 4 발명의 어느 하나에 있어서, 상기 복수의 음향 접수 수단은, 각각의 상대 위치를 변경 가능하게 구성하고 있으며, 상기 복수의 음향 접수 수단간의 거리에 근거해서, 상기 판정 수단의 판정에 이용하는 역치를 산출하는 수단을 더 구비하는 것을 특징으로 한다.
제 6 발명에 따른 음향 판정 장치는, 제 2 발명 내지 제 5 발명의 어느 하나에 있어서, 주파수 축상의 신호로 변환한 음향 신호의 진폭 성분에 근거한 주파수마다의 신호 대 잡음비에 근거해서, 상기 판정 수단의 판정에 이용하는 주파수를 선택하는 선택 수단을 더 구비하는 것을 특징으로 한다.
제 7 발명에 따른 음향 판정 장치는, 제 2 발명 내지 제 6 발명의 어느 하나 에 있어서, 알리아싱 오차(aliasing error)를 방지하도록 디지털 신호로 변환하기 전의 음향 신호를 여파(濾波)하는 안티 알리아싱(anti-aliasing) 필터를 더 구비하며, 상기 판정 수단은, 상기 안티 알리아싱 필터의 특성에 근거한 소정의 주파수보다 높은 주파수를 판정에 이용하는 주파수로부터 제외하도록 구성하고 있는 것을 특징으로 한다.
제 8 발명에 따른 음향 판정 장치는, 제 2 발명 내지 제 7 발명의 어느 하나에 있어서, 음성인 음향 신호를 특정하는 경우에, 주파수 축상의 신호로 변환한 음향 신호의 진폭 성분이 극소치를 취하는 주파수, 또는, 진폭 성분에 근거한 신호 대 잡음비가 극소치를 취하는 주파수를 검출하는 수단을 더 구비하며, 상기 판정 수단은, 검출한 주파수를 판정에 이용하는 주파수로부터 제외하도록 구성하고 있는 것을 특징으로 한다.
제 9 발명에 따른 음향 판정 장치는, 제 2 발명 내지 제 8 발명의 어느 하나에 있어서, 음성인 음향 신호를 특정하는 경우에, 상기 판정 수단은, 음성에 관련하는 기본 주파수가 존재하지 않는 주파수를 판정에 이용하는 주파수로부터 제외하도록 구성하고 있는 것을 특징으로 한다.
제 1 발명, 제 2 발명 및 제 3 발명에서는, 목적으로 하는 최근방의 음원으로부터의 음향 신호는, 반사파 및 회절파로서 혼입하기 어렵고 위상차가 작아지는 것으로부터, 위상차가 소정의 역치 이하인 경우에, 목적으로 하는 음원으로부터의 음향 신호를 포함하는 것으로 판단하는 것이 가능하다. 게다가 배경 잡음 등의 원방으로부터의 잡음은, 위상차가 크기때문에, 잡음 환경하에서도 목적으로 하는 음 원으로부터의 음향 신호가 발생하고 있는 구간을 용이하게 특정하는 것이 가능하다.
제 4 발명에서는, 신호 대 잡음비(S/N비)가 소정의 역치 이하인 경우, 목적으로 하는 음원으로부터의 음향 신호를 포함하지 않는 것으로 판단함으로써, 예를 들면, 배경 잡음의 위상차가 우연히 일치해졌을 경우의 오판정을 회피하는 것이 가능하므로, 특정 정밀도를 향상시키는 것이 가능하다.
제 5 발명에서는, 음향 접수 수단의 상대 위치가 변경 가능한 구성이더라도 역치를 동적으로 변경함으로써, 최적한 역치를 설정하며, 목적으로 하는 음원으로부터의 음향 신호의 특정 정밀도를 향상시키는 것이 가능하다.
제 6 발명에서는, 신호 대 잡음비가 낮은 주파수대를 제외함으로써, 목적으로 하는 음원으로부터의 음향 신호의 특정 정밀도를 향상시키는 것이 가능하다.
제 7 발명에서는, 안티 알리아싱 필터의 영향이 위상차의 동요로서 발현하는, 예를 들면, 표본화 주파수 8000 Hz에서 샘플링한 경우의 3300 Hz 이상의 주파수대를 제외함으로써, 목적으로 하는 음원으로부터의 음향 신호의 특정 정밀도를 향상시키는 것이 가능하다.
제 8 발명에서는, 진폭 성분이 극소치를 취하는 주파수에서의 위상차가 동요하기 쉽다고 하는 음성의 특성을 고려하여, 해당 주파수를 판정에서 제외함으로써, 목적으로 하는 음원으로부터의 음향 신호의 특정 정밀도를 향상시키는 것이 가능하다.
제 9 발명에서는, 음성의 주파수 특성에 따라서 음성 스펙트럼이 존재하지 않는 주파수 이하를 위상차의 판정에서 제외함으로써, 목적으로 하는 음원으로부터의 음향 신호의 특정 정밀도를 향상시키는 것이 가능하다.
제 1 발명, 제 2 발명 및 제 3 발명에 따른 음향 판정 방법 및 음향 판정 장치는, 마이크로 폰 등의 복수의 음향 접수 수단이 받아들인 각각의 음향 신호를 주파수 축상의 신호로 변환하며, 각각의 음향 신호의 위상차를 산출하고, 산출한 위상차가 소정의 역치 이하인 경우에, 특정 대상으로 되는 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정한다.
복수의 음원으로부터의 음향 신호를 받아들이는 경우, 일반적으로, 음원과 음향 접수 수단의 거리가 길수록, 음원으로부터 음향 접수 수단까지 직접 도달하는 직접파에, 벽 등의 물체에 반사해서 음향 접수 수단에 도달하는 반사파 및 회절하여 음향 접수 수단에 도달하는 회절파가 혼입하기 쉬워진다. 직접파와 비교해 반사파 및 회절파는, 도달까지의 경로 길이가 길기 때문에, 반사파 및 회절파가 혼입한 음향 신호를 주파수 축상으로 변환한 경우, 경로에 따라서 여러가지 입사각으로 도래하기 때문에 위상차 스펙트럼의 값이 안정되지 않고, 편차가 커진다. 또한 목적으로 하는 음원이 최근방의 음원인 경우, 최근방의 음원으로부터의 음향 신호는, 반사파 및 회절파가 혼입하기 어렵고 위상차 스펙트럼이 직선상으로 늘어서게 되어, 편차가 적게 된다. 따라서, 본 발명에서는, 위에서 기술한 구성에 의해 위상차가 소정의 역치 이하인 경우에 목적으로 하는 음원으로부터의 음향 신호를 포함하는 것으로 판단하는 것이 가능하며, 게다가 배경 잡음 등의 원방으로부터의 잡음은, 위상차가 크기 때문에 잡음 환경하에서도 목적으로 하는 음원으로부터의 음향 신호를 용이하게 특정하고, 잡음을 억압하는 것이 가능한 것 등, 우수한 효과를 가져온다.
제 4 발명에 따른 음향 판정 장치 등은, 신호 대 잡음비가 소정의 역치 이하인 경우, 위상차에 관여하지 않고 특정 대상으로 되는 음향 신호를 포함하지 않는 것으로 판정함으로써, 예를 들면, 배경 잡음의 위상차가 우연히 일치해진 상황에서의 오판정을 회피하는 것이 가능하므로, 특정 정밀도를 향상시키는 것이 가능한 것 등, 우수한 효과를 가져온다.
제 5 발명에 따른 음향 판정 장치 등은, 음향 접수 수단의 상대 위치가 변경 가능한 경우에, 음향 접수 수단간의 거리에 근거해서, 역치를 산출하고, 산출한 역치로 설정을 동적으로 변경함으로써, 역치를 항상 최적화하며, 목적으로 하는 음원으로부터의 음향 신호의 특정 정밀도를 향상시키는 것이 가능한 것 등, 우수한 효과를 가져온다.
제 6 발명에 따른 음향 판정 장치 등은, 신호 대 잡음비가 낮은 주파수대를 제외하고 판정을 행함으로써, 목적으로 하는 음원으로부터의 음향 신호의 특정 정밀도를 향상시키는 것이 가능한 것 등, 우수한 효과를 가져온다.
제 7 발명에 따른 음향 판정 장치 등은, 디지털 신호로 변환한 음향 신호의 알리아싱 오차를 제거하는 안티 알리아싱 필터 등의 필터의 특성에 근거해, 필터의 영향이 현저해지는, 예를 들면, 표본화 주파수 8000 Hz에서 샘플링한 경우, 3300 Hz 이상의 주파수대를 제외하여 판정을 행함으로써, 목적으로 하는 음원으로부터의 음향 신호의 특정 정밀도를 향상시키는 것이 가능한 것 등, 우수한 효과를 가져온 다.
제 8 발명에 따른 음향 판정 장치 등은, 음성인 음향 신호를 특정하는 경우에, 진폭 성분이 극소치를 취하는 주파수에서의 위상차가 동요하기 쉽다고 하는 음성의 특성을 고려하여, 해당 주파수를 제외하여 판정함으로써, 목적으로 하는 음원으로부터의 음향 신호의 특정 정밀도를 향상시키는 것이 가능한 것 등, 우수한 효과를 가져온다.
제 9 발명에서는, 음성인 음향 신호를 특정하는 경우에, 음성의 주파수 특성에 따라서, 음성 스펙트럼이 존재하지 않는 기본 주파수 이하의 주파수대를 제외하여 위상차를 판정함으로써, 목적으로 하는 음원으로부터의 음향 신호의 특정 정밀도를 향상시키는 것이 가능한 것 등, 우수한 효과를 가져온다.
복수의 마이크로 폰이 받아들인 각각의 음향 신호의 위상차를 산출하며, 산출한 위상차가 소정의 역치 이하인 경우에, 특정 대상이 되는 최근방의 음향 신호를 포함하는 것으로 판정함으로써, 잡음 환경하에서도 목적으로 하는 음원으로부터의 음의 발생 구간을 용이하게 특정하는 것이 가능한 음향 판정 방법 및 이 음향 판정 방법을 적용한 음향 판정 장치가 제공된다.
이하, 본 발명을 그 실시 형태를 나타내는 도면에 근거해서, 상술한다. 또한 본 실시 형태에서는, 처리 대상의 음향 신호가 주로 인간이 발하는 음성인 경우에 대해서 설명한다.
《실시 형태 1》
도 1은 본 발명의 실시 형태 1에 따른 음향 판정 방법의 개요의 일례를 나타내는 설명도이다. 도 1 중의 1은, 휴대 전화에 적용한 본 발명의 음향 판정 장치이며, 음향 판정 장치(1)는, 사용자에 의해 소지되며, 사용자로부터 발생되는 음성을 음향 신호로서 받아들인다. 또한, 음향 판정 장치(1)는, 사용자가 발하는 음성 이외에도 다른 인물이 발하는 음성, 기계음, 음악 등의 여러가지 배경 잡음을 받아들인다. 그래서 본 발명의 음향 판정 장치(1)는, 복수의 음원으로부터 받아들이는 여러가지 음향 신호 중에서 특정 대상으로 되는 음향 신호를 특정하며, 특정한 음향 신호를 강조하며, 또한 이것 이외의 음향 신호를 억압함으로써 잡음의 억압 등의 처리를 행한다. 또한, 본 발명의 음향 판정 장치(1)가 목적으로 하는 음향 신호란, 음향 판정 장치(1)의 최근방의 음원으로부터의 음향 신호, 즉, 사용자로부터 발하여지는 음성이다.
도 2는 본 발명의 실시 형태 1에 따른 음향 판정 장치(1)의 하드웨어의 구성례를 나타내는 블럭도이다. 음향 판정 장치(1)는, 장치 전체를 제어하는 CPU 등의 제어부(10)와, 본 발명의 컴퓨터 프로그램(100) 등의 프로그램 및 각종 설정치 등의 데이터를 기록하는 ROM, RAM 등의 기록부(11)와, 통신 인터페이스로 되는 안테나 및 그 부속 기기 등의 통신부(12)를 구비하고 있다. 또한, 음향 판정 장치(1)는, 음향 신호를 받아들이는 마이크로 폰 등의 복수의 음향 접수부(13, 13, …)와, 스피커 등의 음향 출력부(14)와, 음향 접수부(13, 13, …) 및 음향 출력부(14)에 관련하는 음향 신호의 변환 처리를 행하는 음향 변환부(15)를 구비하고 있다. 음 향 변환부(15)에 의한 변환 처리란, 음향 출력부(14)로부터 출력해야하는 디지털 신호를 아날로그 신호로 변환하는 처리 및 음향 접수부(13, 13, …)로부터 받아들인 아날로그 신호인 음향 신호를 디지털 신호로 변환하는 처리이다. 또한, 음향 판정 장치(1)는, 영숫자(英數字) 및 각종 명령 등의 키 입력에 의한 조작을 받아들이는 조작부(16)와 각종 정보를 표시하는 액정 디스플레이 등의 표시부(17)를 구비하고 있다. 그리고 휴대 전화는, 본 발명의 컴퓨터 프로그램(100)에 포함되는 각종 순서를 제어부(10)에 의해 실행함으로써, 본 발명의 음향 판정 장치(1)로서 작동한다.
도 3은 본 발명의 실시 형태 1에 따른 음향 판정 장치(1)의 기능의 일례를 나타내는 기능 블럭도이다. 본 발명의 음향 판정 장치(1)는, 복수의 음향 접수부(13, 13)와, 아날로그 신호인 음향 신호를 디지털 신호로 변환한 때의 알리아싱 오차(aliasing error)를 방지하도록 LPF(Low Pass Filter)로서 기능하는 안티 알리아싱 필터(150)와, 아날로그 신호인 음향 신호를 디지털 신호로 A/D 변환하는 A/D 변환 수단(151)을 구비하고 있다. 안티 알리아싱 필터(150) 및 A/D 변환 수단(151)은, 음향 변환부(15)에서 실현되는 기능이다. 또한, 안티 알리아싱 필터(150) 및 A/D 변환 수단(151)은, 음향 변환부(15)로서 음향 판정 장치(1)에 내장하는 것이 아니라, 외부의 음향 픽업 디바이스에 실장하는 것도 가능하다.
또한 본 발명의 음향 판정 장치(1)는, 음향 신호로부터 처리의 단위로 되는 소정 시간 길이의 프레임을 생성하는 프레임 생성 수단(110)과 음향 신호를 FFT(고속 푸리에 변환: Fast Fourier Transformation) 처리로 주파수 축상의 신호로 변환 하는 FFT 변환 수단(111)과, 복수의 음향 접수부(13, 13)가 각각 받아들인 음향 신호간의 위상차를 산출하는 위상차 산출 수단(112)과, 음향 신호의 S/N비를 산출하는 S/N비 산출 수단(113)과, 처리의 대상으로 하는 주파수를 선택하는 선택 수단(114)과, 위상차가 큰 주파수를 계수(計數)하는 계수 수단(115)과, 목적으로 하는 최근방의 음원으로부터의 음향 신호를 특정하는 음향 판정 수단(116)과, 특정한 음향 신호에 근거해, 잡음 억압 등의 처리를 행하는 음향 처리 수단(117)을 구비하고 있다. 프레임 생성 수단(110), FFT 변환 수단(111), 위상차 산출 수단(112), 선택 수단(114), 계수 수단(115), 음향 판정 수단(116) 및 음향 처리 수단(117)은, 기록부(11) 내의 각종 컴퓨터 프로그램을 실행함으로써 실현되는 소프트웨어로서의 기능을 나타내고 있으나, 각종 처리 칩 등의 전용 하드웨어를 이용하여 실현하도록 해도 된다.
다음에 본 발명의 실시 형태 1에 따른 음향 판정 장치(1)의 처리에 대해서 설명한다. 또한 이하의 설명에 있어서, 음향 판정 장치(1)는, 두 음향 접수부(13, 13)를 구비하는 것으로서 설명한다. 단, 음향 접수부(13)는, 둘에 한정되는 것이 아니고, 셋 이상의 음향 접수부(13, 13, …)로서 실장하는 것도 가능하다. 도 4는, 본 발명의 실시 형태 1에 따른 음향 판정 장치(1)의 음향 판정 처리의 일례를 나타내는 흐름도이다. 음향 판정 장치(1)는, 컴퓨터 프로그램(100)을 실행하는 제어부(10)의 제어에 의해, 복수의 음향 접수부(13, 13)에서, 각각 음향 신호를 받아들여(S101), LPF인 안티 알리아싱 필터(150)에서 여파하며, A/D 변환 수단(151)에서, 아날로그 신호로서 받아들인 음향 신호를 8000 Hz 등의 주기로 표본화해서 디 지털 신호로 변환한다(S102).
그리고 음향 판정 장치(1)는, 제어부(10)의 제어에 근거한 프레임 생성 수단(110)의 처리에 의해, 디지털 신호로 변환한 음향 신호로부터 소정 시간 길이의 프레임을 생성한다(S103). 스텝 S103에서는, 음향 신호를, 예를 들면, 20 ms ~ 40 ms 정도의 소정 시간 길이의 단위로 프레임화한다. 또한 각 프레임은, 10 ms ~ 20 ms정도씩 오버랩하고 있다. 그리고 각 프레임에 대해서는, 해밍 창, 해닝 창 등의 창함수, 고역 강조 필터(high-pass accentuation filter)에 의한 필터링 등의 음성 인식의 분야에서 일반적인 프레임 처리가 행하여진다. 이와 같이 하여 생성된 각 프레임에 대해서, 이하의 처리가 행하여진다.
음향 판정 장치(1)는, 제어부(10)의 제어에 근거해서, FFT 변환 수단(111)의 처리에 의해, 프레임 단위의 음향 신호를 FFT 처리하여 주파수 축상의 신호인 위상 스펙트럼 및 진폭 스펙트럼으로 변환하고(S104), 주파수 축상의 신호로 변환한 프레임 단위의 음향 신호의 진폭 성분에 근거해서, S/N비(신호 대 잡음비)를 산출하는 S/N비 산출 처리를 개시하며(S105), 위상차 산출 수단(112)의 처리에 의해 각 음향 신호간의 주파수마다의 위상 스펙트럼의 차를 위상차로서 산출한다(S106). 스텝 S104에서는, 예를 들면, 256 점의 음향 신호 샘플에 대해서 FFT를 행하며, 128 점의 주파수의 각각에 대해서 위상 스펙트럼의 값의 차를 위상차로서 산출한다. 스텝 S105에서 개시되는 S/N비 산출 처리는, 스텝 S106 이후의 처리와 병행해서 실행된다. 또한 S/N비 산출 처리의 상세는, 뒤에서 기술한다.
그리고 음향 판정 장치(1)는, 제어부(10)의 제어에 근거한 선택 수단(114)의 처리에 의해, 각 주파수 중에서 처리의 대상으로 하는 주파수를 선택한다(S107). 스텝 S107에서는, 목적으로 하는 최근방의 음원으로부터의 음향 신호가 검출되기 쉽고, 배경 잡음 등의 외부 동요의 영향을 받기 어려운 주파수가 선택된다. 구체적으로는, 안티 알리아싱 필터(150)의 영향에 의해 위상차가 동요하기 쉬운 주파수대를 제외한다. 제외해야 하는 주파수대는, A/D 변환 수단(151)의 특성에 의해 다르나, 일반적으로 3300 ~ 3500 kHz 이상의 고역(高域)에서 위상차가 동요되기 쉽기 때문에, 예를 들면, 3300 Hz 이상의 주파수를 처리의 대상으로부터 제외한다. 또한 S/N비 산출 처리에 의해 산출된 주파수마다의 S/N비를 취득하며, 취득한 S/N비가 낮은 순서로 소정 개수의 주파수 또는, 미리 설정되어 있는 역치 이하의 주파수를 처리의 대상으로 하는 주파수로부터 제외한다. 또한 프레임별로 산출한 S/N비를 취득하여, 제외하는 주파수를 결정하는 것이 아니라, 미리 S/N비가 낮게 되기 쉬운 주파수를 제외하는 주파수로서 설정해 두도록 해도 된다. 스텝 S107의 처리에 의해, 처리의 대상으로 되는 주파수가, 예를 들면, 100 점으로 좁혀진다.
음향 판정 장치(1)는, 제어부(10)의 제어에 근거한 음향 판정 수단(116)의 처리에 의해, S/N비 산출 처리에 의해 산출된 S/N비를 취득하며(S108), 취득한 S/N비가 미리 설정되어 있는 제 0 역치 이상인가 아닌가를 판정한다(S109). 제 0 역치로서는, 예를 들면, 5 dB 등의 값이 이용된다. 스텝 S109에서 S/N비가 제 0 역치 이상인 경우, 목적으로 하는 최근방의 음원으로부터의 음향 신호가 포함되어 있을 가능성이 있는 것으로 판정하며, 제 0 역치 미만인 경우, 목적으로 하는 음향 신호가 포함되어 있지 않은 것으로 판정한다.
스텝 S109에 있어서, S/N비가 제 0 역치 이상인 것으로 판정한 경우(S109: YES), 음향 판정 장치(1)는, 제어부(10)의 제어에 근거한 음향 판정 수단(116)의 처리에 의해, 스텝 S107에서 선택한 주파수의 위상차의 절대치가, 미리 설정되어 있는 제 1 역치 이상인 주파수를 계수하며(S110), 계수 결과에 근거해서, 선택한 주파수에 대한 제 1 역치 이상으로 되는 주파수의 비율을 산출하며(S111), 산출한 비율이 미리 설정되어 있는 제 2 역치 이하인가 아닌가를 판정한다(S112). 제 1 역치로서는, 예를 들면, π/2 라디안(radian) 등의 값이 이용된다. 제 2 역치로서는, 예를 들면, 3 % 등의 값이 이용된다. 예를 들면, 선택된 주파수가 100 점인 경우, 위상차가 π/2 라디안 이상의 주파수가 3 점 이하인가 아닌가를 판정한다.
스텝 S112에 있어서, 산출한 비율이 미리 설정되어 있는 제 2 역치 이하인 경우(S112: YES), 음향 판정 장치(1)는, 제어부(10)의 제어에 근거한 음향 판정 수단(116)의 처리에 의해, 해당 프레임에 위상차가 작은 직접음에 의한 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정한다(S113). 그리고 음향 처리 수단(117)에서는, 스텝 S113의 판정 결과에 근거해서, 각종 음향 처리 및 음향 출력 처리를 실행한다.
스텝 S109에 있어서, S/N비가 제 0 역치 미만인 것으로 판정한 경우(S109: NO), 또는, 스텝 S112에 있어서, 산출한 비율이 미리 설정되어 있는 제 2 역치보다 큰 것으로 판정한 경우(S112: NO), 음향 판정 장치(1)는, 제어부(10)의 제어에 근거한 음향 판정 수단(116)의 처리에 의해, 해당 프레임에 최근방의 음원으로부터의 음향 신호는, 포함하지 않는 것으로 판정한다(S114). 그리고 음향 처리 수단(117) 에서는, 스텝 S113의 판정 결과에 근거해서, 각종 음향 처리 및 음향 출력 처리를 실행한다. 음향 판정 장치(1)는, 상술한 일련의 처리를, 음향 접수부(13, 13)에 의한 음향 신호의 받아들임이 종료하기까지 반복하여 실행한다.
상술한 음향 판정 처리의 예에서는, 음향 판정 장치(1)는, 스텝 S111에 있어서, 계수 결과에 근거해서, 선택한 주파수에 대한 제 1 역치 이상으로 되는 주파수의 비율을 산출하며, 스텝 S112에 있어서, 산출한 비율을 미리 설정되어 있는 비율을 나타내는 제 2 역치와 비교하는 형태를 나타내었으나, 스텝 S110에 있어서, 산출한 제 1 역치 이상으로 되는 주파수의 개수(個數)를, 스텝 S112에 있어서, 제 2 역치인 개수와 비교하도록 해도 좋다. 주파수의 개수를 제 2 역치로 하는 경우, 제 2 역치는, 고정된 정수가 아니고, 스텝 S107에서 선택된 주파수에 근거해서, 변화하는 변수로 된다.
예를 들면, 기준치로서, 스텝 S107에서 선택되는 주파수가 128 점의 경우, 제 2 역치는, 5 개로 되도록 설정되어 있는 것으로 한다. 이와 같은 조건하에 있어서, 스텝 S107에서 128 점 중에서 28 점이 제외되고, 100 점의 주파수로 좁아졌다고 하면, 제 2 역치는, 아래에 기재하는 식 1에 나타내는 것처럼 4 개로 된다.
5 × 100 / 128 = 3.906 ≒ 4 … 식 1
또한 마찬가지의 조건하에 있어서, 스텝 S107에서 128 점 중에서 56 점이 제외되고, 72 점의 주파수로 좁혀졌다고 하면, 제 2 역치는, 아래에 기재하는 식 2에 나타내는 것처럼 3 개로 된다.
5 × 72 / 128 = 2.813 ≒ 3 … 식 2
이와 같이 제 2 역치로서 개수를 이용하는 경우, 스텝 S107에 있어서, 주파수를 선택한 후, 선택된 주파수의 수에 근거해서, 제 2 역치를 산출하는 처리가 행하여진다.
도 5는 본 발명의 실시 형태 1에 따른 음향 판정 장치(1)의 S/N비 산출 처리의 일례를 나타내는 흐름도이다. S/N비 산출 처리는, 도 4를 이용해서 설명한 음향 판정 처리의 스텝 S105에서 개시되는 처리이다. 음향 판정 장치(1)는, 제어부(10)의 제어에 근거한 S/N비 산출 수단(113)의 처리에 의해, S/N비 산출의 대상으로 되는 프레임의 샘플의 진폭치의 제곱의 합을 프레임 파워로서 산출하며(S201), 미리 설정되어 있는 배경 잡음 레벨을 판독하고(S202), 산출한 프레임 파워 및 판독한 배경 잡음 레벨의 비(比)인 해당 프레임의 S/N비(신호 대 잡음비)를 산출한다(S203). 또한, 선택 수단(114)의 처리에 의해, 주파수마다의 S/N비에 근거해서, 제거해야하는 주파수를 결정할 필요가 있는 경우, 프레임 전체로서의 S/N비 뿐만 아니라 주파수마다의 S/N비도 산출한다. 주파수마다의 S/N비는, 배경 잡음의 주파수마다의 레벨을 나타내는 배경 잡음 스펙트럼을 이용하여, 해당 프레임의 진폭 스펙트럼과, 배경 잡음 스펙트럼의 비로서 산출한다.
그리고 음향 판정 장치(1)는, 제어부(10)의 제어에 근거한 S/N비 산출 수단(113)의 처리에 의해, 프레임 파워와 배경 잡음 레벨을 비교하여, 프레임 파워 및 배경 잡음 레벨의 차가 소정의 제 3 역치 이하인가 아닌가를 판정하고(S204), 제 3 역치 이하인 것으로 판정한 경우(S204: YES), 배경 잡음 레벨의 값을, 프레임 파워의 값을 이용해서 갱신한다(S205). 스텝 S204에서는, 프레임 파워와 배경 잡 음 레벨의 차가 소정의 제 3 역치 이하인 경우, 프레임 파워와 배경 잡음 레벨의 차는, 배경 잡음 레벨이 변화한 것에 의한 것으로 판단하며, 스텝 S205에서 배경 잡음 레벨을 최신의 값으로 갱신한다. 스텝 S205에서는, 일정의 비율로 배경 잡음 레벨과 프레임 파워를 조합하여 산출한 값으로 배경 잡음 레벨의 값을 갱신한다. 예를 들면, 원래의 배경 잡음 레벨을 0.9 배한 값과, 이번의 프레임 파워를 0.1 배한 값의 합을 갱신 후의 값으로 한다.
스텝 S204에 있어서, 프레임 파워 및 배경 잡음 레벨의 차가 제 3 역치보다 큰 것으로 판정한 경우(S204: NO), 스텝 S205의 갱신 처리는, 행하여지지 않는다. 즉, 프레임 파워와 배경 잡음 레벨의 차가 소정의 제 3 역치보다 큰 경우, 프레임 파워와 배경 잡음 레벨의 차는, 배경 잡음과는, 다른 음향 신호를 받아들인 것에 의한 것으로 판단한다. 또한 배경 잡음 레벨에 대해서는, 음성 인식, VAD(Voice Activity Detection), 마이크로폰 배열(microphone array) 처리 등의 분야에서 이용되고 있는 여러가지 방법을 적용해서 추정하는 것도 가능하다. 음향 판정 장치(1)는, 상술한 일련의 처리를, 음향 접수부(13, 13)에 의한 음향 신호의 받아들임이 종료하기까지 반복하여 실행한다.
도 6는, 본 발명의 실시 형태 1에 따른 음향 판정 장치(1)의 음향 판정 처리에 관련하는 주파수와 위상차의 관계의 일례를 나타내는 그래프이다. 도 6는, 음향 판정 처리에서 산출한 주파수마다의 위상차를, 횡축으로 주파수를 취하고, 종축으로 위상차를 취하여 그 관계를 나타낸 그래프이다. 또한 그래프에 나타낸 주파수의 범위는, 0 ~ 4000 Hz이며, 위상차의 범위는 -π ~ +π 라디안이다. 또한 도 6 중, +θth 및 -θth로서 나타낸 값은, 음향 판정 처리에서 설명한 제 1 역치를 나타내고 있다. 또한 음향 판정 처리의 설명에 있어서는, 위상차의 절대치를 제 1 역치 이상인가 아닌가를 판정하는 것으로 설명하였으나, 위상차는, 부(負)의 값을 취하는 경우도 있기 때문에, 제 1 역치도 정부(正負)의 두값이 설정된다. 음향 접수부(13, 13)가 근방의 음원으로부터 받아들이는 음향 신호는, 거의 직접음이므로 위상 차는 작고 불연속으로 되는 위상 동요가 작은 것에 비해, 비정상 잡음을 포함하는 배경 잡음은, 원방의 다양한 음원으로부터 반사파 및 회절파를 포함하는 여러가지 경로로 음향 접수부(13, 13)에 도달하기 때문에, 위상차가 크고 또한 불연속점으로 되는 위상 동요가 많아진다. 또한 도 6의 고주파수측에 위상차가 크고, 불연속적으로 되어 있는 주파수대가 관측되나, 이는 안티 알리아싱 필터(150)의 영향에 의한 것이다. 도 6에 나타내는 예에서는, 음향 판정 처리에 있어서, 3300 Hz 이상의 주파수대를 선택 수단(114)의 처리에 의해 제외한 경우, 위상차의 절대치가, 제 1 역치 이상인 주파수는 1 개뿐이기 때문에, 직접음에 의한 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정된다.
도 7은 본 발명의 실시 형태 1에 따른 음향 판정 장치(1)의 음향 판정 처리에 관련하는 주파수와 S/N비의 관계의 일례를 나타내는 그래프이다. 도 7은 S/N비 산출 처리에서 산출한 주파수마다의 S/N비를, 횡축에 주파수를 취하고, 종축에 S/N비를 취하여 그 관계를 나타낸 그래프이다. 또한 그래프에 나타낸 주파수의 범위는, 0 ~ 4000 Hz이며, S/N비의 범위는, 0 ~ 100 dB이다. 음향 판정 처리에 있어서는, 도 7 중, 원으로 표시한 S/N비가 낮은 주파수대를 선택 수단(114)의 처리에 의 해 제외하여 음향 신호의 판정을 행한다.
도 8은 본 발명의 실시 형태 1에 따른 음향 판정 장치(1)의 음향 판정 처리에 관련하는 주파수와 위상차의 관계의 일례를 나타내는 그래프이다. 또한 도 8의 그래프의 표기 방법은 도 6과 마찬가지이다. 도 8에서는, 음향 판정 처리에 있어서, 선택된 주파수 중에서 위상차의 절대치가 제 1 역치 θth 이상으로 되는 주파수를 원으로 표시하고 있으며, 원으로 표시한 주파수의 비율 또는, 수가 제 2 역치 이하인가 아닌가를 판정한다. 예를 들면, 제 2 역치로서 3 점이 설정되어 있는 경우, 도 8에 나타내는 예에서는, 최근방의 음원으로부터의 음향 신호를 포함하지 않는 것으로 판정된다.
상기 실시 형태 1에서는, 음향 판정 장치가 휴대 전화인 형태를 나타내었으나, 본 발명은, 이에 한정되지 않으며, 음향 접수부를 구비한 범용 컴퓨터이라도 좋으며, 또한 음향 접수부는, 반드시 음향 판정 장치 내에 고정해서 배열 설치되어 있을 필요는 없고, 외부의 마이크로 폰을 유선 또는, 무선으로 접속해도 되는 등, 여러가지 형태로 전개하는 것이 가능하다.
또한 상기 실시 형태 1에서는, S/N비가 작은 경우 이후의 판정을 행하지 않는 형태를 나타내었으나, 본 발명은, 이에 한정되지 않으며, S/N비에 한정되지 않고 모든 프레임에 대해서, 위상차에 근거해, 최근방의 음원으로부터의 음향 신호를 포함하는가 아닌가를 판정하도록 하는 등, 여러가지 형태로 전개하는 것이 가능하다.
《실시 형태 2》
실시 형태 2는, 실시 형태 1에 있어서, 목적으로 하는 음원으로부터의 음향 신호를 인물의 음성에 한정하는 형태이다. 또한 실시 형태 2에 따른 음향 판정 방법의 개요, 음향 판정 장치의 구성 및 음향 판정 장치의 기능에 대해서는, 실시 형태 1과 같으므로 실시 형태 1을 참조하는 것으로 하고, 그 설명을 생략한다. 또한 이하의 설명에 있어서, 실시 형태 1과 동일 형태의 구성 요건에 대해서는, 실시 형태 1과 같은 부호를 붙여서 설명한다.
실시 형태 2에서는, 실시 형태 1의 음향 판정 처리에 있어서, 선택 수단(114)에 의한 선택을 음성의 특성에 따른 한층 더한 선택 요건이 추가된다. 도 9는 본 발명의 실시 형태 2에 따른 음향 판정 방법의 음성의 특성의 일례를 나타내는 그래프이다. 도 9는 여성이 발하는 음성의 특성을 나타내고 있으며, 도 9(a)가 주파수와 진폭 스펙트럼의 관계를 나타내고 있으며, 도 9(b)가 주파수와 위상차의 관계를 나타내고 있다. 도 9(a)는, 주파수 변환 처리에 근거한 주파수마다의 진폭 스펙트럼의 값을, 횡축에 주파수를 취하며, 종축에 진폭 스펙트럼을 취하여 그 관계를 나타낸 그래프이다. 또한 그래프에 나타낸 주파수의 범위는, 0 ~ 4000 Hz이다. 도 9(b)는, 음향 판정 처리에서 산출한 주파수마다의 위상차를, 횡축에 주파수를 취하며, 종축에 위상차를 취하여 그 관계를 나타낸 그래프이다. 또한 그래프에 나타낸 주파수의 범위는, 0 ~ 4000 Hz이며, 위상차의 범위는 -π ~ +π 라디안이다. 도 9(a) 및 도 9(b)를 비교하면 분명한 것처럼, 진폭 스펙트럼이 극소치를 취하는 주파수에서는, 위상차가 커져 있다. 또한 진폭 스펙트럼에 대체하여 S/N비의 값을 이용해서도 같은 결과로 된다. 그래서 음향 판정 장치(1)는, 선택 수 단(114)에 의한 주파수의 선택을 행하는 경우, S/N비 또는, 진폭 스펙트럼이 극소치를 취하는 주파수를 제외함으로써, 판정 정밀도를 향상시키는 것이 가능하게 된다.
도 10은 본 발명의 실시 형태 2에 따른 음향 판정 장치(1)의 극소치 검출 처리의 일례를 나타내는 흐름도이다. 도 9를 이용해서 설명한 극소치를 검출하는 처리로서, 음향 판정 장치(1)는, 컴퓨터 프로그램(100)을 실행하는 제어부(10)의 제어에 의해, 주파수 축상의 신호로 변환한 음향 신호의 S/N비 또는, 진폭 스펙트럼이 극소치를 취하는 주파수를 검출하며(S301), 검출한 극소치에 관련하는 주파수 및 이 주파수 근방의 주파수대를, 제외해야하는 주파수로서 기록한다(S302). 또한 음향 신호의 S/N비 및 진폭 스펙트럼의 값은, S/N비 산출 처리에 의해 산출한 값을 이용하는 것이 가능하다. 스텝 S301에 의한 검출은, 판단의 대상으로 되는 주파수에 관련하는 S/N비를 전후의 주파수에 관련하는 S/N비와 비교하고, 전후의 주파수에 관련하는 S/N비보다 작은 경우에, 대상으로 한 주파수를 극소치인 주파수로서 검출한다. 또한 주파수에 관련하는 S/N비로서는, 대상으로 되는 주파수를 포함하는 근방 수점(數点)의 주파수의 평균치를 대상으로 되는 주파수에 관련하는 S/N비로서 취급함으로써, 미소 변화를 제거해서 정밀도 높게 극소치를 검출하는 것이 가능하다. 또한 전후의 S/N비로부터의 변화에 근거해서, 극소치를 검출하도록 해도 된다.
도 11은 본 발명의 실시 형태 2에 따른 음향 판정 방법에 관련하는 음성의 기본 주파수의 특성을 나타내는 그래프이다. 도 11은 여성 및 남성이 발하는 음성 의 기본 주파수의 분포를 나타낸 그래프(예를 들면, 고정정희(古井貞熙)저, 「디지털 음성 처리」, 일본 동해 대학 출판회(東海大學出版會), 1985 년 9 월, p. 18)이며, 횡축이 주파수를 나타내며, 종축이 빈도를 나타내고 있다. 기본 주파수는, 음성 스펙트럼의 하단을 나타내므로, 이 주파수보다도 낮은 주파수에는, 음성 스펙트럼의 성분은 존재하지 않는 것으로 된다. 도 11에 나타낸 음성의 주파수 분포로부터 분명한 것처럼, 80 Hz 이상의 주파수대에 음성의 대부분이 포함된다. 그래서 음향 판정 장치(1)는, 선택 수단(114)에 의한 주파수의 선택을 행하는 경우, 예를 들면, 80 Hz 이하의 주파수를 제외함으로써, 판정 정밀도를 향상시키는 것이 가능하게 된다.
도 9 ~ 도 11을 이용해서 설명한 것처럼, 목적으로 하는 음원으로부터의 음향 신호를 인물의 음성에 한정하는 경우, 음향 판정 처리에 있어서, 음향 판정 장치(1)는, 선택 수단(114)의 처리에 의해, 각 주파수 중에서 처리의 대상으로 하는 주파수의 선택으로, 극소치 검출 처리에 의해 검출하여 기록한 제외해야하는 주파수 및 기본 주파수가 존재하지 않는 저주파수대의 주파수를 제외한다. 이에 의해 판정 정밀도를 향상시키는 것이 가능하다.
실시 형태 3.
실시 형태 3은, 실시 형태 1에 있어서, 각 음향 접수부의 상대 위치가 변경 가능한 형태로 적용하는 경우의 형태이다. 또한 실시 형태 3에 따른 음향 판정 방법의 개요, 음향 판정 장치의 구성, 음향 판정 장치의 기능 및 처리에 대해서는, 실시 형태 1과 같으므로, 실시 형태 1을 참조하는 것으로 하며, 그 설명을 생략한 다. 단, 각 음향 접수부는, 예를 들면, 음향 판정 장치에 유선에 의해 접속된 외부 마이크로 폰과 같이 상대 위치가 변경 가능하게 구성된다. 또한 이하의 설명에 있어서, 실시 형태 1과 동일 형태의 구성 요건에 대해서는, 실시 형태 1과 같은 부호를 붙여서 설명한다.
음속 V(m/s), 음향 접수부(13, 13)간의 폭(거리) W(m), 및 표본화 주파수 F(Hz)의 경우에 있어서, 제 1 역치 θth(라디안)와 음향 접수부(13, 13)로의 입사각 φ(radian)의 관계는, 나이키스트(Nyquist) 주파수에 있어서, 아래에 기술하는 식 3으로 되는 것이 바람직하다.
θth = W·sinφ·F·2π / 2V … 식 3
예를 들면, V = 340 m, W = 0.025 m, F = 8000 Hz, θth = 1/2π radian인 상태로부터, W = 0.030 m으로 변경한 경우, 아래에 기술한 식 4에 나타내는 것처럼 하여 산출한 값으로 제 1 역치 θth도 변경함으로써 제 1 역치를 최적화하는 것이 가능하게 된다.
θth = (0.03 × 0.85 × 8000 × 2π) / (340 × 2) = 3/5π … 식 4
또한 표본화 주파수가 8000 Hz이며, 음속이 340 m/s인 경우, 음향 접수부(13, 13)간의 폭의 상한치는, 340 / 8000 = 0.0425 m = 4.25 cm로 하는 것이 바람직하며, 이 이상의 폭으로 되었을 경우, 사이드로브(sidelobe)에 의한 악영향이 나타난다. 또한 하한치는, 경험상 1.6 cm로 하는 것이 바람직하며, 이 이하의 폭으로 된 경우, 위상차를 검출하기 어렵게 되기 때문에, 오차의 영향이 커지게 된다.
도 12는 본 발명의 실시 형태 3에 따른 음향 판정 장치(1)의 제 1 역치 산출 처리의 일례를 나타내는 흐름도이다. 음향 판정 장치(1)는, 컴퓨터 프로그램(100)을 실행한다. 제어부(10)의 제어에 의해, 음향 접수부(13, 13)간의 폭(거리)의 값을 받아들여(S401), 받아들인 폭에 근거해서, 제 1 역치를 산출하고(S402), 산출한 제 1 역치를 설정치로서 기록한다(S403). 스텝 S401의 받아들임은, 사람이 입력해도 좋고, 또한 자동적으로 검출하도록 해도 된다. 이와 같이 하여 설정된 제 1 역치에 근거해서, 음향 판정 처리 등의 여러가지 처리가 실행된다.
이상의 실시 형태에 관해, 더욱이 이하의 부기(付記)를 개시한다.
(부기 1)
복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 아날로그 음향 신호에 근거해서, 특정 음향 신호의 유무를 판정하는 음향 판정 장치를 이용한 음향 판정 방법에 있어서,
상기 음향 판정 장치는,
각 음향 접수 수단이 받아들인 각각의 음향 신호를 디지털 신호로 변환하고,
디지털 신호로 변환한 각각의 음향 신호를 주파수 축상의 신호로 변환하고,
주파수 축상의 신호로 변환한 각 음향 신호간의 주파수마다의 위상차를 산출하고,
산출한 위상차가 소정의 역치 이하인 경우에, 음향 접수 수단으로부터 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정하고,
판정한 결과에 근거한 출력을 행하는
것을 특징으로 하는 음향 판정 방법.
(부기 2)
복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 아날로그 음향 신호에 근거해서, 특정 음향 신호의 유무를 판정하는 음향 판정 장치에 있어서,
각 음향 접수 수단이 받아들인 각각의 음향 신호를 디지털 신호로 변환하는 수단과,
디지털 신호로 변환한 각각의 음향 신호를 주파수 축상의 신호로 변환하는 수단과,
주파수 축상의 신호로 변환한 각 음향 신호간의 주파수마다의 위상 성분의 차를 위상차로서 산출하는 수단과,
산출한 위상차가 소정의 역치 이하인 경우에, 특정 대상으로 되는 음향 신호를 포함하는 것으로 판정하는 판정 수단과,
판정한 결과에 근거한 출력을 행하는 수단을 구비하는
것을 특징으로 하는 음향 판정 장치.
(부기 3)
복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 아날로그 음향 신호에 근거해서, 상기 음향 접수 수단으로부터 최근방의 음원으로부터의 음향 신호의 유무를 판정하는 음향 판정 장치에 있어서,
각 음향 접수 수단이 받아들인 각각의 음향 신호를 디지털 신호로 변환하는 수단과,
디지털 신호로 변환한 각각의 음향 신호로부터 소정 시간 길이의 프레임을 각각 생성하는 수단과,
생성한 프레임 단위의 각 음향 신호를 주파수 축상의 신호로 각각 변환하는 수단과,
주파수 축상의 신호로 변환한 각 음향 신호간의 주파수마다의 위상 성분의 차를 위상차로서 산출하는 수단과,
산출한 위상차가 제 1 역치 이상으로 되는 주파수의 비율 또는, 수가, 제 2 역치 이하인 경우, 생성한 프레임에 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정하는 판정 수단을 구비하는
것을 특징으로 하는 음향 판정 장치.
(부기 4)
부기 2 또는 부기 3에 있어서,
주파수 축상의 신호로 변환한 음향 신호의 진폭 성분에 근거해서, 신호 대 잡음비를 산출하는 수단을 더 구비하고,
상기 판정 수단은, 산출한 신호 대 잡음비가 소정의 역치 이하인 경우, 위상차에 관계하지 않고, 특정 대상으로 되는 음향 신호를 포함하지 않는 것으로 판정하도록 구성하고 있는
것을 특징으로 하는 음향 판정 장치.
(부기 5)
부기 2 내지 부기 4에 있어서,
상기 복수의 음향 접수 수단은, 각각의 상대 위치를 변경 가능하게 구성하고 있으며,
상기 복수의 음향 접수 수단간의 거리에 근거해서, 상기 판정 수단의 판정에 이용하는 역치를 산출하는 수단을 더 구비하는
것을 특징으로 하는 음향 판정 장치.
(부기 6)
부기 2 내지 부기 5에 있어서,
주파수 축상의 신호로 변환한 음향 신호의 진폭 성분에 근거한 주파수마다의 신호 대 잡음비에 근거해서, 상기 판정 수단의 판정에 이용하는 주파수를 선택하는 선택수단을 더 구비하는 것을 특징으로 하는 음향 판정 장치.
(부기 7)
부기 6에 있어서,
상기 판정 수단이, 위상차가 제 1 역치 이상으로 되는 주파수의 수에 근거해서, 판정하도록 구성하고 있는 경우에, 상기 선택 수단이 선택한 주파수의 수에 근거해서, 제 2 역치를 산출하는 수단을 더 구비하는 것을 특징으로 하는 음향 판정 장치.
(부기 8)
부기 2 내지 부기 7에 있어서,
알리아싱 오차를 방지하도록 디지털 신호로 변환하기 전의 음향 신호를 여 파(濾波)하는 안티 알리아싱 필터를 더 구비하며,
상기 판정 수단은, 상기 안티 알리아싱 필터의 특성에 근거한 소정의 주파수보다 높은 주파수를 판정에 이용하는 주파수로부터 제외하도록 구성하고 있는
것을 특징으로 하는 음향 판정 장치.
(부기 9)
부기 2 내지 부기 8에 있어서,
음성인 음향 신호를 특정하는 경우에, 주파수 축상의 신호로 변환한 음향 신호의 진폭 성분이 극소치를 취하는 주파수, 또는, 진폭 성분에 근거한 신호 대 잡음비가 극소치를 취하는 주파수를 검출하는 수단을 더 구비하며,
상기 판정 수단은, 검출한 주파수를 판정에 이용하는 주파수로부터 제외하도록 구성하고 있는 것을 특징으로 하는 음향 판정 장치.
(부기 10)
부기 2 내지 부기 9에 있어서,
음성인 음향 신호를 특정하는 경우에, 상기 판정 수단은, 음성에 관련하는 기본 주파수가 존재하지 않는 주파수를 판정에 이용하는 주파수로부터 제외하도록 구성하고 있는
것을 특징으로 하는 음향 판정 장치.
(부기 11)
컴퓨터에, 복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 아날로그 음향 신호에 근거해서, 특정 음향 신호의 유무를 판정시키는 컴퓨터 프로그램 에 있어서,
컴퓨터에, 각 음향 접수 수단이 받아들여, 디지털 신호로 변환한 각각의 음향 신호를 주파수 축상의 신호로 변환시키는 순서와,
컴퓨터에, 주파수 축상의 신호로 변환한 각 음향 신호간의 주파수마다의 위상차를 산출시키는 순서와,
컴퓨터에, 산출한 위상차가 소정의 역치 이하인 경우에, 음향 접수 수단으로부터 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정시키는 순서
를 실행시키는 것을 특징으로 하는 컴퓨터 프로그램.
도 1은 본 발명의 실시 형태 1에 따른 음향 판정 방법의 개요의 일례를 나타내는 설명도.
도 2는 본 발명의 실시 형태 1에 따른 음향 판정 장치의 하드웨어의 구성례를 나타내는 블럭도.
도 3은 본 발명의 실시 형태 1에 따른 음향 판정 장치의 기능의 일례를 나타내는 기능 블럭도.
도 4는 본 발명의 실시 형태 1에 따른 음향 판정 장치의 음향 판정 처리의 일례를 나타내는 흐름도.
도 5는 본 발명의 실시 형태 1에 따른 음향 판정 장치의 S/N비 산출 처리의 일례를 나타내는 흐름도.
도 6은 본 발명의 실시 형태 1에 따른 음향 판정 장치의 음향 판정 처리에 관련하는 주파수와 위상차의 관계의 일례를 나타내는 그래프.
도 7은 본 발명의 실시 형태 1에 따른 음향 판정 장치의 음향 판정 처리에 관련하는 주파수와 S/N비의 관계의 일례를 나타내는 그래프.
도 8은 본 발명의 실시 형태 1에 따른 음향 판정 장치의 음향 판정 처리에 관련하는 주파수와 위상차의 관계의 일례를 나타내는 그래프.
도 9는 본 발명의 실시 형태 2에 따른 음향 판정 방법의 음성의 특성의 일례를 나타내는 그래프.
도 10은 본 발명의 실시 형태 2에 따른 음향 판정 장치의 극소치 검출 처리 의 일례를 나타내는 흐름도.
도 11은 본 발명의 실시 형태 2에 따른 음향 판정 방법에 관련하는 음성의 기본 주파수의 특성을 나타내는 그래프.
도 12는 본 발명의 실시 형태 3에 따른 음향 판정 장치의 제 1 역치 산출 처리의 일례를 나타내는 흐름도.
* 도면의 주요 부분에 대한 부호의 설명 *
1 : 음향 판정 장치
10 : 제어부
13 : 음향 접수부
110 : 프레임 생성 수단
111 : FFT 변환 수단
112 : 위상차 산출 수단
113 : S/N비 산출 수단
114 : 선택 수단
115 : 계수 수단
116 : 음향 판정 수단
117 : 음향 처리 수단
150 : 안티 알리아싱 필터
151 : A/D 변환 수단
100 : 컴퓨터 프로그램

Claims (9)

  1. 복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 아날로그 음향 신호에 근거해서, 특정 음향 신호의 유무를 판정하는 음향 판정 장치를 이용한 음향 판정 방법에 있어서,
    상기 음향 판정 장치는,
    각 음향 접수 수단이 받아들인 각각의 음향 신호를 디지털 신호로 변환하며,
    디지털 신호로 변환한 각각의 음향 신호를 주파수 축상의 신호로 변환하며,
    주파수 축상의 신호로 변환한 각 음향 신호간의 주파수마다의 위상차를 산출하며,
    산출한 위상차가 소정의 역치 이하인 경우에, 음향 접수 수단으로부터 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정하며,
    판정한 결과에 근거한 출력을 행하는
    것을 특징으로 하는 음향 판정 방법.
  2. 복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 아날로그 음향 신호에 근거해서, 특정 음향 신호의 유무를 판정하는 음향 판정 장치에 있어서,
    각 음향 접수 수단이 받아들인 각각의 음향 신호를 디지털 신호로 변환하는 수단과,
    디지털 신호로 변환한 각각의 음향 신호를 주파수 축상의 신호로 변환하는 수단과,
    주파수 축상의 신호로 변환한 각 음향 신호간의 주파수마다의 위상 성분의 차를 위상차로서 산출하는 수단과,
    산출한 위상차가 소정의 역치 이하인 경우에, 특정 대상으로 되는 음향 신호를 포함하는 것으로 판정하는 판정 수단과,
    판정한 결과에 근거한 출력을 행하는 수단
    을 구비하는 것을 특징으로 하는 음향 판정 장치.
  3. 복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 아날로그 음향 신호에 근거해서, 상기 음향 접수 수단으로부터 최근방의 음원으로부터의 음향 신호의 유무를 판정하는 음향 판정 장치에 있어서,
    각 음향 접수 수단이 받아들인 각각의 음향 신호를 디지털 신호로 변환하는 수단과,
    디지털 신호로 변환한 각각의 음향 신호로부터 소정 시간 길이의 프레임을 각각 생성하는 수단과,
    생성한 프레임 단위의 각 음향 신호를 주파수 축상의 신호로 각각 변환하는 수단과,
    주파수 축상의 신호로 변환한 각 음향 신호간의 주파수마다의 위상 성분의 차를 위상차로서 산출하는 수단과,
    산출한 위상차가 제 1 역치 이상으로 되는 주파수의 비율 또는, 수가, 제 2 역치 이하인 경우, 생성한 프레임에 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정하는 판정 수단
    을 구비하는 것을 특징으로 하는 음향 판정 장치.
  4. 제 2 항 또는 제 3 항에 있어서,
    주파수 축상의 신호로 변환한 음향 신호의 진폭 성분에 근거해서, 신호 대 잡음비를 산출하는 수단을 더 구비하며,
    상기 판정 수단은, 산출한 신호 대 잡음비가 소정의 역치 이하인 경우, 위상차에 관계하지 않고, 특정 대상으로 되는 음향 신호를 포함하지 않는 것으로 판정하도록 구성하고 있는
    것을 특징으로 하는 음향 판정 장치.
  5. 제 2 항 또는 제 3 항에 있어서,
    상기 복수의 음향 접수 수단은, 각각의 상대 위치를 변경 가능하게 구성하고 있으며,
    상기 복수의 음향 접수 수단간의 거리에 근거해서, 상기 판정 수단의 판정에 이용하는 역치를 산출하는 수단을 더 구비하는
    것을 특징으로 하는 음향 판정 장치.
  6. 제 2 항 또는 제 3 항에 있어서,
    주파수 축상의 신호로 변환한 음향 신호의 진폭 성분에 근거한 주파수마다의 신호 대 잡음비에 근거해서, 상기 판정 수단의 판정에 이용하는 주파수를 선택하는 선택 수단을 더 구비하는 것을 특징으로 하는 음향 판정 장치.
  7. 제 2 항 또는 제 3 항에 있어서,
    알리아싱 오차를 방지하도록 디지털 신호로 변환하기 전의 음향 신호를 여파(濾波)하는 안티 알리아싱 필터를 더 구비하며,
    상기 판정 수단은, 상기 안티 알리아싱 필터의 특성에 근거한 소정의 주파수보다 높은 주파수를 판정에 이용하는 주파수로부터 제외하도록 구성하고 있는
    것을 특징으로 하는 음향 판정 장치.
  8. 제 2 항 또는 제 3 항에 있어서,
    음성인 음향 신호를 특정하는 경우에, 주파수 축상의 신호로 변환한 음향 신호의 진폭 성분이 극소치를 취하는 주파수, 또는, 진폭 성분에 근거한 신호 대 잡음비가 극소치를 취하는 주파수를 검출하는 수단을 더 구비하며,
    상기 판정 수단은, 검출한 주파수를 판정에 이용하는 주파수로부터 제외하도록 구성하고 있는
    것을 특징으로 하는 음향 판정 장치.
  9. 제 2 항 또는 제 3 항에 있어서,
    음성인 음향 신호를 특정하는 경우에, 상기 판정 수단은, 음성에 관련하는 기본 주파수가 존재하지 않는 주파수를 판정에 이용하는 주파수로부터 제외하도록 구성하고 있는 것을 특징으로 하는 음향 판정 장치.
KR1020070122628A 2007-01-30 2007-11-29 음향 판정 방법 및 음향 판정 장치 KR100952894B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2007-00019917 2007-01-30
JP2007019917A JP4854533B2 (ja) 2007-01-30 2007-01-30 音響判定方法、音響判定装置及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
KR20080071479A KR20080071479A (ko) 2008-08-04
KR100952894B1 true KR100952894B1 (ko) 2010-04-16

Family

ID=39092595

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070122628A KR100952894B1 (ko) 2007-01-30 2007-11-29 음향 판정 방법 및 음향 판정 장치

Country Status (5)

Country Link
US (1) US9082415B2 (ko)
EP (1) EP1953734B1 (ko)
JP (1) JP4854533B2 (ko)
KR (1) KR100952894B1 (ko)
CN (1) CN101236250B (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015137621A1 (ko) * 2014-03-11 2015-09-17 주식회사 사운들리 저 전력 연관 콘텐츠 제공 시스템, 방법, 및 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
WO2017135507A1 (ko) * 2016-02-03 2017-08-10 이선정 비명 검출 방법 및 이를 위한 장치
US9794620B2 (en) 2014-03-11 2017-10-17 Soundlly Inc. System and method for providing related content at low power, and computer readable recording medium having program recorded therein

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8369800B2 (en) * 2006-09-15 2013-02-05 Qualcomm Incorporated Methods and apparatus related to power control and/or interference management in a mixed wireless communications system
JP5305743B2 (ja) * 2008-06-02 2013-10-02 株式会社東芝 音響処理装置及びその方法
US9054953B2 (en) * 2008-06-16 2015-06-09 Lg Electronics Inc. Home appliance and home appliance system
JP4545233B2 (ja) * 2008-09-30 2010-09-15 パナソニック株式会社 音判定装置、音判定方法、及び、音判定プログラム
JP4547042B2 (ja) * 2008-09-30 2010-09-22 パナソニック株式会社 音判定装置、音検知装置及び音判定方法
KR101519104B1 (ko) * 2008-10-30 2015-05-11 삼성전자 주식회사 목적음 검출 장치 및 방법
JP2010124370A (ja) * 2008-11-21 2010-06-03 Fujitsu Ltd 信号処理装置、信号処理方法、および信号処理プログラム
KR101442115B1 (ko) * 2009-04-10 2014-09-18 엘지전자 주식회사 가전기기 및 가전기기 시스템
WO2011005018A2 (ko) 2009-07-06 2011-01-13 엘지전자 주식회사 가전기기 진단시스템 및 그 동작방법
KR20110010374A (ko) * 2009-07-24 2011-02-01 엘지전자 주식회사 가전기기 진단시스템 및 그 방법
JP2011033717A (ja) * 2009-07-30 2011-02-17 Secom Co Ltd 雑音抑圧装置
US20110058676A1 (en) * 2009-09-07 2011-03-10 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dereverberation of multichannel signal
JP5493850B2 (ja) * 2009-12-28 2014-05-14 富士通株式会社 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム
KR101748605B1 (ko) 2010-01-15 2017-06-20 엘지전자 주식회사 냉장고 및 냉장고 진단시스템
EP2528231B1 (en) * 2010-01-19 2018-10-10 Mitsubishi Electric Corporation Signal generation device and signal generation method
US9165567B2 (en) 2010-04-22 2015-10-20 Qualcomm Incorporated Systems, methods, and apparatus for speech feature detection
KR101658908B1 (ko) * 2010-05-17 2016-09-30 삼성전자주식회사 휴대용 단말기에서 통화 음질을 개선하기 위한 장치 및 방법
JP5672770B2 (ja) * 2010-05-19 2015-02-18 富士通株式会社 マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム
CN103053136B (zh) 2010-07-06 2015-11-25 Lg电子株式会社 家用电器诊断系统和用于其的诊断方法
US8898058B2 (en) * 2010-10-25 2014-11-25 Qualcomm Incorporated Systems, methods, and apparatus for voice activity detection
JP5668553B2 (ja) * 2011-03-18 2015-02-12 富士通株式会社 音声誤検出判別装置、音声誤検出判別方法、およびプログラム
US8818800B2 (en) * 2011-07-29 2014-08-26 2236008 Ontario Inc. Off-axis audio suppressions in an automobile cabin
KR101416937B1 (ko) 2011-08-02 2014-08-06 엘지전자 주식회사 가전기기, 가전기기 진단시스템 및 동작방법
KR101252167B1 (ko) 2011-08-18 2013-04-05 엘지전자 주식회사 가전기기 진단장치 및 그 진단방법
CN103165137B (zh) * 2011-12-19 2015-05-06 中国科学院声学研究所 一种非平稳噪声环境下传声器阵列的语音增强方法
CN103248992B (zh) * 2012-02-08 2016-01-20 中国科学院声学研究所 一种基于双麦克风的目标方向语音活动检测方法及系统
KR101942781B1 (ko) 2012-07-03 2019-01-28 엘지전자 주식회사 가전기기 및 가전기기 진단을 위한 신호음 출력방법
KR20140007178A (ko) 2012-07-09 2014-01-17 엘지전자 주식회사 가전기기 및 그 시스템
JP6003510B2 (ja) * 2012-10-11 2016-10-05 富士ゼロックス株式会社 音声解析装置、音声解析システムおよびプログラム
CN102981615B (zh) * 2012-11-05 2015-11-25 瑞声声学科技(深圳)有限公司 手势识别装置及识别方法
US9258645B2 (en) * 2012-12-20 2016-02-09 2236008 Ontario Inc. Adaptive phase discovery
CN103117063A (zh) * 2012-12-27 2013-05-22 安徽科大讯飞信息科技股份有限公司 一种基于软件实现的音乐内容截幅检测方法
US9633655B1 (en) 2013-05-23 2017-04-25 Knowles Electronics, Llc Voice sensing and keyword analysis
US9953634B1 (en) 2013-12-17 2018-04-24 Knowles Electronics, Llc Passive training for automatic speech recognition
CN105096946B (zh) * 2014-05-08 2020-09-29 钰太芯微电子科技(上海)有限公司 基于语音激活检测的唤醒装置及方法
CN104134440B (zh) * 2014-07-31 2018-05-08 百度在线网络技术(北京)有限公司 用于便携式终端的语音检测方法和语音检测装置
CN106205628B (zh) 2015-05-06 2018-11-02 小米科技有限责任公司 声音信号优化方法及装置
EP3317878B1 (de) 2015-06-30 2020-03-25 Fraunhofer Gesellschaft zur Förderung der Angewand Verfahren und vorrichtung zum erzeugen einer datenbank
CN106714058B (zh) * 2015-11-13 2024-03-29 钰太芯微电子科技(上海)有限公司 Mems麦克风及基于mems麦克风的移动终端唤醒方法
JP6645322B2 (ja) * 2016-03-31 2020-02-14 富士通株式会社 雑音抑圧装置、音声認識装置、雑音抑圧方法、及び雑音抑圧プログラム
CN107976651B (zh) * 2016-10-21 2020-12-25 杭州海康威视数字技术股份有限公司 一种基于麦克风阵列的声源定位方法及装置
US20190033438A1 (en) * 2017-07-27 2019-01-31 Acer Incorporated Distance detection device and distance detection method thereof
CN108564961A (zh) * 2017-11-29 2018-09-21 华北计算技术研究所(中国电子科技集团公司第十五研究所) 一种移动通信设备的语音降噪方法
CN108766455B (zh) * 2018-05-16 2020-04-03 南京地平线机器人技术有限公司 对混合信号进行降噪的方法和装置
CN111163411B (zh) * 2018-11-08 2022-11-18 达发科技股份有限公司 减少干扰音影响的方法及声音播放装置
CN113986187B (zh) * 2018-12-28 2024-05-17 阿波罗智联(北京)科技有限公司 音区幅值获取方法、装置、电子设备及存储介质
CN110047507B (zh) * 2019-03-01 2021-03-30 北京交通大学 一种声源识别方法及装置
RU2740574C1 (ru) * 2019-09-30 2021-01-15 Акционерное общество "Лаборатория Касперского" Система и способ фильтрации запрошенной пользователем информации
US11276388B2 (en) * 2020-03-31 2022-03-15 Nuvoton Technology Corporation Beamforming system based on delay distribution model using high frequency phase difference
CN111722186B (zh) * 2020-06-30 2024-04-05 中国平安人寿保险股份有限公司 基于声源定位的拍摄方法、装置、电子设备及存储介质
CN112530411B (zh) * 2020-12-15 2021-07-20 北京快鱼电子股份公司 一种实时分角色转录方法、设备和系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003032779A (ja) * 2001-07-17 2003-01-31 Sony Corp 音処理装置、音処理方法及び音処理プログラム
WO2006043413A1 (ja) * 2004-10-19 2006-04-27 Sony Corporation 音声信号処理装置および音声信号処理方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4333170A (en) * 1977-11-21 1982-06-01 Northrop Corporation Acoustical detection and tracking system
DE3545447A1 (de) 1985-12-20 1988-01-28 Bayerische Motoren Werke Ag System zur integration eines personalcomputers oder eines aehnlichen rechners in ein fahrzeug zur benutzung als fahrbares buero
JP2822713B2 (ja) 1991-09-04 1998-11-11 松下電器産業株式会社 収音装置
US6130949A (en) 1996-09-18 2000-10-10 Nippon Telegraph And Telephone Corporation Method and apparatus for separation of source, program recorded medium therefor, method and apparatus for detection of sound source zone, and program recorded medium therefor
JP3384540B2 (ja) * 1997-03-13 2003-03-10 日本電信電話株式会社 受話方法、装置及び記録媒体
DE69939272D1 (de) * 1998-11-16 2008-09-18 Univ Illinois Binaural-signal-verarbeitungstechniken
US6243322B1 (en) 1999-11-05 2001-06-05 Wavemakers Research, Inc. Method for estimating the distance of an acoustic signal
CN1440628A (zh) * 2000-05-10 2003-09-03 伊利诺伊大学评议会 干扰抑制技术
JP4095348B2 (ja) * 2002-05-31 2008-06-04 学校法人明治大学 雑音除去システムおよびプログラム
JP4247002B2 (ja) * 2003-01-22 2009-04-02 富士通株式会社 マイクロホンアレイを用いた話者距離検出装置及び方法並びに当該装置を用いた音声入出力装置
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
JP2005049153A (ja) * 2003-07-31 2005-02-24 Toshiba Corp 音声方向推定装置及びその方法
JP4283645B2 (ja) * 2003-11-19 2009-06-24 パイオニア株式会社 信号遅延時間測定装置及びそのためのコンピュータプログラム
JP2006084928A (ja) * 2004-09-17 2006-03-30 Nissan Motor Co Ltd 音声入力装置
JP4729927B2 (ja) * 2005-01-11 2011-07-20 ソニー株式会社 音声検出装置、自動撮像装置、および音声検出方法
JP3906230B2 (ja) 2005-03-11 2007-04-18 株式会社東芝 音響信号処理装置、音響信号処理方法、音響信号処理プログラム、及び音響信号処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003032779A (ja) * 2001-07-17 2003-01-31 Sony Corp 音処理装置、音処理方法及び音処理プログラム
WO2006043413A1 (ja) * 2004-10-19 2006-04-27 Sony Corporation 音声信号処理装置および音声信号処理方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015137621A1 (ko) * 2014-03-11 2015-09-17 주식회사 사운들리 저 전력 연관 콘텐츠 제공 시스템, 방법, 및 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
US9794620B2 (en) 2014-03-11 2017-10-17 Soundlly Inc. System and method for providing related content at low power, and computer readable recording medium having program recorded therein
WO2017135507A1 (ko) * 2016-02-03 2017-08-10 이선정 비명 검출 방법 및 이를 위한 장치
US10468049B2 (en) 2016-02-03 2019-11-05 Saferway Mobile, Inc Scream detection method and apparatus therefor

Also Published As

Publication number Publication date
US9082415B2 (en) 2015-07-14
EP1953734B1 (en) 2014-03-05
JP2008185834A (ja) 2008-08-14
EP1953734A2 (en) 2008-08-06
US20080181058A1 (en) 2008-07-31
KR20080071479A (ko) 2008-08-04
CN101236250B (zh) 2011-06-22
CN101236250A (zh) 2008-08-06
EP1953734A3 (en) 2011-12-21
JP4854533B2 (ja) 2012-01-18

Similar Documents

Publication Publication Date Title
KR100952894B1 (ko) 음향 판정 방법 및 음향 판정 장치
CN111418010B (zh) 一种多麦克风降噪方法、装置及终端设备
US8620672B2 (en) Systems, methods, apparatus, and computer-readable media for phase-based processing of multichannel signal
JP6028502B2 (ja) 音声信号処理装置、方法及びプログラム
KR100883712B1 (ko) 음원 방향 추정 방법, 및 음원 방향 추정 장치
EP2773137B1 (en) Microphone sensitivity difference correction device
JP5272920B2 (ja) 信号処理装置、信号処理方法、および信号処理プログラム
EP2755204B1 (en) Noise suppression device and method
JP5493850B2 (ja) 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム
EP2751806B1 (en) A method and a system for noise suppressing an audio signal
CN106161751B (zh) 一种噪声抑制方法及装置
JP2012150237A (ja) 音信号処理装置、および音信号処理方法、並びにプログラム
EP3606090A1 (en) Sound pickup device and sound pickup method
JP2008236077A (ja) 目的音抽出装置,目的音抽出プログラム
CN109102819A (zh) 一种啸叫检测方法及装置
JP2010124370A (ja) 信号処理装置、信号処理方法、および信号処理プログラム
US10015592B2 (en) Acoustic signal processing apparatus, method of processing acoustic signal, and storage medium
CN110447239B (zh) 拾音装置及拾音方法
JP6048596B2 (ja) 集音装置、集音装置の入力信号補正方法および移動機器情報システム
CN113160846A (zh) 噪声抑制方法和电子设备
EP2541971B1 (en) Sound processing device and sound processing method
KR20120117488A (ko) 다중 빔포머를 이용한 잡음 방향 탐지 방법
EP3261363A1 (en) Phase control signal generation device, phase control signal generation method, and phase control signal generation program
JP2013125085A (ja) 目的音抽出装置及び目的音抽出プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130321

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20140319

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160318

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20170302

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee