KR100952894B1

KR100952894B1 - 음향 판정 방법 및 음향 판정 장치

Info

Publication number: KR100952894B1
Application number: KR1020070122628A
Authority: KR
Inventors: 쇼지 하야카와
Original assignee: 후지쯔 가부시끼가이샤
Priority date: 2007-01-30
Filing date: 2007-11-29
Publication date: 2010-04-16
Also published as: US9082415B2; EP1953734B1; JP2008185834A; EP1953734A2; US20080181058A1; KR20080071479A; CN101236250B; CN101236250A; EP1953734A3; JP4854533B2

Abstract

근방 음원으로부터의 음향 신호를 고정밀도로 특정하는 음향 판정 방법, 음향 판정 장치 및 컴퓨터 프로그램을 제공한다. 음향 판정 장치(1)는, 복수의 음향 접수부에서, 각각 음향 신호를 받아들여(S101), 소정 시간 길이의 프레임을 생성한다(S103). 음향 판정 장치(1)는, 프레임 단위의 음향 신호를 FFT 처리하여 주파수 축상의 신호인 위상 스펙트럼 및 진폭 스펙트럼으로 변환하고(S104), 각 음향 신호간의 주파수마다의 위상 스펙트럼의 차를 위상차로서 산출하며(S106), 처리의 대상으로 하는 주파수를 선택한다(S107). 음향 판정 장치(1)는, 선택한 주파수의 위상차의 절대치가, 제 1 역치 이상인 주파수의 비율을 산출하며(S111), 산출한 비율이 제 2 역치 이하인 경우(S112: YES), 해당 프레임에 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정한다(S113).

근방 음원, 음향 신호, 프레임, FFT 처리, 위상 스펙트럼, 진폭 스펙트럼, 위상차, 절대치, 역치

Description

음향 판정 방법 및 음향 판정 장치{SOUND DETERMINATION METHOD AND SOUND DETERMINATION APPARATUS}

본 발명은, 복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 음향 신호에 근거해서, 특정 음향 신호의 유무를 판정하는 음향 판정 방법 및 이 음향 판정 방법을 적용한 음향 판정 장치에 관한 것이며, 특히 음향 접수 수단으로부터 최근방의 음원으로부터의 음향 신호를 특정하기 위한 음향 판정 방법 및 음향 판정 장치에 관한 것이다.

요즘의 컴퓨터 기술의 발전에 의해, 대량의 연산 처리를 요구하는 음향 신호 처리이더라도 실용적인 처리 속도로 실행할 수 있게 되어 왔다. 이와 같은 정보로부터, 복수의 마이크로 폰을 이용한 멀티 채널의 음향 처리 기능의 실용화가 기대되고 있다. 그 한 예로서, 잡음 억제 기술이 있다. 잡음 억제 기술에서는, 목적으로 하는 음원, 예를 들면, 근방 음원으로부터의 음을 특정하여, 입사각 또는 입사각으로부터 결정되는 각각의 마이크로 폰으로의 음의 도달 시간차를 변수로 한 동기(同期) 가산, 동기 감산 등의 연산에 의해, 특정 음원으로부터의 음을 강조하고, 또한 특정 음원 이외로부터의 음을 억압함으로써 목적으로 하는 음을 강조하 고, 다른 음을 억제한다. 그리고 목적으로 하는 근방 음원이 이동하고 있는 경우, 동기 가산에 의한 입사각을 변수로 한 파워 분포를 구하며, 그 분포 중에서 파워가 강한 각도에 음원이 있는 것으로 추정하며, 그 각도로부터의 음을 강조하며, 또한 그 각도 이외의 음을 억압하는 것이 일반적이다.

또한 목적의 근방 음원으로부터의 음이 연속해서 발생하지 않고 있는 경우, 미리 결정한 배경 잡음의 파워와 현재의 파워의 비(比) 또는 차(差)를 이용하여, 목적으로 하는 근방 음원으로부터의 음이 발생하고 있는 시간 구간을 검출하는 것이 일반적이다.

더욱이, 예를 들면, 미국 특허 제 6,243,322 호 명세서에서는, 동기 가산에 의해 구해지는 입사각을 변수로 하는 파워 분포의 피크 값과, 그 이외의 각도의 값의 비율로, 입사한 음이 목적으로 하는 근방(近方) 음원으로부터의 음인지 원방(遠方) 음원으로부터의 음인지를 판정하는 방법이 개시되어 있다.

그러나 동기 가산에 의한 입사각을 변수로 한 파워 분포는, 배경 잡음, 비정상 잡음 등의 잡음이 발생하고 있는 환경에 있어서, 복수의 피크가 출현하거나, 피크가 브로드(broad)화하기 때문에, 목적으로 하는 근방 음원을 특정하는 것이 곤란하다고 하는 문제가 있다.

또한 목적으로 하는 근방 음원으로부터의 음이 연속적으로 일정의 강도로 발생하고 있지 않은 경우, 배경 잡음에 의해 피크가 무딘 파워 분포로 되기 때문에, 목적의 음원으로부터의 음이 발생하고 있는 시간 구간의 검출이 더더욱 곤란해진다고 하는 문제가 있다.

더욱이, 예를 들면, 미국 특허 제 6,243,322 호 명세서에 개시된 방법으로는, S/N비가 나쁜 대역을 포함하는 전(全) 대역을 사용하기 때문에, 잡음 환경하에 있어서, 근방 음원으로부터의 음이 도래(到來)하는 각도에 있어서의 피크가 무디어져 정확하게 근방 음원으로부터 도래하는 음을 판정하는 것이 곤란하다고 하는 문제가 있다.

본 발명은 이와 같은 사정을 감안하여 안출된 것으로, 복수의 마이크로 폰이 받아들인 각각의 음향 신호의 위상차를 산출하며, 산출한 위상차가 소정의 역치 이하인 경우에, 특정 대상이 되는 최근방의 음향 신호를 포함하는 것으로 판정함으로써, 잡음 환경하에서도 목적으로 하는 음원으로부터의 음의 발생 구간을 용이하게 특정하는 것이 가능한 음향 판정 방법 및 이 음향 판정 방법을 적용한 음향 판정 장치의 제공을 주요 목적으로 한다.

또한 본 발명에서는, S/N비가 소정의 역치 이하인 경우, 목적으로 하는 음원으로부터의 음향 신호를 포함하지 않는 것으로 판단함으로써, 목적으로 하는 음원으로부터의 음의 발생 구간을 특정하는 정밀도를 향상시키는 음향 판정 장치 등의 제공을 다른 목적으로 한다.

또한 본 발명에서는, S/N비, 배경 잡음, 필터 특성, 음성 특성 등의 요인에 따라서 판정에 이용하는 주파수를 취사 선택함으로써, 목적으로 하는 음원으로부터의 음의 발생 구간을 특정하는 정밀도를 향상시키는 음향 판정 장치 등의 제공을 또 다른 목적으로 한다.

제 1 발명에 따른 음향 판정 방법은, 복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 아날로그 음향 신호에 근거하여, 특정 음향 신호의 유무를 판정하는 음향 판정 장치를 이용한 음향 판정 방법에 있어서, 상기 음향 판정 장치 는 각 음향 접수 수단이 받아들인 각각의 음향 신호를 디지털 신호로 변환하며, 디지털 신호로 변환한 각각의 음향 신호를 주파수 축상의 신호로 변환하며, 주파수 축상의 신호로 변환한 각 음향 신호간의 주파수마다의 위상차를 산출하며, 산출한 위상차가 소정의 역치 이하인 경우에, 음향 접수 수단으로부터 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정하며, 판정한 결과에 근거한 출력을 행하는 것을 특징으로 한다.

제 2 발명에 따른 음향 판정 장치는, 복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 아날로그 음향 신호에 근거해서, 특정 음향 신호의 유무를 판정하는 음향 판정 장치에 있어서, 각 음향 접수 수단이 받아들인 각각의 음향 신호를 디지털 신호로 변환하는 수단과, 디지털 신호로 변환한 각각의 음향 신호를 주파수 축상의 신호로 변환하는 수단과, 주파수 축상의 신호로 변환한 각 음향 신호간의 주파수마다의 위상 성분의 차를 위상차로서 산출하는 수단과, 산출한 위상차가 소정의 역치 이하인 경우에, 특정 대상이 되는 음향 신호를 포함하는 것으로 판정하는 판정 수단과, 판정한 결과에 근거한 출력을 행하는 수단을 구비하는 것을 특징으로 한다.

제 3 발명에 따른 음향 판정 장치는, 복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 아날로그 음향 신호에 근거해서, 상기 음향 접수 수단으로부터 최근방의 음원으로부터의 음향 신호의 유무를 판정하는 음향 판정 장치에 있어서, 각 음향 접수 수단이 받아들인 각각의 음향 신호를 디지털 신호로 변환하는 수단과, 디지털 신호로 변환한 각각의 음향 신호로부터 소정 시간 길이의 프레임을 각각 생성하는 수단과, 생성한 프레임 단위의 각 음향 신호를 주파수 축상의 신호로 각각 변환하는 수단과 주파수 축상의 신호로 변환한 각 음향 신호간의 주파수마다의 위상 성분의 차를 위상차로서 산출하는 수단과, 산출한 위상차가 제 1 역치 이상으로 되는 주파수의 비율 또는 수가, 제 2 역치 이하인 경우, 생성한 프레임에 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정하는 판정 수단을 구비하는 것을 특징으로 한다.

제 4 발명에 따른 음향 판정 장치는, 제 2 발명 또는, 제 3 발명에 있어서, 주파수 축상의 신호로 변환한 음향 신호의 진폭 성분에 근거해서, 신호 대(對) 잡음비를 산출하는 수단을 더 구비하며, 상기 판정 수단은, 산출한 신호 대 잡음비가 소정의 역치 이하인 경우, 위상차에 상관없이, 특정 대상으로 되는 음향 신호를 포함하지 않는 것으로 판정하도록 구성하고 있는 것을 특징으로 한다.

제 5 발명에 따른 음향 판정 장치는, 제 2 발명 내지 제 4 발명의 어느 하나에 있어서, 상기 복수의 음향 접수 수단은, 각각의 상대 위치를 변경 가능하게 구성하고 있으며, 상기 복수의 음향 접수 수단간의 거리에 근거해서, 상기 판정 수단의 판정에 이용하는 역치를 산출하는 수단을 더 구비하는 것을 특징으로 한다.

제 6 발명에 따른 음향 판정 장치는, 제 2 발명 내지 제 5 발명의 어느 하나에 있어서, 주파수 축상의 신호로 변환한 음향 신호의 진폭 성분에 근거한 주파수마다의 신호 대 잡음비에 근거해서, 상기 판정 수단의 판정에 이용하는 주파수를 선택하는 선택 수단을 더 구비하는 것을 특징으로 한다.

제 7 발명에 따른 음향 판정 장치는, 제 2 발명 내지 제 6 발명의 어느 하나 에 있어서, 알리아싱 오차(aliasing error)를 방지하도록 디지털 신호로 변환하기 전의 음향 신호를 여파(濾波)하는 안티 알리아싱(anti-aliasing) 필터를 더 구비하며, 상기 판정 수단은, 상기 안티 알리아싱 필터의 특성에 근거한 소정의 주파수보다 높은 주파수를 판정에 이용하는 주파수로부터 제외하도록 구성하고 있는 것을 특징으로 한다.

제 8 발명에 따른 음향 판정 장치는, 제 2 발명 내지 제 7 발명의 어느 하나에 있어서, 음성인 음향 신호를 특정하는 경우에, 주파수 축상의 신호로 변환한 음향 신호의 진폭 성분이 극소치를 취하는 주파수, 또는, 진폭 성분에 근거한 신호 대 잡음비가 극소치를 취하는 주파수를 검출하는 수단을 더 구비하며, 상기 판정 수단은, 검출한 주파수를 판정에 이용하는 주파수로부터 제외하도록 구성하고 있는 것을 특징으로 한다.

제 9 발명에 따른 음향 판정 장치는, 제 2 발명 내지 제 8 발명의 어느 하나에 있어서, 음성인 음향 신호를 특정하는 경우에, 상기 판정 수단은, 음성에 관련하는 기본 주파수가 존재하지 않는 주파수를 판정에 이용하는 주파수로부터 제외하도록 구성하고 있는 것을 특징으로 한다.

제 1 발명, 제 2 발명 및 제 3 발명에서는, 목적으로 하는 최근방의 음원으로부터의 음향 신호는, 반사파 및 회절파로서 혼입하기 어렵고 위상차가 작아지는 것으로부터, 위상차가 소정의 역치 이하인 경우에, 목적으로 하는 음원으로부터의 음향 신호를 포함하는 것으로 판단하는 것이 가능하다. 게다가 배경 잡음 등의 원방으로부터의 잡음은, 위상차가 크기때문에, 잡음 환경하에서도 목적으로 하는 음 원으로부터의 음향 신호가 발생하고 있는 구간을 용이하게 특정하는 것이 가능하다.

제 4 발명에서는, 신호 대 잡음비(S/N비)가 소정의 역치 이하인 경우, 목적으로 하는 음원으로부터의 음향 신호를 포함하지 않는 것으로 판단함으로써, 예를 들면, 배경 잡음의 위상차가 우연히 일치해졌을 경우의 오판정을 회피하는 것이 가능하므로, 특정 정밀도를 향상시키는 것이 가능하다.

제 5 발명에서는, 음향 접수 수단의 상대 위치가 변경 가능한 구성이더라도 역치를 동적으로 변경함으로써, 최적한 역치를 설정하며, 목적으로 하는 음원으로부터의 음향 신호의 특정 정밀도를 향상시키는 것이 가능하다.

제 6 발명에서는, 신호 대 잡음비가 낮은 주파수대를 제외함으로써, 목적으로 하는 음원으로부터의 음향 신호의 특정 정밀도를 향상시키는 것이 가능하다.

제 7 발명에서는, 안티 알리아싱 필터의 영향이 위상차의 동요로서 발현하는, 예를 들면, 표본화 주파수 8000 Hz에서 샘플링한 경우의 3300 Hz 이상의 주파수대를 제외함으로써, 목적으로 하는 음원으로부터의 음향 신호의 특정 정밀도를 향상시키는 것이 가능하다.

제 8 발명에서는, 진폭 성분이 극소치를 취하는 주파수에서의 위상차가 동요하기 쉽다고 하는 음성의 특성을 고려하여, 해당 주파수를 판정에서 제외함으로써, 목적으로 하는 음원으로부터의 음향 신호의 특정 정밀도를 향상시키는 것이 가능하다.

제 9 발명에서는, 음성의 주파수 특성에 따라서 음성 스펙트럼이 존재하지 않는 주파수 이하를 위상차의 판정에서 제외함으로써, 목적으로 하는 음원으로부터의 음향 신호의 특정 정밀도를 향상시키는 것이 가능하다.

제 1 발명, 제 2 발명 및 제 3 발명에 따른 음향 판정 방법 및 음향 판정 장치는, 마이크로 폰 등의 복수의 음향 접수 수단이 받아들인 각각의 음향 신호를 주파수 축상의 신호로 변환하며, 각각의 음향 신호의 위상차를 산출하고, 산출한 위상차가 소정의 역치 이하인 경우에, 특정 대상으로 되는 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정한다.

복수의 음원으로부터의 음향 신호를 받아들이는 경우, 일반적으로, 음원과 음향 접수 수단의 거리가 길수록, 음원으로부터 음향 접수 수단까지 직접 도달하는 직접파에, 벽 등의 물체에 반사해서 음향 접수 수단에 도달하는 반사파 및 회절하여 음향 접수 수단에 도달하는 회절파가 혼입하기 쉬워진다. 직접파와 비교해 반사파 및 회절파는, 도달까지의 경로 길이가 길기 때문에, 반사파 및 회절파가 혼입한 음향 신호를 주파수 축상으로 변환한 경우, 경로에 따라서 여러가지 입사각으로 도래하기 때문에 위상차 스펙트럼의 값이 안정되지 않고, 편차가 커진다. 또한 목적으로 하는 음원이 최근방의 음원인 경우, 최근방의 음원으로부터의 음향 신호는, 반사파 및 회절파가 혼입하기 어렵고 위상차 스펙트럼이 직선상으로 늘어서게 되어, 편차가 적게 된다. 따라서, 본 발명에서는, 위에서 기술한 구성에 의해 위상차가 소정의 역치 이하인 경우에 목적으로 하는 음원으로부터의 음향 신호를 포함하는 것으로 판단하는 것이 가능하며, 게다가 배경 잡음 등의 원방으로부터의 잡음은, 위상차가 크기 때문에 잡음 환경하에서도 목적으로 하는 음원으로부터의 음향 신호를 용이하게 특정하고, 잡음을 억압하는 것이 가능한 것 등, 우수한 효과를 가져온다.

제 4 발명에 따른 음향 판정 장치 등은, 신호 대 잡음비가 소정의 역치 이하인 경우, 위상차에 관여하지 않고 특정 대상으로 되는 음향 신호를 포함하지 않는 것으로 판정함으로써, 예를 들면, 배경 잡음의 위상차가 우연히 일치해진 상황에서의 오판정을 회피하는 것이 가능하므로, 특정 정밀도를 향상시키는 것이 가능한 것 등, 우수한 효과를 가져온다.

제 5 발명에 따른 음향 판정 장치 등은, 음향 접수 수단의 상대 위치가 변경 가능한 경우에, 음향 접수 수단간의 거리에 근거해서, 역치를 산출하고, 산출한 역치로 설정을 동적으로 변경함으로써, 역치를 항상 최적화하며, 목적으로 하는 음원으로부터의 음향 신호의 특정 정밀도를 향상시키는 것이 가능한 것 등, 우수한 효과를 가져온다.

제 6 발명에 따른 음향 판정 장치 등은, 신호 대 잡음비가 낮은 주파수대를 제외하고 판정을 행함으로써, 목적으로 하는 음원으로부터의 음향 신호의 특정 정밀도를 향상시키는 것이 가능한 것 등, 우수한 효과를 가져온다.

제 7 발명에 따른 음향 판정 장치 등은, 디지털 신호로 변환한 음향 신호의 알리아싱 오차를 제거하는 안티 알리아싱 필터 등의 필터의 특성에 근거해, 필터의 영향이 현저해지는, 예를 들면, 표본화 주파수 8000 Hz에서 샘플링한 경우, 3300 Hz 이상의 주파수대를 제외하여 판정을 행함으로써, 목적으로 하는 음원으로부터의 음향 신호의 특정 정밀도를 향상시키는 것이 가능한 것 등, 우수한 효과를 가져온 다.

제 8 발명에 따른 음향 판정 장치 등은, 음성인 음향 신호를 특정하는 경우에, 진폭 성분이 극소치를 취하는 주파수에서의 위상차가 동요하기 쉽다고 하는 음성의 특성을 고려하여, 해당 주파수를 제외하여 판정함으로써, 목적으로 하는 음원으로부터의 음향 신호의 특정 정밀도를 향상시키는 것이 가능한 것 등, 우수한 효과를 가져온다.

제 9 발명에서는, 음성인 음향 신호를 특정하는 경우에, 음성의 주파수 특성에 따라서, 음성 스펙트럼이 존재하지 않는 기본 주파수 이하의 주파수대를 제외하여 위상차를 판정함으로써, 목적으로 하는 음원으로부터의 음향 신호의 특정 정밀도를 향상시키는 것이 가능한 것 등, 우수한 효과를 가져온다.

복수의 마이크로 폰이 받아들인 각각의 음향 신호의 위상차를 산출하며, 산출한 위상차가 소정의 역치 이하인 경우에, 특정 대상이 되는 최근방의 음향 신호를 포함하는 것으로 판정함으로써, 잡음 환경하에서도 목적으로 하는 음원으로부터의 음의 발생 구간을 용이하게 특정하는 것이 가능한 음향 판정 방법 및 이 음향 판정 방법을 적용한 음향 판정 장치가 제공된다.

이하, 본 발명을 그 실시 형태를 나타내는 도면에 근거해서, 상술한다. 또한 본 실시 형태에서는, 처리 대상의 음향 신호가 주로 인간이 발하는 음성인 경우에 대해서 설명한다.

《실시 형태 1》

도 1은 본 발명의 실시 형태 1에 따른 음향 판정 방법의 개요의 일례를 나타내는 설명도이다. 도 1 중의 1은, 휴대 전화에 적용한 본 발명의 음향 판정 장치이며, 음향 판정 장치(1)는, 사용자에 의해 소지되며, 사용자로부터 발생되는 음성을 음향 신호로서 받아들인다. 또한, 음향 판정 장치(1)는, 사용자가 발하는 음성 이외에도 다른 인물이 발하는 음성, 기계음, 음악 등의 여러가지 배경 잡음을 받아들인다. 그래서 본 발명의 음향 판정 장치(1)는, 복수의 음원으로부터 받아들이는 여러가지 음향 신호 중에서 특정 대상으로 되는 음향 신호를 특정하며, 특정한 음향 신호를 강조하며, 또한 이것 이외의 음향 신호를 억압함으로써 잡음의 억압 등의 처리를 행한다. 또한, 본 발명의 음향 판정 장치(1)가 목적으로 하는 음향 신호란, 음향 판정 장치(1)의 최근방의 음원으로부터의 음향 신호, 즉, 사용자로부터 발하여지는 음성이다.

도 2는 본 발명의 실시 형태 1에 따른 음향 판정 장치(1)의 하드웨어의 구성례를 나타내는 블럭도이다. 음향 판정 장치(1)는, 장치 전체를 제어하는 CPU 등의 제어부(10)와, 본 발명의 컴퓨터 프로그램(100) 등의 프로그램 및 각종 설정치 등의 데이터를 기록하는 ROM, RAM 등의 기록부(11)와, 통신 인터페이스로 되는 안테나 및 그 부속 기기 등의 통신부(12)를 구비하고 있다. 또한, 음향 판정 장치(1)는, 음향 신호를 받아들이는 마이크로 폰 등의 복수의 음향 접수부(13, 13, …)와, 스피커 등의 음향 출력부(14)와, 음향 접수부(13, 13, …) 및 음향 출력부(14)에 관련하는 음향 신호의 변환 처리를 행하는 음향 변환부(15)를 구비하고 있다. 음 향 변환부(15)에 의한 변환 처리란, 음향 출력부(14)로부터 출력해야하는 디지털 신호를 아날로그 신호로 변환하는 처리 및 음향 접수부(13, 13, …)로부터 받아들인 아날로그 신호인 음향 신호를 디지털 신호로 변환하는 처리이다. 또한, 음향 판정 장치(1)는, 영숫자(英數字) 및 각종 명령 등의 키 입력에 의한 조작을 받아들이는 조작부(16)와 각종 정보를 표시하는 액정 디스플레이 등의 표시부(17)를 구비하고 있다. 그리고 휴대 전화는, 본 발명의 컴퓨터 프로그램(100)에 포함되는 각종 순서를 제어부(10)에 의해 실행함으로써, 본 발명의 음향 판정 장치(1)로서 작동한다.

도 3은 본 발명의 실시 형태 1에 따른 음향 판정 장치(1)의 기능의 일례를 나타내는 기능 블럭도이다. 본 발명의 음향 판정 장치(1)는, 복수의 음향 접수부(13, 13)와, 아날로그 신호인 음향 신호를 디지털 신호로 변환한 때의 알리아싱 오차(aliasing error)를 방지하도록 LPF(Low Pass Filter)로서 기능하는 안티 알리아싱 필터(150)와, 아날로그 신호인 음향 신호를 디지털 신호로 A/D 변환하는 A/D 변환 수단(151)을 구비하고 있다. 안티 알리아싱 필터(150) 및 A/D 변환 수단(151)은, 음향 변환부(15)에서 실현되는 기능이다. 또한, 안티 알리아싱 필터(150) 및 A/D 변환 수단(151)은, 음향 변환부(15)로서 음향 판정 장치(1)에 내장하는 것이 아니라, 외부의 음향 픽업 디바이스에 실장하는 것도 가능하다.

또한 본 발명의 음향 판정 장치(1)는, 음향 신호로부터 처리의 단위로 되는 소정 시간 길이의 프레임을 생성하는 프레임 생성 수단(110)과 음향 신호를 FFT(고속 푸리에 변환: Fast Fourier Transformation) 처리로 주파수 축상의 신호로 변환 하는 FFT 변환 수단(111)과, 복수의 음향 접수부(13, 13)가 각각 받아들인 음향 신호간의 위상차를 산출하는 위상차 산출 수단(112)과, 음향 신호의 S/N비를 산출하는 S/N비 산출 수단(113)과, 처리의 대상으로 하는 주파수를 선택하는 선택 수단(114)과, 위상차가 큰 주파수를 계수(計數)하는 계수 수단(115)과, 목적으로 하는 최근방의 음원으로부터의 음향 신호를 특정하는 음향 판정 수단(116)과, 특정한 음향 신호에 근거해, 잡음 억압 등의 처리를 행하는 음향 처리 수단(117)을 구비하고 있다. 프레임 생성 수단(110), FFT 변환 수단(111), 위상차 산출 수단(112), 선택 수단(114), 계수 수단(115), 음향 판정 수단(116) 및 음향 처리 수단(117)은, 기록부(11) 내의 각종 컴퓨터 프로그램을 실행함으로써 실현되는 소프트웨어로서의 기능을 나타내고 있으나, 각종 처리 칩 등의 전용 하드웨어를 이용하여 실현하도록 해도 된다.

다음에 본 발명의 실시 형태 1에 따른 음향 판정 장치(1)의 처리에 대해서 설명한다. 또한 이하의 설명에 있어서, 음향 판정 장치(1)는, 두 음향 접수부(13, 13)를 구비하는 것으로서 설명한다. 단, 음향 접수부(13)는, 둘에 한정되는 것이 아니고, 셋 이상의 음향 접수부(13, 13, …)로서 실장하는 것도 가능하다. 도 4는, 본 발명의 실시 형태 1에 따른 음향 판정 장치(1)의 음향 판정 처리의 일례를 나타내는 흐름도이다. 음향 판정 장치(1)는, 컴퓨터 프로그램(100)을 실행하는 제어부(10)의 제어에 의해, 복수의 음향 접수부(13, 13)에서, 각각 음향 신호를 받아들여(S101), LPF인 안티 알리아싱 필터(150)에서 여파하며, A/D 변환 수단(151)에서, 아날로그 신호로서 받아들인 음향 신호를 8000 Hz 등의 주기로 표본화해서 디 지털 신호로 변환한다(S102).

그리고 음향 판정 장치(1)는, 제어부(10)의 제어에 근거한 프레임 생성 수단(110)의 처리에 의해, 디지털 신호로 변환한 음향 신호로부터 소정 시간 길이의 프레임을 생성한다(S103). 스텝 S103에서는, 음향 신호를, 예를 들면, 20 ms ~ 40 ms 정도의 소정 시간 길이의 단위로 프레임화한다. 또한 각 프레임은, 10 ms ~ 20 ms정도씩 오버랩하고 있다. 그리고 각 프레임에 대해서는, 해밍 창, 해닝 창 등의 창함수, 고역 강조 필터(high-pass accentuation filter)에 의한 필터링 등의 음성 인식의 분야에서 일반적인 프레임 처리가 행하여진다. 이와 같이 하여 생성된 각 프레임에 대해서, 이하의 처리가 행하여진다.

음향 판정 장치(1)는, 제어부(10)의 제어에 근거해서, FFT 변환 수단(111)의 처리에 의해, 프레임 단위의 음향 신호를 FFT 처리하여 주파수 축상의 신호인 위상 스펙트럼 및 진폭 스펙트럼으로 변환하고(S104), 주파수 축상의 신호로 변환한 프레임 단위의 음향 신호의 진폭 성분에 근거해서, S/N비(신호 대 잡음비)를 산출하는 S/N비 산출 처리를 개시하며(S105), 위상차 산출 수단(112)의 처리에 의해 각 음향 신호간의 주파수마다의 위상 스펙트럼의 차를 위상차로서 산출한다(S106). 스텝 S104에서는, 예를 들면, 256 점의 음향 신호 샘플에 대해서 FFT를 행하며, 128 점의 주파수의 각각에 대해서 위상 스펙트럼의 값의 차를 위상차로서 산출한다. 스텝 S105에서 개시되는 S/N비 산출 처리는, 스텝 S106 이후의 처리와 병행해서 실행된다. 또한 S/N비 산출 처리의 상세는, 뒤에서 기술한다.

그리고 음향 판정 장치(1)는, 제어부(10)의 제어에 근거한 선택 수단(114)의 처리에 의해, 각 주파수 중에서 처리의 대상으로 하는 주파수를 선택한다(S107). 스텝 S107에서는, 목적으로 하는 최근방의 음원으로부터의 음향 신호가 검출되기 쉽고, 배경 잡음 등의 외부 동요의 영향을 받기 어려운 주파수가 선택된다. 구체적으로는, 안티 알리아싱 필터(150)의 영향에 의해 위상차가 동요하기 쉬운 주파수대를 제외한다. 제외해야 하는 주파수대는, A/D 변환 수단(151)의 특성에 의해 다르나, 일반적으로 3300 ~ 3500 kHz 이상의 고역(高域)에서 위상차가 동요되기 쉽기 때문에, 예를 들면, 3300 Hz 이상의 주파수를 처리의 대상으로부터 제외한다. 또한 S/N비 산출 처리에 의해 산출된 주파수마다의 S/N비를 취득하며, 취득한 S/N비가 낮은 순서로 소정 개수의 주파수 또는, 미리 설정되어 있는 역치 이하의 주파수를 처리의 대상으로 하는 주파수로부터 제외한다. 또한 프레임별로 산출한 S/N비를 취득하여, 제외하는 주파수를 결정하는 것이 아니라, 미리 S/N비가 낮게 되기 쉬운 주파수를 제외하는 주파수로서 설정해 두도록 해도 된다. 스텝 S107의 처리에 의해, 처리의 대상으로 되는 주파수가, 예를 들면, 100 점으로 좁혀진다.

음향 판정 장치(1)는, 제어부(10)의 제어에 근거한 음향 판정 수단(116)의 처리에 의해, S/N비 산출 처리에 의해 산출된 S/N비를 취득하며(S108), 취득한 S/N비가 미리 설정되어 있는 제 0 역치 이상인가 아닌가를 판정한다(S109). 제 0 역치로서는, 예를 들면, 5 dB 등의 값이 이용된다. 스텝 S109에서 S/N비가 제 0 역치 이상인 경우, 목적으로 하는 최근방의 음원으로부터의 음향 신호가 포함되어 있을 가능성이 있는 것으로 판정하며, 제 0 역치 미만인 경우, 목적으로 하는 음향 신호가 포함되어 있지 않은 것으로 판정한다.

스텝 S109에 있어서, S/N비가 제 0 역치 이상인 것으로 판정한 경우(S109: YES), 음향 판정 장치(1)는, 제어부(10)의 제어에 근거한 음향 판정 수단(116)의 처리에 의해, 스텝 S107에서 선택한 주파수의 위상차의 절대치가, 미리 설정되어 있는 제 1 역치 이상인 주파수를 계수하며(S110), 계수 결과에 근거해서, 선택한 주파수에 대한 제 1 역치 이상으로 되는 주파수의 비율을 산출하며(S111), 산출한 비율이 미리 설정되어 있는 제 2 역치 이하인가 아닌가를 판정한다(S112). 제 1 역치로서는, 예를 들면, π/2 라디안(radian) 등의 값이 이용된다. 제 2 역치로서는, 예를 들면, 3 % 등의 값이 이용된다. 예를 들면, 선택된 주파수가 100 점인 경우, 위상차가 π/2 라디안 이상의 주파수가 3 점 이하인가 아닌가를 판정한다.

스텝 S112에 있어서, 산출한 비율이 미리 설정되어 있는 제 2 역치 이하인 경우(S112: YES), 음향 판정 장치(1)는, 제어부(10)의 제어에 근거한 음향 판정 수단(116)의 처리에 의해, 해당 프레임에 위상차가 작은 직접음에 의한 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정한다(S113). 그리고 음향 처리 수단(117)에서는, 스텝 S113의 판정 결과에 근거해서, 각종 음향 처리 및 음향 출력 처리를 실행한다.

스텝 S109에 있어서, S/N비가 제 0 역치 미만인 것으로 판정한 경우(S109: NO), 또는, 스텝 S112에 있어서, 산출한 비율이 미리 설정되어 있는 제 2 역치보다 큰 것으로 판정한 경우(S112: NO), 음향 판정 장치(1)는, 제어부(10)의 제어에 근거한 음향 판정 수단(116)의 처리에 의해, 해당 프레임에 최근방의 음원으로부터의 음향 신호는, 포함하지 않는 것으로 판정한다(S114). 그리고 음향 처리 수단(117) 에서는, 스텝 S113의 판정 결과에 근거해서, 각종 음향 처리 및 음향 출력 처리를 실행한다. 음향 판정 장치(1)는, 상술한 일련의 처리를, 음향 접수부(13, 13)에 의한 음향 신호의 받아들임이 종료하기까지 반복하여 실행한다.

상술한 음향 판정 처리의 예에서는, 음향 판정 장치(1)는, 스텝 S111에 있어서, 계수 결과에 근거해서, 선택한 주파수에 대한 제 1 역치 이상으로 되는 주파수의 비율을 산출하며, 스텝 S112에 있어서, 산출한 비율을 미리 설정되어 있는 비율을 나타내는 제 2 역치와 비교하는 형태를 나타내었으나, 스텝 S110에 있어서, 산출한 제 1 역치 이상으로 되는 주파수의 개수(個數)를, 스텝 S112에 있어서, 제 2 역치인 개수와 비교하도록 해도 좋다. 주파수의 개수를 제 2 역치로 하는 경우, 제 2 역치는, 고정된 정수가 아니고, 스텝 S107에서 선택된 주파수에 근거해서, 변화하는 변수로 된다.

예를 들면, 기준치로서, 스텝 S107에서 선택되는 주파수가 128 점의 경우, 제 2 역치는, 5 개로 되도록 설정되어 있는 것으로 한다. 이와 같은 조건하에 있어서, 스텝 S107에서 128 점 중에서 28 점이 제외되고, 100 점의 주파수로 좁아졌다고 하면, 제 2 역치는, 아래에 기재하는 식 1에 나타내는 것처럼 4 개로 된다.

5 × 100 / 128 = 3.906 ≒ 4 … 식 1

또한 마찬가지의 조건하에 있어서, 스텝 S107에서 128 점 중에서 56 점이 제외되고, 72 점의 주파수로 좁혀졌다고 하면, 제 2 역치는, 아래에 기재하는 식 2에 나타내는 것처럼 3 개로 된다.

5 × 72 / 128 = 2.813 ≒ 3 … 식 2

이와 같이 제 2 역치로서 개수를 이용하는 경우, 스텝 S107에 있어서, 주파수를 선택한 후, 선택된 주파수의 수에 근거해서, 제 2 역치를 산출하는 처리가 행하여진다.

도 5는 본 발명의 실시 형태 1에 따른 음향 판정 장치(1)의 S/N비 산출 처리의 일례를 나타내는 흐름도이다. S/N비 산출 처리는, 도 4를 이용해서 설명한 음향 판정 처리의 스텝 S105에서 개시되는 처리이다. 음향 판정 장치(1)는, 제어부(10)의 제어에 근거한 S/N비 산출 수단(113)의 처리에 의해, S/N비 산출의 대상으로 되는 프레임의 샘플의 진폭치의 제곱의 합을 프레임 파워로서 산출하며(S201), 미리 설정되어 있는 배경 잡음 레벨을 판독하고(S202), 산출한 프레임 파워 및 판독한 배경 잡음 레벨의 비(比)인 해당 프레임의 S/N비(신호 대 잡음비)를 산출한다(S203). 또한, 선택 수단(114)의 처리에 의해, 주파수마다의 S/N비에 근거해서, 제거해야하는 주파수를 결정할 필요가 있는 경우, 프레임 전체로서의 S/N비 뿐만 아니라 주파수마다의 S/N비도 산출한다. 주파수마다의 S/N비는, 배경 잡음의 주파수마다의 레벨을 나타내는 배경 잡음 스펙트럼을 이용하여, 해당 프레임의 진폭 스펙트럼과, 배경 잡음 스펙트럼의 비로서 산출한다.

그리고 음향 판정 장치(1)는, 제어부(10)의 제어에 근거한 S/N비 산출 수단(113)의 처리에 의해, 프레임 파워와 배경 잡음 레벨을 비교하여, 프레임 파워 및 배경 잡음 레벨의 차가 소정의 제 3 역치 이하인가 아닌가를 판정하고(S204), 제 3 역치 이하인 것으로 판정한 경우(S204: YES), 배경 잡음 레벨의 값을, 프레임 파워의 값을 이용해서 갱신한다(S205). 스텝 S204에서는, 프레임 파워와 배경 잡 음 레벨의 차가 소정의 제 3 역치 이하인 경우, 프레임 파워와 배경 잡음 레벨의 차는, 배경 잡음 레벨이 변화한 것에 의한 것으로 판단하며, 스텝 S205에서 배경 잡음 레벨을 최신의 값으로 갱신한다. 스텝 S205에서는, 일정의 비율로 배경 잡음 레벨과 프레임 파워를 조합하여 산출한 값으로 배경 잡음 레벨의 값을 갱신한다. 예를 들면, 원래의 배경 잡음 레벨을 0.9 배한 값과, 이번의 프레임 파워를 0.1 배한 값의 합을 갱신 후의 값으로 한다.

스텝 S204에 있어서, 프레임 파워 및 배경 잡음 레벨의 차가 제 3 역치보다 큰 것으로 판정한 경우(S204: NO), 스텝 S205의 갱신 처리는, 행하여지지 않는다. 즉, 프레임 파워와 배경 잡음 레벨의 차가 소정의 제 3 역치보다 큰 경우, 프레임 파워와 배경 잡음 레벨의 차는, 배경 잡음과는, 다른 음향 신호를 받아들인 것에 의한 것으로 판단한다. 또한 배경 잡음 레벨에 대해서는, 음성 인식, VAD(Voice Activity Detection), 마이크로폰 배열(microphone array) 처리 등의 분야에서 이용되고 있는 여러가지 방법을 적용해서 추정하는 것도 가능하다. 음향 판정 장치(1)는, 상술한 일련의 처리를, 음향 접수부(13, 13)에 의한 음향 신호의 받아들임이 종료하기까지 반복하여 실행한다.

도 6는, 본 발명의 실시 형태 1에 따른 음향 판정 장치(1)의 음향 판정 처리에 관련하는 주파수와 위상차의 관계의 일례를 나타내는 그래프이다. 도 6는, 음향 판정 처리에서 산출한 주파수마다의 위상차를, 횡축으로 주파수를 취하고, 종축으로 위상차를 취하여 그 관계를 나타낸 그래프이다. 또한 그래프에 나타낸 주파수의 범위는, 0 ~ 4000 Hz이며, 위상차의 범위는 -π ~ +π 라디안이다. 또한 도 6 중, +θth 및 -θth로서 나타낸 값은, 음향 판정 처리에서 설명한 제 1 역치를 나타내고 있다. 또한 음향 판정 처리의 설명에 있어서는, 위상차의 절대치를 제 1 역치 이상인가 아닌가를 판정하는 것으로 설명하였으나, 위상차는, 부(負)의 값을 취하는 경우도 있기 때문에, 제 1 역치도 정부(正負)의 두값이 설정된다. 음향 접수부(13, 13)가 근방의 음원으로부터 받아들이는 음향 신호는, 거의 직접음이므로 위상 차는 작고 불연속으로 되는 위상 동요가 작은 것에 비해, 비정상 잡음을 포함하는 배경 잡음은, 원방의 다양한 음원으로부터 반사파 및 회절파를 포함하는 여러가지 경로로 음향 접수부(13, 13)에 도달하기 때문에, 위상차가 크고 또한 불연속점으로 되는 위상 동요가 많아진다. 또한 도 6의 고주파수측에 위상차가 크고, 불연속적으로 되어 있는 주파수대가 관측되나, 이는 안티 알리아싱 필터(150)의 영향에 의한 것이다. 도 6에 나타내는 예에서는, 음향 판정 처리에 있어서, 3300 Hz 이상의 주파수대를 선택 수단(114)의 처리에 의해 제외한 경우, 위상차의 절대치가, 제 1 역치 이상인 주파수는 1 개뿐이기 때문에, 직접음에 의한 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정된다.

도 7은 본 발명의 실시 형태 1에 따른 음향 판정 장치(1)의 음향 판정 처리에 관련하는 주파수와 S/N비의 관계의 일례를 나타내는 그래프이다. 도 7은 S/N비 산출 처리에서 산출한 주파수마다의 S/N비를, 횡축에 주파수를 취하고, 종축에 S/N비를 취하여 그 관계를 나타낸 그래프이다. 또한 그래프에 나타낸 주파수의 범위는, 0 ~ 4000 Hz이며, S/N비의 범위는, 0 ~ 100 dB이다. 음향 판정 처리에 있어서는, 도 7 중, 원으로 표시한 S/N비가 낮은 주파수대를 선택 수단(114)의 처리에 의 해 제외하여 음향 신호의 판정을 행한다.

도 8은 본 발명의 실시 형태 1에 따른 음향 판정 장치(1)의 음향 판정 처리에 관련하는 주파수와 위상차의 관계의 일례를 나타내는 그래프이다. 또한 도 8의 그래프의 표기 방법은 도 6과 마찬가지이다. 도 8에서는, 음향 판정 처리에 있어서, 선택된 주파수 중에서 위상차의 절대치가 제 1 역치 θth 이상으로 되는 주파수를 원으로 표시하고 있으며, 원으로 표시한 주파수의 비율 또는, 수가 제 2 역치 이하인가 아닌가를 판정한다. 예를 들면, 제 2 역치로서 3 점이 설정되어 있는 경우, 도 8에 나타내는 예에서는, 최근방의 음원으로부터의 음향 신호를 포함하지 않는 것으로 판정된다.

상기 실시 형태 1에서는, 음향 판정 장치가 휴대 전화인 형태를 나타내었으나, 본 발명은, 이에 한정되지 않으며, 음향 접수부를 구비한 범용 컴퓨터이라도 좋으며, 또한 음향 접수부는, 반드시 음향 판정 장치 내에 고정해서 배열 설치되어 있을 필요는 없고, 외부의 마이크로 폰을 유선 또는, 무선으로 접속해도 되는 등, 여러가지 형태로 전개하는 것이 가능하다.

또한 상기 실시 형태 1에서는, S/N비가 작은 경우 이후의 판정을 행하지 않는 형태를 나타내었으나, 본 발명은, 이에 한정되지 않으며, S/N비에 한정되지 않고 모든 프레임에 대해서, 위상차에 근거해, 최근방의 음원으로부터의 음향 신호를 포함하는가 아닌가를 판정하도록 하는 등, 여러가지 형태로 전개하는 것이 가능하다.

《실시 형태 2》

실시 형태 2는, 실시 형태 1에 있어서, 목적으로 하는 음원으로부터의 음향 신호를 인물의 음성에 한정하는 형태이다. 또한 실시 형태 2에 따른 음향 판정 방법의 개요, 음향 판정 장치의 구성 및 음향 판정 장치의 기능에 대해서는, 실시 형태 1과 같으므로 실시 형태 1을 참조하는 것으로 하고, 그 설명을 생략한다. 또한 이하의 설명에 있어서, 실시 형태 1과 동일 형태의 구성 요건에 대해서는, 실시 형태 1과 같은 부호를 붙여서 설명한다.

실시 형태 2에서는, 실시 형태 1의 음향 판정 처리에 있어서, 선택 수단(114)에 의한 선택을 음성의 특성에 따른 한층 더한 선택 요건이 추가된다. 도 9는 본 발명의 실시 형태 2에 따른 음향 판정 방법의 음성의 특성의 일례를 나타내는 그래프이다. 도 9는 여성이 발하는 음성의 특성을 나타내고 있으며, 도 9(a)가 주파수와 진폭 스펙트럼의 관계를 나타내고 있으며, 도 9(b)가 주파수와 위상차의 관계를 나타내고 있다. 도 9(a)는, 주파수 변환 처리에 근거한 주파수마다의 진폭 스펙트럼의 값을, 횡축에 주파수를 취하며, 종축에 진폭 스펙트럼을 취하여 그 관계를 나타낸 그래프이다. 또한 그래프에 나타낸 주파수의 범위는, 0 ~ 4000 Hz이다. 도 9(b)는, 음향 판정 처리에서 산출한 주파수마다의 위상차를, 횡축에 주파수를 취하며, 종축에 위상차를 취하여 그 관계를 나타낸 그래프이다. 또한 그래프에 나타낸 주파수의 범위는, 0 ~ 4000 Hz이며, 위상차의 범위는 -π ~ +π 라디안이다. 도 9(a) 및 도 9(b)를 비교하면 분명한 것처럼, 진폭 스펙트럼이 극소치를 취하는 주파수에서는, 위상차가 커져 있다. 또한 진폭 스펙트럼에 대체하여 S/N비의 값을 이용해서도 같은 결과로 된다. 그래서 음향 판정 장치(1)는, 선택 수 단(114)에 의한 주파수의 선택을 행하는 경우, S/N비 또는, 진폭 스펙트럼이 극소치를 취하는 주파수를 제외함으로써, 판정 정밀도를 향상시키는 것이 가능하게 된다.

도 10은 본 발명의 실시 형태 2에 따른 음향 판정 장치(1)의 극소치 검출 처리의 일례를 나타내는 흐름도이다. 도 9를 이용해서 설명한 극소치를 검출하는 처리로서, 음향 판정 장치(1)는, 컴퓨터 프로그램(100)을 실행하는 제어부(10)의 제어에 의해, 주파수 축상의 신호로 변환한 음향 신호의 S/N비 또는, 진폭 스펙트럼이 극소치를 취하는 주파수를 검출하며(S301), 검출한 극소치에 관련하는 주파수 및 이 주파수 근방의 주파수대를, 제외해야하는 주파수로서 기록한다(S302). 또한 음향 신호의 S/N비 및 진폭 스펙트럼의 값은, S/N비 산출 처리에 의해 산출한 값을 이용하는 것이 가능하다. 스텝 S301에 의한 검출은, 판단의 대상으로 되는 주파수에 관련하는 S/N비를 전후의 주파수에 관련하는 S/N비와 비교하고, 전후의 주파수에 관련하는 S/N비보다 작은 경우에, 대상으로 한 주파수를 극소치인 주파수로서 검출한다. 또한 주파수에 관련하는 S/N비로서는, 대상으로 되는 주파수를 포함하는 근방 수점(數点)의 주파수의 평균치를 대상으로 되는 주파수에 관련하는 S/N비로서 취급함으로써, 미소 변화를 제거해서 정밀도 높게 극소치를 검출하는 것이 가능하다. 또한 전후의 S/N비로부터의 변화에 근거해서, 극소치를 검출하도록 해도 된다.

도 11은 본 발명의 실시 형태 2에 따른 음향 판정 방법에 관련하는 음성의 기본 주파수의 특성을 나타내는 그래프이다. 도 11은 여성 및 남성이 발하는 음성 의 기본 주파수의 분포를 나타낸 그래프(예를 들면, 고정정희(古井貞熙)저, 「디지털 음성 처리」, 일본 동해 대학 출판회(東海大學出版會), 1985 년 9 월, p. 18)이며, 횡축이 주파수를 나타내며, 종축이 빈도를 나타내고 있다. 기본 주파수는, 음성 스펙트럼의 하단을 나타내므로, 이 주파수보다도 낮은 주파수에는, 음성 스펙트럼의 성분은 존재하지 않는 것으로 된다. 도 11에 나타낸 음성의 주파수 분포로부터 분명한 것처럼, 80 Hz 이상의 주파수대에 음성의 대부분이 포함된다. 그래서 음향 판정 장치(1)는, 선택 수단(114)에 의한 주파수의 선택을 행하는 경우, 예를 들면, 80 Hz 이하의 주파수를 제외함으로써, 판정 정밀도를 향상시키는 것이 가능하게 된다.

도 9 ~ 도 11을 이용해서 설명한 것처럼, 목적으로 하는 음원으로부터의 음향 신호를 인물의 음성에 한정하는 경우, 음향 판정 처리에 있어서, 음향 판정 장치(1)는, 선택 수단(114)의 처리에 의해, 각 주파수 중에서 처리의 대상으로 하는 주파수의 선택으로, 극소치 검출 처리에 의해 검출하여 기록한 제외해야하는 주파수 및 기본 주파수가 존재하지 않는 저주파수대의 주파수를 제외한다. 이에 의해 판정 정밀도를 향상시키는 것이 가능하다.

실시 형태 3.

실시 형태 3은, 실시 형태 1에 있어서, 각 음향 접수부의 상대 위치가 변경 가능한 형태로 적용하는 경우의 형태이다. 또한 실시 형태 3에 따른 음향 판정 방법의 개요, 음향 판정 장치의 구성, 음향 판정 장치의 기능 및 처리에 대해서는, 실시 형태 1과 같으므로, 실시 형태 1을 참조하는 것으로 하며, 그 설명을 생략한 다. 단, 각 음향 접수부는, 예를 들면, 음향 판정 장치에 유선에 의해 접속된 외부 마이크로 폰과 같이 상대 위치가 변경 가능하게 구성된다. 또한 이하의 설명에 있어서, 실시 형태 1과 동일 형태의 구성 요건에 대해서는, 실시 형태 1과 같은 부호를 붙여서 설명한다.

음속 V(m/s), 음향 접수부(13, 13)간의 폭(거리) W(m), 및 표본화 주파수 F(Hz)의 경우에 있어서, 제 1 역치 θth(라디안)와 음향 접수부(13, 13)로의 입사각 φ(radian)의 관계는, 나이키스트(Nyquist) 주파수에 있어서, 아래에 기술하는 식 3으로 되는 것이 바람직하다.

θth = W·sinφ·F·2π / 2V … 식 3

예를 들면, V = 340 m, W = 0.025 m, F = 8000 Hz, θth = 1/2π radian인 상태로부터, W = 0.030 m으로 변경한 경우, 아래에 기술한 식 4에 나타내는 것처럼 하여 산출한 값으로 제 1 역치 θth도 변경함으로써 제 1 역치를 최적화하는 것이 가능하게 된다.

θth = (0.03 × 0.85 × 8000 × 2π) / (340 × 2) = 3/5π … 식 4

또한 표본화 주파수가 8000 Hz이며, 음속이 340 m/s인 경우, 음향 접수부(13, 13)간의 폭의 상한치는, 340 / 8000 = 0.0425 m = 4.25 cm로 하는 것이 바람직하며, 이 이상의 폭으로 되었을 경우, 사이드로브(sidelobe)에 의한 악영향이 나타난다. 또한 하한치는, 경험상 1.6 cm로 하는 것이 바람직하며, 이 이하의 폭으로 된 경우, 위상차를 검출하기 어렵게 되기 때문에, 오차의 영향이 커지게 된다.

도 12는 본 발명의 실시 형태 3에 따른 음향 판정 장치(1)의 제 1 역치 산출 처리의 일례를 나타내는 흐름도이다. 음향 판정 장치(1)는, 컴퓨터 프로그램(100)을 실행한다. 제어부(10)의 제어에 의해, 음향 접수부(13, 13)간의 폭(거리)의 값을 받아들여(S401), 받아들인 폭에 근거해서, 제 1 역치를 산출하고(S402), 산출한 제 1 역치를 설정치로서 기록한다(S403). 스텝 S401의 받아들임은, 사람이 입력해도 좋고, 또한 자동적으로 검출하도록 해도 된다. 이와 같이 하여 설정된 제 1 역치에 근거해서, 음향 판정 처리 등의 여러가지 처리가 실행된다.

이상의 실시 형태에 관해, 더욱이 이하의 부기(付記)를 개시한다.

(부기 1)

복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 아날로그 음향 신호에 근거해서, 특정 음향 신호의 유무를 판정하는 음향 판정 장치를 이용한 음향 판정 방법에 있어서,

상기 음향 판정 장치는,

각 음향 접수 수단이 받아들인 각각의 음향 신호를 디지털 신호로 변환하고,

디지털 신호로 변환한 각각의 음향 신호를 주파수 축상의 신호로 변환하고,

주파수 축상의 신호로 변환한 각 음향 신호간의 주파수마다의 위상차를 산출하고,

산출한 위상차가 소정의 역치 이하인 경우에, 음향 접수 수단으로부터 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정하고,

판정한 결과에 근거한 출력을 행하는

것을 특징으로 하는 음향 판정 방법.

(부기 2)

복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 아날로그 음향 신호에 근거해서, 특정 음향 신호의 유무를 판정하는 음향 판정 장치에 있어서,

각 음향 접수 수단이 받아들인 각각의 음향 신호를 디지털 신호로 변환하는 수단과,

디지털 신호로 변환한 각각의 음향 신호를 주파수 축상의 신호로 변환하는 수단과,

주파수 축상의 신호로 변환한 각 음향 신호간의 주파수마다의 위상 성분의 차를 위상차로서 산출하는 수단과,

산출한 위상차가 소정의 역치 이하인 경우에, 특정 대상으로 되는 음향 신호를 포함하는 것으로 판정하는 판정 수단과,

판정한 결과에 근거한 출력을 행하는 수단을 구비하는

것을 특징으로 하는 음향 판정 장치.

(부기 3)

복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 아날로그 음향 신호에 근거해서, 상기 음향 접수 수단으로부터 최근방의 음원으로부터의 음향 신호의 유무를 판정하는 음향 판정 장치에 있어서,

디지털 신호로 변환한 각각의 음향 신호로부터 소정 시간 길이의 프레임을 각각 생성하는 수단과,

생성한 프레임 단위의 각 음향 신호를 주파수 축상의 신호로 각각 변환하는 수단과,

산출한 위상차가 제 1 역치 이상으로 되는 주파수의 비율 또는, 수가, 제 2 역치 이하인 경우, 생성한 프레임에 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정하는 판정 수단을 구비하는

것을 특징으로 하는 음향 판정 장치.

(부기 4)

부기 2 또는 부기 3에 있어서,

주파수 축상의 신호로 변환한 음향 신호의 진폭 성분에 근거해서, 신호 대 잡음비를 산출하는 수단을 더 구비하고,

상기 판정 수단은, 산출한 신호 대 잡음비가 소정의 역치 이하인 경우, 위상차에 관계하지 않고, 특정 대상으로 되는 음향 신호를 포함하지 않는 것으로 판정하도록 구성하고 있는

것을 특징으로 하는 음향 판정 장치.

(부기 5)

부기 2 내지 부기 4에 있어서,

상기 복수의 음향 접수 수단은, 각각의 상대 위치를 변경 가능하게 구성하고 있으며,

상기 복수의 음향 접수 수단간의 거리에 근거해서, 상기 판정 수단의 판정에 이용하는 역치를 산출하는 수단을 더 구비하는

것을 특징으로 하는 음향 판정 장치.

(부기 6)

부기 2 내지 부기 5에 있어서,

주파수 축상의 신호로 변환한 음향 신호의 진폭 성분에 근거한 주파수마다의 신호 대 잡음비에 근거해서, 상기 판정 수단의 판정에 이용하는 주파수를 선택하는 선택수단을 더 구비하는 것을 특징으로 하는 음향 판정 장치.

(부기 7)

부기 6에 있어서,

상기 판정 수단이, 위상차가 제 1 역치 이상으로 되는 주파수의 수에 근거해서, 판정하도록 구성하고 있는 경우에, 상기 선택 수단이 선택한 주파수의 수에 근거해서, 제 2 역치를 산출하는 수단을 더 구비하는 것을 특징으로 하는 음향 판정 장치.

(부기 8)

부기 2 내지 부기 7에 있어서,

알리아싱 오차를 방지하도록 디지털 신호로 변환하기 전의 음향 신호를 여 파(濾波)하는 안티 알리아싱 필터를 더 구비하며,

상기 판정 수단은, 상기 안티 알리아싱 필터의 특성에 근거한 소정의 주파수보다 높은 주파수를 판정에 이용하는 주파수로부터 제외하도록 구성하고 있는

것을 특징으로 하는 음향 판정 장치.

(부기 9)

부기 2 내지 부기 8에 있어서,

음성인 음향 신호를 특정하는 경우에, 주파수 축상의 신호로 변환한 음향 신호의 진폭 성분이 극소치를 취하는 주파수, 또는, 진폭 성분에 근거한 신호 대 잡음비가 극소치를 취하는 주파수를 검출하는 수단을 더 구비하며,

상기 판정 수단은, 검출한 주파수를 판정에 이용하는 주파수로부터 제외하도록 구성하고 있는 것을 특징으로 하는 음향 판정 장치.

(부기 10)

부기 2 내지 부기 9에 있어서,

음성인 음향 신호를 특정하는 경우에, 상기 판정 수단은, 음성에 관련하는 기본 주파수가 존재하지 않는 주파수를 판정에 이용하는 주파수로부터 제외하도록 구성하고 있는

것을 특징으로 하는 음향 판정 장치.

(부기 11)

컴퓨터에, 복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 아날로그 음향 신호에 근거해서, 특정 음향 신호의 유무를 판정시키는 컴퓨터 프로그램 에 있어서,

컴퓨터에, 각 음향 접수 수단이 받아들여, 디지털 신호로 변환한 각각의 음향 신호를 주파수 축상의 신호로 변환시키는 순서와,

컴퓨터에, 주파수 축상의 신호로 변환한 각 음향 신호간의 주파수마다의 위상차를 산출시키는 순서와,

컴퓨터에, 산출한 위상차가 소정의 역치 이하인 경우에, 음향 접수 수단으로부터 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정시키는 순서

를 실행시키는 것을 특징으로 하는 컴퓨터 프로그램.

도 1은 본 발명의 실시 형태 1에 따른 음향 판정 방법의 개요의 일례를 나타내는 설명도.

도 2는 본 발명의 실시 형태 1에 따른 음향 판정 장치의 하드웨어의 구성례를 나타내는 블럭도.

도 3은 본 발명의 실시 형태 1에 따른 음향 판정 장치의 기능의 일례를 나타내는 기능 블럭도.

도 4는 본 발명의 실시 형태 1에 따른 음향 판정 장치의 음향 판정 처리의 일례를 나타내는 흐름도.

도 5는 본 발명의 실시 형태 1에 따른 음향 판정 장치의 S/N비 산출 처리의 일례를 나타내는 흐름도.

도 6은 본 발명의 실시 형태 1에 따른 음향 판정 장치의 음향 판정 처리에 관련하는 주파수와 위상차의 관계의 일례를 나타내는 그래프.

도 7은 본 발명의 실시 형태 1에 따른 음향 판정 장치의 음향 판정 처리에 관련하는 주파수와 S/N비의 관계의 일례를 나타내는 그래프.

도 8은 본 발명의 실시 형태 1에 따른 음향 판정 장치의 음향 판정 처리에 관련하는 주파수와 위상차의 관계의 일례를 나타내는 그래프.

도 9는 본 발명의 실시 형태 2에 따른 음향 판정 방법의 음성의 특성의 일례를 나타내는 그래프.

도 10은 본 발명의 실시 형태 2에 따른 음향 판정 장치의 극소치 검출 처리 의 일례를 나타내는 흐름도.

도 11은 본 발명의 실시 형태 2에 따른 음향 판정 방법에 관련하는 음성의 기본 주파수의 특성을 나타내는 그래프.

도 12는 본 발명의 실시 형태 3에 따른 음향 판정 장치의 제 1 역치 산출 처리의 일례를 나타내는 흐름도.

* 도면의 주요 부분에 대한 부호의 설명 *

1 : 음향 판정 장치

10 : 제어부

13 : 음향 접수부

110 : 프레임 생성 수단

111 : FFT 변환 수단

112 : 위상차 산출 수단

113 : S/N비 산출 수단

114 : 선택 수단

115 : 계수 수단

116 : 음향 판정 수단

117 : 음향 처리 수단

150 : 안티 알리아싱 필터

151 : A/D 변환 수단

100 : 컴퓨터 프로그램

Claims

복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 아날로그 음향 신호에 근거해서, 특정 음향 신호의 유무를 판정하는 음향 판정 장치를 이용한 음향 판정 방법에 있어서,

상기 음향 판정 장치는,

각 음향 접수 수단이 받아들인 각각의 음향 신호를 디지털 신호로 변환하며,

디지털 신호로 변환한 각각의 음향 신호를 주파수 축상의 신호로 변환하며,

주파수 축상의 신호로 변환한 각 음향 신호간의 주파수마다의 위상차를 산출하며,

산출한 위상차가 소정의 역치 이하인 경우에, 음향 접수 수단으로부터 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정하며,

판정한 결과에 근거한 출력을 행하는

것을 특징으로 하는 음향 판정 방법.
복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 아날로그 음향 신호에 근거해서, 특정 음향 신호의 유무를 판정하는 음향 판정 장치에 있어서,

각 음향 접수 수단이 받아들인 각각의 음향 신호를 디지털 신호로 변환하는 수단과,

디지털 신호로 변환한 각각의 음향 신호를 주파수 축상의 신호로 변환하는 수단과,

주파수 축상의 신호로 변환한 각 음향 신호간의 주파수마다의 위상 성분의 차를 위상차로서 산출하는 수단과,

산출한 위상차가 소정의 역치 이하인 경우에, 특정 대상으로 되는 음향 신호를 포함하는 것으로 판정하는 판정 수단과,

판정한 결과에 근거한 출력을 행하는 수단

을 구비하는 것을 특징으로 하는 음향 판정 장치.
복수의 음향 접수 수단으로 받아들인 복수의 음원으로부터의 아날로그 음향 신호에 근거해서, 상기 음향 접수 수단으로부터 최근방의 음원으로부터의 음향 신호의 유무를 판정하는 음향 판정 장치에 있어서,

각 음향 접수 수단이 받아들인 각각의 음향 신호를 디지털 신호로 변환하는 수단과,

디지털 신호로 변환한 각각의 음향 신호로부터 소정 시간 길이의 프레임을 각각 생성하는 수단과,

생성한 프레임 단위의 각 음향 신호를 주파수 축상의 신호로 각각 변환하는 수단과,

주파수 축상의 신호로 변환한 각 음향 신호간의 주파수마다의 위상 성분의 차를 위상차로서 산출하는 수단과,

산출한 위상차가 제 1 역치 이상으로 되는 주파수의 비율 또는, 수가, 제 2 역치 이하인 경우, 생성한 프레임에 최근방의 음원으로부터의 음향 신호를 포함하는 것으로 판정하는 판정 수단

을 구비하는 것을 특징으로 하는 음향 판정 장치.
제 2 항 또는 제 3 항에 있어서,

주파수 축상의 신호로 변환한 음향 신호의 진폭 성분에 근거해서, 신호 대 잡음비를 산출하는 수단을 더 구비하며,

상기 판정 수단은, 산출한 신호 대 잡음비가 소정의 역치 이하인 경우, 위상차에 관계하지 않고, 특정 대상으로 되는 음향 신호를 포함하지 않는 것으로 판정하도록 구성하고 있는

것을 특징으로 하는 음향 판정 장치.
제 2 항 또는 제 3 항에 있어서,

상기 복수의 음향 접수 수단은, 각각의 상대 위치를 변경 가능하게 구성하고 있으며,

상기 복수의 음향 접수 수단간의 거리에 근거해서, 상기 판정 수단의 판정에 이용하는 역치를 산출하는 수단을 더 구비하는

것을 특징으로 하는 음향 판정 장치.
제 2 항 또는 제 3 항에 있어서,

주파수 축상의 신호로 변환한 음향 신호의 진폭 성분에 근거한 주파수마다의 신호 대 잡음비에 근거해서, 상기 판정 수단의 판정에 이용하는 주파수를 선택하는 선택 수단을 더 구비하는 것을 특징으로 하는 음향 판정 장치.
제 2 항 또는 제 3 항에 있어서,

알리아싱 오차를 방지하도록 디지털 신호로 변환하기 전의 음향 신호를 여파(濾波)하는 안티 알리아싱 필터를 더 구비하며,

상기 판정 수단은, 상기 안티 알리아싱 필터의 특성에 근거한 소정의 주파수보다 높은 주파수를 판정에 이용하는 주파수로부터 제외하도록 구성하고 있는

것을 특징으로 하는 음향 판정 장치.
제 2 항 또는 제 3 항에 있어서,

음성인 음향 신호를 특정하는 경우에, 주파수 축상의 신호로 변환한 음향 신호의 진폭 성분이 극소치를 취하는 주파수, 또는, 진폭 성분에 근거한 신호 대 잡음비가 극소치를 취하는 주파수를 검출하는 수단을 더 구비하며,

상기 판정 수단은, 검출한 주파수를 판정에 이용하는 주파수로부터 제외하도록 구성하고 있는

것을 특징으로 하는 음향 판정 장치.
제 2 항 또는 제 3 항에 있어서,

음성인 음향 신호를 특정하는 경우에, 상기 판정 수단은, 음성에 관련하는 기본 주파수가 존재하지 않는 주파수를 판정에 이용하는 주파수로부터 제외하도록 구성하고 있는 것을 특징으로 하는 음향 판정 장치.