KR101021800B1 - 음향 채널 추정에 기반한 음원 위치 탐지 방법 - Google Patents

음향 채널 추정에 기반한 음원 위치 탐지 방법 Download PDF

Info

Publication number
KR101021800B1
KR101021800B1 KR1020090026233A KR20090026233A KR101021800B1 KR 101021800 B1 KR101021800 B1 KR 101021800B1 KR 1020090026233 A KR1020090026233 A KR 1020090026233A KR 20090026233 A KR20090026233 A KR 20090026233A KR 101021800 B1 KR101021800 B1 KR 101021800B1
Authority
KR
South Korea
Prior art keywords
channel
sound source
channel filter
adaptive
filter
Prior art date
Application number
KR1020090026233A
Other languages
English (en)
Other versions
KR20100107893A (ko
Inventor
박형민
조지원
Original Assignee
서강대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서강대학교산학협력단 filed Critical 서강대학교산학협력단
Priority to KR1020090026233A priority Critical patent/KR101021800B1/ko
Publication of KR20100107893A publication Critical patent/KR20100107893A/ko
Application granted granted Critical
Publication of KR101021800B1 publication Critical patent/KR101021800B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/20Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2460/00Details of hearing devices, i.e. of ear- or headphones covered by H04R1/10 or H04R5/033 but not provided for in any of their subgroups, or of hearing aids covered by H04R25/00 but not provided for in any of its subgroups
    • H04R2460/07Use of position data from wide-area or local-area positioning systems in hearing devices, e.g. program or information selection

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

본 발명은 음향 채널 추정에 기반한 음원 위치 탐지 방법에 관한 것이다. 상기 음향 채널 추정에 기반한 음원 위치 탐지 방법은, (a) 적응 채널 필터를 초기화하는 단계; (b) 각 센서로부터 신호들을 입력받는 단계: (c) 각 센서로부터 입력된 신호들을 이전에 갱신된 적응 채널 필터들을 통과시킨 후, 상기 통과된 신호들 간의 차이에 따른 오류 신호를 검출하는 단계: (d) 상기 오류 신호를 이용하여 음원과 각 센서들 사이의 적응 채널 필터들을 다채널 최소 평균 제곱법에 의해 갱신하는 단계: (e) 갱신된 적응 채널 필터를 실제 채널 필터의 선험적 정보를 이용하여 최종 갱신하는 단계: (f) 적응 채널 필터로부터 직접경로의 시간 지연을 파악하고 센서간 시간 지연 차이로부터 음원 위치를 추정하는 단계: 를 구비하고, 상기 (e)단계에서 적응 채널 필터를 갱신할 때 음향 채널 특성을 적용한다. 상기 음향 채널 특성은 채널 필터 계수들이 '성김(sparsity)' 분포를 갖는 특성을 이용함으로써, 보다 더 정확하게 직접경로의 시간 지연을 추정할 수 있게 된다.
음원 위치 탐지, 음향 채널, 추정

Description

음향 채널 추정에 기반한 음원 위치 탐지 방법{Method for sound source localization based on acoustic channel estimation}
본 발명은 다채널 최소 평균 제곱법에 기반한 음향 채널 추정을 이용하여 음원 위치를 탐지하는 방법에 관한 것으로서, 보다 구체적으로는 음성신호 표본사이의 강한 상관도, 높은 반향 시간 환경에서도 음원 위치 탐지가 정확히 추정될 수 있도록 기존 알고리즘을 적용하되 음향 환경의 ‘성김’ 특성을 도입하여 그 성능을 개선하는 기술에 관한 것이다.
음원에서 소리가 발생하여 다수의 마이크에 도달하는 데 소요되는 시간은 소리의 마이크 위치에 따른 경로마다 다르다. 따라서, 신호가 마이크에 도달하는 시간차를 정확히 추정한다면, 음원과 마이크 사이의 거리, 방향 등을 결정할 수 있다. 음원 위치 탐지 알고리즘은 이러한 특성을 이용하여 두 개 또는 그 이상의 마이크에 도달하는 신호의 시간차를 추정하여 음원의 위치를 탐지하게 된다. 그러나, 반향이 있는 환경에서는 음원에서 마이크까지 직접적으로 도달하는 직선 경로 신호 외에 반향을 통해서 실제 음원의 위치와 다른 방향에서 마이크에 도달하는 신호도 발생하게 되어 이 반향 성분이 음원 위치 탐지를 방해하는 요소로 작용하게 된다.
음원의 위치를 탐지하기 위한 알고리즘은 대체적으로 교차상관(cross-correlation)값에 기반한 방법과 음원에서 마이크까지의 음향 채널 필터를 직접 구하는 두 가지로 구분할 수 있다. 교차상관값에 기반한 방법은 일반화된 교차상관함수의 최대값에 해당하는 시간차를 구하는 방법이다. 이 방법은 간단하면서도 반향이 없는 환경에서 마이크에 도달하는 신호간의 시간차를 비교적 정확하게 찾아낼 수 있어서 가장 보편적으로 사용되는 방법이지만, 반향이 있는 환경에서는 반향 성분으로 인해서 교차상관값이 교란되어 그 성능이 크게 저하되는 문제점을 가지고 있다.
이와는 반대로, 음원에서 마이크까지의 음향 채널 필터를 직접 구한 후, 그 필터에서 직선 경로의 시간지연값을 비교하여 그 차이를 시간차로 추정하는 방법이 있다. 이 방법은 반향을 채널 필터에 온전히 고려할 수 있기 때문에, 반향이 있는 일반적인 실내 환경에서 음원의 위치를 탐지함에 있어서 반향 성분에 상대적으로 둔감하게 영향을 받는다. 이 음향 채널 필터를 직접 구하기 위한 다양한 방법들 중에서도 특히 적응 고유값 분할 방법은 잡음이 있는 반향 환경에서 기존 방법들 중에 가장 뛰어난 성능을 나타내고 있어서 각광을 받고 있다.
일반적으로 음향 채널 필터는 매우 많은 필터 계수로 구성되어 있다. 적응 고유값 분할 방법은 비용함수를 최소화하여 채널을 추정하기 때문에, 많은 수의 채널 계수를 정확히 결정하기 위해서는 매우 많은 데이터를 필요로 한다. 하지만, 실제적으로 특정 위치의 화자가 말한 데이터의 양이 너무 적은 경우가 많다. 또한, 비용함수는 채널들 간의 상관관계에 기초한 오차신호를 척도로 하기 때문에, 채널 들간의 상대적인 값에 의존한다. 따라서 더 적은 비용함수를 제공하는 추정 채널이라고 해서 꼭 원래 채널에 더 가깝다고 할 수 없다. 더구나 이런 경우에, 오차신호를 줄임에 있어서 두 컨볼루션(convolution) 결과가 같아지도록 하는 것 외에도 각 컨볼루션 결과의 절대치가 전체적으로 작아지도록 할 수도 있다. 특히, 음성은 이웃한 표본값 사이의 상관도가 매우 높기 때문에 필터 계수를 추정할 때, 후자의 기여도가 상당히 크고 상관도가 높은 신호에 대해서 컨볼루션(convolution) 결과의 절대치를 작게 하기 위해 추정된 채널이 자주 백색화 현상을 겪게 된다. 이 백색화 현상은 실제로 적응 고유값 분할 방법을 음성 신호에 적용한 추정 채널에서 최대값과 그 외 큰 값들의 차이가 크지 않아서 직선 경로에 해당하는 시간지연을 정확히 파악하기가 어려운 문제점이 있다.
음원과 센서들 사이의 채널 필터는 센서 신호간 상관 행렬의 고유값 분할을 위해 비용함수를 최소화하는 다채널 최소 평균 제곱법에 의해 추정될 수 있다. 실제 적인 문제에 적용을 위해서 모든 데이터를 축적한 후 그에 대한 평균을 사용하지 않고 매 입력 데이터에 대해서 적응 채널 필터의 갱신을 반복한다. 이때, 추정된 채널 필터들의 직접경로 반응의 위치를 비교해서 음원과 센서들 사이의 신호가 도달한 시간 차이를 추정할 수 있다. 추정된 시간 지연 차이를 센서의 방향, 거리 등의 정보와 결합해서 음원의 위치를 탐지할 수 있다. 이하, 일반적으로 수행되는 다채널 최소 평균 제곱법에 대하여 설명한다.
먼저, 반향 환경에서 센서의 탐지된 신호는 다음과 같이 표현할 수 있다.
Figure 112009018474951-pat00001
여기서,
Figure 112009018474951-pat00002
,
Figure 112009018474951-pat00003
,
Figure 112009018474951-pat00004
은 각각 음원의 신호, 음원과 i 번째 센서 사이의 채널 필터, 센서의 잡음을 나타낸다. 또, M은 센서의 개수이다. 만약 잡음 신호를 무시할 수 있다고 한다면 임의의 두 센서의 신호에 대해 다음 식이 성립함을 알 수 있다.
Figure 112009018474951-pat00005
이제, i 번째와 j 번째 센서의 신호를 교차시켜 다음과 같은 오류 신호를 정의한다.
Figure 112009018474951-pat00006
Figure 112009018474951-pat00007
,
Figure 112009018474951-pat00008
은 각각 i 번째 센서에서 관찰한 신호, i 번째 센서와 음원간의 채널 필터를 벡터 형식으로 표현한 것이다. L 은 채널 필터의 길이이다. 채널 필터의 모든 요소들이 0으로 가는 명백한 해를 막기 위해 비용함수를 다음과 같이 표현한다.
Figure 112009018474951-pat00009
이 때, 비용함수를 최소로 하는 채널 필터를 얻기 위한 수식을 단순화시킨 최소평균 제곱법은 다음과 같다.
Figure 112009018474951-pat00010
적응 채널 필터
Figure 112009018474951-pat00011
의 모든 계수 값이 0이 되지 않도록 하기 위해 필터 벡터
Figure 112009018474951-pat00012
는 갱신할 때마다 놈(norm)이 1을 갖도록 정규화한다. 채널 필터가 추정될 때, i 번째와 j 번째 센서사이의 시간 지연은 채널 필터의 직접경로의 차이로서 다음과 같이 결정된다.
Figure 112009018474951-pat00013
비록 앞에서 정의한 비용 함수를 최소화하기 위해, 시간 영역에서의 다채널 최소 자승 알고리즘을 이용할 수 있지만 수렴속도가 느리다는 단점이 있다. 수렴속도를 개선하고 계산량을 줄이기 위해서, 위 시간 영역에서의 알고리즘을 주파수 영역으로 확장하는 것도 가능하다. 정규화된 다채널 주파수영역 최소 평균 제곱법은 푸리에 변환과 겹침 저장 방법을 기반으로 한다. 이 알고리즘은 입력 데이터를 블락 형식으로 처리하기 때문에 블락을 형성하기 위한 시간 지연을 피할 수 없지만, 대부분의 응용에서 이는 무시할 만하다. 앞에서 정의한 오류 신호는 겹침 저장 방법에 의해서 효율적으로 계산된다. m 번째 입력 블락에 대한 오류 신호는 다음과 같이 주어진다.
Figure 112009018474951-pat00014
여기서,
Figure 112009018474951-pat00015
은 주파수영역에서 채널필터를 나타내며 수식적으로
Figure 112009018474951-pat00016
와 같이 표현된다. 한편, F{ㆍ}은 이산 푸리에 변환을 나타내고 0 는 L 개의 요소로 이루어진 영 벡터를 표현한다. 또,
Figure 112009018474951-pat00017
은 대각 요소들의 값을 다음과 같이 갖는 대각행렬이다.
Figure 112009018474951-pat00018
정규화된 다채널 주파수 최소 평균 제곱법의
Figure 112009018474951-pat00019
에서 변화량은 다음과 같이 주어진다.
Figure 112009018474951-pat00020
δ는 분모가 0과 가까워지는 것을 방지하기 위한 작은 양수 값이고 ( * ) 은 켤레 복소수를 나타낸다. 주파수 영역에서의 블락 오류 벡터는 다음과 같이 결정된다.
Figure 112009018474951-pat00021
다채널 관찰 신호의 파워 스펙트럼
Figure 112009018474951-pat00022
은 다음과 같은 재귀식으로 안정적으로 얻을 수 있다.
Figure 112009018474951-pat00023
위 식에서 λ는 망각 계수이다.
매번 학습시마다 채널 필터의 모든 요소들이 0으로 가는 명백한 해를 막기 위해서 채널 필터 벡터의 놈을 1로 정규화 한다.
도 1은 종래의 방법에 따른 두 센서에 대한 정규화된 다채널 최소 평균 제곱법의 구조를 나타내고 있다. 도 1을 참조하면, 신호원(10)으로부터 나온 음성 신호(s(n))는 각 음향 채널 필터(20, 30)를 통과하고, 음향 채널 필터를 통과된 신호(X1(z), X2(z))는 다시 적응 채널 필터(40, 50)를 통과하고, 그 때 발생한 두 신호간의 차이인 오차 신호(E(z))를 이용하여 적응 채널 필터(40, 50)를 갱신한다. 이 구조는 센서의 개수를 2개뿐만 아니라 그 이상의 개수로 손쉽게 확장이 가능하다.
그러나 정규화된 다채널 최소 평균 제곱법을 실제적인 음성 신호에 적용하면 음성 신호의 강한 상관도 때문에 적응 채널 필터가 백색화 현상을 겪어 본래 추정하려는 원 채널과는 다르게 결과를 나타내는 경향이 있다. 이는 비용함수가 상호 채널들 간의 상대적인 값에 기반한 에러 신호로 정의되기 때문이다. 이렇게 추정된 채널 필터들에서 직접경로 사이의 표본간 지연이 부정확하여 음원의 위치를 잘못 탐지할 수 있다.
이에, 본 발명은 상기한 문제점을 해결하기 위한 것으로서, 본 발명의 목적은 음원 위치 탐지 시스템에 있어서, 추정된 채널 필터에서 음원에서 센서까지의 직접 경로의 시간 지연 추정의 성능을 향상시키기 위해 일반적인 음향 환경의 특성을 이용하는 방법을 제공하는 것이다.
일반적인 음향 환경의 채널 필터는 백색화 현상을 겪기보다 일부를 제외한 대부분의 채널 계수들이 0에 가까운 값으로 채워져 있다. 즉, 채널 계수들은 ‘성긴’ 확률 분포를 가지게 된다. 더욱이, 음원 위치 탐지는 채널 필터에서 직접 경로에 해당하는 표본의 시간 지연 값에만 관련되어 있다. 따라서 본 발명은 음원 위치 탐지를 위해 직접경로에 해당하는 표본간 시간지연 차이를 더욱 효과적으로 추정하기 위해서 채널 필터를 추정하는 동안에 필터 계수들에 ‘성긴’ 분포를 반영하는 방법을 제시한다.
전술한 기술적 과제를 달성하기 위한 본 발명의 특징은, 다수 개의 센서를 구비하고 음원과 각 센서 사이의 직접 경로간의 표본 시간차를 얻는 음원 위치 탐지기에서의 음향 채널 추정 방법에 관한 것으로서, 상기 음향 채널 추정 기반 음원 위치 탐지 방법은,
(a) 적응 채널 필터를 초기화하는 단계; (b) 각 센서로부터 신호들을 입력받는 단계; (c) 각 센서로부터 입력된 신호들을 적응 채널 필터들에 통과시킨후, 상 기 통과된 신호들간의 차이에 따른 오류 신호를 검출하는 단계; (d) 검출된 오류 신호를 이용하여 상기 적응 채널 필터를 다채널 최소 평균 제곱법에 의해 갱신하는 단계; (e) 상기 갱신된 적응 채널 필터에 실제 음향 채널의 선험적 정보를 적용하여 다시 갱신하는 단계; (f) 적응 채널 필터로부터 직접경로의 시간 지연을 파악하고 센서간 시간 지연 차이로부터 음원 위치를 추정하는 단계; 를 구비하고, 상기 (e) 단계의 선험적 정보는 음향 채널 특성을 표현한 정보이며, 특히 상기 음향 채널 특성은 채널 필터 계수들이 '성김(sparsity)' 분포를 갖는 특성인 것이 가장 바람직하다.
전술한 특징을 갖는 음향 채널 추정 기반 음원 위치 탐지 방법에 있어서, 상기 (e) 단계에 의해 갱신된 적응 채널 필터를 이용하여 지연 시간을 검출하고 검출된 지연 시간을 이용하여 음원 위치를 검출함과 동시에, 단계 (b)로 되돌아가서 입력된 신호들에 대하여 적응 채널 필터를 반복적으로 갱신하는 것이 바람직하다.
전술한 특징을 갖는 음향 채널 추정 기반 음원 위치 탐지 방법에 있어서, 음향 채널의 채널 필터 계수들의 '성김' 분포 특성은 수학식 16 또는 17에 의해 표현되는 것이 바람직하다.
전술한 특징을 갖는 음향 채널 추정 기반 음원 위치 탐지 방법에 있어서, 상기 적응 채널 필터는 다채널 최소 평균 제곱법을 이용하여 상기 오류 신호의 크기를 최소화하도록 결정한 후, 음향 채널 필터의 선험적 특성을 반영하는 것이 바람직하다.
전술한 특징을 갖는 음향 채널 추정 기반 음원 위치 탐지 방법에 있어서, 상 기 채널 필터를 추정할 때 음향 채널 특성에 대한 정보를 확률 밀도 함수에 적용하는 것이 바람직하다.
본 발명에 의하여, 정규화된 다채널 최소 평균 제곱법에 ‘성김’ 특성을 추가함으로써, 종래의 방법에 비하여 수렴 속도, 직접 경로 표본간의 시간 지연차의 정확도 면에서 더욱 개선된 성능을 얻을 수 있다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 따른 음향 채널 추정 기반 음원 위치 탐지 방법에 대하여 구체적으로 설명한다. 본 발명에 따른 음향 채널 추정 기반 음원 위치 탐지 방법은, 다수 개의 센서를 구비하고 음원과 각 센서 사이의 직접 경로간의 표본 시간차를 얻는 음원 위치 탐지기에 있어서 음원 위치 탐지를 위해 음원과 센서들간의 채널 필터를 정확하게 추정하는 방법으로서, 채널 필터를 추정할 때 음향 채널의 선험적 정보인 필터 계수들의‘성김’분포 특성을 수식화하고, 이를 이용하여 채널 필터를 추정하게 되며, 그 결과 기존의 정규화된 다채널 최소 평균 제곱법에 필터 계수들의‘성김’분포 특성을 추가하여 그 성능을 개선하는 것을 특징으로 한다.
도 2는 본 발명의 바람직한 실시예에 따른 음향 채널 추정 기반 음원 위치 탐지 방법을 개념적으로 설명하기 위하여 도시한 구조도이며, 도 3은 본 발명의 바람직한 실시예에 따른 음향 채널 추정 기반 음원 위치 탐지 방법을 순차적으로 도 시한 흐름도이다.
만약 원래 채널 필터에 대한 유용한 선험적 정보를 이용한다면, 강한 상관도를 갖는 입력신호를 사용하거나 반향이 큰 것과 같은 복잡한 음향 환경, 한정된 입력 신호에 대해서 더 정확한 채널 필터를 추정할 수 있을 것이다. 일반적으로 음향 채널 필터의 직접경로에 해당하는 앞부분은 많은 계수가 0으로 채워져 있어, 필터 계수들이‘성김(sparcity)’분포 특성을 갖는다. 또, 추정하고자 하는 채널의 모든 계수의 값을 알 필요는 없다. 그러므로 적응 채널 필터에 전술한 ‘성김’분포 특성을 부여한다면 백색화 현상을 피하고 음원의 위치와 연관있는 직접경로의 표본간의 시간 지연차를 더 효율적으로 추정할 수 있을 것이다. 본 발명에 따른 음향 채널 추정 기반 음원 위치 탐지 방법은 전술한 음향 채널 특성을 이용하고자 한다.
채널 필터를 추정하는 중에,‘성김’ 특성을 다음과 같이 부여할 수 있다.
Figure 112009018474951-pat00024
G(·)는 정규분포보다 더 ‘성긴’ 확률 밀도 분포의 로그를 나타낸다. 여기서, 간편성을 위해 채널 필터의 계수가 독립적 동일 분포에 의해 발생한다고 가정하고 추정한 필터 계수가 정규 분포보다 더‘성긴’확률 밀도 분포로서 라플라시안 확률 밀도 분포에 접근하도록 다음과 같은 식을 적용할 수 있다.
Figure 112009018474951-pat00025
수학식 13은 비용 함수를 최소화하기 위해 정규화된 다채널 최소 평균 제곱법과 결합되어야 한다. 특히 정규화된 다채널 주파수 영역 최소 평균 제곱법에서는 비록 2L 표본 푸리에 변환 후 주파수 영역에서 채널 갱신이 이루어지지만 서큘러 컨볼루션의 오류를 피하기 위해서 적응 채널 필터의 길이가 L 또는 그 보다 더 짧아지도록 만들기 위해 역 푸리에 변환을 수행해야 한다. 따라서 계산량을 거의 증가시키지 않고 ‘성김’ 특성 반영이 가능하다.
도 2는 본 발명에 따른 음향 채널 필터의 ‘성김’ 특성을 이용한 알고리즘의 구조를 나타내고 있다. 도 1에서 갱신된 적응 채널 필터의 계수들을 기반으로 최종 갱신된 채널 필터가 ‘성김’ 특성을 갖도록 함수 sgn{·} 등을 이용해 자체적인 되먹임을 해준다.
도 2 및 도 3을 참조하면, 본 발명에 따른 음향 채널 추정 기반 음원 위치 탐지 방법은 먼저 적응 채널 필터를 초기화한다(단계 300). 다음, 각 센서로부터 신호들을 입력받는다(단계 310). 여기서, 각 센서는 각 마이크를 의미한다.
다음, 각 센서로부터 입력된 신호들을 적응 채널 필터들을 통과시킨 후, 상기 통과된 신호들간의 차이에 따른 오류 신호를 검출한다(단계 320). 상기 오류 신호는 수학식 3에 의해 정의되며 최소화하여야 하는 비용함수는 수학식 4에 의해 정의된다.
다음, 음원과 각 센서들 사이의 적응 채널 필터들을 다채널 최소 평균 제곱법을 이용하여 갱신한다. 다채널 최소 평균 제곱법은 일반적인 기술로서 앞에서 설명한 바와 동일하므로, 중복되는 설명은 생략한다(단계 330 및 도 2의 (A)).
다음, 적응 채널 필터에 음향 채널 특성을 적용하여 적응 채널 필터를 최종 갱신한다(단계 340 및 도 2의 (B)). 상기 적응 채널 필터를 갱신할 때 적용되는 상기 음향 채널 특성은 채널 필터 계수들이 '성김' 분포를 갖는 특성으로서, 음향 채널의 채널 필터 계수들의 '성김' 분포 특성은 아래의 수학식에 의해 표현될 수 있다.
Figure 112009018474951-pat00026
여기서,
Figure 112009018474951-pat00027
Figure 112009018474951-pat00028
는 각각 적응 채널 필터와 그 계수를,
Figure 112009018474951-pat00029
는 적응 채널 필터 계수들의 실제 확률 밀도 함수를 나타낸다.
한편, 본 발명에 따른 상기 음향 채널의 채널 필터 계수들의 '성김(sparsity)' 분포 특성의 다른 실시 형태는 아래의 수학식에 의해 표현될 수 있다.
Figure 112009018474951-pat00030
여기서,
Figure 112009018474951-pat00031
는 적응 채널 필터 계수를, sgn{·}는 signum함수를 나타낸다.
전술한 수학식들에 의해 표현된 음향 채널 특성인 '성김' 분포 특성은 확률 밀도 함수에 적용하게 된다. 특히, 상기 확률 밀도 함수는 정규 분포보다 더 '성긴' 확률 밀도 분포인 라플라시안 확률 밀도 분포에 접근하는 것이 바람직하다.
다음, 적응 채널 필터간의 직접 경로차이를 이용하여 지연 시간 및 음원 위치를 검출한다(단계 340). 단계 340을 진행함과 동시에 단계 310으로 되돌아가서 입력된 신호들에 대하여 적응 채널 필터를 갱신하는 과정을 반복적으로 수행한다.
전술한 구성을 갖는 본 발명에 따른 음향 채널 추정 기반 음원 위치 탐지 방법은 음향 채널의 필터 계수들의‘성김’분포 특성을 이용함으로써, 실제 채널과 동일한 필터의 추정을 꾀하여 정확한 음원 위치 탐지방법을 제시할 수 있게 된다. 따라서, 본 발명에서처럼 선험적 정보를 이용한 채널 필터 학습 방법을 사용하면 선험적 정보를 이용하지 않은 방법에 비하여 더 개선된 음원 위치 탐지를 수행할 수 있다.
한편, 다채널 최소 평균 제곱법에 기반하여 음향 채널 필터를 추정함에 있어서 ‘성김’ 특성을 반영하기 위해 기존의 정규화된 다채널 최소 평균 제곱법에 함수 sgn{·} 등을 이용하여 자체적인 되먹임 구조를 추가하였다.
이상에서 본 발명에 대하여 그 바람직한 실시예를 중심으로 설명하였으나, 이는 단지 예시일 뿐 본 발명을 한정하는 것이 아니며, 본 발명이 속하는 분야의 통상의 지식을 가진 자라면 본 발명의 본질적인 특성을 벗어나지 않는 범위에서 이상에 예시되지 않은 여러 가지의 변형과 응용이 가능함을 알 수 있을 것이다. 그리고, 이러한 변형과 응용에 관계된 차이점들은 첨부된 청구 범위에서 규정하는 본 발명의 범위에 포함되는 것으로 해석되어야 할 것이다.
본 발명에 따른 음향 채널 추정 기반 음원 위치 탐지 방법은 상당한 반향이 수반되는 일반적인 실내 환경에서 음원의 위치를 안정적으로 파악할 수 있게 된다.
도 1은 종래의 기술에 따른 정규화된 다채널 최소 자승 알고리즘을 설명하기 위하여 도시한 구조도이다.
도 2는 본 발명의 바람직한 실시예에 따른 음향 채널 추정 기반 음원 위치 탐지 방법을 설명하기 위하여 도시한 구조도이다.
도 3은 본 발명의 바람직한 실시예에 따른 음향 채널 추정 기반 음원 위치 탐지 방법을 순차적으로 도시한 흐름도이다.
< 도면의 주요 부분에 대한 부호의 설명>
10: 신호원 20: 제2 실제 음향 채널 필터
30: 제1 실제 음향 채널 필터 40: 제1 적응 채널 필터
50: 제2 적응 채널 필터 60: 덧셈기

Claims (7)

  1. 다수 개의 센서를 구비하고 음원과 각 센서 사이의 직접 경로간의 표본 시간차를 얻는 음원 위치 탐지기에서의 음향 채널 추정에 기반한 음원 위치 탐지 방법에 있어서
    (a) 적응 채널 필터를 초기화하는 단계;
    (b) 각 센서로부터 신호들을 입력받는 단계;
    (c) 각 센서로부터 입력된 신호들을 적응 채널 필터들에 통과시킨후, 상기 통과된 신호들간의 차이에 따른 오류 신호를 검출하는 단계;
    (d) 검출된 오류 신호를 이용하여 상기 적응 채널 필터를 다채널 최소 평균 제곱법에 의해 갱신하는 단계;
    (e) 상기 갱신된 적응 채널 필터에 실제 음향 채널의 선험적 정보를 적용하여 다시 갱신하는 단계;
    (f) 갱신된 적응 채널 필터로부터 센서간의 직접경로의 시간 지연을 파악하고, 센서간 시간 지연 차이로부터 음원 위치를 추정하는 단계;
    를 구비하고,
    상기 (f) 단계에 의해 갱신된 적응 채널 필터를 이용하여 지연 시간을 검출하고 검출된 지연 시간을 이용하여 음원 위치를 검출함과 동시에, 단계 (b)로 되돌아가서 입력된 신호들에 대하여 적응 채널 필터를 반복적으로 갱신하고,
    상기 (e) 단계의 선험적 정보는 음향 채널 특성을 표현한 정보인 것을 특징으로 하는 음향 채널 추정 기반 음원 위치 탐지 방법.
  2. 삭제
  3. 제1항에 있어서, 상기 적응 채널 필터를 갱신 때 적용되는 상기 음향 채널 특성은 채널 필터 계수들이 '성김(sparsity)' 분포를 갖는 특성인 것을 특징으로 하는 음향 채널 추정 기반 음원 위치 탐지 방법.
  4. 제3항에 있어서, 음향 채널의 채널 필터 계수들의 '성김' 분포 특성은 아래의 수학식에 의해 표현되는 것을 특징으로 하는 음향 채널 추정 기반 음원 위치 탐지 방법.
    Figure 112009018474951-pat00032
    (여기서,
    Figure 112009018474951-pat00033
    Figure 112009018474951-pat00034
    는 각각 적응 채널 필터와 그 계수를,
    Figure 112009018474951-pat00035
    는 적응 채널 필터 계수들의 실제 확률 밀도 함수를 나타냄. )
  5. 제3항에 있어서, 음향 채널의 채널 필터 계수들의 '성김' 분포 특성은 아래의 수학식에 의해 표현되는 것을 특징으로 하는 음향 채널 추정 기반 음원 위치 탐 지 방법.
    Figure 112009018474951-pat00036
    (여기서,
    Figure 112009018474951-pat00037
    는 적응 채널 필터 계수를, sgn{·}는 signum함수를 나타냄. )
  6. 제1항에 있어서, 상기 적응 채널 필터는 다채널 최소 평균 제곱법을 이용하여 상기 오류 신호의 크기를 최소화하도록 결정한 후, 음향 채널 필터의 선험적 특성을 반영하는 것을 특징으로 하는 음향 채널 추정 기반 음원 위치 탐지 방법.
  7. 제1항에 있어서, 상기 채널 필터를 추정할 때 음향 채널 특성에 대한 정보를 확률 밀도 함수에 적용하는 것을 특징으로 하는 음향 채널 추정 기반 음원 위치 탐지 방법.
KR1020090026233A 2009-03-27 2009-03-27 음향 채널 추정에 기반한 음원 위치 탐지 방법 KR101021800B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090026233A KR101021800B1 (ko) 2009-03-27 2009-03-27 음향 채널 추정에 기반한 음원 위치 탐지 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090026233A KR101021800B1 (ko) 2009-03-27 2009-03-27 음향 채널 추정에 기반한 음원 위치 탐지 방법

Publications (2)

Publication Number Publication Date
KR20100107893A KR20100107893A (ko) 2010-10-06
KR101021800B1 true KR101021800B1 (ko) 2011-03-17

Family

ID=43129543

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090026233A KR101021800B1 (ko) 2009-03-27 2009-03-27 음향 채널 추정에 기반한 음원 위치 탐지 방법

Country Status (1)

Country Link
KR (1) KR101021800B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101721424B1 (ko) * 2015-12-31 2017-03-31 서강대학교산학협력단 독립성분분석을 기반으로 한 반향에 강인한 다음원 탐지 방법
KR102044393B1 (ko) * 2017-08-24 2019-11-13 서강대학교산학협력단 오차 신호를 기반으로 한 음원 위치 탐색 방법 및 음원 위치 탐색 장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100499124B1 (ko) 2002-03-27 2005-07-04 삼성전자주식회사 직교 원형 마이크 어레이 시스템 및 이를 이용한 음원의3차원 방향을 검출하는 방법
KR100873000B1 (ko) * 2007-03-28 2008-12-09 경상대학교산학협력단 마이크 어레이를 이용한 방향성 음원 필터링 시스템 및 그방법
KR100877914B1 (ko) 2007-01-25 2009-01-12 한국과학기술연구원 음원위치-지연시간차 상관관계 역 추정에 의한 음원 방향검지 시스템 및 방법
KR20090098426A (ko) * 2008-03-14 2009-09-17 (주)엘리더스 적응 필터를 이용한 마이크로폰 어레이 시스템에서 음원 방향 자동추출 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100499124B1 (ko) 2002-03-27 2005-07-04 삼성전자주식회사 직교 원형 마이크 어레이 시스템 및 이를 이용한 음원의3차원 방향을 검출하는 방법
KR100877914B1 (ko) 2007-01-25 2009-01-12 한국과학기술연구원 음원위치-지연시간차 상관관계 역 추정에 의한 음원 방향검지 시스템 및 방법
KR100873000B1 (ko) * 2007-03-28 2008-12-09 경상대학교산학협력단 마이크 어레이를 이용한 방향성 음원 필터링 시스템 및 그방법
KR20090098426A (ko) * 2008-03-14 2009-09-17 (주)엘리더스 적응 필터를 이용한 마이크로폰 어레이 시스템에서 음원 방향 자동추출 방법

Also Published As

Publication number Publication date
KR20100107893A (ko) 2010-10-06

Similar Documents

Publication Publication Date Title
US7693287B2 (en) Sound source localization based on binaural signals
CN105409241B (zh) 麦克风校准
EP1931169A1 (en) Post filter for microphone array
US20020138254A1 (en) Method and apparatus for processing speech signals
KR102004513B1 (ko) 빔포밍 애플리케이션들을 위한 적응형 위상-왜곡없는 MRE(Magnitude Response Equalization)
CN111798869B (zh) 一种基于双麦克风阵列的声源定位方法
WO2010109711A1 (ja) 音声処理装置、音声処理方法、及び、プログラム
JP2010175431A (ja) 音源方向推定装置とその方法と、プログラム
KR101021800B1 (ko) 음향 채널 추정에 기반한 음원 위치 탐지 방법
Astudillo et al. Integration of beamforming and uncertainty-of-observation techniques for robust ASR in multi-source environments
KR102048370B1 (ko) 우도 최대화를 이용한 빔포밍 방법
US10219098B2 (en) Location estimation of active speaker
Takashima et al. HMM-based separation of acoustic transfer function for single-channel sound source localization
Klein et al. Direction-of-arrival estimation using a microphone array with the multichannel cross-correlation method
JP3862685B2 (ja) 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム
KR101054071B1 (ko) 음성과 비음성 구간 판별 방법 및 장치
KR101068666B1 (ko) 잡음 환경에서 적응적인 잡음 제거도에 기초한 잡음 제거 방법 및 장치
Moore et al. Linear prediction based dereverberation for spherical microphone arrays
Astapov et al. Far field speech enhancement at low SNR in presence of nonstationary noise based on spectral masking and MVDR beamforming
Kawase et al. Real-time integration of statistical model-based speech enhancement with unsupervised noise PSD estimation using microphone array
Gburrek et al. On source-microphone distance estimation using convolutional recurrent neural networks
Datta et al. Dense-U-Net assisted Localization of Speech Sources in Motion under Reverberant conditions
Gannot et al. The Kalman filter
CN113707171B (zh) 一种空域滤波语音增强系统及方法
Mizumachi et al. Design of robust subtractive beamformer for noisy speech recognition

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140310

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150304

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160223

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170306

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20180226

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20190403

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20200304

Year of fee payment: 10