KR101046683B1 - 음원의 크기를 추정하는 장치 및 방법 - Google Patents

음원의 크기를 추정하는 장치 및 방법 Download PDF

Info

Publication number
KR101046683B1
KR101046683B1 KR1020090067625A KR20090067625A KR101046683B1 KR 101046683 B1 KR101046683 B1 KR 101046683B1 KR 1020090067625 A KR1020090067625 A KR 1020090067625A KR 20090067625 A KR20090067625 A KR 20090067625A KR 101046683 B1 KR101046683 B1 KR 101046683B1
Authority
KR
South Korea
Prior art keywords
gcc
sound source
coordinate system
size
value
Prior art date
Application number
KR1020090067625A
Other languages
English (en)
Other versions
KR20110010193A (ko
Inventor
박영진
현 조
권병호
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020090067625A priority Critical patent/KR101046683B1/ko
Publication of KR20110010193A publication Critical patent/KR20110010193A/ko
Application granted granted Critical
Publication of KR101046683B1 publication Critical patent/KR101046683B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/008Visual indication of individual signal levels
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H11/00Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves by detecting changes in electric or magnetic properties
    • G01H11/02Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves by detecting changes in electric or magnetic properties by magnetic means, e.g. reluctance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Acoustics & Sound (AREA)
  • Otolaryngology (AREA)
  • Computational Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Pure & Applied Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

개시된 기술은 음원의 크기를 추정하는 장치 및 방법에 관한 것이다.
일실시예에 따른 음원의 크기를 추정하는 장치는 복수의 마이크로폰들 중 서로 다른 두 개의 마이크로폰 조합으로 이루어진 n개의 마이크로폰 쌍에 있어서, 제m(1 내지 n) 마이크로폰 쌍에 대한 제m(1 내지 n) 일반화된 상호상관값 (Generalized Cross Correlation: 이하, GCC) 시퀀스(sequence)를 계산하는 상호상관값 계산부; 상기 복수의 마이크로폰들이 설치된 플랫폼에 따라 미리 정해진 제m(1 내지 n) 사상함수(mapping function)를 이용하여 상기 제m GCC 시퀀스를 시간 좌표계에서 기준 공간 좌표계로 사상(mapping)하는 사상함수 적용부; 및 상기 제1 내지 제n GCC 시퀀스의 사상 결과를 기초로 음원의 크기를 추정하는 추정부를 포함한다.

Description

음원의 크기를 추정하는 장치 및 방법{APPARATUS AND METHOD FOR ESTIMATING THE SIZE AND THE LOCATION OF SOUND SOURCE}
개시된 기술은 음원의 크기를 추정하는 장치 및 방법에 관한 것이다.
음원 위치 추정 기술은 마이크로폰 어레이 등의 음향 센서들을 사용하여 음원 및 화자의 위치를 파악하는 기술로서, 로봇 관련 시스템(예컨대, 음원인 사용자를 위치 추정하여, 사용자에게 다가가는 인간형 로봇 또는 위치 이동 로봇을 포함하는 시스템), 폐회로 감시 시스템(예컨대, 음원을 촬영대상으로 간주하여, 음원을 위치 추정하여 촬영하는 시스템), 입체 음향 등 다양한 용도로 활용되고 있다.
음원 위치 추정 방식 중 마이크로폰 어레이 방식은 각 마이크로폰 쌍에서 수신된 두 신호의 도착시간지연(Time Delay of Arrival: 이하 TDOA)를 추정한 후, 마이크로폰 쌍들 간의 기하학적 관계 및 상기 추정된 TDOA 값들을 이용하여 음원 위치를 추정하는 방식이다.
한편, 음원의 특성을 보다 정확하게 파악하기 위하여 음원의 위치뿐만 아니라 음원의 크기를 추정하는 기술이 요구된다.
개시된 기술이 이루고자 하는 기술적 과제는 음원의 크기를 추정하는 장치 및 방법을 제공하는 데 있다.
상기의 기술적 과제를 이루기 위하여 개시된 기술의 제1 측면은 복수의 마이크로폰들 중 서로 다른 두 개의 마이크로폰 조합으로 이루어진 n개의 마이크로폰 쌍에 있어서, 제m(1 내지 n) 마이크로폰 쌍에 대한 제m(1 내지 n) 일반화된 상호상관값 (Generalized Cross Correlation: 이하, GCC) 시퀀스 (sequence)를 계산하는 상호상관값 계산부; 상기 복수의 마이크로폰들이 설치된 플랫폼에 따라 미리 정해진 제m(1 내지 n) 사상함수(mapping function)를 이용하여 상기 제m GCC 시퀀스를 시간 좌표계에서 기준 공간 좌표계로 사상(mapping)하는 사상함수 적용부; 및 상기 제1 내지 제n GCC 시퀀스의 사상 결과를 기초로 음원의 크기를 추정하는 추정부를 포함하는 음원의 크기를 추정하는 장치를 제공한다
상기의 기술적 과제를 이루기 위하여 개시된 기술의 제2 측면은 (a) 복수의 마이크로폰들 중 서로 다른 두 개의 마이크로폰 조합으로 이루어진 n개의 마이크로폰 쌍에 있어서, 제m(1 내지 n) 마이크로폰 쌍에 대한 제m(1 내지 n) GCC 시퀀스를 계산하는 단계; (b) 상기 복수의 마이크로폰들이 설치된 플랫폼에 따라 미리 정해진 제m(1 내지 n) 사상함수(mapping function)를 이용하여 상기 제m GCC 시퀀스를 시간 좌표계에서 기준 공간 좌표계로 사상(mapping)하는 단계; 및 (c) 상기 제1 내 지 제n GCC 시퀀스의 사상 결과를 기초로 음원의 크기를 추정하는 단계를 포함하는 음원의 크기를 추정하는 방법을 제공한다.
상기의 기술적 과제를 이루기 위하여 개시된 기술의 제3 측면은 상술한 음원 위치 추정 방법을 컴퓨터 상에서 실행시키기 위한 프로그램을 수록한 컴퓨터로 읽을 수 있는 기록 매체를 제공한다.
개시된 기술의 실시예들은 다음의 장점들을 포함하는 효과를 가질 수 있다. 다만, 개시된 기술의 실시예들이 이를 전부 포함하여야 한다는 의미는 아니므로, 개시된 기술의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.
개시된 기술의 일 실시예에 따르면, 음원의 위치뿐 아니라 음원의 크기를 추정할 수 있다. 또한, 개시된 기술에 의하면, 적은 개수의 마이크로폰을 사용하여 음원의 위치 추정 및 크기 추정이 가능하며, 앞뒤 혼동에도 강인한 특성을 보인다.
개시된 기술에 관한 설명은 구조적 내지 기능적 설명을 위한 실시예에 불과하므로, 개시된 기술의 권리범위는 본문에 설명된 실시예에 의하여 제한되는 것으로 해석되어서는 아니 된다. 즉, 실시예는 다양한 변경이 가능하고 여러 가지 형태를 가질 수 있으므로 개시된 기술의 권리범위는 기술적 사상을 실현할 수 있는 균등물들을 포함하는 것으로 이해되어야 한다.
한편, 본 출원에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이 다.
“제1”, “제2” 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위한 것으로 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결될 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 한편, 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "포함하다" 또는 "가지다" 등의 용어는 설시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않은 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.
여기서 사용되는 모든 용어들은 다르게 정의되지 않는 한, 개시된 기술이 속하는 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한 이상적이거나 과도하게 형식적인 의미를 지니는 것으로 해석될 수 없다.
도 1은 개시된 기술의 일실시예에 따른 음원의 크기를 추정하는 장치를 설명하기 위한 블록도이다.
도 1을 참조하면, 음원 크기 추정 장치(100)는 상호상관값 계산부(110), 사상함수 적용부(120) 및 추정부(130)를 포함한다. 음원의 크기는 음원이 분포하는 범위를 말하며, 각도로 표현될 수 있다.
상호상관값 계산부(110)는 복수의 마이크로폰들 중 서로 다른 두 개의 마이크로폰 조합으로 이루어진 n개의 마이크로폰 쌍에 있어서, 제m(1 내지 n) 마이크로폰 쌍에 대한 제m(1 내지 n) 일반화된 상호상관값 (Generalized Cross Correlation: 이하, GCC) 시퀀스 (sequence)를 계산한다. 이하, 도 2의 예를 들어 설명한다.
도 2는 일 실시예에 따라 세 개의 마이크로폰이 사용되는 경우를 설명하기 위한 도면이다.
도 2를 참조하면, 세 개의 마이크로폰(m1, m2, m3) 어레이는 반 시계 방향으 로 0도, 120도, 240도에 배열 되어 있다. 3개의 마이크로폰(m1, m2, m3)에 대하여, m1과 m2의 제1 마이크로폰 쌍, m2와 m3의 제2 마이크로폰 쌍 및 m3과 m1의 제3 마이크로폰 쌍이 있을 수 있다. 마이크로폰 어레이는 특정 플랫폼상에 설치될 수 있다.
본 명세서에서 플랫폼은 마이크로폰 어레이가 설치되는 장치, 물체, 구조물 등을 나타내며, 인간형 로봇의 경우에는 일반적으로 인간형 로봇의 머리 부분에 마이크로폰 어레이가 설치되므로 인간형 로봇의 머리가 플랫폼에 해당하나 반드시 이에 한정되는 것은 아니다.
상호상관값 계산부(110)는 제m(1 내지 n) 마이크로폰 쌍에 대한 제m(1 내지 n) GCC 시퀀스를 계산한다.
일 실시예에 따라, 제1 마이크로폰 쌍에 대한 제1 GCC 시퀀스는 수학식 1과 같은 방법으로 계산된 R12들로부터 얻어질 수 있다.
Figure 112009045245980-pat00001
수학식 1에서, s1[n], s2[n]은 각각 m1 및 m2에서 수신된 신호의 n번째 디지털 샘플을 나타내며, Ts는 수신된 신호를 샘플링(즉, 아날로그 신호에서 디지털 신호로 변환)할 때의 샘플링 주파수에 따라 결정되는 샘플 간 시간 간격을 나타낸다. N은 상관 윈도우 사이즈를 나타낸다.
m은 상관 옵셋(correlation offset or correlation lag)를 나타내며, M은 상관 옵셋의 범위를 특정하는 값이다.
수학식 1은 GCC의 개념을 용이하게 설명하기 위해 시간 및 디지털 도메인에서 예시한 식일 뿐, 아날로그 신호 도메인에서 GCC값을 추정할 수도 있으며, 주파수 도메인에서 GCC값을 추정할 수도 있음은 이 분야에 종사하는 자라면 충분히 이해할 수 있다. 또한, 본 발명은 특정한 GCC값 추정 알고리즘만을 사용해야만 하는 것은 아니다.
상호상관값 계산부(110)는 계산된 제1 내지 제m GCC 시퀀스를 사상함수 적용부(120)에 제공한다.
사상함수 적용부(120)는 복수의 마이크로폰(m1, m2, m3)들이 설치된 플랫폼에 따라 미리 정해진 제m(1 내지 n) 사상함수(mapping function)를 이용하여 제m GCC 시퀀스를 시간 좌표계에서 기준 공간 좌표계로 사상(mapping)한다.
여기서, 시간 좌표계는 x축의 단위가 시간(예를 들어, second)인 좌표계를 말하며, 공간 좌표계는 x축의 단위가 각도(degree)인 좌표계를 말한다. y축은 GCC 값을 나타낸다.
일 실시예에 따라, 제m 사상함수는 제m 마이크로폰 쌍 기준에서 시간 좌표계의 TDOA와 제 m(1 내지 n) 공간 좌표계의 각도 간의 대응 관계를 나타내는 함수일 수 있다.
다른 일 실시예에 따르면, 제m 사상함수는 제m 마이크로폰 쌍 기준에서 시간 좌표계의 TDOA와 기준 공간 좌표계의 각도 간의 대응 관계를 나타내는 함수가 될 수 있다.
우선, 제m 사상함수가 시간 좌표계의 TDOA와 제 m(1 내지 n) 공간 좌표계의 각도 간의 대응 관계를 나타내는 함수인 경우에 대해서 도3을 참조하여 설명하도록 한다.
도 3은 도 1의 사상함수 적용부를 일 실시예에 따라 자세히 설명하기 위한 블록도이다. 도 3을 참조하면, 사상함수 적용부(120)는 개별 사상부(310) 및 좌표 변환부(320)를 포함한다.
개별 사상부(310)는 제m 사상함수를 이용하여 제m GCC 시퀀스를 시간 좌표계에서 제m 공간 좌표계로 사상(mapping)한다. 제m 공간 좌표계는 제m 마이크로폰 쌍을 기준으로 설정되는 좌표계로서 수평각 및 고도각을 포함한다.
도 4a 및 도4b는 본 발명의 일실시예에서 사용하는 사상 함수를 설명하기 위한 그래프이다.
제2 및 제3 마이크로폰 쌍 및 제2 및 제3 사상 함수에 대해서도 마찬가지로 설명되므로, 이하에서는 제1 마이크로폰 쌍을 기준으로 설명하고자 한다.
도 4a에서, 제1 마이크로폰 쌍의 좌표계 즉, 제1 공간 좌표계는 제1 내지 제3 마이크로폰(m1, m2, m3)이 이루는 평면을 수평각(azimuth angle)을 나타내는 평면으로 하고, 제1 마이크로폰(m1)과 제2 마이크로폰(m2) 간의 중간 위치를 원점으로 한다.
열린 공간(open space)에서는, 도 4a와 같이, 제1 마이크로폰 쌍에서 임의의 값의 TDOA를 발생시키는 음원의 위치는 최우측의 자주색 원으로 근사화 표현될 수 있다. 즉, 음원이 자주색 원 상에 위치하는 경우 동일한 값의 TDOA가 발생한다. 자주색 원 중 초록색 별표 위치에 해당하는 좌표는 제1 공간 좌표계에서 수평각
Figure 112009045245980-pat00002
및 고도각(elevation angle)
Figure 112009045245980-pat00003
로 표현될 수 있다. 여기서,
Figure 112009045245980-pat00004
는 0도에서 360도의 범위를 가지며,
Figure 112009045245980-pat00005
는 -90도에서 90도의 범위를 가진다.
즉, 제1 사상함수는 각각의 TDOA 값과 그 값을 가지게 하는 음원의 위치(수평각 및 고도각) 간의 대응 관계를 나타내는 함수로서, 플랫폼에 대해 실험을 통하여 이러한 대응 관계를 얻어낼 수도 있고, 플랫폼을 모델링하여 제1 사상 함수를 얻어낼 수도 있다. 제1 사상 함수는 관심 범위에 있는 모든 TDOA값에 대해 상술한 대응 관계를 가지고 있고, 각 GCC값의 상관 지연은 TDOA값에 대응되므로, 사상함수 적용부(110)는 제1 GCC값 시퀀스의 GCC값들 각각을 제1 공간 좌표계의 좌표(수평각, 고도각)에 사상(mapping)할 수 있다.
한편, 제1 내지 제3 마이크로폰들(m1, m2, m3)이 설치된 플랫폼이 제1 내지 제3 마이크로폰들(m1, m2, m3)이 이루는 평면을 기준으로 상하 비대칭 구조를 가지는 경우, 동일한 TDOA를 발생시키는 음원의 위치는 도 4a의 자주색 원과는 달리 원형을 이루지 않을 수 있다. 여기서, 비대칭구조라 함은 마이크로폰 어레이 평면을 기준으로 상단의 플랫폼의 신호 수신 특성과 하단의 플랫폼의 신호 수신 특성이 표면 모양의 상이, 재질의 상이 등으로 인해 달라지는 구조를 의미한다.
비대칭 구조에서는, 사운드 신호가 전달되는 경로가 평면의 상단에 음원이 위치한 경우와, 평면의 하단에 위치한 경우가 서로 다르기 때문에, 평면의 상단과 하단에 각각 동일한 고도각으로 위치한 음원이 있더라도 그 TDOA값이 다를 수 있다.
도 4b는 마이크로폰 어레이 평면을 기준으로 상하 비대칭 구조를 가진 구형 플랫폼에 따른 사상 함수의 대응 관계를 예시한다.
도 4b에서, y축은 TDOA값을 나타내고, x축은 수평각, 곡선의 색깔은 고도각에 대응된다. 즉, 사상함수는 TDOA값과 (수평각, 고도각) 좌표 간의 대응 관계를 나타내는데, 도 4b를 참조하면, 크기가 같고 부호가 다른 고도각은 정확히 일치되지는 않고, 대부분 조금씩 차이가 나는 서로 다른 TDOA에 사상됨을 알 수 있다. 이러한 성질은 플랫폼이 비대칭적인 구조에 따라 발생된다.
도 4b에 예시된 사상 함수는 플랫폼의 표면 구조, 플랫폼의 재질 등을 고려하여 모델링하여 얻을 수 있으며, 실험을 통해서도 사상 함수를 얻을 수 있다.
도 5는 개별 사상부가 일실시예에 따라 사상 함수를 적용하는 과정을 설명하기 위한 도면이다.
제2 및 제3 마이크로폰 쌍 및 제2 및 제3 사상 함수에 대해서도 마찬가지로 설명되므로, 이하에서는 제1 마이크로폰 쌍을 기준으로 설명하고자 한다.
도 5에서 좌측은 제1 공간 좌표계를 나타내고, 우측은 시간 좌표계에서의 제1 GCC 시퀀스를 나타낸다. 제1 GCC 시퀀스의 GCC값들 각각은 해당 상관 옵셋 τ를 가지고 있으며, 이 상관 옵셋은 제1 사상 함수의 대응 관계에 따라 제1 공간 좌표 계의 해당 좌표(수평각
Figure 112009045245980-pat00006
, 고도각
Figure 112009045245980-pat00007
)에 대응된다. 따라서, 개별 사상부(310)는 도 5와 같이 시간 좌표계의 제1 GCC값 시퀀스의 GCC값들 각각을 제1 공간 좌표계의 해당 좌표에 할당할 수 있다.
좌표 변환부(220)는 상기 제m 공간 좌표계로의 사상 결과를 상기 기준 공간 좌표계로 변환한다.
기준 공간 좌표계는 음원 크기 추정 장치(100)의 기준이 되는 공통 좌표계로서, 대개 로봇의 경우에는 정면을 기준으로 설정된다. 좌표 변환부(220)는 기준 공간 좌표계와 제m 공간 좌표계 간의 관계를 기초로 제m GCC 시퀀스의 할당 결과를 좌표 변환하여, 기준 공간 좌표계의 좌표들 각각에 제m(1 내지 n) GCC 시퀀스의 해당 GCC값을 사상한다.
편의상 도 2의 마이크로폰들이 정삼각형을 이루고, 기준 공간 좌표계가 제1 마이크로폰 쌍의 좌표계 즉, 제1 공간 좌표계인 경우를 설명하도록 한다. 이 경우, 제1 GCC값 시퀀스의 할당 결과는 좌표 변환할 필요 없고, 제2및 제3 GCC값 시퀀스의 사상 결과를 좌표 변환해야 한다. 제2 공간 좌표계와 제3 공간 좌표계는, 제1 공간 좌표계에 대해, 각각 -120o의 수평각 옵셋 및 120o 의 수평각 옵셋을 가지고 있다. 따라서, 제2 공간 좌표계의 좌표(
Figure 112009045245980-pat00008
,
Figure 112009045245980-pat00009
)에 할당된 GCC값은 기준 공간 좌표계 즉, 제1 공간 좌표계의 좌표(
Figure 112009045245980-pat00010
-120o,
Figure 112009045245980-pat00011
)에 할당된다. 제3 공간 좌표계도 마찬가지 원리로 설명된다. 이해의 편의를 위해, 간단한 정삼각형의 구조를 설명하였 지만, 정삼각형을 이루지 않는 마이크로폰 어레이의 구조에도 본 발명이 적용될 수 있음은 이 분야에 종사하는 자라면 충분히 이해할 수 있다.
도 6은 사상함수 적용부의 결과를 예시하는 도면이다.
도 6에서 좌측의 (1)번 도면은 상호상관값 계산부(110)에 의한 GCC시퀀스를 나타내고(상단부터 제1 GCC시퀀스, 제2 GCC시퀀스, 제3 GCC시퀀스) (2)번 도면은 사상함수 적용부(120)에 의하여 시간 좌표계에서의 GCC시퀀스를 공간 좌표계에서의 GCC시퀀스로 사상한 결과이다. (상단부터 제1 GCC시퀀스, 제2 GCC시퀀스, 제3 GCC시퀀스) 이해의 편의를 위하여 수평각에 대한 사상 결과만을 도시하였으나, 고도각에 대해서도 마찬가지의 결과를 얻을 수 있다.
다음으로, 다른 일 실시예에 따라, 제m 사상함수가 시간 좌표계의 TDOA와 기준 공간 좌표계의 각도 간의 대응 관계를 나타내는 함수인 경우에 대해 설명한다.
사상함수 적용부(120)는 미리 정해진 제m(1 내지 n) 사상 함수에 따라, 제m(1 내지 n) GCC 시퀀스의 GCC값들 각각을 기준 공간 좌표계의 해당 좌표에 할당한다. 즉, 본 실시예의 제1 내지 제n 사상 함수는 도 3에서의 좌표 변환부(320)의 좌표 변환 과정이 미리 반영된 사상 함수들이다.
추정부(130)는 상기 제1 내지 제n GCC 시퀀스의 사상 결과를 기초로 음원의 크기를 추정한다.
도 7은 일 실시예에 따라 추정부를 자세히 설명하기 위한 도면이고, 도 8은 일 실시예에 따른 추정부에 의해 통합된 하나의 GCC 시퀀스를 설명하기 위한 도면이다.
도1 및 도7을 참조하면, 추정부(130)는 상호상관값 통합부(710), 최대값 검출부(720) 및 음원크기 검출부(730)를 포함한다.
상호상관값 통합부(710)는 기준 공간 좌표계로 사상된 제1 내지 제n GCC 시퀀스들을 하나의 GCC 시퀀스로 통합한다.
일 실시예에 있어서, 상호상관값 통합부(710)는 기준 공간 좌표계로 사상된 제1 내지 제n GCC 시퀀스들을 모두 더하여 하나의 GCC 시퀀스로 통합할 수 있다. 도 6을 참조하여 설명하면, 상호상관값 통합부(710)는 기준 공간 좌표계의 각 좌표마다 도 6의 우측 (2)번 그래프의 상단 도면의 해당 위치의 GCC값, 중간 도면의 해당 위치의 GCC값, 및 하단 도면의 해당 위치의 GCC값을 더하여 도 8과 같은 결과를 생성한다.
여기에서는 편의상 통합 방식으로 단순 합산 방식을 예시하였지만, 사전 정보(apriori information)가 있는 경우(예컨대, 특정 마이크로폰에서 수신된 신호의 세기가 우수하다는 정보, 음원의 대략적인 범위가 파악되는 경우)라면, 단순 합산이 아닌, 가중합 방식(각 GCC들 각각에 가중치를 부여하여 합산하는 방식)의 통합도 가능함은 이 분야에 종사하는 자라면 충분히 이해할 수 있다.
다른 일 실시예에 있어서, 상호상관값 통합부(710)는 기준 공간 좌표계로 사상된 제1 내지 제n GCC 시퀀스들을 모두 곱하여 하나의 GCC 시퀀스로 통합할 수도 있다.
최대값 검출부(720)는 상호상관값 통합부(710)에서 통합된 GCC 시퀀스 중 최대값을 가지는 각도를 검출한다.
도 8을 예를 들어 설명하면, x축의 수평각 360도(0도)에 해당하는 좌표가 최대값(약 1.7)을 가지는 GCC이므로, 최대값 검출부(720)는 통합된 GCC 시퀀스를 분석하여 최대 GCC값인 1.7과 1.7에 해당하는 수평각 360도(0도)를 검출해 낼 수 있다.
한편, 도 8을 보면, 최대 GCC값 이외에 다른 값들에 비해 상당히 큰 값을 가지는 각도(60도, 180도, 300도)가 존재하는 것을 알 수 있다. 이 위치는 개별 마이크로폰 조합으로부터 생겨날 수 있는 앞뒤 혼동 위치에 해당한다. 도 8에서 확인할 수 있는 것과 같이, 합산 혹은 곱셈을 통한 GCC 통합 방식을 이용하면 통합된 GCC의 최대 값(실제 음원의 위치, 0도)은 앞뒤 혼동이 일어날 수 있는 음원의 위치들(60도, 180도, 300도) 보다 크게 나옴을 확인 할 수 있다. 이는 마이크로폰 조합에서 실제 위치에 해당하는 GCC 값의 개별 피크가 더해지거나 곱해짐으로써 그 크기가 앞뒤 혼동 위치에서의 통합된 GCC 값보다 월등히 커졌기 때문에다. 결과적으로 GCC 통합 방식을 이용하면 앞뒤 혼동에 강인한 위치추정 성능을 얻을 수 있다.
도 9a 및 9b는 앞뒤 혼동을 설명하기 위한 도면이다.
이해의 편의를 위하여 음원이 2차원 평면상에만 존재한다고 가정한다. 예를 들어 음원의 위치를 추정하기 위하여 두 개의 마이크로폰만이 사용되는 경우, 하나의 TDOA로부터 추정된 음원의 위치는 한 평면에서 앞과 뒤에 두 곳이 존재하게 되는 데, 이를 앞 뒤 혼돈(front-back confusion) 현상이라고 한다. 도 9a에서 보는 것과 같이, 앞과 뒤의 음원은 모두 두 개의 마이크로폰과의 거리가 동일하기 때문에, 두 개의 마이크로폰 쌍만을 사용하여 TDOA를 측정하면 두 개의 음원의 위치가 구별되지 않는다. 즉, 두 개의 마이크로폰만으로는 TDOA를 이용한 방법으로 음원의 위치가 정확하게 추정될 수 없다.
도 9b는 이와 같은 앞 뒤 혼돈 현상 없이 수평면 상에서 음원의 위치를 추정하는 방법을 보여준다. 도 9b와 같이 최소한 3개의 마이크로폰을 사용하면, 세 쌍의 마이크로폰 쌍으로부터 세 개의 GCC 시퀀스가 산출될 수 있고, 세 개의 GCC 시퀀스가 하나로 통합되면서 앞뒤 혼동에 따른 혼돈 위치의 음원이 제거될 수 있다. 3차원 위치 추정의 경우에는 앞뒤 혼돈을 없애기 위해서 최소한 4개의 마이크로폰이 필요하다.
개시된 기술에 따른 음원 크기 추정 장치(100)는 여러 개의 GCC 시퀀스를 구하여 이를 더하거나 곱하는 등의 방식으로 통합하므로 앞뒤 혼돈에 강하다는 장점이 있다.
최대값 검출부(720)에 의해 검출된 각도는 점음원의 위치 또는 분포음원의 중심 위치가 된다.
음원 크기 검출부(730)는 상기 최대값을 가지는 GCC값을 중심으로 문턱값보다 큰 GCC 값을 가지는 각도의 범위를 음원의 크기로 추정한다.
일 실시예에 따라 문턱값은 GCC 최대값과 혼돈위치의 GCC 값 중 최대값 사이의 값으로 설정될 수 있다. 도 8을 예를 들어 설명하면, GCC 최대값은 1.7이고, 혼돈 위치((60도, 180도, 300도)의 GCC 값들 중 가장 큰 값은 대략 1이므로, 문턱값 은 1.7과 1 사이의 값이 될 수 있다. 문턱값이 1과 1.7 사이에 어떤 값을 갖는지 여부는 음원 크기 추정 장치의 목적, 용도, 사용 환경 등에 따라 다르게 설계될 수 있다.
도 10은 충격음에 대한 위치 및 크기 추정을 위하여 외벽을 세 번 가진한 경우, 도 1의 음원 크기 추정 장치에 의해 분석된 결과를 설명하기 위한 도면이다. 도 10의 아래 그림은 x축이 시간(sec), y축이 전압(V)을 나타내며, 하나의 마이크로폰에서 측정된 음압에 해당하는 전압 데이터를 시간에 따라 그래프로 표현한 것이다. 도 10의 위의 그림은 도 1의 음원 크기 추정 장치(100)가 각각의 마이크로폰으로부터 획득한 전압 데이터를 기초로 GCC 시퀀스를 계산하여 분석한 결과이다. 도 10 위 그림에서 x축은 시간(sec)을 나타내며 y축은 음원의 위치를 표현한 각도(degree)를 나타낸다. 그래프의 색깔은 GCC값의 크기를 나타내는데, 노란색에 가까울수록 큰 값이고, 파란색에 가까울수록 작은 값을 나타낸다. 음원의 크기는 사용자가 정한 문턱값 (예를 들어 노랜색의 최대 값에서부터 노란색이 없어지는 경계까지)으로부터 추정가능하며, 위치는 GCC의 최대값으로부터 추정 가능하다.
다른 일 실시예에 따른 음원 크기 추정 장치(100)는 음원의 주파수의 특성에 따라 음원의 위치 및 크기를 추정할 수 있다.
예를 들어 상호상관값 계산부(110)는 음원의 주파수 특성에 따라 선별된 특정 주파수 대역만 필터링(filtering)하여 GCC값을 계산하고, 계산된 GCC 시퀀스를 사상함수 적용부(120)에 제공할 수 있다. 이러한 경우, 음원 크기 추정 장치(100)는 원하는 주파수 대역의 음원에 대한 위치 및 크기를 보다 효율적으로 추정할 수 있다. 주파수 필터는 실시예에 따라 대역 통과 필터, 저역 통과 필터, 고역 통과 필터 및 대역 저지 필터 등으로 구현될 수 있다.
예를 들어 외벽 가진음이 1kHz부터 4kHz 대역의 소리로만 전파된다는 특징을 미리 알고 있다고 한다면, 음원 크기 추정 장치(100)는 1kHz부터 4kHz까지의 주파수 대역에서만 GCC 시퀀스를 계산하여 외벽 가진음에 대한 위치 및 크기 추정을 보다 효율적으로 할 수 있다.
또 다른 일 실시예에 따르면, 상호상관값 계산부(110)는 주파수 대역 별로 GCC값을 계산하여 주파수 대역별로 음원의 크기를 추정하도록 할 수 있다.
예를 들어, 음원의 위치 및 크기는 주파수 대역별로 다를 수 있고, 이러한 정보는 음원의 특징을 좀 더 정확히 분석하는데 도움이 될 수 있다. 예컨대, 상호상관값 계산부(110)는 옥타브 밴드별로 GCC 시퀀스를 계산하여 사상함수 적용부(120)에 제공하고, 사상함수 적용부(120) 및 추정부(130) 역시 옥타브 밴드별로 동작이 수행되면, 각 밴드별로 음원 위치 및 크기가 추정될 수 있다.
도 11은 개시된 기술의 일 실시예에 따라 음원의 크기를 추정하는 방법을 설명하기 위한 순서도이다.
도 1을 참조하여 도11의 음원 크기 추정 방법을 설명하면 다음과 같다. 즉, 도 1의 실시예를 시계열적으로 구현하는 경우도 본 실시예에 해당하므로 도 1의 음 원 크기 추정 장치(100)에 대하여 설명된 부분은 본 실시예에도 그대로 적용된다.
음원 크기 추정 장치(100)는 복수의 마이크로폰들 중 서로 다른 두 개의 마이크로폰 조합으로 이루어진 n개의 마이크로폰 쌍에 있어서, 제m(1 내지 n) 마이크로폰 쌍에 대한 제m(1 내지 n) GCC 시퀀스를 계산한다(S1110).
음원 크기 추정 장치(100)는 복수의 마이크로폰들이 설치된 플랫폼에 따라 미리 정해진 제m(1 내지 n) 사상함수(mapping function)를 이용하여 제m GCC 시퀀스를 시간 좌표계에서 기준 공간 좌표계로 사상(mapping)한다(S1120).
음원 크기 추정 장치(100)는 S1120 단계에 따른 제1 내지 제n GCC 시퀀스의 사상 결과를 기초로 음원의 크기를 추정한다(S1130).
도 12는 도 11의 S1130 단계를 자세히 설명하기 위한 순서도이다. 도 12를 참조하면, 일 실시예에 따라, 음원 크기 추정 장치(100)는 S1120단계에서 기준 공간 좌표계로 사상된 제1 내지 제n GCC 시퀀스들을 하나의 GCC 시퀀스로 통합한다(S1210). GCC 시퀀스가 통합되면, 음원 크기 추정 장치(100)는 통합된 GCC 시퀀스 중 최대값을 가지는 각도를 검출한다.(S1220) 검출된 각도는 음원의 위치로 추정된다. 음원 크기 추정 장치(100)는 검출된 각도를 중심으로 문턱값보다 큰 GCC 값을 가지는 각도의 범위를 음원의 크기로 추정한다(1230). 문턱값은 전체 GCC 시퀀스 중 최대 GCC값과 문턱위치의 GCC값 중 최대값 사이의 값으로 결정될 수 있다.
도 13은 일 실시예에 따라 도 2에 따른 마이크로폰 어레이가 사용되는 경우, 음원의 크기를 추정하는 장치를 설명하기 위한 블록도이다.
도 13을 참조하면, 음원 크기 추정 장치(1300)는 증폭기(1310), A/D 컨버터(Analog to Digital Converter)(1320), 상호상관값 추정부(110), 사상함수 적용부(120) 및 추정부(130)를 포함한다.
도 1의 음원 크기 추정 장치(100)를 이용하여 음원 크기 추정 장치(1300)를 구현하는 경우도 본 실시예에 해당하므로 도1의 음원 크기 추정 장치(100)에 대하여 설명된 부분은 본 실시예에도 그대로 적용된다.
마이크로폰들(m1, m2, m3)로부터 제공되는 신호는 일반적으로 미약하므로, 증폭기(1310)에서 증폭(amplifying) 과정을 거치게 된다. 이렇게 증폭된 신호는 A/D 컨버터(1320)를 통하여 디지털 샘플들로 변환된다. 그 다음 제1 내지 제3 상호상관값 계산부(110)들은 상술한 바와 같이 공지된 각종 추정 방식을 사용하여, 제1 내지 제3 마이크로폰 쌍에 대한 제1 내지 제3 상호상관값 시퀀스를 계산한다.
계산된 제1 내지 제3 상호상관값 시퀀스는 제1 내지 제3 사상함수 적용부(120)에 제공되어 상술한 바에 따라 기준 공간 좌표로 사상되고, 추정부(130)는 제1 내지 제3 사상함수 적용부(120)로부터 사상 결과를 제공받아 음원의 위치 및 크기를 추정한다.
개시된 기술은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM(Read Only Memory), RAM(Random Access Memory), CD-ROM(Compact Disc-Read Only Memory), 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있으며, 또한 케리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 본 발명을 구현하기 위한 기능적인 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.
이러한 개시된 기술인 방법 및 장치는 이해를 돕기 위하여 도면에 도시된 실시예를 참고로 설명되었으나, 이는 예시적인 것에 불과하며, 당해 분야에서 통상적 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 개시된 기술의 진정한 기술적 보호 범위는 첨부된 특허청구범위에 의해 정해져야 할 것이다.
도 1은 개시된 기술의 일실시예에 따른 음원의 크기를 추정하는 장치를 설명하기 위한 블록도이다.
도 2는 일 실시예에 따라 세 개의 마이크로폰이 사용되는 경우를 설명하기 위한 도면이다..
도 3은 도 1의 사상함수 적용부를 일 실시예에 따라 자세히 설명하기 위한 블록도이다.
도 4a 및 도4b는 본 발명의 일실시예에서 사용하는 사상 함수를 설명하기 위한 그래프이다.
도 5는 개별 사상부가 일실시예에 따라 사상 함수를 적용하는 과정을 설명하기 위한 도면이다.
도 6은 사상함수 적용부의 결과를 예시하는 도면이다..
도 7은 일 실시예에 따라 추정부를 자세히 설명하기 위한 도면이다.
도 8은 일 실시예에 따른 추정부에 의해 통합된 하나의 GCC 시퀀스를 설명하기 위한 도면이다.
도 9a 및 9b는 앞뒤 혼동을 설명하기 위한 도면이다.
도 10은 충격음에 대한 위치 및 크기 추정을 위하여 외벽을 세 번 가진한 경우, 도 1의 음원 크기 추정 장치에 의해 분석된 결과를 설명하기 위한 도면이다.
도 11은 개시된 기술의 일 실시예에 따라 음원의 크기를 추정하는 방법을 설명하기 위한 순서도이다.
도 12는 도 11의 S1130 단계를 자세히 설명하기 위한 순서도이다.
도 13은 일 실시예에 따라 도 2에 따른 마이크로폰 어레이가 사용되는 경우, 음원의 크기를 추정하는 장치를 설명하기 위한 블록도이다.

Claims (12)

  1. 복수의 마이크로폰들 중 서로 다른 두 개의 마이크로폰 조합으로 이루어진 n개의 마이크로폰 쌍에 있어서, 제m(1 내지 n) 마이크로폰 쌍에 대한 제m(1 내지 n) 일반화된 상호상관값 (Generallized Cross Correlation: 이하, GCC) 시퀀스 (sequence)를 계산하는 상호상관값 계산부;
    상기 복수의 마이크로폰들이 설치된 플랫폼에 따라 미리 정해진 제m(1 내지 n) 사상함수(mapping function)를 이용하여 상기 제m(1 내지 n) GCC 시퀀스를 시간 좌표계에서 기준 공간 좌표계로 사상(mapping)하는 사상함수 적용부; 및
    상기 제m(1 내지 n) GCC 시퀀스의 사상 결과를 기초로 음원의 크기를 추정하는 추정부를 포함하고,
    상기 제m 마이크로폰 쌍, 상기 제m GCC 시퀀스 및 상기 제m 사상함수는 동일한 m 값을 가지는 음원의 크기를 추정하는 장치.
  2. 제1항에 있어서,
    상기 제m 사상함수는 상기 제m 마이크로폰 쌍 기준에서 상기 시간 좌표계의 도착시간지연과 제 m(1 내지 n) 공간 좌표계의 각도 간의 대응 관계를 나타내는 함수이며,
    상기 사상함수 적용부는
    상기 제m 사상함수를 이용하여 상기 제m GCC 시퀀스를 상기 시간 좌표계에서 상기 제m 공간 좌표계로 사상(mapping)하는 개별 사상부; 및
    상기 제m 공간 좌표계로의 사상 결과에 해당하는 좌표를 상기 기준 공 간 좌표계의 좌표로 변환하는 좌표변환부를 포함하는 음원의 크기를 추정하는 장치.
  3. 제1항에 있어서,
    상기 제m 사상함수는 상기 제m 마이크로폰 쌍 기준에서 상기 시간 좌표계의 도착시간지연과 상기 기준 공간 좌표계의 각도 간의 대응 관계를 나타내는 함수인 음원의 크기를 추정하는 장치.
  4. 제1항에 있어서, 상기 상호상관값 계산부는 상기 음원의 주파수 특성에 따라 미리 설정된 주파수 대역만 필터링(filtering)하여 GCC값을 계산하는 음원의 크기를 추정하는 장치.
  5. 제1항에 있어서, 상기 상호상관값 계산부는 주파수 대역별로 GCC값을 계산하여 상기 주파수 대역별로 상기 음원의 크기를 추정하도록 하는 음원의 크기를 추정하는 장치.
  6. 제1항에 있어서, 상기 추정부는
    상기 기준 공간 좌표계로 사상된 제1 내지 제n GCC 시퀀스들을 하나의 GCC 시퀀스로 통합하는 상호상관값 통합부;
    상기 통합된 GCC 시퀀스 중 최대값을 가지는 각도를 검출하는 최대값 검출부; 및
    상기 검출된 각도를 중심으로 문턱값보다 큰 GCC 값을 가지는 각도의 범위를 음원의 크기로 추정하는 음원 크기 검출부를 포함하는 음원의 크기를 추정하는 장치.
  7. 제6항에 있어서, 상기 상호상관값 통합부는
    상기 기준 공간 좌표계로 사상된 제1 내지 제n GCC 시퀀스들을 모두 더하여 하나의 GCC 시퀀스로 통합하는 음원의 크기를 추정하는 장치.
  8. 제6항에 있어서, 상기 상호상관값 통합부는
    상기 기준 공간 좌표계로 사상된 제1 내지 제n GCC 시퀀스들을 모두 곱하여 하나의 GCC 시퀀스로 통합하는 음원의 크기를 추정하는 장치.
  9. 제6항에 있어서, 상기 문턱값은 상기 통합된 GCC 시퀀스 중 최대값과 적어도 하나의 혼돈위치의 GCC 중 최대값 사이의 값으로 설정하는 음원의 크기를 추정하는 장치.
  10. (a) 복수의 마이크로폰들 중 서로 다른 두 개의 마이크로폰 조합으로 이루어진 n개의 마이크로폰 쌍에 있어서, 제m(1 내지 n) 마이크로폰 쌍에 대한 제m(1 내지 n) GCC 시퀀스를 계산하는 단계;
    (b) 상기 복수의 마이크로폰들이 설치된 플랫폼에 따라 미리 정해진 제m(1 내지 n) 사상함수(mapping function)를 이용하여 상기 제m(1 내지 n) GCC 시퀀스를 시간 좌표계에서 기준 공간 좌표계로 사상(mapping)하는 단계; 및
    (c) 상기 제m(1 내지 n) GCC 시퀀스의 사상 결과를 기초로 음원의 크기를 추정하는 단계를 포함하고,
    상기 제m 마이크로폰 쌍, 상기 제m GCC 시퀀스 및 상기 제m 사상함수는 동일한 m 값을 가지는 음원의 크기를 추정하는 방법.
  11. 제10항에 있어서,
    상기 (c) 단계는
    상기 기준 공간 좌표계로 사상된 제1 내지 제n GCC 시퀀스들을 하나의 GCC 시퀀스로 통합하는 단계;
    상기 통합된 GCC 시퀀스 중 최대값을 가지는 각도를 검출하는 단계; 및
    상기 검출된 각도를 중심으로 문턱값보다 큰 GCC 값을 가지는 각도의 범위를 음원의 크기로 추정하는 단계를 포함하는 음원의 크기를 추정하는 방법.
  12. 제10항에 기재된 방법을 컴퓨터 상에서 실행시키기 위한 프로그램을 수록한 컴퓨터로 읽을 수 있는 기록 매체.
KR1020090067625A 2009-07-24 2009-07-24 음원의 크기를 추정하는 장치 및 방법 KR101046683B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090067625A KR101046683B1 (ko) 2009-07-24 2009-07-24 음원의 크기를 추정하는 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090067625A KR101046683B1 (ko) 2009-07-24 2009-07-24 음원의 크기를 추정하는 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20110010193A KR20110010193A (ko) 2011-02-01
KR101046683B1 true KR101046683B1 (ko) 2011-07-05

Family

ID=43770766

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090067625A KR101046683B1 (ko) 2009-07-24 2009-07-24 음원의 크기를 추정하는 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101046683B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105657633A (zh) * 2014-09-04 2016-06-08 杜比实验室特许公司 生成针对音频对象的元数据

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1183982A (ja) 1997-09-03 1999-03-26 Nec Eng Ltd 音源方向検知装置
JP2000134688A (ja) * 1998-10-28 2000-05-12 Fujitsu Ltd マイクロホンアレイ装置
JP2001236092A (ja) * 2000-02-23 2001-08-31 Nec Corp 話者方向検出回路及びそれに用いる話者方向検出方法
JP2001356157A (ja) * 2000-06-14 2001-12-26 Sony Corp 相関性演算処理装置及び音源方向判定演算処理装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1183982A (ja) 1997-09-03 1999-03-26 Nec Eng Ltd 音源方向検知装置
JP2000134688A (ja) * 1998-10-28 2000-05-12 Fujitsu Ltd マイクロホンアレイ装置
JP2001236092A (ja) * 2000-02-23 2001-08-31 Nec Corp 話者方向検出回路及びそれに用いる話者方向検出方法
JP2001356157A (ja) * 2000-06-14 2001-12-26 Sony Corp 相関性演算処理装置及び音源方向判定演算処理装置

Also Published As

Publication number Publication date
KR20110010193A (ko) 2011-02-01

Similar Documents

Publication Publication Date Title
Cobos et al. A survey of sound source localization methods in wireless acoustic sensor networks
Argentieri et al. A survey on sound source localization in robotics: From binaural to array processing methods
EP3090275B1 (en) Microphone autolocalization using moving acoustic source
Nunes et al. A steered-response power algorithm employing hierarchical search for acoustic source localization using microphone arrays
JP4675381B2 (ja) 音源特性推定装置
KR101529516B1 (ko) 음원 위치 추정 장치 및 음원 위치 추정 방법
Murray et al. Robotic sound-source localisation architecture using cross-correlation and recurrent neural networks
KR20090057692A (ko) 음원 거리에 따라 음원 신호를 여과하는 방법 및 장치
Perrodin et al. Design and calibration of large microphone arrays for robotic applications
KR101086304B1 (ko) 로봇 플랫폼에 의해 발생한 반사파 제거 신호처리 장치 및 방법
Reju et al. Localization of taps on solid surfaces for human-computer touch interfaces
Padois et al. Time domain localization technique with sparsity constraint for imaging acoustic sources
Su et al. Simultaneous asynchronous microphone array calibration and sound source localisation
Salvati et al. Incident signal power comparison for localization of concurrent multiple acoustic sources
Gaubitch et al. Calibration of distributed sound acquisition systems using TOA measurements from a moving acoustic source
KR101038437B1 (ko) 음원 위치 추정 장치 및 방법
KR20170015139A (ko) 지능형 음원 수집 및 분석을 이용한 음원 방향 탐지 시스템 및 그 방법
Su et al. Asynchronous microphone arrays calibration and sound source tracking
KR101046683B1 (ko) 음원의 크기를 추정하는 장치 및 방법
KR20090128221A (ko) 음원 위치 추정 방법 및 그 방법에 따른 시스템
Al-Sheikh et al. Sound source direction estimation in horizontal plane using microphone array
Salvati et al. A real-time system for multiple acoustic sources localization based on ISP comparison
US9307335B2 (en) Device for estimating placement of physical objects
KR20060124443A (ko) 머리전달함수 데이터베이스를 이용한 음원 위치 추정 방법
Omer et al. An L-shaped microphone array configuration for impulsive acoustic source localization in 2-D using orthogonal clustering based time delay estimation

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140521

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee