KR20140015894A - Apparatus and method for estimating location of sound source - Google Patents

Apparatus and method for estimating location of sound source Download PDF

Info

Publication number
KR20140015894A
KR20140015894A KR1020120081973A KR20120081973A KR20140015894A KR 20140015894 A KR20140015894 A KR 20140015894A KR 1020120081973 A KR1020120081973 A KR 1020120081973A KR 20120081973 A KR20120081973 A KR 20120081973A KR 20140015894 A KR20140015894 A KR 20140015894A
Authority
KR
South Korea
Prior art keywords
microphone
sound source
phat
srp
gcc
Prior art date
Application number
KR1020120081973A
Other languages
Korean (ko)
Other versions
KR101767928B1 (en
Inventor
최우현
김광윤
고한석
Original Assignee
삼성테크윈 주식회사
고려대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성테크윈 주식회사, 고려대학교 산학협력단 filed Critical 삼성테크윈 주식회사
Priority to KR1020120081973A priority Critical patent/KR101767928B1/en
Publication of KR20140015894A publication Critical patent/KR20140015894A/en
Application granted granted Critical
Publication of KR101767928B1 publication Critical patent/KR101767928B1/en

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/8027By vectorial composition of signals received by plural, differently-oriented transducers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01HMEASUREMENT OF MECHANICAL VIBRATIONS OR ULTRASONIC, SONIC OR INFRASONIC WAVES
    • G01H11/00Measuring mechanical vibrations or ultrasonic, sonic or infrasonic waves by detecting changes in electric or magnetic properties
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/02Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using radio waves
    • G01S3/14Systems for determining direction or deviation from predetermined direction
    • G01S3/28Systems for determining direction or deviation from predetermined direction using amplitude comparison of signals derived simultaneously from receiving antennas or antenna systems having differently-oriented directivity characteristics
    • G01S3/30Systems for determining direction or deviation from predetermined direction using amplitude comparison of signals derived simultaneously from receiving antennas or antenna systems having differently-oriented directivity characteristics derived directly from separate directional systems
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/02Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using radio waves
    • G01S3/14Systems for determining direction or deviation from predetermined direction
    • G01S3/28Systems for determining direction or deviation from predetermined direction using amplitude comparison of signals derived simultaneously from receiving antennas or antenna systems having differently-oriented directivity characteristics
    • G01S3/32Systems for determining direction or deviation from predetermined direction using amplitude comparison of signals derived simultaneously from receiving antennas or antenna systems having differently-oriented directivity characteristics derived from different combinations of signals from separate antennas, e.g. comparing sum with difference
    • G01S3/36Systems for determining direction or deviation from predetermined direction using amplitude comparison of signals derived simultaneously from receiving antennas or antenna systems having differently-oriented directivity characteristics derived from different combinations of signals from separate antennas, e.g. comparing sum with difference the separate antennas having differently-oriented directivity characteristics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/78Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using electromagnetic waves other than radio waves
    • G01S3/782Systems for determining direction or deviation from predetermined direction
    • G01S3/785Systems for determining direction or deviation from predetermined direction using adjustment of orientation of directivity characteristics of a detector or detector system to give a desired condition of signal derived from that detector or detector system
    • G01S3/786Systems for determining direction or deviation from predetermined direction using adjustment of orientation of directivity characteristics of a detector or detector system to give a desired condition of signal derived from that detector or detector system the desired condition being maintained automatically
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/78Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using electromagnetic waves other than radio waves
    • G01S3/782Systems for determining direction or deviation from predetermined direction
    • G01S3/789Systems for determining direction or deviation from predetermined direction using rotating or oscillating beam systems, e.g. using mirrors, prisms
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • G01S3/808Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems
    • G01S3/8086Systems for determining direction or deviation from predetermined direction using transducers spaced apart and measuring phase or time difference between signals therefrom, i.e. path-difference systems determining other position line of source

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Electromagnetism (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

The present invention relates to an apparatus and a method for estimating the location of a sound source and more specifically, to an apparatus and a method for estimating the location of a sound source which can accurately estimate the location of the sound source by dividing the sound source direction using a microphone structure, and calculating SRP-PHAT through a combination of microphone pairs capable of detecting a divided sound source direction area. The method for estimating the location of a sound source includes the steps of: acquiring sound from a plurality of microphones; calculating generalized cross correlation (GCC) of the sound acquired from combinations of two different microphones; dividing the sound source direction into a first, a second, a third and a fourth area by using the microphone structure, and calculating SRP-PHAT by combining the GCC corresponding to the first, the second, the third and the fourth area; and estimating a direction with maximum accumulation of SRP-PHAT as the location of the sound source by accumulating SRP-PHAT calculated based on time. [Reference numerals] (AA) Start; (BB) End; (S10) Acquire voice signal from a plurality of microphones; (S20) Calculate generalized cross correlation (GCC) of the sound acquired from combinations of two different microphones; (S30) Divide the sound source direction into a first, second, third and fourth area by using the microphone structure, and calculate SRP-PHAT by using GCC corresponding to the first, the second, the third and the fourth area; (S40) Estimate a direction with maximum accumulation of SRP-PHAT as the location of the sound source by accumulating SRP-PHAT calculated based on time

Description

음원 위치 추정 장치 및 방법{Apparatus and method for estimating location of sound source}Apparatus and method for estimating location of sound source}

본 발명은 음원 위치 추정 장치 및 방법에 관한 것으로, 보다 상세하게는 마이크 구조를 이용하여 음원 방향을 분할하고, 분할된 음원 방향 영역을 검출할 수 있는 마이크 쌍들의 조합을 통해 SRP-PHAT를 계산하여 정확하게 음원의 위치를 추정하는 음원 위치 추정 장치 및 방법에 관한 것이다.The present invention relates to an apparatus and method for estimating a sound source, and more particularly, by dividing a sound source direction using a microphone structure, and calculating an SRP-PHAT through a combination of microphone pairs capable of detecting a divided sound source direction region. A sound source position estimation apparatus and method for accurately estimating the position of a sound source.

음원 위치 추정 기술은 마이크로폰 어레이 등의 음향 센서들을 사용하여 음원 및 화자의 위치를 파악하는 기술로서, 3차원 가상 입체 음향 산업, 인간형 지능 로봇의 화자인식 방법, 군사용 원격 감시 시스템 등 여러 공학적 응용 분야에 적용되어, 많은 부가가치를 창출하고 있다. 다수의 마이크를 직렬이나 병렬로 배치하여 마이크 어레이를 구성하고 이 마이크에 입력된 신호를 분석하여 음원 위치를 파악하려는 연구 개발에 많은 노력을 기울이고 있다.Sound source location technology uses sound sensors such as microphone arrays to locate sound sources and speakers, and is widely used in various engineering applications such as the 3D virtual stereo industry, speaker recognition of humanoid intelligent robots, and military remote monitoring systems. Applied, creating a lot of added value. Much effort is being put into research and development to locate microphones by arranging a microphone array by arranging a plurality of microphones in series or in parallel and analyzing the signals input to the microphones.

이러한 음원 추정 알고리즘은 임의의 음원 위치로부터 각 마이크까지 음파 전달 경로의 차이에 기인한 음파 도착 시간 차이에 따라 각 마이크의 입력 신호를 보상해 주어 이를 더한 신호의 파워가 최대치가 되는 각도를 찾아내어 음원 위치로 추정하고 있다.This sound source estimation algorithm compensates the input signal of each microphone according to the difference of sound wave arrival time due to the difference of sound wave propagation path from any sound source position to each microphone, and finds the angle where the signal power becomes the maximum and adds the sound source. We estimate by position.

국내 공개특허 공보 제2009-0044314호Korean Unexamined Patent Publication No. 2009-0044314

본 발명이 해결하고자 하는 기술적인 과제는 마이크 구조를 이용하여 음원 방향을 분할하고, 분할된 음원 방향 영역을 검출할 수 있는 마이크 쌍들의 조합을 통해 SRP-PHAT를 계산하여 정확하게 음원의 위치를 추정하는 음원 위치 추정 장치 및 방법을 제공하는데 있다.The technical problem to be solved by the present invention is to segment the sound source direction using a microphone structure, and to accurately estimate the position of the sound source by calculating the SRP-PHAT through a combination of microphone pairs capable of detecting the divided sound source direction region. A sound source position estimation apparatus and method are provided.

본 발명이 이루고자 하는 기술적인 과제를 해결하기 위한 일 실시 예에 따른 음원 위치 추정 방법은 복수의 마이크로부터 소리를 획득하는 단계; 서로 다른 두 개의 마이크 조합으로부터 획득된 상기 소리에 대해 상호상관관계(GCC)를 산출하는 단계; 상기 마이크 구조를 이용하여 음원 방향을 제1 내지 제4 영역으로 분할하고, 상기 제1 내지 제4 영역에 대응하는 상기 상호상관관계를 조합하여 SRP-PHAT를 산출하는 단계; 및 소정의 시간대 별로 상기 산출된 SRP-PHAT를 누적하여 최대 SRP-PHAT가 가장 많이 누적된 방향을 음원 위치로 추정하는 단계;를 포함하는 것을 특징으로 한다.According to an aspect of the present invention, there is provided a sound source position estimation method comprising: acquiring sound from a plurality of microphones; Calculating a cross correlation (GCC) for the sound obtained from two different microphone combinations; Calculating a SRP-PHAT by dividing a sound source direction into first to fourth regions using the microphone structure and combining the cross-correlation corresponding to the first to fourth regions; And accumulating the calculated SRP-PHAT for each predetermined time period, and estimating a direction in which the maximum SRP-PHAT is accumulated the most as a sound source location.

본 발명에 있어서, 상기 복수의 마이크는, 4 개의 마이크가 서로 직교하고, 각 마이크 쌍이 서로 마주보도록 배치되어 있는 것을 특징으로 한다.In the present invention, the plurality of microphones are arranged such that four microphones are orthogonal to each other and each pair of microphones faces each other.

본 발명에 있어서, 상기 상호상관관계(GCC)를 산출하는 단계는, 4 개의 상기 마이크가 서로 직교하고, 각 마이크 쌍이 서로 마주보도록 배치되어 있는 구조로부터, 상기 4개의 정방향 마이크 쌍의 상호상관관계(GCC) 및 2개의 대각선 방향 마이크쌍의 상호상관관계(GCC)를 산출하는 것을 특징으로 한다.In the present invention, the step of calculating the cross-correlation (GCC), the four mutually orthogonal microphones, each pair of microphones arranged to face each other, the mutual correlation of the four forward microphone pairs ( GCC) and two diagonal microphone pairs are calculated.

본 발명에 있어서, 상기 SRP-PHAT를 산출하는 단계는, 4 개의 상기 마이크가 서로 직교하고, 각 마이크 쌍이 서로 마주보도록 배치되어 있는 구조를 이용하여 음원 방향을 제1 내지 제4 영역으로 분할하는 단계; 및 상기 각 영역에 대응하는 1개의 정방향 마이크 쌍의 상호상관관계(GCC) 및 2개의 대각선 방향 마이크쌍의 상호상관관계(GCC)를 조합하여 SRP-PHAT를 산출하는 단계;를 포함하는 것을 특징으로 한다.In the present invention, the step of calculating the SRP-PHAT, the step of dividing the sound source direction into the first to fourth regions by using a structure in which the four microphones are orthogonal to each other, and each pair of microphones face each other. ; And calculating an SRP-PHAT by combining a cross correlation (GCC) of one forward microphone pair and a cross correlation (GCC) of two diagonal microphone pairs corresponding to the respective areas. do.

본 발명에 있어서, 상기 분할하는 단계는, 360도 음원 방향을 90도씩 제1 내지 제4 영역으로 분할하는 것을 특징으로 한다.In the present invention, the dividing may include dividing the 360-degree sound source direction into first to fourth regions by 90 degrees.

본 발명이 이루고자 하는 기술적인 과제를 해결하기 위한 일 실시 예에 따른 음원 위치 추정 장치는 소리를 획득하는 복수의 마이크; 서로 다른 두 개의 마이크 조합으로부터 획득된 소리에 대해 상호상관관계(GCC)를 산출하고, 상기 마이크 구조를 이용하여 음원 방향을 제1 내지 제4 영역으로 분할하며, 상기 제1 내지 제4 영역에 대응하는 상기 상호상관관계를 조합하여 SRP-PHAT를 산출하는 음원 탐색부; 및 소정의 시간대 별로 상기 산출된 SRP-PHAT를 누적하여 최대 SRP-PHAT가 가장 많이 누적된 방향을 음원 위치로 추정하는 음원 위치 추정부;를 포함하는 것을 특징으로 한다.According to an aspect of the present invention, there is provided a sound source position estimation device comprising: a plurality of microphones for acquiring sound; Computing a correlation (GCC) for sound obtained from two different microphone combinations, dividing a sound source direction into first to fourth regions using the microphone structure, and corresponding to the first to fourth regions. A sound source search unit for combining the cross-correlation to calculate an SRP-PHAT; And a sound source position estimator for accumulating the calculated SRP-PHAT for each predetermined time period and estimating a direction in which the maximum SRP-PHAT is accumulated the most as a sound source position.

본 발명에 있어서, 상기 복수의 마이크는, 4 개의 마이크가 서로 직교하고, 각 마이크 쌍이 서로 마주보도록 배치되어 있는 것을 특징으로 한다.In the present invention, the plurality of microphones are arranged such that four microphones are orthogonal to each other and each pair of microphones faces each other.

본 발명에 있어서, 상기 음원 탐색부는, 서로 다른 두 개의 마이크 조합으로부터 획득된 소리에 대해 상호상관관계(GCC)를 산출하는 상호상관관계 산출부; 상기 마이크 구조를 이용하여 음원 방향을 제1 내지 제4 영역으로 분할하는 영역 분할부; 및 상기 제1 내지 제4 영역에 대응하는 상기 상호상관관계를 조합하여 SRP-PHAT를 산출하는 SRP-PHAT 산출부;를 포함하는 것을 특징으로 한다.In the present invention, the sound source search unit, a cross-correlation calculation unit for calculating a correlation (GCC) for the sound obtained from two different microphone combinations; An area dividing unit dividing a sound source direction into first to fourth areas by using the microphone structure; And an SRP-PHAT calculator configured to calculate an SRP-PHAT by combining the cross correlations corresponding to the first to fourth regions.

본 발명에 있어서, 상기 상호상관관계 산출부는, 4 개의 상기 마이크가 서로 직교하고, 각 마이크 쌍이 서로 마주보도록 배치되어 있는 구조로부터, 상기 4개의 정방향 마이크 쌍의 상호상관관계(GCC) 및 2개의 대각선 방향 마이크쌍의 상호상관관계(GCC)를 산출하는 것을 특징으로 한다.In the present invention, the cross-correlation calculation unit has a structure in which the four microphones are orthogonal to each other and each microphone pair is disposed to face each other, so that the four correlation microphones (GCC) and two diagonal lines are arranged. A cross correlation (GCC) of the directional microphone pairs is calculated.

본 발명에 있어서, 상기 SRP-PHAT 산출부는, 각각의 상기 제1 내지 제4 영역에 대응하는 1개의 정방향 마이크 쌍의 상호상관관계(GCC) 및 2개의 대각선 방향 마이크쌍의 상호상관관계(GCC)를 조합하여 SRP-PHAT를 산출하는 것을 특징으로 한다.In the present invention, the SRP-PHAT calculation unit, the cross-correlation (GCC) of one forward microphone pair corresponding to each of the first to the fourth region and the cross-correlation (GCC) of two diagonal microphone pairs It is characterized by calculating the SRP-PHAT by combining.

상술한 바와 같이 본 발명에 따르면, 마이크 구조를 이용하여 음원 방향을 분할하고, 분할된 음원 방향 영역을 검출할 수 있는 마이크 쌍들의 조합을 통해 SRP-PHAT를 계산하여 정확하게 음원의 위치를 추정할 수 있다.As described above, according to the present invention, the position of the sound source can be accurately estimated by dividing the sound source direction using a microphone structure and calculating the SRP-PHAT through a combination of microphone pairs capable of detecting the divided sound source direction region. have.

도 1은 본 발명의 일 실시 예에 따른 음원 위치 추정 장치의 구성을 보이는 블록도 이다.
도 2는 도 1 중 음원 방향 영역 분할을 설명하는 도면이다.
도 3은 도 1 중 임의의 어느 한 음원 방향 영역으로부터 SRP-PHAT 산출을 설명하는 도면이다.
도 4는 도 1 중 각 음원 방향 영역을 보이는 도면이다.
도 5는 본 발명의 일 실시 예에 따른 음원 위치 추정 방법의 동작을 보이는 흐름도 이다.
1 is a block diagram showing the configuration of a sound source position estimation apparatus according to an embodiment of the present invention.
FIG. 2 is a diagram for explaining sound source direction region division in FIG. 1.
FIG. 3 is a diagram illustrating SRP-PHAT calculation from any sound source direction region in FIG. 1.
4 is a diagram illustrating each sound source direction region of FIG. 1.
5 is a flowchart illustrating an operation of a sound source position estimation method according to an embodiment of the present invention.

이하, 본 발명의 실시 예를 첨부도면을 참조하여 상세히 설명하기로 하며, 첨부 도면을 참조하여 설명함에 있어, 동일하거나 대응하는 구성 요소는 동일한 도면번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENT Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. Referring to the accompanying drawings, the same or corresponding components are denoted by the same reference numerals, do.

도 1은 본 발명의 일 실시 예에 따른 음원 위치 추정 장치의 구성을 보이는 블록도 이다.1 is a block diagram showing the configuration of a sound source position estimation apparatus according to an embodiment of the present invention.

도 1을 참조하면, 음원 위치 추정 장치(10)는 마이크(100), 음원 탐색부(200) 및 음원 위치 추정부(300)를 포함한다.Referring to FIG. 1, the sound source position estimating apparatus 10 includes a microphone 100, a sound source searching unit 200, and a sound source position estimating unit 300.

마이크(100)는 적어도 하나 이상의 음원으로부터 소리를 획득하며, 마이크1(M1), 마이크2(M2), 마이크3(M3) 및 마이크4(M4)로서, 총 4개의 마이크를 포함한다. 본 실시 예에서 마이크(100) 구조는 4 개의 마이크가 서로 직교하고, 각 마이크 쌍이 서로 마주보도록 배치되어 있다. 즉, 도 2에 도시된 바와 같이, 4개의 마이크(M1-M4)가 각각 반 시계 방향으로 45도, 135도, 225도 및 315도에 배열되어 있다. 또한 마이크1(M1) 및 마이크2(M2)쌍은 마이크3(M3) 및 마이크4(M4)쌍과 서로 마주보도록 배치되어 있고, 마이크1(M1) 및 마이크4(M4)쌍은 마이크2(M2) 및 마이크3(M3)쌍과 서로 마주보도록 배치되어 있다.The microphone 100 obtains sound from at least one or more sound sources, and includes four microphones as a microphone 1 (M1), a microphone 2 (M2), a microphone 3 (M3), and a microphone 4 (M4). In the present embodiment, the microphone 100 is arranged such that four microphones are orthogonal to each other and each pair of microphones faces each other. That is, as shown in Fig. 2, four microphones M1-M4 are arranged at 45 degrees, 135 degrees, 225 degrees and 315 degrees counterclockwise, respectively. In addition, the microphone 1 (M1) and microphone 2 (M2) pairs are arranged to face each other with the microphone 3 (M3) and microphone 4 (M4) pairs, and the microphone 1 (M1) and microphone 4 (M4) pairs are microphone 2 ( M2) and microphone 3 (M3) pairs are arranged to face each other.

음원 탐색부(200)는 서로 다른 두 개의 상기 마이크 쌍으로 획득된 소리에 대해 상호상관관계(GCC)를 산출하고, 상기 마이크 구조를 이용하여 음원 방향을 제1 내지 제4 영역으로 분할하며, 제1 내지 제4 영역에 대응하는 상호상관관계를 조합하여 SRP-PHAT를 산출한다.The sound source searching unit 200 calculates a cross correlation (GCC) for sounds obtained by two different microphone pairs, and divides a sound source direction into first to fourth regions using the microphone structure. The SRP-PHAT is calculated by combining the cross correlations corresponding to the first to fourth areas.

본 실시 예에서 음원 탐색부(200)는 GCC 산출부(210), 영역 분할부(220)및SRP-PHAT 산출부(230)를 포함한다.In the present embodiment, the sound source search unit 200 includes a GCC calculator 210, an area divider 220, and an SRP-PHAT calculator 230.

GCC 산출부(210)는 서로 다른 두 개의 마이크 조합 즉, 마이크 쌍으로부터 획득된 소리에 대해 상호상관관계(generalized cross correlation; GCC)를 산출한다. 여기서 상호상관관계란, 음원으로부터 두 개의 마이크 각각에서 수신한 소리의 도착 시간 차이를 나타낸다. GCC 산출 수학식은 하기 수학식 1과 같다.The GCC calculator 210 calculates a generalized cross correlation (GCC) for sounds obtained from two different microphone combinations, that is, microphone pairs. Here, the cross-correlation refers to the difference in arrival time of the sound received by each of the two microphones from the sound source. The GCC calculation equation is shown in Equation 1 below.

Figure pat00001
Figure pat00001

수학식 1에서,

Figure pat00002
는 가중치 함수를 나타내고,
Figure pat00003
는 i번째 마이크를 통해 입력된 신호의 주파수 영역 값이며,
Figure pat00004
는 주파수 영역의 공액 복소수 값이다.In Equation 1,
Figure pat00002
Represents a weight function,
Figure pat00003
Is the frequency domain value of the signal input through the i-th microphone,
Figure pat00004
Is a conjugate complex value in the frequency domain.

본 실시 예의 마이크 구조에서 총 6개의 GCC를 산출할 수 있다. 즉, 마이크1(M1) 및 마이크2(M2)의 GCC, 마이크2(M2) 및 마이크3(M3)의 GCC, 마이크3(M3) 및 마이크4(M4)의 GCC, 마이크4(M4) 및 마이크1(M1)의 GCC와, 마이크1(M1) 및 마이크3(M3)의 GCC, 마이크2(M2) 및 마이크3(M3)의 GCC를 산출할 수 있다. 여기서, 앞부분 4개의 GCC를 정방향 GCC라 할 수 있고, 뒷부분 2개의 GCC를 대각선 방향 GCC라 할 수 있다.A total of six GCCs can be calculated in the microphone structure of the present embodiment. That is, GCC of microphone 1 (M1) and microphone 2 (M2), GCC of microphone 2 (M2) and microphone 3 (M3), GCC of microphone 3 (M3) and microphone 4 (M4), microphone 4 (M4) and The GCC of the microphone 1 (M1), the GCC of the microphone 1 (M1) and the microphone 3 (M3), the GCC of the microphone 2 (M2) and the microphone 3 (M3) can be calculated. Here, the first four GCCs may be referred to as a forward GCC, and the rear two GCCs may be referred to as a diagonal GCC.

영역 분할부(220)는 마이크(M1-M4) 구조를 이용하여 음원 방향을 제1 내지 제4 영역(Q1-Q4)으로 분할한다. 주위 환경 방해 요소나 마이크 구조로 인한 지연거리를 계산하는 과정에서 오차가 발생하는 경우가 존재한다. 이때 지연거리 오차가 포함된 데이터의 상호상관관계 연산값을 코사인 역함수를 이용하여 각도로 사상할 때 선형으로 근접화 되는 구간에서 각도 사상 오차가 작다. The region dividing unit 220 divides the sound source direction into the first to fourth regions Q1 to Q4 using the microphone M1 to M4 structure. Errors occur when calculating delay distances due to environmental disturbances or microphone structure. At this time, when mapping the correlation value of the data including the delay distance error to the angle using the cosine inverse function, the angle mapping error is small in the linearly approaching section.

본 실시 예에서는 이러한 각도 사상 오차가 적게 발생하는 구간을 90도로 분할한다. 구간을 나누지 않고 전 방향(0도-360도)를 하나의 마이크쌍 조합을 통해 계산할 경우, imaginary source가 발생하여 음원 위치 성능이 저해된다. 따라서, 본 실시 예에서는, 도 2에 도시된 바와 같이, 제1 영역(Q1)은 315도-45도 구간으로, 제2 영역(Q2)는 45도-135도 구간으로, 제3 영역(Q3)은 135도-225도 구간으로, 제4 영역(Q4)는 225도-315도 구간으로 분할한다.In the present embodiment, the section in which such an angular mapping error occurs is divided into 90 degrees. When calculating the omni-directional direction (0 degrees-360 degrees) through one microphone pair combination without dividing the interval, an imaginary source is generated and sound source position performance is impaired. Therefore, in the present embodiment, as shown in FIG. 2, the first region Q1 is in the range of 315 degrees to 45 degrees, the second region Q2 is in the range of 45 degrees to 135 degrees and the third region Q3. ) Is divided into a 135 degree-225 degree interval, and the fourth region Q4 is divided into a 225 degree-315 degree interval.

SRP-PHAT 산출부(230)는 제1 내지 제4 영역(Q1-Q4)에 각각 대응하는 상호상관관계(GCC)를 조합하여 SRP-PHAT를 산출한다. SRP-PHAT 산출 시에 각 영역에 대응하는 1개의 정방향 GCC 및 2개의 대각선 방향 GCC, 총 3개의 GCC를 조합하여 SRP-PHAT를 산출한다.The SRP-PHAT calculation unit 230 calculates the SRP-PHAT by combining the cross correlations GCC corresponding to the first to fourth regions Q1 to Q4, respectively. When calculating the SRP-PHAT, the SRP-PHAT is calculated by combining one forward GCC, two diagonal GCCs corresponding to each region, and three GCCs in total.

여기서, SRP 산출 수학식은 하기 수학식 2와 같다.Here, the SRP calculation equation is as follows.

Figure pat00005
Figure pat00005

여기서 q는 음원의 후보 위치 좌표 이고, N은 마이크의 개수(본 실시 예에서는 4),

Figure pat00006
은 두 마이크 사이의 신호 도달 시간차를 나타낸다.
Figure pat00007
는 앞서 설명한 GCC 값이다. SRP 알고리즘은 해석상 GCC의 모든 마이크 조합을 이용한 시간차 추정 기법이라고 할 수 있다. Where q is the candidate position coordinate of the sound source, N is the number of microphones (4 in this embodiment),
Figure pat00006
Denotes the difference in signal arrival time between two microphones.
Figure pat00007
Is the GCC value described above. The SRP algorithm can be interpreted as a time difference estimation technique using all microphone combinations of GCC.

특히 가중치 함수를

Figure pat00008
로 적용하면 입력 신호의 파워를 갖게 하고 위상의 차이를 이용하는 것으로, PHAT(phase transform)이라 한다. PHAT 가중치 기법은 반향에 강인하다고 알려져 있고, 이를 적용한 SPR 알고리즘을 SRP-PHAT 라 한다. Especially the weight function
Figure pat00008
In this case, the power of the input signal is used and the phase difference is used. This is called a PHAT (phase transform). The PHAT weighting technique is known to be robust to echo, and the SPR algorithm to which it is applied is called SRP-PHAT.

제1 영역(Q1: 315도-45; 도 4a)의 SRP-PHAT 산출 시에는, 제1 영역(Q1)에 대응하는 정방향 마이크1(M1) 및 마이크4(M4)의 GCC, 대각선 방향 마이크1(M1) 및 마이크3(M3)의 GCC와, 마이크2(M2) 및 마이크4(M4)의 GCC, 총 3개의 GCC를 조합하여 SRP-PHAT를 산출한다. 여기서 GCC의 조합은 써메이션, 멀티플레이션, 미니멈 등으로 다양하게 조합할 수 있다.When calculating the SRP-PHAT in the first region Q1 315 to 45; FIG. 4A, the GCC of the forward microphone 1 M1 and the microphone 4 M4 and the diagonal microphone 1 corresponding to the first region Q1 are calculated. SRP-PHAT is calculated by combining the GCC of M1 and microphone 3 (M3), the GCC of microphone 2 (M2) and microphone 4 (M4), and a total of three GCCs. Here, the combination of GCC can be variously combined into summation, multiplexing, minimum, and the like.

제2 영역(Q2: 45도-135도: 도 4b)의 SRP-PHAT 산출 시에는, 도 3에 도시된 바와 같이 제2 영역(Q2) 대응하는 정방향 마이크1(M1) 및 마이크2(M2)의 GCC, 대각선 방향 마이크1(M1) 및 마이크3(M3)의 GCC와 마이크2(M2) 및 마이크4(M4)의 GCC를 조합하여 SRP-PHAT를 산출한다. When calculating the SRP-PHAT of the second area (Q2: 45 degrees to 135 degrees: FIG. 4B), as shown in FIG. 3, the forward microphone 1 (M1) and the microphone 2 (M2) corresponding to the second area (Q2). SRP-PHAT is calculated by combining the GCC of the first direction, the diagonal direction microphone 1 (M1) and the microphone 3 (M3) and the GCC of the microphone 2 (M2) and the microphone 4 (M4).

제3 영역(Q3: 135도-225도: 도 4c)의 SRP-PHAT 산출 시에는, 제3 영역(Q3) 대응하는 정방향 마이크2(M2) 및 마이크3(M3)의 GCC, 대각선 방향 마이크1(M1) 및 마이크3(M3)의 GCC와 마이크2(M2) 및 마이크4(M4)의 GCC를 조합하여 SRP-PHAT를 산출한다. In calculating the SRP-PHAT in the third region Q3 (135 degrees to 225 degrees: FIG. 4C), the GCC of the forward microphone 2 (M2) and the microphone 3 (M3) and the diagonal microphone 1 corresponding to the third region Q3 are calculated. SRP-PHAT is calculated by combining the GCC of M1 and microphone 3 (M3) with the GCC of microphone 2 (M2) and microphone 4 (M4).

제4 영역(Q4: 225도-315도: 도 4d)의 SRP-PHAT 산출 시에는, 제4 영역(Q4) 대응하는 정방향 마이크3(M3) 및 마이크4(M4)의 GCC, 대각선 방향 마이크1(M1) 및 마이크3(M3)의 GCC와 마이크2(M2) 및 마이크4(M4)의 GCC를 조합하여 SRP-PHAT를 산출한다. When calculating the SRP-PHAT in the fourth region (Q4: 225 degrees to 315 degrees: FIG. 4D), the GCC of the forward microphone 3 (M3) and the microphone 4 (M4) and the diagonal microphone 1 corresponding to the fourth region (Q4) are calculated. SRP-PHAT is calculated by combining the GCC of M1 and microphone 3 (M3) with the GCC of microphone 2 (M2) and microphone 4 (M4).

음원 위치 추정부(300)는 소정의 시간대 별로 산출된 SRP-PHAT를 누적하여 최대 SRP-PHAT가 가장 많이 누적된 방향을 음원 위치로 추정한다. 음원이 한 개인 경우 최대 SRP-PHAT가 가장 많이 누적된 방향이 한 개 산출이 되고, 음원이 복수 개 인 경우, 최대 SRP-PHAT가 가장 많이 누적된 방향이 복수 개 산출 된다.The sound source position estimator 300 accumulates the SRP-PHAT calculated for each predetermined time period and estimates the direction in which the maximum SRP-PHAT is accumulated the most as the sound source position. In the case of one sound source, the direction in which the maximum SRP-PHAT is accumulated the most is calculated. In the case of a plurality of sound sources, the direction in which the maximum SRP-PHAT is accumulated the most is calculated.

이와 같이 마이크 구조를 이용하여 음원 방향을 분할하고, 분할된 음원 방향 영역을 검출할 수 있는 마이크 쌍들의 조합을 통해 SRP-PHAT를 계산하여 정확하게 음원의 위치를 추정할 수 있다.As described above, the position of the sound source can be accurately estimated by dividing the sound source direction using a microphone structure and calculating the SRP-PHAT through a combination of microphone pairs capable of detecting the divided sound source direction region.

도 5는 본 발명의 일 실시 예에 따른 음원 위치 추정 방법의 동작을 보이는 흐름도 이다. 이하의 설명에서, 도 1 내지 도 4에 대한 설명과 중복되는 부분은 그 설명을 생략하기로 한다.5 is a flowchart illustrating an operation of a sound source position estimation method according to an embodiment of the present invention. In the following description, the description of the parts which are the same as those in the description of Figs. 1 to 4 will be omitted.

도 5를 참조하면, 음원 위치 추정 장치(10)는 복수의 마이크로부터 소리를 획득하는 단계(S10)를 수행한다. 마이크는 적어도 하나 이상의 음원으로부터 소리를 획득하며, 4개의 마이크를 포함한다. 마이크의 구조는 4 개의 마이크가 서로 직교하고, 각 마이크 쌍이 서로 마주보도록 배치되어 있다.Referring to FIG. 5, the sound source position estimating apparatus 10 performs a step of obtaining sound from a plurality of microphones (S10). The microphone obtains sound from at least one sound source and includes four microphones. The structure of the microphones is arranged such that four microphones are orthogonal to each other, and each pair of microphones faces each other.

복수의 마이크로부터 소리가 획득되면, 음원 위치 추정 장치(10)는 서로 다른 두 개의 상기 마이크 쌍으로 획득된 소리에 대해 상호상관관계(GCC)를 산출하는 단계(S20)를 수행한다. 본 실시 예의 마이크 구조에서 총 6개의 GCC를 산출할 수 있다. 즉, 마이크1(M1) 및 마이크2(M2)의 GCC, 마이크2(M2) 및 마이크3(M3)의 GCC, 마이크3(M3) 및 마이크4(M4)의 GCC, 마이크4(M4) 및 마이크1(M1)의 GCC와, 마이크1(M1) 및 마이크3(M3)의 GCC, 마이크2(M2) 및 마이크3(M3)의 GCC를 산출할 수 있다. 여기서, 앞부분 4개의 GCC를 정방향 GCC라 할 수 있고, 뒷부분 2개의 GCC를 대각선 방향 GCC라 할 수 있다.When sound is obtained from a plurality of microphones, the sound source position estimation apparatus 10 performs a step S20 of calculating a mutual correlation (GCC) with respect to sounds acquired by two different microphone pairs. A total of six GCCs can be calculated in the microphone structure of the present embodiment. That is, GCC of microphone 1 (M1) and microphone 2 (M2), GCC of microphone 2 (M2) and microphone 3 (M3), GCC of microphone 3 (M3) and microphone 4 (M4), microphone 4 (M4) and The GCC of the microphone 1 (M1), the GCC of the microphone 1 (M1) and the microphone 3 (M3), the GCC of the microphone 2 (M2) and the microphone 3 (M3) can be calculated. Here, the first four GCCs may be referred to as a forward GCC, and the rear two GCCs may be referred to as a diagonal GCC.

상호상관관계(GCC)를 산출이 완료되면, 음원 위치 추정 장치(10)는 마이크(M1-M4) 구조를 이용하여 음원 방향을 제1 내지 제4 영역(Q1-Q4)으로 분할하고, 제1 내지 제4 영역(Q1-Q4)에 대응하는 GCC를 이용하여 SRP-PHAT를 산출하는 단계(S30)를 수행한다. 음원 위치 추정 장치(10)는 각도 사상 오차가 적게 발생하는 구간을 90도로 설정하고, 제1 영역(Q1)은 315도-45도 구간으로, 제2 영역(Q2)는 45도-135도 구간으로, 제3 영역(Q3)은 135도-225도 구간으로, 제4 영역(Q4)는 225도-315도 구간으로 분할한다. 제1 영역(Q1: 315도-45)에 대하여 정방향 마이크1(M1) 및 마이크4(M4)의 GCC, 대각선 방향 마이크1(M1) 및 마이크3(M3)의 GCC와, 마이크2(M2) 및 마이크4(M4)의 GCC, 총 3개의 GCC를 조합하여 SRP-PHAT를 산출하고, 제2 영역(Q2:45-135도)에 대하여 정방향 마이크1(M1) 및 마이크2(M2)의 GCC, 대각선 방향 마이크1(M1) 및 마이크3(M3)의 GCC와 마이크2(M2) 및 마이크4(M4)의 GCC를 조합하여 SRP-PHAT를 산출하고, 제3 영역(Q3: 135도-225도)에 대하여 정방향 마이크2(M2) 및 마이크3(M3)의 GCC, 대각선 방향 마이크1(M1) 및 마이크3(M3)의 GCC와 마이크2(M2) 및 마이크4(M4)의 GCC를 조합하여 SRP-PHAT를 산출하며, 제4 영역(Q4: 225도-315도)에 대하여 정방향 마이크3(M3) 및 마이크4(M4)의 GCC, 대각선 방향 마이크1(M1) 및 마이크3(M3)의 GCC와 마이크2(M2) 및 마이크4(M4)의 GCC를 조합하여 SRP-PHAT를 산출한다. When the calculation of the cross correlation GCC is completed, the sound source position estimating apparatus 10 divides the sound source direction into the first to fourth regions Q1 to Q4 using the microphone M1 to M4 structure, and the first to the first region. In operation S30, the SRP-PHAT is calculated using the GCC corresponding to the fourth to fourth regions Q1 to Q4. The sound source position estimating apparatus 10 sets the section in which the angular mapping error is less than 90 degrees, the first region Q1 is 315 degrees to 45 degrees, and the second region Q2 is 45 degrees to 135 degrees. For example, the third region Q3 is divided into 135-225 degrees intervals, and the fourth region Q4 is divided into 225 degrees-315 degrees intervals. GCC of the forward microphone 1 (M1) and the microphone 4 (M4), the GCC of the diagonal microphone 1 (M1) and the microphone 3 (M3), and the microphone 2 (M2) with respect to the 1st area | region Q1: 315 degree-45. And combining the GCC of the microphone 4 (M4) and a total of three GCCs to calculate the SRP-PHAT, and the GCC of the forward microphone 1 (M1) and the microphone 2 (M2) with respect to the second region (Q2: 45-135 degrees). , Combining the GCC of the microphone 1 (M1) and the microphone 3 (M3) in the diagonal direction and the GCC of the microphone 2 (M2) and the microphone 4 (M4) to calculate the SRP-PHAT, and the third region (Q3: 135 degrees-225). FIG. 6) combines the GCC of forward microphone 2 (M2) and microphone 3 (M3), the GCC of diagonal microphone 1 (M1) and microphone 3 (M3), and the GCC of microphone 2 (M2) and microphone 4 (M4). Calculate the SRP-PHAT, and the GCC of the forward microphone 3 (M3) and the microphone 4 (M4), the diagonal microphone 1 (M1) and the microphone 3 (M3) for the fourth region (Q4: 225 degrees to 315 degrees). SRP-PHAT is calculated by combining the GCC and the GCC of the microphone 2 (M2) and the microphone 4 (M4).

SRP-PHAT를 산출이 완료되면, 음원 위치 추정 장치(10)는 소정의 시간대 별로 산출된 SRP-PHAT를 누적하여 최대 SRP-PHAT가 가장 많이 누적된 방향을 음원 위치로 추정하는 단계(S40)를 수행한다.When the calculation of the SRP-PHAT is completed, the sound source position estimating apparatus 10 accumulates the SRP-PHAT calculated for each predetermined time period and estimates the direction in which the largest SRP-PHAT is accumulated the most as the sound source position (S40). To perform.

이제까지 본 발명에 대하여 바람직한 실시 예를 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 본 발명을 구현할 수 있음을 이해할 것이다. 그러므로 상기 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 한다.The present invention has been described above with reference to preferred embodiments. It will be understood by those skilled in the art that the present invention may be embodied in various other forms without departing from the spirit or essential characteristics thereof. Therefore, the above-described embodiments should be considered in an illustrative rather than a restrictive sense. The scope of the present invention is shown not in the above description but in the claims, and all differences within the scope should be construed as being included in the present invention.

100: 마이크 200: 음원 탐색부
210: GCC 산출부 220: 영역 분할부
230: SRP-PHAT 산출부 300: 음원 위치 추정부
100: microphone 200: sound source search unit
210: GCC calculator 220: region divider
230: SRP-PHAT calculation unit 300: sound source position estimation unit

Claims (10)

복수의 마이크로부터 소리를 획득하는 단계;
서로 다른 두 개의 마이크 조합으로부터 획득된 상기 소리에 대해 상호상관관계(GCC)를 산출하는 단계;
상기 마이크 구조를 이용하여 음원 방향을 제1 내지 제4 영역으로 분할하고, 상기 제1 내지 제4 영역에 대응하는 상기 상호상관관계를 조합하여 SRP-PHAT를 산출하는 단계; 및
소정의 시간대 별로 상기 산출된 SRP-PHAT를 누적하여 최대 SRP-PHAT가 가장 많이 누적된 방향을 음원 위치로 추정하는 단계;를 포함하는 것을 특징으로 하는 음원 위치 추정 방법.
Acquiring sound from the plurality of microphones;
Calculating a cross correlation (GCC) for the sound obtained from two different microphone combinations;
Calculating a SRP-PHAT by dividing a sound source direction into first to fourth regions using the microphone structure and combining the cross-correlation corresponding to the first to fourth regions; And
And accumulating the calculated SRP-PHAT for each predetermined time period, and estimating a direction in which the maximum SRP-PHAT is accumulated the most as a sound source location.
제 1항에 있어서, 상기 복수의 마이크는,
4 개의 마이크가 서로 직교하고, 각 마이크 쌍이 서로 마주보도록 배치되어 있는 것을 특징으로 하는 음원 위치 추정 방법.
The method of claim 1, wherein the plurality of microphones,
And four microphones orthogonal to each other, and each pair of microphones is disposed to face each other.
제 1항에 있어서, 상기 상호상관관계(GCC)를 산출하는 단계는,
4 개의 상기 마이크가 서로 직교하고, 각 마이크 쌍이 서로 마주보도록 배치되어 있는 구조로부터, 상기 4개의 정방향 마이크 쌍의 상호상관관계(GCC) 및 2개의 대각선 방향 마이크쌍의 상호상관관계(GCC)를 산출하는 것을 특징으로 하는 음원 위치 추정 방법.
The method of claim 1, wherein the calculating of the cross correlation (GCC) comprises:
Computing the correlation of the four forward microphone pairs (GCC) and the two diagonal microphone pairs (GCC) from a structure in which the four microphones are orthogonal to each other and each microphone pair is disposed to face each other. Sound source position estimation method, characterized in that.
제 1항에 있어서, 상기 SRP-PHAT를 산출하는 단계는,
4 개의 상기 마이크가 서로 직교하고, 각 마이크 쌍이 서로 마주보도록 배치되어 있는 구조를 이용하여 음원 방향을 제1 내지 제4 영역으로 분할하는 단계; 및
상기 각 영역에 대응하는 1개의 정방향 마이크 쌍의 상호상관관계(GCC) 및 2개의 대각선 방향 마이크쌍의 상호상관관계(GCC)를 조합하여 SRP-PHAT를 산출하는 단계;를 포함하는 것을 특징으로 하는 음원 위치 추정 방법.
The method of claim 1, wherein the calculating of the SRP-PHAT comprises:
Dividing a sound source direction into first to fourth regions by using a structure in which four microphones are orthogonal to each other and each microphone pair is disposed to face each other; And
Calculating an SRP-PHAT by combining a cross correlation (GCC) of one forward microphone pair and a cross correlation (GCC) of two diagonal microphone pairs corresponding to the respective areas; Sound source position estimation method.
제 4항에 있어서, 상기 분할하는 단계는,
360도 음원 방향을 90도씩 제1 내지 제4 영역으로 분할하는 것을 특징으로 하는 음원 위치 추정 방법.
The method of claim 4, wherein the dividing comprises:
A sound source position estimation method, comprising dividing a 360-degree sound source direction into first to fourth regions by 90 degrees.
소리를 획득하는 복수의 마이크;
서로 다른 두 개의 상기 마이크 쌍으로 획득된 소리에 대해 상호상관관계(GCC)를 산출하고, 상기 마이크 구조를 이용하여 음원 방향을 제1 내지 제4 영역으로 분할하며, 상기 제1 내지 제4 영역에 대응하는 상기 상호상관관계를 조합하여 SRP-PHAT를 산출하는 음원 탐색부; 및
소정의 시간대 별로 상기 산출된 SRP-PHAT를 누적하여 최대 SRP-PHAT가 가장 많이 누적된 방향을 음원 위치로 추정하는 음원 위치 추정부;를 포함하는 것을 특징으로 하는 음원 위치 추정 장치.
A plurality of microphones for acquiring sound;
Computing a correlation (GCC) for the sound obtained by the two different pairs of microphones, and divides the sound source direction into first to fourth regions using the microphone structure, the first to fourth regions A sound source search unit for combining the corresponding correlations to calculate an SRP-PHAT; And
And a sound source position estimating unit for accumulating the calculated SRP-PHAT for each predetermined time period and estimating a direction in which the maximum SRP-PHAT is accumulated the most as a sound source position.
제 6항에 있어서, 상기 복수의 마이크는,
4 개의 마이크가 서로 직교하고, 각 마이크 쌍이 서로 마주보도록 배치되어 있는 것을 특징으로 하는 음원 위치 추정 장치.
The method of claim 6, wherein the plurality of microphones,
And four microphones orthogonal to each other, and each pair of microphones is disposed to face each other.
제 6항에 있어서, 상기 음원 탐색부는,
서로 다른 두 개의 마이크 조합으로부터 획득된 소리에 대해 상호상관관계(GCC)를 산출하는 상호상관관계 산출부;
상기 마이크 구조를 이용하여 음원 방향을 제1 내지 제4 영역으로 분할하는 영역 분할부; 및
상기 제1 내지 제4 영역에 대응하는 상기 상호상관관계를 조합하여 SRP-PHAT를 산출하는 SRP-PHAT 산출부;를 포함하는 것을 특징으로 하는 음원 위치 추정 장치.
The method of claim 6, wherein the sound source search unit,
A cross-correlation calculation unit for calculating a cross-correlation (GCC) for sounds obtained from two different microphone combinations;
An area dividing unit dividing a sound source direction into first to fourth areas by using the microphone structure; And
And a SRP-PHAT calculation unit for combining the cross-correlation corresponding to the first to fourth areas to calculate an SRP-PHAT.
제 8항에 있어서, 상기 상호상관관계 산출부는,
4 개의 상기 마이크가 서로 직교하고, 각 마이크 쌍이 서로 마주보도록 배치되어 있는 구조로부터, 상기 4개의 정방향 마이크 쌍의 상호상관관계(GCC) 및 2개의 대각선 방향 마이크쌍의 상호상관관계(GCC)를 산출하는 것을 특징으로 하는 음원 위치 추정 장치.
The method of claim 8, wherein the cross-correlation calculation unit,
Computing the correlation of the four forward microphone pairs (GCC) and the two diagonal microphone pairs (GCC) from a structure in which the four microphones are orthogonal to each other and each microphone pair is disposed to face each other. Sound source position estimation device, characterized in that.
제 8항에 있어서, 상기 SRP-PHAT 산출부는,
각각의 상기 제1 내지 제4 영역에 대응하는 1개의 정방향 마이크 쌍의 상호상관관계(GCC) 및 2개의 대각선 방향 마이크쌍의 상호상관관계(GCC)를 조합하여 SRP-PHAT를 산출하는 것을 특징으로 하는 음원 위치 추정 장치.
The method of claim 8, wherein the SRP-PHAT calculation unit,
SRP-PHAT is calculated by combining the cross-correlation (GCC) of one forward microphone pair and the cross-correlation (GCC) of two diagonal microphone pairs corresponding to each of the first to fourth regions. Sound source position estimation device.
KR1020120081973A 2012-07-26 2012-07-26 Apparatus and method for estimating location of sound source KR101767928B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120081973A KR101767928B1 (en) 2012-07-26 2012-07-26 Apparatus and method for estimating location of sound source

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120081973A KR101767928B1 (en) 2012-07-26 2012-07-26 Apparatus and method for estimating location of sound source

Publications (2)

Publication Number Publication Date
KR20140015894A true KR20140015894A (en) 2014-02-07
KR101767928B1 KR101767928B1 (en) 2017-08-31

Family

ID=50265169

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120081973A KR101767928B1 (en) 2012-07-26 2012-07-26 Apparatus and method for estimating location of sound source

Country Status (1)

Country Link
KR (1) KR101767928B1 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180064353A (en) 2018-05-31 2018-06-14 연세대학교 원주산학협력단 Automatic dividing apparatus of sound data
KR20190021820A (en) 2017-08-24 2019-03-06 서강대학교산학협력단 Method and apparatus for sound source localization based on error signal
KR20190104950A (en) * 2019-07-19 2019-09-11 엘지전자 주식회사 Moving robot and methods for tracking a speaker on using the saem
KR20210038399A (en) * 2019-09-30 2021-04-07 주식회사 원키 How to measure the sound wave arrival time more accurately by reflecting the noise input in the vehicle opening/closing system using sound wave communication and to locate the distance
CN113721196A (en) * 2021-09-01 2021-11-30 云知声(上海)智能科技有限公司 Gunshot positioning method and system
WO2022108470A1 (en) 2020-11-18 2022-05-27 "Stc-Innovations Limited" Method for locating a speaker using a conference system

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101950807B1 (en) 2018-02-27 2019-02-21 인하대학교 산학협력단 A neck-band audible device and volume control method for the device
CN108510987B (en) 2018-03-26 2020-10-23 北京小米移动软件有限公司 Voice processing method and device

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190021820A (en) 2017-08-24 2019-03-06 서강대학교산학협력단 Method and apparatus for sound source localization based on error signal
KR20180064353A (en) 2018-05-31 2018-06-14 연세대학교 원주산학협력단 Automatic dividing apparatus of sound data
KR20190104950A (en) * 2019-07-19 2019-09-11 엘지전자 주식회사 Moving robot and methods for tracking a speaker on using the saem
KR20210038399A (en) * 2019-09-30 2021-04-07 주식회사 원키 How to measure the sound wave arrival time more accurately by reflecting the noise input in the vehicle opening/closing system using sound wave communication and to locate the distance
WO2022108470A1 (en) 2020-11-18 2022-05-27 "Stc-Innovations Limited" Method for locating a speaker using a conference system
CN113721196A (en) * 2021-09-01 2021-11-30 云知声(上海)智能科技有限公司 Gunshot positioning method and system

Also Published As

Publication number Publication date
KR101767928B1 (en) 2017-08-31

Similar Documents

Publication Publication Date Title
KR20140015894A (en) Apparatus and method for estimating location of sound source
CN105388459B (en) The robust sound source space-location method of distributed microphone array network
Pavlidi et al. Real-time multiple sound source localization using a circular microphone array based on single-source confidence measures
Padois et al. Acoustic source localization using a polyhedral microphone array and an improved generalized cross-correlation technique
Xu et al. Underwater acoustic source localization method based on TDOA with particle filtering
KR20140015893A (en) Apparatus and method for estimating location of sound source
US9578433B2 (en) Method for self-calibration of a set of sensors, in particular microphones, and corresponding system
Lebarbenchon et al. Evaluation of an open-source implementation of the SRP-PHAT algorithm within the 2018 LOCATA challenge
KR20090128221A (en) Method for sound source localization and system thereof
Astapov et al. Simplified acoustic localization by linear arrays for wireless sensor networks
Archer-Boyd et al. Biomimetic direction of arrival estimation for resolving front-back confusions in hearing aids
KR20090118718A (en) Real-time srp-phat sound source localization system and control method using a search space clustering method
CN116299182A (en) Sound source three-dimensional positioning method and device
Farmani et al. TDOA-based self-calibration of dual-microphone arrays
KR101269189B1 (en) Apparatus and method for estimating sound source
Zhang et al. Structured total least squares based internal delay estimation for distributed microphone auto-localization
CN111157949A (en) Voice recognition and sound source positioning method
JP6650245B2 (en) Impulse response generation device and program
CN111933182B (en) Sound source tracking method, device, equipment and storage medium
Nikunen et al. Time-difference of arrival model for spherical microphone arrays and application to direction of arrival estimation
CN110876100B (en) Sound source orientation method and system
Lee et al. A vectorized method for computationally efficient SRP-PHAT sound source localization
Jiang et al. A simple microphone array for source direction and distance estimation
KR101483271B1 (en) Method for Determining the Representative Point of Cluster and System for Sound Source Localization
DOUAER et al. Tracking a sound source in two dimensions using microsoft kinect sensors

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant