KR101354960B1 - 영역 개념을 이용한 음파 입사 방향 추정 방법 - Google Patents
영역 개념을 이용한 음파 입사 방향 추정 방법 Download PDFInfo
- Publication number
- KR101354960B1 KR101354960B1 KR1020120043702A KR20120043702A KR101354960B1 KR 101354960 B1 KR101354960 B1 KR 101354960B1 KR 1020120043702 A KR1020120043702 A KR 1020120043702A KR 20120043702 A KR20120043702 A KR 20120043702A KR 101354960 B1 KR101354960 B1 KR 101354960B1
- Authority
- KR
- South Korea
- Prior art keywords
- sound
- region
- beam power
- interest
- sound wave
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
- G01S3/802—Systems for determining direction or deviation from predetermined direction
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
- G01S3/8006—Multi-channel systems specially adapted for direction-finding, i.e. having a single aerial system capable of giving simultaneous indications of the directions of different signals
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S3/00—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
- G01S3/80—Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
- G01S3/801—Details
Abstract
본 발명은 영역 개념을 이용한 음파 입사 방향 추정 방법에 관한 것으로, 사용자가 정의하는 전체 추정 공간을 영역으로 나누어 각 영역을 대표하는 모델을 얻고, 그 모델과 수신된 음압 신호와의 상관관계를 비교하는 과정을 반복 수행하는 방법을 통하여 기존의 방법보다 연산량을 줄일 수 있고, 음파의 입사 방향 혹은 음원이 존재하는 위치의 범위를 추정할 수 있다.
본 발명의 영역 개념을 이용한 음파 입사 방향 추정 방법은, (a) 복수의 마이크로폰을 배열하는 단계, (b) 상기 복수의 마이크로폰 배열에 임의의 방향으로부터 적어도 하나 이상의 음압 신호가 입사되는 단계, (c) 상기 음압 신호의 입사 방향을 추정하기 위하여 사용자가 정의한 전체 영역을 적어도 두 영역 이상으로 등분하여 각 영역에서의 음압 신호, 가중치, 공간 평균 빔파워, 각각의 상대적인 크기를 비교하여 그 중 큰 값의 영역 내에 음파의 입사 방향이 존재한다고 추정하는 단계, (d) 상기 음파의 입사 방향이 존재한다고 추정된 영역을 다시 적어도 두 영역 이상으로 등분하여 각 영역에서의 음압 신호, 가중치, 공간 평균 빔파워, 각각의 상대적인 크기를 비교하여 그 중 큰 값의 영역 내에 음파의 입사 방향이 존재한다고 추정하는 단계 및, (e) 상기 영역이 소정 범위 이하가 될 때까지 상기 (d) 단계를 반복 수행하여 상기 소정 범위 이하가 된 영역을 음파가 입사하는 방향의 범위로 추정하는 단계를 포함하고 있다.
본 발명의 영역 개념을 이용한 음파 입사 방향 추정 방법은, (a) 복수의 마이크로폰을 배열하는 단계, (b) 상기 복수의 마이크로폰 배열에 임의의 방향으로부터 적어도 하나 이상의 음압 신호가 입사되는 단계, (c) 상기 음압 신호의 입사 방향을 추정하기 위하여 사용자가 정의한 전체 영역을 적어도 두 영역 이상으로 등분하여 각 영역에서의 음압 신호, 가중치, 공간 평균 빔파워, 각각의 상대적인 크기를 비교하여 그 중 큰 값의 영역 내에 음파의 입사 방향이 존재한다고 추정하는 단계, (d) 상기 음파의 입사 방향이 존재한다고 추정된 영역을 다시 적어도 두 영역 이상으로 등분하여 각 영역에서의 음압 신호, 가중치, 공간 평균 빔파워, 각각의 상대적인 크기를 비교하여 그 중 큰 값의 영역 내에 음파의 입사 방향이 존재한다고 추정하는 단계 및, (e) 상기 영역이 소정 범위 이하가 될 때까지 상기 (d) 단계를 반복 수행하여 상기 소정 범위 이하가 된 영역을 음파가 입사하는 방향의 범위로 추정하는 단계를 포함하고 있다.
Description
본 발명은 영역 개념을 이용한 음파 입사 방향 추정 방법에 관한 것으로, 보다 상세하게는 영역 관점에서 각 영역의 공간 평균 빔파워를 통하여 음파가 입사하는 방향의 범위를 추정하여 산술량을 줄일 수 있는 영역 개념을 이용한 음파 입사 방향 추정 방법에 관한 것이다.
인간은 소리가 들려올 때 그 방향을 대략적으로 파악할 수 있는데, 이는 왼쪽과 오른쪽 귀에 들려오는 시간 차이를 이용하여 추정하는 것으로 밝혀져 있다[18].
그 중 가장 대표적인 방법이 지연-합 빔형성 방법(delay-and-sum beamforming method)이다. 이 방법은 음파의 입사 방향 혹은 음원의 위치를 가정하고 미리 정한 분해능(resolution)에 맞게 후보 위치 혹은 후보 방향을 추정한다. 구체적으로는 마이크로폰 배열에 수신된 음압 신호와 가정한 모델에 근거한 신호와의 상관관계를 모든 후보 위치 혹은 방향에 대해 계산하여 음파의 입사 방향 혹은 음원의 위치를 추정한다. (도 2 참조) 따라서, 음파의 입사 방향 혹은 음원의 위치 추정에 대한 정확성은 분해능에 의하여 정해지는데, 분해능이 작아질수록 연산량이 증가한다. 상관관계가 가장 높은 지점을 음파의 입사 방향 혹은 음원의 위치로 추정할 때 그 주변 역시 추정 가능한 지점들이라고 생각할 수 있다. 즉, 음파의 입사 방향 혹은 음원의 위치가 어떤 범위 내에 존재할 것이라고 추정하는 방법도 생각해 볼 수 있다.
그렇다면 사용자가 정한 전체 추정 공간을 각 방향 혹은 지점으로 이산화(discretization)시켜 접근할 것이 아니라 이등분 혹은 그 이상으로 나누어 영역 관점(regional concept)에서 접근해 볼 수 있다. 이런 영역 개념으로 접근한다면 연산량을 줄이는 대신 음파가 입사하는 방향 혹은 음원의 위치를 어느 정도의 범위로 추정할 수 있을 것을 예상할 수 있다.
따라서, 본 발명에서는 사용자가 정의하는 전체 추정 공간을 영역으로 나누어 각 영역을 대표하는 모델을 얻고, 그 모델과 수신된 음압 신호와의 상관관계를 비교하는 과정을 반복 수행하는 방법을 제안한다. 이 반복 수행을 통하여 기존의 방법보다 연산량을 줄이고, 음파의 입사 방향 혹은 음원이 존재하는 위치의 범위를 추정하고자 한다.
빔형성 방법
음원의 위치 혹은 음파의 입사 방향 추정을 위한 신호처리(array signal processing)는 오래 전부터 발명 되어 왔으며, 높은 신호 대 잡음비(Signal to Noise Ratio, SNR)를 얻기 위해 노력하여 왔는데, 이것은 센서의 배열, 개수, 구경(array aperture) 등에 의하여 결정되는 것으로 알려져 있다(예를 들면, [4], [22], [40], [41], [43], [44]). 다수의 마이크로폰이 어떤 특정한 방향에 대해 원하는 신호 대 잡음비를 가질 수 있도록, 즉 원하는 지향성을 가질 수 있는 빔패턴 설계를 하는 연구가 주로 진행되어 왔다. 그 방법 중 실제 수신한 음압 신호와 음파 방정식을 통해 만들어진 모델링 신호를 상관(correlation)시켜 음원의 위치를 추정하는 방법이 있는데, 이를 정합장처리(MFP, Matched Field Processing)라고 하며 주로 수중 음향학(underwater acoustics)에서 발명가 진행되고 있다. 참고문헌 [1], [2], [5], [40], [41] 에서 다루고 있는 신호처리 방법은 얕은 바다(shallow water)에서 음속 및 매질의 변화, 해저면 및 해수면에 의한 반사와 산란 등에 의한 잡음의 영향을 감소시켜 신호 대 잡음비를 증가시켜 음원의 위치 추정, 특정 파라미터 도출 등을 하기 위해 연구되어 왔다.
정합장처리는 해양 도파관(waveguide)에서의 물리적인 음전달 구조를 고려하고 있어, 음원이 존재하는 방향뿐만 아니라 깊이와 거리도 추정이 가능하다. 이러한 점을 고려하여 정합장처리를 일반화된 빔형성 방법으로 부르는 경우도 있다([1], [2]).
도 3은 기존의 정합장 처리의 과정을 개략적으로 나타내고 있다. 음원으로부터 방사되어 센서 배열에 수신되는 음압 신호와 모델링 신호간의 상관 정도를 모든 추정 위치에 대해 계산한 뒤 그 상관관계 값이 가장 높은 위치를 음원 위치로 추정한다.
빔형성 방법은 크게 주파수 영역과 시간 영역에서의 빔형성 방법으로 나눈다. 주파수 영역 빔형성 방법은 특정 주파수 대역에서 큰 파워를 가지고 있는 음원의 위치 추정을 하는데 용이하나, 충격 신호와 같이 주파수가 광대역에 퍼져있는 경우에는 효과적으로 적용하기 어렵다. 반면, 시간 영역 빔형성 방법은 충격 신호와 같이 특정 시간대역에 에너지가 집중되어 있는 경우 용이하다. 대표적으로 지연-합 빔형성 방법(delay-and-sum beamforming method)을 사용해 평면파, 구면파 모델의 빔출력을 도출하는 알고리즘이 널리 알려져 있다. 이와 같이 빔형성 방법은 평면파 모델의 경우 스캔 함수(가중치 함수)가 음파의 입사 방향을 가리킬 때 주파수 영역에서는 빔파워가, 시간 영역에서는 빔출력이 최대이고, 그 때의 방향을 음파의 입사 방향으로 추정한다.
현재까지 진행된 빔형성 방법에 대한 연구를 크게 3가지 항목으로 분류하여 보면 다음과 같다.
첫 번째는 목적 함수를 가지고 그에 맞는 스캔 함수(가중치 함수)를 도출하여 빔패턴을 설계하는 방법에 관한 연구이다. 먼저, Dolph가 좁은 주엽(mainlobe)을 얻고, 각 부엽의 크기(sidelobe)를 같게 하여 신호 대 잡음비를 획득할 수 있도록 하는 Dolph-Chebeshev법을 제안하였다[17]. Chou는 4개의 옥타브 배열(octave-array)을 nested 배열(nested array)로 배치하여 주파수에 상관없이 동일한 주엽의 폭(Constant Directivity Beamformers, CDB)을 만드는 방법을 제안하였다[8]. Taylor, Cox 등은 원하는 방향에 대해서는 최대의 이득을 얻고, 그 외의 방향에서는 최소의 평균 이득을 가지도록 하는 슈퍼 지향성(super directivity)과 관련된 연구를 진행하였다[9], [39]. 그리고 Monzingo와 Miller는 특정 방향을 널(null)로 만들고, 원하는 방향을 최대로 만드는 최적해를 도출하는 방법을 연구하였다[30]. J. Capon 등은 센서 배열에 수신되는 음압 신호와 센서 배열과 특정 지점간의 전달 함수 사이의 빔파워를 최대로 하는 제한 조건(constraint)을 두고, 이를 만족하는 가중치를 구하는 방법을 제안하였다[6].
두 번째로는 주어진 마이크로폰 개수 및 배열이 있을 때, 이를 이용하여 실제보다 더 많은 마이크로폰을 사용하는 것과 같은 효과를 얻기 위한 연구이다. A. Cigada 등은 선형, 나선형, 오각형 마이크로폰 배열을 사용하여 이들을 회전시켜 공간상에 실제보다 더 많은 수의 센서가 있는 것과 같은 효과를 얻을 수 있도록 하는 연구를 진행하였다[14]. Doblinger는 마이크로폰 배열의 마이크로폰 개수가 정해져 있을 때 실제보다 마이크로폰이 더 많이 존재하는 것처럼 내삽법(interpolation)을 사용하여 빔파워 성능을 개선하는 연구를 하였다[15]. Stephen Orlando 등은 MEMS 마이크로폰 배열의 배치 및 보정(calibration) 방법과 이 배열을 사용한 음원의 위치 추정하는 방법을 연구하였다[32].
세 번째는 음압 신호와 스캔 함수(가중치 함수)를 사용하여 음파의 입사 방향 혹은 음원의 위치를 추정하는 방법에 관한 연구이다. Dirk Dobler 등은 마이크로폰 배열의 각 마이크로폰과 특정 위치간의 시간 지연을 각각 보상하여 그 위치에서 수신되는 음압 신호만을 제거하는 방법을 연구하였다[16]. Sasaki 등은 마이크로폰 배열이 가지는 빔패턴을 이용하여 특정 빔패턴의 주엽을 제거해 나가는 방식으로 음원의 위치를 추정하는 방법을 연구하였다[34].
이와 같이 제한 조건을 이용해 목적에 맞는 빔패턴을 얻고, 이를 이용하여 음파의 입사 방향 혹은 음원의 위치를 추정하는 것과 같이 다양한 빔형성 방법이 연구되어 왔고, 현재도 진행 중에 있다. 그러나 이는 한 후보 방향 혹은 한 후보 지점에 대해 빔파워를 구해 이들의 대소를 비교하는 방법이었다.
하지만, 기존에는 영역 관점에서 음파의 입사 방향을 추정하는 연구가 진행되지 않고 있다. 본 발명에서는 어떻게 영역 개념을 사용하여 음파의 입사 방향을 추정할 것인가 보이고, 그로부터 기존의 방법보다 어떤 장점을 갖는지를 밝히고자 한다.
그렇다면 기존에 진행된 연구 중 영역 개념을 사용한 연구가 어떤 것이 있는가 알아볼 필요가 있다. 영역 개념을 사용한 연구는 음향학적으로 밝은 공간과 어두운 공간을 제어하는 연구가 있다. 이 연구는 마이크로폰이 아닌 스피커와 관련되어 있지만, 음향학적 상반성을 생각해보면 본 발명을 진행하는 데에 이 내용이 고려될 필요가 있는 것을 알 수 있다.
음향학적으로 밝은 공간과 어두운 공간 제어 이론
최와 김이 제안한 음향학적으로 밝은 공간과 어두운 공간 제어 이론은 관심 공간상에 원하는 음장을 형성하기 위한 다수의 음원 제어 방법을 Rayleigh 몫(Rayleigh quotient)의 개념을 도입하여 제안하고, 그것이 이론적으로 가능함을 증명하고 있다([11], [12], [13]). 이 때, 관심 공간이라는 것은 제어하려는 공간을 의미하고, 관심 공간에 소리를 크게 들을 수 있는 공간과 그렇지 않은 공간을 동시에 형성하는 것을 가능하게 한다. 지금까지 수행된 발명를 통하여 1) 관심 공간에 음향 포텐셜 에너지 밀도를 최대로 하는 목적 함수, 2) 임의의 공간 상에 존재하는 두 공간간의 음향 포텐셜 에너지 밀도 비를 목적 함수로 정의하고 이를 제어하는 것이 가능하다는 것을 증명하고 이론적 근거를 정립하였다. 여기서 다른 공간보다 높은 음향 포텐셜 에너지 밀도를 가지는 공간을 음향학적으로 밝은 공간(acoustically bright zone), 다른 공간보다 낮은 음향 포텐셜 에너지 밀도를 가지는 공간을 음향학적으로 어두운 공간(acoustically dark zone)이라고 정의하고 있다. 위에 언급한 두 가지 목적 함수를 얻기 위해 최적화 문제로 정식화함으로써 다수의 음원에 입력되는 최적해를 이론적으로 제시하였다. 이외에도 개인 음향 공간 형성에 관한 발명([7], [26]), 다채널 스피커 시스템을 이용한 밝은 공간 형성에 관한 발명([27], [51], [52])도 정립된 이론을 응용한 예로써 진행되고 발표된 바 있다.
따라서, 본 발명에서는 음향학적 상반성(acoustical reciprocity)을 이용하여 위와 같은 이론을 다수의 스피커가 아닌 마이크로폰 배열에 적용시켜 최적해를 도출하고자 한다.
[1] Arthur B. Baggeroer, William A. Kuperman, and Henrik Schmidt. (1988). "Matched field processing: Source localization in correlated noise as an optimum pa-rameter estimation problem." J. Acoust. Soc. Am., 83(2), pp. 571∼587.
[2] Arthur B. Baggeroer, William A. Kuperman, and Peter N. Mikhalevsky. (1993). "An Overview of Matched Field Methods in Ocean Acoustics." IEEE Journal of Oceanic Engineering, 18(4), pp. 401∼424.
[3] Julius S. Bendat and Allan G. Piersol. (2000). Random data, John & Wiley Sons, pp. 357∼359.
[4] M. Brandstein and D. Ward et al. (2001). Microphone Arrays, Springer, Berlin, pp. 3∼17.
[5] H. P. Bucker (1976). "Use of calculated sound fields and matched-field detection to locate sound sources in shallow water." J. Acoust. Soc. Am., 59, pp. 363∼373.
[6] J. Capon. (1967). "Multidimensional maximum-likelihood processing of a large aperture seismic array." Proc. IEEE, Vol. 55, pp. 192∼211.
[7] Ji-Ho Chang, Chan-Hui Lee, Jin-Young Park, and Yang-Hann Kim. (2009). "A realization of sound focused personal audio system using acoustic contrast control." J. Acoust. Soc. Am., 125(4), pp. 2091∼2097.
[8] T. Chou. (1995). "Frequency-independent beamformer with low response error." Proc. IEEE Int. Conf. Acoust., Speech, Signal Processing (ICASSP-95), Detroit, USA, pp. 2995∼2998.
[9] H. Cox, R. Zeskind, and T. Kooij. (1986). "Practical supergain." IEEE Transac-tions on Acoustics, Speech and Signal Processing, ASSP-34, pp. 393∼397.
[10] Jae-Woong Choi. (2000). "Review on beamforming method and its application on vehicle noise identification." First workshop on vehicle noise visualization and identification.
[11] J.-W. Choi. (2001). "A study on the generation of acoustically bright zone", M.S. Thesis, Korea Advanced Institute of Science and Technology, Daejeon, Repub-lic of Korea.
[12] J.-W. Choi, Y.-H. Kim. (2002). "Generation of an acoustically bright zone with an illuminated region using multiple sources." J. Acoust. Soc. Am., 111(4), pp. 1695∼1700.
[13] J.-W. Choi. (2005). "Spatial Manipulation and Implementation of Sound", Ph.D. Dissertation, Korea Advanced Institute of Science and Technology, Daejeon, Repub-lic of Korea.
[14] Alfredo Cigada, Massimiliano Lurati, Francesco Ripamonti, and Marcello Vana-li. (2008). "Moving microphone arrays to reduce spatial aliasing in the beamforming technique: Theoretical background and numerical investigation." J. Acoust. Soc. Am., 124(6), pp. 3648∼3658.
[15] Gerhard Doblinger. (2008). "Beamforming with optimized interpolated micro-phone arrays." Proc. IEEE HSCMA 2008, pp. 33∼36.
[16] Dirk Dobler, Ralf Schroder, and Gunnar Heilmann. (2010). "Successive deletion of main sources in acoustic maps working in the time domain." Proceedings of Inter Noise 2010, Lisbon, Portugal.
[17] C. L. Dolph. (1946). "A Current Distribution for Broadside Arrays Which Op-timizes the Relationship between Beam Width and Side-lobe Level." Proc. IRE, vol. 34, pp. 335∼348.
[18] W. E. Feddersen et al. (1957). "Localization of High-Frequency Tones." J Acoust. Soc. Am, 29(9), pp. 988∼991.
[19] Gene H. Golub and Charles F. Van Loan. (1996). Matrix computations, The Johns Hopkins University Press, pp. 391∼413.
[20] Edward T. Hall. 정태진 역. (1980). 沈默의 言語, 探求堂, 서울, pp. 215∼245.
[21] Hyun Jo, Youngjin Park, and Youn-sik Park. (2010). "A sound telescope: a con-trol of zone of interest." Proceedings of International Congress on Acoustics 2010, Sydney, Australia.
[22] Don H. Johnson and Dan E. Dudgeon. (1993). Array Signal Processing: Con-cepts and techniques, Prentice Hall, pp. 77∼110.
[23] K.-H. Kim. (2010). "Noise source localization using comparison between candi-date signal and beamformer output in time domain", M.S. Thesis, Korea Advanced Institute of Science and Technology, Daejeon, Republic of Korea.
[24] Yang-Hann Kim. (2010). Sound propagation: An Impedance Based Approach, John & Wiley Sons, Singapore, pp. 188∼196.
[25] Erwin Kreyzig. (1999). Advanced engineering mathematics, John Wiley & Sons, Chapter 4.
[26] C.-H. Lee. (2008). "A practical realization of personal audio system by applying acoustic contrast control with loudspeaker array", M.S. Thesis, Korea Advanced In-stitute of Science and Technology, Daejeon, Republic of Korea.
[27] Jung-Min Lee, Tae-Woong Lee, Jin-young Park, and Yang-Hann Kim. (2010). "Generation of a private listening zone; acoustic parasol." Proceedings of Interna-tional Congress on Acoustics 2010, Sydney, Australia.
[28] Iain McCowan. (2010). "Microphone array tutorial". Retrieved June 16, 2011, from Web site: http://www.idiap.ch/~mccowan/arrays/arrays/tutorial.html
[29] Leonard Meirovitch. (1997). Principles and Techniques of Vibrations, Prentice Hall, pp. 171∼183.
[30] R. A. Monzingo and T. W. Miller. (2004). Introduction to Adaptive Arrays, John & Wiley Sons, pp.89∼101.
[31] Thomas J. Mueller. (2002). Aeroacoustic measurements, Springer-Verlag: Ber-lin, pp.114∼128.
[32] Stephen Orlando, Adam Bale, and David Johnson. (2010). "Design and prelimi-nary testing of a MEMS microphone phased array." Berlin Beamforming Conference, Berlin, Germany.
[33] Shahid U. H. Qureshi. (1985). "Adaptive Equalization." Proceedings of the IEEE, 73(9), pp. 1349∼1361.
[34] Yoko Sasaki, Satoshi Kagami, and Hiroshi Mizoguchi. (2007). "Main-lobe canceling method for multiple sound sources localization on mobile robot." Ad-vanced intelligent mechatronics 2007 IEEE/ASME international conference, Zurich, Swiss.
[35] D.-H. Seo. (2010). "Impulsive sound source localization using delay and sum beamforming method in time domain., M.S. Thesis, Korea Advanced Institute of Science and Technology, Daejeon, Republic of Korea.
[36] K.-C. Shin and J.S. Kim. (2005). "Matched field processing with contrast max-imization." J. Acoust. Soc. Am., 118(3), pp. 1526∼1533.
[37] Merrill I. Skolnik. (1970). Radar Handbook, McGraw-Hill, NewYork, pp. 9-7∼9-9.
[38] Warren L. Stutzman and Gary A. Thiele. 윤영중 외 5인 역. (2000). 안테나 이론과 설계, 교보문고, 서울, pp. 17∼82.
[39] R. Taylor and G. Dailey. (1992). "The super-directional acoustic sensor." in Proceedings of OCEANS’92 Mastering the Oceans through Technology, vol. 35, pp. 1365∼1376.
[40] Alexandra Tolstoy. (1993). Matched Field Processing for Underwater Acous-tics, World Scientific, Singapore, pp. 1∼47.
[41] Alexandra Tolstoy. (2000). "Applications of matched-field processing to inverse problems in underwater acoustics." Inverse Problems, 16, pp. 1655∼1666.
[42] Lloyd N. Trefethen and David Bau, III. (1997). Numerical linear algebra, So-ciety for Industrial and Applied Mathematics, Philadelphia, pp. 190∼240.
[43] Harry L. van Trees. (2002). Optimum Array Processing, John Wiley & Sons, Inc., NewYork, pp. 1∼89.
[44] B. D. VanVeen and K. M. Buckley. (1988). "Beamforming: A versatile ap-proach to spatial filtering." IEEE Trans. Acoust., Speech, Signal Process., 5, pp. 4∼24.
[45] 김문언. (2005). 기계공학에서의 응용수학 I. 선형대수, 한국과학기술원 기계공학과, 대전, 제6장.
[46] 김승일, 양정석. (2007). Array Signal Processing, 토파민, 서울, 2장.
[47] 김신성, 성대선. (2010), KBS 한국어능력시험, 시대고시, 서울.
[48] 김양한, 최영철, 김시문, 남경욱. (2001). "빔형성 방법을 이용한 캐비테이션 터널 내의 소음원 규명." 한국과학기술원 소음진동 발명센터.
[49] 김양한, 서대훈, 박춘수, 전종훈. (2009). "외부 음향 정보 탐지/분석 기술 발명 단계 발명 결과 보고서." 한국과학기술원 소음진동 발명센터.
[50] 손권, 최윤호, 김철 공역. (2008). 응용 수치해석, McGraw-Hill Korea, 서울, pp. 142∼149.
[51] 이태웅, 장지호, 이정민, 강동수, 김양한. (2009). "음장 제어 실험을 위한 32채널 스피커 시스템 구성." 한국소음진동공학회 2009년도 추계학술대회 논문집, pp. 868∼869.
[52] 장지호, 송민호, 박진영, 김양한. (2009). "32채널 스피커 시스템을 이용한 소리공 형성." 한국소음진동공학회 2009년도 추계학술대회 논문집, pp. 866∼867.
[53] 정보통신 용어집. (2010), Retrieved June 16, 2011, from Web site: http://word.tta.or.kr/index.jsp
[54] 한국교육과정평가원. (2010). "2011년도 대학수학능력시험 언어영역 듣기평가." 한국교육과정평가원, 서울.
전술한 문제점을 해결하기 위하여 본 발명이 이루고자 하는 기술적 과제는, 영역 관점에서 음파가 입사하는 방향의 범위를 추정하는 영역 개념을 이용한 음파 입사 방향 추정 방법을 제시하는 데 있다.
또한, 본 발명이 이루고자 하는 다른 기술적 과제는, 음파가 입사하는 방향의 범위를 추정하여 기존의 방법에 비해 연산량을 줄일 수 있는 영역 개념을 이용한 음파 입사 방향 추정 방법을 제시하는 데 있다.
또한, 본 발명이 이루고자 하는 또 다른 기술적 과제는, 사용자가 정의하는 전체 추정 공간을 영역으로 나누어 각 영역을 대표하는 모델을 얻고, 그 모델과 수신된 음압 신호와의 상관관계를 비교하는 과정을 반복 수행하는 방법을 통하여 기존의 방법보다 연산량을 줄이고, 음파의 입사 방향 혹은 음원이 존재하는 위치의 범위를 추정하는 영역 개념을 이용한 음파 입사 방향 추정 방법을 제시하는 데 있다.
또한, 본 발명이 이루고자 하는 또 다른 기술적 과제는, 관심 영역 내의 공간 평균 빔파워를 최대로 하는 가중치를 구하는 음향 밝기 최대화 방법과, 관심 영역과 비 관심 영역간의 공간 평균 빔파워 비를 최대화하는 가중치를 구하는 음향 대조 최대화 방법을 이용하여 영역 관점에서 공간 평균 빔파워를 산출하는 영역 개념을 이용하여 음파가 입사하는 방향을 추정하는 영역 개념을 이용한 음파 입사 방향 추정 방법을 제시하는 데 있다.
본 발명의 해결과제는 이상에서 언급된 것들에 한정되지 않으며, 언급되지 아니한 다른 해결과제들은 아래의 기재로부터 당업자에게 명확하게 이해되어 질 수 있을 것이다.
전술한 기술적 과제를 해결하기 위한 수단으로서, 본 발명에 의한 영역 개념을 이용한 음파 입사 방향 추정 방법은, (a) 복수의 마이크로폰을 배열하는 단계, (b) 상기 복수의 마이크로폰 배열에 임의의 방향으로부터 적어도 하나 이상의 음압 신호가 입사되는 단계, (c) 상기 음압 신호의 입사 방향을 추정하기 위하여, 음파의 입사 방향이 존재할 것이라고 추정되는 전체 영역을 적어도 두 영역 이상으로 등분하여 각 영역에서의 음압 신호, 가중치, 공간 평균 빔파워, 각각의 상대적인 크기를 비교하여 그 중 큰 값의 영역 내에 음파의 입사 방향이 존재한다고 추정하는 단계, (d) 상기 음파의 입사 방향이 존재한다고 추정된 영역을 다시 적어도 두 영역 이상으로 등분하여 각 영역에서의 음압 신호, 가중치, 공간 평균 빔파워, 각각의 상대적인 크기를 비교하여 그 중 큰 값의 영역 내에 음파의 입사 방향이 존재한다고 추정하는 단계 및, (e) 상기 (d) 단계의 상기 큰 값의 영역이 소정 범위 이하가 될 때까지 상기 (d) 단계를 반복 수행하여 상기 소정 범위 이하가 된 영역을 음파가 입사하는 방향의 범위로 추정하는 단계를 포함하여 구성될 수 있다.
상기 가중치는 각 마이크로폰에 수신되는 음압 신호간의 시간 지연 및 음압 신호의 크기를 동시에 조절하는 값이 되고, 상기 가중치는, 인접 마이크로폰 사이의 간격(), 마이크로폰의 총 개수(), 영역의 범위(), 대표 방향(), 주파수()와 관련이 있을 수 있다.
상기 공간 평균 빔파워는 등분된 영역에서 마이크로폰에 수신되는 음압 신호의 세기가 되고, 상기 음압 신호의 방위각(), 대표 방향(), 음압 신호 벡터(), 가중치()와 관련이 있을 수 있다.
상기 (e)단계에서 상기 소정 범위는, 지연-합 빔형성 방법으로부터 구하는 소정의 밴드 폭으로 상기 빔파워가 최대인 방향으로부터 빔파워가 절반인 방향까지의 범위일 수 있다.
상기 음파 입사 방향 추정 방법은, 상기 음파의 입사 방향이 존재한다고 추정된 관심 영역과 그 외의 비 관심 영역으로 구분되고, 상기 관심 영역 내의 공간 평균 빔파워를 최대로 하는 가중치를 구하는 음향 밝기 최대화 방법과, 상기 관심 영역과 비 관심 영역간의 공간 평균 빔파워 비를 최대화하는 가중치를 구하는 음향 대조 최대화 방법을 이용하여 영역 관점에서 공간 평균 빔파워를 산출할 수 있다.
상기 가중치 벡터는 상기 관심 영역이 한 방향인 경우 상기 음향 밝기 최대화 방법에서 구해지고, 평면파 모델의 지연-합 빔형성 방법의 가중치 벡터와 같고, 상기 음향 대조 최대화 방법에서는 주파수와 인접 마이크로폰 사이의 간격에 따라 음향 밝기 최대화 방법과 같은 해를 가질 수 있다.
상기 공간 평균 빔파워는 상기 관심 영역이 전체 영역인 경우 가중치 벡터로부터 구해지고, 주파수와 인접 마이크로폰 사이의 간격에 따라 바뀔 수 있다.
상기 복수의 마이크로폰 배열에 음파가 입사될 때 관심 주파수 대역 내에서 평면파로 간주하도록 상기 마이크로폰 배열과 음원 간의 거리, 상기 마이크로폰 배열의 총 길이 및 인접 마이크로폰 사이의 간격을 결정할 수 있다.
상기 복수의 마이크로폰 배열은, 선형 등간격, 비선형 등간격, 원형, 십자형을 포함한 배열 방법 중 어느 하나로 배열할 수 있다.
상기 음파 입사 방향 추정 방법은, 상기 (c) 및 (d)단계에서 두 영역 이상으로 나눈 영역을 오버랩(overlap)해서 추정할 수 있다.
상기 적어도 하나 이상의 음압 신호는, 단일 주파수 또는 사람의 음성, 음악을 포함한 특정 주파수 대역을 가지는 음원을 사용할 수 있다.
상기 음파 입사 방향 추정 방법은, 다수의 사람이 대화를 하고 있는 상황에서 상기 (a) 내지 (e)단계를 통해 음파가 입사하는 방향의 범위를 추정하여 특정 사람들간의 대화만을 선별하여 들을 수 있다.
상기 음파 입사 방향 추정 방법은, 음악회 또는 연주회에서 상기 (a) 내지 (e)단계를 통해 음파가 입사하는 방향의 범위를 추정하여 무대의 중앙에 위치한 솔로의 노래만을 선별하여 들을 수 있다.
상기 음파 입사 방향 추정 방법은, 상기 (a) 내지 (e)단계를 통해 음파가 입사하는 방향의 범위를 추정하여 공간 상에 어떤 방향에서 어떤 소리가 전파되고 있는지를 알 수 있다.
본 발명에 따르면, 영역 관점에서 음파가 입사하는 방향의 범위를 추정함으로써 기존의 방법에 비해 연산량을 크게 줄일 수 있다.
또한, 사용자가 정의하는 전체 추정 공간을 영역으로 나누어 각 영역을 대표하는 모델을 얻고, 그 모델과 수신된 음압 신호와의 상관관계를 비교하는 과정을 반복 수행하는 방법을 통하여 기존의 방법보다 연산량을 줄일 수 있고, 음파의 입사 방향 혹은 음원이 존재하는 위치의 범위를 추정할 수 있다.
본 발명의 효과는 이상에서 언급된 것들에 한정되지 않으며, 언급되지 아니한 다른 효과들은 아래의 기재로부터 당업자에게 명확하게 이해되어 질 수 있을 것이다.
도 1은 기존의 지연-합 빔형성 방법에 대한 개념도
도 2는 기존의 지연-합 빔형성 방법으로 음파의 입사 방향을 추정하는 방법에 대한 개념도
도 3은 기존의 정합장처리(MFP, Matched Field Processing)에서의 신호처리 과정을 나타낸 도면
도 4는 직교 좌표(Cartesian coordinate)와 구면 좌표(spherical coordinate)사이의 관계를 나타내는 도면
도 5는 마이크로 배열 및 영역에 대한 도면
도 6은 지연-합 빔형성 방법과 본 발명에서 가중치가 가지는 의미를 나타낸 도면
도 7은 마이크로폰 배열의 길이가 일때 평면파 음원의 입사 방향을 나타낸 도면
도 8은 m개의 마이크로폰으로 평면파의 입사 방향을 나타낸 도면
도 9는 방향에서 음파가 전파하는 경우의 빔파워 분포를 나타낸 도면
도 10은 저주파수, 고주파수에서의 주엽 폭(빔폭)에 대한 개념도
도 11은 관심 영역 및 비관심 영역과 각 변수들에 대해 나타낸 도면
도 12는 마이크로폰이 2개, 관심 영역이 전체 영역인 경우 에 따라 구해지는 고유치를 나타낸 그래프
도 13은 마이크로폰이 3개, 관심 영역이 전체 영역인 경우에 구해지는 고유치를 나타낸 그래프
도 14는 이분법(bisection method)에 대한 개념도
도 15는 전체 영역에 대해 영역을 어떻게 표현하는 지를 나타내는 도면
도 16은 지연-합 빔형성 방법의 각도 분해능이 제안 방법의 영역의 범위와 같을 때 연산량 비교를 나타낸 도면
도 17은 지연-합 빔형성 방법과 제안 방법의 연산량을 나타낸 것으로, (a) 지연-합 빔형성 방법의 연산량, (b) 제안 방법의 첫 번째 수행에서 빔파워를 계산하는 횟수, (c) 제안 방법의 두 번째 수행에서 빔파워를 계산하는 횟수를 나타낸 도면
도 18은 영역을 사용하여 음파의 입사 방향을 추정하는 방법의 순서도
도 19는 영역을 사용하여 음파의 입사 방향을 추정하는 방법의 흐름도
도 20은 영역을 이용한 음파의 입사 방향 범위 추정의 각 수행단계를 나타낸 것으로. (a) 1번째 수행, (b) 2번째 수행, (c) 3번째 수행, (d) 4번째 수행, (e) 5번째 수행, (f) 6번째 수행, (g) 7번째 수행 단계를 나타낸 도면
도 21은 마이크로폰 배열로부터 구해지는 각 수행 단계에서의 빔패턴을 나타낸 것으로, (a) 1번째 수행 (b) 2번째 수행 (c) 3번째 수행 (d) 4번째 수행 (e) 5번째 수행 (f) 6번째 수행 (g) 7번째 수행 (h) 7번째 수행의 한 부분을 확대한 도면
도 22는 관심 영역이 일 때 음향 밝기 최대화 방법으로 구해지는 빔패턴을 나타낸 도면
도 23은 관심 영역이 일 때 음향 밝기 최대화 방법으로 구해지는 빔패턴을 나타낸 도면
도 24는 마이크로폰 사이 간격이 일정하지 않은 선형 마이크로폰 배열의 한 예를 나타낸 도면
도 25는 마이크로폰의 개수가 2개, 일때, (a) 음향 밝기 최대화 방법에서의 가중치 벡터, (b) 음향 대조 최대화 방법에서의 가중치 벡터를 나타낸 도면
도 26은 마이크로폰의 개수가 2개, 일때, (a) 음향 밝기 최대화 방법에서의 가중치 벡터, (b) 음향 대조 최대화 방법에서의 가중치 벡터, (c) 각 방법으로부터 얻어지는 빔파워로, 최대값으로 정규화한 도면
도 27은 마이크로폰의 개수가 2개, 일때 음향 밝기 최대화 방법에서 구해지는 빔파워 형태와 고유치를 나타낸 것으로, (a) 음향 밝기를 최대로 하는 고유치를 선정할 때 나타나는 빔파워의 형태로, 최대값으로 정규화, (b) 음향 밝기를 하나의 고유치만으로 선정할 때 나타나는 빔파워의 형태로, 최대값으로 정규화한 도면
도 28은 마이크로폰의 개수가 2개, 일때 음향 밝기 최대화 방법에서 구해지는 빔파워 형태와 고유치를 나타낸 것으로, (a) 음향 밝기를 최대로 하는 고유치를 선정할 때 나타나는 빔파워의 형태로, 최대값으로 정규화, (b) 음향 밝기를 하나의 고유치만으로 선정할 때 나타나는 빔파워의 형태로, 최대값으로 정규화한 도면
도 29는 마이크로폰의 개수가 3개, 일때 각 방법에서 구해지는 가중치 벡터로, (a) 음향 밝기 최대화 방법에서의 가중치 벡터, (b) 음향 대조 최대화 방법에서의 가중치 벡터, (c) 각 방법으로부터 얻어지는 빔파워로, 최대값으로 정규화한 도면
도 30은 관심 영역이 변함에 따라 나타나는 가중치 벡터의 가운데와 양 끝간의 차이를 나타낸 도면
도 31은 마이크로폰의 개수가 9개, , 일때, 각 방법에서 구해지는 가중치 벡터로, (a) 음향 밝기 최대화 방법에서의 가중치 벡터, (b) 음향 대조 최대화 방법에서의 가중치 벡터, (c) 각 방법으로부터 얻어지는 빔파워로, 최대값으로 정규화한 도면
도 32는 마이크로폰의 개수가 9개, , 일때 각 방법에서 구해지는 가중치 벡터로, (a) 관심 영역이 넓어질 때 음향 밝기를 최대로 하는 고유치를 선정할 때 나타나는 빔파워, (b) 일 때 나타나는 각 방법에서의 빔파워로, 최대값으로 정규화한 도면
도 33은 마이크로폰의 개수가 2개, , 일 때 각 방법에서 구해지는 가중치 벡터로서, (a) 음향 밝기 최대화 방법에서의 가중치 벡터, (b) 음향 대조 최대화 방법에서의 가중치 벡터, (c) 각 방법으로부터 얻어지는 빔파워로, 최대값으로 정규화한 도면
도 34는 마이크로폰의 개수가 3개, , 일 때 각 방법에서 구해지는 가중치 벡터로, (a) 음향 밝기 최대화 방법에서의 가중치 벡터, (b) 음향 대조 최대화 방법에서의 가중치 벡터, (c) 각 방법으로부터 얻어지는 빔파워로, 최대값으로 정규화한 도면
도 34는 마이크로폰의 개수가 9개, 일때 각 방법에서 구해지는 가중치 벡터로, (a) 음향 밝기 최대화 방법에서의 가중치 벡터, (b) 음향 대조 최대화 방법에서의 가중치 벡터, (c) 각 방법으로부터 얻어지는 빔파워로, 최대값으로 정규화한 도면
도 36은 실험 장치의 구성도
도 37은 무향실 외부에 설치된 실험 장치의 사진
도 38은 무향실 내부에 설치된 스피커와 마이크로폰 배열을 나타낸 사진
도 39는 마이크로폰 배열을 나타낸 사진
도 40은 선정한 변수들을 나타낸 도면
도 41은 지연-합 빔형성 방법을 이용하여 구한 빔파워 분포로서, 주파수 , 마이크로폰 개수 7개, 각 마이크로폰 사이 간격 , 음파의 입사 추정 방향 을 나타낸 도면
도 42는 영역을 이용한 음파의 입사 방향 범위 추정의 각 수행단계로서, (a) 1번째 수행 , (b) 2번째 수행 , (c) 3번째 수행 , (d) 4번째 수행 , (e) 5번째 수행 , (f) 6번째 수행 , (g) 7번째 수행 이고, 주파수 , 마이크로폰 개수 7개, 각 마이크로폰 사이 간격 , 음파가 입사하는 방향의 추정 범위를 나타낸 도면
도 43은 딸의 신호를 나타낸 것으로, (a) 스팩트로그램, (b) 시간 영역 신호를 나타낸 도면
도 44는 아버지의 신호를 나타낸 것으로, (a) 스팩트로그램, (b) 시간 영역 신호를 나타낸 도면
도 45는 남자 아나운서의 신호를 나타낸 것으로, (a) 스팩트로그램, (b) 시간 영역 신호를 나타낸 도면
도 46은 할아버지의 신호를 나타낸 것으로, (a) 스팩트로그램, (b) 시간 영역 신호를 나타낸 도면
도 47은 손자의 신호를 나타낸 것으로, (a) 스팩트로그램, (b) 시간 영역 신호를 나타낸 도면
도 48은 각 음원의 분포 위치를 나타낸 도면
도 49는 2000 Hz 에서의 각 방법이 가지는 가중치 벡터를 나타낸 도면
도 50은 2000 Hz에서의 각 방법에서 구해지는 빔파워를 나타낸 도면
도 51은 2500 Hz 에서의 각 방법이 가지는 가중치 벡터를 나타낸 도면
도 52는 2500 Hz에서의 각 방법에서 구해지는 빔파워를 나타낸 도면
도 53은 3000 Hz 에서의 각 방법이 가지는 가중치 벡터를 나타낸 도면
도 54는 3000 Hz에서의 각 방법에서 구해지는 빔파워를 나타낸 도면
도 55는 2000 Hz 에서의 각 방법이 가지는 가중치 벡터를 나타낸 도면
도 56은 2000 Hz에서의 각 방법에서 구해지는 빔파워를 나타낸 도면
도 57은 2500 Hz 에서의 각 방법이 가지는 가중치 벡터를 나타낸 도면
도 58은 2500 Hz에서의 각 방법에서 구해지는 빔파워를 나타낸 도면
도 59는 3000 Hz 에서의 각 방법이 가지는 가중치 벡터를 나타낸 도면
도 60은 3000 Hz에서의 각 방법에서 구해지는 빔파워를 나타낸 도면
도 61은 관심 주파수 대역만을 가지고 있는 신호(마이크로폰 배열의 중앙에 위치한 마이크로폰으로부터의 신호)를 나타낸 도면
도 62는 관심 영역이 인 경우의 각 방법을 적용한 시간 영역 신호(아버지와 딸의 대화)를 나타낸 도면
도 63은 관심 영역이 인 경우의 각 방법을 적용한 시간 영역 신호(남자 아나운서의 뉴스 대본)을 나타낸 도면
도 64는 관심 영역이 인 경우의 각 방법을 적용한 시간 영역 신호(할아버지와 손자의 대화)를 나타낸 도면
도 65는 분해능 지표를 나타낸 것으로, 는 3dB 밴드 폭, 은 최대 부엽 레벨, 는 최대 빔파워를 나타낸 도면
도 66은 실험시 스피커(source)와 마이크로폰 배열(ULA) 사이의 간격 , 마이크로폰 배열의 총 길이 를 나타낸 도면
도 67은 주파수가 일 때 마이크로폰 배열의 중앙과 양 끝에 위치한 마이크로폰 사이의 위상차를 나타낸 도면
도 68은 (a) 첫 번째 수행에서 가중치를 구하는 횟수, (b) 두 번째 수행에서 가중치를 구하는 횟수 각 수행 단계에서 가중치를 구하는 횟수를 나타낸 도면
도 69는 일 때 지연-합 빔형성 방법으로 얻는 빔파워 분포로, 마이크로폰의 개수 7개, 마이크로폰 간격 5cm, 주파수 일 경우를 나타낸 도면
도 70은 일 때 제안 방법을 반복 수행하여 얻는 음파가 입사하는 방향의 범위를 추정한 것으로, (a) 1회 수행, (b) 2회 수행, (c) 3회 수행, (d) 4회 수행 결과를 나타낸 도면
도 71은 일 때 지연-합 빔형성 방법으로 얻는 빔파워 분포로, 마이크로폰의 개수 7개, 마이크로폰 간격 5 cm, 주파수 1000 Hz일 경우의 도면
도 72는 일 때 제안 방법을 반복 수행하여 얻은 음파가 입사하는 방향의 범위 추정으로, (a) 1회 수행, (b)는 2회 수행, (c)는 3회 수행, (d)는 4회 수행 결과를 나타낸 도면
도 73은 두 개 이상의 방향에서 음파가 입사하는 경우 제안 방법의 추정 과정에 관한 순서도
도 74는 영역에서 각 수행 과정에서 추정하는 음파가 입사하는 방향의 범위로, (a) 1회 수행, (b) 2회 수행 결과를 나타낸 도면
도 75는 영역에서 각 수행 과정에서 추정하는 음파가 입사하는 방향의 범위로, (a) 1회 수행, (b) 2회 수행 결과를 나타낸 도면
도 2는 기존의 지연-합 빔형성 방법으로 음파의 입사 방향을 추정하는 방법에 대한 개념도
도 3은 기존의 정합장처리(MFP, Matched Field Processing)에서의 신호처리 과정을 나타낸 도면
도 4는 직교 좌표(Cartesian coordinate)와 구면 좌표(spherical coordinate)사이의 관계를 나타내는 도면
도 5는 마이크로 배열 및 영역에 대한 도면
도 6은 지연-합 빔형성 방법과 본 발명에서 가중치가 가지는 의미를 나타낸 도면
도 7은 마이크로폰 배열의 길이가 일때 평면파 음원의 입사 방향을 나타낸 도면
도 8은 m개의 마이크로폰으로 평면파의 입사 방향을 나타낸 도면
도 9는 방향에서 음파가 전파하는 경우의 빔파워 분포를 나타낸 도면
도 10은 저주파수, 고주파수에서의 주엽 폭(빔폭)에 대한 개념도
도 11은 관심 영역 및 비관심 영역과 각 변수들에 대해 나타낸 도면
도 12는 마이크로폰이 2개, 관심 영역이 전체 영역인 경우 에 따라 구해지는 고유치를 나타낸 그래프
도 13은 마이크로폰이 3개, 관심 영역이 전체 영역인 경우에 구해지는 고유치를 나타낸 그래프
도 14는 이분법(bisection method)에 대한 개념도
도 15는 전체 영역에 대해 영역을 어떻게 표현하는 지를 나타내는 도면
도 16은 지연-합 빔형성 방법의 각도 분해능이 제안 방법의 영역의 범위와 같을 때 연산량 비교를 나타낸 도면
도 17은 지연-합 빔형성 방법과 제안 방법의 연산량을 나타낸 것으로, (a) 지연-합 빔형성 방법의 연산량, (b) 제안 방법의 첫 번째 수행에서 빔파워를 계산하는 횟수, (c) 제안 방법의 두 번째 수행에서 빔파워를 계산하는 횟수를 나타낸 도면
도 18은 영역을 사용하여 음파의 입사 방향을 추정하는 방법의 순서도
도 19는 영역을 사용하여 음파의 입사 방향을 추정하는 방법의 흐름도
도 20은 영역을 이용한 음파의 입사 방향 범위 추정의 각 수행단계를 나타낸 것으로. (a) 1번째 수행, (b) 2번째 수행, (c) 3번째 수행, (d) 4번째 수행, (e) 5번째 수행, (f) 6번째 수행, (g) 7번째 수행 단계를 나타낸 도면
도 21은 마이크로폰 배열로부터 구해지는 각 수행 단계에서의 빔패턴을 나타낸 것으로, (a) 1번째 수행 (b) 2번째 수행 (c) 3번째 수행 (d) 4번째 수행 (e) 5번째 수행 (f) 6번째 수행 (g) 7번째 수행 (h) 7번째 수행의 한 부분을 확대한 도면
도 22는 관심 영역이 일 때 음향 밝기 최대화 방법으로 구해지는 빔패턴을 나타낸 도면
도 23은 관심 영역이 일 때 음향 밝기 최대화 방법으로 구해지는 빔패턴을 나타낸 도면
도 24는 마이크로폰 사이 간격이 일정하지 않은 선형 마이크로폰 배열의 한 예를 나타낸 도면
도 25는 마이크로폰의 개수가 2개, 일때, (a) 음향 밝기 최대화 방법에서의 가중치 벡터, (b) 음향 대조 최대화 방법에서의 가중치 벡터를 나타낸 도면
도 26은 마이크로폰의 개수가 2개, 일때, (a) 음향 밝기 최대화 방법에서의 가중치 벡터, (b) 음향 대조 최대화 방법에서의 가중치 벡터, (c) 각 방법으로부터 얻어지는 빔파워로, 최대값으로 정규화한 도면
도 27은 마이크로폰의 개수가 2개, 일때 음향 밝기 최대화 방법에서 구해지는 빔파워 형태와 고유치를 나타낸 것으로, (a) 음향 밝기를 최대로 하는 고유치를 선정할 때 나타나는 빔파워의 형태로, 최대값으로 정규화, (b) 음향 밝기를 하나의 고유치만으로 선정할 때 나타나는 빔파워의 형태로, 최대값으로 정규화한 도면
도 28은 마이크로폰의 개수가 2개, 일때 음향 밝기 최대화 방법에서 구해지는 빔파워 형태와 고유치를 나타낸 것으로, (a) 음향 밝기를 최대로 하는 고유치를 선정할 때 나타나는 빔파워의 형태로, 최대값으로 정규화, (b) 음향 밝기를 하나의 고유치만으로 선정할 때 나타나는 빔파워의 형태로, 최대값으로 정규화한 도면
도 29는 마이크로폰의 개수가 3개, 일때 각 방법에서 구해지는 가중치 벡터로, (a) 음향 밝기 최대화 방법에서의 가중치 벡터, (b) 음향 대조 최대화 방법에서의 가중치 벡터, (c) 각 방법으로부터 얻어지는 빔파워로, 최대값으로 정규화한 도면
도 30은 관심 영역이 변함에 따라 나타나는 가중치 벡터의 가운데와 양 끝간의 차이를 나타낸 도면
도 31은 마이크로폰의 개수가 9개, , 일때, 각 방법에서 구해지는 가중치 벡터로, (a) 음향 밝기 최대화 방법에서의 가중치 벡터, (b) 음향 대조 최대화 방법에서의 가중치 벡터, (c) 각 방법으로부터 얻어지는 빔파워로, 최대값으로 정규화한 도면
도 32는 마이크로폰의 개수가 9개, , 일때 각 방법에서 구해지는 가중치 벡터로, (a) 관심 영역이 넓어질 때 음향 밝기를 최대로 하는 고유치를 선정할 때 나타나는 빔파워, (b) 일 때 나타나는 각 방법에서의 빔파워로, 최대값으로 정규화한 도면
도 33은 마이크로폰의 개수가 2개, , 일 때 각 방법에서 구해지는 가중치 벡터로서, (a) 음향 밝기 최대화 방법에서의 가중치 벡터, (b) 음향 대조 최대화 방법에서의 가중치 벡터, (c) 각 방법으로부터 얻어지는 빔파워로, 최대값으로 정규화한 도면
도 34는 마이크로폰의 개수가 3개, , 일 때 각 방법에서 구해지는 가중치 벡터로, (a) 음향 밝기 최대화 방법에서의 가중치 벡터, (b) 음향 대조 최대화 방법에서의 가중치 벡터, (c) 각 방법으로부터 얻어지는 빔파워로, 최대값으로 정규화한 도면
도 34는 마이크로폰의 개수가 9개, 일때 각 방법에서 구해지는 가중치 벡터로, (a) 음향 밝기 최대화 방법에서의 가중치 벡터, (b) 음향 대조 최대화 방법에서의 가중치 벡터, (c) 각 방법으로부터 얻어지는 빔파워로, 최대값으로 정규화한 도면
도 36은 실험 장치의 구성도
도 37은 무향실 외부에 설치된 실험 장치의 사진
도 38은 무향실 내부에 설치된 스피커와 마이크로폰 배열을 나타낸 사진
도 39는 마이크로폰 배열을 나타낸 사진
도 40은 선정한 변수들을 나타낸 도면
도 41은 지연-합 빔형성 방법을 이용하여 구한 빔파워 분포로서, 주파수 , 마이크로폰 개수 7개, 각 마이크로폰 사이 간격 , 음파의 입사 추정 방향 을 나타낸 도면
도 42는 영역을 이용한 음파의 입사 방향 범위 추정의 각 수행단계로서, (a) 1번째 수행 , (b) 2번째 수행 , (c) 3번째 수행 , (d) 4번째 수행 , (e) 5번째 수행 , (f) 6번째 수행 , (g) 7번째 수행 이고, 주파수 , 마이크로폰 개수 7개, 각 마이크로폰 사이 간격 , 음파가 입사하는 방향의 추정 범위를 나타낸 도면
도 43은 딸의 신호를 나타낸 것으로, (a) 스팩트로그램, (b) 시간 영역 신호를 나타낸 도면
도 44는 아버지의 신호를 나타낸 것으로, (a) 스팩트로그램, (b) 시간 영역 신호를 나타낸 도면
도 45는 남자 아나운서의 신호를 나타낸 것으로, (a) 스팩트로그램, (b) 시간 영역 신호를 나타낸 도면
도 46은 할아버지의 신호를 나타낸 것으로, (a) 스팩트로그램, (b) 시간 영역 신호를 나타낸 도면
도 47은 손자의 신호를 나타낸 것으로, (a) 스팩트로그램, (b) 시간 영역 신호를 나타낸 도면
도 48은 각 음원의 분포 위치를 나타낸 도면
도 49는 2000 Hz 에서의 각 방법이 가지는 가중치 벡터를 나타낸 도면
도 50은 2000 Hz에서의 각 방법에서 구해지는 빔파워를 나타낸 도면
도 51은 2500 Hz 에서의 각 방법이 가지는 가중치 벡터를 나타낸 도면
도 52는 2500 Hz에서의 각 방법에서 구해지는 빔파워를 나타낸 도면
도 53은 3000 Hz 에서의 각 방법이 가지는 가중치 벡터를 나타낸 도면
도 54는 3000 Hz에서의 각 방법에서 구해지는 빔파워를 나타낸 도면
도 55는 2000 Hz 에서의 각 방법이 가지는 가중치 벡터를 나타낸 도면
도 56은 2000 Hz에서의 각 방법에서 구해지는 빔파워를 나타낸 도면
도 57은 2500 Hz 에서의 각 방법이 가지는 가중치 벡터를 나타낸 도면
도 58은 2500 Hz에서의 각 방법에서 구해지는 빔파워를 나타낸 도면
도 59는 3000 Hz 에서의 각 방법이 가지는 가중치 벡터를 나타낸 도면
도 60은 3000 Hz에서의 각 방법에서 구해지는 빔파워를 나타낸 도면
도 61은 관심 주파수 대역만을 가지고 있는 신호(마이크로폰 배열의 중앙에 위치한 마이크로폰으로부터의 신호)를 나타낸 도면
도 62는 관심 영역이 인 경우의 각 방법을 적용한 시간 영역 신호(아버지와 딸의 대화)를 나타낸 도면
도 63은 관심 영역이 인 경우의 각 방법을 적용한 시간 영역 신호(남자 아나운서의 뉴스 대본)을 나타낸 도면
도 64는 관심 영역이 인 경우의 각 방법을 적용한 시간 영역 신호(할아버지와 손자의 대화)를 나타낸 도면
도 65는 분해능 지표를 나타낸 것으로, 는 3dB 밴드 폭, 은 최대 부엽 레벨, 는 최대 빔파워를 나타낸 도면
도 66은 실험시 스피커(source)와 마이크로폰 배열(ULA) 사이의 간격 , 마이크로폰 배열의 총 길이 를 나타낸 도면
도 67은 주파수가 일 때 마이크로폰 배열의 중앙과 양 끝에 위치한 마이크로폰 사이의 위상차를 나타낸 도면
도 68은 (a) 첫 번째 수행에서 가중치를 구하는 횟수, (b) 두 번째 수행에서 가중치를 구하는 횟수 각 수행 단계에서 가중치를 구하는 횟수를 나타낸 도면
도 69는 일 때 지연-합 빔형성 방법으로 얻는 빔파워 분포로, 마이크로폰의 개수 7개, 마이크로폰 간격 5cm, 주파수 일 경우를 나타낸 도면
도 70은 일 때 제안 방법을 반복 수행하여 얻는 음파가 입사하는 방향의 범위를 추정한 것으로, (a) 1회 수행, (b) 2회 수행, (c) 3회 수행, (d) 4회 수행 결과를 나타낸 도면
도 71은 일 때 지연-합 빔형성 방법으로 얻는 빔파워 분포로, 마이크로폰의 개수 7개, 마이크로폰 간격 5 cm, 주파수 1000 Hz일 경우의 도면
도 72는 일 때 제안 방법을 반복 수행하여 얻은 음파가 입사하는 방향의 범위 추정으로, (a) 1회 수행, (b)는 2회 수행, (c)는 3회 수행, (d)는 4회 수행 결과를 나타낸 도면
도 73은 두 개 이상의 방향에서 음파가 입사하는 경우 제안 방법의 추정 과정에 관한 순서도
도 74는 영역에서 각 수행 과정에서 추정하는 음파가 입사하는 방향의 범위로, (a) 1회 수행, (b) 2회 수행 결과를 나타낸 도면
도 75는 영역에서 각 수행 과정에서 추정하는 음파가 입사하는 방향의 범위로, (a) 1회 수행, (b) 2회 수행 결과를 나타낸 도면
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시 예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명되는 실시 예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙여 설명하기로 한다.
이하, 본 발명에서 실시하고자 하는 구체적인 기술내용에 대해 첨부도면을 참조하여 상세하게 설명하기로 한다.
우선, 본 발명에서 다루는 조건에 대해 먼저 정의하기로 한다. 여기서 조건들이란 1) 좌표(coordinate), 2) 마이크로폰 배열(array configuration), 3) 영역(region), 4) 파면의 종류, 5) 가중치(weighting), 그리고 6) 고려하는 도메인(domain)을 포함할 수 있다.
먼저, 좌표를 정의하고 이를 통해 마이크로폰의 위치를 수식적으로 표현하여야 하는 것은 자명하다. 도 4는 직교 좌표(Cartesian coordinate)와 구면 좌표(spherical coordinate)사이의 관계를 나타내는 도면이다[43]. 즉, 3차원 공간의 좌표간 변환을 나타내는 것으로 직교 좌표에서의 x,y 그리고 z는 다음과 같이 표현된다.
이 중 본 발명에서는 인 경우인 xy 평면 내에서 마이크로폰 배열에 입사하는 음압 신호를 다루고자 한다. 이 경우를 해석적으로, 물리적으로 고찰하는 것을 기본으로 하여 인 경우로 확장하기로 한다. 이 xy 평면 상에 존재할 수 있는 마이크로폰 배열은 무수히 많을 것이나 이 중 가장 기본적인 경우인 선형 등간격 마이크로폰 배열(ULA, Uniform Linear Array)만을 이 발명에서 다루고자 한다.(도 3 참조) 선형 등간격 마이크로폰 배열의 총 길이 L은 인접 마이크로폰 사이의 간격 d와 마이크로폰의 총 개수 M을 통해 의 관계를 만족한다.
이 때, x축을 주축으로 하여 를 정의하고, 음파가 마이크로폰 배열에 입사하는 경우 입사 각도는 항으로 표현할 수 있다. 구체적인 사항은 뒤에서 자세하게 다루고 있다. 코사인(cosine)의 주기적인 특성에 따라 와 에서의 마이크로폰 배열의 각 마이크로폰에 수신되는 각 음압 신호의 절대적인 크기와 파형이 같다. 따라서 을 전체 영역으로 고려하기로 한다.
본 발명에서는 영역(region)이라는 개념을 도입하는데, 이것은 관심 영역과 비 관심 영역으로 구분하기로 한다. 이 때, 관심영역이란 음파의 입사 방향을 추정하고자 하는 범위를 의미하고, 비 관심 영역이란 그 외의 범위를 의미한다. 여기서 관심 영역은 로 표시하기로 한다. 하지만 어떤 방향을 기준으로 범위를 가지는 지에 따라 표현이 달라지므로 대표 방향을 설정할 필요가 있다. 그러므로 대표 방향(beam axis)을 라는 기호로 표시하기로 한다. 그렇다면 관심 영역은 대표 방향 를 중심으로 의 범위를 갖는 각도의 범위 로 표시할 수 있다. 비 관심 영역은 이 외의 범위로 표시한다.
만약, 마이크로폰 배열의 중앙에 위치하는 마이크로폰으로부터 음원이 충분히 멀리 떨어져 있다면, 음원으로부터 방사되는 음파는 마이크로폰 배열에 수신될 때 파면이 평면을 이룬다. 본 발명에서는 파면이 평면인 경우를 다루는데 이는 마이크로폰 배열에 수신되는 음압 신호를 해석적으로 고찰할 수 있다는 이점이 있기 때문이다. (Appendix B 참조)
이제 가중치(weighting)와 어떤 영역(domain)에 대해 고려할지 생각해 볼 필요가 있다. 먼저, 지연-합 빔형성 방법(delay and sum beamforming method)에서는 각 마이크로폰 간의 시간 지연만을 조절하여 신호 처리를 하는데 이 때의 시간 지연을 가중치로 볼 수 있다. 본 발명에서 가중치는 각 마이크로폰에 수신되는 음압 신호간의 시간 지연 및 음압 신호의 크기를 동시에 조절하는 값으로 정의한다.(도 4 참조)
그렇다면 이 가중치가 무엇에 관한 함수인지를 생각해 보아야 하는데, 위에서 언급한 1) 인접 마이크로폰 사이의 간격 d, 2) 마이크로폰의 총 개수 M, 3) 영역의 범위 , 4) 대표 방향 , 그리고 5) 주파수 로 총 5 개의 독립 변수에 관한 것임을 생각할 수 있다. 그러므로 고려하는 주파수(혹은 파장)에 따라 가중치가 다른 값을 가질 것을 예상할 수 있으므로, 가중치를 구하기 위해서는 주파수 영역(frequency domain)에서 접근하는 것이 용이하다고 할 수 있다. 그리고 영역을 어떻게 정하는가에 따라서도 가중치가 다른 값을 가지므로 공간 영역(spatial domain)에서 접근할 필요가 있다. 즉, 주파수 영역과 공간 영역에서 가중치를 고찰하는 것이 필요하다.
1. 빔형성 방법
본 장에서는 주파수 영역에서의 지연-합 빔형성 방법을 소개하고 평면파 모델을 통해 빔형성 방법 및 사용하는 물리량이 가지는 물리적인 의미를 살펴보기로 한다. 다음으로 한 방향이 아닌 영역에 대한 것으로 그 적용 범위를 넓혀, 두 가지 제안 방법으로 가중치를 선정하는 내용을 다루고, 두 가지 방법에서 도출할 수 있는 각 가중치들을 단순한 경우에 대해 고찰하기로 한다. 이를 토대로 각 제안 방법으로부터 얻는 가중치를 사용하여 영역 관점에서 음파가 입사하는 방향을 어떻게 추정하는지 설명하고, 지연-합 빔형성 방법과의 비교를 통해 영역 관점으로 음파의 입사 방향 범위를 추정하는 것이 어떤 다른 점이 있는지를 고찰하기로 한다.
1.1 배경 발명
빔형성 방법(beamforming method)은 센서 배열(array sensor)을 사용하는 대표적인 신호처리 방법으로 수중음향, 지진파, 안테나, 그리고 레이더 등의 분야에서 평면파 모델을 기본으로 개발되어 왔다(예를 들면, [1], [44]). 아래의 내용은 평면파 모델을 사용하여 음파의 입사 방향을 추정하는 방법에 대한 설명이다.
도 7은 마이크로폰 배열의 길이가 일때 평면파 음원의 입사 방향을 나타낸 것이다. 여기서, 은 마이크로폰 배열의 길이, x는 마이크로폰 배열의 중심으로부터 임의의 거리만큼 떨어진 위치, 는 평면파 음원의 입사 방향, 는 주파수 에서의 각주파수, 는 음원의 크기, 는 음원의 신호를 나타낸다.
도 7과 같이, 자유 음장에서 단일 주파수 를 가지는 평면파가 전파되어 총 마이크로폰 배열의 길이가 이고 마이크로폰 개수가 무한개인 연속적인 마이크로폰 배열에 입사되는 경우를 생각해 보기로 한다. 임의의 방향 에서 전파되는 음압 신호가 임의의 시간 지연 를 가지고 마이크로폰 배열의 중심 에 입사되는 경우, 이는
과 같이 나타낼 수 있다. 이 때 마이크로폰 배열의 중심 에서 임의의 거리 만큼 떨어진 위치에서 수신되는 음압 신호는 마이크로폰의 위치 에 따라 평면파가 도달하는 데까지 걸리는 시간이 다르므로 임의의 시간 지연 를 가진다. 이를
단,
와 같이 표현할 수 있다. 단일 주파수에 대하여 고려하고 있으므로 이후로는 를 편의상 로 표현하기로 한다. 또, 파수(wavenumber) 와 각주파수 , 그리고 음파 속도 간의 관계를 이용해 수학식 7을
이제 음파의 입사 방향을 추정할 수 있는 신호를 모델링할 필요가 있다. 이를 위해 음파가 임의의 방향 로부터 입사한다고 가정하여 만들어내는 신호를 스캔 함수(가중치 함수)라고 하고, 이것이 수신되는 음압 신호 에 영향을 주지 않도록 신호 파워가 단위 입력이어야 한다. 따라서, 임의의 방향 로부터 입사되는 평면파 신호를 표현하는 가중치 함수 는
음파의 입사 방향을 추정하기 위해서 수학식 9와 수학식 10 사이의 상관관계를 계산하는데 이는 각 식의 지수함수 부분이 얼만큼 일치하는지 보는 것으로, 수학적으로는 두 식을 곱하여 절대값 제곱을 계산한다. 이를 빔파워(혹은 빔형성파워, beampower, BP)라고 하고, 두 함수의 위상(시간지연)을 나타내는 지수함수 부분이 일치하는 에서 최대이다. 다시 말해 두 식의 내적이 최대가 되는 경우이고 이 때 두 식이 같다고 할 수 있다.
음파가 어떤 방향에서 입사하는지 알 수 없으므로 빔파워와 관련되는 변수는 실제 음파의 입사 방향 와 가중치 함수가 스캔하는 방향 에 대한 함수로 나타낸다. 빔파워 를 계산하기 위해 가중치 함수 와 음압신호 를 구간 에 대해 적분하면
임을 알 수 있다. 여기서, 위첨자 *는 켤레(conjugate)를 나타낸다. 수학식 11은 마이크로폰 배열의 길이가 인 구간에 대해 연속적인 음압 신호를 알고 있을 때의 빔파워이다.
수학식 11을 통해 다음과 같은 해석을 시도할 수 있다. 빔파워는 음파가 입사하는 방향과 가중치 함수가 스캔하는 방향이 일치하는 곳에서 최대인 것을 알 수 있다. 따라서 이 방향으로부터의 신호를 다른 방향에 비해서 상대적으로 크게 수신한다고 할 수 있다. 즉, 상대적으로 크게 수신한다는 것을 다음과 같은 수식으로 표현할 수 있다.
하지만 실제의 경우 마이크로폰 배열의 길이 및 마이크로폰 개수에 물리적인 제한이 있으므로 도 8과 같이 공간상에 개의 마이크로폰을 이용해 각 마이크로폰 사이 간격을 로 하여 배열한다면 총 의 음압 신호를 받는다. 도 8에서 는 인접 마이크로폰 사이의 간격, 는 평면파의 입사 방향, 은 m번째 마이크로폰을 나타낸다.
연속적인 경우에 대해 고려한 수학식 9와 수학식 10은 아래와 같이 이산화 형태로 나타난다.
여기서, 는 실제 음파에 의하여 형성되는 음장 중 번째 마이크로폰에 수신되는 음압 신호를, 는 가상의 음파에 의해 형성되는 음장 중 번째 마이크로폰 위치에서의 음압 신호를 나타내고 있다.
이 경우의 빔파워는
도 9는 방향에서 음파가 전파되는 경우에 나타나는 평면파 모델 지연-합 빔형성 방법으로 구하는 빔파워 분포의 한 예다. 여기서, 주파수 는 , 입사 방향은 , 마이크로폰의 개수 은 10개, 마이크로폰의 간격 는 이다.
도 9를 참조하면, 방향에서 빔파워가 가장 크므로 여기서 음파가 입사한다고 추정할 수 있다. 또, 방향에서 마이크로폰 배열에 수신되는 음압 신호를 다른 방향의 그것보다 상대적으로 크게 수신하는 것을 보여주고 있다.
빔패턴(beam pattern)
평면파 모델의 지연-합 빔형성 방법으로 음파의 입사 방향을 추정할 때 무한개의 공간 정보를 얻을 수 없으므로 빔파워의 분포는 도 10에서처럼 일정 범위의 폭을 가진다. 어떤 독립 변수들과 관련이 있는지를 다음과 같이 알아볼 수 있다.
와 같이 나타나고, 이를 다음과 같이 쓸 수 있다.
이 식을 통해서 빔패턴은 마이크로폰의 개수 , 인접 마이크로폰 사이의 간격 , 그리고 입사하는 음파의 파장 와 관련이 있음을 알 수 있다. 또, 사인(sine)의 주기성으로부터 빔파워에 다수의 엽(lobe)이 존재하는 것을 알 수 있다. 여기서, 지향하는 방향(음파가 입사하는 방향)을 포함하고 있는 엽을 주엽(mainlobe), 그 외의 엽들을 부엽(sidelobe)이라고 한다. 주엽의 폭은 수학식 19이 처음으로 0이 되는 각도로 분자의 사인(sine)항의 값이 0일 때이다. 즉, 주엽의 폭을 라고 한다면
로 표현된다. 마이크로폰의 개수 , 인접 마이크로폰 사이의 간격 등이 동일한 조건에서도 저주파수일수록 주엽의 폭 는 더 넓어진다. 도 10에는 동일한 마이크로폰 배열에서 저주파수가 될수록 주엽의 폭이 넓어지고, 고주파수가 될수록 주엽의 폭이 좁아지는 것을 나타내고 있다.
1.2 영역 관점 빔형성 방법
1.2.1 음향 밝기 최대화 방법(acoustical brightness maximization method)
로 나타낼 수 있다. 도 9에서와 같은 공간 상에서 관심 영역을 대표 방향 를 중심으로 영역 만큼의 범위로 하자. 지연-합 빔형성 방법에서는 가중치 를 평면파 모델로 표현할 수 있다. 하지만 영역 개념을 이용할 경우 이 가중치 로 표현하기에는 어려움이 있다. 그렇다면 영역 개념을 이용할 때에 가중치 는 무엇에 관련된 함수인지 먼저 생각해 보자. 음압 신호 벡터 는 수학식 13과 동일하게 표현되나, 가중치 벡터 는 1) , 2) , 3) , 그리고 4) 와 관련이 있다.
이를 이용하여 본 발명에서는 영역 개념으로 음파의 입사 방향을 추정하고자 하므로, 다음과 같이 관심 영역 내에서의 빔파워를 표현하는 방법을 생각해 보기로 한다. 즉 빔파워를 관심 영역에 대해서 적분하는 것이다. 이것이 의미하는 것은 관심 영역 내에 얼만큼의 빔파워가 있는가로, 이 값이 크면 지연-합 빔형성 방법의 개념과 같이 그 영역 내에 음파가 입사하는 방향이 존재할 것이라고 생각할 수 있다. 관심 영역 에서의 빔파워는 영역에 대해 적분한 값이라는 의미로 공간 평균 빔파워(spatial averaged beampower, )라는 용어로 정의하여 사용하기로 한다. 이 값은
과 같이 표현할 수 있다. 방향에 존재하는 평면파 음파가 마이크로폰 배열에 입사할 때 번째, 번째 마이크로폰과 어떤 관계에 있는지 나타내고 있다. 즉, 공간상에서 이 세 값들이 어떤 상관관계인가 나타내는 행렬로, 이후에는 공간 상관행렬 로 표기한다. 이를 적용하여 관심 영역에서의 공간 평균 빔파워를 나타내면
와 같이 쓸 수 있다.
그렇다면 관심 영역에서의 공간 평균 빔파워를 최대로 하는 가중치를 어떻게 선정할지 생각해보자. 가중치의 절대적인 크기보다 각 마이크로폰에 적용되는 가중치간의 비율이 중요하므로 가중치 벡터의 노옴(norm)을 제한 조건으로 한다. 이 때 관심 영역에서의 공간 평균 빔파워를 최대로 하는 가중치 벡터를 구하는 문제는 다음과 같은 최적화 문제로 정의될 수 있다.
이는 라그랑지 승수(Lagrange multiplier) 를 도입하여 제한 조건이 없는 문제로 바꿀 수 있으므로 다음과 같이 문제를 정식화 할 수 있다. .
수학식 27을
로 계산하면 수학식 27은
와 같이 쓸 수 있고, 이 값의 최대값은 공간 상관행렬 의 최대 고유치 가 된다([29], [45]). 즉, 음향 밝기 를 최대로 하는 최적의 가중치 벡터 는 의 고유 벡터가 됨을 알 수 있다.
관심 영역이 한 방향이 되는 경우
이를 수학식 29와 30에 대입하면,
가 된다. 즉, 음압 신호 벡터 는 관심 영역이 한 방향일 때의 음향 밝기 를 최대로 만드는 고유 벡터임을 알 수 있다. 이 경우에는 평면파 모델의 지연-합 빔형성 방법과 같은 해를 가진다.
관심 영역이 전체 영역이 되는 경우
마이크로폰이 개인 경우에는 가 차 정사각행렬로, 수학식 29는 차 고유치 문제다. 차 행렬의 일반해는 해석적으로 구할 수 없으므로, 물리적 의미를 알기 어렵다. 그래서 여기서는 그 경향을 간단한 경우인 마이크로폰 2개, 3개를 통해 해석적으로 접근한다.
1) 마이크로폰이 2개인 경우
수학식 36으로부터 에 따라 고유치 의 대소 관계가 바뀌는 것을 알 수 있다. 도 12는 수학식 36의 두 고유치를 그래프로 나타낸 것이다. 즉, 일 때 을 기준으로 두 고유치의 대소가 바뀌고 구하는 가중치 벡터(고유 벡터)가 바뀌는 것을 알 수 있다.
2) 마이크로폰의 개수가 3개인 경우
이 때에도 세 고유치 간의 대소 관계는 에 따라 바뀐다. (도 13 참조) 목적 함수로부터 얻는 고유치 및 고유 벡터가 각각 음향 밝기 와 가중치 벡터 가 되는데, 에 따라 이 값이 좌우되는 것을 알 수 있다. 또 다른 특징으로는 마이크로폰의 개수가 늘어남에 따라, 즉 마이크로폰 배열의 길이가 늘어남에 따라서 고유치 간의 대소가 바뀌는 지점이 더 일찍 나타나는 것을 알 수 있다. 이는 마이크로폰의 개수 이 늘어남에 따라 한 임의의 고유치 에 0차 1종 베셀 함수가 에서 까지 표현되고, 이 값을 계산하여보면 의 개수가 늘어날수록 교차하는 지점이 더 일찍 생기기 때문이라고 생각할 수 있다.
1.2.2 음향 대조 최대화 방법(acoustical contrast maximization method)
앞 절에서 음향 밝기 최대화 방법을 이용하여 목적 함수를 만족하는 최적의 가중치 벡터를 도출하는 방법을 제안하였다. 이 때는 관심 영역에서의 공간 평균 빔파워를 최대로 하는 데에만 목적이 있으므로 비 관심 영역에서의 공간 평균 빔파워에 대한 고려를 하지 않고 있다. 여기에서는 관심 영역에서의 공간 평균 빔파워를 최대로 하면서, 관심 영역 외에서의 공간 평균 빔파워를 최소로 하는 데에 목적을 둔다.
도 11에 나타낸 비 관심 영역에서의 공간 평균 빔파워를 구하면
로 표현할 수 있다. 여기서 는 비 관심 영역에서의 공간 상관행렬로 차 행렬이고, 는 비 관심 영역을 나타낸다. 이 때 두 영역에서의 공간 평균 빔파워의 비를 라는 음향 대조(contrast)로 정의하여 이를 최대로 만들 수 있는 목적 함수를 다음과 같이 제안한다.
이 때 레일레이 몫의 최대값은
의 일반화된 고유치 문제의 최대 고유치와 동일하다([29], [30], [45]).
음향 대조 는 두 영역 간의 공간 평균 빔파워의 비로써 정의되므로 각각을 , 로 풀어서 그 값을 본다면, 음향 대조 의 거동을 알 수 있다. 즉, 관심 영역의 공간 평균 빔파워를 크게 하며 최적화를 이루는지, 비 관심 영역의 공간 평균 빔파워를 작게 하며 최적화를 이루는지 알 수 있을 것이다.
만약 각 마이크로폰에 수신되는 음압 신호간의 공간 상관 관계가 큰 차이를 보이지 않는다면 공간 상관 행렬 와 의 최소 고유치가 0에 가까운 값을 가질 것이다. 두 공간 상관 행렬에 표현되는 수식은 평면파 모델이므로 다음과 같은 경우에 최소 고유치가 0에 가까운 값을 가진다. 첫 번째로는 인접 마이크로폰 사이의 간격 가 매우 작은 경우, 두 번째로는 전파되는 음파의 파수가 작아지는 저주파수의 경우이다. 즉, 일 때이다.
관심 영역이 한 방향이 되는 경우
관심 영역은 대표 방향 이고, 비 관심 영역은 이다. 이 때 차 행렬의 고유치 문제를 푸는데, 이에 대한 차 일반해를 닫힌 형태로 구할 수 없으므로 간단한 경우인 마이크로폰이 2개인 경우를 통해 그 의미를 살펴보기로 한다.
로 표현된다.
수학식 43의 고유치 문제를 풀기 위해서는 수학식 45의 역행렬을 구하는데, 이 경우 행렬식(determinant)은 다음과 같이 계산된다.
과 같이 계산되고, 이는 음향 밝기 최대화 방법에서 관심 영역이 대표 방향 의 한 방향일 때 구해지는 가중치, 평면파 모델의 지연-합 빔형성 방법에서의 가중치와 같은 결과이다. 즉, 를 조절하면 음향 밝기 최대화 방법과 음향 대조 최대화 방법이 같은 최적해(가중치 벡터)를 가질 수 있음을 알 수 있다.
1.2.3 영역(region)을 이용한 음파의 입사 방향 추정
마이크로폰 배열에 입사하는 음압 신호 와 음향 밝기 최대화 방법과 음향 대조 최대화 방법으로부터 얻는 가중치 를 각각 내적하여 음파가 입사하는 방향의 범위를 추정하는 방법을 제안한다. 이를 위해 영역(region) 개념을 사용하여 전체 영역 를 두 부분으로 나누는 이분법의 개념을 적용하기로 한다(예를 들어, 참고문헌 [50]). 먼저 이분법의 어떤 개념을 적용할지 설명할 필요가 있다.
이분법(bisection method)
의 부호를 살핀다. 이 중 음의 부호를 가지는 영역 내에 해는 존재한다. 그러면 처음에는 구간이 이던 것이 혹은 로 절반이 되고, 이 과정을 반복하여 수행함으로써 구간 의 임의 수련 구간 내에 해가 존재한다고 추정하는 것이 이분법이다. (도 12 참조)
음파의 입사 방향 추정
그렇다면 이분법을 음파의 입사 방향 추정에 어떻게 적용시킬지 다음과 같이 생각해보자. 이는 다음과 같은 흐름으로 해결할 수 있다. 도 15와 같이 전체 영역이 존재할 때 이를 두 영역으로 나눈다. 두 영역의 경계에 위치해 있는 각도를 각각 로 표시를 하면 전체 영역을 , 와 같이 두 영역으로 나눠 쓸 수 있다. 편의상 은 각각 왼쪽 영역(left re-gion)과 오른쪽 영역(right region)이라고 표시한다. 각 영역에서 공간 평균 빔파워의 크기를 최대로 만드는 가중치 는 1.2절, 1.3절에서 제안하는 방법으로 구할 수 있다. 도출되는 가중치의 값이 다를 뿐, 음파의 입사 방향을 추정하는 방법에는 차이가 없으므로, 2.2절의 음향 밝기 최대화 방법으로부터 구해지는 가중치로 설명한다. 각 영역에서 구하는 가중치를 각각 으로 쓰면, 이는 각각 의 열 벡터 형태로 나타난다. 각 가중치의 아래 첨자 는 음향 밝기인 brightness, 그리고 과 은 각각 왼쪽 영역과 오른쪽 영역을 의미한다. 임의의 방향 로부터 마이크로폰 배열에 수신되는 음압 신호 는 수학식 13에서와 같이 표현되므로, 각각의 가중치와 내적을 하여 각 영역에서의 공간 평균 빔파워를 다음과 같이 계산할 수 있다.
각 영역에서 구해지는 빔파워 값은 두 열 벡터의 내적이므로 스칼라 값이다. 지연-합 빔형성 방법에서 빔파워가 최대가 되는 방향이 마이크로폰 배열에 음파가 입사하는 방향이라고 추정하는 것과 같은 개념으로, 각 영역에서 구한 공간 평균 빔파워의 크기를 비교하여 그 중 큰 값의 영역 내에 음파의 입사 방향이 존재한다고 추정할 수 있다.
첫 번째, 로 왼쪽 영역의 빔파워 값이 오른쪽 영역의 그것보다 큰 경우이다. 이 때에는 왼쪽 영역인 에 음파의 입사 방향이 존재한다고 추정하게 되는데, 그렇다면 번째 수행에서 각 영역은 다음과 같이 바뀐다.
두 번째, 로 오른쪽 영역의 빔파워 값이 왼쪽 영역의 그것보다 큰 경우이다. 이 때에는 오른쪽 영역인 내부에 음파의 입사 방향이 존재한다고 추정하게 되고, 번째 수행에서 각 영역은 다음과 같다.
지연-합 빔형성 방법과 제안 방법의 연산량 비교
지연-합 빔형성 방법에서는 음파의 입사 방향을 한 방향으로 추정한다. 하지만, 본 발명에서는 음파가 입사하는 방향의 범위를 추정한다. 그렇다면 제안하는 방법이 지연-합 빔형성 방법에 비해 어떤 면에서 장점을 가지는지를 생각해 볼 필요가 있다. 직관적으로, 제안하는 방법의 경우 이분법으로 음파의 입사 방향을 추정하므로 연산량이 적을 것을 예상할 수 있다. 그렇다면 실제로 연산량이 얼마나 되는지를 수학적으로 살펴보기로 한다.
먼저 연산량을 어떻게 정의할지 생각해 보기로 한다. 음파의 입사 방향을 추정하는 데 필요한 정보는 음압 신호, 가중치, 그리고 이들의 내적으로 구해지는 공간 평균 빔파워 값이다. 음압 신호는 측정값이므로, 나머지 두 값을 구하는 데 계산이 필요하다. 이 중 가중치는 지연-합 빔형성 방법의 경우 각도 분해능 를 알면 항상 구할 수 있고, 제안 방법의 경우 영역과 마이크로폰 배열에 대한 정보(array configuration)가 있으면 항상 구할 수 있는 값이다.(Appendix E. 참고) 즉, 사전에 구해둘 수 있는 값이다. 그러므로 공간 평균 빔파워를 계산하는 데 필요한 계산량을 본 발명에서는 연산량이라고 정의한다.
우선, 지연-합 빔형성 방법의 경우 전체 영역 를 사용자가 얼마만큼의 각도 분해능(angular resolution) 로 빔파워를 구하는가에 따라 연산량이 달라지는데 이는 다음과 같이 수학적으로 표현할 수 있다.
이 값은 각도 분해능 에 종속(dependent)인 것을 알 수 있다. 예를 들어, 각도 분해능이 인 경우를 생각해 보면 각 방향에서의 가중치 벡터(스캔 벡터)를 구하기 위해서는 총 181번의 연산이 필요하다.
이제 본 발명에서 제안하는 방법에서의 연산량을 살펴보기로 한다. 각 영역에서 공간 평균 빔파워를 구하고 이 값을 비교할 때 마다 영역이 하나씩 제외가 된다. 이 때에는 도 17의 (b), (c)와 같이 한 번 비교할 때마다 두 번씩만 계산하면 된다. 즉, 회 반복 수행 했을 때 공간 평균 빔파워를 계산하는 데 소요되는 연산량은 이다. 최종적으로 제안 방법의 총 연산량은
로 표현할 수 있다.
이 값이 지연-합 빔형성 방법의 총 연산량보다 적은 경우가 언제인지를 살펴보기로 한다. 즉,
이므로, 에 대해서는 이 수식이 성립한다. (단, 는 자연수) 그렇다면 제안 방법이 각 수행 단계에서 얼만큼의 영역을 가질 수 있는지 살펴보기로 한다. 각 수행 단계에서 영역은 그 전 단계에 비해 절반으로 항상 줄어들므로, 제안 방법에서의 영역은 다음과 같이 나타낼 수 있다.
위 식을 통해 영역은 반복 수행 횟수 와 관련이 있다는 것을 알 수 있다. 극한 경우(limit case) 일 때를 고찰해 보면, 수학식 62는 0에 가까운 값을 가지고, 음파가 입사하는 방향의 범위가 매우 좁아질 것을 알 수 있다.
그렇다면 지연-합 빔형성 방법에서의 각도 분해능 과 제안 방법의 영역 이 직접적으로 어떤 관계에 있고, 각도 분해능 와 영역 가 같은 경우에는 어떤 방법의 연산량이 더 적은지를 살펴보기로 한다.
만약 지연-합 빔형성 방법의 각도 분해능 이 인 경우 수학식 58로부터 연산량이 3회인 것을 알 수 있고, 영역 가 인 경우는 1번째 수행일 때로 연산량이 2회인 것을 알 수 있다. 그리고 이 절반이 되는 각도 분해능이 이고, 영역 가 인 경우에는 지연-합 빔형성 방법의 연산량은 5회, 제안 방법의 연산량은 4회이다. 이를 계속 비교해보면 제안 방법의 각 수행 단계에서 가지는 영역과 같은 각도 분해능일 때 지연-합 빔형성 방법의 연산량은 다음과 같은 등비수열을 이룬다.
그렇다면 수학식 59와 수학식 60을 비교해보면 제안 방법의 각 수행 단계에서 가지는 영역과 지연-합 빔형성 방법의 각도 분해능이 같을 때, 어떤 방법의 연산량이 큰가 알 수 있다.
수학식 64는 가 자연수일 때 언제나 성립하는 식이다. 즉, 제안 방법의 각 수행 단계에서의 영역과 지연-합 빔형성 방법의 각도 분해능이 같은 경우에는 언제나 제안 방법의 연산량이 더 적은 것을 알 수 있다. (도 16 참조) I
음파의 입사 방향에 대한 추정 범위 제안
제안하는 방법에서 음파가 입사하는 방향의 추정 범위를 어떻게 결정할지 생각해 보아야 한다. 이를 위해 지연-합 빔형성 방법의 3dB 밴드 폭(3-dB bandwidth 혹은 the Half-Power Bandwidth, HPBW, )을 기준으로 삼고자 한다. 이 값은 빔파워가 최대인 방향으로부터 빔파워가 절반인 방향까지의 범위를 나타내는 것으로, 이 범위 내에 음파의 입사 방향이 존재할 것이라고 해석할 수 있다. 이 값은 마이크로폰 배열의 정보(array configuration)를 알면 결정되는 값으로, 제안 방법은 이 값보다 좁은 범위를 가질 때로 그것을 추정 범위(BandWidth, BW)로 정하고, 반복 수행을 종료하고자 한다.
이를 수식으로 표현하면,
와 같이 쓸 수 있다.
간단한 경우에 대한 예시
본 발명에서 제안하는 방법이 음파의 입사 방향 범위를 어떻게 추정하는지 간단한 경우에 대한 예시를 통해 설명하기로 한다. 먼저 선형 마이크로폰 배열은 마이크로폰이 7개, 각 마이크로폰 사이의 간격은 0.005m인 경우를 생각한다. 이 배열에 대해서는 3장에서 그 이유를 설명한다. 이 마이크로폰 배열을 사용할 경우 3dB 밴드 폭은 약 이다. 여기서 음파의 입사 방향을 소수점 첫째 자리까지로 한 것은 입사 방향을 포함하는 일정한 범위를 가지는 영역을 추정하는 것을 보이기 위해서이다.
이 조건 아래에서 제안 방법을 반복 수행하면 다음과 같은 결과를 나타낸다. 도 20의 (a) 부터 (g)까지 1번째부터 7번째 수행하여 음파의 입사 방향 범위를 추정한 것이다. 이 예시의 경우에는 3번째 수행에서 영역의 추정 범위가 가 되고, 3dB 밴드 폭 내로 들어온다. 또, 제안 방법의 각도 분해능이 약 가 될 때인 인 경우까지 살펴보았다. 각 그래프에서 범위(Range)가 의미하는 것은 그 수행 단계에서 추정하고 있는 음파의 입사 방향의 범위이다. 도 18의 (a)에서는 1번째 수행 단계에서 추정하게 되는 음파의 입사 방향 범위가 라는 것을 나타내고 있다.
제안 방법의 한계점
제안 방법의 경우 주어진 마이크로폰 배열로부터 얻는 빔패턴에 의해 그 성능이 크게 좌우된다. 이에 대해 앞의 간단한 경우에 사용한 마이크로폰 배열로 구하는 각 수행 단계에서의 빔패턴을 관찰해 보기로 한다.
도 21을 통해 이 의미를 살펴보면 다음과 같다. 이 때는 영역을 로 하였을 때, 각각의 빔패턴이다. 실선은 오른쪽 영역에서의 공간 평균 빔파워를, 점선은 왼쪽 영역에서의 공간 평균 빔파워를 최대로 하는 가중치로 구해진 빔패턴이다. 공간 평균 빔파워가 큰 영역을 선택하므로, 도 21의 (a)의 경우 음파가 내에서 입사하는 경우 항상 오른쪽 영역으로, 내에서 입사하는 경우 항상 왼쪽 영역으로 추정 영역을 선택한다. 각 경우에 이 과정을 반복하나, 도 21의 (b)의 각 영역의 경계 부분인 약 , 범위에서처럼 각 영역의 대소 관계가 다른 부분이 발생하면 정확한 방향에 대한 추정이 어렵다. 하지만 이 범위의 각 방향에서 계속 추정을 할 경우 에서는 로 추정을, 에서는 로 추정을 한다. 약 의 추정 오차가 생기지만 이는 3dB 밴드 폭 보다 적은 값을 가지므로, 허용 가능한 범위라 생각할 수 있다. 이것은 제안 방법 자체가 가지는 문제이기 보다, 마이크로폰 배열과 관련된 한계점이라고 할 수 있다.
도 21의 (a)에서 (d)까지는 전체 영역 에서의 빔패턴을 나타내고 있으나, 등간격 마이크로폰 배열에서는 와 에서의 빔패턴이 에서 대칭을 이루고 있으므로, 도 21의 (e)에서 (h)에서는 만을 나타내고 있다. 도 21의 (h)는 도 19의 (g)를 좀 더 세부적으로 보기 위해 나타낸 그림이다.
또 다른 한계점은 도 22를 통해 설명하고자 한다. 도 22는 인 경우에 을 관심 영역으로 하는 빔패턴을 나타내고 있다. 그림에 표시되어 있는 방향인 의 경우에는 관심 영역 내 최대 빔파워에 비해 약 더 작은 값을 가진다. 그러므로 만약 이 방향으로부터 음파가 입사하는 경우에는 정확한 추정이 이루어지기 어렵다. 하지만 이것은 마이크로폰 배열의 형태에 따라 달라지는 값이므로, 만약 도 24와 같이 선형이지만 등간격이 아닌 형태의 마이크로폰 배열을 구성한다면, 또 다른 형태의 빔패턴을 가질 것이다. (도 23 참조)
지연-합 빔형성 방법과 제안 방법의 비교
지연-합 빔형성 방법과 제안 방법과의 비교 및 고찰을 통하여 두 방법간의 차이와 유사점은 어떤 것이 있는지를 알아보기로 한다. (표 1 참조)
먼저, 지연-합 빔형성 방법에서는 음파의 입사 방향을 추정하나, 제안하는 방법은 음파가 입사하는 방향의 범위를 추정한다. 그러므로 제안 방법은 지연-합 빔형성 방법에 비해 연산량이 적다는 장점이 있다. 즉, 보다 빠르게 음파가 입사하는 방향의 범위를 추정할 수 있다. 이 범위는 지연-합 빔형성 방법에서의 3dB 밴드 폭을 최소 기준으로 삼고 있다.
지연-합 빔형성 방법의 경우 각도 분해능 를 정하고, 그에 따라 가중치 및 빔파워를 계산하는 연산량도 변한다. 보다 정확히 방향을 추정하기 위해서는 연산량이 늘어날 것을 예상할 수 있다. 반면 제안 방법은 음파가 입사하는 방향의 범위를 추정하므로 분해능과는 무관하다. 대신, 영역을 어떻게 나누는가와 관련이 있다. 앞 절에서 설명한 예와 같이, 방향에서 음파가 마이크로폰 배열에 입사할 때 지연-합 빔형성 방법에서는 혹은 분해능이 큰 경우에는 에 가까운 방향으로 음파의 입사 방향을 추정한다. 하지만 제안 방법은 를 포함하는 어떤 범위로 음파가 입사하는 방향의 범위를 추정한다.
어떤 마이크로폰 배열을 사용하는가에 따라 빔패턴이 달라지므로, 음파의 입사 방향 추정이 제대로 이루어지지 않는 경우가 발생하지만, 이는 마이크로폰 배열을 바꿈으로 해결 가능하다. 그러므로 마이크로폰 배열에 따른 성능 변화를 고찰하는 연구가 더 진행될 필요가 있다.
지연-합 빔형성 방법과 제안 방법 간의 비교는 표 1과 같다.
2. 각 독립 변수들에 따른 가중치의 변화
2.1 독립 변수
본 장에서는 두 제안 방법(음향 밝기 최대화 방법, 음향 대조 최대화 방법)으로 구하는 가중치가 각 변수들이 바뀔 때에 어떻게 변하는 지를 살펴본다. 먼저 가중치와 관련된 독립 변수들은 다음과 같다.
여기에서 독립 변수 1)과 2)의 값들은 길이와 관련된 변수들이다. 본 발명에서는 주파수 영역에서 가중치를 구하므로, 각 주파수의 파장의 길이에 대해 마이크로폰 배열의 총 길이와 인접 마이크로폰 간의 간격에 따라 가중치가 어떻게 되는지 알아보는 것이 더 효과적이다. 그러므로 가중치와 관련된 독립 변수들을 주파수와의 관계로 다시 쓰면
과 같다.
각각의 독립 변수가 가중치에 어떤 영향을 주는지 살펴보기 위해서는 한 독립 변수를 변화시킬 때 다른 독립 변수를 고정시킬 필요가 있다. 그러므로 파라메트릭(parametric) 방법으로 각 독립 변수든의 영향을 살펴보고자 한다.
각 독립 변수든의 범위는 다음과 같이 생각할 수 있다.
공간 앨리어싱이 일어나지 않는 인접 마이크로폰 사이의 간격은 항상 아래 수학식 67을 만족해야 하므로,
의 범위가 된다[22]. 이 독립 변수에 대해서는 각 극한 경우를 살펴본다.
전파하는 음파의 파장 에 비해서 마이크로폰 배열의 총 길이 이 매우 작아 0에 가까운 경우, 그리고 파장의 절반이 되는 경우, 파장과 같아지는 경우, 파장에 비해 긴 경우에 대하여 살펴본다.
영역 인 한 방향에 대해서부터 관심 영역이 가 되는 경우까지 고찰한다. 그리고 이 때 대표 방향이 인 경우와 인 두 가지 경우에 대해 살펴본다. 의 경우는 대표 방향이 일 때부터 까지 변하는 것을 의미한다.
즉, 관심 영역은 한 방향에서부터 전체 영역에 대하여 가중치 및 빔파워의 변화를 관찰한다.
이 경우에는 마이크로폰이 2개가 있더라도 마치 마이크로폰이 1개인 것처럼 거동하며, 관심 영역이 변함에도 가중치의 크기와 위상은 거의 동일하다. 도 25에는 각 방법의 목적함수로부터 구해지는 가중치 벡터를 나타내고 있고, 여기서 영역의 범위 은 각각 일 때이다. 이 때에는 두 공간 상관행렬 와 의 모든 성분이 1에 가까워진다. 음향 대조 방법의 목적함수로부터 가중치 벡터를 구할 때 를 하게 되는데, 마이크로폰의 개수가 증가할 때를 생각해 보자. 를 하기 위해 구해지는 행렬식(determinant)이 점점 더 0에 가까워지기 때문에 마이크로폰의 개수가 증가하면 가중치 벡터를 구하기 어려울 것을 예상할 수 있다.
음향 밝기 최대화 방법의 경우 관심 영역이 한 방향일 때 평면파 모델의 지연-합 빔형성 방법의 가중치와 같다라는 것을 1장에서 밝혔다. 그렇다면 음향 밝기 최대화 방법을 사용해 얻는 빔파워의 최소 주엽의 폭을 빔패턴으로부터 예상할 수 있다. 이 경우에는 최소 주엽의 폭이 수학식 19로부터 임을 알 수 있다.
도 26에는 각각의 가중치 벡터와 빔파워 분포를 보여주고 있다. 영역의 범위 는 각각 를 나타낸다. 이 때 음향 밝기 최대화 방법에서 구하는 빔파워는 영역의 범위가 넓어짐에 따라 불연속한 지점이 생긴다. 그 이유는 음향 밝기(brightness)를 통해서 설명할 수 있다. 음향 밝기 최대화 방법에서는 음향 밝기를 최대화 하는데, 이 음향 밝기는 공간 상관행렬 가 가지는 최대 고유치이다. 영역의 범위가 넓어짐에 따라 의 고유치의 대소가 바뀌는 경우가 발생하고, 이 때부터 그 전과는 다른 고유 벡터를 가중치 벡터로 선정하기 때문에 빔파워가 다른 형태를 띈다.
만약, 한 고유치만을 계속 선정한다면 관심 영역이 넓어짐에따라 빔파워 분포 형태가 갑자기 바뀌는 현상은 발생하지 않는다. (도 27, 도 28 참조) 하지만 이 경우에는 관심 영역에서의 공간 평균 빔파워를 최대로 한다는 음향 밝기 최대화 방법의 목적을 이룰 수 없다. 다른 조건에서도 이와 같은 현상이 발생할 수 있지만, 그 때가 음향 밝기를 최대로 만드는 경우이다.
도 27 (a)는 음향 밝기를 최대로 하는 가중치 벡터로 구해지는 빔파워 분포와 그 때의 고유치를 나타내고 있다. 첫번째 음향 밝기(first brightness)와 두 번째 음향 밝기(second brightness)가 약 부근에서 대소가 바뀌고 있고 이 때 빔파워 분포가 바뀐다. 도 27 (b)는 공간 평균 빔파워의 최대화와 관계없이 첫번째 음향 밝기(first brightness)만을 계속 선정하는 경우의 빔파워 분포를 나타내고 있다. 이 때에는 위에서 설명한 것과 마찬가지로 관심 영역이 넓어지더라도 불연속한 형태를 보이지 않는다. 하지만 공간 평균 빔파워가 최대가 되지 않는 경우가 관심 영역을 이후로 정했을 때에 생긴다.
음향 밝기 최대화 방법에서 영역이 넓어짐에 따라 빔파워 분포가 불연속적인 형태가 나타나는 것을 관찰할 수 있다. 이 때도 앞 절의 설명과 마찬가지로 각 고유치간의 대소가 바뀌어 고유 벡터가 바뀌는 데에서 그 원인을 찾을 수 있다. 도 28 (a)는 관심 영역이 넓어짐에 따라 변하는 빔파워를 나타내고 있다. 여기서는 음향 밝기를 최대로 하는 가중치를 선정하고 있다. 도 28 (b)에서는 첫 번째 음향 밝기의 가중치로 도출되는 빔파워 분포를 나타내고 있다.
이 경우에 대해서 관심 영역이 넓어짐에 따라 가중치 벡터가 어떻게 변하는지를 살펴본다면, 경향을 알 수 있을 것이다. 도 29에는 도 28 (b)의 빔파워 중 몇 가지 경우를 나타내고 그 때의 가중치를 나타내고 있다.
음향 밝기 최대화 방법은 가 각각 를 나타내고, 음향 대조 최대화 방법은 가 각각 를 나타내고 있다. 두 방법에서의 가중치 벡터는 영역이 넓어짐에 따라 가운데가 높아지고 양 끝이 낮아지는 형태를 보인다. 양 끝과 가운데 가중치의 차이가 클수록 빔파워의 주엽은 더 넓어진다. 하지만 이것도 각각의 가중치가 같은 부호이면서 최대의 차이를 보일 때 주엽이 계속 넓어진다. (도 30 참조) 같은 부호를 가지면서 최대의 차이를 보이는 위치는 일 때이고, 가 되면 차이는 더 커지나 각 가중치들의 부호가 바뀐다. 그래서 최대 차이를 가지는 영역의 범위는 일 때이지만, 이 때는 양 끝과 가운데의 가중치 부호가 다르므로 대표 방향 에서 빔파워 값이 최소를 가진다.
음향 대조 최대화 방법의 경우에는 관심 영역의 범위가 넓어짐에 따라 음향 밝기 최대화 방법에 비해 서서히 가중치가 변하는 것을 알 수 있다. 각 가중치가 같은 부호를 유지하되 차이를 크게 하는 형태로 가중치가 변해가고 있으므로, 관심 영역이 넓어짐에 따라서 그에 맞게 주엽의 폭이 넓어지는 것을 알 수 있다.
즉, 관심 영역이 넓어지면 넓어질수록 가중치는 가운데가 높아지고 양 끝이 낮아지는 형태를 보인다. 그리고 이 차이가 크면 클수록 더욱 넓은 주엽을 가지게 되나, 가중치간의 부호가 달라질 경우에는 차이가 크더라도 주엽 외에 부엽의 크기를 더 크게 만드는 경향을 보인다.
도 32에서 나타나는 것과 같이 마이크로폰 배열의 길이가 길어지는 경우에 두 방법으로부터 구해지는 빔파워의 주엽 폭이 좁아진다. 그리고 간단한 경우에서 설명한 것과 같이 마이크로폰 배열의 길이가 길어지면 길어질수록 고유치의 대소가 바뀌는 지점이 더 빨리 생긴다는 것을 관찰할 수 있다. 이는 음향 밝기 최대화 방법에서 관심 영역이 넓어질 때 각도 별 빔파워 분포가 어떻게 나타나는지를 통해서 알 수 있다.
도 31에 나타낸 음향 밝기 최대화 방법에서의 가중치 벡터에 대해서 살펴보면, 관심 영역이 넓어짐에 따라서 가중치의 형태가 가운데는 높아지고 주변으로 갈수록 작아지는 형태를 가진다. 그러나 2.2.3에서 보인 것과 마찬가지로 가중치 벡터의 중간값, 여기서는 5번째 가중치와 다른 가중치 간의 크기 차이를 같은 부호 내에서 더 이상 낼 수 없는 경우, 부호를 바꾸면서 그 차이를 크게 만든다. 이것이 나타나 있는 것이 도 31 (a)에서 의 경우이다. 그리고 그보다 더 관심 영역이 넓어지는 경우에는 가중치 크기는 비슷해지고 각 가중치 간의 위상이 만큼 차이를 보인다. 즉, 이 때에는 가중치의 형태가 삼각형 함수(triangular function)를 띠고, 이 때에는 위상이 변하는 횟수만큼 엽(lobe)이 생기는 것을 알 수 있다.
음향 대조 최대화 방법의 가중치는 영역이 넓어짐에 따라 가중치 벡터의 가운데, 5번째 가중치가 높아진다. 관심 영역이 넓어져 비 관심 영역이 줄면 공간 상관행렬 의 각 성분들이 비슷하게 된다. 그 이유는 인 경우를 다루고 있는데 이는 인접 마이크로폰 사이의 위상 차이가 만큼 나기 때문이다. 그리고 비 관심 영역이 줄어든면 비 관심 영역에서의 대표 방향이 에 가까워진다. 이 때 공간 상관행렬 의 성분이 비슷해 지고, 이 경우에는 일 때와 마찬가지로 의 행렬식이 0에 가까워져 가중치를 구하기 어렵다. 그러므로 음향 대조 최대화 방법에서 관심 영역의 범위가 넓어짐에 따라 형태가 고르지 못한 경우가 발생하게 된다.
영역의 범위 인 경우로부터 영역이 넓어지는 경우, 두 마이크로폰 간의 위상차이가 만큼 난다. 그러므로 음향 밝기 최대화 방법과 음향 대조 최대화 방법의 목적함수에서 도출되는 가중치 벡터는 둘 다
을 가진다. 이 경우에는 에서 빔파워가 0이고, dB값으로 표현하면 에서 골이 생긴다. 또, 음향 대조 최대화 방법에서는 관심 영역이 넓어질수록 두 마이크로폰 간의 위상차이를 줄이면서 주엽의 폭을 넓혀간다.
이 조건에서는 마이크로폰의 개수가 홀수가 되면 가운데 마이크로폰의 가중치와 양 끝의 마이크로폰 간의 위상 차이가 만큼 나게 된다. 2.3.1에서와 마찬가지로 관심 영역이 한 방향일 때 음향 밝기 최대화 방법과 음향 대조 최대화 방법의 목적 함수로부터 구해지는 가중치 벡터는 모두
이므로, 이 때 빔파워를 계산해보면 골이 2군데에서 생기는 것을 알 수 있다. (도 34 참조) 음향 밝기 최대화 방법에서의 가중치 벡터는 중간 마이크로폰을 기준으로 삼각형 함수 형태를 가지므로, 피크의 개수만큼 엽이 생기는 것을 예상할 수 있다.
음향 대조 최대화 방법은 각 가중치 사이의 위상 차이가 줄어든면서 주엽의 폭이 넓어져가는 것을 알 수 있다.
도 35 (a)에 나타나는 바와 같이, 음향 밝기 최대화 방법의 목적 함수로부터 구해지는 가중치 벡터는 크기에는 크게 차이가 없으나, 위상 차이가 각 마이크로폰마다 씩 생긴다. 즉 이 때도 가중치 벡터는 삼각형 함수 형태이고, 만큼 위상 차이가 나는 지점의 개수만큼 엽이 생기는 것을 알 수 있다. 이 조건 아래에서는 관심 영역이 넓어지더라도 빔파워의 주엽 혹은 부엽이 다른 경우들에 비해 적은 변화를 보인다.
음향 대조 최대화 방법에서는 영역이 넓어짐에 따라 가중치 벡터의 크기는 벡터의 중간 성분 값이 높아지고 주변으로 갈수록 낮아지는 형태를 띠게 된다. 하지만 2.2.4에서 고찰한 문제가 여기서도 같이 발생한다. 즉 관심 영역이 넓어짐에 따라, 비 관심 영역에서의 공간 상관 행렬 의 성분들이 비슷해져서 행렬식이 0에 가까워 진다. 그래서 가중치 벡터를 구하는 것에 영향을 준다.
2.4 요약 및 결론
음향 밝기 최대화 방법에서는 관심 영역의 범위를 넓혀감에 따라 가중치 벡터의 형태는 가운데가 높아지고 주변으로 갈수록 낮아지는 경향을 보인다. 이 차이가 클수록 더 넓은 주엽을 가진다. 그러나 모든 가중치가 같은 부호를 가질 때, 즉 위상차이가 적을 때에는 이것을 만족하나, 각 가중치의 부호가 다를 때에는 그렇지 않다. 같은 부호 내에서 가중치 간의 크기 차이를 더 낼 수 없으면 어떤 가중치는 부호가 바뀌고, 이 경우 각 가중치 간의 크기 차이는 유지하지만 위상이 반대가 된다. 즉 부엽의 크기를 더 키운다.
그리고 고유 벡터(가중치 벡터)는 항상 동일한 고유치에 의해 선정되지 않고 주어진 조건 아래에서 최대가 되는 고유치에 의해 선정된다. 그러므로 관심 영역을 넓혀가며 가중치 벡터 및 공간 평균 빔파워를 관찰해보면 빔패턴의 변화 형태가 불연속한 구간이 생길 가능성이 있다.
음향 대조 최대화 방법에서도 영역의 범위가 넓어짐에 따라 가중치 벡터의 형태가 가운데는 높고 주변으로 갈수록 낮아지는 경향을 보이나, 음향 밝기 최대화 방법의 목적 함수로부터 구해지는 가중치 벡터에 비해서는 변화하는 정도가 비교적 느리다. 관심 영역의 범위가 넓어지면 비 관심 영역이 줄어든기 때문에, 공간 상관 행렬 의 성분들이 비슷해져 행렬식이 0에 가까워져 고유치 벡터를 구하기 어렵다. 각 방법들이 가지는 특징에 대하여 표 2로 정리하였다. 표 2는 지연-합 빔형성 방법과 음향 밝기/대조 최대화 방법을 비교한 것이다.
3. 실험
본 발명에서 제안한 두 방법의 적용 가능성을 확인하기 위해 두 가지 실험을 진행하였다.
첫 번째 실험은 임의의 방향으로부터 마이크로폰 배열에 음파가 입사하는 경우, 제안 방법으로 입사 방향의 범위를 추정하는 실험으로 제안 방법의 적용 가능성을 알아보고자 했다. 두 번째 실험은 제안 방법의 적용 예(application)로 임의의 공간에 다수의 음원을 배치하여 특정 음원든의 신호를 크게 수신하는 실험이었다.
4 장에서는 위의 두 실험든에 어떤 장비든을 사용하였는지, 실험에서의 관심 주파수 대역 및 사용된 음원과 배치, 그리고 마이크로폰 배열을 어떻게 정하였는지 등을 다룬다.
3.1 실험 장비 구성 및 환경
한국과학기술원 기계공학동 1층의 무향실(anechoic chamber)에서 실험을 수행하였고, 실험에 사용된 장비는 도 36, 도 37, 도 38에 나타낸 것과 같다. 총 장비는 무향실 내부와 외부에 설치된 것으로 나눌 수 있다. 무향실 외부에는 실험을 진행하는데 필요한 각 장비들을 설치하였고, 아래와 같은 성능을 가지고 있다.
1) 무향실(anechoic chamber)
·하한 주파수(cut-off frequency) : 100 Hz
2) 무향실 외부에 설치된 실험 장비
ⓐ 데이터 수집용 컴퓨터
ⓑ 신호 재생용 컴퓨터
ⓒ 데이터 수집 장치(DAQ board) : NI cDAQ- 9178에 NI 9234를 8개 장착
·32채널, 24 Bit
·입력 범위: ±5V
·Sampling rate : 최대 51.2 kHz
ⓓ 다채널 신호 발생기 : Echo Audiofire12
·입력 출력 각각 12채널, 24 Bit
·Sampling rate : 32 kHz ~ 192 kHz
ⓔ 앰프: Anam AA-77 2채널 3대
ⓕ 신호 생성기 : Sony Tektronics AFG320
3) 무향실 내부에 설치된 실험 장비
ⓗ 마이크로폰(microphone) : BSWA MPA416 7개
·주파수 범위 : 20 Hz ~ 20 kHz
·Sensitivity : 50 mV/Pa
ⓘ 스피커(loudspeaker) : JBL 1Xtreme 5개
·주파수 범위 : 50 Hz ~ 20 kHz
3.2 관심 주파수 대역, 마이크로폰 배열 및 스피커 위치 선정
우선 관심 주파수 대역을 선정할 필요가 있는데, 그에 맞게 마이크로폰 배열을 어떻게 할지 정할 수 있기 때문이다. 그리고 두 실험에서 사용하는 음원을 구분할 필요가 있다. 간단한 경우부터 실험을 통해 적용 가능성을 살펴볼 필요가 있으므로, 첫 번째 실험에서는 단일 주파수의 음원을 마이크로폰 배열로부터 임의의 방향에 위치시켜 실험을 진행한다. 두 번째는 적용 예의 실험으로 단일 주파수가 아닌 특정 주파수 대역을 가지는 음원을 사용한다. 이 때에는 음악, 대화 등 여러가지 음원을 생각해 볼 수 있으나, 그 중에서 대화를 하는 상황을 구성하여 대화 중 특정 사람의 음성 신호를 크게 수신할 수 있는지 알아보기로 한다. 그렇다면 실제 대화하는 신호를 다루므로 사람의 목소리가 분포하고 있는 주파수 대역을 관심 주파수 대역으로 선정할 수 있다. 이에 대해서는 전화에서 대역을 통과시키는 음성대역(voiceband)을 관심 주파수 대역으로 선정할 수 있다[33]. 왜냐하면, 전화는 대부분의 경우 사람들의 대화를 전달하는 역할을 수행하므로 관심 주파수 대역을 내에서 선정하는 것이 타당하기 때문이다.
이제 마이크로폰 배열과 스피커 위치를 어떻게 정할지 생각해보자. 마이크로폰 배열 앞의 반원 상에 스피커를 배치하는데, 마이크로폰 배열과 스피커 간격 R을 최대 얼마까지 할 수 있는지를 알아보자. 실험을 진행하는 무향실 한 변의 최대 길이가 3.6m이므로 최대폭으로 선정할 수 있는 거리는 약 1.8m이다. 여기서 거리는 마이크로폰 배열의 중앙에 위치하는 마이크로폰과 각 스피커 간의 거리를 의미한다. 본 실험에서는 R을 1.6m로 선정하였다.
본 발명에서 평면파를 다루므로 스피커가 마이크로폰 배열의 중심으로부터 최대 1.8m 떨어져 있을 때 평면파를 발생시키는지를 확인할 필요가 있다. 스피커에서 발생하는 음압 신호가 마이크로폰 배열에 수신될 때 이것을 평면파로 간주하는 것은 마이크로폰 배열의 중앙에 위치하는 마이크로폰과 양 끝에 위치하는 마이크로폰에 수신되는 음압 신호의 위상 오차(phase error)가 이하일 때이다[37]. 이를 만족할 수 있는 조건으로 마이크로폰 배열의 총 길이 을 0.3m로 선정하였다. (Appendix B 참고)
여기에서 마이크로폰 배열의 중앙에는 기준 마이크로폰을 위치시키고 신호처리 시 앨리어싱(aliasing) 현상이 발생하지 않는 인접 마이크로폰의 간격 를 선정할 필요가 있다. 관심 주파수 대역에서 최소의 파장 은 주파수가 일 때 약 11cm이다. 마이크로폰 사이의 간격 는 최소한 이 파장 길이의 절반 이하가 돼야 하므로, 마이크로폰 배열의 총 길이 과 를 고려하여 5cm로 선정하였다. 따라서 마이크로폰의 개수 은 7개이고, 마이크로폰의 번호는 왼쪽에서부터 1번으로 정한다. 도 37에는 선정된 마이크로폰 배열을 나타내고 있다.
선정된 각 변수들을 종합하여 보면 마이크로폰 배열의 총 길이 은 0.3m, 마이크로폰의 개수 은 7개, 인접 마이크로폰 사이의 간격 는 5cm, 그리고 마이크로폰 배열의 중심으로부터 각 스피커 사이의 거리 은 1.6m이다. 그리고 관심 주파수 대역은 이다.
이제 각 스피커의 위치 및 개수를 선정해야 한다. 두 번째 실험은 사람들이 대화하는 상황을 표현하고 있으므로, 사람들이 대화할 때 어느 정도 간격으로 서는지 고려하여 스피커의 개수 및 위치를 정할 수 있다. 이에 대해서는 Edward T. Hall의 근접학에 따라 사람들이 대화를 할 때의 거리를 나누는 기준 중 '최단 중립 거리'를 도입한다[20]. 이 거리는 20인치 ~ 36인치(50.8cm∼91.4cm)인데, 이 1.6m일 때 스피커를 간격으로 배치하면 두 스피커 간의 직선 거리가 최단 중립 거리를 만족하는 약 0.8m가 된다. (도 40 참조)
3.3 첫 번째 실험
본 실험에서는 임의의 한 방향으로부터 마이크로폰 배열에 음파가 입사하는 경우, 제안 방법으로 음파가 입사하는 방향의 범위를 추정할 수 있는지를 검증 하였다. 1절과 2절의 내용을 토대로 마이크로폰 배열을 선정하고, 이 1.6m가 되는 반경 위의 한 지점에 스피커를 설치하였다. 무향실에서 실험이 진행됐으므로 자유 음장 조건이라고 간주할 수 있다. (무향실의 차단 주파수 ) 스피커로부터 단일 주파수의 신호를 방사시켰는데, 주파수는 음성 대역 내의 임의의 주파수로 선정하였다. 본 실험에서는 에 대해서 실험을 진행했다.
마이크로폰 배열로부터 에 각도기와 줄자, 그리고 실을 사용하여 스피커의 위치를 잡았다. 실험 장비 설치 후 지연-합 빔형성 방법으로 간격으로 음파의 입사 방향을 추정하였다. (도 41 참조) 제안 방법으로 얻는 각 수행 순서에서의 추정 범위는 도 42에 나타냈다. 각 수행 과정에서는 1장에서 모의 실험을 통해서 추정한 것과 동일한 영역을 추정하는 것을 알 수 있다.
이 때 지연-합 빔형성 방법과 제안 방법에서의 연산량은 각각 다음과 같다. 수학식 58로부터 통해 지연-합 빔형성 방법에서의 연산량이 181회이고, 수학식 59를 통해 제안 방법에서의 연산량은 1회 수행시 2회, 2회 수행시 4회, 3회 수행시 6회, 4회 수행시 8회, 5회 수행시 10회, 6회 수행시 12회, 그리고 7회 수행시 14회이다. 본 마이크로폰 배열의 3dB 밴드폭이 이므로 3회 이상 수행 시에 3dB 밴드 폭보다 좁은 범위를 추정한다. 그리고 최대 7회 수행시에도 제안 방법에서의 연산량이 지연-합 빔형성 방법의 연산량보다 적다.
3.4 두 번째 실험
각 음원의 선정 및 영역 결정
실험에 필요한 각 음원들은 연령대와 성별을 다르게 선정하였다. 즉, 대화를 하고 있는 아버지와 딸, 대화를 하고 있는 할아버지와 손자, 그리고 방송에서 나오는 남성 아나운서의 목소리를 음원으로 선정하였다. (음원의 출처: [47], [54]) 두 사람이 대화를 주고 받는 경우 각 음원 내에서도 신호가 발생하지 않는 시간이 있고 그 때에는 주파수 성분이 존재하지 않는 것을 예상할 수 있다. 각 음원은 사람의 목소리 신호이고, 갑자기 커지거나 작아지는 것이 아닌 일상적인 대화를 나누는 것으로 선정하였다. 실험 시 각 음압 신호의 최대값을 같게 만들고 실험을 진행하였다. 이 경우 실제 사람들이 대화를 나누는 상황을 재연할 수 있을 것이다.
각 음원들이 어떤 주파수 대역의 신호를 가지고 있는지는 도 41에서 도 45에 스펙트로그램(spectrogram)으로 나타냈다. 이를 통해 음성대역인 대역 내에 주파수 신호가 퍼져있음을 알 수 있다. 스펙트로그램은 총 데이터 길이는 20초, 주파수 분해능은 이다. 샘플링 주파수 로 창문 함수는 사각 창문 함수(rectangular window)를 사용하였다.
그리고 도 48에 나타낸 바와 같이, 각각 간격으로 에 딸, 에 아버지, 에 남성 아나운서, 에 손자, 그리고 에 할아버지 음원을 각각 배치하였다. 음원은 딸과 아버지의 대화, 손자와 할아버지의 대화를 사람별로 분리한 것과 남성 아나운서의 뉴스 진행 내용으로 총 5 개를 사용하였다. 이 때 대화를 진행하는 아버지와 딸 그리고 할아버지와 손자의 영역을 각각 관심 영역으로 지향시킬 경우 간격으로 지향하는 범위를 정할 수 있다. 따라서 한 번에 지향하는 관심 영역의 범위는 로 선정한다. 즉, (1)를 관심 영역으로 선정하는 경우 아버지와 딸의 대화를 다른 신호든보다 크게 수신되고, (2)를 관심 영역으로 선정하는 경우 남성 아나운서의 신호를 다른 신호든보다 크게 수신된다. 마지막으로 (3)를 관심 영역으로 선정하면 할아버지와 손자의 대화를 다른 신호든보다 크게 수신한다. 각 음원이 어떤 음절로 구성되어 있는지는 Appendix C.에 첨부하였다.
3.5 가중치 벡터의 형태
제안 방법으로 가중치를 도출하면 마이크로폰의 개수 만큼, 그리고 관심 주파수 대역의 범위만큼 나온다. 또 관심 영역에 따라 다른 가중치가 도출되므로 모든 가중치에 대해 보여주는 것에는 한계가 있다. 그러므로 그 중 대표적으로 3개의 주파수()를 선정하여 각 방법에서 구해지는 가중치를 보이고, 그에 따라 빔패턴이 어떻게 형성되는지를 살펴본다.
이 경우에는 각각 를 기준으로 대칭이기 때문에 한 번에 같이 나타낸다. 평면파 모델의 지연-합 빔형성 방법의 경우 각 영역에서의 각각 를 대표 방향으로 지향하고 있다. 그리고 음향 밝기 최대화 방법과 음향 대조 최대화 방법의 경우 각 마이크로폰 사이의 시간 지연을 통해서 지향하고 있는 방향을 확인할 수 있는데 이는 각각 아래의 표 3 내지 표 5와 같이 나타난다.
아래의 표 3 내지 표 5는 각 마이크로폰 사이의 시간 지연을 통해 알 수 있는 지향 방향을 각각 나타내고 있다. 여기서, 여기서 A : 평면파 모델의 지연-합 빔형성 방법, B : 음향 밝기 최대화 방법, C : 음향 대조 최대화 방법을 나타낸다.
와 같이 표현이 가능하다.
여기서 는 인접 마이크로폰 사이의 시간 지연을 의미하므로 마이크로폰의 총 개수보다 1개 작은 값을 가진다. 그리고 각 시간지연이 다 같다면 지향하는 방향인 도 모두 같은 값을 가진다. 평면파 모델의 지연-합 빔형성 방법의 경우가 모두 같은 값을 가진다.
임을 알 수 있다. 본 실험에서 선정한 마이크로폰 배열로 구해지는 음향 대조 최대화 방법에서의 가중치가 와 에서 어디를 지향하게 되는지는 수학식 73의 우변인 역코사인 항의 값이 허수가 되어 찾을 수가 없었다.
가중치 벡터를 알아보기 위해 선정한 각 주파수에서 음향 밝기 최대화 방법과 음향 대조 최대화 방법의 위상을 확인해 보면 직선 형태임을 알 수 있다. 이는 각 마이크로폰이 완전히 다른 방향을 지향하게 되는 것이 아닌 어떤 분산을 가지는 방향에 대해 지향하고 있다는 것을 의미한다.
에서의 음향 밝기 최대화 방법과 음향 대조 최대화 방법의 가중치 벡터를 보면 각각 대표 방향 를 크게 벗어나지 않는다. 이 대표 방향을 중심으로 각 마이크로폰의 가중치 크기를 바꿈으로써 관심 영역에서의 빔패턴을 각 목적에 맞도록 조절하는 역할을 한다.
관심 영역을 인 경우에도 시간 지연을 통해 대표 방향 를 중심으로 각 방법에서 가중치를 도출하는 것을 알 수 있다. 에서 음향 밝기 최대화 방법은 주엽을 2개 가지는데 이에 대해서는 2장에서 설명하고 있다.
아래의 표 6 내지 표 8은 각 마이크로폰 사이의 시간 지연을 통해 알 수 있는 지향 방향을 나타낸 것이다. 여기서, A : 평면파 모델의 지연-합 빔형성 방법, B : 음향 밝기 최대화 방법, C : 음향 대조 최대화 방법을 나타낸다.
3.6 실험 결과
3.1절 ∼ 3.2절에서 각 변수들을 어떻게 선정했는지를 기술하였다. 그리고 3.5절에서는 관심 주파수 대역에서 적용하는 각 방법들의 가중치 벡터들이 어떤 형태인지, 또, 이를 적용했을 때 각 빔패턴의 변화를 살펴보았다. 이 내용들을 바탕으로 두 번째 실험을 진행하였고 그 결과에 대해 기술하고자 한다.
무향실에서 실험이 진행되었고, 신호 대 잡음비는 관심 주파수 대역 내에서 25 dB 이상을 확보할 수 있었으므로 잡음의 의한 영향은 무시할 수 있다.
본 실험은 단일 주파수가 아닌, 상황을 설정을 하여 사람들의 목소리 신호를 음원으로 선정하였다. 주파수 대역을 가지는 신호이고 주파수 별로 그 크기가 일정한 신호들이 아니기 때문에 결과를 정량화하여 표현하기가 어렵다. 그러므로 총 세 가지 경우. 관심 영역이 에 대하여 각 방법의 가중치를 적용한 결과를 컴퓨터 웨이브 파일로 작성하였다.
파일은 총 4개로 구성이 되어있다. 즉 1) 마이크로폰 배열의 중앙에 위치하고 있는 마이크로폰이 받아들이는 신호에 대한 파일, 2) 를 관심 영역으로 하였을 때의 각 방법을 적용한 파일, 3) 를 관심 영역으로 하였을 때의 각 방법을 적용한 파일, 4) 를 관심 영역으로 하였을 때 각 방법을 적용한 파일이다.
마이크로폰 배열의 중앙에 위치하고 있는 마이크로폰이 받아들이는 신호는 각 음원들과 거리가 모두 같으므로 어느 방향에서 어떤 음원의 음압 신호가 수신되는지를 알기 어렵다. 이에 반해 2), 3), 4)에서와 같이 각 관심 영역을 지향하고 있을 때에는 원래의 신호에 비해 훨씬 그 관심 영역의 신호를 잘 파악할 수 있다. 도 59에서 도 62는 원래 신호와 각 방법을 적용한 신호를 보여주고 있다.
여기서, 도 61은 관심 주파수 대역만을 가지고 있는 신호(마이크로폰 배열의 중앙에 위치한 마이크로폰으로부터의 신호)를 나타낸 도면이고, 도 62는 관심 영역이 인 경우의 각 방법을 적용한 시간 영역 신호(아버지와 딸의 대화)를 나타낸 도면이고, 도 61은 관심 영역이 인 경우의 각 방법을 적용한 시간 영역 신호(남자 아나운서의 뉴스 대본)을 나타낸 도면이고, 도 62는 관심 영역이 인 경우의 각 방법을 적용한 시간 영역 신호(할아버지와 손자의 대화)를 나타낸 도면이다.
3.7 요약 및 결론
3장에서는 제안 방법의 적용 가능성을 알아보기 위해 두 가지 실험을 진행한 결과를 기술하였다. 첫 번째 실험에서는 간단한 경우에 대한 실험으로, 단일 주파수의 음파가 마이크로폰 배열에 입사하는 경우 제안 방법으로 이 입사 방향의 범위를 추정할 수 있는가 검증하는 실험이었다. 두 번째 실험에서는 적용 예로 관심 영역의 신호를 다른 영역에 비해 상대적으로 크게 수신하는 것이 가능한지를 확인하였다.
각 경우에 대해 도출되는 각 방법의 가중치 및 빔패턴을 통해서 관심 영역을 선정하였을 때 각 방법이 대표 방향 를 향하는 것을 알 수 있었다. 각 방법의 가중치를 적용 후 그 결과를 들어보았을 때, 관심 영역의 신호가 다른 영역의 신호에 비해 상대적으로 크게 들리는 것을 알 수 있는데, 이에 대해서는 정량화하기가 어려워 웨이브 파일로 제작하였다.
빔형성 방법의 분해능
빔형성 방법의 분해능을 나타내는 지표는 대표적으로 아래와 같이 2가지를 들 수 있다[43].
1) 3dB 밴드 폭(3dB bandwidth)
2) 최대 부엽 레벨(MSL, Maximum Sidelobe Level)
도 65는 각 지표를 나타내고 있다. 먼저 3dB 밴드 폭은 빔파워가 최대인 지점으로부터 빔파워가 절반인 지점까지의 간격을 말한다. 이 값은 방향을 추정할 때에는 각도(angle)고, 위치를 추정할 때에는 거리(distance)이다.
이다. 여기서 ±의 의미는 도 65에 나타낸 것과 같이, 3dB 밴드 폭의 각 경계를 나타내고 있다. 이를 싱크 함수로 다시 쓰면,
와 같이 쓸 수 있다. 최대 부엽 레벨은 주엽과 부엽간의 빔파워 차이로, 이 값이 클수록 분해능이 크다는 것을 의미한다. 이 두 가지 분해능 지표는 음원의 주파수, 마이크로폰의 개수 및 인접 마이크로폰 사이의 간격과 관련이 있다.
평면파 확인
컴퓨터 모사 실험의 경우 평면파를 모델링 할 수 있지만, 실험에서는 스피커를 사용하기 때문에 실제로 평면파가 구현되는지는 항상 확인을 하여야 한다. 그래서 관심 주파수 대역을 정한 뒤 그 대역에서 평면파가 구현되는지를 프레스넬 영역(Fresnel region)과 프라운호퍼 영역(Fraunhofer re-gion)의 근거리 장(near field)과 원거리 장(far field)을 나누는 기준으로 확인할 수 있다. [37]
도 66과 같은 실험조건 아래에서, 마이크로폰 배열에 음파가 평면파로 수신되는지 확인할 수 있는 조건을 표 9에 표시하였다. 아래의 표 9는 근거리장(near field)과 원거리장(far field)을 나누는 기준을 나타낸 것이다.
이고, 본 실험에서 선정한 은 1.6m이므로 이 조건을 만족한다. 따라서 본 실험에서 사용하고 있는 음원으로부터 방사되는 음파의 파면은 관심 주파수 대역 내의 각 주파수에서 평면파로 간주할 수 있다.
이를 표현하는 또 다른 방법으로는 위상 오차(phase error)라는 값이 있다. 이는 마이크로폰 배열의 수직인 방향에 스피커를 설치하고, 이로부터 순음 성분을 틀어 마이크로폰 배열에 신호가 수신 될 때, 마이크로폰 배열의 중앙과 양 끝에 각각 위치하고 있는 마이크로폰 사이의 위상 오차가 이하면 평면파로 간주하는 것이다.
이에 대해 실험 시 순음 성분 를 스피커가 방사하고 이를 마이크로폰 배열이 받았을 때의 위상 오차를 도 65에 나타내었다. 중앙과 양 끝에 각각 위치하고 있는 마이크로폰 사이의 위상 오차는 각각 로 위상 오차가 와의 에러가 각각 약 이므로 이하의 성분이 마이크로폰 배열에 수신될 때 각 주파수에서 평면파로 간주할 수 있다.
최대 빔파워가 되는 방향에 대한 수학적 증명
아래와 같은 방법으로도 평면파 음파가 공간 상에서 전파되어 마이크로폰 배열에 수신될 때, 가중치 함수(혹은 스캔 함수)에서의 방향 와 실제 음파의 입사 방향 가 일치할 때 빔파워가 최대임을 증명할 수 있다.
와 같은데, 여기서 코쉬-슈바르츠 부등식(Cauchy-Schwarz inequality)을 사용하면 아래와 같은 수식으로 표현할 수 있다.
이 말은 빔파워 가 가질 수 있는 최대값은 1이고, 이 최대값은 혹은 일 때 발생한다. 그러므로 가중치 함수에서의 방향과 실제 음파의 입사 방향이 일치할 때에 항상 빔파워가 최대인 것이 위의 방법으로도 증명 가능하다.
제안 방법에서 가중치를 구하는 데 필요한 계산량
가중치를 구하는 데 2가지 경우에 대해 생각해본다.
첫 번째, 영역이 주어졌을 때 가중치를 구하기 위해 필요한 사칙연산 횟수를 알아본다. 이를 일반적으로 연산 횟수(operation count)라는 용어로 사용하고 있다. 본 발명에서 다루고 있는 문제는 수학식 29에서와 같은 차 고유치 문제로, 이는 수치해석적으로 구할 수 있다. 이 때 관심 영역에서의 공간 상관 행렬 는 항상 허미션 행렬(Hermitian matrix)이므로, 슈르 분해와 대각화(Schur factorization and diagonalization)를 통해 구하는 연산 횟수는 일반 고유치 문제보다 더 적은 값을 가진다. 마이크로폰 개수 M이 충분히 많은 경우 연산 횟수는
로 쓸 수 있다[42]. 마이크로폰의 개수가 늘어날수록 연산 횟수가 증가하지만, 이는 영역이 정해지면 사전에 미리 구할 수 있는 값이다.
두 번째, 각 영역마다 한 개씩 가중치 벡터를 구하는데, 반복 수행 횟수 에 따라 얼마만큼의 가중치 벡터를 구하는가 생각해보자. 도 68 (a)와 같이 전체 영역 를 두 영역으로 나누어 각 영역에서의 가중치를 구하는 데 번의 계산이 필요하다. 두 번째 반복 수행에서는 첫 번째 수행에서 나누었던 영역을 다시 이등분한다. (도 66 (b) 참조) 이 경우 각 영역에서의 가중치를 구하는 데 번의 계산이 필요하다. 즉, 수행 횟수가 증가할 때마다 2의 지수승으로 커지고, 번째 수행에서는 번의 계산을 수행한다. 최종적으로 번 계산을 수행하였을 경우, 각 수행 과정에서 가중치를 구하는 데 필요한 계산 횟수를 모두 더하면 등비수열이므로 이는
두 방향 추정에 대해 제안 방법 적용
신호 대 잡음비(Signal to Noise Ratio, SNR)에 따른 성능 변화
만약, 두 방향에서 음파가 입사하는 경우는 어떤가 생각해 보자. 이 때에는 우리가 원하는 음압 신호가 신호(signal)이고, 다른 방향으로부터 마이크로폰 배열에 수신되는 신호가 잡음(noise)이다. 신호 대 잡음비(SNR)가 어느 정도 일 때 음파의 입사 방향이 추정가능한지를 알아보자.
이 경우 신호 대 잡음비와 음파의 입사 방향과는 수식상으로 관련된 부분이 없기 때문에 각 음압 신호의 절대 크기만을 고려하게 된다. 즉, 신호 대 잡음비가 높은 경우에는 상대적으로 잡음의 영향이 줄어들기 때문에 음파의 입사 방향 추정이 더 정확히 이루어지는 것을 예상할 수 있다. 앞에서 사용한 간단한 경우를 통해 신호 대 잡음비에 따른 성능변화를 알아보기로 한다. 이 때 음파의 주파수는 이고, 입사하는 방향은 임의로 로 정하여 이 경우를 통해 살펴보기로 한다.
두 방향에서 동시에 음파가 입사하고, 각 방향의 음압 신호가 가지는 절대 크기가 같은 경우이다. 이 때 주어진 마이크로폰 배열로 얻게 되는 지연-합 빔형성 방법에서의 빔파워 분포를 살펴보면 도 69와 같다. 이 분포에서 보면 음파가 입사한다고 추정할 수 있는 방향은 빔파워가 최대인 이다. 이런 결과가 나오는 것은 신호 대 잡음비가 충분히 확보되지 않았기 때문이라고 생각할 수 있다.
제안 방법을 반복 수행하면서 얻는 결과는 도 70과 같다. 제안 방법으로 3회 반복 수행을 하였을 때 음파가 입사하는 방향의 범위는 로 추정할 수 있다. 이는 주어진 마이크로폰 배열에서의 3dB 밴드 폭인 보다 적은 값을 나타낸다. 그러나 4회 이상 반복 수행을 할 경우에는 범위 추정이 어렵다. 이 역시도 충분히 신호 대 잡음 비가 확보되지 않았기 때문이라고 예상할 수 있다.
주어진 마이크로폰 배열을 사용하여 얻는 지연-합 빔형성 방법에서의 빔파워 분포는 도 71과 같다. 여기서는 신호 대 잡음비가 인 경우보다 더 정확히 로 음파의 입사 방향을 추정한다. 제안 방법에서 반복 수행하여 얻게 되는 결과를 도 72에 나타냈고, 이 때 3회 반복 수행시 추정 범위는 이다. 더 반복하는 경우에도 음파가 입사하는 방향을 포함하는 범위를 추정하게 되고, 이를 통해 신호 대 잡음비가 충분히 확보되는 것이 필요하다고 예상할 수 있다.
2개 이상의 방향에서 음파가 입사하는 경우 연산량 비교
만약 음파의 입사 방향을 2개 이상 추정하기 위해서는 어떻게 해야 할까? 이에 대해서는 다음과 같이 생각하여보자. 하나의 음파의 입사 방향 범위를 추정하는 데 제안 방법을 적용하는 경우에는 항상 두 영역 중 공간 평균 빔파워가 큰 영역에 음파의 입사 방향이 있다는 가정을 가지고 있다. 다시 말해, 두 영역을 비교하여 공간 평균 빔파워가 상대적으로 작은 영역에 대해서는 고려하지 않겠다는 의미이다.
만약 이를 보완하여, 3dB 밴드 폭을 도입하면 2개 이상의 음파가 입사하는 경우에 적용할 수 있을 것이다. 즉, 사용자가 공간 평균 빔파워에 대해 역치(threshold)를 설정하여, 역치 이상에서는 해당 영역 내부에 음파의 입사 방향이 존재한다고 추정하는 것이다. 이 역치를 두 영역간의 공간 평균 빔파워 비로 정의하면 다음과 같다.
제안 방법은 각 영역이 가지는 공간 평균 빔파워 값의 상대적인 크기 차이를 비교하여 음파가 입사하는 방향의 범위를 추정하는 방법이다. 이 차이가 예를 들어, 와 같이 수치적으로 매우 작은 경우에는 두 영역 중 어디에 음파가 입사하는 방향이 존재하는지 추정하는 것이 어려울 수 있다. 그러므로 이 역치 값이 일정 수치 이하로 들어올 때 각 영역에 음파가 입사하는 방향이 존재한다고 가정하는 것이다. 그리하여 영역 별로 독립적으로 음파가 입사하는 방향의 범위를 추정하는 과정을 반복 수행해서 각각의 추정 범위를 도출해 내는 과정을 따른다.
음파가 2개 이상 입사하는 경우에 대해서 제안 방법이 연산에서 효율적인지 알아보자. 음파가 2개의 방향에서 입사할 때 연산량이 가장 많을 것으로 생각할 수 있는 경우는 의 각 영역에 음파의 입사 방향이 존재할 때이다. 즉, 첫 번째 추정 과정에서 각 영역에 음파의 입사 방향이 존재하는 것으로 추정 될 때이다. 이 때 연산량은
이므로, 6회 반복 수행까지 제안 방법의 연산량이 더 적은 것을 알 수 있다. 추정 범위는 마이크로폰 배열의 3dB 밴드 폭을 기준으로 제안하였으므로, 최대 반복 횟수와는 관련이 없다. 도 73에는 추정 과정을 순서도로 나타내고 있다.
그렇다면 실제로 적용이 가능한지 간단한 경우에 대해 고찰해보자. 앞의 예시에서 사용한 마이크로폰 배열을 사용하고, 음파가 각각 에서 입사하는 경우 두 음파가 입사하는 방향의 범위를 각각 추정할 수 있는지 알아보자. 이 때 입사 주파수는 이고, 신호 대 잡음비는 인 경우를 고려한다. 역치 는 의 두 빔파워 차이를 3dB로 설정하면, 역치 이하일 때에는 각 영역 내부에 음파의 입사 방향이 각각 존재한다고 추정한다.
영역을 와 로 나눴을 때 계산되는 역치 는 2dB이다. 그러므로 와 각 영역에 대해 독립적으로 음파가 입사하는 방향의 범위를 추정한다. 도 74와 도 75는 각 수행 과정에서 추정하는 음파가 입사하는 방향의 범위를 나타내고 있고, 아래의 표 10에는 각 수행 과정에서 얻는 역치 를 나타내고 있다. 이를 통해 본 예제의 선형 마이크로폰 배열이 가지는 3dB 밴드 폭인 보다 더 좁은 범위를 추정하는 것이 가능한 것을 알 수 있다.
4. 요약 및 결론
본 발명에서는 영역 관점에서 음파가 입사하는 방향의 범위를 추정하는 방법에 대해 다루었다. 지연-합 빔형성 방법에서는 음파가 입사하는 방향 혹은 음원의 위치를 추정하는 것과 달리 음파가 입사하는 방향의 범위를 추정하여 연산량이 적은 방법을 제안하였다.
이를 위해 영역 관점에서 구해지는 공간 평균 빔파워를 이용하는 방법을 두 가지 제안하였다. 첫 번째는 음향 밝기 최대화 방법으로 이는 가중치 벡터의 노옴이 제한되어 있을 때 관심 영역 내의 공간 평균 빔파워를 최대로 하는 가중치를 구하는 방법이다. 두 번째는 음향 대조 최대화 방법으로 관심 영역과 비 관심 영역간의 공간 평균 빔파워 비를 최대화하는 가중치를 구하는 방법이다. 이 문제에서 구해지는 최대 고유치 및 최대 고유벡터가 구하고자 하는 각 방법에서의 가중치이다.
각 방법에서 1) 관심 영역이 한 방향, 2) 관심 영역이 전체 영역인 경우에 대한 해석적 접근을 시도하였다. 관심 영역이 한 방향인 경우 음향 밝기 최대화 방법에서 구해지는 가중치 벡터는 평면파 모델의 지연-합 빔형성 방법의 가중치 벡터와 같고, 음향 대조 최대화 방법에서는 주파수와 인접 마이크로폰 사이의 간격에 따라 음향 밝기 최대화 방법과 같은 해를 가지는 것을 보였다.
관심 영역이 전체 영역인 경우에 대해서는 마이크로폰의 개수가 2개, 3개인 경우에 대한 음향 밝기 및 가중치 벡터를 구하였다. 제안 방법에서는 항상 최대 고유치와 그에 따르는 고유 벡터를 음향 밝기, 가중치 벡터로 각각 선정하는데, 이 값이 하나의 고유치로부터 구해지는 것이 아닌 주파수와 인접 마이크로폰 사이의 간격에 따라 고유치의 대소관계가 바뀌고 그에 따라 고유치 및 가중치 벡터가 바뀌는 것을 설명하였다. 그러므로 이 때의 가중치 벡터로부터 구해지는 공간 평균 빔파워가 영역이 변함에 따라 불연속적인 경향을 보이는 것을 설명하였다.
음향 대조 최대화 방법에서는 두 영역 사이의 공간 평균 빔파워의 비를 음향 대조로 나타내는데, 이 음향 대조가 관심 영역의 공간 평균 빔파워를 크게 하며 최적화를 하는 것인지, 비 관심 영역의 공간 평균 빔파워를 작게 하며 최적화를 하는 것인지를 설명하였다. 각 마이크로폰에 수신되는 음압 신호간의 공간 상관이 큰 차이를 보이지 않는 경우에는 비 관심 영역에서의 공간 상관 행렬의 최소 고유치가 0에 가까운 값을 가지고, 이 때에는 역행렬을 구하기 어려움을 설명하였다.
이렇게 구하는 각 방법에서의 가중치를 이용하여 영역 관점에서 음파의 입사 방향을 추정하는 방법을 제안하였다. 지연-합 빔형성 방법과 같은 기존의 빔형성 방법에서는 후보 방향 혹은 후보 위치 단위로 빔파워를 계산하는 방법을 택하는데, 제안 방법에서는 영역 관점에서 각 영역의 공간 평균 빔파워를 통하여 음파가 입사하는 방향의 범위를 추정하였다. 그리고 빔파워 계산 횟수를 연산량이라 정의하고 이 연산량이 지연-합 빔형성 방법과 제안 방법에서는 어떻게 차이 나는지, 몇 번을 반복했을 때까지가 제안 방법에서의 연산량이 더 적은지를 밝혔다. 또, 음파가 입사하는 방향의 범위를 추정하는 기준을 3dB 밴드 폭으로 제안하였다.
그리고 전파하는 음파의 파장, 마이크로폰 배열의 총 길이, 인접 마이크로폰 사이의 간격, 대표 방향, 그리고 영역의 범위에 따라 가중치 벡터가 어떻게 변하는지를 설명하였다. 다른 조건이 동일하고 영역의 범위가 넓어지는 경우에 음향 밝기 최대화 방법과 음향 대조 최대화 방법에서 도출되는 각 가중치 벡터는 삼각형 함수의 형태를 띠는 것을 알 수 있었다. 이 때 가중치 벡터의 성분 중 최대값과 최소값의 차이가 같은 부호 내에서 더 이상 최대가 될 수 없을 때에는 가중치 벡터의 성분에 부호가 다른 값든이 생기게 된다. 이 때문에 주엽이 작아지고 부엽이 커지는 것을 나타내었다. 마이크로폰 배열의 길이가 길어지고 관심 영역이 넓어질수록 삼각형 함수의 개수가 많아지고, 이는 다수의 엽이 생성되는 것을 설명하였다.
제안하는 방법이 실제 경우에 적용이 가능한지를 알아볼 수 있도록 다수의 목소리 음원들을 사용하여 실험을 진행하였다. 진행된 실험에서의 관심 주파수 대역은 음성 대역으로 선정하였고, 각 스피커로부터 방사되는 음파가 마이크로폰 배열에 입사될 때 이것이 관심 주파수 대역 내에서 평면파로 간주하도록 마이크로폰 배열과 스피커 간의 거리, 마이크로폰 배열의 총 길이 및 인접 마이크로폰 사이의 간격을 선정했다. 가중치를 적용한 음압 신호를 컴퓨터 웨이브 파일로 생성하여 실제로 들어볼 수 있도록 하였다.
본 발명에서 제안하는 방법을 다음과 같은 실제의 경우에 적용할 수 있을 것이라 생각할 수 있다. 1) 다수의 사람이 대화를 하고 있는 상황에서 특정 사람든간의 대화를 잘 듣고 싶은 경우, 2) 연주회에서 무대의 중앙에 위치하는 솔로의 노래를 더 잘 듣고 싶은 경우, 그리고 3) 공간 상에 어떤 방향에서 어떤 소리가 전파되고 있는지를 알아보려는 경우 등에 적용할 수 있을 것이다.
향후에는 크게 3가지 측면에서 연구가 진행될 필요가 있다.
첫 번째, 본 발명에서는 평면파로 제한하여, 방위각(azimuth) 만을 고려하였다. 이를 평면파를 사용한다면 고도각(elevation) 도 동시에 고려하여 2차원 이상에 대해 추정하는 연구가 진행될 필요가 있다. 또, 구면파 모델로 범위를 확장하여, 각도의 범위를 영역으로 정하는 것이 아닌 실제로 어떤 면적을 가지는 범위를 영역으로 정하여 제안하는 방법을 적용하는 연구가 필요할 것이다.
차원과 관련하여 생각해보면 마이크로폰 배열 바뀔 필요가 있다. 선형 등간격 마이크로폰 배열은 방위각 만을 추정할 때 사용하였다. 만약 두 방향 혹은 한 지점을 추정할 경우에는 다양한 형태의 마이크로폰 배열, 예를 들어 비 등간격 선형 마이크로폰 배열, 원형 마이크로폰 배열, 십자형 마이크로폰 배열 등에 대해서도 적용하는 연구가 필요할 것이다.
두 번째, 본 발명에서는 음파가 입사하는 방향이 1개일 경우에 대해 추정하는 방법을 제안하였다. 하지만, 앞으로는 2개 이상의 음파가 동시에 입사하는 경우에 대해 이를 추정할 수 있는지 연구할 필요가 있다. 이 때에는 신호 대 잡음비(SNR, Signal to Noise Ratio)에 따라 음파의 입사 방향을 찾을 수 있는지, 2개 이상의 입사 방향을 동시에 찾을 수 있는지 등에 대해 고려할 수 있다. 혹은 동시에 추정하는 방법 외에도 음압 신호의 크기가 가장 큰 신호의 입사 방향을 추정한 뒤, 추정된 영역을 하나씩 제거해 나가는 방법으로 2개 이상의 음파에 대해 입사 방향을 추정할 수도 있을 것이다.
세 번째, 본 발명에서는 영역을 나누는 방법에 대해서는 구체적으로 예시하지 않았다. 즉, 전체 추정 공간이 있으면 이에 대해 항상 이등분을 하여 영역을 왼쪽과 오른쪽으로 구분하였다. 하지만, 향후에는 영역을 삼등분 이상으로 나눌 때에는 연산량이 어떻게 될지, 어떤 장단점이 있는지 등에 대해 연구가 가능할 것이다. 또, 와 같이 영역을 오버랩(overlap)해서 추정하는 방법도 가능하다.
이와 같이 구성된 본 발명의 영역 개념을 이용한 음파 입사 방향 추정 방법은 영역 관점에서 각 영역의 공간 평균 빔파워를 통하여 음파가 입사하는 방향의 범위를 추정함으로써, 본 발명의 기술적 과제를 해결할 수가 있다.
이상에서 설명한 본 발명의 바람직한 실시 예들은 기술적 과제를 해결하기 위해 개시된 것으로, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자(당업자)라면 본 발명의 사상과 범위 안에서 다양한 수정, 변경, 부가 등이 가능할 것이며, 이러한 수정 변경 등은 이하의 특허청구범위에 속하는 것으로 보아야 할 것이다.
Claims (13)
- (a) 복수의 마이크로폰을 배열하는 단계;
(b) 상기 복수의 마이크로폰 배열에 임의의 방향으로부터 적어도 하나 이상의 음압 신호가 입사되는 단계;
(c) 상기 음압 신호의 입사 방향을 추정하기 위하여, 음파의 입사 방향이 존재할 것이라고 추정되는 전체 영역을 적어도 두 영역 이상으로 등분하여 각 영역에서의 음압 신호, 가중치, 공간 평균 빔파워, 각각의 상대적인 크기를 비교하여 그 중 큰 값의 영역 내에 음파의 입사 방향이 존재한다고 추정하는 단계;
(d) 상기 음파의 입사 방향이 존재한다고 추정된 영역을 다시 적어도 두 영역 이상으로 등분하여 각 영역에서의 음압 신호, 가중치, 공간 평균 빔파워, 각각의 상대적인 크기를 비교하여 그 중 큰 값의 영역 내에 음파의 입사 방향이 존재한다고 추정하는 단계; 및
(e) 상기 (d) 단계의 상기 큰 값의 영역이 소정 범위 이하가 될 때까지 상기 (d) 단계를 반복 수행하여 상기 소정 범위 이하가 된 영역을 음파가 입사하는 방향의 범위로 추정하는 단계;
를 포함하는,
영역 개념을 이용한 음파 입사 방향 추정 방법.
- 제1항에 있어서,
상기 (e)단계에서 상기 소정 범위는,
지연-합 빔형성 방법으로부터 구하는 소정의 밴드 폭으로 상기 빔파워가 최대인 방향으로부터 빔파워가 절반인 방향까지의 범위인,
영역 개념을 이용한 음파 입사 방향 추정 방법.
- 제1항에 있어서,
상기 음파 입사 방향 추정 방법은,
상기 음파의 입사 방향이 존재한다고 추정된 관심 영역과 그 외의 비 관심 영역으로 구분되고, 상기 관심 영역 내의 공간 평균 빔파워를 최대로 하는 가중치를 구하는 음향 밝기 최대화 방법과, 상기 관심 영역과 비 관심 영역간의 공간 평균 빔파워 비를 최대화하는 가중치를 구하는 음향 대조 최대화 방법을 이용하여 영역 관점에서 공간 평균 빔파워를 산출하는,
영역 개념을 이용한 음파 입사 방향 추정 방법.
- 제5항에 있어서,
상기 가중치 벡터는 상기 관심 영역이 한 방향인 경우 상기 음향 밝기 최대화 방법에서 구해지고, 평면파 모델의 지연-합 빔형성 방법의 가중치 벡터와 같고,
상기 음향 대조 최대화 방법에서는 주파수와 인접 마이크로폰 사이의 간격에 따라 음향 밝기 최대화 방법과 같은 해를 가지는,
영역 개념을 이용한 음파 입사 방향 추정 방법.
- 제5항에 있어서,
상기 공간 평균 빔파워는 상기 관심 영역이 전체 영역인 경우 가중치 벡터로부터 구해지고, 주파수와 인접 마이크로폰 사이의 간격에 따라 바뀌는,
영역 개념을 이용한 음파 입사 방향 추정 방법.
- 제1항에 있어서,
상기 복수의 마이크로폰 배열에 음파가 입사될 때 관심 주파수 대역 내에서 평면파로 간주하도록 상기 마이크로폰 배열과 음원 간의 거리, 상기 마이크로폰 배열의 총 길이 및 인접 마이크로폰 사이의 간격을 결정하는,
영역 개념을 이용한 음파 입사 방향 추정 방법.
- 제1항에 있어서,
상기 복수의 마이크로폰 배열은,
선형 등간격, 비선형 등간격, 원형, 십자형을 포함한 배열 방법 중 어느 하나로 배열하는,
영역 개념을 이용한 음파 입사 방향 추정 방법.
- 제1항에 있어서,
상기 적어도 하나 이상의 음압 신호는,
단일 주파수 또는 사람의 음성, 음악을 포함한 특정 주파수 대역을 가지는 음원을 사용하는,
영역 개념을 이용한 음파 입사 방향 추정 방법.
- 제1항에 있어서,
상기 음파 입사 방향 추정 방법은,
다수의 사람이 대화를 하고 있는 상황에서 상기 (a) 내지 (e)단계를 통해 음파가 입사하는 방향의 범위를 추정하여 특정 사람들간의 대화만을 선별하여 들을 수 있는,
영역 개념을 이용한 음파 입사 방향 추정 방법.
- 제1항에 있어서,
상기 음파 입사 방향 추정 방법은,
음악회 또는 연주회에서 상기 (a) 내지 (e)단계를 통해 음파가 입사하는 방향의 범위를 추정하여 무대의 중앙에 위치한 솔로의 노래만을 선별하여 들을 수 있는,
영역 개념을 이용한 음파 입사 방향 추정 방법.
- 제1항에 있어서,
상기 음파 입사 방향 추정 방법은,
상기 (a) 내지 (e)단계를 통해 음파가 입사하는 방향의 범위를 추정하여 공간 상에 어떤 방향에서 어떤 소리가 전파되고 있는지를 알 수 있는,
영역 개념을 이용한 음파 입사 방향 추정 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120043702A KR101354960B1 (ko) | 2012-04-26 | 2012-04-26 | 영역 개념을 이용한 음파 입사 방향 추정 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120043702A KR101354960B1 (ko) | 2012-04-26 | 2012-04-26 | 영역 개념을 이용한 음파 입사 방향 추정 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20130120651A KR20130120651A (ko) | 2013-11-05 |
KR101354960B1 true KR101354960B1 (ko) | 2014-01-23 |
Family
ID=49851188
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020120043702A KR101354960B1 (ko) | 2012-04-26 | 2012-04-26 | 영역 개념을 이용한 음파 입사 방향 추정 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101354960B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9866968B2 (en) | 2015-12-09 | 2018-01-09 | Hyundai Motor Company | Microphone and manufacturing method of microphone |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102193570B1 (ko) * | 2015-10-29 | 2020-12-21 | 에스케이텔레콤 주식회사 | 빔 트레이닝 시간 단축을 위한 장치 및 방법 |
CN114675233A (zh) * | 2022-02-18 | 2022-06-28 | 西北工业大学太仓长三角研究院 | 一种基于增强型导波相控阵技术的声发射源定位方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050035562A (ko) * | 2003-10-13 | 2005-04-19 | 삼성전자주식회사 | 잡음에 강인한 화자위치 추정방법 및 장치와 이를 이용한카메라 제어시스템 |
KR20080070196A (ko) * | 2007-01-25 | 2008-07-30 | 한국과학기술연구원 | 음원위치-지연시간차 상관관계 역 추정에 의한 음원 방향검지 시스템 및 방법 |
KR20090038697A (ko) * | 2007-10-16 | 2009-04-21 | 한국전자통신연구원 | 음원 추적이 가능한 지능형 로봇 및 방법 |
KR20110075524A (ko) * | 2009-12-28 | 2011-07-06 | 주식회사 에스원 | 3d 음향 센서 시스템에서의 영역지정 방법 |
-
2012
- 2012-04-26 KR KR1020120043702A patent/KR101354960B1/ko not_active IP Right Cessation
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050035562A (ko) * | 2003-10-13 | 2005-04-19 | 삼성전자주식회사 | 잡음에 강인한 화자위치 추정방법 및 장치와 이를 이용한카메라 제어시스템 |
KR20080070196A (ko) * | 2007-01-25 | 2008-07-30 | 한국과학기술연구원 | 음원위치-지연시간차 상관관계 역 추정에 의한 음원 방향검지 시스템 및 방법 |
KR20090038697A (ko) * | 2007-10-16 | 2009-04-21 | 한국전자통신연구원 | 음원 추적이 가능한 지능형 로봇 및 방법 |
KR20110075524A (ko) * | 2009-12-28 | 2011-07-06 | 주식회사 에스원 | 3d 음향 센서 시스템에서의 영역지정 방법 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9866968B2 (en) | 2015-12-09 | 2018-01-09 | Hyundai Motor Company | Microphone and manufacturing method of microphone |
Also Published As
Publication number | Publication date |
---|---|
KR20130120651A (ko) | 2013-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Salvati et al. | Incoherent frequency fusion for broadband steered response power algorithms in noisy environments | |
CN108375763B (zh) | 一种应用于多声源环境的分频定位方法 | |
EP3210391B1 (en) | Reverberation estimator | |
Gunel et al. | Acoustic source separation of convolutive mixtures based on intensity vector statistics | |
JP6329296B2 (ja) | 収音装置 | |
Rafaely et al. | Speaker localization using direct path dominance test based on sound field directivity | |
JP2018063200A (ja) | 音源位置推定装置、音源位置推定方法、及びプログラム | |
Seo et al. | Impulsive sound source localization using peak and RMS estimation of the time-domain beamformer output | |
Poursheikhali et al. | Source localization in inhomogeneous underwater medium using sensor arrays: Received signal strength approach | |
Xia et al. | Noise reduction method for acoustic sensor arrays in underwater noise | |
Jung et al. | Compensation of inherent bias errors in using the three-dimensional acoustic intensimetry for sound source localization | |
KR101354960B1 (ko) | 영역 개념을 이용한 음파 입사 방향 추정 방법 | |
Saqib et al. | Estimation of acoustic echoes using expectation-maximization methods | |
Woo et al. | Precision enhancement in source localization using a double-module, three-dimensional acoustic intensity probe | |
Hu et al. | Decoupled direction-of-arrival estimations using relative harmonic coefficients | |
Frank et al. | Constant-beamwidth kronecker product beamforming with nonuniform planar arrays | |
Bouchard et al. | Beamforming with microphone arrays for directional sources | |
Svaizer et al. | Environment aware estimation of the orientation of acoustic sources using a line array | |
Koyano et al. | Infinite-dimensional SVD for revealing microphone array’s characteristics | |
Nagata et al. | Two-dimensional DOA estimation of sound sources based on weighted wiener gain exploiting two-directional microphones | |
Xue et al. | Noise robust direction of arrival estimation for speech source with weighted bispectrum spatial correlation matrix | |
US11830471B1 (en) | Surface augmented ray-based acoustic modeling | |
Sarabia et al. | Spatial LibriSpeech: An Augmented Dataset for Spatial Audio Learning | |
Brutti et al. | An environment aware ML estimation of acoustic radiation pattern with distributed microphone pairs | |
Chhetri et al. | On acoustic modeling for broadband beamforming |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20161227 Year of fee payment: 4 |
|
LAPS | Lapse due to unpaid annual fee |