KR101354960B1 - 영역 개념을 이용한 음파 입사 방향 추정 방법 - Google Patents

영역 개념을 이용한 음파 입사 방향 추정 방법 Download PDF

Info

Publication number
KR101354960B1
KR101354960B1 KR1020120043702A KR20120043702A KR101354960B1 KR 101354960 B1 KR101354960 B1 KR 101354960B1 KR 1020120043702 A KR1020120043702 A KR 1020120043702A KR 20120043702 A KR20120043702 A KR 20120043702A KR 101354960 B1 KR101354960 B1 KR 101354960B1
Authority
KR
South Korea
Prior art keywords
sound
region
beam power
interest
sound wave
Prior art date
Application number
KR1020120043702A
Other languages
English (en)
Other versions
KR20130120651A (ko
Inventor
김양한
이태웅
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020120043702A priority Critical patent/KR101354960B1/ko
Publication of KR20130120651A publication Critical patent/KR20130120651A/ko
Application granted granted Critical
Publication of KR101354960B1 publication Critical patent/KR101354960B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/802Systems for determining direction or deviation from predetermined direction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/8006Multi-channel systems specially adapted for direction-finding, i.e. having a single aerial system capable of giving simultaneous indications of the directions of different signals
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S3/00Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received
    • G01S3/80Direction-finders for determining the direction from which infrasonic, sonic, ultrasonic, or electromagnetic waves, or particle emission, not having a directional significance, are being received using ultrasonic, sonic or infrasonic waves
    • G01S3/801Details

Abstract

본 발명은 영역 개념을 이용한 음파 입사 방향 추정 방법에 관한 것으로, 사용자가 정의하는 전체 추정 공간을 영역으로 나누어 각 영역을 대표하는 모델을 얻고, 그 모델과 수신된 음압 신호와의 상관관계를 비교하는 과정을 반복 수행하는 방법을 통하여 기존의 방법보다 연산량을 줄일 수 있고, 음파의 입사 방향 혹은 음원이 존재하는 위치의 범위를 추정할 수 있다.
본 발명의 영역 개념을 이용한 음파 입사 방향 추정 방법은, (a) 복수의 마이크로폰을 배열하는 단계, (b) 상기 복수의 마이크로폰 배열에 임의의 방향으로부터 적어도 하나 이상의 음압 신호가 입사되는 단계, (c) 상기 음압 신호의 입사 방향을 추정하기 위하여 사용자가 정의한 전체 영역을 적어도 두 영역 이상으로 등분하여 각 영역에서의 음압 신호, 가중치, 공간 평균 빔파워, 각각의 상대적인 크기를 비교하여 그 중 큰 값의 영역 내에 음파의 입사 방향이 존재한다고 추정하는 단계, (d) 상기 음파의 입사 방향이 존재한다고 추정된 영역을 다시 적어도 두 영역 이상으로 등분하여 각 영역에서의 음압 신호, 가중치, 공간 평균 빔파워, 각각의 상대적인 크기를 비교하여 그 중 큰 값의 영역 내에 음파의 입사 방향이 존재한다고 추정하는 단계 및, (e) 상기 영역이 소정 범위 이하가 될 때까지 상기 (d) 단계를 반복 수행하여 상기 소정 범위 이하가 된 영역을 음파가 입사하는 방향의 범위로 추정하는 단계를 포함하고 있다.

Description

영역 개념을 이용한 음파 입사 방향 추정 방법{Method for an Estimation of Incident Wave Direction by Applying Regional Concept}
본 발명은 영역 개념을 이용한 음파 입사 방향 추정 방법에 관한 것으로, 보다 상세하게는 영역 관점에서 각 영역의 공간 평균 빔파워를 통하여 음파가 입사하는 방향의 범위를 추정하여 산술량을 줄일 수 있는 영역 개념을 이용한 음파 입사 방향 추정 방법에 관한 것이다.
인간은 소리가 들려올 때 그 방향을 대략적으로 파악할 수 있는데, 이는 왼쪽과 오른쪽 귀에 들려오는 시간 차이를 이용하여 추정하는 것으로 밝혀져 있다[18].
그 중 가장 대표적인 방법이 지연-합 빔형성 방법(delay-and-sum beamforming method)이다. 이 방법은 음파의 입사 방향 혹은 음원의 위치를 가정하고 미리 정한 분해능(resolution)에 맞게 후보 위치 혹은 후보 방향을 추정한다. 구체적으로는 마이크로폰 배열에 수신된 음압 신호와 가정한 모델에 근거한 신호와의 상관관계를 모든 후보 위치 혹은 방향에 대해 계산하여 음파의 입사 방향 혹은 음원의 위치를 추정한다. (도 2 참조) 따라서, 음파의 입사 방향 혹은 음원의 위치 추정에 대한 정확성은 분해능에 의하여 정해지는데, 분해능이 작아질수록 연산량이 증가한다. 상관관계가 가장 높은 지점을 음파의 입사 방향 혹은 음원의 위치로 추정할 때 그 주변 역시 추정 가능한 지점들이라고 생각할 수 있다. 즉, 음파의 입사 방향 혹은 음원의 위치가 어떤 범위 내에 존재할 것이라고 추정하는 방법도 생각해 볼 수 있다.
그렇다면 사용자가 정한 전체 추정 공간을 각 방향 혹은 지점으로 이산화(discretization)시켜 접근할 것이 아니라 이등분 혹은 그 이상으로 나누어 영역 관점(regional concept)에서 접근해 볼 수 있다. 이런 영역 개념으로 접근한다면 연산량을 줄이는 대신 음파가 입사하는 방향 혹은 음원의 위치를 어느 정도의 범위로 추정할 수 있을 것을 예상할 수 있다.
따라서, 본 발명에서는 사용자가 정의하는 전체 추정 공간을 영역으로 나누어 각 영역을 대표하는 모델을 얻고, 그 모델과 수신된 음압 신호와의 상관관계를 비교하는 과정을 반복 수행하는 방법을 제안한다. 이 반복 수행을 통하여 기존의 방법보다 연산량을 줄이고, 음파의 입사 방향 혹은 음원이 존재하는 위치의 범위를 추정하고자 한다.
빔형성 방법
음원의 위치 혹은 음파의 입사 방향 추정을 위한 신호처리(array signal processing)는 오래 전부터 발명 되어 왔으며, 높은 신호 대 잡음비(Signal to Noise Ratio, SNR)를 얻기 위해 노력하여 왔는데, 이것은 센서의 배열, 개수, 구경(array aperture) 등에 의하여 결정되는 것으로 알려져 있다(예를 들면, [4], [22], [40], [41], [43], [44]). 다수의 마이크로폰이 어떤 특정한 방향에 대해 원하는 신호 대 잡음비를 가질 수 있도록, 즉 원하는 지향성을 가질 수 있는 빔패턴 설계를 하는 연구가 주로 진행되어 왔다. 그 방법 중 실제 수신한 음압 신호와 음파 방정식을 통해 만들어진 모델링 신호를 상관(correlation)시켜 음원의 위치를 추정하는 방법이 있는데, 이를 정합장처리(MFP, Matched Field Processing)라고 하며 주로 수중 음향학(underwater acoustics)에서 발명가 진행되고 있다. 참고문헌 [1], [2], [5], [40], [41] 에서 다루고 있는 신호처리 방법은 얕은 바다(shallow water)에서 음속 및 매질의 변화, 해저면 및 해수면에 의한 반사와 산란 등에 의한 잡음의 영향을 감소시켜 신호 대 잡음비를 증가시켜 음원의 위치 추정, 특정 파라미터 도출 등을 하기 위해 연구되어 왔다.
정합장처리는 해양 도파관(waveguide)에서의 물리적인 음전달 구조를 고려하고 있어, 음원이 존재하는 방향뿐만 아니라 깊이와 거리도 추정이 가능하다. 이러한 점을 고려하여 정합장처리를 일반화된 빔형성 방법으로 부르는 경우도 있다([1], [2]).
도 3은 기존의 정합장 처리의 과정을 개략적으로 나타내고 있다. 음원으로부터 방사되어 센서 배열에 수신되는 음압 신호와 모델링 신호간의 상관 정도를 모든 추정 위치에 대해 계산한 뒤 그 상관관계 값이 가장 높은 위치를 음원 위치로 추정한다.
빔형성 방법은 크게 주파수 영역과 시간 영역에서의 빔형성 방법으로 나눈다. 주파수 영역 빔형성 방법은 특정 주파수 대역에서 큰 파워를 가지고 있는 음원의 위치 추정을 하는데 용이하나, 충격 신호와 같이 주파수가 광대역에 퍼져있는 경우에는 효과적으로 적용하기 어렵다. 반면, 시간 영역 빔형성 방법은 충격 신호와 같이 특정 시간대역에 에너지가 집중되어 있는 경우 용이하다. 대표적으로 지연-합 빔형성 방법(delay-and-sum beamforming method)을 사용해 평면파, 구면파 모델의 빔출력을 도출하는 알고리즘이 널리 알려져 있다. 이와 같이 빔형성 방법은 평면파 모델의 경우 스캔 함수(가중치 함수)가 음파의 입사 방향을 가리킬 때 주파수 영역에서는 빔파워가, 시간 영역에서는 빔출력이 최대이고, 그 때의 방향을 음파의 입사 방향으로 추정한다.
현재까지 진행된 빔형성 방법에 대한 연구를 크게 3가지 항목으로 분류하여 보면 다음과 같다.
첫 번째는 목적 함수를 가지고 그에 맞는 스캔 함수(가중치 함수)를 도출하여 빔패턴을 설계하는 방법에 관한 연구이다. 먼저, Dolph가 좁은 주엽(mainlobe)을 얻고, 각 부엽의 크기(sidelobe)를 같게 하여 신호 대 잡음비를 획득할 수 있도록 하는 Dolph-Chebeshev법을 제안하였다[17]. Chou는 4개의 옥타브 배열(octave-array)을 nested 배열(nested array)로 배치하여 주파수에 상관없이 동일한 주엽의 폭(Constant Directivity Beamformers, CDB)을 만드는 방법을 제안하였다[8]. Taylor, Cox 등은 원하는 방향에 대해서는 최대의 이득을 얻고, 그 외의 방향에서는 최소의 평균 이득을 가지도록 하는 슈퍼 지향성(super directivity)과 관련된 연구를 진행하였다[9], [39]. 그리고 Monzingo와 Miller는 특정 방향을 널(null)로 만들고, 원하는 방향을 최대로 만드는 최적해를 도출하는 방법을 연구하였다[30]. J. Capon 등은 센서 배열에 수신되는 음압 신호와 센서 배열과 특정 지점간의 전달 함수 사이의 빔파워를 최대로 하는 제한 조건(constraint)을 두고, 이를 만족하는 가중치를 구하는 방법을 제안하였다[6].
두 번째로는 주어진 마이크로폰 개수 및 배열이 있을 때, 이를 이용하여 실제보다 더 많은 마이크로폰을 사용하는 것과 같은 효과를 얻기 위한 연구이다. A. Cigada 등은 선형, 나선형, 오각형 마이크로폰 배열을 사용하여 이들을 회전시켜 공간상에 실제보다 더 많은 수의 센서가 있는 것과 같은 효과를 얻을 수 있도록 하는 연구를 진행하였다[14]. Doblinger는 마이크로폰 배열의 마이크로폰 개수가 정해져 있을 때 실제보다 마이크로폰이 더 많이 존재하는 것처럼 내삽법(interpolation)을 사용하여 빔파워 성능을 개선하는 연구를 하였다[15]. Stephen Orlando 등은 MEMS 마이크로폰 배열의 배치 및 보정(calibration) 방법과 이 배열을 사용한 음원의 위치 추정하는 방법을 연구하였다[32].
세 번째는 음압 신호와 스캔 함수(가중치 함수)를 사용하여 음파의 입사 방향 혹은 음원의 위치를 추정하는 방법에 관한 연구이다. Dirk Dobler 등은 마이크로폰 배열의 각 마이크로폰과 특정 위치간의 시간 지연을 각각 보상하여 그 위치에서 수신되는 음압 신호만을 제거하는 방법을 연구하였다[16]. Sasaki 등은 마이크로폰 배열이 가지는 빔패턴을 이용하여 특정 빔패턴의 주엽을 제거해 나가는 방식으로 음원의 위치를 추정하는 방법을 연구하였다[34].
이와 같이 제한 조건을 이용해 목적에 맞는 빔패턴을 얻고, 이를 이용하여 음파의 입사 방향 혹은 음원의 위치를 추정하는 것과 같이 다양한 빔형성 방법이 연구되어 왔고, 현재도 진행 중에 있다. 그러나 이는 한 후보 방향 혹은 한 후보 지점에 대해 빔파워를 구해 이들의 대소를 비교하는 방법이었다.
하지만, 기존에는 영역 관점에서 음파의 입사 방향을 추정하는 연구가 진행되지 않고 있다. 본 발명에서는 어떻게 영역 개념을 사용하여 음파의 입사 방향을 추정할 것인가 보이고, 그로부터 기존의 방법보다 어떤 장점을 갖는지를 밝히고자 한다.
그렇다면 기존에 진행된 연구 중 영역 개념을 사용한 연구가 어떤 것이 있는가 알아볼 필요가 있다. 영역 개념을 사용한 연구는 음향학적으로 밝은 공간과 어두운 공간을 제어하는 연구가 있다. 이 연구는 마이크로폰이 아닌 스피커와 관련되어 있지만, 음향학적 상반성을 생각해보면 본 발명을 진행하는 데에 이 내용이 고려될 필요가 있는 것을 알 수 있다.
음향학적으로 밝은 공간과 어두운 공간 제어 이론
최와 김이 제안한 음향학적으로 밝은 공간과 어두운 공간 제어 이론은 관심 공간상에 원하는 음장을 형성하기 위한 다수의 음원 제어 방법을 Rayleigh 몫(Rayleigh quotient)의 개념을 도입하여 제안하고, 그것이 이론적으로 가능함을 증명하고 있다([11], [12], [13]). 이 때, 관심 공간이라는 것은 제어하려는 공간을 의미하고, 관심 공간에 소리를 크게 들을 수 있는 공간과 그렇지 않은 공간을 동시에 형성하는 것을 가능하게 한다. 지금까지 수행된 발명를 통하여 1) 관심 공간에 음향 포텐셜 에너지 밀도를 최대로 하는 목적 함수, 2) 임의의 공간 상에 존재하는 두 공간간의 음향 포텐셜 에너지 밀도 비를 목적 함수로 정의하고 이를 제어하는 것이 가능하다는 것을 증명하고 이론적 근거를 정립하였다. 여기서 다른 공간보다 높은 음향 포텐셜 에너지 밀도를 가지는 공간을 음향학적으로 밝은 공간(acoustically bright zone), 다른 공간보다 낮은 음향 포텐셜 에너지 밀도를 가지는 공간을 음향학적으로 어두운 공간(acoustically dark zone)이라고 정의하고 있다. 위에 언급한 두 가지 목적 함수를 얻기 위해 최적화 문제로 정식화함으로써 다수의 음원에 입력되는 최적해를 이론적으로 제시하였다. 이외에도 개인 음향 공간 형성에 관한 발명([7], [26]), 다채널 스피커 시스템을 이용한 밝은 공간 형성에 관한 발명([27], [51], [52])도 정립된 이론을 응용한 예로써 진행되고 발표된 바 있다.
따라서, 본 발명에서는 음향학적 상반성(acoustical reciprocity)을 이용하여 위와 같은 이론을 다수의 스피커가 아닌 마이크로폰 배열에 적용시켜 최적해를 도출하고자 한다.
미국 등록특허 등록번호 제2,043,416호 미국 등록특허 등록번호 제5,802,190호 미국 등록특허 등록번호 제5,910,990호
[1] Arthur B. Baggeroer, William A. Kuperman, and Henrik Schmidt. (1988). "Matched field processing: Source localization in correlated noise as an optimum pa-rameter estimation problem." J. Acoust. Soc. Am., 83(2), pp. 571∼587. [2] Arthur B. Baggeroer, William A. Kuperman, and Peter N. Mikhalevsky. (1993). "An Overview of Matched Field Methods in Ocean Acoustics." IEEE Journal of Oceanic Engineering, 18(4), pp. 401∼424. [3] Julius S. Bendat and Allan G. Piersol. (2000). Random data, John & Wiley Sons, pp. 357∼359. [4] M. Brandstein and D. Ward et al. (2001). Microphone Arrays, Springer, Berlin, pp. 3∼17. [5] H. P. Bucker (1976). "Use of calculated sound fields and matched-field detection to locate sound sources in shallow water." J. Acoust. Soc. Am., 59, pp. 363∼373. [6] J. Capon. (1967). "Multidimensional maximum-likelihood processing of a large aperture seismic array." Proc. IEEE, Vol. 55, pp. 192∼211. [7] Ji-Ho Chang, Chan-Hui Lee, Jin-Young Park, and Yang-Hann Kim. (2009). "A realization of sound focused personal audio system using acoustic contrast control." J. Acoust. Soc. Am., 125(4), pp. 2091∼2097. [8] T. Chou. (1995). "Frequency-independent beamformer with low response error." Proc. IEEE Int. Conf. Acoust., Speech, Signal Processing (ICASSP-95), Detroit, USA, pp. 2995∼2998. [9] H. Cox, R. Zeskind, and T. Kooij. (1986). "Practical supergain." IEEE Transac-tions on Acoustics, Speech and Signal Processing, ASSP-34, pp. 393∼397. [10] Jae-Woong Choi. (2000). "Review on beamforming method and its application on vehicle noise identification." First workshop on vehicle noise visualization and identification. [11] J.-W. Choi. (2001). "A study on the generation of acoustically bright zone", M.S. Thesis, Korea Advanced Institute of Science and Technology, Daejeon, Repub-lic of Korea. [12] J.-W. Choi, Y.-H. Kim. (2002). "Generation of an acoustically bright zone with an illuminated region using multiple sources." J. Acoust. Soc. Am., 111(4), pp. 1695∼1700. [13] J.-W. Choi. (2005). "Spatial Manipulation and Implementation of Sound", Ph.D. Dissertation, Korea Advanced Institute of Science and Technology, Daejeon, Repub-lic of Korea. [14] Alfredo Cigada, Massimiliano Lurati, Francesco Ripamonti, and Marcello Vana-li. (2008). "Moving microphone arrays to reduce spatial aliasing in the beamforming technique: Theoretical background and numerical investigation." J. Acoust. Soc. Am., 124(6), pp. 3648∼3658. [15] Gerhard Doblinger. (2008). "Beamforming with optimized interpolated micro-phone arrays." Proc. IEEE HSCMA 2008, pp. 33∼36. [16] Dirk Dobler, Ralf Schroder, and Gunnar Heilmann. (2010). "Successive deletion of main sources in acoustic maps working in the time domain." Proceedings of Inter Noise 2010, Lisbon, Portugal. [17] C. L. Dolph. (1946). "A Current Distribution for Broadside Arrays Which Op-timizes the Relationship between Beam Width and Side-lobe Level." Proc. IRE, vol. 34, pp. 335∼348. [18] W. E. Feddersen et al. (1957). "Localization of High-Frequency Tones." J Acoust. Soc. Am, 29(9), pp. 988∼991. [19] Gene H. Golub and Charles F. Van Loan. (1996). Matrix computations, The Johns Hopkins University Press, pp. 391∼413. [20] Edward T. Hall. 정태진 역. (1980). 沈默의 言語, 探求堂, 서울, pp. 215∼245. [21] Hyun Jo, Youngjin Park, and Youn-sik Park. (2010). "A sound telescope: a con-trol of zone of interest." Proceedings of International Congress on Acoustics 2010, Sydney, Australia. [22] Don H. Johnson and Dan E. Dudgeon. (1993). Array Signal Processing: Con-cepts and techniques, Prentice Hall, pp. 77∼110. [23] K.-H. Kim. (2010). "Noise source localization using comparison between candi-date signal and beamformer output in time domain", M.S. Thesis, Korea Advanced Institute of Science and Technology, Daejeon, Republic of Korea. [24] Yang-Hann Kim. (2010). Sound propagation: An Impedance Based Approach, John & Wiley Sons, Singapore, pp. 188∼196. [25] Erwin Kreyzig. (1999). Advanced engineering mathematics, John Wiley & Sons, Chapter 4. [26] C.-H. Lee. (2008). "A practical realization of personal audio system by applying acoustic contrast control with loudspeaker array", M.S. Thesis, Korea Advanced In-stitute of Science and Technology, Daejeon, Republic of Korea. [27] Jung-Min Lee, Tae-Woong Lee, Jin-young Park, and Yang-Hann Kim. (2010). "Generation of a private listening zone; acoustic parasol." Proceedings of Interna-tional Congress on Acoustics 2010, Sydney, Australia. [28] Iain McCowan. (2010). "Microphone array tutorial". Retrieved June 16, 2011, from Web site: http://www.idiap.ch/~mccowan/arrays/arrays/tutorial.html [29] Leonard Meirovitch. (1997). Principles and Techniques of Vibrations, Prentice Hall, pp. 171∼183. [30] R. A. Monzingo and T. W. Miller. (2004). Introduction to Adaptive Arrays, John & Wiley Sons, pp.89∼101. [31] Thomas J. Mueller. (2002). Aeroacoustic measurements, Springer-Verlag: Ber-lin, pp.114∼128. [32] Stephen Orlando, Adam Bale, and David Johnson. (2010). "Design and prelimi-nary testing of a MEMS microphone phased array." Berlin Beamforming Conference, Berlin, Germany. [33] Shahid U. H. Qureshi. (1985). "Adaptive Equalization." Proceedings of the IEEE, 73(9), pp. 1349∼1361. [34] Yoko Sasaki, Satoshi Kagami, and Hiroshi Mizoguchi. (2007). "Main-lobe canceling method for multiple sound sources localization on mobile robot." Ad-vanced intelligent mechatronics 2007 IEEE/ASME international conference, Zurich, Swiss. [35] D.-H. Seo. (2010). "Impulsive sound source localization using delay and sum beamforming method in time domain., M.S. Thesis, Korea Advanced Institute of Science and Technology, Daejeon, Republic of Korea. [36] K.-C. Shin and J.S. Kim. (2005). "Matched field processing with contrast max-imization." J. Acoust. Soc. Am., 118(3), pp. 1526∼1533. [37] Merrill I. Skolnik. (1970). Radar Handbook, McGraw-Hill, NewYork, pp. 9-7∼9-9. [38] Warren L. Stutzman and Gary A. Thiele. 윤영중 외 5인 역. (2000). 안테나 이론과 설계, 교보문고, 서울, pp. 17∼82. [39] R. Taylor and G. Dailey. (1992). "The super-directional acoustic sensor." in Proceedings of OCEANS’92 Mastering the Oceans through Technology, vol. 35, pp. 1365∼1376. [40] Alexandra Tolstoy. (1993). Matched Field Processing for Underwater Acous-tics, World Scientific, Singapore, pp. 1∼47. [41] Alexandra Tolstoy. (2000). "Applications of matched-field processing to inverse problems in underwater acoustics." Inverse Problems, 16, pp. 1655∼1666. [42] Lloyd N. Trefethen and David Bau, III. (1997). Numerical linear algebra, So-ciety for Industrial and Applied Mathematics, Philadelphia, pp. 190∼240. [43] Harry L. van Trees. (2002). Optimum Array Processing, John Wiley & Sons, Inc., NewYork, pp. 1∼89. [44] B. D. VanVeen and K. M. Buckley. (1988). "Beamforming: A versatile ap-proach to spatial filtering." IEEE Trans. Acoust., Speech, Signal Process., 5, pp. 4∼24. [45] 김문언. (2005). 기계공학에서의 응용수학 I. 선형대수, 한국과학기술원 기계공학과, 대전, 제6장. [46] 김승일, 양정석. (2007). Array Signal Processing, 토파민, 서울, 2장. [47] 김신성, 성대선. (2010), KBS 한국어능력시험, 시대고시, 서울. [48] 김양한, 최영철, 김시문, 남경욱. (2001). "빔형성 방법을 이용한 캐비테이션 터널 내의 소음원 규명." 한국과학기술원 소음진동 발명센터. [49] 김양한, 서대훈, 박춘수, 전종훈. (2009). "외부 음향 정보 탐지/분석 기술 발명 단계 발명 결과 보고서." 한국과학기술원 소음진동 발명센터. [50] 손권, 최윤호, 김철 공역. (2008). 응용 수치해석, McGraw-Hill Korea, 서울, pp. 142∼149. [51] 이태웅, 장지호, 이정민, 강동수, 김양한. (2009). "음장 제어 실험을 위한 32채널 스피커 시스템 구성." 한국소음진동공학회 2009년도 추계학술대회 논문집, pp. 868∼869. [52] 장지호, 송민호, 박진영, 김양한. (2009). "32채널 스피커 시스템을 이용한 소리공 형성." 한국소음진동공학회 2009년도 추계학술대회 논문집, pp. 866∼867. [53] 정보통신 용어집. (2010), Retrieved June 16, 2011, from Web site: http://word.tta.or.kr/index.jsp [54] 한국교육과정평가원. (2010). "2011년도 대학수학능력시험 언어영역 듣기평가." 한국교육과정평가원, 서울.
전술한 문제점을 해결하기 위하여 본 발명이 이루고자 하는 기술적 과제는, 영역 관점에서 음파가 입사하는 방향의 범위를 추정하는 영역 개념을 이용한 음파 입사 방향 추정 방법을 제시하는 데 있다.
또한, 본 발명이 이루고자 하는 다른 기술적 과제는, 음파가 입사하는 방향의 범위를 추정하여 기존의 방법에 비해 연산량을 줄일 수 있는 영역 개념을 이용한 음파 입사 방향 추정 방법을 제시하는 데 있다.
또한, 본 발명이 이루고자 하는 또 다른 기술적 과제는, 사용자가 정의하는 전체 추정 공간을 영역으로 나누어 각 영역을 대표하는 모델을 얻고, 그 모델과 수신된 음압 신호와의 상관관계를 비교하는 과정을 반복 수행하는 방법을 통하여 기존의 방법보다 연산량을 줄이고, 음파의 입사 방향 혹은 음원이 존재하는 위치의 범위를 추정하는 영역 개념을 이용한 음파 입사 방향 추정 방법을 제시하는 데 있다.
또한, 본 발명이 이루고자 하는 또 다른 기술적 과제는, 관심 영역 내의 공간 평균 빔파워를 최대로 하는 가중치를 구하는 음향 밝기 최대화 방법과, 관심 영역과 비 관심 영역간의 공간 평균 빔파워 비를 최대화하는 가중치를 구하는 음향 대조 최대화 방법을 이용하여 영역 관점에서 공간 평균 빔파워를 산출하는 영역 개념을 이용하여 음파가 입사하는 방향을 추정하는 영역 개념을 이용한 음파 입사 방향 추정 방법을 제시하는 데 있다.
본 발명의 해결과제는 이상에서 언급된 것들에 한정되지 않으며, 언급되지 아니한 다른 해결과제들은 아래의 기재로부터 당업자에게 명확하게 이해되어 질 수 있을 것이다.
전술한 기술적 과제를 해결하기 위한 수단으로서, 본 발명에 의한 영역 개념을 이용한 음파 입사 방향 추정 방법은, (a) 복수의 마이크로폰을 배열하는 단계, (b) 상기 복수의 마이크로폰 배열에 임의의 방향으로부터 적어도 하나 이상의 음압 신호가 입사되는 단계, (c) 상기 음압 신호의 입사 방향을 추정하기 위하여, 음파의 입사 방향이 존재할 것이라고 추정되는 전체 영역을 적어도 두 영역 이상으로 등분하여 각 영역에서의 음압 신호, 가중치, 공간 평균 빔파워, 각각의 상대적인 크기를 비교하여 그 중 큰 값의 영역 내에 음파의 입사 방향이 존재한다고 추정하는 단계, (d) 상기 음파의 입사 방향이 존재한다고 추정된 영역을 다시 적어도 두 영역 이상으로 등분하여 각 영역에서의 음압 신호, 가중치, 공간 평균 빔파워, 각각의 상대적인 크기를 비교하여 그 중 큰 값의 영역 내에 음파의 입사 방향이 존재한다고 추정하는 단계 및, (e) 상기 (d) 단계의 상기 큰 값의 영역이 소정 범위 이하가 될 때까지 상기 (d) 단계를 반복 수행하여 상기 소정 범위 이하가 된 영역을 음파가 입사하는 방향의 범위로 추정하는 단계를 포함하여 구성될 수 있다.
상기 가중치는 각 마이크로폰에 수신되는 음압 신호간의 시간 지연 및 음압 신호의 크기를 동시에 조절하는 값이 되고, 상기 가중치는, 인접 마이크로폰 사이의 간격(
Figure 112012033351484-pat00001
), 마이크로폰의 총 개수(
Figure 112012033351484-pat00002
), 영역의 범위(
Figure 112012033351484-pat00003
), 대표 방향(
Figure 112012033351484-pat00004
), 주파수(
Figure 112012033351484-pat00005
)와 관련이 있을 수 있다.
상기 공간 평균 빔파워는 등분된 영역에서 마이크로폰에 수신되는 음압 신호의 세기가 되고, 상기 음압 신호의 방위각(
Figure 112012033351484-pat00006
), 대표 방향(
Figure 112012033351484-pat00007
), 음압 신호 벡터(
Figure 112012033351484-pat00008
), 가중치(
Figure 112012033351484-pat00009
)와 관련이 있을 수 있다.
상기 (e)단계에서 상기 소정 범위는, 지연-합 빔형성 방법으로부터 구하는 소정의 밴드 폭으로 상기 빔파워가 최대인 방향으로부터 빔파워가 절반인 방향까지의 범위일 수 있다.
상기 음파 입사 방향 추정 방법은, 상기 음파의 입사 방향이 존재한다고 추정된 관심 영역과 그 외의 비 관심 영역으로 구분되고, 상기 관심 영역 내의 공간 평균 빔파워를 최대로 하는 가중치를 구하는 음향 밝기 최대화 방법과, 상기 관심 영역과 비 관심 영역간의 공간 평균 빔파워 비를 최대화하는 가중치를 구하는 음향 대조 최대화 방법을 이용하여 영역 관점에서 공간 평균 빔파워를 산출할 수 있다.
상기 가중치 벡터는 상기 관심 영역이 한 방향인 경우 상기 음향 밝기 최대화 방법에서 구해지고, 평면파 모델의 지연-합 빔형성 방법의 가중치 벡터와 같고, 상기 음향 대조 최대화 방법에서는 주파수와 인접 마이크로폰 사이의 간격에 따라 음향 밝기 최대화 방법과 같은 해를 가질 수 있다.
상기 공간 평균 빔파워는 상기 관심 영역이 전체 영역인 경우 가중치 벡터로부터 구해지고, 주파수와 인접 마이크로폰 사이의 간격에 따라 바뀔 수 있다.
상기 복수의 마이크로폰 배열에 음파가 입사될 때 관심 주파수 대역 내에서 평면파로 간주하도록 상기 마이크로폰 배열과 음원 간의 거리, 상기 마이크로폰 배열의 총 길이 및 인접 마이크로폰 사이의 간격을 결정할 수 있다.
상기 복수의 마이크로폰 배열은, 선형 등간격, 비선형 등간격, 원형, 십자형을 포함한 배열 방법 중 어느 하나로 배열할 수 있다.
상기 음파 입사 방향 추정 방법은, 상기 (c) 및 (d)단계에서 두 영역 이상으로 나눈 영역을 오버랩(overlap)해서 추정할 수 있다.
상기 적어도 하나 이상의 음압 신호는, 단일 주파수 또는 사람의 음성, 음악을 포함한 특정 주파수 대역을 가지는 음원을 사용할 수 있다.
상기 음파 입사 방향 추정 방법은, 다수의 사람이 대화를 하고 있는 상황에서 상기 (a) 내지 (e)단계를 통해 음파가 입사하는 방향의 범위를 추정하여 특정 사람들간의 대화만을 선별하여 들을 수 있다.
상기 음파 입사 방향 추정 방법은, 음악회 또는 연주회에서 상기 (a) 내지 (e)단계를 통해 음파가 입사하는 방향의 범위를 추정하여 무대의 중앙에 위치한 솔로의 노래만을 선별하여 들을 수 있다.
상기 음파 입사 방향 추정 방법은, 상기 (a) 내지 (e)단계를 통해 음파가 입사하는 방향의 범위를 추정하여 공간 상에 어떤 방향에서 어떤 소리가 전파되고 있는지를 알 수 있다.
본 발명에 따르면, 영역 관점에서 음파가 입사하는 방향의 범위를 추정함으로써 기존의 방법에 비해 연산량을 크게 줄일 수 있다.
또한, 사용자가 정의하는 전체 추정 공간을 영역으로 나누어 각 영역을 대표하는 모델을 얻고, 그 모델과 수신된 음압 신호와의 상관관계를 비교하는 과정을 반복 수행하는 방법을 통하여 기존의 방법보다 연산량을 줄일 수 있고, 음파의 입사 방향 혹은 음원이 존재하는 위치의 범위를 추정할 수 있다.
본 발명의 효과는 이상에서 언급된 것들에 한정되지 않으며, 언급되지 아니한 다른 효과들은 아래의 기재로부터 당업자에게 명확하게 이해되어 질 수 있을 것이다.
도 1은 기존의 지연-합 빔형성 방법에 대한 개념도
도 2는 기존의 지연-합 빔형성 방법으로 음파의 입사 방향을 추정하는 방법에 대한 개념도
도 3은 기존의 정합장처리(MFP, Matched Field Processing)에서의 신호처리 과정을 나타낸 도면
도 4는 직교 좌표(Cartesian coordinate)와 구면 좌표(spherical coordinate)사이의 관계를 나타내는 도면
도 5는 마이크로 배열 및 영역에 대한 도면
도 6은 지연-합 빔형성 방법과 본 발명에서 가중치가 가지는 의미를 나타낸 도면
도 7은 마이크로폰 배열의 길이가
Figure 112012033351484-pat00010
일때 평면파 음원의 입사 방향을 나타낸 도면
도 8은 m개의 마이크로폰으로 평면파의 입사 방향을 나타낸 도면
도 9는
Figure 112012033351484-pat00011
방향에서 음파가 전파하는 경우의 빔파워 분포를 나타낸 도면
도 10은 저주파수, 고주파수에서의 주엽 폭(빔폭)에 대한 개념도
도 11은 관심 영역 및 비관심 영역과 각 변수들에 대해 나타낸 도면
도 12는 마이크로폰이 2개, 관심 영역이 전체 영역
Figure 112012033351484-pat00012
인 경우
Figure 112012033351484-pat00013
에 따라 구해지는 고유치를 나타낸 그래프
도 13은 마이크로폰이 3개, 관심 영역이 전체 영역
Figure 112012033351484-pat00014
인 경우에 구해지는 고유치를 나타낸 그래프
도 14는 이분법(bisection method)에 대한 개념도
도 15는 전체 영역에 대해 영역을 어떻게 표현하는 지를 나타내는 도면
도 16은 지연-합 빔형성 방법의 각도 분해능이 제안 방법의 영역의 범위와 같을 때 연산량 비교를 나타낸 도면
도 17은 지연-합 빔형성 방법과 제안 방법의 연산량을 나타낸 것으로, (a) 지연-합 빔형성 방법의 연산량, (b) 제안 방법의 첫 번째 수행에서 빔파워를 계산하는 횟수, (c) 제안 방법의 두 번째 수행에서 빔파워를 계산하는 횟수를 나타낸 도면
도 18은 영역을 사용하여 음파의 입사 방향을 추정하는 방법의 순서도
도 19는 영역을 사용하여 음파의 입사 방향을 추정하는 방법의 흐름도
도 20은 영역을 이용한 음파의 입사 방향 범위 추정의 각 수행단계를 나타낸 것으로. (a) 1번째 수행, (b) 2번째 수행, (c) 3번째 수행, (d) 4번째 수행, (e) 5번째 수행, (f) 6번째 수행, (g) 7번째 수행 단계를 나타낸 도면
도 21은 마이크로폰 배열로부터 구해지는 각 수행 단계에서의 빔패턴을 나타낸 것으로, (a) 1번째 수행 (b) 2번째 수행 (c) 3번째 수행 (d) 4번째 수행 (e) 5번째 수행 (f) 6번째 수행 (g) 7번째 수행 (h) 7번째 수행의 한 부분을 확대한 도면
도 22는 관심 영역이
Figure 112012033351484-pat00015
일 때 음향 밝기 최대화 방법으로 구해지는 빔패턴을 나타낸 도면
도 23은 관심 영역이
Figure 112012033351484-pat00016
일 때 음향 밝기 최대화 방법으로 구해지는 빔패턴을 나타낸 도면
도 24는 마이크로폰 사이 간격이 일정하지 않은 선형 마이크로폰 배열의 한 예를 나타낸 도면
도 25는 마이크로폰의 개수가 2개,
Figure 112012033351484-pat00017
일때, (a) 음향 밝기 최대화 방법에서의 가중치 벡터, (b) 음향 대조 최대화 방법에서의 가중치 벡터를 나타낸 도면
도 26은 마이크로폰의 개수가 2개,
Figure 112012033351484-pat00018
일때, (a) 음향 밝기 최대화 방법에서의 가중치 벡터, (b) 음향 대조 최대화 방법에서의 가중치 벡터, (c) 각 방법으로부터 얻어지는 빔파워로, 최대값으로 정규화한 도면
도 27은 마이크로폰의 개수가 2개,
Figure 112012033351484-pat00019
일때 음향 밝기 최대화 방법에서 구해지는 빔파워 형태와 고유치를 나타낸 것으로, (a) 음향 밝기를 최대로 하는 고유치를 선정할 때 나타나는 빔파워의 형태로, 최대값으로 정규화, (b) 음향 밝기를 하나의 고유치만으로 선정할 때 나타나는 빔파워의 형태로, 최대값으로 정규화한 도면
도 28은 마이크로폰의 개수가 2개,
Figure 112012033351484-pat00020
일때 음향 밝기 최대화 방법에서 구해지는 빔파워 형태와 고유치를 나타낸 것으로, (a) 음향 밝기를 최대로 하는 고유치를 선정할 때 나타나는 빔파워의 형태로, 최대값으로 정규화, (b) 음향 밝기를 하나의 고유치만으로 선정할 때 나타나는 빔파워의 형태로, 최대값으로 정규화한 도면
도 29는 마이크로폰의 개수가 3개,
Figure 112012033351484-pat00021
일때 각 방법에서 구해지는 가중치 벡터로, (a) 음향 밝기 최대화 방법에서의 가중치 벡터, (b) 음향 대조 최대화 방법에서의 가중치 벡터, (c) 각 방법으로부터 얻어지는 빔파워로, 최대값으로 정규화한 도면
도 30은 관심 영역이 변함에 따라 나타나는 가중치 벡터의 가운데와 양 끝간의 차이를 나타낸 도면
도 31은 마이크로폰의 개수가 9개,
Figure 112012033351484-pat00022
,
Figure 112012033351484-pat00023
일때, 각 방법에서 구해지는 가중치 벡터로, (a) 음향 밝기 최대화 방법에서의 가중치 벡터, (b) 음향 대조 최대화 방법에서의 가중치 벡터, (c) 각 방법으로부터 얻어지는 빔파워로, 최대값으로 정규화한 도면
도 32는 마이크로폰의 개수가 9개,
Figure 112012033351484-pat00024
,
Figure 112012033351484-pat00025
일때 각 방법에서 구해지는 가중치 벡터로, (a) 관심 영역이 넓어질 때 음향 밝기를 최대로 하는 고유치를 선정할 때 나타나는 빔파워, (b)
Figure 112012033351484-pat00026
일 때 나타나는 각 방법에서의 빔파워로, 최대값으로 정규화한 도면
도 33은 마이크로폰의 개수가 2개,
Figure 112012033351484-pat00027
,
Figure 112012033351484-pat00028
일 때 각 방법에서 구해지는 가중치 벡터로서, (a) 음향 밝기 최대화 방법에서의 가중치 벡터, (b) 음향 대조 최대화 방법에서의 가중치 벡터, (c) 각 방법으로부터 얻어지는 빔파워로, 최대값으로 정규화한 도면
도 34는 마이크로폰의 개수가 3개,
Figure 112012033351484-pat00029
,
Figure 112012033351484-pat00030
일 때 각 방법에서 구해지는 가중치 벡터로, (a) 음향 밝기 최대화 방법에서의 가중치 벡터, (b) 음향 대조 최대화 방법에서의 가중치 벡터, (c) 각 방법으로부터 얻어지는 빔파워로, 최대값으로 정규화한 도면
도 34는 마이크로폰의 개수가 9개,
Figure 112012033351484-pat00031
일때 각 방법에서 구해지는 가중치 벡터로, (a) 음향 밝기 최대화 방법에서의 가중치 벡터, (b) 음향 대조 최대화 방법에서의 가중치 벡터, (c) 각 방법으로부터 얻어지는 빔파워로, 최대값으로 정규화한 도면
도 36은 실험 장치의 구성도
도 37은 무향실 외부에 설치된 실험 장치의 사진
도 38은 무향실 내부에 설치된 스피커와 마이크로폰 배열을 나타낸 사진
도 39는 마이크로폰 배열을 나타낸 사진
도 40은 선정한 변수들을 나타낸 도면
도 41은 지연-합 빔형성 방법을 이용하여 구한 빔파워 분포로서, 주파수
Figure 112012033351484-pat00032
, 마이크로폰 개수 7개, 각 마이크로폰 사이 간격
Figure 112012033351484-pat00033
, 음파의 입사 추정 방향
Figure 112012033351484-pat00034
을 나타낸 도면
도 42는 영역을 이용한 음파의 입사 방향 범위 추정의 각 수행단계로서, (a) 1번째 수행
Figure 112012033351484-pat00035
, (b) 2번째 수행
Figure 112012033351484-pat00036
, (c) 3번째 수행
Figure 112012033351484-pat00037
, (d) 4번째 수행
Figure 112012033351484-pat00038
, (e) 5번째 수행
Figure 112012033351484-pat00039
, (f) 6번째 수행
Figure 112012033351484-pat00040
, (g) 7번째 수행
Figure 112012033351484-pat00041
이고, 주파수
Figure 112012033351484-pat00042
, 마이크로폰 개수 7개, 각 마이크로폰 사이 간격
Figure 112012033351484-pat00043
, 음파가 입사하는 방향의 추정 범위를 나타낸 도면
도 43은 딸의 신호를 나타낸 것으로, (a) 스팩트로그램, (b) 시간 영역 신호를 나타낸 도면
도 44는 아버지의 신호를 나타낸 것으로, (a) 스팩트로그램, (b) 시간 영역 신호를 나타낸 도면
도 45는 남자 아나운서의 신호를 나타낸 것으로, (a) 스팩트로그램, (b) 시간 영역 신호를 나타낸 도면
도 46은 할아버지의 신호를 나타낸 것으로, (a) 스팩트로그램, (b) 시간 영역 신호를 나타낸 도면
도 47은 손자의 신호를 나타낸 것으로, (a) 스팩트로그램, (b) 시간 영역 신호를 나타낸 도면
도 48은 각 음원의 분포 위치를 나타낸 도면
도 49는 2000 Hz 에서의 각 방법이 가지는 가중치 벡터를 나타낸 도면
도 50은 2000 Hz에서의 각 방법에서 구해지는 빔파워를 나타낸 도면
도 51은 2500 Hz 에서의 각 방법이 가지는 가중치 벡터를 나타낸 도면
도 52는 2500 Hz에서의 각 방법에서 구해지는 빔파워를 나타낸 도면
도 53은 3000 Hz 에서의 각 방법이 가지는 가중치 벡터를 나타낸 도면
도 54는 3000 Hz에서의 각 방법에서 구해지는 빔파워를 나타낸 도면
도 55는 2000 Hz 에서의 각 방법이 가지는 가중치 벡터를 나타낸 도면
도 56은 2000 Hz에서의 각 방법에서 구해지는 빔파워를 나타낸 도면
도 57은 2500 Hz 에서의 각 방법이 가지는 가중치 벡터를 나타낸 도면
도 58은 2500 Hz에서의 각 방법에서 구해지는 빔파워를 나타낸 도면
도 59는 3000 Hz 에서의 각 방법이 가지는 가중치 벡터를 나타낸 도면
도 60은 3000 Hz에서의 각 방법에서 구해지는 빔파워를 나타낸 도면
도 61은 관심 주파수 대역만을 가지고 있는 신호(마이크로폰 배열의 중앙에 위치한 마이크로폰으로부터의 신호)를 나타낸 도면
도 62는 관심 영역이
Figure 112012033351484-pat00044
인 경우의 각 방법을 적용한 시간 영역 신호(아버지와 딸의 대화)를 나타낸 도면
도 63은 관심 영역이
Figure 112012033351484-pat00045
인 경우의 각 방법을 적용한 시간 영역 신호(남자 아나운서의 뉴스 대본)을 나타낸 도면
도 64는 관심 영역이
Figure 112012033351484-pat00046
인 경우의 각 방법을 적용한 시간 영역 신호(할아버지와 손자의 대화)를 나타낸 도면
도 65는 분해능 지표를 나타낸 것으로,
Figure 112012033351484-pat00047
는 3dB 밴드 폭,
Figure 112012033351484-pat00048
은 최대 부엽 레벨,
Figure 112012033351484-pat00049
는 최대 빔파워를 나타낸 도면
도 66은 실험시 스피커(source)와 마이크로폰 배열(ULA) 사이의 간격
Figure 112012033351484-pat00050
, 마이크로폰 배열의 총 길이
Figure 112012033351484-pat00051
를 나타낸 도면
도 67은 주파수가
Figure 112012033351484-pat00052
일 때 마이크로폰 배열의 중앙과 양 끝에 위치한 마이크로폰 사이의 위상차를 나타낸 도면
도 68은 (a) 첫 번째 수행에서 가중치를 구하는 횟수, (b) 두 번째 수행에서 가중치를 구하는 횟수 각 수행 단계에서 가중치를 구하는 횟수를 나타낸 도면
도 69는
Figure 112012033351484-pat00053
일 때 지연-합 빔형성 방법으로 얻는 빔파워 분포로, 마이크로폰의 개수 7개, 마이크로폰 간격 5cm, 주파수
Figure 112012033351484-pat00054
일 경우를 나타낸 도면
도 70은
Figure 112012033351484-pat00055
일 때 제안 방법을 반복 수행하여 얻는 음파가 입사하는 방향의 범위를 추정한 것으로, (a) 1회 수행, (b) 2회 수행, (c) 3회 수행, (d) 4회 수행 결과를 나타낸 도면
도 71은
Figure 112012033351484-pat00056
일 때 지연-합 빔형성 방법으로 얻는 빔파워 분포로, 마이크로폰의 개수 7개, 마이크로폰 간격 5 cm, 주파수 1000 Hz일 경우의 도면
도 72는
Figure 112012033351484-pat00057
일 때 제안 방법을 반복 수행하여 얻은 음파가 입사하는 방향의 범위 추정으로, (a) 1회 수행, (b)는 2회 수행, (c)는 3회 수행, (d)는 4회 수행 결과를 나타낸 도면
도 73은 두 개 이상의 방향에서 음파가 입사하는 경우 제안 방법의 추정 과정에 관한 순서도
도 74는
Figure 112012033351484-pat00058
영역에서 각 수행 과정에서 추정하는 음파가 입사하는 방향의 범위로, (a) 1회 수행, (b) 2회 수행 결과를 나타낸 도면
도 75는
Figure 112012033351484-pat00059
영역에서 각 수행 과정에서 추정하는 음파가 입사하는 방향의 범위로, (a) 1회 수행, (b) 2회 수행 결과를 나타낸 도면
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시 예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명되는 실시 예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙여 설명하기로 한다.
이하, 본 발명에서 실시하고자 하는 구체적인 기술내용에 대해 첨부도면을 참조하여 상세하게 설명하기로 한다.
우선, 본 발명에서 다루는 조건에 대해 먼저 정의하기로 한다. 여기서 조건들이란 1) 좌표(coordinate), 2) 마이크로폰 배열(array configuration), 3) 영역(region), 4) 파면의 종류, 5) 가중치(weighting), 그리고 6) 고려하는 도메인(domain)을 포함할 수 있다.
먼저, 좌표를 정의하고 이를 통해 마이크로폰의 위치를 수식적으로 표현하여야 하는 것은 자명하다. 도 4는 직교 좌표(Cartesian coordinate)와 구면 좌표(spherical coordinate)사이의 관계를 나타내는 도면이다[43]. 즉, 3차원 공간의 좌표간 변환을 나타내는 것으로 직교 좌표에서의 x,y 그리고 z는 다음과 같이 표현된다.
Figure 112012033351484-pat00060
이 중 본 발명에서는
Figure 112012033351484-pat00061
인 경우인 xy 평면 내에서 마이크로폰 배열에 입사하는 음압 신호를 다루고자 한다. 이 경우를 해석적으로, 물리적으로 고찰하는 것을 기본으로 하여
Figure 112012033351484-pat00062
인 경우로 확장하기로 한다. 이 xy 평면 상에 존재할 수 있는 마이크로폰 배열은 무수히 많을 것이나 이 중 가장 기본적인 경우인 선형 등간격 마이크로폰 배열(ULA, Uniform Linear Array)만을 이 발명에서 다루고자 한다.(도 3 참조) 선형 등간격 마이크로폰 배열의 총 길이 L은 인접 마이크로폰 사이의 간격 d와 마이크로폰의 총 개수 M을 통해
Figure 112012033351484-pat00063
의 관계를 만족한다.
이 때, x축을 주축으로 하여
Figure 112012033351484-pat00064
를 정의하고, 음파가 마이크로폰 배열에 입사하는 경우 입사 각도는
Figure 112012033351484-pat00065
항으로 표현할 수 있다. 구체적인 사항은 뒤에서 자세하게 다루고 있다. 코사인(cosine)의 주기적인 특성에 따라
Figure 112012033351484-pat00066
Figure 112012033351484-pat00067
에서의 마이크로폰 배열의 각 마이크로폰에 수신되는 각 음압 신호의 절대적인 크기와 파형이 같다. 따라서
Figure 112012033351484-pat00068
을 전체 영역으로 고려하기로 한다.
본 발명에서는 영역(region)이라는 개념을 도입하는데, 이것은 관심 영역과 비 관심 영역으로 구분하기로 한다. 이 때, 관심영역이란 음파의 입사 방향을 추정하고자 하는 범위를 의미하고, 비 관심 영역이란 그 외의 범위를 의미한다. 여기서 관심 영역은
Figure 112012033351484-pat00069
로 표시하기로 한다. 하지만 어떤 방향을 기준으로 범위를 가지는 지에 따라 표현이 달라지므로 대표 방향을 설정할 필요가 있다. 그러므로 대표 방향(beam axis)을
Figure 112012033351484-pat00070
라는 기호로 표시하기로 한다. 그렇다면 관심 영역은 대표 방향
Figure 112012033351484-pat00071
를 중심으로
Figure 112012033351484-pat00072
의 범위를 갖는 각도의 범위
Figure 112012033351484-pat00073
로 표시할 수 있다. 비 관심 영역은 이 외의 범위로 표시한다.
만약, 마이크로폰 배열의 중앙에 위치하는 마이크로폰으로부터 음원이 충분히 멀리 떨어져 있다면, 음원으로부터 방사되는 음파는 마이크로폰 배열에 수신될 때 파면이 평면을 이룬다. 본 발명에서는 파면이 평면인 경우를 다루는데 이는 마이크로폰 배열에 수신되는 음압 신호를 해석적으로 고찰할 수 있다는 이점이 있기 때문이다. (Appendix B 참조)
이제 가중치(weighting)와 어떤 영역(domain)에 대해 고려할지 생각해 볼 필요가 있다. 먼저, 지연-합 빔형성 방법(delay and sum beamforming method)에서는 각 마이크로폰 간의 시간 지연만을 조절하여 신호 처리를 하는데 이 때의 시간 지연을 가중치로 볼 수 있다. 본 발명에서 가중치는 각 마이크로폰에 수신되는 음압 신호간의 시간 지연 및 음압 신호의 크기를 동시에 조절하는 값으로 정의한다.(도 4 참조)
그렇다면 이 가중치가 무엇에 관한 함수인지를 생각해 보아야 하는데, 위에서 언급한 1) 인접 마이크로폰 사이의 간격 d, 2) 마이크로폰의 총 개수 M, 3) 영역의 범위
Figure 112012033351484-pat00074
, 4) 대표 방향
Figure 112012033351484-pat00075
, 그리고 5) 주파수
Figure 112012033351484-pat00076
로 총 5 개의 독립 변수에 관한 것임을 생각할 수 있다. 그러므로 고려하는 주파수(혹은 파장)에 따라 가중치가 다른 값을 가질 것을 예상할 수 있으므로, 가중치를 구하기 위해서는 주파수 영역(frequency domain)에서 접근하는 것이 용이하다고 할 수 있다. 그리고 영역을 어떻게 정하는가에 따라서도 가중치가 다른 값을 가지므로 공간 영역(spatial domain)에서 접근할 필요가 있다. 즉, 주파수 영역과 공간 영역에서 가중치를 고찰하는 것이 필요하다.
1. 빔형성 방법
본 장에서는 주파수 영역에서의 지연-합 빔형성 방법을 소개하고 평면파 모델을 통해 빔형성 방법 및 사용하는 물리량이 가지는 물리적인 의미를 살펴보기로 한다. 다음으로 한 방향이 아닌 영역에 대한 것으로 그 적용 범위를 넓혀, 두 가지 제안 방법으로 가중치를 선정하는 내용을 다루고, 두 가지 방법에서 도출할 수 있는 각 가중치들을 단순한 경우에 대해 고찰하기로 한다. 이를 토대로 각 제안 방법으로부터 얻는 가중치를 사용하여 영역 관점에서 음파가 입사하는 방향을 어떻게 추정하는지 설명하고, 지연-합 빔형성 방법과의 비교를 통해 영역 관점으로 음파의 입사 방향 범위를 추정하는 것이 어떤 다른 점이 있는지를 고찰하기로 한다.
1.1 배경 발명
빔형성 방법(beamforming method)은 센서 배열(array sensor)을 사용하는 대표적인 신호처리 방법으로 수중음향, 지진파, 안테나, 그리고 레이더 등의 분야에서 평면파 모델을 기본으로 개발되어 왔다(예를 들면, [1], [44]). 아래의 내용은 평면파 모델을 사용하여 음파의 입사 방향을 추정하는 방법에 대한 설명이다.
도 7은 마이크로폰 배열의 길이가
Figure 112012033351484-pat00077
일때 평면파 음원의 입사 방향을 나타낸 것이다. 여기서,
Figure 112012033351484-pat00078
은 마이크로폰 배열의 길이, x는 마이크로폰 배열의 중심으로부터 임의의 거리만큼 떨어진 위치,
Figure 112012033351484-pat00079
는 평면파 음원의 입사 방향,
Figure 112012033351484-pat00080
는 주파수
Figure 112012033351484-pat00081
에서의 각주파수,
Figure 112012033351484-pat00082
는 음원의 크기,
Figure 112012033351484-pat00083
는 음원의 신호를 나타낸다.
도 7과 같이, 자유 음장에서 단일 주파수
Figure 112012033351484-pat00084
를 가지는 평면파가 전파되어 총 마이크로폰 배열의 길이가
Figure 112012033351484-pat00085
이고 마이크로폰 개수가 무한개인 연속적인 마이크로폰 배열에 입사되는 경우를 생각해 보기로 한다. 임의의 방향
Figure 112012033351484-pat00086
에서 전파되는 음압 신호가 임의의 시간 지연
Figure 112012033351484-pat00087
를 가지고 마이크로폰 배열의 중심
Figure 112012033351484-pat00088
에 입사되는 경우, 이는
Figure 112012033351484-pat00089
과 같이 나타낼 수 있다. 이 때 마이크로폰 배열의 중심
Figure 112012033351484-pat00090
에서 임의의 거리
Figure 112012033351484-pat00091
만큼 떨어진 위치에서 수신되는 음압 신호는 마이크로폰의 위치
Figure 112012033351484-pat00092
에 따라 평면파가 도달하는 데까지 걸리는 시간이 다르므로 임의의 시간 지연
Figure 112012033351484-pat00093
를 가진다. 이를
Figure 112012033351484-pat00094
로 표현할 수 있다. 여기서,
Figure 112012033351484-pat00095
는 음압의 크기,
Figure 112012033351484-pat00096
는 주파수,
Figure 112012033351484-pat00097
는 각주파수를 나타낸다. 그리고 임의의 시간 지연
Figure 112012033351484-pat00098
는 입사 방향
Figure 112012033351484-pat00099
와 거리
Figure 112012033351484-pat00100
, 그리고 음파 속도
Figure 112012033351484-pat00101
Figure 112012033351484-pat00102
와 같이 나타낼 수 있다. 여기서 입사 방향
Figure 112012033351484-pat00103
에 따라 시간 지연이 바뀌므로 입사 방향
Figure 112012033351484-pat00104
를 독립변수로 표현할 수 있다. 수학식 2는 수학식 4를 사용해 다시 표현하면,
Figure 112012033351484-pat00105
가 된다. 푸리에 변환(Fourier transform)으로
Figure 112012033351484-pat00106
를 변환하면,
Figure 112012033351484-pat00107
로 나타낼 수 있다. 여기서
Figure 112012033351484-pat00108
는 디락 델타 함수(Dirac delta function)이다. 시간 지연
Figure 112012033351484-pat00109
를 나타내는 항이 상수이므로, 복소 상수
Figure 112012033351484-pat00110
를 도입하여
Figure 112012033351484-pat00111
단,
Figure 112012033351484-pat00112
와 같이 표현할 수 있다. 단일 주파수에 대하여 고려하고 있으므로 이후로는
Figure 112012033351484-pat00113
를 편의상
Figure 112012033351484-pat00114
로 표현하기로 한다. 또, 파수(wavenumber)
Figure 112012033351484-pat00115
와 각주파수
Figure 112012033351484-pat00116
, 그리고 음파 속도
Figure 112012033351484-pat00117
간의 관계를 이용해 수학식 7을
Figure 112012033351484-pat00118
와 같이 표현할 수 있다. 수학식 9는 단일 주파수
Figure 112012033351484-pat00119
를 가지는 평면파가
Figure 112012033351484-pat00120
방향으로부터 마이크로폰 배열에 입사될 때 임의의 위치
Figure 112012033351484-pat00121
에서의 음압 신호를 주파수 영역에서 나타내고 있다.
이제 음파의 입사 방향을 추정할 수 있는 신호를 모델링할 필요가 있다. 이를 위해 음파가 임의의 방향
Figure 112012033351484-pat00122
로부터 입사한다고 가정하여 만들어내는 신호를 스캔 함수(가중치 함수)라고 하고, 이것이 수신되는 음압 신호
Figure 112012033351484-pat00123
에 영향을 주지 않도록 신호 파워가 단위 입력이어야 한다. 따라서, 임의의 방향
Figure 112012033351484-pat00124
로부터 입사되는 평면파 신호를 표현하는 가중치 함수
Figure 112012033351484-pat00125
Figure 112012033351484-pat00126
음파의 입사 방향을 추정하기 위해서 수학식 9와 수학식 10 사이의 상관관계를 계산하는데 이는 각 식의 지수함수 부분이 얼만큼 일치하는지 보는 것으로, 수학적으로는 두 식을 곱하여 절대값 제곱을 계산한다. 이를 빔파워(혹은 빔형성파워, beampower, BP)라고 하고, 두 함수의 위상(시간지연)을 나타내는 지수함수 부분이 일치하는
Figure 112012033351484-pat00127
에서 최대이다. 다시 말해 두 식의 내적이 최대가 되는 경우이고 이 때 두 식이 같다고 할 수 있다.
음파가 어떤 방향에서 입사하는지 알 수 없으므로 빔파워와 관련되는 변수는 실제 음파의 입사 방향
Figure 112012033351484-pat00128
와 가중치 함수가 스캔하는 방향
Figure 112012033351484-pat00129
에 대한 함수로 나타낸다. 빔파워
Figure 112012033351484-pat00130
를 계산하기 위해 가중치 함수
Figure 112012033351484-pat00131
와 음압신호
Figure 112012033351484-pat00132
를 구간
Figure 112012033351484-pat00133
에 대해 적분하면
Figure 112012033351484-pat00134
임을 알 수 있다. 여기서, 위첨자 *는 켤레(conjugate)를 나타낸다. 수학식 11은 마이크로폰 배열의 길이가
Figure 112012033351484-pat00135
인 구간에 대해 연속적인 음압 신호를 알고 있을 때의 빔파워이다.
수학식 11을 통해 다음과 같은 해석을 시도할 수 있다. 빔파워는 음파가 입사하는 방향과 가중치 함수가 스캔하는 방향이 일치하는 곳에서 최대인 것을 알 수 있다. 따라서 이 방향으로부터의 신호를 다른 방향에 비해서 상대적으로 크게 수신한다고 할 수 있다. 즉, 상대적으로 크게 수신한다는 것을 다음과 같은 수식으로 표현할 수 있다.
Figure 112012033351484-pat00136
음파가 입사하는 방향
Figure 112012033351484-pat00137
에서 빔파워가 최대이므로, 평면파가 동일한 음압 신호의 크기로 마이크로폰 배열에 입사하더라도 입사 방향에 따라 수신되는 신호의 크기가 바뀌는 것을 의미한다.
하지만 실제의 경우 마이크로폰 배열의 길이 및 마이크로폰 개수에 물리적인 제한이 있으므로 도 8과 같이 공간상에
Figure 112012033351484-pat00138
개의 마이크로폰을 이용해 각 마이크로폰 사이 간격을
Figure 112012033351484-pat00139
로 하여 배열한다면 총
Figure 112012033351484-pat00140
의 음압 신호를 받는다. 도 8에서
Figure 112012033351484-pat00141
는 인접 마이크로폰 사이의 간격,
Figure 112012033351484-pat00142
는 평면파의 입사 방향,
Figure 112012033351484-pat00143
은 m번째 마이크로폰을 나타낸다.
연속적인 경우에 대해 고려한 수학식 9와 수학식 10은 아래와 같이 이산화 형태로 나타난다.
Figure 112012033351484-pat00144
여기서,
Figure 112012033351484-pat00145
는 실제 음파에 의하여 형성되는 음장 중
Figure 112012033351484-pat00146
번째 마이크로폰에 수신되는 음압 신호를,
Figure 112012033351484-pat00147
는 가상의 음파에 의해 형성되는 음장 중
Figure 112012033351484-pat00148
번째 마이크로폰 위치에서의 음압 신호를 나타내고 있다.
Figure 112012033351484-pat00149
이 경우의 빔파워는
Figure 112012033351484-pat00150
이다. 여기서 위첨자
Figure 112012033351484-pat00151
는 허미션(Hermitian) 연산자,
Figure 112012033351484-pat00152
은 상관 행렬(correlation matrix)을 나타낸다.
도 9는
Figure 112012033351484-pat00153
방향에서 음파가 전파되는 경우에 나타나는 평면파 모델 지연-합 빔형성 방법으로 구하는 빔파워 분포의 한 예다. 여기서, 주파수
Figure 112012033351484-pat00154
Figure 112012033351484-pat00155
, 입사 방향은
Figure 112012033351484-pat00156
, 마이크로폰의 개수
Figure 112012033351484-pat00157
은 10개, 마이크로폰의 간격
Figure 112012033351484-pat00158
Figure 112012033351484-pat00159
이다.
도 9를 참조하면,
Figure 112012033351484-pat00160
방향에서 빔파워가 가장 크므로 여기서 음파가 입사한다고 추정할 수 있다. 또,
Figure 112012033351484-pat00161
방향에서 마이크로폰 배열에 수신되는 음압 신호를 다른 방향의 그것보다 상대적으로 크게 수신하는 것을 보여주고 있다.
빔패턴(beam pattern)
평면파 모델의 지연-합 빔형성 방법으로 음파의 입사 방향을 추정할 때 무한개의 공간 정보를 얻을 수 없으므로 빔파워의 분포는 도 10에서처럼 일정 범위의 폭을 가진다. 어떤 독립 변수들과 관련이 있는지를 다음과 같이 알아볼 수 있다.
수학식 15의 절대값 내부의
Figure 112012033351484-pat00162
를 살펴보면,
Figure 112012033351484-pat00163
와 같이 나타나고, 이를 다음과 같이 쓸 수 있다.
Figure 112012033351484-pat00164
여기서 대괄호 속에 있는 부분을 빔패턴(beam pattern)
Figure 112012033351484-pat00165
로 정의할 수 있다.
Figure 112012033351484-pat00166
이 식을 통해서 빔패턴은 마이크로폰의 개수
Figure 112012033351484-pat00167
, 인접 마이크로폰 사이의 간격
Figure 112012033351484-pat00168
, 그리고 입사하는 음파의 파장
Figure 112012033351484-pat00169
와 관련이 있음을 알 수 있다. 또, 사인(sine)의 주기성으로부터 빔파워에 다수의 엽(lobe)이 존재하는 것을 알 수 있다. 여기서, 지향하는 방향(음파가 입사하는 방향)을 포함하고 있는 엽을 주엽(mainlobe), 그 외의 엽들을 부엽(sidelobe)이라고 한다. 주엽의 폭은 수학식 19이 처음으로 0이 되는 각도로 분자의 사인(sine)항의 값이 0일 때이다. 즉, 주엽의 폭을
Figure 112012033351484-pat00170
라고 한다면
Figure 112012033351484-pat00171
로 표현된다. 마이크로폰의 개수
Figure 112012033351484-pat00172
, 인접 마이크로폰 사이의 간격
Figure 112012033351484-pat00173
등이 동일한 조건에서도 저주파수일수록 주엽의 폭
Figure 112012033351484-pat00174
는 더 넓어진다. 도 10에는 동일한 마이크로폰 배열에서 저주파수가 될수록 주엽의 폭이 넓어지고, 고주파수가 될수록 주엽의 폭이 좁아지는 것을 나타내고 있다.
1.2 영역 관점 빔형성 방법
1.2.1 음향 밝기 최대화 방법(acoustical brightness maximization method)
Figure 112012033351484-pat00175
개의 마이크로폰이 있는 마이크로폰 배열에서 구해지는 빔파워는
Figure 112012033351484-pat00176
로 나타낼 수 있다. 도 9에서와 같은 공간 상에서 관심 영역을 대표 방향
Figure 112012033351484-pat00177
를 중심으로 영역
Figure 112012033351484-pat00178
만큼의 범위로 하자. 지연-합 빔형성 방법에서는 가중치
Figure 112012033351484-pat00179
를 평면파 모델로 표현할 수 있다. 하지만 영역 개념을 이용할 경우 이 가중치
Figure 112012033351484-pat00180
로 표현하기에는 어려움이 있다. 그렇다면 영역 개념을 이용할 때에 가중치
Figure 112012033351484-pat00181
는 무엇에 관련된 함수인지 먼저 생각해 보자. 음압 신호 벡터
Figure 112012033351484-pat00182
는 수학식 13과 동일하게 표현되나, 가중치 벡터
Figure 112012033351484-pat00183
는 1)
Figure 112012033351484-pat00184
, 2)
Figure 112012033351484-pat00185
, 3)
Figure 112012033351484-pat00186
, 그리고 4)
Figure 112012033351484-pat00187
와 관련이 있다.
Figure 112012033351484-pat00188
이를 이용하여 본 발명에서는 영역 개념으로 음파의 입사 방향을 추정하고자 하므로, 다음과 같이 관심 영역 내에서의 빔파워를 표현하는 방법을 생각해 보기로 한다. 즉 빔파워를 관심 영역에 대해서 적분하는 것이다. 이것이 의미하는 것은 관심 영역 내에 얼만큼의 빔파워가 있는가로, 이 값이 크면 지연-합 빔형성 방법의 개념과 같이 그 영역 내에 음파가 입사하는 방향이 존재할 것이라고 생각할 수 있다. 관심 영역
Figure 112012033351484-pat00189
에서의 빔파워는 영역에 대해 적분한 값이라는 의미로 공간 평균 빔파워(spatial averaged beampower,
Figure 112012033351484-pat00190
)라는 용어로 정의하여 사용하기로 한다. 이 값은
Figure 112012033351484-pat00191
와 같이 표현할 수 있다. 여기서
Figure 112012033351484-pat00192
차 정사각행렬
Figure 112012033351484-pat00193
의 의미를 알아보기 위해 이 행렬의 한 성분인
Figure 112012033351484-pat00194
을 보면
Figure 112012033351484-pat00195
과 같이 표현할 수 있다.
Figure 112012033351484-pat00196
방향에 존재하는 평면파 음파가 마이크로폰 배열에 입사할 때
Figure 112012033351484-pat00197
번째,
Figure 112012033351484-pat00198
번째 마이크로폰과 어떤 관계에 있는지 나타내고 있다. 즉, 공간상에서 이 세 값들이 어떤 상관관계인가 나타내는 행렬로, 이후에는 공간 상관행렬
Figure 112012033351484-pat00199
로 표기한다. 이를 적용하여 관심 영역에서의 공간 평균 빔파워를 나타내면
Figure 112012033351484-pat00200
와 같이 쓸 수 있다.
그렇다면 관심 영역에서의 공간 평균 빔파워를 최대로 하는 가중치를 어떻게 선정할지 생각해보자. 가중치의 절대적인 크기보다 각 마이크로폰에 적용되는 가중치간의 비율이 중요하므로 가중치 벡터의 노옴(norm)을 제한 조건으로 한다. 이 때 관심 영역에서의 공간 평균 빔파워를 최대로 하는 가중치 벡터를 구하는 문제는 다음과 같은 최적화 문제로 정의될 수 있다.
Figure 112012033351484-pat00201
이는 라그랑지 승수(Lagrange multiplier) 를 도입하여 제한 조건이 없는 문제로 바꿀 수 있으므로 다음과 같이 문제를 정식화 할 수 있다. .
Figure 112012033351484-pat00203
수학식 27을
Figure 112012033351484-pat00204
로 계산하면 수학식 27은
Figure 112012033351484-pat00205
과 같이 고유치 문제가 된다. 여기서 가중치 벡터의 노옴에 대한 관심 영역에서의 공간 평균 빔파워를 나타내는 음향 밝기(brightness)
Figure 112012033351484-pat00206
를 목적함수로 하면,
Figure 112012033351484-pat00207
와 같이 쓸 수 있고, 이 값의 최대값은 공간 상관행렬
Figure 112012033351484-pat00208
의 최대 고유치
Figure 112012033351484-pat00209
가 된다([29], [45]). 즉, 음향 밝기
Figure 112012033351484-pat00210
를 최대로 하는 최적의 가중치 벡터
Figure 112012033351484-pat00211
Figure 112012033351484-pat00212
의 고유 벡터가 됨을 알 수 있다.
관심 영역이 한 방향이 되는 경우
관심 영역이
Figure 112012033351484-pat00213
인 경우를 살펴보자. 이 때 관심 영역에서의 공간 상관행렬
Figure 112012033351484-pat00214
는 다음과 같이 표현된다.
Figure 112012033351484-pat00215
이를 수학식 29와 30에 대입하면,
Figure 112012033351484-pat00216
와 같이 표현된다. 만약 최적의 가중치 벡터
Figure 112012033351484-pat00217
Figure 112012033351484-pat00218
가 된다면, 수학식 32는
Figure 112012033351484-pat00219
Figure 112012033351484-pat00220
가 된다. 즉, 음압 신호 벡터
Figure 112012033351484-pat00221
는 관심 영역이 한 방향일 때의 음향 밝기
Figure 112012033351484-pat00222
를 최대로 만드는 고유 벡터임을 알 수 있다. 이 경우에는 평면파 모델의 지연-합 빔형성 방법과 같은 해를 가진다.
관심 영역이 전체 영역이 되는 경우
마이크로폰이
Figure 112012033351484-pat00223
개인 경우에는
Figure 112012033351484-pat00224
Figure 112012033351484-pat00225
차 정사각행렬로, 수학식 29는
Figure 112012033351484-pat00226
차 고유치 문제다.
Figure 112012033351484-pat00227
차 행렬의 일반해는 해석적으로 구할 수 없으므로, 물리적 의미를 알기 어렵다. 그래서 여기서는 그 경향을 간단한 경우인 마이크로폰 2개, 3개를 통해 해석적으로 접근한다.
1) 마이크로폰이 2개인 경우
관심 영역이
Figure 112012033351484-pat00228
, 인 경우에서 공간 상관 행렬
Figure 112012033351484-pat00229
Figure 112012033351484-pat00230
과 같다. 여기서
Figure 112012033351484-pat00231
는 1종 0차 베셀 함수(Bessel's function)이다. 이 때 수학식 29로 구하는 고유치
Figure 112012033351484-pat00232
는 다음과 같이 나타난다.
Figure 112012033351484-pat00233
수학식 36으로부터
Figure 112012033351484-pat00234
에 따라 고유치
Figure 112012033351484-pat00235
의 대소 관계가 바뀌는 것을 알 수 있다. 도 12는 수학식 36의 두 고유치를 그래프로 나타낸 것이다. 즉,
Figure 112012033351484-pat00236
일 때
Figure 112012033351484-pat00237
을 기준으로 두 고유치의 대소가 바뀌고 구하는 가중치 벡터(고유 벡터)가 바뀌는 것을 알 수 있다.
2) 마이크로폰의 개수가 3개인 경우
이 경우에 공간 상관 행렬
Figure 112012033351484-pat00238
와 이 때 도출되는 고유치는 다음과 같다
Figure 112012033351484-pat00239
Figure 112012033351484-pat00240
이 때에도 세 고유치 간의 대소 관계는
Figure 112012033351484-pat00241
에 따라 바뀐다. (도 13 참조) 목적 함수로부터 얻는 고유치 및 고유 벡터가 각각 음향 밝기
Figure 112012033351484-pat00242
와 가중치 벡터
Figure 112012033351484-pat00243
가 되는데,
Figure 112012033351484-pat00244
에 따라 이 값이 좌우되는 것을 알 수 있다. 또 다른 특징으로는 마이크로폰의 개수가 늘어남에 따라, 즉 마이크로폰 배열의 길이가 늘어남에 따라서 고유치 간의 대소가 바뀌는 지점이 더 일찍 나타나는 것을 알 수 있다. 이는 마이크로폰의 개수
Figure 112012033351484-pat00245
이 늘어남에 따라 한 임의의 고유치
Figure 112012033351484-pat00246
에 0차 1종 베셀 함수가
Figure 112012033351484-pat00247
에서
Figure 112012033351484-pat00248
까지 표현되고, 이 값을 계산하여보면
Figure 112012033351484-pat00249
의 개수가 늘어날수록 교차하는 지점이 더 일찍 생기기 때문이라고 생각할 수 있다.
1.2.2 음향 대조 최대화 방법(acoustical contrast maximization method)
앞 절에서 음향 밝기 최대화 방법을 이용하여 목적 함수를 만족하는 최적의 가중치 벡터를 도출하는 방법을 제안하였다. 이 때는 관심 영역에서의 공간 평균 빔파워를 최대로 하는 데에만 목적이 있으므로 비 관심 영역에서의 공간 평균 빔파워에 대한 고려를 하지 않고 있다. 여기에서는 관심 영역에서의 공간 평균 빔파워를 최대로 하면서, 관심 영역 외에서의 공간 평균 빔파워를 최소로 하는 데에 목적을 둔다.
도 11에 나타낸 비 관심 영역에서의 공간 평균 빔파워를 구하면
Figure 112012033351484-pat00250
로 표현할 수 있다. 여기서
Figure 112012033351484-pat00251
는 비 관심 영역에서의 공간 상관행렬로
Figure 112012033351484-pat00252
차 행렬이고,
Figure 112012033351484-pat00253
는 비 관심 영역을 나타낸다. 이 때 두 영역에서의 공간 평균 빔파워의 비를
Figure 112012033351484-pat00254
라는 음향 대조(contrast)로 정의하여 이를 최대로 만들 수 있는 목적 함수를 다음과 같이 제안한다.
Figure 112012033351484-pat00255
Figure 112012033351484-pat00256
이는 비 관심 영역에서의 공간 평균 빔파워
Figure 112012033351484-pat00257
Figure 112012033351484-pat00258
로 제한되어 있을 때, 관심 영역에서의 공간 평균 빔파워
Figure 112012033351484-pat00259
를 최대로 하는 문제이다.
Figure 112012033351484-pat00260
따라서 두 영역간의 공간 평균 빔파워 비를 최대로 하는 문제는 레일레이 몫
Figure 112012033351484-pat00261
를 최대로 하는
Figure 112012033351484-pat00262
를 찾는 문제로 정식화 할 수 있다. .
이 때 레일레이 몫의 최대값은
Figure 112012033351484-pat00263
의 일반화된 고유치 문제의 최대 고유치와 동일하다([29], [30], [45]).
음향 대조
Figure 112012033351484-pat00264
는 두 영역 간의 공간 평균 빔파워의 비로써 정의되므로 각각을
Figure 112012033351484-pat00265
,
Figure 112012033351484-pat00266
로 풀어서 그 값을 본다면, 음향 대조
Figure 112012033351484-pat00267
의 거동을 알 수 있다. 즉, 관심 영역의 공간 평균 빔파워를 크게 하며 최적화를 이루는지, 비 관심 영역의 공간 평균 빔파워를 작게 하며 최적화를 이루는지 알 수 있을 것이다.
만약 각 마이크로폰에 수신되는 음압 신호간의 공간 상관 관계가 큰 차이를 보이지 않는다면 공간 상관 행렬
Figure 112012033351484-pat00268
Figure 112012033351484-pat00269
의 최소 고유치가 0에 가까운 값을 가질 것이다. 두 공간 상관 행렬에 표현되는 수식은 평면파 모델이므로 다음과 같은 경우에 최소 고유치가 0에 가까운 값을 가진다. 첫 번째로는 인접 마이크로폰 사이의 간격
Figure 112012033351484-pat00270
가 매우 작은 경우
Figure 112012033351484-pat00271
, 두 번째로는 전파되는 음파의 파수가 작아지는 저주파수
Figure 112012033351484-pat00272
의 경우이다. 즉,
Figure 112012033351484-pat00273
일 때이다.
이 때에 도출되는 가중치 벡터
Figure 112012033351484-pat00274
Figure 112012033351484-pat00275
의 영공간에 속하면, 이 때에는
Figure 112012033351484-pat00276
를 크게 하여 최적화를 하는 것이 아닌,
Figure 112012033351484-pat00277
를 최소화하여 음향 대조를 최대로 만든다.
관심 영역이 한 방향이 되는 경우
관심 영역은 대표 방향
Figure 112012033351484-pat00278
이고, 비 관심 영역은
Figure 112012033351484-pat00279
이다. 이 때
Figure 112012033351484-pat00280
차 행렬의 고유치 문제를 푸는데, 이에 대한
Figure 112012033351484-pat00281
차 일반해를 닫힌 형태로 구할 수 없으므로 간단한 경우인 마이크로폰이 2개인 경우를 통해 그 의미를 살펴보기로 한다.
이 경우 음압 신호 벡터
Figure 112012033351484-pat00282
Figure 112012033351484-pat00283
와 같이 표현된다. 그렇다면 두 영역의 공간 상관 행렬
Figure 112012033351484-pat00284
Figure 112012033351484-pat00285
는 각각
Figure 112012033351484-pat00286
로 표현된다.
수학식 43의 고유치 문제를 풀기 위해서는 수학식 45의 역행렬을 구하는데, 이 경우 행렬식(determinant)은 다음과 같이 계산된다.
Figure 112012033351484-pat00287
수학식 46의 절대값은 횔더의 부등식
Figure 112012033351484-pat00288
에 의해
Figure 112012033351484-pat00289
가 되고 역행렬이 존재한다. 이로부터 고유치 문제를 풀면 가중치
Figure 112012033351484-pat00290
는 다음과 같이 구해진다.
Figure 112012033351484-pat00291
여기서,
Figure 112012033351484-pat00292
는 1종 0차 베셀 함수(Bessel's function)을 나타낸다. 만약 여기서
Figure 112012033351484-pat00293
이면, 가중치 벡터는
Figure 112012033351484-pat00294
과 같이 계산되고, 이는 음향 밝기 최대화 방법에서 관심 영역이 대표 방향
Figure 112012033351484-pat00295
의 한 방향일 때 구해지는 가중치, 평면파 모델의 지연-합 빔형성 방법에서의 가중치와 같은 결과이다. 즉,
Figure 112012033351484-pat00296
를 조절하면 음향 밝기 최대화 방법과 음향 대조 최대화 방법이 같은 최적해(가중치 벡터)를 가질 수 있음을 알 수 있다.
1.2.3 영역(region)을 이용한 음파의 입사 방향 추정
마이크로폰 배열에 입사하는 음압 신호
Figure 112012033351484-pat00297
와 음향 밝기 최대화 방법과 음향 대조 최대화 방법으로부터 얻는 가중치
Figure 112012033351484-pat00298
를 각각 내적하여 음파가 입사하는 방향의 범위를 추정하는 방법을 제안한다. 이를 위해 영역(region) 개념을 사용하여 전체 영역
Figure 112012033351484-pat00299
를 두 부분으로 나누는 이분법의 개념을 적용하기로 한다(예를 들어, 참고문헌 [50]). 먼저 이분법의 어떤 개념을 적용할지 설명할 필요가 있다.
이분법(bisection method)
임의의 구간
Figure 112012033351484-pat00300
에 함수
Figure 112012033351484-pat00301
가 존재하고 이 함수의 함수값이 구간 내에서 연속일 때, 구간의 양 끝 값의 곱이
Figure 112012033351484-pat00302
와 같이 음수를 나타내면 그 구간 내에 최소한 1개 이상의
Figure 112012033351484-pat00303
을 만족하는 해가 존재한다는 것은 잘 알려져 있다. 그래서
Figure 112012033351484-pat00304
와 같이 양 끝 값의 중간에 위치한
Figure 112012033351484-pat00305
를 얻고,
Figure 112012033351484-pat00306
의 부호를 살핀다. 이 중 음의 부호를 가지는 영역 내에 해는 존재한다. 그러면 처음에는 구간이
Figure 112012033351484-pat00307
이던 것이
Figure 112012033351484-pat00308
혹은
Figure 112012033351484-pat00309
로 절반이 되고, 이 과정을 반복하여 수행함으로써 구간
Figure 112012033351484-pat00310
의 임의 수련 구간 내에 해가 존재한다고 추정하는 것이 이분법이다. (도 12 참조)
음파의 입사 방향 추정
그렇다면 이분법을 음파의 입사 방향 추정에 어떻게 적용시킬지 다음과 같이 생각해보자. 이는 다음과 같은 흐름으로 해결할 수 있다. 도 15와 같이 전체 영역이 존재할 때 이를 두 영역으로 나눈다. 두 영역의 경계에 위치해 있는 각도를 각각
Figure 112012033351484-pat00311
로 표시를 하면 전체 영역을
Figure 112012033351484-pat00312
,
Figure 112012033351484-pat00313
와 같이 두 영역으로 나눠 쓸 수 있다. 편의상
Figure 112012033351484-pat00314
은 각각 왼쪽 영역(left re-gion)과 오른쪽 영역(right region)이라고 표시한다. 각 영역에서 공간 평균 빔파워의 크기를 최대로 만드는 가중치
Figure 112012033351484-pat00315
는 1.2절, 1.3절에서 제안하는 방법으로 구할 수 있다. 도출되는 가중치의 값이 다를 뿐, 음파의 입사 방향을 추정하는 방법에는 차이가 없으므로, 2.2절의 음향 밝기 최대화 방법으로부터 구해지는 가중치로 설명한다. 각 영역에서 구하는 가중치를 각각
Figure 112012033351484-pat00316
으로 쓰면, 이는 각각
Figure 112012033351484-pat00317
의 열 벡터 형태로 나타난다. 각 가중치의 아래 첨자
Figure 112012033351484-pat00318
는 음향 밝기인 brightness, 그리고
Figure 112012033351484-pat00319
Figure 112012033351484-pat00320
은 각각 왼쪽 영역과 오른쪽 영역을 의미한다. 임의의 방향
Figure 112012033351484-pat00321
로부터 마이크로폰 배열에 수신되는 음압 신호
Figure 112012033351484-pat00322
는 수학식 13에서와 같이 표현되므로, 각각의 가중치와 내적을 하여 각 영역에서의 공간 평균 빔파워를 다음과 같이 계산할 수 있다.
Figure 112012033351484-pat00323
각 영역에서 구해지는 빔파워 값은 두 열 벡터의 내적이므로 스칼라 값이다. 지연-합 빔형성 방법에서 빔파워가 최대가 되는 방향이 마이크로폰 배열에 음파가 입사하는 방향이라고 추정하는 것과 같은 개념으로, 각 영역에서 구한 공간 평균 빔파워의 크기를 비교하여 그 중 큰 값의 영역 내에 음파의 입사 방향이 존재한다고 추정할 수 있다.
이를 일반화하여 생각하면,
Figure 112012033351484-pat00324
번째 수행에서의 왼쪽 및 오른쪽 영역은 다음과 같이 쓸 수 있다.
Figure 112012033351484-pat00325
왼쪽과 오른쪽 각 영역에서 음향 밝기 최대화 방법을 통해 구해지는 가중치
Figure 112012033351484-pat00326
와 공간 평균 빔파워
Figure 112012033351484-pat00327
는 아래와 같이 쓸 수 있다.
Figure 112012033351484-pat00328
각 영역에서의 빔파워 값 중에서
Figure 112012033351484-pat00329
가 되는 영역 내부에 음파의 입사 방향이 존재한다고 추정할 수 있다. 그렇다면
Figure 112012033351484-pat00330
번째 수행에서는 영역이 다음과 같이 두 가지 경우로 나뉘게 된다.
첫 번째,
Figure 112012033351484-pat00331
로 왼쪽 영역의 빔파워 값이 오른쪽 영역의 그것보다 큰 경우이다. 이 때에는 왼쪽 영역인
Figure 112012033351484-pat00332
에 음파의 입사 방향이 존재한다고 추정하게 되는데, 그렇다면
Figure 112012033351484-pat00333
번째 수행에서 각 영역은 다음과 같이 바뀐다.
Figure 112012033351484-pat00334
두 번째,
Figure 112012033351484-pat00335
로 오른쪽 영역의 빔파워 값이 왼쪽 영역의 그것보다 큰 경우이다. 이 때에는 오른쪽 영역인
Figure 112012033351484-pat00336
내부에 음파의 입사 방향이 존재한다고 추정하게 되고,
Figure 112012033351484-pat00337
번째 수행에서 각 영역은 다음과 같다.
Figure 112012033351484-pat00338
지연-합 빔형성 방법과 제안 방법의 연산량 비교
지연-합 빔형성 방법에서는 음파의 입사 방향을 한 방향으로 추정한다. 하지만, 본 발명에서는 음파가 입사하는 방향의 범위를 추정한다. 그렇다면 제안하는 방법이 지연-합 빔형성 방법에 비해 어떤 면에서 장점을 가지는지를 생각해 볼 필요가 있다. 직관적으로, 제안하는 방법의 경우 이분법으로 음파의 입사 방향을 추정하므로 연산량이 적을 것을 예상할 수 있다. 그렇다면 실제로 연산량이 얼마나 되는지를 수학적으로 살펴보기로 한다.
먼저 연산량을 어떻게 정의할지 생각해 보기로 한다. 음파의 입사 방향을 추정하는 데 필요한 정보는 음압 신호, 가중치, 그리고 이들의 내적으로 구해지는 공간 평균 빔파워 값이다. 음압 신호는 측정값이므로, 나머지 두 값을 구하는 데 계산이 필요하다. 이 중 가중치는 지연-합 빔형성 방법의 경우 각도 분해능
Figure 112012033351484-pat00339
를 알면 항상 구할 수 있고, 제안 방법의 경우 영역과 마이크로폰 배열에 대한 정보(array configuration)가 있으면 항상 구할 수 있는 값이다.(Appendix E. 참고) 즉, 사전에 구해둘 수 있는 값이다. 그러므로 공간 평균 빔파워를 계산하는 데 필요한 계산량을 본 발명에서는 연산량이라고 정의한다.
우선, 지연-합 빔형성 방법의 경우 전체 영역
Figure 112012033351484-pat00340
를 사용자가 얼마만큼의 각도 분해능(angular resolution)
Figure 112012033351484-pat00341
로 빔파워를 구하는가에 따라 연산량이 달라지는데 이는 다음과 같이 수학적으로 표현할 수 있다.
Figure 112012033351484-pat00342
이 값은 각도 분해능
Figure 112012033351484-pat00343
에 종속(dependent)인 것을 알 수 있다. 예를 들어, 각도 분해능이
Figure 112012033351484-pat00344
인 경우를 생각해 보면 각 방향에서의 가중치 벡터(스캔 벡터)를 구하기 위해서는 총 181번의 연산이 필요하다.
이제 본 발명에서 제안하는 방법에서의 연산량을 살펴보기로 한다. 각 영역에서 공간 평균 빔파워를 구하고 이 값을 비교할 때 마다 영역이 하나씩 제외가 된다. 이 때에는 도 17의 (b), (c)와 같이 한 번 비교할 때마다 두 번씩만 계산하면 된다. 즉,
Figure 112012033351484-pat00345
회 반복 수행 했을 때 공간 평균 빔파워를 계산하는 데 소요되는 연산량은
Figure 112012033351484-pat00346
이다. 최종적으로 제안 방법의 총 연산량은
Figure 112012033351484-pat00347
로 표현할 수 있다.
이 값이 지연-합 빔형성 방법의 총 연산량보다 적은 경우가 언제인지를 살펴보기로 한다. 즉,
Figure 112012033351484-pat00348
인 경우이다. 이 때에는 변수가
Figure 112012033351484-pat00349
Figure 112012033351484-pat00350
로 2개이므로, 간단한 비교를 위해
Figure 112012033351484-pat00351
인 경우를 살펴보면,
Figure 112012033351484-pat00352
이므로,
Figure 112012033351484-pat00353
에 대해서는 이 수식이 성립한다. (단, 는 자연수) 그렇다면 제안 방법이 각 수행 단계에서 얼만큼의 영역을 가질 수 있는지 살펴보기로 한다. 각 수행 단계에서 영역은 그 전 단계에 비해 절반으로 항상 줄어들므로, 제안 방법에서의 영역은 다음과 같이 나타낼 수 있다.
Figure 112012033351484-pat00354
위 식을 통해 영역은 반복 수행 횟수
Figure 112012033351484-pat00355
와 관련이 있다는 것을 알 수 있다. 극한 경우(limit case)
Figure 112012033351484-pat00356
일 때를 고찰해 보면, 수학식 62는 0에 가까운 값을 가지고, 음파가 입사하는 방향의 범위가 매우 좁아질 것을 알 수 있다.
그렇다면 지연-합 빔형성 방법에서의 각도 분해능
Figure 112012033351484-pat00357
과 제안 방법의 영역
Figure 112012033351484-pat00358
이 직접적으로 어떤 관계에 있고, 각도 분해능
Figure 112012033351484-pat00359
와 영역
Figure 112012033351484-pat00360
가 같은 경우에는 어떤 방법의 연산량이 더 적은지를 살펴보기로 한다.
만약 지연-합 빔형성 방법의 각도 분해능
Figure 112012033351484-pat00361
Figure 112012033351484-pat00362
인 경우 수학식 58로부터 연산량이 3회인 것을 알 수 있고, 영역
Figure 112012033351484-pat00363
Figure 112012033351484-pat00364
인 경우는 1번째 수행일 때로 연산량이 2회인 것을 알 수 있다. 그리고 이 절반이 되는 각도 분해능이
Figure 112012033351484-pat00365
이고, 영역
Figure 112012033351484-pat00366
Figure 112012033351484-pat00367
인 경우에는 지연-합 빔형성 방법의 연산량은 5회, 제안 방법의 연산량은 4회이다. 이를 계속 비교해보면 제안 방법의 각 수행 단계에서 가지는 영역과 같은 각도 분해능일 때 지연-합 빔형성 방법의 연산량은 다음과 같은 등비수열을 이룬다.
Figure 112012033351484-pat00368
그렇다면 수학식 59와 수학식 60을 비교해보면 제안 방법의 각 수행 단계에서 가지는 영역과 지연-합 빔형성 방법의 각도 분해능이 같을 때, 어떤 방법의 연산량이 큰가 알 수 있다.
Figure 112012033351484-pat00369
수학식 64는
Figure 112012033351484-pat00370
가 자연수일 때 언제나 성립하는 식이다. 즉, 제안 방법의 각 수행 단계에서의 영역과 지연-합 빔형성 방법의 각도 분해능이 같은 경우에는 언제나 제안 방법의 연산량이 더 적은 것을 알 수 있다. (도 16 참조) I
음파의 입사 방향에 대한 추정 범위 제안
제안하는 방법에서 음파가 입사하는 방향의 추정 범위를 어떻게 결정할지 생각해 보아야 한다. 이를 위해 지연-합 빔형성 방법의 3dB 밴드 폭(3-dB bandwidth 혹은 the Half-Power Bandwidth, HPBW,
Figure 112012033351484-pat00371
)을 기준으로 삼고자 한다. 이 값은 빔파워가 최대인 방향으로부터 빔파워가 절반인 방향까지의 범위를 나타내는 것으로, 이 범위 내에 음파의 입사 방향이 존재할 것이라고 해석할 수 있다. 이 값은 마이크로폰 배열의 정보(array configuration)를 알면 결정되는 값으로, 제안 방법은 이 값보다 좁은 범위를 가질 때로 그것을 추정 범위(BandWidth, BW)로 정하고, 반복 수행을 종료하고자 한다.
이를 수식으로 표현하면,
Figure 112012033351484-pat00372
와 같이 쓸 수 있다.
간단한 경우에 대한 예시
본 발명에서 제안하는 방법이 음파의 입사 방향 범위를 어떻게 추정하는지 간단한 경우에 대한 예시를 통해 설명하기로 한다. 먼저 선형 마이크로폰 배열은 마이크로폰이 7개, 각 마이크로폰 사이의 간격은 0.005m인 경우를 생각한다. 이 배열에 대해서는 3장에서 그 이유를 설명한다. 이 마이크로폰 배열을 사용할 경우 3dB 밴드 폭은 약
Figure 112012033351484-pat00373
이다. 여기서 음파의 입사 방향을 소수점 첫째 자리까지로 한 것은 입사 방향을 포함하는 일정한 범위를 가지는 영역을 추정하는 것을 보이기 위해서이다.
이 조건 아래에서 제안 방법을 반복 수행하면 다음과 같은 결과를 나타낸다. 도 20의 (a) 부터 (g)까지 1번째부터 7번째 수행하여 음파의 입사 방향 범위를 추정한 것이다. 이 예시의 경우에는 3번째 수행에서 영역의 추정 범위가
Figure 112012033351484-pat00374
가 되고, 3dB 밴드 폭 내로 들어온다. 또, 제안 방법의 각도 분해능이 약
Figure 112012033351484-pat00375
가 될 때인
Figure 112012033351484-pat00376
인 경우까지 살펴보았다. 각 그래프에서 범위(Range)가 의미하는 것은 그 수행 단계에서 추정하고 있는 음파의 입사 방향의 범위이다. 도 18의 (a)에서는 1번째 수행 단계에서 추정하게 되는 음파의 입사 방향 범위가
Figure 112012033351484-pat00377
라는 것을 나타내고 있다.
제안 방법의 한계점
제안 방법의 경우 주어진 마이크로폰 배열로부터 얻는 빔패턴에 의해 그 성능이 크게 좌우된다. 이에 대해 앞의 간단한 경우에 사용한 마이크로폰 배열로 구하는 각 수행 단계에서의 빔패턴을 관찰해 보기로 한다.
도 21을 통해 이 의미를 살펴보면 다음과 같다. 이 때는 영역을
Figure 112012033351484-pat00378
로 하였을 때, 각각의 빔패턴이다. 실선은 오른쪽 영역에서의 공간 평균 빔파워를, 점선은 왼쪽 영역에서의 공간 평균 빔파워를 최대로 하는 가중치로 구해진 빔패턴이다. 공간 평균 빔파워가 큰 영역을 선택하므로, 도 21의 (a)의 경우 음파가
Figure 112012033351484-pat00379
내에서 입사하는 경우 항상 오른쪽 영역으로,
Figure 112012033351484-pat00380
내에서 입사하는 경우 항상 왼쪽 영역으로 추정 영역을 선택한다. 각 경우에 이 과정을 반복하나, 도 21의 (b)의 각 영역의 경계 부분인 약
Figure 112012033351484-pat00381
,
Figure 112012033351484-pat00382
범위에서처럼 각 영역의 대소 관계가 다른 부분이 발생하면 정확한 방향에 대한 추정이 어렵다. 하지만 이 범위의 각 방향에서 계속 추정을 할 경우
Figure 112012033351484-pat00383
에서는
Figure 112012033351484-pat00384
로 추정을,
Figure 112012033351484-pat00385
에서는
Figure 112012033351484-pat00386
로 추정을 한다. 약
Figure 112012033351484-pat00387
의 추정 오차가 생기지만 이는 3dB 밴드 폭
Figure 112012033351484-pat00388
보다 적은 값을 가지므로, 허용 가능한 범위라 생각할 수 있다. 이것은 제안 방법 자체가 가지는 문제이기 보다, 마이크로폰 배열과 관련된 한계점이라고 할 수 있다.
도 21의 (a)에서 (d)까지는 전체 영역
Figure 112012033351484-pat00389
에서의 빔패턴을 나타내고 있으나, 등간격 마이크로폰 배열에서는
Figure 112012033351484-pat00390
Figure 112012033351484-pat00391
에서의 빔패턴이
Figure 112012033351484-pat00392
에서 대칭을 이루고 있으므로, 도 21의 (e)에서 (h)에서는
Figure 112012033351484-pat00393
만을 나타내고 있다. 도 21의 (h)는 도 19의 (g)를 좀 더 세부적으로 보기 위해 나타낸 그림이다.
또 다른 한계점은 도 22를 통해 설명하고자 한다. 도 22는
Figure 112012033351484-pat00394
인 경우에
Figure 112012033351484-pat00395
을 관심 영역으로 하는 빔패턴을 나타내고 있다. 그림에 표시되어 있는 방향인
Figure 112012033351484-pat00396
의 경우에는 관심 영역 내 최대 빔파워에 비해 약
Figure 112012033351484-pat00397
더 작은 값을 가진다. 그러므로 만약 이 방향으로부터 음파가 입사하는 경우에는 정확한 추정이 이루어지기 어렵다. 하지만 이것은 마이크로폰 배열의 형태에 따라 달라지는 값이므로, 만약 도 24와 같이 선형이지만 등간격이 아닌 형태의 마이크로폰 배열을 구성한다면, 또 다른 형태의 빔패턴을 가질 것이다. (도 23 참조)
지연-합 빔형성 방법과 제안 방법의 비교
지연-합 빔형성 방법과 제안 방법과의 비교 및 고찰을 통하여 두 방법간의 차이와 유사점은 어떤 것이 있는지를 알아보기로 한다. (표 1 참조)
먼저, 지연-합 빔형성 방법에서는 음파의 입사 방향을 추정하나, 제안하는 방법은 음파가 입사하는 방향의 범위를 추정한다. 그러므로 제안 방법은 지연-합 빔형성 방법에 비해 연산량이 적다는 장점이 있다. 즉, 보다 빠르게 음파가 입사하는 방향의 범위를 추정할 수 있다. 이 범위는 지연-합 빔형성 방법에서의 3dB 밴드 폭을 최소 기준으로 삼고 있다.
지연-합 빔형성 방법의 경우 각도 분해능
Figure 112012033351484-pat00398
를 정하고, 그에 따라 가중치 및 빔파워를 계산하는 연산량도 변한다. 보다 정확히 방향을 추정하기 위해서는 연산량이 늘어날 것을 예상할 수 있다. 반면 제안 방법은 음파가 입사하는 방향의 범위를 추정하므로 분해능과는 무관하다. 대신, 영역을 어떻게 나누는가와 관련이 있다. 앞 절에서 설명한 예와 같이,
Figure 112012033351484-pat00399
방향에서 음파가 마이크로폰 배열에 입사할 때 지연-합 빔형성 방법에서는
Figure 112012033351484-pat00400
혹은 분해능이 큰 경우에는
Figure 112012033351484-pat00401
에 가까운 방향으로 음파의 입사 방향을 추정한다. 하지만 제안 방법은
Figure 112012033351484-pat00402
를 포함하는 어떤 범위로 음파가 입사하는 방향의 범위를 추정한다.
어떤 마이크로폰 배열을 사용하는가에 따라 빔패턴이 달라지므로, 음파의 입사 방향 추정이 제대로 이루어지지 않는 경우가 발생하지만, 이는 마이크로폰 배열을 바꿈으로 해결 가능하다. 그러므로 마이크로폰 배열에 따른 성능 변화를 고찰하는 연구가 더 진행될 필요가 있다.
지연-합 빔형성 방법과 제안 방법 간의 비교는 표 1과 같다.
Figure 112012033351484-pat00403
2. 각 독립 변수들에 따른 가중치의 변화
2.1 독립 변수
본 장에서는 두 제안 방법(음향 밝기 최대화 방법, 음향 대조 최대화 방법)으로 구하는 가중치가 각 변수들이 바뀔 때에 어떻게 변하는 지를 살펴본다. 먼저 가중치와 관련된 독립 변수들은 다음과 같다.
1) 전파하는 음파의 주파수
Figure 112012033351484-pat00404
혹은 파장
Figure 112012033351484-pat00405
2) 마이크로폰 배열의 총 길이
Figure 112012033351484-pat00406
, 인접 마이크로폰 간의 간격
Figure 112012033351484-pat00407
본 발명에서는 등간격 선형 마이크로폰 배열을 사용하므로 마이크로폰의 개수
Figure 112012033351484-pat00408
Figure 112012033351484-pat00409
Figure 112012033351484-pat00410
로 표현할 수 있다.
Figure 112012033351484-pat00411
3) 대표 방향
Figure 112012033351484-pat00412
와 영역
Figure 112012033351484-pat00413
여기에서 독립 변수 1)과 2)의 값들은 길이와 관련된 변수들이다. 본 발명에서는 주파수 영역에서 가중치를 구하므로, 각 주파수의 파장의 길이에 대해 마이크로폰 배열의 총 길이와 인접 마이크로폰 간의 간격에 따라 가중치가 어떻게 되는지 알아보는 것이 더 효과적이다. 그러므로 가중치와 관련된 독립 변수들을 주파수와의 관계로 다시 쓰면
1) 파장과 인접 마이크로폰 간의 간격 비
Figure 112012033351484-pat00414
2) 파장과 마이크로폰 배열 총 길이의 비
Figure 112012033351484-pat00415
3) 대표 방향
Figure 112012033351484-pat00416
, 영역
Figure 112012033351484-pat00417
과 같다.
각각의 독립 변수가 가중치에 어떤 영향을 주는지 살펴보기 위해서는 한 독립 변수를 변화시킬 때 다른 독립 변수를 고정시킬 필요가 있다. 그러므로 파라메트릭(parametric) 방법으로 각 독립 변수든의 영향을 살펴보고자 한다.
각 독립 변수든의 범위는 다음과 같이 생각할 수 있다.
1) 파장과 인접 마이크로폰 간의 간격 비
Figure 112012033351484-pat00418
공간 앨리어싱이 일어나지 않는 인접 마이크로폰 사이의 간격은 항상 아래 수학식 67을 만족해야 하므로,
Figure 112012033351484-pat00419
Figure 112012033351484-pat00420
의 범위가 된다[22]. 이 독립 변수에 대해서는 각 극한 경우를 살펴본다.
2) 파장과 마이크로폰 배열 총 길이의 비
Figure 112012033351484-pat00421
전파하는 음파의 파장
Figure 112012033351484-pat00422
에 비해서 마이크로폰 배열의 총 길이
Figure 112012033351484-pat00423
이 매우 작아 0에 가까운 경우, 그리고 파장의 절반이 되는 경우, 파장과 같아지는 경우, 파장에 비해 긴 경우에 대하여 살펴본다.
3) 대표 방향
Figure 112012033351484-pat00424
, 영역
Figure 112012033351484-pat00425
영역
Figure 112012033351484-pat00426
인 한 방향에 대해서부터 관심 영역이
Figure 112012033351484-pat00427
가 되는 경우까지 고찰한다. 그리고 이 때 대표 방향이
Figure 112012033351484-pat00428
인 경우와
Figure 112012033351484-pat00429
인 두 가지 경우에 대해 살펴본다.
Figure 112012033351484-pat00430
의 경우는 대표 방향이
Figure 112012033351484-pat00431
일 때부터
Figure 112012033351484-pat00432
까지 변하는 것을 의미한다.
즉, 관심 영역은 한 방향에서부터 전체 영역에 대하여 가중치 및 빔파워의 변화를 관찰한다.
2.2 대표 방향
Figure 112012033351484-pat00433
, 마이크로폰 배열의 길이가 바뀌는 경우
2.2.1
Figure 112012033351484-pat00434
이 경우에는 마이크로폰이 2개가 있더라도 마치 마이크로폰이 1개인 것처럼 거동하며, 관심 영역이 변함에도 가중치의 크기와 위상은 거의 동일하다. 도 25에는 각 방법의 목적함수로부터 구해지는 가중치 벡터를 나타내고 있고, 여기서 영역의 범위
Figure 112012033351484-pat00435
은 각각
Figure 112012033351484-pat00436
일 때이다. 이 때에는 두 공간 상관행렬
Figure 112012033351484-pat00437
Figure 112012033351484-pat00438
의 모든 성분이 1에 가까워진다. 음향 대조 방법의 목적함수로부터 가중치 벡터를 구할 때
Figure 112012033351484-pat00439
를 하게 되는데, 마이크로폰의 개수가 증가할 때를 생각해 보자.
Figure 112012033351484-pat00440
를 하기 위해 구해지는 행렬식(determinant)이 점점 더 0에 가까워지기 때문에 마이크로폰의 개수가 증가하면 가중치 벡터를 구하기 어려울 것을 예상할 수 있다.
2.2.2
Figure 112012033351484-pat00441
음향 밝기 최대화 방법의 경우 관심 영역이 한 방향일 때 평면파 모델의 지연-합 빔형성 방법의 가중치와 같다라는 것을 1장에서 밝혔다. 그렇다면 음향 밝기 최대화 방법을 사용해 얻는 빔파워의 최소 주엽의 폭을 빔패턴으로부터 예상할 수 있다. 이 경우에는 최소 주엽의 폭이 수학식 19로부터
Figure 112012033351484-pat00442
임을 알 수 있다.
도 26에는 각각의 가중치 벡터와 빔파워 분포를 보여주고 있다. 영역의 범위
Figure 112012033351484-pat00443
는 각각
Figure 112012033351484-pat00444
를 나타낸다. 이 때 음향 밝기 최대화 방법에서 구하는 빔파워는 영역의 범위가 넓어짐에 따라 불연속한 지점이 생긴다. 그 이유는 음향 밝기(brightness)를 통해서 설명할 수 있다. 음향 밝기 최대화 방법에서는 음향 밝기를 최대화 하는데, 이 음향 밝기는 공간 상관행렬
Figure 112012033351484-pat00445
가 가지는 최대 고유치이다. 영역의 범위가 넓어짐에 따라
Figure 112012033351484-pat00446
의 고유치의 대소가 바뀌는 경우가 발생하고, 이 때부터 그 전과는 다른 고유 벡터를 가중치 벡터로 선정하기 때문에 빔파워가 다른 형태를 띈다.
만약, 한 고유치만을 계속 선정한다면 관심 영역이 넓어짐에따라 빔파워 분포 형태가 갑자기 바뀌는 현상은 발생하지 않는다. (도 27, 도 28 참조) 하지만 이 경우에는 관심 영역에서의 공간 평균 빔파워를 최대로 한다는 음향 밝기 최대화 방법의 목적을 이룰 수 없다. 다른 조건에서도 이와 같은 현상이 발생할 수 있지만, 그 때가 음향 밝기를 최대로 만드는 경우이다.
도 27 (a)는 음향 밝기를 최대로 하는 가중치 벡터로 구해지는 빔파워 분포와 그 때의 고유치를 나타내고 있다. 첫번째 음향 밝기(first brightness)와 두 번째 음향 밝기(second brightness)가 약
Figure 112012033351484-pat00447
부근에서 대소가 바뀌고 있고 이 때 빔파워 분포가 바뀐다. 도 27 (b)는 공간 평균 빔파워의 최대화와 관계없이 첫번째 음향 밝기(first brightness)만을 계속 선정하는 경우의 빔파워 분포를 나타내고 있다. 이 때에는 위에서 설명한 것과 마찬가지로 관심 영역이 넓어지더라도 불연속한 형태를 보이지 않는다. 하지만 공간 평균 빔파워가 최대가 되지 않는 경우가 관심 영역을
Figure 112012033351484-pat00448
이후로 정했을 때에 생긴다.
2.2.3.
Figure 112012033351484-pat00449
음향 밝기 최대화 방법에서 영역이 넓어짐에 따라 빔파워 분포가 불연속적인 형태가 나타나는 것을 관찰할 수 있다. 이 때도 앞 절의 설명과 마찬가지로 각 고유치간의 대소가 바뀌어 고유 벡터가 바뀌는 데에서 그 원인을 찾을 수 있다. 도 28 (a)는 관심 영역이 넓어짐에 따라 변하는 빔파워를 나타내고 있다. 여기서는 음향 밝기를 최대로 하는 가중치를 선정하고 있다. 도 28 (b)에서는 첫 번째 음향 밝기의 가중치로 도출되는 빔파워 분포를 나타내고 있다.
이 경우에 대해서 관심 영역이 넓어짐에 따라 가중치 벡터가 어떻게 변하는지를 살펴본다면, 경향을 알 수 있을 것이다. 도 29에는 도 28 (b)의 빔파워 중 몇 가지 경우를 나타내고 그 때의 가중치를 나타내고 있다.
음향 밝기 최대화 방법은
Figure 112012033351484-pat00450
가 각각
Figure 112012033351484-pat00451
를 나타내고, 음향 대조 최대화 방법은
Figure 112012033351484-pat00452
가 각각
Figure 112012033351484-pat00453
를 나타내고 있다. 두 방법에서의 가중치 벡터는 영역이 넓어짐에 따라 가운데가 높아지고 양 끝이 낮아지는 형태를 보인다. 양 끝과 가운데 가중치의 차이가 클수록 빔파워의 주엽은 더 넓어진다. 하지만 이것도 각각의 가중치가 같은 부호이면서 최대의 차이를 보일 때 주엽이 계속 넓어진다. (도 30 참조) 같은 부호를 가지면서 최대의 차이를 보이는 위치는
Figure 112012033351484-pat00454
일 때이고,
Figure 112012033351484-pat00455
가 되면 차이는 더 커지나 각 가중치들의 부호가 바뀐다. 그래서 최대 차이를 가지는 영역의 범위는
Figure 112012033351484-pat00456
일 때이지만, 이 때는 양 끝과 가운데의 가중치 부호가 다르므로 대표 방향
Figure 112012033351484-pat00457
에서 빔파워 값이 최소를 가진다.
음향 대조 최대화 방법의 경우에는 관심 영역의 범위가 넓어짐에 따라 음향 밝기 최대화 방법에 비해 서서히 가중치가 변하는 것을 알 수 있다. 각 가중치가 같은 부호를 유지하되 차이를 크게 하는 형태로 가중치가 변해가고 있으므로, 관심 영역이 넓어짐에 따라서 그에 맞게 주엽의 폭이 넓어지는 것을 알 수 있다.
즉, 관심 영역이 넓어지면 넓어질수록 가중치는 가운데가 높아지고 양 끝이 낮아지는 형태를 보인다. 그리고 이 차이가 크면 클수록 더욱 넓은 주엽을 가지게 되나, 가중치간의 부호가 달라질 경우에는 차이가 크더라도 주엽 외에 부엽의 크기를 더 크게 만드는 경향을 보인다.
2.2.4
Figure 112012033351484-pat00458
도 32에서 나타나는 것과 같이 마이크로폰 배열의 길이가 길어지는 경우에 두 방법으로부터 구해지는 빔파워의 주엽 폭이 좁아진다. 그리고 간단한 경우에서 설명한 것과 같이 마이크로폰 배열의 길이가 길어지면 길어질수록 고유치의 대소가 바뀌는 지점이 더 빨리 생긴다는 것을 관찰할 수 있다. 이는 음향 밝기 최대화 방법에서 관심 영역이 넓어질 때 각도 별 빔파워 분포가 어떻게 나타나는지를 통해서 알 수 있다.
도 31에 나타낸 음향 밝기 최대화 방법에서의 가중치 벡터에 대해서 살펴보면, 관심 영역이 넓어짐에 따라서 가중치의 형태가 가운데는 높아지고 주변으로 갈수록 작아지는 형태를 가진다. 그러나 2.2.3에서 보인 것과 마찬가지로 가중치 벡터의 중간값, 여기서는 5번째 가중치와 다른 가중치 간의 크기 차이를 같은 부호 내에서 더 이상 낼 수 없는 경우, 부호를 바꾸면서 그 차이를 크게 만든다. 이것이 나타나 있는 것이 도 31 (a)에서
Figure 112012033351484-pat00459
의 경우이다. 그리고 그보다 더 관심 영역이 넓어지는 경우에는 가중치 크기는 비슷해지고 각 가중치 간의 위상이
Figure 112012033351484-pat00460
만큼 차이를 보인다. 즉, 이 때에는 가중치의 형태가 삼각형 함수(triangular function)를 띠고, 이 때에는 위상이
Figure 112012033351484-pat00461
변하는 횟수만큼 엽(lobe)이 생기는 것을 알 수 있다.
음향 대조 최대화 방법의 가중치는 영역이 넓어짐에 따라 가중치 벡터의 가운데, 5번째 가중치가 높아진다. 관심 영역이 넓어져 비 관심 영역이 줄면 공간 상관행렬
Figure 112012033351484-pat00462
의 각 성분들이 비슷하게 된다. 그 이유는
Figure 112012033351484-pat00463
인 경우를 다루고 있는데 이는 인접 마이크로폰 사이의 위상 차이가
Figure 112012033351484-pat00464
만큼 나기 때문이다. 그리고 비 관심 영역이 줄어든면 비 관심 영역에서의 대표 방향이
Figure 112012033351484-pat00465
에 가까워진다. 이 때 공간 상관행렬
Figure 112012033351484-pat00466
의 성분이 비슷해 지고, 이 경우에는
Figure 112012033351484-pat00467
일 때와 마찬가지로
Figure 112012033351484-pat00468
의 행렬식이 0에 가까워져 가중치를 구하기 어렵다. 그러므로 음향 대조 최대화 방법에서 관심 영역의 범위가 넓어짐에 따라 형태가 고르지 못한 경우가 발생하게 된다.
2.3 대표 방향
Figure 112012033351484-pat00469
, 마이크로폰 배열의 길이가 바뀌는 경우
2.3.1
Figure 112012033351484-pat00470
영역의 범위가
Figure 112012033351484-pat00471
에서
Figure 112012033351484-pat00472
까지 바뀌는 경우이나 대표 방향
Figure 112012033351484-pat00473
Figure 112012033351484-pat00474
로 고정되는 상황이 아닌,
Figure 112012033351484-pat00475
에서 시작하여 관심 영역에 따라 바뀌는 경우이다.
영역의 범위
Figure 112012033351484-pat00476
인 경우로부터 영역이 넓어지는 경우, 두 마이크로폰 간의 위상차이가
Figure 112012033351484-pat00477
만큼 난다. 그러므로 음향 밝기 최대화 방법과 음향 대조 최대화 방법의 목적함수에서 도출되는 가중치 벡터는 둘 다
Figure 112012033351484-pat00478
을 가진다. 이 경우에는
Figure 112012033351484-pat00479
에서 빔파워가 0이고, dB값으로 표현하면
Figure 112012033351484-pat00480
에서 골이 생긴다. 또, 음향 대조 최대화 방법에서는 관심 영역이 넓어질수록 두 마이크로폰 간의 위상차이를 줄이면서 주엽의 폭을 넓혀간다.
2.3.2
Figure 112012033351484-pat00481
이 조건에서는 마이크로폰의 개수가 홀수가 되면 가운데 마이크로폰의 가중치와 양 끝의 마이크로폰 간의 위상 차이가 만큼 나게 된다. 2.3.1에서와 마찬가지로 관심 영역이
Figure 112012033351484-pat00482
한 방향일 때 음향 밝기 최대화 방법과 음향 대조 최대화 방법의 목적 함수로부터 구해지는 가중치 벡터는 모두
Figure 112012033351484-pat00483
이므로, 이 때 빔파워를 계산해보면 골이 2군데에서 생기는 것을 알 수 있다. (도 34 참조) 음향 밝기 최대화 방법에서의 가중치 벡터는 중간 마이크로폰을 기준으로 삼각형 함수 형태를 가지므로, 피크의 개수만큼 엽이 생기는 것을 예상할 수 있다.
음향 대조 최대화 방법은 각 가중치 사이의 위상 차이가 줄어든면서 주엽의 폭이 넓어져가는 것을 알 수 있다.
2.3.3
Figure 112012033351484-pat00484
도 35 (a)에 나타나는 바와 같이, 음향 밝기 최대화 방법의 목적 함수로부터 구해지는 가중치 벡터는 크기에는 크게 차이가 없으나, 위상 차이가 각 마이크로폰마다
Figure 112012033351484-pat00485
씩 생긴다. 즉 이 때도 가중치 벡터는 삼각형 함수 형태이고,
Figure 112012033351484-pat00486
만큼 위상 차이가 나는 지점의 개수만큼 엽이 생기는 것을 알 수 있다. 이 조건 아래에서는 관심 영역이 넓어지더라도 빔파워의 주엽 혹은 부엽이 다른 경우들에 비해 적은 변화를 보인다.
음향 대조 최대화 방법에서는 영역이 넓어짐에 따라 가중치 벡터의 크기는 벡터의 중간 성분 값이 높아지고 주변으로 갈수록 낮아지는 형태를 띠게 된다. 하지만 2.2.4에서 고찰한 문제가 여기서도 같이 발생한다. 즉 관심 영역이 넓어짐에 따라, 비 관심 영역에서의 공간 상관 행렬
Figure 112012033351484-pat00487
의 성분들이 비슷해져서 행렬식이 0에 가까워 진다. 그래서 가중치 벡터를 구하는 것에 영향을 준다.
2.4 요약 및 결론
음향 밝기 최대화 방법에서는 관심 영역의 범위를 넓혀감에 따라 가중치 벡터의 형태는 가운데가 높아지고 주변으로 갈수록 낮아지는 경향을 보인다. 이 차이가 클수록 더 넓은 주엽을 가진다. 그러나 모든 가중치가 같은 부호를 가질 때, 즉 위상차이가 적을 때에는 이것을 만족하나, 각 가중치의 부호가 다를 때에는 그렇지 않다. 같은 부호 내에서 가중치 간의 크기 차이를 더 낼 수 없으면 어떤 가중치는 부호가 바뀌고, 이 경우 각 가중치 간의 크기 차이는 유지하지만 위상이 반대가 된다. 즉 부엽의 크기를 더 키운다.
그리고 고유 벡터(가중치 벡터)는 항상 동일한 고유치에 의해 선정되지 않고 주어진 조건 아래에서 최대가 되는 고유치에 의해 선정된다. 그러므로 관심 영역을 넓혀가며 가중치 벡터 및 공간 평균 빔파워를 관찰해보면 빔패턴의 변화 형태가 불연속한 구간이 생길 가능성이 있다.
음향 대조 최대화 방법에서도 영역의 범위가 넓어짐에 따라 가중치 벡터의 형태가 가운데는 높고 주변으로 갈수록 낮아지는 경향을 보이나, 음향 밝기 최대화 방법의 목적 함수로부터 구해지는 가중치 벡터에 비해서는 변화하는 정도가 비교적 느리다. 관심 영역의 범위가 넓어지면 비 관심 영역이 줄어든기 때문에, 공간 상관 행렬
Figure 112012033351484-pat00488
의 성분들이 비슷해져 행렬식이 0에 가까워져 고유치 벡터를 구하기 어렵다. 각 방법들이 가지는 특징에 대하여 표 2로 정리하였다. 표 2는 지연-합 빔형성 방법과 음향 밝기/대조 최대화 방법을 비교한 것이다.
Figure 112012033351484-pat00489
3. 실험
본 발명에서 제안한 두 방법의 적용 가능성을 확인하기 위해 두 가지 실험을 진행하였다.
첫 번째 실험은 임의의 방향으로부터 마이크로폰 배열에 음파가 입사하는 경우, 제안 방법으로 입사 방향의 범위를 추정하는 실험으로 제안 방법의 적용 가능성을 알아보고자 했다. 두 번째 실험은 제안 방법의 적용 예(application)로 임의의 공간에 다수의 음원을 배치하여 특정 음원든의 신호를 크게 수신하는 실험이었다.
4 장에서는 위의 두 실험든에 어떤 장비든을 사용하였는지, 실험에서의 관심 주파수 대역 및 사용된 음원과 배치, 그리고 마이크로폰 배열을 어떻게 정하였는지 등을 다룬다.
3.1 실험 장비 구성 및 환경
한국과학기술원 기계공학동 1층의 무향실(anechoic chamber)에서 실험을 수행하였고, 실험에 사용된 장비는 도 36, 도 37, 도 38에 나타낸 것과 같다. 총 장비는 무향실 내부와 외부에 설치된 것으로 나눌 수 있다. 무향실 외부에는 실험을 진행하는데 필요한 각 장비들을 설치하였고, 아래와 같은 성능을 가지고 있다.
1) 무향실(anechoic chamber)
·방의 크기 :
Figure 112012033351484-pat00490
·하한 주파수(cut-off frequency) : 100 Hz
2) 무향실 외부에 설치된 실험 장비
ⓐ 데이터 수집용 컴퓨터
ⓑ 신호 재생용 컴퓨터
ⓒ 데이터 수집 장치(DAQ board) : NI cDAQ- 9178에 NI 9234를 8개 장착
·32채널, 24 Bit
·입력 범위: ±5V
·Sampling rate : 최대 51.2 kHz
ⓓ 다채널 신호 발생기 : Echo Audiofire12
·입력 출력 각각 12채널, 24 Bit
·Sampling rate : 32 kHz ~ 192 kHz
ⓔ 앰프: Anam AA-77 2채널 3대
ⓕ 신호 생성기 : Sony Tektronics AFG320
3) 무향실 내부에 설치된 실험 장비
ⓗ 마이크로폰(microphone) : BSWA MPA416 7개
·주파수 범위 : 20 Hz ~ 20 kHz
·Sensitivity : 50 mV/Pa
ⓘ 스피커(loudspeaker) : JBL 1Xtreme 5개
·주파수 범위 : 50 Hz ~ 20 kHz
3.2 관심 주파수 대역, 마이크로폰 배열 및 스피커 위치 선정
우선 관심 주파수 대역을 선정할 필요가 있는데, 그에 맞게 마이크로폰 배열을 어떻게 할지 정할 수 있기 때문이다. 그리고 두 실험에서 사용하는 음원을 구분할 필요가 있다. 간단한 경우부터 실험을 통해 적용 가능성을 살펴볼 필요가 있으므로, 첫 번째 실험에서는 단일 주파수의 음원을 마이크로폰 배열로부터 임의의 방향에 위치시켜 실험을 진행한다. 두 번째는 적용 예의 실험으로 단일 주파수가 아닌 특정 주파수 대역을 가지는 음원을 사용한다. 이 때에는 음악, 대화 등 여러가지 음원을 생각해 볼 수 있으나, 그 중에서 대화를 하는 상황을 구성하여 대화 중 특정 사람의 음성 신호를 크게 수신할 수 있는지 알아보기로 한다. 그렇다면 실제 대화하는 신호를 다루므로 사람의 목소리가 분포하고 있는 주파수 대역을 관심 주파수 대역으로 선정할 수 있다. 이에 대해서는 전화에서
Figure 112012033351484-pat00491
대역을 통과시키는 음성대역(voiceband)을 관심 주파수 대역으로 선정할 수 있다[33]. 왜냐하면, 전화는 대부분의 경우 사람들의 대화를 전달하는 역할을 수행하므로 관심 주파수 대역을
Figure 112012033351484-pat00492
내에서 선정하는 것이 타당하기 때문이다.
이제 마이크로폰 배열과 스피커 위치를 어떻게 정할지 생각해보자. 마이크로폰 배열 앞의 반원 상에 스피커를 배치하는데, 마이크로폰 배열과 스피커 간격 R을 최대 얼마까지 할 수 있는지를 알아보자. 실험을 진행하는 무향실 한 변의 최대 길이가 3.6m이므로 최대폭으로 선정할 수 있는 거리는 약 1.8m이다. 여기서 거리는 마이크로폰 배열의 중앙에 위치하는 마이크로폰과 각 스피커 간의 거리를 의미한다. 본 실험에서는 R을 1.6m로 선정하였다.
본 발명에서 평면파를 다루므로 스피커가 마이크로폰 배열의 중심으로부터 최대 1.8m 떨어져 있을 때 평면파를 발생시키는지를 확인할 필요가 있다. 스피커에서 발생하는 음압 신호가 마이크로폰 배열에 수신될 때 이것을 평면파로 간주하는 것은 마이크로폰 배열의 중앙에 위치하는 마이크로폰과 양 끝에 위치하는 마이크로폰에 수신되는 음압 신호의 위상 오차(phase error)가
Figure 112012033351484-pat00493
이하일 때이다[37]. 이를 만족할 수 있는 조건으로 마이크로폰 배열의 총 길이
Figure 112012033351484-pat00494
을 0.3m로 선정하였다. (Appendix B 참고)
여기에서 마이크로폰 배열의 중앙에는 기준 마이크로폰을 위치시키고 신호처리 시 앨리어싱(aliasing) 현상이 발생하지 않는 인접 마이크로폰의 간격
Figure 112012033351484-pat00495
를 선정할 필요가 있다. 관심 주파수 대역에서 최소의 파장
Figure 112012033351484-pat00496
은 주파수가
Figure 112012033351484-pat00497
일 때 약 11cm이다. 마이크로폰 사이의 간격
Figure 112012033351484-pat00498
는 최소한 이 파장 길이의 절반 이하가 돼야 하므로, 마이크로폰 배열의 총 길이
Figure 112012033351484-pat00499
Figure 112012033351484-pat00500
를 고려하여 5cm로 선정하였다. 따라서 마이크로폰의 개수
Figure 112012033351484-pat00501
은 7개이고, 마이크로폰의 번호는 왼쪽에서부터 1번으로 정한다. 도 37에는 선정된 마이크로폰 배열을 나타내고 있다.
선정된 각 변수들을 종합하여 보면 마이크로폰 배열의 총 길이
Figure 112012033351484-pat00502
은 0.3m, 마이크로폰의 개수
Figure 112012033351484-pat00503
은 7개, 인접 마이크로폰 사이의 간격
Figure 112012033351484-pat00504
는 5cm, 그리고 마이크로폰 배열의 중심으로부터 각 스피커 사이의 거리
Figure 112012033351484-pat00505
은 1.6m이다. 그리고 관심 주파수 대역은
Figure 112012033351484-pat00506
이다.
이제 각 스피커의 위치 및 개수를 선정해야 한다. 두 번째 실험은 사람들이 대화하는 상황을 표현하고 있으므로, 사람들이 대화할 때 어느 정도 간격으로 서는지 고려하여 스피커의 개수 및 위치를 정할 수 있다. 이에 대해서는 Edward T. Hall의 근접학에 따라 사람들이 대화를 할 때의 거리를 나누는 기준 중 '최단 중립 거리'를 도입한다[20]. 이 거리는 20인치 ~ 36인치(50.8cm∼91.4cm)인데,
Figure 112012033351484-pat00507
이 1.6m일 때 스피커를
Figure 112012033351484-pat00508
간격으로 배치하면 두 스피커 간의 직선 거리가 최단 중립 거리를 만족하는 약 0.8m가 된다. (도 40 참조)
3.3 첫 번째 실험
본 실험에서는 임의의 한 방향으로부터 마이크로폰 배열에 음파가 입사하는 경우, 제안 방법으로 음파가 입사하는 방향의 범위를 추정할 수 있는지를 검증 하였다. 1절과 2절의 내용을 토대로 마이크로폰 배열을 선정하고,
Figure 112012033351484-pat00509
이 1.6m가 되는 반경 위의 한 지점에 스피커를 설치하였다. 무향실에서 실험이 진행됐으므로 자유 음장 조건이라고 간주할 수 있다. (무향실의 차단 주파수
Figure 112012033351484-pat00510
) 스피커로부터 단일 주파수의 신호를 방사시켰는데, 주파수는 음성 대역 내의 임의의 주파수로 선정하였다. 본 실험에서는
Figure 112012033351484-pat00511
에 대해서 실험을 진행했다.
마이크로폰 배열로부터
Figure 112012033351484-pat00512
에 각도기와 줄자, 그리고 실을 사용하여 스피커의 위치를 잡았다. 실험 장비 설치 후 지연-합 빔형성 방법으로
Figure 112012033351484-pat00513
간격으로 음파의 입사 방향을 추정하였다. (도 41 참조) 제안 방법으로 얻는 각 수행 순서에서의 추정 범위는 도 42에 나타냈다. 각 수행 과정에서는 1장에서 모의 실험을 통해서 추정한 것과 동일한 영역을 추정하는 것을 알 수 있다.
이 때 지연-합 빔형성 방법과 제안 방법에서의 연산량은 각각 다음과 같다. 수학식 58로부터 통해 지연-합 빔형성 방법에서의 연산량이 181회이고, 수학식 59를 통해 제안 방법에서의 연산량은 1회 수행시 2회, 2회 수행시 4회, 3회 수행시 6회, 4회 수행시 8회, 5회 수행시 10회, 6회 수행시 12회, 그리고 7회 수행시 14회이다. 본 마이크로폰 배열의 3dB 밴드폭이
Figure 112012033351484-pat00514
이므로 3회 이상 수행 시에 3dB 밴드 폭보다 좁은 범위를 추정한다. 그리고 최대 7회 수행시에도 제안 방법에서의 연산량이 지연-합 빔형성 방법의 연산량보다 적다.
3.4 두 번째 실험
각 음원의 선정 및 영역 결정
실험에 필요한 각 음원들은 연령대와 성별을 다르게 선정하였다. 즉, 대화를 하고 있는 아버지와 딸, 대화를 하고 있는 할아버지와 손자, 그리고 방송에서 나오는 남성 아나운서의 목소리를 음원으로 선정하였다. (음원의 출처: [47], [54]) 두 사람이 대화를 주고 받는 경우 각 음원 내에서도 신호가 발생하지 않는 시간이 있고 그 때에는 주파수 성분이 존재하지 않는 것을 예상할 수 있다. 각 음원은 사람의 목소리 신호이고, 갑자기 커지거나 작아지는 것이 아닌 일상적인 대화를 나누는 것으로 선정하였다. 실험 시 각 음압 신호의 최대값을 같게 만들고 실험을 진행하였다. 이 경우 실제 사람들이 대화를 나누는 상황을 재연할 수 있을 것이다.
각 음원들이 어떤 주파수 대역의 신호를 가지고 있는지는 도 41에서 도 45에 스펙트로그램(spectrogram)으로 나타냈다. 이를 통해 음성대역인
Figure 112012033351484-pat00515
대역 내에 주파수 신호가 퍼져있음을 알 수 있다. 스펙트로그램은 총 데이터 길이는 20초, 주파수 분해능은
Figure 112012033351484-pat00516
이다. 샘플링 주파수
Figure 112012033351484-pat00517
로 창문 함수는 사각 창문 함수(rectangular window)를 사용하였다.
그리고 도 48에 나타낸 바와 같이, 각각
Figure 112012033351484-pat00518
간격으로
Figure 112012033351484-pat00519
에 딸,
Figure 112012033351484-pat00520
에 아버지,
Figure 112012033351484-pat00521
에 남성 아나운서,
Figure 112012033351484-pat00522
에 손자, 그리고
Figure 112012033351484-pat00523
에 할아버지 음원을 각각 배치하였다. 음원은 딸과 아버지의 대화, 손자와 할아버지의 대화를 사람별로 분리한 것과 남성 아나운서의 뉴스 진행 내용으로 총 5 개를 사용하였다. 이 때 대화를 진행하는 아버지와 딸 그리고 할아버지와 손자의 영역을 각각 관심 영역으로 지향시킬 경우
Figure 112012033351484-pat00524
간격으로 지향하는 범위를 정할 수 있다. 따라서 한 번에 지향하는 관심 영역의 범위는
Figure 112012033351484-pat00525
로 선정한다. 즉, (1)
Figure 112012033351484-pat00526
를 관심 영역으로 선정하는 경우 아버지와 딸의 대화를 다른 신호든보다 크게 수신되고, (2)
Figure 112012033351484-pat00527
를 관심 영역으로 선정하는 경우 남성 아나운서의 신호를 다른 신호든보다 크게 수신된다. 마지막으로 (3)
Figure 112012033351484-pat00528
를 관심 영역으로 선정하면 할아버지와 손자의 대화를 다른 신호든보다 크게 수신한다. 각 음원이 어떤 음절로 구성되어 있는지는 Appendix C.에 첨부하였다.
3.5 가중치 벡터의 형태
제안 방법으로 가중치를 도출하면 마이크로폰의 개수
Figure 112012033351484-pat00529
만큼, 그리고 관심 주파수 대역의 범위만큼 나온다. 또 관심 영역에 따라 다른 가중치가 도출되므로 모든 가중치에 대해 보여주는 것에는 한계가 있다. 그러므로 그 중 대표적으로 3개의 주파수(
Figure 112012033351484-pat00530
)를 선정하여 각 방법에서 구해지는 가중치를 보이고, 그에 따라 빔패턴이 어떻게 형성되는지를 살펴본다.
1)
Figure 112012033351484-pat00531
,
Figure 112012033351484-pat00532
를 관심 영역으로 각각 선정할 때의 가중치 벡터
이 경우에는 각각
Figure 112012033351484-pat00533
를 기준으로 대칭이기 때문에 한 번에 같이 나타낸다. 평면파 모델의 지연-합 빔형성 방법의 경우 각 영역에서의 각각
Figure 112012033351484-pat00534
를 대표 방향으로 지향하고 있다. 그리고 음향 밝기 최대화 방법과 음향 대조 최대화 방법의 경우 각 마이크로폰 사이의 시간 지연을 통해서 지향하고 있는 방향을 확인할 수 있는데 이는 각각 아래의 표 3 내지 표 5와 같이 나타난다.
아래의 표 3 내지 표 5는 각 마이크로폰 사이의 시간 지연을 통해 알 수 있는 지향 방향을 각각 나타내고 있다. 여기서, 여기서 A : 평면파 모델의 지연-합 빔형성 방법, B : 음향 밝기 최대화 방법, C : 음향 대조 최대화 방법을 나타낸다.
Figure 112012033351484-pat00535
Figure 112012033351484-pat00536
Figure 112012033351484-pat00537
인접 마이크로폰 사이의 위상 차이를 벡터
Figure 112012033351484-pat00538
Figure 112012033351484-pat00539
와 같이 표현이 가능하다.
Figure 112012033351484-pat00540
여기서
Figure 112012033351484-pat00541
는 인접 마이크로폰 사이의 시간 지연을 의미하므로 마이크로폰의 총
Figure 112012033351484-pat00542
개수보다 1개 작은 값을 가진다. 그리고 각 시간지연이 다 같다면 지향하는 방향인
Figure 112012033351484-pat00543
도 모두 같은 값을 가진다. 평면파 모델의 지연-합 빔형성 방법의 경우가 모두 같은 값을 가진다.
수학식 71과 수학식 72를 통해
Figure 112012033351484-pat00544
Figure 112012033351484-pat00545
임을 알 수 있다. 본 실험에서 선정한 마이크로폰 배열로 구해지는 음향 대조 최대화 방법에서의 가중치가
Figure 112012033351484-pat00546
Figure 112012033351484-pat00547
에서 어디를 지향하게 되는지는 수학식 73의 우변인 역코사인 항의 값이 허수가 되어 찾을 수가 없었다.
가중치 벡터를 알아보기 위해 선정한 각 주파수에서 음향 밝기 최대화 방법과 음향 대조 최대화 방법의 위상을 확인해 보면 직선 형태임을 알 수 있다. 이는 각 마이크로폰이 완전히 다른 방향을 지향하게 되는 것이 아닌 어떤 분산을 가지는 방향에 대해 지향하고 있다는 것을 의미한다.
Figure 112012033351484-pat00548
에서의 음향 밝기 최대화 방법과 음향 대조 최대화 방법의 가중치 벡터를 보면 각각 대표 방향
Figure 112012033351484-pat00549
를 크게 벗어나지 않는다. 이 대표 방향을 중심으로 각 마이크로폰의 가중치 크기를 바꿈으로써 관심 영역에서의 빔패턴을 각 목적에 맞도록 조절하는 역할을 한다.
2)
Figure 112012033351484-pat00550
를 관심 영역으로 선정할 때의 가중치 벡터
관심 영역을
Figure 112012033351484-pat00551
인 경우에도 시간 지연을 통해 대표 방향
Figure 112012033351484-pat00552
를 중심으로 각 방법에서 가중치를 도출하는 것을 알 수 있다.
Figure 112012033351484-pat00553
에서 음향 밝기 최대화 방법은 주엽을 2개 가지는데 이에 대해서는 2장에서 설명하고 있다.
아래의 표 6 내지 표 8은 각 마이크로폰 사이의 시간 지연을 통해 알 수 있는 지향 방향을 나타낸 것이다. 여기서, A : 평면파 모델의 지연-합 빔형성 방법, B : 음향 밝기 최대화 방법, C : 음향 대조 최대화 방법을 나타낸다.
Figure 112012033351484-pat00554
Figure 112012033351484-pat00555
Figure 112012033351484-pat00556
3.6 실험 결과
3.1절 ∼ 3.2절에서 각 변수들을 어떻게 선정했는지를 기술하였다. 그리고 3.5절에서는 관심 주파수 대역에서 적용하는 각 방법들의 가중치 벡터들이 어떤 형태인지, 또, 이를 적용했을 때 각 빔패턴의 변화를 살펴보았다. 이 내용들을 바탕으로 두 번째 실험을 진행하였고 그 결과에 대해 기술하고자 한다.
무향실에서 실험이 진행되었고, 신호 대 잡음비는 관심 주파수 대역 내에서 25 dB 이상을 확보할 수 있었으므로 잡음의 의한 영향은 무시할 수 있다.
본 실험은 단일 주파수가 아닌, 상황을 설정을 하여 사람들의 목소리 신호를 음원으로 선정하였다. 주파수 대역을 가지는 신호이고 주파수 별로 그 크기가 일정한 신호들이 아니기 때문에 결과를 정량화하여 표현하기가 어렵다. 그러므로 총 세 가지 경우. 관심 영역이
Figure 112012033351484-pat00557
에 대하여 각 방법의 가중치를 적용한 결과를 컴퓨터 웨이브 파일로 작성하였다.
파일은 총 4개로 구성이 되어있다. 즉 1) 마이크로폰 배열의 중앙에 위치하고 있는 마이크로폰이 받아들이는 신호에 대한 파일, 2)
Figure 112012033351484-pat00558
를 관심 영역으로 하였을 때의 각 방법을 적용한 파일, 3)
Figure 112012033351484-pat00559
를 관심 영역으로 하였을 때의 각 방법을 적용한 파일, 4)
Figure 112012033351484-pat00560
를 관심 영역으로 하였을 때 각 방법을 적용한 파일이다.
마이크로폰 배열의 중앙에 위치하고 있는 마이크로폰이 받아들이는 신호는 각 음원들과 거리가 모두 같으므로 어느 방향에서 어떤 음원의 음압 신호가 수신되는지를 알기 어렵다. 이에 반해 2), 3), 4)에서와 같이 각 관심 영역을 지향하고 있을 때에는 원래의 신호에 비해 훨씬 그 관심 영역의 신호를 잘 파악할 수 있다. 도 59에서 도 62는 원래 신호와 각 방법을 적용한 신호를 보여주고 있다.
여기서, 도 61은 관심 주파수 대역만을 가지고 있는 신호(마이크로폰 배열의 중앙에 위치한 마이크로폰으로부터의 신호)를 나타낸 도면이고, 도 62는 관심 영역이 인 경우의 각 방법을 적용한 시간 영역 신호(아버지와 딸의 대화)를 나타낸 도면이고, 도 61은 관심 영역이 인 경우의 각 방법을 적용한 시간 영역 신호(남자 아나운서의 뉴스 대본)을 나타낸 도면이고, 도 62는 관심 영역이 인 경우의 각 방법을 적용한 시간 영역 신호(할아버지와 손자의 대화)를 나타낸 도면이다.
3.7 요약 및 결론
3장에서는 제안 방법의 적용 가능성을 알아보기 위해 두 가지 실험을 진행한 결과를 기술하였다. 첫 번째 실험에서는 간단한 경우에 대한 실험으로, 단일 주파수의 음파가 마이크로폰 배열에 입사하는 경우 제안 방법으로 이 입사 방향의 범위를 추정할 수 있는가 검증하는 실험이었다. 두 번째 실험에서는 적용 예로 관심 영역의 신호를 다른 영역에 비해 상대적으로 크게 수신하는 것이 가능한지를 확인하였다.
각 경우에 대해 도출되는 각 방법의 가중치 및 빔패턴을 통해서 관심 영역을 선정하였을 때 각 방법이 대표 방향
Figure 112012033351484-pat00561
를 향하는 것을 알 수 있었다. 각 방법의 가중치를 적용 후 그 결과를 들어보았을 때, 관심 영역의 신호가 다른 영역의 신호에 비해 상대적으로 크게 들리는 것을 알 수 있는데, 이에 대해서는 정량화하기가 어려워 웨이브 파일로 제작하였다.
빔형성 방법의 분해능
빔형성 방법의 분해능을 나타내는 지표는 대표적으로 아래와 같이 2가지를 들 수 있다[43].
1) 3dB 밴드 폭(3dB bandwidth)
2) 최대 부엽 레벨(MSL, Maximum Sidelobe Level)
도 65는 각 지표를 나타내고 있다. 먼저 3dB 밴드 폭은 빔파워가 최대인 지점으로부터 빔파워가 절반인 지점까지의 간격을 말한다. 이 값은 방향을 추정할 때에는 각도(angle)고, 위치를 추정할 때에는 거리(distance)이다.
음파의 입사 방향을 추정할 경우 3dB 밴드 폭
Figure 112012033351484-pat00562
는 수학식 11로부터,
Figure 112012033351484-pat00563
이다. 여기서 ±의 의미는 도 65에 나타낸 것과 같이, 3dB 밴드 폭의 각 경계를 나타내고 있다. 이를 싱크 함수로 다시 쓰면,
Figure 112012033351484-pat00564
이다. 싱크 함수(sinc function)의 변수 값이 약 1.392가 될 때
Figure 112012033351484-pat00565
를 만족하므로, 3dB 밴드 폭은
Figure 112012033351484-pat00566
와 같이 쓸 수 있다. 최대 부엽 레벨은 주엽과 부엽간의 빔파워 차이로, 이 값이 클수록 분해능이 크다는 것을 의미한다. 이 두 가지 분해능 지표는 음원의 주파수, 마이크로폰의 개수 및 인접 마이크로폰 사이의 간격과 관련이 있다.
평면파 확인
컴퓨터 모사 실험의 경우 평면파를 모델링 할 수 있지만, 실험에서는 스피커를 사용하기 때문에 실제로 평면파가 구현되는지는 항상 확인을 하여야 한다. 그래서 관심 주파수 대역을 정한 뒤 그 대역에서 평면파가 구현되는지를 프레스넬 영역(Fresnel region)과 프라운호퍼 영역(Fraunhofer re-gion)의 근거리 장(near field)과 원거리 장(far field)을 나누는 기준으로 확인할 수 있다. [37]
도 66과 같은 실험조건 아래에서, 마이크로폰 배열에 음파가 평면파로 수신되는지 확인할 수 있는 조건을 표 9에 표시하였다. 아래의 표 9는 근거리장(near field)과 원거리장(far field)을 나누는 기준을 나타낸 것이다.
Figure 112012033351484-pat00567
본 실험에서는 관심 주파수 대역이
Figure 112012033351484-pat00568
이므로, 이 중에서 마이크로폰 배열과 음원간의 거리
Figure 112012033351484-pat00569
이 가장 멀게 되는 주파수
Figure 112012033351484-pat00570
Figure 112012033351484-pat00571
로 이 때의
Figure 112012033351484-pat00572
Figure 112012033351484-pat00573
이고, 본 실험에서 선정한
Figure 112012033351484-pat00574
은 1.6m이므로 이 조건을 만족한다. 따라서 본 실험에서 사용하고 있는 음원으로부터 방사되는 음파의 파면은 관심 주파수 대역 내의 각 주파수에서 평면파로 간주할 수 있다.
이를 표현하는 또 다른 방법으로는 위상 오차(phase error)라는 값이 있다. 이는 마이크로폰 배열의 수직인
Figure 112012033351484-pat00575
방향에 스피커를 설치하고, 이로부터 순음 성분을 틀어 마이크로폰 배열에 신호가 수신 될 때, 마이크로폰 배열의 중앙과 양 끝에 각각 위치하고 있는 마이크로폰 사이의 위상 오차가
Figure 112012033351484-pat00576
이하면 평면파로 간주하는 것이다.
이에 대해 실험 시 순음 성분
Figure 112012033351484-pat00577
를 스피커가 방사하고 이를 마이크로폰 배열이 받았을 때의 위상 오차를 도 65에 나타내었다. 중앙과 양 끝에 각각 위치하고 있는 마이크로폰 사이의 위상 오차는 각각
Figure 112012033351484-pat00578
로 위상 오차가
Figure 112012033351484-pat00579
와의 에러가 각각 약
Figure 112012033351484-pat00580
이므로
Figure 112012033351484-pat00581
이하의 성분이 마이크로폰 배열에 수신될 때 각 주파수에서 평면파로 간주할 수 있다.
최대 빔파워가 되는 방향에 대한 수학적 증명
아래와 같은 방법으로도 평면파 음파가 공간 상에서 전파되어 마이크로폰 배열에 수신될 때, 가중치 함수(혹은 스캔 함수)에서의 방향
Figure 112012033351484-pat00582
와 실제 음파의 입사 방향
Figure 112012033351484-pat00583
가 일치할 때 빔파워가 최대임을 증명할 수 있다.
Figure 112012033351484-pat00584
와 같은데, 여기서 코쉬-슈바르츠 부등식(Cauchy-Schwarz inequality)을 사용하면 아래와 같은 수식으로 표현할 수 있다.
Figure 112012033351484-pat00585
이 말은 빔파워
Figure 112012033351484-pat00586
가 가질 수 있는 최대값은 1이고, 이 최대값은
Figure 112012033351484-pat00587
혹은
Figure 112012033351484-pat00588
일 때 발생한다. 그러므로 가중치 함수에서의 방향과 실제 음파의 입사 방향이 일치할 때에 항상 빔파워가 최대인 것이 위의 방법으로도 증명 가능하다.
제안 방법에서 가중치를 구하는 데 필요한 계산량
가중치를 구하는 데 2가지 경우에 대해 생각해본다.
첫 번째, 영역이 주어졌을 때 가중치를 구하기 위해 필요한 사칙연산 횟수를 알아본다. 이를 일반적으로 연산 횟수(operation count)라는 용어로 사용하고 있다. 본 발명에서 다루고 있는 문제는 수학식 29에서와 같은
Figure 112012033351484-pat00589
차 고유치 문제로, 이는 수치해석적으로 구할 수 있다. 이 때 관심 영역에서의 공간 상관 행렬
Figure 112012033351484-pat00590
는 항상 허미션 행렬(Hermitian matrix)이므로, 슈르 분해와 대각화(Schur factorization and diagonalization)를 통해 구하는 연산 횟수는 일반 고유치 문제보다 더 적은 값을 가진다. 마이크로폰 개수 M이 충분히 많은 경우 연산 횟수는
Figure 112012033351484-pat00591
로 쓸 수 있다[42]. 마이크로폰의 개수가 늘어날수록 연산 횟수가 증가하지만, 이는 영역이 정해지면 사전에 미리 구할 수 있는 값이다.
두 번째, 각 영역마다 한 개씩 가중치 벡터를 구하는데, 반복 수행 횟수
Figure 112012033351484-pat00592
에 따라 얼마만큼의 가중치 벡터를 구하는가 생각해보자. 도 68 (a)와 같이 전체 영역
Figure 112012033351484-pat00593
를 두 영역으로 나누어 각 영역에서의 가중치를 구하는 데
Figure 112012033351484-pat00594
번의 계산이 필요하다. 두 번째 반복 수행에서는 첫 번째 수행에서 나누었던 영역을 다시 이등분한다. (도 66 (b) 참조) 이 경우 각 영역에서의 가중치를 구하는 데
Figure 112012033351484-pat00595
번의 계산이 필요하다. 즉, 수행 횟수가 증가할 때마다 2의 지수승으로 커지고,
Figure 112012033351484-pat00596
번째 수행에서는
Figure 112012033351484-pat00597
번의 계산을 수행한다. 최종적으로
Figure 112012033351484-pat00598
번 계산을 수행하였을 경우, 각 수행 과정에서 가중치를 구하는 데 필요한 계산 횟수를 모두 더하면 등비수열이므로 이는
Figure 112012033351484-pat00599
과 같이 표현할 수 있다. 이는 영역을 나누는 횟수에 관련이 있고, 각도 분해능
Figure 112012033351484-pat00600
와는 무관하다. 이 두 가지 값든이 가중치를 계산하는 데 필요한 계산량이라고 할 수 있다.
두 방향 추정에 대해 제안 방법 적용
신호 대 잡음비(Signal to Noise Ratio, SNR)에 따른 성능 변화
만약, 두 방향에서 음파가 입사하는 경우는 어떤가 생각해 보자. 이 때에는 우리가 원하는 음압 신호가 신호(signal)이고, 다른 방향으로부터 마이크로폰 배열에 수신되는 신호가 잡음(noise)이다. 신호 대 잡음비(SNR)가 어느 정도 일 때 음파의 입사 방향이 추정가능한지를 알아보자.
임의의 방향
Figure 112012033351484-pat00601
으로부터 전파되어 마이크로폰 배열에 입사되는 단일 주파수의 음압 신호를 각각
Figure 112012033351484-pat00602
이라고 한다면 이는 다음과 같이 쓸 수 있다.
Figure 112012033351484-pat00603
여기서,
Figure 112012033351484-pat00604
는 각 방향에서 마이크로폰 배열에 수신되는 음압 신호의 크기를 나타낸다. 그렇다면 신호 대 잡음비는 다음과 같은 dB값의 수식으로 표현이 가능하다.[3]
Figure 112012033351484-pat00605
이 경우 신호 대 잡음비와 음파의 입사 방향과는 수식상으로 관련된 부분이 없기 때문에 각 음압 신호의 절대 크기만을 고려하게 된다. 즉, 신호 대 잡음비가 높은 경우에는 상대적으로 잡음의 영향이 줄어들기 때문에 음파의 입사 방향 추정이 더 정확히 이루어지는 것을 예상할 수 있다. 앞에서 사용한 간단한 경우를 통해 신호 대 잡음비에 따른 성능변화를 알아보기로 한다. 이 때 음파의 주파수는
Figure 112012033351484-pat00606
이고, 입사하는 방향은 임의로
Figure 112012033351484-pat00607
로 정하여 이 경우를 통해 살펴보기로 한다.
1)
Figure 112012033351484-pat00608
두 방향에서 동시에 음파가 입사하고, 각 방향의 음압 신호가 가지는 절대 크기가 같은 경우이다. 이 때 주어진 마이크로폰 배열로 얻게 되는 지연-합 빔형성 방법에서의 빔파워 분포를 살펴보면 도 69와 같다. 이 분포에서 보면 음파가 입사한다고 추정할 수 있는 방향은 빔파워가 최대인
Figure 112012033351484-pat00609
이다. 이런 결과가 나오는 것은 신호 대 잡음비가 충분히 확보되지 않았기 때문이라고 생각할 수 있다.
제안 방법을 반복 수행하면서 얻는 결과는 도 70과 같다. 제안 방법으로 3회 반복 수행을 하였을 때 음파가 입사하는 방향의 범위는
Figure 112012033351484-pat00610
로 추정할 수 있다. 이는 주어진 마이크로폰 배열에서의 3dB 밴드 폭인
Figure 112012033351484-pat00611
보다 적은 값을 나타낸다. 그러나 4회 이상 반복 수행을 할 경우에는 범위 추정이 어렵다. 이 역시도 충분히 신호 대 잡음 비가 확보되지 않았기 때문이라고 예상할 수 있다.
2)
Figure 112012033351484-pat00612
주어진 마이크로폰 배열을 사용하여 얻는 지연-합 빔형성 방법에서의 빔파워 분포는 도 71과 같다. 여기서는 신호 대 잡음비가
Figure 112012033351484-pat00613
인 경우보다 더 정확히
Figure 112012033351484-pat00614
로 음파의 입사 방향을 추정한다. 제안 방법에서 반복 수행하여 얻게 되는 결과를 도 72에 나타냈고, 이 때 3회 반복 수행시 추정 범위는
Figure 112012033351484-pat00615
이다. 더 반복하는 경우에도 음파가 입사하는 방향을 포함하는 범위를 추정하게 되고, 이를 통해 신호 대 잡음비가 충분히 확보되는 것이 필요하다고 예상할 수 있다.
2개 이상의 방향에서 음파가 입사하는 경우 연산량 비교
만약 음파의 입사 방향을 2개 이상 추정하기 위해서는 어떻게 해야 할까? 이에 대해서는 다음과 같이 생각하여보자. 하나의 음파의 입사 방향 범위를 추정하는 데 제안 방법을 적용하는 경우에는 항상 두 영역 중 공간 평균 빔파워가 큰 영역에 음파의 입사 방향이 있다는 가정을 가지고 있다. 다시 말해, 두 영역을 비교하여 공간 평균 빔파워가 상대적으로 작은 영역에 대해서는 고려하지 않겠다는 의미이다.
만약 이를 보완하여, 3dB 밴드 폭을 도입하면 2개 이상의 음파가 입사하는 경우에 적용할 수 있을 것이다. 즉, 사용자가 공간 평균 빔파워에 대해 역치(threshold)를 설정하여, 역치 이상에서는 해당 영역 내부에 음파의 입사 방향이 존재한다고 추정하는 것이다. 이 역치를 두 영역간의 공간 평균 빔파워 비로 정의하면 다음과 같다.
Figure 112012033351484-pat00616
제안 방법은 각 영역이 가지는 공간 평균 빔파워 값의 상대적인 크기 차이를 비교하여 음파가 입사하는 방향의 범위를 추정하는 방법이다. 이 차이가 예를 들어,
Figure 112012033351484-pat00617
와 같이 수치적으로 매우 작은 경우에는 두 영역 중 어디에 음파가 입사하는 방향이 존재하는지 추정하는 것이 어려울 수 있다. 그러므로 이 역치 값이 일정 수치 이하로 들어올 때 각 영역에 음파가 입사하는 방향이 존재한다고 가정하는 것이다. 그리하여 영역 별로 독립적으로 음파가 입사하는 방향의 범위를 추정하는 과정을 반복 수행해서 각각의 추정 범위를 도출해 내는 과정을 따른다.
음파가 2개 이상 입사하는 경우에 대해서 제안 방법이 연산에서 효율적인지 알아보자. 음파가 2개의 방향에서 입사할 때 연산량이 가장 많을 것으로 생각할 수 있는 경우는
Figure 112012033351484-pat00618
의 각 영역에 음파의 입사 방향이 존재할 때이다. 즉, 첫 번째 추정 과정에서 각 영역에 음파의 입사 방향이 존재하는 것으로 추정 될 때이다. 이 때 연산량은
Figure 112012033351484-pat00619
이다. 즉, 가중치를 계산하는 횟수와 빔파워를 계산하는 횟수가 같은 경우이다. 만약
Figure 112012033351484-pat00620
인 경우의 지연-합 빔형성 방법과 연산량을 비교해 본다면,
Figure 112012033351484-pat00621
이므로, 6회 반복 수행까지 제안 방법의 연산량이 더 적은 것을 알 수 있다. 추정 범위는 마이크로폰 배열의 3dB 밴드 폭을 기준으로 제안하였으므로, 최대 반복 횟수와는 관련이 없다. 도 73에는 추정 과정을 순서도로 나타내고 있다.
그렇다면 실제로 적용이 가능한지 간단한 경우에 대해 고찰해보자. 앞의 예시에서 사용한 마이크로폰 배열을 사용하고, 음파가 각각
Figure 112012033351484-pat00622
에서 입사하는 경우 두 음파가 입사하는 방향의 범위를 각각 추정할 수 있는지 알아보자. 이 때 입사 주파수는
Figure 112012033351484-pat00623
이고, 신호 대 잡음비는
Figure 112012033351484-pat00624
인 경우를 고려한다. 역치
Figure 112012033351484-pat00625
Figure 112012033351484-pat00626
의 두 빔파워 차이를 3dB로 설정하면, 역치 이하일 때에는 각 영역 내부에 음파의 입사 방향이 각각 존재한다고 추정한다.
영역을
Figure 112012033351484-pat00627
Figure 112012033351484-pat00628
로 나눴을 때 계산되는 역치
Figure 112012033351484-pat00629
는 2dB이다. 그러므로
Figure 112012033351484-pat00630
Figure 112012033351484-pat00631
각 영역에 대해 독립적으로 음파가 입사하는 방향의 범위를 추정한다. 도 74와 도 75는 각 수행 과정에서 추정하는 음파가 입사하는 방향의 범위를 나타내고 있고, 아래의 표 10에는 각 수행 과정에서 얻는 역치
Figure 112012033351484-pat00632
를 나타내고 있다. 이를 통해 본 예제의 선형 마이크로폰 배열이 가지는 3dB 밴드 폭인
Figure 112012033351484-pat00633
보다 더 좁은 범위를 추정하는 것이 가능한 것을 알 수 있다.
Figure 112012033351484-pat00634
4. 요약 및 결론
본 발명에서는 영역 관점에서 음파가 입사하는 방향의 범위를 추정하는 방법에 대해 다루었다. 지연-합 빔형성 방법에서는 음파가 입사하는 방향 혹은 음원의 위치를 추정하는 것과 달리 음파가 입사하는 방향의 범위를 추정하여 연산량이 적은 방법을 제안하였다.
이를 위해 영역 관점에서 구해지는 공간 평균 빔파워를 이용하는 방법을 두 가지 제안하였다. 첫 번째는 음향 밝기 최대화 방법으로 이는 가중치 벡터의 노옴이 제한되어 있을 때 관심 영역 내의 공간 평균 빔파워를 최대로 하는 가중치를 구하는 방법이다. 두 번째는 음향 대조 최대화 방법으로 관심 영역과 비 관심 영역간의 공간 평균 빔파워 비를 최대화하는 가중치를 구하는 방법이다. 이 문제에서 구해지는 최대 고유치 및 최대 고유벡터가 구하고자 하는 각 방법에서의 가중치이다.
각 방법에서 1) 관심 영역이 한 방향, 2) 관심 영역이 전체 영역인 경우에 대한 해석적 접근을 시도하였다. 관심 영역이 한 방향인 경우 음향 밝기 최대화 방법에서 구해지는 가중치 벡터는 평면파 모델의 지연-합 빔형성 방법의 가중치 벡터와 같고, 음향 대조 최대화 방법에서는 주파수와 인접 마이크로폰 사이의 간격에 따라 음향 밝기 최대화 방법과 같은 해를 가지는 것을 보였다.
관심 영역이 전체 영역인 경우에 대해서는 마이크로폰의 개수가 2개, 3개인 경우에 대한 음향 밝기 및 가중치 벡터를 구하였다. 제안 방법에서는 항상 최대 고유치와 그에 따르는 고유 벡터를 음향 밝기, 가중치 벡터로 각각 선정하는데, 이 값이 하나의 고유치로부터 구해지는 것이 아닌 주파수와 인접 마이크로폰 사이의 간격에 따라 고유치의 대소관계가 바뀌고 그에 따라 고유치 및 가중치 벡터가 바뀌는 것을 설명하였다. 그러므로 이 때의 가중치 벡터로부터 구해지는 공간 평균 빔파워가 영역이 변함에 따라 불연속적인 경향을 보이는 것을 설명하였다.
음향 대조 최대화 방법에서는 두 영역 사이의 공간 평균 빔파워의 비를 음향 대조로 나타내는데, 이 음향 대조가 관심 영역의 공간 평균 빔파워를 크게 하며 최적화를 하는 것인지, 비 관심 영역의 공간 평균 빔파워를 작게 하며 최적화를 하는 것인지를 설명하였다. 각 마이크로폰에 수신되는 음압 신호간의 공간 상관이 큰 차이를 보이지 않는 경우에는 비 관심 영역에서의 공간 상관 행렬의 최소 고유치가 0에 가까운 값을 가지고, 이 때에는 역행렬을 구하기 어려움을 설명하였다.
이렇게 구하는 각 방법에서의 가중치를 이용하여 영역 관점에서 음파의 입사 방향을 추정하는 방법을 제안하였다. 지연-합 빔형성 방법과 같은 기존의 빔형성 방법에서는 후보 방향 혹은 후보 위치 단위로 빔파워를 계산하는 방법을 택하는데, 제안 방법에서는 영역 관점에서 각 영역의 공간 평균 빔파워를 통하여 음파가 입사하는 방향의 범위를 추정하였다. 그리고 빔파워 계산 횟수를 연산량이라 정의하고 이 연산량이 지연-합 빔형성 방법과 제안 방법에서는 어떻게 차이 나는지, 몇 번을 반복했을 때까지가 제안 방법에서의 연산량이 더 적은지를 밝혔다. 또, 음파가 입사하는 방향의 범위를 추정하는 기준을 3dB 밴드 폭으로 제안하였다.
그리고 전파하는 음파의 파장, 마이크로폰 배열의 총 길이, 인접 마이크로폰 사이의 간격, 대표 방향, 그리고 영역의 범위에 따라 가중치 벡터가 어떻게 변하는지를 설명하였다. 다른 조건이 동일하고 영역의 범위가 넓어지는 경우에 음향 밝기 최대화 방법과 음향 대조 최대화 방법에서 도출되는 각 가중치 벡터는 삼각형 함수의 형태를 띠는 것을 알 수 있었다. 이 때 가중치 벡터의 성분 중 최대값과 최소값의 차이가 같은 부호 내에서 더 이상 최대가 될 수 없을 때에는 가중치 벡터의 성분에 부호가 다른 값든이 생기게 된다. 이 때문에 주엽이 작아지고 부엽이 커지는 것을 나타내었다. 마이크로폰 배열의 길이가 길어지고 관심 영역이 넓어질수록 삼각형 함수의 개수가 많아지고, 이는 다수의 엽이 생성되는 것을 설명하였다.
제안하는 방법이 실제 경우에 적용이 가능한지를 알아볼 수 있도록 다수의 목소리 음원들을 사용하여 실험을 진행하였다. 진행된 실험에서의 관심 주파수 대역은 음성 대역으로 선정하였고, 각 스피커로부터 방사되는 음파가 마이크로폰 배열에 입사될 때 이것이 관심 주파수 대역 내에서 평면파로 간주하도록 마이크로폰 배열과 스피커 간의 거리, 마이크로폰 배열의 총 길이 및 인접 마이크로폰 사이의 간격을 선정했다. 가중치를 적용한 음압 신호를 컴퓨터 웨이브 파일로 생성하여 실제로 들어볼 수 있도록 하였다.
본 발명에서 제안하는 방법을 다음과 같은 실제의 경우에 적용할 수 있을 것이라 생각할 수 있다. 1) 다수의 사람이 대화를 하고 있는 상황에서 특정 사람든간의 대화를 잘 듣고 싶은 경우, 2) 연주회에서 무대의 중앙에 위치하는 솔로의 노래를 더 잘 듣고 싶은 경우, 그리고 3) 공간 상에 어떤 방향에서 어떤 소리가 전파되고 있는지를 알아보려는 경우 등에 적용할 수 있을 것이다.
향후에는 크게 3가지 측면에서 연구가 진행될 필요가 있다.
첫 번째, 본 발명에서는 평면파로 제한하여, 방위각(azimuth)
Figure 112012033351484-pat00635
만을 고려하였다. 이를 평면파를 사용한다면 고도각(elevation)
Figure 112012033351484-pat00636
도 동시에 고려하여 2차원 이상에 대해 추정하는 연구가 진행될 필요가 있다. 또, 구면파 모델로 범위를 확장하여, 각도의 범위를 영역으로 정하는 것이 아닌 실제로 어떤 면적을 가지는 범위를 영역으로 정하여 제안하는 방법을 적용하는 연구가 필요할 것이다.
차원과 관련하여 생각해보면 마이크로폰 배열 바뀔 필요가 있다. 선형 등간격 마이크로폰 배열은 방위각 만을 추정할 때 사용하였다. 만약 두 방향 혹은 한 지점을 추정할 경우에는 다양한 형태의 마이크로폰 배열, 예를 들어 비 등간격 선형 마이크로폰 배열, 원형 마이크로폰 배열, 십자형 마이크로폰 배열 등에 대해서도 적용하는 연구가 필요할 것이다.
두 번째, 본 발명에서는 음파가 입사하는 방향이 1개일 경우에 대해 추정하는 방법을 제안하였다. 하지만, 앞으로는 2개 이상의 음파가 동시에 입사하는 경우에 대해 이를 추정할 수 있는지 연구할 필요가 있다. 이 때에는 신호 대 잡음비(SNR, Signal to Noise Ratio)에 따라 음파의 입사 방향을 찾을 수 있는지, 2개 이상의 입사 방향을 동시에 찾을 수 있는지 등에 대해 고려할 수 있다. 혹은 동시에 추정하는 방법 외에도 음압 신호의 크기가 가장 큰 신호의 입사 방향을 추정한 뒤, 추정된 영역을 하나씩 제거해 나가는 방법으로 2개 이상의 음파에 대해 입사 방향을 추정할 수도 있을 것이다.
세 번째, 본 발명에서는 영역을 나누는 방법에 대해서는 구체적으로 예시하지 않았다. 즉, 전체 추정 공간이 있으면 이에 대해 항상 이등분을 하여 영역을 왼쪽과 오른쪽으로 구분하였다. 하지만, 향후에는 영역을 삼등분 이상으로 나눌 때에는 연산량이 어떻게 될지, 어떤 장단점이 있는지 등에 대해 연구가 가능할 것이다. 또,
Figure 112012033351484-pat00637
와 같이 영역을 오버랩(overlap)해서 추정하는 방법도 가능하다.
이와 같이 구성된 본 발명의 영역 개념을 이용한 음파 입사 방향 추정 방법은 영역 관점에서 각 영역의 공간 평균 빔파워를 통하여 음파가 입사하는 방향의 범위를 추정함으로써, 본 발명의 기술적 과제를 해결할 수가 있다.
이상에서 설명한 본 발명의 바람직한 실시 예들은 기술적 과제를 해결하기 위해 개시된 것으로, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자(당업자)라면 본 발명의 사상과 범위 안에서 다양한 수정, 변경, 부가 등이 가능할 것이며, 이러한 수정 변경 등은 이하의 특허청구범위에 속하는 것으로 보아야 할 것이다.

Claims (13)

  1. (a) 복수의 마이크로폰을 배열하는 단계;
    (b) 상기 복수의 마이크로폰 배열에 임의의 방향으로부터 적어도 하나 이상의 음압 신호가 입사되는 단계;
    (c) 상기 음압 신호의 입사 방향을 추정하기 위하여, 음파의 입사 방향이 존재할 것이라고 추정되는 전체 영역을 적어도 두 영역 이상으로 등분하여 각 영역에서의 음압 신호, 가중치, 공간 평균 빔파워, 각각의 상대적인 크기를 비교하여 그 중 큰 값의 영역 내에 음파의 입사 방향이 존재한다고 추정하는 단계;
    (d) 상기 음파의 입사 방향이 존재한다고 추정된 영역을 다시 적어도 두 영역 이상으로 등분하여 각 영역에서의 음압 신호, 가중치, 공간 평균 빔파워, 각각의 상대적인 크기를 비교하여 그 중 큰 값의 영역 내에 음파의 입사 방향이 존재한다고 추정하는 단계; 및
    (e) 상기 (d) 단계의 상기 큰 값의 영역이 소정 범위 이하가 될 때까지 상기 (d) 단계를 반복 수행하여 상기 소정 범위 이하가 된 영역을 음파가 입사하는 방향의 범위로 추정하는 단계;
    를 포함하는,
    영역 개념을 이용한 음파 입사 방향 추정 방법.
  2. 제1항에 있어서,
    상기 가중치는 각 마이크로폰에 수신되는 음압 신호간의 시간 지연 및 음압 신호의 크기를 동시에 조절하는 값이 되고,
    상기 가중치는, 인접 마이크로폰 사이의 간격(
    Figure 112012033351484-pat00638
    ), 마이크로폰의 총 개수(
    Figure 112012033351484-pat00639
    ), 영역의 범위(
    Figure 112012033351484-pat00640
    ), 대표 방향(
    Figure 112012033351484-pat00641
    ), 주파수(
    Figure 112012033351484-pat00642
    )와 관련이 있는,
    영역 개념을 이용한 음파 입사 방향 추정 방법.
  3. 제 1 항에 있어서,
    상기 공간 평균 빔파워는 등분된 영역에서 마이크로폰에 수신되는 음압 신호의 세기가 되고, 상기 음압 신호의 방위각(
    Figure 112012033351484-pat00643
    ), 대표 방향(
    Figure 112012033351484-pat00644
    ), 음압 신호 벡터(
    Figure 112012033351484-pat00645
    ), 가중치(
    Figure 112012033351484-pat00646
    )와 관련이 있는,
    영역 개념을 이용한 음파 입사 방향 추정 방법.
  4. 제1항에 있어서,
    상기 (e)단계에서 상기 소정 범위는,
    지연-합 빔형성 방법으로부터 구하는 소정의 밴드 폭으로 상기 빔파워가 최대인 방향으로부터 빔파워가 절반인 방향까지의 범위인,
    영역 개념을 이용한 음파 입사 방향 추정 방법.
  5. 제1항에 있어서,
    상기 음파 입사 방향 추정 방법은,
    상기 음파의 입사 방향이 존재한다고 추정된 관심 영역과 그 외의 비 관심 영역으로 구분되고, 상기 관심 영역 내의 공간 평균 빔파워를 최대로 하는 가중치를 구하는 음향 밝기 최대화 방법과, 상기 관심 영역과 비 관심 영역간의 공간 평균 빔파워 비를 최대화하는 가중치를 구하는 음향 대조 최대화 방법을 이용하여 영역 관점에서 공간 평균 빔파워를 산출하는,
    영역 개념을 이용한 음파 입사 방향 추정 방법.
  6. 제5항에 있어서,
    상기 가중치 벡터는 상기 관심 영역이 한 방향인 경우 상기 음향 밝기 최대화 방법에서 구해지고, 평면파 모델의 지연-합 빔형성 방법의 가중치 벡터와 같고,
    상기 음향 대조 최대화 방법에서는 주파수와 인접 마이크로폰 사이의 간격에 따라 음향 밝기 최대화 방법과 같은 해를 가지는,
    영역 개념을 이용한 음파 입사 방향 추정 방법.
  7. 제5항에 있어서,
    상기 공간 평균 빔파워는 상기 관심 영역이 전체 영역인 경우 가중치 벡터로부터 구해지고, 주파수와 인접 마이크로폰 사이의 간격에 따라 바뀌는,
    영역 개념을 이용한 음파 입사 방향 추정 방법.
  8. 제1항에 있어서,
    상기 복수의 마이크로폰 배열에 음파가 입사될 때 관심 주파수 대역 내에서 평면파로 간주하도록 상기 마이크로폰 배열과 음원 간의 거리, 상기 마이크로폰 배열의 총 길이 및 인접 마이크로폰 사이의 간격을 결정하는,
    영역 개념을 이용한 음파 입사 방향 추정 방법.
  9. 제1항에 있어서,
    상기 복수의 마이크로폰 배열은,
    선형 등간격, 비선형 등간격, 원형, 십자형을 포함한 배열 방법 중 어느 하나로 배열하는,
    영역 개념을 이용한 음파 입사 방향 추정 방법.
  10. 제1항에 있어서,
    상기 적어도 하나 이상의 음압 신호는,
    단일 주파수 또는 사람의 음성, 음악을 포함한 특정 주파수 대역을 가지는 음원을 사용하는,
    영역 개념을 이용한 음파 입사 방향 추정 방법.
  11. 제1항에 있어서,
    상기 음파 입사 방향 추정 방법은,
    다수의 사람이 대화를 하고 있는 상황에서 상기 (a) 내지 (e)단계를 통해 음파가 입사하는 방향의 범위를 추정하여 특정 사람들간의 대화만을 선별하여 들을 수 있는,
    영역 개념을 이용한 음파 입사 방향 추정 방법.
  12. 제1항에 있어서,
    상기 음파 입사 방향 추정 방법은,
    음악회 또는 연주회에서 상기 (a) 내지 (e)단계를 통해 음파가 입사하는 방향의 범위를 추정하여 무대의 중앙에 위치한 솔로의 노래만을 선별하여 들을 수 있는,
    영역 개념을 이용한 음파 입사 방향 추정 방법.
  13. 제1항에 있어서,
    상기 음파 입사 방향 추정 방법은,
    상기 (a) 내지 (e)단계를 통해 음파가 입사하는 방향의 범위를 추정하여 공간 상에 어떤 방향에서 어떤 소리가 전파되고 있는지를 알 수 있는,
    영역 개념을 이용한 음파 입사 방향 추정 방법.
KR1020120043702A 2012-04-26 2012-04-26 영역 개념을 이용한 음파 입사 방향 추정 방법 KR101354960B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120043702A KR101354960B1 (ko) 2012-04-26 2012-04-26 영역 개념을 이용한 음파 입사 방향 추정 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120043702A KR101354960B1 (ko) 2012-04-26 2012-04-26 영역 개념을 이용한 음파 입사 방향 추정 방법

Publications (2)

Publication Number Publication Date
KR20130120651A KR20130120651A (ko) 2013-11-05
KR101354960B1 true KR101354960B1 (ko) 2014-01-23

Family

ID=49851188

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120043702A KR101354960B1 (ko) 2012-04-26 2012-04-26 영역 개념을 이용한 음파 입사 방향 추정 방법

Country Status (1)

Country Link
KR (1) KR101354960B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9866968B2 (en) 2015-12-09 2018-01-09 Hyundai Motor Company Microphone and manufacturing method of microphone

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102193570B1 (ko) * 2015-10-29 2020-12-21 에스케이텔레콤 주식회사 빔 트레이닝 시간 단축을 위한 장치 및 방법
CN114675233A (zh) * 2022-02-18 2022-06-28 西北工业大学太仓长三角研究院 一种基于增强型导波相控阵技术的声发射源定位方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050035562A (ko) * 2003-10-13 2005-04-19 삼성전자주식회사 잡음에 강인한 화자위치 추정방법 및 장치와 이를 이용한카메라 제어시스템
KR20080070196A (ko) * 2007-01-25 2008-07-30 한국과학기술연구원 음원위치-지연시간차 상관관계 역 추정에 의한 음원 방향검지 시스템 및 방법
KR20090038697A (ko) * 2007-10-16 2009-04-21 한국전자통신연구원 음원 추적이 가능한 지능형 로봇 및 방법
KR20110075524A (ko) * 2009-12-28 2011-07-06 주식회사 에스원 3d 음향 센서 시스템에서의 영역지정 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050035562A (ko) * 2003-10-13 2005-04-19 삼성전자주식회사 잡음에 강인한 화자위치 추정방법 및 장치와 이를 이용한카메라 제어시스템
KR20080070196A (ko) * 2007-01-25 2008-07-30 한국과학기술연구원 음원위치-지연시간차 상관관계 역 추정에 의한 음원 방향검지 시스템 및 방법
KR20090038697A (ko) * 2007-10-16 2009-04-21 한국전자통신연구원 음원 추적이 가능한 지능형 로봇 및 방법
KR20110075524A (ko) * 2009-12-28 2011-07-06 주식회사 에스원 3d 음향 센서 시스템에서의 영역지정 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9866968B2 (en) 2015-12-09 2018-01-09 Hyundai Motor Company Microphone and manufacturing method of microphone

Also Published As

Publication number Publication date
KR20130120651A (ko) 2013-11-05

Similar Documents

Publication Publication Date Title
Salvati et al. Incoherent frequency fusion for broadband steered response power algorithms in noisy environments
CN108375763B (zh) 一种应用于多声源环境的分频定位方法
EP3210391B1 (en) Reverberation estimator
Gunel et al. Acoustic source separation of convolutive mixtures based on intensity vector statistics
JP6329296B2 (ja) 収音装置
Rafaely et al. Speaker localization using direct path dominance test based on sound field directivity
JP2018063200A (ja) 音源位置推定装置、音源位置推定方法、及びプログラム
Seo et al. Impulsive sound source localization using peak and RMS estimation of the time-domain beamformer output
Poursheikhali et al. Source localization in inhomogeneous underwater medium using sensor arrays: Received signal strength approach
Xia et al. Noise reduction method for acoustic sensor arrays in underwater noise
Jung et al. Compensation of inherent bias errors in using the three-dimensional acoustic intensimetry for sound source localization
KR101354960B1 (ko) 영역 개념을 이용한 음파 입사 방향 추정 방법
Saqib et al. Estimation of acoustic echoes using expectation-maximization methods
Woo et al. Precision enhancement in source localization using a double-module, three-dimensional acoustic intensity probe
Hu et al. Decoupled direction-of-arrival estimations using relative harmonic coefficients
Frank et al. Constant-beamwidth kronecker product beamforming with nonuniform planar arrays
Bouchard et al. Beamforming with microphone arrays for directional sources
Svaizer et al. Environment aware estimation of the orientation of acoustic sources using a line array
Koyano et al. Infinite-dimensional SVD for revealing microphone array’s characteristics
Nagata et al. Two-dimensional DOA estimation of sound sources based on weighted wiener gain exploiting two-directional microphones
Xue et al. Noise robust direction of arrival estimation for speech source with weighted bispectrum spatial correlation matrix
US11830471B1 (en) Surface augmented ray-based acoustic modeling
Sarabia et al. Spatial LibriSpeech: An Augmented Dataset for Spatial Audio Learning
Brutti et al. An environment aware ML estimation of acoustic radiation pattern with distributed microphone pairs
Chhetri et al. On acoustic modeling for broadband beamforming

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20161227

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee