KR20010047701A - Method for implementing transaural filter for sound localization - Google Patents

Method for implementing transaural filter for sound localization Download PDF

Info

Publication number
KR20010047701A
KR20010047701A KR1019990052037A KR19990052037A KR20010047701A KR 20010047701 A KR20010047701 A KR 20010047701A KR 1019990052037 A KR1019990052037 A KR 1019990052037A KR 19990052037 A KR19990052037 A KR 19990052037A KR 20010047701 A KR20010047701 A KR 20010047701A
Authority
KR
South Korea
Prior art keywords
sound
gain
filter
speaker
sound pressure
Prior art date
Application number
KR1019990052037A
Other languages
Korean (ko)
Other versions
KR100344975B1 (en
Inventor
정완섭
Original Assignee
정명세
한국표준과학연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정명세, 한국표준과학연구원 filed Critical 정명세
Priority to KR1019990052037A priority Critical patent/KR100344975B1/en
Publication of KR20010047701A publication Critical patent/KR20010047701A/en
Application granted granted Critical
Publication of KR100344975B1 publication Critical patent/KR100344975B1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

PURPOSE: A method for embodying a transaural filter for a space sound image lateralization is provided to minimize a distortion of a tone colour and a degradation of a tone quality CONSTITUTION: A method for embodying a transaural filter for a space sound image lateralization comprises an (a) step for establishing a ratio of a sound pressure transferred to the right ear and the left ear directly and a sound pressure transferred across from the bilateral symmetry type of the speaker, a (b) step for introducing the driving signal of the left speaker and the driving signal of the right signal applying a gain rate corresponding to the relative sound pressure ratio of the right and left ear and a delayed time corresponding to the different of reaching time between the right ear and the left ear and inverting 180°phase to the driving signal of speaker of the other side respectively, and a (c) step for applying the gain compensation rate to the obtained signal from the step (b).

Description

공간음상정위를 위한 트랜스오랄 필터 구현방법 {Method for implementing transaural filter for sound localization}Method for implementing transaural filter for sound localization

본 발명은 공간음상정위를 위한 트랜스오랄(transaural) 필터 구현방법에 관한 것이다. 보다 구체적으로, 인간 청각기관의 공간 인지량적 인자인 ILD (interaural level difference)와 ITD(interaural time difference)의 개념을 이용하여 cross-talk을 제거하고, 청각기관의 masking 특성을 이용하여 트랜스오랄 필터의 진폭을 보상하여 음색의 왜곡과 음질의 저하를 최소화 할 수 있는 트랜스오랄 필터의 구현방법에 관한 것이다.The present invention relates to a method for implementing a transaural filter for spatial sound localization. More specifically, cross-talk is removed using the concepts of interaural level difference (ILD) and interaural time difference (ITD), which are spatial cognitive factors of human auditory organs, and the transoral filter is applied using masking characteristics of auditory organs. The present invention relates to a method for implementing a transoral filter capable of compensating amplitude and minimizing distortion and degradation of sound quality.

공간에 위치한 단일 음원으로부터 양 귀에 직접 도달될 때 느끼는 음향은 좌측과 우측의 음압성분 {PL, PR}로 정의된다. 즉, 다수의 공간 음원으로부터 양귀에 도달하는 음압성분 {PL,i, PR,i; i = 1, 2, ... }으로 구성된다. 그러나, 이러한 공간 음향을 두 개의 좌우 대칭형 스피커를 이용하여 구현할 경우, 양귀에 도달하는 음압성분은 좌측 및 우측 스피커에서 발생된 음이 좌측 및 우측 귀로 직접 전달되는 직접경로(direct path) 음압성분 {PLL,i, PRR,i; i = 1, 2, ... }과 좌측 및 우측 스피커에서 발생된 음이 우측 및 좌측 귀로 서로 교차하여 전달되는 교차 전달경로(cross-talk path) 음압성분 {PLR,i, PRL,i; i = 1, 2, ... }으로 각각 구성된다. 따라서, 실제 청취 조건에서의 음원에 대한 좌우측 음향 전달 경로가 스피커를 구동할 경우 2종의 직접 음압전달 경로와 2종의 좌우 교차 음압전달 경로가 수반된다. 특히, 좌우 교차 음압전달 성분을 "cross-talk 성분"이라 호칭하며, 이를 제거하는 방법을 "cross-talk 제거 기법"이라 한다. cross-talk 제거 방법은 1966년 미국 특허로 제시된 초기의 방법에서 최근 일반화된 방법들까지 여러 가지가 제시되고 있으나, 본 발명에서는 고전적 자유 음장모델을 이용함으로써 두 개의 대칭형 스피커를 이용하여 양 귀에 들리는 4종의 음압전달 경로를 마치 단일 음원을 청취할 경우 양 귀에 들리는 좌우 2종의 직접 음압전달 경로로 변환하는 방법을 개발하였다.The sound felt when it reaches both ears directly from a single sound source located in space is defined by the sound pressure components {P L , P R } on the left and right. That is, sound pressure components {P L, i , P R, i ; i = 1, 2, ...}. However, when this spatial sound is implemented using two symmetrical speakers, the sound pressure component reaching both ears is a direct path sound pressure component {P, which directly transmits the sound generated from the left and right speakers to the left and right ears. LL, i , P RR, i ; i = 1, 2, ...} and cross-talk path sound pressure components in which the sound generated from the left and right speakers crosses each other to the right and left ears {P LR, i , P RL, i ; i = 1, 2, ...} respectively. Therefore, when the left and right sound transmission paths to the sound source under actual listening conditions drive the speaker, two types of direct sound pressure transmission paths and two types of left and right cross sound pressure transmission paths are involved. In particular, the left-right cross-negative pressure transmission components are called "cross-talk components", and the method of removing them is called "cross-talk removal technique." Cross-talk removal methods have been proposed in various ways, from the initial method proposed in the US patent in 1966 to the recently generalized methods. However, in the present invention, by using the classical free sound field model, two symmetrical speakers are used. We developed a method of converting a sound pressure transmission path of a species into two types of direct sound pressure transmission paths that are heard on both ears when listening to a single sound source.

본 발명의 목적은 음질 저하나 음색 왜곡의 문제점을 최소화할 수 있는 트랜스오랄 필터의 구현방법을 제공하는 것이다.An object of the present invention is to provide a method for implementing a transoral filter that can minimize the problems of sound quality degradation or tone distortion.

본 발명의 다른 목적은 전문적인 지식이 없이도 녹음기사들이 손쉽게 구현할 수 있는 트랜스오랄 필터 구현방법을 제공하는 것이다.Another object of the present invention is to provide a method for implementing a transoral filter that can be easily implemented by recording technicians without specialized knowledge.

도1은 청취자와 음원의 배치도이다.1 is a layout view of a listener and a sound source.

도2 및 도3는 음압비와 시간지연의 경향에 대한 그래프이다.2 and 3 are graphs of trends in sound pressure ratio and time delay.

도4는 본 발명의 트랜스 오랄 필터링의 개요도이다.4 is a schematic diagram of the trans-oral filtering of the present invention.

도5는 본 발명의 트랜스 오랄 필터의 이득 특성에 관한 그래프이다.5 is a graph relating to gain characteristics of the transoral filter of the present invention.

도6 및 도7은 ⅓ 옥타브 밴드에서 등가 이득의 그래프이다.6 and 7 are graphs of equivalent gains in the n octave band.

본 발명에서는 기존의 측정 머리전달함수를 이용한 cross-talk 제거의 문제점인 음색 왜곡과 음질 저하를 최소화하기 위하여 고전적 자유음장 모델을 선정하였다. 자유음장 모델을 이용할 경우 측정머리 전달함수에 내포된 수많은 측정 오차(스피커 및 음압센서 장치들 포함), 공진 및 노치 성분들(머리, 귀 바퀴, 어깨 등의 신체 부위의 음향특성)에 의한 inverse filter의 문제점 등을 피할 수 있기 때문이다. 그리고, 청취자는 항상 자신의 상체, 머리, 외이 등의 신체 구조에 따른 자신의 음향학적 음압전달 특성에 따라 들리는 음을 가장 자연스러운 음으로 인식한다는 점이다. 그리고, 자유 음장 모델은 양 귀 주위의 음장 재현에 초점을 맞추고 있을 뿐, 양 귀의 고막에서의 음압 재현은 아니라는 점이다.In the present invention, the classical free sound field model was selected to minimize the tone distortion and the degradation of sound quality, which are problems of cross-talk removal using the conventional measurement head transfer function. Inverse filter due to numerous measurement errors (including loudspeakers and sound pressure sensor devices), resonance and notch components (acoustic characteristics of body parts such as head, ear wheels and shoulders) in the measurement head transfer function when using the free sound field model This is because problems can be avoided. In addition, the listener always recognizes the sound heard according to his acoustic sound pressure transmission characteristics according to his or her upper body, head, and outer ear as the most natural sound. In addition, the free sound field model focuses only on the reproduction of the sound field around both ears, not the sound pressure reproduction in the eardrum of both ears.

자유 음장에서 단극 점 음원이 주파수 f인 신호로 구동될 때, 거리 r에서 음압은 수학식 1과 같이 주어진다.When the monopole source is driven with a signal of frequency f in the free sound field, the sound pressure at distance r is given by Equation (1).

수학식 1에서 ρ0= 공기의 밀도, jω·q = 음원의 체적 가속도(volume acceleration), k = 파수(ω/c0; ω = 각속도, C0= 음속)이다. 음원의 특성치 V =라 하면, 공간위치에 대한 음원의 음압 전달함수는 수학식 2와 같다.In Equation 1, ρ 0 = air density, jωq = volume acceleration of the sound source, k = wave count (ω / c 0 ; ω = angular velocity, C 0 = sound velocity). Characteristic value of sound source V = In this case, the sound pressure transfer function of the sound source with respect to the spatial position is shown in Equation 2.

도 1은 본 발명에서 사용하고 있는 스피커와 청취자의 기하학적 구성도를 보이고 있다. R0는 음원에서 머리 중심까지의 거리이고, R1와 R2는 음원에 근접한 귀까지의 경로(direct path)와 먼쪽 귀와의 경로(cross-talk path) 거리이며, θ는 머리의 중심점과 스피커와의 각도, 그리고 a는 청취자 머리의 반경이다. 근접 경로와 교차경로와의 음압비 gc와 두 경로차이에 의한 음압도달 시간차 τc는 수학식 3과 같이 정의한다.Figure 1 shows the geometrical configuration of the speaker and the listener used in the present invention. R 0 is the distance from the sound source to the center of the head, R 1 and R 2 are the direct path to the ear near the sound source and the cross-talk path distance from the far ear, and θ is the center of the head and the speaker The angle of and, and a is the radius of the listener's head. The sound pressure ratio g c between the proximity path and the cross path and the sound pressure arrival time difference τ c by the two path differences are defined as in Equation 3.

여기서 음압 비 gc는 항상 1 보다는 작은 값이다.Where the sound pressure ratio g c is always less than one.

도 2 및 도3은 청취자와 스피커의 설치조건에 따라 양귀 음압비 gc와 음압도달 시간차 τc의 변화를 보이고 있다. 자유음장에서 음압은 거리의 역수에 비례하기 때문에 단순 거리의 비와 같게된다. 도 2에서 음압비는 스피커의 설치 각도가 증가함에 따라 감소되며, 그리고 스피커와 청취자의 거리가 멀어짐에 따라 음압비 또한 감소됨을 알 수 있다. 좌우측 귀의 음압도달 시간차이 τc는 스피커의 설치 각도가 증가함에 따라 증가되지만 거리의 영향은 매우 미미함을 도 3에서 확인할 수 있다. 도 2 및 도3에 보인 스피커에 대한 청음자의 좌우측 귀 부근 음압의 비와 도달시간 차이의 정보는 transaural 필터의 구현과정에서 사용된다.2 and 3 show the change in the sound pressure ratio g c and the sound pressure arrival time difference τ c of both ears according to the installation conditions of the listener and the speaker. In a free sound field, the sound pressure is proportional to the inverse of the distance, so it is equal to the ratio of the simple distance. In FIG. 2, the sound pressure ratio decreases as the installation angle of the speaker increases, and the sound pressure ratio also decreases as the distance between the speaker and the listener increases. The sound pressure arrival time difference τ c of the left and right ears increases as the installation angle of the speaker increases, but the influence of the distance is very small in FIG. 3. The information of the ratio of the sound pressure ratio and the time difference between the left and right ears of the listener to the speaker shown in FIGS. 2 and 3 is used in the implementation of the transaural filter.

도 1과 같이 구성된 좌우측 스피커의 구동 음원 신호를 {SL, SR}이라 할 때, 수학식 2의 음압 전달함수로부터 양 귀의 직접경로 음압은 수학식 4와 같고, 좌우 교차 성분인 크로스 토크 경로 음압은 수학식 5의 선형 모델로 각각 기술된다.When the driving sound source signals of the left and right speakers configured as shown in FIG. 1 are {S L , S R }, the direct path sound pressures of both ears from the sound pressure transfer function of Equation 2 are the same as Equation 4, and the cross talk path is a left and right cross component. Sound pressure is described by the linear model of Equation 5, respectively.

따라서, 좌우 귀 음압 {PL, PR}은 수학식 4 및 5의 음압 성분들의 합으로 수학식 6과 같이 기술된다.Therefore, the left and right ear sound pressures {P L , P R } are described by Equation 6 as the sum of sound pressure components of Equations 4 and 5.

수학식 6은 좌우측 음원을 두 스피커에 구동할 때 양 귀 주변의 음압에 대한 선형 모델이다. 위의 음향학적 모델로부터 좌우 음원 신호를 스피커로 구동할 때 양 귀에서 들리는 음압과 공간에 위치한 음원에서 직접 들리는 양 귀 음압이 서로 같은 경우, 두 개의 스피커를 이용하여 공간 음상 정위(spatial sound image localization)를 구현할 수 있게 된다. 이와 같이 좌우 대칭형 두 스피커를 이용한 공간 음상 정위는 반드시 스피커의 구성에 따른 스피커의 구동 음원 신호 {SL, SR}의 설계를 수반함을 알 수 있다. 따라서, 수학식 6의 우변 음압을 공간 음원 구동 시 양 귀에 들리는 기준 음압이라 하면, 이때 스피커 구동 신호는 수학식 7과 같다.Equation 6 is a linear model of the sound pressure around both ears when driving the left and right sound sources to two speakers. From the above acoustic model, when driving the left and right sound source signals to the speaker, when the sound pressure heard from both ears and the sound pressure of both ears directly from the sound source located in the space are the same, the spatial sound image localization using two speakers is performed. ) Can be implemented. As described above, it can be seen that spatial sound positioning using two symmetrical speakers involves the design of a driving sound source signal {S L , S R } according to the configuration of the speaker. Therefore, when the sound pressure on the right side of Equation 6 is the reference sound pressure heard by both ears when driving the spatial sound source, the speaker driving signal is expressed by Equation 7 below.

G(f)는 수학식 5의 우변 행렬의 determinant 값이며, 다음과 같은 복소수 함수이다.G (f) is a determinant value of the right side matrix of Equation 5, and is a complex function as follows.

따라서, 수학식 7의 |G(f)|는 좌우 스피커에 동일하게 인가하는 이득율(gain) 값이다. 수학식 7을 고찰할 경우, 좌우 측 스피커와 양 귀가 서로 교차하는 음향경로(cross-talk path)를 제거하는 구체적 방법을 이해할 수 있다. 예를 들어, 우측 귀의 음압 PR= 0 라 가정하면, 좌측 스피커는 PL에 비례하는 성분만을 구동하고 우측 스피커는 (-gc·e-jωτ)×PL에 비례하는 신호를 구동하게 된다. 이때, 우측 구동 신호 (-gc·e-jωτ)×PL는 좌측 스피커 구동신호 PL에 좌우측 귀의 상대적 음압비(Relative ILD) 만큼의 이득율 gc(gc< 1) 적용과 양귀 도달 시간차이 ITD 만큼 시간지연 τc적용, 그리고 위상 180도 변환을 각각 적용하는 과정을 의미한다. 이러한 세가지 과정(relative ILD, ITD, 위상반전)을 거쳐 얻어진 우측 신호와 좌측 신호를 동시에 스피커에 인가할 때, 좌측 귀에는 좌측 스피커의 구동 신호 성분만 들리게 되며, 우측 귀에는 좌측 스피커의 교차 전달 경로에 의한 음압과 우측 스피커의 구동 음압이 서로 중첩되어 교차 전달음압 성분이 제거된다. 동일한 방법으로 우측 구동 신호 또한 좌측 귀로 전달되는 교차 음압전달 성분을 제거하기 위하여 앞서 설명한 세가지 과정(relative ILD, ITD, 위상반전) 즉, 180도 위상반전, 이득율 gc(gc< 1) 그리고 시간지연 τc를 각각 적용하여 좌측 스피커에 공급된다. 이러한 연산 과정을 도식화하면 도 3의 교차성분 제거부와 같이 표시된다.Therefore, | G (f) | in Equation 7 is a gain value applied equally to the left and right speakers. Considering Equation 7, it is possible to understand a specific method of removing a cross-talk path in which the left and right speakers and both ears cross each other. For example, assuming that the sound pressure P R = 0 of the right ear, the left speaker drives only a component proportional to P L and the right speaker drives a signal proportional to (-g c · e -jωτ ) × P L. . At this time, the gain factor of the drive signal by right (-g c · e -jωτ) × P L is a non-relative negative pressure to the left and right of the ear speaker drive signal P L (Relative ILD) g c (g c <1) Application and reach yanggwi It means the process of applying time delay τ c and applying phase 180 degree transformation as much as time difference ITD. When the right and left signals obtained through these three processes (relative ILD, ITD, phase inversion) are applied to the speaker at the same time, only the driving signal component of the left speaker is heard in the left ear, and the cross transmission path of the left speaker in the right ear. The sound pressure caused by the sound pressure and the driving sound pressure of the right speaker overlap each other to remove the cross-transfer sound pressure component. Right drive signal in the same way also three kinds of processes described previously to remove the cross-sound pressure transmission elements are passed ears left (relative ILD, ITD, phase shift), that is, 180 degree phase shift, the gain factor g c (g c <1) and The respective time delays τ c are applied to the left speaker. This calculation process is shown as shown in FIG.

앞서 언급한 대칭 스피커 구동시 수반되는 교차 음압전달 성분의 제거 방안은 transaural 필터의 첫 단계 처리과정일 뿐이다. 두 번째 단계는 도 3의 스피커 전단에 표시된 바와 같이 좌우 스피커 구동신호에 동일하게 적용하는 이득함수 |G(f)|에 의한 이득보상(gain equalization)이며, 이는 수학식 7의 우변 이득함수 |G(f)|를 좌우 스피커 채널에 적용하는 것이다.The method of eliminating cross sound pressure transfer components involved in driving the symmetrical speaker mentioned above is only the first step of the transaural filter. The second step is gain equalization by the gain function | G (f) | which is equally applied to the left and right speaker drive signals as indicated in front of the speaker of FIG. (f) | is applied to the left and right speaker channels.

수학식 8에 포함된 위상 정보는 좌우 채널에 동일하게 인가하게 되기 때문에 청각 기관의 인지에는 영향을 미치지 않는다. 따라서, 본 발명에서는 수학식 7에서와 같이 G(f) 대신에 |G(f)|를 사용한다. 그리고, 도 1에서 보인 바와 같이 청취자와 스피커의 거리 및 각도 {R0, θ}에 따라 좌우 채널의 이득율 |G(f)|는 결정된다.Since the phase information included in Equation 8 is equally applied to the left and right channels, it does not affect the recognition of the auditory organ. Therefore, in the present invention, | G (f) | is used instead of G (f) as in Equation (7). As shown in FIG. 1, the gain ratio | G (f) | of the left and right channels is determined according to the distance between the listener and the speaker and the angle {R 0 , θ}.

영국 ISVR에서 개발된 "Stereo Dipole"의 기법은 위의 복소수 이득율 함수인 G(f)를 직접 디지털 신호처리 기술로 실현하는 방법을 택하고 있다. 특히, 위상 항의 구현 문제점은 많은 연산과 복잡한 처리과정을 필요로 한다. 그러나, 인간의 청각구조는 양 귀 음압의 위상이 같을 경우 ITD(interaural time difference)가 영이 되어 공간 음상 정위에 전혀 영향을 미치지 않는다는 점을 Stereo Dipole 기법은 활용하지 않고 있다.The technique of "Stereo Dipole", developed by ISVR in the UK, chooses to realize G (f) directly as a digital gain processing function. In particular, the problem of implementing a phase term requires a lot of computation and complex processing. However, the stereo-dipole technique does not utilize the fact that the human auditory structure has the same interaural time difference (ITD) of zero when the phases of both ear pressures are in the same phase, and thus does not affect the spatial sound positioning.

위에서는 대칭적 두 스피커와 양 귀 사이에서 발생하는 교차 음압전달 성분제거라는 첫번째 단계와 좌우 동일한 이득율을 보상하는 두번째 단계로 구성된 transaural 필터의 구성 개념을 설명하였다. 이렇게 구성된 transaural 필터는 좌우 대칭 스피커를 이용하여 청음자가 마치 자유 음장 조건의 공간에 정위된 음원에서 발생되는 양 귀 주위의 음장을 직접 들을 수 있게 한다. 즉, 스피커 구동부가 없는 것처럼 즉 transaural한 음장 재현을 얻게 된다.Above we have described the concept of a transaural filter consisting of a first stage, the second stage that compensates for gain equal to the left and right, and the first stage of cross-pressure transfer component removal between two symmetrical speakers and both ears. This transaural filter uses symmetrical speakers to allow listeners to hear the sound field around both ears directly from a sound source located in a space of free sound field conditions. In other words, you get a transaural sound field reproduction, as if there is no speaker drive.

다음은 좌우측 스피커의 이득(Gain) 함수인 |G(f)|를 구현하는 방법을 설명한다. 도 5는 음원과 거리 R0= 2m 이고, 청취자와 스피커의 각도 θ= 5°와 30°에 대한 이득율 |G(f)|을 각각 보이고 있다.The following describes how to implement | G (f) |, a gain function of the left and right speakers. Fig. 5 shows the gain ratio | G (f) | for the angles θ = 5 ° and 30 °, respectively, of the sound source and the distance R 0 = 2m, respectively.

이득율함수의 최대값은 |G|max= gc/(1-gc 2)이고 최소값은 |G|min= gc/(1+gc 2)이다. 도 5에 보인 경우와 같이 거리 R0= 2m 이고 스피커의 각도 θ= 5°와 30°도인 경우 gc( 5°) = 0.9914이고 gc( 30°) = 0.9577이다. 청취자와 스피커의 각도가 5°인 경우 |G|max= 35.2 dB, |G|min= -6 dB, 그리고 각도가 30°인 경우 |G|max= 21.3 dB, |G|min= -6 dB로 각각 확인되었다. 이들 피크 값들의 크기와 형상은 청취자와 스피커의 구성에 따라 매우 현격한 차이를 보인다는 점을 도 5에서 확인할 수 있다. 우선 저주파에서 많은 이득보상이 필요하며 스피커의 각도가 적을수록 이득보상의 크기와 대역폭이 증가함을 알 수 있다. 스피커의 각도가 증가할수록 이득보상의 크기와 대역폭은 감소되지만 피크치의 개수가 급격히 증가됨을 확인할 수 있다.The maximum value of gain factor is | G | max = g c / (1-g c 2 ) and the minimum value is | G | min = g c / (1 + g c 2 ). As shown in FIG. 5, when the distance R 0 = 2m and the speaker angles θ = 5 ° and 30 °, g c (5 °) = 0.9914 and g c (30 °) = 0.9577. When the listener and speaker are at an angle of 5 ° | G | max = 35.2 dB, | G | min = -6 dB and when the angle is 30 ° | G | max = 21.3 dB, | G | min = -6 dB, respectively. It can be seen from FIG. 5 that the magnitude and shape of these peak values show a very sharp difference depending on the configuration of the listener and the speaker. First of all, we need a lot of gain compensation at low frequency, and the smaller the speaker angle, the more the size and bandwidth of the gain compensation. As the angle of the speaker increases, the size and bandwidth of the gain compensation decrease, but the number of peaks increases rapidly.

transaural 필터의 구현에서 가장 기본적 문제점은 도 5에 보인 이득함수의 효과적 보상에 있으나, Stereo Dipole의 기법을 비롯한 기존 transaural 필터 기법들은 위의 문제에 대한 효과적인 해결방안을 제시하지 못하고 있는 실정이다. 도 5에서 보인바와 같이 일반적으로 가장 널리 이용되고 있는 청취자와 스피커의 각도가 30°인 경우, 20 kHz까지의 가청 범위에서 11개의 피크를 갖는 이득함수 |G(f)|의 주파수 특성은 FIR 혹은 IIR 디지털 필터로 구현할 때 음색 왜곡과 음질 저하를 야기할 수 있는 주된 인자이다. 그리고, 11개의 피크를 갖는 이득함수 |G(f)|의 주파수 특성을 최대한 만족하는 FIR 혹은 IIR 디지털 필터로 구현해야 되는 문제가 있다. 특히, 이들 디지털 필터 구현 시 최적의 필터 Tap 수 혹은 Pole 및 Zero의 수의 선정, 그리고 필터의 위상 특성에 따른 공간 음상 왜곡과 음질 저하에 대한 방지대책이 필요하다.The most basic problem in the implementation of the transaural filter is the effective compensation of the gain function shown in FIG. 5, but the existing transaural filter techniques including the stereo dipole technique do not provide an effective solution to the above problem. As shown in FIG. 5, when the angle of the most widely used listener and speaker is 30 °, the frequency characteristic of the gain function | G (f) | with 11 peaks in the audible range up to 20 kHz is FIR or When implemented with an IIR digital filter, this is a major factor that can cause tonal distortion and degradation. In addition, there is a problem that a FIR or IIR digital filter that satisfies the frequency characteristic of the gain function | G (f) | having 11 peaks is maximized. In particular, when implementing these digital filters, it is necessary to select the optimal number of filter taps or the number of poles and zeros, and to prevent spatial sound distortion and degradation of sound quality according to the phase characteristics of the filter.

본 발명에서는 다수의 피크를 갖는 이득함수 |G(f)|의 주파수 특성을 만족하는 이득보상 기법을 해결하기 위하여, "masking 청각 특성"을 이용한 유한 대역폭의 등가 이득율(equivalent bandwidth gain)을 계산하여 이득 보상을 수행하는 방법을 채택하였다. 관심 대역의 중심 주파수 fc에 대하여 저역 하한 주파수를 fL라 하고 고역 상한 fH라하자. 이때 등가 대역 이득값은 수학식 9와 같이 정의한다.In the present invention, in order to solve a gain compensation technique that satisfies the frequency characteristic of the gain function | G (f) | having a large number of peaks, the equivalent bandwidth gain of the finite bandwidth is calculated using the "masking auditory characteristic". We adopt a method of performing gain compensation. Let low-lower frequency be f L and high-frequency upper limit f H for the center frequency f c of the band of interest. At this time, the equivalent band gain value is defined as in Equation (9).

수학식 9의 중심 주파수, 상/하한 대역에 대한 선정은 옥타브, 1/3-옥타브, 임계대역(critical band), 혹은 최근의 Gammatone 등의 청각 구조 모델을 선정할 수 있다. 도 6 및 도 7은 음향 기사들이 가장 널리 이용하고 있는 1/3-옥타브 대역에 대한 결과를 보여주고 있다.Selection of the center frequency, upper and lower limit bands of Equation 9 may select an auditory structure model such as octave, 1 / 3-octave, critical band, or recent Gammatone. 6 and 7 show the results for the 1 / 3-octave band, the most widely used acoustic technicians.

도 5의 결과에서 확인된 바와 같이 등가 밴드폭을 이용한 도 6 및 도 7의 이득 함수의 가장 큰 특성은 우선 저주파 대역에서 상대적으로 큰 Gain 보상이 필요함을 알 수 있다. 보상의 크기는 스피커의 각도가 증가함에 따라 감소하며, 저주파 보상 대역은 스피커의 각도가 감소할수록 대역폭은 증가된다. 거리에 따른 저주파 보상 값은 커다란 차이를 보이지 않음을 알 수 있다. 그러나, 스피커 설치 각도의 크기 변화에 따라 저주파 이득 보상 값은 상대적으로 민감함을 알 수 있다. 특히, 스피커 설치 각도가 5°인 경우보다 30°인 경우 고주파 영역의 보상 또한 증가됨을 알 수 있다.As can be seen from the results of FIG. 5, the largest characteristic of the gain function of FIGS. 6 and 7 using the equivalent bandwidth can be seen that first, a relatively large gain compensation is required in the low frequency band. The amount of compensation decreases as the angle of the speaker increases, and the bandwidth of the low frequency compensation band increases as the angle of the speaker decreases. It can be seen that the low frequency compensation value according to the distance does not show a big difference. However, it can be seen that the low frequency gain compensation value is relatively sensitive to the magnitude of the speaker installation angle. In particular, it can be seen that the compensation of the high frequency region is also increased when the speaker installation angle is 30 ° than when the speaker installation angle is 5 °.

특히, 30°인 경우 고주파 영역의 이득율은 도 4에서 보인바와 같이 이득함수 |G(f)|의 많은 최대 피크들 때문에 이득 보상양의 증가를 보인다. 고주파 영역에서 이득함수 |G(f)|의 많은 최소 피크들은 최대 피크치에 의하여 묻히는 즉 "masking" 효과 때문에 이들의 영향은 최소화된다. 사실 이들 고주파 영역의 많은 최대/최소 피크들은 이득함수 |G(f)|를 FIR 혹은 IIR 필터로 구현할 때 많은 문제점을 수반한다. 이러한 문제점을 갖는 디지털 필터 구현 기법은 최종적으로 음질의 저하와 음색의 왜곡을 수반하게 된다.In particular, in the case of 30 °, the gain ratio in the high frequency region shows an increase in gain compensation amount due to many maximum peaks of the gain function | G (f) | as shown in FIG. Many of the minimum peaks of the gain function | G (f) | in the high frequency region are buried by the maximum peak value, i.e. their effect is minimized because of the "masking" effect. In fact, many of the maximum and minimum peaks in these high frequency ranges involve many problems when implementing the gain function | G (f) | with an FIR or IIR filter. The digital filter implementation technique having such a problem is accompanied by deterioration of sound quality and distortion of timbre.

수학식 8에 의하여 얻어진 등가대역별 이득값 {EQ(fc); 20 Hz <= fc<= 20 kHz}에 따라 기존의 이퀼라이저의 대역별 이득 치를 설정함으로써 필요한 이득율을 보상할 수 있다. 좌우측 이득율 보상 시 기존의 이퀼라이저들의 좌우 위상 특성이 정확히 일치되지 않을 경우 스피커 입력 신호의 위상에 영향을 피할 수 없게된다. 이러한 이퀼라이저의 위상 영향은 공간 음상 정위 시 좌/우측의 유한 시간지연 양으로 변환되기 때문에 공간 음상 정위 성능을 저해할 수 있다. 본 발명에서는 zero-phase 보상 기법 즉, 시간 축에 대하여 forward 방향으로 이득율의 반을 적용한 뒤 다시 신호를 시간축의 역으로 뒤집어 나머지 반의 이득율을 적용하는 방법을 사용한다. 본 방법은 어떠한 디지털 이퀼라이저로도 위상의 영향을 완전히 제거할 수 있는 zero-phase 이득율 보상 수행을 가능하게 할 수 있다.An equivalent band-specific gain value obtained by Equation 8 {EQ (f c ); The desired gain ratio can be compensated for by setting the band-specific gain of the existing equalizer according to 20 Hz <= f c <= 20 kHz}. When the left and right gain ratio compensation does not exactly match the left and right phase characteristics of the existing equalizer it is inevitable to influence the phase of the speaker input signal. Since the phase influence of the equalizer is converted into the finite time delay amount of the left and right sides in the spatial sound positioning, the spatial sound positioning can be hindered. In the present invention, a zero-phase compensation technique, that is, a method of applying half of the gain in the forward direction with respect to the time axis and then inverting the signal back to the inverse of the time axis, applies the gain of the other half. The method may enable zero-phase gain compensation to completely eliminate the effects of phase with any digital equalizer.

상술한 트랜스오랄 필터의 구현은 볼륨, 시간지연기, 위상반전기 및 디지털 또는 아날로그 이퀼라이저와 같은 종래의 하드웨어를 이용하여 용이하게 구현할 수 있고, 하드웨어적인 구현절차를 음향편집 전문 소프트웨어를 이용하여 구현할 수도 있다.The implementation of the transoral filter described above can be easily implemented using conventional hardware such as volume, time delay, phase inverter, and digital or analog equalizer, and the hardware implementation procedure can be implemented using sound editing software. have.

본 발명은 직접음과 교차 음압의 비 gc를 설정하는 gain 볼륨과 시간 지연기를 이용한 좌우 스피커의 cross-talk 성분 제거과정과 그리고 기존의 디지털 이퀄라이져를 이용한 zero-phase 이득 보상 단계로 구성되어 있다. 이러한 구현 방법은 디지털 신호처리 기술이나 관련 DSP hardware의 전문적 지식을 필요하지 않기 때문에 국내 음향 설계 및 녹음 기사들이 쉽게 구현할 수 있는 장점을 제공한다. 특히, 이퀄라이져를 이용한 zero-phase 이득 보상기법은 기존의 transaural filter의 이득함수 G(f) 구현에 필요한 디지털 필터링 기법과 관련 DSP 사용 시 수반되는 근사화 및 위상 왜곡 때문에 발생하는 음질 저하 및 음색 왜곡의 문제점을 최소화할 수 있는 장점을 갖는다.The invention consists of the direct sound and the cross sound pressure ratio g cross-talk component removal process of the left and right speakers Using a gain volume and the time delay to set the c and and the zero-phase gain compensation stage using the existing digital equalizer of. This implementation provides the advantages that domestic sound design and recording technicians can easily implement because they do not require the expertise of digital signal processing technology or related DSP hardware. In particular, the zero-phase gain compensator using the equalizer has problems of sound quality degradation and timbre distortion caused by the digital filtering technique required to implement the gain function G (f) of the conventional transaural filter and the approximation and phase distortions associated with the related DSP. It has the advantage of minimizing.

Claims (4)

(a) 좌우 대칭형 스피커에서 좌측 및 우측 귀로 직접 전달되는 음압과 교차 전달되는 음압의 비를 설정하고;(a) setting the ratio of sound pressure delivered cross-directly and sound pressure delivered directly to the left and right ears in a symmetrical speaker; (b) 좌측 스피커 구동신호 및 우측 스피커 구동신호에 좌우측 귀의 상대적 음압비 만큼의 이득율 및 양 귀 사이의 도달시간 차이만큼의 시간지연을 적용하고 180°위상을 반전하여 이를 각각 반대편 스피커 구동신호에 인가하고; 그리고,(b) Applying the gain ratio as much as the relative sound pressure ratio of the left and right ears and the time delay as much as the arrival time difference between both ears, to the left speaker driving signal and the right speaker driving signal, and inverting the 180 ° phase to the opposite speaker driving signal, respectively. Authorized; And, (c) 상기 (b)단계에서 얻어진 신호에 다시 동일한 이득보상율을 적용하는 단계;(c) applying the same gain compensation rate to the signal obtained in step (b) again; 로 구성되는 것을 특징으로 하는 공간음상정위를 위한 트랜스오랄 필터 구현방법.Transoral filter implementation method for spatial sound phase, characterized in that consisting of. 제1항에서, 상기 이득보상율은 중심주파수 fc에 대하여 저역 하한 주파수 fL과 고역 상한 주파수 fU범위에서값으로 정의되는 등가대역별 이득값을 사용하는 것을 특징으로 하는 공간음상정위를 위한 트랜스오랄 필터 구현방법.The method of claim 1, wherein the gain compensation ratio is in the range of the lower limit frequency f L and the higher frequency limit f U with respect to the center frequency f c . 12. A method for implementing a transoral filter for spatial sound localization, comprising using an equivalent band-specific gain defined by a value. 제2항에서, 상기 등가대역별 이득값은 시간축에 대하여 전방으로 이득율의 반을 적용한 뒤 다시 신호를 시간축의 역으로 뒤집어 나머지 반의 이득율을 적용하는 것을 특징으로 하는 공간음상정위를 위한 트랜스오랄 필터 구현방법.[4] The transoral for spatial acoustic stereotype of claim 2, wherein the gain value of each equivalent band is applied half of the gain rate forwardly with respect to the time axis, and then reverses the signal to the inverse of the time axis and applies the gain rate of the other half. How to implement a filter. 제1항 내지 제3항 중의 어느 한 항에서, 상기 트랜스오랄 필터의 구현을 볼륨, 시간지연기, 위상반전기 및 디지털 또는 아날로그 이퀼라이저와 같은 하드웨어를 이용하여 구현하거나 음향편집 소프트웨어를 이용하여 구현하는 것을 특징으로 하는 공간음상정위를 위한 트랜스오랄 필터 구현방법.The method of any one of claims 1 to 3, wherein the implementation of the transoral filter is implemented using hardware such as volume, time delay, phase inverter and digital or analog equalizer, or using sound editing software. A method for implementing a transoral filter for spatial sound phase, characterized in that.
KR1019990052037A 1999-11-23 1999-11-23 Method for implementing transaural filter for sound localization KR100344975B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990052037A KR100344975B1 (en) 1999-11-23 1999-11-23 Method for implementing transaural filter for sound localization

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990052037A KR100344975B1 (en) 1999-11-23 1999-11-23 Method for implementing transaural filter for sound localization

Publications (2)

Publication Number Publication Date
KR20010047701A true KR20010047701A (en) 2001-06-15
KR100344975B1 KR100344975B1 (en) 2002-07-20

Family

ID=19621285

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990052037A KR100344975B1 (en) 1999-11-23 1999-11-23 Method for implementing transaural filter for sound localization

Country Status (1)

Country Link
KR (1) KR100344975B1 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007035072A1 (en) * 2005-09-26 2007-03-29 Samsung Electronics Co., Ltd. Apparatus and method to cancel crosstalk and stereo sound generation system using the same
KR100705930B1 (en) * 2006-06-02 2007-04-13 엘지전자 주식회사 Apparatus and method for implementing stereophonic
KR100739762B1 (en) * 2005-09-26 2007-07-13 삼성전자주식회사 Apparatus and method for cancelling a crosstalk and virtual sound system thereof
NL1032538C2 (en) * 2005-09-22 2008-10-02 Samsung Electronics Co Ltd Apparatus and method for reproducing virtual sound from two channels.

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03270400A (en) * 1990-03-19 1991-12-02 Roland Corp Sound image localization device

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL1032538C2 (en) * 2005-09-22 2008-10-02 Samsung Electronics Co Ltd Apparatus and method for reproducing virtual sound from two channels.
WO2007035072A1 (en) * 2005-09-26 2007-03-29 Samsung Electronics Co., Ltd. Apparatus and method to cancel crosstalk and stereo sound generation system using the same
KR100739762B1 (en) * 2005-09-26 2007-07-13 삼성전자주식회사 Apparatus and method for cancelling a crosstalk and virtual sound system thereof
NL1032569C2 (en) * 2005-09-26 2008-09-09 Samsung Electronics Co Ltd Cross talk canceling apparatus for stereo sound generation system, has signal processing unit comprising filter to adjust frequency characteristics of left and right channel signals obtained from mixer
US8050433B2 (en) * 2005-09-26 2011-11-01 Samsung Electronics Co., Ltd. Apparatus and method to cancel crosstalk and stereo sound generation system using the same
KR100705930B1 (en) * 2006-06-02 2007-04-13 엘지전자 주식회사 Apparatus and method for implementing stereophonic

Also Published As

Publication number Publication date
KR100344975B1 (en) 2002-07-20

Similar Documents

Publication Publication Date Title
US6714652B1 (en) Dynamic decorrelator for audio signals
KR100416757B1 (en) Multi-channel audio reproduction apparatus and method for loud-speaker reproduction
US4118599A (en) Stereophonic sound reproduction system
KR100958243B1 (en) Stereophonic Sound Imaging
US8050433B2 (en) Apparatus and method to cancel crosstalk and stereo sound generation system using the same
KR100626233B1 (en) Equalisation of the output in a stereo widening network
EP0730812B1 (en) Apparatus for processing binaural signals
JP3514639B2 (en) Method for out-of-head localization of sound image in listening to reproduced sound using headphones, and apparatus therefor
US4567607A (en) Stereo image recovery
US6504933B1 (en) Three-dimensional sound system and method using head related transfer function
JP2000050400A (en) Processing method for sound image localization of audio signals for right and left ears
JP2007028624A (en) Method and system for reproducing wide monaural sound
JPH07105999B2 (en) Sound image localization device
JP3663461B2 (en) Frequency selective spatial improvement system
EP2229012B1 (en) Device, method, program, and system for canceling crosstalk when reproducing sound through plurality of speakers arranged around listener
WO2006009058A1 (en) Sound image localization device
JP2003230198A (en) Sound image localization control device
CN106954139A (en) A kind of sound field rendering method and system for combining earphone and loudspeaker
US6700980B1 (en) Method and device for synthesizing a virtual sound source
KR20020059725A (en) Two methods and two devices for processing an input audio stereo signal, and an audio stereo signal reproduction system
KR100344975B1 (en) Method for implementing transaural filter for sound localization
JP4540290B2 (en) A method for moving a three-dimensional space by localizing an input signal.
JP3500746B2 (en) Sound image localization device and filter setting method
US20030016837A1 (en) Stereo sound circuit device for providing three-dimensional surrounding effect
JP2985557B2 (en) Surround signal processing device

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20070627

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee