KR100312965B1 - Evaluation method of characteristic parameters(PC-ILD, ITD) for 3-dimensional sound localization and method and apparatus for 3-dimensional sound recording - Google Patents

Evaluation method of characteristic parameters(PC-ILD, ITD) for 3-dimensional sound localization and method and apparatus for 3-dimensional sound recording Download PDF

Info

Publication number
KR100312965B1
KR100312965B1 KR1019990049096A KR19990049096A KR100312965B1 KR 100312965 B1 KR100312965 B1 KR 100312965B1 KR 1019990049096 A KR1019990049096 A KR 1019990049096A KR 19990049096 A KR19990049096 A KR 19990049096A KR 100312965 B1 KR100312965 B1 KR 100312965B1
Authority
KR
South Korea
Prior art keywords
sound
equation
ears
difference
spatial
Prior art date
Application number
KR1019990049096A
Other languages
Korean (ko)
Other versions
KR20010045704A (en
Inventor
정완섭
김순협
Original Assignee
정명세
한국표준과학연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정명세, 한국표준과학연구원 filed Critical 정명세
Priority to KR1019990049096A priority Critical patent/KR100312965B1/en
Publication of KR20010045704A publication Critical patent/KR20010045704A/en
Application granted granted Critical
Publication of KR100312965B1 publication Critical patent/KR100312965B1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Abstract

본 발명은 인간이 청각구조(어깨, 머리, 좌/우측 귀)와 인지특성에 의하여 음원의 위치에 대한 삼차원적(거리, 방위각 및 고도) 정보를 인지하는 원리를 이용하여 음의 공간적 정위를 실현할 수 있는 방법 및 이를 이용하여 3차원 녹음을 할 수 있는 방법 및 장치에 관한 것이다.According to the present invention, a spatial spatial orientation of sound can be realized by using a principle that humans recognize three-dimensional (distance, azimuth, and altitude) information about a sound source's position by auditory structure (shoulder, head, left / right ears) and cognitive characteristics. The present invention relates to a method and an apparatus capable of three-dimensional recording using the same.

실험을 통하여 얻어진 공간 음상 정위에 가장 효과적인 환산 방법은 다음과 같이 두 단계로 구성된 인지량적 머리전달함수의 특성치 환산 방법이며, 그 과정은 다음과 같다. 먼저 기준점의 좌우측 머리전달함수에 대하여 임의 공간에서 측정된 좌우측 머리전달함수 HL및 HR의 상대적 양 IL및 IR을 식 1 및 식 2에 따라 환산하고,The most effective conversion method for spatial spatial positioning obtained through the experiments is the conversion of characteristic values of cognitive head transfer function consisting of two steps as follows. First, in terms of the relative amount of I L and I R of the left and right head related transfer function H L and H R measured in any place in accordance with equation 1 and the equation 2 with respect to the left and right head related transfer function of the reference point,

식 1: Equation 1:

식 2: Equation 2:

임의 밴드폭 내의 머리전달함수의 유효 진폭 LL(fc) 및 LR(fc)를 식 3 및 식 4에 따라 환산하고,The effective amplitudes L L (f c ) and L R (f c ) of the head transfer function within an arbitrary bandwidth are converted according to Equations 3 and 4,

식 3: Equation 3:

식 4: Equation 4:

주파수 대역별 양 귀 인지량적 음압레벨 차이 dBL및 dBR을 식 5 및 식 6에 의해 구하고,The difference between the two sound perceptual quantitative sound pressure level dB L and dB R for each frequency band can be obtained by

식 5: Equation 5:

식 6: Equation 6:

양 귀의 음압 도달 시간 τL과 τR의 상대적 차이τR,L을 식 7, 식 8 및 식 9에 의해 구하는 단계로 구성된다.It is composed of the steps of obtaining the relative difference τ R, L between the negative pressure arrival times τ L and τ R of both ears by Equation 7, Equation 8 and Equation 9.

식 7: Equation 7:

식 8: Equation 8:

식 9: Equation 9:

청취자와 음원의 상대적 공간 정보가 주어지면, 좌우 귀의 인지량적 음압레벨 데이터베이스로부터 좌/우측 음향 채널의 대역별 이퀄라이저 설정값이 결정되며, 이를 이용하여 좌우 채널의 이퀄라이저 이득율을 조정하고, 원음에 대하여 양귀 음압레벨 차이를 코딩한 이퀄라이저의 출력신호를 얻게되며, 양귀 음압 도달 시간차이의 설정값 또한 결정된다. 이때 좌측과 우측 중 음압 도달 시간이 늦은 채널에 상대적 지연시간을 설정하여 삼차원 공간 음상 정위를 구현한다.Given the relative spatial information of the listener and the sound source, the equalizer setting values for the left and right sound channels are determined from the cognitive sound pressure level databases of the left and right ears, and the equalizer gain ratios of the left and right channels are adjusted using the left and right sound channels. An equalizer output signal is coded with the sound pressure level difference between both ears, and the setting value of the time difference between arrival of the sound pressure of both ears is also determined. At this time, the relative delay time is set to the channel having the slow sound pressure arrival time among the left and the right to realize the three-dimensional spatial image orientation.

Description

공간 음상 정위를 위한 특성치의 환산 방법 및 이를 이용한 삼차원 음향 녹음 방법 및 장치 {Evaluation method of characteristic parameters(PC-ILD, ITD) for 3-dimensional sound localization and method and apparatus for 3-dimensional sound recording}{Evaluation method of characteristic parameters (PC-ILD, ITD) for 3-dimensional sound localization and method and apparatus for 3-dimensional sound recording}

본 발명은 인간이 청각구조(어깨, 머리, 좌/우측 귀)와 인지특성에 의하여 음원의 위치에 대한 삼차원적(거리, 방위각 및 고도) 정보를 인지하는 원리를 이용하여 음의 공간적 정위를 실현할 수 있는 방법 및 이를 이용하여 3차원 녹음을 할 수 있는 방법 및 장치에 관한 것이다. 보다 구체적으로, 본 발명은 음원에서 양 귀까지의 거리, 방위각 및 고도에 따라 변화되는 양귀의 인지량적 음압레벨 차이(Perception- Based Interaural Level Difference, PB-ILD)와 음압 도달시간 차이 (Interaural Time Difference, ITD)를 이용하여 삼차원 공간의 음상 정위를 실현하고 이를 이용하여 3차원적으로 녹음을 할 수 있는 방법 및 장치에 관한 것이다.According to the present invention, a spatial spatial orientation of sound can be realized by using a principle that humans recognize three-dimensional (distance, azimuth, and altitude) information about a sound source's position by auditory structure (shoulder, head, left / right ears) and cognitive characteristics. The present invention relates to a method and an apparatus capable of three-dimensional recording using the same. More specifically, the present invention is a perception-based interaural level difference (PB-ILD) and sound pressure arrival time difference (Interaural Time Difference) of both ears that change according to the distance, azimuth and altitude from the sound source to both ears The present invention relates to a method and apparatus for realizing sound image positioning in three-dimensional space using ITD and recording in three dimensions using the same.

본 발명은 음원의 공간 위치에 대한 단순 물리량적 기존의 머리전달함수 (Head-Related Transfer Function, HRTF)로부터 청각기관의 인지량적 특성치 (PB-ILD, ITD)의 환산 기법과 이들을 이용한 음원의 삼차원 공간 정위를 구현하는 소프트웨어 기술을 포함한다. 특히, 양귀의 인지량적 환산 기법을 이용하여 얻어진 양귀의 인지량적 음압레벨 차이(PB-ILD)와 음압 도달시간 차이 (ITD)를 이용한 공간 음상정위 기술은 기존의 머리전달함수를 이용한 음상 정위 기술의 한계점인 음색 왜곡과 음질 저하의 문제점을 획기적으로 개선하기 위하여 개발된 기술이다.The present invention relates to a method of converting the cognitive quantitative values (PB-ILD, ITD) of auditory organs from the simple physical-quantitative head-related transfer function (HRTF) to the spatial location of a sound source and the three-dimensional space of the sound source using the same. Includes software technology to implement the orientation. In particular, the spatial stereotactic technique using the cognitive quantitative sound pressure level difference (PB-ILD) and the sound pressure arrival time difference (ITD) of both ears obtained by using the quantitative conversion technique of both ears is based on the conventional stereophonic stereotactic technique using head transfer function. This technology was developed to drastically improve the problems of tone distortion and sound degradation, which are limitations.

본 기술은 하나의 음원에 대한 공간 정보(거리, 방위각 및 고도) 뿐만 아니라 다수의 음원들 또한 공간에 정위할 수 있는 기술을 제공한다. 그리고, 청음자의 위치 기준 좌표계에 대하여 복합 음원들의 상대적 위치 좌표계로 음상을 정위하는 기법을 사용하기 때문에, 청음자의 공간 이동에 의한 복합 음원의 공간적 청음 특성 재현뿐 아니라 다수 음원들의 개별적 공간 이동에 대한 청음자의 공간 청음 특성 또한 실현할 수 있다. 이러한 공간 음상 정위 기술은 기존의 스테레오 녹음용 장비 (그래픽 이퀄라이저, 시간 지연기)들과 개인용 컴퓨터의 단순 조합으로 삼차원의 고 품질 음향 녹음을 구현할 수 있는 장점을 제공한다. 따라서, 본 발명에서 제안하는 기술들은 기존의 녹음 기기를 사용하는 분야(음반, TV 및 라디오 방송, 오락)에 직접 적용될 수 있는 새로운 삼차원 음향 기록 기술로 전문 녹음 기사들의 창의성 향상과 더불어 아직 들어보지 못한 고품위 음의 창조에도 크게 기여할 수 있다.The present technology provides not only spatial information (distance, azimuth and altitude) for one sound source but also a plurality of sound sources to be located in the space. In addition, since the method of orienting the sound image in the relative position coordinate system of the composite sound sources with respect to the position reference coordinate system of the listener, not only reproduces the spatial sound characteristics of the composite sound source due to the spatial movement of the listener, but also listens to the individual spatial movement of multiple sound sources. The spatial hearing characteristics of the ruler can also be realized. This spatial sound localization technology provides the advantage of three-dimensional high-quality sound recording with a simple combination of conventional stereo recording equipment (graphic equalizer, time delay) and personal computer. Therefore, the techniques proposed in the present invention are a new three-dimensional sound recording technology that can be directly applied to the field (records, TV and radio broadcasting, entertainment) using the existing recording equipment, and the creativity of professional recording technicians have not heard yet It can also contribute greatly to the creation of high quality sound.

기존의 녹음 기술 분야에서 가장 널리 이용되고 있는 헤드폰 재생에 의한 스테레오 녹음방식(제1도 참고)은 음상(sound image)이 양 귀의 선상(102)에만 음이 정위 되게 된다. 즉, 모노 입력 신호에 대해 팬폿을 12시 방향에 설정하면 음상은 머리의 중앙(103)에 맺히게 되고 3시 방향으로 설정하면 오른쪽 귀 가까운 부분(104)에 맺히게 되고 9시 방향에 설정하면 왼쪽 귀 가까운 부분(105)에 맺히게 된다. 따라서, 녹음 기사는 삼차원상에 위치한 각각의 소리를 단지 팬폿을 이용하여 적당히 양귀 선상에 음을 정위 시키게 된다. 이러한 방법은 모노의 녹음 방식에 비해 다소 개선된 녹음 방식이긴 하지만 공간적 현실감을 느낄 수 있는 삼차원적 음향의 재생에는 한계가 있다.Stereo recording method (refer to FIG. 1) by headphone reproduction, which is most widely used in the conventional recording technology, has a sound image positioned only on the line 102 of both ears. That is, when the panpot is set at 12 o'clock for the mono input signal, the sound image is formed at the center 103 of the head, and when it is set at 3 o'clock, it is formed at the part near the right ear 104, and when it is set at 9 o'clock, the left ear is set. The close portion 105 is formed. Thus, the recording engineer places the sounds on each of the three-dimensional planes by using a panpot to properly place them on both ears. Although this method is a somewhat improved recording method compared to the mono recording method, there is a limit to the reproduction of the three-dimensional sound that can feel the spatial reality.

그리고, 방송실에서 널리 이용되고 있는 방법은 두 개의 모니터 스피커를 이용한 2 채널 녹음 방식(제2도 참고)이다. 이 방식 또한 녹음 기사는 3차원 공간상에 위치한 음들을 팬폿으로 적당히 두 스피커를 잇는 선상(201)에 음을 정위시킨다. 즉, 팬폿을 12시 방향에 설정하면 음상은 머리의 중앙(204)에 맺히게 되고, 3시 방향에 설정하면 오른쪽 가까운 부분(205)에 맺히게 되고 9시 방향에 설정하면 왼쪽 귀 가까운 부분(206)에 맺히게 된다. 이러한 2채널 방식에 의한 녹음은 3차원 공간상의 음을 1 차원 선상(203)에 위치시킬 수밖에 없었기 때문에 현실감 있는 소리들을 재생하기 어려웠고 녹음기사가 할 수 있는 일은 단지 팬폿으로 음을 좌우의 적당한 위치에 정위 시키는 일 뿐이어서 녹음기사의 창의력을 충분히 발휘할 수 없다.In addition, a widely used method in a broadcasting room is a two-channel recording method using two monitor speakers (see FIG. 2). In this manner, the recording engineer positions the sound on the line 201 connecting the two speakers as appropriate as a panpot. That is, when the panpot is set at 12 o'clock, the sound image is formed at the center of the head 204, and at 3 o'clock, the sound image is formed at the right near part 205. It is concluded. This two-channel recording made it difficult to reproduce realistic sounds because the sound in the three-dimensional space had to be located on the one-dimensional line 203. The only thing the recorder can do is simply move the sound to the right position to the left and right. It's just an orthodox, so you can't get enough of the recorder's creativity.

이러한 1차원적 선상의 음상 정위에 대한 한계를 극복하기 위해 나온 개념이 멀티 채널 녹음/재생 방법이다. 이는 청취자의 귀 높이에 해당되는 평면의 전면에 2개의 스피커와 뒷면에 2개의 스피커를 각각 위치시킨다 (제3도 참조). 본 녹음 방식은 전면에 위치한 스피커 선상의 위치에 음상을 정위 시키기 위해 2채널 스피커 재생방식처럼 팬폿으로 조절하여 스피커를 잇는 선상(305)에 음을 정위시킬 수 있다. 이렇게 전면 스피커 선상에 맺힌 음상을 청취자 귀 높이의 평면상으로 펼치기 위해서는 청취자 앞(301,302), 뒤(303,304)의 스피커의 음량을 조절하여 소리를 선상(305)에서 평면상의 위치(307)로 이동시킬 수 있다. 또한 뒷면에 위치한 스피커(303, 304)의 음량을 전면 스피커에 비해 크게 했을 때 전방 음상 (307)의 위치를 청취자의 뒷면(308)으로 음상 위치를 이동할 수 있게 된다. 부수적으로 뒤 스피커의 재생 시간차를 이용하여 음이 앞에서 뒤로 혹은 그 반대로 움직이는 효과도 재생할 수 있어 보다 현실감 있는 음의 재생이 가능하다. 그러나, 방송과 음반의 경우 채널 수가 2 개로 고정되어 있어 멀티 채널의 도입에 많은 현실적 한계점이 있다. 단지, 영화나 대형 오락 시설 등의 특수한 용도에서는 이미 멀티채널 녹음/재생 방법이 도입되고 있을 뿐이다. 이러한 서라운드 방식 또한 아래와 같은 문제점들을 안고 있다.The concept to overcome the limitation of the 1-dimensional linear image location is a multi-channel recording / playback method. This places two speakers in the front and two speakers in the back, respectively, corresponding to the height of the listener's ears (see Figure 3). In this recording method, the sound can be positioned on the line 305 connecting the speakers by adjusting the panpot like the 2-channel speaker reproduction method to position the sound image at the position on the front line of the speaker. In order to spread the sound image formed on the front speaker line on the plane of the height of the listener's ear, the sound is moved from the line 305 to the position 307 on the plane by adjusting the volume of the speaker in front of the listener (301, 302) and the rear (303, 304). Can be. In addition, when the volume of the speakers 303 and 304 located at the rear side is increased compared to the front speakers, the position of the front image 307 can be moved to the rear side 308 of the listener. Incidentally, the effect of moving the sound from the front to the back or vice versa can be reproduced by using the playback time difference of the rear speaker, which enables more realistic sound reproduction. However, in the case of broadcasting and recording, the number of channels is fixed to two, so there are many practical limitations in the introduction of multi-channel. However, multi-channel recording / playback methods have already been introduced for special applications such as movies and large entertainment facilities. This surround method also has the following problems.

첫째, 이 방식에서도 3차원(방위각, 고도, 거리)에 위치한 소리들을 재생할 수가 없다. 기존의 2채널 방식의 한계점인 선상의 정위를 단순 2 차원적 평면상으로 넓히기는 했지만 청취자의 위 혹은 아래에서 나는 소리의 정위는 실현할 수는 없다.First, even in this method, sounds located in three dimensions (azimuth, altitude, distance) cannot be reproduced. Although the linear position, which is the limitation of the conventional two-channel method, has been expanded to a simple two-dimensional plane, the position of sound coming from above or below the listener cannot be realized.

둘째, 기존의 2 채널 녹음 방법을 직접 사용할 수가 없다. 영화나 오락 같은 특수한 시설을 갖춘 용도에서는 문제점이 없지만, 공중파 방송(라디오, 텔레비전)이나 음반 분야에서 현재 채널 수 확장은 사실 불가능한 실정이다. 따라서, 공중파 방송, 음반 분야에서 이 방식을 적용하기 의해서는 멀티채널 녹음을 2채널로 바꿔주는 인코더, 이 인 코딩된 신호를 멀티채널로 바꿔주는 디코더를 사용해야 한다. 이것은 결국 소비자의 입장에서 보면 개별적으로 디코더를 구입해야 되기 때문에 많은 금전상의 손해를 보아야 한다.Second, the existing two channel recording method cannot be used directly. Although there are no problems in applications with special facilities such as movies and entertainment, it is currently impossible to expand the number of channels in the air broadcasting (radio, television) and recording fields. Therefore, in the field of over-the-air broadcasting and recording, this method should use an encoder that converts multichannel recording into two channels and a decoder that converts the encoded signal into multichannel. This, in the end, requires a lot of monetary damage, because the individual decoder must be purchased separately.

셋째, 실제의 가정에서 4개의 스피커를 청취자의 앞뒤에 두고 음을 청취할 만큼 공간이 충분치 않다. 도시 아파트 생활을 하는 가정에서 멀티 채널 재생은 많은 어려움에 직면하게 된다.Third, there is not enough space in the real home to listen to the sound with four speakers in front of and behind the listener. Multi-channel playback faces many challenges in urban apartment homes.

현재 국내에서 이용되고 있는 두 채널 및 다 채널 녹음 방법의 문제점들을 소개하였다. 이러한 문제점은 사실 국내 음반 및 방송 분야에 종사하는 전문 녹음 기술자의 공통된 애로 사항이며, 향후 고 품질의 음반 생산과 방송국의 음향 분야에 대한 기술적 한계점 극복에 대한 필요성은 본 발명의 개발에 동기를 부여하였다.The problems of the two-channel and multi-channel recording methods currently used in Korea are introduced. This problem is actually a common problem of professional recording technicians working in the field of recording and broadcasting in Korea, and the necessity of overcoming the technical limitations in the sound field of high quality recording and the sound field of the broadcasting station has motivated the development of the present invention. .

본 발명의 목적은 3차원 공간상에 음을 정위시키고 재생할 수 있는 공간 음상 정위를 위한 특성치의 환산 방법 및 이를 이용한 3차원 음향 녹음 방법 및 장치를 제공하는 것이다.SUMMARY OF THE INVENTION An object of the present invention is to provide a method for converting a characteristic value for spatial sound positioning for reproducing and reproducing sound in three-dimensional space, and a three-dimensional sound recording method and apparatus using the same.

본 발명의 다른 목적은 인코더나 디코더와 같은 별도로 추가적인 장비가 필요치 않고 기존의 장비만으로 구현이 가능한 공간 음상 정위를 위한 특성치의 환산 방법 및 이를 이용한 3차원 음향 녹음 방법 및 장치를 제공하는 것이다.It is another object of the present invention to provide a method of converting characteristic values for spatial sound image positioning that can be implemented using only existing equipment without requiring additional equipment such as an encoder or a decoder, and a method and apparatus for three-dimensional sound recording using the same.

본 발명의 또 다른 목적은 음원 스피커의 음향 특성, 마이크로폰의 전기적, 음향학적 특성, 청음자의 체위 인자들에 의한 음향학적 특성 또는 실험실의 음향 특성치 등에 의한 영향을 최소화할 수 있는 공간 음상 정위를 위한 특성치의 환산 방법 및 이를 이용한 3차원 음향 녹음 방법 및 장치를 제공하는 것이다.It is still another object of the present invention to provide a characteristic value for spatial sound positioning that can minimize the influence of acoustic characteristics of a sound source speaker, electrical and acoustic characteristics of a microphone, acoustic characteristics by positional factors of a listener, or acoustic characteristics of a laboratory. To provide a conversion method and a three-dimensional sound recording method and apparatus using the same.

본 발명의 또 다른 목적은 기존의 스테레오 녹음용 장비들과 개인용 컴퓨터의 단순 조합으로 삼차원의 고 품질 음향 녹음을 구현할 수 있는 장치 및 방법을 제공하는 것이다.It is still another object of the present invention to provide an apparatus and method for realizing three-dimensional high quality sound recording by a simple combination of existing stereo recording equipment and a personal computer.

제1도는 2 채널 녹음 시 헤드폰 재생을 통한 음상 정위 개념도이다.1 is a conceptual diagram of sound image positioning through headphone playback during two-channel recording.

제2도는 2채널 녹음 시 스테레오 스피커 재생을 통한 음상 정위 개념도이다.FIG. 2 is a conceptual diagram of stereotactic stereophony through stereo speaker reproduction during two-channel recording.

제3도는 멀티채널 녹음 시 멀티채널 스피커를 이용한 음상 정위 개념도이다.3 is a conceptual diagram of sound image positioning using multi-channel speakers during multi-channel recording.

제4도는 측정된 머리전달함수의 진폭 및 위상 주파수 특성이다.(거리 r=1.5 m, 고도각 φ=0˚)4 is the amplitude and phase frequency characteristics of the measured head transfer function (distance r = 1.5 m, elevation angle φ = 0 °).

제5도는 인지량적 머리전달함수의 진폭 특성이다.5 is the amplitude characteristic of the cognitive head transfer function.

제6도는 방위각의 변화에 대한 좌우측 귀에 도달하는 음압도달 시간에 관한 그래프이다.(기준점은 방위각과 고도가 0°인 점을 선정)6 is a graph of the sound pressure arrival time to reach the left and right ears for a change in azimuth (the reference point is a point with an azimuth and an altitude of 0 °).

제7도는 이퀄라이저와 시간지연기를 이용한 삼차원 공간 음향기록 장치의 개략도이다.7 is a schematic diagram of a three-dimensional spatial sound recording apparatus using an equalizer and a time delay.

제8도는 일반적 믹싱 콘솔의 개념도이다.8 is a conceptual diagram of a general mixing console.

제9도 내지 제12도는 인지량적 양귀 음압레벨 및 음압도달 시간차이를 이용한 삼차원 공간 음향 녹음 기술에 관한 제1실시예 내지 제4실시예의 개념도이다.9 to 12 are conceptual views of the first to fourth embodiments of the three-dimensional spatial sound recording technique using the cognitive volume ear pressure level and sound pressure arrival time difference.

<도면의 주요부에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>

101: 헤드폰 102: 양 귀를 잇는 선101: headphone 102: a line connecting both ears

103: 헤드폰 재생 시 팬폿을 12시 방향 설정 시 음상 위치103: Sound position when the panpot is set to 12 o'clock during headphone playback

104: 헤드폰 재생 시 팬폿을 3시 방향 설정 시 음상 위치104: Sound image position when the panpot is set to 3 o'clock when headphones are played

105: 헤드폰 재생 시 팬폿을 9시 방향 설정 시 음상 위치105: Sound image position when the panpot is set to 9 o'clock during headphone playback

106: 청취자의 머리 201: 왼쪽 스피커106: head of the listener 201: left speaker

202: 오른쪽 스피커 203: 두 스피커를 잇는 선202: right speaker 203: line connecting two speakers

204: 스테레오 스피커 재생 시 팬폿을 12시 방향 설정 시 음상 위치204: Sound position when the panpot is set to 12 o'clock when playing stereo speakers

205: 스테레오 스피커 재생 시 팬폿을 3시 방향 설정 시 음상 위치205: Sound position when the panpot is set to 3 o'clock when playing stereo speakers

206: 스테레오 스피커 재생 시 팬폿을 9시 방향 설정 시 음상 위치206: Sound position when the panpot is set to 9 o'clock when playing stereo speakers

207: 청취자의 머리 301: 전면 왼쪽 스피커207: head of the listener 301: front left speaker

302: 전면 오른쪽 스피커 303: 후면 왼쪽 스피커302: Front right speaker 303: Rear left speaker

304: 후면 오른쪽 스피커 305: 전면 스피커 사이를 잇는 선304: Rear right speaker 305: Line between front speakers

306: 전면 왼쪽, 후면 왼쪽 스피커를 잇는 선306: Line connecting the front left and rear left speakers

307: 전면 두개의 스피커 사이를 잇는 선상에 위치한 음을 뒷면에 위치한 스피커의 음량에 비해 전면 스피커의 음량을 크게 했을 때의 음상 정위 위치307: Sound location when the volume of the front speakers is increased compared to the volume of the rear speakers

308: 전면 두 개의 스피커 사이를 잇는 선상에 위치한 음을 뒷면에 위치한 스피커의 음량에 비해 전면 스피커의 음량을 작게 했을 때의 음상 정위 위치308: Stereotactic position when the volume of the front speaker is lower than the volume of the front speaker between the two speakers

309: 청취자의 머리309: head of the listener

인간은 좌우 2개의 귀를 가지고 있으며, 이를 이용하여 공간상의 모든 소리의 방향을 파악할 뿐 아니라 거리감까지도 인식할 수 있다. 이러한 3차원 공간 음의 인지 원리는 Lord Rayleigh (1907, On our perception of sound direction,Philosophical Magzine)가 처음 소개한 두 가지의 양, 즉 양귀 음압레벨 (Interaural Level Difference, ILD)과 음압 도달시간 차이 (Interaural Time Difference, ITD)로 정량화 될 수 있다. 이러한 고전적 개념에서 비추어 볼 때 앞서 소개한 기존 스테레오 음향 기록기술은 팬폿을 이용하여 양귀 음압레벨 차이(ILD)만을 조정할 뿐 양 귀의 시간 차이(ITD)를 이용한 음향 기술은 아직도 현실화되지 못하고 있다. 사실, Lord Rayleigh의 고전적 음상 인식 개념은 양 귀의 음압레벨 차이와 시간 차이의 두 특성치를 동시에 조정할 때 청각 기관은 공간적 음상을 올바르게 인식한다는 점을 의미한다. 따라서, 좌우 음압레벨 조절용 팬폿만을 사용하는 기존 스테레오 음향 기록 기술은 우선 양 귀 음압 도달 시간지연 조절용 또 하나의 팬폿이 필요할 뿐 아니라 선정된 음압 조절용 팬폿의 설정치에 대한 적절한 시간지연 팬폿 설정의 정량화된 방법 또한 필요함을 알 수 있다. 따라서, 양 귀 음압의 레벨차이와 도달시간 설정용 팬폿의 동시 설정 방법은 삼차원 공간 음상 정위의 가장 핵심적 기술 요소임을 알 수 있다.Humans have two ears, left and right, which can be used to recognize the direction of all sounds in space as well as to sense distance. This three-dimensional spatial cognitive principle is introduced by Lord Rayleigh (1907, On our perception of sound direction, Philosophical Magzine ), the two quantities, namely Interaural Level Difference (ILD) and time difference of sound pressure arrival ( Interaural Time Difference (ITD). In view of this classical concept, the conventional stereo sound recording technology introduced above only adjusts the sound pressure level difference (ILD) of both ears using a panpot, but the sound technology using the time difference (ITD) of both ears is still not realized. In fact, Lord Rayleigh's concept of classical sound recognition means that the auditory organ correctly recognizes spatial sound when adjusting both characteristics of sound pressure level difference and time difference of both ears simultaneously. Therefore, the existing stereo sound recording technology using only the left and right sound pressure level adjustment panpots first needs another panpot for adjusting the sound pressure arrival time delay of both ears, as well as a method for quantifying the appropriate time delay panpot setting for the selected sound pressure adjustment panpot. It can also be seen that it is necessary. Therefore, it can be seen that the simultaneous setting of the level difference between the sound pressure of both ears and the panpot for setting the arrival time is the most important technical element of the three-dimensional spatial sound image positioning.

음상 공간 정위의 핵심적 두 특성치인 양귀 음압 차이와 도달시간 차이를 동시에 설정하는 방법을 1970∼80년대 수행된 머리전달함수, 즉 음원의 공간적 위치 (방위각, 고도)에 따른 양 귀까지의 음향학적 머리전달함수 (Head-RelatedTransfer Function, 이하 'HRTF'라 약칭)의 실험 결과들을 이용하여 추정하는 방법을 본 발명에서 새로이 고안하였다. 머리전달 함수(HRTF)는 방위각과 고도를 미세하게 세분하여 약 700 개 이상의 구형 공간에 위치한 기준 음원에 대한 좌우측 외이부(귓구멍)에서 측정된 음압의 주파수 전달 특성을 포함하고 있다. 음원에서 양귀 중심점까지의 거리를 r, 음원과 양귀 중심점의 좌우 방위각(Azimuth Angle)을 θ, 그리고 음원과 양귀 중심점이 이루는 상하 고도각(Elevation Angle)을 φ라 하면, 좌측 귀에서 측정된 머리전달함수 HL(f; r, θ, φ)과 우측 귀에서 측정된 머리전달함수 HR(f; r, θ, φ)을 동시에 측정할 수 있다. 제 4도는 거리 r = 1.5 m이고 고도각 φ = 0˚ 경우, 표준(연)에서 측정한 머리전달함수의 진폭 크기와 위상의 주파수 특성을 방위각에 따라 보여주고 있다.The head transfer function performed in the 1970s and 1980s, namely the acoustic head to both ears according to the spatial position (azimuth, altitude) of the sound source, was established to establish the two key characteristics of the acoustic spatial orientation, the difference in both sound pressure and the time of arrival. The method of estimating using the experimental results of the transfer function (Head-Related Transfer Function, hereinafter abbreviated as 'HRTF') is newly devised in the present invention. The head transfer function (HRTF) includes the frequency transfer characteristics of sound pressures measured at the left and right outer ear parts of the reference sound source located at about 700 spherical spaces by subdividing the azimuth and altitude finely. If the distance from the sound source to the center of both ears is r, the azimuth angle of the sound source and the center of both ears is θ, and the elevation angle between the sound source and the center of both ears is φ. The function H L (f; r, θ, φ) and the head transfer function H R (f; r, θ, φ) measured at the right ear can be measured simultaneously. 4 shows the amplitude magnitude and phase frequency characteristics of the head transfer function measured in the standard (years) according to the azimuth angle when the distance r = 1.5 m and the altitude angle φ = 0 °.

실험적으로 측정된 머리전달함수는 음원 스피커의 음향 특성 (음향 출력 및 방향성 등), 양귀 음압 측정용 마이크로폰의 전기적 그리고 음향학적 특성, 청음자의 체위 인자들 (양 귀, 머리, 어깨, 및 상체의 크기 및 형상)에 의한 반사, 회절, 산란 등에 의한 음향학적 특성, 그리고 실험실의 음향 특성치 (잔향 시간, 반사 및 흡음 특성)에 의한 복합적 영향 인자를 포함하고 있다. 이러한 복합적 영향인자들이 포함된 단순 측정량인 머리전달함수를 음원의 공간 음상 정위에 이용할 경우, 제4도 (a)와 (b)에 표시된 바와 같이 머리전달함수의 진폭과 위상에 포함된 수많은 피크치들은 원음의 음색 왜곡과 음질의 저하를 초래하게 된다. 이와 같이 단순 측정 머리전달함수를 이용한 공간 음상 정위에 수반되는 음색 왜곡과 음질 저하는 아직도 삼차원 공간 음상 정위 기술이 공중파 방송 (TV, 라디오), 음반 그리고 영화의 응용분야에 활용되지 못하는 가장 주된 요인이 되고 있다. 이러한 문제점을 해결할 수 있는 방안을 소개한다. 사람의 청각기관이 과연 제4도 (a)의 진폭 특성에서 보인 수 없는 최대 최소 피크치들을 식별하여 정확히 인식할 수 있는가 하는 점이다. 인간의 청각기관은 다수의 소리를 동시에 들을 경우 'Masking' 현상 (일부 소리의 묻힘 현상)때문에 최소치들에 대한 음향 성분은 인식이 불가능하며 그리고 근접한 두 최대 피크치의 미세한 식별 또한 불가능하다. 이러한 원리를 구체화한 예들이 음악의 음계 (Octave, 옥타브)나 혹은 임계 밴드폭 (Critical Bandwidth)을 이용한 인간 청각 기관의 인식 모델이다.Experimentally measured head transfer functions include acoustic characteristics of sound source speakers (such as sound output and directivity), electrical and acoustic characteristics of microphones for measuring both ears sound pressure, and positional factors of the listener (both ears, head, shoulders, and upper body size). And acoustic properties due to reflection, diffraction, scattering, etc., and complex influence factors due to laboratory acoustic properties (reverberation time, reflection, and sound absorption properties). When the head transfer function, which is a simple measure containing these complex influence factors, is used for the spatial sound localization of the sound source, as shown in Figs. 4 (a) and (b), numerous peaks included in the amplitude and phase of the head transfer function are shown. They cause distortion of the original sound and deterioration of sound quality. As such, the distortion and sound quality associated with spatial sound positioning using the simple measurement head transfer function are still the main reasons why three-dimensional spatial sound positioning technology is not utilized in the application of airwave broadcasting (TV, radio), recording, and film. It is becoming. Here are some ways to solve this problem. Does the human auditory organ correctly identify and recognize the maximum and minimum peaks that cannot be seen in the amplitude characteristics of FIG. When the human auditory organ hears multiple sounds simultaneously, the sound component of the minimums cannot be recognized because of the 'masking' phenomenon (some sound buried), and the fine identification of two adjacent maximum peaks is impossible. Examples embodying this principle are the recognition models of human auditory organs using musical scales (Octave, Octave) or Critical Bandwidth.

사실, 방송국이나 음반업계의 전문 음향 기사들이나 음향 연구원들이 이용하고 있는 1/3-옥타브로 구성된 이퀄라이저 (1/3-Octave Band Equaliser, 혹은 그래픽 이퀄라이저)는 음계 모델을 이용한 음향 기기이다. 이와 같이 청각기관의 주파수 대역에 대한 인지량에 직접 관련된 양으로 머리전달함수의 주파수 특성을 환산하는 방법을 제안한다.In fact, 1 / 3-octave equalizers (1 / 3-Octave Band Equalisers, or graphic equalizers), used by professional sound technologists and sound researchers in the broadcast and record industry, are acoustic devices using scale models. Thus, we propose a method of converting the frequency characteristics of the head transfer function into an amount directly related to the perceived amount of the hearing organ.

수많은 사람의 실험을 통하여 얻어진 공간 음상 정위에 가장 효과적인 환산 방법은 다음과 같이 두 단계로 구성된 인지량적 머리전달함수의 특성치 환산 방법이다. 첫 단계는 기준점의 좌우측 머리전달함수 HL(f; r0, θ0, φ0)과 HR(f; r0, θ0, φ0)에 대하여 임의 공간에서 측정된 좌우 측 머리전달함수 HL(f; r, θ, φ)과 HR(f; r, θ, φ)의 상대적 양을 다음 수학식 1 및 2에 따라 환산한다.The most effective conversion method for the spatial sound positioning obtained through the experiments of many people is the conversion of the characteristic value of the cognitive head transfer function composed of two steps as follows. The first step is the left and right head transfer functions measured in arbitrary spaces for the left and right head transfer functions H L (f; r 0 , θ 0 , φ 0 ) and H R (f; r 0 , θ 0 , φ 0 ) of the reference point. The relative amounts of H L (f; r, θ, φ) and H R (f; r, θ, φ) are converted according to the following equations (1) and (2).

위 수학식 1과 2에서 위첨자 *는 공액복소수를 표시한다. 그리고, 기준점에 대한 선정은 사용자의 편의에 따라 선정할 수 있다. 본 발명에서는 사용한 기준점은 고도각 φ0= 0°으로 고정하고 방위각 θ0= 0°와 θ0= 30°두 가지의 값을 사용하며 이러한 선정은 스피커를 구성하는 방법에 따라 다른 값을 사용한다. 두 개의 스피커가 매우 근접한 상태에서 설치될 경우 기준점은 고도각 φ0= θ0= 0°를 사용하며, 그리고 두 개의 스피커를 좌우 30°대칭되게 설치할 경우 기준점은 고도각 φ0= 0°와 방위각 θ0= 30°를 선정한다. 수학식 1과 2에서 보인 상대적 머리전달함수 환산 기법은 음원의 공간 정보와는 무관한 다음 3 가지 항목에 대한 머리전달함수의 영향인자의 효과를 최소화할 수 있는 효과적 방법이다.In Equations 1 and 2, the superscript * denotes a conjugate complex number. The reference point may be selected according to the user's convenience. In the present invention, the reference point used is fixed at an altitude angle φ 0 = 0 ° and uses two values of azimuth angle θ 0 = 0 ° and θ 0 = 30 °, and this selection uses different values depending on the method of configuring the speaker. . If the two speakers are installed in close proximity, the reference point uses an elevation angle of φ 0 = θ 0 = 0 °, and if the two speakers are mounted side-by-side 30 °, the reference point is between the elevation angle of φ 0 = 0 ° and the azimuth angle. Select θ 0 = 30 °. The relative head transfer function conversion technique shown in Equations 1 and 2 is an effective method to minimize the effect of the influence factors of the head transfer function on the following three items irrelevant to the spatial information of the sound source.

(1) 음원 스피커의 음향 특성 (음향 출력 및 방향성 등) 인자(1) acoustic characteristics (sound output and directivity) of sound source speaker

(2) 양귀 음압 측정용 마이크로폰의 전기적 그리고 음향학적 특성 인자(2) Electrical and acoustical characteristics of both ears sound pressure microphones

(3) 실험실의 음향 특성 (잔향 시간, 반사 및 흡음 특성) 인자(3) factor of acoustic characteristics (reverberation time, reflection and sound absorption characteristics) of laboratory

그리고, 머리전달함수의 측정 및 분석 장치들에서 수반되는 측정 오차 인자들의 영향 또한 최소화 할 수 있다.In addition, it is possible to minimize the influence of the measurement error factors involved in the measurement and analysis of the head transfer function.

두 번째 단계는 수학식 1과 2에 따라 환산된 결과를 이용하여 인간 청감 특성에 따른 공간 특성 인자를 추정하는 방법이다. 즉, 음악의 음계 (Octave, 옥타브)나 혹은 임계 밴드폭 (Critical Bandwidth)을 이용하여 인간 청감 주파수 대역에 따라 공간 음상 특성치를 환산하는 과정이다. 1/3 옥타브 혹은 임계 밴드의 임의 중심 주파수를 fc, 하한 주파수와 상한 주파수를 각각 fL와 fU라 하자. 임의 밴드폭 내의 머리전달함수의 유효 진폭은 다음과 같이 환산한다.The second step is a method of estimating spatial characteristic factors according to human hearing characteristics using the results converted according to Equations 1 and 2 below. That is, the process of converting the spatial sound quality value according to the human hearing frequency band using the musical scale (Octave, Octave) or the critical bandwidth (Critical Bandwidth). Let f c be the arbitrary center frequency of the 1/3 octave or critical band, and f L and f U for the lower and upper frequencies, respectively. The effective amplitude of the head transfer function within an arbitrary bandwidth is converted as follows.

수학식 3와 4를 이용하여 가청 주파수 범위인 (16 Hz ∼ 25 kHz)에 대한 1/3-옥타브 혹은 임계 밴드별 중심 주파수에 대한 좌/우측 머리전달함수의 진폭을 각각 계산할 수 있다. 그리고, 방위각과 고도에 따라 측정된 모든 머리전달함수들을 위에서 제시한 계산 방법에 따라 환산함으로써 새로운 인지량적 머리전달함수의 진폭에 대한 데이터베이스 즉 { LL(fc; r,θ, φ), LR(fc; r,θ, φ); 0°≤θ≤ 360°, -60°≤φ≤ 90°}를 구축할 수 있다. 좌/우측의 인지량적 머리전달함수 LL(fc; r,θ,φ)과 LR(fc; r,θ,φ)를 이용하면 음원이 위치한 공간에 대한 주파수대역별 양귀 인지량적 음압레벨 차이 (Perception- Based ILD, PB-ILD)를 쉽게 구할 수 있다.Equations 3 and 4 can be used to calculate the amplitudes of the left and right head transfer functions for 1 / 3-octave for the audible frequency range (16 Hz to 25 kHz) or for the center frequency of each critical band. And, by converting all the head transfer functions measured according to the azimuth and altitude according to the calculation method presented above, a database for the amplitude of the new cognitive head transfer function, that is, {L L (f c ; r, θ, φ), L R (f c ; r, θ, φ); 0 ° ≦ θ ≦ 360 ° and −60 ° ≦ φ ≦ 90 °}. Using the left / right cognitive head transfer functions L L (f c ; r, θ, φ) and L R (f c ; r, θ, φ), the bilateral perceptual quantitative sound pressure level for the space where the sound source is located Differences (Perception-Based ILD, PB-ILD) are readily available.

수학식 5 및 6에 의해 연산된 좌우 dB값으로 양귀의 인지량적 음압레벨 차이를 구할 수 있다.Differences in the perceived sound pressure level of both ears can be obtained from the left and right dB values calculated by Equations 5 and 6.

제5도는 지금까지 소개한 연산 과정에 따라 구한 인지량적 머리전달함수의 진폭 특성을 보여 주고 있다. 제5도에 보인 바와 같이 이러한 양귀의 인지량적 음압레벨 {dBL(fc; r, θ,φ), dBR(fc; r, θ,φ) }을 이용하여 청음자에 대한 상대적 음원의 공간 위치 (r,θ, φ)에 음상을 정위하게 된다. 지금까지 소개한 두 번째 연산 단계는 청음자의 기준점에 대한 상대적 측정 음압의 크기를 이용함을 알 수 있다. 반복된 실험적 검증을 거쳐 얻어진 결과로 다음과 같은 장점을 제공한다.5 shows the amplitude characteristics of the cognitive head transfer function obtained according to the computation process introduced up to now. As shown in Fig. 5, the sound source relative to the listener using the cognitive sound pressure level {dB L (f c ; r, θ, φ), dB R (f c ; r, θ, φ) of both ears is shown. The sound image is positioned at the spatial positions (r, θ, and φ). The second computational step introduced so far uses the magnitude of the measured sound pressure relative to the listener's reference point. The results obtained through repeated experimental verification provide the following advantages.

(1) 머리전달함수 측정에 참여한 피시험자의 체격 인자 (양 귀, 머리, 어깨 및 상체의 크기 및 형상)에 대한 영향도 최소화: 기준점에 대한 피 시험자별 변량 (Intervariability)이 최소화되는 기준점을 선정함으로써 청음자 자신의 체격에 맞는 상대적 감응량에 따라 인식도 부여.(1) Minimize the influence on the physique factors (size and shape of the ears, head, shoulders and torso) of the subjects who participated in the measurement of the head transfer function: select a reference point that minimizes the subject's intervariability to the reference point This gives recognition to the listener's relative response to his or her physique.

(2) 단순 물리량적 측정 머리전달함수에 수반된 수많은 최소/최대 피크치에의한 음색 왜곡 및 음질 저하를 최소화할 수 있는 방안 제공.(2) Simple physical and quantitative measurement Provides a method for minimizing sound distortion and sound quality deterioration due to a large number of minimum and maximum peaks accompanying the head transfer function.

(3) dB 단위로 연산된 양귀의 인지량적 음압레벨 {dBL(fc; r, θ,φ), dBR(fc; r,θ,φ) }을 이용하여 기존의 이퀄라이저에 대한 대역별 레벨치을 직접 설정함으로써 공간 음상 정위의 새로운 구현 기법을 제공함.(3) Bands for conventional equalizers using cognitive sound pressure levels {dB L (f c ; r, θ, φ), dB R (f c ; r, θ, φ)} calculated in dB By directly setting the star levels, we provide a new implementation of spatial sound positioning.

지금까지 소개된 내용은 양귀의 인지량적 음압레벨 차이 환산 기법, 연산 단계별로 본 기법이 제공하는 장점, 그리고 기존의 음향 장비로 구현할 수 있는 방법을 소개하였다.The contents introduced so far introduced the quantitative sound pressure level difference conversion method of both ears, the advantages provided by this method for each calculation step, and the method that can be realized by the existing sound equipment.

지금까지는 양귀의 인지량적 음압레벨 차이(PB-ILD)에 대한 소개를 하였다. 또 하나의 공간 음향 인지량은 양귀에 도달 음압의 시간차이(ITL)에 대한 연산 기법을 소개한다. 수학식 1과 2에 따라 연산된 상대적 머리전달함수의 위상 성분에는 기준점에 대한 좌우측의 측정 음압 도달시간에 비례하는 선형 위상(Linear Phase)성분이 존재한다. 이러한 선형적 위상 성분을 이용하면 기준점에 대한 상대적 음압 도달시간을 매우 정밀하게 추정할 수 있다. 좌/우측의 상대적 머리전달함수의 위상을 ΘL(f; r, θ,φ), ΘR(f; r, θ,φ)하고 각각의 상대적 음압 도달 시간을 τL, τR이라 하면, 다음 식 7과 8에 주어진 최소 자승법의 추정 연산으로부터 정확히 환산된다.So far, we have introduced the difference in cognitive sound pressure level (PB-ILD) of both ears. Another spatial acoustic perception volume introduces a computational technique for the time difference (ITL) of sound pressure reaching the ears. The phase component of the relative head transfer function calculated according to Equations 1 and 2 has a linear phase component proportional to the time of arrival of the measured sound pressure on the left and right with respect to the reference point. Using this linear phase component, the relative sound pressure arrival time with respect to the reference point can be estimated very precisely. If the phases of the left / right relative head transfer functions are Θ L (f; r, θ, φ) and Θ R (f; r, θ, φ), and the relative sound pressure arrival times are τ L and τ R , respectively. It is exactly converted from the estimation operation of the least squares method given in the following equations (7) and (8).

위의 수학식 7과 8에서 f1과 f2는 상대적 머리전달함수의 선형 위상 특성이 잘 만족하는 하단 주파수와 상단 주파수를 각각 나타내며, ΘL(f; r, θ,φ) - ΘR(f1; r, θ,φ)는 하단 주파수 f1에 대한 주파수 f에서의 상대적 위상이다. 상하단의 주파수 선정은 측정 머리전달함수의 실험 장치 정확도 (음원 스피커와 음압 마이크로폰의 정확도, 신호 기록 및 분석 장비의 정확도)에 따라 많은 차이를 보인다. 그러나, 표준연에서 사용된 모든 음압 측정 및 분석 장비들은 매우 높은 정밀도와 정확도를 갖기 때문에, 상/하단 주파수는 f1= 200 Hz 그리고 상단 주파수 f2= 1.25 kHz의 대역에서 상대적 선형 위상을 측정할 수 있었다.In Equations 7 and 8, f 1 and f 2 represent lower and upper frequencies, respectively, where the linear phase characteristics of the relative head transfer function are well satisfied, and Θ L (f; r, θ, φ)-Θ R ( f 1 ; r, θ, φ) is the relative phase at frequency f with respect to the lower frequency f 1 . The frequency selection at the top and bottom varies greatly depending on the experimental device accuracy of the measurement head transfer function (the accuracy of the sound source speaker and sound pressure microphone, the accuracy of the signal recording and analysis equipment). However, all sound pressure measurement and analysis instruments used in standard stations have very high precision and accuracy, so that the upper and lower frequencies can measure relative linear phases in the band f 1 = 200 Hz and the upper frequency f 2 = 1.25 kHz. there was.

제6도는 방위각과 고도가 0°인 기준점을 선정하였을 때, 수평면에 위치한 음원의 방위각의 변화에 대한 좌우측 귀에 도달된 음압 도달 상대적 시간차를 각각 보이고 있다. 제4도에 보인바와 같이 모든 측정 머리함수에 대하여 수학식 1과 2의 연산 결과로 얻어진 상대 위상 정보와 수학식 7과 8에 제시된 연산과정으로부터 모든 측정 머리전달함수에 대한 좌우측 귀의 음압 도달시간 {τL(r, θ,φ), τR(r, θ,φ) }에 대한 데이터 베이스를 구축할 수 있다. 좌우측 귀에 대한 음압 도달 시간을 이용하여 양귀 사이의 도달 시간차이(ITD)는 다음과 같이 구할 수 있다.6 shows the relative time difference of sound pressure reached to the left and right ears with respect to the change in the azimuth angle of the sound source located on the horizontal plane when the azimuth angle and the reference point having an altitude of 0 ° are selected. As shown in FIG. 4, the relative phase information obtained from the calculation results of Equations 1 and 2 for all measurement head functions and the sound pressure arrival time of the left and right ears for all measurement head transfer functions from the calculation process shown in Equations 7 and 8 { We can build a database for τ L (r, θ, φ), τ R (r, θ, φ)}. Using the sound pressure arrival time for the left and right ears, the time difference of arrival (ITD) between both ears can be obtained as follows.

위 수학식 9는 좌측 귀에 대한 우측귀의 음압 도달 시간차이을 나타낸다. 물론 부호를 변경하면 우측 귀에 대한 좌측 귀의 도달 시간 또한 구할 수 있다. 이러한 양귀 음압 도달 시간의 차이는 사용자가 편의에 따라 좌측 혹은 우측 귀를 기준으로 선정할 수 있다. 이렇게 추정된 양귀 시간차이 TR,L(r,θ,φ)를 이용하여 공간에 원하는 음상을 정위하기 위하여 사용자 선정이 가능한 시간 지연장치를 사용하여 원하는 채널에 시간지연을 적용함으로써 쉽게 수행할 수 있다. 그러나, 시간 지연장치가 진폭의 변화를 야기하는 기존의 장치들의 사용은 음상 정위의 명료도를 저하한다는 점을 확인하였다. 진폭 변화를 전혀 수반하자 않는 디지털 시간 지연 장치의 사용하는 것이 가장 정확한 구현 기법임을 강조한다.Equation 9 represents the difference in time of arrival of the sound pressure of the right ear with respect to the left ear. Of course, changing the sign can also determine the arrival time of the left ear to the right ear. The difference between the arrival time of the negative sound pressure may be selected by the user based on the left or right ear for convenience. Using the estimated double-ear time difference T R, L (r, θ, φ), it can be easily performed by applying the time delay to the desired channel using a user selectable time delay device to locate the desired sound in the space. have. However, it has been found that the use of existing devices, in which the time delay device causes a change in amplitude, reduces the intelligibility of the sound localization. It is emphasized that the most accurate implementation technique is the use of a digital time delay device that does not involve amplitude changes at all.

지금까지 상대적 머리전달함수를 이용하여 인지량적 양귀 음압 도달시간 차이 TR,L(r,θ,φ)와 음압 레벨차이 {dBL(fc; r, θ,φ), dBR(fc; r, θ,φ) }를 환산하는 방법을 각각 소개하였다. 이러한 결과로부터 청음자와 음원의 상대적 위치 (r, θ,φ)에 음상을 정위하는 문제는 최소한 양귀 음압 레벨차이 {dBL(fc; r, θ,φ), dBR(fc; r, θ,φ) }와 도달시간 차이 TL,R(r,θ,φ)를 동시에 설정을 필요로 함을 알 수 있다. 그리고, 공간 음상 정위에 최소한의 필수 인자인 양귀 음압 레벨차이와 도달시간차이를 실현하는 방법은 기존의 대역별 레벨 설정이 가능한 이퀄라이저와 디지털 시간 지연기를 사용함으로써 실현할 수 있다는 점을 본 발명에서 제안하고 있다.Difference in cognitive volume ear pressure reaching time using relative head transfer function T R, L (r, θ, φ) and sound pressure level difference {dB L (f c ; r, θ, φ), dB R (f c r, θ, φ)} were introduced. From these results, the problem of locating the sound image at the relative position (r, θ, φ) between the listener and the sound source is at least the difference between the sound pressure level of both ears {dB L (f c ; r, θ, φ), dB R (f c ; r , θ, φ)} and the arrival time difference T L, R (r, θ, φ) are required to be set at the same time. In addition, the present invention proposes that the method of realizing both the sound pressure level difference and the arrival time difference, which are the minimum necessary factors for spatial sound position, can be realized by using an existing equalizer and a digital time delay that can set the level for each band. have.

다음은 앞서 소개한 공간 음상 정위를 위한 특성치 즉 인지량적 양 귀 음압레벨 차이 {dBL(fc; r, θ,φ), dBR(fc; r, θ,φ)}와 도달시간 T(r,θ,φ)에 대한 데이터베이스를 이용하여 원하는 삼차원 공간의 음향 신호 녹음 방법을 기술한다. 본 발명의 녹음 기술의 독창성과 비교 우위성을 명확히 하기 위하여 기존의 머리전달함수를 이용한 삼차원 음향 녹음 기술을 간략히 비교 분석한다. 기존의 삼차원 음향 정위 기술은 양귀의 단순 음압의 측정치인 머리전달함수를 직접 이용하는 방법으로, 측정 머리전달함수인 주파수 영역의 전달함수를 역 푸리에 변환 (Inverse Fourier Transform)하여 얻어진 시간영역의 단위 충격응답(Head-Related Impluse Response, HRIR)을 직접 이용하는 방법이다. 추정된 시간영역의 HRIR을 디지털 필터의 응답함수로 설정한 뒤 입력 음향 시간신호에 대한 디지털 필터링 연산(FIR Filtering)을 수행함으로써 원음에 공간 정보를 코딩하게 된다. 이러한 HRIR을 직접 이용한 디지털 필터링(FIR Filtering)기법의 자세한 연구는 William G. Gardner (1997년 MIT 박사학위 논문)에 자세히 소개되고 있으며, 국내외 대다수의 삼차원 음향 정위 기술은 이러한 디지털 필터링(FIR Filtering) 기법에 속한다. 이러한 기존 기술은 최소한 FIR 필터를 실시간으로 구현할 수 있는 고속 디지털 연산 장치(Digital Signal Processor, DSP)가 필요하며, DSP를 구동하기 위한 연산 소프트웨어 또한 필요하게 된다. 이러한 구현 기법이 음향기기 시장에 현실적 뿌리를 내리지 못하고 있는 원인은 크게 두 가지 원인 때문이다.Next, the characteristic values for the spatial sound image location introduced above, that is, the cognitive quantum two-sound pressure level difference {dB L (f c ; r, θ, φ), dB R (f c ; r, θ, φ)} and the arrival time T A method for recording acoustic signals in a desired three-dimensional space is described using a database for (r, θ, φ). In order to clarify the originality and comparative advantage of the recording technology of the present invention, a brief comparison and analysis of the conventional three-dimensional sound recording technology using the head transfer function. Conventional three-dimensional acoustic positioning technique directly uses the head transfer function, which is a measure of the simple sound pressure of both ears, and the unit shock response of the time domain obtained by inverse Fourier transform of the transfer function of the frequency domain, which is the measured head transfer function. (Head-Related Impluse Response, HRIR). The spatial information is coded in the original sound by setting the HRIR of the estimated time domain as the response function of the digital filter and performing digital filtering on the input acoustic time signal. The detailed study of the direct FIR filtering technique using HRIR is introduced in detail in William G. Gardner (1997 Ph.D. dissertation), and the majority of domestic and foreign three-dimensional acoustic positioning techniques are the FIR filtering techniques. Belongs to. This existing technology requires at least a high-speed digital signal processor (DSP) capable of real-time implementation of FIR filters, as well as computational software to drive the DSP. There are two main reasons why these implementations are not taking root in the sound market.

첫째, 필터계수로 이용되는 시간영역의 단순 측정치인 HRIR값에 공간 음상정위에 전혀 불필요한 실험 인자들 (스피커의 음향학적 특성, 측정 마이크로폰의 전기/음향학적 특성, 피 시험자의 양귀 머리 상체의 크기 및 형상 변화, 측정 공간 음향 특성 등)이 내재되어 있어 불필요한 음색 왜곡과 음질 저하를 공간 음상 정위 시 피할 수 없다는 점이다. 수많은 전문 음향 기사 및 연구 종사자들이 기존의 공간 음상정위 기술 분야에 대해 지적하고 있는 첫 번째 문제점이 바로 음색 왜곡과 음질 저하이며, 기존 기술이 현실에 뿌리를 내리지 못하는 주된 요인이 되고 있다. 이러한 점은 사실 본 발명을 개발하게된 동기를 제공하였다.First, experimental factors that are absolutely unnecessary for spatial acoustic positioning on HRIR values, which are simple measurements of the time domain, used as filter coefficients (acoustic characteristics of speakers, electrical / acoustic characteristics of measuring microphones, size of both heads of both subjects, and Shape changes, measurement spatial acoustics, etc.) are inherent, so that unnecessary tonal distortion and deterioration of sound quality cannot be avoided during spatial image positioning. The first problem that many professional sound technicians and researchers have pointed out in the field of spatial stereotactic technology is tonal distortion and sound quality degradation, and it is the main factor that the existing technology cannot take root in reality. This actually provided the motivation for developing the present invention.

둘째, 디지털 필터링의 연산에 필요한 DSP 관련 하드웨어와 전문 소프트웨어로 구축한 음상재현 시스템은 성능과 고품위성은 최근 음향기기 기술과의 적지 않은 거리감은 아직도 음향 설계분야(음반, 방송, 영화, 멀티미디어 등)에서 매우 낮은 신뢰성을 얻고 있다는 점이다. 영국의 음상정위 관련 DSP 하드웨어와 소프트웨어 전문 기술진(영국 ISVR과 ARL 등)들도 기존의 단순 물리량적 측정 머리전달함수의 직접 사용에 의한 음색왜곡과 음질저하에 대한 한계가 있다는 점을 인정하고 있으며, 효율적 공간 음상 정위를 위한 새로운 필터계수의 추정에 대한 필요성을 느끼고 있다.Second, the sound reproducing system built with DSP-related hardware and professional software required for the operation of digital filtering has a high level of performance and high quality in the sound design field (record, broadcasting, film, multimedia, etc.). It is getting very low reliability. DSP hardware and software experts in the UK, such as UK stereotypes, have recognized that there are limitations on tone distortion and sound quality due to the direct use of existing simple quantitative measurement head transfer functions. There is a need to estimate new filter coefficients for efficient spatial sound localization.

기존의 측정 머리전달함수와 디지털 필터링 기술을 이용한 방법과는 달리 본 발명에서는 청각기관의 공간인식에 대한 고전적 Lord Rayleigh의 개념인 양 귀의 음압레벨 차이와 도달시간을 이용하여 삼차원 음상 정위를 구현하는 기술이다. 음상정위의 두 가지 특성치인 양귀 음압레벨과 도달시간 차이를 최근의 실험적으로 구축된 머리전달함수를 이용한 추정 방법과 이를 이용한 공간적 두 특성치의 데이터베이스 {dBL(fc; r,θ,φ), dBR(fc; r,θ,φ), TL,R(r,θ,φ)}를 구축한다는 점이다. 이러한 특성치들의 공간에 대한 데이터베이스는 사용자가 음원과 청취자의 상대적 삼차원 좌표값 (r, θ,φ)으로부터 양귀의 인지량적 음압레벨 차이 {dBL(fc; r, θ,φ), dBR(fc; r, θ,φ)}와 도달시간 차이 TL,R(r,θ,φ)를 호출하여 사용하게 된다. 삼차원 좌표값 (r, θ,φ)으로부터 호출된 양 귀의 인지량적 음압레벨 차이는 이퀄라이저의 대역별 레벨값의 설정에 각각 이용되며, 양귀의 도달 시간차이는 좌측 혹은 우측의 입력 신호에 대한 시간지연 장치의 설정치로 입력된다. 이러한 구현 방법은 앞서 설명한 DSP를 이용한 디지털 필터링 기법을 이용한 기존 삼차원 음향 설계 기술보다는 매우 간단할 뿐 아니라 현장 음향 전문 기술자나 연구자들이 사용하고 있는 음향장치(이퀄라이저와 시간 지연기)로 구현이 가능하다.Unlike the conventional method using the measurement head transfer function and the digital filtering technique, the present invention implements three-dimensional image positioning using sound pressure level difference and arrival time of both ears, which is the concept of classical Lord Rayleigh for the spatial recognition of auditory organs. to be. Estimation method using head transfer function constructed recently using experimentally constructed head transfer function, which is the difference between two characteristic values of sound phase, the ear pressure level and arrival time, and the database of spatial two characteristic values {dB L (f c ; r, θ, φ), dB R (f c ; r, θ, φ) and T L, R (r, θ, φ)}. The database of the space of these characteristic values shows that the user can perceive the difference between the cognitive sound pressure levels of both ears from the relative three-dimensional coordinate values (r, θ, φ) of the sound source and the listener {dB L (f c ; r, θ, φ), dB R ( f c ; r, θ, φ)} and the difference in arrival time T L, R (r, θ, φ). Differences in the perceived sound pressure level of both ears, called from three-dimensional coordinate values (r, θ, φ), are used to set the level values for each band of the equalizer, respectively. The time difference of arrival of both ears is the time delay for the left or right input signal. It is entered as the set point of the device. This implementation method is much simpler than the conventional three-dimensional sound design technique using the digital filtering technique using the DSP, and can be implemented by the acoustic devices (equalizer and time delay) used by the field acoustic technicians or researchers.

제7도는 이퀄라이저와 시간 지연기를 이용한 공간 음향 기록 구성도를 보이고 있다. 우선 청취자와 음원의 상대적 공간 정보 (r, θ,φ)가 주어지면, 좌우 양 귀의 인지량적 음압레벨 데이터베이스로부터 좌/우측 음향 채널의 대역별 이퀄라이저의 설정값 {dBL(fc; r,θ,φ), dBR(fc; r,θ,φ)}이 결정되며, 이들을 이용하여 좌우 채널의 이퀄라이저 이득율을 조정한다. 이렇게 설정된 좌우 이퀄라이저를 이용하여 입력된 원음 S(t)에 대하여 공간 음상 정위에 필요한 양귀 음압레벨 차이를 코딩한 이퀄라이저의 출력신호 EQL(t)와 EQR(t)를 각각 얻게된다. 그리고, 설정 공간정보 (r, θ,φ)에 따라 양귀 음압 도달 시간차이의 설정값 {TL,R(r,θ,φ)} 또한 결정되며, 이때 좌측과 우측 중 음압 도달 시간이 늦은 채널에 상대적 지연시간을 설정한다. 만약 우측 채널의 음압 도달시간이 늦을 경우 즉, 음원이 청취자의 좌측에 위치한 경우, 이퀄라이저의 출력신호 EQL(t)와 EQR(t)가 입력되면 시간 지연기는 EQL(t)와 EQR(t-TL,R) 신호를 출력한다 (제7도에 보인 예 참고). 이와 같이 좌우측 이퀄라이저와 시간 지연기로 구성된 장치를 공간 음상 정보에 따라 동시에 설정하여 삼차원 공간 음상 정위를 구현한다. 현재 상용화된 외장형 디지털 이퀄라이저와 디지털 딜레이의 구동은 컴퓨터 상에서 미디 컨트롤 혹은 시리얼 케이블을 통한 컨트롤이 가능하며 이들은 20 Bit 양자화와 48/96kHz 샘플링(sampling rate)성능을 동시에 제공하기 때문에 기존 CD 음질 이상의 고 음질 입체음향의 녹음을 실시간으로 구현할 수 있다.7 shows a spatial sound recording configuration using an equalizer and a time delay. First, given the relative spatial information (r, θ, φ) of the listener and the sound source, the set value of the band-based equalizer of the left and right sound channels from the cognitive sound pressure level database of both left and right ears {dB L (f c ; r, θ) , φ), dB R (f c ; r, θ, φ)} are used to adjust the equalizer gain ratio of the left and right channels. Using the left and right equalizers set as above, the output signals EQ L (t) and EQ R (t) of the equalizer obtained by coding the difference between the two sound pressure levels required for spatial sound positioning for the original sound S (t) are obtained. In addition, the set value {T L, R (r, θ, φ)} of the positive ear negative pressure arrival time difference is also determined according to the set spatial information (r, θ, φ). Set the relative delay time to. If the right channel sound pressure reaching time late that is, the sound source in this case on the left side of the listener, when the output signal EQ L (t) and EQ R (t) of the equalizer input time retarder EQ L (t) and EQ R Output the (tT L, R ) signal (see the example in Figure 7). In this way, a device composed of left and right equalizers and a time delay is simultaneously set according to spatial sound information to realize three-dimensional spatial sound localization. The drive of commercially available external digital equalizers and digital delays can be controlled via a MIDI control or serial cable on a computer. They provide 20 bit quantization and 48/96 kHz sampling rate simultaneously, so that the sound quality is higher than conventional CD sound quality. Stereo sound recording can be realized in real time.

지금까지의 구현 기술은 하드웨어로 구성된 음향장비를 이용한 삼차원 음향 녹음의 실시간 기법을 설명하였다. 이러한 하드웨어 장치를 이용한 구현 기법을 디지털신호 처리 소프트웨어로 또한 구현할 수 있다. 즉, 기존의 상용화되어 있는 신호처리 소프트웨어로 작성된 디지털 이퀄라이저 모사 장치와 디지털 시간 지연기의 모사 장치를 사용하여 앞서 제시된 하드웨어 장치의 설정방법과 동일하게 삼차원 공간 음상 정위를 또한 구현할 수 있다. 따라서, 신호처리용 소프트웨어를 이용하여 본 발명에서 제시한 양귀 인지량적 음압레벨 차이에 따라 대역별 이퀄라이저의 기능 수행과 좌우 채널간의 시간 지연을 수행하여 삼차원 공간에 음상을 정위하는 기법들은 본 발명의 내용에 포함된다.The implementation techniques thus far have described the real-time technique of three-dimensional sound recording using sound equipment composed of hardware. Implementation techniques using such hardware devices can also be implemented in digital signal processing software. That is, using the digital equalizer simulation device and the digital time delay simulation device made by the existing commercially available signal processing software, the three-dimensional spatial sound orientation can also be implemented in the same way as the hardware device setting method described above. Therefore, techniques for aligning sound images in three-dimensional space by performing the function of the equalizer for each band and the time delay between the left and right channels according to the difference between the two ears' perceptual sound pressure levels presented in the present invention using signal processing software are described in the present invention. Included in

다음은 위에서 개시된 기술을 이용한 본 발명의 삼차원 녹음 장치에 대하여 설명한다. 제8도는 기존의 믹싱 콘솔의 개요도이고 제 9, 10, 11, 12도는 본 발명의 3차원 녹음 방법 및 장치의 제1실시예 내지 제4실시예의 개요도이다.Next, a three-dimensional recording apparatus of the present invention using the technique disclosed above will be described. 8 is a schematic diagram of a conventional mixing console, and 9, 10, 11, and 12 are schematic diagrams of the first to fourth embodiments of the three-dimensional recording method and apparatus of the present invention.

본 발명의 3차원 녹음 장치는 마이크로폰, 신디사이저 또는 샘플러에서의 출력신호를 받아들이는 입력단, 상기 입력단에서 출력되는 신호의 크기를 최적으로 조절하는 입력신호 조절단, 양 귀의 인지량적 음압레벨의 차이와 양 귀 음압 도달시간의 차이를 이용한 신호처리단, 음량 조절단으로 구성되며, 음색 편집단 또는 효과기기 추가단이 추가될 수 있다.The three-dimensional recording apparatus of the present invention is an input terminal for receiving an output signal from a microphone, a synthesizer or a sampler, an input signal adjusting stage for optimally adjusting the magnitude of the signal output from the input terminal, and the difference and the amount of the cognitive sound pressure level of both ears. It consists of a signal processing stage and a volume control stage using the difference in ear sound pressure arrival time, a tone editing stage or an effect device addition stage may be added.

현재의 녹음은 입력단, 출력 단을 제외한 거의 모든 부분들이 디지털화 되어 있으며 컴퓨터를 이용하여 자동화 되어있다. 본 발명의 특징은 디지털화된 기존의 녹음장비를 교체할 필요 없이 기존의 일차원 선상에서의 녹음을 3차원 입체 공간으로 확장 녹음할 수 있다.The current recording is almost entirely digital except for the input and output stages and is automated using a computer. A feature of the present invention is that the recording on the existing one-dimensional line can be expanded to three-dimensional three-dimensional space without having to replace the existing digitized recording equipment.

입력단은 마이크로폰, 신디사이저, 샘플러 등에서의 출력신호를 받아들이며, 모든 신호는 모노이며 이펙트가 빠진 드라이 신호여야 한다. 현재의 대부분의 녹음은 녹음 부스에서 행해지기 때문에 마이크를 이용한 녹음은 드라이 신호이며 라인을 이용한 입력 시에는 기계 자체에서 드라이 신호를 만들면 된다.The input accepts output signals from microphones, synthesizers, samplers, and so on, all of which must be mono and have no effect dry. Most of the current recording is done in a recording booth, so recording with a microphone is a dry signal, and for input using a line, you can create a dry signal on the machine itself.

입력신호 조절단은 과부하 혹은 포화 입력을 방지하기 위해 입력 신호의 크기를 최적으로 조절한다.The input signal control stage optimally adjusts the size of the input signal to prevent overload or saturation input.

음색 편집단은 입력 신호의 음색을 임의로 변경하고자 할 때 사용되며, 원 신호를 그대로 사용하고자 할 시에는 제9도에서처럼 바이패스 시키면 된다.The tone editor is used to arbitrarily change the tone of the input signal. If the tone is to be used as it is, the tone editor can be bypassed as shown in FIG.

양귀의 인지량적 음압레벨 차이와 양귀 음압 도달시간 차이를 이용한 신호처리 단은 청취자와 음원의 상대적 공간 인자를 입력함으로써 원하는 삼차원 공간상에 음상 정위를 수행하는 음향처리작업 수행되는 단이다.The signal processing stage using the cognitive-level sound pressure level difference between the two ears and the difference between the sound pressure arrival time of both ears is a sound processing operation that performs sound image positioning on the desired three-dimensional space by inputting the relative spatial factors of the listener and the sound source.

효과기기 추가 단은 기존의 디지털 전용 특수 효과기를 사용하여 기계적인 특수효과를 추가할 수 있도록 하였으며, 자연스러운 공간 음을 재생하고자 할 시에는 효과 기기를 바이패스(제9도, 제10도)시키면 된다.The effect unit add stage adds a mechanical special effect by using a conventional digital special effector, and if you want to reproduce natural spatial sound, you can bypass the effect device (figure 9, 10). .

음량 조절단은 미세한 음량조절이 가능하도록 하였으며 멀티 채널 녹음 시 유용하게 사용될 수 있다.The volume control stage enables fine volume control and can be useful for multi-channel recording.

본 발명의 삼차원 공간 음향 믹싱 콘솔 기술은 국내외에서 아직까지 제품화되지 않은 새로운 기술이다. 이러한 기술은 기존의 음향 믹싱 콘솔을 직접 이용하여 삼차원의 공간 음향을 전문 음향기사들이 직접 제작할 수 있을 뿐 아니라, 이들 장비들이 수행하는 신호처리과정을 현재 상품화된 전문 음향 기사용 소프트웨어로도 수행이 가능하다. 특히, 본 발명은 하나의 음원에 대한 공간 정보(거리, 방위각, 그리고 고도) 뿐 아니라 다수의 음원들 또한 공간에 정위시킬 수 있다. 그리고, 청음자의 위치 기준 좌표계에 대하여 복합 음원들의 상대적 위치 좌표계로 음상을 정위하는 기법을 사용하기 때문에, 청음자의 공간 이동에 의한 복합 음원의 공간적 청음 특성 재현뿐 아니라 다수 음원들의 개별적 공간 이동에 대한 청음자의 공간 청음 특성 또한 실현할 수 있다. 이러한 공간 음상 정위 기술은 기존의 스테레오 녹음용 장비(그래픽 이퀄라이저, 시간 지연기)들과 개인용 컴퓨터의 단순 조합으로 삼차원의 고 품질 음향 녹음을 구현할 수 있는 장점을 제공한다. 따라서, 본 발명에서 제안하는 기술들은 기존의 녹음 기기를 사용하는 분야(음반, TV 및 라디오 방송, 오락)에 직접 적용될 수 있는 새로운 삼차원 음향 기록 기술로 전문 녹음 기사들의 창의성 향상과 더불어 아직 들어보지 못한 고품위 음의 창조에도 크게 기여할 수 있다.The three-dimensional spatial sound mixing console technology of the present invention is a new technology that has not yet been commercialized at home and abroad. This technology can not only produce three-dimensional spatial sound directly by using existing sound mixing consoles, but also perform the signal processing performed by these equipments with commercially available professional sound technician software. Do. In particular, the present invention can locate not only spatial information (distance, azimuth, and altitude) for one sound source but also a plurality of sound sources in space. In addition, since the method of orienting the sound image in the relative position coordinate system of the composite sound sources with respect to the position reference coordinate system of the listener, not only reproduces the spatial sound characteristics of the composite sound source due to the spatial movement of the listener, but also listens to the individual spatial movement of multiple sound sources. The spatial hearing characteristics of the ruler can also be realized. This spatial sound localization technology provides the advantage of three-dimensional high-quality sound recording with a simple combination of conventional stereo recording equipment (graphic equalizer, time delay) and personal computer. Therefore, the techniques proposed in the present invention are a new three-dimensional sound recording technology that can be directly applied to the field (records, TV and radio broadcasting, entertainment) using the existing recording equipment, and the creativity of professional recording technicians have not heard yet It can also contribute greatly to the creation of high quality sound.

Claims (6)

기준점의 좌우측 머리전달함수에 대하여 임의 공간에서 측정된 좌우측 머리전달함수 HL및 HR의 상대적 양 IL및 IR을 다음 식 1 및 식 2에 따라 환산하고;With respect to the left and right head related transfer function in terms of a reference point along the relative amount I L and I R of the left and right head related transfer function H L and H R measured in any area in the following formula 1 and formula 2; 식 1: Equation 1: 식 2: Equation 2: 임의 밴드폭 내의 머리전달함수의 유효 진폭 LL(fc) 및 LR(fc)를 다음 식 3 및 식 4에 따라 환산하고;The effective amplitudes L L (f c ) and L R (f c ) of the head transfer function within an arbitrary bandwidth are converted according to the following equations 3 and 4; 식 3: Equation 3: 식 4: Equation 4: 주파수 대역별 양 귀 인지량적 음압레벨 차이 dBL및 dBR을 다음 식 5 및 식 6에 의해 구하고; 그리고,The difference between the two ear perceptual quantitative sound pressure levels for each frequency band dB L and dB R is obtained by the following equations 5 and 6; And, 식 5: Equation 5: 식 6: Equation 6: 양 귀의 음압 도달 시간 τL과 τR의 상대적 차이τR,L을 다음 식 7, 식 8 및 식 9에 의해 구하는 단계;Obtaining the relative difference τ R, L between the negative pressure arrival times τ L and τ R of both ears by the following Equations 7, Equations 8 and 9; 식 7: Equation 7: 식 8: Equation 8: 식 9: Equation 9: 로 구성되는 것을 특징으로 하는 공간 음상 정위를 위한 특성치의 환산 방법.Method of converting the characteristic value for spatial sound image positioning, characterized in that consisting of. 양 귀의 음압레벨과 도달시간의 차이를 제1항의 공간 음상 정위를 위한 특성치의 환산 방법에 의해 계산하여 데이터베이스를 구축하고;Constructing a database by calculating the difference between the sound pressure level and the arrival time of both ears by the method of converting the characteristic values for the spatial sound positioning of claim 1; 음원과 청취자 사이의 상대적 삼차원 좌표값을 입력하고;Input relative three-dimensional coordinate values between the sound source and the listener; 상기 좌표값으로부터 양 귀의 음압레벨과 도달시간의 차이를 상기 데이터베이스로부터 호출하고;Calling from the database the difference between the sound pressure level and the arrival time of both ears from the coordinate value; 호출된 인지량적 음압레벨의 차이로부터 좌우측 음향 채널의 대역별 이퀼라이저의 설정값을 결정한 다음 좌우 채널의 이퀼라이저 이득율을 조절하고;Determining a set value of band-based equalizers of the left and right sound channels from the difference in the perceived cognitive sound pressure levels, and then adjusting the equalizer gain ratios of the left and right channels; 설정된 좌우 이퀼라이저를 이용하여 입력된 원음에 대하여 공간 음상 정위에 필요한 양 귀 음압레벨 차이를 코딩한 이퀼라이저 출력신호를 얻고; 그리고,An equalizer output signal obtained by coding the difference between the sound pressure levels of both ears required for spatial sound positioning with respect to the input original sound using the set left and right equalizers; And, 호출된 양 귀의 도달 시간차이의 설정값으로부터 좌우측 채널 중 음압 도달 시간이 늦은 채널에 상대적 지연시간을 설정하는 단계;Setting a relative delay time for a channel having a slow sound pressure arrival time among the left and right channels from a set value of a difference between arrival times of the called ears; 로 구성되는 것을 특징으로 하는 공간 음상 정위의 특성치를 이용한 삼차원음향 녹음 방법.Three-dimensional sound recording method using the characteristic value of spatial sound image positioning, characterized in that consisting of. 제2항에서, 상대적 지연시간의 설정은 디지털 시간 지연장치를 이용하여 수행하는 것을 특징으로 하는 공간 음상 정위의 특성치를 이용한 삼차원 음향 녹음 방법.3. The method of claim 2, wherein the relative delay time is set using a digital time delay device. 마이크로폰, 신디사이저 또는 샘플러에서의 출력신호를 받아들이는 입력단;An input for receiving an output signal from a microphone, synthesizer or sampler; 상기 입력단에서 출력되는 신호의 크기를 최적으로 조절하는 입력신호 조절단;An input signal adjusting stage configured to optimally adjust a magnitude of a signal output from the input terminal; 양 귀의 인지량적 음압레벨의 차이와 양 귀 음압 도달시간의 차이를 이용한 신호처리단; 및,A signal processing stage using a difference in cognitive sound pressure level of both ears and a difference in arrival time of both sound pressures; And, 음량 조절단;Volume control stage; 으로 구성되는 것을 특징으로 하는 3차원 음향 녹음 장치.Three-dimensional sound recording device, characterized in that consisting of. 제4항에서, 입력신호 조절단과 신호처리단 사이에 음색 편집단을 더 추가하는 것을 특징으로 하는 3차원 음향 녹음 장치.The 3D sound recording apparatus of claim 4, further comprising a tone editing stage between the input signal control stage and the signal processing stage. 제4항 또는 제5항에서, 상기 신호처리단과 상기 음량 조절단의 사이에 효과기기 추가단을 더 설치하는 것을 특징으로 하는 3차원 음향 녹음 장치.The 3D sound recording apparatus according to claim 4 or 5, further comprising an effect unit adding stage between the signal processing stage and the volume control stage.
KR1019990049096A 1999-11-06 1999-11-06 Evaluation method of characteristic parameters(PC-ILD, ITD) for 3-dimensional sound localization and method and apparatus for 3-dimensional sound recording KR100312965B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990049096A KR100312965B1 (en) 1999-11-06 1999-11-06 Evaluation method of characteristic parameters(PC-ILD, ITD) for 3-dimensional sound localization and method and apparatus for 3-dimensional sound recording

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990049096A KR100312965B1 (en) 1999-11-06 1999-11-06 Evaluation method of characteristic parameters(PC-ILD, ITD) for 3-dimensional sound localization and method and apparatus for 3-dimensional sound recording

Publications (2)

Publication Number Publication Date
KR20010045704A KR20010045704A (en) 2001-06-05
KR100312965B1 true KR100312965B1 (en) 2001-11-05

Family

ID=19618936

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990049096A KR100312965B1 (en) 1999-11-06 1999-11-06 Evaluation method of characteristic parameters(PC-ILD, ITD) for 3-dimensional sound localization and method and apparatus for 3-dimensional sound recording

Country Status (1)

Country Link
KR (1) KR100312965B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11910180B2 (en) 2018-08-20 2024-02-20 Huawei Technologies Co., Ltd. Audio processing method and apparatus

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020080730A (en) * 2001-04-17 2002-10-26 큐빅아이(주) Synthesis method for spatial sound using head modeling

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11910180B2 (en) 2018-08-20 2024-02-20 Huawei Technologies Co., Ltd. Audio processing method and apparatus

Also Published As

Publication number Publication date
KR20010045704A (en) 2001-06-05

Similar Documents

Publication Publication Date Title
JP5431249B2 (en) Method and apparatus for reproducing a natural or modified spatial impression in multi-channel listening, and a computer program executing the method
EP0912076B1 (en) Binaural synthesis, head-related transfer functions, and uses thereof
US8270616B2 (en) Virtual surround for headphones and earbuds headphone externalization system
Hacihabiboglu et al. Perceptual spatial audio recording, simulation, and rendering: An overview of spatial-audio techniques based on psychoacoustics
US9197977B2 (en) Audio spatialization and environment simulation
US20160234620A1 (en) Method and device for audio signal processing
CN113170271B (en) Method and apparatus for processing stereo signals
Yao Headphone-based immersive audio for virtual reality headsets
Akeroyd et al. The binaural performance of a cross-talk cancellation system with matched or mismatched setup and playback acoustics
Pulkki et al. Multichannel audio rendering using amplitude panning [dsp applications]
Jakka Binaural to multichannel audio upmix
JPH05168097A (en) Method for using out-head sound image localization headphone stereo receiver
KR100312965B1 (en) Evaluation method of characteristic parameters(PC-ILD, ITD) for 3-dimensional sound localization and method and apparatus for 3-dimensional sound recording
Jot et al. Binaural concert hall simulation in real time
Laitinen Binaural reproduction for directional audio coding
Mickiewicz et al. Spatialization of sound recordings using intensity impulse responses
Baumgarte et al. Design and evaluation of binaural cue coding schemes
Deppisch et al. Browser Application for Virtual Audio Walkthrough.
Merimaa et al. Perceptually-based processing of directional room responses for multichannel loudspeaker reproduction
Miyahara et al. Application of sound field reproduction system to acoustic welfare engineering-Real time sound field transmission system for parent and child room in a concert hall
KR20050060552A (en) Virtual sound system and virtual sound implementation method
Pompetzki Binaural recording and reproduction for documentation and evaluation
Lee et al. A 3-D sound orchestra in the cyber space
Laitinen Binauraalinen toisto Directional Audio Coding-tekniikassa
Jakka Binauraalisen audiosignaalin muokkaus monikanavaiselle äänentoistojärjestelmälle

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20051012

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee