WO2015002517A1 - Virtual sound image localization method for two dimensional and three dimensional spaces - Google Patents

Virtual sound image localization method for two dimensional and three dimensional spaces Download PDF

Info

Publication number
WO2015002517A1
WO2015002517A1 PCT/KR2014/006053 KR2014006053W WO2015002517A1 WO 2015002517 A1 WO2015002517 A1 WO 2015002517A1 KR 2014006053 W KR2014006053 W KR 2014006053W WO 2015002517 A1 WO2015002517 A1 WO 2015002517A1
Authority
WO
WIPO (PCT)
Prior art keywords
virtual sound
determining
loudspeakers
sound source
panning coefficient
Prior art date
Application number
PCT/KR2014/006053
Other languages
French (fr)
Korean (ko)
Inventor
유재현
이용주
서정일
강경옥
최근우
방희석
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020140083959A external-priority patent/KR102149046B1/en
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to US14/758,719 priority Critical patent/US20160112820A1/en
Priority to CN201480008005.7A priority patent/CN104982040B/en
Publication of WO2015002517A1 publication Critical patent/WO2015002517A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation

Abstract

Disclosed is a virtual sound image localization method for two dimensional and three dimensional spaces. The virtual sound image localization method may comprise the steps of: setting up a playback area consisting of at least one loudspeaker which is usable in an output channel; dividing the playback area into a plurality of sub-areas; identifying a sub-area, among the divided sub-areas, in which a desired virtual sound source to be played is located; determining a Fanning coefficient for playing the virtual sound source on the basis of the identified sub-area; and rendering an input signal on the basis of the Fanning coefficient.

Description

2차원 및 3차원 공간 상에서의 가상 음상 정위 방법 Virtual Phonetic Positioning Method in 2D and 3D Spaces
아래 실시예들은 출력 채널에 대응하는 복수의 라우드스피커들을 이용한 가상 음상 정위 방법에 관한 것이다.The following embodiments relate to a virtual sound image positioning method using a plurality of loudspeakers corresponding to an output channel.
패닝(panning) 방법은 재생하고자 하는 가상 음원의 위치를 고려하여 가상 음원의 주변에 위치한 라우드스피커에 파워를 할당하여 가상 음원을 재생하는 방법이다. 이와 같이, 라우드스피커에 파워를 할당하여 라우드스피커의 출력 크기를 결정함으로써 가상 공간 상에서 가상 음원의 위치를 결정하는 것을 가상 음상 정위 방법이라고 한다.The panning method is a method of reproducing a virtual sound source by allocating power to a loudspeaker located near the virtual sound source in consideration of the position of the virtual sound source to be reproduced. As described above, determining the position of the virtual sound source in the virtual space by allocating power to the loudspeaker to determine the output size of the loudspeaker is called a virtual sound image positioning method.
이 때, 2개의 라우드스피커를 이용하여 가상 음원을 재생하는 것을 파워 패닝이라고 정의하고, 3개의 라우드스피커를 이용하여 가상 음원을 재생하는 것을 백터 기반 진폭 패닝(vector based amplitude panning: VBAP)라고 정의한다. 이 기술들은 가상 음상 정위 방법으로 널리 활용되고 있다.At this time, the playback of the virtual sound source using two loudspeakers is defined as power panning, and the playback of the virtual sound source using three loudspeakers is defined as vector based amplitude panning (VBAP). . These techniques are widely used as a virtual sound image location method.
위에서 설명한 방법들은 2개 또는 3개의 라우드스피커 사이에 가상 음원의 위치를 매핑하기 위해 라우드스피커에 파워를 배분하는 연산을 이용한다. 이러한 연산에 따르면 정교한 각도 분할이 가능하지만, 이와 같이 분할된 각도에 위치한 가상 음원을 청취자가 구분하기 어려우며 연산량도 증가한다. 또한, 출력 채널에 대응하는 라우드스피커에 패닝되는 입력 채널이 증가하는 경우 음질 저하가 발생될 수 있다. 따라서, 각도 분할에 따른 문제점을 해결하기 위한 패닝 기법이 필요하다.The methods described above use an operation that distributes power to the loudspeakers to map the position of the virtual sound source between two or three loudspeakers. According to this operation, sophisticated angle division is possible, but it is difficult for the listener to distinguish the virtual sound source located at the divided angle and the amount of calculation increases. In addition, when the input channel panned to the loudspeaker corresponding to the output channel increases, a sound quality degradation may occur. Therefore, there is a need for a panning technique to solve the problem caused by the angle division.
한편, 일반적으로 재생 공간에 배치된 라우드스피커들은 청취자를 기준으로 왼쪽, 오른쪽, 또는 중간 등 좌우 대칭적인 배치 형태를 나타낸다. 하지만, 이러한 대칭적인 배칭 형태는 실제 생활에서는 이상적인 상황을 의미한다. 다시 말해서, 실제로 라우드스피커들은 전후/좌우의 배치 형태가 비대칭적인 경우가 많다. 따라서, 비대칭적으로 배치된 라우드스피커를 위한 패닝 기법도 필요하다.On the other hand, the loudspeakers generally arranged in the playback space have a symmetrical arrangement such as left, right, or middle with respect to the listener. However, this symmetrical batching represents an ideal situation in real life. In other words, in practice, loudspeakers are often asymmetrical in arrangement of front, rear, left and right. Accordingly, there is also a need for a panning technique for asymmetrically arranged loudspeakers.
이하의 실시예들은 2차원 및 3차원 공간 상에 존재하는 라우드스피커를 이용한 가상 음상 정위 방법 및 이러한 방법을 수행하는 라우드스피커 렌더러를 제공한다.The following embodiments provide a virtual sound image positioning method using loudspeakers existing in two-dimensional and three-dimensional space, and a loudspeaker renderer performing the method.
이하의 실시예들은 라우드스피커들이 구성하는 재생 영역을 세부 영역으로 분할하고, 재생하고자 하는 가상 음원이 위치한 세부 영역에 기초하여 패닝 계수를 결정함으로써 패닝 계수를 결정하기 위한 연산량을 줄일 수 있는 가상 음상 정위 방법 및 이러한 방법을 수행하는 라우드스피커 렌더러를 제공한다.The following exemplary embodiments divide virtual playback regions composed of loudspeakers into sub-regions, and determine a panning coefficient based on the sub-region in which the virtual sound source to be played is located to reduce the amount of computation for determining the panning coefficient. A method and a loudspeaker renderer performing this method are provided.
이하의 실시예들은 라우드스피커들이 2차원 공간 또는 3차원 공간 상에 위치했는지 여부를 고려하여 패닝 계수를 결정함으로써 가상 음원을 효과적으로 재생할 수 있는 가상 음상 정위 방법 및 이러한 방법을 수행하는 라우드스피커 렌더러를 제공한다.The following embodiments provide a virtual sound image positioning method that can effectively reproduce a virtual sound source by determining a panning coefficient in consideration of whether the loudspeakers are located in a two-dimensional space or a three-dimensional space, and a loudspeaker renderer performing the method. do.
일실시예에 따른 가상 음상 정위 방법은 입력 채널에 대응하는 가상 음원을 재생하기 위해 출력 채널에서 사용가능한 적어도 하나의 라우드스피커들의 재생 정보를 결정하는 단계; 및 상기 재생 정보를 이용하여 입력 신호를 렌더링하는 단계를 포함할 수 있다.According to one or more exemplary embodiments, a virtual sound image positioning method includes determining reproduction information of at least one loudspeaker available in an output channel to reproduce a virtual sound source corresponding to an input channel; And rendering an input signal using the reproduction information.
상기 라우드스피커들은, 2차원 공간 또는 3차원 공간에 존재할 수 있다.The loudspeakers may be in two-dimensional or three-dimensional space.
상기 라우드스피커들의 재생 정보를 결정하는 단계는, 상기 라우드스피커들로 구성된 재생 영역을 복수의 세부 영역들로 분할하는 단계; 상기 분할된 세부 영역들 중 재생하고자 하는 가상 음원이 위치하는 세부 영역을 판단하는 단계 및 상기 판단된 세부 영역에 기초하여 상기 라우드스피커들의 패닝 계수를 결정하는 단계를 포함할 수 있다.The determining of the playback information of the loudspeakers may include: dividing a playback area composed of the loudspeakers into a plurality of detailed areas; The method may include determining a detailed area in which the virtual sound source to be reproduced from among the divided detailed areas is located and determining a panning coefficient of the loudspeakers based on the determined detailed area.
상기 분할하는 단계는, 상기 라우드스피커가 2개인 경우, 상기 2개의 라우드스피커들을 연결하는 원주에 대응하는 재생 영역을 복수의 세부 영역들로 분할하고, 상기 판단하는 단계는, 상기 분할된 세부 영역들 중 상기 가상 음원이 위치하는 세부 영역을 판단할 수 있다.The dividing may include dividing a reproduction region corresponding to a circumference connecting the two loudspeakers into a plurality of subregions when the two loudspeakers are two, and determining the divided subregions. The detailed region in which the virtual sound source is located may be determined.
상기 분할하는 단계는, 상기 라우드스피커가 K개(K>3)인 경우, 상기 라우드스피커들로 구성된 재생 영역을 X개(X≥K)의 세부 영역들로 분할하고, 상기 판단하는 단계는, 상기 분할된 세부 영역들 중 상기 가상 음원이 위치하는 세부 영역을 판단할 수 있다.In the dividing step, when the loudspeakers are K pieces (K> 3), the dividing area consisting of the loudspeakers is divided into X sub-regions (X≥K), and the determining is performed. The detailed area in which the virtual sound source is located may be determined among the divided detailed areas.
다른 실시예에 따른 가상 음상 정위 방법은 출력 채널에서 사용가능한 적어도 하나의 라우드스피커들로 구성된 재생 영역을 설정하는 단계; 상기 재생 영역을 복수의 세부 영역들로 분할하는 단계; 상기 분할된 세부 영역들 중 재생하고자 하는 가상 음원이 위치한 세부 영역을 판단하는 단계; 상기 판단된 세부 영역에 기초하여 상기 가상 음원을 재생하기 위한 패닝 계수를 결정하는 단계; 및 상기 패닝 계수에 기초하여 입력 신호를 렌더링하는 단계를 포함할 수 있다.According to another embodiment of the present invention, a virtual sound image positioning method may include: setting a reproduction area including at least one loudspeaker usable in an output channel; Dividing the playback area into a plurality of detailed areas; Determining a detailed area in which the virtual sound source to be reproduced is located among the divided detailed areas; Determining a panning coefficient for reproducing the virtual sound source based on the determined subregion; And rendering an input signal based on the panning coefficient.
상기 라우드스피커들은, 2차원 공간 또는 3차원 공간에 존재할 수 있다.The loudspeakers may be in two-dimensional or three-dimensional space.
상기 분할하는 단계는, 상기 라우드스피커가 2개인 경우, 상기 2개의 라우드스피커들을 연결하는 원주에 대응하는 재생 영역을 복수의 세부 영역들로 분할하고, 상기 판단하는 단계는, 상기 분할된 세부 영역들 중 상기 가상 음원이 위치하는 세부 영역을 판단할 수 있다.The dividing may include dividing a reproduction region corresponding to a circumference connecting the two loudspeakers into a plurality of subregions when the two loudspeakers are two, and determining the divided subregions. The detailed region in which the virtual sound source is located may be determined.
상기 분할하는 단계는, 상기 라우드스피커가 K개(K>3)인 경우, 상기 라우드스피커들로 구성된 재생 영역을 X개(X≥K)의 세부 영역들로 분할하고, 상기 판단하는 단계는, 상기 분할된 세부 영역들 중 상기 가상 음원이 위치하는 세부 영역을 판단할 수 있다.In the dividing step, when the loudspeakers are K pieces (K> 3), the dividing area consisting of the loudspeakers is divided into X sub-regions (X≥K), and the determining is performed. The detailed area in which the virtual sound source is located may be determined among the divided detailed areas.
또 다른 실시예에 따른 가상 음상 정위 방법은 평면 상에 위치한 라우드스피커들을 이용하여 가상 음원을 위한 패닝 계수를 결정할 수 있는지 여부를 판단하는 단계; 판단 결과에 기초하여 가상 음원을 위한 패닝 계수를 결정하는 단계를 포함할 수 있다.According to another exemplary embodiment, a virtual sound image positioning method may include determining whether a panning coefficient for a virtual sound source may be determined using loudspeakers positioned on a plane; The method may include determining a panning coefficient for the virtual sound source based on the determination result.
상기 패닝 계수를 결정하는 단계는, 상기 평면 상에 위치한 라우드스피커를 이용하여 패닝 계수를 결정할 수 있는 경우, 수평각에 기초하여 상기 가상 음원을 위한 패닝 계수를 결정할 수 있다.The determining of the panning coefficient may include determining a panning coefficient for the virtual sound source based on a horizontal angle when the panning coefficient may be determined using a loudspeaker located on the plane.
상기 패닝 계수를 결정하는 단계는, 상기 평면 상에 위치한 라우드스피커를 이용하여 패닝 계수를 결정할 수 없는 경우, 수직각에 기초하여 상기 가상 음원을 위한 패닝 계수를 결정할 수 있다.The determining of the panning coefficient may include determining a panning coefficient for the virtual sound source based on a vertical angle when the panning coefficient cannot be determined using a loudspeaker positioned on the plane.
또 다른 실시예에 따른 가상 음상 정위 방법은 라우드스피커들이 2차원 공간 또는 3차원 공간 상에 위치했는지 여부를 판단하는 단계; 및 판단 결과에 기초하여 가상 음원을 위한 패닝 계수를 결정하는 단계를 포함할 수 있다.According to another embodiment of the present invention, a virtual sound image positioning method includes determining whether loudspeakers are located in a two-dimensional space or a three-dimensional space; And determining a panning coefficient for the virtual sound source based on the determination result.
상기 패닝 계수를 결정하는 단계는, 상기 라우드스피커들이 2차원 공간에 위치한 경우, 수평각에 기초하여 상기 가상 음원을 위한 패닝 계수를 결정할 수 있다.In the determining of the panning coefficient, when the loudspeakers are located in a two-dimensional space, the panning coefficient for the virtual sound source may be determined based on a horizontal angle.
상기 패닝 계수를 결정하는 단계는, 상기 라우드스피커들이 3차원 공간에 위치한 경우, 수직각에 기초하여 상기 가상 음원을 위한 패닝 계수를 결정할 수 있다.The determining of the panning coefficient may include determining a panning coefficient for the virtual sound source based on a vertical angle when the loudspeakers are located in a three-dimensional space.
일실시예에 따른 라우드스피커 렌더러는 입력 채널에 대응하는 가상 음원을 재생하기 위해 출력 채널에서 사용가능한 적어도 하나의 라우드스피커들의 재생 정보를 결정하는 결정부; 및 상기 재생 정보를 이용하여 입력 신호를 렌더링하는 렌더링부를 포함할 수 있다.According to an embodiment, a loudspeaker renderer may include: a determiner configured to determine reproduction information of at least one loudspeaker usable in an output channel to reproduce a virtual sound source corresponding to an input channel; And a rendering unit that renders an input signal using the reproduction information.
다른 실시예에 따른 라우드스피커 렌더러는 출력 채널에서 사용가능한 적어도 하나의 라우드스피커들로 구성된 재생 영역을 분할한 세부 영역에 기초하여 가상 음원을 재생하기 위한 패닝 계수를 결정하는 결정부; 및 상기 패닝 계수에 기초하여 입력 신호를 렌더링하는 렌더링부를 포함할 수 있다.According to another exemplary embodiment, a loudspeaker renderer may include: a determiner configured to determine a panning coefficient for reproducing a virtual sound source based on a subdivided region of a reproduction region composed of at least one loudspeaker usable in an output channel; And a rendering unit that renders an input signal based on the panning coefficient.
또 다른 실시예에 따른 라우드스피커 렌더러는 평면 상에 위치한 라우드스피커들을 이용하여 가상 음원을 위한 패닝 계수를 결정할 수 있는지 여부를 판단하고, 판단 결과에 기초하여 가상 음원을 위한 패닝 계수를 결정하는 결정부; 및 상기 패닝 계수에 기초하여 입력 신호를 렌더링하는 렌더링부를 포함할 수 있다.The loudspeaker renderer according to another embodiment determines whether or not the panning coefficient for the virtual sound source can be determined using the loudspeakers located on a plane, and determines a panning coefficient for the virtual sound source based on the determination result. ; And a rendering unit that renders an input signal based on the panning coefficient.
또 다른 실시예에 따른 라우드스피커 렌더러는 라우드스피커들이 2차원 공간 또는 3차원 공간 상에 위치했는지 여부를 판단하고, 판단 결과에 기초하여 가상 음원을 위한 패닝 계수를 결정하는 결정부; 및 상기 패닝 계수에 기초하여 입력 신호를 렌더링하는 렌더링부를 포함할 수 있다.According to another embodiment of the present invention, a loudspeaker renderer may include: a determiner configured to determine whether loudspeakers are positioned in a two-dimensional space or a three-dimensional space, and determine a panning coefficient for a virtual sound source based on a determination result; And a rendering unit that renders an input signal based on the panning coefficient.
상기 결정부는, 상기 라우드스피커들이 2차원 공간에 위치한 경우, 수평각에 기초하여 상기 가상 음원을 위한 패닝 계수를 결정하고, 상기 라우드스피커들이 3차원 공간에 위치한 경우, 수직각에 기초하여 상기 가상 음원을 위한 패닝 계수를 결정할 수 있다.The determining unit may determine a panning coefficient for the virtual sound source based on a horizontal angle when the loudspeakers are located in a two-dimensional space, and determine the panning coefficient for the virtual sound source based on a vertical angle when the loudspeakers are located in a three-dimensional space. Can determine the panning coefficient.
이하의 실시예들에 따르면, 라우드스피커들이 구성하는 재생 영역을 세부 영역으로 분할하고, 재생하고자 하는 가상 음원이 위치한 세부 영역에 기초하여 패닝 계수를 결정함으로써 패닝 계수를 결정하기 위한 연산량을 줄일 수 있다..According to the following embodiments, it is possible to reduce the amount of calculation for determining the panning coefficient by dividing the playback region that is configured by the loudspeakers into subregions and determining the panning coefficient based on the subregion where the virtual sound source to be played is located. ..
이하의 실시예들은 라우드스피커들이 2차원 공간 또는 3차원 공간 상에 위치했는지 여부를 고려하여 패닝 계수를 결정함으로써 가상 음원을 효과적으로 재생할 수 있다.The following embodiments can effectively reproduce the virtual sound source by determining the panning coefficient in consideration of whether the loudspeakers are located in a two-dimensional space or a three-dimensional space.
도 1은 일실시예에 따른 가상 음상 정위 방법을 수행하는 라우드스피커 렌더러를 도시한 도면이다.FIG. 1 is a diagram illustrating a loudspeaker renderer performing a virtual sound image positioning method according to an embodiment.
도 2는 일실시예에 따른 가상 음상 정위 방법을 도시한 도면이다.2 is a diagram illustrating a virtual sound image positioning method according to an embodiment.
도 3은 다른 실시예에 따른 가상 음상 정위 방법을 도시한 도면이다.3 is a diagram illustrating a virtual sound image positioning method according to another embodiment.
도 4는 일실시예에 따른 공간 그룹핑 기반의 패닝 기법을 도시한 도면이다. 4 is a diagram illustrating a spatial grouping-based panning technique according to an embodiment.
도 5는 도 4에서 K가 3일 때 공간 그룹핑 기반의 패닝 기법을 도시한 도면이다.FIG. 5 is a diagram illustrating a spatial grouping-based panning technique when K is 3 in FIG. 4.
도 6은 다른 실시예에 따른 공간 그룹핑 기반의 패닝 기법을 도시한 도면이다.6 is a diagram illustrating a spatial grouping-based panning technique according to another embodiment.
도 7은 도 6에서 K가 4일 때 공간 그룹핑 기반의 패닝 기법을 도시한 도면이다.FIG. 7 is a diagram illustrating a spatial grouping-based panning technique when K is 4 in FIG. 6.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 1은 일실시예에 따른 가상 음상 정위 방법을 수행하는 라우드스피커 렌더러를 도시한 도면이다.FIG. 1 is a diagram illustrating a loudspeaker renderer performing a virtual sound image positioning method according to an embodiment.
도 1을 참고하면, 라우드스피커 렌더러(102)는 결정부(103) 및 렌더링부(104)를 포함할 수 있다.Referring to FIG. 1, the loudspeaker renderer 102 may include a determiner 103 and a renderer 104.
결정부(103)는 디코더(101)로부터 믹서 출력 레이아웃(mixer output layout)을 수신할 수 있다. 여기서, 믹서 출력 레이아웃은 디코더(101)가 비트스트림을 디코딩함으로써 출력한 믹서 출력 신호의 포맷을 의미할 수 있다. 라우드스피커 렌더러(102)에 대해, 믹서 출력 신호는 입력 신호일 수 있으며 이에 대응한 믹서 출력 레이아웃은 입력 포맷을 의미한다.The determiner 103 may receive a mixer output layout from the decoder 101. Here, the mixer output layout may refer to a format of the mixer output signal output by the decoder 101 by decoding the bitstream. For the loudspeaker renderer 102, the mixer output signal may be an input signal and the corresponding mixer output layout means an input format.
결정부(103)는 믹서 출력 레이아웃과 재생 레이아웃을 고려하여 복수의 라우드스피커들의 재생 정보를 결정할 수 있다. 여기서, 재생 정보는 믹서 출력 레이아웃을 나타나는 입력 포맷을 재생 레이아웃을 나타내는 출력 포맷으로 변환할 때 사용되는 정보를 의미한다. 따라서, 라우드스피커 렌더러(102)는 포맷 컨버터(format converter)로 표현될 수 있다.The determination unit 103 may determine the reproduction information of the plurality of loudspeakers in consideration of the mixer output layout and the reproduction layout. Here, the reproduction information means information used when converting an input format representing the mixer output layout into an output format representing the reproduction layout. Thus, the loudspeaker renderer 102 may be represented as a format converter.
구체적으로, 입력 포맷의 채널수가 출력 포맷의 채널수보다 큰 경우, 재생 정보는 입력 신호를 출력 신호로 매핑하기 위한 다운믹스 매트릭스를 의미할 수 있다. 즉, 라우드스피커 렌더러(102)는 M채널의 입력 신호를 재생할 때 고려되어야 하는 재생 레이아웃에 대응하는 N채널의 출력 신호로 변환할 수 있다. 결정부(103)는 포맷 변환을 위한 재생 정보를 결정할 수 있다.Specifically, when the number of channels of the input format is larger than the number of channels of the output format, the reproduction information may mean a downmix matrix for mapping the input signal to the output signal. That is, the loudspeaker renderer 102 may convert the output signal of the N-channel corresponding to the reproduction layout to be considered when reproducing the input signal of the M-channel. The determination unit 103 may determine the reproduction information for format conversion.
이 때, 1채널에 대응하는 입력 신호는 라우드스피커에 따라 1채널 또는 복수의 채널에 대응하는 출력 신호로 매핑될 수 있다. 다시 말해서, 입력 신호들은 1채널에 대응하는 출력 신호로 매핑될 수 있다. 또는, 입력 신호는 2채널에 대응하는 출력 신호로 패닝될 수 있다. 그리고, 입력 신호는 3개 이상의 채널에 대응하는 출력 신호로 분배될 수 있다.In this case, the input signal corresponding to one channel may be mapped to an output signal corresponding to one channel or a plurality of channels according to the loudspeaker. In other words, the input signals may be mapped to output signals corresponding to one channel. Alternatively, the input signal may be panned into an output signal corresponding to two channels. In addition, the input signal may be divided into output signals corresponding to three or more channels.
그래서, 결정부(103)는 입력 신호를 1채널 또는 복수의 채널에 대응하는 출력 신호로 매핑하기 위한 재생 정보를 결정할 수 있다. 여기서, 재생 정보는 복수의 패닝 계수들로 구성된 다운믹스 매트릭스를 포함할 수 있다. Thus, the determination unit 103 may determine the reproduction information for mapping the input signal to an output signal corresponding to one channel or a plurality of channels. In this case, the reproduction information may include a downmix matrix composed of a plurality of panning coefficients.
이하의 실시예에서는 입력 신호를 출력 신호로 매핑할 때 입력 신호에 대응하는 음원을 라우드스피커에 재생될 수 있도록 재생 정보를 결정하는 과정을 설명한다. 특히, 결정부(103)는 라우드스피커에 입력된 파워를 제어함으로써 라우드스피커들 사이의 가상 공간에서 실제 음원이 아닌 가상 음원(virtual sound source)이 재생되는 효과를 청취자에게 제공하는 가상 음상 정위(virtual sound image localization)를 위해 패닝 계수(panning coefficient)를 결정할 수 있다. 패닝 계수를 결정하는 과정은 도 2 및 도 3에서 각각 설명하기로 한다.In the following embodiment, a process of determining the reproduction information so that a sound source corresponding to the input signal can be reproduced in the loudspeaker when the input signal is mapped to the output signal will be described. In particular, the determination unit 103 controls the power input to the loudspeakers to provide the listener with the effect that the virtual sound source is reproduced in the virtual space between the loudspeakers, not the actual sound source. A panning coefficient may be determined for sound image localization. A process of determining the panning coefficient will be described with reference to FIGS. 2 and 3, respectively.
렌더링부(104)는 재생 정보에 기초하여 디코더(101)로부터 수신한 믹서 출력 신호를 라우드스피커 신호로 매핑함으로써 믹서 출력 신호를 렌더링할 수 있다. 다시 말해서, 렌더링부(104)는 입력 포맷에 대응하는 입력 신호를 출력 포맷에 대응하는 출력 신호로 매핑함으로써, 입력 신호를 렌더링할 수 있다. 구체적으로, 렌더링부(104)는 결정부(103)에서 결정된 패닝 계수를 이용하여 입력 신호를 출력 신호로 매핑함으로써 입력 신호를 렌더링할 수 있다.The rendering unit 104 may render the mixer output signal by mapping the mixer output signal received from the decoder 101 to the loudspeaker signal based on the reproduction information. In other words, the rendering unit 104 may render an input signal by mapping an input signal corresponding to the input format to an output signal corresponding to the output format. In detail, the renderer 104 may render the input signal by mapping the input signal to the output signal using the panning coefficient determined by the determiner 103.
도 2는 일실시예에 따른 가상 음상 정위 방법을 도시한 도면이다.2 is a diagram illustrating a virtual sound image positioning method according to an embodiment.
단계(201)에서, 라우드스피커 렌더러(102)는 복수의 라우드스피커들로 구성된 재생 영역을 설정할 수 있다. 여기서, 재생 영역은 2개의 라우드스피커들을 연결하는 선을 의미하거나 또는 3개 이상의 라우드스피커들을 포함하는 평면을 의미할 수 있다. 이 때, 선은 직선 또는 곡선(원주)를 포함할 수 있다.In step 201, the loudspeaker renderer 102 may set up a playback area composed of a plurality of loudspeakers. Here, the reproduction region may mean a line connecting two loudspeakers or a plane including three or more loudspeakers. In this case, the line may include a straight line or a curve (circumference).
이 때, 입력 신호에 대응하는 가상 음원은 라우드스피커가 존재하는 위치가 아닌 재생 영역에서 재생된다고 가정한다. 다시 말해서, 재생 영역은 복수의 라우드스피커들로 구성된 가상의 2차원 또는 3차원 공간으로써, 가상 음원이 재생되는 위치를 의미할 수 있다.At this time, it is assumed that the virtual sound source corresponding to the input signal is reproduced in the reproduction region rather than the position where the loudspeaker is present. In other words, the reproduction region is a virtual two-dimensional or three-dimensional space composed of a plurality of loudspeakers, and may mean a position at which the virtual sound source is reproduced.
단계(202)에서, 라우드스피커 렌더러(102)는 재생 영역을 복수의 세부 영역들로 분할할 수 있다. 이 때, 재생 영역은 K개의 세부 영역으로 분할될 수 있다. 분할되는 세부 영역들은 서로 동일하거나 또는 동일하지 않을 수 있다.In step 202, the loudspeaker renderer 102 may divide the playback area into a plurality of subregions. At this time, the reproduction region may be divided into K subregions. The subdivided subdivisions may or may not be the same as each other.
단계(203)에서, 라우드스피커 렌더러(102)는 가상 음원이 위치하는 세부 영역을 판단할 수 있다. 앞서 설명하였듯이, 재생 영역은 가상 음원이 재생되는 위치를 의미하므로, 라우드스피커 렌더러(102)는 가상 음원이 재생 영역을 구성하는 복수의 세부 영역들 중 어떤 세부 영역에서 재생될 지를 판단할 수 있다.In operation 203, the loudspeaker renderer 102 may determine a detailed area in which the virtual sound source is located. As described above, since the playback region refers to a position at which the virtual sound source is played, the loudspeaker renderer 102 may determine in which detail region of the plurality of detailed regions constituting the playback region.
단계(204)에서, 라우드스피커 렌더러(102)는 세부 영역에 기초하여 가상 음원을 재생하기 위한 패닝 계수를 결정할 수 있다. 이 때, 라우드스피커에 대한 패닝 계수는 -1에서 1 사이로 결정될 수 있다.In step 204, the loudspeaker renderer 102 may determine a panning coefficient for playing the virtual sound source based on the detail region. At this time, the panning coefficient for the loudspeaker may be determined to be -1 to 1.
단계(205)에서, 라우드스피커 렌더러(102)는 패닝 계수에 따라 입력 신호를 렌더링할 수 있다.In step 205, the loudspeaker renderer 102 may render the input signal according to the panning coefficient.
도 2에서 설명하는 가상 음상 정위 방법은 라우드스피커들로 구성된 재생 영역을 복수의 세부 영역들로 그룹핑한 결과를 이용하는 것이므로, 그룹핑 기반의 패닝 기법으로 정의될 수 있다.Since the virtual sound image positioning method illustrated in FIG. 2 uses a result of grouping a playback region composed of loudspeakers into a plurality of detailed regions, it may be defined as a grouping-based panning technique.
도 2에서 설명된 가상 음상 정위 방법에 기초하여 다채널을 가지는 입력 신호의 포맷을 변환하는 과정을 설명하기로 한다. 즉, 입력 신호의 포맷을 변환하는 과정은 입력 신호를 출력 신호에 매핑함으로써 입력 신호를 렌더링하는 과정을 나타낸다.A process of converting a format of an input signal having multiple channels will be described based on the virtual sound image positioning method described with reference to FIG. 2. That is, the process of converting the format of the input signal represents the process of rendering the input signal by mapping the input signal to the output signal.
M채널의 입력 신호를 의미하는 음원을 N채널의 라우드스피커로 재생(M>2, N>2)하기 위해서는, M채널의 입력 신호를 N채널의 출력 신호로 변환 과정이 필요하며, 이러한 변환 과정은 이하의 수학식 1에 기초하여 수행될 수 있다.In order to reproduce (M> 2, N> 2) sound sources representing M input signals with N-channel loudspeakers, an M-channel input signal is converted into an N-channel output signal. May be performed based on Equation 1 below.
Figure PCTKR2014006053-appb-I000001
Figure PCTKR2014006053-appb-I000001
여기서, Y는 n채널(n=1~N)에 대응하는 라우드스피커를 통해 재생되는 출력 신호를 의미하며, 이하의 수학식 2에 따라 표현될 수 있다.Here, Y denotes an output signal reproduced through a loudspeaker corresponding to n channels (n = 1 to N), and may be expressed according to Equation 2 below.
Figure PCTKR2014006053-appb-I000002
Figure PCTKR2014006053-appb-I000002
그리고, X는 m 채널(m=1~M)에 대응하는 입력 신호를 의미하며, 이하의 수학식 3에 따라 표현될 수 있다.X denotes an input signal corresponding to m channels (m = 1 to M) and may be expressed according to Equation 3 below.
Figure PCTKR2014006053-appb-I000003
Figure PCTKR2014006053-appb-I000003
또한, A는 NxM 매트릭스로써, 도 2에서 설명된 패닝 계수로 구성될 수 있다. 이 때, A는 하기 수학식 4에 따라 표현될 수 있다.In addition, A is an N × M matrix and may be configured with the panning coefficient described in FIG. 2. In this case, A may be expressed according to Equation 4 below.
Figure PCTKR2014006053-appb-I000004
Figure PCTKR2014006053-appb-I000004
그러면, 수학식 1을 다시 표현하면 수학식 5와 같다.Then, Equation 1 is expressed again as Equation 5.
Figure PCTKR2014006053-appb-I000005
Figure PCTKR2014006053-appb-I000005
그리고, 수학식 5는 수학식 6으로 간단하게 표현될 수 있다.Equation 5 may be simply expressed by Equation 6.
Figure PCTKR2014006053-appb-I000006
Figure PCTKR2014006053-appb-I000006
M채널의 입력 신호가 22.2채널, 14.0채널, 11.1채널, 9.0채널의 입력 신호라고 가정하면, 하기 표 1과 같이 각 채널의 포맷에 따라 x 표시가 된 채널만이 실제로 포함될 수 있다.Assuming that the input signals of the M channel are input signals of 22.2 channels, 14.0 channels, 11.1 channels, and 9.0 channels, only channels marked with x may be actually included as shown in Table 1 below.
Figure PCTKR2014006053-appb-I000007
Figure PCTKR2014006053-appb-I000007
또한, N채널의 출력 신호가 5.1채널, 8.1채널, 10.1채널의 출력 신호로 가정하면, 하기 표 2와 같이 각 채널의 포맷에 따라 x 표시가 된 채널만이 실제로 포함될 수 있다.In addition, assuming that the output signal of the N channel is an output signal of 5.1, 8.1, and 10.1 channels, only channels marked with x may be actually included as shown in Table 2 below.
Figure PCTKR2014006053-appb-I000008
Figure PCTKR2014006053-appb-I000008
이하에서는 M채널의 입력 신호를 N채널의 출력 신호에 매핑하여 입력 신호를 렌더링하는 과정을 나타낸다. 즉, 입력 포맷이 출력 포맷으로 변환되는 과정이 설명된다. 이하의 수학식 7 내지 수학식 24에서 등호의 왼쪽은 표 2에서 표시된 번호를 출력 신호의 채널 번호를 의미하고, 등호의 오른쪽은 패닝 계수와 입력 신호의 채널 번호의 조합을 의미한다.Hereinafter, a process of rendering an input signal by mapping an input signal of M channel to an output signal of N channel will be described. That is, a process of converting an input format into an output format will be described. In the following Equations 7 to 24, the left side of the equal sign indicates the channel number of the output signal, and the right side of the equal sign indicates the combination of the panning coefficient and the channel number of the input signal.
(1) 22.2채널에서 5.1채널로의 변환(1) 22.2 channel to 5.1 channel conversion
Figure PCTKR2014006053-appb-I000009
Figure PCTKR2014006053-appb-I000009
Figure PCTKR2014006053-appb-I000010
Figure PCTKR2014006053-appb-I000010
(2) 22.2채널에서 8.1채널로의 변환(2) 22.2 channel to 8.1 channel conversion
Figure PCTKR2014006053-appb-I000011
Figure PCTKR2014006053-appb-I000011
Figure PCTKR2014006053-appb-I000012
Figure PCTKR2014006053-appb-I000012
(3) 22.2채널에서 10.1채널로의 변환(3) Conversion from 22.2 channels to 10.1 channels
Figure PCTKR2014006053-appb-I000013
Figure PCTKR2014006053-appb-I000013
(4) 14.0채널에서 5.1채널로의 변환(4) Conversion from 14.0 channels to 5.1 channels
Figure PCTKR2014006053-appb-I000014
Figure PCTKR2014006053-appb-I000014
Figure PCTKR2014006053-appb-I000015
Figure PCTKR2014006053-appb-I000015
(5) 14.0채널에서 8.1채널로의 변환(5) Conversion from 14.0 channel to 8.1 channel
Figure PCTKR2014006053-appb-I000016
Figure PCTKR2014006053-appb-I000016
Figure PCTKR2014006053-appb-I000017
Figure PCTKR2014006053-appb-I000017
(6) 14.0채널에서 10.1채널로의 변환(6) Conversion from 14.0 channels to 10.1 channels
Figure PCTKR2014006053-appb-I000018
Figure PCTKR2014006053-appb-I000018
(7) 11.1채널에서 5.1채널로의 변환(7) 11.1 channel to 5.1 channel conversion
Figure PCTKR2014006053-appb-I000019
Figure PCTKR2014006053-appb-I000019
Figure PCTKR2014006053-appb-I000020
Figure PCTKR2014006053-appb-I000020
(8) 11.1채널에서 8.1채널로의 변환(8) Conversion from 11.1 channel to 8.1 channel
Figure PCTKR2014006053-appb-I000021
Figure PCTKR2014006053-appb-I000021
Figure PCTKR2014006053-appb-I000022
Figure PCTKR2014006053-appb-I000022
(9) 11.1채널에서 10.1채널로의 변환(9) Conversion from 11.1 channel to 10.1 channel
Figure PCTKR2014006053-appb-I000023
Figure PCTKR2014006053-appb-I000023
(10) 9.0채널에서 5.1채널로의 변환(10) Conversion from 9.0 channel to 5.1 channel
Figure PCTKR2014006053-appb-I000024
Figure PCTKR2014006053-appb-I000024
(11) 9.0채널에서 8.1채널로의 변환(11) Conversion from 9.0 channel to 8.1 channel
Figure PCTKR2014006053-appb-I000025
Figure PCTKR2014006053-appb-I000025
(12) 9.0채널에서 10.1채널로의 변환(12) Conversion from 9.0 channel to 10.1 channel
Figure PCTKR2014006053-appb-I000026
Figure PCTKR2014006053-appb-I000026
한편, 도 2에서 제안된 가상 음상 정위 방법은 시간 도메인뿐만 아니라, FFT(Fast Fourier transform)과 같이 주파수 도메인, 또는 QMF(quadrature mirror filter), Hybrid filter 등을 이용한 변환에서 고려되는 서브밴드 도메인 등에도 적용될 수 있다. 한편, 동일한 입력 신호와 출력 신호 간의 매핑 관계라고 하더라도, 입력 신호의 주파수 밴드 등에 따라서 영역별로 다른 패닝 계수가 적용될 수 있다.On the other hand, the virtual sound image positioning method proposed in FIG. Can be applied. On the other hand, even if the mapping relationship between the same input signal and the output signal, different panning coefficients may be applied for each region according to the frequency band of the input signal.
도 3은 다른 실시예에 따른 가상 음상 정위 방법을 도시한 도면이다.3 is a diagram illustrating a virtual sound image positioning method according to another embodiment.
단계(301)에서, 라우드스피커 렌더러(102)는 평면 상에 존재하는 2개 이하의 라우드스피커로 패닝 계수를 결정할 수 있는지 여부를 판단할 수 있다. 만약, 패닝 계수를 결정할 수 있다고 판단된 경우, 단계(304)에서 라우드스피커 렌더러(102)는 2개의 라우드스피커에 기초한 수평각을 이용하여 가상 음원에 대한 패닝 계수를 결정할 수 있다. 즉, 평면 상에 위치한 2개의 라우드스피커를 패닝하도록 패닝 계수가 결정될 수 있다.In step 301, the loudspeaker renderer 102 may determine whether the panning coefficient can be determined by two or less loudspeakers present on the plane. If it is determined that the panning coefficient can be determined, in step 304 the loudspeaker renderer 102 may determine the panning coefficient for the virtual sound source using the horizontal angle based on the two loudspeakers. That is, the panning coefficient can be determined to pan two loudspeakers located on the plane.
여기서, 가상 음원에 대한 패닝 계수는 하기 수학식 25에 기초하여 결정될 수 있다.Here, the panning coefficient for the virtual sound source may be determined based on Equation 25 below.
Figure PCTKR2014006053-appb-I000027
Figure PCTKR2014006053-appb-I000027
여기서, 청취자의 정면으로 향하는 기준선과 오른쪽 라우드스피커가 이루는 각도는
Figure PCTKR2014006053-appb-I000028
으로 표현되고, 청취자의 정면으로 향하는 기준선과 왼쪽 라우드스피커가 이루는 각도는 360-
Figure PCTKR2014006053-appb-I000029
로 표현될 수 있다. 한편,
Figure PCTKR2014006053-appb-I000030
은 가상 음원과 청취자의 정면으로 향하는 기준선이 이루는 각도를 의미한다.
Figure PCTKR2014006053-appb-I000031
은 왼쪽 라우드스피커와 오른쪽 라우드스피커에 인가되는 게인값을 각각 cos
Figure PCTKR2014006053-appb-I000032
과 sin
Figure PCTKR2014006053-appb-I000033
으로 표현된다. 그러면, cos
Figure PCTKR2014006053-appb-I000034
과 sin
Figure PCTKR2014006053-appb-I000035
의 제곱의 합이 1이 되는 바, 왼쪽 라우드스피커와 오른쪽 라우드스피커에 할당되는 파워의 합이 항상 일정하다는 것을 나타낸다.
Here, the angle between the reference line facing the front of the listener and the right loudspeaker is
Figure PCTKR2014006053-appb-I000028
The angle between the baseline facing the listener's front and the left loudspeaker is 360-
Figure PCTKR2014006053-appb-I000029
It can be expressed as. Meanwhile,
Figure PCTKR2014006053-appb-I000030
Denotes an angle formed by the virtual sound source and the reference line facing the front of the listener.
Figure PCTKR2014006053-appb-I000031
The cos is the gain applied to the left and right loudspeakers respectively.
Figure PCTKR2014006053-appb-I000032
And sin
Figure PCTKR2014006053-appb-I000033
It is expressed as Then cos
Figure PCTKR2014006053-appb-I000034
And sin
Figure PCTKR2014006053-appb-I000035
The sum of the squares of equals to 1, indicating that the sum of powers allocated to the left and right loudspeakers is always constant.
만약, 단계(301)에서 패닝 계수를 결정할 수 없다고 판단된 경우, 단계(302)에서, 라우드스피커 렌더러(102)는 평면 상의 3개의 라우드스피커로 패닝 계수를 결정할 수 있는 지 여부를 판단할 수 있다. 만약, 패닝 계수를 결정할 수 있다고 판단된 경우, 단계(304)에서 라우드스피커 렌더러(102)는 3개의 라우드스피커에 기초한 수평각을 이용하여 가상 음원에 대한 패닝 계수를 결정할 수 있다. 즉, 평면 상에 위치한 3개의 라우드스피커를 패닝하도록 패닝 계수가 결정될 수 있다.If it is determined in step 301 that the panning coefficient cannot be determined, in step 302 the loudspeaker renderer 102 may determine whether the panning coefficient can be determined by three loudspeakers on the plane. . If it is determined that the panning coefficient can be determined, in step 304 the loudspeaker renderer 102 may determine the panning coefficient for the virtual sound source using the horizontal angle based on the three loudspeakers. That is, the panning coefficient can be determined to pan three loudspeakers located on the plane.
만약, 단계(302)에서 패닝 계수를 결정할 수 없다고 판단된 경우, 단계(303)에서, 라우드스피커 렌더러(102)는 수직각을 이용하여 가상 음원에 대한 패닝 계수를 결정할 수 있다. 단계(303)의 경우, 2개 또는 3개의 라우드스피커가 존재하는 평면에 가상 음원이 위치한 경우를 의미한다. 이 경우, 라우드스피커 렌더러(102)는 가상 음원의 위치가 가장 가까운 라우드스피커를 선택하고, 2개 또는 3개의 라우드스피커를 동일한 수직각으로 투영한 위치에 존재하는 가상 음원에 대한 패닝 계수를 결정할 수 있다.If it is determined in step 302 that the panning coefficient cannot be determined, in step 303, the loudspeaker renderer 102 may determine the panning coefficient for the virtual sound source using the vertical angle. In the case of step 303, this means a case where the virtual sound source is located on a plane where two or three loudspeakers exist. In this case, the loudspeaker renderer 102 may select the loudspeaker whose position is the closest to the virtual sound source, and determine a panning coefficient for the virtual sound source existing at the position where two or three loudspeakers are projected at the same vertical angle. have.
도 3에서 설명된 가상 음상 정위 방법에 기초하여 다채널을 가지는 입력 신호의 포맷을 변환하는 과정을 설명하기로 한다. 즉, 입력 신호의 포맷을 변환하는 과정은 입력 신호를 출력 신호에 매핑함으로써 입력 신호를 렌더링하는 과정을 나타낸다. 도 3의 렌더링 과정은 도 2에서 설명한 수학식 1 내지 수학식 6과 동일한 과정을 결정될 수 있다.A process of converting a format of an input signal having multiple channels will be described based on the virtual sound image positioning method described with reference to FIG. 3. That is, the process of converting the format of the input signal represents the process of rendering the input signal by mapping the input signal to the output signal. The rendering process of FIG. 3 may determine the same process as that of Equations 1 to 6 described with reference to FIG. 2.
M채널의 입력 신호가 22.2채널, 14.0채널, 11.1채널, 9.0채널의 입력 신호라고 가정하면, 상기 표 1과 같이 각 채널의 포맷에 따라 x 표시가 된 채널만이 실제로 포함될 수 있다.Assuming that the input signal of the M channel is an input signal of 22.2 channels, 14.0 channels, 11.1 channels, and 9.0 channels, only the channels marked with x may be actually included as shown in Table 1 above.
또한, N채널의 출력 신호가 5.1채널, 10.1채널의 출력 신호로 가정하면, 하기 표 3과 같이 각 채널의 포맷에 따라 x 표시가 된 채널만이 실제로 포함될 수 있다.In addition, assuming that an output signal of N channels is an output signal of 5.1 channels and 10.1 channels, only channels marked with x may be actually included as shown in Table 3 below.
Figure PCTKR2014006053-appb-I000036
Figure PCTKR2014006053-appb-I000036
이하에서는 M채널의 입력 신호를 N채널의 출력 신호에 매핑하여 입력 신호를 렌더링하는 과정을 나타낸다. 즉, 입력 포맷이 출력 포맷으로 변환되는 과정이 설명된다. 이하의 수학식 26 내지 수학식 33에서 등호의 왼쪽은 표 2에서 표시된 번호를 출력 신호의 채널 번호를 의미하고, 등호의 오른쪽은 패닝 계수와 입력 신호의 채널 번호의 조합을 의미한다.Hereinafter, a process of rendering an input signal by mapping an input signal of M channel to an output signal of N channel will be described. That is, a process of converting an input format into an output format will be described. In the following Equations 26 to 33, the left side of the equal sign indicates the channel number of the output signal, and the right side of the equal sign indicates the combination of the panning coefficient and the channel number of the input signal.
(1) 22.2채널에서 5.1채널로의 변환 (1) 22.2 channel to 5.1 channel conversion
Figure PCTKR2014006053-appb-I000037
Figure PCTKR2014006053-appb-I000037
(2) 22.2채널에서 10.1채널로의 변환(2) Conversion from 22.2 channels to 10.1 channels
Figure PCTKR2014006053-appb-I000038
Figure PCTKR2014006053-appb-I000038
(3) 14.0채널에서 5.1채널로의 변환(3) Conversion from 14.0 channels to 5.1 channels
Figure PCTKR2014006053-appb-I000039
Figure PCTKR2014006053-appb-I000039
(4) 14.0채널에서 10.1채널로의 변환(4) Conversion from 14.0 channels to 10.1 channels
Figure PCTKR2014006053-appb-I000040
Figure PCTKR2014006053-appb-I000040
(5) 11.1채널에서 5.1채널로의 변환(5) 11.1 channel to 5.1 channel conversion
Figure PCTKR2014006053-appb-I000041
Figure PCTKR2014006053-appb-I000041
(6) 11.1채널에서 10.1채널로의 변환(6) Conversion from 11.1 channel to 10.1 channel
Figure PCTKR2014006053-appb-I000042
Figure PCTKR2014006053-appb-I000042
(7) 9.0채널에서 5.1채널로의 변환(7) Conversion from 9.0 channel to 5.1 channel
Figure PCTKR2014006053-appb-I000043
Figure PCTKR2014006053-appb-I000043
(8) 9.0채널에서 10.1채널로의 변환(8) Conversion from 9.0 channel to 10.1 channel
Figure PCTKR2014006053-appb-I000044
Figure PCTKR2014006053-appb-I000044
수학식 27 내지 수학식 33에서 상향 채널을 나타내는 입력 신호가 수평면에 위치한 라우드스피커로 재생하는 경우와 같이, 입력 신호에 대응하는 입력 채널과 출력 신호에 대응하는 출력 채널의 수직각이 서로 다른 경우 패닝 계수 중 일부가 음수로 사용될 수 있다. 이에 의해 라우드스피커의 수직각과 다른 수직각을 가지는 가상 음원을 보다 효과적으로 재생할 수 있다.Panning when the vertical angles of the input channel corresponding to the input signal and the output channel corresponding to the output signal are different, such as when the input signal representing the upstream channel is reproduced by a loudspeaker located on a horizontal plane in Equations 27 to 33 Some of the coefficients can be used as negative numbers. As a result, the virtual sound source having a vertical angle different from that of the loudspeaker can be reproduced more effectively.
한편, 제안된 방법은 시간 영역에서뿐 아니라, fft(fast Fourier transform) 등을 이용한 변환에 따른 주파수 도메인, 혹은 QMF(quadrature mirror filter) 그리고/혹은 Hybrid filter 등을 이용한 변환에 따른 서브밴드 도메인 등에서 적용할 수 있다. 이 경우 동일한 입출력 채널의 연결 경우라도 주파수 밴드 등에 따라서 영역별로 다른 패닝 계수를 적용할 수 있다.On the other hand, the proposed method is applied not only in the time domain but also in the frequency domain according to transform using fft (fast Fourier transform), or the subband domain according to transform using quadrature mirror filter (QMF) and / or Hybrid filter. can do. In this case, even when the same input / output channel is connected, different panning coefficients may be applied for each region according to a frequency band.
도 3에 의하면, 라우드스피커가 표준화된 출력 포맷에서 정의하는 위치에 존재하지 않더라도, 라우드스피커에 대해 수평각과 수직각을 제공함으로써 패닝 계수를 결정할 수 있다. 또한, 입력 신호가 변환된 출력 신호들이 재생되는 라우드스피커들 간의 거리 차이(distance variation)도 패닝 계수를 결정할 때 이용될 수 있다.According to FIG. 3, even if the loudspeaker is not present at the position defined by the standardized output format, the panning coefficient can be determined by providing a horizontal angle and a vertical angle with respect to the loudspeaker. In addition, a distance variation between loudspeakers from which output signals converted from an input signal are reproduced may also be used when determining a panning coefficient.
도 2 및 도 3에서 설명되는 수학식들을 플래그를 통해 샘플별 또는 프레임별로 다르게 적용할 수 있다. 여기서, 수학식은 가상 음원을 재생하기 위한 가상 음상 정위 방법에 관한 것으로, 샘플별 또는 프레임별로 서로 다른 방법에 의해 M채널의 입력 신호가 N채널의 출력 신호로 변환될 수 있다.The equations described in FIGS. 2 and 3 may be applied differently for each sample or frame through a flag. Here, Equation relates to a virtual sound image positioning method for reproducing a virtual sound source, the input signal of the M channel can be converted to the output signal of the N channel by different methods for each sample or frame.
도 4는 일실시예에 따른 공간 그룹핑 기반의 패닝 기법을 도시한 도면이다. 4 is a diagram illustrating a spatial grouping-based panning technique according to an embodiment.
도 4를 참고하면, 2개의 라우드스피커(401, 402)가 존재한다. 이 때, 청취자(403)를 중심으로 왼쪽 라우드스피커(401)와 오른쪽 라우드스피커(402)가 위치한다. 여기서, 라우드스피커(401, 402)는 2차원 공간(선 또는 평면)에 존재한다고 가정한다. Referring to FIG. 4, there are two loudspeakers 401, 402. At this time, the left loudspeaker 401 and the right loudspeaker 402 are positioned around the listener 403. Here, it is assumed that the loudspeakers 401 and 402 exist in a two-dimensional space (line or plane).
청취자(403)를 중심으로 왼쪽 라우드스피커(401)와 오른쪽 라우드스피커(402)에 기초하여 재생 영역이 설정될 수 있다. 그러면, 재생 영역은 K개의 세부 영역(region 1, region 2, , region K)으로 분할될 수 있다. 이러한 재생 영역은 세부 영역으로 그룹화되며, 패닝 계수는 재생하고자 하는 가상 음원이 어떤 세부 영역에 위치했는지에 기초하여 결정될 수 있다.The playback area may be set based on the left loudspeaker 401 and the right loudspeaker 402 around the listener 403. Then, the reproduction region may be divided into K subregions (region 1, region 2, region K). These reproduction regions are grouped into sub-regions, and the panning coefficient may be determined based on which sub-region in which the virtual sound source to be reproduced is located.
도 5는 도 4에서 K가 3일 때 공간 그룹핑 기반의 패닝 기법을 도시한 도면이다.FIG. 5 is a diagram illustrating a spatial grouping-based panning technique when K is 3 in FIG. 4.
청취자(504)를 중심으로 왼쪽 라우드스피커(501)와 오른쪽 라우드스피커(502)가 위치한다. 이 때, 가상 음원(503)은 왼쪽 라우드스피커(501)와 오른쪽 라우드스피커(502)를 연결하는 원주에 위치하여 재생될 수 있다.The left loudspeaker 501 and the right loudspeaker 502 are positioned around the listener 504. At this time, the virtual sound source 503 may be reproduced by being located at the circumference connecting the left loudspeaker 501 and the right loudspeaker 502.
한편, 원주는 재생 영역을 구성하는 세부 영역으로 분할될 수 있다. 도 5는 왼쪽 라우드스피커(501)와 오른쪽 라우드스피커(502)를 구성하는 재생 영역을 3개의 세부 영역을 분할하여 가상 음원을 재생하는 경우를 도시하고 있다. 하지만, 일실시예에 따르면 반드시 균등하게 분할될 필요는 없다.On the other hand, the circumference may be divided into detailed regions constituting the reproduction region. FIG. 5 illustrates a case in which a virtual sound source is reproduced by dividing three sub-regions into a reproduction region constituting the left loudspeaker 501 and the right loudspeaker 502. FIG. However, according to one embodiment it is not necessary to divide evenly.
이 때, 왼쪽 라우드스피커(501)와 오른쪽 라우드스피커(502)가 이루는 각도가 θ이고, 세부 영역에 대응하는 각도가 θd인 경우 가상 음상 정위 방법에 따라 패닝 계수를 결정하는 과정은 다음과 같다.At this time, when the angle formed by the left loudspeaker 501 and the right loudspeaker 502 is θ, and the angle corresponding to the detail region is θd, the process of determining the panning coefficient according to the virtual sound image positioning method is as follows.
일례로, 가상 음원(503)이 세부 영역 region 1에 대응하는 원주 위에서 재생되는 경우, 가상 음원(503)을 재생하기 위해서 왼쪽 라우드스피커(501)에 파워가 전부 할당된다. 예를 들어, θ가 60도이면 θ d 가 20도일 때 가상 음원이 0도에서 20도에서 재생되는 경우, 가상 음원은 0도에 있는 왼쪽 라우드스피커(501)에 의해 재생될 수 있다.For example, when the virtual sound source 503 is reproduced on the circumference corresponding to the subregion region 1, all the power is allocated to the left loudspeaker 501 in order to reproduce the virtual sound source 503. For example, when θ is 60 degrees, when the virtual sound source is reproduced at 0 degrees to 20 degrees when θ d is 20 degrees, the virtual sound source may be reproduced by the left loudspeaker 501 at 0 degrees.
다른 예로, 가상 음원(503)이 세부 영역 region 2에 대응하는 원주 위에서 재생되는 경우, 가상 음원(503)을 재생하기 위해서 왼쪽 라우드스피커(501)와 오른쪽 라우드스피커(502)에 동일한 파워가 배분될 수 있다. 예를 들어, θ가 60도이면 θd가 20도일 때 가상 음원이 20도에서 40도에서 재생되는 경우, 왼쪽 라우드스피커(501)와 오른쪽 라우드스피커(502)에 입력 신호의
Figure PCTKR2014006053-appb-I000045
의 파워가 배분됨으로써 가상 음원이 재생될 수 있다.
As another example, when the virtual sound source 503 is reproduced on the circumference corresponding to the detail region region 2, the same power is distributed to the left loudspeaker 501 and the right loudspeaker 502 to reproduce the virtual sound source 503. Can be. For example, when θ is 60 degrees, when the virtual sound source is reproduced at 20 degrees to 40 degrees when θd is 20 degrees, the input signal is input to the left loudspeaker 501 and the right loudspeaker 502.
Figure PCTKR2014006053-appb-I000045
The virtual sound source can be reproduced by distributing the power of.
또 다른 예로, 가상 음원(503)이 세부 영역 region 3에 대응하는 원주 위에서 재생되는 경우, 가상 음원(503)을 재생하기 위해서 오른쪽 라우드스피커(502)에 파워가 전부 할당된다. 예를 들어, θ가 60도이면 θd가 20도일 때 가상 음원이 40도에서 60도에서 재생되는 경우, 가상 음원은 60도에 있는 오른쪽 라우드스피커(502)에 의해 재생될 수 있다. As another example, when the virtual sound source 503 is reproduced on the circumference corresponding to the subregion region 3, all the power is allocated to the right loudspeaker 502 to reproduce the virtual sound source 503. For example, when θ is 60 degrees, when θd is 20 degrees, when the virtual sound source is reproduced at 40 degrees to 60 degrees, the virtual sound source may be reproduced by the right loudspeaker 502 at 60 degrees.
도 5의 경우 재생 영역이 3개의 세부 영역으로 분할되는 경우를 설명하고 있다. 이와 달리, 재생 영역이 2개의 세부 영역으로 분할되는 경우 재생하고자 하는 가상 음원의 위치에 따라 라우드스피커가 선택될 수 있다.In the case of Fig. 5, the case where the reproduction region is divided into three subregions is explained. In contrast, when the reproduction region is divided into two sub-regions, the loudspeaker may be selected according to the position of the virtual sound source to be reproduced.
도 6은 다른 실시예에 따른 공간 그룹핑 기반의 패닝 기법을 도시한 도면이다.6 is a diagram illustrating a spatial grouping-based panning technique according to another embodiment.
도 6은 도 5와 달리 3차원 공간에 라우드스피커(601, 602, 603)가 존재하는 경우를 설명하고 있다. 예를 들어, 라우드스피커(601, 602, 603) 중 적어도 하나는 평면에 존재하고, 나머지는 평면이 아닌 3차원 공간에 배치된 경우를 나타낸다. 다시 말해서, 도 6은 청취자가 위치한 수평 방향 뿐만 아니라 수직 방향 (상향 또는 하향)에도 라우드스피커가 존재하는 경우를 의미한다.FIG. 6 illustrates a case where the loudspeakers 601, 602, and 603 exist in a three-dimensional space unlike FIG. 5. For example, at least one of the loudspeakers 601, 602, 603 is present in a plane, and the rest is arranged in a three-dimensional space rather than a plane. In other words, FIG. 6 means a case where the loudspeaker is present not only in the horizontal direction where the listener is located but also in the vertical direction (upward or downward).
도 6에서 3개의 라우드스피커(601, 602, 603)로 구성되는 재생 영역은 K개의 세부 영역으로 분할될 수 있다. 재생 영역은 균등하게 분할되거나 또는 균등하지 않게 분할될 수 있다. 그러면, K개의 세부 영역들 중 가상 음원이 재생되는 위치에 해당하는 세부 영역과 관련된 라우드스피커에 파워를 할당할 수 있도록 패닝 계수가 결정될 수 있다. 패닝 계수는 -1 에서 1사이의 값을 가질 수 있다. In FIG. 6, a reproduction area composed of three loudspeakers 601, 602, and 603 may be divided into K subregions. The reproduction region may be divided evenly or not evenly. Then, the panning coefficient may be determined so that power may be allocated to a loudspeaker associated with the detailed region corresponding to the position where the virtual sound source is reproduced among the K detailed regions. The panning coefficient may have a value between -1 and 1.
도 7은 도 6에서 K가 4일 때 공간 그룹핑 기반의 패닝 기법을 도시한 도면이다.FIG. 7 is a diagram illustrating a spatial grouping-based panning technique when K is 4 in FIG. 6.
도 7을 참고하면, 3차원 공간 상에 존재하는 라우드스피커(701, 702, 703)로 구성된 재생 영역이 4개의 세부 영역들로 분할된 경우가 도시된다. 즉, 3개의 라우드스피커(701, 702, 703)로 4개의 세부 영역이 결정될 수 있다. 그러면, 재생하고자 하는 가상 음원이 4개의 세부 영역들 중 어떤 세부 영역에 존재하는지 여부에 따라 가상 음원에 대한 패닝 계수가 결정될 수 있다.Referring to FIG. 7, a case in which a reproduction area composed of loudspeakers 701, 702, and 703 existing in a three-dimensional space is divided into four subregions is illustrated. That is, four detailed regions may be determined by three loudspeakers 701, 702, and 703. Then, the panning coefficient for the virtual sound source may be determined according to which of the four subregions the virtual sound source to be reproduced exists in.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The apparatus described above may be implemented as a hardware component, a software component, and / or a combination of hardware components and software components. For example, the devices and components described in the embodiments may be, for example, processors, controllers, arithmetic logic units (ALUs), digital signal processors, microcomputers, field programmable arrays (FPAs), It may be implemented using one or more general purpose or special purpose computers, such as a programmable logic unit (PLU), microprocessor, or any other device capable of executing and responding to instructions. The processing device may execute an operating system (OS) and one or more software applications running on the operating system. The processing device may also access, store, manipulate, process, and generate data in response to the execution of the software. For convenience of explanation, one processing device may be described as being used, but one of ordinary skill in the art will appreciate that the processing device includes a plurality of processing elements and / or a plurality of types of processing elements. It can be seen that it may include. For example, the processing device may include a plurality of processors or one processor and one controller. In addition, other processing configurations are possible, such as parallel processors.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.The software may include a computer program, code, instructions, or a combination of one or more of the above, and configure the processing device to operate as desired, or process it independently or collectively. You can command the device. Software and / or data may be any type of machine, component, physical device, virtual equipment, computer storage medium or device in order to be interpreted by or to provide instructions or data to the processing device. Or may be permanently or temporarily embodied in a signal wave to be transmitted. The software may be distributed over networked computer systems so that they may be stored or executed in a distributed manner. Software and data may be stored on one or more computer readable recording media.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The method according to the embodiment may be embodied in the form of program instructions that can be executed by various computer means and recorded in a computer readable medium. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. The program instructions recorded on the media may be those specially designed and constructed for the purposes of the embodiments, or they may be of the kind well-known and available to those having skill in the computer software arts. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like. The hardware device described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다. 그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.Although the embodiments have been described by the limited embodiments and the drawings as described above, various modifications and variations are possible to those skilled in the art from the above description. For example, the described techniques may be performed in a different order than the described method, and / or components of the described systems, structures, devices, circuits, etc. may be combined or combined in a different form than the described method, or other components. Or even if replaced or substituted by equivalents, an appropriate result can be achieved. Therefore, other implementations, other embodiments, and equivalents to the claims are within the scope of the claims that follow.

Claims (20)

  1. 입력 채널에 대응하는 가상 음원을 재생하기 위해 출력 채널에서 사용가능한 적어도 하나의 라우드스피커들의 재생 정보를 결정하는 단계;Determining reproduction information of at least one loudspeaker usable in the output channel to reproduce the virtual sound source corresponding to the input channel;
    상기 재생 정보를 이용하여 입력 신호를 렌더링하는 단계Rendering an input signal using the reproduction information;
    를 포함하는 가상 음상 정위 방법.Virtual phonetic stereotactic method comprising a.
  2. 제1항에 있어서,The method of claim 1,
    상기 라우드스피커들은, 2차원 공간 또는 3차원 공간에 존재하는 가상 음상 정위 방법.The loudspeakers are located in a two-dimensional space or three-dimensional space.
  3. 제1항에 있어서,The method of claim 1,
    상기 라우드스피커들의 재생 정보를 결정하는 단계는,Determining the reproduction information of the loudspeakers,
    상기 라우드스피커들로 구성된 재생 영역을 복수의 세부 영역들로 분할하는 단계;Dividing a playback area composed of the loudspeakers into a plurality of detailed areas;
    상기 분할된 세부 영역들 중 재생하고자 하는 가상 음원이 위치하는 세부 영역을 판단하는 단계Determining a detailed area in which the virtual sound source to be reproduced is located among the divided detailed areas;
    상기 판단된 세부 영역에 기초하여 상기 라우드스피커들의 패닝 계수를 결정하는 단계Determining a panning coefficient of the loudspeakers based on the determined subregion.
    를 포함하는 가상 음상 정위 방법.Virtual phonetic stereotactic method comprising a.
  4. 제3항에 있어서,The method of claim 3,
    상기 분할하는 단계는,The dividing step,
    상기 라우드스피커가 2개인 경우, 상기 2개의 라우드스피커들을 연결하는 원주에 대응하는 재생 영역을 복수의 세부 영역들로 분할하고,When the two loudspeakers are two, the reproduction region corresponding to the circumference connecting the two loudspeakers is divided into a plurality of detailed regions,
    상기 판단하는 단계는,The determining step,
    상기 분할된 세부 영역들 중 상기 가상 음원이 위치하는 세부 영역을 판단하는 가상 음상 정위 방법.The virtual sound image positioning method of determining the detailed region in which the virtual sound source is located among the divided sub-regions.
  5. 제3항에 있어서,The method of claim 3,
    상기 분할하는 단계는,The dividing step,
    상기 라우드스피커가 K개(K>3)인 경우, 상기 라우드스피커들로 구성된 재생 영역을 X개(X≥K)의 세부 영역들로 분할하고,If the loudspeakers are K (K> 3), the playback area composed of the loudspeakers is divided into X (X≥K) sub-regions,
    상기 판단하는 단계는,The determining step,
    상기 분할된 세부 영역들 중 상기 가상 음원이 위치하는 세부 영역을 판단하는 가상 음상 정위 방법.The virtual sound image positioning method of determining the detailed region in which the virtual sound source is located among the divided sub-regions.
  6. 출력 채널에서 사용가능한 적어도 하나의 라우드스피커들로 구성된 재생 영역을 설정하는 단계;Establishing a playback region comprised of at least one loudspeakers available in the output channel;
    상기 재생 영역을 복수의 세부 영역들로 분할하는 단계;Dividing the playback area into a plurality of detailed areas;
    상기 분할된 세부 영역들 중 재생하고자 하는 가상 음원이 위치한 세부 영역을 판단하는 단계;Determining a detailed area in which the virtual sound source to be reproduced is located among the divided detailed areas;
    상기 판단된 세부 영역에 기초하여 상기 가상 음원을 재생하기 위한 패닝 계수를 결정하는 단계; 및Determining a panning coefficient for reproducing the virtual sound source based on the determined subregion; And
    상기 패닝 계수에 기초하여 입력 신호를 렌더링하는 단계Rendering an input signal based on the panning coefficient
    를 포함하는 가상 음상 정위 방법.Virtual phonetic stereotactic method comprising a.
  7. 제6항에 있어서,The method of claim 6,
    상기 라우드스피커들은, 2차원 공간 또는 3차원 공간에 존재하는 가상 음상 정위 방법.The loudspeakers are located in a two-dimensional space or three-dimensional space.
  8. 제6항에 있어서,The method of claim 6,
    상기 분할하는 단계는,The dividing step,
    상기 라우드스피커가 2개인 경우, 상기 2개의 라우드스피커들을 연결하는 원주에 대응하는 재생 영역을 복수의 세부 영역들로 분할하고,When the two loudspeakers are two, the reproduction region corresponding to the circumference connecting the two loudspeakers is divided into a plurality of detailed regions,
    상기 판단하는 단계는,The determining step,
    상기 분할된 세부 영역들 중 상기 가상 음원이 위치하는 세부 영역을 판단하는 가상 음상 정위 방법.The virtual sound image positioning method of determining the detailed region in which the virtual sound source is located among the divided sub-regions.
  9. 제6항에 있어서,The method of claim 6,
    상기 분할하는 단계는,The dividing step,
    상기 라우드스피커가 K개(K>3)인 경우, 상기 라우드스피커들로 구성된 재생 영역을 X개(X≥K)의 세부 영역들로 분할하고,If the loudspeakers are K (K> 3), the playback area composed of the loudspeakers is divided into X (X≥K) sub-regions,
    상기 판단하는 단계는,The determining step,
    상기 분할된 세부 영역들 중 상기 가상 음원이 위치하는 세부 영역을 판단하는 가상 음상 정위 방법.The virtual sound image positioning method of determining the detailed region in which the virtual sound source is located among the divided sub-regions.
  10. 평면 상에 위치한 라우드스피커들을 이용하여 가상 음원을 위한 패닝 계수를 결정할 수 있는지 여부를 판단하는 단계;Determining whether or not a panning coefficient for the virtual sound source can be determined using the loudspeakers located on the plane;
    판단 결과에 기초하여 가상 음원을 위한 패닝 계수를 결정하는 단계Determining a panning coefficient for the virtual sound source based on the determination result
    를 포함하는 가상 음상 정위 방법.Virtual phonetic stereotactic method comprising a.
  11. 제10항에 있어서,The method of claim 10,
    상기 패닝 계수를 결정하는 단계는,Determining the panning coefficient,
    상기 평면 상에 위치한 라우드스피커를 이용하여 패닝 계수를 결정할 수 있는 경우, 수평각에 기초하여 상기 가상 음원을 위한 패닝 계수를 결정하는 가상 음상 정위 방법.And determining a panning coefficient for the virtual sound source based on a horizontal angle when the panning coefficient can be determined using a loudspeaker located on the plane.
  12. 제10항에 있어서,The method of claim 10,
    상기 패닝 계수를 결정하는 단계는,Determining the panning coefficient,
    상기 평면 상에 위치한 라우드스피커를 이용하여 패닝 계수를 결정할 수 없는 경우, 수직각에 기초하여 상기 가상 음원을 위한 패닝 계수를 결정하는 가상 음상 정위 방법.And when a panning coefficient cannot be determined using a loudspeaker located on the plane, determining a panning coefficient for the virtual sound source based on a vertical angle.
  13. 라우드스피커들이 2차원 공간 또는 3차원 공간 상에 위치했는지 여부를 판단하는 단계;Determining whether loudspeakers are located in a two-dimensional space or a three-dimensional space;
    판단 결과에 기초하여 가상 음원을 위한 패닝 계수를 결정하는 단계Determining a panning coefficient for the virtual sound source based on the determination result
    를 포함하는 가상 음상 정위 방법.Virtual phonetic stereotactic method comprising a.
  14. 제13항에 있어서,The method of claim 13,
    상기 패닝 계수를 결정하는 단계는,Determining the panning coefficient,
    상기 라우드스피커들이 2차원 공간에 위치한 경우, 수평각에 기초하여 상기 가상 음원을 위한 패닝 계수를 결정하는 가상 음상 정위 방법.And determining the panning coefficient for the virtual sound source based on a horizontal angle when the loudspeakers are located in a two-dimensional space.
  15. 제13항에 있어서,The method of claim 13,
    상기 패닝 계수를 결정하는 단계는,Determining the panning coefficient,
    상기 라우드스피커들이 3차원 공간에 위치한 경우, 수직각에 기초하여 상기 가상 음원을 위한 패닝 계수를 결정하는 가상 음상 정위 방법.And determining the panning coefficient for the virtual sound source based on a vertical angle when the loudspeakers are located in a three-dimensional space.
  16. 입력 채널에 대응하는 가상 음원을 재생하기 위해 출력 채널에서 사용가능한 적어도 하나의 라우드스피커들의 재생 정보를 결정하는 결정부; 및A determination unit that determines reproduction information of at least one loudspeaker usable in the output channel to reproduce the virtual sound source corresponding to the input channel; And
    상기 재생 정보를 이용하여 입력 신호를 렌더링하는 렌더링부Rendering unit for rendering the input signal using the reproduction information
    를 포함하는 라우드스피커 렌더러.Loudspeaker renderer comprising.
  17. 출력 채널에서 사용가능한 적어도 하나의 라우드스피커들로 구성된 재생 영역을 분할한 세부 영역에 기초하여 가상 음원을 재생하기 위한 패닝 계수를 결정하는 결정부; 및A determination unit for determining a panning coefficient for reproducing the virtual sound source based on the subdivided region of the reproduction region composed of at least one loudspeaker available in the output channel; And
    상기 패닝 계수에 기초하여 입력 신호를 렌더링하는 렌더링부A rendering unit that renders an input signal based on the panning coefficient
    를 포함하는 라우드스피커 렌더러.Loudspeaker renderer comprising.
  18. 평면 상에 위치한 라우드스피커들을 이용하여 가상 음원을 위한 패닝 계수를 결정할 수 있는지 여부를 판단하고, 판단 결과에 기초하여 가상 음원을 위한 패닝 계수를 결정하는 결정부; 및A determination unit that determines whether a panning coefficient for the virtual sound source can be determined using the loudspeakers located on the plane, and determines a panning coefficient for the virtual sound source based on the determination result; And
    상기 패닝 계수에 기초하여 입력 신호를 렌더링하는 렌더링부A rendering unit that renders an input signal based on the panning coefficient
    를 포함하는 라우드스피커 렌더러.Loudspeaker renderer comprising.
  19. 라우드스피커들이 2차원 공간 또는 3차원 공간 상에 위치했는지 여부를 판단하고, 판단 결과에 기초하여 가상 음원을 위한 패닝 계수를 결정하는 결정부; 및A determination unit that determines whether the loudspeakers are located in a two-dimensional space or a three-dimensional space, and determines a panning coefficient for the virtual sound source based on the determination result; And
    상기 패닝 계수에 기초하여 입력 신호를 렌더링하는 렌더링부A rendering unit that renders an input signal based on the panning coefficient
    를 포함하는 라우드스피커 렌더러.Loudspeaker renderer comprising.
  20. 제19항에 있어서,The method of claim 19,
    상기 결정부는,The determining unit,
    상기 라우드스피커들이 2차원 공간에 위치한 경우, 수평각에 기초하여 상기 가상 음원을 위한 패닝 계수를 결정하고,When the loudspeakers are located in a two-dimensional space, the panning coefficient for the virtual sound source is determined based on a horizontal angle,
    상기 라우드스피커들이 3차원 공간에 위치한 경우, 수직각에 기초하여 상기 가상 음원을 위한 패닝 계수를 결정하는 라우드스피커 렌더러.A loudspeaker renderer that determines a panning coefficient for the virtual sound source based on a vertical angle when the loudspeakers are located in three-dimensional space.
PCT/KR2014/006053 2013-07-05 2014-07-07 Virtual sound image localization method for two dimensional and three dimensional spaces WO2015002517A1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US14/758,719 US20160112820A1 (en) 2013-07-05 2014-07-07 Virtual sound image localization method for two dimensional and three dimensional spaces
CN201480008005.7A CN104982040B (en) 2013-07-05 2014-07-07 Virtual sound image localization method in two dimension and three dimensions

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
KR10-2013-0079263 2013-07-05
KR20130079116 2013-07-05
KR20130079263 2013-07-05
KR10-2013-0079116 2013-07-05
KR10-2014-0083959 2014-07-04
KR1020140083959A KR102149046B1 (en) 2013-07-05 2014-07-04 Virtual sound image localization in two and three dimensional space

Publications (1)

Publication Number Publication Date
WO2015002517A1 true WO2015002517A1 (en) 2015-01-08

Family

ID=52144020

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2014/006053 WO2015002517A1 (en) 2013-07-05 2014-07-07 Virtual sound image localization method for two dimensional and three dimensional spaces

Country Status (1)

Country Link
WO (1) WO2015002517A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11666971B1 (en) 2015-10-30 2023-06-06 Seurat Technologies, Inc. Additive manufacturing system and method

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002505057A (en) * 1997-06-19 2002-02-12 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー Sound reproduction system
JP2006515490A (en) * 2003-02-12 2006-05-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ Apparatus and method for determining playback position
JP2009077379A (en) * 2007-08-30 2009-04-09 Victor Co Of Japan Ltd Stereoscopic sound reproduction equipment, stereophonic sound reproduction method, and computer program
KR20090050380A (en) * 2007-11-15 2009-05-20 삼성전자주식회사 Method and apparatus for audio matrix decoding
JP2011211312A (en) * 2010-03-29 2011-10-20 Panasonic Corp Sound image localization processing apparatus and sound image localization processing method

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002505057A (en) * 1997-06-19 2002-02-12 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー Sound reproduction system
JP2006515490A (en) * 2003-02-12 2006-05-25 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ Apparatus and method for determining playback position
JP2009077379A (en) * 2007-08-30 2009-04-09 Victor Co Of Japan Ltd Stereoscopic sound reproduction equipment, stereophonic sound reproduction method, and computer program
KR20090050380A (en) * 2007-11-15 2009-05-20 삼성전자주식회사 Method and apparatus for audio matrix decoding
JP2011211312A (en) * 2010-03-29 2011-10-20 Panasonic Corp Sound image localization processing apparatus and sound image localization processing method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11666971B1 (en) 2015-10-30 2023-06-06 Seurat Technologies, Inc. Additive manufacturing system and method

Similar Documents

Publication Publication Date Title
WO2014088328A1 (en) Audio providing apparatus and audio providing method
WO2011115430A2 (en) Method and apparatus for reproducing three-dimensional sound
WO2012005507A2 (en) 3d sound reproducing method and apparatus
WO2018088742A1 (en) Display apparatus and control method thereof
WO2014157975A1 (en) Audio apparatus and audio providing method thereof
WO2018147701A1 (en) Method and apparatus for processing audio signal
WO2019107868A1 (en) Apparatus and method for outputting audio signal, and display apparatus using the same
WO2015105393A1 (en) Method and apparatus for reproducing three-dimensional audio
KR20200105455A (en) Virtual sound image localization in two and three dimensional space
WO2015005577A1 (en) Camera pose estimation apparatus and method
WO2015152661A1 (en) Method and apparatus for rendering audio object
WO2017209477A1 (en) Audio signal processing method and device
WO2018093193A1 (en) System and method for producing audio data to head mount display device
EP3841428A1 (en) Apparatus and method of displaying image and computer program thereof
WO2022085958A1 (en) Electronic device and method for operating same
WO2015002517A1 (en) Virtual sound image localization method for two dimensional and three dimensional spaces
EP3871158A1 (en) Image processing apparatus and operating method of the same
WO2016190460A1 (en) Method and device for 3d sound playback
WO2015009040A1 (en) Encoder and encoding method for multichannel signal, and decoder and decoding method for multichannel signal
WO2016182184A1 (en) Three-dimensional sound reproduction method and device
WO2015147434A1 (en) Apparatus and method for processing audio signal
EP3529776A1 (en) Method, device, and system for processing multimedia signal
WO2024014711A1 (en) Audio rendering method based on recording distance parameter and apparatus for performing same
WO2023085859A1 (en) Auditory monitoring method using hearing aid earphone, and system therefor
WO2019225799A1 (en) Method and device for deleting user information using deep learning generative model

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14820264

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 14758719

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 14820264

Country of ref document: EP

Kind code of ref document: A1