JP2017212731A - Acoustic processing apparatus, acoustic processing method, and program - Google Patents

Acoustic processing apparatus, acoustic processing method, and program Download PDF

Info

Publication number
JP2017212731A
JP2017212731A JP2017097433A JP2017097433A JP2017212731A JP 2017212731 A JP2017212731 A JP 2017212731A JP 2017097433 A JP2017097433 A JP 2017097433A JP 2017097433 A JP2017097433 A JP 2017097433A JP 2017212731 A JP2017212731 A JP 2017212731A
Authority
JP
Japan
Prior art keywords
sound source
reproduction
sound
virtual
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017097433A
Other languages
Japanese (ja)
Other versions
JP6826945B2 (en
Inventor
大出 訓史
Norifumi Oide
訓史 大出
陽 佐々木
Akira Sasaki
陽 佐々木
小森 智康
Tomoyasu Komori
智康 小森
岳大 杉本
Takehiro Sugimoto
岳大 杉本
北島 周
Shu Kitajima
周 北島
一穂 小野
Kazuo Ono
一穂 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Publication of JP2017212731A publication Critical patent/JP2017212731A/en
Application granted granted Critical
Publication of JP6826945B2 publication Critical patent/JP6826945B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Stereophonic System (AREA)

Abstract

PROBLEM TO BE SOLVED: To reproduce a spatial impression of a reproduction sound in acoustic reproduction on the basis of a multichannel acoustic signal at a sound source arrangement different from the production.SOLUTION: In a virtual space setting part, a position of a center point in which an opening angle of two target points as a target of a sound distribution from a predetermined center point in a virtual space is equal to a predetermined opening angle during production of a multi channel sound signal and a rate of a size of the virtual space corresponded to the reproduction space are determined on a straight line obtained by connecting a predetermined reference point in the reproduction space and the two target points. A sound direction determination part determines a direction from the reference point to a virtual sound direction as a position of a virtual sound to a predetermined reproduction space at each channel position to the sound direction of the channel during production from the center point. A sound signal conversion part converts the multi channel sound signal to a sound signal to the reproduction sound on the basis of the reproduction sound direction from the reference point of the reproduction sound arranged in the virtual sound direction and the reproduction space.SELECTED DRAWING: Figure 1

Description

本発明は、音響処理装置、音響処理方法およびプログラムに関する。   The present invention relates to an acoustic processing device, an acoustic processing method, and a program.

複数の音声チャンネルの番組音声を、制作時におけるチャンネル数よりも少ないチャンネル数に変換(ダウンミックス)することがある。その際、制作時における各音声チャンネルの音響信号にそれぞれダウンミックス係数を乗じて得られる音響信号を加算して、再生時における各音声チャンネルの音響信号を生成する。ダウンミックス係数として、所定の音響システムの標準規格(例えば、勧告ITU−R BS.775等)で規定されているものと、番組ごとに音響信号に付加したメタデータに基づいて指定されるものがある(例えば、ARIB STD−B32)。   There are cases where program audio of a plurality of audio channels is converted (downmixed) to a number of channels smaller than the number of channels at the time of production. At this time, the sound signal obtained by multiplying the sound signal of each sound channel at the time of production by the downmix coefficient is added to generate the sound signal of each sound channel at the time of reproduction. As a downmix coefficient, one specified by a standard standard of a predetermined acoustic system (for example, recommendation ITU-R BS.775) and one specified based on metadata added to an acoustic signal for each program Yes (for example, ARIB STD-B32).

また、映画用音響システムにはオブジェクトベース音響方式が採用されることがある。オブジェクトベース音響方式では、再生装置が音声コンテンツを構成する音響素材について各劇場の再生環境に応じて再生用の音響信号を生成する処理(レンダリング)を行う。ダウンミックス係数やレンダリングにおける各種パラメータの算出方法には、チャンネル数の変換前後の各チャンネルに係る音源方向(角度)に基づいて算出する方法、目標方向の近傍のチャンネルの音源に均等に分配する方法などがある。   In addition, an object-based sound system may be employed in a movie sound system. In the object-based audio method, the playback device performs processing (rendering) for generating a sound signal for playback according to the playback environment of each theater with respect to the sound material constituting the audio content. As a method for calculating various parameters in the downmix coefficient and rendering, a method of calculating based on the sound source direction (angle) of each channel before and after the conversion of the number of channels, and a method of evenly distributing to the sound sources of channels near the target direction and so on.

例えば、非特許文献2には、式(1)に示す関係を用いて5.1chサラウンドの音響信号からステレオ2chの音響信号へのダウンミックス処理について記載されている。   For example, Non-Patent Document 2 describes a downmix process from a 5.1ch surround sound signal to a stereo 2ch sound signal using the relationship shown in Equation (1).

Figure 2017212731
Figure 2017212731

式(1)において、Lt、Rtは、ステレオ2chのうち、それぞれ左チャンネル、右チャンネルの音響信号を示す。L、R、C、LFE、Ls、Rsは、5.1chサラウンドのうち、それぞれ前方左チャンネル、前方右チャンネル、前方中央チャンネル、低域効果音チャンネル、サラウンド左チャンネル、サラウンド右チャンネルそれぞれの音響信号を示す。従って、式(1)の第1項の2行6列の行列の各要素がダウンミックス係数に相当する。kは、サラウンド左チャンネルLs、サラウンド右チャンネルRsのレベルを規定する係数を示す。kは、例えば、1/√2、1/2、0である。メタデータが音響信号に付随して伝送されない場合、テレビジョン受信機では、kとして1/√2が用いられる。   In the formula (1), Lt and Rt indicate acoustic signals of the left channel and the right channel, respectively, of the stereo 2ch. L, R, C, LFE, Ls, and Rs are the acoustic signals of the front left channel, the front right channel, the front center channel, the low-frequency sound effect channel, the surround left channel, and the surround right channel, respectively, in 5.1ch surround. Indicates. Therefore, each element of the matrix of 2 rows and 6 columns of the 1st term of Formula (1) is equivalent to a downmix coefficient. k represents a coefficient that defines the levels of the surround left channel Ls and the surround right channel Rs. k is, for example, 1 / √2, 1/2, 0. When the metadata is not transmitted along with the acoustic signal, 1 / √2 is used as k in the television receiver.

また、昨今では4K/8K放送などの超高精細度テレビジョン放送において、22.2マルチチャンネル音響などのマルチチャンネル音響システムが導入されている。また、番組制作時において薄型高精細度のディスプレイ等、使用されるディスプレイの画面サイズが大きくなる傾向にある。そのため、映像位置と音像位置とが連動する番組が制作されることがある。   Recently, multi-channel sound systems such as 22.2 multi-channel sound have been introduced in ultra-high-definition television broadcasting such as 4K / 8K broadcasting. In addition, the screen size of a display used, such as a thin high-definition display, tends to increase during program production. Therefore, a program in which the video position and the sound image position are linked may be produced.

International Telecommunication Union,Recommendation ITU−R BS.775−3,“Multichannel stereosphonic sound system with and without accompanying picture”,(08/2012)International Telecommunication Union, Recommendation ITU-R BS. 775-3, “Multichannel stereophonic sound system with and without accompaniment picture”, (08/2012) 一般財団法人 電波産業会,ARIB STD−B32 3.6版,「デジタル放送における映像符号化、音声符号化及び多重化方式」,平成28年3月25日Japan Radio Industry Association, ARIB STD-B32 version 3.6, “Video coding, audio coding and multiplexing methods in digital broadcasting”, March 25, 2016

しかしながら、超高精細映像を視聴する際の視聴距離は、0.75Hから3H程度である。Hは、画面の高さを示す。これらの視聴距離を視野角に換算すると、100度から30度程度となる。この視野角の最大値および最小値は、それぞれステレオ2chや5.1サラウンドなどの所定の前方チャンネルの開き角60度と大きく異なる。他方、放送番組を家庭で視聴する場合における音声の再生環境は、番組制作時とは異なりうる。再生環境の要素として、画面サイズ、音源(スピーカ)数およびそれらの位置が含まれる。番組制作時と画面サイズが大きく異なると、番組視聴時において番組制作時と同じ音響空間を再現すると、映像と音像とのミスマッチが生じる。このミスマッチは、視聴者に対し違和感を与えることがある。また、テレビジョン受信装置には、前方のスピーカ、つまり左チャンネル、中央チャンネルおよび右チャンネルがディスプレイと一体に構成されていることがある。その場合には、前方のチャンネルで再生される音の位置が画面に連動すると、後方などのその他のチャンネルで再生される音とのつながりが悪くなることがある。   However, the viewing distance when viewing ultra-high definition video is about 0.75H to 3H. H indicates the height of the screen. When these viewing distances are converted into viewing angles, they are about 100 degrees to 30 degrees. The maximum value and the minimum value of the viewing angle are greatly different from the opening angle 60 degrees of a predetermined front channel such as stereo 2ch or 5.1 surround. On the other hand, the sound reproduction environment when watching a broadcast program at home can be different from that at the time of program production. Elements of the playback environment include the screen size, the number of sound sources (speakers), and their positions. If the screen size is greatly different from that at the time of program production, when the same acoustic space as at the time of program production is reproduced at the time of program viewing, a mismatch between the video and the sound image occurs. This mismatch may give the viewer a sense of discomfort. In addition, in a television receiver, a front speaker, that is, a left channel, a center channel, and a right channel may be integrated with a display. In that case, if the position of the sound reproduced in the front channel is linked to the screen, the connection with the sound reproduced in other channels such as the rear may be deteriorated.

本発明は上記の点に鑑みてなされたものであり、制作時とは異なる音源配置でのマルチチャンネル音響信号に基づく音響再生において、再生音の空間的印象を再現することができる音響処理装置、音響処理方法およびプログラムを提供することを目的とする。   The present invention has been made in view of the above points, and in an acoustic reproduction based on a multi-channel acoustic signal with a sound source arrangement different from that at the time of production, an acoustic processing device capable of reproducing a spatial impression of reproduced sound, An object is to provide a sound processing method and a program.

本発明は上記の課題を解決するためになされたものであり、[1]本発明の一態様は、再生空間の所定の基準点(聴取位置)と音源配置の目標とする2つの目標点の中点を結ぶ直線上に、仮想空間における所定の中心点からの前記2つの目標点の開き角がマルチチャンネル音響信号の制作時における所定の開き角に等しくなる前記中心点の位置と再生空間に対する仮想空間の大きさの割合を定める仮想空間設定部と、前記再生空間に、前記仮想空間における前記制作時の各チャンネルの位置を前記中心点から前記制作時の各チャンネルの方向に射影した位置を仮想音源の位置として前記基準点からの方向を仮想音源方向に定める音源方向決定部と、前記仮想音源方向と前記再生空間に配置される再生音源の前記基準点からの音源方向(再生音源方向)に基づいて前記マルチチャンネル音響信号を前記再生音源への音響信号に変換する音響信号変換部と、を備える音響処理装置である。
[1]の構成によれば、再生環境における音源配置が制作時の音源配置と異なっていても、再生環境において目標点を基準に全てのチャンネル位置を連動して再配置することができる。そのため、個々の音のつながりを保持した制作者が意図した空間的印象が再現される。
The present invention has been made to solve the above-mentioned problems. [1] One aspect of the present invention is that a predetermined reference point (listening position) in a reproduction space and two target points that are targets of sound source arrangement are provided. On the straight line connecting the midpoints, the opening angle of the two target points from the predetermined center point in the virtual space is equal to the predetermined opening angle at the time of producing the multi-channel sound signal, and the position of the center point and the reproduction space A virtual space setting unit for determining a proportion of the size of the virtual space; and a position obtained by projecting the position of each channel during the production in the virtual space from the center point to the direction of each channel during the production in the reproduction space. A sound source direction determining unit that determines a direction from the reference point as a virtual sound source direction as a position of the virtual sound source, and a sound source direction (reproduced sound) from the reference point of the reproduced sound source arranged in the virtual sound source direction and the reproduction space. An acoustic signal conversion section for converting the multi-channel audio signal based on the direction) the acoustic signal to the reproduction sound source, a sound processing apparatus comprising a.
According to the configuration of [1], even if the sound source arrangement in the reproduction environment is different from the sound source arrangement at the time of production, all the channel positions can be relocated in association with the target point in the reproduction environment. As a result, the spatial impression intended by the creator who maintains the connection between the individual sounds is reproduced.

[2]本発明の一態様は、上述の音響処理装置であって、前記音響信号変換部は、前記基準点からの前記仮想音源方向と前記再生音源方向とがなす角度が所定の閾値以下であるとき、前記仮想音源方向に係るチャンネルの音響信号を前記再生音源から出力することを特徴とする。
[2]の構成によれば、前記仮想音源方向に位置するチャンネルの音響信号がその近傍に位置する前記再生音源を用いて再生される。受聴者に対して、仮想音源方向に近接した再生音源の方向に、複数の再生音源を用いる場合よりも再生される音を確実に知覚させることができる。
[2] One aspect of the present invention is the above-described acoustic processing device, wherein the acoustic signal conversion unit is configured such that an angle formed by the virtual sound source direction and the reproduction sound source direction from the reference point is equal to or less than a predetermined threshold. In some cases, an acoustic signal of a channel related to the virtual sound source direction is output from the reproduction sound source.
According to the configuration of [2], the acoustic signal of the channel located in the virtual sound source direction is reproduced using the reproduction sound source located in the vicinity thereof. The listener can surely perceive the reproduced sound in the direction of the reproduced sound source close to the virtual sound source direction, compared to the case where a plurality of reproduced sound sources are used.

[3]本発明の一態様は、上述の音響処理装置であって、前記音響信号変換部は、音響信号が分配されない再生音源が存在するとき、前記再生音源から所定範囲内の仮想音源方向に係るチャンネルの音響信号の少なくとも一部を前記再生音源に出力することを特徴とする。
[3]の構成によれば、複数の仮想音源方向間の間隔が大きい場合において、その間に位置する再生音源からそれぞれの仮想音源方向に係る音が再生される。大きく離れた仮想音源の間にも音が知覚されるために、制作者が意図した方向に音が知覚されない現象が回避される。
[3] One aspect of the present invention is the above-described acoustic processing device, wherein the acoustic signal conversion unit is configured to move in a virtual sound source direction within a predetermined range from the reproduced sound source when there is a reproduced sound source to which no acoustic signal is distributed. At least a part of the sound signal of the channel is output to the reproduction sound source.
According to the configuration of [3], when the interval between the plurality of virtual sound source directions is large, the sound according to each virtual sound source direction is reproduced from the reproduction sound source positioned therebetween. Since sound is perceived between virtual sound sources that are far apart, a phenomenon in which sound is not perceived in the direction intended by the creator is avoided.

[4]本発明の一態様は、上述の音響処理装置であって、前記音源方向決定部は、前記再生音源が3次元空間に分布するとき、前記仮想空間として半径が一定である面を用いることを特徴とする。
[4]の構成によれば、制作時の各チャンネルの音源配置に基づいて仮想音源方向が球面上に設定される。そのため、制作時のマルチチャンネル音響信号の各チャンネルの音源方向が方位角と仰角で表されている場合、仮想空間への音源のマッピングが容易である。また、仮想空間として球面が用いられることで3次元空間内のあらゆる音源方向に配置された音源に適用される。
[4] One aspect of the present invention is the above-described sound processing device, wherein the sound source direction determination unit uses a surface having a constant radius as the virtual space when the reproduced sound source is distributed in a three-dimensional space. It is characterized by that.
According to the configuration of [4], the virtual sound source direction is set on the spherical surface based on the sound source arrangement of each channel at the time of production. Therefore, when the sound source direction of each channel of the multi-channel acoustic signal at the time of production is expressed by an azimuth angle and an elevation angle, the sound source can be easily mapped to the virtual space. In addition, since a spherical surface is used as the virtual space, the present invention is applied to sound sources arranged in all sound source directions in the three-dimensional space.

[5]本発明の一態様は、上述の音響処理装置であって、前記再生音源が3次元空間に分布するとき、前記仮想空間として水平方向の半径が一定である面を用いることを特徴とする。
[5]の構成によれば、制作時の各チャンネルの音源配置に基づいて仮想音源方向が円柱面上に配置される。そのため、制作時のマルチチャンネル音響信号の各チャンネルの音源方向が方位角と高さで表されている場合、仮想空間への音源のマッピングが容易である。また、仮想空間として円柱面が用いられることで、高さがそれぞれ異なる音源について、マッピング処理を行わないため、マッピング処理を容易に行うことができる。
[5] One aspect of the present invention is the acoustic processing apparatus described above, wherein when the reproduced sound source is distributed in a three-dimensional space, a surface having a constant horizontal radius is used as the virtual space. To do.
According to the configuration of [5], the virtual sound source direction is arranged on the cylindrical surface based on the sound source arrangement of each channel at the time of production. Therefore, when the sound source direction of each channel of the multi-channel acoustic signal at the time of production is represented by an azimuth angle and a height, mapping of the sound source to the virtual space is easy. In addition, since the cylindrical surface is used as the virtual space, the mapping process is not performed for the sound sources having different heights, so that the mapping process can be easily performed.

[6]本発明の一態様は、上述の音響処理装置であって、前記音源方向決定部は、前記再生音源が3次元空間に分布するとき、前記仮想空間として立方体の面を用いることを特徴とする。
[6]の構成によれば、制作時の各チャンネルの音源配置に基づいて仮想音源方向が立方体の面上に配置される。そのため、制作時のマルチチャンネル音響信号の各チャンネルの音源方向が直交座標系で表されている場合、仮想空間への音源のマッピングが容易である。また、仮想空間として立方体の面が用いられることで、制作時および再生環境における音源配置の設定が容易になる。
[6] One aspect of the present invention is the above-described sound processing device, wherein the sound source direction determining unit uses a cubic surface as the virtual space when the reproduced sound source is distributed in a three-dimensional space. And
According to the configuration of [6], the virtual sound source direction is arranged on the cube surface based on the sound source arrangement of each channel at the time of production. Therefore, when the sound source direction of each channel of the multi-channel acoustic signal at the time of production is represented by an orthogonal coordinate system, mapping of the sound source to the virtual space is easy. In addition, the use of a cubic surface as the virtual space facilitates the setting of the sound source arrangement during production and in the playback environment.

[7]本発明の一態様は、上述の音響処理装置であって、前記音源方向決定部は、前記制作時のチャンネル毎の音源方向が3次元空間に分布するとき、当該音源方向の水平面内の方位角と水平面からの仰角もしくは高さとを独立に処理する。
[7]の構成によれば、制作時の各チャンネルから変換される仮想音源方向として方位角の成分と仰角もしくは高さの成分とが独立に得られる。そのため、方位角の成分と仰角もしくは高さの成分とで、変換の要否または変換の度合いが調整可能になる。
[7] One aspect of the present invention is the above-described sound processing device, wherein the sound source direction determination unit is configured so that a sound source direction for each channel at the time of production is distributed in a three-dimensional space in a horizontal plane of the sound source direction. The azimuth angle and the elevation angle or height from the horizontal plane are processed independently.
According to the configuration of [7], an azimuth component and an elevation angle or height component can be independently obtained as the virtual sound source direction converted from each channel at the time of production. Therefore, the necessity of conversion or the degree of conversion can be adjusted by the azimuth angle component and the elevation angle or height component.

[8]本発明の一態様は、音響処理装置における音響処理方法であって、再生空間の所定の基準点と音源配置の目標とする2つの目標点の中点を結ぶ直線上に、仮想空間における所定の中心点からの2つの目標点の開き角がマルチチャンネル音響信号の制作時における所定の開き角に等しくなる前記中心点の位置と再生空間に対する仮想空間の大きさの割合を定める仮想空間設定過程と、前記再生空間に、前記仮想空間における前記制作時の各チャンネルの位置を前記中心点から前記制作時の各チャンネルの方向に射影した位置を仮想音源の位置として前記基準点からの方向を仮想音源方向として定める音源方向決定過程と、前記仮想音源方向と前記再生空間に配置される再生音源の前記基準点からの音源方向(再生音源方向)に基づいて前記マルチチャンネル音響信号を前記再生音源への音響信号に変換する音響信号変換過程と、を有する音響処理方法である。
[8]の構成によれば、再生環境における音源配置が制作時の音源配置と異なっていても、再生環境において目標点を基準に全てのチャンネル位置を連動して再配置することができる。そのため、個々の音のつながりを保持した制作者が意図した空間的印象が再現される。
[8] One aspect of the present invention is a sound processing method in a sound processing apparatus, in a virtual space on a straight line connecting a predetermined reference point in a reproduction space and a midpoint between two target points targeted for sound source placement. A virtual space that defines the position of the center point at which the opening angle of two target points from a predetermined center point in the video signal is equal to the predetermined opening angle at the time of producing a multi-channel sound signal and the ratio of the size of the virtual space to the reproduction space The setting process and the direction from the reference point with the position of each channel in the virtual space being projected from the center point to the direction of each channel in the production as the position of the virtual sound source in the reproduction space Based on the sound source direction determination process for determining the sound source direction as a virtual sound source direction, and the sound source direction from the reference point of the reproduction sound source arranged in the reproduction space and the reproduction sound source direction (reproduction sound source direction) An acoustic signal conversion step of converting the multichannel audio signal into an acoustic signal to the reproduction sound source, a sound processing method comprising the.
According to the configuration of [8], even if the sound source arrangement in the reproduction environment is different from the sound source arrangement at the time of production, all the channel positions can be rearranged in conjunction with the target point in the reproduction environment. As a result, the spatial impression intended by the creator who maintains the connection between the individual sounds is reproduced.

[9]本発明の一態様は、コンピュータに、再生空間の所定の基準点(聴取位置)と音源配置の目標とする2つの目標点の中点を結ぶ直線上に、仮想空間における所定の中心点からの前記2つの目標点の開き角がマルチチャンネル音響信号の制作時における所定の開き角に等しくなる前記中心点の位置と再生空間に対する仮想空間の大きさの割合を定める仮想空間設定部と、前記再生空間に、前記仮想空間における前記制作時の各チャンネルの位置を前記中心点から前記制作時の各チャンネルの方向に射影した位置を仮想音源の位置として前記基準点からの方向を仮想音源方向として定める音源方向決定部と、前記仮想音源方向と前記再生空間に配置される再生音源の前記基準点からの音源方向(再生音源方向)に基づいて前記マルチチャンネル音響信号を前記再生音源への音響信号に変換する音響信号変換部と、を備える音響処理装置として機能させるためのプログラムである。
[9]の構成によれば、再生環境における音源配置が制作時の音源配置と異なっていても、再生環境において目標点を基準に全てのチャンネル位置を連動して再配置することができる。そのため、個々の音のつながりを保持した制作者が意図した空間的印象が再現される。
[9] According to one aspect of the present invention, a computer has a predetermined center in a virtual space on a straight line connecting a predetermined reference point (listening position) in a reproduction space and a midpoint between two target points targeted for sound source arrangement. A virtual space setting unit for determining a position of the center point at which an opening angle of the two target points from a point is equal to a predetermined opening angle at the time of producing a multi-channel sound signal and a ratio of the size of the virtual space to the reproduction space; In the reproduction space, the position of each channel at the time of production in the virtual space is projected from the center point to the direction of each channel at the time of production as the position of the virtual sound source, and the direction from the reference point is the virtual sound source. A sound source direction determination unit defined as a direction, and the multi-channel based on the virtual sound source direction and the sound source direction (reproduction sound source direction) from the reference point of the reproduction sound source arranged in the reproduction space. An acoustic signal conversion section for converting Le acoustic signal into an acoustic signal to the playback sound is a program to function as the sound processing apparatus comprising a.
According to the configuration of [9], even if the sound source arrangement in the reproduction environment is different from the sound source arrangement at the time of production, all the channel positions can be rearranged in association with the target point in the reproduction environment. As a result, the spatial impression intended by the creator who maintains the connection between the individual sounds is reproduced.

本発明によれば、制作時とは異なる音源配置でのマルチチャンネル音響信号に基づく音響再生において、制作時の空間的印象をなるべく保持したまま、音のつながりがよい再生音で再生することができる。   According to the present invention, in sound reproduction based on a multi-channel sound signal with a sound source arrangement different from that at the time of production, it is possible to reproduce the reproduced sound with a good sound connection while maintaining the spatial impression at the time of production as much as possible. .

本発明の実施形態に係る音響処理装置の構成を示す概略ブロック図である。It is a schematic block diagram which shows the structure of the sound processing apparatus which concerns on embodiment of this invention. 本発明の実施形態に係る仮想空間サイズ算出処理の一例を示す説明図である。It is explanatory drawing which shows an example of the virtual space size calculation process which concerns on embodiment of this invention. 本発明の実施形態に係る仮想音響空間マッピング処理の説明図である。It is explanatory drawing of the virtual acoustic space mapping process which concerns on embodiment of this invention. 本発明の実施形態に係る音響処理の一例を示すフローチャートである。It is a flowchart which shows an example of the acoustic process which concerns on embodiment of this invention. 本発明の実施形態に係る仮想空間サイズ算出処理の各例を示す説明図である。It is explanatory drawing which shows each example of the virtual space size calculation process which concerns on embodiment of this invention. 本発明の実施形態に係る仮想音源方向の一算出例を示す図である。It is a figure which shows the example of 1 calculation of the virtual sound source direction which concerns on embodiment of this invention. 本発明の実施形態に係る仮想音源方向の一算出例を示す図である。It is a figure which shows the example of 1 calculation of the virtual sound source direction which concerns on embodiment of this invention. 本発明の実施形態に係る仮想音源方向の一算出例を示す図である。It is a figure which shows the example of 1 calculation of the virtual sound source direction which concerns on embodiment of this invention. 本発明の実施形態に係る仮想音源方向の一算出例を示す図である。It is a figure which shows the example of 1 calculation of the virtual sound source direction which concerns on embodiment of this invention.

以下、図面を参照しながら本発明の実施形態について説明する。
図1は、本実施形態に係る音響処理装置1の構成例を示すブロック図である。
音響処理装置1は、再生環境を構成する画面サイズ、再生音源の数ならびに配置に応じて、入力される音響信号を変換する。音響処理装置1は、各種の放送受信機、パッケージメディアの再生装置などに組み込まれてもよい。放送受信機は、例えば、テレビジョン受信機である。再生装置は、例えば、ホームシアターセットである。音響信号の変換に際して、音響信号のチャンネル数が制作時のN個から再生時のM個に変換される。N、Mは、それぞれ2以上の整数である。但し、MとNが互いに等しくてもよいし、MとNが異なっていてもよい。通例、Mは、Nよりも少ない。また、音響信号の制作時における音源配置は、再生時における音源配置とは異なる。以下の説明では、主に変換前後でチャンネル数が変更され、制作時の音源配置と再生時の音源配置とが異なる場合を例にする。
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram illustrating a configuration example of a sound processing apparatus 1 according to the present embodiment.
The sound processing device 1 converts an input sound signal according to the screen size constituting the reproduction environment, the number and arrangement of reproduction sound sources. The sound processing device 1 may be incorporated in various broadcast receivers, package media playback devices, and the like. The broadcast receiver is, for example, a television receiver. The playback device is, for example, a home theater set. When converting the acoustic signal, the number of channels of the acoustic signal is converted from N at the time of production to M at the time of reproduction. N and M are each an integer of 2 or more. However, M and N may be equal to each other, or M and N may be different. Typically, M is less than N. Further, the sound source arrangement at the time of production of the acoustic signal is different from the sound source arrangement at the time of reproduction. In the following description, an example will be given in which the number of channels is mainly changed before and after conversion, and the sound source arrangement at the time of production is different from the sound source arrangement at the time of reproduction.

音響処理装置1は、データ入力部11、仮想空間サイズ算出部12、仮想音響空間マッピング部13および音響信号変換部14を含んで構成される。
データ入力部11には、変換前のマルチチャンネル音響信号110、マルチチャンネル音源配置情報111および視野角情報112が入力される。マルチチャンネル音響信号110は、Nチャンネルの音響信号から構成される。マルチチャンネル音源配置情報111は、マルチチャンネル音響信号110の制作時に用いられた各チャンネルの音源配置、つまり各チャンネルの音源の所定の基準点からの方向を示す情報である。マルチチャンネル音源配置情報111には、各チャンネルの音源方向の他、距離の情報が含まれてもよいし、その方向または位置は、いかなる座標系で表されてもよい。視野角情報112は、マルチチャンネル音響信号110の制作時における指標となる聴取位置からの所定の開き角に関する情報である。所定の開き角として、制作時において聴取位置からの画像表示部(図示せず)の画面の左右両端、もしくは前方の主要な左右のスピーカのなす角である開き角が用いられ、画像として表示されるオブジェクトの表示位置の方向に音が知覚されるようにマルチチャンネル音響信号110が制作されることがある。オブジェクトは、例えば、人物、動物、その他、音を生じることが期待される被写体の像である。以下の説明では、この開き角を視野角と呼ぶ。
The acoustic processing device 1 includes a data input unit 11, a virtual space size calculation unit 12, a virtual acoustic space mapping unit 13, and an acoustic signal conversion unit 14.
The data input unit 11 receives a multi-channel acoustic signal 110 before conversion, multi-channel sound source arrangement information 111 and viewing angle information 112. The multi-channel acoustic signal 110 is composed of N-channel acoustic signals. The multi-channel sound source arrangement information 111 is information indicating the sound source arrangement of each channel used when the multi-channel sound signal 110 is produced, that is, the direction from the predetermined reference point of the sound source of each channel. The multi-channel sound source arrangement information 111 may include distance information in addition to the sound source direction of each channel, and the direction or position may be expressed in any coordinate system. The viewing angle information 112 is information relating to a predetermined opening angle from the listening position that serves as an index when the multi-channel acoustic signal 110 is produced. As the predetermined opening angle, the opening angle that is the angle formed by the left and right ends of the screen of the image display unit (not shown) from the listening position at the time of production or the main left and right speakers in front is used and displayed as an image. The multi-channel acoustic signal 110 may be produced so that sound is perceived in the direction of the display position of the object. The object is, for example, an image of a person, an animal, or other subject that is expected to generate sound. In the following description, this opening angle is called a viewing angle.

マルチチャンネル音源配置情報111が示す各チャンネルの音源位置は、後述するようにチャンネル数、聴取位置、画面の位置、大きさに応じて定められている。例えば、画面、各チャンネルの音源方向、聴取位置の配置として、非特許文献1に記載の配置が用いられることがある。視聴距離は、聴取位置と画面中心との距離に相当する。この聴取位置が仮想空間上の中心点、再生空間上の基準点に相当する。ここで、画面中心が音源分布の基準となる設定点とする。この設定点は、視野角を等分する方向、つまり2つの目標点の中点の方向に設定される。以下の説明では、基準点から設定点の方向、設定点から基準の方向を、それぞれ前方、後方と呼ぶ。また、基準点と設定点の線分から左回りの方向、右回りの方向を、それぞれ左方、右方と呼ぶ。設定点もしくはその位置を画面中央と呼ぶ。制作時に用いられる音源の個数は、N個であり、音響処理装置1に入力されるマルチチャンネル音響信号110のチャンネル数に相当する。
データ入力部11は、マルチチャンネル音響信号110、マルチチャンネル音源配置情報111および視野角情報112を、それぞれ音響信号変換部14、仮想音響空間マッピング部13および仮想空間サイズ算出部12に出力する。
The sound source position of each channel indicated by the multi-channel sound source arrangement information 111 is determined according to the number of channels, the listening position, the screen position, and the size, as will be described later. For example, the arrangement described in Non-Patent Document 1 may be used as the arrangement of the screen, the sound source direction of each channel, and the listening position. The viewing distance corresponds to the distance between the listening position and the screen center. This listening position corresponds to the center point in the virtual space and the reference point in the reproduction space. Here, the center of the screen is set as a reference point for the sound source distribution. This set point is set in the direction of equally dividing the viewing angle, that is, in the direction of the midpoint between the two target points. In the following description, the direction from the reference point to the set point and the direction from the set point to the reference point are referred to as the front and rear, respectively. Further, the counterclockwise direction and the clockwise direction from the line segment of the reference point and the set point are referred to as the left direction and the right direction, respectively. The set point or its position is called the center of the screen. The number of sound sources used at the time of production is N, which corresponds to the number of channels of the multichannel sound signal 110 input to the sound processing device 1.
The data input unit 11 outputs the multichannel acoustic signal 110, the multichannel sound source arrangement information 111, and the viewing angle information 112 to the acoustic signal conversion unit 14, the virtual acoustic space mapping unit 13, and the virtual space size calculation unit 12, respectively.

仮想空間サイズ算出部12には、データ入力部11から制作時における視野角情報112が入力され、視野角情報112とは別個に再生環境における視野角情報120が予め設定されている。仮想空間サイズ算出部12は、視野角情報112、120に基づいて仮想空間を設定する。仮想空間サイズ算出部12は、再生空間における2つの目標点の中点もしくは設定点と基準点とを結ぶ直線上に、仮想空間の中心点からの再生空間に配置された2つの目標点の開き角がマルチチャンネル音響信号の制作時の所定の開き角と一致するように、仮想空間の中心点の位置およびサラウンド半径を定める。仮想空間サイズ算出部12は、定めた中心点の位置を示す仮想空間情報を仮想音響空間マッピング部13に出力する。このサラウンド半径が仮想空間サイズに相当する。   Viewing angle information 112 at the time of production is input from the data input unit 11 to the virtual space size calculation unit 12, and viewing angle information 120 in a reproduction environment is set in advance separately from the viewing angle information 112. The virtual space size calculation unit 12 sets a virtual space based on the viewing angle information 112 and 120. The virtual space size calculation unit 12 opens the two target points arranged in the reproduction space from the center point of the virtual space on the straight line connecting the midpoint of the two target points in the reproduction space or the set point and the reference point. The position of the center point of the virtual space and the surround radius are determined so that the angle coincides with a predetermined opening angle at the time of production of the multichannel acoustic signal. The virtual space size calculation unit 12 outputs virtual space information indicating the position of the determined center point to the virtual acoustic space mapping unit 13. This surround radius corresponds to the virtual space size.

視野角情報120は、再生環境における画像表示部の画面の視野角に関する情報である。再生環境における各チャンネルの音源位置は、後述するように、チャンネル数、再生空間のサイズ(サラウンド半径)もしくは基準点と画面との距離、画面の大きさに応じて定められている。視野角情報112、120は、聴取位置からの視野角に限られず、画面のサイズ、アスペクト比および視聴距離など、聴取位置からの開き角を導出することができる情報であればよい。なお、映像を伴わない場合には画像表示部に代えて、主たる音声チャンネルの音源方向間の角度(見開き角)が以下に説明する処理において視野角に代えて用いられてもよい。主たる音声チャンネルは、例えば、ステレオ2chでは左チャンネル、右チャンネルであり、5.1chサラウンドでは前方左チャンネル、前方右チャンネルである。また、主たる音声チャンネルは、22.2chサラウンドでは中層の前方左チャンネル、前方右チャンネルである。   The viewing angle information 120 is information regarding the viewing angle of the screen of the image display unit in the reproduction environment. As will be described later, the sound source position of each channel in the reproduction environment is determined according to the number of channels, the size of the reproduction space (surround radius) or the distance between the reference point and the screen, and the size of the screen. The viewing angle information 112 and 120 is not limited to the viewing angle from the listening position, but may be any information that can derive the opening angle from the listening position such as the screen size, aspect ratio, and viewing distance. In the case where no video is accompanied, instead of the image display unit, an angle between the sound source directions of the main audio channel (a spread angle) may be used instead of the viewing angle in the processing described below. The main audio channels are, for example, a left channel and a right channel in stereo 2ch, and a front left channel and a front right channel in 5.1ch surround. The main audio channels are the middle left front left channel and front right channel in 22.2ch surround.

仮想音響空間マッピング部13には、データ入力部11からマルチチャンネル音源配置情報111が入力され、仮想空間サイズ算出部12から仮想空間情報が入力される。また、仮想音響空間マッピング部13には、再生スピーカ配置情報130が予め設定されている。
再生スピーカ配置情報130は、再生環境における各チャンネルの再生スピーカの位置を示す情報である。再生スピーカの個数はM個であり、音響処理装置1から出力されるマルチチャンネル音響信号140のチャンネル数と等しい。再生スピーカは、所定の基準点(聴取位置)からの所定の半径の再生空間上にそれぞれ異なる方向に配置される。再生スピーカ配置情報130は、例えば、チャンネル毎の再生スピーカの聴取位置からの方向を示す。仮想音響空間マッピング部13は、その再生空間に仮想空間の中心点から制作時の各チャンネルの音源方向と同一の方向に各チャンネルの音源を射影した位置を仮想音源位置として定める。仮想音響空間マッピング部13は、チャンネル毎に定めた仮想音源位置の前記基準点からの方向を仮想音源方向として定める。仮想音響空間マッピング部13は、制作時のチャンネル毎の仮想音源方向と再生スピーカの方向に基づいて変換情報を生成し、生成した変換情報を音響信号変換部14に出力する。
The virtual acoustic space mapping unit 13 receives the multi-channel sound source arrangement information 111 from the data input unit 11 and the virtual space information from the virtual space size calculation unit 12. In the virtual acoustic space mapping unit 13, reproduction speaker arrangement information 130 is set in advance.
The reproduction speaker arrangement information 130 is information indicating the position of the reproduction speaker of each channel in the reproduction environment. The number of reproduction speakers is M, which is equal to the number of channels of the multichannel acoustic signal 140 output from the acoustic processing device 1. The reproduction speakers are arranged in different directions on a reproduction space having a predetermined radius from a predetermined reference point (listening position). The reproduction speaker arrangement information 130 indicates a direction from the listening position of the reproduction speaker for each channel, for example. The virtual acoustic space mapping unit 13 determines a position where the sound source of each channel is projected from the center point of the virtual space in the reproduction space in the same direction as the sound source direction of each channel at the time of production as a virtual sound source position. The virtual acoustic space mapping unit 13 determines the direction from the reference point of the virtual sound source position determined for each channel as the virtual sound source direction. The virtual acoustic space mapping unit 13 generates conversion information based on the virtual sound source direction and reproduction speaker direction for each channel at the time of production, and outputs the generated conversion information to the acoustic signal conversion unit 14.

音響信号変換部14は、仮想音響空間マッピング部13から入力された変換情報を用いて、データ入力部11から入力されたマルチチャンネル音響信号110をマルチチャンネル音響信号140に変換する。具体的には、音響信号変換部14は、マルチチャンネル音響信号110を構成する各チャンネルの音響信号を各列に要素として含む入力ベクトルに、変換情報に基づく変換マトリックスを乗算して出力ベクトルを算出する。音響信号変換部14は、出力ベクトルの各列からマルチチャンネル音響信号140を構成する各チャンネルの音響信号を抽出する。音響信号変換部14は、変換により得られたマルチチャンネル音響信号140を構成する各チャンネルの音響信号を、当該チャンネルに対応する再生スピーカに出力する。   The acoustic signal conversion unit 14 converts the multichannel acoustic signal 110 input from the data input unit 11 into a multichannel acoustic signal 140 using the conversion information input from the virtual acoustic space mapping unit 13. Specifically, the acoustic signal conversion unit 14 calculates an output vector by multiplying an input vector that includes the acoustic signal of each channel constituting the multi-channel acoustic signal 110 as an element in each column by a conversion matrix based on the conversion information. To do. The acoustic signal converter 14 extracts the acoustic signals of the respective channels constituting the multi-channel acoustic signal 140 from each column of the output vectors. The acoustic signal conversion unit 14 outputs the acoustic signal of each channel constituting the multi-channel acoustic signal 140 obtained by the conversion to a reproduction speaker corresponding to the channel.

(仮想空間サイズ算出処理の例)
次に、本実施形態に係る仮想空間サイズ算出処理の一例について説明する。図2は、本実施形態に係る仮想空間サイズ算出処理の一例の説明図である。
仮想空間サイズ算出部12は、視野角情報112に基づいて制作時の画像表示部の画面サイズ211と、聴取位置212と、サラウンド半径213を取得する。図2(A)には、視聴距離をサラウンド半径213とするサラウンドサークル210が示されている。仮想空間サイズ算出部12は、視野角情報120に基づいて再生環境における画像表示部の画面サイズ221と、聴取位置222と、サラウンド半径223を取得する。図2(B)には、視聴距離をサラウンド半径223とするサラウンドサークル220が示されている。サラウンドサークル220は、再生環境において再生スピーカが配置される再生空間の一例である。聴取位置は、再生環境における基準点である。図2に示す例では、音源配置の目標とする2つの目標点を再生環境における画面サイズ221の両端とする。
(Example of virtual space size calculation processing)
Next, an example of the virtual space size calculation process according to the present embodiment will be described. FIG. 2 is an explanatory diagram of an example of a virtual space size calculation process according to the present embodiment.
The virtual space size calculation unit 12 acquires the screen size 211 of the image display unit at the time of production, the listening position 212, and the surround radius 213 based on the viewing angle information 112. FIG. 2A shows a surround circle 210 with a viewing distance as a surround radius 213. The virtual space size calculation unit 12 acquires the screen size 221, the listening position 222, and the surround radius 223 of the image display unit in the reproduction environment based on the viewing angle information 120. FIG. 2B shows a surround circle 220 having a viewing radius as the surround radius 223. The surround circle 220 is an example of a reproduction space in which reproduction speakers are arranged in a reproduction environment. The listening position is a reference point in the reproduction environment. In the example shown in FIG. 2, the two target points that are the targets of the sound source arrangement are the two ends of the screen size 221 in the reproduction environment.

次に、仮想空間サイズ算出部12は、画面の中心を固定した状態で、制作時の聴取位置212と画面211の両端がなす角である所定の開き角と、仮想空間の中心位置232と再生環境の画面221の両端である目標点がなす角とが一致するように、サラウンド半径213をサラウンド半径233まで変化させる。図2(C)には、サラウンド半径233を半径として有するサラウンドサークル230が示されている。サラウンドサークル230は、制作時の音響空間を再生空間に対応させるための仮想空間の一例である。中心位置232は、サラウンドサークル230の中心位置である。ここで、中心位置232と画面221の両端がなす角と、中心位置212と画面211の両端がなす角とが一致し、この画面221の領域が仮想空間上の画面231の領域に相当する。仮想空間サイズ算出部12は、再生環境のサラウンドサークルの中心位置である聴取位置222、そのサラウンド半径223、仮想空間のサラウンドサークルの中心位置232およびそのサラウンド半径233を示す仮想空間情報を仮想音響空間マッピング部13に出力する。   Next, with the center of the screen fixed, the virtual space size calculation unit 12 reproduces a predetermined opening angle that is an angle formed between the listening position 212 at the time of production and both ends of the screen 211, and the center position 232 of the virtual space. The surround radius 213 is changed to the surround radius 233 so that the angles formed by the target points at both ends of the environment screen 221 coincide with each other. FIG. 2C shows a surround circle 230 having a surround radius 233 as a radius. The surround circle 230 is an example of a virtual space for making the acoustic space at the time of production correspond to the reproduction space. The center position 232 is the center position of the surround circle 230. Here, the angle formed by the center position 232 and both ends of the screen 221 matches the angle formed by the center position 212 and both ends of the screen 211, and the area of the screen 221 corresponds to the area of the screen 231 in the virtual space. The virtual space size calculation unit 12 displays virtual space information indicating the listening position 222, which is the center position of the surround circle in the reproduction environment, the surround radius 223, the center position 232 of the surround circle in the virtual space, and the surround radius 233, in the virtual acoustic space. Output to the mapping unit 13.

(仮想音響空間マッピング処理)
次に、本実施形態に係る仮想音響空間マッピング処理の一例について説明する。図3は、本実施形態に係る仮想音響空間マッピング処理の説明図である。
仮想音響空間マッピング部13は、中心位置311からの方向が、マルチチャンネル音源配置情報が示す各チャンネルの音源方向と同一の方向にある仮想空間のサラウンドサークル310上の位置をチャンネル位置312として定める。サラウンドサークル310、中心位置311は、上述のサラウンドサークル230、中心位置232に相当する。仮想音響空間マッピング部13は、中心位置311から各チャンネルのチャンネル位置312を通過する直線と再生環境のサラウンドサークル320の交点を再生環境における仮想音源位置322として定める。サラウンドサークル320は、上述のサラウンドサークル220に相当する。仮想音源位置322は、聴取位置321からの所定の半径となる再生空間に、中心位置311から制作時のチャンネル毎の音源方向と同一の方向に射影される位置に相当する。
(Virtual acoustic space mapping process)
Next, an example of the virtual acoustic space mapping process according to the present embodiment will be described. FIG. 3 is an explanatory diagram of the virtual acoustic space mapping process according to the present embodiment.
The virtual acoustic space mapping unit 13 determines a position on the surround circle 310 in the virtual space in which the direction from the center position 311 is in the same direction as the sound source direction of each channel indicated by the multi-channel sound source arrangement information as the channel position 312. The surround circle 310 and the center position 311 correspond to the surround circle 230 and the center position 232 described above. The virtual acoustic space mapping unit 13 determines an intersection of a straight line passing through the channel position 312 of each channel from the center position 311 and the surround circle 320 of the reproduction environment as a virtual sound source position 322 in the reproduction environment. The surround circle 320 corresponds to the surround circle 220 described above. The virtual sound source position 322 corresponds to a position projected from the center position 311 in the reproduction space having a predetermined radius from the listening position 321 in the same direction as the sound source direction for each channel at the time of production.

サラウンドサークル330上には、予め複数の再生音源(スピーカ)が配置されている。また、以下の説明では、再生音源を実音源と呼ぶこともある。図3に示す再生音源位置332は、複数の再生音源のうち聴取位置331、つまりサラウンドサークル330の中心点から左後方に配置された再生音源の位置である。サラウンドサークル330、聴取位置331は、上述のサラウンドサークル320、聴取位置321に相当する。ここで、仮想音響空間マッピング部13は、再生環境における仮想音源位置の方向と各チャンネルの再生音源の方向との関係に基づいて、制作時の各チャンネルのマルチチャンネル音響信号110を各再生音源に分配するための分配係数を算出する。以下の説明では、仮想音源位置322の方向、各チャンネルの再生音源の方向を、それぞれ仮想チャンネル方向、実音源(スピーカ)方向と呼ぶことがある。音響信号変換部14は、制作時の各チャンネルを各列に、再生環境における各チャンネルを各行に、算出した分配係数を配置して変換マトリックスを構成する。   A plurality of reproduction sound sources (speakers) are arranged in advance on the surround circle 330. In the following description, the playback sound source may be referred to as a real sound source. A reproduction sound source position 332 shown in FIG. 3 is a listening position 331 among a plurality of reproduction sound sources, that is, a position of a reproduction sound source arranged on the left rear side from the center point of the surround circle 330. The surround circle 330 and the listening position 331 correspond to the surround circle 320 and the listening position 321 described above. Here, based on the relationship between the direction of the virtual sound source position in the playback environment and the direction of the playback sound source of each channel, the virtual acoustic space mapping unit 13 uses the multi-channel acoustic signal 110 of each channel at the time of production as each playback sound source. A distribution coefficient for distribution is calculated. In the following description, the direction of the virtual sound source position 322 and the direction of the playback sound source of each channel may be referred to as a virtual channel direction and a real sound source (speaker) direction, respectively. The acoustic signal conversion unit 14 configures a conversion matrix by arranging each channel at the time of production in each column, each channel in the reproduction environment in each row, and the calculated distribution coefficient.

音響信号変換部14は、分配係数を算出する際、仮想音源方向を挟む複数の実音源方向の各チャンネルへの分配係数を算出する手法であれば、例えば、Tan則、Sin則、VBAP法など、いずれの手法を用いてもよい。また、仮想音源方向からの角度が、所定の角度の閾値以下となる方向に実音源が存在する場合がある。その場合、音響信号変換部14は、その仮想音源方向に係るチャンネルからその実音源に係るチャンネルへの分配係数を1とし、その他のチャンネルへの分配係数を0としてもよい。その場合には、実音源は、仮想音源方向に係るチャンネルに基づく音をそのまま再生するので、受聴者は、その再生音源の方向に確実に音の方向を知覚することができる。また、仮想音源方向を挟む各実音源方向への角度の差が、所定の差の閾値よりも少ない場合には、音響信号変換部14は、その仮想音源方向に係るチャンネルから各実音源方向に対応するチャンネルの分配係数を互いに等しくしてもよい。その場合には、各実音源から再生される音の音圧レベルが等しくなる。   If the acoustic signal conversion unit 14 calculates a distribution coefficient, a method of calculating a distribution coefficient to each channel in a plurality of real sound source directions sandwiching the virtual sound source direction, for example, Tan law, Sin law, VBAP method, etc. Any method may be used. In some cases, the actual sound source exists in a direction in which the angle from the virtual sound source direction is equal to or less than a predetermined angle threshold. In this case, the acoustic signal conversion unit 14 may set the distribution coefficient from the channel related to the virtual sound source direction to the channel related to the real sound source to 1, and set the distribution coefficient to other channels to 0. In that case, since the real sound source reproduces the sound based on the channel related to the virtual sound source direction as it is, the listener can surely perceive the direction of the sound in the direction of the reproduced sound source. When the difference in angle to each real sound source direction across the virtual sound source direction is smaller than a predetermined difference threshold, the acoustic signal conversion unit 14 moves from the channel related to the virtual sound source direction to each real sound source direction. Corresponding channel distribution coefficients may be equal to each other. In that case, the sound pressure level of the sound reproduced from each real sound source becomes equal.

また、音響信号変換部14が構成する変換マトリックスにおいて、出力チャンネルの行の分配係数が0となることがある。このことは、そのチャンネルに音響信号が分配されないことを意味する。そこで、音響信号変換部14は、そのチャンネルの音源方向から所定の範囲内の仮想音源方向に係る音響信号について、そのチャンネルへの分配係数を0よりも有意に大きい値に定める。これにより、音響信号変換部14は、そのチャンネルの実音源に、その仮想音源方向に係る音響信号を出力する。そのため、受聴者は仮想音源方向に近接した実音源の方向に再生される音を確実に知覚することができる。   Further, in the conversion matrix formed by the acoustic signal conversion unit 14, the distribution coefficient of the row of the output channel may become zero. This means that no acoustic signal is distributed to that channel. Therefore, the acoustic signal conversion unit 14 sets a distribution coefficient to the channel to a value significantly larger than 0 for the acoustic signal related to the virtual sound source direction within a predetermined range from the sound source direction of the channel. Thereby, the acoustic signal converter 14 outputs an acoustic signal related to the virtual sound source direction to the real sound source of the channel. Therefore, the listener can surely perceive the sound reproduced in the direction of the real sound source close to the virtual sound source direction.

(音響処理)
次に、本実施形態に係る音響処理について説明する。図4は、本実施形態に係る音響処理の一例を示すフローチャートである。
(ステップS101)仮想空間サイズ算出部12は、データ入力部11から入力される制作時の視野角情報112が示す視野角と予め設定された再生環境における視野角情報120が示す視野角の差異に基づいて仮想空間サイズとして仮想サラウンド半径を算出する。その後、ステップS102の処理に進む。
(ステップS102)仮想音響空間マッピング部13は、仮想サラウンドサークル上のデータ入力部11から入力されるマルチチャンネル音源配置情報111が示すチャンネル毎の音源方向の位置を仮想音源位置として設定する。その後、ステップS103の処理に進む。
(Sound processing)
Next, acoustic processing according to the present embodiment will be described. FIG. 4 is a flowchart illustrating an example of acoustic processing according to the present embodiment.
(Step S101) The virtual space size calculation unit 12 determines the difference between the viewing angle indicated by the viewing angle information 112 at the time of production input from the data input unit 11 and the viewing angle indicated by the viewing angle information 120 in a preset reproduction environment. Based on this, the virtual surround radius is calculated as the virtual space size. Thereafter, the process proceeds to step S102.
(Step S102) The virtual acoustic space mapping unit 13 sets the position in the sound source direction for each channel indicated by the multi-channel sound source arrangement information 111 input from the data input unit 11 on the virtual surround circle as the virtual sound source position. Thereafter, the process proceeds to step S103.

(ステップS103)音響信号変換部14は、聴取位置からの仮想音源位置の方向である仮想音源方向と、予め設定された再生スピーカ配置情報が示す各チャンネルの再生スピーカの方向に基づいて分配係数を要素として有する変換マトリックスを算出する。その後、ステップS104の処理に進む。
(ステップS104)音響信号変換部14は、データ入力部11から入力されるマルチチャンネル音響信号110に変換マトリックスを作用して再生信号としてマルチチャンネル音響信号140に変換する。音響信号変換部14は、変換により得られたマルチチャンネル音響信号140を構成する各チャンネルの音響信号をそれぞれ対応する再生スピーカに出力する。その後、図4に示す処理を終了する。
(Step S103) The acoustic signal conversion unit 14 calculates a distribution coefficient based on the virtual sound source direction which is the direction of the virtual sound source position from the listening position and the direction of the reproduction speaker of each channel indicated by the reproduction speaker arrangement information set in advance. A transformation matrix having as elements is calculated. Thereafter, the process proceeds to step S104.
(Step S <b> 104) The acoustic signal conversion unit 14 applies a conversion matrix to the multichannel acoustic signal 110 input from the data input unit 11 to convert it into a multichannel acoustic signal 140 as a reproduction signal. The acoustic signal converter 14 outputs the acoustic signals of the respective channels constituting the multi-channel acoustic signal 140 obtained by the conversion to the corresponding reproduction speakers. Thereafter, the process shown in FIG.

(仮想空間サイズ算出処理の変形例)
上述した仮想空間サイズ算出処理では、仮想空間サイズ算出部12は、図5(C)に示すように番組制作時の画面中心を固定した状態で、制作時の画面501aのサイズが再生環境の画面502aのサイズと一致するようにサラウンド半径503を算出する。以下の説明では、この例を例1と呼ぶ。例1では、画面501aのサイズの指標として、中心位置501bからの画面中心までの距離に対する画面の水平方向の幅の比が用いられ、再生環境の画面502aのサイズの指標として、中心位置502bからの画面中心までの距離に対する画面の水平方向の幅の比が用いられる(図5(A)、(B))。なお、図5(C)−(G)に示す太い矢印は、音源配置の目標となる2つの目標点のうち左方の目標点を示す。図5(C)に示す太い矢印は、左方の目標点として画面502aの左端が用いられることを示す。
(Variation of virtual space size calculation process)
In the virtual space size calculation processing described above, the virtual space size calculation unit 12 fixes the screen center at the time of program production as shown in FIG. 5C, and the size of the screen 501a at the time of production is the screen of the playback environment. The surround radius 503 is calculated so as to match the size of 502a. In the following description, this example is referred to as Example 1. In Example 1, the ratio of the horizontal width of the screen to the distance from the center position 501b to the screen center is used as an index of the size of the screen 501a. From the center position 502b as an index of the size of the screen 502a in the reproduction environment The ratio of the horizontal width of the screen to the distance to the screen center is used (FIGS. 5A and 5B). In addition, the thick arrow shown to FIG.5 (C)-(G) shows the left target point among the two target points used as the target of sound source arrangement | positioning. A thick arrow shown in FIG. 5C indicates that the left end of the screen 502a is used as the left target point.

仮想空間サイズ算出部12は、例2−例5に示すようにサラウンド半径を算出してもよい。例2では、仮想空間サイズ算出部12は、再生環境における中心位置502bと画面の左右両端それぞれの間との線分とサラウンドサークル502cとの交点504、505を2つの目標点に定める(図5(B))。そして、仮想空間サイズ算出部12は、図5(A)に示す中心位置501bからの視野角と中心位置501bからの目標点504、505のなす角とが一致するように、中心位置501bから画面中心までの距離をサラウンド半径503として算出する(図5(D))。図5(D)に示す太い矢印は、左方の目標点として交点504が用いられることを示す。   The virtual space size calculation unit 12 may calculate the surround radius as shown in Example 2 to Example 5. In Example 2, the virtual space size calculation unit 12 determines the intersections 504 and 505 of the line segment between the center position 502b in the reproduction environment and the left and right ends of the screen and the surround circle 502c as two target points (FIG. 5). (B)). Then, the virtual space size calculation unit 12 displays the screen from the center position 501b so that the viewing angle from the center position 501b shown in FIG. 5A matches the angle formed by the target points 504 and 505 from the center position 501b. The distance to the center is calculated as the surround radius 503 (FIG. 5D). The thick arrow shown in FIG. 5D indicates that the intersection 504 is used as the left target point.

例1、例2では、画面中心がサラウンドサークル501c、502cそれぞれの1点で接している場合を例にしたが、例3−例5に示すように、画面の左右両端がサラウンドサークル501c、502c上に設置されていてもよい。例3では、仮想空間サイズ算出部12は、サラウンドサークル502c上の画面502aの交点506と交点507を目標点とし、中心点501bと目標点とのなす角と、中心点501bと画面501aの左右両端のなす角とが一致するように中心点501bを算出する。つまり、サラウンドサークル501c上の画面501aの左右両端とサラウンドサークル502c上の画面502aの左右両端が、それぞれ交点506、507において交わるサラウンドサークル501cを求める(図5(E))。仮想空間サイズ算出部12は、サラウンドサークル501cの半径として、中心位置501bから交点506または交点507までの距離を算出する。図5(E)に示す太い矢印は、左方の目標点として交点506が用いられることを示す。   In Example 1 and Example 2, the case where the center of the screen is in contact with one point of each of the surround circles 501c and 502c is taken as an example, but as shown in Example 3 to Example 5, the left and right ends of the screen are surround circles 501c and 502c. It may be installed on the top. In Example 3, the virtual space size calculation unit 12 sets the intersection point 506 and the intersection point 507 of the screen 502a on the surround circle 502c as target points, the angle between the center point 501b and the target point, and the left and right sides of the center point 501b and the screen 501a. The center point 501b is calculated so that the angles formed by both ends coincide. That is, a surround circle 501c is obtained in which the left and right ends of the screen 501a on the surround circle 501c and the left and right ends of the screen 502a on the surround circle 502c intersect at intersections 506 and 507, respectively (FIG. 5E). The virtual space size calculation unit 12 calculates the distance from the center position 501b to the intersection point 506 or the intersection point 507 as the radius of the surround circle 501c. A thick arrow shown in FIG. 5E indicates that the intersection 506 is used as the left target point.

例4では、仮想空間サイズ算出部12は、図5(A)に示すサラウンドサークル501cと基準位置502bと画面502aの左右両端とを結ぶ直線とが交差する点509と点510を目標点とし、中心位置501bと目標点509、510のなす角が中心位置501bからの画面501aの視野角と一致するサラウンドサークル501cを求める(図5(F))。この条件では、中心位置502bから画面502aの左端、右端それぞれとの間の線分とサラウンドサークル501cが交点509、510において画面501aの左端、右端と交わる。仮想空間サイズ算出部12は、図5(F)における中心位置501bから目標点である画面501aの左右両端までの距離をサラウンド半径として算出する。図5(F)に示す太い矢印は、左方の目標点として交点509が用いられることを示す。   In Example 4, the virtual space size calculation unit 12 uses the points 509 and 510 where the surround circle 501c and the straight line connecting the reference position 502b and the left and right ends of the screen 502a intersect as shown in FIG. A surround circle 501c in which the angle formed by the center position 501b and the target points 509 and 510 matches the viewing angle of the screen 501a from the center position 501b is obtained (FIG. 5F). Under this condition, a line segment between the center position 502b and the left and right edges of the screen 502a and the surround circle 501c intersect the left and right edges of the screen 501a at intersections 509 and 510, respectively. The virtual space size calculation unit 12 calculates the distance from the center position 501b in FIG. 5F to the left and right ends of the screen 501a, which is the target point, as the surround radius. A thick arrow shown in FIG. 5F indicates that the intersection 509 is used as the left target point.

例5では、仮想空間サイズ算出部12は、図5(A)に示す中心位置501bからの画面501aの視野角と、図5(G)に示す中心位置501bからの画面502aの視野角とが等しく、かつ、サラウンドサークル501cとサラウンドサークル502cとが、それぞれの画面501aと画面502aの左右両端で区分される弧の中点511で接するサラウンドサークル501cを求める(図5(G))。この例では、図5(G)に示す画面502aの左端、右端である点512、513を目標点として、中心位置501bと点512、513がなす角の角度が、図5(A)に示す中心位置501bからの画面501aの視野角に相当する。仮想空間サイズ算出部12は、図5(G)における中心位置501bから画面501aの両端までの距離をサラウンド半径として算出する。図5(G)に示す太い矢印は、左方の目標点として点512が用いられることを示す。   In Example 5, the virtual space size calculation unit 12 has a viewing angle of the screen 501a from the center position 501b shown in FIG. 5A and a viewing angle of the screen 502a from the center position 501b shown in FIG. A surround circle 501c that is equal and surrounds the screen 501a and the surround circle 502c at the midpoint 511 of the arc divided at both the left and right ends of the screen 501a is obtained (FIG. 5G). In this example, with the points 512 and 513 at the left and right ends of the screen 502a shown in FIG. 5G as target points, the angle formed by the center position 501b and the points 512 and 513 is shown in FIG. This corresponds to the viewing angle of the screen 501a from the center position 501b. The virtual space size calculation unit 12 calculates the distance from the center position 501b to both ends of the screen 501a in FIG. 5G as the surround radius. The thick arrow shown in FIG. 5G indicates that the point 512 is used as the left target point.

例2、例3、例5では、再生環境における基準点502bからの画面502aの視野角と、基準点502bからサラウンドサークル502c上にある各目標点のなす角が等しいことを条件としている。他方、マルチチャンネル音響信号のスタジオ規格である勧告ITU−R BS.775、勧告ITU−R BS.2051、ARIB STD−B59などでは、画面の両端に配置するスピーカ位置を所定の聴取位置を中心とするサラウンドサークル上に設定することを規定している。そのため、例2、例3、例5によれば、例1、例4よりも、これらの規格に基づいて制作された音響信号に基づく再生音の空間的印象が、制作時に制作者がその音響信号に基づく再生音について知覚された音の空間的印象に近くなる。   In Example 2, Example 3, and Example 5, it is a condition that the viewing angle of the screen 502a from the reference point 502b in the reproduction environment is equal to the angle formed by each target point on the surround circle 502c from the reference point 502b. On the other hand, the recommended ITU-R BS. 775, Recommendation ITU-R BS. 2051, ARIB STD-B59, etc. stipulate that the speaker positions placed at both ends of the screen are set on a surround circle centered on a predetermined listening position. Therefore, according to Example 2, Example 3, and Example 5, compared to Examples 1 and 4, the spatial impression of the reproduced sound based on the acoustic signal produced based on these standards is displayed by the producer at the time of production. It approximates the perceived sound spatial impression of the reproduced sound based on the signal.

以下、例1−例5のそれぞれについて、仮想音響空間マッピング部13により与えられる変換前の制作時における各チャンネルの音源方向から変換後の再生環境における仮想音源方向を与えるチャンネル位置座標変換の変換式と、変換前後の音源方向の典型例を示す。
例1によれば、変換後の仮想音源方向θは、式(2)に示す変換式を用いて与えられる。
Hereinafter, for each of Example 1 to Example 5, a channel position coordinate conversion formula that gives the virtual sound source direction in the reproduction environment after conversion from the sound source direction of each channel at the time of production before conversion given by the virtual acoustic space mapping unit 13 A typical example of the sound source direction before and after conversion is shown.
According to Example 1, the converted virtual sound source direction θ is given using the conversion formula shown in Formula (2).

Figure 2017212731
Figure 2017212731

式(2)において、θは、あるチャンネルの変換前、即ち制作時における音源方向を示す。θ、θは、それぞれ正面方向を基準とする左回りの水平面内の方位角である(図6(C))。θは、制作時における画面の左右両端のそれぞれに配置された音源の音源方向、即ち制作時における所定の開き角の1/2の角度を示す(図6(A))。θは、再生環境における画面の左右両端のそれぞれに配置された音源の音源方向、即ち目標点の方向を示す(図6(B))。但し、θ、θは、正面方向を基準とする方位角の絶対値である。制作時、再生環境における画面の視野角は、それぞれ2θ、2θに相当する。rは、再生環境におけるサラウンドサークルの半径、即ち視聴距離を示す。rは、仮想空間におけるサラウンドサークルの半径を示す(図6(C))。式(2)の右式は、中心位置501bからの画面502a(目標点)の視野角が、中心位置501bからの画面501aの視野角(制作時の所定の視野角)と等しいとの条件に基づき、仮想空間におけるサラウンドサークルの半径rが再生環境におけるサラウンドサークルの半径rと角度比で与えられることを示す。式(2)の左式は、仮想空間におけるサラウンドサークルの中心、即ち中心点からの制作時の音源方向θを、再生環境におけるサラウンドサークルの中心、即ち基準点からの仮想音源方向θに変換できることを示す(図6(C))。 In Equation (2), θ t indicates the sound source direction before conversion of a certain channel, that is, at the time of production. theta, the theta t, is the azimuthal angle in the horizontal plane counterclockwise to each reference in the front direction (Fig. 6 (C)). θ 0 indicates the sound source direction of the sound source arranged at each of the left and right ends of the screen at the time of production, that is, an angle that is ½ of a predetermined opening angle at the time of production (FIG. 6A). θ r indicates the sound source direction of the sound source arranged at each of the left and right ends of the screen in the reproduction environment, that is, the direction of the target point (FIG. 6B). However, θ 0 and θ r are absolute values of azimuth angles with respect to the front direction. At the time of production, the viewing angle of the screen in the reproduction environment corresponds to 2θ 0 and 2θ r , respectively. r 0 indicates the radius of the surround circle in the reproduction environment, that is, the viewing distance. r t represents the radius of the surround circle in the virtual space (FIG. 6C). The right expression of Equation (2) is based on the condition that the viewing angle of the screen 502a (target point) from the center position 501b is equal to the viewing angle of the screen 501a from the center position 501b (a predetermined viewing angle at the time of production). Based on this, it is shown that the radius r t of the surround circle in the virtual space is given by the angle ratio with the radius r 0 of the surround circle in the reproduction environment. The left side of Equation (2) converts the center of the surround circle in the virtual space, that is, the sound source direction θ t at the time of production from the center point, to the center of the surround circle in the reproduction environment, that is, the virtual sound source direction θ from the reference point. This shows what can be done (FIG. 6C).

図6(D)は、式(2)に示す変換式を用いて算出される変換後の音源方向を示す表である。図6(D)の各列は、制作時における各チャンネルの音源方向を示し、各行は変換条件を示す。第1行は、画面サイズを一定にして視聴距離を制作時における0.75Hから3.0Hに変更する場合、第2行は、画面サイズを一定にして視聴距離を0.75Hから1.5Hに変更する場合をそれぞれ示す。Hは、画面の垂直方向の高さを示す。アスペクト比は16:9であるので、視聴距離1.5Hにおける視野角は約60度、左側の音源方向が約30度となる。第3行は、視聴距離を一定にして視野角を120度から60度に変更する場合、第4行は、視聴距離を一定にして視野角を90度から60度に変更する場合を示す。   FIG. 6D is a table showing the converted sound source direction calculated using the conversion formula shown in Formula (2). Each column in FIG. 6D indicates the sound source direction of each channel at the time of production, and each row indicates a conversion condition. The first line changes the viewing distance from 0.75H to 3.0H at the time of production while keeping the screen size constant. The second line sets the viewing distance from 0.75H to 1.5H while keeping the screen size constant. The cases of changing to are shown respectively. H indicates the vertical height of the screen. Since the aspect ratio is 16: 9, the viewing angle at a viewing distance of 1.5H is about 60 degrees, and the sound source direction on the left side is about 30 degrees. The third row shows a case where the viewing angle is changed from 120 degrees to 60 degrees with the viewing distance kept constant, and the fourth line shows a case where the viewing angle is changed from 90 degrees to 60 degrees with the viewing distance kept constant.

次に、例2、例5による変換後の仮想音源方向θについて説明する。例2では視聴距離がサラウンドサークルの半径と一致し、例5では視聴距離がサラウンドサークルに余弦成分を乗じたものになる違いがあるが、2つの目標点が再生環境のサラウンドサークル上の同じ位置にあるため、例2、例5のいずれも変換後の仮想音源方向θは、式(3)に示す変換式を用いて与えられる。   Next, the virtual sound source direction θ after conversion according to Example 2 and Example 5 will be described. In Example 2, the viewing distance matches the radius of the surround circle, and in Example 5, the viewing distance is different from the surround circle multiplied by the cosine component, but the two target points are the same position on the surround circle in the playback environment. Therefore, the virtual sound source direction θ after conversion in both Example 2 and Example 5 is given using the conversion formula shown in Formula (3).

Figure 2017212731
Figure 2017212731

式(3)の右式は、半径rから制作時の画面の左右いずれか一端の方向の余弦成分の差分と、その方向の正弦成分に再生環境における画面の左右いずれか一端の方向の余接成分を乗じて得られる値との和が仮想空間におけるサラウンドサークルの半径rであることを示す(図7(A)−(C))。なお、式(3)の左式は、式(2)の左式と同様である。 The right side of equation (3) is the difference between the cosine component in the direction of either the left or right side of the screen from the radius r 0 and the sine component in that direction as the remainder in the direction of the left or right side of the screen in the playback environment. the sum of the values obtained by multiplying the tangential components indicates a radius r t of the surround circles in the virtual space (FIG. 7 (a) - (C) ). Note that the left expression in Expression (3) is the same as the left expression in Expression (2).

図7(D)は、式(3)に示す変換式を用いて算出される変換後の音源方向を示す表である。図7(D)の各行、各列の項目は、図6(D)の各行、各列の項目と同様である。
この変換式では、目標点が再生環境のサラウンドサークル上にあるため、視野角を120度から60度に変換する場合に、変換前の画面両端の角度である60度が30度に変換される。
FIG. 7D is a table showing the converted sound source direction calculated using the conversion formula shown in Formula (3). The items in each row and each column in FIG. 7D are the same as the items in each row and each column in FIG.
In this conversion formula, since the target point is on the surround circle of the playback environment, when the viewing angle is converted from 120 degrees to 60 degrees, 60 degrees that is the angle at both ends of the screen before conversion is converted to 30 degrees. .

次に、例3による変換後の仮想音源方向θについて説明する。例3について変換後の仮想音源方向θは、式(4)に示す変換式を用いて与えられる。   Next, the virtual sound source direction θ after conversion according to Example 3 will be described. The virtual sound source direction θ after conversion for Example 3 is given using the conversion formula shown in Formula (4).

Figure 2017212731
Figure 2017212731

式(4)の右式は、サラウンドサークルの半径rの制作時の画面の左右いずれか一端に相当する正弦成分が、再生環境におけるサラウンドサークルの半径rの画面のその方向の端に相当する正弦成分に等しいことに基づく。式(4)の左式は、仮想空間におけるサラウンドサークルの中心からの制作時の音源方向θを、再生環境におけるサラウンドサークルの中心からの仮想音源方向θに変換できることを示す(図8(C))。
式(4)は、式(3)と一見して表現が異なるが、実質的に式(3)と等価である。従って、図8(D)に示す仮想音源方向は、図7(D)に示す仮想音源方向と同様である。表現の違いは、仮想空間のサラウンドサークルと再生空間のサラウンドサークルとが弧の1点で接するのではなく、目標点の2点で交差することに起因して、式(4)の右式に示すサラウンドサークルの半径rの定義が、式(3)の右式に示す定義とは異なることによる。
Right formula of the formula (4) is sinusoidal components corresponding to the left or right end of the screen when the production of the radius r t of the surround circle, corresponding to the direction of the end of the screen of the radius r 0 of the surround circles in the playback environment Based on being equal to the sine component. The left side of Expression (4) indicates that the sound source direction θ t at the time of production from the center of the surround circle in the virtual space can be converted into the virtual sound source direction θ from the center of the surround circle in the reproduction environment (FIG. 8C )).
Expression (4) differs from Expression (3) at first glance, but is substantially equivalent to Expression (3). Therefore, the virtual sound source direction shown in FIG. 8D is the same as the virtual sound source direction shown in FIG. The difference in expression is that the surround circle in the virtual space and the surround circle in the reproduction space do not touch at one point of the arc but intersect at the two points of the target point, so This is because the definition of the radius r t of the surround circle to be shown is different from the definition shown in the right expression of Expression (3).

次に、例4による変換後の仮想音源方向θについて説明する。例4による変換後の仮想音源方向θは、式(5)に示す変換式を用いて与えられる。   Next, the virtual sound source direction θ after conversion according to Example 4 will be described. The virtual sound source direction θ after conversion according to Example 4 is given using the conversion formula shown in Formula (5).

Figure 2017212731
Figure 2017212731

式(5)の右式は、再生環境における画面の水平方向の両端を仮想空間におけるサラウンドサークル上に投射した点を目標点とし、前記目標点が仮想空間における画面の水平方向の両端に相当することに基づく(図9(C))。仮想空間における画面の水平方向の幅は、サラウンドサークルの半径rの制作時の画面中心から左右いずれか一端の方向の正接成分で与えられる(図9(D))。なお、式(5)の左式は、式(2)、(3)の左式と同様である(図9(A)−(C))。 The right side of the expression (5) is a point where the both ends of the horizontal direction of the screen in the reproduction environment are projected on the surround circle in the virtual space, and the target point corresponds to both ends of the horizontal direction of the screen in the virtual space. Based on that (FIG. 9C). Horizontal width of the screen in the virtual space is given by the direction of the tangential component of the left or right end from the center at the time of production of the radius r t of the surround circle (FIG. 9 (D)). In addition, the left type | formula of Formula (5) is the same as the left type | formula of Formula (2) and (3) (FIG. 9 (A)-(C)).

図9(D)は、式(5)に示す変換式を用いて算出される変換後の音源方向を示す表である。図9(D)の各行、各列の項目は、図6(D)、図7(D)、図8(D)の各行、各列の項目と同様である。但し、図9(D)に示す例では、全体的に仮想音源方向の角度が小さくなる度合いが図8(D)に示す例よりもさらに少ない。
上記の説明では、視野角120度を視野角60度に変換した場合に、変換後の仮想音源方向として10.53度(図6(D))、13.22度(図7(D)、図8(D))、15.52度(図9(D))など正確な数値を算出している場合を例示したが、これには限られない。実装に当たっては、音響信号変換部14は、変換後の仮想音源方向として、11度、13度、16度の1度単位、10度、15度、15度の5度単位など、きりのよい数字に近似した数値を用いてもよい。また、音響信号変換部14は、変換後の仮想音源方向に合わせてチャンネル毎の音源の再生信号レベルを決める場合においても、1dB単位で近似するなど、簡略化した再生信号レベルを用いてもよい。
FIG. 9D is a table showing converted sound source directions calculated using the conversion equation shown in equation (5). The items in each row and each column in FIG. 9D are the same as the items in each row and each column in FIG. 6D, FIG. 7D, and FIG. However, in the example shown in FIG. 9D, the degree to which the angle of the virtual sound source direction becomes smaller as a whole is smaller than that in the example shown in FIG.
In the above description, when a viewing angle of 120 degrees is converted to a viewing angle of 60 degrees, the converted virtual sound source directions are 10.53 degrees (FIG. 6D), 13.22 degrees (FIG. 7D), Although the case where accurate numerical values, such as FIG. 8 (D)) and 15.52 degree | times (FIG. 9 (D)) are calculated was illustrated, it is not restricted to this. In mounting, the acoustic signal conversion unit 14 is a clear number such as a unit of 11 degrees, 13 degrees, and 16 degrees of 1 degree, 10 degrees, 15 degrees, and 5 degrees of 15 degrees as the virtual sound source direction after conversion. A numerical value approximated to may be used. Further, the acoustic signal conversion unit 14 may use a simplified reproduction signal level such as approximation in 1 dB units even when determining the reproduction signal level of the sound source for each channel in accordance with the virtual sound source direction after conversion. .

(その他の変形例)
上記の説明では、マルチチャンネル音源配置情報111が示す制作時における音源配置ならびに再生スピーカ配置情報130が示す再生環境における音源配置として主に1つの2次元の水平面内に各チャンネルのスピーカが配置される場合を例にした。また、上記の説明では、視野角情報112、120が水平方向の視野角である場合を例にした。しかし、音源配置ならびに視野角はこれには限られない。3次元空間内に各チャンネルのスピーカが分布する音源配置が適用されてもよいし、さらに垂直方向の視野角が適用されてもよい。
(Other variations)
In the above description, the speaker of each channel is arranged mainly in one two-dimensional horizontal plane as the sound source arrangement at the time of production indicated by the multi-channel sound source arrangement information 111 and the sound source arrangement in the reproduction environment indicated by the reproduction speaker arrangement information 130. Take the case as an example. In the above description, the viewing angle information 112 and 120 is a viewing angle in the horizontal direction. However, the sound source arrangement and the viewing angle are not limited to this. A sound source arrangement in which speakers of each channel are distributed in a three-dimensional space may be applied, or a vertical viewing angle may be applied.

例えば、音源配置として22.2chサラウンドのように、中層の他、上層、下層に各チャンネルのスピーカが分布する再生方式に適用されてもよい。上層、下層は、中層とは高さが異なる水平面である。但し、上層や下層に配置されるスピーカの個数は、中層よりも少ないことがある。その場合、仮想空間サイズ算出部12、仮想音響空間マッピング部13は、水平面内の方位角の方向について上記の処理を行い、水平面からの仰角または高さの方向には実行しなくてもよい。   For example, the sound source arrangement may be applied to a reproduction system in which speakers of each channel are distributed in the upper layer and the lower layer in addition to the middle layer as in 22.2ch surround. The upper layer and the lower layer are horizontal surfaces different in height from the middle layer. However, the number of speakers arranged in the upper layer or the lower layer may be smaller than that in the middle layer. In that case, the virtual space size calculation unit 12 and the virtual acoustic space mapping unit 13 may perform the above-described processing for the direction of the azimuth angle in the horizontal plane, and may not execute it for the elevation angle or height direction from the horizontal plane.

そこで、仮想空間サイズ算出部12、仮想音響空間マッピング部13は、仮想空間および再生環境において再生スピーカが配置される再生空間として、2次元平面内の円であるサラウンドサークルに代えて、3次元の立体空間の面を用いる。立体空間の面として、例えば、所定の基準点として聴取位置を中心とする球面、円柱面、立方体面のいずれが用いられてもよい。球面は、聴取位置からの半径が一定である面である。球面は、制作時および再生環境における各チャンネルの音源の配置が方位角と仰角で表されている場合にそのまま適用される。そのため、仮想空間への音源のマッピングが容易になる。また、球面が用いられることで3次元空間内のあらゆる音源方向に配置された音源にも適用される。円柱面は、聴取位置からの水平面内の半径が仰角または高さにかかわらず一定である面である。円柱面は、制作時および再生環境における各チャンネルの音源の配置が方位角と高さで表されている場合にそのまま適用される。そのため、仮想空間への音源のマッピングが容易になる。円柱面が用いられることで、高さがそれぞれ異なる音源について、高さごとの独立な処理が容易になる。例えば、互いに共通の高さの音源または所定の高さの範囲の音源同士で仮想音源方向が算出されてもよい。立方体面は、一つの面が画面と平行であって聴取位置を中心とする立方体の面である。立方体面は、制作時および再生環境における各チャンネルの音源の配置が直交座標系で表されている場合にそのまま適用される。そのため、仮想空間への音源のマッピングが容易になる。また、立方体面が用いられることで、制作者または受聴者による制作時および再生環境における音源配置の設定が容易になる。   Therefore, the virtual space size calculation unit 12 and the virtual acoustic space mapping unit 13 replace the surround circle that is a circle in the two-dimensional plane as a reproduction space in which the reproduction speakers are arranged in the virtual space and the reproduction environment. Use the surface of the three-dimensional space. As the surface of the three-dimensional space, for example, any of a spherical surface, a cylindrical surface, and a cubic surface centered at the listening position may be used as a predetermined reference point. The spherical surface is a surface having a constant radius from the listening position. The spherical surface is applied as it is when the arrangement of the sound source of each channel in production and in the reproduction environment is expressed by an azimuth angle and an elevation angle. This facilitates mapping of the sound source to the virtual space. Moreover, it is applied also to the sound source arrange | positioned in all the sound source directions in three-dimensional space by using a spherical surface. The cylindrical surface is a surface whose radius in the horizontal plane from the listening position is constant regardless of the elevation angle or height. The cylindrical surface is applied as it is when the arrangement of the sound source of each channel in the production and playback environment is expressed by the azimuth and height. This facilitates mapping of the sound source to the virtual space. By using the cylindrical surface, independent processing for each height is facilitated for sound sources having different heights. For example, the virtual sound source direction may be calculated between sound sources having a common height or sound sources having a predetermined height range. The cube plane is a cube plane with one plane parallel to the screen and centered at the listening position. The cube plane is applied as it is when the arrangement of the sound source of each channel in the production environment and the reproduction environment is expressed in an orthogonal coordinate system. This facilitates mapping of the sound source to the virtual space. In addition, the use of the cubic surface facilitates the setting of the sound source arrangement at the time of production by the producer or listener and in the playback environment.

また、上述した実施形態において、視野角情報120と再生スピーカ配置情報130のいずれか一方または両方は、データ入力部11を介して入力されてもよい。また、マルチチャンネル音源配置情報111、視野角情報112、視野角情報120および再生スピーカ配置情報130のいずれか、または任意の組み合わせは、ユーザの操作に応じて生じる操作信号としてデータ入力部11に入力されてもよい。これらの情報が、ユーザの操作により任意に設定可能となる。例えば、操作信号により指示される視野角情報112、120が用いられることで、再生される音の前方の音響空間の広がりがユーザの所望の範囲に制御される。また、操作信号により指示される再生スピーカ配置情報130が用いられることで、実際の再生環境に応じた再生スピーカの配置が指示され、再生される音について制作者が意図した空間的印象をより忠実に再現することができる。   In the above-described embodiment, either one or both of the viewing angle information 120 and the reproduction speaker arrangement information 130 may be input via the data input unit 11. Further, any one or any combination of the multi-channel sound source arrangement information 111, the viewing angle information 112, the viewing angle information 120, and the reproduction speaker arrangement information 130 is input to the data input unit 11 as an operation signal generated according to a user operation. May be. These pieces of information can be arbitrarily set by a user operation. For example, by using the viewing angle information 112 and 120 indicated by the operation signal, the expansion of the acoustic space ahead of the reproduced sound is controlled to a range desired by the user. Further, by using the reproduction speaker arrangement information 130 instructed by the operation signal, the arrangement of the reproduction speakers in accordance with the actual reproduction environment is instructed, and the spatial impression intended by the producer is more faithful to the reproduced sound. Can be reproduced.

また、仮想音響空間マッピング部13は、マルチチャンネル音響信号110のうち音源方向が所定の範囲に含まれる一部のチャンネルにのみ変換マトリックスを生成してもよい。一部のチャンネルは、例えば、音源が前方のチャンネル、音源が中層に配置されている中層のチャンネル、などである。音響信号変換部14は、その一部のチャンネルについて変換マトリックスを用いて変換後の音響信号を生成する。音響信号変換部14は、残りのチャンネルの音響信号を変換後の音響信号として採用する。また、変換マトリックスの生成に係るチャンネルとして、5.1chサラウンドの低域効果音(LFE:Low Frequency Channel)のように音像定位に寄与しないチャンネルは、変換後の音響信号として採用されなくてもよい。   In addition, the virtual acoustic space mapping unit 13 may generate a transformation matrix only for some channels in the multichannel acoustic signal 110 whose sound source direction is included in a predetermined range. Some of the channels are, for example, a channel in which the sound source is in front, a channel in the middle layer in which the sound source is arranged in the middle layer, and the like. The acoustic signal converter 14 generates a converted acoustic signal using a conversion matrix for some of the channels. The acoustic signal conversion unit 14 employs the acoustic signals of the remaining channels as converted acoustic signals. In addition, a channel that does not contribute to sound image localization, such as a 5.1ch surround low-frequency effect sound (LFE), may not be used as a converted acoustic signal as a channel related to the generation of the conversion matrix. .

また、仮想音響空間マッピング部13には、所定の範囲が複数個あり、それぞれの範囲に音源方向が含まれるチャンネルのグループが複数個設定されてもよい。その場合には、仮想音響空間マッピング部13は、複数のグループのそれぞれについて変換マトリックスを生成する。音響信号変換部14は、各グループのチャンネルについて変換マトリックスを用いて変換後の音響信号を生成する。   The virtual acoustic space mapping unit 13 may have a plurality of predetermined ranges, and a plurality of channel groups each including the sound source direction may be set in each range. In that case, the virtual acoustic space mapping unit 13 generates a transformation matrix for each of the plurality of groups. The acoustic signal conversion unit 14 generates a converted acoustic signal using a conversion matrix for each group of channels.

なお、仮想音響空間マッピング部13が算出した仮想音源方向と所定の聴取位置からの再生スピーカの方向との角度が所定の角度の閾値以下である場合がある。その場合、音響信号変換部14は、その仮想音源方向に係るチャンネルの音響信号を、その再生スピーカのチャンネルとして定め、その音響信号を定めたチャンネルの再生スピーカに出力してもよい。角度の閾値は、例えば、3〜10度である。これにより、再生スピーカを用いてそのチャンネルの音響信号に基づく音が再生され、受聴者に対して仮想音源方向に近接したその再生スピーカの方向に再生される音を確実に知覚させることができる。複数の再生スピーカを用いて音を再生する際、合成音像が知覚されずに各々の再生スピーカからの音が知覚されることが回避される。   In some cases, the angle between the virtual sound source direction calculated by the virtual acoustic space mapping unit 13 and the direction of the reproduction speaker from a predetermined listening position is equal to or less than a predetermined angle threshold. In that case, the acoustic signal conversion unit 14 may determine the acoustic signal of the channel related to the virtual sound source direction as the channel of the reproduction speaker, and output the acoustic signal to the reproduction speaker of the determined channel. The angle threshold is, for example, 3 to 10 degrees. Thereby, the sound based on the sound signal of the channel is reproduced using the reproduction speaker, and the listener can surely perceive the sound reproduced in the direction of the reproduction speaker close to the virtual sound source direction. When a sound is reproduced using a plurality of reproduction speakers, it is avoided that the sound from each reproduction speaker is perceived without a synthesized sound image being perceived.

また、仮想音響空間マッピング部13が構成する変換マトリックスによっては、音響信号が分配されない再生スピーカのチャンネルが存在する場合がある。この現象は、仮想音源方向間の角度が再生スピーカ間の角度よりも十分に大きいときに生じ、聴取位置の後方に現われる傾向がある。その場合には、音響信号変換部14は、その再生スピーカから所定の範囲内の仮想音源方向に係るチャンネルの音響信号の全部または一部を、そのチャンネルの再生スピーカに出力してもよい。所定の範囲は、例えば、10〜20度である。これにより、現実の再生スピーカを用いてその音響信号に基づく音が再生されるので、受聴者は仮想音源方向に近接したその再生スピーカの方向に再生される音を確実に知覚することができる。従って、複数の仮想音源方向間の間隔が大きい場合において、それぞれの仮想音源方向に係る再生スピーカにそれぞれ音が知覚されるために、制作者が意図した方向に音像が知覚されない現象が回避される。   Further, depending on the transformation matrix formed by the virtual acoustic space mapping unit 13, there may be a channel of a reproduction speaker to which no acoustic signal is distributed. This phenomenon occurs when the angle between the virtual sound source directions is sufficiently larger than the angle between the playback speakers, and tends to appear behind the listening position. In that case, the acoustic signal converter 14 may output all or part of the acoustic signal of the channel related to the virtual sound source direction within a predetermined range from the reproduction speaker to the reproduction speaker of the channel. The predetermined range is, for example, 10 to 20 degrees. Thereby, since the sound based on the acoustic signal is reproduced using an actual reproduction speaker, the listener can surely perceive the sound reproduced in the direction of the reproduction speaker close to the virtual sound source direction. Therefore, when the interval between a plurality of virtual sound source directions is large, the sound is perceived by the reproduction speaker in each virtual sound source direction, so that the phenomenon that the sound image is not perceived in the direction intended by the creator is avoided. .

以上に説明したように、本実施形態に係る音響処理装置1は、再生空間の所定の基準点と2つの目標点の中点を結ぶ直線上に、仮想空間における所定の中心点からの音源配置の目標とする2つの目標点の開き角がマルチチャンネル音響信号の制作時における所定の開き角に等しくなる中心点の位置と再生空間に対する仮想空間の大きさの割合を定める仮想空間設定部として仮想空間サイズ算出部12を備える。音響処理装置1は、仮想空間の中心点から制作時の各チャンネルの音源方向に各チャンネル位置を再生空間に射影した位置を仮想音源の位置として前記基準点からみた仮想音源の位置を仮想音源方向に定める音源方向決定部として仮想音響空間マッピング部13を備える。また、音響処理装置1は、仮想音源方向と再生空間に配置される再生音源の基準点からの音源方向に基づいてマルチチャンネル音響信号を再生音源への音響信号に変換する音響信号変換部14を備える。   As described above, the sound processing device 1 according to the present embodiment arranges the sound source from the predetermined center point in the virtual space on the straight line connecting the predetermined reference point of the reproduction space and the midpoint of the two target points. As a virtual space setting unit for determining the position of the center point where the opening angle of two target points as the target of the video signal is equal to a predetermined opening angle when producing a multi-channel sound signal and the ratio of the size of the virtual space to the reproduction space A space size calculation unit 12 is provided. The sound processing apparatus 1 uses the position of each channel position projected on the reproduction space from the center point of the virtual space to the sound source direction of each channel at the time of production as the virtual sound source position, and the position of the virtual sound source viewed from the reference point as the virtual sound source direction The virtual sound space mapping unit 13 is provided as a sound source direction determination unit defined in FIG. The acoustic processing device 1 also includes an acoustic signal conversion unit 14 that converts a multi-channel acoustic signal into an acoustic signal for the reproduction sound source based on the virtual sound source direction and the sound source direction from the reference point of the reproduction sound source arranged in the reproduction space. Prepare.

この構成によれば、再生環境における音源配置が制作時の音源配置と異なっていても、再生環境において制作時における各チャンネルの音源方向に受聴者に知覚させる音を再生することができる。そのため、個々のオブジェクトの方向情報を用いずに制作者が意図した空間的印象が再現される。例えば、画面に表示されるそのオブジェクトの方向に連動する音を示すマルチチャンネル音響信号に基づく音が再生されるとき、受聴者はそのオブジェクトの方向に音を知覚することができる。   According to this configuration, even if the sound source arrangement in the reproduction environment is different from the sound source arrangement at the time of production, it is possible to reproduce the sound that the listener perceives in the sound source direction of each channel at the time of production in the reproduction environment. Therefore, the spatial impression intended by the creator is reproduced without using the direction information of each object. For example, when a sound based on a multi-channel sound signal indicating a sound that is linked to the direction of the object displayed on the screen is reproduced, the listener can perceive the sound in the direction of the object.

以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。   As described above, the embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to the above, and various design changes and the like can be made without departing from the scope of the present invention. It is possible to

例えば、上述した音響処理装置1の一部、例えば、仮想空間サイズ算出部12、仮想音響空間マッピング部13および音響信号変換部14をコンピュータで実現するようにしてもよい。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、音響処理装置1に内蔵されたコンピュータシステムであって、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
また、上述した実施形態における音響処理装置1の一部、または全部をLSI(Large Scale Integration)等の集積回路として実現してもよい。音響処理装置1の各機能ブロックは個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化してもよい。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現してもよい。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いてもよい。
For example, you may make it implement | achieve a part of acoustic processing apparatus 1 mentioned above, for example, the virtual space size calculation part 12, the virtual acoustic space mapping part 13, and the acoustic signal conversion part 14 with a computer. In that case, the program for realizing the control function may be recorded on a computer-readable recording medium, and the program recorded on the recording medium may be read by the computer system and executed. Here, the “computer system” is a computer system built in the sound processing apparatus 1 and includes hardware such as an OS and peripheral devices. The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Furthermore, the “computer-readable recording medium” is a medium that dynamically holds a program for a short time, such as a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line, In this case, a volatile memory inside a computer system that serves as a server or a client may be included that holds a program for a certain period of time. The program may be a program for realizing a part of the functions described above, and may be a program capable of realizing the functions described above in combination with a program already recorded in a computer system.
Moreover, you may implement | achieve part or all of the sound processing apparatus 1 in embodiment mentioned above as integrated circuits, such as LSI (Large Scale Integration). Each functional block of the sound processing apparatus 1 may be individually made into a processor, or a part or all of them may be integrated into a processor. Further, the method of circuit integration is not limited to LSI, and may be realized by a dedicated circuit or a general-purpose processor. In addition, when an integrated circuit technology that replaces LSI appears due to the advancement of semiconductor technology, an integrated circuit based on the technology may be used.

1…音響処理装置、11…データ入力部、12…仮想空間サイズ算出部、13…仮想音響空間マッピング部、14…音響信号変換部 DESCRIPTION OF SYMBOLS 1 ... Acoustic processing apparatus, 11 ... Data input part, 12 ... Virtual space size calculation part, 13 ... Virtual acoustic space mapping part, 14 ... Acoustic signal conversion part

Claims (9)

再生空間の所定の基準点と2つの目標点の中点を結ぶ直線上に、仮想空間における所定の中心点から前記目標点間の開き角がマルチチャンネル音響信号の制作時における所定の開き角に等しくなる前記中心点の位置と再生空間に対する仮想空間の大きさの割合を定める仮想空間設定部と、
前記再生空間に、前記仮想空間における前記制作時の各チャンネル位置を前記中心点から前記制作時の各チャンネルの音源方向に射影した位置を仮想音源の位置として前記基準点からの方向を仮想音源方向に定める音源方向決定部と、
前記仮想音源方向と前記再生空間に配置される再生音源の前記基準点からの再生音源方向に基づいて前記マルチチャンネル音響信号を前記再生音源への音響信号に変換する音響信号変換部と、
を備える音響処理装置。
On the straight line connecting the predetermined reference point in the reproduction space and the midpoint of the two target points, the opening angle between the target points from the predetermined center point in the virtual space is the predetermined opening angle at the time of producing the multi-channel sound signal. A virtual space setting unit for determining a ratio of the size of the virtual space to the reproduction space and the position of the center point that is equal;
In the reproduction space, a position obtained by projecting each channel position at the time of production in the virtual space from the center point to a sound source direction of each channel at the time of production is defined as a virtual sound source position, and a direction from the reference point is a virtual sound source direction. A sound source direction determination unit defined in
An acoustic signal conversion unit that converts the multi-channel acoustic signal into an acoustic signal to the reproduction sound source based on the virtual sound source direction and the reproduction sound source direction from the reference point of the reproduction sound source arranged in the reproduction space;
A sound processing apparatus comprising:
前記音響信号変換部は、
前記仮想音源方向と前記再生音源の前記基準点からの再生音源方向との角度が所定の角度の閾値以下であるとき、前記仮想音源方向に係るチャンネルの音響信号を前記再生音源方向の再生音源に出力する
ことを特徴とする請求項1に記載の音響処理装置。
The acoustic signal converter is
When an angle between the virtual sound source direction and the reproduced sound source direction from the reference point of the reproduced sound source is equal to or smaller than a predetermined angle threshold, an acoustic signal of a channel related to the virtual sound source direction is used as a reproduced sound source in the reproduced sound source direction. The sound processing apparatus according to claim 1, wherein the sound processing apparatus outputs the sound.
前記音響信号変換部は、
音響信号が分配されない再生音源が存在するとき、前記再生音源方向から所定範囲内の仮想音源方向に係るチャンネルの音響信号の少なくとも一部を前記少なくとも1つの再生音源に出力する
ことを特徴とする請求項1または請求項2に記載の音響処理装置。
The acoustic signal converter is
When there is a reproduced sound source to which an acoustic signal is not distributed, at least a part of an acoustic signal of a channel related to a virtual sound source direction within a predetermined range from the reproduced sound source direction is output to the at least one reproduced sound source. Item 3. The sound processing device according to item 1 or item 2.
前記音源方向決定部は、前記制作時のチャンネル毎の音源または再生環境における再生音源が3次元空間に分布するとき、前記仮想空間として半径が一定である面を用いる
ことを特徴とする請求項1から請求項3のいずれか一項に記載の音響処理装置。
The sound source direction determination unit uses a surface having a constant radius as the virtual space when sound sources for each channel at the time of production or reproduced sound sources in a reproduction environment are distributed in a three-dimensional space. The sound processing apparatus according to claim 3.
前記音源方向決定部は、前記制作時のチャンネル毎の音源または再生環境における再生音源が3次元空間に分布するとき、前記仮想空間として水平方向の半径が一定である面を用いる
ことを特徴とする請求項1から請求項3のいずれか一項に記載の音響処理装置。
The sound source direction determining unit uses a surface having a constant horizontal radius as the virtual space when the sound source for each channel at the time of production or the reproduced sound source in a reproduction environment is distributed in a three-dimensional space. The sound processing apparatus according to any one of claims 1 to 3.
前記音源方向決定部は、前記制作時のチャンネル毎の音源または再生環境における再生音源が3次元空間に分布するとき、前記仮想空間として立方体の面を用いる
ことを特徴とする請求項1から請求項3のいずれか一項に記載の音響処理装置。
The sound source direction determination unit uses a cubic surface as the virtual space when sound sources for each channel at the time of production or reproduction sound sources in a reproduction environment are distributed in a three-dimensional space. The sound processing apparatus according to claim 3.
前記音源方向決定部は、
前記制作時のチャンネル毎の音源方向が3次元空間に分布するとき、当該音源方向の水平面内の方位角と水平面からの仰角もしくは高さとを独立に処理する
ことを特徴とする請求項1から請求項6のいずれか一項に記載の音響処理装置。
The sound source direction determination unit
When the sound source direction for each channel at the time of production is distributed in a three-dimensional space, the azimuth angle in the horizontal plane of the sound source direction and the elevation angle or height from the horizontal plane are independently processed. Item 7. The sound processing device according to any one of items 6 to 6.
音響処理装置における音響処理方法であって、
再生空間の所定の基準点と2つの目標点の中点を結ぶ直線上に、仮想空間における所定の中心点からの前記目標点間の開き角がマルチチャンネル音響信号の制作時における所定の開き角に等しくなる前記中心点の位置と再生空間に対する仮想空間の大きさの割合を定める仮想空間設定過程と、
前記再生空間に、前記仮想空間における前記制作時の各チャンネル位置を前記中心点から前記制作時の各チャンネルの音源方向に射影した位置を仮想音源の位置として前記基準点からの方向を仮想音源方向に定める音源方向決定過程と、
前記仮想音源方向と前記再生空間に配置される再生音源の前記基準点からの再生音源方向に基づいて前記マルチチャンネル音響信号を前記再生音源への音響信号に変換する音響信号変換過程と、
を有する音響処理方法。
A sound processing method in a sound processing apparatus,
An opening angle between the target points from a predetermined center point in the virtual space is a predetermined opening angle at the time of producing a multi-channel sound signal on a straight line connecting a predetermined reference point in the reproduction space and the midpoint of the two target points. A virtual space setting process for determining a ratio of the size of the virtual space to the reproduction space and the position of the center point equal to
In the reproduction space, a position obtained by projecting each channel position at the time of production in the virtual space from the center point to a sound source direction of each channel at the time of production is defined as a virtual sound source position, and a direction from the reference point is a virtual sound source direction. The sound source direction determination process defined in
An acoustic signal conversion process for converting the multi-channel acoustic signal into an acoustic signal to the reproduction sound source based on the virtual sound source direction and the reproduction sound source direction from the reference point of the reproduction sound source arranged in the reproduction space;
A sound processing method comprising:
コンピュータに、
再生空間の所定の基準点と2つの目標点の中点を結ぶ直線上に、仮想空間における所定の中心点からの前記目標点間の開き角がマルチチャンネル音響信号の制作時における所定の開き角に等しくなる前記中心点の位置と再生空間に対する仮想空間の大きさの割合を定める仮想空間設定部と、
前記再生空間に、前記仮想空間における前記制作時の各チャンネル位置を前記中心点から前記制作時の各チャンネルの音源方向に射影した位置を仮想音源の位置として前記基準点からの方向を仮想音源方向に定める音源方向決定部と、
前記仮想音源方向と前記再生空間に配置される再生音源の前記基準点からの再生音源方向に基づいて前記マルチチャンネル音響信号を前記再生音源への音響信号に変換する音響信号変換部と、
を備える音響処理装置として機能させるためのプログラム。
On the computer,
An opening angle between the target points from a predetermined center point in the virtual space is a predetermined opening angle at the time of producing a multi-channel sound signal on a straight line connecting a predetermined reference point in the reproduction space and the midpoint of the two target points. A virtual space setting unit for determining a ratio of the size of the virtual space to the reproduction space and the position of the center point equal to
In the reproduction space, a position obtained by projecting each channel position at the time of production in the virtual space from the center point to a sound source direction of each channel at the time of production is defined as a virtual sound source position, and a direction from the reference point is a virtual sound source direction. A sound source direction determination unit defined in
An acoustic signal conversion unit that converts the multi-channel acoustic signal into an acoustic signal to the reproduction sound source based on the virtual sound source direction and the reproduction sound source direction from the reference point of the reproduction sound source arranged in the reproduction space;
A program for causing a sound processing apparatus to function.
JP2017097433A 2016-05-24 2017-05-16 Sound processing equipment, sound processing methods and programs Active JP6826945B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016103763 2016-05-24
JP2016103763 2016-05-24

Publications (2)

Publication Number Publication Date
JP2017212731A true JP2017212731A (en) 2017-11-30
JP6826945B2 JP6826945B2 (en) 2021-02-10

Family

ID=60474950

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017097433A Active JP6826945B2 (en) 2016-05-24 2017-05-16 Sound processing equipment, sound processing methods and programs

Country Status (1)

Country Link
JP (1) JP6826945B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020010318A (en) * 2018-05-28 2020-01-16 ホンダ リサーチ インスティテュート ヨーロッパ ゲーエムベーハーHonda Research Institute Europe GmbH Method and system for reproducing visual and/or audio content synchronously by one group of devices

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009278381A (en) * 2008-05-14 2009-11-26 Nippon Hoso Kyokai <Nhk> Acoustic signal multiplex transmission system, manufacturing device, and reproduction device added with sound image localization acoustic meta-information
JP2011259097A (en) * 2010-06-07 2011-12-22 Sony Corp Audio signal processing device and audio signal processing method
JP2013187908A (en) * 2012-03-06 2013-09-19 Thomson Licensing Method and apparatus for playback of high-order ambisonics audio signal
JP2014222856A (en) * 2013-05-14 2014-11-27 日本放送協会 Acoustic signal reproduction device and acoustic signal preparation device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009278381A (en) * 2008-05-14 2009-11-26 Nippon Hoso Kyokai <Nhk> Acoustic signal multiplex transmission system, manufacturing device, and reproduction device added with sound image localization acoustic meta-information
JP2011259097A (en) * 2010-06-07 2011-12-22 Sony Corp Audio signal processing device and audio signal processing method
JP2013187908A (en) * 2012-03-06 2013-09-19 Thomson Licensing Method and apparatus for playback of high-order ambisonics audio signal
JP2014222856A (en) * 2013-05-14 2014-11-27 日本放送協会 Acoustic signal reproduction device and acoustic signal preparation device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020010318A (en) * 2018-05-28 2020-01-16 ホンダ リサーチ インスティテュート ヨーロッパ ゲーエムベーハーHonda Research Institute Europe GmbH Method and system for reproducing visual and/or audio content synchronously by one group of devices
JP7069085B2 (en) 2018-05-28 2022-05-17 ホンダ リサーチ インスティテュート ヨーロッパ ゲーエムベーハー Methods and systems for synchronously playing visual and / or audio content on a group of devices

Also Published As

Publication number Publication date
JP6826945B2 (en) 2021-02-10

Similar Documents

Publication Publication Date Title
KR102568140B1 (en) Method and apparatus for playback of a higher-order ambisonics audio signal
US10334385B2 (en) Music collection navigation device and method
US9510127B2 (en) Method and apparatus for generating an audio output comprising spatial information
JP2023075334A (en) Reproducing device, reproducing method, and program
CN106961647B (en) Audio playback and method
MX2011007035A (en) Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction.
KR20130045338A (en) Apparatus for changing an audio scene and an apparatus for generating a directional function
US11445317B2 (en) Method and apparatus for localizing multichannel sound signal
Bates The composition and performance of spatial music
US20190394596A1 (en) Transaural synthesis method for sound spatialization
JP2018110366A (en) 3d sound video audio apparatus
JP6826945B2 (en) Sound processing equipment, sound processing methods and programs
US20240196150A1 (en) Adaptive loudspeaker and listener positioning compensation
JP2013048317A (en) Sound image localization device and program thereof
US20240163629A1 (en) Adaptive sound scene rotation
Trevino et al. A Spatial Extrapolation Method to Derive High-Order Ambisonics Data from Stereo Sources.
Tarzan et al. Assessment of sound spatialisation algorithms for sonic rendering with headphones
JP6914009B2 (en) Audio processor, audio processing method and program
Guan et al. Perceptual Localization of Virtual Sound Source Based on Loudspeaker Triplet
KR102058619B1 (en) Rendering for exception channel signal
JP2019097164A (en) Acoustic processing device and program
JP2014222859A (en) Acoustic signal reproduction device and acoustic signal preparation device
Wang et al. The method for generating 3D audio content
Romanov Comparison of Amplitude Panning Approaches on ITU BS. 2051 Loudspeaker Layouts with Height

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20181026

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200330

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210118

R150 Certificate of patent or registration of utility model

Ref document number: 6826945

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250