JP2012049652A - Multichannel audio reproducer and multichannel audio reproducing method - Google Patents

Multichannel audio reproducer and multichannel audio reproducing method Download PDF

Info

Publication number
JP2012049652A
JP2012049652A JP2010187692A JP2010187692A JP2012049652A JP 2012049652 A JP2012049652 A JP 2012049652A JP 2010187692 A JP2010187692 A JP 2010187692A JP 2010187692 A JP2010187692 A JP 2010187692A JP 2012049652 A JP2012049652 A JP 2012049652A
Authority
JP
Japan
Prior art keywords
sound source
signal
localization
listener
reproduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010187692A
Other languages
Japanese (ja)
Inventor
Naoya Tanaka
直也 田中
Akira Usami
陽 宇佐見
Toshihiko Date
俊彦 伊達
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Priority to JP2010187692A priority Critical patent/JP2012049652A/en
Publication of JP2012049652A publication Critical patent/JP2012049652A/en
Pending legal-status Critical Current

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide a multichannel audio reproducer capable of correctly recognizing a sound source position regardless of a distance between the sound source and a listener.SOLUTION: A multichannel audio reproducer comprises a localization sound source estimation part 1 estimating a localization sound source signal when a localization sound source exists in an input multichannel audio signal, a sound source signal separation part 2 separating the input multichannel audio signal into the localization sound source signal and a non-localization sound source signal, a sound source position parameter calculation part 3 calculating a sound source position parameter based on signal components composing the localization sound source, a sound source position determination part 101 determining whether a sound source position specified by the sound source position parameter is in an area close to a listener or in a distant area, a first reproduction signal generation part 102 generating a reproduction signal to control the sound source position when it is in the distant area, a second reproduction signal generation part 103 generating a reproduction signal to control the sound source position when it is in the close area, and a switch part 104 switching between the first reproduction signal generation part 102 and the second reproduction signal generation part 103.

Description

本発明は、マルチチャネルオーディオの再生において、高い臨場感を実現するマルチチャネルオーディオ再生装置およびマルチチャネルオーディオ再生方法に関する。   The present invention relates to a multi-channel audio playback apparatus and a multi-channel audio playback method that achieve high realism in multi-channel audio playback.

DVD(Digital Versatile Disc)やBD(Blu−ray Disc)などの記録メディアや、ディジタルテレビジョン放送の普及によって、マルチチャネルのオーディオ再生の需要が高まっている。マルチチャネルのオーディオ信号として最も多く用いられるフォーマットは、5.1chサラウンドと呼ばれ、受聴者の前方にレフトチャネル(L)、センターチャネル(C)、ライトチャネル(R)、また、受聴者の後方にサラウンドレフト(Ls)およびサラウンドライト(Rs)の計5チャネルを配置する。また、0.1chの部分は、LFE(Low Frequency Effect)チャネルと呼ばれ、主に数百Hz以下の低域成分のみを記録し、サブウーハ(SW)と呼ばれる専用のスピーカを接続する。各オーディオチャネルに対してそれぞれ個別のスピーカを接続し、受聴者を取り囲む同一円周上にスピーカを配置することによって、マルチチャネルのオーディオ再生が実現される。   With the spread of recording media such as DVD (Digital Versatile Disc) and BD (Blu-ray Disc) and digital television broadcasting, demand for multi-channel audio reproduction is increasing. The format most often used as a multi-channel audio signal is called 5.1ch surround, and the left channel (L), center channel (C), right channel (R) in front of the listener, and the rear of the listener. A total of 5 channels of surround left (Ls) and surround right (Rs) are arranged in The 0.1ch portion is called an LFE (Low Frequency Effect) channel, which mainly records only a low frequency component of several hundred Hz or less and is connected to a dedicated speaker called a subwoofer (SW). By connecting individual speakers to each audio channel and arranging the speakers on the same circumference surrounding the listener, multi-channel audio reproduction is realized.

しかしながら、一般的なオーディオチャネル数のスピーカを同一円周上に配置するオーディオ再生システムには、最適なスピーカ配置や受聴位置に大きな制限があり、適切でないスピーカ配置を行ったり、最適な視聴位置(スイートスポット)から外れた位置で視聴したりすると、高い臨場感を得ることができない。この問題を解決する一例として、遠方に配置する第1のスピーカ群と、耳元近傍に配置する第2のスピーカ群もしくはヘッドホンの組み合わせによる再生装置が本願発明者らによって開示されている(特願2009−084551号)。この再生装置に用いられる技術によれば、前記第1のスピーカ群と第2のスピーカ群の間で信号成分を適切に分配してそれぞれの信号エネルギを制御することによって、生成される音像位置を高い精度で制御し、高い臨場感を実現するマルチチャネルオーディオ再生が可能となる。図6は、従来の第1のスピーカ群と第2のスピーカ群を用いるマルチチャネルオーディオ再生装置の構成の一例を示す図である。第1のスピーカ群として、受聴者から離れた位置に配置される周辺スピーカを用い、受聴者の前方にレフトチャネル(L)5、センターチャネル(C)6、ライトチャネル(R)7、また、受聴者の後方にサラウンドレフトチャネル(Ls)9およびサラウンドライトチャネル(Rs)8の計5チャネルを配置する。LFEチャネルについては、再生システムの低域再生能力を補強するために用いるものであり、音像位置の制御には係わらないので図示しない。また、第2のスピーカ群としてはヘッドホンを用いる。ヘッドホンは左耳用のレフトヘッドホンチャネル(Lh)10と右耳用のライトヘッドホンチャネル(Rh)11から成る。入力されるマルチチャネルオーディオ信号は、一般的な5chサラウンド信号であり、L、C、R、Ls、Rsの各チャネルに対応する信号から構成される。定位音源推定部1は、入力されたマルチチャネルオーディオ信号を分析して、再生される音像位置を制御すべき定位音源が存在するかどうかを判定する。定位音源が存在する場合には、音源信号分離部2において定位音源を構成する信号成分とそれ以外の信号成分が分離される。音源位置パラメータ算出部3は、定位音源を構成する信号成分から、再生音響空間において定位音源が定位する位置を求め、音源位置パラメータを算出する。再生信号生成部4は、算出された音源位置パラメータに基づいて、定位音源の信号成分を周辺スピーカとヘッドホンに配分すると共に、先に分離した定位音源以外の信号成分を合成することによって、周辺スピーカおよびヘッドホンそれぞれに対する出力信号を生成する。ここで、前記音源位置パラメータは、受聴者から見た定位音源の方向角γと受聴者から定位音源までの距離rである。   However, in an audio reproduction system in which speakers with a general number of audio channels are arranged on the same circumference, there are significant restrictions on the optimum speaker arrangement and listening position, and inappropriate speaker arrangement or optimum viewing position ( If you watch at a position outside the sweet spot), you cannot get a high sense of realism. As an example of solving this problem, the inventors of the present application have disclosed a playback device using a combination of a first speaker group disposed far away and a second speaker group disposed near the ear or headphones (Japanese Patent Application No. 2009). -084551). According to the technology used in this reproducing apparatus, the sound image position to be generated can be determined by appropriately distributing signal components between the first speaker group and the second speaker group and controlling each signal energy. Multi-channel audio playback with high precision and high realism is possible. FIG. 6 is a diagram illustrating an example of a configuration of a conventional multi-channel audio reproducing apparatus using a first speaker group and a second speaker group. As the first speaker group, peripheral speakers arranged at positions away from the listener are used, and the left channel (L) 5, the center channel (C) 6, the right channel (R) 7 in front of the listener, A total of five channels, a surround left channel (Ls) 9 and a surround right channel (Rs) 8, are arranged behind the listener. The LFE channel is not shown because it is used to reinforce the low frequency reproduction capability of the reproduction system and does not relate to the control of the sound image position. Moreover, headphones are used as the second speaker group. The headphones consist of a left headphone channel (Lh) 10 for the left ear and a right headphone channel (Rh) 11 for the right ear. The input multi-channel audio signal is a general 5ch surround signal, and is composed of signals corresponding to the L, C, R, Ls, and Rs channels. The localization sound source estimation unit 1 analyzes the input multi-channel audio signal and determines whether there is a localization sound source whose sound image position to be reproduced exists. When a localization sound source exists, the signal source constituting the localization sound source and other signal components are separated in the sound source signal separation unit 2. The sound source position parameter calculation unit 3 obtains a position where the localization sound source is localized in the reproduction acoustic space from the signal components constituting the localization sound source, and calculates a sound source position parameter. Based on the calculated sound source position parameter, the reproduction signal generating unit 4 distributes the signal components of the localization sound source to the peripheral speakers and headphones, and combines the signal components other than the localization sound source separated earlier, thereby And an output signal for each of the headphones. Here, the sound source position parameter is a direction angle γ of the localization sound source viewed from the listener and a distance r from the listener to the localization sound source.

図2は、再生信号生成部4において定位音源の信号を周辺スピーカとヘッドホンに配分する処理を説明する図である。図において、201は受聴者の中心位置である受聴点、202は定位音源の位置、203はLチャネルスピーカ、204はCチャネルスピーカ、205はRチャネルスピーカ、206はRsチャネルスピーカ、207はLsチャネルスピーカ、208はLチャネルヘッドホン、209はRチャネルヘッドホン、210は受聴点とLチャネルスピーカおよびRチャネルスピーカによって囲まれる扇形の領域である。また、各周辺スピーカは受聴点取り囲む円周上に配置され、LチャネルスピーカとRチャネルスピーカおよび、LsチャネルスピーカとRsチャネルスピーカは受聴者正面に対して対称に配置され、その円周半径はr0である。また、各周辺スピーカとヘッドホンは、あらかじめ定められたレベルの信号が与えられた時に、それぞれのスピーカおよびヘッドホンから同じ大きさの音が再生されていると受聴者が感じるように出力レベルが調整される。一般的に、マルチチャネルオーディオ信号において、Cチャネル信号はダイアログ(せりふ)を中心とする信号成分によって構成されており、その他効果音など受聴者を取り囲む音響空間内に配置される音源は、L、R、Ls、Rs各チャネルの信号成分によって構成される。よって、定位音源の位置を制御する周辺スピーカとしてCチャネルを除くL、R、Ls、Rsの各スピーカを用いるものとする。受聴点および隣り合う2つの周辺スピーカによって作られる扇形の内部に定位音源が存在すれば、各頂点に配置されたスピーカ(受聴点近傍のヘッドホンと2つの周辺スピーカ)から出力される再生信号の合成によって、定位音源の位置が再現される。図2において、定位音源202は受聴点201とLチャネルスピーカ203およびRチャネルスピーカ205によって囲まれる扇形の領域210の中にある。したがって、定位音源202の位置を制御するのに用いるスピーカは、受聴点近傍のヘッドホンとLチャネルスピーカおよびRチャネルスピーカとなる。定位音源202の信号成分をXとし、受聴者から見た定位音源の方向角γと受聴者から定位音源までの距離rが与えられるとき、各スピーカに対する信号の配分は次のとおりである。   FIG. 2 is a diagram for explaining the process of allocating the localization sound source signal to the peripheral speakers and headphones in the reproduction signal generation unit 4. In the figure, 201 is the listening point that is the center position of the listener, 202 is the position of the stereophonic sound source, 203 is the L channel speaker, 204 is the C channel speaker, 205 is the R channel speaker, 206 is the Rs channel speaker, and 207 is the Ls channel. A speaker, 208 is an L channel headphone, 209 is an R channel headphone, and 210 is a fan-shaped region surrounded by the listening point, the L channel speaker, and the R channel speaker. Also, each peripheral speaker is arranged on the circumference surrounding the listening point, the L channel speaker and the R channel speaker, and the Ls channel speaker and the Rs channel speaker are arranged symmetrically with respect to the front of the listener, and the circumferential radius thereof is r0. It is. In addition, the output level of each peripheral speaker and headphone is adjusted so that the listener feels that the same volume of sound is being reproduced from each speaker and headphone when given a predetermined level of signal. The In general, in a multi-channel audio signal, a C channel signal is composed of signal components centered on a dialog, and other sound sources such as sound effects arranged in an acoustic space surrounding the listener are L, It is composed of signal components of R, Ls, and Rs channels. Therefore, L, R, Ls, and Rs speakers other than the C channel are used as peripheral speakers for controlling the position of the localization sound source. If there is a stereophonic sound source inside the sector created by the listening point and two neighboring speakers, the playback signal output from the speakers (headphones near the listening point and two peripheral speakers) placed at each vertex The position of the localization sound source is reproduced. In FIG. 2, the localization sound source 202 is in a fan-shaped region 210 surrounded by the listening point 201, the L channel speaker 203 and the R channel speaker 205. Therefore, the speakers used to control the position of the localization sound source 202 are headphones, an L channel speaker, and an R channel speaker near the listening point. When the signal component of the localization sound source 202 is X, and the direction angle γ of the localization sound source viewed from the listener and the distance r from the listener to the localization sound source are given, the distribution of signals to each speaker is as follows.

まず、定位信号成分Xは、式1に示す左側信号Xlと、式2に示す右側信号Xrとに配分される。   First, the localization signal component X is distributed to the left signal Xl shown in Equation 1 and the right signal Xr shown in Equation 2.

Figure 2012049652
Figure 2012049652

Figure 2012049652
Figure 2012049652

ここで方向角Aは、受聴者正面に対するLチャネルスピーカの方向を表す角度である。   Here, the direction angle A is an angle representing the direction of the L channel speaker with respect to the front of the listener.

続いて、左側信号Xlは、式3に示すLチャネルスピーカ信号Xl_Lと、式4に示すLhチャネルヘッドホン信号Xl_Lhとに配分される。   Subsequently, the left signal Xl is distributed to the L channel speaker signal Xl_L shown in Expression 3 and the Lh channel headphone signal Xl_Lh shown in Expression 4.

Figure 2012049652
Figure 2012049652

Figure 2012049652
Figure 2012049652

同様に、右側信号Xrは、式5に示すRチャネルスピーカ信号Xr_Rと、式6に示すRhチャネルヘッドホン信号Xr_Rhとに配分される。   Similarly, the right signal Xr is distributed to the R channel speaker signal Xr_R shown in Expression 5 and the Rh channel headphone signal Xr_Rh shown in Expression 6.

Figure 2012049652
Figure 2012049652

Figure 2012049652
Figure 2012049652

以上によって、定位音源202が受聴点201とLチャネルスピーカ203およびRチャネルスピーカ205によって囲まれる扇形の領域210の中にある場合について、扇形の頂点を成す各チャネルのスピーカおよびヘッドホンに配分される信号が算出された。定位音源202が他の隣り合う2つの周辺スピーカと受聴点によって囲まれる扇形領域にある場合も、以上の説明と同様にして、扇形の頂点を成す各チャネルのスピーカおよびヘッドホンに配分される信号が算出できる。   As described above, when the localization sound source 202 is in the fan-shaped region 210 surrounded by the listening point 201 and the L-channel speaker 203 and the R-channel speaker 205, the signal distributed to the speakers and headphones of each channel forming the fan-shaped vertex. Was calculated. Even when the localization sound source 202 is in a fan-shaped area surrounded by two adjacent neighboring speakers and listening points, the signals distributed to the speakers and headphones of each channel forming the fan-shaped apex are the same as described above. It can be calculated.

各周辺スピーカおよびヘッドホンに配分された定位音源の信号成分は、先に分離された定位しない音源の信号成分と合成された後、各周辺スピーカおよびヘッドホンへ出力される。   The localization sound source signal components allocated to the peripheral speakers and headphones are combined with the signal components of the non-localized sound sources previously separated and then output to the peripheral speakers and headphones.

従来の遠方に配置する第1のスピーカ群と、耳元近傍に配置する第2のスピーカ群とを用いるマルチチャネルオーディオの再生システムにおいては、前記第1のスピーカ群と第2のスピーカ群のそれぞれから再生される信号エネルギの比率を変化させることによって、定位音源の位置の制御を行っていた。再生される信号エネルギの比率による制御は、音源位置が受聴者から比較的離れている(たとえば、音源位置が受聴者から半径数十cmより外側にある)場合、それぞれのスピーカから再生される信号成分の合成によって仮想音像が生成され、受聴者は音源位置を正しく認識することができる。しかしながら、音源位置が受聴者に非常に近い(たとえば、音源位置が受聴者から半径数十cmより内側にある)場合、再生される信号エネルギの配分は、耳元近傍に配置される第2のスピーカ群への配分が非常に大きくなる。つまり、前記仮想音像の生成において第2のスピーカ群から再生される信号成分が支配的となり、第1のスピーカ群から再生される信号成分の寄与度は非常に小さくなる。受聴者に非常に近いエリアにおいて音源位置を制御するためには、寄与度の小さい第1のスピーカ群からの信号成分量を正しく与える信号エネルギ配分を行わなければならないが、第1のスピーカ群は受聴者から遠方に配置されるスピーカであり、小さな寄与度に対応する細かい信号エネルギ配分の制御を、遠方のスピーカを用いて正しく行うことは非常に困難である。結果として、受聴者に近いエリアの音源位置の制御は精度が低下し、受聴者は正しい音源位置を認識することが困難となる。   In a conventional multi-channel audio reproduction system using a first speaker group disposed far away and a second speaker group disposed in the vicinity of the ear, each of the first speaker group and the second speaker group is used. The position of the localization sound source is controlled by changing the ratio of the signal energy to be reproduced. The control based on the ratio of the signal energy to be reproduced is based on the signal reproduced from each speaker when the sound source position is relatively far from the listener (for example, the sound source position is outside a radius of several tens of centimeters from the listener). A virtual sound image is generated by combining the components, and the listener can correctly recognize the sound source position. However, when the sound source position is very close to the listener (for example, the sound source position is inside the radius of several tens of centimeters from the listener), the distribution of the signal energy to be reproduced is the second speaker arranged near the ear. The distribution to the group becomes very large. That is, in the generation of the virtual sound image, the signal component reproduced from the second speaker group becomes dominant, and the contribution degree of the signal component reproduced from the first speaker group becomes very small. In order to control the sound source position in an area very close to the listener, it is necessary to perform signal energy distribution that correctly gives the amount of signal components from the first speaker group with a small contribution, but the first speaker group It is a speaker arranged far from the listener, and it is very difficult to correctly control fine signal energy distribution corresponding to a small contribution degree using a far speaker. As a result, the accuracy of the control of the sound source position in the area close to the listener is reduced, and it becomes difficult for the listener to recognize the correct sound source position.

本発明は前記課題を解決するものであって、受聴者に近いエリアの音源位置の制御の精度を向上することによって、音源から受聴者までの距離にかかわらず正しい音源位置の認識を可能とし、高い臨場感を実現するマルチチャネルオーディオ再生装置を提供するものである。   The present invention solves the above problem, and by improving the accuracy of the control of the sound source position in the area close to the listener, it enables the recognition of the correct sound source position regardless of the distance from the sound source to the listener, The present invention provides a multi-channel audio playback device that realizes a high sense of realism.

また、受聴者に近いエリアの音源位置の制御の精度を向上するために、受聴者から遠いエリアと受聴者に近いエリアの境界で音源位置制御を切り替えると、切り替えによる不連続が発生し、受聴者が違和感を受けることがある。本発明は受聴者に近いエリアの音源位置の制御の精度を向上することによって、音源から受聴者までの距離にかかわらず正しい音源位置の認識を可能とすると共に、受聴者から遠いエリアと受聴者に近いエリアの境界における音源位置制御の切り替えを平滑化することにより、高い臨場感を実現するマルチチャネルオーディオ再生装置を提供するものである。   In addition, when the sound source position control is switched at the boundary between the area far from the listener and the area close to the listener in order to improve the accuracy of the control of the sound source position in the area close to the listener, discontinuity due to the switching occurs, and The listener may feel uncomfortable. The present invention makes it possible to recognize the correct sound source position regardless of the distance from the sound source to the listener by improving the accuracy of the control of the sound source position in the area close to the listener, as well as the area far from the listener and the listener. The present invention provides a multi-channel audio reproduction device that realizes a high sense of realism by smoothing the switching of sound source position control at the boundary of an area close to.

本発明のマルチチャネルオーディオ再生装置は、マルチチャネルオーディオ信号を入力とし、入力されたマルチチャネルオーディオ信号に定位音源が存在するか否かを判定し、定位音源が存在する場合に定位音源信号を推定する定位音源推定部と、入力マルチチャネルオーディオ信号を定位音源信号と定位しない音源信号のそれぞれの成分に分離する音源信号分離部と、定位音源を構成する信号成分から音源位置パラメータを算出する音源位置パラメータ部と、算出された音源位置パラメータによって示される音源位置が受聴者に近いエリアに存在するか、もしくは遠いエリアに存在するかを判定する音源位置判定部と、音源位置が受聴者から遠いエリアに存在する場合に、音源位置パラメータによって示される音源位置を制御する再生信号を生成する第1の再生信号生成部と、音源位置が受聴者に近いエリアに存在する場合に、音源位置パラメータによって示される音源位置を制御する再生信号を生成する第2の再生信号生成部と、前記第1の再生信号生成部と第2の再生信号生成部を切り替えるスイッチ部とを備える。   The multi-channel audio reproduction apparatus of the present invention receives a multi-channel audio signal, determines whether or not a localized sound source exists in the input multi-channel audio signal, and estimates a localized sound source signal when a localized sound source exists. A local sound source estimation unit, a sound source signal separation unit that separates an input multi-channel audio signal into components of a localization sound source signal and a non-localization sound source signal, and a sound source position that calculates a sound source position parameter from the signal components constituting the localization sound source A parameter part, a sound source position determination part for determining whether the sound source position indicated by the calculated sound source position parameter is in an area close to or far from the listener, and an area where the sound source position is far from the listener Playback signal that controls the sound source position indicated by the sound source position parameter A first reproduction signal generation unit for generating, a second reproduction signal generation unit for generating a reproduction signal for controlling the sound source position indicated by the sound source position parameter when the sound source position is in an area close to the listener, A switch unit that switches between the first reproduction signal generation unit and the second reproduction signal generation unit;

また、本発明のマルチチャネルオーディオ再生装置は、マルチチャネルオーディオ信号を入力とし、入力されたマルチチャネルオーディオ信号に定位音源が存在するか否かを判定し、定位音源が存在する場合に定位音源信号を推定する定位音源推定部と、入力マルチチャネルオーディオ信号を定位音源信号と定位しない音源信号のそれぞれの成分に分離する音源信号分離部と、定位音源を構成する信号成分から音源位置パラメータを算出する音源位置パラメータ部と、算出された音源位置パラメータによって示される音源位置が受聴者に近いエリアに存在するか、もしくは遠いエリアに存在するかを判定する音源位置判定部と、音源位置が受聴者から遠いエリアに存在する場合に、音源位置パラメータによって示される音源位置を制御する再生信号を生成する第1の再生信号生成部と、音源位置が受聴者に近いエリアに存在する場合に、音源位置パラメータによって示される音源位置を制御する再生信号を生成する第2の再生信号生成部と、定位音源および定位しない音源信号を分配する信号分配部と、定位音源および定位しない音源信号を前記第1の再生信号生成部のみに入力するか、もしくは信号分配部を通して第1および第2の再生信号生成部の両方に入力するかを切り替えるスイッチ部とを備え、第1の再生信号生成部の出力と第2の再生信号生成部の出力を加算することによって出力再生信号を生成する。   The multi-channel audio reproduction apparatus of the present invention receives a multi-channel audio signal as input, determines whether or not a localized sound source exists in the input multi-channel audio signal, and determines whether or not a localized sound source exists. A sound source position estimation unit, a sound source signal separation unit that separates an input multichannel audio signal into components of a sound source signal and a sound source signal that are not localized, and a sound source position parameter from a signal component that constitutes the sound source A sound source position parameter unit, a sound source position determination unit for determining whether the sound source position indicated by the calculated sound source position parameter is in an area close to or far from the listener, and a sound source position from the listener When the sound source is located in a distant area, the sound source position indicated by the sound source position parameter is controlled again. A first reproduction signal generation unit that generates a signal, and a second reproduction signal generation unit that generates a reproduction signal for controlling the sound source position indicated by the sound source position parameter when the sound source position exists in an area close to the listener A signal distribution unit that distributes the localization sound source and the non-localization sound source signal, and inputs the localization sound source and the non-localization sound source signal only to the first reproduction signal generation unit, or through the signal distribution unit, the first and second A switching unit that switches whether to input to both of the reproduction signal generation units, and an output reproduction signal is generated by adding the output of the first reproduction signal generation unit and the output of the second reproduction signal generation unit.

本発明を用いることにより、マルチチャネルオーディオ信号に含まれる音源が受聴者から遠いか近いかに係わらず、再生される音源位置を高い精度で制御することができるため、高い臨場感の実現が可能となる。   By using the present invention, it is possible to control the position of the reproduced sound source with high accuracy regardless of whether the sound source included in the multi-channel audio signal is far or near from the listener, and thus it is possible to realize a high sense of presence. Become.

本発明の実施の形態1に係るマルチチャネルオーディオ再生装置の構成を示す図である。It is a figure which shows the structure of the multi-channel audio reproduction apparatus which concerns on Embodiment 1 of this invention. 定位音源の信号を周辺スピーカとヘッドホンに配分する処理を説明する図である。It is a figure explaining the process which distributes the signal of a localization sound source to a surrounding speaker and headphones. 定位音源の位置の判定法を説明する図である。It is a figure explaining the determination method of the position of a localization sound source. 本実施の形態1に係る第2の再生信号生成部における信号処理を説明する図である。It is a figure explaining the signal processing in the 2nd reproduction | regeneration signal production | generation part which concerns on this Embodiment 1. FIG. 本発明の実施の形態2に係るマルチチャネルオーディオ再生装置の構成を示す図である。It is a figure which shows the structure of the multi-channel audio reproduction apparatus which concerns on Embodiment 2 of this invention. 従来の再生装置の構成を示す図である。It is a figure which shows the structure of the conventional reproducing | regenerating apparatus.

(実施の形態1)
図1は、本発明の実施の形態1に係るマルチチャネルオーディオ再生装置の構成を示す図である。先に説明した従来のマルチチャネルオーディオ再生装置で用いられる処理部と同じ機能を有する部については、図中において同じ番号を付し詳細な説明は省略する。図1において、本発明のマルチチャネルオーディオ再生装置は、図4に示す従来のマルチチャネルオーディオ再生装置に対して、音源位置判定部101を新たに設けると共に、再生信号生成部4を第1の再生信号生成部102と第2の再生信号生成部103をスイッチ部104によって切り替える様に構成したものである。
(Embodiment 1)
FIG. 1 is a diagram showing a configuration of a multi-channel audio playback apparatus according to Embodiment 1 of the present invention. Parts having the same functions as those of the processing unit used in the conventional multi-channel audio playback apparatus described above are denoted by the same reference numerals in the drawing, and detailed description thereof is omitted. In FIG. 1, the multi-channel audio playback apparatus of the present invention is provided with a sound source position determination unit 101 and a playback signal generation unit 4 for the first playback in the conventional multi-channel audio playback apparatus shown in FIG. The signal generation unit 102 and the second reproduction signal generation unit 103 are configured to be switched by a switch unit 104.

定位音源推定部1は、入力されたマルチチャネルオーディオ信号を分析して、再生される音像位置を制御すべき定位音源が存在するかどうかを判定する。定位音源が存在する場合には、音源信号分離部2において定位音源を構成する信号成分とそれ以外の信号成分が分離される。音源位置パラメータ算出部3は、定位音源を構成する信号成分から、再生音響空間において定位音源が定位する位置を求め、音源位置パラメータを算出する。音源位置判定部101は、算出された音源位置パラメータから、再生音響空間における定位音源の位置が、受聴者から遠いか近いかを判定する。図3は、音源位置判定部101が再生音響空間における定位音源の位置が、受聴者から遠いか近いかを判定する方法を説明する図である。先に説明した様に、音源位置パラメータは受聴者から見た定位音源の方向角γと受聴者から定位音源までの距離rによって与えられる。再生音響空間は、受聴者の中心である受聴点201を中心とする半径r1の円周301を境界として、受聴者に近いエリア302と受聴者から遠いエリア303に分割されている。半径r1として好ましい値の範囲は0.2mから1.0m程度である。与えられた定位音源までの距離rがr1以下であれば、定位音源は受聴者に近いエリアに存在し、逆にrがr1よりも大きければ、定位音源は受聴者から遠いエリアに存在することになる。音源位置判定部は、定位音源が受聴者から遠いエリアにあると判定された場合に第1の再生信号生成部を選択し、定位音源が受聴者から近いエリアにあると判定された場合に第2の再生信号生成部が選択されるように、スイッチ部104を制御する。   The localization sound source estimation unit 1 analyzes the input multi-channel audio signal and determines whether there is a localization sound source whose sound image position to be reproduced exists. When a localization sound source exists, the signal source constituting the localization sound source and other signal components are separated in the sound source signal separation unit 2. The sound source position parameter calculation unit 3 obtains a position where the localization sound source is localized in the reproduction acoustic space from the signal components constituting the localization sound source, and calculates a sound source position parameter. The sound source position determination unit 101 determines, based on the calculated sound source position parameter, whether the position of the localization sound source in the reproduction acoustic space is far from or close to the listener. FIG. 3 is a diagram for explaining a method by which the sound source position determination unit 101 determines whether the position of the localization sound source in the reproduction acoustic space is far from or close to the listener. As described above, the sound source position parameter is given by the direction angle γ of the localization sound source viewed from the listener and the distance r from the listener to the localization sound source. The reproduction acoustic space is divided into an area 302 near the listener and an area 303 far from the listener, with a circumference 301 having a radius r1 centered on the listening point 201 being the center of the listener. A preferable range of the radius r1 is about 0.2 m to 1.0 m. If the distance r to a given localization sound source is r1 or less, the localization sound source exists in an area close to the listener, and conversely if r is larger than r1, the localization sound source exists in an area far from the listener. become. The sound source position determination unit selects the first reproduction signal generation unit when it is determined that the localization sound source is in an area far from the listener, and the first sound source position determination unit is selected when it is determined that the localization sound source is in an area near the listener. The switch unit 104 is controlled so that the second reproduction signal generation unit is selected.

次に、再生信号生成部の動作について説明する。定位音源が受聴者から遠いエリアにあると判定された場合に選択される第1の再生信号生成部は、従来のマルチチャネルオーディオ再生装置における再生信号生成部と同一の機能を有しており、先に説明した手法に従って入力された定位音源信号を各周辺スピーカおよびヘッドホンに配分した後、定位しない音源信号と合成して出力する。定位音源が受聴者から近いエリアにあると判定された場合に選択される第2の再生信号生成部は、定位音源の信号成分をヘッドホンのみに配分し、人間の聴覚特性に基づく信号処理を適用することによって、定位音源の位置を制御する。   Next, the operation of the reproduction signal generation unit will be described. The first reproduction signal generation unit selected when it is determined that the localization sound source is in an area far from the listener has the same function as the reproduction signal generation unit in the conventional multi-channel audio reproduction device, After the localization sound source signal input in accordance with the method described above is distributed to each peripheral speaker and headphones, it is synthesized with a non-localization sound source signal and output. The second playback signal generator selected when it is determined that the localization sound source is in an area close to the listener distributes the signal component of the localization sound source only to the headphones and applies signal processing based on human auditory characteristics By doing so, the position of the localization sound source is controlled.

図4は、第2の再生信号生成部における信号処理を説明する図である。定位音源202は、受聴点201に対して方向角γと距離rで示される位置に存在する。定位音源から受聴者の左耳に相当するレフトヘッドホンLhへの信号伝達経路は矢印401で示され、また定位音源から受聴者の右耳に相当するライトヘッドホンRhへの信号伝達経路は矢印402で示される。つまり、受聴者は定位音源202から発せられた信号に対して、矢印401で示される信号伝達経路および矢印402で示される伝達経路の両方の伝達特性を付加した信号を受聴していることになる。これらの伝達特性は、頭部伝達関数HRTF(Head Related Transfer Function)として知られており、元の音源信号に対して信号処理によってHRTFの特性を付加することにより、あたかも音源がHRTFによって示される伝達経路の先にあるように感じさせることができる。一般的にHRTFは、インパルス応答あるいはFIRフィルタ係数として与えられ、元の音源信号に対してHRTFの特性を付加する処理は畳み込み演算によって実現される。すなわち、定位音源の信号成分をX、矢印401で示される伝達経路のHRTFをHLh、矢印402で示される伝達経路のHRTFをHRh、畳み込み演算を表す記号を*として、レフトチャネルヘッドホンLhへの出力信号X_LhおよびライトチャネルヘッドホンRhへの出力信号X_Rhは、それぞれ次の式7および式8のように求められる。   FIG. 4 is a diagram for explaining signal processing in the second reproduction signal generation unit. The localization sound source 202 is present at a position indicated by a direction angle γ and a distance r with respect to the listening point 201. A signal transmission path from the localization sound source to the left headphones Lh corresponding to the listener's left ear is indicated by an arrow 401, and a signal transmission path from the localization sound source to the right headphones Rh corresponding to the listener's right ear is indicated by an arrow 402. Indicated. That is, the listener is listening to a signal in which the transmission characteristics of both the signal transmission path indicated by the arrow 401 and the transmission path indicated by the arrow 402 are added to the signal emitted from the localization sound source 202. . These transfer characteristics are known as a head related transfer function HRTF (Head Related Transfer Function). By adding the HRTF characteristics to the original sound source signal by signal processing, the transfer is as if the sound source is indicated by the HRTF. You can feel as if you are at the end of the route. Generally, the HRTF is given as an impulse response or an FIR filter coefficient, and the process of adding the HRTF characteristic to the original sound source signal is realized by a convolution operation. That is, the signal component of the localization sound source is X, the HRTF of the transmission path indicated by the arrow 401 is HLh, the HRTF of the transmission path indicated by the arrow 402 is HRh, and the symbol representing the convolution operation is output to the left channel headphones Lh. The signal X_Lh and the output signal X_Rh to the light channel headphone Rh are obtained by the following equations 7 and 8, respectively.

Figure 2012049652
Figure 2012049652

Figure 2012049652
Figure 2012049652

信号処理において使用するHRTFは、あらかじめ測定した伝達特性をROMなどの記憶媒体に保持しておく。ただし、定位音源202の位置によってHRTFの特性は変化するため、必要なすべてのHRTFを保持しておくことは困難である。しかしながら、一般にHRTFは方向角γに依存する周波数特性と、受聴点から音源までの距離に依存するゲイン特性に分離することができるため、代表的な方向角γに対する周波数特性のみを保持しておき、受聴点から音源までの距離rに応じてゲインを調整することにより、HRTFの保持に必要な記憶容量を削減することができる。   The HRTF used in signal processing holds the transfer characteristics measured in advance in a storage medium such as a ROM. However, since the characteristics of the HRTF change depending on the position of the localization sound source 202, it is difficult to hold all necessary HRTFs. However, since HRTF can generally be separated into a frequency characteristic depending on the direction angle γ and a gain characteristic depending on the distance from the listening point to the sound source, only the frequency characteristic with respect to the representative direction angle γ is retained. By adjusting the gain according to the distance r from the listening point to the sound source, the storage capacity necessary for holding the HRTF can be reduced.

さらに、第2の再生信号生成部103は、音源信号分離部2において分離された定位しない音源信号の成分を周辺スピーカの各チャネルに配分する。以上の処理によって、受聴者に近いエリアに存在する定位音源はヘッドホンから再生され、それ以外の定位しない音源の信号成分は周辺スピーカから再生される。   Furthermore, the second reproduction signal generation unit 103 distributes the components of the non-localized sound source signal separated in the sound source signal separation unit 2 to each channel of the peripheral speakers. Through the above processing, the localized sound source existing in the area close to the listener is reproduced from the headphones, and the signal components of the other non-localized sound sources are reproduced from the peripheral speakers.

以上で説明した構成により、定位音源が受聴者に近いエリアに存在するのか遠いエリアに存在するのかの違いによって、最適な再生信号生成部を用いて再生される音源位置を制御することができる。これにより、音源と受聴者との間の距離に係わらず、精度の高い音源位置の制御が可能となり、高い臨場感が実現される。   With the configuration described above, the position of the sound source reproduced using the optimum reproduction signal generation unit can be controlled depending on whether the localized sound source exists in an area close to or far from the listener. As a result, regardless of the distance between the sound source and the listener, it is possible to control the position of the sound source with high accuracy, thereby realizing a high sense of realism.

なお、本実施の形態においては、受聴者に近いエリア302と受聴者から遠いエリア303の境界は半径r1の円としているが、方向角γによって半径r1が異なるような境界(例えば楕円)を用いてもよい。なぜならば、人間の聴覚特性は方向角γによって感度や距離感覚が異なるためである。その場合、音源位置判定部は方向角γと距離rの両方の音源位置パラメータを参照して、定位音源がどちらのエリアに存在するかを判定する様に構成される。   In this embodiment, the boundary between the area 302 close to the listener and the area 303 far from the listener is a circle having a radius r1, but a boundary (for example, an ellipse) having a radius r1 that differs depending on the direction angle γ is used. May be. This is because human auditory characteristics differ in sensitivity and sense of distance depending on the direction angle γ. In that case, the sound source position determination unit is configured to determine in which area the localization sound source exists with reference to the sound source position parameters of both the direction angle γ and the distance r.

(実施の形態2)
図5は、本発明の実施の形態2に係るマルチチャネルオーディオ再生装置の構成を示す図である。先に説明した本発明の実施の形態1のマルチチャネルオーディオ再生装置で用いられる処理部と同じ機能を有する部については、図中において同じ番号を付し詳細な説明は省略する。本実施の形態2の構成では、図1に示すマルチメディアオーディオ再生装置の再生信号生成部4に信号分配部105を追加し、音源信号分離部2から入力される音源信号を、スイッチ104を介して、第1の再生信号生成部102のみに入力するか、もしくは、信号分配部105を通して第1の再生信号生成部102と第2の再生信号生成部103のそれぞれに分配して入力するかを切り替える。また、第1の再生信号生成部の出力と第2の再生信号生成部の出力は加算されてから出力される。スイッチ104の切り替えの制御は本発明の実施の形態1の構成と同様であり、音源位置判定部101によって、音源位置が受聴者から遠いエリアに存在すると判断された場合には、第1の再生信号生成部側に切り替えられ、逆に音源位置が受聴者に近いエリアに存在すると判定された場合には、信号分配部側に切り替えられる。信号分配部105は、定位音源の信号成分をあらかじめ定められた比率もしくは、定位音源から受聴者までの距離に基づく比率にしたがって2つの信号に分配し、それぞれを第1の再生信号生成部と第2の再生信号生成部とに入力する。一例として、前記定位音源から受聴者までの距離に基づく比率は、第1の再生信号生成部に対する分配割合をa、第2の再生信号生成部に対する分配割合をb、受聴者から定位音源までの距離をr、受聴者から受聴者に近いエリアと受聴者から遠いエリアの境界までの距離をr1として、次式で与えられる。
(Embodiment 2)
FIG. 5 is a diagram showing a configuration of a multi-channel audio playback apparatus according to Embodiment 2 of the present invention. Parts having the same functions as those of the processing unit used in the multi-channel audio reproducing apparatus according to Embodiment 1 of the present invention described above are denoted by the same reference numerals in the drawing, and detailed description thereof is omitted. In the configuration of the second embodiment, a signal distribution unit 105 is added to the reproduction signal generation unit 4 of the multimedia audio reproduction apparatus shown in FIG. 1, and the sound source signal input from the sound source signal separation unit 2 is passed through the switch 104. Whether to input only to the first reproduction signal generation unit 102 or to distribute and input to each of the first reproduction signal generation unit 102 and the second reproduction signal generation unit 103 through the signal distribution unit 105 Switch. Further, the output of the first reproduction signal generator and the output of the second reproduction signal generator are added and then output. The switching control of the switch 104 is the same as in the configuration of the first embodiment of the present invention. When the sound source position determination unit 101 determines that the sound source position exists in an area far from the listener, the first reproduction is performed. If it is determined that the sound source position is in the area close to the listener, the signal generator is switched to the signal distributor. The signal distribution unit 105 distributes the signal component of the localization sound source into two signals according to a predetermined ratio or a ratio based on the distance from the localization sound source to the listener, and each of them is divided into the first reproduction signal generation unit and the first reproduction signal generation unit. 2 to the reproduction signal generation unit. As an example, the ratio based on the distance from the localization sound source to the listener includes a distribution ratio for the first reproduction signal generation unit a, a distribution ratio for the second reproduction signal generation unit b, and from the listener to the localization sound source. The distance is r, and the distance from the listener to the boundary between the area close to the listener and the area far from the listener is r1, and is given by the following equation.

Figure 2012049652
Figure 2012049652

また、定位しない音源信号の成分については、分配することなく第1の再生信号生成部に入力する。(第2の再生信号生成部に入力される定位しない音源信号の成分は0となる。)第1の再生信号生成部と第2の再生信号生成部は、それぞれ、先に説明した手順に従って各周辺スピーカおよびヘッドホンへの出力信号を算出する。第1の再生信号生成部からヘッドホンへの出力信号と第2の再生信号生成部からヘッドホンへの出力信号は加算され、最終的なヘッドホンへの出力信号が生成される。同様に、第1の再生信号生成部から各周辺スピーカへの出力信号と第2の再生信号生成部から各周辺スピーカへの出力信号は加算され、最終的な周辺スピーカへの出力信号となる。なお、第1の再生信号生成部と第2の再生信号生成部は共に、入力信号が与えられない、もしくは入力信号が0ならば、出力信号が0となることは自明である。   The sound source signal components that are not localized are input to the first reproduction signal generation unit without being distributed. (The component of the non-localized sound source signal input to the second reproduction signal generation unit is 0.) Each of the first reproduction signal generation unit and the second reproduction signal generation unit follows the procedure described above. Output signals to peripheral speakers and headphones are calculated. The output signal from the first reproduction signal generation unit to the headphones and the output signal from the second reproduction signal generation unit to the headphones are added to generate a final output signal to the headphones. Similarly, the output signal from the first reproduction signal generation unit to each peripheral speaker and the output signal from the second reproduction signal generation unit to each peripheral speaker are added to become the final output signal to the peripheral speaker. It is obvious that both the first reproduction signal generation unit and the second reproduction signal generation unit are not given an input signal, or if the input signal is 0, the output signal becomes 0.

以上で説明した構成により、定位音源が受聴者に近いエリアに存在するのか遠いエリアに存在するのかの違いによって、最適な再生信号生成部を用いて再生される音源位置を制御すると共に、受聴者から遠いエリアと受聴者に近いエリアの境界における音源位置制御の切り替えを平滑化することが出来る。これにより、音源と受聴者との間の距離に係わらず、精度の高い音源位置の制御が可能となり、高い臨場感が実現される。   With the configuration described above, the position of the sound source reproduced using the optimum reproduction signal generator is controlled depending on whether the localization sound source exists in an area close to or far from the listener, and the listener The switching of sound source position control at the boundary between the area far from the listener and the area close to the listener can be smoothed. As a result, regardless of the distance between the sound source and the listener, it is possible to control the position of the sound source with high accuracy, thereby realizing a high sense of realism.

なお、(1)上記の各装置は、具体的には、マイクロプロセッサ、ROM、RAM、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムである。前記RAMまたはハードディスクユニットには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。   Note that (1) Each of the above devices is specifically a computer system including a microprocessor, a ROM, a RAM, a hard disk unit, a display unit, a keyboard, a mouse, and the like. A computer program is stored in the RAM or hard disk unit. Each device achieves its functions by the microprocessor operating according to the computer program. Here, the computer program is configured by combining a plurality of instruction codes indicating instructions for the computer in order to achieve a predetermined function.

(2)上記の各装置を構成する構成要素の一部または全部は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムである。前記RAMには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、システムLSIは、その機能を達成する。   (2) A part or all of the constituent elements constituting each of the above-described devices may be configured by one system LSI (Large Scale Integration). The system LSI is an ultra-multifunctional LSI manufactured by integrating a plurality of components on a single chip, and specifically, a computer system including a microprocessor, ROM, RAM, and the like. . A computer program is stored in the RAM. The system LSI achieves its functions by the microprocessor operating according to the computer program.

(3)上記の各装置を構成する構成要素の一部または全部は、各装置に脱着可能なICカードまたは単体のモジュールから構成されているとしてもよい。前記ICカードまたは前記モジュールは、マイクロプロセッサ、ROM、RAMなどから構成されるコンピュータシステムである。前記ICカードまたは前記モジュールは、上記の超多機能LSIを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、前記ICカードまたは前記モジュールは、その機能を達成する。このICカードまたはこのモジュールは、耐タンパ性を有するとしてもよい。   (3) Part or all of the constituent elements constituting each of the above devices may be configured from an IC card that can be attached to and detached from each device or a single module. The IC card or the module is a computer system including a microprocessor, a ROM, a RAM, and the like. The IC card or the module may include the super multifunctional LSI described above. The IC card or the module achieves its function by the microprocessor operating according to the computer program. This IC card or this module may have tamper resistance.

(4)本発明は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるディジタル信号であるとしてもよい。   (4) The present invention may be the method described above. Further, the present invention may be a computer program that realizes these methods by a computer, or may be a digital signal composed of the computer program.

また、本発明は、前記コンピュータプログラムまたは前記ディジタル信号をコンピュータ読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、CD−ROM、MO、DVD、DVD−ROM、DVD−RAM、BD(Blu−ray Disc)、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されている前記ディジタル信号であるとしてもよい。   The present invention also provides a computer-readable recording medium such as a flexible disk, a hard disk, a CD-ROM, an MO, a DVD, a DVD-ROM, a DVD-RAM, a BD (Blu-ray Disc). ), Recorded in a semiconductor memory or the like. Further, the digital signal may be recorded on these recording media.

また、本発明は、前記コンピュータプログラムまたは前記ディジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。   The present invention may also be such that the computer program or the digital signal is transmitted via an electric communication line, a wireless or wired communication line, a network represented by the Internet, data broadcasting, or the like.

また、本発明は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、前記メモリは、上記コンピュータプログラムを記憶しており、前記マイクロプロセッサは、前記コンピュータプログラムにしたがって動作するとしてもよい。   The present invention may be a computer system including a microprocessor and a memory, wherein the memory stores the computer program, and the microprocessor operates according to the computer program.

また、前記プログラムまたは前記ディジタル信号を前記記録媒体に記録して移送することにより、または前記プログラムまたは前記ディジタル信号を前記ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。   In addition, the program or the digital signal is recorded on the recording medium and transferred, or the program or the digital signal is transferred via the network or the like, and executed by another independent computer system. It is good.

(5)上記実施の形態及び上記変形例をそれぞれ組み合わせるとしてもよい。   (5) The above embodiment and the above modifications may be combined.

本発明は、音源から受聴者までの距離にかかわらず正しい音源位置の認識を可能とし、高い臨場感を実現するマルチチャネルオーディオ再生装置等に適用できる。   The present invention can be applied to a multi-channel audio reproducing apparatus and the like that can recognize the correct sound source position regardless of the distance from the sound source to the listener and realize a high sense of reality.

1 定位音源推定部
2 音源信号分離部
3 音源位置パラメータ算出部
4 再生信号生成部
5 レフトチャネルスピーカ(L)
6 センターチャネルスピーカ(C)
7 ライトチャネルスピーカ(R)
8 サラウンドライトチャネルスピーカ(Rs)
9 サラウンドレフトチャネルスピーカ(Ls)
10 レフトチャネルヘッドホン(Lh)
11 ライトチャネルヘッドホン(Rh)
101 音源位置判定部
102 第1の再生信号生成部
103 第2の再生信号生成部
104 スイッチ部
105 信号分配部
201 受聴点
202 定位音源
203 レフトチャネルスピーカ(L)
204 センターチャネルスピーカ(C)
205 ライトチャネルスピーカ(R)
206 サラウンドライトチャネルスピーカ(Rs)
207 サラウンドレフトチャネルスピーカ(Ls)
208 レフトチャネルヘッドホン(Lh)
209 ライトチャネルヘッドホン(Rh)
301 円周(再生音響空間を分割する境界)
302 受聴者に近いエリア
303 受聴者から遠いエリア
401、402 矢印
DESCRIPTION OF SYMBOLS 1 Localization sound source estimation part 2 Sound source signal separation part 3 Sound source position parameter calculation part 4 Playback signal generation part 5 Left channel speaker (L)
6 Center channel speaker (C)
7 Light channel speaker (R)
8 Surround light channel speakers (Rs)
9 Surround Left Channel Speaker (Ls)
10 Left channel headphones (Lh)
11 Light channel headphones (Rh)
DESCRIPTION OF SYMBOLS 101 Sound source position determination part 102 1st reproduction | regeneration signal generation part 103 2nd reproduction | regeneration signal generation part 104 Switch part 105 Signal distribution part 201 Listening point 202 Localization sound source 203 Left channel speaker (L)
204 Center channel speaker (C)
205 Light channel speaker (R)
206 Surround Light Channel Speaker (Rs)
207 Surround Left Channel Speaker (Ls)
208 Left channel headphones (Lh)
209 Light channel headphones (Rh)
301 Circumference (boundary that divides playback acoustic space)
302 Area close to the listener 303 Area far from the listener 401, 402 Arrow

Claims (10)

受聴者の周辺に配置する第1のスピーカ群と、耳元近傍に配置する第2のスピーカ群を用いてマルチチャネルオーディオ信号を再生するマルチチャネルオーディオ再生装置であって、
入力マルチチャネル信号に含まれる定位音源を推定する定位音源推定部と、
定位音源が存在する場合に、入力マルチチャネル信号を定位音源の信号成分とそれ以外の定位しない音源信号の成分に分離する音源信号分離部と、
定位音源の位置を算出してパラメータ化する音源位置パラメータ算出部と、
音源位置パラメータに基づいて、定位音源が受聴者に近いエリアに存在するか、もしくは遠いエリアに存在するかを判定する音源位置判定部と、
定位音源が受聴者から遠いエリアに存在する場合に音源位置を制御する再生信号を生成する第1の再生信号生成部と、
定位音源が受聴者に近いエリアに存在する場合に音源位置を制御する再生信号を生成する第2の再生信号生成部と、
音源位置判定部の判定結果に従って、第1の再生信号生成部と第2の再生信号生成部を切り替えるスイッチ部と
を備えるマルチチャネルオーディオ再生装置。
A multi-channel audio reproduction device that reproduces a multi-channel audio signal using a first speaker group arranged near the listener and a second speaker group arranged near the ear,
A localization source estimation unit for estimating a localization source included in the input multi-channel signal;
A sound source signal separation unit that separates an input multi-channel signal into a signal component of a localization sound source and a component of a sound source signal other than the localization source when a localization sound source exists;
A sound source position parameter calculation unit for calculating and parameterizing the position of the localization sound source;
A sound source position determination unit that determines whether the localization sound source exists in an area close to the listener or in a distant area based on the sound source position parameter;
A first reproduction signal generation unit that generates a reproduction signal for controlling the sound source position when the localization sound source exists in an area far from the listener;
A second reproduction signal generation unit that generates a reproduction signal for controlling the sound source position when the localization sound source exists in an area close to the listener;
A multi-channel audio reproduction device comprising: a switch unit that switches between a first reproduction signal generation unit and a second reproduction signal generation unit according to a determination result of a sound source position determination unit.
前記音源位置パラメータは受聴者に対する定位音源の方向角γと距離rであり、前記受聴者に近いエリアと受聴者から遠いエリアの境界は、方向角γに対してあらかじめ定められた距離r1によって規定され、前記音源位置判定部は、方向角γにおける距離rと距離r1の大きさを比較することにより、音源位置を判定する
請求項1に記載のマルチチャネルオーディオ再生装置。
The sound source position parameter is the direction angle γ and the distance r of the localization sound source with respect to the listener, and the boundary between the area close to the listener and the area far from the listener is defined by a distance r1 predetermined with respect to the direction angle γ. The multi-channel audio reproduction device according to claim 1, wherein the sound source position determination unit determines a sound source position by comparing the distance r and the distance r1 at the direction angle γ.
前記第1の再生信号生成部は、前記第1のスピーカ群と前記第2のスピーカ群との間で、定位音源の信号エネルギを受聴者に対する方向角γと距離rにしたがって配分することによって再生される音源位置を制御し、
前記第2の再生信号生成部は、音源から受聴者までの伝達特性を付加した音源信号を、前記第2のスピーカ群へ出力することによって再生される音源位置を制御する
請求項1に記載のマルチチャネルオーディオ再生装置。
The first reproduction signal generation unit reproduces the distribution of the signal energy of the localization sound source between the first speaker group and the second speaker group according to the direction angle γ and the distance r to the listener. Control the sound source position
The second reproduction signal generation unit controls a sound source position to be reproduced by outputting a sound source signal to which a transfer characteristic from a sound source to a listener is added to the second speaker group. Multi-channel audio playback device.
前記距離r1は、人間の聴覚特性に合わせて方向角γに対応して定められる値である
請求項2に記載のマルチチャネルオーディオ再生装置。
The multi-channel audio reproduction device according to claim 2, wherein the distance r1 is a value determined in accordance with the direction angle γ in accordance with human auditory characteristics.
前記距離r1は、0.2mから1.0m程度の範囲で定められる
請求項2に記載のマルチチャネルオーディオ再生装置。
The multi-channel audio reproducing apparatus according to claim 2, wherein the distance r1 is determined in a range of about 0.2 m to 1.0 m.
受聴者の周辺に配置する第1のスピーカ群と、耳元近傍に配置する第2のスピーカ群を用いてマルチチャネルオーディオ信号を再生するマルチチャネルオーディオ再生装置であって、
入力マルチチャネル信号に含まれる定位音源を推定する定位音源推定部と、
定位音源が存在する場合に、入力マルチチャネル信号を定位音源の信号成分とそれ以外の定位しない音源信号の成分に分離する音源信号分離部と、
定位音源の位置を算出してパラメータ化する音源位置パラメータ算出部と、
音源位置パラメータに基づいて、定位音源が受聴者に近いエリアに存在するか、もしくは遠いエリアに存在するかを判定する音源位置判定部と、
定位音源が受聴者から遠いエリアに存在する場合に音源位置を制御する再生信号を生成する第1の再生信号生成部と、
定位音源が受聴者に近いエリアに存在する場合に音源位置を制御する再生信号を生成する第2の再生信号生成部と、
定位音源の信号成分とそれ以外の定位しない音源信号の成分を分配する信号分配部と、
音源位置判定部の判定結果に従って、定位音源の信号成分とそれ以外の定位しない音源信号の成分を、第1の再生信号生成部にのみ入力するか、もしくは、信号分配部を通して第1の再生信号生成部と第2の再生信号生成部の両方に入力するかを切り替えるスイッチ部と
を備え、
第1の再生信号生成部の出力と第2の再生信号生成部の出力を加算することによって出力再生信号を生成する
マルチチャネルオーディオ再生装置。
A multi-channel audio reproduction device that reproduces a multi-channel audio signal using a first speaker group arranged near the listener and a second speaker group arranged near the ear,
A localization source estimation unit for estimating a localization source included in the input multi-channel signal;
A sound source signal separation unit that separates an input multi-channel signal into a signal component of a localization sound source and a component of a sound source signal other than the localization source when a localization sound source exists;
A sound source position parameter calculation unit for calculating and parameterizing the position of the localization sound source;
A sound source position determination unit that determines whether the localization sound source exists in an area close to the listener or in a distant area based on the sound source position parameter;
A first reproduction signal generation unit that generates a reproduction signal for controlling the sound source position when the localization sound source exists in an area far from the listener;
A second reproduction signal generation unit that generates a reproduction signal for controlling the sound source position when the localization sound source exists in an area close to the listener;
A signal distribution unit that distributes the signal component of the localization sound source and the other non-localization sound source signal components;
According to the determination result of the sound source position determination unit, the signal component of the localization sound source and the other non-localization sound source signal components are input only to the first reproduction signal generation unit, or the first reproduction signal is transmitted through the signal distribution unit. A switch unit for switching whether to input to both the generation unit and the second reproduction signal generation unit,
A multi-channel audio reproduction device that generates an output reproduction signal by adding the output of a first reproduction signal generation unit and the output of a second reproduction signal generation unit.
前記信号分配部は、前記定位音源の信号成分を、あらかじめ定められた比率に従って2つの信号に分配し、それぞれを第1の再生信号生成部と第2の再生信号生成部に入力する
請求項6に記載のマルチチャネルオーディオ再生装置。
The signal distribution unit distributes the signal component of the localization sound source into two signals according to a predetermined ratio, and inputs each of the signals to the first reproduction signal generation unit and the second reproduction signal generation unit. A multi-channel audio playback apparatus according to claim 1.
前記信号分配部は、前記定位音源の信号成分を、定位音源から受聴者までの距離に基づく比率に従って2つの信号に分配し、それぞれを第1の再生信号生成部と第2の再生信号生成部に入力する
請求項6に記載のマルチチャネルオーディオ再生装置。
The signal distribution unit distributes the signal component of the localization sound source into two signals according to a ratio based on the distance from the localization sound source to the listener, and the first reproduction signal generation unit and the second reproduction signal generation unit, respectively. The multi-channel audio reproducing apparatus according to claim 6.
受聴者の周辺に配置する第1のスピーカ群と、耳元近傍に配置する第2のスピーカ群を用いてマルチチャネルオーディオ信号を再生するマルチチャネルオーディオ再生方法であって、
入力マルチチャネル信号に含まれる定位音源を推定するステップと、
定位音源が存在する場合に、入力マルチチャネル信号を定位音源の信号成分とそれ以外の信号の成分に分離するステップと、
定位音源の位置を算出して音源位置パラメータ化するステップと、
音源位置パラメータに基づいて、定位音源が受聴者に近いエリアに存在するか、もしくは遠いエリアに存在するかの音源位置判定を行うステップと、
定位音源が受聴者から遠いエリアに存在する場合に音源位置を制御する再生信号を生成する第1の再生信号生成のステップと、
定位音源が受聴者に近いエリアに存在する場合に音源位置を制御する再生信号を生成する第2の再生信号生成のステップと、
音源位置判定のステップの判定結果に従って、第1の再生信号生成のステップと第2の再生信号生成のステップを切り替えるステップから構成される
マルチチャネルオーディオ再生方法。
A multi-channel audio reproduction method for reproducing a multi-channel audio signal using a first speaker group arranged in the vicinity of a listener and a second speaker group arranged in the vicinity of the ear,
Estimating a localization sound source included in the input multichannel signal;
Separating the input multichannel signal into a signal component of the localization sound source and a component of the other signal when a localization sound source exists;
Calculating the position of the localization sound source and converting it to a sound source position parameter;
Based on the sound source position parameter, performing a sound source position determination whether the localization sound source exists in an area close to the listener or in a distant area;
A first reproduction signal generation step of generating a reproduction signal for controlling the sound source position when the localization sound source is in an area far from the listener;
A second reproduction signal generation step of generating a reproduction signal for controlling the sound source position when the localization sound source is present in an area close to the listener;
A multi-channel audio reproduction method comprising a step of switching between a first reproduction signal generation step and a second reproduction signal generation step according to a determination result of a sound source position determination step.
請求項9に記載のマルチチャネルオーディオ再生方法に含まれる各ステップを、コンピュータに実行させるためのプログラム。   A program for causing a computer to execute each step included in the multi-channel audio reproduction method according to claim 9.
JP2010187692A 2010-08-24 2010-08-24 Multichannel audio reproducer and multichannel audio reproducing method Pending JP2012049652A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010187692A JP2012049652A (en) 2010-08-24 2010-08-24 Multichannel audio reproducer and multichannel audio reproducing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010187692A JP2012049652A (en) 2010-08-24 2010-08-24 Multichannel audio reproducer and multichannel audio reproducing method

Publications (1)

Publication Number Publication Date
JP2012049652A true JP2012049652A (en) 2012-03-08

Family

ID=45904062

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010187692A Pending JP2012049652A (en) 2010-08-24 2010-08-24 Multichannel audio reproducer and multichannel audio reproducing method

Country Status (1)

Country Link
JP (1) JP2012049652A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105407432A (en) * 2015-10-30 2016-03-16 努比亚技术有限公司 Method and system for achieving audio play
RU2656986C1 (en) * 2014-06-26 2018-06-07 Самсунг Электроникс Ко., Лтд. Method and device for acoustic signal rendering and machine-readable recording media

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2656986C1 (en) * 2014-06-26 2018-06-07 Самсунг Электроникс Ко., Лтд. Method and device for acoustic signal rendering and machine-readable recording media
US10484810B2 (en) 2014-06-26 2019-11-19 Samsung Electronics Co., Ltd. Method and device for rendering acoustic signal, and computer-readable recording medium
CN105407432A (en) * 2015-10-30 2016-03-16 努比亚技术有限公司 Method and system for achieving audio play

Similar Documents

Publication Publication Date Title
JP4743790B2 (en) Multi-channel audio surround sound system from front loudspeakers
JP5323210B2 (en) Sound reproduction apparatus and sound reproduction method
KR100608024B1 (en) Apparatus for regenerating multi channel audio input signal through two channel output
TWI489887B (en) Virtual audio processing for loudspeaker or headphone playback
US9749767B2 (en) Method and apparatus for reproducing stereophonic sound
JP4914124B2 (en) Sound image control apparatus and sound image control method
US8335331B2 (en) Multichannel sound rendering via virtualization in a stereo loudspeaker system
JP5496235B2 (en) Improved reproduction of multiple audio channels
KR20080060640A (en) Method and apparatus for reproducing a virtual sound of two channels based on individual auditory characteristic
KR102160248B1 (en) Apparatus and method for localizing multichannel sound signal
JP5986426B2 (en) Sound processing apparatus and sound processing method
JP5118267B2 (en) Audio signal reproduction apparatus and audio signal reproduction method
EP2229012B1 (en) Device, method, program, and system for canceling crosstalk when reproducing sound through plurality of speakers arranged around listener
JP2006033847A (en) Sound-reproducing apparatus for providing optimum virtual sound source, and sound reproducing method
JP5787128B2 (en) Acoustic system, acoustic signal processing apparatus and method, and program
JP4810621B1 (en) Audio signal conversion apparatus, method, program, and recording medium
ES2952212T3 (en) Stereophonic sound reproduction method and apparatus
JP2012049652A (en) Multichannel audio reproducer and multichannel audio reproducing method
JP6512767B2 (en) Sound processing apparatus and method, and program
JP7332745B2 (en) Speech processing method and speech processing device
JP2005184140A (en) Stereophonic sound recording method, stereophonic sound reproducing method, and stereophonic sound reproducing apparatus
JP3942914B2 (en) Stereo signal processor
GB2583438A (en) Signal processing device for headphones
Aarts et al. NAG