JP6228389B2 - Acoustic signal reproduction device - Google Patents

Acoustic signal reproduction device Download PDF

Info

Publication number
JP6228389B2
JP6228389B2 JP2013102436A JP2013102436A JP6228389B2 JP 6228389 B2 JP6228389 B2 JP 6228389B2 JP 2013102436 A JP2013102436 A JP 2013102436A JP 2013102436 A JP2013102436 A JP 2013102436A JP 6228389 B2 JP6228389 B2 JP 6228389B2
Authority
JP
Japan
Prior art keywords
channel
acoustic
signal
audio
video format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013102436A
Other languages
Japanese (ja)
Other versions
JP2014222856A (en
Inventor
大出 訓史
訓史 大出
靖茂 中山
靖茂 中山
渡辺 馨
馨 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
NHK Engineering System Inc
Original Assignee
Japan Broadcasting Corp
NHK Engineering System Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp, NHK Engineering System Inc filed Critical Japan Broadcasting Corp
Priority to JP2013102436A priority Critical patent/JP6228389B2/en
Publication of JP2014222856A publication Critical patent/JP2014222856A/en
Application granted granted Critical
Publication of JP6228389B2 publication Critical patent/JP6228389B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Stereophonic System (AREA)

Description

この発明は、複数の音響空間層を持つマルチチャンネル音響方式の音響信号再生装置関する。 The present invention relates to audio signal reproducing apparatus of a multi-channel sound system having a plurality of layered sound field.

現在番組制作が行われている2チャンネル音響方式、5.1チャンネル音響方式に加え、7.1チャンネルや22.2チャンネルなどの5.1チャンネル音響方式を超えた「3次元(立体)音響方式」など複数の音響方式が提案されている。オーディオ関連の国際標準化団体であるITU-Rでは、ITU-R勧告として5.1チャンネル音響方式を超えた3次元音響方式(advanced multichannel audio system)に対する要求条件(非特許文献1)を定めており、今後も複数の音響方式が提案されることが予測される。これらの音響方式を共通のフォーマットで表現することで、次世代オーディオシステムに適用可能であり種々の方面への活用が可能な柔軟なシステムとすることができる。   In addition to the two-channel and 5.1-channel sound systems currently being produced, multiple sound systems such as the “three-dimensional (three-dimensional) sound system” that exceed the 5.1-channel sound systems such as 7.1 and 22.2 channels are proposed. Has been. The ITU-R, an international standardization organization related to audio, has set requirements (non-patent document 1) for a three-dimensional acoustic system (advanced multichannel audio system) beyond the 5.1 channel acoustic system as an ITU-R recommendation. It is expected that a plurality of acoustic methods will be proposed. By expressing these acoustic systems in a common format, it can be applied to a next-generation audio system and can be a flexible system that can be used in various fields.

"Performance requirements for an advanced multichannel stere ophonic sound system for use with or without accompanying picture", ITU-R勧告BS. 1909"Performance requirements for an advanced multichannel stere ophonic sound system for use with or without accompanying picture", ITU-R recommendation BS. 1909

種々の音響方式を表現可能な共通のフォーマットとして、「単一の音響空間層を持つ音響信号」の検討は進んでいる。ここで、空間的に配置された複数のチャンネル信号によって構築される音を単一の音響空間層とする。これまでの番組制作では番組に必要な音を全て単一の音響空間層に配置している。これまで一つにまとめていた音響空間層を幾つかの層に分割して音響番組制作を行い、「複数の音響空間層を持つ音響信号」の形式を用いることで、番組交換時の受取先や家庭の環境に合わせて受信した音響信号の変形・変換・入替を容易に行うことができるようになる。これ以降、「マルチチャンネル音響方式」とは「複数の音響空間層を持つ音響方式」を意図するものとして説明を行う。   As a common format capable of expressing various acoustic systems, “acoustic signals having a single acoustic space layer” are being studied. Here, a sound constructed by a plurality of spatially arranged channel signals is defined as a single acoustic space layer. In conventional program production, all the sounds required for a program are arranged in a single acoustic space layer. Dividing the acoustic space layer that has been integrated into several layers into several layers, producing an audio program, and using the format of "acoustic signal with multiple acoustic space layers", the recipient at the time of program exchange In addition, it is possible to easily transform, convert, and replace the received acoustic signal according to the home environment. Hereinafter, the “multi-channel acoustic system” will be described as intended to be an “acoustic system having a plurality of acoustic spatial layers”.

例えば、マルチチャンネル音響方式を用いて放送される放送番組は、様々な音響方式によって制作され、様々な再生環境において再生される。番組制作においては、画面上の映像と音像を一致させる場合があるが、次世代放送フォーマットとして提案されている映像フォーマットに対して想定されている視野角は、例えば30度から100度という大きな幅があり、空間的に同じ位置にスピーカが設置されていても、映像フォーマットによってスピーカの役割が異なる場合がある。   For example, a broadcast program broadcast using a multi-channel audio system is produced by various audio systems and reproduced in various reproduction environments. In program production, the video on the screen may match the sound image, but the viewing angle assumed for the video format proposed as the next-generation broadcast format is as large as 30 to 100 degrees, for example. Even if the speakers are installed at the same spatial position, the role of the speakers may differ depending on the video format.

したがって、かかる点に鑑みてなされた本発明の目的は、複数の音響空間層を持つマルチチャンネル音響方式に対応し、映像フォーマットに応じた役割を持つ音響チャンネル信号を適切に選択して再生可能な音響信号再生装置提供することにある。 Accordingly, an object of the present invention made in view of the above point is to support a multi-channel audio system having a plurality of acoustic space layers, and to appropriately select and reproduce an audio channel signal having a role corresponding to a video format. An object is to provide an acoustic signal reproducing device.

上述した諸課題を解決すべく、本発明に係る音響信号再生装置は、異なる映像フォーマットにそれぞれ対応する音響空間層を複数含むマルチチャンネル音響信号の再生装置であって、前記マルチチャンネル音響信号は音響空間層に対応する映像フォーマットをメタデータに含み、前記音響空間層対応する映像フォーマットと、再生環境の映像フォーマットとに基づき選択した1つの音響空間層の音響チャンネル信号の復号化を行い、前記選択した音響空間層以外の音響空間層の音響チャンネル信号の復号化は行わない復号化部、を備える。 In order to solve the above-described problems, an audio signal reproduction device according to the present invention is a multi-channel audio signal reproduction device including a plurality of acoustic space layers respectively corresponding to different video formats, and the multi-channel audio signal is an audio signal. includes a video format corresponding to the space layer in the metadata, the video format corresponding to the acoustic space layer, have row decoding of the audio channel signals of a single layered sound field selected on the basis of the video format of the playback environment, A decoding unit that does not decode an acoustic channel signal of an acoustic space layer other than the selected acoustic space layer .

また、前記再生環境の画面配置が、前記映像フォーマットに対する標準配置と異なる場合、前記音響チャンネル信号のうち、画面と連動する音響チャンネル信号が、前記再生環境の画面配置における音響チャンネル位置から再生されるように前記音響チャンネル信号の変換を行う再生チャンネル変換部を備える、ことが好ましい。   In addition, when the screen layout of the playback environment is different from the standard layout for the video format, among the acoustic channel signals, an acoustic channel signal that is linked to the screen is played from the acoustic channel position in the screen layout of the playback environment. It is preferable that a reproduction channel conversion unit for converting the acoustic channel signal is provided.

また、前記再生環境のスピーカ配置が、前記映像フォーマットに対する標準配置と異なる場合、前記音響チャンネル信号のうち、画面と連動しない音響チャンネル信号が、前記映像フォーマットに対する標準配置から再生されるように前記音響チャンネル信号の変換を行う再生チャンネル変換部を備える、ことが好ましい。   In addition, when the speaker arrangement of the reproduction environment is different from the standard arrangement for the video format, the audio channel signal that is not linked to the screen among the audio channel signals is reproduced from the standard arrangement for the video format. It is preferable to include a reproduction channel conversion unit that converts channel signals.

本発明に係る音響信号再生装置よれば、複数の音響空間層を持つマルチチャンネル音響方式に対応し、映像フォーマットに応じた役割を持つ音響チャンネル信号を適切に選択して再生することが可能になる。 According to the audio signal reproducing device of the present invention, it is possible to appropriately select and reproduce an audio channel signal having a role corresponding to a video format, corresponding to a multi-channel audio system having a plurality of acoustic space layers. Become.

本発明の第1の実施形態に係る音響信号再生装置の構成を示す図である。It is a figure which shows the structure of the acoustic signal reproducing | regenerating apparatus which concerns on the 1st Embodiment of this invention. マルチチャンネル音響信号に含まれる音響空間層と映像フォーマットの画面配置の一例を示す図である。It is a figure which shows an example of the screen arrangement | positioning of the sound space layer and video format which are contained in a multichannel sound signal. マルチチャンネル音響信号におけるメタデータの一例を示す図である。It is a figure which shows an example of the metadata in a multichannel acoustic signal. 映像フォーマットによるチャンネルの役割の違いを示す図である。It is a figure which shows the difference in the role of the channel by a video format. 再生環境の画面配置が映像フォーマットに対する標準配置と異なる場合の音響チャンネル信号の変換を示す図である。It is a figure which shows conversion of an acoustic channel signal when the screen arrangement | positioning of a reproduction environment differs from the standard arrangement | positioning with respect to a video format. 再生環境のスピーカ配置が映像フォーマットに対する標準配置と異なる場合の音響チャンネル信号の変換を示す図である。It is a figure which shows conversion of an audio channel signal when the speaker arrangement | positioning of a reproduction environment differs from the standard arrangement | positioning with respect to a video format. 再生環境の画面配置における音響チャンネル位置と映像フォーマットに対する標準配置との関係を示す図である。It is a figure which shows the relationship between the acoustic channel position in the screen arrangement | positioning of reproduction | regeneration environment, and the standard arrangement | positioning with respect to a video format. 振幅パンニング法の概要を示す図である。It is a figure which shows the outline | summary of an amplitude panning method. 本発明の一実施形態に係る音響信号作成装置の構成を示す図である。It is a figure which shows the structure of the acoustic signal production apparatus which concerns on one Embodiment of this invention.

以降、諸図面を参照しながら、本発明の実施態様を詳細に説明する。ここで、本発明は、「複数の音響空間層を持つ音響信号」であるマルチチャンネル音響信号に対応するものである。本件出願人は、「単一の音響空間層を持つ音響信号」について韓国特許出願(10-2012-0112984)を行っており、また、「複数の音響空間層を持つ音響信号」について日本国特許出願(特願2013-010544)を行っている。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. Here, the present invention corresponds to a multi-channel acoustic signal that is an “acoustic signal having a plurality of acoustic spatial layers”. The applicant has filed a Korean patent application (10-2012-0112984) for “acoustic signals having a single acoustic space layer” and a Japanese patent for “acoustic signals having multiple acoustic space layers”. An application has been filed (Japanese Patent Application 2013-010544).

図1は、本発明の一実施形態に係る音響信号再生装置の構成を示す図である。音響信号再生装置10は、デマルチプレクサ11(DEMUX)と、復号化部12と、再生チャンネル変換部13とを備え、音響信号再生装置10の出力信号はスピーカ14により音として再生される。   FIG. 1 is a diagram showing a configuration of an acoustic signal reproduction device according to an embodiment of the present invention. The acoustic signal reproduction device 10 includes a demultiplexer 11 (DEMUX), a decoding unit 12, and a reproduction channel conversion unit 13. The output signal of the acoustic signal reproduction device 10 is reproduced as sound by the speaker 14.

デマルチプレクサ11は、入力されたマルチチャンネル音響データストリームをメタデータと音響チャンネル信号に分離する。デマルチプレクサ11は、音響チャンネル信号を復号化部12に出力し、メタデータを復号化部12及び再生チャンネル変換部13に出力する。   The demultiplexer 11 separates the input multi-channel audio data stream into metadata and audio channel signals. The demultiplexer 11 outputs the acoustic channel signal to the decoding unit 12 and outputs the metadata to the decoding unit 12 and the reproduction channel conversion unit 13.

図2は、本実施形態におけるマルチチャンネル音響信号(音響データストリーム)に含まれる音響空間層と映像フォーマットの画面配置の一例を示す図である。図2に示される音響空間層100は利用者を中心に10チャンネル(110〜200)が配置される。また、図示の通り、UHDTV(Ultra High Definition Television)の映像フォーマットであるUHDTV-1(4K)に対応する画面配置320と、UHDTV-2(スーパーハイビジョン)に対応する画面配置310とは、視野角が異なるものである。   FIG. 2 is a diagram illustrating an example of a screen arrangement of an acoustic space layer and a video format included in a multichannel audio signal (acoustic data stream) in the present embodiment. The acoustic space layer 100 shown in FIG. 2 has 10 channels (110 to 200) arranged around the user. In addition, as shown in the drawing, the screen layout 320 corresponding to UHDTV-1 (4K) which is a video format of UHDTV (Ultra High Definition Television) and the screen layout 310 corresponding to UHDTV-2 (Super Hi-Vision) have a viewing angle. Are different.

図3は、マルチチャンネル音響信号における音響チャンネル信号及びメタデータの一例を示す図である。図3のメタデータ(Sound Essence 000)には、当該マルチチャンネル音響信号が音声(Talk)の役割を持つ1層の音響空間層(Sound Field)であり、映像フォーマットUHDTV-2及びUHDTV-1それぞれに対し、第1の音響空間層(Sound Field 01)及び第2の音響空間層(Sound Field 02)が対応することが記載されている。   FIG. 3 is a diagram illustrating an example of an acoustic channel signal and metadata in a multi-channel acoustic signal. The metadata (Sound Essence 000) in FIG. 3 includes a single sound field layer (Sound Field) in which the multi-channel sound signal plays a role of voice (Talk), and each of the video formats UHDTV-2 and UHDTV-1 On the other hand, it is described that the first acoustic space layer (Sound Field 01) and the second acoustic space layer (Sound Field 02) correspond.

第1の音響空間層(Sound Field 01)は、UHDTV-2に対応し、10チャンネルの完プロ番組(complete mix、再生に必要な音が全て収録された番組)であり、画面左右の視野角が60度であることが記載されている。また、各音響チャンネル信号110〜200に対して、音響チャンネル信号の番号(Channel 01-10)、チャンネルラベル(FL FR FLc FRc FC SiL SiR BL BR BC)、各チャンネルの位置が画面と連動するか(Linked/Unlinked)が記載されている。   The first acoustic space layer (Sound Field 01) corresponds to UHDTV-2 and is a 10-channel complete program (complete mix, a program that contains all the sounds necessary for playback). Is 60 degrees. Also, for each acoustic channel signal 110-200, whether the acoustic channel signal number (Channel 01-10), channel label (FL FR FLc FRc FC SiL SiR BL BR BC), and the position of each channel are linked to the screen (Linked / Unlinked) is described.

第2の音響空間層(Sound Field 02)は、UHDTV-1に対応し、10チャンネルの完プロ番組(complete mix、再生に必要な音が全て収録された番組)であり、画面左右の視野角が30度であることが記載されている。また、各音響チャンネル信号110〜200に対して、音響チャンネル信号の番号(Channel 01-10)、チャンネルラベル(FLw FRw FL FR FC SiL SiR BL BR BC)、各チャンネルの位置が画面と連動するか(Linked/Unlinked)が記載されている。上述の通り、第1の音響空間層及び第2の音響空間層は、各チャンネルの配置は同じ空間位置となるが、画面左右のチャンネルの役割(チャンネルラベル)が異なるものである。   The second acoustic space layer (Sound Field 02) corresponds to UHDTV-1 and is a 10 channel complete professional program (complete mix, a program that contains all the sounds necessary for playback). Is 30 degrees. Also, for each acoustic channel signal 110-200, whether the acoustic channel signal number (Channel 01-10), channel label (FLw FRw FL FR FC SiL SiR BL BR BC), and the position of each channel are linked to the screen (Linked / Unlinked) is described. As described above, in the first acoustic space layer and the second acoustic space layer, the arrangement of the channels is the same spatial position, but the roles of the left and right channels (channel labels) are different.

図4は、映像フォーマットによるチャンネルの役割の違いを示す図である。図4(a)はUHDTV-1に対応する画面配置320と、各チャンネルの役割を示す図である。UHDTV-1の場合、画面配置320の両端に対応するチャンネル130がLch、チャンネル140がRchとなる。また、チャンネル130より外側(ワイド側)となるチャンネル110はLwチャンネル、チャンネル140より外側となるチャンネル120はRwチャンネルとなる。   FIG. 4 is a diagram illustrating the difference in channel roles depending on the video format. FIG. 4A shows a screen layout 320 corresponding to UHDTV-1 and the role of each channel. In the case of UHDTV-1, the channel 130 corresponding to both ends of the screen arrangement 320 is Lch, and the channel 140 is Rch. Further, the channel 110 outside (wide side) from the channel 130 is the Lw channel, and the channel 120 outside the channel 140 is the Rw channel.

図4(b)はUHDTV-2に対応する画面配置310と、各チャンネルの役割を示す図である。UHDTV-2の場合、画面配置310の両端に対応するチャンネル110がLch、チャンネル120がRchとなる。また、チャンネル110より内側(センター側)となるチャンネル130はLcチャンネル、チャンネル120より内側となるチャンネル140はRcチャンネルとなる。   FIG. 4B is a diagram showing a screen layout 310 corresponding to UHDTV-2 and the role of each channel. In the case of UHDTV-2, the channel 110 corresponding to both ends of the screen arrangement 310 is Lch and the channel 120 is Rch. Further, the channel 130 on the inner side (center side) from the channel 110 is the Lc channel, and the channel 140 on the inner side from the channel 120 is the Rc channel.

なお、図4では、画面の両サイドのチャンネルであるLch、Rchを例に挙げたが、LEF(低周波帯域用の効果チャンネル)などを含む他のチャンネルも、映像フォーマットにより役割が変化する場合がある。   In FIG. 4, Lch and Rch, which are channels on both sides of the screen, are taken as an example, but the roles of other channels including LEF (effect channel for low frequency band) also change depending on the video format. There is.

復号化部12は、マルチチャンネル音響信号に含まれるメタデータと再生環境データに基づき、再生環境に対応した音響空間層を選択し、選択した音響空間層に含まれる音響チャンネル信号を復号化する。再生環境データとは、映像フォーマット、画面サイズ、スピーカ配置、利用者の位置などであり、装置毎に予め定められたデータや、リモコン等を通じて利用者から入力されるデータである。   The decoding unit 12 selects an acoustic space layer corresponding to the reproduction environment based on the metadata and the reproduction environment data included in the multi-channel audio signal, and decodes the acoustic channel signal included in the selected acoustic space layer. The reproduction environment data is a video format, a screen size, a speaker arrangement, a user position, and the like, and is data set in advance for each device or data input from the user through a remote controller or the like.

図2、3に示すマルチチャンネル音響信号の場合、復号化部12は、再生環境データとして映像フォーマットがUHDTV-2である旨の情報を受信すると、第1の音響空間層(Sound Field 01)を選択し、各音響チャンネル信号110〜200の復号化を行う。また、復号化部12は、再生環境データとして映像フォーマットがUHDTV-1である旨の情報を受信すると、第2の音響空間層(Sound Field 02)を選択し、各音響チャンネル信号110〜200の復号化を行う。なお、復号化部12は、メタデータ及び再生環境データを参照し、再生対象とならない音響空間層については、当該音響空間層の各音響チャンネル信号の復号化は行わなくてもよい。これにより、復号化に関する消費電力を低減することができる。   In the case of the multi-channel audio signal shown in FIGS. 2 and 3, when the decoding unit 12 receives information indicating that the video format is UHDTV-2 as the reproduction environment data, the decoding unit 12 displays the first acoustic space layer (Sound Field 01). Select and decode each acoustic channel signal 110-200. In addition, when receiving information indicating that the video format is UHDTV-1 as the reproduction environment data, the decoding unit 12 selects the second acoustic space layer (Sound Field 02), and stores each of the acoustic channel signals 110 to 200. Decrypt. Note that the decoding unit 12 refers to the metadata and the reproduction environment data, and for the acoustic space layer that is not to be reproduced, it is not necessary to decode each acoustic channel signal of the acoustic space layer. Thereby, the power consumption regarding a decoding can be reduced.

再生チャンネル変換部13は、メタデータと再生環境データとに基づき、各再生スピーカに入力する音響チャンネル信号を生成する。再生チャンネル変換部13は、再生環境の画面配置及びスピーカ配置が、映像フォーマットに対する標準的な配置(標準配置)と同じか所定の許容範囲内に含まれる場合には、そのまま対応するスピーカより音響チャンネル信号を再生させる。これにより、不要な信号処理による音響品質の劣化を防ぐことができる。なお、画面配置及びスピーカ配置に関する映像フォーマットに対する標準配置とは、各音響空間層における理想的な再生環境であって、例えば標準規格に基づき定めたり、番組制作者が想定する再生環境を適宜設定したりできるものである。再生チャンネル変換部13は、再生環境の画面配置及びスピーカ配置が、映像フォーマットに対する標準配置と(許容範囲以上)異なる場合には、音響チャンネル信号の変換を行う。   The reproduction channel conversion unit 13 generates an acoustic channel signal to be input to each reproduction speaker based on the metadata and the reproduction environment data. When the screen layout and the speaker layout of the playback environment are the same as the standard layout (standard layout) for the video format or within a predetermined allowable range, the playback channel conversion unit 13 receives the sound channel from the corresponding speaker as it is. Play the signal. As a result, it is possible to prevent deterioration of sound quality due to unnecessary signal processing. The standard layout for the video format related to the screen layout and the speaker layout is an ideal playback environment in each acoustic space layer. For example, the standard layout is determined based on the standard, or the playback environment assumed by the program producer is appropriately set. It can be. The reproduction channel conversion unit 13 converts an audio channel signal when the screen arrangement and the speaker arrangement of the reproduction environment are different from the standard arrangement for the video format (over an allowable range).

図5は、再生環境の画面配置が映像フォーマットに対する標準配置と異なる場合の音響チャンネル信号の変換を示すものである。ここで、UHDTV-2の画面配置及びスピーカ配置の標準配置は、図4(b)に示す画面配置310及びチャンネル110〜200であるものとする。図5では、画面配置310は図4(b)に示すUHDTV-2の標準配置と異なる。このため、再生環境の画面配置における音響チャンネル位置は、Lチャンネル410、Lcチャンネル430、Rcチャンネル440、Rチャンネル420として図示するように、標準配置であるチャンネル110、130、140、120と異なる位置となる。図3のメタデータにおいて、UHDTV-2に対応する第1の音響空間層のうち、音響チャンネル信号110〜150は、各チャンネルの位置が画面と連動する(Linked)ことが記載されている。画面配置が標準配置と異なる場合、画面と連動する音響チャンネル信号については、その再生位置の変換が必要となる。このため、再生チャンネル変換部13は、音響チャンネル信号110〜140は、図5に示すチャンネル410〜440の位置に虚音像が生成されるように、音響チャンネル信号の変換を行う。なお、画面配置の変化によるチャンネル位置の変更がない音響チャンネル信号150については、音響チャンネル信号の変換を省略することができる。また、音響チャンネル信号160〜200は、各チャンネルの位置が画面と連動しない(UnLinked)ため、再生チャンネル変換部13は、そのまま対応するスピーカより音響チャンネル信号を再生させる。   FIG. 5 shows the conversion of sound channel signals when the screen layout of the playback environment is different from the standard layout for the video format. Here, it is assumed that the standard layout of the UHDTV-2 screen layout and speaker layout is the screen layout 310 and the channels 110 to 200 shown in FIG. In FIG. 5, the screen layout 310 is different from the standard layout of UHDTV-2 shown in FIG. For this reason, the acoustic channel positions in the screen layout of the reproduction environment are different from the standard channels 110, 130, 140, and 120 as illustrated as the L channel 410, the Lc channel 430, the Rc channel 440, and the R channel 420. It becomes. In the metadata of FIG. 3, among the first acoustic space layers corresponding to UHDTV-2, the acoustic channel signals 110 to 150 describe that the position of each channel is linked to the screen (Linked). When the screen layout is different from the standard layout, it is necessary to convert the playback position of the acoustic channel signal linked with the screen. Therefore, the reproduction channel conversion unit 13 converts the acoustic channel signals 110 to 140 so that a virtual sound image is generated at the positions of the channels 410 to 440 shown in FIG. Note that the conversion of the acoustic channel signal can be omitted for the acoustic channel signal 150 in which the channel position is not changed by the change in the screen layout. Moreover, since the position of each channel of the acoustic channel signals 160 to 200 is not linked to the screen (UnLinked), the reproduction channel conversion unit 13 reproduces the acoustic channel signal from the corresponding speaker as it is.

図6は、再生環境のスピーカ配置が映像フォーマットに対する標準配置と異なる場合の音響チャンネル信号の変換を示すものである。図6では、画面配置310は図4(b)に示すUHDTV-2の標準的な画面配置と異なり、さらに、再生環境の画面配置における音響チャンネル位置に対応して、チャンネル110〜140を、それぞれLチャンネル210、Lcチャンネル230、Rcチャンネル240、Rチャンネル220の位置へと配置したものである。図3のメタデータにおいて、UHDTV-2に対応する第1の音響空間層のうち、音響チャンネル信号110〜150は、各チャンネルの位置が画面と連動する(Linked)ことが記載されている。図6の場合、スピーカ配置が再生環境の画面配置における音響チャンネル位置となっているため、再生チャンネル変換部13は、音響チャンネル信号110〜150は、そのまま対応するスピーカより音響チャンネル信号を再生させる。また、音響チャンネル信号160〜200は、各チャンネルの位置が画面と連動しない(UnLinked)ため、再生チャンネル変換部13は、対応するスピーカの標準配置の位置に虚音像が生成されるように、音響チャンネル信号の変換を行う。   FIG. 6 shows the conversion of the acoustic channel signal when the speaker arrangement in the reproduction environment is different from the standard arrangement for the video format. In FIG. 6, the screen layout 310 is different from the standard screen layout of UHDTV-2 shown in FIG. 4B, and the channels 110 to 140 are respectively set corresponding to the acoustic channel positions in the screen layout of the playback environment. The L channel 210, the Lc channel 230, the Rc channel 240, and the R channel 220 are arranged at positions. In the metadata of FIG. 3, among the first acoustic space layers corresponding to UHDTV-2, the acoustic channel signals 110 to 150 describe that the position of each channel is linked to the screen (Linked). In the case of FIG. 6, since the speaker arrangement is the acoustic channel position in the screen arrangement of the reproduction environment, the reproduction channel conversion unit 13 reproduces the acoustic channel signals from the corresponding speakers as they are as the acoustic channel signals 110 to 150. In addition, since the position of each channel is not linked to the screen (UnLinked) in the acoustic channel signals 160 to 200, the reproduction channel conversion unit 13 generates a sound image so that a virtual sound image is generated at the position of the standard arrangement of the corresponding speaker. Performs channel signal conversion.

図7は、再生環境に合わせて配置されたスピーカと映像フォーマットに対する標準配置との関係を示す図である。チャンネル210及び220は、再生環境の画面配置に合わせて配置されたスピーカであり、チャンネル110〜200は、映像フォーマットにおけるスピーカの標準配置を示すものである。図7において、Lchの音響チャンネル信号のメタデータにチャンネルの位置が画面と連動すること(Linked)が記載されている場合、再生チャンネル変換部13は、チャンネル210よりそのままLchの音響チャンネル信号を再生させる。また、Lchの音響チャンネル信号のメタデータにチャンネルの位置が画面と連動しないこと(Unlinked)が記載されている場合、再生チャンネル変換部13は、チャンネル110の位置に虚音像が生成されるように、音響チャンネル信号の変換を行う。   FIG. 7 is a diagram showing the relationship between the speakers arranged in accordance with the reproduction environment and the standard arrangement for the video format. Channels 210 and 220 are speakers arranged in accordance with the screen layout of the reproduction environment, and channels 110 to 200 indicate a standard layout of speakers in the video format. In FIG. 7, when the metadata of the Lch acoustic channel signal describes that the channel position is linked to the screen (Linked), the reproduction channel conversion unit 13 reproduces the Lch acoustic channel signal as it is from the channel 210. Let Further, when the metadata of the Lch acoustic channel signal describes that the channel position is not linked to the screen (Unlinked), the reproduction channel conversion unit 13 generates a virtual sound image at the channel 110 position. , Conversion of acoustic channel signals.

再生チャンネル変換部13による虚音像の生成には、任意の好適な方法を用いることができる。例えば、音響チャンネル信号の変換方法として、VBAP(Vector Base Amplitude Panning)や音響インテンシティが一致するように変換する方法などがある。このほか、WFS(Wave Field Synthesis)といった方法で音響チャンネル信号をレンダリングしてもよい。   Any suitable method can be used to generate the virtual sound image by the reproduction channel conversion unit 13. For example, as a method of converting an acoustic channel signal, there is a method of converting so that VBAP (Vector Base Amplitude Panning) and acoustic intensity match. In addition, the acoustic channel signal may be rendered by a method such as WFS (Wave Field Synthesis).

図8は、音響チャンネル信号の変換方法の一例である振幅パンニング法の概要を示す図である。振幅パンニング法では、スピーカSP13の位置に虚音像を生成するため、虚音像の方向を挟み隣り合うスピーカであるスピーカSP22及びSP23が用いられる。音響チャンネル信号S(t)が重み係数W及びWによって左右のスピーカSP23及びSP22に分配される場合を考える。各スピーカSP23及びSP22の挟み込む角度を2θとし、スピーカSP23及びSP22の中心から虚音像(スピーカSP13)までの角度をφとすると、振幅パンニング法におけるタンゼント則では、角度φに音を定位させるための重み係数W及びWは、式(1)により表される。 FIG. 8 is a diagram showing an outline of an amplitude panning method which is an example of a method for converting an acoustic channel signal. In the amplitude panning method, in order to generate a virtual sound image at the position of the speaker SP13, speakers SP22 and SP23 which are adjacent speakers across the direction of the virtual sound image are used. Sound channel signals S (t) is considered the case where it is distributed to left and right speakers SP23 and SP22 by the weight coefficient W L and W R. When the angle between the speakers SP23 and SP22 is 2θ and the angle from the center of the speakers SP23 and SP22 to the virtual sound image (speaker SP13) is φ, the tangent law in the amplitude panning method is used to localize the sound to the angle φ. weight coefficient W L and W R is represented by the formula (1).

Figure 0006228389
Figure 0006228389

ここで、重み係数W及びWの和を1とすると、式(1)の右辺の分母が1となり、重み係数W及びWについて式(2)が導き出される。 Here, when 1 the sum of the weighting factors W L and W R, the denominator of the right side becomes 1 of the formula (1), the weight coefficient W L and W R formula (2) is derived.

Figure 0006228389
Figure 0006228389

以上より、再生チャンネル変換部13は、スピーカSP13に割り当てられた音響チャンネル信号S(t)については、式(3)に示すスピーカSP22及びSP23それぞれから再生すべき音響信号S(t)及びS(t)へと変換することにより、虚音像によるスピーカ位置の補正を行うことができる。 As described above, the reproduction channel conversion unit 13 has the acoustic signals S L (t) and S to be reproduced from the speakers SP22 and SP23 shown in Expression (3) for the acoustic channel signal S (t) assigned to the speaker SP13. By converting to R (t), it is possible to correct the speaker position by the virtual sound image.

Figure 0006228389
Figure 0006228389

このように、本実施形態によれば、復号化部12は、マルチチャンネル音響信号に含まれるメタデータに記載された音響空間層の対応する映像フォーマットと、再生環境の映像フォーマットとに基づき選択した1つの音響空間層の音響チャンネル信号の復号化を行う。これにより、複数の音響空間層を持つマルチチャンネル音響方式に対応し、映像フォーマットに応じた役割を持つ音響チャンネル信号を適切に選択して再生することが可能となる。   Thus, according to the present embodiment, the decoding unit 12 selects based on the video format corresponding to the acoustic space layer described in the metadata included in the multi-channel audio signal and the video format of the playback environment. The acoustic channel signal of one acoustic space layer is decoded. Accordingly, it is possible to appropriately select and reproduce an acoustic channel signal having a role corresponding to a video format, corresponding to a multi-channel acoustic system having a plurality of acoustic space layers.

また、再生チャンネル変換部13は、再生環境の画面配置が、映像フォーマットに対する標準配置と異なる場合、音響チャンネル信号のうち、画面と連動する音響チャンネル信号が、再生環境の画面配置における音響チャンネル位置から再生されるように音響チャンネル信号の変換を行う。これにより、再生環境の画面配置が、映像フォーマットに対する標準配置と異なる場合でも、適切な音響チャンネル信号の変換が可能となり、より臨場感の高い音響再生が可能となる。   In addition, when the screen layout of the playback environment is different from the standard layout with respect to the video format, the playback channel conversion unit 13 determines that the acoustic channel signal that is linked to the screen out of the acoustic channel signals from the acoustic channel position in the screen layout of the playback environment. The sound channel signal is converted so as to be reproduced. As a result, even when the screen layout of the playback environment is different from the standard layout for the video format, it is possible to convert an appropriate sound channel signal, and sound playback with higher presence can be realized.

また、再生チャンネル変換部13は、再生環境のスピーカ配置が、映像フォーマットに対する標準配置と異なる場合、音響チャンネル信号のうち、画面と連動しない音響チャンネル信号が、映像フォーマットに対する標準配置から再生されるように音響チャンネル信号の変換を行う。これにより、再生環境のスピーカ配置が、映像フォーマットに対する標準配置と異なる場合でも、適切な音響チャンネル信号の変換が可能となり、より臨場感の高い音響再生が可能となる。   In addition, when the speaker arrangement in the reproduction environment is different from the standard arrangement for the video format, the reproduction channel conversion unit 13 causes the audio channel signal that is not linked to the screen among the audio channel signals to be reproduced from the standard arrangement for the video format. The sound channel signal is converted. As a result, even when the speaker arrangement in the reproduction environment is different from the standard arrangement for the video format, it is possible to convert an appropriate sound channel signal, and it is possible to reproduce sound with a higher sense of reality.

図9は、本発明の一実施形態に係る音響信号作成装置の構成を示す図である。音響信号作成装置20は、ミキサ21と、符号化部22と、マルチプレクサ23(MUX)とを備える。   FIG. 9 is a diagram showing a configuration of an acoustic signal creation device according to an embodiment of the present invention. The acoustic signal generation device 20 includes a mixer 21, an encoding unit 22, and a multiplexer 23 (MUX).

ミキサ21は、複数の音響信号をミキシングして、音響空間層毎の音響チャンネル信号として符号化部22に出力する。   The mixer 21 mixes a plurality of acoustic signals, and outputs them to the encoding unit 22 as acoustic channel signals for each acoustic space layer.

符号化部22は、ミキサ21からの各音響空間層の音響チャンネル信号を符号化してマルチプレクサ23に出力する。   The encoding unit 22 encodes the acoustic channel signal of each acoustic space layer from the mixer 21 and outputs it to the multiplexer 23.

マルチプレクサ23(多重化部)は、音響空間層の音響チャンネル信号と、音響空間層の対応する映像フォーマットを含むメタデータとを多重化するものであり、番組制作者等により入力されるメタデータと、符号化された音響チャンネル信号を多重化して複数の音響空間層を持つマルチチャンネル音響信号を作成する。マルチプレクサ23は、放送又は伝送によりマルチチャンネル音響信号を伝えるため、マルチチャンネル音響信号を多重化して電波またはIP回線等で家庭など遠隔地に伝送する。   The multiplexer 23 (multiplexer) multiplexes the sound channel signal of the sound space layer and the metadata including the corresponding video format of the sound space layer, and includes metadata input by a program producer or the like. The encoded acoustic channel signal is multiplexed to create a multi-channel acoustic signal having a plurality of acoustic spatial layers. The multiplexer 23 multiplexes the multi-channel sound signal and transmits it to a remote place such as a home by radio wave or IP line in order to transmit the multi-channel sound signal by broadcasting or transmission.

このように、本実施形態によれば、マルチプレクサ23は、音響空間層の音響チャンネル信号と、音響空間層の対応する映像フォーマットを含むメタデータとを多重化する。これにより、音響信号再生装置側で、複数の音響空間層を持つマルチチャンネル音響方式に対応し、映像フォーマットに応じた役割を持つ音響チャンネル信号を適切に選択して再生することが可能となる。   Thus, according to this embodiment, the multiplexer 23 multiplexes the acoustic channel signal of the acoustic space layer and the metadata including the video format corresponding to the acoustic space layer. As a result, on the acoustic signal reproduction device side, it is possible to appropriately select and reproduce an acoustic channel signal corresponding to a multi-channel acoustic system having a plurality of acoustic space layers and having a role corresponding to a video format.

本発明を諸図面や実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形や修正を行うことが容易であることに注意されたい。従って、これらの変形や修正は本発明の範囲に含まれることに留意されたい。例えば、各部材、各手段、各ステップなどに含まれる機能などは論理的に矛盾しないように再配置可能であり、複数の手段やステップなどを1つに組み合わせたり、或いは分割したりすることが可能である。   Although the present invention has been described based on the drawings and examples, it should be noted that those skilled in the art can easily make various modifications and corrections based on the present disclosure. Therefore, it should be noted that these variations and modifications are included in the scope of the present invention. For example, functions included in each member, each means, each step, etc. can be rearranged so as not to be logically contradictory, and a plurality of means, steps, etc. can be combined or divided into one. Is possible.

10 音響信号再生装置
11 デマルチプレクサ
12 復号化部
13 再生チャンネル変換部
14 スピーカ
20 音響信号作成装置
21 ミキサ
22 符号化部
23 マルチプレクサ(多重化部)
DESCRIPTION OF SYMBOLS 10 Acoustic signal reproduction | regeneration apparatus 11 Demultiplexer 12 Decoding part 13 Reproduction | regeneration channel conversion part 14 Speaker 20 Acoustic signal production apparatus 21 Mixer 22 Encoding part 23 Multiplexer (multiplexing part)

Claims (3)

異なる映像フォーマットにそれぞれ対応する音響空間層を複数含むマルチチャンネル音響信号の再生装置であって、
前記マルチチャンネル音響信号は音響空間層に対応する映像フォーマットをメタデータに含み、前記音響空間層対応する映像フォーマットと、再生環境の映像フォーマットとに基づき選択した1つの音響空間層の音響チャンネル信号の復号化を行い、前記選択した音響空間層以外の音響空間層の音響チャンネル信号の復号化は行わない復号化部、を備える音響信号再生装置。
A multi-channel audio signal reproducing apparatus including a plurality of sound space layers corresponding to different video formats ,
The multi-channel audio signal includes a video format corresponding to the audio space layer in the metadata, and an audio channel signal of one audio space layer selected based on the video format corresponding to the audio space layer and the video format of the reproduction environment decoding gastric row, audio signal reproducing apparatus including a decoding unit, which does not perform the decoding of the audio channel signals of the acoustic space layer other than the layered sound field in which the selected.
前記再生環境の画面配置が、前記映像フォーマットに対する標準配置と異なる場合、前記音響チャンネル信号のうち、画面と連動する音響チャンネル信号が、前記再生環境の画面配置における音響チャンネル位置から再生されるように前記音響チャンネル信号の変換を行う再生チャンネル変換部を備える、請求項に記載の音響信号再生装置。 When the screen layout of the playback environment is different from the standard layout for the video format, among the acoustic channel signals, an acoustic channel signal that is linked to the screen is played back from the acoustic channel position in the screen layout of the playback environment. The acoustic signal reproduction device according to claim 1 , further comprising a reproduction channel conversion unit that performs conversion of the acoustic channel signal. 前記再生環境のスピーカ配置が、前記映像フォーマットに対する標準配置と異なる場合、前記音響チャンネル信号のうち、画面と連動しない音響チャンネル信号が、前記映像フォーマットに対する標準配置から再生されるように前記音響チャンネル信号の変換を行う再生チャンネル変換部を備える、請求項に記載の音響信号再生装置。 When the speaker arrangement of the playback environment is different from the standard arrangement for the video format, the audio channel signal is reproduced from the standard arrangement for the video format among the audio channel signals. The audio signal reproduction device according to claim 1 , further comprising: a reproduction channel conversion unit that performs the conversion.
JP2013102436A 2013-05-14 2013-05-14 Acoustic signal reproduction device Active JP6228389B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013102436A JP6228389B2 (en) 2013-05-14 2013-05-14 Acoustic signal reproduction device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013102436A JP6228389B2 (en) 2013-05-14 2013-05-14 Acoustic signal reproduction device

Publications (2)

Publication Number Publication Date
JP2014222856A JP2014222856A (en) 2014-11-27
JP6228389B2 true JP6228389B2 (en) 2017-11-08

Family

ID=52122192

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013102436A Active JP6228389B2 (en) 2013-05-14 2013-05-14 Acoustic signal reproduction device

Country Status (1)

Country Link
JP (1) JP6228389B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6826945B2 (en) * 2016-05-24 2021-02-10 日本放送協会 Sound processing equipment, sound processing methods and programs

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001298680A (en) * 2000-04-17 2001-10-26 Matsushita Electric Ind Co Ltd Specification of digital broadcasting signal and its receiving device
JP2002118900A (en) * 2000-08-02 2002-04-19 Matsushita Electric Ind Co Ltd Sound data reproducing device and sound data recording device
JP2004072345A (en) * 2002-08-05 2004-03-04 Pioneer Electronic Corp Information recording medium, information recording device and method, information reproducing device and method, information recording/reproducing device and method, computer program, and data structure
KR100803212B1 (en) * 2006-01-11 2008-02-14 삼성전자주식회사 Method and apparatus for scalable channel decoding
JP4780057B2 (en) * 2007-08-06 2011-09-28 ヤマハ株式会社 Sound field generator
JP5174527B2 (en) * 2008-05-14 2013-04-03 日本放送協会 Acoustic signal multiplex transmission system, production apparatus and reproduction apparatus to which sound image localization acoustic meta information is added
EP2205007B1 (en) * 2008-12-30 2019-01-09 Dolby International AB Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction
JP2011066868A (en) * 2009-08-18 2011-03-31 Victor Co Of Japan Ltd Audio signal encoding method, encoding device, decoding method, and decoding device
JP2011188287A (en) * 2010-03-09 2011-09-22 Sony Corp Audiovisual apparatus
JP2012160984A (en) * 2011-02-02 2012-08-23 Panasonic Corp Stereoscopic acoustic reproduction device and stereoscopic acoustic reproduction method

Also Published As

Publication number Publication date
JP2014222856A (en) 2014-11-27

Similar Documents

Publication Publication Date Title
JP5174527B2 (en) Acoustic signal multiplex transmission system, production apparatus and reproduction apparatus to which sound image localization acoustic meta information is added
EP2205007B1 (en) Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction
CN109983786B (en) Reproducing method, reproducing apparatus, reproducing medium, information processing method, and information processing apparatus
JP6174326B2 (en) Acoustic signal generating device and acoustic signal reproducing device
US20100324915A1 (en) Encoding and decoding apparatuses for high quality multi-channel audio codec
JP2013174891A (en) High quality multi-channel audio encoding and decoding apparatus
Jot et al. Beyond surround sound-creation, coding and reproduction of 3-D audio soundtracks
KR20130054159A (en) Encoding and decdoing apparatus for supprtng scalable multichannel audio signal, and method for perporming by the apparatus
KR101915258B1 (en) Apparatus and method for providing the audio metadata, apparatus and method for providing the audio data, apparatus and method for playing the audio data
JP6204681B2 (en) Acoustic signal reproduction device
JP6228389B2 (en) Acoustic signal reproduction device
JP6204682B2 (en) Acoustic signal reproduction device
JP6798312B2 (en) Encoding device and method, decoding device and method, and program
JP6204683B2 (en) Acoustic signal reproduction device, acoustic signal creation device
JP6228388B2 (en) Acoustic signal reproduction device
JP6204680B2 (en) Acoustic signal reproduction device, acoustic signal creation device
JP2014204316A (en) Acoustic signal reproducing device and acoustic signal preparation device
JP6228387B2 (en) Acoustic signal reproduction device
JP6204684B2 (en) Acoustic signal reproduction device
JP6670802B2 (en) Sound signal reproduction device
KR20070081735A (en) Apparatus for encoding and decoding audio signal and method thereof
JP2014222859A (en) Acoustic signal reproduction device and acoustic signal preparation device
KR20140017344A (en) Apparatus and method for audio signal processing
JP7182751B1 (en) System, method, and apparatus for conversion of channel-based audio to object-based audio
JP2007180662A (en) Video audio reproducing apparatus, method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160328

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170404

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170919

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171013

R150 Certificate of patent or registration of utility model

Ref document number: 6228389

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250