JP6174326B2 - 音響信号作成装置及び音響信号再生装置 - Google Patents

音響信号作成装置及び音響信号再生装置 Download PDF

Info

Publication number
JP6174326B2
JP6174326B2 JP2013010544A JP2013010544A JP6174326B2 JP 6174326 B2 JP6174326 B2 JP 6174326B2 JP 2013010544 A JP2013010544 A JP 2013010544A JP 2013010544 A JP2013010544 A JP 2013010544A JP 6174326 B2 JP6174326 B2 JP 6174326B2
Authority
JP
Japan
Prior art keywords
acoustic
sound
acoustic signal
signal
space layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013010544A
Other languages
English (en)
Other versions
JP2014142475A (ja
Inventor
渡辺 馨
馨 渡辺
大出 訓史
訓史 大出
郁子 澤谷
郁子 澤谷
ジェヒョン ユ
ジェヒョン ユ
テジン イ
テジン イ
キョンオク カン
キョンオク カン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Priority to JP2013010544A priority Critical patent/JP6174326B2/ja
Priority to US14/652,907 priority patent/US20150334502A1/en
Priority to KR1020157018270A priority patent/KR101682323B1/ko
Priority to PCT/JP2013/007390 priority patent/WO2014115222A1/en
Publication of JP2014142475A publication Critical patent/JP2014142475A/ja
Application granted granted Critical
Publication of JP6174326B2 publication Critical patent/JP6174326B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic

Description

この発明は、複数チャンネルのスピーカによる音響再生のため、メタデータを用いて音響信号に関する情報を表現する音響信号記述法、音響信号作成装置、音響信号再生装置に関する。
2チャンネル音響方式、5.1チャンネル音響方式や、5.1チャンネル音響方式を超えた「3次元(立体)音響方式」など複数の音響方式の形式で番組制作が行われている。これらの音響方式を共通のフォーマットで表現することで、次世代オーディオシステムに適用可能であり種々の方面への活用が可能な柔軟なシステムとすることができる。オーディオ関連の国際標準化団体であるITU-Rでは、ITU-R勧告としてadvanced multichannel audio systemに対する要求条件を定めている(非特許文献1)。
種々の音響方式を表現可能な共通のフォーマットとして、「単一の音響空間層を持つ音響信号」の検討は進んでいる。しかし、番組制作において、番組交換時の受取先や家庭の環境に合わせて受信した音響信号の変形・変換・入替を容易に行うことができるように「複数の音響空間層を持つ音響信号」の形式で音響番組制作を行う場合がある。例えば、番組交換の受取先や家庭においては、番組制作と同一条件の映像ディスプレイサイズを用いない場合があり、受取先の映像環境に合わせて音響信号の変形が必要とされる。また、番組の再生言語の選択や受取先の要望に合わせてナレーション信号の再生位置の調整を行いたいことがある。従来、「複数の音響空間層を持つ音響信号」の記述法については検討されていなかった。
したがって、かかる点に鑑みてなされた本発明の目的は、「複数の音響空間層を持つ音響信号」の形式に対応した音響信号記述法及び当該音響信号記述法に対応した音響信号作成装置及び音響信号再生装置を提供することにある。
上述した諸課題を解決すべく、本発明に係る音響信号作成装置は、複数の音響空間層を表現できる音響信号記述法による音響信号を作成する音響信号作成装置であって、音響空間層の数と、音響空間層のタイプと、言語情報とを含むメタデータを作成するメタデータ付加部と、入力音響信号及び前記メタデータに基づき前記音響信号記述法による前記複数の音響空間層を持つ音響信号を作成するコーディング部と、前記音響信号をビットストリームに多重化するマルチプレクサと、を備えており、前記音響信号記述法による前記複数の音響空間層を持つ音響信号の記述は階層的な構成を有し、各音響空間層の記述情報は、ひとつの音響空間を再現するのに必要なチャンネル配置の情報を含み、前記音響空間層のタイプは、音響空間層が、言語に係らず使用されるインターナショナルサウンドの音響空間層であるか、特定の言語で構成される音響空間層であるか、を示すものである。
さらに、本発明に係る音響信号再生装置は、複数の音響空間層を表現できる音響信号記述法による音響信号を再生する音響信号再生装置であって、視聴者の環境情報を入力する環境情報入力部と、前記音響信号に含まれる音響空間層の数、音響空間層のタイプ、及び言語情報と、前記環境情報とに応じて、前記音響信号を変換して再生するレンダリング再生部と、を備えており、前記音響信号記述法による前記複数の音響空間層を持つ音響信号の記述は階層的な構成を有し、各音響空間層の記述情報は、ひとつの音響空間を再現するのに必要なチャンネル配置の情報を含み、前記音響空間層のタイプは、音響空間層が、言語に係らず使用されるインターナショナルサウンドの音響空間層であるか、特定の言語で構成される音響空間層であるか、を示すものである。
また前記レンダリング再生部は、前記環境情報入力部により選択された前記特定の言語の音響信号を、前記インターナショナルサウンドに加算して再生することが好ましい。
さらに、本発明に係る他の音響信号作成装置は、複数の音響空間層を表現できる音響信号記述法による音響信号を作成する音響信号作成装置であって、音響空間層の数と、各音響空間層が映像に連動するかどうかを示す映像リンク識別子と、映像に連動する音響空間層における映像フォーマットの種類及び最適な視野角とを含むメタデータを作成するメタデータ付加部と、入力音響信号及び前記メタデータに基づき前記音響信号記述法による前記複数の音響空間層を持つ音響信号を作成するコーディング部と、前記音響信号をビットストリームに多重化するマルチプレクサと、を備えており、前記音響信号記述法による前記複数の音響空間層を持つ音響信号の記述は階層的な構成を有し、各音響空間層の記述情報は、ひとつの音響空間を再現するのに必要なチャンネル配置の情報を含むものである。
さらに、本発明に係る他の音響信号再生装置は、複数の音響空間層を表現できる音響信号記述法による音響信号を再生する音響信号再生装置であって、視聴者の環境情報を入力する環境情報入力部と、前記音響信号に含まれる音響空間層の数と、各音響空間層が映像に連動するかどうかを示す映像リンク識別子と、映像に連動する音響空間層における映像フォーマットの種類及び最適な視野角と、入力された前記環境情報とに応じて、前記音響信号を変換して再生するレンダリング再生部と、を備えており、前記音響信号記述法による前記複数の音響空間層を持つ音響信号の記述は階層的な構成を有し、各音響空間層の記述情報は、ひとつの音響空間を再現するのに必要なチャンネル配置の情報を含むものである。
また、前記レンダリング再生部は、前記映像リンク識別子が、音響空間層が映像に連動することを示す場合、当該音響空間層の音響信号に、前記環境情報入力部からの映像ディスプレイの情報に基づくレンダリング処理を施して再生する、ことが好ましい。
本発明に係る音響信号作成装置及び音響信号再生装置によれば、「複数の音響空間層を持つ音響信号」の表現や、当該音響信号を用いた番組作成及び視聴が可能となる。
本発明の一実施形態に係るExtended structure descriptorの構造の一例を示す図である。 本発明の一実施形態に係る音響信号作成装置の構成を示す図である。 本発明の一実施形態に係る音響信号再生装置の構成を示す図である。 ナレーション言語選択に関する複数音響空間層の概念図である。 番組作成環境と視聴環境とのディスプレイの違いを示す図である。 映像音声の一致不一致に関する複数音響空間層の概念図である。 Basic structure descriptorの構造の一例を示す図である。
以降、諸図面を参照しながら、本発明の実施態様を詳細に説明する。
本発明は、「単一の音響空間層を持つ音響信号」を表現する記述法(以下「Basic structure descriptor」という)を拡張し、「複数の音響空間層を持つ音響信号」を表現する記述法(以下「Extended structure descriptor」という)とするものである。Basic structure descriptorについて、本件出願人は韓国特許出願(10-2012-0112984)を行っており、本件の理解のため、以下、Basic structure descriptorを概説する。
マルチチャンネルの音響空間層を表現するためには、どのチャンネルをどの位置から再生するかを記述しなければならない。この記述情報をdescriptorと呼び、この記述情報はメタデータとして該当マルチチャンネル音響信号のヘッダ又はマルチチャンネルを構成する各オーディオチャンネルのヘッダに記述される。
表1は、Basic structure descriptorの用語を説明する表である。Basic structure descriptorは、例えばマルチチャンネル音響の完プロ番組(complete mix、再生に必要な音が全て収録された番組)の作成・交換に使用される。
Figure 0006174326
Sound Essenceは、番組に関する記述、Sound-fieldに関する記述(名称)、その他関連する記述で構成される。
Sound-fieldは、図7に示すとおり、階層的な構成をもつSound-field configurationで記述する。
Sound Channelは、Channel labelによる記述、及び/又は、Channel Positionによる記述で記述する。
これ以降、Basic structure descriptorの各記述子(descriptor)を説明する。なお、多様な交換シナリオを想定し、一部記述子には重複する項目があるが、番組作成者などは、交換シナリオ毎に適宜必要な記述子を選択することができる。
Basic structure descriptorは、(A)Sound Essence descriptorsと、(B)Sound-field configuration descriptorsと、(C)Sound Channel descriptorsとを含む。
表2は、Basic structure descriptorにおける(A)Sound Essence descriptorsを示す表である。
Figure 0006174326
表3は、Basic structure descriptor における(B)Sound-field configuration descriptorsを示す表である。
Figure 0006174326
表4は、Basic structure descriptor における(C)Sound Channel descriptorsを示す表である。
Figure 0006174326
表5は、Sound Channel descriptorsが含むChannel label dataの記述子であるC.1 Channel label descriptorsを示す表である。
Figure 0006174326
表6は、Sound Channel descriptorsが含むChannel position dataの記述子であるC.2 Channel position descriptorsを示す表である。
Figure 0006174326
本発明は、上記で述べた「単一の音響空間層を持つ音響信号」の記述法であるBasic Structure Descriptorsを拡張し、「複数の音響空間層を持つ音響信号」の記述法であるExtended Structure Descriptorsとするものである。
表7は、Extended structure descriptorの用語を説明する表である。
Figure 0006174326
Sound Essenceは、番組に関する記述、Sound-fieldに関する記述(名称)、その他関連する記述で構成される。
Extended structure descriptorにおけるSound-fieldは、図1の通り、階層的な構成をもつ複数のSound-field-layer configuration(Group of sound-field configuration) (Sound space configuration)で記述する。
Sound Channelは、Channel labelによる記述、及び/又は、Channel Positionによる記述で記述する。
表8は、Extended structure descriptor における(A)Sound Essence descriptorsを示す表である。
Figure 0006174326
表9は、Extended structure descriptor におけるA.2 Sound-field descriptorsを示す表である。
Figure 0006174326
Extended structure descriptorにおける(B)Sound-field configuration descriptorsと、(C)Sound Channel descriptorsについては、Basic structure descriptorと同一であるため、説明を省略する。
図2は、本発明の一実施形態に係る音響信号作成装置の構成を示す図である。音響信号作成装置は、番組制作において、番組交換の受取先や家庭での環境に合わせて受信した音響信号の変形・変換・入替を「容易に」行うことができるように「複数の音響空間層を持つ音響信号」の形式であるExtended structure descriptorによる音響番組制作を行う。音響信号作成装置は、Extended structure descriptorを、メタデータとして該当音響フォーマット信号のヘッダまたは各音響信号を構成する各ヘッダに入れて、番組交換や家庭への伝送を行う。音響信号作成装置は、ミキシング部11と、メタデータ付加部12と、コーディング部13と、マルチプレクサ14と、モニタリング部15とを備える。
ミキシング部11は、音響ソース信号(Audio Source 1〜M)をミキシングし「複数の音響空間層を持つ音響信号制作システム」から出力されるSpatial anchor、Commentary、Dialogue、Object signalsを含む複数の音響空間層の音響ミキシング信号をコーディング部13に出力する。
メタデータ付加部12は、Spatial anchor、Commentary、Dialogue、Object signalsを含む複数の音響空間層のExtended structure descriptorに記述するメタデータを作成し、コーディング部13に出力する。
コーディング部13は、ミキシング部11からの音響ミキシング信号と、メタデータ付加部12からのメタデータに基づき、Extended structure descriptorによる音響信号を作成し、当該音響信号を符号化してマルチプレクサ14に出力する。
マルチプレクサ14は、放送又は伝送により信号を音響信号再生装置に伝えるため、コーディング部13からの符号化されたExtended structure descriptorによる音響信号をビットストリームに多重化する。マルチプレクサ14は、多重化したビットストリームを電波またはIP回線等で家庭など遠隔地に伝送する。
モニタリング部15は、音響信号及びメタデータの内容確認に用いられる。
図3は、本発明の一実施形態に係る音響信号再生装置の構成を示す図である。音響信号再生装置は、スピーカ配置情報や再生するナレーション音像の位置情報などの再生システムの情報入力により、受信した音響信号に含まれるメタデータを利用して、制作した臨場感に匹敵する高品質音響を保持しつつ、使用者の希望するナレーション言語やナレーション再生位置にナレーション音声を制御して再現する。また、音響信号再生装置は、制作条件と異なるサイズの映像ディスプレイを設置した視聴環境においては、制作した臨場感に匹敵する高品質音響を保持しつつ、かつ映像と音像位置の一致が必要な「映音一致音源」の音響空間層については映像ディスプレイにあわせるように音像の空間位置を制御することで映像ディスプレイにあった音響を再現する。音響信号再生装置は、デマルチプレクサ21と、デコーディング部22と、レンダリング再生部23と、環境情報入力部24と、モニタリング部25とを備える。
デマルチプレクサ21は、放送又は伝送により受信したビットストリームに多重化されたExtended structure descriptorによる音響信号より、各音響空間層の音響信号及びメタデータを分離してデコーディング部22に出力する。
デコーディング部22は、デマルチプレクサ21からの符号化された音響信号及びメタデータをデコードし、Spatial anchor、Commentary、Dialogue、Object signals、メタデータを含む信号をレンダリング再生部23に出力する。
レンダリング再生部23は、Extended structure descriptorに基づき、本来の音響信号をそのまま再生したり、視聴環境(例えばスピーカのチャネル数、ディスプレイサイズ)に基づくダウンミックスなどの音響信号変換を行ってから音響信号を再生したりする。すなわち、レンダリング再生部23は、Extended structure descriptorに基づき、番組作成時と異なる音響再生環境において、音響信号の入替え、変形及び変換などのレンダリング処理をするものである。
環境情報入力部24は、Extended structure descriptorとして記載されるメタデータの情報を視聴者に対して表示し、また、視聴者側にて、視聴者の環境情報として、多重音声の言語選択、再生システム情報(スピーカ構成、ディスプレイサイズ)などの入力を受け付け、入力された情報をレンダリング再生部23に出力する。
モニタリング部25は、レンダリング再生部23による再生結果の確認や番組の視聴に用いられる。
以下、音響信号作成装置及び音響信号再生装置の具体的な使用形態について述べる。例えば、本発明に係る音響信号作成装置及び音響信号再生装置によれば、家庭視聴の環境に合わせて、ナレーション言語の選択やナレーション再生位置を容易に制御することが可能となる。また、本発明に係る音響信号作成装置及び音響信号再生装置によれば、標準制作条件と異なるサイズの映像ディスプレイを設置した視聴環境において、制作した臨場感に匹敵する高品質音響を保持しつつ、かつ映像と音像位置の一致が必要な「映音一致音源」の音響空間層については映像ディスプレイにあわせるように音像の空間位置を容易に制御して再生することが可能となる。
(作成形態1:複数言語に関する音響空間層を含む信号作成)
「複数の音響空間層を持つ音響信号」の形式であるExtended Structure descriptorを用いて番組制作を行う一例として、日本語や韓国語ナレーション・せりふ用の音響信号のほか、英語など多言語用の音響信号を制作する場合について示す。この例では、言語にかかわらず使用するいわゆるインターナショナルサウンド(Spatial anchor)で構成される音響空間層と特定言語で構成されるナレーション・せりふで構成される複数の音響空間層(Commentary, Dialogue)からなる「複数の音響空間層を持つ音響信号」の形式で音響信号制作システムが構成される。
この場合、メタデータ付加部12は、Extended Structure descriptorに則り、表10に示すメタデータを該当マルチチャンネル音響フォーマット信号のヘッダまたはマルチチャンネルを構成する各オーディオチャンネルの各ヘッダに付随する。
Figure 0006174326
(再生形態1:複数言語に関する音響空間層を含む信号再生)
使用者側ではスピーカ配置情報や再生するナレーション音像の位置情報などの再生システムの情報を入力して、使用者が任意に再生する位置の変更など音響信号を操作する。例えば家庭視聴環境において、制作した臨場感に匹敵する高品質音響を保持しつつ、希望するナレーション言語やナレーション再生位置などに関し、音響信号を制御して再現する。
この機能を実現するため、受信する使用者側では、環境情報入力部24により、再生したいナレーション言語やナレーション再生位置など希望するナレーション音声の情報、スピーカの配置情報など再生システムの情報を入力する。レンダリング再生部23は、メタデータに記載されている制作されているナレーション言語の中から指定された「ナレーション言語」層の音響信号を選択し、言語にかかわらず使用するいわゆるインターナショナルサウンドを加算して再生する。また、レンダリング再生部23は、希望するナレーション再生位置とスピーカの配置情報および制作されている「ナレーション言語」層の音響信号を選択し、指定するナレーション再生位置から得られるようにレンダリング処理を施して制作した臨場感に匹敵する音質が得られるように信号に変換したのち、言語にかかわらず使用するいわゆるインターナショナルサウンドを加算して再生する。
図4は、言語にかかわらず使用するいわゆるインターナショナルサウンド(Spatial anchor)の音響空間層と「ナレーション言語」(Commentary, Dialogue)の音響空間層からなる複数の音響空間層の概念図を示す。
(作成形態2:映像と音声との一致不一致に関する音響空間層を含む番組作成)
「複数の音響空間層を持つ音響信号」の形式であるExtended Structure descriptorを用いて番組制作を行う一例として、「映像と音の位置の一致が必要な音」と「映像の位置に直接係らない音」を別個に制作記録する例を示す。音響信号には、俳優のせりふや画面内の物体から放射される音のように画面の中の「映像と音の位置の一致が必要な音」のほかに、番組全体の臨場感を高めるための効果音など「映像の位置に直接係らない音」があり、「映像と音の位置の一致が必要な音」と「映像の位置に直接係らない音」を別個に制作記録する場合がある。この例では、「映像と音の位置の一致が必要な音」で構成される音響空間層と「映像の位置に直接係らない音」からなる「複数の音響空間層を持つ音響信号」の形式で音響信号制作システムが構成される。
この場合、メタデータ付加部12は、Extended Structure descriptorに則り、表11に示すメタデータを該当マルチチャンネル音響フォーマット信号のヘッダまたはマルチチャンネルを構成する各オーディオチャンネルの各ヘッダに付随する。
Figure 0006174326
(再生形態2:映像と音声との一致不一致に関する音響空間層を含む番組再生)
音響信号再生装置は、例えば、図5のような制作条件と異なるサイズの映像ディスプレイを設置した視聴環境においては、制作した臨場感に匹敵する高品質音響を保持しつつ、かつ映像と音像位置の一致が必要な「映音一致音源」の音響空間層については映像ディスプレイにあわせるように音像の空間位置を制御して再現する。
この機能を実現するため、受信する使用者側では、環境情報入力部24により、映像ディスプレイの配置情報など再生システムの情報を入力する。レンダリング再生部23は、メタデータに記載されている制作時の映像ディスプレイ・スピーカ配置条件と受信使用者側の映像ディスプレイ・スピーカ配置が同一条件であれば受信した音響信号の変形・変換を行わず「映像と音の位置の一致が必要な音」と「映像の位置に直接係らない音」を加算して再生する。一方、レンダリング再生部23は、映像ディスプレイかスピーカ配置のどちらか一方が同一条件でない場合、レンダリング処理またはダウンミックス処理を施して制作した臨場感に匹敵する音質が得られるように信号に変換したのち、加算して再生する。映像ディスプレイサイズが異なり、スピーカ配置が同一の場合には、レンダリング再生部23は、「映像と音の位置の一致が望ましい音」の層の音響信号は、映像ディスプレイサイズと音像の幅が同一となるようにレンダリング処理を施す。レンダリング再生部23は、レンダリング処理を施した「映像と音の位置の一致が望ましい音」と変形・変換を行わない「映像の位置に直接係らない音」を加算して再生する。ここで「映像と音の位置の一致が望ましい音」の音像幅を映像ディスプレイサイズと合わせるためのレンダリング処理は「映音一致音源」の音響空間層のChannel position data内で定義される Spatial position dataのAzimuth angleとElevation angleの空間位置情報を利用することで容易に行うことができる。
図6は、「映音一致音源」の音響空間層(Video linked object)「映像の位置に直接係らない」音響空間層(Spatial anchor, Dialogue)からなる複数の音響空間層の概念図を示す。
このように、本実施形態によれば、Extended Structure descriptorは、音響空間層の数と、音響空間層のタイプと、言語情報と、を含む。これにより、「複数の音響空間層を持つ音響信号」の形式に対応した音響信号記述法が実現される。
また、音響空間層のタイプは、音響空間層が、言語に係らず使用されるインターナショナルサウンドの音響空間層であるか、特定の言語で構成される音響空間層であるか、を示す、ことが好ましい。これにより、例えば家庭視聴環境において、制作した臨場感に匹敵する高品質音響を保持しつつ、希望するナレーション言語やナレーション再生位置などに関し、音響信号を制御して再現することが可能になる。
さらに、本実施形態によれば、Extended Structure descriptorは、音響空間層の数と、各音響空間層が映像に連動するかどうかを示す映像リンク識別子と、を含む。これにより、例えば制作条件と異なるサイズの映像ディスプレイを設置した視聴環境において、制作した臨場感に匹敵する高品質音響を保持しつつ、かつ映像と音像位置の一致が必要な「映音一致音源」の音響空間層については映像ディスプレイにあわせるように音像の空間位置を制御して再現することが可能になる。
さらに、本実施形態に係る音響信号作成装置及び音響信号再生装置によれば、Extended Structure descriptorで記述された音響信号を作成及び再生することが可能になる。また、本発明の範囲は、Extended Structure descriptorで記述された音響信号を電波またはIP回線等で家庭など遠隔地に伝送する装置、Extended Structure descriptorで記述された音響信号を記憶媒体に蓄積、記録する装置、Extended Structure descriptorで記述された音響信号が蓄積、記録された記憶媒体をも含むものである。
本発明の一実施形態に係る音響信号作成装置は、音響空間層の数と、音響空間層のタイプと、言語情報とを含むメタデータを作成し、入力音響信号及びメタデータに基づきExtended Structure descriptorによる音響信号を作成し、当該音響信号をビットストリームに多重化する。また、本発明の一実施形態に係る音響信号再生装置は、音響信号に含まれる音響空間層の数、音響空間層のタイプ、及び言語情報と、視聴者の環境情報とに応じて、音響信号を変換して再生する。これにより、「複数の音響空間層を持つ音響信号」を用いた番組作成及び視聴が可能となる。特に、音響信号再生装置は、視聴者により選択された特定の言語の音響信号を、インターナショナルサウンドに加算して再生する。これにより、受信したメタデータを用いて視聴者が任意に言語選択などの操作を行い、制作時の臨場感に匹敵する高品質音を保持しつつ、適切なナレーション言語やナレーション再生位置の入替・変形を行うことが可能となる。
また、本発明の一実施形態に係る音響信号作成装置は、音響空間層の数と、各音響空間層が映像に連動するかどうかを示す映像リンク識別子とを含むメタデータを作成し、入力音響信号及びメタデータに基づきExtended Structure descriptorによる音響信号を作成し、当該音響信号をビットストリームに多重化する。また、本発明の一実施形態に係る音響信号再生装置は、音響信号に含まれる音響空間層の数及び各音響空間層が映像に連動するかどうかを示す映像リンク識別子と、視聴者の環境情報とに応じて、音響信号を変換して再生する。これにより、「複数の音響空間層を持つ音響信号」を用いた番組作成及び視聴が可能となる。特に、音響信号再生装置は、映像リンク識別子が、音響空間層が映像に連動することを示す場合、当該音響空間層の音響信号に、視聴者の映像ディスプレイの情報に基づくレンダリング処理を施して再生する。これにより、視聴者側の映像ディスプレイ情報など再生システムの情報を入力し、メタデータに記載されている制作時の映像ディスプレイ情報を利用して、制作した臨場感に匹敵する高品質音を保持しつつ、かつ映像と音像位置の一致が必要な「映音一致音源」の音響空間層については映像ディスプレイにあわせるように音像の空間位置を変形・変換することが可能になる。
本発明を諸図面や実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形や修正を行うことが容易であることに注意されたい。従って、これらの変形や修正は本発明の範囲に含まれることに留意されたい。例えば、各部材、各手段、各ステップなどに含まれる機能などは論理的に矛盾しないように再配置可能であり、複数の手段やステップなどを1つに組み合わせたり、或いは分割したりすることが可能である。
本発明によれば、「複数の音響空間層を持つ音響信号」の表現や、当該音響信号を用いた番組作成及び視聴が可能となり、各種次世代オーディオシステムでの相互運用が実現され、番組作成時と異なる音響再生環境においても容易に音響信号の入替え、変形及び変換することができる。
11 ミキシング部
12 メタデータ付加部
13 コーディング部
14 マルチプレクサ
15 モニタリング部
21 デマルチプレクサ
22 デコーディング部
23 レンダリング再生部
24 環境情報入力部
25 モニタリング部

Claims (6)

  1. 複数の音響空間層を表現できる音響信号記述法による音響信号を作成する音響信号作成装置であって、
    音響空間層の数と、音響空間層のタイプと、言語情報とを含むメタデータを作成するメタデータ付加部と、
    入力音響信号及び前記メタデータに基づき前記音響信号記述法による前記複数の音響空間層を持つ音響信号を作成するコーディング部と、
    前記音響信号をビットストリームに多重化するマルチプレクサと、を備えており、
    前記音響信号記述法による前記複数の音響空間層を持つ音響信号の記述は階層的な構成を有し、各音響空間層の記述情報は、ひとつの音響空間を再現するのに必要なチャンネル配置の情報を含み、
    前記音響空間層のタイプは、音響空間層が、言語に係らず使用されるインターナショナルサウンドの音響空間層であるか、特定の言語で構成される音響空間層であるか、を示す、
    音響信号作成装置。
  2. 複数の音響空間層を表現できる音響信号記述法による音響信号を再生する音響信号再生装置であって、
    視聴者の環境情報を入力する環境情報入力部と、
    前記音響信号に含まれる音響空間層の数、音響空間層のタイプ、及び言語情報と、前記環境情報とに応じて、前記音響信号を変換して再生するレンダリング再生部と、を備えており、
    前記音響信号記述法による前記複数の音響空間層を持つ音響信号の記述は階層的な構成を有し、各音響空間層の記述情報は、ひとつの音響空間を再現するのに必要なチャンネル配置の情報を含み、
    前記音響空間層のタイプは、音響空間層が、言語に係らず使用されるインターナショナルサウンドの音響空間層であるか、特定の言語で構成される音響空間層であるか、を示す、
    音響信号再生装置。
  3. 前記レンダリング再生部は、前記環境情報入力部により選択された前記特定の言語の音響信号を、前記インターナショナルサウンドに加算して再生する、請求項に記載の音響信号再生装置。
  4. 複数の音響空間層を表現できる音響信号記述法による音響信号を作成する音響信号作成装置であって、
    音響空間層の数と、各音響空間層が映像に連動するかどうかを示す映像リンク識別子と、映像に連動する音響空間層における映像フォーマットの種類及び最適な視野角とを含むメタデータを作成するメタデータ付加部と、
    入力音響信号及び前記メタデータに基づき前記音響信号記述法による前記複数の音響空間層を持つ音響信号を作成するコーディング部と、
    前記音響信号をビットストリームに多重化するマルチプレクサと、を備えており、
    前記音響信号記述法による前記複数の音響空間層を持つ音響信号の記述は階層的な構成を有し、各音響空間層の記述情報は、ひとつの音響空間を再現するのに必要なチャンネル配置の情報を含む、
    音響信号作成装置。
  5. 複数の音響空間層を表現できる音響信号記述法による音響信号を再生する音響信号再生装置であって、
    視聴者の環境情報を入力する環境情報入力部と、
    前記音響信号に含まれる音響空間層の数と、各音響空間層が映像に連動するかどうかを示す映像リンク識別子と、映像に連動する音響空間層における映像フォーマットの種類及び最適な視野角と、入力された前記環境情報とに応じて、前記音響信号を変換して再生するレンダリング再生部と、を備えており、
    前記音響信号記述法による前記複数の音響空間層を持つ音響信号の記述は階層的な構成を有し、各音響空間層の記述情報は、ひとつの音響空間を再現するのに必要なチャンネル配置の情報を含む、
    音響信号再生装置。
  6. 前記レンダリング再生部は、前記映像リンク識別子が、音響空間層が映像に連動することを示す場合、当該音響空間層の音響信号に、前記環境情報入力部からの映像ディスプレイの情報に基づくレンダリング処理を施して再生する、請求項に記載の音響信号再生装置。
JP2013010544A 2013-01-23 2013-01-23 音響信号作成装置及び音響信号再生装置 Active JP6174326B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2013010544A JP6174326B2 (ja) 2013-01-23 2013-01-23 音響信号作成装置及び音響信号再生装置
US14/652,907 US20150334502A1 (en) 2013-01-23 2013-12-16 Sound signal description method, sound signal production equipment, and sound signal reproduction equipment
KR1020157018270A KR101682323B1 (ko) 2013-01-23 2013-12-16 음향 신호 기술 방법, 음향 신호 생성 장치 및 음향 신호 재생 장치
PCT/JP2013/007390 WO2014115222A1 (en) 2013-01-23 2013-12-16 Sound signal description method, sound signal production equipment, and sound signal reproduction equipment

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013010544A JP6174326B2 (ja) 2013-01-23 2013-01-23 音響信号作成装置及び音響信号再生装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2017132946A Division JP6670802B2 (ja) 2017-07-06 2017-07-06 音響信号再生装置

Publications (2)

Publication Number Publication Date
JP2014142475A JP2014142475A (ja) 2014-08-07
JP6174326B2 true JP6174326B2 (ja) 2017-08-02

Family

ID=51227039

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013010544A Active JP6174326B2 (ja) 2013-01-23 2013-01-23 音響信号作成装置及び音響信号再生装置

Country Status (4)

Country Link
US (1) US20150334502A1 (ja)
JP (1) JP6174326B2 (ja)
KR (1) KR101682323B1 (ja)
WO (1) WO2014115222A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7129962B2 (ja) 2019-09-27 2022-09-02 株式会社クボタ モーア

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10109285B2 (en) 2014-09-08 2018-10-23 Sony Corporation Coding device and method, decoding device and method, and program
JPWO2016052191A1 (ja) 2014-09-30 2017-07-20 ソニー株式会社 送信装置、送信方法、受信装置および受信方法
US10032447B1 (en) * 2014-11-06 2018-07-24 John Mitchell Kochanczyk System and method for manipulating audio data in view of corresponding visual data
WO2018173413A1 (ja) * 2017-03-24 2018-09-27 シャープ株式会社 音声信号処理装置及び音声信号処理システム
CN109286888B (zh) * 2018-10-29 2021-01-29 中国传媒大学 一种音视频在线检测与虚拟声像生成方法及装置
KR20220144604A (ko) 2021-04-20 2022-10-27 한국전자통신연구원 가상 음향 공간의 장애물 효과 처리 방법 및 시스템

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07264144A (ja) * 1994-03-16 1995-10-13 Toshiba Corp 信号圧縮符号化装置および圧縮信号復号装置
JP3491401B2 (ja) * 1995-08-02 2004-01-26 ソニー株式会社 データ符号化装置および方法、並びに、データ復号化装置および方法
JP4000095B2 (ja) * 2003-07-30 2007-10-31 株式会社東芝 音声認識方法、装置及びプログラム
CN101853683B (zh) * 2005-02-18 2011-12-21 松下电器产业株式会社 流供给装置
CN101026725B (zh) * 2005-07-15 2010-09-29 索尼株式会社 再现设备及再现方法
JP4897404B2 (ja) * 2006-09-12 2012-03-14 株式会社ソニー・コンピュータエンタテインメント 映像表示システム、映像表示装置、その制御方法及びプログラム
GB2442983A (en) * 2006-10-16 2008-04-23 Martin Audio Ltd A computer-based method of configuring loudspeaker arrays
JP2008154065A (ja) * 2006-12-19 2008-07-03 Roland Corp 効果付与装置
EP2137726B1 (en) * 2007-03-09 2011-09-28 LG Electronics Inc. A method and an apparatus for processing an audio signal
KR20090001605A (ko) * 2007-05-03 2009-01-09 삼성전자주식회사 재생 설정 정보를 포함하는 이동식 기록매체, 이동식기록매체에 기록된 재생 설정 정보를 이용하여 콘텐츠를재생하는 장치 및 방법
JP5174527B2 (ja) * 2008-05-14 2013-04-03 日本放送協会 音像定位音響メタ情報を付加した音響信号多重伝送システム、制作装置及び再生装置
JP5197525B2 (ja) * 2009-08-04 2013-05-15 シャープ株式会社 立体映像・立体音響記録再生装置・システム及び方法
JP2011234177A (ja) * 2010-04-28 2011-11-17 Panasonic Corp 立体音響再生装置及び再生方法
US8908874B2 (en) * 2010-09-08 2014-12-09 Dts, Inc. Spatial audio encoding and reproduction
US20130282876A1 (en) * 2011-01-07 2013-10-24 Sharp Kabushiki Kaisha Reproduction device, method for controlling reproduction device, generation device, method for controlling generation device, recording medium, data structure, control program, and recording medium containing said program
WO2013006330A2 (en) * 2011-07-01 2013-01-10 Dolby Laboratories Licensing Corporation System and tools for enhanced 3d audio authoring and rendering
MX347100B (es) * 2012-12-04 2017-04-12 Samsung Electronics Co Ltd Aparato de suministro de audio y método de suministro de audio.

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7129962B2 (ja) 2019-09-27 2022-09-02 株式会社クボタ モーア

Also Published As

Publication number Publication date
KR20150093794A (ko) 2015-08-18
US20150334502A1 (en) 2015-11-19
WO2014115222A1 (en) 2014-07-31
JP2014142475A (ja) 2014-08-07
KR101682323B1 (ko) 2016-12-02

Similar Documents

Publication Publication Date Title
JP6174326B2 (ja) 音響信号作成装置及び音響信号再生装置
US20220159400A1 (en) Reproduction apparatus, reproduction method, information processing apparatus, information processing method, and program
EP2205007B1 (en) Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction
Bleidt et al. Development of the MPEG-H TV audio system for ATSC 3.0
JP5174527B2 (ja) 音像定位音響メタ情報を付加した音響信号多重伝送システム、制作装置及び再生装置
JP6407155B2 (ja) オーディオデータ生成装置及びオーディオデータ再生装置
KR102172279B1 (ko) 스케일러블 다채널 오디오 신호를 지원하는 부호화 장치 및 복호화 장치, 상기 장치가 수행하는 방법
Jot et al. Beyond surround sound-creation, coding and reproduction of 3-D audio soundtracks
KR101915258B1 (ko) 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR20150028147A (ko) 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법, 오디오 재생 장치
JP6670802B2 (ja) 音響信号再生装置
JP6204683B2 (ja) 音響信号再生装置、音響信号作成装置
JP6228388B2 (ja) 音響信号再生装置
Corteel et al. An open 3D audio production chain proposed by the Edison 3D project
JP6204680B2 (ja) 音響信号再生装置、音響信号作成装置
JP2014204316A (ja) 音響信号再生装置、音響信号作成装置
JP2014222856A (ja) 音響信号再生装置、音響信号作成装置
JP6204684B2 (ja) 音響信号再生装置
JP7441057B2 (ja) オーディオオーサリング装置、オーディオレンダリング装置、送信装置、受信装置、及び方法
KR102529400B1 (ko) 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR102370348B1 (ko) 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
KR102220521B1 (ko) 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
CN114121036A (zh) 音轨唯一标识元数据和生成方法、电子设备及存储介质
JP6228387B2 (ja) 音響信号再生装置
CN115134737A (zh) 一种音床输出渲染项确定方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170706

R150 Certificate of patent or registration of utility model

Ref document number: 6174326

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250