JP7182751B1 - チャネルベースオーディオからオブジェクトベースオーディオへの変換のためのシステム、方法、及び機器 - Google Patents
チャネルベースオーディオからオブジェクトベースオーディオへの変換のためのシステム、方法、及び機器 Download PDFInfo
- Publication number
- JP7182751B1 JP7182751B1 JP2022532868A JP2022532868A JP7182751B1 JP 7182751 B1 JP7182751 B1 JP 7182751B1 JP 2022532868 A JP2022532868 A JP 2022532868A JP 2022532868 A JP2022532868 A JP 2022532868A JP 7182751 B1 JP7182751 B1 JP 7182751B1
- Authority
- JP
- Japan
- Prior art keywords
- audio
- channel
- oamd
- bitstream
- metadata
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 63
- 238000006243 chemical reaction Methods 0.000 title abstract description 29
- 230000011664 signaling Effects 0.000 claims abstract description 24
- 238000013507 mapping Methods 0.000 claims description 3
- 238000009877 rendering Methods 0.000 abstract description 30
- 230000005540 biological transmission Effects 0.000 abstract description 19
- 230000009466 transformation Effects 0.000 abstract 1
- 230000001131 transforming effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 40
- 230000003068 static effect Effects 0.000 description 18
- 238000009966 trimming Methods 0.000 description 17
- 230000000694 effects Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/308—Electronic adaptation dependent on speaker or headphone connection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
Description
本願は、米国仮特許出願番号第62/942,322号、2019年12月2日出願、及び欧州特許出願番号第19212906.2号、2019年12月2日出願の優先権を主張する。両出願は、参照によりその全体がここに組み込まれる。
本開示は、概して、チャネルベースオーディオからオブジェクトベースオーディオへの変換を含むオーディオ信号処理に関する。
オーディオ処理機器の1つ以上のプロセッサにより、チャネルベースオーディオと関連するチャネルベースオーディオメタデータとを含むビットストリームを受信するステップ、を含み、
前記1つ以上のプロセッサは、
前記チャネルベースオーディオメタデータからシグナリングパラメータをパースし、前記シグナリングパラメータは、複数の異なるオブジェクトオーディオメタデータ(OAMD)表現のうちの1つを示し、前記OAMD表現のうちの各OAMD表現は、前記チャネルベースオーディオの1つ以上のオーディオチャネルを1つ以上のオーディオオブジェクトにマッピングし、
前記シグナリングパラメータにより示されるOAMD表現を用いて、前記チャネルベースオーディオメタデータを前記1つ以上のオーディオオブジェクトに関連付けられたOAMDに変換し、
前記OAMDのチャネル順序制約に基づき、チャネルシャッフル情報を生成し、
前記チャネルシャッフル情報に基づき前記チャネルベースオーディオの1つ以上のオーディオチャネルを並べ替えて、並べ替えチャネルベースオーディオを生成し、
前記OAMDを用いて、前記並べ替えチャネルベースオーディオをレンダリングオーディオにレンダリングするか、又は、
前記並べ替えチャネルベースオーディオ及び前記OAMDをオブジェクトベースオーディオビットストリームに符号化し、前記オブジェクトベースオーディオビットストリームを再生装置又はソース装置へ送信する、
よう構成される。
前記第1チャネルセットにOAMDベッドチャネルラベルを割り当てるステップと、
OAMDベッドチャネルにより表現できないチャネルベースオーディオの第2チャネルセットを決定するステップと、
前記第2チャネルセットに静的OAMD位置座標を割り当てるステップと、
を更に含む。
オーディオ処理機器の1つ以上のプロセッサにより、チャネルベースオーディオとメタデータとを含むビットストリームを受信するステップを含み、
前記1つ以上のプロセッサは、
前記チャネルベースオーディオをネイティブオーディオビットストリームに符号化し、
前記メタデータからシグナリングパラメータをパースし、前記シグナリングパラメータは複数の異なるオブジェクトオーディオメタデータ(OAMD)表現のうちの1つを示し、
前記シグナリングパラメータにより示されるOAMD表現を用いて、前記チャネルベースメタデータをOAMDに変換し、
前記OAMDのチャネル順序制約に基づき、チャネルシャッフル情報を生成し、
前記ネイティブオーディオビットストリーム、前記チャネルシャッフル情報、及び前記OAMDを含むビットストリームパッケージを生成し、
前記パッケージをトランスポート層ビットストリームに多重化し、
前記トランスポート層ビットストリームを再生装置又はソース装置に送信する、よう構成される。
オーディオ処理機器の1つ以上のプロセッサにより、パッケージを含むトランスポート層ビットストリームを受信するステップを含み、
前記1つ以上のプロセッサは、
前記トランスポート層ビットストリームを逆多重化して、前記パッケージを復元し(つまり、決定し、又は抽出し)、
前記パッケージを復号して、ネイティブオーディオビットストリーム、チャネルシャッフル情報、及びオブジェクトオーディオメタデータ(OAMD)を復元し(つまり、決定し、又は抽出し)、
前記ネイティブオーディオビットストリームを復号して、チャネルベースオーディオ及びメタデータを復元し、
前記チャネルシャッフル情報に基づき、前記チャネルベースオーディオのチャネルを並べ替え、
前記OAMDを用いて、前記並べ替えチャネルベースオーディオをレンダリングオーディオにレンダリングするか、又は、
前記チャネルベースオーディオ及びOAMDをオブジェクトベースオーディオビットストリームに符号化し、前記オブジェクトベースオーディオビットストリームをソース装置へ送信する、よう構成される。
前記第1チャネルセットにOAMDベッドチャネルラベルを割り当てるステップと、
OAMDベッドチャネルにより表現できないチャネルベースオーディオの第2チャネルセットを決定するステップと、
前記第2チャネルセットに静的OAMD位置座標を割り当てるステップと、
を更に含む。
1つ以上のプロセッサと、
命令を格納している非一時的コンピュータ可読記憶媒体であって、前記命令は、前記1つ以上のプロセッサにより実行されると、前記1つ以上のプロセッサに、本願明細書に記載の方法を実行させる、非一時的コンピュータ可読記憶媒体と、
を含む。
オブジェクトオーディオメタデータ(Object Audio Metadata (OAMD))は、例えばETSI TS 103 420 v1.2.1(2018-10)に記載されたメタデータのような、OBA処理のためのメタデータのコーディングビットストリーム表現である。OAMDビットストリームは、例えばETSI TS 102 366[1]に指定されたような拡張可能メタデータ配信フォーマット(Extensible Metadata Delivery Format (EMDF))コンテナの中で運ばれてよい。OAMDは、オーディオオブジェクトをレンダリングするために使用される。レンダリング情報は、動的に変化してよい(例えば、利得及び位置)。OAMDビットストリーム要素は、コンテンツ記述メタデータ、オブジェクト特性メタデータ、特性更新メタデータ、及び他のメタデータを含んでよい。
以下の開示では、OAMDを用いて、CBAコンテンツをOBAに変換する技術が開示される。例示的な実施形態では、22.2チャネル(「22.2ch」)コンテンツは、OAMDを用いてOBAに変換される。本実施形態では、22.2chコンテンツは、チャネルが位置付けられ、従ってダウンミキシング/レンダリングされる2つの定義された方法を有する。方法の選択は、22.2chビットストリームに埋め込まれたdmix_pos_adj_idxパラメータのようなパラメータの値に依存してよい。22.2ch位置をOAMD表現に変換するフォーマット変換器は、このパラメータの値に基づき、2つのOAMD表現のうちの1つを選択する。選択された表現は、再生装置(例えば、Dolby(登録商標)Atmos(登録商標)再生装置)に入力されるOBAビットストリーム(例えば、Dolby(登録商標)MATビットストリーム)内で運ばれる。例示的な22.2chシステムは、Hamasaki22.2である。Hamasaki22.2は、NHK放送技術研究所により開発されたテレビジョン規格であるスーパーハイビジョンのサラウンド音声コンポーネントであり、3層に配置された(2個のサブウーハを含む)24個のスピーカを使用する。
本願では、22.2chコンテンツ305(例えば、ファイル又はライブストリーム)は、フォーマット変換器301により受信される。コンテンツ305は、オーディオ及び関連付けられたメタデータを含む。メタデータは、dmix_pos_adj_idxパラメータを含む。該パラメータは、該パラメータの値に基づき、2つのOAMD表現のうちの1つを選択するためのものである。OAMDベッド(bed)チャネルラベルにより表現できるチャネルは、OAMDベッドチャネルラベルを使用する。OAMDベッドチャネルラベルにより表現できないチャネルは、静的オブジェクト位置を使用する。ここで、各静的オブジェクト位置は、例えばETSI TS 103 420 v1.2.1(2018-10)に記載されるようなOAMD[x,y,z]位置座標で記述される。本願明細書で使用されるとき、「ベッド(bed)チャネル」は、複数のベッド(bed)オブジェクトのグループであり、「ベッドオブジェクト」は、再生システムのラウドスピーカへの割り当てにより空間的位置が固定される静的オブジェクトである。
OAMDは、ベッドオブジェクトが動的オブジェクトより先行すると想定する。更に、ベッドオブジェクトは特定の順序で現れる。これらの理由から、22.2chコンテンツのオーディオは、OAMD順序制約を満たすために、オーディオチャネルシャッフラ303により並べ替えられる。オーディオチャネルシャッフラ303は、メタデータ生成器304からチャネルシャッフル情報を受信し、チャネルシャッフル情報を用いて、22.2チャネルを並べ替える。
図2Aは、実施形態による、次元トリミングメタデータを示す表である。22.2chコンテンツのOBAコンテンツへの並べ替えが22.2ch仕様により指定されるダウンミックスと厳密に一致するようになることを保証するために、OBAレンダリング装置に配信される22.2chコンテンツを伴うOAMDに次元トリミングメタデータが含まれる。オブジェクトtirmは、ミックスに含まれるスクリーン外要素のレベルを低下させるために使用される。これは、没入型ミックスが幾つかのラウドスピーカを有するレイアウトで再生されるとき、望ましい。
OAMDは、各オブジェクトが個々のオブジェクト利得を有することを許容する。この利得は、オブジェクトオーディオレンダラ302により適用される。オブジェクト利得は、22.2chコンテンツのダウンミックス値の間の差の補償、及び22.2chコンテンツのOAMD表現のレンダリングを可能にする。実施形態では、オブジェクト利得は、LFE1又はLFE2のベッドチャネル割り当てを有するオブジェクトについて-3dBに、全部の他のオブジェクトについて0dBに設定される。オブジェクト利得の他の値は、適用に依存して使用できる。
<OBAとしての22.2chコンテンツの聴取>
図3は、実施形態による、ビットストリーム符号化を用いずに、22.2チャネルオーディオビットストリームをオーディオ及びOAMDに変換する例示的なシステム300のブロック図である。システム300は、22.2chコンテンツがOBA再生システム(Dolby(登録商標)Atmos(登録商標))でOBAコンテンツとして聴取される適用で使用される。
図4は、実施形態による、ビットストリーム符号化を用いて、22.2チャネルオーディオビットストリームをオーディオオブジェクト及びOAMDに変換する例示的なシステム400のブロック図である。本願では、22.2chコンテンツを送信するのではなく、22.2chコンテンツは、フォーマット変換され、OBAコーデックを用いてOBAとして送信される。
図5は、実施形態による、ソース装置におけるレンダリングのために、22.2チャネルオーディオビットストリームをオーディオオブジェクト及びOAMDに変換する例示的なシステムのブロック図である。本願では、セットトップボックス(STB)又はオーディオ/ビデオレコーダ(AVR)のようなソース装置は、22.2chコンテンツをネイティブオーディオビットストリームから受信し、フォーマット変換器によるフォーマット変換の後に、コンテンツはオブジェクトオーディオレンダラを用いてレンダリングされる。例示的なネイティブオーディオビットストリームフォーマットは、高度オーディオコーディング(advanced audio coding (AAC))標準ビットストリームフォーマットである。
図6A及び6Bは、実施形態による、外部レンダリングのために、高精細度マルチメディアインタフェース(high definition multimedia interface (HDMI))を介して送信するために、22.2chオーディオビットストリームをオーディオオブジェクト及びOAMDに変換する例示的なシステムのブロック図である。本願では、チャネルシャッフル情報は、OAMDと共に、エンコーダにおいて生成され、送信されるためにネイティブオーディオビットストリーム(例えば、AAV)内にパッケージされる。この構成では、生じるフォーマット変換は、オーディオシャッフラに簡略化される。OAMDと一緒にシャッフルされたオーディオは、HDMIを介してビットストリーム内で送信するために、OBAエンコーダへ送信される。受信機側で、ビットストリームは、復号され、オブジェクトオーディオレンダラによりレンダリングされる。
図7A~7Cは、実施形態による、22.2chオーディオビットストリームをオーディオオブジェクト及びOAMDに変換する例示的なシステムのブロック図であり、チャネルシャッフル情報及びOAMDがネイティブオーディオビットストリーム内にパッケージされる。前の例示的な適用では、OAMDは、デコーダ(例えば、AACデコーダ)の後に生成される。しかしながら、代替の実施形態として、チャネルシャッフル情報及びOAMDを送信フォーマット)(ネイティブオーディオビットストリーム又はトランスポート層のいずれか)に埋め込むことが可能である。本願では、チャネルシャッフル情報は、OAMDと共に、エンコーダにおいて生成され、送信されるためにネイティブオーディオビットストリーム(例えば、AACビットストリーム)内にパッケージされる。この構成では、生じるフォーマット変換は、オーディオシャッフラに簡略化される。OAMDと一緒にシャッフルされたオーディオは、HDMIを介して送信するために、OBAエンコーダへ送信される。受信側で、OBAビットストリームは、復号され、オブジェクトオーディオレンダラによりレンダリングされる。
図8A及び8Bは、実施形態による、ソース装置におけるレンダリングのために、22.2chオーディオビットストリームをオーディオオブジェクト及びOAMDに変換する例示的なシステムのブロック図であり、ソース装置におけるレンダリングのために、チャネルシャッフル情報及びOAMDがネイティブオーディオビットストリーム内にパッケージされる。本願では、チャネルシャッフル情報は、OAMDと共に、エンコーダにおいて生成され、トランスポート層を介して送信されるためにネイティブオーディオビットストリーム(例えば、AACビットストリーム)内にパッケージされる。この構成では、生じるフォーマット変換は、オーディオシャッフラに簡略化される。OAMDと一緒にシャッフルされたオーディオは、レンダリングするために、オブジェクトオーディオレンダラへ送信される。
図9A~9Cは、実施形態による、22.2chオーディオビットストリームをオーディオオブジェクト及びOAMDに変換する例示的なシステムのブロック図であり、ソース装置に供給するために、チャネルシャッフル情報及びOAMDがトランスポート層に埋め込まれ、次にHDMIを介して送信するために、ネイティブオーディオビットストリーム内にパッケージされる。
図10A及び10Bは、実施形態による、22.2chオーディオビットストリームをオーディオオブジェクト及びOAMDに変換する例示的なシステムのブロック図であり、ソース装置(例えば、STB、AVR)におけるレンダリングのために、チャネルシャッフル情報及びOAMDが、トランスポート層に埋め込まれる。22.2chコンテンツを表現するために使用されるOAMDは、プログラムの間、静的である。この理由から、オーディオビットストリームの中でデータレートの増大を回避するために、OAMDを頻繁に送信することを回避することが望ましい。これは、静的OAMD及びチャネルシャッフル情報を、トランスポート層内で送信し及びトランスポート層で送信されることにより達成できる。受信されると、OAMD及びチャネルシャッフル情報は、コンテンツをレンダリングするためにオブジェクトオーディオレンダラにより使用される。例示的なトランスポート層は、ビデオ及びオーディオのような時間に基づくマルチメディアファイルの一般的構造を定義するISO/IEC14496-12-MPEG-4 Part12に記載されるベースメディアファイルフォーマット(base media file format (BMFF))である。実施形態では、OAMDは、MPEG-DASHマニフェストに含まれる。
図11は、CBAからOBAへの変換処理1100のフロー図である。処理1100は、図3に示すオーディオシステムアーキテクチャを用いて実施できる。処理1100は、チャネルベースオーディオとメタデータとを含むビットストリームを受信するステップと(1101)、ビットストリームからOAMD表現を示すシグナリングパラメータをパースするステップと(1102)、シグナリングされたOAMD表現に基づき、チャネルベースメタデータをOAMDに変換するステップと(1103)、OAMDの順序制約に基づき、チャネルシャッフル情報を生成するステップと(1104)、チャネルシャッフル情報に基づき、チャネルベースオーディオのチャネルを並べ替えるステップと(1105)、OAMDを用いて並べ替えチャネルベースオーディオをレンダリングするステップと(1106)、を含む。上述のステップ1103及び1104は、例えば、OAMD表現及び各々図1A及び1Bに示されるベッドチャネル割り当て/順序、並びに図3に示されるオーディオシステムアーキテクチャを用いて実行できる。OAMDメタデータの幾つかの例は、限定ではないが、コンテンツ記述メタデータ、特性更新メタデータ、及びトリミングデータを含む。
実施形態では、22.2コンテンツを表現するOAMDは、MPEG-4オーディオ(ISO/IEC14496-3)ビットストリームのようなネイティブオーディオビットストリームの中で運ばれる。3つの実施形態の例示的なシンタックスが以下に提供される。
図17は、実施形態による、チャネルオーディオからオブジェクトオーディオへの変換を含む例示的なオーディオシステムアーキテクチャのブロック図である。本例では、アーキテクチャはSTB又はAVRのためである。STB/AVR1700は、入力1701、アナログ-デジタル変換器(ADC)1702、復調器1703、同期化器/デコーダ1704、MEPG逆多重化器1707、MEPGデコーダ1706、メモリ1709、制御プロセッサ1710、オーディオチャネルシャッフラ1705、OBAエンコーダ1711、及びビデオエンコーダ1712を含む。本例では、STB/AVR1700は、図9A~9C、及び10A、10Bで説明した適用を実施する。ここで、予め計算されたOAMDはMPEG-4オーディオビットストリームの中で運ばれる。
Claims (15)
- 方法であって、
オーディオ処理機器の1つ以上のプロセッサにより、チャネルベースオーディオと関連するチャネルベースオーディオメタデータとを含むビットストリームを受信するステップ、を含み、
前記1つ以上のプロセッサは、
前記チャネルベースオーディオメタデータからシグナリングパラメータをパースし、前記シグナリングパラメータは、複数の異なるオブジェクトオーディオメタデータ(OAMD)表現のうちの1つを示し、前記OAMD表現のうちの各OAMD表現は、前記チャネルベースオーディオの1つ以上のオーディオチャネルを1つ以上のオーディオオブジェクトにマッピングし、
前記シグナリングパラメータにより示されるOAMD表現を用いて、前記チャネルベースオーディオメタデータを前記1つ以上のオーディオオブジェクトに関連付けられたOAMDに変換し、
前記OAMDのチャネル順序制約に基づき、チャネルシャッフル情報を生成し、
前記チャネルシャッフル情報に基づき前記チャネルベースオーディオの1つ以上のオーディオチャネルを並べ替えて、並べ替えチャネルベースオーディオを生成し、
前記OAMDを用いて、前記並べ替えチャネルベースオーディオをレンダリングオーディオにレンダリングするか、又は、
前記並べ替えチャネルベースオーディオ及び前記OAMDをオブジェクトベースオーディオビットストリームに符号化し、前記オブジェクトベースオーディオビットストリームを再生装置又はソース装置へ送信する、
よう構成される、方法。 - 前記ビットストリームは、ネイティブオーディオビットストリームであり、前記方法は、前記ネイティブオーディオビットストリームを復号して、前記チャネルベースオーディオ及びメタデータを決定するステップ、を更に含む請求項1に記載の方法。
- 前記ネイティブオーディオビットストリームは、高度オーディオコーディング(AAC)ビットストリームである、請求項2に記載の方法。
- 前記チャネルベースオーディオ及び前記関連するチャネルベースオーディオメタデータは、各々N.Mチャネルベースオーディオ及び前記N.Mチャネルベースオーディオに関連付けられたチャネルベースオーディオメタデータであり、Nは9より大きい正の整数であり、Mは0以上の正の整数である、請求項1~3のいずれかに記載の方法。
- 前記チャネルベースオーディオは22.2である、請求項4に記載の方法。
- 方法であって、
オーディオ処理機器の1つ以上のプロセッサにより、チャネルベースオーディオと関連するチャネルベースオーディオメタデータとを含むビットストリームを受信するステップ、を含み、
前記1つ以上のプロセッサは、
前記チャネルベースオーディオをネイティブオーディオビットストリームに符号化し、
前記チャネルベースオーディオメタデータからシグナリングパラメータをパースし、前記シグナリングパラメータは、複数の異なるオブジェクトオーディオメタデータ(OAMD)表現のうちの1つを示し、前記OAMD表現のうちの各OAMD表現は、前記チャネルベースオーディオの1つ以上のオーディオチャネルを1つ以上のオーディオオブジェクトにマッピングし、
前記シグナリングパラメータにより示されるOAMD表現を用いて、前記チャネルベースメタデータを前記1つ以上のオーディオオブジェクトに関連付けられたOAMDに変換し、
前記OAMDのチャネル順序制約に基づき、チャネルシャッフル情報を生成し、
前記ネイティブオーディオビットストリーム、前記チャネルシャッフル情報、及び前記OAMDを含むビットストリームパッケージを生成し、前記チャネルシャッフル情報は、再生装置又はソース装置において、前記チャネルシャッフル情報に基づき前記チャネルベースオーディオの1つ以上のオーディオチャネルを並べ替えて、並べ替えチャネルベースオーディオを生成することを可能にし、
前記ビットストリームパッケージをトランスポート層ビットストリームに多重化し、
前記トランスポート層ビットストリームを前記再生装置又は前記ソース装置へ送信する、
よう構成される、方法。 - 前記ネイティブオーディオビットストリームは、高度オーディオコーディング(AAC)ビットストリームである、請求項6に記載の方法。
- 前記チャネルベースオーディオ及び前記関連するチャネルベースオーディオメタデータは、各々N.Mチャネルベースオーディオ及び前記N.Mチャネルベースオーディオに関連付けられたチャネルベースオーディオメタデータであり、Nは7より大きい正の整数であり、Mは0以上の正の整数である、請求項6又は7に記載の方法。
- 前記チャネルベースオーディオは22.2である、請求項8に記載の方法。
- 方法であって、
オーディオ処理機器の1つ以上のプロセッサにより、ビットストリームパッケージを含むトランスポート層ビットストリームを受信するステップであって、前記ビットストリームパッケージは、符号化されたチャネルベースオーディオ、チャネルシャッフル情報、及びオブジェクトオーディオメタデータ(OAMD)を含むネイティブオーディオビットストリームを含む、ステップを含み、
前記1つ以上のプロセッサは、
前記トランスポート層ビットストリームを逆多重化して、前記ビットストリームパッケージを決定し、
前記ビットストリームパッケージを復号して、前記チャネルベースオーディオ、前記チャネルシャッフル情報、及び前記オブジェクトオーディオメタデータ(OAMD)を決定し、
前記チャネルシャッフル情報に基づき前記チャネルベースオーディオのオーディオチャネルを並べ替えて、並べ替えチャネルベースオーディオを生成し、
前記OAMDを用いて、前記並べ替えチャネルベースオーディオをレンダリングオーディオにレンダリングするか、又は、
前記並べ替えチャネルベースオーディオ及び前記OAMDをオブジェクトベースオーディオビットストリームに符号化し、前記オブジェクトベースオーディオビットストリームをソース装置へ送信する、
よう構成される、方法。 - 前記ネイティブオーディオビットストリームは、高度オーディオコーディング(AAC)ビットストリームである、請求項10に記載の方法。
- 前記チャネルベースオーディオは、N.Mチャネルベースオーディオであり、Nは7より大きい正の整数であり、Mは0以上の正の整数である、請求項10又は11に記載の方法。
- 前記チャネルベースオーディオは22.2である、請求項12に記載の方法。
- 機器であって、
1つ以上のプロセッサと、
命令を格納している非一時的コンピュータ可読記憶媒体であって、前記命令は、前記1つ以上のプロセッサにより実行されると、前記1つ以上のプロセッサに、請求項1~13のいずれかに記載の方法を実行させる、非一時的コンピュータ可読記憶媒体と、
を含む機器。 - 命令を格納している非一時的コンピュータ可読記憶媒体であって、前記命令は、前記1つ以上のプロセッサにより実行されると、前記1つ以上のプロセッサに、請求項1~13のいずれかに記載の方法を実行させる、非一時的コンピュータ可読記憶媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962942322P | 2019-12-02 | 2019-12-02 | |
EP19212906 | 2019-12-02 | ||
EP19212906.2 | 2019-12-02 | ||
US62/942,322 | 2019-12-02 | ||
PCT/US2020/062873 WO2021113350A1 (en) | 2019-12-02 | 2020-12-02 | Systems, methods and apparatus for conversion from channel-based audio to object-based audio |
Publications (3)
Publication Number | Publication Date |
---|---|
JP7182751B1 true JP7182751B1 (ja) | 2022-12-02 |
JP7182751B6 JP7182751B6 (ja) | 2022-12-20 |
JP2022553111A JP2022553111A (ja) | 2022-12-21 |
Family
ID=73835849
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022532868A Active JP7182751B6 (ja) | 2019-12-02 | 2020-12-02 | チャネルベースオーディオからオブジェクトベースオーディオへの変換のためのシステム、方法、及び機器 |
Country Status (7)
Country | Link |
---|---|
US (1) | US12094476B2 (ja) |
EP (1) | EP3857919B1 (ja) |
JP (1) | JP7182751B6 (ja) |
KR (1) | KR102471715B1 (ja) |
CN (1) | CN114930876B (ja) |
BR (1) | BR112022010737A2 (ja) |
WO (1) | WO2021113350A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115190412A (zh) * | 2022-05-27 | 2022-10-14 | 赛因芯微(北京)电子科技有限公司 | 生成渲染器内部数据结构的方法、装置、设备及存储介质 |
CN115038030A (zh) * | 2022-05-30 | 2022-09-09 | 赛因芯微(北京)电子科技有限公司 | 一种场景输出渲染项确定方法、装置、设备及存储介质 |
CN115038029A (zh) * | 2022-05-30 | 2022-09-09 | 赛因芯微(北京)电子科技有限公司 | 音频渲染器的渲染项处理方法、装置、设备及存储介质 |
CN115226002A (zh) * | 2022-05-31 | 2022-10-21 | 赛因芯微(北京)电子科技有限公司 | 一种场景渲染项数据映射方法、装置、设备及存储介质 |
CN115209310A (zh) * | 2022-06-07 | 2022-10-18 | 赛因芯微(北京)电子科技有限公司 | 利用元数据对基于音床的音频进行渲染的方法及装置 |
CN115348528A (zh) * | 2022-06-30 | 2022-11-15 | 赛因芯微(北京)电子科技有限公司 | 一种音床渲染项数据映射方法、装置、设备及存储介质 |
CN115426613A (zh) * | 2022-07-29 | 2022-12-02 | 赛因芯微(北京)电子科技有限公司 | 利用元数据对基于场景的音频进行渲染的方法及装置 |
CN115426611A (zh) * | 2022-07-29 | 2022-12-02 | 赛因芯微(北京)电子科技有限公司 | 利用元数据对基于对象的音频进行渲染的方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013006338A2 (en) | 2011-07-01 | 2013-01-10 | Dolby Laboratories Licensing Corporation | System and method for adaptive audio signal generation, coding and rendering |
WO2016138168A1 (en) | 2015-02-25 | 2016-09-01 | Dolby Laboratories Licensing Corporation | Video content assisted audio object extraction |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2097895A4 (en) * | 2006-12-27 | 2013-11-13 | Korea Electronics Telecomm | DEVICE AND METHOD FOR ENCODING AND DECODING MULTI-OBJECT AUDIO SIGNAL WITH DIFFERENT CHANNELS WITH INFORMATION BIT RATE CONVERSION |
JP5220840B2 (ja) * | 2007-03-30 | 2013-06-26 | エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート | マルチチャネルで構成されたマルチオブジェクトオーディオ信号のエンコード、並びにデコード装置および方法 |
JP5856295B2 (ja) | 2011-07-01 | 2016-02-09 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 適応的オーディオシステムのための同期及びスイッチオーバ方法及びシステム |
EP3913931B1 (en) | 2011-07-01 | 2022-09-21 | Dolby Laboratories Licensing Corp. | Apparatus for rendering audio, method and storage means therefor. |
WO2013122387A1 (en) | 2012-02-15 | 2013-08-22 | Samsung Electronics Co., Ltd. | Data transmitting apparatus, data receiving apparatus, data transceiving system, data transmitting method, and data receiving method |
EP2862370B1 (en) | 2012-06-19 | 2017-08-30 | Dolby Laboratories Licensing Corporation | Rendering and playback of spatial audio using channel-based audio systems |
CN108806706B (zh) | 2013-01-15 | 2022-11-15 | 韩国电子通信研究院 | 处理信道信号的编码/解码装置及方法 |
US9338420B2 (en) | 2013-02-15 | 2016-05-10 | Qualcomm Incorporated | Video analysis assisted generation of multi-channel audio data |
CA2898885C (en) | 2013-03-28 | 2016-05-10 | Dolby Laboratories Licensing Corporation | Rendering of audio objects with apparent size to arbitrary loudspeaker layouts |
WO2014175668A1 (ko) | 2013-04-27 | 2014-10-30 | 인텔렉추얼디스커버리 주식회사 | 오디오 신호 처리 방법 |
TWI634798B (zh) | 2013-05-31 | 2018-09-01 | 新力股份有限公司 | Audio signal output device and method, encoding device and method, decoding device and method, and program |
US9858932B2 (en) * | 2013-07-08 | 2018-01-02 | Dolby Laboratories Licensing Corporation | Processing of time-varying metadata for lossless resampling |
EP2830045A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
EP3028476B1 (en) | 2013-07-30 | 2019-03-13 | Dolby International AB | Panning of audio objects to arbitrary speaker layouts |
EP2866227A1 (en) | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
EP2928216A1 (en) | 2014-03-26 | 2015-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for screen related audio object remapping |
EP3175446B1 (en) * | 2014-07-31 | 2019-06-19 | Dolby Laboratories Licensing Corporation | Audio processing systems and methods |
CN111556426B (zh) * | 2015-02-06 | 2022-03-25 | 杜比实验室特许公司 | 用于自适应音频的混合型基于优先度的渲染系统和方法 |
US10136240B2 (en) | 2015-04-20 | 2018-11-20 | Dolby Laboratories Licensing Corporation | Processing audio data to compensate for partial hearing loss or an adverse hearing environment |
JP6863282B2 (ja) | 2015-07-10 | 2021-04-21 | ソニーグループ株式会社 | 受信装置および受信方法 |
US9934790B2 (en) * | 2015-07-31 | 2018-04-03 | Apple Inc. | Encoded audio metadata-based equalization |
US10341770B2 (en) | 2015-09-30 | 2019-07-02 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
US10251007B2 (en) | 2015-11-20 | 2019-04-02 | Dolby Laboratories Licensing Corporation | System and method for rendering an audio program |
EP3301951A1 (en) | 2016-09-30 | 2018-04-04 | Koninklijke KPN N.V. | Audio object processing based on spatial listener information |
US10555103B2 (en) | 2017-03-31 | 2020-02-04 | Lg Electronics Inc. | Method for outputting audio signal using scene orientation information in an audio decoder, and apparatus for outputting audio signal using the same |
US20180357038A1 (en) * | 2017-06-09 | 2018-12-13 | Qualcomm Incorporated | Audio metadata modification at rendering device |
-
2020
- 2020-12-02 WO PCT/US2020/062873 patent/WO2021113350A1/en unknown
- 2020-12-02 BR BR112022010737A patent/BR112022010737A2/pt unknown
- 2020-12-02 CN CN202080092548.7A patent/CN114930876B/zh active Active
- 2020-12-02 JP JP2022532868A patent/JP7182751B6/ja active Active
- 2020-12-02 KR KR1020227022443A patent/KR102471715B1/ko active IP Right Grant
- 2020-12-02 US US17/781,978 patent/US12094476B2/en active Active
- 2020-12-02 EP EP20824875.7A patent/EP3857919B1/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013006338A2 (en) | 2011-07-01 | 2013-01-10 | Dolby Laboratories Licensing Corporation | System and method for adaptive audio signal generation, coding and rendering |
WO2016138168A1 (en) | 2015-02-25 | 2016-09-01 | Dolby Laboratories Licensing Corporation | Video content assisted audio object extraction |
Also Published As
Publication number | Publication date |
---|---|
JP7182751B6 (ja) | 2022-12-20 |
BR112022010737A2 (pt) | 2022-08-23 |
US12094476B2 (en) | 2024-09-17 |
CN114930876A (zh) | 2022-08-19 |
US20230024873A1 (en) | 2023-01-26 |
EP3857919B1 (en) | 2022-05-18 |
KR20220100084A (ko) | 2022-07-14 |
KR102471715B1 (ko) | 2022-11-29 |
EP3857919A1 (en) | 2021-08-04 |
CN114930876B (zh) | 2023-07-14 |
WO2021113350A1 (en) | 2021-06-10 |
JP2022553111A (ja) | 2022-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7182751B1 (ja) | チャネルベースオーディオからオブジェクトベースオーディオへの変換のためのシステム、方法、及び機器 | |
EP3729425B1 (en) | Priority information for higher order ambisonic audio data | |
KR101283783B1 (ko) | 고품질 다채널 오디오 부호화 및 복호화 장치 | |
US9373333B2 (en) | Method and apparatus for processing an audio signal | |
US20200013426A1 (en) | Synchronizing enhanced audio transports with backward compatible audio transports | |
KR101761569B1 (ko) | 오디오 현장의 코딩 | |
KR102172279B1 (ko) | 스케일러블 다채널 오디오 신호를 지원하는 부호화 장치 및 복호화 장치, 상기 장치가 수행하는 방법 | |
KR102640460B1 (ko) | 고차 앰비소닉 오디오 데이터에 대한 계층화된 중간 압축 | |
US11081116B2 (en) | Embedding enhanced audio transports in backward compatible audio bitstreams | |
CN108206022A (zh) | 利用aes/ebu信道传输三维声信号的编解码器及其编解码方法 | |
US11062713B2 (en) | Spatially formatted enhanced audio data for backward compatible audio bitstreams | |
KR20090039642A (ko) | Dmb 신호의 디코딩 방법 및 이의 디코딩 장치 | |
CN108206984A (zh) | 利用多信道传输三维声信号的编解码器及其编解码方法 | |
RU2793271C1 (ru) | Системы, способы и оборудование для преобразования из канально-ориентированного аудио в объектно-ориентированное аудио | |
JP2020120377A (ja) | オーディオオーサリング装置、オーディオレンダリング装置、送信装置、受信装置、及び方法 | |
CN108206983A (zh) | 兼容现有音视频系统的三维声信号的编码器及其方法 | |
CN108206021A (zh) | 一种后向兼容式三维声编码器、解码器及其编解码方法 | |
KR20140128563A (ko) | 복호화 객체 리스트 갱신 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220727 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220727 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20220727 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221025 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221121 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7182751 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |