JP6612753B2 - 高チャンネル数マルチチャンネルオーディオのためのマルチプレットベースのマトリックスミキシング - Google Patents
高チャンネル数マルチチャンネルオーディオのためのマルチプレットベースのマトリックスミキシング Download PDFInfo
- Publication number
- JP6612753B2 JP6612753B2 JP2016534697A JP2016534697A JP6612753B2 JP 6612753 B2 JP6612753 B2 JP 6612753B2 JP 2016534697 A JP2016534697 A JP 2016534697A JP 2016534697 A JP2016534697 A JP 2016534697A JP 6612753 B2 JP6612753 B2 JP 6612753B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- channels
- layout
- surviving
- quadruplet
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000011159 matrix material Substances 0.000 title claims description 43
- 238000002156 mixing Methods 0.000 title claims description 37
- 238000000034 method Methods 0.000 claims description 159
- 238000004091 panning Methods 0.000 claims description 99
- 230000005236 sound signal Effects 0.000 claims description 49
- 238000012545 processing Methods 0.000 claims description 41
- 238000009877 rendering Methods 0.000 claims description 40
- 238000010606 normalization Methods 0.000 claims description 26
- 238000013507 mapping Methods 0.000 claims description 6
- 230000001419 dependent effect Effects 0.000 claims description 2
- 239000000203 mixture Substances 0.000 description 85
- 230000006399 behavior Effects 0.000 description 39
- 230000006870 function Effects 0.000 description 36
- 238000010586 diagram Methods 0.000 description 30
- 230000008569 process Effects 0.000 description 25
- 230000000875 corresponding effect Effects 0.000 description 24
- 238000003860 storage Methods 0.000 description 19
- 230000015572 biosynthetic process Effects 0.000 description 18
- 238000003786 synthesis reaction Methods 0.000 description 18
- 230000002829 reductive effect Effects 0.000 description 14
- 230000009467 reduction Effects 0.000 description 11
- 230000006835 compression Effects 0.000 description 10
- 238000007906 compression Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 238000012732 spatial analysis Methods 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 7
- 230000002596 correlated effect Effects 0.000 description 7
- 210000005069 ears Anatomy 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 238000009795 derivation Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012856 packing Methods 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 239000002131 composite material Substances 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Analysis (AREA)
- Theoretical Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- General Physics & Mathematics (AREA)
- Algebra (AREA)
- Stereophonic System (AREA)
Description
本出願は、2013年11月27日出願の米国仮特許出願番号61/909,841「高チャンネル数マルチチャンネルオーディオのためのマルチプレットベースのマトリックスミキシング」の非仮出願である2014年11月26日出願の米国特許出願番号14/555,324「高チャンネル数マルチチャンネルオーディオのためのマルチプレットベースのマトリックスミキシング」、及び2014年7月30日出願の米国特許出願番号14/447,516「コンスタントパワーペアワイズパニングを備えたマトリックス復号器」の利益を主張し、その開示内容全体は引用により本明細書に組み込まれている。
以下は、本文書で使用される幾つかの基本的な用語及び概念である。このような用語及び概念の一部は、他のオーディオ技術に対して使用される際に有する意味とはわずかに異なる意味を有する場合がある。
マルチプレットベースの空間的マトリクス化コーデック及び方法の実施形態は、特定のチャンネルをマルチプレットの残りのチャンネルにパンニングすることによって、高チャンネル数マルチチャンネルオーディオ及びビットレートを低減する。これは、空間的精度及び基本的オーディオ品質の間のトレードオフを可能にすることによってオーディオ品質を最適化するのに役立つ。コーデック及び方法の実施形態は、オーディオ信号フォーマットを再生環境構成に変換する。
図5は、図4に示したマルチプレットベースの空間的マトリクス化符号器410の非レガシー実施形態の詳細を示すブロック図である。このような非レガシー実施形態では、符号器410は、後方互換性がレガシー復号器によって維持されるようにコンテンツを符号化しない。さらに、符号器410の実施形態は、オーディオデータと共にビットストリームに含まれる様々なタイプのメタデータを使用する。図5に示すように、符号器410はマルチプレットベースのマトリックスミキシングシステム500並びに圧縮及びビットストリームパッキングモジュール510を含む。コンテンツ作成環境430からの出力は、N.xパルス符号変調(PCM)ベッドミックス520を含み、N.xパルス符号変調(PCM)ベッドミックス520は、チャンネルベースのオーディオ情報と、オブジェクトPCMデータ530及び関連のオブジェクトメタデータ540を含むオブジェクトベースのオーディオ情報とを包含する。図5−8において、中空の矢印は時間ドメインデータを示し、実線の矢印は空間データを示す点に留意されたい。例えば、N.xPCMベッドミックス520からマルチプレットベースのマトリックスミキシングシステム500への矢印は中空矢印であり時間ドメインデータを示す。コンテンツ作成環境430からオブジェクトPCM530への矢印は実線の矢印であり空間データを示す。
M.x拡張ビットストリーム580は、レンダリングのために復号器420を包含する受信デバイスに配信される。図6は、図4に示したマルチプレットベースの空間マトリクス化復号器の非レガシー実施形態の詳細を示すブロック図である。これらの非レガシー実施形態では、復号器420は、以前のビットストリームのタイプとの後方互換性を保持せずこれを復号することができない。図6に示すように、復号器420は、マルチプレットベースのマトリックスアップミキシングシステム600、復元及びビットストリームアンパッキングモジュール610、遅延モジュール620、オブジェクト内包レンダリングエンジン630、及びダウンミキサ及びスピーカリマッピングモジュール640を含む。
図7は、図4に示したマルチプレットベースの空間マトリクス化符号器410のレガシー実施形態の詳細を示すブロック図である。このようなレガシー実施形態では、符号器410が、レガシー復号器との後方互換性が維持されるようにコンテンツを符号化する。多くの構成要素は、後方互換性のない実施形態と同じである。具体的には、マルチプレットベースのマトリックスミキシングシステム500がN.xPCMベッドミックス520をM.xPCMベッドミックス550にダウンミックスする。符号器410はオブジェクトPCM530及びオブジェクトメタデータ540を受け取り、これをM.xPCMベッドミックス550にミキシングしてエンベッディッドダウンミックスを作成する。このエンベッディッドダウンミックスはレガシー復号器によって復号可能である。これらの後方互換性のある実施形態では、エンベッディッドダウンミックスがM.xベッドミックスとオブジェクトの両方を含み、レガシー復号器が復号できるレガシーダウンミックスを作成する。
後方互換性M.x拡張ビットストリーム580は、レンダリングのための復号器420を包含する受信デバイスに配信される。図8は、図4に示したマルチプレットベースの空間マトリクス化復号器420の後方互換性のある実施形態の詳細を示すブロック図である。これらの後方互換性のある実施形態では、復号器420は、復号器420が以前のタイプのビットストリームを復号できるように以前のタイプのビットストリームとの後方互換性を保持する。
マルチプレットベースの空間マトリクス化コーデック及び方法の実施形態の構成要素のシステム詳細を説明する。モジュール、システム、及びコーデックを実施することができる幾つかの方法の一部が以下に詳細に説明されている点に留意されたい。多くの変形例が図9及び10に示したものから可能である。
マルチプレットベースの空間マトリクス化コーデック400及び方法の実施形態は、空間符号化及び復号技術であり、チャンネル数(従ってビットレート)を低減し、空間精度と基本的なオーディオ品質との間のトレードオフを可能にすることによってオーディオ品質を最適化して、オーディオ信号フォーマットを再生環境構成に変換する。
コーデック400及び方法の実施形態の第1使用事例は、ビットレート低減ツールとしての事例である。コーデック400及び方法をビットレート低減のために使用できる1つの例示的なシナリオは、1チャンネル当たりの利用可能なビットレートが、コーデック400によってサポートされる1つのチャンネル当たりの最小ビットレートを下回る場合である。このシナリオでは、コーデック400及び方法の実施形態を使用して符号化チャンネルの数を低減することができ、従って、サバイビングチャンネルのための高ビットレート割り当てを可能にする。このようなチャンネルは、デマトリクス化後のアーティファクトのアンマスキングを阻止するために、十分高いビットレートで符号化する必要がある。
コーデック400及び方法の実施形態の第2の使用事例は、レガシーコンテンツのブラインドアップミキシングを実行することである。この機能は、コーデック400及び方法が、レガシーコンテンツを再生環境485のラウドスピーカ位置に一致する水平及び高位チャンネルを含む3Dレイアウトに変換するのを可能にする。ブラインドアップミキシングは、モノ、ステレオ、5.1、7.1、及びその他のような標準的なレイアウトに実行することができる。
図11は、図4に示したマルチプレットベースの空間マトリクス化コーデック400及び方法の実施形態の一般的な動作を示す流れ図である。動作は、ダウンミックスされた出力オーディオ信号に入れるチャンネルのM数を選択することによって始まる(ボックス1100)。この選択は上述したように要求されるビットレートに基づく。N及びMはゼロではない正の整数であり、NはMより大きい点に留意されたい。
更に、マトリクス化動作は、固定オブジェクト(動き回らないオブジェクト)に適用することができ、デマトリクス化の後に個人のレベル修正を可能にする十分なオブジェクト分離を達成する。
マルチプレットベースの空間マトリクス化コーデック400及び方法の実施形態の動作の詳細を説明する。
マルチプレットベースのマトリックスダウンミキシングシステム500の例示的な実施形態では、システム500がNチャンネルオーディオ信号を受け入れMチャンネルオーディオ信号を出力し、ここでN及びMは整数でありNはMより大きい。システム500は、コンテンツ作成環境(オリジナル)チャンネルレイアウト、ダウンミックスされたチャンネルレイアウト、及び各オリジナルチャンネルが各ダウンミックスされたチャンネルに寄与するミキシング重みを記述するミキシング係数の知識を使用して構成することができる。例えば、ミキシング係数は、サイズM×NのマトリックスCによって定義することができ、行が出力チャンネルに対応し列が入力チャンネルに対応する。
は、
である場合に入力オーディオ信号のj番目のチャンネルであり、
は、
である場合に出力オーディオ信号のi番目のチャンネルであり、cijは、マトリックスCのijエントリに対応するミキシング係数である。
システム500の一部の実施形態は、図9に示したラウドネス正規化モジュール980も含む。ラウドネス正規化プロセスは、ダウンミックスされた信号の知覚されるラウドネスを原信号のラウドネスに正規化するよう設計される。マトリックスCのミキシング係数は、単一の原信号成分のためのパワーを保存するために一般的に選ばれるが、例えば標準的なサイン/コサインパンニング法則は、単一の成分のためのパワーを保存し、より複雑な信号材料では、パワー保存特性は保持されないことになる。ダウンミックスプロセスはオーディオ信号をパワードメインではなく振幅ドメインに結合するので、ダウンミックスされた信号の結果として得られる信号パワーは予測できず信号に依存する。さらに、ラウドネスは関連のある知覚特性であるので、信号パワーの代わりに、ダウンミックスされたオーディオ信号の知覚ラウドネスを保存することが望ましい。
は、入力ラウドネス推定値であり、
は、ITU−R BS.1770−3ラウドネス測定基準に記述される「K」周波数加重フィルタなどの周波数加重フィルタであり、(*)は畳み込みを示す。
は出力ラウドネス推定値である。
パーチャンネルラウドネス正規化を使用した動的ダウンミックスは、
は次式のように与えられるチャンネル依存利得であり、
は、BS.1770で定義されるようなラウドネス推定関数である。
図6に示したマルチプレットベースのマトリックスアップミキシングシステム600の例示的な実施形態では、システム600は、Mチャンネルオーディオ信号を受け入れ、Nチャンネルオーディオ信号を出力するが、M及びNは整数でありNはMより大きい。一部の実施形態では、システム600は、ダウンミキサによって処理されたオリジナルチャンネルレイアウトと同じ出力チャンネルレイアウトを目標にする。一部の実施形態では、分析及び合成フィルタバンクを内包するアップミックス処理が周波数ドメインで実行される。周波数ドメインにおけるアップミックス処理の実行は、複数の周波数帯域での別々の処理を可能にする。マルチ周波数帯域を別々に処理することは、異なる周波数帯域がサウンドフィールドの異なる位置から同時に生じる状況にアップミキサが対処するのを可能にする。しかしながら、ブロードバンド時間ドメイン信号にアップミックス処理を実行できる点にも留意されたい。
は周波数ドメインにおけるi番目の入力ダウンミックスチャンネルであり、
はサブバンド合計ダウンミックスパワー推定値であり、mは、時間指数であり(フィルタバンク構造に起因して縮小されている可能性がある)、kはサブバンド指数である。
コーデック400及び方法の実施形態による実際のマトリックスダウンミキシング及び相補アップミキシングが、スピーカ構成に応じて、ペアワイズ、トリプレット、及び好ましくはクアドラプレットミキシング法則の組合せを使用して実行される。換言すると、記録/ミキシングにおいて特定のスピーカがダウンミキシングによって排除又は仮想化される場合、位置が、a)サバイビングスピーカのペア間のラインセグメント又はこの近く、b)3サバイビングチャンネル/スピーカによって定義される三角形内、又はc)各々が頂点に配置される4つのチャンネルスピーカによって定義される四辺形内のケースであるかどうかの決定が適用される。
コーデック400及び方法の実施形態により、非サバイビング(又はサープラス)チャンネルの位置が2つのサバイビングチャンネル(又はサバイビングチャンネルの対応するサブバンド)の位置によって定義されたダブレットの間にある場合、以下に示すように、ダウンミックスされるチャンネルをダブレットのセット(又はペアワイズ)チャンネル関係に従ってマトリックス化する必要がある。
として示される推定パンニング角度)を、チャンネル間のレベル差(ICLDとして示す)から計算することができる。ICLDを次式のように定義するとする。
中心チャンネルは、以下の式を使用して2チャンネルダウンミックスから生成される。
に基づいて決定される。
中心チャンネルの同相成分に対する所望のパンニング挙動を図13に示す。図13は、次式によって与えられる同相プロット1300に対応するパンニング挙動を示す。
中心チャンネルの異相成分に対する所望のパンニング挙動を図14に示す。図14は次式によって与えられる異相プロット1400に対応するパンニング挙動を示す。
サラウンドチャンネルは、次式を使用して2チャンネルダウンミックスから生成される。
に基づいて決定され、事前に定義される所定の目標を達成する。
異相成分に対する左サラウンドチャンネルの目標は、図16の異相プロット1600によって示されるようなパンニング挙動を達成することである。図16は、左サラウンド及び右サラウンドチャンネルが別個に符号化され復号されるダウンミックス式に対応する2つの特定の角度を示す(これらの角度は図16の異相プロット1600において約0.25及び0.75である(45°及び135°に対応する))。このような角度は以下のように示される。
左及び右チャンネルは、中心及びサラウンドチャンネルに生成された成分を(完全に又は部分的に)取り除くために以下の式を使用して修正される。
に基づいて決定され、L’は修正された左チャンネルであり、R’は修正された右チャンネルである。
同相成分の修正された左チャンネルの目標は、図17の同相プロット1700によって示されるパンニング挙動を達成することである。図17では、0.5のパンニング角度θがディスクリート中心チャンネルに対応する。修正された左チャンネルのためのa及びb係数が、所望の出力のピースワイズ挙動によるピースワイズ関数を介して生成される。
異相成分のための修正された左チャンネルの目標は、図18の異相プロット1800によって示されるパンニング挙動を達成することである。図18では、パンニング角度
が左サラウンドチャンネルのための符号化角度に相当する。修正された左チャンネルのためのa及びb係数は、所望の出力のピースワイズ挙動によるピースワイズ関数を介して生成される。
上記に提示したチャンネル合成導出は、同相又は異相のいずれかであるソースコンテンツに対する所望のパンニング挙動の達成に基づく。ソースコンテンツの相対的な位相差を、次式のように適正に定義されたチャンネル間位相差(ICPD)によって決定することができる。
の三角関数を使用して生成される点に注目すべきである。
中心出力チャンネルは、次式のように定義される修正されたICPD値を使用して生成される。
上記の正弦関数の引数における第1項は、第1デマトリクス化係数の同相成分を表し、第2項は異相成分を表わす。従って、αは同相係数を表し、βは異相係数を表わす。同相係数及び異相係数共に、位相係数として公知である。
右サラウンド出力チャンネルは、次式のように定義される修正されたICPD値を使用して生成される。
の代わりにパンニング角度として
を使用することは別にして、左サラウンドチャンネルと同様に生成される点に留意されたい。
修正された右出力チャンネルは、次式のように修正されたICPD値を使用して生成される。
の代わりにパンニング角度として
を使用することは別にして、左チャンネルと同様に生成される。
コーデック400及び方法の実施形態により、非サバイビング(又はサープラス)チャンネルの位置が、3つのサバイビングチャンネル(又はサバイビングチャンネルの対応するサブバンド)の位置によって定義される三角形内にある場合、ダウンミックスされるチャンネルは、以下に示すようにトリプレットチャンネル関係のセットに従ってマトリックスにする必要がある。
非サバイビングチャンネルは三角形を形成する3つのサバイビングチャンネルにダウンミックスされる。数学的には、信号、S、は、チャンネルトリプレットC1/C2/C3にパンニングされた振幅である。図19は、チャンネルトリプレットへの信号ソース、S、のパンニングを示す図である。図19を参照すると、チャンネルC1とC2の間に位置付けられる信号ソースSの場合、チャンネルC1/C2/C3が以下の信号モデルに従って生成されることが前提になる。
トリプレットをアップミックスする場合の目的は、入力トリプレットC1/C2/C3から4つの出力チャンネルC1´/C2´/C3´/C4´を作成することによってトリプレットにダウンミックスされた非サバイビングチャンネルを取得することである。図20は、トリプレットにパンニングされていた非サバイビング第4チャンネルの抽出を示す図である。図20を参照すると、第4出力チャンネルC4の位置は、基準点であることが前提であり、他の3つの出力チャンネルC1´/C2´/C3´の位置は、入力チャンネルC1/C2/C3と同一であることが前提とされる。マルチプレットベースの空間マトリクス化復号器420の実施形態は、原信号成分Sの空間位置及び信号エネルギが保存されるように4つの出力チャンネルを生成する。
出力チャンネルC1´/C2´/C3´は、出力チャンネルC4で既に生成された信号成分が入力チャンネルC1/C2/C3から適切に「取り除かれる」ように入力チャンネルC1/C2/C3から生成される。
チャンネル間位相差(ICPD)空間特性は、元のペアワイズICPD値からトリプレットに対して計算することができる。
コーデック400及び方法の実施形態により、特定の対称条件が普及する場合、サープラスチャンネル(又はチャンネルサブバンド)は、好都合に四角形の中に入るに考えられる。このようなケースでは、コーデック400及び方法の実施形態は、以下に示したクアドラプレットケースセットの関係に従うダウンミキシング(及び相補アップミキシング)を含む。
非サバイビングチャンネルは、四角形を形成する4つのサバイビングチャンネルにダウンミックスされる。数学的には、信号ソース、S、は、チャンネルクアドラプレットC1/C2/C3/C4に振幅パンニングされる。図21は、チャンネルクアドラプレットへの信号ソース、S、のパンニングを示す図である。図21を参照すると、チャンネルC1とC2の間に位置付けられる信号ソースSに対して、チャンネルC1/C2/C3/C4は以下の信号モデルに従って生成されると仮定される。
クアドラプレットをアップミックスする場合の目的は、入力クアドラプレットC1/C2/C3/C4から5つの出力チャンネルC1´/C2´/C3´/C4´/C5を作成することによってクアドラプレットにダウンミックスされた非サバイビングチャンネルを取得することである。図22は、クアドラプレットにパンニングされている非サバイビング第5チャンネルの抽出を示す図である。図22を参照すると、第5出力チャンネルC5の位置は基準点にあることが前提とされ、他の4つの出力チャンネルC1´/C2´/C3´/C4´の位置は、入力チャンネルC1/C2/C3/C4に同一であることが前提とされる。マルチプレットベースの空間マトリクス化復号器420の実施形態は、原信号成分Sの空間位置及び信号エネルギが保存されるように5つの出力チャンネルを生成する。
及び
推定値を導出する。
)入力クアドラプレットC1/C2/C3/C4が前に識別された信号モデルの前提を壊す状況に対処する点に留意されたい。C3及びC4のエネルギレベルが互いに等しくなることを信号モデルは前提とする。しかし、これが任意の入力信号のケースでなくC3がC4に等しくない場合、出力チャンネルC1´/C2´/C3´/C4´/C5´全体に渡る入力信号のリパンニングを制限することが望ましい。これは、最小出力チャンネルC5を合成して可能な限りその対応する入力チャンネルC1/C2/C3/C4に同様に出力チャンネルC1´/C2´/C3´/C4´を保存することによって達成することができる。この段落では、C3及びC4チャンネルにおける最小関数の使用が、この目的を達成しようとする。
出力チャンネルC1´/C2´/C3´/C4´は、出力チャンネルC5で既に生成された信号成分が入力チャンネルC1/C2/C3/C4から適切に「取り除かれる」ように入力チャンネルC1/C2/C3/C4から生成される。
チャンネル間位相差(ICPD)空間特性を、元のペアワイズICPD値からクアドラプレットに対して計算することができる。
コーデック400及び方法の実施形態は、ベクトルベースの振幅パンニング(VBAP)技術の新規な拡張を使用してスピーカアレイ全体にオーディオオブジェクト波形をレンダリングする。従来のVBAP技術は、単位球面上の任意数の任意に配置されたラウドスピーカを使用して3次元サウンドフィールドを作成する。単位球面上の半球は、聴取者上方にドームを作成する。VBAPによって、作成できる最もローカライズ可能なサウンドは、ある三角形配列を作り上げる最大3チャンネルから発生する。サウンドが2つのスピーカの間の線上にあるポイントから偶発的に発生する場合、VBAPは、このような2つのスピーカを使用するだけである。サウンドが、スピーカが位置付けられている場所から発していると思われる場合は、VBAPはその1つのスピーカだけを使用する。VBAPは、サウンドを再生するために最大で3つのスピーカ及び最小で1つのスピーカを使用する。再生環境は3より多いスピーカを有することができるが、VBAP技術はこのようなスピーカのうち3つだけを使用してサウンドを再生する。
入力レイアウトのカテゴリが与えられると、サバイビングチャンネルの選択された数(M)、及び以下の法則は、実際の入力レイアウトに関わらず固有の方法で各非サバイビングチャンネルのマトリクス化を指示する。図22−25は、サバイビングレイアウトに存在しない入力レイアウトにおけるいずれのスピーカに対してもマトリックスマルチプレットのマッピングを指示するルックアップテーブルである。
1.高位チャンネルなしのレイアウト
2.前面にだけ高位チャンネルをもつレイアウト
3.取り囲む高位チャンネルをもつレイアウト(2つのハイトスピーカの間の分離>180°ではない)
4.取り囲む高位チャンネル及びオーバヘッドチャンネルをもつレイアウト
5.取り囲む高位チャンネル、オーバヘッドチャンネル、及び聴取者面より下のチャンネルをもつレイアウト
上記の説明では、「リパンニング」は、ダウンミックスされたチャンネルを上回ってナンバリングされたディスクリートチャンネル(N>M)がそれによって各チャンネルセットのダウンミックスから回復されるアップミキシング動作を指すことを理解されたい。これは、各セットに対して複数の知覚的に重要なサブバンドの各々で行われるのが好ましい。
以下に説明するものより多い他の変種がこの文書から明らかになるであろう。例えば、実施形態に応じて、本明細書で説明する方法及びアルゴリズムのいずれの特定の動作、事象、又は関数も、異なる順序で実行することができ、追加、統合、又は互いに除外することができる(説明する動作又は事象の全てが本方法及びアルゴリズムの実施に必要ではない)。また、特定の実施形態では、順次ではなく、マルチスレッド処理、割り込み処理、又はマルチプロセッサ又はプロセッサコア又は他の並行アーキテクチャなどを介して動作又は事象を同時に実行することができる。加えて、互いに作用することができる異なる機械及びコンピュータシステムによって異なるタスク又は処理を実行することができる。
400 マルチプレットベースの空間的マトリクス化コーデック
410 マルチプレットベースの空間的マトリクス化符号器
420 マルチプレットベースの空間的マトリクス化復号器
430 コンテンツ作成環境
435 複数のマイクロフォン
440 N.xミックス
450 M.xダウンミックス
460 配信環境
465 ネットワーク
470 媒体
475 M.xストリーム
480 再構成されたN.xコンテンツ
485 再生環境
Claims (20)
- Nチャンネルを有する入力オーディオ信号を伝送するための1又は2以上の処理デバイスによって実行される方法であって、
所望のビットレートに基づいてダウンミックス出力オーディオ信号のためのMチャンネルを選択する段階であって、N及びMはゼロでない正の整数でありNはMより大きい、段階と、
前記1又は2以上の処理デバイス及びマルチプレットパン法則の組合せを使用して前記NチャンネルをMチャンネルにダウンミックス及び符号化して、Mマルチプレット符号化チャンネルを包含するパルス符号変調(PCM)ベッドミックスを取得する段階と、
前記PCMベッドミックスを前記所望のビットレートで又はそれ以下のビットレートで伝送する段階と、
前記複数のMマルチプレット符号化チャンネルを分離する段階と、
前記1又は2以上の処理デバイス及びマルチプレットパン法則の組合せを使用して前記Mマルチプレット符号化チャンネルの各々をアップミックス及び復号して、前記Mマルチプレット符号化チャンネルから前記Nチャンネルを抽出して、Nチャンネルを有する結果として得られる出力オーディオ信号を取得する段階と、
再生チャンネルレイアウトを有する再生環境で前記結果として得られる出力オーディオ信号をレンダリングする段階と、
を含む方法。 - ダウンミックス及び符号化する段階は、クアドラプレットパン法則を使用して前記Nチャンネルの1つを前記Mチャンネルの4つにダウンミックス及び符号化して、クアドラプレット符号化チャンネルを取得する段階を更に含む、請求項1に記載の方法。
- ダウンミックス及び符号化する段階は、前記Nチャンネルの1つを前記Mチャンネルの4つにダウンミックス及び符号化してクアドラプレット符号化チャンネルを取得するようにクアドラプレットパン法則と、前記Nチャンネルの1つを前記Mチャンネルの3つにダウンミックス及び符号化してトリプレット符号化チャンネルを取得するようにトリプレットパン法則とを組み合わせて使用する段階を更に含む、請求項1に記載の方法。
- 前記クアドラプレット符号化チャンネルで使用される前記4つのMチャンネルの少なくとも一部は、前記トリプレット符号化チャンネルで使用される前記3つのMチャンネルと同じである、請求項3に記載の方法。
- コンテンツ作成環境チャンネルレイアウトを有するコンテンツ作成環境でオーディオコンテンツをミキシングする段階と、
前記コンテンツ作成環境チャンネルレイアウト及びMマルチプレット符号化チャンネルを包含する前記PCMベッドミックスをビットストリームに多重化して前記ビットストリームを前記所望のビットレート又はそれ以下のビットレートで伝送する段階と、
を更に含む、請求項1に記載の方法。 - 前記入力オーディオ信号の前記Nチャンネルのコンテンツ作成環境チャンネルレイアウトをカテゴライズして、前記コンテンツ作成環境チャンネルレイアウトのカテゴリを取得する段階と、
抽出されたマルチプレット符号化チャンネルを前記カテゴリ及びルックアップテーブルに基づいて前記再生チャンネルレイアウトにマッピングする段階と、
を更に含む、請求項1に記載の方法。 - 前記コンテンツ作成環境チャンネルレイアウトを前記以下の5つのカテゴリ、(a)高位チャンネルなしのレイアウト、(b)前面にだけ高位チャンネルのあるレイアウト、(c)取り囲む高位チャンネルを有するレイアウト、(d)取り囲む高位チャンネル及びオーバヘッドチャンネルを有するレイアウト、(e)取り囲む高位チャンネル、オーバヘッドチャンネル、及び聴取者の耳の面より下方のチャンネルを有するレイアウトの1又は2以上にカテゴライズする段階を更に含む、請求項6に記載の方法。
- 入力ラウドネス対出力ラウドネスの比によって前記Mチャンネルの各々をスケーリングしてラウドネス正規化を達成する段階を更に含む、請求項1に記載の方法。
- Nチャンネルを有するオーディオ信号をマトリクスダウンミックスするためのコンピュータデバイスによって実行される方法であって、
サバイビングチャンネルが合計でMチャンネルになるように、前記Nチャンネルのどれが前記サバイビングチャンネルであるか及びどれが非サバイビングチャンネルであるか選択する段階であって、N及びMはゼロでない正の整数でありNはMより大きい、段階と、 前記コンピュータデバイス及びマルチプレットパン法則を使用して、前記非サバイビングチャンネルの各々を前記サバイビングチャンネルのマルチプレットにダウンミックスしてパンニング重みを取得する段階であって、ダウンミックスする段階は、
一部の非サバイビングチャンネルを、ダブレットパン法則を使用してサバイビングチャンネルダブレットにダウンミックスする段階と、
一部の非サバイビングチャンネルを、トリプレットパン法則を使用してサバイビングチャンネルトリプレットにダウンミックスする段階と、
一部の非サバイビングチャンネルを、クアドラプレットパン法則を使用してサバイビングチャンネルクアドラプレットにダウンミックスする段階と
を含むことを特徴とする段階と、
前記サバイビングチャンネルダブレット、トリプレット、及びクアドラプレットを、Mチャンネルを有するビットストリームに符号化及び多重化して、再生環境でレンダリングするためのビットストリームを送信する段階と、
を含む方法。 - 前記クアドラプレットパン重みは、(a)再生環境の基準点からの信号ソース、S、の距離、r、及び(b)前記サバイビングチャンネルクアドラプレットにおける第1チャンネルと第2チャンネルの間の前記信号ソース、S、の角度、θ、に基づいて生成される、請求項12に記載の方法。
- Mチャンネルを有するオーディオ信号をマトリックスアップミックスするためのコンピュータデバイスによって実行される方法であって、
前記Mチャンネルを、ダブレットチャンネル、トリプレットチャンネル、及びクアドラプレットチャンネルに分離する段階と、
前記コンピュータデバイス及びクアドラプレットパン法則を使用して前記クアドラプレットチャンネルから第1チャンネルを抽出する段階と、
前記第1チャンネルが抽出された後、トリプレットパン法則を使用して前記トリプレットチャンネルから第2チャンネルを抽出する段階と、
前記第2チャンネルが抽出された後、ダブレットパン法則を使用して前記ダブレットチャンネルから第3チャンネルを抽出する段階と、
前記第1チャンネル、第2チャンネル、第3チャンネル、及びMチャンネルを互いに多重化して、Nチャンネルを有する出力信号を取得する段階と、
前記出力信号を再生環境でレンダリングする段階と、
を含む、方法。 - 前記第1チャンネルを抽出する段階は、係数によって各々が加重された前記クアドラプレットチャンネルの4つのチャンネルの和として前記第1チャンネルを取得する段階を更に含む、請求項15に記載の方法。
- 前記再生環境における聴取者の周りのイメージ単位球面を定義する段階であって、前記聴取者は前記単位球面の中心にいる、段階と、
半径距離、r、方位角、q、及び極角度、jを含む前記単位球面上のイメージ球座標系を定義する段階と、
前記第1チャンネルを、前記単位球面の内側の位置にリパンニングする段階と、
を更に含む、請求項15に記載の方法。 - 前記単位球面レンダリング技術に前記第1チャンネルを位置付ける段階と、
前記半径距離、rに沿って前記第1チャンネルを引き込むために、前記再生環境の全スピーカを使用して前記単位球面の中心に位置付けられたソースで前記第1チャンネルをクロスフェードする段階と、
を更に含む、請求項18に記載の方法。 - 前記オーディオ信号で符号化されたオーディオコンテンツをミキシングするよう使用された前記スピーカレイアウトを示す前記オーディオ信号からのコンテンツ作成環境スピーカレイアウトを抽出する段階を更に含む、請求項15に記載の方法。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361909841P | 2013-11-27 | 2013-11-27 | |
US61/909,841 | 2013-11-27 | ||
US14/447,516 US9338573B2 (en) | 2013-07-30 | 2014-07-30 | Matrix decoder with constant-power pairwise panning |
US14/447,516 | 2014-07-30 | ||
PCT/US2014/067763 WO2015081293A1 (en) | 2013-11-27 | 2014-11-26 | Multiplet-based matrix mixing for high-channel count multichannel audio |
US14/555,324 US9552819B2 (en) | 2013-11-27 | 2014-11-26 | Multiplet-based matrix mixing for high-channel count multichannel audio |
US14/555,324 | 2014-11-26 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017501438A JP2017501438A (ja) | 2017-01-12 |
JP6612753B2 true JP6612753B2 (ja) | 2019-11-27 |
Family
ID=56797954
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016534697A Active JP6612753B2 (ja) | 2013-11-27 | 2014-11-26 | 高チャンネル数マルチチャンネルオーディオのためのマルチプレットベースのマトリックスミキシング |
Country Status (8)
Country | Link |
---|---|
US (1) | US9552819B2 (ja) |
EP (2) | EP3074969B1 (ja) |
JP (1) | JP6612753B2 (ja) |
KR (1) | KR102294767B1 (ja) |
CN (1) | CN105981411B (ja) |
ES (2) | ES2772851T3 (ja) |
PL (2) | PL3444815T3 (ja) |
WO (1) | WO2015081293A1 (ja) |
Families Citing this family (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016018787A1 (en) * | 2014-07-31 | 2016-02-04 | Dolby Laboratories Licensing Corporation | Audio processing systems and methods |
CN106303897A (zh) * | 2015-06-01 | 2017-01-04 | 杜比实验室特许公司 | 处理基于对象的音频信号 |
US9590580B1 (en) * | 2015-09-13 | 2017-03-07 | Guoguang Electric Company Limited | Loudness-based audio-signal compensation |
ES2797224T3 (es) | 2015-11-20 | 2020-12-01 | Dolby Int Ab | Renderización mejorada de contenido de audio inmersivo |
US9886234B2 (en) | 2016-01-28 | 2018-02-06 | Sonos, Inc. | Systems and methods of distributing audio to one or more playback devices |
JP6703884B2 (ja) * | 2016-04-13 | 2020-06-03 | 日本放送協会 | チャンネル数変換装置、放送受信機およびプログラム |
US10375498B2 (en) * | 2016-11-16 | 2019-08-06 | Dts, Inc. | Graphical user interface for calibrating a surround sound system |
CN106774930A (zh) * | 2016-12-30 | 2017-05-31 | 中兴通讯股份有限公司 | 一种数据处理方法、装置及采集设备 |
US10366695B2 (en) * | 2017-01-19 | 2019-07-30 | Qualcomm Incorporated | Inter-channel phase difference parameter modification |
US11595774B2 (en) * | 2017-05-12 | 2023-02-28 | Microsoft Technology Licensing, Llc | Spatializing audio data based on analysis of incoming audio data |
EP3625974B1 (en) | 2017-05-15 | 2020-12-23 | Dolby Laboratories Licensing Corporation | Methods, systems and apparatus for conversion of spatial audio format(s) to speaker signals |
CN107506409B (zh) * | 2017-08-09 | 2021-01-08 | 浪潮金融信息技术有限公司 | 一种多音频数据的处理方法 |
KR102468799B1 (ko) | 2017-08-11 | 2022-11-18 | 삼성전자 주식회사 | 전자장치, 그 제어방법 및 그 컴퓨터프로그램제품 |
EP3681177A4 (en) * | 2017-09-06 | 2021-03-17 | Yamaha Corporation | AUDIO SYSTEM, AUDIO DEVICE, AND METHOD OF CONTROLLING AN AUDIO DEVICE |
CN111133411B (zh) * | 2017-09-29 | 2023-07-14 | 苹果公司 | 空间音频上混 |
GB201718341D0 (en) | 2017-11-06 | 2017-12-20 | Nokia Technologies Oy | Determination of targeted spatial audio parameters and associated spatial audio playback |
US10523171B2 (en) | 2018-02-06 | 2019-12-31 | Sony Interactive Entertainment Inc. | Method for dynamic sound equalization |
US10652686B2 (en) | 2018-02-06 | 2020-05-12 | Sony Interactive Entertainment Inc. | Method of improving localization of surround sound |
US11330370B2 (en) | 2018-02-15 | 2022-05-10 | Dolby Laboratories Licensing Corporation | Loudness control methods and devices |
GB2572650A (en) | 2018-04-06 | 2019-10-09 | Nokia Technologies Oy | Spatial audio parameters and associated spatial audio playback |
EP3550561A1 (en) | 2018-04-06 | 2019-10-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Downmixer, audio encoder, method and computer program applying a phase value to a magnitude value |
GB2574239A (en) | 2018-05-31 | 2019-12-04 | Nokia Technologies Oy | Signalling of spatial audio parameters |
JP2021530723A (ja) * | 2018-07-02 | 2021-11-11 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 没入的オーディオ信号を含むビットストリームを生成またはデコードするための方法および装置 |
US10887717B2 (en) | 2018-07-12 | 2021-01-05 | Sony Interactive Entertainment Inc. | Method for acoustically rendering the size of sound a source |
TWI688280B (zh) * | 2018-09-06 | 2020-03-11 | 宏碁股份有限公司 | 正交基底修正之音效控制方法及音效輸出裝置 |
US11304021B2 (en) | 2018-11-29 | 2022-04-12 | Sony Interactive Entertainment Inc. | Deferred audio rendering |
US11348573B2 (en) * | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
CN112216310B (zh) * | 2019-07-09 | 2021-10-26 | 海信视像科技股份有限公司 | 音频处理方法与装置、以及多声道系统 |
US11327802B2 (en) * | 2019-07-31 | 2022-05-10 | Microsoft Technology Licensing, Llc | System and method for exporting logical object metadata |
GB2586214A (en) * | 2019-07-31 | 2021-02-17 | Nokia Technologies Oy | Quantization of spatial audio direction parameters |
GB2590650A (en) * | 2019-12-23 | 2021-07-07 | Nokia Technologies Oy | The merging of spatial audio parameters |
WO2022124620A1 (en) * | 2020-12-08 | 2022-06-16 | Samsung Electronics Co., Ltd. | Method and system to render n-channel audio on m number of output speakers based on preserving audio-intensities of n-channel audio in real-time |
CN113438595B (zh) * | 2021-06-24 | 2022-03-18 | 深圳市叡扬声学设计研发有限公司 | 音频处理系统 |
CN113838470B (zh) * | 2021-09-15 | 2023-10-03 | Oppo广东移动通信有限公司 | 音频处理方法、装置、电子设备及计算机可读介质及产品 |
WO2023210978A1 (ko) * | 2022-04-28 | 2023-11-02 | 삼성전자 주식회사 | 다채널 오디오 신호 처리 장치 및 방법 |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5291557A (en) | 1992-10-13 | 1994-03-01 | Dolby Laboratories Licensing Corporation | Adaptive rematrixing of matrixed audio signals |
US5319713A (en) | 1992-11-12 | 1994-06-07 | Rocktron Corporation | Multi dimensional sound circuit |
US5638452A (en) | 1995-04-21 | 1997-06-10 | Rocktron Corporation | Expandable multi-dimensional sound circuit |
US5771295A (en) | 1995-12-26 | 1998-06-23 | Rocktron Corporation | 5-2-5 matrix system |
US5870480A (en) | 1996-07-19 | 1999-02-09 | Lexicon | Multichannel active matrix encoder and decoder with maximum lateral separation |
US6665407B1 (en) | 1998-09-28 | 2003-12-16 | Creative Technology Ltd. | Three channel panning system |
US6507658B1 (en) | 1999-01-27 | 2003-01-14 | Kind Of Loud Technologies, Llc | Surround sound panner |
US7003467B1 (en) | 2000-10-06 | 2006-02-21 | Digital Theater Systems, Inc. | Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio |
ES2280736T3 (es) | 2002-04-22 | 2007-09-16 | Koninklijke Philips Electronics N.V. | Sintetizacion de señal. |
US7039204B2 (en) * | 2002-06-24 | 2006-05-02 | Agere Systems Inc. | Equalization for audio mixing |
US20050052457A1 (en) | 2003-02-27 | 2005-03-10 | Neil Muncy | Apparatus for generating and displaying images for determining the quality of audio reproduction |
US7283684B1 (en) | 2003-05-20 | 2007-10-16 | Sandia Corporation | Spectral compression algorithms for the analysis of very large multivariate images |
SE0400997D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Efficient coding of multi-channel audio |
EP1749296B1 (en) * | 2004-05-28 | 2010-07-14 | Nokia Corporation | Multichannel audio extension |
US7391870B2 (en) | 2004-07-09 | 2008-06-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Apparatus and method for generating a multi-channel output signal |
US7283634B2 (en) | 2004-08-31 | 2007-10-16 | Dts, Inc. | Method of mixing audio channels using correlated outputs |
JP5106115B2 (ja) * | 2004-11-30 | 2012-12-26 | アギア システムズ インコーポレーテッド | オブジェクト・ベースのサイド情報を用いる空間オーディオのパラメトリック・コーディング |
US7787631B2 (en) * | 2004-11-30 | 2010-08-31 | Agere Systems Inc. | Parametric coding of spatial audio with cues based on transmitted channels |
JP4610650B2 (ja) * | 2005-03-30 | 2011-01-12 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 多チャンネルオーディオ符号化 |
US8345899B2 (en) | 2006-05-17 | 2013-01-01 | Creative Technology Ltd | Phase-amplitude matrixed surround decoder |
EP2575130A1 (en) * | 2006-09-29 | 2013-04-03 | Electronics and Telecommunications Research Institute | Apparatus and method for coding and decoding multi-object audio signal with various channel |
US8385556B1 (en) * | 2007-08-17 | 2013-02-26 | Dts, Inc. | Parametric stereo conversion system and method |
ES2435792T3 (es) * | 2008-12-15 | 2013-12-23 | Orange | Codificación perfeccionada de señales digitales de audio multicanal |
WO2010097748A1 (en) | 2009-02-27 | 2010-09-02 | Koninklijke Philips Electronics N.V. | Parametric stereo encoding and decoding |
KR101283783B1 (ko) * | 2009-06-23 | 2013-07-08 | 한국전자통신연구원 | 고품질 다채널 오디오 부호화 및 복호화 장치 |
KR101710113B1 (ko) | 2009-10-23 | 2017-02-27 | 삼성전자주식회사 | 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법 |
EP2539889B1 (en) * | 2010-02-24 | 2016-08-24 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus for generating an enhanced downmix signal, method for generating an enhanced downmix signal and computer program |
CN101964202B (zh) * | 2010-09-09 | 2012-03-28 | 南京中兴特种软件有限责任公司 | 一种混合多种编码格式的音频数据文件播放处理方法 |
WO2012125855A1 (en) * | 2011-03-16 | 2012-09-20 | Dts, Inc. | Encoding and reproduction of three dimensional audio soundtracks |
CN102158881B (zh) * | 2011-04-28 | 2013-07-31 | 武汉虹信通信技术有限责任公司 | 一种全面评估3g视频电话质量的方法和装置 |
TWI543642B (zh) | 2011-07-01 | 2016-07-21 | 杜比實驗室特許公司 | 用於適應性音頻信號的產生、譯碼與呈現之系統與方法 |
TWI505262B (zh) * | 2012-05-15 | 2015-10-21 | Dolby Int Ab | 具多重子流之多通道音頻信號的有效編碼與解碼 |
WO2014068817A1 (ja) * | 2012-10-31 | 2014-05-08 | パナソニック株式会社 | オーディオ信号符号化装置及びオーディオ信号復号装置 |
CN102984642A (zh) * | 2012-12-18 | 2013-03-20 | 武汉大学 | 一种五个扬声器的三维平移方法 |
EP2979467B1 (en) | 2013-03-28 | 2019-12-18 | Dolby Laboratories Licensing Corporation | Rendering audio using speakers organized as a mesh of arbitrary n-gons |
US9521501B2 (en) | 2013-09-12 | 2016-12-13 | Dolby Laboratories Licensing Corporation | Loudness adjustment for downmixed audio content |
-
2014
- 2014-11-26 PL PL18197144T patent/PL3444815T3/pl unknown
- 2014-11-26 ES ES18197144T patent/ES2772851T3/es active Active
- 2014-11-26 KR KR1020167016992A patent/KR102294767B1/ko active IP Right Grant
- 2014-11-26 JP JP2016534697A patent/JP6612753B2/ja active Active
- 2014-11-26 ES ES14866041T patent/ES2710774T3/es active Active
- 2014-11-26 EP EP14866041.8A patent/EP3074969B1/en active Active
- 2014-11-26 US US14/555,324 patent/US9552819B2/en active Active
- 2014-11-26 PL PL14866041T patent/PL3074969T3/pl unknown
- 2014-11-26 WO PCT/US2014/067763 patent/WO2015081293A1/en active Application Filing
- 2014-11-26 CN CN201480072584.1A patent/CN105981411B/zh active Active
- 2014-11-26 EP EP18197144.1A patent/EP3444815B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN105981411B (zh) | 2018-11-30 |
EP3444815B1 (en) | 2020-01-08 |
EP3444815A1 (en) | 2019-02-20 |
KR20160090869A (ko) | 2016-08-01 |
PL3444815T3 (pl) | 2020-11-30 |
KR102294767B1 (ko) | 2021-08-27 |
ES2772851T3 (es) | 2020-07-08 |
WO2015081293A1 (en) | 2015-06-04 |
EP3074969B1 (en) | 2018-11-21 |
ES2710774T3 (es) | 2019-04-26 |
EP3074969A4 (en) | 2017-08-30 |
PL3074969T3 (pl) | 2019-05-31 |
US9552819B2 (en) | 2017-01-24 |
US20150170657A1 (en) | 2015-06-18 |
EP3074969A1 (en) | 2016-10-05 |
JP2017501438A (ja) | 2017-01-12 |
CN105981411A (zh) | 2016-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6612753B2 (ja) | 高チャンネル数マルチチャンネルオーディオのためのマルチプレットベースのマトリックスミキシング | |
US10820134B2 (en) | Near-field binaural rendering | |
US20200335115A1 (en) | Audio encoding and decoding | |
CN112262585B (zh) | 环境立体声深度提取 | |
JP4944902B2 (ja) | バイノーラルオーディオ信号の復号制御 | |
JP6674981B2 (ja) | 音響信号のレンダリング方法、装置及び記録媒体 | |
KR102374897B1 (ko) | 3차원 오디오 사운드트랙의 인코딩 및 재현 | |
GB2549532A (en) | Merging audio signals with spatial metadata | |
KR20170109023A (ko) | 몰입형 오디오를 캡처하고, 인코딩하고, 분산하고, 디코딩하기 위한 시스템 및 방법 | |
BR112016016008B1 (pt) | Método para renderizar um sinal de áudio | |
JP2015509212A (ja) | 空間オーディオ・レンダリング及び符号化 | |
JP2016529801A (ja) | 一定出力ペアワイズパニングによるマトリクスデコーダ | |
WO2020080099A1 (ja) | 信号処理装置および方法、並びにプログラム | |
KR20190060464A (ko) | 오디오 신호 처리 방법 및 장치 | |
MX2008010631A (es) | Codificacion y decodificacion de audio |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20171124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190110 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190410 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190610 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190912 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20191015 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191031 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6612753 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |