JP6686015B2 - オーディオ信号のパラメトリック混合 - Google Patents
オーディオ信号のパラメトリック混合 Download PDFInfo
- Publication number
- JP6686015B2 JP6686015B2 JP2017522828A JP2017522828A JP6686015B2 JP 6686015 B2 JP6686015 B2 JP 6686015B2 JP 2017522828 A JP2017522828 A JP 2017522828A JP 2017522828 A JP2017522828 A JP 2017522828A JP 6686015 B2 JP6686015 B2 JP 6686015B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- signal
- channels
- additional
- group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 460
- 238000002156 mixing Methods 0.000 title claims description 260
- 238000000034 method Methods 0.000 claims description 150
- 238000012545 processing Methods 0.000 claims description 18
- 230000011664 signaling Effects 0.000 claims 1
- 239000011159 matrix material Substances 0.000 description 109
- 238000013507 mapping Methods 0.000 description 24
- 238000010586 diagram Methods 0.000 description 19
- 238000009877 rendering Methods 0.000 description 15
- 230000005540 biological transmission Effects 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 13
- 238000004590 computer program Methods 0.000 description 13
- 239000000203 mixture Substances 0.000 description 10
- 230000014509 gene expression Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000013139 quantization Methods 0.000 description 4
- 239000000654 additive Substances 0.000 description 3
- 230000000996 additive effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
第一の側面によれば、例示的実施形態は、オーディオ・デコード・システム、オーディオ・デコード方法および関連するコンピュータ・プログラム・プロダクトを提案する。第一の側面に基づく提案されるデコード・システム、方法およびコンピュータ・プログラム・プロダクトは一般に、同じ特徴および利点を共有してもよい。
第二の側面によれば、例示的実施形態は、オーディオ・エンコード・システムならびにオーディオ・エンコード方法および関連するコンピュータ・プログラム・プロダクトを提案する。第二の側面に基づく提案されるエンコード・システム、方法およびコンピュータ・プログラム・プロダクトは一般に、同じ特徴および利点を共有してもよい。さらに、第一の側面に基づくデコード・システム、方法およびコンピュータ・プログラム・プロダクトの特徴について上記で呈示された利点は一般に、第二の側面に基づくエンコード・システム、方法およびコンピュータ・プログラム・プロダクトについても有効でありうる。
第三の側面によれば、例示的実施形態は、コンピュータ可読媒体を提案する。前記第一および/または第二の側面に基づくシステム、方法およびコンピュータ・プログラム・プロダクトについて上記で呈示した利点は、概して、第三の側面に基づくコンピュータ可読媒体の対応する特徴についても有効でありうる。
図4〜図6は、11.1チャネル・オーディオ信号を5.1チャネル・オーディオ信号としてパラメトリック・エンコードするためまたは11.1チャネル・オーディオ信号を五つのスピーカーおよび一つのサブウーファーを有するスピーカー・システムにおいて再生するために、11.1チャネル・オーディオ信号をチャネルの諸グループに分割する代替的な諸仕方を示している。
L1=L+LS+LB
のように第一のグループ401のチャネルの和に対応していてもよく、ダウンミックス信号の第二のチャネルL2は、
L2=TFL+TBL
のように第二のグループ402のチャネルの和に対応していてもよい。
z1−z2=αy1+βy2+r
に従って最小二乗推定としてy1およびy2から推定されてもよい。誤差信号rはy1およびy2の両方に直交する。z1+z2=y1+y2を用いると、次式が導ける。
x1=TBL、x2=LS、x3=LB
として一度、
x1=TBR、x2=RS、x3=RB
として一度、適用されてもよく、式(3)によって与えられる近似が
x4=L、x5=TFL
として一度、
x4=R、x5=TFR
として一度、適用されてもよい。
x1=L、x2=LS、x3=LB
として一度、
x1=R、x2=RS、x3=RB
として一度、適用されてもよい。
x1=TBL、x2=LS、x3=LB
として一度、
x1=TBR、x2=RS、x3=RB
として一度、適用されてもよく、式(3)によって与えられる近似が
x4=L、x5=TFL
として一度、
x4=R、x5=TFR
として一度、適用されてもよい。
x1=TBL、x2=LS、x3=LB
として一度、
x1=TBR、x2=RS、x3=RB
として一度、
x1=TFL、x2=LW、x3=LSCRN
として一度、
x1=TFR、x2=RW、x3=RSCRN
として一度、適用されてもよい。
本開示は特定の例示的実施形態を記述し、図示しているが、本発明はそうした特定の例に制約されるものではない。上記の例示的実施形態に対する修正および変形が、付属の請求項によってのみ定義される本発明の範囲から外れることなく、なされることができる。
いくつかの態様を記載しておく。
〔態様1〕
オーディオ・デコード方法であって:
二チャネル・ダウンミックス信号を受領する段階であって、前記ダウンミックス信号は、該ダウンミックス信号に基づくMチャネル・オーディオ信号のパラメトリック再構成のためのアップミックス・パラメータを含むメタデータに関連付けられており、M≧4であり、前記ダウンミックス信号の第一のチャネルは、前記Mチャネル・オーディオ信号の第一のグループの一つまたは複数のチャネルの線形結合に対応し、前記ダウンミックス信号の第二のチャネルは、前記Mチャネル・オーディオ信号の第二のグループの一つまたは複数のチャネルの線形結合に対応し、前記第一のグループおよび前記第二のグループは、前記Mチャネル・オーディオ信号のM個のチャネルの分割をなす、段階と;
前記メタデータの少なくとも一部を受領する段階と;
前記ダウンミックス信号の少なくとも一つのチャネルに基づいて脱相関信号を生成する段階と;
受領されたメタデータに基づいて一組の混合係数を決定する段階と;
それらの混合係数に基づいて前記ダウンミックス信号および前記脱相関信号の線形結合としてKチャネル出力信号を形成する段階であって、2≦K<Mである、段階とを含み、
前記混合係数は:
前記出力信号のK個のチャネルのそれぞれが前記Mチャネル・オーディオ信号のあるグループの一つまたは複数のチャネルの線形結合を近似し;
前記出力信号のそれぞれのチャネルに対応するグループが前記Mチャネル・オーディオ信号のM個のチャネルの、一つまたは複数のチャネルのK個のグループへの分割をなし;
前記K個のグループのうちの少なくとも二つが前記第一のグループからの少なくとも一つのチャネルを含む、ように決定される、
オーディオ・デコード方法。
〔態様2〕
K=2である、態様1記載のオーディオ・デコード方法。
〔態様3〕
K=3またはK=4である、態様1記載のオーディオ・デコード方法。
〔態様4〕
受領されたメタデータが前記アップミックス・パラメータを含を含み、前記混合係数は、前記アップミックス・パラメータを処理することによって決定される、態様1ないし3のうちいずれか一項記載のオーディオ・デコード方法。
〔態様5〕
受領されたメタデータが前記アップミックス・パラメータとは異なる混合パラメータを含む、態様1ないし3のうちいずれか一項記載のオーディオ・デコード方法。
〔態様6〕
前記混合係数が、前記アップミックス・パラメータのいかなる値とも独立して決定される、態様5記載のオーディオ・デコード方法。
〔態様7〕
M=5またはM=6である、態様1ないし6のうちいずれか一項記載のオーディオ・デコード方法。
〔態様8〕
前記Mチャネル・オーディオ信号のあるチャネルからの、そのダウンミックス信号のチャネルが対応する前記線形結合のうちの一線形結合への寄与を制御する各利得が、前記Mチャネル・オーディオ信号のそのチャネルからの、前記出力信号のチャネルによって近似される前記線形結合のうちの一線形結合への寄与を制御する利得と一致する、態様1ないし7のうちいずれか一項記載のオーディオ・デコード方法。
〔態様9〕
前記ダウンミックス信号および前記メタデータを表わすビットストリーム(B)を受領する初期段階をさらに含み、
前記ダウンミックス信号と受領されたメタデータは前記ビットストリームから抽出される、
態様1ないし5のうちいずれか一項記載のオーディオ・デコード方法。
〔態様10〕
前記脱相関信号は単一チャネルの信号であってもよく、前記出力信号は、高々一つの脱相関信号チャネルを、前記ダウンミックス信号および前記脱相関信号の前記線形結合に含めることによって形成される、態様1ないし9のうちいずれか一項記載のオーディオ・デコード方法。
〔態様11〕
K=2であり、前記出力信号を形成することは、三チャネルから二チャネルへの投影に相当する、態様10記載のオーディオ・デコード方法。
〔態様12〕
前記脱相関信号は二チャネル信号であり、前記出力信号は、高々二つの脱相関信号チャネルを前記ダウンミックス信号と前記脱相関信号との線形結合に含めることによって形成される、態様1ないし9のうちいずれか一項記載のオーディオ・デコード方法。
〔態様13〕
K=3であり、前記出力信号を形成することは、四チャネルから三チャネルへの投影に相当する、態様12記載のオーディオ・デコード方法。
〔態様14〕
前記混合係数は、前記出力信号の一対のチャネルが前記脱相関信号のあるチャネルから等しい絶対値の寄与を受け、前記脱相関信号の前記あるチャネルから前記対のそれぞれのチャネルへの寄与は逆符号をもつよう、決定される、態様1ないし13のうちいずれか一項記載のオーディオ・デコード方法。
〔態様15〕
前記混合係数は、前記ダウンミックス信号の第一のチャネルから前記出力信号のあるチャネルへの寄与を制御する混合係数と前記ダウンミックス信号の前記第一のチャネルから前記出力信号の別のチャネルへの寄与を制御する混合係数との和が値1をもつよう決定される、態様1ないし14のうちいずれか一項記載のオーディオ・デコード方法。
〔態様16〕
前記第一のグループが二つまたは三つのチャネルからなる、態様1ないし15のうちいずれか一項記載のオーディオ・デコード方法。
〔態様17〕
前記Mチャネル・オーディオ信号は、前記Mチャネル・オーディオ信号のための再生環境における異なる水平方向を表わす三つのチャネルと、前記再生環境における前記三つのチャネルの方向から垂直に離間した方向を表わす二つのチャネルとを含む、態様1ないし16のうちいずれか一項記載のオーディオ・デコード方法。
〔態様18〕
前記第一のグループは、前記三つのチャネルからなり、前記第二のグループは前記再生環境における前記三つのチャネルの方向から垂直に離間した方向を表わす前記二つのチャネルからなる、態様17記載のオーディオ・デコード方法。
〔態様19〕
K=2であり、前記K個のグループのうちの一つが、前記再生環境における前記三つのチャネルの方向から垂直に離間した方向を表わす前記二つのチャネルの両方を含む、態様18記載のオーディオ・デコード方法。
〔態様20〕
前記再生環境における前記三つのチャネルの方向から垂直に離間した方向を表わす前記二つのチャネルが前記K個のグループのうちの異なるグループに含まれる、態様18記載のオーディオ・デコード方法。
〔態様21〕
前記Mチャネル・オーディオ信号が、前記Mチャネル・オーディオ信号についての再生環境における異なる水平方向を表わす四つのチャネル(LSCRN,LW,LS,LB)と、前記再生環境における前記四つのチャネルの方向から垂直に離間した方向を表わす二つのチャネル(TFL,TBL)とを含む、態様1ないし17のうちいずれか一項記載のオーディオ・デコード方法。
〔態様22〕
前記K個のグループのうちの一つが、前記再生環境における前記三つのチャネルの方向から垂直に離間した方向を表わす前記二つのチャネルの両方を含む、態様17〜18、20〜21のうちいずれか一項記載のオーディオ・デコード方法。
〔態様23〕
前記脱相関信号が、前記ダウンミックス信号のチャネルの線形結合を処理することによって得られる、態様1ないし22のうちいずれか一項記載のオーディオ・デコード方法。
〔態様24〕
前記脱相関信号が、前記ダウンミックス信号のたった一つのチャネルに基づいて得られる、態様1ないし22のうちいずれか一項記載のオーディオ・デコード方法。
〔態様25〕
前記脱相関信号が二つのチャネルを含み、前記脱相関信号の第一のチャネルは前記ダウンミックス信号の前記第一のチャネルに基づいて得られ、前記脱相関信号の第二のチャネルは前記ダウンミックス信号のたった一つのチャネルに基づいて得られる、態様1ないし22のうちいずれか一項記載のオーディオ・デコード方法。
〔態様26〕
前記第一のグループがN個のチャネルからなり、N≧3であり、前記第一のグループは、前記ダウンミックス信号の前記第一のチャネルと(N−1)チャネルの脱相関信号との線形結合として再構成可能であり、該再構成は、ドライ・アップミックス係数を前記ダウンミックス信号の前記第一のチャネルに適用し、ウェット・アップミックス係数を前記(N−1)チャネルの脱相関信号のチャネルに適用することにより、受領されたメタデータは、ドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータを含み、
前記混合係数の決定は:
前記ドライ・アップミックス・パラメータに基づいて、前記ドライ・アップミックス係数を決定する段階と;
受領されたウェット・アップミックス・パラメータの数より多くの要素をもつ中間行列に値を入れる段階であって、前記受領されたウェット・アップミックス・パラメータおよび該中間行列があらかじめ定義された行列クラスに属することを知ることに基づく、段階と;
前記中間行列にあらかじめ定義された行列を乗算することによって前記ウェット・アップミックス係数を得る段階であって、前記ウェット・アップミックス係数は前記乗算から帰結する行列に対応し、前記中間行列の要素の数より多い係数を含む、段階と;
前記ウェット・アップミックス係数および前記ドライ・アップミックス係数を処理する段階とを含む、
態様1〜4、7〜25のうちいずれか一項記載のオーディオ・デコード方法。
〔態様27〕
前記Mチャネル・オーディオ信号の少なくとも二つの符号化フォーマット(F 1 ,F 2 ,F 3 )のうちの一つを示すシグナルを受領する段階をさらに含み、それらの符号化フォーマットは、前記Mチャネル・オーディオ信号のチャネルの、前記ダウンミックス信号のチャネルに関連付けられたそれぞれ第一および第二のグループへのそれぞれの異なる分割に対応し、
前記K個のグループはあらかじめ定義されており、前記混合係数は、前記Mチャネル・オーディオ信号のチャネルの、前記出力信号のチャネルによって近似される前記K個のグループへの単一の分割が前記少なくとも二つの符号化フォーマットについて維持されるよう決定される、
態様1ないし26のうちいずれか一項記載のオーディオ・デコード方法。
〔態様28〕
K=2であり、当該オーディオ・デコード方法が:
前記シグナルが特定の符号化フォーマット(F 2 )を示すことに応答して、前記ダウンミックス信号を前記出力信号として通過させる段階をさらに含み、前記特定の符号化フォーマットは、前記K個のグループが定義する分割と一致する前記Mチャネル・オーディオ信号のチャネルの分割に対応する、
態様27記載のオーディオ・デコード方法。
〔態様29〕
K=2であり、当該オーディオ・デコード方法が:
前記シグナルがある特定の符号化フォーマットを指示することに応答して、前記脱相関信号からの前記出力信号への寄与を抑制することを含み、前記特定の符号化フォーマットは、前記K個のグループが定義する分割と一致する前記Mチャネル・オーディオ信号のチャネルの分割に対応する、
態様27記載のオーディオ・デコード方法。
〔態様30〕
第一の符号化フォーマット(F 1 )においては、前記第一のグループは、前記Mチャネル・オーディオ信号についての再生環境における異なる水平方向を表わす三つのチャネル(L,LS,LB)からなり、前記第二のグループは、前記再生環境における前記三つのチャネルの方向から垂直に離間した方向を表わす二つのチャネル(TFL,TBL)からなり、
第二の符号化フォーマット(F 2 )では、前記第一のグループおよび前記第二のグループのそれぞれが、前記再生環境における前記三つのチャネルの方向から垂直に離間した方向を表わす前記二つのチャネルの一つを含む、
態様27ないし29のうちいずれか一項記載のオーディオ・デコード方法。
〔態様31〕
デコード部(700、1200)を有するオーディオ・デコード・システム(800)であって、前記デコード部は:
二チャネル・ダウンミックス信号(L 1 ,L 2 )を受領する段階であって、前記ダウンミックス信号は、該ダウンミックス信号に基づくMチャネル・オーディオ信号(L,LS,LB,TFL,TBL)のパラメトリック再構成のためのアップミックス・パラメータ(α LU )を含むメタデータに関連付けられており、M≧4であり、前記ダウンミックス信号の第一のチャネル(L 1 )は、前記Mチャネル・オーディオ信号の第一のグループ(401)の一つまたは複数のチャネルの線形結合に対応し、前記ダウンミックス信号の第二のチャネル(L 2 )は、前記Mチャネル・オーディオ信号の第二のグループ(402)の一つまたは複数のチャネル(TFL,TBL)の線形結合に対応し、前記第一のグループおよび前記第二のグループは、前記Mチャネル・オーディオ信号のM個のチャネルの分割をなす、段階と;
前記メタデータの少なくとも一部を受領する段階と;
前記ダウンミックス信号および受領されたメタデータに基づいてKチャネル出力信号を提供する段階とを実行するよう構成されており、2≦K<Mであり、
前記デコード部は:
前記ダウンミックス信号の少なくとも一つのチャネルを受領し、それに基づいて脱相関信号(D)を出力するよう構成された脱相関部(710、1210)と;
受領されたメタデータに基づいて一組の混合係数を決定し、それらの混合係数に基づく、前記ダウンミックス信号および前記脱相関信号の線形結合として、前記出力信号を形成するよう構成された混合部(720、1220)とを有し、
前記混合部は、前記混合係数を:
前記出力信号のK個のチャネルのそれぞれが前記Mチャネル・オーディオ信号のあるグループの一つまたは複数のチャネルの線形結合を近似し;
前記出力信号のそれぞれのチャネルに対応するグループが前記Mチャネル・オーディオ信号のM個のチャネルの、一つまたは複数のチャネルのK個のグループ(501〜502、1301〜1303)への分割をなし;
前記K個のグループのうち少なくとも二つが前記第一のグループからの少なくとも一つのチャネルを含むよう決定するよう構成されている、
オーディオ・デコード・システム。
〔態様32〕
当該オーディオ・デコード・システムはさらに追加的なデコード部(805)を有しており、前記追加的なデコード部は:
追加的な二チャネル・ダウンミックス信号(R 1 ,R 2 )を受領する段階であって、前記追加的なダウンミックス信号は、該追加的なダウンミックス信号に基づく追加的なMチャネル・オーディオ信号(R,RS,RB,TFR,TBR)のパラメトリック再構成のための追加的なアップミックス・パラメータ(α RU )を含む追加的なメタデータに関連付けられており、前記追加的なダウンミックス信号の第一のチャネル(R 1 )は、前記追加的なMチャネル・オーディオ信号の第一のグループ(403)の一つまたは複数のチャネルの線形結合に対応し、前記追加的なダウンミックス信号の第二のチャネル(R 2 )は、前記追加的なMチャネル・オーディオ信号の第二のグループ(404)の一つまたは複数のチャネルの線形結合に対応し、前記追加的なMチャネル・オーディオ信号のチャネルの前記第一のグループおよび前記第二のグループは、前記追加的なMチャネル・オーディオ信号のM個のチャネルの分割をなす、段階と;
前記追加的なメタデータの少なくとも一部を受領する段階と;
前記追加的なダウンミックス信号および追加的な受領されたメタデータに基づいて追加的なKチャネル出力信号を提供する段階とを実行するよう構成されており、
前記追加的なデコード部は、前記追加的なダウンミックス信号の少なくとも一つのチャネルを受領し、それに基づいて追加的な脱相関信号を出力するよう構成された追加的な脱相関部と;
受領された追加的なメタデータに基づいて一組の追加的な混合係数を決定し、それらの追加的な混合係数に基づく、前記追加的なダウンミックス信号および前記追加的な脱相関信号の線形結合として、前記追加的な出力信号を形成するよう構成された追加的な混合部とを有しており、
前記追加的な混合部は、前記追加的な混合係数を:
前記追加的な出力信号のK個のチャネルのそれぞれが前記Mチャネル・オーディオ信号のあるグループの一つまたは複数のチャネルの線形結合を近似し;
前記追加的な出力信号のそれぞれのチャネルに対応するグループが前記追加的なMチャネル・オーディオ信号のM個のチャネルの、一つまたは複数のチャネルのK個のグループ(503〜504、1304〜1306)への分割をなし;
前記追加的なMチャネル・オーディオ信号の一つまたは複数のチャネルの前記K個のグループのうち少なくとも二つが前記追加的なMチャネル・オーディオ信号の前記第一のグループのチャネルからの少なくとも一つのチャネルを含む、よう決定するよう構成されている、
態様31記載のオーディオ・デコード・システム。
〔態様33〕
前記ダウンミックス信号、前記受領されたメタデータおよび離散的に符号化されたオーディオ・チャネル(C)をビットストリーム(B)から抽出するよう構成されたデマルチプレクサ(801)と;
前記離散的に符号化されたオーディオ・チャネルをデコードするよう動作可能な単一チャネル・デコード部とをさらに有する、
態様31または32記載のデコード・システム。
〔態様34〕
オーディオ・エンコード方法(300)であって:
M≧4であるとして、Mチャネル・オーディオ信号(L,LS,LB,TFL,TBL)を受領する段階(310)と;
前記Mチャネル・オーディオ信号に基づいて二チャネル・ダウンミックス信号(L 1 ,L 2 )を計算する段階であって、前記ダウンミックス信号の第一のチャネル(L 1 )は、前記Mチャネル・オーディオ信号の第一のグループ(401)の一つまたは複数のチャネルの線形結合として形成され、前記ダウンミックス信号の第二のチャネル(L 2 )は、前記Mチャネル・オーディオ信号の第二のグループ(402)の一つまたは複数のチャネルの線形結合として形成され、前記第一のグループおよび前記第二のグループは、前記Mチャネル・オーディオ信号のM個のチャネルの分割をなす、段階(320)と;
前記ダウンミックス信号からの前記Mチャネル・オーディオ信号のパラメトリック再構成のためのアップミックス・パラメータ(α LU )を決定する段階(330)と;
Kチャネル出力信号を前記ダウンミックス信号に基づいて得るための混合パラメータを決定する段階であって、2≦K<Mであり、前記出力信号のK個のチャネルのそれぞれが前記Mチャネル・オーディオ信号のあるグループの一つまたは複数のチャネルの線形結合を近似し、前記出力信号のそれぞれのチャネルに対応するグループが前記Mチャネル・オーディオ信号のM個のチャネルの、一つまたは複数のチャネルのK個のグループへの分割をなし、前記K個のグループのうち少なくとも二つは前記第一のグループからの少なくとも一つのチャネルを含む、段階(340)と;
前記ダウンミックス信号およびメタデータを、合同での記憶または伝送のために出力する段階であって、前記メタデータは、前記アップミックス・パラメータおよび前記混合パラメータを含む、段階(350)とを含む、
オーディオ・エンコード方法。
〔態様35〕
前記混合パラメータは、前記ダウンミックス信号からおよび脱相関信号から前記出力信号へのそれぞれの寄与を制御するものであり、前記混合パラメータの少なくともいくつかは、前記出力信号のK個のチャネルが一つまたは複数のチャネルのそれぞれK個のグループの一つまたは複数のチャネルの前記線形結合の共分散保存近似になるようにするような混合パラメータの間で、前記脱相関信号からの寄与を最小化することによって、決定される、態様34記載のオーディオ・エンコード方法。
〔態様36〕
前記第一のグループはN個のチャネルからなり、N≧3であり、前記アップミックス・パラメータの少なくともいくつかは、前記ダウンミックス信号の前記第一のチャネルと、前記ダウンミックス信号の前記第一のチャネルに基づいて決定される(N−1)チャネルの脱相関信号とからの、前記第一のグループのチャネルのパラメトリック再構成のために好適であり、前記アップミックス・パラメータを決定することは:
前記第一のグループを近似する前記ダウンミックス信号の前記第一のチャネルの線形マッピングを定義するために、一組のドライ・アップミックス係数を決定する段階と;
受領された前記第一のグループの共分散と前記ダウンミックス信号の前記第一のチャネルの前記線形マッピングによって近似される前記第一のグループのチャネルの共分散との間の差に基づく中間行列を決定する段階であって、前記中間行列は、あらかじめ定義された行列を乗算されたとき、前記第一のグループのパラメトリック再構成の一部として前記脱相関信号の線形マッピングを定義する一組のウェット・アップミックス係数に対応し、前記一組のウェット・アップミックス係数は、前記中間行列の要素の数より多くの係数を含む、段階とを含み、
前記アップミックス・パラメータは、ドライ・アップミックス・パラメータを含み、該ドライ・アップミックス・パラメータから前記一組のドライ・アップミックス係数が導出可能であり、前記アップミックス・パラメータは、ウェット・アップミックス・パラメータを含み、該ウェット・アップミックス・パラメータは、前記中間行列があらかじめ定義された行列クラスに属する限り、前記中間行列を一意的に定義し、前記中間行列は、前記ウェット・アップミックス・パラメータの数より多くの要素をもつ、
態様34または35記載のオーディオ・エンコード方法。
〔態様37〕
少なくとも二つの符号化フォーマット(F 1 ,F 2 ,F 3 )のうちの一つを選択する段階をさらに含み、それらの符号化フォーマットは、前記Mチャネル・オーディオ信号のチャネルの、前記ダウンミックス信号のチャネルに関連付けられたそれぞれ第一および第二のグループへのそれぞれの異なる分割に対応し、
前記ダウンミックス信号の前記第一および第二のチャネルは、選択された符号化フォーマットに基づく、前記Mチャネル・オーディオ信号のそれぞれ一つまたは複数のチャネルの第一および第二のグループの線形結合として形成され、前記アップミックス・パラメータおよび前記混合パラメータは、前記選択された符号化フォーマットに基づいて決定され、
当該方法はさらに:
選択された符号化フォーマットを指示するシグナルを提供することを含む、
態様34ないし36のうちいずれか一項記載のオーディオ・エンコード方法。
〔態様38〕
エンコード部(100)を有するオーディオ・エンコード・システム(200)であって、前記エンコード部は、M≧4であるとして、Mチャネル・オーディオ信号(L,LS,LB,TFL,TBL)を、二チャネル・ダウンミックス信号(L 1 ,L 2 )および関連付けられたメタデータとしてエンコードし、前記ダウンミックス信号およびメタデータを合同した記憶または伝送のために出力するよう構成されており、前記エンコード部は:
前記Mチャネル・オーディオ信号に基づいて前記ダウンミックス信号を計算するよう構成されたダウンミックス部(110)であって、前記ダウンミックス信号の第一のチャネル(L 1 )は、前記Mチャネル・オーディオ信号の第一のグループ(401)の一つまたは複数のチャネルの線形結合として形成され、前記ダウンミックス信号の第二のチャネル(L 2 )は、前記Mチャネル・オーディオ信号の第二のグループ(402)の一つまたは複数のチャネルの線形結合として形成され、前記第一のグループおよび前記第二のグループは、前記Mチャネル・オーディオ信号のM個のチャネルの分割をなす、ダウンミックス部と;
解析部(120)とを有し、前記解析部は:
前記ダウンミックス信号からの前記Mチャネル・オーディオ信号のパラメトリック再構成のためのアップミックス・パラメータ(α LU )と;
前記ダウンミックス信号に基づいてKチャネル出力信号を得るための混合パラメータ(α LM )とを決定するよう構成されており、2≦K<Mであり、前記出力信号の各チャネルが前記Mチャネル・オーディオ信号のあるグループの一つまたは複数のチャネルの線形結合を近似し、前記出力信号のそれぞれのチャネルに対応するグループは前記Mチャネル・オーディオ信号のM個のチャネルの、一つまたは複数のチャネルのK個のグループへの分割をなし、前記K個のグループのうち少なくとも二つは前記第一のグループからの少なくとも一つのチャネルを含み、
前記メタデータは、前記アップミックス・パラメータおよび前記混合パラメータを含む、
オーディオ・エンコード・システム。
〔態様39〕
態様1ないし30および34ないし37のうちいずれか一項記載の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔態様40〕
コンピュータ可読媒体(1100)であって:
二チャネル・ダウンミックス信号(L 1 ,L 2 )と;
前記ダウンミックス信号に基づくMチャネル・オーディオ信号(L,LS,LB,TFL,TBL)のパラメトリック再構成を許容するアップミックス・パラメータ(α LU )であって、M≧4であり、前記ダウンミックス信号の第一のチャネル(L 1 )は、前記Mチャネル・オーディオ信号の第一のグループ(401)の一つまたは複数のチャネルの線形結合に対応し、前記ダウンミックス信号の第二のチャネル(L 2 )は、前記Mチャネル・オーディオ信号の第二のグループ(402)の一つまたは複数のチャネルの線形結合に対応し、前記第一のグループおよび前記第二のグループは、前記Mチャネル・オーディオ信号のM個のチャネルの分割をなす、アップミックス・パラメータと;
前記ダウンミックス信号に基づいてKチャネル出力信号を提供することを許容する混合パラメータ(α LM )であって、2≦K<Mであり、前記出力信号の各チャネルが前記Mチャネル・オーディオ信号のあるグループの一つまたは複数のチャネルの線形結合を近似し、前記出力信号のそれぞれのチャネルに対応するグループが前記Mチャネル・オーディオ信号のM個のチャネルの、一つまたは複数のチャネルのK個のグループへの分割をなし、前記K個のグループのうち少なくとも二つは前記第一のグループからの少なくとも一つのチャネルを含む、混合パラメータとを表わす、
コンピュータ可読媒体。
〔態様41〕
前記コンピュータ可読媒体によって表わされるデータが諸時間フレームに配置されており、所与の時間フレームについて、その時間フレームについてのダウンミックス信号および関連付けられた混合パラメータが、関連付けられたアップミックス・パラメータとは独立して抽出されうるように層構成にされている、態様40記載のコンピュータ可読媒体。
〔実施例1〕
オーディオ・デコード方法(1000)であって:
二チャネル・ダウンミックス信号(L1,L2)を受領する段階であって、前記ダウンミックス信号は、該ダウンミックス信号に基づくMチャネル・オーディオ信号(L,LS,LB,TFL,TBL)のパラメトリック再構成のためのアップミックス・パラメータ(αLU)を含むメタデータに関連付けられており、M≧4であり、前記ダウンミックス信号の第一のチャネル(L1)は、前記Mチャネル・オーディオ信号の第一のグループ(401)の一つまたは複数のチャネルの線形結合に対応し、前記ダウンミックス信号の第二のチャネル(L2)は、前記Mチャネル・オーディオ信号の第二のグループ(402)の一つまたは複数のチャネルの線形結合に対応し、前記第一のグループおよび前記第二のグループは、前記Mチャネル・オーディオ信号のM個のチャネルの分割をなす、段階(1010)と;
前記メタデータの少なくとも一部を受領する段階(1020)と;
前記ダウンミックス信号の少なくとも一つのチャネルに基づいて脱相関信号(D)を生成する段階(1040)と;
受領されたメタデータに基づいて一組の混合係数を決定する段階(1050)と;
それらの混合係数に基づいて前記ダウンミックス信号および前記脱相関信号の線形結合として二チャネル出力信号〔チルダ付きのL1,L2〕を形成する段階(1060)とを含み、
前記混合係数は:
前記出力信号の第一のチャネル〔チルダ付きのL1〕が前記Mチャネル・オーディオ信号の第三のグループの一つまたは複数のチャネルの線形結合を近似し;
前記出力信号の第二のチャネル〔チルダ付きのL2〕が前記Mチャネル・オーディオ信号の第四のグループの一つまたは複数のチャネルの線形結合を近似し;
前記第三のグループおよび前記第四のグループが前記Mチャネル・オーディオ信号のM個のチャネルの分割をなし;
前記第三のグループおよび前記第四のグループがいずれも前記第一のグループからの少なくとも一つのチャネルを含む、ように決定される、
オーディオ・デコード方法。
〔実施例2〕
受領されたメタデータが前記アップミックス・パラメータを含を含み、前記混合係数は、前記アップミックス・パラメータを処理することによって決定される、実施例1記載のオーディオ・デコード方法。
〔実施例3〕
受領されたメタデータが前記アップミックス・パラメータとは異なる混合パラメータ(αLM)を含む、実施例1記載のオーディオ・デコード方法。
〔実施例4〕
前記混合係数が、前記アップミックス・パラメータのいかなる値とも独立して決定される、実施例3記載のオーディオ・デコード方法。
〔実施例5〕
M=5である、実施例1ないし4のうちいずれか一項記載のオーディオ・デコード方法。
〔実施例6〕
前記Mチャネル・オーディオ信号のあるチャネルからの、そのダウンミックス信号のチャネルが対応する前記線形結合のうちの一線形結合への寄与を制御する各利得が、前記Mチャネル・オーディオ信号のそのチャネルからの、前記出力信号のチャネルによって近似される前記線形結合のうちの一線形結合への寄与を制御する利得と一致する、実施例1ないし5のうちいずれか一項記載のオーディオ・デコード方法。
〔実施例7〕
前記ダウンミックス信号および前記メタデータを表わすビットストリーム(B)を受領する初期段階をさらに含み、
前記ダウンミックス信号と受領されたメタデータは前記ビットストリームから抽出される、
実施例1ないし6のうちいずれか一項記載のオーディオ・デコード方法。
〔実施例8〕
前記脱相関信号は単一チャネルの信号であってもよく、前記出力信号は、高々一つの脱相関信号チャネルを、前記ダウンミックス信号および前記脱相関信号の前記線形結合に含めることによって形成される、実施例1ないし7のうちいずれか一項記載のオーディオ・デコード方法。
〔実施例9〕
前記混合係数は、前記出力信号の二つのチャネルが前記脱相関信号から等しい絶対値の寄与を受け、前記脱相関信号から前記出力信号のそれぞれのチャネルへの寄与は逆符号をもつよう、決定される、実施例8記載の方法。
〔実施例10〕
前記出力信号を形成することは、三チャネルから二チャネルへの投影に相当する、実施例8または9記載の方法。
〔実施例11〕
前記混合係数は、前記ダウンミックス信号の第一のチャネルから前記出力信号の第一のチャネルへの寄与を制御する混合係数と前記ダウンミックス信号の第一のチャネルから前記出力信号の第二のチャネルへの寄与を制御する混合係数との和が値1をもつよう決定される、実施例1ないし10のうちいずれか一項記載のオーディオ・デコード方法。
〔実施例12〕
前記第一のグループが二つまたは三つのチャネルからなる、実施例1ないし11のうちいずれか一項記載のオーディオ・デコード方法。
〔実施例13〕
前記Mチャネル・オーディオ信号は、前記Mチャネル・オーディオ信号のための再生環境における異なる水平方向を表わす三つのチャネル(L,LS,LB)と、前記再生環境における前記三つのチャネルの方向とは垂直方向に離間した方向を表わす二つのチャネル(TFL,TBL)とを含む、実施例1ないし12のうちいずれか一項記載のオーディオ・デコード方法。
〔実施例14〕
前記第一のグループは、前記三つのチャネルからなり、前記第二のグループは前記二つのチャネルからなる、実施例13記載のオーディオ・デコード方法。
〔実施例15〕
前記第三のグループおよび前記第四のグループのうちの一つが、前記二つのチャネルの両方を含む、実施例14記載のオーディオ・デコード方法。
〔実施例16〕
前記第三のグループおよび前記第四のグループのそれぞれが、前記二つのチャネルの一方を含む、実施例14記載のオーディオ・デコード方法。
〔実施例17〕
前記脱相関信号が、前記ダウンミックス信号のチャネルの線形結合を処理することによって得られる、実施例1ないし16のうちいずれか一項記載のオーディオ・デコード方法。
〔実施例18〕
前記脱相関信号が、前記ダウンミックス信号のたった一つのチャネルに基づいて得られる、実施例1ないし15のうちいずれか一項記載のオーディオ・デコード方法。
〔実施例19〕
前記第一のグループがN個のチャネルからなり、N≧3であり、前記第一のグループは、前記ダウンミックス信号の前記第一のチャネルと(N−1)チャネルの脱相関信号との線形結合として再構成可能であり、該再構成は、ドライ・アップミックス係数を前記ダウンミックス信号の前記第一のチャネルに適用し、ウェット・アップミックス係数を前記(N−1)チャネルの脱相関信号のチャネルに適用することにより、受領されたメタデータは、ドライ・アップミックス・パラメータおよびウェット・アップミックス・パラメータを含み、
前記混合係数の決定は:
前記ドライ・アップミックス・パラメータに基づいて、前記ドライ・アップミックス係数を決定する段階と;
受領されたウェット・アップミックス・パラメータの数より多くの要素をもつ中間行列に値を入れる段階であって、前記受領されたウェット・アップミックス・パラメータおよび該中間行列があらかじめ定義された行列クラスに属することを知ることに基づく、段階と;
前記中間行列にあらかじめ定義された行列を乗算することによって前記ウェット・アップミックス係数を得る段階であって、前記ウェット・アップミックス係数は前記乗算から帰結する行列に対応し、前記中間行列の要素の数より多い係数を含む、段階と;
前記ウェット・アップミックス係数および前記ドライ・アップミックス係数を処理する段階とを含む、
実施例1〜2、5〜18のうちいずれか一項記載のオーディオ・デコード方法。
〔実施例20〕
前記Mチャネル・オーディオ信号の少なくとも二つの符号化フォーマット(F1,F2,F3)のうちの一つを示すシグナルを受領する段階(1030)をさらに含み、それらの符号化フォーマットは、前記Mチャネル・オーディオ信号のチャネルの、前記ダウンミックス信号のチャネルに関連付けられたそれぞれ第一および第二のグループへのそれぞれの異なる分割に対応し、
前記第三のグループおよび前記第四のグループはあらかじめ定義されており、前記混合係数は、前記Mチャネル・オーディオ信号のチャネルの、前記出力信号のチャネルによって近似される前記第三のグループおよび前記第四のグループへの単一の分割が前記少なくとも二つの符号化フォーマットについて維持されるよう決定される、
実施例1ないし19のうちいずれか一項記載のオーディオ・デコード方法。
〔実施例21〕
前記シグナルが特定の符号化フォーマット(F2)を示すことに応答して、前記ダウンミックス信号を前記出力信号として通過させる段階(1070)をさらに含み、前記特定の符号化フォーマットは、前記第三のグループおよび前記第四のグループが定義する分割と一致する前記Mチャネル・オーディオ信号のチャネルの分割に対応する、
実施例20記載のオーディオ・デコード方法。
〔実施例22〕
前記シグナルがある特定の符号化フォーマットを指示することに応答して、前記脱相関信号からの前記出力信号への寄与を抑制することを含み、前記特定の符号化フォーマットは、前記第三のグループおよび前記第四のグループが定義する分割と一致する前記Mチャネル・オーディオ信号のチャネルの分割に対応する、
実施例20記載のオーディオ・デコード方法。
〔実施例23〕
第一の符号化フォーマット(F1)においては、前記第一のグループは、前記Mチャネル・オーディオ信号についての再生環境における異なる水平方向を表わす三つのチャネル(L,LS,LB)からなり、前記第二のグループは、前記再生環境における前記三つのチャネルの方向から垂直に離間した方向を表わす二つのチャネル(TFL,TBL)からなり、
第二の符号化フォーマット(F2)では、前記第一のグループおよび前記第二のグループのそれぞれが前記二つのチャネルの一つを含む、
実施例20ないし22のうちいずれか一項記載のオーディオ・デコード方法。
〔実施例24〕
デコード部(700)を有するオーディオ・デコード・システム(800)であって、前記デコード部は:
二チャネル・ダウンミックス信号(L1,L2)を受領する段階であって、前記ダウンミックス信号は、該ダウンミックス信号に基づくMチャネル・オーディオ信号(L,LS,LB,TFL,TBL)のパラメトリック再構成のためのアップミックス・パラメータ(αLU)を含むメタデータに関連付けられており、M≧4であり、前記ダウンミックス信号の第一のチャネル(L1)は、前記Mチャネル・オーディオ信号の第一のグループ(401)の一つまたは複数のチャネルの線形結合に対応し、前記ダウンミックス信号の第二のチャネル(L2)は、前記Mチャネル・オーディオ信号の第二のグループ(402)の一つまたは複数のチャネル(TFL,TBL)の線形結合に対応し、前記第一のグループおよび前記第二のグループは、前記Mチャネル・オーディオ信号のM個のチャネルの分割をなす、段階と;
前記メタデータの少なくとも一部を受領する段階と;
前記ダウンミックス信号および受領されたメタデータに基づいて二チャネル出力信号〔チルダ付きのL1,L2〕を提供する段階とを実行するよう構成されており、
前記デコード部は:
前記ダウンミックス信号の少なくとも一つのチャネルを受領し、それに基づいて脱相関信号(D)を出力するよう構成された脱相関部(710)と;
受領されたメタデータに基づいて一組の混合係数を決定し、それらの混合係数に基づく、前記ダウンミックス信号および前記脱相関信号の線形結合として、前記出力信号を形成するよう構成された混合部(720)とを有し、
前記混合部は、前記混合係数を:
前記出力信号の第一のチャネル〔チルダ付きのL1〕が前記Mチャネル・オーディオ信号の第三のグループ(501)の一つまたは複数のチャネルの線形結合を近似し;
前記出力信号の第二のチャネル〔チルダ付きのL2〕が前記Mチャネル・オーディオ信号の第四のグループ(502)の一つまたは複数のチャネルの線形結合を近似し;
前記第三のグループおよび前記第四のグループが前記Mチャネル・オーディオ信号のM個のチャネルの分割をなし;
前記第三のグループおよび前記第四のグループがいずれも前記第一のグループからの少なくとも一つのチャネルを含むよう決定するよう構成されている、
オーディオ・デコード・システム。
〔実施例25〕
当該オーディオ・デコード・システムはさらに追加的なデコード部(805)を有しており、前記追加的なデコード部は:
追加的な二チャネル・ダウンミックス信号(R1,R2)を受領する段階であって、前記追加的なダウンミックス信号は、該追加的なダウンミックス信号に基づく追加的なMチャネル・オーディオ信号(R,RS,RB,TFR,TBR)のパラメトリック再構成のための追加的なアップミックス・パラメータ(αRU)を含む追加的なメタデータに関連付けられており、前記追加的なダウンミックス信号の第一のチャネル(R1)は、前記追加的なMチャネル・オーディオ信号の第一のグループ(403)の一つまたは複数のチャネルの線形結合に対応し、前記追加的なダウンミックス信号の第二のチャネル(R2)は、前記追加的なMチャネル・オーディオ信号の第二のグループ(403)の一つまたは複数のチャネルの線形結合に対応し、前記追加的なMチャネル・オーディオ信号のチャネルの前記第一のグループおよび前記第二のグループは、前記追加的なMチャネル・オーディオ信号のM個のチャネルの分割をなす、段階と;
前記追加的なメタデータの少なくとも一部を受領する段階と;
前記追加的なダウンミックス信号および追加的な受領されたメタデータに基づいて追加的な二チャネル出力信号〔チルダ付きのR1,R2〕を提供する段階とを実行するよう構成されており、
前記追加的なデコード部は、前記追加的なダウンミックス信号の少なくとも一つのチャネルを受領し、それに基づいて追加的な脱相関信号を出力するよう構成された追加的な脱相関部と;
受領された追加的なメタデータに基づいて一組の追加的な混合係数を決定し、それらの追加的な混合係数に基づく、前記追加的なダウンミックス信号および前記追加的な脱相関信号の線形結合として、前記追加的な出力信号を形成するよう構成された追加的な混合部とを有しており、
前記追加的な混合部は、前記追加的な混合係数を:
前記追加的な出力信号の第一のチャネル〔チルダ付きのR1〕が前記追加的なMチャネル・オーディオ信号の第三のグループ(503)の一つまたは複数のチャネルの線形結合を近似し;
前記追加的な出力信号の第二のチャネル〔チルダ付きのR2〕が前記追加的なMチャネル・オーディオ信号の第四のグループ(504)の一つまたは複数のチャネルの線形結合を近似し;
前記追加的なMチャネル・オーディオ信号のチャネルの前記第三のグループおよび前記第四のグループが前記追加的なMチャネル・オーディオ信号のM個のチャネルの分割をなし;
前記追加的なMチャネル・オーディオ信号のチャネルの前記第三のグループおよび前記第四のグループがいずれも前記追加的なMチャネル・オーディオ信号の前記第一のグループのチャネルからの少なくとも一つのチャネルを含む、よう決定するよう構成されている、
実施例24記載のオーディオ・デコード・システム。
〔実施例26〕
前記ダウンミックス信号、前記受領されたメタデータおよび離散的に符号化されたオーディオ・チャネル(C)をビットストリーム(B)から抽出するよう構成されたデマルチプレクサ(801)と;
前記離散的に符号化されたオーディオ・チャネルをデコードするよう動作可能な単一チャネル・デコード部とをさらに有する、
実施例24または25記載のデコード・システム。
〔実施例27〕
オーディオ・エンコード方法(300)であって:
M≧4であるとして、Mチャネル・オーディオ信号(L,LS,LB,TFL,TBL)を受領する段階(310)と;
前記Mチャネル・オーディオ信号に基づいて二チャネル・ダウンミックス信号(L1,L2)を計算する段階であって、前記ダウンミックス信号の第一のチャネル(L1)は、前記Mチャネル・オーディオ信号の第一のグループ(401)の一つまたは複数のチャネルの線形結合として形成され、前記ダウンミックス信号の第二のチャネル(L2)は、前記Mチャネル・オーディオ信号の第二のグループ(402)の一つまたは複数のチャネルの線形結合として形成され、前記第一のグループおよび前記第二のグループは、前記Mチャネル・オーディオ信号のM個のチャネルの分割をなす、段階(320)と;
前記ダウンミックス信号からの前記Mチャネル・オーディオ信号のパラメトリック再構成のためのアップミックス・パラメータ(αLU)を決定する段階(330)と;
二チャネル出力信号〔チルダ付きのL1,L2〕を前記ダウンミックス信号に基づいて得るための混合パラメータを決定する段階であって、前記出力信号の第一のチャネル〔チルダ付きのL1〕が前記Mチャネル・オーディオ信号の第三のグループ(501)の一つまたは複数のチャネルの線形結合を近似し、前記出力信号の第二のチャネル〔チルダ付きのL2〕が前記Mチャネル・オーディオ信号の第四のグループ(502)の一つまたは複数のチャネルの線形結合を近似し、前記第三のグループおよび前記第四のグループは前記Mチャネル・オーディオ信号のM個のチャネルの分割をなし、前記第三のグループおよび前記第四のグループはいずれも前記第一のグループからの少なくとも一つのチャネルを含む、段階(340)と;
前記ダウンミックス信号およびメタデータを、合同での記憶または伝送のために出力する段階であって、前記メタデータは、前記アップミックス・パラメータおよび前記混合パラメータを含む、段階(350)とを含む、
オーディオ・エンコード方法。
〔実施例28〕
前記混合パラメータは、前記ダウンミックス信号からおよび脱相関信号から前記出力信号へのそれぞれの寄与を制御するものであり、前記混合パラメータの少なくともいくつかは、前記出力信号のチャネルがそれぞれ前記第一のグループおよび前記第二のグループのチャネルの前記線形結合の共分散保存近似になるようにするような混合パラメータの間で、前記脱相関信号からの寄与を最小化することによって、決定される、実施例27記載のオーディオ・エンコード方法。
〔実施例29〕
前記第一のグループはN個のチャネルからなり、N≧3であり、前記アップミックス・パラメータの少なくともいくつかは、前記ダウンミックス信号の前記第一のチャネルと、前記ダウンミックス信号の前記第一のチャネルに基づいて決定される(N−1)チャネルの脱相関信号とからの、前記第一のグループのチャネルのパラメトリック再構成のために好適であり、前記アップミックス・パラメータを決定することは:
前記第一のグループを近似する前記ダウンミックス信号の前記第一のチャネルの線形マッピングを定義するために、一組のドライ・アップミックス係数を決定する段階と;
受領された前記第一のグループの共分散と前記ダウンミックス信号の前記第一のチャネルの前記線形マッピングによって近似される前記第一のグループのチャネルの共分散との間の差に基づく中間行列を決定する段階であって、前記中間行列は、あらかじめ定義された行列を乗算されたとき、前記第一のグループのパラメトリック再構成の一部として前記脱相関信号の線形マッピングを定義する一組のウェット・アップミックス係数に対応し、前記一組のウェット・アップミックス係数は、前記中間行列の要素の数より多くの係数を含む、段階とを含み、
前記アップミックス・パラメータは、ドライ・アップミックス・パラメータを含み、該ドライ・アップミックス・パラメータから前記一組のドライ・アップミックス係数が導出可能であり、前記アップミックス・パラメータは、ウェット・アップミックス・パラメータを含み、該ウェット・アップミックス・パラメータは、前記中間行列があらかじめ定義された行列クラスに属する限り、前記中間行列を一意的に定義し、前記中間行列は、前記ウェット・アップミックス・パラメータの数より多くの要素をもつ、
実施例27または28記載のオーディオ・エンコード方法。
〔実施例30〕
少なくとも二つの符号化フォーマット(F1,F2,F3)のうちの一つを選択する段階をさらに含み、それらの符号化フォーマットは、前記Mチャネル・オーディオ信号のチャネルの、前記ダウンミックス信号のチャネルに関連付けられたそれぞれ第一および第二のグループへのそれぞれの異なる分割に対応し、
前記ダウンミックス信号の前記第一および第二のチャネルは、選択された符号化フォーマットに基づく、前記Mチャネル・オーディオ信号のそれぞれ一つまたは複数のチャネルの第一および第二のグループの線形結合として形成され、前記アップミックス・パラメータおよび前記混合パラメータは、前記選択された符号化フォーマットに基づいて決定され、
当該方法はさらに:
選択された符号化フォーマットを指示するシグナルを提供することを含む、
実施例27ないし29のうちいずれか一項記載のオーディオ・エンコード方法。
〔実施例31〕
エンコード部(100)を有するオーディオ・エンコード・システム(200)であって、前記エンコード部は、M≧4であるとして、Mチャネル・オーディオ信号(L,LS,LB,TFL,TBL)を、二チャネル・ダウンミックス信号(L1,L2)および関連付けられたメタデータとしてエンコードし、前記ダウンミックス信号およびメタデータを合同した記憶または伝送のために出力するよう構成されており、前記エンコード部は:
前記Mチャネル・オーディオ信号に基づいて前記ダウンミックス信号を計算するよう構成されたダウンミックス部(110)であって、前記ダウンミックス信号の第一のチャネル(L1)は、前記Mチャネル・オーディオ信号の第一のグループ(401)の一つまたは複数のチャネルの線形結合として形成され、前記ダウンミックス信号の第二のチャネル(L2)は、前記Mチャネル・オーディオ信号の第二のグループ(402)の一つまたは複数のチャネルの線形結合として形成され、前記第一のグループおよび前記第二のグループは、前記Mチャネル・オーディオ信号のM個のチャネルの分割をなす、ダウンミックス部と;
解析部(120)とを有し、前記解析部は:
前記ダウンミックス信号からの前記Mチャネル・オーディオ信号のパラメトリック再構成のためのアップミックス・パラメータ(αLU)と;
前記ダウンミックス信号に基づいて二チャネル出力信号〔チルダ付きのL1,L2〕を得るための混合パラメータ(αLM)とを決定するよう構成されており、前記出力信号の第一のチャネル〔チルダ付きのL1〕が前記Mチャネル・オーディオ信号の第三のグループ(501)の一つまたは複数のチャネルの線形結合を近似し、前記出力信号の第二のチャネル〔チルダ付きのL2〕が前記Mチャネル・オーディオ信号の第四のグループ(502)の一つまたは複数のチャネルの線形結合を近似し、前記第三のグループおよび前記第四のグループは前記Mチャネル・オーディオ信号のM個のチャネルの分割をなし、前記第三のグループおよび前記第四のグループはいずれも前記第一のグループからの少なくとも一つのチャネルを含み、
前記メタデータは、前記アップミックス・パラメータおよび前記混合パラメータを含む、
オーディオ・エンコード・システム。
〔実施例32〕
実施例1ないし23および27ないし30のうちいずれか一項記載の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔実施例33〕
コンピュータ可読媒体(1100)であって:
二チャネル・ダウンミックス信号(L1,L2)と;
前記ダウンミックス信号に基づくMチャネル・オーディオ信号(L,LS,LB,TFL,TBL)のパラメトリック再構成を許容するアップミックス・パラメータ(αLU)であって、M≧4であり、前記ダウンミックス信号の第一のチャネル(L1)は、前記Mチャネル・オーディオ信号の第一のグループ(401)の一つまたは複数のチャネルの線形結合に対応し、前記ダウンミックス信号の第二のチャネル(L2)は、前記Mチャネル・オーディオ信号の第二のグループ(402)の一つまたは複数のチャネルの線形結合に対応し、前記第一のグループおよび前記第二のグループは、前記Mチャネル・オーディオ信号のM個のチャネルの分割をなす、アップミックス・パラメータと;
前記ダウンミックス信号に基づいて二チャネル出力信号〔チルダ付きのL1,L2〕を提供することを許容する混合パラメータ(αLM)であって、前記出力信号の第一のチャネル〔チルダ付きのL1〕が前記Mチャネル・オーディオ信号の第三のグループ(501)の一つまたは複数のチャネルの線形結合を近似し、前記出力信号の第二のチャネル〔チルダ付きのL2〕が前記Mチャネル・オーディオ信号の第四のグループ(502)の一つまたは複数のチャネルの線形結合を近似し、前記第三のグループおよび前記第四のグループが前記Mチャネル・オーディオ信号のM個のチャネルの分割をなし、前記第三のグループおよび前記第四のグループはいずれも前記第一のグループからの少なくとも一つのチャネルを含む、混合パラメータとを表わす、
コンピュータ可読媒体。
〔実施例34〕
前記データ担体によって表わされるデータが諸時間フレームに配置されており、所与の時間フレームについて、その時間フレームについてのダウンミックス信号および関連付けられた混合パラメータが、関連付けられたアップミックス・パラメータとは独立して抽出されうるように層構成にされている、実施例33記載のコンピュータ可読媒体。
Claims (16)
- オーディオ・デコード方法であって:
二チャネル・ダウンミックス信号を受領する段階であって、前記ダウンミックス信号は、該ダウンミックス信号に基づくMチャネル・オーディオ信号のパラメトリック再構成のためのアップミックス・パラメータを含むメタデータに関連付けられており、M≧4である、段階と;
前記メタデータの少なくとも一部を受領する段階と;
前記ダウンミックス信号の少なくとも一つのチャネルに基づいて脱相関信号を生成する段階と;
受領されたメタデータに基づいて一組の混合係数を決定する段階と;
それらの混合係数に基づいて前記ダウンミックス信号および前記脱相関信号の線形結合としてKチャネル出力信号を形成する段階であって、2≦K<Mである、段階とを含み、
前記混合係数は、前記ダウンミックス信号の第一のチャネルから前記出力信号のあるチャネルへの寄与を制御する混合係数と前記ダウンミックス信号の前記第一のチャネルから前記出力信号の別のチャネルへの寄与を制御する混合係数との和が値1をもつよう決定され、
前記ダウンミックス信号が第一の符号化フォーマット(F1)に従って前記Mチャネル・オーディオ信号を表わし、前記第一の符号化フォーマットでは:
前記ダウンミックス信号の第一のチャネルは、前記Mチャネル・オーディオ信号の第一のグループの一つまたは複数のチャネルのある線形結合に対応し、
前記ダウンミックス信号の第二のチャネルは、前記Mチャネル・オーディオ信号の第二のグループの一つまたは複数のチャネルのある線形結合に対応し、
前記第一のグループおよび前記第二のグループは、前記Mチャネル・オーディオ信号のM個のチャネルのある分割をなす、場合、
前記Kチャネル出力信号は第二の符号化フォーマット(F2,F4)に従って前記Mチャネル・オーディオ信号を表わし、前記第二の符号化フォーマットでは:
前記出力信号のK個のチャネルのそれぞれが前記Mチャネル・オーディオ信号のあるグループの一つまたは複数のチャネルの線形結合を近似し;
前記出力信号のそれぞれのチャネルに対応するグループが前記Mチャネル・オーディオ信号のM個のチャネルの、一つまたは複数のチャネルのK個のグループへの分割をなし;
前記K個のグループのうちの少なくとも二つが前記第一のグループからの少なくとも一つのチャネルを含む、ように決定される、
オーディオ・デコード方法。 - K=2、K=3またはK=4である、および/またはM=5またはM=6である、請求項1記載のオーディオ・デコード方法。
- 受領されたメタデータが前記アップミックス・パラメータを含み、前記混合係数は、前記アップミックス・パラメータを処理することによって決定される、請求項1または2記載のオーディオ・デコード方法。
- 前記第一の符号化フォーマットでは、前記Mチャネル・オーディオ信号の各チャネルは、そのチャネルからの、そのダウンミックス信号のチャネルが対応する前記線形結合のうちの一線形結合への寄与を制御する0でない利得と関連付けられており、
前記第二の符号化フォーマットでは、前記Mチャネル・オーディオ信号の各チャネルは、そのチャネルからの、前記出力信号のチャネルによって近似される前記線形結合のうちの一線形結合への寄与を制御する0でない利得と関連付けられており、
前記Mチャネル・オーディオ信号の各チャネルについて、前記第一の符号化フォーマットにおいてそのチャネルと関連付けられている0でない利得は、前記第二の符号化フォーマットにおいてそのチャネルと関連付けられている0でない利得と一致する、請求項1ないし3のうちいずれか一項記載のオーディオ・デコード方法。 - 前記脱相関信号は二チャネル信号であり、前記出力信号は、高々二つの脱相関信号チャネルを前記ダウンミックス信号と前記脱相関信号との線形結合に含めることによって形成される、請求項1ないし4のうちいずれか一項記載のオーディオ・デコード方法。
- K=3であり、前記出力信号を形成することは、四チャネルから三チャネルへの投影に相当する、請求項5記載のオーディオ・デコード方法。
- 前記Mチャネル・オーディオ信号は、前記Mチャネル・オーディオ信号のための再生環境における異なる水平方向を表わす三つまたは四つのチャネルと、前記再生環境における前記三つまたは四つのチャネルの方向から垂直に離間した方向を表わす二つのチャネルとを含む、請求項1ないし6のうちいずれか一項記載のオーディオ・デコード方法。
- 前記第一のグループは、前記三つのチャネルからなり、前記第二のグループは前記再生環境における前記三つのチャネルの方向から垂直に離間した方向を表わす前記二つのチャネルからなる、請求項7記載のオーディオ・デコード方法。
- 前記K個のグループのうちの一つが、前記再生環境における前記三つまたは四つのチャネルの方向から垂直に離間した方向を表わす前記二つのチャネルの両方を含む、請求項7記載のオーディオ・デコード方法。
- 前記脱相関信号が二つのチャネルを含み、前記脱相関信号の第一のチャネルは前記ダウンミックス信号の前記第一のチャネルに基づいて得られ、前記脱相関信号の第二のチャネルは前記ダウンミックス信号のたった一つのチャネルに基づいて得られる、請求項1ないし9のうちいずれか一項記載のオーディオ・デコード方法。
- 前記Mチャネル・オーディオ信号の少なくとも二つの符号化フォーマット(F1,F2,F3)のうちの一つを示す信号伝達をさらに含み、それらの符号化フォーマットは、前記Mチャネル・オーディオ信号のチャネルの、前記ダウンミックス信号のチャネルに関連付けられたそれぞれ第一および第二のグループへのそれぞれの異なる分割に対応し、
前記K個のグループはあらかじめ定義されており、前記混合係数は、前記Mチャネル・オーディオ信号のチャネルの、前記出力信号のチャネルによって近似される前記K個のグループへの単一の分割が前記少なくとも二つの符号化フォーマットについて維持されるよう決定される、
請求項1ないし10のうちいずれか一項記載のオーディオ・デコード方法。 - 前記少なくとも二つの符号化フォーマットのうちの第一の符号化フォーマット(F1)においては、前記第一のグループは、前記Mチャネル・オーディオ信号についての再生環境における異なる水平方向を表わす三つのチャネル(L,LS,LB)からなり、前記第二のグループは、前記再生環境における前記三つのチャネルの方向から垂直に離間した方向を表わす二つのチャネル(TFL,TBL)からなり、
前記少なくとも二つの符号化フォーマットのうちの第二の符号化フォーマット(F2)では、前記第一のグループおよび前記第二のグループのそれぞれが、前記再生環境における前記三つのチャネルの方向から垂直に離間した方向を表わす前記二つのチャネルの一つを含む、
請求項11記載のオーディオ・デコード方法。 - デコード部(700、1200)を有するオーディオ・デコード・システム(800)であって、前記デコード部は:
二チャネル・ダウンミックス信号(L1,L2)を受領する段階であって、前記ダウンミックス信号は、該ダウンミックス信号に基づくMチャネル・オーディオ信号(L,LS,LB,TFL,TBL)のパラメトリック再構成のためのアップミックス・パラメータ(αLU)を含むメタデータに関連付けられており、M≧4である、段階と;
前記メタデータの少なくとも一部を受領する段階と;
前記ダウンミックス信号および受領されたメタデータに基づいてKチャネル出力信号を提供する段階とを実行するよう構成されており、2≦K<Mであり、
前記デコード部は:
前記ダウンミックス信号の少なくとも一つのチャネルを受領し、それに基づいて脱相関信号(D)を出力するよう構成された脱相関部(710、1210)と;
受領されたメタデータに基づいて一組の混合係数を決定し、それらの混合係数に基づく、前記ダウンミックス信号および前記脱相関信号の線形結合として、前記出力信号を形成するよう構成された混合部(720、1220)とを有し、
前記混合部は、前記混合係数を:
前記ダウンミックス信号の第一のチャネルから前記出力信号のあるチャネルへの寄与を制御する混合係数と前記ダウンミックス信号の前記第一のチャネルから前記出力信号の別のチャネルへの寄与を制御する混合係数との和が値1をもつよう決定するよう構成されており、
前記ダウンミックス信号が第一の符号化フォーマット(F1)に従って前記Mチャネル・オーディオ信号を表わし、前記第一の符号化フォーマットでは:
前記ダウンミックス信号の第一のチャネルは、前記Mチャネル・オーディオ信号の第一のグループの一つまたは複数のチャネルのある線形結合に対応し、
前記ダウンミックス信号の第二のチャネルは、前記Mチャネル・オーディオ信号の第二のグループの一つまたは複数のチャネルのある線形結合に対応し、
前記第一のグループおよび前記第二のグループは、前記Mチャネル・オーディオ信号のM個のチャネルのある分割をなす、場合、
前記Kチャネル出力信号は第二(F2,F4)の符号化フォーマットに従って前記Mチャネル・オーディオ信号を表わし、前記第二の符号化フォーマットでは:
前記出力信号のK個のチャネルのそれぞれが前記Mチャネル・オーディオ信号のあるグループの一つまたは複数のチャネルの線形結合を近似し;
前記出力信号のそれぞれのチャネルに対応するグループが前記Mチャネル・オーディオ信号のM個のチャネルの、一つまたは複数のチャネルのK個のグループ(501〜502、1301〜1303)への分割をなし;
前記K個のグループのうち少なくとも二つが前記第一のグループからの少なくとも一つのチャネルを含む、
オーディオ・デコード・システム。 - 当該オーディオ・デコード・システムはさらに追加的なデコード部(805)を有しており、前記追加的なデコード部は:
追加的な二チャネル・ダウンミックス信号(R1,R2)を受領する段階であって、前記追加的なダウンミックス信号は、該追加的なダウンミックス信号に基づく追加的なMチャネル・オーディオ信号(R,RS,RB,TFR,TBR)のパラメトリック再構成のための追加的なアップミックス・パラメータ(αRU)を含む追加的なメタデータに関連付けられておいる、段階と;
前記追加的なメタデータの少なくとも一部を受領する段階と;
前記追加的なダウンミックス信号および追加的な受領されたメタデータに基づいて追加的なKチャネル出力信号を提供する段階とを実行するよう構成されており、
前記追加的なデコード部は、前記追加的なダウンミックス信号の少なくとも一つのチャネルを受領し、それに基づいて追加的な脱相関信号を出力するよう構成された追加的な脱相関部と;
受領された追加的なメタデータに基づいて一組の追加的な混合係数を決定し、それらの追加的な混合係数に基づく、前記追加的なダウンミックス信号および前記追加的な脱相関信号の線形結合として、前記追加的な出力信号を形成するよう構成された追加的な混合部とを有しており、
前記追加的な混合部は、前記追加的な混合係数を:
前記追加的なダウンミックス信号の第一のチャネルから前記追加的な出力信号のあるチャネルへの寄与を制御する混合係数と前記追加的なダウンミックス信号の前記第一のチャネルから前記追加的な出力信号の別のチャネルへの寄与を制御する混合係数との和が値1をもつよう決定するよう構成されており、
前記追加的なダウンミックス信号が第三の符号化フォーマットに従って前記追加的なMチャネル・オーディオ信号を表わし、前記第三の符号化フォーマットでは:
前記追加的なダウンミックス信号の第一のチャネルは、前記追加的なMチャネル・オーディオ信号の第一のグループの一つまたは複数のチャネルの線形結合に対応し、
前記追加的なダウンミックス信号の第二のチャネルは、前記追加的なMチャネル・オーディオ信号の第二のグループの一つまたは複数のチャネルの線形結合に対応し、
前記第一のグループおよび前記第二のグループは、前記追加的なMチャネル・オーディオ信号のM個のチャネルのある分割をなす、場合、
前記追加的なKチャネル出力信号は第四の符号化フォーマットに従って前記追加的なMチャネル・オーディオ信号を表わし、前記第四の符号化フォーマットでは:
前記追加的な出力信号のK個のチャネルのそれぞれが前記Mチャネル・オーディオ信号のあるグループの一つまたは複数のチャネルの線形結合を近似し;
前記追加的な出力信号のそれぞれのチャネルに対応するグループが前記追加的なMチャネル・オーディオ信号のM個のチャネルの、一つまたは複数のチャネルのK個のグループ(503〜504、1304〜1306)への分割をなし;
前記追加的なMチャネル・オーディオ信号の一つまたは複数のチャネルの前記K個のグループのうち少なくとも二つが前記追加的なMチャネル・オーディオ信号の前記第一のグループのチャネルからの少なくとも一つのチャネルを含む、よう決定するよう構成されている、
請求項13記載のオーディオ・デコード・システム。 - 前記ダウンミックス信号、前記受領されたメタデータおよび離散的に符号化されたオーディオ・チャネル(C)をビットストリーム(B)から抽出するよう構成されたデマルチプレクサ(801)と;
前記離散的に符号化されたオーディオ・チャネルをデコードするよう動作可能な単一チャネル・デコード部とをさらに有する、
請求項13または14記載のデコード・システム。 - 請求項1ないし12のうちいずれか一項記載の方法をコンピュータに実行させるための命令をもつコンピュータ可読媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462073462P | 2014-10-31 | 2014-10-31 | |
US62/073,462 | 2014-10-31 | ||
US201562167711P | 2015-05-28 | 2015-05-28 | |
US62/167,711 | 2015-05-28 | ||
PCT/EP2015/075022 WO2016066705A1 (en) | 2014-10-31 | 2015-10-28 | Parametric mixing of audio signals |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2017537342A JP2017537342A (ja) | 2017-12-14 |
JP2017537342A5 JP2017537342A5 (ja) | 2018-12-06 |
JP6686015B2 true JP6686015B2 (ja) | 2020-04-22 |
Family
ID=54364338
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017522828A Active JP6686015B2 (ja) | 2014-10-31 | 2015-10-28 | オーディオ信号のパラメトリック混合 |
Country Status (39)
Country | Link |
---|---|
US (1) | US9930465B2 (ja) |
EP (1) | EP3213322B1 (ja) |
JP (1) | JP6686015B2 (ja) |
KR (1) | KR102501969B1 (ja) |
CN (1) | CN107112020B (ja) |
AU (1) | AU2015340622B2 (ja) |
CA (1) | CA2965731C (ja) |
CL (1) | CL2017001037A1 (ja) |
CO (1) | CO2017004283A2 (ja) |
CY (1) | CY1121917T1 (ja) |
DK (1) | DK3213322T3 (ja) |
EA (1) | EA034250B1 (ja) |
EC (1) | ECSP17023702A (ja) |
ES (1) | ES2732668T3 (ja) |
GE (1) | GEP20196960B (ja) |
GT (1) | GT201700088A (ja) |
HK (1) | HK1243547B (ja) |
HR (1) | HRP20191107T1 (ja) |
HU (1) | HUE044368T2 (ja) |
IL (1) | IL251789B (ja) |
LT (1) | LT3213322T (ja) |
ME (1) | ME03453B (ja) |
MX (1) | MX364405B (ja) |
MY (1) | MY190174A (ja) |
PE (1) | PE20170759A1 (ja) |
PH (1) | PH12017500723A1 (ja) |
PL (1) | PL3213322T3 (ja) |
PT (1) | PT3213322T (ja) |
RS (1) | RS58874B1 (ja) |
SA (1) | SA517381440B1 (ja) |
SG (1) | SG11201703263PA (ja) |
SI (1) | SI3213322T1 (ja) |
SV (1) | SV2017005431A (ja) |
TN (1) | TN2017000143A1 (ja) |
TW (1) | TWI587286B (ja) |
UA (1) | UA123388C2 (ja) |
UY (1) | UY36378A (ja) |
WO (1) | WO2016066705A1 (ja) |
ZA (1) | ZA201702647B (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6640849B2 (ja) * | 2014-10-31 | 2020-02-05 | ドルビー・インターナショナル・アーベー | マルチチャネル・オーディオ信号のパラメトリック・エンコードおよびデコード |
EP3286930B1 (en) | 2015-04-21 | 2020-05-20 | Dolby Laboratories Licensing Corporation | Spatial audio signal manipulation |
BR112021014135A2 (pt) * | 2019-01-21 | 2021-09-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sinal de áudio codificado, aparelho e método para codificação de uma representação de áudio espacial ou aparelho e método para decodificação de um sinal de áudio codificado |
US11523239B2 (en) * | 2019-07-22 | 2022-12-06 | Hisense Visual Technology Co., Ltd. | Display apparatus and method for processing audio |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7720230B2 (en) * | 2004-10-20 | 2010-05-18 | Agere Systems, Inc. | Individual channel shaping for BCC schemes and the like |
US20060106620A1 (en) | 2004-10-28 | 2006-05-18 | Thompson Jeffrey K | Audio spatial environment down-mixer |
SE0402649D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Advanced methods of creating orthogonal signals |
US7813933B2 (en) | 2004-11-22 | 2010-10-12 | Bang & Olufsen A/S | Method and apparatus for multichannel upmixing and downmixing |
US20060165247A1 (en) | 2005-01-24 | 2006-07-27 | Thx, Ltd. | Ambient and direct surround sound system |
TWI313857B (en) * | 2005-04-12 | 2009-08-21 | Coding Tech Ab | Apparatus for generating a parameter representation of a multi-channel signal and method for representing multi-channel audio signals |
WO2006108543A1 (en) * | 2005-04-15 | 2006-10-19 | Coding Technologies Ab | Temporal envelope shaping of decorrelated signal |
CN102693727B (zh) * | 2006-02-03 | 2015-06-10 | 韩国电子通信研究院 | 用于控制音频信号的渲染的方法 |
US7965848B2 (en) | 2006-03-29 | 2011-06-21 | Dolby International Ab | Reduced number of channels decoding |
EP2054875B1 (en) | 2006-10-16 | 2011-03-23 | Dolby Sweden AB | Enhanced coding and parameter representation of multichannel downmixed object coding |
CA2670864C (en) | 2006-12-07 | 2015-09-29 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
US8908873B2 (en) | 2007-03-21 | 2014-12-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
KR101312470B1 (ko) * | 2007-04-26 | 2013-09-27 | 돌비 인터네셔널 에이비 | 출력 신호 합성 장치 및 방법 |
MX2010004138A (es) * | 2007-10-17 | 2010-04-30 | Ten Forschung Ev Fraunhofer | Codificacion de audio usando conversion de estereo a multicanal. |
JP5258967B2 (ja) * | 2008-07-15 | 2013-08-07 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
EP2214162A1 (en) | 2009-01-28 | 2010-08-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Upmixer, method and computer program for upmixing a downmix audio signal |
EP2214161A1 (en) * | 2009-01-28 | 2010-08-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for upmixing a downmix audio signal |
EP2249334A1 (en) * | 2009-05-08 | 2010-11-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
EP2489038B1 (en) | 2009-11-20 | 2016-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear combination parameter |
US9437198B2 (en) | 2012-07-02 | 2016-09-06 | Sony Corporation | Decoding device, decoding method, encoding device, encoding method, and program |
EP2870603B1 (en) | 2012-07-09 | 2020-09-30 | Koninklijke Philips N.V. | Encoding and decoding of audio signals |
IN2015MN01952A (ja) | 2013-02-14 | 2015-08-28 | Dolby Lab Licensing Corp | |
BR112016008817B1 (pt) | 2013-10-21 | 2022-03-22 | Dolby International Ab | Método para reconstruir um sinal de áudio de n canais, sistema de decodificação de áudio, método para codificar um sinal de áudio de n canais e sistema de codificação de áudio |
-
2015
- 2015-10-13 TW TW104133508A patent/TWI587286B/zh active
- 2015-10-28 CN CN201580059156.XA patent/CN107112020B/zh active Active
- 2015-10-28 ME MEP-2019-170A patent/ME03453B/me unknown
- 2015-10-28 UA UAA201704246A patent/UA123388C2/uk unknown
- 2015-10-28 EA EA201790753A patent/EA034250B1/ru unknown
- 2015-10-28 DK DK15787573.3T patent/DK3213322T3/da active
- 2015-10-28 WO PCT/EP2015/075022 patent/WO2016066705A1/en active Application Filing
- 2015-10-28 US US15/522,255 patent/US9930465B2/en active Active
- 2015-10-28 CA CA2965731A patent/CA2965731C/en active Active
- 2015-10-28 LT LTEP15787573.3T patent/LT3213322T/lt unknown
- 2015-10-28 MY MYPI2017701447A patent/MY190174A/en unknown
- 2015-10-28 MX MX2017005409A patent/MX364405B/es active IP Right Grant
- 2015-10-28 PL PL15787573T patent/PL3213322T3/pl unknown
- 2015-10-28 HU HUE15787573 patent/HUE044368T2/hu unknown
- 2015-10-28 GE GEAP201514481A patent/GEP20196960B/en unknown
- 2015-10-28 SI SI201530795T patent/SI3213322T1/sl unknown
- 2015-10-28 JP JP2017522828A patent/JP6686015B2/ja active Active
- 2015-10-28 PE PE2017000726A patent/PE20170759A1/es unknown
- 2015-10-28 SG SG11201703263PA patent/SG11201703263PA/en unknown
- 2015-10-28 RS RS20190769A patent/RS58874B1/sr unknown
- 2015-10-28 KR KR1020177011883A patent/KR102501969B1/ko active IP Right Grant
- 2015-10-28 PT PT15787573T patent/PT3213322T/pt unknown
- 2015-10-28 ES ES15787573T patent/ES2732668T3/es active Active
- 2015-10-28 AU AU2015340622A patent/AU2015340622B2/en active Active
- 2015-10-28 TN TN2017000143A patent/TN2017000143A1/en unknown
- 2015-10-28 EP EP15787573.3A patent/EP3213322B1/en active Active
- 2015-10-30 UY UY0001036378A patent/UY36378A/es active IP Right Grant
-
2017
- 2017-04-12 ZA ZA2017/02647A patent/ZA201702647B/en unknown
- 2017-04-19 IL IL251789A patent/IL251789B/en active IP Right Grant
- 2017-04-20 PH PH12017500723A patent/PH12017500723A1/en unknown
- 2017-04-26 CL CL2017001037A patent/CL2017001037A1/es unknown
- 2017-04-27 GT GT201700088A patent/GT201700088A/es unknown
- 2017-04-27 CO CONC2017/0004283A patent/CO2017004283A2/es unknown
- 2017-04-28 SV SV2017005431A patent/SV2017005431A/es unknown
- 2017-04-30 SA SA517381440A patent/SA517381440B1/ar unknown
- 2017-05-03 EC ECIEPI201723702A patent/ECSP17023702A/es unknown
-
2018
- 2018-02-27 HK HK18102845.3A patent/HK1243547B/zh unknown
-
2019
- 2019-06-18 HR HRP20191107TT patent/HRP20191107T1/hr unknown
- 2019-06-27 CY CY20191100677T patent/CY1121917T1/el unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8379868B2 (en) | Spatial audio coding based on universal spatial cues | |
JP5185340B2 (ja) | マルチチャネルオーディオ信号を表示するための装置と方法 | |
TWI544479B (zh) | 音訊解碼器、音訊編碼器、用以基於已編碼表示型態提供至少四音訊聲道信號的方法、用以基於至少四音訊聲道信號提供已編碼表示型態的方法、及使用頻寬擴展的電腦程式 | |
JP6479786B2 (ja) | オーディオ信号のパラメトリック再構成 | |
CN107077861B (zh) | 音频编码器和解码器 | |
JP6374980B2 (ja) | サラウンドオーディオ信号処理のための装置及び方法 | |
RU2749349C1 (ru) | Кодер аудиосцены, декодер аудиосцены и соответствующие способы, использующие пространственный анализ с гибридным кодером/декодером | |
JP6686015B2 (ja) | オーディオ信号のパラメトリック混合 | |
KR20180009337A (ko) | 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치 | |
CN112823534B (zh) | 信号处理设备和方法以及程序 | |
JP6201047B2 (ja) | オーディオ信号のパラメトリック再構成のための脱相関器構造 | |
KR20220093158A (ko) | 방향성 메타데이터를 사용한 멀티채널 오디오 인코딩 및 디코딩 | |
WO2023172865A1 (en) | Methods, apparatus and systems for directional audio coding-spatial reconstruction audio processing | |
NZ731194B2 (en) | Parametric mixing of audio signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A529 | Written submission of copy of amendment under article 34 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A529 Effective date: 20170427 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181023 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181023 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191112 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200303 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200401 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6686015 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |