JP6163545B2 - 可変数の受信チャネルに基づくマルチチャネル・オーディオ・レンダリングのためのなめらかな構成切り換え - Google Patents
可変数の受信チャネルに基づくマルチチャネル・オーディオ・レンダリングのためのなめらかな構成切り換え Download PDFInfo
- Publication number
- JP6163545B2 JP6163545B2 JP2015516626A JP2015516626A JP6163545B2 JP 6163545 B2 JP6163545 B2 JP 6163545B2 JP 2015516626 A JP2015516626 A JP 2015516626A JP 2015516626 A JP2015516626 A JP 2015516626A JP 6163545 B2 JP6163545 B2 JP 6163545B2
- Authority
- JP
- Japan
- Prior art keywords
- time frame
- signal
- channel
- input signal
- encoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000009877 rendering Methods 0.000 title 1
- 230000005236 sound signal Effects 0.000 claims description 206
- 238000002156 mixing Methods 0.000 claims description 114
- 230000015572 biosynthetic process Effects 0.000 claims description 107
- 238000003786 synthesis reaction Methods 0.000 claims description 107
- 230000007704 transition Effects 0.000 claims description 60
- 238000006243 chemical reaction Methods 0.000 claims description 52
- 238000000034 method Methods 0.000 claims description 50
- 230000007935 neutral effect Effects 0.000 claims description 49
- 230000004044 response Effects 0.000 claims description 32
- 230000008859 change Effects 0.000 claims description 14
- 238000004891 communication Methods 0.000 claims description 9
- 238000009826 distribution Methods 0.000 claims description 8
- 238000013213 extrapolation Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 15
- 230000003111 delayed effect Effects 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 9
- 238000011161 development Methods 0.000 description 9
- 230000018109 developmental process Effects 0.000 description 9
- 238000003860 storage Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 8
- 238000000354 decomposition reaction Methods 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000006399 behavior Effects 0.000 description 5
- 230000001934 delay Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本稿での用法では、オーディオ信号は、純粋なオーディオ信号、オーディオビジュアル信号もしくはマルチメディア信号のオーディオ部分またはこれらの任意のものをメタデータと組み合わせたものでありうる。
時間フレームのはじまりにおける(たとえば時間フレームの最初の1/6の間のまたは1536個のうち256個の時間サンプルの間の)クロスフェードに関わる(たとえば、入力信号を、ビットストリームから該入力信号が得られうる周波数領域フォーマットから時間領域に変換するときに重なり合う変換窓を使う結果として)。ダウンミックス段は、好ましくは、入力信号の離散的符号化への/からの遷移直後の時間フレームの少なくとも初期部分の間、アクティブであってもよい。これは、ダウンミックス信号を、入力信号におけるクロスフェードの間、利用可能にする。それにより、空間的合成段は、入力信号におけるクロスフェードに関する時間フレームの部分について、オーディオ信号のnチャネル表現を出力しうる。入力信号の現在の方式(たとえばパラメトリック符号化または離散的符号化)についての情報が、入力信号と一緒に受領されてもよい。たとえば、入力信号が含まれるビットストリーム中のある位置にあるビットである。たとえば、パラメトリック符号化の間、空間的パラメータについての情報がビットストリームのある種の位置に見出されてもよく、一方、離散的符号化の間は、これらの位置/ビットは使用されない。そのようなビットの期待される位置での存在をチェックすることにより、デコード・システムは入力信号の現在の符号化方式を判定しうる。
rP D または D rP
すなわち、離散的符号化された時間フレームの(直)後または(直)前には縮小パラメトリック符号化された時間フレームがこない。換言すれば、離散的符号化された時間フレームの次には離散的符号化された時間フレームまたはパラメトリック符号化された時間フレームのどちらかがきて、離散的符号化された時間フレームの前には離散的符号化された時間フレームまたはパラメトリック符号化された時間フレームのどちらかがくる。代替的または追加的に、相続く(連続する)時間フレームの次のシーケンス:
P rP P および P rP … rP P
が、符号化効率の理由により、それぞれ:
P P P および P P … P P
より好まれる。換言すれば、パラメトリック符号化された時間フレームの直後の各時間フレームは、好ましくは、縮小パラメトリック符号化されるまたは離散的符号化されうる。これに対する例外は、非常に短いエピソードが受け容れられる実装でありうる。そのような状況では、二つの相続くパラメトリック符号化された時間フレームが起こりうるような、縮小パラメトリック符号化方式にはいる十分な時間が常にあるとは限らない。
ここで、離散的符号化(D)とパラメトリック(P)符号化は常に縮小パラメトリック符号化(rP)によって分離されている。上記のように、上記の例示的実施形態の少なくともいくつかのもののエンコード・システムは、相続くフレーム(の符号化方式の)他の組み合わせを受領するよう適応されてもよいことを注意しておく。
図1は、本発明の例示的実施形態に基づくデコード・システム100をブロック図の形で示している。オーディオ・デコーダ110はビットストリームPを受領し、それから、一つまたは複数の処理段階において、丸囲みの文字Aによって表わされる、nチャネル・オーディオ信号を表わす入力信号を生成する。一例として、ドルビー・デジタル・プラス・フォーマット(または向上AC-3)を、それに適応したオーディオ・デコーダ110とともに使ってもよい。オーディオ・デコーダ110の内部動作についてはのちにより詳細に述べる。入力信号Aは、オーディオ信号の時間セグメントに対応する時間フレームにセグメント分割される。好ましくは、相続く時間フレームは連続しており、重なり合わない。入力信号Aは、所与の時間フレームにおいて、オーディオ信号を、(b)パラメトリック符号化によってまたは(a)n個の離散的にエンコードされたチャネルWとして、表現する。パラメトリック符号化データは、オーディオ信号をダウンミックスすることによって得られるダウンミックス信号Xに対応するmチャネル・コア信号を含む。入力信号Aにおいて受領されるパラメトリック符号化データは、まとめてαによって表わされる、ダウンミックス信号Xに関連付けられている一つまたは複数の混合パラメータをも含んでいてもよい。あるいはまた、ダウンミックス信号Xに関連付けられた前記少なくとも一つの混合パラメータαは、同じビットストリームP内の前記入力信号とは別個の信号を通じてまたは異なるビットストリームを通じて受領されてもよい。入力信号の現在の符号化方式(すなわち、パラメトリック符号化または離散的符号化)についての情報は、ビットストリームPにおいて、あるいは別個の信号として受領されてもよい。図1に示されるデコード・システムでは、オーディオ信号は六つのチャネルをもち、コア信号は二つのチャネルをもつ。すなわち、m=2、n=6である。本開示のいくつかの節では、いくつかの接続線がマルチチャネル信号を伝送するよう適応されていることを明示的に示すために、これらの線は、それぞれのチャネル数の隣に横断線を与えられている。入力信号Aは、離散的符号化方式においては、チャネルL(左)、R(右)およびC(中央)、Lfe(低域効果)、Ls(左サラウンド)、Rs(右サラウンド)をもつ5.1サラウンドとしてのオーディオ信号の表現であってもよい。しかしながら、パラメトリック符号化方式では、LおよびRチャネルは2.0ステレオにおいてコア信号チャネルL0(コア左)およびR0(コア右)を伝送するために使われる。
コントローラ170の状態は、相変わらず、現在および直前の時間フレームにおける符号化方式の組み合わせによって一意的に決定される。この新しい符号化方式の存在は、表2に比べ、FSMプログラミング表のサイズを増大させる。
D D D rP rP … rP D D D
の型の時間フレーム・シーケンスを扱うことができるようになる。
上記の記述を研究したあとでは、当業者には本発明のさらなる実施形態が明白となるであろう。本稿および図面が実施形態および例を開示しているとはいえ、本発明はそうした個別的な例に制約されるものではない。付属の請求項によって定義される本発明の範囲から外れることなく数多くの修正および変形をなすことができる。請求項に現われる参照符号があったとしても、その範囲を限定するものと理解されるものではない。
いくつかの態様を記載しておく。
〔態様1〕
nチャネル・オーディオ信号を再構成するデコード・システムであって、当該デコード・システムは、所与の時間フレームにおいて、時間フレームにセグメント分割されており前記オーディオ信号を表現する入力信号を、
b)n個の別々にエンコードされるチャネルを使う離散的符号化;および
c)mチャネル・コア信号および少なくとも一つの混合パラメータを使い、n>m≧1である、縮小パラメトリック符号化
を含む群から選択される符号化方式に従ってエンコードするビットストリームを受領するよう適応されており、
当該デコード・システムは、前記n個の別々にエンコードされるチャネルに基づいてまたは空間的合成によって前記オーディオ信号を導出するよう動作可能であり、
当該デコード・システムは:
前記ビットストリームから前記入力信号の周波数領域表現を抽出し、それを前記入力信号の時間領域表現に変換するよう適応されたオーディオ・デコーダと;
ダウンミックス指定に従って、前記入力信号の前記時間領域表現に基づいてmチャネル・ダウンミックス信号を出力するよう動作可能なダウンミックス段と;
前記ダウンミックス信号および前記少なくとも一つの混合パラメータに基づいて、前記オーディオ信号のnチャネル表現を出力するよう動作可能な空間的合成段とを有しており、
前記オーディオ・デコーダはさらに、前記入力信号の前記周波数領域表現を、それを前記時間領域表現に変換する前にn−m個の中立チャネルをアペンドすることによってnチャネル・フォーマットにフォーマットし直すよう適応されており、前記オーディオ・デコーダは、離散的符号化された時間フレームの直後の各縮小パラメトリック符号化された時間フレームの少なくとも初期部分についておよび離散的符号化された時間フレームの直前の各縮小パラメトリック符号化された時間フレームの少なくとも最後の部分について前記フォーマットし直すことを実行するよう適応されている、
デコード・システム。
〔態様2〕
前記オーディオ・デコーダは、重複変換窓を使う時間から周波数への変換を実行するよう適応されており、
前記時間フレームのそれぞれが前記変換窓のうちの少なくとも一つの長さの半分と等価である、
態様1記載のデコード・システム。
〔態様3〕
前記オーディオ・デコーダは、離散的符号化された時間フレームの直後の各縮小パラメトリック符号化された時間フレームにおいて、少なくとも、前記縮小パラメトリック符号化された時間フレームの前記中立チャネルのうちの少なくとも一つからの第一の寄与および直前の離散的符号化された時間フレームからの第二の寄与を合計することによって、前記入力信号の前記時間領域表現の少なくとも一つのチャネルを決定するよう適応されている、態様1または2記載のデコード・システム。
〔態様4〕
前記オーディオ・デコーダは、パラメトリック符号化された時間フレームの直後の各離散的符号化された時間フレームにおいて、少なくとも、前記離散的符号化された時間フレームからの第一の寄与および直前の縮小パラメトリック符号化された時間フレームの前記中立チャネルのうちの少なくとも一つからの第二の寄与を合計することによって、前記入力信号の前記時間領域表現の少なくとも一つのチャネルを決定するよう適応されている、態様1ないし3のうちいずれか一項記載のデコード・システム。
〔態様5〕
前記ダウンミックス段が、離散的符号化された各エピソードにおける少なくとも最初の時間フレームにおいておよび離散的符号化された時間フレームの各エピソード後の少なくとも最初の時間フレームにおいてアクティブであるよう適応されている、態様1ないし4のうちいずれか一項記載のデコード・システム。
〔態様6〕
前記入力信号がn個の別々にエンコードされたチャネルとして前記オーディオ信号を表わす各時間フレームにおいて、前記入力信号から、同じオーディオ信号を表わすmチャネル・コア信号が前記ダウンミックス指定を使って取得可能であるようなmチャネル・コア信号の形を、前記入力信号が縮小パラメトリック符号化によって前記オーディオ信号を表わす各時間フレームにおいてもつ入力信号をエンコードするビットストリームを受領するよう適応されている、態様1ないし5のうちいずれか一項記載のデコード・システム。
〔態様7〕
前記入力信号を受領するよう適応された第一の遅延線;および
前記空間的合成段および前記第一の遅延線に通信上接続された混合器をさらに有する、態様1ないし6のうちいずれか一項記載のデコード・システムであって、
前記混合器は、当該システムのパラメトリック・モードでは、前記空間的合成段の出力またはそれから導出される信号を出力し;
当該システムの離散モードでは、前記第一の遅延線の出力を出力し;
前記入力信号において生起する縮小パラメトリック符号化と離散的符号化との間の変化に応答して、前記空間的合成段の出力と前記第一の遅延線の出力との間の混合遷移を出力するよう適応されている、
デコード・システム。
〔態様8〕
前記第一の遅延線が、前記ダウンミックス段および前記空間的合成段に付随する全通過時間に対応する遅延を受けるよう動作可能である、態様7記載のデコード・システム。
〔態様9〕
前記混合器の出力を受領するよう適応された第二の遅延線(160)をさらに有し、前記第一および第二の遅延線によって受ける全遅延が一つの時間フレームの長さの倍数に対応する、態様8記載のデコード・システム。
〔態様10〕
前記空間的合成段は、縮小パラメトリック符号化または該当するならパラメトリック符号化における前記入力信号が、当該時間フレームにおける最初でない点についての明示的な混合パラメータ値を定義しているような相続く時間フレームどうしの間の補間によって得られる混合パラメータ値を適用するよう適応されている、態様1ないし9のうちいずれか一項記載のデコード・システム。
〔態様11〕
前記空間的合成段は、現在時間フレームが、各時間フレームが縮小パラメトリック符号化されているまたは該当するならパラメトリック符号化されている時間フレームのエピソードにおける最初の時間フレームであることに応答して、最も早い明示的な混合パラメータ値を現在の時間フレームの先頭まで後ろ向きに外挿することを含む離散からパラメトリックへの遷移を開始するよう適応されている、態様10記載のデコード・システム。
〔態様12〕
前記空間的合成段は、現在時間フレームが、離散的符号化された時間フレームのエピソードにおける最初の時間フレームであることに応答して、最も遅い明示的な混合パラメータ値を少なくとも現在の時間フレームの終わりまで前向きに外挿することを含むパラメトリックから離散への遷移を開始するよう適応されている、態様10または11記載のデコード・システム。
〔態様13〕
前記空間的合成段が:
前記mチャネル・ダウンミックス信号の時間領域表現を受領してそれに基づいて前記ダウンミックス信号の周波数領域表現を出力するよう適応された第一の変換段と;
前記ダウンミックス信号の前記周波数領域表現および前記少なくとも一つの混合パラメータに基づいて、前記オーディオ信号の前記nチャネル表現の周波数領域表現を出力するよう適応されているアップミックス段と;
前記オーディオ信号の前記nチャネル表現の前記周波数領域表現を受領し、それに基づいて、前記オーディオ信号の前記nチャネル表現の時間領域表現を、前記空間的合成段の出力として出力するよう適応されている、第二の変換段とを有する、
態様1ないし12のうちいずれか一項記載のデコード・システム。
〔態様14〕
前記アップミックス段が、前記ダウンミックス信号の前記mチャネル周波数領域表現におけるチャネルを含む線形結合を形成し、これを前記オーディオ信号の前記nチャネル表現の前記周波数領域表現として出力するよう適応されており、前記少なくとも一つの混合パラメータは、前記線形結合における前記ダウンミックス信号の前記mチャネル周波数領域表現における少なくとも一つのチャネルに関係する少なくとも一つの利得を制御する、態様13記載のデコード・システム。
〔態様15〕
前記ダウンミックス段が、前記入力信号の時間領域表現のチャネルの線形結合を形成するよう適応されている、態様1ないし14のうちいずれか一項記載のデコード・システム。
〔態様16〕
前記空間的合成段および混合器があれば該混合器を、現在の時間フレームおよび直前の時間フレームの符号化方式に基づいて制御するコントローラをさらに有する、態様1ないし15のうちいずれか一項記載のデコード・システム。
〔態様17〕
前記コントローラが、前記空間的合成段および混合器があれば該混合器を、現在の時間フレームおよび二つの直前の時間フレームの符号化方式に基づいて制御する、態様16記載のデコード・システム。
〔態様18〕
前記入力信号が縮小パラメトリック符号化によって前記オーディオ信号を表わし、直前に縮小パラメトリック符号化された時間フレームまたは該当するならパラメトリック符号化された時間フレームがある各時間フレームにおいて、前記入力信号および前記少なくとも一つの混合パラメータに基づいて前記オーディオ信号の前記nチャネル表現を出力するよう動作可能である、態様1ないし17のうちいずれか一項記載のデコード・システム。
〔態様19〕
符号化方式の前記群がさらに、
a)パラメトリック符号化
を含み、当該デコード・システムは、前記入力信号がn個の別々にエンコードされたチャネルとして前記オーディオ信号を表わす各時間フレームにおいて、前記入力信号から、同じオーディオ信号を表わすmチャネル・コア信号が前記ダウンミックス指定を使って取得可能であるようなものであるmチャネル・コア信号を、前記入力信号がパラメトリック符号化によって前記オーディオ信号を表わす各時間フレームにおいて含む入力信号をエンコードするビットストリームを受領するよう適応されている、態様1ないし18のうちいずれか一項記載のデコード・システム。
〔態様20〕
前記ダウンミックス段が、前記入力信号がパラメトリック符号化によって前記オーディオ信号を表わし、前に縮小パラメトリック符号化された時間フレームまたはパラメトリック符号化された時間フレームがある各時間フレームにおいて、前記オーディオ信号の前記パラメトリック表現の前記コア信号を前記ダウンミックス信号として再生することによって、前記ダウンミックス信号を生成するよう適応されている、態様19記載のデコード・システム。
〔態様21〕
当該デコード・システムが、前記入力信号がパラメトリック符号化によって前記オーディオ信号を表わす各時間フレームにおいてnチャネル信号である入力信号をエンコードするビットストリームを受領するよう適応されており、前記nチャネル信号においてn−m個のチャネルは前記オーディオ信号を表現するために使われない、態様19または20記載のデコード・システム。
〔態様22〕
nチャネル・オーディオ信号を再構成する方法であって、当該方法は、所与の時間フレームにおいて、時間フレームにセグメント分割されており前記オーディオ信号を表現する入力信号を、
b)n個の別々にエンコードされるチャネルを使う離散的符号化:および
c)mチャネル・コア信号および少なくとも一つの混合パラメータを使い、n>m≧1である、縮小パラメトリック符号化を含む群から選択される符号化方式に従ってエンコードするビットストリームを受領する段階と;
前記ビットストリームから前記入力信号の周波数領域表現を抽出する段階と;
前記入力信号が現在の時間フレームにおいて縮小パラメトリック符号化されており直前の時間フレームにおいて離散的符号化されていることに応答して、前記入力信号の前記周波数領域表現の現在の時間フレームの少なくとも初期部分を、前記mチャネル・コア信号にn−m個の中立チャネルをアペンドすることによってnチャネル・フォーマットにフォーマットし直す段階と;
前記入力信号が現在の時間フレームにおいて縮小パラメトリック符号化されており直後の時間フレームにおいて離散的符号化されていることに応答して、前記入力信号の前記周波数領域表現の現在の時間フレームの少なくとも最後の部分を、前記mチャネル・コア信号にn−m個の中立チャネルをアペンドすることによってnチャネル・フォーマットにフォーマットし直す段階と;
前記入力信号の前記周波数領域表現を前記入力信号の時間領域表現に変換する段階と;
前記入力信号が現在および二つの直前の時間フレームにおいて離散的符号化されていることに応答して、前記n個の別々にエンコードされるチャネルに基づいて前記オーディオ信号を導出する段階と;
前記入力信号が現在および二つの直前の時間フレームにおいてパラメトリック符号化されていることに応答して、前記コア信号および前記少なくとも一つの混合パラメータに基づいて、前記オーディオ信号のnチャネル表現を生成する段階とを含む、
方法。
〔態様23〕
前記入力信号が現在および前の時間フレームにおいて離散的符号化されていることに応答して、前記n個の別々にエンコードされるチャネルに基づいて前記オーディオ信号を導出する段階と;
前記入力信号が現在および直前の時間フレームにおいて縮小パラメトリック符号化されていることに応答して、前記コア信号および前記少なくとも一つの混合パラメータに基づいて、前記オーディオ信号のnチャネル表現を生成する段階とを含む、
態様22記載の方法。
〔態様24〕
現在の時間フレームが、離散的符号化された時間フレームのエピソードにおける最初の時間フレームであることまたは現在の時間フレームが、離散的符号化された時間フレームのエピソード後の最初の時間フレームであることに応答して、ダウンミックス指定に従って、前記入力信号に基づいてmチャネル・ダウンミックス信号を生成する段階をさらに含む、
態様22または23記載の方法。
〔態様25〕
縮小パラメトリック符号化によって前記オーディオ信号を表わす前記入力信号の各時間フレームが、その与えられた時間フレームにおける最初でない点について前記少なくとも一つの混合パラメータの値を含み、当該方法がさらに、
前記入力信号が現在の時間フレームにおいて離散的符号化されており、前の時間フレームにおいて縮小パラメトリック符号化されていることに応答して、前記ダウンミックス信号に基づきかつ前記少なくとも一つの混合パラメータの、前記前の時間フレームに関連付けられている少なくとも一つの値に基づき、前記オーディオ信号のnチャネル表現を生成し、現在の時間フレームの間に、前記n個の別々にエンコードされるチャネルに基づいて前記オーディオ信号を導出することに遷移する段階をさらに含む、態様24記載の方法。
〔態様26〕
縮小パラメトリック符号化によって前記オーディオ信号を表わす前記入力信号の各時間フレームが、その与えられた時間フレームにおける最初でない点について前記少なくとも一つの混合パラメータの値を含み、当該方法が、
現在時間フレームが、縮小パラメトリック符号化された時間フレームのエピソードにおける最初の時間フレームであることに応答して、前記少なくとも一つの混合パラメータの受領された値を現在の時間フレームの先頭まで後ろ向きに外挿する段階をさらに含む、
態様22ないし25のうちいずれか一項記載の方法。
〔態様27〕
時間フレームにセグメント分割されたnチャネル・オーディオ信号をエンコードするエンコード・システムであって、当該エンコード・システムは、
b)n個の別々にエンコードされるチャネルを使う離散的符号化;および
c)縮小パラメトリック符号化
を含む群から選択される符号化方式に従って、所与の時間フレームにおいて、前記オーディオ信号を表わすビットストリーム(P)を出力するよう適応されており、
当該エンコード・システムは:
所与の時間フレームについて、どのエンコード方式が前記オーディオ信号を表わすために使用されるかを選択するよう適応された選択器と;
前記オーディオ信号のnチャネル表現に基づき、ダウンミックス指定に従って、mチャネル・コア信号および少なくとも一つの混合パラメータを出力するよう動作可能なパラメトリック分解段とを有しており、前記mチャネル・コア信号および少なくとも一つの混合パラメータは、縮小パラメトリック符号化方式における前記出力ビットストリームによってエンコードされ、n>m≧1である、
エンコード・システム。
〔態様28〕
符号化方式の前記群がさらに、
a)パラメトリック符号化
を含み、前記パラメトリック符号化方式および前記離散的符号化方式においてはnチャネル信号フォーマットが使われ、前記縮小パラメトリック符号化方式においてはmチャネル信号フォーマットが使われる、
態様27記載のエンコード・システム。
〔態様29〕
態様27または28記載のエンコード・システムおよび態様1ないし21のうちいずれか一項記載のデコード・システムを有するオーディオ配信システムであって、前記エンコード・システムおよび前記デコード・システムは通信上接続されており、前記エンコード・システムおよび前記デコード・システムのそれぞれのダウンミックス指定は等価である、オーディオ配信システム。
〔態様30〕
nチャネル・オーディオ信号をビットストリームとしてエンコードする方法であって:
前記オーディオ信号のnチャネル表現を受領する段階と;
b)n個の別々にエンコードされるチャネルを使う離散的符号化;および
c)縮小パラメトリック符号化
を含む群から、所与の時間フレームにおいて、前記オーディオ信号を表現するために使われる符号化方式を選択する段階と;
縮小パラメトリック符号化によって前記オーディオ信号をエンコードするとの選択に応答して、前記オーディオ信号の前記nチャネル表現に基づき、ダウンミックス指定に従って、mチャネル・コア信号および少なくとも一つの混合パラメータをエンコードするビットストリームを形成する段階であって、n>m≧1である、段階と;
離散的符号化によって前記オーディオ信号をエンコードするとの選択に応答して、n個の別々にエンコードされる信号によって前記オーディオ信号をエンコードするビットストリームを出力する段階とを含む、
方法。
〔態様31〕
態様22ないし26および30のうちいずれか一項記載の方法を実行するための命令をもつコンピュータ可読媒体を有するコンピュータ・プログラム・プロダクト。
〔態様32〕
n=6かつm=2である、態様1ないし31のうちいずれか一項記載の装置または方法。
Claims (32)
- nチャネルのオーディオ信号を再構成するデコード・システムであって、当該デコード・システムは、所与の時間フレームにおいて、時間フレームにセグメント分割されており前記オーディオ信号を表現する入力信号を、
b)n個の別々にエンコードされるチャネルを使う離散的符号化;および
c)mチャネル・コア信号および少なくとも一つの混合パラメータを使い、n>m≧1である、縮小パラメトリック符号化
を含む群から選択される符号化方式に従ってエンコードするビットストリームを受領するよう適応されており、
当該デコード・システムは、前記n個の別々にエンコードされるチャネルに基づいてまたは空間的合成によって前記オーディオ信号を導出するよう動作可能であり、
当該デコード・システムは:
前記ビットストリームから前記入力信号の周波数領域表現を抽出し、それを前記入力信号の時間領域表現に変換するよう適応されたオーディオ・デコーダと;
ダウンミックス指定に従って、前記入力信号の前記時間領域表現に基づいてmチャネルのダウンミックス信号を出力するよう動作可能なダウンミックス段と;
前記ダウンミックス信号および前記少なくとも一つの混合パラメータに基づいて、前記オーディオ信号のnチャネル表現を出力するよう動作可能な空間的合成段とを有しており、
前記オーディオ・デコーダはさらに、前記入力信号の前記周波数領域表現を、それを前記時間領域表現に変換する前にn−m個の中立チャネルをアペンドすることによってnチャネル・フォーマットにフォーマットし直すよう適応されており、前記オーディオ・デコーダは、離散的符号化された時間フレームの直後の各縮小パラメトリック符号化された時間フレームの少なくとも初期部分についておよび離散的符号化された時間フレームの直前の各縮小パラメトリック符号化された時間フレームの少なくとも最後の部分について前記フォーマットし直すことを実行するよう適応されている、
デコード・システム。 - 前記オーディオ・デコーダは、重複変換窓を使う時間から周波数への変換を実行するよう適応されており、
前記時間フレームのそれぞれが前記重複変換窓のうちの少なくとも一つの長さの半分と等価である、
請求項1記載のデコード・システム。 - 前記オーディオ・デコーダは、離散的符号化された時間フレームの直後の各縮小パラメトリック符号化された時間フレームにおいて、少なくとも、前記縮小パラメトリック符号化された時間フレームの前記中立チャネルのうちの少なくとも一つからの第一の寄与および直前の離散的符号化された時間フレームからの第二の寄与を合計することによって、前記入力信号の前記時間領域表現の少なくとも一つのチャネルを決定するよう適応されている、請求項1または2記載のデコード・システム。
- 前記オーディオ・デコーダは、パラメトリック符号化された時間フレームの直後の各離散的符号化された時間フレームにおいて、少なくとも、前記離散的符号化された時間フレームからの第一の寄与および直前の縮小パラメトリック符号化された時間フレームの前記中立チャネルのうちの少なくとも一つからの第二の寄与を合計することによって、前記入力信号の前記時間領域表現の少なくとも一つのチャネルを決定するよう適応されている、請求項1ないし3のうちいずれか一項記載のデコード・システム。
- 前記ダウンミックス段が、離散的符号化された各エピソードにおける少なくとも最初の時間フレームにおいておよび離散的符号化された時間フレームの各エピソード後の少なくとも最初の時間フレームにおいてアクティブであるよう適応されている、請求項1ないし4のうちいずれか一項記載のデコード・システム。
- 前記入力信号がn個の別々にエンコードされたチャネルとして前記オーディオ信号を表わす各時間フレームにおいて、前記入力信号から、同じオーディオ信号を表わすmチャネル・コア信号が前記ダウンミックス指定を使って取得可能であるようなmチャネル・コア信号の形を、前記入力信号が縮小パラメトリック符号化によって前記オーディオ信号を表わす各時間フレームにおいてもつ入力信号をエンコードするビットストリームを受領するよう適応されている、請求項1ないし5のうちいずれか一項記載のデコード・システム。
- 前記入力信号を受領するよう適応された第一の遅延線;および
前記空間的合成段および前記第一の遅延線に通信上接続された混合器をさらに有する、請求項1ないし6のうちいずれか一項記載のデコード・システムであって、
前記混合器は、当該システムのパラメトリック・モードでは、前記空間的合成段の出力またはそれから導出される信号を出力し;
当該システムの離散モードでは、前記第一の遅延線の出力を出力し;
前記入力信号において生起する縮小パラメトリック符号化と離散的符号化との間の変化に応答して、前記空間的合成段の出力と前記第一の遅延線の出力との間の混合遷移を出力するよう適応されている、
デコード・システム。 - 前記第一の遅延線が、前記ダウンミックス段および前記空間的合成段に付随する全通過時間に対応する遅延を受けるよう動作可能である、請求項7記載のデコード・システム。
- 前記混合器の出力を受領するよう適応された第二の遅延線(160)をさらに有し、前記第一および第二の遅延線によって受ける全遅延が一つの時間フレームの長さの倍数に対応する、請求項8記載のデコード・システム。
- 前記空間的合成段は、縮小パラメトリック符号化または該当するならパラメトリック符号化における前記入力信号が、当該時間フレームにおける最初でない点についての明示的な混合パラメータ値を定義しているような相続く時間フレームどうしの間の補間によって得られる混合パラメータ値を適用するよう適応されている、請求項1ないし9のうちいずれか一項記載のデコード・システム。
- 前記空間的合成段は、現在時間フレームが、各時間フレームが縮小パラメトリック符号化されているまたは該当するならパラメトリック符号化されている時間フレームのエピソードにおける最初の時間フレームであることに応答して、最も早い明示的な混合パラメータ値を現在の時間フレームの先頭まで後ろ向きに外挿することを含む離散からパラメトリックへの遷移を開始するよう適応されている、請求項10記載のデコード・システム。
- 前記空間的合成段は、現在時間フレームが、離散的符号化された時間フレームのエピソードにおける最初の時間フレームであることに応答して、最も遅い明示的な混合パラメータ値を少なくとも現在の時間フレームの終わりまで前向きに外挿することを含むパラメトリックから離散への遷移を開始するよう適応されている、請求項10または11記載のデコード・システム。
- 前記空間的合成段が:
前記mチャネルのダウンミックス信号の時間領域表現を受領してそれに基づいて前記ダウンミックス信号の周波数領域表現を出力するよう適応された第一の変換段と;
前記ダウンミックス信号の前記周波数領域表現および前記少なくとも一つの混合パラメータに基づいて、前記オーディオ信号の前記nチャネル表現の周波数領域表現を出力するよう適応されているアップミックス段と;
前記オーディオ信号の前記nチャネル表現の前記周波数領域表現を受領し、それに基づいて、前記オーディオ信号の前記nチャネル表現の時間領域表現を、前記空間的合成段の出力として出力するよう適応されている、第二の変換段とを有する、
請求項1ないし12のうちいずれか一項記載のデコード・システム。 - 前記アップミックス段が、前記mチャネルのダウンミックス信号の前記周波数領域表現におけるチャネルを含む線形結合を形成し、これを前記オーディオ信号の前記nチャネル表現の前記周波数領域表現として出力するよう適応されており、前記少なくとも一つの混合パラメータは、前記線形結合における前記mチャネルのダウンミックス信号の前記周波数領域表現における少なくとも一つのチャネルに関係する少なくとも一つの利得を制御する、請求項13記載のデコード・システム。
- 前記ダウンミックス段が、前記入力信号の時間領域表現のチャネルの線形結合を形成するよう適応されている、請求項1ないし14のうちいずれか一項記載のデコード・システム。
- 前記空間的合成段および混合器があれば該混合器を、現在の時間フレームおよび直前の時間フレームの符号化方式に基づいて制御するコントローラをさらに有する、請求項1ないし15のうちいずれか一項記載のデコード・システム。
- 前記コントローラが、前記空間的合成段および混合器があれば該混合器を、現在の時間フレームおよび二つの直前の時間フレームの符号化方式に基づいて制御する、請求項16記載のデコード・システム。
- 前記空間的合成段が、前記入力信号が縮小パラメトリック符号化によって前記オーディオ信号を表わし、直前に縮小パラメトリック符号化された時間フレームまたは該当するならパラメトリック符号化された時間フレームがある各時間フレームにおいて、前記入力信号および前記少なくとも一つの混合パラメータに基づいて前記オーディオ信号の前記nチャネル表現を出力するよう動作可能である、請求項1ないし17のうちいずれか一項記載のデコード・システム。
- 符号化方式の前記群がさらに、
a)パラメトリック符号化
を含み、当該デコード・システムは、前記入力信号がn個の別々にエンコードされたチャネルとして前記オーディオ信号を表わす各時間フレームにおいて、前記入力信号から、同じオーディオ信号を表わすmチャネル・コア信号が前記ダウンミックス指定を使って取得可能であるようなものであるmチャネル・コア信号を、前記入力信号がパラメトリック符号化によって前記オーディオ信号を表わす各時間フレームにおいて含む入力信号をエンコードするビットストリームを受領するよう適応されている、請求項1ないし18のうちいずれか一項記載のデコード・システム。 - 前記ダウンミックス段が、前記入力信号がパラメトリック符号化によって前記オーディオ信号を表わし、前に縮小パラメトリック符号化された時間フレームまたはパラメトリック符号化された時間フレームがある各時間フレームにおいて、前記入力信号がパラメトリック符号化によって前記オーディオ信号を表わす各時間フレームの前記mチャネル・コア信号を前記ダウンミックス信号として再生することによって、前記ダウンミックス信号を生成するよう適応されている、請求項19記載のデコード・システム。
- 当該デコード・システムが、前記入力信号がパラメトリック符号化によって前記オーディオ信号を表わす各時間フレームにおいてnチャネル信号である入力信号をエンコードするビットストリームを受領するよう適応されており、前記nチャネル信号においてn−m個のチャネルは前記オーディオ信号を表現するために使われない、請求項19または20記載のデコード・システム。
- nチャネルのオーディオ信号を再構成する方法であって、当該方法は、所与の時間フレームにおいて、時間フレームにセグメント分割されており前記オーディオ信号を表現する入力信号を、
b)n個の別々にエンコードされるチャネルを使う離散的符号化:および
c)mチャネル・コア信号および少なくとも一つの混合パラメータを使い、n>m≧1である、縮小パラメトリック符号化を含む群から選択される符号化方式に従ってエンコードするビットストリームを受領する段階と;
前記ビットストリームから前記入力信号の周波数領域表現を抽出する段階と;
前記入力信号が現在の時間フレームにおいて縮小パラメトリック符号化されており直前の時間フレームにおいて離散的符号化されていることに応答して、前記入力信号の前記周波数領域表現の現在の時間フレームの少なくとも初期部分を、前記mチャネル・コア信号にn−m個の中立チャネルをアペンドすることによってnチャネル・フォーマットにフォーマットし直す段階と;
前記入力信号が現在の時間フレームにおいて縮小パラメトリック符号化されており直後の時間フレームにおいて離散的符号化されていることに応答して、前記入力信号の前記周波数領域表現の現在の時間フレームの少なくとも最後の部分を、前記mチャネル・コア信号にn−m個の中立チャネルをアペンドすることによってnチャネル・フォーマットにフォーマットし直す段階と;
前記入力信号の前記周波数領域表現を前記入力信号の時間領域表現に変換する段階と;
前記入力信号が現在および二つの直前の時間フレームにおいて離散的符号化されていることに応答して、前記n個の別々にエンコードされるチャネルに基づいて前記オーディオ信号を導出する段階と;
前記入力信号が現在および二つの直前の時間フレームにおいてパラメトリック符号化されていることに応答して、前記mチャネル・コア信号および前記少なくとも一つの混合パラメータに基づいて、前記オーディオ信号のnチャネル表現を生成する段階とを含む、
方法。 - 前記入力信号が現在および前の時間フレームにおいて離散的符号化されていることに応答して、前記n個の別々にエンコードされるチャネルに基づいて前記オーディオ信号を導出する段階と;
前記入力信号が現在および直前の時間フレームにおいて縮小パラメトリック符号化されていることに応答して、前記コア信号および前記少なくとも一つの混合パラメータに基づいて、前記オーディオ信号のnチャネル表現を生成する段階とを含む、
請求項22記載の方法。 - 現在の時間フレームが、離散的符号化された時間フレームのエピソードにおける最初の時間フレームであることまたは現在の時間フレームが、離散的符号化された時間フレームのエピソード後の最初の時間フレームであることに応答して、ダウンミックス指定に従って、前記入力信号に基づいてmチャネルのダウンミックス信号を生成する段階をさらに含む、
請求項22または23記載の方法。 - 縮小パラメトリック符号化によって前記オーディオ信号を表わす前記入力信号の各時間フレームが、その与えられた時間フレームにおける最初でない点について前記少なくとも一つの混合パラメータの値を含み、当該方法がさらに、
前記入力信号が現在の時間フレームにおいて離散的符号化されており、前の時間フレームにおいて縮小パラメトリック符号化されていることに応答して、前記ダウンミックス信号に基づきかつ前記少なくとも一つの混合パラメータの、前記前の時間フレームに関連付けられている少なくとも一つの値に基づき、前記オーディオ信号のnチャネル表現を生成し、現在の時間フレームの間に、前記n個の別々にエンコードされるチャネルに基づいて前記オーディオ信号を導出することに遷移する段階をさらに含む、請求項24記載の方法。 - 縮小パラメトリック符号化によって前記オーディオ信号を表わす前記入力信号の各時間フレームが、その与えられた時間フレームにおける最初でない点について前記少なくとも一つの混合パラメータの値を含み、当該方法が、
現在時間フレームが、縮小パラメトリック符号化された時間フレームのエピソードにおける最初の時間フレームであることに応答して、前記少なくとも一つの混合パラメータの受領された値を現在の時間フレームの先頭まで後ろ向きに外挿する段階をさらに含む、
請求項22ないし25のうちいずれか一項記載の方法。 - 時間フレームにセグメント分割されたnチャネルのオーディオ信号をエンコードするエンコード・システムであって、当該エンコード・システムは、
a)パラメトリック符号化;
b)n個の別々にエンコードされるチャネルを使う離散的符号化;および
c)縮小パラメトリック符号化
を含む群から選択される符号化方式に従って、所与の時間フレームにおいて、前記オーディオ信号を表わすビットストリーム(P)を出力するよう適応されており、前記パラメトリック符号化および前記離散的符号化においてはnチャネル信号フォーマットが使われ、前記縮小パラメトリック符号化においてはmチャネル信号フォーマットが使われ、
当該エンコード・システムは:
所与の時間フレームについて、どのエンコード方式が前記オーディオ信号を表わすために使用されるかを選択するよう適応された選択器と;
前記オーディオ信号のnチャネル表現に基づき、ダウンミックス指定に従って、縮小パラメトリック符号化方式の場合に前記ビットストリーム中にエンコードされるmチャネル・コア信号および少なくとも一つの混合パラメータを出力するよう動作可能なダウンミックス段とを有しており、n>m≧1である、
エンコード・システム。 - 請求項27記載のエンコード・システムおよび請求項1ないし21のうちいずれか一項記載のデコード・システムを有するオーディオ配信システムであって、前記エンコード・システムおよび前記デコード・システムは通信上接続されており、前記エンコード・システムおよび前記デコード・システムのそれぞれのダウンミックス指定は等価である、オーディオ配信システム。
- nチャネルのオーディオ信号をビットストリームとしてエンコードする方法であって:
前記オーディオ信号のnチャネル表現を受領する段階と;
a)パラメトリック符号化;
b)n個の別々にエンコードされるチャネルを使う離散的符号化;および
c)縮小パラメトリック符号化
を含む群から、所与の時間フレームにおいて、前記オーディオ信号を表現するために使われる符号化方式を選択する段階であって、前記パラメトリック符号化および前記離散的符号化においてはnチャネル信号フォーマットが使われ、前記縮小パラメトリック符号化においてはmチャネル信号フォーマットが使われる、段階と;
縮小パラメトリック符号化によって前記オーディオ信号をエンコードするとの選択に応答して、前記オーディオ信号の前記nチャネル表現に基づき、ダウンミックス指定に従って、mチャネル・コア信号および少なくとも一つの混合パラメータをエンコードするビットストリームを形成する段階であって、n>m≧1である、段階と;
離散的符号化によって前記オーディオ信号をエンコードするとの選択に応答して、n個の別々にエンコードされる信号によって前記オーディオ信号をエンコードするビットストリームを出力する段階とを含む、
方法。 - コンピュータに請求項22ないし26のうちいずれか一項記載の方法を実行させるためのコンピュータ・プログラム。
- コンピュータに請求項29記載の方法を実行させるためのコンピュータ・プログラム。
- n=6かつm=2である、請求項1ないし21のうちいずれか一項記載のデコード・システム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261659602P | 2012-06-14 | 2012-06-14 | |
US61/659,602 | 2012-06-14 | ||
US201261713025P | 2012-10-12 | 2012-10-12 | |
US61/713,025 | 2012-10-12 | ||
PCT/EP2013/062340 WO2013186344A2 (en) | 2012-06-14 | 2013-06-14 | Smooth configuration switching for multichannel audio rendering based on a variable number of received channels |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015525375A JP2015525375A (ja) | 2015-09-03 |
JP6163545B2 true JP6163545B2 (ja) | 2017-07-12 |
Family
ID=48626053
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015516626A Active JP6163545B2 (ja) | 2012-06-14 | 2013-06-14 | 可変数の受信チャネルに基づくマルチチャネル・オーディオ・レンダリングのためのなめらかな構成切り換え |
JP2015516625A Active JP6133413B2 (ja) | 2012-06-14 | 2013-06-14 | マルチチャネル・オーディオのためのなめらかな構成切り換え |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015516625A Active JP6133413B2 (ja) | 2012-06-14 | 2013-06-14 | マルチチャネル・オーディオのためのなめらかな構成切り換え |
Country Status (5)
Country | Link |
---|---|
US (2) | US9601122B2 (ja) |
EP (2) | EP2862165B1 (ja) |
JP (2) | JP6163545B2 (ja) |
CN (2) | CN104364843B (ja) |
WO (2) | WO2013186344A2 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5581449B2 (ja) * | 2010-08-24 | 2014-08-27 | ドルビー・インターナショナル・アーベー | Fmステレオ無線受信機の断続的モノラル受信の隠蔽 |
JP6224850B2 (ja) | 2014-02-28 | 2017-11-01 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 会議における変化盲を使った知覚的連続性 |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980794A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
CN109219847B (zh) * | 2016-06-01 | 2023-07-25 | 杜比国际公司 | 将多声道音频内容转换成基于对象的音频内容的方法及用于处理具有空间位置的音频内容的方法 |
CN107731238B (zh) * | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
US10210874B2 (en) * | 2017-02-03 | 2019-02-19 | Qualcomm Incorporated | Multi channel coding |
CN106919108B (zh) * | 2017-03-23 | 2019-02-01 | 南京富岛信息工程有限公司 | 一种红外热轴音频通道信号测量方法 |
CN111210837B (zh) * | 2018-11-02 | 2022-12-06 | 北京微播视界科技有限公司 | 音频处理方法和装置 |
EP3719799A1 (en) * | 2019-04-04 | 2020-10-07 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | A multi-channel audio encoder, decoder, methods and computer program for switching between a parametric multi-channel operation and an individual channel operation |
WO2020216459A1 (en) * | 2019-04-23 | 2020-10-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for generating an output downmix representation |
CN113539286B (zh) * | 2020-06-09 | 2024-06-04 | 深圳声临奇境人工智能有限公司 | 音频装置、音频系统和音频处理方法 |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG54379A1 (en) * | 1996-10-24 | 1998-11-16 | Sgs Thomson Microelectronics A | Audio decoder with an adaptive frequency domain downmixer |
SE523112C2 (sv) | 2001-07-05 | 2004-03-30 | Anoto Ab | Förfaringssätt för kommunikation mellan en användarenhet som har möjlighet att läsa information från en yta, och servrar som exekverar tjänster som stöder användarenheten |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
ES2255678T3 (es) | 2002-02-18 | 2006-07-01 | Koninklijke Philips Electronics N.V. | Codificacion de audio parametrica. |
EP1394772A1 (en) | 2002-08-28 | 2004-03-03 | Deutsche Thomson-Brandt Gmbh | Signaling of window switchings in a MPEG layer 3 audio data stream |
EP1427252A1 (en) | 2002-12-02 | 2004-06-09 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for processing audio signals from a bitstream |
RU2374703C2 (ru) * | 2003-10-30 | 2009-11-27 | Конинклейке Филипс Электроникс Н.В. | Кодирование или декодирование аудиосигнала |
JP2007515672A (ja) | 2003-12-04 | 2007-06-14 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号符号化 |
EP1769491B1 (en) | 2004-07-14 | 2009-09-30 | Koninklijke Philips Electronics N.V. | Audio channel conversion |
SE0402650D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
WO2006126843A2 (en) * | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding audio signal |
FR2888699A1 (fr) * | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
ATE455348T1 (de) * | 2005-08-30 | 2010-01-15 | Lg Electronics Inc | Vorrichtung und verfahren zur dekodierung eines audiosignals |
JP4568363B2 (ja) * | 2005-08-30 | 2010-10-27 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号デコーディング方法及びその装置 |
CN101263742B (zh) | 2005-09-13 | 2014-12-17 | 皇家飞利浦电子股份有限公司 | 音频编码 |
US7653533B2 (en) | 2005-10-24 | 2010-01-26 | Lg Electronics Inc. | Removing time delays in signal paths |
CN101479785B (zh) * | 2006-09-29 | 2013-08-07 | Lg电子株式会社 | 用于编码和解码基于对象的音频信号的方法和装置 |
US8553891B2 (en) | 2007-02-06 | 2013-10-08 | Koninklijke Philips N.V. | Low complexity parametric stereo decoder |
WO2009066959A1 (en) * | 2007-11-21 | 2009-05-28 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
KR101629862B1 (ko) | 2008-05-23 | 2016-06-24 | 코닌클리케 필립스 엔.브이. | 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더 |
MY152252A (en) | 2008-07-11 | 2014-09-15 | Fraunhofer Ges Forschung | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
PL2311034T3 (pl) | 2008-07-11 | 2016-04-29 | Fraunhofer Ges Forschung | Koder i dekoder audio do kodowania ramek próbkowanego sygnału audio |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
PT2146344T (pt) * | 2008-07-17 | 2016-10-13 | Fraunhofer Ges Forschung | Esquema de codificação/descodificação de áudio com uma derivação comutável |
ATE557387T1 (de) * | 2008-07-30 | 2012-05-15 | France Telecom | Rekonstruktion von mehrkanal-audiodaten |
WO2010097748A1 (en) | 2009-02-27 | 2010-09-02 | Koninklijke Philips Electronics N.V. | Parametric stereo encoding and decoding |
BRPI1009467B1 (pt) * | 2009-03-17 | 2020-08-18 | Dolby International Ab | Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo |
ES2524428T3 (es) | 2009-06-24 | 2014-12-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decodificador de señales de audio, procedimiento para decodificar una señal de audio y programa de computación que utiliza etapas en cascada de procesamiento de objetos de audio |
TWI433137B (zh) | 2009-09-10 | 2014-04-01 | Dolby Int Ab | 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法 |
PL3779977T3 (pl) | 2010-04-13 | 2023-11-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder audio do przetwarzania audio stereo z wykorzystaniem zmiennego kierunku predykcji |
BR122021003688B1 (pt) | 2010-08-12 | 2021-08-24 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. | Reamostrar sinais de saída de codecs de áudio com base em qmf |
JP5650227B2 (ja) | 2010-08-23 | 2015-01-07 | パナソニック株式会社 | 音声信号処理装置及び音声信号処理方法 |
-
2013
- 2013-06-14 WO PCT/EP2013/062340 patent/WO2013186344A2/en active Application Filing
- 2013-06-14 US US14/406,648 patent/US9601122B2/en active Active
- 2013-06-14 US US14/406,670 patent/US9552818B2/en active Active
- 2013-06-14 JP JP2015516626A patent/JP6163545B2/ja active Active
- 2013-06-14 CN CN201380030996.4A patent/CN104364843B/zh active Active
- 2013-06-14 EP EP13728755.3A patent/EP2862165B1/en active Active
- 2013-06-14 EP EP13728754.6A patent/EP2862168B1/en active Active
- 2013-06-14 WO PCT/EP2013/062339 patent/WO2013186343A2/en active Application Filing
- 2013-06-14 CN CN201380031015.8A patent/CN104380376B/zh active Active
- 2013-06-14 JP JP2015516625A patent/JP6133413B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
WO2013186343A2 (en) | 2013-12-19 |
WO2013186344A2 (en) | 2013-12-19 |
US9552818B2 (en) | 2017-01-24 |
US20150187361A1 (en) | 2015-07-02 |
JP2015525532A (ja) | 2015-09-03 |
WO2013186343A3 (en) | 2014-02-06 |
JP2015525375A (ja) | 2015-09-03 |
CN104364843A (zh) | 2015-02-18 |
JP6133413B2 (ja) | 2017-05-24 |
CN104380376B (zh) | 2017-03-15 |
EP2862168B1 (en) | 2017-08-09 |
EP2862168A2 (en) | 2015-04-22 |
US9601122B2 (en) | 2017-03-21 |
CN104364843B (zh) | 2017-03-29 |
EP2862165A2 (en) | 2015-04-22 |
US20150154970A1 (en) | 2015-06-04 |
CN104380376A (zh) | 2015-02-25 |
EP2862165B1 (en) | 2017-03-08 |
WO2013186344A3 (en) | 2014-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6163545B2 (ja) | 可変数の受信チャネルに基づくマルチチャネル・オーディオ・レンダリングのためのなめらかな構成切り換え | |
JP6407928B2 (ja) | オーディオ処理システム | |
JP4616349B2 (ja) | ステレオ互換性のあるマルチチャネルオーディオ符号化 | |
JP7009437B2 (ja) | マルチチャネル・オーディオ信号のパラメトリック・エンコードおよびデコード | |
KR101981936B1 (ko) | 다중 채널 오디오 코딩에서의 잡음 충진 | |
AU2004298708A1 (en) | Fidelity-optimised variable frame length encoding | |
US9460723B2 (en) | Error concealment strategy in a decoding system | |
JP7420829B2 (ja) | 予測コーディングにおける低コスト誤り回復のための方法および装置 | |
TW202429446A (zh) | 用於具有元資料之參數化經寫碼獨立串流之不連續傳輸的解碼器及解碼方法 | |
TW202411984A (zh) | 用於具有元資料之參數化經寫碼獨立串流之不連續傳輸的編碼器及編碼方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160421 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170530 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170619 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6163545 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |