JP7174081B2 - マルチチャンネル音声符号化 - Google Patents

マルチチャンネル音声符号化 Download PDF

Info

Publication number
JP7174081B2
JP7174081B2 JP2020571588A JP2020571588A JP7174081B2 JP 7174081 B2 JP7174081 B2 JP 7174081B2 JP 2020571588 A JP2020571588 A JP 2020571588A JP 2020571588 A JP2020571588 A JP 2020571588A JP 7174081 B2 JP7174081 B2 JP 7174081B2
Authority
JP
Japan
Prior art keywords
itd
parameter
comparison
channel
stereo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020571588A
Other languages
English (en)
Other versions
JP2021528693A (ja
Inventor
ヤン ビューテ
エレニ フォトポウロウ
スリカンス コルセ
パラヴィ マベン
マルクス ムルトゥルス
フランツ ロイテルフーバー
Original Assignee
フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2021528693A publication Critical patent/JP2021528693A/ja
Priority to JP2022177073A priority Critical patent/JP2023017913A/ja
Application granted granted Critical
Publication of JP7174081B2 publication Critical patent/JP7174081B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本願発明は、パラメトリックマルチチャンネル音声符号化に関する。
低ビットレートでのステレオ信号の損失性パラメトリック符号化についての最新の方法は、MPEG-4パート3[1]で規格化されたパラメトリックステレオに基づいている。一般的な考えは、デコーダにサイド情報として送られるステレオ/空間パラメータを抽出した後に2つの入力チャンネルからダウンミックス信号を計算することによって、マルチチャンネルシステムのチャンネル数を削減することである。これらのステレオ/空間パラメータは、一般に、チャンネル間レベル差ILD、チャンネル間位相差IPD、及びチャンネル間コヒーレンスICCから構成されてもよく、これらはサブバンドで計算されてもよく、特定の拡張のための空間像をある程度捉えることができる。
しかしながら、この方法は、例えば、ABマイク設定で録音された音声をダウンミックスまたは再生するためにあるいはバイノーラルにレンダリングされたシーンを合成するために望ましいチャンネル間時間差(ITD(複数))を補償したり合成したりすることはできない。ITD合成は、バイノーラルキュー符号化(BCC)[2]で対処されており、一般に、パラメータILD及びICCが使用されるがITD(複数)は推定され、チャンネル調整は周波数領域で実行される。
時間領域ITD推定量は存在するが、通常ITD推定にとって、時間-周波数変換を適用することが好ましく、これは、相互相関関数のスペクトルフィルタリングを可能にし、また、計算量も効率的でもある。複雑であるという理由から、ステレオ/空間パラメータの抽出や可能ならばチャンネルのダウンミックスにも使用される同じ変換を使用することは、望ましいが、これはBCCアプローチ内でも行われている。
しかしながら、これには欠点がある:ステレオパラメータの正確な推定は、調整されたチャンネル上で実行されるのが理想的である。しかし、チャンネルが、例えば周波数領域内での循環シフトによって、周波数領域で調整されている場合、これは、分析ウインドウ内でのオフセットを引き起こす可能性があり、パラメータ推定に悪影響を及ぼす可能性がある。BCCの場合、これは、主に、ICCの測定に影響を及ぼし、たとえ入力信号が実際には全体的にコヒーレントであっても、ウインドウオフセットの増加は、最終的にICC値をゼロに向けて押し上げる。
このように、本願発明は、空間パラメータ推定に対する悪影響を回避しつつ、チャンネル間時間差を補償することを可能にする、マルチチャンネル音声符号化でのパラメータ計算の概念を提供することを目的とする。
この目的は、同封された独立請求項の主題によって達成される。
本願発明は、マルチチャンネル音声符号化においてパラメトリック音声エンコーダによって使用される周波数領域内の任意の2つのチャンネル間のITD補償についての少なくとも1つの比較パラメータを計算することによって、改善された計算効率が達成される可能性があるという知見に基づいている。少なくとも前記1つの比較パラメータは、空間パラメータ推定での上述の悪影響を軽減するために、パラメトリックエンコーダによって使用されてもよい。
実施の形態は、少なくとも1つのダウンミックス信号と追加のステレオまたは空間パラメータによって、ステレオまたは一般的な空間コンテンツを表現することを目的とするパラメトリック音声エンコーダを備えていてもよい。これらステレオ/空間パラメータには、残りのステレオ/空間パラメータを計算する前に、周波数領域で推定され補償されたITD(複数)が含まれてもよい。この手順では、他のステレオ/空間パラメータに偏りが生じる可能性があり、そうでなければ、コストがかかる方法で解決しなければならない問題は、周波数-時間変換を再計算することになる。前述の実施の形態では、この問題は、むしろ、ITDの値及び基本的な変換の特定のデータを使用できる計算量の少ない補正スキームを適用することによって、むしろ軽減できるかもしれない。
実施の形態は、重み付けられた、ミッド/サイド変換アプローチに基づいていてもよく、ステレオ/空間パラメータIPD、ITD、ならびに、2つのゲイン係数を用いてもよく、周波数領域で動作してもよい、非可逆パラメトリック音声エンコーダに関する。他の実施形態では、異なる変換を用いてもよく、適宜異なる空間パラメータを用いてもよい。
実施の形態では、パラメトリック音声エンコーダは、周波数領域内のITD(複数)の補償及び合成の両方が可能であってもよい。それは、前述のウインドウオフセットの悪影響を軽減する計算効率の高いゲイン補正スキームを特徴としていてもよい。また、BCCコーダについての補正スキームも、提案されている。
本願発明の有利な実施例は、従属項の主題である。本願発明の好ましい実施の形態は、図面に関して以下に説明される。
図1は、本願発明の実施の形態に従った、パラメトリックエンコーダ用の比較装置のブロック図を示す。 図2は、本願発明の実施の形態に従った、パラメトリックエンコーダのブロック図を示す。 図3は、本願発明の実施の形態に従った、パラメトリックデコーダのブロック図を示す。
図1は、マルチチャンネル音声信号用の比較装置100を示す。図示の通り、それは、一対のステレオチャンネルについての音声信号、すなわち、左音声チャンネル信号l(τ)及び右音声チャンネル信号r(τ)についての入力を備えていてもよい。他の実施の形態は、もちろん、音源の空間特性を捕捉するために複数のチャンネルを備えていてもよい。
時間領域音声信号l(τ)、r(τ)を周波数領域に変換する前に、同一の重複するウインドウ関数11、21、w(τ)は、左、及び右入力チャンネル信号l(τ)、r(τ)にそれぞれ適用されてもよい。さらに、実施の形態では、一定量のゼロパディング(zero padding)が、周波数領域内でのシフトを可能にするために加えられてもよい。その後、ウインドウ処理された音声信号は、対応する離散フーリエ変換(DFT)ブロック12、22に提供されて時間-周波数変換を実行されてもよい。これらは、一対のチャンネルの音声信号の周波数変換として時間-周波数ビンLt,k及びRt,k、k=0,・・・,k-1を生じさせてもよい。
前記周波数変換Lt,k及びRt,kは、ITD検出及び補償ブロック20に提供されてもよい。後者は、前記分析ウインドウw(τ)内の一対のチャンネルの音声信号の周波数変換Lt,k及びRt,kを用いて、一対のチャンネルについての音声信号間のITDを表すITDパラメータ、ここでは、ITDτを導出するように構成されていてもよい。他の実施の形態では、時間領域内のDFTブロックの前に決定されてもよいITDパラメータを導出するために異なるアプローチを使用してもよい。
ITDを計算するためのITDパラメータの導出は、可能な限り重み付けられた、自己相関、または相互相関関数の計算を含んでいてもよい。従来は、これは、逆離散フーリエ変換(IDFT)を項(Lt,k* t,kωt,kkに適用することにより、時間-周波数ビンLt,k、及びRt,kから計算することができる。
Figure 0007174081000001
実施の形態では、ITDt/2サンプルによって、これは遅延チャンネルを進めてもよく、または、遅延チャンネルを遅らせてもよい。しかしながら、別の実施の形態では、遅れが重要である場合、システムの遅れを増加させないITDtサンプルだけ遅延チャンネルを進めることは有益であるかもしれない。
その結果、ITD検出及び補償ブロック20は、ITDパラメータITDtを用いて周波数領域内の一対のチャンネルについてのITDを循環シフト[複数]によって補償して、一対のITD補償された周波数変換Lt,k,comp、Rt,k,compをその出力で生じさせてもよい。さらに、ITD検出及び補償ブロック20は、例えば、パラメトリックエンコーダによる送信のために、導出されたITDパラメータ、すなわちITDtを出力してもよい。
図1に示すように、比較及び空間パラメータ計算ブロック30は、ITDパラメータITDt、及び一対のITD補償周波数変換Lt,k,comp、Rt,k,compをその入力信号として受信してもよい。比較及び空間パラメータ計算ブロック30は、入力信号の一部または全部を使用して、位相間差分IPD等のマルチチャンネル音声信号のステレオ/空間パラメータを抽出してもよい。
さらに、比較及び空間パラメータ計算ブロック30は、ITDパラメータITDt、及び一対のITD補償周波数変換Lt,k,comp,Rt,k,compに基づいて、少なくとも1つの比較パラメータ、ここでは2つのゲイン係数gt,b及びrt,b,corrをパラメトリックエンコーダのために生成してもよい。他の実施の形態では、少なくとも1つの比較パラメータを生成するために、周波数変換Lt,k、Rt,k、および/または、比較及び空間パラメータ計算ブロック30で抽出された、空間/ステレオパラメータを追加的にまたは代替的に使用してもよい。
少なくとも1つの比較パラメータは、パラメトリックエンコーダの空間/ステレオパラメータ推定での分析ウインドウw(τ)での前述のオフセットの悪影響を軽減する計算効率の良い補正スキームの一部として役立てることが可能であり、前記オフセットは、ITD検出及び補償ブロック20のDFT領域内の循環シフトによってチャンネルが調整されることによって引き起こされる。実施の形態では、少なくとも1つの比較パラメータは、デコーダで一対のチャンネルの音声信号を復元するために、例えば、ダウンミックス信号から計算されてもよい。
図2は、図1の比較装置100が、ITDパラメータITDt、一対のITD補償周波数変換Lt,k,comp,Rt,k,comp、及び比較パラメータrt,b,corr及びgt,bを提供するために使用されてもよいステレオ音声信号のためのこのようなパラメトリックエンコーダ200の実施の形態を示す。
パラメトリックエンコーダ200は、ITD補償周波数変換Lt,k,comp、Rt,k,compを入力として使用して、左右の入力チャンネル信号l(τ)、r(τ)についてダウンミックスブロック40でダウンミックス信号DMXt,kを生成してもよい。他の実施の形態では、周波数変換Lt,k、Rt,kを追加的にまたは代替的に使用して、ダウンミックス信号DMXt,kを生成してもよい。
パラメトリックエンコーダ200は、比較及び空間パラメータ計算ブロック30においてフレームベースで、ステレオパラメータ、例えば、IPD等、を計算してもよい。他の実施の形態では、異なるまたはさらなるステレオ/空間パラメータを決定してもよい。図2のパラメトリックエンコーダ200の実施の形態の符号化手順は、以下に詳細に記述された、以下のステップに大まかに従ってもよい。

1.ウインドウにおけるウインドウ処理されたDFTとDFTブロック11、12、21、22とを使用する、入力信号の時間-周波数変換
2.ITD検出及び補償ブロック20の周波数領域内のITD推定及び補償
3.比較及び空間パラメータ計算ブロック30のステレオパラメータ抽出及び比較パラメータ計算
4.ダウンミックスブロック40のダウンミキシング
5.IDFTブロック50における周波数-時間変換に続くウインドウ処理及びオーバーラップの追加
図2のパラメトリック音声エンコーダ200の実施の形態は、ITD補償周波数変換Lt,k,comp、Rt,k,compならびにITDを入力として使用して、周波数領域内の入力チャンネルの重み付けられたミッド/サイド変換に基づいていてもよい。それは、さらに、IPDなどの、ステレオ/空間パラメータ、ならびに、ステレオ画像をキャプチャする2つのゲイン係数をさらに計算してもよい。それは、前述のウインドウオフセットの悪影響を軽減するかもしれない。
Figure 0007174081000002
Figure 0007174081000003
Figure 0007174081000004
Figure 0007174081000005
Figure 0007174081000006
Figure 0007174081000007
他の実施の形態では、他のアプローチおよび/または式が、サイドゲイン係数gt,b及び残差ゲイン係数rt,bおよび/または異なる比較パラメータを適切に計算するために使用されてもよい。
Figure 0007174081000008
Figure 0007174081000009
Figure 0007174081000010
このような周波数領域のチャンネル調整は、主に、残差予測ゲイン係数rt,bに影響を与え、ITDtの増加とともにより大きくなることが観測されている。さらなる対策がなければ、周波数領域でのチャンネル調整は、このように、図3に示された、追加のアンビエンスをデコーダでの出力音声信号に加える。特に符号化される音声信号がクリーンなスピーチを含む場合には、人工的なアンビエンスがスピーチの明瞭性を損なうので、このような追加のアンビエンスは、望ましくない。
従って、上述の効果は、更なる比較パラメータを使用して、ノンゼロITD(複数)が存在するときには、(予測)残差ゲイン係数rt,bを補正することによって緩和される可能性がある。
Figure 0007174081000011
Figure 0007174081000012
Figure 0007174081000013
Figure 0007174081000014
Figure 0007174081000015
Figure 0007174081000016
Figure 0007174081000017
それゆえに、さらなる実施の形態は、ウインドウ処理されたDFTと、式(3)に従ったパラメータIPD[のサブセット]、式(11)に従ったサイドゲインgt,b、式(12)に従った残差ゲインrt,b、及びITD(複数)とを使用したパラメトリックオーディオ符号化に関連し、残差ゲインrt,bは、式(25)に従って調整される。
Figure 0007174081000018
Figure 0007174081000019
Figure 0007174081000020
Figure 0007174081000021
Figure 0007174081000022
定義上、ICCは、ITD(複数)を補償した後に測定される。しかしながら、マッチしていないウインドウ関数wは、ICC測定を偏らせるかもしれない。式(13)によって示された上述のクリーンな無反響音声の設定では、適切に調整された入力チャンネルで計算された場合、ICCは1となるであろう。
Figure 0007174081000023
Figure 0007174081000024
このように、更なる実施の形態は、ウインドウ処理されたDFTおよび式(3)に従ったパラメータIPD[のサブセット]、式(26)に従ったICC、及びITC(複数)を用いるパラメトリック音声コーディングに関し、ICCは式(28)に従って調整される。
Figure 0007174081000025
式(29)では、βは、ステレオ/空間パラメータから計算された実際の絶対位相調整パラメータであってもよい。他の実施の形態では、図2に示された符号化スキームは、また、他のどのようなダウンミックス方法で動作してもよい。他の実施の形態は、周波数変換Lt,k、及びRt,k、及び任意の更なるパラメータを用いてダウンミックス信号DMXt,kを決定してもよい。
図2の実施の形態のエンコーダでは、逆離散フーリエ変換(IDFT)ブロック50は、ダウンミックスブロック40から周波数領域ダウンミックス信号DMXt,kを受信してもよい。IDFTブロック50は、周波数領域から時間領域まで、ダウンミックス時間-周波数ビンDMXt,k、k=0,・・・,k-1を変換して時間領域ダウンミックス信号dmx(τ)を生じさせてもよい。実施の形態では、合成ウインドウws(τ)を適用して、時間領域ダウンミックス信号dmx(τ)に加えてもよい。
さらに、図2の実施の形態のように、コアエンコーダ60は、MPEG-4パート3[1]、または、必要に応じて他の任意の適当な音声符号化アルゴリズムにも従って、単独チャンネル音声信号をエンコードするためにドメインダウンミックス信号dmx(τ)を受信してもよい。図2の実施の形態では、コアエンコードされた時間領域ダウンミックス信号dmx(τ)は、ITDパラメータITDt、サイドゲインgt,b及び補正された残差ゲインrt,b,corrと組み合わせてデコーダへの送信のために適切に処理され、および/またはエンコードされてもよい。
図3は、マルチチャンネルデコーダの実施形態を示す。デコーダは、時間領域内のモノラル/ダウンミックス入力信号dmx(τ)と、フレームベースのサイド情報としての比較および/または空間パラメータからなる複合信号を受信してもよい。図3に示すデコーダは、以下に詳細に記述される、以下のステップを実行してもよい。
1.DFTブロック80のウインドウ処理されたDFT(複数)を用いる時間周波数変換
2.アップミキシング及び空間復元ブロック90における周波数領域の消失残差の予測
3.アップミキシング及び空間復元ブロック90における周波数領域でのアップミキシング
4.ITD合成ブロック100での周波数領域のITD合成
5.IDFTブロック112、122、及びウインドウブロック111、121での周波数-時間領域変換、ウインドウ処理及び重複の追加
モノラル/ダウンミックス信号入力信号dmx(τ)の時間-周波数変換は、図2のエンコーダの入力音声信号に関しては、類似した方法で行われてもよい。特定の実施の形態では、適切な量のゼロパディングが、周波数領域内のITD復元に対して加えられてもよい。この手順は、時間-周波数ビンDMXt,k、k=0,・・・,k-1の形式で、ダウンミックス信号の周波数変換を生じさせてもよい。
Figure 0007174081000026
Figure 0007174081000027
Figure 0007174081000028
Figure 0007174081000029
上述の実施の形態は、単に、本発明の原則を説明したにすぎない。ここに記述された配置及び詳細の修正及び変更は、他の当業者にとって明らかであると理解される。したがって、差し迫った特許請求の範囲のみに限定され、そして、明細書中の実施の形態の記述及び説明によって表された特定の詳細によっては制限されないことを意味する。
参考文献
[1] MPEG-4 High Efficiency Advanced Audio Coding (HE-AAC) v2
[2] Juergen Herre, FROM JOINT STEREO TO SPATIAL AUDIO CODING - RECENT PROGRESS AND STANDARDIZATION, Proc. of the 7th Int. Conference on digital Audio Effects (DAFX-04), Naples, Italy, October 5-8, 2004
[3] Christoph Tourney and Christof Faller, Improved Time Delay Analysis/Synthesis for Parametric Stereo Audio Coding, AES Convention Paper 6753, 2006
[4] Christof Faller and Frank Baumgarte, Binaural Cue Coding Part II: Schemes and Applications, IEEE Transactions on Speech and Audio Processing, Vol. 11, No. 6, November 2003

Claims (15)

  1. Figure 0007174081000030
  2. 前記少なくとも1つのITDパラメータ(ITDt)を抽出するために、前記分析ウインドウ(w(τ))内の前記少なくとも一対の前記チャンネルの前記音声信号の周波数変換(Lt,k;Rt,k)を用いるようにさらに構成される、請求項1に記載の比較装置。
  3. Figure 0007174081000031
  4. Figure 0007174081000032
  5. ルックアップテーブルに記憶された前記分析ウインドウの前記自己相関関数の前記正規化バージョンの補間によって前記関数を得るようにさらに構成される、請求項4に記載の比較装置。
  6. Figure 0007174081000033
  7. Figure 0007174081000034
  8. 前記少なくとも1つのサイドゲイン及び前記少なくとも1つの残差ゲインを、前記エネルギーと前記少なくとも一対のITD補償された周波数変換 (Lt,k,comp;Rt,k,comp)の内積とを用いて計算するようにさらに構成される、請求項7に記載の比較装置。
  9. Figure 0007174081000035
  10. Figure 0007174081000036
  11. Figure 0007174081000037
  12. 前記少なくとも1つの前記ダウンミックス信号を、少なくとも一対のITD補償された周波数変換に基づいて生成するようにさらに構成される、請求項1ないし11のいずれか1項に記載の比較装置。
  13. 前記少なくとも1つのダウンミックス信号、前記少なくとも1つのITDパラメータ、及び前記少なくとも1つの比較パラメータを符号化して、デコーダに送信するようにさらに構成される請求項11または請求項12に記載の前記比較装置を備える、マルチチャンネルエンコーダ。
  14. Figure 0007174081000038
  15. Figure 0007174081000039
JP2020571588A 2018-06-22 2019-06-19 マルチチャンネル音声符号化 Active JP7174081B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022177073A JP2023017913A (ja) 2018-06-22 2022-11-04 マルチチャンネル音声符号化

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18179373.8A EP3588495A1 (en) 2018-06-22 2018-06-22 Multichannel audio coding
EP18179373.8 2018-06-22
PCT/EP2019/066228 WO2019243434A1 (en) 2018-06-22 2019-06-19 Multichannel audio coding

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022177073A Division JP2023017913A (ja) 2018-06-22 2022-11-04 マルチチャンネル音声符号化

Publications (2)

Publication Number Publication Date
JP2021528693A JP2021528693A (ja) 2021-10-21
JP7174081B2 true JP7174081B2 (ja) 2022-11-17

Family

ID=62750879

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020571588A Active JP7174081B2 (ja) 2018-06-22 2019-06-19 マルチチャンネル音声符号化
JP2022177073A Pending JP2023017913A (ja) 2018-06-22 2022-11-04 マルチチャンネル音声符号化

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2022177073A Pending JP2023017913A (ja) 2018-06-22 2022-11-04 マルチチャンネル音声符号化

Country Status (13)

Country Link
US (2) US11978459B2 (ja)
EP (2) EP3588495A1 (ja)
JP (2) JP7174081B2 (ja)
CN (1) CN112424861B (ja)
AR (1) AR115600A1 (ja)
AU (1) AU2019291054B2 (ja)
BR (1) BR112020025552A2 (ja)
CA (1) CA3103875C (ja)
MX (1) MX2020013856A (ja)
SG (1) SG11202012655QA (ja)
TW (1) TWI726337B (ja)
WO (1) WO2019243434A1 (ja)
ZA (1) ZA202100230B (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3588495A1 (en) 2018-06-22 2020-01-01 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Multichannel audio coding
JP7380838B2 (ja) * 2020-03-09 2023-11-15 日本電信電話株式会社 音信号符号化方法、音信号復号方法、音信号符号化装置、音信号復号装置、プログラム及び記録媒体
BR112023006291A2 (pt) * 2020-10-09 2023-05-09 Fraunhofer Ges Forschung Dispositivo, método ou programa de computador para processar uma cena de áudio codificada usando uma conversão de parâmetro
US11818353B2 (en) * 2021-05-13 2023-11-14 Qualcomm Incorporated Reduced complexity transforms for high bit-depth video coding

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017125562A1 (en) 2016-01-22 2017-07-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatuses and methods for encoding or decoding a multi-channel audio signal using frame control synchronization
WO2017153466A1 (en) 2016-03-09 2017-09-14 Telefonaktiebolaget Lm Ericsson (Publ) A method and apparatus for increasing stability of an inter-channel time difference parameter
WO2018086947A1 (en) 2016-11-08 2018-05-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5789689A (en) * 1997-01-17 1998-08-04 Doidic; Michel Tube modeling programmable digital guitar amplification system
AU2003281128A1 (en) * 2002-07-16 2004-02-02 Koninklijke Philips Electronics N.V. Audio coding
US7809579B2 (en) * 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
SE0402650D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
EP1866911B1 (en) 2005-03-30 2010-06-09 Koninklijke Philips Electronics N.V. Scalable multi-channel audio coding
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
CN101556799B (zh) * 2009-05-14 2013-08-28 华为技术有限公司 一种音频解码方法和音频解码器
US9424852B2 (en) * 2011-02-02 2016-08-23 Telefonaktiebolaget Lm Ericsson (Publ) Determining the inter-channel time difference of a multi-channel audio signal
US10002614B2 (en) * 2011-02-03 2018-06-19 Telefonaktiebolaget Lm Ericsson (Publ) Determining the inter-channel time difference of a multi-channel audio signal
KR101580240B1 (ko) * 2012-02-17 2016-01-04 후아웨이 테크놀러지 컴퍼니 리미티드 다채널 오디오 신호를 인코딩하는 파라메트릭 인코더
EP2834813B1 (en) * 2012-04-05 2015-09-30 Huawei Technologies Co., Ltd. Multi-channel audio encoder and method for encoding a multi-channel audio signal
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
MY195412A (en) * 2013-07-22 2023-01-19 Fraunhofer Ges Forschung Multi-Channel Audio Decoder, Multi-Channel Audio Encoder, Methods, Computer Program and Encoded Audio Representation Using a Decorrelation of Rendered Audio Signals
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
CN117037810A (zh) * 2013-09-12 2023-11-10 杜比国际公司 多声道音频内容的编码
EP3067889A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for signal-adaptive transform kernel switching in audio coding
EP3067886A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
EP3208800A1 (en) * 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
EP3588495A1 (en) 2018-06-22 2020-01-01 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Multichannel audio coding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017125562A1 (en) 2016-01-22 2017-07-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatuses and methods for encoding or decoding a multi-channel audio signal using frame control synchronization
WO2017153466A1 (en) 2016-03-09 2017-09-14 Telefonaktiebolaget Lm Ericsson (Publ) A method and apparatus for increasing stability of an inter-channel time difference parameter
WO2018086947A1 (en) 2016-11-08 2018-05-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain

Also Published As

Publication number Publication date
WO2019243434A1 (en) 2019-12-26
CN112424861B (zh) 2024-04-16
CN112424861A (zh) 2021-02-26
US20210098007A1 (en) 2021-04-01
CA3103875C (en) 2023-09-05
MX2020013856A (es) 2021-03-25
JP2021528693A (ja) 2021-10-21
AU2019291054A1 (en) 2021-02-18
BR112020025552A2 (pt) 2021-03-16
ZA202100230B (en) 2022-07-27
TW202016923A (zh) 2020-05-01
AR115600A1 (es) 2021-02-03
KR20210021554A (ko) 2021-02-26
TWI726337B (zh) 2021-05-01
SG11202012655QA (en) 2021-01-28
EP3588495A1 (en) 2020-01-01
AU2019291054B2 (en) 2022-04-07
JP2023017913A (ja) 2023-02-07
CA3103875A1 (en) 2019-12-26
EP3811357A1 (en) 2021-04-28
US11978459B2 (en) 2024-05-07
US20240112685A1 (en) 2024-04-04

Similar Documents

Publication Publication Date Title
US11871205B2 (en) Parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder
JP7174081B2 (ja) マルチチャンネル音声符号化
JP7270096B2 (ja) フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法
JP2023017913A5 (ja)
EP2904609B1 (en) Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
JP5604933B2 (ja) ダウンミクス装置およびダウンミクス方法
WO2010097748A1 (en) Parametric stereo encoding and decoding
MX2014010098A (es) Control de coherencia de fase para señales armonicas en codecs de audio perceptual.
KR20190085988A (ko) 상관해제 필터들의 적응적 제어를 위한 방법 및 장치
Lang et al. Novel low complexity coherence estimation and synthesis algorithms for parametric stereo coding
KR102670634B1 (ko) 멀티 채널 오디오 코딩
RU2778832C2 (ru) Многоканальное кодирование аудио

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220315

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220316

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220609

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220907

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221104

R150 Certificate of patent or registration of utility model

Ref document number: 7174081

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150