JP6538820B2 - スムーズな遷移を取得するために、ゼロ入力応答を用いるオーディオ・デコーダ、方法及びコンピュータ・プログラム - Google Patents
スムーズな遷移を取得するために、ゼロ入力応答を用いるオーディオ・デコーダ、方法及びコンピュータ・プログラム Download PDFInfo
- Publication number
- JP6538820B2 JP6538820B2 JP2017504677A JP2017504677A JP6538820B2 JP 6538820 B2 JP6538820 B2 JP 6538820B2 JP 2017504677 A JP2017504677 A JP 2017504677A JP 2017504677 A JP2017504677 A JP 2017504677A JP 6538820 B2 JP6538820 B2 JP 6538820B2
- Authority
- JP
- Japan
- Prior art keywords
- audio information
- decoded audio
- decoded
- decoder
- linear prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000004044 response Effects 0.000 title claims description 150
- 230000007704 transition Effects 0.000 title claims description 81
- 238000000034 method Methods 0.000 title claims description 65
- 238000004590 computer program Methods 0.000 title claims description 17
- 238000001914 filtration Methods 0.000 claims description 54
- 238000012545 processing Methods 0.000 claims description 43
- 230000009466 transformation Effects 0.000 claims description 3
- 230000002123 temporal effect Effects 0.000 claims description 2
- 230000005236 sound signal Effects 0.000 description 19
- 238000007792 addition Methods 0.000 description 16
- 238000013459 approach Methods 0.000 description 16
- 230000004048 modification Effects 0.000 description 11
- 238000012986 modification Methods 0.000 description 11
- 238000012937 correction Methods 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 230000015654 memory Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Description
本発明に係る実施形態は、符号化オーディオ情報に基づいて復号オーディオ情報を提供するオーディオ・デコーダに関する。
近年、符号化オーディオ情報を伝送すること及び保存することに対する要求が増加してきている。スピーチ及び一般的なオーディオ(例えば、音楽、背景ノイズ等)の両方を備えるオーディオ信号のオーディオ符号化及びオーディオ復号に対する要求もまた増加している。
本発明に係る実施形態は、符号化オーディオ情報に基づいて復号オーディオ情報を提供するためにオーディオ・デコーダを創造する。オーディオ・デコーダは、線形予測領域において符号化されるオーディオ・フレームに基づいて第1の復号オーディオ情報を提供するように構成される線形予測領域デコーダと、周波数領域において符号化されるオーディオ・フレームに基づいて第2の復号オーディオ情報を提供するように構成される周波数領域デコーダとを備える。オーディオ・デコーダは、遷移処理装置をさらに備える。遷移処理装置は、線形予測フィルタリングのゼロ入力応答を取得するように構成され、線形予測フィルタリングの初期状態は、第1の復号オーディオ情報及び第2の復号オーディオ情報に依存して定義される。遷移処理装置は、第2の復号オーディオ情報を修正するようにさらに構成され、第1の復号オーディオ情報と修正された第2の復号オーディオ情報との間でのスムーズな遷移を取得するために、ゼロ入力応答に依存して、線形予測領域において符号化されるオーディオ・フレームの後に続く周波数領域において符号化されるオーディオ・フレームに基づいて提供される。
本発明に係る実施形態は、次の添付図面を参照して後に記述されるだろう。
5.1.図1係るオーディオ・デコーダ
図1は、本発明の一実施形態に係る、オーディオ・デコーダ100の略ブロック図を示す。オーディオ・エンコーダ100は、例えば、線形予測領域において符号化される第1のフレーム、及び周波数領域において符号化される後に続く第2のフレームを備え得る、符号化オーディオ情報110を受信するように構成される。オーディオ・デコーダ100は、符号化オーディオ情報110に基づいて復号オーディオ情報112を提供するようにもまた構成される。
図2は、本発明のもう一つの実施形態に係る、オーディオ・デコーダの略ブロック図を示す。オーディオ・デコーダ200は、符号化オーディオ情報210を受信するように構成され、例えば、線形予測領域において(又は同等に、線形予測領域表現において)符号化される1つ以上のフレームと、周波数領域において(又は、同等に、変換領域において、若しくは同等に周波数領域表現において、若しくは同等に変換領域表現において)符号化される1つ以上のオーディオ・フレームとを備える。オーディオ・デコーダ200は、符号化オーディオ情報210に基づいて復号オーディオ情報212を提供するように構成される。復号オーディオ情報212は、例えば、時間領域表現であり得る。
図3は、本発明の一実施形態に係る、オーディオ・デコーダ300の略ブロック図を示す。オーディオ・デコーダ300は、相違のみが詳細において記述されるであろうように、オーディオ・デコーダ200と同様である。さもなければ、参照は、オーディオ・デコーダ200に関して提示された上記の説明になされる。
以下において、オーディオ・デコーダ100,200,300において適用可能である、CELPフレームからMDCTフレームへの遷移に関する幾つかの詳細が議論されるだろう。
本発明に係る実施形態において、エイリアシング問題は、(例えば、逆MDCT変換を用いるMDCT係数のセットに基づいて再構成される時間領域オーディオ信号の)左屈曲点がCELPとMDCTフレームの境界の左で動かされるように、(例えば、線形予測領域において符号化されるオーディオ・フレームの後に続くMDCT領域において符号化されるオーディオ・フレームのために)MDCT長さを増加させることによって解決される。(例えば、逆MDCT変換を用いるMDCT係数のセットに基づいて再構成される時間領域オーディオ信号に適用されるウィンドウの)MDCTウィンドウの左部は、重複が減じられるように、(例えば、「標準の」MDCTウィンドウと比較した場合、)さらに変更される。
以下において、短い段階的な記述が提供されるだろう。その後で、更なる詳細が与えられるだろう。
1.(「第1のフレーム」で時々示されもする)以前のフレームがCELPである(又は、一般に、線形予測領域において符号化される)場合、(周波数領域において又は変換領域において符号化されるフレームの例として考慮され得る)(「第2のフレーム」として時々示されもする)現在のMDCTフレームは、異なるMDCT長さ及び異なるMDCTウィンドウで符号化される。例えば、ウィンドウ440は、(「標準の」ウィンドウ422よりもむしろ、)この場合において用いられ得る。
1.(第1のオーディオ・フレームとしてもまた示される)以前のフレームがCELP(又は、一般に、線形予測領域において符号化される)場合、(周波数領域又は変換領域において符号化されるフレームの例である、)(第2のオーディオ・フレームとしてもまた示される)現在のMDCTフレームは、エンコーダ側において用いられるのと同じMDCT長さ及び同じMDCTウィンドウで復号される。別の言葉で言えば、図4Bにおいて示されるウィンドウ処理は、第2の復号オーディオ情報の提供において適用され、且つ(エンコーダの側で用いられる修正離散的コサイン変換の特性に対応する)逆修正離散的コサイン変換に関する上述した特性をさらに適用され得る。
a)信号の第1部は、CELP信号を用いる(例えば、第1の復号オーディオ情報を用いる)MDCT信号の(例えば、逆修正離散的コサイン変換によって提供される時間領域オーディオ信号の時間t4とt2の間の信号部の)重複部の欠落したエイリアシング、並びに重複−及び−追加の操作を人工的に導入することによって構成される。信号の第1部の長さは、例えば、重複長さ(例えば、1.25ms)に等しい。
b)信号の第2部は、対応するCELP信号のために信号の第1部(例えば、第1のオーディオ・フレームと第2のオーディオ・フレームの間の、フレーム境界の直前に位置する一部)を減算することによって構成される。
c)CELP合成フィルタのゼロ入力応答は、複数のゼロ(zeroes)のフレームをフィルタリングすることによって、且つメモリ状態として(又は初期状態として)信号の第2部を用いて、生成される。
d)ゼロ入力応答は、例えば、それが沢山のサンプル(例えば、64)の後で複数のゼロに減少するように、ウィンドウ処理される。
e)ウィンドウ処理されたゼロ入力応答は、MDCT信号の開始部(例えば、時間t2=0で始まるオーディオ部)に加算される。
以下において、デコーダの機能性がより詳細に記述されるだろう。
(エンコーダ側において用いられるのと同じMDCT長さ及び同じMDCTウィンドウで現在のMDCTフレームを復号する)デコーダ側のステップ1の後で、我々は、現在の復号MDCTフレーム(例えば、上述した第2の復号オーディオ情報を構成する「第2のオーディオ・フレーム」の時間領域表現)を得る。このフレーム(例えば、第2のフレーム)は、如何なるエイリアシングも含まない。なぜならば、左屈曲点は、(例えば、図4Bを参照して詳細に記述されるようなコンセプトを用いて、)CELPとMDCTフレームの間の境界の左で動かされたためである。つまり、我々は、十分に高いビットレートで現在のフレームにおいて、(例えば、時間t2=0とt3=20msの間で、)完全な再構成を得ることができる。しかしながら、低いのビットレートで、信号は必ずしも入力信号に合致せず、且つそれ故に、不連続性は、CELPとMDCTの間の境界で、(例えば、図4Bにおいて示されるように、時間t=0で、)導入され得る。
この問題に対する一つの考えられる解決策は、MPEG USACにおいて用いられるコンセプトを記述する、上述した参考文献1(J.ルコント及びその他の者による「LPCに基づく及び非LPCに基づくオーディオ・コーディングの間での遷移のための効率的なクロスフェード・ウィンドウ」)において提案されるアプローチである。以下において、上述の参考文献アプローチの簡潔な記述が提供されるだろう。
上述した従来のアプローチと比較して、不連続性を取り除くためにここで提案されるアプローチは、如何なる追加の遅延も有しない。それは、(第1のオーディオ・フレームとして示されもする)過去のCELPフレームを修正しないが、代わりに、(線形予測領域において符号化される第1のオーディオ・フレームの後に続く周波数領域において符号化される第2のオーディオ・フレームとして示されもする)現在のMDCTフレームを修正する。
コンセプトは、CELP合成フィルタのために(初期状態として示されもする)2つの異なるメモリを用いて(線形予測フィルタとして一般に考慮され得る)CELP合成フィルタのゼロ入力応答(ZIP)を計算するステップによって2つの信号を生成するステップをさらに備える。
現在のMDCT信号(例えば、第2の復号オーディオ情報132,232,332)は、現在のMDCTの(すなわち、現在の、第2のオーディオ・フレームに関連付けられるMDCT信号の)第2のバージョン142,242,342に置き換えられる。
任意で、ウィンドウは、元のままの(entire)現在のMDCTフレームに影響を及ぼさないために、2つのZIRに適用され得る。これは、例えば、複雑さを減じるために、又はZIRがMDCTフレームの終了で0に近くない場合に、有用である。
例えば、P=64である。
図9は、符号化オーディオ情報に基づいて復号オーディオ情報を提供する方法のフローチャートを示す。方法900は、線形予測領域において符号化されるオーディオ・フレームに基づいて第1の復号オーディオ情報を提供するステップ910を備える。方法900は、周波数領域において符号化されるオーディオ・フレームに基づいて第2の復号オーディオ情報を提供するステップ920をさらに備える。方法900は、線形予測フィルタリングのゼロ入力応答を取得するステップ930をさらに備える。線形予測フィルタリングの初期状態は、第1の復号オーディオ情報及び第2の復号オーディオ情報に依存して定義される。
図10は、符号化オーディオ情報Tに基づいて復号オーディオ情報を提供する方法1000のフローチャートを示す。
結論として、本発明に係る実施形態は、CELP−MDCT変換に関係する。これらの変換は、一般に、2つの問題を導入する。
1.欠落した以前のMDCTフレームに起因するエイリアシング、及び
2.低い/中位のビットレートで操作する2つのコーディング体系の性質をコード化する不完全な波形に起因する、CELPフレームとMDCTフレームの間の境界での不連続性
幾つかの態様が装置のコンテキストにおいて記述されたが、これらの態様が対応する方法の記述をさらに表現することは明らかである。そこでは、ブロック又は装置が方法ステップ又は方法ステップの特徴に対応する。類似して、方法ステップのコンテキストにおいて記述される態様は、対応するブロック若しくはアイテム又は対応する装置の特徴の記述をさらに表現する。方法ステップの幾つか又は全ては、例えば、マイクロプロセッサ、プログラム可能なコンピュータ又は電子回路のようなハードウェア装置によって(又はを用いて)実施され得る。幾つかの実施形態において、最も重要な方法ステップの1つ以上の幾つかは、そのような装置によって実施され得る。
Claims (18)
- 符号化オーディオ情報(110;210;310)に基づいて復号オーディオ情報(112;212;312)を提供するオーディオ・デコーダ(100;200;300)であって、前記オーディオ・デコーダは、
線形予測領域において符号化されたオーディオ・フレームに基づいて第1の復号オーディオ情報(122;222;322;SC(n))を提供するように構成される線形予測領域デコーダ(120;220;320)と、
周波数領域において符号化されたオーディオ・フレームに基づいて第2の復号オーディオ情報(132;232;332;SM(n))を提供するように構成される周波数領域デコーダ(130;230;330)と、
遷移処理装置(140;240;340)と、を備え、
前記遷移処理装置は、線形予測フィルタリング(148;254;346)のゼロ入力応答(150;256;348)を取得するように構成され、前記線形予測フィルタリングの初期状態(146;252;344)は、前記第1の復号オーディオ情報及び前記第2の復号オーディオ情報に依存して定義され、且つ
- 請求項1に記載のオーディオ・デコーダであって、
- 前記周波数領域デコーダ(130;230;330)は、逆重複変換を実行して、前記第2の復号オーディオ情報(132;232;332)がエイリアシングを含むように構成される、請求項1又は2に記載のオーディオ・デコーダ(100;200;300)。
- 前記周波数領域デコーダ(130;230;330)は、前記線形予測領域デコーダ(120;220;320)が第1の復号オーディオ情報(122;222;322)を提供する時間部分と時間的に重複する時間部分において前記第2の復号オーディオ情報(132;232;332)がエイリアシングを含むように、且つ、前記線形予測領域デコーダが第1の復号オーディオ情報を提供する前記時間部分に続く時間部分については前記第2の復号オーディオ情報にエイリアシングがないように、逆重複変換を実行するように構成される、請求項1若しくは2又は3に記載のオーディオ・デコーダ(100;200;300)。
-
-
- mは、引き続く(running)変数を示し、
Mは、前記線形予測フィルタのフィルタ長さを示し、
amは、前記線形予測フィルタのフィルタ係数を示し、
SC(n)は、時間指数nに対する前記第1の復号オーディオ情報(122;222;322)の以前に復号された値を示し、
Nは、処理長さを示す、請求項1〜6の1つに記載のオーディオ・デコーダ(100;200;300)。
- 前記遷移処理装置(140;240;340)は、前記第1の復号オーディオ情報(122;222;322;SC(n))に第1のウィンドウ処理((w(−n−1)w(−n−1))を適用して前記第1の復号オーディオ情報のウィンドウ処理バージョンを取得し、且つ前記第1の復号オーディオ情報(122;222;322;SC(n))の時間鏡映バージョン(SC(−n−L−1))に、第2のウィンドウ処理(w(n+L)w(−n−1))を適用して前記第1の復号オーディオ情報の時間鏡映バージョンのウィンドウ処理バージョンを取得するように構成され、且つ
- 前記遷移処理装置(140;240;340)は、
ここで、
nは、時間指数を示し、
w(−n−1)は、時間指数(−n−1)に対するウィンドウ関数の値を示し、
w(n+L)は、時間指数(n+L)に対するウィンドウ関数の値を示し、
SC(n)は、時間指数(n)に対する前記第1の復号オーディオ情報(122;222;322)の以前に復号された値を示し、
SC(−n−L−1)は、時間指数(−n−L−1)に対する前記第1の復号オーディオ情報の以前に復号された値を示し、
SM(n)は、時間指数nに対する前記第2の復号オーディオ情報(132;232;332)の復号された値を示し、且つ
Lは、ウィンドウの長さを示す、請求項1〜8の1つに記載のオーディオ・デコーダ。
- mは、引き続く変数を示し、
Mは、前記線形予測フィルタ(148;254;346)のフィルタ長さを示し、
amは、前記線形予測フィルタのフィルタ係数を示し、
Nは、処理長さを示す、請求項1〜9の1つに記載のオーディオ・デコーダ(100;200;300)。
- 前記遷移処理装置(140;240;340)は、前記修正された第2の復号オーディオ情報を取得するために、前記線形予測領域デコーダ(120;220;320)が第1の復号オーディオ情報(122;222;322)を提供しない時間部分について、前記第2の復号オーディオ情報(132;232;332)を、第1のゼロ入力応答(248)及び第2のゼロ入力応答(256)に、又は結合ゼロ入力応答(150;348)に、線形的に結合するように構成される、請求項1〜10の1つに記載のオーディオ・デコーダ(100;200;300)。
- 前記遷移処理装置(140;240;340)は、
v(n)は、ウィンドウ関数の値を示し、
Nは、処理長さを示す、請求項1〜11の1つに記載のオーディオ・デコーダ(100;200;300)。
- 前記遷移処理装置(140;240;340)は、線形予測領域において符号化されたオーディオ・フレームのための復号オーディオ情報を提供するときに、前記線形予測領域において符号化されたオーディオ・フレームに提供される前記復号オーディオ情報が前記周波数領域において符号化された次のオーディオ・フレームに提供される復号オーディオ情報から独立して提供されるように、前記第1の復号オーディオ情報(122;222;322)が前記第2の復号オーディオ情報(132;232;332)によって変更されないようにするように構成される、請求項1〜12の1つに記載のオーディオ・デコーダ(100;200;300)。
- 前記オーディオ・デコーダは、前記周波数領域において符号化されたオーディオ・フレームが後に続く前記線形予測領域において符号化されたオーディオ・フレームについては、前記周波数領域において符号化されたオーディオ・フレームを復号する前に、完全な復号オーディオ情報(122;222;322)を提供するように構成される、請求項1〜13の1つに記載のオーディオ・デコーダ(100;200;300)。
- 前記遷移処理装置(140;240;340)は、第1のゼロ入力応答(248)及び第2のゼロ入力応答(256)、又は結合ゼロ入力応答(150;348)を、ウィンドウ処理された第1のゼロ入力応答及びウィンドウ処理された第2のゼロ入力応答に依存して、又はウィンドウ処理された結合ゼロ入力応答に依存して前記第2の復号オーディオ情報(132;232;332)を修正する前に、ウィンドウ処理するように構成される、請求項1〜14の1つに記載のオーディオ・デコーダ(100;200;300)。
- 前記遷移処理装置は、線形ウィンドウを用いて、前記第1のゼロ入力応答及び前記第2のゼロ入力応答、又は前記結合ゼロ入力応答をウィンドウ処理するように構成される、請求項15に記載のオーディオ・デコーダ(100;200;300)。
- 符号化オーディオ情報に基づいて復号オーディオ情報を提供する方法(900)であって、前記方法は、
線形予測領域において符号化されたオーディオ・フレームに基づいて第1の復号オーディオ情報(SC(n))を提供するステップ(910)と、
周波数領域において符号化されたオーディオ・フレームに基づいて第2の復号オーディオ情報(SM(n))を提供するステップ(920)と、
線形予測フィルタリングのゼロ入力応答を取得するステップ(930)であって、前記線形予測フィルタリングの初期状態が前記第1の復号オーディオ情報及び前記第2の復号オーディオ情報に依存して定義されるステップ(930)と、
- コンピュータ・プログラムがコンピュータで動作するとき、請求項17に記載の前記方法を実行するコンピュータ・プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14178830.7 | 2014-07-28 | ||
EP14178830.7A EP2980797A1 (en) | 2014-07-28 | 2014-07-28 | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition |
PCT/EP2015/066953 WO2016016105A1 (en) | 2014-07-28 | 2015-07-23 | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019106415A Division JP7128151B2 (ja) | 2014-07-28 | 2019-06-06 | スムーズな遷移を取得するために、ゼロ入力応答を用いるオーディオ・デコーダ、方法及びコンピュータ・プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2017528753A JP2017528753A (ja) | 2017-09-28 |
JP2017528753A5 JP2017528753A5 (ja) | 2018-08-30 |
JP6538820B2 true JP6538820B2 (ja) | 2019-07-03 |
Family
ID=51224881
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017504677A Active JP6538820B2 (ja) | 2014-07-28 | 2015-07-23 | スムーズな遷移を取得するために、ゼロ入力応答を用いるオーディオ・デコーダ、方法及びコンピュータ・プログラム |
JP2019106415A Active JP7128151B2 (ja) | 2014-07-28 | 2019-06-06 | スムーズな遷移を取得するために、ゼロ入力応答を用いるオーディオ・デコーダ、方法及びコンピュータ・プログラム |
JP2022130470A Pending JP2022174077A (ja) | 2014-07-28 | 2022-08-18 | スムーズな遷移を取得するために、ゼロ入力応答を用いるオーディオ・デコーダ、方法及びコンピュータ・プログラム |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019106415A Active JP7128151B2 (ja) | 2014-07-28 | 2019-06-06 | スムーズな遷移を取得するために、ゼロ入力応答を用いるオーディオ・デコーダ、方法及びコンピュータ・プログラム |
JP2022130470A Pending JP2022174077A (ja) | 2014-07-28 | 2022-08-18 | スムーズな遷移を取得するために、ゼロ入力応答を用いるオーディオ・デコーダ、方法及びコンピュータ・プログラム |
Country Status (19)
Country | Link |
---|---|
US (4) | US10325611B2 (ja) |
EP (2) | EP2980797A1 (ja) |
JP (3) | JP6538820B2 (ja) |
KR (1) | KR101999774B1 (ja) |
CN (2) | CN106663442B (ja) |
AR (1) | AR101288A1 (ja) |
AU (1) | AU2015295588B2 (ja) |
BR (1) | BR112017001143A2 (ja) |
CA (1) | CA2954325C (ja) |
ES (1) | ES2690256T3 (ja) |
MX (1) | MX360729B (ja) |
MY (1) | MY178143A (ja) |
PL (1) | PL3175453T3 (ja) |
PT (1) | PT3175453T (ja) |
RU (1) | RU2682025C2 (ja) |
SG (1) | SG11201700616WA (ja) |
TR (1) | TR201815658T4 (ja) |
TW (1) | TWI588818B (ja) |
WO (1) | WO2016016105A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11170797B2 (en) | 2014-07-28 | 2021-11-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9384748B2 (en) * | 2008-11-26 | 2016-07-05 | Electronics And Telecommunications Research Institute | Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching |
EP2980796A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
FR3024581A1 (fr) | 2014-07-29 | 2016-02-05 | Orange | Determination d'un budget de codage d'une trame de transition lpd/fd |
FR3024582A1 (fr) | 2014-07-29 | 2016-02-05 | Orange | Gestion de la perte de trame dans un contexte de transition fd/lpd |
EP4243015A4 (en) * | 2021-01-27 | 2024-04-17 | Samsung Electronics Co., Ltd. | AUDIO PROCESSING APPARATUS AND METHOD |
Family Cites Families (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2177413A1 (en) * | 1995-06-07 | 1996-12-08 | Yair Shoham | Codebook gain attenuation during frame erasures |
JP3707116B2 (ja) | 1995-10-26 | 2005-10-19 | ソニー株式会社 | 音声復号化方法及び装置 |
JP4121578B2 (ja) * | 1996-10-18 | 2008-07-23 | ソニー株式会社 | 音声分析方法、音声符号化方法および装置 |
US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
ATE302991T1 (de) * | 1998-01-22 | 2005-09-15 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen |
EP0966102A1 (en) * | 1998-06-17 | 1999-12-22 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for signalling program or program source change with a characteristic acoustic mark to a program listener |
US6658383B2 (en) * | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
US6963842B2 (en) * | 2001-09-05 | 2005-11-08 | Creative Technology Ltd. | Efficient system and method for converting between different transform-domain signal representations |
JP4290917B2 (ja) * | 2002-02-08 | 2009-07-08 | 株式会社エヌ・ティ・ティ・ドコモ | 復号装置、符号化装置、復号方法、及び、符号化方法 |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
JP4238535B2 (ja) * | 2002-07-24 | 2009-03-18 | 日本電気株式会社 | 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体 |
JP2004151123A (ja) | 2002-10-23 | 2004-05-27 | Nec Corp | 符号変換方法、符号変換装置、プログラム及びその記憶媒体 |
CN101800049B (zh) * | 2003-09-16 | 2012-05-23 | 松下电器产业株式会社 | 编码装置和译码装置 |
DE102005002111A1 (de) * | 2005-01-17 | 2006-07-27 | Robert Bosch Gmbh | Verfahren und Vorrichtung zur Steuerung einer Brennkraftmaschine |
US8260609B2 (en) * | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
US7987089B2 (en) * | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
EP2092517B1 (en) | 2006-10-10 | 2012-07-18 | QUALCOMM Incorporated | Method and apparatus for encoding and decoding audio signals |
CN101197134A (zh) * | 2006-12-05 | 2008-06-11 | 华为技术有限公司 | 消除编码模式切换影响的方法和装置以及解码方法和装置 |
KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
CN101025918B (zh) * | 2007-01-19 | 2011-06-29 | 清华大学 | 一种语音/音乐双模编解码无缝切换方法 |
CN101231850B (zh) * | 2007-01-23 | 2012-02-29 | 华为技术有限公司 | 编解码方法及装置 |
CN101256771A (zh) * | 2007-03-02 | 2008-09-03 | 北京工业大学 | 嵌入式编码、解码方法、编码器、解码器及系统 |
US8527265B2 (en) * | 2007-10-22 | 2013-09-03 | Qualcomm Incorporated | Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs |
US8515767B2 (en) | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
MY181231A (en) * | 2008-07-11 | 2020-12-21 | Fraunhofer Ges Zur Forderung Der Angenwandten Forschung E V | Audio encoder and decoder for encoding and decoding audio samples |
EP2311034B1 (en) * | 2008-07-11 | 2015-11-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding frames of sampled audio signals |
CN102089814B (zh) | 2008-07-11 | 2012-11-21 | 弗劳恩霍夫应用研究促进协会 | 对编码的音频信号进行解码的设备和方法 |
EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
EP2144171B1 (en) * | 2008-07-11 | 2018-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
AU2013200680B2 (en) * | 2008-07-11 | 2015-01-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder and decoder for encoding and decoding audio samples |
KR20100007738A (ko) | 2008-07-14 | 2010-01-22 | 한국전자통신연구원 | 음성/오디오 통합 신호의 부호화/복호화 장치 |
JP4977157B2 (ja) | 2009-03-06 | 2012-07-18 | 株式会社エヌ・ティ・ティ・ドコモ | 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム |
EP3764356A1 (en) | 2009-06-23 | 2021-01-13 | VoiceAge Corporation | Forward time-domain aliasing cancellation with application in weighted or original signal domain |
CA2777073C (en) | 2009-10-08 | 2015-11-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
WO2011048117A1 (en) * | 2009-10-20 | 2011-04-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
BR122020024236B1 (pt) * | 2009-10-20 | 2021-09-14 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E. V. | Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio, método para prover uma representação decodificada de um conteúdo de áudio e programa de computador para uso em aplicações de baixo retardamento |
BR112012009490B1 (pt) | 2009-10-20 | 2020-12-01 | Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. | ddecodificador de áudio multimodo e método de decodificação de áudio multimodo para fornecer uma representação decodificada do conteúdo de áudio com base em um fluxo de bits codificados e codificador de áudio multimodo para codificação de um conteúdo de áudio em um fluxo de bits codificados |
EP2524374B1 (en) * | 2010-01-13 | 2018-10-31 | Voiceage Corporation | Audio decoding with forward time-domain aliasing cancellation using linear-predictive filtering |
SI3239979T1 (sl) | 2010-10-25 | 2024-09-30 | Voiceage Evs Llc | Kodiranje generičnih zvočnih signalov pri nizkih bitnih hitrostih in majhni zakasnitvi |
FR2969805A1 (fr) | 2010-12-23 | 2012-06-29 | France Telecom | Codage bas retard alternant codage predictif et codage par transformee |
US9037456B2 (en) * | 2011-07-26 | 2015-05-19 | Google Technology Holdings LLC | Method and apparatus for audio coding and decoding |
CN107068156B (zh) * | 2011-10-21 | 2021-03-30 | 三星电子株式会社 | 帧错误隐藏方法和设备以及音频解码方法和设备 |
JP6126006B2 (ja) | 2012-05-11 | 2017-05-10 | パナソニック株式会社 | 音信号ハイブリッドエンコーダ、音信号ハイブリッドデコーダ、音信号符号化方法、及び音信号復号方法 |
FR3013496A1 (fr) * | 2013-11-15 | 2015-05-22 | Orange | Transition d'un codage/decodage par transformee vers un codage/decodage predictif |
US20170015871A1 (en) * | 2013-11-29 | 2017-01-19 | Proionic Gmbh | Method for curing an adhesive using microwave irradiation |
EP2980797A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition |
US10157621B2 (en) * | 2016-03-18 | 2018-12-18 | Qualcomm Incorporated | Audio signal decoding |
US10839814B2 (en) * | 2017-10-05 | 2020-11-17 | Qualcomm Incorporated | Encoding or decoding of audio signals |
-
2014
- 2014-07-28 EP EP14178830.7A patent/EP2980797A1/en not_active Withdrawn
-
2015
- 2015-07-23 RU RU2017106091A patent/RU2682025C2/ru active
- 2015-07-23 CN CN201580041724.3A patent/CN106663442B/zh active Active
- 2015-07-23 SG SG11201700616WA patent/SG11201700616WA/en unknown
- 2015-07-23 MY MYPI2017000029A patent/MY178143A/en unknown
- 2015-07-23 KR KR1020177004348A patent/KR101999774B1/ko active IP Right Grant
- 2015-07-23 EP EP15741215.6A patent/EP3175453B1/en active Active
- 2015-07-23 WO PCT/EP2015/066953 patent/WO2016016105A1/en active Application Filing
- 2015-07-23 PL PL15741215T patent/PL3175453T3/pl unknown
- 2015-07-23 PT PT15741215T patent/PT3175453T/pt unknown
- 2015-07-23 TR TR2018/15658T patent/TR201815658T4/tr unknown
- 2015-07-23 ES ES15741215.6T patent/ES2690256T3/es active Active
- 2015-07-23 BR BR112017001143A patent/BR112017001143A2/pt not_active Application Discontinuation
- 2015-07-23 CA CA2954325A patent/CA2954325C/en active Active
- 2015-07-23 TW TW104123861A patent/TWI588818B/zh active
- 2015-07-23 JP JP2017504677A patent/JP6538820B2/ja active Active
- 2015-07-23 AU AU2015295588A patent/AU2015295588B2/en active Active
- 2015-07-23 CN CN202110275947.3A patent/CN112951255B/zh active Active
- 2015-07-23 MX MX2017001244A patent/MX360729B/es active IP Right Grant
- 2015-07-23 AR ARP150102338A patent/AR101288A1/es active IP Right Grant
-
2017
- 2017-01-26 US US15/416,052 patent/US10325611B2/en active Active
-
2019
- 2019-05-31 US US16/427,488 patent/US11170797B2/en active Active
- 2019-06-06 JP JP2019106415A patent/JP7128151B2/ja active Active
-
2021
- 2021-09-20 US US17/479,151 patent/US11922961B2/en active Active
-
2022
- 2022-08-18 JP JP2022130470A patent/JP2022174077A/ja active Pending
-
2023
- 2023-10-19 US US18/381,866 patent/US20240046941A1/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11170797B2 (en) | 2014-07-28 | 2021-11-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, method and computer program using a zero-input-response to obtain a smooth transition |
JP2022174077A (ja) * | 2014-07-28 | 2022-11-22 | フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | スムーズな遷移を取得するために、ゼロ入力応答を用いるオーディオ・デコーダ、方法及びコンピュータ・プログラム |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7128151B2 (ja) | スムーズな遷移を取得するために、ゼロ入力応答を用いるオーディオ・デコーダ、方法及びコンピュータ・プログラム | |
US8751246B2 (en) | Audio encoder and decoder for encoding frames of sampled audio signals | |
CA2984042C (en) | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal | |
AU2014343904B2 (en) | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal | |
TWI479478B (zh) | 用以使用對齊的預看部分將音訊信號解碼的裝置與方法 | |
CN109155133B (zh) | 音频帧丢失隐藏的错误隐藏单元、音频解码器及相关方法 | |
RU2574849C2 (ru) | Устройство и способ для кодирования и декодирования аудиосигнала с использованием выровненной части опережающего просмотра |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180123 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20180406 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20180723 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181002 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20181221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190402 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190507 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190606 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6538820 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |