JP2016511433A - オーディオフレーム損失コンシールメント - Google Patents

オーディオフレーム損失コンシールメント Download PDF

Info

Publication number
JP2016511433A
JP2016511433A JP2015555963A JP2015555963A JP2016511433A JP 2016511433 A JP2016511433 A JP 2016511433A JP 2015555963 A JP2015555963 A JP 2015555963A JP 2015555963 A JP2015555963 A JP 2015555963A JP 2016511433 A JP2016511433 A JP 2016511433A
Authority
JP
Japan
Prior art keywords
frame
sine wave
frequency
audio signal
prototype
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015555963A
Other languages
English (en)
Other versions
JP5978408B2 (ja
Inventor
ステファン ブルーン,
ステファン ブルーン,
Original Assignee
テレフオンアクチーボラゲット エルエム エリクソン(パブル)
テレフオンアクチーボラゲット エルエム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エルエム エリクソン(パブル), テレフオンアクチーボラゲット エルエム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エルエム エリクソン(パブル)
Publication of JP2016511433A publication Critical patent/JP2016511433A/ja
Application granted granted Critical
Publication of JP5978408B2 publication Critical patent/JP5978408B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals

Abstract

過去に受信又は再構成されたオーディオ信号の一部分の正弦波分析であって、前記オーディオ信号の正弦波成分の周波数を特定することを含む正弦波分析を行い、前記過去に受信又は再構成されたオーディオ信号のセグメントであって、損失オーディオフレームの代替フレームを生成するためにプロトタイプフレームとして使用されるセグメントに、正弦波モデルを適用し、対応する前記特定された周波数に応じて、前記損失オーディオフレームの時間インスタンスまでの前記プロトタイプフレームの正弦波成分を時間発展させることを含む、前記損失オーディオフレームの前記代替フレームを生成することにより、受信オーディオ信号の損失オーディオフレームのコンシールメントを行う。

Description

本発明は、受信オーディオ信号の損失オーディオフレームのコンシールメントを行う方法に関する。本発明はまた、受信オーディオ信号の損失オーディオフレームのコンシールメントを行うデコーダに関する。本発明は更に、デコーダを含む受信機、及びコンピュータプログラム並びにコンピュータプログラム製品にも関連する。
従来のオーディオ通信システムは、音声信号及びオーディオ信号をフレームごとに送信する。送信側は、まず信号を例えば20〜40msの短いセグメントとして配列する。これらは順次、符号化され、例えば送信パケットにおける論理ユニットとして送信される。受信側のデコーダは、これらの論理ユニットの各々を復号化し、対応するオーディオ信号フレームを再構成する。再構成されたフレームは最終的に、再構成信号サンプルの連続シーケンスとして出力される。
符号化に先立って、アナログ/デジタル(A/D)変換により、マイクロホンからのアナログ音声信号又はアナログオーディオ信号がデジタルオーディオサンプルのシーケンスに変換される。逆に、受信端では、再構成デジタル信号サンプルをスピーカ再生のための連続時間アナログ信号に変換する最終D/A変換ステップが通常実行される。
しかし、従来の音声又はオーディオ信号の伝送システムは、伝送誤りを受け、1つ又はいくつかの伝送フレームが受信側で再構成のため利用できない状況になる場合がある。この場合、デコーダは利用不可となった各フレームの代替信号を生成する必要がある。これは、受信側のデコーダにおける、いわゆるオーディオフレーム損失コンシールメント(audio frame loss concealment)ユニットで実行される。フレーム損失コンシールメントの目的は、フレーム損失を可能な限り聴き取れないようにし、それにより、フレーム損失が再構成信号の品質に与える影響を軽減することである。
従来のフレーム損失コンシールメント方法は、コーデックの構造又はアーキテクチャに依存して、例えば過去に受信されたコーデックパラメータを反復して適用するというものである。そのようなパラメータ反復技術は、使用されるコーデックの特定のパラメータに明らかに依存しており、従って、異なる構造を有する他のコーデックには容易に適用することはできない。従来のフレーム損失コンシールメント方法は、損失フレームに対する代替フレームを生成するために、例えば過去に受信されたフレームのパラメータのフリーズと外挿を行うというものがある。AMR又はAMR−WBなどの標準化された線形予測コーデックのような多くのパラメトリック音声コーデックは、通常、デコーダのために、過去に受信されたパラメータをフリーズするか又はそれらの外挿を使用する。本質的には、この原理は、符号化/復号化のために所定のモデルを設定し、フリーズされたパラメータ又は外挿されたパラメータによって同一のモデルを適用するというものである。
多くのコーデックは、周波数領域変換の後にスペクトルパラメータに符号化モデルが適用される周波数領域符号化技術を適用する。デコーダは、受信したパラメータから信号スペクトルを再構成し、スペクトルを変換して時間信号に戻す。通常、時間信号はフレームごとに再構成される。そのようなフレームは、オーバラップ加算技術により合成され、他の可能な処理を経て最終的な再構成信号が形成される。対応するオーディオフレーム損失コンシールメントは、損失フレームに対して同一の又は少なくとも類似する復号化モデルを適用する。ここで、過去に受信されたフレームからの周波数領域パラメータがフリーズされるか又は適切に外挿され、その後、周波数/時間領域変換で使用される。
しかし、従来のオーディオフレーム損失コンシールメント方法では、品質の不足が問題となる。これは、パラメータのフリーズ、外挿技術や損失フレーム対しても同一のデコーダモデルを再適用することによって、必ずしも、過去に復号化された信号フレームから損失フレームへの円滑かつ忠実な信号発展(signal evolution)が保証されるものではないからである。そのため、可聴信号はしばしば不連続になり、品質にも影響が出る。したがって、品質低下を抑えることができるオーディオフレーム損失コンシールメントが望まれ、必要である。
本発明の実施形態の目的は、上記した課題の少なくともいくつかを解決することである。この目的及びその他の目的は、添付の独立請求項に記載の方法及び装置、並びに従属請求項に記載の態様により達成される。
一側面によれば、実施形態により、損失オーディオフレームのコンシールメントを行う方法が提供される。方法は、過去に受信又は再構成されたオーディオ信号の一部分の正弦波分析であって、前記オーディオ信号の正弦波成分の周波数を特定することを含む正弦波分析を行うステップを含む。更に、前記過去に受信又は再構成されたオーディオ信号のセグメントであって、損失オーディオフレームの代替フレームを生成するためにプロトタイプフレームとして使用されるセグメントに、正弦波モデルが適用される。前記代替フレームの生成は、対応する前記特定された周波数に応じて、前記損失オーディオフレームの時間インスタンスまでの前記プロトタイプフレームの正弦波成分を時間発展させることを含む。
第2の側面によれば、実施形態により、受信オーディオ信号の損失オーディオフレームのコンシールメントを行うデコーダが提供される。これにより前記デコーダは、過去に受信又は再構成されたオーディオ信号の一部分の正弦波分析であって、前記オーディオ信号の正弦波成分の周波数を特定することを含む正弦波分析を行う。前記デコーダは、前記過去に受信又は再構成されたオーディオ信号のセグメントであって、損失オーディオフレームの代替フレームを生成するためにプロトタイプフレームとして使用されるセグメントに、正弦波モデルを適用し、対応する前記特定された周波数に応じて、前記損失オーディオフレームの時間インスタンスまでの前記プロトタイプフレームの正弦波成分を時間発展させることにより、前記損失オーディオフレームの前記代替フレームを生成する。
第3の側面によれば、実施形態により、受信オーディオ信号の損失オーディオフレームのコンシールメントを行うデコーダが提供される。前記デコーダは、符号化オーディオ信号を受信する入力ユニットと、フレーム損失コンシールメントユニットとを有する。前記フレーム損失コンシールメントユニットは、過去に受信又は再構成されたオーディオ信号の一部分の正弦波分析であって、前記オーディオ信号の正弦波成分の周波数を特定することを含む正弦波分析を行う手段を含む。前記フレーム損失コンシールメントユニットは、前記過去に受信又は再構成されたオーディオ信号のセグメントであって、損失オーディオフレームの代替フレームを生成するためにプロトタイプフレームとして使用されるセグメントに、正弦波モデルを適用する手段を含む。前記フレーム損失コンシールメントユニットは、更に、対応する前記特定された周波数に応じて、前記損失オーディオフレームの時間インスタンスまでの前記プロトタイプフレームの正弦波成分を時間発展させることにより、前記損失オーディオフレームの前記代替フレームを生成する手段を含む。
デコーダは、携帯電話等の装置に実装されうる。
第4の側面によれば、実施形態により、上記第2及び第3の側面のうちのいずれかによるデコーダを有する受信機が提供される。
第5の側面によれば、実施形態により、損失オーディオフレームのコンシールメントのために定義されるコンピュータプログラムが提供される。コンピュータプログラムは、プロセッサによって実行されると、前記プロセッサに、上記第1の側面に従う損失オーディオフレームのコンシールメントを実行させるための命令を含む。
第6の側面によれば、実施形態により、上記第5の側面に従うコンピュータプログラムを格納したコンピュータ読み取り可能な媒体を含むコンピュータプログラム製品が提供される。
本明細書に記載される実施形態の利点は、オーディオ信号(例えば符号化音声)の伝送におけるフレーム損失による聴感への影響を軽減できるフレーム損失コンシールメントが提供されることである。一般的な利点は、損失フレームに対する再構成信号の円滑かつ忠実な発展(evolution)が提供されることである。フレーム損失の音質への影響は、従来技術と比べて大幅に低減される。
以下の説明及び添付の図面を読めば、本願実施形態の内容のさらなる特徴及び利点が明らかになろう。
代表的な窓関数を示す図。 特定の窓関数を示す図。 窓関数の振幅スペクトルの一例を示す図。 周波数fkの例示的な正弦波信号の線スペクトルを示す図。 周波数fkの窓掛け後の正弦波信号のスペクトルを示す図。 分析フレームに基づくDFTのグリッドポイントの大きさに対応するバーを示す図。 DFTグリッドポイントを通るパラボラフィッティングを示す図。 実施形態に係る方法のフローチャート。 実施形態におけるデコーダを示す図。 実施形態におけるコンピュータプログラム及びコンピュータプログラム製品を示す図。
以下、本発明の実施形態を詳しく説明する。より深い理解に資するべく、特定の状況、技術といった特定の詳細説明を行うが、これらに限定されるものではない。
また、以下で示される例示の方法及び装置の少なくとも一部は、プログラムされたマイクロプロセッサ、汎用コンピュータ、あるいは特定用途集積回路(ASIC)と共に機能するソフトウェアの使用によって実現されうることは明らかである。さらに、実施形態の少なくとも一部が、コンピュータプログラム製品として、あるいは、コンピュータプロセッサ及び、そのプロセッサに接続され、下記の機能を実行可能な1つ以上のプログラムを含むメモリとを含むシステムとして、実現されうる。
以下の実施形態の概念は、損失オーディオフレームのコンシールメントを行う方法であって、
- 過去に受信又は再構成されたオーディオ信号の少なくとも一部分の正弦波分析であって、前記オーディオ信号の正弦波成分の周波数を特定することを含む正弦波分析を行い、
- 前記過去に受信又は再構成されたオーディオ信号のセグメントであって、損失オーディオフレームの代替フレームを生成するためにプロトタイプフレームとして使用されるセグメントに、正弦波モデルを適用し、
- 対応する前記特定された周波数に応じて、前記損失オーディオフレームの時間インスタンスまでの前記プロトタイプフレームの正弦波成分を時間発展させることにより、前記代替フレームを生成する
ことにより、損失オーディオフレームのコンシールメントを行うものである。
正弦波分析
実施形態に係るフレーム損失コンシールメントは、過去に受信又は再構成されたオーディオ信号の一部分の正弦波分析(sinusoidal analysis)を含む。この正弦波分析の目的は、その信号の主正弦波成分(すなわち正弦波(sinusoids))の周波数を特定することである。これは、オーディオ信号は正弦波モデルによって生成され、限定された数の個別の正弦波から構成されていること、すなわち、オーディオ信号が以下に示すマルチ正弦波信号であることが、基本的な前提となっている。
Figure 2016511433
・・・(6.1)
ただし、Kは、信号を構成すると想定される正弦波の数である。添字k=1…Kの各正弦波に対して、akは振幅、fkは周波数、φkは位相である。サンプリング周波数はfsで表され、時間離散信号サンプルs(n)の時間インデックスはnで表される。
可能な限り正確な正弦波の周波数を特定することが重要である。理想的な正弦波信号は線周波数fkの線スペクトルを有すると考えられるが、その真の値を特定するには、原理上、無限の測定時間が必要になるであろう。従って、実際には、本明細書において説明される正弦波分析に使用される信号セグメントに対応する短時間の測定に基づいて線周波数を推定することしかできないので、線周波数を特定するのは難しい。以下の説明中、この信号セグメントは分析フレームと呼ばれる。別の困難な問題は、信号が実際には時変信号であり、上記の式のパラメータが時間の経過に伴って変動するということである。そこで、測定をより正確にするためには長い分析フレームを使用することが望ましいが、起こりうる信号変動に更に適切に対応するためには、測定時間を短縮することが必要になる。その適切なトレードオフとしては、例えば20〜40ms程度の長さの分析フレームを使用することである。
好適な実施形態によれば、正弦波の周波数fkは、分析フレームの周波数領域分析によって特定される。この目的を達成するために、例えばDFT(Discrete Fourier Transform)又はDCT(Discrete Cosine Transform)、あるいは類似の周波数領域変換により、分析フレームは周波数領域に変換される。分析フレームのDFTが使用される場合、スペクトルは次式により表される。
Figure 2016511433
・・・(6.2)
ただし、w(n)は、長さLの分析フレームを抽出し重み付けする窓関数を表す。
図1は、典型的な窓関数を示している。これは、n∈[0…L−1]に対して1であり、その他の場合は0である方形窓である。過去に受信されたオーディオ信号の時間指標は、分析フレームが時間指標n=0…L−1により参照されるように設定されると想定する。スペクトル分析に更に適すると思われる他の窓関数としては、例えばハミング窓、ハニング窓、カイザー窓又はブラックマン窓がある。
図2は、ハミング窓と方形窓との組み合わせによる、とりわけ有用な窓関数を示している。図2に示されるように、この窓は、長さL1のハミング窓の左半分のような立ち上がり端形状及び長さL1のハミング窓の右半分のような立ち下がり端形状を有し、立ち上がり端と立ち下がり端との間で、窓は、長さL−L1の場合に1に等しい。
窓分析フレーム|X(m)|の振幅スペクトルのピークは、必要とされる正弦波周波数fkの近似を構成する。しかし、この近似の正確度は、DFTの周波数間隔により限定される。ブロック長LのDFTの場合、正確度はfs/(2L)に限定される。
しかし、このレベルの正確度は、本明細書において説明される方法の範囲内では低すぎるかもしれない。以下のことを考慮した結果に基づき、正確度の改善を得ることができる。
窓分析フレームのスペクトルは、正弦波モデル信号S(Ω)の線スペクトルによる窓関数のスペクトルの畳み込みと、その後に続く次式のDFTのグリッドポイントにおけるサンプリングによって与えられる。
Figure 2016511433
・・・(6.3)
正弦波モデル信号のスペクトル表現を使用することにより、これを次のように書き換えることができる。
Figure 2016511433
・・・(6.4)
従って、サンプリングされたスペクトルは次式により表される。
Figure 2016511433
・・・(6.5)
ただし、m=0…L−1
これに基づき、分析フレームの振幅スペクトルにおいて観測されるピークは、それらのピークの近傍で真の正弦波周波数が特定されるK個の正弦波を含む窓掛け後正弦波信号に由来するものと想定される。したがって、正弦波成分の周波数を特定することは、使用される周波数領域変換に関するスペクトルのピークの付近における周波数を特定することをを更に含みうる。
観測されたk番目のピークのDFTインデックス(グリッドポイント)をmkとすると、対応する周波数は、
Figure 2016511433
であり、これは、真の正弦波周波数fkの近似であるとみなすことができる。真の正弦波周波数fkは、区間
Figure 2016511433
の中にあると想定できる。
なお、明確にするため、正弦波モデル信号の線スペクトルのスペクトルによる窓関数のスペクトルの畳み込みは、窓関数スペクトルの周波数シフトバージョンの重畳であると理解することができ、このため、シフト周波数は正弦波の周波数である。次に、この重畳はDFTグリッドポイントでサンプリングされる。窓関数のスペクトルと正弦波モデル信号の線スペクトルのスペクトルとの畳み込みが、図3〜図7に示される。図3は窓関数の振幅スペクトルの一例を示す。図4は、周波数の1つの正弦波と共に正弦波信号の一例の振幅スペクトル(線スペクトル)を示す。図5は、正弦波の周波数における周波数シフト窓スペクトルを再現し、重畳する窓掛け後正弦波信号の振幅スペクトルを示す。図6の点線は、分析フレームのDFTを計算することにより取得された窓掛け後正弦波におけるDFTのグリッドポイントの振幅に対応する。なお、すべてのスペクトルは正規化周波数パラメータΩによって周期的である。ここで、Ωは、サンプリング周波数fsに対応する2πである。
上記の議論に基づき、また、図6の記載に基づき、探索の分解能を、使用される周波数領域変換の周波数分解能より高くなるように増加させることにより、真の正弦波周波数のより良い近似を得ることができる。
したがって、正弦波成分の周波数の特定は、使用される周波数領域変換の周波数分解能より高い分解能で行われることが好ましく、この特定は、更に補間を含むことができる。
正弦波の周波数fkの更によい近似を発見する好適な方法の1つは、放物線補間(parabolic interpolation)を適用することである。そのような方式の1つは、ピークを取り囲むDFT振幅スペクトルのグリッドポイントを通してパラボラフィッティングを行い、放物線最大値に属する各々の周波数を計算することである。放物線の次の例示の適切な選択肢は2である。詳細には、以下の手順を適用することができる。
1)窓掛け後分析フレームのDFTのピークを特定する。ピーク探索はピークの数K及びピークの対応するDFTインデックスを出力する。ピーク探索は、通常、DFT振幅スペクトル又は対数DFT振幅スペクトルに対して実行可能である。
2)対応するDFTインデックスmkを有するピークk(k=1…K)ごとに、3つのポイント
Figure 2016511433
を通してパラボラフィッティングを行う。その結果、次式により定義される放物線の放物線係数bk(0)、bk(1)、bk(2)が得られる。
Figure 2016511433
図7は、グリッドポイントP1,P2,P3を通るパラボラフィッティングを示している。
3)K個の放物線の各々に対して、その放物線が最大値を有するqの値に対応する補間周波数インデックス
Figure 2016511433
を計算する。正弦波周波数fkの近似として
Figure 2016511433
を使用する。
正弦波モデルの適用
以下、実施形態に係るフレーム損失コンシールメント演算を実行するための正弦波モデルの適用について説明する。
対応する符号化情報が利用不可能であるため、すなわちフレームが消失したため、符号化信号の所定のセグメントをデコーダにより再構成できない場合、このセグメントより過去の信号の利用可能な部分を、プロトタイプフレームとして使用できる。y(n)(ただし、n=0…N−1)を、代替フレームz(n)が生成されなければならない利用不可能セグメントであるとし、n<0の場合のy(n)を、過去に復号された利用可能信号であるとすると、長さL及び開始インデックスn-1の利用可能信号のプロトタイプフレームが窓関数w(n)によって抽出され、例えば次式のDFTによって周波数領域に変換される。
Figure 2016511433
窓関数は、先に正弦波分析に関して説明した窓関数のうち1つでありうる。数値の複雑さを軽減するために、周波数領域変換後のフレームは、正弦波分析において使用されるフレームと同一であるのが好ましい。
次のステップにおいて、想定正弦波モデルが適用される。想定正弦波モデルによれば、プロトタイプフレームのDFTを次のように書き表すことができる。
Figure 2016511433
この式は、分析部においても使用される。以下詳しく説明する。
次に、使用される窓関数のスペクトルが0にごく近い周波数範囲において重大な寄与をすると理解される。図3に示されるように、窓関数の振幅スペクトルは、0にごく近い周波数に対しては大きく、そうでない周波数に対しては小さい(サンプリング周波数の2分の1に対応する−π〜πの正規化周波数範囲内)。従って、近似として、窓スペクトルW(m)は、区間M=[−mmin,mmax](mmin及びmmaxは小さな正の整数)に対してのみ0ではないと仮定する。特に、窓関数スペクトルの近似は、kごとに、上記の式中のシフトされた窓スペクトルの寄与が厳密に互いに重なり合わないように使用される。上記の式において、周波数インデックスごとに、1つの被加数からの、すなわち1つのシフトされた窓スペクトルからの寄与のみが常に最大である。これは、上記の式が下記の近似式に縮小されることを意味する。
非負であるm∈Mkに対して、kごとに、
Figure 2016511433
ここで、Mkは、整数区間
Figure 2016511433
を示し、mmin,k及びmmax,kは、区間が互いに重なり合わないようにするという先に説明した制約に適合する。mmin,k及びmmax,kの適切な選択は、それらの値を小さな整数値δ、例えばδ=3に設定することである。しかし、2つの隣接する正弦波周波数fk及びfk+1に関連するDFTインデックスが2δより小さい場合、区間が重なり合わないことが保証されるように、δは、
Figure 2016511433
に設定される。関数floor(・)は、それ以下である関数引数に最も近い整数である。
一実施形態による次のステップは、上記の式による正弦波モデルを適用し、そのK個の正弦波を時間的に発展(evolve)させることである。プロトタイプフレームの時間インデックスと比較して、消去セグメントの時間インデックスはn-1サンプルだけ異なるという仮定は、正弦波の位相が
Figure 2016511433
だけ進んでいることを意味する。従って、発展させた正弦波モデルのDFTスペクトルは次式により表される。
Figure 2016511433
シフトされた窓関数スペクトルが互いに重なり合わないという近似を再び適用すると、非負であるm∈Mkに対して、kごとに以下の式が得られる。
Figure 2016511433
近似を使用することにより、プロトタイプフレームY-1Y(m)のDFTを、発展させた正弦波モデルY0(m)のDFTと比較すると、m∈Mkごとに位相が
Figure 2016511433
だけシフトされる間、振幅スペクトルは不変のままであることがわかる。
従って、次式により代替フレームを計算できる。
非負のm∈Mkに対して、kごとに、
Figure 2016511433
とし、
Figure 2016511433
特定の一実施形態は、どの区間Mkにも属さないDFTインデックスに関する位相ランダム化に対処する。先に説明したように、区間Mk,k=1…Kは、それらの区間が厳密に重なり合わないように設定されなければならず、これは、区間のサイズを制御する何らかのパラメータδを使用して実行される。2つの隣接する正弦の周波数距離に関連して、δが小さいということが起こりうる。従って、その場合、2つの区間の間に隙間ができることもありうる。そのため、対応するDFTインデックスmに対して、上記の式
Figure 2016511433
に従った位相シフトは定義されない。本実施形態による適切な選択肢は、それらのインデックスに対して位相をランダム化することであり、その結果、
Figure 2016511433
となる。ここで、関数rand(・)は何らかの乱数を返す。
上記に基づいて、実施形態に係る例示のオーディオフレーム損失コンシールメント方法を、図8に示す。
ステップ81において、過去に受信又は再構成されたオーディオ信号の一部分の正弦波分析が実行される。ここで、正弦波分析は、オーディオ信号の正弦波成分(すなわち正弦波(sinusoids))の周波数を特定することを含む。次に、ステップ82において、過去に受信又は再構成されたオーディオ信号のセグメントに正弦波モデルが適用される。ここで、セグメントは、損失オーディオフレームの代替フレームを生成するためのプロトタイプフレームとして使用される。そして、ステップ83で、損失オーディオフレームの代替フレームが生成される。ここでは、対応する上記特定された周波数に応じて、損失オーディオフレームの時間インスタンス(time instance)までの、プロトタイプフレームの正弦波成分(すなわち正弦波(sinusoids))を時間発展(time-evolution)させることを含む。
他の実施形態によれば、オーディオ信号は限定された数の個別の正弦波成分から構成され、正弦波分析は周波数領域で行われると想定される。さらに、正弦波成分の周波数の特定は、使用される周波数領域変換に関するスペクトルのピークの付近における周波数を特定することを含みうる。
例示の実施形態によれば、正弦波成分の周波数の特定は、使用される周波数領域変換の分解能より高い分解能で行われ、この特定は、放物線型などの補間を更に含みうる。
例示の実施形態によれば、方法は、窓関数を用いて、使用可能な過去に受信又は再構成された信号からプロトタイプフレームを抽出することを含む。ここで、抽出されたプロトタイプフレームは、周波数領域表現に変換されうる。
さらなる実施形態によれば、窓関数のスペクトルの近似であって、代替フレームスペクトルが当該近似された窓関数スペクトルの部分と一切重複しないような近似を含む。
さらなる実施形態によれば、方法は、正弦波成分の位相を、当該正弦波成分の周波数に応じて、かつ、損失オーディオフレームとプロトタイプフレームとの間の時間差に応じて進めることにより、プロトタイプフレームの周波数スペクトルの正弦波成分を時間発展させることを含み、また、正弦波周波数fk、並びに、損失オーディオフレームとプロトタイプフレームとの間の時間差に比例する位相シフトにより、正弦波kの付近における区間Mkに含まれるプロトタイプフレームのスペクトル係数を変更することを含む。
さらなる実施形態は、特定された正弦波に属していないプロトタイプフレームのスペクトル係数の位相をランダム位相によって変更すること、又は、その特定された正弦波の付近に関連するいずれの区間にも含まれないプロトタイプフレームのスペクトル係数の位相をランダム値によって変更することを含む。
実施形態は更に、プロトタイプフレームの周波数スペクトルの逆周波数領域変換を含む。
具体的には、さらなる実施形態に従うオーディオフレーム損失コンシールメント方法は、以下のステップを含むことができる。
1)使用可能な過去に合成された信号のセグメントを分析して正弦波モデルの組成正弦波周波数fkを得る。
2)使用可能な過去に合成された信号からプロトタイプフレームy-1を抽出しそのフレームのDFTを計算する。
3)正弦波周波数fkと、プロトタイプと代替フレームとの間の時間進みn-1とに応じて、正弦波kごとに、位相シフトθkを計算する。
4)正弦波kごとに、正弦波周波数fkの付近に関連するDFTインデックスについて選択的に、プロトタイプフレームDFTの位相をθkだけ進める。
5)4)で得られたスペクトルの逆DFTを計算する。
上述の実施形態は、更に以下の想定により説明される。
a)信号が、限定された数の正弦波により表現されうる、という想定。
b)代替フレームは、時間発展されたこれらの正弦波によって、過去の時間インスタントと比べて、十分良好に表現される、という想定。
c)シフト周波数を正弦波周波数とし、周波数シフトされた窓関数スペクトルの非オーバラップ部分によって代替フレームのスペクトルが構成されうるように、窓関数のスペクトルが近似される、という想定。
図9は、実施形態に従うオーディオフレーム損失コンシールメントの方法を実行する例示のデコーダ1を示すブロック図である。図示のデコーダは、1又は2以上のプロセッサ11と、適切なソフトウェアを含む記憶部又はメモリ12とを含む。入力される符号化オーディオ信号は、プロセッサ11及びメモリ12に接続される入力部(IN)により受信される。ソフトウェアから得られた、復号化され再構成されたオーディオ信号は、出力部(OUT)から出力される。例示のデコーダは、受信オーディオ信号の損失オーディオフレームのコンシールメントを行うように構成され、プロセッサ11及びメモリ12を有する。メモリは、プロセッサ11によって実行可能な命令を含んでいる。これにより、デコーダ1は、
- 過去に受信又は再構成されたオーディオ信号の一部分の正弦波分析であって、オーディオ信号の正弦波成分の周波数を特定することを含む正弦波分析を行い、
- 過去に受信又は再構成されたオーディオ信号のセグメントであって、損失オーディオフレームの代替フレームを生成するためにプロトタイプフレームとして使用されるセグメントに、正弦波モデルを適用し、
- 対応する上記特定された周波数に応じて、損失オーディオフレームの時間インスタンスまでのプロトタイプフレームの正弦波成分を時間発展させることにより、損失オーディオフレームの代替フレームを生成する。
デコーダの更なる実施形態によれば、適用される正弦波モデルは、オーディオ信号は限定された数の個別の正弦波成分で構成されることを前提としており、また、オーディオ信号の正弦波成分の周波数を特定することは、放物線補間を更に含みうる。
さらなる実施形態によれば、デコーダは、窓関数を用いて、使用可能な過去に受信又は再構成された信号からプロトタイプフレームを抽出し、また、抽出されたプロトタイプフレームを周波数領域に変換する。
さらなる実施形態によれば、デコーダは、正弦波成分の位相を、各正弦波成分の周波数に応じて、かつ、損失オーディオフレームとプロトタイプフレームとの間の時間差に応じて進めることにより、プロトタイプフレームの周波数スペクトルの正弦波成分を時間発展させ、また、周波数スペクトルの逆周波数変換を行うことにより代替フレームを生成する。
別の実施形態に係るデコーダを図10aに示す。このデコーダは、符号化オーディオ信号を受信する入力部を備える。同図において、論理フレーム損失コンシールメントユニット13によるフレーム損失コンシールメントが行われる。ここで、デコーダ1は、上述した実施形態に従う損失オーディオフレームのコンシールメントを実行する。図10bにも示されている論理フレーム損失コンシールメントユニット13は、損失オーディオフレームのコンシールメントを行う適切な手段、すなわち、過去に受信又は再構成されたオーディオ信号の一部分の正弦波分析であって、オーディオ信号の正弦波成分の周波数を特定することを含む正弦波分析を行う手段14と、上記過去に受信又は再構成されたオーディオ信号のセグメントであって、損失オーディオフレームの代替フレームを生成するためにプロトタイプフレームとして使用されるセグメントに、正弦波モデルを適用する手段15と、対応する上記特定された周波数に応じて、損失オーディオフレームの時間インスタンスまでのプロトタイプフレームの正弦波成分を時間発展させることにより、損失オーディオフレームの代替フレームを生成する手段16とを含む。
図示のデコーダに含まれるユニット及び手段は、その少なくとも一部がハードウェアに実装されうるものであり、デコーダのユニットの機能を実現するように使用され又は組み合わされうる回路要素の種々の変形がある。それらの変形は実施形態に包含される。デコーダのハードウェア実現の特定の例として、デジタル信号処理プロセッサ(DSP)ハードウェア及び集積回路技術による実現がある。ここには汎用電子回路及び特定用途回路の双方が含まれる。
本発明の実施形態に係るコンピュータプログラムは、プロセッサによって実行されると、当該プロセッサに、図8に沿って説明した手順に従う方法を実行させる命令を含む。図11は、実施形態に係るコンピュータプログラム製品9を示している。これは、EEPROM(Electrically Erasable Programmable Read-Only Memory)、フラッシュメモリ、あるいはディスクドライブといった、不揮発性メモリの形式で実現されうる。コンピュータプログラム製品は、コンピュータプログラム91を格納したコンピュータ読み取り可能な媒体を含む。ここで、コンピュータプログラム91は、デコーダ1で実行されると、デコーダのプロセッサに、図8に従う手順を実行させるプログラムモジュール91a,b,c,dを含む。
本発明の実施形態によるデコーダは、携帯電話やラップトップ等の移動体装置の受信機、あるいは、パーソナルコンピュータ等の固定式装置の受信機に使用されうる。
本明細書に記載した実施形態の利点は、符号化音声等のオーディオ信号の伝送におけるフレーム損失の聴感上の影響を軽減することができるフレーム損失コンシールメント方法が提供されることである。一般的な利点は、損失フレームに対して再構成される信号の円滑かつ忠実な発展(evolution)が提供されることである。フレーム損失の聴感上の影響は、従来技術と比べて大幅に低減される。
相互に作用するユニット又はモジュールの選択、並びにそれらのユニットの名前は単なる例であり、開示される処理動作を実行可能にするために複数の代替方法で構成されうることは理解されよう。なお、本明細書において説明されるユニット又はモジュールは、必ずしも個別の物理エンティティではなく、論理エンティティとしてみなされるべきものである。本明細書において開示される技術の範囲は、当業者には自明であると思われる他の実施形態をすべて含み、それに従って、本明細書の開示の範囲が限定されるべきではないことが理解されるだろう。

Claims (26)

  1. 受信オーディオ信号の損失オーディオフレームのコンシールメントを行う方法であって、
    過去に受信又は再構成されたオーディオ信号の一部分の正弦波分析であって、前記オーディオ信号の正弦波成分の周波数を特定することを含む正弦波分析を行うステップ(81)と、
    前記過去に受信又は再構成されたオーディオ信号のセグメントであって、損失オーディオフレームの代替フレームを生成するためにプロトタイプフレームとして使用されるセグメントに、正弦波モデルを適用するステップ(82)と、
    対応する前記特定された周波数に応じて、前記損失オーディオフレームの時間インスタンスまでの前記プロトタイプフレームの正弦波成分を時間発展させることを含む、前記損失オーディオフレームの前記代替フレームを生成するステップ(83)と、
    を有することを特徴とする方法。
  2. 前記オーディオ信号は限定された数の個別の正弦波成分から構成されることが想定されていることを特徴とする請求項1に記載の方法。
  3. 前記正弦波分析は周波数領域で行われることを特徴とする請求項1又は2に記載の方法。
  4. 前記正弦波成分の周波数を特定することは、更に、使用される周波数領域変換に関するスペクトルのピークの付近における周波数を特定することを含むことを特徴とする請求項3に記載の方法。
  5. 前記正弦波成分の周波数を特定することは、前記使用される周波数領域変換の周波数分解能よりも高い分解能で行われることを特徴とする請求項3又は4に記載の方法。
  6. 前記正弦波成分の周波数を特定することは、補間を更に含むことを特徴とする請求項5に記載の方法。
  7. 前記補間は放物線型であることを特徴とする請求項6に記載の方法。
  8. 窓関数を用いて、使用可能な過去に受信又は再構成された信号からプロトタイプフレームを抽出するステップを更に有することを特徴とする請求項1乃至7のいずれか1項に記載の方法。
  9. 前記抽出されたプロトタイプフレームを周波数領域表現に変換するステップを更に有することを特徴とする請求項8に記載の方法。
  10. 前記窓関数のスペクトルの近似であって、代替フレームスペクトルが当該近似された窓関数のスペクトルの部分と一切重複しないような近似を更に含むことを特徴とする請求項9に記載の方法。
  11. 正弦波成分の位相を、当該正弦波成分の周波数に応じて、かつ、前記損失オーディオフレームとプロトタイプフレームとの間の時間差に応じて進めることにより、前記プロトタイプフレームの周波数スペクトルの正弦波成分を時間発展させるステップを更に有することを特徴とする請求項9又は10に記載の方法。
  12. 正弦波周波数fk、並びに、前記損失オーディオフレームと前記プロトタイプフレームとの間の時間差に比例する位相シフトにより、正弦波kの付近における区間Mkに含まれる前記プロトタイプフレームのスペクトル係数を変更するステップを更に有することを特徴とする請求項9乃至11のいずれか1項に記載の方法。
  13. 特定された正弦波に属していない前記プロトタイプフレームのスペクトル係数の位相をランダム位相によって変更するステップを更に有することを特徴とする請求項9乃至12のいずれか1項に記載の方法。
  14. 前記特定された正弦波の付近に関連するいずれの区間にも含まれない前記プロトタイプフレームのスペクトル係数の位相をランダム位相によって変更するステップを更に有することを特徴とする請求項9乃至12のいずれか1項に記載の方法。
  15. 前記プロトタイプフレームの前記周波数スペクトルの逆周波数領域変換を含むことを特徴とする請求項9乃至14のいずれか1項に記載の方法。
  16. 受信オーディオ信号の損失オーディオフレームのコンシールメントを行うデコーダ(1)であって、
    前記デコーダは、プロセッサ(11)と、前記プロセッサ(11)によって実行可能な命令を含むメモリ(12)とを含み、
    これにより前記デコーダは、
    過去に受信又は再構成されたオーディオ信号の一部分の正弦波分析であって、前記オーディオ信号の正弦波成分の周波数を特定することを含む正弦波分析を行い、
    前記過去に受信又は再構成されたオーディオ信号のセグメントであって、損失オーディオフレームの代替フレームを生成するためにプロトタイプフレームとして使用されるセグメントに、正弦波モデルを適用し、
    対応する前記特定された周波数に応じて、前記損失オーディオフレームの時間インスタンスまでの前記プロトタイプフレームの正弦波成分を時間発展させることにより、前記損失オーディオフレームの前記代替フレームを生成する
    ことを特徴とするデコーダ。
  17. 前記適用された正弦波モデルは、前記オーディオ信号が限定された数の個別の正弦波成分から構成されることを想定したものであることを特徴とする請求項16に記載のデコーダ。
  18. 前記オーディオ信号の正弦波成分の周波数を特定することは、放物線補間を更に含むことを特徴とする請求項15又は16に記載のデコーダ。
  19. 更に、窓関数を用いて、使用可能な過去に受信又は再構成された信号からプロトタイプフレームを抽出することを特徴とする請求項15乃至18のいずれか1項に記載のデコーダ。
  20. 更に、前記抽出されたプロトタイプフレームを周波数領域に変換することを特徴とする請求項19に記載のデコーダ。
  21. 更に、前記正弦波成分の位相を、各正弦波成分の周波数に応じて、かつ、前記損失オーディオフレームとプロトタイプフレームとの間の時間差に応じて進めることにより、前記プロトタイプフレームの周波数スペクトルの正弦波成分を時間発展させることを特徴とする請求項20に記載のデコーダ。
  22. 更に、前記周波数スペクトルの逆周波数変換を行うことにより前記代替フレームを生成することを特徴とする請求項21に記載のデコーダ。
  23. 受信オーディオ信号の損失オーディオフレームのコンシールメントを行うデコーダ(1)であって、
    前記デコーダは、符号化オーディオ信号を受信する入力ユニットと、フレーム損失コンシールメントユニット(13)とを有し、
    前記フレーム損失コンシールメントユニットは、
    過去に受信又は再構成されたオーディオ信号の一部分の正弦波分析であって、前記オーディオ信号の正弦波成分の周波数を特定することを含む正弦波分析を行う手段(14)と、
    前記過去に受信又は再構成されたオーディオ信号のセグメントであって、損失オーディオフレームの代替フレームを生成するためにプロトタイプフレームとして使用されるセグメントに、正弦波モデルを適用する手段(15)と、
    対応する前記特定された周波数に応じて、前記損失オーディオフレームの時間インスタンスまでの前記プロトタイプフレームの正弦波成分を時間発展させることにより、前記損失オーディオフレームの前記代替フレームを生成する手段(16)と、
    を含むことを特徴とするデコーダ。
  24. 請求項16乃至23のいずれか1項に記載のデコーダを有する受信機。
  25. プロセッサによって実行されると、前記プロセッサに、請求項1乃至15のいずれか1項に記載の方法を実行させる命令を有するコンピュータプログラム(91)。
  26. 請求項25に記載のコンピュータプログラム(91)を格納したコンピュータ読み取り可能な媒体を含むコンピュータプログラム製品(9)。
JP2015555963A 2013-02-05 2014-01-22 オーディオフレーム損失コンシールメント Active JP5978408B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361760814P 2013-02-05 2013-02-05
US61/760,814 2013-02-05
PCT/SE2014/050067 WO2014123470A1 (en) 2013-02-05 2014-01-22 Audio frame loss concealment

Publications (2)

Publication Number Publication Date
JP2016511433A true JP2016511433A (ja) 2016-04-14
JP5978408B2 JP5978408B2 (ja) 2016-08-24

Family

ID=50113007

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015555963A Active JP5978408B2 (ja) 2013-02-05 2014-01-22 オーディオフレーム損失コンシールメント

Country Status (13)

Country Link
US (4) US9847086B2 (ja)
EP (6) EP3866164B1 (ja)
JP (1) JP5978408B2 (ja)
KR (3) KR101855021B1 (ja)
CN (3) CN108847247B (ja)
BR (1) BR112015017222B1 (ja)
DK (3) DK2954517T3 (ja)
ES (5) ES2954240T3 (ja)
HU (2) HUE036322T2 (ja)
NZ (1) NZ709639A (ja)
PL (4) PL3333848T3 (ja)
PT (1) PT3333848T (ja)
WO (1) WO2014123470A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022521077A (ja) * 2019-02-21 2022-04-05 テレフオンアクチーボラゲット エルエム エリクソン(パブル) 周波数領域パケットロス補償のための方法、および関連デコーダ

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK2954517T3 (en) * 2013-02-05 2016-11-28 ERICSSON TELEFON AB L M (publ) HIDE OF LOST AUDIO FRAMES
NO2780522T3 (ja) 2014-05-15 2018-06-09
ES2785000T3 (es) 2014-06-13 2020-10-02 Ericsson Telefon Ab L M Gestión de errores de trama de ráfaga
KR20190008663A (ko) * 2017-07-17 2019-01-25 삼성전자주식회사 음성 데이터 처리 방법 및 이를 지원하는 시스템
AU2019437394A1 (en) * 2019-03-25 2021-10-21 Razer (Asia-Pacific) Pte. Ltd. Method and apparatus for using incremental search sequence in audio error concealment
CN116368565A (zh) * 2020-11-26 2023-06-30 瑞典爱立信有限公司 使用噪声信号比的误差隐藏单元中的噪声抑制逻辑

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050058145A1 (en) * 2003-09-15 2005-03-17 Microsoft Corporation System and method for real-time jitter control and packet-loss concealment in an audio signal

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AT362479B (de) * 1979-06-22 1981-05-25 Vianova Kunstharz Ag Verfahren zur herstellung von bindemitteln fuer die elektrotauchlackierung
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
JPH10513282A (ja) * 1995-11-22 1998-12-15 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ 言語信号再合成方法および装置
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6691092B1 (en) * 1999-04-05 2004-02-10 Hughes Electronics Corporation Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system
DE19921122C1 (de) * 1999-05-07 2001-01-25 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
US6397175B1 (en) * 1999-07-19 2002-05-28 Qualcomm Incorporated Method and apparatus for subsampling phase spectrum information
US7388853B2 (en) 2000-04-07 2008-06-17 Broadcom Corporation Method for providing dynamic adjustment of frame encoding parameters in a frame-based communications network
CN1386354A (zh) * 2000-07-25 2002-12-18 皇家菲利浦电子有限公司 受引导的判定频移估计
EP1199709A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Error Concealment in relation to decoding of encoded acoustic signals
US20040002856A1 (en) 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
US20040122680A1 (en) 2002-12-18 2004-06-24 Mcgowan James William Method and apparatus for providing coder independent packet replacement
US6985856B2 (en) 2002-12-31 2006-01-10 Nokia Corporation Method and device for compressed-domain packet loss concealment
JP4719674B2 (ja) 2003-06-30 2011-07-06 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ノイズの加算によるデコードオーディオの品質の向上
US7337108B2 (en) * 2003-09-10 2008-02-26 Microsoft Corporation System and method for providing high-quality stretching and compression of a digital audio signal
US20050091044A1 (en) 2003-10-23 2005-04-28 Nokia Corporation Method and system for pitch contour quantization in audio coding
US20050091041A1 (en) * 2003-10-23 2005-04-28 Nokia Corporation Method and system for speech coding
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
WO2005086138A1 (ja) 2004-03-05 2005-09-15 Matsushita Electric Industrial Co., Ltd. エラー隠蔽装置およびエラー隠蔽方法
US7734381B2 (en) 2004-12-13 2010-06-08 Innovive, Inc. Controller for regulating airflow in rodent containment system
KR101203244B1 (ko) 2005-01-31 2012-11-20 스카이프 통신 시스템에서 은닉 프레임들을 발생시키는 방법
US20070147518A1 (en) 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US8620644B2 (en) * 2005-10-26 2013-12-31 Qualcomm Incorporated Encoder-assisted frame loss concealment techniques for audio coding
DE102006017280A1 (de) * 2006-04-12 2007-10-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals
CN101375330B (zh) * 2006-08-15 2012-02-08 美国博通公司 丢包后解码音频信号的时间扭曲的方法
FR2907586A1 (fr) 2006-10-20 2008-04-25 France Telecom Synthese de blocs perdus d'un signal audionumerique,avec correction de periode de pitch.
CN101261833B (zh) * 2008-01-24 2011-04-27 清华大学 一种使用正弦模型进行音频错误隐藏处理的方法
CN101308660B (zh) * 2008-07-07 2011-07-20 浙江大学 一种音频压缩流的解码端错误恢复方法
EP2109096B1 (en) * 2008-09-03 2009-11-18 Svox AG Speech synthesis with dynamic constraints
ES2374008B1 (es) * 2009-12-21 2012-12-28 Telefónica, S.A. Codificación, modificación y síntesis de segmentos de voz.
US8538038B1 (en) * 2010-02-12 2013-09-17 Shure Acquisition Holdings, Inc. Audio mute concealment
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
DK2375782T3 (en) * 2010-04-09 2019-03-18 Oticon As Improvements in sound perception by using frequency transposing by moving the envelope
WO2012049659A2 (en) * 2010-10-14 2012-04-19 Centro De Investigación Y De Estudios Avanzados Del Instituto Politécnico Nacional High payload data-hiding method in audio signals based on a modified ofdm approach
JP5743137B2 (ja) * 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
DK2954517T3 (en) * 2013-02-05 2016-11-28 ERICSSON TELEFON AB L M (publ) HIDE OF LOST AUDIO FRAMES
EP3561808B1 (en) 2013-02-05 2021-03-31 Telefonaktiebolaget LM Ericsson (publ) Method and apparatus for controlling audio frame loss concealment

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050058145A1 (en) * 2003-09-15 2005-03-17 Microsoft Corporation System and method for real-time jitter control and packet-loss concealment in an audio signal

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JPN6016008306; Huan Hou: 'Real-time audio error concealment method based on sinusoidal model' Audio, Language and Image Processing, 2008. ICALIP 2008. International Conference on , 20080707, p.22-28, IEEE *
JPN6016008309; Maciej Bartkowiak: 'Mitigation of long gaps in music using hybrid sinusoidal+noise model with context adaptation' Signals and Electronic Systems (ICSES), 2010 International Conference on , 20100907, p.435-438, IEEE *
JPN6016008310; Jonas Lindblom: 'Packet loss concealment based on sinusoidal extrapolation' Acoustics, Speech, and Signal Processing (ICASSP), 2002 IEEE International Conference on , 20020513, I-173 - I-176, IEEE *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022521077A (ja) * 2019-02-21 2022-04-05 テレフオンアクチーボラゲット エルエム エリクソン(パブル) 周波数領域パケットロス補償のための方法、および関連デコーダ
JP7307805B2 (ja) 2019-02-21 2023-07-12 テレフオンアクチーボラゲット エルエム エリクソン(パブル) 周波数領域パケットロス補償のための方法、および関連デコーダ

Also Published As

Publication number Publication date
KR20160075790A (ko) 2016-06-29
EP3096314A1 (en) 2016-11-23
EP2954517B1 (en) 2016-07-27
DK3096314T3 (en) 2018-04-03
CN108847247B (zh) 2023-04-07
ES2757907T3 (es) 2020-04-30
WO2014123470A1 (en) 2014-08-14
US10339939B2 (en) 2019-07-02
US20150371642A1 (en) 2015-12-24
PT3333848T (pt) 2019-10-14
DK3576087T3 (da) 2021-05-31
US20190272832A1 (en) 2019-09-05
EP3333848A1 (en) 2018-06-13
KR20150108419A (ko) 2015-09-25
CN108564958B (zh) 2022-11-15
BR112015017222A2 (pt) 2017-07-11
EP3096314B1 (en) 2018-01-03
PL3866164T3 (pl) 2023-12-27
CN108847247A (zh) 2018-11-20
KR20180049145A (ko) 2018-05-10
NZ709639A (en) 2016-06-24
EP2954517A1 (en) 2015-12-16
BR112015017222B1 (pt) 2021-04-06
EP4276820A2 (en) 2023-11-15
EP3576087A1 (en) 2019-12-04
EP3866164B1 (en) 2023-07-19
US11482232B2 (en) 2022-10-25
ES2597829T3 (es) 2017-01-23
PL3333848T3 (pl) 2020-03-31
EP3333848B1 (en) 2019-08-21
US9847086B2 (en) 2017-12-19
ES2877213T3 (es) 2021-11-16
ES2664968T3 (es) 2018-04-24
DK2954517T3 (en) 2016-11-28
EP4276820A3 (en) 2024-01-24
KR102037691B1 (ko) 2019-10-29
ES2954240T3 (es) 2023-11-21
US20230008547A1 (en) 2023-01-12
CN104995675A (zh) 2015-10-21
HUE036322T2 (hu) 2018-06-28
PL3576087T3 (pl) 2021-10-25
PL2954517T3 (pl) 2016-12-30
CN104995675B (zh) 2018-06-29
KR101855021B1 (ko) 2018-05-04
EP3866164A1 (en) 2021-08-18
EP3576087B1 (en) 2021-04-07
US20180096691A1 (en) 2018-04-05
JP5978408B2 (ja) 2016-08-24
CN108564958A (zh) 2018-09-21
HUE045991T2 (hu) 2020-01-28

Similar Documents

Publication Publication Date Title
JP5978408B2 (ja) オーディオフレーム損失コンシールメント
JP6426626B2 (ja) 信号復号の間のフレーム損失訂正の改善
JP6789915B2 (ja) スペクトルパターンを利用することによってシヌソイドおよびスイープを効率的に合成するための装置および方法
US9478221B2 (en) Enhanced audio frame loss concealment
BR112013020587B1 (pt) esquema de codificação com base em previsão linear utilizando modelagem de ruído de domínio espectral
JP2022521494A (ja) 位相ecu f0補間スプリットのための方法および関係するコントローラ
CN111630594A (zh) 基音增强装置、其方法以及程序
JP7275217B2 (ja) 処理されたオーディオ信号表現を提供するための装置およびオーディオ信号プロセッサ、オーディオデコーダ、オーディオエンコーダ、方法、ならびにコンピュータプログラム
KR20220050924A (ko) 오디오 코딩을 위한 다중 래그 형식

Legal Events

Date Code Title Description
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20160202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160413

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160715

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160725

R150 Certificate of patent or registration of utility model

Ref document number: 5978408

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250