JP2011502287A - 音声復号化方法及び装置 - Google Patents

音声復号化方法及び装置 Download PDF

Info

Publication number
JP2011502287A
JP2011502287A JP2010532409A JP2010532409A JP2011502287A JP 2011502287 A JP2011502287 A JP 2011502287A JP 2010532409 A JP2010532409 A JP 2010532409A JP 2010532409 A JP2010532409 A JP 2010532409A JP 2011502287 A JP2011502287 A JP 2011502287A
Authority
JP
Japan
Prior art keywords
signal component
frequency
frequency signal
time
high frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010532409A
Other languages
English (en)
Other versions
JP5547081B2 (ja
Inventor
チェン、ツェー
イン、フリァン
チャン、シャオユ
ダイ、ジンリァン
チャン、リビン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from CN200810084725A external-priority patent/CN100585699C/zh
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2011502287A publication Critical patent/JP2011502287A/ja
Application granted granted Critical
Publication of JP5547081B2 publication Critical patent/JP5547081B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Abstract

音声信号復号化方法は、音声信号の低域信号成分を、受信された符号化符号ストリームに対応する音声信号が第1の帯域幅から第2の帯域幅に変換された場合に取得し、ここで、第1の帯域幅は第2の帯域幅よりも広く(S303)、高域情報を、低域信号成分から拡張して導き出し(S304)、拡張により導き出された高域情報に対して、時間と共に徐々に変化する処理を行って、処理された高域信号成分を取得し(S305)、処理された高域信号成分を、取得された低域信号成分と合成すること(S306)を含む。

Description

本開示は、音声(ボイス)通信の分野に関し、特に、音声(オーディオ)復号化の方法及び装置に関する。
G.729.1は、国際電気通信連合(ITU)によって新たに公開された、新世代の発話(スピーチ)符号化及び復号化標準である。このエンベデッド発話符号化及び復号化標準は、8kb/s〜32kb/sのレート範囲内で狭帯域から広帯域までの音声品質を提供することが可能な、レイヤード符号化の機能を有することで最も良く特徴付けられる。伝送処理の間に、外側のレイヤの符号ストリームが、チャネル状態に応じて廃棄されてもよく、従って、良好なチャネル適応が達成されることが可能である。
G.729.1標準では、レイヤリングの機能は、符号ストリームを、エンベデッドレイヤード構成の中に形成することによって達成され、従って、新規なエンベデッドレイヤードマルチレート発話コーデックが必要とされる。20msのスーパーフレームが入力される場合、サンプリングレートが16000Hzならば、フレームの長さは320ポイントである。図1は、各レイヤにおいて符号器を有するG.729.1システムのブロック図である。発話コーデックは、以下のような特定の符号化処理を有する。最初に、入力信号SWB(n)が、直交ミラーフィルタバンク(QMF)によって、2つのサブバンド(H(z)、H(z))に分割される。低域サブバンド信号Sqmf LB(n)は、50Hzのカットオフ周波数を有するハイパスフィルタにおいて前処理される。出力信号SLB(n)は、8kb/s〜12kb/s狭帯域エンベデッド符号励振線形予測(CELP)符号器によって符号化される。SLB(n)と、12Kb/sのレートにおけるCELP符号器の局所合成信号
Figure 2011502287

との間の差信号dLB(n)は、知覚重み付けフィルタ(WLB(z))を通過し、信号d LB(n)が取得される。信号d LB(n)は、周波数領域への変形離散コサイン変換(MDCT)を受ける。重み付けフィルタWLB(z)は、フィルタの出力信号d LB(n)と、高域サブバンド入力信号SHB(n)との間のスペクトル連続性を維持するための、利得補償を含む。重み付けされた差信号は、周波数領域に変換される。
高域サブバンド成分に(−1)が掛けられて、スペクトル的に反転した信号Sfold HB(n)が取得される。スペクトル的に反転した信号Sfold HB(n)は、3000HZのカットオフ周波数を有するローパスフィルタを通過した後で前処理される。フィルタリングされた信号SHB(n)は、時間領域帯域幅拡張(TDBWE)符号器において符号化される。SHB(n)が時間領域エイリアスキャンセル(TDAC)符号化モジュールに入力される前に、SHB(n)に対して周波数領域へのMDCT変換が実行される。
最後に、2組のMDCT係数D LB(k)及びSHB(k)が、TDAC符号化アルゴリズムを使用して符号化される。加えて、伝送中にフレーム損失が発生した場合に引き起こされる誤りを改善するために、いくつかのその他のパラメータがフレーム消去隠蔽(FEC)符号器によって送信される。
図2は、各レイヤにおいて復号器を有するG.729.1システムのブロック図である。復号器の動作モードは、受信された符号ストリームのレイヤの数によって、すなわち、受信レートによって決定される。受信側における異なる受信レートに基づく様々なケースについて、詳細な説明を行う。
1.受信レートが8kb/s又は12kb/sである場合(すなわち、最初のレイヤ又は最初の2つのレイヤのみが受信された場合)、エンベデッドCELP復号器が、最初のレイヤ又は最初の2つのレイヤの符号ストリームを復号化し、復号化された信号
Figure 2011502287

を取得し、ポストフィルタリングを実行して
Figure 2011502287

を取得し、この信号は、ハイパスフィルタを通過して、QMFフィルタバンクに到達する。0に設定された高域信号成分を有する、16kHz広帯域信号が合成される。
2.受信レートが14kb/sである場合(すなわち、最初の3つのレイヤが受信された場合)、CELP復号器が狭帯域成分を復号化するのに加えて、TDBWE復号器が、高域信号成分
Figure 2011502287

を復号化する。MDCT変換が、
Figure 2011502287

に対して実行され、高域サブバンド成分スペクトル内の3000Hzよりも高い周波数成分(16kHzサンプリングレートにおける7000Hzよりも高い周波数成分に対応)が0に設定され、次に、逆MDCT変換が実行される。重ね合わせ及びスペクトル反転の後、処理された高域成分が、CELP復号器によって復号化された低域成分
Figure 2011502287

と、QMFフィルタバンク内で合成されて、16kHzのサンプリングレートを有する広帯域信号が取得される。
3.受信された符号ストリームが14kb/sよりも高いレートを有する場合(最初の4つのレイヤ又はより多くのレイヤに対応)、CELP復号器が低域サブバンド成分
Figure 2011502287

を復号化によって取得し、TDBWE復号器が高域サブバンド成分
Figure 2011502287

を復号化によって取得するのに加えて、TDAC復号器が、低域サブバンド重み付け差分信号と高域サブバンドエンハンスメント信号とを復号化によって取得する。フル帯域の信号がエンハンスされ、最後に、16kHzのサンプリングレートを有する広帯域信号がQMFフィルタバンク内で合成される。
本発明の実施において、発明者らは、従来技術が少なくとも以下の問題を有することを見出した。
G.729.1符号ストリームは、レイヤード構成を有する。伝送処理の間に、外側のレイヤの符号ストリームが、チャネル伝送機能に応じて外側から内側への順で廃棄されてもよく、従って、チャネル状態への適応が達成されることが可能である。符号化及び復号化アルゴリズムについての説明から、チャネル容量が時間の経過と共に速く変化する場合、復号器は、復号化された信号が4000Hzより低い成分のみを含む瞬間においては狭帯域符号ストリーム(12kb/s以下)を受信する可能性があり、そして復号器は、復号化された信号が0〜7000Hzの広帯域信号を含む可能性がある別の瞬間においては広帯域符号ストリーム(14kb/s以上)を受信する可能性があるということがわかる。帯域幅のそのような突然の変化を、本明細書では、帯域幅の切り換えと呼ぶ。聴取体験への、高域及び低域からの寄与は異なるため、そのような頻繁な切り換えは、聴取体験に顕著な不快をもたらす可能性がある。特に、広帯域から狭帯域への頻繁な切り換えがある場合、鮮明な音声から単調な音声へのジャンプが頻繁に感じられる。従って、頻繁な切り換えによって聴取体験に引き起こされる不快を軽減するための技術が必要とされている。
本開示は、発話信号に帯域幅の切り換えが発生する場合に人間によって感じられる快適さを向上させるための、音声復号化方法及び装置を提供する。
上記の目的を達成するために、本発明の一実施形態で提供される音声復号化方法は、
受信された符号ストリームに対応する音声信号の低域信号成分を、音声信号が第1の帯域幅から、第1の帯域幅よりも狭い第2の帯域幅に切り換わった場合に取得し、
低域信号成分を拡張して高域情報を取得し、
拡張を介して取得された高域情報に対して経時変化フェードアウト処理を実行して、処理された高域信号成分を取得し、
処理された高域信号成分と、取得された低域信号成分とを合成することを含む。
更に、本発明の一実施形態は、取得ユニットと、拡張ユニットと、経時変化フェードアウト処理ユニットと、合成ユニットとを含む、音声復号化装置を提供する。
取得ユニットは、受信された符号ストリームに対応する音声信号の低域信号成分を、音声信号が第1の帯域幅から、第1の帯域幅よりも狭い第2の帯域幅に切り換わった場合に取得し、低域信号成分を拡張ユニットに送信するように構成される。
拡張ユニットは、低域信号成分を拡張して高域情報を取得し、拡張を介して取得された高域情報を経時変化フェードアウト処理ユニットに送信するように構成される。
経時変化フェードアウト処理ユニットは、拡張を介して取得された高域情報に対して経時変化フェードアウト処理を実行して、処理された高域信号成分を取得し、処理された高域信号成分を合成ユニットに送信するように構成される。
合成ユニットは、受信された、処理された高域信号成分と、取得ユニットによって取得された低域信号成分とを合成するように構成される。
従来技術と比較して、本発明の実施形態においては、以下の有益な効果が達成されることが可能である。
本発明の実施形態で提供される方法を使用すれば、音声信号が広帯域から狭帯域への切り換えを有する場合に、人為的帯域拡張、経時変化フェードアウト処理、及び帯域幅合成などの一連の処理が、切り換えが広帯域信号から狭帯域信号への滑らかな移行を有するようにするために実行されてもよく、これにより、快適な聴取体験が達成されることが可能である。
従来技術におけるG.729.1符号化システムのブロック図である。 従来技術におけるG.729.1復号化システムのブロック図である。 本発明の第1の実施形態における、音声信号を復号化する方法のフローチャートである。 本発明の第2の実施形態における、音声信号を復号化する方法のフローチャートである。 本発明の第2の実施形態における、経時変化利得係数の変化曲線を示す。 本発明の第2の実施形態における、経時変化フィルタの極点の変化を示す。 本発明の第3の実施形態における、音声信号を復号化する方法のフローチャートである。 本発明の第4の実施形態における、音声信号を復号化する方法のフローチャートである。 本発明の第5の実施形態における、音声信号を復号化する方法のフローチャートである。 本発明の第6の実施形態における、音声信号を復号化する方法のフローチャートである。 本発明の第7の実施形態における、音声信号を復号化する方法のフローチャートである。 本発明の第8の実施形態における、音声信号を復号化する方法のフローチャートである。 本発明の第9の実施形態における、音声信号を復号化する装置を概略的に示す。
本発明の実施についての更なる詳細な説明を、特定の実施形態及び添付の図面を参照して行う。
本発明の第1の実施形態における、音声信号を復号化する方法を、図3に示す。以下のような特定のステップが含まれる。
ステップS301で、受信された符号ストリームのフレーム構成が判定される。
ステップS302で、符号ストリームのフレーム構成に基づいて、符号ストリームに対応する音声信号が、第1の帯域幅から、第1の帯域幅よりも狭い第2の帯域幅への切り換えを有するかどうかについての検知が行われる。そのような切り換えがある場合、ステップS303が実行される。それ以外の場合、通常の復号化フローに従って符号ストリームが復号化され、復元された音声信号が出力される。
発話符号化及び復号化の分野では、狭帯域信号は、一般に、0〜4000Hzの周波数帯域を有する信号を意味し、広帯域信号は、0〜8000Hzの周波数帯域を有する信号を意味する。超広帯域(UWB)信号は、0〜16000Hzの周波数帯域を有する信号を意味する。より広い帯域を有する信号は、低域信号成分と高域信号成分とに分割されてもよい。もちろん、上記の定義は一般的なものにすぎず、実際の適用例はこれに関して限定されない。説明を容易にするために、本発明の実施形態における高域信号成分は、切り換えの前の帯域幅を基準にして、切り換えの後に追加される部分を意味してもよく、狭帯域信号成分は、切り換えの前及び後の両方の音声信号に共通の帯域幅を有する部分を意味してもよい。例えば、0〜8000Hzの帯域を有する信号から、0〜4000Hzの帯域を有する信号への切り換えが発生した場合、低域信号成分は、0〜4000Hzの信号を意味してもよく、高域信号成分は、4000〜8000Hzの信号を意味してもよい。
ステップS303で、符号ストリームに対応する音声信号が第1の帯域幅から第2の帯域幅に切り換わったことを検知した場合、受信された低域符号化パラメータが復号化のために使用されて、低域信号成分が取得される。
本発明の一実施形態では、切り換えの前の帯域幅が切り換えの後の帯域幅よりも広い限り、本発明の実施形態における解決法が適用されてもよく、一般的な意味では、広帯域から狭帯域への切り換えに限定されない。
ステップS304で、人為的帯域拡張技術が使用されて低域信号成分が拡張され、高域情報が取得される。
具体的には、高域情報は、高域信号成分又は高域符号化パラメータであってもよい。初期期間中に、符号ストリームに対応する音声信号が第1の帯域幅から第2の帯域幅に切り換わった場合に、人為的帯域幅拡張技術を使用して低域信号成分を拡張し高域情報を取得するための、2つの方法が存在してもよい。具体的には、切り換えの前に受信された高域符号化パラメータが、低域信号成分を拡張して高域情報を取得するために使用されてもよく、又は、切り換えの後の現在の音声フレームから復号化された低域信号成分が、高域情報を取得するために拡張されてもよい。
切り換えの前に受信された高域符号化パラメータを、低域信号成分を拡張して高域情報を取得するために使用する方法は、切り換えの前に受信された高域符号化パラメータ(例えば、TDBWE符号化アルゴリズムにおける時間領域及び周波数領域エンベロープ、又は、TDAC符号化アルゴリズムにおけるMDCT係数)をバッファリングし、現在の音声フレームの高域符号化パラメータを、切り換えの後の外挿を使用することによって推定することを含んでもよい。更に、高域符号化パラメータに応じて、対応する広帯域復号化アルゴリズムが、高域信号成分を取得するために使用されてもよい。
切り換えの後の現在の音声フレームから復号化された低域信号成分を、高域情報を取得するために使用する方法は、切り換えの後の現在の音声フレームから復号化された低域信号成分に対して、高速フーリエ変換(FFT)を実行し、低域信号成分のFFT係数を、FFT領域内で拡張及び整形し、整形されたFFT係数を、高域情報のFFT係数とし、逆FFT変換を実行して、高域信号成分を取得することを含んでもよい。もちろん、前者の方法の計算量は、後者の方法よりもはるかに少ない。以下の実施形態では、例として、前者の方法が、本発明を説明するために使用される。
ステップS305で、経時変化フェードアウト処理が、拡張を介して取得された高域情報に対して実行される。
具体的には、人為的帯域拡張技術を使用することによって、拡張を介して高域情報が取得された後に、QMFフィルタリングが、高域情報と低域信号成分とを合成して広帯域信号を作るために実行されるのではない。より正確には、拡張を介して取得された高域情報に対して、経時変化フェードアウト処理が実行される。フェードアウト処理は、音声信号の、第1の帯域幅から第2の帯域幅への移行を意味する。高域情報に対して、経時変化フェードアウト処理を実行する方法は、セパレート経時変化フェードアウト処理とハイブリッド経時変化フェードアウト処理とを含んでもよい。
具体的には、セパレート経時変化フェードアウト処理は、拡張を介して取得された高域情報に対して、時間領域整形が、時間領域利得係数を使用することによって実行され、そして更に、時間領域整形された高域情報に対して、周波数領域整形が、経時変化フィルタリングを使用することによって実行されてもよい、第1の方法か、又は、拡張を介して取得された高域情報に対して、周波数領域整形が、経時変化フィルタリングを使用することによって実行され、そして更に、周波数領域整形された高域情報に対して、時間領域整形が、時間領域利得係数を使用することによって実行されてもよい、第2の方法を含んでもよい。
具体的には、ハイブリッド経時変化フェードアウト処理は、拡張を介して取得された高域符号化パラメータに対して、周波数領域整形が、周波数領域高域パラメータ経時変化重み付け法を使用することによって実行されて、経時変化フェードアウトスペクトルエンベロープが取得され、処理された高域信号成分が復号化を介して取得される、第3の方法か、又は、拡張を介して取得された高域信号成分が、サブバンドに分割され、各サブバンドの符号化パラメータに対して、周波数領域高域パラメータ経時変化重み付けが実行されて、経時変化フェードアウトスペクトルエンベロープが取得され、処理された高域信号成分が復号化を介して取得される、第4の方法を含んでもよい。
ステップS306で、処理された高域信号成分と、復号化された低域信号成分とが合成される。
上記のステップにおいて、復号器は、拡張を介して取得された高域情報に対して、経時変化フェードアウト処理を、多くの方法で実行してもよい。様々な経時変化フェードアウト処理方法の特定の実施形態についての詳細な説明を以下で行う。
以下の実施形態では、復号器によって受信される符号ストリームは、発話セグメントであってもよい。発話セグメントは、復号器によって連続的に受信される発話フレームのセグメントを意味する。発話フレームは、フルレート発話フレーム、又は、フルレート発話フレームのいくつかのレイヤであってもよい。あるいは、復号器によって受信される符号ストリームは、雑音セグメントであってもよく、雑音セグメントは、復号器によって連続的に受信される雑音フレームのセグメントを意味する。雑音フレームは、フルレート雑音フレーム、又は、フルレート雑音フレームのいくつかのレイヤであってもよい。
本発明の第2の実施形態では、例えば、復号器によって受信される符号ストリームは、発話セグメントであり、経時変化フェードアウト処理は、第1の方法を使用する。言い換えると、拡張を介して取得された高域情報に対して、時間領域整形が、時間領域利得係数を使用することによって実行され、そして更に、時間領域整形された高域情報に対して、周波数領域整形が、経時変化フィルタリングを使用することによって実行されてもよい。音声信号を復号化する方法が図4に示されており、この方法は、以下のような特定のステップを含んでもよい。
ステップ401で、復号器は、符号器から送信された符号ストリームを受信し、受信された符号ストリームのフレーム構成を判定する。
具体的には、符号器は、図1の系統ブロック図に示すフローに従って、音声信号を符号化し、符号ストリームを復号器に送信する。復号器は、符号ストリームを受信する。符号ストリームに対応する音声信号が、広帯域から狭帯域への切り換えを有さない場合、復号器は、受信された符号ストリームを、図2の系統ブロック図に示すフローに従って、通常通りに復号化してもよい。ここでは繰り返しを行わない。復号器によって受信される符号ストリームは、発話セグメントである。発話セグメント内の発話フレームは、フルレート発話フレーム、又は、フルレート発話フレームのいくつかのレイヤであってもよい。この実施形態では、フルレート発話フレームが使用され、そのフレーム構成は表1に示されている。
Figure 2011502287
Figure 2011502287
ステップS402で、復号器は、符号ストリームのフレーム構成に従って、広帯域から狭帯域への切り換えが発生したかどうかを検知する。そのような切り換えが発生した場合、フローはステップS403に進む。それ以外の場合、通常の復号化フローに従って符号ストリームが復号化され、復元された音声信号が出力される。
発話フレームが受信された場合、現在のフレームのデータ長又は復号化レートに従って、広帯域から狭帯域への切り換えが発生したかどうかについての判定が行われる。例えば、現在のフレームがレイヤ1及びレイヤ2のデータのみを含む場合、現在のフレームの長さは160ビット(すなわち、復号化レートは8kb/s)又は240ビット(すなわち、復号化レートは12kb/s)であり、従って、現在のフレームは狭帯域である。そうではなく、現在のフレームが、最初の2つのレイヤのデータと、より高いレイヤのデータとを含む場合、すなわち、現在のフレームの長さが280ビット以上(すなわち、復号化レートが14kb/s)である場合、現在のフレームは広帯域である。
具体的には、現在のフレームと、以前のフレーム(1つ又は複数)とから判定された、発話信号の帯域幅に基づいて、現在の発話セグメントが広帯域から狭帯域への切り換えを有するかどうかについての検知が行われてもよい。
ステップS403で、受信された符号ストリームに対応する発話信号が広帯域から狭帯域に切り換わった場合、復号器は、受信された低域符号化パラメータを、エンベデッドCELPを使用することによって復号化して、低域信号成分
Figure 2011502287

を取得する。
ステップS404で、切り換えの前に受信された高域信号成分の符号化パラメータが、低域信号成分
Figure 2011502287

を拡張して、高域信号成分
Figure 2011502287

を取得するために使用されてもよい。
具体的には、高域符号化パラメータを有する発話フレームを受信した後で、復号器は、切り換えの前に受信されたM個の発話フレームのTDBWE符号化パラメータ(時間領域エンベロープ及び周波数領域エンベロープを含む)を、毎回バッファリングする。広帯域から狭帯域への切り換えを検知した後で、復号器は、最初に、バッファ内に記憶された、切り換えの前に受信された発話フレームの時間領域エンベロープと周波数領域エンベロープとに基づいて、現在のフレームの時間領域エンベロープと周波数領域エンベロープとを外挿し、次に、外挿された時間領域エンベロープと周波数領域エンベロープとを使用することによって、TDBWE復号化を実行して、高域信号成分を、拡張を介して取得する。同様に、復号器は、切り換えの前に受信されたM個の発話フレームのTDAC符号化パラメータ(すなわち、MDCT係数)をバッファリングしてもよく、現在のフレームのMDCT係数を外挿し、次に、外挿されたMDCT係数を使用することによって、TDAC復号化を実行して、高域信号成分を、拡張を介して取得する。
広帯域から狭帯域への切り換えが検知され次第、いかなる高域符号化パラメータも欠けている発話フレームについて、高域信号成分の合成パラメータが、ミラー補間法を使用して推定されてもよい。言い換えると、バッファ内にバッファリングされた、M個の最近の発話フレームの高域符号化パラメータが、ミラーソースとして使用されて、セグメント線形補間が、現在の発話フレームから開始して実行される。セグメント線形補間のための式は、次の通りである。
Figure 2011502287

(1)
上式で、Pは、切り換え位置から復元されるk番目の発話フレームの高域信号成分のための合成パラメータを表し、k=0,・・・,N−1であり、Nは、発話フレーム(それに対してフェードアウト処理が実行される)の数であり、P−iは、バッファ内に記憶された、切り換え位置の前に受信されたi番目の発話フレームの高域符号化パラメータを表し、i=1,・・・,Mであり、Mは、フェードアウト処理のためにバッファリングされたフレームの数であり、(a)mod(b)は、bを用いたaのMOD演算を表し、
Figure 2011502287

は、フロア演算を表す。式(1)に従って、切り換えの前のM個のバッファリングされた発話フレームの高域符号化パラメータが、切り換えの後のN個の発話フレームの高域符号化パラメータを推定するために使用されてもよい。切り換えの後のN個の発話フレームの高域信号成分は、TDBWE又はTDAC復号化アルゴリズムを使用して復元されてもよい。実際の適用例の要求に応じて、Mは、N未満の任意の値であってもよい。
ステップS405で、拡張を介して取得された高域信号成分
Figure 2011502287

に対して、時間領域整形が実行されて、処理された高域信号成分
Figure 2011502287

が取得される。
具体的には、時間領域整形が実行される場合、経時変化利得係数g(k)が導入されてもよい。経時変化係数の変化曲線を、図5に示す。経時変化利得係数は、対数領域において直線的に減衰する曲線を有する。切り換えの後に発生するk番目の発話フレームについて、式(2)に示すように、拡張を介して取得された高域信号成分に、経時変化利得係数が掛けられる。
Figure 2011502287

(2)
ただし、n=0,...,L−1であり、k=0,...,N−1であり、Lは、フレームの長さを表す。
ステップS406で、必要に応じて、周波数領域整形が、時間領域整形された高域信号成分
Figure 2011502287

に対して、経時変化フィルタリングを使用することによって実行されて、周波数領域整形された高域信号成分
Figure 2011502287

が取得されてもよい。
具体的には、時間領域整形された高域信号成分
Figure 2011502287

が、経時変化フィルタを通過し、これにより、高域信号成分の周波数帯域が、時間の経過と共に徐々に狭くなる。この実施形態で使用される経時変化フィルタは、−1に固定された零点と、常に変化する極点とを有する、経時変化2次バターワースフィルタである。図6は、経時変化2次バターワースフィルタの極点の変化を示す。経時変化フィルタの極点は、時計回りに移動する。言い換えると、フィルタの通過帯域は、0に達するまで減少する。
復号器が14kb/s以上の発話信号を処理した場合、広帯域−狭帯域切り換えフラグfad_out_flagが0に設定され、フィルタの点のカウンタfad_out_countが0に設定される。特定の瞬間から開始して、復号器が8kb/s又は12kb/sの発話信号を処理し始めた場合、狭帯域−広帯域切り換えフラグfad_out_flagが1に設定され、経時変化フィルタが、復元された高域信号成分のフィルタリングを開始するために有効にされる。フィルタの点の数fad_out_countが、fad_out_count<FAD_OUT_COUNT_MAXという条件を満たす場合、経時変化フィルタリングは継続的に実行される。それ以外の場合、経時変化フィルタの処理は停止される。ここで、FAD_OUT_COUNT_MAX=N×Lは、移行の数である(例えば、FAD_OUT_COUNT_MAX=8000)。
経時変化フィルタは、瞬間iにおいて、rel(i)+img(i)×jという正確な極点を有し、極点は、正確に瞬間mにおいて、rel(m)+img(m)×jに移動すると仮定する。補間の点の数がNである場合、瞬間kにおける補間結果は、次の通りである。
rel(k)=rel(i)×(N−k)/N+rel(m)×k/N
img(k)=img(i)×(N−k)/N+img(m)×k/N
補間の極点が、瞬間kにおけるフィルタ係数を回復するために使用されてもよく、次の伝達関数が取得されてもよい。
H(z)=(1+2z−1+z−2)/(1−2rel(k)z−1+[rel(k)+img(k)]z−2
復号器が広帯域発話信号を受信した場合、フィルタの点のカウンタfad_out_countが0に設定される。復号器によって受信された発話信号が、広帯域から狭帯域に切り換わった場合、経時変化フィルタが有効にされ、そして、フィルタカウンタは、次のように更新されてもよい。
fad_out_count=min(fad_out_count+1,FAD_OUT_COUNT_MAX)
ただし、FAD_OUT_COUNT_MAXは、移行フェーズ中の連続したサンプルの数である。
=2rel(k)及びa=−[rel(k)+img(k)]とする。時間領域整形された復元された高域信号成分
Figure 2011502287

は、経時変化フィルタの入力信号であり、
Figure 2011502287

は、経時変化フィルタの出力信号である。
Figure 2011502287

上式で、gain_filterは、フィルタ利得であり、その演算式は、次の通りである。
gain_filter=(1−a−a)/4
ステップS407で、復号化された低域信号成分
Figure 2011502287

と、処理された高域信号成分
Figure 2011502287

(ステップS406が実行されない場合は、高域信号成分
Figure 2011502287

)とに対して、合成フィルタリングを実行するために、QMFフィルタバンクが使用されてもよい。このようにして、広帯域から狭帯域への滑らかな移行という特性を満たす、経時変化フェードアウト信号が復元されてもよい。
経時変化フェードアウト処理された高域信号成分
Figure 2011502287

と、復元された低域信号成分
Figure 2011502287

とが、合成フィルタリングのためにQMFフィルタバンクに一緒に入力されて、フル帯域の復元された信号が取得される。復号化中に広帯域から狭帯域への頻繁な切り換えがある場合でも、本発明に従って処理された、復元された信号は、比較的良好な聴取品質を人間に提供することが可能である。
この実施形態では、例えば、発話セグメントの経時変化フェードアウト処理は、第1の方法を使用し、すなわち、拡張を介して取得された高域情報に対して、時間領域整形が、時間領域利得係数を使用することによって実行され、そして、時間領域整形された高域情報に対して、周波数領域整形が、経時変化フィルタリングを使用することによって実行される。経時変化フェードアウト処理は、他の代替の方法を使用してもよいということが理解されよう。本発明の第3の実施形態では、例えば、復号器によって受信される符号ストリームは、発話セグメントであり、経時変化フェードアウト処理は、第3の方法を使用し、すなわち、周波数領域高域パラメータ経時変化重み付け法が、拡張を介して取得された高域情報に対して周波数領域整形を実行するために使用される。音声信号を復号化する方法が図7に示されており、この方法は、以下のようなステップを含む。
ステップS701〜S703は、第2の実施形態におけるステップS401〜S403と同様であり、従って、ここでは繰り返しは行わない。
ステップS704で、切り換えの前に受信された高域信号成分の符号化パラメータが、低域信号成分
Figure 2011502287

を拡張して、高域符号化パラメータを取得するために使用される。
この処理では、復号器内にバッファリングされた、切り換えの前のM個の発話フレームの高域符号化パラメータが、切り換えの後のN個の発話フレームの高域符号化パラメータ(周波数領域エンベロープ及び高域スペクトルエンベロープ)を推定するために使用されてもよい。具体的には、復号器が、高域符号化パラメータを含むフレームを受信した後で、切り換えの前に受信されたM個の発話フレームのTDBWE符号化パラメータ(時間領域エンベロープ及び周波数領域エンベロープなどの、符号化パラメータを含む)が、毎回バッファリングされてもよい。広帯域から狭帯域への切り換えが検知され次第、復号器は、最初に、バッファ内に記憶された、切り換えの前に受信された時間領域エンベロープと周波数領域エンベロープとに基づいて、外挿を介して、現在のフレームの時間領域エンベロープと周波数領域エンベロープとを取得する。あるいは、復号器は、切り換えの前に受信されたM個の発話フレームのTDAC符号化パラメータ(すなわち、MDCT係数)をバッファリングしてもよく、そして、発話フレームのMDCT係数に基づいて、拡張を介して高域符号化パラメータを取得する。
広帯域から狭帯域への切り換えが検知され次第、いかなる高域符号化パラメータも欠けているフレームについて、ミラー補間法が、高域信号成分の合成パラメータを推定するために使用されてもよい。具体的には、バッファ内にバッファリングされた、M個(例えば、M=5)の最近の発話フレームの高域符号化パラメータ(周波数領域エンベロープ及び高域スペクトルエンベロープ)を、ミラーソースとして利用することによって、現在の発話フレームから開始して、セグメント線形補間が実行される。これは、第2の実施形態におけるセグメント線形補間式(1)を使用することによって実施されてもよく、ここで、連続したフレームの数はN(例えば、N=50)である。この処理では、切り換えの前のM個のフレームの、バッファリングされた高域符号化パラメータが、切り換えの後のN個のフレームの高域符号化パラメータ(周波数領域エンベロープ及び高域スペクトルエンベロープ)を推定するために使用されてもよい。
ステップS705で、周波数領域高域パラメータ経時変化重み付け法が、拡張を介して取得された高域符号化パラメータに対して周波数領域整形を実行するために使用されてもよい。
具体的には、高域信号が、周波数領域内でいくつかのサブバンドに分割され、次に、各サブバンドの高域符号化パラメータに対して、周波数領域重み付けが、異なる利得を使用して実行され、これにより、高域信号成分の周波数帯域が徐々に狭くなる。広帯域符号化パラメータは、14kb/sでのTDBWE符号化アルゴリズムにおける周波数領域エンベロープ又は14kb/sを超えるレートでのTDAC符号化アルゴリズムにおける高域エンベロープに関係なく、高域を複数のサブバンドに分割する処理を含意してもよい。従って、受信された高域符号化パラメータに対して、周波数領域内で、経時変化フェードアウト処理が直接実行される場合、時間領域内でフィルタを使用する方法に比較して、より多くの計算量が節約されることが可能である。復号器が14kb/s以上のレートを有する発話信号を処理した場合、狭帯域−広帯域切り換えフラグfad_out_flagが0に設定され、移行フレームのカウンタfad_out_frame_countが0に設定される。特定の瞬間から、復号器が8kb/s又は12kb/sの発話信号を処理し始めた場合、狭帯域−広帯域切り換えフラグfad_out_flagが1に設定される。移行フレームのカウンタfad_out_frame_countが、fad_out_frame_count<Nという条件を満たす場合、周波数領域内で符号化パラメータが重み付けされ、重み付け係数は時間の経過と共に変化する。
切り換えの前に発生した発話フレームのレートが、14kb/sよりも高い場合、受信されてバッファ内にバッファリングされた高域信号成分の符号化パラメータは、MDCT領域内の高域エンベロープと、TDBWEアルゴリズムにおける周波数領域エンベロープとを含んでもよい。それ以外の場合、受信されてバッファ内にバッファリングされた高域信号符号化パラメータは、TDBWEアルゴリズムにおける周波数領域エンベロープのみを含む。切り換えの後に発生するk番目の発話フレーム(k=1,・・・,N)のために、バッファ内の高域符号化パラメータが、現在のフレームの対応する高域符号化パラメータ(周波数領域エンベロープ、又はMDCT領域内の高域エンベロープ)を復元するために使用されてもよい。周波数領域内のこれらのエンベロープは、高域全体をいくつかのサブバンドに分割する。これらのスペクトルエンベロープは、
Figure 2011502287

で表される(j=0,・・・,J−1、Jは分割されたサブバンドの数であり、例えば、G.729.1によるTDBWEアルゴリズムにおける周波数領域エンベロープについては、J=12であり、MDCT領域内の高域エンベロープについては、J=18である)。各サブバンドは、経時変化フェードアウト利得係数gain(k,j)によって重み付けされ、すなわち、
Figure 2011502287

とされる。このようにして、周波数領域内の経時変化フェードアウトスペクトルエンベロープが取得されてもよい。gain(k,j)を計算するための式は、次の通りである。
gain(k,j)=max(0,(J−j)×N−J×k)/(J×N), k=1,...,N;j=0,...,J−1
処理されたTDBWE周波数領域エンベロープ及びMDCT領域高域エンベロープについて、それらは、それぞれ、TDBWE復号化アルゴリズム及びTDAC復号化アルゴリズムを使用することによって復号化されてもよい。このようにして、経時変化フェードアウト高域信号成分
Figure 2011502287

が取得されてもよい。
ステップS706で、処理された高域信号成分
Figure 2011502287

と、復号化された低域信号成分
Figure 2011502287

とに対して、QMFフィルタバンクが合成フィルタリングを実行して、経時変化フェードアウト信号が復元されてもよい。
音声信号は、発話信号と雑音信号とを含んでもよい。本発明の第2の実施形態及び第3の実施形態の説明においては、例えば、発話セグメントが広帯域から狭帯域に切り換わる。雑音セグメントも広帯域から狭帯域に切り換わってもよいということが理解されるであろう。本発明の第4の実施形態では、例えば、復号器によって受信される符号ストリームは、雑音セグメントであり、経時変化フェードアウト処理は、第2の方法を使用する。言い換えると、拡張を介して取得された高域情報に対して、周波数領域整形が、経時変化フィルタリングを使用することによって実行され、そして更に、周波数領域整形された高域情報に対して、時間領域整形が、時間領域利得係数を使用することによって実行されてもよい。音声信号を復号化する方法が図8に示されており、この方法は、以下のようなステップを含む。
ステップ801で、復号器は、符号器から送信された符号ストリームを受信し、受信された符号ストリームのフレーム構成を判定する。
具体的には、符号器は、図1の系統ブロック図に示すフローに従って、音声信号を符号化し、符号ストリームを復号器に送信する。復号器は、符号ストリームを受信する。符号ストリームに対応する音声信号が、広帯域から狭帯域への切り換えを有さない場合、復号器は、受信された符号ストリームを、図2の系統ブロック図に示すフローに従って、通常通りに復号化してもよい。ここでは繰り返しを行わない。復号器によって受信される符号ストリームは、発話セグメントである。発話セグメント内の発話フレームは、フルレート発話フレーム、又は、フルレート発話フレームのいくつかのレイヤであってもよい。雑音フレームは、連続的に符号化されて送信されてもよく、又は、不連続送信(DTX)技術を使用してもよい。この実施形態では、雑音セグメントと雑音フレームとは同じ定義を有する。この実施形態では、復号器によって受信される雑音フレームは、フルレート雑音フレームであり、この実施形態で使用される雑音フレームの符号化構成を、図2に示す。
Figure 2011502287
ステップS802で、復号器は、符号ストリームのフレーム構成に従って、広帯域から狭帯域への切り換えが発生したかどうかを検知する。そのような切り換えが発生した場合、フローはステップS803に進む。それ以外の場合、通常の復号化フローに従って符号ストリームが復号化され、復元された雑音信号が出力される。
雑音フレームが受信された場合、復号器は、現在のフレームのデータ長に従って、広帯域から狭帯域への切り換えが発生したかどうかを判定してもよい。例えば、現在のフレームのデータが、狭帯域コアレイヤのみを、又は狭帯域コアレイヤと狭帯域エンハンスメントレイヤとのみを含む場合、すなわち、現在のフレームの長さが15ビット又は24ビットである場合、現在のフレームは狭帯域である。そうではなく、現在のフレームのデータが、広帯域コアレイヤを更に含む場合、すなわち、現在のフレームの長さが43ビットである場合、現在のフレームは広帯域である。
現在のフレーム、又は以前のフレーム(1つ又は複数)から判定された、雑音信号の帯域幅に基づいて、広帯域から狭帯域への切り換えが現在発生しているかどうかについての検知が行われてもよい。
復号器によって受信された無音挿入記述子(SID)フレームが高域符号化パラメータ(すなわち、広帯域コアレイヤ)を含む場合、バッファ内の高域符号化パラメータが、SIDフレームを使用して更新される。雑音セグメントの特定の瞬間から開始して、復号器によって受信されたSIDフレームが、広帯域コアレイヤを含まなくなった場合、復号器は、広帯域から狭帯域への切り換えが発生したと判定してもよい。
ステップS803で、受信された符号ストリームに対応する雑音信号が広帯域から狭帯域に切り換わった場合、復号器は、受信された低域符号化パラメータを、エンベデッドCELPを使用することによって復号化して、低域信号成分
Figure 2011502287

を取得する。
ステップS804で、切り換えの前に受信された高域信号成分の符号化パラメータを使用することによって、低域信号成分
Figure 2011502287

が拡張されて、高域信号成分
Figure 2011502287

が取得される。
いかなる高域符号化パラメータも欠けている雑音フレームについて、高域信号成分の合成パラメータが、ミラー補間法を使用して推定されてもよい。雑音フレームが連続的に符号化されて送信される場合、バッファ内にバッファリングされた、M個の最近の雑音フレーム(例えば、M=5)の高域符号化パラメータ(周波数領域エンベロープ及び高域スペクトルエンベロープ)が、広帯域から狭帯域への切り換えの後のk番目の雑音フレームの高域符号化パラメータを、第2の実施形態における式(1)を使用することによって復元するための、ミラーソースとして使用される。雑音フレームがDTX技術を使用する場合、バッファ内にバッファリングされた高域符号化パラメータ(周波数領域エンベロープ)を含む2つの最新のSIDフレームが、現在のフレームから開始してセグメント線形補間を実行するための、ミラーソースとして利用されてもよい。広帯域から狭帯域への切り換えの後のk番目の雑音フレームの高域符号化パラメータを復元するために、式(3)が使用される。
=(k/(N−1))Psid_past+(1−k/(N−1))Psid_p_past
(3)
連続するフレームの数は、Nである(例えば、N=50)。Psid_pastは、バッファ内に記憶された、広帯域コアレイヤを含む最新のSIDフレームの高域符号化パラメータを表し、Psid_p_pastは、バッファ内に記憶された、広帯域コアレイヤを含む次の最新のSIDフレームの高域符号化パラメータを表す。処理においては、切り換えの前の2つの雑音フレームの、バッファリングされた高域符号化パラメータが、切り換えの後のN個の雑音フレームの高域符号化パラメータ(周波数領域エンベロープ)を推定するために使用されて、切り換えの後のN個の雑音フレームの高域信号成分が復元されてもよい。TDBWE又はTDAC復号化を使用することによって、式(3)を用いて復元された高域符号化パラメータが拡張されて、高域信号成分
Figure 2011502287

が取得されてもよい。
ステップS805で、拡張を介して取得された高域信号成分
Figure 2011502287

に対して、周波数領域整形を実行するために、経時変化フィルタリングが使用されて、周波数領域整形された高域信号成分
Figure 2011502287

が取得される。
具体的には、周波数領域整形が実行される場合、拡張を介して取得された高域信号成分
Figure 2011502287

が、経時変化フィルタを通過し、これにより、高域信号成分の周波数帯域が、時間の経過と共に徐々に狭くなる。図6は、フィルタの極点の変化を示す。復号器が、広帯域コアレイヤを含むSIDフレームを受信するたびに、広帯域−狭帯域切り換えフラグfad_out_flagが0に設定され、フィルタ点のカウンタfad_out_flagが0に設定される。特定の瞬間から開始して、復号器が、広帯域コアレイヤを含まないSIDフレームを受信した場合、狭帯域−広帯域切り換えフラグfad_out_flagが1に設定される。そして、経時変化フィルタが、復元された高域信号成分をフィルタリングするために有効にされる。フィルタの点の数fad_out_countが、fad_out_count<FAD_OUT_COUNT_MAXという条件を満たす場合、経時変化フィルタリングは継続的に実行される。それ以外の場合、経時変化フィルタの処理は停止される。ここで、FAD_OUT_COUNT_MAX=N×Lは、移行の数である(例えば、FAD_OUT_COUNT_MAX=8000)。
経時変化フィルタは、瞬間iにおいて、rel(i)+img(i)×jという正確な極点を有し、極点は、正確に瞬間mにおいて、rel(m)+img(m)×jに移動すると仮定する。補間の数がNである場合、瞬間kにおける補間結果は、次の通りである。
rel(k)=rel(i)×(N−k)/N+rel(m)×k/N
img(k)=img(i)×(N−k)/N+img(m)×k/N
補間の極点が、瞬間kにおけるフィルタ係数を回復するために使用されてもよく、次の伝達関数が取得されてもよい。
H(z)=(1+2z−1+z−2)/(1−2rel(k)z−1+[rel(k)+img(k)]z−2
復号器が広帯域雑音信号を受信した場合、フィルタのカウンタfad_out_countが0に設定される。復号器によって受信された雑音信号が、広帯域から狭帯域に切り換わった場合、経時変化フィルタが有効にされ、そして、フィルタカウンタは、次のように更新されてもよい。
fad_out_count=min(fad_out_count+1,FAD_OUT_COUNT_MAX)、ここで、FAD_OUT_COUNT_MAXは、移行フェーズ中の連続したサンプルの数である。
=2rel(k)及びa=−[rel(k)+img(k)]とする。拡張を介して取得された高域信号成分
Figure 2011502287

は、経時変化フィルタの入力信号であり、
Figure 2011502287

は、経時変化フィルタの出力信号である。
Figure 2011502287

上式で、gain_filterは、フィルタ利得であり、その演算式は、次の通りである。
gain_filter=(1−a−a)/4
ステップS806で、必要に応じて、時間領域整形が、周波数領域整形された高域信号成分
Figure 2011502287

に対して実行されて、時間領域整形された高域信号成分
Figure 2011502287

が取得されてもよい。
具体的には、時間領域整形が実行される場合、経時変化利得係数g(k)が導入されてもよい。経時変化係数の変化曲線を、図5に示す。切り換えの後に発生するk番目の発話フレームについて、式(2)に示すように、TDBWE又はTDAC復号化の後の、拡張を介して取得された高域信号成分に、経時変化利得係数が掛けられる。この実施は、第2の実施形態における、高域信号成分に対して時間領域整形を実行する処理と同様であり、従って、ここでは繰り返しを行わない。あるいは、このステップにおける経時変化利得係数には、ステップS805におけるフィルタ利得が掛けられてもよい。2つの方法により同じ結果が取得される可能性がある。
ステップS807で、復号化された低域信号成分
Figure 2011502287

と、整形された高域信号成分
Figure 2011502287

(ステップS806が実行されない場合は、高域信号成分
Figure 2011502287

)とに対して、合成フィルタリングを実行するために、QMFフィルタバンクが使用されてもよい。このようにして、広帯域から狭帯域への滑らかな移行という特性を満たす、経時変化フェードアウト信号が復元されてもよい。
この実施形態では、例えば、雑音セグメントの経時変化フェードアウト処理は、第2の方法を使用し、すなわち、拡張を介して取得された高域情報に対して、周波数領域整形が、経時変化フィルタリングを使用することによって実行され、そして更に、周波数領域整形された高域情報に対して、時間領域整形が、時間領域利得係数を使用することによって実行されてもよい。経時変化フェードアウト処理は、他の代替の方法を使用してもよいということが理解されよう。本発明の第5の実施形態では、例えば、復号器によって受信される符号ストリームは、雑音セグメントであり、経時変化フェードアウト処理は、第4の方法を使用し、すなわち、拡張を介して取得された高域情報が、サブバンドに分割され、各サブバンドの符号化パラメータに対して、周波数領域高域パラメータ経時変化重み付けが実行される。音声復号化方法が図9に示されており、この方法は、以下のようなステップを含む。
ステップS901〜S903は、第4の実施形態におけるステップS801〜S803と同様であり、従って、ここでは繰り返しを行わない。
ステップS904で、切り換えの前に受信された高域信号成分の符号化パラメータ(これに限定されないが周波数領域エンベロープを含む)が、高域符号化パラメータを拡張を介して取得するために使用されてもよい。
いかなる高域符号化パラメータも欠けている雑音フレームについて、高域信号成分の合成パラメータが、ミラー補間法を使用して推定されてもよい。雑音フレームが連続的に符号化されて送信される場合、バッファ内にバッファリングされた、M個(例えば、M=5)の最近の発話フレームの高域符号化パラメータ(周波数領域エンベロープ及び高域スペクトルエンベロープ)が、広帯域から狭帯域への切り換えの後のk番目のフレームの高域符号化パラメータを、式(1)を使用することによって復元するための、ミラーソースとして利用されてもよい。雑音フレームがDTX技術を使用する場合、バッファ内にバッファリングされた高域符号化パラメータ(周波数領域エンベロープ)を含む2つの最新のSIDフレームが、現在のフレームから開始してセグメント線形補間を実行するための、ミラーソースとして利用されてもよい。広帯域から狭帯域への切り換えの後のk番目のフレームの高域符号化パラメータを復元するために、式(3)が使用されてもよい。
異なる符号化アルゴリズムにおける音声信号の高域符号化パラメータは、異なるタイプを有する可能性があるため、拡張を介して取得された上記の高域符号化パラメータは、サブバンドに分割されない可能性がある。この場合、拡張を介して取得された高域符号化パラメータが復号化されて、高域信号成分が取得されてもよく、そして、拡張を介して取得された高域信号成分から、高域符号化パラメータが、周波数領域整形を実行するために抽出されてもよい。
ステップS905で、拡張を介して取得された高域符号化パラメータが復号化されて、高域信号成分が取得される。
ステップS906で、拡張を介して取得された高域信号成分から、周波数領域エンベロープが、TDBWEアルゴリズムを使用することによって抽出されてもよい。これらの周波数領域エンベロープは、高域信号成分全体を、一連の重複していないサブバンドに分割してもよい。
ステップS907で、周波数領域高域パラメータ経時変化重み付けが、抽出された周波数領域エンベロープに対して周波数領域整形を実行するために使用される。周波数領域整形された周波数領域エンベロープが復号化されて、処理された高域信号成分が取得される。
具体的には、抽出された周波数領域エンベロープに対して、経時変化重み付け処理が実行される。周波数領域エンベロープは、高域信号成分を、周波数領域内でいくつかのサブバンドに分割することと同等であり、従って、各周波数領域エンベロープに対して、周波数領域重み付けが、異なる利得を使用して実行され、これにより、信号帯域が徐々に狭くなる。復号器が、高域符号化パラメータを含むSIDフレームを連続的に受信する場合、広帯域雑音信号フェーズにあると考えられてもよい。広帯域−狭帯域切り換えフラグfad_out_flagが0に設定され、移行フレームのカウンタfad_out_frame_countが0に設定される。復号器によって受信されたSIDフレームが、特定の瞬間から開始して、広帯域コアレイヤを含まない場合、復号器は、広帯域から狭帯域への切り換えが発生したと判定する。広帯域−狭帯域切り換えフラグfad_out_flagが1に設定される。移行フレームのカウンタfad_out_frame_countが、fad_out_frame_count<Nという条件を満たす場合、経時変化フェードアウト処理が、周波数領域内で符号化パラメータを重み付けすることによって実行され、重み付け係数は時間の経過と共に変化し、ここで、Nは、移行フレームの数である(例えば、N=50)。
広帯域から狭帯域への切り換えの後のk番目のフレーム(k=0,...,N−1)の高域符号化パラメータが、式(3)を使用して復元されてもよく、そして、復元された高域符号化パラメータが復号化されて、高域信号成分が取得されてもよい。周波数領域エンベロープ
Figure 2011502287

(j=0,...,J、Jは分割されたサブバンドの数)は、拡張を介して取得された高域信号成分から、TDBWEアルゴリズムを使用することによって抽出されてもよい。各サブバンドの周波数領域エンベロープは、経時変化フェードアウト利得係数gain(k,j)を使用することによって重み付けされ、すなわち、
Figure 2011502287

とされる。このようにして、経時変化フェードアウトスペクトルエンベロープが周波数領域内で取得されてもよい。gain(k,j)を計算するための式は、次の通りである。
gain(k,j)=max(0,(J−j)×N−J×k)/(J×N),
k=1,...,N;j=0,...,J−1
経時変化フェードアウトTDBWE周波数領域エンベロープは、TDBWE復号化アルゴリズムを使用して復号化されて、処理された経時変化フェードアウト高域信号成分が取得されてもよい。
ステップS908で、処理された高域信号成分と、復号化された低域信号成分
Figure 2011502287

とに対して、QMFフィルタバンクが合成フィルタリングを実行して、経時変化フェードアウト信号が復元されてもよい。
本発明の上記の実施形態の説明においては、例えば、復号器によって受信された符号ストリームに対応する発話セグメント又は雑音セグメントが、広帯域から狭帯域に切り換わる。以下のような2つのケースがありうるということが理解されよう。復号器によって受信された符号ストリームに対応する発話セグメントが、広帯域から狭帯域に切り換わり、切り換えの後、復号器は、符号ストリームに対応する雑音セグメントを依然として受信する可能性がある。又は、復号器によって受信された符号ストリームに対応する雑音セグメントが、広帯域から狭帯域に切り換わり、切り換えの後、復号器は、符号ストリームに対応する発話セグメントを依然として受信する可能性がある。
本発明の第6の実施形態では、例えば、復号器によって受信された符号ストリームに対応する発話セグメントが、広帯域から狭帯域に切り換わり、復号器は、切り換えの後、符号ストリームに対応する雑音セグメントを依然として受信する可能性があり、経時変化フェードアウト処理は、第3の方法を使用する。言い換えると、拡張を介して取得された高域情報に対して、周波数領域整形が、周波数領域高域パラメータ経時変化重み付け法を使用することによって実行される。音声復号化方法が図10に示されており、この方法は、以下のようなステップを含む。
ステップ1001で、復号器は、符号器から送信された符号ストリームを受信し、受信された符号ストリームのフレーム構成を判定する。
具体的には、符号器は、図1の系統ブロック図に示すフローに従って、音声信号を符号化し、符号ストリームを復号器に送信する。復号器は、符号ストリームを受信する。符号ストリームに対応する音声信号が、広帯域から狭帯域への切り換えを有さない場合、復号器は、受信された符号ストリームを、図2の系統ブロック図に示すフローに従って、通常通りに復号化してもよい。ここでは繰り返しを行わない。この実施形態では、復号器によって受信される符号ストリームは、発話セグメントと雑音セグメントとを含む。発話セグメント内の発話フレームは、表1に示すフルレート発話フレームのフレーム構成を有し、雑音セグメント内の雑音フレームは、表2に示すフルレート雑音フレームのフレーム構成を有する。
ステップS1002で、復号器は、符号ストリームのフレーム構成に従って、広帯域から狭帯域への切り換えが発生したかどうかを検知する。そのような切り換えが発生した場合、フローはステップS1003に進む。それ以外の場合、通常の復号化フローに従って符号ストリームが復号化され、復元された音声信号が出力される。
ステップS1003で、受信された符号ストリームに対応する発話信号が広帯域から狭帯域に切り換わった場合、復号器は、受信された低域符号化パラメータを、エンベデッドCELPを使用することによって復号化して、低域信号成分
Figure 2011502287

を取得する。
ステップS1004で、人為的帯域拡張技術が、低域信号成分
Figure 2011502287

を拡張して、高域符号化パラメータを取得するために使用されてもよい。
広帯域から狭帯域への切り換えが発生した場合、バッファ内に記憶された音声信号は、切り換えの後に受信された音声信号と同じ、又は異なるタイプのものであってもよい。以下のような5つのケースがありうる。
(1)雑音フレームの高域符号化パラメータのみがバッファ内に記憶され(言い換えると、TDBWE周波数領域エンベロープのみで、TDAC高域エンベロープはなし)、切り換えの後に受信されるフレームは、全て発話フレームである。
(2)雑音フレームの高域符号化パラメータのみがバッファ内に記憶され(言い換えると、TDBWE周波数領域エンベロープのみで、TDAC高域エンベロープはなし)、切り換えの後に受信されるフレームは、全て雑音フレームである。
(3)発話フレームの高域符号化パラメータがバッファ内に記憶され(言い換えると、TDBWE周波数領域エンベロープとTDAC高域エンベロープとの両方)、切り換えの後に受信されるフレームは、全て発話フレームである。
(4)発話フレームの高域符号化パラメータがバッファ内に記憶され(言い換えると、TDBWE周波数領域エンベロープとTDAC高域エンベロープとの両方)、切り換えの後に受信されるフレームは、全て雑音フレームである。
(5)発話フレームの高域符号化パラメータがバッファ内に記憶され(言い換えると、TDBWE周波数領域エンベロープとTDAC高域エンベロープとの両方)、雑音フレームの高域符号化パラメータがバッファ内に記憶される(言い換えると、TDBWE周波数領域エンベロープのみで、TDAC高域エンベロープはなし)。切り換えの後に受信されるフレームは、雑音フレームと発話フレームとの両方を含んでもよい。
上記の実施形態では、ケース(2)及びケース(3)についての詳細な説明を行った。残りの3つのケースでは、切り換えの後に、式(1)の方法に従って、高域符号化パラメータが復元されてもよい。但し、雑音フレームの高域符号化パラメータは、TDAC高域エンベロープを有さない。従って、発話セグメントが切り換えを有した後で雑音セグメントが受信されるケースでは、その高域符号化パラメータはもはや復元されない。言い換えると、TDAC高域エンベロープは復元されず、その理由は、TDAC符号化アルゴリズムはTDBWE符号化のエンハンスメントにすぎないからである。TDBWE周波数領域エンベロープがあれば、高域信号成分を回復するのに十分である。言い換えると、この実施形態の解決法が有効にされた場合(すなわち、切り換えの後のNフレーム以内)、発話フレームは、経時変化フェードアウト動作全体が完了するまで、14kb/sという減少させられたレートで復号化される。切り換えの後のk番目のフレーム(k=1,...,N)のために、高域符号化パラメータの周波数領域エンベロープ
Figure 2011502287

(j=0,...,J−1、J=12)が復元されてもよい。
ステップS1005で、拡張を介して取得された高域符号化パラメータに対して、周波数領域整形が、周波数領域高域パラメータ経時変化重み付け法を使用して実行され、そして、整形された高域符号化パラメータが復号化されて、処理された高域信号成分が取得される。
具体的には、周波数領域整形の間、高域信号が、周波数領域内でいくつかのサブバンドに分割され、次に、各サブバンド又は各サブバンドを特徴付ける高域符号化パラメータに対して、周波数領域重み付けが、異なる利得を使用して実行され、これにより、信号帯域が徐々に狭くなる。発話フレーム内で使用される、TDBWE符号化アルゴリズムにおける周波数領域エンベロープ、又は、雑音フレームの広帯域コアレイヤにおける周波数領域エンベロープは、高域を複数のサブバンドに分割する処理を含意してもよい。復号器は、高域符号化パラメータを含む音声信号(広帯域コアレイヤを有するSIDフレーム、及び14kb/s以上のレートを有する発話フレームを含む)を受信する。広帯域−狭帯域切り換えフラグfad_out_flagが0に設定され、移行フレームの数fad_out_frame_countが0に設定される。特定の瞬間から、復号器によって受信される音声信号が、高域符号化パラメータを含まない場合(SIDフレーム内に広帯域コアレイヤがない、又は、発話フレームが14kb/sよりも低い)、復号器は、広帯域から狭帯域への切り換えを判定してもよい。広帯域−狭帯域切り換えフラグfad_out_flagが1に設定される。移行フレームの数fad_out_frame_countが、fad_out_frame_count<Nという条件を満たす場合、経時変化フェードアウト処理が、周波数領域内で符号化パラメータを重み付けすることによって実行され、重み付け係数は時間の経過と共に変化し、ここで、Nは、移行フレームの数である(例えば、N=50)。
J個の周波数領域エンベロープは、高域信号成分をJ個のサブバンドに分割してもよい。各周波数領域エンベロープは、経時変化利得係数gain(k,j)を使用して重み付けされ、言い換えると、
Figure 2011502287

とされる。このようにして、経時変化フェードアウトスペクトルエンベロープが周波数領域内で取得されてもよい。gain(k,j)を計算するための式は、次の通りである。
gain(k,j)=max(0,(J−j)×N−J×k)/(J×N),
k=1,...,N;j=0,...,J−1
処理されたTDBWE周波数領域エンベロープが、TDBWE復号化アルゴリズムを使用して復号化されて、処理された経時変化フェードアウト高域信号成分が取得されてもよい。
ステップS1006で、処理された高域信号成分と、復号化された低域信号成分
Figure 2011502287

とに対して、QMFフィルタバンクが合成フィルタリングを実行して、経時変化フェードアウト信号が復元されてもよい。
本発明の第7の実施形態では、例えば、復号器によって受信された符号ストリームに対応する雑音セグメントが、広帯域から狭帯域に切り換わる。切り換えの後、復号器は、符号ストリームに対応する発話セグメントを依然として受信する可能性があり、経時変化フェードアウト処理は、第3の方法を使用する。言い換えると、周波数領域高域パラメータ経時変化重み付け法が、拡張を介して取得された高域情報に対して周波数領域整形を実行するために使用されてもよい。音声復号化方法が図11に示されており、この方法は、以下のようなステップを含む。
ステップS1101〜S1102は、第6の実施形態におけるステップS1001〜S1002と同様であり、従って、ここでは繰り返しを行わない。
ステップS1103で、受信された符号ストリームに対応する雑音信号が広帯域から狭帯域に切り換わった場合、復号器は、受信された低域符号化パラメータを、エンベデッドCELPを使用することによって復号化して、低域信号成分
Figure 2011502287

を取得する。
ステップS1104で、人為的帯域拡張技術が、低域信号成分
Figure 2011502287

を拡張して、高域符号化パラメータを取得するために使用されてもよい。
ステップS1105で、周波数領域高域パラメータ経時変化重み付け法が、拡張を介して取得された高域符号化パラメータに対して周波数領域整形を実行するために使用されてもよく、そして、整形された高域符号化パラメータが復号化されて、処理された高域信号成分が取得される。
具体的には、周波数領域整形の間、周波数領域重み付けが、各サブバンドを表す高域符号化パラメータに対して、異なる利得を使用して実行され、これにより、信号帯域が徐々に広くなる。復号器は、広帯域符号化パラメータを含む音声信号(広帯域コアレイヤを有するSIDフレーム、及び14kb/s以上のレートを有する発話フレームを含む)を受信する。広帯域−狭帯域切り換えフラグfad_out_flagが0に設定され、移行フレームカウンタfad_out_frame_countが0に設定される。特定の瞬間から開始して、復号器によって受信される音声信号が、広帯域符号化パラメータを含まない場合(言い換えると、SIDフレームが広帯域コアレイヤを有さない、又は、発話フレームが14kb/sよりも低いレートを有する)、復号器は、広帯域から狭帯域への切り換えの発生を判定する。次に、広帯域−狭帯域切り換えフラグfad_out_flagが1に設定される。移行フレームのカウンタfad_out_frame_countが、fad_out_frame_count<Nという条件を満たす場合、経時変化フェードアウト処理が、周波数領域内で符号化パラメータを重み付けすることによって実行され、重み付け係数は時間の経過と共に変化し、ここで、Nは、移行フレームの数である(例えば、N=50)。
この実施形態では、切り換えが発生した場合、雑音フレームの広帯域符号化パラメータのみがバッファ内に記憶されている(すなわち、TDBWE周波数領域エンベロープのみで、TDAC高域エンベロープはなし)。切り換えの後に受信されるフレームは、雑音フレームと発話フレームとの両方を含む。切り換えが発生した後、本実施形態の解決法の期間中の高域符号化パラメータは、式(1)の方法を使用して復元されてもよい。しかし、雑音の高域符号化パラメータは、発話フレームにおいて必要とされるTDAC高域エンベロープパラメータを有さない。従って、受信された発話フレームのために高域符号化パラメータが復元される場合、TDAC高域エンベロープはもはや復元されず、その理由は、TDAC符号化アルゴリズムはTDBWE符号化のエンハンスメントにすぎないからである。TDBWE周波数領域エンベロープがあれば、高域信号成分を回復するのに十分である。言い換えると、この実施形態の解決法が有効にされた場合(すなわち、切り換えの後のNフレーム以内)、発話フレームは、経時変化フェードアウト動作全体が完了するまで、14kb/sという減少させられたレートで復号化される。切り換えの後のk番目のフレーム(k=1,...,N)のための、復元される高広帯域符号化パラメータは、周波数領域エンベロープ
Figure 2011502287

(j=0,...,J−1、J=12)が高域成分をJ個のサブバンドに分割するものである。各サブバンドは、経時変化フェードアウト利得係数gain(k,j)を使用して重み付けされ、言い換えると、
Figure 2011502287

とされる。このようにして、経時変化フェードアウトスペクトルエンベロープが周波数領域内で取得されてもよい。gain(k,j)を計算するための式は、次の通りである。
gain(k,j)=max(0,(J−j)×N−J×k)/(J×N),
k=1,...,N;j=0,...,J−1
処理されたTDBWE周波数領域エンベロープが、TDBWE復号化アルゴリズムを使用して復号化されて、経時変化フェードアウト高域信号成分が取得されてもよい。
ステップS1106で、処理された高域信号成分と、復号化された狭帯域信号成分
Figure 2011502287

とに対して、QMFフィルタバンクが合成フィルタリングを実行して、経時変化フェードアウト信号が復元されてもよい。
本発明の第8の実施形態では、例えば、復号器によって受信された符号ストリームに対応する発話セグメントが、広帯域から狭帯域に切り換わり、復号器は、切り換えの後、符号ストリームに対応する雑音セグメントを依然として受信する可能性があり、経時変化フェードアウト処理は、第3の方法の簡略化されたバージョンを使用する。音声復号化方法が図12に示されており、この方法は、以下のようなステップを含む。
ステップS1201〜S1202は、第6の実施形態におけるステップS1001〜S1002と同様であり、従って、ここでは繰り返しを行わない。
ステップS1203で、受信された発話信号が広帯域から狭帯域に切り換わった場合、復号器は、受信された低域符号化パラメータを、エンベデッドCELPを使用して復号化して、低域信号成分
Figure 2011502287

を取得してもよい。
ステップS1204で、人為的帯域拡張技術が、低域信号成分
Figure 2011502287

を拡張して、高域符号化パラメータを取得するために使用される。
広帯域から狭帯域への切り換えが発生したとき、バッファ内に記憶されている音声信号は、切り換えの後に受信された音声信号と同じ、又は異なるタイプのものであってもよく、そして、第6の実施形態で説明した5つのケースが含まれてもよい。上記の実施形態では、ケース(2)及びケース(3)についての詳細な説明を行った。残りの3つのケースについては、切り換えの後に、式(1)の方法に従って、高域符号化パラメータが復元されてもよい。但し、雑音フレームの高域符号化パラメータは、TDAC高域エンベロープを有さない。従って、符号化パラメータを復元するために、TDAC高域エンベロープは復元されず、TDBWEアルゴリズムにおける周波数領域エンベロープ
Figure 2011502287

のみが復元される。TDAC符号化アルゴリズムはTDBWE符号化のエンハンスメントにすぎない。TDBWE周波数領域エンベロープがあれば、高域信号成分を回復するのに十分である。言い換えると、この実施形態の解決法が有効にされた場合(すなわち、切り換えの後のCOUNTfad_outフレーム以内)、発話フレームは、経時変化フェードアウト動作全体が完了するまで、14kb/sという減少させられたレートで復号化される。切り換えの後のk番目のフレーム(k=1,...,COUNTfad_out−1)のための、復元される高域符号化パラメータは、周波数領域エンベロープ
Figure 2011502287

(j=0,...,J−1)が高域成分をJ個のサブバンドに分割するようなものである。
ステップS1205で、拡張を介して取得された高域符号化パラメータに対して周波数領域整形を実行するための、簡略化された方法が使用され、そして、整形された高域符号化パラメータが復号化されて、処理された高域信号成分が取得される。
周波数領域整形の間、復元された周波数領域エンベロープ
Figure 2011502287

は、高域信号を、周波数領域内でJ個のサブバンドに分割する。広帯域−狭帯域切り換えフラグfad_out_flagが1であり、かつ、移行フレームカウンタfad_out_frame_countが、fad_out_frame_count<COUNTfad_outという条件を満たす場合、経時変化フェードアウト処理が、切り換えの後のk番目のフレームのために復元された周波数領域エンベロープに対して、式(4)又は(5)又は(6)を使用して実行される。
Figure 2011502287

(4)
Figure 2011502287

(5)
Figure 2011502287

(6)
上式で、
Figure 2011502287

は、x以下の最大の整数を表す。TDBWE復号化アルゴリズムが、処理されたTDBWE周波数領域エンベロープに対して使用されて、経時変化フェードアウト高域信号成分が取得されてもよい。LOW_LEVELは、量子化テーブル内の、周波数領域エンベロープのための可能な最小の値である。例えば、周波数領域エンベロープ
Figure 2011502287

(j=0,...,3)は、マルチレベル量子化技術を使用し、レベル1量子化コードブックは、次の通りである。
Figure 2011502287
レベル2量子化コードブックは、次の通りである。
Figure 2011502287
次に、
Figure 2011502287

であり、ここで、l1(j)は、レベル1量子化ベクトルであり、l2(j)は、レベル2量子化ベクトルである。この実施形態では、
Figure 2011502287

の最小値は、−3.0000+(−12.95541)=−15.95541である。更に、実際の配備では、最小値は、十分に小さな値の選択肢に簡略化されてもよい。
更に、
Figure 2011502287

を決定するための上記の方法は、本発明の好ましい実施形態であることに留意されたい。実際の配備では、値は、簡略化されるか、又は、特定の技術的要求に応じた技術的要件を満たす他の値に置き換えられてもよい。それらの変更も本発明の範囲に入る。
ステップS1206で、処理された高域信号成分と、復号化された、復元された低域信号成分とに対して、QMFフィルタバンクが合成フィルタリングを実行して、経時変化フェードアウト信号が復元される。
本発明は、広帯域から狭帯域への切り換え、及び、UWBから広帯域への切り換えに適用される。上述の実施形態では、高域信号成分は、TDBWE又はTDAC復号化アルゴリズムを使用して復号化される。本発明は、TDBWE及びTDAC復号化アルゴリズムに加えて、その他の広帯域符号化アルゴリズムにも適用されることに留意されたい。加えて、切り換えの後で高域信号成分及び高域符号化パラメータを拡張するための、本明細書では説明しない様々な方法が存在しうる。
本発明の実施形態で提供される方法を使用すれば、音声信号が広帯域から狭帯域への切り換えを有する場合に、帯域幅検知、人為的帯域拡張、経時変化フェードアウト処理、及び帯域幅合成などの一連の処理が、切り換えが広帯域信号から狭帯域信号への滑らかな移行を有するようにするために使用されてもよく、これにより、快適な聴取体験が達成されることが可能である。
本発明の第9の実施形態による音声復号化装置が図12に示されており、この装置は、取得ユニット10と、拡張ユニット20と、経時変化フェードアウト処理ユニット30と、合成ユニット40とを含む。
取得ユニット10は、受信された符号ストリームに対応する音声信号の低域信号成分を、音声信号が第1の帯域幅から、第1の帯域幅よりも狭い第2の帯域幅に切り換わった場合に取得し、低域信号成分を拡張ユニット20に送信するように構成される。
拡張ユニット20は、低域信号成分を拡張して高域情報を取得し、拡張を介して取得された高域情報を経時変化フェードアウト処理ユニット30に送信するように構成される。
経時変化フェードアウト処理ユニット30は、拡張を介して取得された高域情報に対して経時変化フェードアウト処理を実行して、処理された高域信号成分を取得し、処理された高域信号成分を合成ユニット40に送信するように構成される。
合成ユニット40は、受信された、処理された高域信号成分と、取得ユニット10によって取得された低域信号成分とを合成するように構成される。
装置は、処理ユニット50と、検知ユニット60とを更に含む。
処理ユニット50は、受信された符号ストリームのフレーム構成を判定し、符号ストリームのフレーム構成を検知ユニット60に送信するように構成される。
検知ユニット60は、処理ユニット50から送信された、符号ストリームのフレーム構成に従って、第1の帯域幅から第2の帯域幅への切り換えが発生したかどうかを検知し、第1の帯域幅から第2の帯域幅への切り換えが発生した場合に、符号ストリームを取得ユニット10に送信するように構成される。
具体的には、拡張ユニット20は、第1の拡張サブユニット21、第2の拡張サブユニット22、及び第3の拡張サブユニット23のうちの少なくとも1つを更に含む。
第1の拡張サブユニット21は、低域信号成分を、切り換えの前に受信された高域信号成分のための符号化パラメータを使用することによって拡張して、高域符号化パラメータを取得するように構成される。
第2の拡張サブユニット22は、低域信号成分を、切り換えの前に受信された高域信号成分のための符号化パラメータを使用することによって拡張して、高域信号成分を取得するように構成される。
第3の拡張サブユニット23は、切り換えの後の現在の音声フレームから復号化された低域信号成分を拡張して、高域信号成分を取得するように構成される。
経時変化フェードアウト処理ユニット30は、セパレート処理サブユニット31、及びハイブリッド処理サブユニット32のうちの少なくとも1つを更に含む。
セパレート処理サブユニット31は、拡張を介して取得された高域情報が高域信号成分である場合に、拡張を介して取得された高域信号成分に対して、時間領域整形及び/又は周波数領域整形を実行し、処理された高域信号成分を合成ユニット40に送信するように構成される。
ハイブリッド処理サブユニット32は、拡張を介して取得された高域情報が高域符号化パラメータである場合に、拡張を介して取得された高域符号化パラメータに対して周波数領域整形を実行するか、又は、拡張を介して取得された高域情報が高域信号成分である場合に、拡張を介して取得された高域信号成分をサブバンドに分割し、各サブバンドのための符号化パラメータに対して周波数領域整形を実行し、処理された高域信号成分を合成ユニット50に送信するように構成される。
セパレート処理サブユニット31は、第1のサブユニット311、第2のサブユニット312、第3のサブユニット313、及び第4のサブユニット314のうちの少なくとも1つを更に含む。
第1のサブユニット311は、拡張を介して取得された高域信号成分に対して、時間領域整形を、時間領域利得係数を使用することによって実行し、処理された高域信号成分を合成ユニット40に送信するように構成される。
第2のサブユニット312は、拡張を介して取得された高域信号成分に対して、周波数領域整形を、経時変化フィルタリングを使用することによって実行し、処理された高域信号成分を合成ユニット40に送信するように構成される。
第3のサブユニット313は、拡張を介して取得された高域信号成分に対して、時間領域整形を、時間領域利得係数を使用することによって実行し、時間領域整形された高域信号成分に対して、周波数領域整形を、経時変化フィルタリングを使用することによって実行し、処理された高域信号成分を合成ユニット40に送信するように構成される。
第4のサブユニット314は、拡張を介して取得された高域信号成分に対して、周波数領域整形を、経時変化フィルタリングを使用することによって実行し、周波数領域整形された高域信号成分に対して、時間領域整形を、時間領域利得係数を使用することによって実行し、処理された高域信号成分を合成ユニット40に送信するように構成される。
ハイブリッド処理サブユニット32は、第5のサブユニット321、及び第6のサブユニット322のうちの少なくとも1つを更に含む。
第5のサブユニット321は、拡張を介して取得された高域情報が高域符号化パラメータである場合に、拡張を介して取得された高域符号化パラメータに対して、周波数領域整形を、周波数領域高域パラメータ経時変化重み付け法を使用することによって実行して、経時変化フェードアウトスペクトルエンベロープを取得し、高域信号成分を復号化を介して取得し、処理された高域信号成分を合成ユニット40に送信するように構成される。
第6のサブユニット322は、拡張を介して取得された高域情報が高域信号成分である場合に、拡張を介して取得された高域信号成分をサブバンドに分割し、各サブバンドのための符号化パラメータに対して、周波数領域高域パラメータ経時変化重み付けを実行して、経時変化フェードアウトスペクトルエンベロープを取得し、高域信号成分を復号化を介して取得し、処理された高域信号成分を合成ユニット40に送信するように構成される。
本発明の実施形態で提供される装置を使用すれば、音声信号が広帯域から狭帯域への切り換えを有する場合に、帯域幅検知、人為的帯域拡張、経時変化フェードアウト処理、及び帯域幅合成などの一連の処理が、切り換えが広帯域信号から狭帯域信号への滑らかな移行を有するようにするために使用されてもよく、これにより、快適な聴取体験が達成されることが可能である。
様々な実施形態についての上記の説明から、当業者は、本発明が、ハードウェア内で、又はソフトウェアと必要な汎用ハードウェアプラットフォームとによって実施されてもよいということを明確に理解するであろう。この理解に基づいて、本発明の技術的解決法は、ソフトウェア製品として実施されてもよい。ソフトウェア製品は、不揮発性記憶媒体(ROM/RAM、Uディスク、リムーバブルディスクなどであってもよい)内に記憶されてもよく、コンピュータ装置(PC、サーバ、ネットワーク装置など)に本発明の様々な実施形態による方法を実行させるいくつかの命令を含む。
本発明についての詳細な説明を、いくつかの好ましい実施形態を参照して上記で行ったが、それらの実施形態は、本発明の範囲を限定するために使用されるものではない。本発明の原理内で行われる様々な変更、均等物との置換、及び改良は、本発明の範囲に入ることが意図される。

Claims (16)

  1. 受信された符号ストリーム内の音声信号の低域信号成分を、前記音声信号が第1の帯域幅から、前記第1の帯域幅よりも狭い第2の帯域幅に切り換わった場合に取得し、
    前記低域信号成分を拡張して高域情報を取得し、
    拡張を介して取得された前記高域情報に対して経時変化フェードアウト処理を実行して、処理された高域信号成分を取得し、
    前記処理された高域信号成分と、前記取得された低域信号成分とを合成すること
    を含む、音声信号復号化方法。
  2. 前記音声信号の前記低域信号成分を取得する前に、前記方法は、
    前記受信された符号ストリームのフレーム構成を判定し、
    前記第1の帯域幅から前記第2の帯域幅への前記切り換えが発生したかどうかを、前記フレーム構成に従って検知すること
    を更に含む、請求項1に記載の音声信号復号化方法。
  3. 前記低域信号成分を拡張して高域情報を取得することは、
    前記低域信号成分を、前記切り換えの前に受信された高域信号成分のための符号化パラメータを使用することによって拡張して、高域復号化パラメータである高域情報を取得し、又は、
    前記低域信号成分を、前記切り換えの前に受信された高域信号成分のための符号化パラメータを使用することによって拡張して、高域信号成分である高域情報を取得し、又は、
    前記切り換えの後の現在の音声フレームから復号化された低域信号成分を拡張して、高域信号成分を取得すること
    を更に含む、請求項1に記載の音声信号復号化方法。
  4. 前記低域信号成分を、前記切り換えの前に受信された前記高域信号成分のための前記符号化パラメータを使用することによって拡張して、高域情報を取得することは、
    前記切り換えの前に受信された音声フレームの高域符号化パラメータをバッファリングし、
    現在の音声フレームの高域符号化パラメータを、前記切り換えの後の外挿を使用することによって推定すること
    を含む、請求項3に記載の音声信号復号化方法。
  5. 前記低域信号成分を、前記切り換えの前に受信された前記高域信号成分のための前記符号化パラメータを使用することによって拡張して、高域情報を取得することは、
    前記切り換えの前に受信された音声フレームの高域符号化パラメータをバッファリングし、
    現在の音声フレームの高域符号化パラメータを、前記切り換えの後の外挿を使用することによって推定し、
    外挿を使用して推定された前記高域符号化パラメータを、対応する広帯域復号化アルゴリズムを使用して拡張して、高域信号成分を取得すること
    を含む、請求項3に記載の音声信号復号化方法。
  6. 前記高域情報に対して経時変化フェードアウト処理を実行することは、
    前記高域情報に対してセパレート経時変化フェードアウト処理を実行すること、又は
    前記高域情報に対してハイブリッド経時変化フェードアウト処理を実行すること
    を含む、請求項1に記載の音声信号復号化方法。
  7. 前記高域情報は高域信号成分であり、前記高域情報に対してセパレート経時変化フェードアウト処理を実行するステップは、
    拡張を介して取得された前記高域信号成分に対して、時間領域整形を、時間領域利得係数を使用することによって実行すること、又は、
    拡張を介して取得された前記高域信号成分に対して、周波数領域整形を、経時変化フィルタリングを使用することによって実行すること
    を更に含む、請求項6に記載の音声信号復号化方法。
  8. 拡張を介して取得された前記高域信号成分に対して、時間領域整形を、時間領域利得係数を使用することによって実行した後に、前記方法は、
    前記時間領域整形された高域信号成分に対して、周波数領域整形を、経時変化フィルタリングを使用することによって実行すること
    を更に含む、請求項7に記載の音声信号復号化方法。
  9. 拡張を介して取得された前記高域信号成分に対して、周波数領域整形を、経時変化フィルタリングを使用することによって実行した後に、前記方法は、
    前記周波数領域整形された高域信号成分に対して、時間領域整形を、時間領域利得係数を使用することによって実行すること
    を更に含む、請求項7に記載の音声信号復号化方法。
  10. 前記高域情報に対してハイブリッド経時変化フェードアウト処理を実行することは、
    前記高域情報が高域符号化パラメータである場合に、拡張を介して取得された前記高域符号化パラメータに対して、周波数領域整形を、周波数領域高域パラメータ経時変化重み付け法を使用することによって実行して、経時変化フェードアウトスペクトルエンベロープを取得し、そして、高域信号成分を復号化を介して取得すること、又は、
    前記高域情報が高域信号成分である場合に、拡張を介して取得された前記高域信号成分をサブバンドに分割し、各サブバンドのための符号化パラメータに対して、周波数領域高域パラメータ経時変化重み付けを実行して、経時変化フェードアウトスペクトルエンベロープを取得し、そして、高域信号成分を復号化を介して取得すること
    を更に含む、請求項6に記載の音声信号復号化方法。
  11. 取得ユニットと、拡張ユニットと、経時変化フェードアウト処理ユニットと、合成ユニットとを備え、
    前記取得ユニットは、受信された符号ストリーム内の音声信号の低域信号成分を、前記音声信号が第1の帯域幅から、前記第1の帯域幅よりも狭い第2の帯域幅に切り換わった場合に取得し、前記低域信号成分を前記拡張ユニットに送信するように構成され、
    前記拡張ユニットは、前記低域信号成分を拡張して高域情報を取得し、拡張を介して取得された前記高域情報を前記経時変化フェードアウト処理ユニットに送信するように構成され、
    前記経時変化フェードアウト処理ユニットは、拡張を介して取得された前記高域情報に対して経時変化フェードアウト処理を実行して、処理された高域信号成分を取得し、前記処理された高域信号成分を前記合成ユニットに送信するように構成され、
    前記合成ユニットは、受信された、前記処理された高域信号成分と、前記取得ユニットによって取得された前記低域信号成分とを合成するように構成された、音声信号復号化装置。
  12. 処理ユニットと、検知ユニットとを更に備え、
    前記処理ユニットは、前記受信された符号ストリームのフレーム構成を判定し、前記符号ストリームの前記フレーム構成を前記検知ユニットに送信するように構成され、
    前記検知ユニットは、前記処理ユニットから送信された、前記符号ストリームの前記フレーム構成に従って、前記第1の帯域幅から前記第2の帯域幅への前記切り換えが発生したかどうかを検知し、前記第1の帯域幅から前記第2の帯域幅への前記切り換えが発生した場合に、前記符号ストリームを前記取得ユニットに送信するように構成された、請求項11に記載の音声信号復号化装置。
  13. 前記拡張ユニットは、第1の拡張サブユニット、第2の拡張サブユニット、及び第3の拡張サブユニットのうちの少なくとも1つを更に備え、
    前記第1の拡張サブユニットは、前記低域信号成分を、前記切り換えの前に受信された高域信号成分のための符号化パラメータを使用することによって拡張して、高域符号化パラメータを取得するように構成され、
    前記第2の拡張サブユニットは、前記低域信号成分を、前記切り換えの前に受信された高域信号成分のための符号化パラメータを使用することによって拡張して、高域信号成分を取得するように構成され、
    前記第3の拡張サブユニットは、前記切り換えの後の現在の音声フレームから復号化された低域信号成分を拡張して、高域信号成分を取得するように構成された、請求項11に記載の音声信号復号化装置。
  14. 前記経時変化フェードアウト処理ユニットは、セパレート処理サブユニット、又はハイブリッド処理サブユニットを更に備え、
    前記セパレート処理サブユニットは、拡張を介して取得された前記高域情報が高域信号成分である場合に、拡張を介して取得された前記高域信号成分に対して、時間領域整形及び/又は周波数領域整形を実行し、処理された高域信号成分を前記合成ユニットに送信するように構成され、
    前記ハイブリッド処理サブユニットは、
    拡張を介して取得された前記高域情報が高域符号化パラメータである場合に、拡張を介して取得された前記高域符号化パラメータに対して周波数領域整形を実行するか、又は、
    拡張を介して取得された前記高域情報が高域信号成分である場合に、拡張を介して取得された前記高域信号成分をサブバンドに分割し、各サブバンドのための符号化パラメータに対して周波数領域整形を実行し、処理された高域信号成分を前記合成ユニットに送信するように構成された、請求項11に記載の音声信号復号化装置。
  15. 前記セパレート処理サブユニットは、第1のサブユニット、第2のサブユニット、第3のサブユニット、及び第4のサブユニットのうちの少なくとも1つを更に備え、
    前記第1のサブユニットは、拡張を介して取得された前記高域信号成分に対して、時間領域整形を、時間領域利得係数を使用することによって実行し、処理された高域信号成分を前記合成ユニットに送信するように構成され、
    前記第2のサブユニットは、拡張を介して取得された前記高域信号成分に対して、周波数領域整形を、経時変化フィルタリングを使用することによって実行し、処理された高域信号成分を前記合成ユニットに送信するように構成され、
    前記第3のサブユニットは、拡張を介して取得された前記高域信号成分に対して、時間領域整形を、時間領域利得係数を使用することによって実行し、前記時間領域整形された高域信号成分に対して、周波数領域整形を、経時変化フィルタリングを使用することによって実行し、処理された高域信号成分を前記合成ユニットに送信するように構成され、
    前記第4のサブユニットは、拡張を介して取得された前記高域信号成分に対して、周波数領域整形を、経時変化フィルタリングを使用することによって実行し、前記周波数領域整形された高域信号成分に対して、時間領域整形を、時間領域利得係数を使用することによって実行し、処理された高域信号成分を前記合成ユニットに送信するように構成された、請求項14に記載の音声信号復号化装置。
  16. 前記ハイブリッド処理サブユニットは、第5のサブユニット、及び第6のサブユニットのうちの少なくとも1つを更に備え、
    前記第5のサブユニットは、
    拡張を介して取得された前記高域情報が高域符号化パラメータである場合に、拡張を介して取得された前記高域符号化パラメータに対して、周波数領域整形を、周波数領域高域パラメータ経時変化重み付け法を使用することによって実行して、経時変化フェードアウトスペクトルエンベロープを取得し、
    高域信号成分を復号化を介して取得し、
    処理された高域信号成分を前記合成ユニットに送信するように構成され、
    前記第6のサブユニットは、
    拡張を介して取得された前記高域情報が高域信号成分である場合に、拡張を介して取得された前記高域信号成分をサブバンドに分割し、
    各サブバンドのための前記符号化パラメータに対して、周波数領域高域パラメータ経時変化重み付けを実行して、経時変化フェードアウトスペクトルエンベロープを取得し、
    高域信号成分を復号化を介して取得し、
    処理された高域信号成分を前記合成ユニットに送信するように構成された、請求項14に記載の音声信号復号化装置。
JP2010532409A 2007-11-02 2008-10-20 音声復号化方法及び装置 Active JP5547081B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
CN200710166745 2007-11-02
CN200710166745.5 2007-11-02
CN200710187437 2007-11-23
CN200710187437.0 2007-11-23
CN200810084725A CN100585699C (zh) 2007-11-02 2008-03-14 一种音频解码的方法和装置
CN200810084725.8 2008-03-14
PCT/CN2008/072756 WO2009056027A1 (fr) 2007-11-02 2008-10-20 Procédé et dispositif de décodage audio

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2013141872A Division JP2013235284A (ja) 2007-11-02 2013-07-05 音声復号化方法及び装置

Publications (2)

Publication Number Publication Date
JP2011502287A true JP2011502287A (ja) 2011-01-20
JP5547081B2 JP5547081B2 (ja) 2014-07-09

Family

ID=40590539

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2010532409A Active JP5547081B2 (ja) 2007-11-02 2008-10-20 音声復号化方法及び装置
JP2013141872A Pending JP2013235284A (ja) 2007-11-02 2013-07-05 音声復号化方法及び装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2013141872A Pending JP2013235284A (ja) 2007-11-02 2013-07-05 音声復号化方法及び装置

Country Status (7)

Country Link
US (1) US8473301B2 (ja)
EP (2) EP2207166B1 (ja)
JP (2) JP5547081B2 (ja)
KR (1) KR101290622B1 (ja)
BR (1) BRPI0818927A2 (ja)
RU (1) RU2449386C2 (ja)
WO (1) WO2009056027A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011512564A (ja) * 2008-02-19 2011-04-21 シーメンス エンタープライズ コミュニケーションズ ゲゼルシャフト ミット ベシュレンクテル ハフツング ウント コンパニー コマンディートゲゼルシャフト 背景雑音情報の復号化方法および背景雑音情報の復号化手段
JP2016038513A (ja) * 2014-08-08 2016-03-22 富士通株式会社 音声切替装置、音声切替方法及び音声切替用コンピュータプログラム
JP2017062512A (ja) * 2011-12-30 2017-03-30 華為技術有限公司Huawei Technologies Co.,Ltd. オーディオ・データを処理するための方法、装置、及びシステム

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
DE102008009719A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
EP2357649B1 (en) * 2010-01-21 2012-12-19 Electronics and Telecommunications Research Institute Method and apparatus for decoding audio signal
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN101964189B (zh) * 2010-04-28 2012-08-08 华为技术有限公司 语音频信号切换方法及装置
US8000968B1 (en) 2011-04-26 2011-08-16 Huawei Technologies Co., Ltd. Method and apparatus for switching speech or audio signals
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
CN102404072B (zh) 2010-09-08 2013-03-20 华为技术有限公司 一种信息比特发送方法、装置和系统
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
CN105469805B (zh) 2012-03-01 2018-01-12 华为技术有限公司 一种语音频信号处理方法和装置
CN103516440B (zh) 2012-06-29 2015-07-08 华为技术有限公司 语音频信号处理方法和编码装置
AU2014211544B2 (en) * 2013-01-29 2017-03-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Noise filling in perceptual transform audio coding
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
EP3011561B1 (en) 2013-06-21 2017-05-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for improved signal fade out in different domains during error concealment
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
WO2015041070A1 (ja) 2013-09-19 2015-03-26 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
US9293143B2 (en) 2013-12-11 2016-03-22 Qualcomm Incorporated Bandwidth extension mode selection
KR20230042410A (ko) 2013-12-27 2023-03-28 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
CN104753653B (zh) * 2013-12-31 2019-07-12 中兴通讯股份有限公司 一种解速率匹配的方法、装置和接收侧设备
KR101864122B1 (ko) 2014-02-20 2018-06-05 삼성전자주식회사 전자 장치 및 전자 장치의 제어 방법
JP6035270B2 (ja) * 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
US9542955B2 (en) * 2014-03-31 2017-01-10 Qualcomm Incorporated High-band signal coding using multiple sub-bands
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
EP3340664A1 (en) 2015-09-15 2018-06-27 Huawei Technologies Co., Ltd. Method and network device for establishing a wireless bearer
PL3555885T3 (pl) * 2016-12-16 2021-01-11 Telefonaktiebolaget Lm Ericsson (Publ) Sposób i koder do obsługi współczynników reprezentacji obwiedni
US10339947B2 (en) 2017-03-22 2019-07-02 Immersion Networks, Inc. System and method for processing audio data
RU2727794C1 (ru) 2017-05-18 2020-07-24 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Управляющее сетевое устройство
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007000988A1 (ja) * 2005-06-29 2007-01-04 Matsushita Electric Industrial Co., Ltd. スケーラブル復号装置および消失データ補間方法

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08278800A (ja) * 1995-04-05 1996-10-22 Fujitsu Ltd 音声通信システム
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP4132154B2 (ja) * 1997-10-23 2008-08-13 ソニー株式会社 音声合成方法及び装置、並びに帯域幅拡張方法及び装置
JP4099879B2 (ja) * 1998-10-26 2008-06-11 ソニー株式会社 帯域幅拡張方法及び装置
GB2357682B (en) * 1999-12-23 2004-09-08 Motorola Ltd Audio circuit and method for wideband to narrowband transition in a communication device
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
FI115329B (fi) 2000-05-08 2005-04-15 Nokia Corp Menetelmä ja järjestely lähdesignaalin kaistanleveyden vaihtamiseksi tietoliikenneyhteydessä, jossa on valmiudet useisiin kaistanleveyksiin
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
US20020128839A1 (en) * 2001-01-12 2002-09-12 Ulf Lindgren Speech bandwidth extension
US7113522B2 (en) 2001-01-24 2006-09-26 Qualcomm, Incorporated Enhanced conversion of wideband signals to narrowband signals
SE522553C2 (sv) 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
WO2003007480A1 (fr) 2001-07-13 2003-01-23 Matsushita Electric Industrial Co., Ltd. Dispositif de decodage de signaux audio et dispositif de codage de signaux audio
US6988066B2 (en) * 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
CN1248194C (zh) 2001-11-14 2006-03-29 松下电器产业株式会社 编码装置、解码装置及其系统和方法
FR2849727B1 (fr) * 2003-01-08 2005-03-18 France Telecom Procede de codage et de decodage audio a debit variable
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
EP1638083B1 (en) * 2004-09-17 2009-04-22 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited audio signals
CN100592389C (zh) * 2008-01-18 2010-02-24 华为技术有限公司 合成滤波器状态更新方法及装置
JP4821131B2 (ja) * 2005-02-22 2011-11-24 沖電気工業株式会社 音声帯域拡張装置
MX2007012187A (es) * 2005-04-01 2007-12-11 Qualcomm Inc Sistemas, metodos y aparatos para deformacion en tiempo de banda alta.
US8249861B2 (en) * 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
JP4604864B2 (ja) * 2005-06-14 2011-01-05 沖電気工業株式会社 帯域拡張装置及び不足帯域信号生成器
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
ES2356492T3 (es) * 2005-07-22 2011-04-08 France Telecom Método de conmutación de tasa de transmisión en decodificación de audio escalable en tasa de transmisión y ancho de banda.
US7734462B2 (en) * 2005-09-02 2010-06-08 Nortel Networks Limited Method and apparatus for extending the bandwidth of a speech signal
EP1772855B1 (en) * 2005-10-07 2013-09-18 Nuance Communications, Inc. Method for extending the spectral bandwidth of a speech signal
US7546237B2 (en) * 2005-12-23 2009-06-09 Qnx Software Systems (Wavemakers), Inc. Bandwidth extension of narrowband speech
JP2007271916A (ja) * 2006-03-31 2007-10-18 Yamaha Corp 音声データ圧縮装置および伸張装置
JP2007310298A (ja) * 2006-05-22 2007-11-29 Oki Electric Ind Co Ltd 帯域外信号生成装置及び周波数帯域拡張装置
CN2927247Y (zh) * 2006-07-11 2007-07-25 中兴通讯股份有限公司 语音解码器
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
KR101377702B1 (ko) * 2008-12-11 2014-03-25 한국전자통신연구원 가변 대역 코덱 및 그 제어 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007000988A1 (ja) * 2005-06-29 2007-01-04 Matsushita Electric Industrial Co., Ltd. スケーラブル復号装置および消失データ補間方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011512564A (ja) * 2008-02-19 2011-04-21 シーメンス エンタープライズ コミュニケーションズ ゲゼルシャフト ミット ベシュレンクテル ハフツング ウント コンパニー コマンディートゲゼルシャフト 背景雑音情報の復号化方法および背景雑音情報の復号化手段
JP2017062512A (ja) * 2011-12-30 2017-03-30 華為技術有限公司Huawei Technologies Co.,Ltd. オーディオ・データを処理するための方法、装置、及びシステム
US10529345B2 (en) 2011-12-30 2020-01-07 Huawei Technologies Co., Ltd. Method, apparatus, and system for processing audio data
US11183197B2 (en) 2011-12-30 2021-11-23 Huawei Technologies Co., Ltd. Method, apparatus, and system for processing audio data
US11727946B2 (en) 2011-12-30 2023-08-15 Huawei Technologies Co., Ltd. Method, apparatus, and system for processing audio data
JP2016038513A (ja) * 2014-08-08 2016-03-22 富士通株式会社 音声切替装置、音声切替方法及び音声切替用コンピュータプログラム

Also Published As

Publication number Publication date
EP2629293A3 (en) 2014-01-08
RU2449386C2 (ru) 2012-04-27
JP5547081B2 (ja) 2014-07-09
EP2207166B1 (en) 2013-06-19
EP2207166A4 (en) 2010-11-24
JP2013235284A (ja) 2013-11-21
US8473301B2 (en) 2013-06-25
EP2629293A2 (en) 2013-08-21
BRPI0818927A2 (pt) 2015-06-16
EP2207166A1 (en) 2010-07-14
US20100228557A1 (en) 2010-09-09
KR101290622B1 (ko) 2013-07-29
WO2009056027A1 (fr) 2009-05-07
RU2010122326A (ru) 2011-12-10
KR20100085991A (ko) 2010-07-29

Similar Documents

Publication Publication Date Title
JP5547081B2 (ja) 音声復号化方法及び装置
JP6346322B2 (ja) フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置
KR101981548B1 (ko) 시간 도메인 여기 신호를 기초로 하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법
KR101940742B1 (ko) 시간 도메인 여기 신호를 변형하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법
TWI606440B (zh) 訊框錯誤隱藏裝置
KR101455915B1 (ko) 일반 오디오 및 음성 프레임을 포함하는 오디오 신호용 디코더
JP4838235B2 (ja) 音声信号の符号化
CN100585699C (zh) 一种音频解码的方法和装置
CN109155133B (zh) 音频帧丢失隐藏的错误隐藏单元、音频解码器及相关方法
KR101248535B1 (ko) 배경 노이즈 생성 방법 및 노이즈 처리 장치
JP2021502596A (ja) ピッチラグの選択

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120417

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120717

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130705

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130716

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20130816

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20131127

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20131202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140514

R150 Certificate of patent or registration of utility model

Ref document number: 5547081

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250