JP2011502287A

JP2011502287A - 音声復号化方法及び装置

Info

Publication number: JP2011502287A
Application number: JP2010532409A
Authority: JP
Inventors: チェン、ツェー; イン、フリァン; チャン、シャオユ; ダイ、ジンリァン; チャン、リビン
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2007-11-02
Filing date: 2008-10-20
Publication date: 2011-01-20
Anticipated expiration: 2028-10-20
Also published as: EP2629293A3; RU2449386C2; JP5547081B2; EP2207166B1; EP2207166A4; JP2013235284A; US8473301B2; EP2629293A2; BRPI0818927A2; EP2207166A1; US20100228557A1; KR101290622B1; WO2009056027A1; RU2010122326A; KR20100085991A

Abstract

音声信号復号化方法は、音声信号の低域信号成分を、受信された符号化符号ストリームに対応する音声信号が第１の帯域幅から第２の帯域幅に変換された場合に取得し、ここで、第１の帯域幅は第２の帯域幅よりも広く（Ｓ３０３）、高域情報を、低域信号成分から拡張して導き出し（Ｓ３０４）、拡張により導き出された高域情報に対して、時間と共に徐々に変化する処理を行って、処理された高域信号成分を取得し（Ｓ３０５）、処理された高域信号成分を、取得された低域信号成分と合成すること（Ｓ３０６）を含む。

Description

本開示は、音声（ボイス）通信の分野に関し、特に、音声（オーディオ）復号化の方法及び装置に関する。

Ｇ．７２９．１は、国際電気通信連合（ＩＴＵ）によって新たに公開された、新世代の発話（スピーチ）符号化及び復号化標準である。このエンベデッド発話符号化及び復号化標準は、８ｋｂ／ｓ〜３２ｋｂ／ｓのレート範囲内で狭帯域から広帯域までの音声品質を提供することが可能な、レイヤード符号化の機能を有することで最も良く特徴付けられる。伝送処理の間に、外側のレイヤの符号ストリームが、チャネル状態に応じて廃棄されてもよく、従って、良好なチャネル適応が達成されることが可能である。

Ｇ．７２９．１標準では、レイヤリングの機能は、符号ストリームを、エンベデッドレイヤード構成の中に形成することによって達成され、従って、新規なエンベデッドレイヤードマルチレート発話コーデックが必要とされる。２０ｍｓのスーパーフレームが入力される場合、サンプリングレートが１６０００Ｈｚならば、フレームの長さは３２０ポイントである。図１は、各レイヤにおいて符号器を有するＧ．７２９．１システムのブロック図である。発話コーデックは、以下のような特定の符号化処理を有する。最初に、入力信号Ｓ_ＷＢ（ｎ）が、直交ミラーフィルタバンク（ＱＭＦ）によって、２つのサブバンド（Ｈ_１（ｚ）、Ｈ_２（ｚ））に分割される。低域サブバンド信号Ｓ^ｑｍｆ _ＬＢ（ｎ）は、５０Ｈｚのカットオフ周波数を有するハイパスフィルタにおいて前処理される。出力信号Ｓ_ＬＢ（ｎ）は、８ｋｂ／ｓ〜１２ｋｂ／ｓ狭帯域エンベデッド符号励振線形予測（ＣＥＬＰ）符号器によって符号化される。Ｓ_ＬＢ（ｎ）と、１２Ｋｂ／ｓのレートにおけるＣＥＬＰ符号器の局所合成信号

との間の差信号ｄ_ＬＢ（ｎ）は、知覚重み付けフィルタ（Ｗ_ＬＢ（ｚ））を通過し、信号ｄ^ｗ _ＬＢ（ｎ）が取得される。信号ｄ^ｗ _ＬＢ（ｎ）は、周波数領域への変形離散コサイン変換（ＭＤＣＴ）を受ける。重み付けフィルタＷ_ＬＢ（ｚ）は、フィルタの出力信号ｄ^ｗ _ＬＢ（ｎ）と、高域サブバンド入力信号Ｓ_ＨＢ（ｎ）との間のスペクトル連続性を維持するための、利得補償を含む。重み付けされた差信号は、周波数領域に変換される。

高域サブバンド成分に（−１）^ｎが掛けられて、スペクトル的に反転した信号Ｓ^ｆｏｌｄ _ＨＢ（ｎ）が取得される。スペクトル的に反転した信号Ｓ^ｆｏｌｄ _ＨＢ（ｎ）は、３０００ＨＺのカットオフ周波数を有するローパスフィルタを通過した後で前処理される。フィルタリングされた信号Ｓ_ＨＢ（ｎ）は、時間領域帯域幅拡張（ＴＤＢＷＥ）符号器において符号化される。Ｓ_ＨＢ（ｎ）が時間領域エイリアスキャンセル（ＴＤＡＣ）符号化モジュールに入力される前に、Ｓ_ＨＢ（ｎ）に対して周波数領域へのＭＤＣＴ変換が実行される。

最後に、２組のＭＤＣＴ係数Ｄ^Ｗ _ＬＢ（ｋ）及びＳ_ＨＢ（ｋ）が、ＴＤＡＣ符号化アルゴリズムを使用して符号化される。加えて、伝送中にフレーム損失が発生した場合に引き起こされる誤りを改善するために、いくつかのその他のパラメータがフレーム消去隠蔽（ＦＥＣ）符号器によって送信される。

図２は、各レイヤにおいて復号器を有するＧ．７２９．１システムのブロック図である。復号器の動作モードは、受信された符号ストリームのレイヤの数によって、すなわち、受信レートによって決定される。受信側における異なる受信レートに基づく様々なケースについて、詳細な説明を行う。

１．受信レートが８ｋｂ／ｓ又は１２ｋｂ／ｓである場合（すなわち、最初のレイヤ又は最初の２つのレイヤのみが受信された場合）、エンベデッドＣＥＬＰ復号器が、最初のレイヤ又は最初の２つのレイヤの符号ストリームを復号化し、復号化された信号

を取得し、ポストフィルタリングを実行して

を取得し、この信号は、ハイパスフィルタを通過して、ＱＭＦフィルタバンクに到達する。０に設定された高域信号成分を有する、１６ｋＨｚ広帯域信号が合成される。

２．受信レートが１４ｋｂ／ｓである場合（すなわち、最初の３つのレイヤが受信された場合）、ＣＥＬＰ復号器が狭帯域成分を復号化するのに加えて、ＴＤＢＷＥ復号器が、高域信号成分

を復号化する。ＭＤＣＴ変換が、

に対して実行され、高域サブバンド成分スペクトル内の３０００Ｈｚよりも高い周波数成分（１６ｋＨｚサンプリングレートにおける７０００Ｈｚよりも高い周波数成分に対応）が０に設定され、次に、逆ＭＤＣＴ変換が実行される。重ね合わせ及びスペクトル反転の後、処理された高域成分が、ＣＥＬＰ復号器によって復号化された低域成分

と、ＱＭＦフィルタバンク内で合成されて、１６ｋＨｚのサンプリングレートを有する広帯域信号が取得される。

３．受信された符号ストリームが１４ｋｂ／ｓよりも高いレートを有する場合（最初の４つのレイヤ又はより多くのレイヤに対応）、ＣＥＬＰ復号器が低域サブバンド成分

を復号化によって取得し、ＴＤＢＷＥ復号器が高域サブバンド成分

を復号化によって取得するのに加えて、ＴＤＡＣ復号器が、低域サブバンド重み付け差分信号と高域サブバンドエンハンスメント信号とを復号化によって取得する。フル帯域の信号がエンハンスされ、最後に、１６ｋＨｚのサンプリングレートを有する広帯域信号がＱＭＦフィルタバンク内で合成される。

本発明の実施において、発明者らは、従来技術が少なくとも以下の問題を有することを見出した。

Ｇ．７２９．１符号ストリームは、レイヤード構成を有する。伝送処理の間に、外側のレイヤの符号ストリームが、チャネル伝送機能に応じて外側から内側への順で廃棄されてもよく、従って、チャネル状態への適応が達成されることが可能である。符号化及び復号化アルゴリズムについての説明から、チャネル容量が時間の経過と共に速く変化する場合、復号器は、復号化された信号が４０００Ｈｚより低い成分のみを含む瞬間においては狭帯域符号ストリーム（１２ｋｂ／ｓ以下）を受信する可能性があり、そして復号器は、復号化された信号が０〜７０００Ｈｚの広帯域信号を含む可能性がある別の瞬間においては広帯域符号ストリーム（１４ｋｂ／ｓ以上）を受信する可能性があるということがわかる。帯域幅のそのような突然の変化を、本明細書では、帯域幅の切り換えと呼ぶ。聴取体験への、高域及び低域からの寄与は異なるため、そのような頻繁な切り換えは、聴取体験に顕著な不快をもたらす可能性がある。特に、広帯域から狭帯域への頻繁な切り換えがある場合、鮮明な音声から単調な音声へのジャンプが頻繁に感じられる。従って、頻繁な切り換えによって聴取体験に引き起こされる不快を軽減するための技術が必要とされている。

本開示は、発話信号に帯域幅の切り換えが発生する場合に人間によって感じられる快適さを向上させるための、音声復号化方法及び装置を提供する。

上記の目的を達成するために、本発明の一実施形態で提供される音声復号化方法は、
受信された符号ストリームに対応する音声信号の低域信号成分を、音声信号が第１の帯域幅から、第１の帯域幅よりも狭い第２の帯域幅に切り換わった場合に取得し、
低域信号成分を拡張して高域情報を取得し、
拡張を介して取得された高域情報に対して経時変化フェードアウト処理を実行して、処理された高域信号成分を取得し、
処理された高域信号成分と、取得された低域信号成分とを合成することを含む。

更に、本発明の一実施形態は、取得ユニットと、拡張ユニットと、経時変化フェードアウト処理ユニットと、合成ユニットとを含む、音声復号化装置を提供する。

取得ユニットは、受信された符号ストリームに対応する音声信号の低域信号成分を、音声信号が第１の帯域幅から、第１の帯域幅よりも狭い第２の帯域幅に切り換わった場合に取得し、低域信号成分を拡張ユニットに送信するように構成される。

拡張ユニットは、低域信号成分を拡張して高域情報を取得し、拡張を介して取得された高域情報を経時変化フェードアウト処理ユニットに送信するように構成される。

経時変化フェードアウト処理ユニットは、拡張を介して取得された高域情報に対して経時変化フェードアウト処理を実行して、処理された高域信号成分を取得し、処理された高域信号成分を合成ユニットに送信するように構成される。

合成ユニットは、受信された、処理された高域信号成分と、取得ユニットによって取得された低域信号成分とを合成するように構成される。

従来技術と比較して、本発明の実施形態においては、以下の有益な効果が達成されることが可能である。

本発明の実施形態で提供される方法を使用すれば、音声信号が広帯域から狭帯域への切り換えを有する場合に、人為的帯域拡張、経時変化フェードアウト処理、及び帯域幅合成などの一連の処理が、切り換えが広帯域信号から狭帯域信号への滑らかな移行を有するようにするために実行されてもよく、これにより、快適な聴取体験が達成されることが可能である。

従来技術におけるＧ．７２９．１符号化システムのブロック図である。従来技術におけるＧ．７２９．１復号化システムのブロック図である。本発明の第１の実施形態における、音声信号を復号化する方法のフローチャートである。本発明の第２の実施形態における、音声信号を復号化する方法のフローチャートである。本発明の第２の実施形態における、経時変化利得係数の変化曲線を示す。本発明の第２の実施形態における、経時変化フィルタの極点の変化を示す。本発明の第３の実施形態における、音声信号を復号化する方法のフローチャートである。本発明の第４の実施形態における、音声信号を復号化する方法のフローチャートである。本発明の第５の実施形態における、音声信号を復号化する方法のフローチャートである。本発明の第６の実施形態における、音声信号を復号化する方法のフローチャートである。本発明の第７の実施形態における、音声信号を復号化する方法のフローチャートである。本発明の第８の実施形態における、音声信号を復号化する方法のフローチャートである。本発明の第９の実施形態における、音声信号を復号化する装置を概略的に示す。

本発明の実施についての更なる詳細な説明を、特定の実施形態及び添付の図面を参照して行う。

本発明の第１の実施形態における、音声信号を復号化する方法を、図３に示す。以下のような特定のステップが含まれる。

ステップＳ３０１で、受信された符号ストリームのフレーム構成が判定される。

ステップＳ３０２で、符号ストリームのフレーム構成に基づいて、符号ストリームに対応する音声信号が、第１の帯域幅から、第１の帯域幅よりも狭い第２の帯域幅への切り換えを有するかどうかについての検知が行われる。そのような切り換えがある場合、ステップＳ３０３が実行される。それ以外の場合、通常の復号化フローに従って符号ストリームが復号化され、復元された音声信号が出力される。

発話符号化及び復号化の分野では、狭帯域信号は、一般に、０〜４０００Ｈｚの周波数帯域を有する信号を意味し、広帯域信号は、０〜８０００Ｈｚの周波数帯域を有する信号を意味する。超広帯域（ＵＷＢ）信号は、０〜１６０００Ｈｚの周波数帯域を有する信号を意味する。より広い帯域を有する信号は、低域信号成分と高域信号成分とに分割されてもよい。もちろん、上記の定義は一般的なものにすぎず、実際の適用例はこれに関して限定されない。説明を容易にするために、本発明の実施形態における高域信号成分は、切り換えの前の帯域幅を基準にして、切り換えの後に追加される部分を意味してもよく、狭帯域信号成分は、切り換えの前及び後の両方の音声信号に共通の帯域幅を有する部分を意味してもよい。例えば、０〜８０００Ｈｚの帯域を有する信号から、０〜４０００Ｈｚの帯域を有する信号への切り換えが発生した場合、低域信号成分は、０〜４０００Ｈｚの信号を意味してもよく、高域信号成分は、４０００〜８０００Ｈｚの信号を意味してもよい。

ステップＳ３０３で、符号ストリームに対応する音声信号が第１の帯域幅から第２の帯域幅に切り換わったことを検知した場合、受信された低域符号化パラメータが復号化のために使用されて、低域信号成分が取得される。

本発明の一実施形態では、切り換えの前の帯域幅が切り換えの後の帯域幅よりも広い限り、本発明の実施形態における解決法が適用されてもよく、一般的な意味では、広帯域から狭帯域への切り換えに限定されない。

ステップＳ３０４で、人為的帯域拡張技術が使用されて低域信号成分が拡張され、高域情報が取得される。

具体的には、高域情報は、高域信号成分又は高域符号化パラメータであってもよい。初期期間中に、符号ストリームに対応する音声信号が第１の帯域幅から第２の帯域幅に切り換わった場合に、人為的帯域幅拡張技術を使用して低域信号成分を拡張し高域情報を取得するための、２つの方法が存在してもよい。具体的には、切り換えの前に受信された高域符号化パラメータが、低域信号成分を拡張して高域情報を取得するために使用されてもよく、又は、切り換えの後の現在の音声フレームから復号化された低域信号成分が、高域情報を取得するために拡張されてもよい。

切り換えの前に受信された高域符号化パラメータを、低域信号成分を拡張して高域情報を取得するために使用する方法は、切り換えの前に受信された高域符号化パラメータ（例えば、ＴＤＢＷＥ符号化アルゴリズムにおける時間領域及び周波数領域エンベロープ、又は、ＴＤＡＣ符号化アルゴリズムにおけるＭＤＣＴ係数）をバッファリングし、現在の音声フレームの高域符号化パラメータを、切り換えの後の外挿を使用することによって推定することを含んでもよい。更に、高域符号化パラメータに応じて、対応する広帯域復号化アルゴリズムが、高域信号成分を取得するために使用されてもよい。

切り換えの後の現在の音声フレームから復号化された低域信号成分を、高域情報を取得するために使用する方法は、切り換えの後の現在の音声フレームから復号化された低域信号成分に対して、高速フーリエ変換（ＦＦＴ）を実行し、低域信号成分のＦＦＴ係数を、ＦＦＴ領域内で拡張及び整形し、整形されたＦＦＴ係数を、高域情報のＦＦＴ係数とし、逆ＦＦＴ変換を実行して、高域信号成分を取得することを含んでもよい。もちろん、前者の方法の計算量は、後者の方法よりもはるかに少ない。以下の実施形態では、例として、前者の方法が、本発明を説明するために使用される。

ステップＳ３０５で、経時変化フェードアウト処理が、拡張を介して取得された高域情報に対して実行される。

具体的には、人為的帯域拡張技術を使用することによって、拡張を介して高域情報が取得された後に、ＱＭＦフィルタリングが、高域情報と低域信号成分とを合成して広帯域信号を作るために実行されるのではない。より正確には、拡張を介して取得された高域情報に対して、経時変化フェードアウト処理が実行される。フェードアウト処理は、音声信号の、第１の帯域幅から第２の帯域幅への移行を意味する。高域情報に対して、経時変化フェードアウト処理を実行する方法は、セパレート経時変化フェードアウト処理とハイブリッド経時変化フェードアウト処理とを含んでもよい。

具体的には、セパレート経時変化フェードアウト処理は、拡張を介して取得された高域情報に対して、時間領域整形が、時間領域利得係数を使用することによって実行され、そして更に、時間領域整形された高域情報に対して、周波数領域整形が、経時変化フィルタリングを使用することによって実行されてもよい、第１の方法か、又は、拡張を介して取得された高域情報に対して、周波数領域整形が、経時変化フィルタリングを使用することによって実行され、そして更に、周波数領域整形された高域情報に対して、時間領域整形が、時間領域利得係数を使用することによって実行されてもよい、第２の方法を含んでもよい。

具体的には、ハイブリッド経時変化フェードアウト処理は、拡張を介して取得された高域符号化パラメータに対して、周波数領域整形が、周波数領域高域パラメータ経時変化重み付け法を使用することによって実行されて、経時変化フェードアウトスペクトルエンベロープが取得され、処理された高域信号成分が復号化を介して取得される、第３の方法か、又は、拡張を介して取得された高域信号成分が、サブバンドに分割され、各サブバンドの符号化パラメータに対して、周波数領域高域パラメータ経時変化重み付けが実行されて、経時変化フェードアウトスペクトルエンベロープが取得され、処理された高域信号成分が復号化を介して取得される、第４の方法を含んでもよい。

ステップＳ３０６で、処理された高域信号成分と、復号化された低域信号成分とが合成される。

上記のステップにおいて、復号器は、拡張を介して取得された高域情報に対して、経時変化フェードアウト処理を、多くの方法で実行してもよい。様々な経時変化フェードアウト処理方法の特定の実施形態についての詳細な説明を以下で行う。

以下の実施形態では、復号器によって受信される符号ストリームは、発話セグメントであってもよい。発話セグメントは、復号器によって連続的に受信される発話フレームのセグメントを意味する。発話フレームは、フルレート発話フレーム、又は、フルレート発話フレームのいくつかのレイヤであってもよい。あるいは、復号器によって受信される符号ストリームは、雑音セグメントであってもよく、雑音セグメントは、復号器によって連続的に受信される雑音フレームのセグメントを意味する。雑音フレームは、フルレート雑音フレーム、又は、フルレート雑音フレームのいくつかのレイヤであってもよい。

本発明の第２の実施形態では、例えば、復号器によって受信される符号ストリームは、発話セグメントであり、経時変化フェードアウト処理は、第１の方法を使用する。言い換えると、拡張を介して取得された高域情報に対して、時間領域整形が、時間領域利得係数を使用することによって実行され、そして更に、時間領域整形された高域情報に対して、周波数領域整形が、経時変化フィルタリングを使用することによって実行されてもよい。音声信号を復号化する方法が図４に示されており、この方法は、以下のような特定のステップを含んでもよい。

ステップ４０１で、復号器は、符号器から送信された符号ストリームを受信し、受信された符号ストリームのフレーム構成を判定する。

具体的には、符号器は、図１の系統ブロック図に示すフローに従って、音声信号を符号化し、符号ストリームを復号器に送信する。復号器は、符号ストリームを受信する。符号ストリームに対応する音声信号が、広帯域から狭帯域への切り換えを有さない場合、復号器は、受信された符号ストリームを、図２の系統ブロック図に示すフローに従って、通常通りに復号化してもよい。ここでは繰り返しを行わない。復号器によって受信される符号ストリームは、発話セグメントである。発話セグメント内の発話フレームは、フルレート発話フレーム、又は、フルレート発話フレームのいくつかのレイヤであってもよい。この実施形態では、フルレート発話フレームが使用され、そのフレーム構成は表１に示されている。

ステップＳ４０２で、復号器は、符号ストリームのフレーム構成に従って、広帯域から狭帯域への切り換えが発生したかどうかを検知する。そのような切り換えが発生した場合、フローはステップＳ４０３に進む。それ以外の場合、通常の復号化フローに従って符号ストリームが復号化され、復元された音声信号が出力される。

発話フレームが受信された場合、現在のフレームのデータ長又は復号化レートに従って、広帯域から狭帯域への切り換えが発生したかどうかについての判定が行われる。例えば、現在のフレームがレイヤ１及びレイヤ２のデータのみを含む場合、現在のフレームの長さは１６０ビット（すなわち、復号化レートは８ｋｂ／ｓ）又は２４０ビット（すなわち、復号化レートは１２ｋｂ／ｓ）であり、従って、現在のフレームは狭帯域である。そうではなく、現在のフレームが、最初の２つのレイヤのデータと、より高いレイヤのデータとを含む場合、すなわち、現在のフレームの長さが２８０ビット以上（すなわち、復号化レートが１４ｋｂ／ｓ）である場合、現在のフレームは広帯域である。

具体的には、現在のフレームと、以前のフレーム（１つ又は複数）とから判定された、発話信号の帯域幅に基づいて、現在の発話セグメントが広帯域から狭帯域への切り換えを有するかどうかについての検知が行われてもよい。

ステップＳ４０３で、受信された符号ストリームに対応する発話信号が広帯域から狭帯域に切り換わった場合、復号器は、受信された低域符号化パラメータを、エンベデッドＣＥＬＰを使用することによって復号化して、低域信号成分

を取得する。

ステップＳ４０４で、切り換えの前に受信された高域信号成分の符号化パラメータが、低域信号成分

を拡張して、高域信号成分

を取得するために使用されてもよい。

具体的には、高域符号化パラメータを有する発話フレームを受信した後で、復号器は、切り換えの前に受信されたＭ個の発話フレームのＴＤＢＷＥ符号化パラメータ（時間領域エンベロープ及び周波数領域エンベロープを含む）を、毎回バッファリングする。広帯域から狭帯域への切り換えを検知した後で、復号器は、最初に、バッファ内に記憶された、切り換えの前に受信された発話フレームの時間領域エンベロープと周波数領域エンベロープとに基づいて、現在のフレームの時間領域エンベロープと周波数領域エンベロープとを外挿し、次に、外挿された時間領域エンベロープと周波数領域エンベロープとを使用することによって、ＴＤＢＷＥ復号化を実行して、高域信号成分を、拡張を介して取得する。同様に、復号器は、切り換えの前に受信されたＭ個の発話フレームのＴＤＡＣ符号化パラメータ（すなわち、ＭＤＣＴ係数）をバッファリングしてもよく、現在のフレームのＭＤＣＴ係数を外挿し、次に、外挿されたＭＤＣＴ係数を使用することによって、ＴＤＡＣ復号化を実行して、高域信号成分を、拡張を介して取得する。

広帯域から狭帯域への切り換えが検知され次第、いかなる高域符号化パラメータも欠けている発話フレームについて、高域信号成分の合成パラメータが、ミラー補間法を使用して推定されてもよい。言い換えると、バッファ内にバッファリングされた、Ｍ個の最近の発話フレームの高域符号化パラメータが、ミラーソースとして使用されて、セグメント線形補間が、現在の発話フレームから開始して実行される。セグメント線形補間のための式は、次の通りである。

（１）

上式で、Ｐ_ｋは、切り換え位置から復元されるｋ番目の発話フレームの高域信号成分のための合成パラメータを表し、ｋ＝０，・・・，Ｎ−１であり、Ｎは、発話フレーム（それに対してフェードアウト処理が実行される）の数であり、Ｐ_−ｉは、バッファ内に記憶された、切り換え位置の前に受信されたｉ番目の発話フレームの高域符号化パラメータを表し、ｉ＝１，・・・，Ｍであり、Ｍは、フェードアウト処理のためにバッファリングされたフレームの数であり、（ａ）ｍｏｄ（ｂ）は、ｂを用いたａのＭＯＤ演算を表し、

は、フロア演算を表す。式（１）に従って、切り換えの前のＭ個のバッファリングされた発話フレームの高域符号化パラメータが、切り換えの後のＮ個の発話フレームの高域符号化パラメータを推定するために使用されてもよい。切り換えの後のＮ個の発話フレームの高域信号成分は、ＴＤＢＷＥ又はＴＤＡＣ復号化アルゴリズムを使用して復元されてもよい。実際の適用例の要求に応じて、Ｍは、Ｎ未満の任意の値であってもよい。

ステップＳ４０５で、拡張を介して取得された高域信号成分

に対して、時間領域整形が実行されて、処理された高域信号成分

が取得される。

具体的には、時間領域整形が実行される場合、経時変化利得係数ｇ（ｋ）が導入されてもよい。経時変化係数の変化曲線を、図５に示す。経時変化利得係数は、対数領域において直線的に減衰する曲線を有する。切り換えの後に発生するｋ番目の発話フレームについて、式（２）に示すように、拡張を介して取得された高域信号成分に、経時変化利得係数が掛けられる。

（２）
ただし、ｎ＝０，．．．，Ｌ−１であり、ｋ＝０，．．．，Ｎ−１であり、Ｌは、フレームの長さを表す。

ステップＳ４０６で、必要に応じて、周波数領域整形が、時間領域整形された高域信号成分

に対して、経時変化フィルタリングを使用することによって実行されて、周波数領域整形された高域信号成分

が取得されてもよい。

具体的には、時間領域整形された高域信号成分

が、経時変化フィルタを通過し、これにより、高域信号成分の周波数帯域が、時間の経過と共に徐々に狭くなる。この実施形態で使用される経時変化フィルタは、−１に固定された零点と、常に変化する極点とを有する、経時変化２次バターワースフィルタである。図６は、経時変化２次バターワースフィルタの極点の変化を示す。経時変化フィルタの極点は、時計回りに移動する。言い換えると、フィルタの通過帯域は、０に達するまで減少する。

復号器が１４ｋｂ／ｓ以上の発話信号を処理した場合、広帯域−狭帯域切り換えフラグｆａｄ＿ｏｕｔ＿ｆｌａｇが０に設定され、フィルタの点のカウンタｆａｄ＿ｏｕｔ＿ｃｏｕｎｔが０に設定される。特定の瞬間から開始して、復号器が８ｋｂ／ｓ又は１２ｋｂ／ｓの発話信号を処理し始めた場合、狭帯域−広帯域切り換えフラグｆａｄ＿ｏｕｔ＿ｆｌａｇが１に設定され、経時変化フィルタが、復元された高域信号成分のフィルタリングを開始するために有効にされる。フィルタの点の数ｆａｄ＿ｏｕｔ＿ｃｏｕｎｔが、ｆａｄ＿ｏｕｔ＿ｃｏｕｎｔ＜ＦＡＤ＿ＯＵＴ＿ＣＯＵＮＴ＿ＭＡＸという条件を満たす場合、経時変化フィルタリングは継続的に実行される。それ以外の場合、経時変化フィルタの処理は停止される。ここで、ＦＡＤ＿ＯＵＴ＿ＣＯＵＮＴ＿ＭＡＸ＝Ｎ×Ｌは、移行の数である（例えば、ＦＡＤ＿ＯＵＴ＿ＣＯＵＮＴ＿ＭＡＸ＝８０００）。

経時変化フィルタは、瞬間ｉにおいて、ｒｅｌ（ｉ）＋ｉｍｇ（ｉ）×ｊという正確な極点を有し、極点は、正確に瞬間ｍにおいて、ｒｅｌ（ｍ）＋ｉｍｇ（ｍ）×ｊに移動すると仮定する。補間の点の数がＮである場合、瞬間ｋにおける補間結果は、次の通りである。
ｒｅｌ（ｋ）＝ｒｅｌ（ｉ）×（Ｎ−ｋ）／Ｎ＋ｒｅｌ（ｍ）×ｋ／Ｎ
ｉｍｇ（ｋ）＝ｉｍｇ（ｉ）×（Ｎ−ｋ）／Ｎ＋ｉｍｇ（ｍ）×ｋ／Ｎ

補間の極点が、瞬間ｋにおけるフィルタ係数を回復するために使用されてもよく、次の伝達関数が取得されてもよい。
Ｈ（ｚ）＝（１＋２ｚ^−１＋ｚ^−２）／（１−２ｒｅｌ（ｋ）ｚ^−１＋［ｒｅｌ^２（ｋ）＋ｉｍｇ^２（ｋ）］ｚ^−２）

復号器が広帯域発話信号を受信した場合、フィルタの点のカウンタｆａｄ＿ｏｕｔ＿ｃｏｕｎｔが０に設定される。復号器によって受信された発話信号が、広帯域から狭帯域に切り換わった場合、経時変化フィルタが有効にされ、そして、フィルタカウンタは、次のように更新されてもよい。
ｆａｄ＿ｏｕｔ＿ｃｏｕｎｔ＝ｍｉｎ（ｆａｄ＿ｏｕｔ＿ｃｏｕｎｔ＋１，ＦＡＤ＿ＯＵＴ＿ＣＯＵＮＴ＿ＭＡＸ）
ただし、ＦＡＤ＿ＯＵＴ＿ＣＯＵＮＴ＿ＭＡＸは、移行フェーズ中の連続したサンプルの数である。

ａ_１＝２ｒｅｌ（ｋ）及びａ_２＝−［ｒｅｌ^２（ｋ）＋ｉｍｇ^２（ｋ）］とする。時間領域整形された復元された高域信号成分

は、経時変化フィルタの入力信号であり、

は、経時変化フィルタの出力信号である。

上式で、ｇａｉｎ＿ｆｉｌｔｅｒは、フィルタ利得であり、その演算式は、次の通りである。
ｇａｉｎ＿ｆｉｌｔｅｒ＝（１−ａ_１−ａ_２）／４

ステップＳ４０７で、復号化された低域信号成分

と、処理された高域信号成分

（ステップＳ４０６が実行されない場合は、高域信号成分

）とに対して、合成フィルタリングを実行するために、ＱＭＦフィルタバンクが使用されてもよい。このようにして、広帯域から狭帯域への滑らかな移行という特性を満たす、経時変化フェードアウト信号が復元されてもよい。

経時変化フェードアウト処理された高域信号成分

と、復元された低域信号成分

とが、合成フィルタリングのためにＱＭＦフィルタバンクに一緒に入力されて、フル帯域の復元された信号が取得される。復号化中に広帯域から狭帯域への頻繁な切り換えがある場合でも、本発明に従って処理された、復元された信号は、比較的良好な聴取品質を人間に提供することが可能である。

この実施形態では、例えば、発話セグメントの経時変化フェードアウト処理は、第１の方法を使用し、すなわち、拡張を介して取得された高域情報に対して、時間領域整形が、時間領域利得係数を使用することによって実行され、そして、時間領域整形された高域情報に対して、周波数領域整形が、経時変化フィルタリングを使用することによって実行される。経時変化フェードアウト処理は、他の代替の方法を使用してもよいということが理解されよう。本発明の第３の実施形態では、例えば、復号器によって受信される符号ストリームは、発話セグメントであり、経時変化フェードアウト処理は、第３の方法を使用し、すなわち、周波数領域高域パラメータ経時変化重み付け法が、拡張を介して取得された高域情報に対して周波数領域整形を実行するために使用される。音声信号を復号化する方法が図７に示されており、この方法は、以下のようなステップを含む。

ステップＳ７０１〜Ｓ７０３は、第２の実施形態におけるステップＳ４０１〜Ｓ４０３と同様であり、従って、ここでは繰り返しは行わない。

ステップＳ７０４で、切り換えの前に受信された高域信号成分の符号化パラメータが、低域信号成分

を拡張して、高域符号化パラメータを取得するために使用される。

この処理では、復号器内にバッファリングされた、切り換えの前のＭ個の発話フレームの高域符号化パラメータが、切り換えの後のＮ個の発話フレームの高域符号化パラメータ（周波数領域エンベロープ及び高域スペクトルエンベロープ）を推定するために使用されてもよい。具体的には、復号器が、高域符号化パラメータを含むフレームを受信した後で、切り換えの前に受信されたＭ個の発話フレームのＴＤＢＷＥ符号化パラメータ（時間領域エンベロープ及び周波数領域エンベロープなどの、符号化パラメータを含む）が、毎回バッファリングされてもよい。広帯域から狭帯域への切り換えが検知され次第、復号器は、最初に、バッファ内に記憶された、切り換えの前に受信された時間領域エンベロープと周波数領域エンベロープとに基づいて、外挿を介して、現在のフレームの時間領域エンベロープと周波数領域エンベロープとを取得する。あるいは、復号器は、切り換えの前に受信されたＭ個の発話フレームのＴＤＡＣ符号化パラメータ（すなわち、ＭＤＣＴ係数）をバッファリングしてもよく、そして、発話フレームのＭＤＣＴ係数に基づいて、拡張を介して高域符号化パラメータを取得する。

広帯域から狭帯域への切り換えが検知され次第、いかなる高域符号化パラメータも欠けているフレームについて、ミラー補間法が、高域信号成分の合成パラメータを推定するために使用されてもよい。具体的には、バッファ内にバッファリングされた、Ｍ個（例えば、Ｍ＝５）の最近の発話フレームの高域符号化パラメータ（周波数領域エンベロープ及び高域スペクトルエンベロープ）を、ミラーソースとして利用することによって、現在の発話フレームから開始して、セグメント線形補間が実行される。これは、第２の実施形態におけるセグメント線形補間式（１）を使用することによって実施されてもよく、ここで、連続したフレームの数はＮ（例えば、Ｎ＝５０）である。この処理では、切り換えの前のＭ個のフレームの、バッファリングされた高域符号化パラメータが、切り換えの後のＮ個のフレームの高域符号化パラメータ（周波数領域エンベロープ及び高域スペクトルエンベロープ）を推定するために使用されてもよい。

ステップＳ７０５で、周波数領域高域パラメータ経時変化重み付け法が、拡張を介して取得された高域符号化パラメータに対して周波数領域整形を実行するために使用されてもよい。

具体的には、高域信号が、周波数領域内でいくつかのサブバンドに分割され、次に、各サブバンドの高域符号化パラメータに対して、周波数領域重み付けが、異なる利得を使用して実行され、これにより、高域信号成分の周波数帯域が徐々に狭くなる。広帯域符号化パラメータは、１４ｋｂ／ｓでのＴＤＢＷＥ符号化アルゴリズムにおける周波数領域エンベロープ又は１４ｋｂ／ｓを超えるレートでのＴＤＡＣ符号化アルゴリズムにおける高域エンベロープに関係なく、高域を複数のサブバンドに分割する処理を含意してもよい。従って、受信された高域符号化パラメータに対して、周波数領域内で、経時変化フェードアウト処理が直接実行される場合、時間領域内でフィルタを使用する方法に比較して、より多くの計算量が節約されることが可能である。復号器が１４ｋｂ／ｓ以上のレートを有する発話信号を処理した場合、狭帯域−広帯域切り換えフラグｆａｄ＿ｏｕｔ＿ｆｌａｇが０に設定され、移行フレームのカウンタｆａｄ＿ｏｕｔ＿ｆｒａｍｅ＿ｃｏｕｎｔが０に設定される。特定の瞬間から、復号器が８ｋｂ／ｓ又は１２ｋｂ／ｓの発話信号を処理し始めた場合、狭帯域−広帯域切り換えフラグｆａｄ＿ｏｕｔ＿ｆｌａｇが１に設定される。移行フレームのカウンタｆａｄ＿ｏｕｔ＿ｆｒａｍｅ＿ｃｏｕｎｔが、ｆａｄ＿ｏｕｔ＿ｆｒａｍｅ＿ｃｏｕｎｔ＜Ｎという条件を満たす場合、周波数領域内で符号化パラメータが重み付けされ、重み付け係数は時間の経過と共に変化する。

切り換えの前に発生した発話フレームのレートが、１４ｋｂ／ｓよりも高い場合、受信されてバッファ内にバッファリングされた高域信号成分の符号化パラメータは、ＭＤＣＴ領域内の高域エンベロープと、ＴＤＢＷＥアルゴリズムにおける周波数領域エンベロープとを含んでもよい。それ以外の場合、受信されてバッファ内にバッファリングされた高域信号符号化パラメータは、ＴＤＢＷＥアルゴリズムにおける周波数領域エンベロープのみを含む。切り換えの後に発生するｋ番目の発話フレーム（ｋ＝１，・・・，Ｎ）のために、バッファ内の高域符号化パラメータが、現在のフレームの対応する高域符号化パラメータ（周波数領域エンベロープ、又はＭＤＣＴ領域内の高域エンベロープ）を復元するために使用されてもよい。周波数領域内のこれらのエンベロープは、高域全体をいくつかのサブバンドに分割する。これらのスペクトルエンベロープは、

で表される（ｊ＝０，・・・，Ｊ−１、Ｊは分割されたサブバンドの数であり、例えば、Ｇ．７２９．１によるＴＤＢＷＥアルゴリズムにおける周波数領域エンベロープについては、Ｊ＝１２であり、ＭＤＣＴ領域内の高域エンベロープについては、Ｊ＝１８である）。各サブバンドは、経時変化フェードアウト利得係数ｇａｉｎ（ｋ，ｊ）によって重み付けされ、すなわち、

とされる。このようにして、周波数領域内の経時変化フェードアウトスペクトルエンベロープが取得されてもよい。ｇａｉｎ（ｋ，ｊ）を計算するための式は、次の通りである。
ｇａｉｎ（ｋ，ｊ）＝ｍａｘ（０，（Ｊ−ｊ）×Ｎ−Ｊ×ｋ）／（Ｊ×Ｎ），ｋ＝１，．．．，Ｎ；ｊ＝０，．．．，Ｊ−１

処理されたＴＤＢＷＥ周波数領域エンベロープ及びＭＤＣＴ領域高域エンベロープについて、それらは、それぞれ、ＴＤＢＷＥ復号化アルゴリズム及びＴＤＡＣ復号化アルゴリズムを使用することによって復号化されてもよい。このようにして、経時変化フェードアウト高域信号成分

が取得されてもよい。

ステップＳ７０６で、処理された高域信号成分

と、復号化された低域信号成分

とに対して、ＱＭＦフィルタバンクが合成フィルタリングを実行して、経時変化フェードアウト信号が復元されてもよい。

音声信号は、発話信号と雑音信号とを含んでもよい。本発明の第２の実施形態及び第３の実施形態の説明においては、例えば、発話セグメントが広帯域から狭帯域に切り換わる。雑音セグメントも広帯域から狭帯域に切り換わってもよいということが理解されるであろう。本発明の第４の実施形態では、例えば、復号器によって受信される符号ストリームは、雑音セグメントであり、経時変化フェードアウト処理は、第２の方法を使用する。言い換えると、拡張を介して取得された高域情報に対して、周波数領域整形が、経時変化フィルタリングを使用することによって実行され、そして更に、周波数領域整形された高域情報に対して、時間領域整形が、時間領域利得係数を使用することによって実行されてもよい。音声信号を復号化する方法が図８に示されており、この方法は、以下のようなステップを含む。

ステップ８０１で、復号器は、符号器から送信された符号ストリームを受信し、受信された符号ストリームのフレーム構成を判定する。

具体的には、符号器は、図１の系統ブロック図に示すフローに従って、音声信号を符号化し、符号ストリームを復号器に送信する。復号器は、符号ストリームを受信する。符号ストリームに対応する音声信号が、広帯域から狭帯域への切り換えを有さない場合、復号器は、受信された符号ストリームを、図２の系統ブロック図に示すフローに従って、通常通りに復号化してもよい。ここでは繰り返しを行わない。復号器によって受信される符号ストリームは、発話セグメントである。発話セグメント内の発話フレームは、フルレート発話フレーム、又は、フルレート発話フレームのいくつかのレイヤであってもよい。雑音フレームは、連続的に符号化されて送信されてもよく、又は、不連続送信（ＤＴＸ）技術を使用してもよい。この実施形態では、雑音セグメントと雑音フレームとは同じ定義を有する。この実施形態では、復号器によって受信される雑音フレームは、フルレート雑音フレームであり、この実施形態で使用される雑音フレームの符号化構成を、図２に示す。

ステップＳ８０２で、復号器は、符号ストリームのフレーム構成に従って、広帯域から狭帯域への切り換えが発生したかどうかを検知する。そのような切り換えが発生した場合、フローはステップＳ８０３に進む。それ以外の場合、通常の復号化フローに従って符号ストリームが復号化され、復元された雑音信号が出力される。

雑音フレームが受信された場合、復号器は、現在のフレームのデータ長に従って、広帯域から狭帯域への切り換えが発生したかどうかを判定してもよい。例えば、現在のフレームのデータが、狭帯域コアレイヤのみを、又は狭帯域コアレイヤと狭帯域エンハンスメントレイヤとのみを含む場合、すなわち、現在のフレームの長さが１５ビット又は２４ビットである場合、現在のフレームは狭帯域である。そうではなく、現在のフレームのデータが、広帯域コアレイヤを更に含む場合、すなわち、現在のフレームの長さが４３ビットである場合、現在のフレームは広帯域である。

現在のフレーム、又は以前のフレーム（１つ又は複数）から判定された、雑音信号の帯域幅に基づいて、広帯域から狭帯域への切り換えが現在発生しているかどうかについての検知が行われてもよい。

復号器によって受信された無音挿入記述子（ＳＩＤ）フレームが高域符号化パラメータ（すなわち、広帯域コアレイヤ）を含む場合、バッファ内の高域符号化パラメータが、ＳＩＤフレームを使用して更新される。雑音セグメントの特定の瞬間から開始して、復号器によって受信されたＳＩＤフレームが、広帯域コアレイヤを含まなくなった場合、復号器は、広帯域から狭帯域への切り換えが発生したと判定してもよい。

ステップＳ８０３で、受信された符号ストリームに対応する雑音信号が広帯域から狭帯域に切り換わった場合、復号器は、受信された低域符号化パラメータを、エンベデッドＣＥＬＰを使用することによって復号化して、低域信号成分

を取得する。

ステップＳ８０４で、切り換えの前に受信された高域信号成分の符号化パラメータを使用することによって、低域信号成分

が拡張されて、高域信号成分

が取得される。

いかなる高域符号化パラメータも欠けている雑音フレームについて、高域信号成分の合成パラメータが、ミラー補間法を使用して推定されてもよい。雑音フレームが連続的に符号化されて送信される場合、バッファ内にバッファリングされた、Ｍ個の最近の雑音フレーム（例えば、Ｍ＝５）の高域符号化パラメータ（周波数領域エンベロープ及び高域スペクトルエンベロープ）が、広帯域から狭帯域への切り換えの後のｋ番目の雑音フレームの高域符号化パラメータを、第２の実施形態における式（１）を使用することによって復元するための、ミラーソースとして使用される。雑音フレームがＤＴＸ技術を使用する場合、バッファ内にバッファリングされた高域符号化パラメータ（周波数領域エンベロープ）を含む２つの最新のＳＩＤフレームが、現在のフレームから開始してセグメント線形補間を実行するための、ミラーソースとして利用されてもよい。広帯域から狭帯域への切り換えの後のｋ番目の雑音フレームの高域符号化パラメータを復元するために、式（３）が使用される。
Ｐ_ｋ＝（ｋ／（Ｎ−１））Ｐ_{ｓｉｄ＿ｐａｓｔ}＋（１−ｋ／（Ｎ−１））Ｐ_{ｓｉｄ＿ｐ＿ｐａｓｔ}
（３）

連続するフレームの数は、Ｎである（例えば、Ｎ＝５０）。Ｐ_{ｓｉｄ＿ｐａｓｔ}は、バッファ内に記憶された、広帯域コアレイヤを含む最新のＳＩＤフレームの高域符号化パラメータを表し、Ｐ_{ｓｉｄ＿ｐ＿ｐａｓｔ}は、バッファ内に記憶された、広帯域コアレイヤを含む次の最新のＳＩＤフレームの高域符号化パラメータを表す。処理においては、切り換えの前の２つの雑音フレームの、バッファリングされた高域符号化パラメータが、切り換えの後のＮ個の雑音フレームの高域符号化パラメータ（周波数領域エンベロープ）を推定するために使用されて、切り換えの後のＮ個の雑音フレームの高域信号成分が復元されてもよい。ＴＤＢＷＥ又はＴＤＡＣ復号化を使用することによって、式（３）を用いて復元された高域符号化パラメータが拡張されて、高域信号成分

が取得されてもよい。

ステップＳ８０５で、拡張を介して取得された高域信号成分

に対して、周波数領域整形を実行するために、経時変化フィルタリングが使用されて、周波数領域整形された高域信号成分

が取得される。

具体的には、周波数領域整形が実行される場合、拡張を介して取得された高域信号成分

が、経時変化フィルタを通過し、これにより、高域信号成分の周波数帯域が、時間の経過と共に徐々に狭くなる。図６は、フィルタの極点の変化を示す。復号器が、広帯域コアレイヤを含むＳＩＤフレームを受信するたびに、広帯域−狭帯域切り換えフラグｆａｄ＿ｏｕｔ＿ｆｌａｇが０に設定され、フィルタ点のカウンタｆａｄ＿ｏｕｔ＿ｆｌａｇが０に設定される。特定の瞬間から開始して、復号器が、広帯域コアレイヤを含まないＳＩＤフレームを受信した場合、狭帯域−広帯域切り換えフラグｆａｄ＿ｏｕｔ＿ｆｌａｇが１に設定される。そして、経時変化フィルタが、復元された高域信号成分をフィルタリングするために有効にされる。フィルタの点の数ｆａｄ＿ｏｕｔ＿ｃｏｕｎｔが、ｆａｄ＿ｏｕｔ＿ｃｏｕｎｔ＜ＦＡＤ＿ＯＵＴ＿ＣＯＵＮＴ＿ＭＡＸという条件を満たす場合、経時変化フィルタリングは継続的に実行される。それ以外の場合、経時変化フィルタの処理は停止される。ここで、ＦＡＤ＿ＯＵＴ＿ＣＯＵＮＴ＿ＭＡＸ＝Ｎ×Ｌは、移行の数である（例えば、ＦＡＤ＿ＯＵＴ＿ＣＯＵＮＴ＿ＭＡＸ＝８０００）。

経時変化フィルタは、瞬間ｉにおいて、ｒｅｌ（ｉ）＋ｉｍｇ（ｉ）×ｊという正確な極点を有し、極点は、正確に瞬間ｍにおいて、ｒｅｌ（ｍ）＋ｉｍｇ（ｍ）×ｊに移動すると仮定する。補間の数がＮである場合、瞬間ｋにおける補間結果は、次の通りである。
ｒｅｌ（ｋ）＝ｒｅｌ（ｉ）×（Ｎ−ｋ）／Ｎ＋ｒｅｌ（ｍ）×ｋ／Ｎ
ｉｍｇ（ｋ）＝ｉｍｇ（ｉ）×（Ｎ−ｋ）／Ｎ＋ｉｍｇ（ｍ）×ｋ／Ｎ

復号器が広帯域雑音信号を受信した場合、フィルタのカウンタｆａｄ＿ｏｕｔ＿ｃｏｕｎｔが０に設定される。復号器によって受信された雑音信号が、広帯域から狭帯域に切り換わった場合、経時変化フィルタが有効にされ、そして、フィルタカウンタは、次のように更新されてもよい。
ｆａｄ＿ｏｕｔ＿ｃｏｕｎｔ＝ｍｉｎ（ｆａｄ＿ｏｕｔ＿ｃｏｕｎｔ＋１，ＦＡＤ＿ＯＵＴ＿ＣＯＵＮＴ＿ＭＡＸ）、ここで、ＦＡＤ＿ＯＵＴ＿ＣＯＵＮＴ＿ＭＡＸは、移行フェーズ中の連続したサンプルの数である。

ａ_１＝２ｒｅｌ（ｋ）及びａ_２＝−［ｒｅｌ^２（ｋ）＋ｉｍｇ^２（ｋ）］とする。拡張を介して取得された高域信号成分

は、経時変化フィルタの入力信号であり、

は、経時変化フィルタの出力信号である。

ステップＳ８０６で、必要に応じて、時間領域整形が、周波数領域整形された高域信号成分

に対して実行されて、時間領域整形された高域信号成分

が取得されてもよい。

具体的には、時間領域整形が実行される場合、経時変化利得係数ｇ（ｋ）が導入されてもよい。経時変化係数の変化曲線を、図５に示す。切り換えの後に発生するｋ番目の発話フレームについて、式（２）に示すように、ＴＤＢＷＥ又はＴＤＡＣ復号化の後の、拡張を介して取得された高域信号成分に、経時変化利得係数が掛けられる。この実施は、第２の実施形態における、高域信号成分に対して時間領域整形を実行する処理と同様であり、従って、ここでは繰り返しを行わない。あるいは、このステップにおける経時変化利得係数には、ステップＳ８０５におけるフィルタ利得が掛けられてもよい。２つの方法により同じ結果が取得される可能性がある。

ステップＳ８０７で、復号化された低域信号成分

と、整形された高域信号成分

（ステップＳ８０６が実行されない場合は、高域信号成分

この実施形態では、例えば、雑音セグメントの経時変化フェードアウト処理は、第２の方法を使用し、すなわち、拡張を介して取得された高域情報に対して、周波数領域整形が、経時変化フィルタリングを使用することによって実行され、そして更に、周波数領域整形された高域情報に対して、時間領域整形が、時間領域利得係数を使用することによって実行されてもよい。経時変化フェードアウト処理は、他の代替の方法を使用してもよいということが理解されよう。本発明の第５の実施形態では、例えば、復号器によって受信される符号ストリームは、雑音セグメントであり、経時変化フェードアウト処理は、第４の方法を使用し、すなわち、拡張を介して取得された高域情報が、サブバンドに分割され、各サブバンドの符号化パラメータに対して、周波数領域高域パラメータ経時変化重み付けが実行される。音声復号化方法が図９に示されており、この方法は、以下のようなステップを含む。

ステップＳ９０１〜Ｓ９０３は、第４の実施形態におけるステップＳ８０１〜Ｓ８０３と同様であり、従って、ここでは繰り返しを行わない。

ステップＳ９０４で、切り換えの前に受信された高域信号成分の符号化パラメータ（これに限定されないが周波数領域エンベロープを含む）が、高域符号化パラメータを拡張を介して取得するために使用されてもよい。

いかなる高域符号化パラメータも欠けている雑音フレームについて、高域信号成分の合成パラメータが、ミラー補間法を使用して推定されてもよい。雑音フレームが連続的に符号化されて送信される場合、バッファ内にバッファリングされた、Ｍ個（例えば、Ｍ＝５）の最近の発話フレームの高域符号化パラメータ（周波数領域エンベロープ及び高域スペクトルエンベロープ）が、広帯域から狭帯域への切り換えの後のｋ番目のフレームの高域符号化パラメータを、式（１）を使用することによって復元するための、ミラーソースとして利用されてもよい。雑音フレームがＤＴＸ技術を使用する場合、バッファ内にバッファリングされた高域符号化パラメータ（周波数領域エンベロープ）を含む２つの最新のＳＩＤフレームが、現在のフレームから開始してセグメント線形補間を実行するための、ミラーソースとして利用されてもよい。広帯域から狭帯域への切り換えの後のｋ番目のフレームの高域符号化パラメータを復元するために、式（３）が使用されてもよい。

異なる符号化アルゴリズムにおける音声信号の高域符号化パラメータは、異なるタイプを有する可能性があるため、拡張を介して取得された上記の高域符号化パラメータは、サブバンドに分割されない可能性がある。この場合、拡張を介して取得された高域符号化パラメータが復号化されて、高域信号成分が取得されてもよく、そして、拡張を介して取得された高域信号成分から、高域符号化パラメータが、周波数領域整形を実行するために抽出されてもよい。

ステップＳ９０５で、拡張を介して取得された高域符号化パラメータが復号化されて、高域信号成分が取得される。

ステップＳ９０６で、拡張を介して取得された高域信号成分から、周波数領域エンベロープが、ＴＤＢＷＥアルゴリズムを使用することによって抽出されてもよい。これらの周波数領域エンベロープは、高域信号成分全体を、一連の重複していないサブバンドに分割してもよい。

ステップＳ９０７で、周波数領域高域パラメータ経時変化重み付けが、抽出された周波数領域エンベロープに対して周波数領域整形を実行するために使用される。周波数領域整形された周波数領域エンベロープが復号化されて、処理された高域信号成分が取得される。

具体的には、抽出された周波数領域エンベロープに対して、経時変化重み付け処理が実行される。周波数領域エンベロープは、高域信号成分を、周波数領域内でいくつかのサブバンドに分割することと同等であり、従って、各周波数領域エンベロープに対して、周波数領域重み付けが、異なる利得を使用して実行され、これにより、信号帯域が徐々に狭くなる。復号器が、高域符号化パラメータを含むＳＩＤフレームを連続的に受信する場合、広帯域雑音信号フェーズにあると考えられてもよい。広帯域−狭帯域切り換えフラグｆａｄ＿ｏｕｔ＿ｆｌａｇが０に設定され、移行フレームのカウンタｆａｄ＿ｏｕｔ＿ｆｒａｍｅ＿ｃｏｕｎｔが０に設定される。復号器によって受信されたＳＩＤフレームが、特定の瞬間から開始して、広帯域コアレイヤを含まない場合、復号器は、広帯域から狭帯域への切り換えが発生したと判定する。広帯域−狭帯域切り換えフラグｆａｄ＿ｏｕｔ＿ｆｌａｇが１に設定される。移行フレームのカウンタｆａｄ＿ｏｕｔ＿ｆｒａｍｅ＿ｃｏｕｎｔが、ｆａｄ＿ｏｕｔ＿ｆｒａｍｅ＿ｃｏｕｎｔ＜Ｎという条件を満たす場合、経時変化フェードアウト処理が、周波数領域内で符号化パラメータを重み付けすることによって実行され、重み付け係数は時間の経過と共に変化し、ここで、Ｎは、移行フレームの数である（例えば、Ｎ＝５０）。

広帯域から狭帯域への切り換えの後のｋ番目のフレーム（ｋ＝０，．．．，Ｎ−１）の高域符号化パラメータが、式（３）を使用して復元されてもよく、そして、復元された高域符号化パラメータが復号化されて、高域信号成分が取得されてもよい。周波数領域エンベロープ

（ｊ＝０，．．．，Ｊ、Ｊは分割されたサブバンドの数）は、拡張を介して取得された高域信号成分から、ＴＤＢＷＥアルゴリズムを使用することによって抽出されてもよい。各サブバンドの周波数領域エンベロープは、経時変化フェードアウト利得係数ｇａｉｎ（ｋ，ｊ）を使用することによって重み付けされ、すなわち、

とされる。このようにして、経時変化フェードアウトスペクトルエンベロープが周波数領域内で取得されてもよい。ｇａｉｎ（ｋ，ｊ）を計算するための式は、次の通りである。
ｇａｉｎ（ｋ，ｊ）＝ｍａｘ（０，（Ｊ−ｊ）×Ｎ−Ｊ×ｋ）／（Ｊ×Ｎ），
ｋ＝１，．．．，Ｎ；ｊ＝０，．．．，Ｊ−１

経時変化フェードアウトＴＤＢＷＥ周波数領域エンベロープは、ＴＤＢＷＥ復号化アルゴリズムを使用して復号化されて、処理された経時変化フェードアウト高域信号成分が取得されてもよい。

ステップＳ９０８で、処理された高域信号成分と、復号化された低域信号成分

本発明の上記の実施形態の説明においては、例えば、復号器によって受信された符号ストリームに対応する発話セグメント又は雑音セグメントが、広帯域から狭帯域に切り換わる。以下のような２つのケースがありうるということが理解されよう。復号器によって受信された符号ストリームに対応する発話セグメントが、広帯域から狭帯域に切り換わり、切り換えの後、復号器は、符号ストリームに対応する雑音セグメントを依然として受信する可能性がある。又は、復号器によって受信された符号ストリームに対応する雑音セグメントが、広帯域から狭帯域に切り換わり、切り換えの後、復号器は、符号ストリームに対応する発話セグメントを依然として受信する可能性がある。

本発明の第６の実施形態では、例えば、復号器によって受信された符号ストリームに対応する発話セグメントが、広帯域から狭帯域に切り換わり、復号器は、切り換えの後、符号ストリームに対応する雑音セグメントを依然として受信する可能性があり、経時変化フェードアウト処理は、第３の方法を使用する。言い換えると、拡張を介して取得された高域情報に対して、周波数領域整形が、周波数領域高域パラメータ経時変化重み付け法を使用することによって実行される。音声復号化方法が図１０に示されており、この方法は、以下のようなステップを含む。

ステップ１００１で、復号器は、符号器から送信された符号ストリームを受信し、受信された符号ストリームのフレーム構成を判定する。

具体的には、符号器は、図１の系統ブロック図に示すフローに従って、音声信号を符号化し、符号ストリームを復号器に送信する。復号器は、符号ストリームを受信する。符号ストリームに対応する音声信号が、広帯域から狭帯域への切り換えを有さない場合、復号器は、受信された符号ストリームを、図２の系統ブロック図に示すフローに従って、通常通りに復号化してもよい。ここでは繰り返しを行わない。この実施形態では、復号器によって受信される符号ストリームは、発話セグメントと雑音セグメントとを含む。発話セグメント内の発話フレームは、表１に示すフルレート発話フレームのフレーム構成を有し、雑音セグメント内の雑音フレームは、表２に示すフルレート雑音フレームのフレーム構成を有する。

ステップＳ１００２で、復号器は、符号ストリームのフレーム構成に従って、広帯域から狭帯域への切り換えが発生したかどうかを検知する。そのような切り換えが発生した場合、フローはステップＳ１００３に進む。それ以外の場合、通常の復号化フローに従って符号ストリームが復号化され、復元された音声信号が出力される。

ステップＳ１００３で、受信された符号ストリームに対応する発話信号が広帯域から狭帯域に切り換わった場合、復号器は、受信された低域符号化パラメータを、エンベデッドＣＥＬＰを使用することによって復号化して、低域信号成分

を取得する。

ステップＳ１００４で、人為的帯域拡張技術が、低域信号成分

を拡張して、高域符号化パラメータを取得するために使用されてもよい。

広帯域から狭帯域への切り換えが発生した場合、バッファ内に記憶された音声信号は、切り換えの後に受信された音声信号と同じ、又は異なるタイプのものであってもよい。以下のような５つのケースがありうる。

（１）雑音フレームの高域符号化パラメータのみがバッファ内に記憶され（言い換えると、ＴＤＢＷＥ周波数領域エンベロープのみで、ＴＤＡＣ高域エンベロープはなし）、切り換えの後に受信されるフレームは、全て発話フレームである。

（２）雑音フレームの高域符号化パラメータのみがバッファ内に記憶され（言い換えると、ＴＤＢＷＥ周波数領域エンベロープのみで、ＴＤＡＣ高域エンベロープはなし）、切り換えの後に受信されるフレームは、全て雑音フレームである。

（３）発話フレームの高域符号化パラメータがバッファ内に記憶され（言い換えると、ＴＤＢＷＥ周波数領域エンベロープとＴＤＡＣ高域エンベロープとの両方）、切り換えの後に受信されるフレームは、全て発話フレームである。

（４）発話フレームの高域符号化パラメータがバッファ内に記憶され（言い換えると、ＴＤＢＷＥ周波数領域エンベロープとＴＤＡＣ高域エンベロープとの両方）、切り換えの後に受信されるフレームは、全て雑音フレームである。

（５）発話フレームの高域符号化パラメータがバッファ内に記憶され（言い換えると、ＴＤＢＷＥ周波数領域エンベロープとＴＤＡＣ高域エンベロープとの両方）、雑音フレームの高域符号化パラメータがバッファ内に記憶される（言い換えると、ＴＤＢＷＥ周波数領域エンベロープのみで、ＴＤＡＣ高域エンベロープはなし）。切り換えの後に受信されるフレームは、雑音フレームと発話フレームとの両方を含んでもよい。

上記の実施形態では、ケース（２）及びケース（３）についての詳細な説明を行った。残りの３つのケースでは、切り換えの後に、式（１）の方法に従って、高域符号化パラメータが復元されてもよい。但し、雑音フレームの高域符号化パラメータは、ＴＤＡＣ高域エンベロープを有さない。従って、発話セグメントが切り換えを有した後で雑音セグメントが受信されるケースでは、その高域符号化パラメータはもはや復元されない。言い換えると、ＴＤＡＣ高域エンベロープは復元されず、その理由は、ＴＤＡＣ符号化アルゴリズムはＴＤＢＷＥ符号化のエンハンスメントにすぎないからである。ＴＤＢＷＥ周波数領域エンベロープがあれば、高域信号成分を回復するのに十分である。言い換えると、この実施形態の解決法が有効にされた場合（すなわち、切り換えの後のＮフレーム以内）、発話フレームは、経時変化フェードアウト動作全体が完了するまで、１４ｋｂ／ｓという減少させられたレートで復号化される。切り換えの後のｋ番目のフレーム（ｋ＝１，．．．，Ｎ）のために、高域符号化パラメータの周波数領域エンベロープ

（ｊ＝０，．．．，Ｊ−１、Ｊ＝１２）が復元されてもよい。

ステップＳ１００５で、拡張を介して取得された高域符号化パラメータに対して、周波数領域整形が、周波数領域高域パラメータ経時変化重み付け法を使用して実行され、そして、整形された高域符号化パラメータが復号化されて、処理された高域信号成分が取得される。

具体的には、周波数領域整形の間、高域信号が、周波数領域内でいくつかのサブバンドに分割され、次に、各サブバンド又は各サブバンドを特徴付ける高域符号化パラメータに対して、周波数領域重み付けが、異なる利得を使用して実行され、これにより、信号帯域が徐々に狭くなる。発話フレーム内で使用される、ＴＤＢＷＥ符号化アルゴリズムにおける周波数領域エンベロープ、又は、雑音フレームの広帯域コアレイヤにおける周波数領域エンベロープは、高域を複数のサブバンドに分割する処理を含意してもよい。復号器は、高域符号化パラメータを含む音声信号（広帯域コアレイヤを有するＳＩＤフレーム、及び１４ｋｂ／ｓ以上のレートを有する発話フレームを含む）を受信する。広帯域−狭帯域切り換えフラグｆａｄ＿ｏｕｔ＿ｆｌａｇが０に設定され、移行フレームの数ｆａｄ＿ｏｕｔ＿ｆｒａｍｅ＿ｃｏｕｎｔが０に設定される。特定の瞬間から、復号器によって受信される音声信号が、高域符号化パラメータを含まない場合（ＳＩＤフレーム内に広帯域コアレイヤがない、又は、発話フレームが１４ｋｂ／ｓよりも低い）、復号器は、広帯域から狭帯域への切り換えを判定してもよい。広帯域−狭帯域切り換えフラグｆａｄ＿ｏｕｔ＿ｆｌａｇが１に設定される。移行フレームの数ｆａｄ＿ｏｕｔ＿ｆｒａｍｅ＿ｃｏｕｎｔが、ｆａｄ＿ｏｕｔ＿ｆｒａｍｅ＿ｃｏｕｎｔ＜Ｎという条件を満たす場合、経時変化フェードアウト処理が、周波数領域内で符号化パラメータを重み付けすることによって実行され、重み付け係数は時間の経過と共に変化し、ここで、Ｎは、移行フレームの数である（例えば、Ｎ＝５０）。

Ｊ個の周波数領域エンベロープは、高域信号成分をＪ個のサブバンドに分割してもよい。各周波数領域エンベロープは、経時変化利得係数ｇａｉｎ（ｋ，ｊ）を使用して重み付けされ、言い換えると、

処理されたＴＤＢＷＥ周波数領域エンベロープが、ＴＤＢＷＥ復号化アルゴリズムを使用して復号化されて、処理された経時変化フェードアウト高域信号成分が取得されてもよい。

ステップＳ１００６で、処理された高域信号成分と、復号化された低域信号成分

本発明の第７の実施形態では、例えば、復号器によって受信された符号ストリームに対応する雑音セグメントが、広帯域から狭帯域に切り換わる。切り換えの後、復号器は、符号ストリームに対応する発話セグメントを依然として受信する可能性があり、経時変化フェードアウト処理は、第３の方法を使用する。言い換えると、周波数領域高域パラメータ経時変化重み付け法が、拡張を介して取得された高域情報に対して周波数領域整形を実行するために使用されてもよい。音声復号化方法が図１１に示されており、この方法は、以下のようなステップを含む。

ステップＳ１１０１〜Ｓ１１０２は、第６の実施形態におけるステップＳ１００１〜Ｓ１００２と同様であり、従って、ここでは繰り返しを行わない。

ステップＳ１１０３で、受信された符号ストリームに対応する雑音信号が広帯域から狭帯域に切り換わった場合、復号器は、受信された低域符号化パラメータを、エンベデッドＣＥＬＰを使用することによって復号化して、低域信号成分

を取得する。

ステップＳ１１０４で、人為的帯域拡張技術が、低域信号成分

ステップＳ１１０５で、周波数領域高域パラメータ経時変化重み付け法が、拡張を介して取得された高域符号化パラメータに対して周波数領域整形を実行するために使用されてもよく、そして、整形された高域符号化パラメータが復号化されて、処理された高域信号成分が取得される。

具体的には、周波数領域整形の間、周波数領域重み付けが、各サブバンドを表す高域符号化パラメータに対して、異なる利得を使用して実行され、これにより、信号帯域が徐々に広くなる。復号器は、広帯域符号化パラメータを含む音声信号（広帯域コアレイヤを有するＳＩＤフレーム、及び１４ｋｂ／ｓ以上のレートを有する発話フレームを含む）を受信する。広帯域−狭帯域切り換えフラグｆａｄ＿ｏｕｔ＿ｆｌａｇが０に設定され、移行フレームカウンタｆａｄ＿ｏｕｔ＿ｆｒａｍｅ＿ｃｏｕｎｔが０に設定される。特定の瞬間から開始して、復号器によって受信される音声信号が、広帯域符号化パラメータを含まない場合（言い換えると、ＳＩＤフレームが広帯域コアレイヤを有さない、又は、発話フレームが１４ｋｂ／ｓよりも低いレートを有する）、復号器は、広帯域から狭帯域への切り換えの発生を判定する。次に、広帯域−狭帯域切り換えフラグｆａｄ＿ｏｕｔ＿ｆｌａｇが１に設定される。移行フレームのカウンタｆａｄ＿ｏｕｔ＿ｆｒａｍｅ＿ｃｏｕｎｔが、ｆａｄ＿ｏｕｔ＿ｆｒａｍｅ＿ｃｏｕｎｔ＜Ｎという条件を満たす場合、経時変化フェードアウト処理が、周波数領域内で符号化パラメータを重み付けすることによって実行され、重み付け係数は時間の経過と共に変化し、ここで、Ｎは、移行フレームの数である（例えば、Ｎ＝５０）。

この実施形態では、切り換えが発生した場合、雑音フレームの広帯域符号化パラメータのみがバッファ内に記憶されている（すなわち、ＴＤＢＷＥ周波数領域エンベロープのみで、ＴＤＡＣ高域エンベロープはなし）。切り換えの後に受信されるフレームは、雑音フレームと発話フレームとの両方を含む。切り換えが発生した後、本実施形態の解決法の期間中の高域符号化パラメータは、式（１）の方法を使用して復元されてもよい。しかし、雑音の高域符号化パラメータは、発話フレームにおいて必要とされるＴＤＡＣ高域エンベロープパラメータを有さない。従って、受信された発話フレームのために高域符号化パラメータが復元される場合、ＴＤＡＣ高域エンベロープはもはや復元されず、その理由は、ＴＤＡＣ符号化アルゴリズムはＴＤＢＷＥ符号化のエンハンスメントにすぎないからである。ＴＤＢＷＥ周波数領域エンベロープがあれば、高域信号成分を回復するのに十分である。言い換えると、この実施形態の解決法が有効にされた場合（すなわち、切り換えの後のＮフレーム以内）、発話フレームは、経時変化フェードアウト動作全体が完了するまで、１４ｋｂ／ｓという減少させられたレートで復号化される。切り換えの後のｋ番目のフレーム（ｋ＝１，．．．，Ｎ）のための、復元される高広帯域符号化パラメータは、周波数領域エンベロープ

（ｊ＝０，．．．，Ｊ−１、Ｊ＝１２）が高域成分をＪ個のサブバンドに分割するものである。各サブバンドは、経時変化フェードアウト利得係数ｇａｉｎ（ｋ，ｊ）を使用して重み付けされ、言い換えると、

処理されたＴＤＢＷＥ周波数領域エンベロープが、ＴＤＢＷＥ復号化アルゴリズムを使用して復号化されて、経時変化フェードアウト高域信号成分が取得されてもよい。

ステップＳ１１０６で、処理された高域信号成分と、復号化された狭帯域信号成分

本発明の第８の実施形態では、例えば、復号器によって受信された符号ストリームに対応する発話セグメントが、広帯域から狭帯域に切り換わり、復号器は、切り換えの後、符号ストリームに対応する雑音セグメントを依然として受信する可能性があり、経時変化フェードアウト処理は、第３の方法の簡略化されたバージョンを使用する。音声復号化方法が図１２に示されており、この方法は、以下のようなステップを含む。

ステップＳ１２０１〜Ｓ１２０２は、第６の実施形態におけるステップＳ１００１〜Ｓ１００２と同様であり、従って、ここでは繰り返しを行わない。

ステップＳ１２０３で、受信された発話信号が広帯域から狭帯域に切り換わった場合、復号器は、受信された低域符号化パラメータを、エンベデッドＣＥＬＰを使用して復号化して、低域信号成分

を取得してもよい。

ステップＳ１２０４で、人為的帯域拡張技術が、低域信号成分

広帯域から狭帯域への切り換えが発生したとき、バッファ内に記憶されている音声信号は、切り換えの後に受信された音声信号と同じ、又は異なるタイプのものであってもよく、そして、第６の実施形態で説明した５つのケースが含まれてもよい。上記の実施形態では、ケース（２）及びケース（３）についての詳細な説明を行った。残りの３つのケースについては、切り換えの後に、式（１）の方法に従って、高域符号化パラメータが復元されてもよい。但し、雑音フレームの高域符号化パラメータは、ＴＤＡＣ高域エンベロープを有さない。従って、符号化パラメータを復元するために、ＴＤＡＣ高域エンベロープは復元されず、ＴＤＢＷＥアルゴリズムにおける周波数領域エンベロープ

のみが復元される。ＴＤＡＣ符号化アルゴリズムはＴＤＢＷＥ符号化のエンハンスメントにすぎない。ＴＤＢＷＥ周波数領域エンベロープがあれば、高域信号成分を回復するのに十分である。言い換えると、この実施形態の解決法が有効にされた場合（すなわち、切り換えの後のＣＯＵＮＴ_{ｆａｄ＿ｏｕｔ}フレーム以内）、発話フレームは、経時変化フェードアウト動作全体が完了するまで、１４ｋｂ／ｓという減少させられたレートで復号化される。切り換えの後のｋ番目のフレーム（ｋ＝１，．．．，ＣＯＵＮＴ_{ｆａｄ＿ｏｕｔ}−１）のための、復元される高域符号化パラメータは、周波数領域エンベロープ

（ｊ＝０，．．．，Ｊ−１）が高域成分をＪ個のサブバンドに分割するようなものである。

ステップＳ１２０５で、拡張を介して取得された高域符号化パラメータに対して周波数領域整形を実行するための、簡略化された方法が使用され、そして、整形された高域符号化パラメータが復号化されて、処理された高域信号成分が取得される。

周波数領域整形の間、復元された周波数領域エンベロープ

は、高域信号を、周波数領域内でＪ個のサブバンドに分割する。広帯域−狭帯域切り換えフラグｆａｄ＿ｏｕｔ＿ｆｌａｇが１であり、かつ、移行フレームカウンタｆａｄ＿ｏｕｔ＿ｆｒａｍｅ＿ｃｏｕｎｔが、ｆａｄ＿ｏｕｔ＿ｆｒａｍｅ＿ｃｏｕｎｔ＜ＣＯＵＮＴ_{ｆａｄ＿ｏｕｔ}という条件を満たす場合、経時変化フェードアウト処理が、切り換えの後のｋ番目のフレームのために復元された周波数領域エンベロープに対して、式（４）又は（５）又は（６）を使用して実行される。

（４）

（５）

（６）
上式で、

は、ｘ以下の最大の整数を表す。ＴＤＢＷＥ復号化アルゴリズムが、処理されたＴＤＢＷＥ周波数領域エンベロープに対して使用されて、経時変化フェードアウト高域信号成分が取得されてもよい。ＬＯＷ＿ＬＥＶＥＬは、量子化テーブル内の、周波数領域エンベロープのための可能な最小の値である。例えば、周波数領域エンベロープ

（ｊ＝０，．．．，３）は、マルチレベル量子化技術を使用し、レベル１量子化コードブックは、次の通りである。

レベル２量子化コードブックは、次の通りである。

次に、

であり、ここで、ｌ１（ｊ）は、レベル１量子化ベクトルであり、ｌ２（ｊ）は、レベル２量子化ベクトルである。この実施形態では、

の最小値は、−３．００００＋（−１２．９５５４１）＝−１５．９５５４１である。更に、実際の配備では、最小値は、十分に小さな値の選択肢に簡略化されてもよい。

更に、

を決定するための上記の方法は、本発明の好ましい実施形態であることに留意されたい。実際の配備では、値は、簡略化されるか、又は、特定の技術的要求に応じた技術的要件を満たす他の値に置き換えられてもよい。それらの変更も本発明の範囲に入る。

ステップＳ１２０６で、処理された高域信号成分と、復号化された、復元された低域信号成分とに対して、ＱＭＦフィルタバンクが合成フィルタリングを実行して、経時変化フェードアウト信号が復元される。

本発明は、広帯域から狭帯域への切り換え、及び、ＵＷＢから広帯域への切り換えに適用される。上述の実施形態では、高域信号成分は、ＴＤＢＷＥ又はＴＤＡＣ復号化アルゴリズムを使用して復号化される。本発明は、ＴＤＢＷＥ及びＴＤＡＣ復号化アルゴリズムに加えて、その他の広帯域符号化アルゴリズムにも適用されることに留意されたい。加えて、切り換えの後で高域信号成分及び高域符号化パラメータを拡張するための、本明細書では説明しない様々な方法が存在しうる。

本発明の実施形態で提供される方法を使用すれば、音声信号が広帯域から狭帯域への切り換えを有する場合に、帯域幅検知、人為的帯域拡張、経時変化フェードアウト処理、及び帯域幅合成などの一連の処理が、切り換えが広帯域信号から狭帯域信号への滑らかな移行を有するようにするために使用されてもよく、これにより、快適な聴取体験が達成されることが可能である。

本発明の第９の実施形態による音声復号化装置が図１２に示されており、この装置は、取得ユニット１０と、拡張ユニット２０と、経時変化フェードアウト処理ユニット３０と、合成ユニット４０とを含む。

取得ユニット１０は、受信された符号ストリームに対応する音声信号の低域信号成分を、音声信号が第１の帯域幅から、第１の帯域幅よりも狭い第２の帯域幅に切り換わった場合に取得し、低域信号成分を拡張ユニット２０に送信するように構成される。

拡張ユニット２０は、低域信号成分を拡張して高域情報を取得し、拡張を介して取得された高域情報を経時変化フェードアウト処理ユニット３０に送信するように構成される。

経時変化フェードアウト処理ユニット３０は、拡張を介して取得された高域情報に対して経時変化フェードアウト処理を実行して、処理された高域信号成分を取得し、処理された高域信号成分を合成ユニット４０に送信するように構成される。

合成ユニット４０は、受信された、処理された高域信号成分と、取得ユニット１０によって取得された低域信号成分とを合成するように構成される。

装置は、処理ユニット５０と、検知ユニット６０とを更に含む。

処理ユニット５０は、受信された符号ストリームのフレーム構成を判定し、符号ストリームのフレーム構成を検知ユニット６０に送信するように構成される。

検知ユニット６０は、処理ユニット５０から送信された、符号ストリームのフレーム構成に従って、第１の帯域幅から第２の帯域幅への切り換えが発生したかどうかを検知し、第１の帯域幅から第２の帯域幅への切り換えが発生した場合に、符号ストリームを取得ユニット１０に送信するように構成される。

具体的には、拡張ユニット２０は、第１の拡張サブユニット２１、第２の拡張サブユニット２２、及び第３の拡張サブユニット２３のうちの少なくとも１つを更に含む。

第１の拡張サブユニット２１は、低域信号成分を、切り換えの前に受信された高域信号成分のための符号化パラメータを使用することによって拡張して、高域符号化パラメータを取得するように構成される。

第２の拡張サブユニット２２は、低域信号成分を、切り換えの前に受信された高域信号成分のための符号化パラメータを使用することによって拡張して、高域信号成分を取得するように構成される。

第３の拡張サブユニット２３は、切り換えの後の現在の音声フレームから復号化された低域信号成分を拡張して、高域信号成分を取得するように構成される。

経時変化フェードアウト処理ユニット３０は、セパレート処理サブユニット３１、及びハイブリッド処理サブユニット３２のうちの少なくとも１つを更に含む。

セパレート処理サブユニット３１は、拡張を介して取得された高域情報が高域信号成分である場合に、拡張を介して取得された高域信号成分に対して、時間領域整形及び／又は周波数領域整形を実行し、処理された高域信号成分を合成ユニット４０に送信するように構成される。

ハイブリッド処理サブユニット３２は、拡張を介して取得された高域情報が高域符号化パラメータである場合に、拡張を介して取得された高域符号化パラメータに対して周波数領域整形を実行するか、又は、拡張を介して取得された高域情報が高域信号成分である場合に、拡張を介して取得された高域信号成分をサブバンドに分割し、各サブバンドのための符号化パラメータに対して周波数領域整形を実行し、処理された高域信号成分を合成ユニット５０に送信するように構成される。

セパレート処理サブユニット３１は、第１のサブユニット３１１、第２のサブユニット３１２、第３のサブユニット３１３、及び第４のサブユニット３１４のうちの少なくとも１つを更に含む。

第１のサブユニット３１１は、拡張を介して取得された高域信号成分に対して、時間領域整形を、時間領域利得係数を使用することによって実行し、処理された高域信号成分を合成ユニット４０に送信するように構成される。

第２のサブユニット３１２は、拡張を介して取得された高域信号成分に対して、周波数領域整形を、経時変化フィルタリングを使用することによって実行し、処理された高域信号成分を合成ユニット４０に送信するように構成される。

第３のサブユニット３１３は、拡張を介して取得された高域信号成分に対して、時間領域整形を、時間領域利得係数を使用することによって実行し、時間領域整形された高域信号成分に対して、周波数領域整形を、経時変化フィルタリングを使用することによって実行し、処理された高域信号成分を合成ユニット４０に送信するように構成される。

第４のサブユニット３１４は、拡張を介して取得された高域信号成分に対して、周波数領域整形を、経時変化フィルタリングを使用することによって実行し、周波数領域整形された高域信号成分に対して、時間領域整形を、時間領域利得係数を使用することによって実行し、処理された高域信号成分を合成ユニット４０に送信するように構成される。

ハイブリッド処理サブユニット３２は、第５のサブユニット３２１、及び第６のサブユニット３２２のうちの少なくとも１つを更に含む。

第５のサブユニット３２１は、拡張を介して取得された高域情報が高域符号化パラメータである場合に、拡張を介して取得された高域符号化パラメータに対して、周波数領域整形を、周波数領域高域パラメータ経時変化重み付け法を使用することによって実行して、経時変化フェードアウトスペクトルエンベロープを取得し、高域信号成分を復号化を介して取得し、処理された高域信号成分を合成ユニット４０に送信するように構成される。

第６のサブユニット３２２は、拡張を介して取得された高域情報が高域信号成分である場合に、拡張を介して取得された高域信号成分をサブバンドに分割し、各サブバンドのための符号化パラメータに対して、周波数領域高域パラメータ経時変化重み付けを実行して、経時変化フェードアウトスペクトルエンベロープを取得し、高域信号成分を復号化を介して取得し、処理された高域信号成分を合成ユニット４０に送信するように構成される。

本発明の実施形態で提供される装置を使用すれば、音声信号が広帯域から狭帯域への切り換えを有する場合に、帯域幅検知、人為的帯域拡張、経時変化フェードアウト処理、及び帯域幅合成などの一連の処理が、切り換えが広帯域信号から狭帯域信号への滑らかな移行を有するようにするために使用されてもよく、これにより、快適な聴取体験が達成されることが可能である。

様々な実施形態についての上記の説明から、当業者は、本発明が、ハードウェア内で、又はソフトウェアと必要な汎用ハードウェアプラットフォームとによって実施されてもよいということを明確に理解するであろう。この理解に基づいて、本発明の技術的解決法は、ソフトウェア製品として実施されてもよい。ソフトウェア製品は、不揮発性記憶媒体（ＲＯＭ／ＲＡＭ、Ｕディスク、リムーバブルディスクなどであってもよい）内に記憶されてもよく、コンピュータ装置（ＰＣ、サーバ、ネットワーク装置など）に本発明の様々な実施形態による方法を実行させるいくつかの命令を含む。

本発明についての詳細な説明を、いくつかの好ましい実施形態を参照して上記で行ったが、それらの実施形態は、本発明の範囲を限定するために使用されるものではない。本発明の原理内で行われる様々な変更、均等物との置換、及び改良は、本発明の範囲に入ることが意図される。

Claims

受信された符号ストリーム内の音声信号の低域信号成分を、前記音声信号が第１の帯域幅から、前記第１の帯域幅よりも狭い第２の帯域幅に切り換わった場合に取得し、
前記低域信号成分を拡張して高域情報を取得し、
拡張を介して取得された前記高域情報に対して経時変化フェードアウト処理を実行して、処理された高域信号成分を取得し、
前記処理された高域信号成分と、前記取得された低域信号成分とを合成すること
を含む、音声信号復号化方法。
前記音声信号の前記低域信号成分を取得する前に、前記方法は、
前記受信された符号ストリームのフレーム構成を判定し、
前記第１の帯域幅から前記第２の帯域幅への前記切り換えが発生したかどうかを、前記フレーム構成に従って検知すること
を更に含む、請求項１に記載の音声信号復号化方法。
前記低域信号成分を拡張して高域情報を取得することは、
前記低域信号成分を、前記切り換えの前に受信された高域信号成分のための符号化パラメータを使用することによって拡張して、高域復号化パラメータである高域情報を取得し、又は、
前記低域信号成分を、前記切り換えの前に受信された高域信号成分のための符号化パラメータを使用することによって拡張して、高域信号成分である高域情報を取得し、又は、
前記切り換えの後の現在の音声フレームから復号化された低域信号成分を拡張して、高域信号成分を取得すること
を更に含む、請求項１に記載の音声信号復号化方法。
前記低域信号成分を、前記切り換えの前に受信された前記高域信号成分のための前記符号化パラメータを使用することによって拡張して、高域情報を取得することは、
前記切り換えの前に受信された音声フレームの高域符号化パラメータをバッファリングし、
現在の音声フレームの高域符号化パラメータを、前記切り換えの後の外挿を使用することによって推定すること
を含む、請求項３に記載の音声信号復号化方法。
前記低域信号成分を、前記切り換えの前に受信された前記高域信号成分のための前記符号化パラメータを使用することによって拡張して、高域情報を取得することは、
前記切り換えの前に受信された音声フレームの高域符号化パラメータをバッファリングし、
現在の音声フレームの高域符号化パラメータを、前記切り換えの後の外挿を使用することによって推定し、
外挿を使用して推定された前記高域符号化パラメータを、対応する広帯域復号化アルゴリズムを使用して拡張して、高域信号成分を取得すること
を含む、請求項３に記載の音声信号復号化方法。
前記高域情報に対して経時変化フェードアウト処理を実行することは、
前記高域情報に対してセパレート経時変化フェードアウト処理を実行すること、又は
前記高域情報に対してハイブリッド経時変化フェードアウト処理を実行すること
を含む、請求項１に記載の音声信号復号化方法。
前記高域情報は高域信号成分であり、前記高域情報に対してセパレート経時変化フェードアウト処理を実行するステップは、
拡張を介して取得された前記高域信号成分に対して、時間領域整形を、時間領域利得係数を使用することによって実行すること、又は、
拡張を介して取得された前記高域信号成分に対して、周波数領域整形を、経時変化フィルタリングを使用することによって実行すること
を更に含む、請求項６に記載の音声信号復号化方法。
拡張を介して取得された前記高域信号成分に対して、時間領域整形を、時間領域利得係数を使用することによって実行した後に、前記方法は、
前記時間領域整形された高域信号成分に対して、周波数領域整形を、経時変化フィルタリングを使用することによって実行すること
を更に含む、請求項７に記載の音声信号復号化方法。
拡張を介して取得された前記高域信号成分に対して、周波数領域整形を、経時変化フィルタリングを使用することによって実行した後に、前記方法は、
前記周波数領域整形された高域信号成分に対して、時間領域整形を、時間領域利得係数を使用することによって実行すること
を更に含む、請求項７に記載の音声信号復号化方法。
前記高域情報に対してハイブリッド経時変化フェードアウト処理を実行することは、
前記高域情報が高域符号化パラメータである場合に、拡張を介して取得された前記高域符号化パラメータに対して、周波数領域整形を、周波数領域高域パラメータ経時変化重み付け法を使用することによって実行して、経時変化フェードアウトスペクトルエンベロープを取得し、そして、高域信号成分を復号化を介して取得すること、又は、
前記高域情報が高域信号成分である場合に、拡張を介して取得された前記高域信号成分をサブバンドに分割し、各サブバンドのための符号化パラメータに対して、周波数領域高域パラメータ経時変化重み付けを実行して、経時変化フェードアウトスペクトルエンベロープを取得し、そして、高域信号成分を復号化を介して取得すること
を更に含む、請求項６に記載の音声信号復号化方法。
取得ユニットと、拡張ユニットと、経時変化フェードアウト処理ユニットと、合成ユニットとを備え、
前記取得ユニットは、受信された符号ストリーム内の音声信号の低域信号成分を、前記音声信号が第１の帯域幅から、前記第１の帯域幅よりも狭い第２の帯域幅に切り換わった場合に取得し、前記低域信号成分を前記拡張ユニットに送信するように構成され、
前記拡張ユニットは、前記低域信号成分を拡張して高域情報を取得し、拡張を介して取得された前記高域情報を前記経時変化フェードアウト処理ユニットに送信するように構成され、
前記経時変化フェードアウト処理ユニットは、拡張を介して取得された前記高域情報に対して経時変化フェードアウト処理を実行して、処理された高域信号成分を取得し、前記処理された高域信号成分を前記合成ユニットに送信するように構成され、
前記合成ユニットは、受信された、前記処理された高域信号成分と、前記取得ユニットによって取得された前記低域信号成分とを合成するように構成された、音声信号復号化装置。
処理ユニットと、検知ユニットとを更に備え、
前記処理ユニットは、前記受信された符号ストリームのフレーム構成を判定し、前記符号ストリームの前記フレーム構成を前記検知ユニットに送信するように構成され、
前記検知ユニットは、前記処理ユニットから送信された、前記符号ストリームの前記フレーム構成に従って、前記第１の帯域幅から前記第２の帯域幅への前記切り換えが発生したかどうかを検知し、前記第１の帯域幅から前記第２の帯域幅への前記切り換えが発生した場合に、前記符号ストリームを前記取得ユニットに送信するように構成された、請求項１１に記載の音声信号復号化装置。
前記拡張ユニットは、第１の拡張サブユニット、第２の拡張サブユニット、及び第３の拡張サブユニットのうちの少なくとも１つを更に備え、
前記第１の拡張サブユニットは、前記低域信号成分を、前記切り換えの前に受信された高域信号成分のための符号化パラメータを使用することによって拡張して、高域符号化パラメータを取得するように構成され、
前記第２の拡張サブユニットは、前記低域信号成分を、前記切り換えの前に受信された高域信号成分のための符号化パラメータを使用することによって拡張して、高域信号成分を取得するように構成され、
前記第３の拡張サブユニットは、前記切り換えの後の現在の音声フレームから復号化された低域信号成分を拡張して、高域信号成分を取得するように構成された、請求項１１に記載の音声信号復号化装置。
前記経時変化フェードアウト処理ユニットは、セパレート処理サブユニット、又はハイブリッド処理サブユニットを更に備え、
前記セパレート処理サブユニットは、拡張を介して取得された前記高域情報が高域信号成分である場合に、拡張を介して取得された前記高域信号成分に対して、時間領域整形及び／又は周波数領域整形を実行し、処理された高域信号成分を前記合成ユニットに送信するように構成され、
前記ハイブリッド処理サブユニットは、
拡張を介して取得された前記高域情報が高域符号化パラメータである場合に、拡張を介して取得された前記高域符号化パラメータに対して周波数領域整形を実行するか、又は、
拡張を介して取得された前記高域情報が高域信号成分である場合に、拡張を介して取得された前記高域信号成分をサブバンドに分割し、各サブバンドのための符号化パラメータに対して周波数領域整形を実行し、処理された高域信号成分を前記合成ユニットに送信するように構成された、請求項１１に記載の音声信号復号化装置。
前記セパレート処理サブユニットは、第１のサブユニット、第２のサブユニット、第３のサブユニット、及び第４のサブユニットのうちの少なくとも１つを更に備え、
前記第１のサブユニットは、拡張を介して取得された前記高域信号成分に対して、時間領域整形を、時間領域利得係数を使用することによって実行し、処理された高域信号成分を前記合成ユニットに送信するように構成され、
前記第２のサブユニットは、拡張を介して取得された前記高域信号成分に対して、周波数領域整形を、経時変化フィルタリングを使用することによって実行し、処理された高域信号成分を前記合成ユニットに送信するように構成され、
前記第３のサブユニットは、拡張を介して取得された前記高域信号成分に対して、時間領域整形を、時間領域利得係数を使用することによって実行し、前記時間領域整形された高域信号成分に対して、周波数領域整形を、経時変化フィルタリングを使用することによって実行し、処理された高域信号成分を前記合成ユニットに送信するように構成され、
前記第４のサブユニットは、拡張を介して取得された前記高域信号成分に対して、周波数領域整形を、経時変化フィルタリングを使用することによって実行し、前記周波数領域整形された高域信号成分に対して、時間領域整形を、時間領域利得係数を使用することによって実行し、処理された高域信号成分を前記合成ユニットに送信するように構成された、請求項１４に記載の音声信号復号化装置。
前記ハイブリッド処理サブユニットは、第５のサブユニット、及び第６のサブユニットのうちの少なくとも１つを更に備え、
前記第５のサブユニットは、
拡張を介して取得された前記高域情報が高域符号化パラメータである場合に、拡張を介して取得された前記高域符号化パラメータに対して、周波数領域整形を、周波数領域高域パラメータ経時変化重み付け法を使用することによって実行して、経時変化フェードアウトスペクトルエンベロープを取得し、
高域信号成分を復号化を介して取得し、
処理された高域信号成分を前記合成ユニットに送信するように構成され、
前記第６のサブユニットは、
拡張を介して取得された前記高域情報が高域信号成分である場合に、拡張を介して取得された前記高域信号成分をサブバンドに分割し、
各サブバンドのための前記符号化パラメータに対して、周波数領域高域パラメータ経時変化重み付けを実行して、経時変化フェードアウトスペクトルエンベロープを取得し、
高域信号成分を復号化を介して取得し、
処理された高域信号成分を前記合成ユニットに送信するように構成された、請求項１４に記載の音声信号復号化装置。