JP2017062512A

JP2017062512A - オーディオ・データを処理するための方法、装置、及びシステム

Info

Publication number: JP2017062512A
Application number: JP2016252612A
Authority: JP
Inventors: ▲ジョ▼ 王; Zhe Wang
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2011-12-30
Filing date: 2016-12-27
Publication date: 2017-03-30
Anticipated expiration: 2032-12-28
Also published as: US9406304B2; KR20170002704A; US20140316774A1; KR101770237B1; KR20140109456A; BR112014016153A2; MY173976A; SG11201403686SA; US11183197B2; RU2641464C1; JP6072068B2; CA2861916A1; ZA201600247B; US20220044692A1; HK1199543A1; PT2793227T; MX338445B; EP2793227B1; EP2793227A1; CA2861916C

Abstract

【課題】本発明は、オーディオ・データを処理するための方法、装置、及びシステムを開示し、通信技術の分野に関する。
【解決手段】この方法は、オーディオ信号の雑音フレームを取得し、雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解することと、第１の非連続送信機構を用いることによって雑音低帯域信号を符号化及び送信し、第２の非連続送信機構を用いることによって雑音高帯域信号を符号化及び送信することと、を含む。本発明に従って、高帯域信号及び低帯域信号に異なる処理方法を用い、コーデックの本質的な品質を低下させないという前提のもとに計算の複雑さを軽減して符号化ビットを節約することができ、節約したビットは、送信帯域幅を縮小するか又は全体的な符号化品質を向上させる目的の達成に役立てることができる。
【選択図】図１

Description

本発明は通信技術の分野に関し、具体的には、オーディオ・データを処理するための方法、装置、及びシステムに関する。

デジタル通信の分野において、移動電話通話、オーディオ／ビデオ会議、放送用テレビ、及びマルチメディア娯楽等、音声、画像、オーディオ、及びビデオの送信を幅広く利用しようという要求がある。音声はデジタル化され、次いである端末から別の端末へ音声通話通信ネットワークを介して転送される。本明細書において、端末とは、移動電話、デジタル電話端末、又は音声通話向け端末、又は他のいずれかのタイプである場合がある。デジタル電話端末の例は、ＶｏＩＰ電話又はＩＳＤＮ電話、コンピュータ、及びケーブル通信電話である。オーディオ信号を記憶又は送信するプロセスに占有されるリソースを低減させるため、送信端はオーディオ信号を受信端に送信する前にオーディオ信号に圧縮処理を行い、受信端は伸張処理を行ってオーディオ信号を復元しオーディオ信号を再生する。

音声通話向け通信においては、音声は時間の約４０％に含まれるに過ぎず、他の時間は単に無音又は背景雑音があるだけである。無音又は背景雑音期間において送信帯域幅を節約し不必要な帯域幅の消費を回避するため、ＤＴＸ／ＣＮＧ（Discontinuous transmission system/Comfort noise Generation）技術が出現している。簡単に言うとＤＴＸ／ＣＮＧは、雑音フレームを連続的に符号化せず、特定のポリシーに従って雑音／無音期間中はいくつかのフレーム間隔に１度のみ符号化を行うことを意味する。この場合、符号化ビット・レートは概して音声フレーム符号化のビット・レートよりもはるかに低い。かかる低レートで符号化される雑音フレームはＳＩＤ（Silence Insertion Descriptor、無音挿入記述子フレーム）と称される。デコーダは、非連続的に受信したＳＩＤに従って復号化端において連続的な背景雑音フレームを復元する。かかる連続的に復元した背景雑音は、復号化端の背景雑音の忠実な再生ではなく、聴取における品質低下の発生をできる限り回避して、ユーザに雑音が聞こえた場合でも快適に感じることを目的とするものである。復元した背景雑音はＣＮ（Comfort Noise、快適雑音）と称され、復号化端においてＣＮを復元するための方法は快適雑音生成と称される。

従来技術において、ＩＴＵ−ＴＧ．７１８は新しい標準的な広帯域コーデック規格であり、広帯域ＤＴＸ／ＣＮＧシステムを含む。この標準規格に従うシステムは、固定間隔に従ってＳＩＤを送信することができ、推定雑音レベルに従ってＳＩＤ送信間隔を適応的に調節することができる。Ｇ．７１８のＳＩＤフレームは１６のＩＳＰパラメータ及び励起エネルギ・パラメータを含む。このＩＳＰ（Immittance Spectral Pair）パラメータ群は、全ての広帯域帯域幅のスペクトル包絡線を表し、このＩＳＰパラメータ群が表す分析フィルタによって励起エネルギを取得する。復号化端において、Ｇ．７１８は、ＣＮＧ状態となるようにＳＩＤを復号化処理することで取得されるＩＳＰパラメータに従って、ＣＮＧに必要なＬＰＣ係数を推定し、ＳＩＤフレームを復号化処理することで取得される励起エネルギ・パラメータに従って、ＣＮＧに必要な励起エネルギを推定し、利得調整した白色雑音を用いてＣＮＧ合成フィルタを励起して再構築されたＣＮを取得する。

しかしながら、超広帯域スペクトル包絡線では、超広帯域の帯域幅は極めて広い。従来技術を超広帯域ＤＴＸ／ＣＮＧシステムに拡張した場合、数十個の追加的なＩＳＰパラメータを計算し符号化するために、更に多くの計算負荷及びビットを消費する必要がある。なぜなら、ＳＩＤのために完全な超広帯域スペクトル包絡線を符号化する必要があるからである。雑音の高帯域信号（これは本明細書において広帯域よりも高い周波数位置に有る周波数範囲を指す）は、概して人間が聴取した際の知覚的な感度が高くない帯域信号であるので、この帯域信号部分のために消費される計算負荷及びビットは費用対効果が小さく、このためコーデックの符号化効率が低下してしまう。

超広帯域符号化及び送信の問題を解決するため、本発明の実施形態は、オーディオ・データを処理するための方法、デバイス、及びシステムを提供する。この技術的解決策は以下の通りである。

本発明を実施するための一態様によれば、オーディオ・データを処理するための方法が提供され、これは、
オーディオ信号の雑音フレームを取得し、当該雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解する処理動作と、
第１の非連続送信機構を用いることによって当該雑音低帯域信号を符号化した上で、当該符号化された後の当該雑音低帯域信号を当該第１の非連続送信機構を使用して送信し、第２の非連続送信機構を用いることによって当該雑音高帯域信号を符号化した上で、当該符号化された後の当該雑音高帯域信号を当該第２の非連続送信機構を使用して送信する処理動作であって、当該第１の非連続送信機構の第１の無音挿入記述子フレーム（ＳＩＤ）を送出するためのポリシーが、当該第２の非連続送信機構の第２のＳＩＤを送出するためのポリシーとは異なり、又は、当該第１の非連続送信機構の第１のＳＩＤを符号化するためのポリシーが、当該第２の非連続送信機構の第２のＳＩＤを符号化するためのポリシーとは異なる、処理動作と、
を含む。

本発明を実施するための一態様によれば、オーディオ・データを処理するための方法が提供され、これは、
デコーダによって、ＳＩＤを取得し、当該ＳＩＤが低帯域パラメータ及び／又は高帯域パラメータを含むことを判定する処理動作と、
当該ＳＩＤが当該低帯域パラメータを含む場合、当該ＳＩＤを復号化処理して雑音低帯域パラメータを取得し、雑音高帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音低帯域パラメータ及び当該ローカルに発生した雑音高帯域パラメータに従って第１の快適雑音（ＣＮ）フレームを取得する処理動作と、
当該ＳＩＤが高帯域パラメータを含む場合、当該ＳＩＤを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音高帯域パラメータ及び当該ローカルに発生した雑音低帯域パラメータに従って第２のＣＮフレームを取得する処理動作と、
当該ＳＩＤが高帯域パラメータ及び低帯域パラメータを含む場合、当該ＳＩＤを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、当該復号化処理によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第３のＣＮフレームを取得する処理動作と、
を含む。

本発明を実施するためのさらに別の態様によれば、オーディオ・データを符号化するための装置が提供され、これは、
オーディオ信号の雑音フレームを取得し、当該雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解するように構成された取得モジュールと、
第１の非連続送信機構を用いることによって当該雑音低帯域信号を符号化した上で、当該符号化された後の当該雑音低帯域信号を当該第１の非連続送信機構を使用して送信し、第２の非連続送信機構を用いることによって当該雑音高帯域信号を符号化した上で、当該符号化された後の当該雑音高帯域信号を当該第２の非連続送信機構を使用して送信するように構成された送信モジュールであって、当該第１の非連続送信機構の第１のＳＩＤを送出するためのポリシーが、当該第２の非連続送信機構の第２のＳＩＤを送出するためのポリシーとは異なり、又は、当該第１の非連続送信機構の第１のＳＩＤを符号化するためのポリシーが、当該第２の非連続送信機構の第２のＳＩＤを符号化するためのポリシーとは異なる、送信モジュールと、
を含む。

本発明を実施するためのさらに別の態様によれば、オーディオ・データを復号化するための装置が提供され、これは、
ＳＩＤを取得し、当該ＳＩＤが低帯域パラメータ及び／又は高帯域パラメータを含むことを判定するように構成された取得モジュールと、
当該取得モジュールによって取得された当該ＳＩＤが低帯域パラメータを含む場合、当該ＳＩＤを復号化処理して雑音低帯域パラメータを取得し、雑音高帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音低帯域パラメータ及び当該ローカルに発生した雑音高帯域パラメータに従って第１のＣＮフレームを取得するように構成された第１の復号化モジュールと、
当該取得モジュールによって取得された当該ＳＩＤが高帯域パラメータを含む場合、当該ＳＩＤを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、当該復号処理によって取得した雑音高帯域パラメータ及び当該ローカルに発生した雑音低帯域パラメータに従って第２のＣＮフレームを取得するように構成された第２の復号化モジュールと、
当該取得モジュールによって取得された当該ＳＩＤが高帯域パラメータ及び低帯域パラメータを含む場合、当該ＳＩＤを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、当該復号化処理によって取得した当該雑音高帯域パラメータ及び当該雑音低帯域パラメータに従って第３のＣＮフレームを取得するように構成された第３の復号化モジュールと、
を含む。

本発明を実施するためのさらに別の態様によれば、オーディオ・データを処理するためのシステムが提供され、これは、オーディオ・データを符号化するための前述の装置及びオーディオ・データを復号化するための前述の装置を含む。

本発明の実施形態が提供する技術的解決策は、以下の有利な効果を与える。すなわち、現在処理中の雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解し、第１の非連続送信機構を用いることによって雑音低帯域信号を符号化し及び送信し、第２の非連続送信機構を用いることによって雑音高帯域信号を符号化し及び送信する。デコーダは、無音挿入記述子フレーム（ＳＩＤ）を取得し、当該ＳＩＤが低帯域パラメータ及び／又は高帯域パラメータを含むか否かを判定する。当該判定に関し、異なる判定結果に応じて異なる雑音復号化方法が用いられる。このように、高帯域信号及び低帯域信号のそれぞれについて互いに異なる符号化及び復号化の処理方法を用い、コーデックの本質的な品質を低下させないという前提のもとに計算の複雑さを軽減して符号化ビットを節約することができ、当該節約したビットは、送信帯域幅を縮小するか又は全体的な符号化品質を向上させる目的を達成するために役立てることができ、これによって超広帯域符号化及び超広帯域送信の問題を解決する。

本発明の実施形態における技術的解決策を更に明確に説明するため、以下で、実施形態又を説明するために必要な添付図面を簡単に紹介する。明らかに、以下の説明における添付図面は本発明のいくつかの実施形態を図示するだけであり、当業者は、創造的な労力なしで、これらの添付図面から他の図面を導出することができる。

本発明の実施形態１に従ってオーディオ・データを処理するための方法のフローチャートである。本発明の実施形態２に従ってオーディオ・データを処理するための方法のフローチャートである。本発明の実施形態３に従ってオーディオ・データを処理するための方法のフローチャートである。本発明の実施形態４に従ってオーディオ・データを処理するための方法のフローチャートである。本発明の実施形態６に従ってオーディオ・データを符号化するための装置の概略図である。本発明の実施形態６に従ってオーディオ・データを符号化するための別の装置の概略図である。本発明の実施形態７に従ってオーディオ・データを復号化するための装置の概略図である。本発明の実施形態７に従ってオーディオ・データを復号化するための別の装置の概略図である。本発明の実施形態８に従ってオーディオ・データを処理するためのシステムの概略図である。

本発明の目的、技術的解決策、及び利点を更に明らかにするため、以下で添付図面を参照して本発明の実施形態を更に詳細に記載する。

図１を参照すると、この実施形態はオーディオ・データを処理するための方法を提供する。この方法は以下を含む。

１０１．オーディオ信号の雑音フレームを取得し、雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解する。

１０２．第１の非連続送信機構を用いることによって雑音低帯域信号を符号化及び送信し、第２の非連続送信機構を用いることによって雑音高帯域信号を符号化及び送信することであって、第１の非連続送信機構の第１の無音挿入記述子フレーム（ＳＩＤ）を送出するためのポリシーが、第２の非連続送信機構の第２のＳＩＤを送出するためのポリシーとは異なり、又は、第１の非連続送信機構の第１のＳＩＤを符号化するためのポリシーが、第２の非連続送信機構の第２のＳＩＤを符号化するためのポリシーとは異なる。

この実施形態において、第１のＳＩＤは雑音フレームの低帯域パラメータを含み、第２のＳＩＤは雑音フレームの低帯域パラメータ又は高帯域パラメータを含む。

任意選択的な構成として、この実施形態では、第２の非連続送信機構を用いることによって雑音高帯域信号を符号化及び送信することが、
雑音高帯域信号が予め設定されたスペクトル構造を有するか否かを判定し、これを有すると共に第２のＳＩＤを送出するためのポリシーの送出条件を満たす場合は、第２のＳＩＤを符号化するためのポリシーを用いることで雑音高帯域信号のＳＩＤを符号化し、ＳＩＤを送出し、これを有しない場合は、雑音高帯域信号の符号化及び送信を行う必要がないと判定することを含む。

雑音高帯域信号が予め設定されたスペクトル構造を有するか否かを判定する処理動作が、
雑音高帯域信号のスペクトルを取得し、当該スペクトルを少なくとも２つのサブバンド（subband）に分割し、当該サブバンド内のいずれの第１のサブバンドの平均エネルギであっても当該サブバンド内の第２のサブバンドの平均エネルギより低くない場合には、雑音高帯域信号が予め設定されたスペクトル構造を有しないことを確定し、その他の場合においては、雑音高帯域信号が予め設定されたスペクトル構造を有することを確定する動作を含み、第２のサブバンドが位置する周波数帯域が第１のサブバンドが位置する周波数帯域よりも高いことを特徴とする。

任意選択的な構成として、この実施形態では、第２の非連続送信機構を用いることによって雑音高帯域信号を符号化及び送信する処理動作が、
第１の比率及び第２の比率に従って偏差程度値（deviation extent value）を発生する処理動作であって、第１の比率が、雑音フレームの雑音低帯域信号のエネルギに対する雑音フレームの雑音高帯域信号のエネルギの比率であり、第２の比率が、雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号のエネルギの比率である、処理動作と、
偏差程度値が予め設定された閾値に達したか否かを判定し、これに達した場合は第２のＳＩＤを符号化するためのポリシーを用いることによって雑音高帯域信号のＳＩＤを符号化し、ＳＩＤを送出し、達しない場合は雑音高帯域信号の符号化及び送信を行う必要がないと判定する処理動作と、
を含む。

任意選択的な構成として、第１の比率を、雑音フレームの雑音低帯域信号のエネルギに対する雑音高帯域信号のエネルギの比率とすることは、
第１の比率を、雑音フレームの雑音低帯域信号の瞬時エネルギに対する雑音フレームの雑音高帯域信号の瞬時エネルギの比率とすることを含み、更に、
これに対応して、第２の比率を、雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号のエネルギの比率とすることは、
第２の比率を、雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した時点での雑音低帯域信号の瞬時エネルギに対する雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号の瞬時エネルギの比率とすることを含む。

あるいは、第１の比率を、雑音フレームの雑音低帯域信号のエネルギに対する雑音フレームの雑音高帯域信号のエネルギの比率とすることが、
第１の比率を、雑音フレーム及びこの雑音フレームの前の雑音フレームの雑音低帯域信号の加重平均エネルギに対する雑音フレーム及びこの雑音フレームの前の雑音フレームの雑音高帯域信号の加重平均エネルギの比率とすることを含み、更に、
これに対応して、第２の比率を、雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号のエネルギの比率とすることが、
第２の比率を、雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点での雑音フレーム及び雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点での前記雑音フレームの前の雑音フレームの低帯域信号の加重平均エネルギに対する、雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点での前記雑音フレーム及び雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した時点での前記雑音フレームの前の雑音フレームの高帯域信号の加重平均エネルギの比率とすることを含む。

この実施形態において、第１の比率及び第２の比率に従って偏差程度値を発生する処理動作が、
第１の比率の対数値及び第２の比率の対数値を別個に計算する処理動作と、
第１の比率の対数値と第２の比率の対数値との間の差の絶対値を計算して偏差程度値を取得する処理動作と、
を含む。

任意選択的な構成として、この実施形態では、第２の非連続送信機構を用いることによって雑音高帯域信号を符号化及び送信する処理動作が、
雑音フレームの雑音高帯域信号のスペクトル構造が、雑音フレームの前の雑音高帯域信号の平均スペクトル構造に比べて、予め設定された条件を満たすか否かを判定し、これを満たす場合には、第２のＳＩＤを符号化するためのポリシーを用いることによって雑音フレームの雑音高帯域信号のＳＩＤを符号化し、ＳＩＤを送出し、これを満たさない場合には、雑音フレームの雑音高帯域信号の符号化及び送信を行う必要がないと判定する処理動作を含む。

雑音フレームの前の雑音高帯域信号の平均スペクトル構造が、雑音フレームの前の雑音高帯域信号のスペクトルの加重平均を含む。

この実施形態において、第２の非連続送信機構の第２のＳＩＤを送出するためのポリシーにおける送出条件が、第１の非連続送信機構が第１のＳＩＤを送出するための条件を満たす必要があることを更に含む。

本発明が提供する方法の実施形態は、以下の有利な効果を与える。すなわち、オーディオ信号の雑音フレームを取得し、現在処理中の雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解し、第１の非連続送信機構を用いることによって雑音低帯域信号を符号化及び送信し、第２の非連続送信機構を用いることによって雑音高帯域信号を符号化し及び送信する。このように、高帯域信号及び低帯域信号のそれぞれについて互いに異なる処理方法を用い、コーデックの本質的な品質を低下させないという前提のもとに計算の複雑さを軽減して符号化ビットを節約することができ、当該節約したビットは、送信帯域幅を縮小するか又は全体的な符号化品質を向上させる目的を達成するために役立てることができ、これによって超広帯域符号化及び超広帯域送信の問題を解決する。

実施形態２
図２を参照すると、この実施形態はオーディオ・データを処理するための方法を提供する。この方法は以下を含む。

２０１．デコーダは、無音挿入記述子フレーム（ＳＩＤ）を取得し、このＳＩＤが低帯域パラメータを含むか又は高帯域パラメータを含むかを判定する。

２０２．当該ＳＩＤが低帯域パラメータを含む場合、当該ＳＩＤを復号化処理して雑音低帯域パラメータを取得し、雑音高帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音低帯域パラメータ及び当該ローカルに発生した雑音高帯域パラメータに従って第１の快適雑音（ＣＮ）フレームを取得する。

２０３．当該ＳＩＤが高帯域パラメータを含む場合、当該ＳＩＤを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音高帯域パラメータ及び当該ローカルに発生した雑音低帯域パラメータに従って第２のＣＮフレームを取得する。

２０４．当該ＳＩＤが高帯域パラメータ及び低帯域パラメータを含む場合、当該ＳＩＤを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、当該復号化処理によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第３のＣＮフレームを取得する。

任意選択的な構成として、この実施形態では、当該ＳＩＤが低帯域パラメータを含む場合、当該ＳＩＤを復号化処理して雑音低帯域パラメータを取得すること、雑音高帯域パラメータをローカルに発生すること、並びに当該復号化処理によって取得した雑音低帯域パラメータ及び当該ローカルに発生した雑音高帯域パラメータに従って第１の快適雑音（ＣＮ）フレームを取得する動作に先立って、この方法が、
当該デコーダが第１の快適雑音生成（ＣＮＧ）状態にある場合、当該デコーダによって第２のＣＮＧ状態に入ることを更に含む。

任意選択的な構成として、この実施形態では、当該ＳＩＤが高帯域パラメータ及び低帯域パラメータを含む場合、当該ＳＩＤを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得すること、並びに当該復号化処理によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第３のＣＮフレームを取得する動作に先立って、この方法が、
当該デコーダが第２のＣＮＧ状態にある場合、デコーダによって第１のＣＮＧ状態に入ることを更に含む。

任意選択的な構成として、この実施形態では、当該ＳＩＤが低帯域パラメータ及び／又は高帯域パラメータを含むことを判定する処理動作が、以下の動作を実行することを含む。
すなわち、上記判定する処理動作は、当該ＳＩＤのビット数が予め設定された第１の閾値よりも小さい場合、当該ＳＩＤが高帯域パラメータを含むことを確定し、当該ＳＩＤのビット数が予め設定された第１の閾値よりも大きく予め設定された第２の閾値よりも小さい場合、当該ＳＩＤが低帯域パラメータを含むことを確定し、当該ＳＩＤのビット数が予め設定された第２の閾値よりも大きく予め設定された第３の閾値よりも小さい場合、当該ＳＩＤが高帯域パラメータ及び低帯域パラメータを含むことを確定する動作、又は、
当該ＳＩＤが第１の識別子を含む場合、当該ＳＩＤが高帯域パラメータを含むことを確定し、当該ＳＩＤが第２の識別子を含む場合、当該ＳＩＤが低帯域パラメータを含むことを確定し、当該ＳＩＤが第３の識別子を含む場合、当該ＳＩＤが低帯域パラメータ及び高帯域パラメータを含むことを確定する動作、を含む。

この実施形態では、雑音高帯域パラメータをローカルに発生する処理動作が、
ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギ及び雑音高帯域信号の合成フィルタ係数を別個に取得する動作と、
ＳＩＤに対応する時点での雑音高帯域信号の取得した加重平均エネルギ及び雑音高帯域信号の取得した合成フィルタ係数に従って雑音高帯域信号を取得する動作と、
を含む。

任意選択的な構成として、この実施形態では、当該ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギを取得する処理動作が、
当該復号化処理によって取得した雑音低帯域パラメータに従って第１のＣＮフレームの低帯域信号のエネルギを取得する動作と、
高帯域パラメータを含むＳＩＤを先行するＳＩＤの前に受信した時点における雑音低帯域信号のエネルギに対する雑音高帯域信号のエネルギの比率を計算して第１の比率を取得する動作と、
当該第１のＣＮフレームの低帯域信号のエネルギ及び当該第１の比率に従って、ＳＩＤに対応する時点での雑音高帯域信号のエネルギを取得することと、
当該ＳＩＤに対応する時点での雑音高帯域信号のエネルギ及びローカルにバッファリングされたＣＮフレームの高帯域信号のエネルギに対して加重平均を実行して、当該ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギを取得する動作であって、当該ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギを当該第１のＣＮフレームの高帯域信号エネルギとする、動作と、
を含む。

任意選択的な構成として、この実施形態では、高帯域パラメータを含むＳＩＤを先行するＳＩＤの前に受信した時点における雑音低帯域信号のエネルギに対する雑音高帯域信号のエネルギの比率を計算して第１の比率を取得する処理動作が、
当該高帯域パラメータを含むＳＩＤを当該先行するＳＩＤの前に受信した時点における雑音低帯域信号の瞬時エネルギに対する雑音高帯域信号の瞬時エネルギの比率を計算して第１の比率を取得する動作、又は、
当該高帯域パラメータを含むＳＩＤを当該先行するＳＩＤの前に受信した時点における雑音低帯域信号の加重平均エネルギに対する雑音高帯域信号の加重平均エネルギの比率を計算して第１の比率を取得する動作、
を含む。

この実施形態においては、当該ＳＩＤに対応する時点での雑音高帯域信号のエネルギが、ローカルにバッファリングされた以前のＣＮフレームの高帯域信号のエネルギよりも大きい場合には、当該ローカルにバッファリングされた以前のＣＮフレームの高帯域信号のエネルギは第１の更新頻度で更新され、その他の場合には、当該ローカルにバッファリングされた以前のＣＮフレームの高帯域信号のエネルギは第２の更新頻度で更新され、当該第１の更新頻度が第２の更新頻度よりも大きい。

任意選択的な構成として、この実施形態では、当該ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギを取得する処理動作が、
当該ＳＩＤよりも先行する予め設定された時間期間内の音声フレームから、最小の高帯域信号エネルギを有する音声フレームの高帯域信号を選択する動作と、
当該音声フレーム中で当該最小の高帯域信号エネルギを有する音声フレームの高帯域信号のエネルギに従って、当該ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギを取得することであって、当該ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギを第１のＣＮフレームの高帯域信号エネルギとする、動作と、を含み、又は、
当該ＳＩＤよりも先行する予め設定された時間期間内の音声フレームから、当該予め設定された閾値よりも小さい高帯域信号エネルギを有するＮ個の音声フレームの高帯域信号を選択する動作と、
当該Ｎ個の音声フレームの高帯域信号の加重平均エネルギに従って、当該ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギを取得することであって、当該ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギを第１のＣＮフレームの高帯域信号エネルギとする、動作と、
を含む。

任意選択的な構成として、この実施形態では、当該ＳＩＤに対応する時点での雑音高帯域信号の合成フィルタ係数を取得する処理動作が、
イミタンス・スペクトル周波数（ＩＳＦ：Immittance Spectral Frequency）係数又はＩＳＰ係数又は線スペクトル周波数（ＬＳＦ：Line Spectral Frequency）係数又は線スペクトル対（ＬＳＰ：Line Spectral pair）係数の何れかであるＭ個の係数を、高帯域信号に対応する周波数範囲にわたって分散させることと、
上述したＭ個の係数に対してランダム化処理を実行する動作であって、当該ランダム化処理の特性が、当該Ｍ個の係数中に含まれる各係数を、当該各係数に対応する目標値に徐々に漸近させるものであり、当該目標値は当該係数の値に近接した予め設定された範囲内の値であり、当該Ｍ個の係数中に含まれる各係数の目標値がＮ個のフレームの各々毎に変化し、Ｍ及びＮの双方が自然数である、動作と、
当該ランダム化処理によって取得したフィルタ係数に従って、当該ＳＩＤに対応する時点での雑音高帯域信号の合成フィルタ係数を取得することと、
を含む。

任意選択的な構成として、この実施形態では、当該ＳＩＤに対応する時点での雑音高帯域信号の合成フィルタ係数を取得する処理動作が、
ローカルにバッファリングされた雑音高帯域信号のＭ個のＩＳＦ係数又はＩＳＰ係数又はＬＳＦ係数又はＬＳＰ係数を取得する動作と、
当該Ｍ個の係数に対してランダム化処理を実行することであって、当該ランダム化処理の特性が、当該Ｍ個の係数中に含まれる各係数を、当該各係数に対応する目標値に徐々に漸近させるものであり、当該目標値は当該係数の値に近接した予め設定された範囲内の値であり、当該Ｍ個の係数中に含まれる各係数の目標値がＮ個のフレームの各々毎に変化する、動作と、
当該ランダム化処理によって取得したフィルタ係数に従って、当該ＳＩＤに対応する時点での雑音高帯域信号の合成フィルタ係数を取得する動作と、
を含む。

任意選択的な構成として、この実施形態では、上述した復号化処理によって取得した雑音低帯域パラメータ及び上記のとおりローカルに発生した雑音高帯域パラメータに従って第１のＣＮフレームを取得する動作に先立って、この方法が、当該ＳＩＤに隣接した履歴フレームが符号化音声フレームである場合には、符号化音声フレームから復号化処理された高帯域信号又は高帯域信号の一部の平均エネルギが、当該ローカルに発生した雑音高帯域信号又は雑音高帯域信号の一部の平均エネルギよりも小さいならば、当該ＳＩＤから開始して以降のＬ個のフレームの雑音高帯域信号を１よりも小さい平滑化係数で乗算して、当該ローカルに発生した雑音高帯域信号の新しい加重平均エネルギを取得する動作をさらに含み、
これに対応して、当該復号化処理によって取得した雑音低帯域パラメータ及び当該ローカルに発生した雑音高帯域パラメータに従って第１のＣＮフレームを取得する動作が、
当該復号化処理によって取得した雑音低帯域パラメータ、当該ＳＩＤに対応する時点での雑音高帯域信号の合成フィルタ係数、及び当該ローカルに発生した雑音高帯域信号の新しい加重平均エネルギに従って、第４のＣＮフレームを取得する動作を含む。

本発明が提供する方法の実施形態は、以下の有利な効果を与える。すなわち、デコーダが、無音挿入記述子フレーム（ＳＩＤ）を取得し、このＳＩＤが低帯域パラメータ及び／又は高帯域パラメータを含むか否かを判定する。当該ＳＩＤが低帯域パラメータを含む場合、ＳＩＤを復号化処理して雑音低帯域パラメータを取得し、雑音高帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音低帯域パラメータ及び当該ローカルに発生した雑音高帯域パラメータに従って第１の快適雑音（ＣＮ）フレームを取得する。当該ＳＩＤが高帯域パラメータを含む場合、当該ＳＩＤを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音高帯域パラメータ及び当該ローカルに発生した雑音低帯域パラメータに従って第２のＣＮフレームを取得する。当該ＳＩＤが高帯域パラメータ及び低帯域パラメータを含む場合、当該ＳＩＤを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、当該復号化処理によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第３のＣＮフレームを取得する。このように、高帯域信号及び低帯域信号のそれぞれに関して互いに異なる処理方法を用い、コーデックの本質的な品質を低下させないという前提のもとに計算の複雑さを軽減して符号化ビットを節約することができ、当該節約したビットは、送信帯域幅を縮小するか又は全体的な符号化品質を向上させる目的を達成することに役立てることができ、これによって超広帯域符号化及び超広帯域送信の問題を解決する。

実施形態３
この実施形態は、オーディオ・データを処理するための方法を提供する。符号化端においては、低帯域ＣＮＧ雑音スペクトル又は高帯域ＣＮＧ雑音スペクトルに関わらず、一般的に高調波構造が失われ、従ってＣＮＧ高帯域信号において、聴取に対して知覚的に有効であるのは主にＣＮＧ高帯域信号のエネルギであり、ＣＮＧ高帯域信号のスペクトル構造ではない。従って、超広帯域信号のＤＴＸ送信では、多くの場合、ＳＩＤにおいて高帯域信号スペクトルを送信する必要はなく、適切な方法を用いて復号化端でローカルに高帯域スペクトルを構築すれば良い。ローカルに構築した高帯域スペクトルは、明らかな知覚的な歪みを生じない。このようにして、符号化端において高帯域スペクトルを計算及び符号化するための計算負荷及びビットが節約される。一方、他の雑音信号では、その高帯域信号に高調波構造が存在する場合があり、復号化端のみでローカルに高帯域スペクトルを構築することによってＣＮＧセグメントと音声セグメントとの間の切り換えにおいて知覚的な品質低下の問題が生じる恐れがある。従って、かかる雑音では、ＳＩＤにおいてスペクトル・パラメータを送信する必要がある。効率及び品質の双方を考慮するＤＴＸ／ＣＮＧシステムは、背景雑音の高帯域特性に従って符号化端でＳＩＤ内に高帯域スペクトル・パラメータを符号化すること、又は符号化しないこと、及び異なるタイプのＳＩＤに応じて異なる復号化処理方法を用いることによって復号化端でＣＮＧフレームを再構築する手段を適応的に選択可能でなければならないことがわかる。この実施形態では、オーディオ・データを処理するための方法が提供され、この方法は以下を含む。すなわち、雑音高帯域スペクトルを分析し分類する。デコーダは高帯域信号スペクトルを盲目的に構築する。ＳＩＤが高帯域エネルギ・パラメータを含まない場合、当該デコーダは高帯域信号エネルギを推定する。当該デコーダは異なるＣＮＧモジュール間で切り換わる等である。特に図３を参照すると、この実施形態に従って符号化端（エンコーダ）においてオーディオ・データを処理するための方法は以下を含む。

３０１．エンコーダはオーディオ信号の雑音フレームを取得し、この雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解する。

この実施形態では、エンコーダはオーディオ信号の雑音フレームを取得し、エンコーダのそれぞれ異なる符号化ルールに応じて、雑音フレームは、現在処理中の雑音フレーム又は符号化端（エンコーダ）でバッファリングされた雑音フレームとすることができ、これはこの実施形態において特に限定されない。この実施形態では、一例として３２ｋＨｚでサンプリングされた超広帯域入力オーディオ信号を用いる。エンコーダはまず、入力オーディオ信号にフレーミング処理を実行し、例えば１フレームとして２０ｍｓ（又は６４０サンプリング・ポイント）を用いる。現在のフレーム（この実施形態においては現在のフレームとは符号化対象となっている現在のフレームを指す）について、エンコーダはまず高域フィルタリングを実行する。概して通過帯域は５０Ｈｚを超える周波数である。高域フィルタリングされた現在のフレームを、直交ミラー・フィルタＱＭＦ（Quadrature Mirror Filter）分析フィルタによって、低帯域信号ｓ_０及び高帯域信号ｓ_１に分解する。低帯域信号ｓ_０は１６ｋＨｚでサンプリングされ、現在のフレームの０〜８ｋＨｚスペクトルを表す。高帯域信号ｓ_１も１６ｋＨｚでサンプリングされ、現在のフレームの８〜１６ｋＨｚスペクトルを表す。ＶＡＤ（Voice Activity Detector、音声活動検出器）が、現在のフレームが前景信号フレームすなわち音声信号フレームであることを示した場合、エンコーダは現在のフレームに音声符号化を実行する。この実施形態では、エンコーダが符号化音声フレームを符号化することは従来技術の分野に関連するので、この実施形態では詳細を繰り返して説明しない。現在のフレームが雑音フレームである場合、ＶＡＤは、エンコーダがＤＴＸ動作状態に入ることを示す。この実施形態では、雑音フレームは背景雑音フレーム又は無音フレームのいずれかを指す。

この実施形態では、ＤＴＸ動作状態において、ＤＴＸコントローラは、ＳＩＤ送出ポリシーに従って、現在のフレームの低帯域信号のＳＩＤを符号化した上で送出するか否かを決定する。この実施形態では、低帯域信号のＳＩＤを送出するためのポリシーは以下の通りである。（１）符号化音声フレーム後の第１の雑音フレームにおいてＳＩＤを送出し、ＳＩＤ送出フラグｆｌａｇ_ＳＩＤを１にセットする。（２）雑音期間において、各ＳＩＤフレーム後のＮ番目のフレームにおいてＳＩＤフレームを送出し、フレーム内のｆｌａｇ_ＳＩＤを１にセットする。ここでＮは１よりも大きい整数であり、外部からエンコーダに入力される。（３）雑音期間において、他のフレームではＳＩＤを送出せず、ｆｌａｇ_ＳＩＤを０にセットする。この実施形態では、低帯域信号のＳＩＤを送出するためのポリシーは従来技術のものと同様であり、本発明では詳細な説明は行わない。

３０２．現在の雑音フレームの高帯域信号が予め設定された符号化及び送信に関する条件を満たすか否かを判定し、満たす場合はステップ３０４を実行し、満たさない場合はステップ３０３を実行する。

この実施形態において、現在の雑音フレームの高帯域信号が予め設定された符号化及び送信に関する条件を満たすか否かの判定動作は、雑音高帯域信号が予め設定されたスペクトル構造を有するか否かを判定し、これを有すると共に第２のＳＩＤを送出するためのポリシーの送出条件を満たす場合は、第２のＳＩＤを符号化するためのポリシーを用いることによって雑音高帯域信号のＳＩＤを符号化し、ＳＩＤを送出し、これを有しない場合は、雑音高帯域信号の符号化及び送信を行う必要がないと判定する動作を含む。雑音高帯域信号が予め設定されたスペクトル構造を有するか否かを判定する動作が、雑音高帯域信号のスペクトルを取得し、スペクトルを少なくとも２つのサブバンドに分割し、サブバンド内のいずれの第１のサブバンドの平均エネルギであってもサブバンド内の第２のサブバンドの平均エネルギより低くない場合には雑音高帯域信号が予め設定されたスペクトル構造を有しないことを確定し、その他の場合には雑音高帯域信号が予め設定されたスペクトル構造を有することを確定する動作を含み、第２のサブバンドが位置する周波数帯域が第１のサブバンドが位置する周波数帯域よりも高いことを特徴とする。

この実施形態では、ＤＴＸ動作状態において、エンコーダは現在のフレームの高帯域信号ｓ_１にスペクトル分析を実行して、ｓ_１が明らかなスペクトル構造すなわち予め設定されたスペクトル構造を有するか否かを判定する。この実施形態における具体的な方法は以下の通りである。すなわち、ｓ_１に対して１２．８ｋＨｚへのダウン・サンプリングを実行し、ダウン・サンプリングした信号に２５６ポイントのＦＥＴを実行してスペクトルＣ（ｉ）を取得する。ここでｉ＝０、．．．１２７である。Ｃ（ｉ）を等しい幅の４個のサブバンドに分割し、各サブバンドのエネルギＥ（ｉ）を計算する。各サブバンドは上述のいずれかの第１のサブバンドである。

であり、ここで、ｉ＝０、．．．３であり、ｌ（ｉ）及びｈ（ｉ）はそれぞれｉ番目のサブバンドの上方の境界及び下方の境界を表し、ｌ（ｉ）＝｛０、３２、６４、９６｝であり、ｈ（ｉ）＝｛３１、６３、９５、１２７｝である。以下の条件を満たすか否かを調べる。

ここで、Ｅ（ｉ）は上述の第２のサブバンドである。前述の式（１）を満たした場合、すなわちサブバンド内のいずれの第１のサブバンドのエネルギがサブバンド内の第２のサブバンドのエネルギよりも低くない場合、高帯域信号は明らかなスペクトル構造を有しないと見なされる。他の場合、高帯域信号は明らかなスペクトル構造を有する。高帯域信号が明らかなスペクトル構造を有する場合、ＤＴＸポリシーは高帯域パラメータを送出している。この実施形態では、高帯域パラメータ送出フラグｆｌａｇ_ｈｂが１でない場合、次にｆｌａｇ_ＳＩＤ＝１となったときにｆｌａｇ_ｈｂ＝１をセットする。他の場合、ｆｌａｇ_ｈｂ＝０とする。

この実施形態において、ＳＩＤ送出条件を満たした場合は、現在の雑音フレームの高帯域信号のスペクトル構造、雑音高帯域信号が予め設定されたスペクトル構造を有するか否かの判定、及びＳＩＤ送出条件を満たす雑音低帯域信号が第１の判定条件として用いられるか否かの判定を用いることによって、現在の雑音フレームの高帯域信号を符号化及び送信する必要があるか否かを判定することができる。任意選択的な構成として、この実施形態では、現在の雑音フレームの高帯域信号が予め設定された符号化及び送信条件を満たすか否かの判定動作は、第１の比率及び第２の比率に従って偏差程度値を発生する動作であって、当該第１の比率を、雑音フレームの雑音低帯域信号のエネルギに対する雑音フレームの雑音高帯域信号のエネルギの比率とし、当該第２の比率を、雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号のエネルギの比率とする、動作と、偏差程度値が予め設定された閾値に達したか否かを判定し、これに達した場合は第２のＳＩＤを符号化するためのポリシーを用いることによって雑音高帯域信号のＳＩＤを符号化し、ＳＩＤを送出し、達しない場合は雑音高帯域信号の符号化及び送信を行う必要がないと判定する動作と、を含む。任意選択的な構成として、当該第１の比率を、雑音フレームの雑音低帯域信号のエネルギに対する雑音フレームの雑音高帯域信号のエネルギの比率とすることが、当該第１の比率を、雑音フレームの雑音低帯域信号の瞬時エネルギに対する雑音フレームの雑音高帯域信号の瞬時エネルギの比率とすることを含み、これに応じて、当該第２の比率を、雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号のエネルギの比率とすることが、当該第２の比率を、雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した時点での雑音低帯域信号の瞬時エネルギに対する雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号の瞬時エネルギの比率とすることを含む。あるいは、第１の比率を、雑音フレームの雑音低帯域信号のエネルギに対する雑音フレームの雑音高帯域信号のエネルギの比率とすることが、当該第１の比率を、雑音フレーム及びこの雑音フレームの前の雑音フレームの雑音低帯域信号の加重平均エネルギに対する雑音フレーム及びこの雑音フレームの前の雑音フレームの雑音高帯域信号の加重平均エネルギの比率とすることを含み、これに応じて、当該第２の比率を、雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号のエネルギの比率とすることが、当該第２の比率を、雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した時点での雑音フレーム及び雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点でのこの雑音フレームの前の雑音フレームの低帯域信号の加重平均エネルギに対する雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点での雑音フレーム及び雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点でのこの雑音フレームの前の雑音フレームの高帯域信号の加重平均エネルギの比率とすることを含む。この実施形態では、好ましくは、当該第１の比率及び当該第２の比率に従って偏差程度値を発生することが、当該第１の比率の対数値及び当該第２の比率の対数値を別個に計算することと、当該第１の比率の対数値と当該第２の比率の対数値との間の差の絶対値を計算して偏差程度値を取得することと、を含む。

具体的には、この実施形態において、偏差程度値が予め設定された閾値に達したか否かの判定は以下のように実施することができる。

ＤＴＸ動作状態において、エンコーダは現在処理中のフレームの高帯域信号ｓ_１及び低帯域信号ｓ_０の対数エネルギｅ_１及びｅ_０を別個に計算する。

符号化端においてｅ_１及びｅ_０の長期移動平均ｅ_１ａ及びｅ_０ａを更新する。

ｓｉｇｎ［．］は符号関数を表し、ＭＩＮ［．］は最小関数を表し、｜．｜は絶対値関数を表し、形式ｘ^（−１）は以前のフレームｘの値を表し、α＝０．１は更新速度が高いか又は低いかを決定する忘却係数である。以前のフレームは、現在処理中の雑音フレームの前に最後に送出されたＳＩＤであり、雑音高帯域パラメータを含む。この実施形態では、ｅ_１ａ及びｅ_０ａの更新の大きさが限定される。現在処理中の雑音フレームのｅ_ｘと以前のフレームのｅ_ｘａとの間のエネルギ変動が３ｄＢよりも大きい場合、現在処理中のフレームのｅ_ｘａを３ｄＢで更新する。エンコーダが最初にＤＴＸ動作状態に入った場合、現在処理中のフレームのｅ_ｘとしてｅ_ｘａを初期化する。エンコーダは、現在の雑音フレームの低帯域信号のエネルギに対する高帯域信号のエネルギの比率（すなわち第１の比率）と、高帯域パラメータを含むＳＩＤが最後に送出された時点での低帯域のエネルギに対する高帯域のエネルギの比率（第２の比率）との間の偏差が、ある程度に達するか否かを調べる、すなわち、以下の条件を満たすか否かを調べる。

ここで、

はそれぞれ、高帯域パラメータを含むＳＩＤフレームが最後に送出された時点での高帯域対数エネルギ及び低帯域対数エネルギを表す。前述の式（４）を満たす場合、雑音高帯域信号は符号化及び送信を行う必要がある。高帯域パラメータ送出フラグｆｌａｇ_ｈｂ＝０である場合、フラグｆｌａｇ_ｈｂ＝１をセットする。

この実施形態では、長期移動平均は重み付け平均計算の１つのタイプであり、この実施形態では特に限定されない。

この実施形態において、偏差程度値が予め設定された閾値に達したか否かの判定を第２の判定条件として用いることができる。特定の実施プロセスでは、雑音高帯域信号を符号化及び送信する必要があると判定するために、第１の判定条件又は第２の判定条件のどちらかのみを判定すれば良く、これはこの実施形態では特に限定されない。

この実施形態では、当該第２の判定条件は任意選択である。このステップを実行する目的は、復号化端が、雑音低帯域のエネルギ及び高帯域パラメータを含むＳＩＤが最後に送出された時点での雑音低帯域のエネルギに対する雑音高帯域のエネルギの比率に応じて、高帯域雑音のエネルギをローカルに推定するのを支援することである。具体的には、符号化端で偏差程度値が計算されない場合は、復号化端において、現在処理中の雑音フレームの前のある時間期間内の音声フレームから最小の高帯域信号エネルギを有する音声フレームを取得することができ、現在処理中の雑音フレームの前のその時間期間内の音声フレーム中で最小の高帯域信号エネルギを有する音声フレームの高帯域信号のエネルギに応じて、現在の高帯域雑音のエネルギをローカルに推定する。例えば、現在の雑音フレームの前のその時間期間内の音声フレーム中で最小の高帯域信号エネルギを有する音声フレームの高帯域信号のエネルギを、現在の高帯域雑音のエネルギとして選択する。あるいは、ＳＩＤの前のある時間期間内の音声フレームから、予め設定された閾値よりも小さい高帯域信号エネルギを有するＮ個の音声フレームの高帯域信号を選択し、Ｎ個の音声フレームの高帯域信号の加重平均エネルギに従って、ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギを取得する。具体的には、この実施形態において制約は設定されない。

３０３．第１の非連続送信機構を用いることによって雑音低帯域信号を送信する。

この実施形態では、好ましくは、第１の非連続送信機構を用いることによって雑音低帯域信号を送信することは以下を含む。すなわち、ＤＴＸ動作状態において、エンコーダは現在の雑音フレームの低帯域信号ｓ_０に１６次線形予測分析を実行し、１６の線形予測係数ｌｐｃ（ｉ）を取得する。ここでｉ＝０、１、．．．、１５である。ＬＰＣ係数をＩＳＰ係数に変換して１６のＩＳＰ係数ｉｓｐ（ｉ）を取得する。ここでｉ＝０、１、．．．、１５である。これらのＩＳＰ係数をバッファリングする。現在のフレームでＳＩＤが符号化されている、すなわちｆｌａｇ_ＳＩＤ＝１である場合、現在のフレームを含むＮ個の履歴フレームのバッファリングされたＩＳＰ係数において中央値のＩＳＰ係数を検索する。方法は以下の通りである。まず、各フレームのＩＳＰ係数から別のフレームのＩＳＰ係数への距離δを計算する。

次いで、符号化対象のＩＳＰ係数ｉｓｐ_ＳＩＤ（ｉ）として、最小のδを有するフレームのＩＳＰ係数を選択する。ここでｉ＝０、．．．、１５である。ｉｓｐ_ＳＩＤ（ｉ）をＩＳＦ係数ｉｓｆ_ＳＩＤ（ｉ）に変換し、ｉｓｆ_ＳＩＤ（ｉ）を量子化し、量子化インデクス群ｉｄｘ_ＩＳＦを取得してＳＩＤ内にカプセル化する。ｉｄｘ_ＩＳＦをローカルに復号化処理する。復号化処理したＩＳＦ係数ｉｓｆ’（ｉ）を取得する。ここでｉ＝０、．．．、１５である。ｉｓｆ’（ｉ）をＩＳＰ係数ｉｓｐ’（ｉ）に変換する。ここでｉ＝０、．．．、１５である。ｉｓｐ’（ｉ）をバッファリングする。各雑音フレームについて、バッファリングしたｉｓｐ’（ｉ）を用いることによって符号化端の復号ＩＳＰ係数の長期移動平均を更新する。

ここで、好ましくは、α＝０．９であり、ｉｓｐ_ａ（ｉ）を第１のＳＩＤのｉｓｐ’（ｉ）として初期化する。ｉｓｐ_ａ（ｉ）をＬＰＣ係数ｌｐｃ_ａ（ｉ）に変換し、分析フィルタＡ（Ｚ）を取得する。各雑音フレームの低帯域信号ｓ_０をＡ（Ｚ）でフィルタリングして残留信号ｒ（ｉ）を取得する。ここでｉ＝０、１、．．．３１９である。対数残留エネルギｅ_ｒを計算する。

この実施形態では、ｅ_ｒをバッファリングする。現在の雑音フレームのｆｌａｇ_ＳＩＤが１である場合、現在の雑音フレームを含むＭ個の履歴フレームのバッファリングしたｅ_ｒに応じて、重み付け平均対数エネルギｅ_ＳＩＤを計算する。

であり、ここでｗ_１（ｋ）はＭ次元の正の係数群であり、その和は１より小さい。ｅ_ＳＩＤを量子化し、量子化インデクスｉｄｘ_ｅを取得する。

この実施形態では、ＤＴＸ動作状態において、ｆｌａｇ_ＳＩＤ＝１である場合、ｆｌａｇ_ｈｂ＝０ならば、ＳＩＤフレームにおいて低帯域パラメータのみを符号化して送出する。この場合、ＳＩＤフレームはｉｄｘ_ＩＳＦ及びｉｄｘ_ｅから成り、便宜上これを小さいＳＩＤフレームと称する。

この実施形態では、雑音低帯域信号を符号化及び送信するためのポリシーは、従来技術において雑音広帯域信号を符号化及び送信するためのポリシーと同様である。この実施形態では簡潔な紹介のみを行う。具体的な実施プロセスはこの実施形態では詳細に説明しない。この実施形態では、現在処理中の雑音フレームの雑音高帯域信号を符号化する必要はなく、雑音低帯域信号のみを符号化する。従って、符号化端において計算負荷が低減し、送信ビットが節約される。

３０４．第１の非連続送信機構を用いることによって雑音低帯域信号を送信し、第２の非連続送信機構を用いることによって雑音高帯域信号を送信する。

この実施形態では、ｆｌａｇ_ｈｂ＝１である場合、低帯域パラメータを符号化する必要があることに加えて、ＳＩＤにおいて高帯域パラメータも符号化する必要がある。低帯域雑音の低帯域パラメータの符号化は、ステップ３０３における符号化モードと同一であり、この実施形態では詳細は繰り返し説明しない。この実施形態では、好ましくは、高帯域パラメータを符号化するための方法は以下の通りである。すなわち、エンコーダがＤＴＸ動作状態にあってｆｌａｇ_ＳＩＤ＝１である場合にのみ、エンコーダは現在のフレームの高帯域信号ｓ_１に１０次の線形予測分析を実行し、１０の線形予測係数ｌｐｃ（ｉ）を取得する。ここでｉ＝０、１、．．．、９である。ｌｐｃ（ｉ）を重み付けする。

更に、重み付けＬＰＣ係数ｌｐｃ_Ｗ（ｉ）を取得する。ここで、ｗ_２（ｉ）は１以下の９次元重み付け係数群を表す。ｌｐｃ_Ｗ（ｉ）をＬＳＰ係数に変換して１０のＬＳＰ係数ｌｓｐ_Ｗ（ｉ）を取得する。ここでｉ＝０、１、．．．、９である。ｌｓｐ_Ｗ（ｉ）に従って符号化端のｌｓｐ_Ｗ（ｉ）の長期移動平均を更新する。

ここで、好ましくは、α＝０．９であり、ｌｓｐ_ａ（ｉ）は、ｆｌａｇ_ｈｂが０から１に変化するたびに現在のフレームのｌｓｐ_Ｗ（ｉ）として初期化される。ＳＩＤが高帯域パラメータを含む必要がある場合、ｌｓｐ_ａ（ｉ）を量子化し、量子化インデクス群ｉｄｘ_ＬＳＰを取得する。符号化端における高帯域信号の対数エネルギの長期移動平均ｅ_１ａを量子化し、量子化インデクスｉｄｘ_Ｆを取得する。この場合、ＳＩＤは、ｉｄｘ_ＩＳＦ、ｉｄｘ_ｅ、ｉｄｘ_ＬＳＰ、及びｉｄｘ_Ｆから成る。この実施形態では、ｉｄｘ_ＩＳＦ、ｉｄｘ_ｅ、ｉｄｘ_ＬＳＰ、及びｉｄｘ_Ｆから成るＳＩＤを大きいＳＩＤと称する。

任意選択的な構成として、ｌｓｐ_ａ（ｉ）はＤＴＸ動作状態において連続的に更新することも可能である。すなわち、ｆｌａｇ_ｈｂの値が１であるか０であるかに関わらず、ｌｓｐ_ａ（ｉ）を更新する。具体的には、ｆｌａｇ_ｈｂ＝０である場合にｌｓｐ_ａ（ｉ）を更新するための方法は、ｆｌａｇ_ｈｂ＝１である場合の前述の方法と同一であり、この実施形態では詳細は繰り返し説明しない。

この実施形態では、雑音高帯域信号を符号化するためのポリシーの原理は、雑音低帯域信号を符号化するためのポリシーのものと同様である。この実施形態では簡潔な紹介のみを行う。具体的な実施プロセスはこの実施形態では詳細には説明しない。

この実施形態では、雑音高帯域信号を符号化及び送信するための条件が満される場合には、雑音低帯域信号の符号化及び送信と同時に雑音高帯域信号の符号化及び送信を常に実行する。しかしながら任意選択的な構成として、雑音高帯域信号の符号化及び送信は、雑音低帯域信号の符号化及び送信と同時に行わない場合がある。すなわち、ＳＩＤを送出した場合、３つの考えられるケースがあり得る。すなわち（１）現在処理中の雑音フレームの低帯域信号のみを符号化及び送信する。（２）現在処理中の雑音フレームの高帯域信号のみを符号化及び送信する。（３）現在処理中の雑音フレームの低帯域信号及び高帯域信号を同時に符号化及び送信する。この場合、第２の非連続送信機構の第２のＳＩＤを送出するためのポリシーにおける送出条件は、第１の非連続送信機構が第１のＳＩＤ送出条件を満たすことを更に含む。ＳＩＤを送出するこれら３つのケースは、この実施形態では特に限定されない。

この実施形態では、ステップ３０２及び３０４は具体的には、第１の非連続送信機構を用いることによって雑音低帯域信号を符号化及び送信し、第２の非連続送信機構を用いることによって雑音高帯域信号を符号化及び送信するステップであり、第１の非連続送信機構の第１の無音挿入記述子フレームＳＩＤを送出するためのポリシーが、第２の非連続送信機構の第２のＳＩＤを送出するためのポリシーとは異なり、又は、第１の非連続送信機構の第１のＳＩＤを符号化するためのポリシーが、第２の非連続送信機構の第２のＳＩＤを符号化するためのポリシーとは異なる。

本発明が提供する方法の実施形態は、以下の有利な効果を与える。すなわち、オーディオ信号の現在の雑音フレームを取得し、現在の雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解し、第１の非連続送信機構を用いることによって雑音低帯域信号を符号化し及び送信し、第２の非連続送信機構を用いることによって雑音高帯域信号を符号化及び送信する。このように、高帯域信号及び低帯域信号のそれぞれについて互いに異なる処理方法を用い、コーデックの本質的な品質を低下させないという前提のもとに計算の複雑さを軽減して符号化ビットを節約することができ、当該節約したビットは、送信帯域幅を縮小するか又は全体的な符号化品質を向上させる目的を達成するために役立てることができ、これによって超広帯域符号化及び超広帯域送信の問題を解決する。

実施形態４
この実施形態は、オーディオ・データを処理するための方法を提供する。符号化端（エンコーダ）での雑音信号の処理に比較すると、復号化端（デコーダ）は、受信したビット・ストリームに応じて、現在のフレームが符号化音声フレーム、又はＳＩＤ、又はＮＯ＿ＤＡＴＡフレームのどれであるかを判定することができる。ＮＯ＿ＤＡＴＡフレームは、符号化端が雑音期間においてＳＩＤの符号化及び送出を行わないことを示すフレームである。現在のフレームがＳＩＤである場合、デコーダは更に、ＳＩＤのビット数に応じて、ＳＩＤが低帯域及び／又は高帯域パラメータを含むことを判定することができる。任意選択的な構成としてデコーダは、ＳＩＤに挿入された特定の識別子に応じて、ＳＩＤが低帯域及び／又は高帯域パラメータを含むことを判定することができる。このためには、ＳＩＤを符号化した場合に追加の識別子ビットを加える必要がある。例えばＳＩＤに第１の識別子が挿入された場合、これはＳＩＤが高帯域パラメータのみを含むことを識別する。第２の識別子が挿入された場合、これはＳＩＤが低帯域パラメータのみを含むことを識別する。第３の識別子が挿入された場合、これはＳＩＤが高帯域パラメータ及び低帯域パラメータを含むことを識別する。現在のフレームが符号化音声フレームである場合、デコーダは音声フレームを復号化処理する。具体的な処理プロセスは従来技術のものと同様であり、この実施形態では詳細には説明しない。現在のフレームがＳＩＤ又はＮＯ＿ＤＡＴＡフレームである場合、デコーダは、ＣＮＧの特定の動作状態に従って、ＣＮフレームを再構築するための対応する方法を選択する。この実施形態では、ＣＮＧは２つの動作状態を有する。すなわち、小さいＳＩＤフレームに対応する半復号化ＣＮＧ状態すなわち第１のＣＮＧ状態と、大きいＳＩＤフレームに対応する全復号ＣＮＧ状態すなわち第２のＣＮＧ状態と、である。全復号化ＣＮＧ状態において、デコーダは、大きいＳＩＤフレームを復号化処理することによって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従ってＣＮフレームを再構築する。半復号化ＣＮＧ状態において、デコーダは、小さいＳＩＤフレームを復号化処理することによって取得した雑音低帯域パラメータ及びローカルに推定した雑音高帯域パラメータに従ってＣＮフレームを再構築する。復号化端における現在のフレームが大きいＳＩＤフレームである場合、ＣＮＧ動作状態フラグｆｌａｇ_ＣＮＧが０である（半復号ＣＮＧ状態を示す）ならば、ＣＮＧ動作状態フラグｆｌａｇ_ＣＮＧを１にセットする（全復号化ＣＮＧ状態を示す）。他の場合、元の状態を不変のまま維持する。同様に、復号端における現在のフレームが小さいＳＩＤフレームである場合、ＣＮＧ作業状態フラグｆｌａｇ_ＣＮＧが１であるならば、ＣＮＧ動作状態フラグｆｌａｇ_ＣＮＧを０にセットする。その他の場合、元の状態を不変のまま維持する。図４を参照すると、特にこの実施形態は、復号化端（デコーダ）においてオーディオ・データを処理するための方法を提供する。この方法は以下を含む。

４０１．デコーダはＳＩＤを取得し、このＳＩＤが高帯域パラメータ及び低帯域パラメータを含む場合、ＳＩＤを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、復号によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第３のＣＮフレームを取得する。

この実施形態では、符号化端（エンコーダ）が送信した符号化された音声フレームを受信した後、復号化端（デコーダ）はまず音声フレームのタイプを判定するので、音声フレームの異なるタイプに応じて異なる復号化方法が用いられる。具体的には、ＳＩＤのビット数が予め設定された第１の閾値よりも小さい場合には、ＳＩＤが高帯域パラメータを含むことを確定する。ＳＩＤのビット数が予め設定された第１の閾値よりも大きく予め設定された第２の閾値よりも小さい場合には、ＳＩＤが低帯域パラメータを含むことを確定する。ＳＩＤのビット数が予め設定された第２の閾値よりも大きく予め設定された第３の閾値よりも小さい場合には、ＳＩＤが高帯域パラメータ及び低帯域パラメータを含むことを確定する。あるいは、ＳＩＤが第１の識別子を含む場合には、ＳＩＤが高帯域パラメータを含むことを確定し、ＳＩＤが第２の識別子を含む場合には、ＳＩＤが低帯域パラメータを含むことを確定し、又は、ＳＩＤが第３の識別子を含む場合には、ＳＩＤが低帯域パラメータ及び高帯域パラメータを含むことを確定する。

この実施形態では、ＳＩＤが高帯域パラメータ及び低帯域パラメータを含む場合、ＳＩＤを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、復号によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第３のＣＮフレームを取得する。具体的には、デコーダはＳＩＤを復号化処理して、復号低帯域励起対数エネルギｅ_Ｄ、低帯域ＩＳＦ係数ｉｓｆ_ｄ（ｉ）、高帯域対数エネルギＥ_Ｄ、及び高帯域ＬＳＰ係数ｌｓｐ_ｄ（ｉ）を取得する。ｉｓｆ_ｄ（ｉ）はＩＳＰ係数ｉｓｐ_ｄ（ｉ）に変換され、ｅ_Ｄ及びＥ_Ｄはエネルギｅ_ｄ及びＥ_ｄに変換される。ここで、

であり、

である。
次いでｉｓｐ_ｄ（ｉ）、ｅ_ｄ、ｌｓｐ_ｄ（ｉ）、及びＥ_ｄをバッファリングする。

この実施形態では、デコーダがＣＮＧ動作状態にあってｆｌａｇ_ＣＮＧ＝１である場合は、現在のフレームがＳＩＤであるかＮＯ＿ＤＡＴＡフレームであるかには関わらず、バッファリングしたｉｓｐ_ｄ（ｉ）、ｅ_ｄ、ｌｓｐ_ｄ（ｉ）、及びＥ_ｄを用いて、復号端においてバッファリングしたｉｓｐ_ｄ（ｉ）、ｅ_ｄ、ｌｓｐ_ｄ（ｉ）、及びＥ_ｄの長期移動平均を更新する。

ここで、α＝０．９及びβ＝０．７である。Ｅ_ＣＮは高帯域エネルギ・バッファＥ_１ｏｌｄにバッファリングする。ｅ_ＣＮに基づいてランダムな小さいエネルギを加え、低帯域雑音信号を再構築するために用いられる最終励起エネルギｅ’_ＣＮを取得する。
ｅ’_ＣＮ＝（１＋０．００００１１・ＲＮＤ・ｅ_ＣＮ）・ｅ_ＣＮである。ここで、ＲＮＤは〔−３２７６７、３２７６７〕の範囲内の乱数を表す。この実施形態では、３２０ポイント白色雑音シーケンスｅｘｃ_０（ｉ）を生成する。ここでｉ＝０、１、．．．３１９である。ｅ’_ＣＮを用いてｅｘｃ_０（ｉ）に利得調整を行ってｅｘｃ’_０（ｉ）を取得する。すなわち、ｅｘｃ_０（ｉ）に利得係数Ｇ_０を乗算するので、ｅｘｃ’_０（ｉ）のエネルギはｅ’_ＣＮに等しい。ここで

である。ｉｓｐ_ＣＮ（ｉ）をＬＰＣ係数に変換して合成フィルタ１／Ａ_０（Ｚ）を取得し、利得調整した励起ｅｘｃ’_０（ｉ）を用いてフィルタ１／Ａ（Ｚ）を励起して低帯域ＣＮ信号ｓ’_０を取得する。これは復号端で再構築され１６ｋＨｚでサンプリングされる。ｓ’_０のエネルギを計算して低帯域エネルギ・バッファＥ_０ｏｌｄにバッファリングする。

この実施形態では、復号端における雑音高帯域信号の処理は雑音低帯域信号の処理と同様である。別の３２０ポイント白色雑音シーケンスｅｘｃ_１（ｉ）を生成する。ここでｉ＝０、１、．．．３１９である。ｌｓｐ_ＣＮ（ｉ）をＬＰＣ係数に変換して合成フィルタ１／Ａ_１（Ｚ）を取得し、ｅｘｃ_１（ｉ）を用いてフィルタ１／Ａ_１（Ｚ）を励起して利得調整した高帯域ＣＮ信号ｓ^〜 _１（ｉ）を取得する。ｓ^〜 _１（ｉ）に利得係数Ｇ_１及びＧ_２を乗算し、このときＧ_２＝０．８であり、復号化端で再構築され１６ｋＨｚでサンプリングされる高帯域ＣＮ信号ｓ’_１を取得する。ここで、

である。この実施形態では、Ｇ_２の目的は、再構築した雑音信号に対してある程度のエネルギ抑制を実行することである。

この実施形態では、復号化端（デコーダ）において、ｓ’_０及びｓ’_１をＱＭＦ合成フィルタに通し、最後に、デコーダにより再構築され３２ｋＨｚでサンプリングされる第１のＣＮフレームを取得する。

４０２．ＳＩＤが低帯域パラメータを含む場合、ＳＩＤを復号化処理して雑音低帯域パラメータを取得し、雑音高帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音低帯域パラメータ及びローカルに発生した雑音高帯域パラメータに従って第１のＣＮフレームを取得する。

この実施形態では、デコーダがＣＮＧ動作状態にあってｆｌａｇ_ＣＮＧ＝０である場合は、現在のフレームがＳＩＤであるかＮＯ＿ＤＡＴＡフレームであるかには関わらず、復号化端において再構築され１６ｋＨｚでサンプリングされる低帯域ＣＮ信号ｓ’_０を、ｆｌａｇ_ＣＮＧ＝１である場合に用いたものと同一の方法すなわちステップ４０２の方法に従って取得する。これについては本実施形態ではこれ以上は説明しない。

この実施形態では、第１のＣＮフレームの高帯域信号は、白色雑音を用いて合成フィルタを励起する方法を用いることによって取得する。ただし、第１のＣＮフレームの高帯域信号のエネルギ及び合成フィルタ係数は、ローカルに推定を実行することによって取得する。この実施形態では、雑音高帯域パラメータをローカルに発生することは、ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギ及び雑音高帯域信号の合成フィルタ係数を別個に取得することと、ＳＩＤに対応する時点での雑音高帯域信号の取得した加重平均エネルギ及び雑音高帯域信号の取得した合成フィルタ係数に従って雑音高帯域信号を取得することと、を含む。

この実施形態では、好ましくは、ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギを取得する処理動作が、復号化処理によって取得した雑音低帯域パラメータに従って第１のＣＮフレームの低帯域信号のエネルギを取得する動作と、高帯域パラメータを含むＳＩＤを先のＳＩＤの前に受信した時点での雑音低帯域信号のエネルギに対する雑音高帯域信号のエネルギの比率を計算して第１の比率を取得する動作と、第１のＣＮフレームの低帯域信号のエネルギ及び第１の比率に従って、ＳＩＤに対応する時点での雑音高帯域信号のエネルギを取得する動作と、ＳＩＤに対応する時点での雑音高帯域信号のエネルギ及びローカルにバッファリングされたＣＮフレームの高帯域信号のエネルギに対して加重平均を実行して、ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギを取得する動作であって、ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギを第１のＣＮフレームの高帯域信号エネルギとする、動作と、を含む。任意選択的な構成として、高帯域パラメータを含むＳＩＤを先のＳＩＤの前に受信した時点での雑音低帯域信号のエネルギに対する雑音高帯域信号のエネルギの比率を計算して第１の比率を取得することが、高帯域パラメータを含むＳＩＤを先のＳＩＤの前に受信した時点での雑音低帯域信号の瞬時エネルギに対する雑音高帯域信号の瞬時エネルギの比率を計算して第１の比率を取得すること、又は、高帯域パラメータを含むＳＩＤを先のＳＩＤの前に受信した時点での雑音低帯域信号の加重平均エネルギに対する雑音高帯域信号の加重平均エネルギの比率を計算して第１の比率を取得すること、を含む。瞬時エネルギは復号によって取得されるエネルギである。ＳＩＤに対応する時点での雑音高帯域信号のエネルギが、ローカルにバッファリングされた以前のＣＮフレームの高帯域信号のエネルギよりも大きい場合は、ローカルにバッファリングされた以前のＣＮフレームの高帯域信号のエネルギを第１の更新頻度で更新し、その他の場合は、ローカルにバッファリングされた以前のＣＮフレームの高帯域信号のエネルギを第２の更新頻度で更新し、第１の更新頻度が第２の更新頻度よりも大きい。

具体的には、この実施形態では、ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギを取得することは、以下の方法を用いて実施することができる。
復号化処理によって取得した雑音低帯域パラメータに従って第１のＣＮフレームｓ’_０の低帯域信号のエネルギＥ_０を取得し、全復号化ＣＮＧ状態における以前のＣＮフレームの高帯域信号のエネルギＥ_１ｏｌｄ及び低帯域信号のＥ_０ｏｌｄ及びＥ_０に従って、ＳＩＤに対応する時点での雑音高帯域信号のエネルギＥ^〜 _１を推定する。ここで

である。更に、Ｅ^〜 _１を用いることによって復号端における高帯域ＣＮ信号エネルギの長期移動平均Ｅ_ＣＮを更新する。

である。ここで係数λは変数であり、Ｅ^〜 _１＞Ｅ_ＣＮである場合はλ＝０．９８であり、他の場合はλ＝０．９である。ここでλ＝０．９８は第１のレートであり、λ＝０．９は第２のレートである。

この実施形態では、符号化端で偏差程度値が計算されない場合は、任意選択的な構成として、ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギを取得する処理動作が、ＳＩＤの前の予め設定された時間期間内の音声フレームから、最小の高帯域信号エネルギを有する音声フレームの高帯域信号を選択する動作と、音声フレーム中で最小の高帯域信号エネルギを有する音声フレームの高帯域信号のエネルギに従って、ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギを取得する動作と、を含み、又は、ＳＩＤの前の予め設定された時間期間内の音声フレームから、予め設定された閾値よりも小さい高帯域信号エネルギを有するＮ個の音声フレームの高帯域信号を選択する動作と、Ｎ個の音声フレームの高帯域信号の加重平均エネルギに従って、ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギを取得する動作であって、ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギを第１のＣＮフレームの高帯域信号エネルギとする、動作と、を含む。

この実施形態では、好ましくは、ＳＩＤに対応する時点での雑音高帯域信号の合成フィルタ係数を取得する処理動作が、イミタンス・スペクトル周波数ＩＳＦ係数又はイミタンス・スペクトル対ＩＳＰ係数又は線スペクトル周波数ＬＳＦ係数又は線スペクトル対ＬＳＰ係数のいずれかを含むＭ個の係数を、高帯域信号に対応する周波数範囲にわたって分散させる動作と、当該Ｍ個の係数にランダム化処理を実行する動作であって、当該ランダム化処理の特性が、Ｍ個の係数中に含まれる各係数を当該各係数に対応する目標値に徐々に漸近させるものであり、当該目標値が当該係数の値に近接した予め設定された範囲内の値であり、当該Ｍ個の係数中に含まれる各係数の目標値がＮ個のフレームの各々毎に変化し、Ｎは変数とすることができる、動作と、当該ランダム化処理によって取得したフィルタ係数に従って、ＳＩＤに対応する時点での雑音高帯域信号の合成フィルタ係数を取得する動作と、を含む。

具体的には、この実施形態では、ＳＩＤに対応する時点での雑音高帯域信号の合成フィルタ係数を取得することは、以下の方法を用いて実施することができる。

９個のＩＳＦ係数ｉｓｆ_ｅｘｔ（ｉ）を、低帯域ＩＳＦ係数ｉｓｆ_ｄ（１４）に対応する１６ｋＨｚまでの周波数帯域に均等に分散させる。ここでｉ＝０、１、．．．８である。

ｉｓｆ_ｅｘｔ（ｉ）を０〜８ｋＨｚの周波数帯域に変換し、ｉｓｆ’_ｅｘｔ（ｉ）を取得する。

ｉｓｆ’_ｅｘｔ（ｉ）を、９次元のランダム化係数群Ｒ（ｉ）を用いることによってランダム化する。ここでｉ＝０、１、．．．８である。ランダム化ＩＳＦ係数ｉｓｆ_１（ｉ）を取得する。

ここで、Ｒ（ｉ）は以下の式（１４）に従って取得する。

ここで、α＝０．８であり、Ｒ_ｔ（ｉ）は目標ランダム化係数と称し、以下の式に従って取得する。

前述の式（１５）において、ＲＮＤは９次元乱数シーケンス群を表し、各次元における乱数は相互に異なり、全てが〔−１、１〕の範囲内に収まる。ｃｎｔはフレーム・カウンタである。ＣＮＧ動作状態において、ｆｌａｇ_ＣＮＧ＝０である場合、各ＳＩＤフレーム又はＮＯ＿ＤＡＴＡフレームについて、カウンタに１を加える。ｍｏｄ（ｃｎｔ．１０）は１０を法とするｃｎｔを表す。別の実施形態では、Ｒ_ｔ（ｉ）を計算する場合、例えばｍｏｄ（ｃｎｔ．１０）の１０も変数であることがある。

ここで、ＲＮＤは〔−１、１〕の範囲内の乱数を表し、この実施形態では特に限定されない。

この実施形態では、低帯域ＩＳＦ係数ｉｓｆ_ｄ（１５）をｉｓｆ_１（９）として用い、ランダム化ＩＳＦ係数ｉｓｆ_１（ｉ）によって合成し（ここでｉ＝０、１、．．．８である）、１０次フィルタＩＳＦ係数を形成し、これをＬＰＣ係数ｌｐｃ_１（ｉ）に変換する。ここでｉ＝０、１、．．．９である。ｌｐｃ（ｉ）に、１０次重み付け係数群Ｗ（ｉ）＝｛０．６６９９、０．５８６２、０．５１２９、０．４４８８、０．３９２７、０．３４３６、０．３００７、０．２６３１、０．２３０２、０．２０１４｝を乗算する。重み付けしたＬＰＣ係数ｌｐｃ^〜 _１（ｉ）を取得する。すなわち、合成フィルタ１／Ａ^〜 _１（Ｚ）を推定する。

この実施形態では、３２０ポイント白色雑音シーケンスｅｘｃ_２（ｉ）を発生し（ここでｉ＝０、１、．．．３１９である）、ｅｘｃ_２（ｉ）を用いてフィルタ１／Ａ^〜 _１（Ｚ）を励起して、利得未調整の高帯域ＣＮ信号ｓ^〜 _１（ｉ）を取得する。ｓ^〜 _１に、利得係数Ｇ_３及びＧ_４を乗算し、このときＧ_４＝０．６であり、復号化端で再構築され１６ｋＨｚでサンプリングされる高帯域ＣＮ信号ｓ’_１を取得する。ここで

である。

現在のフレームがＳＩＤである場合、ｌｐｃ^〜 _１（ｉ）をＬＳＰ係数ｌｓｐ^〜 _１（ｉ）に変換し、ｌｓｐ^〜 _１（ｉ）を用いて、復号端でバッファリングされたＣＮフレームの高帯域信号のＬＳＰ係数の長期移動平均を更新する必要がある。

ここで、β＝０．７である。

この実施形態では、任意選択的な構成として、ＳＩＤに対応する時点での雑音高帯域信号の合成フィルタ係数を取得する処理動作が、ローカルにバッファリングされた雑音高帯域信号のＭ個のＩＳＦ係数又はＩＳＰ係数又はＬＳＦ係数又はＬＳＰ係数を取得する動作と、Ｍ個の係数にランダム化処理を実行する動作であって、当該ランダム化処理の特性が、当該Ｍ個の係数中に含まれる各係数を当該各係数に対応する目標値に徐々に漸近させるものであり、当該目標値が当該係数の値に近接した予め設定された範囲内の値であり、当該Ｍ個の係数中に含まれる各係数の目標値がＮ個のフレームの各々毎に変化する、動作と、当該ランダム化処理によって取得したフィルタ係数に従って、ＳＩＤに対応する時点での雑音高帯域信号の前記フィルタ係数を取得する動作と、を含む。具体的には、この実施形態において制約は設定されない。

この実施形態では、低帯域パラメータ及び高帯域パラメータを取得した後、ｓ’_０及びｓ’_１をＱＭＦ合成フィルタに通し、最後に、デコーダにより再構築され３２ｋＨｚでサンプリングされる第１のＣＮフレームを取得する。

更にこの実施形態では、任意選択的な構成として、復号化処理によって取得した雑音低帯域パラメータ及びローカルに発生した雑音高帯域パラメータに従って第１のＣＮフレームを取得する前に、ローカルに発生した高帯域パラメータを更に最適化して、より良い効果の快適雑音を得ることができる。具体的な最適化ステップは、ＳＩＤに隣接した履歴フレームが符号化音声フレームである場合には、符号化音声フレームから復号化処理された高帯域信号又は高帯域信号の一部の平均エネルギが、ローカルに発生した雑音高帯域信号又は雑音高帯域信号の一部の平均エネルギよりも小さいならば、ＳＩＤから開始して以降のＬ個のフレームの雑音高帯域信号を１よりも小さい平滑化係数で乗算して、ローカルに発生した雑音高帯域信号の新しい加重平均エネルギを取得する動作を含み、これに対応して、復号化処理によって取得した雑音低帯域パラメータ及びローカルに発生した雑音高帯域パラメータに従って第１のＣＮフレームを取得する動作が、復号化処理によって取得した雑音低帯域パラメータ、ＳＩＤに対応する時点での雑音高帯域信号の合成フィルタ係数、及びローカルに発生した雑音高帯域信号の新しい加重平均エネルギに従って、第４のＣＮフレームを取得する動作を含む。

この実施形態では、現在のＳＩＤの前のフレームが符号化音声フレームであって、更に、符号化音声フレームの高帯域信号のエネルギＥ_ＳＰがｓ’_１のエネルギＥ_Ｓ’１よりも低い場合、現在のＳＩＤ及び以降のいくつかのＳＩＤ（この実施形態では５０フレーム）の高帯域信号のエネルギを平滑化する必要がある。具体的な平滑化方法は、現在のフレームのｓ’_１に利得Ｇ_Ｓを乗算することで平滑化ｓ’_１Ｓを取得する。

である。ここで、ｃｎｔはフレーム・カウンタであり、符号化音声フレーム後の第１のＣＮフレームから開始して各フレームについてカウンタに１を加える。

は、以前のフレームの平滑化高帯域信号のエネルギであり、ｃｎｔ＝１である場合にＥ_ＳＰとして初期化される。平滑化プロセスは最大で５０フレームまでに対してのみ実行される。この期間において、

がＥ_Ｓ’１よりも大きい場合、平滑化プロセスは終了する。任意選択的な構成として、

及びＥ_Ｓ’１はフレームの一部のみのエネルギを表す場合があり、この実施形態では特に限定されない。この実施形態では、ｓ’_０及びｓ’_１（又はｓ’_１Ｓ）をＱＭＦ合成フィルタに通し、最後に、デコーダにより再構築され３２ｋＨｚでサンプリングされるＣＮフレームを取得する。

４０３．ＳＩＤが高帯域パラメータを含む場合、ＳＩＤを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、復号によって取得した雑音高帯域パラメータ及びローカルに発生した雑音低帯域パラメータに従って第２のＣＮフレームを取得する。

この実施形態では、ＳＩＤが高帯域パラメータを含む場合、ＳＩＤを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、復号によって取得した雑音高帯域パラメータ及びローカルに発生した雑音低帯域パラメータに従って第２のＣＮフレームを取得する。高帯域パラメータを復号化処理するための方法は、ステップ４０１における方法と同一であり、この実施形態では詳細は繰り返し説明しない。低帯域パラメータをローカルに発生するための方法は、広帯域パタメータをローカルに発生するための方法と同一であり、この実施形態では詳細は繰り返し説明しない。

本発明が提供する方法の実施形態は、以下の有利な効果を与える。すなわち、デコーダが、無音挿入記述子フレーム（ＳＩＤ）を取得し、ＳＩＤが低帯域パラメータ及び／又は高帯域パラメータを含むことを判定する。ＳＩＤが低帯域パラメータを含む場合、ＳＩＤを復号化処理して雑音低帯域パラメータを取得し、雑音高帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音低帯域パラメータ及びローカルに発生した雑音高帯域パラメータに従って第１の快適雑音ＣＮフレームを取得する。ＳＩＤが高帯域パラメータを含む場合、ＳＩＤを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音高帯域パラメータ及びローカルに発生した雑音低帯域パラメータに従って第２のＣＮフレームを取得する。ＳＩＤが高帯域パラメータ及び低帯域パラメータを含む場合、ＳＩＤを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、当該復号化処理によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第３のＣＮフレームを取得する。このように、高帯域信号及び低帯域信号のそれぞれについて互いに異なる処理方法を用い、コーデックの本質的な品質を低下させないという前提のもとに計算の複雑さを軽減して符号化ビットを節約することができ、当該節約したビットは、送信帯域幅を縮小するか又は全体的な符号化品質を向上させる目的を達成することに役立てることができ、これによって超広帯域符号化及び超広帯域送信の問題を解決する。また、復号化処理によって取得した雑音低帯域パラメータ及びローカルに発生した雑音高帯域パラメータに従って第２のＣＮフレームを取得するのに先立って、当該ローカルに発生した雑音高帯域パラメータを更に最適化して、より良い効果の快適雑音を得ることができる。これによってデコーダの性能をいっそう最適化する。

実施形態５
この実施形態は、オーディオ・データを処理するための方法を提供する。実施形態２におけるオーディオ・データを処理するための方法と同じように、符号化端（エンコーダ）は、オーディオ信号の雑音フレームを取得し、雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解する。しかしながら任意選択的な構成として、雑音フレームの高帯域信号が予め設定された符号化及び送信条件を満たすか否かを判定する処理動作が、雑音フレームの雑音高帯域信号のスペクトル構造が、雑音フレームの前の雑音高帯域信号の平均スペクトル構造に比べて、予め設定された条件を満たすか否かを判定し、これを満たす場合には第２のＳＩＤを符号化するためのポリシーを用いることによって雑音フレームの雑音高帯域信号のＳＩＤを符号化し、ＳＩＤを送出し、これを満たさない場合には雑音フレームの雑音高帯域信号の符号化及び送信を行う必要がないと判定する動作を含む。この実施形態では、雑音フレームの雑音高帯域信号のスペクトル構造が、雑音フレームの前の雑音高帯域信号の平均スペクトル構造に比べて、予め設定された条件を満たすか否かを判定することを、雑音高帯域信号の符号化及び送信を行うか否かを判定するための第３の条件として用いる。

この実施形態では、任意選択的な構成として、雑音高帯域信号を符号化及び送信するか否かを、第２の判定条件を用いることによって判定することができる。これについてはこの実施形態では特に限定しない。

この実施形態では、ＤＴＸは、高帯域パラメータを符号化及び送信するか否かを決定する。すなわち、以下の条件を用いることでｆｌａｇ_ｈｂの設定を決定することができる。（１）第３の判定条件を満たすか否か。満たす場合はｆｌａｇ_ｈｂを０にセットし、他の場合はｆｌａｇ_ｈｂを１にセットする。（２）第２の判定条件を満たすか否か。満たさない場合はｆｌａｇ_ｈｂを０にセットし、満たす場合はｆｌａｇ_ｈｂを１にセットする。

この実施形態では、第３の判定条件を実施するための具体的な方法は以下の通りとすることができる。すなわち、エンコーダは現在の雑音フレームの雑音高帯域信号ｓ_１の１０次ＬＳＰ係数ｌｓｐ（ｉ）を取得する。ここでｉ＝０、．．．９である。任意選択的な構成として、この係数はＬＳＦ又はＩＳＦ又はＩＳＰ係数とすることも可能であり、これはこの実施形態では特に限定されない。ＬＳＰ又はＬＳＦ又はＩＳＦ又はＩＳＰ係数は、単に異なるドメインにおける異なる表現方法に過ぎないが、全て合成フィルタ係数を表し、これはこの実施形態では特に限定されない。ｌｓｐ（ｉ）を用いてその移動平均を更新する。

ここで、ｌｓｐ_ａ（ｉ）はｌｓｐ（ｉ）の長期移動平均である。現在のｌｓｐ_ａ（ｉ）と、高帯域パラメータを含むＳＩＤフレームが最後に送出された時点でのｌｓｐ_ａ（ｉ）との間のスペクトル歪みを計算する。

ここで、Ｄ_ｌｓｐはスペクトル歪みを表し、

は、高帯域パラメータを含むＳＩＤフレームが最後に送出された時点でのｌｓｐ_ａ（ｉ）を表す。Ｄ_ｌｓｐがある閾値よりも小さい場合はｆｌａｇ_ｈｂ＝０にセットする。他の場合はｆｌａｇ_ｈｂ＝１にセットする。

この実施形態では、必要な場合にエンコーダによって低帯域パラメータ及び／又は高帯域パラメータを符号化するための動作方法は、基本的に実施形態３における動作方法と同一であり、この実施形態では詳細は繰り返し説明しない。

この実施形態では、デコーダがＣＮＧ動作状態でありｆｌａｇ_ＣＮＧ＝０である場合、雑音高帯域信号をローカルに発生する必要がある。ＳＩＤに対応する時点で雑音高帯域信号の重み付け平均エネルギを取得するための方法は、実施形態４における方法と同一であり、この実施形態では詳細は繰り返し説明しない。しかしながらこの実施形態では、好ましくは、ＳＩＤに対応する時点での雑音高帯域信号の合成フィルタ係数を取得する処理動作が、ローカルにバッファリングされた雑音高帯域信号のＭ個のＩＳＦ係数又はＩＳＰ係数又はＬＳＦ係数又はＬＳＰ係数を取得する動作と、Ｍ個の係数にランダム化処理を実行する動作であって、当該ランダム化処理の特性が、当該Ｍ個の係数中に含まれる各係数を当該各係数に対応する目標値に徐々に漸近させるものであり、当該目標値が当該係数の値に近接した予め設定された範囲内の値であり、当該Ｍ個の係数中に含まれる各係数の目標値がＮ個のフレームの各々毎に変化する、動作と、当該ランダム化処理によって取得したフィルタ係数に従って、ＳＩＤに対応する時点での雑音高帯域信号の合成フィルタ係数を取得する動作と、を含む。具体的には、ＳＩＤに対応する時点での雑音高帯域信号の合成フィルタ係数を取得する動作とは、以下のように実施することができる。

ｌｓｐ’（ｉ）＝ｌｓｐ_ＣＮ（ｉ）と想定する（ここでｉ＝０、．．．９である）と、ｌｓｐ_ＣＮ（ｉ）は、復号端でローカルにバッファリングされたＣＮフレームの高帯域信号のＬＳＰ係数の長期移動平均である。ランダム化処理は、実施形態４におけるものと同一の方法を用いてｌｓｐ’（ｉ）に対して実行し、ｌｓｐ_１（ｉ）を取得する。

ｌｓｐ_１（ｉ）をＬＰＣ係数ｌｐｃ_１（ｉ）に変換し、実施形態４におけるものと同一の方法を用いることで、ｗ（ｉ）で重み付けした後に合成フィルタ１／Ａ^〜 _１（Ｚ）を取得する。この実施形態では、３２０ポイント白色雑音シーケンスｅｘｃ_２（ｉ）を発生する。ここでｉ＝０、１、．．．３１９である。ｅｘｃ_２（ｉ）を用いてフィルタ１／Ａ^〜 _１（Ｚ）を励起して利得未調整の高帯域ＣＮ信号ｓ^〜 _１（ｉ）を取得する。ｓ^〜 _１（ｉ）に利得係数Ｇ３を乗算し、復号端で再構築され１６ｋＨｚでサンプリングされるＣＮフレームの高帯域信号ｓ’_１を取得する。この実施形態では、現在のフレームがＳＩＤである場合、この方法を用いて取得したｌｓｐ_１（ｉ）は、復号端でバッファリングされたＣＮフレームの高帯域信号のＬＳＰ係数の長期移動平均を更新するために用いられない。

この実施形態では、エンコーダが大きいＳＩＤフレームを符号化した場合、符号化端で高帯域信号の対数エネルギの長期移動平均ｅ_１ａを量子化する場合、ｅ_１ａを減衰させた後に（すなわち値を減算した後に）量子化を実行する。従ってこの場合、復号において、実施形態４におけるようにｓ^〜 _１をＧ２又はＧ４で乗算する必要はない。この実施形態における復号端の他のステップは、前述の実施形態におけるステップと同様であり、この実施形態では詳細は繰り返し説明しない。

本発明が提供する方法の実施形態は、以下の有利な効果を与える。すなわち、オーディオ信号の現在の雑音フレームを取得し、現在の雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解し、第１の非連続送信機構を用いることによって雑音低帯域信号を符号化及び送信し、第２の非連続送信機構を用いることによって雑音高帯域信号を符号化及び送信する。デコーダが、無音挿入記述子フレームＳＩＤを取得し、このＳＩＤが低帯域パラメータ及び／又は高帯域パラメータを含むことを判定する。ＳＩＤが低帯域パラメータを含む場合、ＳＩＤを復号化処理して雑音低帯域パラメータを取得し、雑音高帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音低帯域パラメータ及びローカルに発生した雑音高帯域パラメータに従って第１の快適雑音ＣＮフレームを取得する。ＳＩＤが高帯域パラメータを含む場合、ＳＩＤを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音高帯域パラメータ及びローカルに発生した雑音低帯域パラメータに従って第２のＣＮフレームを取得する。ＳＩＤが高帯域パラメータ及び低帯域パラメータを含む場合、ＳＩＤを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、当該復号化処理によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第３のＣＮフレームを取得する。このように、高帯域信号及び低帯域信号のそれぞれについて互いに異なる処理方法を用い、コーデックの本質的な品質を低下させないという前提のもとに計算の複雑さを軽減して符号化ビットを節約することができ、当該節約したビットは、送信帯域幅を縮小するか又は全体的な符号化品質を向上させる目的を達成するために役立てることができ、これによって超広帯域符号化及び超広帯域送信の問題を解決する。

実施形態６
図５を参照すると、この実施形態は、オーディオ・データを符号化するための装置を提供する。この装置は取得モジュール５０１及び送信モジュール５０２を含む。

取得モジュール５０１は、オーディオ信号の雑音フレームを取得し、雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解するように構成されている。

送信モジュール５０２は、第１の非連続送信機構を用いることによって雑音低帯域信号を符号化及び送信し、第２の非連続送信機構を用いることによって雑音高帯域信号を符号化及び送信するように構成され、第１の非連続送信機構の第１の無音挿入記述子フレームＳＩＤを送出するためのポリシーが、第２の非連続送信機構の第２のＳＩＤを送出するためのポリシーとは異なり、又は、第１の非連続送信機構の第１のＳＩＤを符号化するためのポリシーが、第２の非連続送信機構の第２のＳＩＤを符号化するためのポリシーとは異なる。

この実施形態では、第１のＳＩＤが雑音フレームの低帯域パラメータを含み、第２のＳＩＤが雑音フレームの低帯域パラメータ及び／又は高帯域パラメータを含む。

任意選択的な構成として、図６を参照すると、送信モジュール５０２は、
雑音高帯域信号が予め設定されたスペクトル構造を有するか否かを判定し、これを有すると共に第２のＳＩＤを送出するためのポリシーの送出条件を満たす場合は、第２のＳＩＤを符号化するためのポリシーを用いることによって雑音高帯域信号のＩＤを符号化し、ＳＩＤを送出し、これを有しない場合は、雑音高帯域信号の符号化及び送信を行う必要がないと判定するように構成された第１の送信ユニット５０２ａを含む。

この実施形態では、第１の送信ユニット５０２ａは、
雑音高帯域信号のスペクトルを取得し、スペクトルを少なくとも２つのサブバンドに分割し、サブバンド内のいずれの第１のサブバンドの平均エネルギがサブバンド内の第２のサブバンドの平均エネルギよりも低くない場合は雑音高帯域信号が予め設定されたスペクトル構造を有しないことを確定し、他の場合は雑音高帯域信号が予め設定されたスペクトル構造を有することを確定するように構成され、第２のサブバンドが位置する周波数帯域が第１のサブバンドが位置する周波数帯域よりも高い、第１の判定サブユニットを含む。

図６を参照すると、任意選択的な構成として、送信モジュール５０２は、
第１の比率及び第２の比率に従って偏差程度値を発生し、第１の比率が、雑音フレームの雑音低帯域信号のエネルギに対する雑音フレームの雑音高帯域信号のエネルギの比率であり、第２の比率が、雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した時点での雑音高帯域信号のエネルギの比率であり、更に、偏差程度値が予め設定された閾値に達したか否かを判定し、これに達した場合は第２のＳＩＤを符号化するためのポリシーを用いることによって雑音高帯域信号のＳＩＤを符号化し、ＳＩＤを送出し、達しない場合は雑音高帯域信号の符号化及び送信を行う必要がないと判定するように構成された第２の送信ユニット５０２ｂを含む。

任意選択的な構成として、第１の比率が、雑音フレームの雑音低帯域信号のエネルギに対する雑音フレームの雑音高帯域信号のエネルギの比率であることは、
第１の比率が、雑音フレームの雑音低帯域信号の瞬時エネルギに対する雑音フレームの雑音高帯域信号の瞬時エネルギの比率であることを含み、更に、
これに対応して、第２の比率が、雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号のエネルギの比率であることが、
第２の比率が、雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点での雑音低帯域信号の瞬時エネルギに対する雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号の瞬時エネルギの比率であることを含む。

あるいは、第１の比率が、雑音フレームの雑音低帯域信号のエネルギに対する雑音フレームの雑音高帯域信号のエネルギの比率であることは、
第１の比率が、雑音フレーム及びこの雑音フレームの前の雑音フレームの雑音低帯域信号の加重平均エネルギに対する雑音フレーム及びこの雑音フレームの前の雑音フレームの雑音高帯域信号の加重平均エネルギの比率であることを含み、更に、
これに対応して、第２の比率が、雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号のエネルギの比率であることが、
第２の比率が、雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点での雑音フレーム及び雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点でのこの雑音フレームの前の雑音フレームの低帯域信号の加重平均エネルギに対する雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点での雑音フレーム及び雑音高帯域パラメータを含むＳＩＤを雑音フレームの前に最後に送出した前記時点でのこの雑音フレームの前の雑音フレームの高帯域信号の加重平均エネルギの比率であることを含む。

任意選択的な構成として、この実施形態では、第２の送信ユニット５０２ｂは、
第１の比率の対数値及び第２の比率の対数値を別個に計算し、第１の比率の対数値と第２の比率の対数値との間の差の絶対値を計算して偏差程度値を取得するように構成された計算サブユニットを含む。

図６を参照すると、任意選択的な構成として、この実施形態では、送信モジュール５０２は、
雑音フレームの雑音高帯域信号のスペクトル構造が、雑音フレームの前の雑音高帯域信号の平均スペクトル構造に比べて、予め設定された条件を満たすか否かを判定し、これを満たす場合は第２のＳＩＤを符号化するためのポリシーを用いることによって雑音フレームの雑音高帯域信号のＳＩＤを符号化し、ＳＩＤを送出し、これを満たさない場合は雑音フレームの雑音高帯域信号の符号化及び送信を行う必要がないと判定するように構成された第３の送信ユニット５０２ｃを含む。

この実施形態では、任意選択的な構成として、雑音フレームの前の雑音高帯域信号の平均スペクトル構造が、雑音フレームの前の雑音高帯域信号のスペクトルの加重平均を含む。

任意選択的な構成として、この実施形態では、第２の非連続送信機構の第２のＳＩＤを送出するためのポリシーにおける送出条件が、第１の非連続送信機構が第１のＳＩＤを送出するための条件を満たすことを更に含む。

本発明が提供する装置の実施形態は、以下の有利な効果を与える。すなわち、オーディオ信号の現在の雑音フレームを取得し、現在の雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解し、第１の非連続送信機構を用いることによって雑音低帯域信号を符号化及び送信し、第２の非連続送信機構を用いることによって雑音高帯域信号を符号化し及び送信する。このように、高帯域信号及び低帯域信号のそれぞれについて互いに異なる処理方法を用い、コーデックの本質的な品質を低下させないという前提のもとに計算の複雑さを軽減して符号化ビットを節約することができ、当該節約したビットは、送信帯域幅を縮小するか又は全体的な符号化品質を向上させる目的を達成するために役立てることができ、これによって超広帯域符号化及び超広帯域送信の問題を解決する。

実施形態７
図７を参照すると、この実施形態は、オーディオ・データを復号化するための装置を提供する。この装置は、取得モジュール６０１、第１の復号化モジュール６０２、第２の復号化モジュール６０３、及び第３の復号化モジュール６０４を含む。

取得モジュール６０１は、受信した現在の無音挿入記述子フレームＳＩＤが低帯域パラメータを含むか又は高帯域パラメータを含むかを判定するように構成されている。

第１の復号化モジュール６０２は、取得モジュール６０１によって取得されたＳＩＤが低帯域パラメータを含む場合、ＳＩＤを復号化処理して雑音低帯域パラメータを取得し、雑音高帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音低帯域パラメータ及びローカルに発生した雑音高帯域パラメータに従って第１の快適雑音ＣＮフレームを取得するように構成されている。

第２の復号化モジュール６０３は、取得モジュール６０１によって取得されたＳＩＤが高帯域パラメータを含む場合、ＳＩＤを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音高帯域パラメータ及びローカルに発生した雑音低帯域パラメータに従って第２のＣＮフレームを取得するように構成されている。

第３の復号化モジュール６０４は、取得モジュール６０１によって取得されたＳＩＤが高帯域パラメータ及び低帯域パラメータを含む場合、ＳＩＤを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、当該復号化処理によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第３のＣＮフレームを取得するように構成されている。

任意選択的な構成として、この実施形態では、第１の復号化モジュール６０２が、ＳＩＤを復号化処理して雑音低帯域パラメータを取得すること、雑音高帯域パラメータをローカルに発生すること、並びに当該復号化処理によって取得した雑音低帯域パラメータ及びローカルに発生した雑音高帯域パラメータに従って第１の快適雑音ＣＮフレームを取得することの前に、デコーダが第１の快適雑音生成ＣＮＧ状態にある場合、第２のＣＮＧ状態に入るように更に構成されている。

任意選択的な構成として、この実施形態では、第３の復号化モジュール６０４が、ＳＩＤを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得すること、並びに当該復号化処理によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第３のＣＮフレームを取得することの前に、デコーダが第２のＣＮＧ状態にある場合、第１のＣＮＧ状態に入るように更に構成されている。

任意選択的な構成として、この実施形態では、取得モジュール６０１は、
ＳＩＤのビット数が予め設定された第１の閾値よりも小さい場合、ＳＩＤが高帯域パラメータを含むことを確定し、ＳＩＤのビット数が予め設定された第１の閾値よりも大きく予め設定された第２の閾値よりも小さい場合、ＳＩＤが低帯域パラメータを含むことを確定し、ＳＩＤのビット数が予め設定された第２の閾値よりも大きく予め設定された第３の閾値よりも小さい場合、ＳＩＤが高帯域パラメータ及び低帯域パラメータを含むことを確定するように構成された第１の確定ユニット、又は、
ＳＩＤが第１の識別子を含む場合、ＳＩＤが高帯域パラメータを含むことを確定し、ＳＩＤが第２の識別子を含む場合、ＳＩＤが低帯域パラメータを含むことを確定し、ＳＩＤが第３の識別子を含む場合、ＳＩＤが低帯域パラメータ及び高帯域パラメータを含むことを確定するように構成された第２の確定ユニット、
を含む。

この実施形態では、第１の復号化モジュール６０２は、
ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギ及び雑音高帯域信号の合成フィルタ係数を別個に取得するように構成された第１の取得ユニットと、
ＳＩＤに対応する時点での雑音高帯域信号の取得した加重平均エネルギ及び雑音高帯域信号の取得した合成フィルタ係数に従って雑音高帯域信号を取得するように構成された第２の取得ユニットと、
を含む。

任意選択的な構成として、第１の取得ユニットは、
復号によって取得した雑音低帯域パラメータに従って第１のＣＮフレームの低帯域信号のエネルギを取得するように構成された第１の取得サブユニットと、
高帯域パラメータを含むＳＩＤをＳＩＤの前に受信した時点での雑音低帯域信号のエネルギに対する雑音高帯域信号のエネルギの比率を計算して第１の比率を取得するように構成された計算サブユニットと、
第１のＣＮフレームの低帯域信号のエネルギ及び第１の比率に従って、ＳＩＤに対応する時点での雑音高帯域信号のエネルギを取得するように構成された第２の取得サブユニットと、
ＳＩＤに対応する時点での雑音高帯域信号のエネルギ及びローカルにバッファリングされたＣＮフレームの高帯域信号のエネルギに対して加重平均を実行して、ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギを取得するように構成された第３の取得サブユニットであって、ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギが第１のＣＮフレームの高帯域信号エネルギである、第３の取得サブユニットと、
を含む。

計算サブユニットは、具体的には、
高帯域パラメータを含むＳＩＤをＳＩＤの前に受信した時点での雑音低帯域信号の瞬時エネルギに対する雑音高帯域信号の瞬時エネルギの比率を計算して第１の比率を取得する、又は、
高帯域パラメータを含むＳＩＤをＳＩＤの前に受信した時点での雑音低帯域信号の加重平均エネルギに対する雑音高帯域信号の加重平均エネルギの比率を計算して第１の比率を取得する、
ように構成されている。

ＳＩＤに対応する時点での雑音高帯域信号のエネルギが、ローカルにバッファリングされた以前のＣＮフレームの高帯域信号のエネルギよりも大きい場合は、ローカルにバッファリングされた以前のＣＮフレームの高帯域信号のエネルギを第１のレートで更新し、その他の場合は、ローカルにバッファリングされた以前のＣＮフレームの高帯域信号のエネルギを第２のレートで更新し、第１のレートは第２のレートよりも大きい。

任意選択的な構成として、第１の取得ユニットは、
ＳＩＤの前の予め設定された時間期間内の音声フレームから、最小の高帯域信号エネルギを有する音声フレームの高帯域信号を選択し、音声フレーム中で最小の高帯域信号エネルギを有する音声フレームの高帯域信号のエネルギに従って、ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギを取得するように構成された第１の選択サブユニットであって、ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギが第１のＣＮフレームの高帯域信号エネルギである、第１の選択サブユニット、又は、
ＳＩＤの前の予め設定された時間期間内の音声フレームから、予め設定された閾値よりも小さい高帯域信号エネルギを有するＮ個の音声フレームの高帯域信号を選択し、Ｎ個の音声フレームの高帯域信号の加重平均エネルギに従って、ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギを取得するように構成された第２の選択ユニットであって、ＳＩＤに対応する時点での雑音高帯域信号の加重平均エネルギが第１のＣＮフレームの高帯域信号エネルギである、第２の選択ユニット、
を含む。

任意選択的な構成として、第１の取得ユニットは、
高帯域信号に対応する周波数範囲に、Ｍ個のイミタンス・スペクトル周波数ＩＳＦ係数又はイミタンス・スペクトル対ＩＳＰ係数又は線スペクトル周波数ＬＳＦ係数又は線スペクトル対ＬＳＰ係数を分散させるように構成された分散サブユニットと、
Ｍ個の係数にランダム化処理を実行するように構成された第１のランダム化処理サブユニットであって、ランダム化の特性が、Ｍ個の係数中の各係数を各係数に対応する目標値に徐々に近付かせるものであり、目標値が係数値に隣接した予め設定された範囲内の値であり、Ｍ個の係数中の各係数の目標値がＮ個のフレームごとに変化し、Ｍ及びＮの双方が自然数である、第１のランダム化処理サブユニットと、
ランダム化処理によって取得したフィルタ係数に従って、ＳＩＤに対応する時点での雑音高帯域信号の合成フィルタ係数を取得するように構成された第４の取得サブユニットと、
を含む。

任意選択的な構成として、第１の取得ユニットは、
ローカルにバッファリングされた雑音高帯域信号のＭ個のＩＳＦ係数又はＩＳＰ係数又はＬＳＦ係数又はＬＳＰ係数を取得するように構成された第５の取得サブユニットと、
Ｍ個の係数にランダム化処理を実行するように構成された第２のランダム化処理サブユニットであって、ランダム化の特性が、Ｍ個の係数中の各係数を各係数に対応する目標値に徐々に近付かせるものであり、目標値が係数値に隣接した予め設定された範囲内の値であり、Ｍ個の係数中の各係数の目標値がＮ個のフレームごとに変化する、第２のランダム化処理サブユニットと、
ランダム化処理によって取得したフィルタ係数に従って、ＳＩＤに対応する時点での雑音高帯域信号の合成フィルタ係数を取得するように構成された第６の取得サブユニットと、
を含む。

図８を参照すると、任意選択的な構成として、この装置は、
第１の復号化モジュール６０２が第１のＣＮフレームを取得することの前に、ＳＩＤに隣接した履歴フレームが符号化音声フレームである場合、符号化音声フレームから復号された高帯域信号又は高帯域信号の一部の平均エネルギが、ローカルに発生した雑音高帯域信号又は雑音高帯域信号の一部の平均エネルギよりも小さいならば、ＳＩＤから開始して以降のＬ個のフレームの雑音高帯域信号を１よりも小さい平滑化係数で乗算して、ローカルに発生した雑音高帯域信号の新しい加重平均エネルギを取得するように構成された最適化モジュール６０５を更に含む。

これに対応して、第１の復号化モジュール６０２は、具体的には、復号によって取得した雑音低帯域パラメータ、ＳＩＤに対応する時点での雑音高帯域信号の合成フィルタ係数、及びローカルに発生した雑音高帯域信号の新しい加重平均エネルギに従って、第４のＣＮフレームを取得するように構成されている。

本発明が提供する方法の実施形態は、以下の有利な効果を与える。すなわち、デコーダが、無音挿入記述子フレームＳＩＤを取得し、このＳＩＤが低帯域パラメータ又は高帯域パラメータを含むことを判定する。ＳＩＤが低帯域パラメータを含む場合、ＳＩＤを復号化処理して雑音低帯域パラメータを取得し、雑音高帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音低帯域パラメータ及びローカルに発生した雑音高帯域パラメータに従って第１の快適雑音ＣＮフレームを取得する。ＳＩＤが高帯域パラメータを含む場合、ＳＩＤを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音高帯域パラメータ及びローカルに発生した雑音低帯域パラメータに従って第２のＣＮフレームを取得する。ＳＩＤが高帯域パラメータ及び低帯域パラメータを含む場合、ＳＩＤを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、当該復号化処理によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第３のＣＮフレームを取得する。このように、高帯域信号及び低帯域信号に異なる処理方法を用い、コーデックの本質的な品質を低下させないという前提のもとに計算の複雑さを軽減して符号化ビットを節約することができ、節約したビットは、送信帯域幅を縮小するか又は全体的な符号化品質を向上させる目的の達成に役立ち、これによって超広帯域符号化及び送信の問題を解決する。

実施形態８
図９を参照すると、この実施形態は、オーディオ・データを処理するための方法を提供する。このシステムは、オーディオ・データを符号化するための前述の装置５００及びオーディオ・データを復号化するための前述の装置６００を含む。

本発明の実施形態が提供する技術的解決策は、以下の有利な効果を与える。すなわち、オーディオ信号の雑音フレームを取得し、現在の雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解し、第１の非連続送信機構を用いることによって雑音低帯域信号を符号化及び送信し、第２の非連続送信機構を用いることによって雑音高帯域信号を符号化及び送信する。デコーダが、無音挿入記述子フレームＳＩＤを取得し、このＳＩＤが低帯域パラメータ及び／又は高帯域パラメータを含むことを判定する。ＳＩＤが低帯域パラメータを含む場合、ＳＩＤを復号化処理して雑音低帯域パラメータを取得し、雑音高帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音低帯域パラメータ及びローカルに発生した雑音高帯域パラメータに従って第１の快適雑音ＣＮフレームを取得する。ＳＩＤが高帯域パラメータを含む場合、ＳＩＤを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音高帯域パラメータ及びローカルに発生した雑音低帯域パラメータに従って第２のＣＮフレームを取得する。ＳＩＤが高帯域パラメータ及び低帯域パラメータを含む場合、ＳＩＤを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、当該復号化処理によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第３のＣＮフレームを取得する。このように、高帯域信号及び低帯域信号のそれぞれについて互いに異なる処理方法を用い、コーデックの本質的な品質を低下させないという前提のもとに計算の複雑さを軽減して符号化ビットを節約することができ、当該節約したビットは、送信帯域幅を縮小するか又は全体的な符号化品質を向上させる目的を達成するために役立てることができ、これによって超広帯域符号化及び送信の問題を解決する。

実施形態が提供する装置及びシステムは、特に、方法の実施形態と同一の思想に属することができる。方法及び装置の具体的な実施プロセスは方法の実施形態において詳しく説明したので、ここでは詳細は繰り返し記載しない。

前述の実施形態におけるオーディオ・データを処理するための方法及び装置は、オーディオ・エンコーダ及びオーディオ・デコーダに適用することができる。オーディオ・コーデックは、移動電話、無線装置、携帯情報端末（ＰＤＡ）、手持ち型又は携帯型コンピュータ、ＧＰＳ受信器又はナビゲーション・デバイス、カメラ、オーディオ／ビデオ・プレーヤ、カムコーダ、ビデオ・レコーダ、及び監視デバイス等、様々な電子デバイスに広く適用可能である。一般に、かかる電子デバイスはオーディオ・エンコーダ又はオーディオ・デコーダを含む。オーディオ・エンコーダ又はデコーダは、例えばＤＳＰ（デジタル信号プロセッサ）のようなデジタル回路又はチップを用いることで直接に実施することができ、又はソフトウェア・コードを用いてこのソフトウェア・コード内の手順をプロセッサに実行させることによって実施することができる。

実施形態のステップの全て又は一部を、ハードウェア又は関連するハードウェアに命令するプログラムによって実施可能であることは、当業者には理解されよう。プログラムはコンピュータ読み取り可能記憶媒体に記憶することができる。記憶媒体は、読み取り専用メモリ、磁気ディスク、又は光ディスクを含むことができる。

前述の記載は本発明の例示的な実施形態に過ぎず、本発明を限定することは意図していない。本発明の精神及び範囲から逸脱することなく行われるいかなる変更、均等な置換、及び改良も、本発明の保護範囲内に包含されるものである。

Claims

オーディオ・データを処理するための方法であって、
オーディオ信号の現在の雑音フレームから現在の雑音低帯域信号及び現在の雑音高帯域信号を生成するステップと、
第１の比率及び第２の比率に基づいて偏差を発生するステップであって、前記第１の比率は、前記現在の雑音高帯域信号のエネルギに対する前記現在の雑音低帯域信号のエネルギの比率を表わし、前記第２の比率は、前の時点での前の雑音高帯域信号のエネルギに対する前記前の時点での前の雑音低帯域信号のエネルギの比率を表わし、前記前の時点は、雑音高帯域パラメータを含む前記オーディオ信号の無音挿入記述子（ＳＩＤ）が前記現在の雑音フレームの前に送られた最後の時点に対応する、ステップと、
生成された前記偏差が予め設定された閾値より大きいかどうかを判定するステップと、
生成された前記偏差が前記予め設定された閾値より大きいときは、前記現在の雑音低帯域信号の雑音低帯域パラメータ及び前記現在の雑音高帯域信号の雑音高帯域パラメータを含む第１のＳＩＤを符号化するステップと、
生成された前記偏差が前記予め設定された閾値より大きくないときは、前記現在の雑音低帯域信号の前記雑音低帯域パラメータを含み、かつ前記現在の雑音高帯域信号の雑音高帯域パラメータを含まない第２のＳＩＤを符号化するステップと、
生成された前記偏差が前記予め設定された閾値より大きくないときは、前記第２のＳＩＤを送信するステップとを含む、
方法。
前記現在の雑音低帯域信号のエネルギは前記現在の雑音低帯域信号の平滑化された平均エネルギを表わし、前記現在の雑音高帯域信号のエネルギは前記現在の雑音高帯域信号の平滑化された平均エネルギを表わし、前記前の時点での前記前の雑音低帯域信号のエネルギは前記前の時点での前記前の雑音低帯域信号の平滑化された平均エネルギを表わし、前記前の時点での前記前の雑音高帯域信号のエネルギは前記前の時点での前記前の雑音高帯域信号の平滑化された平均エネルギを表わす、請求項１記載の方法。
前記現在の雑音低帯域信号の前記平滑化された平均エネルギは、前記前の時点での前記前の雑音低帯域信号の前記平滑化された平均エネルギ及び前記現在の雑音低帯域信号の平均エネルギに基づいて得られ、前記現在の雑音高帯域信号の前記平滑化された平均エネルギは、前記前の時点での前記前の雑音高帯域信号の前記平滑化された平均エネルギ及び前記現在の雑音高帯域信号の平均エネルギに基づいて得られる、請求項２記載の方法。
前記現在の雑音低帯域信号の前記平滑化された平均エネルギは対数領域で得られ、前記現在の雑音高帯域信号の前記平滑化された平均エネルギは対数領域で得られる、請求項２記載の方法。
前記第１の比率及び前記第２の比率に基づいて前記偏差を発生することが、
前記第１の比率の対数値及び前記第２の比率の対数値を別個に計算する動作と、
前記第１の比率の前記対数値と前記第２の比率の前記対数値との間の差の絶対値を計算して前記偏差を取得する動作と、
を含む、請求項１ないし４のうちいずれか一項記載の方法。
前記第１の比率の前記対数値が：
前記現在の雑音低帯域信号の平滑化された平均エネルギの対数値を取得し、
前記現在の雑音高帯域信号の平滑化された平均エネルギの対数値を取得し、
前記現在の雑音低帯域信号の前記平滑化された平均エネルギの前記対数値と前記現在の雑音高帯域信号の平滑化された平均エネルギの前記対数値との間の差を計算することによって、前記第１の比率の前記対数値を取得することによって計算される、
請求項５記載の方法。
前記第２の比率の前記対数値が：
前記前の時点での前記前の雑音低帯域信号の平滑化された平均エネルギの対数値を取得し、
前記前の時点での前記前の雑音高帯域信号の平滑化された平均エネルギの対数値を取得し、
前記前の時点での前記前の雑音低帯域信号の平滑化された平均エネルギの前記対数値と前記前の時点での前記前の雑音高帯域信号の平滑化された平均エネルギの前記対数値との間の差を計算することによって、前記第１の比率の前記対数値を取得することによって計算される、
請求項５記載の方法。
オーディオ・データを処理するための方法であって、
デコーダによって、現在の無音挿入記述子（ＳＩＤ）を取得するステップであって、前記現在のＳＩＤは雑音低帯域パラメータを含む、ステップ；
前記現在のＳＩＤが雑音高帯域パラメータを含むかどうかを判定するステップ；
前記現在のＳＩＤが前記雑音高帯域パラメータを含まないとき、前記現在のＳＩＤを復号化して、前記雑音低帯域パラメータを取得するステップと；
前記現在のＳＩＤが前記雑音高帯域パラメータを含まないとき、雑音高帯域パラメータを外挿するステップと；
前記現在のＳＩＤが前記雑音高帯域パラメータを含まないとき、前記復号化された雑音低帯域パラメータ及び前記外挿された雑音高帯域パラメータに基づいて第１の快適雑音（ＣＮ）フレームを取得するステップ；
前記現在のＳＩＤが前記雑音高帯域パラメータを含むとき、前記現在のＳＩＤを復号化して、前記雑音高帯域パラメータ及び前記雑音低帯域パラメータを取得するステップと；
前記現在のＳＩＤが前記雑音高帯域パラメータを含むとき、前記復号化された雑音高帯域パラメータ及び前記復号化された雑音低帯域に基づいて第２のＣＮフレームを取得するステップとを含む、
方法。
前記現在のＳＩＤが雑音高帯域パラメータを含むかどうかを判定することが：
前記現在のＳＩＤが第１の識別子を含むときに前記現在のＳＩＤが前記雑音高帯域パラメータを含むと判定し；
前記現在のＳＩＤが第２の識別子を含むときに前記現在のＳＩＤが前記雑音高帯域パラメータを含まないと判定することを含み、
前記第１の識別子及び前記第２の識別子は前記現在のＳＩＤの一つのビットによって指示される、
請求項８記載の方法。
前記雑音高帯域パラメータを外挿することが：
前記現在のＳＩＤに対応する現在の時点での雑音高帯域信号の加重平均エネルギを取得し；
前記現在の時点での前記雑音高帯域信号の合成フィルタ係数を取得し；
前記現在の時点での前記雑音高帯域信号の前記取得した加重平均エネルギ及び前記現在の時点での前記雑音高帯域信号の前記取得した合成フィルタ係数に基づいて前記雑音高帯域信号を取得することを含む、
請求項８記載の方法。
前記現在の時点での前記雑音高帯域信号の前記加重平均エネルギを前記取得することが、
復号化された前記雑音低帯域パラメータに基づいて前記第１のＣＮフレームの低帯域信号のエネルギを取得する動作と、
前の時点での雑音低帯域信号のエネルギに対する前記前の時点での雑音高帯域信号のエネルギの比率を表わす第１の比率を計算する動作であって、前記前の時点は、雑音高帯域パラメータを含む前のＳＩＤが前記現在のＳＩＤの前に受領された最後の時点に対応する、動作と、
前記第１のＣＮフレームの前記低帯域信号の前記エネルギ及び前記第１の比率に基づいて、前記現在の時点での前記雑音高帯域信号のエネルギを取得する動作と、
前記現在の時点での前記雑音高帯域信号の前記エネルギ及びローカルにバッファリングされたＣＮフレームの高帯域信号のエネルギに対して加重平均を実行して、前記現在の時点での前記雑音高帯域信号の前記加重平均エネルギを取得する動作であって、前記現在の時点での前記雑音高帯域信号の前記加重平均エネルギが前記第１のＣＮフレームの高帯域信号エネルギに対応する、動作と、
を含む、請求項１０記載の方法。
前記第１の比率を取得することが、
前記前の時点での前記雑音低帯域信号の加重平均エネルギに対する前記前の時点での前記雑音高帯域信号の加重平均エネルギの比率を計算すること、又は、
前記前の時点での前記雑音低帯域信号の瞬時エネルギに対する前記前の時点での前記雑音高帯域信号の瞬時エネルギの比率を計算することを含む、
請求項１１記載の方法。
前記第１のＣＮフレームを取得するのに先立って、前記方法がさらに、
前記現在のＳＩＤに隣接した履歴フレームが符号化音声フレームである場合、前記符号化音声フレームから復号化された高帯域信号の一部又は高帯域信号の平均エネルギが、外挿された前記雑音高帯域信号又は雑音高帯域信号の平均エネルギよりも小さいならば、前記現在のＳＩＤから開始して以降のＬ個のフレームの雑音高帯域信号に０よりも大きく１よりも小さい平滑化係数を乗算して、前記外挿された雑音高帯域信号の新しい加重平均エネルギを取得するステップを含み、
前記第１のＣＮフレームを取得することが、
復号化された前記雑音低帯域パラメータ、前記現在の時点での前記雑音高帯域信号の前記合成フィルタ係数、及び前記外挿された雑音高帯域信号の前記新しい加重平均エネルギに基づいて、前記第１のＣＮフレームを取得することを含む、請求項１０記載の方法。
コンピュータ実行可能命令を記憶している非一時的なメモリと；
前記非一時的なメモリに動作上結合されたプロセッサとを有するエンコーダであって、前記プロセッサは前記コンピュータ実行可能命令を実行して：
オーディオ信号の現在の雑音フレームから現在の雑音低帯域信号及び現在の雑音高帯域信号を生成するステップと、
第１の比率及び第２の比率に基づいて偏差を発生するステップであって、前記第１の比率は、前記現在の雑音高帯域信号のエネルギに対する前記現在の雑音低帯域信号のエネルギの比率を表わし、前記第２の比率は、前の時点での前の雑音高帯域信号のエネルギに対する前記前の時点での前の雑音低帯域信号のエネルギの比率を表わし、前記前の時点は、雑音高帯域パラメータを含む前記オーディオ信号の無音挿入記述子（ＳＩＤ）が前記現在の雑音フレームの前に送られた最後の時点に対応する、ステップと、
生成された前記偏差が予め設定された閾値より大きいかどうかを判定するステップと、
生成された前記偏差が前記予め設定された閾値より大きいときは、前記現在の雑音低帯域信号の雑音低帯域パラメータ及び前記現在の雑音高帯域信号の雑音高帯域パラメータを含む第１のＳＩＤを符号化するステップと、
生成された前記偏差が前記予め設定された閾値より大きいときは、前記第１のＳＩＤを送信するステップと、
生成された前記偏差が前記予め設定された閾値より大きくないときは、前記現在の雑音低帯域信号の前記雑音低帯域パラメータを含み、かつ前記現在の雑音高帯域信号の雑音高帯域パラメータを含まない第２のＳＩＤを符号化するステップと、
生成された前記偏差が前記予め設定された閾値より大きくないときは、前記第２のＳＩＤを送信するステップとを実行するよう構成されている、
エンコーダ。
前記現在の雑音低帯域信号のエネルギは前記現在の雑音低帯域信号の平滑化された平均エネルギを表わし、前記現在の雑音高帯域信号のエネルギは前記現在の雑音高帯域信号の平滑化された平均エネルギを表わし、前記前の時点での前記前の雑音低帯域信号のエネルギは前記前の時点での前記前の雑音低帯域信号の平滑化された平均エネルギを表わし、前記前の時点での前記前の雑音高帯域信号のエネルギは前記前の時点での前記前の雑音高帯域信号の平滑化された平均エネルギー表わす、請求項１４記載のエンコーダ。
前記現在の雑音低帯域信号の前記平滑化された平均エネルギは、前記前の時点での前記前の雑音低帯域信号の前記平滑化された平均エネルギ及び前記現在の雑音低帯域信号の平均エネルギに基づいて得られ、前記現在の雑音高帯域信号の前記平滑化された平均エネルギは、前記前の時点での前記前の雑音高帯域信号の前記平滑化された平均エネルギ及び前記現在の雑音高帯域信号の平均エネルギに基づいて得られる、請求項１５記載のエンコーダ。
前記現在の雑音低帯域信号の前記平滑化された平均エネルギは対数領域で得られ、前記現在の雑音高帯域信号の前記平滑化された平均エネルギは対数領域で得られる、請求項１６記載のエンコーダ。
前記プロセッサが：
前記第１の比率の対数値及び前記第２の比率の対数値を別個に計算し、
前記第１の比率の前記対数値と前記第２の比率の前記対数値との間の差の絶対値を計算して前記偏差を取得するよう構成されている、
請求項１４ないし１７のうちいずれか一項記載のエンコーダ。
前記プロセッサが：
前記現在の雑音低帯域信号の平滑化された平均エネルギの対数値を取得し、
前記現在の雑音高帯域信号の平滑化された平均エネルギの対数値を取得し、
前記現在の雑音低帯域信号の前記平滑化された平均エネルギの前記対数値と前記現在の雑音高帯域信号の平滑化された平均エネルギの前記対数値との間の差を計算することによって、前記第１の比率の前記対数値を取得するよう構成されている、
請求項１８記載のエンコーダ。
前記プロセッサが：
前記前の時点での前記前の雑音低帯域信号の平滑化された平均エネルギの対数値を取得し、
前記前の時点での前記前の雑音高帯域信号の平滑化された平均エネルギの対数値を取得し、
前記前の時点での前記前の雑音低帯域信号の平滑化された平均エネルギの前記対数値と前記前の時点での前記前の雑音高帯域信号の平滑化された平均エネルギの前記対数値との間の差を計算することによって、前記第１の比率の前記対数値を取得するよう構成されている、
請求項１８記載のエンコーダ。
コンピュータ実行可能命令を記憶している非一時的なメモリと；
前記非一時的なメモリに動作上結合されたプロセッサとを有するデコーダであって、前記プロセッサは前記コンピュータ実行可能命令を実行して：
現在の無音挿入記述子（ＳＩＤ）を取得するステップであって、前記現在のＳＩＤは雑音低帯域パラメータを含む、ステップ；
前記現在のＳＩＤが雑音高帯域パラメータを含むかどうかを判定するステップ；
前記現在のＳＩＤが前記雑音高帯域パラメータを含まないとき、前記現在のＳＩＤを復号化して、前記雑音低帯域パラメータを取得するステップと；
前記現在のＳＩＤが前記雑音高帯域パラメータを含まないとき、雑音高帯域パラメータを外挿するステップと；
前記現在のＳＩＤが前記雑音高帯域パラメータを含まないとき、前記復号化された雑音低帯域パラメータ及び前記外挿された雑音高帯域パラメータに基づいて第１の快適雑音（ＣＮ）フレームを取得するステップ；
前記現在のＳＩＤが前記雑音高帯域パラメータ及び前記雑音低帯域パラメータを含むとき、前記現在のＳＩＤを復号化して、前記雑音高帯域パラメータ及び前記雑音低帯域パラメータを取得するステップと；
前記現在のＳＩＤが前記雑音高帯域パラメータ及び前記雑音低帯域パラメータを含むとき、前記復号化された雑音高帯域パラメータ及び前記復号化された雑音低帯域に基づいて第２のＣＮフレームを取得するステップとを実行するよう構成されている、
デコーダ。
前記プロセッサがさらに：
前記現在のＳＩＤが第１の識別子を含むときに前記現在のＳＩＤが前記雑音高帯域パラメータを含むと判定し；
前記現在のＳＩＤが第２の識別子を含むときに前記現在のＳＩＤが前記雑音高帯域パラメータを含まないと判定するよう構成されており、
前記第１の識別子及び前記第２の識別子は前記現在のＳＩＤの一つのビットによって指示される、
請求項２１記載のデコーダ。
前記プロセッサがさらに：
前記現在のＳＩＤに対応する現在の時点での雑音高帯域信号の加重平均エネルギを取得し；
前記現在の時点での前記雑音高帯域信号の合成フィルタ係数を取得し；
前記現在の時点での前記雑音高帯域信号の前記取得した加重平均エネルギ及び前記現在の時点での前記雑音高帯域信号の前記取得した合成フィルタ係数に基づいて前記雑音高帯域信号を取得するよう構成されている、
請求項２１記載のデコーダ。
前記プロセッサがさらに：
復号化された前記雑音低帯域パラメータに基づいて前記第１のＣＮフレームの低帯域信号のエネルギを取得する動作と、
前の時点での雑音低帯域信号のエネルギに対する前記前の時点での雑音高帯域信号のエネルギの比率を表わす第１の比率を計算する動作であって、前記前の時点は、雑音高帯域パラメータを含む前のＳＩＤが前記現在のＳＩＤの前に受領された最後の時点に対応する、動作と、
前記第１のＣＮフレームの前記低帯域信号の前記エネルギ及び前記第１の比率に基づいて、前記現在の時点での前記雑音高帯域信号のエネルギを取得する動作と、
前記現在の時点での前記雑音高帯域信号の前記エネルギ及びローカルにバッファリングされたＣＮフレームの高帯域信号のエネルギに対して加重平均を実行して、前記現在の時点での前記雑音高帯域信号の前記加重平均エネルギを取得する動作であって、前記現在の時点での前記雑音高帯域信号の前記加重平均エネルギが前記第１のＣＮフレームの高帯域信号エネルギに対応する、動作とを実行するよう構成されている、
請求項２３記載のデコーダ。
前記プロセッサがさらに：
前記前の時点での前記雑音低帯域信号の加重平均エネルギに対する前記前の時点での前記雑音高帯域信号の加重平均エネルギの比率を前記第１の比率として計算する、又は、
前記前の時点での前記雑音低帯域信号の瞬時エネルギに対する前記前の時点での前記雑音高帯域信号の瞬時エネルギの比率を前記第１の比率として計算する
よう構成されている、請求項２４記載のデコーダ。
前記プロセッサがさらに：
前記現在のＳＩＤに隣接した履歴フレームが符号化音声フレームである場合、前記符号化音声フレームから復号化された高帯域信号の一部又は高帯域信号の平均エネルギが、外挿された前記雑音高帯域信号又は雑音高帯域信号の平均エネルギよりも小さいならば、前記現在のＳＩＤから開始して以降のＬ個のフレームの雑音高帯域信号に０よりも大きく１よりも小さい平滑化係数を乗算して、前記外挿された雑音高帯域信号の新しい加重平均エネルギを取得し、
復号化された前記雑音低帯域パラメータ、前記現在の時点での前記雑音高帯域信号の前記合成フィルタ係数、及び前記外挿された雑音高帯域信号の前記新しい加重平均エネルギに基づいて、前記第１のＣＮフレームを取得するよう構成されている、
請求項２３記載のデコーダ。
コンピュータによって実行されたときに該コンピュータに請求項１乃至１３の中のいずれか１項に記載されたステップを実行させるプログラム。