JP6612808B2

JP6612808B2 - 会話／音声信号処理方法および符号化装置

Info

Publication number: JP6612808B2
Application number: JP2017066354A
Authority: JP
Inventors: 晨胡; ▲澤▼新 ▲劉▼; 磊苗
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2012-06-29
Filing date: 2017-03-29
Publication date: 2019-11-27
Anticipated expiration: 2033-06-06
Also published as: WO2014000559A1; JP2020024461A; KR20160150107A; KR101790680B1; US20180336910A1; KR102005967B1; EP2851897A1; US20150095038A1; US11107486B2; EP2851897B1; CN103516440A; JP6892491B2; KR101689138B1; KR102331531B1; KR20150021100A; KR101907494B1; JP2015526754A; ES2930240T3; KR20170120209A; EP2851897A4

Description

本出願は、２０１２年６月２９日付けで出願された、“会話／音声信号処理方法および符号化装置”と題する中国特許出願第ＣＮ２０１２１０２２３０１４．０号に基づく優先権を主張し、この中国出願は、全体として参照することにより本明細書に援用される。

本発明は、通信技術に関し、特に、会話／音声信号処理方法および符号化装置に関する。

デジタル通信分野では、携帯電話通信、音声およびビデオ会議、放送テレビ、およびマルチメディアエンターテイメントのような会話、画像、音声、およびビデオ伝送に対する巨大なアプリケーション需要がある。会話／音声信号は、デジタル化され、通信ネットワークを使用することにより一方の端末から別の端末へ転送される。本明細書において端末は、携帯電話、デジタル電話端末、またはその他のタイプの会話および音声端末であり得る。デジタル電話端末は、たとえば、ＶＯＩＰ電話機、ＩＳＤＮ電話機、コンピュータ、またはケーブル通信電話機であり得る。会話／音声信号の格納または伝送プロセスにおいて占有される資源を削減するために、会話／音声信号は、送信端で圧縮され、受信端に送信され、受信端は、解凍処理によって会話／音声信号を復元し、会話／音声信号を再生する。

実際の会話通信処理においては、会話／音声信号の帯域幅は、頻繁に変化する。会話／音声信号の帯域幅変化をもたらす原因は、ネットワーク状態の変化であり得、会話／音声信号自体の帯域幅変化であり得、または、高周波信号と低周波信号との間で会話／音声信号の切り換えを引き起こし得る別の要因であり得る。会話／音声信号が高周波と低周波との間で切り換わる処理は、広帯域スイッチングと呼ばれる。

具体的には、ネットワーク状態は、頻繁に変化し、ネットワーク帯域幅は、ネットワーク状態が悪化するにつれて狭くなる。その結果、ネットワーク帯域幅の変化に伴って、会話／音声信号もまた、高周波信号と低周波信号との間で切り換わる必要がある。ネットワーク帯域幅が狭くなるとき、会話／音声信号は、高周波信号から低周波信号に変化する必要があり、ネットワーク状況が回復したとき、会話／音声信号は、低周波信号から高周波信号に回復する必要がある。高周波信号および低周波信号の帯域幅サイズは、相対的な概念である。たとえば、高周波信号の帯域幅が０〜１６ｋＨｚであり、低周波信号の帯域幅が０〜８ｋＨｚであり、または、高周波信号の帯域幅が０〜８ｋＨｚであり、低周波信号の帯域幅が０〜４ｋＨｚであり、高周波信号は、超広帯域信号でもあり、低周波信号は、広帯域信号でもある。

しかし、エンコーダで、従来技術を使用することにより広帯域スイッチングが実行された後、デコーダでは、不連続な会話／音声信号の問題が頻繁に発生し、その結果、音声通信サービス品質が下がる。

本発明の実施形態は、広帯域スイッチングに基づく会話／音声信号処理方法と符号化装置とを提供する。

本発明の実施形態は、広帯域スイッチングに基づく会話／音声信号処理方法を提供し、該方法は、
もし、第１の広帯域会話／音声信号が調和信号であるならば、第２の広帯域会話／音声信号が調和信号であると決定するための決定条件を、前記第２の広帯域会話／音声信号が調和信号であると決定する可能性を上昇させるように第１の決定条件を取得するために、調整する調整ステップであり、第１の広帯域会話信号が広帯域スイッチング前の信号であり、第２の広帯域会話信号が広帯域スイッチング後の信号である、調整ステップと、
第１の決定条件に従って、第２の広帯域会話／音声信号が調和信号であるか否かを決定する決定ステップと、を備える。

本発明の実施形態は、符号化装置をさらに提供し、該符号化装置は、
第１の広帯域会話／音声信号が調和信号であるならば、第２の広帯域会話／音声信号が調和信号であると決定するための決定条件を、前記第２の広帯域会話／音声信号が調和信号であると決定する可能性を上昇させるように第１の決定条件を取得するために、調整するように構成された決定条件調整モジュールであり、第１の広帯域会話信号が広帯域スイッチング前の信号であり、第２の広帯域会話信号が広帯域スイッチング後の信号である、決定条件調整モジュールと、
第１の決定条件に従って、第２の広帯域会話／音声信号が調和信号であるか否かを決定するように構成された信号タイプ決定モジュールと、を備える。

本発明の実施形態においては、符号化装置は、広帯域スイッチング前の第１の広帯域会話／音声信号が調和信号であるか否かを決定することができ、第１の広帯域会話／音声信号が調和信号であると決定されたとき、第２の広帯域会話／音声信号が調和信号であると決定する可能性をできるだけ上昇させるように第２の広帯域会話／音声信号が調和信号であるか否かを決定する条件を緩和するために、広帯域スイッチング後の第２の広帯域会話／音声信号の調和信号決定条件を調整する方法を使用することができる。従って、本発明の実施形態においては、広帯域スイッチングの場合に、会話／音声信号の信号タイプは、復号化器装置によって復号化される会話／音声信号の連続性ができるだけ確保され、会話通信サービス品質をさらに改善するように、スイッチングの前後で、できるだけ一致するように保たれる。

本発明の実施形態または従来技術における技術的解決手法をより明瞭に説明するために、実施形態または従来技術を説明するため必要とされる添付図面を以下で簡単に紹介する。当然ながら、以下の説明における添付図面は、本発明のいくつかの実施形態を示し、当業者は、創造的な努力なしでこれらの添付図面から他の図面をさらに導出し得る。

本発明による会話／音声信号処理方法の第１の実施形態のフローチャートである。本発明による会話／音声信号処理方法の第２の実施形態のフローチャートである。本発明による会話／音声信号処理方法の第３の実施形態のフローチャートである。本発明による会話／音声信号処理方法の第４の実施形態のフローチャートである。本発明による会話／音声信号処理方法の第５の実施形態のフローチャートである。本発明による符号化装置が配置されたエンコーダ機器の概略構成図である。本発明による符号化装置の第１の実施形態の概略構成図である。本発明による符号化装置の第２の実施形態の概略構成図である。

本発明の実施形態の目的、技術的解決手法、および利点をより明瞭にするために、以下では、本発明の実施形態における添付図面を参照して本発明の実施形態における技術的解決手法を明瞭かつ完全に説明する。当然ながら、説明された実施形態は、本発明の実施形態の全部というよりもむしろ一部である。創造的な努力なしで本発明の実施形態に基づいて当業者によって達成されるすべての他の実施形態は、本発明の保護範囲に含まれる。

本発明による会話／音声信号処理方法は、音声コーダに適用され得る。デジタル信号処理の分野においては、音声コーデックは、様々な電子機器、たとえば、携帯電話、無線装置、個人情報端末（ＰＤＡ）、ハンドヘルドもしくはポータブルコンピュータ、ＧＰＳ受信機／ナビゲータ、カメラ、音声／ビデオプレーヤ、カムコーダ、ビデオレコーダ、および監視機器に広く適用される。通常、このタイプの電子機器は、音声コーダまたは音声デコーダを含み、音声コーダもしくはデコーダは、デジタル回路もしくはチップ、たとえば、ＤＳＰ（デジタル信号プロセッサ）によって直接実装され得、または、ソフトウェアコードにおけるプロセスを実行するようにプロセッサを駆動するソフトウェアコードによって実装され得る。

図１は、本発明による会話／音声信号処理方法の第１の実施形態のフローチャートである。図１に示されるように、本実施形態による方法は、以下を含み得る。

ステップ１０１：第１の広帯域会話／音響信号が調和信号であるならば、第２の広帯域会話／音声信号が調和信号であると決定するための決定条件を、第２の広帯域会話／音声信号が調和信号であると決定する可能性を上昇させるように第１の決定条件を取得するために、調整する。

第１の広帯域会話／音声信号は、広帯域スイッチング前の会話／音声信号であり、第２の広帯域会話／音声信号は、広帯域スイッチング後の会話／音声信号である。

ステップ１０２：第１の決定条件に従って、第２の広帯域会話／音声信号が調和信号であるか否かを決定する。

具体的には、高周波信号は、超広帯域信号であり得、また、低周波信号は、広帯域信号であり得る。当業者は、要件に従って、或る帯域幅レンジより上の信号を超広帯域信号として、そして、或る帯域幅レンジ以下の信号を高帯域幅信号として自ら定義し得る。たとえば、０〜８ｋＨｚの帯域幅レンジより上の信号が超広帯域信号であり、そして、０〜８ｋＨｚの帯域幅レンジ以下の信号が広帯域信号である、と設定され得る。エンコーダでの符号化中に、超広帯域信号は、調和信号、コモン信号、過渡信号およびノイズ信号に分類され得、広帯域信号は、調和信号およびコモン信号に分類され得る。

本実施形態における第１の広帯域会話／音声信号は、超広帯域信号であり得、スイッチング後の第２の広帯域会話／音声信号は、広帯域信号であり得、または、第１の広帯域会話／音声信号は、広帯域信号であり得、スイッチング後の第２の広帯域会話／音声信号は、超広帯域信号であり得る。超広帯域信号について、その信号タイプは、調和信号、コモン信号、過渡信号、およびノイズ信号のうちの１つであり得、広帯域信号について、その信号タイプは、調和信号およびコモン信号のうちの１つであり得る。超広帯域信号について、符号化装置は、超広帯域信号の信号タイプを決定するために超広帯域信号に対応する調和信号決定条件を使用し得、広帯域信号について、符号化装置は、広帯域信号の信号タイプを決定するために広帯域信号に対応する調和信号決定条件を使用し得る。従来技術において、超広帯域信号に対応する調和信号決定条件および広帯域信号に対応する調和信号決定条件はいずれも、調和信号の決定中に、前のフレームの信号に関する情報を基準情報として使用する必要がある。

発明者は、従来技術の実施プロセスにおいて、エンコーダでの広帯域スイッチングの場合、もし、広帯域スイッチング前の会話／音声信号が超広帯域信号の調和信号もしくは広帯域信号の調和信号であるならば、断続的な会話がデコーダで頻繁に発生し、このことは、それによって、ユーザの通常の通信に影響を与え、会話通信サービス品質を下げることに気付いた。

入念な研究の後、発明者は、前述の問題の主要因が、超広帯域信号に対応する調和信号決定条件および広帯域信号に対応する調和信号決定条件がいずれも、調和信号の決定中に、前のフレームの信号に関する情報を基準情報として使用することが必要であるが、しかし、広帯域スイッチングが発生するとき、信号帯域幅が変化するので、広帯域スイッチングの前後の信号のエネルギーおよび周波数帯域が著しく異なることにある、ということに気付いた。この変化に基づいて、もし、符号化装置が、広帯域スイッチング前の信号を、広帯域スイッチング後の信号のタイプを決定するための基準情報としてそれでもなお使用するならば、符号化装置は、広帯域スイッチング中に信号タイプの切り換えを実行し得る。たとえば、広帯域スイッチング前の会話／音声信号は、調和信号であり、しかし、広帯域スイッチング後の会話／音声信号は、過渡信号であると決定され得る。エンコーダは、広帯域スイッチング前の調和信号を符号化するために調和信号の符号化方法を使用し得、広帯域スイッチング後の非調和信号を符号化するために非調和信号の符号化方法を使用し得る。

その後、エンコーダは、符号化された信号をデコーダに送信し得、デコーダは、調和信号および非調和信号を復元するために、符号化された信号を受信した後、符号化された信号を復号化するために対応する復号化方法を使用し得る。信号特徴の点において、調和信号と非調和信号との間には著しい差が存在するので、２つの信号の出力は、デコーダにおいてユーザによって聞かれる会話／音声信号を断続的にする。非調和信号、すなわち、ノイズ信号と、過渡信号と、コモン信号の３つの信号タイプの間のスイッチングに関しては、デコーダ機器について、復号化された会話／音声信号は、著しく影響されない。

従って、本実施形態においては、符号化装置は、広帯域スイッチング前の第１の広帯域会話／音声信号が調和信号であるか否かを決定することができる。もし、広帯域スイッチング前の第１の広帯域会話／音声信号が調和信号であるならば、符号化装置は、広帯域スイッチング後の第２の広帯域会話／音声信号が調和信号であると決定する可能性を上昇させるために、調和信号決定条件を調整する方式を使用し得る。従って、広帯域スイッチングの場合、会話／音声信号の信号タイプは、会話／音声信号の連続性をできるだけ確保するために、デコーダ機器で受信された会話／音声信号の信号タイプが広帯域スイッチングの前後で一致するように、すなわち、同じ復号化方式が復号化のため使用できるように、広帯域スイッチング後の会話／音声信号の決定中にできるだけ変更されない。第２の広帯域会話／音声信号の信号タイプは、スイッチング後の第２の広帯域会話／音声信号が緩和させられた調和信号決定条件を満たさないときに限り、すなわち、第２の広帯域会話／音声信号中の調和成分がかなり少ないときに限り、変更される。本実施形態では、もし、第１の広帯域会話／音声信号が超広帯域信号であるならば、第２の広帯域会話／音声信号は、広帯域信号であり、もし、第１の広帯域会話／音声信号が広帯域信号であるならば、第２の広帯域会話／音声信号は、超広帯域信号である。

第１の広帯域会話／音声信号が超広帯域信号であり、第２の広帯域会話／音声信号が広帯域信号である一例においては、符号化装置は、広帯域スイッチング前の超広帯域信号が調和信号であるか否かを決定するために超広帯域信号に対応する調和信号決定条件を使用し得、非調和信号は、過渡信号、ノイズ信号およびコモン信号のうちの１つである。もし、決定の結果が調和信号であるならば、符号化装置は、第１の決定条件を取得するために広帯域信号に対応する調和信号決定条件を緩和し得、第１の決定条件に従って、広帯域スイッチング後の広帯域信号が調和信号であるか否かを決定し得る。広帯域信号に対応する調和信号決定条件が緩和されるので、スイッチング後の広帯域信号が調和信号であると決定する可能性が増加され、そのため、広帯域スイッチング前後の信号タイプができるだけ変えられることがなく、さらに、デコーダ機器によって復号化された会話／音声信号の連続性ができるだけ確保される。

なお、当業者は、超広帯域信号に対応する調和信号決定条件および広帯域信号に対応する調和信号決定条件を、会話／音声信号処理方法に従って設計し得、または、規格に規定された調和信号決定条件を使用し得、本実施形態において限定されることはない。

本実施形態においては、符号化装置は、広帯域スイッチング前の第１の広帯域会話／音声信号が調和信号であるか否かを決定することができ、第１の広帯域会話／音声信号が調和信号であると決定されたとき、第２の広帯域会話／音声信号が調和信号であると決定する可能性をできるだけ上昇させるように、広帯域スイッチング後の第２の会話／音声信号が調和信号であるか否かを決定する条件を緩和するために、広帯域スイッチング後の第２の広帯域会話／音声信号の調和信号決定条件を調整する方式を使用することができる。従って、本実施形態においては、広帯域スイッチングの場合、会話／音声信号の信号タイプは、デコーダ機器によって復号化された会話／音声信号の連続性ができるだけ確保され、さらに、会話通信サービス品質が改善されるように、スイッチングの前後で、できるだけ一致するように保たれる。

図１に示された方法実施形態に基づいて、もし、符号化装置が第１の広帯域会話／音声信号は調和信号ではないと決定するならば、符号化装置が図１に示された方法実施形態におけるステップ１０２を実行する前に、該方法は、
第２の広帯域会話／音声信号が調和信号であると決定する可能性を減少させるように第２の決定条件を取得するために、調和信号決定条件を調整する調整ステップと、第２の決定条件に従って、第２の広帯域会話／音声信号が調和信号であるか否かをさらに決定する決定ステップと、をさらに含み得る。

具体的には、もし、符号化装置が広帯域スイッチング前の第１の広帯域会話／音声信号は調和信号ではないと決定するならば、符号化装置は、第２の広帯域会話／音声信号が調和信号であると決定する可能性を減少させるように第２の広帯域会話／音声信号が調和信号であると決定するための決定閾値を増加させるために、調和信号決定条件を調整する方式を使用し得る。すなわち、もし、広帯域スイッチング前の第１の広帯域会話／音声信号が非調和信号、たとえば、ノイズ信号、過渡信号、もしくはコモン信号であるならば、大部分は、調和信号決定閾値を増加させることにより、広帯域スイッチング後の第２の広帯域会話／音声信号は、調和信号ではなく、ノイズ信号、過渡信号、またはコモン信号であると決定され得る。エンコーダは、できるだけ、広帯域スイッチング中に会話／音声信号の信号タイプを変えることがなく、デコーダによって復号化された会話／音声信号の連続性は、できるだけ確保されることができる。

前述のとおり、もし、第１の広帯域会話／音声信号が超広帯域信号であるならば、第２の広帯域会話／音声信号は広帯域信号であり、もし、第１の広帯域会話／音声信号が広帯域信号であるならば、第２の広帯域会話／音声信号は超広帯域信号である。以下では、異なった広帯域スイッチング状況に対して異なった実施形態を使用することにより、本発明の技術的解決手法について詳細に説明する。

第一に、以下の実施形態において使用される、超広帯域信号に対応する調和信号決定条件および非調和信号決定条件と、広帯域信号に対応する調和信号決定条件および非調和信号決定条件とを詳細に説明する。なお、以下の実施形態では、会話／音声信号が調和信号であるか、または、非調和信号であるかを決定するために実施例として、規格に規定された信号タイプ決定条件が使用される。当業者は、これらの決定条件が会話／音声信号処理方法に従って変えられ得ることを理解し得る。

超広帯域信号について、超広帯域信号の信号タイプを決定するために、以下の方法が使用され得る。

（１）時間ドメイン信号の複数のセグメントを取得し、時間ドメイン信号の各セグメントに対する時間包絡線パラメータを決定するするために、現在の会話／音声信号を複数の信号セグメントに分割する。オプション的に、時間ドメイン信号の各セグメントに対する時間包絡線パラメータ値が決定される前に、時間ドメイン信号の各セグメントは、時間包絡線パラメータ値を決定するため使用される時間ドメイン信号を取得するために、会話／音声信号全体における、時間ドメイン信号の各セグメントの重要度に従って、比例係数が乗じられることもあり得る。

（２）時間ドメイン信号の複数の時間包絡線パラメータ値のうちの１つの時間包絡線パラメータ値が、会話／音声信号の数個の前の包絡線値の加重和を実行し、その後、この結果にプリセット値を乗じることにより取得される所定の包絡線閾値Ｔ１より大きいか否かを決定する。

（３）もし、少なくとも１つの時間包絡線閾値がＴ１より大きいならば、現在の会話／音声信号は過渡信号であると決定する。

ステップ１からステップ３は、過渡信号決定条件である。

（４）もし、いずれの時間包絡線閾値もＴ１より大きくないならば、現在の会話／音声信号の周波数ドメイン信号を複数の周波数帯域に分割し、各周波数帯域の１つの周波数ドメイン振幅ピーク値を計算し、その後、周波数ドメイン振幅ピーク値、複数の周波数帯域の周波数ドメイン振幅ピーク値の平均値、および周波数帯域幅に従って、各周波数帯域の調和特性値を計算する。

（５）各周波数帯域の調和特性値が所定の閾値より大きいか否か、および、各周波数帯域の周波数ドメイン振幅ピーク値が所定の閾値Ｔ２より大きいか否か、を決定する。もし、各周波数帯域の調和特性値および各周波数帯域の周波数ドメイン振幅ピーク値が共に所定の閾値より大きいならば、周波数帯域が調和周波数帯域であると決定し、ステップ６を実行し、そうでないならば、調和特性値が所定の閾値Ｔ３未満であるか否かをさらに決定する。もし、調和特性値が所定の閾値Ｔ３未満であるならば、周波数帯域がノイズ周波数帯域であると決定し、そうでないならば、周波数帯域がコモン周波数帯域であると決定する。

（６）最大ピーク値パラメータの値、すなわち、あらゆる周波数帯域の振幅ピーク値の最大値を決定し、調和周波数帯域の量およびノイズ周波数帯域の量を計算し、前の会話／音声信号のグローバルエネルギーに対する現在の会話／音声信号のグローバルエネルギーの比を計算する。

（７）最大ピーク値パラメータの値が所定の閾値Ｔ４より大きいか否か、調和周波数帯域の量が所定の閾値Ｔ５より大きいか否か、および、グローバルエネルギー比が所定の閾値レンジ（Ｔ６，Ｔ７）に含まれるか否か、を決定する。もし、すべての決定結果が肯定的であるならば、現在の会話／音声信号は調和信号であると決定し、調和モードカウンタを更新し、たとえば、調和モードカウンタのカウント値に１を加える。

（８）３つすべての決定条件が肯定的であるとは限らないならば、調和モードカウンタを更新し、たとえば、調和モードカウンタのカウント値から１を減算し、この場合、調和モードカウント値が所定の閾値Ｔ８より大きいか否かを決定する。もし、肯定的であるならば、現在の会話／音声信号は調和信号であると決定する。

ステップ４からステップ８は、調和信号決定条件である。

なお、調和モードカウンタは、オプション的な機能である。現在の会話／音声信号の最大ピーク値パラメータの値が所定の閾値Ｔ４以下であり、調和周波数帯域の量が所定の閾値Ｔ５以下であり、グローバルエネルギー比が所定のレンジ（Ｔ６，Ｔ７）に含まれないとき、調和モードカウンタは、現在の会話／音声信号が調和信号であるか否かを決定する基準として使用され得る。もし、前に累積された調和信号の量が所定の閾値Ｔ８を超えるならば、それは、連続的な会話／音声信号が一層高い可能性で調和信号であることを示し、この場合、上記３つの条件が満たされなくても、現在の会話／音声信号が調和信号であると決定されることもあり得る。

（９）もし、そうでないならば、ノイズ周波数帯域の量および別のノイズ関連パラメータが条件を満たすか否かをさらに決定する。もし、ノイズ周波数帯域の量および別のノイズ関連パラメータが条件を満たすならば、現在の会話／音声信号はノイズ信号であると決定し、そうでないならば、現在の会話／音声信号はコモン信号であると決定する。

広帯域信号について、調和信号およびコモン信号だけが識別される必要がある。しかし、広帯域スイッチングプロセスにおいて、調和信号決定条件は、超広帯域信号を決定する原理に類似し、具体的には、以下のとおりである。

現在の会話／音声信号が調和信号であるか否かを決定するとき、符号化装置は、調和周波数帯域の量および最大ピーク値パラメータの値がそれぞれ所定の閾値Ｔ４およびＴ５より大きいか否かを決定することだけが必要であり、もし、肯定的であるならば、現在の会話／音声信号が調和信号であると決定し、調和モードカウンタの値を増加させ、たとえば、調和モードカウンタのカウント値に１を加算し、あるいは、もし、両方が同時に満たされることができないならば、調和モードカウンタの値を減少させ、たとえば、調和モードカウンタのカウント値から１を減算し、その後、調和モードカウンタのカウント値が所定の閾値Ｔ８より大きいか否かを決定し、もし、肯定的であるならば、現在の会話／音声信号は調和信号であると決定し、または、もし、否定的であるならば、現在の会話／音声信号はコモン信号であると決定する。

広帯域信号および超広帯域信号の信号タイプの決定についての上記説明に基づいて、以下では、本発明の技術的解決手法について詳細に説明する。

図２は、本発明による会話／音声信号処理方法の第２の実施形態のフローチャートである。本実施形態においては、第１の広帯域会話／音声信号は超広帯域信号であり、第２の広帯域会話／音声信号は広帯域信号であり、広帯域スイッチングは、超広帯域信号から広帯域信号への切り換えである。図２に示されるように、本実施形態における方法は、以下を含む。

ステップ２０１：調和周波数帯域の量および広帯域スイッチング後の広帯域信号のサイダピーク値パラメータを計算する。

このステップは、上記ステップ６を使用することにより実装され得、従って、さらなる詳細は、ここでは説明しない。

ステップ２０２：調和周波数帯域の量、最大ピーク値パラメータ、および広帯域信号のための調和信号決定条件に従って調和モードカウント値を更新する。

このステップは、たとえば、上記ステップ７を使用することにより実装され得る。なお、広帯域信号について、グローバルエネルギー比は計算される必要がないが、調和モードカウンタを更新できるように、広帯域信号のための調和信号決定条件における調和周波数帯域の量および最大ピーク値パラメータの決定だけが使用される。もし、調和周波数帯域の量が所定の閾値Ｔ５より大きく、かつ、最大ピーク値パラメータが所定の閾値Ｔ４より大きいならば、広帯域スイッチング後の広帯域信号が調和信号であると決定され得、その後、１が調和モードカウンタの値に加算され得、もし、調和周波数帯域量が所定の閾値Ｔ５以下である、および／または、最大ピーク値パラメータが所定の閾値Ｔ４以下であるならば、広帯域スイッチング後の広帯域信号は、非調和信号であると決定され得、その後、１が調和モードカウンタの値から減算され得る。従って、広帯域スイッチング後の広帯域信号が調和信号であるか、または、非調和信号であるかを決定することは、広帯域信号の客観的信号タイプに基づいており、この広帯域信号の更新された調和モードカウントは、後続の会話／音声信号の決定中に基準として使用されることのできる、前の会話／音声信号の客観的情報であることを学ぶことができる。

ステップ２０３：広帯域スイッチング前の超広帯域信号が調和信号であるか否かを決定する。もし、肯定的であるならば、ステップ２０４を実行し、もし、否定的であるならば、ステップ２０６を実行する。

なお、ステップ２０３は、ステップ２０４より前に実行される必要があるが、必ずしもステップ２０１またはステップ２０２の後に実行されない。実際の処理プロセスでは、ステップ２０３は、広帯域スイッチングの前に実行されることができる。

ステップ２０４：広帯域信号のための調和信号決定条件における調和周波数帯域量閾値および最大ピーク値パラメータ閾値のうちの少なくとも一方の閾値を下げる。

広帯域スイッチング前の超広帯域信号は、調和信号であるので、広帯域スイッチング後の広帯域信号が調和信号であると決定する条件は、ステップ２０４において緩和される必要がある。本実施形態においては、広帯域信号のための調和信号決定条件における調和周波数帯域量閾値Ｔ５および最大ピーク値パラメータ閾値Ｔ４のうちの少なくとも一方の閾値は、減少させられ得る。Ｔ４およびＴ５を共に減少させる調整方式について、調和信号決定条件の緩和度は、Ｔ４だけ、もしくは、Ｔ５だけを減少させる調整方式と比べると、相対的により大きいことが理解され得る。本実施形態においては、減少した調和周波数帯域量閾値は、Ｔ５１＜Ｔ５であるＴ５１として表され、減少した最大ピーク値パラメータ閾値は、Ｔ４１＜Ｔ４であるＴ４１として表される。たとえば、Ｔ５１は、Ｔ５の半分であり得、Ｔ４１は、Ｔ４の半分であり得る。

当業者は、Ｔ５１およびＴ４１の具体的な値は、調和信号決定要件に従って設定され得ることを理解し得る。たとえば、もし、或る調和特徴をもつ広帯域信号が調和信号であるとできるだけ決定される必要があるならば、Ｔ５１およびＴ４１は、より小さい値に調整され得、それによって、調和信号決定条件を大幅に緩和する。

ステップ２０５：もし、調和周波数帯域の量が、減少した調和周波数帯域量閾値より大きい、および／または、最大ピーク値パラメータが、減少した最大ピーク値パラメータ閾値より大きいならば、広帯域信号は調和信号であると決定する。

調和信号決定条件が緩和された後、もし、調和周波数帯域量がＴ５１より大きい、および、最大ピーク値パラメータがＴ４１より大きいという２つの条件のうちのいずれかの条件が満たされるならば、広帯域スイッチング後の広帯域信号は調和信号であると決定されることができる。なお、調和信号が従来技術において実行されるとき、調和周波数帯域量がＴ５１より大きい、および、最大ピーク値パラメータがＴ４１より大きいという２つの条件が共に満たされる必要があるが、本実施形態においては、決定閾値Ｔ５およびＴ４が減少させられるだけでなく、広帯域スイッチング後の信号は、調和周波数帯域量がＴ５１より大きい、および、最大ピーク値パラメータがＴ４１より大きいという２つの条件のうちのいずれかの条件が満たされたときに調和信号であると決定され得、それによって、調和信号決定条件がさらに緩和される。

調和周波数帯域量がＴ５１以下であり、最大ピーク値パラメータがＴ４１以下である、すなわち、上記２つの条件がいずれも満たされない場合、本実施形態においては、決定は、調和モードカウンタの値に従って実行され得る。もし、調和モードカウント値がプリセット値Ｔ８より大きいならば、広帯域スイッチング後の広帯域信号は、調和信号である。

ステップ２０６：広帯域信号のための調和信号決定条件における調和周波数帯域領域値および最大ピーク値パラメータ閾値のうちの少なくとも一方の閾値を増加させる。

広帯域スイッチング前の超広帯域信号は、非調和信号、たとえば、過渡信号であるので、広帯域スイッチング後の広帯域信号が調和信号であると決定する条件は、ステップ２０６において増加させられる必要がある。本実施形態においては、広帯域信号のための調和信号決定条件における調和周波数帯域量閾値Ｔ５および最大ピーク値パラメータ閾値Ｔ４のうちの少なくとも一方の閾値が、増加させられ得る。Ｔ４およびＴ５を共に増加させる調整方式について、調和信号決定条件の増加度は、Ｔ４だけを増加、もしくは、Ｔ５だけを増加させる調整方式と比べると、相対的により大きいことが理解され得る。本実施形態においては、増加した調和周波数帯域量閾値は、Ｔ５２＜Ｔ５であるＴ５２として表され、増加した最大ピーク値パラメータ閾値は、Ｔ４２＜Ｔ４であるＴ４２として表される。たとえば、Ｔ５１は、Ｔ５の２倍であり得、Ｔ４１は、Ｔ４の２倍であり得る。

当業者は、Ｔ５２およびＴ４２の具体的な値もまた調和信号決定要件に従って設定され得ることを理解し得る。たとえば、もし、比較的多数の調和特徴をもつ広帯域信号が調和信号であると決定されることが必要であるならば、Ｔ５２およびＴ４２は、歴然たる調和特徴をもつ広帯域が調和信号と決定され得るように、より大きい値に調整され得る。

ステップ２０７：もし、調和周波数帯域の量が増加した調和周波数帯域量閾値より大きい、および／または、最大ピーク値パラメータが増加した最大ピーク値パラメータ閾値より大きいならば、広帯域信号は調和信号であると決定する。

調和信号決定条件が増加させられた後、もし、調和周波数帯域量がＴ５２より大きい、および、最大ピーク値パラメータがＴ４２より大きいという２つの条件のうちのいずれかの条件が満たされるならば、広帯域スイッチング後の広帯域信号は調和信号であると決定され得る。

調和周波数帯域の量がＴ５２以下であり、かつ、最大ピーク値パラメータがＴ４２以下である、すなわち、上記２つの条件がいずれも満たされない場合、本実施形態において、調和モードカウンタの値に従って決定が行われることもあり得る。もし、調和モードカウント値がプリセット値Ｔ８より大きいならば、広帯域スイッチング後の広帯域信号は調和信号であると決定されることもあり得る。

本実施形態において、広帯域スイッチングがエンコーダで発生するとき、符号化装置は、広帯域スイッチング前の超広帯域信号が調和信号であるか、または、非調和信号であるかを決定することができ、もし、超広帯域信号が調和信号であるならば、符号化装置は、広帯域スイッチング後の広帯域信号が調和信号であるとできるだけ決定するように、信号の調和成分を表すために使用される調和周波数帯域量および／または最大ピーク値パラメータの閾値を低下させ得、もし、超広帯域信号が非調和信号であるならば、符号化装置は、広帯域スイッチング後の広帯域信号が非調和信号であるとできるだけ決定するように、調和周波数帯域量および／または最大ピーク値パラメータのため使用される決定閾値を上昇させ得る。加えて、調和信号決定条件が調整された後、たとえ、広帯域スイッチング後の広帯域信号が上記条件を満たさなくても、決定は、調和モードカウンタを用いてさらに実行され得る。従って、本実施形態においては、広帯域スイッチング中に、信号タイプは、できるだけ変えられることがなく、従って、デコーダで受信された会話／音声信号の連続性ができるだけ確保され得る。

図３は、本発明による会話／音声信号処理方法の第３の実施形態のフローチャートである。本実施形態においては、第１の広帯域会話／音声信号は広帯域信号であり、第２の広帯域会話／音声信号は超広帯域信号であり、広帯域スイッチングは、広帯域信号から超広帯域信号への切り換えである。図３に示されるように、本実施形態における方法は、以下を含み得る。

ステップ３０１：広帯域スイッチング後の超広帯域信号の調和周波数帯域の量および最大ピーク値パラメータを計算し、超広帯域信号に対する調和周波数帯域の量、最大ピーク値パラメータ、および調和信号決定条件に従って、調和モードカウント値を更新する。

ステップ３０１について、超広帯域信号の信号タイプを決定するプロセスに関連する上記実装を参照するので、詳細は、ここでは説明しない。

ステップ３０２：超広帯域信号が過渡信号ではないことをデフォルトで決定し、広帯域スイッチング前の広帯域信号のグローバルエネルギーに対する超広帯域信号のグローバルエネルギーの比がプリセット範囲に含まれることをデフォルトで決定する。

本実施形態において、広帯域スイッチングは、広帯域信号から超広帯域信号へのスイッチングであり、超広帯域信号は、４個の信号タイプを含み、広帯域信号のための調和信号決定条件と比べると、広帯域スイッチング前の広帯域信号のグローバルエネルギーに対する広帯域スイッチング後の超広帯域信号のグローバルエネルギーの比が、超広帯域信号のための調和信号決定条件として追加されている。従って、本実施形態においては、決定条件を簡単化するために、ステップ１からステップ３は、実行されないことがあり得、ステップ３０２において、広帯域スイッチング後の超広帯域信号は、過渡信号ではないとデフォルトで決定され、広帯域スイッチング前の広帯域信号のグローバルエネルギーに対する広帯域スイッチング後の超広帯域信号のグローバルエネルギーの比は、プリセットレンジ（Ｔ６，Ｔ７）に含まれるとデフォルトでまた決定され得る。

ステップ３０３：広帯域スイッチング前の広帯域信号が調和信号であるか否かを決定する。もし、肯定的であるならば、ステップ３０４を実行し、もし、否定的であるならば、ステップ３０６を実行する。

ステップ３０４：超広帯域信号のための調和信号決定条件における調和周波数帯域量閾値および最大ピーク値パラメータ閾値のうちの少なくとも一方の閾値を低下させる。

広帯域スイッチング前の広帯域信号が調和信号であるので、広帯域スイッチング後の超広帯域信号が調和信号であると決定する条件は、ステップ３０４において緩和される必要がある。本実施形態においては、超広帯域信号のための調和信号決定条件における調和周波数帯域量閾値Ｔ５および最大ピーク値パラメータ閾値Ｔ４のうちの少なくとも一方の閾値が減少させられ得る。減少した調和周波数帯域量閾値は、Ｔ５１としてまた表され、減少した最大ピーク値パラメータ閾値は、Ｔ４１としてまた表される。

ステップ３０５：もし、調和周波数帯域の量が減少した調和周波数帯域量閾値より大きい、および／または、最大ピーク値パラメータが減少した最大ピーク値パラメータ閾値より大きいならば、超広帯域信号は調和信号であると決定する。

調和信号決定条件が緩和された後、もし、調和周波数帯域の量が減少した調和周波数帯域量閾値より大きい、および、最大ピーク値パラメータが減少した最大ピーク値パラメータ閾値より大きいという２つの条件のうちのいずれかの条件が満たされるならば、広帯域スイッチング後の超広帯域信号は調和信号であると決定され得る。

調和周波数帯域の量がＴ５２以下であり、かつ、最大ピーク値パラメータがＴ４２以下である、すなわち、上記２つの条件がいずれも満たされない場合、本実施形態において、調和モードカウンタの値に従って決定が行われることもあり得る。もし、調和モードカウント値がプリセット値Ｔ８より大きいならば、広帯域スイッチング後の超広帯域信号は調和信号である。

ステップ３０６：超広帯域信号のための調和信号決定条件における調和周波数帯域量閾値および最大ピーク値パラメータ閾値のうちの少なくとも一方の閾値を増加させる。

ステップ３０７：もし、調和周波数帯域の量が増加した調和周波数帯域閾値より大きい、および／または、最大ピーク値パラメータが増加した最大ピーク値パラメータ閾値より大きい場合、超広帯域信号は調和信号であると決定する。

調和信号決定条件が増加させられた後、もし、調和周波数帯域の量が、増加した調和周波数帯域量閾値Ｔ５２より大きい、および、最大ピーク値パラメータが、増加した最大ピーク値パラメータ閾値Ｔ４２より大きい、という２つの条件のうちのいずれかの条件が満たされるならば、広帯域スイッチング後の超広帯域信号は調和信号であると決定され得る。

調和周波数帯域の量がＴ５２以下であり、かつ、最大ピーク値パラメータがＴ４２以下である、すなわち、上記２つの条件のいずれもが満たされない場合、本実施形態においては、調和モードカウンタの値に従って決定が実行されることもあり得る。もし、調和モードカウント値がプリセット値Ｔ８より大きいならば、広帯域スイッチング後の超広帯域信号は調和信号であると決定されることもあり得る。

代替的に、本実施形態においては、ステップ１から３は、広帯域スイッチング後の超広帯域信号が過渡信号であるか否かを決定するために、実行されることもあり得る。加えて、信号連続性を確保するために、過渡信号決定条件は、実際に相対的に著しい過渡特徴を有する超広帯域信号が過渡信号であると決定され得るように、本実施形態においては増加され得る。

実際の実装においては、符号化装置は、超広帯域信号の時間包絡線パラメータを計算するために以下のステップ１を使用し、時間系列包絡線閾値Ｔ１をステップ２において増加させ得、増加した包絡線閾値は、Ｔ１１として表され得、もし、時間包絡線パラメータがＴ１１より大きいならば、超広帯域信号が過渡信号であると決定され得る。たとえば、もし、広帯域スイッチング前の広帯域信号が調和信号であるならば、包絡線閾値は、３倍に増加され得、もし、広帯域スイッチング前の広帯域信号が非調和信号であるならば、包絡線閾値は、２倍に増加され得る。

本実施形態においては、広帯域スイッチングがエンコーダで発生するとき、符号化装置は、広帯域スイッチング前の広帯域信号が調和信号であるか、または、非調和信号であるかを決定し得、もし、広帯域信号が調和信号であるならば、符号化装置は、広帯域スイッチング後の超広帯域信号が調和信号であるとできるだけ決定されるように、信号の調和成分を表すため使用される調和周波数帯域量および／または最大ピーク値パラメータの決定閾値を低下させ得、もし、広帯域信号が非調和信号であるならば、符号化装置は、広帯域スイッチング後の超広帯域信号が非調和信号であるとできるだけ決定されるように、調和周波数帯域量および／または最大ピーク値パラメータのため使用される決定閾値を上昇させ得る。加えて、調和信号決定条件が調整された後、たとえ、広帯域スイッチング後の超広帯域信号が上記条件を満たすことがなくても、決定は、調和モードカウンタを用いてさらに実行されることがあり得る。従って、本実施形態においては、広帯域スイッチング中に、信号タイプは、できるだけ変えられることがなく、従って、デコーダで受信された会話／音声信号の連続性は、できるだけ確保され得る。

図４は、本発明による広帯域スイッチングに基づく信号処理方法の第４の実施形態のフローチャートである。本実施形態においては、第１の広帯域会話／音声信号は超広帯域信号であり、第２の広帯域会話／音声信号は広帯域信号であり、広帯域スイッチングは、超広帯域信号から広帯域信号への切り換えである。図4に示されるように、本実施形態における方法は、以下を含み得る。

ステップ４０１：広帯域スイッチング後の広帯域信号の調和周波数帯域の量および最大ピーク値パラメータを計算する。

ステップ４０２：調和周波数帯域の量、最大ピーク値パラメータ、および広帯域信号のための調和信号決定条件に従って調和モードカウント値を更新する。

ステップ４０３：広帯域スイッチング前の超広帯域信号が調和信号であるか否かを決定する。もし、肯定的であるならば、ステップ４０４を実行し、もし、否定的であるならば、ステップ４０５を実行する。

ステップ４０１から４０３について、図２に示された実施形態におけるステップ２０１からステップ２０３を実行するプロセスを参照するので、詳細は、ここでは説明しない。

ステップ４０４：広帯域スイッチング後の広帯域信号が調和信号であると決定する。

ステップ４０５：広帯域スイッチング後の広帯域信号が非調和信号であると決定する。

本実施形態と図２に示された方法実施形態との間の違いは、図２に示された方法実施形態においては、広帯域スイッチング後の広帯域信号が調和信号であるか否かを決定するステップは、調和信号決定条件における決定閾値を調整することにより実行され、本実施形態においては、調和信号決定条件は、広帯域スイッチング前の超広帯域信号が調和信号である限り、広帯域スイッチング後の広帯域信号が調和信号であることがまた強制的に決定され、広帯域スイッチング前の超広帯域信号が非調和信号である限り、広帯域スイッチング後の広帯域信号が非調和信号であることがまた強制的に決定されるように調整されることにある。

本実施形態においては、広帯域スイッチングがエンコーダで発生するとき、符号化装置は、広帯域スイッチング前の超広帯域信号が調和信号であるか、または、非調和信号であるかを決定し得、もし、超広帯域信号が調和信号であるならば、符号化装置は、広帯域スイッチング後の広帯域信号が調和信号であると強制的に決定し、もし、超広帯域信号が非調和信号であるならば、符号化装置は、広帯域スイッチング後の広帯域信号が非調和信号であると強制的に決定する。従って、本実施形態においては、広帯域スイッチング中に、信号タイプが変えられることがなく、従って、会話／音声信号の連続性は、デコーダで受信された会話／音声信号に対してできるだけ確保され得る。

図５は、本発明による広帯域スイッチングに基づく信号処理方法の第５の実施形態のフローチャートである。本実施形態においては、第１の広帯域会話／音声信号は、広帯域信号であり、第２の広帯域会話／音声信号は、超広帯域信号であり、広帯域スイッチングは、広帯域信号から超広帯域信号への切り換えである。図５に示されるように、本実施形態における方法は、以下を含み得る。

ステップ５０１：広帯域スイッチング後の超広帯域信号の調和周波数帯域の量および最大ピーク値パラメータを計算し、超広帯域信号に対する調和周波数帯域の量、最大ピーク値パラメータ、および調和信号決定条件に従って、調和モードカウント値を更新する。

ステップ５０２：超広帯域信号が過渡信号ではないことをデフォルトで決定し、広帯域スイッチング前の広帯域信号のグローバルエネルギーに対する超広帯域信号のグローバルエネルギーの比がプリセット範囲に含まれることをデフォルトで決定する。

ステップ５０３：広帯域スイッチング前の広帯域信号が調和信号であるか否かを決定する。もし、肯定的であるならば、ステップ５０４を実行し、もし、否定的であるならば、ステップ５０５を実行する。

ステップ５０１から５０３について、図３に示された実施形態におけるステップ３０１からステップ３０３を実行するプロセスを参照するので、さらなる詳細は、ここでは説明しない。

ステップ５０４：広帯域スイッチング後の超広帯域信号が調和信号であると決定する。

ステップ５０５：広帯域スイッチング後の超広帯域信号が非調和信号であると決定する。

本実施形態と図３に示された方法実施形態との間の違いは、図３に示された方法実施形態においては、広帯域スイッチング後の超広帯域信号が調和信号であるか否かを決定するステップは、調和信号決定条件における決定閾値を調整することによって実行され、本実施形態においては、調和信号決定条件は、広帯域スイッチング前の広帯域信号が調和信号である限り、広帯域スイッチング後の超広帯域信号が調和信号であることがまた強制的に決定され、広帯域スイッチング前の広帯域信号が非調和信号である限り、広帯域スイッチング後の超広帯域信号が非調和信号であることがまた強制的に決定されるように調整されることにある。

本実施形態においては、広帯域スイッチングがエンコーダで発生するとき、符号化装置は、広帯域スイッチング前の広帯域信号が調和信号であるか、または、非調和信号であるかを決定し得、もし、広帯域信号が調和信号であるならば、符号化装置は、広帯域スイッチング後の超広帯域信号が調和信号であると強制的に決定し、もし、広帯域信号が非調和信号であるならば、符号化装置は、広帯域スイッチング後の超広帯域信号が非調和信号であると強制的に決定する。従って、本実施形態においては、広帯域スイッチング中に、信号タイプが変えられることがなく、従って、会話／音声信号の連続性は、デコーダで受信された会話／音声信号に対してできるだけ確保され得る。

本方法実施形態に関連して、本発明は、端末機器、ネットワーク機器、またはテスト機器内に置かれ得る符号化装置をさらに提供する。符号化装置は、ハードウェア回路によって実装され得、または、ハードウェアと連携するソフトウェアによって実装され得る。たとえば、図６を参照すると、プロセッサは、会話／音声信号の処理を実装するために符号化装置を呼び出す。符号化装置は、方法実施形態における様々な方法およびプロセスを実行し得る。符号化装置は、決定条件調整モジュールおよび信号タイプ決定モジュールを含み得る。

図７は、本発明による符号化装置の第１の実施形態の概略構成図である。図７に示されるように、本実施形態における符号化装置は、決定条件調整モジュール１１と、信号タイプ決定モジュール１２とを含む。決定条件調整モジュール１１は、もし、第１の広帯域会話／音声信号が調和信号であるならば、第２の広帯域会話／音声信号が調和信号であると決定する可能性を上昇させるように第１の決定条件を取得するために、第２の広帯域会話／音声信号が調和信号であると決定するための決定条件を調整するように構成されており、ここで、第１の広帯域会話／音声信号は、広帯域スイッチング前の会話／音声信号であり、第２の広帯域会話／音声信号は、広帯域スイッチング後の会話／音声信号である。信号タイプ決定モジュール１２は、第１の決定条件に従って、第２の会話／音声信号が調和信号であるか否かを決定するように構成されている。

具体的には、決定条件調整モジュール１１は、第２の広帯域会話／音声信号が調和信号であると決定するための決定条件を緩和するように構成され、ここで、緩和された決定信号は第１の決定条件として使用される。

図８は、本発明の符号化装置による第２の実施形態の概略構成図である。図８に示されるように、図７に示された装置のモジュールに加えて、本実施形態における装置は、調和モード更新モジュール１３をさらに含む。

本実施形態においては、決定条件調整モジュール１１は、具体的には、第２の広帯域会話／音声信号が調和信号であると決定するための決定条件における調和周波数帯域量閾値および最大ピーク値パラメータ閾値のうちの少なくとも一方の閾値を低下させるように構成され、それに応じて、信号タイプ決定モジュール１２は、計算ユニット１２１と、処理ユニット１２２とを含み得、計算ユニット１２１は、第２の広帯域会話／音声信号の調和周波数帯域量および最大ピーク値パラメータを計算するように構成され、処理ユニット１２２は、もし、調和周波数帯域量が減少した調和周波数帯域量閾値より大きい、および／または、最大ピーク値パラメータが減少した最大ピーク値パラメータ閾値より大きいならば、第２の広帯域会話／音声信号が調和信号であると決定するように構成されている。

調和モード更新モジュール１３は、調和周波数帯域量と、最大ピーク値パラメータと、第２の広帯域会話／音声信号が調和信号であると決定するための決定条件との間の関係に従って、調和モードカウント値を更新するように構成され、それに応じて、信号タイプ決定モジュール１２は、もし、調和周波数帯域量が減少した調和周波数帯域量閾値以下であり、かつ、最大ピーク値パラメータが減少した最大ピーク値パラメータ閾値以下であるならば、第２の広帯域会話／音声信号が調和信号であると決定するようにさらに構成されている。

さらに、調和モード更新モジュール１３は、具体的には、もし、調和周波数帯域量が調和周波数帯域量閾値より大きく、かつ、最大ピーク値パラメータが最大ピーク値パラメータ閾値より大きいならば、調和モードカウント値を増加させ、もし、調和周波数帯域量が調和周波数帯域量閾値以下であり、および／または、最大ピーク値パラメータが最大ピーク値パラメータ閾値以下であるならば、調和モードカウント値を減少させるように構成されている。

広帯域スイッチングが広帯域信号から超広帯域信号への切り換えである、すなわち、第１の広帯域会話／音声信号が広帯域信号であり、第２の広帯域会話／音声信号が広帯域信号である場合、決定条件調整モジュール１１は、超広帯域信号の時間包絡線パラメータを計算し、過渡信号決定条件における包絡線閾値を増加させ、もし、時間包絡線パラメータが増加した包絡線閾値以上であるならば、超広帯域信号が過渡信号であると決定し、もし、時間包絡線パラメータが増加した包絡線閾値未満であるならば、超広帯域信号が過渡信号ではないことをデフォルトで決定し、広帯域信号のグローバルエネルギーに対する超広帯域信号のグローバルエネルギーの比がプリセット範囲に含まれるとデフォルトで決定するようにさらに構成されている。実際の実装においては、決定条件調整モジュール１１は、具体的には、もし、広帯域信号が調和信号であるならば、包絡線閾値を３倍に増加させ、もし、広帯域信号が非調和信号であるならば、包絡線閾値を２倍に増加させるように構成されている。

本発明による符号化装置の別の実施形態においては、図７に示された符号化装置実施形態に基づいて、信号タイプ決定モジュール１２は、具体的には、第１の決定条件に従って、第２の広帯域会話／音声信号が調和信号であると決定するように構成され得、または、信号タイプ決定モジュール１２は、もし、第１の広帯域会話／音声信号が調和信号ではないならば、第２の広帯域会話／音声信号が非調和信号であると決定するようにさらに構成される。

本発明による符号化装置のさらに別の実施形態においては、図７に示された符号化装置に基づいて、決定条件調整モジュール１１は、もし、第１の広帯域会話／音声信号が調和信号ではないならば、第２の広帯域会話／音声信号が調和信号であると決定する可能性を低下させるように第２の決定条件を取得するために、調和信号決定条件を調整するようにさらに構成され、それに応じて、信号タイプ決定モジュール１２は、第２の決定条件に従って、第２の広帯域会話／音声信号が調和信号であるか否かを決定するようにさらに構成されている。具体的には、決定条件調整モジュール１１は、第２の広帯域会話／音声信号が調和信号であると決定するための決定条件における調和周波数帯域量閾値および最大ピーク値パラメータ閾値のうちの少なくとも一方を増加させるように構成され、それに応じて、信号タイプ決定モジュール１２は、具体的には、もし、調和周波数帯域量が増加した調和周波数帯域量閾値より大きい、および／または、最大ピーク値パラメータが増加した最大ピーク値パラメータ閾値より大きいならば、第２の広帯域会話／音声信号が調和信号であると決定するように構成されている。

本発明の上記実施形態における符号化装置は、図１から図５に示された方法実施形態における技術的解決手法を対応して実行し得、これらの実装原理および技術的効果は、類似する。従って、さらなる詳細は、ここでは説明しない。

当業者は、方法実施形態のステップの全部または一部が、関連したハードウェアに命令するプログラムによって実装され得ることを理解し得る。プログラムは、コンピュータ読み取り可能な記憶媒体に記憶され得る。プログラムが実行されるとき、方法実施形態のステップが実行される。上記記憶媒体は、ＲＯＭ、ＲＡＭ、磁気ディスク、または光ディスクのようなプログラムコードを格納し得るいかなる媒体も含む。

最後に、上記実施形態は、本発明を限定するためにではなく、本発明の技術的解決手法について説明するためにだけ意図されていることに注意すべきである。本発明は、上記実施形態に関連して詳細に説明されているが、当業者は、本発明の実施形態の技術的解決手法の範囲から逸脱することなく、上記実施形態において説明された技術的解決手法に修正を行い得ること、または、これらの技術的解決手法のある種の技術的特徴に等価な置換を行い得ることを理解すべきである。

Claims

プロセッサ上に構成されたエンコーダによって行われる会話／音声信号処理方法であって、
前記プロセッサ上に構成された前記エンコーダが、第１の広帯域会話／音声信号が調和信号であるか否かを決定するステップと、
前記第１の広帯域会話／音声信号が調和信号である場合、前記プロセッサ上に構成された前記エンコーダが、より広い決定条件を生成するように決定条件を調整するステップであって、前記より広い決定条件は、第２の広帯域会話／音声信号が調和信号であると決定する可能性を上昇させるように生成され、前記第１の広帯域会話／音声信号の帯域幅は、前記第２の広帯域会話／音声信号の帯域幅と異なる、ステップと、
前記プロセッサ上に構成された前記エンコーダが、前記より広い決定条件を使用して、前記第２の広帯域会話／音声信号が調和信号であるか否かを決定するステップと、
帯域幅スイッチング前の調和信号を符号化するために調和信号の符号化方法を選択し、帯域幅スイッチング後の非調和信号を符号化するために非調和信号の符号化方法を使用するステップと、
帯域幅スイッチング前の非調和信号を符号化するために非調和信号の符号化方法を選択し、帯域幅スイッチング後の調和信号を符号化するために調和信号の符号化方法を使用するステップと、
前記の選択を使用して前記信号を符号化するステップと、を備える
方法。
請求項１に記載の方法であって、前記より広い決定条件を生成するように前記決定条件を調整するステップが、
前記エンコーダが、前記決定条件に含まれる調和周波数帯域量閾値または最大ピーク値パラメータ閾値のうちの少なくとも一方を減少させるステップを含み、
前記より広い決定条件に従って、前記第２の広帯域会話／音声信号が調和信号であるか否かを決定するステップが、
前記エンコーダが、前記第２の広帯域会話／音声信号の調和周波数帯域量および最大ピーク値パラメータを計算するステップと、
もし、前記調和周波数帯域量が減少した調和周波数帯域量閾値より大きい、または、前記最大ピーク値パラメータが減少した最大ピーク値パラメータ閾値より大きいならば、前記エンコーダが、前記第２の広帯域会話／音声信号が調和信号であると決定するステップと、を含む、
方法。
請求項２に記載の方法であって、
前記エンコーダが、前記調和周波数帯域量と、前記最大ピーク値パラメータと、前記決定条件との間の関係に従って、調和モードカウント値を更新するステップをさらに備え、
もし、前記調和周波数帯域量が前記減少した調和周波数帯域量閾値以下であり、かつ、前記最大ピーク値パラメータが前記減少した最大ピーク値パラメータ閾値以下であるならば、前記方法は、
もし、前記調和モードカウント値がプリセット値より大きいならば、前記エンコーダが、前記第２の広帯域会話／音声信号が調和信号であると決定するステップをさらに備える、
方法。
請求項３に記載の方法であって、前記調和モードカウント値を更新するステップは、
もし、前記調和周波数帯域量が前記調和周波数帯域量閾値より大きく、かつ、前記最大ピーク値パラメータが前記最大ピーク値パラメータ閾値より大きいならば、前記エンコーダが、前記調和モードカウント値を増加させるステップと、
もし、前記調和周波数帯域量が前記調和周波数帯域量閾値以下である、および／または、前記最大ピーク値パラメータが前記最大ピーク値パラメータ閾値以下であるならば、前記エンコーダが、前記調和モードカウント値を減少させるステップと、を含む、
方法。
請求項３に記載の方法であって、前記第１の広帯域会話／音声信号は広帯域信号であり、前記第２の広帯域会話／音声信号は超広帯域信号であり、前記より広い決定条件に従って、前記第２の広帯域会話／音声信号が調和信号であるか否かを決定するステップの前に、前記方法は、
前記エンコーダが、前記超広帯域信号の時間包絡線パラメータを計算し、過渡信号決定条件における包絡線閾値を増加させるステップと、
もし、前記時間包絡線パラメータが増加した包絡線閾値以上であるならば、前記エンコーダが、前記超広帯域信号が過渡信号であると決定するステップと、
もし、前記時間包絡線パラメータが前記増加した包絡線閾値未満であるならば、前記エンコーダが、前記超広帯域信号が過渡信号ではないとデフォルトで決定し、前記広帯域信号のグローバルエネルギーに対する前記超広帯域信号のグローバルエネルギーの比がプリセット範囲に含まれるとデフォルトで決定するステップと、をさらに備える、
方法。
請求項５に記載の方法であって、前記過渡信号決定条件における前記包絡線閾値を増加させるステップは、
もし、前記広帯域信号が調和信号であるならば、前記エンコーダが、前記包絡線閾値を３倍に増加させるステップと、
もし、前記広帯域信号が非調和信号であるならば、前記エンコーダが、前記包絡線閾値を２倍に増加させるステップと、を含む、
方法。
請求項１に記載の方法であって、前記より広い決定条件に従って、前記第２の広帯域会話／音声信号が調和信号であるか否かを決定するステップが、
前記エンコーダが、前記より広い決定条件に従って、前記第２の広帯域会話／音声信号が調和信号であると決定するステップを含む、
方法。
請求項１に記載の方法であって、
もし、前記第１の広帯域会話／音声信号が調和信号ではないならば、前記エンコーダが、より狭い決定条件を生成するように前記決定条件を調整するステップであって、前記より狭い決定条件は、前記第２の広帯域会話／音声信号が調和信号であると決定する可能性を低下させるように生成される、ステップと、
前記エンコーダが、前記より狭い決定条件を使用して、前記第２の広帯域会話／音声信号が調和信号であるか否かを決定するステップと、をさらに備える、
方法。
請求項８に記載の方法であって、前記より狭い決定条件を生成するように前記決定条件を調整するステップは、
前記エンコーダが、前記決定条件における調和周波数帯域量閾値および最大ピーク値パラメータ閾値のうちの少なくとも一方の閾値を増加させるステップを含み、
前記第２の広帯域会話／音声信号が調和信号であるか否かを決定するステップは、
もし、調和周波数帯域量が増加した調和周波数帯域量閾値より大きい、および／または、最大ピーク値パラメータが増加した最大ピーク値パラメータ閾値より大きいならば、前記エンコーダが、前記第２の広帯域会話／音声信号が調和信号であると決定するステップを含む、
方法。
請求項１に記載の方法であって、
もし、前記第１の広帯域会話／音声信号が調和信号ではないならば、前記エンコーダが、前記第２の広帯域会話／音声信号が非調和信号であると決定するステップをさらに備える、
方法。
符号化装置であって、
命令を含む非一時的なメモリストレージと、
メモリと通信するプロセッサと、
を備え、前記プロセッサは、前記命令を実行して、
第１の広帯域会話／音声信号が調和信号であるか否かを決定し、
前記第１の広帯域会話／音声信号が調和信号である場合、より広い決定条件を生成するように決定条件を調整し、前記より広い決定条件は、第２の広帯域会話／音声信号が調和信号であると決定する可能性を上昇させるように生成され、前記第１の広帯域会話／音声信号の帯域幅は、前記第２の広帯域会話／音声信号の帯域幅と異なり、
前記より広い決定条件を使用して、前記第２の広帯域会話／音声信号が調和信号であるか否かを決定し、
帯域幅スイッチング前の調和信号を符号化するために調和信号の符号化方法を選択し、帯域幅スイッチング後の非調和信号を符号化するために非調和信号の符号化方法を使用し、
帯域幅スイッチング前の非調和信号を符号化するために非調和信号の符号化方法を選択し、帯域幅スイッチング後の調和信号を符号化するために調和信号の符号化方法を使用し、
前記の選択を使用して前記信号を符号化する、
装置。
請求項１１に記載の装置であって、前記プロセッサは、さらに、前記命令を実行して、
前記決定条件に含まれる調和周波数帯域量閾値および最大ピーク値パラメータ閾値のうちの少なくとも一方の閾値を減少させ、
前記第２の広帯域会話／音声信号の調和周波数帯域量および最大ピーク値パラメータを計算し、
もし、前記調和周波数帯域量が減少した調和周波数帯域量閾値より大きい、または、前記最大ピーク値パラメータが減少した最大ピーク値パラメータ閾値より大きいならば、前記第２の広帯域会話／音声信号が調和信号であると決定する、
装置。
請求項１２に記載の装置であって、前記プロセッサは、さらに、前記命令を実行して、
前記調和周波数帯域量と、前記最大ピーク値パラメータと、前記決定条件との間の関係に従って、調和モードカウント値を更新し、
もし、前記調和周波数帯域量が前記減少した調和周波数帯域量閾値以下であり、前記最大ピーク値パラメータが前記減少した最大ピーク値パラメータ閾値以下であり、前記調和モードカウント値がプリセット値より大きいならば、前記第２の広帯域会話／音声信号が調和信号であると決定する、
装置。
請求項１３に記載の装置であって、前記プロセッサは、さらに、前記命令を実行して、
もし、前記調和周波数帯域量が前記調和周波数帯域量閾値より大きく、かつ、前記最大ピーク値パラメータが前記最大ピーク値パラメータ閾値より大きいならば、前記調和モードカウント値を増加させ、
もし、前記調和周波数帯域量が前記調和周波数帯域量閾値以下である、および／または、前記最大ピーク値パラメータが前記最大ピーク値パラメータ閾値以下であるならば、前記調和モードカウント値を減少させる、
装置。
請求項１２に記載の装置であって、前記第１の広帯域会話／音声信号は広帯域信号であり、前記第２の広帯域会話／音声信号は超広帯域信号であり、
前記プロセッサは、さらに、前記命令を実行して、
前記超広帯域信号の時間包絡線パラメータを計算し、過渡信号決定条件における包絡線閾値を増加させ、
もし、前記時間包絡線パラメータが増加した包絡線閾値以上であるならば、前記超広帯域信号が過渡信号であると決定し、
もし、前記時間包絡線パラメータが前記増加した包絡線閾値未満であるならば、前記超広帯域信号が過渡信号ではないとデフォルトで決定し、前記広帯域信号のグローバルエネルギーに対する前記超広帯域信号のグローバルエネルギーの比がプリセット範囲に含まれるとデフォルトで決定する、
装置。
請求項１５に記載の装置であって、前記プロセッサは、さらに、前記命令を実行して、
もし、前記広帯域信号が調和信号であるならば、前記包絡線閾値を３倍に増加させ、
もし、前記広帯域信号が非調和信号であるならば、前記包絡線閾値を２倍に増加させる、
装置。
請求項１１に記載の装置であって、前記プロセッサは、さらに、前記命令を実行して、
前記より広い決定条件に従って、前記第２の広帯域会話／音声信号が調和信号であると決定する、
装置。
請求項１１に記載の装置であって、前記プロセッサは、さらに、前記命令を実行して、
もし、前記第１の広帯域会話／音声信号が調和信号ではないならば、より狭い決定条件を生成するように前記決定条件を調整し、前記より狭い決定条件は、前記第２の広帯域会話／音声信号が調和信号であると決定する可能性を低下させるように生成され、
前記より狭い決定条件を使用して、前記第２の広帯域会話／音声信号が調和信号であるか否かを決定する、
装置。
請求項１８に記載の装置であって、前記プロセッサは、さらに、前記命令を実行して、
前記決定条件における調和周波数帯域量閾値または最大ピーク値パラメータ閾値のうちの少なくとも一方の閾値を増加させ、
もし、調和周波数帯域量が増加した調和周波数帯域量閾値より大きい、および／または、最大ピーク値パラメータが増加した最大ピーク値パラメータ閾値より大きいならば、前記第２の広帯域会話／音声信号が調和信号であると決定する、
装置。
請求項１１に記載の装置であって、前記プロセッサは、さらに、前記命令を実行して、
もし、前記第１の広帯域会話／音声信号が調和信号ではないならば、前記第２の広帯域会話／音声信号が非調和信号であると決定する、
装置。