JP6125031B2

JP6125031B2 - オーディオ信号符号化及び復号化方法並びにオーディオ信号符号化及び復号化装置

Info

Publication number: JP6125031B2
Application number: JP2015543256A
Authority: JP
Inventors: ▲澤▼新 ▲劉▼; ▲賓▼ 王; 磊苗
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2013-01-11
Filing date: 2013-07-22
Publication date: 2017-05-10
Anticipated expiration: 2033-07-22
Also published as: EP3467826A1; JP2016505873A; JP2017138616A; CN105976830A; BR112015014956A2; US10373629B2; CN103928029A; KR101736394B1; WO2014107950A1; US9805736B2; EP2899721A1; KR20170054580A; US20190355378A1; EP2899721B1; US20150235653A1; US20180018989A1; KR20150070398A; CN103928029B; HK1199539A1; CN105976830B

Description

この出願は、2013年1月11日に“AUDIO SIGNAL ENCODING AND DECODING METHOD, AND AUDIO SIGNAL ENCODING AND DECODING APPARATUS”という題で中国専利局に出願された中国特許出願第201310010936.8号の優先権を主張し、その全内容を援用する。

本発明は、通信技術の分野に関し、特に、オーディオ信号符号化方法、オーディオ信号復号化方法、オーディオ信号符号化装置、オーディオ信号復号化装置、送信機、受信機及び通信システムに関する。

通信技術の絶え間ない進展により、ユーザは、音声品質に対してますます高い要件を課している。一般的に、音声品質は、音声品質の帯域幅を増加させることにより改善される。帯域幅が増加した情報が従来の符号化方法で符号化された場合、ビットレートはかなり増加し、その結果、現在のネットワーク帯域幅の制限条件のため、符号化を実施することが困難になる。従って、符号化は、ビットレートが変化しない場合又はわずかに変化する場合に帯域幅が広くなる信号において実行される必要があり、この問題への対策は、帯域幅拡張（帯域拡張、bandwidth extension）技術を使用することである。帯域幅拡張技術は、時間ドメイン又は周波数ドメインで行われてもよく、本発明では、帯域幅拡張は時間ドメインで行われる。

時間ドメインで帯域幅拡張を実行する基本的な原理は、２つの異なる処理方法が低帯域信号と高帯域信号とに使用されることにある。元の信号の低帯域信号では、符号化は、様々なエンコーダ（符号化器）を使用することにより要件に従ってエンコーダ側で実行される。デコーダ（復号化器）側では、エンコーダ側のエンコーダに対応するデコーダが低帯域信号を復号化及び復元するために使用される。高帯域信号では、エンコーダ側で、低帯域信号に使用されたエンコーダが、高帯域励起信号（excitation signal）を予測するために低周波数符号化パラメータを取得するために使用される。例えば、線形予測符号化（LCP：linear Predictive Coding）分析は、高周波数LPC係数を取得するために、元の信号の高帯域信号で実行される。高帯域励起信号は、予測された高帯域信号を取得するために、LPC係数に従って決定された合成フィルタを使用することによりフィルタリングされる。予測された高帯域信号は、高周波数利得パラメータを取得するために、元の信号の高帯域信号と比較される。高周波数利得パラメータ及びLPC係数は、高帯域信号を復元するために、デコーダ側に伝送される。デコーダ側では、低帯域信号の復号化中に励起された低周波数符号化パラメータが、高帯域励起信号を復元するために使用される。LPC係数は、合成フィルタを生成するために使用される。高帯域励起信号は、予測された高帯域信号を復元するために、合成フィルタを使用することによりフィルタリングされる。予測された高帯域信号は、最終的な高帯域信号を取得するために、高周波数利得パラメータを使用することにより調整される。高帯域信号及び低帯域信号は、最終的な出力信号を取得するために結合される。

時間ドメインで帯域幅拡張を実行する前述の技術では、高帯域信号は、特定のレートの条件で復元される。しかし、性能インジケータは不足している。復元した出力信号の周波数スペクトルを元の信号の周波数スペクトルと比較することにより、一般的な期間の有声音では、復元された高帯域信号に極めて強いハーモニック成分（harmonic component）が常に存在することが分かる。しかし、本当の音声信号の高帯域信号は、極めて強いハーモニック特性を有さない。従って、この差は、復元された信号の音が出るときに明らかな機械音が存在することを生じる。

本発明の実施例の目的は、復元された信号の機械音を低減又は除去するための、時間ドメインで帯域幅拡張を実行する前述の技術を改善することである。

本発明の実施例は、復元された信号の機械音を低減又は除去することにより、符号化及び復号化性能を改善することができるオーディオ信号符号化方法、オーディオ信号復号化方法、オーディオ信号符号化装置、オーディオ信号復号化装置、送信機、受信機及び通信システムを提供する。

第１の態様によれば、オーディオ信号符号化方法が提供され、符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割し、低帯域信号を符号化して低周波数符号化パラメータを取得し、低周波数符号化パラメータに従って音声度ファクタを計算し、低周波数符号化パラメータに従って高帯域励起信号を予測し、音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用され、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けし、合成励起信号と高帯域信号とに基づいて高周波数符号化パラメータを取得することを含む。

第１の態様を参照して、第１の態様の実装方法では、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けすることは、プリエンファシス雑音を取得するために、ランダム雑音においてプリエンファシスファクタを使用することによりランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行し、プリエンファシス励起信号を生成するために、音声度ファクタを使用することにより高帯域励起信号とプリエンファシス雑音とを重み付けし、合成励起信号を取得するために、プリエンファシス励起信号においてデエンファシスファクタを使用することによりプリエンファシス励起信号の高周波数部分を下げるためのデエンファシス動作を実行することを含んでもよい。

第１の態様及び前述の実装方法を参照して、第１の態様の他の実装方法では、デエンファシスファクタは、プリエンファシスファクタと、プリエンファシス励起信号におけるプリエンファシス雑音の割合とに基づいて決定されてもよい。

第１の態様及び前述の実装方法を参照して、第１の態様の他の実装方法では、低周波数符号化パラメータは、ピッチ期間を含んでもよく、合成励起信号を取得するために、音声度ファクタを使用することにより予測された高帯域励起信号とランダム雑音とを重み付けすることは、ピッチ期間を使用することにより音声度ファクタを変更し、合成励起信号を取得するために、変更された音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けすることを含んでもよい。

第１の態様及び前述の実装方法を参照して、第１の態様の他の実装方法では、低周波数符号化パラメータは、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間とを含んでもよく、低周波数符号化パラメータに従って高帯域励起信号を予測することは、ピッチ期間を使用することにより音声度ファクタを変更し、重み付け結果を取得するために、変更された音声度ファクタを使用することにより代数コードブックとランダム雑音とを重み付けし、高帯域励起信号を予測するために、重み付け結果及び代数コードブック利得の積と、適応コードブック及び適応コードブック利得の積とを加算することを含んでもよい。

第１の態様及び前述の実装方法を参照して、第１の態様の他の実装方法では、ピッチ期間を使用することにより音声度ファクタを変更することは、以下の式：

に従って実行されてもよい。ただし、voice_facは音声度ファクタであり、T0はピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは変更された音声度ファクタである。

第１の態様及び前述の実装方法を参照して、第１の態様の他の実装方法では、オーディオ信号符号化方法は、符号化されたビットストリームをデコーダ側に送信するために、低周波数符号化パラメータと高周波数符号化パラメータとに従って符号化されたビットストリームを生成することを更に含んでもよい。

第２の態様によれば、オーディオ信号復号化方法が提供され、符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別し、低周波数符号化パラメータを復号化して低帯域信号を取得し、低周波数符号化パラメータに従って音声度ファクタを計算し、低周波数符号化パラメータに従って高帯域励起信号を予測し、音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用され、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けし、合成励起信号と高周波数符号化パラメータとに基づいて高帯域信号を取得し、低帯域信号と高帯域信号とを結合して最終的な復号化された信号を取得することを含む。

第２の態様を参照して、第２の態様の実装方法では、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けすることは、プリエンファシス雑音を取得するために、ランダム雑音においてプリエンファシスファクタを使用することによりランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行し、プリエンファシス励起信号を生成するために、音声度ファクタを使用することにより高帯域励起信号とプリエンファシス雑音とを重み付けし、合成励起信号を取得するために、プリエンファシス励起信号においてデエンファシスファクタを使用することによりプリエンファシス励起信号の高周波数部分を下げるためのデエンファシス動作を実行することを含んでもよい。

第２の態様及び前述の実装方法を参照して、第２の態様の他の実装方法では、デエンファシスファクタは、プリエンファシスファクタと、プリエンファシス励起信号におけるプリエンファシス雑音の割合とに基づいて決定されてもよい。

第２の態様及び前述の実装方法を参照して、第２の態様の他の実装方法では、低周波数符号化パラメータは、ピッチ期間を含んでもよく、合成励起信号を取得するために、音声度ファクタを使用することにより予測された高帯域励起信号とランダム雑音とを重み付けすることは、ピッチ期間を使用することにより音声度ファクタを変更し、合成励起信号を取得するために、変更された音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けすることを含んでもよい。

第２の態様及び前述の実装方法を参照して、第２の態様の他の実装方法では、低周波数符号化パラメータは、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間とを含んでもよく、低周波数符号化パラメータに従って高帯域励起信号を予測することは、ピッチ期間を使用することにより音声度ファクタを変更し、重み付け結果を取得するために、変更された音声度ファクタを使用することにより代数コードブックとランダム雑音とを重み付けし、高帯域励起信号を予測するために、重み付け結果及び代数コードブック利得の積と、適応コードブック及び適応コードブック利得の積とを加算することを含んでもよい。

第２の態様及び前述の実装方法を参照して、第２の態様の他の実装方法では、ピッチ期間を使用することにより音声度ファクタを変更することは、以下の式：

に従って実行される。ただし、voice_facは音声度ファクタであり、T0はピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは変更された音声度ファクタである。

第３の態様によれば、オーディオ信号符号化装置が提供され、符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割するように構成された分割ユニットと、低帯域信号を符号化して低周波数符号化パラメータを取得するように構成された低周波数符号化ユニットと、低周波数符号化パラメータに従って音声度ファクタを計算するように構成された計算ユニットであり、音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用される計算ユニットと、低周波数符号化パラメータに従って高帯域励起信号を予測するように構成された予測ユニットと、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けするように構成された合成ユニットと、合成励起信号と高帯域信号とに基づいて高周波数符号化パラメータを取得するように構成された高周波数符号化ユニットとを含む。

第３の態様を参照して、第３の態様の実装方法では、合成ユニットは、プリエンファシス雑音を取得するために、ランダム雑音においてプリエンファシスファクタを使用することによりランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行するように構成されたプリエンファシス構成要素と、プリエンファシス励起信号を生成するために、音声度ファクタを使用することにより高帯域励起信号とプリエンファシス雑音とを重み付けするように構成された重み付け構成要素と、合成励起信号を取得するために、プリエンファシス励起信号においてデエンファシスファクタを使用することによりプリエンファシス励起信号の高周波数部分を下げるためのデエンファシス動作を実行するように構成されたデエンファシス構成要素とを含んでもよい。

第３の態様及び前述の実装方法を参照して、第３の態様の他の実装方法では、デエンファシスファクタは、プリエンファシスファクタと、プリエンファシス励起信号におけるプリエンファシス雑音の割合とに基づいて決定される。

第３の態様及び前述の実装方法を参照して、第３の態様の他の実装方法では、低周波数符号化パラメータは、ピッチ期間を含んでもよく、合成ユニットは、ピッチ期間を使用することにより音声度ファクタを変更するように構成された第１の変更構成要素と、合成励起信号を取得するために、変更された音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けするように構成された重み付け構成要素とを含んでもよい。

第３の態様及び前述の実装方法を参照して、第３の態様の他の実装方法では、低周波数符号化パラメータは、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間とを含んでもよく、予測ユニットは、ピッチ期間を使用することにより音声度ファクタを変更するように構成された第２の変更構成要素と、重み付け結果を取得するために、変更された音声度ファクタを使用することにより代数コードブックとランダム雑音とを重み付けし、高帯域励起信号を予測するために、重み付け結果及び代数コードブック利得の積と、適応コードブック及び適応コードブック利得の積とを加算するように構成された予測構成要素とを含んでもよい。

第３の態様及び前述の実装方法を参照して、第３の態様の他の実装方法では、第１の変更構成要素及び第２の変更構成要素のうち少なくとも１つは、以下の式：

に従って音声度ファクタを変更してもよい。ただし、voice_facは音声度ファクタであり、T0はピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは変更された音声度ファクタである。

第３の態様及び前述の実装方法を参照して、第３の態様の他の実装方法では、オーディオ信号符号化装置は、符号化されたビットストリームをデコーダ側に送信するために、低周波数符号化パラメータと高周波数符号化パラメータとに従って符号化されたビットストリームを生成するように構成されたビットストリーム生成ユニットを更に含んでもよい。

第４の態様によれば、オーディオ信号復号化装置が提供され、符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別するように構成された区別ユニットと、低周波数符号化パラメータを復号化して低帯域信号を取得するように構成された低周波数復号化ユニットと、低周波数符号化パラメータに従って音声度ファクタを計算するように構成された計算ユニットであり、音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用される計算ユニットと、低周波数符号化パラメータに従って高帯域励起信号を予測するように構成された予測ユニットと、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けするように構成された合成ユニットと、合成励起信号と高周波数符号化パラメータとに基づいて高帯域信号を取得するように構成された高周波数復号化ユニットと、低帯域信号と高帯域信号とを結合して最終的な復号化された信号を取得するように構成された結合ユニットとを含む。

第４の態様を参照して、第４の態様の実装方法では、合成ユニットは、プリエンファシス雑音を取得するために、ランダム雑音においてプリエンファシスファクタを使用することによりランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行するように構成されたプリエンファシス構成要素と、プリエンファシス励起信号を生成するために、音声度ファクタを使用することにより高帯域励起信号とプリエンファシス雑音とを重み付けするように構成された重み付け構成要素と、合成励起信号を取得するために、プリエンファシス励起信号においてデエンファシスファクタを使用することによりプリエンファシス励起信号の高周波数部分を下げるためのデエンファシス動作を実行するように構成されたデエンファシス構成要素とを含んでもよい。

第４の態様及び前述の実装方法を参照して、第４の態様の他の実装方法では、デエンファシスファクタは、プリエンファシスファクタと、プリエンファシス励起信号におけるプリエンファシス雑音の割合とに基づいて決定される。

第４の態様及び前述の実装方法を参照して、第４の態様の他の実装方法では、低周波数符号化パラメータは、ピッチ期間を含んでもよく、合成ユニットは、ピッチ期間を使用することにより音声度ファクタを変更するように構成された第１の変更構成要素と、合成励起信号を取得するために、変更された音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けするように構成された重み付け構成要素とを含んでもよい。

第４の態様及び前述の実装方法を参照して、第４の態様の他の実装方法では、低周波数符号化パラメータは、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間とを含んでもよく、予測ユニットは、ピッチ期間を使用することにより音声度ファクタを変更するように構成された第２の変更構成要素と、重み付け結果を取得するために、変更された音声度ファクタを使用することにより代数コードブックとランダム雑音とを重み付けし、高帯域励起信号を予測するために、重み付け結果及び代数コードブック利得の積と、適応コードブック及び適応コードブック利得の積とを加算するように構成された予測構成要素とを含んでもよい。

第４の態様及び前述の実装方法を参照して、第４の態様の他の実装方法では、第１の変更構成要素及び第２の変更構成要素のうち少なくとも１つは、以下の式：

第５の態様によれば、送信機が提供され、第３の態様によるオーディオ信号符号化装置と、ビットストリームを生成してビットストリームを送信するために、オーディオ信号符号化装置により生成された高周波数符号化パラメータ及び低周波数符号化パラメータのビット割り当てを実行するように構成された送信ユニットとを含む。

第６の態様によれば、受信機が提供され、ビットストリームを受信してビットストリームから符号化された情報を抽出するように構成された受信ユニットと、第４の態様によるオーディオ信号復号化装置とを含む。

第７の態様によれば、通信システムが提供され、第５の態様による送信機又は第６の態様による受信機を含む。

本発明の実施例の前述の技術的対策では、符号化及び復号化の間に、高帯域励起信号及びランダム雑音は、合成励起信号を取得するために、音声度ファクタを使用することにより重み付けされ、高帯域信号の特性が、音声信号に基づいてより正確に示され得る。これにより、符号化及び復号化効果を改善し得る。

本発明の実施例の技術的対策を更に明確に説明するために、実施例又は従来技術を説明するために必要な添付図面を簡単に紹介する。明らかに、以下の説明における添付図面は、本発明の単にいくつかの実施例を示しているに過ぎず、当業者は、依然として創造的取り組みを行うことなく、これらの図面から他の図面を導くことができる。

本発明の実施例によるオーディオ信号符号化方法の概略フローチャート本発明の実施例によるオーディオ信号復号化方法の概略フローチャート本発明の実施例によるオーディオ信号符号化装置の概略ブロック図本発明の実施例によるオーディオ信号符号化装置における予測ユニット及び合成ユニットの概略ブロック図本発明の実施例によるオーディオ信号復号化装置の概略ブロック図本発明の実施例による送信機の概略ブロック図本発明の実施例による受信機の概略ブロック図本発明の実施例による装置の概略ブロック図

以下に、本発明の実施例の添付図面を参照して、本発明の実施例の技術的対策を明確且つ完全に説明する。明らかに、記載の実施例は、本発明の実施例の全てではなく、一部に過ぎない。創造的取り組みを行うことなく、本発明の実施例に基づいて当業者により得られる全ての他の実施例は、本発明の保護範囲内に入るものとする。

デジタル信号処理の分野では、様々な電子デバイス（例えば、移動電話、無線装置、パーソナルデジタルアシスタント（PDA：personal digital assistant）、ハンドヘルド又はポータブルコンピュータ、GPS受信機／ナビゲータ、カメラ、オーディオ／ビデオプレイヤ、ビデオカメラ、ビデオレコーダ及び監視デバイス）にオーディオコーデックが広く適用されている。一般的に、この種類の電子デバイスは、オーディオ信号の符号化及び復号化を実施するオーディオエンコーダ又はオーディオデコーダを含み、オーディオエンコーダ又はオーディオデコーダは、デジタル回路又はチップ（例えば、デジタルシグナルプロセッサ（DSP：digital signal processor））により直接実現されてもよく、ソフトウェアコードのプロセスを実行するようにプロセッサを駆動するソフトウェアコードを使用することにより実現されてもよい。

更に、オーディオコーデック並びにオーディオ符号化及び復号化方法はまた、GSM（登録商標）、符号分割多重アクセス（CDMA：Code Division Multiple Access）システム、広帯域符号分割多重アクセス（WCDMA（登録商標）：Wideband Code Division Multiple Access）、GPRS（General Packet Radio Service）、及びLTE（Long Term Evolution）のような様々な通信システムに適用されてもよい。

図１は、本発明の実施例によるオーディオ信号符号化方法100の概略フローチャートである。オーディオ信号符号化方法は、符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割し（ステップ110）、低帯域信号を符号化して低周波数符号化パラメータを取得し（ステップ120）、低周波数符号化パラメータに従って音声度ファクタ（voiced degree factor）を計算し、低周波数符号化パラメータに従って高帯域励起信号を予測し、音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用され（ステップ130）、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けし（ステップ140）、合成励起信号と高帯域信号とに基づいて高周波数符号化パラメータを取得する（ステップ150）ことを含む。

ステップ110において、符号化される時間ドメイン信号は、低帯域信号と高帯域信号に分割される。分割は、低帯域信号と高帯域信号とが別々に処理され得るように、時間ドメイン信号を処理のために２つの信号に分割することである。分割は、いずれかの従来又は将来の分割技術を使用することにより実施されてもよい。ここでの低周波数の意味は、高周波数の意味に対して相対的なものである。例えば、周波数閾値が設定されてもよく、周波数閾値より低い周波数は低周波数であり、周波数閾値より高い周波数は高周波数である。実際には、周波数閾値は要件に従って設定されてもよく、信号における低帯域信号成分及び高帯域信号成分も、分割を実施するために、他の方法を使用することにより区別されてもよい。

ステップ120において、低帯域信号は、低周波数符号化パラメータを取得するように符号化される。符号化により、低帯域信号は、低周波数符号化パラメータを取得するように処理され、これにより、デコーダ側は、低周波数符号化パラメータに従って低帯域信号を復元する。低周波数符号化パラメータは、低帯域信号を復元するためにデコーダ側により必要とされるパラメータである。一例として、符号化は、ACELP（Algebraic Code Excited Linear Prediction）アルゴリズムを使用したエンコーダ（ACELPエンコーダ）を使用することにより実行されてもよく、この場合に取得される低周波数符号化パラメータは、例えば、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間とを含んでもよく、また、他のパラメータを含んでもよい。低周波数符号化パラメータは、低帯域信号を復元するためにデコーダ側に伝送される。更に、代数コードブック及び適応コードブックがエンコーダ側からデコーダ側に伝送される場合、代数コードブックインデックス及び適応コードブックインデックスが伝送されてもよく、デコーダ側は、復元を実施するために、代数コードブックインデックス及び適応コードブックインデックスに従って、対応する代数コードブック及び適応コードブックを取得する。

実際には、低帯域信号は、要件に従って適切な符号化技術を使用することにより符号化されてもよい。符号化技術が変化する場合、低周波数符号化パラメータの構成も変化してもよい。本発明のこの実施例では、ACELPアルゴリズムを使用した符号化技術が説明の一例として使用される。

ステップ130において、音声度ファクタは、低周波数符号化パラメータに従って計算され、高帯域励起信号は、低周波数符号化パラメータに従って予測される。音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用される。従って、ステップ130は、低周波数符号化パラメータから音声度ファクタと高帯域励起信号とを取得するために使用される。音声度ファクタ及び高帯域励起信号は、高帯域信号の異なる特性を示すために使用される。すなわち、入力信号の高周波数特性がステップ130において取得され、これにより、高周波数特性が、高帯域信号の符号化のために使用される。ACELPアルゴリズムを使用した符号化技術は、音声度ファクタと高帯域励起信号との双方の計算を説明するために、以下で一例として使用される。

音声度ファクタvoice_facは、以下の式(1)：

に従って計算されてもよい。ただし、ener_adpは適応コードブックのエネルギーであり、ener_cbは代数コードブックのエネルギーであり、a、b及びcは予め設定された値である。パラメータa、b及びcは、以下の規則に従って設定される。voice_facの値は0と1との間であり、音声度ファクタvoice_facの特性がより良く示されるように、線形変化（liner change）のvoice_factorは非線形変化（non-linear change）のvoice_facに変化する。

更に、音声度ファクタvoice_facが高帯域信号の特性をより良く示すことを可能にするために、音声度ファクタは、低周波数符号化パラメータのピッチ期間を使用することにより更に変更されてもよい。一例として、式(1)の音声度ファクタvoice_facは、以下の式(2)に従って更に変更されてもよい。

ただし、voice_facは音声度ファクタであり、T0はピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは変更された音声度ファクタである。一例として、式(2)の全てのパラメータの値は以下の通りでもよい。a1=0.0126、b1=1.23、a2=0.0087、b2=0、threshold_min=57.75、及びthreshold_max=115.5。パラメータ値は単なる例であり、要件に従って他の値が設定されてもよい。変更されていない音声度ファクタに比べて、変更された音声度ファクタは、高帯域信号により示される音声特性の程度を更に正確に示すことができ、これにより、一般的な期間の音声信号が拡張された後に導入される機械音を弱めるのに役立ち得る。

高帯域励起信号Exは、以下の式(3)又は式(4)に従って計算されてもよい。

ただし、FixCBは代数コードブックであり、シードはランダム雑音であり、gcは代数コードブック利得であり、AdpCBは適応コードブックであり、gaは適応コードブック利得である。式(3)又は(4)において、代数コードブックFixCB及びランダム雑音のシードは、重み付け結果を取得するために、音声度ファクタを使用することにより重み付けされることが分かり得る。高帯域励起信号Exを取得するために、重み付け結果及び代数コードブック利得gcの積と、適応コードブックAdpCB及び適応コードブック利得gaの積とが加算される。或いは、式(3)又は(4)において、音声度ファクタvoice_facは、高帯域信号により示される音声特性の程度を更に正確に示すために、式(2)の変更された音声度ファクタvoice_fac_Aで置換されてもよい。すなわち、音声信号の高帯域信号は、更に現実的に示され、これにより、符号化効果を改善する。

音声度ファクタ及び高帯域励起信号を計算する前述の方法は単なる例であり、本発明のこの実施例を限定することを意図するものではない点に留意すべきである。ACELPアルゴリズムを使用しない他の符号化技術では、音声度ファクタ及び高帯域励起信号は、他の方法を使用することにより計算されてもよい。

ステップ140において、高帯域励起信号及びランダム雑音は、合成励起信号を取得するために、音声度ファクタを使用することにより重み付けされる。前述のように、従来技術では、一般的な期間の音声信号では、低周波数符号化パラメータに従って予測された高帯域励起信号の周期が極めて強いため、復元されたオーディオ信号の音が出るときに強い機械音が存在する。ステップ140により、低帯域信号及び雑音に従って予測された高帯域励起信号は、音声度ファクタを使用することにより重み付けされる。このことは、低周波数符号化パラメータに従って予測された高帯域励起信号の周期を弱めることができ、これにより、復元されたオーディオ信号における機械音を弱めることができる。
の計算を説明するために、以下で一例として使用される。

重み付けは、要件に従って適切な重みを使用することにより実施されてもよい。一例として、合成励起信号SExは以下の式(5)に従って取得されてもよい。

ただし、Exは高帯域励起信号であり、シードはランダム雑音であり、voice_facは音声度ファクタであり、pow1は高帯域励起信号のエネルギーであり、pow2はランダム雑音のエネルギーである。或いは、式(5)において、音声度ファクタvoice_facは、音声信号の高帯域信号を更に正確に示すために、式(2)の変更された音声度ファクタvoice_fac_Aで置換されてもよく、これにより、符号化効果を改善してもよい。式(2)においてa1=0.0126、b1=1.23、 a2=0.0087、b2=0、threshold_min=57.75、及びthreshold_max=115.5であり、合成励起信号SExが式(5)に従って取得される場合、ピッチ期間T0がthreshold_maxより大きくthreshold_minより小さい高帯域励起信号は、大きい重みを有し、他の高帯域励起信号は小さい重みを有する。要件に従って、合成励起信号はまた、式(5)に加えて他の方法を使用することにより計算されてもよい点に留意すべきである。

更に、高帯域励起信号及びランダム雑音が音声度ファクタを使用することにより重み付けされる場合、事前にランダム雑音においてプリエンファシスが実行されてもよく、重み付けの後にランダム雑音においてデエンファシスが実行されてもよい。特に、ステップ140は、プリエンファシス雑音を取得するために、ランダム雑音においてプリエンファシスファクタを使用することによりランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行し、プリエンファシス励起信号を生成するために、音声度ファクタを使用することにより高帯域励起信号とプリエンファシス雑音とを重み付けし、合成励起信号を取得するために、プリエンファシス励起信号においてデエンファシスファクタを使用することによりプリエンファシス励起信号の高周波数部分を下げるためのデエンファシス動作を実行することを含んでもよい。一般的な有声音では、雑音成分は、通常では低周波数から高周波数に強くなる。このことに基づいて、プリエンファシス動作は、有声音の雑音信号特性を正確に示すために、ランダム雑音において実行される。すなわち、雑音の高周波数部分が改善され、雑音の低周波数部分が下げられる。プリエンファシス動作の一例として、プリエンファシス動作は、以下の式(6)を使用することによりランダム雑音seed(n)で実行されてもよい。

ただし、n=1,2,...Nであり、αはプリエンファシスファクタであり、0<α<1である。プリエンファシスファクタは、有声音の雑音信号特性を正確に示すために、ランダム雑音の特性に基づいて適切に設定されてもよい。プリエンファシス動作が式(6)を使用することにより実行される場合、デエンファシス動作は、以下の式(7)を使用することによりプリエンファシス励起信号S(i)で実行されてもよい。

ただし、n=1,2,...Nであり、βはデエンファシスファクタである。前述の式(6)に示すプリエンファシス動作は単なる例であり、実際には、プリエンファシスは他の方法を使用することにより実行されてもよい点に留意すべきである。更に、使用されるプリエンファシス動作が変化する場合、デエンファシス動作も対応して変化する必要がある。デエンファシスファクタβは、プリエンファシスファクタαと、プリエンファシス励起信号におけるプリエンファシス雑音の割合とに基づいて決定されてもよい。一例として、高帯域励起信号及びプリエンファシス雑音が音声度ファクタを使用することにより式(5)に従って重み付けされる場合（この場合、プリエンファシス励起信号が取得され、デエンファシスがプリエンファシス励起信号で実行された後にのみ合成励起信号が取得される）、デエンファシスファクタβは、以下の式(8)又は式(9)に従って決定されてもよい。

ステップ150において、高周波数符号化パラメータは、合成励起信号と高帯域信号とに基づいて取得される。一例として、高周波数符号化パラメータは、高周波数利得パラメータと、高周波数LPC係数とを含む。高周波数LPC係数は、元の信号の高帯域信号でLPC分析を実行することにより取得されてもよい。予測された高帯域信号は、高帯域励起信号がLPC係数に従って決定された合成フィルタを使用することによりフィルタリングされた後に取得される。高周波数利得パラメータは、予測された高帯域信号と元の信号の高帯域信号とを比較することにより取得される。高周波数利得パラメータ及びLPC係数は、高帯域信号を復元するためにデコーダ側に伝送される。更に、高周波数符号化パラメータはまた、様々な従来又は将来の技術を使用することにより取得されてもよく、合成励起信号と高帯域信号とに基づいて高周波数符号化パラメータを取得する特定の方法は、本発明への限定を構成するものではない。低周波数符号化パラメータ及び高周波数符号化パラメータが取得された後に、信号の符号化が実施され、これにより、信号が復元のためにデコーダ側に伝送され得る。

低周波数符号化パラメータ及び高周波数符号化パラメータが取得された後に、オーディオ信号符号化方法100は、符号化されたビットストリームをデコーダ側に送信するために、低周波数符号化パラメータと高周波数符号化パラメータとに従って符号化されたビットストリームを生成することを更に含んでもよい。

本発明のこの実施例の前述のオーディオ信号符号化方法では、高帯域励起信号及びランダム雑音は、合成励起信号を取得するために、音声度ファクタを使用することにより重み付けされ、高帯域信号の特性が、音声信号に基づいてより正確に示され得る。これにより、符号化効果を改善し得る。

図２は、本発明の実施例によるオーディオ信号復号化方法200の概略フローチャートである。オーディオ信号復号化方法は、符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別し（ステップ210）、低周波数符号化パラメータを復号化して低帯域信号を取得し（ステップ220）、低周波数符号化パラメータに従って音声度ファクタを計算し、低周波数符号化パラメータに従って高帯域励起信号を予測し、音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用され（ステップ230）、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けし（ステップ240）、合成励起信号と高周波数符号化パラメータとに基づいて高帯域信号を取得し（ステップ250）、低帯域信号と高帯域信号とを結合して最終的な復号化された信号を取得する（ステップ260）ことを含む。

ステップ210において、低周波数符号化パラメータ及び高周波数符号化パラメータは、符号化された情報において区別される。低周波数符号化パラメータ及び高周波数符号化パラメータは、エンコーダ側から伝送され、低帯域信号と高帯域信号とを復元するために使用されるパラメータである。低周波数符号化パラメータは、例えば、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間と、他のパラメータを含んでもよく、高周波数符号化パラメータは、例えば、LPC係数と、高周波数利得パラメータと、他のパラメータとを含んでもよい。更に、低周波数符号化パラメータ及び高周波数符号化パラメータは、代替として異なる符号化技術に従って他のパラメータを含んでもよい。

ステップ220において、低周波数符号化パラメータは、低帯域信号を取得するために復号化される。特定の復号化モードは、エンコーダ側の符号化方法に対応する。一例として、符号化がエンコーダ側でACELPアルゴリズムを使用したACELPエンコーダを使用することにより実行される場合、ステップ220において低帯域信号を取得するためにACELPデコーダが使用される。

ステップ230において、音声度ファクタは、低周波数符号化パラメータに従って計算され、高帯域励起信号は、低周波数符号化パラメータに従って予測される。音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用される。ステップ230は、高周波数特性が高帯域信号の復号化（又は復元）に使用されるように、低周波数符号化パラメータに従って符号化された信号の高周波数特性を取得するために使用される。ACELPアルゴリズムを使用した符号化技術に対応する復号化技術が以下の説明において一例として使用される。

音声度ファクタvoice_facは、前述の式(1)に従って計算されてもよく、高帯域信号の特性をより良く示すために、音声度ファクタvoice_facは、低周波数符号化パラメータのピッチ期間を使用することにより、前述の式(2)に示すように変更されてもよく、変更された音声度ファクタvoice_fac_Aが取得されてもよい。変更されていない音声度ファクタvoice_facに比べて、変更された音声度ファクタvoice_fac_Aは、高帯域信号により示される音声特性の程度を更に正確に示すことができ、これにより、一般的な期間の音声信号が拡張された後に導入される機械音を弱めるのに役立ち得る。

高帯域励起信号Exは、前述の式(3)又は式(4)に従って計算されてもよい。すなわち、代数コードブック及びランダム雑音は、重み付け結果を取得するために、音声度ファクタを使用することにより重み付けされ、高帯域励起信号Exを取得するために、重み付け結果及び代数コードブック利得の積と、適応コードブック及び適応コードブック利得の積とが加算される。同様に、音声度ファクタvoice_facは、復号化効果を更に改善するために、式(2)の変更された音声度ファクタvoice_fac_Aで置換されてもよい。

ステップ230の説明については、図１を参照したステップ130の前述の説明を参照されたい。

ステップ240において、高帯域励起信号及びランダム雑音は、合成励起信号を取得するために、音声度ファクタを使用することにより重み付けされる。ステップ240により、低周波数符号化パラメータ及び雑音に従って予測された高帯域励起信号は、音声度ファクタを使用することにより重み付けされる。このことは、低周波数符号化パラメータに従って予測された高帯域励起信号の周期を弱めることができ、これにより、復元されたオーディオ信号における機械音を弱めることができる。

一例として、ステップ240において、合成励起信号SEexは、前述の式(5)に従って取得されてもよく、式(5)の音声度ファクタvoice_facは、音声信号の高帯域信号を更に正確に示すために、式(2)の変更された音声度ファクタvoice_fac_Aで置換されてもよく、これにより、符号化効果を改善してもよい。要件に従って、合成励起信号はまた、他の方法を使用することにより計算されてもよい。

更に、高帯域励起信号及びランダム雑音が音声度ファクタvoice_fac（又は変更された音声度ファクタvoice_fac_A）を使用することにより重み付けされる場合、事前にランダム雑音においてプリエンファシスが実行されてもよく、重み付けの後にランダム雑音においてデエンファシスが実行されてもよい。特に、ステップ240は、プリエンファシス雑音を取得するために、ランダム雑音においてプリエンファシスファクタαを使用することによりランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行し（例えば、プリエンファシス動作は式(6)を使用することにより実施される）、プリエンファシス励起信号を生成するために、音声度ファクタを使用することにより高帯域励起信号とプリエンファシス雑音とを重み付けし、合成励起信号を取得するために、プリエンファシス励起信号においてデエンファシスファクタβを使用することによりプリエンファシス励起信号の高周波数部分を下げるためのデエンファシス動作を実行する（例えば、デエンファシス動作は式(7)を使用することにより実施される）ことを含んでもよい。プリエンファシスファクタαは、有声音の雑音信号特性を更に正確に示すために、要件に従って予め選択されてもよい。すなわち、雑音の高周波数部分は強い信号を有し、雑音の低周波数部分は弱い信号を有する。更に、他の種類の雑音が使用されてもよく、この場合、プリエンファシスファクタαは、一般的な有声音の雑音特性を示すために、対応して変化する必要がある。デエンファシスファクタβは、プリエンファシスファクタαと、プリエンファシス励起信号におけるプリエンファシス雑音の割合とに基づいて決定されてもよい。一例として、デエンファシスファクタβは、前述の式(8)又は式(9)に従って決定されてもよい。

ステップ240の説明については、図１を参照したステップ140の前述の説明を参照されたい。

ステップ250において、高帯域信号は、合成励起信号と高周波数符号化パラメータとに基づいて取得される。ステップ250は、エンコーダ側における合成励起信号と高帯域信号とに基づいて高周波数符号化パラメータを取得する逆の処理で実施される。一例として、高周波数符号化パラメータは、高周波数利得パラメータと高周波数LPC係数とを含む。合成フィルタは、高周波数符号化パラメータのLPC係数を使用することにより生成されてもよい。予測された高帯域信号は、ステップ240において取得された合成励起信号が合成フィルタによりフィルタリングされた後に復元される。最終的な高帯域信号は、予測された高帯域信号が高周波数符号化パラメータの高周波数利得パラメータを使用することにより調整された後に取得される。更に、ステップ240は、様々な従来又は将来の技術を使用することにより実施されてもよく、合成励起信号と高周波数符号化パラメータとに基づいて高帯域信号を取得する特定の方法は、本発明への限定を構成するものではない。

ステップ260において、低帯域信号及び高帯域信号は、最終的な復号化された信号を取得するために結合される。この結合方法は、図１のステップ110における分割方法に対応し、これにより、最終的な出力信号を取得するために復号化が実施される。

本発明のこの実施例の前述のオーディオ信号復号化方法では、高帯域励起信号及びランダム雑音は、合成励起信号を取得するために、音声度ファクタを使用することにより重み付けされ、高帯域信号の特性が、音声信号に基づいてより正確に示され得る。これにより、復号化効果を改善し得る。

図３は、本発明の実施例によるオーディオ信号符号化装置300の概略ブロック図である。オーディオ信号符号化装置300は、符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割するように構成された分割ユニット310と、低帯域信号を符号化して低周波数符号化パラメータを取得するように構成された低周波数符号化ユニット320と、低周波数符号化パラメータに従って音声度ファクタを計算するように構成された計算ユニット330であり、音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用される計算ユニット330と、低周波数符号化パラメータに従って高帯域励起信号を予測するように構成された予測ユニット340と、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けするように構成された合成ユニット350と、合成励起信号と高帯域信号とに基づいて高周波数符号化パラメータを取得するように構成された高周波数符号化ユニット360とを含む。

入力された時間ドメイン信号を受信した後に、分割ユニット310は、いずれかの従来又は将来の分割技術を使用することにより、分割を実施してもよい。ここでの低周波数の意味は、高周波数の意味に対して相対的なものである。例えば、周波数閾値が設定されてもよく、周波数閾値より低い周波数は低周波数であり、周波数閾値より高い周波数は高周波数である。実際には、周波数閾値は要件に従って設定されてもよく、信号における低帯域信号成分及び高帯域信号成分も、分割を実施するために、他の方法を使用することにより区別されてもよい。

低周波数符号化ユニット320は、例えば、ACELPアルゴリズムを使用したACELPエンコーダを使用することにより符号化を実行してもよく、この場合に取得される低周波数符号化パラメータは、例えば、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間とを含んでもよく、また、他のパラメータを含んでもよい。実際には、低帯域信号は、要件に従って適切な符号化技術を使用することにより符号化されてもよい。符号化技術が変化する場合、低周波数符号化パラメータの構成も変化してもよい。取得された低周波数符号化パラメータは、低帯域信号を復元するために必要となるパラメータであり、低帯域信号を復元するためにデコーダに伝送される。

計算ユニット330は、低周波数符号化パラメータに従って、符号化された信号の高周波数特性を示すために使用されるパラメータ、すなわち、音声度ファクタを計算する。特に、計算ユニット330は、低周波数符号化ユニット320を使用することにより取得された低周波数符号化パラメータに従って音声度ファクタvoice_facを計算し、例えば、前述の式(1)に従って音声度ファクタvoice_facを計算してもよい。音声度ファクタは、合成励起信号を取得するために使用される。合成励起信号は、高帯域信号の符号化のために、高周波数符号化ユニット360に伝送される。図４は、本発明の実施例によるオーディオ信号符号化装置の予測ユニット340及び合成ユニット350の概略ブロック図である。

予測ユニット340は、図４の予測構成要素460を単に含んでもよく、図４の第２の変更構成要素450と予測構成要素460との双方を含んでもよい。

高帯域信号の特性をより良く示すために、一般的な期間の音声信号が拡張された後に導入される機械音を弱めるため、例えば、第２の変更構成要素450は、前述の式(2)に従って低周波数符号化パラメータのピッチ期間T0を使用することにより音声度ファクタvoice_facを変更し、変更された音声度ファクタvoice_fac_A2を取得する。

例えば、予測構成要素460は、前述の式(3)又は式(4)に従って高帯域励起信号Exを計算する。すなわち、予測構成要素460は、重み付け結果を取得するために、変更された音声度ファクタvoice_fac_A2を使用することにより低周波数符号化パラメータの代数コードブックとランダム雑音とを重み付けし、高帯域励起信号Exを取得するために、重み付け結果及び代数コードブック利得の積と、適応コードブック及び適応コードブック利得の積とを加算する。予測構成要素460はまた、重み付け結果を取得するために、計算ユニット330により計算された音声度ファクタvoice_facを使用することにより低周波数符号化パラメータの代数コードブックとランダム雑音とを重み付けしてもよい。この場合、第２の変更構成要素450は省略されてもよい。予測構成要素460は、他の方法を使用することにより高帯域励起信号Exを計算してもよい。

一例として、合成ユニット350は、図４のプリエンファシス構成要素410と、重み付け構成要素420と、デエンファシス構成要素430とを含んでもよく、図４の第１の変更構成要素440と重み付け構成要素420とを含んでもよく、更に、プリエンファシス構成要素410と、重み付け構成要素420と、デエンファシス構成要素430と、第１の変更構成要素440とを含んでもよい。

例えば、式(6)を使用することにより、プリエンファシス構成要素410は、プリエンファシス雑音PEnoiseを取得するために、ランダム雑音においてプリエンファシスファクタαを使用することによりランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行する。ランダム雑音は、予測構成要素460に入力されるランダム雑音と同じでもよい。プリエンファシスファクタαは、有声音の雑音信号特性を更に正確に示すために、要件に従って予め選択されてもよい。すなわち、雑音の高周波数部分は強い信号を有し、雑音の低周波数部分は弱い信号を有する。他の種類の雑音が使用される場合、プリエンファシスファクタαは、一般的な有声音の雑音特性を示すために、対応して変化する必要がある。

重み付け構成要素420は、プリエンファシス励起信号PEExを生成するために、変更された音声度ファクタvoice_fac_A1を使用することにより、予測構成要素460からの高帯域励起信号Exとプリエンファシス構成要素410からのプリエンファシス雑音PEnoiseとを重み付けするように構成される。一例として、重み付け構成要素420は、前述の式(5)に従ってプリエンファシス励起信号PEExを取得してもよく（変更された音声度ファクタvoice_fac_A1が音声度ファクタvoice_facと置換するために使用される）、他の方法を使用することによりプリエンファシス励起信号を計算してもよい。変更された音声度ファクタvoice_fac_A1は、第１の変更構成要素440を使用することにより生成される。第１の変更構成要素440は、変更された音声度ファクタvoice_fac_A1を取得するために、ピッチ期間を使用することにより音声度ファクタを変更する。第１の変更構成要素440により実行される変更動作は、第２の変更構成要素450により実行される変更動作と同じでもよく、第２の変更構成要素450の変更動作と異なってもよい。すなわち、第１の変更構成要素440は、前述の式(2)に加えて他の式を使用することにより、ピッチ期間に基づいて音声度ファクタvoice_facを変更してもよい。

例えば、式(7)を使用することにより、デエンファシス構成要素430は、合成励起信号SExを取得するために、重み付け構成要素420からのプリエンファシス励起信号PEExにおいてデエンファシスファクタβを使用することにより、プリエンファシス励起信号PEExの高周波数部分を下げるためのデエンファシス動作を実行する。デエンファシスファクタβは、プリエンファシスファクタαと、プリエンファシス励起信号におけるプリエンファシス雑音の割合とに基づいて決定されてもよい。一例として、デエンファシスファクタβは、前述の式(8)又は式(9)に従って決定されてもよい。

前述のように、変更された音声度ファクタvoice_fac_A1又はvoice_fac_A2を置換するために、計算ユニット330により出力された音声度ファクタvoice_facは、重み付け構成要素420若しくは予測構成要素460又は双方に提供されてもよい。更に、プリエンファシス構成要素410及びデエンファシス構成要素430は削除されてもよく、重み付け構成要素420が、合成励起信号を取得するために、変更された音声度ファクタ（又は音声度ファクタvoice_fac）を使用することにより高帯域励起信号Exとランダム雑音とを重み付けする。

予測ユニット340又は合成ユニット350の説明については、図１を参照した130及び140の前述の説明を参照されたい。

高周波数符号化ユニット360は、合成励起信号SExと分割ユニット310からの高帯域信号とに基づいて高周波数符号化パラメータを取得する。一例として、高周波数符号化ユニット360は、高帯域信号でLPC分析を実行することにより高周波数LPC係数を取得し、高帯域励起信号がLPC係数に従って決定された合成フィルタを使用することによりフィルタリングされた後に、予測された高帯域信号を取得し、予測された高帯域信号と分割ユニット310からの高帯域信号とを比較することにより高周波数利得パラメータを取得する。高周波数利得パラメータ及びLPC係数は、高周波数符号化パラメータの構成要素である。更に、高周波数符号化ユニット360はまた、様々な従来又は将来の技術を使用することにより高周波数符号化パラメータを取得してもよく、合成励起信号と高帯域信号とに基づいて高周波数符号化パラメータを取得する特定の方法は、本発明への限定を構成するものではない。低周波数符号化パラメータ及び高周波数符号化パラメータが取得された後に、信号の符号化が実施され、これにより、信号が復元のためにデコーダ側に伝送され得る。

任意選択で、オーディオ信号符号化装置300は、符号化されたビットストリームをデコーダ側に送信するために、低周波数符号化パラメータと高周波数符号化パラメータとに従って符号化されたビットストリームを生成するように構成されたビットストリーム生成ユニット370を更に含んでもよい。

図３に示すオーディオ信号符号化装置の各ユニットにより実行される動作については、図１のオーディオ信号符号化方法を参照した説明を参照されたい。

本発明のこの実施例の前述のオーディオ信号符号化装置では、合成ユニット350は、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けし、高帯域信号の特性が、音声信号に基づいてより正確に示され得る。これにより、符号化効果を改善し得る。

図５は、本発明の実施例によるオーディオ信号復号化装置500の概略ブロック図である。オーディオ信号復号化装置500は、符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別するように構成された区別ユニット510と、低周波数符号化パラメータを復号化して低帯域信号を取得するように構成された低周波数復号化ユニット520と、低周波数符号化パラメータに従って音声度ファクタを計算するように構成された計算ユニット530であり、音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用される計算ユニット530と、低周波数符号化パラメータに従って高帯域励起信号を予測するように構成された予測ユニット540と、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けするように構成された合成ユニット550と、合成励起信号と高周波数符号化パラメータとに基づいて高帯域信号を取得するように構成された高周波数復号化ユニット560と、低帯域信号と高帯域信号とを結合して最終的な復号化された信号を取得するように構成された結合ユニット570とを含む。

符号化された信号を受信した後に、区別ユニット510は、低周波数復号化ユニット520のために符号化された信号における低周波数符号化パラメータを提供し、高周波数復号化ユニット560のために符号化された信号における高周波数符号化パラメータを提供する。低周波数符号化パラメータ及び高周波数符号化パラメータは、エンコーダ側から伝送され、低帯域信号と高帯域信号とを復元するために使用されるパラメータである。低周波数符号化パラメータは、例えば、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間と、他のパラメータを含んでもよく、高周波数符号化パラメータは、例えば、LPC係数と、高周波数利得パラメータと、他のパラメータとを含んでもよい。

低周波数復号化ユニット520は、低帯域信号を取得するために低周波数符号化パラメータを復号化する。特定の復号化モードは、エンコーダ側の符号化方法に対応する。更に、低周波数復号化ユニット520は、計算ユニット530及び予測ユニット540のために代数コードブック、代数コードブック利得、適応コードブック、適応コードブック利得又はピッチ期間のような低周波数符号化パラメータを更に提供する。計算ユニット530及び予測ユニット540は、区別ユニット510から必要な低周波数符号化パラメータを直接取得してもよい。

計算ユニット530は、低周波数符号化パラメータに従って音声度ファクタを計算するように構成される。音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用される。特に、計算ユニット530は、低周波数復号化ユニット520を使用することにより取得された低周波数符号化パラメータに従って音声度ファクタvoice_facを計算してもよく、例えば、計算ユニット530は、前述の式(1)に従って音声度ファクタvoice_facを計算してもよい。音声度ファクタは、合成励起信号を取得するために使用される。合成励起信号は、高帯域信号を取得するために高周波数復号化ユニット560に伝送される。

予測ユニット540及び合成ユニット550は、それぞれ図３のオーディオ信号符号化装置300の予測ユニット340及び合成ユニット350と同じである。従って、予測ユニット540及び合成ユニット550の構成については、図４の説明を参照されたい。例えば、１つの実装では、予測ユニット540は、第２の変更構成要素450と予測構成要素460との双方を含む。他の実装では、予測ユニット540は、単に予測構成要素460を含む。合成ユニット550については、１つの実装では、合成ユニット550は、プリエンファシス構成要素410と、重み付け構成要素420と、デエンファシス構成要素430とを含む。他の実装では、合成ユニット550は、第１の変更構成要素440と重み付け構成要素420とを含む。更に他の実装では、合成ユニット550は、プリエンファシス構成要素410と、重み付け構成要素420と、デエンファシス構成要素430と、第１の変更構成要素440とを含む。

高周波数復号化ユニット560は、合成励起信号と高周波数符号化パラメータとに基づいて高帯域信号を取得する。高周波数復号化ユニット560は、オーディオ信号符号化装置300の高周波数符号化ユニットの符号化技術に対応する復号化技術を使用することにより復号化を実行する。一例として、高周波数復号化ユニット560は、高周波数符号化パラメータのLPC係数を使用することにより合成フィルタを生成し、合成ユニット550からの合成励起信号が合成フィルタを使用することによりフィルタリングされた後に、予測された高帯域信号を復元し、予測された高帯域信号が高周波数符号化パラメータの高周波数利得パラメータを使用することにより調整された後に、最終的な高帯域信号を取得する。更に、高周波数復号化ユニット560はまた、様々な従来又は将来の技術を使用することにより実施されてもよく、特定の復号化技術は本発明への限定を構成するものではない。

結合ユニット570は、低帯域信号と高帯域信号とを結合し、最終的な復号化された信号を取得する。結合ユニット570の結合方法は、図３において分割ユニット310が分割動作を実行する分割方法に対応し、これにより、最終的な出力信号を取得するために復号化が実施される。

本発明のこの実施例の前述のオーディオ信号復号化装置では、高帯域励起信号及びランダム雑音は、合成励起信号を取得するために、音声度ファクタを使用することにより重み付けされ、高帯域信号の特性が、音声信号に基づいてより正確に示され得る。これにより、復号化効果を改善し得る。

図６は、本発明の実施例による送信機600の概略ブロック図である。図６の送信機600は、図３に示すオーディオ信号符号化装置300を含んでもよく、従って、繰り返しの説明は適宜省略される。更に、送信機600は、ビットストリームを生成してビットストリームを送信するために、オーディオ信号符号化装置300により生成された高周波数符号化パラメータ及び低周波数符号化パラメータのビット割り当てを実行するように構成された送信ユニット610を更に含んでもよい。

図７は、本発明の実施例による受信機700の概略ブロック図である。図７の受信機700は、図５に示すオーディオ信号復号化装置500を含んでもよく、従って、繰り返しの説明は適宜省略される。更に、受信機700は、処理のためにオーディオ信号復号化装置500のために符号化された信号を提供するために、符号化された信号を受信する受信ユニット710を更に含んでもよい。

本発明の他の実施例では、通信システムが更に提供され、通信システムは、図６を参照して説明した送信機600又は図７を参照して説明した受信機700を含んでもよい。

図８は、本発明の他の実施例による装置の概略ブロック図である。図８の装置800は、前述の方法の実施例のステップ及び方法を実施するように構成されてもよい。装置800は、様々な通信システムにおける基地局又は端末に適用されてもよい。図８の実施例では、装置800は、送信回路802と、受信回路803と、符号化プロセッサ804と、復号化プロセッサ805と、処理ユニット806と、メモリ807と、アンテナ801とを含む。処理ユニット806は、装置800の動作を制御し、処理ユニット806はまた、中央処理装置（CPU：Central Processing Unit）と呼ばれてもよい。メモリ807は、読み取り専用メモリとランダムアクセスメモリとを含んでもよく、処理ユニット806のための命令及びデータを提供する。メモリ807の一部は、不揮発性ランダムアクセスメモリ（NVRAM：nonvolatile random access memory）を更に含んでもよい。特定の用途では、装置800は、移動電話のような無線通信デバイス内に構築されてもよく、装置800自体が無線通信デバイスでもよい。装置800は、装置800と遠隔位置との間のデータ送信及び受信を可能にするために、送信回路802と受信回路803とを収容するキャリアを更に含んでもよい。送信回路802及び受信回路803は、アンテナ801に結合されてもよい。装置800の構成要素は、バスシステム809を使用することにより一緒に結合される。データバスに加えて、バスシステム809は、電力バスと、制御バスと、状態信号バスとを更に含む。しかし、説明を簡潔にするため、様々なバスは図面においてバスシステム809として示される。装置800は、信号を処理する処理ユニット806を更に含んでもよく、更に、装置800は、符号化プロセッサ804と復号化プロセッサ805とを更に含む。

本発明の前述の実施例に開示されたオーディオ信号符号化方法は、符号化プロセッサ804に適用されてもよく、符号化プロセッサ804により実施されてもよい。本発明の前述の実施例に開示されたオーディオ信号復号化方法は、復号化プロセッサ805に適用されてもよく、復号化プロセッサ805により実施されてもよい。符号化プロセッサ804及び復号化プロセッサ805は、集積回路チップでもよく、信号処理機能を有する。実施プロセスにおいて、前述の方法は、符号化プロセッサ804又は復号化プロセッサ805のハードウェアの集積論理回路を用いて行われてもよく、ソフトウェアの形式の命令を用いて行われてもよい。これらの命令は、プロセッサ806と協力することにより実施又は制御されてもよい。本発明の実施例に開示された方法を実行するように構成された前述の復号化プロセッサは、汎用プロセッサ、デジタルシグナルプロセッサ（DSP：digital signal processor）、特定用途向け集積回路（ASIC：application specific integrated circuit）、フィールドプログラマブルゲートアレイ（FPGA：field programmable gate array）若しくは他のプログラム可能な論理コンポーネント、ディスクリート・ゲート（discrete gate）若しくはトランジスタ論理コンポーネント、又はディスクリート・ハードウェア・アセンブリでもよい。復号化プロセッサは、本発明の実施例に開示された方法、ステップ及び論理ブロック図を実施又は実行してもよい。汎用プロセッサは、マイクロプロセッサでもよく、プロセッサはまた、いずれかの従来のプロセッサ、変換器等でもよい。本発明の実施例を参照して開示された方法のステップは、ハードウェア復号化プロセッサを使用することにより直接実行されて行われてもよく、復号化プロセッサのハードウェアモジュール及びソフトウェアモジュールの組み合わせを使用することにより実行されて行われてもよい。ソフトウェアモジュールは、ランダムアクセスメモリ、フラッシュメモリ、読み取り専用メモリ、プログラム可能読み取り専用メモリ、電気的消去可能プログラム可能メモリ、又はレジスタのような当該技術分野において成熟した記憶媒体に存在してもよい。記憶媒体は、メモリ807に存在し、符号化プロセッサ804又は復号化プロセッサ805はメモリ807からの情報を読み取り、符号化プロセッサ804又は復号化プロセッサ805のハードウェアと組み合わせて前述の方法を行う。例えば、メモリ807は、符号化又は復号化の間に使用するため、符号化プロセッサ804又は復号化プロセッサ805のために低周波数符号化パラメータを提供するため、取得された低周波数符号化パラメータを格納してもよい。

例えば、図３のオーディオ信号符号化装置300は、符号化プロセッサ804により実装されてもよく、図５のオーディオ信号復号化装置500は、復号化プロセッサ805により実装されてもよい。更に、図４の予測ユニット及び合成ユニットは、プロセッサ806により実装されてもよく、符号化プロセッサ804又は復号化プロセッサ805により実装されてもよい。

更に、例えば、図６の送信機610は、符号化プロセッサ804、送信回路802、アンテナ801等により実装されてもよい。図７の受信機710は、アンテナ801、受信回路803、復号化プロセッサ805等により実装されてもよい。しかし、前述の例は単なる例であり、本発明の実施例をこの特定の実装形式に限定することを意図するものではない。

特に、メモリ807は、プロセッサ806及び／又は符号化プロセッサ804が以下の動作、すなわち、符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割し、低帯域信号を符号化して低周波数符号化パラメータを取得し、低周波数符号化パラメータに従って音声度ファクタを計算し、低周波数符号化パラメータに従って高帯域励起信号を予測し、音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用され、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けし、合成励起信号と高帯域信号とに基づいて高周波数符号化パラメータを取得することを実施可能にする命令を格納する。メモリ807は、プロセッサ806又は復号化プロセッサ805が以下の動作、すなわち、符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別し、低周波数符号化パラメータを復号化して低帯域信号を取得し、低周波数符号化パラメータに従って音声度ファクタを計算し、低周波数符号化パラメータに従って高帯域励起信号を予測し、音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用され、合成励起信号を取得するために、音声度ファクタを使用することにより高帯域励起信号とランダム雑音とを重み付けし、合成励起信号と高周波数符号化パラメータとに基づいて高帯域信号を取得し、低帯域信号と高帯域信号とを結合して最終的な復号化された信号を取得することを実施可能にする命令を格納する。

本発明の実施例による通信システム又は通信装置は、前述のオーディオ信号符号化装置300、送信機600、オーディオ信号復号化装置500、受信機700等の一部又は全部を含んでもよい。

当業者は、この明細書に開示された実施例に記載の例と組み合わせて、ユニット及びアルゴリズムのステップが、電子ハードウェアにより実施されてもよく、コンピュータソフトウェアと電子ハードウェアとの組み合わせにより実施されてもよいことを認識し得る。機能がハードウェアにより実行されるかソフトウェアにより実行されるかは、技術的対策の特定の用途及び設計上の制約条件に依存する。当業者は、特定の用途毎に記載の機能を実施するために異なる方法を使用してもよいが、これは、この実施が本発明の範囲を超えるものとして考えられるべきではない。

便宜上の説明及び簡潔な説明の目的で、前述のシステム、装置及びユニットの詳細な動作処理について、前述の方法の実施例の対応する処理に参照が行われてもよいことが、当業者に明確に分かる。詳細はここでは再び説明しない。

この出願で提供される複数の実施例では、開示のシステム、装置及び方法は、他の方法で実施されてもよいことが分かる。例えば、記載された装置の実施例は単なる例である。例えば、ユニット分割は単なる論理的な機能分割であり、実際の実装では他の分割でもよい。例えば、複数のユニット又はコンポーネントは他のシステムに結合又は統合されてもよく、いくつかの機能は無視されてもよく実行されなくてもよい。

別々の部分として記載したユニットは、物理的に別々でもよく別々でなくてもよく、ユニットとして表示された部分は物理的ユニットでもよく物理的ユニットでなくてもよく、１つの位置に存在してもよく、複数のネットワークユニットに分散されてもよい。ユニットの一部又は全部は、実施例の対策の目的を実現するために、実際のニーズに従って選択されてもよい。

機能がソフトウェア機能ユニットの形式で実装されて独立したプロダクトとして販売又は使用される場合、機能はコンピュータ読み取り可能媒体に格納されてもよい。このような理解に基づいて、本発明の技術的対策は、基本的に、或いは従来技術に寄与する部分は、或いは技術的対策の一部は、ソフトウェアプロダクトの形式で実装されてもよい。ソフトウェアプロダクトは、記憶媒体に格納され、コンピュータデバイス（パーソナルコンピュータ、サーバ又はネットワークデバイスでもよい）に対して本発明の実施例に記載の方法のステップの全部又は一部を実行するように命令する複数の命令を含む。前述の記憶媒体は、USBフラッシュドライブ、取り外し可能ハードディスク、読み取り専用メモリ（ROM：Read-Only Memory）、ランダムアクセスメモリ（RAM：Random Access Memory）、磁気ディスク又は光ディスクのような、プログラムコードを格納することができるいずれかの媒体を含む。

前述の説明は、本発明の単に特定の実装方法に過ぎず、本発明の保護範囲を限定することを意図するものではない。本発明に開示された技術的範囲内で当業者により容易に理解できる如何なる変更又は置換も、本発明の保護範囲内に入るものとする。従って、本発明の保護範囲は、特許請求の範囲の保護範囲に従うものとする。

Claims

符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割するステップと、
前記低帯域信号を符号化して低周波数符号化パラメータを取得するステップと、
前記低周波数符号化パラメータに従って音声度ファクタを計算し、前記低周波数符号化パラメータに従って高帯域励起信号を予測するステップであり、前記音声度ファクタは、前記高帯域信号により示される音声特性の程度を示すために使用されるステップと、
合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするステップと、
前記合成励起信号と前記高帯域信号とに基づいて高周波数符号化パラメータを取得するステップと
を有し、
合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするステップは、
プリエンファシス雑音を取得するために、前記ランダム雑音においてプリエンファシスファクタを使用することにより前記ランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行するステップと、
プリエンファシス励起信号を生成するために、前記音声度ファクタを使用することにより前記高帯域励起信号と前記プリエンファシス雑音とを重み付けするステップと、
前記合成励起信号を取得するために、前記プリエンファシス励起信号においてデエンファシスファクタを使用することにより前記プリエンファシス励起信号の高周波数部分を下げるためのデエンファシス動作を実行するステップと
を有するオーディオ信号符号化方法。
前記デエンファシスファクタは、前記プリエンファシスファクタと、前記プリエンファシス励起信号における前記プリエンファシス雑音の割合とに基づいて決定される、請求項１に記載の方法。
符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割するステップと、
前記低帯域信号を符号化して低周波数符号化パラメータを取得するステップと、
前記低周波数符号化パラメータに従って音声度ファクタを計算し、前記低周波数符号化パラメータに従って高帯域励起信号を予測するステップであり、前記音声度ファクタは、前記高帯域信号により示される音声特性の程度を示すために使用されるステップと、
合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするステップと、
前記合成励起信号と前記高帯域信号とに基づいて高周波数符号化パラメータを取得するステップと
を有し、
前記低周波数符号化パラメータは、ピッチ期間を有し、
合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするステップは、
前記ピッチ期間を使用することにより前記音声度ファクタを変更するステップと、
前記合成励起信号を取得するために、変更された音声度ファクタを使用することにより前記高帯域励起信号と前記ランダム雑音とを重み付けするステップと
を有するオーディオ信号符号化方法。
符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割するステップと、
前記低帯域信号を符号化して低周波数符号化パラメータを取得するステップと、
前記低周波数符号化パラメータに従って音声度ファクタを計算し、前記低周波数符号化パラメータに従って高帯域励起信号を予測するステップであり、前記音声度ファクタは、前記高帯域信号により示される音声特性の程度を示すために使用されるステップと、
合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするステップと、
前記合成励起信号と前記高帯域信号とに基づいて高周波数符号化パラメータを取得するステップと
を有し、
前記低周波数符号化パラメータは、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間とを有し、
前記低周波数符号化パラメータに従って高帯域励起信号を予測するステップは、
前記ピッチ期間を使用することにより前記音声度ファクタを変更するステップと、
重み付け結果を取得するために、変更された音声度ファクタを使用することにより前記代数コードブックと前記ランダム雑音とを重み付けし、前記高帯域励起信号を予測するために、前記重み付け結果及び前記代数コードブック利得の積と、前記適応コードブック及び前記適応コードブック利得の積とを加算するステップと
を有するオーディオ信号符号化方法。
前記ピッチ期間を使用することにより前記音声度ファクタを変更するステップは、
以下の式：

に従って実行され、ただし、voice_facは前記音声度ファクタであり、T0は前記ピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれ前記ピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは前記変更された音声度ファクタである、請求項４に記載の方法。
前記ピッチ期間を使用することにより前記音声度ファクタを変更するステップは、
以下の式：

に従って実行され、ただし、voice_facは前記音声度ファクタであり、T0は前記ピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれ前記ピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは前記変更された音声度ファクタである、請求項３に記載の方法。
符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別するステップと、
前記低周波数符号化パラメータを復号化して低帯域信号を取得するステップと、
前記低周波数符号化パラメータに従って音声度ファクタを計算し、前記低周波数符号化パラメータに従って高帯域励起信号を予測するステップであり、前記音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用されるステップと、
合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするステップと、
前記合成励起信号と前記高周波数符号化パラメータとに基づいて前記高帯域信号を取得するステップと、
前記低帯域信号と前記高帯域信号とを結合して最終的な復号化された信号を取得するステップと
を有し、
合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするステップは、
プリエンファシス雑音を取得するために、前記ランダム雑音においてプリエンファシスファクタを使用することにより前記ランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行するステップと、
プリエンファシス励起信号を生成するために、前記音声度ファクタを使用することにより前記高帯域励起信号と前記プリエンファシス雑音とを重み付けするステップと、
前記合成励起信号を取得するために、前記プリエンファシス励起信号においてデエンファシスファクタを使用することにより前記プリエンファシス励起信号の高周波数部分を下げるためのデエンファシス動作を実行するステップと
を有するオーディオ信号復号化方法。
前記デエンファシスファクタは、前記プリエンファシスファクタと、前記プリエンファシス励起信号における前記プリエンファシス雑音の割合とに基づいて決定される、請求項７に記載の方法。
符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別するステップと、
前記低周波数符号化パラメータを復号化して低帯域信号を取得するステップと、
前記低周波数符号化パラメータに従って音声度ファクタを計算し、前記低周波数符号化パラメータに従って高帯域励起信号を予測するステップであり、前記音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用されるステップと、
合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするステップと、
前記合成励起信号と前記高周波数符号化パラメータとに基づいて前記高帯域信号を取得するステップと、
前記低帯域信号と前記高帯域信号とを結合して最終的な復号化された信号を取得するステップと
を有し、
前記低周波数符号化パラメータは、ピッチ期間を有し、
合成励起信号を取得するために、前記音声度ファクタを使用することにより前記予測された高帯域励起信号とランダム雑音とを重み付けするステップは、
前記ピッチ期間を使用することにより前記音声度ファクタを変更するステップと、
前記合成励起信号を取得するために、変更された音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするステップと
を有するオーディオ信号復号化方法。
符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別するステップと、
前記低周波数符号化パラメータを復号化して低帯域信号を取得するステップと、
前記低周波数符号化パラメータに従って音声度ファクタを計算し、前記低周波数符号化パラメータに従って高帯域励起信号を予測するステップであり、前記音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用されるステップと、
合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするステップと、
前記合成励起信号と前記高周波数符号化パラメータとに基づいて前記高帯域信号を取得するステップと、
前記低帯域信号と前記高帯域信号とを結合して最終的な復号化された信号を取得するステップと
を有し、
前記低周波数符号化パラメータは、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間とを有し、
前記低周波数符号化パラメータに従って高帯域励起信号を予測するステップは、
前記ピッチ期間を使用することにより前記音声度ファクタを変更するステップと、
重み付け結果を取得するために、変更された音声度ファクタを使用することにより前記代数コードブックと前記ランダム雑音とを重み付けするステップと、
前記高帯域励起信号を予測するために、前記重み付け結果及び前記代数コードブック利得の積と、前記適応コードブック及び前記適応コードブック利得の積とを加算するステップと
を有するオーディオ信号復号化方法。
前記ピッチ期間を使用することにより前記音声度ファクタを変更するステップは、
以下の式：

に従って実行され、ただし、voice_facは前記音声度ファクタであり、T0は前記ピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれ前記ピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは前記変更された音声度ファクタである、請求項１０に記載の方法。
前記ピッチ期間を使用することにより前記音声度ファクタを変更するステップは、
以下の式：

に従って実行され、ただし、voice_facは前記音声度ファクタであり、T0は前記ピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれ前記ピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは前記変更された音声度ファクタである、請求項９に記載の方法。
符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割するように構成された分割ユニットと、
前記低帯域信号を符号化して低周波数符号化パラメータを取得するように構成された低周波数符号化ユニットと、
前記低周波数符号化パラメータに従って音声度ファクタを計算するように構成された計算ユニットであり、前記音声度ファクタは、前記高帯域信号により示される音声特性の程度を示すために使用される計算ユニットと、
前記低周波数符号化パラメータに従って高帯域励起信号を予測するように構成された予測ユニットと、
合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするように構成された合成ユニットと、
前記合成励起信号と前記高帯域信号とに基づいて高周波数符号化パラメータを取得するように構成された高周波数符号化ユニットと
を有し、
前記合成ユニットは、
プリエンファシス雑音を取得するために、前記ランダム雑音においてプリエンファシスファクタを使用することにより前記ランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行するように構成されたプリエンファシス構成要素と、
プリエンファシス励起信号を生成するために、前記音声度ファクタを使用することにより前記高帯域励起信号と前記プリエンファシス雑音とを重み付けするように構成された重み付け構成要素と、
前記合成励起信号を取得するために、前記プリエンファシス励起信号においてデエンファシスファクタを使用することにより前記プリエンファシス励起信号の高周波数部分を下げるためのデエンファシス動作を実行するように構成されたデエンファシス構成要素と
を有するオーディオ信号符号化装置。
前記デエンファシスファクタは、前記プリエンファシスファクタと、前記プリエンファシス励起信号における前記プリエンファシス雑音の割合とに基づいて決定される、請求項１３に記載の装置。
符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割するように構成された分割ユニットと、
前記低帯域信号を符号化して低周波数符号化パラメータを取得するように構成された低周波数符号化ユニットと、
前記低周波数符号化パラメータに従って音声度ファクタを計算するように構成された計算ユニットであり、前記音声度ファクタは、前記高帯域信号により示される音声特性の程度を示すために使用される計算ユニットと、
前記低周波数符号化パラメータに従って高帯域励起信号を予測するように構成された予測ユニットと、
合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするように構成された合成ユニットと、
前記合成励起信号と前記高帯域信号とに基づいて高周波数符号化パラメータを取得するように構成された高周波数符号化ユニットと
を有し、
前記低周波数符号化パラメータは、ピッチ期間を有し、
前記合成ユニットは、
前記ピッチ期間を使用することにより前記音声度ファクタを変更するように構成された第１の変更構成要素と、
前記合成励起信号を取得するために、変更された音声度ファクタを使用することにより前記高帯域励起信号と前記ランダム雑音とを重み付けするように構成された重み付け構成要素と
を有するオーディオ信号符号化装置。
符号化される時間ドメイン信号を低帯域信号と高帯域信号に分割するように構成された分割ユニットと、
前記低帯域信号を符号化して低周波数符号化パラメータを取得するように構成された低周波数符号化ユニットと、
前記低周波数符号化パラメータに従って音声度ファクタを計算するように構成された計算ユニットであり、前記音声度ファクタは、前記高帯域信号により示される音声特性の程度を示すために使用される計算ユニットと、
前記低周波数符号化パラメータに従って高帯域励起信号を予測するように構成された予測ユニットと、
合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするように構成された合成ユニットと、
前記合成励起信号と前記高帯域信号とに基づいて高周波数符号化パラメータを取得するように構成された高周波数符号化ユニットと
を有し、
前記低周波数符号化パラメータは、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間とを有し、
前記予測ユニットは、
前記ピッチ期間を使用することにより前記音声度ファクタを変更するように構成された第２の変更構成要素と、
重み付け結果を取得するために、変更された音声度ファクタを使用することにより前記代数コードブックと前記ランダム雑音とを重み付けし、前記高帯域励起信号を予測するために、前記重み付け結果及び前記代数コードブック利得の積と、前記適応コードブック及び前記適応コードブック利得の積とを加算するように構成された予測構成要素と
を有するオーディオ信号符号化装置。
以下の式：

に従って前記音声度ファクタを変更し、ただし、voice_facは前記音声度ファクタであり、T0は前記ピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれ前記ピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは前記変更された音声度ファクタである、請求項１５に記載の装置。
以下の式：

に従って前記音声度ファクタを変更し、ただし、voice_facは前記音声度ファクタであり、T0は前記ピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれ前記ピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは前記変更された音声度ファクタである、請求項１６に記載の装置。
符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別するように構成された区別ユニットと、
前記低周波数符号化パラメータを復号化して低帯域信号を取得するように構成された低周波数復号化ユニットと、
前記低周波数符号化パラメータに従って音声度ファクタを計算するように構成された計算ユニットであり、前記音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用される計算ユニットと、
前記低周波数符号化パラメータに従って高帯域励起信号を予測するように構成された予測ユニットと、
合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするように構成された合成ユニットと、
前記合成励起信号と前記高周波数符号化パラメータとに基づいて前記高帯域信号を取得するように構成された高周波数復号化ユニットと、
前記低帯域信号と前記高帯域信号とを結合して最終的な復号化された信号を取得するように構成された結合ユニットと
を有し、
前記合成ユニットは、
プリエンファシス雑音を取得するために、前記ランダム雑音においてプリエンファシスファクタを使用することにより前記ランダム雑音の高周波数部分を拡張するためのプリエンファシス動作を実行するように構成されたプリエンファシス構成要素と、
プリエンファシス励起信号を生成するために、前記音声度ファクタを使用することにより前記高帯域励起信号と前記プリエンファシス雑音とを重み付けするように構成された重み付け構成要素と、
前記合成励起信号を取得するために、前記プリエンファシス励起信号においてデエンファシスファクタを使用することにより前記プリエンファシス励起信号の高周波数部分を下げるためのデエンファシス動作を実行するように構成されたデエンファシス構成要素と
を有するオーディオ信号復号化装置。
前記デエンファシスファクタは、前記プリエンファシスファクタと、前記プリエンファシス励起信号における前記プリエンファシス雑音の割合とに基づいて決定される、請求項１９に記載の装置。
符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別するように構成された区別ユニットと、
前記低周波数符号化パラメータを復号化して低帯域信号を取得するように構成された低周波数復号化ユニットと、
前記低周波数符号化パラメータに従って音声度ファクタを計算するように構成された計算ユニットであり、前記音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用される計算ユニットと、
前記低周波数符号化パラメータに従って高帯域励起信号を予測するように構成された予測ユニットと、
合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするように構成された合成ユニットと、
前記合成励起信号と前記高周波数符号化パラメータとに基づいて前記高帯域信号を取得するように構成された高周波数復号化ユニットと、
前記低帯域信号と前記高帯域信号とを結合して最終的な復号化された信号を取得するように構成された結合ユニットと
を有し、
前記低周波数符号化パラメータは、ピッチ期間を有し、
前記合成ユニットは、
前記ピッチ期間を使用することにより前記音声度ファクタを変更するように構成された第１の変更構成要素と、
前記合成励起信号を取得するために、変更された音声度ファクタを使用することにより前記高帯域励起信号と前記ランダム雑音とを重み付けするように構成された重み付け構成要素と
を有するオーディオ信号復号化装置。
符号化された情報において低周波数符号化パラメータと高周波数符号化パラメータとを区別するように構成された区別ユニットと、
前記低周波数符号化パラメータを復号化して低帯域信号を取得するように構成された低周波数復号化ユニットと、
前記低周波数符号化パラメータに従って音声度ファクタを計算するように構成された計算ユニットであり、前記音声度ファクタは、高帯域信号により示される音声特性の程度を示すために使用される計算ユニットと、
前記低周波数符号化パラメータに従って高帯域励起信号を予測するように構成された予測ユニットと、
合成励起信号を取得するために、前記音声度ファクタを使用することにより前記高帯域励起信号とランダム雑音とを重み付けするように構成された合成ユニットと、
前記合成励起信号と前記高周波数符号化パラメータとに基づいて前記高帯域信号を取得するように構成された高周波数復号化ユニットと、
前記低帯域信号と前記高帯域信号とを結合して最終的な復号化された信号を取得するように構成された結合ユニットと
を有し、
前記低周波数符号化パラメータは、代数コードブックと、代数コードブック利得と、適応コードブックと、適応コードブック利得と、ピッチ期間とを有し、
前記予測ユニットは、
前記ピッチ期間を使用することにより前記音声度ファクタを変更するように構成された第２の変更構成要素と、
重み付け結果を取得するために、変更された音声度ファクタを使用することにより前記代数コードブックと前記ランダム雑音とを重み付けし、前記高帯域励起信号を予測するために、前記重み付け結果及び前記代数コードブック利得の積と、前記適応コードブック及び前記適応コードブック利得の積とを加算するように構成された予測構成要素と
を有するオーディオ信号復号化装置。
以下の式：

に従って前記音声度ファクタを変更し、ただし、voice_facは前記音声度ファクタであり、T0は前記ピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれ前記ピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは前記変更された音声度ファクタである、請求項２１に記載の装置。
以下の式：

に従って前記音声度ファクタを変更し、ただし、voice_facは前記音声度ファクタであり、T0は前記ピッチ期間であり、a1、a2及びb1>0であり、b2≧0であり、threshold_min及びthreshold_maxはそれぞれ前記ピッチ期間の予め設定された最小値及び予め設定された最大値であり、voice_fac_Aは前記変更された音声度ファクタである、請求項２２に記載の装置。
コンピュータに対して請求項１ないし６のうちいずれか１項に記載の方法を実行させるプログラムを記録したコンピュータ読み取り可能記憶媒体。
コンピュータに対して請求項７ないし１２のうちいずれか１項に記載の方法を実行させるプログラムを記録したコンピュータ読み取り可能記憶媒体。