JP2003522964A

JP2003522964A - 背景ノイズが共存する符号化音声の品質を向上させるためのシステムおよび方法

Info

Publication number: JP2003522964A
Application number: JP2000547612A
Authority: JP
Inventors: スウ，フアン−ユ; ベンヤッシーネ，アディル
Original assignee: Conexant Systems LLC
Current assignee: Conexant Systems LLC
Priority date: 1998-05-11
Filing date: 1999-05-04
Publication date: 2003-07-29
Anticipated expiration: 2019-05-04
Also published as: EP1076895B1; DE69905152D1; ATE232008T1; JP4420562B2; WO1999057715A1; DE69905152T2; EP1076895A1; US6122611A

Abstract

(57)【要約】背景ノイズが共存する符号化音声の品質を向上させるためのシステムおよび方法である。たとえば、この発明は、通信ネットワークを介して符号化音声信号を受取り、次に、その中に含まれる異なったパラメータを復号化しかつ合成して、合成音声信号を発生する。この発明は、合成音声信号内に表わされる非音声期間を決定する。決定された非音声期間は次に、シミュレートされた背景ノイズを出力信号に注入するために利用される。さらに、非音声期間はまた、シミュレートされた背景ノイズを合成音声信号の音声期間といつ組合せるべきかを決定するためにこの発明によって用いられる。この発明の結果得られた出力信号は、音声期間どうしの間に実質的に存在する背景ノイズとは対照的に、背景ノイズの連続した存在のために、人の耳にはより自然かつ現実的に聞こえる向上された合成音声信号である。

Description

【発明の詳細な説明】

【０００１】

【発明の分野】

この発明は、通信の分野に関する。より具体的には、この発明は、符号化音声
通信の分野に関する。

【０００２】

【背景技術】

２人以上の人の間の会話の際には、周囲または背景ノイズは典型的には、人の
耳の全般的な聴覚経験に固有のものである。図１は、典型的な録音された会話の
アナログ音波１００を示し、これは、音声通信によって生じる音声群１０４〜１
０８とともに背景または周囲のノイズ信号１０２を含む。音声通信の伝送、受信
および記憶の技術的分野では、音声群１０４〜１０８の符号化および復号化には
いくつかの異なった技術が存在する。音声群１０４〜１０８の符号化および復号
化の技術の１つは、符号励起線形予測（ＣＥＬＰ）コーダなど、分析合成符号化
システム（analysis-by-synthesis coding system）を用いるものであり、たと
えば国際電気通信連合（International Telecommunication Union、ＩＴＵ）推
奨Ｇ．７２９を参照されたい。

【０００３】図２は、音声の符号化および復号化のための先行技術の分析合成システム２０
０の一般的な概略ブロック図を示す。図１の音声群１０４〜１０８の符号化およ
び復号化のための分析合成システム２００は、対応する合成ユニット２２０とと
もに分析ユニット２０４を利用する。分析ユニット２０４は、ＣＥＬＰコーダな
どの、分析合成タイプの音声コーダを表わす。符号励起線形予測コーダは、通信
ネットワークおよび記憶容量の制約に見合うために中間のまたは低いビットレー
トで音声群１０４〜１０８を符号化する方法の１つである。

【０００４】音声を符号化するために、分析ユニット２０４の図２のマイクロホン２０６は
、入力信号として図１のアナログ音波１００を受取る。マイクロホン２０６は、
受取ったアナログ音波１００を、アナログ−デジタル（Ａ／Ｄ）サンプラ回路２
０８に出力する。アナログ−デジタルサンプラ２０８は、アナログ音波１００を
、サンプリングされたデジタル音声信号（離散的時間期間にわたってサンプリン
グされている）に変換し、これは線形予測係数（ＬＰＣ）抽出器２１０およびコ
ードブック２１４に出力される。

【０００５】図２の線形予測係数抽出器２１０は、Ａ／Ｄサンプラ２０８から受取ったサン
プリングされたデジタル音声信号から線形予測係数を抽出する。隣接する音声サ
ンプルどうしの間の短期相関に関連する線形予測係数は、サンプリングされたデ
ジタル音声信号の声道を表わす。決定された線形予測係数は次に、上述のとおり
、インデックスを備えるルックアップテーブルを用いてＬＰＣ抽出器２１０によ
って量子化される。ＬＰＣ抽出器２１０は次に、量子化された線形予測係数のイ
ンデックス値とともに、サンプリングされたデジタル音声信号の残余をピッチ抽
出器２１２に伝送する。

【０００６】図２のピッチ抽出器２１２は、線形予測係数抽出器２１０から受取ったサンプ
リングされたデジタル音声信号内のピッチ周期どうしの間に存在する長期相関を
除去する。言い換えれば、ピッチ抽出器２１２は、受取ったサンプリングされた
デジタル音声信号から周期性を除去し、その結果白色残差音声信号が得られる。
決定されたピッチ値は次に、上述のとおり、インデックスを備えるルックアップ
テーブルを用いてピッチ抽出器２１２によって量子化される。ピッチ抽出器２１
２は次に、量子化された線形予測係数および量子化されたピッチのインデックス
値を記憶装置／伝送ユニット２１６に伝送する。

【０００７】図２のコードブック２１４は、コードワードと呼ばれる、特定の数の記憶され
たデジタルパターンを含む。コードブック２１４は通常、当業者には公知である
ように、最良の代表ベクトルを与え、何らかの知覚される態様で残差信号を量子
化するために検索される。選択されたコードワードまたはベクトルは典型的には
、固定の励起コードワードと呼ばれる。受取った信号を表わす最良のコードワー
ドを決定した後、コードブック回路２１４はまた、受取った信号の利得係数を計
算する。決定された利得係数は次に、インデックスを備えるルックアップテーブ
ルを用いてコードブック２１４によって量子化されるが、これは当業者には周知
の量子化方式である。コードブック２１４は次に、量子化された利得のインデッ
クス値とともに決定されたコードワードのインデックスを、記憶装置／伝送器ユ
ニット２１６に伝送する。

【０００８】分析ユニット２０４の図２の記憶装置／伝送器２１６は次に、通信ネットワー
ク２１８を介して合成ユニット２２０にピッチ、利得、線形予測係数のインデッ
クス値およびコードワードを伝送するが、これらはすべて、受取ったアナログ音
波信号１００を表わすものである。合成ユニット２２０は、記憶装置／伝送器２
１６から受取った異なったパラメータを復号化し、合成音声信号を得る。人が合
成音声信号を聞くことを可能にするために、合成ユニット２２０は、合成音声信
号をスピーカ２２２に出力する。

【０００９】図２を参照して上述した分析合成システム２００に関連した不利益が存在する
。分析ユニット２０４が中間または低いビットレートでアナログ音波１００をサ
ンプリングした場合、合成ユニット２２０によって発生され、スピーカ２２２に
よって出力された符号化音声は、自然に聞こえない。図３は、合成ユニット２２
０によってスピーカ２２２に出力された合成音声信号３００の例を示す。合成音
声信号３００は、音声群３０４〜３０８とともに背景ノイズ３０２を含む。合成
音声３００内には、音声群３０４〜３０８内で発生された、減衰された背景ノイ
ズ３０２があることに注目されたい。この現象の理由は、分析ユニットコーダ２
０４は、アナログ音波１００の図１の音声群１０４〜１０８をモデリングするた
めに特に調整されており、音声群１０４〜１０８内に存在する背景ノイズ１０２
を適切に再生することができないということである。したがって、合成音声信号
３００がスピーカ２２２によって出力されたとき、これは、音声群３０４〜３０
８の初めおよび終わりで生じる、背景ノイズ３０２の振幅における突然の変化の
ために、人の耳には不自然に聞こえる。

【００１０】したがって、音声を符号化および復号化するための分析合成システムの分析ユ
ニットによって中間または低いビットレートで符号化された音声信号を考慮する
と、人の耳に自然かつ現実的に聞こえる合成音声信号を合成ユニットが出力する
ことを可能とするシステムを提供することが有利であろう。この発明は、この利
点を提供する。

【００１１】

【発明の概要】

この発明は、背景ノイズが共存する符号化音声の品質を向上させるためのシス
テムおよび方法を含む。たとえば、この発明は、通信ネットワークを介して符号
化音声信号を受取り、次に、その中に含まれる異なったパラメータを復号化しか
つ合成し、合成音声信号を発生する。この発明は、合成音声信号内に表わされる
非音声期間を決定する。決定された非音声期間は次に、シミュレートされた背景
ノイズを出力信号に注入するために利用される。さらに、非音声期間はまた、シ
ミュレートされた背景ノイズを合成音声信号の音声期間といつ組合せるべきかを
決定するために、この発明によって使用される。この発明の結果得られた出力信
号は、音声期間どうしの間に実質的に存在する背景ノイズとは対照的に、背景ノ
イズの連続的な存在のために、人の耳にはより自然かつ現実的に聞こえる向上さ
れた合成音声信号である。

【００１２】背景ノイズが共存する符号化音声の品質を向上させるための方法であって、こ
の方法は、（ａ）合成音声部分および合成背景ノイズ部分を有する合成音声信号
を発生するステップを含み、受取られた符号化音声信号に基づく合成音声信号は
、線形予測係数、ピッチ係数、励起コードワードおよびエネルギ（利得）を含み
、さらにこの方法は、（ｂ）合成音声信号の合成背景ノイズ部分に対応する符号
化音声信号から抽出されたエネルギおよび線形予測係数のサブセットを用いて背
景ノイズ信号を生成するステップと、（ｃ）背景ノイズ信号および合成音声信号
を組合せ、自然に聞こえる出力合成音声信号を発生するステップとを含む。

【００１３】この明細書の一部に組込まれかつこれを形成する添付の図面は、この発明の実
施例を例示し、この説明とともに、この発明の原理を説明する役割を果たす。

【００１４】

【詳細な説明】

この発明の、背景ノイズが共存する符号化音声の品質を向上させるためのシス
テムおよび方法の以下の詳細な説明では、この発明を完全に理解するために、多
くの具体的詳細が述べられる。しかしながら、この発明はこれらの具体的詳細な
しに実施可能であることは、当業者には明らかである。他の場合には、周知の方
法、処理、構成要素および回路は、この発明の局面を不必要にわかりにくくしな
いように詳細には記載されない。

【００１５】この発明は、符号化音声通信の分野内で動作する。具体的には、図４は、この
発明が動作する通信および記憶装置のための、音声を符号化し復号化するために
用いられる分析合成システム４００の一般的な概略を示す。分析ユニット４０２
は、背景ノイズとともに音声通信の表示を構成する信号である会話信号４１２を
受取る。この発明における分析ユニット４０２のある実施例は、先に記載された
図２の分析ユニット２０４と同じ電気的構成要素および動作を有する。分析ユニ
ット４０２は、会話信号４１２を、音声部分および背景ノイズ部分を含むデジタ
ルの（圧縮された）符号化音声信号４１４に符号化する。受取った会話信号４１
２を符号化した後、分析ユニット４０２は、符号化音声信号４１４を通信ネット
ワーク４０６を介して受信機４１６（たとえば電話または携帯電話）に伝送する
か、または、記憶装置４０４（たとえば、磁気または光学記録装置または留守番
電話）に伝送することが可能である。

【００１６】図４の受信機４１６は、通信ネットワーク４０６を介して受信すると、符号化
音声信号４１４を合成ユニット４０８に転送する。合成ユニット４０８は、受信
した符号化音声信号４１４によって表わされる合成音声信号を発生する。加えて
、この発明に従って、合成ユニット４０８は、受信した符号化音声信号４１４内
に表わされる受信した背景ノイズを利用して、シミュレートされた背景ノイズを
生成し、これは合成音声信号と適切に組合される。合成ユニット４０８から結果
として得られた出力信号は、信号の音声期間中およびそれらの間に連続したレベ
ルの背景ノイズを有する向上された合成音声信号である。スピーカ４１０は、合
成ユニット４０８から受取った向上された合成音声信号を出力するが、これは、
音声期間どうしの間に実質的に存在する背景ノイズとは対照的に、背景ノイズが
連続しているために人の耳にはより現実的かつ自然に聞こえる。

【００１７】図４の記憶装置４０４は、分析ユニット４０２の出力の１つに任意で接続され
、いかなる符号化音声信号４１４をも記憶する記憶能力を提供し、後からある所
望のときにこれを再生することができる。この発明に従う記憶装置４０４のある
実施例は、ランダムアクセスメモリ（ＲＡＭ）ユニット、フロッピーディスク、
ハードドライブメモリユニットまたはデジタル留守番電話メモリである。記憶さ
れた符号化音声信号４１４が後に再生されると、これは記憶装置４０４から合成
ユニット４１８にまず出力される。合成ユニット４１８は、上述した合成ユニッ
ト４０８と同じ機能を果たす。合成ユニット４１８から得られる出力信号は、信
号の音声期間中およびそれらの間に連続したレベルの背景ノイズを有する、向上
された合成音声信号である。スピーカ４２０は、合成ユニット４０８から受取っ
た向上された合成音声信号を出力するが、これは人の耳にはより現実的かつ自然
に聞こえる。

【００１８】図５は、合成回路５００のブロック図を示すものであるが、これは、この発明
の実施例に従う図４の合成ユニット４０８のある実施例である。合成回路５００
のデコーダ回路５０２は、通信ネットワーク４０６を介して符号化音声信号４１
４を受信する構成要素である。デコーダ回路５０２は次に、音声通信４１２を表
わす、符号化音声信号４１４内で受取られる異なったパラメータを復号化しかつ
合成する。音声信号４１４は、符号化された線形予測係数（ＬＰＣ）、ピッチ係
数、固定の励起コードワードおよびエネルギを含む。符号化音声信号４１４内に
含まれるエネルギから利得係数を得ることが可能であることが認められる。デコ
ーダ回路５０２は、線形予測係数およびエネルギの両方を含む信号５１０を、ノ
イズ生成器回路５０４に伝送する。さらに、デコーダ回路５０２は、合成音声信
号５１２を、加算器回路５０８および音声活性検出器（ＶＡＤ）回路５０６の両
方に伝送する。合成音声信号５１２は、合成音声部分および合成背景ノイズ部分
を含む。この発明に従うデコーダ回路５０２のある実施例は、ソフトウェアで実
現される。

【００１９】図５のノイズ生成器回路５０４は、信号５１０の線形予測係数のサブセットお
よびエネルギのサブセットを利用し、シミュレートされた背景ノイズ信号５１６
を発生し、これは加算器回路５０８に伝送される。加算器回路５０８は、出力信
号５１８を人の耳により自然に聞こえるようにするために、シミュレートされた
背景ノイズ信号５１６を合成音声信号５１２の合成音声部分に加算する。さらに
、加算器回路５０８は、合成音声信号５１６の非音声部分または合成背景ノイズ
部分をその出力に通過させ、これは自然に聞こえる出力合成音声信号５１８の一
部となる。加算器回路５０８は、以下に記載する音声活性検出器回路５０６によ
って伝送される信号５１４の受信に基づいて、どの機能を果たすかが異なってい
る。この発明に従うと、ノイズ生成器回路５０４および加算器回路５０８もまた
、ソフトウェアで実現可能である。

【００２０】図５の音声活性検出器回路５０６は、受取った合成音声信号５１２内に含まれ
る合成された非音声期間（たとえば合成背景ノイズのみの期間）を合成音声期間
から区別する。音声活性検出器回路５０６が合成音声信号５１２の非音声期間を
決定すると、これは、信号５１４としてノイズ生成器回路５０４および加算器回
路５０８の両方に表示を伝送する。ノイズ生成器回路５０４は、信号５１４を利
用し、シミュレートされた背景ノイズ信号５１６の発生の際にこれを支援する。
この発明に従う音声活性検出器回路５０６のある実施例は、ソフトウェアで実現
される。

【００２１】加算器回路５０８による図５の信号５１４の受信は、これが行なう特定の機能
を左右し、自然な音の出力合成音声信号５１８を発生する。具体的には、信号５
１４内に含まれる非音声期間は、受取った合成音声信号５１２内に含まれる合成
非音声期間をその出力にいつ通過させるかを、加算器回路５０８に示す。さらに
、信号５１４内に含まれる音声期間は、受取った合成音声信号５１２内に含まれ
る合成音声期間と受取ったシミュレートされた背景ノイズ信号５１６とをいつ加
算するべきかを、加算器回路５０８に示す。

【００２２】図６は、合成回路６００のブロック図を示し、これは、この発明の実施例に従
う図４の合成ユニット４０８の別の実施例である。合成回路６００は、図５の合
成回路５００と類似しているがただし、これは音声活性検出器回路５０６を含ま
ない。デコーダ回路５０２、ノイズ生成器回路５０４および加算器回路５０８は
各々、一般的には、図５を参照して上述したのと同じ機能を果たす。付加機能を
行なう合成回路６００内の構成要素は、デコーダ回路５０２のみである。デコー
ダ回路５０２が、合成音声信号５１２の非音声期間を示す信号５１４を発生する
ために、図４の分析ユニット４０２は、図５の音声活性検出器回路５０６と同じ
機能を果たす音声活性検出器回路も含む。分析ユニット４０２内に位置する音声
活性検出器回路によって決定される非音声期間データは次に、符号化音声信号４
１４内に含まれる。

【００２３】図７は、図５および図６内に位置するこの発明の実施例に従うデコーダ回路５
０２のある実施例のブロック図を示す。励起コードブック回路７０２、ピッチ合
成フィルタ回路７０４および線形予測係数合成フィルタ回路７０６は各々、図４
の通信ネットワーク４０６を介して転送された符号化音声信号４１４を受取る。
励起コードブック回路７０２は、固定の励起コードワードを受取り、受取った符
号化音声信号４１４内に表わされたその利得値によって乗算された対応するデジ
タル信号パターンを信号７１０として発生する。励起コードブック回路７０２は
次に、信号７１０をピッチ合成フィルタ回路７０４に伝送する。この発明に従う
励起コードブック回路７０２のある実施例は、ソフトウェアで実現される。

【００２４】図７のピッチ合成フィルタ回路７０４は、符号化音声信号４１４内に含まれる
符号化されたピッチ係数を受取り、対応する復号化されたピッチ信号を発生し、
出力信号７１２を発生するために、これを受取った信号７１０と合成する。線形
予測係数合成フィルタ回路７０６は、符号化音声信号４１４内に含まれる符号化
された線形予測係数を受取り、これは、「合成」されてから信号７１２に加えら
れ、合成音声信号５１２を発生する。線形予測係数合成フィルタ回路７０６はま
た、エネルギおよび線形予測係数を含む信号５１０を、図５および図６のノイズ
生成器回路５０４に出力する。この発明に従うと、ピッチ合成フィルタ回路７０
４および線形予測係数合成フィルタ回路７０６もまた、ソフトウェアで実現可能
である。

【００２５】図８は、図５および図６内に位置するこの発明の実施例に従うノイズ生成器回
路５０４のある実施例のブロック図を示す。移動平均回路８０６は、図５の音声
活性検出器５０６から非音声信号５１４を受取り、かつ図７の線形予測係数合成
フィルタ回路７０６からエネルギおよび線形予測係数を含む信号５１０を受取る
構成要素である。信号５１４は、信号５１０の線形予測係数およびエネルギ内に
存在する非音声期間（たとえば合成背景ノイズのみの期間）を、移動平均回路８
０６に示す。移動平均回路８０６は次に、信号５１０内に表わされる背景ノイズ
期間に対応する受取った線形予測係数の移動平均値を決定する。さらに、移動平
均回路８０６は、信号５１０内に表わされる背景ノイズ期間に対応するエネルギ
の移動平均値も決定する。したがって、移動平均回路８０６は、非音声期間の合
成背景ノイズに対応する、エネルギの決定された移動平均および線形予測係数の
決定された移動平均値を連続的に記憶する。移動平均回路８０６は次に、両方の
記憶された移動平均値のコピーを信号８１２として、線形予測係数合成フィルタ
回路８０４に出力する。

【００２６】別の実施例では、図８の移動平均回路８０６を図７の線形予測係数合成フィル
タ回路７０６内に位置付けることも可能である。さらに、別の実施例では、移動
平均回路８０６を線形予測係数合成フィルタ回路７０６内に部分的に位置付ける
ことも可能であり、一方で残りの回路構成を図８のノイズ生成器回路５０４内に
位置づける。具体的には、背景ノイズの、線形予測係数の移動平均値およびエネ
ルギの移動平均値を決定する移動平均回路８０６の回路構成は、線形予測係数合
成フィルタ回路７０６内に位置付けられ、一方で、移動平均回路８０６の記憶回
路は、ノイズ生成器回路５０４内に位置付けられる。この発明に従う移動平均回
路８０６のある実施例は、ソフトウェアで実現される。

【００２７】図８の白色ノイズ生成器回路８０２は、白色ガウスノイズ信号８１０を発生し
、これは線形予測係数合成フィルタ回路８０４に出力される。この発明に従う白
色ノイズ生成器回路８０２のある実施例は、乱数生成器回路である。この発明に
従う白色ノイズ生成器回路８０２の別の実施例は、ソフトウェアで実現される。
線形予測係数合成フィルタ回路８０４は、受取った信号８１０および８１２を用
いて、シミュレートされた背景ノイズ信号５１６を発生し、これは図５および図
６の加算器回路５０８に出力される。この発明に従う線形予測係数合成フィルタ
回路８０４のある実施例は、ソフトウェアで実現される。

【００２８】図９は、この発明の実施例に従う図５および図６の合成回路５００および６０
０によってそれぞれ出力されるより自然に聞こえる合成音声信号５１８を示す。
自然に聞こえる出力合成音声信号５１８は、背景ノイズ９０２および合成音声群
９０４〜９０８を含む。背景ノイズ９０２は、合成音声群９０４〜９０８中およ
びそれらの間に連続して存在することに注目されたい。この発明によってシミュ
レートされた背景ノイズを合成音声群９０４〜９０８とを組合せることによって
、向上された合成音声信号５１８は、人の耳に自然かつ現実的に聞こえる。

【００２９】この発明の特定の実施例の前の記載は、例示および説明の目的で提示された。
これは、余すところないまたはこの発明を開示された正確な態様に限定するもの
ではなく、明らかに、多くの変形および変更が上記教示に鑑みて可能である。実
施例は、この発明の原理およびその実践的適用を最もよく説明するために選択さ
れ記載され、これによって当業者が、企図された特定の使用に適合するようなさ
まざまな変形でこの発明およびさまざまな実施例を最良に利用することを可能と
する。この発明の範囲は、前掲の特許請求の範囲およびその等価によって定義さ
れることが意図される。

【図面の簡単な説明】

【図１】信号にわたって背景または周囲ノイズを含む典型的な音声の会話
のアナログ音波を示す図である。

【図２】音声の符号化および復号化のための先行技術の分析合成システム
の一般的な概略ブロック図である。

【図３】先行技術のシステムに従う合成ユニットによって出力される合成
音声信号を示す図である。

【図４】この発明が動作する音声の符号化および復号化のための分析合成
システムの一般的概略図である。

【図５】図４の分析合成システム内に位置するこの発明の実施例に従う合
成ユニットのある実施例のブロック図である。

【図６】図４の分析合成システム内に位置するこの発明の実施例に従う合
成ユニットの別の実施例のブロック図である。

【図７】図５および図６の合成ユニット内に位置するこの発明の実施例に
従うデコーダ回路のある実施例のブロック図である。

【図８】図５および図６の合成ユニット内に位置するこの発明の実施例に
従うノイズ生成器回路のある実施例のブロック図である。

【図９】この発明の実施例に従う合成ユニットによって出力されるより自
然に聞こえる合成音声信号の図である。

───────────────────────────────────────────────────── フロントページの続き (72)発明者スウ，フアン−ユアメリカ合衆国、92673 カリフォルニア州、サン・クレメンテ、カッレ・フロンテラ、3009 (72)発明者ベンヤッシーネ，アディルアメリカ合衆国、92606 カリフォルニア州、アーバイン、レッジョ・アイル、1305 Ｆターム(参考） 5D045 CA01 CC02 5J064 AA01 BB03 BB07 BC02 BC08 BC21 BD02

Claims

【特許請求の範囲】

【請求項１】背景ノイズが共存する符号化音声の品質を向上させるための
方法であって、前記方法は、（ａ）合成音声部分および合成背景ノイズ部分を有する合成音声信号を発生
するステップを含み、受取った符号化音声信号に基づく前記合成音声信号は、線
形予測係数、ピッチ係数、励起コードワードおよびエネルギを含み、さらに、（ｂ）前記合成音声信号の前記合成背景ノイズ部分に対応する前記符号化音
声信号から抽出される前記エネルギのサブセットおよび前記線形予測係数のサブ
セットを用いて背景ノイズ信号を発生するステップと、（ｃ）前記背景ノイズ信号と前記合成音声信号とを組合せて、自然に聞こえ
る出力合成音声信号を発生するステップとを含む、方法。
【請求項２】前記符号化音声信号は、音声部分および背景ノイズ部分を含
む、請求項１に記載の方法。
【請求項３】前記ステップ（ｃ）は、前記合成音声信号の前記合成音声部
分と前記背景ノイズ信号とを組合せ、前記自然に聞こえる出力合成音声信号を発
生するステップを含む、請求項２に記載の方法。
【請求項４】前記ステップ（ｂ）は、前記合成音声信号の前記合成背景ノ
イズ部分に対応する前記線形予測係数のサブセットの移動平均値および前記エネ
ルギのサブセットの移動平均値を決定するステップをさらに含み、前記移動平均
値は、前記背景ノイズ信号を発生するために用いられる、請求項２に記載の方法
。
【請求項５】前記ステップ（ｂ）は、白色ノイズ信号を発生するステップ
をさらに含み、前記白色ノイズ信号は、前記背景ノイズ信号を発生するために用
いられる、請求項４に記載の方法。
【請求項６】前記白色ノイズ信号は、乱数生成器回路によって発生される
、請求項５に記載の方法。
【請求項７】前記ステップ（ａ）は、前記符号化音声信号の前記励起コードワードを用いて前記励起コードワードに
対応するデジタル信号パターンを発生するステップと、前記デジタル信号パターンを用いて前記合成音声信号を部分的に合成するステ
ップと、前記符号化音声信号の前記ピッチ係数を用いて前記合成音声信号を部分的に合
成するステップと、前記符号化音声信号の前記線形予測係数を用いて前記合成音声信号を部分的に
合成するステップとをさらに含む、請求項６に記載の方法。
【請求項８】背景ノイズが共存する符号化音声の品質を向上させるための
方法であって、前記方法は、（ａ）合成音声部分および合成背景ノイズ部分を含む合成音声信号を発生す
るステップを含み、受取った符号化音声信号に基づく前記合成音声信号は、線形
予測係数、ピッチ係数、励起コードワードおよびエネルギを含み、さらに、（ｂ）前記合成音声信号の前記合成背景ノイズ部分および前記合成音声部分
を決定するステップと、（ｃ）前記合成音声信号の前記合成背景ノイズ部分に対応する前記符号化音
声信号から抽出される前記線形予測係数のサブセットおよび前記エネルギのサブ
セットを用いて背景ノイズ信号を発生するステップと、（ｄ）前記合成音声信号の前記合成音声部分のみと前記背景ノイズ信号とを
組合せて、自然に聞こえる出力合成音声信号を発生するステップとを含む、方法
。
【請求項９】前記ステップ（ｃ）は、前記合成音声信号の前記合成背景ノ
イズ部分に対応する前記線形予測係数のサブセットの移動平均値および前記エネ
ルギのサブセットの移動平均値を決定するステップをさらに含み、前記移動平均
値は、前記背景ノイズ信号を発生するために用いられる、請求項８に記載の方法
。
【請求項１０】前記ステップ（ｃ）は、白色ノイズ信号を発生するステッ
プをさらに含み、前記白色ノイズ信号は、前記背景ノイズ信号を発生するために
用いられる、請求項９に記載の方法。
【請求項１１】前記白色ノイズ信号は、乱数生成器回路によって発生され
る、請求項１０に記載の方法。
【請求項１２】前記ステップ（ａ）は、前記符号化音声信号の前記励起コードワードを用いて前記励起コードワードに
対応するデジタル信号パターンを発生するステップと、前記デジタル信号パターンを用いて前記合成音声信号を部分的に合成するステ
ップと、前記符号化音声信号の前記ピッチ係数を用いて前記合成音声信号を部分的に合
成するステップと、前記符号化音声信号の前記線形予測係数を用いて前記合成音声信号を部分的に
合成するステップとをさらに含む、請求項１０に記載の方法。
【請求項１３】背景ノイズが共存する符号化音声の品質を向上させるため
の装置であって、前記装置は、線形予測係数、ピッチ係数、励起コードワードおよびエネルギを含む符号化音
声信号を受取るよう結合されるデコーダ回路を含み、合成音声信号を発生するた
めの前記デコーダ回路は、合成音声部分および合成背景ノイズ部分を有し、さら
に、前記デコーダ回路に結合され、前記合成音声信号の前記合成背景ノイズ部分に
対応する前記線形予測係数のサブセットおよび前記エネルギのサブセットを用い
て背景ノイズ信号を発生するためのノイズ生成器回路を含み、前記線形予測係数
のサブセットおよび前記エネルギのサブセットは、前記デコーダ回路によって前
記符号化音声信号から抽出され、さらに、前記デコーダ回路から前記合成音声信号を受取り前記ノイズ生成器から前記背
景ノイズ信号を受取るよう結合される加算器手段を含み、前記加算器手段は、前
記背景ノイズ信号と前記合成音声信号とを組合せて自然に聞こえる出力合成音声
信号を発生する、装置。
【請求項１４】前記符号化音声信号は、音声部分および背景ノイズ部分を
含む、請求項１３に記載の装置。
【請求項１５】前記加算器手段は、前記合成音声信号の前記合成音声部分
と前記背景ノイズ信号とを組合せて前記自然に聞こえる出力合成音声信号を発生
する、請求項１４に記載の装置。
【請求項１６】前記合成音声信号の前記線形予測係数および前記エネルギ
を受取るよう結合され、前記合成音声信号の前記合成背景ノイズ部分に対応する
前記エネルギのサブセットの移動平均値および前記線形予測係数のサブセットの
移動平均値を決定するための移動平均回路をさらに含み、前記ノイズ生成器回路
は、前記移動平均値を用いて前記背景ノイズ信号を発生する、請求項１４に記載
の装置。
【請求項１７】前記ノイズ生成器回路は、白色ノイズ信号を発生するため
の白色ノイズ生成器回路をさらに含み、前記ノイズ生成器回路は、前記白色ノイ
ズ信号を用いて前記背景ノイズ信号を発生する、請求項１６に記載の装置。
【請求項１８】前記白色ノイズ生成器回路は、乱数生成器回路である、請
求項１７に記載の装置。
【請求項１９】前記ノイズ生成器回路は、前記移動平均値を受取るよう前
記移動平均回路に結合される第１の線形予測係数合成フィルタ回路をさらに含み
、前記第１の線形予測係数合成フィルタ回路は、前記白色ノイズ信号を受取るよ
う前記白色ノイズ生成器回路にさらに結合され、前記第１の線形予測係数合成フ
ィルタ回路は、前記白色ノイズ信号および前記移動平均値を用いて前記背景ノイ
ズ信号を発生する、請求項１７に記載の装置。
【請求項２０】前記デコーダ回路は、前記符号化音声信号を受取るよう結合され、前記符号化音声信号の前記励起コ
ードワードを用いて前記励起コードワードに対応するデジタル信号パターンを発
生する励起コードブック回路をさらに含み、前記デコーダ回路は、前記デジタル
信号パターンを用いて前記合成音声信号を部分的に合成し、さらに、前記符号化音声信号を受取るよう結合され、前記ピッチ係数を用いて前記合成
音声信号を部分的に合成するピッチ合成フィルタ回路と、前記符号化音声信号を受取るよう結合され、前記線形予測係数および前記エネ
ルギを用いて前記合成音声信号を部分的に合成する第２の線形予測係数合成フィ
ルタ回路とをさらに含む、請求項１９に記載の装置。