WO2000077774A1

WO2000077774A1 - Codeur de signaux de bruit et codeur de signaux vocaux

Info

Publication number: WO2000077774A1
Application number: PCT/JP2000/003526
Authority: WO
Inventors: Koji Yoshida
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 1999-06-15
Filing date: 2000-06-01
Publication date: 2000-12-21
Also published as: EP1120775A4; JP4464484B2; JP2000357000A; CN1313983A; AU5103700A; EP1120775A1

Description

明細書雑音信号符号化装置及び音声信号符号化装置技術分野

本発明は、音声信号を符号化して伝送する移動通信システムや音声録音装置等の用途に用いられる低ビットレート音声信号符号化装置に関する。背景技術

ディジタル移動通信や音声蓄積の分野においては、電波や記憶媒体の有効利用のために音声情報を圧縮し、低いビットレートで符号化する音声符号化装置が用いられている。そのような従来の技術として、 I TU— T勧告 G. 729 "Coding of speech at 8kbit/s using conjugate- structure algebraic - code - excited linear-prediction ( CS-ACELP ) " ) の C S 一 ACE LP符号化方式や、同じく I TU— T勧告の G. 729 Annex B(" A silence compression scheme for G.729 optimized for terminals conforming to Recommendation V.70" ) の D T X (Discontinuous Transmission )制御付きの CS—ACELP符号化方式がある。

図 1は、従来の C S -ACE L P符号化方式の符号化装置の構成を示すプロック図である。図 1において、入力音声信号に対して LP C分析 ·量子化器 1 で LPC (線形予測）分析及び量子化を行い、 L PC係数及び LP C量子化符号を出力する。

そして、適応音源符号帳 2及び固定音源符号帳 3から取り出された適応音源信号及び固定音源信号にゲイン符号帳 4から取り出されたゲインを乗じて加算し、 L PC合成フィル夕 7により音声合成を行い、入力信号に対する誤差信号を聴覚重み付けフィル夕 9により重み付けを行い、重み付け後の誤差が最小となる適応音源符号、固定音源符号、ゲイン符号を LP C量子化符号と共に符号化データとして出力する。なお、図 1において、参照符号 5は乗算器であり、参照符号 6は加算器であり、参照符号 8は減算器である。

図 2は、従来の D T X制御付き CS— ACELP符号化方式の符号化装置の構成を示すブロック図である。まず、有音/無音判定器 1 1により入力信号が有音区間か無音区間（背景雑音のみの区間）かの判定を行う。そして、有音 Z 無音判定器 1 1により有音と判定された場合、 CS— ACELP音声符号化器 12により有音区間の音声符号化を行う。なお、 CS— ACELP音声符号化器 12は、図 1に示す構成となっている。

一方、有音 Z無音判定器 1 1により無音と判定された場合、無音区間符号化器 13により符号化を行う。この無音区間符号化器 13は、入力信号から有音区間の符号化と同様な L P C係数と入力信号の L P C予測残差エネルギーを算出し、それらを無音区間の符号化データとして出力する。

D T X制御及び多重化器 14は、有音 Z無音判定器 1 1、 CS— ACELP 音声符号化器 12及び無音区間符号化器 13の出力から、送信データとして送信すべきデータを制御し、多重化して送信データとして出力する。

しかしながら、上記従来の CS_ ACELP符号化器では、音声符号化器が音声特有の冗長性を利用して 8 k b p sという低ビットレートで符号化を行つているため、背景雑音が重畳されないクリーンな音声信号が入力された場合には、高品質な符号化が可能であるが、入力信号として周囲の背景雑音が重畳された音声信号が入力された場合、背景雑音信号を符号化した際にその復号信号の品質が劣化するという問題がある。

また、上記従来の DTX制御付き CS— ACELP符号化器においては、有音区間のみ CS— ACELP符号化器により符号化を行い、無音区間（雑音のみの区間）は、専用の無音区間符号化器で音声符号化器より少ないビットレー卜で符号化を行うことで、伝送する平均ビットレートを低減する。しなしながら、無音区間符号化器が音声符号化器と同様な信号モデル（短区間（10〜5 0ms程度）毎に AR型の合成フィルタ（LPC合成フィルタ）を雑音信号で駆動することで復号信号を生成する）で符号化を行っているため、上記従来の C S - A C E L P符号化器と同様に、背景雑音が重畳された音声信号に対しては復号信号の品質が劣化するという問題がある。発明の開示

本発明の目的は、背景雑音が重畳された音声信号に対しても復号信号の品質の劣化が少なく、かつ伝送に必要な平均ビットレートも低減することのできる音声信号の符号化装置及び復号装置を提供することである。

本発明の主題は、無音区間（雑音のみの区間）の入力信号に対する統計的特徴量を算出し、入力雑音信号に関する統計的特徴量を表現できるような雑音モデルに関する情報を記憶し、入力雑音信号を表す雑音モデルパラメ一夕が変化したかどうかを検出し、雑音モデルの更新を行うことにより、背景雑音が重畳された音声信号に対しても復号信号の品質の劣化が少なく、かつ伝送に必要な平均ビットレートも低減することである。図面の簡単な説明

図 1は、従来の音声信号符号化装置の構成を示すブロック図；

図 2は、従来の音声信号符号化装置の構成を示すブロック図；

図 3は、本発明の実施の形態に係る音声信号符号化装置及び音声信号複号化装置を備えた無線通信システムの構成を示すブロック図；

図 4は、本発明の実施の形態 1に係る音声信号符号化装置の構成を示すプロック図；

図 5は、本発明の実施の形態 1に係る雑音信号符号化装置の構成を示すプロック図；

図 6は、本発明の実施の形態 1に係る音声信号複号化装置の構成を示すプロック図；

図 7は、本発明の実施の形態 1に係る音声信号復号化装置における雑音信号生成器の構成を示すブロック図；

図 8は、本発明の実施の形態 1に係る音声信号符号化方法の処理の流れを示すフローチヤ一ト；

図 9は、本発明の実施の形態 1に係る雑音信号符号化方法の処理の流れを示すフローチヤ一ト；

図 1 0は、本発明の実施の形態 2に係る音声信号符号化装置の構成を示すブロック図；

図 1 1は、本発明の実施の形態 2に係る音声信号複号化装置の構成を示すブロック図；

図 1 2は、本発明の実施の形態 2に係る音声信号符号化方法の処理の流れを示すフローチヤ一ト；

図 1 3は、本発明の実施の形態 3に係る音声信号符号化装置の構成を示すブロック図；並びに

図 1 4は、本発明の実施の形態 3に係る音声信号符号化方法の処理の流れを示すフローチャートである。発明を実施するための最良の形態

以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。 (実施の形態 1 )

図 3は、本発明の実施の形態 1に係る音声信号符号化装置を備えた無線通信装置の構成を示すブロック図である。

この無線通信装置において、送信側で音声がマイクなどの音声入力装置 1 0 1によって電気的アナログ信号に変換され、 AZD変換器 1 0 2に出力される。アナログ音声信号は、 AZD変換器 1 0 2によってディジタル音声信号に変換され、音声符号化部 1 0 3に出力される。音声符号化部 1 0 3は、ディジタル音声信号に対して音声符号化処理を行い、符号化した情報を変復調部 1 0 4に出力する。変復調部 1 0 4は、符号化された音声信号をディジタル変調して、無線送信部 1 0 5に送る。無線送信部 1 0 5では、変調後の信号に所定の無線送信処理を施す。この信号は、アンテナ 1 0 6を介して送信される。

一方、無線通信装置の受信側では、アンテナ 1 0 7で受信した受信信号は、無線受信部 1 0 8で所定の無線受信処理が施され、変復調部 1 0 4に送られる。変復調部 1 0 4では、受信信号に対して復調処理を行い、復調後の信号を音声復号化部 1 0 9に出力する。音声復号化部 1 0 9は、復調後の信号に復号処理を行ってディジ夕ル復号音声信号を得て、そのディジ夕ル復号音声信号を DZ A変換器 1 1 0へ出力する。 D/A変換器 1 1 0は、音声復号化部 1 0 9から出力されたディジ夕ル復号音声信号をアナログ音声信号に変換してスピーカなどの音声出力装置 1 1 1に出力する。最後に音声出力装置 1 1 1が電気的ァナログ音声信号を音声に変換して出力する。

図 3に示す音声符号化部 1 0 3は、図 4に示す構成を有する。図 4は、本発明の実施の形態 1に係る音声符号化部の構成を示すブロック図である。

有音無音判定器 2 0 1において、入力音声信号に対して有音区間か無音区間（雑音のみの区間）かを判定し、その判定結果を D T X制御及び多重化器 2 0 4に出力する。有音ノ無音判定器 2 0 1は任意のものでよく、一般には、入力信号のパワー、スぺクトルやピッチ周期などの複数のパラメ一夕の瞬時量または変化量等を用いて判定が行われる。

そして、前記有音 Z無音判定器 2 0 1による判定結果が有音である場合には、音声符号化器 2 0 2により、音声信号と雑音信号が含まれる有音区間において入力音声信号に対して音声符号化を行い、その符号化データを D T X制御及び多重化器 2 0 4に出力する。この音声符号化器 2 0 2は、有音区間用の符号化器であり、音声を高能率に符号化するものであれば任意の符号化器でよい。一方、前記有音 Z無音判定器 2 0 1による判定結果が無音である場合には、雑音信号符号化器 2 0 3により、雑音信号のみが含まれる無音区間において入力信号に対して雑音信号の符号化を行い、入力雑音信号を表現する雑音モデルに関する情報と、雑音モデルの更新をするかどうかのフラグとを D T X制御及び多重化器 2 0 4に出力する。最後に、 D T X制御及び多重化器 2 0 4により、前記有音 Z無音判定器 2 0 1、音声符号化器 2 0 2及び雑音信号符号化器 2 0 3からの出力を用いて送信データとして送信すべき情報の制御と送信情報の多重化を行い、送信データとして出力する。

図 4における雑音信号符号化器 2 0 3は、図 5に示す構成を有する。図 5は、本発明の実施の形態 1に係る音声符号化部の雑音信号符号化器の構成を示すブロック図である。

雑音信号分析部 3 0 1により、ある一定区間毎に入力された雑音信号に対して信号分析を行い、雑音信号に対する分析パラメータを算出する。抽出する分析パラメ一夕としては、入力信号に関する統計的特徴量を表すのに必要なパラメータであり、例えば、短区間信号に対して F F T ( Fast Fourier Transform )により求めた短時間スペクトルや、入力パワー、 L P Cスぺクトルパラメ一夕等がある。

次に、雑音モデル変化検出部 3 0 3において、現在入力された雑音信号を表すべき雑音モデルパラメ一夕が、雑音モデル記憶部 3 0 2により保持されている雑音モデルパラメ一夕から変化しているかどうかを検出する。

ここで、雑音モデルパラメ一夕とは、入力雑音信号に関する統計的特徴量を表現できるような雑音モデルに関する情報であり、例えば、短時間スペクトルの平均スペクトルや分散値、等の統計的特徴量を、例えば HMMのような統計モデルで表現した際の情報である。

そして、雑音モデル変化検出部 3 0 3は、雑音信号分析部 3 0 1により得られた現入力信号に対する分析パラメ一夕が、それ以前の入力信号を表す雑音モデルとして記憶された雑音モデルからの出力として妥当かどうか（例えば、 H MMモデルであれば現入力信号に対する分析パラメ一夕の出力確率が規定値以上であるか）を判定し、現在入力された雑音信号を表すべき雑音モデルパラメータが記憶された雑音モデルから変化していると判定された場合に、雑音モデルの更新を行うかどうかのフラグと更新すべき情報（更新情報）を雑音モデル更新部 3 0 4に出力する。

なお、外部更新許可フラグは、雑音モデル更新を許可するかどうかを外部から指示するフラグで、後述する本発明における音声符号化部において、有音区間中の符号化データを送信する期間中等、雑音モデルパラメ一夕の送信を行わないようにする際には、雑音モデルの更新を不許可とする。

そして、雑音モデル更新部 3 0 4において、雑音モデル更新フラグが更新を示す場合には、雑音モデル更新情報として、更新後の雑音モデルパラメ一夕または以前に雑音モデル記憶部 3 0 2に記憶されている雑音モデルパラメ一夕からの変化分のみの情報を出力すると共に、その出力情報を用いて雑音モデル記憶部 3 0 2の更新を行う。一方、雑音モデル更新フラグが非更新を示す場合には、更新を行わず、更新情報を出力しない。

次に、図 3に示す音声復号化部 1 0 9は、図 6に示す構成を有する。図 6は、本発明の実施の形態 1に係る音声復号化装置の構成を示すプロック図である。分離及び D T X制御器 4 0 1において、符号化側で入力信号に対して符号化され送信された送信データを受信データとして受信し、この受信データを音声復号及び雑音生成に必要な、音声符号化データまたは雑音モデルパラメ一夕、有音ノ無音判定フラグ及び雑音モデル更新フラグに分離する。

次いで、前記有音 Z無音判定フラグが有音区間を示す場合には、音声復号化器 4 0 2により前記音声符号化データから音声復号を行い復号音声を出力切替え器 4 0 4に出力する。

一方、前記有音無音判定フラグが無音区間を示す場合には、雑音信号生成器 4 0 3により前記雑音モデルパラメ一タ及び雑音モデル更新フラグから雑音信号の生成を行し、雑音信号を出力切替え器 4 0 4に出力する。そして、出力切り替え器 4 0 4により、前記音声復号化器 4 0 2の出力と前記雑音信号生成器 4 0 3の出力を、有音 Z無音判定フラグの結果に応じて切り替えて出力し、出力信号とする。

図 6における雑音信号生成器 4 0 3は、図 7に示す構成を有する。図 7は、本発明の実施の形態 1に係る音声複号化装置の雑音信号生成器の構成を示すブロック図である。

図 5に示す雑音信号符号化器 2 0 3から出力された、雑音モデル更新フラグ及び雑音モデルパラメータ（モデル更新の場合）が雑音モデル更新部 5 0 1に入力される。雑音モデル更新部 5 0 1においては、前記雑音モデル更新フラグが更新を示している場合、前記入力雑音モデルパラメータ及び雑音モデル記憶部 5 0 2で保持されている以前の雑音モデルパラメータを用いて、雑音モデルの更新を行い、更新後の雑音モデルパラメ一夕を雑音モデル記憶部 5 0 2にて新たに記憶する。

雑音信号生成部 5 0 3では、雑音モデル記憶部 5 0 2の情報をもとに、雑音信号を生成し出力する。雑音生成は、統計的特徴量をパラメ一夕にモデル化された情報をもとに、生成される雑音信号がそのモデルからの出力として妥当な信号となるように生成される。例えば、統計モデルとして HMMを用いた場合、その状態遷移確率及びパラメータ出力確率等に従って、生成に必要な信号パラメータ（例えば、短時間スペクトル）を確率的に出力し、それに基づき雑音信号を生成 ·出力する。

次に、上記構成を有する音声符号化部及び音声復号化部の動作について説明する。図 8は、実施の形態 1に係る音声信号の符号化方法の処理の流れを示すフローチャートである。なお、本方法では、図 8に示す本処理を、一定短区間 (例えば、 1 0〜5 0 m s程度）のフレーム毎に繰り返して行うものとする。まず、ステップ（以下 S Tと省略する） 1 0 1において、フレーム単位の音声信号を入力する。次に、 S T 1 0 2にて、入力信号に対する有音ノ無音判定を行い、その判定結果を出力する。そして、その判定結果が有音である場合には、 S T 1 0 4により入力音声信号に対して音声符号化処理を行いその符号化データを出力する。

一方、 S T 1 0 3における判定結果が無音である場合には、 S T 1 0 5にて、入力信号に対して雑音信号符号化器による雑音信号符号化処理を行い、入力雑音信号を表現する雑音モデルに関する情報と雑音モデルの更新を行うかどうかのフラグを出力する。なお、雑音信号の符号化処理については後述する。そして、 S T 1 0 6において、前記有音ノ無音判定、音声符号化処理及び雑音信号符号化処理の結果得られた出力を用いて送信データとして送信すべき情報の制御と送信情報の多重化を行い、最後に S T 1 0 7にて、送信デ一夕として出力する。

図 9は、本実施の形態に係る音声信号の符号化方法における雑音信号符号化方法の処理の流れを示すフローチャートである。なお、本方法では、図 9に示す本処理を、一定短区間（例えば、 1 0〜5 0 m s程度）のフレーム毎に繰り返して行うものとする。

S T 2 0 1において、フレーム単位の雑音信号を入力する。次に、 S T 2 0 2において、フレーム単位の雑音信号に対して信号分析を行い、雑音信号に対する分析パラメ一夕を算出する。そして、 S T 2 0 3において、分析パラメ一夕から雑音モデルの変化があるかどうかの検出を行い、雑音モデルが変化したと判定された場合、 S T 2 0 5にて、雑音モデルの更新をするかどうかのフラグ（更新あり）と更新すべき情報（更新情報）を出力すると共に、 S T 2 0 6 にて、その出力情報を用いて雑音モデル記憶部 3 0 2の更新を行う。

一方、 S T 2 0 4にて、雑音モデルの変化なしと判定された場合には、 S T 2 0 7にて、雑音モデルの更新をするかどうかのフラグ（更新なし）のみ出力する。なお、 S T 2 0 3において、外部から別途入力される外部更新許可フラグが不許可の場合、モデル変化なしとして雑音モデルパラメ一夕の送信を行わないようにする。

このように、本実施の形態に係る雑音符号化方法によれば、雑音信号を統計的特徴量で表現できるような雑音モデルでモデル化することにより、背景雑音信号に対して聴感的に劣化の少ない復号信号を生成することができる。また、入力信号波形に対する忠実な符号化が不要であると共に、入力信号に対応する雑咅モデルパラメ一夕が変化する区間のみ伝送することにより、低ビットレー WO 00/77774 ^ _Q PCT/JPOO/03526 トで高効率な符号化を行うことができる。

また、本実施の形態に係る音声信号の符号化方法によれば、有音区間では音声信号を高品質で符号化できる音声符号化器で符号化を行い、無音区間では高効率で聴感的に劣化が少ない雑音信号符号化器で符号化を行うことにより、背景雑音環境下においても高品質 ·高効率な符号化を行うことができる。

(実施の形態 2 )

図 1 0は、本発明の実施の形態 2に係る音声信号の符号化部の構成を示すブ口ック図である。

この音声符号化部 1 0 3においては、音声 Z雑音信号分離器 8 0 1で、入力音声信号を、音声信号と音声信号に重畳している背景雑音信号とに分離する。音声 Z雑音信号分離器 8 0 1は、任意のものでよい。この分離方法としては、スぺクトルサブトラクシヨンと呼ばれる、入力信号から周波数領域で雑音スぺクトルを減ずることで、入力信号を雑音抑圧後の音声信号と雑音信号とに分離する方法や、複数の信号入力器からの入力信号から音声と雑音の分離を行う方法などが考えられる。

次に、有音 Z無音判定器 8 0 2において、前記音声/雑音信号分離器 8 0 1 から得られる分離後の音声信号から有音区間か無音区間（雑音のみの区間）かを判定し、その判定結果を音声符号化器 8 0 3及び D T X制御及び多重化器 8 0 5に出力する。なお、分離前の入力信号を用いて判定を行う構成でもよい。有音 Z無音判定器 8 0 2は任意のものでよい。この判定は、一般には、入力信号のパワー、スぺクトルやピッチ周期などの複数のパラメ一夕の瞬時量または変化量等を用いて判定が行われる。

そして、前記有音 Z無音判定器 8 0 2による判定結果が有音である場合には、音声符号化器 8 0 3により、前記音声 Z雑音信号分離器 8 0 1から得られる分離後の音声信号に対して有音区間のみ音声符号化器 8 0 3で音声信号の符号化を行い、その符号化データを D T X制御及び多重化器 8 0 5に出力する。この音声符号化器 8 0 3は、有音区間用の符号化器で、音声を高能率に符号化する任意の符号化器でよい。

一方、雑音信号符号化器 8 0 4により、前記音声 Z雑音信号分離器 8 0 1から得られる分離後の雑音信号に対して全区間にわたって雑音信号符号化器 8 0 4で雑音信号の符号化を行い、入力雑音信号表現する雑音モデルに関する情報と雑音モデルの更新をするかどうかのフラグを出力する。音声 Z雑音信号符号化器 8 0 1は、実施の形態 1にて説明した図 5に示すものである。

なお、有音 Z無音判定結果が有音である場合、雑音信号符号化器 8 0 4に入力される有音 Z無音判定結果フラグを雑音信号符号化器 8 0 4における雑音モデル更新不許可フラグとして、モデル更新を行わないようにする。

最後に、 D T X制御及び多重化器 8 0 5により、前記有音 Z無音判定器 8 0 2、音声符号化器 8 0 3及び雑音信号符号化器 8 0 4からの出力を用いて送信データとして送信すべき情報の制御と送信情報の多重化を行い、送信デ一夕として出力する。

図 1 1は、実施の形態 2に係る音声信号の復号化装置の構成を示すブロック図である。

図 1 1に示す復号化装置においては、分離及び D T X制御器 9 0 1において、符号化側で入力信号に対して符号化され送信された送信デ一夕を受信データとして受信し、音声復号及び雑音生成に必要な、音声符号化データまたは雑音モデルパラメ一夕、有音 Z無音判定フラグ及び雑音モデル更新フラグに分離する。

次に、前記有音 Z無音判定フラグが有音区間を示す場合には、音声復号化器 9 0 2により前記音声符号化データから音声復号を行い復号音声を音声/雑音信号加算器 9 0 4に出力する。

一方、雑音信号生成器 9 0 3により前記雑音モデルパラメ一夕及び雑音モデル更新フラグから雑音信号の生成を行い、雑音信号を音声 Z雑音信号加算器 9 0 4に出力する。そして、音声 Z雑音信号加算器 9 0 4により、前記音声復号化器 9 0 2の出力と前記雑音信号生成器 9 0 3の出力とを加算し、出力信号とする。

次に、図 1 2を参照して、実施の形態 2に係る音声信号の符号化方法の処理の流れを説明する。なお、本方法では、図 1 2に示す本処理を、一定短区間（例えば、 1 0〜5 0 m s程度）のフレーム毎に繰り返して行うものとする。

まず、 S T 3 0 1において、フレーム単位の入力信号を入力する。次いで、 S T 3 0 2にて、入力音声信号を、音声信号と音声信号に重畳している背景雑音信号とに分離する。そして、 S T 3 0 3において、入力信号または S T 3 0 2で得られた分離後の音声信号に対して有音無音判定を行い、その判定結果を出力する（S T 3 0 4 ) 。

そして、判定結果が有音である場合には、 S T 3 0 5において、 S T 3 0 2 で得られた分離後の音声信号に対して音声符号化器による音声符号化処理を行い、その符号化データを出力する。次いで、 S T 3 0 2で得られた分離後の雑音信号に対して、 S T 3 0 6にて、雑音信号符号化器による雑音信号符号化処理を行い、入力雑音信号表現する雑音モデルに関する情報と雑音モデルの更新をするかどうかのフラグを出力する。

S T 3 0 3における有音 Z無音判定結果が有音である場合、 S T 3 0 6にて行う雑音信号符号化処理において、モデル更新を行わないようにする。そして、 S T 3 0 7において、前記有音 Z無音判定、音声符号化処理及び雑音信号符号化処理の結果得られた出力を用いて送信データとして送信すべき情報の制御と送信情報との多重化を行い、最後に S T 3 0 8にて送信データとして出力する。

このように、本実施の形態の音声信号の符号化装置によれば、有音区間では音声信号を高品質で符号化できる音声符号化器で符号化を行い、雑音信号に対しては高効率で聴感的に劣化が少ない実施の形態 1記載の雑音信号符号化器で符号化を行うことにより、背景雑音環境下においても高品質'高効率な符号化を行うことができ、さらに音声 Z雑音信号分離器を設けることにより、前記音声符号化器に入力される音声信号から重畳された背景雑音が除去され、有音区間をより高品質にまたはより高効率に符号化することができる。

(実施の形態 3 )

図 1 3は、本発明の実施の形態 3に係る音声符号化部の構成を示すブロック図である。なお、本実施の形態における復号側の構成は、図 6に示す音声信号の復号装置の構成と同一である。

入力信号分析器 1 1 0 1により、ある一定区間毎に入力された入力信号に対して信号分析を行い、入力信号に対する分析パラメ一夕を算出する。抽出する特徴パラメ一夕としては、入力信号に関する統計的特徴量を表すのに必要なパラメ一夕及び音声的な特徴を表すパラメータである。統計的特徴量を表すのに必要なパラメ一夕としては、例えば、短区間信号に対して F F Tにより求めた短時間スペクトルや、入力パワー、 L P Cスペクトルパラメ一夕、等がある。また、音声的な特徴を表すパラメ一夕としては、 L P Cパラメータ、入力パヮ一やピッチ周期性情報、等がある。

次に、モード判定器 1 1 0 4により、前記入力信号分析器 1 1 0 1で得られた分析パラメ一夕に対して、音声モデル記憶器 1 1 0 2で保持されている音声的な特徴パターン及び雑音モデル記憶器 1 1 0 3で保持されている雑音モデルパラメ一夕を用いて、入力信号が有音区間か無音区間（雑音のみの区間）力及び無音区間の場合に雑音モデルを更新して更新情報を伝送するかどうかの判定を行う。

ここで、音声モデル記憶器 1 1 0 2は、音声的な特徴パターンを予め作成記憶しているもので、音声的な特徴パターンとしては、例えば、音声（有音）区間中の L P Cパラメ一夕、入力信号パヮーゃピッチ周期性情報等の分布などの情報である。また、雑音モデルパラメ一夕とは、入力雑音信号に関する統計的特徴量を表現できるような雑音モデルに関する情報であり、例えば、短時間スぺクトルの平均スぺクトルや分散値、等の統計的特徴量を、例えば HMMのような統計モデルで表現した際の情報である。

そして、入力信号分析器 1 1 0 1により得られた現入力信号に対する統計的分析パラメータが、それ以前の雑音区間中の信号を表す雑音モデルとして記憶された雑音モデルからの出力として妥当かどうか（例えば、 HMMモデルであれば現入力信号に対する分析パラメ一夕の出力確率が規定値以上であるか）を判定すると共に、入力信号に対する音声的特徴を表すパラメ一夕から音声（有音）区間かどうかを判定する。

前記モード判定器 1 104が有音区間であると判定した場合には、音声符号化器 1 105により、入力信号に対して音声符号化を行いその符号化データを DTX制御及び多重化器 1 107に出力する。一方、前記モード判定器 1 10 4が無音区間でかつ雑音モデル更新情報を伝送すると判定した場合には、雑音モデル更新器 1 106により、その雑音モデルの更新を行い、更新後の雑音モデルに関する情報を DTX制御及び多重化器 1 107に出力する。

最後に、 DTX制御及び多重化器 1 107により、音声符号化器及び雑音モデル更新器 1 1 06からの出力を用いて送信デ一夕として送信すべき情報の制御と送信情報の多重化を行い、送信データを出力する。

次に、図 14を参照して、本実施の形態に係る音声信号の符号化方法の処理の流れを説明する。なお、本方法では、図 14に示す本処理を、一定短区間（例えば、 10〜50ms程度）のフレーム毎に繰り返して行うものとする。

まず、 ST401において、フレーム単位の入力信号を入力する。次に、 S T402において、ある一定区間毎に入力された入力信号に対して信号分析を行い、その分析パラメ一夕を算出し出力する。

そして、 ST403において、現在入力された統計的分析パラメ一夕が、図 1 1における雑音モデル記憶器 1 103により保持されている雑音モデルからの出力として妥当かどうかその適合性を判定する（ST404) 。その結果、適合しない、すなわち現入力信号が現時点で保持されている雑音モデルでは表現できないと判定された場合には、次の ST405に進み、入力信号に対して分析して得られた音声的特徴パラメ一夕から音声（有音）区間かどうか判定する。そして、音声区間と判定された場合、 ST406にて、音声符号化器による音声符号化処理を行い、その符号化データを出力する。

一方、 S T 4 0 5にて、音声区間ではないと判定された場合、 S T 4 0 7にて、雑音モデルの更新を行い、更新後の雑音モデルに関する情報を出力する。 S T 4 0 3にて、現入力が現時点で保持されている雑音モデルで表現できると判定された場合は、何も処理をせず次ステップに進む。そして、 S T 4 0 8において、音声符号化器及び雑音モデル更新器からの出力を用いて送信データとして送信すべき情報の制御と送信情報の多重化を行い、 S T 4 0 9にて送信デ一夕を出力する。

このように、本実施の形態に係る音声信号の符号化装置によれば、モード判定器を設けることにより、入力信号の統計的特徴量の変化及び音声の特徴パ夕ーンを用いて判定を行うことができる。したがって、より正確なモード判定を行うことができ、判定誤りによる品質劣化を抑えることができる。

本発明の雑音信号符号化装置は、雑音信号を含む音声信号の前記雑音信号に対して信号分析を行う分析器と、前記雑音信号を表わす雑音モデルに関する情報を記憶する記憶器と、現入力の雑音信号の信号分析結果に基づいて、記憶された雑音モデルに関する情報の変化を検出する検出器と、雑音モデルに関する情報の変化が検出された場合に、前記変化の変化量分だけ前記記憶された雑音モデルに関する情報を更新する更新器と、を具備する構成を採る。

この構成によれば、雑音信号を統計的特徴量で表現できるような雑音モデルでモデル化することにより、背景雑音信号に対して聴感的に劣化の少ない復号信号を生成することができる。また、このモデル化により、入力信号波形に対する忠実な符号化が不要となるので、入力信号に対応する雑音モデルパラメ一夕が変化する区間のみ伝送することにより、低ビットレートで高効率な符号化を行うことができる。

本発明の雑音信号符号化装置は、上記構成において、分析器が、雑音信号に関する統計的特徴量を抽出し、記憶器は、前記統計的特徴量を表現できる情報を雑音モデルに関する情報として記憶する構成を採る。 1 b この構成によれば、雑音信号を適切にモデル化することができ、低ビットレ一卜で高効率な符号化を効率良く行うことができる。

本発明の音声信号符号化装置は、入力音声信号に対して有音区間か雑音信号のみを含む無音区間かを判定する有音 z無音判定器と、判定結果が有音である場合に前記入力音声信号に対して音声符号化を行う音声符号化器と、判定結果が無音である場合に前記入力信号に対して雑音信号の符号化を行う上記雑音信号符号化装置と、前記有音 Z無音判定器、前記音声符号化器、及び前記雑音信号符号化装置からの出力を多重化する多重化器と、を具備する構成を採る。この構成によれば、有音区間では音声信号を高品質で符号化できる音声符号化器で符号化を行い、無音区間では高効率で聴感的に劣化が少ない上記雑音信号符号化装置で符号化を行うことにより、背景雑音環境下においても高品質 · 高効率な符号化を行うことができる。

本発明の音声信号符号化装置は、入力音声信号を、音声信号とこの音声信号に重畳している背景雑音信号とに分離する音声/雑音信号分離器と、前記入力音声信号又は前記音声 Z雑音信号分離器により得られる音声信号から有音区間か雑音信号のみを含む無音区間かを判定する有音 Z無音判定器と、判定結果が有音である場合に前記入力音声信号に対して音声符号化を行う音声符号化器と、前記音声 Z雑音信号分離器により得られる背景雑音信号の符号化を行う上記雑音信号符号化装置と、前記有音 Z無音判定器、前記音声符号化器、及び前記雑音信号符号化装置からの出力を多重化する多重化器と、を具備する構成を採る。

この構成によれば、有音区間では音声信号を高品質で符号化できる音声符号化器で符号化を行い、雑音信号に対しては高効率で聴感的に劣化が少ない上記雑音信号符号化装置で符号化を行うことにより、背景雑音環境下においても高品質 '高効率な符号化を行うことができる。また、音声 Z雑音信号分離器を設けることにより、前記音声符号化器に入力される音声信号から重畳された背景雑音を除去することができ、有音区間をより高品質に又はより高効率に符号化することができる。

本発明の音声信号符号化装置は、入力音声信号に対して信号分析を行う分析器と、前記入力音声信号が有音信号であるかどうかを判定するために必要な音声の特徴パターンを記憶する音声モデル記憶器と、前記入力音声信号に含まれる雑音信号を表現する雑音モデルに関する情報を記憶する雑音モデル記憶器と、前記分析器、音声モデル記憶器及び雑音モデル記憶器の出力を用いて、前記入力音声信号が有音区間か雑音信号のみを含む無音区間かを判定すると共に、前記無音区間の場合に雑音モデルを更新するかどうかの判定を行うモード判定器と、前記モード判定器が有音区間と判定した場合に入力音声信号に対して音声符号化を行う音声符号化器と、前記モード判定器が無音区間でかつ雑音モデルを更新すると判定した場合にその雑音モデルの更新を行う雑音モデル更新器と、音声符号化器及び雑音モデル更新器からの出力を多重化する多重化器と、を具備する構成を採る。

この構成によれば、モード判定器を設けることにより、入力信号の統計的特徴量の変化及び音声の特徴パターンを用いて判定を行うことができる。したがつて、より正確なモード判定を行うことができ、判定誤りによる品質劣化を抑えることができる。

本発明の雑音信号生成装置は、符号化側で入力雑音信号に対して符号化された雑音モデルパラメ一夕及び雑音モデル更新フラグにしたがつて、必要な場合に雑音モデルの更新を行う雑音モデル更新器と、前記雑音モデル更新器の出力を用いて更新後の雑音モデルに関する情報を記憶する雑音モデル記憶器と、前記雑音モデル記憶器で記憶している雑音モデルに関する情報から雑音信号を生成する雑音信号生成器と、を具備する構成を採る。

この構成によれば、背景雑音信号に対して聴感的に劣化の少ない復号信号を生成することができる。

本発明の雑音信号生成装置は、上記構成において、前記雑音モデル更新器へ入力する雑音モデルパラメータ及び前記雑音モデル記憶器で記憶する情報が、生成する雑音信号に関する統計的特徴量を表現できる情報である構成を採る。この構成によれば、雑音信号を統計的特徴量で表現できるような雑音モデルでモデル化することにより、背景雑音信号に対して聴感的に劣化の少ない復号信号を生成することができる。

本発明の音声信号復号化装置は、符号化側で符号化された音声データ、雑音モデルパラメ一夕、有音 Ζ無音判定フラグ及び雑音モデル更新フラグを含む信号を受信し、前記信号から雑音モデルパラメ一夕、有音 Ζ無音判定フラグ及び雑音モデル更新フラグを分離する分離器と、前記有音 Ζ無音判定フラグが有音区間を示す場合に、前記音声データに対して音声復号を行う音声複号化器と、前記有音 Ζ無音判定フラグが無音区間を示す場合に、前記雑音モデルパラメ一夕及び雑音モデル更新フラグから雑音信号の生成を行う雑音信号生成装置と、前記音声復号化器から出力される復号音声と前記雑音信号生成装置から出力される雑音信号のいずれかを、前記有音 Ζ無音判定フラグに応じて切り替えて出力信号として出力する出力切り替え器と、を具備する構成を採る。

本発明の音声信号複号化装置は、符号化側で符号化された音声データ、雑音モデルパラメ一夕、有音 Ζ無音判定フラグ及び雑音モデル更新フラグを含む信号を受信し、前記信号から雑音モデルパラメ一夕、有音 Ζ無音判定フラグ及び雑音モデル更新フラグを分離する分離器と、前記有音 Ζ無音判定フラグが有音区間を示す場合に、前記音声データに対して音声復号を行う音声復号化器と、前記有音 Ζ無音判定フラグが無音区間を示す場合に、前記雑音モデルパラメ一夕及び雑音モデル更新フラグから雑音信号の生成を行う上記雑音信号生成装置と、前記音声復号化器から出力される復号音声と前記雑音信号生成装置から出力される雑音信号とを加算する音声 Ζ雑音信号加算器と、を具備する構成を採る。

この構成によれば、背景雑音信号に対して聴感的に劣化の少ない復号信号を生成することができる。また、符号化側で音声信号とそれに重畳する雑音信号を分離した後に、それぞれの信号に適した符号器で符号化し、復号側でそれらを加算して復号信号を生成するので、有音区間の音声信号をより高品質に符号化することができる。

本発明の音声信号符号化方法は、入力音声信号に対して有音区間か雑音信号のみを含む無音区間かを判定する有音 Ζ無音判定工程と、判定結果が有音である場合に前記入力音声信号に対して音声符号化を行う音声符号化工程と、判定結果が無音である場合に前記入力信号に対して雑音信号の符号化を行う雑音信号符号化工程と、前記有音 Ζ無音判定工程、前記音声符号化工程、及び前記雑音信号符号化工程における出力を多重化する多重化工程と、を具備し、雑音信号符号化工程は、雑音信号を含む音声信号の前記雑音信号に対して信号分析を行う分析工程と、前記雑音信号を表わす雑音モデルに関する情報を記憶する記憶工程と、現入力の雑音信号の信号分析結果に基づいて、記憶された雑音モデルに関する情報の変化を検出する検出工程と、雑音モデルに関する情報の変化が検出された場合に、前記変化の変化量分だけ前記記憶された雑音モデルに関する情報を更新する更新工程と、を含む。

この方法によれば、有音区間では音声信号を高品質で符号化できる音声符号化手段で符号化を行い、無音区間では高効率で聴感的に劣化が少ない第 1の態様の雑音信号符号化装置で符号化を行うことにより、背景雑音環境下においても高品質 ·高効率な符号化を行うことができる。

本発明の音声信号符号化方法は、入力音声信号を、音声信号とこの音声信号に重畳している背景雑音信号とに分離する音声 Ζ雑音信号分離工程と、前記入力音声信号又は前記音声 ζ雑音信号分離工程において得られる音声信号から有音区間か雑音信号のみを含む無音区間かを判定する有音/無音判定工程と、判定結果が有音である場合に前記入力音声信号に対して音声符号化を行う音声符号化工程と、判定結果が無音である場合に前記入力信号に対して雑音信号の符号化を行うと共に、前記音声 Ζ雑音信号分離工程において得られる背景雑音信号の符号化を行う雑音信号符号化工程と、前記有音 Z無音判定工程、前記音声符号化工程、及び前記雑音信号符号化工程における出力を多重化する多重化工程と、を具備し、

雑音信号符号化工程は、雑音信号を含む音声信号の前記雑音信号に対して信号分析を行う分析工程と、前記雑音信号を表わす雑音モデルに関する情報を記憶する記憶工程と、現入力の雑音信号の信号分析結果に基づいて、記憶された雑音モデルに関する情報の変化を検出する検出工程と、雑音モデルに関する情報の変化が検出された場合に、前記変化の変化量分だけ前記記憶された雑音モデルに関する情報を更新する更新工程と、を含む。

この方法によれば、有音区間では音声信号を高品質で符号化できる音声符号化手段で符号化を行い、無音区間では高効率で聴感的に劣化が少ない第 1の態様の雑音信号符号化装置で符号化を行うことにより、背景雑音環境下においても高品質 ·高効率な符号化を行うことができる。また、音声 Z雑音信号分離手段を設けることにより、前記音声符号化手段に入力される音声信号から重畳された背景雑音を除去することができ、有音区間をより高品質に又はより高効率に符号化することができる。

本発明の音声信号符号化方法は、入力音声信号に対して信号分析を行う分析工程と、前記入力音声信号が有音信号であるかどうかを判定するために必要な音声の特徴パターンを記憶する音声モデル記憶工程と、前記入力音声信号に含まれる雑音信号を表現する雑音モデルに関する情報を記憶する雑音モデル記憶工程と、前記分析手段、音声モデル記憶手段及び雑音モデル記憶手段の出力を用いて、前記入力音声信号が有音区間か雑音信号のみを含む無音区間かを判定すると共に、前記無音区間の場合に雑音モデルを更新するかどうかの判定を行うモード判定工程と、前記モード判定手段が有音区間と判定した場合に入力音声信号に対して音声符号化を行う音声符号化工程と、前記モード判定手段が無音区間でかつ雑音モデルを更新すると判定した場合にその雑音モデルの更新を行う雑音モデル更新工程と、音声符号化手段及び雑音モデル更新手段からの出力を多重化する多重化工程と、を具備する。

この方法によれば、モード判定手段を設けることにより、入力信号の統計的特徴量の変化及び音声の特徴パターンを用いて判定を行うことができる。したがって、より正確なモード判定を行うことができ、判定誤りによる品質劣化を抑えることができる。

本発明の記録媒体は、コンピュータに、入力雑音信号に対して統計的特徴量の分析を行う手順と、入力雑音信号に対する統計的特徴量を表現する雑音モデルに関する情報を記憶する手順と、入力雑音信号を表す雑音モデルの変化を検出する手順と、必要な場合に雑音モデルの更新を行い更新後の雑音モデルに関する情報を出力する手順、を実行させるためのプログラムを記録した機械読みとり可能なものである。

以上説明したように本発明の雑音信号符号化装置では、雑音信号を統計的特徴量で表現できるような雑音モデルでモデル化することにより、背景雑音信号に対して聴感的に劣化の少ない復号信号を生成することができる。また、入力信号波形に対する忠実な符号化が不要となるので、入力信号に対応する雑音モデルパラメ一夕が変化する区間のみ伝送することにより、低ビットレ一トで高効率な符号化を行うことができる。

また、本発明の音声信号符号化装置においては、有音区間では音声信号を高品質で符号化できる音声符号化器で符号化を行い、無音区間では高効率で聴感的に劣化が少ない前記雑音信号符号化器で符号化を行うことにより、背景雑音環境下においても高品質 ·高効率な符号化を行うことができる。

本明細書は、 1 9 9 9年 6月 1 5日出願の特願平 1 1 一 1 6 8 5 4 5号に基づく。この内容はすべてここに含めておく。産業上の利用可能性

本発明は、ディジ夕ル無線通信システムにおける基地局装置や通信端末装置に適用することができる。

Claims

請求の範囲

1 . 雑音信号を含む音声信号の前記雑音信号に対して信号分析を行う分析手段と、前記雑音信号を表わす雑音モデルに関する情報を記憶する記憶手段と、現入力の雑音信号の信号分析結果に基づいて、記憶された雑音モデルに関する情報の変化を検出する検出手段と、雑音モデルに関する情報の変化が検出された場合に、前記変化の変化量分だけ前記記憶された雑音モデルに関する情報を更新する更新手段と、を具備する雑音信号符号化装置。

2 . 分析手段は、雑音信号に関する統計的特徴量を抽出し、記憶手段は、前記統計的特徴量を表現できる情報を雑音モデルに関する情報として記憶する請求項 1記載の雑音信号符号化装置。

3 . 入力音声信号に対して有音区間か雑音信号のみを含む無音区間かを判定する有音 Z無音判定手段と、判定結果が有音である場合に前記入力音声信号に対して音声符号化を行う音声符号化手段と、判定結果が無音である場合に前記入力信号に対して雑音信号の符号化を行う請求項 1又は請求項 2記載の雑音信号符号化装置と、前記有音 Z無音判定手段、前記音声符号化手段、及び前記雑音信号符号化装置からの出力を多重化する多重化手段と、を具備する音声信号符号化装置。

4 . 入力音声信号を、音声信号とこの音声信号に重畳している背景雑音信号とに分離する音声 Z雑音信号分離手段と、前記入力音声信号又は前記音声 Z雑音信号分離手段により得られる音声信号から有音区間か雑音信号のみを含む無音区間かを判定する有音 Z無音判定手段と、判定結果が有音である場合に前記入力音声信号に対して音声符号化を行う音声符号化手段と、前記音声 Z雑音信号分離手段により得られる背景雑音信号の符号化を行う請求項 1記載の雑音信号符号化装置と、前記有音 Z無音判定手段、前記音声符号化手段、及び前記雑音信号符号化装置からの出力を多重化する多重化手段と、を具備する音声信号符号化装置。

5 . 入力音声信号に対して信号分析を行う分析手段と、前記入力音声信号が有ム

音信号であるかどうかを判定するために必要な音声の特徴パターンを記憶する音声モデル記憶手段と、前記入力音声信号に含まれる雑音信号を表現する雑音モデルに関する情報を記憶する雑音モデル記憶手段と、前記分析手段、音声モデル記憶手段及び雑音モデル記憶手段の出力を用いて、前記入力音声信号が有音区間か雑音信号のみを含む無音区間かを判定すると共に、前記無音区間の場合に雑音モデルを更新するかどうかの判定を行うモード判定手段と、前記モ一ド判定手段が有音区間と判定した場合に入力音声信号に対して音声符号化を行う音声符号化手段と、前記モード判定手段が無音区間でかつ雑音モデルを更新すると判定した場合にその雑音モデルの更新を行う雑音モデル更新手段と、音声符号化手段及び雑音モデル更新手段からの出力を多重化する多重化手段と、を具備する音声信号符号化装置。

6 . 音声信号符号化装置を備えた基地局装置であって、前記音声符号化装置は、入力音声信号に対して有音区間か雑音信号のみを含む無音区間かを判定する有音 Ζ無音判定手段と、判定結果が有音である場合に前記入力音声信号に対して音声符号化を行う音声符号化手段と、判定結果が無音である場合に前記入力信号に対して雑音信号の符号化を行う請求項 1又は請求項 2記載の雑音信号符号化装置と、前記有音 Ζ無音判定手段、前記音声符号化手段、及び前記雑音信号符号化装置からの出力を多重化する多重化手段と、を具備する。

7 . 音声信号符号化装置を備えた通信端末装置であって、前記音声符号化装置は、入力音声信号に対して有音区間か雑音信号のみを含む無音区間かを判定する有音ノ無音判定手段と、判定結果が有音である場合に前記入力音声信号に対して音声符号化を行う音声符号化手段と、判定結果が無音である場合に前記入力信号に対して雑音信号の符号化を行う請求項 1又は請求項 2記載の雑音信号符号化装置と、前記有音 Ζ無音判定手段、前記音声符号化手段、及び前記雑音信号符号化装置からの出力を多重化する多重化手段と、を具備する。

8 . 符号化側で入力雑音信号に対して符号化された雑音モデルパラメ一夕及び雑音モデル更新フラグにしたがって、必要な場合に雑音モデルの更新を行う雑音モデル更新手段と、前記雑音モデル更新手段の出力を用いて更新後の雑音モデルに関する情報を記憶する雑音モデル記憶手段と、前記雑音モデル記憶手段で記憶している雑音モデルに関する情報から雑音信号を生成する雑音信号生成手段と、を具備する雑音信号生成装置。

9 . 前記雑音モデル更新手段へ入力する雑音モデルパラメ一夕及び前記雑音モデル記憶手段で記憶する情報が、生成する雑音信号に関する統計的特徴量を表現できる情報である請求項 8記載の雑音信号生成装置。

1 0 . 符号化側で符号化された音声データ、雑音モデルパラメ一夕、有音 Z無音判定フラグ及び雑音モデル更新フラグを含む信号を受信し、前記信号から雑音モデルパラメ一夕、有音 Z無音判定フラグ及び雑音モデル更新フラグを分離する分離手段と、前記有音 Z無音判定フラグが有音区間を示す場合に、前記音声デー夕に対して音声復号を行う音声複号化手段と、前記有音 Z無音判定フラグが無音区間を示す場合に、前記雑音モデルパラメ一夕及び雑音モデル更新フラグから雑音信号の生成を行う請求項 8記載の雑音信号生成装置と、前記音声復号化手段から出力される復号音声と前記雑音信号生成装置から出力される雑音信号のいずれかを、前記有音 Z無音判定フラグに応じて切り替えて出力信号として出力する出力切り替え手段と、を具備する音声信号復号化装置。

1 1 . 符号化側で符号化された音声データ、雑音モデルパラメ一夕、有音/無音判定フラグ及び雑音モデル更新フラグを含む信号を受信し、前記信号から雑音モデルパラメ一夕、有音 Z無音判定フラグ及び雑音モデル更新フラグを分離する分離手段と、前記有音ノ無音判定フラグが有音区間を示す場合に、前記音声デ一夕に対して音声復号を行う音声復号化手段と、前記有音 Z無音判定フラグが無音区間を示す場合に、前記雑音モデルパラメ一夕及び雑音モデル更新フラグから雑音信号の生成を行う請求項 8又は請求項 9記載の雑音信号生成装置と、前記音声復号化手段から出力される復号音声と前記雑音信号生成装置から出力される雑音信号とを加算する音声 Z雑音信号加算手段と、を具備する音声信号復号化装置。

1 2 . 入力音声信号に対して有音区間か雑音信号のみを含む無音区間かを判定する有音 Z無音判定工程と、判定結果が有音である場合に前記入力音声信号に対して音声符号化を行う音声符号化工程と、判定結果が無音である場合に前記入力信号に対して雑音信号の符号化を行う雑音信号符号化工程と、前記有音/ 無音判定工程、前記音声符号化工程、及び前記雑音信号符号化工程における出力を多重化する多重化工程と、を具備し、

雑音信号符号化工程は、雑音信号を含む音声信号の前記雑音信号に対して信号分析を行う分析工程と、前記雑音信号を表わす雑音モデルに関する情報を記憶する記憶工程と、現入力の雑音信号の信号分析結果に基づいて、記憶された雑音モデルに関する情報の変化を検出する検出工程と、雑音モデルに関する情報の変化が検出された場合に、前記変化の変化量分だけ前記記憶された雑音モデルに関する情報を更新する更新工程と、を含む音声信号符号化方法。

1 3 . 入力音声信号を、音声信号とこの音声信号に重畳している背景雑音信号とに分離する音声 Z雑音信号分離工程と、前記入力音声信号又は前記音声 Z雑音信号分離工程において得られる音声信号から有音区間か雑音信号のみを含む無音区間かを判定する有音 Z無音判定工程と、判定結果が有音である場合に前記入力音声信号に対して音声符号化を行う音声符号化工程と、判定結果が無音である場合に前記入力信号に対して雑音信号の符号化を行うと共に、前記音声 Z雑音信号分離工程において得られる背景雑音信号の符号化を行う雑音信号符号化工程と、前記有音 Z無音判定工程、前記音声符号化工程、及び前記雑音信号符号化工程における出力を多重化する多重化工程と、を具備し、雑音信号符号化工程は、雑音信号を含む音声信号の前記雑音信号に対して信号分析を行う分析工程と、前記雑音信号を表わす雑音モデルに関する情報を記憶する記憶工程と、現入力の雑音信号の信号分析結果に基づいて、記憶された雑音モデルに関する情報の変化を検出する検出工程と、雑音モデルに関する情報の変化が検出された場合に、前記変化の変化量分だけ前記記憶された雑音モデルに関する情報を更新する更新工程と、を含む音声信号符号化方法。 A b

1 4 . 入力音声信号に対して信号分析を行う分析工程と、前記入力音声信号が有音信号であるかどうかを判定するために必要な音声の特徴パターンを記憶する音声モデル記憶工程と、前記入力音声信号に含まれる雑音信号を表現する雑音モデルに関する情報を記憶する雑音モデル記憶工程と、前記分析手段、音声モデル記憶手段及び雑音モデル記憶手段の出力を用いて、前記入力音声信号が有音区間か雑音信号のみを含む無音区間かを判定すると共に、前記無音区間の場合に雑音モデルを更新するかどうかの判定を行うモード判定工程と、前記モード判定手段が有音区間と判定した場合に入力音声信号に対して音声符号化を行う音声符号化工程と、前記モード判定手段が無音区間でかつ雑音モデルを更新すると判定した場合にその雑音モデルの更新を行う雑音モデル更新ェ程と、音声符号化手段及び雑音モデル更新手段からの出力を多重化する多重化工程と、を具備する音声信号符号化方法。

1 5 . コンピュータに、入力雑音信号に対して統計的特徴量の分析を行う手順と、入力雑音信号に対する統計的特徴量を表現する雑音モデルに関する情報を記憶する手順と、入力雑音信号を表す雑音モデルの変化を検出する手順と、必要な場合に雑音モデルの更新を行い更新後の雑音モデルに関する情報を出力する手順、を実行させるためのプログラムを記録した機械読みとり可能な記憶媒体。