JP3315956B2

JP3315956B2 - 音声符号化装置及び音声符号化方法

Info

Publication number: JP3315956B2
Application number: JP28146699A
Authority: JP
Inventors: 正米崎
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 1999-10-01
Filing date: 1999-10-01
Publication date: 2002-08-19
Anticipated expiration: 2019-10-01
Also published as: AU7447300A; JP2001109496A; WO2001026094A1

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、自動車電話、携帯
電話等の無線通信システムの通信装置に使用される音声
符号化装置及び音声符号化方法に関する。

【０００２】

【従来の技術】近年、需要が急増している無線通信シス
テムの分野では、電波資源の有効利用のため低ビットレ
ートで高品質に音声を符号化できる装置の開発が進めら
れている。

【０００３】図７は、従来の音声符号化装置の構成を示
すブロック図である。

【０００４】図７において、雑音区間検出部１１は、入
力信号を音声区間と他の区間に分離し、音声区間以外の
信号を背景雑音として検出する。雑音モデル推定部１２
は、雑音区間検出部１１にて検出された雑音区間におい
て、例えば、雑音信号の振幅周波数特性のような雑音モ
デルを推定する。

【０００５】雑音除去部１３は、雑音モデル推定部１２
にて推定された雑音モデルを用いて、入力信号から雑音
を除去する。雑音モデルとして振幅周波数特性を用いた
場合、スペクトラルサブトラクション法等を用いて雑音
を除去することができる。なお、雑音除去処理に関して
は、特開平１０−１３３６８９号公報、及び、特開平１
０−１８７１９３号公報等に記載されている。

【０００６】音声分析部１４は、雑音除去部１３の出力
である雑音を除去された信号を分析してパラメータを抽
出する。

【０００７】パラメータ量子化部１５は、音声分析部１
４にて抽出されたパラメータを量子化し、ユークリッド
距離に代表される１つの尺度に基づいて誤差が最小とな
る符号を量子化値に対応する符号として抽出して出力す
る。

【０００８】このように、従来の音声符号化装置は、入
力信号に対して雑音信号成分を除去して、音声信号に特
化したパラメータを抽出することにより、低ビットレー
トで高品質な音声符号化を実現している。

【０００９】

【発明が解決しようとする課題】しかしながら、上記従
来の音声符号化装置は、雑音信号成分の除去処理が音声
符号化処理と独立し、雑音信号成分を除去する能力が雑
音モデルの精度に大きく依存し、背景雑音環境下におい
て品質が劣化するという問題を有している。

【００１０】本発明はかかる点に鑑みてなされたもので
あり、雑音モデルの精度に対する依存度が少なく、雑音
信号成分に対して頑強で背景雑音環境下においても高品
質な音声符号化処理を実現することができる音声符号化
装置及び音声符号化方法を提供することを目的とする。

【００１１】

【課題を解決するための手段】本発明の音声符号化装置
は、入力信号の雑音区間を検出する雑音区間検出手段
と、検出された雑音区間の雑音の大きさを推定する雑音
レベル推定手段と、雑音を含まない音声入力信号に対す
るパラメータ列をモデル化した情報源モデルを記憶する
情報源モデル記憶手段と、入力信号を分析してパラメー
タを抽出する音声分析手段と、前記情報源モデル及び前
記雑音の大きさに基づいて前記抽出されたパラメータを
量子化し、量子化値に対応する符号を出力するパラメー
タ量子化手段とを具備する構成を採る。

【００１２】本発明の音声符号化装置のパラメータ量子
化手段は、雑音の大きさに応じて許容誤差を決定し、パ
ラメータとの誤差が前記許容誤差以下の符号を符号帳の
中から抽出し、情報源モデルに基づいて前記抽出された
符号の中で最も確からしい符号を送信符号として選択す
る構成を採る。

【００１３】これらの構成により、雑音の大きさに応じ
てパラメータから送信符号の候補を抽出し、情報源モデ
ルに基づいて最終的な送信符号を決定することができる
ので、雑音を含まない信号に対する性能を劣化させるこ
となく、雑音信号成分に対して頑強で背景雑音環境下に
おいても高品質な音声符号化処理を実現することができ
る。

【００１４】本発明の音声符号化装置のパラメータ量子
化手段は、雑音の大きさ及び情報源モデルに基づいて、
入力パラメータと量子化値の誤差を算出する際における
パラメータの各要素に対する重み付けを決定し、この決
定された重み付けに従ってパラメータを量子化する構成
を採る。

【００１５】この構成により、雑音の大きさ及び情報源
モデルに基づいてパラメータの各要素に重み付けを行
い、パラメータを量子化することができるので、雑音を
含まない信号に対する性能を劣化させることなく、雑音
信号成分に対して頑強で背景雑音環境下においても高品
質な音声符号化処理を実現することができる。

【００１６】本発明の音声符号化装置のパラメータ量子
化手段は、雑音の大きさ及び情報源モデルから、入力信
号に雑音を含まない場合のパラメータ量子化値の出現確
率を推定し、この推定された出現確率と誤差値とを合わ
せた尤度に従って、パラメータを量子化する構成を採
る。

【００１７】この構成により、雑音の大きさ及び情報源
モデルに基づいてパラメータ量子化値の出現確率を推定
し、パラメータを量子化することができるので、雑音を
含まない信号に対する性能を劣化させることなく、雑音
信号成分に対して頑強で背景雑音環境下においても高品
質な音声符号化処理を実現することができる。

【００１８】本発明の音声符号化装置は、入力信号の雑
音区間を検出する雑音区間検出手段と、検出された雑音
区間における雑音モデルを推定する雑音モデル推定手段
と、雑音を含まない音声入力信号に対するパラメータ列
をモデル化した情報源モデルを記憶する情報源モデル記
憶手段と、入力信号を分析してパラメータを抽出する音
声分析手段と、前記情報源モデル及び前記雑音モデルに
基づいて前記抽出されたパラメータを量子化し、量子化
値に対応する符号を出力するパラメータ量子化手段とを
具備する構成を採る。

【００１９】本発明の音声符号化装置のパラメータ量子
化手段は、雑音モデルに基づいて許容誤差の範囲を決定
し、パラメータとの誤差が前記許容誤差以下の符号を符
号帳の中から抽出し、情報源モデルに基づいて前記抽出
された符号の中で最も確からしい符号を送信符号として
選択する構成を採る。

【００２０】これらの構成により、雑音モデルに基づい
てパラメータから送信符号の候補を抽出し、情報源モデ
ルに基づいて最終的な送信符号を決定することができる
ので、雑音の大きさを用いた場合に比べ、さらに、高品
質な音声符号化処理を実現することができる。

【００２１】本発明の音声符号化装置のパラメータ量子
化手段は、雑音モデル及び情報源モデルに基づいて、入
力パラメータと量子化値の誤差を算出する際におけるパ
ラメータの各要素に対する重み付けを決定し、この決定
された重み付けに従ってパラメータを量子化する構成を
採る。

【００２２】この構成により、雑音モデル及び情報源モ
デルに基づいてパラメータの各要素に重み付けを行い、
パラメータを量子化することができるので、雑音を含ま
ない信号に対する性能を劣化させることなく、雑音信号
成分に対して頑強で背景雑音環境下においても高品質な
音声符号化処理を実現することができる。

【００２３】本発明の音声符号化装置のパラメータ量子
化手段は、雑音モデル及び情報源モデルから、入力信号
に雑音を含まない場合のパラメータ量子化値の出現確率
を推定し、この推定された出現確率と誤差値とを合わせ
た尤度に従って、パラメータを量子化する構成を採る。

【００２４】この構成により、雑音モデル及び情報源モ
デルに基づいてパラメータ量子化値の出現確率を推定
し、パラメータを量子化することができるので、雑音を
含まない信号に対する性能を劣化させることなく、雑音
信号成分に対して頑強で背景雑音環境下においても高品
質な音声符号化処理を実現することができる。

【００２５】本発明の無線通信装置は、上記いずれかに
記載の音声符号化装置を搭載する構成を採る。

【００２６】この構成により、雑音信号成分に対して頑
強で背景雑音環境下においても高品質な音声符号化処理
を実現する無線通信システムを提供することができる。

【００２７】本発明の音声符号化方法は、入力信号の雑
音区間を検出する工程と、検出された雑音区間の雑音の
大きさを推定する工程と、入力信号を分析してパラメー
タを抽出する工程と、雑音を含まない音声入力信号に対
するパラメータ列をモデル化した情報源モデル及び前記
雑音の大きさに基づいて前記抽出されたパラメータを量
子化し、量子化値に対応する符号を出力する工程とを有
することとした。

【００２８】この方法により、雑音の大きさに応じてパ
ラメータから送信符号の候補を抽出し、情報源モデルに
基づいて最終的な送信符号を決定することができるの
で、雑音を含まない信号に対する性能を劣化させること
なく、雑音信号成分に対して頑強で背景雑音環境下にお
いても高品質な音声符号化処理を実現することができ
る。

【００２９】本発明の音声符号化方法は、入力信号の雑
音区間を検出する工程と、検出された雑音区間の雑音モ
デルを推定する工程と、入力信号を分析してパラメータ
を抽出する工程と、雑音を含まない音声入力信号に対す
るパラメータ列をモデル化した情報源モデル及び前記雑
音モデルに基づいて前記抽出されたパラメータを量子化
し、量子化値に対応する符号を出力する工程とを有する
こととした。

【００３０】この方法により、雑音モデルに基づいてパ
ラメータから送信符号の候補を抽出し、情報源モデルに
基づいて最終的な送信符号を決定することができるの
で、雑音の大きさを用いた場合に比べ、さらに、高品質
な音声符号化処理を実現することができる。

【００３１】本発明の記録媒体は、コンピュータに、入
力信号の雑音区間を検出させる手順と、検出された雑音
区間の雑音の大きさを推定させる手順と、入力信号を分
析してパラメータを抽出させる手順と、雑音を含まない
音声入力信号に対するパラメータ列をモデル化した情報
源モデル及び前記雑音の大きさに基づいて前記抽出され
たパラメータを量子化させ、量子化値に対応する符号を
出力させる手順とを実行させるための音声符号化プログ
ラムを記録した機械読み取り可能なものである。

【００３２】これにより、雑音の大きさに応じてパラメ
ータから送信符号の候補を抽出し、情報源モデルに基づ
いて最終的な送信符号を決定することができるので、雑
音を含まない信号に対する性能を劣化させることなく、
雑音信号成分に対して頑強で背景雑音環境下においても
高品質な音声符号化処理を実現することができる。

【００３３】本発明の記録媒体は、コンピュータに、入
力信号の雑音区間を検出させる手順と、検出された雑音
区間の雑音モデルを推定させる手順と、入力信号を分析
してパラメータを抽出させる手順と、雑音を含まない音
声入力信号に対するパラメータ列をモデル化した情報源
モデル及び前記雑音モデルに基づいて前記抽出されたパ
ラメータを量子化させ、量子化値に対応する符号を出力
させる手順とを実行させるための音声符号化プログラム
を記録した機械読み取り可能なものである。

【００３４】これにより、雑音モデルに基づいてパラメ
ータから送信符号の候補を抽出し、情報源モデルに基づ
いて最終的な送信符号を決定することができるので、雑
音の大きさを用いた場合に比べ、さらに、高品質な音声
符号化処理を実現することができる。

【００３５】

【発明の実施の形態】本発明の骨子は、雑音の大きさ又
は雑音モデルに加えて情報源モデルを用いてパラメータ
量子化を実行することである。

【００３６】以下、本発明の実施の形態について、添付
図面を参照して詳細に説明する。

【００３７】（実施の形態１）図１は、本発明の実施の
形態１に係る音声符号化装置の構成を示すブロック図で
ある。

【００３８】図１において、雑音区間検出部１０１は、
入力信号を音声区間とそれ以外の区間を分離し、音声区
間以外の信号を背景雑音として検出する。雑音レベル推
定部１０２は、雑音区間検出部１０１にて検出された雑
音区間の雑音レベル（雑音の大きさ）を推定する。

【００３９】情報源モデル記憶部１０３は、雑音を含ま
ない音声入力信号に対するパラメータ列をモデル化した
情報源モデルを記憶する。音声分析部１０４は、入力信
号を分析してパラメータを抽出する。

【００４０】パラメータ量子化部１０５は、情報源モデ
ル及び雑音レベルに基づいて音声分析部１０４にて抽出
されたパラメータを量子化し、量子化値に対応する符号
を出力する。

【００４１】図２は、本実施の形態に係る音声符号化装
置のパラメータ量子化部１０５の内部構成を示すブロッ
ク図である。

【００４２】図２において、許容誤差レベル決定器２０
１は、雑音レベル推定部１０２にて推定された雑音レベ
ルに応じて許容誤差を決定する。

【００４３】符号帳２０２は、送信符号に対応する量子
化値を蓄積している。符号抽出器２０３は、音声分析部
１０４にて抽出されたパラメータとの誤差が許容誤差以
下の符号を、符号帳２０２の中から抽出する。

【００４４】符号選択器２０４は、情報源モデルに基づ
いて、符号抽出器２０３にて抽出された符号の中で最も
確からしい符号を送信符号として選択する。

【００４５】このように、雑音レベルに応じてパラメー
タから送信符号の候補を抽出し、情報源モデルに基づい
て最終的な送信符号を決定することにより、雑音を含ま
ない信号に対する性能を劣化させることなく、雑音信号
成分に対して頑強で背景雑音環境下においても高品質な
音声符号化処理を実現することができる。

【００４６】（実施の形態２）図３は、本発明の実施の
形態２に係る音声符号化装置の構成を示すブロック図で
ある。図３の音声符号化装置は、図１と比較して、雑音
レベル推定部１０２の代りに、雑音モデル推定部３０１
を有する構成を採る。

【００４７】なお、図３の音声符号化装置において、図
１と共通する構成部分には図１と同一符号を付して説明
を省略する。

【００４８】雑音モデル推定部３０１は、雑音区間検出
部１０１にて検出された雑音区間において、例えば、雑
音信号の振幅周波数特性のような雑音モデルを推定す
る。

【００４９】パラメータ量子化部１０５は、音声分析部
１０４にて抽出されたパラメータを、情報源モデル及び
雑音モデルから得られるパラメータ列の確からしさに基
づいて量子化し、量子化値に対応する符号を出力する。

【００５０】図４は、本実施の形態に係る音声符号化装
置のパラメータ量子化部１０５の内部構成を示すブロッ
ク図である。図４のパラメータ量子化部１０５は、図２
と比較して、許容誤差レベル決定器２０１の代りに、許
容誤差範囲決定器４０１を有する構成を採る。

【００５１】なお、図４のパラメータ量子化部１０５に
おいて、図２と共通する構成部分には図１と同一符号を
付して説明を省略する。

【００５２】図４において、許容誤差範囲決定器２０１
は、雑音モデル推定部３０１にて推定された雑音モデル
に基づいて許容誤差の範囲を決定する。雑音モデルを考
慮することにより、雑音重畳度合いの分散をベクトル量
子化における各要素毎に設定することができる。

【００５３】符号抽出器２０３は、音声分析部１０４に
て抽出されたパラメータとの誤差が許容誤差の範囲に入
っている符号を、符号帳２０２の中から抽出する。

【００５４】このように、雑音モデルに基づいてパラメ
ータから送信符号の候補を抽出し、情報源モデルに基づ
いて最終的な送信符号を決定することにより、雑音レベ
ルを用いた場合に比べ、さらに、高品質な音声符号化処
理を実現することができる。

【００５５】（実施の形態３）図５は、本発明の実施の
形態３に係る音声符号化装置のパラメータ量子化部１０
５の内部構成を示すブロック図である。

【００５６】なお、本実施の形態に係る音声符号化装置
の構成は、実施の形態１の図１に示した音声符号化装置
の構成と同様であるので説明を省略する。

【００５７】図５において、誤差算出重み決定器５０１
は、雑音レベル推定部１０２にて推定された雑音レベル
及び情報源モデルに基づいて、入力パラメータと量子化
値の誤差を算出する際におけるパラメータの各要素に対
する重み付けを決定する。

【００５８】例えば、ＣＥＬＰ音声符号化方式における
雑音音源を符号化する場合、適応音源のパワー包絡に相
関があるパラメータ要素の誤差値が小さくなるように重
み付けを行う。

【００５９】符号帳５０２は、送信符号に対応する量子
化値を蓄積している。量子化器５０３は、誤差算出重み
決定器５０１にて決定された重み付けに従って、音声分
析部１０４にて抽出されたパラメータを、符号帳５０２
を用いて量子化する。

【００６０】このように、雑音レベル及び情報源モデル
に基づいてパラメータの各要素に重み付けを行い、パラ
メータを量子化することにより、雑音を含まない信号に
対する性能を劣化させることなく、雑音信号成分に対し
て頑強で背景雑音環境下においても高品質な音声符号化
処理を実現することができる。

【００６１】なお、上記の説明においては、雑音レベル
を用いる場合について説明したが、本実施の形態は、実
施の形態２で説明した雑音モデルを用いて、重み付け処
理を行うこともできる。

【００６２】（実施の形態４）図６は、本発明の実施の
形態４に係る音声符号化装置のパラメータ量子化部１０
５の内部構成を示すブロック図である。

【００６３】なお、本実施の形態に係る音声符号化装置
の構成は、実施の形態１の図１に示した音声符号化装置
の構成と同様であるので説明を省略する。

【００６４】図６において、符号出現確率算出器６０１
は、雑音レベル推定部１０２にて推定された雑音レベル
及び情報源モデルから、入力信号に雑音を含まない場合
のパラメータ量子化値の出現確率を推定する。

【００６５】符号帳６０２は、送信符号に対応する量子
化値を蓄積している。量子化器６０３は、符号出現確率
算出器６０１にて推定された出現確率と誤差値とを合わ
せた尤度に従って、音声分析部１０４にて抽出されたパ
ラメータを、符号帳６０２を用いて量子化する。

【００６６】このように、雑音レベル及び情報源モデル
に基づいてパラメータ量子化値の出現確率を推定し、パ
ラメータを量子化することにより、雑音を含まない信号
に対する性能を劣化させることなく、雑音信号成分に対
して頑強で背景雑音環境下においても高品質な音声符号
化処理を実現することができる。

【００６７】なお、上記の説明においては、雑音レベル
を用いる場合について説明したが、本実施の形態は、実
施の形態２で説明した雑音モデルを用いて、重み付け処
理を行うこともできる。

【００６８】

【発明の効果】以上説明したように、本発明の音声符号
化装置及び音声符号化方法によれば、雑音モデルの精度
に対する依存度が少なく、雑音信号成分に対して頑強で
背景雑音環境下においても高品質な音声符号化処理を実
現することができる。

【図面の簡単な説明】

【図１】本発明の実施の形態１に係る音声符号化装置の
構成を示すブロック図

【図２】上記実施の形態に係る音声符号化装置のパラメ
ータ量子化部の内部構成を示すブロック図

【図３】本発明の実施の形態２に係る音声符号化装置の
構成を示すブロック図

【図４】上記実施の形態に係る音声符号化装置のパラメ
ータ量子化部の内部構成を示すブロック図

【図５】本発明の実施の形態３に係る音声符号化装置の
パラメータ量子化部の内部構成を示すブロック図

【図６】本発明の実施の形態４に係る音声符号化装置の
パラメータ量子化部の内部構成を示すブロック図

【図７】従来の音声符号化装置の構成を示すブロック図

【符号の説明】

１０１雑音区間検出部１０２雑音レベル推定部１０３情報源モデル記憶部１０４音声分析部１０５パラメータ量子化部２０１許容誤差レベル決定器２０２、５０２、６０２符号帳２０３符号抽出器２０４符号選択器３０１雑音モデル推定部４０１許容誤差範囲決定器５０１誤差算出重み決定器５０３、６０３量子化器６０１符号出現確率算出器

Claims

(57)【特許請求の範囲】

【請求項１】入力信号の雑音区間を検出する雑音区間
検出手段と、検出された雑音区間の雑音の大きさを推定
する雑音レベル推定手段と、雑音を含まない音声入力信
号に対するパラメータ列をモデル化した情報源モデルを
記憶する情報源モデル記憶手段と、入力信号を分析して
パラメータを抽出する音声分析手段と、前記雑音の大き
さに応じて許容誤差を決定し、パラメータとの誤差が前
記許容誤差以下の符号を符号帳の中から抽出し、前記情
報源モデルに基づいて前記抽出された符号の中で最も確
からしい符号を送信符号として選択するパラメータ量子
化手段とを具備することを特徴とする音声符号化装置。
【請求項２】入力信号の雑音区間を検出する雑音区間
検出手段と、検出された雑音区間の雑音の大きさを推定
する雑音レベル推定手段と、雑音を含まない音声入力信
号に対するパラメータ列をモデル化した情報源モデルを
記憶する情報源モデル記憶手段と、入力信号を分析して
パラメータを抽出する音声分析手段と、前記雑音の大き
さ及び前記情報源モデルから入力信号に雑音を含まない
場合のパラメータ量子化値の出現確率を推定し、この推
定された出現確率と誤差値とを合わせた尤度に従って、
パラメータを量子化するパラメータ量子化手段とを具備
することを特徴とする音声符号化装置。
【請求項３】入力信号の雑音区間を検出する雑音区間
検出手段と、検出された雑音区間における雑音モデルを
推定する雑音モデル推定手段と、雑音を含まない音声入
力信号に対するパラメータ列をモデル化した情報源モデ
ルを記憶する情報源モデル記憶手段と、入力信号を分析
してパラメータを抽出する音声分析手段と、前記雑音モ
デルに基づいて許容誤差の範囲を決定し、パラメータと
の誤差が前記許容誤差以下の符号を符号帳の中から抽出
し、前記情報源モデルに基づいて前記抽出された符号の
中で最も確からしい符号を送信符号として選択するパラ
メータ量子化手段とを具備することを特徴とする音声符
号化装置。
【請求項４】入力信号の雑音区間を検出する雑音区間
検出手段と、検出された雑音区間における雑音モデルを
推定する雑音モデル推定手段と、雑音を含まない音声入
力信号に対するパラメータ列をモデル化した情報源モデ
ルを記憶する情報源モデル記憶手段と、入力信号を分析
してパラメータを抽出する音声分析手段と、前記雑音モ
デル及び前記情報源モデルから入力信号に雑音を含まな
い場合のパラメータ量子化値の出現確率を推定し、この
推定された出現確率と誤差値とを合わせた尤度に従っ
て、パラメータを量子化するパラメータ量子化手段とを
具備することを特徴とする音声符号化装置。