JPH07160296A

JPH07160296A - 音声復号装置

Info

Publication number: JPH07160296A
Application number: JP5310523A
Authority: JP
Inventors: Kazunori Ozawa; 一範小澤
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1993-12-10
Filing date: 1993-12-10
Publication date: 1995-06-23
Anticipated expiration: 2015-03-21
Also published as: DE69420682T2; JP3024468B2; EP0658875A3; DE69420682D1; EP0658875B1; US5659661A; EP0658875A2

Abstract

(57)【要約】【目的】再生信号に重畳する量子化雑音を制御し音質
を向上させるポストフィルタを有する音声復号装置の提
供。【構成】デマルチプレクサ１００はスペクトルパラメ
ータに関するインデクス、ピッチに関するインデクス、
振幅に関するインデクス、音源信号に関するインデクス
を受信し分離する。合成フィルタ１４０は、前記ピッチ
に関するインデクスと前記音源に関するインデクスと前
記振幅に関するインデクスを用いて合成フィルタの駆動
信号を復元し、前記スペクトルパラメータに関するイン
デクスを用いて合成フィルタを構成し前記駆動信号によ
り前記合成フィルタを駆動して再生信号を得る。フィル
タ係数計算部２１０は、再生信号から聴覚のマスキング
しきい値を求め、前記マスキングしきい値に対応してポ
ストフィルタの係数を求める。ポストフィルタ２００
は、前記係数をポストフィルタに使用する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、符号化側から受信した
インデクスを用いて音声を再生する音声復号装置であっ
て、特に、再生信号に重畳する量子化雑音を制御し音質
を向上させるポストフィルタを有する音声復号装置に関
する。

【０００２】

【従来の技術】音声信号を低いビットレートである程度
良好に符号化伝送する方式としてＣＥＬＰ（Ｃｏｄｅ
ＥｘｃｉｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｏ
ｎ）方式が知られている。この方式の詳細は、例えば、
Ｍ．ＳｃｈｒｏｅｄｅｒａｎｄＢ．Ａｔａｌ氏によ
る”Ｃｏｄｅ−ｅｘｃｉｔｅｄｌｉｎｅａｒｐｒｅ
ｄｉｃｔｉｏｎ：Ｈｉｇｈｑｕａｌｉｔｙｓｐｅ
ｅｃｈａｔｖｅｒｙｌｏｗｂｉｔｒａｔｅｓ”
（Ｐｒｏｃ．ＩＣＡＳＳＰ，ｐｐ．９３７−９４０，１
９８５年）と題した論文（文献１）やＷ．Ｋｌｅｉｊｉ
ｎ氏らによる”Ｉｍｐｒｏｖｅｄｓｐｅｅｃｈｑｕ
ａｌｉｔｙａｎｄｅｆｆｉｃｉｅｎｔｖｅｃｔｏｒ
ｑｕａｎｔｉｚａｔｉｏｎｉｎＳＥＬＰ”（Ｐｒ
ｏｃ．ＩＣＡＳＳＰ，ｐｐ．１５５−１５８，１９８
８）と題した論文（文献２）等を参照することができ
る。図１はＣＥＬＰ方式の復号側のブロック図である。
図において、デマルチプレクサ１００は、送信側からス
ペクトルパラメータに関するインデクスと、振幅に関す
るインデクスと、ピッチに関するインデクスと音源信号
に関するインデクスとを受信し分離する。適応コードブ
ック部１１０は、ピッチに関するインデクスを入力し、
下式により適応コードベクトルを計算する。

【０００３】ｚ（ｎ）＝β・ｖ（ｎ−ｄ）（１）ここで、ｄはピッチに関するインデクスから計算し、β
は振幅に関するインデクスから計算する。

【０００４】音源コードブック部１２０は、音源に関す
るインデクスを用いてコードブック１２５から対応する
コードベクトルｓ_j（ｎ）を読みだし、下式により音源
コードベクトルを求め出力する。

【０００５】ｒ（ｎ）＝γ・ｓ_j（ｎ）（２）ここでγは、振幅に関するインデクスから求めた音源信
号に関するゲインである。次に、加算部１３０は、
（１）式のｚ（ｎ）と（２）式のｒ（ｎ）とを加算して
駆動信号ｖ（ｎ）を求める。

【０００６】ｃ（ｎ）＝ｚ（ｎ）＋ｒ（ｎ）（３）合成フィルタ部１４０は、スペクトルパラメータに関す
るインデクスを用いて、合成フィルタを構成し、駆動信
号を用いて駆動して再生信号ｘ（ｎ）を求める。

【０００７】

【数１】

【０００８】ここで、α’_i（ｉ＝１．．．Ｍ：Ｍは次
数）は、スペクトルパラメータ復元部１４５においてス
ペクトルパラメータインデクスから復元した線形予測係
数である。

【０００９】ポストフィルタ１５０は、再生信号ｘ
（ｎ）に重畳する量子化複雑音を制御し、音質を向上さ
せる働きをする。ポストフィルタの典型的な伝達関数Ｈ
（ｚ）は下式で表される。

【００１０】

【数２】

【００１１】ここで、γ₁、γ₂はポストフィルタにお
ける量子化雑音の制御度をコントロールする定数であ
り、０＜γ₁＜γ₂＜１に選ぶ。また、ηは高域を強調
する係数であり、０＜η＜１に選ぶ。なお、ポストフィ
ルタの詳細については、Ｊ．Ｃｈｅｎ氏らによる”Ｒｅ
ａｌ−ｔｉｍｅｖｅｃｔｏｒＡＰＣｓｐｅｅｃｈ
ｃｏｎｄｉｎｇａｔ４８００ｂｐｓｗｉｔｈ
ａｄａｐｔｉｖｅｐｏｓｔｆｉｌｔｅｒｉｎｇ”と題
した論文（Ｐｒｏｃ．ＩＥＥＥＩＣＡＳＳＰ，ｐｐ．
２１８５−２１８８，１９８７年）（文献３）等を参照
できる。

【００１２】ゲイン調整部１６０では、ポストフィルタ
による利得を正規化するために、ポストフィルタ入力信
号ｘ（ｎ）の短時間パワＰ₁と、ポストフィルタ出力信
号ｘ’（ｎ）の短時間パワＰ₂とを用いて下式によりゲ
イン調整量Ｇを求める。

【００１３】

【数３】

【００１４】さらに、下式によりゲイン調整を行った出
力信号ｙ（ｎ）を求めて出力する。

【００１５】ｙ（ｎ）＝ｇ（ｎ）・ｘ’（ｎ）（７）ただし、ｇ（ｎ）＝（１−δ）ｇ（ｎ−１）＋δ・Ｇ（８）ここで、δは時定数であり、正の微小量に選ぶ。

【００１６】

【発明が解決しようとする課題】しかしながら、上記の
従来方式では、特にポストフィルタにおいて、量子化雑
音の制御がγ₁、γ₂の選び方に依存していること、聴
覚の特性を考慮したものではないことから、ビットレー
トを低減化していくと、量子化雑音の制御が困難で音質
が大幅に劣化するという問題点があった。

【００１７】

【課題を解決するための手段】本発明による音声復号装
置によれば、スペクトルパラメータに関するインデクス
と振幅に関するインデクスとピッチに関するインデクス
と音源信号に関するインデクスとを受信し分離するデマ
ルチプレクサ部と、前記ピッチに関するインデクスと前
記音源になするインデクスと前記振幅に関するインデク
スを用いて合成フィルタの駆動信号を復元し、前記スペ
クトルパラメータに関するインデクスを用いて合成フィ
ルタを構成し前記駆動信号により前記合成フィルタを駆
動して再生信号を得る合成フィルタ部と、前記合成フィ
ルタの出力信号を入力して前記再生信号のスペクトルを
制御するポストフィルタ部とを有する音声復号方式にお
いて、前記再生信号から聴覚のマスキングしきい値を求
め、前記マスキングしきい値に対応してポストフィルタ
の係数を求めるフィルタ係数計算部と、前記係数をポス
トフィルタに使用するポストフィルタ部とを有すること
を特徴とする。

【００１８】また、本発明による音声復号装置によれ
ば、上述のフィルタ係数計算部において、前記スペクト
ルパラメータに関するインデクスをもとに聴覚のマスキ
ングしきい値を求め、前記マスキングしきい値に対応し
てポストフィルタの係数を求めるフィルタ係数計算部を
有することを特徴とする。

【００１９】

【作用】本発明による音声復号装置の作用を示す。

【００２０】本発明では聴覚のマスキングしきい値を反
映させたフィルタ係数の計算と、その係数を用いるポス
トフィルタの構成がポイントであり、それ以外の構成要
素については、図１に示した従来方式と同一の構成であ
るので、特に、フィルタ係数計算部とポストフィルタに
ついて説明する。

【００２１】フィルタ係数計算部においては、聴覚のマ
スキング特性を考慮して、聴覚のマスキングしきい値を
もとにポストフィルタの係数を求めることを特徴とす
る。そして、ポストフィルタにおいて、再生信号に重畳
した量子化雑音が聴覚のマスキングしきい値以下になる
ように、量子化雑音を整形することにより、音質の改善
を行う。

【００２２】本発明によるフィルタ係数計算部において
は、まず、再生信号ｘ（ｎ）から聴覚のマスキングしき
い値を求める。再生信号をフーリエ変換し、パワスペク
トルを求める。パワスペクトルに対して、臨界帯域毎に
パワの和を求める。ここで各臨界帯域の下限、上限の周
波数については、Ｅ．Ｚｗｉｃｋｅｒ氏らによる”Ｐｓ
ｙｃｈｏａｃｏｕｓｔｉｃｓ”と題した単行本（Ｓｐｒ
ｉｎｇｅｒ−Ｖｅｒｌａｇ社，１９９０年）（文献４）
を参照することができる。次に、ｓｐｒｅａｄｉｎｇｆｕｎｃｔｉｏｎ（散布関数）を臨界帯域のパワに畳み
込んでｓｐｒｅａｄｉｎｇｓｕｐｅｃｔｒｕｍ（散布
スペクトラム）を計算する。そして、ｓｐｒｅａｄｉｎ
ｇｓｕｐｅｃｔｒｕｍに対して各臨界多域毎にあらか
じめ定められたしきい値だけ補正してマスキングしきい
値スペクトルＰ_{m 1}（ｉ＝１．．．Ｂ：ここでＢは臨界
帯域数）を計算する。なお、ｓｐｒｅａｄｉｎｇｆｕ
ｎｃｔｉｏｎや、前記しきい値の具体例については、
Ｊ．Ｊｏｈｎｓｔｏｎ氏らによる”Ｔｒａｎｓｆｏｒｍ
ＣｏｄｉｎｇｏｆＡｕｄｉｏＳｉｇｎａｌｓ
ｕｓｉｎｇＰｃｒｃｅｐｔｕａｌＮｏｉｓｅＣｒ
ｉｔｅｒｉａ”（ＩＥＥＥＪ．Ｓｅｌ．Ａｒｅａｓ
ｉｎＣｏｍｍｕｎ．，ｐｐ．３１４−３２３，１９８
８年）と題した論文（文献５）等を参照できる。Ｐ_{m 1}
を線形周波数軸に変換した後に、逆フーリエ変換を行
い、自己相関関数を計算する。次に、Ｌ＋１点の自己相
関から周知の線形予測分析を用いて、Ｌ次の線形予測係
数ｂ_i（ｉ＝１．．．Ｌ）を計算する。これらの計算に
より、係数ｂ_iは聴覚のマスキングしきい値を反映した
フィルタ係数となっている。

【００２３】次に、ポストフィルタ部では、マスキング
しきい値にもとづくフィルタ係数を用いるポストフィル
タの伝達特性は下式で表される。

【００２４】

【数４】

【００２５】ただし、０＜γ₁＜γ₂＜１である。

【００２６】また、本発明の音声復号方式におけるフィ
ルタ係数計算部によれば、フーリエ変換してパワスペク
トルを求める際に、再生信号ｘ（ｎ）をフーリエ変換す
るのではなく、スペクトルパラメータに関するインデク
スから復元した線形予測係数をフーリエ変換してパワス
ペクトル包絡を求めて、マスキングしきい値を計算して
もよい。

【００２７】

【実施例】図２は、本発明による音声復号装置の第１の
実施例を示すブロック図である。図１と同一の番号を付
した構成要素は、図１と同一の動作を行うので説明は省
略する。

【００２８】フィルタ係数計算部２１０は、まず、合成
フィルタ１４０の出力信号ｘ（ｎ）をあらかじめ定めら
れたサンプル数だけ蓄積する。図３にフィルタ係数計算
部２１０の構成を示す。

【００２９】図３において、フーリエ変換部２１５は、
あらかじめ定められたサンプル数の信号ｘ（ｎ）を入力
し、あらかじめ定められた窓関数（例えばハミング窓）
を乗じあらかじめ定められた点数のフーリエ変換を施
す。パワスペクトル計算部２２０は、２１５の出力に対
して次式によりパワスペクトルＰ（ｗ）を計算する。

【００３０】Ｐ（ｗ）＝Ｒｅ［Ｘ（ｗ）］²＋Ｉｍ［Ｘ（ｗ）］²（ｗ＝０．．．π］（７）ここで、Ｒｅ［Ｘ（ｗ）］、Ｉｍ［Ｘ（ｗ）］はフーリ
エ変換したスペクトルの実部、虚部を示す。ｗは角周波
数である。臨界帯域スペクトル計算部２２５は、Ｐ
（ｗ）を用いて下式の計算を行う。

【００３１】

【数５】

【００３２】ここで、Ｂ_iは帯域番号ｉの臨界帯域スペ
クトルである。ｂｌ_i、ｂｈ_iはｉ番目の臨界帯域の下
限、上限の周波数である。具体的な周波数については、
前記文献４を照できる。

【００３３】次に、下式に従い、臨界帯域スペクトルに
散布関数を畳み込む。

【００３４】

【数６】

【００３５】ここでｓｐｒｄ（ｊ，ｉ）は散布関数であ
り、具体的な値は前記文献４を参照できる。また、ｂ
_{m a x}は、角周波数πまでの間に含まれる臨界帯域の個
数である。２２５は、Ｃ_iを出力する。

【００３６】マスキングしきい値スペクトル計算部２３
０は、下式に従い、マスキングしきい値スペクトルＴｈ
_iを計算する。

【００３７】Ｔｈ_i＝Ｃ_iＴ_i （１０）ただしＴ_i＝１０^{- ( O i / 1 0 )} （１１）Ｏⁱ＝α（１４．５＋ｉ）＋（１−α）５．５（１２） α＝ｍｉｎ［（ＮＧ／Ｒ），１．０］（１３）

【００３８】

【数７】

【００３９】ここで、ｋ₁はｉ次目のｋパラメータであ
り、入力した線形予測係数α’_iから衆知の方法により
変換して求める。また、Ｍは線形予測係数の次数であ
る。Ｒはあらかじめ定められたしきい値である。マスキ
ングしきい値スペクトルは、絶対しきい値を考慮するこ
とにより、下式のようになる。

【００４０】Ｔｈ’_i＝ｍａｘ［Ｔｈ_i，ａｂｓｔｈ_i］（１５）ここで、ａｂｓｔｈ_iは、臨界帯域ｉにおける絶対しき
い値であり、前記文献４を参照できる。

【００４１】係数計算部２４０は、マスキングしきい値
スペクトルＴｈ・ｉ（ｉ＝１．．．ｂ_{m a x}）に対し
て、周波数軸をバーク軸からヘルツ軸に変換したスペク
トルＰ_m（ｆ）を求め、さらに、逆フーリエ変換して自
己相関関数Ｒ（ｎ）を求め、Ｒ（ｎ）のＬ＋１点分から
周知の線形予測分析を施してフィルタ係数ｂ_i（ｉ＝
１．．．Ｌ）を求めて出力する。

【００４２】図２にもどり、ポストフィルタ２００は、
ｂ_iを用いて伝達特性が（６）式で表されるポストフィ
ルタリングを行う。

【００４３】図４は、本発明による第２の実施例を示し
たフロック図である。図において図１、図２と同一の番
号を付した構成要素は、図１、図２と同一の動作を行う
ので、説明は省略する。図４と図２との違いは、フィル
タ係数計算部３１０である。フィルタ係数計算部３１０
を図５に示す。図において、フーリエ変換部３００は、
音声信号ｘ（ｎ）ではなく、スペクトルパラメータ（こ
こでは線形予測係数α’_i）に対してフーリエ変換を施
す点が異なる。

【００４４】上述の実施例において、マスキングしきい
値スペクトルの計算法としては、他の周知な方法を使用
することができる。

【００４５】また、フィルタ係数計算部であ、演算量を
低減化するために、フーリエ変換のかわりに、帯域分割
フィルタ群を用いることもできる。

【００４６】

【発明の効果】以上述べたように、本発明によれば、音
声復号部により再生した再生信号、もしくは受信したス
ペクトルパラメータに関するインデクスをもとに、聴覚
マスキングしきい値を求め、これを反映したフィルタ係
数を求めて、この係数をポストフィルタに使用している
ので、従来方式に比べ、再生信号に重畳した量子化雑音
を聴感的に低減化することが可能であり、より低いビッ
トレートにおいて音質が改善されるという大きな効果を
有する。

【図面の簡単な説明】

【図１】従来方式の例を示すブロック図である。

【図２】本発明の第１の実施例を示すブロック図であ
る。

【図３】図２中のフィルタ係数計算部２１０の構成を示
すブロックである。

【図４】本発明の第２の実施例を示すブロック図であ
る。

【図５】図４中のフィルタ係数計算部３１０の構成を示
すブロック図である。

【符号の説明】

１００デマルチプレクサ１１０適応コードブック部１２０音源コードブック１３０加算部１４０合成フィルタ部１４５スペクトルパラメータ復元部１５０、２００ポストフィルタ１６０ゲイン調整部２１０、３１０フィルタ係数計算部２１５、３００フーリエ変換部２２０パワスペクトル計算部２２５臨界帯域スペクトル計算部２３０マスキングしきい値スペクトル計算部２４０係数計算部

Claims

【特許請求の範囲】

【請求項１】スペクトルパラメータに関するインデク
スと振幅に関するインデクスとピッチに関するインデク
スと音源信号に関するインデクスとを受信し分離するデ
マルチプレクサ部と、前記ピッチに関するインデクスと
前記音源に関するインデクスと前記振幅に関するインデ
クスを用いて合成フィルタの駆動信号を復元し、前記ス
ペクトルパラメータに関するインデクスを用いて合成フ
ィルタを構成し前記駆動信号により前記合成フィルタを
駆動して再生信号を得る合成フィルタ部と、前記合成フ
ィルタの出力信号を入力して前記再生信号のスペクトル
を制御するポストフィルタ部とを有する音声復号方式に
おいて、前記再生信号から聴覚のマスキングしきい値を
求め、前記マスキングしきい値に対応してポストフィル
タの係数を求めるフィルタ係数計算部と、前記係数をポ
ストフィルタに使用するポストフィルタ部とを有するこ
とを特徴とする音声復号装置。
【請求項２】前記フィルタ係数計算部において、前記
スペクトルパラメータのインデクスをもとに聴覚のマス
キングしきい値を求め、前記マスキングしきい値に対応
してポストフィルタの係数を求めるフィルタ係数計算部
と、前記係数をポストフィルタに使用するポストフィル
タ部を有することを特徴とする請求項１記載の音声復号
装置。