JPH0473699A

JPH0473699A - 音声符号化方式

Info

Publication number: JPH0473699A
Application number: JP2184231A
Authority: JP
Inventors: Kazunori Ozawa; 一範小澤
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1990-07-13
Filing date: 1990-07-13
Publication date: 1992-03-09
Anticipated expiration: 2013-10-08
Also published as: JP2808841B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は音声信号を低いビットレート、特に８〜４．８
ｋｂ／ｓ程度で高品質に符号化するための音声符号化方
式に関する。

〔従来の技術〕

音声信号を８〜４．８ｋｂ／ｓ程度の低いビットレート
で符号化する方式としては、例えば、Ｍ、５ｃｈｒｏｅ
ｄｅｒ　ａｎｄ　Ｂ、Ａｔａ１氏による”Ｃｏｄｅ−ｅ
ｘｃｉｔｅｄ　１ｉｎｅａｒｐｒｅｄｉｃｔｉｏｎ：　
）Ｉｉｇｈ　ｑｕａｌｉｔｙ　５ｐｅｅｃｈ　ａｔ　ｖ
ｅｒｙ　ｌｏｗｂｉｔ　ｒａｔｅｓ”　（Ｐｒｏｃ、　
ＩＣＡＳＳＰ、　ｐｐ、９３７−９４０．１９８５年）
と題した論文（文献１）や、Ｋｌｅｉｊｎ氏らによる’
ＩＩｍｐｒｏｖｅｄ　５ｐｅｅｃｈ　ｑｕａＩｉｔｙ　
ａｎｄ　ｅｆｆｉｃｉｅｎｔ　ｖｅｃｔｏｒ　ｑｕａｎ
ｔｉｚａｔｉｏｎ　ｉｎ　５ＥＬＰ″と題した論文（Ｉ
ＣＡＳＳＰ、　ｐｐ、１５５−１５８．１９８８年）（
文献２）等に記載されているＣＥＬＰ（Ｃｏｄｅ　Ｅｘ
ｃｉｔｅｄ　ＬＰＣＣｏｄｉｎｇ）方式や、Ｂ、へｔａ
１氏らによる“八ｎｅｗ　ｍｏｄｅｌ　ｏｆ　ＬＰＣｅ
ｘｃｉｔａｔｉｏｎ　　ｆｏｒ　　ｐｒｏｄｕｃｉｎｇ
　　ｎａｔｕｒａｌ−ｓｏｕｎｄｉｎｇ　５ｐｅｅｃｈ
　　ａｔｌｏｗ　ｂｉｔ　ｒａｔｅｓ”　　（Ｐｒｏｃ
、　　ＩＣＡＳＳｒ’、　　ｐｐ、６１４−６１７１９
８２）と題した論文（文献３）等に記載されているマル
チパルス符号化方式が知られている。

文献１，２に記載の方法では、送信側では、フレーム毎
（例えば２０ｍ５）に音声信号から音声信号のスペクト
ル特性を表すスペクトルパラメータを抽出し、フレーム
をさらに小区間サブフレーム（例えば５　ｍｓ）に分割
し、サブフレーム毎に、過去の音源信号をもとに再生し
た再生信号と、音源信号との重み付け２乗誤差を最小化
するように長時間相関（ピッチ相関）を表す適応コード
ブックのピッチパラメータを抽出し、ピッチパラメータ
によりサブフレームの音声信号を長期予測し、長期予測
して求めた残差信号に対して、予め定められた種類の雑
音信号からなるコードブックから選択した信号により合
成した信号と、音声信号との重み付け２乗誤差を最小化
するように一種類の雑音信号を選択するとともに、最適
なゲインを計算する。そして選択された雑音信号の種類
を表すインデクスとゲイン、ならびに、スペクトルパラ
メータとピッチパラメータを伝送する。

［発明が解決しようとする課題］上述した文献１の従来方式では、マルチパルスや、適応
コードブックや、雑音信号からなるコードブ、りを探索
するときは、誤差評価尺度として、入力音声信号とコー
ドブ・ツクあるいはマルチパルスにより再生した信号と
の重み付け２乗誤差を用いていた。しかし、この評価尺
度は必ずしも聴感と一致していないために、この尺度で
選択したコードベクトル、あるいは求めたマルチパルス
を用いて選択した再生音声の音質は、必ずしも十分では
ないという問題点があった。またこの問題点は特にビッ
トレートを低減しコードブックのサイズを小さくすると
顕著であった。

本発明の目的は、上記問題点を解決した音声符号化方式
を提供することにある。

〔課題を解決するための手段〕

第１の発明は、入力した離散的な音声信号を予め定めら
れた時間長のフレームに分割し、前記音声信号のスペク
トル包絡を表すスペクトルパラメータを求めて出力し、
前記フレームを予め定められた時間長の小区間に分割し
、過去の音源信号からなる適応コードブックをもとに再
生した信号が前記音声信号に近くなるようにピッチパラ
メータを求め、前記音声信号の音源信号を予め構成した
複数種類のコードベクトルからなるコードブックあるい
はマルチパルスにより表して出力する音声符号化方式に
おいて、前記適応コードブックあるいは前記コードブックあるい
は前記マルチパルスにより再生した信号と前記音声信号
との誤差信号に対し聴覚の特性に対応するように周波数
軸を非線形変換して誤差尺度を求め、前記誤差尺度を小
さくするように前記コードブックから最適なコードベク
トルを求めるかあるいはマルチパルスを求めて出力する
ことを特徴とする。

また、第２の発明は、入力した離散的な音声信号を予め
定められた時間長のフレームに分割し、前記音声信号の
スペクトル包絡を表すスペクトルパラメータを求めて出
力し、前記フレームを予め定められた時間長の小区間に
分割し、過去の音源信号からなる適応コードブックをも
とに再生した信号が前記音声信号に近くなるようにピッ
チパラメータを求め、前記音声信号の音源信号を予め構
成した複数種類のコードベクトルからなるコードブック
あるいはマルチパルスにより表して出力する音声符号化
方式において、前記適応コードブックあるいは前記コードブックあるい
は前記マルチパルスにより再生した前記音声信号との誤
差信号と前記音声信号をもとに、聴覚のマスキング特性
に対応するようなマスキングしきい値を求め、前記しき
い値をもとに前記誤差信号を重み付けて誤差尺度を求め
、前記誤差尺度を小さくするように前記コードブックか
ら最適なコードベクトルを求めるかあるいはマルチパル
スを求めて出力することを特徴とする。

〔作用〕

本発明による音声符号化方式の作用を説明する。

第１の発明では、フレームを分割したサブフレーム毎に
、適応コードブックの探索あるいは音源コードブックの
探索あるいはマルチパルスの計算において１、適応コー
ドブックあるいはコードプ。

りあるいはマルチパルスにより再生した信号と、入力音
声信号との誤差信号に対して、聴覚の特性に対応するよ
うに周波数軸を非線形変換して誤差尺度を求めることに
特徴がある。今、音源コードブックの探索を例にして説
明すると、下式を最小化するように最適音源コードベク
トルを音源コードブックから探索する。

・　・　・（１）ここでｘ　（ｎ）は適応コードブックによる長期予測信
号を除去したあとの音声信号、Ｃｊ　（ｎ）は音源コー
ドブック中のｊ番目のコードベクトル（但し、ｊ＝１〜
２１１　二Ｂはコードブックのビット数）、Ｔ、は最適
ゲインである。ｈ　（ｎ）はスペクトルパラメータによ
り構成した合成フィルタのインパルス応答である。記号
率は畳み込み演算を示す。

誤差信号の周波数軸を非線形変換するためには、周波数
軸上での処理の方が演算量が少ないので、（１）式を周
波数軸上での演算に変換する。このためには、周知の直
交変換を用いるが、ここでは効率のよい離散的コサイン
変換（ＤＣＴ）を用いる。（＋）式をＮ点ＤＣＴ変換し
て次式を得る。

上式の誤差スペクトルＤ　（ｋ）において、周波数軸を
聴覚の特性に合うように非線形変換する。このような非
線形変換として、ここでは周知のメル変換を用いる。メ
ル変換によれば、下式の変換を行う。

ω＝ω＋　２　ｊａｎ−’　（αｓｉｎω／　（１−α
ｃｏｓω）　）・　・　・（３）但しω−２πに／Ｎであり、標本化周波数が８　ｋＨｚ
のときα−０，３１である。ノル変換法の詳細は、例え
ば北村氏らによる“″メルケブストラムを利用する音声
の分析合成と合成音声の品質°゛と匙した論文（電子通
信学会論文誌、Ｊ６８−八、　ｐｐ、９５７−９６４１
９８５年）（文献４）等を参照できる。従ってメル変換
をした周波数上の誤差電力を最小にするようなコードベ
クトルＣ，（ｋ）を選択する。

次に、第２の発明では、適応コードブックあるいは音源
コードブックあるいはマルチパルスの探索において、適
応コードブックあるいはコードブックあるいはマルチパ
ルスにより再生した信号と音声信号との誤差信号に対し
て、音声信号をもとに聴覚のマスキング特性に対応する
ようなマスキングしきい値を求め、周波数軸上でマスキ
ングしきい値をもとに誤差信号を重み付けて誤差尺度を
求め、誤差尺度を小さくするようにコードブックから最
適なコードベクトルを求めることを特徴とする。つまり
下式のように重み付けた誤差電力を最小にする。

ＸＩＷ（ｋ）＋２ここでＷ　（ｋ）は、聴覚のマスキングしきい値を用い
て重み付けを行う重み付は関数である。ここでマスキン
グしきい値を求めるには、例えば、疑僚パワスペクトル
ＩＸ（ｋ）＋２をＩｎ臨界域フィルタあるいは聴覚モデ
ルにより分析して、各臨界帯域毎のパワあるいはＲＭＳ
を計算し、これらの値から各臨界帯域におけるマスキン
グしきい値を求める。マスキングしきい値の求め方は、
例えば聴覚心理学実験により得られた値を用いる方法が
知られており、詳細は、Ｊｏｈｎｓ　ｔｏｎ氏による”
Ｔｒａｎｓｆｏｒｍ　ｃｏｄｉｎｇ　ｏｆ　ａｕｄｉｏ
　ｓｉｇｎａｌｓ　ｕｓｉｎｇ　ｐｅｒｃｅｐｔｕａｌ
ｎｏｉｓｅ　　ｃｒｉｔｅｒｉａ”　　（ＩＥＥＥ　　
Ｊ、Ｓｅ１．　　八ｒｅａｓ　　ｏｎ　　Ｃｏｍｍｕｎ
、。

ｐｐ、３１４−３２３．１９８８）　と題した論文（文
献５）や、Ｒ，叶ｏｇｏ　ｄｅ　Ｉａｃｏｖｏ氏らによ
る”Ｖｅｃｔｏｒ　ｑｕａｎｔｉｚａｔｉｏｎ　ａｎｄ
　ｐｅｒｃｅｐｔｕａｌ　ｃｒｉｔｅｒｉａ　ｉｎ　Ｓ
ＶＤ　ｂａｓｅｄＣＥＬＰ　ｃｅｄｅｒｓ”と題した論
文（ＩＣＡＳＳＰ、　ｐｐ、３３−３６゜１９９０年）
（文献６）等を参照できる。また、臨界帯域フィルタあ
るいは臨界帯域分析については、例えば、Ｊ、Ｔｏｂｉ
ａｓ氏編集による“Ｆｏｕｎｄａｔｉｏｎ　ｏｆｍｏｄ
ｅｒｎ　ａｕｄｉｔｏｒｙ　ｔｈｅｏｒｙ”と題した単
行本の第５章（文献７）等を参照できる。また、聴覚モ
デルについては、例えば５ｅｎｅｆｆ氏による”Ａ　ｃ
ｏｌＩｌｐｕｔａ−ｔｉｏｎａｌ　ｍｏｄｅｌ　ｆｏｒ
　ｔｈｅ　ｐｅｒｉｐｈｅｒａｌ　ａｕｄｉｔｏｒｙ　
ｓｙｓｔｅｍ：　Ａｐｐｌｉｃａｔｉｏｎ　ｔｏ　５ｐ
ｅｅｃｈ　ｒｅｃｏｇｎｉｔｉｏｎ　ｒｅｓｅａｒｃｈ
”と題した論文（Ｐｒｏｃ、　ＴＣＡＳＳＰ、　ｐｐ、
１９８３１９８６、１９８６年）（文献８）等を参照で
きる。

次に、（４）式の誤差信号ＩＤ（ｋ）１２に対して臨界
帯域フィルタあるいは聴覚モデルによる分析を行い、各
臨界帯域毎のパワあるいはＲＭＳに対して、マスキング
しきい値の逆数を乗することにより、マスキングによる
重み付けを行い、マスキングによる重み付は誤差尺度を
求める。そしてこの尺度を最小にするコードベクトルを
選択する。

〔実施例〕

第１図は第１の発明による音声符号化方式を実施する音
声符号化装置を示すブロック図である。

送信側では、入力端子１００から音声信号を入力し、１
フレ一ム分（例えば２０ｍ５　）の音声信号をバッファ
メモＩＪＩＩＯに格納する。

ＬＰＧ分析回路１３０は、フレームの音声信号のスペク
トル特性を表すパラメータとして、ＬＳＰパラメータを
フレームの音声信号から周知のＬＰＧ分析を行い、あら
かしめ定められた次数したけ計算する。

次にＬＳＰ量子化回路１４０は、ＬＳＰパラメータを予
め定められた量子化ビット数で量子化し、得た符号Ｉ、
をマルチプレクサ２６０へ出力するとともに、これを復
号化してさらに線形予測係数ａ；’（ｉ−１〜Ｌ）に変
換して、重み付は回路２００．インパルス応答計算回路
１７０１合成フィルタ２８１へ出力する。ＬＳＰパラメ
ータの符号化、ＬＳＰパラメータと線形予測係数との変
換の方法についてはＳｕｇａｍｕｒａ氏らによる”Ｑｕ
ａｎｔｉｚｅｒ　ｄｅｓｉｇｎ　ｉｎ　ＬＳＰ　５ｐｅ
ｅｃｈａｎａｌｙｓｉｓ−ｓｙｎｔｈｅｓｉｓ”　と題
した論文（ＩＥＥＥ　Ｊ、Ｓｅｌ。

Ａｒｅａｓ　Ｃｏｍｍｕｎ、、　ｐｐ、４３２−４４０
．１９８８年）（文献９）等を参照することができる。

またＬＳＰパラメータをさらに効率的に量子化するため
には、ベクトルースカラ量子化を用いることもできる。

ＬＳＰのベクトルースカラ量子化については、Ｍｏｒｉ
ｙａ氏ら二こよる”Ｔｒａｎｓｆｏｒｍ　Ｃｏｄｉｎｇ
　ｏｆ　５ｐｅｅｃｈ　ｕｓｉｎｇ　ａ　Ｗｅｉｇｈｔ
ｅｄ　Ｖｅｃｔｏｒ　Ｑｕａｎｔｉｚｅｒ、”と題した
論文（ＩＥＥＥ　Ｊ。

Ｓｅ１．　　八ｒｅａｓ、　　Ｃｏｍｍｕｎ、、　　ｐ
ｐ、４２５−４３Ｌ　　１９８８年）（文献１（１）や
、特願平２−４２９５６号明細書（文献１１）等を参照
できる。

サブフレーム分割回路１５０は、フレームの音声信号を
サブフレームに分割する。ここで例えばサブフレーム長
は５ｍｓとする。

重み付は回路２００は、サブフレームに分割した信号に
対して周知の重み付けを行う。重み付は関数の詳細は前
記文献１を参照できる。

減算器１９０は、重み付けた信号から合成フィルタ２８
１の出力を減算して出力する。

適応コートブック２１０は、合成フィルタ２８１　の入
力信号ｖ　（ｎ）を遅延回路２０６を介して入力し、さ
らにインパルス応答計算回路１７０かａ重み付はインパ
ルス応答り、ｗ（ｎ）、減算器１９０から重み付は信号
を入力し、長期相関にもとづくピッチ予測を行い、ピッ
チパラメータとして遅延Ｍとゲインβを計算する。以下
の説明では適応コードブ７・りの予測次数は１とするが
、２次以上の高次とすることもできる。適応コードブッ
クにおける遅延Ｍの計算は次のように行う。

ただしＧ、　（ｋ）　−Ｆ　（ｖ　（ｎ−Ｍ）　）　　　　　
　　　（６）である。ここでり、（ｋ）、Ｇ　（ｋ）、
Ｈ，（ｋ）はそれぞれ、重み付は信号ｘ−（ｎ）のＯＣ
Ｔ変換、過去の音源信号ｖ（ｎ−Ｍ）のＤＣＴ変換、重
み付はインパルス応答り、（ｎ）のＤＣＴ変換である。

β′４は予め構成したゲインコードブック２１５のｊ番
目のコードベクトルである。ゲインコードブック２１５
は、予め多量のゲイントレーニング信号を用いて学習し
て構成しておく。学習によるコードブックの構成法は、
例えばＬｉｎｄｅらによる“ＡｎＡ１４ｏｒｉｔｈｍ　
ｆｏｒ　Ｖｅｃｔｏｒ　Ｑｕａｎｔｉｚａｔｉｏｎ　Ｄ
ｅｓｉｇｎ”と題した論文（ｒＥＥＥ　Ｔｒａｎｓ、　
Ｃ０Ｍ−２８，ｐｐ、８４−９５゜１９８０年）（文献
１２）等を参照できる。

次に（５）式のＤ　（ｋ）に対して（３）弐を用いて周
波数軸をメル変換する。そして、メル変換した誤差電力
を最小化する遅延Ｍおよびゲインコードベクトルβ′１
の組合せを探索する。次にこれらを用いて次式により長
期予測による予測信号臭。（ｎ）を計算し、減算器２０
５Ｌこ出力する。また遅延Ｍをマルチプレクサ２６０へ
出力する。

９ｗ（ｎ）−β’・ｖ　（ｎ　　Ｍ）＊ｈｗ（ｎ）　　
　（７）上式でｖ（ｎ−Ｍ）は過去の音源信号で、遅延
回路２０６の出力信号である。

遅延回路２０６は、合成フィルタ２８１の入力信刊ｖ　
（ｎ）を１サブフレ一ム分遅延させて適応コードブック
２１０へ出力する。

減算器２０５は、重み付は信号χ８（ｎ）から適応コー
ドブック２１０の出力を減算し残差信号ｅ、（ｎ）を音
源コードブック探索回路２３０に出力する。

ｅｗ　（ｎ）　−）［、（ｎ）−ｘ、、、（ｎ）　　　
　　　　（８）インパルス応答計算回路１７０は、重み
付けした合成フィルタのインパルス応答ｈ１．Ｉ（ｎ）
を予め定められたサンプル数したけ計算する。具体的な
計算法は、前記文献１等を参照できる。

音源コードブック探索回路２３０は、予め構成した音源
コードブック２３５　とゲインコードブック２３６を用
いて最適なコードベクトルＣｊ　（ｋ）とゲインコード
ベクトルＴＪを探索する。ここで作用の項に記した（２
）、　（３）式を用いて、（２）式による誤差信号につ
いて、（３）式により周波数軸をメル変換して、ノル変
換後の誤差電力を最小化するように音源コードベクトル
ｃ１（ｋ）、ゲインコードベクトルＴ＝を探索する。こ
こでゲインコードベクトルＴ、は、予め学習信号を用い
て文献１２の方法↓こよリゲインコードブンク２３６を
構成しておく。

なお、音源コードブック２３５としては、文献１のよう
なガウス性の乱数信号や、文献１２の方法により学習し
て構成したコードブ・ツク等、周知なコードブックを用
いることができる。

加算器２９０は、適応コードブック２１０の出力音源と
音源コードブック探索回路２３０の出力音源を下式によ
り加算し出力する。

ｖ　（ｎ）−β′・ｖ　（ｎ　−Ｍ）　＋７’ＪＣｉ　
（ｎ）　　（９）合成フィルタ２８１は、加算器２９０
の出力ｖ　（ｎ）を入力し、下式により合成音声を１フ
レーム分求め、さらにもう１フレ一ム分はＯの系列をフ
ィルタに入力して応答信号系列を求め、■フレーム分の
応答信号系列を減算器１９０に出力する。

（０くδ＜１）　　　ＧＯ）ただしマルチプレクサ２６０は、ＬＳＰ量子化器１４０．適応
コードブック２１０．音源コードブック探索回路２３０
の出力符号系列を組みあわせて出力する。

以上で第１の発明の詳細な説明を終える。

第２図は、第２の発明による音声符号化方式を実施する
音声符号化装置を示すブロック図である。

図において、第１図と同一の番号を付した構成要素は、
第１図と同一の動作を行うので説明を省略する。

マスキングしきい植針算回路２０５は、減算器１９０の
出力音声信号ｘＩ、（ｎ）に対してＮ点のＯＣＴ変換を
行いスペクトルＸ、１（ｋ）（ｋ−０〜Ｎ−１）を求め
、さらに疑似パワスペクトルＩＸ、（ｋ）を求め、これ
を臨界帯域フィルタあるいは聴覚モデルにより分析して
、各臨界帯域毎のパワあるいはＲＭＳを計算する。ここ
でパワを計算するには下式に従う。

ここで、ｂｌ、、ｂｈ、は、それぞれｉ番目の臨界帯域
の下限周波数、上限周波数を示す。Ｒは音声信号帯域に
含まれる臨界帯域の個数である。０２）式の値から各臨
界帯域におけるマスキングしきい値Ｃ（ｉ）を求め出力
する。マスキングしきい値の求め方は文献５等を参照で
きる。また、聴覚モデルについては、前記文献８等を参
照できる。臨界帯域については、前記文献７を参照でき
る。

重み付は回路２２０は、適応コードブック２１０におい
て（４）式に従い求めた誤差信号ＩＤ（ｋ）：２に対し
て、臨界帯域フィルタあるいは聴覚モデルによる分析を
行い、さらに前記０２）式に従い各臨界帯域毎のパワＢ
’（ｉ）あるいはＲＭＳを求める。

次に、マスキングしきい値Ｃ（ｉ）による重み付は誤差
尺度Ｗ（ｉ）２を下式に従い各臨界帯域ｉ毎に求める。

Ｗ　（ｉ　）　２（ｉ　＝　１−　Ｒ）　　　　　　　（１３）重み付は
回路２２０は、重み付は誤差尺度Ｗ　（ｉ　）　”を適
応コードブック２１０に出力し、適応コートブック２１
０は次式を最小にするコードベクトルを選択する。

マスキングしきい植針算回路２２５は、減算器２０５の
出力信号ｅ、（ｎ）に対してＮ点のＯＣＴ変換を行いス
ペクトルＥ、（ｋ）（ｋ＝０〜Ｎ−１）を求め、さらに
疑似パワスペクトルＩＥ（ｋ）を求め、これを臨界帯域
フィルタあるいは聴覚モデルにより分析して、各臨界帯
域毎のパワあるいはＲＭＳを計算し、マスキングしきい
植針算回路２２０と同一の動作を行い、これらの値から
各臨界帯域におけるマスキングしきい値Ｃ，（＋）を求
め出力する。

重み付は回路２４０は、音源コードブック探索回路２３
０において（４）式に従い求めた誤差信号Ｄ（ｋ）：２
に対して、臨界帯域フィルタあるいは聴覚モデルによる
分析を行い、各臨界帯域毎のパワあるいはＲＭＳに対し
てマスキングしきい値をもとに、重み付は回路２２０と
同一の動作を行い、マスキングによる重み付は誤差尺度
を求め音源コードブック探索回路２３０へ出力する。

以上で第２の発明の詳細な説明を終える。

前記（２）、　（４）式において、音源コードブックＣ
Ｊ（ｎ）については、予め各コードベクトルをＤＣＴ変
換したコードブックを別に用意することにより、音源コ
ートブック探索時に各コードベクトルのＯＣＴ変換が不
要となり、音源コードブック探索に必要な演算量を低減
化できる。

臨界帯域分析フィルタは、等価な動作を行う他の周知な
構成のフィルタを用いることができる。

例えばＱＭＦフィルタ等を用いることができる。

マスキングしきい値の計算法には、他の周知な方法を用
いることができる。また、マスキングしきい値による重
み付けは実施例で述べた方法以外にも他の良好な方法を
用いることができる。例えば、前記０３）弐の代わりに
０５）あるいはθω弐で求めた重み付は誤差尺度Ｗ　（
ｉ　）　２を用いることもできる。

Ｗ　（ｉ　）　” −Ｂ　（ｉ）　Ｂ’　（ｉ）／　（Ｂ　（ｉ）　Ｃ（ｉ
））　　（１５）Ｗ（ｉ）”＝Ｂ（ｉ）Ｂ’（ｉ）／Ｃ
（ｉ）　　　Ｏωまた、（５）式では、重み付は信号、
重み付はインパルス応答のＤＣＴ変換Ｘｗ　（ｋ）　、
Ｈｌ、　（ｋ）を用いたが、重み付けを行わない信号Ｘ
（ｋ）、インパルス応答Ｈ（ｋ）のＤＣＴ変換を用いて
もよい。

このようにすると、重み付は回路２００は不要となる。

また、ＯＣＴ変換以外に他の周知な直交変換、例えばＤ
ＦＴ等を用いることもできる。

また、音源コードブックとしては、他の周知な構成を用
いることができる。音源コードブックの構成法について
は、例えばＣ，Ｌａｆｌａｍｍｅ氏らによる”Ｏｎ　ｒ
ｅｄｕｃｉｎｇ　ｃｏｍｐｕｔａｔｉｏｎａｌ　ｃｏｍ
ｐｌｅｘｉｔｙ　ｏｆｃｏｄｅｂｏｏｋ　５ｅａｒｃｈ
　ｉｎ　ＣＥＬＰ　ｃｏｄｅｒ　ｔｈｒｏｕｇｈ　ｔｈ
ｅ　ｕｓｅｏｆ　ａｌｇｅｂｒａｉｃ　ｃｏｄｅｓ″と
題した論文（Ｐｒｏｃ、　［ＣＡＳＳＰ、　ｐｐ、１７
７−１８０．１９９０）　　（文献１３）や、１．　Ｔ
ｒａｎｃｏｓ。

氏らによる”ＣＥＬＰ：　Ａ　ｃａｎｄｉｄａｔｅ　ｆ
ｏｒ　ＧＳＭ　ｈａｌｆｒａｔｅ　ｃｏｄｉｎｇ’と題
した論文（Ｐｒｏｃ、　ＩＣＡＳＳＰ、　ｐｐ。

４６９−４７２．１９９０年）（文献１４）等を参照で
きる。

マスキングしきい植針算回路２０５において、疑似パワ
スヘクト／Ｉ／ｌ　Ｘ、１（ｋ）　　：　２ヲ、ＬＳＰ
ｉｉ子化回路１４０の出力である復号化線形予測係数を
ＯＣＴ変換して計算してもよい。このようにすると疑似
パワスペクトル包絡が求まる。

また、重み付は回路２４０において、マスキングしきい
値としては、マスキングしきい植針算回路２０５におい
て求めたマスキングしきい値を用いてもよい。このよう
にすると、マスキングしきい植針算回路２２５を省略で
きる。

音源コードブックとして、より効率のよいコードブック
、例えば、マトリクス量子化、有限状態ヘクトル量子化
、トレリス量子化、　Ｄｅｌａｙｅｄ　Ｄｅｃｉｓｉｏ
ｎ量子化などによるコートブックを用いると、さらに特
性を改善できる。これらの方法の詳細は、例えばＧｒａ
ｙ氏によるνｅｃｔｏｒ　ｑｕａｎｔｉｚａｔｉｏｎ”
　（ｉＥＥＥＡＳＳＰ　Ｍａｇａｚｉｎｅ、　ｐｐ、４
−２９．１９８４年）と題した論文（文献１５）等を参
照できる。

また、上記実施例では、音源コードブックが１段の場合
について説明したが、音源コートブ、・夕は多段として
もよい。例えば、前記文献１１に示すように２段とし、
１段目は文献１１の方法により学習して構成したコート
ブック、２段目は乱数コドブノクの構成をとることもで
きる。具体的な構成法は文献１１を参照できる。このよ
うにしだ方が、コートブック探索に要する演算量を低減
できる。

また、適応コードブックのゲインと音源コートブックの
ゲインは、まとめてベクトル量子化コードブックを構成
することもできる。このようにした方が、さらに少ない
ビット数でゲインを量子化できる。詳細は前記文献１１
や、１．Ｇｅｒｓｏｎ氏らによる”Ｖｅｃｔｏｒ　ｓｕ
ｍ　ｅｘｃｉｔｅｄ　１ｉｎｅａｒ　ｐｒｅｄｉｃｔｉ
ｏｎ（ＶＳｌｌ：ＬＰ）　５ｐｅｅｃｈ　ｃｏｄｉｎｇ
　ａｔ　８ｋｂｐｓ　”と題した論文（Ｐｒｏｃ、　Ｉ
ＣＡＳＳＰ、　ｐｐ、４６１−４６４．１９９０年〕　
（文献１６）等を参照できる。

また、適応コートブックは１次としたが、２次、あるい
は、遅延を整数値ではなく小数値とすることによりさら
に音質を改善できる。詳細は、Ｐ、　Ｋｒｏｏｎ氏らに
よる”Ｐｉｔｃｈ　ｐｒｅｄｉｃｔｏｒｓ　ｗｉｔｈ　
ｈｉｇｈ　ｔｅＩｒｌｐｏｒａｌ　ｒｅｓｏｌｕｔｉｏ
ｎ　　（Ｐｒｏｃ、　ＩＣＡＳＳＰ、　ｐｐ、６６１−
６６４１９９０年）と題した論文（文献１７）等を参照
できる。

また、以上の説明では、適応コートブックのゲインと音
源コードブックのインデクス、ゲインには同時最適化を
施さなかったが、同時最適化を行うことにより、さらに
特性を改善できる。詳細は、前記文献１６等を参照でき
る。

また、演算量を低減化するためには、音源コードブック
のコードベクトルが選択された後に、適応コードブック
のゲインβと、音源コードブックのケインＴを同時に最
適化するような構成とするこもできる。

マタ、上記の実施例では、スペクトルパラメータとして
ＬＳＰパラメータを符号化し、その分析法としてＬＰＧ
分析を用いたが、スベク］・ルパラメータとしては他の
周知なパラメータ、例えばＩＰｃケプストラム、ケプス
トラム、改良ケブス］・ラム一般化ケプストラム、メル
ヶブヌトラムなとを用いることもできる。また各パラメ
ータ０こ最適な分析法を用いることができる。

また、ＬＳＰパラメータのヘクトル量子化において、Ｌ
ＳＰパラメータに聴覚特性に対応した非線形変換を施し
た後にヘクトル量子化するようにしてもよい。非線形変
換としては、例えばメル変換が知られている。

また、フレームで求めたＬＰＧ係数をＬＳＰ上や線形予
測係数上でサブフレーム毎に補間し、補間した係数を用
いて適応コートブン先音源コートフックの探索を行う構
成としてもよい。このような構成とすることにより、音
質がさらに改善される。

実施例に示した重み付は誤差尺度は、適応コードブック
と音源コードブ・ツクの少なくとも一方の探索に用いる
ことができる。

実施例では、コードブックの探索に重み付は誤差尺度を
用いる場合について説明したが、マルチパルスの計算に
も適用することができる。

また、受信側では、量子化雑音を整形することにより聴
覚的に聞き易くするために、ビ・ンチとスペクトル包絡
の少なくとも１つについて動作する適応形ポストフィル
タを付加してもよい。適応型ポストフィルタの構成につ
いては、例えば、Ｋｒｏｏｎ氏らによるｌｌＡ　Ｃ１ａ
ｓｓ　ｏｆ　Ａｎａｌｙｓｉｓ−ｂｙ−ｓｙｎｔｈｅｓ
ｉｓＰｒｅｄｉｃｔｉｖｅ　Ｃｏｄｅｒｓ　ｆｏｒ　Ｈ
ｉｇｈ　Ｑｕａｌｉｔｙ　ＳｐｅｅｃｈＣｏｄｒｎｇ　
ａｔ　Ｒａｔｅｓ　ｂｅｔｗｅｅｎ　４．８　ａｎｄ　
１６ｋｂ／ｓ、”　（ＴＥＥＥＪＳＡＣ，ｖｏｌ、６．
２．３５３−３６３．１９８８）　（文献１８）等を参
照できる。

〔発明の効果〕

以上述べたように、本発明によれば、適応コードブック
の探索あるいは音源コードブックの探索あるいはマルチ
パルスの計算において、適応コードブックあるいは音源
コードブックあるいはマルチパルスにより再生した信号
と、入力音声信号との誤差信号に対して、聴覚の特性に
対応するように周波数軸を非線形変換して誤差尺度を求
めるか、あるいは、誤差信号に対して各臨界帯域毎にマ
スキングしきい値を計算し、マスキングしきい値をもと
に誤差信号に重み付けを行った重み付は誤差尺度を用い
ているので、より聴感に対応した符号化が可能となり、
同程度の音質を保ちながら従来方式に比べよりピントレ
ートを低減することができるという大きな効果がある。

【図面の簡単な説明】

第１図は第１の発明による音声符号化方式を実施する音
声符号化装置を示すブロック図、第２図は第２の発明に
よる音声符号化方式を実施する音声符号化装置を示すブ
ロンク図である。１１０　　・・・・・バッファメモリ１３０　　・・・・・しｐｃ計算回路１４０　　・・・・・ＬＳＰ量子化回路１５０　　・・
・・・サブフレーム分割回路１７０　　・　・　・１９０．２０５・２００　・　・　・２０５．２２５・２０６　・　・　・２１０　・　・２１５．２３６・２２０　２４０・２３０　　・　・　・２３５　・　・　・２６０　・　・　・　・２８１　・　・　・　・２９０　・　・　・　・インパルス応答計算回路減算器重み付は回路マスキングしきい植針算回路遅延回路適応コードブックゲインコートブック重み付は回路音源コードブック探索回路音源コードブックマルチプレクサ合成フィルタ加算器

Claims

【特許請求の範囲】

（１）入力した離散的な音声信号を予め定められた時間
長のフレームに分割し、前記音声信号のスペクトル包絡
を表すスペクトルパラメータを求めて出力し、前記フレ
ームを予め定められた時間長の小区間に分割し、過去の
音源信号からなる適応コードブックをもとに再生した信
号が前記音声信号に近くなるようにピッチパラメータを
求め、前記音声信号の音源信号を予め構成した複数種類
のコードベクトルからなるコードブックあるいはマルチ
パルスにより表して出力する音声符号化方式において、前記適応コードブックあるいは前記コードブックあるい
は前記マルチパルスにより再生した信号と前記音声信号
との誤差信号に対し聴覚の特性に対応するように周波数
軸を非線形変換して誤差尺度を求め、前記誤差尺度を小
さくするように前記コードブックから最適なコードベク
トルを求めるかあるいはマルチパルスを求めて出力する
ことを特徴とする音声符号化方式。
（２）入力した離散的な音声信号を予め定められた時間
長のフレームに分割し、前記音声信号のスペクトル包絡
を表すスペクトルパラメータを求めて出力し、前記フレ
ームを予め定められた時間長の小区間に分割し、過去の
音源信号からなる適応コードブックをもとに再生した信
号が前記音声信号に近くなるようにピッチパラメータを
求め、前記音声信号の音源信号を予め構成した複数種類
のコードベクトルからなるコードブックあるいはマルチ
パルスにより表して出力する音声符号化方式において、前記適応コードブックあるいは前記コードブックあるい
は前記マルチパルスにより再生した前記音声信号との誤
差信号と前記音声信号をもとに、聴覚のマスキング特性
に対応するようなマスキングしきい値を求め、前記しき
い値をもとに前記誤差信号を重み付けて誤差尺度を求め
、前記誤差尺度を小さくするように前記コードブックか
ら最適なコードベクトルを求めるかあるいはマルチパル
スを求めて出力することを特徴とする音声符号化方式。