JPH05315968A

JPH05315968A - 音声符号化装置

Info

Publication number: JPH05315968A
Application number: JP4119314A
Authority: JP
Inventors: Koji Yoshida; 田幸司吉
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1992-05-12
Filing date: 1992-05-12
Publication date: 1993-11-26

Abstract

(57)【要約】【目的】高品質な音声を得ることができる音声符号化
装置の提供。【構成】聴感重み付けフィルタ１１により一定区間の
入力音声の聴感重み付けを行ない重み付き入力音声を生
成する。次に適応コードブック１２と確率的コードブッ
ク１３から駆動音源生成器１４により駆動音源を生成
し、聴感重み付き合成フィルタ１５により聴感重み付き
音声を合成する。そして歪最小化器１６により重み付き
入力音声に対する重み付き合成音声の誤差の二乗和を計
算し、それを最小とする長期予測遅延、確率的コードブ
ックのインデクスおよびそれぞれのゲインを複数候補決
定し、それらの駆動音源符号および最小歪を出力し、そ
れらとそれらを１サブフレーム遅延器１７で遅延させた
ものとを入力して、駆動音源符号決定器１８により前サ
ブフレームおよび現サブフレームの最小歪の和を最小に
するような前サブフレーム駆動音源符号を決定し出力す
る。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、ディジタル通信、ボイ
スメール等に利用される音声符号化装置に関する。

【０００２】

【従来の技術】近年、４．８〜８．０ｋｂ／ｓ程度の低
ビットレートにおける音声符号化装置は、図２に示すよ
うなＣＥＬＰ(Code Excited Linear Prediction)または
ＳＥＬＰ(Stochastically Excited Linear Prediction)
音声符号化装置が広く用いられている。この一例が「W.
B.Kleijn et al. “IMPROVED SPEECH QUALITY AND EFFI
CIENT VECTOR QUANTIZATION IN SELP ”Proc. ICASSP,P
155 〜P158,1988 」に記載されている。

【０００３】以下、従来の音声符号化装置の一例につい
て図２を参照して説明する。図２において、２１は入力
音声の聴感重み付けを行なう聴感重み付けフィルタであ
り、重み付き入力音声を出力する。２２は過去の駆動音
源を蓄えてある適応コードブックであり、２３は複数の
雑音音源を予め保持してある確率的コードブックであ
る。２４は適応コードブック２２と確率的コードブック
２３に基づいて駆動音源信号を生成する駆動音源生成
器、２５は駆動音源を入力として聴感重み付き合成音声
を生成する聴感重み付き合成フィルタである。２６は重
み付き入力音声に対する重み付き合成音声の２乗誤差を
計算し、これが最小となるような長期予測遅延、長期予
測ゲイン、確率的コードブック内のベクトルインデクス
およびそのベクトルに乗ずるゲインのそれぞれの符号を
出力する歪最小化器である。

【０００４】以上のように構成された音声符号化装置に
おいて、以下のその動作について説明する。まず、聴感
重み付けフィルタ２１で重み付き入力音声ｖ［ｎ］（ｎ
は信号の時系列サンプル番号）を求める。ＣＥＬＰ符号
化装置は、聴感重み付き合成フィルタ２５でこれに最も
近い重み付き合成音声を生成するような駆動音源ｅ
［ｎ］を、駆動音源生成器２４が適用コードブック２２
および確率的コードブック２３から生成し、これをサブ
フレーム（音声を一定単位の時間で区切った単位である
フレームをさらに時分割した区間）単位で歪最小化器２
６により符号化するものである。ここで、駆動音源ｅ
［ｎ］は、下記式（１）のように、適応コードブック２
２の出力である長期予測信号ａ_L［ｎ］と確率的コード
ブック２３内の雑音ベクトルＣ_I［ｎ］からなる。

【０００５】ｅ［ｎ］＝β・ａ_L［ｎ］＋γ・Ｃ_I［ｎ］・・・（１）

【０００６】ただし、Ｌは適応コードブック２２に蓄え
られた過去の駆動信号をどれだけ遡るかを示す長期予測
遅延、Ｉは確率的コードブック２３内のＩ番目のベクト
ルを示すインデクス、βは長期予測信号ａ_L［ｎ］に乗
ずるゲイン（長期予測ゲイン）、γは雑音ベクトルＣ_I
［ｎ］に乗ずるゲインである。

【０００７】実際には、両成分を同時に決定するのは困
難であり、通常、適応コードブックから長期予測成分β
・ａ_L［ｎ］のみをまず歪最小化により決定し（これを
適応コードブック探索という。）、長期予測遅延Ｌと最
適長期予測ゲインβの符号を出力する。次に、残りの歪
が最小となるように確率的コードブック２３により歪最
小化し（これを確率的コードブック探索という。）、選
ばれた確率的コードブック２３内ベクトルのインデクス
Ｉとそのベクトルに乗ずるゲインγの符号を出力する。

【０００８】

【発明が解決しようとする課題】しかしながら、上記の
従来の音声符号化装置では、音源符号をサブフレーム単
位で決定しているため、音源符号決定の際に次サブフレ
ームへの影響が考慮されておらず、特に４．８ｋｂ／ｓ
程度以下の低ビットレートでは復号音声品質の劣化が大
きくなるという問題点を有していた。

【０００９】本発明は、上記従来の問題を解決するもの
であり、２サブフレームにわたり音源符号を最適に決定
することにより、音声品質を向上させることができる優
れた音声符号化装置を提供するものである。

【００１０】

【課題を解決するための手段】本発明は、上記目的を達
成するために、従来の音声符号化装置に、２サブフレー
ムにわたる歪最小化による音源符号化を行なう駆動音源
符号決定器および前サブフレームの駆動音源符号および
音源符号化最小歪を得るための１サブフレーム遅延器を
設け、２サブフレームにわたり音源符号を最適に決定す
ることにより音声品質を向上させるようにしたものであ
る。

【００１１】

【作用】したがって、本発明によれば、駆動音源符号決
定器により前サブフレームおよび現サブフレームの音源
符号化最小歪の和を最小にするように前サブフレーム音
源符号を決定することにより、２サブフレームにわたる
最適な音源符号化を行なうことができ、復号音声品質を
向上させることができるという効果を有する。

【００１２】

【実施例】図１は本発明の一実施例の構成を示すもので
ある。図１において、１１は入力音声の聴感重み付けを
行なう聴感重み付けフィルタ、１２は過去の駆動音源を
蓄える適応コードブック、１３は複数の雑音音源を予め
保持している確率的コードブック、１４は適応コードブ
ック１２と確率的コードブック１３から駆動音源信号を
生成する駆動音源生成器、１５は駆動音源を入力として
聴感重み付き合成音声を生成する聴感重み付き合成フィ
ルタ、１６は重み付き入力音声に対する重み付き合成音
声の２乗誤差を計算し、これが最小となるような音源符
号（長期予測遅延、長期予測ゲイン、確率的コードブッ
ク内のベクトルインデクスおよびそのベクトルに乗ずる
ゲインのそれぞれの符号）およびその際の最小歪（２乗
誤差）を出力する歪最小化器、１７はこの歪最小化器１
６の出力を１サブフレーム遅延させる１サブフレーム遅
延器、１８は２サブフレーム間の音源最適符号化により
前サブフレームの駆動音源信号を決定して出力する駆動
音源符号決定器である。

【００１３】次に上記実施例の動作について説明する。
まず、聴感重み付けフィルタ１１で聴感重み付き入力音
声ｖ［ｎ］（ｎは信号の時系列サンプル番号）を求め、
以後聴感重み付き合成フィルタ２５でこれに最も近い重
み付き合成音声を生成する駆動音源ｅ［ｎ］を、駆動音
源生成器１４が適用コードブック１２および確率的コー
ドブック１３から生成し、これを歪最小化器１６により
サブフレーム単位で歪最小化により符号化し、駆動音源
符号とその最小歪を出力する。ここで、駆動音源ｅ
［ｎ］は、下記式（２）のように、適応コードブック１
２の出力である長期予測信号ａ_L［ｎ］と確率的コード
ブック１３内の雑音ベクトルＣ_I［ｎ］との和からな
る。

【００１４】ｅ［ｎ］＝β・ａ_L［ｎ］＋γ・Ｃ_I［ｎ］・・・（２）

【００１５】ただし、Ｌは適応コードブック１２に蓄え
られた過去の駆動信号をどれだけ遡るかを示す長期予測
遅延、Ｉは確率的コードブック１３内のＩ番目のベクト
ルを示すインデクス、βは長期予測信号ａ_L［ｎ］に乗
ずるゲイン（長期予測ゲイン）、γは雑音ベクトルＣ_I
［ｎ］に乗ずるゲインである。

【００１６】歪最小化器１６によるサブフレーム単位の
歪最小化後、その出力を１サブフレーム遅延器１７によ
り１サブフレームだけ遅延させ、駆動音源符号決定器１
８により前サブフレームと現サブフレームの２サブフレ
ームにわたる歪最小化による音源符号化を行なう。ま
ず、サブフレーム内での駆動音源候補を抽出する。上記
式（２）の長期予測成分β・ａ_L［ｎ］に対する聴感重
み付き合成音声の歪最小化により、長期予測成分の候補
音源パラメータ（長期予測遅延Ｌ_ij、長期予測ゲインβ
_ij：ｉ，ｊ＝１，２）を決定する。ここで、この長期予
測成分の音源パラメータ（Ｌ_ij，β_ij）は前サブフレー
ムで候補として決定された第１および第２候補音源をそ
れぞれ（ｉ＝１，２：適応コードブックは各々の候補音
源に対して予め更新されている。）に対して、各々２候
補の音源（ｊ＝１，２）を求めておく。

【００１７】次に、決定された長期予測成分の候補音源
パラメータ（Ｌ_ij，β_ij）それぞれに対して、今度は、
確率的コードブック１３を用いて雑音音源成分γ・Ｃ_I
［ｎ］の候補音源パラメータ（確率的コードブック内の
ベクトルインデクスＩ_ij、そのベクトルに乗ずるゲイン
γ_ij：ｉ＝１，２、ｊ＝１，２）を決定し、各候補音源
の符号化最小歪Ｅ_ij（ｉ，ｊ＝１，２）を求める。以上
のサブフレーム内の駆動音源候補の抽出後、駆動音源符
号決定器１８による２サブフレーム間にわたる歪最小化
により前サブフレームの駆動音源符号を決定する。駆動
音源符号の決定は、２サブフレームの符号化最小歪の
和、ＥＲ_i＝Ｅ_piＩ＋Ｅ_il （ｉ＝１，２）（但し、Ｅ_pi：前サブフレーム第ｉ候補音源に対する符
号化最小歪）を最小にする前サブフレームの第ｉ候補音
源（Ｌ_pi，β_pi，Ｉ_pi，γ_pi，ｉ＝１，２）を前サブフ
レーム音源として決定し、それらの符号を出力する。

【００１８】このように、上記実施例によれば、１サブ
フレーム遅延器１７により歪最小化器１６の出力を１サ
ブフレーム遅延させた後、駆動音源符号決定器１８によ
り前サブフレームおよび現サブフレームの音源符号化最
小歪の和を最小にするように前サブフレーム音源符号を
決定することにより、２サブフレームにわたる最適な音
源符号化を行なうことができ、復号音声品質を向上させ
ることができる。

【００１９】なお、上記実施例において、現サブフレー
ムの音源候補を前サブフレーム音源候補それぞれに対し
て２候補ずつ求めているが、駆動音源符号決定器１８に
よる前サブフレーム音源符号決定前では、第１候補音源
（Ｌ_i1，β_i1，Ｉ_i1，γ_i1：ｉ＝１，２）のみを求め
て、前サブフレーム音源符号決定後に決定された前サブ
フレーム音源（Ｌ_pi，β_pi，Ｉ_pi，γ_pi）に対しての
み、第２候補音源（Ｌ_i2，β_i2，Ｉ_i2，γ_i2）を求めて
もよい。これにより、候補音源抽出のための演算量を減
少させることができる。

【００２０】また、上記実施例では音源候補を２候補と
しているが、２以上の複数候補による符号化を行なうこ
とも可能である。

【００２１】さらにまた、上記実施例では、音源のコー
ドブックとして適応コードブック１２および確率的コー
ドブック１３を備えているが、これらに加えて、周期間
隔のパルス音源を生成するパルス音源生成器と、確率的
コードブックまたはパルス音源生成器から生成された音
源のいずれかを選択する音源切替器とを備え、確率的コ
ードブックからの雑音音源とパルス音源生成器からの周
期パルス音源のいずれかを切り替えて使用するようにし
てもよい。

【００２２】

【発明の効果】本発明は、上記実施例から明らかなよう
に、従来の音源符号化装置に１サブフレーム遅延器およ
び駆動音源符号決定器を設けたものであり、駆動音源符
号決定器により前サブフレームおよび現サブフレームの
音源符号化最小歪の和を最小にするように前サブフレー
ム音源符号を決定することにより、２サブフレームにわ
たる最適な音源符号化を行なうことができ、復号音声品
質を向上させることができるという効果を有する。

【図面の簡単な説明】

【図１】本発明の一実施例における音声符号化装置の構
成を示すブロック図

【図２】従来の音声符号化装置の構成を示すブロック図

【符号の説明】

１１聴感重み付けフィルタ１２適応コードブック１３確率的コードブック１４駆動音源生成器１５聴感重み付き合成フィルタ１６歪最小化器１７１サブフレーム遅延器１８駆動音源符号決定器

Claims

【特許請求の範囲】

【請求項１】フレーム単位の入力音声の聴感重み付け
を行なって重み付け入力音声を生成する聴感重み付けフ
ィルタと、過去の駆動音源を蓄える適応コードブック
と、複数の雑音音源を予め格納する確率的コードブック
と、前記適応コードブックおよび確率的コードブックの
出力をもとにして駆動音源を生成する駆動音源生成器
と、前記駆動音源生成器で生成した駆動音源を入力とし
て聴感重み付き音声を合成する聴感重み付き合成フィル
タと、前記重み付き入力音声に対する重み付き合成音声
の誤差の二乗和を最小とする長期予測遅延、長期予測ゲ
イン、確率的コードブック内のベクトルインデクスおよ
びそのベクトルに乗ずるゲインを複数候補決定してこれ
ら駆動音源符号および最小歪を出力する歪最小化器と、
前記歪最小化器の出力を１サブフレーム遅延させる遅延
器と、前記歪最小化器および遅延器の出力をもとにして
前サブフレームおよび現サブフレームの最小歪の和を最
小にしうる前サブフレーム駆動音源符号を出力する駆動
音源符号決定器とを備えた音声符号化装置。
【請求項２】周期間隔のパルス音源を生成するパルス
音源生成器と、確率的コードブックと前記パルス音源生
成器から生成された音源のいずれかを選択する音源切替
器とを備えた請求項１記載の音声符号化装置。