JPH11272296A

JPH11272296A - 音声符号化／復号化方法

Info

Publication number: JPH11272296A
Application number: JP10073878A
Authority: JP
Inventors: Katsumi Tsuchiya; 勝美土谷; Kimio Miseki; 公生三関
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1998-03-23
Filing date: 1998-03-23
Publication date: 1999-10-08
Anticipated expiration: 2018-03-23
Also published as: JP3576794B2

Abstract

(57)【要約】【課題】合成フィルタを駆動する駆動音源信号の不連続
性を緩和させて復号音声の品質向上を達成する音声符号
化方法を提供する。【解決手段】フレーム単位で入力される音声信号１００
を合成フィルタ１９とその駆動音源信号１０７とで表現
して符号化する際、適応符号帳１２を用いて生成された
適応符号ベクトルと、雑音符号帳１３を用いて生成され
た雑音符号ベクトルとから駆動音源信号１０７を生成す
る音声符号化システムにおいて、適応符号帳１２に格納
された過去の駆動音源ベクトルから切り出したベクトル
１０３に所定の窓長で窓処理を行って生成した単位ベク
トルを入力音声信号１０１のピッチ周期で並べ、ピッチ
周期化された適応符号ベクトル１０６を生成する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は音声符号化／復号化
方法に係り、特に適応符号ベクトルおよび雑音符号ベク
トルの生成方法に関する。

【０００２】

【従来の技術】音声信号の高能率符号化方式として、入
力音声信号をフレームと呼ばれる５〜２０ｍｓ程度の一
定間隔の区間に分割し、このフレーム単位に分割された
入力音声信号を、声道をモデル化した合成フィルタと合
成フィルタの入力に当たる駆動音源信号とで表現して符
号化する方法が知られている。

【０００３】このような音声符号化方法の中で、特に駆
動音源信号をピッチ周期に対応する周期成分とそれ以外
の成分とに分離して符号化する方法があり、ＣＥＬＰ(C
ELP:Code Excited Linear Prediction Coding)と呼ばれ
る符号駆動線形予測符号化がその代表的な方法である。
ＣＥＬＰ音声符号化の詳細については、M.R.Schroeder
and B.S.Atal“Code-Exicited Linear Prediction(CEL
P):Highquality Speechat Very Low Bit Rates”,Proc.
ICASSP‘85,25.1.1,pp.937-940,1985 に述べられてい
る。

【０００４】ＣＥＬＰ音声符号化システムは、図１０に
示すように構成される。まず、入力音声信号１００が５
〜２０ｍｓ程度の一定間隔のフレーム単位に分割されて
入力される。このフレーム単位の入力音声信号１００は
線形予測分析部１０に入力され、その周波数スペクトル
の包絡形状を表す線形予測係数１０１が計算される。線
形予測係数１０１は線形予測係数符号化部１１により符
号化された後、合成フィルタ１９にフィルタ係数１０２
として与えられる。また、線形予測係数１０１は聴感重
み付けフィルタ２１にも供給され、重み付け音声信号１
１０を求めるために利用される。

【０００５】線形予測係数１０１の符号化の後、ピッチ
周期の探索が行われる。この際、まず切り出し適応符号
ベクトル生成部２５において、音声のピッチ周期成分を
符号化するための適応符号ベクトル１０６が生成され
る。

【０００６】切り出し適応符号ベクトル生成部２５から
の適応符号ベクトル１０６と、雑音符号帳１２からの雑
音符号ベクトル１０４は、ゲイン乗算部１６，１７によ
りゲイン符号帳１４から与えられるゲインが乗じられた
後、加算部１８で加算され、合成フィルタ１９を駆動す
るための駆動音源信号１０７が生成される。合成フィル
タ１９は、駆動音源信号１０７を入力して合成音声信号
１０８を生成する。

【０００７】合成音声信号１０８は減算器２０に入力さ
れ、入力音声信号１００に対する合成音声信号１０８の
誤差信号１０９が求められる。この誤差信号１０９は聴
感重み付けフィルタ２１に入力され、この聴感重み付け
フィルタ２１から重み付け音声信号１１０が出力され
る。この重み付け音声信号１１０は歪み計算部２２に入
力され、ここで入力音声信号１００に対する合成音声信
号１０８の聴感重み付け歪み１１１が計算で求められ
る。

【０００８】ここで、図１１および図１２を用いて切り
出し適応符号ベクトル生成部２５について説明する。切
り出し適応符号ベクトル生成部２５では、切り出し部３
０により適応符号帳１２に格納されている過去の駆動音
源ベクトル１０３から、ピッチ周期情報１２０で示され
るピッチ周期Ｌに相当する長さの単位ベクトル１２５が
切り出され、この単位ベクトル１２５がピッチ周期Ｌの
整数ｉ倍（ｉ＝１，２，…，ｎ）の遅延時間を持つ遅延
器３３−１〜３３−ｎでピッチ周期Ｌずつ順次シフトさ
れた後、ベクトル長がフレーム長Ｎになるように加算部
３４で重ね合わせられることにより、適応符号ベクトル
１０６が生成される。単位ベクトル１２５とは、駆動音
源ベクトルから切り出された、繰り返しが行われる単位
のベクトルを指す。

【０００９】このように従来のＣＥＬＰ音声符号化シス
テムでは、適応符号ベクトル１０６の連続性を考慮せず
に、駆動音源信号のピッチ周期化を行っている。このた
め、ピッチ周期が変化すると適応符号ベクトル１０６は
不連続なものになり、結果として合成音声の音質が劣化
する。また、適応符号ベクトル１０６に接続歪みが生じ
ていると、この歪みを削減するような雑音符号ベクトル
が雑音符号帳１３から選択され、やはり合成音声の音質
が劣化してしまうといった問題もある。

【００１０】一方、雑音符号帳からの雑音符号ベクトル
を適応符号帳から求められたピッチ周期で周期化し、適
応符号帳では表現しきれなかったピッチ周期性を効率的
に符号化する方法がＰＳＩ−ＣＥＬＰ音声符号化システ
ムとして提案されている。このＰＳＩ−ＣＥＬＰ音声符
号化の詳細については、例えば、三樹、守谷、間野、大
室：“ピッチ同期雑音励振源をもつＣＥＬＰ符号化(PSI
-CELP)”、信学論(A),J77-A.3,pp.314-324,1994 に述べ
られている。

【００１１】ＰＳＩ−ＣＥＬＰ音声符号化システムは、
図１３に示すように図１０に示したＣＥＬＰ音声符号化
システムに、雑音符号帳１３からの雑音符号ベクトル１
０４を適応符号帳１２から求められたピッチ周期で周期
化した雑音符号ベクトル１１３を生成する切り出し雑音
符号ベクトル生成部２６が追加された構成となってい
る。

【００１２】ここで、図１４および図１５を用いて切り
出し雑音符号ベクトル生成部２６について説明する。切
り出し雑音符号ベクトル生成部２６では、切り出し部５
０により雑音符号帳１３からの雑音ベクトル１０４か
ら、ピッチ周期情報２２０で示されるピッチ周期Ｌに相
当する長さの単位ベクトルが切り出され、この単位ベク
トルが遅延器５３−１〜５３−ｎでピッチ周期Ｌずつ順
次シフトされた後、ベクトル長がフレーム長Ｎになるよ
うに加算部５４で重ね合わせられることにより、ピッチ
周期化された雑音符号ベクトル１１３が生成される。

【００１３】このように従来のＰＳＩ−ＣＥＬＰ音声符
号化システムにおいても、雑音符号ベクトルが生成され
る際、雑音ベクトルの連続性が考慮されないので、駆動
音源信号が不連続なものとなり、合成音声の音質が劣化
する。

【００１４】

【発明が解決しようとする課題】上述したように従来の
ＣＥＬＰ方式、ＰＳＩ−ＣＥＬＰ方式などの音声符号化
システムでは、ピッチ周期が変化すると適応符号帳の駆
動音源ベクトルのピッチ周期化や雑音符号帳の符号ベク
トルのピッチ周期化に伴う接続歪みが生じ、合成音声の
音質が劣化するという問題点があった。

【００１５】本発明は、このような問題点を解消し、合
成フィルタを駆動する駆動音源信号の不連続性を緩和さ
せて復号音声の品質向上を達成する音声符号化／復号化
方法を提供することを目的とする。

【００１６】

【課題を解決するための手段】上記の課題を解決するた
め、本発明に係る音声符号化／復号化方法は、適応符号
帳や雑音符号帳に格納されたベクトルから切り出したベ
クトルに窓処理を行って生成した単位ベクトルをピッチ
周期で並べたものを適応符号ベクトルや雑音符号ベクト
ルとして駆動音源信号を生成することを骨子としてい
る。

【００１７】すなわち、フレーム単位で入力される音声
信号を少なくとも合成フィルタと該合成フィルタを駆動
するための駆動音源信号とで表現して符号化する音声符
号化方法であって、過去の駆動音源ベクトルを格納した
適応符号帳を用いて生成された適応符号ベクトルと、雑
音符号帳を用いて生成された雑音符号ベクトルとから駆
動音源信号を生成する音声符号化方法において、適応符
号帳に格納された過去の駆動音源ベクトルから切り出し
たベクトルに所定の窓長で窓処理を行って生成した単位
ベクトルを音声信号のピッチ周期で並べることにより、
適応符号ベクトルを生成することを特徴とする。

【００１８】また、この音声符号化方法に対応して、合
成フィルタに駆動音源信号を入力してフレーム単位の音
声信号を復号化する音声復号化方法であって、過去の駆
動音源ベクトルを格納した適応符号帳を用いて生成され
た適応符号ベクトルと、雑音符号帳を用いて生成された
雑音符号ベクトルとから駆動音源信号を生成する音声復
号化方法において、適応符号帳に格納された過去の駆動
音源ベクトルから切り出したベクトルに所定の窓長で窓
処理を行って生成した単位ベクトルを音声信号のピッチ
周期で並べることにより、適応符号ベクトルを生成する
ことを特徴とする。

【００１９】このように窓処理を行った後に、適応符号
化ベクトルのピッチ周期化を行うことで、ピッチ周期が
変化しても不連続のない滑らかな適応符号ベクトルを生
成することができるため、復号音声の音質を向上させる
ことができる。

【００２０】さらに、フレーム単位で入力される音声信
号を少なくとも合成フィルタと該合成フィルタを駆動す
るための駆動音源信号とで表現して符号化する音声符号
化方法であって、過去の駆動音源ベクトルを格納した適
応符号帳を用いて生成された適応符号ベクトルと、雑音
符号帳を用いて生成された雑音符号ベクトルとから駆動
音源信号を生成する音声符号化方法において、雑音符号
帳に格納されたベクトルから切り出したベクトルに所定
の窓長で窓処理を行って生成した単位ベクトルを音声信
号のピッチ周期で並べることにより、雑音符号ベクトル
を生成することを特徴とする。

【００２１】また、この音声符号化方法に対応して、合
成フィルタに駆動音源信号を入力してフレーム単位の音
声信号を復号化する音声復号化方法であって、過去の駆
動音源ベクトルを格納した適応符号帳を用いて生成され
た適応符号ベクトルと、雑音符号ベクトルを格納した雑
音符号帳を用いて生成された雑音符号ベクトルとで駆動
音源信号を生成する音声復号化方法において、雑音符号
帳に格納されたベクトルから切り出したベクトルに所定
の窓長で窓処理を行って生成した単位ベクトルを音声信
号のピッチ周期で並べることにより、雑音符号ベクトル
を生成することを特徴とする。

【００２２】このように窓処理を行った後に、雑音符号
化ベクトルのピッチ周期化を行うことで、ピッチ周期が
変化しても不連続のない滑らかな雑音符号ベクトルを生
成することができるため、復号音声の音質を向上させる
ことができる。

【００２３】また、ピッチ周期化を適応符号ベクトルと
雑音符号ベクトルの両方に行えば、これら両方の符号ベ
クトルのピッチ周期に対する不連続がなくなるため、復
号音声の音質はさらに向上する。

【００２４】本発明においては、窓処理における窓長を
音声信号の現フレームのピッチ周期よりも長くすること
により、単位ベクトルを重ね合わせてピッチ周期化され
た適応符号ベクトルや雑音符号ベクトルを生成でき、こ
れら適応符号ベクトルや雑音符号ベクトルの不連続が削
減されるため、復号音声の音質のさらなる向上が期待で
きる。

【００２５】さらに、本発明によると窓処理における窓
長を音声信号の現フレームのピッチ周期よりも長くする
ことにより、ピッチ周期が急激に変化した場合でも、適
応符号ベクトルや雑音符号ベクトルに不連続が生じるこ
とがなく、復号音声の音質劣化が防止される。

【００２６】

【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。（第１の実施形態）まず、本発明の第１の実施形態に係
る音声符号化方法および音声復号化方法について、符号
化側および復号化側に分けて順次説明する。

【００２７】［符号化側について］図１に、本実施形態
に係る音声符号化方法を適用した音声符号化システムの
構成を示す。この音声符号化システムは、図１０に示し
た従来のＣＥＬＰ音声符号化システムにおける切り出し
適応符号ベクトル生成部２５を窓処理適応符号ベクトル
生成部１５に置き換えた構成となっている。

【００２８】すなわち、本実施形態に係る音声符号化シ
ステムは、線形予測分析部１０、線形予測係数符号化部
１１、過去の駆動音源ベクトルを格納し、音声のピッチ
周期成分を符号化するための適応符号帳１２、音声のピ
ッチ周期以外の成分を符号化するための雑音符号帳１
３、雑音符号ベクトル１０４と適応符号ベクトル１０６
に与えるゲインを符号化するためのゲイン符号ベクトル
を格納したゲイン符号帳１４、適応符号帳１２に格納さ
れた過去の駆動音源ベクトルから音声のピッチ周期成分
を表す適応符号ベクトル１０６を生成する窓処理適応符
号ベクトル生成部１５、ゲイン乗算部１６，１７、加算
部１８、合成フィルタ１９、減算器２０、聴感重み付け
フィルタ２１、歪み計算部２２およびマルチプレクサ２
３から構成されている。

【００２９】この音声符号化システムでは、まず入力音
声信号１００が５〜２０ｍｓ程度の一定間隔のフレーム
単位に分割されて入力される。このフレーム単位の入力
音声信号１００は線形予測分析部１０に入力され、その
周波数スペクトルの包絡形状を表す線形予測係数１０１
が計算される。線形予測係数１０１は線形予測係数符号
化部１１により符号化された後、合成フィルタ１９にフ
ィルタ係数１０２として与えられる。また、線形予測係
数１０１は聴感重み付けフィルタ２１にも供給され、重
み付け音声信号１１０を求めるために利用される。

【００３０】線形予測係数１０１の符号化の後、ピッチ
周期の探索が行われる。この際、まず窓処理適応符号ベ
クトル生成部１５において、音声のピッチ周期成分を符
号化するための適応符号ベクトル１０６が生成される。

【００３１】窓処理適応符号ベクトル生成部１５からの
適応符号ベクトル１０６と、雑音符号帳１２からの雑音
符号ベクトル１０４は、ゲイン乗算部１６，１７により
ゲイン符号帳１４から与えられるゲインが乗じられた
後、加算部１８で加算され、合成フィルタ１９を駆動す
るための駆動音源信号１０７が生成される。合成フィル
タ１９は、駆動音源信号１０７を入力して合成音声信号
１０８を生成する。

【００３２】合成音声信号１０８は減算器２０に入力さ
れ、入力音声信号１００に対する合成音声信号１０８の
誤差信号１０９が求められる。この誤差信号１０９は聴
感重み付けフィルタ２１に入力され、この聴感重み付け
フィルタ２１から重み付け音声信号１１０が出力され
る。この重み付け音声信号１１０は歪み計算部２２に入
力され、ここで入力音声信号１００に対する合成音声信
号１０８の聴感重み付け歪み１１１が計算で求められ
る。

【００３３】次に、図２を用いて本実施形態の特徴的な
部分である窓処理適応符号ベクトル生成部１５の構成と
動作について説明する。窓処理適応符号ベクトル生成部
１５は、図２に示すように適応符号帳１２に格納されて
いる過去の駆動音源ベクトル１０３から現フレームのピ
ッチ周期Ｌに相当する長さのベクトルを切り出す切り出
し部３０と、窓処理を行う際の時間窓１２１を計算する
窓関数計算部３１と、切り出し部３０により切り出され
たベクトルに窓処理を行う窓処理部３２と、窓処理され
たベクトル（以下、これを単位ベクトルと呼ぶ）１２３
をピッチ周期Ｌずつ順次シフトして並べて重ね合わせた
ベクトル１２４を生成する遅延器３３−１〜３３−ｎお
よび加算部３４と、ベクトル１２４からフレーム長に相
当する長さを切り出し、ピッチ周期化された適応符号ベ
クトル１０６として取り出す適応符号ベクトル切り出し
部３５とから構成されている。

【００３４】この窓処理適応符号ベクトル生成部１５の
動作は、以下の通りである。まず、切り出し部３０にお
いて、適応符号帳１２に格納されている過去の駆動音源
ベクトル１０３から、窓関数計算部３１で求められた時
間窓１２１と同じ長さのベクトルが切り出される。一
方、窓関数計算部３１において、予め設定された複数の
ピッチ周期候補の中から任意に選び出された、ピッチ周
期情報１２０で与えられる現フレームのピッチ周期Ｌに
対応する時間窓１２１が計算により求められる。次に、
窓処理部３２において駆動音源ベクトル１０３から切り
出されたベクトルに対し、窓関数計算部３１で求められ
た時間窓１２１による窓処理が行われ、単位ベクトル１
２３が生成される。さらに、こうして生成された単位ベ
クトル１２３を現フレームのピッチ周期Ｌの整数ｉ倍
（ｉ＝１，２，…，ｎ）の遅延時間がそれぞれ設定され
た遅延器３３−１〜３３−ｎによりピッチ周期Ｌずつ順
次シフトした後、ベクトル長が２Ｌ＋Ｎよりも長くなる
ように加算部３４で並べて重ね合わせることにより、新
たなベクトル１２４が生成される。最後に、適応符号ベ
クトル切り出し部３５において、このベクトル１２４の
最初のＬに相当する時間後からフレーム長Ｎの部分が切
り出され、その切り出されたベクトルがピッチ周期化さ
れた適応符号ベクトル１０６となる。

【００３５】次に、図３を参照して時間窓１２１として
窓長Ｗがピッチ周期Ｌの２倍の長さであるようなハニン
グ窓を用いた場合を例にとって、窓処理適応符号ベクト
ル生成部１５の動作を詳細に説明する。ハニング窓は次
式（１）で定義される。ただし、Ｗは窓長であり、この
例ではＷ＝２Ｌである。

【００３６】

【数１】

【００３７】まず、ピッチ周期をＬ、フレーム長をＮと
する。適応符号帳１２に格納されている過去の駆動音源
ベクトル１０３のうち、ピッチ周期Ｌの２倍の長さ２Ｌ
の直前のベクトルを切り出し、このベクトルに対して窓
長が２Ｌであるハニング窓で窓処理を施して、長さ２Ｌ
の単位ベクトル１２３を生成する。

【００３８】次に、この単位ベクトル１２３をピッチ周
期Ｌずつ順次シフトして、つまり遅延しない単位ベクト
ル１２３および時間Ｌ，２Ｌ，…ｎＬ（図３ではｎ＝
３）遅延した単位ベクトルをベクトル全体の長さが２Ｌ
＋Ｎよりも長くなるまで並べて重ね合わせることによ
り、新たなベクトル１２４を生成する。こうして単位ベ
クトル１２３の重ね合わせによって生成されたベクトル
１２４の時間Ｌからフレーム長Ｎだけ切り出してきたベ
クトルがピッチ周期Ｌに対応したピッチ周期化された適
応符号ベクトル１０６となる。

【００３９】なお、この例では窓長Ｗおよび単位ベクト
ル１２３の長さ２Ｌがいずれもピッチ周期Ｌよりも大き
いため、図のようにピッチ周期Ｌずつシフトして並べた
ベクトル１２４において、元の単位ベクトルの重なり合
う部分が生じているが、必ずしも単位ベクトルが重なり
合うとは限らない。例えば、窓長Ｗおよび単位ベクトル
の長さがピッチ周期Ｌよりも小さいときは、重なり合う
部分は生じない。要するに、単位ベクトルをピッチ周期
Ｌの単位で順次シフトして並べればよい。

【００４０】上述した適応符号ベクトル１０６の生成方
法は、全てのピッチ周期Ｌに対して適用してもよいし、
特定のピッチ周期に対して、例えば、ピッチ周期Ｌがフ
レーム長Ｎより小さいときのみ適用してもよい。このよ
うにして生成された適応符号ベクトル１０６は、ピッチ
周期Ｌが変化している場合でも、ピッチ周期化による接
続歪みがなく滑らかなものとなり、合成音声の音質が大
きく改善される。

【００４１】また、上記の説明では窓処理部３２での窓
処理に用いられる窓としてハニング窓を用いたが、これ
に限られるものでなく、例えばハミング窓や、式（２）
で定義（Ｗは窓長）されるような窓を用いてもよく、ピ
ッチ周期化による接続歪みが少なくなるような窓であれ
ば、いかなるものでも構わない。

【００４２】

【数２】

【００４３】また、上記の説明では窓長Ｗを現フレーム
のピッチ周期Ｌの２倍としたが、これに限られず、現フ
レームのピッチ周期より長くすればよく、ピッチ周期化
による接続歪みが少なくなるような任意の長さに設定す
ることができるい。さらに、窓長Ｗを現フレームのピッ
チ周期より長くする代わりに、前フレームのピッチ周期
より長くする（例えば前フレームのピッチ周期の２倍に
する）ようにしても構わない。

【００４４】さらに、窓関数計算部３１で予め複数種類
の窓を用意しておき、ピッチ周期Ｌに応じて窓の種類を
切り替えるようにすることも可能である。図１に戻って
説明を続ける。上述のようにして窓処理適応符号ベクト
ル生成部１５で生成されたピッチ周期Ｌに対応する適応
符号ベクトル１０６は、ゲイン乗算部１６および加算部
１８を経て駆動音源信号１０７として合成フィルタ１９
に入力され、合成音声信号１０８が生成される。そし
て、入力音声信号１００に対する合成音声信号１０８の
誤差信号１０９が減算部２０で求められ、さらに聴感重
み付けフィルタ２１で処理されて重み付け音声信号１１
０が生成される。この重み付け音声信号１１０は歪み計
算部２２に供給され、聴感重み付け歪み１１１が計算さ
れる。この処理が予め定められたピッチ周期候補全てに
対して行われ、聴感重み付け歪み１１１を最小にする値
がピッチ周期として選択される。こうして、適応符号帳
１２の探索が行われる。

【００４５】次に、雑音符号帳１３の探索が行われる。
この場合、先に求められたピッチ周期に対応する適応符
号ベクトル１０６と、雑音符号帳１３から選択された雑
音符号ベクトル１０４にゲイン乗算部１６，１７でゲイ
ンを乗じて加算部１８で加算して得られた駆動音源信号
１０７により合成フィルタ１９が駆動され、生成された
合成音声信号１０８の入力音声信号１００に対する聴感
重み付け歪み１１１が計算される。この処理が雑音符号
帳１３にある全ての符号ベクトルに対して行われ、聴感
重み付け歪み１１１を最小にする符号ベクトルが雑音符
号ベクトル１０４として選択される。

【００４６】一方、ゲイン符号帳１４の探索について
は、上述したピッチ周期探索および雑音符号帳探索時に
は聴感重み付け歪み１１１が最小となるような最適ゲイ
ンが用いられ、また実際の符号化時には、ピッチ周期探
索および雑音符号帳探索で求められた適応符号ベクトル
１０６および雑音符号ベクトル１０４を用いて生成され
る合成音声信号１０８の入力音声信号１００に対する聴
感重み付け歪み１１１を最小にするような値がゲイン符
号帳１４から選択される。

【００４７】そして、線形予測係数符号化部１１で線形
予測係数を符号化して得られた線形予測係数符号帳の符
号ベクトルのインデックス（線形予測係数インデック
ス）Ａが線形予測係数符号化部１１からマルチプレクサ
２３に入力されると共に、線形予測分析残差波形を符号
化して得られた適応符号帳１２の符号ベクトルのインデ
ックス（適応符号ベクトルインデックス）Ｂと、雑音符
号帳１３の符号ベクトルのインデックス（雑音符号ベク
トルインデックス）Ｃ、およびゲイン符号帳１４のイン
デックス（ゲインインデックス）Ｄが歪み計算部２２か
らマルチプレクサ２３に入力される。

【００４８】マルチプレクサ２３では、入力されたイン
デックスＡ，Ｂ，Ｃ，Ｄから符号化ビットストリーム１
１２が生成され、この符号化ビットストリーム１１２が
伝送路または蓄積媒体を経て復号化側に伝送される。

【００４９】［復号化側について］図４に、本実施形態
に係る音声復号化方法を適用した音声符号化システムの
構成を示す。本実施形態の音声符号化システムは、図１
に示した音声符号化システムに対応しており、この音声
符号化システムとほぼ逆の処理を行って、復号音声信号
を生成する。

【００５０】すなわち、本実施形態に係る音声復号化シ
ステムは、入力される符号化ビットストリーム２１２か
ら各インデックスを分離生成するデマルチプレクサ４
０、線形予測係数復号化部４１、過去の駆動音源ベクト
ルを格納し、音声のピッチ周期成分を符号化するための
適応符号帳４２、音声のピッチ周期以外の成分を符号化
するための雑音符号帳４３、適応符号ベクトル２０６と
雑音符号ベクトル２０４に与えるゲインを符号化するた
めのゲイン符号ベクトルを格納したゲイン符号帳４４、
適応符号帳４２に格納された駆動音源ベクトルから音声
のピッチ周期成分を表す適応符号ベクトル１０６を生成
する窓処理適応符号ベクトル生成部４５、ゲイン乗算部
４６，４７、加算部４８および合成フィルタ４９から構
成されている。

【００５１】この音声復号化システムでは、図１に示し
た音声符号化システムから出力される符号化ビットスト
リーム１１２が伝送路または蓄積媒体を介した後、符号
化ビットストリーム２１２としてデマルチプレクサ４０
に入力される。デマルチプレクサ４０では、入力された
符号化ビットストリーム２１２から線形予測係数インデ
ックスＡ、適応符号ベクトルインデックスＢ、雑音符号
ベクトルインデックスＣ、およびゲインインデックスＤ
が分離生成される。

【００５２】これらのインデックスＡ，Ｂ，Ｃ，Ｄのう
ち、線形予測係数インデックスＡは線形予測係数復号部
４１に、適応符号ベクトルインデックスＢは適応符号帳
４２に、雑音符号ベクトルインデックスＣは雑音符号帳
に４３、ゲインインデックスＤはゲイン符号帳４４にそ
れぞれ入力される。

【００５３】線形予測係数復号部４１では、入力された
線形予測係数インデックスＡから線形予測係数が復号さ
れ、これが合成フィルタ４９にフィルタ係数２０１とし
て与えられる。

【００５４】また、適応符号ベクトルインデックスＢに
従って適応符号帳４２から選択された適応符号ベクトル
２０３が窓処理適応符号ベクトル生成部４５に入力され
る。窓処理適応符号ベクトル生成部４５では、図１の音
声符号化システムにおける窓処理適応符号ベクトル生成
部１５と同様の処理が行われ、窓処理適応符号ベクトル
２０６が出力される。窓処理適応符号ベクトル生成部４
５の構成と動作は、図１に示した音声符号化システム内
の窓処理適応符号ベクトル生成部１５と全く同様である
ため、説明を省略する。

【００５５】また、雑音符号ベクトルインデックスＣに
従って雑音符号帳４３から雑音符号ベクトル２０４が選
択され出力される。さらに、ゲインインデックスＤに従
ってゲイン符号帳４４から窓処理適応符号ベクトル２０
６および雑音符号ベクトル２０４に乗じるべきゲイン２
０５が求められる。このゲイン２０５がゲイン乗算部４
６，４７で窓処理適応符号ベクトル２０６および雑音符
号ベクトル２０４に乗じられた後、加算部４８で足し合
わされることによって復号残差波形信号が生成され、こ
れが駆動音源信号２０７として合成フィルタ４９および
適応符号帳４２に入力される。

【００５６】そして、線形予測係数復号部４１で復号さ
れた線形予測係数により決定されたフィルタ数２０１が
与えられた合成フィルタ４９が駆動音源信号２０７によ
り駆動され、復号音声信号２００が生成される。なお、
合成フィルタ４９の出力に対してポストフィルタなどの
後処理を行って、最終的な復号音声信号を得るようにし
ても構わない。

【００５７】（第２の実施形態）次に、本発明の第２の
実施形態に係る音声符号化方法および音声復号化方法に
ついて、符号化側および復号化側に分けて順次説明す
る。

【００５８】［符号化側について］図５に、本実施形態
に係る音声符号化方法を適用した音声符号化システムの
構成を示す。図１と同一部分に同一符号を付して説明す
ると、本実施形態の音声符号化システムは、図１に示し
た第１の実施形態の音声符号化システムに、周期化され
た雑音符号ベクトル１１３を生成する窓処理雑音符号ベ
クトル生成部２４が追加された構成であり、いわば図１
３で説明したＰＳＩ−ＣＥＬＰ音声符号化システムを改
良した構成となっている。

【００５９】以下、図６を用いて窓処理雑音符号ベクト
ル生成部２４の構成と動作についてを説明する。窓処理
雑音符号ベクトル生成部２４は、図６に示すように雑音
符号帳１３に格納されている雑音符号ベクトル１０４か
ら現フレームのピッチ周期Ｌに相当する長さのベクトル
を切り出す切り出し部５０と、窓処理を行う際の時間窓
２２１を計算する窓関数計算部５１と、切り出し部５０
により切り出されたベクトルに窓処理を行う窓処理部５
２と、窓処理されたベクトル（以下、これを単位ベクト
ルと呼ぶ）２２３をピッチ周期Ｌずつ順次シフトして並
べて足し合わせたベクトル２２４を生成する遅延器５３
−１〜５３−ｎおよび加算部５４と、ベクトル２２４か
らフレーム長に相当する長さを切り出し、ピッチ周期化
された雑音符号ベクトル１１３として取り出す雑音符号
ベクトル切り出し部５５とから構成されている。

【００６０】この窓処理雑音符号ベクトル生成部２４の
動作は以下の通りである。まず、窓関数計算部５１にお
いて適応符号帳１２の探索で求められた、ピッチ周期情
報２２０で与えられるピッチ周期Ｌに基づいた時間窓２
２１が計算により求められる。次に、切り出し部５０に
おいて雑音符号帳１３に格納されている符号ベクトル１
０４から窓関数計算部５１で求められた時間窓２２１と
同じ長さのベクトルが切り出される。次に、窓処理部５
２において、雑音符号帳１３から切り出されたベクトル
２０５に窓関数計算部５１で求められた時間窓２２１に
よる窓処理が行われ、単位ベクトル２２３が生成され
る。さらに、こうして生成された単位ベクトル２２３を
現フレームのピッチ周期Ｌの整数ｉ倍（ｉ＝１，２，
…，ｎ）の遅延時間がそれぞれ設定された遅延器５３−
１〜５３−ｎによりピッチ周期Ｌずつ順次シフトした
後、ベクトル長が２Ｌ＋Ｎよりも長くなるまで加算部５
４で並べて重ね合わせることにより、新たなベクトル２
２４が生成される。最後に、雑音符号ベクトル切り出し
部５５において、このベクトル２２４の最初のＬに相当
する時間後からフレーム長Ｎの部分が切り出され、その
切り出されたベクトルがピッチ周期化された雑音符号ベ
クトル１１３となる。

【００６１】次に、図７を参照して時間窓２２１として
窓長Ｗがピッチ周期Ｌの２倍の長さであるようなハニン
グ窓を用いた場合を例にとって説明する。適応符号帳１
２の探索によって得られたピッチ周期がＬであるとき、
雑音符号帳１３に格納されているベクトル１０４から、
ピッチ周期Ｌの２倍の長さのベクトルを切り出し、この
ベクトルに対して窓長が２Ｌであるハニング窓で窓処理
を施して、長さ２Ｌの単位ベクトル２２３を生成する。

【００６２】次に、この単位ベクトル２２３をピッチ周
期Ｌずつ順次シフトして、つまり遅延しない単位ベクト
ル１２３および時間Ｌ，２Ｌ，…ｎＬ（図７ではｎ＝
３）遅延した単位ベクトルをベクトル全体の長さが２Ｌ
＋Ｎよりも長くなるまで並べて重ね合わせることによ
り、新たなベクトル２２４を生成する。こうして単位ベ
クトル２２３の重ね合わせによって生成されたベクトル
２２４の時間Ｌからフレーム長Ｎだけ切り出してきたベ
クトルがピッチ周期Ｌに対応して周期化された雑音符号
ベクトル１１３となる。

【００６３】上述した周期化された雑音符号ベクトル１
１３の生成方法は、全てのピッチ周期Ｌに対して適用し
てもよいし、特定のピッチ周期に対して、例えば、ピッ
チ周期Ｌがフレーム長Ｎより小さいときのみ適用しても
よい。このようにして生成された雑音符号ベクトル１１
３は、ピッチ周期Ｌが変化している場合でも、ピッチ周
期化による接続歪みがなく滑らかなものとなり、合成音
声の音質が大きく改善される。

【００６４】また、上記の説明では窓処理部５２での窓
処理に用いられる窓としてハニング窓を用いたが、これ
に限られるものでなく、例えばハミング窓や、式（２）
で定義（Ｗは窓長）されるような窓を用いてもよく、ピ
ッチ周期化による接続歪みが少なくなるような窓であれ
ば、いかなるものでも構わない。義されるような窓を用
いても良く、ピッチ周期化による接続歪みが少なくなる
ような窓であればいかなるものでも構わない。

【００６５】また、上記の説明では窓長Ｗを現フレーム
のピッチ周期Ｌの２倍としたが、これに限られず、現フ
レームのピッチ周期より長くすればよく、ピッチ周期化
による接続歪みが少なくなるような任意の長さに設定す
ることができるい。さらに、窓長Ｗを現フレームのピッ
チ周期より長くする代わりに、前フレームのピッチ周期
より長くする（例えば前フレームのピッチ周期の２倍に
する）ようにしても構わない。

【００６６】例えば、ピッチ周期Ｌに等しい窓長を持
ち、式（３）で定義されるような窓の中央部から両端に
かけて減衰する形状の窓を用いることもできる。但し、
Ｗは窓長であり、この例ではＷ＝Ｌである。

【００６７】

【数３】

【００６８】このような窓を用いて、周期化された雑音
符号ベクトルを生成する例を図８に示す。図８では、雑
音符号帳１３から切り出された単位ベクトル２２３はベ
クトルの長さがＬであり、この単位ベクトル２２３を重
ね合わせずにピッチ周期Ｌで繰り返すことで、周期化さ
れた雑音符号ベクト１１３ルを生成している。また、窓
のピークと雑音符号帳１３に格納されているベクトル１
０４のピークを合わせて単位ベクトル２２３の切り出し
を行うことによって、単位ベクトル２２３の接続部の不
連続を和らげるだけでなく、単位ベクトル２２３のピー
ク付近のパワーを強調することができ、ピークの強調さ
れた雑音符号ベクトルを生成することができる。

【００６９】さらに、窓関数計算部５１で予め複数種類
の窓を用意しておき、ピッチ周期Ｌに応じて窓の種類を
切り替えるようにすることも可能である。なお、ここで
述べた雑音符号ベクトル生成方法は、図５の構成の音声
符号化方式に限らず、雑音符号帳の符号ベクトルのピッ
チ周期化を行う全ての音声符号化方式に適用することが
できる。

【００７０】［復号化側について］図９に、本実施形態
に係る音声復号化方法を適用した音声符号化システムの
構成を示す。本実施形態の音声符号化システムは、図５
に示した音声符号化システムに対応しており、この音声
符号化システムとほぼ逆の処理を行って、復号音声信号
を生成する。図４と同一部分に同一符号を付して説明す
ると、本実施形態の音声復号化システムは、図４に示し
た第１の実施形態の音声復号化システムに、雑音符号イ
ンデックスＣに従って雑音符号帳４３から選択された雑
音符号ベクトル２０４から周期化された雑音符号ベクト
ル２１３を生成する窓処理雑音符号ベクトル生成部５６
が追加された構成となっている。

【００７１】窓処理雑音符号ベクトル生成部５６の構成
と動作は、図５に示した音声符号化システム内の窓処理
雑音符号ベクトル生成部２４と全く同様であるため、説
明を省略する。そして、この窓処理雑音符号ベクトル生
成部５６から出力される周期化された雑音符号ベクトル
２１３がゲイン乗算部４７においてゲインが乗じられた
後、ゲイン乗算部４６でゲインが乗ぜられた適応符号ベ
クトル２０６と加算部４８で加算され、合成フィルタ４
９への駆動音源信号２０７となる。

【００７２】

【発明の効果】以上詳述したように、本発明によれば、
適応符号帳や雑音符号帳から切り出したベクトルに窓処
理を行った後に、適応符号化ベクトルや雑音符号ベクト
ルのピッチ周期化を行うことで、ピッチ周期が変化して
も不連続のない滑らかな適応符号ベクトルや雑音符号ベ
クトルを生成することができるため、合成フィルタを駆
動する駆動音源信号の不連続性を緩和させ、復号音声の
品質を向上させることができる。

【図面の簡単な説明】

【図１】本発明の第１の実施形態に係る音声符号化シス
テムの構成を示す図

【図２】同第１の実施形態における窓処理適応符号ベク
トル生成部の構成を示す図

【図３】同第１の実施形態における窓処理適応符号ベク
トル生成部の動作を示す図

【図４】同第１の実施形態に係る音声復号化システムの
構成を示す図

【図５】本発明の第２の実施形態に係る音声符号化シス
テムの構成を示す図

【図６】同第２の実施形態における窓処理適応符号ベク
トル生成部の構成を示す図

【図７】同第２の実施形態における窓処理雑音符号ベク
トル生成部の動作を示す図

【図８】同第２の実施形態における窓処理雑音符号ベク
トル生成部の動作を示す図

【図９】同第２の実施形態に係る音声復号化システムの
構成を示す図

【図１０】従来のＣＥＬＰ音声符号化システムの構成を
示す図

【図１１】図１０における切り出し適応符号ベクトル生
成部の構成を示す図

【図１２】図１１の切り出し適応符号ベクトル生成部の
動作を示す図

【図１３】従来のＰＳＩ−ＣＥＬＰ音声符号化システム
の構成を示す図

【図１４】図１３における切り出し雑音符号ベクトル生
成部の構成を示す図

【図１５】図１４の切り出し雑音符号ベクトル生成部の
動作を示す図

【符号の説明】

１０…線形予測分析部１１…線形予測計数符号化部１２…適応符号帳１３…雑音符号帳１４…ゲイン符号帳１５…窓処理適応符号ベクトル生成部１６，１７…ゲイン乗算部１８…加算部１９…合成フィルタ２０…減算器２１…聴感重み付けフィルタ２２…歪み計算部２３…マルチプレクサ２４…窓処理雑音符号ベクトル生成部４１…線形予測係数復号部４２…適応符号帳４３…雑音符号帳４４…ゲイン符号帳４５…窓処理適応符号ベクトル生成部４６，４７…ゲイン乗算部４８…加算部４９…合成フィルタ５６…窓処理雑音符号ベクトル生成部１００…入力音声信号１０１…線形予測係数１０２…フィルタ係数１０３…適応符号ベクトル１０４…雑音符号ベクトル１０５…ゲイン符号ベクトル１０６…周期化された適応符号ベクトル１０７…駆動音源信号１０８…合成音声信号１０９…誤差信号１１０…重み付け音声信号１１１…聴感重み付き歪み１１２…符号化ビットストリーム１１３…周期化された雑音符号ベクトル１２０…ピッチ周期情報１２１…時間窓１２３…単位ベクトル１２４…ピッチ周期で並べたベクトル２００…復号音声信号２０１…線形予測係数２０３…適応符号ベクトル２０４…雑音符号ベクトル２０５…ゲイン符号ベクトル２０６…周期化された適応符号ベクトル２０７…駆動音源信号２１２…符号化ビットストリーム２１３…周期化された雑音符号ベクトル２２０…ピッチ周期情報２２１…時間窓２２３…単位ベクトル２２４…ピッチ周期で並べたベクトル

Claims

【特許請求の範囲】

【請求項１】フレーム単位で入力される音声信号を少な
くとも合成フィルタと該合成フィルタを駆動するための
駆動音源信号とで表現して符号化する音声符号化方法で
あって、過去の駆動音源ベクトルを格納した適応符号帳
を用いて生成された適応符号ベクトルと、雑音符号帳を
用いて生成された雑音符号ベクトルとから前記駆動音源
信号を生成する音声符号化方法において、前記適応符号帳に格納された過去の駆動音源ベクトルか
ら切り出したベクトルに所定の窓長で窓処理を行って生
成した単位ベクトルを前記音声信号のピッチ周期で並べ
ることにより、前記適応符号ベクトルを生成することを
特徴とする音声符号化方法。
【請求項２】フレーム単位で入力される音声信号を少な
くとも合成フィルタと該合成フィルタを駆動するための
駆動音源信号とで表現して符号化する音声符号化方法で
あって、過去の駆動音源ベクトルを格納した適応符号帳
を用いて生成された適応符号ベクトルと、雑音符号帳を
用いて生成された雑音符号ベクトルとから前記駆動音源
信号を生成する音声符号化方法において、前記雑音符号帳に格納されたベクトルから切り出したベ
クトルに所定の窓長で窓処理を行って生成した単位ベク
トルを前記音声信号のピッチ周期で並べることにより、
前記雑音符号ベクトルを生成することを特徴とする音声
符号化方法。
【請求項３】フレーム単位で入力される音声信号を少な
くとも合成フィルタと該合成フィルタを駆動するための
駆動音源信号とで表現して符号化する音声符号化方法で
あって、過去の駆動音源ベクトルを格納した適応符号帳
を用いて生成された適応符号ベクトルと、雑音符号帳を
用いて生成された雑音符号ベクトルとから前記駆動音源
信号を生成する音声符号化方法において、前記適応符号帳に格納された過去の駆動音源ベクトルか
ら切り出したベクトルに所定の窓長で窓処理を行って生
成した単位ベクトルを前記音声信号のピッチ周期で並べ
ることにより、前記適応符号ベクトルを生成し、前記雑音符号帳に格納されたベクトルから切り出したベ
クトルに所定の窓長で窓処理を行って生成した単位ベク
トルを前記音声信号のピッチ周期で並べることにより、
前記雑音符号ベクトルを生成することを特徴とする音声
符号化方法。
【請求項４】前記窓処理における窓長を前記音声信号の
現フレームのピッチ周期よりも長くすることを特徴とす
る請求項１〜３のいずれか１項記載の音声符号化方法。
【請求項５】前記窓処理における窓長を前記音声信号の
前フレームのピッチ周期よりも長くすることを特徴とす
る請求項１〜３のいずれか１項記載の音声符号化方法。
【請求項６】合成フィルタに駆動音源信号を入力してフ
レーム単位の音声信号を復号化する音声復号化方法であ
って、過去の駆動音源ベクトルを格納した適応符号帳を
用いて生成された適応符号ベクトルと、雑音符号帳を用
いて生成された雑音符号ベクトルとから前記駆動音源信
号を生成する音声復号化方法において、さらに、前記適応符号帳に格納された過去の駆動音源ベ
クトルから切り出したベクトルに所定の窓長で窓処理を
行って生成した単位ベクトルを前記音声信号のピッチ周
期で並べることにより、前記適応符号ベクトルを生成す
ることを特徴とする音声復号化方法。
【請求項７】合成フィルタに駆動音源信号を入力してフ
レーム単位の音声信号を復号化する音声復号化方法であ
って、過去の駆動音源ベクトルを格納した適応符号帳を
用いて生成された適応符号ベクトルと、雑音符号帳を用
いて生成された雑音符号ベクトルとで前記駆動音源信号
を生成する音声復号化方法において、前記雑音符号帳に格納されたベクトルから切り出したベ
クトルに所定の窓長で窓処理を行って生成した単位ベク
トルを前記音声信号のピッチ周期で並べることにより、
前記雑音符号ベクトルを生成することを特徴とする音声
復号化方法。
【請求項８】合成フィルタに駆動音源信号を入力してフ
レーム単位の音声信号を復号化する音声復号化方法であ
って、過去の駆動音源ベクトルを格納した適応符号帳を
用いて生成された適応符号ベクトルと、雑音符号帳を用
いて生成された雑音符号ベクトルとから前記駆動音源信
号を生成する音声復号化方法において、前記適応符号帳に格納された過去の駆動音源ベクトルか
ら切り出したベクトルに所定の窓長で窓処理を行って生
成した単位ベクトルを前記音声信号のピッチ周期で並べ
ることにより、前記適応符号ベクトルを生成し、さらに、前記雑音符号帳に格納されたベクトルから切り
出したベクトルに所定の窓長で窓処理を行って生成した
単位ベクトルを前記音声信号のピッチ周期で並べること
により、前記雑音符号ベクトルを生成することを特徴と
する音声復号化方法。
【請求項９】前記窓処理における窓長を前記音声信号の
現フレームのピッチ周期よりも長くすることを特徴とす
る請求項６〜８のいずれか１項記載の音声復号化方法。
【請求項１０】前記窓処理における窓長を前記音声信号
の前フレームのピッチ周期よりも長くすることを特徴と
する請求項６〜８のいずれか１項記載の音声復号化方
法。