JPH11272296A - 音声符号化/復号化方法 - Google Patents

音声符号化/復号化方法

Info

Publication number
JPH11272296A
JPH11272296A JP10073878A JP7387898A JPH11272296A JP H11272296 A JPH11272296 A JP H11272296A JP 10073878 A JP10073878 A JP 10073878A JP 7387898 A JP7387898 A JP 7387898A JP H11272296 A JPH11272296 A JP H11272296A
Authority
JP
Japan
Prior art keywords
vector
speech
code vector
generated
adaptive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10073878A
Other languages
English (en)
Other versions
JP3576794B2 (ja
Inventor
Katsumi Tsuchiya
勝美 土谷
Kimio Miseki
公生 三関
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP07387898A priority Critical patent/JP3576794B2/ja
Publication of JPH11272296A publication Critical patent/JPH11272296A/ja
Application granted granted Critical
Publication of JP3576794B2 publication Critical patent/JP3576794B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】合成フィルタを駆動する駆動音源信号の不連続
性を緩和させて復号音声の品質向上を達成する音声符号
化方法を提供する。 【解決手段】フレーム単位で入力される音声信号100
を合成フィルタ19とその駆動音源信号107とで表現
して符号化する際、適応符号帳12を用いて生成された
適応符号ベクトルと、雑音符号帳13を用いて生成され
た雑音符号ベクトルとから駆動音源信号107を生成す
る音声符号化システムにおいて、適応符号帳12に格納
された過去の駆動音源ベクトルから切り出したベクトル
103に所定の窓長で窓処理を行って生成した単位ベク
トルを入力音声信号101のピッチ周期で並べ、ピッチ
周期化された適応符号ベクトル106を生成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声符号化/復号化
方法に係り、特に適応符号ベクトルおよび雑音符号ベク
トルの生成方法に関する。
【0002】
【従来の技術】音声信号の高能率符号化方式として、入
力音声信号をフレームと呼ばれる5〜20ms程度の一
定間隔の区間に分割し、このフレーム単位に分割された
入力音声信号を、声道をモデル化した合成フィルタと合
成フィルタの入力に当たる駆動音源信号とで表現して符
号化する方法が知られている。
【0003】このような音声符号化方法の中で、特に駆
動音源信号をピッチ周期に対応する周期成分とそれ以外
の成分とに分離して符号化する方法があり、CELP(C
ELP:Code Excited Linear Prediction Coding)と呼ばれ
る符号駆動線形予測符号化がその代表的な方法である。
CELP音声符号化の詳細については、M.R.Schroeder
and B.S.Atal“Code-Exicited Linear Prediction(CEL
P):Highquality Speechat Very Low Bit Rates”,Proc.
ICASSP‘85,25.1.1,pp.937-940,1985 に述べられてい
る。
【0004】CELP音声符号化システムは、図10に
示すように構成される。まず、入力音声信号100が5
〜20ms程度の一定間隔のフレーム単位に分割されて
入力される。このフレーム単位の入力音声信号100は
線形予測分析部10に入力され、その周波数スペクトル
の包絡形状を表す線形予測係数101が計算される。線
形予測係数101は線形予測係数符号化部11により符
号化された後、合成フィルタ19にフィルタ係数102
として与えられる。また、線形予測係数101は聴感重
み付けフィルタ21にも供給され、重み付け音声信号1
10を求めるために利用される。
【0005】線形予測係数101の符号化の後、ピッチ
周期の探索が行われる。この際、まず切り出し適応符号
ベクトル生成部25において、音声のピッチ周期成分を
符号化するための適応符号ベクトル106が生成され
る。
【0006】切り出し適応符号ベクトル生成部25から
の適応符号ベクトル106と、雑音符号帳12からの雑
音符号ベクトル104は、ゲイン乗算部16,17によ
りゲイン符号帳14から与えられるゲインが乗じられた
後、加算部18で加算され、合成フィルタ19を駆動す
るための駆動音源信号107が生成される。合成フィル
タ19は、駆動音源信号107を入力して合成音声信号
108を生成する。
【0007】合成音声信号108は減算器20に入力さ
れ、入力音声信号100に対する合成音声信号108の
誤差信号109が求められる。この誤差信号109は聴
感重み付けフィルタ21に入力され、この聴感重み付け
フィルタ21から重み付け音声信号110が出力され
る。この重み付け音声信号110は歪み計算部22に入
力され、ここで入力音声信号100に対する合成音声信
号108の聴感重み付け歪み111が計算で求められ
る。
【0008】ここで、図11および図12を用いて切り
出し適応符号ベクトル生成部25について説明する。切
り出し適応符号ベクトル生成部25では、切り出し部3
0により適応符号帳12に格納されている過去の駆動音
源ベクトル103から、ピッチ周期情報120で示され
るピッチ周期Lに相当する長さの単位ベクトル125が
切り出され、この単位ベクトル125がピッチ周期Lの
整数i倍(i=1,2,…,n)の遅延時間を持つ遅延
器33−1〜33−nでピッチ周期Lずつ順次シフトさ
れた後、ベクトル長がフレーム長Nになるように加算部
34で重ね合わせられることにより、適応符号ベクトル
106が生成される。単位ベクトル125とは、駆動音
源ベクトルから切り出された、繰り返しが行われる単位
のベクトルを指す。
【0009】このように従来のCELP音声符号化シス
テムでは、適応符号ベクトル106の連続性を考慮せず
に、駆動音源信号のピッチ周期化を行っている。このた
め、ピッチ周期が変化すると適応符号ベクトル106は
不連続なものになり、結果として合成音声の音質が劣化
する。また、適応符号ベクトル106に接続歪みが生じ
ていると、この歪みを削減するような雑音符号ベクトル
が雑音符号帳13から選択され、やはり合成音声の音質
が劣化してしまうといった問題もある。
【0010】一方、雑音符号帳からの雑音符号ベクトル
を適応符号帳から求められたピッチ周期で周期化し、適
応符号帳では表現しきれなかったピッチ周期性を効率的
に符号化する方法がPSI−CELP音声符号化システ
ムとして提案されている。このPSI−CELP音声符
号化の詳細については、例えば、三樹、守谷、間野、大
室:“ピッチ同期雑音励振源をもつCELP符号化(PSI
-CELP)”、信学論(A),J77-A.3,pp.314-324,1994 に述べ
られている。
【0011】PSI−CELP音声符号化システムは、
図13に示すように図10に示したCELP音声符号化
システムに、雑音符号帳13からの雑音符号ベクトル1
04を適応符号帳12から求められたピッチ周期で周期
化した雑音符号ベクトル113を生成する切り出し雑音
符号ベクトル生成部26が追加された構成となってい
る。
【0012】ここで、図14および図15を用いて切り
出し雑音符号ベクトル生成部26について説明する。切
り出し雑音符号ベクトル生成部26では、切り出し部5
0により雑音符号帳13からの雑音ベクトル104か
ら、ピッチ周期情報220で示されるピッチ周期Lに相
当する長さの単位ベクトルが切り出され、この単位ベク
トルが遅延器53−1〜53−nでピッチ周期Lずつ順
次シフトされた後、ベクトル長がフレーム長Nになるよ
うに加算部54で重ね合わせられることにより、ピッチ
周期化された雑音符号ベクトル113が生成される。
【0013】このように従来のPSI−CELP音声符
号化システムにおいても、雑音符号ベクトルが生成され
る際、雑音ベクトルの連続性が考慮されないので、駆動
音源信号が不連続なものとなり、合成音声の音質が劣化
する。
【0014】
【発明が解決しようとする課題】上述したように従来の
CELP方式、PSI−CELP方式などの音声符号化
システムでは、ピッチ周期が変化すると適応符号帳の駆
動音源ベクトルのピッチ周期化や雑音符号帳の符号ベク
トルのピッチ周期化に伴う接続歪みが生じ、合成音声の
音質が劣化するという問題点があった。
【0015】本発明は、このような問題点を解消し、合
成フィルタを駆動する駆動音源信号の不連続性を緩和さ
せて復号音声の品質向上を達成する音声符号化/復号化
方法を提供することを目的とする。
【0016】
【課題を解決するための手段】上記の課題を解決するた
め、本発明に係る音声符号化/復号化方法は、適応符号
帳や雑音符号帳に格納されたベクトルから切り出したベ
クトルに窓処理を行って生成した単位ベクトルをピッチ
周期で並べたものを適応符号ベクトルや雑音符号ベクト
ルとして駆動音源信号を生成することを骨子としてい
る。
【0017】すなわち、フレーム単位で入力される音声
信号を少なくとも合成フィルタと該合成フィルタを駆動
するための駆動音源信号とで表現して符号化する音声符
号化方法であって、過去の駆動音源ベクトルを格納した
適応符号帳を用いて生成された適応符号ベクトルと、雑
音符号帳を用いて生成された雑音符号ベクトルとから駆
動音源信号を生成する音声符号化方法において、適応符
号帳に格納された過去の駆動音源ベクトルから切り出し
たベクトルに所定の窓長で窓処理を行って生成した単位
ベクトルを音声信号のピッチ周期で並べることにより、
適応符号ベクトルを生成することを特徴とする。
【0018】また、この音声符号化方法に対応して、合
成フィルタに駆動音源信号を入力してフレーム単位の音
声信号を復号化する音声復号化方法であって、過去の駆
動音源ベクトルを格納した適応符号帳を用いて生成され
た適応符号ベクトルと、雑音符号帳を用いて生成された
雑音符号ベクトルとから駆動音源信号を生成する音声復
号化方法において、適応符号帳に格納された過去の駆動
音源ベクトルから切り出したベクトルに所定の窓長で窓
処理を行って生成した単位ベクトルを音声信号のピッチ
周期で並べることにより、適応符号ベクトルを生成する
ことを特徴とする。
【0019】このように窓処理を行った後に、適応符号
化ベクトルのピッチ周期化を行うことで、ピッチ周期が
変化しても不連続のない滑らかな適応符号ベクトルを生
成することができるため、復号音声の音質を向上させる
ことができる。
【0020】さらに、フレーム単位で入力される音声信
号を少なくとも合成フィルタと該合成フィルタを駆動す
るための駆動音源信号とで表現して符号化する音声符号
化方法であって、過去の駆動音源ベクトルを格納した適
応符号帳を用いて生成された適応符号ベクトルと、雑音
符号帳を用いて生成された雑音符号ベクトルとから駆動
音源信号を生成する音声符号化方法において、雑音符号
帳に格納されたベクトルから切り出したベクトルに所定
の窓長で窓処理を行って生成した単位ベクトルを音声信
号のピッチ周期で並べることにより、雑音符号ベクトル
を生成することを特徴とする。
【0021】また、この音声符号化方法に対応して、合
成フィルタに駆動音源信号を入力してフレーム単位の音
声信号を復号化する音声復号化方法であって、過去の駆
動音源ベクトルを格納した適応符号帳を用いて生成され
た適応符号ベクトルと、雑音符号ベクトルを格納した雑
音符号帳を用いて生成された雑音符号ベクトルとで駆動
音源信号を生成する音声復号化方法において、雑音符号
帳に格納されたベクトルから切り出したベクトルに所定
の窓長で窓処理を行って生成した単位ベクトルを音声信
号のピッチ周期で並べることにより、雑音符号ベクトル
を生成することを特徴とする。
【0022】このように窓処理を行った後に、雑音符号
化ベクトルのピッチ周期化を行うことで、ピッチ周期が
変化しても不連続のない滑らかな雑音符号ベクトルを生
成することができるため、復号音声の音質を向上させる
ことができる。
【0023】また、ピッチ周期化を適応符号ベクトルと
雑音符号ベクトルの両方に行えば、これら両方の符号ベ
クトルのピッチ周期に対する不連続がなくなるため、復
号音声の音質はさらに向上する。
【0024】本発明においては、窓処理における窓長を
音声信号の現フレームのピッチ周期よりも長くすること
により、単位ベクトルを重ね合わせてピッチ周期化され
た適応符号ベクトルや雑音符号ベクトルを生成でき、こ
れら適応符号ベクトルや雑音符号ベクトルの不連続が削
減されるため、復号音声の音質のさらなる向上が期待で
きる。
【0025】さらに、本発明によると窓処理における窓
長を音声信号の現フレームのピッチ周期よりも長くする
ことにより、ピッチ周期が急激に変化した場合でも、適
応符号ベクトルや雑音符号ベクトルに不連続が生じるこ
とがなく、復号音声の音質劣化が防止される。
【0026】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。 (第1の実施形態)まず、本発明の第1の実施形態に係
る音声符号化方法および音声復号化方法について、符号
化側および復号化側に分けて順次説明する。
【0027】[符号化側について]図1に、本実施形態
に係る音声符号化方法を適用した音声符号化システムの
構成を示す。この音声符号化システムは、図10に示し
た従来のCELP音声符号化システムにおける切り出し
適応符号ベクトル生成部25を窓処理適応符号ベクトル
生成部15に置き換えた構成となっている。
【0028】すなわち、本実施形態に係る音声符号化シ
ステムは、線形予測分析部10、線形予測係数符号化部
11、過去の駆動音源ベクトルを格納し、音声のピッチ
周期成分を符号化するための適応符号帳12、音声のピ
ッチ周期以外の成分を符号化するための雑音符号帳1
3、雑音符号ベクトル104と適応符号ベクトル106
に与えるゲインを符号化するためのゲイン符号ベクトル
を格納したゲイン符号帳14、適応符号帳12に格納さ
れた過去の駆動音源ベクトルから音声のピッチ周期成分
を表す適応符号ベクトル106を生成する窓処理適応符
号ベクトル生成部15、ゲイン乗算部16,17、加算
部18、合成フィルタ19、減算器20、聴感重み付け
フィルタ21、歪み計算部22およびマルチプレクサ2
3から構成されている。
【0029】この音声符号化システムでは、まず入力音
声信号100が5〜20ms程度の一定間隔のフレーム
単位に分割されて入力される。このフレーム単位の入力
音声信号100は線形予測分析部10に入力され、その
周波数スペクトルの包絡形状を表す線形予測係数101
が計算される。線形予測係数101は線形予測係数符号
化部11により符号化された後、合成フィルタ19にフ
ィルタ係数102として与えられる。また、線形予測係
数101は聴感重み付けフィルタ21にも供給され、重
み付け音声信号110を求めるために利用される。
【0030】線形予測係数101の符号化の後、ピッチ
周期の探索が行われる。この際、まず窓処理適応符号ベ
クトル生成部15において、音声のピッチ周期成分を符
号化するための適応符号ベクトル106が生成される。
【0031】窓処理適応符号ベクトル生成部15からの
適応符号ベクトル106と、雑音符号帳12からの雑音
符号ベクトル104は、ゲイン乗算部16,17により
ゲイン符号帳14から与えられるゲインが乗じられた
後、加算部18で加算され、合成フィルタ19を駆動す
るための駆動音源信号107が生成される。合成フィル
タ19は、駆動音源信号107を入力して合成音声信号
108を生成する。
【0032】合成音声信号108は減算器20に入力さ
れ、入力音声信号100に対する合成音声信号108の
誤差信号109が求められる。この誤差信号109は聴
感重み付けフィルタ21に入力され、この聴感重み付け
フィルタ21から重み付け音声信号110が出力され
る。この重み付け音声信号110は歪み計算部22に入
力され、ここで入力音声信号100に対する合成音声信
号108の聴感重み付け歪み111が計算で求められ
る。
【0033】次に、図2を用いて本実施形態の特徴的な
部分である窓処理適応符号ベクトル生成部15の構成と
動作について説明する。窓処理適応符号ベクトル生成部
15は、図2に示すように適応符号帳12に格納されて
いる過去の駆動音源ベクトル103から現フレームのピ
ッチ周期Lに相当する長さのベクトルを切り出す切り出
し部30と、窓処理を行う際の時間窓121を計算する
窓関数計算部31と、切り出し部30により切り出され
たベクトルに窓処理を行う窓処理部32と、窓処理され
たベクトル(以下、これを単位ベクトルと呼ぶ)123
をピッチ周期Lずつ順次シフトして並べて重ね合わせた
ベクトル124を生成する遅延器33−1〜33−nお
よび加算部34と、ベクトル124からフレーム長に相
当する長さを切り出し、ピッチ周期化された適応符号ベ
クトル106として取り出す適応符号ベクトル切り出し
部35とから構成されている。
【0034】この窓処理適応符号ベクトル生成部15の
動作は、以下の通りである。まず、切り出し部30にお
いて、適応符号帳12に格納されている過去の駆動音源
ベクトル103から、窓関数計算部31で求められた時
間窓121と同じ長さのベクトルが切り出される。一
方、窓関数計算部31において、予め設定された複数の
ピッチ周期候補の中から任意に選び出された、ピッチ周
期情報120で与えられる現フレームのピッチ周期Lに
対応する時間窓121が計算により求められる。次に、
窓処理部32において駆動音源ベクトル103から切り
出されたベクトルに対し、窓関数計算部31で求められ
た時間窓121による窓処理が行われ、単位ベクトル1
23が生成される。さらに、こうして生成された単位ベ
クトル123を現フレームのピッチ周期Lの整数i倍
(i=1,2,…,n)の遅延時間がそれぞれ設定され
た遅延器33−1〜33−nによりピッチ周期Lずつ順
次シフトした後、ベクトル長が2L+Nよりも長くなる
ように加算部34で並べて重ね合わせることにより、新
たなベクトル124が生成される。最後に、適応符号ベ
クトル切り出し部35において、このベクトル124の
最初のLに相当する時間後からフレーム長Nの部分が切
り出され、その切り出されたベクトルがピッチ周期化さ
れた適応符号ベクトル106となる。
【0035】次に、図3を参照して時間窓121として
窓長Wがピッチ周期Lの2倍の長さであるようなハニン
グ窓を用いた場合を例にとって、窓処理適応符号ベクト
ル生成部15の動作を詳細に説明する。ハニング窓は次
式(1)で定義される。ただし、Wは窓長であり、この
例ではW=2Lである。
【0036】
【数1】
【0037】まず、ピッチ周期をL、フレーム長をNと
する。適応符号帳12に格納されている過去の駆動音源
ベクトル103のうち、ピッチ周期Lの2倍の長さ2L
の直前のベクトルを切り出し、このベクトルに対して窓
長が2Lであるハニング窓で窓処理を施して、長さ2L
の単位ベクトル123を生成する。
【0038】次に、この単位ベクトル123をピッチ周
期Lずつ順次シフトして、つまり遅延しない単位ベクト
ル123および時間L,2L,…nL(図3ではn=
3)遅延した単位ベクトルをベクトル全体の長さが2L
+Nよりも長くなるまで並べて重ね合わせることによ
り、新たなベクトル124を生成する。こうして単位ベ
クトル123の重ね合わせによって生成されたベクトル
124の時間Lからフレーム長Nだけ切り出してきたベ
クトルがピッチ周期Lに対応したピッチ周期化された適
応符号ベクトル106となる。
【0039】なお、この例では窓長Wおよび単位ベクト
ル123の長さ2Lがいずれもピッチ周期Lよりも大き
いため、図のようにピッチ周期Lずつシフトして並べた
ベクトル124において、元の単位ベクトルの重なり合
う部分が生じているが、必ずしも単位ベクトルが重なり
合うとは限らない。例えば、窓長Wおよび単位ベクトル
の長さがピッチ周期Lよりも小さいときは、重なり合う
部分は生じない。要するに、単位ベクトルをピッチ周期
Lの単位で順次シフトして並べればよい。
【0040】上述した適応符号ベクトル106の生成方
法は、全てのピッチ周期Lに対して適用してもよいし、
特定のピッチ周期に対して、例えば、ピッチ周期Lがフ
レーム長Nより小さいときのみ適用してもよい。このよ
うにして生成された適応符号ベクトル106は、ピッチ
周期Lが変化している場合でも、ピッチ周期化による接
続歪みがなく滑らかなものとなり、合成音声の音質が大
きく改善される。
【0041】また、上記の説明では窓処理部32での窓
処理に用いられる窓としてハニング窓を用いたが、これ
に限られるものでなく、例えばハミング窓や、式(2)
で定義(Wは窓長)されるような窓を用いてもよく、ピ
ッチ周期化による接続歪みが少なくなるような窓であれ
ば、いかなるものでも構わない。
【0042】
【数2】
【0043】また、上記の説明では窓長Wを現フレーム
のピッチ周期Lの2倍としたが、これに限られず、現フ
レームのピッチ周期より長くすればよく、ピッチ周期化
による接続歪みが少なくなるような任意の長さに設定す
ることができるい。さらに、窓長Wを現フレームのピッ
チ周期より長くする代わりに、前フレームのピッチ周期
より長くする(例えば前フレームのピッチ周期の2倍に
する)ようにしても構わない。
【0044】さらに、窓関数計算部31で予め複数種類
の窓を用意しておき、ピッチ周期Lに応じて窓の種類を
切り替えるようにすることも可能である。図1に戻って
説明を続ける。上述のようにして窓処理適応符号ベクト
ル生成部15で生成されたピッチ周期Lに対応する適応
符号ベクトル106は、ゲイン乗算部16および加算部
18を経て駆動音源信号107として合成フィルタ19
に入力され、合成音声信号108が生成される。そし
て、入力音声信号100に対する合成音声信号108の
誤差信号109が減算部20で求められ、さらに聴感重
み付けフィルタ21で処理されて重み付け音声信号11
0が生成される。この重み付け音声信号110は歪み計
算部22に供給され、聴感重み付け歪み111が計算さ
れる。この処理が予め定められたピッチ周期候補全てに
対して行われ、聴感重み付け歪み111を最小にする値
がピッチ周期として選択される。こうして、適応符号帳
12の探索が行われる。
【0045】次に、雑音符号帳13の探索が行われる。
この場合、先に求められたピッチ周期に対応する適応符
号ベクトル106と、雑音符号帳13から選択された雑
音符号ベクトル104にゲイン乗算部16,17でゲイ
ンを乗じて加算部18で加算して得られた駆動音源信号
107により合成フィルタ19が駆動され、生成された
合成音声信号108の入力音声信号100に対する聴感
重み付け歪み111が計算される。この処理が雑音符号
帳13にある全ての符号ベクトルに対して行われ、聴感
重み付け歪み111を最小にする符号ベクトルが雑音符
号ベクトル104として選択される。
【0046】一方、ゲイン符号帳14の探索について
は、上述したピッチ周期探索および雑音符号帳探索時に
は聴感重み付け歪み111が最小となるような最適ゲイ
ンが用いられ、また実際の符号化時には、ピッチ周期探
索および雑音符号帳探索で求められた適応符号ベクトル
106および雑音符号ベクトル104を用いて生成され
る合成音声信号108の入力音声信号100に対する聴
感重み付け歪み111を最小にするような値がゲイン符
号帳14から選択される。
【0047】そして、線形予測係数符号化部11で線形
予測係数を符号化して得られた線形予測係数符号帳の符
号ベクトルのインデックス(線形予測係数インデック
ス)Aが線形予測係数符号化部11からマルチプレクサ
23に入力されると共に、線形予測分析残差波形を符号
化して得られた適応符号帳12の符号ベクトルのインデ
ックス(適応符号ベクトルインデックス)Bと、雑音符
号帳13の符号ベクトルのインデックス(雑音符号ベク
トルインデックス)C、およびゲイン符号帳14のイン
デックス(ゲインインデックス)Dが歪み計算部22か
らマルチプレクサ23に入力される。
【0048】マルチプレクサ23では、入力されたイン
デックスA,B,C,Dから符号化ビットストリーム1
12が生成され、この符号化ビットストリーム112が
伝送路または蓄積媒体を経て復号化側に伝送される。
【0049】[復号化側について]図4に、本実施形態
に係る音声復号化方法を適用した音声符号化システムの
構成を示す。本実施形態の音声符号化システムは、図1
に示した音声符号化システムに対応しており、この音声
符号化システムとほぼ逆の処理を行って、復号音声信号
を生成する。
【0050】すなわち、本実施形態に係る音声復号化シ
ステムは、入力される符号化ビットストリーム212か
ら各インデックスを分離生成するデマルチプレクサ4
0、線形予測係数復号化部41、過去の駆動音源ベクト
ルを格納し、音声のピッチ周期成分を符号化するための
適応符号帳42、音声のピッチ周期以外の成分を符号化
するための雑音符号帳43、適応符号ベクトル206と
雑音符号ベクトル204に与えるゲインを符号化するた
めのゲイン符号ベクトルを格納したゲイン符号帳44、
適応符号帳42に格納された駆動音源ベクトルから音声
のピッチ周期成分を表す適応符号ベクトル106を生成
する窓処理適応符号ベクトル生成部45、ゲイン乗算部
46,47、加算部48および合成フィルタ49から構
成されている。
【0051】この音声復号化システムでは、図1に示し
た音声符号化システムから出力される符号化ビットスト
リーム112が伝送路または蓄積媒体を介した後、符号
化ビットストリーム212としてデマルチプレクサ40
に入力される。デマルチプレクサ40では、入力された
符号化ビットストリーム212から線形予測係数インデ
ックスA、適応符号ベクトルインデックスB、雑音符号
ベクトルインデックスC、およびゲインインデックスD
が分離生成される。
【0052】これらのインデックスA,B,C,Dのう
ち、線形予測係数インデックスAは線形予測係数復号部
41に、適応符号ベクトルインデックスBは適応符号帳
42に、雑音符号ベクトルインデックスCは雑音符号帳
に43、ゲインインデックスDはゲイン符号帳44にそ
れぞれ入力される。
【0053】線形予測係数復号部41では、入力された
線形予測係数インデックスAから線形予測係数が復号さ
れ、これが合成フィルタ49にフィルタ係数201とし
て与えられる。
【0054】また、適応符号ベクトルインデックスBに
従って適応符号帳42から選択された適応符号ベクトル
203が窓処理適応符号ベクトル生成部45に入力され
る。窓処理適応符号ベクトル生成部45では、図1の音
声符号化システムにおける窓処理適応符号ベクトル生成
部15と同様の処理が行われ、窓処理適応符号ベクトル
206が出力される。窓処理適応符号ベクトル生成部4
5の構成と動作は、図1に示した音声符号化システム内
の窓処理適応符号ベクトル生成部15と全く同様である
ため、説明を省略する。
【0055】また、雑音符号ベクトルインデックスCに
従って雑音符号帳43から雑音符号ベクトル204が選
択され出力される。さらに、ゲインインデックスDに従
ってゲイン符号帳44から窓処理適応符号ベクトル20
6および雑音符号ベクトル204に乗じるべきゲイン2
05が求められる。このゲイン205がゲイン乗算部4
6,47で窓処理適応符号ベクトル206および雑音符
号ベクトル204に乗じられた後、加算部48で足し合
わされることによって復号残差波形信号が生成され、こ
れが駆動音源信号207として合成フィルタ49および
適応符号帳42に入力される。
【0056】そして、線形予測係数復号部41で復号さ
れた線形予測係数により決定されたフィルタ数201が
与えられた合成フィルタ49が駆動音源信号207によ
り駆動され、復号音声信号200が生成される。なお、
合成フィルタ49の出力に対してポストフィルタなどの
後処理を行って、最終的な復号音声信号を得るようにし
ても構わない。
【0057】(第2の実施形態)次に、本発明の第2の
実施形態に係る音声符号化方法および音声復号化方法に
ついて、符号化側および復号化側に分けて順次説明す
る。
【0058】[符号化側について]図5に、本実施形態
に係る音声符号化方法を適用した音声符号化システムの
構成を示す。図1と同一部分に同一符号を付して説明す
ると、本実施形態の音声符号化システムは、図1に示し
た第1の実施形態の音声符号化システムに、周期化され
た雑音符号ベクトル113を生成する窓処理雑音符号ベ
クトル生成部24が追加された構成であり、いわば図1
3で説明したPSI−CELP音声符号化システムを改
良した構成となっている。
【0059】以下、図6を用いて窓処理雑音符号ベクト
ル生成部24の構成と動作についてを説明する。窓処理
雑音符号ベクトル生成部24は、図6に示すように雑音
符号帳13に格納されている雑音符号ベクトル104か
ら現フレームのピッチ周期Lに相当する長さのベクトル
を切り出す切り出し部50と、窓処理を行う際の時間窓
221を計算する窓関数計算部51と、切り出し部50
により切り出されたベクトルに窓処理を行う窓処理部5
2と、窓処理されたベクトル(以下、これを単位ベクト
ルと呼ぶ)223をピッチ周期Lずつ順次シフトして並
べて足し合わせたベクトル224を生成する遅延器53
−1〜53−nおよび加算部54と、ベクトル224か
らフレーム長に相当する長さを切り出し、ピッチ周期化
された雑音符号ベクトル113として取り出す雑音符号
ベクトル切り出し部55とから構成されている。
【0060】この窓処理雑音符号ベクトル生成部24の
動作は以下の通りである。まず、窓関数計算部51にお
いて適応符号帳12の探索で求められた、ピッチ周期情
報220で与えられるピッチ周期Lに基づいた時間窓2
21が計算により求められる。次に、切り出し部50に
おいて雑音符号帳13に格納されている符号ベクトル1
04から窓関数計算部51で求められた時間窓221と
同じ長さのベクトルが切り出される。次に、窓処理部5
2において、雑音符号帳13から切り出されたベクトル
205に窓関数計算部51で求められた時間窓221に
よる窓処理が行われ、単位ベクトル223が生成され
る。さらに、こうして生成された単位ベクトル223を
現フレームのピッチ周期Lの整数i倍(i=1,2,
…,n)の遅延時間がそれぞれ設定された遅延器53−
1〜53−nによりピッチ周期Lずつ順次シフトした
後、ベクトル長が2L+Nよりも長くなるまで加算部5
4で並べて重ね合わせることにより、新たなベクトル2
24が生成される。最後に、雑音符号ベクトル切り出し
部55において、このベクトル224の最初のLに相当
する時間後からフレーム長Nの部分が切り出され、その
切り出されたベクトルがピッチ周期化された雑音符号ベ
クトル113となる。
【0061】次に、図7を参照して時間窓221として
窓長Wがピッチ周期Lの2倍の長さであるようなハニン
グ窓を用いた場合を例にとって説明する。適応符号帳1
2の探索によって得られたピッチ周期がLであるとき、
雑音符号帳13に格納されているベクトル104から、
ピッチ周期Lの2倍の長さのベクトルを切り出し、この
ベクトルに対して窓長が2Lであるハニング窓で窓処理
を施して、長さ2Lの単位ベクトル223を生成する。
【0062】次に、この単位ベクトル223をピッチ周
期Lずつ順次シフトして、つまり遅延しない単位ベクト
ル123および時間L,2L,…nL(図7ではn=
3)遅延した単位ベクトルをベクトル全体の長さが2L
+Nよりも長くなるまで並べて重ね合わせることによ
り、新たなベクトル224を生成する。こうして単位ベ
クトル223の重ね合わせによって生成されたベクトル
224の時間Lからフレーム長Nだけ切り出してきたベ
クトルがピッチ周期Lに対応して周期化された雑音符号
ベクトル113となる。
【0063】上述した周期化された雑音符号ベクトル1
13の生成方法は、全てのピッチ周期Lに対して適用し
てもよいし、特定のピッチ周期に対して、例えば、ピッ
チ周期Lがフレーム長Nより小さいときのみ適用しても
よい。このようにして生成された雑音符号ベクトル11
3は、ピッチ周期Lが変化している場合でも、ピッチ周
期化による接続歪みがなく滑らかなものとなり、合成音
声の音質が大きく改善される。
【0064】また、上記の説明では窓処理部52での窓
処理に用いられる窓としてハニング窓を用いたが、これ
に限られるものでなく、例えばハミング窓や、式(2)
で定義(Wは窓長)されるような窓を用いてもよく、ピ
ッチ周期化による接続歪みが少なくなるような窓であれ
ば、いかなるものでも構わない。義されるような窓を用
いても良く、ピッチ周期化による接続歪みが少なくなる
ような窓であればいかなるものでも構わない。
【0065】また、上記の説明では窓長Wを現フレーム
のピッチ周期Lの2倍としたが、これに限られず、現フ
レームのピッチ周期より長くすればよく、ピッチ周期化
による接続歪みが少なくなるような任意の長さに設定す
ることができるい。さらに、窓長Wを現フレームのピッ
チ周期より長くする代わりに、前フレームのピッチ周期
より長くする(例えば前フレームのピッチ周期の2倍に
する)ようにしても構わない。
【0066】例えば、ピッチ周期Lに等しい窓長を持
ち、式(3)で定義されるような窓の中央部から両端に
かけて減衰する形状の窓を用いることもできる。但し、
Wは窓長であり、この例ではW=Lである。
【0067】
【数3】
【0068】このような窓を用いて、周期化された雑音
符号ベクトルを生成する例を図8に示す。図8では、雑
音符号帳13から切り出された単位ベクトル223はベ
クトルの長さがLであり、この単位ベクトル223を重
ね合わせずにピッチ周期Lで繰り返すことで、周期化さ
れた雑音符号ベクト113ルを生成している。また、窓
のピークと雑音符号帳13に格納されているベクトル1
04のピークを合わせて単位ベクトル223の切り出し
を行うことによって、単位ベクトル223の接続部の不
連続を和らげるだけでなく、単位ベクトル223のピー
ク付近のパワーを強調することができ、ピークの強調さ
れた雑音符号ベクトルを生成することができる。
【0069】さらに、窓関数計算部51で予め複数種類
の窓を用意しておき、ピッチ周期Lに応じて窓の種類を
切り替えるようにすることも可能である。なお、ここで
述べた雑音符号ベクトル生成方法は、図5の構成の音声
符号化方式に限らず、雑音符号帳の符号ベクトルのピッ
チ周期化を行う全ての音声符号化方式に適用することが
できる。
【0070】[復号化側について]図9に、本実施形態
に係る音声復号化方法を適用した音声符号化システムの
構成を示す。本実施形態の音声符号化システムは、図5
に示した音声符号化システムに対応しており、この音声
符号化システムとほぼ逆の処理を行って、復号音声信号
を生成する。図4と同一部分に同一符号を付して説明す
ると、本実施形態の音声復号化システムは、図4に示し
た第1の実施形態の音声復号化システムに、雑音符号イ
ンデックスCに従って雑音符号帳43から選択された雑
音符号ベクトル204から周期化された雑音符号ベクト
ル213を生成する窓処理雑音符号ベクトル生成部56
が追加された構成となっている。
【0071】窓処理雑音符号ベクトル生成部56の構成
と動作は、図5に示した音声符号化システム内の窓処理
雑音符号ベクトル生成部24と全く同様であるため、説
明を省略する。そして、この窓処理雑音符号ベクトル生
成部56から出力される周期化された雑音符号ベクトル
213がゲイン乗算部47においてゲインが乗じられた
後、ゲイン乗算部46でゲインが乗ぜられた適応符号ベ
クトル206と加算部48で加算され、合成フィルタ4
9への駆動音源信号207となる。
【0072】
【発明の効果】以上詳述したように、本発明によれば、
適応符号帳や雑音符号帳から切り出したベクトルに窓処
理を行った後に、適応符号化ベクトルや雑音符号ベクト
ルのピッチ周期化を行うことで、ピッチ周期が変化して
も不連続のない滑らかな適応符号ベクトルや雑音符号ベ
クトルを生成することができるため、合成フィルタを駆
動する駆動音源信号の不連続性を緩和させ、復号音声の
品質を向上させることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る音声符号化シス
テムの構成を示す図
【図2】同第1の実施形態における窓処理適応符号ベク
トル生成部の構成を示す図
【図3】同第1の実施形態における窓処理適応符号ベク
トル生成部の動作を示す図
【図4】同第1の実施形態に係る音声復号化システムの
構成を示す図
【図5】本発明の第2の実施形態に係る音声符号化シス
テムの構成を示す図
【図6】同第2の実施形態における窓処理適応符号ベク
トル生成部の構成を示す図
【図7】同第2の実施形態における窓処理雑音符号ベク
トル生成部の動作を示す図
【図8】同第2の実施形態における窓処理雑音符号ベク
トル生成部の動作を示す図
【図9】同第2の実施形態に係る音声復号化システムの
構成を示す図
【図10】従来のCELP音声符号化システムの構成を
示す図
【図11】図10における切り出し適応符号ベクトル生
成部の構成を示す図
【図12】図11の切り出し適応符号ベクトル生成部の
動作を示す図
【図13】従来のPSI−CELP音声符号化システム
の構成を示す図
【図14】図13における切り出し雑音符号ベクトル生
成部の構成を示す図
【図15】図14の切り出し雑音符号ベクトル生成部の
動作を示す図
【符号の説明】
10…線形予測分析部 11…線形予測計数符号化部 12…適応符号帳 13…雑音符号帳 14…ゲイン符号帳 15…窓処理適応符号ベクトル生成部 16,17…ゲイン乗算部 18…加算部 19…合成フィルタ 20…減算器 21…聴感重み付けフィルタ 22…歪み計算部 23…マルチプレクサ 24…窓処理雑音符号ベクトル生成部 41…線形予測係数復号部 42…適応符号帳 43…雑音符号帳 44…ゲイン符号帳 45…窓処理適応符号ベクトル生成部 46,47…ゲイン乗算部 48…加算部 49…合成フィルタ 56…窓処理雑音符号ベクトル生成部 100…入力音声信号 101…線形予測係数 102…フィルタ係数 103…適応符号ベクトル 104…雑音符号ベクトル 105…ゲイン符号ベクトル 106…周期化された適応符号ベクトル 107…駆動音源信号 108…合成音声信号 109…誤差信号 110…重み付け音声信号 111…聴感重み付き歪み 112…符号化ビットストリーム 113…周期化された雑音符号ベクトル 120…ピッチ周期情報 121…時間窓 123…単位ベクトル 124…ピッチ周期で並べたベクトル 200…復号音声信号 201…線形予測係数 203…適応符号ベクトル 204…雑音符号ベクトル 205…ゲイン符号ベクトル 206…周期化された適応符号ベクトル 207…駆動音源信号 212…符号化ビットストリーム 213…周期化された雑音符号ベクトル 220…ピッチ周期情報 221…時間窓 223…単位ベクトル 224…ピッチ周期で並べたベクトル

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】フレーム単位で入力される音声信号を少な
    くとも合成フィルタと該合成フィルタを駆動するための
    駆動音源信号とで表現して符号化する音声符号化方法で
    あって、過去の駆動音源ベクトルを格納した適応符号帳
    を用いて生成された適応符号ベクトルと、雑音符号帳を
    用いて生成された雑音符号ベクトルとから前記駆動音源
    信号を生成する音声符号化方法において、 前記適応符号帳に格納された過去の駆動音源ベクトルか
    ら切り出したベクトルに所定の窓長で窓処理を行って生
    成した単位ベクトルを前記音声信号のピッチ周期で並べ
    ることにより、前記適応符号ベクトルを生成することを
    特徴とする音声符号化方法。
  2. 【請求項2】フレーム単位で入力される音声信号を少な
    くとも合成フィルタと該合成フィルタを駆動するための
    駆動音源信号とで表現して符号化する音声符号化方法で
    あって、過去の駆動音源ベクトルを格納した適応符号帳
    を用いて生成された適応符号ベクトルと、雑音符号帳を
    用いて生成された雑音符号ベクトルとから前記駆動音源
    信号を生成する音声符号化方法において、 前記雑音符号帳に格納されたベクトルから切り出したベ
    クトルに所定の窓長で窓処理を行って生成した単位ベク
    トルを前記音声信号のピッチ周期で並べることにより、
    前記雑音符号ベクトルを生成することを特徴とする音声
    符号化方法。
  3. 【請求項3】フレーム単位で入力される音声信号を少な
    くとも合成フィルタと該合成フィルタを駆動するための
    駆動音源信号とで表現して符号化する音声符号化方法で
    あって、過去の駆動音源ベクトルを格納した適応符号帳
    を用いて生成された適応符号ベクトルと、雑音符号帳を
    用いて生成された雑音符号ベクトルとから前記駆動音源
    信号を生成する音声符号化方法において、 前記適応符号帳に格納された過去の駆動音源ベクトルか
    ら切り出したベクトルに所定の窓長で窓処理を行って生
    成した単位ベクトルを前記音声信号のピッチ周期で並べ
    ることにより、前記適応符号ベクトルを生成し、 前記雑音符号帳に格納されたベクトルから切り出したベ
    クトルに所定の窓長で窓処理を行って生成した単位ベク
    トルを前記音声信号のピッチ周期で並べることにより、
    前記雑音符号ベクトルを生成することを特徴とする音声
    符号化方法。
  4. 【請求項4】前記窓処理における窓長を前記音声信号の
    現フレームのピッチ周期よりも長くすることを特徴とす
    る請求項1〜3のいずれか1項記載の音声符号化方法。
  5. 【請求項5】前記窓処理における窓長を前記音声信号の
    前フレームのピッチ周期よりも長くすることを特徴とす
    る請求項1〜3のいずれか1項記載の音声符号化方法。
  6. 【請求項6】合成フィルタに駆動音源信号を入力してフ
    レーム単位の音声信号を復号化する音声復号化方法であ
    って、過去の駆動音源ベクトルを格納した適応符号帳を
    用いて生成された適応符号ベクトルと、雑音符号帳を用
    いて生成された雑音符号ベクトルとから前記駆動音源信
    号を生成する音声復号化方法において、 さらに、前記適応符号帳に格納された過去の駆動音源ベ
    クトルから切り出したベクトルに所定の窓長で窓処理を
    行って生成した単位ベクトルを前記音声信号のピッチ周
    期で並べることにより、前記適応符号ベクトルを生成す
    ることを特徴とする音声復号化方法。
  7. 【請求項7】合成フィルタに駆動音源信号を入力してフ
    レーム単位の音声信号を復号化する音声復号化方法であ
    って、過去の駆動音源ベクトルを格納した適応符号帳を
    用いて生成された適応符号ベクトルと、雑音符号帳を用
    いて生成された雑音符号ベクトルとで前記駆動音源信号
    を生成する音声復号化方法において、 前記雑音符号帳に格納されたベクトルから切り出したベ
    クトルに所定の窓長で窓処理を行って生成した単位ベク
    トルを前記音声信号のピッチ周期で並べることにより、
    前記雑音符号ベクトルを生成することを特徴とする音声
    復号化方法。
  8. 【請求項8】合成フィルタに駆動音源信号を入力してフ
    レーム単位の音声信号を復号化する音声復号化方法であ
    って、過去の駆動音源ベクトルを格納した適応符号帳を
    用いて生成された適応符号ベクトルと、雑音符号帳を用
    いて生成された雑音符号ベクトルとから前記駆動音源信
    号を生成する音声復号化方法において、 前記適応符号帳に格納された過去の駆動音源ベクトルか
    ら切り出したベクトルに所定の窓長で窓処理を行って生
    成した単位ベクトルを前記音声信号のピッチ周期で並べ
    ることにより、前記適応符号ベクトルを生成し、 さらに、前記雑音符号帳に格納されたベクトルから切り
    出したベクトルに所定の窓長で窓処理を行って生成した
    単位ベクトルを前記音声信号のピッチ周期で並べること
    により、前記雑音符号ベクトルを生成することを特徴と
    する音声復号化方法。
  9. 【請求項9】前記窓処理における窓長を前記音声信号の
    現フレームのピッチ周期よりも長くすることを特徴とす
    る請求項6〜8のいずれか1項記載の音声復号化方法。
  10. 【請求項10】前記窓処理における窓長を前記音声信号
    の前フレームのピッチ周期よりも長くすることを特徴と
    する請求項6〜8のいずれか1項記載の音声復号化方
    法。
JP07387898A 1998-03-23 1998-03-23 音声符号化/復号化方法 Expired - Fee Related JP3576794B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07387898A JP3576794B2 (ja) 1998-03-23 1998-03-23 音声符号化/復号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07387898A JP3576794B2 (ja) 1998-03-23 1998-03-23 音声符号化/復号化方法

Publications (2)

Publication Number Publication Date
JPH11272296A true JPH11272296A (ja) 1999-10-08
JP3576794B2 JP3576794B2 (ja) 2004-10-13

Family

ID=13530913

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07387898A Expired - Fee Related JP3576794B2 (ja) 1998-03-23 1998-03-23 音声符号化/復号化方法

Country Status (1)

Country Link
JP (1) JP3576794B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012048154A (ja) * 2010-08-30 2012-03-08 Toshiba Corp 音声合成装置、音声合成方法およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012048154A (ja) * 2010-08-30 2012-03-08 Toshiba Corp 音声合成装置、音声合成方法およびプログラム

Also Published As

Publication number Publication date
JP3576794B2 (ja) 2004-10-13

Similar Documents

Publication Publication Date Title
US7149683B2 (en) Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
KR101513184B1 (ko) 계층적 디코딩 구조에서의 디지털 오디오 신호의 송신 에러에 대한 은닉
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JPH0353300A (ja) 音声符号化装置
JP2008502022A (ja) オーディオ符号化
US6768978B2 (en) Speech coding/decoding method and apparatus
JP2003337600A (ja) 音声符号化復号方式間の符号変換方法および装置とその記憶媒体
JP3558031B2 (ja) 音声復号化装置
WO2002071394A1 (en) Sound encoding apparatus and method, and sound decoding apparatus and method
JPH10268898A (ja) 音声・楽音符号化及び復号化装置
JP3268750B2 (ja) 音声合成方法及びシステム
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JPH11272296A (ja) 音声符号化/復号化方法
JP3559485B2 (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
JP2968109B2 (ja) コード励振線形予測符号化器及び復号化器
JP3088204B2 (ja) コード励振線形予測符号化装置及び復号化装置
JPH0258100A (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JP3593839B2 (ja) ベクトルサーチ方法
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3299099B2 (ja) 音声符号化装置
JP3232701B2 (ja) 音声符号化方法
JP2004151424A (ja) トランスコーダ及び符号変換方法
JP2853170B2 (ja) 音声符号化復号化方式

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040706

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040708

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080716

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090716

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090716

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100716

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110716

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120716

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees