JPH0284700A - 音声符号化復号化装置 - Google Patents

音声符号化復号化装置

Info

Publication number
JPH0284700A
JPH0284700A JP63237727A JP23772788A JPH0284700A JP H0284700 A JPH0284700 A JP H0284700A JP 63237727 A JP63237727 A JP 63237727A JP 23772788 A JP23772788 A JP 23772788A JP H0284700 A JPH0284700 A JP H0284700A
Authority
JP
Japan
Prior art keywords
circuit
frame
pitch
signal
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63237727A
Other languages
English (en)
Other versions
JP2992998B2 (ja
Inventor
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63237727A priority Critical patent/JP2992998B2/ja
Priority to DE68912692T priority patent/DE68912692T2/de
Priority to US07/410,459 priority patent/US5018200A/en
Priority to CA000612254A priority patent/CA1333425C/en
Priority to EP89117463A priority patent/EP0360265B1/en
Publication of JPH0284700A publication Critical patent/JPH0284700A/ja
Application granted granted Critical
Publication of JP2992998B2 publication Critical patent/JP2992998B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声信号を低いビットレート、特に4゜8kb
/s程度で、比較的すくない演算量により高品質に符号
化するための音声符号化復号化装置に関する。
(従来の技術) 音声信号を4.8kb/s程度の低いビットレートで符
号化する方式としては、例えば特願昭59−27243
5(文献1)や特願昭6O−178911(文献2)等
に記載されているピッチ補間マルチパルス法が知られて
いる。この方法では、送信側では、フレーム毎の音声信
号がら音声信号のスペクトル特性を表すスペクトルパラ
メータとピッチを表すピッチパラメータを抽出し、音声
信号を有声区間と無声区間との2種類に分類し、有声区
間では1フレームの音源信号を、17レームをピッチ区
間毎に分割した複数個のピッチ区間のうちの一つのピッ
チ区間(代表区間)についてマルチパルスで表し、代表
区間におけるマルチパルスの振幅、位置とスペクトル、
ピッチパラメータを伝送する。また、無声区間では1フ
レームの音源を少数のマルチパルスと雑音信号で表しマ
ルチパルスの振幅、位置と雑音信号のゲイン、インデク
スを伝送する。受信側では、有声区間では、現フレーム
の代表区間のマルチパルスと隣接フレームの代表区間の
マルチパルスとを用いてマルチパルス同志の振幅と位置
を補間して代表区間以外のピッチ区間のマルチパルスを
復元しフレームの駆動音源信号を復元する。また、無声
区間ではマルチパルスと雑音信号のインデクス、ゲイン
を用いてフレームの駆動音源信号を復元する。さらに、
復元した駆動音源信号を、スペクトルパラメータを用い
た合成フィルタに入力して谷成音声信号を出力する。
(発明が解決しようとする問題点) しかしながら、上述した従来方式では、有声区間では代
表区間のマルチパルス同志の補間によりフレームの駆動
音源信号を復元しているので、母音連鎖のように母音か
ら母音へ遷移する部分や有声の過渡部など、音源信号の
特性が変化しているフレームでは、補間により復元した
駆動音源信号は実際の音源信号とは大きく異なり、その
結果合成音声の音質が劣化していた。また、有声区間で
も鼻音区間では、音源信号に明確な周期性が現れないの
で、前記ピッチ補間の方法では良好に音源信号を表すこ
とができなかった。一方、このように音声の特性が大き
く変化する部分は、音韻知覚や自然性の知覚に非常に重
要であることが知覚実験から知られているが、従来方式
ではこれらの部分の情報が十分に復元できないので音質
が劣化するという大きな問題点があった。また、無声区
間ではマルチパルスと雑音を用いて音源信号を表してい
るが、子音区間でも摩擦音は音源は雑音性となるが、破
裂音ではパルス的な部分が多くなるため、従来方式のよ
うに、音声信号を単純に有声と無声との2種に分類して
表しているのみでは、良好な合成音声が得られないとい
う問題点があった。
本発明の目的は、上述した問題点を解決し、比較的少な
い演算量により4.8kb/s程度で音質の良好な音声
符号化復号化装置を提供することにある。
(問題点を解決するための手段) 本発明による音声符号化装置は、入力した離散的な音声
信号からスペクトル包絡を表すスペクトルパラメータと
ピッチを表すピッチパラメータをフレーム毎に抽出し符
号化するパラメータ計算回路と、前記音声信号の特徴を
表すパラメータを抽出して前記音声信号を複数個の種類
に分類する判別回路と、前記判別回路の出力に応じて前
記フレーム毎の音声信号の音源信号として前記フレーム
区間を前記ピッチパラメータに応じた小区間に分割し前
記小区間の内の1つの小区間のマルチパルスと前記マル
チパルスに関して振幅あるいは位相の少なくとも一方を
補正するための補正情報もしくはコードブックとマルチ
パルスの少なくとも一方を求めて符号化する音源信号計
算回路と、前記パラメータ計算回路の出力符号と前記判
別回路の出力符号と、前記音源信号計算回路の出力符号
とを組み合せて出力するマルチプレクサ回路とを有する
ことを特徴とする特 本発明による音声復号化装置は、スペクトルパラメータ
を表す符号とピッチパラメータを表す符号と音源信号を
表す符号と判別信号を表す符号とを人力し分離して復号
化するデマルチプレクサ回路と、前記復号化した判別信
号に応じてフレームを前記復号したピッチパラメータに
応じた小区間に分割し1つの小区間についてマルチパル
スを発生し他のピッチ区間においては前記マルチパルス
の振幅あるいは位相の少なくとも一方を補正する補正情
報を用いてマルチパルスを発生させて前記フレームの駆
動音源信号を復元するかもしくはコードブックとマルチ
パルスの少なくとも一方を用いて前記フレームの駆動音
源信号を復元する駆動音源信号復元回路と、前記駆動音
源信号と前記復号したスペクトルパラメータとを用いて
合成音声を求め出力する合成フィルタとを有することを
特徴とする。
(作用) 本発明による音声符号化復号化装置は、フレームの音声
信号を予め定められた種類に分類する。
以下では、−例として母音性、鼻音性、摩擦性、破裂性
の4種に分類する例について述べるが、この種類は音声
生成上の違いに応じて音源信号を良好に表せるように適
切に選択する必要がある。
まず、音声信号の特徴を表すパラメータを抽出して第2
図のように音声信号を分類する。このパラメータとして
は、例えば信号のパワあるいはRMS、短時間(例えば
5m5)毎のパワの変化あるいは変化率、短時間毎のス
ペクトル変化あるいは変化率、ピッチゲインなどを用い
ることができる。
まず、信号のパワあるいはRMSとピッチゲインなどを
用いて母音区間か否かを判別する。母音性区間では、第
3図にしめすように、フレーム区間をあらかじめ求めた
ピッチ周期毎の複数個のピッチ区間に分割し、前記ピッ
チ区間のうちの1つのピッチ区間(代表区間)について
マルチパルスを求める。
次に同一フレーム内の他のピッチ区間については前記マ
ルチパルスに対する振幅補正係数ck、位相補正係数d
k!求める。そしてフレーム毎に、音源情報として代表
区間のフレーム内のピッチ位置、代表区間のマルチパル
スの振幅、位置と同一フレームの他のピッチ区間におけ
る振幅補正係数Ck、位相補正係数dke補正情報とし
て伝送する。代表区間は、最も良好な合成音声信号が求
められる区間を探索l〜で求めてもよいし、フレーム内
で固定としてもよい。音質は前者の方が良好であるが、
演算量は多くなる。
以下で振幅補正係数ck、位相補正係数d−求め方、代
表区間の探索法を示す。今、フレームで求めた平均ピッ
チ周期をTとする。フレームをT毎のサブフレーム区間
に分割した様子を第3図(a)に示す。ここでは代表区
間を探索する場合について示す。代表区間の候補となる
サブフレームを例えばサブフレーム■とする。サブフレ
ーム■についてあらかじめ定められた個数りのマルチパ
ルスの振幅、位置を求める。マルチパルスの求め方につ
いては、相互相関関数Φ8.と自己相関関数Rh該用い
て求める方法が知られており、これが例えば前記文献1
,2や、Araseki、 Ozawa、 Ono、 
0cihai氏による“Multi−pulese E
xcited 5peech Coder Ba5ed
 onMaximum    Cross−corre
lation    SearchAlgorithm
、”(GLOBECOM 83. IEEE Glob
al Tele−communications Co
nfereence、講演番号23.3.1983X文
献3)に記載されているのでここでは説明を省略する。
代表区間のマルチパルスの振幅、位置をそれぞれgil
mi(i=1〜L)とする。これを第3図(b)に示す
代表区間以外の区間kにおける振幅補正係数ck、位相
補正係数d、は、これらと合成フィルタをもちいて区間
kについて合成した合成音声X、(D、)と、該当区間
の音声x、(n)との重みずけ誤差電力Ekt最小化す
るように求めることができる。重みずけ誤差電力Ekは E、=Σ([xk(n)−xB、(n)]*w(n))
2(1)ただし x、(n)=ckΣg、−h(n−m、−T−dk) 
    (2)ユニで、w(n)は聴感重みずけフィル
タのインパルス応答を示す。ただしこのフィルタはなく
てもよい。またh(n)は音声を合成するための合成フ
ィルタのインパルス応答を示す。ck、 dB、は(1
)式を最小化するように求めることができる。このため
には例えばまずdkを固定して、(1)式をCkについ
て偏微分して0とおき、次式を得る。
ここで Xwk(n)=x、(n)中w(n)        
                  (4a)XWk
(n)=ΣgH・h(n−m、−T−dk)*w(n)
    (4b)従って(3)式の値を種々のd、の値
について求め、(3)式のckを最小化するdk、ck
の組合せを求めることニヨリ(1)式のE、は最小化さ
れる。このようにして、代表区間以外のピッチ区間に対
してc、 dke求めフレーム全体に対して次式で定義
される重みすけ誤差電力Eを求める。
E=ΣE、                (5)こ
こでNは該肖フレームに含まれるサブフレームの個数で
ある。ただし、代表ピッチ区間(第3図の例ではサブフ
レーム区間■)の重みずけ誤差電力E2は次式で求める
E2=Σ([X(n)−Σg、−h(n −mr)]*
w(n)F    (6)代表ピッチ区間の探索は、全
ての代表ピッチ区間の候補について、(1)〜(6)式
の値を計算し、(5)式の誤差電力の値を最も小さくす
る区間を代表ピッチ区間とすることができる。第3図(
c)に探索後の代表ピッチ区間がサブフレーム■であっ
た場合について、代表区間のマルチパルスと、代表区間
以外のに番目の区間(第3図(c)ではに=1.2,4
.5)の音源vh(n)を振幅、位相補正係数を用いて
次式に従い発生させた例を示す。
■、(n)=ckΣgi・δ(n rnt−T−di)
      (7)次に、鼻音区間では母音区間はど音
源のピッチ毎の周期性が強くないと予想されるので、上
述の方法ではなく、ピッチ予測マルチパルスやマルチパ
ルスにより音源を表す。ここでピッチ予測マルチパルス
の求め方としては、特願昭59−13(文献4)を参照
することができる。また、マルチパルスの求め方は前記
文献3を参照できる。なお、鼻音区間の判別法は、例え
ばパワあるいはRMS、ピッチゲイン、次式で定義され
る第1次の対数断面積比r、を用いることができる。特
に鼻音区間ではrlが大きくなる特徴がある。
ユニでに1は1次回のにパラメータ(PARCORとも
呼ぶ)である。
一方、子音区間では音源をマルチパルス、あるいはマル
チパルスと雑音の組合せで表している。
子音区間では、摩擦性か破裂性かを判別し、摩擦性の場
合はマルチパルスと雑音あるいはコードブックで音源を
表す。具体的な方法は前記文献2等を参照できる。また
、破裂性の場合は、音源をマルチパルスで表す。摩擦性
と破裂性の判別法としては、短時間(例えば5m5)毎
のパワ、低域と高域のパワの比あるいはRMSの変化や
変化率などのパラメータを用いることができる。
(実施例) 第1図(a)、 (b)は本発明による音声符号化復号
化装置の実施例を示すブロック図である。第1図(a)
は送信側、第1図(b)に受信側を示している。
送信側では、入力端子100から音声信号を入力し、1
フレ一ム分(例えば20m5)音声信号をバッファメモ
リ110に格納する。ピッチ分析回路130は、フレー
ムの音声信号から平均ピッチ周期Tを計算する。この方
法としては例えば自己相関法にもとづく方法が知られて
おり、詳細は前記文献1,2のピッチ抽出回路を参照す
ることができる。また、この方法以外にも他の衆知な方
法(例えば、ケプストラム法、5IFT法、変相開法な
ど)を用いることができる。ピッチ符号化回路150は
平均ピッチ周期Tをあらかじめ定められたビット数で量
子化して得た符号をマルチプレクサ260へ出力すると
ともに、これを復号化して得た復号ピッチ周期T′を音
源信号計算回路220、補間回路282、駆動信号復元
回路283へ出力する。
K/(ラメータ計算回路140は、フレームの音声信号
のスペクトル特性を表すパラメータとして、Kパラメー
タを前記フレームの音声信号から衆知のLPC分析を行
いあらかじめ定められた次数Mだけ計算する。この具体
的な計算法については前記文献1゜2のにパラメータ計
算回路を参照することができる。なお、Kパラメータは
PARCOR係数と同一のものである。Kパラメータ符
号化回路160は前記にパラメータを予め定められた量
子化ビット数で量子化して得た符号量をマルチプレクサ
260へ出力するとともに、これを復号化してさらに線
形予測係数a、’(i = 1〜M)に変換して重みす
け回路200、補間回路282へ出力する。Kパラメー
タの符号化、Kパラメータから線形予測係数への変換方
法については前記文献1.2等を参照することができる
インパルス応答計算回路170は、前記線形予測係数a
ilを用いて聴感重みずけを行った合成フィルタのイン
パルス応答−(n)を計算しこれを自己相関関数計算回
路180へ出力する。自己相関関数計算回路180は前
記インパルス応答の自己相関関数Rhh(n)を予め定
められた遅れ時間まで計算して出力する。
インパルス応答計算回路170、自己相関関数計算回路
180の動作は前記文献1,2等を参照することができ
る。
減算器190は、フレームの音声信号x(n)から合成
フィルタ281の出力を1フレーム分減算し減算結果を
重みずけ回路200へ出力する。重みずけ回路200は
前記減算結果をインパルス応答w(n)で表される聴感
重みずけフィルタに通し重みずけ信号xW(n)を得て
これを出力する。重みずけの方法は前記文献1,2等を
参照できる。
相互相関関数計算回路210は、xw(n)とhw(n
)を入力して相互相関関数φ8.を予め定められた遅れ
時間まで計算し出力する。この計算法は前記文献1,2
等を参照できる。
判別回路215は、フレームの音声信号の種類を判別す
る。ここでは−例として作用の項で述べたように、母音
性、鼻音性、摩擦性、破裂性の4種に分類することにす
るが、分類数は4種に限られるわけではなく、他の分類
法を用いることもできる。これらの判別には、作用の項
で述べたように、フレームの音声信号のパワやRMS、
ピッチゲイン、短時間毎のパワあるいはRMSの変化、
フレーム間のスペクトル変化などを用いることができる
。これらのパラメータを用いて判別した種類は音源信号
計算回路220、マルチプレクサ260へ出力される。
音源信号計算回路220では、母音性の判別は、パワあ
るいはRMSが予め定められたしきい値以上でピンチゲ
インが予め定められたしきい値以上であることで判別す
る。この場合は、前記作用の項で説明したように、復号
化した平均ピッチ周期T′を用いてフレームをあらかじ
めピッチ周期毎のサブフレーム(ピッチ区間)に分割し
、音源信号として、代表的な1ピッチ区間(代表区間)
の候補となるいくつかのピッチ区間に対してマルチパル
スの位置四と振幅g、を求める。
次に振幅、位相補正回路270は、前記作用の項の(3
)、(4)式に従い、他のピッチ区間kにおける音源信
号発生のためのマルチパルスの振幅補正係数ck、位相
補正係数dkG計算する。さらにこれらの値を音源信号
計算回路220へ出力し、音源信号計算回路220では
前記作用の項で述べた(1)、 (5ル(6)式に基づ
き、いくつかの候補区間についてフレーム全体の誤差電
力Eを計算し、Eを最も小さくするピッチ区間を代表区
間として選択し、代表区間のサブフレーム番号を示す情
報P1、代表区間のマルチパルスの振幅gt、位置m1
(i=1〜L)、及び他の区間の振幅補正係数ck、位
相補正係数dkI出力する。
次に鼻音性の判別は、ピッチゲインがあらかじめ定めら
れたしきい値よりも大きく、1人目の対数断面積比が予
め定められたしきい値よりも大きいことで判別する。こ
の場合は、フレーム区間全体に対して、例えばマルチパ
ルスを求める。
一方、子音区間では、摩擦性と破裂性の判別は例えば、
短時間(例えば5m5)毎のスペクトルの変化や短時間
(例えば5ms程度)毎のパワあるいはRMSの変化が
予め定められたしきい値よりも大きければ破裂性、そう
でなければ摩擦性と判別する。摩擦性の判別には、低減
(例えば1kHz以下)と高域(例えば2kHz以上)
のパワあるいはRMSの比を用いることもできる。
摩擦性の場合は、予め定められた個数のマルチパルスと
雑音信号あるいはコードブックで音源信号を表す。具体
的な方法は前記文献1,2を参照することができる。ま
ずあらかじめ定められた個数のマルチパルスを求めた後
に、雑音メモリに複数種類格納されている雑音信号ある
いはコードブックの種類を表すインデクスとゲインを求
める。これらの計算はフレームを予め定められた区間長
に分割したサブフレーム毎に行う。この場合音源信号と
して伝送するのは、マルチパルスの振幅、位置と雑音信
号のインデスとゲインである。
また、破裂性の場合は、フレーム全体で予め定められた
個数のマルチパルスの振幅と位置を求める。
符号化回路230は、母音性の場合、代表区間のマルチ
パルスの振幅gt、位置miを予め定められたビット数
で符号化して出力する。また、代表区間のサブフレーム
位置を示す情報P0、振幅補正係数ck、位相補正係数
dk&予め定められたビット数で符号化してマルチプレ
クサ260へ出力する。さらに、これらを復号化して駆
動信号復元回路283へ出力する。鼻音性、破裂性の場
合はマルチパルスの振幅、位置を符号化してマルチプレ
クサ260へ出力するとともに復号化して駆動音源復元
回路283へ出力する。また摩擦性の場合は、マルチパ
ルスの振幅、位置を符号化し雑音信号のゲイン、インデ
クスを符号化してマルチプレクサ260へ出力しこれら
を復号化して駆動音源復元回路283へ出力する。
駆動音源復元回路283は、母音性区間では、平均ピッ
チ周期T′を用いてフレームを前記音源信号計算回路2
20と同様な方法で分割し、代表区間のサブフレーム位
置を示す情報P1、代表区間のマルチパルスの復号化さ
れた振幅、位置を用いて、代表区間ではマルチパルスを
発生し、代表区間以外のピッチ区間では、前記代表区間
のマルチパルスと復号化された振幅補正係数、復号化さ
れた位相補正係数を用いて、前記(7)式に従い音源信
号vi(n)を復元する。
一方、鼻音性、破裂性、摩擦性区間では、マルチパルス
を発生させる。摩擦性区間ではさらに雑音信号のインデ
クスを用いて雑音メモリ225から雑音信号をアクセス
してそれにゲインを乗じて駆動音源信号を復元する。摩
擦性区間での駆動音源信号復元の詳細は前記文献2を参
照することができる。
補間回路282は、母音性区間では、線形予測係数を一
旦にパラメータに変換してにパラメータ上でピッチ周期
T′のサブフレーム区間毎に補間し、線形予測係数に逆
変換し出力する。なお、補間はにパラメータ上のみなら
ず他の衆知なパラメータ、例えば対数断面積比なと、を
用いることができる。鼻音性や子音区間では補間はおこ
なわない。
合成フィルタ281は、前記復元された駆動音源信号を
人力し、前記線形予測係数へ′を入力して1フレ一ム分
の合成音声信号を求めるとともに、次のフレームへの影
響信号を1フレーム分計算しこれを減算器190へ出力
する。なお、影響信号の計算法は特願昭57−2316
05(文献5)等を参照できる。
マルチプレクサ260は、音源信号を表す符号、フレー
ムの音声の種類を表す符号、母音性区間では代表区間の
サブフレーム位置を表す符号、平均ピッチ周期を表す符
号、Kパラメータを表す符号を組み合せて出力する。
以上で本発明の詳細な説明を終える。
受信側では、第1図(b)のデマルチプレクサ290は
前記組み合わされた符号を入力し、音源信号を表す符号
、フレームの音声信号を表す符号、母音性区間では代表
区間のサブフレーム位置を表す符号、平均ピッチ周期の
符号、Kパラメータを表す符号を分離して出力する。
音源復号回路300は音源信号を表す符号を復号して駆
動信号復元回路340へ出力する。、ピッチ復号回路3
20は平均ピッチ周期を復号して駆動信号復元回路34
0と補間回路335へ出力する。復号回路315は、振
幅補正係数、位相補正係数を表す符号を入力しこれらを
復号して出力する。また代表区間のサブフレーム位置を
表す符号を復号して出力する。さらにフレームの音声信
号の種類を表す符号を復号して出力する。
にパラメータ復号回路330はにパラメータを表す符号
を復号して補間回路335へ出力する。
駆動信号復元回路340は、復号したマルチパルス音源
情報の他に、音声信号の種類を表す情報、前記情報が母
音性の場合は復号化した平均ピッチ周期、復号化した振
幅補正係数、復号化した位相補正係数、復号化した代表
区間のサブフレーム位置を入力する。一方、前記情報が
鼻音性、摩擦性、破裂性の場合は、それぞれ予め定めら
れた個数のマルチパルス音源情報を入力する。さらに摩
擦性の場合は、マルチパルス音源情報の他に雑音信号の
インデクス、ゲインを人力する。そして駆動信号復元回
路340は、送信側の駆動信号復元回路283と同一の
動作を行い1フレームの駆動音源信号を復元して出力す
る。また、雑音メモリ310は送信側の雑音メモリ22
5と同一の構成となっている。
補間回路335は、送信側の補間回路282と同一の動
作を行い補間した線形予測係数へ”を出力する。
合成フィルタ350は、復元したフレームの駆動音源信
号と線形予測係数a、lを入力して1フレ一ム分の合成
音声in)を計算して端子360を通して出力する。こ
こで合成フィルタの動作は、前記文献5の合成フィルタ
を参照できる。
以上で本発明の詳細な説明を終える。
上述した実施例はあくまで本発明の一構成に過ぎずその
変形例も種々考えられる。
例えば、前記実施例では、摩擦性区間では音源信号を少
数のマルチパルスと雑音信号で表したが、これは衆知の
5tochastic codingの方法により表す
こともできる。この方法の詳細については、例えば5c
hroeder、 Ata1氏による“Code−ex
cited 1inearprediction (C
ELP): High Quality 5peech
 at very lowbit rates、” (
ICASSP、 937−940.1985X文献6)
等を参照できる。さらに、雑音メモリ225.310に
格納されている雑音信号の求めとしては、あらかじめ定
められた確率密度特性(例えばガウス分布など)を有す
る白色雑音信号を格納しておいてもよいし、予め多量の
音声信号を予測して求めた予測残差信号から学習により
計算しておいてもよい。前者の方法は前記文献6を参照
できる。また後者の方法につぃては、例えば、Makh
ou1氏らによる”VectorQuntizatio
n in 5peech Coding、”(Proc
、 IEEE、 vol、 73゜11、1551−1
588.1958X文献7)等を参照できる。
また、実施例ではフレームの音声信号を母音性、鼻音性
、摩擦性、破裂英の4種に分類して異なる音源信号を用
いたが、この分類数を変えてもよい。
また、実施例では、スペクトルパラメータとしてにパラ
メータを符号化し、その分析法としてLPG分析を用い
たが、スペクトルパラメータとしては他の衆知なパラメ
ータ、例えばLSP、 LPCケプストラム、ケプスト
ラム、改良ケプストラム、一般化ケプスドラム、メルケ
ブストラムなどを用いることもできる。また各パラメー
タに最適な分析法を用いることができる。
また補間回路282.335における補間すべきパラメ
ータ及びその補間法については、他の衆知な方法を用い
ることができる。具体的な補間法は、例えばAta1氏
らによる“5peech Analysis and 
5ynthesisby Linear Predic
tion of 5peech Wave”と題した論
文(J、 Acoust、 Soc、 Am、、 pp
、 637−655.1971)(文献8)等を参照で
きる。
さらに、母音区間では、代表区間以外のピッチ区間では
、振幅補正係数C2と位相補正係数dk7r求めて伝送
したが、復号化した平均ピッチ周期T′を隣接のピッチ
周期を用いてピッチ区間毎に補間することにより位相補
正係数を伝送しない構成とすることもできる。また振幅
補正係数はピッチ区間毎に伝送するのではなくてピッチ
区間毎に求めた振幅補正係数の値を最小2乗曲線あるい
は最小2乗直線で近似して、前記曲線あるいは直線の係
数を伝送するような構成にしてもよい。これらの方法は
任意の組合せにより用いることができる。これらの構成
により補正情報の伝送のための情報量を低減することが
できる。
また位相補正係数として、例えばOno、 Ozawa
氏らによる“2.4kbps Pitch Predi
ction Multi−pulseSpeech C
oding”と題した論文(Proc、 ICASSP
 S4.9゜1988X文献9)に記載されているよう
に、フレームの端で線形位相項Iを求め、これを各ピッ
チ区間に分配し、ピッチ区間毎には位相補正係数を求め
ない構成とすることもできる。
また、演算量を大幅に低減するために、母音区間では、
代表区間をフレーム内の予め定められた区間に固定しく
例えば、フレームのほぼ中央のピッチ区間や、フレーム
内でパワの最も大きいピッチ区間など)、代表区間の探
索をしない構成としてもよい。この場合は、代表区間の
候補区間に対する(5)、 (6)式の計算が不要とな
り大幅な演算量低減が可能となるが音質は低下する。
また、さらに演算量を低減するために、送信側では影響
信号の計算を省略することもできる。これによって、送
信側における駆動信号復元回路283、補間回路282
、合成フィルタ281、減算器190は不要となり演算
量低減が可能となるが、やはり音質は低下する。
また受信側で合成フィルタ350の後ろに、量子化雑音
を整形することにより聴覚的にきき易くなるために、ピ
ッチとスペクトル包絡の少なくとも1つについて動作す
る適応形ポストフィルタを付加してもよい。適応型ポス
トフィルタの構成については、例えば、Krooa氏ら
による’A C1ass of Analysis−b
y−synthesis Predictive Co
ders for High QualitySpee
ch Codinj at Rates betwee
n 4.8 and 16kb/s、 ”(IEE J
SAC,vol、 6.2.353−3631988X
文献10)等を参照できる。
なお、デジタル信号処理の分野でよく知られているよう
に、自己相関関数は周波数軸上でパワスペクトルに、相
互相関関数はクロスパワスペクトルに対応しているので
、これらから計算することもできる。これらの計算法に
ついては、Oppenheim氏らによる“Digit
al Signal Processing”(Pre
ntice−Hall、 1975)と題した単行本(
文献11)を参照できる。
(発明の効果) 以上述べたように本発明によれば、音声信号を音声学的
な特徴に基づきいくつかの種類に分類し、その分類に適
した音源信号を用いていること、特に、母音性区間では
、フレームをピッチ周期に分割したピッチ区間のうち、
1つのピッチ区間(代表区間)のマルチパルスと他のピ
ッチ区間では振幅補正係数、位相補正係数の少なくとも
一方を用いて表していること、摩擦性区間では、少数の
マルチパルスと雑音信号の組合せにより音源信号を表し
ていること、などにより、母音、子音の定常区間はもち
論のこと、音韻知覚や自然性の知覚に重要な音声の特性
が変化している部分(有声の過渡部や母音間の変化部分
)でも音質の劣化のほとんどない合成音声を得ることが
できるという大きな効果がある。
【図面の簡単な説明】
第1図は本発明による音声符号化復号化装置の一実施例
を示すブロック図、第2図は有声フレームでの代表区間
と代表区間のマルチパルス及び振幅補正係数、位相補正
係上を示した説明図、第3図は音声の分類法の一例を示
す図である。 図において 110・・・バッファメモリ、130・・・ピッチ分析
回路、140・・・Kパラメータ計算回路、 150・・・ピッチ符号化回路、160・・・Kパラメ
ータ符号化回路、170・・・インパルス応答計算回路
、180・・・自己相関関数計算回路、215・・・判
別回路、220・・・音源信号計算回路、225.31
0・・・雑音メモリ、230・・・符号化回路、260
・・・マルチプレクサ、270・・・振幅、位相補正係
数計算回路、281、350・・・合成フィルタ、28
2.335・・・補間回路、283、340・・・駆動
信号復元回路、290・・・デマルチプレクサ、300
・・・音源復号回路、315・・・復号回路、320・
・・ピッチ復号回路、330・・・Kパラメータ復号回
路。

Claims (2)

    【特許請求の範囲】
  1. (1)入力した離散的な音声信号からスペクトル包絡を
    表すスペクトルパラメータとピッチを表すピッチパラメ
    ータをフレーム毎に抽出し符号化するパラメータ計算回
    路と、前記音声信号の特徴を表すパラメータを抽出して
    前記音声信号を複数個の種類に分類し符号化する判別回
    路と、前記判別回路の出力に応じて前記フレーム毎の音
    声信号の音源信号として前記フレーム区間を前記ピッチ
    パラメータに応じた小区間に分割し前記小区間の内の1
    つの区間において求めたマルチパルスと前記マルチパル
    スに関して振幅あるいは位相の少なくとも一方を補正す
    るための補正情報もしくはコードブックとマルチパルス
    の少なくとも一方を求めて符号化する音源信号計算回路
    と、前記パラメータ計算回路の出力符号と前記判別回路
    の出力符号と、前記音源信号計算回路の出力符号とを組
    み合せて出力するマルチプレクサ回路とを有することを
    特徴とする音声符号化装置。
  2. (2)スペクトルパラメータを表す符号とピッチパラメ
    ータを表す符号と音源信号を表す符号と判別信号を表す
    符号とを入力し分離して復号化するデマルチプレクサ回
    路と、前記復号化した判別信号に応じてフレームを前記
    復号化したピッチパラメータに応じた小区間に分割し1
    つの小区間についてマルチパルスを発生し他の小区間に
    おいては前記マルチパルスの振幅あるいは位相の少なく
    とも一方を補正する補正情報を用いてマルチパルスを発
    生させて前記フレームの駆動音源信号を復元するかもし
    くは前記判別符号に応じてコードブックとマルチパルス
    の少なくとも一方を用いて前記フレームの駆動音源信号
    を復元する駆動音源信号復元回路と、前記駆動音源信号
    と前記復号化したスペクトルパラメータとを用いて合成
    音声を求め出力する合成フィルタとを有することを特徴
    とする音声復号化装置。
JP63237727A 1988-09-21 1988-09-21 音声符号化復号化装置 Expired - Lifetime JP2992998B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP63237727A JP2992998B2 (ja) 1988-09-21 1988-09-21 音声符号化復号化装置
DE68912692T DE68912692T2 (de) 1988-09-21 1989-09-21 Zur Sprachqualitätsmodifizierung geeignetes Übertragungssystem durch Klassifizierung der Sprachsignale.
US07/410,459 US5018200A (en) 1988-09-21 1989-09-21 Communication system capable of improving a speech quality by classifying speech signals
CA000612254A CA1333425C (en) 1988-09-21 1989-09-21 Communication system capable of improving a speech quality by classifying speech signals
EP89117463A EP0360265B1 (en) 1988-09-21 1989-09-21 Communication system capable of improving a speech quality by classifying speech signals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63237727A JP2992998B2 (ja) 1988-09-21 1988-09-21 音声符号化復号化装置

Publications (2)

Publication Number Publication Date
JPH0284700A true JPH0284700A (ja) 1990-03-26
JP2992998B2 JP2992998B2 (ja) 1999-12-20

Family

ID=17019595

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63237727A Expired - Lifetime JP2992998B2 (ja) 1988-09-21 1988-09-21 音声符号化復号化装置

Country Status (1)

Country Link
JP (1) JP2992998B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5864814A (en) * 1996-12-04 1999-01-26 Justsystem Corp. Voice-generating method and apparatus using discrete voice data for velocity and/or pitch
US5875427A (en) * 1996-12-04 1999-02-23 Justsystem Corp. Voice-generating/document making apparatus voice-generating/document making method and computer-readable medium for storing therein a program having a computer execute voice-generating/document making sequence

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61148500A (ja) * 1984-12-21 1986-07-07 日本電気株式会社 音声信号符号化方法とその装置
JPS6238500A (ja) * 1985-08-13 1987-02-19 日本電気株式会社 高能率音声符号化方式とその装置
JPS63127299A (ja) * 1986-11-17 1988-05-31 日本電気株式会社 音声信号符号化・復号化方式およびその装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61148500A (ja) * 1984-12-21 1986-07-07 日本電気株式会社 音声信号符号化方法とその装置
JPS6238500A (ja) * 1985-08-13 1987-02-19 日本電気株式会社 高能率音声符号化方式とその装置
JPS63127299A (ja) * 1986-11-17 1988-05-31 日本電気株式会社 音声信号符号化・復号化方式およびその装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5864814A (en) * 1996-12-04 1999-01-26 Justsystem Corp. Voice-generating method and apparatus using discrete voice data for velocity and/or pitch
US5875427A (en) * 1996-12-04 1999-02-23 Justsystem Corp. Voice-generating/document making apparatus voice-generating/document making method and computer-readable medium for storing therein a program having a computer execute voice-generating/document making sequence

Also Published As

Publication number Publication date
JP2992998B2 (ja) 1999-12-20

Similar Documents

Publication Publication Date Title
Kleijn Encoding speech using prototype waveforms
EP0718820B1 (en) Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
CN100369112C (zh) 可变速率语音编码
US7664650B2 (en) Speech speed converting device and speech speed converting method
JP3557662B2 (ja) 音声符号化方法及び音声復号化方法、並びに音声符号化装置及び音声復号化装置
JPH0353300A (ja) 音声符号化装置
EP0360265A2 (en) Communication system capable of improving a speech quality by classifying speech signals
JPH1091194A (ja) 音声復号化方法及び装置
WO2002043052A1 (en) Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
JP4040126B2 (ja) 音声復号化方法および装置
US20130218578A1 (en) System and Method for Mixed Codebook Excitation for Speech Coding
JP3308764B2 (ja) 音声符号化装置
JP3179291B2 (ja) 音声符号化装置
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JPH07225599A (ja) 音声の符号化方法
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP2992998B2 (ja) 音声符号化復号化装置
JP3299099B2 (ja) 音声符号化装置
KR0155798B1 (ko) 음성신호 부호화 및 복호화 방법
JP3153075B2 (ja) 音声符号化装置
JP2956068B2 (ja) 音声符号化復号化方式
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JPH02160300A (ja) 音声符号化方式
JPH07168596A (ja) 音声符号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071022

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081022

Year of fee payment: 9

EXPY Cancellation because of completion of term