JP2844589B2 - 音声信号符号化方法とその装置 - Google Patents
音声信号符号化方法とその装置Info
- Publication number
- JP2844589B2 JP2844589B2 JP59269914A JP26991484A JP2844589B2 JP 2844589 B2 JP2844589 B2 JP 2844589B2 JP 59269914 A JP59269914 A JP 59269914A JP 26991484 A JP26991484 A JP 26991484A JP 2844589 B2 JP2844589 B2 JP 2844589B2
- Authority
- JP
- Japan
- Prior art keywords
- circuit
- parameter
- representing
- drive signal
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は音声信号を低いピッチレイトで高品質に符号
化するための音声信号符号化方法とその装置に関する。 (従来技術とその問題点) 音声信号を16Kビット/秒程度以下の伝送情報量で符
号化するための方式として、最近マルチパルス駆動形音
声符号化方式が提案されている。これは、駆動音源信号
系列を表わす複数個のパルス系列(マルチパルス)を、
短時間毎に、符号器側でアナリシス バイ シンセシス
(ANALYS−IS−bY−SYNTHESIS;A−b−S)の手法を用
いて逐次的に求め、このパルス系列を符号化伝送する方
式である。この方式の詳細については、ビー・エス・ア
タール(B.S.ATAL)氏らによるアイ・シー・エー・エス
・エス・ピー(I.C.A.S.S.P.)の予稿集、1982年614〜6
17頁に掲載の論文「ア・ニュー・モデル・オブ・エル・
ピー・シー・エクサイティション・フォー・プロデュー
シング・ナチュラル・サウンディング・スピーチ・アッ
ト・ロウ・ビット・レイツ」(A NEW MODEL OF LPC EXC
ITATION FOR PRODUCING NATURAL−SOUNDING SPEECH AT
LOW BIT RATES)(文献1)に説明されている。 第4図はこの文献1に記載された符号器側の処理を示
すブロック図である。図において、400はA/D変換された
音声信号系列X(n)が入力される符号器入力端子、41
0は音声信号系列を1フレーム(例えば8kHzサンプリン
グの場合でフレーム長を10msecとすると80サンプル)分
蓄積するバッファメモリ回路である。このバッファメモ
リ回路410の出力値は減算器420と、Kパラメータ計算回
路480とに出力される。但し、文献1によればKパラメ
ータのかわりにREFLECTION COEFFICIENTSと記載されて
いるが、これはKパラメータと同一のパラメータであ
る。このKパラメータ計算回路480は、バッファメモリ
回路410の出力値を用い、共分散法に従ってフレーム毎
の音声信号スペクトルを表わすKパラメータKを16次分
(1≦i≦16)求め、これらを合成フィルタ430へ出力
する。440は音源パルス発生回路であり、1フレーム内
にあらかじめ定められた個数のパルス系列を発生させ
る。ここでは、このパルス系列をd(n)と記する。 この音源パルス発生回路440によって発生された音源
パルス系列の一例を、第5図に示す。第5図で横軸は離
散的な時刻を、縦軸は振幅をそれぞれに示す。ここで
は、1フレーム内に8個のパルスを発生させる場合につ
いて示してある。音源パルス発生回路440によって発生
されたパルス系列d(n)は、合成フィルタ430を駆動
する。この合成フィルタ430は、d(n)を入力して音
声信号x(n)に対応する再生信号(n)を求め、こ
れを減算器420へ出力する。ここで合成フィルタ430は、
KパラメータKiを入力し、これらを予測パラメータa
i(1≦i≦16)へ変換し、aiを用いて再生信号
(n)を計算する。(n)は、d(n)とaを用いて
下式のように表わすことができる。 この式でPは合成フィルタの次数を示し、ここではP=
16としている。減算器420は、原信号x(n)と再生信
号(n)との差e(n)を計算して重み付け回路490
へ出力し、重み付け回路490はe(n)を入力し、重み
付け関数w(n)を用いて次式に従って重み付け誤差ew
(n)を計算する。 ew(n)=w(n)*e(n) ……(2) この式で、記号*はたたみこみ積分を表わす。また、重
み付け関数w(n)は、周波数軸上で重み付けを行なう
ものであり、そのZ変換値をW(Z)とすると、合成フ
ィルタの予測パラメータaiを用いて、次式により表わさ
れる。 この式でrは0≦r≦1の定数であり、W(Z)の周波
数特性を決定する。つまり、r=1とすると、W(Z)
=1となり、その周波数特性は平坦となり、r=0とす
ると、W(Z)は合成フィルタの周波数特性の逆特性と
なる。従って、rの値によってW(Z)の特性を変える
ことができる。また、(3)式で示したようにW(Z)
を合成フィルタの周波数特性に依存させて決めているの
は、聴感的なマスク効果を利用しているためである。つ
まり、入力音声信号のスペクトルのパワが大きな箇所で
は(例えばフォルマントの近傍)、再生信号のスペクト
ルとの誤差が少々大きくても、その誤差は耳につき難い
という聴感的な性質による。 第6図はあるフレームにおける入力音声信号のスペク
トルとW(Z)の周波数特性の一例とを示した特性図で
ある。ここではr=0.8とした。図において、横軸は周
波数(最大4kHz)を、縦軸は対数振幅(最大60dB)をそ
れぞれ示す。また、上部の曲線は音声信号のスペクトル
を、下部の曲線は重み付け関数の周波数特性を表わして
いる。 第4図へ戻って、重み付け誤差ew(n)は、誤差最小
化回路450へフィードバックされる。誤差最小化回路450
は、ew(n)の値を1フレーム分記憶し、これらを用い
て次式に従い、重み付け2乗誤差εを計算する。 ここで、Nは2乗誤差を計算するサンプル数を示す。文
献1の方式では、この時間長を5msecとしており、これ
は8kHzサンプリングの場合にはN=40に相当する。 次に、誤差最小化回路450は、この(4)式で計算し
た2乗誤差εを小さくするように音源パルス発生回路44
0に対し、パルス位置及び振幅情報を与え、音源パルス
発生回路440はこの情報に基づいて音源パルス系列を発
生させる。合成フィルタ430は、この音源パルス系列を
駆動源として再生信号(n)を計算する。次に、減算
器420では、先に計算した原信号と再生信号との誤差e
(n)から現在求まった再生信号(n)を減算して、
これを新たな誤差e(n)とする。重み付け回路490は
e(n)を入力し重み付け誤差ew(n)を計算し、これ
を誤差最小化回路450へフィードバックする。誤差最小
化回路450は、再び2乗誤差を計算し、これを小さくす
るように音源パルスの振幅と位置を調整する。こうして
音源パルス系列の発生から誤差最小化による音源パルス
系列の調整までの一連の処理は、音源パルス系列のパル
ス数があらかじめ定められた数に達するまでくり返さ
れ、音源パルス系列が決定される。 この従来の方式の場合、伝送すべき情報は、合成フィ
ルタのパラメータKi(1≦i≦16)と、音源パルス系列
のパルス位置及び振幅であり、1フレーム内にたてるパ
ルスの数によって任意の伝送レイトを実現でいきる。こ
の伝送レイトを16kbps以下とする領域に対しては、良好
な再生音質が得られ有効な方式と考えられる。 しかしながら、この従来方式は、演算量が非常に多い
という欠点がある。これは音源パルス系列におけるパル
スの位置と振幅を計算する際に、そのパルスに基づいて
一旦信号を再生し、原信号と再生信号との誤差及び2乗
誤差を計算し、それらをフィードバックさせて、2乗誤
差を小さくするようにパルス位置と振幅を調整している
ことに起因している。 またこの従来方式によれば、伝送レイトを下げるとピ
ッチ周波数の高い音声の場合、例えば女性話者の音声を
入力した場合には、再生音質が劣化するという欠点があ
った。これは、ピッチ周波数が高い場合には、ピッチ周
波数が低い場合に比べパルスを計算するためのフレーム
により多くのピッチ波形が含まれることになり、このピ
ッチ波形を良好に再生するためには、ピッチ周波数が低
い話者の場合と比べて、より多くの個数の音源パルスを
必要とするという理由による。 (発明の目的) 本発明の目的は、比較的少ない演算量で、低い伝送レ
イトにも適用し得る高品質な音声信号符号化方法とその
装置を提供することにある。 (発明の構成) 本発明の音声信号符号化方法の構成は、送信側では、
離散的な音声信号系列を入力しあらかじめ定められた時
間間隔毎にピッチを表すピッチパラメータと短時間スペ
クトル包絡を表すスペクトルパラメータとを抽出し、前
記音声信号系列を表す駆動信号を前記ピッチに応じて分
割した前記時間間隔よりも短い時間区間のうちの一部区
間について求め前記時間間隔のうちの前記一部区間以外
の区間については前記一部区間から暫定駆動信号を求め
さらに振幅と位置の少なくとも一方の補正量としてあら
かじめ定められた複数個のセットから評価値を最良にす
るものを選択して前記音声信号系列を表す駆動信号を推
定し、前記ピッチパラメータと前記スペクトルパラメー
タと前記駆動信号と前記補正量とを組み合わせて出力
し、受信側では、前記時間間隔毎に前記ピッチパラメー
タと前記スペクトルパラメータと前記駆動信号と前記補
正量とを分離して駆動音源信号を復元し、前記音声信号
系列を再生することを特徴とする。 本発明の音声信号符号化装置の構成は、入力した音声
信号系列からあらかじめ定められた時間間隔毎にピッチ
を表すピッチパラメータと短時間スペクトル包絡を表す
スペクトルパラメータを抽出して出力するパラメータ計
算回路と、前記音声信号系列を表す駆動信号を前記ピッ
チに応じて前記時間間隔よりも短い時間区間に分割し、
前記音声信号系列を表す駆動信号を前記時間区間のうち
の一部区間について求め前記時間間隔のうちの前記一部
区間以外の区間については前記一部区間から暫定駆動信
号を求めさらに振幅と位置の少なくとも一方の補正量と
してあらかじめ定められた複数個のセットから評価値を
最良にするものを選択し、前記駆動信号を表す符号と前
記補正量を表す符号とを出力する駆動信号計算回路と、
前記パラメータ計算回路の出力符号と前記駆動信号計算
回路の出力符号とを組み合わせて出力するマルチプレク
サ回路とを有することを特徴とする。 本発明の音声信号復号化装置の構成は、ピッチパラメ
ータを表す符号とスペクトルパラメータを表す符号と駆
動信号を表す符号と補正量を表す符号とが組み合わされ
た符号系列を入力して分離し復号するデマルチプレクサ
回路と、前記復号されたピッチパラメータと前記復号さ
れた駆動信号と前記復号された補正量をもとに駆動音源
信号を復元する駆動信号復元回路と、前記駆動音源信号
と前記復号されたスペクトルパラメータを用いて音声信
号系列を再生し出力する合成フィルタ回路とを有するこ
とを特徴とする。 (発明の原理) 本発明は、音声信号の周期性を利用して入力音声信号
をピッチ周期毎のサブフレームに分割し、これらサブフ
レームのうち一部のサブフレーム区間に対して前記音声
信号を表わすための駆動パルス列を計算し、残りのサブ
フレーム区間に対しては、前記駆動パルス列をくり返す
かまたは前記駆動パルス列から補間して求めた信号に対
して、振幅または位置あるいは振幅と位置の両方につい
て補正を施すための補正量を求め、ピッチ周期を表わす
ピッチパラメータと、入力音声信号のスペクトル包絡を
表わすスペクトルパラメータと、前記駆動パルス列と、
前記補正量とを伝送し、伝送された情報から音声信号を
合成することを特徴としている。 (実施例) 以下本発明の実施例について図面を参照して詳細に説
明する。 第1図(a),(b)は本発明による音声符号化方式
の符号器側および復号器側の一実施例を示すブロック図
である。第1図(a)において、音声信号系列x(n)
は、入力端子100から入力され、あらかじめ定められサ
ンプル数だけ区切られてバッファメモリ回路100に蓄積
される。次にKパラメータ計算回路140は、バッファメ
モリ回路110に蓄積されている音声信号のうち、あらか
じめ定められたサンプル数を入力し、入力信号のスペク
トル包絡を表わすLPCパラメータを計算する。このLPCパ
ラメータとしては種々知られているが以下ではパーコー
ル係数と同一のパラメータであるKパラメータを用いる
ものとして説明を進める。 このKパラメータの計算法としては代表的な方法とし
て、自己相関法と共分散法とがよく知られているが、こ
こではフィルタの安定性の判別が容易な自己相関法を用
いることにする。尚、この方法の詳細は、ジョン・マク
ホウル(JOHN MAKHOUL)氏らによるアイ・イー・イー・
イー・トランザクションズ・オン・エー・エス・エス・
ピー(IEEE TRANSACTIONS ON A.S.S.P.),1975年6月
号,309〜321頁に掲載の論文「クォンタイゼイション・
プロパティズ・オブ・トランスミッション・パラメター
ズ・イン・リニア・プリディクティブ・システムズ」
(QUANTIZATION PROPERTIES OF TRANSMISSION PARAMETE
RS IN LINEAR PREDICTIVE SYSTEMS)(文献2)等に述
べられているので、ここでは説明を省略する。 第1図(a)に戻って、KパラメータK1はKパラメー
タ符号化回路160へ出力され、Kパラメータ符号化回路1
60は、あらかじめ定められた量子化ビット数に基づいて
Kiを符号化し、符号lKiをマルチプレクサ260へ出力す
る。また、Kパラメータ符号化回路160は、lKiを復号化
して得たKパラメータ復号値Kiを用い文献2に記載の方
法に従い、予測係数値a′iに変換し、インパルス応答
計算回路170と重み付け回路200と合成フィルタ回路250
とへ出力する。 次に、ピッチ分析回路130は、バッファメモリ回路110
の出力である1フレーム分の音声信号を用いてピッチ周
期Pdを計算する。このPdの計算法としては、例えばアー
ル・ブイ・コックス(R.V.COX)氏らによるアイ・イー
・イー・イー・トランザクションズ・オン・エー・エス
・エス・ピー(IEEE TRANSACTIONS ON A.S.S.P)1983年
2月号,258〜272頁に掲載の論文「リアル−タイム・イ
ンプリメンテイション・オブ・タイム・ドメイン・ハー
モニック・スケーリング・オブ・スピーチ・フォー・レ
イト・モディフィケーション・アンド・コーディング」
(REAL−TIME IMPLEMENTATION OF TIME DOMAIN HARMONI
C SCALING OF SPEECH FOR RATE MODIFICATION AND CODI
NG)(文献3)等に説明されている音声信号の自己相関
々数を用いて計算する方法が知られている。ピッチ符号
化回路150は、ピッチ周期Pdを入力し、あらかじめ定め
られた量子化ビット数で量子化符号化し、符号ldをマル
チプレクサ260へ出力する。また、符号ldを復号化して
得たP′dを駆動信号計算回路220と駆動信号復元回路2
40へ出力する。 次に、インパルス応答計算回路170は、Kパラメータ
符号化回路160から予測係数値d1を入力し、重み付けさ
れた合成フィルタの伝達関数を表わすインパスル応答hw
(n)を計算する。ここで、hw(n)の計算には、例え
ば特願昭59−42305号明細書の第4図(a)に記載のイ
ンパルス応答計算回路210と同一の方法を用いることが
できる。このインパルス応答hw(n)は自己相関々数計
算回路180と相互相関々数計算回路210とへ出力される。 また自己相関々数計算回路180は、インパルス応答計
算回路170からインパルス応答hw(n)を入力し、次式
に従って自己相関々数Rhh(7)をあらかじめ定められ
た遅れ時間τだけ計算する。 自己相関々数Rhh(τ)は駆動信号計算回路220へ出力さ
れる。 次に、減算器120は、バッファメモリ回路110に蓄積さ
れた音声信号x(n)を入力し、x(n)から合成フィ
ルタ回路250の出力系列を1フレームサンプル分減算
し、減算結果e(n)を重み付け回路200へ出力する。 この重み付け回路200は、減計器120から減算結果e
(n)とKパラメータ計算回路140から予測係数値d′
1とを入力し、e(n)に対して重み付けを施したe
w(n)を出力する。ここでew(n)の計算には、例え
ば特願昭59−42305の第4図(a)に記載の重み付け回
路410と同一の方法を用いることができる。 次の相互相関々数計算回路210は、重み付け回路200か
らのew(n)とインパルス応答計算回路170からのイン
パルス応答hw(n)とを入力し、次式に従い相互相関々
数ψhx(τ)を計算する。 この相互相関々数hx(τ)は駆動信号計算回路220へ
出力される。 次に駆動信号計算回路220及び補正情報計算回路190に
ついて説明する。ここで駆動信号計算回路220では音声
信号を表わす駆動信号としてパルス系列を計算する。こ
の駆動信号計算回路220での処理手順を以下に示す。こ
こでは2ピッチ区間に対し1ピッチ分のパルスと補正情
報を伝送する場合について説明する。 1)第1番目のパルスを計算し、このパルスの位置と
ピッチ周期P′dとを用い、フレームをピッチ周期P′
dサンプル毎のサブフレームに分割する。第2図(a)
に1フレーム区間(ここでは20msecに選んだ)の音声波
形、第2図(b)にフレームをサブフレームに分割した
一例を示す。 2)第2図(b)でパルスを伝送するサブフレームは
(i),(iii),(V)のサブフレームであり、これ
らのサブフレームに対して次式に従いパルス数を割り当
てる。 L1+L2+L3=LF ……(7) この式でL1,L2,L3はそれぞれ(i),(iii),(V)
のサブフレームに割り当てるパルス数、LFはフレーム毎
に割り当てられるパルス数を示す。なおLFの値はビット
レイトからあらかじめ求めておく。 3)次に、サブフレーム(i)に対してパルスをL1個
計算する。ここでパルス計算には次式を用いる。 この式でgi,miはi番目のパルスの振幅,位置を示し、
hx,Rhhはそれぞれ相互相関々数,自己相関々数を示
す。このようにして求めたパルスは補正情報計算回路19
0と符号化回路230へ出力される。 補正情報計算回路190では、サブフレーム(ii)の音
声を良好に表わすパルスを、サブフレーム(i)で求め
たパルスとその補正情報(パルスの振幅,位置に対する
補正)という形で表現し、最良の補正情報を求める。 この補正情報の求め方はいくつか考えられるが、ここ
ではあらかじめ補正情報を数種類用意しておき、このな
かから最良なものを選択する方法を用いる。ここであら
かじめ用意されている補正情報の一例を第3図に示す。
この図では、補正情報は振幅,位置を含めて16種類の補
正値をもっており、各々の補正値は4ビットの符号と対
応している。この補正値のわりあて方としては種々考え
られるが、パルスの位置の変化が振幅に比べ少ないとす
れば、第3図に示すように、パルス位置の補正量として
“+1",“0",“−1"の3種を用意し、各々の位置補正量
に対応する振幅補正量を“1.2",“1.1",“1.0",“0.9",
“0.8"の5種を用意する。但し、位置補正が“0"をとる
頻度は他の2種の場合と比べ大きいと予想されるので、
位置補正“0"の時のみ振幅補正値を6種用意する。今、
補正値として最上段のパルスが選択された場合は、一つ
の過去(左隣)のサブフレームで求まったパルスをピッ
チ周期だけずらしてくり返してパルスに対して、全ての
パルス位置を“1"サンプルだけ時間正方向にずらし、か
つ全てのパルス振幅に“1.2"の値を乗ずる。そして補正
値を表わす符号としては“0000"の符号を出力する。こ
の補正値のわりあて方は、例えばパルス振幅,位置の統
計的な変化から補正値を求めてわりあててもよい。 次に補正情報計算回路190における補正情報の選択法
は種々考えられるが、例えばサブフレームの音声信号と
補正されたパルスによって合成される信号とS/Nを評価
値として用いて、S/Nを最大とする補正情報を選択する
方法を用いることができる。ここでS/Nは、補正された
パルスを用いて次式から計算される。パルスの補正はサ
ブフレーム(i)の全てのパルスに対して一様に行なわ
れる。この式でgl′i,m′liは,サブフレーム(i)で求めた
パルスに対して16種の補正のうち、i番目の補正を施し
た後のパルスの振幅,位置を示している。またR
ee(O)は、信号ew(n)に対するサブフレーム(ii)
の区間での電力を示す。 この方法により選択された補正情報は駆動信号計算回
路220と駆動信号復元回路240へ出力され、また選択され
た補正情報を表わす符号がマルチブレクサ260へ出力さ
れる。 4)次に駆動信号計算回路220は、サブフレーム(ii
i)のパルスをL2個前述の(8)式に従い計算する。こ
こでサブフレーム(i)及び(ii)で求めたパルスの影
響は、相互相関々数からあらかじめ除去しておく。 以上の処理をくり返して、駆動信号計算回路220はサ
ブフレーム(i),(iii),(V)のパルスを求め、
補正情報計算回路190はサブフレーム(ii),(iv)の
補正情報を求める。以上で駆動信号計算回路220と補正
情報計算回路190の説明を終える。 次に符号化回路230は、入力したパルスの振幅,位置
を符号化し、マルチプレクサ260へ出力する。また、パ
ルスの振幅,位置の復号値g′i,m′iを駆動信号復元
回路240へ出力する。ここでパルスの振幅,位置の符号
化法には、例えば特願昭57−231605に記載の符号化回路
250と同一の方法を用いることができる。 次に、駆動信号復元回路240は、ピッチ周期P′d、
パルスの振幅,位置の復号値g′i,m′i及び補正情報
を用いて、1フレーム分のパルスを発生させ、これを駆
動音源信号として合成フィルタ回路250へ出力する。 この合成フィルタ回路250は、駆動音源信号を入力
し、1フレーム分の応答信号(n)を計算する。ここ
で応答信号(n)の計算には、例えば特願昭57−2316
05に記載の合成フィルタ回路320と同一の方法を用いる
ことができる。 次に、マルチプレクサ260は、Kパラメータ符号化回
路160の符号lKiとピッチ符号化回路150の符号ldと補正
情報計算回路190からの補正情報符号と符号化回路230の
符号を入力し、これらを組み合わせて送信側出力端子27
0から通信路へ出力する。以上で符号器側の説明を終え
る。 次に本実施例の復号器側について、第1図(b)を参
照して説明する。デマルチプレクサ290は、受信側入力
端子280から入力した符号のうち、Kパラメータを表わ
す符号と、ピッチ周期を表わす符号と、パルスの振幅,
位置を表わす符号と、補正情報を表わす符号を分離し
て、それぞれKパラメータ復号回路330,ピッチ復号回路
330,パルス復号回路300補正情報復号回路310へ出力す
る。 次に、Kパラメータ復号回路330は、Kパラメータを
復号し、Kパラメータ復号値K′iを合成フィルタ回路
350へ出力し、ピッチ復号回路320はピッチ周期を復号し
ピッチ周期復号値P′dを駆動信号復元回路340へ出力
し、パルス復号回路300は、音源パルス系列の振幅,位
置を復号し、それぞれg′i,m′iとして駆動信号復元
回路340へ出力する。 次に、補正情報復号回路310は、符号器側の補正情報
計算回路190と同一の補正情報のセットをあらかじめも
っており、この補正情報を表わす符号を入力し、符号に
対応する補正情報を選び出し駆動信号復元回路340へ出
力する。 この駆動信号復元回路340は、符号器側の駆動信号復
元回路240と同一の動作をする。つまり、ピッチ周期復
号値P′dを用いて、フレームをサブフレームに分割
し、サブフレームに発生させるパスル数を計算する。こ
の処理には、符号器側の駆動信号計算回路220における
方法と同一の方法を用いる。また駆動信号復元回路は、
音源パルス系列の振幅,位置の復号値g′i,m′iと補
正情報を用いてサブフレームにパルスを発生させる。こ
こで偶数番目のサブフレームでは、P′dと補正情報を
用いて1つ前(時間的に過去)のサブフレームのパルス
の全てを補正してパルスを発生される。このようにして
1フレーム分のパルスを復元し、これを駆動信号として
合成フィルタ回路350へ出力する。 この合成フィルタ回路350は、駆動信号を入力し合成
信号(n)を1フレーム分計算し、これを受信側出力
端子360から出力する。ここで合成信号(n)の計算
には例えば特願昭59−42305の合成フィルタ回路550と同
一の方法を用いることができる。以上で復号器側の説明
を終える。 本実施例においては、パルス探索アルゴリズムとして
前述の(8)式を用いたが、これは他のパルス探索アル
ゴリズムを用いてもよい。例えば従来例として文献1に
示した方式を用いてもよい。また、(8)式の方法では
パルスを1つずつ順番に探索していたが、パルスを1つ
求める毎にこれより過去に求まった複数個のパルスの振
幅を再調整するような方法を用いてもよい。また本実施
例では2ビッチ区間に対し、1ピッチ分のパルスと補正
情報を伝送する例について説明したが、3ピッチ以上の
区間に対して1ピッチ分のパルスと補正情報を伝送する
ようにしてもよい。このようにした方がパルスを伝送す
るための情報量を低減することができる。 また本実施例では、駆動信号計算回路220において、
フレームをピッチ周期P′dに応じたサブフレームに分
割すれ際に、第2図(b),(c)に示したように、フ
レームの左端からP′dサンプル毎にサブフレームに分
割したが、このサブフレームの分割法としては次のよう
にしてもよい。 まず、フレームに対してあらかじめ定められた個数の
パルスを計算する。次に求まったパルスのうち、フレー
ムの左端に最も近いパルスの近傍を始点Tとして、P′
dサンプル毎にサブフレームに分割する。このようにし
た場合は、始点Tの位置を受信側へ伝送する必要があ
る。これには例えば、フレーム左端から始点Tまでの距
離Tpをあらかじめ定められた長さの符号で表わして伝送
してもよいし、Tpとピッチ周期P′dとの比をあらかじ
め定められた長さの符号で表わして伝送してもよい。 また本実施例では、補正情報として第3図に示したよ
うな振幅と位置の両方の補正を行なうセットを用意して
おいた。このセットとしては、位置の補正は行なわず
に、振幅の補正のみを行なうような補正情報のセットを
用意しておいてもよいし、位置および振幅の両方の補正
情報を用意しておく場合、位置の補正の種類は、サブフ
レームをまびくまびき率に応じて種類を変えるようにし
てもよい。具体的にはまびくサブフレーム数が少ない場
合には、位置の補正の種類を減らし、まびくサブフレー
ム数が多い場合には、この種類を増すようにしてもよ
い。このようにした方が位置の補正を良好に行なうこと
ができる。 また本実施例では、補正情報計算回路190における補
正情報の選択法として、(9)式のS/Nを最大にする補
正情報を選択当していたが、これは次のようにしてもよ
い。一つのは方法としては、本実施例の方法と等価であ
るが、補正情報により補正したパルスから信号を合成
し、該当するサブフレームの音声との誤差電力を計算
し、この誤差電力を最も小さくするような補正情報を選
択するようにしてもよい。他の方法としては、補正情報
を求めるサブフレームでは一旦パルスを求め、このパル
スを最も良好に表わす補正情報を選択するようにしても
よい。あるいは補正情報を求めるサブフレーム内の原信
号の電力と補正したパルスから合成した信号の電力とが
最も近くなるような補正情報を選択してもよい。更にま
た、補正情報を求めるサブフレーム内の原信号の最大値
とパルスから合成した信号の最大値とが最も近くなるよ
うな補正情報を選択してもよい。以上述べた方法は、補
正情報として振幅のみを補正する場合にも用いることが
できる。 また以上述べた実施例では、補正情報を求めるサブフ
レームよりも1つ過去のサブフレームのパルスに対する
補正値を補正情報として伝送していたが、例えば前後の
サブフレームからパルスを補間して求め、このパルスに
対する補正値を補正情報として伝送するようにしてもよ
い。また補正情報を用いてパルスを補正する際に、全て
のパルスについて一様に補正に施していたが、一部のパ
ルス(例えば振幅の大きなパルス)のみについて補正を
施すようにしてもよい。また補正情報のセットとして、
ピッチ周期に応じていくつかの異なるセットを用意して
おいてもよい。 また補正情報としてあらかじめ用意されているセット
を使うのではなく、1つ過去のサブフレームからのパル
スの振幅,位置の変化値を用い、この変化値を求め符号
化して伝送するようにしてもよい。またこの場合、量子
化されたパルスの振幅に対して変化値を求めるようにし
てもよい。 また本実施例では、ピッチ周期に応じて分割したサブ
フレームが、次のフレームにまたがる際には、現在のフ
レームの最後のサブフレームではパルスをあらかじめ定
められた個数だけ新たに求め直して伝送していたが、次
のようにしてもよい。サブフレームが次のフレームにま
たがる際には、次のフレームの信号を入力し、フレーム
をまたいでサブフレームの分割を行ない、2つのフルー
ムにまたがるサブフレームに対しても補正情報を求める
ようにしてもよい。 また本実施例では、受信側においてパルスを復元する
ために用いるピッチ周期P′dとして、送信側で求めた
ピッチ周期を伝送して用いる構成としたが、ピッチ周期
は伝送せずに、受信側では受信したパルス系列または過
去に合成された合成信号系列(n)の周期性からピッ
チ周期Pd′を抽出し、これをもとにパルスを復元するよ
うな構成としてもよい。 尚、ディジタル信号処理の分野でよく知られているよ
うに、自己相関々数はぱパワスペクトルから計算しても
よく、また相互相関々数はクロス・パワスペクトルから
計算してもよい。パワスペクトルと自己相関々数との対
応関係、クロスパワスペクトルと相互相関々数との対応
関係については、エー・ブイ・オッペンハイム(A.V.OP
PENHEIM)氏らによる「ディジタル信号処理(DIGITAL S
IGNAL PROCESSING)」と題した単行本の第8章にて詳細
に説明されているので、ここでは説明を省略する。 (発明の効果) 以上説明したように、本発明によれば、数ピッチ区間
の音声を1ピッチ分のパルスと少ない情報量の補正情報
とで良好に表わすことが可能であるため、従来方式にみ
られた欠点を改善し、伝送レイトが低い場合にも高品質
な音声を合成できるという効果がある。
化するための音声信号符号化方法とその装置に関する。 (従来技術とその問題点) 音声信号を16Kビット/秒程度以下の伝送情報量で符
号化するための方式として、最近マルチパルス駆動形音
声符号化方式が提案されている。これは、駆動音源信号
系列を表わす複数個のパルス系列(マルチパルス)を、
短時間毎に、符号器側でアナリシス バイ シンセシス
(ANALYS−IS−bY−SYNTHESIS;A−b−S)の手法を用
いて逐次的に求め、このパルス系列を符号化伝送する方
式である。この方式の詳細については、ビー・エス・ア
タール(B.S.ATAL)氏らによるアイ・シー・エー・エス
・エス・ピー(I.C.A.S.S.P.)の予稿集、1982年614〜6
17頁に掲載の論文「ア・ニュー・モデル・オブ・エル・
ピー・シー・エクサイティション・フォー・プロデュー
シング・ナチュラル・サウンディング・スピーチ・アッ
ト・ロウ・ビット・レイツ」(A NEW MODEL OF LPC EXC
ITATION FOR PRODUCING NATURAL−SOUNDING SPEECH AT
LOW BIT RATES)(文献1)に説明されている。 第4図はこの文献1に記載された符号器側の処理を示
すブロック図である。図において、400はA/D変換された
音声信号系列X(n)が入力される符号器入力端子、41
0は音声信号系列を1フレーム(例えば8kHzサンプリン
グの場合でフレーム長を10msecとすると80サンプル)分
蓄積するバッファメモリ回路である。このバッファメモ
リ回路410の出力値は減算器420と、Kパラメータ計算回
路480とに出力される。但し、文献1によればKパラメ
ータのかわりにREFLECTION COEFFICIENTSと記載されて
いるが、これはKパラメータと同一のパラメータであ
る。このKパラメータ計算回路480は、バッファメモリ
回路410の出力値を用い、共分散法に従ってフレーム毎
の音声信号スペクトルを表わすKパラメータKを16次分
(1≦i≦16)求め、これらを合成フィルタ430へ出力
する。440は音源パルス発生回路であり、1フレーム内
にあらかじめ定められた個数のパルス系列を発生させ
る。ここでは、このパルス系列をd(n)と記する。 この音源パルス発生回路440によって発生された音源
パルス系列の一例を、第5図に示す。第5図で横軸は離
散的な時刻を、縦軸は振幅をそれぞれに示す。ここで
は、1フレーム内に8個のパルスを発生させる場合につ
いて示してある。音源パルス発生回路440によって発生
されたパルス系列d(n)は、合成フィルタ430を駆動
する。この合成フィルタ430は、d(n)を入力して音
声信号x(n)に対応する再生信号(n)を求め、こ
れを減算器420へ出力する。ここで合成フィルタ430は、
KパラメータKiを入力し、これらを予測パラメータa
i(1≦i≦16)へ変換し、aiを用いて再生信号
(n)を計算する。(n)は、d(n)とaを用いて
下式のように表わすことができる。 この式でPは合成フィルタの次数を示し、ここではP=
16としている。減算器420は、原信号x(n)と再生信
号(n)との差e(n)を計算して重み付け回路490
へ出力し、重み付け回路490はe(n)を入力し、重み
付け関数w(n)を用いて次式に従って重み付け誤差ew
(n)を計算する。 ew(n)=w(n)*e(n) ……(2) この式で、記号*はたたみこみ積分を表わす。また、重
み付け関数w(n)は、周波数軸上で重み付けを行なう
ものであり、そのZ変換値をW(Z)とすると、合成フ
ィルタの予測パラメータaiを用いて、次式により表わさ
れる。 この式でrは0≦r≦1の定数であり、W(Z)の周波
数特性を決定する。つまり、r=1とすると、W(Z)
=1となり、その周波数特性は平坦となり、r=0とす
ると、W(Z)は合成フィルタの周波数特性の逆特性と
なる。従って、rの値によってW(Z)の特性を変える
ことができる。また、(3)式で示したようにW(Z)
を合成フィルタの周波数特性に依存させて決めているの
は、聴感的なマスク効果を利用しているためである。つ
まり、入力音声信号のスペクトルのパワが大きな箇所で
は(例えばフォルマントの近傍)、再生信号のスペクト
ルとの誤差が少々大きくても、その誤差は耳につき難い
という聴感的な性質による。 第6図はあるフレームにおける入力音声信号のスペク
トルとW(Z)の周波数特性の一例とを示した特性図で
ある。ここではr=0.8とした。図において、横軸は周
波数(最大4kHz)を、縦軸は対数振幅(最大60dB)をそ
れぞれ示す。また、上部の曲線は音声信号のスペクトル
を、下部の曲線は重み付け関数の周波数特性を表わして
いる。 第4図へ戻って、重み付け誤差ew(n)は、誤差最小
化回路450へフィードバックされる。誤差最小化回路450
は、ew(n)の値を1フレーム分記憶し、これらを用い
て次式に従い、重み付け2乗誤差εを計算する。 ここで、Nは2乗誤差を計算するサンプル数を示す。文
献1の方式では、この時間長を5msecとしており、これ
は8kHzサンプリングの場合にはN=40に相当する。 次に、誤差最小化回路450は、この(4)式で計算し
た2乗誤差εを小さくするように音源パルス発生回路44
0に対し、パルス位置及び振幅情報を与え、音源パルス
発生回路440はこの情報に基づいて音源パルス系列を発
生させる。合成フィルタ430は、この音源パルス系列を
駆動源として再生信号(n)を計算する。次に、減算
器420では、先に計算した原信号と再生信号との誤差e
(n)から現在求まった再生信号(n)を減算して、
これを新たな誤差e(n)とする。重み付け回路490は
e(n)を入力し重み付け誤差ew(n)を計算し、これ
を誤差最小化回路450へフィードバックする。誤差最小
化回路450は、再び2乗誤差を計算し、これを小さくす
るように音源パルスの振幅と位置を調整する。こうして
音源パルス系列の発生から誤差最小化による音源パルス
系列の調整までの一連の処理は、音源パルス系列のパル
ス数があらかじめ定められた数に達するまでくり返さ
れ、音源パルス系列が決定される。 この従来の方式の場合、伝送すべき情報は、合成フィ
ルタのパラメータKi(1≦i≦16)と、音源パルス系列
のパルス位置及び振幅であり、1フレーム内にたてるパ
ルスの数によって任意の伝送レイトを実現でいきる。こ
の伝送レイトを16kbps以下とする領域に対しては、良好
な再生音質が得られ有効な方式と考えられる。 しかしながら、この従来方式は、演算量が非常に多い
という欠点がある。これは音源パルス系列におけるパル
スの位置と振幅を計算する際に、そのパルスに基づいて
一旦信号を再生し、原信号と再生信号との誤差及び2乗
誤差を計算し、それらをフィードバックさせて、2乗誤
差を小さくするようにパルス位置と振幅を調整している
ことに起因している。 またこの従来方式によれば、伝送レイトを下げるとピ
ッチ周波数の高い音声の場合、例えば女性話者の音声を
入力した場合には、再生音質が劣化するという欠点があ
った。これは、ピッチ周波数が高い場合には、ピッチ周
波数が低い場合に比べパルスを計算するためのフレーム
により多くのピッチ波形が含まれることになり、このピ
ッチ波形を良好に再生するためには、ピッチ周波数が低
い話者の場合と比べて、より多くの個数の音源パルスを
必要とするという理由による。 (発明の目的) 本発明の目的は、比較的少ない演算量で、低い伝送レ
イトにも適用し得る高品質な音声信号符号化方法とその
装置を提供することにある。 (発明の構成) 本発明の音声信号符号化方法の構成は、送信側では、
離散的な音声信号系列を入力しあらかじめ定められた時
間間隔毎にピッチを表すピッチパラメータと短時間スペ
クトル包絡を表すスペクトルパラメータとを抽出し、前
記音声信号系列を表す駆動信号を前記ピッチに応じて分
割した前記時間間隔よりも短い時間区間のうちの一部区
間について求め前記時間間隔のうちの前記一部区間以外
の区間については前記一部区間から暫定駆動信号を求め
さらに振幅と位置の少なくとも一方の補正量としてあら
かじめ定められた複数個のセットから評価値を最良にす
るものを選択して前記音声信号系列を表す駆動信号を推
定し、前記ピッチパラメータと前記スペクトルパラメー
タと前記駆動信号と前記補正量とを組み合わせて出力
し、受信側では、前記時間間隔毎に前記ピッチパラメー
タと前記スペクトルパラメータと前記駆動信号と前記補
正量とを分離して駆動音源信号を復元し、前記音声信号
系列を再生することを特徴とする。 本発明の音声信号符号化装置の構成は、入力した音声
信号系列からあらかじめ定められた時間間隔毎にピッチ
を表すピッチパラメータと短時間スペクトル包絡を表す
スペクトルパラメータを抽出して出力するパラメータ計
算回路と、前記音声信号系列を表す駆動信号を前記ピッ
チに応じて前記時間間隔よりも短い時間区間に分割し、
前記音声信号系列を表す駆動信号を前記時間区間のうち
の一部区間について求め前記時間間隔のうちの前記一部
区間以外の区間については前記一部区間から暫定駆動信
号を求めさらに振幅と位置の少なくとも一方の補正量と
してあらかじめ定められた複数個のセットから評価値を
最良にするものを選択し、前記駆動信号を表す符号と前
記補正量を表す符号とを出力する駆動信号計算回路と、
前記パラメータ計算回路の出力符号と前記駆動信号計算
回路の出力符号とを組み合わせて出力するマルチプレク
サ回路とを有することを特徴とする。 本発明の音声信号復号化装置の構成は、ピッチパラメ
ータを表す符号とスペクトルパラメータを表す符号と駆
動信号を表す符号と補正量を表す符号とが組み合わされ
た符号系列を入力して分離し復号するデマルチプレクサ
回路と、前記復号されたピッチパラメータと前記復号さ
れた駆動信号と前記復号された補正量をもとに駆動音源
信号を復元する駆動信号復元回路と、前記駆動音源信号
と前記復号されたスペクトルパラメータを用いて音声信
号系列を再生し出力する合成フィルタ回路とを有するこ
とを特徴とする。 (発明の原理) 本発明は、音声信号の周期性を利用して入力音声信号
をピッチ周期毎のサブフレームに分割し、これらサブフ
レームのうち一部のサブフレーム区間に対して前記音声
信号を表わすための駆動パルス列を計算し、残りのサブ
フレーム区間に対しては、前記駆動パルス列をくり返す
かまたは前記駆動パルス列から補間して求めた信号に対
して、振幅または位置あるいは振幅と位置の両方につい
て補正を施すための補正量を求め、ピッチ周期を表わす
ピッチパラメータと、入力音声信号のスペクトル包絡を
表わすスペクトルパラメータと、前記駆動パルス列と、
前記補正量とを伝送し、伝送された情報から音声信号を
合成することを特徴としている。 (実施例) 以下本発明の実施例について図面を参照して詳細に説
明する。 第1図(a),(b)は本発明による音声符号化方式
の符号器側および復号器側の一実施例を示すブロック図
である。第1図(a)において、音声信号系列x(n)
は、入力端子100から入力され、あらかじめ定められサ
ンプル数だけ区切られてバッファメモリ回路100に蓄積
される。次にKパラメータ計算回路140は、バッファメ
モリ回路110に蓄積されている音声信号のうち、あらか
じめ定められたサンプル数を入力し、入力信号のスペク
トル包絡を表わすLPCパラメータを計算する。このLPCパ
ラメータとしては種々知られているが以下ではパーコー
ル係数と同一のパラメータであるKパラメータを用いる
ものとして説明を進める。 このKパラメータの計算法としては代表的な方法とし
て、自己相関法と共分散法とがよく知られているが、こ
こではフィルタの安定性の判別が容易な自己相関法を用
いることにする。尚、この方法の詳細は、ジョン・マク
ホウル(JOHN MAKHOUL)氏らによるアイ・イー・イー・
イー・トランザクションズ・オン・エー・エス・エス・
ピー(IEEE TRANSACTIONS ON A.S.S.P.),1975年6月
号,309〜321頁に掲載の論文「クォンタイゼイション・
プロパティズ・オブ・トランスミッション・パラメター
ズ・イン・リニア・プリディクティブ・システムズ」
(QUANTIZATION PROPERTIES OF TRANSMISSION PARAMETE
RS IN LINEAR PREDICTIVE SYSTEMS)(文献2)等に述
べられているので、ここでは説明を省略する。 第1図(a)に戻って、KパラメータK1はKパラメー
タ符号化回路160へ出力され、Kパラメータ符号化回路1
60は、あらかじめ定められた量子化ビット数に基づいて
Kiを符号化し、符号lKiをマルチプレクサ260へ出力す
る。また、Kパラメータ符号化回路160は、lKiを復号化
して得たKパラメータ復号値Kiを用い文献2に記載の方
法に従い、予測係数値a′iに変換し、インパルス応答
計算回路170と重み付け回路200と合成フィルタ回路250
とへ出力する。 次に、ピッチ分析回路130は、バッファメモリ回路110
の出力である1フレーム分の音声信号を用いてピッチ周
期Pdを計算する。このPdの計算法としては、例えばアー
ル・ブイ・コックス(R.V.COX)氏らによるアイ・イー
・イー・イー・トランザクションズ・オン・エー・エス
・エス・ピー(IEEE TRANSACTIONS ON A.S.S.P)1983年
2月号,258〜272頁に掲載の論文「リアル−タイム・イ
ンプリメンテイション・オブ・タイム・ドメイン・ハー
モニック・スケーリング・オブ・スピーチ・フォー・レ
イト・モディフィケーション・アンド・コーディング」
(REAL−TIME IMPLEMENTATION OF TIME DOMAIN HARMONI
C SCALING OF SPEECH FOR RATE MODIFICATION AND CODI
NG)(文献3)等に説明されている音声信号の自己相関
々数を用いて計算する方法が知られている。ピッチ符号
化回路150は、ピッチ周期Pdを入力し、あらかじめ定め
られた量子化ビット数で量子化符号化し、符号ldをマル
チプレクサ260へ出力する。また、符号ldを復号化して
得たP′dを駆動信号計算回路220と駆動信号復元回路2
40へ出力する。 次に、インパルス応答計算回路170は、Kパラメータ
符号化回路160から予測係数値d1を入力し、重み付けさ
れた合成フィルタの伝達関数を表わすインパスル応答hw
(n)を計算する。ここで、hw(n)の計算には、例え
ば特願昭59−42305号明細書の第4図(a)に記載のイ
ンパルス応答計算回路210と同一の方法を用いることが
できる。このインパルス応答hw(n)は自己相関々数計
算回路180と相互相関々数計算回路210とへ出力される。 また自己相関々数計算回路180は、インパルス応答計
算回路170からインパルス応答hw(n)を入力し、次式
に従って自己相関々数Rhh(7)をあらかじめ定められ
た遅れ時間τだけ計算する。 自己相関々数Rhh(τ)は駆動信号計算回路220へ出力さ
れる。 次に、減算器120は、バッファメモリ回路110に蓄積さ
れた音声信号x(n)を入力し、x(n)から合成フィ
ルタ回路250の出力系列を1フレームサンプル分減算
し、減算結果e(n)を重み付け回路200へ出力する。 この重み付け回路200は、減計器120から減算結果e
(n)とKパラメータ計算回路140から予測係数値d′
1とを入力し、e(n)に対して重み付けを施したe
w(n)を出力する。ここでew(n)の計算には、例え
ば特願昭59−42305の第4図(a)に記載の重み付け回
路410と同一の方法を用いることができる。 次の相互相関々数計算回路210は、重み付け回路200か
らのew(n)とインパルス応答計算回路170からのイン
パルス応答hw(n)とを入力し、次式に従い相互相関々
数ψhx(τ)を計算する。 この相互相関々数hx(τ)は駆動信号計算回路220へ
出力される。 次に駆動信号計算回路220及び補正情報計算回路190に
ついて説明する。ここで駆動信号計算回路220では音声
信号を表わす駆動信号としてパルス系列を計算する。こ
の駆動信号計算回路220での処理手順を以下に示す。こ
こでは2ピッチ区間に対し1ピッチ分のパルスと補正情
報を伝送する場合について説明する。 1)第1番目のパルスを計算し、このパルスの位置と
ピッチ周期P′dとを用い、フレームをピッチ周期P′
dサンプル毎のサブフレームに分割する。第2図(a)
に1フレーム区間(ここでは20msecに選んだ)の音声波
形、第2図(b)にフレームをサブフレームに分割した
一例を示す。 2)第2図(b)でパルスを伝送するサブフレームは
(i),(iii),(V)のサブフレームであり、これ
らのサブフレームに対して次式に従いパルス数を割り当
てる。 L1+L2+L3=LF ……(7) この式でL1,L2,L3はそれぞれ(i),(iii),(V)
のサブフレームに割り当てるパルス数、LFはフレーム毎
に割り当てられるパルス数を示す。なおLFの値はビット
レイトからあらかじめ求めておく。 3)次に、サブフレーム(i)に対してパルスをL1個
計算する。ここでパルス計算には次式を用いる。 この式でgi,miはi番目のパルスの振幅,位置を示し、
hx,Rhhはそれぞれ相互相関々数,自己相関々数を示
す。このようにして求めたパルスは補正情報計算回路19
0と符号化回路230へ出力される。 補正情報計算回路190では、サブフレーム(ii)の音
声を良好に表わすパルスを、サブフレーム(i)で求め
たパルスとその補正情報(パルスの振幅,位置に対する
補正)という形で表現し、最良の補正情報を求める。 この補正情報の求め方はいくつか考えられるが、ここ
ではあらかじめ補正情報を数種類用意しておき、このな
かから最良なものを選択する方法を用いる。ここであら
かじめ用意されている補正情報の一例を第3図に示す。
この図では、補正情報は振幅,位置を含めて16種類の補
正値をもっており、各々の補正値は4ビットの符号と対
応している。この補正値のわりあて方としては種々考え
られるが、パルスの位置の変化が振幅に比べ少ないとす
れば、第3図に示すように、パルス位置の補正量として
“+1",“0",“−1"の3種を用意し、各々の位置補正量
に対応する振幅補正量を“1.2",“1.1",“1.0",“0.9",
“0.8"の5種を用意する。但し、位置補正が“0"をとる
頻度は他の2種の場合と比べ大きいと予想されるので、
位置補正“0"の時のみ振幅補正値を6種用意する。今、
補正値として最上段のパルスが選択された場合は、一つ
の過去(左隣)のサブフレームで求まったパルスをピッ
チ周期だけずらしてくり返してパルスに対して、全ての
パルス位置を“1"サンプルだけ時間正方向にずらし、か
つ全てのパルス振幅に“1.2"の値を乗ずる。そして補正
値を表わす符号としては“0000"の符号を出力する。こ
の補正値のわりあて方は、例えばパルス振幅,位置の統
計的な変化から補正値を求めてわりあててもよい。 次に補正情報計算回路190における補正情報の選択法
は種々考えられるが、例えばサブフレームの音声信号と
補正されたパルスによって合成される信号とS/Nを評価
値として用いて、S/Nを最大とする補正情報を選択する
方法を用いることができる。ここでS/Nは、補正された
パルスを用いて次式から計算される。パルスの補正はサ
ブフレーム(i)の全てのパルスに対して一様に行なわ
れる。この式でgl′i,m′liは,サブフレーム(i)で求めた
パルスに対して16種の補正のうち、i番目の補正を施し
た後のパルスの振幅,位置を示している。またR
ee(O)は、信号ew(n)に対するサブフレーム(ii)
の区間での電力を示す。 この方法により選択された補正情報は駆動信号計算回
路220と駆動信号復元回路240へ出力され、また選択され
た補正情報を表わす符号がマルチブレクサ260へ出力さ
れる。 4)次に駆動信号計算回路220は、サブフレーム(ii
i)のパルスをL2個前述の(8)式に従い計算する。こ
こでサブフレーム(i)及び(ii)で求めたパルスの影
響は、相互相関々数からあらかじめ除去しておく。 以上の処理をくり返して、駆動信号計算回路220はサ
ブフレーム(i),(iii),(V)のパルスを求め、
補正情報計算回路190はサブフレーム(ii),(iv)の
補正情報を求める。以上で駆動信号計算回路220と補正
情報計算回路190の説明を終える。 次に符号化回路230は、入力したパルスの振幅,位置
を符号化し、マルチプレクサ260へ出力する。また、パ
ルスの振幅,位置の復号値g′i,m′iを駆動信号復元
回路240へ出力する。ここでパルスの振幅,位置の符号
化法には、例えば特願昭57−231605に記載の符号化回路
250と同一の方法を用いることができる。 次に、駆動信号復元回路240は、ピッチ周期P′d、
パルスの振幅,位置の復号値g′i,m′i及び補正情報
を用いて、1フレーム分のパルスを発生させ、これを駆
動音源信号として合成フィルタ回路250へ出力する。 この合成フィルタ回路250は、駆動音源信号を入力
し、1フレーム分の応答信号(n)を計算する。ここ
で応答信号(n)の計算には、例えば特願昭57−2316
05に記載の合成フィルタ回路320と同一の方法を用いる
ことができる。 次に、マルチプレクサ260は、Kパラメータ符号化回
路160の符号lKiとピッチ符号化回路150の符号ldと補正
情報計算回路190からの補正情報符号と符号化回路230の
符号を入力し、これらを組み合わせて送信側出力端子27
0から通信路へ出力する。以上で符号器側の説明を終え
る。 次に本実施例の復号器側について、第1図(b)を参
照して説明する。デマルチプレクサ290は、受信側入力
端子280から入力した符号のうち、Kパラメータを表わ
す符号と、ピッチ周期を表わす符号と、パルスの振幅,
位置を表わす符号と、補正情報を表わす符号を分離し
て、それぞれKパラメータ復号回路330,ピッチ復号回路
330,パルス復号回路300補正情報復号回路310へ出力す
る。 次に、Kパラメータ復号回路330は、Kパラメータを
復号し、Kパラメータ復号値K′iを合成フィルタ回路
350へ出力し、ピッチ復号回路320はピッチ周期を復号し
ピッチ周期復号値P′dを駆動信号復元回路340へ出力
し、パルス復号回路300は、音源パルス系列の振幅,位
置を復号し、それぞれg′i,m′iとして駆動信号復元
回路340へ出力する。 次に、補正情報復号回路310は、符号器側の補正情報
計算回路190と同一の補正情報のセットをあらかじめも
っており、この補正情報を表わす符号を入力し、符号に
対応する補正情報を選び出し駆動信号復元回路340へ出
力する。 この駆動信号復元回路340は、符号器側の駆動信号復
元回路240と同一の動作をする。つまり、ピッチ周期復
号値P′dを用いて、フレームをサブフレームに分割
し、サブフレームに発生させるパスル数を計算する。こ
の処理には、符号器側の駆動信号計算回路220における
方法と同一の方法を用いる。また駆動信号復元回路は、
音源パルス系列の振幅,位置の復号値g′i,m′iと補
正情報を用いてサブフレームにパルスを発生させる。こ
こで偶数番目のサブフレームでは、P′dと補正情報を
用いて1つ前(時間的に過去)のサブフレームのパルス
の全てを補正してパルスを発生される。このようにして
1フレーム分のパルスを復元し、これを駆動信号として
合成フィルタ回路350へ出力する。 この合成フィルタ回路350は、駆動信号を入力し合成
信号(n)を1フレーム分計算し、これを受信側出力
端子360から出力する。ここで合成信号(n)の計算
には例えば特願昭59−42305の合成フィルタ回路550と同
一の方法を用いることができる。以上で復号器側の説明
を終える。 本実施例においては、パルス探索アルゴリズムとして
前述の(8)式を用いたが、これは他のパルス探索アル
ゴリズムを用いてもよい。例えば従来例として文献1に
示した方式を用いてもよい。また、(8)式の方法では
パルスを1つずつ順番に探索していたが、パルスを1つ
求める毎にこれより過去に求まった複数個のパルスの振
幅を再調整するような方法を用いてもよい。また本実施
例では2ビッチ区間に対し、1ピッチ分のパルスと補正
情報を伝送する例について説明したが、3ピッチ以上の
区間に対して1ピッチ分のパルスと補正情報を伝送する
ようにしてもよい。このようにした方がパルスを伝送す
るための情報量を低減することができる。 また本実施例では、駆動信号計算回路220において、
フレームをピッチ周期P′dに応じたサブフレームに分
割すれ際に、第2図(b),(c)に示したように、フ
レームの左端からP′dサンプル毎にサブフレームに分
割したが、このサブフレームの分割法としては次のよう
にしてもよい。 まず、フレームに対してあらかじめ定められた個数の
パルスを計算する。次に求まったパルスのうち、フレー
ムの左端に最も近いパルスの近傍を始点Tとして、P′
dサンプル毎にサブフレームに分割する。このようにし
た場合は、始点Tの位置を受信側へ伝送する必要があ
る。これには例えば、フレーム左端から始点Tまでの距
離Tpをあらかじめ定められた長さの符号で表わして伝送
してもよいし、Tpとピッチ周期P′dとの比をあらかじ
め定められた長さの符号で表わして伝送してもよい。 また本実施例では、補正情報として第3図に示したよ
うな振幅と位置の両方の補正を行なうセットを用意して
おいた。このセットとしては、位置の補正は行なわず
に、振幅の補正のみを行なうような補正情報のセットを
用意しておいてもよいし、位置および振幅の両方の補正
情報を用意しておく場合、位置の補正の種類は、サブフ
レームをまびくまびき率に応じて種類を変えるようにし
てもよい。具体的にはまびくサブフレーム数が少ない場
合には、位置の補正の種類を減らし、まびくサブフレー
ム数が多い場合には、この種類を増すようにしてもよ
い。このようにした方が位置の補正を良好に行なうこと
ができる。 また本実施例では、補正情報計算回路190における補
正情報の選択法として、(9)式のS/Nを最大にする補
正情報を選択当していたが、これは次のようにしてもよ
い。一つのは方法としては、本実施例の方法と等価であ
るが、補正情報により補正したパルスから信号を合成
し、該当するサブフレームの音声との誤差電力を計算
し、この誤差電力を最も小さくするような補正情報を選
択するようにしてもよい。他の方法としては、補正情報
を求めるサブフレームでは一旦パルスを求め、このパル
スを最も良好に表わす補正情報を選択するようにしても
よい。あるいは補正情報を求めるサブフレーム内の原信
号の電力と補正したパルスから合成した信号の電力とが
最も近くなるような補正情報を選択してもよい。更にま
た、補正情報を求めるサブフレーム内の原信号の最大値
とパルスから合成した信号の最大値とが最も近くなるよ
うな補正情報を選択してもよい。以上述べた方法は、補
正情報として振幅のみを補正する場合にも用いることが
できる。 また以上述べた実施例では、補正情報を求めるサブフ
レームよりも1つ過去のサブフレームのパルスに対する
補正値を補正情報として伝送していたが、例えば前後の
サブフレームからパルスを補間して求め、このパルスに
対する補正値を補正情報として伝送するようにしてもよ
い。また補正情報を用いてパルスを補正する際に、全て
のパルスについて一様に補正に施していたが、一部のパ
ルス(例えば振幅の大きなパルス)のみについて補正を
施すようにしてもよい。また補正情報のセットとして、
ピッチ周期に応じていくつかの異なるセットを用意して
おいてもよい。 また補正情報としてあらかじめ用意されているセット
を使うのではなく、1つ過去のサブフレームからのパル
スの振幅,位置の変化値を用い、この変化値を求め符号
化して伝送するようにしてもよい。またこの場合、量子
化されたパルスの振幅に対して変化値を求めるようにし
てもよい。 また本実施例では、ピッチ周期に応じて分割したサブ
フレームが、次のフレームにまたがる際には、現在のフ
レームの最後のサブフレームではパルスをあらかじめ定
められた個数だけ新たに求め直して伝送していたが、次
のようにしてもよい。サブフレームが次のフレームにま
たがる際には、次のフレームの信号を入力し、フレーム
をまたいでサブフレームの分割を行ない、2つのフルー
ムにまたがるサブフレームに対しても補正情報を求める
ようにしてもよい。 また本実施例では、受信側においてパルスを復元する
ために用いるピッチ周期P′dとして、送信側で求めた
ピッチ周期を伝送して用いる構成としたが、ピッチ周期
は伝送せずに、受信側では受信したパルス系列または過
去に合成された合成信号系列(n)の周期性からピッ
チ周期Pd′を抽出し、これをもとにパルスを復元するよ
うな構成としてもよい。 尚、ディジタル信号処理の分野でよく知られているよ
うに、自己相関々数はぱパワスペクトルから計算しても
よく、また相互相関々数はクロス・パワスペクトルから
計算してもよい。パワスペクトルと自己相関々数との対
応関係、クロスパワスペクトルと相互相関々数との対応
関係については、エー・ブイ・オッペンハイム(A.V.OP
PENHEIM)氏らによる「ディジタル信号処理(DIGITAL S
IGNAL PROCESSING)」と題した単行本の第8章にて詳細
に説明されているので、ここでは説明を省略する。 (発明の効果) 以上説明したように、本発明によれば、数ピッチ区間
の音声を1ピッチ分のパルスと少ない情報量の補正情報
とで良好に表わすことが可能であるため、従来方式にみ
られた欠点を改善し、伝送レイトが低い場合にも高品質
な音声を合成できるという効果がある。
【図面の簡単な説明】
第1図(a),(b)は本発明の一実施例の符号器側お
よび復号器側のブロック図、第2図(a)〜(c)は駆
動信号計算回路220における処理内容の一例を示す波形
図、第3図は第1図(a)の補正情報計算回路440のあ
らかじめ用意されている補正情報のセットの一例を示す
図、第4図は従来方式の構成を示すブロック図、第5図
は音源パルスの一例を示す図、第6図は音声信号のある
フレームにおける周波数特性と重み付け回路の周波数特
性の一例を示す特性図である。図において、110,410…
…バッファメモリ回路、120,420……減算回路、250,35
0,430……合成フィルタ回路、200,490……重み付け回
路、170……インパルス応答計算回路、180……自己相関
々数計算回路、190……補正情報計算回路、220……駆動
信号計算回路、240,340……駆動信号復元回路、130……
ピッチ分析回路、140,480……Kパラメータ計算回路、1
50……ピッチ符号化回路、160……Kパラメータ符号化
回路、230……符号化回路、260……マルチプレクサ、29
0……デマルチプレクサ、300……パルス復号回路、310
……補正情報復号回路、320……ピッチ復号回路、330…
…Kパラメータ復号回路、440……音源パルス発生回
路、450……誤差最小化回路、をそれぞれ示す。
よび復号器側のブロック図、第2図(a)〜(c)は駆
動信号計算回路220における処理内容の一例を示す波形
図、第3図は第1図(a)の補正情報計算回路440のあ
らかじめ用意されている補正情報のセットの一例を示す
図、第4図は従来方式の構成を示すブロック図、第5図
は音源パルスの一例を示す図、第6図は音声信号のある
フレームにおける周波数特性と重み付け回路の周波数特
性の一例を示す特性図である。図において、110,410…
…バッファメモリ回路、120,420……減算回路、250,35
0,430……合成フィルタ回路、200,490……重み付け回
路、170……インパルス応答計算回路、180……自己相関
々数計算回路、190……補正情報計算回路、220……駆動
信号計算回路、240,340……駆動信号復元回路、130……
ピッチ分析回路、140,480……Kパラメータ計算回路、1
50……ピッチ符号化回路、160……Kパラメータ符号化
回路、230……符号化回路、260……マルチプレクサ、29
0……デマルチプレクサ、300……パルス復号回路、310
……補正情報復号回路、320……ピッチ復号回路、330…
…Kパラメータ復号回路、440……音源パルス発生回
路、450……誤差最小化回路、をそれぞれ示す。
Claims (1)
- (57)【特許請求の範囲】 1.送信側では、離散的な音声信号系列を入力しあらか
じめ定められた時間間隔毎にピッチを表すピッチパラメ
ータと短時間スペクトル包絡を表すスペクトルパラメー
タとを抽出し、前記音声信号系列を表す駆動信号を前記
ピッチに応じて分割した前記時間間隔よりも短い時間区
間のうちの一部区間について求め前記時間間隔のうちの
前記一部区間以外の区間については前記一部区間から暫
定駆動信号を求めさらに振幅と位置の少なくとも一方の
補正量としてあらかじめ定められた複数個のセットから
評価値を最良にするものを選択して前記音声信号系列を
表す駆動信号を推定し、前記ピッチパラメータと前記ス
ペクトルパラメータと前記駆動信号と前記補正量とを組
み合わせて出力し、受信側では、前記時間間隔毎に前記
ピッチパラメータと前記スペクトルパラメータと前記駆
動信号と前記補正量とを分離して駆動音源信号を復元
し、前記音声信号系列を再生することを特徴とする音声
信号符号化方法。 2.入力した音声信号系列からあらかじめ定められた時
間間隔毎にピッチを表すピッチパラメータと短時間スペ
クトル包絡を表すスペクトルパラメータを抽出して出力
するパラメータ計算回路と、前記音声信号系列を表す駆
動信号を前記ピッチに応じて前記時間間隔よりも短い時
間区間に分割し前記音声信号系列を表す駆動信号を前記
時間区間のうちの一部区間について求め前記時間間隔の
うちの前記一部区間以外の区間については前記一部区間
から暫定駆動信号を求めさらに振幅と位置の少なくとも
一方の補正量としてあらかじめ定められた複数個のセッ
トから評価値を最良にするものを選択し、前記駆動信号
を表す符号と前記補正量を表す符号とを出力する駆動信
号計算回路と、前記パラメータ計算回路の出力符号と前
記駆動信号計算回路の出力符号とを組み合わせて出力す
るマルチプレクサ回路とを有することを特徴とする音声
信号符号化装置。 3.ピッチパラメータを表す符号とスペクトルパラメー
タを表す符号と駆動信号を表す符号と補正量を表す符号
とが組み合わされた符号系列を入力して分離し復号する
デマルチプレクサ回路と、前記復号されたピッチパラメ
ータと前記復号された駆動信号と前記復号された補正量
をもとに駆動音源信号を復元する駆動信号復元回路と、
前記駆動音源信号と前記復号されたスペクトルパラメー
タを用いて音声信号系列を再生し出力する合成フィルタ
回路とを有することを特徴とする音声信号復号化回路。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59269914A JP2844589B2 (ja) | 1984-12-21 | 1984-12-21 | 音声信号符号化方法とその装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59269914A JP2844589B2 (ja) | 1984-12-21 | 1984-12-21 | 音声信号符号化方法とその装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS61148500A JPS61148500A (ja) | 1986-07-07 |
JP2844589B2 true JP2844589B2 (ja) | 1999-01-06 |
Family
ID=17478974
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59269914A Expired - Lifetime JP2844589B2 (ja) | 1984-12-21 | 1984-12-21 | 音声信号符号化方法とその装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2844589B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2889243B2 (ja) * | 1988-03-22 | 1999-05-10 | 株式会社東芝 | 符号化方式及び復号化方式 |
JP2615862B2 (ja) * | 1988-06-14 | 1997-06-04 | 日本電気株式会社 | 音声符号化復号化方法とその装置 |
JP2829978B2 (ja) * | 1988-08-24 | 1998-12-02 | 日本電気株式会社 | 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置 |
JP2992998B2 (ja) * | 1988-09-21 | 1999-12-20 | 日本電気株式会社 | 音声符号化復号化装置 |
JP2940005B2 (ja) * | 1989-07-20 | 1999-08-25 | 日本電気株式会社 | 音声符号化装置 |
JP2658438B2 (ja) * | 1989-10-19 | 1997-09-30 | 日本電気株式会社 | 音声符号化方法とその装置 |
US6240384B1 (en) | 1995-12-04 | 2001-05-29 | Kabushiki Kaisha Toshiba | Speech synthesis method |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5860799A (ja) * | 1981-10-06 | 1983-04-11 | シャープ株式会社 | 音声デ−タの圧縮方法 |
JPS5911679A (ja) * | 1982-07-12 | 1984-01-21 | Hitachi Ltd | 電荷転送装置 |
-
1984
- 1984-12-21 JP JP59269914A patent/JP2844589B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPS61148500A (ja) | 1986-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2940005B2 (ja) | 音声符号化装置 | |
JP3134817B2 (ja) | 音声符号化復号装置 | |
JP3180762B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JP2844589B2 (ja) | 音声信号符号化方法とその装置 | |
JP2615548B2 (ja) | 高能率音声符号化方式とその装置 | |
JP3255190B2 (ja) | 音声符号化装置並びにその分析器及び合成器 | |
JP3303580B2 (ja) | 音声符号化装置 | |
JP2956068B2 (ja) | 音声符号化復号化方式 | |
JPH0258100A (ja) | 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置 | |
JP3319396B2 (ja) | 音声符号化装置ならびに音声符号化復号化装置 | |
JP2560682B2 (ja) | 音声信号符号化復号化方法とその装置 | |
JPH058839B2 (ja) | ||
JP2898641B2 (ja) | 音声符号化装置 | |
JP3063087B2 (ja) | 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置 | |
JP2844590B2 (ja) | 音声符号化方式とその装置 | |
JP2629762B2 (ja) | ピッチ抽出装置 | |
JP2853170B2 (ja) | 音声符号化復号化方式 | |
JP2508002B2 (ja) | 音声符号化方法とその装置 | |
JPS63127299A (ja) | 音声信号符号化・復号化方式およびその装置 | |
JP2946528B2 (ja) | 音声符号化復号化方法及びその装置 | |
JPH043878B2 (ja) | ||
JPS6396699A (ja) | 音声符号化装置 | |
JPH0632035B2 (ja) | 音声符号化方法とその装置 | |
JPH077275B2 (ja) | 音声信号符号化方式とその装置 | |
JPS62133498A (ja) | 音声符号化方法とその装置 |