JPH0632035B2 - 音声符号化方法とその装置 - Google Patents

音声符号化方法とその装置

Info

Publication number
JPH0632035B2
JPH0632035B2 JP59139634A JP13963484A JPH0632035B2 JP H0632035 B2 JPH0632035 B2 JP H0632035B2 JP 59139634 A JP59139634 A JP 59139634A JP 13963484 A JP13963484 A JP 13963484A JP H0632035 B2 JPH0632035 B2 JP H0632035B2
Authority
JP
Japan
Prior art keywords
parameter
pitch
signal
representing
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59139634A
Other languages
English (en)
Other versions
JPS6119000A (ja
Inventor
一範 小澤
卓 荒関
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP59139634A priority Critical patent/JPH0632035B2/ja
Priority to CA000486304A priority patent/CA1255802A/en
Priority to US06/751,818 priority patent/US4945565A/en
Publication of JPS6119000A publication Critical patent/JPS6119000A/ja
Publication of JPH0632035B2 publication Critical patent/JPH0632035B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声信号の低ビットレイト符号化方式とその装
置に関する。
(従来技術とその問題点) 音声信号を例えば16Kビット/秒程度以下の伝送情報量
で符号化するための方式として、最近マルチパルス駆動
形音声符号化方式が提案されている。これは、駆動音源
信号系列を表わす複数個のパルス系列(マルチパルス)
を、短時間毎に、符号器側でアナリシス バイ シンセ
シィス(NA−LYSIS−by-SYNTHESIS;A−b−
S)の手法を用いて逐次的に求め、このパルス系列を符
号化伝送する方式である。本発明はこの方式に関係する
ものである。この方式の詳細にいては、ビ−・エス・ア
タール(B.S.ATAL)氏らによるアイ・シー・エー・エス
・エス・ピー(I・C.A.S.S.P.)の予稿集、1982年614〜6
17頁に掲載の「ア・ニュー・モデル・オブ・エル・ピー
・シー・エクサイティション・フォー・プロデューシン
グ・ナチュラル・サウンディング・スピーチ・アット・
ロウ・ビット・レイツ」(“A NEW MODEL OF LPC
EXCITATION FOR PRODUCING NATURAL-SOUNDING SPEE
CH AT LOW BIT RATES”)と題した論文(文献1)に
説明されているので、ここでは簡単に説明を行なうにと
どめる。
第1図は、前記文献1に記載された従来方式における符
号器側の処理を示すブロック図である。図において、10
0は符号器入力端子を示し、A/D変換された音声信号系列
x(n)が入力される。110はバッファメモリ回路であり、
音声信号系列を1フレーム(例えば8KHzサンプリング
の場合でフレーム長を10msecとすると80サンプル)
分、蓄積する。バッファメモリ回路110の出力値は減算
器120と、Kパラメータ計算回路180とに出力される。但
し、文献1、によればKパラメータのかわりにレフレク
ション・コエフィシエンツ(REFE-CTION COEFEICIENT
S)と記載されているが、これはKパラメータと同一パ
ラメータである。Kパラメータ計算回路180は、バッフ
ァメモリ回路110の出力値を用い、共分散法に従って、
フレーム毎の音声信号スペクトルを表わすKパラメータ
を16次分(1≦i≦16)求め、これらを合成フィル
タ130へ出力する。140は、音源パルス発生回路であり、
1フレーム内にあらかじめ定められた個数のパルス系列
を発生させる。ここでは、このパルス系列をd(n)と記
する。音源パルス発生回路140によって発生された音源
パルス系列の一例を第2図に示す。第2図で横軸は離散
的な時刻を、縦軸は振幅をそれぞれに示す。ここでは、
1フレーム内に8個のパルスを発生させる場合について
示してある。音源パルス発生回路140によって発生され
たパルス系列d(n)は、合成フィルタ130を駆動する。合
成フィルタ130は、d(n)を入力し、音声信号x(n)に対
応する再生信号 を求め、これを減算器120へ出力する。ここで、合成フ
ィルタ130は、KパラメータKを入力し、これらを予
測パラメータa(1≦i≦16)へ変換し、aiを用いて
再生信号 を計算する。
は、d(n)とaを用いて下式のように表わすことがで
きる。
上式でPは合成フィルタの次数を示し、ここではP=16
としている。減算器120は、原信号 と再生信号x(n)との差e(n)を計算し、重み付け回路19
0へ出力する。190は、e(n)を入力し、重み付け関数w
(n)を用い、次式に従って重み付け誤差ew(n)を計算す
る。
ew(n)=w(n)*e(n) (2) 上式で、記号“*”はたたみこみ積分を表わす。また、
重み付け関数w(n)は、周波数軸上で重み付けを行なう
ものであり、そのZ変換値をW(Z)とすると、合成フィ
ルタの予測パラメータaを用いて、次式により表わさ
れる。
上式でrは0≦r≦1の定数であり、W(Z)の周波数特
性を決定する。つまり、r=1とすると、W(Z)=1と
なり、その周波数特性は平坦となる。一方、r=0とす
ると、W(Z)は合成フィルタの周波数特性の逆特性とな
る。従って、rの値によってW(Z)の特性を変えること
ができる。また、(3)式で示したようにW(Z)を合成フィ
ルタの周波数特性に依存させて決めているのは、聴感的
なマスク効果を利用しているためである。つまり、入力
音声信号のスペクトルのパワが大きな箇所では(例えば
フォルマントの近傍)、再生信号のスペクトルとの誤差
が少々大きくても、その誤差は耳につき難いという聴感
的な性質による。第3図に、あるフレームにおける入力
音声信号のスペクトルと、W(Z)の周波数特性の一例と
を示した。ここではr=0.8とした。図において、横軸
は周波数(最大4KHz)を、縦軸は対数振幅(最大60
dB)をそれぞれ示す。また、上部の曲線は音声信号の
スペクトルを、下部の曲線は重み付け関数の周波数特性
を表わしている。
第1図へ戻って、重み付け誤差e(n)は、誤差最小化
回路150へフィードバックされる。誤差最小化回路150
は、e(n)の値を1フレーム分記憶し、これらを用い
て次式に従い、重み付け2乗誤差εを計算する。
ここで、Nは2乗誤差を計算するサンプル数を示す。文
献1、の方式では、この時間長を5msecとしており、
これは8KHzサンプリングの場合にはN=40に相当す
る。次に、誤差最小化回路150は、前記(4)式で計算した
2乗誤差εを小さくするように音源パルス発生回路140
に対し、パルス位置及び振幅情報を与える。140は、こ
の情報に基づいて音源パルス系列を発生させる。合成フ
ィルタ130は、この音源パルス系列を駆動源として再生
信号 を計算する。次に減算器120では、先に計算した原信号
と再生信号との誤差e(n)から現在求まった再生信号 を減算して、これを新たな誤差e(n)とする。重み付け
回路190はe(n)を入力し重み付け誤差e(n)を計算
し、これを誤差最小化回路150へフィードバックする。
誤差最小化回路150は、再び2乗誤差を計算し、これを
小さくするように音源パルス系列の振幅と位置を調整す
る。こうして音源パルス系列の発生から誤差最小化によ
る音源パルス系列の調整までの一連の処理は、音源パル
ス系列のパルス数があらかじめ定められた数に達するま
でくり返され、音源パルス系列が決定される。
以上で従来方式の説明を終了する。
この方式の場合に、伝送すべき情報は、合成フィルタの
KパラメータK(1≦i≦16)と、音源パルス系列の
パルス位置及び振幅であり、1フレーム内にたてるパル
スの数によって任意の伝送レイトを実現できる。さら
に、伝送レイトを16Kbps以下とする領域に対して
は、良好な再生音質が得られ有効な方式の一つと考えら
れる。
しかしながら、この従来方式は、演算量が非常に多いと
いう欠点がある。これは音源パルス系列におけるパルス
の位置と振幅を計算する際に、そのパルスに基づいて再
生した信号と原信号との誤差及び2乗誤差を計算し、そ
れらをフィードバックさせて、2乗誤差を小さくするよ
うにパルス位置と振幅を調整していることに起因してい
る。
またこの従来方式によれば、伝送レイトを下げるとピッ
チ周波数の高い入力信号の場合、例えば女性の声を入力
した場合には、再生品質が劣化するという欠点があっ
た。これは、ピッチ周波数が高い場合には、ピッチ周波
数が低い場合に比べ、パルスを計算するためのフレーム
により多くのピッチ波形が含まれることになり、このピ
ッチ波形を良好に再生するためには、ピッチ周波数が低
い話者の場合を比べて、より多くの個数の音源パルスを
必要とするという理由による。
(発明の目的) 本発明の目的は、比較的少ない演算量で、低い伝送レイ
トに適用し得る高品質な音声符号方式とその装置を提供
することにある。
(発明の構成) 本発明によれば、送信側では離散的な音声信号系列を入
力し、あらかじめ定められた時間間隔毎にピッチを表す
ピッチパラメータと短時間スペクトル包絡を表すスペク
トルパラメータとを抽出して符号化し、前記音声信号系
列を前記ピッチパラメータのうちのピッチ周期に応じた
区間であって前記時間間隔よりも短い時間区間に分割
し、前記音声信号系列と前記スペクトルパラメータをも
とに前記音声信号系列を表すための駆動信号を前記時間
間隔に含まれる複数個の前記時間区間のうちの一部区間
について求めて符号化し、前記ピッチパラメータを表す
符号と前記スペクトルパラメータを表す符号と前記駆動
信号を表す符号とを組み合わせて出力し、受信側では前
記組み合わされた符号を入力し、前記ピッチパラメータ
を表す符号と前記スペクトルパラメータを表す符号と前
記駆動信号を表す符号とを分離して復号し、前記ピッチ
パラメータと前記復号された駆動信号をもとに前記時間
区間の駆動源信号を復元し前記復元された駆動音源信号
前記復号されたスペクトルパラメータ系列とを用いて前
記音声信号系列を生することを特徴とする音声符号化方
法が得られる。
また本発明によれば、入力音声信号系列からあらかじめ
定められた時間間隔毎にピッチを表すピッチパラメータ
と短時間スペクトル包絡を表すピッチパラメータとを抽
出し符号化するパラメータ計算回路と、前記音声信号系
列を前記ピッチパラメータのうちのピッチ周期に応じた
区間であって前記時間間隔よりも短い時間区間に分割
し、前記音声信号系列と前記スペクトルパラメータをも
とに前記音声信号系列を表すための駆動信号を前記時間
間隔に含まれる複数個の前記時間区間のうちの一部区間
について求めて符号化する駆動信号計算回路と、前記パ
ラメータ計算回路の出力符号と前記駆動信号を表す符号
とを組み合わせて出力するマルチプレクサ回路とを有す
ることを特徴とする音声符号化装置が得られる。
さらに本発明によれば離散的な音声信号系列をあらかじ
め定められた時間間隔毎にピッチを表すピッチパラメー
タと短時間スペクトル包絡を表すスペクトルパラメータ
とを抽出して符号化し、前記音声信号系列を前記ピッチ
パラメータのうちのピッチ周期に応じた区間であって前
記時間間隔よりも短い時間区間に分割し、前記音声信号
系列と前記スペクトルパラメータをもとに前記音声信号
系列を表すための駆動信号を前記時間間隔に含まれる複
数個の前記時間区間のうちの一部区間について求めて符
号化し、前記ピッチパラメータを表す符号と前記スペク
トルパラメータを表す符号と前記駆動信号を表す符号と
が組み合わされた信号を送信側から受け取り、 前記ピッチパラメータを表す符号と前記スペクトルパラ
メータ系列が表す符号と前記駆動信号を表す符号とを分
離して復号するデマルチプレクサ回路と、前記復号され
たピッチパラメータと前記復号された駆動信号をもとに
駆動音源信号を復元する駆動音源信号復元回路と、前記
駆動音源信号と前記復号されたスペクトルパラメータ系
列とを用いて音声信号系列を再生し出力する合成フィル
タ回路とを有することを特徴とする音声信号復号化装置
が得られる。
(実施例) 以下本発明の実施例について図面を参照して詳細に説明
する。第4図(a)は本発明による音声符号化方式の符号
器側の一実施例を示すブロック図であり、第4図(b)は
復号器側の一実施例を示すブロック図である。第4図
(a)において、音声信号系列x(n)は、入力端子195から
入力され、あらかじめ定められたサンプル数だけ区切ら
れてバッファメモリ回路340に蓄積される。次にKパラ
メータ計算回路280は、バッファメモリ回路340に蓄積さ
れている音声信号のうち、あらかじめ定められたサンプ
ル数を入力し、入力信号のスペクトル包絡を表わすLP
Cパラメータを計算する。LPCパラメータとしては種
々知られているが以下ではKパラメータを用いるものと
して説明を進める。尚、Kパラメータはパーコール係数
と同一のパラメータである。Kパラメータの計算法とし
ては代表的な方法として自己相関法と、共分散法がよく
知られている。ここでは自己相関法によるKパラメータ
の計算法を、ジョン・マクホウル(JOHN MA-KHOUL)氏
らによるアイ・イー・イー・イー・トランザクションズ
・オン・エー・エス・エス・ピー(IEEE TRANSACT
IONS ON A.S.S.P.)誌1975年6月号,309〜321頁に掲
載の「クォンタイゼイション・プロパティズ・オブ・ト
ランスミッション・パラメータズ・イン・リニア・プリ
ディクティブ・システムズ」(“QUA−NTIZATION PROP
ERTIES OF TRANSMI −SSION PARAMETERS IN LINE
AR PREDICTIVE SYSTEMS”)と題した論文(文献2.)
等に説明されている方法を引用して以下に示す。
=R(O) (5a) ▲a(i) i▼=k (5c) ▲a(i) j▼=▲a(i-1) j▼+ki・▲a(i-1) i-j▼,(1
≦j≦i-1) (5d) E=(1−▲k2 i▼)・Ei-1 (5e) a=aj (p),(1≦j≦p) (5f) 式(5a)から式(5f)はj=1,2,……pとして再帰的に解く
ことができる。式において、kiはi次目のKパラメータ
値を示す。またR(i)は入力信号に対する遅れ時間iの
自己相関々数を示す。pは予測分析次数を示す。▲a
(p) j▼は分析次数pの場合のj番目の線形予測係数を示
す。ここで式(5e)のEは次数iの予測における予測誤
差電力を示している。従って計算の各段階で次数iの予
測の予測誤差電力を監視することができる。Eiを用いて
正規化予測誤差は次式のように表わせる。
=Ei/R(O) (6) i=pの場合には(5e)式を用いて 表わせる。従ってKパラメータ値が既知の場合は、(7)
式を用いればp次予測分析の場合の正規化予測誤差を知
ることができる。以上で自己相関法によるKパラメータ
計算法の説明を終える。
第4図(a)に戻って、KパラメータKはKパラメータ
符号化回路200へ出力される。Kパラメータ符号化回路2
00は、あらかじめ定められた量子化ビット数に基づいて
を符号化し、符号lkiをマルチプレクサ450へ出力す
る。また、Kパラメータ符号化回路200は、lkiを復号化
して得たKパラメータ復号値k′iを用い前述の(5c),
(5d),(5f)式を用いて予測係数値a′iに変換し、イン
パルス応答計算回路210と重み付け回路410と合成フィル
タ回路400とへ出力する。
次にピッチ分析回路370は、バッファメモリ回路340の出
力である1フレーム分の音声信号を用いてピッチ周期p
を計算する。pの計算法としては、例えばアール・
ブイ・コックス・(R.V.COX)氏らによるアイ・イー・
イー・イー・トランザクシュンズ・オン・エー・エス・
エス・ピー(IEEE TRANSACTIONS ON A.S.S.P)誌198
3年2月号,258〜272頁に掲載の「リアルータイム・イ
ンプリメンティション・オブ・タイム・ドメイン・ハー
モニック・スケーリング・オブ・スピーチ・フォー・レ
イト・モディフィケーション・アンド・コーディング」
(“REAL−TIME IMPLEMENTATION OF TIME DOMAIN
HARMONIC SCALING OF SPEECH FOR RATE MODIFICAT
ION AND CODING”)と題した論文(文献3)等に説明
されている音声信号の自己相関々数を用いて計算する方
法が知られている。また、他の衆知な方法を用いて計算
することもできるし、音声信号を予測した後の予測残差
信号から計算することもできる。ピッチ符号化回路380
は、ピッチ周期pdを入力し、あらかじめ定められた量
子化ビット数で量子化符号し、符号lををマルチプレ
クサ450へ出力する。また、符号lを復号化して得た
p′dをパルス発生回路390とパルス発生回路420へ出力
する。
次にインパルス応答計算回路210は、Kパラメータ符号
化回路200から予測係数値a′を入力し、次式で示さ
れる重み付けされた合成フィルタの伝達関数を表わすイ
ンパルス応答h(n)を、あらかじめ定められたサンプ
ル数だけ計算する。
ここでpは予測係数値a′iの次数を示す。
ここでH(Z)は重み付けされた合成フィルタのZ変換
上での伝達関数を示す。また、W(Z)は前述の(3)式で示
した重み付け関数のZ変換表現である。インパルス応答
計算回路210はインパルス応答h(n)を自己相関々数計
算回路360と相互相関々数計算回路350とへ出力する。
次に自己相関々数計算回路360は、インパルス応答計算
回路210からインパルス応答h(n)を入力し、次式に従
って自己相関々数Rhh(・)をあらかじめ定められた遅れ
時間τだけ計算する。
自己相関々数Rhh(τ)は駆動信号計算回路390へ出力さ
れる。
次に減算器285は、バッファメモリ回路340に蓄積された
音声信号x(n)を入力し、x(n)から合成フィルタ回路40
0の出力系列を1フレームサンプル分減算し、減算結果
e(n)を重み付け回路410へ出力する。
次に重み付け回路410は、減算器285から減算結果e(n)
を入力し、またKパラメータ計算回路200から予測係数
値a′iを入力し、e(n)に対して重み付けを施しew(n)
を出力する。ここでew(n)はZ変換表現で次式のように
書ける。
w(Z)=E(Z)・W(Z) (10) ここでEw(Z),E(Z)はそれぞれe(n)のZ変換値,e
(n)のZ変換値を示す。またW(Z)は前記(3)式で示され
る重み付け関数のZ変換値を示す。重み付け回路410
は、e(n)を相互相関々数計算回路350へ出力する。
次に相互相関々数計算回路350は、重み付け回路410から
(n)を入力し、またインパルス応答計算回路210から
インパルス応答h(n)を入力し、次式に従って相互相
関々数hx(n)をあらかじめ定められたサンプル数だけ
計算する。
相互相関々数hx(・)はパルス計算回路390へ出力され
る。
次に駆動信号計算回路390の説明を行なう。駆動信号計
算回路では、音声信号を良好に表わす駆動信号として、
パルス系列を計算する。駆動信号計算回路390を例えば
信号処理専用のシグナルプロセッサチップを用いて実現
した場合を想定して、処理の流れ図を第5図の破線部の
内側に示す。図において、プロック604では端子600から
相互相関々数hx(・)を入力し、端子601から自己相関々
数Rhh(・)を入力し、端子601から自己相関々数Rhh(・)
を入力し、端子602からピッチ周期p′dを入力する。ま
た端子603からe(n)を入力する。ブロック605におい
て変数iに1がセットされる。ここでiはピッチ周期
p′d毎に分割したサブフレームの番号を表わすインデ
ックスである。
ブロック620では、ピッチ周期p′dを用いて、フレーム
をp′dサンプル毎のサブフレームに分割する。また、
ブロック620ではピッチ周期p′dを用いて1フレーム中
のサブフレーム数Mが計算される。また、ブロック620
では各サブフレーム区間及び残りの区間に求められるパ
ルス数が次のように計算される。ここで各ピッチサブフ
レーム区間及び残りの区間のパルス数をそれぞれLP,LR
とし、1フレーム当たりのパルス数をLとすると、L
及びLは次式を満足するように M・L+L=L (12) 決定される。
次にブロック630では、第1番目のサブフレームにたて
る音源パルスをL個だけ計算する。ここで源パルスは
次式に従って1パルスず順次計算される。
上式でgi,miはi番目のパルスの振幅,位置をそれぞれ
示す。またhx,Rhhは相互相関々数,自己相関々数を
それぞれ示す。(13)式に従うパルス計算過程を第6図に
示す。
第6図(a)は相互相関々数計算回路350で計算され、パル
ス計算回路390へ出力された相互相関々数hxのピッチ
サブフレーム分の例を示す。図において横軸はサブフレ
ーム内のサンプル時刻を示す。縦軸は振幅である。第6
図(b)は(12)式に従って求めた第1番目のパルスg1を示
す図である。第6図(c)は第6図(b)で求めたパルスの影
響を差し引いた後の図である。第6図(d)は第2番目の
パルスg2を求めた図である。第6図(e)は第2番目のパ
ルスg2の影響を差し引いた後の図である。第6図(d)か
ら(e)の処理をくり返してL個のパルスが探索され
る。
次に、第7図にブロック620と630の動作例を示す。第7
図(a)は1フレーム分の音声信号系列を示す。また第7
図(b)は1フレームをサブフレームに分割して、第1番
目のサブフレームにおける音源パルスを(13)式に従って
求めた図を示す。この図ではサブフレーム数Mは4,サ
ブフレームあたりの音源パルス数Lpは6としてある。
第5図に戻って、ブロック640ではサブフレームインデ
ックスiをインクリメントする。ブロック640及び650の
処理はもう一度くり返される。ブロック640では第2番
目のサブフレームにおける音源パルスが前記(13)式に従
ってL個計算され、ブロック650ではサブフレームイ
ンデックスiがインクリメントされる。
次にブロック650では、まず最初に次の2種類のS/N
が計算される。一は第1番目のサブフレーム区間で求め
た音源パルスを、ピッチ周期p′dだけずらせながら第
2番目のサブフレーム区間でくり返した場合のS/N(S/N
1)。もう一つは第2番目のサブフレームにおいて新た
に計算された音源パルスを用いた場合のS/N(P/N2)であ
る。ここでS/Nの計算は次式に従う。
(14)式でRee(O)は、端子603から入力した信号ew(n)に
関するサブフレーム区間での電力を示す。
次にブロック660では、S/N1とS/N2とのRを次式に従っ
て求める。
またブロック660では(15)式に従い求めたRの値をあら
かじめ定められたしきい値Thと比較し、第1番目のサ
ブフレームで求めた音源パルスを第2番目のサブフレー
ムでくり返すか否かの判別を行なう。もしR≦Thなら
ば、パルスをくり返すこととし、リピート情報Rp(1ビ
ット)にあらかじめ定められた値(例えば0)をセット
し、ブロック680へ進む。一方、R>Thならば、パル
スをくり返さないこととし、ブロック670へ進む。パル
スをくり返さない場合に、ブロック670では、第1番目
のサブフレーム及び第2番目のサブフレームで求めたパ
ルスの個数をそれぞれサブフレーム当たり1/2にまび
く。具体的な方法としては例えば、パルスの絶対値振幅
の大きな方から、パルスをLp/2個だけ選択する方法
が考えられる。またブロック670では、Rにあらかじ
め定められた値(例えば1)をセットし、ブロック680
へ進む。
次にブロック680では、サブフレームインデックスiを
インクリメントし、ブロック690へ進む。ブロック690で
は、iがサブフレーム分割数Mを越えたか否かを判別す
る。もしiがMを越えてなければブロック630へ飛び、
ブロック690までの処理をくり返す。もしiがMを越え
ていればブロック700へ進む。次にブロック700では、残
りの区間に入るパルスをL個だけ、(13)式に従って求
める。次にブロック710では、以上の処理によって求め
たパルス列を端子720から出力し、リピート情報R
端子760から出力する。ここで出力されたパルス列の一
例を第7図(c)に示す。この図では第2番目のサブフレ
ーム及び第4番目のサブフレームは、それぞれ第1番
目,第3番目のサブフレームで求めたパルスをくり返す
ので、新たにパルスを求めてはいない。この図は、フレ
ーム当たりのパルス数を13とした例であり、第1番目と
第3番目のサブフレームにはパルスを6個、残りのサブ
フレームにはパルスを1個求めて、フレーム全体でパル
ス数を13としている。
以上で駆動信号計算回路390の説明を終了する。駆動信
号計算回路390で求めたパルス列は、符号化回路470へ出
力され、リピート情報Rは駆動音源信号復元回路420
とマルチプレクサ450へ出力される。
次に符号化回路470は、入力したパルスの振幅、位置を
符号化し、マルチプレクサ450へ出力する。また、パル
スの振幅、位置の復号値g′i,m′iをパルス発生回路
420へ出力する。ここでパルス系列の符号化法は種々考
えられる。一つは、パルス列の振幅、位置を別々に符号
化する方法であり、また一つは振幅、位置を一緒に符号
化する方法である。
前者の方法について一例を説明する。まず、パルス系列
の振幅の符号化法としては、フレーム内のパルス系列の
振幅の最大値を正規化係数として、この値を用いて各パ
ルスの振幅を正規化した後に、量子化,符号化する方法
が考えられる。また、他の方法としては、振幅の確率分
布を正規型と仮定して、正規型の場合の最適量子化器を
用いる方法が考えられる。これについては、ジェー・マ
ックス(J・MAX)氏によるアイ・アール・イー・トラ
ンザクションズ・オン・インフォメーション・セオリー
(IRE TRANSACTIONS ON INFORMATION THEORY)の19
60年3月号、7〜12頁に掲載の「クオンタイジング・フ
ォー・ミニマム・ディストーション」(“QUANTIZING
FOR MINIMUMDISTORTION”)と題した論文(文献4)等
に詳述されているので、ここでは説明を省略する。更
に、各パルスの振幅を直交関係にある他のパラメータに
変換した後に量子化、符号化を施してもよい。また、パ
ルス振幅毎にビット割り当てを換えてもよい。次に、パ
ルス位置の符号化についても種々の方法が考えられる。
例えば、ファクシミリ信号符号化の分野でよく知られて
いるランレングス符号等を用いてもよい。これは符号
“0”または“1”の続く長さをあらかじめ定められた
符号系列を用いて表わすものである。また、正規化係数
の符号化には、従来よく知られている対数圧縮符号化等
を用いることができる。
尚、パルス系列の符号化に関しては、ここで説明した符
号化方法に限らず、衆知の最良の方法を用いることがで
きることは勿論である。
次にマルチプレクサ450は、Kパラメータ符号化回路200
の出力符号lkiとピッチ符号化回路380の出力符号l
駆動信号計算回路390からのリピート情報Rと符号化
回路470の出力符号を入力し、これらを組み合わせて送
信側出力端子480から通信路へ出力する。以上で本発明
による音声符号化方式の符号器側の説明を終える。
次に本発明による音声符号化方式の復号器側について第
4図(b)を参照して説明する。デマルチプレクサ500は受
信側入力端子490から入力した符号のうち、Kパラメー
タを表わす符号と、ピッチ周期を表わす符号と、リピー
ト情報と、パルス系列を表わす符号とを分離する。更に
Kパラメータを表わす符号をKパラメータ復号回路520
へ出力し、ピッチ周期を表わす符号をピッチ復号回路51
0へ出力し、リピート情報を駆動信号復元回路540へ出力
し、パルス系列を表わす符号をパルス復号回路530へ出
力する。
第4図(a)に戻って、駆動音源信号復元回路420は符号化
回路470からパルス系列復号値g′i,m′iを入力す
る。また駆動信号計算回路390からリピート情報R
入力する。またピッチ符号化回路380からピッチ周期復
号値P′dを入力する。駆動音源信号復元回路420はこれ
らの情報を用いて駆動音源信号を発生し、合成フィルタ
回路400へ出力する。
合成フィルタ回路400は、駆動源信号復元回路420から駆
動音源信号を入力し、Kパラメータ符号化回路200から
予測係数復号値aiを入力する。合成フィルタ回路400
は、入力した駆動音源信号と予測係数復号値aiとを用い
て1フレーム分の応答信号系列 を次式に従って計算する。
ここで の値は2フレーム分(1≦n≦2N)計算される。d
(n)は駆動音源信号を表わし、1≦n≦Nでは駆動源信
号復元回路420から入力した駆動音源信号を用いる。ま
たN+1≦n≦2Nでは全て0の系列を用いる。(16)式
で求めた のうち、2フレーム目の (N+1≦n≦2N)の値が減算器285へ出力される。
次にKパラメータ復号回路520は、Kパラメータを復号
し、Kパラメータ復号値K′を合成フィルタ回路550
へ出力する。
次にピッチ復号回路510はピッチ周期を復号しp′dをパ
ルス発生回路540へ出力する。
次に音源パルス復号回路530は、音源パルス系列の振
幅、位置を復号し、それぞれgi′,mi′として駆動信号
復元回路540へ出力する。
次に駆動音源信号復元回路540は、符号器側の駆動音源
信号復元回路420と同一の動作をする。ピッチ周期復号
値p′dを用いて、フレームをサブフレームに分割し、
サブフレームに発生させるパルス数Lp,LRを計算する。
この処理には、符号器側の駆動信号計算回路390におけ
る方法と同一の方法を用いる。また駆動音源信号復元回
路は、音源パルス系列の振幅、位置の復号値gi′,mi
とリピート情報Rを用いてサブフレームにパルスを発
生させる。もし偶数番目のサブフレームにおいて、リピ
ート情報がパルスのくり返しを示している場合は、1つ
前のサブフレームのパルスをp′dだけずらしてくり返
す。一方、パルスをくり返さない場合はLp/2個のパルス
を発生させる。全てのサブフレームに対してこれらの処
理を行なう。最後に、残った区間にL個のパルスを発
生させる。以上のようにして発生されたパルスは駆動音
源信号として、合成フィルタ回路550へ出力される。
次に合成フィルタ回路550は、駆動音源信号とKパラメ
ータ復号値Ki′とを入力する。Kパラメータ復号値Ki
は前述の(5c),(5d),(5f)式を用いて予測係数値
a′iに変換される。合成フィルタ回路550は、次式に従
って合成信号 を1フレーム分計算し、受信側出力端子560から出力す
る。
ここでd(n)は駆動音源信号復元回路540から入力した駆
動音源信号を示す。以上で本発明による復号器側の説明
を終える。
本実施例においては、パルス探索アルゴリズムとして前
述の(13)式を用いたが、これは他のパルス探索アルゴリ
ズムを用いてもよい。例えば従来例として文献1に示し
た方式を用いてもよい。
また、(13)式の方法ではパルスを1つずつ順番に探索し
ていたが、パルスを1つ求める毎にこれより過去に求ま
った複数個のパルスの振幅を再調整するような方法を用
いてもよい。
また本実施例では、音源パルスのまびき方として2対1
のまびきについて説明したが、これ以外の比率のまびき
を行なうこともできる。
また本実施例では、送信側でパルスをまびくか否かを判
別し受信側にリピート情報Rを送っていたが、リピー
ト情報は送らず、送信側ではあらかじめ定められたまび
き率で常にまびき、受信側では送られたパルスを用いて
あらかじめ定められた回数だけ常にくり返す構成として
もよい。
また本実施例では、あるサブフレーム(j番目のサブフ
レームとする)でパルスをまびかない場合には、j番目
のサブフレームとj−1番目のサブフレームにおいて、
/2個のパルスを求めていたが、これはj−1番目
とj番目の2つのサブフレーム全体に対してL個のパ
ルスを求めるようにしてもよい。
また本実施例では、パルスをまびくか否かの判別には、
パルスをサブフレーム毎に計算して用いていたが、これ
はフレームに対してあらかじめ定められた個数のパルス
を計算しておき、このパルスを用いてサブフレーム毎に
上記判別処理を行なってもい。
また本実施例では、駆動信号計算回路390において、フ
レームをピッチ周期p′dに応じたサブフレームに分割
する際に、第7図(b),(c)に示したように、フレームの
左端からp′dサンプル毎にサブフレームに分割した。
サブフレームの分割法としては次のようにしてもよい。
まず、フレームに対してあらかじめ定められた個数のパ
ルスを計算する。次に求まったパルスのうち、フレーム
の左端に最も近いパルスの近傍を始点Tとして、p′d
サンプル毎にサブフレームに分割するようにしてもよ
い。このようにした場合は、始点Tの位置を受信側へ伝
送する必要がある。これには例えば、フレーム左端から
始点Tまでの距離Tをあらかじめ定められた長さの符
号で表わして伝送してもよいし、Tとピッチ周期p′
dとの比をあらかじめ定められた長さの符号で表わして
伝送してもよい。
また受信側においてまびかれたパルスを復元する際に、
本実施例では一つ過去のサブフレームにおけるパルスを
くり返していたが、これは次のようにしてもよい。今、
パルスがまびかれたサブフレームの番号をjとすると、
j−1番目のサブフレームにおけるパルスとj+1番目
のサブフレームにおけるパルスとを用いてj番目のサブ
フレームにおけるパルスを補間して求めるようにしても
よい。
また本実施例では、ピッチ周期に応じて分割したサブフ
レームが、次のフレームにまたがる際には、現在のフレ
ームの最後のサブフレームはパルスのまびき処理を行な
わずに、パルスをあらかじめ定められた個数だけ新たに
求め直して伝送していた。これは例えば以下のようにし
てもよい。サブフレームが次のフレームにまたがる際に
は、次のフレームの信号を入力し、フレームをまたいで
サブフレームの分割を行ない、パルスのまびき処理を次
のフレームにわたって連続的に行なうようにしてもよ
い。また別の方法としては、次のフレームにまたがるサ
ブフレームにおいて、サブフレームが現フレームに存在
する時間区間だけパルスまびき処理を行ない、サブフレ
ームの残りの時間区間に関しては、次のフレームにおい
て行なうようにしてもよい。
またフレーム毎の音声信号に対して有声,無声判別を行
ない、有声と判別されたフレームについて、パルスのま
びき処理を行なうようにしてもよい。この有声,無声判
別には例えば、よく知られているように、音声信号また
は予測残差信号の自己相関または共分散関数のピッチ周
期だけ離れた時刻の値を用いることができる。
また本実施例では、受信側においてまびかれたパルスを
復元するために用いるピッチ周期p′dとして、送信側
で求めたピッチ周期を受信して用いる成としたが、ピッ
チ周期は伝送せずに、受信側では受信したパルス系列ま
たは過去に合成された合成信号系列 の周期性からピッチ周期p′dを抽出し、これをもとに
まびかれたパルスを復元するような構成としてもよい。
本実施例の構成においては、短時間スペクトル構造を表
わすインパルス応答系列の自己相関々数を計算する際
に、インパルス応答計算回路210によってKパラメータ
復号値を用いてインパルス応答を計算した後に、このイ
ンパルス応答を用いて自己相関々数計算回路360にて自
己相関々数を計算していた。ディジタル信号処理の分野
でく知られているように、インパルス応答の自己相関々
数はパワスペクトルと対応関係にある。従ってまずKパ
ラメータ復号値を用いてパワスペクトルを求め、その後
にこの対応関係を用いて自己相関々数を計算するような
構成としてもよい。一方、音声信号と短時間スペクトル
包絡を表わすインパルス応答との相互関々数を計算する
際に、本実施例の構成では重み付け回路410の出力値e
(n)とKパラメータ復号値K′iを用いてインパルス応
答計算回路210にて計算したインパルス応答h(n)を用
いて相互相関々数hx(・)を計算していた。よく知られ
ているように、相互相関々数はクロス・パワスペクトル
と対応関係にある。従ってまずe(n)とK′iとを用い
てクロス・パワスペクトルを求め、その後に相互相関々
数を計算するような構成としてもよい。尚、パワスペク
トルと自己相関々数との対応関係、クロスパワスペクト
ルと相互相関々数との対応関係については、エー・ブイ
・オッペンハイム(A.V.OPPENHEIM)氏らによる「ディ
ジタル信号処理」(“DIGITAL SIGNAL PROCESSIN
G”)と題した単行本(文献)の第8章にそ詳細に説明
されているので、ここでは説明を省略する。
本実施例においては、1フレーム内のパルス系列の符号
化は、パルス系列が全て求まった後に、第4図(a)の符
号化回路470によって符号化を施したが、符号化をパル
ス系列の計算に含めて、パルスを1つ計算する毎に、符
号化を行ない、次のパルスる計算するという構成にして
もよい。このような構成をとることとによって、符号化
の歪をも含めた誤差を最小とするようなパルス系列が求
まるので、更に品質を向上させることができる。
(本発明の効果) 以上説明したように本発明によれば、送信側ではピッチ
サブフレームのパルスをあらかじめ定められたまびき率
で時間的にまびて伝送し、受信側では受信したパルスを
用いて、まびかれたパルスを復元し音声を合成するよう
にしているので、伝送レイトが低い場合にも高品質な音
声を合成できるという効果がある。
【図面の簡単な説明】
第1図は従来方式の構成を示すブロック図、第2図は音
源パルス系列の一例を示す図、第3図は入力音声信号系
列の周波数特性と第1図に記載の重み付け回路の周波数
特性の一例を示す図、第4図(a),(b)は本発明による音
声符号化方式の一実施例を示すブロック図、第5図はパ
ルス計算回路390の処理内容の一例を示す図、第6図は
パルス計算過程の一例を示す図、第7図は第5図のブロ
ック620と630の動作例を示す図である。 図において、110,340……バッファメモリ回路、120,2
85……減算回路、130,400,550……合成フィルタ回
路、420,540……駆動音源信号復元回路、150……誤差
最小化回路、180,280……Kパラメータ計算回路、19
0,410……重み付け回路、200……Kパラメータ符号化
回路、210……インパルス応答計算回路、350……相互相
関計算回路、360……自己相関計算回路、370……ピッチ
分析回路、380……ピッチ符号化回路、390……パルス計
算回路、470…符号化回路、450……マルチプレクサ、50
0……デマルチプレクサ、510……ピッチ復号回路、520
……Kパラメータ復号回路、530……音源パルス復号回
路をそれぞれ示す。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】送信側では離散的な音声信号系列を入力
    し、あらかじめ定められた時間間隔毎にピッチを表すピ
    ッチパラメータと短時間スペクトル包絡を表すスペクト
    ルパラメータとを抽出して符号化し、前記音声信号系列
    を前記ピッチパラメータのうちのピッチ周期に応じた区
    間であって前記時間間隔よりも短い時間区間に分割し、
    前記音声信号系列と前記スペクトルパラメータをもとに
    前記音声信号系列を表すための駆動信号を前記時間間隔
    に含まれる複数個の前記時間区間のうちの一部区間につ
    いて求めて符号化し、前記ピッチパラメータを表す符号
    と前記スペクトルパラメータを表す符号と前記駆動信号
    を表す符号とを組み合わせて出力し、受信側では前記組
    み合わされた符号を入力し、前記ピッチパラメータを表
    す符号と前記スペクトルパラメータを表す符号と前記駆
    動信号を表す符号とを分離して復号し、前記ピッチパラ
    メータと前記復号された駆動信号をもとに前記時間区間
    の駆動音源信号を復元し前記復元された駆動音源信号前
    記復号されたスペクトルパラメータ系列とを用いて前記
    音声信号系列を再生することを特徴とする音声符号化方
    法。
  2. 【請求項2】入力音声信号系列からあらかじめ定められ
    た時間間隔毎にピッチを表すピッチパラメータと短時間
    スペクトル包絡を表すピッチパラメータとを抽出し符号
    化するパラメータ計算回路と、前記音声信号系列を前記
    ピッチパラメータのうちのピッチ周期に応じた区間であ
    って前記時間間隔よりも短い時間区間に分割し、前記音
    声信号系列と前記スペクトルパラメータをもとに前記音
    声信号系列を表すための駆動信号を前記時間間隔に含ま
    れる複数個の前記時間区間のうちの一部区間について求
    めて符号化する駆動信号計算回路と、前記パラメータ計
    算回路の出力符号と前記駆動信号を表す符号とを組み合
    わせて出力するマルチプレクサ回路とを有することを特
    徴とする音声符号化装置。
  3. 【請求項3】離散的な音声信号系列をあらかじめ定めら
    れた時間間隔毎にピッチを表すピッチパラメータと短時
    間スペクトル包絡を表すスペクトルパラメータとを抽出
    して符号化し、前記音声信号系列を前記ピッチパラメー
    タのうちのピッチ周期に応じた区間であって前記時間間
    隔よりも短い時間区間に分割し、前記音声信号系列と前
    記スペクトルパラメータをもとに前記音声信号系列を表
    すための駆動信号を前記時間間隔に含まれる複数個の前
    記時間区間のうちの一部区間について求めて符号化し、
    前記ピッチパラメータを表す符号と前記スペクトルパラ
    メータを表す符号と前記駆動信号を表す符号とが組み合
    わされた信号を送信側から受け取り、 前記ピッチパラメータを表す符号と前記スペクトルパラ
    メータ系列を表す符号と前記駆動信号を表す符号とを分
    離して復号するデマルチプレクサ回路と、前記復号され
    たピッチパラメータと前記復号された駆動信号をもとに
    駆動音源信号を復元する駆動音源信号復元回路と、前記
    駆動音源信号と前記復号されたスペクトルパラメータ系
    列とを用いて音声信号系列を再生し出力する合成フィル
    タ回路とを有することを特徴とする音声信号復号化装
    置。
JP59139634A 1984-07-05 1984-07-05 音声符号化方法とその装置 Expired - Lifetime JPH0632035B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP59139634A JPH0632035B2 (ja) 1984-07-05 1984-07-05 音声符号化方法とその装置
CA000486304A CA1255802A (en) 1984-07-05 1985-07-04 Low bit-rate pattern encoding and decoding with a reduced number of excitation pulses
US06/751,818 US4945565A (en) 1984-07-05 1985-07-05 Low bit-rate pattern encoding and decoding with a reduced number of excitation pulses

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59139634A JPH0632035B2 (ja) 1984-07-05 1984-07-05 音声符号化方法とその装置

Publications (2)

Publication Number Publication Date
JPS6119000A JPS6119000A (ja) 1986-01-27
JPH0632035B2 true JPH0632035B2 (ja) 1994-04-27

Family

ID=15249846

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59139634A Expired - Lifetime JPH0632035B2 (ja) 1984-07-05 1984-07-05 音声符号化方法とその装置

Country Status (1)

Country Link
JP (1) JPH0632035B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011033672A (ja) * 2009-07-30 2011-02-17 Fujitsu Ltd 音声信号変換装置、音声信号変換方法および音声信号変換プログラム

Also Published As

Publication number Publication date
JPS6119000A (ja) 1986-01-27

Similar Documents

Publication Publication Date Title
JPH0353300A (ja) 音声符号化装置
US4945565A (en) Low bit-rate pattern encoding and decoding with a reduced number of excitation pulses
JP2903533B2 (ja) 音声符号化方式
JP2615548B2 (ja) 高能率音声符号化方式とその装置
JP2844589B2 (ja) 音声信号符号化方法とその装置
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JP3303580B2 (ja) 音声符号化装置
JP2560682B2 (ja) 音声信号符号化復号化方法とその装置
JPH0632035B2 (ja) 音声符号化方法とその装置
JPH058839B2 (ja)
JP2900431B2 (ja) 音声信号符号化装置
JPH077275B2 (ja) 音声信号符号化方式とその装置
JP2946528B2 (ja) 音声符号化復号化方法及びその装置
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP2853170B2 (ja) 音声符号化復号化方式
JP2508002B2 (ja) 音声符号化方法とその装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP3055901B2 (ja) 音声信号符号化復号化方法及び音声信号符号化装置
JPH0481199B2 (ja)
JP2844590B2 (ja) 音声符号化方式とその装置
JPH0632032B2 (ja) 音声帯域信号符号化方法とその装置
JP2615862B2 (ja) 音声符号化復号化方法とその装置
JPH0683149B2 (ja) 音声帯域信号符号化・復号化装置
JPH043878B2 (ja)
JPH02160300A (ja) 音声符号化方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term