JPH077275B2 - 音声信号符号化方式とその装置 - Google Patents

音声信号符号化方式とその装置

Info

Publication number
JPH077275B2
JPH077275B2 JP59143017A JP14301784A JPH077275B2 JP H077275 B2 JPH077275 B2 JP H077275B2 JP 59143017 A JP59143017 A JP 59143017A JP 14301784 A JP14301784 A JP 14301784A JP H077275 B2 JPH077275 B2 JP H077275B2
Authority
JP
Japan
Prior art keywords
parameter
signal
pulse
pitch
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59143017A
Other languages
English (en)
Other versions
JPS6120997A (ja
Inventor
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP59143017A priority Critical patent/JPH077275B2/ja
Priority to CA000486304A priority patent/CA1255802A/en
Priority to US06/751,818 priority patent/US4945565A/en
Publication of JPS6120997A publication Critical patent/JPS6120997A/ja
Publication of JPH077275B2 publication Critical patent/JPH077275B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Analogue/Digital Conversion (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声信号の低ビットレイト符号化方式とその装
置に関する。
(従来技術とその問題点) 音声信号を例えば16Kビット/秒程度以下の伝送情報量
で符号化するための方式として、最近マルチパルス駆動
形音声符号化方式が提案されている。これは、駆動音源
信号系列を表わす複数個のパルス系列(マルチパルス)
を、短時間毎に、符号器側でアナリミス バイ シンセ
シィス(NALYSIS−by−YNTHESIS;A−b−S)の手
法を用いて遂次的に求め、このパルス系列を符号化伝送
する方式である。本発明はこの方式に関係するものであ
る。この方式の詳細については、ビー・エス・アタール
(B.S・ATAL)氏らによるアイ・シー・エー・エス・エ
ス・ピー(I.C.A.S・S・P・)の予稿集、1952年614〜
617頁に掲載の「ア・ニュー・モデル・オブ・エル・ピ
ー・シー・エクサイティション・フォー・プロデューシ
ング・ナチュラル・サウンディング・スピーチ・アット
・ロウ・ビット・レイツ」(“A NEW MODEL OF LPC EXC
ITATION FOR PRODUCING NATURAL−SOUNDING SPEECH AT
LOW BIT RATES")と題した論文(文献1)に説明されて
いるので、ここでは簡単な説明を行なうにとどめる。
第1図は、前記文献1、に記載された従来方式における
符号器側の処理を示すブロック図である。図において、
100は符号器入力端子を示し、A/D変換された音声信号系
列x(n)が入力される。110はバッファメモリ回路で
あり、音声信号系列を1フレーム(例えば8kHzサンプリ
ングの場合でフレーム長を10msecとすると80サンプル)
分、蓄積する。バッファメモリ回路110の出力値は減算
器120と、Kパラメータ計算回路180とに出力される。但
し、文献1、によればKパラメータのかわりにレフレク
ション・コエフィシエンツ(REFLECTION COEFFICIENT
S)の記載されているが、これはKパラメータと同一の
パラメータである。Kパラメータ計算回路180は、バッ
ファメモリ回路110の出力値を用い、共分散法に従っ
て、フレーム毎の音声信号スペクトルを表わすKパラメ
ータKiを16次分(1i16)求め、これらを合成フィ
ルタ130へ出力する。140は、音源パルス発生回路であ
り、1フレーム内にあらかじめ定められた個数のパルス
系列を発生させる。ここでは、このパルス系列をd
(n)と記する。音源パルス発生回路140によって発生
された音源パルス系列の一例を第2図に示す。第2図で
横軸は離散的な時刻を、縦軸は振幅をそれぞれに示す。
ここでは、1フレーム内に8個のパルスを発生させる場
合について示してある。音源パルス発生回路140によっ
て発生されたパルス系列d(n)は、合成フィルタ130
を駆動する。合成フィルタ130は、d(n)を入力し、
音声信号x(n)に対応する再生信号(n)を求め、
これを減算器120へ出力する。ここで、合成フィルタ130
は、KパラメータKiを入力し、これらを予測パラメータ
ai(1≦i≦16)へ変換し、aiを用いて再生信号
(n)を計算する。(n)は、d(n)とaiを用いて
下式のように表わすことができる。
上式でPは合成フィルタの次数を示し、ここではP=16
としている。減算器120は、原信号(n)と再生信号
x(n)との差e(n)を計算し、重み付け回路190へ
出力する。190は、e(n)を入力し、重み付け関数w
(n)を用い、次式に従って重み付け誤差ew(n)を計
算する。
ew(n)=w(n)*e(n) (2) 上式で、記号“*”はたたみこみ積分を表わす。また、
重み付け関数w(n)は、周波数軸上で重み付けを行な
うものであり、そのZ変数値をW(Z)とすると、合成
フィルタの予測パラメータaiを用いて、次式により表わ
される。
上式でrは0≦r≦1の定数であり、W(Z)の周波数
特性を決定する。つまり、r=1とすると、W(Z)=
1となり、その周波数特性は平坦となる。一方、r=0
とすると、W(Z)は合成フィルタの周波数特性の逆特
性となる。従って、rの値によってW(Z)の特性を変
えることができる。また、(3)式で示したようにW
(Z)を合成フィルタの周波数特性に依存させて決めて
いるのは、聴感的なマスク効果を利用しているためであ
る。つまり、入力音声信号のスペクトルのパワが大きな
箇所では(例えばフォルマントの近傍)、再生信号のス
ペクトルとの誤差が少々大きくても、その誤差は耳につ
き難いという聴感的な性質による。第3図に、あるフレ
ームにおける入力音声信号のスペクトルと、W(Z)の
周波数特性の一例とを示した。ここではr=0.8とし
た。図において、横軸は周波数(最大4kHz)を、縦軸は
対数振幅(最大60bB)をそれぞれ示す。また、上部の曲
線は音声信号のスペクトルを、下部の曲線は重み付け関
数の周波数特性を表わしている。
第1図へ戻って、重み付け誤差ew(n)は、誤差最小化
回路150へフィードバックされる。誤差最小化回路150
は、ew(n)の値を1フレーム分記憶し、これらを用い
て次式に従い、重み付け2乗誤差εを計算する。
ここで、Nは2乗誤差を計算するサンプル数を示す。文
献1、の方式では、この時間長を5msecとしており、こ
れは8kHzサンプリングの場合にはN=40に相当する。次
に、誤差最小化回路150は、前記(4)式で計算した2
乗誤差εを小さくするように音源パルス発生回路140に
対し、パルス位置及び振幅情報を与える。140は、この
情報に基づいて音源パルス系列を発生させる。合成フィ
ルタ130は、この音源パルス系列を駆動源として再生信
号(n)を計算する。次に減算器120では、先に計算
した原信号と再生信号との誤差e(n)から現在求まっ
た再生信号(n)を減算して、これを新たな誤差e
(n)とする。重み付け回路190はe(n)を入力し重
み付け誤差ew(n)を計算し、これを誤差最小化回路15
0へフィードバックする。誤差最小化回路150は、再び2
乗誤差を計算し、これを小さくするように音原パルス系
列の振幅と位置を調整する。こうして音源パルス系列の
発生から誤差最小化による音源パルス系列の調整までの
一連の処理は、音源パルス系列のパルス数があらかじめ
定められた数に達するまでくり返され、音源パルス系列
が決定される。
以上で従来方式の説明を終了する。
この方式の場合に、伝送すべき情報は、合成フィルタの
KパラメータKi(1≦i≦16)と、音源パルス系列のパ
ルス位置及び振幅であり、1フレーム内にたてるパルス
の数によって任意の伝送レイトを実現できる。さらに、
伝送レイトを16Kbps以下とする領域に対しては、良好な
再生音質が得られ有効な方式の一つと考えられる。
しかしながら、この従来方式は、演算量が非常に多いと
いう欠点がある。これは音源パルス系列におけるパルス
の位置と振幅を計算する際に、そのパルスに基づいて再
生した信号と原信号との誤差及び2乗誤差を計算し、そ
れらをフィードバックさせて、2乗誤差を小さくするよ
うにパルス位置と振幅を調整していることに起因してい
る。
またこの従来方式によれば、伝送レイトを下げるとピッ
チ周波数の高い入力信号の場合、例えば女性の声を入力
した場合には、再生品質が劣化するという欠点があっ
た。これは、ピッチ周波数が高い場合には、ピッチ周波
数が低い場合に比べパルスを計算するためのフレームに
より多くのピッチ波形が含まれることになり、このピッ
チ波形を良好に再生するためには、ピッチ周波数が低い
話者の場合を比べて、より多くの個数の音源パルスを必
要とするという理由による。
(発明の目的) 本発明の目的は、比較的少ない演算量で、低い伝送レイ
トに適用し得る高品質な音声符号方式とその装置を提供
することにある。
本発明によれば、送信側では離散的な音声信号系列を入
力し、あらかじめ定められた時間間隔毎にピッチを表す
ピッチパラメータと短時間スペクトル包絡を表すスペク
トルパラメータとを抽出し前記スペクトルパラメータを
符号化し、前記音声信号系列を前記ピッチに応じた時間
区間に分割し前記音声信号系列と前記スペクトルパラメ
ータをもとに前記音声信号系列を表すための駆動信号を
前記時間区間のうちの一部区間について求め、他の区間
については隣接する区間で求めた前記駆動信号を前記ピ
ッチだけずらして繰り返すか否かを判別し、前記駆動信
号を符号化し、前記スペクトルパラメータを表す符号と
前記駆動信号を表す符号とを組み合わせて出力し、受信
側では前記組み合わされた符号を入力し、前記スペクト
ルパラメータを表す符号と前記駆動信号を表す符号とを
分離して復号し前記復号された駆動信号をもとに前記ピ
ッチに対応するパラメータを抽出し、前記ピッチに対応
するパラメータと前記復号された駆動信号をもとに駆動
音源信号を復元し、前記復元された駆動音源信号と前記
復号されたスペクトルパラメータとを用いて前記音声信
号系列を再生するようにしたことを特徴とする音声信号
符号化方式が得られる。
また本発明によれば、入力音声信号系列からあらかじめ
定められた時間間隔毎にピッチを表すピッチパラメータ
と短時間スペクトル包絡を表すスペクトルパラメータと
を抽出し前記スペクトルパラメータを符号化するパラメ
ータ計算回路と、前記音声信号系列を前記パラメータ計
算回路より供給されるピッチに応じた時間区間に分割し
前記音声信号系列と前記スペクトルパラメータをもとに
前記音声信号系列を表すための駆動信号を前記時間区間
のうちにの一部区間について求め、他の区間については
隣接する区間で求めた前記駆動信号を前記ピッチだけず
らせて繰り返すか否かを判別し、前記駆動信号を符号化
する駆動信号計算回路と、前記スペクトルパラメータを
表す符号と前記駆動信号を表す符号とを組み合わせて出
力するマルチプレクサ回路とを有することを特徴とする
音声符号化装置が得られる。
さらに本発明によれば、組み合わされた符号系列を入力
しスペクトルパラメータを表わす符号と駆動信号を表わ
す符号とを分離し復号し前記復号された駆動信号をもと
に音声信号のピッチに対応するパラメータを抽出するデ
マルチプレクサ回路と、前記ピッチに対応するパラメー
タと前記復号された駆動信号をもとに駆動音源信号を復
元する駆動音源信号復元回路と、前記復元された駆動音
源信号と前記復号されたスペクトルパラメータとを用い
て前記音声信号系列を再生し出力する合成フィルタ回路
とを有するようにしたことを特徴とする音声信号復号化
装置が得られる。
(実施例) 以下本発明の実施例について図面を参照して詳細に説明
する。第4図(a)は本発明による音声符号化方式の符
号器側の一実施例を示すブロック図であり、第4図
(b)は復号器側の一実施例を示すブロック図である。
第4図(a)において、音声信号系列x(n)は、入力
端子195から入力され、あらかじめ定められたサンプル
数だけ区切られてバッファメモリ回路340に蓄積され
る。次にKパラメータ計算回路280は、バッファメモリ
回路340に蓄積されている音声信号のうち、あらかじめ
定められたサンプル数を入力し、入力信号のスペクトル
包絡を表わすLPCパラメータを計算する。LPCパラメータ
としては種々知られているが以下ではKパラメータを用
いるものとして説明を進める。尚、Kパラメータはバー
コール係数と同一のパラメータである。Kパラメータの
計算法としては代表的な方式として自己相関法と、共分
散法がよく知られている。ここでは自己相関法によるK
パラメータの計算法を、ジョン・マクホウル(JOHN MAK
HOUL)氏らによるアイ・イー・イー・イー・トランザク
ションズ・オン・エー・エス・エス・ビー(IEEE TRANS
ACTIONS ON A.S.S.P.)誌1975年6月号、309〜321頁に
掲載の「クォンタイゼイション・プロパティズ・オブ・
トランスミッション・パラメターズ・イン・リニア・プ
リディスクティブ・システムズ」(“QUANTIZATION PRO
PERTIES OF TRANSMISSION PARAMETERS IN LINEAR PREDI
CTIVE SYSTEMS")と題した論文(文献2.)等に説明され
ている方法を引用して以下に示す。
Eo=R(o) (5a) ▲a(i) i▼=ki (5c) ▲a(i) j▼=▲a(i-1) i▼+ki・▲a(i-1) i-j▼, (1≦j≦i−1) (5d) Ei=(1−▲k2 i▼)・Ei-1 (5e) aj=▲a(p) j▼,(1≦j≦P) (5f) 式(5a)から式(5f)はi=1,2,…pとして再帰的に解
くことができる。式において、kiはi次目のKパラメー
タ値を示す。またR(i)は入力信号に対する遅れ時間
iの自己相関々数を示す。Pは予測分析次数を示す。▲
(p) j▼は分析次数Pの場合のj番目の線形予測係数を
示す。ここで式(5e)のEiの値は次数iの予測における
予測誤差電力を示している。従って計算の各段階で次数
iの予測の予測誤差電力を監視することができる。Eiを
用いて正規化予測誤差は次式のように表わせる。
Vi=Ei/R(o) (6) i=Pの場合には(5e)式を用いて 表わせる。従ってKパラメータ値が既知の場合は、
(7)式を用いればp次予測分析の場合の正規化予測誤
差を知ることができる。以上で自己相関法によるKパラ
メータ計算法の説明を終える。
第4図(a)に戻って、KパラメータkiはKパラメータ
符号化回路200へ出力される。Kパラメータ符号化回路2
00は、あらかじめ定められた量子化ビット数に基づいて
Kiを符号化し、符号l をマルチプレクサ450へ出力する。また、Kパラメータ
符号化回路200は、l を復号化して得たKパラメータ復号値▲K ▼を用い
前述の(5c),(5d),(5f)式を用いて予測係数値▲
▼に変換し、インパルス応答計算回路210と重み
付け回路410と合成フィルタ回路400とへ出力する。
次にピッチ分析回路370は、バッファメモリ回路340の出
力である1フレーム分の音声信号を用いてピッチ周期Pd
を計算する。Pdの計算法としては、例えばアール・ブイ
・コックス(R.V.COX)氏らによるアイ・イー・イー・
イー・トランザクション・オン・エー・エス・エス・ピ
ー(IEEE TRANSACTIONS ON A.S.S.P)誌1983年2月号25
8〜272頁に掲載の「リアルータイム・インプリメンティ
ション・オブ・タイム・ドメイン・ハーモニック・スケ
ーリング・オブ・スピーチ・フォー・レイト・モディフ
ィケーション・アンド・コーディング」(“REAL−TIME
IMPLEMENTION OF TIME DOMAIN HARMONIC SCALING OF S
PEECH FOR RATE MODIFICATION AND CODING")と題した
論文(文献3)等に音声信号の自己相関々数を用いて計
算する方法が詳しく示されている。また、他の衆知な方
法を用いて計算することもできるし、音声信号を予測し
た後の予測残差信号から計算することもできる。このよ
うにして求めたピッチ周期Pdは、パルス計算回路390と
パルス発生回路420へ出力される。
次にインパルス応答計算回路210は、Kパラメータ符号
化回路200から予測係数値▲a ▼を入力し、次式で
示される重み付けされた合成フィルタの伝達関数を表わ
すインパルス応答hw(n)を、あらかじめ定められたサ
ンプル数だけ計算する。
ここでpは予測係数値▲a ▼の次数を示す。ここで
Hw(Z)は重み付けされた合成フィルタのZ変換上での
伝達関数を示す。また、W(Z)は前述の(3)式で示
した重み付け関数のZ変換表現である。但し、予測係数
としては▲a ▼を用いる。インパルス応答計算回路
210はインパルス応答hw(n)を自己相関々数計算回路3
60と相互相関々数計算回路350とへ出力する。
次に自己相関々数計算回路360は、インパルス応答計算
回路210からインパルス応答hw(n)を入力し、次式に
従って自己相関々数Rhh(・)をあらかじめ定められた
遅れ時間τだけ計算する。
自己相関々数Rhh(τ)はパルス計算回路390へ出力され
る。
次に減算器285は、バッファメモリ回路340に蓄積された
音声信号x(n)を入力し、x(n)から合成フィルタ
回路400の出力系列を1フレームサンプル分減算し、減
算結果e(n)を重み付け回路410へ出力する。
次に重み付け回路410は、減算器285から減算結果e
(n)を入力し、またKパラメータ計算回路200から予
測係数値aiを入力し、e(n)に対して重み付けを施し
ew(n)を出力する。ここでew(n)はZ変換表現で次
式のように書ける。
Ew(Z)=E(Z)・W(Z) (10) ここでEw(Z),E(Z)はそれぞれew(n)のZ変換
値、e(n)のZ変換値を示す。またW(Z)は前記
(3)式で示される重み付け関数のZ変換値を示す。重
み付け回路410は、ew(n)を相互相関々数計算回路350
及びパルス計算回路390へ出力する。
次に相互相関々数計算回路350は、重み付け回路410から
ew(n)を入力し、またインパルス応答計算回路210か
らインパルス応答hw(n)を入力し、次式に従って相互
相関々数hx(n)をあらかじめ定められたサンプル数
だけ計算する。
相互相関々数hx(・)はパルス計算回路390へ出力さ
れる。
次にパルス計算回路390の説明を行なう。パルス計算回
路では、音声信号を良好に表わす駆動信号として、パル
ス系列を計算する。パルス計算回路390を例えば信号処
理専用のシグナルプロセッサチップを用いて実現した場
合を想定して、処理の流れ図を第5図の破線部の内側に
示す。図において、ブロック604では端子600から相互相
関々数hx(・)を入力し、較子601から自己相関々数R
hh(・)を入力し、端子602からピッチ周期Pdを入力す
る。また端子603からew(n)を入力する。ブロック605
において変数iに1がセットされる。ここでiはピッチ
周期Pd毎に分割したサブフレームの番号を表わすインデ
ックスである。
ブロック620は、ピッチ周期Pdを用いて、フレームをPd
サンプル毎のサブフレームに分割する。また、ブロック
620ではピッチ周期Pdを用いて1フレーム中のサブフレ
ーム数Mが計算される。また、ブロック620では各サブ
フレーム区間及び残りの区間に求められるパルス数が次
のように計算される。ここで各ピッチサブフレーム区間
及び残りの区間のパルス数をそれぞれLP,LRとし、1フ
レーム当たりのパルス数をLBとすると、LP及びLRは次式
を満足するように M・LP+LR=LB (12) 決定される。
次にブロック630では、第1番目のサブフレームにたて
る音源パルスをLP個だけ計算する。ここで音源パルスは
次式に従って1パルスずつ順次計算される。
上式でgi,miはi番目のパルスの振幅、位置をそれぞれ
示す。またhx,Rhhは相互相関々数、自己相関々数をそ
れぞれ示す。(13)式に従うパルス計算過程を第6図に
示す。
第6図(a)は相互相関々数計算回路350で計算され、
パルス計算回路390へ出力された相互相関々数hxのピ
ッチサブフレーム分を示す。図において横軸はサブフレ
ーム内のサンプル時刻を示す。縦軸は振幅である。第6
図(b)は(12)式に従って求めた第1番目のパルスg1
を示す図である。第6図(c)は第6図(b)で求たパ
ルスの影響を差し引いた後の図である。第6図(d)は
第2番目のパルスg2を求めた図である。第6図(e)は
第2番目のパルスg2の影響をも差し引いた後の図であ
る。第6図(d)から(e)の処理をくり返してLP個の
パルスが探索される。
次に、第7図にブロック620と630の動作例を示す。第7
図(a)は1フレーム分の音声信号系列を示す。また第
7図(b)は1フレームをサブフレームに分割して、第
1番目のサブフレームにおける音源パルスを(13)式に
従って求めた図を示す。この図ではサブフレーム数nは
4、サブフレームあたりの音源パルス数LPは6としてあ
る。
第5図に戻って、ブロック640ではサブフレームイレデ
ックスiをインクリメントする。ブロック640及び650の
処理はもう1度くり返される。ブロック640では第2番
目のサブフレームにおける音源パルスが前記(13)式に
従ってLP個計算され、ブロック640ではサブフレームイ
ンデックスiがインクリメントされる。
次にブロック650では、まず最初に次の2種類のS/Nが計
算される。一つは第1番目のサブフレーム区間で求めた
音源パルスをピッチ周期Pdだけずらせながら第2番目の
サブフレーム区間でくり返した場合のS/N(S/N1)。も
う一つは第2番目のサブフレームにおいて新たに計算さ
れた音源パルスを用いた場合のS/N(S/N2)である。こ
こでS/Nの計算は次式に従う。
(14)式でRee(o)は、端子603から入力した信号ew
(n)に関するサブフレーム区間での電力を示す。
次にブロック660では、S/N1とS/N2との比Rを次式に従
って求める。
またブロック660では(15)式に従い求めたRの値をあ
らかじめ定められたしきい値Thと比較し、第1番目のサ
ブフレームで求めた音源パルスを第2番目のサブフレー
ムでくり返すか否かの判別を行なう。もしR≦Thなら
ば、パルスをくり返すこととし、リピート情報Rp(1ビ
ット)にあらかじめ定められた値(例えば0)をセット
し、ブロック680へ進む。一方、R>Thならば、パルス
をくり返さないこととし、ブロック670へ進む。パルス
をくり返さない場合に、ブロック670では、第1番目の
サブフレーム及び第2番目のサブフレームで求めたパル
スの個数をそれぞれサブフレーム当たり1/2にまびく。
具体的な方法としては例えば、パルスの絶対値振幅の大
きな方から、パルスをLp/2個だけ選択する方法が考えら
れる。またブロック670では、Rpにあらかじめ定められ
た値(例えば1)をセットし、ブロック680へ進む。
次にブロック680では、サブフレームインデックスiを
インクリメントし、ブロック690へ進む。ブロック690で
は、iがサブフレーム分割数Mを越えたか否かを判別す
る。もしiがMを越えてなければブロック630へ飛び、
ブロック630からブロック690までの処理をくり返す。も
しiがMを越えていればブロック700へ進む。次にブロ
ック700では、残りの区間に入るパルスをLR個だけ、(1
3)式に従って求める。次にブロック710では、以上の処
理によって求めたパルス列を端子720から出力し、リピ
ート情報Rpを端子760から出力する。ここで出力された
パルス列の一例を第7図(c)に示す。この図では第2
番目のサブフレーム及び第4番目のサブフレームは、そ
れぞれ第1番目、第3番目のサブフレームで求めたパル
スをくり返すので、新たにパルスを求めてはいない。こ
の図は、フレーム当たりのパルス数を13とした例であ
り、第1番目と第3番目のサブフレームにはパルスを6
個、残りのサブフレームにはパルスを1個求めて、フレ
ーム全体でパルス数を13としている。
以上でパルス計算回路390の説明を終了する。再び第4
図(a)にもどって、パルス回路390で求めたパルス列
は、符号化回路470へ出力され、リピート情報Rpはパル
ス発生回路420とマルチプレクサ450へ出力される。
次に符号化回路470は、入力したパルスの振幅、位置を
符号化し、マルチプレクサ450へ出力する。また、パル
スの振幅、位置の復号値▲g ▼,▲m ▼をパル
ス発生回路420へ出力する。ここでパルス系列の符号化
法は種々考えられる。一つは、パルス列の振幅、位置を
別々に符号化する方法であり、また一つは振幅、位置を
一緒に符号化する方法である。
前者の方法について一例を説明する。まず、パルス系列
の振幅の符号化法としては、フレーム内のパルス系列の
振幅の最大値を正規化係数として、この値を用いて各パ
ルスの振幅を正規化した後に、量子化、符号化する方法
が考えられる。また、他の方法としては、振幅の確率分
布を正規型と仮定して、正規型の場合の最適量子化器を
用いる方法が考えられる。これについては、ジェー・マ
ックス(J.MAX)氏によるアイ・アール・イー・トラン
ザクションズ・オン・インフォメーション・セオリー
(IRE TRANSACTIONS ON INFORMATION THEORY)の1960年
3月号、7〜12頁に掲載の「クオンタイジング・フォー
・ミニマム・ディストーション」(“QUANTIZING FOR M
INIMUM DISTORTION")と題した論文(文献4)等に詳述
されているので、ここでは説明を省略する。更に、各パ
ルスの振幅を直交関係にある他のパラメータに変換した
後に量子化、符号化を施してもよい。また、パルス振幅
毎にビット割り当てを変えてもよい。次に、パルス位置
の符号化についても種々の方法が考えられる。例えば、
ファクシミリ信号符号化の分野でよく知られているラン
レングス符号等を用いてもよい。これは符号“0"または
“1"の続く長さをあらかじめ定められた符号系列を用い
て表わすものである。また、正規化係数の符号化には、
従来よく知られている対数圧縮符号化等を用いることが
できる。
尚、パルス系列の符号化に関しては、ここで説明した符
号化方法に限らず、衆知の最良の方法を用いることがで
きることは勿論である。
第4図(a)に戻って、パルス発生回路420は符号化回
路470からパルス系列復号値▲g ▼,▲m ▼を
入力する。またパルス計算回路390からリピート情報Rp
を入力する。またピッチ分析回路370からピッチ周期値P
dを入力する。駆動音源信号復元回路420はこれらの情報
を用いて駆動音源信号を発生し、合成フィルタ回路400
へ出力する。合成フィルタ回路400は、パルス発生回路4
20から駆動音源信号を入力し、Kパラメータ符号化回路
200から予測係数復合値▲a ▼を入力する。合成フ
ィルタ回路400は、入力されたパルス信号と予測係数復
号値▲a ▼とを用いて1フレーム分の応答信号系列
(n)を次式に従って計算する。
ここで(n)の値は2フレーム分(1≦n≦2N)計算
される。d(n)はパルス信号を表わし、1≦n≦Nで
はパルス発生回路420から入力したパルス信号を用い
る。またN+1≦n≦2Nでは全て0の系列を用いる。
(16)式で求めた(n)のうち、2フレーム目の
(n)(N+1≦n≦2N)の値が減算器285へ出力され
る。
次にマルチプレクサ450は、Kパラメータ符号化回路200
の出力符号 とパルス計算回路390からのリピート情報Rpと符号化回
路470の出力符号を入力し、これらを組み合わせて送信
側出力端子480から通信路へ出力する。以上で本発明に
よる音声符号化方式の符号器側の説明を終える。
次に本発明による音声符号化方式の復号器側について、
第4図(b)を参照して説明する。デマルチプレクサ50
0は受信側入力端子490から入力した符号のうち、Kパラ
メータを表わす符号と、リピート情報と、パルス系列を
表わす符号とを分離する。更にKパラメータを表わす符
をKパラメータ復号回路520へ出力し、リピート情報Rp
をパルス発生回路540へ出力し、パルス系列を表わす符
号をパルス復号回路530へ出力する。次にKパラメータ
復号回路520は、Kパラメータを復号し、Kパラメータ
復号値▲K ▼を合成フィルタ回路550へ出力する。
次にパルス復号回路530は、音源パルス系列の振幅、位
置を復号し、それぞれ▲g ▼,▲m ▼としてパ
ルス発生回路540へ出力する。次にピッチ抽出回路510
は、復号された音源パルス列をもとにピッチ周期の対応
する周期▲P ▼を抽出し、パルス発生回路540へ出
力する。ピッチ周期に対応する周期▲P ▼の抽出法
としては、種々考えられる。例えば、送信側からピッチ
サブフレーム内のパルスの相対位置が伝送される場合
は、振幅の大きなパルス同志の相対距離を▲P ▼と
すればよい。一方、サブフレームの最も端にたったパル
スに対しては、2つのサブフレームにまたがったパルス
の相対位置が伝送される場合は、2つのサブフレームの
パルスについて振幅の大きなパルス同志の相対距離の1/
2を▲P ▼とすればよい。
別法としては、パルス列の自己相関々数をいくつかの遅
れ時間に対して求め、自己相関々数を最大とするおくれ
時間を▲P ▼としてもよい。
次にパルス発生回路540は、符号器側のパルス発生回路4
20と同一の動作をする。ピッチ周期復合値▲P ▼を
用いて、フレームをサブフレームに分割し、サブフレー
ムに発生させるパルス数Lp,LRを計算する。この処理に
は、符号器側のパルス計算回路390における方法と同一
の方法を用いる。また駆動音源信号復元回路は、音源パ
ルス系列の振幅、位置の復号値▲g ▼,▲m
と、リピート情報Rpを用いてサブフレームにパルスを発
生させる。もし偶数番目のサブフレームにおいて、リピ
ート情報がパルスのくり返しを示している場合は、1つ
前のサブフレームのパルスを▲P ▼だけずらしてく
り返す。一方、パルスをくり返さない場合は、 のパルスを発生させる。全てのサブフレームに対してこ
れらの処理を行なう。最後に、残った区間にLR個のパル
スを発生させる。以上のようにして発生されたパルスは
駆動音源信号として、合成フィルタ回路550へ出力され
る。
次に合成フィルタ回路550は、駆動音源信号とKパラメ
ータ復号値▲K ▼とを入力する。Kパラメータ復号
値▲K ▼は前述の(5c),(5d),(5f)式を用い
て予測係数▲a ▼に変換される。合成フィルタ回路
550は、次式に従って合成信号(n)を1フレーム分
計算し、受信側出力端子560から出力する。
ここでd(n)はパルス発生回路540から入力した駆動
音源信号を示す。以上で本発明による復号器側の説明を
終える。
本実施例においては、パルス探索アルゴリズムとして前
述の(13)式を用いたが、これは他のパルス探索アルゴ
リズムを用いてもよい。例えば従来例として文献1に示
した方式を用いてもよい。
また、(13)式の方法ではパルスを1つずつ順番に探索
していたが、パルスを1つ求める毎にこれより過去に求
まった複数個のパルスの振幅を再調整するような方法を
用いてもよい。
また本実施例では、音源パルスのまびき方として2対1
のまびきについて説明したが、これ以外の比率のまびき
を行なうこともできる。
また本実施例では、送信側でパルスをまびくか否かを判
別し受信側にリピート情報Rpを送っていたが、リピート
情報は送らず、送信側ではあらかじめ定められたまびき
率で常にまびき、受信側では送られたパルスを用いてあ
らかじめ定められた回数だけ常にくり返す構成としても
よい。
また本実施例では、あるサブフレーム(i番目のサブフ
レームとする)でパルスをまびかない場合には、j番目
のサブフレームとj−1番目のサブフレームにおいて、 のパルスを求めていたが、これはj−1番目とj番目の
2つのサブフレーム全体に対してLp個のパルスを求める
ようにしてもよい。
また本実施例では、パルスをまびくか否かの判別には、
パルスをサブフレーム毎に計算して用いていたが、これ
はフレームに対してあらかじめ定められた個数のパルス
を計算しておき、このパルスを用いてサブフレーム毎に
上記判別処理を行なってもよい。
また本実施例では、パルス計算回路390において、フレ
ームをピッチ周期Pdに応じたサブフレームに分割する際
に、第7図(b),(c)に示したように、フレームの
左端からPdサンプル毎にサブフレームに分割した。サブ
フレーム分割法としては次のようにしてもよい。まず、
フレームに対してあらかじめ定められた個数のパルスを
計算する。次に求まったパルスのうち、フレームの左端
に最も近いパルスの近傍を始点Tとして、Pdサンプル毎
にサブフレームに分割するようにしてもよい。このよう
にした場合は、始点Tの位置を受信側へ伝送する必要が
ある。これには例えば、フレーム左端から始点Tまでの
距離Tpをあらかじめ定められた長さの符号で表わして伝
送してよいし、Tpとピッチ周期▲P ▼との比をあら
かじめ定められた長さの符号で表わして伝送してもよ
い。
また受信側においてまびかれたパルスを復元する際に、
本実施例では一つ過去のサブフレームにおけるパルスを
くり返していたが、これは次のようにしてもよい。今、
パルスがまびかれたサブフレームの番号をjとすると、
j−1番目のサブフレームにおけるパルスとj+1番目
のサブフレームにおけるパルスとを用いてj番目のサブ
フレームにおけるパルスを補間して求めるようにしても
よい。
また本実施例では、ピッチ周期に応じて分割したサブフ
レームが、次のフレームにまたがる際には、現在のフレ
ームの最後のサブフレームはパルスのまびき処理を行な
わずに、パルスをあらかじめ定められた個数だけ新たに
求め直して伝送していた。これは例えば以下のようにし
てもよい。サブフレームが次のフレームにまたがる際に
は、次のフレームの信号を入力し、フレームをまたいで
サブフレームの分割を行ない、パルスのまびき処理を次
のフレームにわたって連続的に行なうようにしてもよ
い。また別な方法としては、次のフレームにまたがるサ
ブフレームにおいて、サブフレームが現フレームに存在
する時間区間だけパルスまびき処理を行ない、サブフレ
ームの残りの時間区間に関しては、次のフレームにおい
て行なうようにしてもよい。
またフレーム毎の音声信号に対して音声、無声判別を行
ない、有声と判別されたフレームについて、パルスのま
びき処理を行なうようにしてもよい。この有声、無声判
別には例えば、よく知られているように、音声信号また
は予測残差信号の自己相関または共分散係数のピッチ周
期だけ離れた時刻の値を用いることができる。
本実施例の構成においては、短時間スペクトル構造を表
わすインパルス応答系列の自己相関々数を計算する際
に、インパルス応答計算回路210によってKパラメータ
復号値を用いてインパルス応答を計算した後に、このイ
ンパルス応答を用いて自己相関々数計算回路360にて自
己相関々数を計算していた。ディジタル信号処理の分野
でよく知られているように、インパルス応答の自己相関
々数はパワスペクトルと対応関係にある。従ってまずK
パラメータ復号値を用いてパワスペクトルを求め、その
後にこの対応関係を用いて自己相関々数を計算するよう
な構成としてもよい。一方、音声信号と短時間スペクト
ル包絡を表わすインパルス応答との相互相関々数を計算
する際に、本実施例の構成では重み付け回路410の出力
値ew(n)とKパラメータ復号値▲K ▼を用いてイ
ンパルス応答計算回路210にて計算したインパルス応答h
w(n)を用いて相互相関々数hx(・)を計算してい
た。よく知られているように、相互相関々数はクロス・
パワスペクトルと対応関係にある。従ってまずew(n)
と▲K ▼とを用いてクロス・パワスペクトルを求
め、その後に相互相関々数を計算するような構成として
もよい。尚、パワスペクトルと自己相関々数との対応関
係、クロススペクトルと相互相関々数との対応関係につ
いては、エー・ブイ・オッペンハイム(A.V.OPPENHEI
M)氏らによる「ディジタル信号処理」(“DIGITAL SIG
NAL PROCESSING")と題した単行本(文献)の第8章に
て詳細に説明されているので、ここでは説明を省略す
る。
本実施例においては、1フレーム内のパルス系列の符号
化は、パルス系列が全て求まった後に、第4図(a)の
符号化回路470によって符号化を施したが、符号化をパ
ルス系列の計算に含めて、パルスを1つ計算する毎に、
符号化を行ない、次のパルスを計算するという構成にし
てもよい。このような構成をとることによって、符号化
の歪をも含めた誤差を最小とするようなパルス系列が求
まるので、更に品質を向上させることができる。
(本発明の効果) 以上説明したように本発明によれば、送信側ではピッチ
サブフレームのパルスをあらかじめ定められたまびき率
で時間的にまびいて伝送し、受信側では受信したパルス
を用いて、まびかれたパルスを復元し音声を合成するよ
うにしているので、伝送レイトが低い場合にも高品質な
音声を合成できるという効果がある。
【図面の簡単な説明】
第1図は従来方式の構成を示すブロック図、第2図は音
源パルス系列の一例を示す図、第3図は入力音声信号系
列の周波数特性と第1図に記載の重み付け回路の周波数
特性の一例を示す図、第4図(a),(b)は本発明に
よる音声符号化方式の一実施例を示すビロック図、第5
図はパルス計算回路390の処理内容の一例を示す図、第
6図はパルス計算過程の一例を示す図、第7図は第5図
のブロック620と630の動作例を示す図である。 図において、110,340……バッファメモリ回路、120,285
……減算回路、130,400,550……合成フィルタ回路、42
0,540……パルス発生回路、150……誤差最小化回路、18
0,280……Kパラメータ計算回路、190,410……重み付け
回路、200……Kパラメータ符号化回路、210……インパ
ルス応答計算回路、350……相互相関計算回路、360……
自己相関計算回路、370……ピッチ分析回路、380……ピ
ッチ符号化回路、390……パルス計算回路、470……符号
化回路、450……マルチプレクサ、500…デマルチプレク
サ、510……ピッチ抽出回路、520……Kパラメータ復号
回路、530……音源パルス復号回路をそれぞれ示す。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】送信側では離散的な音声信号系列を入力
    し、あらかじめ定められた時間間隔毎にピッチを表すピ
    ッチパラメータと短時間スペクトル包絡を表すスペクト
    ルパラメータとを抽出し前記スペクトルパラメータを符
    号化し、前記音声信号系列を前記ピッチに応じた時間区
    間に分割し前記音声信号系列と前記スペクトルパラメー
    タをもとに前記音声信号系列を表すための駆動信号を前
    記時間区間のうちの一部区間について求め、他の区間に
    ついては隣接する区間で求めた前記駆動信号を前記ピッ
    チだけずらして繰り返すか否かを判別し、前記駆動信号
    を符号化し、前記スペクトルパラメータを表す符号と前
    記駆動信号を表す符号とを組み合わせて出力し、受信側
    では前記組み合わされた符号を入力し、前記スペクトル
    パラメータを表す符号と前記駆動信号を表す符号とを分
    離して復号し前記復号された駆動信号をもとに前記ピッ
    チに対応するパラメータを抽出し、前記ピッチに対応す
    るパラメータと前記復号された駆動信号をもとに駆動音
    源信号を復元し、前記復元された駆動音源信号と前記復
    号されたスペクトルパラメータとを用いて前記音声信号
    系列を再生するようにしたことを特徴とする音声信号符
    号化方式。
  2. 【請求項2】入力音声信号系列からあらかじめ定められ
    た時間間隔毎にピッチを表すピッチパラメータと短時間
    スペクトル包絡を表すスペクトルパラメータとを抽出し
    前記スペクトルパラメータを符号化するパラメータ計算
    回路と、前記音声信号系列を前記パラメータ計算回路よ
    り供給されるピッチに応じた時間区間に分割し前記音声
    信号系列と前記スペクトルパラメータをもとに前記音声
    信号系列を表すための駆動信号を前記時間区間のうちに
    の一部区間について求め、他の区間については隣接する
    区間で求めた前記駆動信号を前記ピッチだけずらせて繰
    り返すか否かを判別し、前記駆動信号を符号化する駆動
    信号計算回路と、前記スペクトルパラメータを表す符号
    と前記駆動信号を表す符号とを組み合わせて出力するマ
    ルチプレクサ回路とを有することを特徴とする音声符号
    化装置。
  3. 【請求項3】スペクトルパラメータを表す符号と駆動信
    号を表す符号とが少なくとも組み合わせて入力され、組
    み合わされた符号系列を入力されスペクトルパラメータ
    を表す符号と駆動信号を表す符号とを分離し復号し前記
    復号された駆動信号をもとに音声信号のピッチに対応す
    るパラメータを抽出するデマルチプレクサ回路と、前記
    ピッチに対応するパラメータと前記復号された駆動信号
    をもとに駆動音源信号を復元する駆動音源信号復元回路
    と、前記復元された駆動音源信号と前記復号されたスペ
    クトルパラメータとを用いて前記音声信号系列を再生し
    出力する合成フィルタ回路とを有することを特徴とする
    音声信号復合化装置。
JP59143017A 1984-07-05 1984-07-10 音声信号符号化方式とその装置 Expired - Lifetime JPH077275B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP59143017A JPH077275B2 (ja) 1984-07-10 1984-07-10 音声信号符号化方式とその装置
CA000486304A CA1255802A (en) 1984-07-05 1985-07-04 Low bit-rate pattern encoding and decoding with a reduced number of excitation pulses
US06/751,818 US4945565A (en) 1984-07-05 1985-07-05 Low bit-rate pattern encoding and decoding with a reduced number of excitation pulses

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59143017A JPH077275B2 (ja) 1984-07-10 1984-07-10 音声信号符号化方式とその装置

Publications (2)

Publication Number Publication Date
JPS6120997A JPS6120997A (ja) 1986-01-29
JPH077275B2 true JPH077275B2 (ja) 1995-01-30

Family

ID=15328994

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59143017A Expired - Lifetime JPH077275B2 (ja) 1984-07-05 1984-07-10 音声信号符号化方式とその装置

Country Status (1)

Country Link
JP (1) JPH077275B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62207036A (ja) * 1986-03-07 1987-09-11 Nec Corp 音声符号化方式とその装置
US6240384B1 (en) 1995-12-04 2001-05-29 Kabushiki Kaisha Toshiba Speech synthesis method

Also Published As

Publication number Publication date
JPS6120997A (ja) 1986-01-29

Similar Documents

Publication Publication Date Title
JPH0353300A (ja) 音声符号化装置
JP2903533B2 (ja) 音声符号化方式
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP2615548B2 (ja) 高能率音声符号化方式とその装置
JP2844589B2 (ja) 音声信号符号化方法とその装置
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JPH077275B2 (ja) 音声信号符号化方式とその装置
KR0155798B1 (ko) 음성신호 부호화 및 복호화 방법
JP2560682B2 (ja) 音声信号符号化復号化方法とその装置
JP2853170B2 (ja) 音声符号化復号化方式
JP2900431B2 (ja) 音声信号符号化装置
JPH0632035B2 (ja) 音声符号化方法とその装置
JPH058839B2 (ja)
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP2844590B2 (ja) 音声符号化方式とその装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP2615862B2 (ja) 音声符号化復号化方法とその装置
JP2508002B2 (ja) 音声符号化方法とその装置
JP2946528B2 (ja) 音声符号化復号化方法及びその装置
JP2847730B2 (ja) 音声符号化方式
JPH02160300A (ja) 音声符号化方式
JPH0736119B2 (ja) 区分的最適関数近似方法
JP3017747B2 (ja) 音声符号化装置
JP2853126B2 (ja) マルチパルス符号化装置
KR0156983B1 (ko) 음성 부호기

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term