JPS6119000A - 音声符号化方法とその装置 - Google Patents

音声符号化方法とその装置

Info

Publication number
JPS6119000A
JPS6119000A JP59139634A JP13963484A JPS6119000A JP S6119000 A JPS6119000 A JP S6119000A JP 59139634 A JP59139634 A JP 59139634A JP 13963484 A JP13963484 A JP 13963484A JP S6119000 A JPS6119000 A JP S6119000A
Authority
JP
Japan
Prior art keywords
parameter
signal
circuit
pitch
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59139634A
Other languages
English (en)
Other versions
JPH0632035B2 (ja
Inventor
一範 小澤
卓 荒関
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP59139634A priority Critical patent/JPH0632035B2/ja
Priority to CA000486304A priority patent/CA1255802A/en
Priority to US06/751,818 priority patent/US4945565A/en
Publication of JPS6119000A publication Critical patent/JPS6119000A/ja
Publication of JPH0632035B2 publication Critical patent/JPH0632035B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声信号の低ビツトレイト符号化方式とその装
置に関する。
(従来技術とその問題点) 音声信号を例えば16にビット/秒程度以下の伝送情報
量で符号化するための方式として、最近マルチパルス駆
動形音声符号化方式が提案されている。これは、駆動音
源信号系列を表わす複数個のパルス系列(マルチパルス
)を、短時間毎に、符号器側でアナリシス バイ シン
セシイス(ANA−LY8 I 8−互y一旦YN’l
’HE8IS ; A−b−8)の手法を用いて逐次的
に求め、このパルス系列を符号化伝送する方式である0
本発明はこの方式に関係するものである。この方式の詳
細については。
ビー・ニス・アタール(B、8.ATAL )氏らによ
るアイ・シー・ニー・ニス嗜ニス・ヒ−(I、C。
A、8.8.P、)の予稿集、 1982年614〜6
17頁に掲載の「アφニュー・モデル・オブ、・エル・
ピー・シー・エクサイティション・フォー〇プロデュー
シングeナチュラル・サウンディング・スピーチ・アッ
ト−ロウ・ビット−レイン」(1ANEW MODEL
、OF’ L、PCFiXCITATION ii’0
RPR,0DUCING NATURAL−80UND
ING8PEECf(AT LOW BIT R,AT
E8〃)と題した論文(文献1)に説明されているので
、ここでは簡単に説明を行なうにとどめる。
第1図は、前記文献1に記載された従来方式における符
号器側の処理を示すブロック図である。
図において、100は符号器入力端子を示し、A/D変
換された音声信号系列X(川が入力される。110はバ
ッファメモリ回路であり、音声信号系列を1フレーム(
例えば8KHzサンプリングの場合でフレーム長をlQ
 rrL secとすると80サンプル)分、蓄積する
。バッファメモリ回路110の出力値は減算器120と
、Kパラメータ計算回路180とに出力される。但し、
文献1.によればにパラメータのかわりにレフレクショ
ン・コエフィシエンッ(REFLE−CTION C0
EPf’;ICIENT8)と記載されているが、これ
はにパラメータと同一のパラメータである。にパラメー
タ計算回路180は、バッファメモリ回路110の出力
値を用い、共分散法に従って。
フレーム毎の音声信号スペクトルを表わすにパラメータ
Kiを16次分(1≦i≦16)求め、これらを合成フ
ィルタ130へ出力する。140は、音源パルス発生回
路であり、lフレーム内にあらかじめ定められた個数の
パルス系列を発生させる。ここでは、このパルス系列を
d (nlと記する。音源パルス発生回路140によっ
て発生された音源パルス系列の一例を第2図に示す、第
2図で横軸は離散的な時刻を、縦軸は振幅をそれぞれに
示す、ここでは、lフレーム内に8個のパルスを発生さ
せる場合について示しである。音源パルス発生回路14
0によって発生されたパルス系列d(川は1合成フィル
タ130を駆動する6合成フィルタ130は、 d(n
)を入力し、音声信号X(川に対応する再生信号X(川
を求め、これを減算器120へ出カフする。ここで。
合成フィルタ130は、にパラメータKiを入力し。
これらを予測パラメータa、 (1≦、i≦16)へ変
換しmalを用いて再生信号x(nlを計算する。 x
(nlは。
d (n)とaIを用いて下式のように表わすことがで
きる。
x (nl−d (川+! a(−x (n −i )
         (1)轟;=1 上式でPは合成フィルタの次数を示し、ここではP=1
6としている。減算器120は、原信号X(川と再生信
号X(川との差e (n)を計算し1重み付は回路19
0へ出力する。  190は、e(nlを入力し1重み
付は関数w(nlを用い、次式に従って重み付は誤差e
W(川を計算する。
eW(n) = w (nl * e tnl    
      (2)上式で、記号1*”はたたみこみ積
分を表わす。
また1重み付は関数w(n)は1周波数軸上で重み付け
を行なうものであり、そのZ変換値をW(Z)とすると
1合成フィルタの予測パラメータaiを用いて1次式に
より表わされる。
WiZ)= (1−ΣaIZ−″)/(1−Σa111
ri@Z−i)(3)1−11=1 上式でrはO≦r≦1の定数であり、W <Zlの周波
数特性を決定する。つまり、rz1とすると。
W(Z1=1となり、その周波数特性は平坦となる。
一方、rz0とすると、 W(Z)は合成フィルタの周
波数特性の逆特性となる。従って、rの値によってW(
Z)の特性を変えることができる。また、(3)式で示
したようにw rz)を合成フィルタの周波数特性に依
存させて決めているのは、聴感的なマスク効果を利用し
ているためである。つまり、入力音声信号のスペクトル
のパワが大きな′開所では(例えばフォルマントの近傍
)、再生信号のスペクトルとの誤差が少々大きくても、
その誤差は耳につき難いという聴感的な性質による。第
3図に、あるフレームにおける入力音声信号のスペクト
ルと、W■の周波数特性の一例とを示した。ここではr
 = 0.8とした。図において、横軸は周波数(最大
4KHz)を、縦軸は対数振幅(最大60dB)をそれ
ぞれ示す。また、上部の曲線は音声信号のスペクトルを
、下部の曲線は重み付は関数の周波数特性を表わしてい
る。
第1図へ戻って、重み付は誤差ew(n)は、誤差最小
化回路150ヘフイードバツクされる。誤差最小化回路
150は、ew(n)の値を1フレーム分記憶し、これ
らを用いて次式lこ従い、重み付け2乗瞑差εを計算す
る。
ここで、Nは2乗誤差を計算するサンプル数を示す。文
献11の方式では、この時間長を5H1secとしてお
り、これは8KHzサンプリングの場合にはN=40に
相当する。次に、誤差最小化回路150は、前記(4)
式で計算した2乗誤差しを小さくするように音源パルス
発生回路140に対し、パルス位置及び振幅情報を与え
る。140は、この情報に基づいて音源パルス系列を発
生させる。合成フィルタ130は、この音源パルス系列
を駆動源として再生信号’5i”(n)を計算する。次
に減算器120では、先lこ計算した原信号と再生信号
との誤差e (n)から現在求まった再生信号マ(n>
を減算して、これを新たな誤差e (n)とする。重み
付は回路190はe(n)を入力し重み付は誤差ew(
n)を計算し、これを誤差最小化回路150ヘフイード
バツクする。誤差最小化回路150は、再び2乗誤差を
計算し、これを小さくするように音源パルス系列の振幅
と位置を調整する。こうして音源パルス系列の発生から
誤差最小化による音源パルス系列の調整までの一連の処
理は、音源パルス系列のパルス数があらかじめ定められ
た数に達するまでくり返され、音源パルス系列が決定さ
れる。
以上で従来方式の説明を終了する。
この方式の場合に、伝送すべき情報は、合成フィルタの
にパラメータに、(1≦i≦16)と、音源パルス系列
のパルス位置及び振幅であり、1フレーム内にたてるパ
ルスの数によって任意の伝送レイトを実現できる。さら
に、伝送レイトを16Kbpa以下とする領域に対して
は、良好な再生音質が得られ有効な方式の一つと考えら
れる。
しかしながら、この従来方式は、演算量が非常に多いと
いう欠点がある。これは音源パルス系列におけるパルス
の位置と振幅を計算す、る際に、そのパルスに基づいて
再生した信号と原信号との誤差及び2乗誤差を計算し、
それらをフィードバックさせて、2乗誤差を小さくする
ようζこパルス位置と振幅を調整していることに起因し
ている。
またこの従来方式によれば、伝送レイトを下げるとピッ
チ周波数の高い入力信号の場合、例えば女性の声を入力
した場合には、再生品質が劣化するという欠点があった
。これは、ピッチ周波数が高い場合には、ピッチ周波数
が低い場合に比べ、パルスを計算Tるためのフレームに
より多くのビツチ波形が含菫れることになり、このピッ
チ波形を良好に再生するためには、ビ、千周波数が低い
話者の場合を比べて、より多くの個数の音源パルスを必
要とするという理由tこよる。
(発明の目的) 本発明の目的は、比較的少ない演算量で、低い伝送レイ
トζこ適用し得る高品質な音声符号方式とその装置を提
供Tることにある。
(発明の構成) 本発明によれば、送信側では離散的な音声信号系列を入
力し、あらかじめ定められた時間間隔毎にピッチを表わ
すピッチパラメータと短時間スペクトル包絡を表わすス
ペクトルパラメータとを抽出して符号化し、前記音声信
号系列を前記ピッチ1こ応じた時間区間に分割し前記音
声信号系列と前記スペクトルパラメータをもとに前記音
声信号系列を表わすための駆動信号を前記時間区間のう
ちの一部区間について求めて符号化し、前記ピッチパラ
メータを表わ丁符号と前記スペクトルパラメータを表わ
す符号と前記駆動信号を表わす符号とを組み合わせて出
力し、受信側では前記組み合わされた符号を入力し、前
記ピッチパラメータを表わす符号と前記スペクトルパラ
メータを表わす符号と前記駆動信号を表わす符号とを分
離して復号し、前記ピッチパラメータと前記復号された
駆動信号をもとに前記時間区間の駆動音源信号を復元し
前記復元された駆動音源信号と前記復号されたスペクト
ルパラメータ系列とを用いて前記音声信号系列を再生す
るようにしたことを特徴とする音声符号化方式が得られ
る。
また本発明によれば、離散的な音声信号系列を入力し、
前記音声信号系列からあらかじめ定められた時間間隔毎
にピッチを表わ丁ピッチパラメータと短時間スペクトル
包絡を表わすスペクトルパラメータとを抽出し符号化す
るパラメータ計算回路と、前記音声信号系列を前記ピッ
チに応じた時間区間に分割し前記音声信号系列と前記ス
ペクトルパラメータをもとに前記音声信号系列を表わす
ための駆動信号を前記時間区間のうちの一部区間につい
て求めて符号化する駆動信号計算回路と、前記パラメー
タ計算回路の出力符号と前記駆動信号を表わす符号とを
組み合わせて出力するマルチプレクサ回路とを有するこ
とを特徴とする音声符号化装置が得られる。
さらに本発明によれば、組み合わされた符号系列を入力
しピッチパラメータを表わす符号とスペクトルパラメー
タ系列を表わす符号と駆動信号を表わす符号とを分離し
て復号するデマルチプレクサ回路と、前記復号されたピ
ッチパラメータと前記復号された駆動信号をもとに駆動
音源信号を復元する駆動音源信号復元回路と、前記駆動
音源信号と前記復号されたスペクトルパラメータ系列と
を用いて音声信号系列を再生し出力する合成フィルタ回
路とを有することを特徴とする音声信号復号化装置が得
られる。
(実施例) 以下本発明の実施例について図面を参照して詳#IIこ
説明Tる。第4図(a)は本発明lこよる音声符号化方
式の符号器側の一実施例を示すブロック図であり、第4
図(b)は復号@Mの一実施例を示すプロツク図である
。第4図(a)において、音声信号系列x (n)は、
入力端子195から入力され、あらかじめ定められたサ
ンプル数だけ区切られてバッファメモリ回路340に蓄
積される。次ににバラメーク計算回路280は、バッフ
ァメモリ回路340に蓄積されている音声信号のうち、
あら力)しめ定められたサンプル数を入力し、入力信号
のスペクトル包絡を表わすLPOパラメータを計算する
。LPOパラメータとしては種々知られているが以下で
はにパラメータを用いるものとして説明を進める。尚、
Kパラメータはパーコール係数と同一のパラメータであ
る。Kパラメータの計算法としては代表的な方法として
自己相関法と、共分散法がよく知られている。ここでは
自己相関法によるにパラメータの計算法を、ジョン拳マ
クホウル(JOHNMA−KHOUL)氏らによるアイ
・イー・イー・イー・トランザクションズ−オン・ニー
・ニス・ニス−ビー(IEEB  TRANSAOTI
C)NS ON A、S。
S、P、 )誌1975年6月号、 309〜321頁
に掲載の[クオンタイゼイション・プロパティズ・オブ
・トランスミッション・パラメ−タ値イン・ソニア・ブ
リディクチイブ・システムズJ (”Q、UA−NTI
ZATION PR,0PETtTIES OF TR
AN8MI−8CION PARAMBT18  IN
 LINEARPRBDIOTIVE SY8TEMS
’)  と[1,、た論文(文献2.)等に説明されて
いる方法を引用して以下に示す。
Bo= R(IJ)              (5
a)a r =k I(5’ ) (+ )     (1−1ン        (I−
リa =a 十k −a  +(1≦1≦1−1)(5
d)j     1    1  1−1 B  =(l−に−)−E、  、         
 t5e)a、=a、”’ 、  (1≦1≦p ) 
    (5f)式(5a)から式(5f)はj= 1
.2.・・・・・・pとして再帰的に解くことができる
。式において、k、はi欠目のにパラメータ値を示す。
またR(i)は入力信号に対する遅れ時間iの自己相関
々数を示す。pは予測分析次数を示す。a(7) (ま
分析次数pの場合の3番目の線形予測係数を示す。ここ
で式(5e)のE、の値は次数iの予測における予測誤
差電力を示している。従って計算の各段階で次数量の予
測の予測誤差電力を監視することができる。B、を用い
て正規化予測誤差は次式のようζこ表わせる。
v、 = E、/Rn           (6)i
=pの場合には(5e)式を用いて v、 =π(1−に、)       (7)1=1 表わせる。従ってにパラメータ値が既知の場合は、(7
)式を用いればp次子測分析の場合の正規化予測誤差を
知ることができる。以上で自己相関法によるにパラメー
タ計算法の説明を終える。
第4図(a)に戻って、Kパラメータに、  はにパラ
メータ符号化回路200へ出力される。Kパラメータ符
号化回路200は、あらかじめ定められた量子化ビット
数に基づいてに、を符号化し、符号1k。
をマルチプレクサ450へ出力する。また、Kパラメー
タ符号化回路200は、Jk、を復号化して得たにパラ
メータ復号値に/1を用い前述の(5C)、(5d)、
(5f)  式を用いて予測係数値a/、に変換し、イ
ンパルス応答計算回路210と重み付は回路410と合
成フィルタ回路400とへ出力する。
次にピッチ分析回路370は、バッファメモリ回路34
0の出力であるlフレーム分の音声信号を用いてピッチ
周期pdを計算する。pdの計算法としては、例えばア
ール・ブイ・コックス(R,V。
00X)氏らによるアイ・イー・イー・イー・トランザ
クションズ・オンeニー・ニス噛ニス・ビー(IEEE
  TRAN8AOTION8  ON A、8.S。
P)誌1983年2月号、258〜272頁に掲載の「
リアル−タイム・インプリメンティジョン・イブ・タイ
ム・ドメイン・ハーモニック−スケーリング・イブ・ス
ピーチ・フォー・レイト・モディフィケーション・アン
ド・コープインク」(REAL−T1MB  IMPL
EMENTATION OF  ’I’1MEDOMA
IN HARMONIC80ALING 0FSPEE
CHFOR,RATBMODIFICATIONAND
 C0DING”)と題した論文(文献3)等に説明さ
れている音声信号の自己相関々数を用いて計算する方法
が知られている。また、他の衆知な方法を用いて計算す
ることもできるし、音声信号を予測した後の予測残差信
号から計算することもできる。ピッチ符号化回路380
は、ピッチ周期pdを入力し、あらかじめ定められた量
子化ビット数で量子化符号し、符号l、ををマルチプレ
クサ450へ出力する。また、符号Jdを復号化して得
たp′4をパルス発生回路390とパルス発生回路42
0へ出力する。
次にインパルス応答計算回路210は、Kパラメータ符
号化回路200から予測係数値a′ を入力し、次式で
示される重み付けされた合成フィルタの伝達関数を表わ
すインパルス応答h  <n>を、あらかしめ定められ
たサンプル数だけ計算する。
H,(ZJ−□・W(Z)      (8)1−Σa
/、・z−1 ここでpは予測係数値a/、の次数を示す。
ここでH,■は重み付けされた合成フィルタのZ変換上
での伝達関数を示す。また、W(イ)は前述の(3)式
で示した重み付は関数のZ変換表現である。
インパルス応答計算回路210はインパルス応答h (
n)を自己相関々数計算回路360と相互相関々数計算
回路350とへ出力する。
次に自己相間々数計算回路360は、インパルス応答計
算回路210からインパルス応答h  (n)を入力し
、次式に従って自己相関々数Rhh(・)をあらかじめ
定められた遅れ時間τだけ計算Tる。
自己相関々数”bh(τ)は駆動信号計算回路390へ
出力される。
次に減算詣285は、バッファメモリ回路340に蓄積
された音声信号x(n)を入力し、x (n)から合成
フィルタ回路400の出力系列を1フレームサンプル分
減算し、減算結果e (n)を重み付は回路410へ出
力する。
次に重み付は回路410は、減算器285から減算結果
e(n)を入力し、またにパラメータ計算回路200か
ら予測係数値a11を入力し、e(n)に対して重み付
けを施しe (n)を出力する。ここでe (n)はZ
変換表現で次式のように書ける。
E(イ)= E(Z)・W■        00ここ
でEW■、E(イ)はそれぞれe、(n)のZ変換値。
eか)の2変換値を示す。またW■は前記(3)式で示
される重み付は関数の2変換値を示す。重み付は回路4
10は、e (n)を相互相関々数計算回路350へ出
力する。
次に相互相関々数計算回路350は、重み付は回路41
0からe  (n)を入力し、またインパルス応答計算
回路210からインパルス応答h  (n)を入力し、
次式に従って相互相関々数ψ、(n)をあらかじめ定め
られたサンプル数だけ計算する。
tphxtn3=  Σ6 =(n)−h、、 (n−
m) 、 (1≦m≦N)Ql)n醪1 相互相関々数ψhx(りはパルス計算回路390へ出力
される。
次に駆動信号計算回路390の説明を行なう。駆動信号
計算回路では、音声信号を良好に表わす駆動信号として
、パルス系列を計算する。駆動信号計算回路390を例
えば信号処理専用のシグナルブロセ、サチ、プを用いて
実現した場合を想定して、処理の流れ図を第5図の破線
部の内側に示す。図において、ブロック604では端子
600から相互相関々数ψhx(りを入力し、端子60
1から自己相関々数′fLhh (・)を入力し、端子
601から自己相関々数”hh (・)を入力し、端子
602からピッチ周期p /dを入力する。また端子6
03からe (n)を入力する。
プロ、り605ξこおいて変数iに1がセットされる。
ここでiはピッチ周期pl、毎に分割したサブフレーム
の番号を表わTインデックスである。
ブロック620では、ピッチ周期pI、を用いて、フレ
ームをpldサンプル毎のサブフレームに分割する。ま
た、ブロック620ではピッチ周期p′dを用いてlフ
レーム中のサブフレーム数Mが計算される。また、ブロ
ック620では谷サブフレーム区間及び残りの区間に求
められるパルス数が次のよ゛うに計算される。ここで各
ピッチサブフレーム区間及び残りの区間のパルス数をそ
れぞれLp、LRとし、1フレーム当たりのパルス数を
LBとすると、L 及びLRは次式を満足するようにM
−L +L ミL   α2 p      RB 決定される。
次にブロック630では、第1番目のサブフレームにた
てる音源パルスをL 個だけ計算する。ここで音源パル
スは次式に従って1パルスずつ順次(l≦i≦L)(L
31 上式でg、1m、は1番目のパルスの振幅1位置をそれ
ぞれ示す。またψhx ’ ′ELhhは相互相関々数
自己相関々数をそれぞれ示す。0式に従うパルス計算過
程を第6図に示す。。
第6図(a)は相互相関々数計算回路350で計算さく
22) れ、パルス計算回路390へ出方された相互相関々数ψ
hxのピッチサブフレーム分を示す。図において横軸は
サブフレーム内のサンプル時刻を示す。
縦軸は振幅である。第6図(b)は0り式に従って求め
た第1番目のパルスg1を示す図である。第6図(C)
は第6図(b)で求めたパルスの影響を差し引いた後の
図である。第6図(d)は第2番目のパルスg、を求め
た図である。第6図(e)は第2番目のパルスg、の影
響を差し引いた後の図である。第6図(d)から(e)
の処理をくり返してL 個のパルスが探索される。
次に、第7図にブロック620と630の動作例を示す
。第7図(a)は1フレ一ム分の音声信号系列を示T0
また第7図0))はlフレームをサブフレームに分割し
て、第1番目のサブフレームにおける音源パルスをC1
9式に従って求めた図を示す。この図ではサブフレーム
数Mは4.サブフレームあたりの音源パルス数りは6と
しである。
第5図に戻って、ブロック640ではサブフレームイン
デックスiをインクリメントする。ブロック640及び
650の処理はもう一度くり返される。
ブロック640では第2番目のサブフレームにおける音
源パルスが前記a3式に従ってL 個計算され、ブロッ
ク650ではサブフレームインデックスiがインクリメ
ントされる。
次にブロック650では、すず最初に次の2種類の8/
Nが計算される。一つは第1番目のサブフレーム区間で
求めた音源パルスを、ピッチ周期p/4だけすらせなが
ら第2番目のサブフレーム区間でくり返した場合のS/
N(S/N+ )。もう一つは第2番目のサブフレーム
において新たに計算された音源パルスを用いた場合のS
/N(S/N、 )である。ここで8/Nの計算は次式
をこ従う。
(14)式でRee(0)は、端子603から入力した
信号e Jn)に関Tるサブフレーム区間での電力を示
す。
次にブロック660では、87N1とS/N、との比R
を次式に従って求める。
またブロック660では〔1式に従い求めた凡の値をあ
らかじめ定められたしきい値Thと比較し、第1番目の
サブフレームで求めた音源パルスを第2番目のサブフレ
ームでくり返すか否かの判別を行なう。もしR≦Thな
らば、パルスをくり逗子こととし、リピート情報R(l
ビット)にあらかじめ定められた値(例えばO)をセッ
トし、ブロック680へ進む。−万、R>Thならば、
パルスをくり返さないこととし、ブロック670へ進む
。パルスをくり返さない場合に、ブロック670では、
第1番目のサブフレーム及び第2番目のサブフレームで
求めたパルスの個数をそれぞれサブフレーム当たり3A
tこすびく。具体的な方法としては例えば、パルスの絶
対値振幅の大きな方から、パルスをL /2個だけ選択
する方法が考えられる。菫たブロック670では、Hに
あらかじめ定められた値(例えばl)をセットし、プロ
、り680へ進む。
次にブロック680では、サブフレームインデツクスi
をインクリメントし、プロ、り690へ進む。
ブロック690では、iがサブフレーム分割数M′f越
えたか否かを判別する。もしiがMを越えてなければブ
ロック630へ飛び、ブロック690までの処理をくり
逗子。もしiがMを越えていればブロック700へ進む
。次にブロック700では、残りの区間に入るパルスを
LR個だけ、(1濁式に従って求める。次にブロック7
10では、以上の処理によって求めたパルス列を端子7
20から出力し、リピート情報Rを端子760から出力
Tる。ここで出力されたパルス列の一例を第7図(C)
に示す。この図では第2番目のサブフレーム及び第4番
目のサブフレームは、それぞれ第1番目、第3番目のサ
ブフレームで求めたパルスをくり返すので、新たにパル
スを求めてはいない。この図は、フレーム当たつのパル
ス数を13とした例であり、第1番目と第3番目のサブ
フレームにはパルスを6個、残りのサブフレームにはパ
ルスを1個求めて、フレーム全体でパルス数を13とじ
でや;いる。
以上で駆動信号計算回路390の説明を終了する。
駆動信号計算回路390で求めたパルス列は、符号化回
路470へ出力され、リピート情報Rは駆動音源信号復
元回路420とマルチプレクサ450へ出力される。
次に符号化回路470は、入力したパルスの振幅、位置
を符号化し、マルチプレクサ450へ出力する。
韮た、パルスの振幅、位置の復号値g’  、m’  
をI パルス発生回路42()へ出力する。ここでパルス系列
の符号化法は種々考えられる。一つは、パルス列の振幅
、位置を別々に符号化する方法であり、また一つは振幅
、位置を一緒に符号化する方法である。
前者の方法について一例を説明する。ます、パルス系列
の振幅の符号化法としては、フレーム内のパルス系列の
振幅の最大値を正規化係数として、この値を用いて各パ
ルスの振幅を正規化した後に、量子化、符号化する方法
が考えられる。また、他の方法としては、振幅の確率分
布を正規型と仮定して、正規型の場合の最適量子化器を
用いる方法が考えられる。これについては、ジェー・マ
ックス(J −MAX)氏によるアイ・アール・イー・
トランザクションズ・オン・インフォメーション・セオ
リー(IRE TH,AN8AOTION8 ON I
NFO−RMATION THEOR,Y)の1960
年3月号、7〜12頁に掲載の「クオンタイジング・フ
ォー・ミニマム・ディストーション」(“QUANT 
I Z I NGFORMINIMUMDI8TO1’
tTION”)と題した論文(文献4)等iこ詳述され
ているので、ここでは説明を省略■゛る。更に、各パル
スの振幅を偵交関係にある他のパラメータに変換した後
に量子化、符号化を施してもよい。また、パルス振幅毎
にビット割り当てを換えてもよい。次に、パルス位置の
符号化についても種々の方法が考えられる。例えば、フ
ァクシミリ信号符号化の分野でよく知られているランレ
ングス符号等を用いてもよい。これは符号”0”または
“l”の続く長さをあらかじめ定められた符号系列を用
いて表わすものである。また、正規化係数の符号化には
、従来よく知られている対数圧縮符号化等を用いること
ができる。
尚、パルス系列の符号化に関しては、ここで説明した符
号化方法に限らす、衆知の最良の方法を用いることがで
きることは勿論である。
次にマルチプレクサ450は、Kパラメータ符号化回路
200の出力符号lkjとピッチ符号化回路380の出
力符号ldと駆動信号計算回路390からのりビート情
報Rと符号化回路470の出力符号を入力し、これらを
組み合わせて送信側出力端子480から通信路へ出力す
る。以上で本発明による音声符号化方式の符号器側の説
明を終える。
次に本発明による音声符号化方式の復号器側について第
4図(b)を参照して説明する。デマルチプレクサ50
0は受信側入力端子490から入力した符号のうち、K
パラメータを表わ丁符号と、ピッチ周期を表わす符号と
、リピート情報と、パルス系列を表わす符号とを分離す
る。更ににパラメータを表わす符号をにパラメータ復号
回路520へ出力し、ピッチ周期を表わす符号をピッチ
復号回路510へ出力し、リピート情報を駆動信号復元
N路540へ出力し、パルス系列を表わす符号をパルス
復号回路530へ出力Tる。
第4図(a)に戻って、駆動音源信号復元回路420は
符号化回路470からパルス系列復号値g’、 、m’
 。
を入力する。また駆動信号計算回路390からリピート
情報Rを入力Tる。またピッチ符号化回路380からピ
ッチ周期復号値p/、を入力する。駆動音源信号復元回
路420はこれらの情報を用いて駆動音源信号を発生し
、合成フィルタ回路400へ出力する。
合成フィルタ回路400は、駆動音源信号復元回路42
0から駆動音源信号を入力し、Kパラメータ符号化回路
200から予測係数復号値a、を入力する。
合成フィルタ回路400は、入力した駆動音源信号と予
測係数復号値atを用いてlフレーム分の応答信号系列
x(n)を次式に従って計算する。
ここでx(n)の値は2フレ一ム分(l≦n≦2N)計
算される。d(n)は駆動音源信号を表わし、l≦n≦
Nでは駆動音源信号復元回路420から入力した駆動音
源信号を用いる。またN+I≦n≦2N次ににパラメー
タ復号回路520は、Kパラメータを復号し、Kパラメ
ータ復号回路 を合成フィルタ回路550へ出力する。
次にピッチ復号回路510はピッチ周期を復号しp′ 
をパルス発生回路540へ出力する。
次に音源パルス復号回路530は、音源パルス系列の振
幅、位置を復号し、それぞれg、’ 、m、’として駆
動信号復元回路540へ出力する。
次に駆動音源信号復元iq路540は、符号器側の駆動
音源信号復元回路420と同一の動作をする。
ピッチ周期復号値p′、を用いて、フレームをサブフレ
ームに分割し、サブフレームに発生させるパルス数Lp
、LRを計算する。この処理には、符号器側の駆!に!
]信号計算回路390における方法と同一の方法を用い
る。また駆動音源信号復元回路は、音源パルス系列の振
幅、位置の作号値g、’ l m、’とリピート情報R
を用いてサブフレームにパルスを発生させる。もし偶数
番目のサブフレームにおいて、リピート情報がパルスの
くり返しを示している場合は、1つ前のサブフレームの
パルスをp′ だけずらしてくり返す。一方、パルスを
くり返さない場合は、3個のパルスを発生させる。全て
のサブフレームに対してこれらの処理を行なう。
最後に、残った区間にTJ8個のパルスを発生させる。
以上のようにして発生されたパルスは駆動音源信号とし
て、合成フィルタ回路550へ出力される。
次に合成フィルタ回路550は、駆動音源信号とにバラ
メーグ復号値に′とを入力する。Kパラメ−タ復号値に
、′は前述の(5c)、(5d)、(5f)式を用いて
予測係数値a /、に変換される。合成フィルタ回路5
50は、次式に従って合成信号x(n)を1フレーム分
計算し、受信側出力端子560から出力する。
x (n) −d (n)十 Σa ’−2’(n−t
 )e(]≦n≦N)  (17)、、、11 ここでd (n)は駆動音源信号復元回路540から入
力した駆動音源信号を示す。以上で本発明による復号器
側の説明を終える。
本実施例においては、パルス探索アルゴリズムとして前
述の餞式を用いたが、これは他のパルス探索アルゴリズ
ムを用いてもよい。例えば従来例として文献1に示した
方式を用いてもよい。
また、03式の方法ではパルスを1つすつ)@番番こ探
索していたが、パルスを1つ求める毎(ここれより過去
に求まった複数個のパルスの振幅をA調整するような方
法を用いてもよい。
また本実施例では、音源パルスの韮びき万として2対1
のまびきについて説明したが、これ以外の比率のまびき
を行なうこともできる。
また本実施例では、送信側でパルスをまひくか否かを判
別し受信側にリピート情報Rを送っていたが、リピート
情報は送らす、送信側でばあらかじめ定められたまびき
率で常にまびき、受信向では送られたパルスを用いてあ
らかじめ定められた回数だけ常lこくり返す荷成として
もよい。
また本実施例では、あるサブフレーム(j番目のサブフ
レームとする)でパルスをまひかない場合には、j番目
のサブフレームとj−1番目のすが、これはj−1番目
とj番目の2つのサブフレーム全体に対してL 個のパ
ルスを求めるようにしてもよい。
また本実施例では、パルスをまびくか否かの判別には、
パルスをサブフレーム毎番こ計算して用いていたが、こ
れはフレームに対してあ、らかしめ定められた個数のパ
ルスを計算しておき、このパルスを用いてサブフレーム
毎に上記判別処理を行なってもよい。
また本実施例では、駆動信号計算回路390cこおいて
、フレームをピッチ周期p′4に応じたサブフレームに
分割する際に、第7図(b) 、 (C)に示したよう
に、フ、レームの左端からp′、サンプル毎にサブフレ
ームに分割した。サブフレームの分割法としては次のよ
うlこしてもよい。
ます、フレームに対してあらかじめ定められた個数のパ
ルスを計算する。次に求まったパルスのうち、フレーム
の左端に最も近いパルスの近傍を始点Tとして、p′、
サンプル毎をこサブフレームに分割するようにしてもよ
い。このようtこした場合は、始点Tの位置を受信側へ
伝送する必要がある。
これには例えば、フレーム左端から始点Tまでの距離T
 をあらかじめ定められた長さの符号で表わしで伝送し
てもよいし、T とピッチ周期p Zとの比をあらかじ
め定められた長さの符号で表わして伝送してもよい。
また受信側においてまびかれたパルスを復元する際に、
本実施例では一つ過去のサブフレームにおけるパルスを
くり返していたが、これは次のようにしてもよい。今、
パルスがまびかれたサブフレームの番号をjとすると、
j−1番目のサブフレームにおけるパルスとj+1番目
のサブフレームにおけるパルスとを用いて1番目のサブ
フレーム1こおけるパルスを補間して求めるようにして
もよい。
また本実施例では、ピッチ周期に応じて分割したサブフ
レームが、次のフレームにまたがる際には、現在のフレ
ームの最後のサブフレームはパルスのまびき処理を行な
わすに、パルスをあらかじめ定められた個数だけ新たに
求め直して伝送していた。これは例えば以下のようにし
てもよい。サブフレームが次のフレームにまたがる際に
は、次のフレームの信号を入力し、フレームをまたいで
サブフレームの分割を行ない、パルスのまびき処理を次
のフレームζこわたって連続的に行なうようにしてもよ
い。また別な方法としては、次のフレームにまたがるサ
ブフレームにおいて、サブフレームが現フレームに存在
する時間区間だけパルスまびき処理を行ない、サブフレ
ームの残りの時間区間に関しては、次のフレームにおい
て行なうようにしてもよい。
またフレーム毎の音声信号に対して有声、無声判別を行
ない、有声と判別されたフレームについて、パルスの猿
びき処理を行なうようにしてもよい。この有声、無声判
別には例えば、よく知られているように、音声信号また
は予測残差信号の自己相関または共分散関数のピッチ周
期だけ離れた時刻の値を用いることができる。
また本実施例では、受信側においてまびかれたパルスを
復元するために用いるピッチ周期pSとして、送信側で
求めたピッチ周期を受信して用いる構成としたが、ピッ
チ周期は伝送せずに、受信側では受信したパルス系列ま
たは過去に合成された合成信号系列x(n)の周期性か
らピッチ周期p′。
を抽出し、これをもとにまびかれたパルスを復元するよ
うな構成としてもよい。
本実施例の構成においては、短時間スペクトル構造を表
わTインパルス応答系列の自己相関々数を計算する際に
、インパルス応答計算回路210によってにパラメータ
復号値を用いてインパルス応答を計算した後に、このイ
ンパルス応答を用いて自己相関々数計算回路360にて
自己相関々数を計算していた。ディジタル信号処理の分
野でよく知られているように、インパルス応答の自己相
関々数はパワスペクトルと対応関係にある。従って菫す
にパラメータ復号値を用いてパワスペクトルを求め、そ
の後にこの対応関係を用いて自己相関々数を計算するよ
うな構成としてもよい。一方、音声信号と短時間スペク
トル包絡を表わ丁インパルス応答との相互相関々数を計
算する際に、本実施例の構成では重み付は回路410の
出力値e  (n)とにパラメータ復号値に/、を用い
てインパルス応答計算回路210にて計算したインパル
ス応答h  (n)を用いて相互相関々数ψ、(・)を
計算していた。よく知られているように、相互相関々数
はクロス・パワスペクトルと対応関係にある。従・って
ますe  (n)とに/、とを用いてクロス・パワスペ
クトルを求め、その後に相互相関々数を計算するような
構成としてもよい。尚、パワスペクトルと自己相関々数
との対応関係、クロスパワスペクトルと相互相関々数と
の対応関係については、ニー・ブイ、オッペンハイム(
A、V、OPPENHEIM)氏らによる[ディジタル
信号処理J (@DIGITAL8IGNAL PRO
OBS8ING−)と題した単行本(文献)の第8章に
そ詳細に説明されているので、ここでは説明を省略する
本実施例においては、lフレーム内のパルス系列の符号
化は、パルス系列が全て求まった後に、第4図(a)の
符号化回路470によって符号化を施したが、符号化を
パルス系列の計算に含めて、パルスを1つ計算する毎(
こ、符号化を行ない、次のパルスる計算するという構成
にしてもよい。このような構成をとることによって、符
号化の歪をも含めた誤差を最小とするようなパルス系列
が求まるので、更に品質を向上させることができる。
(本発明の効果) 以上説明したように本発明によれば、送信側ではピッチ
サブフレームのパルスをあらかじめ定められたまびき率
で時間的にまびき、まびかれたパルスを伝送し、受信側
では受信したパルスを用いて、まびかれたパルスを復元
し音声を合成するようにしているので、伝送レイトが低
い場合にも高品質な音声を合成できるという効果がある
【図面の簡単な説明】
第1図は従来方式の構成を示すブロック図、第2図は音
源パルス系列の一例を示す図、第3図は入力音声信号系
列の周波数特性と第1図に記載の重み付は回路の周波数
特性の一例を示T図、第4図(a) 、 (b)は本発
明による音声符号化方式の一実施例を示すブロック図、
第5図はパルス計算回路390の処理内容の一例を示す
図、第6図はパルス計算過程の一例を示、す図、第7図
は第5図のブロック620と630の動作例を示す図で
ある。 図1こおいて、110 、340・・・・・・バッファ
メモリ回路、120 、285・・・・・・減算回路、
130 、400 、550・・・・・・合成フィルタ
回路、420 、540 =−・・・・駆動音源信号復
元回路、150・・・・・・誤差最小化回路、180 
。 280・・・・・・Kパラメータ計算回路、190 、
410・・・・・・重み付は回路、200・・・・・・
Kパラメータ符号化回路、210・・・°°・インパル
ス応答計算回路、350・・・・・・相互相関計算回路
、3′60・・・・・・自己相関計算回路、370・・
・・・・ピッチ分析回路、380・・・・・・ピッチ符
号化回路、390・・・・・・パルス計算回路、470
・・・・・・符号化回路、450・・・・・・マルチプ
レクサ、500・・・・・・デマルチプレクサ、510
・・・・・・ピッチ復号回路、520・・・°°°にパ
ラメータ復号回路、530・・・・・・音源パルス復号
回路をそれぞれ示す。 第1図 才2図 才 3 図 オ6図 (C) (e) f 7 図 (b) (C) 手続補正書(自発) 昭和  年60°芹“−1日 特許庁長官 殿          国1、事件の表示
   昭和59年 特許 願第139634号2、発明
の名称  音声符号化方式とその装置3、補正をする者 事件との関係       出 願 人東京都港区芝五
丁目33番1号 (423)   日本電気株式会社 代表者 関本忠弘 4、代理人 (連絡先 日本電気株式会社特許部) 五 補正の対象 明細書の発明の詳細な説明の欄 a補正の内容 (1)  明細書第15頁第1行目から第2行目に「リ
ニア」とあるのを「リニア」と補正する。 (2)  明細書第23頁第2行目の「フレーム分」の
あとに次をそう入する。 「の例」 (3)明細書第39頁第13行目から第14行目K「ま
びき、まびかれたパルスを」とあるのを「まびいて」と
補正する。

Claims (3)

    【特許請求の範囲】
  1. (1)送信側では離散的な音声信号系列を入力し、あら
    かじめ定められた時間間隔毎にピッチを表わすピッチパ
    ラメータと短時間スペクトル包絡を表わすスペクトルパ
    ラメータとを抽出して符号化し、前記音声信号系列を前
    記ピッチに応じた時間区間に分割し、前記音声信号系列
    と前記スペクトルパラメータをもとに前記音声信号系列
    を表わすための駆動信号を前記時間区間のうちの一部区
    間について求めて符号化し、前記ピッチパラメータを表
    わす符号と前記スペクトルパラメータを表わす符号と前
    記駆動信号を表わす符号とを組み合わせて出力し、受信
    側では前記組み合わされた符号を入力し、前記ピッチパ
    ラメータを表わす符号と前記スペクトルパラメータを表
    わす符号と前記駆動信号を表わす符号とを分離して復号
    し、前記ピッチパラメータと前記復号された駆動信号を
    もとに前記時間区間の駆動音源信号を復元し前記復元さ
    れた駆動音源信号と前記復号されたスペクトルパラメー
    タ系列とを用いて前記音声信号系列を再生することを特
    徴とする音声符号化方式。
  2. (2)入力音声信号系列からあらかじめ定められた時間
    間隔毎にピッチを表わすピッチパラメータと短時間スペ
    クトル包絡を表わすスペクトルパラメータとを抽出し符
    号化するパラメータ計算回路と、前記音声信号系列を前
    記ピッチに応じた時間区間に分割し、前記音声信号系列
    と前記スペクトルパラメータをもとに前記音声信号系列
    を表わすための駆動信号を前記時間区間のうちの一部区
    間について求めて符号化する駆動信号計算回路と、前記
    パラメータ計算回路の出力符号と前記駆動信号を表わす
    符号とを組み合わせて出力するマルチプレクサ回路とを
    有することを特徴とする音声符号化装置。
  3. (3)ピッチパラメータを示す符号とスペクトルパラメ
    ータを示す符号と駆動信号を表わす符号とが組み合わさ
    れた符号系列が入力され、ピッチパラメータを表わす符
    号とスペクトルパラメータ系列を表わす符号と駆動信号
    を表わす符号とを分離して復号するデマルチプレクサ回
    路と、前記復号されたピッチパラメータと前記復号され
    た駆動信号をもとに駆動音源信号を復元する駆動音源信
    号復元回路と、前記駆動音源信号と前記復号されたスペ
    クトルパラメータ系列とを用いて音声信号系列を再生し
    出力する合成フィルタ回路とを有することを特徴とする
    音声信号復号化装置。
JP59139634A 1984-07-05 1984-07-05 音声符号化方法とその装置 Expired - Lifetime JPH0632035B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP59139634A JPH0632035B2 (ja) 1984-07-05 1984-07-05 音声符号化方法とその装置
CA000486304A CA1255802A (en) 1984-07-05 1985-07-04 Low bit-rate pattern encoding and decoding with a reduced number of excitation pulses
US06/751,818 US4945565A (en) 1984-07-05 1985-07-05 Low bit-rate pattern encoding and decoding with a reduced number of excitation pulses

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59139634A JPH0632035B2 (ja) 1984-07-05 1984-07-05 音声符号化方法とその装置

Publications (2)

Publication Number Publication Date
JPS6119000A true JPS6119000A (ja) 1986-01-27
JPH0632035B2 JPH0632035B2 (ja) 1994-04-27

Family

ID=15249846

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59139634A Expired - Lifetime JPH0632035B2 (ja) 1984-07-05 1984-07-05 音声符号化方法とその装置

Country Status (1)

Country Link
JP (1) JPH0632035B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011033672A (ja) * 2009-07-30 2011-02-17 Fujitsu Ltd 音声信号変換装置、音声信号変換方法および音声信号変換プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011033672A (ja) * 2009-07-30 2011-02-17 Fujitsu Ltd 音声信号変換装置、音声信号変換方法および音声信号変換プログラム

Also Published As

Publication number Publication date
JPH0632035B2 (ja) 1994-04-27

Similar Documents

Publication Publication Date Title
JPH0353300A (ja) 音声符号化装置
JP2903533B2 (ja) 音声符号化方式
EP0374941A2 (en) Communication system capable of improving a speech quality by effectively calculating excitation multipulses
JP2844589B2 (ja) 音声信号符号化方法とその装置
JP3303580B2 (ja) 音声符号化装置
JPS6238500A (ja) 高能率音声符号化方式とその装置
JPS6119000A (ja) 音声符号化方法とその装置
JP2956068B2 (ja) 音声符号化復号化方式
JP2900431B2 (ja) 音声信号符号化装置
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP2560682B2 (ja) 音声信号符号化復号化方法とその装置
JP2946528B2 (ja) 音声符号化復号化方法及びその装置
JPH058839B2 (ja)
JPH0481199B2 (ja)
JP3035960B2 (ja) 音声符号化復号化方法及びその装置
JP2508002B2 (ja) 音声符号化方法とその装置
JP2615862B2 (ja) 音声符号化復号化方法とその装置
JP3128226B2 (ja) 音声符号化方法
JPH043878B2 (ja)
JP2844590B2 (ja) 音声符号化方式とその装置
JP3017747B2 (ja) 音声符号化装置
JPS6120997A (ja) 音声信号符号化方式とその装置
JPH0632032B2 (ja) 音声帯域信号符号化方法とその装置
JPH0426119B2 (ja)
JPH0683149B2 (ja) 音声帯域信号符号化・復号化装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term