JPH0683149B2 - 音声帯域信号符号化・復号化装置 - Google Patents

音声帯域信号符号化・復号化装置

Info

Publication number
JPH0683149B2
JPH0683149B2 JP6711484A JP6711484A JPH0683149B2 JP H0683149 B2 JPH0683149 B2 JP H0683149B2 JP 6711484 A JP6711484 A JP 6711484A JP 6711484 A JP6711484 A JP 6711484A JP H0683149 B2 JPH0683149 B2 JP H0683149B2
Authority
JP
Japan
Prior art keywords
pulse
circuit
parameter
sequence
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP6711484A
Other languages
English (en)
Other versions
JPS60212045A (ja
Inventor
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP6711484A priority Critical patent/JPH0683149B2/ja
Priority to CA000475777A priority patent/CA1229681A/en
Publication of JPS60212045A publication Critical patent/JPS60212045A/ja
Priority to US07/462,981 priority patent/US4945567A/en
Publication of JPH0683149B2 publication Critical patent/JPH0683149B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】 <産業上の利用分野> 本発明は音声帯域信号(音声信号、データモデム信号
等)の低ビットレイト波形符号化方式、特に伝送情報量
を16Kビット/秒以下とするような音声帯域信号符号化
復号化装置に関する。
<従来技術とその問題点> 音声信号を16Kビット/秒程度以下の伝送情報量で符号
化するための方式として、最近マルチパルス駆動形音声
符号化方式が提案されている。これは、駆動音源信号系
列を表わす複数個のパルス系列(マルチパルス)を、短
時間毎に符号器側でA−b−S(ANALYSIS−BY−SYNTHE
SIS)の手法を用いて遂次的に求め、このパルス系列を
符号化伝送する方式である。本発明はこの方式に関係す
るものである。この方式の詳細については、ビー・エス
・アタール(B.S.ATAL)氏らによるアイ・シー・エー・
エス・エス・ピー(I.C.A.S.S.P.)の予稿集、1982年61
4〜617頁に掲載の「ア.ニユー.モデル.オブ.エル.
ピー.シー.エクサイティション.フォー.プロデュー
シング.ナチュラル.サウンディング.スピーチ.アッ
ト.ロウ.ビット.レイツ」(“A NEW MODEL OF LPC E
XCITATION FOR PRODUCING NATURAL−SOUNDING SPEECH A
T LOW BIT RATES")と題した論文(文献1)に説明され
ているので、ここでは簡単に説明を行なうにとどめる。
第1図は、前記文献1に記載された従来方式における符
号器側の処理を示すブロック図である。図において、10
0は符号器入力端子を示し、A/D変換された音声信号系列
x(n)が入力される。110はバッファメモリ回路であ
り、音声信号系列を1フレーム(例えば8KHZサンプリン
グの場合でフレーム長を10msecとすると80サンプル)
分、畜積する。バッファメモリ回路110の出力値は減算
器120と、Kパラメータ計算回路180とに出力される。但
し、文献1、によればKパラメータのかわりにレフレク
ション・コエフィシエンツ(REFLECTION COEFFICIENT
S)と記載されているが、これはKパラメータと同一の
パラメータである。Kパラメータ計算回路180は、バッ
ファメモリ回路110の出力値を用い、共分散法に従っ
て、フレーム毎の音声信号スペクトルを表わすKパラメ
ータKiを16次分(1≦i≦16)求め、これらを合成フィ
ルタ130へ出力する。140は、音源パルス発生回路であ
り、1フレーム内にあらかじめ定められた個数のパルス
系列を発生させる。ここでは、このパルス系列をd
(n)と記する。音源パルス発生回路140によって発生
された音源パルス系列の一例を第2図に示す。第2図で
横軸は離散的な時刻を、縦軸は振幅をそれぞれに示す。
ここでは、1フレーム内に8個のパルスを発生させる場
合について示してある。音源パルス発生回路140によっ
て発生されたパルス系列d(n)は、合成フィルタ130
を駆動する。合成フィルタ130は、d(n)を入力し、
音声信号x(n)に対応する再生信号(n)を求め、
これを減算器120へ出力する。ここで、合成フィルタ130
は、KパラメータKiを入力し、これらを予測パラメータ
ai(1≦i≦16)へ変換し、aiを用いて再生信号
(n)を計算する。(n)は、d(n)とaiを用いて
下式のように表わすことができる。
上式でPは合成フィルタの次数を示し、ここではP=16
6としている。減算器120は、原信号x(n)と再生信号
(n)との差e(n)を計算し、重み付け回路190へ
出力する。190は、e(n)を入力し、重み付け関数w
(n)を用い、次式に従って重み付け誤差ew(n)を計
算する。
ew(n)=w(n)e(n) −(2) 上式で、記号“*”はたたみこみ積分を表わす。また、
重みづけ関数w(n)は、周波数軸上で重み付けを行な
うものであり、そのZ変換値をW(Z)とすると、合成
フィルタの予測パラメータaiを用いて次式により表わさ
れる。
上式でrは0≦r≦1の定数であり、W(Z)の周波数
特性を決定する。つまり、r=1とすると、W(Z)=
1となり、W(Z)の周波数特性は平担となる。一方、
r=0とすると、W(Z)の合成フィルタの周波数特性
の逆極性となる。従って、rの値によってW(Z)の特
性を変えることができる。また、(3)式に示したよう
にW(Z)の特性を合成フィルタの周波数特性に依存さ
せて決めているのは、聴感的なマスク効果を利用してい
るためである。つまり、入力音声信号のスペクトルのパ
ワが大きな箇所では(例えばフォルマント周波数の近
傍)、再生信号のスペクトルとの誤差が少々大きくて
も、その誤差は耳につきにくいという聴感的な性質によ
る。第3図に、あるフレームにおける入力音声信号のス
ペクトルと、W(Z)の周波数特性の一例とを示した。
ここではr=0.8とした。図において、横軸は周波数
(最大4KHz)を、縦軸は対数振幅(最大60dB)をそれぞ
れ示す。また、上部の曲線は音声信号のスペクトルを、
下部の曲線は重み付け関数の周波数特性を表わしてい
る。
第1図へ戻って、重み付け誤差ew(n)は、誤差最小化
回路150へフィードバックされる。誤差最小化回路150
は、ew(n)の値を1フレーム分記憶し、これらを用い
て次式に従い、重み付けられた誤差電力εを計算する。
ここでNは誤差電力を計算するサンプル数を示す。
文献1、の方式では、この時間長を5msecとしており、
これは8KHzサンプリングの場合にはN=40に相当する。
次に、誤差最小化回路150は、前記(4)式で計算した
誤差電力εを小さくするように音源パルスの振幅及び位
置を求め、この振幅情報と位置情報とを音源パルス発生
回路140に出力する。音源パルス発生回路140はこの情報
に基づいて音源パルス系列を発生させる。
合成フィルタ回路130は、この音源パルス系列を駆動源
として再生信号(n)を求める。減算器120では、原
信号と先に計算した再生信号との誤差e(n)から上記
のようにして求まった再生信号(n)を減算して、こ
れを新たな誤差e(n)とする。重み付け回路190はe
(n)を入力し重み付け誤差ew(n)を計算し、これを
誤差最小化回路150へフィードバックする。誤差最小化
回路150は、再び誤差電力を計算し、この誤差電力を小
さくするように音源パルス列の振幅と位置とを調整す
る。こうして音源パルス系列の発生から誤差最小化によ
る音源パルス系列の調整までの一連の処理は、音源パル
ス系列フレーム内のパルス数があらかじめ定められた数
に達するまでくり返され、音源パルス系列が決定され
る。
以上で従来方式の説明を終了する。
この方式の場合に、伝送すべき情報は、合成フィルタの
KパラメータKi(1≦i≦16)と、音源パルス系列のパ
ルス位置及び振幅であり、1フレーム内にたてるパルス
の数によって任意の伝送レイトを実現できる。さらに、
伝送レイトを16Kbps〜10Kbpsとする領域に対しては有効
な方式の一つと考えられる。
しかしながら、この従来方式は、演算量が非常に多いと
いう欠点がある。これは音源パルス系列におけるパルス
の位置と振幅を計算する際に、そのパルスに基づいて再
生した信号と原信号との誤差及び誤差電力を計算し、そ
れらをフィードバックさせて誤差電力を小さくするよう
にパルス位置と振幅とを調整していることに起因してい
る。更には、これらパルスの発生から誤差電力をフィー
ドバックさせてパルス振幅と位置とを調整するまでの処
理を、パルスの数があらかじめ定められた値に達するま
でくり返すことに起因している。
また、16Kビット/秒以下の伝送ビットレイトの場合、
音声信号の無声部分では従来方式によれば音源パルス数
が十分に多くはできないので、このような箇所では良好
な特性が得られなかった。
最近の動向として、16Kビット/秒程度の伝送ビットレ
イトで2400ビット/秒程度の音声帯域データモデム信号
を良好に伝送したいという要請が非常に強い。音声帯域
データモデム信号に対しては、従来方式によれば、パル
ス数が十分に多くはないので良好な特性を得ることが困
難であった。
<発明の目的> 本発明の目的は、16Kビット/秒、あるいは16Kビット/
秒以下の伝送ビットレイトで音声信号に対しては勿論の
こと、2400ビット/秒程度の音声帯域データモデム信号
に対しても比較的少ない演算量で良好な特性が得られる
音声帯域信号符号化方式とその装置を提供することにあ
る。
<発明の構成> 本発明によれば、送信側は、離散的な音声帯域信号系列
を入力し、前記音声帯域信号系列から短時間スペクトル
包絡を表すスペクトルパラメータ系列を抽出し符号化す
る手段と、前記符号化されたスペクトルパラメータ系列
をもとに正規化予測誤差を算出し、前記正規化予測誤差
をあらかじめ定められたしきい値と比較して判別情報を
つくるパラメータ計算回路と、前記スペクトルパラメー
タから求めたインパルス応答の自己相関と前記音声帯域
信号系列と前記インパルス応答との相互相関とを求め、
求めるパルス系列の個数を前記判別情報に従い切り替
え、前記音声帯域信号系列を良好に表し得るパルス系列
を前記個数だけ探索し符号化するパルス探索回路と、前
記スペクトルパラメータ系列を表す符号と前記パルス系
列を表す符号とを組み合わせて出力するマルチプレクサ
回路とを有する符号化器であり、受信側は、前記組み合
わされた符号系列を入力しスペクトルパラメータ系列を
表す符号を分離するデマルチプレクサ回路と、前記スペ
クトルパラメータを復号し、前記復号したスペクトルパ
ラメータをもとに正規化予測誤差を算出し、前記正規化
予測誤差をあらかじめ定められたしきい値と比較して判
別情報をつくり、前記判別情報に従って復号すべきパル
スの個数を切り替え、前記個数に従いパルス系列を表す
符号を分離し復号する手段と、前記復号されたパルス系
列を入力して駆動パルス系列を発生させるパルス系列発
生回路と、前記復号されたスペクトルパラメータ系列と
前記駆動パルス系列とを用いて音声狭帯域信号系列を再
生し出力する合成フィルタ回路とを有する復号化器であ
ることを特徴とする音声帯域信号符号化・復号化装置が
得られる。
<実施例> 本発明による音声帯域信号符号化復号化装置の構成を図
面を用いて詳細に説明する。第4図(a)は、本発明に
よる音声帯域信号符号化復号化装置の符号器側の一実施
例を示すブロック図であり、第4図(b)は復号器側の
一実施例を示すブロック図である。第4図(a)におい
て、音声帯域信号系列x(n)は、入力端子195から入
力され、あらかじめ定められたサンプル数だけ区切られ
てバッファメモリ回路340に蓄積される。次にKパラメ
ータ計算回路280は、バッファメモリ回路340に蓄積され
ている音声帯域信号のうち、あらかじめ定められたサン
プル数を入力し、入力信号のスペクトル包絡を表わすLP
Cパラメータを計算する。LPCパラメータとしては種々知
られているが以下ではKパラメータを用いるものとして
説明を進める。尚、Kパラメータはパーコール係数と同
一のパラメータである。Kパラメータの計算法としては
代表的な方法として自己相関法と、共分離法がよく知ら
れている。ここでは自己相関法によるKパラメータの計
算法を、ジョン・マクホウル(JOHN MAKHOUL)氏らによ
るアイ・イー・イー・イートランザクションズ・オン・
エー・エス・エス・ピー(IEEE TRANSACTIONS ON A.S.
S.P.)誌1975年6月号、309〜321頁に掲載の「クォンタ
イゼイシション・プロパティズ・オブ・トランスミッシ
ョン・パラメターズ・イン・リニア・プリディクティブ
・システムズ(QUANTIZATION PROPERTIES OF TRANSMISS
ION PARAMETERS IN LINEAR PREDICTIVE SYSTEMS)」と
題した論文(文献2)等に説明されている方法を引用し
て以下に示す。
式(5a)から式(5f)はi=1,2,…Pとして再帰的に解
くことができる。式において、Kiはi次目のKパラメー
タ値を示す。またR(i)は入力信号に対する遅れ時間
iの自己相関々数を示す、Pは予測分析次数を示す。▲
(p) j▼は分析次数Pの場合のj番目の線形予測係数を
示す。ここで式(5e)のEiの値は次数iの予測における
予測誤差電力を示している。従って計算の各段階で次数
iの予測の予測誤差電力を監視することができる。Eiを
用いて正規化予測誤差は次式のように表わせる。
Vi=Ei/R(0) (6) i=Pの場合には(5e)式を用いて と表わせる。ここで1/VPは予測利得ともよばれる。従っ
てKパラメータ値が既知の場合は、(7)式を用いれば
P次予測分析の場合の正規化予測誤差を知ることができ
る。以上で自己相関法によるKパラメータ計算法の説明
を終える。
第4図(a)に戻って、Kパラメータ計算回路280は式
(5a)から式(5e)に従ってあらかじめ定められた次数
M2(例えばM2=12)のKパラメータKi(1≦i≦M2)を
計算し、Kパラメータ符号化回路200へ出力する。
次にKパラメータ符号化回路200は、Kパラメータ値Ki
を入力し、あらかじめ定められた量子化特性と量子化ビ
ット配分に従って、最初のM1(M1<M2,例えばM1=4)
次のKパラメータ値を符号化した後に復号化し、Kパラ
メータ復号値K′i(1≦i≦M1)を求める。このKパ
ラメータ復号値を用いて前述の(7)式に従い正規化予
測誤差VM1を計算する。この際に(7)式の次数PはM1
とする。求まった正規化予測誤差VM1をあらかじめ定め
られたしきい値と比較して、VM1がしきい値よりも小さ
ければ現フレーム区間の入力信号は有声と判断する。一
方、VM1がしきい値よりも大きければ無声と判断する。
有声と判断された場合には、入力したKパラメータ値の
符号化を続けM2(例えばM2=12)次までのKパラメータ
を符号化し、符号lKiをマルチプレクサ450へ出力する。
一方、無声と判断された場合には、すでに求まっている
M1次までのKパラメータを表わす符号lKiをマルチプレ
クサ450へ出力する。Kパラメータ符号化回路200は有声
/無声判別結果にもとづく有声/無声判別情報dをイン
パルス応答計算回路210とパルス計算回路390と合成フィ
ルタ回路400と重み付け回路410と符号化回路470とへ出
力する。またKパラメータ符号化回路200は、符号lKiを
復号化したKパラメータ復号値Ki(1≦i≦M1または1
≦i≦M2)を用いて前述の(5c),(5d),(5f)式に
従い予測係数値a′iに変換する。この際に次数Pは有
声/無声判別情報に従ってM1またはM2次とする。求めた
予測係数値a′iはインパルス応答計算回路210と重み
付け回路410と合成フィルタ回路400とへ出力される。
次にインパルス応答計算回路210は、Kパラメータ符号
化回路200から有声/無声判別情報dと予測係数値a′
iを入力し、次式で示される重み付けされた合成フィル
タの伝達関数Hw(Z)を表わすインパルス応答hw(n)
を、あらかじめ定められたサンプル数だけ計算する。
ここでPは予測係数値a′iの次数を示す。Pは有声/
無声判別情報dに従って切り換えられ、有声の場合はP
はM2(例えば12)次にセットされ、無声の場合はPはM1
(例えば4)次にセットされる。また、W(Z)は前記
(3)式で示した重み付け関数のZ変換表現である。但
し次数Pは、有声/無声情報dに従いM2またはM1に切り
換えられる。インパルス応答計算回路210はインパルス
応答hw(n)を自己相関々数計算回路360と相互相関々
数計算回路350とへ出力する。
次に自己相関々数計算回路360は、インパルス応答計算
回路210からインパルス応答hw(n)を入力し、次式に
従って自己相関々数Rhh(・)をあらかじめ定められた
遅れ時間τだけ計算する。
自己相関々数Rhh(τ)はパルス計算回路390へ出力され
る。
次に減算器285は、バッファメモリ回路340に蓄積された
音声信号x(n)を入力し、x(n)から合成フィルタ
回路400の出力系列を1フレームサンプル分減算し、減
算結果e(n)を重み付け回路410へ出力する。
次に重み付け回路410は、減算器285から減算結果e
(n)を入力し、またKパラメータ符号化回路200から
予測係数値a′iと有声/無声判別情報dとを入力し、
減算結果e(n)に対して重み付けを施したew(n)を
出力する。ここでew(n)はZ変換表現で次式のように
書ける。
EW(Z)=E(Z)・W(Z) (10) ここでEW(Z),E(Z)はそれぞれew(n)のZ変換
値、e(n)のZ変換値を示す。W(Z)は前記(3)
式で示した重み付け関数のZ変換値を示す。但しW
(Z)の次数Pは有声/無声情報dに従いM2またはM1
切り換えられる。重み付け回路410は、求めたew(n)
を相互相関々数計算回路350へ出力する。
次に相互相関々数計算回路350は、重み付け回路410から
ew(n)を入力し、またインパルス応答計算回路210か
らインパルス応答hw(n)を入力し、次式に従って相互
相関々数hx(m)をあらかじめ定められたサンプル数
だけ計算する。
求めた相互相関々数hx(・)はパルス計算回路390へ
出力される。
次にパルス計算回路390は、相互相関々数計算回路350か
ら相互相関々数hx(・)を入力し、自己相関々数計算
回路360から自己相関々数Rhh(・)を入力し、Kパラメ
ータ符号化回路200から有声/無声判別情報dを入力す
る。ここでパルス計算回路390は、有声/無声判別情報
dに従って、1フレーム内に求めるパルス数を切り換え
る。つまり有声の場合にはL1個のパルスを求め、無声の
場合にはL2個のパルスを求める。但し、L1<L2とし、無
声の場合のパルス数が多くなるようにしておく。無声の
場合に、有声の場合と比較してパルス数を増やす必要が
あるのは、前述したように無声の場合は有声の場合に比
べ一般的には予測利得が少ないためである。ここでパル
ス数は伝送ビットレイトに応じて決定されなくてはなら
ない。今、フレーム当たりのパルス数を一定とした場合
に例えば、伝送ビットレイトを16Kビット/秒とする
と、後述する量子化回路における量子化ビット配分を一
例にとれば、パルス数は有声の場合にL1=32、無声の場
合にL2=50個程度にすることができる。
パルス計算回路390では、入力信号と合成信号との重み
付け誤差電力を最小化するパルス系列を、次式に従って
1パルスずつ順次計算する。
ここでgiはフレーム内のi番目にたつパルスの振幅を示
す。miはi番目のパルスのフレーム内のサンプル位置を
示す。またLは1フレーム内に求めるパルス数を示し、
この値は前述のように有声/無声判別情報に従ってL
1(有声の場合)、またはL2(無声の場合)に切り換え
られる。パルスの位置miはgiの絶対値最大値をとるフレ
ーム内位置から求めることができる。
次に、(12)式に従ってパルスを1っずつ求める過程
を、図面を用いて説明する。第5図(a)は相互相関々
数計算回路350で計算され、パルス計算回路390へ出力さ
れた1フレーム分の相互相関々数の一例を示す。図にお
いて横軸は1フレーム内のサンプル時刻を示す。フレー
ム長は160としている。縦軸は振幅を示す。第5図
(b)は(12)式に従って求めた第1番目のパルスg1
示す図である。第5図(c)は第5図(b)で求めたパ
ルスの影響を差し引いた後の図である。第5図(d)は
(12)式に従って第2番目のパルスg2を求めた図であ
る。第5図(e)は第2番目のパルスg2の影響を差し引
いた後の図である。第5図(d)から(e)の処理をく
り返してL1個またはL2個のパルスを求めればよい。
第4図(a)に戻って、パルス計算回路390は(12)式
に従って求めたパルス列を符号化回路470へ出力する。
次に符号化回路470は、パルス計算回路390からパルス系
列を入力し、Kパラメータ符号化回路200から有声/無
声判別情報dを入力する。符号化回路470は、有声/無
声判別情報dに従い、有声、無声の場合に対して量子化
ビット数の配分及び量子化特性を切り換える。量子化特
性を切り換えるのは、有声と無声の場合ではパルス振幅
の分布が異なるので、各々の分布に対し最適な量子化を
施すためである。符号化回路470は、入力したパルス系
列の振幅、位置を符号化し、マルチプレクサ450へ出力
する。また、パルス系列の振幅、位置の復号値g′i,
m′iをパルス発生回路420へ出力する。ここでパルス系
列の符号化法は種々考えられる。一つは、パルス列の振
幅、位置を別々に符号化する方法であり、また一つは振
幅、位置を一緒に符号化する方法である。
前者の方法について一例を説明する。まず、パルス系列
の振幅の符号化法としては、フレーム内のパルス系列の
振幅の最大値を正規化係数としてこの値を用いて各パル
スの振幅を正規化した後に、量子化、符号化する方法が
考えられる。量子化特性については、有声、無声、各々
の場合の振幅分布に応じた最適な特性を用いる。また、
各パルスの振幅を直交関係にある他のパラメータに変換
した後に量子化、符号化を施してもよい。また、パルス
振幅毎にビット割り当てを変えてもよい。次に、パルス
位置の符号化についても種々の方法が考えられる。例え
ば、ファクシミリ信号符号化等でよく知られているラン
レングス符号等を用いてもよい。これは符号“0"または
“1"の続く長さをあらかじめ定められた符号系列を用い
て表わすものである。また、正規化係数の符号化には、
従来よく知られている対数圧縮符号化等を用いることが
できる。
次に有声、無声の各場合に対する量子化ビット配分の一
例を以下に示す。伝送ビットレイトは16Kビット/秒と
する。もし判別情報dが有声であった場合には、パルス
振幅の量子化ビット数は5ビット、パルス位置のビット
数は3ビットとする。一方、判別情報が無声であった場
合には、パルス振幅の量子化ビット数は4ビット、パル
ス位置のビット数は2ビットとする。このビット配分に
よれば、伝送ビットレイトを16Kビット/秒とした場合
に、前述のように、有声に対するパルス数は32、無声に
対するパルス数は50程度とすることができる。
尚、パルス系列の符号化に関しては、ここで説明した符
号化方法に限らず、衆知の最良の方法を用いることがで
きることは勿論である。
第4図(a)に戻って、パルス発生回路420は、パルス
系列復号値g′i,m′iを入力してm′iの位置に振幅
g′iをもち、他のサンプル位置は振幅を0とする駆動
パルス系列を1フレーム分発生させる。パルス発生回路
420は、駆動パルス系列を合成フィルタ回路400へ出力す
る。
合成フィルタ回路400は、パルス発生回路420から駆動パ
ルス系列を入力し、Kパラメータ符号化回路200から有
声/無声判別情報dと予測係数復号値a′iを入力す
る。合成フィルタ回路400は、入力した駆動パルス系列
と予測係数復号値a′iとを用いて1フレーム分の応答
信号系列(n)を次式に従って計算する。
ここで(n)の値は2フレーム分(1≦n≦2N)計算
される。d(n)は駆動信号を表わし、1≦n≦Nでは
パルス発生回路420から入力した駆動パルス系列を用い
る。またN+1≦n≦2Nでは全て0の系列を用いる。次
数Pは判別情報dに従って切り換え、有声の場合はM
2(例えば12)次、無声の場合はM1(例えば4)次とす
る。(13)式で求めた(n)のうち、2フレーム目の
(n)(N+1≦n≦2N)の値が減算器285へ出力さ
れる。
次にマルチプレクサ450は、Kパラメータ符号化回路200
から出力された符号系列と符号化回路470から出力され
た符号系列とを組み合わせて送信側出力端子480から通
信路へ出力する。以上で本発明による音声帯域信号符号
化復号化装置の符号器側の説明を終える。
次に本発明による音声帯域信号符号化復号化装置の復号
器側について第4図(b)を参照して説明する。デマル
チプレクサ500は、復号器側入力端子490から組み合わさ
れた符号を入力する。デマルチプレクサ500は入力した
符号のうち、Kパラメータを表わす符号を最初のM1(例
えば4)次分だけ分離し、Kパラメータを表わす符号を
Kパラメータ復号回路520へ出力する。
次にKパラメータ復号回路520は、Kパラメータを表わ
す符号を入力し、M1(例えば4)次分だけあらかじめ定
められた復号特性に従って復号する。この復号されたK
パラメータ値K′i(1≦i≦M1)を用いて前記(7)
式に従って正規化予測誤差V′M1を計算する。次にV′
M1の値をあらかじめ定められたしきい値と比較して、
V′M1がしきい値よりも小さければ有声と判断する。一
方、V′M1がしきい値よりも大きければ無声と判断す
る。このようにして有声/無声判別情報をつくり、これ
をデマルチプレクサ500とパルス系列復号回路530と合成
フィルタ回路550とへ出力する。無声と判断された場合
には、Kパラメータ復号回路520はM1次のKパラメータ
復号値を合成フィルタ回路550へ出力する。一方、有声
と判断された場合には、デマルチプレクサ500からM
2(例えば12)次までのKパラメータを表わす符号がK
パラメータ復号回路520に出力される。Kパラメータ復
号回路520は新たに入力した符号を用いてKパラメータ
の復号処理を続け、M2(例えば12)次のKパラメータを
復号し、復号値K′i(1≦i≦M2)を合成フィルタ回
路550へ出力する。以上の処理によってKパラメータを
表わす符号が分離される。
次にパルス系列復号回路530は、有声/無声判別情報を
Kパラメータ復号回路520から入力し、パルス系列を表
わす符号をデマルチプレクサ500から分離して入力し、
有声/無声判別情報に従って、有声の場合にはL1(例え
ば32)個のパルス系列を復号化する。一方、無声の場合
にはL2(例えば50)個のパルス系列を復号化する。復号
化されたパルス系列の振幅、位置情報はパルス発生回路
540へ出力される。パルス発生回路540は、復号化された
振幅、位置情報を入力し駆動パルス系列を発生させ、合
成フィルタ回路550へ出力する。
次に合成フィルタ回路550は、有声/無声判別情報と駆
動パルス系列と、Kパラメータ復号値K′iとを入力す
る。Kパラメータ復号値K′iは前述の(5c),(5
d),(5f)式を用いて予測係数値a′iに変換され
る。この際に有声/無声判別情報に従って次数PをM1
たはM2に切り換えておく。合成フィルタ回路550は次式
に従って合成信号(n)を1フレーム分計算し、受信
側出力端子560から出力する。
ここでd(n)は駆動パルス系列を示す。また次数Pは
有声/無声判別情報に従って、M1またはM2に切り換えら
れる。以上で本発明による復号器側の説明を終える。
本実施例の構成によれば、パルス系列を前述の(12)式
に従い求めているので、文献1.の従来方式のように、音
源パルスで合成フィルタを駆動して再生信号を求め、原
信号との2乗誤差をフィードバックしてパルスを調整す
るという径路がなく、またその処理をくり返す必要もな
いので、演算量を大幅に低減できる。但し、パルス計算
アルゴリズムは実施例で説明した方法に限定されるわけ
ではなく演算量の増加を許せば、前記文献1.に例を示す
ようなA−b−S的手法によるパルス計算アルゴリズム
を用いてもよい。
尚、(12)式に示したパルス計算法においては、パルス
を1つずつ順番に計算していた。この方法においては次
のパルスを計算する際にこれより過去に求まった複数個
のパルスの振幅を再調整するようにしてもよい。このよ
うにすることによってパルス間の距離が短く、パルスが
互いに独立でない場合に特性が向上する。また音源パル
スを求める方法としては、より最適なパルス系列を計算
する方法のような他の良好なパルス系列計算法を用いて
もよい。
また本実施例においては、理解を容易とするために合成
フィルタ回路550の次数を、有声/無声判別情報を入力
して切り換えていたが、有声/無声判別情報を用いた切
り換え操作はなくてもよい。これはKパラメータ復号回
路520から入力するKパラメータ復号値の次数が有声/
無声判別情報に応じてすでに切り換えらているためであ
る。
また本実施例においては、有声/無声判別情報を用い
て、符号器側では符号化回路470の量子化特性、量子化
ビット配分を切り換え、復号器側では、パルス復号回路
530の復号特性を切り換えていた。装置構成をより簡略
化するために量子化特性、量子化ビット配分、復号特性
については、切り換えずにあらかじめ定められた特性と
しておいてもよい。
また本実施例においては、パルス計算回路390でパルス
数切り換えの種類をL1またはL2の2種類としたが、切り
換えの種類を3種類以上としてもよい。これに伴なって
Kパラメータの次数、量子化特性、量子化ビット配分の
切り換え種類を3種類以上としてもよい。但しこのよう
にした場合には、Kパラメータ符号化回路200、Kパラ
メータ復号回路520において判定のためしきい値の種類
を増やす必要がある。
本実施例の構成においては、短時間スペクトル構造を表
わすインパルス応答系列の自己相関々数を計算する際
に、インパルス応答計算回路210によってKパラメータ
復号値を用いてインパルス応答を計算した後に、このイ
ンパルス応答を用いて自己相関々数計算回路360にて自
己相関々数を計算していた。ディジタル信号処理の分野
でよく知られているように、インパルス応答の自己相関
々数はパワスペクトルと対応関係にある。従ってまずK
パラメータ復号値を用いてパワスペクトルを求め、その
後にこの対応関係を用いて自己相関々数を計算するよう
な構成としてもよい。一方、音声信号と短時間スペクト
ル包絡を表わすインパルス応答との相互相関々数を計算
する際に、本実施例の構成では重み付け回路410の出力
値ew(n)とKパラメータ復号値K′iを用いてインパ
ルス応答計算回路210にて計算したインパルス応答hw
(n)を用いて相互相関々数hx(・)を計算してい
た。よく知られているように、相互相関々数なクロス・
パワスペクトルと対応関係にある。従ってまずew(n)
とK′iとを用いてクロス・パワスペクトルを求め、そ
の後に相互相関々数を計算するような構成としてもよ
い。尚、パワスペクトルと自己相関々数との対応関係、
クロスパワスペクトルと相互相関々数との対応関係につ
いては、エー・ブイ・オッペンハイム(A.V.OPPENHEI
M)氏らによる「ディジタル信号処理」(“DIGITAL SIG
NAL PROCESSING")と題した単行本(文献3.)の第8章
にて詳細に説明されているので、ここでは説明を省略す
る。
本実施例においては、1フレーム内のパルス系列の符号
化は、パルス系列が全て求まった後に、第4図(a)の
符号化回路470によって符号化を施したが、符号化をパ
ルス系列の計算に含めて、パルスを1つ計算する毎に、
符号化を行ない、次のパルスを計算するという構成にし
てもよい。このような構成をとることによって、符号化
の歪をも含めた誤差を最小とするようなパルス系列が求
まるので、更に品質を向上させることができる。
本実施例によれば、フレーム境界での波形の不連続に起
因したフレーム境界近傍での再生信号の劣化がほとんど
ない。これは、符号器側において、現フレームのパルス
系列を計算する際に、1フレーム過去の駆動パルス系列
によって合成フィルタを駆動して得られた応答信号系列
を、現フレームにまで伸ばして求め、これを入力信号系
列から減算した結果に対して現フレームのパルス系列を
計算するという構成にしたことに起因している。また、
本実施例ではフレーム長を一定とした場合について説明
したが、フレーム長を時間的に変化させる可変長フレー
ムとしてもよい。また、1フレーム内にたてる音源パル
スの個数は一定でなくてもよい。例えばS/Nを一定とす
るように各フレームのパルス系列の個数を変化させるよ
うにしてもよい。
また、本実施例においては、短時間音声信号系列のスペ
クトル包絡を表わすパラメータとしてはKパラメータを
用いたが、これはよく知られている他のパラメータ(例
えばLSPパラメータ等)を用いてもよい。更に前述の
(8)式、(10)式において重み付け関数W(Z)はな
くてもよい。
また、本実施例においては、フレーム境界での再生波形
の不連続に起因する品質劣化を防ぐために、現フレーム
より1フレーム過去の駆動パルス系列に由来した応答信
号系列を計算し、現フレームの入力信号からこの応答信
号を減算した後に、パルス系列を計算したが、第6図に
示すように、パルス系列の計算に用いるデータとして、
パルスを伝送するフレームのデータとそれよりも過去の
データとを含むような構成にしてもよい。第6図でNT
パルスを伝送するフレームを示し、Nはパルスを計算す
るフレームを示す。このよえな構成とすることによっ
て、1フレーム過去の駆動パルスに由来した応答信号系
列を計算する必要がなくなる。
(発明の効果) 以上説明したように本発明によれば、入力信号に対する
予測利得の小さいフレームでは、フレームあたりのパル
ス数を増加させているので、16Kビット/秒程度のビッ
トレイトでは良好な特性を得ることが困難であった音声
信号の子音部の特性を改善することができるだけでな
く、やはり良好な特性を得ることが困難であった2400ビ
ット/秒程度の音声帯域データモデム信号も良好に伝送
できるという効果がある。
【図面の簡単な説明】
第1図は従来方式の構成を示すブロック図、第2図は音
源パルス系列の一例を示す図、第3図は入力音声信号系
列の周波数特性と第1図に記載の重み付け回路の周波数
特性の一例を示す図、第4図(a),(b)は本発明に
よる音声帯域信号符号化復号化装置の一実施例を示すブ
ロック図、第5図(a)〜(e)はパルス探索過程の一
例を示す図、第6図はパルス伝送フレームと音源パルス
計算フレームとの位置関係を説明するための図である。 図において、110,340……バッファメモリ回路、120,285
……減算回路、130,400,550……合成フィルタ回路、14
0,420,540……パルス発生回路、150……誤差最小化回
路、180,280……Kパラメータ計算回路、190,410……重
み付け回路、200……Kパラメータ符号化回路、210……
インパルス応答計算回路、350……相互相関関数計算回
路、360……自己相関関数計算回路、390……パルス計算
回路、470……符号化回路、450……マルチプレクサ、50
0……デマルチプレクサ、520……Kパラメータ復号回
路、530……パルス復号回路、をそれぞれ示す。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】送信側は、離散的な音声帯域信号系列を入
    力し、前記音声帯域信号系列から短時間スペクトル包絡
    を表すスペクトルパラメータ系列を抽出し符号化する手
    段と、前記符号化されたスペクトルパラメータ系列をも
    とに正規化予測誤差を算出し、前記正規化予測誤差をあ
    らかじめ定められたしきい値と比較して判別情報をつく
    るパラメータ計算回路と、前記スペクトルパラメータか
    ら求めたインパルス応答の自己相関と前記音声帯域信号
    系列と前記インパルス応答との相互相関とを求め、求め
    るパルス系列の個数を前記判別情報に従い切り替え、前
    記音声帯域信号系列を良好に表し得るパルス系列を前記
    個数だけ探索し符号化するパルス探索回路と、前記スペ
    クトルパラメータ系列を表す符号と前記パルス系列を表
    す符号とを組み合わせて出力するマルチプレクサ回路と
    を有する符号化器であり、受信側は、前記組み合わされ
    た符号系列を入力しスペクトルパラメータ系列を表す符
    号を分離するデマルチプレクサ回路と、前記スペクトル
    パラメータを復号し、前記復号したスペクトルパラメー
    タをもとに正規化予測誤差を算出し、前記正規化予測誤
    差をあらかじめ定められたしきい値と比較して判別情報
    をつくり、前記判別情報に従って復号すべきパルスの個
    数を切り替え、前記個数に従いパルス系列を表す符号を
    分離し復号する手段と、前記復号されたパルス系列を入
    力して駆動パルス系列を発生させるパルス系列発生回路
    と、前記復号されたスペクトルパラメータ系列と前記駆
    動パルス系列とを用いて音声狭帯域信号系列を再生し出
    力する合成フイルタ回路とを有する復号化器であること
    を特徴とする音声帯域信号符号化・復号化装置。
JP6711484A 1984-03-06 1984-04-04 音声帯域信号符号化・復号化装置 Expired - Lifetime JPH0683149B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP6711484A JPH0683149B2 (ja) 1984-04-04 1984-04-04 音声帯域信号符号化・復号化装置
CA000475777A CA1229681A (en) 1984-03-06 1985-03-05 Method and apparatus for speech-band signal coding
US07/462,981 US4945567A (en) 1984-03-06 1990-01-10 Method and apparatus for speech-band signal coding

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6711484A JPH0683149B2 (ja) 1984-04-04 1984-04-04 音声帯域信号符号化・復号化装置

Publications (2)

Publication Number Publication Date
JPS60212045A JPS60212045A (ja) 1985-10-24
JPH0683149B2 true JPH0683149B2 (ja) 1994-10-19

Family

ID=13335544

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6711484A Expired - Lifetime JPH0683149B2 (ja) 1984-03-06 1984-04-04 音声帯域信号符号化・復号化装置

Country Status (1)

Country Link
JP (1) JPH0683149B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE68923771T2 (de) * 1988-12-23 1995-12-14 Nec Corp Sprachübertragungssystem unter Anwendung von Mehrimpulsanregung.

Also Published As

Publication number Publication date
JPS60212045A (ja) 1985-10-24

Similar Documents

Publication Publication Date Title
EP0409239B1 (en) Speech coding/decoding method
EP0360265B1 (en) Communication system capable of improving a speech quality by classifying speech signals
KR20010093210A (ko) 가변 속도 음성 코딩
KR20010093208A (ko) 주기적 음성 코딩
US5027405A (en) Communication system capable of improving a speech quality by a pair of pulse producing units
JP2586043B2 (ja) マルチパルス符号化装置
JP2615548B2 (ja) 高能率音声符号化方式とその装置
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JPH0683149B2 (ja) 音声帯域信号符号化・復号化装置
JP2560682B2 (ja) 音声信号符号化復号化方法とその装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP2853170B2 (ja) 音声符号化復号化方式
JP2847730B2 (ja) 音声符号化方式
JPH0632032B2 (ja) 音声帯域信号符号化方法とその装置
JP3055901B2 (ja) 音声信号符号化復号化方法及び音声信号符号化装置
JP2946528B2 (ja) 音声符号化復号化方法及びその装置
JPH0481199B2 (ja)
JP2508002B2 (ja) 音声符号化方法とその装置
JP2844590B2 (ja) 音声符号化方式とその装置
JPH077275B2 (ja) 音声信号符号化方式とその装置
JPH01233499A (ja) 音声信号符号化復号化方法及びその装置
JPH0632035B2 (ja) 音声符号化方法とその装置
JPH03116199A (ja) 音声信号符号化装置
JP2853126B2 (ja) マルチパルス符号化装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term