JPH0632031B2 - 音声符号化方法とその装置 - Google Patents

音声符号化方法とその装置

Info

Publication number
JPH0632031B2
JPH0632031B2 JP59042305A JP4230584A JPH0632031B2 JP H0632031 B2 JPH0632031 B2 JP H0632031B2 JP 59042305 A JP59042305 A JP 59042305A JP 4230584 A JP4230584 A JP 4230584A JP H0632031 B2 JPH0632031 B2 JP H0632031B2
Authority
JP
Japan
Prior art keywords
sequence
parameter
pulse sequence
pitch
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59042305A
Other languages
English (en)
Other versions
JPS60186898A (ja
Inventor
一範 小澤
卓 荒関
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP59042305A priority Critical patent/JPH0632031B2/ja
Publication of JPS60186898A publication Critical patent/JPS60186898A/ja
Publication of JPH0632031B2 publication Critical patent/JPH0632031B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声信号の低ビットレイト波形符号化方式、特
に伝送情報量を10kビット/秒以下とするような符号
化方式と装置に関する。
(従来技術とその問題点) 音声信号を10kビット/秒程度以下の伝送情報量で符
号化するための効果的な方法としては、音声信号の駆動
音源信号系列を、それを用いて再生した信号と入力信号
との誤差最小を条件として、短時間毎に探索する方法
が、よく知られている。これらの方法はその探索方法に
よって木符号化(TREE CODING)、ベクトル量子化(VEC
TOR QUANTIZATION)と呼ばれている。また、これらの方
法以外に、駆動音源信号系列を表わす複数個のパルス系
列を、短時間毎に、符号器側で、アナリシス・バイ・シ
ンセシス(ANALYSIS-BY-SYNTHESIS;A−B−S)の手
法を用いて逐次的に求めようとする方式が最近、提案さ
れている。本発明は、この方式に関係するものである。
この方式の詳細については、ピー・エス・アタール
((B・S・ATAL)氏らによるアイ・シー・エー・エス
・エス・ビー(I・C・A・S・S・P)の予稿集、1
982年614〜617頁に掲載の「ア・ニュー・モデ
ル・オブ・エル・ピー・シー・エクサイティション・フ
ォー・プロデューシング・ナチュラル・サウンディング
・スピーチ・アット・ロウ・ビット・レイツ」(“A NE
W MODEL OF LPC EXCITATION FOR PRODUCING NATURAL-SO
UNDING SPEECH AT LOW BIT RATES”)と題した論文(文
献1)に説明されているので、ここでは簡単に説明を行
なうにとどめる。
第1図は、前記文献1、に記載された従来方式における
符号器側の処理を示すブロツク図である。図において、
100は符号器入力端子を示し、A/D変換された音声
信号系列x(n)が入力される。110はバッファメモリ回
路であり、音声信号系列を1フレーム(例えば8KHzサ
ンプリングの場合でフレーム長を10msecとすると8
0サンプル)分、蓄積する。110の出力値は減算器1
20と、Kパラメータ計算回路180とに出力される。
但し、文献1、によればKパラメータのかわりにレフレ
クション・コエフィシエンツ(REFLECTION COEFFICIENT
S)と記載されているが、これはKパラメータと同一の
パラメータである。また、Kパラメータはパーコール
(PARCOR)係数とも呼ばれる。Kパラメータ計算回路1
80は、110の出力値を用い、共分散法に従って、フ
レーム毎の音声信号スペクトルを表わすKパラメータKi
を16次分(1≦i≦16)求め、これらの合成フィル
タ130へ出力する。140は、音源パルス発生回路で
あり、1フレームにあらかじめ定められた個数のパルス
系列を発生させる。ここでは、このパルス系列をd(n)
と記する。音源パルス発生回路140によって発生され
た音源パルス系列の一例を第2図に示す。第2図で横軸
は離散的な時刻を、縦軸は振幅をそれぞれ示す。ここで
は、1フレーム内に8個のパルスを発生させる場合につ
いて示してある。音源パルス発生回路140によって発
生されたパルス系列d(n)は、合成フィルタ130を駆
動する。合成フィルタ130は、d(n)を入力し、音声
信号x(n)に対応する再生信号 を求め、これを減算器120へ出力する。ここで、合成
フィルタ130は、KパラメータKiを入力し、これらを
予測パラメータai(I≦i≦16)へ変換し、aiを用い
て再生信号x(n)を計算する。
は、d(n)とaiを用い下式のように表わすことができ
る。
上式でPは合成フィルタの次数を示し、ここではP=1
6としている。減算器120は、原信号 と再生信号x(n)との差e(n)を計算し、重み付け回路1
90へ出力する。190は、e(n)を入力し、重み付け
関数w(n)を用い、次式に従って重み付け誤差ew(n)を
計算する。
w(n)=w(n)e(n) (2) 上式で、記号“*”はたたみこみ積分を表わす。また重
み付へ関数w(n)は、周波数軸上で重み付けを行なうも
のであり、そのZ変換をW(z)とすると、合成フィルタ
の予測パルスaiを用いて、次式により表わされる。
上式でrは0≦r≦1の定数であり、W(Z)の周波数特
性を決定する。つまり、r=1とすると、W(Z)=1と
なり、その周波数特性は平坦となる。一方、r=0とす
ると、W(Z)は合成フィルタの周波数特性の逆特とな
る。従って、rの値によってW(Z)に特性を変えること
ができる。また、(3)式で示したようにW(Z)を合成フィ
ルタの周波数特性に依存させて決めているのは、聴感的
なマスク効果を利用しているためである。つまり、入力
音声信号のスペクトルのパワが大きな箇所では(例えば
フォルマントの近傍、再生信号のスペクトルとの誤差が
少々大きくても、その誤差な耳につきにくいという聴感
的な性質による。第3図に、あるフレームにおける入力
音声信号のスペクトルと、W(Z)の周波数特性の一例と
を示した。ここではr=0.8とした。図において、横
軸は周波数(最大4KHz)を、縦軸は対数振幅(最大6
0dB)をそれぞれ示す。また、上部の曲線は音声信号
のスペクトルを、下部の曲線は重み付け関数の周波数特
性を表わしている。
第1図へ戻って、重み付け誤差ew(n)は、誤差最小化回
路150へフィードバックされる。誤差最小化回路15
0は、ew(n)の値を1フレーム分記憶し、これらを用い
て次式に従い、重み付けられた2乗誤差εを計算する。
ここで、Nは2乗誤差を計算するサンプル数を示す。文
献1、の方式では、この時間長を5msecとしており、
これは8KHzサンプリングの場合にはN=40に相当す
る。次に、誤差最小化回路150は、前記(4)式で計算
した2乗誤差εを小さくするように音源パルス発生回路
140に対し、パルス位置及び振幅情報を与える。14
0は、この情報に基づいて音源パルス系列を発生させ
る。合成フィルタ130は、この音源パルス系列を駆動
源として再生信号 を計算する。次に減算器120では、側に計算した原信
号と再生信号との誤差e(n)から現在求まった再生信号 を減算して、これを新たな誤差e(n)とする。重み付け
回路190はe(n)を入力し重み付け誤差ew(n)を計算
し、これを誤差最小化回路150へフィードバックす
る。誤差最小化回路150は、再び2乗誤差を計算し、
これを小さくするように音源パルス系列の振幅と位置を
調整する。こうして音源パルス系列の発生から誤差最小
化による音源パルス系列の調整までの一連の処理は、音
源パルス系列のパルス数をあらかじめ定められた数に達
するまでくり返され、音源パルス系列が決定される。
以上で従来方式の説明を終了する。
この方式の場合に、伝送すべき情報は、合成フィルタの
KパラメータKi(1≦i≦16)と、音源パルス系列
のパルス位置及び振幅であり、1フレーム内にたてるパ
ルスの数によって任意の伝送レイトを実現できる。さら
に、伝送レイトを16Kbps〜10K6psとする領域に対し
ては、良好な再生音質が得られ有効な方式の一つと考え
られる。
しかしながら、この従来方式は、演算量が非常に多いと
いう欠点がある。これは音源パルス系列におけるパルス
の位置と振幅を計算する際に、そのパルスに基づいて再
生した信号と原信号との誤差及び2乗誤差を計算し、そ
れらをフィードバックさせて、2乗誤差を小さくするよ
うにパルス位置と振幅を調整していることに起因してい
る。更には、パルスの数があらかじめ定められた値に達
するまでこの処理をくり返すことに起因している。
更に、この従来方式によれば、10Kbps程度以下にビッ
トレイトでは、ピッチ周波数の高い入力信号の場合、例
えば女性の声を入力した場合には、再生品質が劣化する
という欠点があった。これはピッチ周波数が高い場合に
は、パルス計算のためのフレーム内に多くのピッチ波形
が含まれることになり、このピッチ波形を良好に再生す
るためには、ピッチ周波数が低い話者の場合と比べて、
より多くの個数の音源パルスを必要とするためである。
従ってこの理由から、品質の劣化なしに、伝送ビットレ
イトを大幅に下げる、すなわち1フレーム内のパルス数
を大幅に減少させることが困難であった。
(発明の目的) 本発明の目的は、比較的少ない演算量で、10Kbps以下
のビットレイトでも高品質な音声を再生し得る音声符号
化方式とその装置を提供することにある。
(発明の構成) 本発明によれば、送信側では、離散的音声信号系列をピ
ッチの微細構造を表すピッチパラメータと短時間スペク
トル包絡を表すスペクトルパラメータを抽出して符号化
し、前記スペクトルパラメータをもとに前記短時間スペ
クトル包絡に応じたインパルス応答系列の自己相関関数
を計算し、前記音声信号系列と前記インパルス応答系列
とに応じた相互相関関数を計算し、前記ピッチパラメー
タと前記自己相関関数と前記相互相関関数とからピッチ
周期を利用したパルス系列を求め、前記自己相関関数と
前記相互相関関数とからピッチ周期を利用しないパルス
系列を求め、前記ピッチ周期を利用したパルス系列によ
る誤差電力と前記ピッチ周期を利用しないパルス系列に
よる誤差電力とを比較して誤差電力のより小さい方のパ
ルス系列を第1のパルス系列として選択して符号化し、
前記第1のパルス系列を表す符号と前記ピッチパラメー
タ及び前記スペクトルパラメータを表す符号とを組み合
わせて出力し、 受信側では、前記組み合わされた符号を前記第1のパル
ス系列を表す符号と前記ピッチパラメータを表す符号と
前記スペクトルパラメータを表す符号と分離して復号
し、前記復号された第1のパルス系列をもとに前記復号
されたピッチパラメータを用いて第2のパルス系列を求
め、前記第2のパルス系列と前記復号されたスペクトル
パラメータとを用いて前記音声信号系列を再生すること
を特徴とする音声符号化方法が得られる。
また本発明によれば、離散的音声信号系列を入力し前記
音声信号系列からピッチの微細構造を表すピッチパラメ
ータと短時間スペクトル包絡を表すスペクトルパラメー
タとを抽出し符号化するパラメータ計算回路と、前記パ
ラメータ計算回路の出力系列を入力し前記音声信号系列
の短時間スペクトルに応じたインパルス応答系列の自己
相関関数を計算する自己相関関数計算回路と、前記音声
信号系列と前記パラメータ計算回路の出力系列とを入力
し前記音声系列と前記短時間スペクトルに応じたインパ
ルス応答系列とに応じた相互相関関数を計算する相互相
関関数計算回路と、前記自己相関関数計算回路の出力系
列と前記相互相関関数計算回路の出力系列と前記パラメ
ータ計算回路の出力系列とが入力され、該ピッチパラメ
ータと前記自己相関関数と前記相互相関関数とからピッ
チ周期を利用したパルス系列を求めて符号化し、前記自
己相関関数と前記相互相関関数とからピッチ周期を利用
しないパルス系列を求めて符号化し、前記ピッチ周期を
利用したパルス系列による誤差電力と前記ピッチ周期を
利用しないパルス系列による誤差電力とを比較して誤差
電力のより小さい方のパルス系列を第1のパルス系列と
して選択して符号化する第1のパルス系列計算回路と、
前記パラメータ計算回路の出力符号と前記第1のパルス
系列計算回路の出力系列とを組み合わせて出力するマル
チプレクサ回路とを有することを特徴とする音声符号化
装置が得られる。
さらに本発明によれば、離散的音声信号系列をピッチの
微細構造を表すピッチパラメータと短時間スペクトル包
絡を表すスペクトルパラメータを抽出して符号化し、前
記スペクトルパラメータをもとに前記短時間スペクトル
包絡に応じたインパルス応答系列の自己相関関数を計算
し、前記音声信号系列と前記インパルス応答系列とに応
じた相互相関関数を計算し、前記ピッチパラメータと前
記自己相関関数と前記相互相関関数とからピッチ周期を
利用したパルス列を求め、前記自己相関関数と前記相互
相関関数とからピッチ周期を利用しないパルス系列を求
め、前記ピッチ周期を利用したパルス系列による誤差電
力と前記ピッチ周期を利用しないパルス系列による誤差
電力とを比較して誤差電力のより小さい方のパルス系列
を第1のパルス系列として選択して符号化し、前記第1
のパルス系列を表す符号と前記ピッチパラメータ及び前
記スペクトルパラメータを表す符号とが組み合わされた
信号を送信側から受け取り、 前記第1のパルス系列を表す符号と前記音声信号系列の
ピッチの微細構造を表すピッチパラメータを表す符号と
前記音声信号系列の短時間スペクトル包絡を表すスペク
トルパラメータを表す符号とが組み合わされた符号系列
を入力し前記第1のパルス系列を表す符号と前記ピッチ
パラメータを表す符号と前記スペクトルパラメータを表
す符号とを分離するデマルチプレクサ回路と、分離して
得られた前記第1のパルス系列を表す符号を入力して復
号する第1のパルス系列復号回路と、分離して得られた
前記ピッチパラメータを表す符号を入力して復号するピ
ッチパラメータパ復号回路と、分離して得られた前記ス
ペクトルパラメータを表す符号を入力して復号するスペ
クトルパラメータ復号回路と、前記第1のパルス系列復
号回路の出力系列と前記ピッチパラメータ復号回路の出
力系列とを入力し前記復号された第1のパルス系列をも
とに前記復号されたピッチパラメータを用いて第2のパ
ルス系列を求める第2のパルス系列発生回路と、前記第
2のパルス系列発生回路の出力系列と前記スペクトルパ
ラメータ復号回路の出力系列とを入力し音声信号系列を
再生し出力する合成フィルタ回路を有することを特徴と
する音声復号化装置が得られる。
(実施例) 一般に音源系列は、有声部において非常に周期性が強
い。本発明においては、この周期性を利用して音源パル
スを探索することにより、少ない音源パルスで良好な音
質を提供している。
以下に本発明による音声符号化方式の構成を図面を用い
て詳細に説明する。第4図(a)は、本発明による音声符
号化方式の符号器側の一実施例を示すブロツク図であ
り、第4図(b)は復号器側の一実施例を示すブロツク図
である。第4図(a)において、音声信号系列x(n)は、入
力端子195から入力され、あらかじめ定められたサン
プル数だけ区切られてバッファメモリ回路340に蓄積
される。次にKパラメータ計算回路280は、バッファ
メモリ回路340に蓄積されている音声信号のうち、あ
らかじめ定められたサンプル数を入力し、これを用いて
スペクトル包絡を表すスペクトルパラメータとしてあら
かじめ定められた次数P個のLPCパラメータを、衆知
の方法(例えば線形予測分析法)に従い計算する。LP
Cパラメータとしては、種々のものが考えられるが、以
下ではKパラメータKi(1≦i≦P)を用いるものと
して説明を進める。Kパラメータはパーコール係数と同
一のパラメータである。KパラメータKiはKパラメー
タ符号化回路200に出力される。Kパラメータ符号化
回路200は、あらかじめ定められた量子化ビット数に
基づいてKiを符号化し、符号1kiをマルチプレクサ4
50へ出力する。また、Kパラメータ符号化回路200
は、1kiを復号化して得たKパラメータ復号値k′i
用いて衆知の方法に従って予測係数値a′i(1≦i≦
p)に変換し、インパルス応答計算回路210と重み付
け回路410と合成フィルタ回路400へ出力する。
次にピッチ分析回路370は、バッファメモリ回路34
0の出力である1フレーム分の音声信号を用いてピッチ
の微細構造を表すピッチパラメータとしてピッチ周期pd
を計算する。Pdのの計算法としては、例えばアール・ブ
イ・コックス(R.V.COX)氏によるアイ・イー・
イー・イー トランザクションズ オン エー・エス・
エス・ピー(IEEE TRANSACTIONS ON A・S・S・P)誌198
3年2月号、258〜272頁に掲載の「リアルタイム
・インプリメンテイション・オブ・タイム・ドメイン・
ハーモニック・スケーリング・オブ・スピーチ・フォー
・レイト・モディフィケーション・アンド・コーディン
グ」(“REAL-TIME IMPLEMENTATION OF TIME DOMAIN HA
RMONIC SCALING OF SPEECH FOR RATE MODIFICATION AND
CODING")と題した論文(文献2)等に説明されている
音声信号の自己相関々数を用いて計算する方法が知られ
ている。また、他の衆知な方法を用いて計算することも
できるし、音声信号を予測した後の予測残差信号から計
算することもできる。ピッチ符号化回路380はピッチ
周期Pdを入力し、あらかじめ定められた量子化ビット
数で量子化符号化し、符号ldをゲート回路460へ出
力する。また、ピッチ符号化回路380はldを復号化
して得たP′dをパルス計算回路390とパルス発生回
路420へ出力する。
次にインパルス応答計算回路210は、スペクトルパラ
メータである予測係数値a′i(1≦i≦P)をし、次
式で示される重み付けされた合成フィルタの伝達関数を
表わすインパルス応答hw(n)を、あらかじめ定められた
サンプル数だけ計算する。
(Z)=W(Z)/(1−Σa′i-i) (5) ここでHw(Z)は重み付けされた合成フィルタのZ変換上
での伝達関数を示す。また、W(Z)は前述の(3)式で示し
た重み付け関数のZ変換表現である。インパルス応答計
算回路210はインパルス応答hw(n)を自己相関々数計
算回路360と相互相関々数計算回路350へと出力す
る。
次に自己相関々数計算回路360は、インパルス応答計
算回路210からインパルス応答hw(n)を入力し、次式
に従って自己相関々数Rhh(・)をあらかじめ定められた
遅れ時間τだけ計算する。
自己相関々数Rhh(τ)はパルス計算回路390へ出力さ
れる。
次に減算器285は、バッファメモリ回路340に蓄積
された音声信号x(n)を入力し、x(n)から合成フィルタ
回路400の出力系列を1フレームサンプル分減算し、
減算結果e(n)を重み付け回路410へ出力する。
次に重み付け回路410は、減算器285から減算結果
e(n)を入力し、またKパラメータ計算回路200から
予測係数値a′iを入力し、e(n)に対して重み付けを施
しew(n)を出力する。ここでew(n)はZ変換表現で次式
のように書ける。
w(Z)=E(Z)・W(Z) (7) ここでEw(Z),E(Z)はそれぞれew(n)のZ変換値、e
(n)のZ変換値を示す。またW(Z)は前記(3)式で示され
る重み付け関数のZ変換値を示す。重み付け回路410
は、ew(n)を相互相関々数計算回路350へ出力する。
次に相互相関々数計算回路350は重み付け回路410
からew(n)を入力し、またインパルス応答計算回路21
0からインパルス応答hw(n)を入力し、次式に従って相
互相関々数ψhx(n)をあらかじめ定められたサンプル数
だけ計算する。
相互相関々数ψhx(・)はパルス計算回路390へ出力さ
れる。
次にパルス計算回路390は相互相関々数ψhx(・)と自
己相関々数ψhh(・)とを用いピッチ周期P′dを加味して
駆動音源パルス系列のもととなる第1のパルス系列を計
算する。具体的にはピッチ周期P′dを利用したパルス
系列の計算と、P′dを利用しないパルス系列の計算と
を行なう。
まずP′dを用いない場合のパルス系列計算アルゴリズ
ムを示す。入力音声信号と合成音声信号との重み付け誤
差電力を最小化するパルス系列は次式に従って1パルス
ずつ順次計算される。
ここでgiはフレーム内のi番目のパルスの振幅を示
す。またkはフレーム内にたてる全パルス数を、mi
i番目のパルスのフレーム内の位置を示す。(9)式にお
いてパルスの位置miはgiの絶対値最大値をとるフレー
ム内位置から求まる。
次にP′dを利用した場合のパルス系列の計算法につい
て説明する。音声信号の有声部は周期性が非常に強く駆
動音源パルス系列は周期的に並んでいる。従って音源パ
ルスを1つ計算するごとにピッチ周期を利用して、ピッ
チ周期だけ離れた位置にパルスを外挿すれば、当価的に
音源パルス数を増加させることが可能で特性を大幅に改
善することができる。第5図はピッチ周期P′dを利用
した場合のパルス系列を求める過程の一例を示す図であ
る。
パルス系列の計算は前記(9)式に従う。第5図(a)は相互
相関々数計算回路350から計算された1フレーム分の
相互相関々数を示す。ここでフレーム長は160サンプ
ルとしている。第5図(b)は(9)式に従って求めた第1番
目のパルスを示す図である。この第1番目のパルスに対
し、ピッチ周期P′dを利用してパルスを外そうしたの
が第5図(c)である。第5図(d)は第5図(c)で求まった
3つのパルス(g1,g11,g12)の影響を第5図(a)の
相互相関々数からさし引いた図である。第5図(e)はパ
ルスg2を求めた図である。第5図(f)はパルスg2に対
してピッチ周期P′dを利用してパルスを外そうした図
である。以上のようにして求まったパルス系列に対し
て、復号器側に伝送すべきパルスは、この例では、g1
とg2の2つのみでよい。これは復号器側では、伝送さ
れたg12とピッチ周期P′dを用いてパルスを外そう
することによって、g11,g12,及びg21,g22を発生
させることができるからである。従って少ないパルス数
ででも非常に良好な特性を得ることができる。以上でパ
ルス系列の計算法の説明を終える。
第4図(a)に戻って、パルス計算回路390は、ピッチ
周期を利用して求めたパルスとピッチ周期を利用しない
で求めたパルス系列とに対して、ピッチ周期を用いた場
合と用いない場合についての、入力信号と再生信号との
誤差電力を次式に従って計算する。
ここでgiはピッチ周期を用いない場合は(9)式のパルス
振幅、ピッチ周期を用いる場合は外そうしたパルスを含
むすべてのパルス振幅、ψhx(・)は相互相関々数を示
す。またRee(o)は重み付け回路410の出力値ew(n)
のNサンプル分の電力を示す。ピッチ周期を利用しない
場合の誤差電力をJN,ピッチ周期を利用した場合の誤
差電力をJPとする。JNとJPとは比較回路430へ出
力される。また、ピッチ周期を利用して求めたパルス系
列とピッチ周期を利用しないで求めたパルス系列とは切
り換え回路440へ出力される。
次に比較回路430は誤差電力JNとJPとを比較する。
PがJNよりも小さければ、ピッチ周期を利用した方が
特性が良好であると判断し、この情報を切り換え回路4
40、比較回路430、ゲート回路460へ出力する。
またJPがJNよりも大きい場合には、ピッチ周期を利用
しないという情報を切り換え回路440、比較回路43
0、ゲート回路460へ出力する。
次に切り換え回路440は、比較回路430からの比較
情報を入力し、この情報に従って2種のパルス系列のう
ち、一方を符号化回路470へ出力する。
次にゲート回路460は、比較回路430からの比較情
報をし、ピッチ周期を利用した方がよい場合には、符号
dをそのままマルチプレクサ450へ出力する。ま
た、ピッチ周期を利用しない方がよい場合にはピッチ周
期0を表わす符号dをマルチプレクサ450へ出力す
る。
次に符号化回路470は切り換え回路440からパルス
系列を入力し、各パルスの振幅,位置をあらかじめ定め
られたビット数で符号化する。また、各パルスの振幅,
位置の復号値g′i,m′をパルス発生回路420へ
出力する。ここでパルス系列の符号化の方法は種々考え
られる。一つは、パルス列の振幅,位置を別々に符号化
する方法であり、また一つは振幅,位置を一緒に符号化
する方法である。前者の方法について一例を説明する。
まず、パルス系列の振幅の符号化法としては、フレーム
内のパルス系列の振幅の最大値を正規化系数として、こ
の値を用いて各パルスの振幅を正規化した後に、量子
化,符号化する方法が考えられる。また、他の方法とし
ては、振幅の確率分布を正規型と仮定して、正規型の場
合の最適量子化器を用いる方法が考えられる。これにつ
いては、ジェー・マックス(J・MAX)氏によるアイ・
アール・イー・トランザクションズ・オン・インフォメ
ーション・セオリー(IRE TRANSACTIONS ON INFOMATION
THEORY)の1960年3月号、7〜12頁に掲載の
「クオンタイジング・フォー・ミニマム・ディストーシ
ョン」(“QUANTIZING FOR MINIMUMDISTORTION”)と題
した論文(文献3)等に詳述されているので、ここでは
説明を省略する。更に、各パルスの振幅を直交関係にあ
る他のパラメータに変換した後に量子化,符号化を施し
てもよい。また、パルス振幅毎にビット割り当てを変え
てもよい。次に、パルス位置の符号化についても種々の
方法が考えられる。例えば、ファクシミリ信号符号化の
分野でよく知られているランレングス符号等を用いても
よい。これは符号“0”または“1”の続く長さをあら
かじめ定められた符号系列を用いて表わすものである。
また、正規化係数の符号化には、従来よく知られている
対数圧縮符号化等を用いることができる。
尚、パルス系列の符号化に関しては、ここで説明した符
号化方法に限らず、衆知の最良の方法を用いることがで
きることは勿論である。
第4図(a)に戻って、パルス発生回路420は、パルス
系列復号値g′i,m′i,を用いてm′iの位置に振幅
g′iをもつパルス列を発生させる。この際に、比較回
路430から入力した情報に基づきピッチ周期を利用す
る場合は、ピッチ符号化回路380から入力したピッチ
周期復号値P′dを用いて符号化回路470から入力し
たパルス系列復号値に対してピッチ周期P′dだけ離れ
た位置にパルスを外そうする。このようにして求まった
駆動音源パルス系列は合成フィルタ回路400へ出力さ
れる。合成フィルタ回路400は、パルス発生回路42
0から駆動音源パルス系列を入力する。また、Kパラメ
ータ符号化回路200から予測係数値a′iを入力し合
成フィルタが構成される。合成フィルタ回路400は、
入力した駆動音源パルスを用いてフィルタ動作の後、1
フレーム分の応答信号を計算し、減算器285へ出力す
る。応答信号 の計算は次式に従う。
ここで の値は2フレーム分(1≦n≦2N)計算される。d
(n)は駆動音源信号を表わし、1≦n≦Nではパルス発
生回路420から出力された駆動音源パルスを用いる。
またN+1≦n≦2Nでは全て0の系列を用いる。(11)
式求めた のうち、第2フレームの目の (N+1≦n≦2N)の値が減算器285へ出力され
る。
次にマルチプレクサ450は、符号化回路470の出力
符号とKパラメータ符号化回路200の出力符号とゲー
ト回路460の出力符号とを入力し、これらを組み合わ
せて送信側出力端子480から通信路へ出力する。以上
で本発明による音声符号化方式の符号器側の説明を終え
る。
次に本発明による音声符号化方式の復号器側について第
4図(b)を参照して説明する。デマルチプレクサ500
は、復号器側端子490から符号を入力する。デマルチ
プレクサ500は、入力符号のうち、Kパラメータを表
わす符号系列とピッチ情報を表わす符号系列と、第1の
パルス系列を表わす符号系列とを分離し、Kパラメータ
を表わす符号系列をKパルス復号回路520へ出力し、
第1のパルス系列を表わす符号系列を、パルス系列復号
回路530へ出力する。Kパラメータ復号回路520及
びピッチ復号回路510は、入力した符号系列を復号
し、合成フィルタ回路550へ出力する。
パルス系列復号回路530は、第1のパルス系列を表わ
す符号系列を入力し、復号化してパルス系列の振幅,位
置情報としてパルス発生回路540へ出力する。パルス
発生回路540は、第1のパルス系列の振幅,位置情報
を入力し、第2のパルス系列に対応した駆動音源パルス
系列を発生させる。この際にピッチ復号回路510から
ピッチ周期復号値P′dを入力し、この値が0でなかっ
たら、入力したパルス系列に対してP′dだけ離れた位
置にパルスを外そうする。このようにして求めた駆動音
源パルス系列を合成フィルタ回路550へ出力する。合
成フィルタ回路550は、Kパラメータ復号回路520
からKパラメータ復号値K′iを入力し、パルス発生回
路540の出力パルス列を駆動源として合成信号 を求め、受信側出力端子560から出力する。以上で本
発明による復号器側の説明を終える。
本実施例の構成によれば、符号器側においてピッチ周期
を利用してパルス系列を求めた場合とピッチ周期を利用
しないでパルス系列を求めた場合とで誤差電力を計算し
誤差電力のより小さい方のパルス、つまり入力音声をよ
り忠実に再現できるパルス系列を伝送し、これを復号器
側での再生に用いる構成としているので、入力音声信号
の過渡部やピッチパラメータの抽出誤りに起因する劣化
を防止することができるという効果がある。尚、ピッチ
周期を利用するか利用しないかを判断するためのより簡
便な方法として、ピッチゲインを用いることもできる。
ここでピッチゲインはピッチ周期だだけの遅れをもつ相
関係数の値から求まる。このようにして求めたピッチゲ
インをあらかじめ定められたしきい値と比較して、ピッ
チゲインがしきい値以下であれば音源パルスを計算する
際にピッチ周期を利用しないようにする。また復号器側
に伝送するピッチ周期は0としておく。このような構成
にすることによって、(10)式の誤差電力の計算と比較回
路430は不要となり、演算量を低減することができ
る。
また(10)式に示したパルス計算法においては、パルスを
1つづつ順番に計算していた。この方法においては次の
パルスを計算する際にこれより過去に求まった復数個の
パルスの振幅を再調整するようにしてもよい。このよう
にすることによってフレームあたりのパルス数が多くパ
ルスが互いに独立できない場合に特性が向上する。また
音源パルスを求める方法としては、より最適なパルス系
列を計算する方法のような他の良好なパルス系列計算法
を求めることができる。
また本実施例の構成においては、ピッチ周期を利用した
方が特性が良好であると判別された場合には、求まった
全てのパルス系列に対して外そう処理を施していた。こ
の外そう処理は必ずしも全てのパルス系列に対して施す
必要はなく、パルス外そう効果の大きい特定のパルスを
選択してこの選択されたパルスに対してのみ外そう処理
を施すようにしてもよい。特定のパルスの選択法として
は種々考えられる。例えば振幅の大きなパルスはより周
期性が強いと考えられるので、フレーム内で求まったパ
ルスのうち、振幅の大きなパルスからM個のパルスに対
してのみ外そう処理を施すようにしてもよい。ここでM
の値はあらかじめ定められた値でもよいし、フレーム毎
に変化させてもよい。また各パルス毎に外そう処理を施
すか否かを判別するための情報(1ビット)を付加する
ようにしてもよい。このような構成とすることによっ
て、伝送情報量は若干増加するが、特性はより改善され
るという効果がある。
本実施例の構成においては、短時間スペクトル構造を表
わすインパルス応答系列の自己相関々数を計算する際
に、インパルス応答計算回路210によってKパラメー
タ復号値を用いてインパルス応答を計算した後に、この
インパルス応答を用いて自己相関々数計算回路360に
て自己相関々数を計算していた。ディジタル信号処理の
分野でよく知られているように、インパルス応答の自己
相関々数はパワスペクトルと対応関係にある。従ってま
ずKパラメータ復号値を用いてパワスペクトルを求め、
その後にこの対応関係を用いて自己相関々数を計算する
ような構成としてもよい。一方、音声信号と短時間スペ
クトル包絡を表わすインパルス応答との相互相関々数を
計算する際に、本実施例の構成では重み付け回路410
の出力値ew(n)とKパラメータ復号値K′iを用いてイ
ンパルス応答計算回路210にて計算したインパルス応
答hw(n)を用いて相互相関々数ψhx(・)を計算してい
た。よく知られているように、相互相関々数はクロス・
パワスペクトルと対応関係にある。従ってまずew(n)と
K′iとを用いてクロス・パワスペクトルを求め、その
後に相互相関々数を計算するような構成としてもよい。
尚、パワスペクトルと自己相関々数との対応関係、及び
クロス・パワスペクトルと相互相関々数との対応関係に
ついては、エー・ブイ・オッペンハイム(A・V・OPPE
NHETM)氏らによる「ディジタル信号処理」(“DIGITAL
SIGNAL PROCESSING”)と題した単行本(文献4)の第
8章にて詳細に説明されているので、ここでは説明を省
略する。
更に本発明によれば、フレーム境界での波形の不連続に
起因したフレーム境界近傍での再生信号の劣化がほとん
どないという大きな効果がある。この効果は、符号器側
において、現フレームのパルス系列を計算する際に、1
フレーム過去の駆動音源パルス系列によって合成フィル
タを駆動して得られた応答信号系列を、現フレームにま
で伸ばして求め、これを入力音声信号系列から減算した
結果に対して現フレームのパルス系列を計算するという
構成にしたことに起因している。また、本実施例ではフ
レーム長を一定とした場合について説明したが、フレー
ム長を時間的に変化させる可変長フレームとしてもよ
い。また、1フレーム内にたてる音源パルスの個数は一
定でなくてもよい。例えばS/Nを一定とするように各
フレームのパルス系列の個数を変化させるようにしても
よい。
また本実施例においては、ピッチ周期を利用して求めた
パルス系列とピッチ周期を利用しないで求めたパルス系
列のうち、入力信号をより忠実に再現し得るパルス系列
を選択する基準として、(10)式で示した誤差電力を用い
た。これは他の最良な方法を用いることができる。例え
ばピッチゲインからピッチを用いた場合の予測ゲインを
計算し、この値をあらかじめ定められたしきい値と比較
するような構成にしてもよい。
また、前述の本発明の実施例においては、1フレーム内
のパルス系列の符号化は、パルス系列が全て求まった後
に、第4図(a)の符号化回路470によって符号化を施
したが、符号化をパルス系列の計算に含めて、パルスを
1つ計算する毎に、符号化を行ない、次のパルスを計算
するという構成にしてもよい。このような構成をとるこ
とによって、符号化の歪をも含めた誤差を最小とするよ
うなパルスが求まるので、更に品質を向上させることが
できる。
また、以上説明した実施例においては、短時間音声信号
系列のスペクトル包絡を表わすパラメータとしてはKパ
ラメータを用いたが、これはよく知られている他のパラ
メータ(例えばLSPパラメータ等)を用いてもよい。
更に前述の(5)式,(7)式において重み付け関数W(Z)は
なくてももよい。
また、本実施例においては、フレーム境界での再生波形
の不連続に起因する品質劣化を防ぐために、現フレーム
より1フレーム過去の駆動音源パルスに由来した応答信
号系列を計算し、現フレームの入力音声からこの応答信
号を減算した後に、パルス系列を計算したが、第6図に
示すように、パルス系列の計算に用いるデータとして、
パルスを伝送するフレームのデータ及びそれよりも過去
のデータを含むような構成にしてもよい。第6図で、N
Tはパルスを伝送するフレームを示し、Nは音源パルス
を計算するフレームを示す。このような構成とすること
によって、1フレーム過去の駆動音源パルスに由来した
応答信号系列を計算する必要がなくなるという効果があ
る。
(発明の効果) 以上詳細に説明した通り、本発明によれば、パルス系列
の計算において、ピッチ周期を利用してパルスを外そう
しパルス数を増加させているので、伝送ピットレイトが
低い(音源パルス数が少ない)場合でも良好な再生音声
を得ることができるという効果がある。特に従来方式に
おいて再声品質の劣化していたピッチ周波数の高い女性
音声に対しても10Kbps以下の伝送情報量で良好な再
生音声を得ることができる。また音源パルスを(9)式に
従い求めているので、文献1.の従来方式のように、音
源パルスで合成フィルタを駆動して再生信号を求め、原
信号との2乗誤差をフィードバックしてパルスを調整す
るという径路がなく、またその処理をくり返す必要もな
いので、演算量を大幅に低減できるという効果がある。
またピッチ周期を利用したパルスの外そう法はわずかな
演算量の追加で実現できるという効果がある。
【図面の簡単な説明】
第1図は従来方式の構成を示すブロツク図、第2図は音
源パルス系列の一例を示す図、第3図は入力音声信号系
列の周波数特性と第1図に記載の重み付け回路の周波数
特性の一例を示す図、第4図(a),(b)は本発明の一実施
例を示すブロツク図、第5図(a)〜(f)はピッチを利用し
てパルスを外そうした場合の音源パルスの探索過程の一
例を示す図、第6図はパルス伝送フレームと音源パルス
計算フレームとの位置関係を説明するための図である。 図において、110,340……バッファメモリ回路、
120,285……減算回路、130,400,550
……合成フィルタ回路、140,420,540……パ
ルス発生回路、150……誤差最小化回路、180,2
80……Kパラメータ計算回路、190,410……重
み付け回路、200……Kパラメータ符号化回路、21
0……インパルス応答計算回路、350……相互相関計
算回路、360……自己相関計算回路、370……ピッ
チ分析回路、380……ピッチ符号化回路、390……
パルス計算回路、430……比較回路、440……切り
換え回路、470……符号化回路、450……マルチプ
レクサ、460……ゲート回路、500……デマルチプ
レクサ、510……ピッチ復号回路、520……Kパラ
メータ復号回路、530……音源パルス復号回路をそれ
ぞれ示す。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】送信側では、離散的音声信号系列をピッチ
    の微細構造を表すピッチパラメータと短時間スペクトル
    包絡を表すスペクトルパラメータを抽出して符号化し、
    前記スペクトルパラメータをもとに前記短時間スペクト
    ル包絡に応じたインパルス応答系列の自己相関関数を計
    算し、前記音声信号系列と前記インパルス応答系列とに
    応じた相互相関関数を計算し、前記ピッチパラメータと
    前記自己相関関数と前記相互相関関数とからピッチ周期
    を利用したパルス系列を求め、前記自己相関関数と前記
    相互相関関数とからピッチ周期を利用しないパルス系列
    を求め、前記ピッチ周期を利用したパルス系列による誤
    差電力と前記ピッチ周期を利用しないパルス系列による
    誤電力差とを比較して誤差電力のより小さい方のパルス
    系列を第1のパルス系列として選択して符号化し、前記
    第1のパルス系列を表す符号と前記ピッチパラメータ及
    び前記スペクトルパラメータを表す符号とを組み合わせ
    て出力し、 受信側では、前記組み合わされた符号を前記第1のパル
    ス系列を表す符号と前記ピッチパラメータを表す符号と
    前記スペクトルパラメータを表す符号とを分離して復号
    し、前記復号された第1のパルス系列をもとに前記復号
    されたピッチパラメータを用いて第2のパルス系列を求
    め、前記第2のパルス系列と前記復号されたスペクトル
    パラメータとを用いて前記音声信号系列を再生すること
    を特徴とする音声符号化方法。
  2. 【請求項2】離散的音声信号系列を入力し前記音声信号
    系列からピッチの微細構造を表すピッチパラメータと短
    時間スペクトル包絡を表すスペクトルパラメータとを抽
    出し符号化するパラメータ計算回路と、前記パラメータ
    計算回路の出力系列を入力し前記音声信号系列の短時間
    スペクトルに応じたインパルス応答系列の自己相関関数
    を計算する自己相関関数計算回路と、前記音声信号系列
    と前記パラメータ計算回路の出力系列とを入力し前記音
    声信号系列と前記短時間スペクトルに応じたインパルス
    応答系列とに応じた相互相関関数を計算する相互相関関
    数計算回路と、前記自己相関関数計算回路の出力系列と
    前記相互相関関数計算回路の出力系列と前記パラメータ
    計算回路の出力系列とが入力され、該ピッチパラメータ
    と前記自己相関関数と前記相互相関関数とからピッチ周
    期を利用したパルス系列を求めて符号化し、前記自己相
    関関数と前記相互相関関数とからピッチ周期を利用しな
    いパルス系列を求めて符号化し、前記ピッチ周期を利用
    したパルス系列による誤差電力と前記ピッチ周期を利用
    しないパルス系列による誤差電力とを比較して誤差電力
    のより小さい方のパルス系列を第1のパルス系列として
    選択して符号化する第1のパルス系列計算回路と、前記
    パラメータ計算回路の出力符号と前記第1のパルス系列
    計算回路の出力系列とを組み合わせて出力するマルチプ
    レクサ回路とを有することを特徴とする音声符号化装
    置。
  3. 【請求項3】離散的音声信号系列をピッチの微細構造を
    表すピッチパラメータと短時間スペクトル包絡を表すス
    ペクトルパラメータを抽出して符号化し、前記スペクト
    ルパラメータをもとに前記短時間スペクトル包絡に応じ
    たインパルス応答系列の自己相関関数を計算し、前記音
    声信号系列と前記インパルス応答系列とに応じた相互相
    関関数を計算し、前記ピッチパラメータと前記自己相関
    関数と前記相互相関関数とからピッチ周期を利用したパ
    ルス系列を求め、前記自己相関関数と前記相互相関関数
    とからピッチ周期を利用しないパルス系列を求め、前記
    ピッチ周期を利用したパルス系列による誤差電力と前記
    ピッチ周期を利用しないパルス系列による誤差電力とを
    比較して誤差電力のより小さい方のパルス系列を第1の
    パルス系列として選択して符号化し、前記第1のパルス
    系列を表す符号と前記ピッチパラメータ及び前記スペク
    トルパラメータを表す符号とが組み合わされた信号を送
    信側から受け取り、 前記第1のパルス系列を表す符号と前記音声信号系列の
    ピッチの微細構造を表すピッチパラメータを表す符号と
    前記音声信号系列の短時間スペクトル包絡を表すスペク
    トルパラメータを表す符号とが組み合わされた符号系列
    を入力し前記第1のパルス系列を表す符号と前記ピッチ
    パラメータを表す符号と前記スペクトルパラメータを表
    す符号とを分離するデマルチプレクサ回路と、分離して
    得られた前記第1のパルス系列を表す符号を入力して復
    号する第1のパルス系列復号回路と、分離して得られた
    前記ピッチパラメータを表す符号を入力して復号するピ
    ッチパラメータ復号回路と、分離して得られた前記スペ
    クトルパラメータを表す符号を入力して復号するスペク
    トルパラメータ復号回路と、前記第1のパルス系列復号
    回路の出力系列と前記ピッチパラメータ復号回路の出力
    系列とを入力し前記復号された第1のパルス系列をもと
    に前記復号されたピッチパラメータを用いて第2のパル
    ス系列を求める第2のパルス系列発生回路と、前記第2
    のパルス系列発生回路の出力系列と前記スペクトルパラ
    メータ復号回路の出力系列とを入力し音声信号系列を再
    生し出力する合成フィルタ回路を有することを特徴とす
    る音声復号化装置。
JP59042305A 1984-03-06 1984-03-06 音声符号化方法とその装置 Expired - Lifetime JPH0632031B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59042305A JPH0632031B2 (ja) 1984-03-06 1984-03-06 音声符号化方法とその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59042305A JPH0632031B2 (ja) 1984-03-06 1984-03-06 音声符号化方法とその装置

Publications (2)

Publication Number Publication Date
JPS60186898A JPS60186898A (ja) 1985-09-24
JPH0632031B2 true JPH0632031B2 (ja) 1994-04-27

Family

ID=12632304

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59042305A Expired - Lifetime JPH0632031B2 (ja) 1984-03-06 1984-03-06 音声符号化方法とその装置

Country Status (1)

Country Link
JP (1) JPH0632031B2 (ja)

Also Published As

Publication number Publication date
JPS60186898A (ja) 1985-09-24

Similar Documents

Publication Publication Date Title
RU2262748C2 (ru) Многорежимное устройство кодирования
JPH0353300A (ja) 音声符号化装置
JP2903533B2 (ja) 音声符号化方式
JPH09152896A (ja) 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
JP3266178B2 (ja) 音声符号化装置
JPH11504733A (ja) 聴覚モデルによる量子化を伴う予測残余信号の変形符号化による多段音声符号器
JP3303580B2 (ja) 音声符号化装置
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
JPS61148500A (ja) 音声信号符号化方法とその装置
JPS6238500A (ja) 高能率音声符号化方式とその装置
JPH0632031B2 (ja) 音声符号化方法とその装置
KR0155798B1 (ko) 음성신호 부호화 및 복호화 방법
JPH0481199B2 (ja)
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP2900431B2 (ja) 音声信号符号化装置
JP2946528B2 (ja) 音声符号化復号化方法及びその装置
JP2853170B2 (ja) 音声符号化復号化方式
JPH0632032B2 (ja) 音声帯域信号符号化方法とその装置
JP3607774B2 (ja) 音声符号化装置
JP3055901B2 (ja) 音声信号符号化復号化方法及び音声信号符号化装置
JPH0683149B2 (ja) 音声帯域信号符号化・復号化装置
JPH0426119B2 (ja)
JPH0632035B2 (ja) 音声符号化方法とその装置
JP2615862B2 (ja) 音声符号化復号化方法とその装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term