JPS6051900A - 音声符号化方法及びその装置並びに音声符号化復号化装置 - Google Patents
音声符号化方法及びその装置並びに音声符号化復号化装置Info
- Publication number
- JPS6051900A JPS6051900A JP58139022A JP13902283A JPS6051900A JP S6051900 A JPS6051900 A JP S6051900A JP 58139022 A JP58139022 A JP 58139022A JP 13902283 A JP13902283 A JP 13902283A JP S6051900 A JPS6051900 A JP S6051900A
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- signal sequence
- circuit
- parameter
- pitch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本発明は音声信号の低ビツトレイト波形符号化方式、特
に伝送情報量を10にビット/秒以下とするような符号
化方式と装置に関する。
に伝送情報量を10にビット/秒以下とするような符号
化方式と装置に関する。
音声信号を10にビット/秒程度以下の伝送情報量で符
号化するための効果的な方法としては、音声信号の駆動
音源信号系列を、それを用いて再生した信号と入力信号
との誤差最小を条件として、短時間毎に探索する方法が
、よく知られている。
号化するための効果的な方法としては、音声信号の駆動
音源信号系列を、それを用いて再生した信号と入力信号
との誤差最小を条件として、短時間毎に探索する方法が
、よく知られている。
これらの方法はその探索方法によって木符号化(TRE
Fi 0ODING)、べ゛クトル量子化(VEO’r
Oi(。
Fi 0ODING)、べ゛クトル量子化(VEO’r
Oi(。
QUANTIZATION) と呼ばれている。また、
これらの方法以外ζこ、駆動音源信号系列を表わす複数
個のパルス系列を、短時間毎に、符号器側で、A−b−
8(ΔNALI I S一旦Y一旦YNTHE !3
I 8 )の手法を用いて逐次的にめようと下る方式が
最近、提案されている。本発明は、この方式に関係する
ものである。この方式の詳細については、ビー。
これらの方法以外ζこ、駆動音源信号系列を表わす複数
個のパルス系列を、短時間毎に、符号器側で、A−b−
8(ΔNALI I S一旦Y一旦YNTHE !3
I 8 )の手法を用いて逐次的にめようと下る方式が
最近、提案されている。本発明は、この方式に関係する
ものである。この方式の詳細については、ビー。
ニス、アタール(’B 、S 、ATAL)氏らによる
アイ、シー、ニー、ニス、ニス、ビー(i、0.A。
アイ、シー、ニー、ニス、ニス、ビー(i、0.A。
S、S、P)の予梠集、1982年614〜617貝に
116載の「ア、ニュー、モデル、オブ、エル、ビー。
116載の「ア、ニュー、モデル、オブ、エル、ビー。
シー、エクサイティション、フォー、ブ”7’ x−シ
ング、ナチュラル、サウンディング、スピーチアット、
ロウ、ビット、レイン」(’ANII;WMODEL
OF LPOEXCITATION I”01(。
ング、ナチュラル、サウンディング、スピーチアット、
ロウ、ビット、レイン」(’ANII;WMODEL
OF LPOEXCITATION I”01(。
PRODUOING NA’T’UIもAL−8OUN
I)INGSPEECHAT LOW BIT RAT
ES”)と題した論文(文献1)に説明されているので
、ここでは簡単tこ説明を行なう。
I)INGSPEECHAT LOW BIT RAT
ES”)と題した論文(文献1)に説明されているので
、ここでは簡単tこ説明を行なう。
第1図は、前記文献1、に記載された従来方式における
符号器側の処理を示すブロック図である。
符号器側の処理を示すブロック図である。
図fこおいて、100は符号器入力端子を示し、A/D
/換された音声信号系列x(n)が入力される。1.1
0はバッファメモリ回路であり、音声信号系列を1フレ
ーム(例えば8KHzサンプリングの場合でフレーム長
を10 m secとすると80サンプル)分、蓄積す
る。110の出力値は減算器120と、Kパラメータ計
算回路180とlこ出力される。但し、文献1、によれ
はにパラメータのかわりにレフレクション。
/換された音声信号系列x(n)が入力される。1.1
0はバッファメモリ回路であり、音声信号系列を1フレ
ーム(例えば8KHzサンプリングの場合でフレーム長
を10 m secとすると80サンプル)分、蓄積す
る。110の出力値は減算器120と、Kパラメータ計
算回路180とlこ出力される。但し、文献1、によれ
はにパラメータのかわりにレフレクション。
メータと同一のパラメータである。Kパラメータ計算回
路180は、110の出力値を用い、共分散法に従って
、フレーム毎の音声信号スペクトルを表わ丁にパラメー
タK・を16次分(1≦i≦16)求め、これらを合成
フィルター30へ出力する。140は、音源パルス発生
回路であり、lフレームにあらかじめ定められた個数の
パルス糸タ1]ヲ発生させる。ここでは、このパルス系
列をd (n)と龜じTる。
路180は、110の出力値を用い、共分散法に従って
、フレーム毎の音声信号スペクトルを表わ丁にパラメー
タK・を16次分(1≦i≦16)求め、これらを合成
フィルター30へ出力する。140は、音源パルス発生
回路であり、lフレームにあらかじめ定められた個数の
パルス糸タ1]ヲ発生させる。ここでは、このパルス系
列をd (n)と龜じTる。
音源パルス発生回路140によって発生された音源パル
ス系列の一例を第2図に示す。第2図で1゛黄軸は離散
的な時刻を、縦軸は振幅をそれぞれζこ示す。
ス系列の一例を第2図に示す。第2図で1゛黄軸は離散
的な時刻を、縦軸は振幅をそれぞれζこ示す。
ここでは、1フレーム内に8個のパルスを発生させる場
合lこついて示しである。音源パルス発生回路140に
よって発生されたパルス系列d(n)は、合成フィルタ
ー30を駆動する。合成フィルター30は、d(n)を
入力し、音声信号x(n)ζこ対応する再生信号x (
n)をめ、これを減算器120へ出力する。ここで、合
成フィルター30は、KパラメータKiを入力し、これ
らを予測パラメータa・(l≦i≦16)へ変換し、a
lを用いて再生信号x(n)を計′Sする。
合lこついて示しである。音源パルス発生回路140に
よって発生されたパルス系列d(n)は、合成フィルタ
ー30を駆動する。合成フィルター30は、d(n)を
入力し、音声信号x(n)ζこ対応する再生信号x (
n)をめ、これを減算器120へ出力する。ここで、合
成フィルター30は、KパラメータKiを入力し、これ
らを予測パラメータa・(l≦i≦16)へ変換し、a
lを用いて再生信号x(n)を計′Sする。
x (n)は、d(n)とaiを用いて下式のように表
わ丁ことができる。
わ丁ことができる。
上式でPは合成フィルタの次数を示し、ここではする。
190は、e (n)を入力し、重み付は関数w(n)
を用い、次式に従って重み付は誤差ew(n)を計算す
る。
を用い、次式に従って重み付は誤差ew(n)を計算す
る。
ew(n)=W(n) e(n) −(2)上式で、記
号“米”はたたみこみ積分を表わす。
号“米”はたたみこみ積分を表わす。
菫た、重み付は関数w(n)は、周波数軸上で重み付け
を行なうものであり、そのZ変換値をW■とすると、合
成フィルタの予測パラメータaif用いて、次式により
表わされる。
を行なうものであり、そのZ変換値をW■とすると、合
成フィルタの予測パラメータaif用いて、次式により
表わされる。
上式でrはO≦r≦1の定数であり、W(Z)の周波数
特性を決定する。つまり、r=1とすると、W(Z)=
1となり、その周波数特性は平担となる。
特性を決定する。つまり、r=1とすると、W(Z)=
1となり、その周波数特性は平担となる。
−万、r = Oとすると、W■は合成フィルりの周波
数特性の逆特性となる。従って、rの値によってW■の
特性を変えることができる。また、(3)式で示したよ
うlこW(イ)を合成フィルタの周波数特性に依存させ
て決めているのは、@感的なマスク効果を利用している
ためである。つまり、入力音声信号のスペクトルのパワ
が大きな箇所では(例えばフォルマントの近傍)、再生
信号のスペクトルとの誤差が少々大きくても、その誤差
は耳につき難いという聴感的な性質lこよる。第3図に
、あるフレームにおける入力音声信号のスペクトルと、
W■の周波数特性の一例とを示した。ここではr=0.
8 とした。図において、横軸は周波数(最大4KH2
)を、縦軸は対数振幅(最大60dB)をそれぞれ示T
0また、上部の曲線は音声信号のスペクトルを、下部の
曲線は重み付は関数の周波数特性を表わしている。
数特性の逆特性となる。従って、rの値によってW■の
特性を変えることができる。また、(3)式で示したよ
うlこW(イ)を合成フィルタの周波数特性に依存させ
て決めているのは、@感的なマスク効果を利用している
ためである。つまり、入力音声信号のスペクトルのパワ
が大きな箇所では(例えばフォルマントの近傍)、再生
信号のスペクトルとの誤差が少々大きくても、その誤差
は耳につき難いという聴感的な性質lこよる。第3図に
、あるフレームにおける入力音声信号のスペクトルと、
W■の周波数特性の一例とを示した。ここではr=0.
8 とした。図において、横軸は周波数(最大4KH2
)を、縦軸は対数振幅(最大60dB)をそれぞれ示T
0また、上部の曲線は音声信号のスペクトルを、下部の
曲線は重み付は関数の周波数特性を表わしている。
第1図へ戻って、重み付は誤差eW(n)は、誤差最小
化回路150ヘフイードバツクされる。誤差最小化回路
150は、ew(n)の値を1フレーム分記憶し、これ
らを用いて次式をこ従い、重み付け2乗誤差εを計算す
る。
化回路150ヘフイードバツクされる。誤差最小化回路
150は、ew(n)の値を1フレーム分記憶し、これ
らを用いて次式をこ従い、重み付け2乗誤差εを計算す
る。
ε=Σ e研n)2−(4)
n=1
ここで、Nは2乗誤差を計算下るサンプル数を示す。文
献1、の方式では、この時間長を5mψCとしており、
これは8KHzサンプリングの場合にはN=401こ相
当する。次に、誤差最小化回路150は、前記(4)式
で計算した2乗誤差εそ小さくするように音源パルス発
生回路140Gこ対し、パルス位置及び振幅情報を与え
る。140は、この情報に基づいて音源パルス系列を発
生させる。合成フィルタ130は、この音源パルス系列
を駆動源として再生信号x(n)を計算する。次に減算
器120では、先に計算した原信号と再生信号との誤差
e (n)から現在求すった再生信号x (n)を減算
して、こ21を新たな誤差e(n)とする。重み付は回
路190はe(n)を入力し重み付は誤差ew(n)を
計算し、これを誤差最小化回路150ヘフイードバツク
する。誤差最小化回路150は、再び2乗誤差を計算し
、これを小さくするように音源パルス系列の振幅と位置
を調整する。こうして音源パルス系列の発生から誤差最
小化による音源パルス系列の調整までの一連の処理は、
音源パルス系列のパルス数があらかじめ定められた数に
達するまでくり返され、Lt音源パルス系列決定される
。
献1、の方式では、この時間長を5mψCとしており、
これは8KHzサンプリングの場合にはN=401こ相
当する。次に、誤差最小化回路150は、前記(4)式
で計算した2乗誤差εそ小さくするように音源パルス発
生回路140Gこ対し、パルス位置及び振幅情報を与え
る。140は、この情報に基づいて音源パルス系列を発
生させる。合成フィルタ130は、この音源パルス系列
を駆動源として再生信号x(n)を計算する。次に減算
器120では、先に計算した原信号と再生信号との誤差
e (n)から現在求すった再生信号x (n)を減算
して、こ21を新たな誤差e(n)とする。重み付は回
路190はe(n)を入力し重み付は誤差ew(n)を
計算し、これを誤差最小化回路150ヘフイードバツク
する。誤差最小化回路150は、再び2乗誤差を計算し
、これを小さくするように音源パルス系列の振幅と位置
を調整する。こうして音源パルス系列の発生から誤差最
小化による音源パルス系列の調整までの一連の処理は、
音源パルス系列のパルス数があらかじめ定められた数に
達するまでくり返され、Lt音源パルス系列決定される
。
以上で従来方式の説明を終了する。
この方式の場合ζこ、伝送下べき情報は、合成フィルタ
のにパラメータKi (1≦i≦16)と、音源パルス
系列のパルス位置及び振IP!itであり、Jフレーム
内にたてるパルスの数をこまって任意の伝送レイトを実
現できる。さらζこ、伝送レイt−’5J7川に、b
p s以下とTる領域に対しては、良好な[4生音質が
イ!Iられ有効な方式の一つと考えられる。
のにパラメータKi (1≦i≦16)と、音源パルス
系列のパルス位置及び振IP!itであり、Jフレーム
内にたてるパルスの数をこまって任意の伝送レイトを実
現できる。さらζこ、伝送レイt−’5J7川に、b
p s以下とTる領域に対しては、良好な[4生音質が
イ!Iられ有効な方式の一つと考えられる。
しかしながら、この従来方式は、6i()γJitがJ
1′常に多いという欠点がある。これは音源パルス系列
におけるパルスの位置と振幅を計q、する際ζこ、その
パルスに基づいて再生した信号と原(it号との誤差及
び2乗誤差を計算し、それらをフィードバックさせて、
2乗誤差を小さくするようにパルス位置と振幅を調整し
ていることに起因している。更ζこは、パルスの数があ
らかじめ定められた値に達するまでこの処理をくり返丁
ことに起因している。
1′常に多いという欠点がある。これは音源パルス系列
におけるパルスの位置と振幅を計q、する際ζこ、その
パルスに基づいて再生した信号と原(it号との誤差及
び2乗誤差を計算し、それらをフィードバックさせて、
2乗誤差を小さくするようにパルス位置と振幅を調整し
ていることに起因している。更ζこは、パルスの数があ
らかじめ定められた値に達するまでこの処理をくり返丁
ことに起因している。
更Qこ、この従来方式ζこよれは、10Kbps 程度
以下のビットレイトでは、ピッチ周波数の品い入力信号
の場合、例えは女性の声を入力した場合には、再生品質
が劣化するという欠点があった。これはピッチ周波数が
高い場合には、パルス計算のフレーム内に多くのピッチ
波形が含まれることになり、このピッチ波形を良好ζこ
再生するためには、ピッチ周波数が低い話者の場合を比
べて、より多くの個数の音源パルスを必要とするという
理由をこよる。従ってこの理由から、伝送ビットレイト
ヲ大幅に下げる、Tなイっち1フレーム内のパルス数を
大幅に減少させることが困難であった。
以下のビットレイトでは、ピッチ周波数の品い入力信号
の場合、例えは女性の声を入力した場合には、再生品質
が劣化するという欠点があった。これはピッチ周波数が
高い場合には、パルス計算のフレーム内に多くのピッチ
波形が含まれることになり、このピッチ波形を良好ζこ
再生するためには、ピッチ周波数が低い話者の場合を比
べて、より多くの個数の音源パルスを必要とするという
理由をこよる。従ってこの理由から、伝送ビットレイト
ヲ大幅に下げる、Tなイっち1フレーム内のパルス数を
大幅に減少させることが困難であった。
本発明の目的(ば、比較的少ない演算量で、1OKbp
s以下のビットレイトに適用し得る高品貿な酋声符号方
式とその装置を提供することにある。
s以下のビットレイトに適用し得る高品貿な酋声符号方
式とその装置を提供することにある。
本発明によれば、送信側では離散的音声信号系列を入力
しピッチのea F¥造を含む短時間スペクトルを表わ
丁パラメータを抽出して符号化し、前記ハラメータをも
とに前記短時間スペクトルに応じたインパルス応答系列
の自己相関々数を計算し、前記音声信号系列と前記イン
パルス応答系列と−こ応じた相互相関々数を計算し、前
記自己相関々数と前記相互相関々数とを用いて前記音声
信号系列に対する駆動音源信号系列をめて符号化し、前
記駆動音源信号系列を表わ丁符号と前記パラメータを表
わす符号とを組み合わせて出力し、受信側ではmJ記符
号系列を入力し前記駆動音源信号系列を表わ丁符号系列
と前記ピッチの微細構造を含む短時間スペクトルを表わ
丁バラメークの符号系列とを分離して復号し、前記復号
化された駆動′t¥r源信号系列と前記復号されたパラ
メータとを用いて前記音声信号系列を再生するようにし
たことを特徴とする音声符号化方式が得られる。
しピッチのea F¥造を含む短時間スペクトルを表わ
丁パラメータを抽出して符号化し、前記ハラメータをも
とに前記短時間スペクトルに応じたインパルス応答系列
の自己相関々数を計算し、前記音声信号系列と前記イン
パルス応答系列と−こ応じた相互相関々数を計算し、前
記自己相関々数と前記相互相関々数とを用いて前記音声
信号系列に対する駆動音源信号系列をめて符号化し、前
記駆動音源信号系列を表わ丁符号と前記パラメータを表
わす符号とを組み合わせて出力し、受信側ではmJ記符
号系列を入力し前記駆動音源信号系列を表わ丁符号系列
と前記ピッチの微細構造を含む短時間スペクトルを表わ
丁バラメークの符号系列とを分離して復号し、前記復号
化された駆動′t¥r源信号系列と前記復号されたパラ
メータとを用いて前記音声信号系列を再生するようにし
たことを特徴とする音声符号化方式が得られる。
また、本発明によれは、離散的音声信号系列を人力し前
記音声信号系列からピッチの倣細構造を表わ丁ピッチパ
ラメータと短時間スペクトル包絡を表わすスペクトルパ
ラメータとを抽出し符号化するパラメータ計算回路と、
前記パラメータ11纜−回路の出力系列を入力し前記音
声信号系列のピッチ構造を含んだ短時間スペクトルに応
じたインパルス応答系列の自己相関々数を計34−Tる
自己イ・目間関数計算回路と、前記音声信号系列と前記
パラメータ計算回路の出力系列を入力し前記音声信号系
列と前記短時間スペクトルに応じ1こインパルス応答系
列とで表わされる相互相関々数を計算する相互相関々数
計算回路と、前記自己411!al々数計算回路の出力
系列と前記相互相関々数計算回路の出力系列とを入力し
前記音声信号系列に対する駆動音源信号系列をめて符号
化する駆動音源信号系列計算回路と、前記パラメータ計
算回路の出力符号系列と前記駆動音源信号系列計算回路
の出力、符号系列とを組み合イつせて出力するマルチプ
レクサ回路とを有するようζこしたことを特徴と下る音
声符゛ −号化装置が得らオ]−ろ。
記音声信号系列からピッチの倣細構造を表わ丁ピッチパ
ラメータと短時間スペクトル包絡を表わすスペクトルパ
ラメータとを抽出し符号化するパラメータ計算回路と、
前記パラメータ11纜−回路の出力系列を入力し前記音
声信号系列のピッチ構造を含んだ短時間スペクトルに応
じたインパルス応答系列の自己相関々数を計34−Tる
自己イ・目間関数計算回路と、前記音声信号系列と前記
パラメータ計算回路の出力系列を入力し前記音声信号系
列と前記短時間スペクトルに応じ1こインパルス応答系
列とで表わされる相互相関々数を計算する相互相関々数
計算回路と、前記自己411!al々数計算回路の出力
系列と前記相互相関々数計算回路の出力系列とを入力し
前記音声信号系列に対する駆動音源信号系列をめて符号
化する駆動音源信号系列計算回路と、前記パラメータ計
算回路の出力符号系列と前記駆動音源信号系列計算回路
の出力、符号系列とを組み合イつせて出力するマルチプ
レクサ回路とを有するようζこしたことを特徴と下る音
声符゛ −号化装置が得らオ]−ろ。
更に本発明によれば、符号系列を入力しバSiス動音源
信号系列を表わ丁符号系列とピッチパラメータを表わ丁
符号系列とスペクトルパラメータ少表わ丁符号系列とを
分離下るデマルチプレクサ回路と、分離して得られた前
記駆動音源信号系列を表わす符号系列を入力して復号す
る駆動音源信号系列と、分離して祷られた前記ピッチパ
ラメータを表わす符号系列と前記スペクトルパラメータ
を表わ丁符号系列とを入力し復号するパラメーク復号回
路と、前記駆動音源復号回路の出力系列と前記パラメー
タ復号回路の出力とを用いて音声信号系列を再生し出力
下る合成フィルタ回路とを有するようζこしたことを特
徴とする音声 −復号 化装置が得られる。
信号系列を表わ丁符号系列とピッチパラメータを表わ丁
符号系列とスペクトルパラメータ少表わ丁符号系列とを
分離下るデマルチプレクサ回路と、分離して得られた前
記駆動音源信号系列を表わす符号系列を入力して復号す
る駆動音源信号系列と、分離して祷られた前記ピッチパ
ラメータを表わす符号系列と前記スペクトルパラメータ
を表わ丁符号系列とを入力し復号するパラメーク復号回
路と、前記駆動音源復号回路の出力系列と前記パラメー
タ復号回路の出力とを用いて音声信号系列を再生し出力
下る合成フィルタ回路とを有するようζこしたことを特
徴とする音声 −復号 化装置が得られる。
ます不発明による音源パルス計算アルゴリスムを詳細に
説明することにする。
説明することにする。
1フレーム内の任意の時刻nにおける音i+にパルス系
列d(n)を次式で表わ丁。
列d(n)を次式で表わ丁。
ここで、δ ・ はクロネッカーのデルタを表イ)n、
ml し、n=m1 の場合ζこ1で、n笑rni o、)吠
1合は()である。Kはlフレーム内にたてるパルス数
を示す。11は1番目のパルスの振幅を示し、Ill
ili番目のパルスの位置を示す。
ml し、n=m1 の場合ζこ1で、n笑rni o、)吠
1合は()である。Kはlフレーム内にたてるパルス数
を示す。11は1番目のパルスの振幅を示し、Ill
ili番目のパルスの位置を示す。
次に、合成フィルタとしてピッチの微細構ぶ!1も含め
た音声信号のスペクトル構造を表わしイ(!るフィルタ
を考える。このフィルタはピッチ予測フィルタとスペク
トル包絡予測フィルタとの縦続接続で表わすことができ
る。ブロック図を第4図ζこ示す。図において、191
はピッチ予測フィルタを示し、192はスペクトル包絡
予測フィルタを示している。ピッチ予測フィルタとして
は、1次の場合と高次の場合とが考えられるが、ここで
は説明の簡略化のために1次のピッチ予測フィルタを用
いた場合について考える。音源パルス列d(n))こよ
って、ピッチ予測フィルタとスペクトル包絡子61リフ
ィルタとの縦続接続からなる、合成フィルタを駆動して
得られる再生信号x(n)は、次式のように書き表わ丁
ことができる。
た音声信号のスペクトル構造を表わしイ(!るフィルタ
を考える。このフィルタはピッチ予測フィルタとスペク
トル包絡予測フィルタとの縦続接続で表わすことができ
る。ブロック図を第4図ζこ示す。図において、191
はピッチ予測フィルタを示し、192はスペクトル包絡
予測フィルタを示している。ピッチ予測フィルタとして
は、1次の場合と高次の場合とが考えられるが、ここで
は説明の簡略化のために1次のピッチ予測フィルタを用
いた場合について考える。音源パルス列d(n))こよ
って、ピッチ予測フィルタとスペクトル包絡子61リフ
ィルタとの縦続接続からなる、合成フィルタを駆動して
得られる再生信号x(n)は、次式のように書き表わ丁
ことができる。
ここでβはピッチ予測フィルタのタップ係数を示し、M
dは入力信号のピッチ周期を示す。xd(n)はピッチ
予測フィルタ出力信号を示1−0また、Pはスペクトル
包絡予測器の予測次数であり、ai(1≦i≦P)は、
スペクトル包絡子θ(り器の予6+11係数を示す。ピ
ッチ予測器のタップ係数β及びピッチ周期Mdの算出法
は種々知られているが、111”1便な方法としては、
例えば入力音声信号の自己4[1関々数列のピーク振幅
及びその位置を抽出する方法がよく知られている。この
方法の詳細については、ビーニス・アタール(B、S、
ΔT A L )、エム・アール・シュレーダー(M、
R,SOH几〇−EDER)氏によるベル・システム・
テクニカル・ジャーナル(BELL SYSTEM T
ECHNICALJOU凡NAL) 誌、1970年I
O月号、1973〜1986頁に掲載の「アダプティブ
・ブリディクチイブ・コーディング・オブ・スピーチ・
シグナルズ」(“ADAPTIVE PI(、EDIT
IVE 0O−DING OF 5PEECH5IGN
ALS”)amした論文(文献2)#こ詳細に説明され
ているのでここでは説明を省略する。
dは入力信号のピッチ周期を示す。xd(n)はピッチ
予測フィルタ出力信号を示1−0また、Pはスペクトル
包絡予測器の予測次数であり、ai(1≦i≦P)は、
スペクトル包絡子θ(り器の予6+11係数を示す。ピ
ッチ予測器のタップ係数β及びピッチ周期Mdの算出法
は種々知られているが、111”1便な方法としては、
例えば入力音声信号の自己4[1関々数列のピーク振幅
及びその位置を抽出する方法がよく知られている。この
方法の詳細については、ビーニス・アタール(B、S、
ΔT A L )、エム・アール・シュレーダー(M、
R,SOH几〇−EDER)氏によるベル・システム・
テクニカル・ジャーナル(BELL SYSTEM T
ECHNICALJOU凡NAL) 誌、1970年I
O月号、1973〜1986頁に掲載の「アダプティブ
・ブリディクチイブ・コーディング・オブ・スピーチ・
シグナルズ」(“ADAPTIVE PI(、EDIT
IVE 0O−DING OF 5PEECH5IGN
ALS”)amした論文(文献2)#こ詳細に説明され
ているのでここでは説明を省略する。
今、ピッチ予測フィルタとスペクトル包絡予測フィルタ
とからなる合成フィルタのインパルス応答をh(i)(
0≦i≦M−1;ここでMはインパルス応答の縦続サン
プル数を示す。)とすると、14)生信号x(n)は次
式のようにも書くことができる。
とからなる合成フィルタのインパルス応答をh(i)(
0≦i≦M−1;ここでMはインパルス応答の縦続サン
プル数を示す。)とすると、14)生信号x(n)は次
式のようにも書くことができる。
X (n)−d (n)* h (n) −(7)次に
、入力音声信号x (n)と再生信号マ(n)、=の1
フレーム内の重み付け2來誤差J(ゴ、次のように表イ
つ丁ことかできる。
、入力音声信号x (n)と再生信号マ(n)、=の1
フレーム内の重み付け2來誤差J(ゴ、次のように表イ
つ丁ことかできる。
J−Σ [x(n)−x(n月* w (n) ] (
8)n=1 ここでw(n)は直み付は回路のインパルス応答であり
、例えは第1図ζこ示した従来方式の屯み付は回路と同
一の特性とする。又、Nはjフレームのザンブル数を示
す。
8)n=1 ここでw(n)は直み付は回路のインパルス応答であり
、例えは第1図ζこ示した従来方式の屯み付は回路と同
一の特性とする。又、Nはjフレームのザンブル数を示
す。
(8)式で示した重み付けられた2來誤差Jそ最小化す
る音源パルス列を計算下るためのアルゴリズムを、次に
導出Tる。
る音源パルス列を計算下るためのアルゴリズムを、次に
導出Tる。
まず(7)式を(8)弐に代入して次式をイ叫るーJ−
Σ [fx(n)−d(n)*h(n)l*w(n))
(9)11=1 ここで上式右辺の各項を次式のように表わし、x w
(n) −x (n) * w (n) −(10)h
(n) = h (n) * w (n) −(1,
1)(5)式、(]o式、(11)式ヲ(9)式jコ代
し’T:次式f得6゜α2式を最小化する音源パルス系
列は、021式を祈源パルス系列の振幅?量で偏微分し
て0とおくことによって得た次式から計算される。
Σ [fx(n)−d(n)*h(n)l*w(n))
(9)11=1 ここで上式右辺の各項を次式のように表わし、x w
(n) −x (n) * w (n) −(10)h
(n) = h (n) * w (n) −(1,
1)(5)式、(]o式、(11)式ヲ(9)式jコ代
し’T:次式f得6゜α2式を最小化する音源パルス系
列は、021式を祈源パルス系列の振幅?量で偏微分し
て0とおくことによって得た次式から計算される。
ここで、ψxh(・)はx w (n)とhW(n)か
ら計算した相互相関々数列を、ψhh(りはh w (
n)から計算した自己相関々数列をそれぞれ表わし、次
式のように書ける。尚、ψhh(・)は音声信号処理の
分野では共分散関数列と呼ばれることが多い。
ら計算した相互相関々数列を、ψhh(りはh w (
n)から計算した自己相関々数列をそれぞれ表わし、次
式のように書ける。尚、ψhh(・)は音声信号処理の
分野では共分散関数列と呼ばれることが多い。
(19式によれは、音源パルス系列の振幅21 は、そ
の位置mi の関数となっており、位置m1にパルスを
たてる場合に最適な振幅fiを計算することができる。
の位置mi の関数となっており、位置m1にパルスを
たてる場合に最適な振幅fiを計算することができる。
また、#源パルスの位j藏miは、α四式を02式に代
入してめた2莱誤差 に そ最小化する、つまり、右辺第2項を最大化する位置を
選べはよい。また、近似的な方法としては、12.1を
最大とするような位置を選んでもよい。
入してめた2莱誤差 に そ最小化する、つまり、右辺第2項を最大化する位置を
選べはよい。また、近似的な方法としては、12.1を
最大とするような位置を選んでもよい。
命、フレームの端の影響を無視丁れは、0!19式で示
した共分散関数ψhh(mj2mi)は、次式のように
時間差(1m□−mi+)に依存した自己相関々数列R
hh(1m、fil )cc等シイトオケル。
した共分散関数ψhh(mj2mi)は、次式のように
時間差(1m□−mi+)に依存した自己相関々数列R
hh(1m、fil )cc等シイトオケル。
ψhh(m7 、ml)=Rhh(1mj−miI )
CIfilここで1(hh(りは、次式のように表わ
せる。
CIfilここで1(hh(りは、次式のように表わ
せる。
(賠119m1≦N)−Qη
従りて住9式はα眠(Iη式を用いで次式のように修正
Rhh(りの計算は、ψhh(・、・)の計算に比べ約
1./Nの演算量で丁む。従って、音源パルス系列の計
豹に(181式を用いることによってQ3)式と比較し
て演算量を1/Hに低減できる。しかしながら(111
式に従って音源パルス列を計算する場合fこ、411互
、111関々数ψxh(・)を計算するデータサンプル
数がパルスを伝送下るフレームのサンプル数よりも太*
<、1hいとフレームの端近傍のパルスに誤差を生ず
る。従って、相互相関々数ψxh(りを計算するテーク
→)゛ンブル数を、フレームのサンプル数よりも太きく
醪んでおくことにまって、この問題は回避できる。以上
で音源パルス計算アルゴリズムの導出及びその特徴に関
する説明を終える。
Rhh(りの計算は、ψhh(・、・)の計算に比べ約
1./Nの演算量で丁む。従って、音源パルス系列の計
豹に(181式を用いることによってQ3)式と比較し
て演算量を1/Hに低減できる。しかしながら(111
式に従って音源パルス列を計算する場合fこ、411互
、111関々数ψxh(・)を計算するデータサンプル
数がパルスを伝送下るフレームのサンプル数よりも太*
<、1hいとフレームの端近傍のパルスに誤差を生ず
る。従って、相互相関々数ψxh(りを計算するテーク
→)゛ンブル数を、フレームのサンプル数よりも太きく
醪んでおくことにまって、この問題は回避できる。以上
で音源パルス計算アルゴリズムの導出及びその特徴に関
する説明を終える。
次に不発明による音源パルス計算アルゴリズムを用いた
音声符号化方式を、第5図を参照して詳細に貌、明する
。
音声符号化方式を、第5図を参照して詳細に貌、明する
。
第5図(a)は、不発明による音声符号化方式の送信側
の一実施例を示すブロック図であり、第5図(b)は受
信側の一実施例を示すブロック図である。
の一実施例を示すブロック図であり、第5図(b)は受
信側の一実施例を示すブロック図である。
第5図(a)において、離散的な音声信号系列x (n
)は入力端子195から入力され、あらかじめ定められ
たサンプル数だけ区切られてバッファメモリ回路340
−こ蓄積される。ここで入力脩声信号系列を区切る際に
、あらかじめ定められたサンプル数だけの重なりをもっ
て区切るようにする。これは前述のように、音源パルス
計算に用いるデータサンプル数をフレームのサンプル数
よりも大きくする1こめである。次に、Kパラメータ計
算回路280は、バッファメモリ回路34旧こ蓄積され
ている音声信号系列のうち、あらかじめ定められた長さ
の系列を入力し、これを用いてあらかじめ定められた次
数P個のLPOパラメータを、衆知の方法(例えは線形
予測分析法)に従い計算する。LPO/−eラメーグと
しては、種々のものが考えられるが、以下ではにパラメ
ータKi(1≦i≦P)を用いるものとして説明を進め
る。Kパラメータはパーコール係数と同一のパラメータ
である。Kバラメー夕Ki は、Kパラメータ符号化回
路200に出力される。Kパラメータ符号化回路200
は、例えはあらかじめ定められた童子化ビット数に基づ
いて、Kiを符号化し、符号tki をゲート回路46
0へ出力する。また、Kパラメータ符号化回路200は
、tkiを復号化して得たki′をインパルス応答計算
回路210と合成フィルタ回路400へ出力”if−る
、次ζ乙ピッチ分析回路370は、バッファメモリ回路
340の出力系列を入力し、例えば1)1■述の文献(
2ハこ記載の方法に従って、ピッチ周期Md及びピッチ
ゲインβを計算し、ピッチ符号化回路380へ出力する
。ピッチ符号化回路380は、あらかじめ定められたビ
ット数でピッチ周期Md及びピッチゲインβを符号化し
て得たld及びらをゲート回路460へ出力する。才た
、ピッチ符号化回路380は、ld及びlβ を復号化
して得たΔ1d′及びβ′をインパルス応答計算回路2
10と合ルにフィルタ回路400へ出力する。
)は入力端子195から入力され、あらかじめ定められ
たサンプル数だけ区切られてバッファメモリ回路340
−こ蓄積される。ここで入力脩声信号系列を区切る際に
、あらかじめ定められたサンプル数だけの重なりをもっ
て区切るようにする。これは前述のように、音源パルス
計算に用いるデータサンプル数をフレームのサンプル数
よりも大きくする1こめである。次に、Kパラメータ計
算回路280は、バッファメモリ回路34旧こ蓄積され
ている音声信号系列のうち、あらかじめ定められた長さ
の系列を入力し、これを用いてあらかじめ定められた次
数P個のLPOパラメータを、衆知の方法(例えは線形
予測分析法)に従い計算する。LPO/−eラメーグと
しては、種々のものが考えられるが、以下ではにパラメ
ータKi(1≦i≦P)を用いるものとして説明を進め
る。Kパラメータはパーコール係数と同一のパラメータ
である。Kバラメー夕Ki は、Kパラメータ符号化回
路200に出力される。Kパラメータ符号化回路200
は、例えはあらかじめ定められた童子化ビット数に基づ
いて、Kiを符号化し、符号tki をゲート回路46
0へ出力する。また、Kパラメータ符号化回路200は
、tkiを復号化して得たki′をインパルス応答計算
回路210と合成フィルタ回路400へ出力”if−る
、次ζ乙ピッチ分析回路370は、バッファメモリ回路
340の出力系列を入力し、例えば1)1■述の文献(
2ハこ記載の方法に従って、ピッチ周期Md及びピッチ
ゲインβを計算し、ピッチ符号化回路380へ出力する
。ピッチ符号化回路380は、あらかじめ定められたビ
ット数でピッチ周期Md及びピッチゲインβを符号化し
て得たld及びらをゲート回路460へ出力する。才た
、ピッチ符号化回路380は、ld及びlβ を復号化
して得たΔ1d′及びβ′をインパルス応答計算回路2
10と合ルにフィルタ回路400へ出力する。
次に、インパルス応答計算回路210は、I(パラメー
タ復号値Ki/をにパラメータ符号化回路200から入
力し、マタ、ピッチ周期及びピッチゲインの復号化値M
d′及びβ′をピッチ符号化回路380から入力する、
インパルス応答計算回路210は、2種類のインパルス
応答を計算下る。まず初めに、Kパラメータ復号値に1
′のみを用いて第4図ζこ示しれ合成フィルタのうち、
スペクトル包絡予測フィルタ192のみの場合の重み付
けられたインパルス応答hIwを、あら力1じめ足めら
れたサンプル数だ一計算し請求まったh 1w (n)
を自己相関々数計算回路360と、相互相関々数計算回
路350とへ出刃T6゜続いてにパラメータ復号値K
i/とピッチ情@(ビッチゲーインβ′及びピッチ周期
〜1d′)とを用いて、ピッチ予測フィルタとスペクト
ル包絡予測フィルタからなる合成フィルタの+4(み付
けられたインパルス応答hzw(n)fあらかじめ定め
られたサンプル数だけ計算し、hl、(n)#こよる相
関演算処理が終了した後に、自己相関々数計算回路36
0ご相互相関々数計算回路350とへ出方する。
タ復号値Ki/をにパラメータ符号化回路200から入
力し、マタ、ピッチ周期及びピッチゲインの復号化値M
d′及びβ′をピッチ符号化回路380から入力する、
インパルス応答計算回路210は、2種類のインパルス
応答を計算下る。まず初めに、Kパラメータ復号値に1
′のみを用いて第4図ζこ示しれ合成フィルタのうち、
スペクトル包絡予測フィルタ192のみの場合の重み付
けられたインパルス応答hIwを、あら力1じめ足めら
れたサンプル数だ一計算し請求まったh 1w (n)
を自己相関々数計算回路360と、相互相関々数計算回
路350とへ出刃T6゜続いてにパラメータ復号値K
i/とピッチ情@(ビッチゲーインβ′及びピッチ周期
〜1d′)とを用いて、ピッチ予測フィルタとスペクト
ル包絡予測フィルタからなる合成フィルタの+4(み付
けられたインパルス応答hzw(n)fあらかじめ定め
られたサンプル数だけ計算し、hl、(n)#こよる相
関演算処理が終了した後に、自己相関々数計算回路36
0ご相互相関々数計算回路350とへ出方する。
次ζこ、自己相関々数計算回路360は、インパルス応
答h 1w (n)を入力し、前述の07+式に従って
h + J+すの自己相関々数列Rhh1(1m1−m
1l ) y、−計容し、これをパルス計算回路390
へ出力する。続いて、前述の計算が終了した後に、イン
パルス応答11□、 (n)を入力し、h2 w (n
)の自己相関々数列1Lbh2ΦII J −111i
l)を計算し、パルス計算回路390へ出力する。
答h 1w (n)を入力し、前述の07+式に従って
h + J+すの自己相関々数列Rhh1(1m1−m
1l ) y、−計容し、これをパルス計算回路390
へ出力する。続いて、前述の計算が終了した後に、イン
パルス応答11□、 (n)を入力し、h2 w (n
)の自己相関々数列1Lbh2ΦII J −111i
l)を計算し、パルス計算回路390へ出力する。
次に、減算器285は、バッファメモリ回路340に蓄
積された音声信号系列x(n)を入力し、x(n)か出
力する。框み付は回路410は、Kパラメータ符号化回
路200から、Kパラメータ復号値に、/を入力し、重
み付は関数w(n)を、その2変換値を(3)式とする
ように計算する。これは他の周波数重み付は方法を用い
て計算してもよい。四に、IFみ付は回路410は、減
算器285の減算結果を入力し、これと重み付は関数w
(n)とのたたみこみ演算を行ない、得られたx、、(
n)を相互相関々数計算回路350へ出力する。
積された音声信号系列x(n)を入力し、x(n)か出
力する。框み付は回路410は、Kパラメータ符号化回
路200から、Kパラメータ復号値に、/を入力し、重
み付は関数w(n)を、その2変換値を(3)式とする
ように計算する。これは他の周波数重み付は方法を用い
て計算してもよい。四に、IFみ付は回路410は、減
算器285の減算結果を入力し、これと重み付は関数w
(n)とのたたみこみ演算を行ない、得られたx、、(
n)を相互相関々数計算回路350へ出力する。
相互相関々数計算回路350は、インパルス応答計算回
路210からインパルス応答り、<n)+入力し、h
、 y (n)と前述のx、、(n)とを用いて、鷹1
の相互相関々数ψXh1 (−mI) (1≦mi≦N
)ヲ計Wし、これをパルス計算回路390へ出力下る。
路210からインパルス応答り、<n)+入力し、h
、 y (n)と前述のx、、(n)とを用いて、鷹1
の相互相関々数ψXh1 (−mI) (1≦mi≦N
)ヲ計Wし、これをパルス計算回路390へ出力下る。
続いて、インパルス応答hzwC”)’<入力し、hz
w(ロ)とxw(n)とを用いて、第2の相互組閣々数
ψxh 2 (−mi)(1≦nli≦N)を計算し、
これをパルス計装回路390へ出力する。
w(ロ)とxw(n)とを用いて、第2の相互組閣々数
ψxh 2 (−mi)(1≦nli≦N)を計算し、
これをパルス計装回路390へ出力する。
パルス計算回路390は、相互相関々数さ自己間関数と
を同期して入力する。つまり、あら力)しめ定められた
フレーム周期内で初めに、第]の相互相関々数ψx)、
、(−mi)と自己相関々数R1,h1(1mn−m、
l) とを同期して入力し、前述の音源パルス計算式α
印を用いて、第1の音源パルス列の振幅2□と位置mi
とを、あらかじめ定められた個数だけ計算する。次に
、前述の処理が終了した後に、第2の相互相関々数ψx
hz (−m i) と自己相関々斂Rhh2(1mj
mi l ) トf同期シテ入カシ、FjfT il
s O,)(ld式に従って、第2の音源パルス列の振
幅と位置とを計算下6゜更に、パルス計算回路390は
、入力信号と再生儀遡信号との間の誤差信号のパワーを
、第1の音源パルス列と第2のfP、1°ルス列の各々
tこ対して、次式ζこ従って計算する。
を同期して入力する。つまり、あら力)しめ定められた
フレーム周期内で初めに、第]の相互相関々数ψx)、
、(−mi)と自己相関々数R1,h1(1mn−m、
l) とを同期して入力し、前述の音源パルス計算式α
印を用いて、第1の音源パルス列の振幅2□と位置mi
とを、あらかじめ定められた個数だけ計算する。次に
、前述の処理が終了した後に、第2の相互相関々数ψx
hz (−m i) と自己相関々斂Rhh2(1mj
mi l ) トf同期シテ入カシ、FjfT il
s O,)(ld式に従って、第2の音源パルス列の振
幅と位置とを計算下6゜更に、パルス計算回路390は
、入力信号と再生儀遡信号との間の誤差信号のパワーを
、第1の音源パルス列と第2のfP、1°ルス列の各々
tこ対して、次式ζこ従って計算する。
n:l l−1
上式は、(9)式ζこ(国式を代入することによって軍
められる。ここで、取)0)は重み付は回路旧0の出力
値xJn)のパワーを示す。第1の酢源ノクルス列と第
2の音源パルス列について計算されγこ誤7′I;′−
信一号パワーは、判別回路430へ出力される。尚、(
111式のかわ引こ、音源パルス列を計算した結果、イ
:Jられる相互イ°目関々数の残差を用いて、誤差信号
U)ノぐワーを次式ζこ従い近似的に計算下ることもで
きる。
められる。ここで、取)0)は重み付は回路旧0の出力
値xJn)のパワーを示す。第1の酢源ノクルス列と第
2の音源パルス列について計算されγこ誤7′I;′−
信一号パワーは、判別回路430へ出力される。尚、(
111式のかわ引こ、音源パルス列を計算した結果、イ
:Jられる相互イ°目関々数の残差を用いて、誤差信号
U)ノぐワーを次式ζこ従い近似的に計算下ることもで
きる。
次に、判別回路430は、第1の音源ノ々ルス列と第2
の音源パルス列のうちで、人力14号をより忠実に表わ
し得る音源パルス列を選択下る目的うr持っている。従
って判別@路430は、7句レス計算回路390から入
力した各々の音源パルス列に71’−(Iる誤差信号の
パワーを比較する。もし第1のt1°源〕く″ルスに対
する値が第2の音源ノ々ルスに対する値よりも小さい場
合は、第1の音源ツク゛ルス列をJT−1fz)た方が
第2の音源パルス列をi−1いるよりも特性かよいと判
断下る。第1の音源/マルス列Cバビツチ11j報を用
いない(つまりβ’−〇、 、 Md’ = 0とし1
こ)第1のインパルス応答から計算したものである1こ
め、判別回路430は、切り換え回路4401こズ1し
て、第1の音源パルス列を符号化回路47()へ出力さ
せるようにT6゜また、判別回路430は、ゲー1−
IE!1路460 lこ対して、Kパラメータ符号li
<ifマルチプレクサ450へ出力させろ。また、ビ゛
ツチ情報を表わ丁符号(A’d及ヒA、)は、ゲート回
路4601こおいて、あらかじめ定められた符号がセ、
トされ、マルチプレクサ450へ出力される、逆0)場
合には、第2の音源パルス列を用い1こ万が第10)音
源パルス列を用いるよりも特性がよいと一1′ll断よ
る。
の音源パルス列のうちで、人力14号をより忠実に表わ
し得る音源パルス列を選択下る目的うr持っている。従
って判別@路430は、7句レス計算回路390から入
力した各々の音源パルス列に71’−(Iる誤差信号の
パワーを比較する。もし第1のt1°源〕く″ルスに対
する値が第2の音源ノ々ルスに対する値よりも小さい場
合は、第1の音源ツク゛ルス列をJT−1fz)た方が
第2の音源パルス列をi−1いるよりも特性かよいと判
断下る。第1の音源/マルス列Cバビツチ11j報を用
いない(つまりβ’−〇、 、 Md’ = 0とし1
こ)第1のインパルス応答から計算したものである1こ
め、判別回路430は、切り換え回路4401こズ1し
て、第1の音源パルス列を符号化回路47()へ出力さ
せるようにT6゜また、判別回路430は、ゲー1−
IE!1路460 lこ対して、Kパラメータ符号li
<ifマルチプレクサ450へ出力させろ。また、ビ゛
ツチ情報を表わ丁符号(A’d及ヒA、)は、ゲート回
路4601こおいて、あらかじめ定められた符号がセ、
トされ、マルチプレクサ450へ出力される、逆0)場
合には、第2の音源パルス列を用い1こ万が第10)音
源パルス列を用いるよりも特性がよいと一1′ll断よ
る。
第20J t ibJパルス列は、スペクトル包絡情報
と1−’ツチ情報とを用いた累2のインパルス応谷から
計算したものであるため、判別回路430は、切V)換
え回路440に対し、第2の音源ノ々ルス列を右−弓゛
イし回路470へ出力させるように下る。ま1こ、判別
回路430は、ゲート回路460ζこ対して、Kパラメ
ータ符号lki及びピッチ情報を表わ丁符号ld、lβ
をマルチプレクサ450へ出力させる。
と1−’ツチ情報とを用いた累2のインパルス応谷から
計算したものであるため、判別回路430は、切V)換
え回路440に対し、第2の音源ノ々ルス列を右−弓゛
イし回路470へ出力させるように下る。ま1こ、判別
回路430は、ゲート回路460ζこ対して、Kパラメ
ータ符号lki及びピッチ情報を表わ丁符号ld、lβ
をマルチプレクサ450へ出力させる。
次に、符号化(ロ)路470は、切り換え回路440か
ら、音源パルス列の振幅及び位置を入力し、こわらを後
述の正規化係数を用いて符号化する。また正規化係数に
も符号化を施し、正規化係数、17(源パルス列の振幅
、位置を表わ丁符号を、マルチプレクサ450へ出力す
る。また、音源パルス列の4bり幅、位置の復号化値P
i’ 、mi’を音源パルス発/1:回路420へ出力
する。ここで符号化pl路470の符号化の方法は種々
考えられる。一つは、パルス列の振幅、位置を別々に符
号化する方法であり、また、一つは、振幅、位置を一諸
にして符号化する方法である。前者の方法について一例
を説明下る。まず、音源パルスの振幅の符号化法さして
は、フレーム内のパルス系列の振幅の最大値を正規化係
数として、この値を用いて各パルスの振幅を正規化した
後に、量子化、符号化下る方法が考えられる。
ら、音源パルス列の振幅及び位置を入力し、こわらを後
述の正規化係数を用いて符号化する。また正規化係数に
も符号化を施し、正規化係数、17(源パルス列の振幅
、位置を表わ丁符号を、マルチプレクサ450へ出力す
る。また、音源パルス列の4bり幅、位置の復号化値P
i’ 、mi’を音源パルス発/1:回路420へ出力
する。ここで符号化pl路470の符号化の方法は種々
考えられる。一つは、パルス列の振幅、位置を別々に符
号化する方法であり、また、一つは、振幅、位置を一諸
にして符号化する方法である。前者の方法について一例
を説明下る。まず、音源パルスの振幅の符号化法さして
は、フレーム内のパルス系列の振幅の最大値を正規化係
数として、この値を用いて各パルスの振幅を正規化した
後に、量子化、符号化下る方法が考えられる。
才た、イ(bの方法としては、振幅の砕率分イ丘を正規
型と仮定して、正規型の場合の最適i<量子化器を用い
る方法が考えられる。こI′V−lこついては、ジェー
・マックス(J・MAX)氏によるアイ・アール・イー
・トランザクションズ・オン・インフォメーション・セ
オリー(IRE ’I’RANSA(3TIONS 0
NINF’ORMATION Tl−IEOI(Y )
の1960年3月号、7〜】2頁に掲載の「クオンタイ
ジンク・フォー・ミニマム・ディストーション」 (QUANTI ZING FORMINIMT7Mρ
l8TORT1ON′)と題した論文(文献3)等に詳
述されているので、ここでは説明を省略下る。次に、パ
ルス位置の符号化についても種々の方法が考えられる。
型と仮定して、正規型の場合の最適i<量子化器を用い
る方法が考えられる。こI′V−lこついては、ジェー
・マックス(J・MAX)氏によるアイ・アール・イー
・トランザクションズ・オン・インフォメーション・セ
オリー(IRE ’I’RANSA(3TIONS 0
NINF’ORMATION Tl−IEOI(Y )
の1960年3月号、7〜】2頁に掲載の「クオンタイ
ジンク・フォー・ミニマム・ディストーション」 (QUANTI ZING FORMINIMT7Mρ
l8TORT1ON′)と題した論文(文献3)等に詳
述されているので、ここでは説明を省略下る。次に、パ
ルス位置の符号化についても種々の方法が考えられる。
例えは、ファクシミリ信号符号化の分野でよく知られて
いるランレングス符号等を用いてもよい。これは符号“
0”またはドの続く長さをあらかじめ定められた符号系
列を用いて表わすものである。また、正規化係数の符号
化には、従来よく知られている対数圧縮符号化等を用い
ることができる。
いるランレングス符号等を用いてもよい。これは符号“
0”またはドの続く長さをあらかじめ定められた符号系
列を用いて表わすものである。また、正規化係数の符号
化には、従来よく知られている対数圧縮符号化等を用い
ることができる。
尚、パルス系列の符号化に関しては、ここで説明した符
号化方法に限らず、衆知の最良の方法を用いることがで
きることは勿論である。
号化方法に限らず、衆知の最良の方法を用いることがで
きることは勿論である。
第5図ζこ戻って、パルス系列発生回路420は入力し
たりi′+ mi’を用いて、I’n i ’の位i(
’&に振幅7□′をもつ音源パルス系列を1フレーム長
Nにわたって計算し、これを駆動信号として、合成フィ
ルタ回路400へ出力する。合成フィルタ回路400は
、Kパラメータ符号化回路200から、Kパラメータ復
号値Ki/を入力する。また、ピッチ符号化回路380
から、ピッチ情報(ピッチ周期復号値Md′及びピッチ
ゲイン復号値β′ )を入力よる。Kパラメータ復号器
1ぐ、′を予測パラメータai(1≦1≦N、)に、衆
知の方法を用いて変換しておく。また、判別回路430
から、判別情報を入力゛グーる1、 1iil述のel
J式が取立する場合には、ピッチ情報はOとする。
たりi′+ mi’を用いて、I’n i ’の位i(
’&に振幅7□′をもつ音源パルス系列を1フレーム長
Nにわたって計算し、これを駆動信号として、合成フィ
ルタ回路400へ出力する。合成フィルタ回路400は
、Kパラメータ符号化回路200から、Kパラメータ復
号値Ki/を入力する。また、ピッチ符号化回路380
から、ピッチ情報(ピッチ周期復号値Md′及びピッチ
ゲイン復号値β′ )を入力よる。Kパラメータ復号器
1ぐ、′を予測パラメータai(1≦1≦N、)に、衆
知の方法を用いて変換しておく。また、判別回路430
から、判別情報を入力゛グーる1、 1iil述のel
J式が取立する場合には、ピッチ情報はOとする。
次に合成フィルタ回路400は、音源パルス発生回路4
20から、1フレ一ム分の駆動音源信号を入力して、こ
の1フレ一ム分の信号に、更に1フレ一ム分、零を付加
し、この2フレームの信号に対する応答信号系列マ(n
)をめる。
20から、1フレ一ム分の駆動音源信号を入力して、こ
の1フレ一ム分の信号に、更に1フレ一ム分、零を付加
し、この2フレームの信号に対する応答信号系列マ(n
)をめる。
次式ζここのことを示す。
−01)
ここで駆動音源信号d (n)は、1≦n≦Nでは、パ
ルス発生回路420から出力されたパルス系列を表わし
、N+1≦n≦2Nでは、全て0の系列を表わす。沫た
、N+1≦n≦2N時刻において、C?])式で用いる
ai、Md、βは現フレーム時刻にめ1こ値を使っても
よいし、次のフレーム時刻でまる値を使ってもよい。0
0式に従ってめたx(n)のうち、第2フレーム日のX
(n)(N+1≦n≦2N)の値が減算器285へ出力
される。
ルス発生回路420から出力されたパルス系列を表わし
、N+1≦n≦2Nでは、全て0の系列を表わす。沫た
、N+1≦n≦2N時刻において、C?])式で用いる
ai、Md、βは現フレーム時刻にめ1こ値を使っても
よいし、次のフレーム時刻でまる値を使ってもよい。0
0式に従ってめたx(n)のうち、第2フレーム日のX
(n)(N+1≦n≦2N)の値が減算器285へ出力
される。
次に、マルチプレクサ450は、杓号化回路470の出
力符号と、ゲート回路460の出力符号とを入力し、こ
れらを組み合わせて、送信側出力端子480から通信路
へ出力する。以上で不発Φ」による首座符号化方式の符
号器側の説明を終えろ1、次に、本発明による音声符号
化方式の受信側について第5図(b)を参照して説明す
る。
力符号と、ゲート回路460の出力符号とを入力し、こ
れらを組み合わせて、送信側出力端子480から通信路
へ出力する。以上で不発Φ」による首座符号化方式の符
号器側の説明を終えろ1、次に、本発明による音声符号
化方式の受信側について第5図(b)を参照して説明す
る。
デマルチプレクサ500は、受信側入力端子490から
、符号を入力する。デマルチプレクサ500は、入力符
号のうち、Kパラメータを表わす符号系列とピッチ情報
を表わす符号系列と、音源パルス列を表わ丁符号系列と
を分離し、Kパラメークを表わす符号系列をにパラメー
タ復号回路520へ出力し、ピッチ情報を表わ丁符号系
列を、ピッチ復号回路510へ出力し、音源パルス列を
表わT符号系列を、音源パルス復号回路530へ出力丁
イ、。■(パラメータ復号回路520及びピッチ復号回
路510は、入力した符号系列を復号し、合、賊フィル
ク1【コ1路550へ出力する。
、符号を入力する。デマルチプレクサ500は、入力符
号のうち、Kパラメータを表わす符号系列とピッチ情報
を表わす符号系列と、音源パルス列を表わ丁符号系列と
を分離し、Kパラメークを表わす符号系列をにパラメー
タ復号回路520へ出力し、ピッチ情報を表わ丁符号系
列を、ピッチ復号回路510へ出力し、音源パルス列を
表わT符号系列を、音源パルス復号回路530へ出力丁
イ、。■(パラメータ復号回路520及びピッチ復号回
路510は、入力した符号系列を復号し、合、賊フィル
ク1【コ1路550へ出力する。
音源パルス復号回路530は、前渡パルス列を表わ工符
号系列を入力し、復号化して暫′源パルス列の振幅、位
置情報としてパルス発生回路540へ出力下る。パルス
発生回路540は、音源パルス列の振幅、位置情報を入
力し、祈源パルス列を411牛させ、これを合成フィル
タ回路550へ出力1−る。
号系列を入力し、復号化して暫′源パルス列の振幅、位
置情報としてパルス発生回路540へ出力下る。パルス
発生回路540は、音源パルス列の振幅、位置情報を入
力し、祈源パルス列を411牛させ、これを合成フィル
タ回路550へ出力1−る。
合成フィルタ回路550は、第4図に示したように、ピ
ッチ予渭1フィルタとスペクI・ル予6(11フイルタ
との、縦続接続ζこなっている。合成フィルタ回路55
0は、ビ、7チ復号回路510、Kパラメータ復号回路
520から、ピッチ情報及びにバラメーtl復号値を入
力する。もしピッチ’IN報があらかじめ定められた符
号であ−)た場合は、スペクトル予測フィルタのみを用
いて(つ才り、ピッチ情報はOとして)信号を再生する
合成フィルタ回路550は、パルス発生回路540の出
力パルス列’c”lfs動源として信号x (n)を再
生し、受信側出力端子560から出力する。以上で本発
明による復号器側の説明を終える。
ッチ予渭1フィルタとスペクI・ル予6(11フイルタ
との、縦続接続ζこなっている。合成フィルタ回路55
0は、ビ、7チ復号回路510、Kパラメータ復号回路
520から、ピッチ情報及びにバラメーtl復号値を入
力する。もしピッチ’IN報があらかじめ定められた符
号であ−)た場合は、スペクトル予測フィルタのみを用
いて(つ才り、ピッチ情報はOとして)信号を再生する
合成フィルタ回路550は、パルス発生回路540の出
力パルス列’c”lfs動源として信号x (n)を再
生し、受信側出力端子560から出力する。以上で本発
明による復号器側の説明を終える。
本発明によりは、音源パルス系列の計算を081式に従
っているので、文献1、の従来方式に見られたよつiこ
、パルスにより合成フィルタを駆動し、再生信号をめ、
原信号との誤差及び2乗誤差をフィードバックしてパル
スを調整するという径路がなく、またその処理をくり返
す必要もないので、演算量を大幅に減ら丁ことか可能で
、艮好な再生音質が得られ、るという大きな効果がある
。史lこ、(旧式の演算をこおいて、ψxh(rnl)
と几1+h(Irnt ml l )(1≦Imz −
mi l≦N)の値は、1アレーン・毎に、前もって計
算しておくことによって、(内式o>t13’iは音源
パルスをめる毎に相関演算を何な′)必νシはなくなり
、更に演算量を減らすことができる占いう効果がある。
っているので、文献1、の従来方式に見られたよつiこ
、パルスにより合成フィルタを駆動し、再生信号をめ、
原信号との誤差及び2乗誤差をフィードバックしてパル
スを調整するという径路がなく、またその処理をくり返
す必要もないので、演算量を大幅に減ら丁ことか可能で
、艮好な再生音質が得られ、るという大きな効果がある
。史lこ、(旧式の演算をこおいて、ψxh(rnl)
と几1+h(Irnt ml l )(1≦Imz −
mi l≦N)の値は、1アレーン・毎に、前もって計
算しておくことによって、(内式o>t13’iは音源
パルスをめる毎に相関演算を何な′)必νシはなくなり
、更に演算量を減らすことができる占いう効果がある。
また、音源パルス列を探索′□4″る他の従来方式と比
べても、本発明fこよる方法は、同一の伝送情報量の場
合に、より良好な品タイを44)ることができるという
効果がある。
べても、本発明fこよる方法は、同一の伝送情報量の場
合に、より良好な品タイを44)ることができるという
効果がある。
また本発明ζこよれは、入力音声信号の周Jυ1性つま
りは音源パルス系列の周期性を利用し、人力信号のピッ
チ構造も含めたスペクトル構造を再現できるパラメータ
を用いて音源パルス系列を計算しており、音源パルス上
で、ピッチ周期だけ離れた音源パルスを予測することか
できるので、従来方式と比較して、同一の特性を得るの
に必要な音源パルス数をきわめて削減できるという効果
がある。
りは音源パルス系列の周期性を利用し、人力信号のピッ
チ構造も含めたスペクトル構造を再現できるパラメータ
を用いて音源パルス系列を計算しており、音源パルス上
で、ピッチ周期だけ離れた音源パルスを予測することか
できるので、従来方式と比較して、同一の特性を得るの
に必要な音源パルス数をきわめて削減できるという効果
がある。
従って伝送情報量の低減にきわめて有効である。
このことは、従来方式と同一の伝送情報量とした場合に
、再生品質が向上するという効果にもなる。
、再生品質が向上するという効果にもなる。
特ζこ、従来方式において問題であったピッチ周波数の
高い女性話者に対しては、1OKbps以下の伝送情報
量でも良好IS再生品質を得ることができる。
高い女性話者に対しては、1OKbps以下の伝送情報
量でも良好IS再生品質を得ることができる。
また本発明によれば、符号器側において、スペクトルパ
ラメータのみを用いて計算し1こ音源パルス列とピッチ
パラメータをも用いて計算した音源パルス列とを比較し
、入力信号をより忠実に再現できるパルス列を伝送し、
これを受信側での再生に用いるS成としているので、入
力音声信号の過渡部で周期性がμいフレームや、ピッチ
パラメータの抽出誤りに起因する劣化を防止″2rにと
ができるという効果がある。尚、より簡便p方法として
、ピッチパラメータのピッチゲインβを用いて判別下る
ような構成とすることも考えられる。例えは、ピッチゲ
インβを計算し几後に、βをあらかじめ定められたしき
い値と比較して、βがしきい値以下であればβを強制的
に0とする。この場合には、スペクトルパラメータのみ
を用いて音源パルスを計算下ることをこなる。このよう
な構成とすること−こよって、音源パルス系列を比較判
別するための判別回路及び前述の09式あるいはQa式
の演算が不要となり、演n量を低減することができる。
ラメータのみを用いて計算し1こ音源パルス列とピッチ
パラメータをも用いて計算した音源パルス列とを比較し
、入力信号をより忠実に再現できるパルス列を伝送し、
これを受信側での再生に用いるS成としているので、入
力音声信号の過渡部で周期性がμいフレームや、ピッチ
パラメータの抽出誤りに起因する劣化を防止″2rにと
ができるという効果がある。尚、より簡便p方法として
、ピッチパラメータのピッチゲインβを用いて判別下る
ような構成とすることも考えられる。例えは、ピッチゲ
インβを計算し几後に、βをあらかじめ定められたしき
い値と比較して、βがしきい値以下であればβを強制的
に0とする。この場合には、スペクトルパラメータのみ
を用いて音源パルスを計算下ることをこなる。このよう
な構成とすること−こよって、音源パルス系列を比較判
別するための判別回路及び前述の09式あるいはQa式
の演算が不要となり、演n量を低減することができる。
また、0〜式に示した音源パルス計算法においては、準
最適なパルスを一つずつ計算していた。この方法におい
ては、次のパルスを計算する際に、これより過去ζこま
った複数個のパルスの振幅を再調整するような方法を用
いることもできる。この方法によれは、各パルスに独立
性が成立しない場合、つまり、各パルスの位置が非常に
接近してまる場合に効果的である。更ζこ、他の音源パ
ルス計算法として、種々のものが考えられる。例えば、
lフレーム内の全てのパルスがまった後に、全てのパル
スの振幅を再調整するような方法を用いることもできる
。
最適なパルスを一つずつ計算していた。この方法におい
ては、次のパルスを計算する際に、これより過去ζこま
った複数個のパルスの振幅を再調整するような方法を用
いることもできる。この方法によれは、各パルスに独立
性が成立しない場合、つまり、各パルスの位置が非常に
接近してまる場合に効果的である。更ζこ、他の音源パ
ルス計算法として、種々のものが考えられる。例えば、
lフレーム内の全てのパルスがまった後に、全てのパル
スの振幅を再調整するような方法を用いることもできる
。
更に、本発明にまれは、フレーム境界での波形の不連続
ζこ起因したフレーム境界近傍での(り生信号の劣化が
ほとんどないという大きな効果がある。
ζこ起因したフレーム境界近傍での(り生信号の劣化が
ほとんどないという大きな効果がある。
この効果は、符号器側)こおいて、現フレームの音源パ
ルス系列を計算する際に、lフレーム過去の音源パルス
系列によって合成フィルタを駆!Ith L、て得られ
た応答信号系列を、現フレームをこすで伸はしてめ、こ
れを入力音声信号系列から域別した結果に対して現フレ
ームの音源パルス系列を計算するというS成にしたこと
ζこ起因している。また、本実施例ではフレーム長を一
定とした場合について説明したが、フレーム長を時間的
に変化させる可変長フレームとしても勿論同様の効果は
得られる。
ルス系列を計算する際に、lフレーム過去の音源パルス
系列によって合成フィルタを駆!Ith L、て得られ
た応答信号系列を、現フレームをこすで伸はしてめ、こ
れを入力音声信号系列から域別した結果に対して現フレ
ームの音源パルス系列を計算するというS成にしたこと
ζこ起因している。また、本実施例ではフレーム長を一
定とした場合について説明したが、フレーム長を時間的
に変化させる可変長フレームとしても勿論同様の効果は
得られる。
また、1フレーム過去の音源パルス系列に由来した応答
信号系列のめ方として、本発明の実施例の構成ζこまれ
ば、応答信号計算回路のフィルタパラメータとしては、
1フレーム過去に入力されたピッチ情報ごにパラメータ
値をその丈ま用いたか、過去のフレームの音源パルスζ
こ由来した応答信号系列を計算する際には、現フレーム
時刻に入力されたピッチ情報とにパラメータ値を用いる
構成としてもよい。
信号系列のめ方として、本発明の実施例の構成ζこまれ
ば、応答信号計算回路のフィルタパラメータとしては、
1フレーム過去に入力されたピッチ情報ごにパラメータ
値をその丈ま用いたか、過去のフレームの音源パルスζ
こ由来した応答信号系列を計算する際には、現フレーム
時刻に入力されたピッチ情報とにパラメータ値を用いる
構成としてもよい。
また、本発明によれは、送信画の合成フィルタ回路40
0において、lフレーム過去の音源パルスに由来した応
答信号系列をめるPiAζこ、判別回路430の判別結
果に従ってピッチ情報を用いるか用いないかを切り換え
ていたが、ピッチ情報は常に0として応答信号系列を計
算するような構成としてもよい。
0において、lフレーム過去の音源パルスに由来した応
答信号系列をめるPiAζこ、判別回路430の判別結
果に従ってピッチ情報を用いるか用いないかを切り換え
ていたが、ピッチ情報は常に0として応答信号系列を計
算するような構成としてもよい。
また、符号器側において、合成フィルタ回路4oOにて
過去のフレームの音源パルスに由来した応答信号系列を
計算する場合に、Kパラメータのみを用いて計算した応
答信号系列と、Kパラメータとピッチ情報とを用いて計
算した応答信号系列との2種の応答信号系列を計算して
おき、次のフレームで、どちらの応答信号系列を用いた
方がよいが、例えば入力信号と各々の応答信号系列との
事み伺けされた誤差のパワーを計算し、この誤差パワー
の小さい方を選択するという構成にすれば、!r、テ性
はより改善される。但し、このような構成とした場合に
は、復号器側で2種の応答信号系列のうち1種を選択す
るために必要な選択情報を、フレーム毎に1ビット余分
に伝送しなくではならない。
過去のフレームの音源パルスに由来した応答信号系列を
計算する場合に、Kパラメータのみを用いて計算した応
答信号系列と、Kパラメータとピッチ情報とを用いて計
算した応答信号系列との2種の応答信号系列を計算して
おき、次のフレームで、どちらの応答信号系列を用いた
方がよいが、例えば入力信号と各々の応答信号系列との
事み伺けされた誤差のパワーを計算し、この誤差パワー
の小さい方を選択するという構成にすれば、!r、テ性
はより改善される。但し、このような構成とした場合に
は、復号器側で2種の応答信号系列のうち1種を選択す
るために必要な選択情報を、フレーム毎に1ビット余分
に伝送しなくではならない。
この場合の伝送情報量の増加は、フレーム長を20m5
I!lcとすると、50ビット/秒となり、非常に少な
い量で済む。
I!lcとすると、50ビット/秒となり、非常に少な
い量で済む。
また、本発明の実施例の構成によれは、送信側の重み付
は回路410において、従来方式に用いられている(3
)式に従った爪み付けを行なった。この重み付けはスペ
クトル包絡に関する爪み付けであり、ピッチ構造を利用
した重み付けは含まれていない。従って、次式に示すス
ペクトル包絡とピッチ構造の両方を利用した重み付は関
数Wp (n)を用いることによって、より効果的な重
み付けかされ、1=1 −(財) ここでWp (z)は、重み付は関数wp(nlの Z
変換表現であり、r及びr′は重み付は係数であり、・
0<r * r’ <1の値が選ばれる3゜また本発明
によれは、符号器側の判別回路430において、2楓の
音源パルス列のうち、どちらのパルス列を用いれは特性
が良好かを判別下る場合に、0!1、(イ)式でめた重
み付けられた誤差信号のパワーを判断の基準にした。判
断基準としては、他の最良な方法を用いることができる
。例えは、ピッチ予測を行なった場合の予測ゲインを計
算し、それらの値とあらかじめ定められたしきい値とを
比較して判断基準とするような構成にしてもよい。
は回路410において、従来方式に用いられている(3
)式に従った爪み付けを行なった。この重み付けはスペ
クトル包絡に関する爪み付けであり、ピッチ構造を利用
した重み付けは含まれていない。従って、次式に示すス
ペクトル包絡とピッチ構造の両方を利用した重み付は関
数Wp (n)を用いることによって、より効果的な重
み付けかされ、1=1 −(財) ここでWp (z)は、重み付は関数wp(nlの Z
変換表現であり、r及びr′は重み付は係数であり、・
0<r * r’ <1の値が選ばれる3゜また本発明
によれは、符号器側の判別回路430において、2楓の
音源パルス列のうち、どちらのパルス列を用いれは特性
が良好かを判別下る場合に、0!1、(イ)式でめた重
み付けられた誤差信号のパワーを判断の基準にした。判
断基準としては、他の最良な方法を用いることができる
。例えは、ピッチ予測を行なった場合の予測ゲインを計
算し、それらの値とあらかじめ定められたしきい値とを
比較して判断基準とするような構成にしてもよい。
才た本発明においては、短時間スペクトル構造を表わT
インパルス応答系列の自己相関々数列を計算下る際に、
インパルス応答計算回路210によって、Kパラメータ
復号値及びピッチ情報とを用いて、インパルス応答系列
を計算したのちに、このインパルス応答系列を用いて自
己相関々数列を計算していた。ディジタル信号処理の分
野でよく知られているように、インパルス応答系列の自
己相関々数列は、短時間スペクトルのパワスペクトルと
対応関係にある。従って、Kバラメーク復号値及びピッ
チ情報を用いて、短時間スペクトルのパワスペクトルを
め自己を目間々数列を計37.Tるようなりt厄として
もよい。−万、音声信号系列と短時間スペクトル包絡を
表イっ丁インパルス応答系列との相互相関々数列を計算
する際C乙不実施例の構成で(ま、社み付は回路410
の出力値である信号系列xwωンと、インパルス応答計
算回路210でめたインパルス応答系列とを用いて、相
互を目間関数計算回路350にて相互イ″目関々数を計
算していた。よく知られているように、1″H互相関々
数は、クロス・パワスペクトルと対応関係にある。この
関係を用いて音声信号系列とにバラメーク復号値及びピ
ッチ′隋報とを用いてクロス・パワスペクトルをめて相
互イ゛目関々数列を計nするような構成としてもよい。
インパルス応答系列の自己相関々数列を計算下る際に、
インパルス応答計算回路210によって、Kパラメータ
復号値及びピッチ情報とを用いて、インパルス応答系列
を計算したのちに、このインパルス応答系列を用いて自
己相関々数列を計算していた。ディジタル信号処理の分
野でよく知られているように、インパルス応答系列の自
己相関々数列は、短時間スペクトルのパワスペクトルと
対応関係にある。従って、Kバラメーク復号値及びピッ
チ情報を用いて、短時間スペクトルのパワスペクトルを
め自己を目間々数列を計37.Tるようなりt厄として
もよい。−万、音声信号系列と短時間スペクトル包絡を
表イっ丁インパルス応答系列との相互相関々数列を計算
する際C乙不実施例の構成で(ま、社み付は回路410
の出力値である信号系列xwωンと、インパルス応答計
算回路210でめたインパルス応答系列とを用いて、相
互を目間関数計算回路350にて相互イ″目関々数を計
算していた。よく知られているように、1″H互相関々
数は、クロス・パワスペクトルと対応関係にある。この
関係を用いて音声信号系列とにバラメーク復号値及びピ
ッチ′隋報とを用いてクロス・パワスペクトルをめて相
互イ゛目関々数列を計nするような構成としてもよい。
尚、パワスペクトルと自己(目間々数列との対応関係、
及びクロス・パワスペクトルと相互相関4数列との対応
関係については、ニー・ブイ・オッペンハイム(A 、
V 、 OPPENi−IEiM )氏らによる。「
ディジタル信+jF処理」じDiG]TALSIGNA
L PH,0OESSING″)と題した単11本(文
:猷4)のp84にて詳細に説明されているので、ここ
では説明を省略する。
及びクロス・パワスペクトルと相互相関4数列との対応
関係については、ニー・ブイ・オッペンハイム(A 、
V 、 OPPENi−IEiM )氏らによる。「
ディジタル信+jF処理」じDiG]TALSIGNA
L PH,0OESSING″)と題した単11本(文
:猷4)のp84にて詳細に説明されているので、ここ
では説明を省略する。
韮た、前述の本発明の実施例に3いては、1フレーム内
の1を源パルス系列の符号化は、パルス糸列が全てまっ
1こ後ζこ、第5図の符号化回路470ζこまって符号
化を施したが、符号化をパルス系列の計算に含めて、パ
ルスを1つ計算下る毎に、符号化を竹ない、次のパルス
を計算するという構成lこしてもよい。このようf、K
F? W、fとることによって、符号化の歪をも含め
た誤差を最小とするようなパルス系列がまるので、更に
品質を向」ニさせることができる。
の1を源パルス系列の符号化は、パルス糸列が全てまっ
1こ後ζこ、第5図の符号化回路470ζこまって符号
化を施したが、符号化をパルス系列の計算に含めて、パ
ルスを1つ計算下る毎に、符号化を竹ない、次のパルス
を計算するという構成lこしてもよい。このようf、K
F? W、fとることによって、符号化の歪をも含め
た誤差を最小とするようなパルス系列がまるので、更に
品質を向」ニさせることができる。
また、符号化回路470tこおける符号割り当てζこ関
しては、本発明の構成では等長符号側り当て4つも可変
長符号割り当てを行なった方が符号化効率がかなり向上
する。なぜならば、ピッチ情報を用いて音源パルス列を
めることζこよって、音源パルス列の振幅分布により一
層のかたよりが生ずるためである。
しては、本発明の構成では等長符号側り当て4つも可変
長符号割り当てを行なった方が符号化効率がかなり向上
する。なぜならば、ピッチ情報を用いて音源パルス列を
めることζこよって、音源パルス列の振幅分布により一
層のかたよりが生ずるためである。
また、以上説明した実施例においては、短時間音声信号
系列のスペクトル包絡7i−表わすパラメータとしては
にパラメータを用いたが、これはよく知られている他の
パラメータ(例えばJJS Fパラメータ等)を用いて
もよい。更ζこ、前述の(8)弐において重み付は関数
w(n)はなくてもよい〇また、本実施例ζこおいては
、フレーム境界での再生波形の不連続に起因下る品質劣
化を防ぐために、現フレームより1フレーム過去の音源
パルスに由来した応答信号系列を計算し、現フレームθ
)入力音声からこの応答信号を減算した後間こ、駆動音
源パルスを計算したが、第61y目こ示すように、音源
パルス計算に用いるデータとして、パルスを伝送するフ
レームのデータ及びそれよりも渦去のデータを含むよう
な構成にしてもよい。図6で、NT はパルスを伝送す
るフレームを示し、Nは音源パルスを計算下るフレーム
を示す。このような構成とすることによって、1フレー
ム過去の音源パルスに出来した応答信号系列を計算下る
必要がなくなるという効果がある。
系列のスペクトル包絡7i−表わすパラメータとしては
にパラメータを用いたが、これはよく知られている他の
パラメータ(例えばJJS Fパラメータ等)を用いて
もよい。更ζこ、前述の(8)弐において重み付は関数
w(n)はなくてもよい〇また、本実施例ζこおいては
、フレーム境界での再生波形の不連続に起因下る品質劣
化を防ぐために、現フレームより1フレーム過去の音源
パルスに由来した応答信号系列を計算し、現フレームθ
)入力音声からこの応答信号を減算した後間こ、駆動音
源パルスを計算したが、第61y目こ示すように、音源
パルス計算に用いるデータとして、パルスを伝送するフ
レームのデータ及びそれよりも渦去のデータを含むよう
な構成にしてもよい。図6で、NT はパルスを伝送す
るフレームを示し、Nは音源パルスを計算下るフレーム
を示す。このような構成とすることによって、1フレー
ム過去の音源パルスに出来した応答信号系列を計算下る
必要がなくなるという効果がある。
第1図は従来方式の構Pj、を示すブoツク図、第2図
は音源パルス系列の一例を示す図、第3図は入力音声信
号系列の周波数特性と第1図に記載の重み付は回路の周
波数特性の一例を示1−図、第4図は本発明lこよる音
源パルス計算アルゴリズムの説明に用いる合成フィルタ
の一例を示下図、第5図は本発明の構成による音声符号
化方式の一実/1fli例を示すブロック図、第6図は
パルス伝送フレームと音源パルス計算フレームとの位岐
19・1係を説明するための図である。 図1こ2いて、110 、340・・・バッファメモリ
回路、120 、285・・・減算回路、130 、4
00 、550・・・合成フィルタ回路、140 、4
20 、540・・・音源パルスう1′3生回路、15
0・・・誤差最小化回路、180 、280・・・Kパ
ラメータ計算回路、190 、410・・・亜み1τ」
け回路、200・・・Kパラメータ符号化回路、191
°°゛ピツチ予泪リフイルタ、192・・・スペクトル
包絡予1則フィルタ、210・・・インパルス応答計算
回路、350・・・相互相関計算回路、360・・・自
己相関計算回路、370 ゛°°ピッチ分析回路、38
0・・・ピッチ符号化回路、390・・・パルス計算回
路、430川判別回路、440・・・切り換え回路、4
70・・・符号化回路、450・・・マルチプレクサ、
460・・・ゲート回路、500・・°デマルチプレク
サ、510・・・ピッチ復号回路、520・・・Kパラ
メータ復号回路、530・・・音源パルス復号回路をそ
イア、それ示1−0;71 図 72 図 オ 4 図 71−6 図 手続補正書(自発) 1、事件の表示 昭和58年 特許 願第139022
号2、発明の名称 音声符号化方式とその装置3、補正
をする者 事件との関係 出 η((人 東京都港区芝/i、I’1133酢1)シ(423)
日本電気株式会社 代表h 関本忠弘 4、代理人 〒108 東京都港区芝fi1’1137訴8シ; イ
1// 叩′ル5 補正の対象 明細書の発明の詳細な説明の欄 6、補正の内容 (1)明細書第12頁第7行目に「場合を」とあるのを
「場合と」と補正する。 (2)明細書第17頁第20行目に「縦続」とあるのを
「継続」と補正する。 (3)明細書第18頁第9行目に「Nば」とあるのを「
Nは例えば」と補正する。 (4)明細書第20頁第8行目の後に次の文をそう人す
る。 「09式でRxx (O1fd重み付は信号x 、、
(n)の電力を示す。」 (5)明細書第27頁第10行目に「残差」とあるのを
「(相互相関々数からパルスと自己相関々数によってま
る値をパルス毎に減算してめり最終イω」と補正する。 (6)明細書第31頁第15行目にr 01)式が成立
する」とあるのを「第1の音源パルス列を用いる」と補
正する。 ■1人ブr理士 内ハ:1 ′顕
は音源パルス系列の一例を示す図、第3図は入力音声信
号系列の周波数特性と第1図に記載の重み付は回路の周
波数特性の一例を示1−図、第4図は本発明lこよる音
源パルス計算アルゴリズムの説明に用いる合成フィルタ
の一例を示下図、第5図は本発明の構成による音声符号
化方式の一実/1fli例を示すブロック図、第6図は
パルス伝送フレームと音源パルス計算フレームとの位岐
19・1係を説明するための図である。 図1こ2いて、110 、340・・・バッファメモリ
回路、120 、285・・・減算回路、130 、4
00 、550・・・合成フィルタ回路、140 、4
20 、540・・・音源パルスう1′3生回路、15
0・・・誤差最小化回路、180 、280・・・Kパ
ラメータ計算回路、190 、410・・・亜み1τ」
け回路、200・・・Kパラメータ符号化回路、191
°°゛ピツチ予泪リフイルタ、192・・・スペクトル
包絡予1則フィルタ、210・・・インパルス応答計算
回路、350・・・相互相関計算回路、360・・・自
己相関計算回路、370 ゛°°ピッチ分析回路、38
0・・・ピッチ符号化回路、390・・・パルス計算回
路、430川判別回路、440・・・切り換え回路、4
70・・・符号化回路、450・・・マルチプレクサ、
460・・・ゲート回路、500・・°デマルチプレク
サ、510・・・ピッチ復号回路、520・・・Kパラ
メータ復号回路、530・・・音源パルス復号回路をそ
イア、それ示1−0;71 図 72 図 オ 4 図 71−6 図 手続補正書(自発) 1、事件の表示 昭和58年 特許 願第139022
号2、発明の名称 音声符号化方式とその装置3、補正
をする者 事件との関係 出 η((人 東京都港区芝/i、I’1133酢1)シ(423)
日本電気株式会社 代表h 関本忠弘 4、代理人 〒108 東京都港区芝fi1’1137訴8シ; イ
1// 叩′ル5 補正の対象 明細書の発明の詳細な説明の欄 6、補正の内容 (1)明細書第12頁第7行目に「場合を」とあるのを
「場合と」と補正する。 (2)明細書第17頁第20行目に「縦続」とあるのを
「継続」と補正する。 (3)明細書第18頁第9行目に「Nば」とあるのを「
Nは例えば」と補正する。 (4)明細書第20頁第8行目の後に次の文をそう人す
る。 「09式でRxx (O1fd重み付は信号x 、、
(n)の電力を示す。」 (5)明細書第27頁第10行目に「残差」とあるのを
「(相互相関々数からパルスと自己相関々数によってま
る値をパルス毎に減算してめり最終イω」と補正する。 (6)明細書第31頁第15行目にr 01)式が成立
する」とあるのを「第1の音源パルス列を用いる」と補
正する。 ■1人ブr理士 内ハ:1 ′顕
Claims (3)
- (1)送信側では離散的音声信号系列を入力しピッチの
微細構造を含む短時間スペクトルを表イっ丁パラメータ
を抽出して符号化し、前記パラメータをもとに前記短時
間スペクトルに応じたインパルス応答系列の自己相関々
数を計算し、前記音声信号系列と前記インパルス応答系
列とに応じy、=A11互イ11関々数を計算し、前記
自己相関々数と前記オ[1互411関々数とを用いて前
記音声信号系列に苅する駆動音源信号系列をめて符号化
し、前記駆動音源信号系列を表わ丁符号と前記パラメー
タを表わ1〜符号とを組み合わせて出力し、受信側では
前記符号系列を入力し前記駆動音源信号系列を表わす符
号系列と前記ピッチの微細構造を含む短時間スペクトル
を表わ丁パラメータの符号系列とを分離して復号し、前
記復号化された駆動音源信号系列と前記復号されたパラ
メータとを用いて前記音声信号系列を再生するようにし
たことを特徴とする音声符号化方式。 - (2)離散的音声信号系列を入力し前記音声信号系列か
らピッチの微細構造を表わすピッチパラメータと短時間
スペクトル包絡を表わ丁スペクトルパラメータdを抽出
し符号化するパラメータ計算回路と、前記パラメータ計
算回路の出力系列を入力し前記音声信号系列のピッチ構
造を含んだ短時間スペクトルζこ応じたインパルス応答
系列の自己相関々数を計算する自己相関々数計算回路と
、前記音声信号系列と前記パラメータ計算回路の出力系
列を入力し前記音声信号系列と前記短時間スペクトルに
応じたインパルス応答系列とで表わされる4目互相関々
数を計算する相互相関々数計算回路と、前記自己相関々
数計算回路の出力系列と前記相互相関々数計算回路の出
力系列とを入力し前記賃声信号系列に対する駆動音源信
号系列をめて符号化する駆動音源信号系列計算回路と、
前記バラメーク計算回路の出力符号系列と前記駆動音諒
信号系列計算回路の出力符号系列とを組み合わせて出力
するマルチプレクサ回路とを有することを特徴と下る音
声符号化装置。 - (3)送信側ζこおいて離散的音声信号系列を入力しピ
ッチの微細構造を含む短時間スペクトルを表わすピッチ
パラメータと短時間スペトル包絡を表わ丁スペクトルパ
ラメータを抽出して符号化し、前記ピッチパラメータと
スペクトルパラメータをもとに前記短時間スペクトルに
応じたインパルス応答系列の自己相関々数を計算し、前
記音声信号系列と前記インパルス応答系列とに応じ7:
411互相関関数を計算し、前記自己相関々数と前記
和互関々数とを用いて前記音声信号系列に対する駆動音
源信号系列をめて符号化し、前記駆動付源信号系列を表
わす符号と前記ピッチパラメータを表わす符号と、前記
スペクトルパラメータを表わ丁符号とを組合せることに
より得られる符号系列が人力さ孔、前記音声信号系列を
復号化する政声復号化装匝であって、前記厘合わせるこ
とにより得られる符号系列が入力され前記駆#I音源信
号系列7i−表わ丁符号系列と前記ピッチパラメータを
表わ丁符号系列と前記スペクトルパラメータを表わ丁符
号系列とを分離するデマルチプレクサ回路と、分離して
得られた前記駆動音源信号系列を表わす符号系列を入力
して復号する駆動音源復号回路と、分離して得られた前
記ピッチパラメータを表わす符号系列と前記スペクトル
パラメータを表わ丁符号系列とを入力し復号′g′ろパ
ラメータ復号回路と、前記駆動音源復号回路の出力系列
上前記パラメータ復号回路の出力とを用いて音声信号系
列を再生し出力下る合成フィルタ回路とを有することを
特徴とする音声復号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58139022A JPS6051900A (ja) | 1983-07-29 | 1983-07-29 | 音声符号化方法及びその装置並びに音声符号化復号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58139022A JPS6051900A (ja) | 1983-07-29 | 1983-07-29 | 音声符号化方法及びその装置並びに音声符号化復号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6051900A true JPS6051900A (ja) | 1985-03-23 |
JPH0481199B2 JPH0481199B2 (ja) | 1992-12-22 |
Family
ID=15235643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58139022A Granted JPS6051900A (ja) | 1983-07-29 | 1983-07-29 | 音声符号化方法及びその装置並びに音声符号化復号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6051900A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61236599A (ja) * | 1985-04-12 | 1986-10-21 | 日本電気株式会社 | 音声信号符号化復号化方法とその装置 |
JPH0279923U (ja) * | 1988-12-09 | 1990-06-20 | ||
JPH07250862A (ja) * | 1994-11-28 | 1995-10-03 | Sony Corp | レーザープローブ |
-
1983
- 1983-07-29 JP JP58139022A patent/JPS6051900A/ja active Granted
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61236599A (ja) * | 1985-04-12 | 1986-10-21 | 日本電気株式会社 | 音声信号符号化復号化方法とその装置 |
JPH0279923U (ja) * | 1988-12-09 | 1990-06-20 | ||
JPH07250862A (ja) * | 1994-11-28 | 1995-10-03 | Sony Corp | レーザープローブ |
Also Published As
Publication number | Publication date |
---|---|
JPH0481199B2 (ja) | 1992-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5778335A (en) | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding | |
RU2469422C2 (ru) | Способ и устройство для формирования уровня улучшения в системе кодирования звука | |
US4821324A (en) | Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate | |
JPH0353300A (ja) | 音声符号化装置 | |
JPS6156400A (ja) | 音声処理装置 | |
JP2002202799A (ja) | 音声符号変換装置 | |
US5295224A (en) | Linear prediction speech coding with high-frequency preemphasis | |
JPH10187196A (ja) | 低ビットレートピッチ遅れコーダ | |
JPH01155400A (ja) | 音声符号化方式 | |
JP3357795B2 (ja) | 音声符号化方法および装置 | |
US7302385B2 (en) | Speech restoration system and method for concealing packet losses | |
Almeida et al. | Harmonic coding: A low bit-rate, good-quality speech coding technique | |
JPS6051900A (ja) | 音声符号化方法及びその装置並びに音声符号化復号化装置 | |
CA2347265A1 (en) | Speech coder and speech decoder | |
JP2968109B2 (ja) | コード励振線形予測符号化器及び復号化器 | |
JP2900431B2 (ja) | 音声信号符号化装置 | |
JP3047761B2 (ja) | 音声符号化装置 | |
JP3006790B2 (ja) | 音声符号化復号化方法及びその装置 | |
JPH058839B2 (ja) | ||
JP3063087B2 (ja) | 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置 | |
JPS58188000A (ja) | 音声認識合成装置 | |
JP3350340B2 (ja) | 音声符号化方法および音声復号化方法 | |
JPH043878B2 (ja) | ||
JPS59116794A (ja) | 音声符号化・復号化装置 | |
JPS6163900A (ja) | 音声符号化方法とその装置 |