JPH03243999A - 音声符号化装置 - Google Patents
音声符号化装置Info
- Publication number
- JPH03243999A JPH03243999A JP2042956A JP4295690A JPH03243999A JP H03243999 A JPH03243999 A JP H03243999A JP 2042956 A JP2042956 A JP 2042956A JP 4295690 A JP4295690 A JP 4295690A JP H03243999 A JPH03243999 A JP H03243999A
- Authority
- JP
- Japan
- Prior art keywords
- codebook
- signal
- signals
- gain
- sound source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims description 40
- 230000005236 sound signal Effects 0.000 claims description 31
- 230000003595 spectral effect Effects 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 abstract description 34
- 238000013139 quantization Methods 0.000 abstract description 20
- 230000008878 coupling Effects 0.000 abstract 2
- 238000010168 coupling process Methods 0.000 abstract 2
- 238000005859 coupling reaction Methods 0.000 abstract 2
- 230000003044 adaptive effect Effects 0.000 description 26
- 230000015572 biosynthetic process Effects 0.000 description 14
- 238000003786 synthesis reaction Methods 0.000 description 14
- 230000004044 response Effects 0.000 description 13
- 238000012549 training Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 5
- 238000005311 autocorrelation function Methods 0.000 description 5
- 238000005314 correlation function Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000007774 longterm Effects 0.000 description 5
- 238000005457 optimization Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 102220007331 rs111033633 Human genes 0.000 description 1
- 102220042509 rs112033303 Human genes 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
Abstract
め要約のデータは記録されません。
Description
8kb/s程度で高品質に符号化するための音声符号化
方式に関する。
で符号化する方式としては、例えば、M、 5chro
ederand B、 Ata1氏による”Code−
excited 1inear predic−tio
n: High quality 5peech at
very low bit rates” (Pro
c。
)と題した論文(文献1)等に記載されているCELP
(Code Excited LPCCoding)が
知られている。この方法では、送信側では、フレード毎
(例えば20m5)に音声信号から音声信号のスペクト
ル特性を表すスペクトルパラメータを抽出し、フレーム
をさらに小区間サブフレーム(例えば5m5)に分割し
、サブフレーム毎に過去の音源信号をもとに長時間相関
(ヒツチ相関)を表すピンチパラメータを抽出し、ピッ
チパラメータにより前記サブフレームの音声信号を長期
予測し、長期予測して求めた残差信号に対して、予め定
められた種類の雑音信号からなるコードブックから選択
した信号により合成した信号と、前記音声信号との誤差
電力を最小化するように一種類の雑音信号を選択すると
ともに、最適なゲインを計算する。そして選択された雑
音信号の種類を表すインデクスとゲインならびに、前記
スペクトルパラメータとピッチパラメータを伝送する。
一般に、雑音信号から構成されるコードブックのビット
サイズを10ビット以上にきわめて大きくする必要があ
るため、コードブックを探索して最適な雑音信号(コー
ドワード)を求めるために膨大な演算量が必要であると
いう問題点があった。さらに、コードブックが基本的に
雑音信号から構成されるために、コードブックから選択
された音源信号により再生された再生音声の音質は雑音
感がともなうという問題点があった。
い演算量及びメモリ量により、8〜4.8kb/s程度
で音質の良好な音声符号化方式を提供することにある。
信号を予め定められた時間長のフレームに分割し、前記
音声信号のスペクトル包絡を表すスペクトルパラメータ
を求めて出力し、前記フレームを予め定められた時間長
の小区間に分割し、過去の音源信号をもとに再生した信
号が前記音声信号に近くなるようにピッチパラメータを
求め、前記音声信号をもとに学習して構成した信号が格
納された第1のコードブックと、予め定められた特性を
有する信号が格納された第2のコードブックとを有し、
前記第1のコードブックから選択した信号と、前記第2
のコードブックから選択した信号との線形結合により前
記音声信号の音源信号を表し、予め構成した第3のコー
ドブックを用いて前記ピンチパラメータと前記音源信号
の少なくとも一方のゲインを量子化して出力することを
特徴とする。
な音声信号を予め定められた時間長のフレームに分割し
、前記音声信号のスペクトル包絡を表すスペクトルパラ
メータを求めて出力し、前記フレームを予め定められた
時間長の小区間に分割し、過去の音源信号をもとに再生
した信号が前記音声信号に近くなるようにピンチパラメ
ータの遅延量を求め、予め構成したコードブックを用い
て前記ピンチパラメータのゲインを量子化として出力し
、前記音声信号をもとに学習して構成した信号が格納さ
れた第1のコードブックと、予め定められた特性を有す
る信号が格納された第2のフードブックとを有し、前記
第1のコードブックから選択した信号と、前記第2のコ
ードブックから選択した信号との線形結合により前記音
声信号の音源信号を表し、予め構成した第3のコードブ
ックを用いて前記音源信号のゲインを量子化して出力す
ることを特徴とする。
、下式を最小化するように音源信号を求める。
応コードブック)のピッチパラメータ、すなわちゲイン
及び遅延であり、v(n)は過去の音源信号である。
フィルタのインパルス応答、w(n)は聴感重み付はフ
ィルタのインパルス応答を示す。記号中は畳み込み演算
を示す。なお、w(n)の詳細については前記文献1を
参照できる。
を示し、下式のように、第1のコードブックから選択さ
れたコードワードc1(n)と第2のコードブックから
選択されたコードワードc2(n)との線形結合で表さ
れる。
c21(n) (2)1=1 ここでγ1、γ2は選択されたコードワードc1j(n
)、c21(n)のゲインを示す。従って、本発明では
、2種類のコードブックに分解して音源信号が表される
ことになるため、各コードブックはコードブック全体の
ビット数の1/2でよい。例えばコードブック全体のビ
ット数を10ビツトとすると、第1.2のコードブック
は5ビツトずつでよく、コードブック探索の演算量を大
幅に低減できる。
ックを用いると、(2)式のように分割すると、特性的
には10ビット分のコードブックよりも劣化し全体で7
〜8ビット分の性能しか出せない。
ドブックはトレーニングデータを用いてあらかじめ学習
させることにより構成する。学習によるコードブックの
構成法としては、例えば、Linde ら に
よ る”An Algorithm for Ve
ctorQuantization Design”と
題した論文(IEEE Trans。
献2)等が知られている。
リッド距離)が用いられるが、本方法では2乗距離より
も性能の良好な次式による聴感重み付は距離尺度用いる
。
(n)はクラスタ1のコードワードである。クラスタ1
のセントロイド(代表コードワード)は、クラスタ1内
のトレーニングデータを用いて(4)式あるいは(5)
式を最小化するように求める。
ーニングデータ依存性を救済するために、前記文献1の
ガウス性雑音信号のようなあらかじめ統計的特性が頼定
した雑音信号あるいは乱数信号からなるコードブックや
、他の特性を有するコードブックを使用する。なお、雑
音コードブックに対して、ある距離尺度のもとて選別を
行うことにより、さらに特性が改善される。詳細はT、
Moriya氏らによる“Transform Co
ding of 5peech using aWei
ghted Vector Quantizer、”と
題した論文(IEEE J。
425−431.19羽年)。
なコードワードを選択した後に、第1、第2のコードブ
ックのゲインγ1、γ2を、あらかじめ学習により構成
したコードブック(第3のコードブック)を用いて効率
的にベクトル量子化する。ベクトル量子化において、最
適コードワードの探索は、次式を最小化するコードワー
ドを選択する。
たゲインの値である。またci(n)は、第1、第2の
コードブックから選択されたコードワードである。(6
)式において ew(n)=x(n)−w(n)−13v(n−M)−
h(n)−w(n) (7)とすると、(6)、
(7)式から次式を得る。
n)+2γ2′Σew(n)8w2(n)−γ1″Σ5
w12(n)−γ2″Σsw2”(n) −2γ1′γ
2′Σsw1(n)8w2(n)] (8)ここで 5w1(n)=c1(n)*h(n)中w(n)=Ct
(n)傘hw(n) (9)sW2(
n)=c2(n)申h(n)*w(n)=C2(n)傘
hW(n) (10)である。また、(
8)式の第1項は定数であるから、コードワードの探索
は(8)式の第2項以降を最大化するものを選択すれば
よい。
には、下式に従いコードワードの選択を行ってもよい。
からなるトレーニングデータを用いてあらかじめ学習に
より構成する。コードブックの学習には前期文献2の方
法を用いることができる。ここで学習の際の距離尺度は
通常2乗距離であるが、さらに特性を改善するために、
次式の距離尺度を用いることもできる。
表コードワードである。(12)式の距離尺度を用いる
ときは、クラスタ1におけるセントロイドScHは次式
を最小化するように求める。
常の2乗距離による次式の距離尺度を用いてもよい。
測(適応コードブック)のピッチパラメータにおけるゲ
インを、予め学習により構成したコードブックを用いて
ベクトル量子化することを特徴とする。今ピンチ予測の
次数を1次とすると、ゲインをベクトル量子化するには
、ピッチパラメータの遅延量Mを決定した後で、次式を
最小化するコードワードを選択する。
)*w(n)]2 (15)コードブックの学習
の際の距離尺度は次式を用いる。
n−M)本h(n))傘w(n)]2(16) =Σ[(i3t 13’1)V(n−M)*h(n)
*w(n)]2(17)ここで13tはコードブックト
レーニング用のゲインデータである。なお、演算量を低
減するためには下式を用いることもできる。
示すブロック図である。
を入力し、1フレ一ム分(例えば20m5)の音声信号
をバッファメモリー10に格納する。
トル特性を表すパラメータとして、LSPパラメータを
前記フレームの音声信号から衆知のLPG分析を行いあ
らかじめ定められた次数りだけ計算する。この具体的な
計算法については前記文献6を参照することができる。
め定められた量子化ビット数で量子化し、得た符号1k
をマルチプレケクサ260へ出力するとともに、これを
復号化してさらに線形予測係数ai’(i = 1−L
)に変換して重み付は回路200、インパルス応答計算
回路170、合成フィルタ281へ出力する。LSPパ
ラメータの複合化、LSPパラメータから線形予測係数
への変換の方法についてはSugamura氏らによる
”Quantizer Design in LSP
5peechAnalysis−8ynthesis”
と題した論文(IEEE J、 Sel。
40.1988年)(文献4)等を参照することができ
る。
サブフレームに分割する。ここで例えばフレーム長は2
0m5、サブフレーム長は5msとする。
ら合成フィルタ281の出力を減算して出力する。
感重み付けを行う。聴感重み付は関数の詳細は前記文献
1を参照できる。
信号v(n)を遅延回路206を介して入力し、さらに
インパルス応答出力回路170から重み付はインパルス
応答hw(n)、重み付は回路200から重み付は信号
を入力し、長期相関にもとづくピッチ予測を行い、ピッ
チパラメータとして遅延Mとゲインpを計算する。以下
の説明では適応コードブックの予測次数は1とするが、
2次以上の高次とすることもできる。1次の適応コード
ブックにおける遅延M、ゲインpの計算法は、Klei
jin氏らによる”Improvedspeech q
uality and efficient vect
or quantization 1nSELP”と題
した論文(ICASSP、 pp、 155−158年
、1988年)(文献5)に記載されているので説明を
省略する。
らかじめ定められた量子化ビット数で量子化復号化し、
ゲインp′を求め、これを用いて次式により予測信号〜
(n)を計算し減算器205に出力する。また遅延Mを
マルチプレクサ260へ出力する。
(19)上式でv(n−M)は合成フ
ィルタ281の入力信号である。hw(n)はインパル
ス応答計算回路170で求めた重み付はインパルス応答
である。
サブフレ一ム分遅延させて適応コードブック210へ出
力する。
定められた量子化ビット数で量子化して符号をマルチプ
レクサ260に出力すると共に、適応コードブック20
0に出力する。
応コードブック210の出力)cw(n)を減算し残差
信号ew(n)を第1のコードブック探索回路230に
出力する。
(20)インパルス応答計算回路170
は、聴感重み付けした合成フィルタのインパルス応答h
w(n)を予め定められたサンプル数りだけ計算する。
ック235を用いて最適なコードワードc1j(n)を
探索する。ここで作用の項に託したように、第1のコー
ドブックは、あらかじめトレーニング信号を用いて学習
しておく。
図を示す。コードワードの探索は下式に従う。
)式をγ1で偏微分して0とおくことにより得た下式を
用いる。
=Σ(Cxj(n)ohw(n))2(22) (23) (24) このとき(21)式は E=Σew(n)2− Gj2/ Cj
(25)となる。ここで(25)式の第1項は定数
であるので、第2項を最大化するようにコードブックの
コードワードc1j(n)を選択し、(22)式からゲ
インγ1を計算する。
3)式の計算を行い、自己相関関数計算回路420は(
24)式の計算を行い、判別回路430は(25)式の
計算を行い、コードワードCj(n)を選択し、それを
表すインデクスを出力する。
は、以下の方法を用いることもできる。
(27)Cj ” 11(0)vj(0)+ 2
写p(i)vj(i) (28)ここで1
l(i)、VJ(1)はそれぞれhw(n)のi次遅れ
の自己相関、コードワードc1j(n)のi次遅れの自
己相関を示す。
をマルチプレクサ260に出力する。また、選択された
コードワードcj(n)を乗算器241に出方する。
を下式により乗じて音源信号q(n)を求め合成フィル
タ250へ出力する。
(29)合成フィルタ250は乗算器241の出力q
(n)を入力し、下式に従い重み付は合成信号yw(n
)を求め出力する。
(30)減算器255は、ew(n)から
yw(n)を減算して第2のコードブック探索回路27
0へ出力する。
ック275から最適なコードワードを計算する。第2の
コードブック探索回路の構成は、第2図に示した第1の
フードブック探索回路の構成と基本的に同一の構成を用
いることができる。また、コードワードの探索法として
は、前記第1のコードブックの探索と同一の方法を用い
ることができる。第2のコードブックの構成法としては
、作用の項で述べたように、学習コードブックの高効率
を保ちながらトレーニングデータ依存性を救済するため
に、乱数系列からなるコードブックを用いる。乱数系列
からなるコードブックの構成法は前記文献1を参照でき
る。
2のコードブックとして、重畳型(overlap)乱
数コードブックを用いることができる。重畳型乱数コー
ドブックの構成法、コードワード探索法については前記
文献5等を参照できる。
め学習により前記(12)、(13)式を用いて作製し
たゲインコードブック287を用いて、ゲインγ1、γ
2をベクトル量子化する。ベクトル量子化の際の最適な
コードワードの選択には、前記(8)式を用いる。第3
図はゲイン量子化器286の構成を示すブロック図であ
る。図において、再生回路505は、cl(n)、c2
(n)、hw(n)を人力して前記(9)、(10)式
にもとづき、5w1(n)、5w2(n)を求める。
10は、ew(n)、5w1(n)、5w2(n)、ゲ
インコードブック287の出力であるコードワードを人
力し、前記(8)式の第2項以下の各項を計算する。最
大値判別回路520は、第(8)式の第2項以下の最大
値を判別し、そのときのゲインコードワードのコードワ
ードを示すインデクスを出力する。ゲイン復号回路53
0は前記インデクスを用いてゲインを復号化して出力す
る。そしてコードブックのインブクスをマルチプレクサ
260に出力する。またゲインの復号化値γ1′、γ2
゛を乗算器242に出力する。
されたコードワードc1j(n)、c2i(n)に対し
てそれぞれ量子化復号化したゲインγ1′、γ2′を乗
じて合成フィルタ281に出力する。
人力し、下式により合成音声を1フレーム分求め、さら
にもう1フレ一ム分はOの系列をフィルタに人力して応
答信号系列を求め、1フレ一ム分の応答信号系列を減算
器190に出力する。
) (31)ただし マルチプレクサ260は、LSP量子化器140、第1
のコードブック探索回路230、第2のコードブック探
索回路270、ゲイン量子化器286の出力符号系列を
組みあわせて出力する。
る。図において、第1図と同一の番号を付した構成要素
は、第1図と同一の動作を行うので説明は省略する。
づき予め学習して構成したコードブック226を用いて
、適応コードブックのゲインをベクトル量子化する。最
適なコードワードのインデクスを示す符号をマルチプレ
クサ260へ出力すると共に、ゲインを量子化復号化し
て出力する。
第2のコードブックのゲインをまとめてベクトル量子化
することもできる。
2のコードブックのゲインには同時最適化を施さなかっ
たが、適応コードブック、第1のコードブック、第2の
コードブックのゲインについて、同時最適化を行い、さ
らに特性を改善する。この同時最適化は、作用の項で述
べたように、第1.2のコードブックのコードワードを
求めるときに適用するとさらに特性が改善される。
に、第1のコードブックのコードワードc1j(n)、
ゲインγ1を探索するときに、各コードワード毎に、次
式を最小化するように解いてpとγ、を同時最適化する
。
(v(n −M)*hw(n))(clj(n)*hw
(n))R22=Σ包1j(n)*hw(n))2P1
=Σxw(nXv(n−M)−hw(n))p2=ΣX
W(n)(C1j (n)*hw(n))(35a) (35b) (35c) (35d) (35e) 次に、第2のコードワードを決定するときに、次式を最
小化するように適応コードブックのゲイン、第1、第2
のコードブックのゲインを同時最適化する。
]2 (36)なお、演算量の低減化
のために、第1のコードブックのコードワード探索のと
きに(33)式によるゲイン最適化を行い、第2のコー
ドブックの探索のときには行わない構成とすることもで
きる。
のコードワードの探索のときにはゲインの最適化を行わ
ずに、第1のコードブックのコードワードが選択された
ときに、適応コードブックと第1のコードブックのゲイ
ンの同時最適化を行い、第2のコードブックのコードワ
ードが選択されたときには、適応コードブックと第1.
2のコードブックのゲインを同時に最適化する構成を用
いることもできる。
コードブックのコードワードが選択された後に、適応コ
ードブックのゲインpと、第1、第2のコードブックの
一ゲインγ1、γ2の3種を同時に最適化するような構
成とすることもできる。
ブックのゲインγ0、γ2のベクトル量子化における最
適コードワードの選択には、演算量低減化のためにそれ
ぞれ前記(18)式、(11)式を用いることもできる
。
ブックのゲインのベクトル量子化において、第3のコー
ドブックをゲインの絶対値に対して学習してあらかじめ
求めておき、ベクトル量子化のときはゲインの絶対値を
量子化し、符号は別に伝送するような構成としてもよい
。
法は実施例の方法以外にも他の衆知な方法を用いること
ができる。例えば、前記文献1に記載の方法や、あらか
じめコードブックの各コードワードc1j(n)の直交
変換c1(k)を求めて格納しておき、サブフレーム毎
に、前記重み付はインパルス応答hw(n)の直交変換
Hw(k)と、残差信号ew(n)の直交変換Ew(k
)を予め定められた点数だけ求め、前記(23)、(2
4)式の代わりに下式を用いてもよい。
(o≦に≦N−1) (37)CJ (k)=(C1
j(k)Hw(k))2(0≦に≦N−1) (38)
そして(37)、(38)式を逆直交変換して、相互相
関関数Gj、自己相関関数Cjを計算し、前記(25)
、(22)式に従いコードワードの探索、ゲインの計算
をするような構成としてもよい。このとき、直交変換と
しては、フーリエ変換、あるいはFFT、コサイン変換
などを用いることができる。この方法によれば、(23
)、(24)式の畳み込み演算を周波数軸上で乗算に帰
着できるので演算量を低減することができる。
例の方法以外にも上記で示した方法や、前記文献5に記
載の方法や、他の衆知な良好な方法を用いることができ
る。
例に記載した方法以外に、例えば予め膨大な乱数系列を
コードブックとして用意して、それらを用いてトレーニ
ングデータに対して乱数系列の探索を行い、選択される
頻度が高いものからコードワードとして登録して第2の
コードブックを構成することもできる。なお、この構成
法は、第1のコードブックの構成にも適用することがで
きる。
1、第2のコードブックのゲインは別々にベクトル量子
化したが、3種のゲインp、γ1、γ2をまとめてベク
トル量子化するような構成をとることもできる。学習に
よるベクトル量子化器のコードブックの作成は前記文献
2を参照できる。
としたが、2次以上の高次とすることもできる。また、
次数は1次のままで遅延を整数値ではなく小数値とする
こともできる。これらについての詳細は、例えばMar
que氏らによる“?1tchPrediction
with Fractional Delays in
CELP Coding”と題した論文(EURO8
PEECH,pp、 509−513.1989年)(
文献6)等を参照できる。以上のようにした方が特性は
向上するが、ゲインあるいは遅延の伝送に必要な情報量
が若干増大する。
にパラメータ、LSPパラメータを符号化し、その分析
法としてLPC分析を用いたが、スペクトルパラメータ
としては他の衆知なパラメータ、例えばLPCケプスト
ラム、ケプストラム、改良ケプストラム、−膜化ケプス
トラム、メルケプストラムなどを用いることもできる。
。
測係数上でサブフレーム毎に補間し、補間した係数を用
いて適応コードブック、第1、第2のコードブックの探
索を行う構成としてもよい。このような構成とすること
により、音質がさらに改善される。
、あるいはベクトルースカラ量子化の方法については例
えば前記文献3等を参照できる。
計算を省略することもできる。これによって、送信側に
おける合成フィルタ281、減算器190は不要となり
演算量低減が可能となるが、音質は若干低下する。
サブフレーム分割回路150の前に配置させ、合成フィ
ルタ281では下式により重み付は合成信号を計算する
ようにしてもよい。
(o<γ< 1) (39)ここでγは聴感重み付
けの程度を決める重み付は係数である。
覚的にきき易くするために、ピッチとスペクトル包絡の
少なくとも1つについて動作する適応形ポストフィルタ
を付加してもよい。適応型ポストフィルタの構成につい
ては、例えば、Kroon氏between 4.8
and 16kb/s、”(IEEE JSAC,vo
l、 6.2.353−363、1988X文献7)等
を参照できる。
に、自己相関関数は周波数軸上でパワスペクトルに、相
互相関関数はクロスパワスペクトルに対応しているので
、これらから計算することもできる。これらの計算法に
ついては、Oppenheim氏らによる”Digit
al Signal Processing”(Pre
ntice−Hall、 1975)と題した単行本(
文献8)を参照できる。
ードブックを2段に分離して、1段目はあらかじめ多量
の残差信号によるトレーニン・グ信号に対して学習して
求めたコードブック、2段目は予め定められた統計的特
性を有するコードブックを用い、さらに前記コードブッ
クのゲインやピッチ予測による適応コードブックのゲイ
ンをあらかじめ多量のトレーニング信号に対して学習し
て構成したコードブックを用いてベクトル量子化するこ
とにより、従来方式に比べてより少ない演算量でより良
好な特性を得ることができるという効果がある。また、
コードブックのゲインを最適化することによりさらに特
性が改善される。従って本発明によれば、従来方式に比
べて、8〜4.8kb/sのビットレートで、良好な音
質の符号化再生音声を得ることができるという大きな効
果がある。
示すブロック図、第2図は第1の発明による音声符号化
方式のコードブック探索回路の構成を示すブロック図、
第3図は第1の発明によるゲイン量子化器の構成を示す
ブロック図、第4図は第2の発明による音声符号化方式
の一実施例を示すブロック図である。 図において、110・・・バッファメモリ、130・・
・LPG計算回路、14001.量子化回路、150・
・・サブフレーム分割回路、17000.インパルス応
答計算回路、190.205.255.325・・・減
算器、200・・・重み付は回路、206・・・遅延回
路、210・・・適応コードブック、220・・・量子
化器、286・・・ゲイン量子化器、230・・・第1
のコードブック探索回路、235・・・第1のコードブ
ック、250.281・・・合成フィルタ、230・・
・第2のコードブック探索回路、241.242・・・
乗算器、275・・・第2のコードブック、287・・
・ゲインコードブック、410.500・・・相互相関
関数計算回路、420.510・・・自己相関関数計算
回路、430.520・・・判別回路、530・・・ゲ
イン復号回路を示す。
Claims (2)
- (1)入力した離散的な音声信号を予め定められた時間
長のフレームに分割し、前記音声信号のスペクトル包絡
を表すスペクトルパラメータを求めて出力し、前記フレ
ームを予め定められた時間長の小区間に分割し、過去の
音源信号をもとに再生した信号が前記音声信号に近くな
るようにピッチパラメータを求め、前記音声信号をもと
に学習して構成した信号が格納された第1のコードブッ
クと、予め定められた特性を有する信号が格納された第
2のコードブックとを有し、前記第1のコードブックか
ら選択した信号と、前記第2のコードブックから選択し
た信号との線形結合により前記音声信号の音源信号を表
し、予め構成した第3のコードブックを用いて前記ピッ
チパラメータと前記音源信号の少なくとも一方のゲイン
を量子して出力することを特徴とする音声符号化方式。 - (2)入力した離散的な音声信号を予め定められた時間
長のフレームに分割し、前記音声信号のスペクトル包絡
を表すスペクトルパラメータを求めて出力し、前記フレ
ームを予め定められた時間長の小区間に分割し、過去の
音源信号をもとに再生した信号が前記音声信号に近くな
るようにピッチパラメータの遅延量を求め、予め構成し
たコードブックを用いて前記ピッチパラメータのゲイン
を量子化して出力し、前記音声信号をもとに学習して構
成した信号が格納された第1のコードブックと、予め定
められた特性を有する信号が格納された第2のコードブ
ックとを有し、前記第1のコードブックから選択した信
号と、前記第2のコードブックから選択した信号との線
形結合により前記音声信号の音源信号を表して出力する
ことを特徴とする音声符号化方式。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04295690A JP3256215B2 (ja) | 1990-02-22 | 1990-02-22 | 音声符号化装置 |
DE69133296T DE69133296T2 (de) | 1990-02-22 | 1991-02-20 | Sprachcodierer |
US07/658,473 US5208862A (en) | 1990-02-22 | 1991-02-20 | Speech coder |
EP91102440A EP0443548B1 (en) | 1990-02-22 | 1991-02-20 | Speech coder |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04295690A JP3256215B2 (ja) | 1990-02-22 | 1990-02-22 | 音声符号化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH03243999A true JPH03243999A (ja) | 1991-10-30 |
JP3256215B2 JP3256215B2 (ja) | 2002-02-12 |
Family
ID=12650480
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP04295690A Expired - Lifetime JP3256215B2 (ja) | 1990-02-22 | 1990-02-22 | 音声符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3256215B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0744200A (ja) * | 1993-07-29 | 1995-02-14 | Nec Corp | 音声符号化方式 |
US5487128A (en) * | 1991-02-26 | 1996-01-23 | Nec Corporation | Speech parameter coding method and appparatus |
US5677985A (en) * | 1993-12-10 | 1997-10-14 | Nec Corporation | Speech decoder capable of reproducing well background noise |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6466700A (en) * | 1987-09-08 | 1989-03-13 | Fujitsu Ltd | Vector quantization system |
JPH01233500A (ja) * | 1988-03-08 | 1989-09-19 | Internatl Business Mach Corp <Ibm> | 複数レート音声エンコーデイング方法 |
-
1990
- 1990-02-22 JP JP04295690A patent/JP3256215B2/ja not_active Expired - Lifetime
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6466700A (en) * | 1987-09-08 | 1989-03-13 | Fujitsu Ltd | Vector quantization system |
JPH01233500A (ja) * | 1988-03-08 | 1989-09-19 | Internatl Business Mach Corp <Ibm> | 複数レート音声エンコーデイング方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5487128A (en) * | 1991-02-26 | 1996-01-23 | Nec Corporation | Speech parameter coding method and appparatus |
JPH0744200A (ja) * | 1993-07-29 | 1995-02-14 | Nec Corp | 音声符号化方式 |
US5677985A (en) * | 1993-12-10 | 1997-10-14 | Nec Corporation | Speech decoder capable of reproducing well background noise |
Also Published As
Publication number | Publication date |
---|---|
JP3256215B2 (ja) | 2002-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6510407B1 (en) | Method and apparatus for variable rate coding of speech | |
JP3114197B2 (ja) | 音声パラメータ符号化方法 | |
JP3094908B2 (ja) | 音声符号化装置 | |
JPH09127991A (ja) | 音声符号化方法及び装置、音声復号化方法及び装置 | |
JPH0353300A (ja) | 音声符号化装置 | |
JPH06222797A (ja) | 音声符号化方式 | |
JPH03211599A (ja) | 4.8kbpsの情報伝送速度を有する音声符号化/復号化器 | |
JPH09127990A (ja) | 音声符号化方法及び装置 | |
JP3344962B2 (ja) | オーディオ信号符号化装置、及びオーディオ信号復号化装置 | |
JPH0990995A (ja) | 音声符号化装置 | |
JPH10124092A (ja) | 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置 | |
JPH056199A (ja) | 音声パラメータ符号化方式 | |
JPH05216500A (ja) | 音声符号化装置 | |
JP2002268686A (ja) | 音声符号化装置及び音声復号化装置 | |
JP3095133B2 (ja) | 音響信号符号化方法 | |
JP3531780B2 (ja) | 音声符号化方法および復号化方法 | |
JPH0854898A (ja) | 音声符号化装置 | |
JPH03243999A (ja) | 音声符号化装置 | |
JP3252285B2 (ja) | 音声帯域信号符号化方法 | |
JPH09127987A (ja) | 信号符号化方法及び装置 | |
JP3194930B2 (ja) | 音声符号化装置 | |
JP3153075B2 (ja) | 音声符号化装置 | |
JP2002221998A (ja) | 音響パラメータ符号化、復号化方法、装置及びプログラム、音声符号化、復号化方法、装置及びプログラム | |
JP3092436B2 (ja) | 音声符号化装置 | |
JP3192051B2 (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071130 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081130 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081130 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091130 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091130 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101130 Year of fee payment: 9 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101130 Year of fee payment: 9 |