JPH03243999A - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JPH03243999A
JPH03243999A JP2042956A JP4295690A JPH03243999A JP H03243999 A JPH03243999 A JP H03243999A JP 2042956 A JP2042956 A JP 2042956A JP 4295690 A JP4295690 A JP 4295690A JP H03243999 A JPH03243999 A JP H03243999A
Authority
JP
Japan
Prior art keywords
codebook
signal
signals
gain
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2042956A
Other languages
English (en)
Other versions
JP3256215B2 (ja
Inventor
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP04295690A priority Critical patent/JP3256215B2/ja
Priority to DE69133296T priority patent/DE69133296T2/de
Priority to US07/658,473 priority patent/US5208862A/en
Priority to EP91102440A priority patent/EP0443548B1/en
Publication of JPH03243999A publication Critical patent/JPH03243999A/ja
Application granted granted Critical
Publication of JP3256215B2 publication Critical patent/JP3256215B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、音声信号を低いビットレート、特に8〜4.
8kb/s程度で高品質に符号化するための音声符号化
方式に関する。
(従来の技術) 音声信号を8〜4.8kb/s程度の低いビットレート
で符号化する方式としては、例えば、M、 5chro
ederand B、 Ata1氏による”Code−
excited 1inear predic−tio
n: High quality 5peech at
 very low bit rates” (Pro
c。
ICASSP、 pp、 937−940.1985年
)と題した論文(文献1)等に記載されているCELP
(Code Excited LPCCoding)が
知られている。この方法では、送信側では、フレード毎
(例えば20m5)に音声信号から音声信号のスペクト
ル特性を表すスペクトルパラメータを抽出し、フレーム
をさらに小区間サブフレーム(例えば5m5)に分割し
、サブフレーム毎に過去の音源信号をもとに長時間相関
(ヒツチ相関)を表すピンチパラメータを抽出し、ピッ
チパラメータにより前記サブフレームの音声信号を長期
予測し、長期予測して求めた残差信号に対して、予め定
められた種類の雑音信号からなるコードブックから選択
した信号により合成した信号と、前記音声信号との誤差
電力を最小化するように一種類の雑音信号を選択すると
ともに、最適なゲインを計算する。そして選択された雑
音信号の種類を表すインデクスとゲインならびに、前記
スペクトルパラメータとピッチパラメータを伝送する。
受信側の説明は省略する。
(発明が解決しようとする課題) 上述した文献1の従来方式では、高音質を得るためには
一般に、雑音信号から構成されるコードブックのビット
サイズを10ビット以上にきわめて大きくする必要があ
るため、コードブックを探索して最適な雑音信号(コー
ドワード)を求めるために膨大な演算量が必要であると
いう問題点があった。さらに、コードブックが基本的に
雑音信号から構成されるために、コードブックから選択
された音源信号により再生された再生音声の音質は雑音
感がともなうという問題点があった。
本発明の目的は、上述した問題点を解決し、比較的少な
い演算量及びメモリ量により、8〜4.8kb/s程度
で音質の良好な音声符号化方式を提供することにある。
(課題を解決するための手段) 本発明による音声符号化方式は、人力した離散的な音声
信号を予め定められた時間長のフレームに分割し、前記
音声信号のスペクトル包絡を表すスペクトルパラメータ
を求めて出力し、前記フレームを予め定められた時間長
の小区間に分割し、過去の音源信号をもとに再生した信
号が前記音声信号に近くなるようにピッチパラメータを
求め、前記音声信号をもとに学習して構成した信号が格
納された第1のコードブックと、予め定められた特性を
有する信号が格納された第2のコードブックとを有し、
前記第1のコードブックから選択した信号と、前記第2
のコードブックから選択した信号との線形結合により前
記音声信号の音源信号を表し、予め構成した第3のコー
ドブックを用いて前記ピンチパラメータと前記音源信号
の少なくとも一方のゲインを量子化して出力することを
特徴とする。
また、本発明による音声符号化方式は、入力した離散的
な音声信号を予め定められた時間長のフレームに分割し
、前記音声信号のスペクトル包絡を表すスペクトルパラ
メータを求めて出力し、前記フレームを予め定められた
時間長の小区間に分割し、過去の音源信号をもとに再生
した信号が前記音声信号に近くなるようにピンチパラメ
ータの遅延量を求め、予め構成したコードブックを用い
て前記ピンチパラメータのゲインを量子化として出力し
、前記音声信号をもとに学習して構成した信号が格納さ
れた第1のコードブックと、予め定められた特性を有す
る信号が格納された第2のフードブックとを有し、前記
第1のコードブックから選択した信号と、前記第2のコ
ードブックから選択した信号との線形結合により前記音
声信号の音源信号を表し、予め構成した第3のコードブ
ックを用いて前記音源信号のゲインを量子化して出力す
ることを特徴とする。
(作用) 本発明による音声符号化方式の作用を示す。
第1の発明では、フレームを分割したサブフレーム毎に
、下式を最小化するように音源信号を求める。
ここで43. Mは長期相関にもとづくピンチ予測(適
応コードブック)のピッチパラメータ、すなわちゲイン
及び遅延であり、v(n)は過去の音源信号である。
h(n)はスペクトルパラメータにより構成される合成
フィルタのインパルス応答、w(n)は聴感重み付はフ
ィルタのインパルス応答を示す。記号中は畳み込み演算
を示す。なお、w(n)の詳細については前記文献1を
参照できる。
また、d(n)はコードブックにより表される残差信号
を示し、下式のように、第1のコードブックから選択さ
れたコードワードc1(n)と第2のコードブックから
選択されたコードワードc2(n)との線形結合で表さ
れる。
d(n)=、Σγ1ei(n)=nctj(n)+r2
c21(n)    (2)1=1 ここでγ1、γ2は選択されたコードワードc1j(n
)、c21(n)のゲインを示す。従って、本発明では
、2種類のコードブックに分解して音源信号が表される
ことになるため、各コードブックはコードブック全体の
ビット数の1/2でよい。例えばコードブック全体のビ
ット数を10ビツトとすると、第1.2のコードブック
は5ビツトずつでよく、コードブック探索の演算量を大
幅に低減できる。
各コードブックとして前記文献1のような雑音コードブ
ックを用いると、(2)式のように分割すると、特性的
には10ビット分のコードブックよりも劣化し全体で7
〜8ビット分の性能しか出せない。
そこで、本発明では、高性能を得るために、第1のコー
ドブックはトレーニングデータを用いてあらかじめ学習
させることにより構成する。学習によるコードブックの
構成法としては、例えば、Linde   ら  に 
 よ  る”An Algorithm for Ve
ctorQuantization Design”と
題した論文(IEEE Trans。
C0M−28,pp、 84−95.1980年)(文
献2)等が知られている。
学習のときの距離尺度としては通常、2乗距離(ユーク
リッド距離)が用いられるが、本方法では2乗距離より
も性能の良好な次式による聴感重み付は距離尺度用いる
ここでtj(n)はj番目のトレーニングデータ、cl
(n)はクラスタ1のコードワードである。クラスタ1
のセントロイド(代表コードワード)は、クラスタ1内
のトレーニングデータを用いて(4)式あるいは(5)
式を最小化するように求める。
(5)式においてgは最適ゲインを示す。
第2のコードブックは、第1のコードブックによるトレ
ーニングデータ依存性を救済するために、前記文献1の
ガウス性雑音信号のようなあらかじめ統計的特性が頼定
した雑音信号あるいは乱数信号からなるコードブックや
、他の特性を有するコードブックを使用する。なお、雑
音コードブックに対して、ある距離尺度のもとて選別を
行うことにより、さらに特性が改善される。詳細はT、
 Moriya氏らによる“Transform Co
ding of 5peech using aWei
ghted Vector Quantizer、”と
題した論文(IEEE J。
Se1. Areas、 Commun、、 pp、 
425−431.19羽年)。
(文献3)等を参照することができる。
さらに本発明では、第1、第2のコードブックから最適
なコードワードを選択した後に、第1、第2のコードブ
ックのゲインγ1、γ2を、あらかじめ学習により構成
したコードブック(第3のコードブック)を用いて効率
的にベクトル量子化する。ベクトル量子化において、最
適コードワードの探索は、次式を最小化するコードワー
ドを選択する。
ここでγ′iは各コードワードの示すベクトル量子化し
たゲインの値である。またci(n)は、第1、第2の
コードブックから選択されたコードワードである。(6
)式において ew(n)=x(n)−w(n)−13v(n−M)−
h(n)−w(n)    (7)とすると、(6)、
(7)式から次式を得る。
E=ΣeW(n)2−[2γl’Σew(n)swl(
n)+2γ2′Σew(n)8w2(n)−γ1″Σ5
w12(n)−γ2″Σsw2”(n) −2γ1′γ
2′Σsw1(n)8w2(n)]  (8)ここで 5w1(n)=c1(n)*h(n)中w(n)=Ct
(n)傘hw(n)         (9)sW2(
n)=c2(n)申h(n)*w(n)=C2(n)傘
hW(n)        (10)である。また、(
8)式の第1項は定数であるから、コードワードの探索
は(8)式の第2項以降を最大化するものを選択すれば
よい。
また、コードブック探索の演算量を大幅に低減するため
には、下式に従いコードワードの選択を行ってもよい。
E=写(γi−γ’1j)2(11) ゲインのベクトル量子化用のコードブックは、多量の値
からなるトレーニングデータを用いてあらかじめ学習に
より構成する。コードブックの学習には前期文献2の方
法を用いることができる。ここで学習の際の距離尺度は
通常2乗距離であるが、さらに特性を改善するために、
次式の距離尺度を用いることもできる。
(12) ここでγ、iはトレーニング用のゲインデータである。
γ”11はゲインコードブックのクラスタ1における代
表コードワードである。(12)式の距離尺度を用いる
ときは、クラスタ1におけるセントロイドScHは次式
を最小化するように求める。
一方、学習における演算量を大幅に低減するためには通
常の2乗距離による次式の距離尺度を用いてもよい。
D=夏γ1Scij)2(14) 次に、第2の発明では、第1の発明に加えて、ピッチ予
測(適応コードブック)のピッチパラメータにおけるゲ
インを、予め学習により構成したコードブックを用いて
ベクトル量子化することを特徴とする。今ピンチ予測の
次数を1次とすると、ゲインをベクトル量子化するには
、ピッチパラメータの遅延量Mを決定した後で、次式を
最小化するコードワードを選択する。
E=Σ[(x(n)−13’・V(n−M)−h(n)
)*w(n)]2    (15)コードブックの学習
の際の距離尺度は次式を用いる。
E=Σ[(ptV(n−M)*h(n) −p’IV(
n−M)本h(n))傘w(n)]2(16) =Σ[(i3t  13’1)V(n−M)*h(n)
*w(n)]2(17)ここで13tはコードブックト
レーニング用のゲインデータである。なお、演算量を低
減するためには下式を用いることもできる。
E=(13t 13’t)2(18) (実施例) 第1図は第1の発明による音声符号化方式の一実施例を
示すブロック図である。
図において、送信側では、入力端子100から音声信号
を入力し、1フレ一ム分(例えば20m5)の音声信号
をバッファメモリー10に格納する。
LPC分析回路130は、フレームの音声信号のスペク
トル特性を表すパラメータとして、LSPパラメータを
前記フレームの音声信号から衆知のLPG分析を行いあ
らかじめ定められた次数りだけ計算する。この具体的な
計算法については前記文献6を参照することができる。
次にLSP量子化回路140は、LSPパラメータを予
め定められた量子化ビット数で量子化し、得た符号1k
をマルチプレケクサ260へ出力するとともに、これを
復号化してさらに線形予測係数ai’(i = 1−L
)に変換して重み付は回路200、インパルス応答計算
回路170、合成フィルタ281へ出力する。LSPパ
ラメータの複合化、LSPパラメータから線形予測係数
への変換の方法についてはSugamura氏らによる
”Quantizer Design in LSP 
5peechAnalysis−8ynthesis”
と題した論文(IEEE J、 Sel。
Arees、 Commun、、 pp、 432−4
40.1988年)(文献4)等を参照することができ
る。
サブフレーム分割回路150は、フレームの音声信号を
サブフレームに分割する。ここで例えばフレーム長は2
0m5、サブフレーム長は5msとする。
減算器190は、サブフレームに分割された人力信号か
ら合成フィルタ281の出力を減算して出力する。
重み付は回路200は、減算した信号に対して衆知の聴
感重み付けを行う。聴感重み付は関数の詳細は前記文献
1を参照できる。
適応コードブック210は、合成フィルタ281の人力
信号v(n)を遅延回路206を介して入力し、さらに
インパルス応答出力回路170から重み付はインパルス
応答hw(n)、重み付は回路200から重み付は信号
を入力し、長期相関にもとづくピッチ予測を行い、ピッ
チパラメータとして遅延Mとゲインpを計算する。以下
の説明では適応コードブックの予測次数は1とするが、
2次以上の高次とすることもできる。1次の適応コード
ブックにおける遅延M、ゲインpの計算法は、Klei
jin氏らによる”Improvedspeech q
uality and efficient vect
or quantization 1nSELP”と題
した論文(ICASSP、 pp、 155−158年
、1988年)(文献5)に記載されているので説明を
省略する。
さらに求めたゲインpをゲイン量子化器220によりあ
らかじめ定められた量子化ビット数で量子化復号化し、
ゲインp′を求め、これを用いて次式により予測信号〜
(n)を計算し減算器205に出力する。また遅延Mを
マルチプレクサ260へ出力する。
iw(n)= p’ −v(n −M)ohw(n) 
        (19)上式でv(n−M)は合成フ
ィルタ281の入力信号である。hw(n)はインパル
ス応答計算回路170で求めた重み付はインパルス応答
である。
遅延回路206は、合成フィルタ入力信号v(n)を1
サブフレ一ム分遅延させて適応コードブック210へ出
力する。
量子化器220は、適応コードブックのゲインpを予め
定められた量子化ビット数で量子化して符号をマルチプ
レクサ260に出力すると共に、適応コードブック20
0に出力する。
減算器205は、重み付は回路200の出力信号から適
応コードブック210の出力)cw(n)を減算し残差
信号ew(n)を第1のコードブック探索回路230に
出力する。
ew(n) = xw(n) −fw(n)     
       (20)インパルス応答計算回路170
は、聴感重み付けした合成フィルタのインパルス応答h
w(n)を予め定められたサンプル数りだけ計算する。
具体的な計算法は、前記文献1等を参照できる。
第1のコードブック探索回路230は、第1のコードブ
ック235を用いて最適なコードワードc1j(n)を
探索する。ここで作用の項に託したように、第1のコー
ドブックは、あらかじめトレーニング信号を用いて学習
しておく。
第2図は第1のコードブック探索回路230のブロック
図を示す。コードワードの探索は下式に従う。
%式%(21) (21)式を最小化するγ1を求めるためには、(21
)式をγ1で偏微分して0とおくことにより得た下式を
用いる。
γ1 = Gj / Cj ただし Gj=Σew(n)(clj(n)傘hw(n))Cj
=Σ(Cxj(n)ohw(n))2(22) (23) (24) このとき(21)式は E=Σew(n)2− Gj2/ Cj       
  (25)となる。ここで(25)式の第1項は定数
であるので、第2項を最大化するようにコードブックの
コードワードc1j(n)を選択し、(22)式からゲ
インγ1を計算する。
第2図において、相互相関関数計算回路410は、(2
3)式の計算を行い、自己相関関数計算回路420は(
24)式の計算を行い、判別回路430は(25)式の
計算を行い、コードワードCj(n)を選択し、それを
表すインデクスを出力する。
また、コードブックの探索に要する演算量を低減するに
は、以下の方法を用いることもできる。
Gj=瑳甲(i)clj(i))2(26)但し V(i)=Σew(n)hW(n−i)       
   (27)Cj ” 11(0)vj(0)+ 2
写p(i)vj(i)       (28)ここで1
l(i)、VJ(1)はそれぞれhw(n)のi次遅れ
の自己相関、コードワードc1j(n)のi次遅れの自
己相関を示す。
以上の方法により求めたコードワードを示すインデクス
をマルチプレクサ260に出力する。また、選択された
コードワードcj(n)を乗算器241に出方する。
乗算器241は、コードワードcj(n)にゲインγ1
を下式により乗じて音源信号q(n)を求め合成フィル
タ250へ出力する。
q(n)=γ1 cj(n)            
 (29)合成フィルタ250は乗算器241の出力q
(n)を入力し、下式に従い重み付は合成信号yw(n
)を求め出力する。
yw(n) = g(n)*hw(n)       
      (30)減算器255は、ew(n)から
yw(n)を減算して第2のコードブック探索回路27
0へ出力する。
第2のコードブック探索回路270は、第2のコードブ
ック275から最適なコードワードを計算する。第2の
コードブック探索回路の構成は、第2図に示した第1の
フードブック探索回路の構成と基本的に同一の構成を用
いることができる。また、コードワードの探索法として
は、前記第1のコードブックの探索と同一の方法を用い
ることができる。第2のコードブックの構成法としては
、作用の項で述べたように、学習コードブックの高効率
を保ちながらトレーニングデータ依存性を救済するため
に、乱数系列からなるコードブックを用いる。乱数系列
からなるコードブックの構成法は前記文献1を参照でき
る。
また、コードブック探索の演算量の低減化のために、第
2のコードブックとして、重畳型(overlap)乱
数コードブックを用いることができる。重畳型乱数コー
ドブックの構成法、コードワード探索法については前記
文献5等を参照できる。
ゲイン量子化器286は、作用に述べた方法により、予
め学習により前記(12)、(13)式を用いて作製し
たゲインコードブック287を用いて、ゲインγ1、γ
2をベクトル量子化する。ベクトル量子化の際の最適な
コードワードの選択には、前記(8)式を用いる。第3
図はゲイン量子化器286の構成を示すブロック図であ
る。図において、再生回路505は、cl(n)、c2
(n)、hw(n)を人力して前記(9)、(10)式
にもとづき、5w1(n)、5w2(n)を求める。
相互相関関数計算回路500、自己相関関数計算回路5
10は、ew(n)、5w1(n)、5w2(n)、ゲ
インコードブック287の出力であるコードワードを人
力し、前記(8)式の第2項以下の各項を計算する。最
大値判別回路520は、第(8)式の第2項以下の最大
値を判別し、そのときのゲインコードワードのコードワ
ードを示すインデクスを出力する。ゲイン復号回路53
0は前記インデクスを用いてゲインを復号化して出力す
る。そしてコードブックのインブクスをマルチプレクサ
260に出力する。またゲインの復号化値γ1′、γ2
゛を乗算器242に出力する。
乗算器242は、第1、第2のコードブックにより選択
されたコードワードc1j(n)、c2i(n)に対し
てそれぞれ量子化復号化したゲインγ1′、γ2′を乗
じて合成フィルタ281に出力する。
合成フィルタ281は、加算器290の出力v(n)を
人力し、下式により合成音声を1フレーム分求め、さら
にもう1フレ一ム分はOの系列をフィルタに人力して応
答信号系列を求め、1フレ一ム分の応答信号系列を減算
器190に出力する。
t(n)= b(n)+ ’f2 ai’f(n −i
)         (31)ただし マルチプレクサ260は、LSP量子化器140、第1
のコードブック探索回路230、第2のコードブック探
索回路270、ゲイン量子化器286の出力符号系列を
組みあわせて出力する。
以上で第1の発明の詳細な説明を終える。
第4図は、第2の発明の一実施例を示すブロック図であ
る。図において、第1図と同一の番号を付した構成要素
は、第1図と同一の動作を行うので説明は省略する。
図において、量子化器225は、前記(17)式にもと
づき予め学習して構成したコードブック226を用いて
、適応コードブックのゲインをベクトル量子化する。最
適なコードワードのインデクスを示す符号をマルチプレ
クサ260へ出力すると共に、ゲインを量子化復号化し
て出力する。
以上で第2の発明の詳細な説明を終える。
以上の実施例の他、適応コードブックのゲインと第1、
第2のコードブックのゲインをまとめてベクトル量子化
することもできる。
以上の発明では、適応コードブックのゲイン、第1、第
2のコードブックのゲインには同時最適化を施さなかっ
たが、適応コードブック、第1のコードブック、第2の
コードブックのゲインについて、同時最適化を行い、さ
らに特性を改善する。この同時最適化は、作用の項で述
べたように、第1.2のコードブックのコードワードを
求めるときに適用するとさらに特性が改善される。
例えば、適応コードブックの遅延、ゲインpを求めた後
に、第1のコードブックのコードワードc1j(n)、
ゲインγ1を探索するときに、各コードワード毎に、次
式を最小化するように解いてpとγ、を同時最適化する
ここで、 R11=Σ(V(n−M)*hw(n))2R12=Σ
(v(n −M)*hw(n))(clj(n)*hw
(n))R22=Σ包1j(n)*hw(n))2P1
=Σxw(nXv(n−M)−hw(n))p2=ΣX
W(n)(C1j (n)*hw(n))(35a) (35b) (35c) (35d) (35e) 次に、第2のコードワードを決定するときに、次式を最
小化するように適応コードブックのゲイン、第1、第2
のコードブックのゲインを同時最適化する。
h(n) −γ2elj(n)*h(n))*w(n)
]2         (36)なお、演算量の低減化
のために、第1のコードブックのコードワード探索のと
きに(33)式によるゲイン最適化を行い、第2のコー
ドブックの探索のときには行わない構成とすることもで
きる。
また、さらに演算量を低減するためには、コードブック
のコードワードの探索のときにはゲインの最適化を行わ
ずに、第1のコードブックのコードワードが選択された
ときに、適応コードブックと第1のコードブックのゲイ
ンの同時最適化を行い、第2のコードブックのコードワ
ードが選択されたときには、適応コードブックと第1.
2のコードブックのゲインを同時に最適化する構成を用
いることもできる。
また、さらに演算量を低減化するためには、第1と2の
コードブックのコードワードが選択された後に、適応コ
ードブックのゲインpと、第1、第2のコードブックの
一ゲインγ1、γ2の3種を同時に最適化するような構
成とすることもできる。
また、適応コードブックのゲイン、第1、第2のコード
ブックのゲインγ0、γ2のベクトル量子化における最
適コードワードの選択には、演算量低減化のためにそれ
ぞれ前記(18)式、(11)式を用いることもできる
また、適応コードブックのゲイン、第1、第2のコード
ブックのゲインのベクトル量子化において、第3のコー
ドブックをゲインの絶対値に対して学習してあらかじめ
求めておき、ベクトル量子化のときはゲインの絶対値を
量子化し、符号は別に伝送するような構成としてもよい
また、上記実施例において、第1のコードブックの探索
法は実施例の方法以外にも他の衆知な方法を用いること
ができる。例えば、前記文献1に記載の方法や、あらか
じめコードブックの各コードワードc1j(n)の直交
変換c1(k)を求めて格納しておき、サブフレーム毎
に、前記重み付はインパルス応答hw(n)の直交変換
Hw(k)と、残差信号ew(n)の直交変換Ew(k
)を予め定められた点数だけ求め、前記(23)、(2
4)式の代わりに下式を用いてもよい。
Gj(k)=Ew(k)(C1j(k)Hw(k)) 
(o≦に≦N−1)  (37)CJ (k)=(C1
j(k)Hw(k))2(0≦に≦N−1) (38)
そして(37)、(38)式を逆直交変換して、相互相
関関数Gj、自己相関関数Cjを計算し、前記(25)
、(22)式に従いコードワードの探索、ゲインの計算
をするような構成としてもよい。このとき、直交変換と
しては、フーリエ変換、あるいはFFT、コサイン変換
などを用いることができる。この方法によれば、(23
)、(24)式の畳み込み演算を周波数軸上で乗算に帰
着できるので演算量を低減することができる。
また、第2のコードブックの探索法としては、前記実施
例の方法以外にも上記で示した方法や、前記文献5に記
載の方法や、他の衆知な良好な方法を用いることができ
る。
また、第2のコードブックの構成法としては、前記実施
例に記載した方法以外に、例えば予め膨大な乱数系列を
コードブックとして用意して、それらを用いてトレーニ
ングデータに対して乱数系列の探索を行い、選択される
頻度が高いものからコードワードとして登録して第2の
コードブックを構成することもできる。なお、この構成
法は、第1のコードブックの構成にも適用することがで
きる。
また、上記実施例では、適応コードブックのゲインと第
1、第2のコードブックのゲインは別々にベクトル量子
化したが、3種のゲインp、γ1、γ2をまとめてベク
トル量子化するような構成をとることもできる。学習に
よるベクトル量子化器のコードブックの作成は前記文献
2を参照できる。
また、上記実施例では、適応コードブックの次数は1次
としたが、2次以上の高次とすることもできる。また、
次数は1次のままで遅延を整数値ではなく小数値とする
こともできる。これらについての詳細は、例えばMar
que氏らによる“?1tchPrediction 
with Fractional Delays in
 CELP Coding”と題した論文(EURO8
PEECH,pp、 509−513.1989年)(
文献6)等を参照できる。以上のようにした方が特性は
向上するが、ゲインあるいは遅延の伝送に必要な情報量
が若干増大する。
また、上記の実施例では、スペクトルパラメータとして
にパラメータ、LSPパラメータを符号化し、その分析
法としてLPC分析を用いたが、スペクトルパラメータ
としては他の衆知なパラメータ、例えばLPCケプスト
ラム、ケプストラム、改良ケプストラム、−膜化ケプス
トラム、メルケプストラムなどを用いることもできる。
また各パラメータに最適な分析法を用いることができる
また、フレームで求めたLPC係数をLSP上や線形予
測係数上でサブフレーム毎に補間し、補間した係数を用
いて適応コードブック、第1、第2のコードブックの探
索を行う構成としてもよい。このような構成とすること
により、音質がさらに改善される。
また、LSP係数は衆知の方法により、ベクトル量子化
、あるいはベクトルースカラ量子化の方法については例
えば前記文献3等を参照できる。
また、演算量を低減するために、送信側では影響信号の
計算を省略することもできる。これによって、送信側に
おける合成フィルタ281、減算器190は不要となり
演算量低減が可能となるが、音質は若干低下する。
また、演算量を低減するために、重み付は回路200を
サブフレーム分割回路150の前に配置させ、合成フィ
ルタ281では下式により重み付は合成信号を計算する
ようにしてもよい。
〜(n) = V(n)十苓ai”γ1〜(n−i) 
 (o<γ< 1)  (39)ここでγは聴感重み付
けの程度を決める重み付は係数である。
また、受信側では、量子化雑音を整形することにより聴
覚的にきき易くするために、ピッチとスペクトル包絡の
少なくとも1つについて動作する適応形ポストフィルタ
を付加してもよい。適応型ポストフィルタの構成につい
ては、例えば、Kroon氏between 4.8 
and 16kb/s、”(IEEE JSAC,vo
l、 6.2.353−363、1988X文献7)等
を参照できる。
なお、デジタル信号処理の分野でよく知られているよう
に、自己相関関数は周波数軸上でパワスペクトルに、相
互相関関数はクロスパワスペクトルに対応しているので
、これらから計算することもできる。これらの計算法に
ついては、Oppenheim氏らによる”Digit
al Signal Processing”(Pre
ntice−Hall、 1975)と題した単行本(
文献8)を参照できる。
(発明の効果) 以上述べたように、本発明によれば、音源信号を表すコ
ードブックを2段に分離して、1段目はあらかじめ多量
の残差信号によるトレーニン・グ信号に対して学習して
求めたコードブック、2段目は予め定められた統計的特
性を有するコードブックを用い、さらに前記コードブッ
クのゲインやピッチ予測による適応コードブックのゲイ
ンをあらかじめ多量のトレーニング信号に対して学習し
て構成したコードブックを用いてベクトル量子化するこ
とにより、従来方式に比べてより少ない演算量でより良
好な特性を得ることができるという効果がある。また、
コードブックのゲインを最適化することによりさらに特
性が改善される。従って本発明によれば、従来方式に比
べて、8〜4.8kb/sのビットレートで、良好な音
質の符号化再生音声を得ることができるという大きな効
果がある。
【図面の簡単な説明】
第1図は第1の発明による音声符号化方式の一実施例を
示すブロック図、第2図は第1の発明による音声符号化
方式のコードブック探索回路の構成を示すブロック図、
第3図は第1の発明によるゲイン量子化器の構成を示す
ブロック図、第4図は第2の発明による音声符号化方式
の一実施例を示すブロック図である。 図において、110・・・バッファメモリ、130・・
・LPG計算回路、14001.量子化回路、150・
・・サブフレーム分割回路、17000.インパルス応
答計算回路、190.205.255.325・・・減
算器、200・・・重み付は回路、206・・・遅延回
路、210・・・適応コードブック、220・・・量子
化器、286・・・ゲイン量子化器、230・・・第1
のコードブック探索回路、235・・・第1のコードブ
ック、250.281・・・合成フィルタ、230・・
・第2のコードブック探索回路、241.242・・・
乗算器、275・・・第2のコードブック、287・・
・ゲインコードブック、410.500・・・相互相関
関数計算回路、420.510・・・自己相関関数計算
回路、430.520・・・判別回路、530・・・ゲ
イン復号回路を示す。

Claims (2)

    【特許請求の範囲】
  1. (1)入力した離散的な音声信号を予め定められた時間
    長のフレームに分割し、前記音声信号のスペクトル包絡
    を表すスペクトルパラメータを求めて出力し、前記フレ
    ームを予め定められた時間長の小区間に分割し、過去の
    音源信号をもとに再生した信号が前記音声信号に近くな
    るようにピッチパラメータを求め、前記音声信号をもと
    に学習して構成した信号が格納された第1のコードブッ
    クと、予め定められた特性を有する信号が格納された第
    2のコードブックとを有し、前記第1のコードブックか
    ら選択した信号と、前記第2のコードブックから選択し
    た信号との線形結合により前記音声信号の音源信号を表
    し、予め構成した第3のコードブックを用いて前記ピッ
    チパラメータと前記音源信号の少なくとも一方のゲイン
    を量子して出力することを特徴とする音声符号化方式。
  2. (2)入力した離散的な音声信号を予め定められた時間
    長のフレームに分割し、前記音声信号のスペクトル包絡
    を表すスペクトルパラメータを求めて出力し、前記フレ
    ームを予め定められた時間長の小区間に分割し、過去の
    音源信号をもとに再生した信号が前記音声信号に近くな
    るようにピッチパラメータの遅延量を求め、予め構成し
    たコードブックを用いて前記ピッチパラメータのゲイン
    を量子化して出力し、前記音声信号をもとに学習して構
    成した信号が格納された第1のコードブックと、予め定
    められた特性を有する信号が格納された第2のコードブ
    ックとを有し、前記第1のコードブックから選択した信
    号と、前記第2のコードブックから選択した信号との線
    形結合により前記音声信号の音源信号を表して出力する
    ことを特徴とする音声符号化方式。
JP04295690A 1990-02-22 1990-02-22 音声符号化装置 Expired - Lifetime JP3256215B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP04295690A JP3256215B2 (ja) 1990-02-22 1990-02-22 音声符号化装置
DE69133296T DE69133296T2 (de) 1990-02-22 1991-02-20 Sprachcodierer
US07/658,473 US5208862A (en) 1990-02-22 1991-02-20 Speech coder
EP91102440A EP0443548B1 (en) 1990-02-22 1991-02-20 Speech coder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04295690A JP3256215B2 (ja) 1990-02-22 1990-02-22 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH03243999A true JPH03243999A (ja) 1991-10-30
JP3256215B2 JP3256215B2 (ja) 2002-02-12

Family

ID=12650480

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04295690A Expired - Lifetime JP3256215B2 (ja) 1990-02-22 1990-02-22 音声符号化装置

Country Status (1)

Country Link
JP (1) JP3256215B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0744200A (ja) * 1993-07-29 1995-02-14 Nec Corp 音声符号化方式
US5487128A (en) * 1991-02-26 1996-01-23 Nec Corporation Speech parameter coding method and appparatus
US5677985A (en) * 1993-12-10 1997-10-14 Nec Corporation Speech decoder capable of reproducing well background noise

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6466700A (en) * 1987-09-08 1989-03-13 Fujitsu Ltd Vector quantization system
JPH01233500A (ja) * 1988-03-08 1989-09-19 Internatl Business Mach Corp <Ibm> 複数レート音声エンコーデイング方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6466700A (en) * 1987-09-08 1989-03-13 Fujitsu Ltd Vector quantization system
JPH01233500A (ja) * 1988-03-08 1989-09-19 Internatl Business Mach Corp <Ibm> 複数レート音声エンコーデイング方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5487128A (en) * 1991-02-26 1996-01-23 Nec Corporation Speech parameter coding method and appparatus
JPH0744200A (ja) * 1993-07-29 1995-02-14 Nec Corp 音声符号化方式
US5677985A (en) * 1993-12-10 1997-10-14 Nec Corporation Speech decoder capable of reproducing well background noise

Also Published As

Publication number Publication date
JP3256215B2 (ja) 2002-02-12

Similar Documents

Publication Publication Date Title
US6510407B1 (en) Method and apparatus for variable rate coding of speech
JP3114197B2 (ja) 音声パラメータ符号化方法
JP3094908B2 (ja) 音声符号化装置
JPH09127991A (ja) 音声符号化方法及び装置、音声復号化方法及び装置
JPH0353300A (ja) 音声符号化装置
JPH06222797A (ja) 音声符号化方式
JPH03211599A (ja) 4.8kbpsの情報伝送速度を有する音声符号化/復号化器
JPH09127990A (ja) 音声符号化方法及び装置
JP3344962B2 (ja) オーディオ信号符号化装置、及びオーディオ信号復号化装置
JPH0990995A (ja) 音声符号化装置
JPH10124092A (ja) 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
JPH056199A (ja) 音声パラメータ符号化方式
JPH05216500A (ja) 音声符号化装置
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JP3095133B2 (ja) 音響信号符号化方法
JP3531780B2 (ja) 音声符号化方法および復号化方法
JPH0854898A (ja) 音声符号化装置
JPH03243999A (ja) 音声符号化装置
JP3252285B2 (ja) 音声帯域信号符号化方法
JPH09127987A (ja) 信号符号化方法及び装置
JP3194930B2 (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP2002221998A (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音声符号化、復号化方法、装置及びプログラム
JP3092436B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071130

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081130

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081130

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091130

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091130

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101130

Year of fee payment: 9

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101130

Year of fee payment: 9