JP3256215B2 - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JP3256215B2
JP3256215B2 JP04295690A JP4295690A JP3256215B2 JP 3256215 B2 JP3256215 B2 JP 3256215B2 JP 04295690 A JP04295690 A JP 04295690A JP 4295690 A JP4295690 A JP 4295690A JP 3256215 B2 JP3256215 B2 JP 3256215B2
Authority
JP
Japan
Prior art keywords
signal
codebook
gain
signals
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP04295690A
Other languages
English (en)
Other versions
JPH03243999A (ja
Inventor
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP04295690A priority Critical patent/JP3256215B2/ja
Priority to DE69133296T priority patent/DE69133296T2/de
Priority to US07/658,473 priority patent/US5208862A/en
Priority to EP91102440A priority patent/EP0443548B1/en
Publication of JPH03243999A publication Critical patent/JPH03243999A/ja
Application granted granted Critical
Publication of JP3256215B2 publication Critical patent/JP3256215B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、音声信号を低いビットレート、特に8〜4.
8kb/s程度で高品質に符号化するための音声符号化方式
に関する。
(従来の技術) 音声信号を8〜4.8kb/s程度の低いビットレートで符
号化する方式としては、例えば、M.Schroeder and B.At
al氏による“Code−excited linear prediction:High q
uality speech at very low bit rates"(Proc.ICASSP,
pp.937−940,1985年)と題した論文(文献1)等に記載
されているCELP(Code Excited LPC Coding)が知られ
ている。この方法では、送信側では、フレード毎(例え
ば20ms)に音声信号から音声信号のスペクトル特性を表
すスペクトルパラメータを抽出し、フレームをさらに小
区間サブフレーム(例えば5ms)に分割し、サブフレー
ム毎に過去の音源信号をもとに長時間相関(ヒッチ相
関)を表すピッチパラメータを抽出し、ピッチパラメー
タにより前記サブフレームの音声信号を長期予測し、長
期予測して求めた残差信号に対して、予め定められた種
類の雑音信号からなるコードブックから選択した信号に
より合成した信号と、前記音声信号との誤差電力を最小
化するように一種類の雑音信号を選択するとともに、最
適なゲインを計算する。そして選択された雑音信号の種
類を表すインデクスとゲインならびに、前記スペクトル
パラメータとピッチパラメータを伝送する。受信側の説
明は省略する。
(発明が解決しようとする課題) 上述した文献1の従来方式では、高音質を得るために
は一般に、雑音信号から構成されるコードブックのビッ
トサイズを10ビット以上にきわめて大きくする必要があ
るため、コードブックを探索して最適な雑音信号(コー
ドワード)を求めるために膨大な演算量が必要であると
いう問題点があった。さらに、コードブックが基本的に
雑音信号から構成されるために、コードブックから選択
された音源信号により再生された再生音声の音質は雑音
感がともなうという問題点があった。
本発明の目的は、上述した問題点を解決し、比較的少
ない演算量及びメモリ量により、8〜4.8kb/s程度で音
質の良好な音声符号化方式を提供することにある。
(課題を解決するための手段) 本発明による音声符号化装置は、 入力した離散的な音声信号を予め定められた時間長のフ
レームに分割する手段と、 前記音声信号のスペクトラム包絡を表すスペクトルパ
ラメータを求めて出力する手段と、 前記フレームを予め定められた時間長の小区間に分割
する手段と、 過去の音源信号をもとに再生した信号が前記音声信号
に近くなるようにピッチパラメータを求める手段と、 前記音声信号をもとに予め学習して構成した信号が、
インデクスに対応して格納された第1のコードブック
と、 予め定められた特性を有する信号が、インデクスに対
応して格納された第2のコードブックと、 前記第1のコードブックから選択した信号と、前記第
2のコードブックから選択した信号との線形結合により
前記音声信号の音源信号を表し、第1のコードブック、
第2のコードブックから選択された信号に対応するイン
デクスを出力するとともに、予め構成した第3のコード
ブックを用いて前記ピッチパラメータと前記音源信号の
少なくとも一方のゲインを量子化して出力する手段 とを備えることを特徴とする。
また、本発明による音声符号化装置は、 入力した離散的な音声信号を予め定められた時間長のフ
レームに分割する手段と、 前記音声信号のスペクトラム包絡を表すスペクトルパ
ラメータを求めて出力する手段と、 前記フレームを予め定められた時間長の小区間に分割
する手段と、 過去の音源信号をもとに再生した信号が前記音声信号
に近くなるようにピッチパラメータの遅延量を求める手
段と、 予め構成したコードブックを用いて前記ピッチパラメ
ータのゲインを量子化して出力する手段と、 前記ピッチパラメータを用いて前記入力信号に対して
ピッチ予測を行ってピッチ予測信号を得、前記入力信号
と、このピッチ予測信号との差信号である残差信号を求
める手段と、 前記音声信号をもとに予め学習して構成した信号が、
インデクスに対応して格納された第1のコードブック
と、 予め定められた特性を有する信号が、インデクスに対
応して格納された第2のコードブックと、 前記第1のコードブックから前記残差信号をよく表す
第1の信号を選択する手段と、 前記第2のコードブックから前記残差信号に基づく信
号をよく表す第2の信号を選択する手段と、 前記第1の信号と前記第2の信号との線形結合により
前記音声信号の音源信号を表し、前記第1の信号、第2
の信号に対応するインデクスを出力する手段 とを有することを特徴とする。
(作用) 本発明による音声符号化方式の作用を示す。
第1の発明では、フレームを分割したサブフレーム毎
に、下式を最小化するように音源信号を求める。
ここでβ、Mは長期相関にもとづくピッチ予測(適応
コードブック)のピッチパラメータ、すなわちゲイン及
び遅延であり、v(n)は過去の音源信号である。h
(n)はスペクトルパラメータにより構成される合成フ
ィルタのインパルス応答、w(n)は聴感重み付けフィ
ルタのインパルス応答を示す。記号*は畳み込み演算を
示す。なお、w(n)の詳細については前記文献1を参
照できる。
また、d(n)はコードブックにより表される残差信
号示し、下式のように、第1のコードブックから選択さ
れたコードワードc1(n)と第2のコードブックから選
択されたコードワードc2(n)との線形結合で表され
る。
ここでγ、γは選択されたコードワードc
1j(n)、c2j(n)のゲインを示す。従って、本発明
では、2種類のコードブックに分解して音源信号が表さ
れることになるため、各コードブックはコードブック全
体のビット数の1/2でよい。例えばコードブック全体の
ビット数を10ビットとすると、第1、2のコードブック
は5ビットずつでよく、コードブック探索の演算量を大
幅に低減できる。
各コードブックとして前記文献1のような雑音コード
ブックを用いると、(2)式のように分割すると、特性
的には10ビット分のコードブックよりも劣化し全体で7
〜8ビット分の性能しか出せない。
そこで、本発明では、高性能を得るために、第1のコ
ードブックはトレーニングデータを用いてあらかじめ学
習させることにより構成する。学習によるコードブック
の構成法としては、例えば、Lindeらによる“An Algori
thm for Vector Quantization Design"と題した論文(I
EEE Trans.COM−28,pp.84−95,1980年)(文献2)等が
知られている。
学習のときの距離尺度としては通常、2乗距離(ユー
クリッド距離)が用いられるが、本方法では2乗距離よ
りも性能の良好な次式による聴感重み付け距離尺度用い
る。
ここでtj(n)はj番目のトレーニングデータ、c
1(n)はクラスタ1のコードワードである。クラスタ
1のセントロイド(代表コードワード)は、クラスタ1
内のトレーニングデータを用いて(4)式あるいは
(5)式を最小化するように求める。
(5)式においてgは最適ゲインを示す。
第2のコードブックは、第1のコードブックによるト
レーニングデータ依存性を救済するために、前記文献1
のガウス性雑音信号のようなあらかじめ統計的特性が確
定した雑音信号あるいは乱数信号からなるコードブック
や、他の特性を有するコードブックを使用する。なお、
雑音コードブックに対して、ある距離尺度のもとで選別
を行うことにより、さらに特性が改善される。詳細には
T.Moriya氏らによる“Transform Coding of Speech usi
ng a Weighted Vector Quantizer,"と題した論文(IEEE
J.Sel.Areas,Commun.,pp.425−431,1988年)。
(文献3)等を参照することができる。
さらに本発明では、第1、第2のコードブックから最
適なコードワードを選択した後に、第1、第2のコード
ブックのゲインγ、γを、あらかじめ学習により構
成したコードブック(第3のコードブック)を用いて効
率的にベクトル量子化する。ベクトル量子化において、
最適コードワートの探索は、次式を最小化するコードワ
ードを選択する。
ここでγ'iは各コードワードの示すベクトル量子化し
たゲインの値である。またcj(n)は、第1、第2のコ
ードブックから選択されたコードワードである。(6)
式において とすると、(6)、(7)式から次式を得る。
ここで である。また、(8)式の第1項は定数であるから、コ
ードワードの探索は(8)式の第2項以降を最大化する
ものを選択すればよい。
また、コードブック探索の演算量を大幅に低減するた
めには、下式に従いコードワードの選択を行ってもよ
い。
ゲインのベクトル量子化用のコードブックは、多量の
値からなるトレーニングデータを用いてあらかじめ学習
により構成する。コードブックの学習には前期文献2の
方法を用いることができる。ここで学習の際の距離尺度
は通常2乗距離であるが、さらに特性を改善するため
に、次式の距離尺度を用いることもできる。
ここでγtiはトレーニング用のゲインデータである。
γ'i1はゲインコードブックのクラスタ1における代表
コードワードである。(12)式の距離尺度を用いるとき
は、クラスタ1におけるセントロイドSc1iは次式を最小
化するように求める。
一方、学習における演算量を大幅に低減するためには
通常の2乗距離による次式の距離尺度を用いてもよい。
次に、第2の発明では、第1の発明に加えて、ピッチ
予測(適応コードブック)のピッチパラメータにおける
ゲインを、予め学習により構成したコードブックを用い
てベクトル量子化することを特徴とする。今ピッチ予測
の次数を1次とすると、ゲインをベクトル量子化するに
は、ピッチパラメータの遅延量Mを決定した後で、次式
を最小化するコードワードを選択する。
コードブックの学習の際の距離尺度は次式を用いる。
ここでβはコードブックトレーニング用のゲインデ
ータである。なお、演算量を低減するためには下式を用
いることもできる。
(実施例) 第1図は第1の発明による音声符号化方式の一実施例
を示すブロック図である。
図において、送信側では、入力端子100から音声信号
を入力し、1フレーム分(例えば20ms)の音声信号をバ
ッファメモリ110に格納する。
LPC分析回路130は、フレームの音声信号のスペクトル
特性を表すパラメータとして、LSPパラメータを前記フ
レームの音声信号から衆知のLPC分析を行いあらかじめ
定められた次数Lだけ計算する。この具体的な計算法に
ついては前記文献6を参照することができる。次にLSP
量子化回路140は、LSPパラメータを予め定められた量子
化ビット数で量子化し、得た符号1kをマルチプレケクサ
260へ出力するとともに、これを復号化してさらに線形
予測係数ai'(i=1〜L)に変換して重み付け回路20
0、インパルス応答計算回路170、合成フィルタ281へ出
力する。LSPパラメータの複合化、LSPパラメータから線
形予測係数への変換の方法についてはSugamura氏らによ
る“Quantizer Design in LSP Speech Analysis−Systh
esis"と題した論文(IEEE J.Sel.Arees,Commun.,pp.432
−440,1988年)(文献4)等を参照することができる。
サブフレーム分割回路150は、フレームの音声信号を
サブフレームに分割する。ここで例えばフレーム長は20
ms、サブフレーム長は5msとする。
減算器190は、サブフレームに分割された入力信号か
ら合成フィルタ281の出力を減算して出力する。
重み付け回路200は、減算した信号に対して衆知の聴
感重み付けを行う。聴感重み付け関数の詳細は前記文献
1を参照できる。
適応コードブック210は、合成フィルタ281の入力信号
v(n)を遅延回路206を介して入力し、さらにインパ
ルス応答出力回路170から重み付けインパルス応答h
w(n)、重み付け回路200から重み付け信号を入力し、
長期相関にもとづくピッチ予測を行い、ピッチパラメー
タとして遅延Mとゲインβを計算する。以下の説明では
適応コードブックの予測次数は1とするが、2次以上の
高次とすることもできる。1次の適応コードブックにお
ける遅延M、ゲインβの計算法は、Kleijin氏らによる
“Improved speech quality and efficient vector qua
ntization in SELP"と題した論文(ICASSP,pp.155−158
年、1988年)(文献5)に記載されているので説明を省
略する。
さらに、適応コードブック210は、次式により予測信
(n)を減算器に出力する。また遅延Mをマルチ
プレクサ260へ出力する。
上式でv(n−M)は合成フィルタ281の入力信号で
ある。hw(n)はインパルス応答計算回路170で求めた
重み付けインパルス応答である。
遅延回路206は、合成フィルタ入力信号v(n)を1
サブフレーム分遅延させて適応コードブック210へ出力
する。
演算器205は、重み付け回路200の出力信号から適応コ
ードブック210の出力(n)を減算し残差信号e
w(n)を第1のコードブック探索回路230に出力する。
減算器205は、重み付け回路200の出力信号から適応コ
ードブック210の出力(n)を減算し残差信号e
w(n)を第1のコードブック探索回路230に出力する。
インパルス応答計算回路170は、聴感重み付けした合
成フィルタのインパルス応答hw(n)を予め定められた
サンプル数Lだけ計算する。具体的な計算法は、前記文
献1等を参照できる。
第1のコードブック探索回路230は、第1のコードブ
ック235を用いて最適なコードワードc1j(n)を探索す
る。ここで作用の項に記したように、第1のコードブッ
クは、あらかじめトレーニング信号を用いて学習してお
く。
第2図は第1のコードブック探索回路230のブロック
図を示す。コードワードの探索は下式に従う。
(21)式を最小化するγを求めるためには、(21)
式をγで偏微分して0とおくことにより得た下式を用
いる。
ただし このとき(21)式は となる。ここで(25)式の第1項は定数であるので、第
2項を最大化するようにコードブックのコードワードc
1j(n)を選択し、(22)式からゲインγを計算す
る。
第2図において、相互相関関数計算回路410は、(2
3)式の計算を行い、自己相関関数計算回路420は(24)
式の計算を行い、判別回路430は(25)式の計算を行
い、C1j(n)を選択し、それを表すインデクスを出力
する。
また、コードブックの探索に要する演算量を低減する
には、以下の方法を用いることもできる。
但し ここでμ(i)、vj(i)はそれぞれhw(n)のi次遅
れの自己相関、コードワードc1j(n)のi次遅れの自
己相関を示す。
以上の方法により求めたコードワードを示すインデク
スをマルチプレクサ260に出力する。また、選択された
コードワードcj(n)を乗算器241に出力する。
乗算器241は、コードワードcj(n)にゲインγ
下式により乗じて音源信号q(n)を求め合成フィルタ
250へ出力する。
合成フィルタ250は乗算器241の出力q(n)を入力
し、下式に従い重み付け合成信号yw(n)を求め出力す
る。
減算器255は、ew(n)からyw(n)を減算して第2
のコードブック探索回路270へ出力する。
第2のコードブック探索回路270は、第2のコードブ
ック275から最適なコードワードを計算する。第2のコ
ードブック探索回路の構成は、第2図に示した第1のコ
ードブック探索回路の構成と基本的に同一の構成を用い
ることができる。また、コードワードの探索法として
は、前記第1のコードブックの探索と同一の方法を用い
ることができる。第2のコードブックの構成法として
は、作用の項で述べたように、学習コードブックの高効
率を保ちながらトレーニングデータ依存性を救済するた
めに、乱数系列からなるコードブックを用いる。乱数系
列からなるコードブックの構成法は前記文献1を参照で
きる。
また、コードブック探索の演算量の低減化のために、
第2のコードブックとして、重畳型(overlap)乱数コ
ードブックを用いることができる。重畳型乱数コードブ
ックの構成法、コードワード探索法については前記文献
5等を参照できる。
ゲイン量子化器286は、作用に述べた方法により、予
め学習により前記(12)、(13)式を用いて作製したゲ
インコードブック287を用いて、ゲインγ、γをベ
クトル量子化する。ベクトル量子化の際の最適なコード
ワードの選択には、前記(8)式を用いる。第3図はゲ
イン量子化器286の構成を示すブロック図である。図に
おいて、再生回路505は、c1(n)、c2(n)、h
w(n)を入力して前記(9)、(10)式にもとづき、s
w1(n)、sw2(n)を求める。
相互相関関数計算回路500、自己相関関数計算回路510
は、ew(n)、sw1(n)、sw2(n)、ゲインコードブ
ック287の出力であるコードワードを入力し、前記
(8)式の第2項以下の各項を計算する。最大値判別回
路520は、第(8)式の第2項以下の最大値を判別し、
そのときのゲインコードワードとコードワードを示すイ
ンデクスを出力する。ゲイン復号回路530は前記インデ
クスを用いてゲインを復号化して出力する。そしてコー
ドブックのインデクスをマルチプレクサ260に出力す
る。またゲインの復号化値γ1'、γ2'を乗算器242に出
力する。
乗算器242は、第1、第2のコードブックにより選択
されたコードワードc1j(n)、c2j(n)に対してそれ
ぞれ量子化複号化したゲインγ1'、γ2'を乗じて合成フ
ィルタ281に出力する。
合成フィルタ281は、加算器290の出力v(n)を入力
し、下式により合成音声を1フレーム分求め、さらにも
う1フレーム分は0の系列をフィルタに入力して応答信
号系列を求め、1フレーム分の応答信号系列を減算器19
0に出力する。
ただし マルチプレクサ260は、LSP量子化器140、第1のコード
ブック探索回路230、第2のコードブック探索回路270、
ゲイン量子化器286の出力符号系列を組みあわせて出力
する。
以上で第1の発明の実施例の説明を終える。
第4図は、第2の発明の一実施例を示すブロック図で
ある。図において、第1図と同一の番号を付した構成要
素は、第1図と同一の動作を行うので説明は省略する。
図において、量子化器225は、前記(17)式にもとづ
き予め学習して構成したコードブック226を用いて、適
応コードブックのゲインをベクトル量子化する。最適な
コードワードのインデクスを示す符号をマルチプレクサ
260へ出力すると共に、ゲインを量子化復号化して適応
コードブック210へ出力する。
以上で第2の発明の実施例の説明を終える。
以上の実施例の他、適応コードブックのゲインと第
1、第2のコードブックのゲインをまとめてベクトル量
子化することもできる。
以上の発明では、適応コードブックのゲイン、第1、
第2のコードブックのゲインには同時最適化を施さなか
ったが、適応コードブック、第1のコードブック、第2
のコードブックのゲインについて、同時最適化を行い、
さらに特性を改善する。この同時最適化は、作用の項で
述べたように、第1、2のコードブックのコードワード
を求めるときに適用するとさらに特性が改善される。
例えば、適応コードブックの遅延、ゲインβを求めた
後に、第1のコードブックのコードワードc1j(n)、
ゲインγを探索するときに、各コードワード毎に、次
式を最小化するように解いてβとγを同時最適化す
る。
これから ここで、 次に、第2のコードワードを決定するときに、次式を最
小化するように適応コードブックのゲイン、第1、第2
のコードブックのゲインを同時最適化する。
なお、演算量の低減化のために、第1のコードブック
のコードワード探索のときに(33)式によるゲイン最適
化を行い、第2のコードブックの探索のときには行わな
い構成とすることもできる。
また、さらに演算量を低減するためには、コードブッ
クのコードワードの探索のときにはゲインの最適化を行
わずに、第1のコードブックのコードワードが選択され
たときに、適応コードブックと第1のコードブックのゲ
インの同時最適化を行い、第2のコードブックのコード
ワードが選択されたときには、適応コードブックと第
1、2のコードブックのゲインを同時に最適化する構成
を用いることもできる。
また、さらに演算量を低減化するためには、第1と2
のコードブックのコードワードが選択された後に、適応
コードブックのゲインβと、第1、第2のコードブック
のゲインγ、γの3種を同時に最適化するような構
成とすることもできる。
また、適応コードブックのゲイン、第1、第2のコー
ドブックのゲインγ、γのベクトル量子化における
最適コードワードの選択には、演算量低減化のためにそ
れぞれ前記(18)式、(11)式を用いることもできる。
また、適応コードブックのゲイン、第1、第2のコー
ドブックのゲインのベクトル量子化において、第3のコ
ードブックをゲインの絶対値に対して学習してあらかじ
め求めておき、ベクトル量子化のときはゲインの絶対値
を量子化し、符号は別に伝送するような構成としてもよ
い。
また、上記実施例において、第1のコードブックの探
索法は実施例の方法以外にも他の衆知な方法を用いるこ
とができる。例えば、前記文献1に記載の方法や、あら
かじめコードブックの各コードワードc1j(n)の直交
変換c1(k)を求めて格納しておき、サブフレーム毎
に、前記重み付けインパルス応答hw(n)の直交変換Hw
(k)と、残差信号ew(n)の直交変換Ew(k)を予め
定められた点数だけ求め、前記(23)、(24)式の代わ
りに下式を用いてもよい。
そして(37)、(38)式を逆直交変換して、相互相関
関数Gj、自己相関関数Cjを計算し、前記(25)、(22)
式に従いコードワードの探索、ゲインの計算をするよう
な構成としてもよい。このとき、直交変換としては、フ
ーリエ変換、あるいはFFT、コサイン変換などを用いる
ことができる。この方法によれば、(23)、(24)式の
畳み込み演算を周波数軸上で乗算に帰着できるので演算
量を低減することができる。
また、第2のコードブックの探索法としては、前記実
施例の方法以外にも上記で示した方法や、前記文献5に
記載の方法や、他の衆知な良好な方法を用いることがで
きる。
また、第2のコードブックの構成法としては、前記実
施例に記載した方法以外に、例えば予め膨大な乱数系列
をコードブックとして用意して、それらを用いてトレー
ニングデータに対して乱数系列の探索を行い、選択され
る頻度が高いものからコードワードとして登録して第2
のコードブックを構成することもできる。なお、この構
成法は、第1のコードブックの構成にも適用することが
できる。
また、上記実施例では、適応コードブックのゲインと
第1、第2のコードブックのゲインは別々にベクトル量
子化したが、3種のゲインβ、γ、γをまとめてベ
クトル量子化するような構成をとることもできる。学習
によるベクトル量子化器のコードブックの作成は前記文
献2を参照できる。
また、上記実施例では、適応コードブックの次数は1
次としたが、2次以上の高次とすることもできる。ま
た、次数は1次のままで遅延を整数値ではなく少数値と
することもできる。これらについての詳細は、例えばMa
rque氏らによる“Pitch Prediction with Fractional D
elays in CELP Coding"と題した論文(EUROSPEECH,pp.5
09−513,1989年)(文献6)等を参照できる。以上のよ
うにした方が特性は向上するが、ゲインあるいは遅延の
伝送に必要な情報量が若干増大する。
また、上記の実施例では、スペクトルパラメータとし
てKパラメータ、LSPパラメータを符号化し、その分析
法としてLPC分析を用いたが、スペクトルパラメータと
しては他の衆知なパラメータ、例えばLPCケプストラ
ム、ケプストラム、改良ケプストラム、一般化ケプスト
ラム、メルケプストラムなどを用いることもできる。ま
た各パラメータに最適な分析法を用いることができる。
また、フレームで求めたLPC係数をLSP上や線形予測係
数上でサブフレーム毎に補間し、補間した係数を用いて
適応コードブック、第1、第2のコードブックの探索を
行う構成としてもよい。このような構成とすることによ
り、音質がさらに改善される。
また、LSP係数は衆知の方法により、ベクトル量子
化、あるいはベクトルースカラ量子化の方法については
例えば前記文献3等を参照できる。
また、演算量を低減するために、送信側では影響信号
の計算を省略することもできる。これによって、送信側
における合成フィルタ281、減算器190は不要となり演算
量低減が可能となるが、音質は若干低下する。
また、減算量を低減するために、重み付け回路200を
サブフレーム分割回路150の前に配置させ、合成フィル
タ281では下式により重み付け合成信号を計算するよう
にしてもよい。
ここでγは聴感重み付けの程度を決める重み付け係数
である。
また、受信側は、量子化雑音を整形することにより聴
覚的にきき易くするために、ピッチとスペクトル包絡の
少なくとも1つについて動作する適応形ポストフィルタ
を付加してもよい。適応型ポストフィルタの構成につい
ては、例えば、Kroon氏らによる“A Class of Analysis
−by−synthesis Predictive Coders for High Quality
Speech Coding at Rates between 4.8 and 16kb/s,"
(IEEE JSAC,vol.6,2,353−363,1988)(文献7)等を
参照できる。
なお、デジタル信号処理の分野でよく知られているよ
うに、自己相関関数は周波数軸上でパワスペクトルに、
相互相関関数はクロスパワスペクトルに対応しているの
で、これらから計算することもできる。これらの計算法
については、Oppenheim氏らによる“Digital Signal Pr
ocessing"(Prentice−Hall,1975)と題した単行本(文
献8)を参照できる。
(発明の効果) 以上述べたように、本発明によれば、音源信号を表す
コードブックを2段に分離して、1段目はあらかじめ多
量の残差信号によるトレーニング信号に対して学習して
求めたコードブック、2段目は予め定められた統計的特
性を有するコードブックを用い、さらに前記コードブッ
クのゲインやピッチ予測による適応コードブックのゲイ
ンをあらかじめ多量のトレーニング信号に対して学習し
て構成したコードブックを用いてベクトル量子化するこ
とにより、従来方式に比べてより少ない演算量でより良
好な特性を得ることができるという効果がある。また、
コードブックのゲインを最適化することによりさらに特
性が改善される。従って本発明によれば、従来方式に比
べて、8〜4.8kb/sのビットレートで、良好な音質の符
号化再生音声を得ることができるという大きな効果があ
る。
【図面の簡単な説明】
第1図は第1の発明による音声符号化方式の一実施例を
示すブロック図、第2図は第1の発明による音声符号化
方式のコードブック探索回路の構成を示すブロック図、
第3図は第1の発明によるゲイン量子化器の構成を示す
ブロック図、第4図は第2の発明による音声符号化方式
の一実施例を示すブロック図である。 図において、110……バッファメモリ、130……LPC計算
回路、140……量子化回路、150……サブフレーム分割回
路、170……インパルス応答計算回路、190、205、255、
325……減算器、200……重み付け回路、206……遅延回
路、210……適応コードブック、220……量子化器、286
……ゲイン量子化器、230……第1のコードブック探索
回路、235……第1のコードブック、250、281……合成
フィルタ、230……第2のコードブック探索回路、241、
242……乗算器、275……第2のコードブック、287……
ゲインコードブック、410、500……相互相関関数計算回
路、420、510……自己相関関数計算回路、430、520……
判別回路、530……ゲイン復号回路を示す。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】入力した離散的な音声信号を予め定められ
    た時間長のフレームに分割する手段と、 前記音声信号のスペクトラム包絡を表すスペクトルパラ
    メータを求めて出力する手段と、 前記フレームを予め定められた時間長の小区間に分割す
    る手段と、 過去の音源信号をもとに再生した信号が前記音声信号に
    近くなるようにピッチパラメータを求める手段と、 前記音声信号をもとに予め学習して構成した信号が、イ
    ンデクスに対応して格納された第1のコードブックと、 予め定められた特性を有する信号が、インデクスに対応
    して格納された第2のコードブックと、 前記第1のコードブックから選択した信号と、前記第2
    のコードブックから選択した信号との線形結合により前
    記音声信号の音源信号を表し、第1のコードブック、第
    2のコードブックから選択された信号に対応するインデ
    クスを出力するとともに、予め構成した第3のコードブ
    ックを用いて前記ピッチパラメータと前記音源信号の少
    なくとも一方のゲインを量子化して出力する手段 とを備えることを特徴とする音声符号化装置。
  2. 【請求項2】入力した離散的な音声信号を予め定められ
    た時間長のフレームに分割する手段と、 前記音声信号のスペクトラム包絡を表すスペクトルパラ
    メータを求めて出力する手段と、 前記フレームを予め定められた時間長の小区間に分割す
    る手段と、 過去の音源信号をもとに再生した信号が前記音声信号に
    近くなるようにピッチパラメータの遅延量を求める手段
    と、 予め構成したコードブックを用いて前記ピッチパラメー
    タのゲインを量子化して出力する手段と、 前記ピッチパラメータを用いて前記入力信号に対してピ
    ッチ予測を行ってピッチ予測信号を得、前記入力信号
    と、このピッチ予測信号との差信号である残差信号を求
    める手段と、 前記音声信号をもとに予め学習して構成した信号が、イ
    ンデクスに対応して格納された第1のコードブックと、 予め定められた特性を有する信号が、インデクスに対応
    して格納された第2のコードブックと、 前記第1のコードブックから前記残差信号をよく表す第
    1の信号を選択する手段と、 前記第2のコードブックから前記残差信号に基づく信号
    をよく表す第2の信号を選択する手段と、 前記第1の信号と前記第2の信号との線形結合により前
    記音声信号の音源信号を表し、前記第1の信号、第2の
    信号に対応するインデクスを出力する手段 とを有することを特徴とする音声符号化装置。
JP04295690A 1990-02-22 1990-02-22 音声符号化装置 Expired - Lifetime JP3256215B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP04295690A JP3256215B2 (ja) 1990-02-22 1990-02-22 音声符号化装置
DE69133296T DE69133296T2 (de) 1990-02-22 1991-02-20 Sprachcodierer
US07/658,473 US5208862A (en) 1990-02-22 1991-02-20 Speech coder
EP91102440A EP0443548B1 (en) 1990-02-22 1991-02-20 Speech coder

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04295690A JP3256215B2 (ja) 1990-02-22 1990-02-22 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH03243999A JPH03243999A (ja) 1991-10-30
JP3256215B2 true JP3256215B2 (ja) 2002-02-12

Family

ID=12650480

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04295690A Expired - Lifetime JP3256215B2 (ja) 1990-02-22 1990-02-22 音声符号化装置

Country Status (1)

Country Link
JP (1) JP3256215B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3151874B2 (ja) * 1991-02-26 2001-04-03 日本電気株式会社 音声パラメータ符号化方式および装置
JP2624130B2 (ja) * 1993-07-29 1997-06-25 日本電気株式会社 音声符号化方式
JP2616549B2 (ja) * 1993-12-10 1997-06-04 日本電気株式会社 音声復号装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6466700A (en) * 1987-09-08 1989-03-13 Fujitsu Ltd Vector quantization system
EP0331858B1 (en) * 1988-03-08 1993-08-25 International Business Machines Corporation Multi-rate voice encoding method and device

Also Published As

Publication number Publication date
JPH03243999A (ja) 1991-10-30

Similar Documents

Publication Publication Date Title
EP0443548B1 (en) Speech coder
JP2776050B2 (ja) 音声符号化方式
JP3094908B2 (ja) 音声符号化装置
JP3143956B2 (ja) 音声パラメータ符号化方式
JP3196595B2 (ja) 音声符号化装置
JPH0353300A (ja) 音声符号化装置
RU2005137320A (ru) Способ и устройство для квантования усиления в широкополосном речевом кодировании с переменной битовой скоростью передачи
JP2626223B2 (ja) 音声符号化装置
JP2800618B2 (ja) 音声パラメータ符号化方式
JPH04270398A (ja) 音声符号化方式
JP3089769B2 (ja) 音声符号化装置
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JP3308764B2 (ja) 音声符号化装置
JP3256215B2 (ja) 音声符号化装置
US6006177A (en) Apparatus for transmitting synthesized speech with high quality at a low bit rate
JP3252285B2 (ja) 音声帯域信号符号化方法
JP3194930B2 (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3299099B2 (ja) 音声符号化装置
JP3102017B2 (ja) 音声符号化方法
JP3249144B2 (ja) 音声符号化装置
JP3428595B2 (ja) 音声符号化方式
JP2658794B2 (ja) 音声符号化方式
JP2808841B2 (ja) 音声符号化方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071130

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081130

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081130

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091130

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091130

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101130

Year of fee payment: 9

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101130

Year of fee payment: 9