JPH0876800A - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JPH0876800A
JPH0876800A JP6214838A JP21483894A JPH0876800A JP H0876800 A JPH0876800 A JP H0876800A JP 6214838 A JP6214838 A JP 6214838A JP 21483894 A JP21483894 A JP 21483894A JP H0876800 A JPH0876800 A JP H0876800A
Authority
JP
Japan
Prior art keywords
sound source
amount
circuit
signal
code vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6214838A
Other languages
English (en)
Other versions
JP2907019B2 (ja
Inventor
Kazunori Ozawa
一範 小澤
Masahiro Serizawa
芹沢  昌宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP6214838A priority Critical patent/JP2907019B2/ja
Priority to CA002154911A priority patent/CA2154911C/en
Priority to DE69530442T priority patent/DE69530442T2/de
Priority to EP00128106A priority patent/EP1093115A3/en
Priority to EP00128160A priority patent/EP1093116A1/en
Priority to EP95112094A priority patent/EP0696026B1/en
Priority to US08/510,217 priority patent/US5778334A/en
Publication of JPH0876800A publication Critical patent/JPH0876800A/ja
Application granted granted Critical
Publication of JP2907019B2 publication Critical patent/JP2907019B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】比較的少ない演算量及びメモリ量により、4.8k
b/s 以下のビットレートで音質の良好な音声符号化方式
を提供する。 【構成】音源コードブック11の探索時に、音源コード
ベクトルの少なくとも一つに対して、あらかじめ補正量
を計算して補正量コードブック12に格納しておき、補
正量を加味しながらコードベクトルを探索する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は音声符号化装置に関し、
特に音声信号を4.8kb/s 以下の低いビットレートで高品
質に符号化するための音声符号化装置に関する。
【0002】
【従来の技術】従来の音声符号化装置で、音声信号を4.
8kb/s 以下の低いビットレートで符号化する有効な方法
としては、例えば、エム・シュレーダー(M.Schroeder
)とビー・アタル(B.Atal)等がアイイーイーイー・
プロシーディングス(IEEE Proc.)ICASSP-85,1985年、9
37〜940頁にコード・エキサイテド・リニア・プリ
ディクション:ハイ・クオリティ・スピーチ・アット・
ベリー・ロウ・ビット・レイツ(Code-excited linear
prediction: High quality speech at very low bit ra
tes )と題して発表した論文(文献1)や、クレイジン
(Kleijn)等によるアイイーイーイー・プロシーディン
グス(IEEE Proc.)ICASSP-88,1988年、155〜158頁
にインプルーブド・スピーチ・クオリティ・アンド・エ
フィシェント・ベクトル・クオンタイゼイション・イン
・エスイーエルピー(Improved speechquality and effi
cient vector quantization in SELP) と題して発表し
た論文(文献2)等に記載されているCELP(Code Ex
cited Linear Prediction Coding) が知られている。こ
の方法では、送信側では、フレーム毎(例えば20ms)に
音声信号から線形予測(LPC)分析を用いて、音声信
号のスペクトル特性を表すスペクトルパラメータを抽出
し、フレームをさらに複数のサブフレーム(例えば5ms)
に分割し、サブフレーム毎に過去の音源信号をもとに適
応コードブックにおけるパラメータ(ピッチ周期に対応
する遅延パラメータとゲインパラメータ)を抽出し、適
応コードブックにより該当のサブフレームの音声信号を
ピッチ予測し、ピッチ予測して求めた残差信号に対し
て、予め定められた種類の雑音信号からなる音源コード
ブック(ベクトル量子化コードブック)から最適音源コ
ードベクトルを選択し、最適なゲインを計算することに
より、音源信号を量子化する。音源コードベクトルの選
択の仕方は、選択した雑音信号により合成した信号と、
前述の残差信号との誤差電力を最小化するように行う。
そして選択されたコードベクトルの種類を表すインデッ
クスとゲインならびに、スペクトルパラメータと適応コ
ードブックのパラメータとをマルチプレクサ部により組
み合わせて伝送する。
【0003】
【発明が解決しようとする課題】上述した従来の音声符
号化装置で、音声信号を低いビットレートで符号化する
方法としてCELPを用いる場合、音源コードブックの
探索に下式を使用しているため、膨大な演算量を必要と
する。
【0004】
【0005】ここで、cj(n) は、音源コードブックにお
けるj番目の音源コードベクトル、h(n)、γj はそれぞ
れ、スペクトルパラメータから求めたインパルス応答、
j 番目の音源コードベクトルに対する最適ゲインであ
る。但し、簡単のために、ここでは、後述の聴感重み付
け演算は省略している。
【0006】(1) 式を最小化する音源コードベクトル
は、等価な関係として、下式を最小化することにより得
られる。
【0007】
【0008】ここで、
【0009】
【0010】である。記号"*" は畳み込み演算を示す。
【0011】この従来の音声符号化装置で用いる方法で
は、特に、(4) 式の計算が多い。例えば、h(n)の次数を
20点とし、N=64とすると、音源コードベクトル当たりで
は、20x64+64=1344 回の積和演算が必要である。この値
を1秒当たりに換算すると、1344x8000/64=16.8 万回と
なる。このため、符号化を高速度に行うには演算量を低
減化することが必要となる。
【0012】音源コードブックの探索に必要な演算量を
低減化する方法として、(4) 式を下式で近似する方法が
提案されている。
【0013】
【0014】ここで、L≦Nであり、通常、L<Nにと
る。但し、
【0015】
【0016】この方法は自己相関法と呼ばれる。この方
法では、(6) 式の計算は各音源コードベクトルごとに予
め計算し、値をメモリに格納しておくので演算量は零で
あり、又、(7) 式の計算は音源コードブックの探索の前
に1回行えばよいので、(5) 式の計算は音源コードベク
トル当たり、ほぼL回の積和演算でよいことになる。例
えばL=20とすれば、前述の従来方式に比べ、積和回数を
1/67と、大幅に低減化することができる。自己相関法の
詳細は、例えば、トランコソ(Trancoso)らによるアイ
イーイーイー・プロシーディングス(IEEE Proc.)ICASSP
-86,1986年、2375〜2378頁にエフィセント・プ
ロシジャース・フォー・ファインディング・ザ・オプテ
ィマム・イノベイション(Efficient procedures for f
inding theoptimum innovation )と題して発表した論
文(文献3)等を参照することができるので、説明は省
略する。
【0017】しかしながら、文献3の方法を用いた場
合、R2 j の値を(5) 式により近似しているので、近似誤
差が発生するという問題点がある。さらに、この近似誤
差は、インパルス応答h(n)の減衰度とコードベクトルcj
(n) の形状に依存しており、特に、母音部などでインパ
ルス応答長が長い場合に、(5) 式のLの値を小さく設定
すると、誤差が顕著になるという現象が発生する。この
ため、(5) 式の計算の結果が、常に(2) 式を最小化する
音源コードベクトルを選択しているとは限らず、再生音
声が劣化させることもあるという問題点がある。
【0018】本発明の目的は、上述した問題点を解決
し、比較的少ない演算量及びメモリ量により、4.8kb/s
以下のビットレートで音質の良好な音声符号化方式を提
供することにある。
【0019】
【課題を解決するための手段】本発明の音声符号化装置
は、音声信号もしくは音声信号から計算した信号を量子
化する音声符号化装置であって、複数種類のコードベク
トルからなるコードブックと、前記コードベクトルの少
なくとも一つに対して予め補正量を計算しこの補正量を
加味しながらコードベクトルを探索する音源探索手段と
を有する構成である。
【0020】本発明の音声符号化装置は、入力した音声
信号からスペクトルパラメータを求めるスペクトルパラ
メータ分析手段と、複数種類のコードベクトルからなる
コードブックと、前記コードベクトルの少なくとも一つ
に対し予め想定した複数のスペクトルパラメータのそれ
ぞれに合せて計算してある異なる複数種類の補正量を切
り替えながら前記音声信号もしくは前記音声信号から計
算した信号に対してコードベクトルを探索する音源探索
手段とを有する構成である。
【0021】本発明の音声符号化装置は、入力した音声
信号からスペクトルパラメータを求めるスペクトルパラ
メータ分析手段と、このスペクトルパラメータ分析手段
の求めたスペクトルパラメータをもとに複数種類のイン
パルス応答を計算するインパルス応答計算手段と、複数
種類のコードベクトルからなるコードブックと、前記コ
ードベクトルの少なくとも一つに対し予め第1の量を計
算し、前記音声信号もしくは前記音声信号から計算した
信号に対してコードベクトルを探索する際、該当のコー
ドベクトルに対応する前記第1の量が予め定められた条
件を満たすときは前記インパルス応答長を変えて前記該
当のコードベクトルを探索する音源探索手段とを有する
構成である。
【0022】本発明の音声符号化装置は、入力した音声
信号からスペクトルパラメータを求めるスペクトルパラ
メータ分析手段と、このスペクトルパラメータ分析手段
の求めたスペクトルパラメータをもとに複数種類のイン
パルス応答を計算するインパルス応答計算手段と、複数
種類のコードベクトルからなるコードブックと、前記コ
ードベクトルの少なくとも一つに対し予め想定した複数
のスペクトルパラメータのそれぞれに合せて計算してあ
る異なる第1の量を切り替えながら前記音声信号もしく
は前記音声信号から計算した信号に対して前記コードブ
ックを探索する際、該当のコードベクトルに対応する前
記第1の量が予め定められた条件を満たすときは前記イ
ンパルス応答長を変えて前記該当のコードベクトルを探
索する構成である。
【0023】
【作用】本発明による音声符号化装置の作用を説明す
る。
【0024】第1の発明では、音声信号をフレーム(例
えば40ms)に分割し、さらにサブフレーム( 8ms)に分
割する。サブフレーム毎に音声信号あるいは音源信号を
量子化するためのベクトル量子化コードブックを予め用
意しておき、予め定められた個数(2B:ここでBはベク
トル量子化コードブックのビット数) のコードベクトル
が格納されている。すくなくとも一つのコードベクトル
cj(n) に対して、下式の補正量△j あるいは△'jを予め
計算しておく。コードベクトルの探索には、前述の(2)
式に従うが、(2) 式右辺第2 項の分母の計算には(5) 式
のかわりに、下記の(8) 式あるいは(9) 式を使用する。
【0025】
【0026】ここで、補正量△j あるいは△'jは、(4)
式での真の値とのずれを統計的に表す量として、トレー
ニング用の多量の音声信号に対して予め測定し、メモリ
に格納しておく。
【0027】第2の発明では、(8) および(9) 式の補正
量がインパルス応答に依存している点を考慮し、音声信
号から求めたスペクトルパラメータに応じて、(8) ある
いは(9) 式の補正量△j あるいは△'jを、予め複数種類
求めておき、スペクトルパラメータに応じて切り替えて
いる。
【0028】第3の発明では、従来の技術で説明した方
法と同様に、コードブック探索時に(5) 式を使用する。
本発明の特徴は、音声信号からスペクトルパラメータを
求めさらに、インパルス応答h(n)に変換する。すくなく
とも一つのコードベクトルに対して、第1の量として
(7) 式あるいは(8) 式の補正量△j あるいは△'jを予め
計算しておき、この値が、例えば、予め定められたしき
い値をこえるときは、予め定められた条件を満たすと判
断して、(5) 式におけるインパルス応答の次数Lを変え
る点にある。変え方としては、例えば、Lを長くするこ
とが考えられる。
【0029】第4の発明では、次の2点を特徴とする。
音声信号から求めたスペクトルパラメータに応じて(7)
式あるいは(8) 式の補正量△j あるいは△'jを予め複数
種類計算しておき、さらに、第1の量として第3の発明
と同一の補正量を用い、この値が予め定められたしきい
値を越えるときは、(5) 式におけるインパルス応答の次
数Lの値を変える。
【0030】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
【0031】図1は本発明の第1の実施例のブロック図
である。
【0032】本発明の第1の実施例の音声符号化装置1
は、入力端子から入力する音声信号を受信し、フレーム
に分割するフレーム分割回路2と、フレームの音声信号
をフレームよりも短いサブフレームに分割するサブフレ
ーム分割回路3と、サブフレームの音声信号に対してサ
ブフレーム長よりも長い窓をかけて音声を切り出してス
ペクトルパラメータを予め定められた次数計算するスペ
クトルパラメータ分析回路4と、スペクトルパラメータ
分析回路4の出力する複数のサブフレームの線スペクト
ル対(以下LSPと記す)パラメータを受け量子化する
スペクトルパラメータ量子化回路5と、サブフレーム分
割回路3の出力するサブフレームとスペクトルパラメー
タ分析回路4の出力するサブフレームの線形予測係数と
を受け各サブフレームの音声信号に対して聴感重み付け
を行い聴感重み付け信号を出力する聴感重み付け回路6
と、スペクトルパラメータ分析回路4からは各サブフレ
ームごとに線形予測係数αilを、スペクトルパラメータ
量子化回路5からは量子化および補間を行い復元したサ
ブフレームごとの線形予測係数α'il をそれぞれ入力
し、応答信号を1サブフレーム分計算し出力する応答信
号計算回路7と、聴感重み付け回路6が出力する聴感重
み付け信号から応答信号計算回路7が出力する応答信号
を1サブフレーム分減算する減算器8と、スペクトルパ
ラメータ分析回路4からは線形予測係数αilを、スペク
トルパラメータ量子化回路5からは線形予測係数α'il
をそれぞれ入力し、重み付けフィルタのインパルス応答
を予め定められた点数Lだけ計算し出力するインパルス
応答計算回路9と、減算器8およびインパルス応答計算
回路9の出力を受けピッチパラメータを求める適応コー
ドブック回路10と、インパルス応答計算回路9と適応
コードブック回路10との出力を受け音源コードブック
11に格納された音源コードベクトルから最良の音源コ
ードベクトルを選択し読みだし補正量コードブック12
からはこれに対応する補正量を読みだす音源探索回路1
3と、音源探索回路13の出力する音源コードベクトル
を受けこれと組み合わせが最良なゲインコードベクトル
をゲインコードブック14から選択し、これらの音源コ
ードベクトルとゲインコードベクトルを表すインデック
スを出力するゲイン量子化回路15と、スペクトルパラ
メータ分析回路4からは線形予測係数αilを、スペクト
ルパラメータ量子化回路5からは線形予測係数α'il
を、ゲイン量子化回路15からはそれぞれのインデック
スを入力し、これらに対応するコードベクトルを読みだ
し駆動音源信号v(n)を求める重み付け信号計算回路16
と、スペクトルパラメータ量子化回路5の出力するコー
ドベクトルを表すインデックスと、適応コードブック回
路10が求めたサブフレームごとの遅延値に対応するイ
ンデックスと、ゲイン量子化回路15が選択した音源コ
ードベクトルとゲインコードベクトルを表すインデック
スとを入力し、これらのインデックスを組み合わせて出
力端子から出力するマルチプレクサ17とで構成してい
る。
【0033】図2は本発明の第2の実施例のブロック図
である。
【0034】本発明の第2の実施例の音声符号化装置2
1は、第1の実施例の音声符号化装置1に、インパルス
応答計算回路9の出力のインパルス応答h(n)を予め定め
られた種類のクラスに分類する分類回路22と、補正量
コードブック12に替えて、少なくとも一つの音源コー
ドベクトルについての補正量をK種のインパルス応答の
パターンの各々に対して予め計算し格納しておき、分類
回路22の分類結果に応じてK種の補正量コードブック
を切り替えて音源探索回路13に出力する補正量コード
ブック23とを設けて構成している。図中、図1と同一
の名称および符号を付した構成要素は、図1と同一の働
きをするので、説明は省略する。
【0035】図3は本発明の第3の実施例のブロック図
である。
【0036】本発明の第3の実施例の音声符号化装置3
1は、第1の実施例の音声符号化装置1に、インパルス
応答計算回路9に替えて、インパルス応答を、2種類の
次数置1に、インパルス応答計算回路9の出力のインパ
ルス応答h(n)を予め定められL1 ,L2 (L1 <L2
だけ計算し、両方のインパルス応答h(n)を出力し、この
内L1 次のインパルス応答h(n)は、適応コードブック回
路10に出力するインパルス応答計算回路32と、イン
パルス応答計算回路32の2種類の次数L1 ,L2 のイ
ンパルス応答h(n)を受け、音源探索回路13が補正量コ
ードブック12から読み出す補正量を予め計算してある
第1の量と比較し、比較結果により補正量と共にインパ
ルス応答の一方を音源探索回路13に出力する判別回路
33とを設けて構成している。図中、図1と同一の名称
および符号を付した構成要素は、図1と同一の働きをす
るので、説明は省略する。
【0037】図4は本発明の第4の実施例のブロック図
である。
【0038】本発明の第4の実施例の音声符号化装置4
1は、第1の実施例の音声符号化装置1に、第2および
第3の実施例で新たに設けた構成要素をすべて設けて構
成している。ここで、若干の説明を付け加えるならば、
特に本実施例で特徴となる構成要素は、インパルス応答
計算回路32の出力する2種類の次数L1 ,L2 のイン
パルス応答h(n)の内、次数L1 のインパルス応答h(n)を
受け、予め定められたK種類のクラスに分類する分類回
路22と、分類回路22の出力に応じて、K種類の補正
量を切替えて出力する補正量コードブック23と、補正
量コードブック23から少なくとも一つの補正量を読み
出し、音源探索回路13が補正量コードブック12から
読み出す補正量を予め計算してある第1の量と比較し、
比較結果により補正量と共にインパルス応答の一方を音
源探索回路13に出力する判別回路33とである。な
お、前述の説明に含まれない、図中、図1と同一の名称
および符号を付した構成要素は、図1と同一の働きをす
るので、説明は省略する。
【0039】次に動作について説明する。
【0040】第1の実施例では、入力端子1から音声信
号を入力し、フレーム分割回路2では音声信号をフレー
ム(例えば40ms)毎に分割し、サブフレーム分割回
路3では、フレームの音声信号をフレームよりも短いサ
ブフレーム(例えば8ms)に分割する。スペクトルパ
ラメータ分析回路4では、少なくとも一つのサブフレー
ムの音声信号に対して、サブフレーム長よりも長い窓
(例えば24ms)をかけて音声を切り出してスペクト
ルパラメータを予め定められた次数(例えばP=10次)計
算する。スペクトルパラメータは、特に子音、母音間で
の過渡区間では時間的に大きく変化するので、短い時間
毎に分析する方が望ましいが、そのようにすると分析に
必要な演算量が増大するため、ここでは、フレーム中の
いずれかQ個(Q>1)のサブフレーム(例えばQ=3
とし、第1、3、5サブフレーム)に対してスペクトル
パラメータを計算することにする。そして、分析をしな
かったサブフレーム(ここでは第2、4サブフレーム)
では、それぞれ、第1と第3サブフレーム、第3と第5
サブフレームのスペクトルパラメータを後述のLSP上
で直線補間したものをスペクトルパラメータとして使用
する。ここでスペクトルパラメータの計算には、周知の
LPC分析や、バーグ(Burg)分析等を用いることができ
る。ここでは、バーグ(Burg)分析を用いることとする。
バーグ(Burg)分析の詳細については、中溝著による“信
号解析とシステム同定”と題した単行本(コロナ社19
88年刊)の82〜87頁(文献4)に記載されている
ので説明は略する。
【0041】さらにスペクトルパラメータ分析回路4で
は、バーグ(Burg)分析により計算された線形予測係数α
i(i=1-10) を量子化や補間に適したLSPパラメータに
変換する。ここで、線形予測係数からLSPへの変換
は、菅村他による“線スペクトル対(LSP)音声分析
合成方式による音声情報圧縮”と題した論文(電子通信
学会論文誌、J64―A,599〜606頁、1981
年)(文献5)を参照することができる。即ち、第1、
3、5サブフレームでバーグ(Burg)分析により求めた線
形予測係数を、LSPパラメータに変換し、第2、4サ
ブフレームのLSPを直線補間により求めて、第2、4
サブフレームのLSPを逆変換して線形予測係数に戻
し、第1〜5サブフレームの線形予測係数αil(i=1-10,
l=1-5) を聴感重み付け回路6に出力する。また、第1
〜5サブフレームのLSPをスペクトルパラメータ量子
化回路5へ出力する。
【0042】スペクルパラメータ量子化回路5では、予
め定められたサブフレームのLSPパラメータを効率的
に量子化する。以下では、量子化法として、ベクトル量
子化を用いるものとし、第5サブフレームのLSPパラ
メータを量子化するものとする。LSPパラメータのベ
クトル量子化の手法は、周知の手法を用いることができ
る。具体的な方法は、例えば、特願平2−297600
号(文献6)や特願平3−261925号(文献7)
や、特願平3−155049号(文献8)や、ティー・
ノムラ(T.Nomura)等によるアイイーイーイー・プロシー
ディングス.モバイル・マルチメディア・コミュニケー
ションズ(IEEE Proc.Mobile MultimediaCommunication
s.)1993年、B.2.5頁にエルエスピー・コーディン
グ・ユージング・ブイキュー−エスブイキュー・ウイズ
・インターポウレーション・イン・4.075・ケービ
ーピーエス・エム−エルシーイーエルピー・スピーチ・
コーダー (LSP Coding Using VQ-SVQ With Interpolat
ion in 4.075 kbps M-LCELPSpeech Coder) と題した論
文(文献9)等を参照できるのでここでは説明は略す
る。
【0043】また、スペクトルパラメータ量子化回路5
では、第5サブフレームで量子化したLSPパラメータ
をもとに、第1〜第4サブフレームのLSPパラメータ
を復元する。ここでは、現フレームの第5サブフレーム
の量子化LSPパラメータと1つ過去のフレームの第5
サブフレームの量子化LSPを直線補間して、第1〜第
4サブフレームのLSPを復元する。ここで、量子化前
のLSPと量子化後のLSPとの誤差電力を最小化する
コードベクトルを1種類選択した後に、直線補間により
第1〜第4サブフレームのLSPを復元できる。さらに
性能を向上させるためには、前述の誤差電力を最小化す
るコードベクトルを複数候補選択した後に、各々の候補
について累積歪を評価し、累積歪を最小化する候補と補
間LSPの組を選択するようにすることができる。詳細
は、例えば、特開平6−222797号公報(文献1
0)を参照することができる。
【0044】以上説明した手順により復元した第1〜4
サブフレームのLSPと第5サブフレームの量子化LS
Pをサブフレーム毎に線形予測係数α'il (i=1-10, l=1
-5)に変換し、インパルス応答計算回路9に出力する。
また、第5サブフレームの量子化LSPのコードベクト
ルを表すインデックスをマルチプレクサ17に出力す
る。
【0045】上記において、直線補間のかわりに、LS
Pの補間パターンを予め定められたビット数(例えば2
ビット)分用意しておき、これらのパターンの各々に対
して1〜4サブフレームのLSPを復元して累積歪を最
小化するコードベクトルと補間パターンの組を選択する
ようにしてもよい。このようにすると補間パターンのビ
ット数だけ伝送情報が増加するが、LSPのフレーム内
での時間的な変化をより精密に表すことができる。ここ
で、補間パターンは、トレーニング用のLSPデータを
用いて予め学習して作成してもよいし、予め定められた
パターンを格納しておいてもよい。予め定められたパタ
ーンとしては、例えば、ティー・タニグチ(T.Taniguch)
等がアイイーイーイー・プロシーディングス(IEEE Pro
c.)ICSLP,1992 年、41〜44頁にイムプルーブド・シ
ーイーエルピー・スピーチ・コーディング・アット・4
ケービーパーエス・アンド・ビロウ(Improved CELP spe
ech coding at 4kb/s and below)と題した論文(文献1
1)等に記載のパターンを用いることができる。
【0046】また、さらに性能を改善するためには、補
間パターンを選択した後に、予め定められたサブフレー
ムにおいて、LSPの真の値とLSPの補間値との誤差
信号を求め、この誤差信号をさらに誤差コードブックで
表すようにしてもよい。詳細は、前述の文献9等を参照
できる。
【0047】聴感重み付け回路6は、スペクトルパラメ
ータ分析回路4から、各サブフレーム毎に量子化前の線
形予測係数αil(i=1-10, l=1-5) を入力し、前述の文献
10にもとづき、サブフレームの音声信号に対して聴感
重み付けを行い、聴感重み付け信号を出力する。
【0048】応答信号計算回路7は、スペクトルパラメ
ータ分析回路4から、各サブフレーム毎に線形予測係数
αilを入力し、スペクトルパラメータ量子化回路5か
ら、量子化、補間して復元した線形予測係数α'il をサ
ブフレーム毎に入力し、保存されているフィルタメモリ
の値を用いて、入力信号d(n)=0とした応答信号を1サブ
フレーム分計算し、減算器8に出力する。ここで、応答
信号xZ(n)は、例えば、下式で表される。
【0049】
【0050】ここで、γは、聴感重み付け量を制御する
重み係数であり、下記の(11)式と同一の値である。
【0051】減算器8は、下式により、聴感重み付け信
号から応答信号を1サブフレーム分減算し、x'w(n) を
適応コードブック回路10に出力する。
【0052】
【0053】インパルス応答計算回路9は、Z変換が下
式で表される重み付けフィルタのインパルス応答 hw(n)
を予め定められた点数Lだけ計算し、適応コードブック
回路10、音源探索回路13に出力する。
【0054】
【0055】適応コードブック回路10は、ピッチパラ
メータを求める。詳細は、例えば前記文献10を参照す
ることができる。そして、求めたサブフレーム毎の遅延
値に対応するインデックスをマルチプレクサ17に出力
する。また、適応コードブックによりピッチ予測を下式
に従って行い、適応コードブック予測算差信号z(n)を出
力する。
【0056】
【0057】ここで、b(n)は、適応コードブックピッチ
予測信号であり、下式で表せる。
【0058】
【0059】ここで、β、T は、それぞれ、適応コード
ブックのゲイン、遅延を示す。v(n)は適応コードベクト
ルである。
【0060】音源探索回路13は、音源コードブック1
1に格納された音源コードベクトルの全部あるいは一部
に対して、補正量コードブック12から補正量を読みだ
す。音源コードブック探索時に、補正量を考慮した(8)
式あるいは(9) 式を用いて、前出(2) 式を最小化するよ
うに、最良の音源コードベクトルcj(n) を選択する。こ
のとき、最良のコードベクトルを1種選択してもよい
し、2 種以上のコードベクトルを選んでおいて、ゲイン
量子化の際に、1種に本選択してもよい。ここでは、2
種以上のコードベクトルを選んでおくものとする。ここ
で、補正量△j 、あるいは△'jは、少なくとも一つの音
源コードベクトルcj(n) に対して予め計算され、補正量
コードブック12に格納されている。
【0061】ゲイン量子化回路15は、ゲインコードブ
ック14からゲインコードベクトルを読みだし、選択さ
れた音源コードベクトルに対して、(15)式を最小化する
ように、音源コードベクトルとゲインコードベクトルの
組み合わせを選択する。
【0062】
【0063】ここで、β'k、γ'kは、ゲインコードブッ
ク14に格納された2次元ゲインコードブックにおける
k番目のコードベクトルである。Nは、サブフレーム長
を表わすサンプル数である。
【0064】選択された音源コードベクトルとゲインコ
ードベクトルを表すインデックスをマルチプレクサ17
に出力する。
【0065】重み付け信号計算回路16は、スペクトル
パラメータ分析回路4の出力パラメータおよびそれぞれ
のインデックスを入力し、インデックスからこれに対応
するコードベクトルを読みだし、まず下式にもとづき駆
動音源信号v(n)を求める。
【0066】
【0067】次に、スペクトルパラメータ分析回路4の
出力パラメータとスペクトルパラメータ量子化回路5の
出力パラメータとを用いて下式により、重み付け信号sw
(n)をサブフレーム毎に計算し、応答信号計算回路7に
出力する。
【0068】
【0069】次に、第2の実施例では、分類回路22が
新たに付加され、インパルス応答計算回路9の出力のイ
ンパルス応答h(n)を受け、予め定められた種類のクラス
に分類する。分類の方法は、例えば、インパルス応答の
パターンをコードブックとして予めK種類作成してお
き、各々のパターンとの間で、下式に従い距離を求め、
距離を最小にするパターンを選択することにより分類を
行う。
【0070】
【0071】ここで、h'm(n)は、m番目のインパルス応
答パターンを示す。
【0072】また、補正量コードブック23は、補正量
コードブック12に替えて設けられ、少なくとも一つの
音源コードベクトルcj(n) について、補正量△j を格納
したコードブックを、K種のインパルス応答のパターン
の各々に対して、予め計算し( △j1,・・・・,△jK) 格納し
ておく。そして、分類回路22の分類結果に応じて、K
種の補正量コードブックを切り替え、切り替えた補正量
コードブック23の出力を音源探索回路13に出力す
る。その他の部分の動作は、第1の実施例と同一であ
る。
【0073】続いて、第3の実施例では、インパルス応
答計算回路32は、インパルス応答計算回路9に替えて
設けられ、インパルス応答を、2種類の次数L1、L2 (L1
<L2)だけ計算し、L1次のインパルス応答を適応コードブ
ック回路10に出力する。また、両方のインパルス応答
を、新たに付加された判別回路33に出力する。
【0074】判別回路33は、第1の量として補正量を
用いる。補正量コードブック12から少なくとも一つの
コードベクトルcj(n) に対する補正量△j を読みだす。
jが例えば、下式の条件を満足するときは、自己相関
法による近似誤差が大きいと判断し、インパルス応答の
長さを長くし、L2次のインパルス応答を音源探索回路1
3に出力する。
【0075】△j >Th (19) ここで、Thは、予め定められたしきい値である。
【0076】一方、(19)式の条件が満足されないとき
は、L1次のインパルス応答を音源探索回路13に出力す
る。その他の部分の動作は、第1の実施例と同一であ
る。
【0077】最後に、第4の実施例では、第2の実施例
と第3の実施例とを組み合わせたもので、分類回路22
は、インパルス応答計算回路32の出力する2種類の次
数L1 ,L2 のインパルス応答h(n)の内、次数L1 のイ
ンパルス応答h(n)を受け、予め定められたK種類のクラ
スに分類し補正量コードブック23に出力する。補正量
コードブック23は、分類回路22の出力に応じて、K
種類の補正量を切替えて出力する。判別回路33は、補
正量コードブック23から少なくとも一つの補正量を読
み出し、音源探索回路13が補正量コードブック12か
ら読み出す補正量を予め計算してある第1の量と比較
し、比較結果により補正量と共にインパルス応答の一方
を音源探索回路13に出力する。その他の部分の動作
は、第1の実施例と同一である。
【0078】以上、本発明の実施例について説明した
が、本発明の意向を損なうことなく、上述した実施例以
外にも種々の変形が可能である。
【0079】スペクトルパラメータはLSP以外にも他
の周知なパラメータを用いることができる。
【0080】スペクトルパラメータ分析回路ではフレー
ム中で少なくとも1つのサブフレームでスペクトルパラ
メータを計算するときに、前のサブフレームとの現在の
サブフレームとのRMSの変化あるいはパワーの変化を
測定し、これらの変化が大きな複数個のサブフレームに
対してスペクトルパラメータを計算するようにしてもよ
い。このようにすると、音声の変化点では必ずスペクト
ルパラメータを分析することになり、分析するサブフレ
ーム数を低減しても性能の劣化を防ぐことができる。
【0081】スペクトルパラメータの量子化には、ベク
トル量子化、スカラ量子化、ベクトルースカラ量子化な
ど周知な方法を用いることができる。
【0082】スペクトルパラメータ量子化回路における
補間パターンの選択には、他の周知な距離尺度を用いる
ことができる。
【0083】また、音声信号を量子化する回路におい
て、どの実施例も、コードブックが1段の場合について
説明したが、2段、あるいは多段構成にすることもでき
る。
【0084】また、音源コードブックの探索ならびに学
習のときの、距離尺度あるいは学習法は、他の周知な尺
度を用いることもできる。
【0085】補正量コードブックの学習には、周知の方
法を用いることができる。
【0086】前出(8) 、(9) 式では、音源コードブック
の探索の際、補正量を加算する構成としたが、補正量を
乗算する構成や、他の構成をとることもできる。
【0087】第2および第4の実施例の分類回路では、
インパルス応答を用いて分類したが、スペクトルパラメ
ータを用いて分類する構成や、他のパラメータを用いる
構成とすることができる。
【0088】第3および第4の実施例の判別回路では、
第1の量として、補正量を用いたが、他の構成として、
インパルス応答と補正量の両者を用いることもできる。
【0089】第1ないし第4の実施例のゲインコードブ
ックは、伝送ビット数よりも全体で数倍大きなのサイズ
のコードブックを予め学習し、予め定められたモード毎
にこのコードブックの一部の領域を使用領域としてアサ
インしておき、符号化するときは、モードに応じて使用
領域を切り替えて使用することもできる。
【0090】
【発明の効果】以上説明したように、本発明は、音源コ
ードブックの探索時に、音源コードベクトルの少なくと
も一つに対して、あらかじめ補正量を計算して補正量コ
ードブックに格納しておき、補正量を加味しながらコー
ドベクトルを探索するので、高速化音源探索法を用いた
ときに生ずる近似誤差を最小限におさえることが可能
で、劣化の少ない再生音声を提供できるという効果があ
る。また、スペクトルパラメータを分類した種類毎に異
なる補正量を求めておき、スペクトルパラメータにより
切り替えて使用することにより、さらに精度の高い再生
音声を提供できるという効果もある。さらに、少なくと
も一つの音源コードベクトルに対して第1の量をあらか
じめ計算しておき、音源コードベクトルを探索する際
に、前述の第1の量が予め定められた条件を満たすとき
は、音源探索のときにインパルス応答の次数を変えるこ
とにより、精度の高い再生音声を提供できるという効果
もある。このように本発明は、比較的少ない演算量及び
メモリ量により、4.8kb/s 以下のビットレートで音質の
良好な再生音声を提供できるという効果が有る。
【図面の簡単な説明】
【図1】本発明の第1の実施例のブロック図である。
【図2】本発明の第2の実施例のブロック図である。
【図3】本発明の第3の実施例のブロック図である。
【図4】本発明の第4の実施例のブロック図である。
【符号の説明】
1,21,31,41 音声符号化装置 2 フレーム分割回路 3 サブフレーム分割回路 4 スペクトルパラメータ分析回路 5 スペクトルパラメータ量子化回路 6 聴感重み付け回路 7 応答信号計算回路 8 減算器 9,32 インパルス応答計算回路 10 適応コードブック回路 11 音源コードブック 12,23 補正量コードブック 13 音源探索回路 14 ゲインコードブック 15 ゲイン量子化回路 16 重み付け信号計算回路 17 マルチプレクサ 22 分類回路 33 判別回路

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 音声信号もしくは音声信号から計算した
    信号を量子化する音声符号化装置であって、複数種類の
    コードベクトルからなるコードブックと、前記コードベ
    クトルの少なくとも一つに対して予め補正量を計算しこ
    の補正量を加味しながらコードベクトルを探索する音源
    探索手段とを有することを特徴とする音声符号化装置。
  2. 【請求項2】 入力した音声信号からスペクトルパラメ
    ータを求めるスペクトルパラメータ分析手段と、複数種
    類のコードベクトルからなるコードブックと、前記コー
    ドベクトルの少なくとも一つに対し予め想定した複数の
    スペクトルパラメータのそれぞれに合せて計算してある
    異なる複数種類の補正量を切り替えながら前記音声信号
    もしくは前記音声信号から計算した信号に対してコード
    ベクトルを探索する音源探索手段とを有することを特徴
    とする音声符号化装置。
  3. 【請求項3】 補正量を計算するための補正量コードブ
    ックを有することを特徴とする請求項1または2記載の
    音声符号化装置。
  4. 【請求項4】 入力した音声信号からスペクトルパラメ
    ータを求めるスペクトルパラメータ分析手段と、このス
    ペクトルパラメータ分析手段の求めたスペクトルパラメ
    ータをもとに複数種類のインパルス応答を計算するイン
    パルス応答計算手段と、複数種類のコードベクトルから
    なるコードブックと、前記コードベクトルの少なくとも
    一つに対し予め第1の量を計算し、前記音声信号もしく
    は前記音声信号から計算した信号に対してコードベクト
    ルを探索する際、該当のコードベクトルに対応する前記
    第1の量が予め定められた条件を満たすときは前記イン
    パルス応答長を変えて前記該当のコードベクトルを探索
    する音源探索手段とを有することを特徴とする音声符号
    化装置。
  5. 【請求項5】 入力した音声信号からスペクトルパラメ
    ータを求めるスペクトルパラメータ分析手段と、このス
    ペクトルパラメータ分析手段の求めたスペクトルパラメ
    ータをもとに複数種類のインパルス応答を計算するイン
    パルス応答計算手段と、複数種類のコードベクトルから
    なるコードブックと、前記コードベクトルの少なくとも
    一つに対し予め想定した複数のスペクトルパラメータの
    それぞれに合せて計算してある異なる第1の量を切り替
    えながら前記音声信号もしくは前記音声信号から計算し
    た信号に対して前記コードブックを探索する際、該当の
    コードベクトルに対応する前記第1の量が予め定められ
    た条件を満たすときは前記インパルス応答長を変えて前
    記該当のコードベクトルを探索する音源探索手段とを有
    することを特徴とする音声符号化装置。
JP6214838A 1994-08-02 1994-09-08 音声符号化装置 Expired - Lifetime JP2907019B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP6214838A JP2907019B2 (ja) 1994-09-08 1994-09-08 音声符号化装置
CA002154911A CA2154911C (en) 1994-08-02 1995-07-28 Speech coding device
EP00128106A EP1093115A3 (en) 1994-08-02 1995-08-01 Predictive coding of pitch lag in a speech coder
EP00128160A EP1093116A1 (en) 1994-08-02 1995-08-01 Autocorrelation based search loop for CELP speech coder
DE69530442T DE69530442T2 (de) 1994-08-02 1995-08-01 Vorrichtung zur Sprachkodierung
EP95112094A EP0696026B1 (en) 1994-08-02 1995-08-01 Speech coding device
US08/510,217 US5778334A (en) 1994-08-02 1995-08-02 Speech coders with speech-mode dependent pitch lag code allocation patterns minimizing pitch predictive distortion

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6214838A JP2907019B2 (ja) 1994-09-08 1994-09-08 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH0876800A true JPH0876800A (ja) 1996-03-22
JP2907019B2 JP2907019B2 (ja) 1999-06-21

Family

ID=16662382

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6214838A Expired - Lifetime JP2907019B2 (ja) 1994-08-02 1994-09-08 音声符号化装置

Country Status (1)

Country Link
JP (1) JP2907019B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003532149A (ja) * 2000-04-24 2003-10-28 クゥアルコム・インコーポレイテッド 音声発話を予測的に量子化するための方法および装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05273999A (ja) * 1992-03-30 1993-10-22 Hitachi Ltd 音声符号化方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05273999A (ja) * 1992-03-30 1993-10-22 Hitachi Ltd 音声符号化方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003532149A (ja) * 2000-04-24 2003-10-28 クゥアルコム・インコーポレイテッド 音声発話を予測的に量子化するための方法および装置
US8660840B2 (en) 2000-04-24 2014-02-25 Qualcomm Incorporated Method and apparatus for predictively quantizing voiced speech

Also Published As

Publication number Publication date
JP2907019B2 (ja) 1999-06-21

Similar Documents

Publication Publication Date Title
JP2746039B2 (ja) 音声符号化方式
JP3196595B2 (ja) 音声符号化装置
JP3094908B2 (ja) 音声符号化装置
EP0657874B1 (en) Voice coder and a method for searching codebooks
JPH056199A (ja) 音声パラメータ符号化方式
JP3180786B2 (ja) 音声符号化方法及び音声符号化装置
JP2624130B2 (ja) 音声符号化方式
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JPH0944195A (ja) 音声符号化装置
JP3308764B2 (ja) 音声符号化装置
JP3148778B2 (ja) 音声の符号化方法
JP3153075B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3360545B2 (ja) 音声符号化装置
JP3144284B2 (ja) 音声符号化装置
JP2907019B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JPH08185199A (ja) 音声符号化装置
JP3089967B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP3047761B2 (ja) 音声符号化装置
JP3471542B2 (ja) 音声符号化装置
JPH08320700A (ja) 音声符号化装置
JP3024467B2 (ja) 音声符号化装置
JP3092654B2 (ja) 信号符号化装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990302