JP3003531B2 - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JP3003531B2
JP3003531B2 JP7000300A JP30095A JP3003531B2 JP 3003531 B2 JP3003531 B2 JP 3003531B2 JP 7000300 A JP7000300 A JP 7000300A JP 30095 A JP30095 A JP 30095A JP 3003531 B2 JP3003531 B2 JP 3003531B2
Authority
JP
Japan
Prior art keywords
delay
signal
unit
value
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP7000300A
Other languages
English (en)
Other versions
JPH08185199A (ja
Inventor
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP7000300A priority Critical patent/JP3003531B2/ja
Priority to CA002154911A priority patent/CA2154911C/en
Priority to EP00128160A priority patent/EP1093116A1/en
Priority to EP00128106A priority patent/EP1093115A3/en
Priority to DE69530442T priority patent/DE69530442T2/de
Priority to EP95112094A priority patent/EP0696026B1/en
Priority to US08/510,217 priority patent/US5778334A/en
Publication of JPH08185199A publication Critical patent/JPH08185199A/ja
Application granted granted Critical
Publication of JP3003531B2 publication Critical patent/JP3003531B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号を低いビット
レートで高品質に符号化するための音声符号化装置に関
するものである。
【0002】
【従来の技術】音声信号を高能率に符号化する方式とし
て、例えば、M.Schroederand B.At
al氏による“Code−excited linea
rprediction: High quality
speech at very low bit r
ates”(Proc.ICASSP,pp.937−
940,1985年)と題した論文(文献1)や、Kl
eijn氏らによる“Improved speech
quality and efficient ve
ctor quantization in SEL
P”(Proc.ICASSP,pp.155−15
8,1988年)と題した論文(文献2)などに記載さ
れているCELP(Code Excited Lin
ear Predictive Coding)が知ら
れている。この従来例では、送信側では、フレーム毎
(例えば20ms)に音声信号から線形予測(LPC)
分析を用いて、音声信号のスペクトル特性を表すスペク
トルパラメータを抽出する。フレームをさらにサブフレ
ーム(例えば5ms)に分割し、サブフレーム毎に過去
の音源信号を基に適応コードブックにおけるパラメータ
(ピッチ周期に対応する遅延パラメータとゲインパラメ
ータ)を抽出し、適応コードブックにより前記サブフレ
ームの音声信号をピッチ予測する。ピッチ予測して求め
た音源信号に対して、予め定められた種類の雑音信号か
らなる音源コードブック(ベクトル量子化コードブッ
ク)から最適音源コードベクトルを選択し最適なゲイン
を計算することにより、音源信号を量子化する。音源コ
ードベクトルの選択の仕方は、選択した音源コードベク
トルにより合成した信号と、前記残差信号との誤差電力
を最小化するように行なう。そして、選択されたコード
ベクトルの種類を表すインデクスとゲインならびに、前
記スペクトルパラメータと適応コードブックのパラメー
タをマルチプレクサ部により組み合わせて伝送する。受
信側の説明は省略する。
【0003】
【発明が解決しようとする課題】前記従来法では、適応
コードブックにおいて、サブフレーム毎に遅延パラメー
タを求めて独立に伝送していた。例えば、音声の場合、
遅延は16−140サンプルの範囲に存在するが、ピッ
チ周期の短い女性音などで十分な精度を得るためには、
遅延を整数サンプルきざみではなく、小数サンプルきざ
みとする必要がある。このため、遅延を表すのにサブフ
レーム当たり最低8ビット必要であり、1フレームに4
サブフレーム収容されるとすればフレーム当たりで32
ビット必要であった。これはフレーム長を40msとし
た場合、1秒当たりの伝送量にして、1.6kb/sで
あった。
【0004】このため、音声信号を4kb/s以下で良
好に送ろうとした場合、遅延の伝送に必要な情報を低減
する必要があった。しかしながら、単純にサブフレーム
当たりのビット数を低減したのでは、ピッチ変化範囲が
狭まったり、精度が不十分になったりして音質が大幅に
劣化するという問題があった。
【0005】本発明は、上述の問題を解決し、少ないビ
ット数で遅延の伝送を可能とするので、音声信号を4k
b/s以下で良好に符号化することが可能となる。
【0006】
【課題を解決するための手段】第1の発明によれば、音
声信号を予め定めたフレーム単位に区切るフレーム分割
(110)と、前記音声信号からスペクトルパラメータ
求め量子化符号を出力するスペクトルパラメータ計算部
(200,210,211)と、スペクトルパラメータ計算部の出力
にもとづき遅延分過去の音源信号を切り出してピッチ予
測を行ない遅延を表す符号を出力する適応コードブック
(500)スペクトルパラメータ計算部の出力にもとづ
音源信号を量子化し量子化符号を出力する音源量子化
(350,351)と前記符号を多重化して送出するマルチプ
レクサ(400)を有する音声符号化装置において、前記適
応コードブックで求めた遅延を符号化する際に、過去の
差分量子化値(540)と予測係数(525)を用いて遅延値を予
測し(520)、予測した値と前記遅延との差分値を量子化
(530)し差分量子化符号を出力する適応コードブック部
(500)を有することを特徴とする音声符号化装置が得ら
れる。
【0007】第2の発明によれば、音声信号を予め定め
たフレーム単位に区切るフレーム分割部(110)と、前記
音声信号からスペクトルパラメータを求め量子化符号を
出力するスペクトルパラメータ計算部(200,210,211)
と、スペクトルパラメータ計算部の出力にもとづき遅延
分過去の音源信号を切り出してピッチ予測を行ない遅延
を表す符号を出力する適応コードブック部(600)とスペ
クトルパラメータ計算部の出力にもとづき音源信号を量
子化し量子化符号を出力する音源量子化部(350,351)と
前記符号を多重化して送出するマルチプレクサ(400)を
有する音声符号化装置において、 前記適応コードブッ
クで求めた遅延を符号化する際に、過去の差分量子化値
(540)と予測係数(525)を用いて遅延値を予測し(520)、
予測した値と前記遅延との差分値を求め、前記差分値を
もとに前記差分値を量子化するかあるいは予測をせずに
前記遅延値をそのまま量子化するかを判別(610)する適
応コードブック部(600)を有することを特徴とする音声
符号化装置が得られる。
【0008】第3の発明によれば、音声信号を予め定め
たフレーム単位に区切るフレーム分割部(110)と、前記
音声信号から特徴量を計算しモード判別を行なうモード
判別部(700)と、前記音声信号からスペクトルパラメー
タを求め量子化符号を出力するスペクトルパラメータ計
算部(200,210,211)と、スペクトルパラメータ計算部の
出力にもとづき遅延分過去の音源信号を切り出してピッ
チ予測を行ない遅延を表す符号を出力する適応コードブ
ック部(800)スペクトルパラメータ計算部の出力にも
とづき音源信号を量子化し量子化符号を出力する音源量
子化部(350,351)と前記符号を多重化して送出するマル
チプレクサ(400)を有する音声符号化装置において、
前記適応コードブックで求めた遅延を符号化する際に、
過去の差分量子化値(540)と予測係数(525)を用いて遅延
値を予測し(520)、予測した値と前記遅延との差分値を
量子化し(530)、差分量子化値を出力する適応コードブ
ック部(800)を有することを特徴とする音声符号化装置
が得られる。
【0009】第4の発明によれば、音声信号を予め定め
たフレーム単位に区切るフレーム分割部(110)と、前記
音声信号から特徴量を計算しモード判別を行なうモード
判別部(700)と、前記音声信号からスペクトルパラメー
タを求め量子化符号を出力するスペクトルパラメータ計
算部(200,210,211)と、スペクトルパラメータ計算部の
出力にもとづき遅延分過去の音源信号を切り出してピッ
チ予測を行ない遅延を表す符号を出力する適応コードブ
ック部(900)スペクトルパラメータ計算部の出力にも
とづき音源信号を量子化し量子化符号を出力する音源量
子化部(350,351)と前記符号を多重化して送出するマル
チプレクサ(400)を有する音声符号化装置において、
前記適応コードブックで求めた遅延を符号化する際に、
過去の差分量子化値(540)と予測係数(525)を用いて遅延
値を予測し(520)、予測した値と前記遅延との差分値を
求め、前記差分値をもとに前記差分値を量子化(530)す
るかあるいは予測をせずに前記遅延値をそのまま量子化
するかを判別(910)する適応コードブック部(900)を有す
ることを特徴とする音声符号化装置が得られる。
【0010】
【実施例】図1は第1の発明による音声符号化装置の一
実施例を示すブロック図である。
【0011】図において、入力端子100から音声信号
を入力し、フレーム分割回路110では音声信号をフレ
ーム(例えば40ms)毎に分割し、サブフレーム分割
回路120では、フレームの音声信号をフレームよりも
短いサブフレーム(例えば8ms)に分割する。
【0012】スペクトルパラメータ計算回路200で
は、少なくとも一つのサブフレームの音声信号に対し
て、サブフレーム長よりも長い窓(例えば24ms)を
かけて音声を切り出してスペクトルパラメータを予め定
められた次数(例えばP=10次)を計算する。ここで
スペクトルパラメータの計算には、周知のLPC分析
や、Burg分析等を用いることができる。ここでは、
Burg分析を用いることとする。Burg分析の詳細
については、中溝著による“信号解析とシステム同定”
と題した単行本(コロナ社1988年刊)の82〜87
頁(文献3)等に記載されているので説明は省略する。
さらにスペクトルパラメータ計算部では、Burg法に
より計算された線形予測係数αi (i=1,…,10)
を量子化や補間に適したLSPパラメータに変換する。
ここで、線形予測係数からLSPへの変換は、菅村他に
よる“線スペクトル対(LSP)音声分析合成方式によ
る音声情報圧縮”と題した論文(電子通信学会論文誌、
J64−A、pp.599−606、1981年)(文
献4)を参照することができる。例えば、第1、3、5
サブフレームでBurg法により求めた線形予測係数
を、LSPパラメータに変換し、第2、4サブフレーム
のLSPを直線補間により求めて、第2、4サブフレー
ムのLSPを逆変換して線形予測係数に戻し、第1−5
サブフレームの線形予測係数αil(i=1,…,10,
l=1,…,5)を聴感重み付け回路230に出力す
る。また、第5サブフレームのLSPをスペクトルパラ
メータ量子化回路210へ出力する。
【0013】スペクトルパラメータ量子化回路210で
は、あらかじめ定められたサブフレームのLSPパラメ
ータを効率的に量子化する。以下では、量子化法とし
て、ベクトル量子化を用いるものとし、第5サブフレー
ムのLSPパラメータを量子化するものとする。LSP
パラメータのベクトル量子化の手法は周知の手法を用い
ることができる。具体的な方法は例えば、特開平4−1
71500号公報(特願平2−297600号)(文献
5)や特開平4−363000号公報(特願平3−26
1925号)(文献6)や、特開平5−6199号公報
(特願平3−155049号)(文献7)や、T.No
mura et al.,による“LSPCoding
Using VQ−SVQ With Interp
olation in 4.075kbps M−LC
ELP Speech Coder”と題した論文(P
roc.Mobile Multimedia Com
munications,pp.B.2.5,199
3)(文献8)等を参照できるのでここでは説明は省略
する。
【0014】また、スペクトルパラメータ量子化回路2
10では、第5サブフレームで量子化したLSPパラメ
ータをもとに、第1〜第4サブフレームのLSPパラメ
ータを復元する。ここでは、現フレームの第5サブフレ
ームの量子化LSPパラメータと1つ過去のフレームの
第5サブフレームの量子化LSPを直線補間して、第1
〜第4サブフレームのLSPを復元する。ここで、量子
化前のLSPと量子化後のLSPとの誤差電力を最小化
するコードベクトルを1種類選択した後に、直線補間に
より第1〜第4サブフレームのLSPを復元できる。さ
らに性能を向上させるためには、前記誤差電力を最小化
するコードベクトルを複数候補選択したのちに、各々の
候補について、累積歪を評価し、累積歪を最小化する候
補と補間LSPの組を選択するようにすることができ
る。詳細は、例えば、特願平5−8737号明細書(文
献9)を参照することができる。
【0015】以上により復元した第1−4サブフレーム
のLSPと第5サブフレームの量子化LSPをサブフレ
ーム毎に線形予測係数α′il(i=1,…,10,l=
1,…,5)に変換し、インパルス応答計算回路310
へ出力する。また、第5サブフレームの量子化LSPの
コードベクトルを表すインデクスをマルチプレクサ40
0に出力する。
【0016】上記において、直線補間のかわりに、LS
Pの補間パターンを予め定められたビット数(例えば2
ビット)分用意しておき、これらのパターンの各々に対
して1〜4サブフレームのLSPを復元して累積歪を最
小化するコードベクトルと補間パターンの組を選択する
ようにしてもよい。このようにすると補間パターンのビ
ット数だけ伝送情報が増加するが、LSPのフレーム内
での時間的な変化をより精密に表すことができる。ここ
で、補間パターンは、トレーニング用のLSPデータを
用いて予め学習して作成してもよいし、予め定められた
パターンを格納しておいてもよい。予め定められたパタ
ーンとしては、例えば、T.Taniguchi et
alによる“Improved CELP spee
ch coding at 4kb/s and be
low”と題した論文(Proc.ICSLP,pp.
41−44,1992)(文献10)等に記載のパター
ンを用いることができる。また、さらに性能を改善する
ためには、補間パターンを選択した後に、予め定められ
たサブフレームにおいて、LSPの真の値とLSPの補
間値との誤差信号を求め、前記誤差信号をさらに誤差コ
ードブックで表すようにしてもよい。
【0017】聴感重み付け回路230は、スペクトルパ
ラメータ計算回路200から、各サブフレーム毎に量子
化前の線形予測係数αil(i=1,…,10,l=1,
…,5)を入力し、前記文献1にもとづき、サブフレー
ムの音声信号に対して聴感重み付けを行い、聴感重み付
け信号xw (n)を出力する。
【0018】応答信号計算回路240は、スペクトルパ
ラメータ計算回路200から、各サブフレーム毎に線形
予測係数αilを入力し、スペクトルパラメータ量子化回
路210から、量子化、補間して復元した線形予測係数
α′ilをサブフレーム毎に入力し、保存されているフィ
ルタメモリの値を用いて、入力信号d(n)=0とした
応答信号を1サブフレーム分計算し、減算器235へ出
力する。ここで、応答信号xz (n)は下式で表され
る。
【0019】
【数1】
【0020】ここで、γは、聴感重み付け量を制御する
重み係数であり、下記の式(3)と同一の値である。
【0021】減算器235は、下式により、聴感重み付
け信号から応答信号を1サブフレーム分減算し、x′w
(n)を適応コードブック回路500へ出力する。
【0022】 x′w (n)=xw (n)−xz (n) (2) インパルス応答計算回路310は、z変換が下式で表さ
れる重み付けフィルタのインパルス応答hw (n)を予
め定められた点数Lだけ計算し、適応コードブック回路
300、音源量子化回路350へ出力する。
【0023】
【数2】
【0024】適応コードブック回路500の構成を図2
に示す。図2において、遅延計算部510では、端子5
01、502、503の各々から、過去の音源信号v
(n)、減算器235の出力信号x’w(n)、インパ
ルス応答hw (n)を入力し、適応コードブックの遅延
Tを下式を最小化するように求める。なお、遅延Tの時
間長は音声信号のピッチ周期に対応する。
【0025】
【数3】
【0026】ここで、 yw (n−T)=v(n−T)*hw (n) (5) であり、記号*は畳み込み演算を表す。
【0027】ゲインβを下式に従い求める。
【0028】
【数4】
【0029】ここで、女性音や子供の声に対して、遅延
の抽出精度を向上させるために、遅延を整数サンプルで
はなく、小数サンプル値で求めてもよい。具体的な方法
は、例えば、P.Kroonらによる、“Pitch
predictors with high temp
oral resolution”と題した論文(Pr
oc.ICASSP,pp.661−664,1990
年)(文献11)等を参照することができる。
【0030】遅延予測部520では、遅延Tを入力し、
さらに、サブフレーム遅延部540から過去のサブフレ
ームの遅延の差分量子化値を、予測係数コードブック5
25から予測係数を入力して、現在のサブフレームの遅
延をMA(Moving Average)予測する。
一例として過去の一つのサブフレームの量子化値を予測
に用いる場合について下式に示す。
【0031】 Th =ηeh l-1 (7) ここで、ηは予測係数コードブックに格納された固定の
予測係数である。差分量子化部530では、下式に従い
差分を計算する。
【0032】 el =T−Th (8) 差分値el を予め定められた量子化ビット数で表して量
子化し、量子化値eh lを求め、遅延復元部550へ出
力する。量子化値eh l はサブフレーム遅延部540へ
出力する。また、量子化値eh l を表すインデクスを端
子505から出力する。
【0033】遅延復元部550では、下式に従い、遅延
T′を復元し出力する。
【0034】 T′=Th +eh l (9) また、ピッチ予測部560では、下式に従いピッチ予測
を行い、適応コードブック予測算差信号z(n)を端子
504から出力する。
【0035】 z(n)=x′w (n)−βv(n−T′)*hw (n) (10) 以上で適応コードブック回路500の説明を終える。
【0036】音源量子化回路350では、音源コードブ
ックを探索する例について示す。音源コードブック35
1に格納されているコードベクトルを探索することによ
り、音源信号を量子化する。音源コードベクトルの探索
は、式を最小化するように、最良の音源コードベクトル
j (n)を選択する。このとき、最良のコードベクト
ルを1種選択してもよいし、2種以上のコードベクトル
を選んでおいて、ゲイン量子化の際に、1種に本選択し
てもよい。ここでは、2種以上のコードベクトルを選ん
でおくものとする。
【0037】
【数5】
【0038】なお、一部の音源コードベクトルに対して
のみ、下式を適用するときには、複数個の音源コードベ
クトルをあらかじめ予備選択しておき、予備選択された
音源コードベクトルに対して、下式を適用することもで
きる。
【0039】ゲイン量子化回路365は、ゲインコード
ブック355からゲインコードベクトルを読みだし、選
択された音源コードベクトルに対して、下式を最小化す
るように、音源コードベクトルとゲインコードベクトル
の組み合わせを選択する。
【0040】
【数6】
【0041】ここで、β′k 、γ′k は、ゲインコード
ブック355に格納された2次元ゲインコードブックに
おけるk番目のコードベクトルである。選択された音源
コードベクトルとゲインコードベクトルを表すインデク
スをマルチプレクサ400に出力する。
【0042】重み付け信号計算回路360は、スペクト
ルパラメータ計算回路の出力パラメータ及び、それぞれ
のインデクスを入力し、インデクスからそれに対応する
コードベクトルを読みだし、まず下式にもとづき駆動音
源信号v(n)を求める。
【0043】 v(n)=β′k v(n−T)+γ′k j (n) (13) 次に、スペクトルパラメータ計算回路200の出力パラ
メータ、スペクトルパラメータ量子化回路210の出力
パラメータを用いて下式により、応答信号sw(n)を
サブフレーム毎に計算し、応答信号計算回路240へ出
力する。
【0044】
【数7】
【0045】以上により、第1の発明に対応する実施例
の説明を終える。
【0046】第2の発明の一実施例を示すブロック図を
図3に示す。第2の発明では、第1の発明と適応コード
ブック回路600の動作が異なるので、適応コードブッ
ク回路600の動作を図4を用いて説明する。なお、図
4において、図2と同一の番号を付した構成要素は、図
2と同一の動作を行なうので説明は省略する。
【0047】判別部610は、遅延予測部520の出力
である遅延予測値Th と、遅延計算部510から現サブ
フレームの遅延Tを入力し、下式により誤差を求める。
【0048】 el =T−Th (15) 誤差el の例えば絶対値を予め定められたしきい値と比
較し、しきい値よりも小さい時は、予測を用い、しきい
値よりも大きいときは予測しないという予測判別信号を
求め、スイッチ6201 ,6202 と端子506に出力
する。
【0049】スイッチ6201 は、予測判別信号を入力
し、予測なしのときはスイッチを上側に倒し、予測あり
のときは下側に倒すことにより、予測なしのときは、遅
延計算部510からの出力であるTを、予測ありのとき
は遅延復元部550からの出力であるT′をピッチ予測
部560に出力する。スイッチ6202 は、予測判別信
号を入力し、予測なしのときは遅延Tに対応するインデ
クスを、予測ありのときは、差分量子化のインデクスを
端子505に出力する。
【0050】以上で説明を終える。
【0051】図5は第3の発明の一実施例を示すブロッ
ク図である。図において、図1と同一の番号を付した構
成要素は、図1と同一の動作を行なうので、説明は省略
する。図5において、モード判別回路700は、聴感重
み付け回路230からフレーム単位で聴感重み付け信号
を受取り、モード判別情報を出力する。ここでは、モー
ド判別に、現在のフレームの特徴量を用いる。特徴量と
しては、例えばピッチ予測ゲインを用いる。ピッチ予測
ゲインの計算は、例えば下式を用いる。
【0052】
【数8】
【0053】ここで、Tは予測ゲインを最大化する最適
遅延である。
【0054】ピッチ予測ゲインをあらかじめ定められた
複数個のしきい値と比較して複数種類のモードに分類す
る。モードの個数としては、例えば4を用いることがで
きる。
【0055】モード判別回路700は、モード判別情報
を適応コードブック回路800へ出力する。
【0056】適応コードブック回路800の構成を図6
に示す。図において、図2、4と同一の番号を付した構
成要素は、図2、4と同一の働きをするので説明は省略
する。図6において、スイッチ8201 、8202 は、
端子801からモード判別情報を入力し、モードに応じ
て、遅延の予測あり/なしを切替える。
【0057】また、モード情報に応じて、ピッチ予測部
860の動作を変える。例えば、予め定められたモード
のみ(例えばモード0)、適応コードブック回路を使用
しないようにすることもできる。このようにするには、
ピッチ予測部860の演算において、(9)式を実行す
るときに、ゲインβを0として実行すれば良い。
【0058】図7は第4の発明の一実施例を示すブロッ
ク図である。図において、図1、3、5と同一の番号を
付した構成要素は、同一の動作を行なうので、説明は省
略する。図7では、適応コードブック回路900の動作
が異なるので、この構成を図8に示す。図8において、
図4、6と同一の番号を付した構成要素は、同一の動作
を行なうので、説明は省略する。図8において、端子9
01からモード情報を入力し、判別部910へ出力す
る。判別部910では、予め定められたモードについて
予測残差の判別を行ない、予測あり/なしの判別信号を
スイッチ6201、6202 に出力する。あらかじめ定
められたモード以外では、予測なしとしておく。
【0059】以上で本発明の実施例の説明を終える。
【0060】上述した実施例に限らず、種々の変形が可
能である。
【0061】適応コードブック回路において、遅延予測
部520では、過去の複数フレームの差分量子化値から
遅延を予測する高次予測としてもよい。予測の次数をL
とすると、予測式は下式を使用する。
【0062】
【数9】
【0063】また、予測係数コードブックは、モード毎
に切替えてもよい。
【0064】音源量子化回路の音源コードブックの構成
としては、他の周知な構成、例えば、多段構成や、スパ
ース構成などを用いることができる。
【0065】モード判別情報を用いて音源量子化回路に
おける音源コードブックを切替える構成とすることもで
きる。
【0066】音源量子化回路では、音源コードブックを
探索する例について示したが、複数個の位置と振幅の異
なるマルチパルスを探索するようにしてもよい。ここ
で、マルチパルスの振幅と位置は、下式を最小化するよ
うに行なう。
【0067】
【数10】
【0068】ここで、gj ,mj はそれぞれ、j番目の
マルチパルスの振幅、位置を示す。kはマルチパルスの
個数である。
【0069】
【発明の効果】以上説明したように、本発明によれば、
音声符号化装置において、遅延を過去の差分量子化値を
用いて予測することにより、遅延を表すのに必要なビッ
ト数をサブフレーム当たり例えば8ビットから5ビット
程度に低減化することができる。これは、1秒当たりの
遅延伝送量にすると、1.6kb/sから1kb/sに
低減化できるので、音声全体の符号化速度を4kb/s
以下に低減化することが容易となり、低減化しても従来
よりも良好な音質が得られるという効果がある。
【図面の簡単な説明】
【図1】第1の発明の実施例を示す図。
【図2】適応コードブック回路500の構成を示す図。
【図3】第2の発明の実施例を示す図。
【図4】適応コードブック回路600の構成を示す図。
【図5】第3の発明の実施例を示す図。
【図6】適応コードブック回路800の構成を示す図。
【図7】第4の発明の実施例を示す図。
【図8】適応コードブック回路900の構成を示す図。
【符号の説明】
110 フレーム分割回路 120 サブフレーム分割回路 200 スペクトルパラメータ計算回路 210 スペクトルパラメータ量子化回路 211 LSPコードブック 230 重み付け回路 235 減算回路 240 応答信号計算回路 500,600,800,900 適応コードブック回
路 310 インパルス応答計算回路 350 音源量子化回路 351 音源コードブック 355 ゲインコードブック 360 重み付け信号計算回路 365 ゲイン量子化回路 400 マルチプレクサ 510 遅延計算部 520 遅延予測部 525 予測係数コードブック 530 差分量子化部 540 サブフレーム遅延部 550 遅延復元部 560,860 ピッチ予測部 6201 ,6202 ,8201 ,8202 スイッチ回
路 700 モード判別回路

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】フレーム分割部(110)、スペクトルパ
    ラメータ計算部(200)、適応コードブック部(50
    0)、音源信号算出部(350,351,355,36
    5)、応答信号作成部(240)、マルチプレクサ(4
    00)を備える音声符号化装置において、 フレーム分割部(110)は、入力される音声信号をフ
    レーム音声信号に分割し、 スペクトルパラメータ計算部(200)は、フレーム音
    声信号からスペクトルパラメータを算出し、 適応コードブック部(500)は、遅延計算部(51
    0)、遅延予測部(520)、予測係数コードブック
    (525)、差分量子化部(530)、遅延部(54
    0)、遅延復元部(550)、ピッチ予測部(56
    0)、を備えると共に、音源信号、フレーム音声信号か
    ら応答信号を減算した信号である差分信号と、スペクト
    ルパラメータを入力し、予測残差信号、差分量子化値を
    出力し、 遅延計算部(510)は、音源信号、差分信号、スペク
    トルパラメータに基づいて遅延値(T)、ゲイン(β)
    を計算し、 遅延予測部(520)は、この遅延値、遅延部の出力、
    予測係数コードブック(525)の記憶する予測係数に
    基づいて予測遅延値を計算し、 差分量子化部(530)は、遅延値と予測遅延値の差分
    値を量子化し差分量子化符号をマルチプレクサに出力
    し、 遅延部は、この量子化された差分値に所定の遅延を付与
    して遅延予測部に供給し、 遅延復元部(550)は、予測遅延値と差分値に基づい
    て復元遅延値を算出し、 ピッチ予測部は、復元遅延値、差分信号、スペクトルパ
    ラメータ、ゲイン(β)に基づいて予測残差信号を出力
    し、 音源信号算出部は、予測残差信号、スペクトルパラメー
    タに基づいて音源信号を算出し、マルチプレクサに出力
    応答信号作成部は、音源信号、スペクトルパラメータ
    に基づいて前記応答信号を生成する 音声符号化装置。
  2. 【請求項2】フレーム分割部(110)、スペクトルパ
    ラメータ計算部(200)、適応コードブック部(60
    0)、音源信号算出部(350,351,355,36
    5)、応答信号作成部(240)、マルチプレクサ(4
    00)を備える音声符号化装置において、 フレーム分割部(110)は、入力される音声信号をフ
    レーム音声信号に分割し、 スペクトルパラメータ計算部(200)は、フレーム音
    声信号からスペクトルパラメータを算出し、 適応コードブック部(500)は、遅延計算部(51
    0)、遅延予測部(520)、予測係数コードブック
    (525)、差分量子化部(530)、遅延部(54
    0)、遅延復元部(550)、ピッチ予測部(56
    0)、判別部(610)、第1スイッチ(620 )、
    第2スイッチ(620 )を備えると共に、音源信号、
    フレーム音声信号から応答信号を減算した信号である差
    分信号と、スペクトルパラメータを入力し、予測残差信
    号、差分量子化値を出力し、 遅延計算部(510)は、音源信号、差分信号、スペク
    トルパラメータに基づいて遅延値(T)、ゲイン(β)
    を計算して、遅延値(T)を遅延予測部と第1スイッチ
    の第1の入力に供給し、 遅延予測部(520)は、この遅延値(T)、遅延部の
    出力、予測係数コードブック(525)の記憶する予測
    係数に基づいて予測遅延値(Th)を計算し、 差分量子化部(530)は、遅延値と予測遅延値の差分
    値を量子化し差分量子化符号を第2のスイッチの第2の
    入力に供給し、 遅延部は、この量子化された差分値に所定の遅延を付与
    して遅延予測部に供給し、 遅延復元部(550)は、予測遅延値と差分値に基づい
    て復元遅延値を算出 して、第1スイッチの第2の入力に
    供給し、 判別部(610)は、遅延計算部出力の遅延値Tと遅延
    予測部出力の遅延予測値(Th)との差(|T−Th
    |)が閾値より大であるか否かを判定し、 第1のスイッチ(620 )は、判別部出力が、|T−
    Th|が閾値より大であることを示しているときはその
    第1の入力を出力し、そうでない場合にはその第2の入
    力を出力し、 第2のスイッチ(620 )は、判別部出力が、|T−
    Th|が閾値より大であることを示しているときはその
    第1の入力を出力し、そうでない場合にはその第2の入
    力を出力し、 ピッチ予測部は、第1のスイッチ出力、差分信号、スペ
    クトルパラメータ、ゲイン(β)に基づいて予測残差信
    号を出力し、 音源信号算出部は、予測残差信号、スペクトルパラメー
    タに基づいて音源信号を算出し、マルチプレクサに出力
    応答信号作成部は、音源信号、スペクトルパラメータ
    に基づいて前記応答信号を生成する 音声符号化装置。
  3. 【請求項3】フレーム分割部(110)、スペクトルパ
    ラメータ計算部(200)、適応コードブック部(80
    0)、音源信号算出部(350,351,355,36
    5)、応答信号作成部(360,240)、マルチプレ
    クサ(400)、モード判別回路(700)を備える音
    声符号化装置において、 フレーム分割部(110)は、入力される音声信号をフ
    レーム音声信号に分割し、 スペクトルパラメータ計算部(200)は、フレーム音
    声信号からスペクトルパラメータを算出し、 判別回路(700)は、フレーム音声信号の性質を示す
    モード信号を生成し、マルチプレクサ及び適応コードブ
    ック部に出力し、 適応コードブック部(500)は、遅延計算部(51
    0)、遅延予測部(520)、予測係数コードブック
    (525)、差分量子化部(530)、遅延部(5
    0)、遅延復元部(550)、ピッチ予測部(56
    0)、第1スイッチ(620 )、第2スイッチ(62
    )を備えると共に、音源信号、フレーム音声信号か
    ら応答信号を減算した信号である差分信号と、スペクト
    ルパラメータとモード信号を入力し、予測残差信号、差
    分量子化値を出力し、 遅延計算部(510)は、音源信号、差分信号、スペク
    トルパラメータに基づいて遅延値(T)、ゲイン(β)
    を計算して、遅延値(T)を遅延予測部と第1スイッチ
    の第1の入力に供給し、 遅延予測部(520)は、この遅延値(T)、遅延部の
    出力、予測係数コードブック(525)の記憶する予測
    係数に基づいて予測遅延値(Th)を計算し、 差分量子化部(530)は、遅延値と予測遅延値の差分
    値を量子化し差分量子化符号を第2のスイッチの第2の
    入力に供給し、 遅延部は、この量子化された差分値に所定の遅延を付与
    して遅延予測部に供給し、 遅延復元部(550)は、予測遅延値と差分値に基づい
    て復元遅延値を算出して、第1スイッチの第2の入力に
    供給し、 第1のスイッチ(620 )は、モード信号に応じてそ
    の第1の入力または第2の入力を選択出力し、 第2のスイッチ(620 )は、モード信号に応じてそ
    の第1の入力または第2の入力を選択出力し、 ピッチ予測部は、第1のスイッチ出力、差分信号、スペ
    クトルパラメータ、ゲイン(β)に基づいて予測残差信
    号を出力し、 音源信号算出部(350,351,355,365)
    は、予測残差信号、スペクトルパラメータに基づいて音
    源信号を算出し、マルチプレクサに出力し 応答信号作成
    部(240,360)は、音源信号、スペクトルパラメ
    ータに基づいて前記応答信号を生成する 音声符号化装
    置。
  4. 【請求項4】フレーム分割部(110)、スペクトルパ
    ラメータ計算部(200)、適応コ ードブック部(80
    0)、音源信号算出部(350,351,355,36
    5)、応答信号作成部(360,240)、マルチプレ
    クサ(400)、モード判別回路(700)を備える音
    声符号化装置において、 フレーム分割部(110)は、入力される音声信号をフ
    レーム音声信号に分割し、 スペクトルパラメータ計算部(200)は、フレーム音
    声信号からスペクトルパラメータを算出し、 モード判別回路(700)は、フレーム音声信号の性質
    を示すモード信号を生成し、マルチプレクサ及び適応コ
    ードブック部に出力し、 適応コードブック部(500)は、遅延計算部(51
    0)、遅延予測部(520)、予測係数コードブック
    (525)、差分量子化部(530)、遅延部(54
    0)、遅延復元部(550)、ピッチ予測部(56
    0)、判別部(910)、第1スイッチ(620 )、
    第2スイッチ(620 )を備えると共に、音源信号、
    フレーム音声信号と応答信号との差である差分信号と、
    スペクトルパラメータとモード信号を入力し、予測残差
    信号、差分量子化値を出力し、 遅延計算部(510)は、音源信号、差分信号、スペク
    トルパラメータに基づいて遅延値(T)、ゲイン(β)
    を計算して、遅延値(T)を遅延予測部と第1スイッチ
    の第1の入力に供給し、 遅延予測部(520)は、この遅延値(T)、遅延部の
    出力、予測係数コードブック(525)の記憶する予測
    係数に基づいて予測遅延値(Th)を計算し、 判別部(910)は、モード信号を受け、予め定められ
    たモードにおいて、遅延値(T)と遅延予測値(Th)
    差が閾値以下の場合にのみ「予測あり」を示す信号を送
    出し、それ以外の場合には、「予測なし」を示す信号を
    出力し、 差分量子化部(530)は、遅延値と予測遅延値の差分
    値を量子化し差分量子化符号を第2のスイッチの第2の
    入力に供給し、 遅延部は、この量子化された差分値に所定の遅延を付与
    して遅延予測部に供給し、 遅延復元部(550)は、予測遅延値と差分値に基づい
    て復元遅延値を算出 して、第1スイッチの第2の入力に
    供給し、 第1のスイッチ(620 )は、判別部出力が「予測あ
    り」を示しているときはその第2の入力を選択出力し、
    そうでない場合には、第1の入力を選択出力し、 第2のスイッチ(620 )は、判別部出力「予測あ
    り」を示しているときはその第2の入力を選択出力し、
    そうでない場合には、第1の入力を選択出力し、 ピッチ予測部は、第1のスイッチ出力、差分信号、スペ
    クトルパラメータ、ゲイン(β)に基づいて予測残差信
    号を出力し、 音源信号算出部(350,351,355,365)
    は、予測残差信号、スペクトルパラメータに基づいて音
    源信号を算出し、マルチプレクサに出力し 応答信号作成
    部(240,360)は、音源信号、スペクトルパラメ
    ータに基づいて前記応答信号を生成する 音声符号化装
    置。
JP7000300A 1994-08-02 1995-01-05 音声符号化装置 Expired - Fee Related JP3003531B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP7000300A JP3003531B2 (ja) 1995-01-05 1995-01-05 音声符号化装置
CA002154911A CA2154911C (en) 1994-08-02 1995-07-28 Speech coding device
EP00128106A EP1093115A3 (en) 1994-08-02 1995-08-01 Predictive coding of pitch lag in a speech coder
DE69530442T DE69530442T2 (de) 1994-08-02 1995-08-01 Vorrichtung zur Sprachkodierung
EP00128160A EP1093116A1 (en) 1994-08-02 1995-08-01 Autocorrelation based search loop for CELP speech coder
EP95112094A EP0696026B1 (en) 1994-08-02 1995-08-01 Speech coding device
US08/510,217 US5778334A (en) 1994-08-02 1995-08-02 Speech coders with speech-mode dependent pitch lag code allocation patterns minimizing pitch predictive distortion

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7000300A JP3003531B2 (ja) 1995-01-05 1995-01-05 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH08185199A JPH08185199A (ja) 1996-07-16
JP3003531B2 true JP3003531B2 (ja) 2000-01-31

Family

ID=11470059

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7000300A Expired - Fee Related JP3003531B2 (ja) 1994-08-02 1995-01-05 音声符号化装置

Country Status (1)

Country Link
JP (1) JP3003531B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3180762B2 (ja) 1998-05-11 2001-06-25 日本電気株式会社 音声符号化装置及び音声復号化装置
JP3180786B2 (ja) 1998-11-27 2001-06-25 日本電気株式会社 音声符号化方法及び音声符号化装置
JP2003532149A (ja) * 2000-04-24 2003-10-28 クゥアルコム・インコーポレイテッド 音声発話を予測的に量子化するための方法および装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001052241A1 (en) * 2000-01-11 2001-07-19 Matsushita Electric Industrial Co., Ltd. Multi-mode voice encoding device and decoding device
JP4108317B2 (ja) 2001-11-13 2008-06-25 日本電気株式会社 符号変換方法及び装置とプログラム並びに記憶媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3180762B2 (ja) 1998-05-11 2001-06-25 日本電気株式会社 音声符号化装置及び音声復号化装置
JP3180786B2 (ja) 1998-11-27 2001-06-25 日本電気株式会社 音声符号化方法及び音声符号化装置
JP2003532149A (ja) * 2000-04-24 2003-10-28 クゥアルコム・インコーポレイテッド 音声発話を予測的に量子化するための方法および装置

Also Published As

Publication number Publication date
JPH08185199A (ja) 1996-07-16

Similar Documents

Publication Publication Date Title
JP3196595B2 (ja) 音声符号化装置
JP3094908B2 (ja) 音声符号化装置
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JP3180786B2 (ja) 音声符号化方法及び音声符号化装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP3137176B2 (ja) 音声符号化装置
JP3266178B2 (ja) 音声符号化装置
JP2624130B2 (ja) 音声符号化方式
JPH0944195A (ja) 音声符号化装置
JP2970407B2 (ja) 音声の励振信号符号化装置
JP3308764B2 (ja) 音声符号化装置
JP3003531B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3153075B2 (ja) 音声符号化装置
JP3360545B2 (ja) 音声符号化装置
JP3144284B2 (ja) 音声符号化装置
JP2001318698A (ja) 音声符号化装置及び音声復号化装置
JP2956068B2 (ja) 音声符号化復号化方式
JP3089967B2 (ja) 音声符号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP3192051B2 (ja) 音声符号化装置
JPH08320700A (ja) 音声符号化装置
JP3471542B2 (ja) 音声符号化装置
JP3024467B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19991019

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071119

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081119

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081119

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091119

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091119

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101119

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111119

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111119

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121119

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121119

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131119

Year of fee payment: 14

LAPS Cancellation because of no payment of annual fees