JP3100082B2 - 音声符号化・復号化方式 - Google Patents

音声符号化・復号化方式

Info

Publication number
JP3100082B2
JP3100082B2 JP03267112A JP26711291A JP3100082B2 JP 3100082 B2 JP3100082 B2 JP 3100082B2 JP 03267112 A JP03267112 A JP 03267112A JP 26711291 A JP26711291 A JP 26711291A JP 3100082 B2 JP3100082 B2 JP 3100082B2
Authority
JP
Japan
Prior art keywords
opt
vector
pitch
codebook
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03267112A
Other languages
English (en)
Other versions
JPH0561499A (ja
Inventor
秀明 栗原
智彦 谷口
恭士 大田
良広 坂井
良紀 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP03267112A priority Critical patent/JP3100082B2/ja
Publication of JPH0561499A publication Critical patent/JPH0561499A/ja
Application granted granted Critical
Publication of JP3100082B2 publication Critical patent/JP3100082B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声符号化・復号化方
式に関し、特にベクトル量子化を用いて音声信号の情報
圧縮を行う高能率な音声符号化・復号化方式に関するも
のである。
【0002】近年、企業内通信システム・ディジタル移
動無線システムなどにおいて、音声信号をその品質を保
持しつつ情報圧縮するベクトル量子化方式が用いられて
いるが、このベクトル量子化方式とは、符号帳(コード
ブック)の各信号ベクトルに予測重み付けを施して再生
信号を作り、再生信号と入力音声信号との間の誤差電力
を評価して最も誤差の小さい信号ベクトルの番号(イン
デックス)を決定するものとして良く知られたものであ
るが、音声情報をより一層圧縮するためこのベクトル量
子化方式をより進めた方式に対する要求が高まってい
る。
【0003】
【従来の技術】図12及び図13には、ベクトル量子化
を用いたCELP(Code Excited LPC)と呼ばれる高能率
音声符号化方式が示されており、この内、図12は逐次
最適化CELPと呼ばれ、図13は同時最適化CELP
と呼ばれる方式を示している。尚、以下の説明で用いる
符号P,X,Y,C,及びEはそれぞれベクトルを意味
するものとする(但し、図面中ではベクトル特有の記号
で示している)。
【0004】図12において、適応符号帳1aは音声信
号を1サンプルづつピッチ周期が遅延されたNサンプル
に対応するN次元のピッチ予測残差ベクトルが適応的に
変化しながら格納されて行くものであり、また固定符号
帳2には同様のNサンプルに対応するN次元の白色雑音
を用いて生成した適応符号帳1aでの周期的な成分以外
の非周期的な成分のコード・ベクトルが2m パターンだ
け予め固定設定されている。
【0005】まず、適応符号帳1aの各ピッチ予測残差
ベクトルPにスカラーA=1/A’(Z) (但し、A’
(Z) は聴覚重み付け線形予測分析フィルタを示す)で示
される聴覚重み付け線形予測再生フィルタ3で聴覚重み
付けして生成されたピッチ予測ベクトルAPにゲイン5
でゲインbを乗算してピッチ予測再生信号ベクトルbA
Pを生成する。
【0006】そして、このピッチ予測再生信号ベクトル
bAPと、A(Z) /A’(Z) (但し、A(Z) は線形予測
分析フィルタを示す)で示される聴覚重み付けフィルタ
7で聴覚重み付けされた入力音声信号ベクトルAXとの
間で聴覚重み付けされたピッチ予測誤差信号ベクトルA
Yを減算部8で求め、このピッチ予測誤差信号ベクトル
AYの電力が最小の値になるように評価部10がフレー
ム毎に下記式: P=argmin(|AY|2 ) =argmin(|AX−bAP|2 ) …… により、符号帳1aの中から最適なピッチ予測残差ベク
トルPを選択すると共に最適なゲインbを選択する。
【0007】更に、白色雑音の固定符号帳2の各コード
・ベクトル信号Cにも同様にして線形予測再生フィルタ
4で聴覚重み付けして生成された聴覚重み付け再生後の
コード・ベクトルACにゲイン6でゲインgを乗算して
線形予測再生信号ベクトルgACを生成する。
【0008】そして、この線形予測再生信号ベクトルg
ACと、上記のピッチ予測誤差信号ベクトルAYとの誤
差信号ベクトルEを減算部9で求め、この誤差信号ベク
トルEの電力が下記の式: C=argmin(|E|2 ) =argmin(|AY−gAC|2 ) …… により最小の値になるように評価部11がフレーム毎に
符号帳2の中から最適なコード・ベクトルCを選択する
と共に最適なゲインgを選択する。
【0009】尚、適応符号帳1aの適応化(更新)は、
最適駆動音源信号bAP+gACを加算部12で求め、
これを聴覚重み付け線形予測分析フィルタ( A' (Z) )
13でbP+gCに戻し、更に遅延器14で1フレーム
分遅延させたものを次のフレームの適応符号帳(ピッチ
予測符号帳)として格納することにより行われる。
【0010】このように図12に示した逐次最適化CE
LP方式では、ゲインbとgが別々に制御されるのに対
し、図13に示した同時最適化CELP方式では、bA
PとgACとを加算部15で加算してAX’=bAP+
gACを求め、更に減算部8でフィルタ7からの聴覚重
み付けされた入力音声信号ベクトルAXとの誤差信号ベ
クトルEを上記の式と同様にして求め、評価部16が
このベクトルEの電力を最小にするコード・ベクトルC
を固定符号帳2から選択すると共に最適なゲインbとg
を同時に選択制御するものである。
【0011】この場合には、上記の式,より、 C=argmin(|E|2 ) =argmin(|AX−bAP−gAC|2 ) …… となる。
【0012】尚、この場合の適応符号帳1aの適応化
は、図12の加算部12の出力に相当するAX’に対し
て同様にして行われる。また、フィルタ3,4は加算部
15の後に共通に設けてもよく、このときには逆フィル
タ13は不要となる。
【0013】ところで、実際の符号帳探索は、適応符号
帳1aに対する探索と、固定符号帳2に対する探索の二
段階に分けて行われ、適応符号帳1aのピッチ探索にお
いては、上記の式の場合であっても、式に示すよう
に行われる。
【0014】即ち、上記の式において、ベクトルEの
電力を最小にするためのゲインgを偏微分により求める
と、 0=δ(|AX−bAP|2)/δb =2 t( −bAP)(AX−bAP) より、 b= t( AP) AX/ t( AP)AP … となる。但し、「 t」は転置行列を示す。
【0015】そこで、図14に示すピッチ周期の最適化
アルゴリズムにおいては、聴覚重み付け入力音声信号ベ
クトルAXと、適応符号帳1aの各ピッチ予測残差ベク
トルPを聴覚重み付け線形予測再生フィルタ4に通して
得られるコード・ベクトルAPとを乗算部41で乗算し
て両者の相関値 t( AP) AXを発生し、聴覚重み付け
再生後のピッチ予測残差ベクトルAPの自己相関値 t(
AP) APを乗算部42で求める。
【0016】そして、評価部10では、両相関値 t( A
P) AX及び t( AP) APに基づいて上記の式によ
り聴覚重み付け入力信号ベクトルAXに対する誤差信号
ベクトルE=AYの電力を最小にする最適なピッチ予測
残差信号ベクトルP及びゲインbを選択する。
【0017】尚、上記の式を最小とするように各ピッ
チ予測残差信号ベクトルPに対してゲインbが求めら
れ、このゲインに対する量子化がオープン・ループで行
われるなら、相関値の比率、 ( t(AX)AP)2 t(AP)AP を最大にすることと等価になる。
【0018】即ち、 となり、この右辺第2項を最大にすれば良い。
【0019】
【発明が解決しようとする課題】このような適応符号帳
1aのピッチ探索においては、適応符号帳1aの各ピッ
チ予測残差信号ベクトルPに対してフィルタ4で聴覚重
み付け再生フィルタのインパルス応答が畳み込まれるの
で、適応符号帳1aのM本(M=128〜256)の各
ピッチ予測残差信号ベクトルの次元をN(通常N=40
〜60)、聴覚重み付けフィルタ4の次数をNP (II
R型フィルタの場合はNP =10) とすると、乗算部4
1での演算量は、各ベクトル毎に聴覚重み付けフィルタ
に要する演算量N×NP と、ベクトルの内積計算に要す
る演算量Nとの和となる。
【0020】そして、最適なピッチ・ベクトルPを決定
するには、適応符号帳1aに含まれるM本のピッチ・ベ
クトルの全てについてこの演算量が必要となり、演算量
が膨大になるという問題点があった。
【0021】また、過去のフレームの最適駆動音源信号
をそのまま帰還させて適応符号帳1aの更新を行ってい
るので、図15に示すように、固定符号帳2からのコー
ドベクトル成分をも含んだ信号が帰還されてしまい、適
応符号帳にとって好ましくない非周期的な雑音成分が重
畳されてしまい、特に駆動音源信号の性質としてピッチ
周期の強い有声音の区間において符号化音声品質の劣化
を招くという問題点もあった。
【0022】従って、本発明は、このような適応符号帳
によりピッチ周期探索による長期予測を行うCELP型
の音声符号化・復号化方式において、ピッチ周期探索の
演算量をできるだけ少なくすると共に固定符号帳から非
周期な雑音成分が適応符号帳に漏れ込まないようにする
ことを目的とする。
【0023】
【課題を解決するための手段】図1は、上記の課題を解
決するための本発明に係る音声符号化方式における適応
符号帳1の最適なピッチ・ベクトルP及びゲインbを選
択するための最適化アルゴリズムを概念的に示したもの
で、図14に示した従来例の最適化アルゴリズムの改良
に相当している。
【0024】この発明では、適応符号帳1が、所定の要
素を除いて全てゼロのスパース符号帳であると共に、そ
の中からピッチ探索により選択された最適ピッチ・ベク
トルbopt opt をスパース化回路17でスパース化し
た後、固定符号帳2から符号帳探索により選択された最
適コードベクトルgopt opt と加えあわせ遅延器14
で1フレーム分遅延させて与えることにより更新されて
いる。尚、スパース回路17のスパース化は、一定閾値
Th又は所定サンプル数の平均信号振幅に応じた適応閾
値Thを基準として行うことができる。
【0025】そして更に、聴覚重み付けされた入力音声
信号ベクトルAXから時間反転聴覚重み付け入力音声信
号ベクトル tAAXを算出する演算手段21と、時間反
転聴覚重み付け入力音声信号ベクトル tAAXと適応符
号帳1の各ピッチ予測残差ベクトルPとを乗算して両者
の相関値t(AP) AXを発生する乗算部22と、適応
符号帳1の各ピッチ予測残差ベクトルPの聴覚重み付け
再生後のベクトルAPの自己相関値 t(AP) APを求
めるフィルタ演算部23と、両相関値に基づいて聴覚重
み付けされた入力音声信号ベクトルAXに対する誤差信
号Eの電力を最小にする最適なピッチ予測残差ベクトル
opt 及びゲインboptを選択する評価部10とを備え
ている。
【0026】また、図1に示すような符号化側に対し
て、本発明の復号化側では、図2に示すように、符号化
側と同一のスパース適応符号帳1と固定符号帳2とスパ
ース化回路17と遅延器14とを設け、適応符号帳1の
内の最適選択されたピッチ予測残差ベクトルPopt に最
適ゲインbopt を乗じることにより得た最適コード・ベ
クトルbopt opt を該スパース化回路17でスパース
化し、固定符号帳2の最適選択されたコード・ベクトル
opt に最適ゲインgopt を乗じることにより得た最適
コード・ベクトルgopt opt とを加算したコード・ベ
クトルXを線形予測再生フィルタ200を通して再生信
号を得ると共にスパース化回路17に与えている。この
場合もスパース回路17のスパース化は、一定閾値Th
又は平均信号振幅に応じた適応閾値Thを基準として行
うことができる。
【0027】また、上記の図1及び図2におけるスパー
ス化回路17は、それぞれ図3及び図4に示すように、
最適ピッチ・ベクトルboptoptに対してではなく、該
最適ピッチ・ベクトルboptoptと最適コードベクトル
opt opt とを加え合わせた値に対して設けてもよ
く、この場合には、全体のパワーに占める該最適コード
ベクトルgopt opt のパワーの割合に対応した閾値T
hを閾値演算回路18で生成してスパース化回路17に
与えてスパース化した後、遅延器14に送ることとな
る。
【0028】このようなCELP方式においては、図5
(a) に示すように、演算手段21が、FIR聴覚重み付
けフィルタ・マトリックスの転置マトリックス tAを乗
算するもので構成することができる。
【0029】或いは、図5(b) に示すように、演算手段
21が、入力信号を時間軸上で逆に並べ換え、IIR聴
覚重み付けフィルタ処理 (1/A' (Z) )した後、再び
時間軸上で逆に並べ換えるもので構成することもでき
る。
【0030】
【作用】まず、図1に示した本発明のCELP型の音声
符号化方式においては、適応符号帳1がスパース化され
た最適駆動音源信号によって更新されているので、常に
格納されるピッチ予測残差信号ベクトルが所定のサンプ
ルを除いてゼロとなっているスパース(間引)状態に在
る。
【0031】そして、評価部10に与えるべき一方の自
己相関値 t(AP) APは図14に示した従来例と同様
にして演算されるが、相関値 t(AP) AXの方は、聴
覚重み付け入力音声信号ベクトルAXを演算手段21で
tAAXに変換しておき、スパース構成の適応符号帳2
のピッチ予測残差信号ベクトルPをそのまま乗算部22
に与えることにより得ているので、スパース回路17で
スパース化された適応符号帳1の利点をそのまま生かし
た形で(即ち、サンプル値が“0”の部分に対する乗算
を行わない形で)乗算を行うことができ、演算量を削減
することができる。これは、逐次最適化方式及び同時最
適化CELP方式のいずれの場合にも全く同様に適用す
ることができると共に更には、両者を組み合わせたピッ
チ直交最適化CELP方式にも適用することができる。
【0032】また、スパース回路17で各サンプルの信
号振幅を閾値と比較することにより、閾値を越えないサ
ンプル点についてはサンプル値を零に置き換えることに
より非周期成分の適応符号帳1への漏れ込みを防ぐこと
もできる。
【0033】更に、スパース化回路17を、それぞれ図
3及び図4に示すように、最適ピッチ・ベクトルbopt
opt に対してではなく、該最適ピッチ・ベクトルb
opt opt と最適コードベクトルgopt opt とを加え
合わせた値に対して設け、このスパース回路17で、全
体のパワーに占める該固定符号帳2のパワーの比に対応
した閾値Thを閾値演算回路18で生成してスパース化
回路17に与えてスパース化した後、遅延器14に送る
ようにすれば、より一層非周期成分の適応符号帳1への
漏れ込みを抑制することができる。
【0034】即ち、音声は有声音のときには、或る一定
周期の信号(ピッチ周期)が大きくなり、他の非周期成
分との振幅差が大きくなる。逆に、無声音のときには、
ピッチ周期西部が殆ど無くなり非周期成分が優勢になり
振幅差が無くなってくる。
【0035】従って、ピッチ周期成分と非周期成分との
差、即ち適応符号帳と固定符号帳の信号パワー差(全体
のパワーに占める固定符号帳2のパワーの比)によりス
パース回路17の閾値を適応的に可変にすることによ
り、非周期成分の適応符号帳1への漏れ込みを少なくす
ることができる。
【0036】また、図1に示すような符号化側に対し
て、本発明の復号化側では、図2に示すように符号化側
から知らされた適応符号帳1の内の最適選択されたピッ
チ予測残差ベクトルPopt に最適ゲインbopt を乗じる
ことにより得た最適コード・ベクトルbopt opt と、
やはり符号化側から知らされた固定符号帳2の最適選択
されたコード・ベクトルCopt に最適ゲインgopt を乗
じることにより得た最適コード・ベクトルgopt opt
とを加算したコード・ベクトルXを線形予測再生フィル
タ200を通して再生信号を得ることにより適応符号帳
1の更新を行っている。
【0037】尚、この場合において、演算手段21が、
図5(b) に示すように、入力信号を時間軸上で逆に並べ
換えし、IIR聴覚重み付けフィルタ処理(1/A’
(Z) )した後、再び時間軸上で逆に並べ換えするもので
構成する場合には、図5(a) に示すように、FIR聴覚
重み付けフィルタ・マトリックスの転置マトリックス t
Aを乗算するもので構成する場合に比べて、IIRとF
IRの違いにより演算量が削減される。
【0038】
【実施例】図6は、図1及び図2に示したスパース化回
路17の一実施例を示したもので、この実施例では、図
6(a) に示すように、一定の閾値Th以上の値を有する
サンプル点については、入力値をそのまま出力し、閾値
Th以下の場合は入力値がゼロに置き換えられてスパー
ス化される。
【0039】従って、この場合のスパース化回路17は
同図(b) に示すようにセンター・クリッピング特性を有
する回路となり、このようなセンター・クリッピング回
路の実現手法としては、例えば2通り考えられる。
【0040】まず、図7に示す実施例では、入力信号
(最適ピッチ予測残差信号)の各サンプル点の値を、そ
の絶対値(信号振幅)の大きい方から順位を付け、その
上位から所望のサンプル数(一定閾値Thに相当)まで
はそのまま出力し、それ以外のサンプル点はゼロに置き
換えている。これにより、ピッチ探索の演算量に直接の
影響を与える“ゼロでないサンプル点”の数(スパース
度)を正確に制御できることとなる。
【0041】一方、図8に示す実施例では、入力信号に
対して所定サンプル当たりの平均信号振幅VAVを算出
し、その値VAVに係数λを乗じて閾値Th=VAV・λを
決定し、この閾値Thを用いてセンター・クリッピング
を行うものである。この場合には、入力信号の性質によ
って適応符号帳1のスパース度は多少変化するが、図7
の実施例に比べてサンプル点の順位付けに必要な演算量
が不要となるため、より少ない演算量で済むこととな
る。
【0042】図9は、図3及び図4に示した閾値演算回
路18の一実施例を示したもので、この実施例では、閾
値Thを適応符号帳に帰還される最適駆動音源信号中の
ピッチベクトル及びコードベクトルの各成分のパワー
(電力)|bopt opt 2 及び|gopt opt 2
(ベクトルの内積演算により)算出し、この内のコード
ベクトルの成分パワー|gopt opt 2 が全体に占め
る割合(kC ) を次式のように求める。 kC =(|gopt opt 2/(|bopt opt 2+|gopt opt 2))1/2 但し、0≦kC ≦1である。
【0043】そして、このkC の関数f(kC )として
図9に示すように閾値Th=λ/kC が決定される。但
し、λは経験により決定される定数である。
【0044】一方、ピッチベクトルの成分パワー|g
opt opt 2 が全体に占める割合(kP ) は、次式の
ようになる。 kp =(|bopt opt 2/(|bopt opt 2+|gopt opt 2))1/2 但し、kC 2 +kp 2 =1である。
【0045】ここで、kC とkp とについて考えると、
これらの値は相補的な関係にあり、駆動音源中に占める
ピッチ成分の割合が大きく適応符号帳が入力信号のピッ
チ周期性に充分追従出来ているときにはkC の値は小さ
くなるため、閾値Thは反対に大きくなる。従って、ピ
ッチ成分のみが残り、他の信号成分はクリップされ、適
応符号帳へ帰還される非周期成分が抑圧されることとな
る。
【0046】逆に、ピッチ成分の割合が小さく適応符号
帳が入力信号のピッチ周期性に追従できていないときに
はkC の値が大きくなり、閾値Thが小さくなるため、
最適駆動音源信号成分はそのまま適応符号帳へ帰還され
る。
【0047】このように、適応符号帳の追従状態に応じ
て適応符号帳の更新に用いられている駆動音源信号の
内、非周期成分の帰還量を制御することが可能になる。
【0048】尚、ピッチベクトル及びコードベクトルの
割合を評価する方法としては,上記のkC の代わりにそ
れぞれの成分に対して重み付け合成フィルタを施したも
のについて次式のようにしてkC ’を求めてもよい。 kC ’= (|gopt ACopt 2/(|bopt APopt 2+|gopt ACopt 2))1/2
【0049】また、このような閾値Thは、kC の値か
らテーブル・ルック・アップ方式でも求めることができ
る。
【0050】図10は、図5(a) に示した本発明に係る
音声符号化方式に用いられる演算手段の一実施例を示し
たもので、FIR(有限インパルス応答)聴覚重み付け
フィルタ・マトリックスをAとし、このマトリックスA
の転置マトリックス tAを図10(a) に示す符号帳次元
数Nに一致したN次元のマトリックスとすると、図1に
示したCELP方式の場合では、重み付け入力信号ベク
トルAXが図10(b)に示すようなものであれば、この
重み付け入力信号ベクトルAXに転置マトリックス t
を乗じた時間反転聴覚重み付け入力信号ベクトル t
AXは図10(c) に示すようになる。尚、図中、*は乗
算符号を示す。
【0051】また、図11は、図5(b) に示した本発明
に係る音声符号化方式に用いられる演算手段の一実施例
を示したもので、まず、図1に示したCELP方式の場
合では、重み付け入力信号ベクトルAXが図11(a) に
示すようなもの(図10(b)に示すものと同じ)とする
と、これを時間軸上で逆に並べ換えしたものが図11
(b) に示すベクトル(AX)TRである。
【0052】そして、このベクトル(AX)TRを、聴覚
重み付けフィルタ関数1/A’(Z)のIIR(無限イン
パルス応答)形の聴覚重み付け線形予測再生フィルタA
にかけると、A(AX)TRは例えば図11(c) に示すよ
うになる。
【0053】この場合、マトリックスAは図10(a) に
示す転置マトリックス tAを戻した行列であるので、上
記のA(AX)TRを元に戻すために、時間軸上で逆に並
べ換えを行うと、図11(d) に示すように、なり、これ
は図10(c) に示した時間反転聴覚重み付け入力信号ベ
クトル tAAXと同じになる。
【0054】このようにして、図10の実施例と図11
の実施例が同じ機能を果たすことが分かる。
【0055】尚、図11の実施例では、フィルタ・マト
リックスAをIIRフィルタとしたが、FIRフィルタ
を用いても構わない。但し、FIRフィルタを用いる
と、図10の実施例と同様に全乗算回数がN2 /2(及
び2Nの移動操作)となるが、IIRフィルタを用いた
場合には、例えば10次線形予測分析の場合であれば1
0Nの乗算回数と2Nの移動操作とを必要とするだけで
済むことになる。
【0056】
【発明の効果】以上説明したように、本発明によれば、
適応符号帳として所定の要素を除いて全てゼロのスパー
ス符号帳を用いると共に最適ピッチ・ベクトルをスパー
ス化回路でスパース化して与えることにより更新し、評
価部に与えるべき相関値を求める際に、聴覚重み付けさ
れた入力音声信号ベクトルから時間反転聴覚重み付け入
力音声信号ベクトルを算出して適応符号帳の各ピッチ予
測残差ベクトルとを乗算し両者の相関値を生成するよう
に構成したので、スパース符号帳の利点をそのまま生か
した形で符号化及び復号化に際しての乗算を行うことが
でき、演算量を削減することができる。
【0057】また、スパース化に際しての閾値を、適応
符号帳の追従状態に応じて適応符号帳の更新に用いられ
ている駆動音源信号の内、固定符号帳からのコードベク
トルによる非周期成分の帰還量を制御するように可変に
したので、従来のものに比べてより周期性が保たれ、結
果として有声音などのピッチ周期性の強い駆動音源を有
する音声に対して符号化・復号化音声品質を改善するこ
とができる。
【図面の簡単な説明】
【図1】本発明に係る音声符号化方式のピッチ探索の最
適化アルゴリズムを概念的に示したブロック図である。
【図2】本発明に係る音声復号化方式の再生アルゴリズ
ムを概念的に示したブロック図である。
【図3】本発明に係る音声符号化方式のピッチ探索を別
のスパース化により実行するときの最適化アルゴリズム
を概念的に示したブロック図である。
【図4】本発明に係る音声復号化方式の別のスパース化
により実行するときの再生アルゴリズムを概念的に示し
たブロック図である。
【図5】本発明に係る音声符号化・復号化方式に用いる
演算手段の構成例を概念的に示した図である。
【図6】本発明に係る音声符号化・復号化方式に用いる
スパース化回路の実施例を概念的に説明するためのグラ
フ図である。
【図7】本発明に係る音声符号化・復号化方式に用いる
スパース化回路の信号振幅順によるセンター・クリッピ
ングを概念的に説明するためのグラフ図である。
【図8】本発明に係る音声符号化・復号化方式に用いる
スパース化回路の平均化閾値によるセンター・クリッピ
ングを概念的に説明するためのグラフ図である。
【図9】本発明に係る音声符号化・復号化方式に用いる
閾値演算回路の実施例を示した図である。
【図10】本発明に用いる演算手段の実施例を説明する
ための図である。
【図11】本発明に用いる演算手段の他の実施例を説明
するための図である。
【図12】一般的な逐次最適化CELP方式を概略的に
示すブロック図である。
【図13】一般的な同時最適化CELP方式を概略的に
示すブロック図である。
【図14】従来のピッチ探索の最適化アルゴリズムを概
念的に示したブロック図である。
【図15】従来方式の問題点を説明するためのブロック
図である。
【符号の説明】
1 スパース(ピッチ周期)適応符号帳 2 固定符号帳 10 評価部 14 フレーム遅延器 17 スパース回路 18 閾値演算回路 21 演算手段 22 乗算部 23 フィルタ演算部 図中、同一符号は同一又は相当部分を示す。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 坂井 良広 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 田中 良紀 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (58)調査した分野(Int.Cl.7,DB名) G10L 19/00 - 19/14 H03M 7/30 H04B 14/04 JICSTファイル(JOIS)

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 適応符号帳(1) 及び白色雑音の固定符号
    帳(2) の二つの符号帳を用い、ピッチ探索・符号帳探索
    を行って最適な駆動音源信号を求めることで符号化を行
    うCELP型の音声符号化方式において、 該適応符号帳(1) が、所定の要素を除いて全てゼロのス
    パース符号帳であると共に、その中からピッチ探索によ
    り選択された最適ピッチ・ベクトル(bopt opt )を
    スパース化回路(17)でスパース化した後、該固定符号帳
    (2) から符号帳探索により選択された最適コードベクト
    ル(gopt opt ) と加えあわせ遅延器(14)で1フレーム
    分遅延させて与えることにより更新され、 更に、聴覚重み付けされた入力音声信号ベクトル(A
    X)から時間反転聴覚重み付け入力音声信号ベクトル(
    tAAX) を算出する演算手段(21)と、 該時間反転聴覚重み付け入力音声信号ベクトル( tAA
    X) と該適応符号帳(1) の各ピッチ予測残差ベクトル
    (P)とを乗算して両者の相関値( ( t ( AP)AX)
    を発生する乗算部(22)と、 該適応符号帳(1) の各ピッチ予測残差ベクトル(P)の
    聴覚重み付け再生後のベクトル(AP) の自己相関値
    (( t ( AP) A ) を求めるフィルタ演算部(23)と、 両相関値に基づいて該聴覚重み付けされた入力音声信号
    ベクトル(AX)に対する誤差信号(E)の電力を最小
    にする最適なピッチ予測残差ベクトル(Popt)及びゲ
    イン(bopt )を選択する評価部(10)と、 を備えたことを特徴とする音声符号化方式。
  2. 【請求項2】 該スパース化回路(17)が、一定閾値(Th)
    を基準としてスパース化を行うことを特徴とした請求項
    1に記載の音声符号化方式。
  3. 【請求項3】 該スパース化回路(17)が、所定サンプル
    数の平均信号振幅に応じた適応閾値(Th)を基準としてス
    パース化を行うことを特徴とした請求項1に記載の音声
    符号化方式。
  4. 【請求項4】 該スパース化回路(17)が、該最適ピッチ
    ・ベクトル(boptopt ) に対してではなく、該最適ピ
    ッチ・ベクトル( bopt opt ) と該最適コードベクト
    ル(gopt opt ) とを加え合わせた値に対して設けられ
    ており、全体のパワーに占める該最適コードベクトル(g
    optopt ) のパワーの割合に対応した閾値(Th)を閾値
    演算回路(18)で生成して該スパース化回路(17)に与えて
    スパース化した後、該遅延器(14)に送ることを特徴とし
    た請求項1に記載の音声符号化方式。
  5. 【請求項5】 該演算手段(21)が、FIR聴覚重み付け
    フィルタ・マトリックスの転置マトリックス( tA )を
    乗算するものであることを特徴とした請求項1乃至4の
    いずれかに記載の音声符号化方式。
  6. 【請求項6】 該演算手段(21)が、入力信号を時間軸上
    で逆に並べ換え、IIR聴覚重み付けフィルタ処理(1
    /A’(Z))した後、再び時間軸上で逆に並べ換えするも
    のであることを特徴とした請求項1乃至4のいずれかに
    記載の音声符号化方式。
  7. 【請求項7】 符号化側と同一のスパース適応符号帳
    (1) と固定符号帳(2)とスパース化回路(17)と遅延器(1
    4)と演算手段(21)とを有し、該適応符号帳(1)の内の最
    適選択されたピッチ予測残差ベクトル(Popt )に最適
    ゲイン(bopt)を乗じることにより得た最適コード・
    ベクトル(bopt opt )を該スパース化回路(17)でス
    パース化し、該固定符号帳(2) の最適選択されたコード
    ・ベクトル(Copt )に最適ゲイン(gopt )を乗じる
    ことにより得た最適コード・ベクトル(gopt opt )
    とを加算したコード・ベクトル(X)を線形予測再生フ
    ィルタ(200)を通して再生信号を得ることを特徴とした
    請求項1乃至6のいずれかに記載の音声復号化方式。
JP03267112A 1990-09-18 1991-09-18 音声符号化・復号化方式 Expired - Fee Related JP3100082B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03267112A JP3100082B2 (ja) 1990-09-18 1991-09-18 音声符号化・復号化方式

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP24848490 1990-09-18
JP2-248484 1990-09-18
JP03267112A JP3100082B2 (ja) 1990-09-18 1991-09-18 音声符号化・復号化方式

Publications (2)

Publication Number Publication Date
JPH0561499A JPH0561499A (ja) 1993-03-12
JP3100082B2 true JP3100082B2 (ja) 2000-10-16

Family

ID=26538796

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03267112A Expired - Fee Related JP3100082B2 (ja) 1990-09-18 1991-09-18 音声符号化・復号化方式

Country Status (1)

Country Link
JP (1) JP3100082B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100447152B1 (ko) * 1996-12-31 2004-11-03 엘지전자 주식회사 디코더필터의연산처리방법
DE19845888A1 (de) * 1998-10-06 2000-05-11 Bosch Gmbh Robert Verfahren zur Codierung oder Decodierung von Sprachsignalabtastwerten sowie Coder bzw. Decoder
US7698132B2 (en) * 2002-12-17 2010-04-13 Qualcomm Incorporated Sub-sampled excitation waveform codebooks
WO2008018464A1 (fr) * 2006-08-08 2008-02-14 Panasonic Corporation dispositif de codage audio et procédé de codage audio
WO2012053146A1 (ja) * 2010-10-20 2012-04-26 パナソニック株式会社 符号化装置及び符号化方法
US20140244274A1 (en) 2011-10-19 2014-08-28 Panasonic Corporation Encoding device and encoding method
TWI831804B (zh) * 2018-07-17 2024-02-11 日商索尼股份有限公司 運算裝置、積和運算裝置、積和運算系統及積和運算方法

Also Published As

Publication number Publication date
JPH0561499A (ja) 1993-03-12

Similar Documents

Publication Publication Date Title
US5396576A (en) Speech coding and decoding methods using adaptive and random code books
US5867814A (en) Speech coder that utilizes correlation maximization to achieve fast excitation coding, and associated coding method
US5819213A (en) Speech encoding and decoding with pitch filter range unrestricted by codebook range and preselecting, then increasing, search candidates from linear overlap codebooks
EP0476614A2 (en) Speech coding and decoding system
JP5400701B2 (ja) 音声符号化のための方法と装置
WO1998006091A1 (fr) Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications
CA2044750C (en) Speech coding and decoding system
EP0450064B1 (en) Digital speech coder having improved sub-sample resolution long-term predictor
JP3100082B2 (ja) 音声符号化・復号化方式
JP2624130B2 (ja) 音声符号化方式
JPH1097294A (ja) 音声符号化装置
JPH0944195A (ja) 音声符号化装置
JP2970407B2 (ja) 音声の励振信号符号化装置
JP3095133B2 (ja) 音響信号符号化方法
US5719993A (en) Long term predictor
JP3153075B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP3089967B2 (ja) 音声符号化装置
JPH08185199A (ja) 音声符号化装置
JPH1069297A (ja) 音声符号化装置
JP3270146B2 (ja) 音声符号化装置
JP3226180B2 (ja) 音声のピッチ周期符号化法
JPH08320700A (ja) 音声符号化装置
JPH0774642A (ja) 線形予測係数補間装置
KR100550002B1 (ko) 음성부호화기에서 적응 코드북 검색기 및 그 방법

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000801

LAPS Cancellation because of no payment of annual fees