JP3420222B2 - 利得形状ベクトル量子化方法とこれを用いた音声符号化方法及び装置 - Google Patents

利得形状ベクトル量子化方法とこれを用いた音声符号化方法及び装置

Info

Publication number
JP3420222B2
JP3420222B2 JP2001215842A JP2001215842A JP3420222B2 JP 3420222 B2 JP3420222 B2 JP 3420222B2 JP 2001215842 A JP2001215842 A JP 2001215842A JP 2001215842 A JP2001215842 A JP 2001215842A JP 3420222 B2 JP3420222 B2 JP 3420222B2
Authority
JP
Japan
Prior art keywords
vector
shape
gain
codebook
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2001215842A
Other languages
English (en)
Other versions
JP2002084194A (ja
Inventor
正浩 押切
政巳 赤嶺
公生 三関
進 神庭
皇 天田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001215842A priority Critical patent/JP3420222B2/ja
Publication of JP2002084194A publication Critical patent/JP2002084194A/ja
Application granted granted Critical
Publication of JP3420222B2 publication Critical patent/JP3420222B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、利得形状ベクトル
量子化方法とこれを用いた音声符号化方法及び装置に関
する。
【0002】
【従来の技術】音声信号や画像信号の高能率な符号化法
として、入力信号をベクトル化してベクトル単位で量子
化を行うベクトル量子化が一般に知られている。また、
ベクトル量子化法の一形態として多段化した利得形状ベ
クトル量子化法があり、広く利用されている。利得形状
ベクトル量子化は、音声信号や画像信号などの信号の形
状と大きさ(利得)をベクトル化して量子化する技術で
ある。以下、図6および図7を用いて2段(M=2)の
利得形状ベクトル量子化について説明する。
【0003】なお、以下の説明で用いるI〜N以外の大
文字のアルファベットはベクトル、小文字のアルファベ
ットおよびI〜Nはスカラーをそれぞれ表す。また、‖
はベクトルのユークリッド距離を表し、<,>は2
ベクトル間の内積値を表すものとする。さらに、カッコ
内の添字は符号帳のインデックスを表し、*印を伴う変
数は最適なベクトルのインデックスを表すものとする。
加えて、minおよびmaxはそれぞれ最小値および最
大値をとるときのインデックスを出力する関数を表すも
のとする。
【0004】図6に示す符号化器においては、次式
(1)に示すように形状ベクトル符号帳601から得ら
れる形状ベクトルC1(i)と、形状ベクトル符号帳6
02から得られる形状ベクトルC2(j)と、利得ベク
トル符号帳603から得られる利得ベクトルG(k)=
{g1(k),g2(k)}の対応する利得との線形結
合を乗算器603,604および加算器606を用いて
候補ベクトルYとして求める。
【0005】 Y=g1(k)・C1(i)+g2(k)・C2(j) (1) ただし、 1≦i≦I(I:形状ベクトル符号帳101に含まれる
形状ベクトルの数) 1≦j≦J(J:形状ベクトル符号帳102に含まれる
形状ベクトルの数) 1≦k≦K(K:利得ベクトル符号帳に含まれる利得ベ
クトルの数) である。
【0006】次に、入力端子607から入力される目標
ベクトルXと候補ベクトルYの類似度を求めるため、減
算器608で目標ベクトルXから該候補ベクトルYを減
じて残差ベクトルEを求め、さらに誤差評価部609で
残差ベクトルEの誤差評価値dを求める。以後、誤差評
価値dとしてユークリッド距離を用いることにする。こ
の場合、誤差評価値dは次式で表される。 d=‖E‖ =‖X−Y‖ (2) そして、この誤差評価値dが最小となるC1(i*),
C2(j*)およびG(k*)を探索して求め、そのイ
ンデックス情報i*,j*,k*を図7に示す復号器に
伝送する。
【0007】図7に示す復号器においては、図6に示し
た符号化器と同様の形状ベクトル符号帳701,702
および利得ベクトル符号帳705を備え、符号化器から
伝送されたインデックス情報i*,j*,k*からC1
(i*),C2(j*)およびG(k*)を復号し、乗
算器703,704と加算器706により式(1)に従
い出力ベクトルZを求めて出力する。
【0008】以上の説明から明らかなように、利得形状
ベクトル量子化の最終的な目的は、目標ベクトルXと候
補ベクトルYとの誤差の評価値dが最小となる形状ベク
トルC1(i*),C2(j*)および利得ベクトルG
(k*)の組み合わせを見つけることに他ならない。こ
の目的を達成する一番直接的でかつ確実な方法として、
形状ベクトルと利得ベクトルの全ての組み合わせからと
り得る候補ベクトルYを求め、誤差評価値dが最小とな
る組み合わせを探索する方法が考えられる。しかし、こ
のような全探索法は計算量が膨大となるため現実的では
ない。
【0009】一方、M個の形状ベクトルにそれぞれ与え
る利得を個別に量子化、つまりスカラー量子化すること
で、M個の形状ベクトルを現実的な計算量で探索する方
法も知られている。この方法を図8を用いて説明する。
まず1段目の探索では、形状ベクトル符号帳801から
得られる形状ベクトルC1(i)に乗算器803で最適
利得g1optを乗じて得られる候補ベクトルY1と、
入力端子804より入力される目標ベクトルXとの残差
信号F1を減算器805で求め、この残差信号F1に対
する誤差評価値d1を誤差評価部806で計算する。こ
のとき、誤差評価値d1が最小となる形状ベクトルC1
(i*)を決定する。次に、C1(i*)の最適利得g
1optについて利得テーブル807と加算器808お
よび誤差評価部809を用いてスカラー量子化を行い、
g1(k*)を決定する。
【0010】次に、2段目では減算器811で2段目の
目標ベクトルE1を E1=X−g1(k*)・C1(i*) (3) により求め、この目標ベクトルE1を用い、1段目と同
様の方法で形状ベクトル符号帳802、乗算器810、
減算器812、誤差評価部813、利得テーブル81
4、減算器815および誤差評価部816を用いて形状
ベクトルC2(j*)と利得値g2(n*)を決定す
る。このようにして、形状ベクトルC1(i*),C2
(j*)および利得値g1(k*),g2(n*)を決
定することができる。
【0011】この方法を用いると、1段目の形状ベクト
ルC1(i*)と2段目の形状ベクトルC2(j*)を
独立に探索できるため、ベクトル探索に必要な計算量を
大幅に削減することができる。しかし、利得をスカラー
量子化しているため符号化効率が低下するという問題が
ある。
【0012】さらに別の方法として、直交化処理を適用
してM個の形状ベクトルにそれぞれ与える利得を同時に
量子化する、つまり利得のベクトル量子化を行う方法も
知られている。この方法を図9および図10を用いて説
明する。
【0013】まず、形状ベクトル量子化部について図9
を用いて説明する。形状ベクトル量子化部においては、
最初に、1段目の形状ベクトル符号帳901から得られ
る形状ベクトルC1(i)に乗算器903で最適利得g
1optを乗じて得られる候補ベクトルY1と、入力端
子904から入力される目標ベクトルXとの誤差評価値
d1を減算器905を介して誤差評価部403を用いて
計算する。このとき、誤差評価値d1が最小となる形状
ベクトルC1(i*)を決定する。
【0014】2段目の形状ベクトル符号帳902からの
形状ベクトルC2(j)の探索は、C1(i*)との内
積値が0になるように直交化処理部908で直交化処理
しながら行う。直交化処理は、次式に従い実現される。 C2(j)=C2(j)−<C1(i*),C2(j)>・C1(i*) /‖C1(i*)‖2 (4) ただし、C2(j)は直交化処理後のベクトルであ
る。
【0015】そして、2段目の形状ベクトル符号帳90
2について、直交化処理部907、乗算器908、減算
器909および誤差評価部910を用いて形状ベクトル
符号帳902からの形状ベクトルの探索を1段目と同様
に行い、誤差評価値が最小となるC2(j*)を決定
する。
【0016】ここで、上記の直交化処理によって、1段
目の形状ベクトル符号帳901から探索された形状ベク
トルC1(i*)と直交化処理後のベクトルC2(j
*)とは無相関となる。すなわち、C2(j*)は形
状ベクトルC1(i*)の量子化の影響が取り除かれて
いるので、これに最適利得g2optを乗じたものを目
標ベクトルXから減じることにより、2段目の形状ベク
トル符号帳902から探索される形状ベクトルの誤差を
的確に評価することが可能となる。
【0017】次に、形状ベクトルC1(i*)と直交化
処理後のベクトルC2(j*)に対応する形状ベクト
ルC2(j*)を固定にして、利得ベクトルG(k*)
を決定する。
【0018】図10に、利得ベクトル量子化部のブロッ
ク図を示す。この利得ベクトル量子化部においては、形
状ベクトルC1(i*),C2(j*)に乗算器100
1,1002で利得ベクトル符号帳1007から得られ
る利得ベクトルG(k)の各要素を乗じ、これらを加算
器1003で加算した後、入力端子1004から入力さ
れる目標ベクトルXとの誤差を減算器1005で求め、
この誤差を誤差評価部1006で評価し、誤差値が最小
となるようにG(k*)は決定される。つまり、利得ベ
クトルG(k*)は、次式で与えられる誤差評価式を最
小とするベクトルを探し出すことで決定される。 k*=min‖X−g1(k)・C1(i*) −g2(k)・C2(j*)‖ (5) このように直交化処理を用いて利得のベクトル量子化を
行う方法によると、利得をスカラー量子化する方法に比
べて符号化効率が向上する。反面、この方法では直交化
処理が必要になり、そのためには2段目の形状ベクトル
符号帳902から得られる形状ベクトル全てに対して式
(4)で表される計算を行わなければならず、計算量が
著しく増大するという問題がある。この問題は、特に2
段目の形状ベクトル符号帳902に格納されている形状
ベクトル数が大きい場合に顕著となる。
【0019】
【発明が解決しようとする課題】上述したように従来の
利得形状ベクトル量子化装置において、利得をスカラー
量子化する方法は符号化効率が低下し、また利得をベク
トル量子化する方法は直交化処理を伴うため計算量が増
大するという問題があった。
【0020】本発明の目的は、直交化処理を用いずに少
ない計算量で利得のベクトル量子化を行い、符号化効率
を低下させることなく、最適に近い複数個の形状ベクト
ルと利得ベクトルを探索することが可能な利得形状ベク
トル量子化方法とこれを用いた音声符号化方法及び装置
を提供することにある。
【0021】
【課題を解決するための手段】上記の課題を解決するた
め、本発明に係る利得形状ベクトル量子化方法は、第1
の目標ベクトルを用いて1段目の形状ベクトル符号帳か
ら第1の形状ベクトルを探索して決定し、第1の形状ベ
クトルと仮の利得とを利用して第2の目標ベクトルを生
成し、第2の目標ベクトルを用いて2段目の形状ベクト
ル符号帳から第2の形状ベクトルを探索して決定し、第
1の形状ベクトル及び第2の形状ベクトルを基に利得ベ
クトルを決定することを特徴とする。
【0022】本発明に係る音声符号化方法は、入力音声
から第1の目標ベクトルを生成し、第1の目標ベクトル
を用いて1段目の形状ベクトル符号帳から第1の形状ベ
クトルを探索して決定し、第1の形状ベクトルと仮の利
得とを利用して第2の目標ベクトルを生成し、第2の目
標ベクトルを用いて2段目の形状ベクトル符号帳から第
2の形状ベクトルを探索して決定し、第1の形状ベクト
ル及び第2の形状ベクトルを基に利得ベクトルを決定
し、第1、第2の形状ベクトル及び利得ベクトルのイン
デックス情報を出力することを特徴とする。
【0023】また、第1の形状ベクトルを探索して決定
するステップにおいて、例えば1段目の形状ベクトル符
号帳から得られる形状ベクトルに最適利得を乗じて得ら
れる第1の候補ベクトルと前記第1の目標ベクトルとの
誤差が最小となる形状ベクトルを第1の形状ベクトルと
して決定し、第2の目標ベクトルを生成するステップに
おいて、最適利得を仮の利得として用いることを特徴と
する。
【0024】また、第1の形状ベクトルを探索して決定
するステップにおいては、1段目の形状ベクトル符号帳
から得られる形状ベクトルに最適利得を乗じて得られる
第1の候補ベクトルと第1の目標ベクトルとの誤差が最
小となる形状ベクトルを第1の形状ベクトルとして決定
し、第2の目標ベクトルを生成するステップにおいて、
最適利得と利得ベクトル符号帳内の1つ以上の要素値と
を用いて仮の利得を設定することを特徴とする。
【0025】さらに、第2の目標ベクトルを生成するス
テップは、利得ベクトル符号帳に含まれる利得ベクトル
の対応する1つ以上の利得を仮の利得として用いること
を特徴とする。
【0026】本発明に係る音声符号化装置は、入力音声
から第1の目標ベクトルを生成する手段と、第1の目標
ベクトルを用いて1段目の形状ベクトル符号帳から第1
の形状ベクトルを探索して決定する手段と、第1の形状
ベクトルと仮の利得とを利用して第2の目標ベクトルを
生成する手段と、第2の目標ベクトルを用いて2段目の
形状ベクトル符号帳から第2の形状ベクトルを探索して
決定する手段と、第1の形状ベクトル及び第2の形状ベ
クトルを基に利得ベクトルを決定する手段と、第1、第
2の形状ベクトル及び利得ベクトルのインデックス情報
を出力する手段とを有することを特徴とする。
【0027】本発明に係る他の音声符号化装置は、入力
音声から第1の目標ベクトルを生成する第1の目標ベク
トル生成手段と、複数の形状ベクトルをそれぞれ有する
2段の形状ベクトル符号帳と、複数の利得ベクトルを有
する2次元の利得ベクトル符号帳と、1段目の形状ベク
トル符号帳から得られる形状ベクトルに最適利得を乗じ
て得られる第1の候補ベクトルと第1の目標ベクトルと
の誤差が最小となる第1の形状ベクトルを該1段目の形
状ベクトル符号帳から探索する第1の形状ベクトル探索
手段と、第1の目標ベクトルと1段目の形状ベクトル符
号帳から探索された形状ベクトルに仮の利得を乗じたベ
クトルとを用いて第2の目標ベクトルを生成する第2の
目標ベクトル生成手段と、2段目の形状ベクトル符号帳
から得られる形状ベクトルに最適利得を乗じて得られる
第2の候補ベクトルと第2の目標ベクトルとの誤差が最
小となる第2の形状ベクトルを該2段目の形状ベクトル
符号帳から探索する第2の形状ベクトル探索手段と、第
1および第2の形状ベクトル探索手段により2段の形状
ベクトル符号帳から探索された2個の形状ベクトルと利
得ベクトル符号帳から得られる利得ベクトルの各々対応
する利得との線形和をとって2個の第3の候補ベクトル
を生成すると共に、該第3の候補ベクトルと第1の目標
ベクトルとの誤差が最小となる利得ベクトルを該利得ベ
クトル符号帳から探索する利得ベクトル探索手段と、第
1、第2の形状ベクトル探索手段により探索された第
1、第2の形状ベクトル及び利得ベクトル探索手段によ
り探索された利得ベクトルのインデックス情報を出力す
る手段とを有することを特徴とする。
【0028】ここで、第2の目標ベクトル生成手段は、
1段目の形状ベクトル符号帳から形状ベクトルを探索す
る際に用いる最適利得を仮の利得として用いることを特
徴とする。
【0029】また、第2の目標ベクトル生成手段は、1
段目の形状ベクトル符号帳から形状ベクトルを探索する
際に用いる最適利得と利得ベクトル符号帳内の1つ以上
の要素値とを用いて仮の利得を設定することを特徴とす
る。
【0030】本発明によると、直交化処理を必要としな
いために少ない計算量で、しかも利得をスカラー量子化
する方法のような符号化効率の低下を伴うことなく、最
適に近い形状ベクトルと利得ベクトルの探索が可能にな
る。
【0031】
【発明の実施の形態】以下、図面を参照しながら本発明
の実施形態を説明する。
【0032】図1および図2は、本発明の第一の実施形
態に係る形状ベクトル量子化装置の構成を示すブロック
図であり、図1は形状ベクトル量子化部、図2は利得ベ
クトル量子化部の構成をそれぞれ示している。また、本
実施形態では説明を簡略化するため形状ベクトル符号帳
が2段構成(M=2)の場合を想定している。
【0033】図1に示す形状ベクトル量子化部は、2段
の形状ベクトル符号帳101,102と、形状ベクトル
符号帳101,102から得られる形状ベクトルに最適
利得を乗じて候補ベクトルを生成するための乗算器10
3,106と、生成された候補ベクトルと目標ベクトル
との誤差を評価するための誤差評価部105,109
と、2段目の形状ベクトル符号帳102からの形状ベク
トル探索時に必要な目標ベクトル(第1の目標ベクト
ル)を生成するための乗算器107と減算器108から
なる。
【0034】まず、1段目の形状ベクトル符号帳101
からの最適形状ベクトルC1(i*)の探索法について
説明する。形状ベクトル符号帳101からi番目の形状
ベクトルC1(i)を取り出し、この形状ベクトルの各
要素に乗算器103で最適利得g1optを乗じて得ら
れる候補ベクトルY1と、入力端子104から入力され
る目標ベクトルX(第2の目標ベクトル)との誤差の評
価値d1を誤差評価部105を用いて求める。誤差評価
値d1としてユークリッド距離を用いるものとすると、
d1は次式で表される。 d1=‖X−Y1‖ =‖X−g1opt・C1(i)‖ (6) d1を最小とするようg1optを決定するために、d
1をg1optで偏微分して0とおき、この偏微分方程
式を解くことでg1optを求めることができる。ま
た、そのときの誤差評価値d1は次式で表される。 g1opt=<X,C1(i)>/‖C1(i)‖ (7) d1=‖X‖−<X,C1(i)>/‖C1(i)‖ (8) (8式)の右辺第1項はXについて固定であるので、第
2項が最大となるとき誤差評価値d1は最小となる。つ
まり、最適な形状ベクトルC1(i*)は i*=max(<X、C1(i)>/‖C1(i)‖) (9) となるi*で与えられる形状ベクトルである。よって式
(9)から、1段目の形状ベクトル符号帳101から探
索すべき形状ベクトルC1(i*)を決定することがで
きる。
【0035】次に、2段目の形状ベクトル符号帳102
から探索すべき形状ベクトルを決定するため、第2の目
標ベクトルE1を決定する。2段目の目標ベクトルE1
は、1段目の形状ベクトル符号帳101から探索された
C1(i*)に乗算器107で仮の利得g1kを乗じた
ものを減算器108で1段目の目標ベクトルXから減ず
ることにより得られる。つまり、 E1=X−g1k・C1(i*) (10) である。
【0036】ここで、仮の利得g1kは最終的に量子化
される最適利得に近い利得であり、この例では最適利得
g1optを用いる。最適利得g1optは、目標ベク
トルXに対するC1(i*)の寄与度を正確に表してい
るので、仮の利得g1kとしてg1optを利用するこ
とは妥当である。すると式(10)は、 E1=X−g1opt・C1(i*) (11) となる。
【0037】2段目の形状ベクトル符号帳102から探
索すべき形状ベクトルは、E1を目標ベクトルとして1
段目と同様の探索を行うことで決定することができる。
すなわち、形状ベクトル符号帳102より得られる形状
ベクトルC2(j)と目標ベクトルE1を用いて、誤差
評価部109で式(9)と同様に、 j*=max(<E1,C2(j)>/‖C2(j)‖) (12) を満足するj*を求める。このj*から得られる形状ベ
クトルC2(j*)が2段目の最適な形状ベクトルとな
る。
【0038】一方、図2に示す利得ベクトル量子化部
は、利得ベクトル符号帳201と、図1中に示した形状
ベクトル符号帳101,102から得られる形状ベクト
ルと利得ベクトル符号帳201から得られる利得ベクト
ルの各々対応する利得との線形和をM個の第3の候補ベ
クトルとして求める乗算器202,203および加算器
204と、これらの候補ベクトルと目標ベクトルとの誤
差を求めるための減算器206と、この誤差を評価する
誤差評価部207とからなる。
【0039】次に、図1の構成で前述のようにして形状
ベクトルC1(i*),C2(j*)を探索して決定し
た後、図2の構成で利得ベクトルを決定する手順を説明
する。図1(a)の形状ベクトル量子化部において探索
され決定された形状ベクトルC1(i*)とC2(j
*)に対して、利得ベクトル符号帳201から得られる
利得ベクトルG(k)の各要素g1(k),g2(k)
を乗算器202,203でそれぞれ乗じたベクトルと、
入力端子205から入力される目標ベクトルXとの誤差
を減算器206で求め、誤差評価値d3を誤差評価部2
07で次式のように計算するとき、 d3=‖X−g1(k)・C1(i*)−g2(k)・C2(j*)‖ (13) d3を最小とするkを見つけることで、利得ベクトルを
決定する。つまり、 k*=min‖X−g1(k)・C1(i*) −g2(k)・C2(j*)‖ (14) を満足するk*を求め、k*から得られる利得ベクトル
G(k*)が最適な利得ベクトルとなる。このようにし
て、形状ベクトルC1(i*),C2(j*)および利
得ベクトルG(k*)の探索が達成される。
【0040】以上の処理の流れをまとめると、図3のよ
うになる。まず最初にステップS1で、目標ベクトルX
を用いて1段目の形状ベクトル符号帳101から最適な
形状ベクトルC1(i*)を探索して決定し、次にステ
ップS2で、ステップS1で決定された形状ベクトルC
1(i*)と仮の利得とを利用して目標ベクトルE1を
生成する。次に、ステップS3で、目標ベクトルE1を
用いて2段目の形状ベクトル符号帳102から形状ベク
トルC2(j*)を探索して決定し、最後にステップS
4で、ステップS1で決定された形状ベクトルC1(i
*)とステップS3で決定された形状ベクトルC2(j
*)を基に、利得ベクトルG(k*)を決定する。
【0041】上述した実施形態では、2段目の形状ベク
トル符号帳102からの形状ベクトルの探索時に用いる
目標ベクトルE1を生成するための仮の利得として、1
段目の形状ベクトル符号帳101からの形状ベクトルの
探索時に得られる最適利得であるg1optを適用する
場合について説明を行ったが、その他に、利得ベクトル
符号帳201に含まれる利得ベクトルの対応する1つ以
上の利得を利用して仮の利得を設定する方法を用いても
よい。
【0042】その一例として、最適利得g1optに最
も近い利得ベクトルの要素値g1(k)を用いる方法が
ある。この方法によると、このとき選ばれる要素値を含
む利得ベクトルG(k)が最終的に選択される利得ベク
トルG(k*)に一致する可能性が高いため、効率的な
符号化が可能になるという効果が得られる。
【0043】また、別の例として、仮の利得として最適
利得g1optに近い方から複数のg1(k)のそれぞ
れに対して、2段目の形状ベクトルの目標ベクトルを複
数個生成し、該複数個の目標ベクトルに対し各々2段目
のベクトル探索を行い、かつ利得ベクトルの探索を行
う。そして、最後に全体の誤差が小さくなる形状ベクト
ルと利得ベクトルの組み合わせを選択する方法も考えら
れる。こうすることで、さらに効率的な符号化が可能に
なる。
【0044】以上の実施形態では、2段構成の形状ベク
トル符号帳を持つ利得形状ベクトル量子化について説明
を行ったが、3段以上の段数の形状ベクトル符号帳を持
つ構造についても、本発明が適用可能であることは明ら
かである。
【0045】さらに、各々の最適ベクトルの決定の際、
複数個のベクトルを候補として残し、その組み合わせの
中で誤差評価値が最小となる組み合わせを最終的な出力
とする方法として実現することも可能である。こうする
ことで、さらに誤差評価値の小さいM個の形状ベクトル
と利得ベクトルの探索が実現できる。
【0046】本発明においては、仮の利得を利用して形
状ベクトルと利得ベクトルを段階的に探索を行うので、
形状ベクトルと利得ベクトルの全ての組み合わせを探索
する従来の全探索法に比べ非常に少ない計算量で探索を
実現できる。また、直交化処理を行って形状ベクトルを
決定するもう一つの従来法に比較して、本発明では直交
化処理が必要ない分だけ計算量を低減させながら、かつ
利得のベクトル量子化が実現できるので、高い符号化効
率を得ることができる。
【0047】次に、図4を参照して本発明を音声符号化
に適用した実施形態を説明する。図1および図2と相対
応する部分に同一符号を付して相違点を中心に説明する
と、先の実施形態では候補ベクトルがそれぞれ形状ベク
トルと利得ベクトルの利得との線形和で表されるのに対
し、本実施形態では候補ベクトルが形状ベクトルにある
時間間隔で分析して得られる重み付き合成フィルタを通
過させて得られる合成信号と利得ベクトルの利得との線
形和で表される点が異なる。
【0048】図4において、入力端子401から入力さ
れる入力ベクトルSは、入力音声を短い時間周期(20
ms程度)でベクトル化したものである。この入力ベク
トルSをまずLPC分析部402で分析してLPC係数
を求め、さらに該LPC係数をLPC係数量子化部40
3で量子化し、量子化後のLPC係数を基に重みフィル
タ404と重み付き合成フィルタ406および407を
設定する。次に、入力ベクトルSを重みフィルタ404
に通過させた後に減算器405で前フレームの影響を減
じたベクトルを目標ベクトルXとする。
【0049】一方、形状ベクトル符号帳101から得ら
れる1段目の形状ベクトルC1(i)を重み付き合成フ
ィルタ406に通過させて重み付き合成ベクトルV1
(i)を求め、同様に形状ベクトル102から得られる
2段目の形状ベクトルC2(j)を重み付き合成フィル
タ407に通過させて重み付き合成ベクトルV2(j)
を求める。これらの目標ベクトルXと、重み付き合成ベ
クトルV1(i)、V2(j)を基に、先の実施形態と
同様の方法でV1(i*)を決定した後に、V2(j
*)を決定することができる。つまり、 i*=max(<X,V1(i)>/‖V1(i)‖) (15) j*=max(<E1,V2(j)>/‖V2(j)‖) (16) (ここで、E1=X−g1k・V1(i*)である)と
なるi*,j*を誤差評価部105,109でそれぞれ
求め、それぞれ対応する形状ベクトルC1(i*),C
2(j*)が最適なベクトルとして探索され決定される
ことになる。
【0050】次に、図5を参照して利得ベクトル探索法
について説明する。利得ベクトルは重み付き合成ベクト
ルV1(i*),V2(j*)と利得ベクトル符号帳2
01から得られる利得ベクトルG(k)を基にして決定
することができる。つまり、誤差評価部207で次式の
計算を行い、k*から得られる利得ベクトルG(k*)
が最適な利得ベクトルとして決定される。 k*=min‖X−g1(k)・V1(i*) −g2(k)・V2(j*)‖ (17) 上述した実施形態に示したように、本発明を音声符号化
に適用した場合、音声符号化における形状ベクトルおよ
び利得ベクトルを少ない計算量で求めることができ、か
つ利得のベクトル量子化が適用されるため高い符号化効
率が実現できる。
【0051】また、上述した実施形態では2段構造の音
声符号化について説明を行ったが、3段以上の段数を持
つ構造についても本発明が適用可能なのは明らかであ
る。さらに、各々の最適ベクトルの決定の際、複数個の
ベクトルを候補として残し、その組み合わせの中で誤差
評価値が最小となる組み合わせを最終的な出力とする方
法として実現することも可能である。こうすることで、
さらに誤差評価値の小さいM個の形状ベクトルと利得ベ
クトルの探索が実現できる。
【0052】
【発明の効果】以上説明したように、本発明によれば、
少ない計算量でかつ符号化効率を犠牲にすることなく、
最適に近いM個の形状ベクトルと利得ベクトルの探索が
可能となる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係るベクトル量子化装置
の形状ベクトル量子化部の構成を示すブロック図
【図2】同実施形態に係るベクトル量子化装置の利得ベ
クトル量子化部の構成を示すブロック図
【図3】同実施形態における処理の流れを示すフローチ
ャート
【図4】本発明の他の実施形態に係るベクトル量子化装
置の形状ベクトル量子化部の構成を示すブロック図
【図5】同実施形態に係るベクトル量子化装置の利得ベ
クトル量子化部の構成を示すブロック図
【図6】第1の従来例による利得形状ベクトル量子化を
用いた符号化器の構成を示すブロック図
【図7】第1の従来例による利得形状ベクトル量子化を
用いた復号器の構成を示すブロック図
【図8】第2の従来例による利得形状ベクトル量子化装
置の構成を示すブロック図
【図9】第3の従来例による利得形状ベクトル量子化を
用いた符号化器の構成を示すブロック図
【図10】第3の従来例による利得形状ベクトル量子化
を用いた復号器の構成を示すブロック図
【符号の説明】
101…形状ベクトル符号帳 102…形状ベクトル符号帳 103…乗算器 104…入力端子 105…誤差評価部 106…乗算器 107…乗算器 108…減算器 109…誤差評価部 201…利得ベクトル符号帳 202…乗算器 203…乗算器 204…加算器 205…入力端子 206…減算器 207…誤差評価部 401…入力端子 402…LPC分析部 403…LPC量子化部 404…重みフィルタ 405…減算器 406…重み付き合成フィルタ 407…重み付き合成フィルタ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 神庭 進 神奈川県川崎市幸区小向東芝町1番地 株式会社東芝研究開発センター内 (72)発明者 天田 皇 神奈川県川崎市幸区小向東芝町1番地 株式会社東芝研究開発センター内 (56)参考文献 特開 平5−41670(JP,A) 特開 平5−14208(JP,A) 特開 平2−287399(JP,A) 特開 平5−150800(JP,A) 特開 平6−202700(JP,A) (58)調査した分野(Int.Cl.7,DB名) H03M 7/30

Claims (10)

    (57)【特許請求の範囲】
  1. 【請求項1】第1の目標ベクトルを用いて1段目の形状
    ベクトル符号帳から第1の形状ベクトルを探索して決定
    するステップと、 前記第1の形状ベクトルと仮の利得とを利用して第2の
    目標ベクトルを生成するステップと、 前記第2の目標ベクトルを用いて2段目の形状ベクトル
    符号帳から第2の形状ベクトルを探索して決定するステ
    ップと、 前記第1の形状ベクトル及び第2の形状ベクトルを基に
    利得ベクトルを決定するステップとを有することを特徴
    とする利得形状ベクトル量子化方法。
  2. 【請求項2】入力音声から第1の目標ベクトルを生成す
    るステップと、 第1の目標ベクトルを用いて1段目の形状ベクトル符号
    帳から第1の形状ベクトルを探索して決定するステップ
    と、 前記第1の形状ベクトルと仮の利得とを利用して第2の
    目標ベクトルを生成するステップと、 前記第2の目標ベクトルを用いて2段目の形状ベクトル
    符号帳から第2の形状ベクトルを探索して決定するステ
    ップと、 前記第1の形状ベクトル及び第2の形状ベクトルを基に
    利得ベクトルを決定するステップと、 前記第1、第2の形状ベクトル及び利得ベクトルのイン
    デックス情報を出力するステップとを有することを特徴
    とする音声符号化方法。
  3. 【請求項3】前記第1の形状ベクトルを探索して決定す
    るステップは、前記1段目の形状ベクトル符号帳から得
    られる形状ベクトルに最適利得を乗じて得られる第1の
    候補ベクトルと前記第1の目標ベクトルとの誤差が最小
    となる形状ベクトルを前記第1の形状ベクトルとして決
    定し、 前記第2の目標ベクトルを生成するステップは、前記最
    適利得を前記仮の利得として用いることを特徴とする請
    求項2記載の音声符号化方法。
  4. 【請求項4】前記第1の形状ベクトルを探索して決定す
    るステップは、前記1段目の形状ベクトル符号帳から得
    られる形状ベクトルに最適利得を乗じて得られる第1の
    候補ベクトルと前記第1の目標ベクトルとの誤差が最小
    となる形状ベクトルを前記第1の形状ベクトルとして決
    定し、 前記第2の目標ベクトルを生成するステップは、前記最
    適利得と利得ベクトル符号帳内の1つ以上の要素値とを
    用いて前記仮の利得を設定することを特徴とする請求項
    2記載の音声符号化方法。
  5. 【請求項5】前記第2の目標ベクトルを生成するステッ
    プは、利得ベクトル符号帳に含まれる利得ベクトルの対
    応する1つ以上の利得を前記仮の利得として用いること
    を特徴とする請求項2記載の音声符号化方法。
  6. 【請求項6】入力音声から第1の目標ベクトルを生成す
    る手段と、 第1の目標ベクトルを用いて1段目の形状ベクトル符号
    帳から第1の形状ベクトルを探索して決定する手段と、 前記第1の形状ベクトルと仮の利得とを利用して第2の
    目標ベクトルを生成する手段と、 前記第2の目標ベクトルを用いて2段目の形状ベクトル
    符号帳から第2の形状ベクトルを探索して決定する手段
    と、 前記第1の形状ベクトル及び第2の形状ベクトルを基に
    利得ベクトルを決定する手段と、 前記第1、第2の形状ベクトル及び利得ベクトルのイン
    デックス情報を出力する手段とを有することを特徴とす
    る音声符号化装置。
  7. 【請求項7】入力音声から第1の目標ベクトルを生成す
    る第1の目標ベクトル生成手段と、 複数の形状ベクトルをそれぞれ有する2段の形状ベクト
    ル符号帳と、 複数の利得ベクトルを有する2次元の利得ベクトル符号
    帳と、 1段目の形状ベクトル符号帳から得られる形状ベクトル
    に最適利得を乗じて得られる第1の候補ベクトルと前記
    第1の目標ベクトルとの誤差が最小となる第1の形状ベ
    クトルを該1段目の形状ベクトル符号帳から探索する第
    1の形状ベクトル探索手段と、 前記第1の目標ベクトルと前記1段目の形状ベクトル符
    号帳から探索された形状ベクトルに仮の利得を乗じたベ
    クトルとを用いて第2の目標ベクトルを生成する第2の
    目標ベクトル生成手段と、 2段目の形状ベクトル符号帳から得られる形状ベクトル
    に最適利得を乗じて得られる第2の候補ベクトルと前記
    第2の目標ベクトルとの誤差が最小となる第2の形状ベ
    クトルを該2段目の形状ベクトル符号帳から探索する第
    2の形状ベクトル探索手段と、 前記第1および第2の形状ベクトル探索手段により前記
    2段の形状ベクトル符号帳から探索された2個の形状ベ
    クトルと前記利得ベクトル符号帳から得られる利得ベク
    トルの各々対応する利得との線形和をとって2個の第3
    の候補ベクトルを生成すると共に、該第3の候補ベクト
    ルと前記第1の目標ベクトルとの誤差が最小となる利得
    ベクトルを該利得ベクトル符号帳から探索する利得ベク
    トル探索手段と、 前記第1、第2の形状ベクトル探索手段により探索され
    た第1、第2の形状ベクトル及び前記利得ベクトル探索
    手段により探索された利得ベクトルのインデックス情報
    を出力する手段とを有することを特徴とする音声符号化
    装置。
  8. 【請求項8】前記第2の目標ベクトル生成手段は、1段
    目の形状ベクトル符号帳から形状ベクトルを探索する際
    に用いる最適利得を前記仮の利得として用いることを特
    徴とする請求項7記載の音声符号化装置。
  9. 【請求項9】前記第2の目標ベクトル生成手段は、1段
    目の形状ベクトル符号帳から形状ベクトルを探索する際
    に用いる最適利得と前記利得ベクトル符号帳内の1つ以
    上の要素値とを用いて前記仮の利得を設定することを特
    徴とする請求項7記載の音声符号化装置。
  10. 【請求項10】前記第2の目標ベクトル生成手段は、前
    記利得ベクトル符号帳に含まれる利得ベクトルの対応す
    る1つ以上の利得を前記仮の利得として用いることを特
    徴とする請求項7記載の音声符号化装置。
JP2001215842A 2001-07-16 2001-07-16 利得形状ベクトル量子化方法とこれを用いた音声符号化方法及び装置 Expired - Lifetime JP3420222B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001215842A JP3420222B2 (ja) 2001-07-16 2001-07-16 利得形状ベクトル量子化方法とこれを用いた音声符号化方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001215842A JP3420222B2 (ja) 2001-07-16 2001-07-16 利得形状ベクトル量子化方法とこれを用いた音声符号化方法及び装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP06522694A Division JP3228389B2 (ja) 1994-04-01 1994-04-01 利得形状ベクトル量子化装置

Publications (2)

Publication Number Publication Date
JP2002084194A JP2002084194A (ja) 2002-03-22
JP3420222B2 true JP3420222B2 (ja) 2003-06-23

Family

ID=19050404

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001215842A Expired - Lifetime JP3420222B2 (ja) 2001-07-16 2001-07-16 利得形状ベクトル量子化方法とこれを用いた音声符号化方法及び装置

Country Status (1)

Country Link
JP (1) JP3420222B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4414705B2 (ja) 2003-09-17 2010-02-10 パナソニック株式会社 音源信号符号化装置、及び音源信号符号化方法
JP5337305B2 (ja) * 2010-07-05 2013-11-06 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、及び記録媒体

Also Published As

Publication number Publication date
JP2002084194A (ja) 2002-03-22

Similar Documents

Publication Publication Date Title
EP0443548B1 (en) Speech coder
US7733973B2 (en) Multichannel signal encoding method, its decoding method, devices for these, program, and its recording medium
US7392179B2 (en) LPC vector quantization apparatus
JP3114197B2 (ja) 音声パラメータ符号化方法
JPH04363000A (ja) 音声パラメータ符号化方式および装置
US5451951A (en) Method of, and system for, coding analogue signals
JPH06222797A (ja) 音声符号化方式
JPH04134400A (ja) 音声符号化装置
KR100215709B1 (ko) 벡터부호화 방법 및 그것을 사용한 부호화기 및복호화기
JP2800618B2 (ja) 音声パラメータ符号化方式
US20050114123A1 (en) Speech processing system and method
JP3420222B2 (ja) 利得形状ベクトル量子化方法とこれを用いた音声符号化方法及び装置
JP3228389B2 (ja) 利得形状ベクトル量子化装置
JP3088163B2 (ja) Lsp係数の量子化方法
JPH06175695A (ja) 音声パラメータの符号化方法および復号方法
EP0405548B1 (en) System for speech coding and apparatus for the same
JP2003345392A (ja) 分割型スケーリング因子を用いたスペクトル包絡パラメータのベクトル量子化器
JP3319551B2 (ja) ベクトル量子化装置
JP3471892B2 (ja) ベクトル量子化方法及び装置
JP3233184B2 (ja) 音声符号化方法
JP3194930B2 (ja) 音声符号化装置
JP2897940B2 (ja) 音声の線形予測パラメータ符号化方法
JP3335650B2 (ja) 音声符号化方式
JP3192051B2 (ja) 音声符号化装置
JP3267308B2 (ja) 統計励振コードベクトルの最適化方法、多段コード励振線形予測符号化器及び多段コード励振線形予測復号化器

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080418

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090418

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100418

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100418

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110418

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130418

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140418

Year of fee payment: 11

EXPY Cancellation because of completion of term