JP3526417B2 - ベクトル量子化方法と音声符号化方法および装置 - Google Patents

ベクトル量子化方法と音声符号化方法および装置

Info

Publication number
JP3526417B2
JP3526417B2 JP21128899A JP21128899A JP3526417B2 JP 3526417 B2 JP3526417 B2 JP 3526417B2 JP 21128899 A JP21128899 A JP 21128899A JP 21128899 A JP21128899 A JP 21128899A JP 3526417 B2 JP3526417 B2 JP 3526417B2
Authority
JP
Japan
Prior art keywords
vector
target vector
target
gain
quantization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP21128899A
Other languages
English (en)
Other versions
JP2001044846A (ja
Inventor
皇 天田
勝美 土谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP21128899A priority Critical patent/JP3526417B2/ja
Publication of JP2001044846A publication Critical patent/JP2001044846A/ja
Application granted granted Critical
Publication of JP3526417B2 publication Critical patent/JP3526417B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ベクトル量子化方
法と該ベクトル量子化方法を用いた音声符号化方法およ
び装置に関する。
【0002】
【従来の技術】ベクトル量子化は、量子化したい要素を
組(ベクトル)にして目標ベクトルとし、これに最も近
いベクトルを予め用意した複数のベクトルの中から選択
することで量子化を行う方法である。こうして選択され
た目標ベクトルにより近いベクトルを量子化ベクトルと
呼ぶ。ベクトル量子化は少ないビット数で効率良く量子
化を行うことができるため、音声や画像などの情報の圧
縮符号化に広く用いられている。
【0003】例えば、携帯電話用の音声コーデックなど
に広く用いられているCELP(Code Excited Linear P
rediction)方式の音声符号化(文献1:M.R.Schroeder
andB.S.Atal,“Code Excited Linear Prediction(CEL
P):High Quality Speech at Very Low Bit Rates,”Pro
c.ICASSP,pp.937-940,1985参照)では、LPC(LinearP
redictive Coefficient)と呼ばれる線形予測係数の量子
化や、音源部(音源ベクトルやそのゲインなど)の量子
化などにベクトル量子化の技術が使われている。
【0004】ベクトル量子化の方法の一つに、次式に示
す目標ベクトルrと量子化ベクトルg・s(i)との間
の距離Dを量子化ベクトルの歪みを表す歪み尺度とし、
この距離Dを最小化する符号ベクトルs(i)と、これ
に乗じるゲインgを符号帳からそれぞれ探索する方法が
知られている。 D=|r−g・s(i)|2 …(1) 符号ベクトルs(i)とゲインgの候補が少ない場合に
は、s(i)とgの全ての組合せに対して式(1)を計
算すればよいが、一般にはこれらの候補が各々数百パタ
ーン程度用意されている場合が多く、全ての組合せに対
して式(1)を計算すると数万パターン以上となり、計
算量が膨大となる。そこで、通常は符号ベクトルs
(i)を先に決定し、その後にゲインgを決定するか、
逆にゲインgを先に決定し、その後に符号ベクトルs
(i)を決定するという逐次探索の手法が用いられる。
【0005】符号ベクトルs(i)を先に決定する場
合、ゲインgは目標ベクトルrと量子化ベクトルg・s
(i)との間の距離Dが最小となるように設定される。
距離Dを最小にするゲインは、理想ゲイン(または最適
ゲイン)と呼ばれ、その値は次式により求められる。 g_opt=<r,s(i)>/|s(i)|2 …(2) 量子化の手順としては、まず、式(1)の距離Dを最小
にする符号ベクトルs(i)を符号帳の中から探索す
る。このとき、ゲインgは上述した理想ゲインg_opt
の値を用いる。こうして符号ベクトルs(i)が決定す
ると、次に理想ゲインg_optに最も近いゲインをゲイ
ン符号帳から探索する。ゲイン探索において理想ゲイン
g_optを求めずに式(1)を直接計算し、これを最小
化するゲインを求める方法もある。
【0006】また、目標ベクトルrを複数の符号ベクト
ルの線形結合で量子化する場合もある。2つの符号ベク
トルs1(i),s2(i)を使う場合、 D=|r−g1・s1(i)−g2・s2(j)|2 …(3) を最小化するように探索を行う。探索方法としては、例
えばg2・s2(j)を無視して、s1(i)だけで目
標ベクトルrを量子化する。このとき、ゲインg1は理
想ゲインg1_optとする。次に、r_res=r−g1_
opt・s(i)を計算し、これを新たな目標ベクトルと
して理想ゲインg2_optを用いてs2(j)を同様に
求める。最後に、式(3)の距離Dが最小となるように
g1,g2を量子化する。
【0007】図9は、上述した従来のベクトル量子化方
法を説明するために、各ベクトルを幾何学的に表した図
である。目標ベクトルrを1本の符号ベクトルs(i)
とこれに乗じるゲインgとで近似する場合を考える。理
想ゲインg_optは、幾何学的にはg_opt・s(i)が
目標ベクトルrの符号ベクトルs(i)に対する射影ベ
クトルとなるような値である。
【0008】この理想ゲインg_optの下で求めた式
(1)の距離Dは、目標ベクトルrから量子化ベクトル
g_opt・s(i)に下ろした垂線の長さhの自乗h2
と等しい。従って、理想ゲインg_optを仮定して符号
ベクトルs(i)を探索することは、幾何学的には目標
ベクトルrから符号ベクトルs(i)に下ろした垂線の
長さが最小となるようなs(i)を探索していることに
なる。このときの量子化ベクトルは、g_opt・s
(i)となる。
【0009】ところで、図9から明らかなように、理想
ゲインg_optを用いた場合、量子化ベクトルg_opt・
s(i)の大きさは目標ベクトルrの大きさよりも必ず
小さくなる。このベクトル量子化方法を音声符号化に適
用した場合、つまり目標ベクトルrが音声符号化装置に
入力された音声信号のそれである場合、量子化ベクトル
は符号化音声信号(量子化された音声信号)であるの
で、符号化音声信号の大きさが入力音声信号の大きさよ
りも小さくなる。これは、聴覚的には符号化音声信号を
復号して得られる復号音声の音が小さく聞こえることを
意味する。
【0010】この現象は図9から分かるように、目標ベ
クトルrの方向と符号ベクトルsの方向のずれが大きい
ほど顕著となり、このずれが大きくなり易い子音区間の
ような量子化の難しい区間では、復号音声の音量が小さ
くなってしまう。また、背景雑音区間などでは、入力音
声の音量は一定でもフレーム毎に量子化が適切に行われ
たり行われなかったりするため、復号音声に音量の揺ら
ぎが発生してしまい、音質低下の一因となる。
【0011】
【発明が解決しようとする課題】上述したように、従来
のベクトル量子化方法では量子化ベクトルの大きさが目
標ベクトルの大きさよりも必ず小さくなるという問題が
ある。
【0012】このため、従来のベクトル量子化方法を音
声符号化に適用した場合、符号化音声信号の大きさが入
力音声信号の大きさよりも小さくなり、聴覚的には復号
音声の音が小さく聞こえるため、子音区間のような量子
化の難しい区間で非常に音量が小さくなったり、またフ
レーム毎の量子化が不安定な背景雑音区間などで復号音
声に音量の揺らぎが発生するなどの問題点があった。
【0013】本発明の目的は、量子化ベクトルの大きさ
が目標ベクトルの大きさより小さくなるという問題点を
解決できるベクトル量子化方法を提供することにある。
【0014】本発明の他の目的は、このベクトル量子化
方法を音声信号の符号化に適用して子音部の音量低下や
背景雑音部での音量の揺らぎなどの少ない良好な復号音
声を得ることができる音声符号化方法および装置を提供
することにある。
【0015】
【課題を解決するための手段】上記の課題を解決するた
め、本発明に係るベクトル量子化方法は、目標ベクトル
と該目標ベクトルとの間の距離が最小となる理想量子化
ベクトルとの大きさまたは方向の関係から求められる伸
長係数に従って該目標ベクトルを伸長し、符号ベクトル
に複数のゲインを乗じて得られる複数の量子化ベクトル
のうち前記伸長された目標ベクトルとの間の距離が最小
となる量子化ベクトルに対応するゲインを前記複数のゲ
インから探索し、探索したゲインを示すインデックスを
出力することを特徴とする。また、目標ベクトルと該目
標ベクトルとの間の距離が最小となる理想量子化ベクト
ルとの大きさまたは方向の関係から求められる伸長係数
に従って該目標ベクトルを伸長し、複数の符号ベクトル
から前記伸長された目標ベクトルとの間の距離が最小と
なる符号ベクトルを探索し、探索した符号ベクトルを示
すインデックスを出力することを特徴とする。
【0016】また、複数のベクトルをそれぞれにゲイン
を乗じた後に足し合わせることにより生成される量子化
ベクトルによって目標ベクトルを近似するベクトル量子
化方法においては、目標ベクトルと該目標ベクトルとの
間の距離が最小となる理想量子化ベクトルとの大きさま
たは方向の関係から求められる伸長係数に従って該目標
ベクトルを伸長し、複数の符号ベクトルをそれぞれにゲ
インを乗じた後に足し合わせることにより生成される量
子化ベクトルと前記伸長された目標ベクトルとの間の距
が最小となる量子化ベクトルを生成する際の複数の符
号ベクトルおよびゲインの少なくとも一方を求める。
【0017】本発明に係る音声符号化方法は、入力音声
信号から目標ベクトルを生成するステップと、複数の音
源ベクトルをそれぞれにゲインを乗じた後に足し合わ
せ、かつ合成フィルタにより所定の周波数特性を与える
ことによって目標ベクトルとの間の距離が最小となる理
想合成音声ベクトルを生成するステップと、目標ベクト
ルと理想合成音声ベクトルとの大きさまたは方向の関係
から伸長係数を求めるステップと、この伸長係数に従っ
て目標ベクトルを伸長するステップと、複数の音源ベク
トルをそれぞれにゲインを乗じた後に足し合わせ、かつ
合成フィルタにより所定の周波数特性を与えることによ
って、伸長された目標ベクトルとの間の距離が最小とな
合成音声ベクトルを生成すると共に、該合成音声ベク
トルを生成する際のゲインを求めるステップとを有す
る。
【0018】本発明に係る音声符号化装置は、入力音声
信号から目標ベクトルを生成する目標ベクトル生成手段
と、複数の音源ベクトルをそれぞれにゲインを乗じた後
に足し合わせ、かつ合成フィルタにより所定の周波数特
性を与えることによって合成音声ベクトルを生成する合
成音声ベクトル生成手段と、目標ベクトルと合成音声
ベクトル生成手段により生成される合成音声ベクトルの
うちの該目標ベクトルとの間の距離が最小となる理想合
成音声ベクトルとの大きさまたは方向の関係から伸長係
数を求める伸長係数算出手段と、この伸長係数に従って
目標ベクトルを伸長する目標ベクトル伸長手段と、合成
音声ベクトル生成手段によって目標ベクトル伸長手段に
より伸長された目標ベクトルとの間の距離が最小となる
合成音声ベクトルを生成する際のゲインを求める手段と
を有する。
【0019】このように本発明では、伸長された目標ベ
クトルに対して量子化ベクトルやゲインを探索すること
により、量子化ベクトルの大きさが目標ベクトルの大き
さよりも小さくなる問題が解決される。従って、本発明
を音声符号化に適用した場合には、子音区間のような量
子化の難しい区間での音量低下や、フレーム毎の量子化
が不安定な背景雑音区間などでの音量の揺らぎといった
現象が緩和される。
【0020】また、本発明ではこの問題解決の仕組みを
ゲイン探索のアルゴリズムに組み込むのではなく、探索
を始める前に目標ベクトルを伸長するという簡単な操作
により実現しているため、既存のゲイン探索のアルゴリ
ズムをそのまま使用できるというメリットがあり、計算
量や伝送量の増加といった副作用の問題もない。
【0021】目標ベクトルを伸長する際の伸長係数とし
ては、目標ベクトルと理想合成音声ベクトルとの大きさ
の比、または目標ベクトルと理想合成音声ベクトルとの
なす角の余弦の逆数をそのまま用いてもよいし、これら
の値を所定の関数を用いて制限したものを伸長係数とし
てもよい。後者のように伸長係数の値を制限して用いる
ようにすると、関数の特性を適切に選ぶことで、聴覚的
な特性を向上させることが可能となる。
【0022】
【発明の実施の形態】(第1の実施形態)図1は、第1
の実施形態に係るベクトル量子化方法をゲイン量子化に
適用したベクトル量子化装置の構成を示している。この
ベクトル量子化装置は、入力端子101,102、伸長
係数算出部103、目標ベクトル伸長部104、ゲイン
符号帳105、ゲイン乗算器106および評価部107
から構成される。
【0023】入力端子101,102には、それぞれ目
標ベクトルrおよび符号ベクトルsが入力される。伸長
係数算出部103では、後述するように目標ベクトルr
および理想量子化ベクトルg_opt・sの大きさまたは
方向の関係から、目標ベクトルrを伸長するための伸長
係数aが求められる。目標ベクトル伸長部104では、
入力された目標ベクトルrを伸長係数算出部103で算
出された伸長係数aに従って伸長した目標ベクトルr_
scaleが生成される。
【0024】ゲイン符号帳105には、符号ベクトルs
に乗じるべきゲインの候補となるm個のゲインg
(1),g(2),…,g(m)が格納されている。ゲ
イン乗算器106では、入力された符号ベクトルsにゲ
インg(1),g(2),…,g(m)を乗じ、量子化
ベクトルg(j)・s(=1,2,…,m)を評価部1
07に出力する。
【0025】評価部107では、ゲイン乗算器106か
ら出力される量子化ベクトルg(j)・sと伸長された
目標ベクトルr_scaleとの間の距離が最小となるゲイ
ンg(j)がゲイン符号帳105から探索され、このゲ
インg(j)を示すインデックスjがゲイン量子化値と
して出力される。
【0026】次に、図2を用いて伸長係数算出部103
での伸長係数aの算出法について述べる。図2は、符号
ベクトルsにゲインg(j)を乗じて得られる量子化ベ
クトルg(j)・sで目標ベクトルrを近似する様子を
表している。量子化ベクトルg(j)・sの歪みの程度
を表す歪み尺度として、式(1)に示した目標ベクトル
rと量子化ベクトルg(j)・sとの間の距離Dを用い
た場合、理想ゲインg_optは理想量子化ベクトルg_o
pt・sが目標ベクトルrの真下にくるような値であるこ
とは既に述べた。このときの理想ゲインg_optは、数
学的には式(1)をゲインgで偏微分して求めることが
でき、その値は式(2)に示した通りである。
【0027】ところで、図2から分かるように、理想量
子化ベクトルg_opt・sの大きさは必ず目標ベクトル
rの大きさよりも小さくなる。ゲインgを量子化する場
合も理想ゲインg_optに近いゲイン(g′とする)が
選ばれ、目標ベクトルrの大きさよりも小さい量子化ベ
クトルg′・sが得られてしまう。これが従来のベクト
ル量子化の問題点であった。
【0028】本発明は、このような量子化ベクトルの大
きさが目標ベクトルの大きさよりも小さくなる現象を解
決するベクトル量子化方法であり、そのポイントは本実
施形態に係るゲイン量子化の場合、量子化ベクトルの大
きさが小さくなる分を見越して、ゲインの量子化を始め
る前に、予め目標ベクトルの大きさを伸長しておくこと
にある。
【0029】具体的には、例えば伸長係数aを目標ベク
トルrに乗じて伸長した目標ベクトルar=r_scale
を新たな目標ベクトルとしてゲインの量子化を行う。伸
長係数aは、伸長した目標ベクトルarを符号ベクトル
sに射影して得られるベクトルg_scale・sが目標ベ
クトルrと同じ大きさになるように定められる。このよ
うな伸長係数aの値は、図2の二つの三角形の辺の比 |r|:|g_opt・s|=|ar|:|g_scale・s| …(4) を用いて求めることができる。上述したように本発明で
は|g_scale・s|=|r|としたいのだから、この
条件を式(4)の右辺の右側に代入すると、 |r|:|g_opt・s|=|ar|:|r| …(5) が得られる。これより伸長係数aは、 a=|r|/|g_opt・s| …(6) と求められる。すなわち、目標ベクトルrの大きさと理
想量子化ベクトルg_opt・sの大きさとの比を伸長係
数aとして用いる。
【0030】また、この伸長係数aの値は目標ベクトル
rと理想量子化ベクトルg_opt・sとのなす角(=目
標ベクトルrと符号ベクトルsとのなす角)をθとする
と、1/cosθに等しい。 a=1/cosθ …(7) すなわち、伸長係数aは目標ベクトルrの方向と理想量
子化ベクトルg_opt・sの方向(符号ベクトルsの方
向)とからcosθを計算し、さらにcosθの逆数を
とって求めることもできる。
【0031】このように本実施形態によれば、目標ベク
トルrと理想量子化ベクトルg_opt・sの大きさまた
は方向の関係から求められる伸長係数aに従って目標ベ
クトルrを伸長することにより、量子化ベクトルの大き
さが目標ベクトルの大きさより小さくなるという問題を
回避することができる。
【0032】また、本実施形態ではゲインの量子化を行
う前に目標ベクトルrを予め伸長しておくという方法を
用いているため、既存のゲイン量子化技術をそのまま流
用することが可能である。従って、実現が簡単であり、
計算量の増加をほとんど伴うことなく、量子化ベクトル
の大きさが目標ベクトルの大きさより小さくなるという
問題を解決することができる。
【0033】(第2の実施形態)図3に、本発明の第2
の実施形態に係るベクトル量子化方法を実現するベクト
ル量子化装置の構成を示す。図1と同一部分に同一符号
を付して説明すると、本実施形態では図1のゲイン符号
帳105が除去され、入力端子108に固定のゲインg
が入力される点と、複数の符号ベクトルを格納した符号
帳109が追加されている点が第1の実施形態と異なっ
ている。なお、g=1.0の場合は、ゲイン乗算器10
6は不要である。
【0034】入力端子101には、第1の実施形態と同
様に目標ベクトルrが入力される。符号帳109には、
n個の符号ベクトルs(1),s(2),…,s(n)
が格納されている。伸長係数算出部103では、符号ベ
クトルs(i)(i=1,2,…,n)と目標ベクトル
rから伸長係数sが求められる。目標ベクトル伸長部1
04では、目標ベクトルrに伸長係数aを乗じることで
伸長された目標ベクトルr_scaleが求められる。
【0035】評価部107では、目標ベクトル伸長部1
04により伸長された目標ベクトルr_scaleとの間の
距離が最小となる符号ベクトルs(i)が符号帳109
から探索され、これを示すインデックスiが符号ベクト
ルs(i)のベクトル量子化値として出力される。
【0036】第1の実施形態では、符号ベクトルを固定
にしてゲインを探索する方法であったのに対して、本実
施形態はゲインを固定にして符号ベクトルの探索を行う
例である。伸長係数aについては、第1の実施形態と同
様に式(6)または式(7)により求めることができ
る。
【0037】このように本実施形態によると、符号ベク
トルのベクトル量子化においても、目標ベクトルrと理
想量子化ベクトルg_opt・sの大きさまたは方向の関
係から求められる伸長係数aに従って目標ベクトルrを
伸長することにより、量子化ベクトルの大きさが目標ベ
クトルrの大きさよりも小さくなる問題を解決すること
ができる。
【0038】(第3の実施形態)図4に、本発明の第3
の実施形態に係るベクトル量子化方法を実現するベクト
ル量子化装置の構成を示す。このベクトル量子化装置
は、入力端子102に複数の符号ベクトルs1,s2,
…,slが入力される点以外は、図1に示した実施形態
1の構成と同じである。
【0039】すなわち、入力端子101には目標ベクト
ルrが入力され、入力端子102には複数(l本)の符
号ベクトルs1,s2,…,slが入力される。ゲイン
符号帳105には符号ベクトルs1,s2,…,slの
それぞれに乗じるべきゲインの候補が格納されている。
【0040】伸長係数算出部103では、符号ベクトル
s1,s2,…,slと目標ベクトルrから伸長係数a
が求められる。目標ベクトル伸長部104では、この伸
長係数aを目標ベクトルrに乗じることで伸長された目
標ベクトルr_scaleが生成される。評価部107で
は、ゲイン乗算器106でゲインが乗じられて足し合わ
された量子化ベクトルq=g1(j)s1+g2(j)
s2+…+gl(j)slと伸長された目標ベクトルr
_scaleとの間の距離が最小となるようにゲインg1
(j),g2(j),…,gl(j)がゲイン符号帳1
05から探索され、これを示すインデックスjが出力さ
れる。
【0041】ここでは、ゲインの候補を表す方法とし
て、インデックスjを用いてg1〜g1のうちの1個の
ゲインを表すベクトル量子化の表現を用いているが、1
個のゲイン毎にインデックスを割り当てるスカラー量子
化を行ってもよい。
【0042】次に、図5を用いて本実施形態において伸
長係数算出部103で伸長係数aを求める方法について
説明する。図5は、入力端子102に入力される符号ベ
クトルの数がl=2の場合を示しているが、l=3以上
の場合も同様である。
【0043】量子化ベクトルqは、ゲインg1,g2を
変えることで様々な方法を向くが、全て符号ベクトルs
1,s2が張る平面上のベクトルである。この平面を図
ではπs1,s2と表す。目標ベクトルrが平面πs
1,s2上にあれば、適当なゲインg1,g2を選ぶこ
とで量子化ベクトルqの歪みが0(r=q)となるが、
一般的には目標ベクトルrは平面πs1,s2上にな
い。
【0044】そこで、符号ベクトルs1,s2の線形結
合で目標ベクトルrとの間の距離が最小となる量子化ベ
クトルq_opt=g1_opt・s1+g2_opt・s2を
求める。この量子化ベクトルq_optは、目標ベクトル
rを平面πs1,s2に射影したベクトルである。この
量子化ベクトルq_optとゲインg1_opt,g2_opt
をそれぞれ理想量子化ベクトル、理想ゲインと表すこと
にする。これが式(3)から計算で求まる理想ゲイン
(g1_opt,g2_opt)の幾何学的な解釈である。
【0045】ところで、これまでの実施形態と同様に、
理想量子化ベクトルq_optの大きさは目標ベクトルr
の大きさよりも小さい。そこで、第1の実施形態と同様
にゲインの量子化を始める前に予め目標ベクトルrを伸
長しておき、量子化ベクトルの大きさの減少を抑止する
ようにする。この場合の伸長係数aは、 a=|r|/|q_opt| …(8) と、第1の実施形態と同様の考え方で求めることができ
る。また、目標ベクトルrと理想ゲインq_optとのな
す角をθとすれば、 a=1/cosθ …(9) と表せることも同じである。
【0046】ここで、図6に示すフローチャートを用い
て本実施形態におけるベクトル量子化の処理の流れをま
とめると、次の通りである。
【0047】(ステップS1):目標ベクトルrおよび
符号ベクトルs1,s2から、理想ゲインg1_opt,
g2_optを用いて理想量子化ベクトルq_opt=g1_
opt・s1+g2_opt・s2を求める。
【0048】(ステップS2):式(8)に従い、目標
ベクトルrの大きさ|r|を理想量子化ベクトルg_op
tの大きさ|g_opt|で割り、伸長係数aを求める。
【0049】(ステップS3):伸長係数aを目標ベク
トルrに乗じて、伸長された目標ベクトルr_scaleを
求める。
【0050】(ステップS4):伸長された目標ベクト
ルr_scaleと量子化ベクトルq=g1(j)・s1+
g2(j)・s2との間の距離D=(r_scale−g1
(j)・s1−g2(j)・s2)2 が最小となるゲイ
ンg1(j),g2(j)をゲイン符号帳105から探
索し、そのインデックスjをゲインのベクトル量子化値
として出力する。
【0051】このように本実施形態によると、複数の符
号ベクトルs1,s2,…,slを用いて目標ベクトル
rを表す場合でも、1本の符号ベクトルを用いて目標ベ
クトルrを表す場合と同様に、目標ベクトルrと理想量
子化ベクトルg_opt・sの大きさまたは方向の関係か
ら求められる伸長係数aに従って目標ベクトルrを伸長
することにより、パワーの減少を防ぐことができる。
【0052】また、ゲインの量子化方法に関しては、ベ
クトル量子化や予測符号化など高度な技術を駆使した方
法が多く提案されているが、本発明は目標ベクトルrを
予め伸長しておくという方法を用いているため、目標ベ
クトルrのみを量子化前に伸長するだけで既存の量子化
方法に何ら手を加えることなく、利用することができる
という利点もある。
【0053】本実施形態を第2の実施形態と同様にゲイ
ンを固定にし、複数の符号ベクトルを探索する符号ベク
トルの量子化に適用することも可能であるが、これは第
1、第2の実施形態から明らかであるので、詳しい説明
は省略する。
【0054】(第4の実施形態)図7は、本発明の第4
の実施形態として、本発明によるベクトル量子化方法を
ゲイン量子化部に適用したCELP方式の音声符号化装
置の構成を示している。この音声符号化装置は入力端子
201、聴覚重み付け部202、LPC分析部203、
LPC量子化部204、目標ベクトル生成部205、適
応符号帳206、雑音符号帳207、聴覚重み付き合成
フィルタ208、ゲイン符号帳209、ゲイン乗算器2
10,211、加算器212、伸長係数算出部213、
目標ベクトル伸長部214、切替器215、減算器21
6および評価部217から構成されている。
【0055】入力端子201には、符号化すべき音声信
号がフレーム単位で入力される。この入力音声信号は、
聴覚重み付け部202とLPC分析(Linear Predictive
Coding:線形予測分析)部203に入力される。聴覚重
み付け部202により入力音声信号に聴覚的な重み付け
が行われ後、目標ベクトル生成部205で符号化の目標
となる目標ベクトルが生成される。目標ベクトル生成部
205では、例えば前のフレームの影響を引き去るな
ど、符号化を始める前に必要な前処理が適宜行われ、目
標ベクトルが生成される。なお、このような前処理を必
要としない場合もある。
【0056】LPC分析部203では、入力音声信号が
線形予測分析され、これにより線形予測係数が得られ
る。この線形予測係数はLPC量子化部204で量子化
され、聴覚重み付き合成フィルタ208にフィルタ係数
として与えられると同時に、量子化値を指し示すインデ
ックスAが符号化パラメータとして出力される。
【0057】適応符号帳206および雑音符号帳207
には、音源ベクトルである複数の適応符号ベクトルおよ
び雑音符号ベクトルが格納されている。これらの適応符
号ベクトルおよび雑音符号ベクトルは、聴覚重み付き合
成フィルタ208によってフィルタリングされることに
より、声道特性に相当する所定の周波数特性が付与され
る。このフィルタリング後の適応符号ベクトルS1およ
び雑音符号ベクトルS2は、ゲイン乗算器210,21
1によりゲイン符号帳209から出力されるゲインがそ
れぞれ乗じられた後、加算器212で足し合わせられ、
合成音声ベクトルが生成される。
【0058】すなわち、聴覚重み付き合成フィルタ20
8とゲイン乗算器210,211および加算器212に
よって、合成音声ベクトル生成部が構成される。なお、
聴覚重み付き合成フィルタ208を加算器212の後段
に配置して合成音声ベクトル生成部を構成してもよい。
【0059】加算器212から出力される合成音声ベク
トルは減算器216に入力され、その歪み、つまり切替
器215で選択された目標ベクトル(rまたはr_scal
e)との間の距離が求められる。減算器216の出力は
評価部217に入力され、この評価部217によって適
応符号帳206、雑音符号帳207およびゲイン符号帳
209から合成音声ベクトルと目標ベクトル(rまたは
r_scale)との間の距離が最小となる適応符号ベクト
ル、雑音符号ベクトルおよびゲインが探索され、それぞ
れのインデックスB,C,Gが符号化パラメータとして
出力される。
【0060】ここで、従来の音声符号化装置では適応符
号ベクトル、雑音符号ベクトルおよびゲインのいずれの
探索においても、目標ベクトルrとの差が最小となる候
補を探索していたが、本実施形態では少なくともゲイン
の探索に限っては、目標ベクトル伸長部214で伸長さ
れた目標ベクトルr_scaleを用いて探索を行う。すな
わち、切替器215では適応符号帳206および雑音符
号帳207からの適応符号ベクトルおよび雑音符号ベク
トルの探索に際しては、目標ベクトルrを選択して減算
器216に入力するが、ゲイン符号帳209からのゲイ
ンの探索に際しては伸長された目標ベクトルr_scale
を選択して減算器216に入力する。
【0061】目標ベクトル伸長部214で伸長された目
標ベクトルr_scaleを得るために、本実施形態では目
標ベクトルrと聴覚重み付き合成フィルタ208による
フィルタリングで周波数特性が与えられた適応符号ベク
トルS1および雑音符号ベクトルS2が伸長係数算出部
213に入力され、伸長係数aが算出される。そして、
目標ベクトル伸長部214において伸長係数aを目標ベ
クトルrに乗じることにより、伸長された目標ベクトル
r_scaleが求められる。
【0062】伸長係数aの算出に際しては、聴覚重み付
き合成フィルタ208とゲイン乗算器210,211お
よび加算器212により構成される合成音声ベクトル生
成部において、聴覚重み付き合成フィルタ208により
フィルタリングされた適応符号ベクトルおよび雑音符号
ベクトルがゲイン乗算器210,211により理想ゲイ
ンが乗じられた後、加算器212で足し合わせられる。
これによって、合成音声ベクトル生成部では目標ベクト
ルrとの距離が最小となる理想合成音声ベクトルが生成
される。
【0063】そして、先の実施形態と同様の考えで、目
標ベクトルrおよび理想合成音声ベクトルの大きさまた
は方向の関係から伸長係数aが算出される。具体的に
は、例えば式(6)における理想量子化ベクトルq_op
tを理想合成音声ベクトルに置き換え、あるいは式
(7)におけるθを目標ベクトルrと理想音声合成ベク
トルとのなす角として、伸長係数aを求めればよい。
【0064】本実施形態によると、ゲインの探索に際し
て加算器212から出力される合成音声ベクトル(量子
化ベクトル)の大きさが目標ベクトルの大きさに比べて
小さくなる問題、言い換えれば合成音声信号(符号化音
声信号)の大きさが入力音声信号の大きさより小さくな
る問題を回避することができる。すなわち、こうして得
られた符号化音声信号は従来の量子化方法で得られた符
号化音声信号と比較して、波形の形状は同一でその大き
さだけが従来よりも大きくなっているため、音のスペク
トル情報は従来と変わらず、音量が小さくなる問題だけ
を解決することができる。
【0065】従来のCELP方式の音声符号化装置で
は、量子化ベクトルの大きさが小さくなる問題は、主に
子音区間や背景区間などで量子化効率が下がり、目標ベ
クトルと量子化ベクトルの方向が大きくずれるために生
じていた。また、背景区間などでは量子化が正しく行わ
れる区間とそうでない区間が入り交じり、入力音声のパ
ワーは一定でも符号化音声のパワーはフレーム毎に変動
する結果となり、CELP方式に特有のウネリ感を伴う
復号音声が生成される一因となっていた。ゲインのスム
ージングなどを行うことで、この問題を解決する方法も
提案されているが、完全とは言えない。
【0066】本発明は、符号化音声、復号音声の音が小
さくなるメカニズムを解明し、この問題を根本的に解決
する一手法を提案するものであり、量子化効率の善し悪
しに関わらず、原理的に目標ベクトルのパワーと同じパ
ワーの符号化音声ベクトルを得ることができる。
【0067】また、本発明は量子化ベクトルの大きさを
伸長された目標ベクトルの大きさに合わせる結果、従来
法の歪み尺度である式(3)に示される量子化ベクトル
と目標ベクトルとの直接の距離Dは増大している。この
ことが聴覚的にどのような印象を与えるかは、試聴試験
などを行って慎重に判断する必要がある。
【0068】発明者らの行った実験によれば、上述のよ
うに例えば式(6)または(7)と同様にして求められ
た伸長係数a(目標ベクトルおよび理想合成音声ベクト
ルの大きさの比、または目標ベクトルおよび理想合成音
声ベクトルのなす角の余弦の逆数)に対し、図8に示し
た非線形特性に従って値の制限を加えた伸長係数a′を
用いる方法が最も主観評価値が高いことが確認された。
【0069】すなわち、前述のようにして求められたa
の値が1.0〜th1の範囲では、a′=1.0とする
(つまり、伸長は行わない)。aの値が1.0に近いと
いうことは、目標ベクトルと量子化ベクトルの向きがほ
ぼ揃っていることを意味しており、有声区間などがこの
ような特徴を示す。このような区間では、目標ベクトル
の伸長は行わない。
【0070】一方、aの値がth1〜th2の範囲では
徐々にaの値に応じて伸長を行う。音声では、主として
子音区間や背景部がこの範囲の区間に該当する。aの値
がth2を越えた場合は、極端に量子化がうまくいって
おらず、場合によっては異音が発生している場合もある
ので、a′=Smaxとし、これ以上の伸長は行わない
ようにする。
【0071】なお、図8に示した伸長係数の制限方法は
一例であって、コーデックの構成やビットレート、扱う
音声の種類によって制限の仕方は様々であり、制限を加
えず計算により求めた伸長係数aをそのまま使う方法が
最良の場合も有り得る。
【0072】
【発明の効果】以上説明したように、本発明によれば量
子化ベクトルの大きさが目標ベクトルの大きさよりも小
さくなるという従来のベクトル量子化の問題を解決でき
る。従って、特に本発明を音声符号化に適用した場合、
子音部の音量低下や背景雑音部での音量の揺らぎなどを
抑止することができ、音質の改善が可能となるという効
果を期待できる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係るベクトル量子化
装置の構成を示すブロック図
【図2】同実施形態における伸長係数の算出法を説明す
るための図
【図3】本発明の第2の実施形態に係るベクトル量子化
装置の構成を示すブロック図
【図4】本発明の第3の実施形態に係るベクトル量子化
装置の構成を示すブロック図
【図5】同実施形態における伸長係数の算出法を説明す
るための図
【図6】同実施形態におけるゲイン探索の手順を示すフ
ローチャート
【図7】本発明の第4の実施形態に係る音声符号化装置
の構成を示すブロック図
【図8】同実施形態における伸長係数の制限方法を説明
するための図
【図9】従来のベクトル量子化方法を示す図
【符号の説明】
101…目標ベクトル入力端子 102…符号ベクトル入力端子 103…伸長係数算出部 104…目標ベクトル伸長部 105…ゲイン符号帳 106…ゲイン乗算器 107…評価部 108…ゲイン入力端子 109…符号帳 201…音声入力端子 202…聴覚重み付け部 203…LPC分析部 204…LPC量子化部 205…目標ベクトル生成部 206…適応符号帳 207…雑音符号帳 208…聴覚重み付き合成フィルタ 209…ゲイン符号帳 210,211…ゲイン乗算器 212…加算器 213…伸長係数算出部 214…目標ベクトル伸長部 215…切替器 216…減算器 217…評価部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) H03M 3/00 - 11/00 G10L 19/00

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】目標ベクトルと該目標ベクトルとの間の距
    離が最小となる理想量子化ベクトルとの大きさまたは方
    向の関係から求められる伸長係数に従って該目標ベクト
    ルを伸長し、符号ベクトルに複数のゲインを乗じて得られる複数の量
    子化ベクトルのうち前記伸長された目標ベクトルとの間
    の距離が最小となる量子化ベクトルに対応するゲインを
    前記複数のゲインから探索し、 探索したゲインを示すインデックスを出力 することを特
    徴とするベクトル量子化方法。
  2. 【請求項2】目標ベクトルと該目標ベクトルとの間の距
    離が最小となる理想量子化ベクトルとの大きさまたは方
    向の関係から求められる伸長係数に従って該目標ベクト
    ルを伸長し、 複数の符号ベクトルから前記伸長された目標ベクトルと
    の間の距離が最小となる符号ベクトルを探索し、 探索した符号ベクトルを示すインデックスを出力するこ
    とを特徴とするベクトル量子化方法。
  3. 【請求項3】複数の符号ベクトルをそれぞれにゲインを
    乗じた後に足し合わせることにより生成される量子化ベ
    クトルによって目標ベクトルを近似するベクトル量子化
    方法において、 前記目標ベクトルと該目標ベクトルとの間の距離が最小
    となる理想量子化ベクトルとの大きさまたは方向の関係
    から求められる伸長係数に従って該目標ベクトルを伸長
    するステップと、 複数の符号ベクトルをそれぞれにゲインを乗じた後に足
    し合わせることにより生成される量子化ベクトルと前記
    伸長された目標ベクトルとの間の距離が最小となる量子
    化ベクトルを生成する際の複数の符号ベクトルおよびゲ
    インの少なくとも一方を求めるステップとを有すること
    を特徴とするベクトル量子化方法。
  4. 【請求項4】入力音声信号から目標ベクトルを生成する
    ステップと、 複数の音源ベクトルをそれぞれにゲインを乗じた後に足
    し合わせ、かつ合成フィルタにより所定の周波数特性を
    与えることによって前記目標ベクトルとの間の距離が最
    小となる理想合成音声ベクトルを生成するステップと、 前記目標ベクトルと前記理想合成音声ベクトルとの大き
    さまたは方向の関係から伸長係数を求めるステップと、 前記伸長係数に従って前記目標ベクトルを伸長するステ
    ップと、 前記複数の音源ベクトルをそれぞれにゲインを乗じた後
    に足し合わせ、かつ前記合成フィルタにより所定の周波
    数特性を与えることによって、前記伸長された目標ベク
    トルとの間の距離が最小となる合成音声ベクトルを生成
    する際のゲインを求めるスップとを有することを特徴と
    する音声符号化方法。
  5. 【請求項5】前記目標ベクトルと前記理想合成音声ベク
    トルとの大きさの比、または前記目標ベクトルと前記理
    想合成音声ベクトルとのなす角の余弦の逆数を求め、か
    つその値を所定の関数を用いて制限することにより前記
    伸長係数を求めることを特徴とする請求項記載の音声
    符号化方法。
  6. 【請求項6】入力音声信号から目標ベクトルを生成する
    目標ベクトル生成手段と、 複数の音源ベクトルをそれぞれにゲインを乗じた後に足
    し合わせ、かつ合成フィルタにより所定の周波数特性を
    与えることによって合成音声ベクトルを生成する合成音
    声ベクトル生成手段と、 前記目標ベクトルと前記合成音声ベクトル生成手段に
    より生成される合成音声ベクトルのうちの該目標ベクト
    ルとの間の距離が最小となる理想合成音声ベクトルとの
    大きさまたは方向の関係から伸長係数を求める伸長係数
    算出手段と、 前記伸長係数に従って前記目標ベクトルを伸長する目標
    ベクトル伸長手段と、 前記合成音声ベクトル生成手段前記目標ベクトル伸長
    手段により伸長された目標ベクトルとの間の距離が最小
    となる合成音声ベクトルを生成する際のゲインを求める
    手段とを有することを特徴とする音声符号化装置。
  7. 【請求項7】前記伸長係数算出手段は、前記目標ベクト
    ルと前記理想合成音声ベクトルとの大きさの比、または
    前記目標ベクトルと前記理想合成音声ベクトルのなす角
    の余弦の逆数を求め、かつその値を所定の関数を用いて
    制限することにより前記伸長係数を求めることを特徴と
    する請求項記載の音声符号化装置。
JP21128899A 1999-07-26 1999-07-26 ベクトル量子化方法と音声符号化方法および装置 Expired - Fee Related JP3526417B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21128899A JP3526417B2 (ja) 1999-07-26 1999-07-26 ベクトル量子化方法と音声符号化方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21128899A JP3526417B2 (ja) 1999-07-26 1999-07-26 ベクトル量子化方法と音声符号化方法および装置

Publications (2)

Publication Number Publication Date
JP2001044846A JP2001044846A (ja) 2001-02-16
JP3526417B2 true JP3526417B2 (ja) 2004-05-17

Family

ID=16603459

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21128899A Expired - Fee Related JP3526417B2 (ja) 1999-07-26 1999-07-26 ベクトル量子化方法と音声符号化方法および装置

Country Status (1)

Country Link
JP (1) JP3526417B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008015357A (ja) * 2006-07-07 2008-01-24 Toshiba Corp 符号化装置

Also Published As

Publication number Publication date
JP2001044846A (ja) 2001-02-16

Similar Documents

Publication Publication Date Title
JP3707153B2 (ja) ベクトル量子化方法、音声符号化方法及び装置
EP0770989B1 (en) Speech encoding method and apparatus
JP3707154B2 (ja) 音声符号化方法及び装置
TWI576832B (zh) 產生帶寬延伸訊號的裝置與方法
EP2791937B1 (en) Generation of a high band extension of a bandwidth extended audio signal
JPH09127991A (ja) 音声符号化方法及び装置、音声復号化方法及び装置
EP0772186A2 (en) Speech encoding method and apparatus
US7805314B2 (en) Method and apparatus to quantize/dequantize frequency amplitude data and method and apparatus to audio encode/decode using the method and apparatus to quantize/dequantize frequency amplitude data
EP2805324B1 (en) System and method for mixed codebook excitation for speech coding
JPH1091194A (ja) 音声復号化方法及び装置
US20060277040A1 (en) Apparatus and method for coding and decoding residual signal
US9082398B2 (en) System and method for post excitation enhancement for low bit rate speech coding
US6593872B2 (en) Signal processing apparatus and method, signal coding apparatus and method, and signal decoding apparatus and method
JPH10124092A (ja) 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
Kroon et al. Quantization procedures for the excitation in CELP coders
JP3526417B2 (ja) ベクトル量子化方法と音声符号化方法および装置
JPH11143498A (ja) Lpc係数のベクトル量子化方法
JP2003044099A (ja) ピッチ周期探索範囲設定装置及びピッチ周期探索装置
JP3088163B2 (ja) Lsp係数の量子化方法
JP3192051B2 (ja) 音声符号化装置
JP3277090B2 (ja) ゲイン量子化方法及び装置、音声符号化方法及び装置並びに音声復号化方法及び装置
JP3675054B2 (ja) ベクトル量子化方法、音声符号化方法及び装置、並びに音声復号化方法
JP3101376B2 (ja) 音声符号化方式
JPH09127997A (ja) 音声符号化方法及び装置
Nishiguchi Weighted vector quantization of harmonic spectral magnitudes for very low-bit-rate speech coding

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040213

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080227

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090227

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100227

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees