JPH0556008A - ベクトル量子化装置 - Google Patents

ベクトル量子化装置

Info

Publication number
JPH0556008A
JPH0556008A JP3267356A JP26735691A JPH0556008A JP H0556008 A JPH0556008 A JP H0556008A JP 3267356 A JP3267356 A JP 3267356A JP 26735691 A JP26735691 A JP 26735691A JP H0556008 A JPH0556008 A JP H0556008A
Authority
JP
Japan
Prior art keywords
vector
code
index
quantization
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3267356A
Other languages
English (en)
Inventor
Yoshiaki Asakawa
吉章 淺川
Katsuya Yamazaki
山崎  勝也
Hiroshi Ichikawa
熹 市川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP3267356A priority Critical patent/JPH0556008A/ja
Publication of JPH0556008A publication Critical patent/JPH0556008A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【目的】本発明の目的は、相補型ベクトル量子化の線形
結合に用いるコードベクトルを指定する指標の一部を伝
送不要とすることによって、伝送情報量を飛躍的に低減
するベクトル量子化装置を提供することにある。 【構成】上記目的を達成するために、本発明のベクトル
量子化装置では、相異なる指標に対応づけられた複数個
のコードベクトルを格納するコードブック(401)と、あ
らかじめ定められた大きさのブロック(フレーム)に分
割された信号を入力し、ベクトルに変換する変換手段(4
02)と、前記ベクトルを前記コードブックに格納されて
いる前記コードベクトルと照合し、その照合結果に基づ
き前記指標のうち少なくとも1つを出力する照合手段(4
06)と、該照合手段の出力結果に基づき、前記コードブ
ックに格納されている前記コードベクトルの情報を用い
て前記ブロックに分割された信号を復元する復元手段(4
10)と、前記照合手段の出力結果を少なくとも1ブロッ
ク分記憶する記憶手段(420)と、該記憶手段に記憶され
ている指標を参照して前記照合手段と前記復元手段を制
御する手段(410)とを備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は信号のベクトル量子化装
置に係り、特に高品質な低ビットレート音声符号化に好
適なベクトル量子化装置に関する。
【0002】
【従来の技術】従来、音声高能率符号化方式には、様々
な方式が提案されてきた。例えば、中田和男著「ディジ
タル情報圧縮」(廣済堂産報出版、電子科学シリーズ1
00、1984年発行)には、様々な方式がわかりやす
く解説されており、波形符号化方式や情報源符号化方式
(パラメータ符号化方式)に関する多数の方式が示され
ている。また、従来、音声の分析合成には、様々な方式
が提案されてきた。特に、情報圧縮率を高めたものとし
て、いわゆるボコーダと呼ばれているものがある。これ
は音声をスペクトル包絡情報と音源情報に分離し、それ
ぞれをパラメータ化するものである。代表的なものとし
て、チャネルボコーダやLPC(線形予測)ボコーダ、
ホモモルフィックボコーダなどがある。これらの概要
は、たとえば、古井貞煕著「ディジタル音声処理」(東
海大学出版会、1985年9月)に要領良くまとめられ
ている。しかし、これらの方式ではスペクトル包絡の抽
出精度が不十分で、合成音声の品質に問題があった。こ
れに対し、最近新しいスペクトル包絡抽出法として、P
SE(パワースペクトル包絡)分析合成法が提案されて
いる。これは、音声のフーリエパワースペクトルをピッ
チ周波数の間隔で標本化して得られるデータ列からスペ
クトル包絡を定義するものであり、その合成音は従来方
式に比べ高品質である。方式の詳細は、中島隆之、他
著、「パワースペクトル包絡(PSE)音声分析・合成
系」(日本音響学会誌44巻11号、昭63−11)に
述べられている。
【0003】
【発明が解決しようとする課題】これら諸方式のうち、
波形符号化方式は音質が良好なものの、情報圧縮効率を
あげることが困難である。一方パラメータ符号化方式
は、情報圧縮効率は高いものの、逆に情報量をましても
音質に上限が生じ、十分な品質が得られない。特に5〜
10kbps付近は両方式でカバーできない谷間の帯域
となっている。これに対し、両方式の長所を組合せたハ
イブリッド方式として、マルチパルス方式(たとえば、
B.S.Atal et al. "A new model of LPC excitation for
producing natural-sounding speech at low bit rate
s" Proc. ICASSP 82, S-5,10,(1982)など)や、TOR方式
(A.Ichikawa et al.,"A speech coding method using
thinned-out residual" Proc. ICASSP 85,25.7(1985))
等が提案され、各種の検討がなされている。しかし、音
質の点から見ても、処理に要するコストの面から見ても
不十分な状況にあった。
【0004】一般に、各種高能率符号化方式は、音声の
情報の存在が偏っている点に注目し、情報の存在してい
る部分に符号の割当を厚くすることにより実現してい
る。この点をさらに積極的に推し進め、複数のパラメー
タの組合せとしての情報の偏りに注目し、パラメータの
組合せセット(ベクトルと呼ぶ)に対し、音声情報の存
在している部分に符号の割当を厚くする方式(ベクトル
量子化と呼ぶ)(たとえば、S.Roucos et al.,"Segment
quantization for very-low-rate speech coding" Pro
c. ICASSP 82, p.1563(1982))が注目されている。
【0005】ベクトル量子化では、有限個のベクトルを
指標(インデックス)に対応付けて格納するコードブック
を用いる。ベクトル量子化は入力ベクトルを有限個のコ
ードベクトルに写像すると言う意味で量子化過程である
が、指標の情報量が元のベクトルよりも少なく出来るの
で、情報圧縮に用いられる。 音声の予測残差に対して
ベクトル量子化を適用するCELP方式(例えば、B.S.A
tal et al.,“Stochastic coding of speech signals a
t very low bit rates" Proc. ICC 84, pp.1610−1613
(1984))やその改良方式であるVSELP方式(例え
ば、I.A.Gerson etal.,"Vector sum excited linear pr
ediction(VSELP)" Proc. IEEE workshop on speech cod
ing for telecommunications, pp.66−68(1989))などが
提案されている。これらの方式では合成音声と原音声の
誤差をフィードバックループを用いて最小化するような
方法を採っている。そのため合成音声の品質は良好だ
が、処理量が多いこと、また、4.8kbps 以下への適用が
困難という問題が有る。
【0006】高品質の音声符号化を実現するためには、
事前に良質のコードブックを作っておく必要がある。量
子化特性の向上には量子化歪を小さくすることが基本で
あるが、量子化歪はコードブックを大きくするほど小さ
くなる。しかし、大規模のコードブックの作成には極め
て大量の音声データを用いなければならず、かつ、膨大
な処理量を要する。また、メモリ容量や探索処理量とい
った制約から、コードブックのサイズには限度がある。
【0007】同一サイズのコードブックを用いて、通常
のベクトル量子化よりも量子化歪を小さくできる方法と
して、ファジィベクトル量子化がある。これは、入力ベ
クトルとコードブック内のすべてのコードベクトルに対
する級関数を用いて内挿するものである(たとえば、H.
P.Tseng et al.,"Fuzzy vector quantization applied
to hidden Markov modeling" ICASSP 87,4 (1987))。
しかし、各コードベクトルとの類似性の情報である級関
数(メンバシップ関数)情報が大量に必要となるため、
コードブックの質やサイズに比して音質の向上は期待さ
れるものの、伝送用の技術としては用いられてはいなか
った。本発明の発明者らは、ファジィベクトル量子化を
音声符号化向きに改良した方法を提案した(特開平2−90
200号)。これは入力ベクトルの最近傍コードベクトル
と、事前にテーブルに登録されているその近傍ベクトル
を用いてファジィベクトル量子化するものであり、ビッ
トレートを8kbps以下にすることができる。また、
常に量子化歪が低減するように、有効なコードベクトル
のみを選択的に使用するようにした(特開平2-238565
号)。しかしながら、使用されないコードベクトルの級
関数(値は0とする)も伝送する必要があり、伝送情報
量に占める級関数の比率が大きいという問題があった。
したがって、更にビットレートを低減するためには級関
数の情報量の削減が必要である。
【0008】一方、特開昭63−285599号には複数個のコ
ードブックを用い、各コードブックから1個ずつのコー
ドベクトルを選択して伝送し、伝送路符号誤りに対する
耐性を向上させる方法が提案されている。入力ベクトル
の近似となる合成ベクトルは、各コードベクトルの平均
値である。しかしながら、与えられた情報量で複数個の
コードブックを用意するため、全体としてコードベクト
ル数は小さくなり、また、コードベクトルの組合せ数は
同一の情報量で1つのコードブックを用いた場合のコー
ドベクトル数と一致するので、量子化歪は必ずしも減少
しない。本発明の発明者らは、同一のコードブック内の
複数個のコードベクトルの線形結合によって入力ベクト
ルを近似する方法(相補型ベクトル量子化)を提案した
(特願平1−211311号)。これにより、ファジィベクトル
量子化において、量子化歪の低減を保証した上で、情報
量を大幅に低減することができた。
【0009】相補型ベクトル量子化では、複数個のコー
ドベクトルの線形結合によって入力ベクトルを近似する
が、使用するコードベクトルの1つは入力ベクトルとの
距離が最も小さいコードベクトル(最近傍ベクトル)で
ある。音声信号では連続するフレーム間の変化は少ない
ことが多いので、1つのコードベクトルが最近傍ベクト
ルとして数フレームにわたって続くことがある(コード
ブックサイズが小さい場合ほどその傾向が強い)。同じ
指標が連続している場合には、その指標を毎回伝送する
必要はない。しかしながら、従来方法では線形結合に用
いるコードベクトルの数だけ指標を伝送しており、同一
サイズのコードブックを用いる通常のベクトル量子化方
法に比べると情報量の増加が避けられなかった。
【0010】本発明の目的は、上記相補型ベクトル量子
化方法において、線形結合に用いるコードベクトルを指
定する指標の一部を伝送しなくても済むようにすること
で、情報量をより低減するベクトル量子化装置を提供す
ることにある。
【0011】
【課題を解決するための手段】上記第1の目的を達成す
るために、通常のベクトル量子化手段(コードブック、
入力ベクトルをコードベクトルと照合する手段、入力ベ
クトルを復元する手段)のほかに、照合手段における照
合結果を少なくとも1フレーム分記憶する記憶手段を設
ける。この記憶手段に記憶されている前フレームで伝送
した指標を参照し、照合手段及び復元手段を制御する。
【0012】
【作用】伝送したい音声が入力されるとフレーム(ブロ
ック)に分割され、ベクトル変換部(分析部)において
特徴ベクトル(以下、入力ベクトル)が抽出される。こ
の入力ベクトルとコードブック中のコードベクトルが順
次比較され、最も距離が小さいコードベクトル(最近傍
ベクトル)が選択される。この時の入力ベクトルと最近
傍ベクトルとの距離が通常のベクトル量子化における量
子化歪に相当する。
【0013】相補型ベクトル量子化(特願平1−211311
号)では、最近傍ベクトルと組合せるコードベクトルを
選択する。組合せるベクトルの候補は各コードベクトル
ごとにコードブックにあらかじめ登録してある(通常は
そのコードベクトルとの距離が小さいコードベクトル
で、以下、近傍ベクトルと呼ぶ)。具体的には、最近傍
ベクトルに登録してある候補コードベクトルを順次取り
出し、最近傍ベクトルと組合せて、線形結合として入力
ベクトルを近似する。この時、近似度が最良となるよう
に線形結合の係数を決定する。各候補ベクトルごとに最
適な係数を用いて近似誤差(量子化歪に相当する)を算
出し、誤差が最小となる候補ベクトルを選択する。
【0014】本発明は、相補型ベクトル量子化に用いる
コードベクトルの1つは、必ず前フレームで指標が伝送
されたコードベクトルを用いることで指標の伝送を一部
不要としている。そのようにすることで量子化歪が増大
しないように、以下のことを行なう。
【0015】記憶手段に記憶されている前フレームで伝
送された指標を読みだし、更にコードブックを参照し
て、指標に対応するコードベクトルの近傍ベクトル(最
近傍ベクトルと組合せるコードベクトルの候補として用
いる)の指標を読みだす。先に検出された現フレームの
最近傍ベクトルが、前フレームの伝送コードベクトル、
もしくは、その近傍ベクトルのいずれかと一致している
か否かを判定する。もし一致している場合には、前フレ
ームの伝送コードベクトル(実際にはコードベクトルそ
のものが伝送されるわけではなく、その指標が伝送され
るわけだが、ここでは簡単のため、伝送コードベクトル
と呼ぶことにする。以下、同様)とその近傍ベクトルと
で相補型ベクトル量子化を実行する。一致しなかった場
合は、上記のコードベクトルに加えて現フレームの最近
傍ベクトルを用いて相補型ベクトル量子化を実行する。
【0016】いずれの場合も伝送する情報は前フレーム
の伝送コードベクトルと組み合わされたコードベクトル
の指標と、その時の最適係数である。
【0017】入力ベクトルの復元は、記憶手段に記憶さ
れている前フレームで伝送された指標と現フレームで伝
送された指標に基づいてコードブックから線形結合する
コードベクトルを読みだす。現フレームで伝送された係
数を用いて線形結合を行い、入力ベクトルを復元する。
この時点で記憶手段の中の指標を消去し、現フレームで
伝送された指標を記憶する。
【0018】以上で説明した本発明の作用による結果を
従来例と比較すると次のようになる。 (1)現フレームの最近傍ベクトルと前フレームの伝送ベ
クトルが一致する場合は、従来の相補型ベクトル量子化
結果と全く一致する。 (2)現フレームの最近傍ベクトルが前フレームの伝送ベ
クトルの近傍ベクトルの1つと一致した場合は、現フレ
ームの最近傍ベクトルが前フレームの伝送ベクトルの相
補ベクトルとして選ばれる確率が高い。従来方法では現
フレームの最近傍ベクトルを核ベクトルとして相補型ベ
クトル量子化を実行するわけであるが、前フレームの伝
送ベクトルが現フレームの近傍ベクトルの1つとなって
いる可能性が高く、本発明方法でも従来方法とほとんど
同じ結果が得られる。 (3)現フレームの最近傍ベクトルが前フレームの伝送ベ
クトル及びその近傍ベクトルのいずれとも一致しない場
合は、上記(1),(2)と異なり、入力信号の性質が現フ
レームで大きく変化した場合である。この場合は前フレ
ームの伝送ベクトルやその近傍ベクトルは現フレームの
最近傍ベクトルの近傍ベクトルとは一致しない可能性が
高く、従来方法による結果とは異なる。しかし、本発明
の方法では相補ベクトルとして必ず現フレームの最近傍
ベクトルが選ばれる。相補型ベクトル量子化では任意の
コードベクトル組み合わせても量子化歪の非増加(通常
ベクトル量子化に比べての)が保証されているので、通
常ベクトル量子化よりも量子化歪が増えることはない。
これは線形結合の係数を伝送していることの利点であ
り、前フレームの伝送ベクトルを必ず使うという前提で
も、信号の性質が大きく変化した場合の悪影響が避けら
れる。
【0019】したがって本発明によれば、従来方法に比
べて量子化歪をほとんど増加させることなく伝送すべき
指標を減らすことが出きるので、大幅な情報圧縮が可能
である。
【0020】
【実施例】以下、本発明の実施例を図面を用いて説明す
る。図2は本発明のベクトル量子化装置を用いた音声符
号化装置を説明するためのブロック図である。送信側と
受信側を対にした一方向のみを示しており、逆方向への
通信路は、図が複雑になるため省略してある。なお、こ
こでは量子化過程としてのベクトル量子化を、指標等を
出力するまでの過程と、指標等からベクトルを復元する
過程に分け、便宜上前者をベクトル量子化、後者をベク
トル逆量子化と呼んでいる。
【0021】図2において、入力音声101はアナログ
・ディジタル(A/D)変換器102を経て、2面構成の
バッファメモリ103に入力される。このメモリは以下
の処理の時間調整と、入力音声の中断を防止するために
設けられている。バッファメモリ103からの音声は分
析部104に入力され、ピッチ情報107、スペクトル
情報106、レベル情報105が求められる。スペクト
ル情報106 は本発明によるベクトル量子化部108に加
えられ、指標109と線形結合の係数110を得る。指
標109、係数110、ピッチ情報107、レベル情報
105は送信部111、伝送路112を経て受信部11
3に送られる。受信側では受信部で受けた指標10
9′、係数110′、レベル情報105′はベクトル逆
量子化部114に加えられ、スペクトル情報115が復
元され、ピッチ情報107′、レベル情報105′と共
に合成部116に加えられる。合成部116では音声波
形に復号され、出力用の2面バッファメモリ117を経
て、ディジタル・アナログ(D/A)変換器118によ
りアナログ信号に変換され、出力音声119として復元
される。
【0022】以下、各部分を詳細に説明する。図3は分
析部104を説明するための図である。本実施例では、
分析部はパワスペクトル包絡(PSE)分析法による。
PSE分析法は、中島等の論文”パワースペクトル包絡
(PSE)音声分析・合成系”、日本音響学会誌44巻
11号(昭63−11)に詳細に述べられている。ここ
ではその概要を述べる。
【0023】第3図において、波形切り出し部203は
入力音声からピッチ抽出やスペクトル分析をするための
波形区間(フレーム)を切り出すものである。波形区間
長は20〜60ms程度であり、通常1/3〜1/2を
前後のフレームと重なり合うように切り出す。ピッチ抽
出部201は入力音声のピッチ情報(ピッチ周波数また
はピッチ周期)を抽出する。ピッチ抽出の方法は、相関
法やAMDF法など公知の方法を用いれば良い。切り出
された波形は、また、フーリエ変換部204に送られ、
フーリエ級数に変換される。このとき、切り出された波
形にハミング窓等、通常用いられる窓関数を掛けた後、
前後に零データを埋め込み、2048点のデータとし、高速
フーリエ変換(FFT)を用いることで、高速かつ周波
数分解能の高いデータが得られる。フーリエ係数を絶対
値で表示したものが切り出し波形の周波数成分、すなわ
ちスペクトルとなる。切り出し波形が周期構造を有する
場合は、スペクトルはピッチの高調波による線スペクト
ル構造を有する。
【0024】ピッチ再標本化部205では、FFTによ
り得られたスペクトル情報の中から、ピッチ周波数の高
調波成分(線スペクトル成分)のみを取り出す。パワス
ペクトル化部206は、再標本化されたスペクトルの各
成分を2乗し、パワスペクトルに変換する。さらに、対
数化部207は、各成分を対数化し、対数パワスペクト
ルを得る。レベル正規化部208は入力音声の大きさに
基づくレベル変動を吸収するものであるが、次の余弦変
換部209において、まとめて抽出しても良い。
【0025】余弦変換部209は対数パワスペクトルを
再標本化したデータを用いて、有限項の余弦級数で近似
的に表現するものである。項数mは、通常25程度に設
定する。パワスペクトル包絡を次のように表現する。
【0026】
【数1】
【0027】係数Ai(i=0,1,…,m)は、再標
本化されたパワスペクトルデータと、(1)式によるY
(λ)との2乗誤差が最小となるように求められる。係
数の第0項A0 は入力のレベルを表わしているのでレベ
ル情報105として、A1,…,Amをスペクトル情報1
06として出力する。{A1,…,Am}をベクトルとみ
なしているので、本分析部は実質的にベクトル変換部と
なっている。
【0028】次に図1を用いて本発明のベクトル量子化
部を説明する。図1において、コードブック401 にはコ
ードベクトルの要素の値431とその指標(インデック
ス)430が記憶されている。また、後述の候補ベクト
ル選択のため、各コードベクトルごとにそのコードベク
トルとの距離が小さいコードベクトル(以下、近傍ベク
トルと呼ぶ)の指標432が記憶されている。本実施例
で用いるコードブックの構造を図4に示す。ここでcは
コードベクトル数(コードブックサイズ)、nはベクト
ルの次元、kは1コードベクトル当りの近傍ベクトル数
である。kは処理量低減のために設定されており、通常
はcよりも十分小さな値である(c=1024のときk
=32程度)。
【0029】図1に戻り、照合部400について説明す
る。スペクトル情報(入力ベクトル)106が入力され
ると、コードブック401から各コードベクトルの要素
431が読みだされ、距離計算部402において入力ベ
クトル106との距離が計算される。ここで距離尺度
は、ベクトルの各要素に重み付けしたユークリッド距離
であるが、他の適当な尺度を用いても良いことは言うま
でもない。全数探索の場合はコードブック中の全てのコ
ードベクトルに対して距離値403が計算され、最小値
検出部404に供給される。最小値検出部404では距
離値403が最小となるコードベクトル(最近傍ベクト
ル)の指標405を出力する。なお、主として処理量を
低減する目的で種々のコードブック探索法が提案されて
いるが、いずれの方法を採ることも可能である。
【0030】次に具体的な手順の説明の前に、本発明の
ポイントであるコードベクトルの選択法について、従来
の相補型ベクトル量子化方法(以下、相補型VQと略
す)との比較において概念的に説明する。図6(a)は
簡単のために2次元のベクトル空間を想定し、コードベ
クトル(C1〜C14)と入力ベクトル(I1〜I5)及び
従来の相補型VQによるその量子化結果(S1〜S5)の
関係を示している。コードベクトルはベクトル空間を複
数個のクラスタ(領域)に分割したときの各クラスタを
代表するベクトルである。一方、入力ベクトルI1〜I5
は時系列(時刻、あるいはフレーム番号の1〜5に対
応)を示しており、音声のような信号では多くの場合図
示のように連続的にベクトル空間を移動する。従来の相
補型VQの詳細については図5を用いて後述するが、そ
の要点は2つのコードベクトルの線形結合によって新た
にベクトルを合成し、それを入力ベクトルの量子化結果
とするものである。具体的には入力ベクトルI1に対
し、距離が最も小さいコードベクトル(最近傍ベクト
ル)C1とそれに登録してある近傍ベクトルの中からC4
が相補ベクトルとして選ばれ、係数a1が決まり、合成
ベクトルS1が量子化結果として得られる。以下同様に
2に対してはコードベクトルC4、C5と係数a2が、I
3に対してはコードベクトルC8、C9と係数a3が選ば
れ、そのコードベクトルの指標と係数が伝送される。こ
の関係を図6(a)の表に示す。
【0031】図6(b)は本発明によるベクトル量子化
結果を示したものである。コードベクトルC1〜C14
入力ベクトルI1〜I5は図6(a)と同一である。本発
明では組合せる2つのコードベクトルのうち1つは必ず
前フレームで伝送されたコードベクトルを用いることに
している。入力ベクトルI1については、最近傍ベクト
ルはC1であり、これは前フレームの伝送ベクトルであ
る(と、この例では仮定している)。従ってこの場合
は、従来の相補型VQと全く同様に相補ベクトルにC4
が選ばれ、係数a1’が決定される。係数a1’と量子化
結果S1’は図6(a)の場合のa1とS1に一致する。
ただし、伝送すべきパラメータはC4の指標と係数a1
であり、C1の指標は伝送不要である。
【0032】入力ベクトルI2についても同様に量子化
結果は従来の相補型VQの結果と同じである。I3につ
いては、従来方式ではコードベクトルC8とC9が選択さ
れていたが、本発明ではC5が前フレームで伝送されて
いるので、これは無条件に選択される。I3の最近傍ベ
クトルはC8なので、C5の近傍ベクトルにC8を加えた
ものを対象としてもう1つのコードベクトルを選択す
る。同図の例ではC8が選択され、量子化結果はS3’と
なる。これは第6図(a)のS3とは異なっており、量
子化歪(‖S3’−I3‖)は従来方式の量子化歪(‖S
3−I3‖)よりも若干増加する。I4についても同様に
従来の相補型VQとは結果が異なる。I5については同
じ結果が得られる。伝送すべきパラメータは、いずれの
場合も選択コードベクトルの指標と係数である。これら
の関係を図6(b)の表に示す。
【0033】以下、図1に戻り、具体的な手順について
説明する。指標照合部406において、まず指標記憶部
420から前フレームで伝送されたコードベクトルの指
標421が読みだされる。次にコードブック401を参
照し、指標421に対応するコードベクトルの要素43
1と近傍ベクトルの指標432を読みだす。指標421の
具体的な値がjとすると、第4図で見るように、コード
ブック401から指標jに対応するコードベクトルの要
素V1j,...Vnjと近傍ベクトルの指標i1j,...
ikjが読みだされる。さらに近傍ベクトルの指標に対応
するコードベクトルの要素431が読みだされる。
【0034】後述のように相補型ベクトル量子化実行部
410 においては、前フレームで伝送した指標に対応する
コードベクトルを必ず用い、これと組み合わせるコード
ベクトル(相補ベクトルと呼ぶ)を複数個の候補ベクト
ルの中から選択する。指標照合部406の出力は、前フ
レーム伝送コードベクトル(前述のように、実際にはコ
ードベクトルそのものが伝送されるわけではなく、その
指標が伝送されるわけだが、ここでは簡単のため、伝送
コードベクトルと呼んでいる)の要素407とそれと組
み合わせるコードベクトルの候補である複数個のコード
ベクトルの要素408、及びそれらの指標409であ
る。
【0035】候補ベクトルの選び方は次のとおりであ
る。まず、最小値検出部404の出力である、入力ベク
トル106の最近傍ベクトルの指標405が、前フレー
ムで伝送された指標421とそれに対応するコードベク
トル(伝送コードベクトル)の近傍ベクトルの指標のい
ずれかと一致しているかどうかを判定する。一致してい
る場合は、候補ベクトルは伝送コードベクトルのk個の
近傍ベクトルとする。一方、最近傍ベクトルの指標40
5がいずれとも一致しない場合は、候補ベクトルの伝送
コードベクトルのk個の近傍ベクトルに、入力ベクトル
106に対する最近傍ベクトルを追加した(k+1)個
とする。なお、処理量の制約上、候補ベクトル数をk個
にする必要がある場合は、次のようにする。照合対象を
(k−1)個の近傍ベクトルとし、一致した場合は候補
ベクトルとしてk個の近傍ベクトルを全て用いる。一致
しなかった場合は、(k−1)個の近傍ベクトルに入力ベ
クトル106に対する最近傍ベクトルを加えたk個のコ
ードベクトルを候補ベクトルとする。
【0036】次に、相補型ベクトル量子化実行部410
について説明する。相補型ベクトル量子化については同
出願人の先願特願平1−211311号に詳細に説明さ
れているので、ここでは概要を述べる。相補型ベクトル
量子化は、入力ベクトルを複数個のコードベクトルの組
み合わせで近似することを基本としている。近似方法は
種々考えられるが、ここでは2個のコードベクトルの線
形結合で近似する場合について説明する。また、2個の
コードベクトルのうち1個(以後、これを核ベクトルと
呼ぶ)は前フレームの伝送コードベクトルとする。入力
ベクトルを2個のコードベクトルの線形結合で近似する
原理を第5図で説明する。同図では簡単のため、2次元
のベクトルとして表示してある。
【0037】線形結合で合成されるベクトル(近似ベク
トル)は、2個のベクトルu、vを通る直線上に合成さ
れる。重み係数の符号と大きさにより、u、vの内分
点、または外分点となる。線形結合の重みは、近似誤差
(合成ベクトルと入力ベクトルの距離、すなわち量子化
歪)を最小化するように決定すればよい。図から明らか
なように、入力ベクトルを2個のコードベクトルで近似
することにより、量子化歪を低減できることがわかる。
【0038】一般に、ベクトルの次元をLとする。入力
ベクトルをx={x1,x2,...xL}、核ベクトルを
u={u1,u2,...uL}、核ベクトルと組み合わせ
るコードベクトル(以下、相補ベクトルと呼ぶ)をv=
{v1,v2,...vL}とする。線形結合の係数を
w、(1−w)とすれば、近似ベクトルy={y1
2,...yL}は,
【0039】
【数2】
【0040】と表される。ここで近似誤差|x−y|が
最小になるように係数wを定める。2乗誤差をQD2とす
ると
【0041】
【数3】
【0042】となる。これをwで偏微分し、0と置いて
整理すれば、係数wは次のように求まる。
【0043】
【数4】
【0044】以上はコードベクトルを2個用いる場合で
あるが、3個以上の場合も、まったく同様に係数の組
(w1,w2,...)を求めることができる。また、以
上の説明ではコードブックは1つと仮定しているが、複
数個の独立した、または従属したコードブックを用い、
そこからコードベクトルを選択するようにしてもよいこ
とは、いうまでもない。
【0045】図1に戻り、相補型ベクトル量子化実行部
410の後半について説明する。k個または(k+1)
個の候補ベクトルを順次核ベクトルと組み合わせ、(4)
式の係数を求めて(3)式の2乗誤差を計算する。この2
乗誤差、すなわち近似誤差が最小となる候補ベクトルの
指標109と、その時の係数110を出力する。この時
点で、指標記憶部420に記憶されている前フレームで
伝送された指標421を消去し、現フレームで伝送する
指標109を改めて421として記憶する。以上の例で
は、入力ベクトルを複数個の線形結合として近似し、そ
の係数は近似誤差を最小化するという規範で決定した。
他の例として、ファジィベクトル量子化の考えに基づい
て決定することもできる。
【0046】ファジィベクトル量子化については、中村
等の文献「ファジィベクトル量子化を用いたスペクトロ
グラムの正規化」(日本音響学会誌45巻2号(198
9))及びそこで引用されている文献に詳しく述べられ
ているので、ここではその概要を説明する。ファジィベ
クトル量子化では、入力ベクトルを複数個のコードベク
トルに対する帰属度によって表現する。帰属度は級関数
(メンバシップ関数)により、数値化される。級関数の
求め方の一例を次式に示す。今、c個のコードベクトル
(v1,...,vc)を対象とするとき、入力ベクトル
xk とコードベクトルvi との距離をdikとする。入力
ベクトルがどのコードベクトルにも一致しない場合は、
各コードベクトルに対する級関数uikは次式によって求
まる。
【0047】
【数5】
【0048】ここに、pはファジィネスと呼ぶパラメー
タで、通常1.5程度の値とする。もし、入力ベクトル
がコードベクトルのいずれかに一致したときは、そのコ
ードベクトルに対する級関数の値を1とし、他を0とす
る。
【0049】次に、級関数からベクトルを復元する(逆
量子化操作)について説明する。復元ベクトルyはコー
ドベクトルの線形結合で表わされる。
【0050】
【数6】
【0051】入力ベクトルxk と復元ベクトルyとの誤
差(距離)がファジィベクトル量子化による量子化歪で
ある。ファジィベクトル量子化に基づく場合は、関数の
パラメータは級関数(メンバシップ関数)である。級関
数はその性質上、総和は1となるので、入力ベクトルを
近似するコードベクトルの数より1少ない個数だけ出力
すれば良い。
【0052】以上は、相補ベクトルの選択基準として量
子化歪を用いた例である。これ以外に、局所復号器を持
つことにより、入力信号と同じ次元での誤差尺度を評価
基準として、ベクトルを選択することもできる。
【0053】次に復号化側(受信側)について説明す
る。図7は伝送パラメータ(指標及び係数)から入力ベク
トルを復元するベクトル逆量子化部114を説明するた
めの図である。まず、指標記憶部720から前フレーム
で受信された指標721が読みだされ、これに基づいて
コードブック701から核ベクトルの要素731aが読
みだされる。ここで、受信側のコードブック701は送
信側のコードブック401と同一の内容であることは言
うまでもない。但し、各コードベクトルごとの近傍ベク
トルの指標は不要である。同様に、現フレームで受信さ
れた指標109′に基づいて、相補ベクトルの要素73
1bがコードブック701から読みだされる。これらの
ベクトル要素731a、731bと、受信された係数
(または係数の組)110′を用いて、ベクトル復元部
702において、前述の(2)式(ファジィベクトル量子
化の場合は(6)式)によりベクトルを復元する。復元ベ
クトルy={A1′,A2′,...,Am′}はスペクト
ル情報115として合成部116に送られる。この時点
で、指標記憶部720に記憶されている前フレームで受
信された指標721を消去し、現フレームで受信した指
標109′を改めて721 として記憶する。なお、指標記
憶部720には指標109′ではなく核ベクトルの要素
731aを記憶しても良い。この場合は、次フレームで
核ベクトルの要素731aをコードブック701から読
みだす必要が無くなる。但し、記憶容量は増加する。
【0054】次に、合成部116を図8を用いて説明す
る。同図において、対数パワスペクトル復元部801で
は、伝送されたレベル情報A0′105′ と復元ベクト
ル(スペクトル情報115)の各要素A1′,
2′,...,Am′を用いて対数パワスペクトルY′
802を次式にしたがって得る。
【0055】
【数7】
【0056】復元された対数パワスペクトルY′802
は逆対数変換部803で変換、
【0057】
【数8】
【0058】を行い、零位相化スペクトル804を得、
逆フーリエ変換部805へ送られる。逆フーリエ変換部
805では高速フーリエ逆変換(IFFT)により音声
素片806が得られる。音声素片806は波形合成部8
07でピッチ情報107′にしたがって順次ピッチ間隔
だけずらしながら加えあわせられ、復元音声808とし
て出力される。
【0059】実施例における本発明の効果を図9に示
す。同図は入力ベクトルの伝送に必要なビット数に対す
る量子化歪の関係をプロットしたものである。本発明の
ベクトル量子化方法によれば、同一情報量で従来方法よ
りも量子化歪が小さくなっていることがわかる。
【0060】
【発明の効果】本発明によれば、複数個のコードベクト
ルによって入力ベクトルを表現する場合に、従来方法で
は伝送する必要があったコードベクトルの指標の一部を
伝送する必要が無くなる。この時、量子化歪の増加をほ
とんど伴わないので、情報圧縮効率が高まる。本発明を
音声符号化に適用した場合は、低ビットレートで高品質
な音声を伝送できる。なお、本発明の説明では、対象は
全て音声を例にしているが、類似の構造の情報をもつも
のに利用できることは言うまでもない。
【図面の簡単な説明】
【図1】本発明によるベクトル量子化装置の一実施例を
説明する図である。
【図2】本発明の一実施例の音声符号化装置のシステム
構成を説明するブロック図である。
【図3】図2中の分析部を説明する図である。
【図4】図1中のコードブックの構成を示す図である。
【図5】線形結合による入力ベクトル近似の説明図であ
る。
【図6】(a)は従来の相補型ベクトル量子化を説明す
るための図、(b)は本発明による逐次相補型ベクトル
量子化を説明するための図である。
【図7】図2中のベクトル逆量子化部を説明する図であ
る。
【図8】図2中の合成部を説明する図である。
【図9】実施例の効果を説明する図である。
【符号の説明】
101…入力音声、103,117…バッファメモリ、
104…分析部、106,115…スペクトル情報(入
力ベクトル及び復元ベクトル)、107,107’…ピ
ッチ情報、108…ベクトル量子化部、109,10
9’…コードベクトルの指標、110,110’…係
数、114…ベクトル逆量子化部、116…合成部、1
20…出力音声。

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】高品質で、かつ、低ビットレート音声符号
    化に適したベクトル量子化装置であって、相異なる指標
    に対応づけられた複数個のコードベクトルを格納するコ
    ードブックと、あらかじめ定められた大きさのブロック
    (フレーム)に分割された信号を入力し、ベクトルに変
    換する変換手段と、前記ベクトルを前記コードブックに
    格納されている前記コードベクトルと照合し、その照合
    結果に基づき前記指標のうち少なくとも1つを出力する
    照合手段と、該照合手段の出力結果に基づき、前記コー
    ドブックに格納されている前記コードベクトルの情報を
    用いて前記ブロックに分割された信号を復元する復元手
    段と、前記照合手段の出力結果を少なくとも1ブロック
    分記憶する記憶手段と、該記憶手段に記憶されている指
    標を参照して前記照合手段と前記復元手段を制御する手
    段とを備えたことを特徴とするベクトル量子化装置。
  2. 【請求項2】前記復号手段では前記記憶手段に記憶され
    ている指標と前記照合手段の出力結果の指標とに対応す
    る複数個のコードベクトルの組合せによって前記ブロッ
    クに分割された信号を復元することを特徴とする、請求
    項1記載のベクトル量子化装置。
  3. 【請求項3】前記復号手段では前記記憶手段に記憶され
    ている指標と前記照合手段の出力結果の指標とに対応す
    る複数個のコードベクトルの線形結合によって前記ブロ
    ックに分割された信号を復元し、前記照合手段において
    は線形結合の係数を前記指標とともに出力することを特
    徴とする、請求項1記載のベクトル量子化装置。
  4. 【請求項4】前記照合手段において出力される指標は前
    記記憶手段に記憶されている指標と一致しないことを特
    徴とする、請求項1記載のベクトル量子化装置。
  5. 【請求項5】前記コードブックに格納されているコード
    ベクトルの各々に対し、前記照合手段における照合手順
    を制御する情報があらかじめ付与されていることを特徴
    とする、請求項1記載のベクトル量子化装置。
JP3267356A 1990-10-17 1991-10-16 ベクトル量子化装置 Pending JPH0556008A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3267356A JPH0556008A (ja) 1990-10-17 1991-10-16 ベクトル量子化装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2-276296 1990-10-17
JP27629690 1990-10-17
JP3267356A JPH0556008A (ja) 1990-10-17 1991-10-16 ベクトル量子化装置

Publications (1)

Publication Number Publication Date
JPH0556008A true JPH0556008A (ja) 1993-03-05

Family

ID=26547837

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3267356A Pending JPH0556008A (ja) 1990-10-17 1991-10-16 ベクトル量子化装置

Country Status (1)

Country Link
JP (1) JPH0556008A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017504829A (ja) * 2013-12-17 2017-02-09 ノキア テクノロジーズ オサケユイチア オーディオ信号エンコーダ

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017504829A (ja) * 2013-12-17 2017-02-09 ノキア テクノロジーズ オサケユイチア オーディオ信号エンコーダ

Similar Documents

Publication Publication Date Title
US5384891A (en) Vector quantizing apparatus and speech analysis-synthesis system using the apparatus
US6871176B2 (en) Phase excited linear prediction encoder
Sabin et al. Product code vector quantizers for waveform and voice coding
US6725190B1 (en) Method and system for speech reconstruction from speech recognition features, pitch and voicing with resampled basis functions providing reconstruction of the spectral envelope
US6078880A (en) Speech coding system and method including voicing cut off frequency analyzer
US6081776A (en) Speech coding system and method including adaptive finite impulse response filter
US5890110A (en) Variable dimension vector quantization
CA1321645C (en) Method and system for voice coding based on vector quantization
US6138092A (en) CELP speech synthesizer with epoch-adaptive harmonic generator for pitch harmonics below voicing cutoff frequency
US6094629A (en) Speech coding system and method including spectral quantizer
US6678655B2 (en) Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope
JP3446764B2 (ja) 音声合成システム及び音声合成サーバ
JPH0683400A (ja) 音声メッセージ処理方法
JP2003522965A (ja) 周期的スピーチコーディング
US5751901A (en) Method for searching an excitation codebook in a code excited linear prediction (CELP) coder
JPH0990995A (ja) 音声符号化装置
US20050091041A1 (en) Method and system for speech coding
EP1597721B1 (en) 600 bps mixed excitation linear prediction transcoding
US6611797B1 (en) Speech coding/decoding method and apparatus
EP1239458B1 (en) Voice recognition system, standard pattern preparation system and corresponding methods
Das et al. Variable-dimension vector quantization of speech spectra for low-rate vocoders
EP0950238B1 (en) Speech coding and decoding system
JPH0556008A (ja) ベクトル量子化装置
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP3058640B2 (ja) 符号化方法