JPH0490217A - ベクトル量子化法および音声符号化復合化装置 - Google Patents

ベクトル量子化法および音声符号化復合化装置

Info

Publication number
JPH0490217A
JPH0490217A JP2204918A JP20491890A JPH0490217A JP H0490217 A JPH0490217 A JP H0490217A JP 2204918 A JP2204918 A JP 2204918A JP 20491890 A JP20491890 A JP 20491890A JP H0490217 A JPH0490217 A JP H0490217A
Authority
JP
Japan
Prior art keywords
waveform
interosseous
centroid
centroids
multidimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2204918A
Other languages
English (en)
Other versions
JP2780458B2 (ja
Inventor
Toshiyuki Morii
利幸 森井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2204918A priority Critical patent/JP2780458B2/ja
Publication of JPH0490217A publication Critical patent/JPH0490217A/ja
Application granted granted Critical
Publication of JP2780458B2 publication Critical patent/JP2780458B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、音声信号の符号化復号化装置に用いられるベ
クトル量子化法および音声符号化復号化装置に関するも
のである。
従来の技術 現在のディジタル移動通信の分野では、その加入者の増
加に対応するために、より低ビツトレートで音声を伝送
できる音声符号化復号化装置が望まれている。その低ビ
ツトレート音声符号化を行うには、音声の冗長性を利用
して大幅な情報圧縮を行わなくてはならない。その情報
圧縮法の一つとして従来からベクトル量子化という手法
が用いられてきた。
ベクトル量子化とは、複数のアナログ値情報をベクトル
としたときのベクトル集合の統計的偏りを利用して、複
数のベクトル(セントロイド)が格納されていることを
特徴とする符号帳を用℃・て符号化するものである。符
号化されるベクトルは、符号帳のセントロイドとの距離
計算の後、最も近(・セントロイドの番号に符号化され
る。この方法により、複数の情報が一つの番号に変換さ
れるので、大幅な情報圧縮が実現される。
発明が解決しようとする課題 しかしながら、このベクトル量子化を用いたアルゴリズ
ムでは、セントロイドとの距離計算に非常に大きな計算
量を必要とするために、リアルタイム処理ができないと
いう問題が起る。特に、ベクトルの次数の大きい音声情
報の圧縮では、その計算量は膨大になる。例を挙げろと
、ベクトルの次数が100で、符号帳サイズ2048で
は、20万回の掛は算と2千回の大小比較が必要になる
。ディジタル音声信号の分析単位を20m5ecとする
と、符号帳参照だけで1秒間に1千万回もの掛は算が必
要となる。
本発明は、符号帳の参照の際に、セントロイドとの距離
計算を用いずに、セントロイドとセントロイドとの判別
境界面の式を段階的に適用することにより、計算量を指
数的に大幅に削減しようとするものである。
課題を解決するための手段 この目的を達成するために、本発明によるベクトル量子
化法は、多次元ユークIJ ノド空間上に分布するベク
トルであるセントロイドの集合と、セントロイド集合を
2分割する多次元平面の係数が格納されている多次元平
面係数格納部を設け、多次元平面係数格納部に格納され
ている係数を用いて候補集合を絞り込むことによって、
入力されたベクトルに対してセントロイドの集合の中で
最も近いセントロイドをサーチするように構成されてい
る。
また、本発明による音声符号化復号化装置は、音声信号
を分析することによって得られる数種類の骨組をパワー
とピッチの情報で符号化する骨組符号化手段と、符号付
けられた複数の骨間波形セン)ロイドが格納されている
骨間波形符号帳と、骨間波形符号帳内の骨間波形セント
ロイドの集合に対して2分割のクラスタ分析をすること
によって得られる骨間波形セントロイドの集合を2分割
する多次元平面の係数が格納されている多次元平面係数
格納部と、骨組符号化手段で得られた骨組の間に張られ
る骨間波形をベクトル量子化するために、多次元平面係
数格納部に格納された係数を用いて候補集合を絞り込む
ことによって、骨組符号化手段で得られた骨組の間に張
られる骨間波形に最も近い骨間波形セントロイドを選択
する骨間波形符号化手段を有する符号器と、骨間波形符
号化手段によって符号化された情報をもとに、2種類の
骨組を作成する骨組復号化手段と、符号付けられた複数
の骨間波形セントロイドが格納されている骨間波形符号
帳と、骨間波形符号化手段によって符号化された情報を
もとに、骨間波形符号帳の利用によりその骨組の間に張
られる骨間波形を復号化する骨間波形復号化手段を有す
る復号器とを設けるように構成されている。
作用 本発明は、符号帳の参照に必要な計算量の大部分がセン
トロイドとの距離の計算量であることに着目したもので
あり、上記構成により最も近いセントロイドな求めるの
に、セントロイドとの距離計算を行わずに、セントロイ
ド集合を2分割する多次元平面の式に代入し、その正負
から最も近いセントロイドがどぢらの集合に存在するか
を求め、その情報を用いて段階的に候補集合を小さくし
ていき、最終的に最も近いセントロイドを求めろもので
ある。これにより、計算量を指数的に大幅に削減するこ
とができる。
実施例 本発明の詳細な説明するために、まず例として、入力ベ
クトルが、2つのセントロイドのうちのどぢらに近(・
かを求める問題を考える。
ベクトルの次数をd次とする。従来法では、2つのセン
トロイドとの距離を求めてどちらが小さ(・かを判別す
るという手順であるから、ユークリッド距離で2d回の
掛は算が必要となる。ここで、2つのセントロイドから
等距離にある多次元平面の式に入力ベクトルを代入して
その正負を判別するという方法によると、d回の掛は算
で全く同じ性能を得る事ができる。
そこで、符号帳が2のに乗のサイズであると仮定スると
、セントロイド集合を2つに分割する多次元平面の式を
段階的に用意し、それらの式を使つて最も近いセントロ
イドが含まれる候補集合を絞り込み、最終的に一つのセ
ントロイドを選択スるような探索を行えば、同様の作用
で計算量はl o g 2 K / Kに削減される。
例を挙げると、ベクトルの次数が100で、符号帳サイ
ズ2048では、200000回の掛は算が1200回
に削減される。従って、大幅な計算削減が実現でき、上
記目的が達成される。
以下、本発明の一実施例について図面を参照しながら説
明する。
本発明の実施例として、音声符号化法の一つである骨組
(パルスの時系列)と骨間波形による音声符号化・復号
化システムへの応用例を示す。第1図は、本発明の一実
施例における骨組と骨間波形による音声符号化・復号化
システムの機能ブロック結線図である。
第1図において、1は符号器、2は復号器、3は入力音
声、4はパワー計算部、6はピッチ分析部、6は骨組検
索部、7は骨間波形選択部、8は骨間波形符号帳、9は
多次元平面係数格納部、10は骨組形成部、11は波形
合成部、12は骨間波形符号帳、13は出力音声である
各ブロックの動作を以下に説明ずろ。
符号器1においては、まず、音声信号をサンフリングし
てディジタル信号に変換し、一定時間長(1フレーム)
ごとに区切った入力音声に対して、パワー計算部4にお
いて、その区間内の平均パワーを求めて、補助情報とす
る。
次に、ピッチ分析部6において、その区間内のピンチを
求め、ピッチ情報とする。骨組検索部6においては、ピ
ッチ情報を基に、1ピツチ内の信号で、正と負で絶対値
最大となる2つの信号を検索し、その2つの信号の位置
と、信号の振幅と、前述したピンチ情報とを骨組情報と
する。
骨間波形選択部70機能を第2図を用℃・て説明する。
まず、前述した骨組情報を基に、1ピツチ内において、
骨組となる正の最大信号から負の最大信号までの間に張
られる波形と、負の最大信号から正の最大信号までの間
に張られる波形とを求めて、これを基本骨間波形ベクト
ルとする。
次に、2つの基本骨間波形ベクトルを端点固定(時間的
・パワー的)に正規化した後、ベクトル量子化によって
符号化を行う。骨間波形符号帳8に格納されている番号
付けられた骨間波形セントロイドと比較し、正規化され
た基本骨間波形ベクトルに最も近い骨間波形セントロイ
ドに付℃・ている番号を骨間波形情報とする。本発明で
は、骨間波形セントロイドとのユークリッド距離計算に
よるセントロイド選択は行わず、多次元平面係数格納部
9に格納された多次元平面係数を用いた候補集合の絞り
込みによるセントロイド選択を行う。
そして、上記のパワー情報、骨組情報、骨間波形情報を
単位時間の音声の符号として伝送する。
ここで、骨間波形選択部7における、多次元平面係数格
納部9に格納された多次元平面係数を用いた候補集合の
絞り込みによるセントロイド選択のアルゴリズムについ
て以下に述べる。また、そのセントロイドの選択の様子
を、符号帳サイズ8の場合について第3図に図示する。
く1〉 まず、セントロイドの全体集合を2つに分けろ
多次元平面の式に入力ベクトルを代入し、その正負から
どちらの集合に属するセントロイドに近いかを判別する
(第3図(a))。
く2〉 次に、判別された集合を2つに分ける多次元平
面の式に代入し、その正負からどちらの集合に属するセ
ントロイドに近いかを判別する(第3図(b))。
<3>  <2>を候補集合の要素が2つになるまで繰
返す(第3図(C))。
〈4〉 最後に、2つのセントロイドから等距離にある
多次元平面の式に代入し、その2つのセントロイドのう
ちどちらに近いかを判別し、近いと判別されたセントロ
イドの番号を骨間波形情報とする(第3図(d))。
また、この時に用いられる多次元平面の式の係数は、い
ずれも多次元平面係数格納部9に格納されているが、多
次元平面係数格納部9および骨間波形符号帳8は次の手
順で作成する。
く1〉 あらかじめ、音声を分析することによって得ら
れる基本骨間波形ベクトルを多くの音声テークについて
集め、それぞれを端点固定(時間的、パワー的)に正規
化して、骨間波形母集団を作成する。
〈2〉 骨間波形母集団に対して、クラスタ分析を行い
、指定の個数のセントロイドを求め、これを骨間波形符
号帳8とする。
く3〉 骨間波形符号帳80セントロイド集合に対して
、多次元平面による2分割のクラスタ分析を行う。さら
に、その2分割されたセントロイド集合それぞれに対し
て2分割のクラスタ分析を行う。そして、クラスタの要
素の数が1になるまで分析を行い、その過程で求められ
る2つのクラスタを分ける多次元平面の式の係数を集め
、これを多次元平面係数格納部9に格納する。
次に、復号器の動作を第4図を用いて説明する。
まず、骨組形成部10においては、前述した符号化によ
って得られるパワー情報と骨組情報を基に、音声の骨組
を形成する。第4図の上部は、この骨組の一例であり、
骨組が骨組情報に基づいて形成されている様子を示す。
波形合成部11においては、骨間波形情報に基づいて、
符号器1に格納されているものと同じ骨間波形符号帳1
2かも基本骨間波形を選び、骨組に応じて時間的・パワ
ー的に変換して各骨の間に張り、この波形を出力音声と
する。第4図下部はこの波形合成の一例である。骨間波
形情報に基づいて、骨間波形符号帳12から選び出した
2種類の骨間波形サンプルによって、骨組の間に基本骨
間波形を張っている様子を示している。
本発明の効果を示すために、乱数コードプククによる判
別シミーレーション実験を行った。セントロイド集合と
しては次数10の乱数ベクトルの集合を用いる。入力す
るサンプル集合としては、セントロイド集合とは別の乱
数ベクトルの集合を用いる。いずれのベクトルもベクト
ルの各値は0〜1の乱数で、また集合のサイズは102
4である。従来のユークリッド距離を用いた方法を方法
1とし、本発明による多次元平面を用いたサーチ法を方
法2としてサーチを行う。また、方法2によってサーチ
されたセントロイドの近傍から32候補のセントロイド
を選んで、それらの候補とのユークリッド距離を求めて
最も近いセントロイドを求める方法を方法3とする。方
法3は方法2の性能を向上させたものである。多次元平
面でサーチした場合は、距離が一番近いセントロイドが
選ばれるとは限らない。従って、方法2および3の場合
は、いかに距離の小さいセントロイドなサーチできたか
がその方法の性能となる。その性能を評価するために、
選ばれたセントロイドが、ユークリッド距離の近い順で
平均何位であるかと、1位で選ばれた個数とを求める。
本明細書の第16頁に示す表1は、各方法における10
24個のサンプルに対する乗算の数と、平均順位と1位
に選ばれた個数とを示したものである。
本実験により、本発明によりほぼ同等の性能で大幅な計
算量削減を実現できることが検証された。
以下余白 表1 性能評価 発明の効果 以上のように本発明は、最も近いセントロイドを求める
のにセントロイドとの距離計算を行わずに、セントロイ
ド集合を2分割する多次元平面の式に代入し、その正負
から最も近いセントロイドがどちらの集合に存在するか
を求め、段階的にセントロイド候補集合を小さくしてい
き、最終的に最も近いセントロイドを求めるようにした
ので、計算量を指数的に大幅に削減することができる。
【図面の簡単な説明】
第1図は本発明の一実施例におけるヘクトル量子化法お
よび音声符号化復号化装置のブロック結線図、第2図は
同実施例における骨間波形選択部7の動作を示す概念図
、第3図(a)から第3図(d)は同実施例における骨
間波形選択部70セントロイドの選択動作を示す概念図
、第4図は同実施例における復号器2の動作を示す概念
図である。 1・・・符号器、2・・・復号器、3・・・入力音声、
4・・パワー計算部、6・・・ピンチ分析部、6・・・
骨組検索部、7・・・骨間波形選択部、8・・・骨間波
形符号帳、9・・・多次元平面係数格納部、10・・・
骨組形成部、11・・・波形合成部、12・・・骨間波
形符号帳、13・・・出力音声。 代理人の氏名 弁理士 粟 野 重 孝 ほか1名(イ
)玉 第2図 号 号 区 階 O ○ ○ 最も近いと選択されたセントロイド ○ ○ ○ 第 図 M、N・・・骨間波形情報

Claims (2)

    【特許請求の範囲】
  1. (1)多次元ユークリッド空間上に分布するベクトルで
    あるセントロイドの集合と、上記セントロイド集合を2
    分割する多次元平面の係数が格納されている多次元平面
    係数格納部を有し、上記多次元平面係数格納部に格納さ
    れている係数を用いて候補集合を絞り込むことによつて
    、入力されたベクトルに対して上記セントロイドの集合
    の中で最も近いセントロイドをサーチすることを特徴と
    するベクトル量子化法。
  2. (2)音声信号を分析することによつて得られる数種類
    の骨組をパワーとピッチの情報で符号化する骨組符号化
    手段と、符号付けられた複数の骨間波形セントロイドが
    格納されている骨間波形符号帳と、上記骨間波形符号帳
    内の骨間波形セントロイドの集合に対して2分割のクラ
    スタ分析をすることによつて得られる骨間波形セントロ
    イドの集合を2分割する多次元平面の係数が格納されて
    いる多次元平面係数格納部と、上記骨組符号化手段で得
    られた骨組の間に張られる骨間波形をベクトル量子化す
    るために、上記多次元平面係数格納部に格納された係数
    を用いて候補集合を絞り込むことによつて、上記骨組符
    号化手段で得られた骨組の間に張られる骨間波形に最も
    近い骨間波形セントロイドを選択する骨間波形符号化手
    段を有する符号器と、上記骨間波形符号化手段によつて
    符号化された情報をもとに、2種類の骨組を作成する骨
    組復号化手段と、符号付けられた複数の骨間波形セント
    ロイドが格納されている骨間波形符号帳と、上記骨間波
    形符号化手段によつて符号化された情報をもとに、上記
    骨間波形符号帳の利用によりその骨組の間に張られる骨
    間波形を復号化する骨間波形復号化手段を有する復号器
    とを備えたことを特徴とする音声符号化復号化装置。
JP2204918A 1990-08-01 1990-08-01 ベクトル量子化法および音声符号化復合化装置 Expired - Lifetime JP2780458B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2204918A JP2780458B2 (ja) 1990-08-01 1990-08-01 ベクトル量子化法および音声符号化復合化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2204918A JP2780458B2 (ja) 1990-08-01 1990-08-01 ベクトル量子化法および音声符号化復合化装置

Publications (2)

Publication Number Publication Date
JPH0490217A true JPH0490217A (ja) 1992-03-24
JP2780458B2 JP2780458B2 (ja) 1998-07-30

Family

ID=16498534

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2204918A Expired - Lifetime JP2780458B2 (ja) 1990-08-01 1990-08-01 ベクトル量子化法および音声符号化復合化装置

Country Status (1)

Country Link
JP (1) JP2780458B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993025007A1 (en) * 1992-05-29 1993-12-09 Studio Gen Inc. Method for compressing sound information and apparatus for reproducing sound information
JPH07110695A (ja) * 1993-09-27 1995-04-25 Internatl Business Mach Corp <Ibm> 音声符号化装置および方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5977730A (ja) * 1982-10-26 1984-05-04 Mitsubishi Electric Corp ベクトル量子化器
JPH01280800A (ja) * 1988-05-06 1989-11-10 Ricoh Co Ltd 符号化方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5977730A (ja) * 1982-10-26 1984-05-04 Mitsubishi Electric Corp ベクトル量子化器
JPH01280800A (ja) * 1988-05-06 1989-11-10 Ricoh Co Ltd 符号化方式

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1993025007A1 (en) * 1992-05-29 1993-12-09 Studio Gen Inc. Method for compressing sound information and apparatus for reproducing sound information
US5594833A (en) * 1992-05-29 1997-01-14 Miyazawa; Takeo Rapid sound data compression in code book creation
JPH07110695A (ja) * 1993-09-27 1995-04-25 Internatl Business Mach Corp <Ibm> 音声符号化装置および方法

Also Published As

Publication number Publication date
JP2780458B2 (ja) 1998-07-30

Similar Documents

Publication Publication Date Title
KR100661040B1 (ko) 정보 처리 장치 및 방법, 정보 기록 장치 및 방법, 기록 매체 및 제공 매체
CN1215491A (zh) 语言处理
US20100217753A1 (en) Multi-stage quantization method and device
KR100215709B1 (ko) 벡터부호화 방법 및 그것을 사용한 부호화기 및복호화기
Constantinescu et al. Improved techniques for single-pass adaptive vector quantization
CN100493199C (zh) 编码装置、编码方法和码本
Hedelin Single stage spectral quantization at 20 bits
JPH0490217A (ja) ベクトル量子化法および音声符号化復合化装置
JP2002158589A (ja) 符号化装置および復号化装置
JP2626492B2 (ja) ベクトル量子化装置
JP4357852B2 (ja) 時系列信号の圧縮解析装置および変換装置
JPH07111456A (ja) 音声圧縮方法および装置
JP4645866B2 (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
JPH0990989A (ja) 変換符号化方法および変換復号化方法
JP2004120623A (ja) 符号化装置、符号化方法、復号装置及び復号方法
JP3227608B2 (ja) 音声符号化装置および音声復号化装置
JP2606583B2 (ja) ベクトル画像符号化装置
JP3420222B2 (ja) 利得形状ベクトル量子化方法とこれを用いた音声符号化方法及び装置
JP3095758B2 (ja) ベクトル量子化のコードベクトル検索方法
JP3648931B2 (ja) 反復変換音声符号化方法および装置
Le Vu et al. Optimal transformation of LSP parameters using neural network
JPH07273660A (ja) 利得形状ベクトル量子化装置
Velсsquez et al. Voice codification using self organizing maps as data mining tool
JP2853266B2 (ja) 音声符号化装置および音声復号化装置
KR100332748B1 (ko) 음성인식의벡터양자화검색방법

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090515

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100515

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100515

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110515

Year of fee payment: 13

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110515

Year of fee payment: 13