JP2780458B2 - ベクトル量子化法および音声符号化復合化装置 - Google Patents

ベクトル量子化法および音声符号化復合化装置

Info

Publication number
JP2780458B2
JP2780458B2 JP2204918A JP20491890A JP2780458B2 JP 2780458 B2 JP2780458 B2 JP 2780458B2 JP 2204918 A JP2204918 A JP 2204918A JP 20491890 A JP20491890 A JP 20491890A JP 2780458 B2 JP2780458 B2 JP 2780458B2
Authority
JP
Japan
Prior art keywords
waveform
interosseous
multidimensional
centroids
centroid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2204918A
Other languages
English (en)
Other versions
JPH0490217A (ja
Inventor
利幸 森井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2204918A priority Critical patent/JP2780458B2/ja
Publication of JPH0490217A publication Critical patent/JPH0490217A/ja
Application granted granted Critical
Publication of JP2780458B2 publication Critical patent/JP2780458B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、音声信号の符号化復号化装置に用いられる
ベクトル量子化法および音声符号化復号化装置に関する
ものである。
従来の技術 現在のディジタル移動通信の分野では、その加入者の
増加に対応するために、より低ビットレートで音声を伝
送できる音声符号化復号化装置が望まれている。その低
ビットレート音声符号化を行うには、音声の冗長性を利
用して大幅な情報圧縮を行わなくてはならない。その情
報圧縮法の一つとして従来からベクトル量子化という手
法が用いられてきた。
ベクトル量子化とは、複数のアナログ値情報をベクト
ルとしたときのベクトル集合の統計的偏りを利用して、
複数のベクトル(セントロイド)が格納されていること
を特徴とする符号帳を用いて符号化するものである。符
合化されるベクトルは、符号帳のセントロイドとの距離
計算の後、最も近いセントロイドの番号に符号化され
る。この方法により、複数の情報が一つの番号に変換さ
れるので、大幅な情報圧縮が実現される。
発明が解決しようとする課題 しかしながら、このベクトル量子化を用いたアルゴリ
ズムでは、セントロイドとの距離計算に非常に大きな計
算量を必要とするために、リアルタイム処理ができない
という問題が起る。特に、ベクトルの次数の大きい音声
情報の圧縮では、その計算量は膨大になる。例を挙げる
と、ベクトルの次数が100で、符号帳サイズ2048では、2
0万回の掛け算と2千回の大小比較が必要になる。ディ
ジタル音声信号の分析単位を20msecとすると、符号帳参
照だけで1秒間に1千万回もの掛け算が必要となる。
本発明は、符号帳の参照の際に、セントロイドとの距
離計算を用いずに、セントロイドとセントロイドとの判
別境界面の式を段階的に適用することにより、計算量を
指数的に大幅に削減しようとするものである。
課題を解決するための手段 この目的を達成するために、本発明によるベクトル量
子化法は、多次元ユークリッド空間上に分布するベクト
ルであるセントロイドの集合と、セントロイド集合を2
分割する平面を表す多元一次式の係数が格納されている
多次元平面係数格納部を設け、多次元平面係数格納部に
格納されている係数によって構成される多元一次式に入
力ベクトルの要素を代入することによって得られる値の
正負を参照して候補集合を絞り込むことによって、入力
されたベクトルに対してセントロイドの集合の中で最も
近いセントロイドをサーチするように構成されている。
また、本発明による音声符号化復号化装置は、音声信
号を分析することによって得られる数種類の骨組をパワ
ーとピッチの情報で符号化する骨組符号化手段と、符号
付けられた複数の骨間波形セントロイドが格納されてい
る骨間波形符号帳と、骨間波形符号帳内の骨間波形セン
トロイドの集合に対して2分割のクラスタ分析をするこ
とによって得られる骨間波形セントロイドの集合を2分
割する平面を表す多元一次式の係数が格納されている多
次元平面係数格納部と、骨組符号化手段で得られた骨組
の間に張られる骨間波形をベクトル量子化するために、
多次元平面係数格納部に格納された係数によって構成さ
れる多元一次式に入力ベクトルの要素を代入することに
よって得られる値の正負を参照して候補集合を絞り込む
ことによって、骨組符号化手段で得られた骨組の間に張
られる骨間波形に最も近い骨間波形セントロイドを選択
する骨間波形符号化手段を有する符号器と、骨間波形符
号化手段によって符号化された情報をもとに、2種類の
骨組を作成する骨組復号化手段と、符号付けられた複数
の骨間波形セントロイドが格納されている骨間波形符号
帳と、骨間波形符号化手段によって符号化された情報を
もとに、骨間波形符号帳の利用によりその骨組の間に張
られる骨間波形を復号化する骨間波形復号化手段を有す
る復号器とを設けるように構成されている。
作 用 本発明は、符号帳の参照に必要な計算量の大部分がセ
ントロイドとの距離の計算量であることに着目したもの
であり、上記構成により最も近いセントロイドを求める
のに、セントロイドとの距離計算を行わずに、セントロ
イド集合を2分割する多次元平面の式に代入し、その正
負から最も近いセントロイドがどちらの集合に存在する
かを求め、その情報を用いて段階的に候補集合を小さく
していき、最終的に最も近いセントロイドを求めるもの
である。これにより、計算量を指数的に大幅に削減する
ことができる。
実施例 本発明の実施例を説明するために、まず例として、入
力ベクトルが、2つのセントロイドのうちのどちらに近
いかを求める問題を考える。
ベクトルの次数をd次とする。従来法では、2つのセ
ントロイドとの距離を求めてどちらが小さいかを判別す
るという手順であるから、ユークリッド距離で2d回の掛
け算が必要となる。ここで、2つのセントロイドから等
距離にある多次元平面の式に入力ベクトルを代入してそ
の正負を判別するという方法によると、d回の掛け算で
全く同じ性能を得る事ができる。
そこで、符号帳が2のK乗のサイズであると仮定する
と、セントロイド集合を2つに分割する多次元平面の式
を段階的に用意し、それらの式に入力ベクトルの要素を
代入して得られる値の正負によって、最も近いセントロ
イドが含まれる候補集合を絞り込み、最終的に一つのセ
ントロイドを選択するような探索を行えば、同様の作用
で計算量は1og2K/Kに削減される。
例を挙げると、ベクトルの次数が100で、符号帳サイ
ズ2048では、200000回の掛け算が1200回に削減される。
従って、大幅な計算削減が実現でき、上記目的が達成さ
れる。
以下、本発明の一実施例について図面を参照しながら
説明する。
本発明の実施例として、音声符号化法の一つである骨
組(パルスの時系列)と骨間波形による音声符号化・復
号化システムへの応用例を示す。第1図は、本発明の一
実施例における骨組と骨間波形による音声符号化・復号
化システムの機能ブロック結線図である。
第1図において、1は符号器、2は復号器、3は入力
音声、4はパワー計算部、5はピッチ分析部、6は骨組
検索部、7は骨間波形選択部、8は骨間波形符号帳、9
は多次元平面係数格納部、10は骨組形成部、11は波形合
成部、12は骨間波形符号帳、13は出力音声である。
各ブロックの動作を以下に説明する。
符号器1においては、まず、音声信号をサンプリング
してディジタル信号に変換し、一定時間長(1フレー
ム)ごとに区切った入力音声に対して、パワー計算部4
において、その区間内の平均パワーを求めて、補助情報
とする。
次に、ピッチ分析部5において、その区間内のピッチ
を求め、ピッチ情報とする。骨組検索部6においては、
ピッチ情報を基に、1ピッチ内の信号で、正と負で絶対
値最大となる2つの信号を検索し、その2つの信号の位
置と、信号の振幅と、前述したピッチ情報とを骨組情報
とする。
骨間波形選択部7の機能を第2図を用いて説明する。
まず、前述した骨組情報を基に、1ピッチ内において、
骨組となる正の最大信号から負の最大信号までの間に張
られる波形と、負の最大信号から正の最大信号までの間
に張られる波形とを求めて、これを基本骨間波形ベクト
ルとする。
次に、2つの基本骨間波形ベクトルを端点固定(時間
的・パワー的)に正規化した後、ベクトル量子化によっ
て符号化を行う。骨間波形符号帳8に格納されている番
号付けられた骨間波形セントロイドと比較し、正規化さ
れた基本骨間波形ベクトルに最も近い骨間波形セントロ
イドに付いている番号を骨間波形情報とする。本発明で
は、骨間波形セントロイドとのユークリッド距離計算に
よるセントロイド選択は行わず、多次元平面係数格納部
9に格納された多次元平面係数を用いた候補集合の絞り
込みによるセントロイド選択を行う。
そして、上記のパワー情報、骨組情報、骨間波形情報
を単位時間の音声の符号として伝送する。
ここで、骨間波形選択部7における、多次元平面係数
格納部9に格納された多次元平面係数を用いた候補集合
の絞り込みによるセントロイド選択のアルゴリズムにつ
いて以下に述べる。また、そのセントロイドの選択の様
子を、符号帳サイズ8の場合について第3図に図示す
る。
<1> まず、セントロイドの全体集合を2つに分ける
多次元平面の式に入力ベクトルを代入し、その正負から
どちらの集合に属するセントロイドに近いかを判別する
(第3図(a))。
<2> 次に、判別された集合を2つに分ける多次元平
面の式に代入し、その正負からどちらの集合に属するセ
ントロイドに近いかを判別する(第3図(b))。
<3> <2>を候補集合の要素が2つになるまで繰返
す(第3図(c))。
<4> 最後に、2つのセントロイドから等距離にある
多次元平面の式に代入し、その2つのセントロイドのう
ちどちらに近いかを判別し、近いと判別されたセントロ
イドの番号を骨間波形情報とする(第3図(d))。
また、この時に用いられる多次元平面の式の係数は、
いずれも多次元平面係数格納部9に格納されているが、
多次元平面係数格納部9および骨間波形符号帳8は次の
手順で作成する。
<1> あらかじめ、音声を分析することによって得ら
れる基本骨間波形ベクトルを多くの音声データについて
集め、それぞれを端点固定(時間的、パワー的)に正規
化して、骨間波形母集団を作成する。
<2> 骨間波形母集団に対して、クラスタ分析を行
い、指定の個数のセントロイドを求め、これを骨間波形
符号帳8とする。
<3> 骨間波形符号帳8のセントロイド集合に対し
て、多次元平面による2分割のクラスタ分析を行う。さ
らに、その2分割されたセントロイド集合それぞれに対
して2分割のクラスタ分析を行う。そして、クラスタの
要素の数が1になるまで分析を行い、その過程で求めら
れる2つのクラスタを分ける多次元平面の式の係数を集
め、これを多次元平面係数格納部9に格納する。
次に、復号器の動作を第4図を用いて説明する。
まず、骨組形成部10においては、前述した符号化によ
って得られるパワー情報と骨組情報を基に、音声の骨組
を形成する。第4図の上部は、この骨組の一例であり、
骨組が骨組情報に基づいて形成されている様子を示す。
波形合成部11においては、骨間波形情報に基づいて、符
号器1に格納されているものと同じ骨間波形符号帳12か
ら基本骨間波形を選び、骨組に応じて時間的・パワー的
に変換して各骨の間に張り、この波形を出力音声とす
る。第4図下部はこの波形合成の一例である。骨間波形
情報に基づいて、骨間波形符号帳12から選び出した2種
類の骨間波形サンプルによって、骨組の間に基本骨間波
形を張っている様子を示している。
本発明の効果を示すために、乱数コードブックによる
判別シミュレーション実験を行った。セントロイド集合
としては次数10の乱数ベクトルの集合を用いる。入力す
るサンプル集合としては、セントロイド集合とは別の乱
数ベクトルの集合を用いる。いずれのベクトルもベクト
ルの各値は0〜1の乱数で、また集合のサイズは1024で
ある。従来のユークリッド距離を用いた方法を方法1と
し、本発明による多次元平面を用いたサーチ法を方法2
としてサーチを行う。また、方法2によってサーチされ
たセントロイドの近傍から32候補のセントロイドを選ん
で、それらの候補とのユークリッド距離を求めて最も近
いセントロイドを求める方法を方法3とする。方法3は
方法2の性能を向上させたものである。多次元平面でサ
ーチした場合は、距離が一番近いセントロイドが選ばれ
るとは限らない。従って、方法2および3の場合は、い
かに距離の小さいセントロイドをサーチできたかがその
方法の性能となる。その性能を評価するために、選ばれ
たセントロイドが、ユークリッド距離の近い順で平均何
位であるかと、1位で選ばれた個数とを求める。
本明細書の第15頁に示す表1は、各方法における1024
個のサンプルに対する乗算の数と、平均順位と1位に選
ばれた個数とを示したものである。
本実験により、本発明によりほぼ同等の性能で大幅な
計算量削減を実現できることが検証された。
発明の効果 以上のように本発明は、最も近いセントロイドを求め
るのにセントロイドとの距離計算を行わずに、セントロ
イド集合を2分割する多次元平面の式に代入し、その正
負から最も近いセントロイドがどちらの集合に存在する
かを求め、段階的にセントロイド候補集合を小さくして
いき、最終的に最も近いセントロイドを求めるようにし
たので、計算量を指数的に大幅に削減することができ
る。
【図面の簡単な説明】
第1図は本発明の一実施例におけるベクトル量子化法お
よび音声符号化復号化装置のブロック結線図、第2図は
同実施例における骨間波形選択部7の動作を示す概念
図、第3図(a)から第3図(d)は同実施例における
骨間波形選択部7のセントロイドの選択動作を示す概念
図、第4図は同実施例における復号器2の動作を示す概
念図である。 1……符号器、2……復号器、3……入力音声、4……
パワー計算部、5……ピッチ分析部、6……骨組検索
部、7……骨間波形選択部、8……骨間波形符号帳、9
……多次元平面係数格納部、10……骨組形成部、11……
波形合成部、12……骨間波形符号帳、13……出力音声。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】多次元ユークリッド空間上に分布するベク
    トルであるセントロイドの集合と、上記セントロイド集
    合を2分割する平面を表す多元一次式の係数が格納され
    ている多次元平面係数格納部を有し、上記多次元平面係
    数格納部に格納されている係数によって構成される多元
    一次式に入力ベクトルの要素を代入することによって得
    られる値の正負を参照して候補集合を絞り込むことによ
    って、入力されたベクトルに対して上記セントロイドの
    集合の中で最も近いセントロイドをサーチすることを特
    徴とするベクトル量子化法。
  2. 【請求項2】音声信号を分析することによって得られる
    数種類の骨組をパワーとピッチの情報で符号化する骨組
    符号化手段と、符号付けられた複数の骨間波形セントロ
    イドが格納されている骨間波形符号帳と、上記骨間波形
    符号帳内の骨間波形セントロイドの集合に対して2分割
    のクラスタ分析をすることによって得られる骨間波形セ
    ントロイドの集合を2分割する平面を表す多元一次式の
    係数が格納されている多次元平面係数格納部と、上記骨
    間符号化手段で得られた骨組の間に張られる骨間波形を
    ベクトル量子化するために、上記多次元平面係数格納部
    に格納された係数によって構成される多元一次式に入力
    ベクトルの要素を代入することによって得られる値の正
    負を参照して候補集合を絞り込むことによって、上記骨
    組符号化手段で得られた骨組の間に張られる骨間波形に
    最も近い骨間波形セントロイドを選択する骨間波形符号
    化手段を有する符号器と、上記骨間波形符号化手段によ
    って符号化された情報をもとに、2種類の骨組を作成す
    る骨組復号化手段と、符号付けられた複数の骨間波形セ
    ントロイドが格納されている骨間波形符号帳と、上記骨
    間波形符号化手段によって符号化された情報をもとに、
    上記骨間波形符号帳の利用によりその骨組の間に張られ
    る骨間波形を復号化する骨間波形復号化手段を有する復
    号器とを備えたことを特徴とする音声符号化復号化装
    置。
JP2204918A 1990-08-01 1990-08-01 ベクトル量子化法および音声符号化復合化装置 Expired - Lifetime JP2780458B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2204918A JP2780458B2 (ja) 1990-08-01 1990-08-01 ベクトル量子化法および音声符号化復合化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2204918A JP2780458B2 (ja) 1990-08-01 1990-08-01 ベクトル量子化法および音声符号化復合化装置

Publications (2)

Publication Number Publication Date
JPH0490217A JPH0490217A (ja) 1992-03-24
JP2780458B2 true JP2780458B2 (ja) 1998-07-30

Family

ID=16498534

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2204918A Expired - Lifetime JP2780458B2 (ja) 1990-08-01 1990-08-01 ベクトル量子化法および音声符号化復合化装置

Country Status (1)

Country Link
JP (1) JP2780458B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05335967A (ja) * 1992-05-29 1993-12-17 Takeo Miyazawa 音情報圧縮方法及び音情報再生装置
US5522011A (en) * 1993-09-27 1996-05-28 International Business Machines Corporation Speech coding apparatus and method using classification rules

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5977730A (ja) * 1982-10-26 1984-05-04 Mitsubishi Electric Corp ベクトル量子化器
JPH01280800A (ja) * 1988-05-06 1989-11-10 Ricoh Co Ltd 符号化方式

Also Published As

Publication number Publication date
JPH0490217A (ja) 1992-03-24

Similar Documents

Publication Publication Date Title
EP0403154A2 (en) Vector quantizer search arrangement
JPWO2006019117A1 (ja) 多チャネル信号符号化方法、その復号化方法、これらの装置、プログラム及びその記録媒体
JPH09181611A (ja) 信号符号化装置及び方法
KR100215709B1 (ko) 벡터부호화 방법 및 그것을 사용한 부호화기 및복호화기
JP2780458B2 (ja) ベクトル量子化法および音声符号化復合化装置
JP2000132194A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP2626492B2 (ja) ベクトル量子化装置
JP3147807B2 (ja) 信号符号化装置
JP2002049397A (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
JP2009139505A (ja) 符号化方法、復号化方法、これらの方法を用いた装置、プログラム、記録媒体
JPH01319100A (ja) スループットが極めて小さいボコーダ内の音声信号のエネルギをエンコードする方法と装置
JP3209248B2 (ja) 音声の励振信号符号化法
JPH03233500A (ja) 音声合成方式およびこれに用いる装置
JP3227608B2 (ja) 音声符号化装置および音声復号化装置
JP3319551B2 (ja) ベクトル量子化装置
US6907413B2 (en) Digital signal processing method, learning method, apparatuses for them, and program storage medium
JP3471889B2 (ja) 音声符号化方法及び装置
JP3095758B2 (ja) ベクトル量子化のコードベクトル検索方法
JP3228389B2 (ja) 利得形状ベクトル量子化装置
JP4645868B2 (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
CN113129920B (zh) 一种基于u型网络和音频指纹的音乐与人声分离方法
JP2002049395A (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
JP3648931B2 (ja) 反復変換音声符号化方法および装置
JP3420222B2 (ja) 利得形状ベクトル量子化方法とこれを用いた音声符号化方法及び装置
JP3112462B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090515

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100515

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100515

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110515

Year of fee payment: 13

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110515

Year of fee payment: 13