JP2780458B2 - Vector quantization method and speech coding / decoding device - Google Patents

Vector quantization method and speech coding / decoding device

Info

Publication number
JP2780458B2
JP2780458B2 JP2204918A JP20491890A JP2780458B2 JP 2780458 B2 JP2780458 B2 JP 2780458B2 JP 2204918 A JP2204918 A JP 2204918A JP 20491890 A JP20491890 A JP 20491890A JP 2780458 B2 JP2780458 B2 JP 2780458B2
Authority
JP
Japan
Prior art keywords
waveform
interosseous
multidimensional
centroids
centroid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2204918A
Other languages
Japanese (ja)
Other versions
JPH0490217A (en
Inventor
利幸 森井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2204918A priority Critical patent/JP2780458B2/en
Publication of JPH0490217A publication Critical patent/JPH0490217A/en
Application granted granted Critical
Publication of JP2780458B2 publication Critical patent/JP2780458B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、音声信号の符号化復号化装置に用いられる
ベクトル量子化法および音声符号化復号化装置に関する
ものである。
Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a vector quantization method and a speech encoding / decoding device used for a speech signal encoding / decoding device.

従来の技術 現在のディジタル移動通信の分野では、その加入者の
増加に対応するために、より低ビットレートで音声を伝
送できる音声符号化復号化装置が望まれている。その低
ビットレート音声符号化を行うには、音声の冗長性を利
用して大幅な情報圧縮を行わなくてはならない。その情
報圧縮法の一つとして従来からベクトル量子化という手
法が用いられてきた。
2. Description of the Related Art In the current field of digital mobile communication, in order to cope with an increase in the number of subscribers, a speech encoding / decoding apparatus capable of transmitting speech at a lower bit rate is desired. In order to perform the low bit rate audio coding, a large amount of information compression must be performed by utilizing the redundancy of the audio. As one of the information compression methods, a method called vector quantization has been conventionally used.

ベクトル量子化とは、複数のアナログ値情報をベクト
ルとしたときのベクトル集合の統計的偏りを利用して、
複数のベクトル(セントロイド)が格納されていること
を特徴とする符号帳を用いて符号化するものである。符
合化されるベクトルは、符号帳のセントロイドとの距離
計算の後、最も近いセントロイドの番号に符号化され
る。この方法により、複数の情報が一つの番号に変換さ
れるので、大幅な情報圧縮が実現される。
Vector quantization uses the statistical bias of a vector set when a plurality of pieces of analog value information are used as vectors,
The encoding is performed using a codebook characterized by storing a plurality of vectors (centroids). The vector to be coded is coded to the number of the closest centroid after calculating the distance to the codebook centroid. According to this method, a plurality of pieces of information are converted into one number, so that significant information compression is realized.

発明が解決しようとする課題 しかしながら、このベクトル量子化を用いたアルゴリ
ズムでは、セントロイドとの距離計算に非常に大きな計
算量を必要とするために、リアルタイム処理ができない
という問題が起る。特に、ベクトルの次数の大きい音声
情報の圧縮では、その計算量は膨大になる。例を挙げる
と、ベクトルの次数が100で、符号帳サイズ2048では、2
0万回の掛け算と2千回の大小比較が必要になる。ディ
ジタル音声信号の分析単位を20msecとすると、符号帳参
照だけで1秒間に1千万回もの掛け算が必要となる。
Problems to be Solved by the Invention However, the algorithm using the vector quantization requires a very large amount of calculation for calculating the distance from the centroid, so that there is a problem that real-time processing cannot be performed. In particular, in the compression of audio information having a large vector order, the amount of calculation becomes enormous. For example, if the degree of the vector is 100 and the codebook size is 2048, 2
It requires 0,000 multiplications and 2,000 comparisons. Assuming that the analysis unit of the digital audio signal is 20 msec, multiplication of 10 million times per second is required only by referring to the codebook.

本発明は、符号帳の参照の際に、セントロイドとの距
離計算を用いずに、セントロイドとセントロイドとの判
別境界面の式を段階的に適用することにより、計算量を
指数的に大幅に削減しようとするものである。
According to the present invention, when the codebook is referred to, the calculation amount is exponentially reduced by applying the equation of the discrimination boundary surface between the centroid and the centroid stepwise without using the distance calculation with the centroid. It is going to reduce it greatly.

課題を解決するための手段 この目的を達成するために、本発明によるベクトル量
子化法は、多次元ユークリッド空間上に分布するベクト
ルであるセントロイドの集合と、セントロイド集合を2
分割する平面を表す多元一次式の係数が格納されている
多次元平面係数格納部を設け、多次元平面係数格納部に
格納されている係数によって構成される多元一次式に入
力ベクトルの要素を代入することによって得られる値の
正負を参照して候補集合を絞り込むことによって、入力
されたベクトルに対してセントロイドの集合の中で最も
近いセントロイドをサーチするように構成されている。
Means for Solving the Problems In order to achieve this object, a vector quantization method according to the present invention uses a set of centroids, which are vectors distributed on a multidimensional Euclidean space, and a set of centroids.
Providing a multidimensional plane coefficient storage unit that stores the coefficients of the multidimensional linear expression representing the plane to be divided, and substituting the elements of the input vector into the multidimensional linear expression composed of the coefficients stored in the multidimensional plane coefficient storage unit By narrowing the candidate set by referring to the sign of the value obtained by performing the search, the nearest centroid in the set of centroids is searched for the input vector.

また、本発明による音声符号化復号化装置は、音声信
号を分析することによって得られる数種類の骨組をパワ
ーとピッチの情報で符号化する骨組符号化手段と、符号
付けられた複数の骨間波形セントロイドが格納されてい
る骨間波形符号帳と、骨間波形符号帳内の骨間波形セン
トロイドの集合に対して2分割のクラスタ分析をするこ
とによって得られる骨間波形セントロイドの集合を2分
割する平面を表す多元一次式の係数が格納されている多
次元平面係数格納部と、骨組符号化手段で得られた骨組
の間に張られる骨間波形をベクトル量子化するために、
多次元平面係数格納部に格納された係数によって構成さ
れる多元一次式に入力ベクトルの要素を代入することに
よって得られる値の正負を参照して候補集合を絞り込む
ことによって、骨組符号化手段で得られた骨組の間に張
られる骨間波形に最も近い骨間波形セントロイドを選択
する骨間波形符号化手段を有する符号器と、骨間波形符
号化手段によって符号化された情報をもとに、2種類の
骨組を作成する骨組復号化手段と、符号付けられた複数
の骨間波形セントロイドが格納されている骨間波形符号
帳と、骨間波形符号化手段によって符号化された情報を
もとに、骨間波形符号帳の利用によりその骨組の間に張
られる骨間波形を復号化する骨間波形復号化手段を有す
る復号器とを設けるように構成されている。
Further, the speech encoding / decoding apparatus according to the present invention includes a framework encoding means for encoding several types of frameworks obtained by analyzing a speech signal with information of power and pitch, and a plurality of encoded inter-bone waveforms. An interosseous waveform codebook in which a centroid is stored, and a set of interosseous waveform centroids obtained by performing a two-division cluster analysis on the set of interosseous waveform centroids in the interosseous waveform codebook In order to vector-quantize the interskeletal waveform stretched between the frames obtained by the frame encoding means, and a multidimensional plane coefficient storage unit storing coefficients of a multidimensional linear expression representing a plane to be divided into two,
By narrowing the candidate set by referring to the sign of the value obtained by substituting the elements of the input vector into the multidimensional linear expression constituted by the coefficients stored in the multidimensional plane coefficient storage unit, An encoder having an interosseous waveform encoding means for selecting an interosseous waveform centroid closest to the interosseous waveform stretched between the set skeletons, and information based on the information encoded by the interosseous waveform encoding means. Skeleton decoding means for creating two types of skeletons, an interosseous waveform codebook in which a plurality of encoded interosseous waveform centroids are stored, and information encoded by the interosseous waveform encoding means. Originally, a decoder having an interstitial waveform decoding means for decoding an interstitial waveform stretched between the frames by using the interstitial waveform codebook is provided.

作 用 本発明は、符号帳の参照に必要な計算量の大部分がセ
ントロイドとの距離の計算量であることに着目したもの
であり、上記構成により最も近いセントロイドを求める
のに、セントロイドとの距離計算を行わずに、セントロ
イド集合を2分割する多次元平面の式に代入し、その正
負から最も近いセントロイドがどちらの集合に存在する
かを求め、その情報を用いて段階的に候補集合を小さく
していき、最終的に最も近いセントロイドを求めるもの
である。これにより、計算量を指数的に大幅に削減する
ことができる。
The present invention focuses on the fact that most of the calculation amount necessary for referring to the codebook is the calculation amount of the distance from the centroid. Substituting the centroid set into a multidimensional plane formula that divides the centroid set into two without calculating the distance to the Lloyd, finds out which set has the closest centroid from its positive or negative, and uses that information to determine the stage The candidate set is gradually reduced, and finally the closest centroid is obtained. As a result, the amount of calculation can be significantly reduced exponentially.

実施例 本発明の実施例を説明するために、まず例として、入
力ベクトルが、2つのセントロイドのうちのどちらに近
いかを求める問題を考える。
Embodiment To explain an embodiment of the present invention, as an example, first consider a problem of determining which of two centroids an input vector is closer to.

ベクトルの次数をd次とする。従来法では、2つのセ
ントロイドとの距離を求めてどちらが小さいかを判別す
るという手順であるから、ユークリッド距離で2d回の掛
け算が必要となる。ここで、2つのセントロイドから等
距離にある多次元平面の式に入力ベクトルを代入してそ
の正負を判別するという方法によると、d回の掛け算で
全く同じ性能を得る事ができる。
Let the order of the vector be d-th order. In the conventional method, since the distance between two centroids is determined to determine which is smaller, 2d multiplications by the Euclidean distance are required. Here, according to the method of substituting an input vector into an expression of a multidimensional plane equidistant from two centroids and determining the sign thereof, exactly the same performance can be obtained by d times of multiplication.

そこで、符号帳が2のK乗のサイズであると仮定する
と、セントロイド集合を2つに分割する多次元平面の式
を段階的に用意し、それらの式に入力ベクトルの要素を
代入して得られる値の正負によって、最も近いセントロ
イドが含まれる候補集合を絞り込み、最終的に一つのセ
ントロイドを選択するような探索を行えば、同様の作用
で計算量は1og2K/Kに削減される。
Therefore, assuming that the codebook has a size of 2K, a multidimensional plane formula for dividing the centroid set into two is prepared in stages, and the elements of the input vector are substituted into those formulas. By narrowing down the candidate set containing the closest centroid based on the sign of the obtained value and performing a search that finally selects one centroid, the calculation effect is reduced to 1 og 2 K / K by the same effect Is done.

例を挙げると、ベクトルの次数が100で、符号帳サイ
ズ2048では、200000回の掛け算が1200回に削減される。
従って、大幅な計算削減が実現でき、上記目的が達成さ
れる。
For example, if the degree of the vector is 100 and the codebook size is 2048, 200,000 multiplications are reduced to 1200.
Therefore, a great reduction in calculation can be realized, and the above object is achieved.

以下、本発明の一実施例について図面を参照しながら
説明する。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.

本発明の実施例として、音声符号化法の一つである骨
組(パルスの時系列)と骨間波形による音声符号化・復
号化システムへの応用例を示す。第1図は、本発明の一
実施例における骨組と骨間波形による音声符号化・復号
化システムの機能ブロック結線図である。
As an embodiment of the present invention, an example of application to a speech encoding / decoding system using a skeleton (time series of pulses) and an interosseous waveform, which is one of speech encoding methods, will be described. FIG. 1 is a functional block connection diagram of a speech encoding / decoding system based on a skeleton and a waveform between bones according to an embodiment of the present invention.

第1図において、1は符号器、2は復号器、3は入力
音声、4はパワー計算部、5はピッチ分析部、6は骨組
検索部、7は骨間波形選択部、8は骨間波形符号帳、9
は多次元平面係数格納部、10は骨組形成部、11は波形合
成部、12は骨間波形符号帳、13は出力音声である。
In FIG. 1, 1 is an encoder, 2 is a decoder, 3 is an input voice, 4 is a power calculator, 5 is a pitch analyzer, 6 is a skeleton searcher, 7 is an interosseous waveform selector, and 8 is an interosseous. Waveform codebook, 9
Is a multidimensional plane coefficient storage unit, 10 is a skeleton forming unit, 11 is a waveform synthesizing unit, 12 is an interbone waveform codebook, and 13 is an output voice.

各ブロックの動作を以下に説明する。 The operation of each block will be described below.

符号器1においては、まず、音声信号をサンプリング
してディジタル信号に変換し、一定時間長(1フレー
ム)ごとに区切った入力音声に対して、パワー計算部4
において、その区間内の平均パワーを求めて、補助情報
とする。
In the encoder 1, first, a voice signal is sampled and converted into a digital signal, and a power calculation unit 4 converts the input voice divided for each fixed time length (one frame).
In, the average power in the section is determined and used as auxiliary information.

次に、ピッチ分析部5において、その区間内のピッチ
を求め、ピッチ情報とする。骨組検索部6においては、
ピッチ情報を基に、1ピッチ内の信号で、正と負で絶対
値最大となる2つの信号を検索し、その2つの信号の位
置と、信号の振幅と、前述したピッチ情報とを骨組情報
とする。
Next, in the pitch analysis unit 5, the pitch in the section is obtained and used as pitch information. In the skeleton search unit 6,
Based on the pitch information, a signal within one pitch is searched for two signals having the maximum absolute value in positive and negative directions, and the positions of the two signals, the signal amplitude, and the pitch information described above are skeleton information. And

骨間波形選択部7の機能を第2図を用いて説明する。
まず、前述した骨組情報を基に、1ピッチ内において、
骨組となる正の最大信号から負の最大信号までの間に張
られる波形と、負の最大信号から正の最大信号までの間
に張られる波形とを求めて、これを基本骨間波形ベクト
ルとする。
The function of the interbone waveform selector 7 will be described with reference to FIG.
First, based on the skeleton information described above, within one pitch,
The waveform stretched between the positive maximum signal and the negative maximum signal, which is the skeleton, and the waveform stretched between the negative maximum signal and the positive maximum signal are obtained, and this is referred to as a basic interosseous waveform vector. I do.

次に、2つの基本骨間波形ベクトルを端点固定(時間
的・パワー的)に正規化した後、ベクトル量子化によっ
て符号化を行う。骨間波形符号帳8に格納されている番
号付けられた骨間波形セントロイドと比較し、正規化さ
れた基本骨間波形ベクトルに最も近い骨間波形セントロ
イドに付いている番号を骨間波形情報とする。本発明で
は、骨間波形セントロイドとのユークリッド距離計算に
よるセントロイド選択は行わず、多次元平面係数格納部
9に格納された多次元平面係数を用いた候補集合の絞り
込みによるセントロイド選択を行う。
Next, after two basic interosseous waveform vectors are normalized to fixed end points (temporally / power-wise), encoding is performed by vector quantization. Compared with the numbered interosseous waveform centroid stored in the interosseous waveform codebook 8, the number attached to the interosseous waveform centroid closest to the normalized basic interosseous waveform vector is the interosseous waveform. Information. In the present invention, the centroid selection is not performed by calculating the Euclidean distance with the interbone waveform centroid, but the centroid selection is performed by narrowing down the candidate set using the multidimensional plane coefficients stored in the multidimensional plane coefficient storage unit 9. .

そして、上記のパワー情報、骨組情報、骨間波形情報
を単位時間の音声の符号として伝送する。
Then, the power information, the skeleton information, and the interosseous waveform information are transmitted as a code of a unit time voice.

ここで、骨間波形選択部7における、多次元平面係数
格納部9に格納された多次元平面係数を用いた候補集合
の絞り込みによるセントロイド選択のアルゴリズムにつ
いて以下に述べる。また、そのセントロイドの選択の様
子を、符号帳サイズ8の場合について第3図に図示す
る。
Here, an algorithm of the centroid selection by narrowing down the candidate set using the multidimensional plane coefficients stored in the multidimensional plane coefficient storage unit 9 in the interbone waveform selection unit 7 will be described below. FIG. 3 shows how the centroid is selected for a codebook size of 8.

<1> まず、セントロイドの全体集合を2つに分ける
多次元平面の式に入力ベクトルを代入し、その正負から
どちらの集合に属するセントロイドに近いかを判別する
(第3図(a))。
<1> First, an input vector is substituted into an expression of a multidimensional plane that divides the entire set of centroids into two, and it is determined which of the sets is closer to the centroid from the positive or negative (FIG. 3 (a)). ).

<2> 次に、判別された集合を2つに分ける多次元平
面の式に代入し、その正負からどちらの集合に属するセ
ントロイドに近いかを判別する(第3図(b))。
<2> Next, the determined set is substituted into an equation of a multidimensional plane which divides the set into two, and it is determined which of the sets is closer to a centroid from the positive or negative (FIG. 3 (b)).

<3> <2>を候補集合の要素が2つになるまで繰返
す(第3図(c))。
<3><2> is repeated until the candidate set has two elements (FIG. 3 (c)).

<4> 最後に、2つのセントロイドから等距離にある
多次元平面の式に代入し、その2つのセントロイドのう
ちどちらに近いかを判別し、近いと判別されたセントロ
イドの番号を骨間波形情報とする(第3図(d))。
<4> Lastly, the centroid is substituted into an equation of a multidimensional plane equidistant from the two centroids, which one of the two centroids is closer to the other is determined, and the number of the centroid determined to be closer is calculated as a bone number. It is set as inter-waveform information (FIG. 3 (d)).

また、この時に用いられる多次元平面の式の係数は、
いずれも多次元平面係数格納部9に格納されているが、
多次元平面係数格納部9および骨間波形符号帳8は次の
手順で作成する。
Also, the coefficient of the multidimensional plane equation used at this time is
Both are stored in the multidimensional plane coefficient storage unit 9,
The multidimensional plane coefficient storage unit 9 and the interbone waveform codebook 8 are created in the following procedure.

<1> あらかじめ、音声を分析することによって得ら
れる基本骨間波形ベクトルを多くの音声データについて
集め、それぞれを端点固定(時間的、パワー的)に正規
化して、骨間波形母集団を作成する。
<1> A basic interosseous waveform vector obtained by analyzing speech in advance is collected for a large amount of speech data, and each is normalized to an end point fixed (temporally and power-wise) to create an interosseous waveform population. .

<2> 骨間波形母集団に対して、クラスタ分析を行
い、指定の個数のセントロイドを求め、これを骨間波形
符号帳8とする。
<2> A cluster analysis is performed on the interbone waveform population to obtain a specified number of centroids, which is referred to as an interbone waveform codebook 8.

<3> 骨間波形符号帳8のセントロイド集合に対し
て、多次元平面による2分割のクラスタ分析を行う。さ
らに、その2分割されたセントロイド集合それぞれに対
して2分割のクラスタ分析を行う。そして、クラスタの
要素の数が1になるまで分析を行い、その過程で求めら
れる2つのクラスタを分ける多次元平面の式の係数を集
め、これを多次元平面係数格納部9に格納する。
<3> The centroid set of the interbone waveform codebook 8 is subjected to two-part cluster analysis using a multidimensional plane. Further, a two-part cluster analysis is performed on each of the two divided centroid sets. Then, the analysis is performed until the number of elements of the cluster becomes one, and the coefficients of the multidimensional plane equation that divides the two clusters obtained in the process are collected and stored in the multidimensional plane coefficient storage unit 9.

次に、復号器の動作を第4図を用いて説明する。 Next, the operation of the decoder will be described with reference to FIG.

まず、骨組形成部10においては、前述した符号化によ
って得られるパワー情報と骨組情報を基に、音声の骨組
を形成する。第4図の上部は、この骨組の一例であり、
骨組が骨組情報に基づいて形成されている様子を示す。
波形合成部11においては、骨間波形情報に基づいて、符
号器1に格納されているものと同じ骨間波形符号帳12か
ら基本骨間波形を選び、骨組に応じて時間的・パワー的
に変換して各骨の間に張り、この波形を出力音声とす
る。第4図下部はこの波形合成の一例である。骨間波形
情報に基づいて、骨間波形符号帳12から選び出した2種
類の骨間波形サンプルによって、骨組の間に基本骨間波
形を張っている様子を示している。
First, the skeleton forming unit 10 forms a voice skeleton based on the power information and the skeleton information obtained by the above-described encoding. The upper part of FIG. 4 is an example of this skeleton,
It shows a state where a skeleton is formed based on skeleton information.
The waveform synthesizing section 11 selects a basic interosseous waveform from the same interosseous waveform codebook 12 stored in the encoder 1 on the basis of the interosseous waveform information, and temporally and power-wise according to the skeleton. The waveform is converted and stretched between the bones, and this waveform is used as an output voice. The lower part of FIG. 4 shows an example of this waveform synthesis. This shows a state in which a basic interosseous waveform is stretched between frames by using two types of interosseous waveform samples selected from the interosseous waveform codebook 12 based on the interosseous waveform information.

本発明の効果を示すために、乱数コードブックによる
判別シミュレーション実験を行った。セントロイド集合
としては次数10の乱数ベクトルの集合を用いる。入力す
るサンプル集合としては、セントロイド集合とは別の乱
数ベクトルの集合を用いる。いずれのベクトルもベクト
ルの各値は0〜1の乱数で、また集合のサイズは1024で
ある。従来のユークリッド距離を用いた方法を方法1と
し、本発明による多次元平面を用いたサーチ法を方法2
としてサーチを行う。また、方法2によってサーチされ
たセントロイドの近傍から32候補のセントロイドを選ん
で、それらの候補とのユークリッド距離を求めて最も近
いセントロイドを求める方法を方法3とする。方法3は
方法2の性能を向上させたものである。多次元平面でサ
ーチした場合は、距離が一番近いセントロイドが選ばれ
るとは限らない。従って、方法2および3の場合は、い
かに距離の小さいセントロイドをサーチできたかがその
方法の性能となる。その性能を評価するために、選ばれ
たセントロイドが、ユークリッド距離の近い順で平均何
位であるかと、1位で選ばれた個数とを求める。
In order to demonstrate the effects of the present invention, a discriminative simulation experiment using a random codebook was performed. As the centroid set, a set of random number vectors of degree 10 is used. As a sample set to be input, a set of random number vectors different from the centroid set is used. In each vector, each value of the vector is a random number from 0 to 1, and the size of the set is 1024. The conventional method using the Euclidean distance is referred to as method 1, and the search method using the multidimensional plane according to the present invention is referred to as method 2.
Perform a search as In addition, a method of selecting 32 centroids from the vicinity of the centroid searched by the method 2 and obtaining the Euclidean distance from the candidates to obtain the nearest centroid is referred to as a method 3. Method 3 is an improvement over method 2. When searching on a multidimensional plane, the centroid with the shortest distance is not always selected. Therefore, in the case of the methods 2 and 3, the performance of the method depends on how small the centroid can be searched. In order to evaluate the performance, the average number of the selected centroids in the order of the Euclidean distance and the number of the selected centroids are calculated.

本明細書の第15頁に示す表1は、各方法における1024
個のサンプルに対する乗算の数と、平均順位と1位に選
ばれた個数とを示したものである。
Table 1 on page 15 of this specification shows that 1024
It shows the number of multiplications for the number of samples, the average rank, and the number selected as the first place.

本実験により、本発明によりほぼ同等の性能で大幅な
計算量削減を実現できることが検証された。
This experiment has verified that the present invention can achieve a significant reduction in the amount of calculation with almost the same performance.

発明の効果 以上のように本発明は、最も近いセントロイドを求め
るのにセントロイドとの距離計算を行わずに、セントロ
イド集合を2分割する多次元平面の式に代入し、その正
負から最も近いセントロイドがどちらの集合に存在する
かを求め、段階的にセントロイド候補集合を小さくして
いき、最終的に最も近いセントロイドを求めるようにし
たので、計算量を指数的に大幅に削減することができ
る。
Effects of the Invention As described above, the present invention substitutes the centroid set into a multidimensional plane equation for dividing the centroid set into two without calculating the distance to the centroid to find the nearest centroid, and calculates The set of nearby centroids is determined, the centroid candidate set is reduced in stages, and finally the closest centroid is determined, so the computational cost is significantly reduced exponentially can do.

【図面の簡単な説明】[Brief description of the drawings]

第1図は本発明の一実施例におけるベクトル量子化法お
よび音声符号化復号化装置のブロック結線図、第2図は
同実施例における骨間波形選択部7の動作を示す概念
図、第3図(a)から第3図(d)は同実施例における
骨間波形選択部7のセントロイドの選択動作を示す概念
図、第4図は同実施例における復号器2の動作を示す概
念図である。 1……符号器、2……復号器、3……入力音声、4……
パワー計算部、5……ピッチ分析部、6……骨組検索
部、7……骨間波形選択部、8……骨間波形符号帳、9
……多次元平面係数格納部、10……骨組形成部、11……
波形合成部、12……骨間波形符号帳、13……出力音声。
FIG. 1 is a block diagram of a vector quantization method and a speech coding / decoding apparatus according to an embodiment of the present invention. FIG. 2 is a conceptual diagram showing the operation of the interosseous waveform selector 7 in the embodiment. 3 (a) to 3 (d) are conceptual diagrams showing a centroid selecting operation of the interosseous waveform selecting unit 7 in the embodiment, and FIG. 4 is a conceptual diagram showing an operation of the decoder 2 in the embodiment. It is. 1 ... encoder, 2 ... decoder, 3 ... input voice, 4 ...
Power calculation section, 5: Pitch analysis section, 6: Frame search section, 7: Interbone waveform selection section, 8: Interbone waveform codebook, 9
... Multidimensional plane coefficient storage unit, 10 ... Frame forming unit, 11 ...
Waveform synthesizing unit, 12: interstitial waveform codebook, 13: output voice.

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】多次元ユークリッド空間上に分布するベク
トルであるセントロイドの集合と、上記セントロイド集
合を2分割する平面を表す多元一次式の係数が格納され
ている多次元平面係数格納部を有し、上記多次元平面係
数格納部に格納されている係数によって構成される多元
一次式に入力ベクトルの要素を代入することによって得
られる値の正負を参照して候補集合を絞り込むことによ
って、入力されたベクトルに対して上記セントロイドの
集合の中で最も近いセントロイドをサーチすることを特
徴とするベクトル量子化法。
1. A multidimensional plane coefficient storage unit storing a set of centroids, which are vectors distributed on a multidimensional Euclidean space, and a multidimensional linear coefficient representing a plane dividing the centroid set into two. By narrowing down the candidate set with reference to the sign of the value obtained by substituting the elements of the input vector into the multidimensional linear expression constituted by the coefficients stored in the multidimensional plane coefficient storage unit, A vector quantization method for searching a centroid closest to the set of vectors from the set of centroids.
【請求項2】音声信号を分析することによって得られる
数種類の骨組をパワーとピッチの情報で符号化する骨組
符号化手段と、符号付けられた複数の骨間波形セントロ
イドが格納されている骨間波形符号帳と、上記骨間波形
符号帳内の骨間波形セントロイドの集合に対して2分割
のクラスタ分析をすることによって得られる骨間波形セ
ントロイドの集合を2分割する平面を表す多元一次式の
係数が格納されている多次元平面係数格納部と、上記骨
間符号化手段で得られた骨組の間に張られる骨間波形を
ベクトル量子化するために、上記多次元平面係数格納部
に格納された係数によって構成される多元一次式に入力
ベクトルの要素を代入することによって得られる値の正
負を参照して候補集合を絞り込むことによって、上記骨
組符号化手段で得られた骨組の間に張られる骨間波形に
最も近い骨間波形セントロイドを選択する骨間波形符号
化手段を有する符号器と、上記骨間波形符号化手段によ
って符号化された情報をもとに、2種類の骨組を作成す
る骨組復号化手段と、符号付けられた複数の骨間波形セ
ントロイドが格納されている骨間波形符号帳と、上記骨
間波形符号化手段によって符号化された情報をもとに、
上記骨間波形符号帳の利用によりその骨組の間に張られ
る骨間波形を復号化する骨間波形復号化手段を有する復
号器とを備えたことを特徴とする音声符号化復号化装
置。
2. A skeleton encoding means for encoding several types of skeletons obtained by analyzing an audio signal with power and pitch information, and a skeleton storing a plurality of encoded interskeletal waveform centroids. Representing a plane which divides the set of interstitial waveform centroids obtained by performing a two-division cluster analysis on the set of interstitial waveform centroids in the interstitial waveform codebook A multidimensional plane coefficient storage unit in which coefficients of a linear expression are stored, and the multidimensional plane coefficient storage unit for vector quantizing an interosseous waveform stretched between frames obtained by the interosseous encoding means. By substituting the elements of the input vector into the linear equation composed of the coefficients stored in the section, the candidate set is narrowed down by referring to the sign of the value obtained by the skeleton encoding means. An encoder having an interosseous waveform encoding means for selecting an interosseous waveform centroid closest to the interosseous waveform stretched between the skeletons, and information based on the information encoded by the interosseous waveform encoding means. Skeleton decoding means for creating two types of skeletons, an interosseous waveform codebook in which a plurality of encoded interosseous waveform centroids are stored, and coded by the interosseous waveform encoding means. Based on the information
A speech encoding / decoding apparatus, comprising: a decoder having an interosseous waveform decoding means for decoding an interosseous waveform stretched between frames by using the interosseous waveform codebook.
JP2204918A 1990-08-01 1990-08-01 Vector quantization method and speech coding / decoding device Expired - Lifetime JP2780458B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2204918A JP2780458B2 (en) 1990-08-01 1990-08-01 Vector quantization method and speech coding / decoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2204918A JP2780458B2 (en) 1990-08-01 1990-08-01 Vector quantization method and speech coding / decoding device

Publications (2)

Publication Number Publication Date
JPH0490217A JPH0490217A (en) 1992-03-24
JP2780458B2 true JP2780458B2 (en) 1998-07-30

Family

ID=16498534

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2204918A Expired - Lifetime JP2780458B2 (en) 1990-08-01 1990-08-01 Vector quantization method and speech coding / decoding device

Country Status (1)

Country Link
JP (1) JP2780458B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05335967A (en) * 1992-05-29 1993-12-17 Takeo Miyazawa Sound information compression method and sound information reproduction device
US5522011A (en) * 1993-09-27 1996-05-28 International Business Machines Corporation Speech coding apparatus and method using classification rules

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5977730A (en) * 1982-10-26 1984-05-04 Mitsubishi Electric Corp Vector quantizer
JPH01280800A (en) * 1988-05-06 1989-11-10 Ricoh Co Ltd Coding system

Also Published As

Publication number Publication date
JPH0490217A (en) 1992-03-24

Similar Documents

Publication Publication Date Title
JPH09181611A (en) Signal coder and its method
KR100215709B1 (en) Vector coding method, encoder using the same and decoder therefor
JP2780458B2 (en) Vector quantization method and speech coding / decoding device
JP4359949B2 (en) Signal encoding apparatus and method, and signal decoding apparatus and method
JP2626492B2 (en) Vector quantizer
JP3147807B2 (en) Signal encoding device
WO2002013182A1 (en) Digital signal processing method, learning method, apparatuses for them, and program storage medium
JPH01319100A (en) Method and apparatus for encoding energy of voice signal within vocoder with very small throughput
JP3209248B2 (en) Excitation signal coding for speech
JPH03233500A (en) Voice synthesis system and device used for same
JP3227608B2 (en) Audio encoding device and audio decoding device
JP3319551B2 (en) Vector quantizer
US6907413B2 (en) Digital signal processing method, learning method, apparatuses for them, and program storage medium
JP2734995B2 (en) Spectrum parameter extraction device
JP3058640B2 (en) Encoding method
JP3471889B2 (en) Audio encoding method and apparatus
JP3095758B2 (en) Code Vector Search Method for Vector Quantization
JP3228389B2 (en) Gain shape vector quantizer
JP4645868B2 (en) DIGITAL SIGNAL PROCESSING METHOD, LEARNING METHOD, DEVICE THEREOF, AND PROGRAM STORAGE MEDIUM
CN113129920B (en) Music and human voice separation method based on U-shaped network and audio fingerprint
JP2897940B2 (en) Speech linear prediction parameter coding method
JP2002049395A (en) Digital signal processing method, learning method, and their apparatus, and program storage media therefor
JP4438655B2 (en) Encoding device, decoding device, encoding method, and decoding method
JP3648931B2 (en) Iterative transform speech coding method and apparatus
JP2853266B2 (en) Audio encoding device and audio decoding device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090515

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100515

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100515

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110515

Year of fee payment: 13

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110515

Year of fee payment: 13