JP3262652B2 - Audio encoding device and audio decoding device - Google Patents

Audio encoding device and audio decoding device

Info

Publication number
JP3262652B2
JP3262652B2 JP28089093A JP28089093A JP3262652B2 JP 3262652 B2 JP3262652 B2 JP 3262652B2 JP 28089093 A JP28089093 A JP 28089093A JP 28089093 A JP28089093 A JP 28089093A JP 3262652 B2 JP3262652 B2 JP 3262652B2
Authority
JP
Japan
Prior art keywords
speech
point position
fixed
power
average power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP28089093A
Other languages
Japanese (ja)
Other versions
JPH07134600A (en
Inventor
義博 有山
浩 桂川
弘美 青柳
克俊 伊東
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP28089093A priority Critical patent/JP3262652B2/en
Publication of JPH07134600A publication Critical patent/JPH07134600A/en
Application granted granted Critical
Publication of JP3262652B2 publication Critical patent/JP3262652B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は音声符号化装置及び音声
復号化装置に関し、例えば、VSELP(Vector Sum E
xcited Linear Prediction:ベクトル加算励振線形予
測)音声符号化方式に従うものに適用して好適なもので
ある。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech coding apparatus and a speech decoding apparatus, for example, a VSELP (Vector Sum E
xcited Linear Prediction: Vector addition excitation linear prediction) This is suitable for application to a speech coding system.

【0002】[0002]

【従来の技術】VSELP音声符号化方式は、コード励
振線形予測(CELP)音声符号化方式の一種であり、
音声信号を、声道及び声帯(励振源)の情報にパラメー
タ符号化するものである。VSELP音声符号化方式
は、特に、励振源のパラメータ符号化方法がCELP符
号化方式とは異なっている。このVSELP音声符号化
方式は、例えば、米国TIA(Telecommunications Ind
ustry Association )委員会によって、デジタルセルラ
用の音声符号化方式として標準化されている。
2. Description of the Related Art VSELP speech coding is a type of code-excited linear prediction (CELP) speech coding,
The voice signal is parameter-encoded into vocal tract and vocal cord (excitation source) information. In particular, the VSELP speech coding method differs from the CELP coding method in the parameter coding method of the excitation source. This VSELP speech coding method is described in, for example, US TIA (Telecommunications Ind.
ustry Association) committee has standardized it as a voice coding system for digital cellular.

【0003】このようなVSELP音声符号化方式につ
いては、例えば、文献Aや文献Bに記載されている。
[0003] Such a VSELP speech coding system is described in, for example, References A and B.

【0004】文献A:“VECTOR SUM EXCITED LINEAR PR
EDICTION (VSELP) SPEECH CODINGAT 8KBPS ”,Ira A.G
erson and Mark A.Jasiuk,Proc. IEEE Inc.Conf. on A
coustics, Speech and Signal Processing, pp.461-46
4,April 1990 文献B:特開平4−190399号公報 図2は、従来のVSELP音声符号化方式に従う音声符
号化装置の機能的構成を、主として文献Aの記載内容に
従って示すものである。
Reference A: "VECTOR SUM EXCITED LINEAR PR
EDICTION (VSELP) SPEECH CODINGAT 8KBPS ”, Ira AG
erson and Mark A. Jasiuk, Proc. IEEE Inc. Conf. on A
coustics, Speech and Signal Processing, pp.461-46
4, April 1990 Document B: Japanese Patent Laid-Open No. 4-190399 FIG. 2 shows a functional configuration of a conventional speech coding apparatus according to the VSELP speech coding method, mainly in accordance with the contents described in Document A.

【0005】なお、図2において、各機能ブロックから
引き出されている破線出力線に係る情報は、音声復号化
装置に伝送されるものを示し、各機能ブロックから引き
出されている実線出力線に係る情報は、伝送する情報を
決定(探索)する際に処理される情報である。
[0005] In FIG. 2, the information related to the dashed output lines drawn from each functional block indicates information transmitted to the audio decoding device, and the information related to the solid output lines drawn from each functional block. The information is information processed when determining (searching) information to be transmitted.

【0006】このVSELP音声符号化装置は、入力音
声分析部(さらに機能を分解すると、音声パワー計算
部、音声パワー補間部及び声道分析部とに分けることが
できる)101、ターゲット信号作成部102、ロング
タームラグ選択部103、第1コード選択部104、第
2コード選択部105、ゲイン選択部106、3個の増
幅回路107〜109、加算回路110から構成されて
おり、このVSELP音声符号化装置は、所定周波数で
サンプリングされたデジタル化された音声信号Vが入力
されて符号化を行なう。
The VSELP speech coding apparatus includes an input speech analysis unit (which can be further divided into a speech power calculation unit, a speech power interpolation unit, and a vocal tract analysis unit) 101 and a target signal creation unit 102. , A long-term lag selector 103, a first code selector 104, a second code selector 105, a gain selector 106, three amplifier circuits 107 to 109, and an adder circuit 110. The apparatus receives a digitized audio signal V sampled at a predetermined frequency and performs encoding.

【0007】入力音声分析部101は、入力音声信号V
を例えば160サンプル(1フレーム)毎に、LPC分
析(声道分析方法の一種)して声道情報としてのLPC
係数k、及び音声平均パワーRを求め、さらに、これら
LPC係数k及び音声平均パワーRを量子化すると共に
40サンプルからなるサブフレームに対して補間して、
サブフレーム毎のLPC係数kj 及び音声平均パワーR
0を出力する。
[0007] The input voice analysis unit 101 receives the input voice signal V
Is subjected to LPC analysis (a type of vocal tract analysis method) for every 160 samples (one frame),
A coefficient k and a voice average power R are obtained, and the LPC coefficient k and the voice average power R are quantized and interpolated with respect to a subframe including 40 samples.
LPC coefficient kj and average sound power R for each subframe
Outputs 0.

【0008】このようなサブフレームに対する音声平均
パワーの補間方法を示すと、第1サブフレームの音声平
均パワーは前フレームの音声平均パワーとし、第2サブ
フレームの音声平均パワーは前フレームの音声平均パワ
ーと現フレームの音声平均パワーの相乗平均とし、第3
及び第4サブフレームの音声平均パワーはそれぞれ現フ
レームの音声平均パワーとする。
The method of interpolating the average voice power for such a subframe is as follows. The average voice power of the first subframe is the average voice power of the previous frame, and the average voice power of the second subframe is the average voice power of the previous frame. The average of the power and the average power of the voice of the current frame
And the average voice power of the fourth subframe is the average voice power of the current frame.

【0009】ターゲット信号作成部102は、各サブフ
レーム毎に、LPC係数kj を用いた分析フィルタによ
って、入力音声信号Vの残差信号を作成すると共に、L
PC係数kj を用いた重み付けフィルタにその残差信号
を入力させることで音声信号に再合成し、さらに、以前
のサブフレームで合成された励振信号(励振コードベク
トル)exによる影響を取り除くことで、ターゲット信
号pを作成して出力する。
The target signal generator 102 generates a residual signal of the input voice signal V by an analysis filter using the LPC coefficient kj for each subframe,
By inputting the residual signal to a weighting filter using the PC coefficient kj to resynthesize the speech signal, and removing the influence of the excitation signal (excitation code vector) ex synthesized in the previous subframe, Generate and output a target signal p.

【0010】このターゲット信号pを目標に、後述する
各機能部が自機能部に係る励振源情報を探索して決定す
る。図2に示す各種情報を表す符号は決定された状態の
ものとし、以下では、探索中のもの(候補)に対しては
その符号末尾に符号tを付けて説明する。
[0010] With the target signal p as a target, each function unit described later searches and determines excitation source information related to its own function unit. It is assumed that the codes indicating various types of information shown in FIG. 2 are in a determined state, and the search (candidate) being searched for will be described with the code t appended to the end of the code.

【0011】ロングタームラグ選択部103には、以前
に合成された複数のサブフレームの励振信号exがサブ
フレーム単位の処理が終了する毎に更新されて保存され
ている(内部値ロングタームフィルタステート)。ロン
グタームラグ選択部103は、保存されている合成励振
信号の中から様々なラグLtで40サンプルずつの励振
信号c0tを取り出し(このような40サンプルずつの
励振信号がロングターム励振コードベクトルである)、
LPC係数kj を用いた重み付けフィルタにその取り出
したラグ対応のロングターム励振コードベクトルc0t
を入力させて得た信号f0tと、ターゲット信号pとの
差の二乗誤差を計算し、この二乗誤差が最も小さくなる
ロングターム励振コードベクトルc0を求めて出力す
る。なお、各ロングターム励振コードベクトルc0tに
は、インデックスとしてそのロングターム励振コードベ
クトルに係るラグLtが対応する。
[0011] The long-term lag selecting section 103 updates and saves the excitation signal ex of a plurality of subframes that have been synthesized before each time processing on a subframe basis is completed (internal value long-term filter state). ). The long-term lag selecting unit 103 extracts an excitation signal c0t of 40 samples each with various lags Lt from the stored combined excitation signals (the excitation signal of each 40 samples is a long-term excitation code vector. ),
A lag-corresponding long-term excitation code vector c0t is added to the weighting filter using the LPC coefficient kj.
Is calculated, and the square error of the difference between the signal f0t obtained by inputting the target signal and the target signal p is calculated, and a long-term excitation code vector c0 that minimizes the square error is obtained and output. Note that a lag Lt related to the long-term excitation code vector corresponds to each long-term excitation code vector c0t as an index.

【0012】第1コード選択部104には、ベーシスベ
クトル(基底ベクトル)v1として複数の固定データが
保存されている。第1コード選択部104は、ベーシス
ベクトルに対してベクトルの正負極性を与えるパラメー
タ(グレイコード)θを組み合わせて複数の第1励振コ
ードベクトルu1tを作成し(文献Aの(1) 式参照)、
各励振コードベクトルu1tをLPC係数kj を用いた
重み付けフィルタにかけた後、さらにロングタームラグ
選択部103で選択されたロングターム励振コードベク
トルc0に対して直交化した信号f1tを作成し、この
信号f1tとターゲット信号pとの差の二乗誤差を計算
し、この二乗誤差が最も小さくなる第1励振コードベク
トルc1(u1)を求めて出力する。なお、各第1励振
コードベクトルu1tにはインデックスItが付与され
ている。
The first code selection unit 104 stores a plurality of fixed data as a basis vector (basis vector) v1. The first code selection unit 104 creates a plurality of first excitation code vectors u1t by combining a parameter (gray code) θ that gives the vector a positive / negative polarity with respect to the basis vector (refer to Expression (1) in Document A).
After applying a weighting filter using the LPC coefficient kj to each excitation code vector u1t, a signal f1t orthogonalized to the long-term excitation code vector c0 selected by the long-term lag selection unit 103 is further created. And a target signal p, and calculates and outputs a first excitation code vector c1 (u1) that minimizes the square error. Note that an index It is assigned to each first excitation code vector u1t.

【0013】第2コード選択部105には、第1コード
選択部104とは異なる複数のベーシスベクトルv2が
保存されている。第2コード選択部105は、ベーシス
ベクトルに対してパラメータθを組み合わせて複数の第
2励振コードベクトルu2tを作成し、各励振コードベ
クトルをLPC係数kj を用いた重み付けフィルタにか
けた後、ロングターム励振コードベクトルc0に対して
直交化させた、しかも第1コード選択部104が選択し
た最適な第1励振コードベクトルc1に対して直交化さ
せた信号f2tを作成し、この信号f2tとターゲット
信号pとの差の二乗誤差を計算し、この二乗誤差が最も
小さくなる第2励振コードベクトルc2(u2)を求め
て出力する。なお、各第2励振コードベクトルu2tに
はインデックスJtが付与されている。
The second code selector 105 stores a plurality of basis vectors v2 different from those of the first code selector 104. The second code selecting unit 105 creates a plurality of second excitation code vectors u2t by combining the parameter θ with the basis vector, applies each excitation code vector to a weighting filter using the LPC coefficient kj, and then performs long-term excitation. A signal f2t that is orthogonalized to the code vector c0 and that is orthogonalized to the optimal first excitation code vector c1 selected by the first code selection unit 104 is created. Is calculated, and the second excitation code vector c2 (u2) that minimizes the square error is obtained and output. The index Jt is assigned to each second excitation code vector u2t.

【0014】ゲイン選択部106は、増幅回路107〜
109及び加算回路110と相俟って、各励振コードベ
クトルc0、c1、c2に対する最適なゲインβ、γ
1、γ2を決定するものである。
The gain selection unit 106 includes amplification circuits 107 to
109 and the addition circuit 110, the optimum gains β, γ for the respective excitation code vectors c0, c1, c2.
1, γ2.

【0015】ゲイン選択部106には、各励振コードベ
クトルc0、c1、c2に対するゲインβ、γ1、γ2
の組情報が、これらゲインβ、γ1、γ2を等価変換し
たパラメータGS、P0、P1の組として複数組格納さ
れている。パラメータGS、P0、P1の組はベクトル
量子化されており、その組毎にインデックス(ゲインイ
ンデックス)Gが付与されている。なお、ゲインβ、γ
1、γ2の組と、パラメータGS、P0、P1の組との
関係については、上記文献Aの(15)式〜(23)式に記載さ
れている。
The gain selector 106 includes gains β, γ1, γ2 for the respective excitation code vectors c0, c1, c2.
Are stored as a set of parameters GS, P0, and P1 obtained by equivalently converting the gains β, γ1, and γ2. A set of parameters GS, P0, and P1 is vector-quantized, and an index (gain index) G is given to each set. Note that the gains β and γ
The relationship between the set of 1, γ2 and the set of parameters GS, P0, P1 is described in the above-mentioned document A in equations (15) to (23).

【0016】ゲイン選択部106は、パラメータGS
t、P0t、P1tの各組について、LPC係数kj 、
平均音声パワーR0及び各励振コードベクトルc0、c
1、c2に基づいて、ゲインβt、γ1t、γ2tに変
換して対応する増幅回路107、108、109に与え
る。増幅回路107〜109及び加算回路110によっ
て、各励振コードベクトルc0、c1、c2と対応する
ゲインβt、γ1t、γ2tとの積和演算結果である合
成励振信号extが複数の候補として得られる。ゲイン
選択部106は、各合成励振信号extについて、LP
C係数kj から求められる合成フィルタを適用して局部
再生の信号を得、各局部再生信号とターゲット信号pと
の差の二乗誤差を計算し、この二乗誤差を最も小さくす
るゲインβ、γ1、γ2の組を最適なものと決定する。
The gain selector 106 has a parameter GS
For each set of t, P0t, and P1t, the LPC coefficient kj,
Average voice power R0 and each excitation code vector c0, c
1, c2, and converted to gains βt, γ1t, and γ2t and provided to the corresponding amplifier circuits 107, 108, and 109. By the amplification circuits 107 to 109 and the addition circuit 110, a combined excitation signal ext which is a product-sum operation result of each of the excitation code vectors c0, c1, c2 and the corresponding gain βt, γ1t, γ2t is obtained as a plurality of candidates. The gain selection unit 106 calculates LP for each synthesized excitation signal ext.
A local reproduction signal is obtained by applying a synthesis filter obtained from the C coefficient kj, a square error of a difference between each local reproduction signal and the target signal p is calculated, and gains β, γ1, γ2 for minimizing the square error are calculated. Are determined to be optimal.

【0017】最適な励振コードベクトルc0、c1、c
2及び最適なゲインβ、γ1、γ2から生成された合成
励振信号exは、次のサブフレームに対するターゲット
信号の合成や、ロングタームフィルタステートの更新等
に用いられる。
Optimum excitation code vectors c0, c1, c
2 and the combined excitation signal ex generated from the optimal gains β, γ1, and γ2 are used for the synthesis of the target signal for the next subframe, the update of the long-term filter state, and the like.

【0018】VSELP音声符号化装置は、LPC係数
kj 、平均音声パワーR0、ロングターム励振コードベ
クトルc0のインデックス(ロングタームラグ)L、最
適な第1励振コードベクトルc1のインデックスI、最
適な第2励振コードベクトルc2のインデックスJ、及
び、最適なゲインパラメータGS、P0 、P1 の組のイ
ンデックスGを、VSELP音声復号化装置に送信す
る。
The VSELP speech coding apparatus comprises an LPC coefficient kj, an average speech power R0, an index (long term lag) L of a long-term excitation code vector c0, an index I of an optimal first excitation code vector c1, an optimal second The index J of the excitation code vector c2 and the index G of the set of the optimal gain parameters GS, P0, P1 are transmitted to the VSELP speech decoder.

【0019】次に、VSELP音声復号化装置の図示は
省略するが、その復号動作を簡単に説明する。
Next, although the illustration of the VSELP speech decoder is omitted, its decoding operation will be briefly described.

【0020】VSELP音声復号化装置においては、後
述するようにして得られた過去の数サブフレームの合成
励振信号に基づいて更新されているロングタームフィル
タステートに、受信したラグLをインデックスとして適
用してロングターム励振コードベクトルc0を復号す
る。また、符号化装置と同一の格納されているベーシス
ベクトル(符号化装置と復号化装置とが同一装置に搭載
されているものであれば符号化装置が用意したもの)v
1と受信した第1励振コードベクトルについてのインデ
ックスIとから最適な第1励振コードベクトルc1を復
号し、符号化装置と同一の格納されているベーシスベク
トル(符号化装置と復号化装置とが同一装置に搭載され
ているものであれば符号化装置が用意したもの)v2と
受信した第2励振コードベクトルについてのインデック
スJとから最適な第2励振コードベクトルc2を復号す
る。さらに、最適なゲインインデックスGから最適なゲ
インパラメータGS、P0 、P1 の組を取出し、得られ
たロングターム励振コードベクトルc0、第1励振コー
ドベクトルc1、第2励振コードベクトルc2と、受信
したLPC係数kj 、平均音声パワーR0とから最適な
ゲインβ、γ1、γ2を復号する。
In the VSELP speech decoding apparatus, the received lag L is applied as an index to the long-term filter state updated based on the synthesized excitation signals of several past subframes obtained as described later. To decode the long-term excitation code vector c0. Also, the same stored basis vector as the encoding device (if the encoding device and the decoding device are mounted on the same device, those prepared by the encoding device) v
1 and the index I of the received first excitation code vector, and decodes the optimal first excitation code vector c1, and stores the same stored basis vector (the same as the encoding device and the decoding device) An optimal second excitation code vector c2 is decoded from v2 and the index J of the received second excitation code vector if it is installed in the apparatus. Further, a set of optimal gain parameters GS, P0, P1 is extracted from the optimal gain index G, and the obtained long-term excitation code vector c0, first excitation code vector c1, second excitation code vector c2, and received LPC The optimum gain β, γ1, γ2 is decoded from the coefficient kj and the average audio power R0.

【0021】そして、得られたロングターム励振コード
ベクトルc0、第1励振コードベクトルc1、第2励振
コードベクトルc2に、対応するゲインβ、γ1、γ2
を乗算した後、それらを加算して合成励振信号exを
得、この合成励振信号exを、受信したLPC係数kj
を用いて構成された合成フィルタ部を通すことにより、
音声信号Vを再生し、さらに、この音声信号Vを、受信
したLPC係数kj を用いて構成されたポストフィルタ
部を通してその雑音成分を圧縮して出力する。
Then, gains β, γ1, γ2 corresponding to the obtained long-term excitation code vector c0, first excitation code vector c1, and second excitation code vector c2 are obtained.
, And add them to obtain a combined excitation signal ex.
By passing through the synthesis filter unit configured using
The audio signal V is reproduced, and the noise component of the audio signal V is compressed and output through a post-filter unit configured using the received LPC coefficient kj.

【0022】ところで、VSELP音声符号化方式は、
米国TIA(Telecommunications Industry Associatio
n )委員会がデジタルセルラ用の音声符号化方式として
標準化したように、主として、デジタル移動体通信等の
音声信号の圧縮通信に用いられる。
By the way, the VSELP speech coding method is as follows.
US TIA (Telecommunications Industry Association)
n) It is mainly used for compression communication of audio signals such as digital mobile communication, as standardized by the committee as an audio coding method for digital cellular.

【0023】そのため、VSELP音声符号化方式を実
行する処理装置(音声符号化装置や音声復号化装置)
は、可能な限りの小形化と低消費電力が要求される。こ
のような要求に応えるためには、処理装置内で扱うデー
タのビット長(語長)をできるだけ短く固定し、しか
も、処理装置が実行する演算処理を固定小数点表現で実
行することが有効な方法である。従って、図2に示した
従来のVSELP音声符号化装置や、それに対応するV
SELP音声復号化装置においても、演算処理を固定小
数点表現で実行するようになされている。
For this reason, a processing unit (speech encoding device or speech decoding device) that executes the VSELP speech encoding method
Requires the smallest possible size and low power consumption. In order to meet such a demand, it is effective to fix the bit length (word length) of data handled in the processing device as short as possible and to execute the arithmetic processing performed by the processing device in a fixed-point representation. It is. Therefore, the conventional VSELP speech coding apparatus shown in FIG.
In the SELP speech decoding apparatus, the arithmetic processing is executed in a fixed-point representation.

【0024】しかし、演算処理するデータのビット長が
短く選定され、固定小数点表現での演算処理が採用され
ている場合において、そのときのサブフレームの入力音
声信号の音声平均パワーが変化すると、演算処理に供す
る各種内部変数の値も変化し、選定されている固定小数
点表現ではオーバーフロー等を起こす変数も生じ、その
結果、計算精度が低下し、最終的に復号された音声信号
の品質を著しく低下させることも生じていた。
However, if the bit length of the data to be processed is selected to be short and the arithmetic processing in the fixed-point representation is employed, if the average audio power of the input audio signal of the subframe at that time changes, the arithmetic operation is performed. The values of various internal variables used for processing also change, and in the selected fixed-point representation, some variables may cause overflow, etc., resulting in a decrease in calculation accuracy and a significant decrease in the quality of the final decoded speech signal. Had also been caused.

【0025】上述した文献Bは、短ビット長のデータを
固定小数点表現で演算することで生じていた不都合を解
決できる発明を記載している。すなわち、入力音声信号
の大きさ(平均パワー)と、演算処理に供する内部変数
の大きさとの間には特定の関係があることに着目し、求
められた音声平均パワーR0に応じて、演算処理に供す
る内部変数等の小数点位置の切替えを行ない、切り替え
た小数点位置による固定小数点位置で所定の演算を実行
することが記載されている。
The above-mentioned Document B describes an invention which can solve the inconvenience caused by calculating short bit length data in fixed point representation. That is, attention is paid to the fact that there is a specific relationship between the magnitude (average power) of the input audio signal and the magnitude of the internal variable used for the arithmetic processing, and the arithmetic processing is performed in accordance with the determined average audio power R0. It describes that a decimal point position of an internal variable or the like to be used is switched, and a predetermined operation is performed at a fixed point position based on the switched decimal point position.

【0026】図2において、ターゲット信号作成部10
2、ロングタームラグ選択部103、第1コード選択部
104、第2コード選択部105及びゲイン選択部10
6等は種々の演算を実行する機能部であり、文献Bに記
載の方法が適用される部分である。図2において、ター
ゲット信号作成部102、ロングタームラグ選択部10
3、第1コード選択部104及び第2コード選択部10
5の機能ブロックに対して、音声平均パワーR0を括弧
書きで入力させているのは、文献Bの方法が適用可能な
ことを示している。また、ゲイン選択部114において
も、ゲインパラメータをゲインに変換する場合だけでな
く、固定小数点位置の決定に音声平均パワーR0が利用
可能である。
In FIG. 2, the target signal generator 10
2. Long term lag selection unit 103, first code selection unit 104, second code selection unit 105, and gain selection unit 10
Reference numeral 6 denotes a functional unit that executes various operations, and is a unit to which the method described in Document B is applied. In FIG. 2, a target signal creating unit 102, a long term lag selecting unit 10
3. First code selector 104 and second code selector 10
The fact that the audio average power R0 is input in parentheses for the fifth functional block indicates that the method of Document B is applicable. Also in the gain selection unit 114, not only the case where the gain parameter is converted into the gain, but also the average voice power R0 can be used to determine the fixed-point position.

【0027】このような各機能部において、音声平均パ
ワーR0が入力されると、その音声平均パワーR0が属
する段階を検出し、例えば、予め用意されているテーブ
ルを参照し、演算に用いる変数の固定小数点表現を得
る。このような処理の後に、所定の演算(例えば所定信
号がフィルタを通過する処理)を行なう。
When the sound average power R0 is input to each of these functional units, the stage to which the sound average power R0 belongs is detected, and for example, a table prepared in advance is referred to and the variable used for the calculation is determined. Get fixed-point representation. After such a process, a predetermined operation (for example, a process of passing a predetermined signal through a filter) is performed.

【0028】図3は、固定小数点位置を切り替えるため
のテーブルの構成例を示すものである。例えば、音声平
均パワーR0が、値PW0以上PW1未満では、変数1
の固定小数点位置をa1にし、変数2の固定小数点位置
をa2にし、変数yの固定小数点位置をayにすること
を規定している。因に、音声平均パワーR0が属する段
階と内部変数の固定小数点表現とを対応付けたテーブル
は、例えば、音声平均パワーR0が属する段階に応じた
その機能部からの出力信号(これも内部変数になる)の
固定小数点位置を意識し(出力信号の精度)、このよう
な出力信号の固定小数点位置を実現できるような内部変
数の固定小数点位置を格納しているものである。
FIG. 3 shows an example of the structure of a table for switching the fixed-point position. For example, if the audio average power R0 is equal to or more than the value PW0 and less than PW1, the variable 1
, The fixed-point position of variable 2 is set to a2, and the fixed-point position of variable y is set to ay. Incidentally, a table in which the stage to which the audio average power R0 belongs and the fixed-point representation of the internal variable are associated is, for example, an output signal from the functional unit corresponding to the stage to which the audio average power R0 belongs (also an internal variable). The fixed-point position of an internal variable that can realize such a fixed-point position of the output signal is stored in consideration of the fixed-point position of the output signal.

【0029】[0029]

【発明が解決しようとする課題】しかしながら、このよ
うな内部変数の固定小数点表現が切り替えられる複数の
機能部の内、ロングタームラグ選択部103は他の機能
部とは異なる性格を有する。すなわち、ロングタームラ
グ選択部103は、過去の数個のサブフレームの合成励
振信号exをロングタームフィルタステートとして格納
しており、格納しているサブフレームによってはその合
成励振信号の固定小数点位置が他とは異なっている。現
在対象のサブフレームの音声平均パワーR0に基づい
て、当該ロングタームラグ選択部103からのロングタ
ーム励振コードベクトルc0の固定小数点位置を決定し
た場合、この決定された固定小数点位置に、ロングター
ムフィルタステートとして格納されている合成励振信号
の固定小数点位置を一致させて取出すことが必要となる
が、このことはデータをシフトさせることを意味し、シ
フト方向によっては値がオーバーフローすることもあ
る。
However, among the plurality of functional units in which the fixed-point representation of the internal variables can be switched, the long term lag selecting unit 103 has a different characteristic from other functional units. That is, the long-term lag selecting unit 103 stores the combined excitation signal ex of several past subframes as a long-term filter state, and depending on the stored subframe, the fixed-point position of the combined excitation signal may be different. Different from the others. When the fixed-point position of the long-term excitation code vector c0 from the long-term lag selecting unit 103 is determined based on the audio average power R0 of the current target subframe, a long-term filter is added to the determined fixed-point position. It is necessary to match the fixed-point position of the combined excitation signal stored as a state and extract it. This means that data is shifted, and the value may overflow depending on the shift direction.

【0030】すなわち、音声平均パワーR0に基づい
て、固定小数点位置を切り替えたとしても、ロングター
ムラグ選択部103については、十分な精度を得ること
ができなかった。
That is, even if the fixed-point position is switched based on the average voice power R0, the long term lag selecting section 103 cannot obtain sufficient accuracy.

【0031】以上のように、ゲイン選択だけではなく、
固定小数点位置の切替えに用いる各サブフレーム毎の音
声平均パワーR0は、例えば上述のように、第1サブフ
レームの音声平均パワーは前フレームの音声平均パワー
とし、第2サブフレームの音声平均パワーは前フレーム
の音声平均パワーと現フレームの音声平均パワーの相乗
平均とし、第3及び第4サブフレームの音声平均パワー
はそれぞれ現フレームの音声平均パワーとするように決
定される。なお、第2サブフレームについて、2個の音
声平均パワーの平均的情報を相乗平均によって求めるよ
うにしているのは、音声平均パワーはサンプル値の二乗
和になっており、相乗平均の方が相加平均より、その中
間的な値のサンプル列の二乗和に近くなるためである。
As described above, not only gain selection but also
For example, as described above, the average audio power R0 of each subframe used for switching the fixed-point position is, as described above, the average audio power of the first subframe is the average audio power of the previous frame, and the average audio power of the second subframe is The average audio power of the previous frame and the average audio power of the current frame are determined as the geometric mean, and the average audio power of the third and fourth subframes is determined to be the average audio power of the current frame. It should be noted that the average information of the two average audio powers is obtained by geometric mean for the second subframe because the average audio power is the sum of squares of the sample values, and This is because it is closer to the sum of squares of the sample sequence of the intermediate value than the averaging.

【0032】上述の補間方法によれば、第1、第3及び
第4サブフレームの音声平均パワーを容易に得ることが
できるが、第2サブフレームについては演算が必要であ
る。しかも、相乗平均演算であるので、乗算及び平方処
理が必要である。一般的に、平方根を求める処理は、複
雑な計算機構によるか、また、多くの処理ステップを必
要とする。従って、VSELP音声符号化方式が適用さ
れた装置(音声符号化装置や音声復号化装置)に求めら
れている、可能な限りの小形化と低消費電力に反してい
る。
According to the above-mentioned interpolation method, the average voice power of the first, third and fourth sub-frames can be easily obtained, but the second sub-frame requires calculation. In addition, since it is a geometric mean operation, multiplication and squaring are required. In general, the process of finding the square root depends on a complicated calculation mechanism and requires many processing steps. Therefore, this is contrary to the miniaturization and low power consumption as much as possible which are required for a device (a voice coding device or a voice decoding device) to which the VSELP voice coding method is applied.

【0033】以上、VSELP音声符号化方式に従う装
置について課題を説明したが、一般的なCELP音声符
号化方式に従う装置においても、過去の合成励振信号を
格納してある種の励振コードベクトルを出力する適応
コードベクトル選択(上述したロングタームラグ選
択部に対応)を有するものがあり、また、音声平均パワ
ーをサブフレーム毎に補間するものがある。すなわち、
上記課題は、一般的なCELP音声符号化方式に従う装
置についても生じているものである。
Although the problem has been described above with respect to the device that complies with the VSELP speech coding method, a device that complies with the general CELP speech coding method also outputs a certain kind of excitation code vector storing the past synthesized excitation signal. adaptation excited
Vibration code vector selection unit (long-term lag election described above
(Corresponding to the selection unit), and there is a type that interpolates the average voice power for each subframe. That is,
The above problem also occurs in a device that follows a general CELP speech coding scheme.

【0034】本発明は、以上の点を考慮してなされたも
のであり、過去の合成励振信号を格納している適応励振
コードベクトル選択部においても、固定小数点位置の切
替えによる精度向上を実現することができる音声符号化
装置及び音声復号化装置を提供しようとしたものであ
る。
The present invention has been made in view of the above points, and realizes an improvement in accuracy by switching the fixed-point position even in an adaptive excitation code vector selection unit storing past synthesized excitation signals. It is an object of the present invention to provide a speech encoding device and a speech decoding device capable of performing the above-mentioned operations.

【0035】また、本発明は、フレーム毎の音声平均パ
ワーからサブフレーム毎の音声平均パワーを補間して求
めることを、簡単な構成又は簡単な処理によって実行す
ることができる音声符号化装置を提供しようとしたもの
である。
Further, the present invention provides a speech coding apparatus capable of executing, by a simple configuration or a simple process, obtaining an average speech power per subframe from a speech average power per frame. Is what I tried.

【0036】[0036]

【課題を解決するための手段】かかる課題を解決するた
め、請求項1の本発明においては、音声信号を、有限語
長によるデジタル処理によってパラメータ符号化するC
ELP音声符号化方式に従う音声符号化装置であって、
過去の数個のフレーム(この請求項においてはサブフレ
ームを含む概念)の合成励振信号を保存しておき、その
信号系列の一部を適応的な励振コードベクトル成分とし
て出力する、内部変数の固定小数点位置を切替え可能な
適応励振コードベクトル選択部を有する音声符号化装置
において、以下の構成を設けた。
In order to solve this problem, according to the first aspect of the present invention, a voice signal is parameter-encoded by digital processing using a finite word length.
An audio encoding device according to an ELP audio encoding method,
A fixed internal variable that stores a combined excitation signal of several past frames (a concept including a subframe in this claim) and outputs a part of the signal sequence as an adaptive excitation code vector component. The following configuration is provided in a speech coding apparatus having an adaptive excitation code vector selection unit capable of switching a decimal point position.

【0037】すなわち、適応励振コードベクトル選択部
に保存されている過去の数個のフレームの合成励振信号
のそれぞれについて、固定小数点位置情報を格納する小
数点位置バッファ部と、この小数点位置バッファ部に格
納されている複数の固定小数点位置情報と、現フレーム
についての音声平均パワーとから、適応励振コードベク
トル選択部における内部変数の固定小数点位置を決定す
る小数点位置選択部とを設けた。
That is, for each of the combined excitation signals of the past several frames stored in the adaptive excitation code vector selection unit, a decimal point position buffer unit for storing fixed-point position information, and stored in the decimal point position buffer unit A fixed-point position selector for determining a fixed-point position of an internal variable in the adaptive excitation code vector selector based on the plurality of fixed-point position information and the average voice power for the current frame.

【0038】また、請求項2の本発明は、音声信号を、
有限語長によるデジタル処理によってパラメータ符号化
するCELP音声符号化方式に従う音声符号化装置であ
って、音声信号のフレーム毎の音声平均パワーを求める
音声パワー計算部と、相前後する2個のフレームの音声
平均パワーから、1フレームを数個に等分したサブフレ
ーム毎の音声平均パワー情報を得る音声パワー補間部と
を有する音声符号化装置を、以下のようにした。
According to the second aspect of the present invention, an audio signal is
An audio encoding apparatus according to a CELP audio encoding method for performing parameter encoding by digital processing with a finite word length, comprising: an audio power calculation unit for obtaining an average audio power of each frame of an audio signal; A speech encoding apparatus having a speech power interpolator for obtaining speech average power information for each subframe obtained by equally dividing one frame into several frames from the speech average power is as follows.

【0039】すなわち、音声パワー補間部が、少なくと
も音声平均パワーの量子化手段を備え、サブフレーム毎
の音声平均パワー情報を求めるときに、フレーム毎の音
声平均パワーを量子化したインデックスで扱い、2個の
フレームの音声平均パワーの相乗平均情報を求めるサブ
フレームに対してはインデックスの相加平均で求め、サ
ブフレーム毎に求められたインデックスを出力し、又
は、求められたインデックスを逆量子化手段を介して戻
した音声平均パワーを出力することとした。
That is, the audio power interpolator has at least a means for quantizing the average audio power and, when obtaining the average audio power information for each sub-frame, treats the average audio power for each frame by a quantized index and For the subframes for which the geometric average information of the audio average power of the frames is obtained, the arithmetic average of the indexes is obtained, the index obtained for each subframe is output, or the obtained index is inversely quantized. And output the average power of the voice returned via the.

【0040】さらに、請求項3の本発明は、音声信号
を、有限語長によるデジタル処理によってパラメータ符
号化するCELP音声符号化方式に従う音声符号化装置
であって、音声信号のフレーム毎の音声平均パワーを求
める音声パワー計算部と、相前後する2個のフレームの
音声平均パワーから、1フレームを数個に等分したサブ
フレーム毎の音声平均パワー情報を得る音声パワー補間
部と、過去の数個のサブフレームの合成励振信号を保存
しておき、その信号系列の一部を適応的な励振コードベ
クトル成分として出力する、内部変数の固定小数点位置
を切替え可能な適応励振コードベクトル選択部を有する
音声符号化装置を、以下のようにした。
Furthermore, the present invention according to claim 3 is a speech encoding apparatus according to a CELP speech encoding method for encoding a speech signal by digital processing with a finite word length, wherein the speech signal is averaged for each frame of the speech signal. A voice power calculator for obtaining power; a voice power interpolator for obtaining voice average power information for each sub-frame obtained by equally dividing one frame into several frames from the voice average power of two consecutive frames; An adaptive excitation code vector selector capable of switching a fixed-point position of an internal variable, storing a composite excitation signal of the sub-frames and outputting a part of the signal sequence as an adaptive excitation code vector component The speech encoding device was as follows.

【0041】すなわち、音声パワー補間部が、少なくと
も音声平均パワーの量子化手段を備え、サブフレーム毎
の音声平均パワー情報を求めるときに、フレーム毎の音
声平均パワーを量子化したインデックスで扱い、2個の
フレームの音声平均パワーの相乗平均情報を求めるサブ
フレームに対してはインデックスの相加平均で求め、サ
ブフレーム毎に求められたインデックスを出力し、又
は、求められたインデックスを逆量子化手段を介して戻
した音声平均パワーを出力すると共に、適応励振コード
ベクトル選択部に保存されている過去の数個のサブフレ
ームの合成励振信号のそれぞれについて、固定小数点位
置情報を格納する小数点位置バッファ部と、この小数点
位置バッファ部に格納されている複数の固定小数点位置
情報と、現サブフレームについての音声平均パワーとか
ら、適応励振コードベクトル選択部における内部変数の
固定小数点位置を決定する小数点位置選択部とを設け
た。
That is, the audio power interpolating unit includes at least audio average power quantizing means, and when obtaining audio average power information for each sub-frame, treats the audio average power for each frame with a quantized index, and For the subframes for which the geometric average information of the audio average power of the frames is obtained, the arithmetic average of the indexes is obtained, the index obtained for each subframe is output, or the obtained index is inversely quantized. And a fixed-point position buffer unit for storing fixed-point position information for each of the past several sub-frame synthesized excitation signals stored in the adaptive excitation code vector selection unit, And a plurality of fixed point position information stored in the decimal point position buffer section and the current subframe. And a voice average power of beam, provided with decimal point selection unit which determines a fixed-point position of the internal variables of the adaptive excitation code vector selection unit.

【0042】請求項4の本発明は、請求項1〜3の本発
明のいずれかに記載の音声符号化装置が採用しているC
ELP音声符号化方式が、その1種であるフォワード形
VSELP音声符号化方式であることを特徴とする。
According to a fourth aspect of the present invention, there is provided a speech encoding apparatus according to any one of the first to third aspects of the present invention.
The ELP speech encoding method is a forward-type VSELP speech encoding method, which is one type of the ELP speech encoding method.

【0043】請求項5の本発明は、請求項1の本発明の
音声符号化装置に対応したCELP音声符号化方式に従
う音声復号化装置であって、過去の数個のフレーム(こ
の請求項においてはサブフレームを含む概念)の合成励
振信号を保存しておき、その信号系列の一部を適応的な
励振コードベクトル成分として出力する、内部変数の固
定小数点位置を切替え可能な適応励振コードベクトル選
択部を有する音声復号化装置において、以下の構成を設
けた。
According to a fifth aspect of the present invention, there is provided a speech decoding apparatus according to the CELP speech coding system corresponding to the speech coding apparatus according to the first aspect of the present invention. Is a concept that includes subframes), and outputs a part of the signal sequence as an adaptive excitation code vector component. Selects an adaptive excitation code vector that can switch the fixed-point position of internal variables. The following configuration is provided in the audio decoding device having the section.

【0044】すなわち、適応励振コードベクトル選択部
に保存されている過去の数個のフレームの合成励振信号
のそれぞれについて、固定小数点位置情報を格納する小
数点位置バッファ部と、この小数点位置バッファ部に格
納されている複数の固定小数点位置情報と、現フレーム
についての音声平均パワーとから、適応励振コードベク
トル選択部における内部変数の固定小数点位置を決定す
る小数点位置選択部とを設けた。
That is, for each of the combined excitation signals of the past several frames stored in the adaptive excitation code vector selection unit, a decimal point position buffer unit for storing fixed-point position information, and a decimal point position buffer unit A fixed-point position selector for determining a fixed-point position of an internal variable in the adaptive excitation code vector selector based on the plurality of fixed-point position information and the average voice power for the current frame.

【0045】請求項6の本発明は、請求項5の本発明の
いずれかに記載の音声復号化装置が採用しているCEL
P音声符号化方式が、その1種であるフォワード形VS
ELP音声符号化方式であることを特徴とする。
According to a sixth aspect of the present invention, there is provided a speech decoding apparatus according to any one of the fifth aspects of the present invention.
P-speech coding method is one of the forward type VS
It is characterized by the ELP audio coding method.

【0046】[0046]

【作用】請求項1及び5の本発明は、音声信号を、有限
語長によるデジタル処理によってパラメータ符号化して
伝送するCELP符号化方式に従う音声符号化装置及び
音声復号化装置であって、過去の数個のフレームの合成
励振信号を保存しておき、その信号系列の一部を適応的
な励振コードベクトル成分として出力する、内部変数の
固定小数点位置を切替え可能な適応励振コードベクトル
選択部を有するものに関する。
According to the first and fifth aspects of the present invention, there are provided a speech encoding apparatus and a speech decoding apparatus which conform to a CELP encoding system for encoding a speech signal by digital processing with a finite word length and transmitting the encoded signal. It has an adaptive excitation code vector selector capable of switching a fixed-point position of an internal variable, storing a composite excitation signal of several frames and outputting a part of the signal sequence as an adaptive excitation code vector component. About things.

【0047】既に、音声平均パワーによって、各機能部
が処理する際に用いる内部変数の固定小数点位置を切り
替える方法が提案されている。過去の数個のフレームの
合成励振信号を保存してこれを利用する適応励振コード
ベクトル選択部においては、過去の数個のフレームの合
成励振信号毎に固定小数点位置が異なるため、単に現フ
レームについての音声平均パワーから固定小数点位置を
決定した場合、過去のフレームの合成励振信号から見て
固定小数点位置が妥当ではないことがある(例えば小さ
い数を正確に表現できても大きい数ではオーバーフロー
して不正確になることがある)。
There has already been proposed a method of switching the fixed-point position of an internal variable used when each functional unit performs processing according to the average voice power. In the adaptive excitation code vector selection unit that saves and uses the combined excitation signals of the past several frames, the fixed-point position differs for each of the combined excitation signals of the past several frames. If the fixed-point position is determined from the average voice power of the fixed frame, the fixed-point position may not be appropriate in view of the synthesized excitation signal of the past frame (for example, even if a small number can be accurately represented, a large number overflows. May be incorrect).

【0048】そこで、請求項1及び請求項5の本発明に
おいては、小数点位置バッファ部及び小数点位置選択部
を設け、小数点位置選択部が、小数点位置バッファ部に
格納されている複数の固定小数点位置情報と、現フレー
ムについての音声平均パワーとから、適応励振コードベ
クトル選択部における内部変数の固定小数点位置を決定
することとした。勿論、音声符号化装置と音声復号化装
置とでは、適応励振コードベクトル選択部が同じ状態で
適応励振コードベクトルを出力しなければならず、音声
符号化装置に、小数点位置バッファ部及び小数点位置選
択部を設けた場合には、それに対応する音声復号化装置
にもこれら機能部を設ける。
Therefore, according to the first and fifth aspects of the present invention, a decimal point position buffer section and a decimal point position selecting section are provided, and the decimal point position selecting section includes a plurality of fixed decimal point positions stored in the decimal point position buffer section. The fixed-point position of the internal variable in the adaptive excitation code vector selector is determined from the information and the average voice power of the current frame. Of course, in the speech encoding device and the speech decoding device, the adaptive excitation code vector selection unit must output the adaptive excitation code vector in the same state, and the speech encoding device requires the decimal point position buffer unit and the decimal point position selection unit. When such units are provided, these functional units are also provided in the corresponding audio decoding device.

【0049】請求項2の本発明は、音声信号を、有限語
長によるデジタル処理によってパラメータ符号化するC
ELP音声符号化方式に従う音声符号化装置であって、
音声信号のフレーム毎の音声平均パワーを求める音声パ
ワー計算部と、相前後する2個のフレームの音声平均パ
ワーから、1フレームを数個に等分したサブフレーム毎
の音声平均パワー情報を得る音声パワー補間部とを有す
る音声符号化装置を前提とする。
According to a second aspect of the present invention, a voice signal is parameter-encoded by digital processing using a finite word length.
An audio encoding device according to an ELP audio encoding method,
An audio power calculation unit for calculating an average audio power of each frame of an audio signal, and audio for obtaining average audio power of each sub-frame obtained by equally dividing one frame into several pieces from the average audio power of two consecutive frames. It is assumed that the speech encoding device has a power interpolation unit.

【0050】サブフレームによっては、相前後する2個
のフレームの音声平均パワーの平均的情報が補間情報と
して求められる。音声平均パワーが、サンプル値の二乗
和で求められることを考慮し、従来では、相乗平均値で
補間していたが、これでは補間構成又は補間処理が複雑
である。
For some subframes, average information of the average sound power of two consecutive frames is obtained as interpolation information. In consideration of the fact that the average voice power is obtained by the sum of squares of the sample values, interpolation has conventionally been performed using the geometric mean value. However, the interpolation configuration or interpolation processing is complicated.

【0051】そこで、請求項2の本発明においては、音
声パワー補間部が、少なくとも音声平均パワーの量子化
手段を備えるようにし、サブフレーム毎の音声平均パワ
ー情報を求めるときに、フレーム毎の音声平均パワーを
量子化したインデックスで扱うこととした。また、サブ
フレームによっては、2個のフレームの音声平均パワー
の相乗平均情報が求められることがあるが、この場合に
は、インデックスの相加平均で求めることとした。サブ
フレーム毎の音声平均パワー情報の利用の仕方によって
は、サブフレーム毎に求められた音声平均パワーのイン
デックスを出力するようにしても良く、また、求められ
たインデックスを逆量子化手段を介して戻した音声平均
パワーを出力するようにしても良い。
Therefore, in the present invention of claim 2, the audio power interpolating unit is provided with at least audio average power quantizing means, and when obtaining the audio average power information for each sub-frame, the audio power for each frame is obtained. The average power is treated as a quantized index. In some subframes, the geometric average information of the audio average power of the two frames may be obtained. In this case, the arithmetic average of the indices is used. Depending on how to use the audio average power information for each sub-frame, an index of the audio average power obtained for each sub-frame may be output, and the obtained index may be output via the inverse quantization means. The returned audio average power may be output.

【0052】請求項3の本発明の音声符号化装置は、請
求項1及び2の本発明の特徴部分を共に備えたものであ
る。
According to a third aspect of the present invention, there is provided a speech encoding apparatus having both the features of the first and second aspects of the present invention.

【0053】請求項4の本発明は、請求項1〜3の本発
明のいずれかに記載の音声符号化装置が採用しているC
ELP音声符号化方式が、その1種であるフォワード形
VSELP音声符号化方式であることに限定したもので
あり、請求項6の本発明は、請求項5の本発明に記載の
音声復号化装置が採用しているCELP音声符号化方式
が、その1種であるフォワード形VSELP音声符号化
方式であることに限定したものである。移動体通信等の
圧縮通信では、フォワード形VSELP音声符号化方式
が採用されており、請求項1〜3の本発明のいずれ共
に、また、請求項6の本発明も有効に機能する発明であ
る。
According to a fourth aspect of the present invention, there is provided a speech encoding apparatus according to any one of the first to third aspects of the present invention.
The ELP audio coding system is limited to one of the forward-type VSELP audio coding systems, and the present invention according to claim 6 is the audio decoding apparatus according to claim 5 of the present invention. Is limited to the forward VSELP speech coding method, which is one type of the CELP speech coding method. In compressed communication such as mobile communication, a forward type VSELP speech coding system is adopted, and any of the present inventions of claims 1 to 3 and the present invention of claim 6 are also effective inventions. .

【0054】[0054]

【実施例】【Example】

(A)VSELP音声符号化装置 以下、本発明による音声符号化装置の一実施例を図面を
参照しながら詳述する。この実施例は、VSELP音声
符号化方式に従うVSELP音声符号化装置の例であ
り、図1にその機能ブロック構成を示している。
(A) VSELP Speech Encoding Apparatus Hereinafter, an embodiment of a speech encoding apparatus according to the present invention will be described in detail with reference to the drawings. This embodiment is an example of a VSELP speech coding apparatus according to the VSELP speech coding method, and FIG. 1 shows a functional block configuration thereof.

【0055】なお、図1においても、各機能ブロックか
ら引き出されている破線出力線に係る情報は、復号化装
置に伝送されるものを示し、各機能ブロックから引き出
されている実線出力線に係る情報は、伝送する情報を決
定(探索)する際に処理される情報である。
In FIG. 1, the information on the dashed output lines drawn from each functional block indicates information transmitted to the decoding device, and the information on the solid output lines drawn from each functional block. The information is information processed when determining (searching) information to be transmitted.

【0056】また、図1に示す各種情報を表す符号も決
定された状態のものとし、探索中のもの(候補)に対し
てはその符号末尾に符号tを付けて説明する。
Also, it is assumed that the codes indicating the various information shown in FIG. 1 are in the determined state, and the searching (candidate) will be described with the code t appended to the end of the code.

【0057】この実施例のVSELP音声符号化装置
は、図1に示すように、音声パワー計算部201、音声
パワー補間部202、LPC分析部203、ターゲット
信号作成部204、ロングタームラグ選択部205、小
数点位置バッファ部206、小数点位置選択部207、
第1コード選択部208、第2コード選択部209、ゲ
イン選択部210、3個の増幅回路211〜213、加
算回路214から構成されている。
As shown in FIG. 1, the VSELP speech coding apparatus of this embodiment has a speech power calculator 201, a speech power interpolator 202, an LPC analyzer 203, a target signal generator 204, and a long term lag selector 205. , Decimal point position buffer 206, decimal point position selector 207,
It comprises a first code selector 208, a second code selector 209, a gain selector 210, three amplifier circuits 211 to 213, and an adder circuit 214.

【0058】音声パワー計算部201にはデジタル入力
音声信号Vが与えられ、音声パワー計算部201は、入
力音声信号Vの音声平均パワーをフレーム(例えば16
0サンプル)毎に計算し(例えばサンプル値の二乗
和)、フレーム毎の音声平均パワーRfを音声パワー補
間部202及びLPC分析部203に与える。
The audio power calculator 201 is supplied with the digital input audio signal V. The audio power calculator 201 converts the average audio power of the input audio signal V into a frame (for example, 16 bits).
The calculation is performed for each sample (for example, 0 samples) (for example, the sum of squares of sample values), and the average audio power Rf for each frame is provided to the audio power interpolation unit 202 and the LPC analysis unit 203.

【0059】音声パワー補間部202は、現フレーム及
び前フレームの音声平均パワーRfから、サブフレーム
(例えば40サンプル)毎の音声平均パワーR0を補間
して得て後述するように種々の機能部に出力する。
The audio power interpolation unit 202 interpolates the average audio power R0 of each subframe (for example, 40 samples) from the average audio power Rf of the current frame and the previous frame and obtains the average audio power R0 of each subframe. Output.

【0060】ここで、音声パワー補間部202は、対数
のオーダーで表現されている音声平均パワーの量子化テ
ーブル202aを有し、その音声平均パワーがどの量子
化段階に属するかを表すインデックスを得ることができ
るようになされている。また、音声パワー補間部202
は、音声平均パワーのインデックスから音声平均パワー
を得る逆量子化テーブル202bも備えている。
Here, the audio power interpolation unit 202 has a quantization table 202a of audio average power expressed in logarithmic order, and obtains an index indicating to which quantization stage the audio average power belongs. It has been made possible. Also, the audio power interpolation unit 202
Also has an inverse quantization table 202b for obtaining the average voice power from the index of the average voice power.

【0061】この実施例においては、音声パワー補間部
202は、各フレームの音声平均パワーRfを量子化テ
ーブル202aを用いてインデックスに変換し、インデ
ックス段階でサブフレームに対する補間処理を行ない、
各サブフレームの音声平均パワーのインデックスを逆量
子化テーブル202bを用いて音声平均パワーR0に変
換する。
In this embodiment, the audio power interpolation unit 202 converts the average audio power Rf of each frame into an index using the quantization table 202a, and performs an interpolation process on the sub-frame at the index stage.
The index of the average audio power of each subframe is converted to the average audio power R0 using the inverse quantization table 202b.

【0062】サブフレーム毎のインデックスの補間は、
例えば次のように行なう。(1) 第1サブフレームの音声
平均パワーのインデックスとして、前フレームの音声平
均パワーのインデックスを用いる。(2) 第2サブフレー
ムの音声平均パワーのインデックスとして、前フレーム
の音声平均パワーのインデックスと現フレームの音声平
均パワーのインデックスとの相加平均を用いる。(3) 第
3のサブフレームの音声平均パワーのインデックスとし
て、現フレームの音声平均パワーのインデックスを用い
る。(4) 第4のサブフレームの音声平均パワーのインデ
ックスとして、現フレームの音声平均パワーのインデッ
クスを用いる。
The interpolation of the index for each sub-frame is as follows:
For example, the following is performed. (1) The index of the average audio power of the previous frame is used as the index of the average audio power of the first subframe. (2) The arithmetic average of the index of the average audio power of the previous frame and the index of the average audio power of the current frame is used as the index of the average audio power of the second subframe. (3) The index of the average voice power of the current frame is used as the index of the average voice power of the third subframe. (4) The index of the average voice power of the current frame is used as the index of the average voice power of the fourth subframe.

【0063】なお、逆量子化テーブル202bは、相加
平均で得られた端数を有するインデックスを音声平均パ
ワーに変換できるように、量子化テーブル202aより
細かく構成されている。
Note that the inverse quantization table 202b is configured more finely than the quantization table 202a so that an index having a fraction obtained by arithmetic averaging can be converted into audio average power.

【0064】この実施例の補間方法において、音声平均
パワーのインデックスへの変換、インデックスから音声
平均パワーへの変換はテーブル202a及び202bを
用いて行なっているので簡単な処理であり、しかも、2
個の音声平均パワーの平均的情報を得る処理も相乗平均
ではなく相加平均を用いているので簡単な処理である。
相乗平均値は、乗算及び平方処理で得られるが、相加平
均値は、加算及び1/2倍処理で得られる。相加平均演
算における加算も簡単な処理であり、複数ビットでなる
データの1/2倍も1ビットシフトという簡単な処理で
ある。
In the interpolation method of this embodiment, the conversion of the average voice power into the index and the conversion from the index into the average voice power are performed using the tables 202a and 202b, so that the processing is simple.
The process for obtaining the average information of the individual voice average powers is also a simple process because the arithmetic mean is used instead of the geometric mean.
The geometric mean is obtained by multiplication and squaring, while the arithmetic mean is obtained by addition and halving. The addition in the arithmetic averaging operation is also a simple process, and is a simple process of shifting half the data of a plurality of bits by one bit.

【0065】なお、以上では、インデックスを逆量子化
して音声平均パワーに戻した後、各種機能部に与えるも
のを示したが、インデックスのまま各種機能部に与える
ようにしても良く、インデックスのまま復号化装置に送
信するようにしても良い。サブフレーム毎の音声平均パ
ワーR0は、後述するように、各種機能部における内部
変数の固定小数点位置に用いられるものであり、絶対的
な値が問題ではなく、固定小数点位置との関係では段階
が明らかであれば良く、インデックスを出力しても十分
であり、むしろ、インデックスを与える形式の方が各種
機能部での構成を簡単にできる。但し、ゲイン選択部2
10では、サブフレーム毎の音声平均パワーの絶対的な
値がゲインの選択動作に必要であるので、インデックス
で与える場合には、ゲイン選択部210内に逆量子化テ
ーブルを持たせることが必要となる。しかし、以下で
は、サブフレーム毎の音声平均パワーR0自体を各種機
能部に与えるとして説明する。
In the above description, the index is inversely quantized and returned to the audio average power, and then applied to various functional units. However, the index may be applied to various functional units as it is. You may make it transmit to a decoding apparatus. As will be described later, the audio average power R0 for each subframe is used for the fixed-point position of an internal variable in various functional units, and its absolute value is not a problem. It is sufficient if it is clear, and it is sufficient to output the index. Rather, the format in which the index is provided simplifies the configuration of various functional units. However, the gain selection unit 2
In 10, since the absolute value of the average sound power of each sub-frame is required for the gain selection operation, it is necessary to provide an inverse quantization table in the gain selection unit 210 when giving an index. Become. However, in the following, description will be made assuming that the average sound power R0 per subframe is given to various functional units.

【0066】LPC分析部203は声道分析手段として
設けられたものである。LPC分析部203は、与えら
れた現フレームの音声平均パワーRfに基づいて、内部
で行なうLPC分析演算での変数の固定小数点位置を切
り替える(図3参照)。その後、1フレーム分の入力音
声信号Vに対してLPC分析を行なってLPC係数kj
を求めて出力する。
The LPC analysis section 203 is provided as vocal tract analysis means. LPC analysis section 203 switches the fixed-point positions of variables in the LPC analysis operation performed internally based on the given average voice power Rf of the current frame (see FIG. 3). Thereafter, an LPC analysis is performed on the input voice signal V for one frame to obtain an LPC coefficient kj.
Is output.

【0067】なお、従来では、LPC係数についてもサ
ブフレーム毎の補間値を求めて出力するものを示した
が、この実施例においてはフレーム毎のLPC係数kj
を全てのサブフレームで利用する。しかし、この相違
は、本発明の特徴とは無関係であり、従来と同様に、サ
ブフレーム毎にLPC係数を得て出力するようにしても
良い。
In the prior art, the LPC coefficient is calculated and output for each sub-frame, but in this embodiment, the LPC coefficient kj is determined for each frame.
Is used in all subframes. However, this difference is irrelevant to the feature of the present invention, and the LPC coefficient may be obtained and output for each subframe as in the related art.

【0068】ターゲット信号作成部204は、図2に示
した従来のターゲット信号作成部102とほぼ同様な処
理を行なってサブフレーム毎のターゲット信号pを形成
して出力する。図2に示した従来のターゲット信号作成
部102と異なる点は、ターゲット信号pの作成演算処
理を開始する前に、入力されたサブフレームの音声平均
パワーR0に応じて、ターゲット信号pの作成演算に用
いる変数の固定小数点位置の設定を行なう点である。
The target signal generator 204 performs substantially the same processing as the conventional target signal generator 102 shown in FIG. 2 to form and output a target signal p for each subframe. The difference from the conventional target signal creation unit 102 shown in FIG. 2 is that before the start of the target signal p creation calculation processing, the target signal p creation calculation is performed in accordance with the average audio power R0 of the input subframe. Is to set the fixed-point position of the variable used for.

【0069】ロングタームラグ選択部205は、図2に
示した従来のロングタームラグ選択部103とほぼ同様
な処理を行なってサブフレーム毎に最適なロングターム
励振コードベクトルc0を得て出力する。勿論、この際
には、最適なロングタームラグLも決定される。
The long-term lag selecting section 205 performs almost the same processing as the conventional long-term lag selecting section 103 shown in FIG. 2 to obtain and output the optimal long-term excitation code vector c0 for each subframe. Of course, at this time, the optimum long term lug L is also determined.

【0070】しかし、この実施例のロングタームラグ選
択部205は、最適なロングターム励振コードベクトル
c0や最適なロングタームラグLを決定する処理に供す
る内部変数の固定小数点位置を切り替える機能を有する
点が従来とは異なっており、しかも、内部変数の固定小
数点位置を切り替える方法も、音声平均パワーR0にの
み基づく文献Bに記載されている方法とは異なってい
る。
However, the long-term lag selecting section 205 of this embodiment has a function of switching the fixed-point position of an internal variable used for determining the optimum long-term excitation code vector c0 and the optimum long-term lag L. Is different from the conventional one, and the method of switching the fixed-point position of the internal variable is also different from the method described in Document B based only on the average sound power R0.

【0071】固定小数点位置の切替えのために、この実
施例のロングタームラグ選択部205には関連して小数
点位置バッファ部206及び小数点位置選択部207が
設けられている。
For switching the fixed-point position, the long-term lag selecting unit 205 of this embodiment is provided with a decimal-point position buffer unit 206 and a decimal-point position selecting unit 207.

【0072】図4は、ロングタームラグ選択部203内
のロングタームフィルタステートバッファ部、及び、小
数点位置バッファ部206の格納内容を示すものであ
る。
FIG. 4 shows the contents stored in the long-term filter state buffer unit in the long-term lag selection unit 203 and the decimal point position buffer unit 206.

【0073】ロングタームラグ選択部203には、サブ
フレーム毎の最終的な合成励振信号exが与えられ、直
前過去の数個(図4では4個の例)のサブフレームの最
終的な合成励振信号ex(−1)、ex(−2)、ex
(−3)、ex(−4)が、図4(a)に示すように、
ロングタームフィルタステートバッファ部に格納され
る。この合成励振信号exの格納時には、その合成励振
信号に係る固定小数点位置fpの情報が小数点位置バッ
ファ部206に与えられ、図4(b)に示すように、サ
ブフレームを明らかにしてその固定小数点位置fp(−
1)、fp(−2)、fp(−3)、fp(−4)の情
報が小数点位置バッファ部206に格納される。
The long-term lag selecting section 203 is supplied with the final combined excitation signal ex for each subframe, and the final combined excitation of several immediately preceding subframes (four in FIG. 4 as an example). Signals ex (-1), ex (-2), ex
(-3) and ex (-4) are as shown in FIG.
It is stored in the long-term filter state buffer. At the time of storing the combined excitation signal ex, information on the fixed-point position fp related to the combined excitation signal is given to the decimal-point position buffer unit 206, and as shown in FIG. Position fp (-
1), fp (−2), fp (−3), and fp (−4) are stored in the decimal point position buffer unit 206.

【0074】ここで、現サブフレームについて最適なロ
ングターム励振コードベクトルc0を探索する際には、
ロングタームフィルタステートバッファ部に格納されて
いる部分からロングタームラグLtを変更しながら1サ
ブフレーム期間のデータを取出すことを要する。このよ
うな場合、過去の2個のサブフレームの合成励振信号に
股がるサブフレーム期間のデータを取出すことがほとん
どである。ロングタームフィルタステートバッファ部に
格納されている直前過去の数個のサブフレームの最終的
な合成励振信号ex(−1)、ex(−2)、ex(−
3)、ex(−4)の固定小数点位置fp(−1)、f
p(−2)、fp(−3)、fp(−4)は、異なって
いることの方が多く、音声平均パワーR0にのみ基づい
て、ロングタームラグ選択部205における内部変数の
固定小数点位置を決定することは妥当ではない。
Here, when searching for the optimal long-term excitation code vector c0 for the current subframe,
It is necessary to extract data for one subframe period while changing the long term lag Lt from the portion stored in the long term filter state buffer unit. In such a case, in most cases, data is extracted during a subframe period that overlaps with the combined excitation signal of the past two subframes. The final combined excitation signals ex (−1), ex (−2), ex (−) of the last several subframes stored in the long-term filter state buffer unit
3), fixed point positions fp (-1), f of ex (-4)
p (−2), fp (−3), and fp (−4) are often different, and the fixed-point positions of the internal variables in the long term lag selection unit 205 are determined based on only the average voice power R0. It is not reasonable to determine

【0075】小数点位置選択部207は、直前過去の数
個のサブフレームの最終的な合成励振信号ex(−
1)、ex(−2)、ex(−3)、ex(−4)の固
定小数点位置fp(−1)、fp(−2)、fp(−
3)、fp(−4)を考慮し、以下のようにして、ロン
グタームラグ選択部205における内部変数の固定小数
点位置を決定する。
The decimal point position selection unit 207 outputs the final combined excitation signal ex (−
1), fixed-point positions fp (-1), fp (-2), fp (-) of ex (-2), ex (-3), ex (-4)
3) In consideration of fp (-4), the fixed-point position of the internal variable in the long term lag selecting unit 205 is determined as follows.

【0076】図5は、小数点位置選択部207に内蔵さ
れているテーブル構成を示すものである。小数点位置選
択部207は、現サブフレームの音声平均パワーR0に
よって、図5(a)に示すテーブルをアクセスして、現
サブフレームの合成励振信号に求められる固定小数点位
置fp(0)の推測値を得る。次に、小数点位置選択部
207は、小数点位置バッファ部206に格納されてい
る固定小数点位置fp(−1)、fp(−2)、fp
(−3)、fp(−4)と、現サブフレームに関して得
た固定小数点位置fp(0)の中で最も大きな数を表す
固定小数点位置FPを求める。その後、小数点位置選択
部207は、この固定小数点位置FPによって、図5
(b)に示すテーブルをアクセスして、ロングタームラ
グ選択部205における内部変数のそれぞれについて固
定小数点位置を決定する。
FIG. 5 shows a table structure incorporated in the decimal point position selection unit 207. The decimal point position selection unit 207 accesses the table shown in FIG. 5A based on the average voice power R0 of the current subframe, and estimates the fixed point position fp (0) obtained for the combined excitation signal of the current subframe. Get. Next, the decimal point position selection unit 207 converts the fixed point positions fp (−1), fp (−2), and fp stored in the decimal point position buffer unit 206.
(−3), fp (−4) and the fixed point position FP representing the largest number among the fixed point positions fp (0) obtained for the current subframe are obtained. After that, the decimal point position selection unit 207 uses this fixed point position FP as shown in FIG.
By accessing the table shown in (b), the fixed-point position is determined for each of the internal variables in the long term lag selection unit 205.

【0077】以上のようにして固定小数点位置を決定す
ることにより、ロングターム励振コードベクトルc0t
(ロングタームラグLt)の探索時に、精度が低下する
ことを防止できる。
By determining the fixed-point position as described above, the long-term excitation code vector c0t
When searching for (long term lag Lt), it is possible to prevent the accuracy from lowering.

【0078】第1コード選択部208、第2コード選択
部209及びゲイン選択部210においても、ターゲッ
ト信号作成部204と同様に、音声平均パワーR0に基
づいた内部変数の固定小数点位置の決定処理が実行され
る(図3参照)。第1コード選択部208、第2コード
選択部209及びゲイン選択部210において、このよ
うな内部変数の固定小数点位置を決定した後に行なう処
理自体は、図2に示した従来の第1コード選択部10
4、第2コード選択部105及びゲイン選択部106と
ほぼ同様であるので、その説明は省略する。
In the first code selector 208, the second code selector 209, and the gain selector 210, as in the case of the target signal generator 204, the process of determining the fixed-point position of the internal variable based on the average voice power R0 is performed. (See FIG. 3). In the first code selection unit 208, the second code selection unit 209, and the gain selection unit 210, the processing itself performed after determining the fixed-point position of such an internal variable is performed by the conventional first code selection unit shown in FIG. 10
4, the second code selection unit 105 and the gain selection unit 106 are substantially the same, and thus description thereof is omitted.

【0079】上記実施例のVSELP音声符号化装置に
よれば、ロングタームラグ選択部205における演算に
供する内部変数の固定小数点位置を、保存している直前
過去の数個の合成励振信号についての固定小数点位置、
及び、現サブフレームの音声平均パワーに基づいて、決
定するようにしているので、過去の合成励振信号の固定
小数点位置の相違に精度が影響されなくなり、音声信号
の符号化精度が高まり、復号された音声信号の品質を従
来より高めることができる。
According to the VSELP speech encoding apparatus of the above embodiment, the fixed-point positions of the internal variables used for the operation in the long-term lag selecting unit 205 are fixed for the stored several immediately preceding synthetic excitation signals. Decimal point position,
In addition, since the determination is made based on the average voice power of the current subframe, the accuracy is not affected by the difference in the fixed-point position of the past synthetic excitation signal, the encoding accuracy of the audio signal is increased, and decoding is performed. The quality of the sound signal thus obtained can be improved as compared with the conventional case.

【0080】なお、ロングターム励振コードベクトルc
0(ロングタームラグL)の各候補毎に、その候補に係
る過去2個のサブフレームの合成励振信号の固定小数点
位置と、現サブフレームの音声平均パワーR0とから内
部変数の固定小数点位置を決定することも考えられる。
しかし、このようにすると、ロングターム励振コードベ
クトルc0(ロングタームラグL)の各候補毎に、内部
変数の見直しを行なうことを要して実際的ではなく、上
記実施例のように、全ての候補に対して内部変数の固定
小数点位置を一律に決定することが好ましい。
Note that the long-term excitation code vector c
For each candidate of 0 (long term lag L), the fixed-point position of an internal variable is determined from the fixed-point position of the combined excitation signal of the past two sub-frames relating to the candidate and the average voice power R0 of the current sub-frame. It is also conceivable to decide.
However, in this case, it is not practical because it is necessary to review the internal variables for each candidate of the long-term excitation code vector c0 (long-term lag L). It is preferable that the fixed-point positions of the internal variables be determined uniformly for the candidates.

【0081】また、上記実施例のVSELP音声符号化
装置によれば、2個のフレームの音声平均パワーからあ
るサブフレームの音声平均パワーを平均的情報値として
求めるにつき、音声平均パワーの量子化、量子化による
インデックスの相加平均処理を利用して行なうようにし
たので、サブフレームの音声平均パワーを得る構成を簡
単にでき、又は、処理ステップ数を少なくすることがで
きる(従って消費電力を小さくできる)。
Further, according to the VSELP speech coding apparatus of the above embodiment, when the speech mean power of a certain sub-frame is determined as the average information value from the speech mean power of two frames, the quantization of the speech mean power is performed. Since the arithmetic average processing of the index by quantization is performed, the configuration for obtaining the average audio power of the subframe can be simplified, or the number of processing steps can be reduced (thus, the power consumption can be reduced). it can).

【0082】(B)VSELP音声復号化装置 次に、上記実施例によるVSELP音声符号化装置に対
応した実施例のVSELP音声復号化装置を図面を参照
しながら詳述する。
(B) VSELP Speech Decoding Apparatus Next, a VSELP speech decoding apparatus according to an embodiment corresponding to the VSELP speech encoding apparatus according to the above embodiment will be described in detail with reference to the drawings.

【0083】図6は、この実施例のVSELP音声復号
化装置の機能ブロック構成を示すものである。なお、図
6において、各機能ブロックへの入力線のうち破線のも
のに係る情報は、復号化装置に伝送されてきたものを示
し、各機能ブロックへの入力線のうち実線のものに係る
情報は、当該復号化装置において形成された情報であ
る。
FIG. 6 shows a functional block configuration of the VSELP speech decoding apparatus of this embodiment. In FIG. 6, information relating to the broken lines among the input lines to the respective functional blocks indicates information transmitted to the decoding device, and information relating to the solid lines among the input lines to the respective functional blocks. Is information formed in the decoding device.

【0084】この実施例のVSELP音声復号化装置
は、図6に示すように、ロングタームラグ選択部30
1、小数点位置バッファ部302、小数点位置選択部3
03、第1コード選択部304、第2コード選択部30
5、ゲイン選択部306、3個の増幅回路307〜30
9、加算回路310、合成フィルタ部311、ポストフ
ィルタ部312から構成されている。
As shown in FIG. 6, the VSELP speech decoding apparatus of this embodiment has a long term lag selecting section 30.
1. Decimal point buffer 302, decimal point selector 3
03, first code selector 304, second code selector 30
5, gain selector 306, three amplifier circuits 307 to 30
9, an adder circuit 310, a synthesis filter unit 311, and a post filter unit 312.

【0085】図6において、VSELP音声符号化装置
から送信されてきた情報の内、ロングタームラグLはロ
ングタームラグ選択部301に与えられ、第1励振コー
ドベクトルのインデックスIは第1コード選択部304
に与えられ、第2励振コードベクトルのインデックスJ
は第2コード選択部305に与えられ、ゲインインデッ
クスGはゲイン選択部306に与えられ、音声平均パワ
ーR0は小数点位置選択部303、第1コード選択部3
04、第2コード選択部305、ゲイン選択部306、
合成フィルタ部311及びポストフィルタ部312に与
えられ、LPC係数kj はゲイン選択部306、合成フ
ィルタ部311及びポストフィルタ部312に与えられ
る。
In FIG. 6, of the information transmitted from the VSELP speech coding apparatus, the long term lag L is given to the long term lag selecting section 301, and the index I of the first excitation code vector is set to the first code selecting section. 304
And the index J of the second excitation code vector
Is given to the second code selection unit 305, the gain index G is given to the gain selection unit 306, and the average voice power R0 is calculated by the decimal point position selection unit 303 and the first code selection unit 3
04, a second code selector 305, a gain selector 306,
The LPC coefficient kj is provided to the synthesis filter unit 311 and the post filter unit 312, and the LPC coefficient kj is provided to the gain selection unit 306, the synthesis filter unit 311 and the post filter unit 312.

【0086】ロングタームラグ選択部301には、サブ
フレーム毎の確定された合成励振信号exが与えられ、
内部のロングタームフィルタステートバッファ部に格納
されるようになされており、また、その合成励振信号e
xに係る固定小数点位置fpの情報を小数点位置バッフ
ァ部302に与えて格納させるようになされている。す
なわち、現サブフレームの処理を開始する前のロングタ
ームフィルタステートバッファ部及び小数点位置バッフ
ァ部302の格納内容が、符号化装置における対応バッ
ファ部と同一になるようになされている。
The long-term lag selecting section 301 is provided with the synthesized excitation signal ex determined for each sub-frame,
The internal excitation signal e is stored in an internal long-term filter state buffer.
The information of the fixed-point position fp related to x is given to the decimal-point position buffer unit 302 and stored. That is, the contents stored in the long-term filter state buffer unit and the decimal point position buffer unit 302 before starting the processing of the current subframe are the same as those of the corresponding buffer unit in the encoding device.

【0087】小数点位置選択部303は、現サブフレー
ムの音声平均パワーR0に基づいて現サブフレームの合
成励振信号に求められる固定小数点位置fp(0)の推
測値を得、次に、小数点位置バッファ部302に格納さ
れている直前過去の数個のサブフレームの合成励振信号
ex(−1)、ex(−2)、ex(−3)、ex(−
4)の固定小数点位置fp(−1)、fp(−2)、f
p(−3)、fp(−4)と、現サブフレームに関して
得た固定小数点位置fp(0)の中で最も大きな数を表
す固定小数点位置FPを求め、その固定小数点位置FP
によって、ロングタームラグ選択部301における内部
変数について固定小数点位置を決定する。
The decimal point position selection unit 303 obtains an estimated value of the fixed point position fp (0) obtained for the combined excitation signal of the current subframe based on the average voice power R0 of the current subframe. The composite excitation signals ex (-1), ex (-2), ex (-3), ex (-
4) Fixed-point positions fp (-1), fp (-2), f
p (−3), fp (−4) and the fixed point position FP representing the largest number among the fixed point positions fp (0) obtained for the current subframe are obtained.
Thus, the fixed-point position of the internal variable in the long term lag selecting unit 301 is determined.

【0088】復号化装置のロングタームラグ選択部30
1では、最適なロングターム励振コードベクトルc0の
探索が不要であるので、固定小数点が切り替えられる変
数は、出力されるロングターム励振コードベクトルc0
自体である。
The long term lag selector 30 of the decoding device
In No. 1, since the search for the optimum long-term excitation code vector c0 is unnecessary, the variable whose fixed point is switched is the long-term excitation code vector c0 to be output.
Is itself.

【0089】ロングタームラグ選択部301は、現サブ
フレームに対する固定小数点位置が決定されると、与え
られたロングタームラグLに基づいて、ロングタームフ
ィルタステートバッファ部からロングターム励振コード
ベクトルc0を取出して、ゲイン選択部306及び増幅
回路307に出力する。
When the fixed-point position with respect to the current subframe is determined, the long-term lag selecting section 301 extracts the long-term excitation code vector c0 from the long-term filter state buffer section based on the given long-term lag L. Then, the signal is output to the gain selection unit 306 and the amplification circuit 307.

【0090】第1コード選択部304、第2コード選択
部305、ゲイン選択部306、合成フィルタ部31
1、ポストフィルタ部312は、自己ブロックに割り当
てられた本来の処理を実行する前に、符号化装置側から
与えられた音声平均パワーR0に基づいて、処理に供す
る内部変数の固定小数点位置を決定する(図3参照)。
なお、音声復号化装置における第1コード選択部30
4、第2コード選択部305及びゲイン選択部306
は、最適値の探索処理が不要であるので、符号化装置に
おける対応機能ブロックより固定小数点位置が決定され
る内部変数の種類数は少ない。
First code selection section 304, second code selection section 305, gain selection section 306, synthesis filter section 31
1. The post-filter unit 312 determines the fixed-point position of an internal variable to be used for processing based on the average audio power R0 given from the encoding apparatus before executing the original processing assigned to the self-block. (See FIG. 3).
Note that the first code selection unit 30 in the speech decoding device
4. Second code selector 305 and gain selector 306
Does not require an optimum value search process, so the number of types of internal variables whose fixed-point positions are determined is smaller than that of the corresponding function block in the encoding device.

【0091】第1コード選択部304は、符号化装置に
おける第1コード選択部208と同一のベーシスベクト
ルv1を格納しており、固定小数点位置が決定される
と、このベーシスベクトルと受信した第1励振コードベ
クトルについてのインデックスIとから最適な第1励振
コードベクトルc1を復号して、増幅回路308及びゲ
イン選択部306に出力する。
The first code selection unit 304 stores the same basis vector v1 as that of the first code selection unit 208 in the encoding device. When the fixed-point position is determined, the first vector selection unit 304 receives this basis vector and the received first base vector. The optimum first excitation code vector c1 is decoded from the index I for the excitation code vector and output to the amplification circuit 308 and the gain selection unit 306.

【0092】第2コード選択部305は、符号化装置に
おける第2コード選択部209と同一のベーシスベクト
ルv2を格納しており、固定小数点位置が決定される
と、このベーシスベクトルと受信した第2励振コードベ
クトルについてのインデックスJとから最適な第2励振
コードベクトルc0を復号して、増幅回路309及びゲ
イン選択部306に出力する。
The second code selection unit 305 stores the same basis vector v2 as that of the second code selection unit 209 in the encoding device. When the fixed-point position is determined, the second vector selection unit 305 and the received second vector are received. The optimum second excitation code vector c0 is decoded from the index J of the excitation code vector and output to the amplification circuit 309 and the gain selection unit 306.

【0093】ゲイン選択部306は、符号化装置におけ
るゲイン選択部210と同一のゲインパラメータGS、
P0 、P1 の組情報を格納しており、固定小数点位置が
決定されると、受信したゲインインデックスGから最適
なゲインパラメータGS、P0 、P1 の組を取出し、得
られたロングターム励振コードベクトルc0、第1励振
コードベクトルc1、第2励振コードベクトルc2と、
受信したLPC係数kj 、平均音声パワーR0 とから最
適なゲインβ、γ1、γ2を復号し、それぞれ対応する
増幅回路307、308、309に出力する。
The gain selection unit 306 has the same gain parameters GS,
When the fixed-point position is determined, the optimum set of gain parameters GS, P0, P1 is extracted from the received gain index G, and the obtained long-term excitation code vector c0 is stored. , A first excitation code vector c1, a second excitation code vector c2,
The optimum gains β, γ1 and γ2 are decoded from the received LPC coefficient kj and the average audio power R0 and output to the corresponding amplifier circuits 307, 308 and 309, respectively.

【0094】以上のようにして得られたロングターム励
振コードベクトルc0、第1励振コードベクトルc1、
第2励振コードベクトルc2は、各増幅回路307、3
08、309によって、対応するゲインβ、γ1、γ2
に基づいた利得制御がなされ、それらが加算回路310
によって加算されて現サブフレームについて合成励振信
号exが得られる。この合成励振信号exは、合成フィ
ルタ部311及びロングタームラグ選択部301に与え
られる。
The long-term excitation code vector c0, the first excitation code vector c1,
The second excitation code vector c2 is stored in each of the amplifier circuits 307, 3
08, 309, the corresponding gain β, γ1, γ2
Is controlled based on
To obtain a combined excitation signal ex for the current subframe. This combined excitation signal ex is provided to the combining filter unit 311 and the long term lag selecting unit 301.

【0095】合成フィルタ部311は、決定された固定
小数点位置表現で受信したLPC係数kj を設定してフ
ィルタ特性を規定し、入力された合成励振信号exをそ
のフィルタ特性でフィルタリングして音声信号を再生す
る。このようにして得られた再生音声信号の雑音成分が
大きいこともある。
The synthesis filter unit 311 sets the LPC coefficient kj received in the determined fixed-point position expression to define the filter characteristics, filters the input synthesized excitation signal ex with the filter characteristics, and converts the audio signal into an audio signal. Reproduce. The noise component of the reproduced audio signal obtained in this way may be large.

【0096】ポストフィルタ部312は、決定された固
定小数点位置表現で受信したLPC係数kj を設定して
フィルタ特性を規定し、合成フィルタ部311による再
生音声信号をそのフィルタ特性でフィルタリングして雑
音成分を圧縮した最終的な再生音声信号Vを得て出力す
る。
The post-filter unit 312 sets the LPC coefficient kj received in the determined fixed-point position expression to define the filter characteristics, filters the audio signal reproduced by the synthesis filter unit 311 with the filter characteristics, and removes the noise component. Is obtained and output.

【0097】上記実施例のVSELP音声復号化装置に
よれば、ロングタームラグ選択部301における演算に
供する内部変数の固定小数点位置を、保存している直前
過去の数個の合成励振信号についての固定小数点位置、
及び、現サブフレームの音声平均パワーに基づいて、決
定するようにしているので、過去の合成励振信号の固定
小数点位置の相違に精度が影響されなくなり、音声信号
の符号化精度が高まり、復号された音声信号の品質を従
来より高めることができる。勿論、符号化装置と同一の
固定小数点位置の決定方法を採用して上記効果が実効あ
るものとなる。
According to the VSELP speech decoding apparatus of the above embodiment, the fixed-point positions of the internal variables used for the operation in the long term lag selecting section 301 are fixed for the stored several immediately preceding synthetic excitation signals. Decimal point position,
In addition, since the determination is made based on the average voice power of the current subframe, the accuracy is not affected by the difference in the fixed-point position of the past synthetic excitation signal, the encoding accuracy of the audio signal is increased, and decoding is performed. The quality of the sound signal thus obtained can be improved as compared with the conventional case. Needless to say, the same effect can be obtained by adopting the same fixed point position determining method as that of the encoding device.

【0098】(C)他の実施例 上記実施例の説明においても、他の実施例について言及
したが、上記で説明した以外にも、以下のような他の実
施例を挙げることができる。
(C) Other Embodiments In the description of the above embodiments, other embodiments have been mentioned. In addition to the above, the following other embodiments can be mentioned.

【0099】上記実施例の特徴は大きく言えば2個あ
る。第1の特徴は、音声平均パワーの補間方法に関し、
2個の音声平均パワーからその平均的な情報を得るのに
インデックスの相加平均を利用したことである。第2の
特徴は、過去のサブフレームの合成励振信号を現サブフ
レームの励振コードベクトル成分として用いる際の固定
小数点表現方法に関し、過去の合成励振信号の固定小数
点位置を利用して必要な変数の固定小数点位置を決定し
ていることである。しかし、いずれか一方の特徴だけを
備えて装置を構成しても良い。
The features of the above embodiment are roughly two. The first feature relates to a method for interpolating the average voice power.
That is, the arithmetic mean of the index is used to obtain the average information from the two audio average powers. The second feature relates to a fixed-point representation method when a combined excitation signal of a past subframe is used as an excitation code vector component of a current subframe. That is, the fixed-point position is determined. However, the device may be configured to include only one of the features.

【0100】上記実施例においては、本発明をフォワー
ド形のVSELP音声符号化方式に従う装置に適用した
ものを示したが、バックワード形のVSELP音声符号
化方式に従う装置に適用しても良く、一般的なCELP
音声符号化方式に従う装置に適用しても良い。
In the above embodiment, the present invention is applied to an apparatus according to the forward-type VSELP speech coding scheme. However, the present invention may be applied to an apparatus according to the backward-type VSELP speech coding scheme. CELP
The present invention may be applied to a device that conforms to a speech coding method.

【0101】例えば、一般的なCELP音声符号化方式
に従う装置においても、過去の合成励振信号を保存して
利用する適応励振コードベクトル選択部(実施例のロン
グタームラグ選択部に相当)を有するものがあり、この
ような装置では第2の特徴を適用できる。なお、この場
合において、フレームをサブフレームに分解することが
ない装置であっても良い。VSELP音声符号化方式
は、CELP音声符号化方式の一種であるので、過去の
合成励振信号を保存して利用する構成部分名を、特許請
求の範囲では、「適応励振コードベクトル選択部」と表
現している。
For example, an apparatus according to a general CELP speech coding system also has an adaptive excitation code vector selection unit (corresponding to the long term lag selection unit in the embodiment) for storing and using past synthesized excitation signals. In such an apparatus, the second feature can be applied. In this case, a device that does not decompose a frame into subframes may be used. VSELP speech coding system
Is a type of CELP speech coding method,
The name of the component that stores and uses the synthesized excitation signal is
In the range of the
Is showing.

【0102】また、例えば、2個の音声平均パワーの平
均的情報を固定小数点表現の切替えに用いることがない
装置であっても、2個の音声平均パワーの平均的情報を
得ることを要する装置であれば、第1の特徴構成を適用
できる。
Further, for example, even if the apparatus does not use the average information of the two audio average powers for switching the fixed-point representation, it is necessary to obtain the average information of the two audio average powers. Then, the first characteristic configuration can be applied.

【0103】[0103]

【発明の効果】以上のように、本発明の音声符号化装置
及び音声復号化装置によれば、適応励振コードベクトル
選択部に保存されている過去の数個のフレームの合成励
振信号のそれぞれについて、固定小数点位置情報を格納
する小数点位置バッファ部と、この小数点位置バッファ
部に格納されている複数の固定小数点位置情報と、現フ
レームについての音声平均パワーとから、適応励振コー
ドベクトル選択部における内部変数の固定小数点位置を
決定する小数点位置選択部とを設けたので、過去の合成
励振信号を格納している適応励振コードベクトル選択部
においても、固定小数点位置の切替えによる精度向上を
実現することができるようになる。
As described above, according to the speech encoding apparatus and speech decoding apparatus of the present invention, each of the synthesized excitation signals of the past several frames stored in the adaptive excitation code vector selection unit is used. The adaptive excitation code vector selection unit uses a decimal point position buffer unit for storing fixed point position information, a plurality of fixed point position information stored in the decimal point position buffer unit, and a speech average power for the current frame. Since a decimal point position selector for determining the fixed point position of the variable is provided, even in the adaptive excitation code vector selector that stores the past synthesized excitation signal, it is possible to realize an improvement in accuracy by switching the fixed point position. become able to.

【0104】また、他の本発明の音声符号化装置によれ
ば、音声パワー補間部が、少なくとも音声平均パワーの
量子化手段を備え、サブフレーム毎の音声平均パワー情
報を求めるときに、フレーム毎の音声平均パワーを量子
化したインデックスで扱い、2個のフレームの音声平均
パワーの相乗平均情報をインデックスナンバーの相加平
均で求め、サブフレーム毎に求められたインデックスを
出力し、又は、求められたインデックスを逆量子化手段
を介して戻した音声平均パワーを出力するようにしたの
で、簡単な構成又は簡単な処理によってサブフレーム毎
の音声平均パワー情報を得ることができる。
According to another speech coding apparatus of the present invention, the speech power interpolator includes at least speech average power quantizing means, and obtains speech average power information for each sub-frame. The audio average power of the two frames is treated as a quantized index, and the geometric average information of the audio average power of the two frames is obtained by the arithmetic mean of the index numbers, and the index obtained for each subframe is output or obtained. Since the average voice power obtained by returning the index obtained through the inverse quantization means is output, the average voice power information for each subframe can be obtained by a simple configuration or simple processing.

【図面の簡単な説明】[Brief description of the drawings]

【図1】実施例のVSELP音声符号化装置の機能ブロ
ック図である。
FIG. 1 is a functional block diagram of a VSELP speech encoding device according to an embodiment.

【図2】従来のVSELP音声符号化装置の機能ブロッ
ク図である。
FIG. 2 is a functional block diagram of a conventional VSELP speech coding apparatus.

【図3】固定小数点表現の一般的な切替え方法の説明図
である。
FIG. 3 is an explanatory diagram of a general switching method of fixed-point representation.

【図4】実施例のロングタームラグ選択部に関する固定
小数点表現の切替え方法の説明図(その1)である。
FIG. 4 is an explanatory diagram (part 1) of a method for switching a fixed-point expression regarding a long-term lag selector according to the embodiment.

【図5】実施例のロングタームラグ選択部に関する固定
小数点表現の切替え方法の説明図(その2)である。
FIG. 5 is a diagram (part 2) illustrating a method of switching the fixed-point representation regarding the long-term lag selector according to the embodiment.

【図6】実施例のVSELP音声復号化装置の機能ブロ
ック図である。
FIG. 6 is a functional block diagram of the VSELP speech decoding device according to the embodiment;

【符号の説明】[Explanation of symbols]

201…音声パワー計算部、 202…音声パワー補間部、 202a…音声平均パワーの量子化テーブル、 203…LPC分析部、 204…ターゲット信号作成部、 205、301…ロングタームラグ選択部、 206、302…小数点位置バッファ部、 207、303…小数点位置選択部、 208、304…第1コード選択部、 209、305…第2コード選択部、 210、306…ゲイン選択部、 211〜213、307〜309…増幅回路、 214、310…加算回路214、 311…合成フィルタ部、 312…ポストフィルタ部。 201: audio power calculation unit, 202: audio power interpolation unit, 202a: audio average power quantization table, 203: LPC analysis unit, 204: target signal creation unit, 205, 301: long term lag selection unit, 206, 302 ... Decimal point position buffer section, 207, 303... Decimal point position selecting section, 208, 304... First code selecting section, 209, 305. ... Amplifier circuits 214 and 310... Addition circuits 214 and 311... Synthesis filter section 312.

フロントページの続き (72)発明者 伊東 克俊 東京都港区虎ノ門1丁目7番12号 沖電 気工業株式会社内 (56)参考文献 特開 平4−190399(JP,A) 特開 平5−165498(JP,A) 特開 昭58−63998(JP,A) 特開 昭63−261925(JP,A) 特開 平4−107600(JP,A) 特開 平4−270399(JP,A) 特開 平5−6199(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/00 - 19/14 H03M 7/30 H04B 14/04 Continuation of the front page (72) Inventor Katsutoshi Ito 1-7-12 Toranomon, Minato-ku, Tokyo Oki Electric Industry Co., Ltd. (56) References JP-A-4-190399 (JP, A) JP-A-5-190 165498 (JP, A) JP-A-58-63998 (JP, A) JP-A-63-261925 (JP, A) JP-A-4-107600 (JP, A) JP-A-4-270399 (JP, A) JP-A-5-6199 (JP, A) (58) Fields investigated (Int. Cl. 7 , DB name) G10L 19/00-19/14 H03M 7/30 H04B 14/04

Claims (6)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 音声信号を、有限語長によるデジタル処
理によってパラメータ符号化するCELP音声符号化方
式に従う音声符号化装置であって、過去の数個のフレー
ムの合成励振信号を保存しておき、その信号系列の一部
を適応的な励振コードベクトル成分として出力する、内
部変数の固定小数点位置を切替え可能な適応励振コード
ベクトル選択部を有する音声符号化装置において、上記 適応励振コードベクトル選択部に保存されている過
去の数個のフレームの合成励振信号のそれぞれについ
て、固定小数点位置情報を格納する小数点位置バッファ
部と、 この小数点位置バッファ部に格納されている複数の固定
小数点位置情報と、現フレームについての音声平均パワ
ーとから、上記適応励振コードベクトル選択部における
内部変数の固定小数点位置を決定する小数点位置選択部
とを備えたことを特徴とする音声符号化装置。
1. A speech coding apparatus according to a CELP speech coding system for parameter coding a speech signal by digital processing with a finite word length, wherein a synthetic excitation signal of several past frames is stored. outputting a portion of the signal sequence as adaptive excitation code vector component, in speech encoding apparatus having an adaptive excitation code vector selection unit capable of switching fixed-point position of the internal variable, to the adaptive excitation code vector selection unit For each of the stored excitation signals of the past several frames, a fixed-point position buffer for storing fixed-point position information, a plurality of fixed-point position information stored in the fixed-point position buffer, and a voice average power of the frame, fixed-internal variables in the adaptive excitation code vector selection unit Speech coding apparatus is characterized in that a decimal point position selection section which determines a point location.
【請求項2】 音声信号を、有限語長によるデジタル処
理によってパラメータ符号化するCELP音声符号化方
式に従う音声符号化装置であって、音声信号のフレーム
毎の音声平均パワーを求める音声パワー計算部と、相前
後する2個のフレームの音声平均パワーから、1フレー
ムを数個に等分したサブフレーム毎の音声平均パワー情
報を得る音声パワー補間部とを有する音声符号化装置に
おいて、 上記音声パワー補間部が、少なくとも音声平均パワーの
量子化手段を備え、サブフレーム毎の音声平均パワー情
報を求めるときに、フレーム毎の音声平均パワーを量子
化したインデックスで扱い、2個のフレームの音声平均
パワーの相乗平均情報を演算するときにはインデックス
の相加平均で求め、サブフレーム毎に求められたインデ
ックスを出力し、又は、求められたインデックスを逆量
子化手段を介して戻した音声平均パワーを出力すること
を特徴とした音声符号化装置。
2. A speech encoding apparatus according to a CELP speech encoding method for encoding a speech signal by digital processing with a finite word length according to a CELP speech encoding method, comprising: a speech power calculation unit for calculating a speech average power of each frame of the speech signal; A voice power interpolator for obtaining voice average power information for each sub-frame obtained by equally dividing one frame into several frames from the voice average power of two successive frames. The unit includes at least voice average power quantization means, and when obtaining voice average power information for each subframe, treats the voice average power for each frame with a quantized index and calculates the voice average power of two frames. When calculating the geometric mean information, the arithmetic mean of the index is calculated, and the index obtained for each subframe is calculated. Force and, or, the speech coding apparatus and outputs a voice average power back through the inverse quantization means indexes obtained.
【請求項3】 音声信号を、有限語長によるデジタル処
理によってパラメータ符号化するCELP音声符号化方
式に従う音声符号化装置であって、音声信号のフレーム
毎の音声平均パワーを求める音声パワー計算部と、相前
後する2個のフレームの音声平均パワーから、1フレー
ムを数個に等分したサブフレーム毎の音声平均パワー情
報を得る音声パワー補間部と、過去の数個のサブフレー
ムの合成励振信号を保存しておき、その信号系列の一部
を適応的な励振コードベクトル成分として出力する、内
部変数の固定小数点位置を切替え可能な適応励振コード
ベクトル選択部を有する音声符号化装置において、 上記音声パワー補間部が、少なくとも音声平均パワーの
量子化手段を備え、サブフレーム毎の音声平均パワー情
報を求めるときに、フレーム毎の音声平均パワーを量子
化したインデックスで扱い、2個のフレームの音声平均
パワーの相乗平均情報を演算するときにはインデックス
の相加平均で求め、サブフレーム毎に求められたインデ
ックスを出力し、又は、求められたインデックスを逆量
子化手段を介して戻した音声平均パワーを出力すると共
に、上記 適応励振コードベクトル選択部に保存されている過
去の数個のサブフレームの合成励振信号のそれぞれにつ
いて、固定小数点位置情報を格納する小数点位置バッフ
ァ部と、 この小数点位置バッファ部に格納されている複数の固定
小数点位置情報と、現サブフレームについての音声平均
パワーとから、上記適応励振コードベクトル選択部にお
ける内部変数の固定小数点位置を決定する小数点位置選
択部とを備えたことを特徴とする音声符号化装置。
3. A speech encoding apparatus according to a CELP speech encoding method for encoding a speech signal by digital processing with a finite word length according to a CELP speech encoding method, comprising: a speech power calculation unit for calculating a speech average power of each frame of the speech signal. A voice power interpolator for obtaining voice average power information for each subframe obtained by equally dividing one frame into several frames from the voice average power of two successive frames, and a synthetic excitation signal of several past subframes Is stored, and a part of the signal sequence is output as an adaptive excitation code vector component. The power interpolation unit includes at least a voice average power quantizing unit, and obtains voice average power information for each sub-frame. The audio average power of each frame is treated as a quantized index, and when calculating geometric average information of the audio average power of two frames, the arithmetic average of the indexes is calculated, and the index determined for each subframe is output. or outputs the audio average power index back through the inverse quantization unit obtained, each of the synthetic excitation signal of the past several sub frames stored in said adaptive excitation code vector selection unit The adaptive excitation code vector selection is performed based on a decimal point position buffer unit for storing fixed point position information, a plurality of fixed point position information stored in the decimal point position buffer unit, and a speech average power for the current subframe. And a decimal point position selecting unit for determining a fixed point position of an internal variable in the unit. Speech coding apparatus for.
【請求項4】 上記CELP音声符号化方式がその1種
であるフォワード形VSELP音声符号化方式であるこ
とを特徴とした請求項1〜3のいずれかに記載の音声符
号化装置。
4. The speech encoding apparatus according to claim 1, wherein said CELP speech encoding scheme is one of the forward type VSELP speech encoding schemes.
【請求項5】 請求項1の音声符号化装置に対応したC
ELP音声符号化方式に従う音声復号化装置であって、
過去の数個のフレームの合成励振信号を保存しておき、
その信号系列の一部を適応的な励振コードベクトル成分
として出力する、内部変数の固定小数点位置を切替え可
能な適応励振コードベクトル選択部を有する音声復号化
装置において、上記 適応励振コードベクトル選択部に保存されている過
去の数個のフレームの合成励振信号のそれぞれについ
て、固定小数点位置情報を格納する小数点位置バッファ
部と、 この小数点位置バッファ部に格納されている複数の固定
小数点位置情報と、現フレームについての音声平均パワ
ーとから、上記適応励振コードベクトル選択部における
内部変数の固定小数点位置を決定する小数点位置選択部
とを備えたことを特徴とする音声復号化装置。
5. A C code corresponding to the speech coding apparatus according to claim 1.
An audio decoding device according to an ELP audio encoding method,
Save the combined excitation signals of several past frames,
Outputting a portion of the signal sequence as adaptive excitation code vector component, the speech decoder with adaptive excitation code vector selection unit capable of switching fixed-point position of the internal variable, to the adaptive excitation code vector selection unit For each of the stored excitation signals of the past several frames, a fixed-point position buffer for storing fixed-point position information, a plurality of fixed-point position information stored in the fixed-point position buffer, and a voice average power of the frame, the speech decoding apparatus is characterized in that a decimal point position selection section which determines a fixed-point position of the internal variable in the adaptive excitation code vector selection unit.
【請求項6】 上記CELP音声符号化方式がその1種
であるフォワード形VSELP音声符号化方式であるこ
とを特徴とした請求項5に記載の音声復号化装置。
6. The speech decoding apparatus according to claim 5, wherein said CELP speech coding system is one of the forward type VSELP speech coding systems.
JP28089093A 1993-11-10 1993-11-10 Audio encoding device and audio decoding device Expired - Lifetime JP3262652B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP28089093A JP3262652B2 (en) 1993-11-10 1993-11-10 Audio encoding device and audio decoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP28089093A JP3262652B2 (en) 1993-11-10 1993-11-10 Audio encoding device and audio decoding device

Publications (2)

Publication Number Publication Date
JPH07134600A JPH07134600A (en) 1995-05-23
JP3262652B2 true JP3262652B2 (en) 2002-03-04

Family

ID=17631373

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28089093A Expired - Lifetime JP3262652B2 (en) 1993-11-10 1993-11-10 Audio encoding device and audio decoding device

Country Status (1)

Country Link
JP (1) JP3262652B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3303580B2 (en) * 1995-02-23 2002-07-22 日本電気株式会社 Audio coding device
JPH09152896A (en) * 1995-11-30 1997-06-10 Oki Electric Ind Co Ltd Sound path prediction coefficient encoding/decoding circuit, sound path prediction coefficient encoding circuit, sound path prediction coefficient decoding circuit, sound encoding device and sound decoding device
JP3481027B2 (en) * 1995-12-18 2003-12-22 沖電気工業株式会社 Audio coding device
JP7243498B2 (en) 2019-07-11 2023-03-22 富士通株式会社 Arithmetic processing device, control program, and control method

Also Published As

Publication number Publication date
JPH07134600A (en) 1995-05-23

Similar Documents

Publication Publication Date Title
US6202046B1 (en) Background noise/speech classification method
JPH08263099A (en) Encoder
US5659659A (en) Speech compressor using trellis encoding and linear prediction
JP3357795B2 (en) Voice coding method and apparatus
JP3478209B2 (en) Audio signal decoding method and apparatus, audio signal encoding and decoding method and apparatus, and recording medium
JP3180786B2 (en) Audio encoding method and audio encoding device
JPH03102921A (en) Conditional probabilistic excitation coding method
JPH1097295A (en) Coding method and decoding method of acoustic signal
JP3266178B2 (en) Audio coding device
JP2002268686A (en) Voice coder and voice decoder
JP3262652B2 (en) Audio encoding device and audio decoding device
JP2000112498A (en) Audio coding method
JPH0944195A (en) Voice encoding device
JP2002366195A (en) Method and device for encoding voice and parameter
JP3088163B2 (en) LSP coefficient quantization method
JPH06282298A (en) Voice coding method
JP3417362B2 (en) Audio signal decoding method and audio signal encoding / decoding method
KR100341398B1 (en) Codebook searching method for CELP type vocoder
JP2968109B2 (en) Code-excited linear prediction encoder and decoder
JPH11219196A (en) Speech synthesizing method
JP3249144B2 (en) Audio coding device
JP3299099B2 (en) Audio coding device
JPH113098A (en) Method and device of encoding speech
JP3229784B2 (en) Audio encoding / decoding device and audio decoding device
JP3192051B2 (en) Audio coding device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081221

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091221

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091221

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101221

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101221

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111221

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111221

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121221

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131221

Year of fee payment: 12

EXPY Cancellation because of completion of term