JP3138574B2 - Linear prediction coefficient interpolator - Google Patents

Linear prediction coefficient interpolator

Info

Publication number
JP3138574B2
JP3138574B2 JP05217373A JP21737393A JP3138574B2 JP 3138574 B2 JP3138574 B2 JP 3138574B2 JP 05217373 A JP05217373 A JP 05217373A JP 21737393 A JP21737393 A JP 21737393A JP 3138574 B2 JP3138574 B2 JP 3138574B2
Authority
JP
Japan
Prior art keywords
coefficient
interpolation
hyperbolic
conversion
linear
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP05217373A
Other languages
Japanese (ja)
Other versions
JPH0774642A (en
Inventor
修一 河間
吉伸 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP05217373A priority Critical patent/JP3138574B2/en
Publication of JPH0774642A publication Critical patent/JPH0774642A/en
Application granted granted Critical
Publication of JP3138574B2 publication Critical patent/JP3138574B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PURPOSE:To provide a linear predictive coefficient interpolating device which can extremely reduce its calculation quantity even in a digital signal processor. CONSTITUTION:A linear predictive coefficient interpolating device is provided with a hyperbolic conversion part 61 which applies the hyperbolic conversion to a partial autocorrelation coefficient of a prescribed degree acquired from an input voice signal of a fixed time length, a linear interpolation part 62 which is connected to the part 61 and applies the linear interpolation to the hyperbolic conversion result of the part 61, and a hyperbolic reverse conversion part 63 which connected to the part 62 and applies the reverse conversion to the linear interpolation result of the part 62.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、線形予測係数を使用す
る音声情報処理システムに関し、特に音声情報処理シス
テムに用いることができる線形予測係数補間装置に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech information processing system using linear prediction coefficients, and more particularly to a linear prediction coefficient interpolation device which can be used in a speech information processing system.

【0002】[0002]

【従来の技術】従来の技術では、入力された音声信号を
線形予測分析し、線形予測係数によりスペクトル情報を
得て、得られたスペクトル情報を伝送することにより実
際の音声信号を伝送するよりも低ビットレートで音声の
通信を行う方式が実現されている。
2. Description of the Related Art In a conventional technique, an input speech signal is subjected to linear prediction analysis, spectrum information is obtained from linear prediction coefficients, and the obtained spectrum information is transmitted. A system for performing voice communication at a low bit rate has been realized.

【0003】上記の線形予測分析を使用して、低ビット
レートの伝送を行う為の音声符号化復号化方法として
は、CELP(Code Excited Linea
r Prediction)方式が知られている。
[0003] As a speech encoding / decoding method for transmitting at a low bit rate using the above-described linear prediction analysis, CELP (Code Excited Linea) is used.
r Prediction) method is known.

【0004】CELP方式は、音声の生成をモデル化し
たもので、声門で生じる気流に相当する信号の候補をコ
ードブックに持っており、この中の一つの信号に声帯の
開閉の周期に相当するピッチを付加するピッチ予測(ま
たは長期予測)フィルタ、口腔での調音に相当する(短
期)予測フィルタを通すことによって合成音声を生成す
る。このとき気流に相当する信号の候補からなるコード
ブックの中から最適な信号をAbS(Analysis
by Synthesis)法、即ち合成による分析
法で求め、この信号の番号、利得、ピッチ予測フィルタ
の係数、ラグ(ピッチ長に相当)、線形予測フィルタの
係数を量子化及び符号化している。
[0004] The CELP system is a model of voice generation, in which codebooks have candidates for signals corresponding to air currents generated in the glottis, and one of these signals corresponds to a period of opening and closing a vocal cord. The synthesized speech is generated by passing through a pitch prediction (or long-term prediction) filter for adding a pitch and a (short-term) prediction filter corresponding to articulation in the oral cavity. At this time, an optimal signal is selected from AbS (Analysis) from a code book including signal candidates corresponding to the airflow.
The signal number, gain, pitch prediction filter coefficient, lag (corresponding to pitch length), and linear prediction filter coefficient are quantized and coded by a synthesis analysis method, that is, a signal of this signal.

【0005】CELP方式では、入力音声信号を約20
〜40msのフレームに分割し、各フレームを4〜5の
サブフレームに分割して処理を行う。また、CELP方
式ではフレーム単位に線形予測係数を求め、それらを補
間することによってサブフレーム単位の線形予測係数を
求める。本来、線形予測係数は、サブフレーム毎に求め
る方が合成音質の良い符号化を行える。しかし、計算量
が多くなり、伝送する符号の量が増加する為、一般的に
上記方式が用いられている。
In the CELP system, an input audio signal is reduced to about 20
The frame is divided into 4040 ms frames, and each frame is divided into 4 to 5 subframes for processing. In the CELP method, a linear prediction coefficient is obtained for each frame, and a linear prediction coefficient is obtained for each subframe by interpolating them. Essentially, the linear prediction coefficient can be obtained for each subframe, so that encoding with good synthesized sound quality can be performed. However, since the amount of calculation increases and the amount of codes to be transmitted increases, the above method is generally used.

【0006】従来、CELP方式では、線形予測係数の
補間方法としてLAR(Log Area Rati
o:パーコール(PARCOR)係数の対数変換形(対
数断面積比))による補間を用いている。即ち、線形予
測係数からPARCOR係数に変換し、PARCOR係
数から下記(1)式によりLARを求める。
Conventionally, in the CELP system, LAR (Log Area Ratio) is used as a method of interpolating linear prediction coefficients.
o: Interpolation using a logarithmic conversion type (logarithmic cross-sectional ratio) of a PARCOR coefficient is used. That is, the linear prediction coefficient is converted into the PARCOR coefficient, and the LAR is obtained from the PARCOR coefficient by the following equation (1).

【0007】[0007]

【数1】 (Equation 1)

【0008】そしてLARの上で線形補間を行い、補間
結果を(1)式の逆変換によりPARCOR係数に変換
してサブフレーム単位の線形予測係数を求める。
[0008] Then, linear interpolation is performed on the LAR, and the interpolation result is converted into a PARCOR coefficient by the inverse conversion of equation (1) to obtain a linear prediction coefficient in subframe units.

【0009】ここでLARについて説明する。Here, the LAR will be described.

【0010】PARCOR係数は、相関値を表し、その
値は−1〜+1を取るが、PARCOR係数の次数によ
りその分布に偏りが存在する為、偏りの大きい2次まで
のPARCOR係数に関して非線形変換を施して補間を
行う。ここで、(1)式で示すgmの2倍、即ち2gm
をLARと呼ぶ。
The PARCOR coefficient represents a correlation value, and its value ranges from -1 to +1. However, since there is a bias in the distribution due to the order of the PARCOR coefficient, nonlinear transformation is performed on the PARCOR coefficient up to the second order having a large bias. To perform interpolation. Here, twice the gm shown in the equation (1), that is, 2 gm
Is called LAR.

【0011】図5は、PARCOR係数からLARの変
換結果を示す。図5に示すように、LARは、±1付近
のPARCOR係数に関しては敏感な変換特性を持つの
で、このLAR変換を予め施すことにより補間誤差は減
少する。また、中高次のPARCOR係数は偏在が少な
く0付近に分散している。LARは0付近のPARCO
R係数に関しては線形に近い変換を施す為、中高次のP
ARCOR係数の特性にも合致する。
FIG. 5 shows a conversion result of PAR to LAR from a PARCOR coefficient. As shown in FIG. 5, since the LAR has a sensitive conversion characteristic with respect to the PARCOR coefficient near ± 1, the interpolation error is reduced by performing the LAR conversion in advance. Further, the middle and high order PARCOR coefficients are less ubiquitous and are dispersed around zero. LAR is PARCO near 0
As for the R coefficient, a nearly linear conversion is performed,
It also matches the characteristics of the ARCOR coefficient.

【0012】[0012]

【発明が解決しようとする課題】しかしながら、上述し
た従来の技術では、現在、線形予測係数の補間において
CELPで一般的に使用されているLARは、補間誤差
は少ないが対数を使用する必要があるため、ディジタル
・シグナル・プロセッサ(DSP)上で実現した場合に
計算量が多くなるという問題点があった。
However, in the above-mentioned conventional technology, the LAR generally used in CELP in the interpolation of the linear prediction coefficient at present has a small interpolation error but needs to use a logarithm. For this reason, there is a problem in that the amount of calculation increases when implemented on a digital signal processor (DSP).

【0013】本発明の目的は、上記従来の技術における
問題点に鑑み、DSP上で実現しても計算量を大幅に減
少することができる線形予測係数補間装置を提供するこ
とにある。
SUMMARY OF THE INVENTION An object of the present invention is to provide a linear prediction coefficient interpolation apparatus which can greatly reduce the amount of calculation even when implemented on a DSP in view of the above-mentioned problems in the conventional technology.

【0014】[0014]

【課題を解決するための手段】本発明の目的は、一定時
間長の入力音声信号から得られた所定次数のPARCO
R係数を双曲線変換する変換手段と、変換手段に接続さ
れており双曲線変換された変換結果を線形補間する補間
手段と、補間手段に接続されており線形補間された線形
補間結果を逆変換する逆変換手段とを備える線形予測係
数補間装置によって達成される。
SUMMARY OF THE INVENTION An object of the present invention is to provide a PARCO of a predetermined order obtained from an input audio signal of a fixed time length.
Conversion means for hyperbolically converting the R coefficient, interpolation means connected to the conversion means for linearly interpolating the result of the hyperbolic conversion, and inverse means connected to the interpolation means for inversely converting the linearly interpolated linear interpolation result This is achieved by a linear prediction coefficient interpolation device including a conversion unit.

【0015】本発明の線形予測係数補間装置では、双曲
線変換手段は、所定次数のPARCOR係数が±1の値
に近付く程、急傾斜を持つように双曲線変換を行うよう
に構成してもよい。
In the linear predictive coefficient interpolating apparatus according to the present invention, the hyperbolic transform means may be configured to perform the hyperbolic transform such that the closer the PARCOR coefficient of a predetermined order approaches the value of ± 1, the steeper the slope.

【0016】[0016]

【作用】本発明の線形予測係数補間装置では、変換手段
は一定時間長の入力音声信号から得られた所定次数のP
ARCOR係数を双曲線変換し、補間手段は双曲線変換
された変換結果を線形補間し、逆変換手段は線形補間さ
れた線形補間結果を逆変換する。
In the linear predictive coefficient interpolating apparatus according to the present invention, the converting means includes a predetermined-order P of a predetermined order obtained from an input audio signal having a fixed time length.
The ARCOR coefficient is hyperbolically transformed, the interpolation means linearly interpolates the hyperbolically transformed result, and the inverse transformation means inversely transforms the linearly interpolated linear interpolation result.

【0017】本発明の線形予測係数補間装置では、双曲
線変換手段は、所定次数のPARCOR係数が±1の値
に近付く程、急傾斜を持つように双曲線変換する。
In the linear predictive coefficient interpolating apparatus according to the present invention, the hyperbolic conversion means performs hyperbolic conversion so as to have a steep slope as the predetermined order PARCOR coefficient approaches a value of ± 1.

【0018】[0018]

【実施例】以下、図面を参照して本発明の線形予測係数
補間装置の実施例を説明する。
BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a block diagram showing an embodiment of a linear prediction coefficient interpolation apparatus according to the present invention.

【0019】図1は、本発明の線形予測係数補間装置で
ある予測係数補間部の一実施例を示すブロック図であ
る。
FIG. 1 is a block diagram showing an embodiment of a prediction coefficient interpolation section which is a linear prediction coefficient interpolation apparatus according to the present invention.

【0020】図2は、図1の主要部を備えたCELP方
式の符号化復号化装置の一実施例の構成を示すブロック
図である。
FIG. 2 is a block diagram showing the configuration of an embodiment of a CELP encoding / decoding apparatus having the main parts of FIG.

【0021】ここで、図1の説明を行う前に、図2の符
号化復号化装置を参照して、図1の予測係数補間部の役
割を示す。
Before explaining FIG. 1, the role of the prediction coefficient interpolation unit in FIG. 1 will be described with reference to the encoding / decoding apparatus in FIG.

【0022】まず、図2の符号化部を説明する。First, the encoding unit shown in FIG. 2 will be described.

【0023】図2の符号化部では、線形予測分析(短期
予測)部1において、サンプリング周波数fsでサンプ
リングされたディジタル入力信号s(t)の線形予測分
析があるフレーム周期で行われ、量子化されたフレーム
単位のPARCOR係数が求められる。ここで、tはサ
ンプル時点を示す。
In the encoding unit shown in FIG. 2, the linear prediction analysis (short-term prediction) unit 1 performs linear prediction analysis of the digital input signal s (t) sampled at the sampling frequency fs at a certain frame period, and performs quantization. The obtained PARCOR coefficient is determined for each frame. Here, t indicates the sampling time.

【0024】その後、予測係数補間部6(図1参照)中
の、変換手段である双曲線変換部61において、低次の
PARCOR係数の偏在を緩和する変換を行い、それら
の変換結果を補間手段である線形補間部62にて線形補
間を行う。その後、逆変換手段である双曲線逆変換部6
3にて補間結果の逆変換を行い、サブフレーム単位の補
間PARCOR係数を求める。
Thereafter, in the prediction coefficient interpolator 6 (see FIG. 1), a hyperbolic converter 61, which is a conversion means, performs a conversion for alleviating the uneven distribution of low-order PARCOR coefficients, and converts the conversion results by the interpolation means. A certain linear interpolation unit 62 performs linear interpolation. Thereafter, a hyperbolic inverse transform unit 6 as an inverse transform means
In step 3, the inverse conversion of the interpolation result is performed, and an interpolation PARCOR coefficient for each subframe is obtained.

【0025】聴覚重み付けフィルタ2は、式(2)で示
す伝達関数W(z)を持つ。
The auditory weighting filter 2 has a transfer function W (z) represented by equation (2).

【0026】[0026]

【数2】 (Equation 2)

【0027】ここで、α(m) i (0≦m<M,0<i≦
P)は第mサブフレームのi次の補間後の線形予測係数
を表し、Mは1フレームに含まれるサブフレーム数を表
す。
Here, α (m) i (0 ≦ m <M, 0 <i ≦
P) represents the ith-order interpolated linear prediction coefficient of the m-th subframe, and M represents the number of subframes included in one frame.

【0028】つまり、聴覚重み付けフィルタ2は、式
(3)に基づいて入力信号の残差信号を得る逆フィルタ
201と、
That is, the auditory weighting filter 2 comprises: an inverse filter 201 for obtaining a residual signal of the input signal based on the equation (3);

【0029】[0029]

【数3】 (Equation 3)

【0030】式(4)に基づいて重み付け線形予測フィ
ルタ202と、
A weighted linear prediction filter 202 based on equation (4)

【0031】[0031]

【数4】 (Equation 4)

【0032】からなり、入力信号s(t)のスペクトル
の谷の部分を強調させた信号u(t)を決める。
The signal u (t) is formed by emphasizing the valley portion of the spectrum of the input signal s (t).

【0033】ここで、λはスペクトルの谷の部分をどれ
だけ強調するかを決定するパラメータであり、0に近い
ほど谷の部分が強調される。この信号u(t)にできる
だけ似た信号(聴覚重み付けされた合成信号)u′
(t)を合成するように符号化が行われる。この処理は
サブフレーム単位で行われる。1フレームあたりのサン
プル数をFとする。
Here, λ is a parameter for determining how much the valley portion of the spectrum is emphasized, and the valley portion is emphasized as it approaches 0. A signal as similar as possible to this signal u (t) (a composite signal weighted by hearing) u ′
Encoding is performed to synthesize (t). This processing is performed in subframe units. The number of samples per frame is F.

【0034】この聴覚重み付けフィルタ2により、後に
説明する合成信号s′(t)はパワーの小さいスペクト
ルほど入力信号s(t)との誤差が小さくなり、聴覚の
マスキング特性によりマスクされ難いこれらのスペクト
ル成分の雑音を小さくすることができるので、聴覚的に
合成音質は良くなる。
With the auditory weighting filter 2, the error of the synthesized signal s' (t), which will be described later, from the input signal s (t) decreases as the power of the spectrum decreases, and these spectra are hard to be masked by the masking characteristics of the auditory sense. Since the noise of the component can be reduced, the synthesized sound quality is improved audibly.

【0035】コードブック3には、励起信号ベクトルが
N個(ここで、Nは正の整数)入っており、この中の一
つの励起信号ベクトルcj(t)(0≦j<N)は、乗
算器4によりγ倍され、ピッチ予測フィルタ5でピッチ
成分が付け加えられ、重み付け合成フィルタ7(伝達関
数はフィルタ202と同じ)を通ることにより、聴覚重
み付けされた合成信号u′j(t)が得られる。ここ
で、最適な励起信号ベクトルcj(t)を選択する為に
AbS(Analysis by Synthesi
s)法を用いる。
The codebook 3 contains N excitation signal vectors (where N is a positive integer), and one of the excitation signal vectors cj (t) (0 ≦ j <N) is Multiplied by γ by the multiplier 4, the pitch component is added by the pitch prediction filter 5 and passed through the weighting synthesis filter 7 (the transfer function is the same as that of the filter 202), so that the perceptually weighted synthesized signal u′j (t) is obtained. can get. Here, in order to select the optimal excitation signal vector cj (t), AbS (Analysis by Synthesis) is used.
s) Method is used.

【0036】図2においてAbS法を説明する。コード
ブック3中の励起信号ベクトルcj(t)が乗算器4で
利得γによる乗算が行われ、ピッチ予測フィルタ5でピ
ッチ成分が付加される。その後、重み付け合成フィルタ
7により合成音声信号u′j(t)が生成される。合成
音声信号とターゲットの入力音声信号u(t)の差分が
減算器8で計算され、誤差信号ej(t)が生成され
る。この誤差信号ej(t)のパワーPjがパワー計算
部9によって式(5)に基づいて計算される。
The AbS method will be described with reference to FIG. The multiplier 4 multiplies the excitation signal vector cj (t) in the codebook 3 by the gain γ, and the pitch prediction filter 5 adds a pitch component. After that, the weighted synthesis filter 7 generates a synthesized speech signal u′j (t). The difference between the synthesized voice signal and the input voice signal u (t) of the target is calculated by the subtracter 8, and an error signal ej (t) is generated. The power Pj of the error signal ej (t) is calculated by the power calculator 9 based on equation (5).

【0037】[0037]

【数5】 (Equation 5)

【0038】そして、このパワーPjが最小となるコー
ドブック3の励起信号ベクトルcj、γ、ピッチ予測フ
ィルタの係数をエラー最小化部10で検索する。
Then, the error minimizing unit 10 searches for the excitation signal vectors cj, γ of the codebook 3 and the coefficients of the pitch prediction filter in which the power Pj is minimized.

【0039】線形予測係数、励起信号のインデックス
j、利得γ、ピッチ予測フィルタの係数、ピッチ長が符
号化・マルチプレクサ部11で符号化、マルチプレクサ
化されて伝送路12に送られる。この伝送路12とし
て、無線系、有線系、蓄積系がある。
The linear prediction coefficient, the index j of the excitation signal, the gain γ, the coefficient of the pitch prediction filter, and the pitch length are encoded and multiplexed by the encoding / multiplexing section 11 and sent to the transmission line 12. The transmission path 12 includes a wireless system, a wired system, and a storage system.

【0040】次に、図2の復号化部を説明する。Next, the decoding unit shown in FIG. 2 will be described.

【0041】復号化部では、デマルチプレクサ・復号化
部13において、伝送された符号列がデマルチプレク
ス、復号化され、線形予測係数、励起信号のインデック
スj、利得γ、ラグ(ピッチ長)、ピッチ予測フィルタ
の係数が得られる。符号化部のコードブック3と同じ励
起信号ベクトルを持つコードブック14の中のjで示さ
れる励起信号ベクトルcj(t)が乗算器15によりγ
倍され、符号化部のピッチ予測フィルタ5と同じ構造の
ピッチ予測フィルタ16でピッチ成分が付加され、更
に、式(6)で示される伝達関数F(z)
In the decoding unit, the transmitted code string is demultiplexed and decoded in the demultiplexer / decoding unit 13, and the linear prediction coefficient, the index j of the excitation signal, the gain γ, the lag (pitch length), The pitch prediction filter coefficients are obtained. An excitation signal vector cj (t) indicated by j in a codebook 14 having the same excitation signal vector as the codebook 3 of the encoding unit is converted by the multiplier 15 into γ.
The pitch component is added by a pitch prediction filter 16 having the same structure as that of the pitch prediction filter 5 of the encoding unit, and further, a transfer function F (z) represented by Expression (6) is added.

【0042】[0042]

【数6】 (Equation 6)

【0043】を持つ線形予測フィルタ(合成フィルタ)
17を通ることにより、合成信号s′(t)が得られ
る。式(6)で用いられる線形予測係数α(m) i は、伝
送されたフレーム毎の線形予測係数を予測係数補間部1
8において各サブフレーム毎に補間したものである。
Linear prediction filter (synthesis filter) having
17, the synthesized signal s' (t) is obtained. The linear prediction coefficient α (m) i used in the equation (6) is obtained by calculating the linear prediction coefficient for each transmitted frame by the prediction coefficient interpolation unit 1
In FIG. 8, interpolation is performed for each subframe.

【0044】予測係数補間部18は予測係数補間部6と
同様の構造をしており、双曲線変換を施した後、線形補
間を行い、その後、双曲線逆変換を行いサブフレーム毎
のPARCOR係数を求める。
The prediction coefficient interpolation unit 18 has the same structure as that of the prediction coefficient interpolation unit 6, and performs a hyperbolic transformation, performs a linear interpolation, and then performs a hyperbolic inverse transformation to obtain a PARCOR coefficient for each subframe. .

【0045】次に、図1の予測係数補間部6を詳細に説
明する。
Next, the prediction coefficient interpolation unit 6 of FIG. 1 will be described in detail.

【0046】図2の短期予測部1では1フレームの音声
区間毎にP次(Pは正の整数)のPARCOR係数を求
める。その後、PARCOR係数kj(j=1〜P)を
量子化する。以降、この量子化したPARCOR係数を
使用する。
The short-term prediction unit 1 in FIG. 2 obtains a P-order (P is a positive integer) PARCOR coefficient for each voice section of one frame. Thereafter, the PARCOR coefficient kj (j = 1 to P) is quantized. Hereinafter, this quantized PARCOR coefficient is used.

【0047】予測係数補間部6では直前のフレームで求
めたPARCOR係数と現在のフレームで求めたPAR
COR係数との線形補間を行なうことによりM個(Mは
正の整数)のサブフレーム単位のPARCOR係数を求
める。この線形補間PARCOR係数は、低次のPAR
COR係数については双曲線変換部61で変換し、その
結果を線形補間部62で補間し、その後、双曲線逆変換
部63で逆変換することにより得る。また、中・高次の
PARCOR係数については線形補間部62で線形補間
のみ行う。
The prediction coefficient interpolating unit 6 calculates the PAROR coefficient obtained in the immediately preceding frame and the PAR coefficient obtained in the current frame.
By performing linear interpolation with COR coefficients, M (M is a positive integer) PARCOR coefficients in subframe units are obtained. This linearly interpolated PARCO coefficient is calculated using the low-order PAR
The COR coefficient is converted by the hyperbolic conversion unit 61, the result is interpolated by the linear interpolation unit 62, and then inversely converted by the hyperbolic inverse conversion unit 63. In addition, only the linear interpolation is performed by the linear interpolation unit 62 for the middle and higher order PARCOR coefficients.

【0048】上記方法により決定されたPARCOR係
数を線形予測係数αi(i=0〜P)に変換し、各々の
サブフレームで求めた線形予測係数を使用する。但し、
1次のPARCOR係数k1の補間は、各フレームのk
1を下記の式(7)で変換した後に線形補間し、式
(8)により逆変換する。
The PARCOR coefficient determined by the above method is converted into a linear prediction coefficient αi (i = 0 to P), and the linear prediction coefficient obtained in each subframe is used. However,
Interpolation of the first-order PARCOR coefficient k1 is performed by calculating k for each frame.
1 is converted by the following equation (7), linearly interpolated, and inversely converted by the equation (8).

【0049】[0049]

【数7】 (Equation 7)

【0050】[0050]

【数8】 (Equation 8)

【0051】上記式(7)及び式(8)により、+1に
偏在するk1は図3に示されるように分配される。この
変換式において、定数aの値が大きくなる程±1付近で
の傾斜が大きくなる。2次のPARCOR係数も同様に
変換、補間可能である。また、±1に非常に近い値のP
ARCOR係数をLARで表現すると非常に大きな値と
なり、大きなダイナミックレンジが必要となるが、この
変換式によればそのようなPARCOR係数を変換して
小さなダイナミックレンジで表現可能である。
According to the above equations (7) and (8), k1 unevenly distributed to +1 is distributed as shown in FIG. In this conversion formula, as the value of the constant a increases, the inclination around ± 1 increases. The secondary PARCOR coefficient can be similarly converted and interpolated. In addition, a P value very close to ± 1
When the ARCOR coefficient is expressed by the LAR, the value becomes a very large value, and a large dynamic range is required. According to this conversion formula, such a PARCOR coefficient can be converted and expressed with a small dynamic range.

【0052】次に、図4のフローチャートを参照して、
本実施例によるPARCOR係数補間処理の動作を説明
する。
Next, referring to the flowchart of FIG.
The operation of the PARCOR coefficient interpolation processing according to the present embodiment will be described.

【0053】まず、n番目のフレームのPARCOR係
数ki(次数i=1〜P)が入力処理で予測係数補間部
6(図1)に入力され(401)、PARCOR係数の
次数を表す変換iを1に初期化する(402)。PAR
COR係数の次数が判定され(403)、低次のPAR
COR係数は式(7)によるyi(n)への変換が行わ
れ(404)、中高次のPARCOR係数はyi(n)
への無変換代入が行われる(405)。そして、次数を
表す変数iをインクリメントする(406)。全ての次
数のPARCOR係数におけるyi(n)を求める。そ
の処理の終了を判定する(407)。その後、yi
(n)は前フレームのyi(n−1)と補間されてy
i′(n)が求まる(408)。その補間式を式(9)
に示す。
First, the PARCOR coefficient ki (order i = 1 to P) of the n-th frame is input to the prediction coefficient interpolator 6 (FIG. 1) in the input processing (401), and the transform i representing the order of the PARCOR coefficient is calculated. Initialized to 1 (402). PAR
The order of the COR coefficient is determined (403) and the lower order PAR is determined.
The COR coefficient is converted to yi (n) according to equation (7) (404), and the middle-high order PARCOR coefficient is yi (n).
Is performed (405). Then, the variable i representing the order is incremented (406). Find yi (n) in the PARCOR coefficients of all orders. The end of the process is determined (407). Then yi
(N) is interpolated with yi (n-1) of the previous frame to obtain y
i '(n) is obtained (408). Equation (9)
Shown in

【0054】[0054]

【数9】 (Equation 9)

【0055】再び図4に戻って、前フレームのPARC
OR係数yi(n−1)を現在のフレームのPARCO
R係数yi(n)により更新して(409)、上記ステ
ップ402と同様に、次数を表す変数iに初期値1を代
入する(410)。
Referring back to FIG. 4, the PARC of the previous frame
The OR coefficient yi (n-1) is calculated using the PARCO of the current frame.
It is updated with the R coefficient yi (n) (409), and the initial value 1 is substituted for the variable i representing the degree (410), as in the above step 402.

【0056】その処理後、低次のyi′(n)は双曲線
変換(式(8))されてPARCOR係数へと変換され
る(411、412)。また、中高次のyi′(n)は
そのままPARCOR係数に代入される(413)。こ
れらの変換処理は全ての次数のyi′(n)についてな
され、その後、次数を表す変数iをインクリメントして
(414)、その処理終了を判定する(415)。これ
により求まったPARCOR係数がサブフレーム単位の
処理に適用される(416)。
After the processing, the low-order yi '(n) is subjected to hyperbolic transformation (Equation (8)) and transformed into PARCOR coefficients (411, 412). The middle and high order yi '(n) is directly substituted for the PARCOR coefficient (413). These conversion processes are performed for all the orders yi '(n), and thereafter, the variable i representing the order is incremented (414), and the end of the process is determined (415). The PARCOR coefficient thus obtained is applied to the processing on a subframe basis (416).

【0057】図4のフローチャートにおいて、ステップ
402から407までが図1の双曲線変換部61、ステ
ップ408が図1の線形補間部62、ステップ409か
ら415までが図1の双曲線逆変換部63で処理され
る。
In the flowchart of FIG. 4, steps 402 to 407 are processed by the hyperbolic converter 61 of FIG. 1, steps 408 are processed by the linear interpolation unit 62 of FIG. 1, and steps 409 to 415 are processed by the inverse hyperbolic converter 63 of FIG. Is done.

【0058】双曲線変換ステップ404及び双曲線逆変
換ステップ412の変換式として、本実施例では式
(7)及び式(8)に示す双曲線関数を用いたが、図3
に示すような±1付近に偏在するPARCOR係数を分
配変換する特性を持つ関数ならば、補間結果は改善され
るので、このような特性を持つ高次の曲線を用いても良
いが実現の際の計算量の観点からは双曲線関数が適当で
ある。なぜなら、双曲線関数であれば、その逆変換も簡
易であり計算量の点からも適していると判断できる。
In this embodiment, the hyperbolic functions shown in equations (7) and (8) are used as the conversion equations in the hyperbolic transformation step 404 and the hyperbolic inverse transformation step 412.
If the function has a characteristic of distributing and transforming the PARCOR coefficient unevenly distributed near ± 1 as shown in (1), the interpolation result is improved, and a higher-order curve having such a characteristic may be used. A hyperbolic function is appropriate from the viewpoint of the computational complexity of. The reason is that if the hyperbolic function is used, its inverse transformation is simple and it can be determined that it is suitable from the viewpoint of the amount of calculation.

【0059】上述したように、本発明では、線形予測係
数を補間する前にその分布を考慮した線形変換を施すこ
とによりLARに変換することなく良い補間特性を示
し、またLARに変換しないため計算量を大幅に減ずる
ことができる。即ち、補間誤差の影響削減の効果とし
て、実施例において説明したように、±1付近に偏在す
る提示PARCOR係数の補間による誤差を、その分布
を考慮した変換を行うことにより削減する。また、計算
量削減の効果として、本方式による線形予測係数の補間
ではLARの計算に必要である対数の計算が不必要とな
り、この方式を実際に計算機上で実現する際に計算量を
減少できる。
As described above, according to the present invention, a linear interpolation taking into account the distribution of the linear prediction coefficients before interpolation is performed, thereby exhibiting good interpolation characteristics without conversion to LAR. The amount can be greatly reduced. That is, as an effect of reducing the influence of the interpolation error, as described in the embodiment, the error due to the interpolation of the presented PARCOR coefficient unevenly distributed around ± 1 is reduced by performing the conversion in consideration of the distribution. Further, as an effect of reducing the amount of calculation, in the interpolation of the linear prediction coefficient according to the present method, the calculation of the logarithm required for the calculation of the LAR becomes unnecessary. .

【0060】[0060]

【発明の効果】本発明の線形予測係数補間装置は、一定
時間長の入力音声信号から得られた所定次数のPARC
OR係数を双曲線変換する変換手段と、変換手段に接続
されており双曲線変換された変換結果を線形補間する補
間手段と、補間手段に接続されており線形補間された線
形補間結果を逆変換する逆変換手段とを備えるので、L
ARの計算に必要である対数の計算が不必要となり、こ
の方式を実際に計算機上で実現する際に計算量を減少で
きる。
The linear predictive coefficient interpolating apparatus according to the present invention provides a PARC of a predetermined order obtained from an input speech signal of a fixed time length.
Conversion means for hyperbolically transforming the OR coefficient, interpolation means connected to the conversion means for linearly interpolating the result of the hyperbolic transformation, and inverse means for inversely converting the linearly interpolated linear interpolation result connected to the interpolation means Conversion means,
The calculation of the logarithm required for the calculation of the AR becomes unnecessary, and the amount of calculation can be reduced when this method is actually realized on a computer.

【0061】また、本発明の線形予測係数補間装置で
は、双曲線変換手段は、所定次数のPARCOR係数が
±1の値に近付く程、急傾斜を持つように双曲線変換を
行うので、±1付近に偏在する提示PARCOR係数の
補間による誤差を、その分布を考慮した変換を行うこと
により削減できる。
In the linear predictive coefficient interpolating apparatus according to the present invention, the hyperbolic conversion means performs the hyperbolic conversion so as to have a steep slope as the predetermined-order PARCOR coefficient approaches the value of ± 1, so that it is close to ± 1. An error due to interpolation of unevenly distributed presentation PARCOR coefficients can be reduced by performing conversion in consideration of the distribution.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の線形予測係数補間装置の一実施例の構
成を示すブロック図である。
FIG. 1 is a block diagram illustrating a configuration of an embodiment of a linear prediction coefficient interpolation device according to the present invention.

【図2】図1の線形予測係数補間部を備えた音声符号化
復号化装置の一構成例を示すブロック図である。
FIG. 2 is a block diagram illustrating a configuration example of a speech encoding / decoding device including the linear prediction coefficient interpolation unit illustrated in FIG. 1;

【図3】図1の線形予測係数補間部によるPARCOR
係数の分布を表す説明図である。
FIG. 3 is a diagram showing a PARCOR by a linear prediction coefficient interpolation unit shown in FIG. 1;
FIG. 9 is an explanatory diagram illustrating a distribution of coefficients.

【図4】図1の線形予測係数補間部によるPARCOR
係数補間処理の動作を説明するためのフローチャートで
ある。
FIG. 4 is a diagram showing a PARCOR by the linear prediction coefficient interpolation unit shown in FIG. 1;
It is a flow chart for explaining operation of coefficient interpolation processing.

【図5】PARCORからLARへの変換結果の説明図
である。
FIG. 5 is an explanatory diagram of a conversion result from PARCOR to LAR.

【符号の説明】[Explanation of symbols]

1 短期予測部 2 聴覚重み付けフィルタ 3,14 コードブック 4,15 乗算器 5,16 ピッチ予測フィルタ 6,18 予測係数補間部 7,202 重み付け合成フィルタ 8 減算器 9 パワー計算部 10 エラー最小化部 11 符号化、マルチプレクサ部 12 伝送路 13 デマルチプレクサ、復号化部 17 合成フィルタ 61 双曲線変換部 62 線形補間部 63 双曲線逆変換部 201 線形予測フィルタ DESCRIPTION OF SYMBOLS 1 Short-term prediction part 2 Perceptual weighting filter 3,14 Codebook 4,15 Multiplier 5,16 Pitch prediction filter 6,18 Prediction coefficient interpolation part 7,202 Weighting synthesis filter 8 Subtractor 9 Power calculation part 10 Error minimization part 11 Encoding and multiplexer unit 12 Transmission path 13 Demultiplexer, decoding unit 17 Synthesis filter 61 Hyperbolic transformation unit 62 Linear interpolation unit 63 Hyperbolic inverse transformation unit 201 Linear prediction filter

フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 13/00 G10L 19/00 - 19/14 H03M 7/30 H04B 14/04 Continuation of front page (58) Fields investigated (Int. Cl. 7 , DB name) G10L 13/00 G10L 19/00-19/14 H03M 7/30 H04B 14/04

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 一定時間長の入力音声信号から得られた
所定次数のパーコール係数を双曲線変換する変換手段
と、該変換手段に接続されており該双曲線変換された変
換結果を線形補間する補間手段と、該補間手段に接続さ
れており該線形補間された線形補間結果を逆変換する逆
変換手段とを備えることを特徴とする線形予測係数補間
装置。
1. A conversion means for performing hyperbolic conversion of a predetermined order Percoll coefficient obtained from an input audio signal having a predetermined time length, and an interpolation means connected to the conversion means for linearly interpolating the hyperbolically converted result. A linear prediction coefficient interpolation apparatus, comprising: an inverse conversion means connected to the interpolation means for inversely converting the linearly interpolated linear interpolation result.
【請求項2】 前記双曲線変換手段は、前記所定次数の
パーコール係数が±1の値に近付く程、急傾斜を持つよ
うに双曲線変換を行うことを特徴とする請求項1に記載
の線形予測係数補間装置。
2. The linear prediction coefficient according to claim 1, wherein the hyperbolic transformation means performs the hyperbolic transformation so as to have a steep slope as the Percoll coefficient of the predetermined order approaches a value of ± 1. Interpolator.
JP05217373A 1993-09-01 1993-09-01 Linear prediction coefficient interpolator Expired - Fee Related JP3138574B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05217373A JP3138574B2 (en) 1993-09-01 1993-09-01 Linear prediction coefficient interpolator

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05217373A JP3138574B2 (en) 1993-09-01 1993-09-01 Linear prediction coefficient interpolator

Publications (2)

Publication Number Publication Date
JPH0774642A JPH0774642A (en) 1995-03-17
JP3138574B2 true JP3138574B2 (en) 2001-02-26

Family

ID=16703161

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05217373A Expired - Fee Related JP3138574B2 (en) 1993-09-01 1993-09-01 Linear prediction coefficient interpolator

Country Status (1)

Country Link
JP (1) JP3138574B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009072571A1 (en) * 2007-12-04 2009-06-11 Nippon Telegraph And Telephone Corporation Coding method, device using the method, program, and recording medium
JP4783412B2 (en) * 2008-09-09 2011-09-28 日本電信電話株式会社 Signal broadening device, signal broadening method, program thereof, and recording medium thereof
JP5253518B2 (en) * 2008-12-22 2013-07-31 日本電信電話株式会社 Encoding method, decoding method, apparatus thereof, program, and recording medium
JP5845725B2 (en) * 2011-08-26 2016-01-20 ヤマハ株式会社 Signal processing device

Also Published As

Publication number Publication date
JPH0774642A (en) 1995-03-17

Similar Documents

Publication Publication Date Title
EP0673014B1 (en) Acoustic signal transform coding method and decoding method
JP4662673B2 (en) Gain smoothing in wideband speech and audio signal decoders.
EP1619664B1 (en) Speech coding apparatus, speech decoding apparatus and methods thereof
JP3566652B2 (en) Auditory weighting apparatus and method for efficient coding of wideband signals
RU2255380C2 (en) Method and device for reproducing speech signals and method for transferring said signals
JP4550289B2 (en) CELP code conversion
US20090204397A1 (en) Linear predictive coding of an audio signal
MXPA96004161A (en) Quantification of speech signals using human auiditive models in predict encoding systems
JP3186007B2 (en) Transform coding method, decoding method
JP4603485B2 (en) Speech / musical sound encoding apparatus and speech / musical sound encoding method
JPH09152896A (en) Sound path prediction coefficient encoding/decoding circuit, sound path prediction coefficient encoding circuit, sound path prediction coefficient decoding circuit, sound encoding device and sound decoding device
EP1672619A2 (en) Speech coding apparatus and method therefor
JP3087814B2 (en) Acoustic signal conversion encoding device and decoding device
JPH0341500A (en) Low-delay low bit-rate voice coder
JP3684751B2 (en) Signal encoding method and apparatus
EP1619666B1 (en) Speech decoder, speech decoding method, program, recording medium
JP3138574B2 (en) Linear prediction coefficient interpolator
JP3270922B2 (en) Encoding / decoding method and encoding / decoding device
WO1997031367A1 (en) Multi-stage speech coder with transform coding of prediction residual signals with quantization by auditory models
JP2968109B2 (en) Code-excited linear prediction encoder and decoder
JP3163206B2 (en) Acoustic signal coding device
JP3099876B2 (en) Multi-channel audio signal encoding method and decoding method thereof, and encoding apparatus and decoding apparatus using the same
JP4618823B2 (en) Signal encoding apparatus and method
JP3520955B2 (en) Acoustic signal coding
JPH05232995A (en) Method and device for encoding analyzed speech through generalized synthesis

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees