JPS6342532A - Audio encoding device - Google Patents

Audio encoding device

Info

Publication number
JPS6342532A
JPS6342532A JP18532986A JP18532986A JPS6342532A JP S6342532 A JPS6342532 A JP S6342532A JP 18532986 A JP18532986 A JP 18532986A JP 18532986 A JP18532986 A JP 18532986A JP S6342532 A JPS6342532 A JP S6342532A
Authority
JP
Japan
Prior art keywords
audio signal
auxiliary information
audio
frequency
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP18532986A
Other languages
Japanese (ja)
Inventor
Tomohiko Taniguchi
智彦 谷口
Hidehira Iseda
衡平 伊勢田
Yoshihiro Tomita
吉弘 富田
Shigeyuki Umigami
重之 海上
Shoji Tominaga
昭治 富永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP18532986A priority Critical patent/JPS6342532A/en
Publication of JPS6342532A publication Critical patent/JPS6342532A/en
Pending legal-status Critical Current

Links

Landscapes

  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PURPOSE:To considerably improve the information compression ratio by encoding a low band component and using a representative value in every prescribed audio section of respective time series data of plural filter coefficients obtained from an adaptive equalizing filter as auxiliary information for high band reproducing. CONSTITUTION:When an audio signal X(n) is inputted, a thinning LPF 111 eliminates every other sample point of the audio signal X(n) to generate a low band audio signal XL. An encoding part 112 encodes the low band audio signal XL to generate an encoded low band audio signal EL. When an approximated audio signal X1'(n) is inputted to an ADF 121, the ADF 121 outputs time series data of each filter coefficient, namely, auxiliary information Hau for high band reproducing, and this information is stored in a coefficient memory 131 in frame units. A coefficient converting part 133 converts and quantizes inputted representation auxiliary information Au to a known LSP parameter tolerant of quantization. Thus, information whose quantity is considerably larger than that in a conventional system is compressed to improve the transmission rate.

Description

【発明の詳細な説明】 〔概 要〕 高域成分の補償を必要とする音声符号化方式において、
低域成分は符号化し、高域再生用の補助情報として、適
応等化フィルタから得られる複数のフィルタ係数の各時
系列データの所定音声区間   毎の代表値を用いる様
にする。これにより、情報圧圧縮比を太き(改善すると
共に、高域成分も良好に再生することが出来る。
[Detailed Description of the Invention] [Summary] In a speech coding system that requires compensation of high-frequency components,
The low-frequency component is encoded, and the representative value for each predetermined speech section of each time-series data of a plurality of filter coefficients obtained from the adaptive equalization filter is used as auxiliary information for high-frequency reproduction. As a result, the information pressure compression ratio can be increased (improved), and high frequency components can also be reproduced satisfactorily.

〔産業上の利用分野〕[Industrial application field]

本発明は、音声符号化装置、特に音声信号を低域成分と
高域成分に分割し、低域成分については符号化処理を行
い、高域成分については適応等化フィルタから得られる
高域成分再生に必要な補助情報を用いる音声符号化装置
において、再生される高域成分の品質を良好に保持しつ
つ、高域成分再生に必要な補助情報を効率的に圧縮する
様に改良した音声符号化装置に関する。
The present invention provides an audio encoding device, in particular, divides an audio signal into a low frequency component and a high frequency component, performs encoding processing on the low frequency component, and generates a high frequency component obtained from an adaptive equalization filter for the high frequency component. In a speech encoding device that uses auxiliary information necessary for reproduction, an improved speech code that maintains good quality of the reproduced high-frequency components and efficiently compresses the auxiliary information necessary for high-frequency component reproduction. related to conversion equipment.

〔従来の技術〕[Conventional technology]

音声符号化方式には各種の方式が提案されているが、音
声信号を符号化する場合には、音声の品質を損うことな
(圧縮比が大きくなる様に符号化することが要求される
。一方、音声の品質を決定する支配的な成分が主として
低周波帯域にあることは、良く知られている。
Various methods have been proposed for audio encoding, but when encoding audio signals, it is required to encode in a way that does not impair the quality of the audio (i.e., increases the compression ratio). On the other hand, it is well known that the dominant components that determine the quality of voice are mainly in the low frequency band.

そこで、音声品質を保持しつつ効率良く圧縮する代表的
な音声符号化方式として、音声信号を低域成分と高域成
分に分割し、低域成分については符号化処理を行い、高
域成分については、その再生に必要な補助情報を送る様
にする周波数分割形の音声符号化方式が知られている。
Therefore, as a typical audio encoding method that efficiently compresses audio while maintaining audio quality, the audio signal is divided into low frequency components and high frequency components, the low frequency component is encoded, and the high frequency component is encoded. A frequency division type audio encoding system is known in which auxiliary information necessary for reproduction is sent.

低域成分を主体とする従来の周波数分割形音声符号化方
式として、第5図に示す様な音声符」−化方式が採用さ
れている。
As a conventional frequency division type speech encoding method mainly containing low-frequency components, a speech coding method as shown in FIG. 5 has been adopted.

第5図において、30は符号装置であり、40は復号装
置である。
In FIG. 5, 30 is an encoding device and 40 is a decoding device.

符号装置30において、31は低域符号化手段で、入力
された音声信号Xの低域成分(低域音声信号XL)を符
号化して、符号化低域音声信号ELを生成する。
In the encoding device 30, 31 is a low frequency encoding means that encodes the low frequency component (low frequency audio signal XL) of the input audio signal X to generate an encoded low frequency audio signal EL.

32は高域再生補助情報発生手段で、内部に適応等化フ
ィルタ(ADF : Adaptive  Filte
r)  321を備え、再生された近似音声信号X+’
(図示せず)と元の音声信号Xとの誤差が零となる様に
等化処理を行い、その際得られるADF321の等化残
差信号を、高域成分再生用の高域再生補助情報hauと
して出力する。ADF321の等化残差信号は、符号化
処理時のサンプリング周期の時系列データで形成される
32 is a high frequency reproduction auxiliary information generating means, which includes an adaptive equalization filter (ADF).
r) 321 and reproduced approximate audio signal X+'
(not shown) and the original audio signal Output as hau. The equalized residual signal of the ADF 321 is formed from time-series data of the sampling period during encoding processing.

符号装置30は、この様にして生成された符号化低域音
声信号EL及び高域再生補助情報hauを音声符号化情
報として、復号装置40に送る。
The encoding device 30 sends the encoded low frequency audio signal EL and the high frequency reproduction auxiliary information hau generated in this manner to the decoding device 40 as audio encoding information.

復号装置40おいて、41は復号・再生手段で、受信さ
れた符号化低域信号EL’  (ダッシュは符号装置3
0側のELと区別する為で、次のhau’も同様である
)を復号して、符号装置30例の近似る。
In the decoding device 40, reference numeral 41 denotes a decoding/reproducing means, in which the received encoded low frequency signal EL' (the dash indicates the encoder 3
This is to distinguish it from the EL on the 0 side, and the same applies to the next hau'), and the 30 examples of encoding devices approximate it.

42は適応等化フィルタ(ADF’ )で、符号装置3
0側のADF321と同じ構成を有している。ADF’
  42は、受信された高域再生補助情報hau’ に
よりADF’42内の各フィルタ係数を修正し、入力さ
れた近似音声信号X+より、符号装置30例の元の音声
信号Xに対応する音声信号kを再生する。
42 is an adaptive equalization filter (ADF');
It has the same configuration as the ADF 321 on the 0 side. ADF'
42 corrects each filter coefficient in the ADF' 42 using the received high frequency reproduction auxiliary information hau', and generates an audio signal corresponding to the original audio signal X of the 30 encoding devices from the input approximate audio signal X+. Play k.

以上の様に、音声信号の低域成分を主体にして符号化を
行い、音声信号の高域成分についてはADFの等化残差
信号を高域成分再生用の補助情報として送る様にするこ
とにより、音声情報を太きく圧縮すると共に、高域成分
まで良好に再生することが出来る。
As described above, encoding is performed mainly on the low-frequency components of the audio signal, and for the high-frequency components of the audio signal, the equalized residual signal of the ADF is sent as auxiliary information for reproducing the high-frequency components. This makes it possible to thickly compress audio information and to reproduce even high-frequency components favorably.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

第5図に示した従来の音声符号化方式は、大きな情報圧
縮比が得られると共に高域成分まで良好に再生すること
が出来るものである。
The conventional audio encoding method shown in FIG. 5 provides a high information compression ratio and can reproduce even high-frequency components favorably.

然しなから、高域成分再生用の補助情報として用いられ
るADFの制御に関する等化残差信号は、符号化処理時
のサンプリング周期の時系列データの形で生成されるこ
とから、そのデータ量を大きく低下することが出来ず、
この為、圧縮される情報量に限界があるという問題があ
った。
However, since the equalized residual signal related to ADF control used as auxiliary information for high-frequency component reproduction is generated in the form of time-series data of the sampling period during encoding processing, the amount of data cannot be reduced. unable to decrease significantly,
Therefore, there is a problem that there is a limit to the amount of information that can be compressed.

本発明は、第5図に示した従来の音声符号化方式におい
て、高域成分再生用の補助情報のデータ量を大幅に圧縮
することにより、情報圧縮比を太き(すると共に音声信
号の高域成分まで良好に再生することを可能にした音声
符号化方式を提供することを目的とする。
In the conventional audio encoding method shown in FIG. An object of the present invention is to provide a speech encoding method that makes it possible to reproduce satisfactorily even the range components.

〔問題点を解決する為の手段〕[Means for solving problems]

従来の音声符号化方式における前述の問題点を解決する
為に本発明が講じた手段を、第1図を参照して説明する
The means taken by the present invention to solve the above-mentioned problems in the conventional audio encoding system will be explained with reference to FIG.

第1図は、本発明の基本構成をプロ・ツク図で示したも
のである。
FIG. 1 is a block diagram showing the basic configuration of the present invention.

第1図において、10は符号装置で、本発明の音声符号
化処理を行う。
In FIG. 1, numeral 10 is an encoding device that performs the audio encoding process of the present invention.

11は低域符号化手段で、入力された音声信号Xの低域
成分(低域音声信号XL)を符号化して、符号化低域音
声信号ELを生成する。
Reference numeral 11 denotes a low frequency encoding means, which encodes the low frequency component (low frequency audio signal XL) of the input audio signal X to generate an encoded low frequency audio signal EL.

12は高域再生補助情報発生手段で、内部にADF即ち
適応等化フィルタ121を備え、再生された近似音声信
号Xr’ と元の音声信号Xとの誤差が零となる様にA
DF121により等化処理を行ったときにADF 12
1から得られる複数のフィルタ係数の各時系列データを
高域成分再生用の高域再生補助情報Hauとして出力す
る。
Reference numeral 12 denotes a high frequency reproduction auxiliary information generating means, which is equipped with an ADF, that is, an adaptive equalization filter 121, and is configured to adjust A so that the error between the reproduced approximate audio signal Xr' and the original audio signal X becomes zero.
When equalization processing is performed by DF121, ADF12
Each time series data of a plurality of filter coefficients obtained from 1 is output as high frequency reproduction auxiliary information Hau for high frequency component reproduction.

13は代表補助情報発生手段で、所定音声区間毎にその
高域再生補助情報1iauの代表値を求めて高域成分再
生用の代表補助情報篩として出力する。
Reference numeral 13 denotes representative auxiliary information generating means, which obtains a representative value of the high frequency reproduction auxiliary information 1iau for each predetermined audio section and outputs it as a representative auxiliary information sieve for high frequency component reproduction.

〔作 用〕[For production]

音声信号Xが入力されると、低域符号化手段11は、こ
の音声信号Xの低域音声信号XLを符号化して、符号化
低域音声信号ELを生成する。この符号化は、例えば公
知の適応差分P CM (AdapLive  dif
ferential  P CM : A D P C
M)によって行われる。
When the audio signal X is input, the low frequency encoding means 11 encodes the low frequency audio signal XL of the audio signal X to generate an encoded low frequency audio signal EL. This encoding is performed using, for example, the well-known adaptive differential P CM (AdapLive dif
ferential PCM: ADPC
M).

高域再生補助情報発生手段12は、再生された近似音声
信号Xl′と元の音声信号Xとの誤差が零となる様に八
DF12により等化処理を行ったときにADF 121
から得られる複数のフィルタ係数の各時系列データを高
域再生補助情91 Hauとして出力する。ADPCM
により符号化低域音声信号ELを生成した場合、その符
号化処理の過程において低域音声信号の再生信号が生成
されるので、その再生低域信号を利用して前記近似音声
信号に1′を再生することが出来る。
The high frequency reproduction auxiliary information generating means 12 generates an ADF 121 when equalization processing is performed by the eight DFs 12 so that the error between the reproduced approximate audio signal Xl' and the original audio signal X becomes zero.
Each time series data of a plurality of filter coefficients obtained from the filter coefficients is output as high frequency reproduction auxiliary information 91 Hau. ADPCM
When the encoded low-frequency audio signal EL is generated, a reproduced signal of the low-frequency audio signal is generated in the encoding process, so the reproduced low-frequency signal is used to add 1' to the approximate audio signal. It can be played.

高域再生補助情報Hauは、前述の様に、ADF121
の複数のフィルタ係数の各時系列データの形で出力され
るが、代表補助情報発生手段13は、所定音声区間毎に
高域再生補助情報Hauの代表値を各時系列データにつ
いて求め、高域成分再生用の代表補助情91Auとして
出力する。
As mentioned above, the high frequency reproduction auxiliary information Hau is
The representative auxiliary information generating means 13 obtains the representative value of the high frequency reproduction auxiliary information Hau for each predetermined audio section, and calculates the representative value of the high frequency reproduction auxiliary information Hau for each time series data, and It is output as representative auxiliary information 91Au for component reproduction.

以上の様にすることにより、高域成分を良好に再生する
ことが出来ると共に、ADFの等化残差信号を直接利用
した従来方式よりも高域成分再生用の補助情報の情報量
を大幅に圧縮することが出来、従って全体の情報圧縮比
を大きく改善することが出来る。
By doing the above, it is possible to reproduce high-frequency components well, and the amount of auxiliary information for high-frequency component reproduction can be significantly increased compared to the conventional method that directly uses the equalized residual signal of the ADF. Therefore, the overall information compression ratio can be greatly improved.

〔実施例〕〔Example〕

本発明の実施例を、第2図〜第4図を参照して説明する
Embodiments of the present invention will be described with reference to FIGS. 2 to 4.

第2図は本発明の一実施例の構成のブロック説明図、第
3図はADFの説明図、第4図は同実施例の信号スペク
ラム及び信号波形の説明図である。
FIG. 2 is an explanatory block diagram of the configuration of an embodiment of the present invention, FIG. 3 is an explanatory diagram of the ADF, and FIG. 4 is an explanatory diagram of the signal spectrum and signal waveform of the embodiment.

(A)実施例の構成 第2図において、符号装置10、低域符号化手段11、
高域再生補助情報発生手段12、ADF121、代表補
助情報発生手段13については、第1図で説明した通り
である。
(A) Configuration of the embodiment In FIG. 2, an encoding device 10, a low-frequency encoding means 11,
The high frequency reproduction auxiliary information generating means 12, ADF 121, and representative auxiliary information generating means 13 are as described in FIG.

符号装置10の低域符号化手段11において、111は
間引き低域フィルタ(間引きLPF)で、サンプリング
変換することにより低域音声信号XLを生成する。
In the low frequency encoding means 11 of the encoding device 10, 111 is a decimation low pass filter (decimation LPF) which generates a low frequency audio signal XL by performing sampling conversion.

112符号化部で、低域音声信号XLを符号化して符号
化低域音声信号ELを生成する。
The encoder 112 encodes the low frequency audio signal XL to generate an encoded low frequency audio signal EL.

高域再生補助情報発生手段12において、122は近似
音声再生部で、音声信号Xに近似した近似音声信号Xl
’を再生する。
In the high frequency reproduction auxiliary information generating means 12, 122 is an approximate audio reproducing section, which generates an approximate audio signal Xl that approximates the audio signal X.
'Play.'

123は加算器で、元の音声信号XとADF 121の
再生した音声信号Xとの誤差信号eを発生する。
An adder 123 generates an error signal e between the original audio signal X and the audio signal X reproduced by the ADF 121.

代表補助情報発生手段13において、131は係数メモ
リで、ADF121から入力された高域再生補助情報1
auを所定音声区間単位で記憶する。
In the representative auxiliary information generating means 13, 131 is a coefficient memory in which high frequency reproduction auxiliary information 1 inputted from the ADF 121 is stored.
au is stored in units of predetermined audio sections.

132は平均化部で、高域再生補助情fl Hau即ち
各フィルタ係数の時系列データの所定音声区間毎の平均
値から所定音声区間毎の高域再生補助情報の代表値を求
めて代表補助情報へ〇とする。
Reference numeral 132 is an averaging unit that calculates the representative value of the high frequency reproduction auxiliary information fl Hau, that is, the representative value of the high frequency reproduction auxiliary information for each predetermined audio section from the average value for each predetermined audio section of the time series data of each filter coefficient. To 〇.

133は係数変換部で、公知の線スペクトル対(L S
 P : Line  spectrum  pair
)変換処理により代表補助情報Auを変換量子化する。
133 is a coefficient conversion unit which converts a known line spectrum pair (L S
P: Line spectrum pair
) The representative auxiliary information Au is converted and quantized by conversion processing.

第2図の右側は復号装置20で、受信された音声符号化
情報から、音声信号を再生する処理を行う。
On the right side of FIG. 2 is a decoding device 20, which performs a process of reproducing an audio signal from received encoded audio information.

復号装置20おいて、21は複号部で、受信された符号
化低域音声信号EL’(ダッシュは符号装置10側のE
Lと区別する為に付したもので、次に説明するAu′ 
も同様である)を復号して、符号装置10例の低域音声
信号XLに対応する低域音声XLを再生する。
In the decoding device 20, reference numeral 21 denotes a decoding unit, in which the received encoded low-frequency audio signal EL' (the dash indicates E on the encoding device 10 side
This is added to distinguish it from L, and Au′ which will be explained next.
) is decoded to reproduce the low-frequency audio XL corresponding to the low-frequency audio signal XL of the 10 encoding devices.

22は近似音声再生部で、符号装置10例の近生成する
Reference numeral 22 denotes an approximate speech reproduction unit which generates an approximate sound of the 10 encoding devices.

23は係数逆変換部で、LSP変換された代表補助情報
を受信して元の代表補助情!IaAu’を生成する。
23 is a coefficient inverse transformation unit which receives the LSP-converted representative auxiliary information and converts it to the original representative auxiliary information! Generate IaAu'.

24は適応等化フィルタ(ADF’ )で、符号装置1
0側のADF 121と同じ構成を有し、入力された代
表補助情報Au’及び近似音声信号′X+より、元の音
声信号Xに対応する音声信号Xを再生する。
24 is an adaptive equalization filter (ADF');
It has the same configuration as the ADF 121 on the 0 side, and reproduces the audio signal X corresponding to the original audio signal X from the input representative auxiliary information Au' and the approximate audio signal 'X+.

第3図は、ADF’121の一例を示したものである。FIG. 3 shows an example of the ADF'121.

第3図のADF 121において、121al〜121
 a*はZ変換記号で表された遅延要素で、サンプリン
グ周期に等しい時間遅れを生じさせる。
In ADF 121 in FIG. 3, 121al to 121
a* is a delay element represented by a Z-transform symbol, which causes a time delay equal to the sampling period.

12 l b+〜12 l b+はフィルタ係数設定部
で、フィルタ係数a14a、を設定する。121Cは加
算器で、フィルタ係数設定部121b+”121b4の
出力を加算して音声信号X (nlを発生する。
12 l b+ to 12 l b+ are filter coefficient setting units that set filter coefficients a14a. 121C is an adder which adds the outputs of the filter coefficient setting section 121b+"121b4 to generate the audio signal X (nl).

121dは加算器で、この音声信号X (n)と近似音
声信号X+’(nlの和信号S (nlを発生する。な
お、(nlはサンプル点nにおける値であることを示す
121d is an adder which generates a sum signal S(nl) of this audio signal X(n) and the approximate audio signal X+'(nl. Note that (nl is the value at sample point n).

121eは係数制御部で、加算器123の出力した誤差
信号e (nlが零となる様にフィルタ係数設定部12
1bi〜121b、+のフィルタ係数a1〜a、の値を
逐次制御する。
121e is a coefficient control unit that controls the filter coefficient setting unit 12 so that the error signal e (nl) output from the adder 123 becomes zero.
1bi to 121b, and the values of + filter coefficients a1 to a are sequentially controlled.

可変制御された各フィルタ係数al−84の各時系列デ
ータ、即ち本発明で用いられる高域再生補助情報である
1lauは、それぞれサンプリング周期の時系列データ
として出力されて代表補助情報発生手段13に加えられ
る。(なお、加算器123より出力される等化残差信号
は、第5図の従来方式において用いられた高域再生補助
情報である。)(B)実施例の動作 実施例の動作を、第3図のスベクラム及び信号波形を参
照して説明する。
Each time series data of each variably controlled filter coefficient al-84, that is, 1lau, which is high frequency reproduction auxiliary information used in the present invention, is outputted as time series data of each sampling period to the representative auxiliary information generation means 13. Added. (Note that the equalized residual signal output from the adder 123 is high frequency reproduction auxiliary information used in the conventional method shown in FIG. 5.) (B) Operation of the embodiment This will be explained with reference to the subekram and signal waveforms in FIG.

なお、以下に説明する実施例においては、所定音声区間
は、音声パラメータがその間で略変化しないとみられる
数mφC(実施例では5m5ec)であるとする)の短
いフレームであり、サンプリング周波数fsは6.4 
k Hzであるとする。従って、1フレーム内には32
サンプル(=6.4に!(zx5msec)が存在する
In the embodiment described below, it is assumed that the predetermined voice section is a short frame of several mφC (5m5ec in the example) during which the voice parameters do not seem to change substantially, and the sampling frequency fs is 6. .4
Suppose that it is kHz. Therefore, there are 32
There is a sample (=6.4!(zx5msec)).

入力される音声信号Xは、第3図(alに示す様に、0
−f s/2  (0〜3.2kHz)のスベクラム特
性を有し、その信号波形は、同図(dlに示す様に、1
フレーム当り32回サンプリングしたサンプリング信号
の形になっている。以下、サンプル点nにおける振幅値
をX(n):  (n=1 t 2.3 t−+32)
で表すことにする。このことは、他の信号波形について
も同様である。
The input audio signal X is 0 as shown in Figure 3 (al).
-f s/2 (0 to 3.2kHz), and its signal waveform is 1 as shown in the figure (dl).
It is in the form of a sampling signal sampled 32 times per frame. Below, the amplitude value at sample point n is X(n): (n=1 t 2.3 t-+32)
Let us express it as This also applies to other signal waveforms.

(B−1)符号装五の動作 音声信号X (nlが入力されると、間引きLPF 1
11は、音声信号X (n)のサンプル点を1つ置きに
間引く処理を行って、低域音声信号XLを生成する。こ
の様にして生成された低域音信号XLは、第3図中)に
示す様に、O=f s/4 (0〜1.6kHz)のス
ペクラム特性を有し、その信号波形は、同図(elに示
す様に、1フレーム当り16回サンプリングしたサンプ
リング信号XL  (2n):  (2n=2 、4 
、6 、・・・、32)の形になっている。
(B-1) Operation audio signal X of encoder 5 (When nl is input, thinning LPF 1
11 performs a process of thinning out every other sample point of the audio signal X (n) to generate a low frequency audio signal XL. The low-frequency sound signal XL generated in this way has a spectrum characteristic of O=f s/4 (0 to 1.6 kHz), as shown in Figure 3), and its signal waveform is the same. As shown in the figure (el), sampling signal XL (2n) sampled 16 times per frame: (2n=2,4
,6,...,32).

符号化部112は、低域音声信号XLを符号化して、符
号化低域音声信号Eしを生成する。この符号化処理は、
公知のADPCM符号化方式によって行われる。生成さ
れた符号化低域音声信号Eしは、低域音声信号XLの予
測残差信号である。
The encoding unit 112 encodes the low frequency audio signal XL to generate an encoded low frequency audio signal E. This encoding process is
This is performed using the well-known ADPCM encoding method. The generated encoded low frequency audio signal E is a prediction residual signal of the low frequency audio signal XL.

これにより、少ないビット数即ち大きい情報圧縮比を持
った符号化低域音声信号ELが得られ、且つ、これより
元の低域音声信号を良好に再生することが出来る。
As a result, an encoded low-frequency audio signal EL having a small number of bits, that is, a high information compression ratio is obtained, and the original low-frequency audio signal can be reproduced satisfactorily.

ADPCM符号化方式においては、その符号化処理の過
程においては、符号化低域音声信号ELの復号処理が行
われ、復号装置20側で再生される低域音声信号XLに
対応する低域音声信号XL’が再生される。この再生低
域音声信号XL’ は、近似音声再生部123に入力さ
れた。
In the ADPCM encoding method, in the encoding process, the encoded low frequency audio signal EL is decoded, and the low frequency audio signal corresponding to the low frequency audio signal XL reproduced on the decoding device 20 side is generated. XL' is played. This reproduced low frequency audio signal XL' was input to the approximate audio reproduction section 123.

近似音声再生部122は、この再生低域音声信号XL’
 を受けると、間引きLPFIIIによって間引かれた
サンプル点における振幅情報を補間処理により補充して
、復号装置20側で再生される近似音声信号X+に対応
する近似音声信号X+’を再生する。近似音声信号X1
′は、第3図(C1に示す様に、0〜f s/2  (
0〜3.2kHz)のスペクラム特性を有し、同図ff
lに示す様に、1フレーム当り32回サンプリングした
サンプリング信号X1’ (n):  (n−1、2、
3、++、 32)の形になっている。
The approximate audio reproduction section 122 uses this reproduced low-frequency audio signal XL'
When received, the amplitude information at the sample points thinned out by the thinning LPFIII is supplemented by interpolation processing, and an approximate audio signal X+' corresponding to the approximate audio signal X+ reproduced on the decoding device 20 side is reproduced. Approximate audio signal X1
' is 0 to f s/2 (as shown in Figure 3 (C1)
It has a spectrum characteristic of 0 to 3.2kHz), and
As shown in l, the sampling signal X1' (n) sampled 32 times per frame: (n-1, 2,
3, ++, 32).

ADF 121は、近似音声信号X+’(n)が入力さ
れると、音声信号X (n)を出力して加算器123に
加える。加算器123は、この音声信号X (n)と元
の音声信号X (n)との誤差信号e (nlをADF
121に戻す。ADF 121の係数制御部121eは
、入力された誤差信号e (nlが零となる様に、フィ
ルタ係数設定部12 lb1〜12 l b4のフィル
タ係数a 1(nl:  (i=1 、2 、3 、4
)の値を、例えば次の+11式に示す係数更新式によっ
て逐次更新制御する。
When the approximate audio signal X+'(n) is input, the ADF 121 outputs the audio signal X (n) and adds it to the adder 123. The adder 123 outputs an error signal e (nl) between this audio signal X (n) and the original audio signal
Return to 121. The coefficient control section 121e of the ADF 121 sets the filter coefficients a1(nl: (i=1, 2, 3) of the filter coefficient setting sections 12 lb1 to 12 lb4 so that the input error signal e , 4
) is sequentially updated and controlled by, for example, a coefficient update equation shown in the following equation +11.

ai (n + 1 ) =ai(n)※γ+εHsg
n (e (nil 誉sgn  (S (n −1)
 )   ・・・(1)ここで sgn (X) :符号関数と呼ばれ、次の様に定渡さ
れる 又、s (n)は加算器121dの出力する和信号、T
は伝送エラーに対するリーク係数、εは更新速度係数、
舛は乗算(Xと同じ)をそれぞれ示す。
ai (n + 1) = ai (n) *γ+εHsg
n (e (nil honor sgn (S (n -1)
)...(1) Here, sgn (X): is called a sign function and is passed as follows, and s (n) is the sum signal output from the adder 121d, T
is the leakage coefficient for transmission errors, ε is the update rate coefficient,
Each square indicates multiplication (same as X).

この逐次制御により可変制御されたフィルタ係数a i
 (n) (i = 1〜4)は、1フレーム当り32
サンプル存在する時系列データa 1(J):  (i
=1 。
Filter coefficient a i variably controlled by this sequential control
(n) (i = 1 to 4) is 32 per frame
Sample existing time series data a 1 (J): (i
=1.

2.3,4;j=1,2,3.・・・、32)として取
り出されて、各フィルタ係数の時系列データ即ち高域再
生補助情報11auとなる。
2.3,4; j=1,2,3. ..., 32), and becomes time series data of each filter coefficient, that is, high frequency reproduction auxiliary information 11au.

ADF 121より出力された高域再生補助情報11a
uは、係数メモリ131にフレーム単位で記憶される。
High frequency reproduction auxiliary information 11a output from ADF 121
u is stored in the coefficient memory 131 in units of frames.

平均化部132は、次の式によって高域再生補助情報!
lau中の各フィルタ係数ai  (i=1,2゜3.
4)時系列データのフレーム当りの平均値を求めて、そ
れぞれの代表値Ai  (i−1,2,3゜4)とする
。即ち、 32j=1 i=1,2,3.4 平均化部132は、この様にして求めた各代表値Ai 
 (i=1〜4)を、高域成分再生用の代表補助情報A
uとして係数変換部133に加える。
The averaging unit 132 calculates the high frequency reproduction auxiliary information! according to the following formula.
Each filter coefficient ai (i=1, 2°3.
4) Find the average value per frame of the time series data and set it as the respective representative value Ai (i-1, 2, 3°4). That is, 32j=1 i=1, 2, 3.4 The averaging unit 132 calculates each representative value Ai obtained in this way.
(i=1 to 4) as representative auxiliary information A for high frequency component reproduction.
It is added to the coefficient conversion unit 133 as u.

係数変換部133は、入力された代表補助情報Auを量
子化に強い公知のLSPパラメータに変換量子化する。
The coefficient conversion unit 133 converts and quantizes the input representative auxiliary information Au into known LSP parameters that are resistant to quantization.

符号化部112で生成された符号化低域音声信号Eし及
びLSP変換された代表補助情!iAuが音声符号化情
報として、復号装置20に送出される。
The encoded low-frequency audio signal E generated by the encoder 112 and the representative auxiliary information subjected to LSP conversion! iAu is sent to the decoding device 20 as audio encoded information.

その場合、符号化音声情報を多重化装置により多重化し
た後、伝送路くいずれも図示せず)を経由して復号装置
20に伝送する様にしてもよい。
In that case, the encoded audio information may be multiplexed by a multiplexing device and then transmitted to the decoding device 20 via a transmission path (none of which is shown).

次に、以上の様にして生成された音声符号化情報の伝送
に必要な情報量を第5図の従来方式と対比して具体的に
説明する。
Next, the amount of information necessary for transmitting the encoded audio information generated as described above will be specifically explained in comparison with the conventional method shown in FIG.

本発明による音声符号化方式においては、低域音声信号
XL  (2n)の予測残差を量子化した符号化低域音
声信号ELは、2ビツト×16サンプル=32ビツトで
ある。又、フレーム同期がlビット、LSP変換された
高域成分再生用の補助情%iAuが3ビット×4次=1
2ビットである。従って、本発明の音声符号化方式に必
要な情報量は、合計45ビツトとなる。その場合の音声
符号化情報の伝送レートは、フレーム長が5m5ecで
あるので、45ビツト/ 5m5ec=9.0 k b
 p sである。
In the audio encoding system according to the present invention, the encoded low-frequency audio signal EL, which is obtained by quantizing the prediction residual of the low-frequency audio signal XL (2n), is 2 bits x 16 samples = 32 bits. Also, the frame synchronization is 1 bit, and the auxiliary information %iAu for reproducing high frequency components converted to LSP is 3 bits x 4th order = 1
It is 2 bits. Therefore, the amount of information required for the audio encoding method of the present invention is 45 bits in total. In that case, the frame length is 5m5ec, so the transmission rate of audio encoded information is 45 bits/5m5ec=9.0 kb
ps.

これに対し、第5図に示した従来方式の場合は、同じ条
件で、符号化低域音声信号Eしは同じく32ビツトであ
るが、高域成分再生用の高域再生情報(Au)である等
化残差信号(a(1):i=1〜32)が最低1ビツト
it子化の場合でも1ビツト×32=32ビツト必要と
するので、フレーム同期1ビツトを加えると合計として
最低65ビツトとなる。従って、その符号化情報の伝送
レートは、最低65ビツト15m5s= 13 k b
 pSである。
On the other hand, in the case of the conventional method shown in Fig. 5, under the same conditions, the encoded low frequency audio signal E is also 32 bits, but the high frequency reproduction information (Au) for high frequency component reproduction is Even if a certain equalized residual signal (a(1): i = 1 to 32) is converted to a minimum of 1 bit, it requires 1 bit x 32 = 32 bits, so adding 1 bit of frame synchronization makes the total minimum It will be 65 bits. Therefore, the transmission rate of the encoded information is at least 65 bits 15m5s=13 kb
It is pS.

この様に、本発明の音声符号化方式によれば、従来方式
よりも大幅に情報量を圧縮して、伝送レートを上げるこ
とが出来る。
As described above, according to the audio encoding method of the present invention, the amount of information can be compressed to a greater extent than the conventional method, and the transmission rate can be increased.

(B−2)復号装置の動作 復号装置20、音声符号化情報が多重化されて伝送され
て来た場合は、図示しない多重化復号装置により符号化
低域音声信号EL’及びLSP変換された高域成分再生
用の代表補助情報Au’を分離して取り出し、符号化低
域音声信号EL’を複号部21に入力し、LSP変換さ
れた代表補助情報Au’を係数逆変換部23に入力する
(B-2) Operation of the decoding device When the decoding device 20 receives encoded audio information in a multiplexed manner, the encoded low-frequency audio signal EL' and LSP are converted into the encoded low-frequency audio signal EL' by a multiplexing decoding device (not shown). The representative auxiliary information Au' for high-frequency component reproduction is separated and extracted, the encoded low-frequency audio signal EL' is inputted to the decoder 21, and the LSP-converted representative auxiliary information Au' is sent to the coefficient inverse transformer 23. input.

複号部21は、入力された符号化低域音声信号EL’を
復号して、符号装置10例の低域音声信号XL  (第
4図(b)及び(e)参照)に対応した低域音声信号X
Lを再生する。
The decoding unit 21 decodes the input encoded low frequency audio signal EL' to generate a low frequency signal corresponding to the low frequency audio signal XL (see FIGS. 4(b) and (e)) of the 10 encoding devices. audio signal
Play L.

近似音声再生部22は、再生された低域音声信号XLを
受けると、間引かれたサンプル点における振幅情報を補
間処理により補充して、符号装置10例の近似音声信号
X1′ (第4図(C)及び(f)参照)に対応した近
似音声信号X+を生成し、ADF′ 24に入力する。
When the approximate audio reproduction unit 22 receives the reproduced low-frequency audio signal XL, it supplements the amplitude information at the thinned out sample points by interpolation processing, and reproduces the approximate audio signal X1' of the 10 encoding devices (Fig. 4). An approximate audio signal X+ corresponding to (see (C) and (f)) is generated and input to the ADF' 24.

一方、係数逆変換部23は、加えられたLSP変換され
た代表補助情報Au’に対し、LSP=係数の逆変換を
行って元の高域成分再生用の代表補助情報Au’を生成
し、ADF’  24に人力する。
On the other hand, the coefficient inverse transform unit 23 performs LSP=coefficient inverse transform on the added LSP-transformed representative auxiliary information Au' to generate representative auxiliary information Au' for original high frequency component reproduction, ADF' 24 is manually operated.

ADF’24は、入力された代表補助情報Au’に基づ
いて各フレーム毎にそのフィルタ係数設定部の各フレー
ム係数値を更新し、入力された近似音声信号X+より、
元の音声信号X(第4図(al及び(d)参照)に対応
する音声信号Xを再生する。
The ADF'24 updates each frame coefficient value of its filter coefficient setting section for each frame based on the input representative auxiliary information Au', and updates the frame coefficient value of the filter coefficient setting section based on the inputted approximate audio signal X+.
An audio signal X corresponding to the original audio signal X (see FIGS. 4(al and d)) is reproduced.

この様にすると、再生された音声信号Xの高域成分の1
フレーム当りの振幅平均値は、元の音声信号Xの高域成
分の1フレーム当りの振幅平均値と同じくなるので、低
域成分はもちろん、高域成分も従来方式に比べて殆んど
劣化のない少ないスペクラム歪を持って良好に再生する
ことが出来る。
In this way, one of the high frequency components of the reproduced audio signal
The average amplitude per frame is the same as the average amplitude per frame of the high-frequency components of the original audio signal It can be reproduced well with little spectral distortion.

以上本発明の一実施例について説明したが、本発明の構
成は、この実施例の各構成に限定されるものではない。
Although one embodiment of the present invention has been described above, the structure of the present invention is not limited to each structure of this embodiment.

間引きLPFIIIは、2よりも大きい整数の間引き率
によって間引き処理を行うことが出来る。
Thinning LPF III can perform thinning processing using a thinning rate of an integer greater than 2.

その場合、近似音声再生部122及び24の補間率も、
それに対応して2よりも大きい整数に設定される。
In that case, the interpolation rate of the approximate audio reproduction units 122 and 24 is also
Correspondingly, it is set to an integer greater than 2.

又、ADF 121の係数更新処理は、前掲の(11式
の他、公知の各種の係数更新式を用いて行うことが出来
る。
Further, the coefficient update process of the ADF 121 can be performed using various known coefficient update formulas in addition to the above-mentioned formula (11).

〔発明の効果〕〔Effect of the invention〕

以上説明した様に、本発明によれば、次の諸効果が得ら
れる。
As explained above, according to the present invention, the following effects can be obtained.

(イ)音声信号の高域成分再生に必要な補助情報の情報
量を大幅に圧縮することが可能となり、全体の情報圧縮
比を太き(改善することが出来る。
(b) It becomes possible to significantly compress the amount of auxiliary information necessary for reproducing high-frequency components of audio signals, and the overall information compression ratio can be increased (improved).

(ロ)再生された音声信号の高域成分の1フレーム当り
の振幅平均値が元の音声信号の高域成分の1フレーム当
りの振幅平均値と同じであるので、高域成分も、少ない
スペクラム歪で良好に再生することが出来る。
(b) Since the average amplitude per frame of the high-frequency components of the reproduced audio signal is the same as the average amplitude per frame of the high-frequency components of the original audio signal, the high-frequency components also have a small spectrum. It can be reproduced well with distortion.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図・・・本発明の基本構成の説明図、第2図・・・
本発明の一実施例の構成の説明図、第3図・・・同実施
例の適応等化フィルタ(ADF)の説明図、 第4図・・・同実施例の信号スペクラム及び信号波形の
説明図、 第5図・・・従来の音声符号化方式の説明図。 第1図及び第2図において、 10・・・符号装置、11・・・低域符号化手段、12
・・・高域再生補助情報発生手段、121・・・適応等
化フィルタ(ADF) 、13・・・代表補助情報発生
手段、20・・・復号装置、21・・・複号部、22・
・・近似音声再生部、23・・・係数逆変換部、24・
・・適応等化フィルタ(ADF’ )。
Fig. 1...Explanatory diagram of the basic configuration of the present invention, Fig. 2...
An explanatory diagram of the configuration of an embodiment of the present invention, Fig. 3: An explanatory diagram of the adaptive equalization filter (ADF) of the embodiment, Fig. 4: Explanation of the signal spectrum and signal waveform of the embodiment Fig. 5: An explanatory diagram of a conventional audio encoding method. In FIG. 1 and FIG. 2, 10... encoding device, 11... low frequency encoding means, 12
. . . High frequency reproduction auxiliary information generation means, 121 . . . Adaptive equalization filter (ADF), 13 . . . Representative auxiliary information generation means, 20 .
... Approximate audio reproduction section, 23... Coefficient inverse transformation section, 24.
...Adaptive equalization filter (ADF').

Claims (2)

【特許請求の範囲】[Claims] (1)入力された音声信号(X)の低域成分を符号化し
て符号化低域音声信号(EL)を生成し、適応等化フィ
ルタにより等化処理を行って高域成分再生用の高域再生
補助情報を出力する音声符号化装置において、 (a)適応等化フィルタ(121)を備え、この適応等
化フィルタ(121)から得られる複数のフィルタ係数
の各時系列データを高域成分再生用の高域再生補助情報
(Hau)として出力する高域再生補助情報発生手段(
12)と、 (b)所定音声区間毎に高域再生補助情報(Hau)の
代表値を求めて高域成分再生用の代表補助情報(Au)
として出力する代表補助情報発生手段(13)、 を備えたことを特徴とする音声符号化装置。
(1) Encode the low-frequency components of the input audio signal (X) to generate an encoded low-frequency audio signal (EL), and perform equalization processing using an adaptive equalization filter to reproduce the high-frequency components. A speech encoding device that outputs frequency reproduction auxiliary information includes (a) an adaptive equalization filter (121), and converts each time series data of a plurality of filter coefficients obtained from the adaptive equalization filter (121) into high frequency components. High frequency reproduction auxiliary information generating means (Hau) for outputting as high frequency reproduction auxiliary information (Hau)
(b) Find the representative value of the high frequency reproduction auxiliary information (Hau) for each predetermined audio section and obtain the representative auxiliary information (Au) for high frequency component reproduction.
A speech encoding device comprising representative auxiliary information generating means (13) for outputting as follows.
(2)補助情報発生手段(13)が、線スペクトル対(
LSP)変換処理された補助情報(Au)を出力するも
のであることを特徴とする特許請求の範囲第1項記載の
音声符号化装置。
(2) The auxiliary information generating means (13) generates a line spectrum pair (
2. The audio encoding device according to claim 1, wherein the audio encoding device outputs auxiliary information (Au) that has been subjected to LSP) conversion processing.
JP18532986A 1986-08-08 1986-08-08 Audio encoding device Pending JPS6342532A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP18532986A JPS6342532A (en) 1986-08-08 1986-08-08 Audio encoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP18532986A JPS6342532A (en) 1986-08-08 1986-08-08 Audio encoding device

Publications (1)

Publication Number Publication Date
JPS6342532A true JPS6342532A (en) 1988-02-23

Family

ID=16168917

Family Applications (1)

Application Number Title Priority Date Filing Date
JP18532986A Pending JPS6342532A (en) 1986-08-08 1986-08-08 Audio encoding device

Country Status (1)

Country Link
JP (1) JPS6342532A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04504936A (en) * 1989-04-17 1992-08-27 フラウンホッファー―ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ. Digital encoding method
JPH11511315A (en) * 1996-05-08 1999-09-28 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ Transmission of digital information signal with specific primary sampling frequency

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04504936A (en) * 1989-04-17 1992-08-27 フラウンホッファー―ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ. Digital encoding method
JPH11511315A (en) * 1996-05-08 1999-09-28 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ Transmission of digital information signal with specific primary sampling frequency

Similar Documents

Publication Publication Date Title
US5701346A (en) Method of coding a plurality of audio signals
US8311815B2 (en) Method, apparatus, and program for encoding digital signal, and method, apparatus, and program for decoding digital signal
JPS62234435A (en) Voice coding system
EP0966793A1 (en) Audio coding method and apparatus
JPS60501918A (en) equipment for coding, decoding, analyzing, and synthesizing signals
JPWO2006120931A1 (en) Encoding device, decoding device and methods thereof
US8055499B2 (en) Transmitter and receiver for speech coding and decoding by using additional bit allocation method
JP2007504503A (en) Low bit rate audio encoding
US5524170A (en) Vector-quantizing device having a capability of adaptive updating of code book
JPH10285048A (en) Digital data encoding/decoding method and its device
JP2002221994A (en) Method and apparatus for assembling packet of code string of voice signal, method and apparatus for disassembling packet, program for executing these methods, and recording medium for recording program thereon
JPH09127995A (en) Signal decoding method and signal decoder
JP2003332914A (en) Encoding method for digital signal, decoding method therefor, apparatus for the methods and program thereof
JPS6342532A (en) Audio encoding device
JP3193515B2 (en) Voice coded communication system and apparatus therefor
JP2958726B2 (en) Apparatus for coding and decoding a sampled analog signal with repeatability
JP3453116B2 (en) Audio encoding method and apparatus
JP4638895B2 (en) Decoding method, decoder, decoding device, program, and recording medium
JP2006119301A (en) Speech encoding method, wideband speech encoding method, speech encoding system, wideband speech encoding system, speech encoding program, wideband speech encoding program, and recording medium with these programs recorded thereon
JP4195598B2 (en) Encoding method, decoding method, encoding device, decoding device, encoding program, decoding program
JPH0990997A (en) Speech coding device, speech decoding device, speech coding/decoding method and composite digital filter
JPS6251827A (en) Voice coding system
JPH09190198A (en) Method and device for transmitting sound by narrow band width channel, and method for receiving sound digitized from narrow band width channel
JPH043878B2 (en)
JP2001228888A (en) Speech-encoding device, speech decoding device and code word-arraying method