JP2001298367A - Method for encoding audio singal, method for decoding audio signal, device for encoding/decoding audio signal and recording medium with program performing the methods recorded thereon - Google Patents

Method for encoding audio singal, method for decoding audio signal, device for encoding/decoding audio signal and recording medium with program performing the methods recorded thereon

Info

Publication number
JP2001298367A
JP2001298367A JP2000111031A JP2000111031A JP2001298367A JP 2001298367 A JP2001298367 A JP 2001298367A JP 2000111031 A JP2000111031 A JP 2000111031A JP 2000111031 A JP2000111031 A JP 2000111031A JP 2001298367 A JP2001298367 A JP 2001298367A
Authority
JP
Japan
Prior art keywords
coefficient
reproduction
input
audio signal
flattening
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000111031A
Other languages
Japanese (ja)
Other versions
JP3361790B2 (en
Inventor
Naoki Iwagami
直樹 岩上
Akio Jin
明夫 神
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000111031A priority Critical patent/JP3361790B2/en
Publication of JP2001298367A publication Critical patent/JP2001298367A/en
Application granted granted Critical
Publication of JP3361790B2 publication Critical patent/JP3361790B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide an audio signal encoding method, an audio signal decoding method, an audio signal encoding/decoding device which suppress distortion of the frequency characteristic of a reproduced signal, prevent the deterioration of reproduced sound quality and can satisfactorily maintain the reproduced sound quality, and a recording medium where a program with which the methods are performed is recorded. SOLUTION: An encoding part 10 flattens the input coefficient of a frequency domain obtained in such a manner that a time-frequency converting part 1 performs time-frequency conversion of an input audio signal, reproduces a vector quantization information by performing vector quantization of the flattened input coefficient, reversely flattens the reproduced flattened coefficient, and calculates a correction coefficient for making the frequency characteristic of a reproduction coefficient close to the frequency characteristic of the input coefficient from the reproduction coefficient and the input coefficient, and a decoding part 20 generates a reproduction coefficient by reversely flattening the reproduced flattened coefficient, corrects the frequency characteristic of the reproduction coefficient by using the correction coefficient in a frequency characteristic correcting part 29, performs frequency-time conversion of the corrected reproduction coefficient and outputs an audio signal.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、離散サンプル列と
して入力されるオーディオ信号を符号化し、ディジタル
符号を出力するオーディオ信号符号化方法およびディジ
タル符号をオーディオ信号に復元するオーディオ信号復
号化方法に関し、例えばオーディオ信号の録音、再生
や、オーディオ信号の通話路を使用した伝送、放送など
に利用し得るオーディオ信号符号化方法、オーディオ信
号復号化方法、オーディオ信号符号化/復号化装置と前
記方法を実施するプログラムを記録した記録媒体に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an audio signal encoding method for encoding an audio signal input as a sequence of discrete samples and outputting a digital code, and an audio signal decoding method for restoring the digital code into an audio signal. For example, an audio signal encoding method, an audio signal decoding method, an audio signal encoding / decoding apparatus, and an audio signal encoding / decoding apparatus that can be used for recording and reproducing an audio signal, transmitting the audio signal using a communication path, broadcasting, and the like are implemented. The present invention relates to a recording medium storing a program to be executed.

【0002】[0002]

【従来の技術】オーディオ信号を高能率に符号化する従
来の手法として、変換符号化方法がある。この変換符号
化では、離散信号サンプル列として入力されたオーディ
オ信号に対して一定サンプル数の入力毎に時間−周波数
変換を行い、周波数領域の入力係数にしてから符号化を
行うものである。
2. Description of the Related Art As a conventional technique for encoding an audio signal with high efficiency, there is a transform encoding method. In this transform coding, time-frequency transform is performed on an audio signal input as a discrete signal sample sequence for each input of a fixed number of samples, and coding is performed after setting the input coefficients in the frequency domain.

【0003】この種の従来の技術の1つとして、図4に
示すように、符号化部80に供給される入力オーディオ
信号を時間−周波数変換部81で時間−周波数変換し、
周波数領域の入力係数を出力し、この周波数領域の入力
係数を平坦化部82で平坦化してから、ベクトル量子化
部83でベクトル量子化している。そして、平坦化部8
2およびベクトル量子化部83の出力を多重化部84で
多重して、符号化部80から復号化部90に出力し、復
号化部90の逆多重化部85でそれぞれの符号に分解
し、ベクトル量子化/復号化87で再生平坦化係数を出
力し、逆平坦化部27で再生平坦化係数を逆平坦化し
て、再生係数を出力し、周波数−時間変換部89で再生
係数を周波数−時間変換して、オーディオ信号を出力し
ている。
As one of the prior arts of this type, as shown in FIG. 4, an input audio signal supplied to an encoding unit 80 is subjected to time-frequency conversion by a time-frequency conversion unit 81.
The input coefficients in the frequency domain are output, and the input coefficients in the frequency domain are flattened by the flattening unit 82 and then vector-quantized by the vector quantization unit 83. Then, the flattening unit 8
2 and the output of the vector quantization unit 83 are multiplexed by the multiplexing unit 84, output from the encoding unit 80 to the decoding unit 90, and demultiplexed into respective codes by the demultiplexing unit 85 of the decoding unit 90. The reproduction flattening coefficient is output by the vector quantization / decoding 87, the reproduction flattening coefficient is inverse-flattened by the inverse flattening unit 27, the reproduction coefficient is output, and the reproduction coefficient is output by the frequency-time conversion unit 89. The audio signal is output after time conversion.

【0004】なお、このような符号化及び復号化方法
は、例えば特開平8−44399号に開示されている。
この特開平8−44399号に開示されている音響信号
変換符号化方法および復号化方法は、オーディオ信号を
周波数領域係数に変換し、その周波数領域係数をできる
だけ少ない情報量でディジタル符号化するものである。
[0004] Such an encoding and decoding method is disclosed, for example, in JP-A-8-44399.
The audio signal transform coding method and decoding method disclosed in Japanese Patent Application Laid-Open No. Hei 8-44399 convert an audio signal into frequency domain coefficients and digitally encode the frequency domain coefficients with a minimum amount of information. is there.

【0005】また、周波数重み付けインタリーブベクト
ル量子化(TWINVQ:Transform-domain Weighted Interle
ave Vector Quantization)方式は上述した図4の従来
例に当てはまるものである。このTWINVQ方式は、
入力信号を時間−周波数変換した後、2段階の平坦化の
手順を経た後に、ベクトル量子化により符号化を行って
いる。
In addition, frequency-weighted interleave vector quantization (TWINVQ: Transform-domain Weighted Interle
The ave Vector Quantization) method is applied to the above-described conventional example of FIG. This TWINVQ system is
After the time-frequency conversion of the input signal, a two-stage flattening procedure is performed, and then encoding is performed by vector quantization.

【0006】ベクトル量子化は、目標ベクトルとの距離
が最小であるコードベクトルを選択し、このコードベク
トルを用いて復号器側でベクトルを再生する。このよう
な符号化方法では、再生ベクトルと目標ベクトルとの距
離は小さく、高能率に符号化ができるが、ベクトル中の
個々の要素についての目標値からの誤差を制御すること
は困難である。
In the vector quantization, a code vector having a minimum distance from a target vector is selected, and the vector is reproduced on the decoder side using the code vector. With such an encoding method, the distance between the reproduction vector and the target vector is small, and encoding can be performed with high efficiency. However, it is difficult to control the error of each element in the vector from the target value.

【0007】従って、ベクトル量子化を用いた符号化方
式では、復号器側で再生した信号の周波数特性が、原信
号の周波数特性から歪み、再生音質の劣化を招いてしま
うことがある。
Therefore, in an encoding method using vector quantization, the frequency characteristics of a signal reproduced on the decoder side may be distorted from the frequency characteristics of the original signal, resulting in deterioration of reproduced sound quality.

【0008】なお、TWINVQ方式については、岩上
他「周波数領域重み付けインタリーブベクトル量子化
(TwinVQ)による楽音符号化」電子情報通信学会
論文誌Vol.J80-A, pp.830〜837 および ISO/IEC 標準 I
SO/IEC 14496-3 Information Technology:Coding of Au
dio-Visual objects(MPEG-4 Audio)に詳細が記述され
ている。また、ベクトル量子化技術全般に関する詳細
は、古井他著「ベクトル量子化と情報圧縮」(コロナ
社、1998)に述べられている。
[0008] Regarding the TWINVQ method, see Iwagami et al., "Tone Sound Coding by Frequency Domain Weighted Interleave Vector Quantization (TwinVQ)," IEICE Transactions Vol. I
SO / IEC 14496-3 Information Technology: Coding of Au
Details are described in dio-Visual objects (MPEG-4 Audio). The details of the vector quantization technology in general are described in "Vector quantization and information compression" by Corui et al. (Corona, 1998).

【0009】[0009]

【発明が解決しようとする課題】上述した従来のベクト
ル量子化を用いた符号化方法では、ベクトル中の個々の
要素についての目標値からの誤差を制御することが困難
であるため、復号器側で再生した信号の周波数特性が原
信号の周波数特性から歪み、再生音質の劣化を招いてし
まうという問題がある。
In the above-described encoding method using vector quantization, it is difficult to control the error of each element in the vector from a target value. However, there is a problem that the frequency characteristics of the signal reproduced in the above are distorted from the frequency characteristics of the original signal, resulting in deterioration of reproduced sound quality.

【0010】本発明は、上記に鑑みてなされたもので、
その目的とするところは、再生信号の周波数特性の歪み
を抑えて、再生音質の劣化を防止し、再生音質を良好に
保ち得るオーディオ信号符号化方法、オーディオ信号復
号化方法およびオーディオ信号符号化/復号化装置と前
記方法を実施するプログラムを記録した記録媒体を提供
することにある。
[0010] The present invention has been made in view of the above,
An object of the present invention is to provide an audio signal encoding method, an audio signal decoding method, and an audio signal encoding / decoding method capable of suppressing distortion of a frequency characteristic of a reproduced signal, preventing deterioration of reproduced sound quality, and maintaining good reproduced sound quality. An object of the present invention is to provide a decoding device and a recording medium on which a program for executing the method is recorded.

【0011】[0011]

【課題を解決するための手段】上記目的を達成するた
め、請求項1記載の本発明は、離散サンプル列として入
力されるオーディオ信号を符号化し、ディジタル符号を
出力するオーディオ信号符号化方法であって、前記入力
オーディオ信号を一定数の入力毎に時間−周波数変換し
て、周波数領域の入力係数を取得する時間−周波数変換
段階と、この周波数領域の入力係数を符号化するととも
に、この符号化情報を符号化器出力として出力する符号
化段階と、この符号化された周波数領域の入力係数を復
号化して、再生係数を取得する復号化段階と、この取得
した再生係数の周波数特性を入力係数の周波数特性に近
づけるための補正係数を計算するとともに、該補正係数
を符号化して符号化器出力として出力する補正係数計算
段階とを有することを要旨とする。
According to the first aspect of the present invention, there is provided an audio signal encoding method for encoding an audio signal input as a sequence of discrete samples and outputting a digital code. A time-frequency conversion step of performing time-frequency conversion on the input audio signal for each predetermined number of inputs to obtain an input coefficient in the frequency domain; encoding the input coefficient in the frequency domain; An encoding step of outputting information as an encoder output; a decoding step of decoding the encoded frequency-domain input coefficient to obtain a reproduction coefficient; and inputting the frequency characteristic of the obtained reproduction coefficient to an input coefficient. Calculating a correction coefficient for approximating the frequency characteristic of the correction coefficient, encoding the correction coefficient, and outputting the result as an encoder output. The gist.

【0012】請求項1記載の本発明にあっては、入力オ
ーディオ信号を一定数の入力毎に時間−周波数変換し
て、周波数領域の入力係数を取得し、この周波数領域の
入力係数を符号化し、この符号化された周波数領域の入
力係数を復号化して、再生係数を取得し、この再生係数
の周波数特性を入力係数の周波数特性に近づけるための
補正係数を計算し、該補正係数を符号化して符号化器出
力として出力するため、この補正係数を用いて、再生係
数の周波数特性を補正することにより補正後再生係数の
周波数特性を入力係数の周波数特性に一致させることが
でき、復号器側で再生される信号の周波数特性の歪みは
小さく、再生音質を良好に保つことができる。
According to the first aspect of the present invention, an input audio signal is subjected to time-frequency conversion for every fixed number of inputs to obtain an input coefficient in the frequency domain, and the input coefficient in the frequency domain is encoded. By decoding the encoded frequency-domain input coefficient, a reproduction coefficient is obtained, a correction coefficient for bringing the frequency characteristic of the reproduction coefficient closer to the frequency characteristic of the input coefficient is calculated, and the correction coefficient is encoded. By using the correction coefficient to correct the frequency characteristic of the reproduction coefficient, the frequency characteristic of the reproduction coefficient after correction can be made to match the frequency characteristic of the input coefficient. The distortion of the frequency characteristic of the signal reproduced by the method is small, and the reproduced sound quality can be kept good.

【0013】また、請求項2記載の本発明は、請求項1
記載の発明において、前記補正係数計算段階が、前記入
力係数および再生係数を複数の小帯域に分割し、各小帯
域毎に補正係数を決定する補正係数決定段階を有するこ
とを要旨とする。
[0013] The present invention described in claim 2 provides the present invention in claim 1.
In the invention described above, the correction coefficient calculation step includes a correction coefficient determination step of dividing the input coefficient and the reproduction coefficient into a plurality of small bands and determining a correction coefficient for each of the small bands.

【0014】請求項2記載の本発明にあっては、入力係
数および再生係数を複数の小帯域に分割し、各小帯域毎
に補正係数を決定する。
According to the present invention, the input coefficient and the reproduction coefficient are divided into a plurality of small bands, and a correction coefficient is determined for each small band.

【0015】更に、請求項3記載の本発明は、請求項2
記載の発明において、前記補正係数決定段階が、前記複
数の小帯域中のすべての再生係数に補正係数を掛け合わ
せると、補正後の再生係数のパワーが入力係数のパワー
に最も近くなるように補正係数を決定するパワー最近接
型補正係数決定段階を有することを要旨とする。
Further, the present invention according to claim 3 provides the invention according to claim 2.
In the invention described above, when the correction coefficient determining step multiplies all the reproduction coefficients in the plurality of small bands by a correction coefficient, the correction coefficient is corrected so that the power of the corrected reproduction coefficient becomes closest to the power of the input coefficient. The gist of the present invention is to have a power closest correction coefficient determining step of determining a coefficient.

【0016】請求項3記載の本発明にあっては、補正係
数は複数の小帯域中のすべての再生係数に補正係数を掛
け合わせると、補正後の再生係数のパワーが入力係数の
パワーに最も近くなるように決定される。
According to the third aspect of the present invention, when the correction coefficient is multiplied by the correction coefficient to all the reproduction coefficients in the plurality of small bands, the power of the corrected reproduction coefficient is the most significant of the input coefficient power. It is determined to be close.

【0017】請求項4記載の本発明は、請求項2記載の
発明において、前記補正係数決定段階が、前記複数の小
帯域中のすべての再生係数に補正係数を掛け合わせる
と、補正後の再生係数と入力係数との誤差が最小となる
ように補正係数を決定する誤差最小型補正係数決定段階
を有することを要旨とする。
According to a fourth aspect of the present invention, in the second aspect of the present invention, when the correction coefficient determining step multiplies all the reproduction coefficients in the plurality of small bands by a correction coefficient, the reproduction after the correction is performed. The gist of the present invention is to include a minimum error type correction coefficient determining step of determining a correction coefficient so that an error between a coefficient and an input coefficient is minimized.

【0018】請求項4記載の本発明にあっては、補正係
数は複数の小帯域中のすべての再生係数に補正係数を掛
け合わせると、補正後の再生係数と入力係数との誤差が
最小となるように決定される。
According to the present invention, when the correction coefficient is multiplied by the correction coefficient to all the reproduction coefficients in the plurality of small bands, the error between the corrected reproduction coefficient and the input coefficient is minimized. It is determined to be.

【0019】また、請求項5記載の本発明は、請求項2
記載の発明において、前記補正係数決定段階が、前記複
数の小帯域中のすべての再生係数に補正係数を掛け合わ
せると、補正後の再生係数のパワーが入力係数のパワー
に最も近くなるように補正係数を決定するパワー最近接
型補正係数決定段階、前記複数の小帯域中のすべての再
生係数に補正係数を掛け合わせると、補正後の再生係数
と入力係数との誤差が最小となるように補正係数を決定
する誤差最小型補正係数決定段階、および前記パワー最
近接型補正係数決定段階と前記誤差最小型補正係数決定
段階の両段階のうちのいずれの段階で補正係数を決定す
るかを小帯域によって選択する選択段階を有することを
要旨とする。
The present invention described in claim 5 is the same as claim 2.
In the invention described above, when the correction coefficient determining step multiplies all the reproduction coefficients in the plurality of small bands by a correction coefficient, the correction coefficient is corrected so that the power of the corrected reproduction coefficient becomes closest to the power of the input coefficient. A power closest-decision correction coefficient determining step of determining a coefficient, when all of the reproduction coefficients in the plurality of small bands are multiplied by the correction coefficient, the correction is performed so that an error between the corrected reproduction coefficient and the input coefficient is minimized. A small-bandwidth correction coefficient determining step for determining a coefficient, and a small band for determining which of the two stages of the power closest correction coefficient determining step and the minimum error-type correction coefficient determination step The gist of the present invention is to have a selection step of selecting by

【0020】請求項5記載の本発明にあっては、補正係
数はパワー最近接型補正係数決定段階と誤差最小型補正
係数決定段階の両段階のうちのいずれの段階で補正係数
を決定するかを小帯域によって選択する。
According to the fifth aspect of the present invention, the correction coefficient is determined at any one of the power nearest-neighbor type correction coefficient determining step and the minimum error type correction coefficient determining step. Is selected by the small band.

【0021】更に、請求項6記載の本発明は、請求項5
記載の発明において、前記選択段階が、前記小帯域中の
入力係数の平坦度を計算し、この平坦度が低い場合に
は、前記補正係数決定段階として前記誤差最小型補正係
数決定段階を選択し、平坦度が高い場合には、前記補正
係数決定段階として前記選択段階で選択される補正係数
決定段階を選択する段階を有することを要旨とする。
Further, the present invention described in claim 6 provides the present invention according to claim 5.
In the invention described, the selecting step calculates flatness of the input coefficient in the small band, and when the flatness is low, selects the minimum error type correction coefficient determining step as the correction coefficient determining step. In the case where the flatness is high, the method further includes a step of selecting a correction coefficient determination step selected in the selection step as the correction coefficient determination step.

【0022】請求項6記載の本発明にあっては、小帯域
中の入力係数の平坦度を計算し、この平坦度が低い場合
には、補正係数決定段階として誤差最小型補正係数決定
段階を選択し、平坦度が高い場合には、補正係数決定段
階として前記選択段階で選択される補正係数決定段階を
選択する。
According to the present invention, the flatness of the input coefficient in the small band is calculated, and when the flatness is low, a minimum error type correction coefficient determining step is performed as a correction coefficient determining step. If the degree of flatness is high, the correction coefficient determination step selected in the selection step is selected as the correction coefficient determination step.

【0023】請求項7記載の本発明は、請求項1記載の
発明において、前記符号化段階が、前記入力係数を平坦
化し、平坦化入力係数を符号化器出力として出力する平
坦化段階、および該平坦化段階で平坦化された入力係数
をベクトル量子化することにより符号化し、ベクトル量
子化情報を取得するベクトル量子化段階を有することを
要旨とする。
According to a seventh aspect of the present invention, in the first aspect, the encoding step includes a step of flattening the input coefficients and outputting the flattened input coefficients as an encoder output. The gist of the present invention is to include a vector quantization step of encoding the input coefficients flattened in the flattening step by vector quantization to obtain vector quantization information.

【0024】請求項7記載の本発明にあっては、符号化
段階では入力係数を平坦化し、平坦化入力係数を符号化
器出力として出力し、この平坦化された入力係数をベク
トル量子化することにより符号化し、ベクトル量子化情
報を取得する。
According to the present invention, in the encoding step, the input coefficients are flattened, the flattened input coefficients are output as an encoder output, and the flattened input coefficients are vector-quantized. To obtain the vector quantization information.

【0025】また、請求項8記載の本発明は、請求項7
記載の発明において、前記復号化段階が、前記ベクトル
量子化情報を再生し、再生平坦化係数を取得するベクト
ル再生段階、および前記再生平坦化係数に対して前記平
坦化と逆の操作である逆平坦化を行って、再生係数を取
得する逆平坦化段階を有することを要旨とする。
The present invention according to claim 8 provides the present invention according to claim 7.
In the invention described above, the decoding step is a vector reproduction step of reproducing the vector quantization information and obtaining a reproduction flattening coefficient, and performing an inverse operation of the flattening coefficient on the reproduction flattening coefficient. The gist of the present invention is to have an inverse flattening step of performing flattening and obtaining a reproduction coefficient.

【0026】請求項8記載の本発明にあっては、復号化
段階ではベクトル量子化情報を再生し、再生平坦化係数
を取得し、この再生平坦化係数に対して逆平坦化を行っ
て、再生係数を取得する。
According to the present invention, in the decoding step, the vector quantization information is reproduced, a reproduction flattening coefficient is obtained, and the reproduction flattening coefficient is subjected to inverse flattening. Get the playback factor.

【0027】更に、請求項9記載の本発明は、ディジタ
ル符号を入力し、離散サンプル列のオーディオ信号を出
力するオーディオ信号復号化方法であって、前記入力デ
ィジタル符号を復号し、周波数領域の再生係数を取得す
る再生係数取得段階と、前記入力ディジタル符号を復号
し、補正係数を取得する補正係数取得段階と、前記補正
係数取得段階で取得した補正係数を用いて、前記再生係
数取得段階で取得した再生係数の周波数特性を補正する
周波数特性補正段階と、該周波数特性補正段階で補正さ
れた再生係数を時間−周波数変換し、オーディオ信号と
して出力する周波数−時間変換段階とを有することを要
旨とする。
Further, the present invention according to claim 9 is a method for decoding an audio signal which inputs a digital code and outputs an audio signal of a sequence of discrete samples, wherein the input digital code is decoded to reproduce a frequency domain. A reproduction coefficient obtaining step of obtaining a coefficient; a correction coefficient obtaining step of decoding the input digital code to obtain a correction coefficient; and a correction coefficient obtaining step of using the correction coefficient obtained in the correction coefficient obtaining step. A frequency characteristic correction step of correcting the frequency characteristic of the reproduced reproduction coefficient, and a frequency-time conversion step of performing a time-frequency conversion of the reproduction coefficient corrected in the frequency characteristic correction step and outputting it as an audio signal. I do.

【0028】請求項9記載の本発明にあっては、入力デ
ィジタル符号を復号し、周波数領域の再生係数および補
正係数を取得し、この取得した補正係数を用いて、再生
係数の周波数特性を補正し、この補正された再生係数を
時間−周波数変換し、オーディオ信号として出力するた
め、補正後再生係数は入力係数の周波数特性に一致で
き、復号化器で再生される信号の周波数特性の歪みは小
さく、再生音質を良好に保つことができる。
According to the ninth aspect of the present invention, an input digital code is decoded, a reproduction coefficient and a correction coefficient in the frequency domain are obtained, and the frequency characteristic of the reproduction coefficient is corrected using the obtained correction coefficient. Then, since the corrected reproduction coefficient is subjected to time-frequency conversion and output as an audio signal, the corrected reproduction coefficient can match the frequency characteristic of the input coefficient, and the distortion of the frequency characteristic of the signal reproduced by the decoder is reduced. It is small and can maintain good reproduction sound quality.

【0029】請求項10記載の本発明は、請求項9記載
の発明において、前記補正係数取得段階が、予め決めら
れた周波数領域での小帯域毎に1個ずつの補正係数を再
生する補正係数再生段階を有することを要旨とする。
According to a tenth aspect of the present invention, in the invention of the ninth aspect, the step of obtaining the correction coefficient comprises the step of reproducing one correction coefficient for each small band in a predetermined frequency domain. The point is to have a regeneration step.

【0030】請求項10記載の本発明にあっては、予め
決められた周波数領域での小帯域毎に1個ずつの補正係
数を再生する。
According to the present invention, one correction coefficient is reproduced for each small band in a predetermined frequency domain.

【0031】また、請求項11記載の本発明は、請求項
10記載の発明において、前記周波数特性補正段階が、
予め決められた周波数領域での小帯域に含まれるすべて
の再生係数に対して前記補正係数再生段階で再生された
対応する補正係数を掛け合わせることにより周波数特性
を補正する段階を有することを要旨とする。
The present invention according to claim 11 is the invention according to claim 10, wherein the frequency characteristic correction step comprises:
A gist comprising a step of correcting the frequency characteristic by multiplying all the reproduction coefficients included in the small band in the predetermined frequency domain by the corresponding correction coefficient reproduced in the correction coefficient reproduction step. I do.

【0032】請求項11記載の本発明にあっては、予め
決められた周波数領域での小帯域に含まれるすべての再
生係数に対して補正係数再生段階で再生された対応する
補正係数を掛け合わせることにより周波数特性を補正す
る。
According to the present invention, all the reproduction coefficients included in the small band in the predetermined frequency region are multiplied by the corresponding correction coefficient reproduced in the correction coefficient reproduction stage. Thus, the frequency characteristics are corrected.

【0033】請求項12記載の本発明は、請求項9記載
の発明において、前記再生係数取得段階が、ベクトル量
子化された入力ディジタル符号を再生し、再生平坦化係
数を取得した後、入力ディジタル符号を再生して逆平坦
化情報を取得し、この逆平坦化情報を用いて、前記再生
平坦化係数を逆平坦化して再生係数を取得する段階を有
することを要旨とする。
According to a twelfth aspect of the present invention, in the ninth aspect of the present invention, the reproducing coefficient obtaining step includes the steps of: reproducing the vector-quantized input digital code and obtaining a reproduction flattening coefficient; The gist of the present invention is to include a step of reproducing codes and obtaining inverse flattening information, and using the inverse flattening information to inverse flatten the reproduction flattening coefficients to obtain reproduction coefficients.

【0034】請求項12記載の本発明にあっては、ベク
トル量子化された入力ディジタル符号を再生し、再生平
坦化係数を取得した後、入力ディジタル符号を再生して
逆平坦化情報を取得し、この逆平坦化情報を用いて、再
生平坦化係数を逆平坦化して再生係数を取得する。
According to the twelfth aspect of the present invention, after the vector-quantized input digital code is reproduced and a reproduced flattening coefficient is obtained, the input digital code is reproduced to obtain inverse flattening information. Using this inverse flattening information, the reproduction flattening coefficient is inverse flattened to obtain a reproduction coefficient.

【0035】請求項13記載の本発明は、離散サンプル
列として入力されるオーディオ信号を符号化し、ディジ
タル符号を出力するオーディオ信号符号化プログラムを
記録した記録媒体であって、前記入力オーディオ信号を
一定数の入力毎に時間−周波数変換して、周波数領域の
入力係数を取得する時間−周波数変換段階と、この周波
数領域の入力係数を符号化するとともに、この符号化情
報を符号化器出力として出力する符号化段階と、この符
号化された周波数領域の入力係数を復号化して、再生係
数を取得する復号化段階と、この取得した再生係数の周
波数特性を入力係数の周波数特性に近づけるための補正
係数を計算するとともに、該補正係数を符号化して符号
化器出力として出力する補正係数計算段階とを有するオ
ーディオ信号符号化プログラムを記録媒体に記録するこ
とを要旨とする。
According to a thirteenth aspect of the present invention, there is provided a recording medium recording an audio signal encoding program for encoding an audio signal input as a discrete sample sequence and outputting a digital code, wherein the input audio signal is fixed. A time-frequency conversion step of performing time-frequency conversion for each number input to obtain an input coefficient in the frequency domain, encoding the input coefficient in the frequency domain, and outputting this encoded information as an encoder output A decoding step of decoding the input coefficient in the frequency domain to obtain a reproduction coefficient, and correcting the frequency characteristic of the obtained reproduction coefficient to be close to the frequency characteristic of the input coefficient. Calculating a coefficient and encoding the correction coefficient to output the output as an encoder output. And summarized in that to record the program on a recording medium.

【0036】請求項13記載の本発明にあっては、入力
オーディオ信号を一定数の入力毎に時間−周波数変換し
て、周波数領域の入力係数を取得し、この周波数領域の
入力係数を符号化するとともに、この符号化情報を符号
化器出力として出力し、この周波数領域の入力係数を復
号化して、再生係数を取得し、この再生係数の周波数特
性を入力係数の周波数特性に近づけるための補正係数を
計算し、該補正係数を符号化して符号化器出力として出
力するオーディオ信号符号化プログラムを記録媒体に記
録しているため、該記録媒体を用いて、その流通性を高
めることができる。
According to the thirteenth aspect of the present invention, an input audio signal is subjected to time-frequency conversion for every fixed number of inputs to obtain an input coefficient in the frequency domain, and the input coefficient in the frequency domain is encoded. And outputs the encoded information as an encoder output, decodes the input coefficient in this frequency domain, obtains a reproduction coefficient, and corrects the frequency characteristic of the reproduction coefficient to be close to the frequency characteristic of the input coefficient. Since the audio signal encoding program for calculating the coefficient, encoding the correction coefficient and outputting the result as an encoder output is recorded on the recording medium, the distribution of the program can be improved by using the recording medium.

【0037】請求項14記載の本発明は、ディジタル符
号を入力し、離散サンプル列のオーディオ信号を出力す
るオーディオ信号復号化プログラムを記録した記録媒体
であって、前記入力ディジタル符号を復号し、周波数領
域の再生係数を取得する再生係数取得段階と、前記入力
ディジタル符号を復号し、補正係数を取得する補正係数
取得段階と、前記補正係数取得段階で取得した補正係数
を用いて、前記再生係数取得段階で取得した再生係数の
周波数特性を補正する周波数特性補正段階と、該周波数
特性補正段階で補正された再生係数を時間−周波数変換
し、オーディオ信号として出力する周波数−時間変換段
階とを有するオーディオ信号復号化プログラムを記録媒
体に記録することを要旨とする。
According to a fourteenth aspect of the present invention, there is provided a recording medium recording an audio signal decoding program for inputting a digital code and outputting an audio signal of a sequence of discrete samples, wherein the input digital code is decoded. A reproduction coefficient obtaining step of obtaining a reproduction coefficient of an area, a correction coefficient obtaining step of decoding the input digital code and obtaining a correction coefficient, and the reproduction coefficient obtaining using the correction coefficient obtained in the correction coefficient obtaining step. Audio having a frequency characteristic correction step of correcting the frequency characteristic of the reproduction coefficient obtained in the step, and a frequency-time conversion step of performing time-to-frequency conversion on the reproduction coefficient corrected in the frequency characteristic correction step and outputting it as an audio signal The gist is to record the signal decoding program on a recording medium.

【0038】請求項14記載の本発明にあっては、入力
ディジタル符号を復号し、周波数領域の再生係数および
補正係数を取得し、この取得した補正係数を用いて、再
生係数の周波数特性を補正し、この補正された再生係数
を時間−周波数変換し、オーディオ信号として出力する
オーディオ信号符号化プログラムを記録媒体に記録して
いるため、該記録媒体を用いて、その流通性を高めるこ
とができる。
According to the present invention, an input digital code is decoded, a reproduction coefficient and a correction coefficient in a frequency domain are obtained, and the obtained correction coefficient is used to correct the frequency characteristic of the reproduction coefficient. Then, since the audio signal encoding program for performing time-frequency conversion of the corrected reproduction coefficient and outputting the audio signal as an audio signal is recorded on a recording medium, it is possible to use the recording medium to enhance its circulation. .

【0039】請求項15記載の本発明は、離散サンプル
列として入力されるオーディオ信号を符号化し、ディジ
タル符号を出力する符号化部、および該符号化部から出
力されるディジタル符号を入力して復号し、離散サンプ
ル列のオーディオ信号を出力する復号化部を有するオー
ディオ信号符号化/復号化装置であって、前記符号化部
は、前記入力オーディオ信号を一定数の入力毎に時間−
周波数変換して、周波数領域の入力係数を出力する時間
−周波数変換手段と、この時間−周波数変換手段から出
力される周波数領域の入力係数を平坦化し、平坦化入力
係数を出力する平坦化手段と、この平坦化手段から出力
される平坦化入力係数をベクトル量子化して符号化し、
ベクトル量子化情報を出力するベクトル量子化手段と、
このベクトル量子化手段から出力されるベクトル量子化
情報を再生し、再生平坦化係数を出力するベクトル再生
手段と、このベクトル再生手段から出力される再生平坦
化係数に対して前記平坦化手段で行った平坦化と逆の操
作である逆平坦化を行って、再生係数を出力する逆平坦
化手段と、この逆平坦化手段から出力される再生係数お
よび前記時間−周波数変換手段から出力される入力係数
を比較し、再生係数の周波数特性を入力係数の周波数特
性に近づけるための補正係数を計算する補正係数計算手
段と、前記平坦化手段から出力される平坦化入力係数、
前記ベクトル量子化手段から出力されるベクトル量子化
情報、および前記補正係数計算手段から出力される補正
係数を多重化して出力する多重化手段とを有し、前記復
号化部は、前記符号化部の多重化手段から入力される多
重化情報を受信し、前記多重化と逆の手順により前記平
坦化入力係数、ベクトル量子化情報、および補正係数に
それぞれ対応する符号に分解して出力する逆多重化手段
と、該逆多重化手段から出力される前記補正係数に対応
する符号を再生して、補正係数を出力する補正係数再生
手段と、前記逆多重化手段から出力される前記ベクトル
量子化情報に対応する符号を再生して、再生平坦化係数
を出力するベクトル再生手段と、前記逆多重化手段から
出力される前記平坦化入力係数に対応する符号を再生し
て、逆平坦化情報を取得するとともに、前記ベクトル再
生手段からの再生平坦化係数を逆平坦化して、再生係数
を出力する逆平坦化手段と、前記補正係数再生手段から
出力される補正係数を用いて、前記逆平坦化手段から出
力される再生係数の周波数特性を補正する周波数特性補
正手段と、該周波数特性補正手段で補正された再生係数
を周波数−時間変換し、離散サンプル列のオーディオ信
号を出力する周波数−時間変換手段とを有することを要
旨とする。
According to a fifteenth aspect of the present invention, there is provided an encoding section for encoding an audio signal input as a sequence of discrete samples and outputting a digital code, and a decoding section for inputting and decoding a digital code output from the encoding section. An audio signal encoding / decoding device having a decoding unit for outputting an audio signal of a discrete sample sequence, wherein the encoding unit converts the input audio signal into a time-sequential signal every predetermined number of inputs.
Time-frequency converting means for performing frequency conversion and outputting an input coefficient in a frequency domain; flattening means for flattening an input coefficient in a frequency domain output from the time-frequency converting means and outputting a flattened input coefficient; , Vector quantization and encoding of the flattened input coefficient output from the flattening means,
Vector quantization means for outputting vector quantization information,
A vector reproducing unit that reproduces the vector quantization information output from the vector quantizing unit and outputs a reproduction flattening coefficient, and performs the reproduction flattening coefficient output from the vector reproducing unit by the flattening unit. Inverse flattening means for performing inverse flattening, which is an operation opposite to the flattening, to output a reproduction coefficient, a reproduction coefficient output from the inverse flattening means, and an input output from the time-frequency conversion means. Comparing the coefficients, a correction coefficient calculating means for calculating a correction coefficient for bringing the frequency characteristic of the reproduction coefficient closer to the frequency characteristic of the input coefficient, and a flattening input coefficient output from the flattening means,
Multiplexing means for multiplexing and outputting the vector quantization information output from the vector quantization means and the correction coefficient output from the correction coefficient calculation means, and wherein the decoding section comprises: Receiving the multiplexing information input from the multiplexing means, and decomposing the multiplexed information into codes corresponding to the flattened input coefficient, the vector quantization information, and the correction coefficient by a procedure reverse to the multiplexing and outputting the code. Multiplexing means, a correction coefficient reproducing means for reproducing a code corresponding to the correction coefficient output from the demultiplexing means and outputting a correction coefficient, and the vector quantization information output from the demultiplexing means. And a vector reproducing means for outputting a reproduced flattening coefficient and reproducing a code corresponding to the flattening input coefficient outputted from the demultiplexing means, and reproducing the inverse flattening information. Acquiring and inverse flattening the reproduction flattening coefficient from the vector reproduction means, and using the correction coefficient output from the correction coefficient reproduction means, Frequency characteristic correction means for correcting the frequency characteristic of the reproduction coefficient output from the means, and frequency-time conversion for frequency-time converting the reproduction coefficient corrected by the frequency characteristic correction means and outputting an audio signal of a discrete sample sequence And the means.

【0040】請求項15記載の本発明にあっては、符号
化部においては入力オーディオ信号を一定数の入力毎に
時間−周波数変換手段で時間−周波数変換して、周波数
領域の入力係数を出力し、この周波数領域の入力係数を
平坦化手段で平坦化し、平坦化入力係数を出力し、この
平坦化入力係数をベクトル量子化手段でベクトル量子化
して符号化し、ベクトル量子化情報を出力し、このベク
トル量子化情報をベクトル再生手段で再生し、再生平坦
化係数を出力し、この再生平坦化係数に対して逆平坦化
手段で逆平坦化を行って、再生係数を出力し、この再生
係数および時間−周波数変換手段からの入力係数を比較
し、再生係数の周波数特性を入力係数の周波数特性に近
づけるための補正係数を補正係数計算手段で計算し、平
坦化入力係数、ベクトル量子化情報、および補正係数を
多重化手段で多重化して出力し、復号化部においては符
号化部の多重化手段からの情報を受信し、平坦化入力係
数、ベクトル量子化情報、および補正係数にそれぞれ対
応する符号に分解し、補正係数に対応する符号を補正係
数再生手段で再生して補正係数を出力し、ベクトル量子
化情報に対応する符号をベクトル再生手段で再生して再
生平坦化係数を出力し、平坦化入力係数に対応する符号
を再生して、逆平坦化情報を取得するとともに、ベクト
ル再生手段からの再生平坦化係数を逆平坦化手段で逆平
坦化して、再生係数を出力し、周波数特性補正手段で補
正係数を用いて再生係数の周波数特性を補正し、この補
正された再生係数を周波数−時間変換手段で周波数−時
間変換し、離散サンプル列のオーディオ信号を出力する
ため、補正係数を用いて再生係数の周波数特性を補正し
て、補正後再生係数の周波数特性を入力係数の周波数特
性に一致させることができ、復号器側で再生される信号
の周波数特性の歪みは小さく、再生音質を良好に保つこ
とができる。
According to a fifteenth aspect of the present invention, the encoding section performs time-frequency conversion on the input audio signal by a time-frequency conversion means for every fixed number of inputs, and outputs an input coefficient in the frequency domain. Then, the input coefficients in the frequency domain are flattened by the flattening means, a flattened input coefficient is output, the flattened input coefficients are vector-quantized and coded by the vector quantization means, and vector quantization information is output. The vector quantization information is reproduced by the vector reproduction means, a reproduction flattening coefficient is output, and the reproduction flattening coefficient is inverse-flattened by the inverse flattening means to output a reproduction coefficient. And the input coefficient from the time-frequency conversion means, and a correction coefficient for making the frequency characteristic of the reproduction coefficient close to the frequency characteristic of the input coefficient is calculated by the correction coefficient calculation means. Multiplexed by the multiplexing means, and the decoding unit receives the information from the multiplexing unit of the encoding unit, and outputs the flattened input coefficient, the vector quantization information, and the correction information. The code is decomposed into codes corresponding to the coefficients, the code corresponding to the correction coefficient is reproduced by the correction coefficient reproducing means, the correction coefficient is output, and the code corresponding to the vector quantization information is reproduced by the vector reproducing means to reproduce and flatten. The coefficient is output, the code corresponding to the flattening input coefficient is reproduced, and the inverse flattening information is obtained, and the reproduced flattening coefficient from the vector reproducing means is inverse-flattened by the inverse flattening means, and the reproduction coefficient is calculated. The frequency characteristic of the reproduction coefficient is corrected by the frequency characteristic correction means using the correction coefficient, and the corrected reproduction coefficient is frequency-time converted by the frequency-time conversion means to output the audio data of the discrete sample sequence. In order to output the signal, the frequency characteristic of the reproduction coefficient is corrected using the correction coefficient, the frequency characteristic of the corrected reproduction coefficient can be made to match the frequency characteristic of the input coefficient, and the signal reproduced on the decoder side. , The distortion of the frequency characteristic is small, and the reproduced sound quality can be kept good.

【0041】[0041]

【発明の実施の形態】以下、図面を用いて本発明の実施
の形態を説明する。図1は、本発明の一実施形態に係る
オーディオ信号符号化/復号化装置の構成を示すブロッ
ク図である。同図に示すオーディオ信号符号化/復号化
装置は、離散サンプル列として入力されるオーディオ信
号を符号化し、ディジタル符号を出力する符号化部1
0、および該符号化部10から出力されるディジタル符
号を入力して復号し、離散サンプル列であるオーディオ
信号を出力する復号化部20から構成されている。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram illustrating a configuration of an audio signal encoding / decoding device according to an embodiment of the present invention. An audio signal encoding / decoding device shown in FIG. 1 encodes an audio signal input as a sequence of discrete samples and outputs a digital code.
And a decoding unit 20 that inputs and decodes 0 and a digital code output from the coding unit 10 and outputs an audio signal as a discrete sample sequence.

【0042】符号化部10は、入力オーディオ信号を一
定数の入力毎に時間−周波数変換して、周波数領域の入
力係数を出力する時間−周波数変換部1、時間−周波数
変換部1から出力される周波数領域の入力係数を平坦化
し、平坦化入力係数を出力する平坦化部3、この平坦化
部3から出力される平坦化入力係数をベクトル量子化し
て符号化し、ベクトル量子化情報を出力するベクトル量
子化部5、このベクトル量子化部5から出力されるベク
トル量子化情報を再生し、再生平坦化係数を出力するベ
クトル再生部7、このベクトル再生部7から出力される
再生平坦化係数に対して平坦化部3で行った平坦化と逆
の操作である逆平坦化を行って、再生係数を出力する逆
平坦化部9、この逆平坦化部9から出力される再生係数
および時間−周波数変換部1から出力される入力係数を
比較し、再生係数の周波数特性を入力係数の周波数特性
に近づけるための補正係数を計算する補正係数計算部1
1、および平坦化部3から出力される平坦化入力係数、
ベクトル量子化部5から出力されるベクトル量子化情
報、および補正係数計算部11から出力される補正係数
を多重化して出力する多重化部13から構成されてい
る。
The encoding unit 10 performs time-frequency conversion on the input audio signal for each predetermined number of inputs, and outputs the input coefficients in the frequency domain from the time-frequency conversion unit 1 and the time-frequency conversion unit 1. A flattening unit 3 for flattening an input coefficient in a frequency domain to output a flattened input coefficient, vector-encoding and coding the flattened input coefficient output from the flattening unit 3, and outputting vector quantization information. A vector quantization unit 5, a vector reproduction unit 7 that reproduces vector quantization information output from the vector quantization unit 5 and outputs a reproduction flattening coefficient, and a reproduction flattening coefficient output from the vector reproduction unit 7 On the other hand, inverse flattening, which is the reverse operation of the flattening performed by the flattening unit 3, is performed, and the inverse flattening unit 9 that outputs the reproduction coefficient, the reproduction coefficient output from the inverse flattening unit 9, and the time- frequency Comparing the input coefficients output from the converter unit 1, the correction coefficient calculation unit 1 for calculating a correction coefficient for approximating the frequency characteristics of the input coefficients frequency characteristic of the reproduction coefficients
1, and a flattening input coefficient output from the flattening unit 3;
A multiplexing unit 13 multiplexes and outputs vector quantization information output from the vector quantization unit 5 and correction coefficients output from the correction coefficient calculation unit 11.

【0043】また、復号化部20は、符号化部10の多
重化部13から出力される多重化情報を受信し、多重化
部13の多重化と逆の手順により前記平坦化入力係数、
ベクトル量子化情報、および補正係数に対応するそれぞ
れの符号を分解して出力する逆多重化部21、この逆多
重化部21から出力される補正係数に対応する符号を再
生して、補正係数を出力する補正係数再生部23、前記
逆多重化部21から出力されるベクトル量子化情報に対
応する符号を再生して、再生平坦化係数を出力するベク
トル再生部25、前記逆多重化部21から出力される平
坦化入力係数に対応する符号を再生して、逆平坦化情報
を取得するとともに、ベクトル再生部25からの再生平
坦化係数を逆平坦化して、再生係数を出力する逆平坦化
部27、前記補正係数再生部23から出力される補正係
数を用いて、逆平坦化部27から出力される再生係数の
周波数特性を補正する周波数特性補正部29、この周波
数特性補正部29で補正された再生係数を周波数−時間
変換し、離散サンプル列のオーディオ信号を出力する周
波数−時間変換部31から構成されている。
The decoding section 20 receives the multiplexed information output from the multiplexing section 13 of the encoding section 10 and performs the above-mentioned flattening input coefficient,
A demultiplexing unit 21 that decomposes and outputs the respective codes corresponding to the vector quantization information and the correction coefficient, reproduces a code corresponding to the correction coefficient output from the demultiplexing unit 21, and The correction coefficient reproducing unit 23 for outputting, the vector reproducing unit 25 for reproducing a code corresponding to the vector quantization information output from the demultiplexing unit 21 and outputting a reproduced flattening coefficient, and the demultiplexing unit 21 An inverse flattening unit that reproduces a code corresponding to the output flattening input coefficient to obtain inverse flattening information, and inversely flattens the reproduced flattening coefficient from the vector reproducing unit 25 and outputs a reproduction coefficient 27, a frequency characteristic correction unit 29 for correcting the frequency characteristic of the reproduction coefficient output from the inverse flattening unit 27 using the correction coefficient output from the correction coefficient reproduction unit 23, and the frequency characteristic correction unit 29 A corrected reproduced coefficient frequency - converting time, frequency and outputs the audio signal of the discrete sample sequence - and a time conversion unit 31.

【0044】更に詳しくは、符号化部10に入力される
オーディオ信号は、離散サンプル列として時間−周波数
変換部1に入力され、一定数Nの入力毎に時間−周波数
変換を受け、N個の周波数領域の入力係数に変換され
る。この時間−周波数変換の方法としては、離散コサイ
ン変換(DCT)や、変形離散コサイン変換(MDC
T)を用いることができる。変換方法として変形離散コ
サイン変換を用いる場合には、N個の入力毎に過去2×
N個の入力オーディオサンプルを変換してN個の周波数
領域の入力係数を得る。時間−周波数変換処理を行う直
前にハミング窓やハニング窓などの窓関数を掛けてもよ
い。Nの値は、時間−周波数変換アルゴリズムに適用で
きるどのようなものを適用してもよいが、128から2
048の間の値を使うと最も効果が高い。
More specifically, the audio signal input to the encoding unit 10 is input to the time-frequency conversion unit 1 as a sequence of discrete samples, and is subjected to time-frequency conversion for every fixed number N of inputs. It is converted to frequency domain input coefficients. As a method of the time-frequency transform, a discrete cosine transform (DCT) or a modified discrete cosine transform (MDC) is used.
T) can be used. When the modified discrete cosine transform is used as the transform method, the past 2 ×
Transform the N input audio samples to obtain N frequency domain input coefficients. Immediately before performing the time-frequency conversion processing, a window function such as a Hamming window or a Hanning window may be multiplied. The value of N may be any value applicable to the time-frequency conversion algorithm,
Using a value between 0 and 048 is most effective.

【0045】時間−周波数変換部1で得られた入力係数
は、平坦化部3で平坦化され、平坦化入力係数を得る。
平坦化の方法としては、例えば、入力信号を線形予測分
析して得られた線形予測係数をインパルス応答としたフ
ィルタ係数を周波数領域に変換し、得られたスペクトル
振幅を入力係数に掛け合わせてもよいし、周波数領域の
係数をサブバンド分割し、サブバンド毎に入力係数を強
弱により1系統以上に分類してから、各々のサブバンド
・系統毎に代表値を与え、正規化を行ってもよい。ま
た、これらの平坦化の方法は順次行うことにより併用し
てもよい。
The input coefficients obtained by the time-frequency conversion unit 1 are flattened by the flattening unit 3 to obtain flattened input coefficients.
As a method of flattening, for example, a linear prediction coefficient obtained by performing a linear prediction analysis on an input signal is converted into an impulse response using a filter coefficient converted into a frequency domain, and the obtained spectrum amplitude is multiplied by the input coefficient. Alternatively, the frequency domain coefficients may be divided into sub-bands, and input coefficients may be classified into one or more systems for each sub-band according to the strength, and then a representative value may be given to each sub-band / system to perform normalization. Good. In addition, these flattening methods may be used together by performing them sequentially.

【0046】平坦化情報は逆平坦化部9および27で必
要なため、逆平坦化に必要な情報を多重化部13に送ら
れる。上記線形予測による平坦化の方法では、線形予測
係数が逆平坦化に必要な情報であり、線形予測係数を符
号化可能な情報に変換し平坦化情報とする。上記サブバ
ンド毎の代表値による平坦化の方法では、サブバンド毎
の代表値が逆平坦化に必要な情報であり、サブバンド毎
の代表値を符号化可能な情報に変換して平坦化情報とす
る。
Since the flattening information is required by the inverse flattening units 9 and 27, information necessary for the inverse flattening is sent to the multiplexing unit 13. In the flattening method using the linear prediction, the linear prediction coefficient is information necessary for inverse flattening, and the linear prediction coefficient is converted into coderable information to obtain flattening information. In the flattening method using the representative value for each sub-band, the representative value for each sub-band is information necessary for inverse flattening. And

【0047】なお、上記平坦化において、線形予測係数
やサブバンド・系統毎の代表値などの平坦化に必要な値
は、上記符号化可能な平坦化情報を再生して得られたも
のを用いてもよい。ここでは、係数の平坦化方法の例と
して、線形予測分析によるものと、サブバンド・系統毎
の代表値によるものを挙げたが、平坦化の手法のバリエ
ーションはこの他にも多数存在する。
In the above-mentioned flattening, values required for flattening, such as linear prediction coefficients and representative values for each subband / system, are those obtained by reproducing the above-mentioned coded flattening information. You may. Here, as examples of the coefficient flattening method, a method based on a linear prediction analysis and a method based on a representative value for each subband / system are listed, but there are many other variations of the flattening method.

【0048】平坦化部3で得られた平坦化入力係数は、
ベクトル量子化部5でベクトル量子化される。量子化結
果である量子化インデックス情報はベクトル再生部7に
送られるとともに、2進数化して多重化部13に送られ
る。平坦化入力係数は数が多いので、一括してベクトル
量子化を行うことは困難であるため、何らかの方法で平
坦化入力係数を分割してから複数回にわたってベクトル
量子化する分割ベクトル量子化を使う。この分割ベクト
ル量子化方法として、重み付きインタリーブベクトル量
子化の方法をとると特に高い効果が得られる。
The flattening input coefficient obtained by the flattening unit 3 is
The vector quantization section 5 performs vector quantization. The quantization index information, which is the quantization result, is sent to the vector reproducing unit 7 and is also converted into a binary number and sent to the multiplexing unit 13. Since the number of flattening input coefficients is large, it is difficult to perform vector quantization in a lump. Use split vector quantization that divides the flattening input coefficient by some method and then performs vector quantization multiple times. . As a method of quantizing the divided vector, a particularly high effect can be obtained by using a method of weighted interleave vector quantization.

【0049】ベクトル再生部7では、ベクトル量子化部
5から送られた量子化インデックス情報を再生し、再生
平坦化係数を得る。ベクトル量子化部5では、分割ベク
トル量子化を行っているため、ベクトル再生は複数回に
わたり、得られたベクトル群をベクトル量子化部5にお
ける分割の規則に従って再構成して再生平坦化係数を得
る。再生平坦化係数は、逆平坦化部9に送られる。
The vector reproduction section 7 reproduces the quantization index information sent from the vector quantization section 5 to obtain a reproduction flattening coefficient. Since the vector quantization unit 5 performs the division vector quantization, the vector reproduction is performed a plurality of times, and the obtained vector group is reconfigured according to the division rule in the vector quantization unit 5 to obtain a reproduction flattening coefficient. . The reproduction flattening coefficient is sent to the inverse flattening unit 9.

【0050】逆平坦化部9では、ベクトル再生部7で得
られた再生平坦化係数に対して平坦化部3で行った平坦
化と逆の操作を行い、再生係数を得る。平坦化部3で線
形予測分析を用いた平坦化方法を適用した場合には、平
坦化部3から送られてきた線形予測係数情報を再生し、
得られた再生予測係数をインパルス応答としたフィルタ
を周波数領域に変換し、得られたスペクトル振幅の逆数
を再生平坦化係数に掛け合わせることにより逆平坦化を
行う。平坦化部3でサブバンド・系統毎の代表値で平坦
化する方法を適用した場合には、平坦化部3から送られ
てきた代表値情報により逆正規化することにより逆平坦
化を行う。平坦化部3で平坦化の方法を併用した場合に
は、同様に、順次各々の方法で逆平坦化を行うことによ
り逆平坦化方法を併用する。
The inverse flattening section 9 performs a reverse operation of the flattening performed by the flattening section 3 on the reproduction flattening coefficient obtained by the vector reproducing section 7 to obtain a reproduction coefficient. When a flattening method using linear prediction analysis is applied in the flattening unit 3, the linear prediction coefficient information sent from the flattening unit 3 is reproduced,
A filter using the obtained reproduction prediction coefficient as an impulse response is converted into a frequency domain, and inverse flattening is performed by multiplying the reciprocal of the obtained spectrum amplitude by a reproduction flattening coefficient. When the flattening unit 3 applies a method of flattening with a representative value for each sub-band / system, inverse flattening is performed by inverse normalization using the representative value information sent from the flattening unit 3. When a flattening method is used in combination with the flattening unit 3, similarly, the reverse flattening method is used together by sequentially performing the reverse flattening by each method.

【0051】補正係数計算部11では、逆平坦化部9で
得られた再生係数と時間−周波数変換部1で得られた入
力係数を比較し、補正係数を計算する。
The correction coefficient calculation section 11 compares the reproduction coefficient obtained by the inverse flattening section 9 with the input coefficient obtained by the time-frequency conversion section 1 and calculates a correction coefficient.

【0052】補正係数計算部11の詳細について図2を
参照して説明する。補正係数計算部11は、図2に示す
ように、逆平坦化部9からの再生係数を複数の係数毎に
複数の小帯域に分割する小帯域分割部111、および時
間−周波数変換部1からの入力係数を複数の係数毎に複
数の小帯域に分割する小帯域分割部113を有する。な
お、小帯域の幅Mは、帯域によらず一定でもよいし、帯
域毎に値を変化させてもよい。帯域毎に値を変化させる
場合、周波数軸をバーク尺度上に投影し、バーク尺度上
で帯域幅が等間隔となるようにMを決めると特に高能率
である。図2では、小帯域数が4で示されているが、小
帯域数はもちろん4に限定されない。フレームの係数の
数が2048程度の時には、帯域数を40程度にすると
効果が高い。
The details of the correction coefficient calculator 11 will be described with reference to FIG. As shown in FIG. 2, the correction coefficient calculation unit 11 includes a small band division unit 111 that divides the reproduction coefficient from the inverse flattening unit 9 into a plurality of small bands for each of a plurality of coefficients, and a time-frequency conversion unit 1. Is divided into a plurality of small bands for each of a plurality of coefficients. Note that the width M of the small band may be constant regardless of the band, or the value may be changed for each band. When changing the value for each band, it is particularly efficient to project the frequency axis on the Bark scale and determine M so that the bandwidths are equally spaced on the Bark scale. In FIG. 2, the number of small bands is indicated by four, but the number of small bands is not limited to four. When the number of frame coefficients is about 2048, it is effective to set the number of bands to about 40.

【0053】次に、各小帯域毎に、補正係数計算器11
5〜121で補正係数を計算する。補正係数rの一例と
して、次式のように、補正後の再生係数のパワーが入力
係数のパワーと一致するように決定してもよい。
Next, the correction coefficient calculator 11
The correction coefficient is calculated in 5-121. As an example of the correction coefficient r, the power of the corrected reproduction coefficient may be determined to be equal to the power of the input coefficient as in the following equation.

【0054】[0054]

【数1】 ここで、xは、計算対象の小帯域内の入力係数、yは、
計算対象の小帯域内の再生係数である。あるいは、次式
のように、補正後の再生係数と入力係数の誤差が最小に
なるように計算してもよい。
(Equation 1) Here, x is an input coefficient in a small band to be calculated, and y is
It is a reproduction coefficient in a small band to be calculated. Alternatively, the calculation may be performed such that the error between the corrected reproduction coefficient and the input coefficient is minimized as in the following equation.

【0055】[0055]

【数2】 また、上記の計算方法のうち最適な方法を小帯域によっ
て選択してもよい。選択方法は、例えば帯域内での入力
係数の大きさの平坦度を計算し、平坦度が低い場合上記
(1)式の方法で補正係数を決定し、平坦度が高い場合
上記(2)式で補正係数を決定すると良好な性能が得ら
れる。
(Equation 2) Further, an optimal method among the above calculation methods may be selected according to the small band. As a selection method, for example, the flatness of the magnitude of the input coefficient in the band is calculated, and if the flatness is low, the correction coefficient is determined by the method of the above equation (1). If the correction coefficient is determined by, good performance can be obtained.

【0056】補正係数計算器115〜121で計算され
た補正係数は、補正係数符号化器123〜129で符号
化される。符号化の方法としては、スカラー量子化を行
い、量子化インデックスを2進数化したり、スカラー量
子化して得られた量子化インデックスをハフマン符号化
や算術符号化などのエントロピー符号化したりする方法
などが適用できる。なお、補正係数の量子化に先立ち、
対数などの非線形関数を適用しておいてもよい。
The correction coefficients calculated by the correction coefficient calculators 115 to 121 are encoded by the correction coefficient encoders 123 to 129. As a coding method, there is a method of performing scalar quantization and binarizing a quantization index, or entropy coding of a quantization index obtained by scalar quantization such as Huffman coding or arithmetic coding. Applicable. Before quantizing the correction coefficient,
A non-linear function such as logarithm may be applied.

【0057】多重化部13では、平坦化部3、ベクトル
量子化部5および補正係数計算部11からの入力情報の
すべてを出力ビット列として出力する。多重化部13か
ら出力されるビット列は符号化部10の出力となり、復
号化部20の逆多重化部21に渡される。
The multiplexing unit 13 outputs all of the input information from the flattening unit 3, the vector quantization unit 5, and the correction coefficient calculation unit 11 as an output bit string. The bit string output from the multiplexing unit 13 becomes the output of the encoding unit 10 and is passed to the demultiplexing unit 21 of the decoding unit 20.

【0058】復号化部20の逆多重化部21では、符号
化部10から出力されたビット列を入力し、多重化部1
3と逆の手順により、補正係数再生部23への符号、ベ
クトル再生部25への符号、および逆平坦化部27への
符号に分解し、各々を補正係数再生部23、ベクトル再
生部25および逆平坦化部27へ送る。
The demultiplexing unit 21 of the decoding unit 20 receives the bit string output from the encoding unit 10 and
3 is decomposed into a code to the correction coefficient reproducing unit 23, a code to the vector reproducing unit 25, and a code to the inverse flattening unit 27, each of which is divided into the correction coefficient reproducing unit 23, the vector reproducing unit 25, It is sent to the reverse flattening unit 27.

【0059】補正係数再生部23では、逆多重化部21
からの符号を再生して補正係数を得る。復号化は補正係
数計算部11における補正係数符号化器と逆の方法で行
うが、2進数化されているスカラー量子化インデックス
を再生したり、ハフマン符号や算術符号などのエントロ
ピー符号を復号化して得られたスカラー量子化インデッ
クスを再生するなどの方法がある。なお、補正係数計算
部11における補正係数符号化器において、対数などの
非線形関数を用いた場合、量子化インデックス再生後、
指数関数などの逆関数を適用する。
In the correction coefficient reproducing section 23, the demultiplexing section 21
The code from is reproduced to obtain a correction coefficient. Decoding is performed in a manner opposite to that of the correction coefficient encoder in the correction coefficient calculation unit 11. For example, there is a method of reproducing the obtained scalar quantization index. When a non-linear function such as logarithm is used in the correction coefficient encoder in the correction coefficient calculation unit 11, after reproducing the quantization index,
Apply an inverse function such as an exponential function.

【0060】ベクトル再生部25では、逆多重化部21
からの符号を再生して再生平坦化係数を得る。再生の手
法はベクトル再生部7と同様である。
In the vector reproducing section 25, the demultiplexing section 21
Are reproduced to obtain a reproduction flattening coefficient. The reproduction method is the same as that of the vector reproduction unit 7.

【0061】逆平坦化部27では、逆多重化部21から
の符号を再生して逆平坦化情報を得るとともに、ベクト
ル再生部25からの再生平坦化係数を逆平坦化して再生
係数を得る。逆平坦化の手法は逆平坦化部9と同様であ
る。
The inverse flattening section 27 reproduces the code from the demultiplexing section 21 to obtain inverse flattening information, and also inversely flattens the reproduction flattening coefficient from the vector reproducing section 25 to obtain a reproduction coefficient. The method of inverse flattening is the same as that of the inverse flattening unit 9.

【0062】周波数特性補正部29では、補正係数再生
部23からの補正係数と逆平坦化部27からの再生係数
を入力し、周波数特性を補正して補正後再生係数を周波
数−時間変換部31へ出力する。
The frequency characteristic correction unit 29 receives the correction coefficient from the correction coefficient reproduction unit 23 and the reproduction coefficient from the inverse flattening unit 27, corrects the frequency characteristics, and outputs the corrected reproduction coefficient to the frequency-time conversion unit 31. Output to

【0063】周波数特性補正部29の詳細について図3
を参照して説明する。周波数特性補正部29は、図3に
示すように、逆平坦化部27からの再生係数を複数の小
帯域に分割する小帯域分割部211を有する。なお、こ
の小帯域分割部211における分割の規則は、補正係数
計算部11における小帯域分割と同様である。
FIG. 3 shows details of the frequency characteristic correction section 29.
This will be described with reference to FIG. As shown in FIG. 3, the frequency characteristic correction unit 29 includes a small band dividing unit 211 that divides the reproduction coefficient from the inverse flattening unit 27 into a plurality of small bands. Note that the division rule in the small band division unit 211 is the same as that in the small band division in the correction coefficient calculation unit 11.

【0064】次に、小帯域分割部211で分割された小
帯域毎にすべての係数に対して補正係数再生部23から
の補正係数を乗算器213〜219において掛け合わ
せ、係数の補正を行う。それから、乗算器213〜21
9で補正された係数を元の全帯域の係数列に帯域結合器
221で結合し、得られた補正後再生係数を出力する。
Next, for each of the small bands divided by the small band dividing unit 211, all the coefficients are multiplied by the correction coefficients from the correction coefficient reproducing unit 23 in multipliers 213 to 219 to correct the coefficients. Then, the multipliers 213 to 21
The coefficient corrected in step 9 is combined with the original coefficient sequence of all bands by the band combiner 221 and the obtained corrected reproduction coefficient is output.

【0065】周波数−時間変換部31では、周波数特性
補正部29からの補正後再生係数に周波数−時間変換を
掛けてオーディオ信号を出力する。周波数−時間変換の
方法としては、逆離散コサイン変換(IDCT)や、逆
変形離散コサイン変換(IMDCT)を用いることがで
きる。変換方法として逆変形離散コサイン変換を用いる
場合には、N個の入力係数を変換して2N個の時間領域
のサンプルを得る。このサンプルに窓関数を掛けた後、
現フレームの前半Nサンプルと1つ前のフレームの後半
Nサンプル同士を加え合わせて得られたNサンプルを出
力とする。
The frequency-time conversion section 31 multiplies the corrected reproduction coefficient from the frequency characteristic correction section 29 by frequency-time conversion to output an audio signal. As a method of the frequency-time transform, an inverse discrete cosine transform (IDCT) or an inverse modified discrete cosine transform (IMDCT) can be used. When the inverse transformed discrete cosine transform is used as the transform method, N input coefficients are transformed to obtain 2N time domain samples. After multiplying this sample by the window function,
An N sample obtained by adding the first half N samples of the current frame and the second half N samples of the immediately preceding frame is output.

【0066】なお、上記実施形態のオーディオ信号符号
化方法およびオーディオ信号復号化方法の処理手順をプ
ログラムとして記録媒体に記録して、この記録媒体をコ
ンピュータシステムに組み込むとともに、該記録媒体に
記録されたプログラムをコンピュータシステムにダウン
ロードまたはインストールし、該プログラムでコンピュ
ータシステムを作動させることにより、オーディオ信号
符号化方法およびオーディオ信号復号化方法を実施する
オーディオ信号符号化/復号化装置として機能させるこ
とができることは勿論であり、このような記録媒体を用
いることにより、その流通性を高めることができるもの
である。
The processing procedure of the audio signal encoding method and the audio signal decoding method of the above embodiment is recorded as a program on a recording medium, and this recording medium is incorporated in a computer system and recorded on the recording medium. By downloading or installing a program in a computer system and operating the computer system with the program, it is possible to function as an audio signal encoding / decoding device that performs an audio signal encoding method and an audio signal decoding method. Needless to say, by using such a recording medium, its distribution can be enhanced.

【0067】[0067]

【発明の効果】以上説明したように、本発明によれば、
符号化器において入力オーディオ信号を一定数の入力毎
に時間−周波数変換して、周波数領域の入力係数を取得
し、この周波数領域の入力係数を符号化し、この符号化
された周波数領域の入力係数を復号化して、再生係数を
取得し、この再生係数の周波数特性を入力係数の周波数
特性に近づけるための補正係数を計算し、該補正係数を
符号化して符号化器出力として出力するので、この補正
係数を用いて再生係数の周波数特性を補正することによ
り補正後再生係数の周波数特性を入力係数の周波数特性
に一致させることができ、復号化器で再生される信号の
周波数特性の歪みが少ないように周波数特性を少ない演
算量と補助情報で補正でき、再生音質の劣化を防止し、
再生音質を向上することができる。
As described above, according to the present invention,
An encoder performs time-frequency conversion on the input audio signal for each fixed number of inputs, obtains an input coefficient in the frequency domain, encodes the input coefficient in the frequency domain, and encodes the input coefficient in the encoded frequency domain. To obtain a reproduction coefficient, calculate a correction coefficient for bringing the frequency characteristic of the reproduction coefficient closer to the frequency characteristic of the input coefficient, encode the correction coefficient, and output it as an encoder output. By correcting the frequency characteristic of the reproduction coefficient using the correction coefficient, the frequency characteristic of the corrected reproduction coefficient can be made to match the frequency characteristic of the input coefficient, and the distortion of the frequency characteristic of the signal reproduced by the decoder is small. In this way, the frequency characteristics can be corrected with a small amount of calculation and auxiliary information, preventing the deterioration of the reproduction sound quality,
The reproduction sound quality can be improved.

【0068】また、本発明によれば、復号化器において
は入力ディジタル符号を復号し、周波数領域の再生係数
および補正係数を取得し、この補正係数を用いて、再生
係数の周波数特性を補正し、この補正された再生係数を
時間−周波数変換し、オーディオ信号として出力するの
で、補正後再生係数は入力係数の周波数特性に一致で
き、復号化器で再生される信号の周波数特性の歪みは小
さく、再生音質を向上することができる。
According to the present invention, a decoder decodes an input digital code, obtains a reproduction coefficient and a correction coefficient in the frequency domain, and corrects the frequency characteristic of the reproduction coefficient using the correction coefficient. Since the corrected reproduction coefficient is subjected to time-frequency conversion and output as an audio signal, the corrected reproduction coefficient can match the frequency characteristic of the input coefficient, and the distortion of the frequency characteristic of the signal reproduced by the decoder is small. Thus, the reproduction sound quality can be improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施形態に係るオーディオ信号符号
化/復号化装置の構成を示すブロック図である。
FIG. 1 is a block diagram illustrating a configuration of an audio signal encoding / decoding device according to an embodiment of the present invention.

【図2】図1に示すオーディオ信号符号化/復号化装置
に使用されている補正係数計算部の詳細な構成を示す図
である。
FIG. 2 is a diagram showing a detailed configuration of a correction coefficient calculation unit used in the audio signal encoding / decoding device shown in FIG.

【図3】図1に示すオーディオ信号符号化/復号化装置
に使用されている周波数特性補正部の詳細な構成を示す
図である。
FIG. 3 is a diagram illustrating a detailed configuration of a frequency characteristic correction unit used in the audio signal encoding / decoding device illustrated in FIG. 1;

【図4】従来のオーディオ信号符号化/復号化装置の構
成を示す図である。
FIG. 4 is a diagram showing a configuration of a conventional audio signal encoding / decoding device.

【符号の説明】[Explanation of symbols]

1 時間−周波数変換部 3 平坦化部 5 ベクトル量子化部 7,25 ベクトル再生部 9,27 逆平坦化部 11 補正係数計算部 13 多重化部 21 逆多重化部 23 補正係数再生部 29 周波数特性補正部 31 周波数−時間変換部 DESCRIPTION OF SYMBOLS 1 Time-frequency conversion part 3 Flattening part 5 Vector quantization part 7, 25 Vector reproduction part 9, 27 De-flattening part 11 Correction coefficient calculation part 13 Multiplexing part 21 Demultiplexing part 23 Correction coefficient reproduction part 29 Frequency characteristic Correction unit 31 Frequency-time conversion unit

───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5D045 DA08 DA11 5J064 AA01 AA02 BA09 BA13 BB14 BC02 BC09 BC11 BC16 BC18 BC21 BC25 BC30 BD02 BD03 ──────────────────────────────────────────────────続 き Continued on the front page F term (reference) 5D045 DA08 DA11 5J064 AA01 AA02 BA09 BA13 BB14 BC02 BC09 BC11 BC16 BC18 BC21 BC25 BC30 BD02 BD03

Claims (15)

【特許請求の範囲】[Claims] 【請求項1】 離散サンプル列として入力されるオーデ
ィオ信号を符号化し、ディジタル符号を出力するオーデ
ィオ信号符号化方法であって、 前記入力オーディオ信号を一定数の入力毎に時間−周波
数変換して、周波数領域の入力係数を取得する時間−周
波数変換段階と、 この周波数領域の入力係数を符号化するとともに、この
符号化情報を符号化器出力として出力する符号化段階
と、 この符号化された周波数領域の入力係数を復号化して、
再生係数を取得する復号化段階と、 この取得した再生係数の周波数特性を入力係数の周波数
特性に近づけるための補正係数を計算するとともに、該
補正係数を符号化して符号化器出力として出力する補正
係数計算段階とを有することを特徴とするオーディオ信
号符号化方法。
1. An audio signal encoding method for encoding an audio signal input as a sequence of discrete samples and outputting a digital code, wherein the input audio signal is subjected to time-frequency conversion for each predetermined number of inputs, A time-frequency transforming step for obtaining an input coefficient in the frequency domain; an encoding step for encoding the input coefficient in the frequency domain and outputting the encoded information as an encoder output; Decoding the input coefficients of the region,
A decoding step of obtaining a reproduction coefficient; and a correction step of calculating a correction coefficient for bringing the frequency characteristic of the obtained reproduction coefficient closer to the frequency characteristic of the input coefficient, encoding the correction coefficient, and outputting as an encoder output. A coefficient calculating step.
【請求項2】 前記補正係数計算段階は、前記入力係数
および再生係数を複数の小帯域に分割し、各小帯域毎に
補正係数を決定する補正係数決定段階を有することを特
徴とする請求項1記載のオーディオ信号符号化方法。
2. The correction coefficient calculating step includes a step of dividing the input coefficient and the reproduction coefficient into a plurality of small bands and determining a correction coefficient for each of the small bands. 2. The audio signal encoding method according to claim 1.
【請求項3】 前記補正係数決定段階は、前記複数の小
帯域中のすべての再生係数に補正係数を掛け合わせる
と、補正後の再生係数のパワーが入力係数のパワーに最
も近くなるように補正係数を決定するパワー最近接型補
正係数決定段階を有することを特徴とする請求項2記載
のオーディオ信号符号化方法。
3. The step of determining a correction coefficient, wherein, when all the reproduction coefficients in the plurality of small bands are multiplied by the correction coefficient, the correction coefficient is corrected so that the power of the corrected reproduction coefficient becomes closest to the power of the input coefficient. 3. The audio signal encoding method according to claim 2, further comprising a power closest correction coefficient determining step of determining a coefficient.
【請求項4】 前記補正係数決定段階は、前記複数の小
帯域中のすべての再生係数に補正係数を掛け合わせる
と、補正後の再生係数と入力係数との誤差が最小となる
ように補正係数を決定する誤差最小型補正係数決定段階
を有することを特徴とする請求項2記載のオーディオ信
号符号化方法。
4. The correction coefficient determining step is such that, when all the reproduction coefficients in the plurality of small bands are multiplied by the correction coefficient, a correction coefficient between the corrected reproduction coefficient and the input coefficient is minimized. 3. The audio signal encoding method according to claim 2, further comprising a step of determining a minimum error type correction coefficient for determining the correction coefficient.
【請求項5】 前記補正係数決定段階は、前記複数の小
帯域中のすべての再生係数に補正係数を掛け合わせる
と、補正後の再生係数のパワーが入力係数のパワーに最
も近くなるように補正係数を決定するパワー最近接型補
正係数決定段階、前記複数の小帯域中のすべての再生係
数に補正係数を掛け合わせると、補正後の再生係数と入
力係数との誤差が最小となるように補正係数を決定する
誤差最小型補正係数決定段階、および前記パワー最近接
型補正係数決定段階と前記誤差最小型補正係数決定段階
の両段階のうちのいずれの段階で補正係数を決定するか
を小帯域によって選択する選択段階を有することを特徴
とする請求項2記載のオーディオ信号符号化方法。
5. The correction coefficient determining step comprises: correcting all the reproduction coefficients in the plurality of small bands by a correction coefficient so that the corrected reproduction coefficient power becomes closest to the input coefficient power. A power closest-decision correction coefficient determining step of determining a coefficient, when all of the reproduction coefficients in the plurality of small bands are multiplied by the correction coefficient, the correction is performed so that an error between the corrected reproduction coefficient and the input coefficient is minimized. A small-bandwidth correction coefficient determining step for determining a coefficient, and a small band for determining which of the two stages of the power closest correction coefficient determining step and the minimum error-type correction coefficient determination step 3. The audio signal encoding method according to claim 2, further comprising a selecting step of selecting the audio signal.
【請求項6】 前記選択段階は、前記小帯域中の入力係
数の平坦度を計算し、この平坦度が低い場合には、前記
補正係数決定段階として前記誤差最小型補正係数決定段
階を選択し、平坦度が高い場合には、前記補正係数決定
段階として前記選択段階で選択される補正係数決定段階
を選択する段階を有することを特徴とする請求項5記載
のオーディオ信号符号化方法。
6. The selecting step calculates flatness of an input coefficient in the small band, and when the flatness is low, selects the minimum error type correction coefficient determining step as the correction coefficient determining step. 6. The audio signal encoding method according to claim 5, further comprising the step of selecting a correction coefficient determining step selected in said selecting step as said correction coefficient determining step when the flatness is high.
【請求項7】 前記符号化段階は、前記入力係数を平坦
化し、平坦化入力係数を符号化器出力として出力する平
坦化段階、および該平坦化段階で平坦化された入力係数
をベクトル量子化することにより符号化し、ベクトル量
子化情報を取得するベクトル量子化段階を有することを
特徴とする請求項1記載のオーディオ信号符号化方法。
7. The encoding step includes: flattening the input coefficient, outputting the flattened input coefficient as an encoder output, and vector quantizing the input coefficient flattened in the flattening step. 2. The audio signal encoding method according to claim 1, further comprising a vector quantization step of performing encoding to obtain vector quantization information.
【請求項8】 前記復号化段階は、前記ベクトル量子化
情報を再生し、再生平坦化係数を取得するベクトル再生
段階、および前記再生平坦化係数に対して前記平坦化と
逆の操作である逆平坦化を行って、再生係数を取得する
逆平坦化段階を有することを特徴とする請求項7記載の
オーディオ信号符号化方法。
8. The decoding step is a vector reproduction step of reproducing the vector quantization information and obtaining a reproduction flattening coefficient, and an inverse operation that is the reverse of the flattening operation on the reproduction flattening coefficient. 8. The audio signal encoding method according to claim 7, further comprising an inverse flattening step of performing flattening to obtain a reproduction coefficient.
【請求項9】 ディジタル符号を入力し、離散サンプル
列のオーディオ信号を出力するオーディオ信号復号化方
法であって、 前記入力ディジタル符号を復号し、周波数領域の再生係
数を取得する再生係数取得段階と、 前記入力ディジタル符号を復号し、補正係数を取得する
補正係数取得段階と、 前記補正係数取得段階で取得した補正係数を用いて、前
記再生係数取得段階で取得した再生係数の周波数特性を
補正する周波数特性補正段階と、 該周波数特性補正段階で補正された再生係数を時間−周
波数変換し、オーディオ信号として出力する周波数−時
間変換段階とを有することを特徴とするオーディオ信号
復号化方法。
9. An audio signal decoding method for receiving a digital code and outputting an audio signal of a sequence of discrete samples, comprising: a reproduction coefficient obtaining step of decoding the input digital code and obtaining a reproduction coefficient in a frequency domain; Decoding the input digital code to obtain a correction coefficient, and correcting the frequency characteristic of the reproduction coefficient obtained in the reproduction coefficient obtaining step by using the correction coefficient obtained in the correction coefficient obtaining step. An audio signal decoding method, comprising: a frequency characteristic correction step; and a frequency-time conversion step of performing time-frequency conversion on the reproduction coefficient corrected in the frequency characteristic correction step and outputting the converted reproduction coefficient as an audio signal.
【請求項10】 前記補正係数取得段階は、予め決めら
れた周波数領域での小帯域毎に1個ずつの補正係数を再
生する補正係数再生段階を有することを特徴とする請求
項9記載のオーディオ信号復号化方法。
10. The audio according to claim 9, wherein the step of obtaining the correction coefficient includes a step of reproducing one correction coefficient for each small band in a predetermined frequency domain. Signal decoding method.
【請求項11】 前記周波数特性補正段階は、予め決め
られた周波数領域での小帯域に含まれるすべての再生係
数に対して前記補正係数再生段階で再生された対応する
補正係数を掛け合わせることにより周波数特性を補正す
る段階を有することを特徴とする請求項10記載のオー
ディオ信号復号化方法。
11. The frequency characteristic correction step includes multiplying all reproduction coefficients included in a small band in a predetermined frequency region by a corresponding correction coefficient reproduced in the correction coefficient reproduction step. 11. The audio signal decoding method according to claim 10, further comprising the step of correcting a frequency characteristic.
【請求項12】 前記再生係数取得段階は、ベクトル量
子化された入力ディジタル符号を再生し、再生平坦化係
数を取得した後、入力ディジタル符号を再生して逆平坦
化情報を取得し、この逆平坦化情報を用いて、前記再生
平坦化係数を逆平坦化して再生係数を取得する段階を有
することを特徴とする請求項9記載のオーディオ信号復
号化方法。
12. The reproduction coefficient obtaining step includes: reproducing the vector-quantized input digital code, obtaining a reproduction flattening coefficient, and then reproducing the input digital code to obtain inverse flattening information; 10. The audio signal decoding method according to claim 9, further comprising the step of: inversely flattening the reproduction flattening coefficient using flattening information to obtain a reproduction coefficient.
【請求項13】 離散サンプル列として入力されるオー
ディオ信号を符号化し、ディジタル符号を出力するオー
ディオ信号符号化プログラムを記録した記録媒体であっ
て、 前記入力オーディオ信号を一定数の入力毎に時間−周波
数変換して、周波数領域の入力係数を取得する時間−周
波数変換段階と、 この周波数領域の入力係数を符号化するとともに、この
符号化情報を符号化器出力として出力する符号化段階
と、 この符号化された周波数領域の入力係数を復号化して、
再生係数を取得する復号化段階と、 この取得した再生係数の周波数特性を入力係数の周波数
特性に近づけるための補正係数を計算するとともに、該
補正係数を符号化して符号化器出力として出力する補正
係数計算段階とを有することを特徴とするオーディオ信
号符号化プログラムを記録した記録媒体。
13. A recording medium recording an audio signal encoding program for encoding an audio signal inputted as a sequence of discrete samples and outputting a digital code, wherein the input audio signal is time-separated every fixed number of inputs. A time-frequency conversion step of performing frequency conversion to obtain an input coefficient in the frequency domain; an encoding step of encoding the input coefficient in the frequency domain and outputting the encoded information as an encoder output; Decoding the encoded frequency domain input coefficients,
A decoding step of obtaining a reproduction coefficient; and a correction step of calculating a correction coefficient for bringing the frequency characteristic of the obtained reproduction coefficient closer to the frequency characteristic of the input coefficient, encoding the correction coefficient, and outputting as an encoder output. A recording medium for recording an audio signal encoding program, comprising: a coefficient calculating step.
【請求項14】 ディジタル符号を入力し、離散サンプ
ル列のオーディオ信号を出力するオーディオ信号復号化
プログラムを記録した記録媒体であって、前記入力ディ
ジタル符号を復号し、周波数領域の再生係数を取得する
再生係数取得段階と、 前記入力ディジタル符号を復号し、補正係数を取得する
補正係数取得段階と、 前記補正係数取得段階で取得した補正係数を用いて、前
記再生係数取得段階で取得した再生係数の周波数特性を
補正する周波数特性補正段階と、 該周波数特性補正段階で補正された再生係数を時間−周
波数変換し、オーディオ信号として出力する周波数−時
間変換段階とを有することを特徴とするオーディオ信号
復号化プログラムを記録した記録媒体。
14. A recording medium for recording an audio signal decoding program for inputting a digital code and outputting an audio signal of a sequence of discrete samples, wherein the input digital code is decoded to obtain a reproduction coefficient in a frequency domain. A reproduction coefficient obtaining step, a decoding coefficient obtaining step of decoding the input digital code and obtaining a correction coefficient, and using the correction coefficient obtained in the correction coefficient obtaining step to obtain a reproduction coefficient obtained in the reproduction coefficient obtaining step. Audio signal decoding, comprising: a frequency characteristic correction step of correcting a frequency characteristic; and a frequency-time conversion step of performing a time-frequency conversion on the reproduction coefficient corrected in the frequency characteristic correction step and outputting the converted audio signal as an audio signal. Recording medium on which a computerized program is recorded.
【請求項15】 離散サンプル列として入力されるオー
ディオ信号を符号化し、ディジタル符号を出力する符号
化部、および該符号化部から出力されるディジタル符号
を入力して復号し、離散サンプル列のオーディオ信号を
出力する復号化部を有するオーディオ信号符号化/復号
化装置であって、 前記符号化部は、 前記入力オーディオ信号を一定数の入力毎に時間−周波
数変換して、周波数領域の入力係数を出力する時間−周
波数変換手段と、 この時間−周波数変換手段から出力される周波数領域の
入力係数を平坦化し、平坦化入力係数を出力する平坦化
手段と、 この平坦化手段から出力される平坦化入力係数をベクト
ル量子化して符号化し、ベクトル量子化情報を出力する
ベクトル量子化手段と、 このベクトル量子化手段から出力されるベクトル量子化
情報を再生し、再生平坦化係数を出力するベクトル再生
手段と、 このベクトル再生手段から出力される再生平坦化係数に
対して前記平坦化手段で行った平坦化と逆の操作である
逆平坦化を行って、再生係数を出力する逆平坦化手段
と、 この逆平坦化手段から出力される再生係数および前記時
間−周波数変換手段から出力される入力係数を比較し、
再生係数の周波数特性を入力係数の周波数特性に近づけ
るための補正係数を計算する補正係数計算手段と、 前記平坦化手段から出力される平坦化入力係数、前記ベ
クトル量子化手段から出力されるベクトル量子化情報、
および前記補正係数計算手段から出力される補正係数を
多重化して出力する多重化手段とを有し、 前記復号化部は、 前記符号化部の多重化手段から入力される多重化情報を
受信し、前記多重化と逆の手順により前記平坦化入力係
数、ベクトル量子化情報、および補正係数にそれぞれ対
応する符号に分解して出力する逆多重化手段と、 該逆多重化手段から出力される前記補正係数に対応する
符号を再生して、補正係数を出力する補正係数再生手段
と、 前記逆多重化手段から出力される前記ベクトル量子化情
報に対応する符号を再生して、再生平坦化係数を出力す
るベクトル再生手段と、 前記逆多重化手段から出力される前記平坦化入力係数に
対応する符号を再生して、逆平坦化情報を取得するとと
もに、前記ベクトル再生手段からの再生平坦化係数を逆
平坦化して、再生係数を出力する逆平坦化手段と、 前記補正係数再生手段から出力される補正係数を用い
て、前記逆平坦化手段から出力される再生係数の周波数
特性を補正する周波数特性補正手段と、 該周波数特性補正手段で補正された再生係数を周波数−
時間変換し、離散サンプル列のオーディオ信号を出力す
る周波数−時間変換手段とを有することを特徴とするオ
ーディオ信号符号化/復号化装置。
15. An encoding unit for encoding an audio signal input as a sequence of discrete samples and outputting a digital code, and inputting and decoding a digital code output from the encoding unit, and decoding the audio of the sequence of discrete samples. An audio signal encoding / decoding device having a decoding unit that outputs a signal, wherein the encoding unit performs time-frequency conversion on the input audio signal for each predetermined number of inputs, and obtains an input coefficient in a frequency domain. And a flattening means for flattening an input coefficient in the frequency domain output from the time-frequency converting means and outputting a flattened input coefficient, and a flattening output from the flattening means. Vector quantizing means for vector-quantizing and encoding the quantized input coefficients and outputting vector-quantized information; output from the vector quantizing means Vector reproducing means for reproducing the vector quantization information and outputting a reproduced flattening coefficient, and an operation reverse to the flattening performed by the flattening means on the reproduced flattening coefficient output from the vector reproducing means. By performing inverse flattening, an inverse flattening means for outputting a reproduction coefficient, and comparing a reproduction coefficient output from the inverse flattening means and an input coefficient output from the time-frequency conversion means,
Correction coefficient calculating means for calculating a correction coefficient for bringing the frequency characteristic of the reproduction coefficient closer to the frequency characteristic of the input coefficient; a flattened input coefficient output from the flattening means; a vector quantizer output from the vector quantization means. Information,
And multiplexing means for multiplexing and outputting correction coefficients output from the correction coefficient calculating means, wherein the decoding section receives multiplexed information input from multiplexing means of the encoding section. Demultiplexing means for decomposing the flattened input coefficient, the vector quantization information, and the code corresponding to the correction coefficient into codes corresponding to the procedure opposite to the multiplexing and outputting the codes, A correction coefficient reproducing unit that reproduces a code corresponding to the correction coefficient and outputs a correction coefficient, and reproduces a code corresponding to the vector quantization information output from the demultiplexing unit, and generates a reproduction flattening coefficient. A vector reproducing means for outputting, and reproducing a code corresponding to the flattening input coefficient output from the demultiplexing means to obtain de-flattening information, and a reproducing flattening from the vector reproducing means. Inverse flattening means for inversely flattening the coefficient, and outputting a reproduction coefficient; and correcting the frequency characteristic of the reproduction coefficient output from the inverse flattening means using the correction coefficient output from the correction coefficient reproduction means. Frequency characteristic correction means to perform the reproduction coefficient corrected by the frequency characteristic correction means
An audio signal encoding / decoding apparatus, comprising: frequency-time conversion means for performing time conversion and outputting an audio signal of a discrete sample sequence.
JP2000111031A 2000-04-12 2000-04-12 Audio signal encoding method, audio signal decoding method, audio signal encoding / decoding device, and recording medium recording program for implementing the method Expired - Lifetime JP3361790B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000111031A JP3361790B2 (en) 2000-04-12 2000-04-12 Audio signal encoding method, audio signal decoding method, audio signal encoding / decoding device, and recording medium recording program for implementing the method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000111031A JP3361790B2 (en) 2000-04-12 2000-04-12 Audio signal encoding method, audio signal decoding method, audio signal encoding / decoding device, and recording medium recording program for implementing the method

Publications (2)

Publication Number Publication Date
JP2001298367A true JP2001298367A (en) 2001-10-26
JP3361790B2 JP3361790B2 (en) 2003-01-07

Family

ID=18623445

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000111031A Expired - Lifetime JP3361790B2 (en) 2000-04-12 2000-04-12 Audio signal encoding method, audio signal decoding method, audio signal encoding / decoding device, and recording medium recording program for implementing the method

Country Status (1)

Country Link
JP (1) JP3361790B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008015357A (en) * 2006-07-07 2008-01-24 Toshiba Corp Encoding device
WO2009093714A1 (en) * 2008-01-24 2009-07-30 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, and device therefor and program therefor, and recording medium

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008015357A (en) * 2006-07-07 2008-01-24 Toshiba Corp Encoding device
WO2009093714A1 (en) * 2008-01-24 2009-07-30 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, and device therefor and program therefor, and recording medium
JP5097217B2 (en) * 2008-01-24 2012-12-12 日本電信電話株式会社 ENCODING METHOD, ENCODING DEVICE, PROGRAM THEREOF, AND RECORDING MEDIUM
JP2013008040A (en) * 2008-01-24 2013-01-10 Nippon Telegr & Teleph Corp <Ntt> Encoding method, device and program, decoding method, device and program, and recording medium
US8724734B2 (en) 2008-01-24 2014-05-13 Nippon Telegraph And Telephone Corporation Coding method, decoding method, apparatuses thereof, programs thereof, and recording medium

Also Published As

Publication number Publication date
JP3361790B2 (en) 2003-01-07

Similar Documents

Publication Publication Date Title
US6721700B1 (en) Audio coding method and apparatus
RU2422987C2 (en) Complex-transform channel coding with extended-band frequency coding
JP4506039B2 (en) Encoding apparatus and method, decoding apparatus and method, and encoding program and decoding program
US5508949A (en) Fast subband filtering in digital signal coding
US6675148B2 (en) Lossless audio coder
US7333929B1 (en) Modular scalable compressed audio data stream
CN103765509B (en) Code device and method, decoding device and method
US20080243518A1 (en) System And Method For Compressing And Reconstructing Audio Files
US20060212290A1 (en) Audio coding apparatus and audio decoding apparatus
US6593872B2 (en) Signal processing apparatus and method, signal coding apparatus and method, and signal decoding apparatus and method
EP1047047B1 (en) Audio signal coding and decoding methods and apparatus and recording media with programs therefor
KR20110021803A (en) Factorization of overlapping transforms into two block transforms
JP3765171B2 (en) Speech encoding / decoding system
JP3434260B2 (en) Audio signal encoding method and decoding method, these devices and program recording medium
US7983346B2 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
JPH07261800A (en) Transformation encoding method, decoding method
JP3344944B2 (en) Audio signal encoding device, audio signal decoding device, audio signal encoding method, and audio signal decoding method
JP3353868B2 (en) Audio signal conversion encoding method and decoding method
JP3087814B2 (en) Acoustic signal conversion encoding device and decoding device
JP3255022B2 (en) Adaptive transform coding and adaptive transform decoding
JP3406275B2 (en) Digital signal encoding method, digital signal decoding method, these devices and their respective program recording media
JP3557164B2 (en) Audio signal encoding method and program storage medium for executing the method
JP4191503B2 (en) Speech musical sound signal encoding method, decoding method, encoding device, decoding device, encoding program, and decoding program
US6549147B1 (en) Methods, apparatuses and recorded medium for reversible encoding and decoding
JP3361790B2 (en) Audio signal encoding method, audio signal decoding method, audio signal encoding / decoding device, and recording medium recording program for implementing the method

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
R150 Certificate of patent or registration of utility model

Ref document number: 3361790

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071018

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081018

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091018

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101018

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101018

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111018

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111018

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121018

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121018

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131018

Year of fee payment: 11

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term