JP2003186499A - Encoding device and decoding device - Google Patents

Encoding device and decoding device

Info

Publication number
JP2003186499A
JP2003186499A JP2001381807A JP2001381807A JP2003186499A JP 2003186499 A JP2003186499 A JP 2003186499A JP 2001381807 A JP2001381807 A JP 2001381807A JP 2001381807 A JP2001381807 A JP 2001381807A JP 2003186499 A JP2003186499 A JP 2003186499A
Authority
JP
Japan
Prior art keywords
data
decoding
encoded
spectrum data
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001381807A
Other languages
Japanese (ja)
Other versions
JP3984468B2 (en
Inventor
Kosuke Nishio
孝祐 西尾
Takeshi Norimatsu
武志 則松
Mineo Tsushima
峰生 津島
Naoya Tanaka
直也 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP2001381807A priority Critical patent/JP3984468B2/en
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to PCT/JP2002/011256 priority patent/WO2003038813A1/en
Priority to EP02775412A priority patent/EP1440300B1/en
Priority to CN02809440.9A priority patent/CN1288622C/en
Priority to EP02775411A priority patent/EP1440432B1/en
Priority to EP02775413A priority patent/EP1440433B1/en
Priority to PCT/JP2002/011255 priority patent/WO2003038389A1/en
Priority to DE60204038T priority patent/DE60204038T2/en
Priority to DE60208426T priority patent/DE60208426T2/en
Priority to CNB02803421XA priority patent/CN1324558C/en
Priority to PCT/JP2002/011254 priority patent/WO2003038812A1/en
Priority to DE60204039T priority patent/DE60204039T2/en
Priority to CN02803419.8A priority patent/CN1209744C/en
Priority to US10/285,609 priority patent/US7283967B2/en
Priority to US10/285,627 priority patent/US7392176B2/en
Priority to US10/285,633 priority patent/US7328160B2/en
Publication of JP2003186499A publication Critical patent/JP2003186499A/en
Application granted granted Critical
Publication of JP3984468B2 publication Critical patent/JP3984468B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an encoding device and a decoding device for realizing wideband encoding and decoding for a digital sound signal. <P>SOLUTION: This encoding device 100 is provided with: a converting part 120 for segmenting an input sound signal in each fixed time to convert the input sound signal into a frequency spectrum and generating a window for a short block; a sharing judging part 137 for comparing windows with each other, judging that spectrum data in a high-pass part of one window are shared by the other window if spectrums of each of the windows are similar within a range satisfying a prescribed judgment standard, and replacing the spectrum data in the high-pass part of the other window with '0'; a first quantizing part 131 for quantizing the spectrum data of each of the windows after replacement processing; a first encoding part 132 for encoding quantization results of the first quantizing part 131; and a stream outputting part 140 for outputting the encoded data by the first encoding part 132. <P>COPYRIGHT: (C)2003,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、デジタル音響デー
タの高音質符号化及び復号化技術に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a high quality audio encoding and decoding technique for digital audio data.

【0002】[0002]

【従来の技術】現在、音声データを圧縮符号化する様々
な音声圧縮方式が開発されている。MPEG−2 Ad
vanced Audio Coding(以下、AA
Cと略称する)もその方式の一つである。AACの詳細
は、「ISO/IEC 13818−7(MPEG−2
Advanced Audio Coding、AA
C)」という規格書に記載されている。
2. Description of the Related Art Currently, various audio compression methods for compressing and encoding audio data have been developed. MPEG-2 Ad
advanced Audio Coding (hereinafter AA
(Abbreviated as C) is one of the methods. For details of AAC, refer to "ISO / IEC 13818-7 (MPEG-2).
Advanced Audio Coding, AA
C) ”.

【0003】先ず従来の符号化及び復号化手順を、図1
7を用いて説明する。図17は、従来のMPEG−2
AAC方式による符号化装置300及び復号化装置40
0の構成を示すブロック図である。符号化装置300
は、入力された音響信号をMPEG−2 AAC符号化
方式に基づいて圧縮符号化する装置であって、音響信号
入力部310、変換部320、量子化部331、符号化
部332及びストリーム出力部340から構成される。
First, the conventional encoding and decoding procedure is shown in FIG.
This will be described using 7. FIG. 17 shows a conventional MPEG-2.
Encoding device 300 and decoding device 40 based on the AAC method
It is a block diagram which shows the structure of 0. Encoding device 300
Is an apparatus for compressing and encoding an input acoustic signal based on the MPEG-2 AAC encoding method, and is an acoustic signal input unit 310, a conversion unit 320, a quantization unit 331, an encoding unit 332, and a stream output unit. 340.

【0004】音響信号入力部310は、例えば、44.
1kHzのサンプリング周波数でサンプリングされたデ
ジタル音響データを、連続した1024サンプルごとに
切り出す。なお、この1024サンプルの符号化単位を
「フレーム」という。
The acoustic signal input section 310 includes, for example, 44.
Digital audio data sampled at a sampling frequency of 1 kHz is cut out every 1024 continuous samples. The coding unit of 1024 samples is called "frame".

【0005】変換部320は、音響信号入力部310に
よって切り出された時間軸上のサンプルデータを、MD
CT(Modified Discrete Cosi
neTransform)によって周波数軸上のスペク
トルデータに変換する。なお、この時点で変換された1
024サンプルのスペクトルデータは、複数のグループ
に分類される。前記各グループは、複数のグループのそ
れぞれに、1サンプル以上のスペクトルデータが含まれ
るように設定される。また、この各グループは、人間の
聴覚におけるクリティカルバンドを擬似している。各グ
ループのそれぞれを「スケールファクターバンド」とい
う。
The conversion unit 320 uses the MD of the sample data on the time axis cut out by the acoustic signal input unit 310.
CT (Modified Discrete Cosi)
(neTransform) to convert the spectrum data on the frequency axis. In addition, 1 converted at this time
The spectral data of 024 samples is classified into a plurality of groups. Each of the groups is set so that each of the plurality of groups includes one or more samples of spectral data. Also, each of these groups simulates a critical band in human hearing. Each of the groups is called a “scale factor band”.

【0006】量子化部331は、変換部320から得ら
れたスペクトルデータを所定ビット数で量子化する。M
PEG−2 AACでは、スケールファクターバンドご
とに1つの正規化係数を用いて、スケールファクターバ
ンド内のスペクトルデータを量子化する。この正規化係
数のことを「スケールファクター」という。また、各ス
ペクトルデータを各スケールファクターで量子化した結
果を「量子化値」という。符号化部332は、量子化部
331で量子化されたデータ、すなわち、各スケールフ
ァクターと、それを用いて量子化されたスペクトルデー
タとをストリーム用のフォーマットにハフマン符号化す
る。この際に、符号化部332は、1フレームにおいて
前後に隣接するスケールファクターバンドのスケールフ
ァクターの差分を求め、その差分と先頭スケールファク
ターバンドのスケールファクターとをハフマン符号化す
る。
The quantizer 331 quantizes the spectrum data obtained from the converter 320 with a predetermined number of bits. M
PEG-2 AAC quantizes the spectral data within the scale factor band using one normalization factor for each scale factor band. This normalization coefficient is called "scale factor". In addition, the result of quantizing each spectrum data with each scale factor is referred to as a “quantized value”. The encoding unit 332 Huffman-encodes the data quantized by the quantization unit 331, that is, each scale factor and the spectrum data quantized using the scale factor into a stream format. At this time, the encoding unit 332 obtains the difference between the scale factors of the scale factor bands adjacent to each other in the front and rear in one frame, and performs the Huffman encoding on the difference and the scale factor of the leading scale factor band.

【0007】ストリーム出力部340は、符号化部33
2から得られた符号化信号を、MPEG−2 AACビ
ットストリームに変換し、出力する。符号化装置300
から出力されたビットストリームは、伝送媒体を介して
復号化装置400に伝送されたり、CDやDVD等の光
ディスク、半導体、ハードディスク等の記録媒体に記録
されたりする。
The stream output unit 340 includes a coding unit 33.
The encoded signal obtained from 2 is converted into an MPEG-2 AAC bitstream and output. Encoding device 300
The bit stream output from is transmitted to the decoding device 400 via a transmission medium, or recorded on a recording medium such as an optical disk such as a CD or a DVD, a semiconductor, a hard disk, or the like.

【0008】復号化装置400は、符号化装置300に
よって符号化されたビットストリームを復号化する装置
であって、ストリーム入力部410、復号化部421、
逆量子化部422、逆変換部430及び音響信号出力部
440から構成される。
The decoding device 400 is a device for decoding the bitstream coded by the coding device 300, and comprises a stream input section 410, a decoding section 421,
The inverse quantization unit 422, the inverse conversion unit 430, and the acoustic signal output unit 440 are included.

【0009】ストリーム入力部410は、符号化装置3
00によって符号化されたビットストリームを伝送媒体
を介して、あるいは、記録媒体から再生して入力し、入
力したビットストリームから符号化信号を取り出す。復
号化部421は、取り出された符号化信号をストリーム
用のフォーマットから量子化データに復号化する。
The stream input section 410 is used by the encoding device 3.
The bit stream coded by "00" is input through the transmission medium or the recording medium after being reproduced, and the coded signal is extracted from the input bit stream. The decoding unit 421 decodes the extracted coded signal from the stream format into quantized data.

【0010】逆量子化部422は、復号化部421で復
号化された量子化データを逆量子化する。MPEG−2
AACでは、ハフマン符号化されたデータを復号化す
る。逆変換部430は、逆量子化部422で得られた周
波数軸上のスペクトルデータを、時間軸上のサンプルデ
ータに変換する。MPEG−2 AACでは、IMDC
T(Inverse Modified Discre
te CosineTransform)を用いて変換
する。音響信号出力部440は、逆変換部430で得ら
れた時間軸上のサンプルデータを順次組み合わせ、デジ
タル音響データとして出力する。
The dequantization section 422 dequantizes the quantized data decoded by the decoding section 421. MPEG-2
AAC decodes Huffman-encoded data. The inverse transform unit 430 transforms the spectrum data on the frequency axis obtained by the inverse quantization unit 422 into sample data on the time axis. In MPEG-2 AAC, IMDC
T (Inverse Modified Discre
te CosineTransform). The acoustic signal output unit 440 sequentially combines the sample data on the time axis obtained by the inverse conversion unit 430, and outputs it as digital acoustic data.

【0011】なお、MPEG−2 AACでは入力の音
響信号に応じて、MDCTの変換長を変更することがで
きる。変換長が2048サンプルのものをLONGブロ
ック、変換長が256サンプルのものをSHORTブロ
ックといい、これらをまとめてブロックサイズという。
SHORTブロックでは、入力されるデジタル音響デー
タのサンプリング周波数を44.1kHzとすると、符
号化装置において、デジタル音響データの連続する12
8サンプルごとに、その前後64サンプルを重複して合
計256サンプルの音響データが切り出される。切り出
されたデジタル音響データはMDCT変換され、変換結
果の半分の128サンプルからなるスペクトルデータが
量子化及び符号化の対象となる。SHORTブロックで
は、この各128サンプルのスペクトルデータからなる
連続したウィンドウ8つをまとめて1024サンプルか
らなる1フレームとし、以降の量子化及び符号化などの
処理を、このフレームを1つの処理単位として行う。
In MPEG-2 AAC, the conversion length of MDCT can be changed according to the input acoustic signal. A block having a conversion length of 2048 samples is called a LONG block, a block having a conversion length of 256 samples is called a SHORT block, and these are collectively called a block size.
In the SHORT block, assuming that the sampling frequency of the input digital audio data is 44.1 kHz, 12 consecutive digital audio data are generated in the encoding device.
For every 8 samples, a total of 256 samples of acoustic data are cut out by overlapping 64 samples before and after that. The cut out digital acoustic data is subjected to MDCT conversion, and spectral data of 128 samples, which is half of the conversion result, is subjected to quantization and encoding. In the SHORT block, eight continuous windows each composed of the spectral data of 128 samples are put together into one frame of 1024 samples, and subsequent processing such as quantization and coding is performed using this frame as one processing unit. .

【0012】このように、1ウィンドウ128サンプル
のSHORTブロックでは、1ブロック1024サンプ
ルのLONGブロックに比べると、同じ22.05kH
zの再生帯域を少ないサンプル数で表すため、音質の点
ではLONGブロックに比べて不利であるが、早い周期
の音響信号に対する追従性が高いという利点がある。す
なわち、LONGブロックの場合、切り出しの周期が長
いため、切り出された音響信号の中にアタック(振幅の
大きいスパイク波)が含まれていたときには、1024
サンプルの全スペクトルに渡ってアタックの周波数成分
の影響を受けてしまうという問題がある。これに対しS
HORTブロックでは、アタックが含まれていた場合で
も、その影響が1つのウィンドウ内だけでおさまるの
で、他のウィンドウのスペクトルには影響を受けず、よ
り忠実に原音を再生できるという利点がある。
As described above, the SHORT block of 128 samples per window has the same 22.05 kHz as the LONG block of 1024 samples per block.
Since the reproduction band of z is represented by a small number of samples, it is disadvantageous in terms of sound quality as compared with the LONG block, but has an advantage that it has high followability to an acoustic signal of a quick cycle. That is, in the case of the LONG block, since the cutout cycle is long, when the cutout acoustic signal includes an attack (a spike wave with a large amplitude), 1024
There is a problem that the frequency component of the attack affects the entire spectrum of the sample. On the other hand, S
In the HORT block, even if an attack is included, its influence is suppressed within one window, so that there is an advantage that the original sound can be reproduced more faithfully without being affected by the spectra of other windows.

【0013】符号化装置300において上記な方式で符
号化され、復号化装置400に伝送される音響データの
音質がどの程度保持されるかを表す1つの目安として、
符号化後の再生帯域がある。例えば入力信号のサンプリ
ング周波数が44.1kHzの時、再生帯域は22.0
5kHzとなる。この22.05kHz分、又は22.
05kHzに近い広帯域な音響信号を劣化させることな
く符号化し、その符号化データをすべて伝送することに
より、高音質な音響信号の伝送を達成することができ
る。しかし、再生帯域の広さはスペクトルデータの数に
影響し、スペクトルデータの数は伝送データ量に影響す
る。例えば、入力信号のサンプリング周波数が44.1
kHzの時、1024サンプルのスペクトルデータが2
2.05kHz分のデータに対応し、22.05kHz
の再生帯域を確保するためには、1024サンプルのス
ペクトルデータをすべて伝送することが必要である。こ
のためには、音響信号を効率的に符号化し、かつ、その
データ量を伝送路の転送レート範囲内に納めることが必
要になってくる。
[0013] As one measure of how much the sound quality of the audio data encoded by the encoding device 300 and transmitted to the decoding device 400 is maintained,
There is a reproduction band after encoding. For example, when the sampling frequency of the input signal is 44.1 kHz, the reproduction band is 22.0.
It becomes 5 kHz. This 22.05 kHz, or 22.
High-quality sound signal transmission can be achieved by encoding a broadband acoustic signal close to 05 kHz without deterioration and transmitting all the encoded data. However, the width of the reproduction band affects the number of spectrum data, and the number of spectrum data affects the transmission data amount. For example, the sampling frequency of the input signal is 44.1.
2 kHz spectrum data of 1024 samples at kHz
Corresponding to 2.05kHz data, 22.05kHz
In order to secure the reproduction band of, it is necessary to transmit all the spectrum data of 1024 samples. For this purpose, it is necessary to efficiently encode the acoustic signal and keep the data amount within the transfer rate range of the transmission path.

【0014】ところが、携帯電話等の低転送レートの伝
送路を考慮すると、実際に1024サンプルのスペクト
ルデータすべてを伝送することは、データ量が大きすぎ
て現実的ではない。つまり、転送レートに合わせたデー
タ量で、この再生帯域の全スペクトルデータを転送しよ
うとすると、各周波数帯域に割り当てることができる情
報量がわずかとなり、その結果、量子化ノイズによる影
響が大きくなり、符号化による音質劣化を招く。
However, considering a transmission line of a low transfer rate such as a mobile phone, it is not realistic to actually transmit all the spectrum data of 1024 samples because the data amount is too large. In other words, if you try to transfer all spectrum data in this playback band with a data amount that matches the transfer rate, the amount of information that can be assigned to each frequency band will be small, and as a result, the effect of quantization noise will increase, Audio quality is deteriorated due to encoding.

【0015】このため、MPEG−2 AACに限ら
ず、多くの音響信号符号化方式において、スペクトルデ
ータに聴覚的重み付けを行い、優先度の低いデータは伝
送しないことにより、効率的な音響信号の伝送を実現し
ている。これに従えば、再生帯域に関しては、聴覚的に
優先度の高い低域部の符号化精度を向上させるため、低
域部の符号化情報に十分なデータ量を割り当て、優先度
の低い高域部は伝送対象外とされる確率が高い。
Therefore, not only in the MPEG-2 AAC but also in many audio signal coding systems, auditory weighting is applied to the spectrum data and low priority data is not transmitted, so that efficient audio signal transmission is achieved. Has been realized. According to this, in the reproduction band, in order to improve the coding accuracy of the low-frequency part having a high auditory priority, a sufficient amount of data is allocated to the coding information of the low-frequency part and The part has a high probability of being excluded from transmission.

【0016】[0016]

【発明が解決しようとする課題】しかしながら、MPE
G−2 AAC方式においてはこのような工夫がなされ
ているにもかかわらず、音響信号の符号化に対して、さ
らなる高品質化、圧縮効率の向上が求められている。つ
まり、低転送レートであっても、高域部の音響信号を伝
送することの要望が高まってきている。
[Problems to be Solved by the Invention] However, MPE
Despite such ingenuity in the G-2 AAC system, further improvement in quality and improvement in compression efficiency are demanded for audio signal encoding. That is, there is an increasing demand for transmitting high-frequency acoustic signals even at low transfer rates.

【0017】本発明の目的は、符号化後の情報量を大幅
に増加させることなく音響信号の高音質な符号化及びそ
の復号化を実現できる符号化装置及び復号化装置を提供
することである。
An object of the present invention is to provide an encoding device and a decoding device which can realize high-quality encoding of an audio signal and its decoding without significantly increasing the amount of information after encoding. .

【0018】[0018]

【課題を解決するための手段】上記課題に鑑みて、本発
明の符号化装置は、入力された音響信号を符号化する符
号化装置であって、入力音響信号を一定時間ごとに切り
出して周波数スペクトルに変換することにより、1フレ
ーム時間ごとに、スペクトルデータの集合からなる組を
複数個生成する変換手段と、前記変換手段によって得ら
れた前記組同士を比較し、それら組同士のスペクトルが
所定の判断基準を満たす範囲で相似する場合、一方の組
の高域部のスペクトルデータを他方の組において共有す
ると判定する共有判定手段と、高域部スペクトルデータ
を共有すると判定された前記他方の組につき、その組の
高域部スペクトルデータを所定値に置換する置換手段
と、前記置換手段による置換処理の後、前記各組のスペ
クトルデータを量子化する第1量子化手段と、前記第1
量子化手段による量子化結果を符号化する第1符号化手
段と、前記第1符号化手段によって符号化されたデータ
を出力する出力手段とを備えることを特徴とする。
In view of the above-mentioned problems, an encoding device of the present invention is an encoding device for encoding an input acoustic signal, and the input acoustic signal is cut out at regular intervals to obtain a frequency. A conversion unit that generates a plurality of sets each composed of a set of spectrum data by converting into a spectrum and the sets obtained by the conversion unit are compared with each other, and the spectra of the sets are predetermined. In the case of similarity in a range satisfying the criterion of (1), sharing determination means for determining that the high band spectral data of one set is shared by the other set, and the other set determined to share the high band spectral data Therefore, the replacement means for replacing the high band spectrum data of the set with a predetermined value, and the replacement processing by the replacement means, the spectrum data of each set is quantized. A first quantization means for said first
It is characterized by comprising first encoding means for encoding the quantization result by the quantization means, and output means for outputting the data encoded by the first encoding means.

【0019】これに対応して、本発明の復号化装置は、
入力符号化データ中の前記第1符号化手段によって符号
化されたデータを復号化する第1復号化手段と、第1復
号化手段の復号化結果を逆量子化し、前記各組のスペク
トルデータを出力する第1逆量子化手段と、前記第1逆
量子化手段の逆量子化結果を監視し、前記第1逆量子化
手段によって出力された高域部スペクトルデータの値が
所定値となっている場合、その組を前記他方の組である
と判定する判定手段と、前記判定手段の判定に基づい
て、前記第1逆量子化手段の逆量子化結果から前記一方
の組の高域部を表すスペクトルデータをコピーし、コピ
ーしたスペクトルデータを前記他方の組に対応付けて出
力する第2逆量子化手段と、前記第1逆量子化手段によ
って出力された高域部スペクトルデータであって、第2
逆量子化手段によって対応付けられている組の高域部ス
ペクトルデータの値を、前記第2逆量子化手段によって
出力された高域部スペクトルデータの値で置換した後、
逆変換し、時間軸上の音響信号として出力する音響信号
出力手段とを備えることを特徴とする。
In response to this, the decoding apparatus of the present invention is
First decoding means for decoding the data encoded by the first encoding means in the input encoded data, and the result of decoding by the first decoding means are dequantized to obtain the spectrum data of each set. The first dequantization means for outputting and the dequantization result of the first dequantization means are monitored, and the value of the high frequency band spectrum data output by the first dequantization means becomes a predetermined value. If it is determined that the pair is the other pair, the high band part of the one pair is determined from the dequantization result of the first dequantization means based on the determination of the determination means. A second dequantization means for copying the spectrum data represented, outputting the copied spectrum data in association with the other set, and high-band part spectrum data output by the first dequantization means, Second
After replacing the values of the high frequency band spectrum data of the set associated by the dequantization means with the values of the high frequency band spectrum data output by the second dequantization means,
An acoustic signal output unit that performs inverse conversion and outputs as an acoustic signal on a time axis is provided.

【0020】また、本発明の符号化装置において、前記
共有判定手段は、前記組同士のスペクトルが所定の判断
基準を満たす範囲で相似する場合に、前記一方の組の高
域部に加えてさらに低域部のスペクトルデータを、他方
の組において共有すると判定し、前記置換手段は、スペ
クトルデータを共有すると判定された前記他方の組につ
き、入力されるその組の高域部に加えてさらに低域部の
スペクトルデータを所定値に置換することを特徴とす
る。
Further, in the encoding apparatus of the present invention, the sharing determination means further adds to the high-frequency part of one of the pairs when the spectra of the pairs are similar to each other within a range satisfying a predetermined determination criterion. It is determined that the spectrum data of the low frequency band is shared by the other pair, and the replacing unit further lowers the other frequency band of the other pair determined to share the spectrum data in addition to the high frequency band of the pair input. It is characterized in that the spectrum data of the region is replaced with a predetermined value.

【0021】これに対応して、本発明の復号化装置は、
入力符号化データ中の前記第1符号化手段によって符号
化されたデータを復号化する第1復号化手段と、第1復
号化手段の復号化結果を逆量子化し、前記各組のスペク
トルデータを出力する第1逆量子化手段と、前記第1逆
量子化手段の逆量子化結果を監視し、前記第1逆量子化
手段によって出力された全スペクトルデータの値が所定
値となっている場合、その組を前記他方の組であると判
定する判定手段と、前記判定手段の判定に基づいて、前
記第1逆量子化手段の逆量子化結果から前記一方の組の
全スペクトルデータをコピーし、コピーしたスペクトル
データを前記他方の組に対応付けて出力する第2逆量子
化手段と、前記第1逆量子化手段によって出力されたス
ペクトルデータであって、第2逆量子化手段によって対
応付けられている組の全スペクトルデータの値を、前記
第2逆量子化手段によって出力されたスペクトルデータ
の値で置換した後、逆変換し、時間軸上の音響信号とし
て出力する音響信号出力手段とを備えることを特徴とす
る。
In response to this, the decoding device of the present invention is
First decoding means for decoding the data encoded by the first encoding means in the input encoded data, and the result of decoding by the first decoding means are dequantized to obtain the spectrum data of each set. When the first dequantization means for outputting and the dequantization result of the first dequantization means are monitored, and the values of all spectrum data output by the first dequantization means are predetermined values. , The determination unit that determines that the set is the other set, and, based on the determination by the determination unit, copies all spectrum data of the one set from the dequantization result of the first dequantization unit. , A second dequantization means for outputting the copied spectrum data in association with the other set, and spectrum data output by the first dequantization means, the second dequantization means being associated with each other. Has been After replacing all the spectrum data values of the above with the spectrum data values output by the second dequantization means, inverse conversion is performed, and the sound signal output means outputs as a sound signal on the time axis. Characterize.

【0022】さらに、本発明の符号化装置は、入力され
た音響信号を符号化する符号化装置であって、入力音響
信号を一定時間ごとに切り出して周波数スペクトルに変
換する変換手段と、前記変換手段によって得られたスペ
クトルデータを量子化する第1量子化手段と、前記第1
量子化手段に入力されたスペクトルデータのうち、第1
量子化手段において、スペクトルのピークに隣接したス
ペクトルデータの量子化結果が連続して所定値となった
ものを所定の正規化係数を用いて量子化し直す第2量子
化手段と、前記第1量子化手段の量子化結果を符号化す
る第1符号化手段と、前記第2量子化手段の量子化結果
を符号化する第2符号化手段と、前記第1符号化手段に
よって符号化されたデータと、前記第2符号化手段によ
って符号化されたデータとを出力する出力手段とを備え
ることを特徴とする。
Further, the coding apparatus of the present invention is a coding apparatus for coding an input acoustic signal, and converting means for cutting out the input acoustic signal at regular time intervals and converting it into a frequency spectrum, and the conversion means. First quantizing means for quantizing the spectrum data obtained by the means;
Of the spectral data input to the quantizing means, the first
In the quantizing means, second quantizing means for requantizing the spectrum data adjacent to the peak of the spectrum whose quantization result is continuously a predetermined value using a predetermined normalization coefficient; and the first quantum. First encoding means for encoding the quantization result of the encoding means, second encoding means for encoding the quantization result of the second quantization means, and data encoded by the first encoding means And output means for outputting the data encoded by the second encoding means.

【0023】これに対応して、本発明の復号化装置は、
前記符号化装置によって符号化された符号化データを入
力し、入力した符号化データを復号化する復号化装置で
あって、入力符号化データから、前記第2符号化手段に
よって符号化されたデータを分離する符号化データ分離
手段と、入力符号化データ中の前記第1符号化手段によ
って符号化されたデータを復号化する第1復号化手段
と、前記第1復号化手段の復号化結果を逆量子化し、前
記各バンドのスペクトルデータを出力する第1逆量子化
手段と、前記第2符号化手段によって符号化されたデー
タを復号化する第2復号化手段と、前記第2復号化手段
の復号化結果を所定の正規化係数を用いて逆量子化し、
前記各バンドにおいてピークとなるスペクトルデータに
隣接したため、前記第1量子化手段による量子化結果が
所定値となった連続するスペクトルデータを復元する第
2逆量子化手段と、前記第1逆量子化手段によって出力
されたスペクトルデータのうち、前記バンドごとに、1
スペクトルデータの前後に隣接し、かつ、いずれも連続
して所定値となる複数のスペクトルデータの値を、前記
第2逆量子化手段によって復元されたスペクトルデータ
の値で置換した後、逆変換し、時間軸上の音響信号とし
て出力する音響信号出力手段とを備えることを特徴とす
る。
In response to this, the decoding device of the present invention is
A decoding device for inputting encoded data encoded by the encoding device and decoding the input encoded data, wherein data encoded from the input encoded data by the second encoding means And a first decoding means for decoding the data encoded by the first encoding means in the input encoded data, and a decoding result of the first decoding means. First dequantization means for dequantizing and outputting the spectrum data of each band, second decoding means for decoding the data coded by the second coding means, and second decoding means. Dequantize the decoding result of using a predetermined normalization coefficient,
Second dequantizing means for reconstructing continuous spectrum data whose quantization result by the first quantizing means is a predetermined value because the spectrum data is adjacent to the peak spectral data in each band, and the first dequantizing means 1 for each band of the spectral data output by the means
The values of a plurality of spectrum data which are adjacent to the front and rear of the spectrum data and which continuously have a predetermined value are replaced with the values of the spectrum data restored by the second dequantization means, and then inversely transformed. And an audio signal output means for outputting as an audio signal on the time axis.

【0024】[0024]

【発明の実施の形態】(実施の形態1)以下、本実施の
形態における符号化装置100及び復号化装置200に
ついて詳細に説明する。図1は、本発明の符号化装置1
00及び復号化装置200の構成を示すブロック図であ
る。
BEST MODE FOR CARRYING OUT THE INVENTION (Embodiment 1) Hereinafter, encoding apparatus 100 and decoding apparatus 200 according to the present embodiment will be described in detail. FIG. 1 shows an encoding device 1 of the present invention.
00 and a decoding device 200. FIG.

【0025】<符号化装置100>符号化装置100
は、従来伝送されている音響信号のデータ量を低減して
伝送し、伝送するデータ量が同じであれば、復号化装置
200において従来よりも高音質の音響信号を復元でき
る音響符号化ビットストリームを出力する。具体的に
は、SHORTブロックの場合に、128サンプル単位
のブロック(=ウィンドウ)を8つまとめて伝送する
が、2つ以上のウィンドウにおいて高域部のスペクトル
データが類似または相似ならば、高域部の量子化データ
を共有することによりデータ量を削減する。符号化装置
100は、音響信号入力部110、変換部120、第1
の量子化部131、第1の符号化部132、第2の符号
化部134、共有判定部137及びストリーム出力部1
40から構成される。
<Encoder 100> Encoder 100
Is an audio coded bitstream that reduces the data amount of an audio signal that has been conventionally transmitted and transmits the same, and if the transmitted data amount is the same, the decoding device 200 can restore an audio signal of higher sound quality than before. Is output. Specifically, in the case of the SHORT block, eight blocks (= windows) of 128 sample units are collectively transmitted, but if the spectral data in the high frequency band is similar or similar in two or more windows, the high frequency band will be transmitted. The amount of data is reduced by sharing the quantized data of each part. The encoding device 100 includes an acoustic signal input unit 110, a conversion unit 120, and a first
Quantization unit 131, first encoding unit 132, second encoding unit 134, sharing determination unit 137, and stream output unit 1
It consists of 40.

【0026】音響信号入力部110は、周波数44.1
kHzのサンプリング周波数でサンプリングされたMP
EG−2 AACと同様の入力信号であるデジタル音響
データを、約2.9msec(128サンプルごと)の
サイクルで、その前後の64サンプルをオーバーラップ
させ、256サンプルずつ切り出す。
The acoustic signal input section 110 has a frequency of 44.1.
MP sampled at a sampling frequency of kHz
Digital acoustic data, which is an input signal similar to that of EG-2 AAC, is divided into 256 samples by overlapping 64 samples before and after the same in a cycle of about 2.9 msec (every 128 samples).

【0027】変換部120は、従来と同様、音響信号入
力部110によって切り出された時間軸上のサンプルデ
ータを、周波数軸上のスペクトルデータに変換する。M
PEG−2 AACでは、MDCTを用いて、256サ
ンプルの時間軸データを、SHORTブロック256サ
ンプルのスペクトルデータに変換する。しかし、MDC
Tでは左右対称なスペクトルデータとなるので、片方の
128サンプルのみを符号化の対象とする。以下では、
SHORTブロックにおける、この128サンプルから
なる単位を「ウィンドウ」といい、1フレームは8ウィ
ンドウ1024サンプルからなる。
The conversion section 120 converts the sample data on the time axis cut out by the acoustic signal input section 110 into spectrum data on the frequency axis, as in the conventional case. M
In PEG-2 AAC, MDCT is used to convert the time axis data of 256 samples into the spectral data of 256 blocks of the SHORT block. But MDC
In T, since the spectrum data is bilaterally symmetric, only one of the 128 samples is to be encoded. Below,
A unit of 128 samples in the SHORT block is called a "window", and one frame consists of 8 windows and 1024 samples.

【0028】変換部120は、さらに、変換された1ウ
ィンドウのスペクトルデータを、それぞれ1サンプル以
上(実用的には4の倍数)のスペクトルデータを含む複
数のスケールファクターバンドに分類する。MPEG−
2 AACでは、1フレームに含まれるスケールファク
ターバンドの数が、ブロックサイズとサンプリング周波
数に応じて定められており、各スケールファクターバン
ドに含まれるサンプル(スペクトルデータ)数も、周波
数に応じて定められている。このスケールファクターバ
ンドは、周波数低域部においては少数のサンプルごとに
細かく区切られ、高域部になるほど多数のサンプルを含
むよう大きく区切られている。SHORTブロックにお
いては、サンプリング周波数が44.1kHzの場合
は、1ウィンドウに含まれるスケールファクターバンド
の数は14個である。このような各ウィンドウの128
サンプルのスペクトルデータは、入力音源のサンプリン
グ周波数が44.1kHzの場合、それぞれが22.0
5kHzの再生帯域を表している。
The conversion unit 120 further classifies the converted spectrum data of one window into a plurality of scale factor bands each containing one sample or more (practically a multiple of 4) of spectrum data. MPEG-
In 2 AAC, the number of scale factor bands included in one frame is determined according to the block size and the sampling frequency, and the number of samples (spectral data) included in each scale factor band is also determined according to the frequency. ing. The scale factor band is finely divided into a small number of samples in the low frequency part, and is divided into a large number so as to include a large number of samples in the high frequency part. In the SHORT block, when the sampling frequency is 44.1 kHz, the number of scale factor bands included in one window is 14. 128 of each such window
When the sampling frequency of the input sound source is 44.1 kHz, the spectral data of each sample is 22.0.
It represents a reproduction band of 5 kHz.

【0029】図2は、図1に示した符号化装置100に
おいて処理される音響信号の変換過程を示す図である。
図2(a)は、図1に示した音響信号入力部110によ
って各SHORTブロックに切り出される時間軸上のサ
ンプルデータを示す波形図である。図2(b)は、図1
に示した変換部120によってMDCT変換された後の
1フレーム分のSHORTブロックのスペクトルデータ
を示す波形図である。なお、図2(b)に示すスペクト
ルデータは、縦軸にスペクトルの値、横軸に周波数を表
している。また、図2(a)及び図2(b)において、
サンプルデータ及びスペクトルデータはアナログ波形で
示されているが、実際には、いずれもデジタル信号であ
る。以下の波形図においても同様である。なお、図2
(b)においては簡単に説明するため、正の値のみから
なる波形を示しているが、実際にはMDCT変換による
スペクトルデータは負の値をとりうる。
FIG. 2 is a diagram showing a conversion process of an acoustic signal processed in the coding apparatus 100 shown in FIG.
FIG. 2A is a waveform diagram showing sample data on the time axis cut out into each SHORT block by the acoustic signal input unit 110 shown in FIG. 1. 2 (b) is shown in FIG.
4 is a waveform diagram showing spectrum data of one frame of SHORT blocks after being subjected to MDCT conversion by the conversion unit 120 shown in FIG. In the spectrum data shown in FIG. 2B, the vertical axis represents the spectrum value and the horizontal axis represents the frequency. 2 (a) and 2 (b),
Although the sample data and the spectrum data are shown as analog waveforms, both are actually digital signals. The same applies to the following waveform diagrams. Note that FIG.
In (b), a waveform consisting of only positive values is shown for the sake of simplicity. However, in reality, the spectrum data obtained by MDCT conversion may have negative values.

【0030】音響信号入力部110には、図2(a)の
ようなデジタル音響信号が入力される。音響信号入力部
110は、この入力信号から毎128サンプルを切り出
すタイミングで、その前後64サンプルをオーバーラッ
プさせて256サンプルを切り出し、変換部120に出
力する。変換部120は、合計256サンプルのデータ
をMDCTするが、MDCTによって得られるスペクト
ルが左右対称の波形となるため、その半分の128サン
プルに対応するスペクトルデータを生成する。図2
(b)は、このように生成された8つのウィンドウから
なるSHORTブロック、1フレームのスペクトルデー
タを示しており、各ウィンドウは変換部120によって
約2.9msecごとに生成される128点のスペクト
ルデータからなる。すなわち、各ウィンドウは、128
サンプルの電圧値で表されていた音響信号に含まれる周
波数成分の量(大きさ)を、前記サンプル数に対応する
128点のスペクトルデータで表している。
A digital audio signal as shown in FIG. 2A is input to the audio signal input section 110. The acoustic signal input unit 110 cuts out 256 samples by overlapping the 64 samples before and after that at the timing of cutting out every 128 samples from this input signal, and outputs it to the conversion unit 120. The conversion unit 120 MDCTs the data of 256 samples in total, but the spectrum obtained by MDCT has a symmetrical waveform, and thus generates the spectrum data corresponding to half the 128 samples. Figure 2
(B) shows the SHORT block composed of eight windows generated in this way, one frame of spectral data, and each window has 128 points of spectral data generated by the conversion unit 120 about every 2.9 msec. Consists of. That is, each window has 128
The amount (magnitude) of the frequency component contained in the acoustic signal represented by the voltage value of the sample is represented by the spectrum data of 128 points corresponding to the number of samples.

【0031】共有判定部137は、変換部120の出力
するスペクトルデータの8つのウィンドウに関して、他
のウィンドウと高域部の量子化データを共有するか否か
を判定し、かつ、高域部量子化データを他のウィンドウ
と共有する場合は、そのウィンドウの高域部スペクトル
データの値を「0」に置換する。例えば、具体的な判定
の方法として、高域部データを共有しない直前のウィン
ドウとの間で、スペクトル間のエネルギー差を求め、そ
のエネルギー差がしきい値未満である場合に共有すると
判定する。共有判定部137は、共有するか否かを示す
フラグを各ウィンドウに対応して生成し、生成したフラ
グからなり、どのウィンドウが直前のウィンドウの高域
部量子化データを共有するかを示す共有情報を出力す
る。
The sharing determination unit 137 determines whether or not the quantized data of the high frequency band is shared with other windows for the eight windows of the spectrum data output from the conversion unit 120, and the high frequency band quantization is performed. When the digitized data is shared with another window, the value of the high frequency band spectrum data of the window is replaced with "0". For example, as a specific determination method, an energy difference between spectra is obtained with respect to a window immediately before which high frequency band data is not shared, and when the energy difference is less than a threshold value, it is determined to be shared. The sharing determination unit 137 generates a flag indicating whether or not to share, corresponding to each window, and includes the generated flag, and indicates which window shares the high frequency region quantized data of the immediately previous window. Output information.

【0032】第1の量子化部131は、共有判定部13
7の出力するスペクトルデータを入力し、入力されたス
ペクトルデータの各スケールファクターバンドにつき、
それぞれスケールファクターを決定する。さらに、決定
したスケールファクターを用いてそのスケールファクタ
ーバンド内のスペクトルを量子化し、量子化結果である
量子化値とスケールファクターとを第1の符号化部13
2に出力する。具体的には、第1の量子化部131は、
各フレームの符号化後のビット数が伝送路の転送レート
の範囲に収まるように各スケールファクターバンドのス
ケールファクターを計算し、そのスケールファクターを
用いて当該スケールファクターバンド内の各スペクトル
を正規化し、量子化する。
The first quantizing unit 131 has a sharing determining unit 13
Input the spectrum data to be output from 7 and for each scale factor band of the input spectrum data,
Determine the scale factor for each. Furthermore, the spectrum in the scale factor band is quantized using the determined scale factor, and the quantized value and the scale factor which are the quantized result are quantized by the first encoding unit 13
Output to 2. Specifically, the first quantizer 131
Calculate the scale factor of each scale factor band so that the number of bits after encoding of each frame falls within the range of the transfer rate of the transmission path, normalize each spectrum in the scale factor band using the scale factor, Quantize.

【0033】第1の符号化部132は、第1の量子化部
131で量子化された1024サンプルのスペクトルデ
ータの量子化値及びその量子化に用いられたスケールフ
ァクターなどを、第1の符号化信号としてハフマン符号
化して所定のストリーム用のフォーマットに変換する。
スケールファクターについては、それぞれの差分を順次
求め、先頭のスケールファクターと差分とをハフマン符
号化する。
The first encoder 132 encodes the quantized value of the spectrum data of 1024 samples quantized by the first quantizer 131, the scale factor used for the quantization, and the like as the first code. It is Huffman-encoded as a converted signal and converted into a predetermined stream format.
Regarding the scale factor, the respective differences are sequentially obtained, and the leading scale factor and the difference are Huffman-encoded.

【0034】第2の符号化部134は、各ウィンドウで
直前のウィンドウの高域部量子化値を共有するか否かを
示す共有情報を共有判定部137から受け取り、その共
有情報を所定のストリーム用のフォーマットにハフマン
符号化し、第2の符号化信号として出力する。
The second encoding unit 134 receives sharing information indicating whether or not each window shares the high frequency band quantized value of the immediately preceding window from the sharing determination unit 137, and the sharing information is transmitted to a predetermined stream. Huffman-encoded into a format for and output as a second encoded signal.

【0035】ストリーム出力部140は、第1の符号化
部132から出力される第1の符号化信号にヘッダ情報
及びその他必要に応じた副情報を付加してMPEG−2
AACの符号化ビットストリームに変換し、かつ、第
2の符号化部134から出力された第2の符号化信号
を、上記ビットストリーム中の従来の復号化装置では無
視される又はその動作が規定されていない領域に格納す
る。
The stream output section 140 adds header information and other necessary sub-information to the first encoded signal output from the first encoding section 132 to add MPEG-2.
The second coded signal converted into the AAC coded bit stream and output from the second coding unit 134 is ignored by the conventional decoding device in the bit stream or its operation is defined. Store in an area that has not been set.

【0036】具体的には、ストリーム出力部140は、
第2の符号化部134から出力される符号化信号を、M
PEG−2 AACの符号化ビットストリームにおける
Fill ElementやData Stream
Elementに格納する。
Specifically, the stream output section 140 is
The encoded signal output from the second encoding unit 134 is M
Fill Element and Data Stream in PEG-2 AAC encoded bit stream
Stored in Element.

【0037】符号化装置100から出力されたビットス
トリームは、携帯電話通信網、インターネットなどの通
信回線網、ケーブルテレビ及びデジタルテレビの放送電
波などの伝送媒体を介して復号化装置200に伝送され
たり、CDやDVD等の光ディスク、半導体、ハードデ
ィスク等の記録媒体に記録されたりする。
The bit stream output from the coding device 100 is transmitted to the decoding device 200 via a transmission medium such as a mobile telephone communication network, a communication network such as the Internet, a broadcast wave of cable television and digital television. It is recorded on a recording medium such as an optical disk such as a CD or a DVD, a semiconductor, a hard disk, or the like.

【0038】なおまた実際のMPEG−2 AACの符
号化処理では、Gain ControlやTNS(T
emporal Noise Shaping)、聴覚
心理モデル、M/S Stereo、Intensit
y Stereo、Prediction等のツール利
用、及びブロックサイズの切り換え、ビットリザーバー
等を使用する場合がある。
Furthermore, in actual MPEG-2 AAC encoding processing, Gain Control and TNS (T
Emporial Noise Shaping), psychoacoustic model, M / S Stereo, Intensit
There are cases where tools such as y Stereo and Prediction are used, block size switching, and bit reservoirs are used.

【0039】<復号化装置200>復号化装置200
は、入力された符号化ビットストリームから前記共有情
報に基づいて高域部の付加された広帯域の音響データを
復元する復号化装置であって、ストリーム入力部21
0、第1の復号化部221、第1の逆量子化部222、
第2の復号化部223、第2の逆量子化部224、逆量
子化データ合成部225、逆変換部230及び音響信号
出力部240から構成される。
<Decoding Device 200> Decoding Device 200
Is a decoding device that restores wideband acoustic data added with a high frequency part from an input coded bitstream based on the shared information, and is a stream input part 21.
0, the first decoding unit 221, the first dequantization unit 222,
The second decoding unit 223, the second dequantization unit 224, the dequantized data combination unit 225, the detransformation unit 230, and the acoustic signal output unit 240 are included.

【0040】ストリーム入力部210は、携帯電話通信
網、インターネットなどの通信回線網、ケーブルテレビ
の伝送路及び放送電波などの伝送媒体を介したり、記録
媒体から再生したりして、符号化装置100において生
成されたビットストリームを入力し、従来の復号化装置
400が復号化するべき領域に格納されている第1の符
号化信号と、従来の復号化装置400が無視するかまた
はその情報に対する動作が規定されていない領域に格納
されている第2の符号化信号(共有情報)とを取り出し
て、それぞれ第1の復号化部221と第2の復号化部2
23とに出力する。
The stream input unit 210 passes through a portable telephone communication network, a communication line network such as the Internet, a transmission path such as a cable television and a transmission medium such as broadcast radio waves, or reproduces from a recording medium to reproduce data from the encoding device 100. The first encoded signal stored in the area to be decoded by the conventional decoding apparatus 400 and the operation performed on the information that the conventional decoding apparatus 400 ignores or inputs the bit stream generated in And the second coded signal (shared information) stored in the area in which is not specified, and the first decoding section 221 and the second decoding section 2 respectively.
23 and 23.

【0041】第1の復号化部221は、ストリーム入力
部210の出力する第1の符号化信号を入力し、ハフマ
ン符号化されたデータをストリーム用のフォーマットか
ら量子化データに復号化する。第2の復号化部223
は、ストリーム入力部210の出力する第2の符号化信
号を入力し、入力された第2の符号化信号を復号して共
有情報を出力する。第2の逆量子化部224では、第2
の復号化部223から出力された共有情報を参照して、
他のウィンドウに共有されている部分につき、第1の逆
量子化部222より出力されたスペクトルデータをコピ
ーして出力する。
The first decoding unit 221 inputs the first coded signal output from the stream input unit 210, and decodes the Huffman-coded data from the stream format into quantized data. Second decoding unit 223
Inputs the second encoded signal output from the stream input unit 210, decodes the input second encoded signal, and outputs shared information. In the second dequantization unit 224, the second dequantization unit 224
Referring to the shared information output from the decryption unit 223 of
The spectrum data output from the first inverse quantization unit 222 is copied and output for the portion shared by the other windows.

【0042】逆量子化データ合成部225は、第1の逆
量子化部222の出力するスペクトルデータと第2の逆
量子化部224の出力するスペクトルデータとを合成す
る。具体的には、第1の逆量子化部222から入力され
たスペクトルデータに対し、第2の逆量子化部224か
ら周波数を指定して入力されたスペクトルデータがあれ
ば、第1の逆量子化部222の出力であるその周波数の
スペクトルデータの値を、第2の逆量子化部224の出
力であるスペクトルデータの値で置換する。また、第2
の逆量子化部224からウィンドウを指定して入力され
た高域部スペクトルデータがあれば、そのウィンドウの
第1の逆量子化部222からの出力である高域部スペク
トルデータを、第2の逆量子化部224から入力された
スペクトル値で置換する。
The dequantized data synthesizing section 225 synthesizes the spectrum data output from the first dequantization section 222 and the spectrum data output from the second dequantization section 224. Specifically, for the spectrum data input from the first dequantization unit 222, if there is spectrum data input by designating a frequency from the second dequantization unit 224, the first dequantization unit The spectrum data value of the frequency output from the quantization unit 222 is replaced with the spectrum data value output from the second dequantization unit 224. Also, the second
If there is high frequency band spectrum data input from the dequantization unit 224 of the window, the high frequency band spectrum data output from the first dequantization unit 222 of the window is converted into the second high frequency band spectrum data. The spectral value input from the inverse quantization unit 224 is replaced.

【0043】逆変換部230は、MPEG−2 AAC
に従って、逆量子化データ合成部225から出力された
周波数軸上のスペクトルデータを、IMDCTを用いて
時間軸上の1024サンプルのサンプルデータに変換す
る。音響信号出力部240は、逆変換部230で得られ
た時間軸上のサンプルデータを順次組み合わせ、デジタ
ル音響データとして出力する。
The inverse transform unit 230 uses the MPEG-2 AAC.
Accordingly, the spectrum data on the frequency axis output from the inverse quantized data synthesis unit 225 is converted into sample data of 1024 samples on the time axis using IMDCT. The acoustic signal output unit 240 sequentially combines the sample data on the time axis obtained by the inverse conversion unit 230, and outputs it as digital acoustic data.

【0044】このように、8つウィンドウのうちいくつ
かの高域部量子化データを共有化することによって、ス
ペクトルデータの再現性の低下を最小限に抑えながら
も、共有された高域部情報の分だけデータの伝送量を削
減することができるという効果がある。
In this way, by sharing some of the high band quantized data of the eight windows, the shared high band information can be minimized while minimizing the deterioration of the reproducibility of the spectral data. There is an effect that the amount of data transmission can be reduced by that amount.

【0045】図3は、図1に示した共有判定部137に
よる高域部データの共有の一例を示す図である。図3
は、図2(b)と同様、MDCT変換によって得られる
1フレーム分のSHORTブロックのスペクトルデータ
を示している。図3において各ウィンドウにつき、破線
で区切った左側を、例えば0kHzから11.025k
Hzまでの再生帯域を表す低域部とし、右側を11.0
25kHzから22.05kHzまでの再生帯域である
高域部とする。
FIG. 3 is a diagram showing an example of sharing of high frequency band data by the sharing determination unit 137 shown in FIG. Figure 3
2B shows the spectrum data of the SHORT block for one frame obtained by MDCT conversion, as in FIG. 2B. In FIG. 3, for each window, the left side separated by a broken line is, for example, 0 kHz to 11.025 kHz.
The low-frequency part that represents the playback band up to Hz, and the right side is 11.0
The high frequency band is the reproduction band from 25 kHz to 22.05 kHz.

【0046】また、隣接する2つのウィンドウのスペク
トルは、ウィンドウを切り出すサイクルが短いため、図
3のように相互に類似した波形となる可能性が高い。こ
のような場合、共有判定部137は、相互に類似した波
形となるウィンドウ間で高域部量子化データを共有する
と判定する。例えば、第1ウィンドウと第2ウィンドウ
とのスペクトルの相似性が高く、第3ウィンドウから第
8ウィンドウまでのスペクトルが相互に相似性が高い場
合、共有判定部137は、第1ウィンドウと第2ウィン
ドウとが高域部量子化データを共有し、第3ウィンドウ
と第4以降のウィンドウとが高域部量子化データを共有
すると判定する。この場合、図3に矢印で示す範囲のス
ペクトルデータが伝送(すなわち、量子化及び符号化)
の対象となり、それ以外の第2ウィンドウと、第4〜第
8ウィンドウとの高域部のスペクトルデータは伝送(す
なわち、量子化及び符号化)の対象とならず、共有判定
部137によって「0」に置換される。
Further, the spectra of two adjacent windows are likely to have waveforms similar to each other as shown in FIG. 3 because the cycle for cutting out the windows is short. In such a case, the sharing determination unit 137 determines to share the high frequency region quantized data between windows having waveforms similar to each other. For example, when the spectra of the first window and the second window have high similarity and the spectra of the third window to the eighth window have high similarities to each other, the sharing determination unit 137 causes the sharing determination unit 137 to determine the first window and the second window. And the high band quantized data are shared, and the third window and the fourth and subsequent windows share the high band quantized data. In this case, the spectrum data in the range indicated by the arrow in FIG. 3 is transmitted (that is, quantization and coding).
The spectrum data in the high frequency band of the second window and the fourth to eighth windows other than that are not subject to transmission (that is, quantization and encoding), and are not “0” by the sharing determination unit 137. Will be replaced with

【0047】図4は、図1に示したストリーム出力部1
40によって第2の符号化信号(共有情報)が格納され
るビットストリームのデータ構造を示す図である。図4
(a)は、ビットストリーム内に第2の符号化信号を格
納した場合の各領域内部のデータ構造を示す図である。
図4(b)は、MPEG−2 AACに準拠する音響符
号化ビットストリームの一部データ構造の一例を示す図
である。図4(c)は、MPEG−2 AACに準拠す
る音響符号化ビットストリームの一部データ構造の他の
例を示す図である。図4(b)において斜線で示す部分
は、例えば、ビットストリームのデータ長を合わせるた
めに「0」で埋められる領域(FillElemen
t)である。また、図4(c)において斜線で示す部分
は、例えば、Data Stream Element
(DSE)という領域であって、この領域は、将来の拡
張のためMPEG−2 AACの規格によってビット長
などの物理的構造だけが規定された領域である。前述の
共有情報は、第2の符号化部134によって符号化され
た後、図4(a)のように識別情報を付され、ビットス
トリーム中の上記Fill Element又はDSE
などの領域に格納される。
FIG. 4 shows the stream output unit 1 shown in FIG.
It is a figure which shows the data structure of the bit stream which stores the 2nd encoding signal (shared information) by 40. Figure 4
(A) is a figure which shows the data structure inside each area | region when the 2nd coded signal is stored in a bit stream.
FIG. 4B is a diagram showing an example of a partial data structure of an audio coded bit stream conforming to MPEG-2 AAC. FIG. 4C is a diagram showing another example of a partial data structure of an audio coded bitstream conforming to MPEG-2 AAC. The shaded portion in FIG. 4B is, for example, an area (FillElemen) filled with “0” to match the data length of the bitstream.
t). In addition, the hatched portion in FIG. 4C indicates, for example, Data Stream Element.
The area (DSE) is an area in which only the physical structure such as the bit length is defined by the MPEG-2 AAC standard for future expansion. The above-mentioned shared information is encoded by the second encoding unit 134, and then has identification information as shown in FIG.
It is stored in the area such as.

【0048】Fill Elementに第2の符号化
信号を格納した場合、従来の復号化装置400では復号
化すべき符号化信号とは認識されず、無視される。DS
Eに第2の符号化信号を格納した場合、従来の復号化装
置400によって第2の符号化信号が読み取られたとし
ても、DSE内で読み取られた第2の符号化信号に対す
る復号化装置400の動作が規定されていないので、復
号化装置400はこれに対応する処理を何も行わない。
従って、このような領域に第2の符号化信号を格納して
おくことによって、本発明の符号化装置100による符
号化ビットストリームが従来の復号化装置400に入力
された場合でも、第2の符号化信号は音響符号化信号と
して復号化されないために、第2の符号化信号を正しく
復号化することができないことに起因する雑音の発生等
を防止することができる。これにより、従来の復号化装
置400であっても、第1の符号化信号のみに従って、
音響信号を従来どおり支障なく再生することができると
いう効果がある。
When the second coded signal is stored in the Fill Element, the conventional decoding apparatus 400 does not recognize the coded signal to be decoded and ignores it. DS
When the second coded signal is stored in E, even if the second coded signal is read by the conventional decoding apparatus 400, the decoding apparatus 400 for the second coded signal read in the DSE Is not specified, the decoding apparatus 400 does not perform any processing corresponding to this.
Therefore, by storing the second coded signal in such an area, even if the coded bit stream by the coding apparatus 100 of the present invention is input to the conventional decoding apparatus 400, Since the coded signal is not decoded as an acoustic coded signal, it is possible to prevent the occurrence of noise or the like due to the inability to correctly decode the second coded signal. Thereby, even in the conventional decoding device 400, according to only the first coded signal,
There is an effect that the audio signal can be reproduced as usual without any trouble.

【0049】このようなFill Elementに第
2の符号化信号を格納する場合、Fill Eleme
ntには当初から図4(a)のヘッダ情報が設けられて
いる。このヘッダ情報には、Fill Element
であることを示すFillElement識別子及びF
ill Element全体のビット長を示すビット数
データなどが含まれている。DSEに第2の符号化信号
を格納する場合にも、Fill Elementと同
様、図4(a)に示したヘッダ情報が設けられており、
以下のデータがDSEであることを示すDSE識別子及
びDSE全体のビット長を示すビット数データなどが含
まれている。ストリーム出力部140は、このヘッダ情
報に続いて、識別情報と共有情報とからなる第2の符号
化信号を格納する。
When the second coded signal is stored in such a Fill Element, Fill Element is used.
The header information of FIG. 4A is provided in the nt from the beginning. This header information includes the Fill Element
FillElement identifier and F indicating that
Bit number data indicating the bit length of the entire ill Element is included. Even when the second encoded signal is stored in the DSE, the header information shown in FIG. 4A is provided as in the case of the Fill Element,
The following data includes a DSE identifier indicating that it is a DSE and bit number data indicating the bit length of the entire DSE. The stream output unit 140 stores the second encoded signal including the identification information and the shared information, following the header information.

【0050】識別情報は、以下に格納されている符号化
情報が、本発明の符号化装置100による符号化情報で
あるか否かを示す情報である。例えば、識別情報が「0
001」であれば、以下の符号化情報が符号化装置10
0によって符号化された共有情報であることを示してい
る。また、例えば、識別情報が「1000」であれば、
以下の符号化情報が符号化装置100によって符号化さ
れたものでないことを示している。本発明の復号化装置
200は、上記の例では、識別情報が「0001」であ
れば、以下の共有情報を第2の復号化部223で復号化
し、復号化の結果得られた共有情報に基づいて各ウィン
ドウの高域部スペクトルデータを復元するが、識別情報
が「1000」であれば、以下の符号化データを無視す
る。このFill ElementやDSEのように、
内部に符号化データが格納されていても、従来の復号化
装置400には音響符号化信号として認識されない領域
に第2の符号化信号を格納する場合、これらの領域には
他の方式に基づく符号化情報も格納される可能性があ
る。このような場合、第2の符号化信号に識別情報を含
めておくことによって、他の符号化情報と本発明の第2
の符号化信号とを明確に区別することができ、それらの
混同を容易に防止することができるという効果がある。
The identification information is information indicating whether or not the coded information stored below is coded by the coding apparatus 100 of the present invention. For example, if the identification information is "0
001 ”, the following encoding information is obtained by the encoding device 10
This indicates that the shared information is coded by 0. Further, for example, if the identification information is “1000”,
It is indicated that the following coded information is not coded by the coding apparatus 100. In the above example, if the identification information is “0001”, the decryption device 200 of the present invention decrypts the following shared information by the second decryption unit 223 and converts it into the shared information obtained as a result of the decryption. The high frequency band spectrum data of each window is restored based on this, but if the identification information is “1000”, the following encoded data is ignored. Like this Fill Element and DSE,
Even if the encoded data is stored inside, when the second encoded signal is stored in the areas which are not recognized as the acoustic encoded signals by the conventional decoding device 400, these areas are based on other methods. Encoding information may also be stored. In such a case, by including identification information in the second coded signal, other coded information and the second code of the present invention can be obtained.
This has the effect that it can be clearly distinguished from the coded signal of 1 and the confusion thereof can be easily prevented.

【0051】さらに、この識別情報を用いることによっ
て、上記に例示した以外にも、前述の共有情報に本発明
の以下の実施の形態に基づく他の情報(例えば、補助情
報など)を組み合わせて第2の符号化信号に格納する場
合などに、その旨を復号化装置200に明示することが
できるという効果がある。なお、この識別情報は、必ず
しも第2の符号化信号の先頭に付す必要はなく、符号化
された共有情報の末尾あるいは一部に挿入してもよい。
Further, by using this identification information, in addition to the above-mentioned examples, the above-mentioned shared information is combined with other information (for example, auxiliary information) based on the following embodiments of the present invention. When it is stored in the second encoded signal, the effect can be clearly indicated to the decoding device 200. Note that this identification information does not necessarily have to be added to the beginning of the second encoded signal, and may be inserted at the end or part of the encoded shared information.

【0052】図5は、図1に示したストリーム出力部1
40によって第2の符号化信号(共有情報)が格納され
るビットストリームの他のデータ構造を示す図である。
なお、この場合、音響符号化ビットストリームは、MP
EG−2 AACに準拠するものでなくてもよい。図5
(a)は、第1の符号化信号のみがフレームごとに連続
して格納されているストリーム1を示している。図5
(b)は、共有情報が符号化された第2の符号化信号の
みが、ストリーム1に対応するフレームごとに連続して
格納されているストリーム2を示している。図5(b)
に示すストリーム2には、図4(a)のようにヘッダ情
報及び識別情報を付加された共有情報が、例えば、1フ
レーム分ずつ順次格納される。このように、ストリーム
出力部140は、第1の符号化信号と第2の符号化信号
とを、それぞれ全く別のストリーム1とストリーム2と
に格納してもよい。例えば、ストリーム1とストリーム
2とは、異なるチャンネルで伝送されるビットストリー
ムであってもよい。
FIG. 5 shows the stream output unit 1 shown in FIG.
It is a figure which shows the other data structure of the bit stream in which the 2nd encoding signal (shared information) is stored by 40.
In this case, the audio coded bit stream is MP
It does not have to comply with EG-2 AAC. Figure 5
(A) shows stream 1 in which only the first coded signal is continuously stored for each frame. Figure 5
(B) shows stream 2 in which only the second encoded signal in which shared information is encoded is continuously stored for each frame corresponding to stream 1. Figure 5 (b)
In the stream 2 shown in FIG. 4, shared information to which header information and identification information are added as shown in FIG. In this way, the stream output unit 140 may store the first encoded signal and the second encoded signal in completely different streams 1 and 2, respectively. For example, the stream 1 and the stream 2 may be bit streams transmitted on different channels.

【0053】このように、第1の符号化信号と第2の符
号化信号をまったく異なるビットストリームで伝送する
ことにより、入力音響信号の基本的な情報を表す低域部
分をあらかじめ伝送又は蓄積しておき、必要に応じて高
域部に関する情報を後から付加することができるという
効果がある。
As described above, by transmitting the first coded signal and the second coded signal by completely different bit streams, the low-frequency part representing the basic information of the input acoustic signal is transmitted or accumulated in advance. In addition, there is an effect that the information regarding the high frequency region can be added later, if necessary.

【0054】また、第2の符号化信号を組み込んだ符号
化ビットストリームを本発明の復号化装置200のみを
対象として出力する場合には、符号化装置100及び復
号化装置200間であらかじめ定めた上記以外のヘッダ
情報内の所定位置に組み込んでもよいし、第1の符号化
信号中の所定の位置に第2の符号化信号を組み込んでも
よいし、その両方にまたがって組み込んでもよい。ま
た、ビットストリーム中に第2の符号化信号を格納する
ために、ヘッダにおいても第1の符号化信号において
も、連続した領域を確保しなくてもよい。図5(c)
は、第2の符号化信号をビットストリームのヘッダ情報
及び第1の符号化信号の中に飛び飛びに挿入した場合の
ビットストリームのデータ構造を示す図である。すなわ
ち、図5(c)のように、ヘッダ情報と第1の符号化信
号との中に、非連続に第2の符号化信号を組み込んでも
よい。この場合も、図4(a)のようにヘッダ情報及び
識別情報を付加された共有情報が順次格納される。
When the encoded bit stream incorporating the second encoded signal is output only to the decoding device 200 of the present invention, it is predetermined between the encoding device 100 and the decoding device 200. The second encoded signal may be incorporated at a predetermined position in the header information other than the above, the second encoded signal may be incorporated at a predetermined position in the first encoded signal, or both may be incorporated. Further, in order to store the second coded signal in the bit stream, it is not necessary to secure a continuous area in the header and the first coded signal. FIG. 5 (c)
FIG. 6 is a diagram showing a data structure of a bitstream when the second coded signal is inserted in the header information of the bitstream and the first coded signal in a scattered manner. That is, as shown in FIG. 5C, the second coded signal may be discontinuously incorporated in the header information and the first coded signal. Also in this case, the shared information to which the header information and the identification information are added is sequentially stored as shown in FIG.

【0055】以上のように構成された符号化装置100
及び復号化装置200の動作について、以下、図6、図
7及び図10のフローチャートと図9の波形図とを用い
て説明する。図6は、図1に示した第1の量子化部13
1のスケールファクター決定処理における動作を示すフ
ローチャートである。第1の量子化部131は、まず、
スケールファクターの初期値として、各スケールファク
ターバンドに共通のスケールファクターを定め(S9
1)、そのスケールファクターを用いて、1フレーム分
の音響データとして共有判定部137から出力されたス
ペクトルデータをすべて量子化するとともに、求められ
たスケールファクターの前後の差分を求め、その差分と
先頭のスケールファクターと各量子化値とをハフマン符
号化する(S92)。なお、ここでの量子化及び符号化
は、ビット数のカウントのためだけに行うので、処理を
簡略化するため、データのみについて行い、ヘッダなど
の情報は付加しないものとする。次いで、第1の量子化
部131は、ハフマン符号化後のデータのビット数が所
定のビット数を超えたか否かを判断し(S93)、超え
ていれば、スケールファクターの初期値を下げ(S10
1)、そのスケールファクターの値を用いて、同じスペ
クトルデータにつき、量子化とハフマン符号化とをやり
直した上(S92)、ハフマン符号化後の1フレーム分
の符号化データのビット数が所定のビット数を超えたか
否かを判断して(S93)、所定ビット数以下になるま
でこの処理を繰り返す。
Coding apparatus 100 configured as described above
The operation of the decoding apparatus 200 will be described below with reference to the flowcharts of FIGS. 6, 7, and 10 and the waveform chart of FIG. 6 is a block diagram of the first quantizer 13 shown in FIG.
It is a flow chart which shows operation in scale factor decision processing of No. 1. The first quantizer 131 first
As an initial value of the scale factor, a scale factor common to each scale factor band is determined (S9
1) Using the scale factor, all spectrum data output from the sharing determination unit 137 as acoustic data for one frame is quantized, and a difference before and after the obtained scale factor is calculated, and the difference and the beginning Huffman coding is performed on the scale factor and each quantized value (S92). Since the quantization and the encoding here are performed only for counting the number of bits, it is assumed that only the data is added and the information such as the header is not added in order to simplify the processing. Next, the first quantization unit 131 determines whether or not the number of bits of the Huffman-encoded data has exceeded a predetermined number of bits (S93). If the number of bits has exceeded, the initial value of the scale factor is lowered ( S10
1) Quantization and Huffman coding are performed again for the same spectrum data using the value of the scale factor (S92), and the number of bits of coded data for one frame after Huffman coding is set to a predetermined value. It is determined whether or not the number of bits is exceeded (S93), and this process is repeated until the number of bits is less than or equal to the predetermined number.

【0056】第1の量子化部131は、符号化データの
ビット数が所定のビット数を超えていなければ、スケー
ルファクターバンドごとに以下の処理を繰り返し、各ス
ケールファクターバンドのスケールファクターを決定す
る(S94)。まず、スケールファクターバンド内の各
量子化値を逆量子化し(S95)、それぞれの逆量子化
値とそれに対応する元のスペクトルデータとの各絶対値
の差分を求めて合計する(S96)。さらに、求められ
た差分の合計が許容範囲内の値であるか否かを判断し
(S97)、許容範囲内であれば、次のスケールファク
ターバンドにつき、上記の処理を繰り返す(S94〜S
98)。一方、許容範囲を超えていれば、スケールファ
クターの値を大きくして当該スケールファクターバンド
のスペクトルデータを量子化するとともに(S10
0)、その量子化値を逆量子化して(S95)、逆量子
化値と対応するスペクトルデータとの絶対値の差分を合
計する(S96)。さらに、差分の合計が許容範囲内か
どうかを判断して(S97)許容範囲を超えていれば、
許容範囲内となるまでスケールファクターを順次大きく
し(S100)、上記の処理(S95〜S97及びS1
00)を繰り返す。
If the number of bits of encoded data does not exceed the predetermined number of bits, the first quantizer 131 repeats the following processing for each scale factor band to determine the scale factor of each scale factor band. (S94). First, each quantized value in the scale factor band is inversely quantized (S95), and the absolute value difference between each inverse quantized value and the corresponding original spectrum data is obtained and summed (S96). Further, it is judged whether or not the calculated sum of the differences is a value within the allowable range (S97), and if it is within the allowable range, the above process is repeated for the next scale factor band (S94 to S94).
98). On the other hand, if it exceeds the allowable range, the value of the scale factor is increased to quantize the spectrum data of the scale factor band (S10).
0), the quantized values are inversely quantized (S95), and the absolute value differences between the inverse quantized values and the corresponding spectrum data are summed (S96). Further, it is judged whether the total of the differences is within the allowable range (S97), and if it exceeds the allowable range,
The scale factor is sequentially increased until it is within the allowable range (S100), and the above processing (S95 to S97 and S1) is performed.
00) is repeated.

【0057】第1の量子化部131は、すべてのスケー
ルファクターバンドにつき、スケールファクターバンド
内の量子化値を逆量子化した値と元のスペクトルデータ
との絶対値の差分の合計が許容範囲となるようなスケー
ルファクターを決定すると(S98)、決定されたスケ
ールファクターを用いて、再度、1フレーム分のスペク
トルデータを量子化し、各スケールファクターの差分と
先頭のスケールファクターと各量子化値とをハフマン符
号化し、符号化データのビット数が所定のビット数を超
えているか否かを判定する(S99)。符号化データの
ビット数が所定のビット数を超えていれば、それが所定
のビット数以下になるまでスケールファクターの初期値
を下げた後(S101)、各スケールファクターバンド
内のスケールファクターを決定する処理(S94〜S9
8)を繰り返す。符号化データのビット数が所定のビッ
ト数を超えていなければ(S99)、そのときの各スケ
ールファクターの値を、各スケールファクターバンドの
スケールファクターに決定する。
The first quantizer 131, for all scale factor bands, sums the difference between the absolute values of the dequantized quantized values in the scale factor bands and the original spectrum data within the allowable range. When such a scale factor is determined (S98), the spectrum data for one frame is quantized again using the determined scale factor, and the difference between each scale factor, the leading scale factor, and each quantized value are calculated. Huffman coding is performed, and it is determined whether the number of bits of the encoded data exceeds a predetermined number of bits (S99). If the number of bits of the encoded data exceeds the predetermined number of bits, the scale factor initial value is reduced until it becomes equal to or smaller than the predetermined number of bits (S101), and then the scale factor in each scale factor band is determined. Processing (S94 to S9
Repeat 8). If the number of bits of the encoded data does not exceed the predetermined number of bits (S99), the value of each scale factor at that time is determined as the scale factor of each scale factor band.

【0058】なお、スケールファクターバンド内の量子
化値を逆量子化した値と元のスペクトルデータとの絶対
値の差分の合計が許容範囲となるかどうかの判断は、聴
覚心理モデルなどのデータに基づいて行われる。
It should be noted that whether or not the sum of the differences between the absolute values of the dequantized quantized values in the scale factor band and the original spectrum data is within the allowable range is determined by data such as a psychoacoustic model. It is done based on.

【0059】また、ここではスケールファクターの初期
値を比較的大きな数値に設定し、ハフマン符号化後の符
号化データのビット数が、所定のビット数を超えた場合
には、順次、スケールファクターの初期値を下げていく
方法でスケールファクターを決定しているが、必ずしも
このようにする必要はない。例えば、あらかじめスケー
ルファクターの初期値を低い値に設定しておき、その初
期値を徐々に増加していき、符号化データの全体のビッ
ト数が所定のビット数を最初に超えた段階で、直前に設
定されていたスケールファクターの初期値を用いて各ス
ケールファクターバンドのスケールファクターを決定す
るようにしてもよい。
Further, here, the initial value of the scale factor is set to a relatively large numerical value, and when the number of bits of the coded data after Huffman coding exceeds a predetermined number of bits, the scale factor of the scale factor is sequentially changed. The scale factor is determined by the method of lowering the initial value, but it is not always necessary to do so. For example, the initial value of the scale factor is set to a low value in advance, the initial value is gradually increased, and immediately before the total number of bits of encoded data exceeds a predetermined number of bits, The scale factor of each scale factor band may be determined by using the initial value of the scale factor set in the above.

【0060】さらに、ここでは1フレーム分の符号化デ
ータ全体のビット数が所定のビット数を超えないように
各スケールファクターバンドのスケールファクターを決
定したが、必ずしもこのようにしなくてよい。例えば、
各スケールファクターバンドにおいて、スケールファク
ターバンド内の各量子化値が所定のビット数を超えない
ようスケールファクターを決定するようにしてもよい。
Further, here, the scale factor of each scale factor band is determined so that the number of bits of the entire encoded data for one frame does not exceed a predetermined number of bits, but this need not always be the case. For example,
In each scale factor band, the scale factor may be determined so that each quantized value in the scale factor band does not exceed a predetermined number of bits.

【0061】図7は、図1に示した共有判定部137の
1フレームの共有判定処理における動作の一例を示すフ
ローチャートである。ここで共有判定部137は、フレ
ーム内の各ウィンドウの判定結果を、例えば8個のウィ
ンドウに対応する8個のフラグからなる共有情報で表す
とする。フラグはそれぞれ、値「0」が高域部の量子化
データを伝送することを表し、値「1」が高域部の量子
化データを他のウィンドウと共有することを表す。
FIG. 7 is a flow chart showing an example of the operation in the one-frame sharing determination processing of the sharing determination unit 137 shown in FIG. Here, it is assumed that the sharing determination unit 137 represents the determination result of each window in the frame with sharing information including, for example, eight flags corresponding to eight windows. Each of the flags indicates that the value "0" transmits the quantized data in the high frequency band, and the value "1" indicates that the quantized data in the high frequency band is shared with other windows.

【0062】共有判定部137は、変換部120から入
力した第1ウィンドウの全スペクトルデータを第1の量
子化部131に出力し、共有情報の第1ビットであるフ
ラグを「0」にした後(S1)、残りの第2から第8ま
での各ウィンドウについて、以下の判定処理を繰り返す
(S2〜S9)。
The sharing determination unit 137 outputs all the spectrum data of the first window input from the conversion unit 120 to the first quantization unit 131, and after setting the flag which is the first bit of the sharing information to “0”. (S1) Then, the following determination process is repeated for each of the remaining second to eighth windows (S2 to S9).

【0063】すなわち、注目しているウィンドウと、そ
の直前のウィンドウであってフラグが「0」のウィンド
ウとの間でスペクトルのエネルギー差を求め(S3)、
エネルギー差が所定のしきい値未満となるか否かを判断
する(S4)。
That is, the energy difference of the spectrum between the window of interest and the window immediately before the window having the flag "0" is calculated (S3),
It is determined whether the energy difference is less than a predetermined threshold value (S4).

【0064】判断の結果、エネルギー差がしきい値未満
であれば、現在注目しているウィンドウと、前記直前の
ウィンドウとのスペクトルが相似であるとして、注目ウ
ィンドウと前記直前のウィンドウとの間で高域部スペク
トルデータを共有すると判定する。この場合、共有判定
部137は、注目ウィンドウの高域部スペクトルを
「0」に置換し(S5)、共有情報中の注目ウィンドウ
に対応するビットを「1」にする(S6)。一方、判断
の結果、エネルギー差がしきい値以上であれば、注目ウ
ィンドウと前記直前のウィンドウとの間で高域部スペク
トルデータを共有しないと判定する。この場合、共有判
定部137は、注目ウィンドウの全スペクトルデータを
そのまま第1の量子化部131に出力し(S7)、共有
情報中の注目ウィンドウに対応するビットを「0」にす
る(S8)。
If the result of the determination is that the energy difference is less than the threshold value, it is determined that the current window and the immediately preceding window have similar spectra, and the spectrum is similar between the window of interest and the immediately preceding window. It is determined to share the high frequency spectrum data. In this case, the sharing determination unit 137 replaces the high frequency band spectrum of the window of interest with "0" (S5), and sets the bit corresponding to the window of interest in the shared information to "1" (S6). On the other hand, as a result of the determination, if the energy difference is equal to or more than the threshold value, it is determined that the high frequency band spectrum data is not shared between the target window and the immediately preceding window. In this case, the sharing determination unit 137 outputs all the spectrum data of the window of interest as it is to the first quantization unit 131 (S7), and sets the bit corresponding to the window of interest in the shared information to "0" (S8). .

【0065】例えば、まず、第2ウィンドウを注目ウィ
ンドウとし、第2ウィンドウの128サンプルからなる
各スペクトルデータと、第1ウィンドウの128サンプ
ルからなる各スペクトルデータとについて、同じ周波数
同士の差分を求め、求められた差分を合計することによ
って、第2ウィンドウと第1ウィンドウとのスペクトル
のエネルギー差を求め(S3)、求められたエネルギー
差が所定のしきい値未満であるか否かを判断する(S
4)。
For example, first, with the second window as the window of interest, the difference between the same frequencies is obtained for each of the spectral data of 128 samples of the second window and each of the spectral data of 128 samples of the first window. By summing the calculated differences, the energy difference between the spectra of the second window and the first window is calculated (S3), and it is determined whether or not the calculated energy difference is less than a predetermined threshold (S3). S
4).

【0066】ここで、第1ウィンドウと第2ウィンドウ
とのエネルギー差がしきい値未満であったとすると、共
有判定部137は、第2ウィンドウと第1ウィンドウと
のスペクトルが相似であるので、第2ウィンドウにおい
て、第1ウィンドウの高域部データを共有すると判定す
る。この判定に応じて、共有判定部137は第2ウィン
ドウの高域部スペクトルデータをすべて「0」に置換し
(S5)、共有情報の第2ビットのフラグを「1」にす
る(S6)。
Here, if the energy difference between the first window and the second window is less than the threshold value, the sharing determination unit 137 determines that the spectra of the second window and the first window are similar to each other. In the two windows, it is determined that the high frequency band data of the first window is shared. In response to this determination, the sharing determination unit 137 replaces all the high frequency band spectrum data of the second window with "0" (S5), and sets the flag of the second bit of the shared information to "1" (S6).

【0067】第2ウィンドウについての判定処理はこれ
で終了した(S9)ので、共有判定部137は、次の第
3ウィンドウについて(S2)、第1ウィンドウとのス
ペクトルのエネルギー差を計算する(S3)。具体的に
は、第3ウィンドウの128サンプルからなる各スペク
トルデータと、第1ウィンドウの128サンプルからな
る各スペクトルデータとについて、同じ周波数同士の差
分を求め、求められた差分を合計することによって、第
2ウィンドウと第1ウィンドウとのスペクトルのエネル
ギー差を求める。さらに、求められたエネルギー差が所
定のしきい値未満であるか否かを判断する(S4)。
Since the determination process for the second window is finished (S9), the sharing determination unit 137 calculates the energy difference of the spectrum with the first window for the next third window (S2) (S3). ). Specifically, with respect to each of the spectral data of 128 samples of the third window and each of the spectral data of 128 samples of the first window, the difference between the same frequencies is obtained, and the obtained differences are summed, An energy difference between spectra of the second window and the first window is obtained. Furthermore, it is determined whether the calculated energy difference is less than a predetermined threshold value (S4).

【0068】判断の結果、エネルギー差がしきい値以上
であったとすると、第3ウィンドウと第1ウィンドウと
のスペクトルは相似でないとして、第3ウィンドウにお
いて第1ウィンドウの高域部スペクトルデータを共有し
ないと判定する。これに応じて、共有判定部137は、
第3ウィンドウの高域部スペクトルデータを「0」に置
換しないで、そのまま全スペクトルデータを第1の量子
化部131に出力するとともに(S7)、共有情報の第
3ビットのフラグを「0」にする。
As a result of the determination, if the energy difference is equal to or more than the threshold value, it is determined that the spectra of the third window and the first window are not similar to each other, and the high frequency band spectrum data of the first window is not shared in the third window. To determine. In response to this, the sharing determination unit 137
Without replacing the high frequency band spectrum data of the third window with "0", all the spectrum data is output as it is to the first quantization unit 131 (S7), and the flag of the third bit of the shared information is "0". To

【0069】共有判定部137は、これで、第3ウィン
ドウについての判定処理を終了した(S9)ので、次の
第4ウィンドウについて(S2)、直前のウィンドウで
あって高域部スペクトルデータを「0」にしないで出力
したウィンドウとのエネルギー差を計算するが、この場
合、前記直前のウィンドウとは、他のウィンドウと高域
部量子化データを共有する連続したウィンドウの直前に
ある第3ウィンドウのことである。以下、共有判定部1
37は上記と同様にして第8ウィンドウまで共有判定処
理を繰り返し、第8ウィンドウについての処理を終了す
ると、1フレームについての処理を終了する。この結
果、当該1フレームのスペクトルデータが第1の量子化
部131に出力され、そのフレームについての8ビット
の共有情報、「01011111」が生成される。この
場合、第2ウィンドウが直前の第1ウィンドウと高域部
量子化データを共有し、第4から第8までの連続するウ
ィンドウが直前の第3ウィンドウと高域部量子化データ
を共有することを示している。また、同じ共有情報の別
の表現方法として、第1ウィンドウは常に高域部量子化
データを伝送すると決めておく場合、共有情報の先頭1
ビットを省略して、共有情報を「1011111」と7
ビットで表してもよい。なお、共有情報はこのような表
現に限ったものでなくてもよい。共有判定部137は、
生成された共有情報を第2の符号化部134に出力し、
その後、次のフレームについて同様の処理を行う。
Since the sharing determination unit 137 has finished the determination processing for the third window (S9), the high frequency spectrum data of the immediately preceding window for the next fourth window (S2) is " The energy difference from the output window is calculated without being set to "0". In this case, the immediately preceding window is the third window immediately before the consecutive windows that share the high frequency region quantized data with other windows. That is. Hereinafter, the sharing determination unit 1
37 repeats the sharing determination process up to the eighth window in the same manner as described above, and when the process for the eighth window ends, the process for one frame ends. As a result, the spectrum data of the one frame is output to the first quantization unit 131, and 8-bit shared information “01011111” for the frame is generated. In this case, the second window shares the high band quantized data with the immediately preceding first window, and the consecutive windows from the fourth to the eighth share the high band quantized data with the immediately preceding third window. Is shown. As another method of expressing the same shared information, when it is decided that the first window always transmits high-frequency quantized data, the first 1
The bits are omitted and the shared information is set to "10111111" and 7
It may be expressed in bits. The shared information does not have to be limited to such an expression. The sharing determination unit 137
The generated shared information is output to the second encoding unit 134,
After that, similar processing is performed for the next frame.

【0070】なお、ここでは、共有判定部137が注目
しているウィンドウと、高域部スペクトル値を「0」に
置換しないで出力した直前のウィンドウとのスペクトル
のエネルギー差を、各ウィンドウの全域128サンプル
について求めたが、必ずしもこのようにする必要はな
く、高域部64サンプルについてのみウィンドウ間のエ
ネルギー差を求め、そのエネルギー差がしきい値未満と
なるウィンドウについて、高域部データを共有すると判
定してもよい。
Here, the energy difference of the spectrum between the window that the sharing determination unit 137 is paying attention to and the immediately preceding window that is output without replacing the high-frequency part spectrum value with “0” is the whole area of each window. Although it was calculated for 128 samples, it is not always necessary to do this, and the energy difference between windows is calculated only for 64 samples in the high frequency band, and the high frequency band data is shared for the windows where the energy difference is less than the threshold value. Then, it may be determined.

【0071】また、ここでは、第1ウィンドウについて
は高域部スペクトルデータを置換しないで、常に全スペ
クトルデータをそのまま出力する場合を説明したが、必
ずしもそうする必要はない。例えば、共有判定部137
は、1フレーム内で、どのウィンドウに対してもスペク
トルのエネルギー差が最小となるウィンドウをサーチ
し、その1つ、あるいは、エネルギー差が小さい順に所
定の数のウィンドウだけ、ウィンドウ内の全スペクトル
データを(量子化及び符号化し、)伝送するとしてもよ
い。そうした場合、第1ウィンドウの高域部スペクトル
データを必ず伝送するとは限らない。
Although the case where the high frequency band spectrum data is not replaced in the first window and all the spectrum data is always output as it is has been described here, it is not always necessary to do so. For example, the sharing determination unit 137
Is a window in which the energy difference of the spectrum is the smallest for any window in one frame. May be transmitted (quantized and encoded). In such a case, the high band spectrum data of the first window is not always transmitted.

【0072】なお、本実施の形態の形態において、ある
ウィンドウが他のウィンドウと高域部を共有するか否か
の判定は、高域部データを共有しない直前のウィンドウ
との間でスペクトルのエネルギー差を求め、そのエネル
ギー差がしきい値未満であれば共有すると判定したが、
ウィンドウ間で高域部量子化データを共有するか否かの
判定基準は、エネルギー差でなくてもよい。例えば、各
ウィンドウ内においてスペクトル値の絶対値が最大とな
るスペクトルデータの周波数軸上の位置(周波数)を求
め、ウィンドウ間でのその位置のずれが所定のしきい値
未満となる場合に、高域部量子化データを共有するとし
てもよい。それ以外にも、高域部データを共有しない直
前のウィンドウとの間でスペクトルのピークの数および
/または位置が類似する場合に、共有すると判定しても
よい。また、これらをスケールファクターバンドごとに
比較して、類似の度合いに応じて点数評価し、1ウィン
ドウ全体について総合的に判断してもよい。また単に、
高域部データを共有しない直前のウィンドウとの間で、
ウィンドウ内において絶対値が最大となるスペクトルデ
ータの位置が類似する場合に、共有すると判定してもよ
い。さらに、各ウィンドウのスペクトルに所定の関数を
かけて比較し、その比較結果に基づいて共有するか否か
を判定してもよい。なおまた、高域部データのみを共有
する場合には、スペクトルの相似性を比較することな
く、あらかじめ定めたウィンドウ間で高域部スペクトル
データを共有するとしてもよい。例えば、第2、第4、
第6及び第8というように偶数番目のウィンドウにおい
て奇数番目のウィンドウと高域部データを共有するよう
に定めておいてもよく、その逆でもよい。また、それ以
外の組み合わせであらかじめ高域部データを「0」に置
換しないウィンドウを定めておいてもよい。例えば、特
定の1つのウィンドウの高域部データを他の7つのウィ
ンドウで共有するとしておいてもよい。
In the present embodiment, it is determined whether or not a certain window shares the high frequency band with another window by determining the energy of the spectrum between the immediately preceding window that does not share the high frequency band data. The difference was calculated, and if the energy difference was less than the threshold value, it was determined to be shared, but
The criterion for determining whether or not the high frequency part quantized data is shared between the windows may not be the energy difference. For example, if the position (frequency) on the frequency axis of the spectrum data where the absolute value of the spectrum value is maximum in each window is found and the deviation of the position between the windows is less than the predetermined threshold value, The area quantized data may be shared. In addition, if the number and / or the position of the peaks of the spectrum are similar to the immediately preceding window that does not share the high frequency band data, it may be determined to be shared. Alternatively, these may be compared for each scale factor band, and scores may be evaluated according to the degree of similarity to make a comprehensive determination for one window. Also simply
With the previous window that does not share high band data,
If the positions of the spectrum data having the maximum absolute values are similar in the window, it may be determined to be shared. Further, the spectrum of each window may be multiplied by a predetermined function and compared, and whether or not to share may be determined based on the comparison result. In addition, when only the high frequency band data is shared, the high frequency band spectrum data may be shared between predetermined windows without comparing the similarity of spectra. For example, second, fourth,
It may be determined that the even-numbered window shares the high frequency band data with the odd-numbered window as in the sixth and eighth windows, and vice versa. In addition, a window in which the high frequency band data is not replaced with “0” may be defined in advance in any other combination. For example, the high frequency band data of one specific window may be shared by the other seven windows.

【0073】さらにまた、各ウィンドウの高域部、ある
いはウィンドウの全域において、スペクトルのピークが
複数ある場合には、各ピークの周波数がそれぞれしきい
値の範囲内で近似するウィンドウ間で高域部量子化デー
タを共有するとしてもよい。また、各ピークのウィンド
ウ間の周波数差の合計がしきい値の範囲内となるウィン
ドウ間で高域部量子化データを共有するとしてもよい。
Furthermore, when there are a plurality of spectrum peaks in the high band part of each window, or in the entire window, the high band part between the windows where the frequency of each peak approximates within the range of the threshold value. The quantized data may be shared. Further, the high frequency part quantized data may be shared between windows in which the total frequency difference between windows of each peak falls within the threshold range.

【0074】上記のように生成された符号化装置100
からの符号化ビットストリームを入力した復号化装置2
00では、第1の復号化部221において第1の符号化
信号を従来の手順に従い復号化すると、1024サンプ
ルのスペクトルデータが得られる。このとき、図7の例
では、第2及び第4から第8ウィンドウに関して高域部
スペクトルデータのスペクトル値はすべて「0」となっ
ている。これに対し、第2の逆量子化部224は、少な
くとも第1の逆量子化部222より出力される1ウィン
ドウ分の高域部スペクトルデータを保持しておくための
メモリを有し、フラグが「0」であるウィンドウにつ
き、第1の逆量子化部222の出力である高域部のスペ
クトルデータをメモリに保持しておき、保持しているス
ペクトルデータをそれ以降、フラグが「1」となってい
る各ウィンドウに対し、フラグが「0」のウィンドウが
現れるまで繰り返しコピーして出力する。なお、上記メ
モリは、MPEG−2 AACに準拠した従来の復号化
装置400において、1フレーム分のスペクトルデータ
を保持するために標準的に備えられているものを使用す
ればよく、新たにメモリを備える必要はない。また、本
発明において新たにメモリを備えるとしたら、スペクト
ルデータのコピー元となるウィンドウの先頭及び高域部
先頭を示すポインタを格納するための記憶領域を増設す
る場合が考えられる。この場合でも、目的とするスペク
トルデータの周波数などに基づいて上記メモリ内を検索
するように処理手順を設定しておけば、あえてこのよう
な記憶領域を増設する必要はなく、例えば、目的とする
スペクトルデータを検索する間の処理時間を削減したい
場合などには、必要に応じてメモリを備えればよい。こ
のメモリについては、以下のスペクトルデータのコピー
処理においても同様である。以下に、図8のフローチャ
ートを用いてこれにおける第2の逆量子化部224の具
体的な動作を説明する。
Encoding device 100 generated as described above
Decoding device 2 to which the encoded bit stream from
In 00, when the first decoding unit 221 decodes the first coded signal according to the conventional procedure, spectrum data of 1024 samples is obtained. At this time, in the example of FIG. 7, all the spectrum values of the high frequency band spectrum data are “0” for the second and fourth to eighth windows. On the other hand, the second dequantization unit 224 has a memory for holding at least one window of high frequency band spectrum data output from the first dequantization unit 222, and the flag is For the window of "0", the spectrum data of the high frequency band, which is the output of the first dequantization unit 222, is held in the memory, and the held spectrum data is set to "1" thereafter. For each window that has been turned on, it is repeatedly copied and output until a window whose flag is "0" appears. The memory may be the one that is standardly provided for holding the spectrum data for one frame in the conventional decoding device 400 compliant with MPEG-2 AAC. There is no need to prepare. Further, if a memory is newly provided in the present invention, it is conceivable to add a storage area for storing pointers indicating the beginning of the window and the beginning of the high-frequency part that are the copy source of the spectrum data. Even in this case, if the processing procedure is set so as to search the memory based on the frequency of the target spectrum data, it is not necessary to add such a storage area. If it is desired to reduce the processing time during the search for the spectrum data, a memory may be provided as necessary. This memory is the same in the following spectral data copy processing. Hereinafter, the specific operation of the second dequantization unit 224 in this will be described using the flowchart of FIG.

【0075】図8は、図1に示した第2の逆量子化部2
24の高域部スペクトルデータのコピー処理における動
作を示すフローチャートである。ここで、第2の逆量子
化部224は、少なくとも、ここでは64サンプルの高
域部スペクトルデータを記憶するためのメモリを備えて
いるものとし、1フレーム内のすべてのウィンドウにつ
いて(S71)、フラグが「0」の場合(S72)、メ
モリに第1の逆量子化部222の出力である高域部スペ
クトルデータを保持し(S73)、フラグが「0」でな
い場合(S72)、メモリ内の高域部スペクトルデータ
を逆量子化データ合成部225に出力する(S74)と
いう処理を繰り返す(S75)。
FIG. 8 is a block diagram of the second inverse quantizer 2 shown in FIG.
It is a flowchart which shows the operation | movement in the copy process of 24 high frequency part spectrum data. Here, the second dequantization unit 224 is assumed to include at least a memory for storing the high frequency band spectrum data of 64 samples here, and for all windows in one frame (S71), If the flag is "0" (S72), the high frequency band spectrum data output from the first dequantization unit 222 is held in the memory (S73). If the flag is not "0" (S72), the memory The process of outputting the high frequency band spectrum data to the dequantized data synthesis unit 225 (S74) is repeated (S75).

【0076】すなわち、第2の逆量子化部224は、第
2の復号化部223によって復号された共有情報のうち
の注目ウィンドウに対応する1ビットを調べ、そのビッ
トのフラグが「0」か否かを調べる(S72)。調べた
結果、フラグが「0」であれば、第1の逆量子化部22
2によって逆量子化された注目ウィンドウの高域部スペ
クトルデータは、「0」に置換されていないスペクトル
である。第2の逆量子化部224は、この高域部スペク
トルデータをメモリ内に保持し(S73)、メモリ内に
すでにデータがあれば、そのデータを更新する。調べた
結果(S72)、フラグが「1」であれば、注目ウィン
ドウに対して第1の逆量子化部222から出力される高
域部スペクトルデータは、すべて値が「0」となってい
る。第2の逆量子化部224は、注目ウィンドウに対し
てメモリ内のスペクトルデータを読み出し、読み出した
スペクトルデータを逆量子化データ合成部225に出力
する(S74)。この結果、注目ウィンドウの高域部ス
ペクトルデータは、逆量子化データ合成部225におい
て、第2の逆量子化部224によってメモリから読み出
されたスペクトル値に置換される。
That is, the second dequantization unit 224 checks one bit corresponding to the window of interest in the shared information decoded by the second decoding unit 223, and determines whether the flag of that bit is "0". It is checked whether or not (S72). As a result of the check, if the flag is “0”, the first dequantization unit 22
The high frequency band spectrum data of the window of interest dequantized by 2 is a spectrum that is not replaced with “0”. The second dequantization unit 224 holds this high frequency band spectrum data in the memory (S73) and updates the data if the data already exists in the memory. As a result of the examination (S72), if the flag is "1", all the high frequency band spectrum data output from the first dequantization unit 222 for the window of interest have a value of "0". . The second dequantization unit 224 reads the spectrum data in the memory for the window of interest and outputs the read spectrum data to the dequantized data synthesis unit 225 (S74). As a result, the high frequency band spectrum data of the window of interest is replaced with the spectrum value read from the memory by the second dequantization unit 224 in the dequantized data synthesis unit 225.

【0077】例えば、まず、第1ウィンドウに注目する
と、共有情報の第1ビットのフラグが「0」であったと
する。この場合、第2の逆量子化部224は、第1の逆
量子化部222で得られた第1ウィンドウの高域部スペ
クトルデータをメモリに書き込み、メモリ内のデータを
更新する(S73)。第2の逆量子化部224は、第1
ウィンドウに対してスペクトルデータを逆量子化データ
合成部225に出力しないので、第1の逆量子化部22
2によって出力されたスペクトルデータが、そのまま第
1ウィンドウのスペクトルデータとして逆量子化データ
合成部225を介して逆変換部230に出力される。
For example, first, focusing on the first window, it is assumed that the flag of the first bit of the shared information is "0". In this case, the second dequantization unit 224 writes the high frequency band spectrum data of the first window obtained by the first dequantization unit 222 in the memory and updates the data in the memory (S73). The second inverse quantizer 224 has a first
Since the spectrum data for the window is not output to the dequantized data synthesis unit 225, the first dequantized unit 22
The spectrum data output by 2 is output as it is to the inverse transform unit 230 via the inverse quantized data synthesis unit 225 as the spectrum data of the first window.

【0078】次に、第2ウィンドウに注目すると、共有
情報の第2ビットのフラグが「1」であったとする。こ
の場合、第2の逆量子化部224は、メモリ内から第1
ウィンドウの高域部スペクトルデータを読み出し、読み
出したスペクトルデータを第2ウィンドウの高域部スペ
クトルデータとして逆量子化データ合成部225に出力
する(S74)。第1の逆量子化部222からは、第2
ウィンドウのスペクトルデータが逆量子化データ合成部
225に出力されており、第2ウィンドウの高域部スペ
クトルデータの値はすべて「0」となっている。この高
域部スペクトルデータは、逆量子化データ合成部225
において、第2の逆量子化部224によってメモリから
読み出された第1ウィンドウのスペクトル値に置換され
る。
Next, focusing on the second window, it is assumed that the flag of the second bit of the shared information is "1". In this case, the second dequantization unit 224 selects the first dequantization unit from the memory.
The high frequency band spectrum data of the window is read and the read spectrum data is output to the inverse quantized data synthesizing section 225 as the high frequency band spectrum data of the second window (S74). From the first inverse quantizer 222, the second
The spectrum data of the window is output to the dequantized data synthesis unit 225, and the values of the high-frequency spectrum data of the second window are all “0”. This high-frequency part spectrum data is stored in the dequantized data synthesis unit 225.
In, the second dequantization unit 224 replaces the spectrum value of the first window read from the memory.

【0079】このようにして、復号化装置200では、
符号化装置100からの共有情報に基づいて、フラグが
「1」のウィンドウに対してフラグが「0」のウィンド
ウの高域部スペクトルデータがコピーされることにな
る。
In this way, in the decoding device 200,
Based on the shared information from the encoding device 100, the high frequency band spectrum data of the window whose flag is “0” is copied to the window whose flag is “1”.

【0080】なお、上記説明では、高域部データを共有
するウィンドウは直前のウィンドウの「0」に置換され
なかった高域部スペクトルデータをそのままコピーする
だけであったが、必要に応じてコピーしたスペクトルデ
ータの振幅を調整してもよい。振幅の調整は、各スペク
トルにあらかじめ決められた係数、その値を例えば
「0.5」として乗じることにより達成する。この係数
は固定値でもよいし、帯域ごとに変更してもよいし、第
1の逆量子化部222から出力されるスペクトルデータ
に応じて変更してもよい。
In the above description, the window sharing the high frequency band data is simply the high frequency band spectrum data that has not been replaced with "0" in the immediately preceding window, but is copied as necessary. The amplitude of the spectrum data may be adjusted. The adjustment of the amplitude is achieved by multiplying each spectrum by a predetermined coefficient and its value, for example, as “0.5”. This coefficient may be a fixed value, may be changed for each band, or may be changed according to the spectrum data output from the first inverse quantization unit 222.

【0081】また、ここでは振幅の調整に復号化装置2
00においてあらかじめ定めた係数を用いるとしたが、
符号化装置100においてこの係数を計算しておき、共
有情報である第2の符号化信号に付加してもよい。また
は係数としてスケールファクター値を第2の符号化信号
に付加してもよいし、係数として量子化値を第2の符号
化信号に付加してもよい。また、振幅調整方法は上記の
方法に限らず、それ以外の方法であってもよい。
Further, here, the decoding device 2 is used for adjusting the amplitude.
Although a predetermined coefficient is used in 00,
This coefficient may be calculated in the encoding apparatus 100 and added to the second encoded signal which is shared information. Alternatively, a scale factor value as a coefficient may be added to the second encoded signal, or a quantized value as a coefficient may be added to the second encoded signal. Further, the amplitude adjusting method is not limited to the above method and may be another method.

【0082】なお上記実施の形態においては、共有され
る高域部データとして、フラグが「0」のウィンドウの
高域部スペクトルデータを従来の方法で量子化及び符号
化して伝送したが、これに限ったものでなくてよい。例
えば、共有される高域部データとして、フラグが「0」
のウィンドウの高域部スペクトルデータを従来のように
は伝送せず、すなわち、どのウィンドウについても高域
部スペクトルデータをすべて「0」に置換してしまう。
その代わり、フラグが「0」のウィンドウの高域部の音
響信号をその音響信号の代表値などにより簡略的に表し
た補助情報を生成して、前記共有情報とこの補助情報と
を第2の符号化信号として符号化してもよい。補助情報
は、例えば、(1)高域部の各スケールファクターバン
ド内で絶対最大スペクトルデータ(絶対値が最大となる
スペクトルデータ)の量子化値を「1」にするような、
スケールファクターバンドごとのスケールファクター、
(2)高域部の全スケールファクターバンドに共通なス
ケールファクターを定め、そのスケールファクターを用
いて、スケールファクターバンドごとに絶対最大スペク
トルデータを量子化した場合の量子化値、(3)各スケ
ールファクターバンドにおける絶対最大スペクトルデー
タの位置又は高域部全体における絶対最大スペクトルデ
ータの位置、(4)高域部においてあらかじめ定めた位
置のスペクトルの正負を示す符号及び(5)高域部のス
ペクトルに相似した低域部のスペクトルをコピーして高
域部のスペクトルを表す場合のコピー方法などで表され
る。またこれらを2つ以上組み合わせてもよい。その
際、復号化装置200側では、この補助情報に基づい
て、前記高域部スペクトルデータを復元する。
In the above embodiment, the high frequency spectrum data of the window having the flag of "0" is quantized and encoded by the conventional method and transmitted as the high frequency data to be shared. It doesn't have to be limited. For example, the flag is “0” as the high-frequency part data to be shared.
The high frequency band spectrum data of the window is not transmitted as in the conventional case, that is, the high frequency band spectrum data of all windows is replaced with "0".
Instead, auxiliary information is generated by simply expressing the acoustic signal in the high-frequency part of the window whose flag is "0" by the representative value of the acoustic signal, and the shared information and this auxiliary information are generated as second information. It may be encoded as an encoded signal. The auxiliary information is, for example, (1) such that the quantized value of the absolute maximum spectrum data (spectrum data having the maximum absolute value) within each scale factor band in the high frequency band is "1",
Scale factor Scale factor for each band,
(2) A scale factor common to all scale factor bands in the high frequency band is determined, and the scale factor is used to quantize the absolute maximum spectrum data for each scale factor band. (3) Each scale The position of the absolute maximum spectrum data in the factor band or the position of the absolute maximum spectrum data in the entire high band, (4) the sign indicating the sign of the spectrum at a predetermined position in the high band, and (5) the spectrum of the high band. This is represented by a copy method or the like when a similar low-frequency spectrum is copied to represent a high-frequency spectrum. Also, two or more of these may be combined. At this time, the decoding device 200 side restores the high frequency band spectrum data based on this auxiliary information.

【0083】以下では、上記(1)のスケールファクタ
ーを補助情報とした場合について説明する。図9は、図
1に示した共有判定部137によってSHORTブロッ
クの1ウィンドウにつき生成される補助情報(スケール
ファクター)の具体例を示すスペクトル波形図である。
なお、図9において、低域部の周波数軸上に示す区切り
及び高域部において周波数方向に破線で示す区切りは、
スケールファクターバンドの区切りを示しているが、説
明のため簡略的に示したものであって、その位置は実際
とは異なる。
The case where the scale factor (1) is used as auxiliary information will be described below. FIG. 9 is a spectrum waveform diagram showing a specific example of the auxiliary information (scale factor) generated for one window of the SHORT block by the sharing determination unit 137 shown in FIG.
In addition, in FIG. 9, the divisions shown on the frequency axis in the low frequency range and the divisions in the high frequency range indicated by broken lines in the frequency direction are
Although the division of the scale factor band is shown, it is simply shown for the sake of explanation, and its position is different from the actual position.

【0084】変換部120から出力されるスペクトルデ
ータのうち、図9に実線の波形で示す再生帯域11.0
25kHz以下の低域部は、第1の量子化部131に出
力され、従来どおり量子化される。一方、図9に破線の
波形で示す再生帯域11.025kHzを超える再生帯
域22.05kHzまでの高域部は、共有判定部137
によって計算される補助情報(スケールファクター)に
よって表される。以下、図9の具体例を用い、図10の
フローチャートに従って共有判定部137の補助情報
(スケールファクター)の計算手順を説明する。
Of the spectrum data output from the conversion unit 120, the reproduction band 11.0 shown by the solid line waveform in FIG.
The low frequency band of 25 kHz or less is output to the first quantization unit 131 and quantized as usual. On the other hand, the high-frequency part up to the reproduction band 22.05 kHz exceeding the reproduction band 11.0525 kHz shown by the broken line waveform in FIG.
It is represented by the auxiliary information (scale factor) calculated by The calculation procedure of the auxiliary information (scale factor) of the sharing determination unit 137 will be described below with reference to the flowchart of FIG. 10 using the specific example of FIG.

【0085】図10は、図1に示した共有判定部137
の補助情報(スケールファクター)計算処理における動
作を示すフローチャートである。共有判定部137は、
再生帯域11.025kHzを超える再生帯域22.0
5kHzまでの高域部のすべてのスケールファクターバ
ンドにつき、各スケールファクターバンドにおける絶対
最大スペクトルデータの量子化値を「1」にする最適な
スケールファクターを、以下の手順に従って計算する
(S11)。
FIG. 10 shows the sharing determination unit 137 shown in FIG.
5 is a flowchart showing an operation in auxiliary information (scale factor) calculation processing of FIG. The sharing determination unit 137
Playback band 12.0 Playback band 22.0 over 25 kHz
For all scale factor bands in the high frequency band up to 5 kHz, the optimum scale factor for setting the quantized value of the absolute maximum spectrum data in each scale factor band to "1" is calculated according to the following procedure (S11).

【0086】共有判定部137は、再生帯域11.02
5kHzを超える高域部の最初のスケールファクターバ
ンドにおける絶対最大スペクトルデータ(ピーク)を特
定する(S12)。図9の具体例において、最初のスケ
ールファクターバンド内で特定されたピークの位置が
で、そのときのピークの値が「256」であったとす
る。
The sharing determination unit 137 determines the reproduction band 11.02.
The absolute maximum spectrum data (peak) in the first scale factor band in the high frequency band exceeding 5 kHz is specified (S12). In the specific example of FIG. 9, it is assumed that the position of the peak specified in the first scale factor band is and the peak value at that time is “256”.

【0087】共有判定部137は、図7のフローチャー
トに示した手順と同様にして、量子化値を計算する公式
にピークの値「256」と初期値のスケールファクター
値とをあてはめ、公式から得られる量子化値が「1」と
なるスケールファクターsfの値を計算する(S1
3)。例えば、この場合、ピーク値「256」の量子化
値を「1」にするスケールファクターsfの値、例えば
sf=24が算出される。
The sharing determination unit 137 applies the peak value “256” and the scale factor value of the initial value to the formula for calculating the quantized value in the same manner as the procedure shown in the flowchart of FIG. 7, and obtains from the formula. The value of the scale factor sf at which the quantized value to be obtained is "1" is calculated (S1
3). For example, in this case, the value of the scale factor sf that makes the quantized value of the peak value “256” “1”, for example, sf = 24 is calculated.

【0088】最初のスケールファクターバンドについ
て、ピークの量子化値を「1」にするスケールファクタ
ーの値sf=24が求められると(S14)、共有判定
部137は、次のスケールファクターバンドについて、
スペクトルデータのピークを特定し(S12)、例え
ば、特定されたピークの位置がで、その値が「31
2」であった場合、ピーク値「312」の量子化値が
「1」となるスケールファクターsfの値、例えばsf
=32を計算する(S13)。
When the scale factor value sf = 24 that sets the peak quantization value to "1" is obtained for the first scale factor band (S14), the sharing determination unit 137 determines that the next scale factor band is
The peak of the spectrum data is specified (S12), and for example, the position of the specified peak is and its value is "31.
2 ”, the value of the scale factor sf at which the quantized value of the peak value“ 312 ”becomes“ 1 ”, for example, sf
= 32 is calculated (S13).

【0089】同様にして、共有判定部137は、高域部
における3番目のスケールファクターバンドについて、
ピークの値「288」の量子化値を「1」にするスケ
ールファクターsfの値、例えばsf=26を計算し、
4番目のスケールファクターバンドについて、ピーク
の値「203」の量子化値を「1」にするスケールファ
クターsfの値、例えばsf=18を計算する。
Similarly, the sharing determination unit 137 determines, for the third scale factor band in the high frequency region,
The value of the scale factor sf that makes the quantized value of the peak value “288” “1”, for example, sf = 26, is calculated,
For the fourth scale factor band, the value of the scale factor sf that makes the quantized value of the peak value “203” “1”, for example, sf = 18 is calculated.

【0090】このようにして、高域部のすべてのスケー
ルファクターバンドについて、ピーク値の量子化値を
「1」にするスケールファクターが計算されると(S1
4)、共有判定部137は、計算によって得られた各ス
ケールファクターバンドのスケールファクターを、高域
部の補助情報として第2の符号化部134に出力し、処
理を終了する。
In this way, for all scale factor bands in the high frequency region, when the scale factors that make the quantized value of the peak value "1" are calculated (S1
4), the sharing determination unit 137 outputs the scale factor of each scale factor band obtained by the calculation to the second encoding unit 134 as auxiliary information of the high frequency band, and ends the process.

【0091】以上のようにして共有判定部137によっ
て補助情報(スケールファクター)が生成されるが、こ
の補助情報(スケールファクター)によれば、高域部
を、各スケールファクターバンドに1つのスケールファ
クターだけで表すことができるという効果がある。さら
に、各スケールファクターの値を0〜255までの値で
表せば、高域部における各スケールファクターバンド
(ここでは4つ)につき、それぞれ8ビットで表すこと
ができる。また、この各スケールファクターの差分をハ
フマン符号化するようにすれば、データ量をさらに低減
できる可能性がある。従って、この補助情報は、高域部
の各スケールファクターバンドにつき1つのスケールフ
ァクターを示しているに過ぎないが、従来の方法に従っ
て高域部を量子化する場合に比べて、高域部スペクトル
データの数だけある量子化値を符号化しない分だけデー
タ量が大きく低減されていることがわかる。
As described above, the auxiliary information (scale factor) is generated by the sharing determination unit 137. According to this auxiliary information (scale factor), the high frequency part is provided with one scale factor for each scale factor band. There is an effect that it can be expressed only. Furthermore, if each scale factor value is represented by a value from 0 to 255, each scale factor band (here, four) in the high frequency region can be represented by 8 bits. Further, if the difference of each scale factor is Huffman-encoded, the data amount may be further reduced. Therefore, this auxiliary information indicates only one scale factor for each scale factor band in the high frequency band, but the high frequency spectrum data is higher than that in the case of quantizing the high frequency band according to the conventional method. It can be seen that the amount of data is greatly reduced by not encoding the quantized value of the number.

【0092】また、このスケールファクターは、各スケ
ールファクターバンドにおけるピーク値(絶対値)にほ
ぼ比例した値を示しており、高域部におけるサンプル数
だけ一定値をとるスペクトルデータを生成するか、ある
いは低域部のスペクトルデータをコピーするかして、そ
れにスケールファクターを乗算して得られるスペクトル
データは、入力音響信号に基づいて得られたスペクトル
データを大まかに復元しているといえる。また、これと
は別の方法として、スケールファクターバンド毎に、バ
ンド内に生成またはコピーされたスペクトルデータの絶
対最大値と、そのバンドに対応するスケールファクター
値を用いて量子化値「1」を逆量子化した値との比率を
係数として、バンド内の各スペクトルデータに乗じるこ
とにより、より精度良くスペクトルデータを復元するこ
とができる。(2)スケールファクターバンドごとの絶
対最大スペクトルデータの量子化値を補助情報とする場
合も上記と同様にして高域部スペクトルデータを復元す
ることができる。また、補助情報を(3)各スケールフ
ァクターバンドにおける絶対最大スペクトルデータの位
置又は高域部全体における絶対最大スペクトルデータの
位置又は(4)高域部においてあらかじめ定めた位置の
スペクトルの正負を示す符号とする場合には、復号化装
置200において、あらかじめ定めた波形のスペクトル
を生成するかあるいは低域部のスペクトルをコピーし、
(3)又は(4)の補助情報で表される条件にスペクト
ルの波形が一致するよう、スペクトルを調整する。
(5)高域部のスペクトルに相似した低域部のスペクト
ルをコピーして高域部のスペクトルを表す場合のコピー
方法を補助情報とする場合には、共有判定部137は、
ウィンドウ間のスペクトルの相似性を判定する場合と同
様にして、高域部の各スケールファクターバンド内のス
ペクトルと互いに相似するスペクトルをもつ低域部のス
ケールファクターバンドを特定し、特定したスケールフ
ァクターバンド番号を補助情報とする。また、低域部の
スペクトルをコピーする方向(低域部から高域部に向か
ってコピーする場合と、高域部から低域部に向かってコ
ピーする場合との2通りがある)及び低域部のスペクト
ルと高域部のスペクトルとの符号の関係(スペクトルの
正負の符号を反転してコピーするか、反転しないでコピ
ーするか)も併せて補助情報とする。復号化装置200
においては、高域部のスケールファクターバンドごと
に、この補助情報で示される低域部のスペクトルを高域
部にコピーして高域部スペクトルを復元する。さらに、
高域部の波形の相違は、低域部ほど聴覚的にはっきり識
別されるものではないので、このようにして得られた補
助情報は、高域部の波形を表す情報として十分であると
いえる。
Further, this scale factor shows a value almost proportional to the peak value (absolute value) in each scale factor band, and either generates spectral data having a constant value for the number of samples in the high frequency region, or It can be said that the spectrum data obtained by copying the spectrum data of the low frequency part and multiplying it by the scale factor roughly restores the spectrum data obtained based on the input acoustic signal. Alternatively, as another method, for each scale factor band, a quantized value “1” is obtained using the absolute maximum value of the spectrum data generated or copied in the band and the scale factor value corresponding to that band. The spectrum data can be more accurately restored by multiplying each spectrum data in the band by using the ratio of the inversely quantized value as a coefficient. (2) When the quantized value of the absolute maximum spectrum data for each scale factor band is used as the auxiliary information, the high frequency band spectrum data can be restored in the same manner as above. Further, the auxiliary information is a code indicating (3) the position of the absolute maximum spectrum data in each scale factor band or the position of the absolute maximum spectrum data in the entire high frequency region, or (4) the positive or negative of the spectrum at a predetermined position in the high frequency region. In this case, in the decoding device 200, a spectrum of a predetermined waveform is generated or a spectrum of the low frequency band is copied,
The spectrum is adjusted so that the waveform of the spectrum matches the condition represented by the auxiliary information of (3) or (4).
(5) When the copy method in the case of copying the spectrum of the low frequency band similar to the spectrum of the high frequency band to represent the spectrum of the high frequency band is used as the auxiliary information, the sharing determination unit 137,
Similar to the case of determining the similarity of spectra between windows, the scale factor band in the low frequency band that has a spectrum similar to the spectrum in each scale factor band in the high frequency region is specified, and the specified scale factor band is specified. The number is used as auxiliary information. In addition, there are two directions of copying the spectrum of the low-frequency part (the case of copying from the low-frequency part to the high-frequency part and the case of copying from the high-frequency part to the low-frequency part) and the low-frequency range. Also, the relationship between the sign of the spectrum of the part and the spectrum of the high-frequency part (whether the positive and negative signs of the spectrum are inverted and copied or not and copied) is also used as auxiliary information. Decoding device 200
In the above, in each of the scale factor bands in the high frequency band, the low frequency band spectrum indicated by the auxiliary information is copied to the high frequency band to restore the high frequency band spectrum. further,
Since the difference in the waveform in the high frequency band is not as clearly audibly discriminated as in the low frequency band, it can be said that the auxiliary information thus obtained is sufficient as information representing the waveform in the high frequency band. .

【0093】なお、ここでは、高域部の各スケールファ
クターバンド内のスペクトルデータの量子化値が「1」
となるようスケールファクターを計算したが、必ずしも
「1」である必要はなく、他の値に定めておいてもよ
い。またここでは、補助情報としてスケールファクター
のみを符号化したが、これに限ったものでなく、量子化
値、特徴的なスペクトルの位置情報、スペクトルの正負
の符号を表すサイン情報及びノイズ生成方法等を併せて
符号化してもよい。またこれらを2つ以上組み合わせて
符号化してもよい。この場合、補助情報内に、振幅の比
率を表す係数や絶対最大スペクトルデータの位置などを
前記スケールファクターと組み合わせて符号化すれば、
特に有効である。
Here, the quantized value of the spectrum data in each scale factor band in the high frequency band is "1".
Although the scale factor is calculated so that it does not have to be “1”, it may be set to another value. Further, here, only the scale factor is encoded as the auxiliary information, but the present invention is not limited to this, and the quantization value, the characteristic spectrum position information, the sine information representing the positive and negative signs of the spectrum, the noise generation method, etc. May be encoded together. Also, two or more of these may be combined and coded. In this case, in the auxiliary information, if the coefficient indicating the ratio of the amplitude and the position of the absolute maximum spectrum data are encoded in combination with the scale factor,
Especially effective.

【0094】なお、上記実施の形態では、共有判定部1
37が共有情報を生成する場合について説明したが、本
発明の符号化装置100においては、必ずしも共有情報
を生成しなくてもよい。この場合、第2の符号化部13
4は不要である。これに対し、復号化装置200側で、
高域部スペクトルデータを共有しているウィンドウを判
定する必要がある。この場合、第2の逆量子化部224
は、少なくとも1つのウィンドウの高域部スペクトルデ
ータを保持しておくためのメモリを有し、例えば、第1
の逆量子化部222が逆量子化によって各ウィンドウの
スペクトルデータを復元した時点で、「0」以外の値の
スペクトルデータを含む64サンプル分の高域部スペク
トルデータをメモリに保持するとともに、高域部のスペ
クトル値がすべて「0」になっているウィンドウを検出
し、検出されたウィンドウに対応付けてメモリ内の高域
部スペクトルデータを出力する。例えば、第2の逆量子
化部224は、検出したウィンドウの番号を指定して、
メモリ内の高域部スペクトルデータを逆量子化データ合
成部225に出力する。これによって、指定されたウィ
ンドウの高域部スペクトルデータが、逆量子化データ合
成部225において、メモリからコピーしたスペクトル
値に置換される。
In the above embodiment, the sharing determination unit 1
The case where the 37 generates shared information has been described, but the encoding device 100 of the present invention does not necessarily have to generate shared information. In this case, the second encoding unit 13
4 is unnecessary. On the other hand, on the decoding device 200 side,
It is necessary to determine the windows that share the high band spectral data. In this case, the second dequantization unit 224
Has a memory for holding the high band spectral data of at least one window, for example the first
When the inverse quantization unit 222 of FIG. 3 restores the spectrum data of each window by inverse quantization, the high frequency spectrum data of 64 samples including the spectrum data of values other than “0” is held in the memory, and A window in which all spectrum values in the high frequency band are "0" is detected, and high frequency band spectrum data in the memory is output in association with the detected window. For example, the second dequantization unit 224 specifies the detected window number,
The high frequency band spectrum data in the memory is output to the dequantized data synthesis unit 225. As a result, the high frequency band spectral data of the specified window is replaced with the spectral value copied from the memory in the inverse quantized data synthesizing unit 225.

【0095】これにおいて符号化装置100は、必ずし
も第1ウィンドウの高域部スペクトルデータを伝送しな
くてよい。この場合には、符号化装置100側では高域
部データを伝送するウィンドウを少なくとも1フレーム
の前半に設けるようにする。第2の逆量子化部224は
第1の逆量子化部222の逆量子化結果を常時監視し、
第1の逆量子化部222の逆量子化結果において、第1
ウィンドウの高域部のスペクトル値がすべて「0」であ
った場合、第2の逆量子化部224は、それ以降のウィ
ンドウについて、高域部に「0」以外の値のスペクトル
データを含むウィンドウをサーチする。サーチの結果、
高域部に「0」以外の値のスペクトルデータを含むウィ
ンドウが得られると、第2の逆量子化部224は、その
ウィンドウの高域部スペクトルデータを逆量子化データ
合成部225に出力する。それと同時に、その高域部ス
ペクトルデータをメモリにコピーして、以降に検出され
るウィンドウに対応付けてその値で置換するよう逆量子
化データ合成部225に出力する。
In this case, coding apparatus 100 does not necessarily have to transmit the high band spectrum data of the first window. In this case, on the encoding device 100 side, a window for transmitting high frequency band data is provided in at least the first half of one frame. The second dequantization unit 224 constantly monitors the dequantization result of the first dequantization unit 222,
In the dequantization result of the first dequantization unit 222,
When all the spectrum values in the high frequency band of the window are “0”, the second dequantization unit 224 determines that the window including the subsequent windows includes spectrum data having a value other than “0” in the high frequency band. Search for. As a result of the search,
When a window including spectrum data having a value other than “0” in the high frequency band is obtained, the second dequantization unit 224 outputs the high frequency band spectrum data of the window to the dequantized data synthesis unit 225. . At the same time, the high-frequency part spectrum data is copied to the memory, and is output to the inverse quantized data synthesizing unit 225 so as to be associated with the window detected thereafter and replaced with the value.

【0096】以上のように本実施の形態によれば、従来
では、低転送レートの伝送路を用いる場合、カットされ
ることが多い高域部スペクトルデータを、SHORTブ
ロックの1フレーム8ウィンドウにつき、少なくとも1
ウィンドウ分を伝送するので、復号化装置において、従
来よりも、高域の豊かな音質で音響信号を再生すること
ができるという効果がある。また、本実施の形態の符号
化装置100では、相似したスペクトルをもつウィンド
ウ間において、高域部スペクトルデータを共有するの
で、高域部スペクトルデータを伝送されなかったウィン
ドウにおいても、原音の音質に相似した音響信号を再生
することができるという効果がある。
As described above, according to the present embodiment, in the conventional case, when a low transfer rate transmission line is used, the high frequency band spectrum data, which is often cut, is distributed for each frame and 8 windows of the SHORT block. At least 1
Since the window portion is transmitted, there is an effect that the decoding apparatus can reproduce an acoustic signal with rich sound quality in a high frequency range as compared with the related art. Further, in the encoding device 100 of the present embodiment, the high frequency band spectrum data is shared between the windows having similar spectra, so that the sound quality of the original sound is improved even in the window in which the high frequency band spectrum data was not transmitted. There is an effect that a similar acoustic signal can be reproduced.

【0097】なお、本実施の形態は、サンプリング周波
数を44.1kHzとして説明したが、サンプリング周
波数は必ずしもこの値に限定されず、他の値であっても
よい。また、ここでは高域部を周波数11.025kH
z以上の周波数領域としたが、低域部と高域部との区切
りは必ずしも周波数11.025kHzでなくてもよ
く、もっと低域で区切ってもよいし、高域で区切っても
よい。
In the present embodiment, the sampling frequency is described as 44.1 kHz, but the sampling frequency is not necessarily limited to this value and may be another value. Also, here, the high frequency part has a frequency of 11.025 kHz.
Although the frequency range is equal to or higher than z, the low-frequency part and the high-frequency part are not necessarily separated at the frequency of 11.025 kHz, and may be divided into a lower range or a higher range.

【0098】なお、上記実施の形態においては、第2の
符号化部134による符号化結果(符号化された共有情
報など)に識別情報を付し、これを第2の符号化信号と
してビットストリーム中に格納する場合について説明し
たが、Fill ElementやDSEなどに他の方
式に基づく符号化情報が格納される可能性がない場合
や、本発明の復号化装置200でのみ復号化が可能なビ
ットストリームに第2の符号化信号を格納する場合など
には、必ずしも識別情報を付す必要はない。この場合、
復号化装置200は、ビットストリーム中の符号化装置
100との間であらかじめ定めた格納位置(例えば、F
ill Element)から無条件に第2の符号化信
号を抽出し、共有情報を復号化する。
In the above embodiment, the identification result is attached to the encoding result (encoded shared information etc.) by the second encoding unit 134, and this is used as the second encoded signal in the bit stream. Although the case of storing it in the inside has been described, there is no possibility that encoded information based on another system will be stored in Fill Element, DSE, or the like, or bits that can be decoded only by the decoding device 200 of the present invention. When storing the second coded signal in the stream, it is not necessary to add the identification information. in this case,
The decoding device 200 has a predetermined storage position (for example, F
ill Element), the second encoded signal is unconditionally extracted and the shared information is decoded.

【0099】なお本実施の形態については、ブロックサ
イズがSHORTブロックの時のみ有効であるので、ブ
ロックサイズがLONGブロックである時には、内部の
機能を従来の符号化装置300及び復号化装置400と
同様に切り換えるようにしてもよい。すなわち、この場
合、符号化装置100においては、音響信号入力部11
0の切り出しの周期を1024サンプルとし、その前後
512サンプルを重複して切り出すよう機能を切り換
え、変換部120のMDCT変換の単位を2048サン
プルに切り換えるとともに、その変換結果のうちの片側
1024サンプルを、所定の49スケールファクターバ
ンドに分類するよう切り換える。共有判定部137は、
入力した変換部120からのスペクトルデータをそのま
ま第1の量子化部131に出力し、第2の符号化部13
4は機能を停止する。復号化装置200においては、ス
トリーム入力部210は符号化音響ストリームから第2
の符号化信号を抽出せず、第2の復号化部223と第2
の逆量子化部224とは機能を停止し、逆量子化データ
合成部225は、入力した第1の逆量子化部222から
のスペクトルデータを、逆変換部230にそのまま出力
する。このように符号化装置100及び復号化装置20
0を切り換え可能にすることによって、スローテンポの
音楽などについては音質を重視したLONGブロックに
よる音響データを伝送し、復号化することができるとと
もに、アタックが頻出するようなアップテンポの音楽に
ついては、追従性のよいSHORTブロックによる音響
データを伝送し、復号化することができるという効果が
ある。
Since this embodiment is effective only when the block size is the SHORT block, when the block size is the LONG block, the internal functions are the same as those of the conventional encoding device 300 and decoding device 400. You may switch to. That is, in this case, in the encoding device 100, the acoustic signal input unit 11
The cutout cycle of 0 is set to 1024 samples, the function is switched to cut out 512 samples before and after the cutout, the unit of MDCT conversion of the conversion unit 120 is switched to 2048 samples, and 1024 samples on one side of the conversion result are Switch to classify into the predetermined 49 scale factor bands. The sharing determination unit 137
The input spectrum data from the conversion unit 120 is output to the first quantization unit 131 as it is, and the second encoding unit 13 outputs the spectrum data.
4 stops functioning. In the decoding device 200, the stream input unit 210 converts the second encoded audio stream into the second audio stream.
Of the second decoding unit 223 and the second decoding unit 223 without extracting the encoded signal of
The inverse quantization unit 224 stops its function, and the inverse quantized data synthesis unit 225 outputs the inputted spectrum data from the first inverse quantization unit 222 to the inverse conversion unit 230 as it is. Thus, the encoding device 100 and the decoding device 20
By making 0 switchable, it is possible to transmit and decode sound data by a LONG block that emphasizes sound quality for slow tempo music and the like, and for up tempo music that frequently attacks, There is an effect that acoustic data by the SHORT block having good followability can be transmitted and decoded.

【0100】(実施の形態2)以下では、図11及び図
12を用いて本実施の形態における符号化装置101及
び復号化装置201について、実施の形態1と異なる点
についてのみ説明する。図11は、符号化装置101及
び復号化装置201の構成を示すブロック図である。 <符号化装置101>符号化装置101は、SHORT
ブロックで符号化する場合に、2つ以上のウィンドウに
おいてスペクトルデータが類似または相似ならば、その
ウィンドウ間で、ウィンドウ内の全量子化データを共有
することにより、伝送される符号化音響ストリームのデ
ータ量を削減する。符号化装置101は、音響信号入力
部110、変換部120、第1の量子化部131、第1
の符号化部132、第2の符号化部134、共有判定部
138及びストリーム出力部140から構成される。
(Embodiment 2) In the following, with reference to FIG. 11 and FIG. 12, only the points of difference between Embodiment 1 and encoding apparatus 101 and decoding apparatus 201 of the present embodiment will be explained. FIG. 11 is a block diagram showing the configurations of the encoding device 101 and the decoding device 201. <Encoding Device 101> The encoding device 101 is a SHORT.
If the spectral data is similar or similar in two or more windows when encoding with a block, the data of the encoded audio stream to be transmitted by sharing all the quantized data in the windows between the windows. Reduce the amount. The encoding device 101 includes an acoustic signal input unit 110, a conversion unit 120, a first quantization unit 131, and a first quantization unit 131.
The encoding unit 132, the second encoding unit 134, the sharing determination unit 138, and the stream output unit 140.

【0101】共有判定部138は、ウィンドウ内の高域
部スペクトルデータを共有するだけでなく、低域部スペ
クトルデータを含むウィンドウ内の全帯域のスペクトル
データを共有する点で、実施の形態1の共有判定部13
7と異なる。すなわち、高周波領域の音響信号と比較し
た場合、原音に対して聴覚的に、より厳密な忠実性が要
求される低周波領域の音響信号についても、そのデータ
量を削減する。共有判定部138は、変換手段120の
出力するスペクトルデータの8つのウィンドウに関し
て、他のウィンドウと量子化データを共有するウィンド
ウを判定し、前述の共有情報を生成するとともに、その
ウィンドウ内のスペクトル値をすべて「0」に置換す
る。
The sharing determination unit 138 of Embodiment 1 is that the sharing determination unit 138 not only shares the high frequency band spectrum data in the window but also the spectrum data of the entire band in the window including the low frequency band spectrum data. Sharing determination unit 13
Different from 7. That is, when compared with the acoustic signal in the high frequency region, the data amount of the acoustic signal in the low frequency region, which requires auditory strict fidelity to the original sound, is reduced. The sharing determination unit 138 determines a window that shares the quantized data with other windows among the eight windows of the spectrum data output by the conversion unit 120, generates the shared information described above, and also the spectrum value in the window. Are all replaced with "0".

【0102】例えば、共有判定部138が、第1ウィン
ドウと第2ウィンドウとでスペクトルデータを共有し、
かつ、第3ウィンドウ以降のウィンドウでもスペクトル
データを共有すると判定した場合、第2ウィンドウ及び
第4から第8ウィンドウのスペクトル値をすべて「0」
にし、共有情報「01011111」を生成する。この
結果、第1の量子化部131において共有判定部138
から出力されたスペクトルデータを量子化する場合に、
第2ウィンドウ及び第4から第8ウィンドウのスペクト
ル値がすべて「0」であるため、従来と比べてさらに少
ないデータ量で量子化することができる。
For example, the sharing determination unit 138 shares the spectrum data between the first window and the second window,
In addition, when it is determined that the spectrum data is shared in the windows after the third window, all the spectrum values of the second window and the fourth to eighth windows are “0”.
And the shared information “01011111” is generated. As a result, the sharing determination unit 138 in the first quantization unit 131.
When quantizing the spectrum data output from
Since the spectral values of the second window and the fourth to eighth windows are all “0”, it is possible to quantize with a smaller amount of data than in the conventional case.

【0103】<復号化装置201>復号化装置201
は、符号化装置101によって符号化された音響ビット
ストリームを復号化する装置であって、ストリーム入力
部210、第1の復号化部221、第1の逆量子化部2
22、第2の復号化部223、第2の逆量子化部22
6、逆量子化データ合成部227、逆変換部230及び
音響信号出力部240を備える。第2の逆量子化部22
6は、第2の復号化部223において復号化された共有
情報に従って、フラグが「0」であらわされているウィ
ンドウにつき、第1の逆量子化部222の逆量子化結果
であるスペクトルデータをメモリにコピーし、コピーし
たスペクトルデータを、フラグが「1」で表されている
以下のウィンドウに対応付けて逆量子化データ合成部2
27に出力する。逆量子化データ合成部227は、第1
の逆量子化部222の出力するスペクトルデータと第2
の逆量子化部226の出力するスペクトルデータとをウ
ィンドウ単位で合成する。
<Decoding Device 201> Decoding Device 201
Is a device that decodes the acoustic bitstream encoded by the encoding device 101, and is a stream input unit 210, a first decoding unit 221, and a first dequantization unit 2.
22, second decoding section 223, second dequantization section 22
6, an inverse quantized data combination unit 227, an inverse conversion unit 230, and an acoustic signal output unit 240. Second dequantizer 22
In accordance with the shared information decoded by the second decoding unit 223, 6 displays the spectrum data which is the result of the inverse quantization of the first inverse quantization unit 222 for the window whose flag is represented by “0”. The inverse quantized data synthesizing unit 2 is copied to the memory, and the copied spectrum data is associated with the following window whose flag is represented by "1".
To 27. The inverse quantized data synthesizing unit 227 uses the first
Of the spectrum data output from the inverse quantization unit 222 of
And the spectrum data output from the inverse quantization unit 226 of (1) are combined in window units.

【0104】図12は、図11に示した共有判定部13
8によるスペクトルデータの共有の一例を示す図であ
る。図12は、図2(b)と同様、MDCT変換によっ
て得られる1フレーム分のSHORTブロックのスペク
トルデータを示している。このような各ウィンドウは、
入力音響データのサンプリング周波数が例えば44.1
kHzの場合、0kHzから22.05kHzまでの再
生帯域を表している。
FIG. 12 shows the sharing determination unit 13 shown in FIG.
FIG. 8 is a diagram showing an example of sharing of spectrum data according to No. 8. Similar to FIG. 2B, FIG. 12 shows the spectrum data of the SHORT block for one frame obtained by the MDCT transform. Each such window
The sampling frequency of the input sound data is, for example, 44.1.
In the case of kHz, it represents a reproduction band from 0 kHz to 22.05 kHz.

【0105】すでに説明したように、SHORTブロッ
クでは入力音響データの切り出しのサイクルが短いの
で、隣接する2つのウィンドウのスペクトルは、相互に
類似した波形となる可能性が高い。図12において、例
えば、第1ウィンドウと第2ウィンドウとのスペクトル
が相似であり、かつ、第3〜第8ウィンドウのスペクト
ルが相似であると判断した場合、共有判定部138は、
相互に類似した波形となるウィンドウ間、すなわち、第
1ウィンドウと第2ウィンドウとで第1ウィンドウの量
子化データを共有し、第3〜第8ウィンドウにおいて第
3ウィンドウの量子化データを共有すると判定する。こ
の場合、図12に矢印で示す範囲のスペクトルデータが
伝送(すなわち、量子化及び符号化)の対象となり、そ
れ以外の第2ウィンドウと、第4〜第8ウィンドウとの
スペクトルデータは共有判定部138によってすべて
「0」の値に置換される。このように、すべて「0」の
値に置換されたウィンドウのスペクトルデータは、復号
化装置201において、フラグが「0」の直前のウィン
ドウからコピーされたスペクトルデータによって近似的
に復元される。
As described above, since the SHORT block has a short cutout cycle of input acoustic data, the spectra of two adjacent windows are likely to have waveforms similar to each other. In FIG. 12, for example, when it is determined that the spectra of the first window and the second window are similar, and the spectra of the third to eighth windows are similar, the sharing determination unit 138
It is determined that windows having similar waveforms, that is, the first window and the second window share the quantized data of the first window and the third to eighth windows share the quantized data of the third window. To do. In this case, the spectrum data in the range indicated by the arrow in FIG. 12 is the target of transmission (that is, quantization and coding), and the spectrum data of the other second windows and the fourth to eighth windows is the sharing determination unit. 138 replaces all with a value of "0". In this way, the spectral data of the window in which all the values are replaced with the value of “0” is approximately restored by the decoding device 201 by the spectral data copied from the window immediately before the flag of “0”.

【0106】上記のように共有判定部138は、スペク
トルが相似するウィンドウ間で、低域部のスペクトルデ
ータまでを共有することによって、符号化ビットストリ
ームのデータ量を大幅に削減することができる。しか
し、一般的に、低域部スペクトルは聴覚的に鋭敏な低周
波領域の音響信号を表しているため、再生される音響信
号の音質を重視する場合には、共有判定部138は、ウ
ィンドウ間のスペクトルの相似性について、より厳密な
判定を行う。具体的には、判定の基準は共有判定部13
7と同様の方法を用いるが、これらにおいて、例えば、
しきい値の値を小さくしたり、複数の判定を併用したり
することによって、共有判定部137より厳しい判定を
行う。さらにこの場合、同じ理由から、相似性の判定を
省略することはできないので、あらかじめ定めたウィン
ドウのスペクトルデータのみ伝送することは行わない。
As described above, the sharing determination unit 138 can significantly reduce the data amount of the coded bit stream by sharing the spectrum data of the low frequency band between the windows having similar spectra. However, in general, the low-pass spectrum represents an acoustic signal in the low-frequency region that is auditorily sensitive. Therefore, when importance is attached to the sound quality of the reproduced acoustic signal, the sharing determination unit 138 determines that A more rigorous determination is made regarding the similarity of the spectra of. Specifically, the determination criterion is the sharing determination unit 13
The same method as in 7 is used, but in these, for example,
By making the threshold value smaller or using a plurality of judgments in combination, a stricter judgment is made by the sharing judgment unit 137. Further, in this case, for the same reason, the determination of the similarity cannot be omitted, so that only the spectral data of the predetermined window is not transmitted.

【0107】なお、共有判定部138は、実施の形態1
の共有判定部137と同様、必ずしも共有情報を生成し
なくてよい。この場合、第2の符号化部134は不要で
ある。例えば、共有判定部138がグルーピングを行う
場合、各グループにつき、1つ又はそれ以上のウィンド
ウのスペクトルデータを従来どおり量子化及び符号化し
て伝送し、同じグループ内の他のウィンドウのスペクト
ルデータをすべて「0」に置換した後、量子化及び符号
化し伝送する。この場合、共有判定部138は、グルー
ピングに関する情報を生成し、従来と同様、第1の量子
化部131に出力する。なお、ウィンドウ内のスペクト
ルデータを「0」に置換しないで伝送するウィンドウ
は、必ずしもグループ内の先頭ウィンドウでなくてもよ
い。また、グループ内で1つのウィンドウのスペクトル
データを共有する必要はない。
The sharing determination unit 138 is the same as that of the first embodiment.
Similar to the sharing determination unit 137, the sharing information does not necessarily have to be generated. In this case, the second encoding unit 134 is unnecessary. For example, when the sharing determination unit 138 performs grouping, for each group, the spectrum data of one or more windows is quantized and encoded as before and transmitted, and all the spectrum data of other windows in the same group are transmitted. After replacing with “0”, it is quantized and encoded and transmitted. In this case, the sharing determination unit 138 generates information about grouping and outputs it to the first quantization unit 131 as in the conventional case. The window for transmitting without replacing the spectrum data in the window with “0” is not necessarily the first window in the group. Also, it is not necessary to share the spectral data of one window within the group.

【0108】なお、グルーピングについては、従来、S
HORTブロックにおいて既存のツールを用いて行われ
ている手法であるので簡単に説明するが、このグルーピ
ングによって、互いにスペクトルが相似するウィンドウ
がグループ化され、各グループ内で各ウィンドウのスケ
ールファクターが共有される。グルーピングを行う際の
ウィンドウ間のスペクトルの相似性の判定は、スペクト
ルデータを共有する際の判定基準と同様である。サンプ
リング周波数44.1kHzのSHORTブロックで
は、従来、各ウィンドウに14のスケールファクターバ
ンドが規定されているため、各ウィンドウに14のスケ
ールファクターが存在する。従って、1つのグループに
グルーピングされるウィンドウの数が多ければ多いほ
ど、伝送するスケールファクターのデータ量を低減する
ことができる。
Incidentally, regarding the grouping, S is conventionally used.
This method will be briefly described because it is a method that is performed by using an existing tool in the HORT block. By this grouping, windows whose spectra are similar to each other are grouped, and the scale factor of each window is shared within each group. It The determination of the similarity of spectra between windows when grouping is performed is the same as the determination criterion when sharing spectrum data. In the SHORT block having a sampling frequency of 44.1 kHz, 14 scale factor bands are conventionally defined in each window, so that 14 scale factors exist in each window. Therefore, as the number of windows grouped into one group increases, the amount of scale factor data to be transmitted can be reduced.

【0109】さらに共有判定部138は、上記のような
グルーピングにおけるスペクトル相似性の判定におい
て、ウィンドウ間で相似性の高いグループがある場合、
グループ内で各ウィンドウの同一周波数のスペクトル値
の平均値を求め、各周波数のスペクトル値の平均値12
8サンプルからなるウィンドウを新たに生成して当該グ
ループの第1ウィンドウとし、グループ内の他のウィン
ドウのスペクトル値をすべて「0」にして第1の量子化
部131に出力するとしてもよい。
Further, in the determination of the spectral similarity in the grouping described above, the sharing determination unit 138 determines that there is a group having a high similarity between windows,
The average value of the spectrum values of the same frequency of each window in the group is calculated, and the average value of the spectrum values of each frequency is calculated as 12
It is also possible to newly generate a window of 8 samples to be the first window of the group, set all the spectrum values of other windows in the group to “0”, and output the first quantization section 131.

【0110】符号化装置101において共有情報を生成
しない場合、あらかじめ符号化装置101と復号化装置
201との間で、例えば、符号化装置101はグルーピ
ングを行い、同じグループ内の先頭ウィンドウについて
のみスペクトルデータを従来どおり量子化及び符号化し
て送信し、同一グループ内の他のウィンドウについては
スペクトルデータとして「0」を送信すると取り決めて
おく。これによって第2の逆量子化部226は、復号化
されたグルーピングに関する情報に基づいて、各グルー
プの先頭ウィンドウのスペクトルデータをコピーし、コ
ピーしたスペクトルデータを、同一ウィンドウ内の2番
目以降の各ウィンドウに対応付けて逆量子化データ合成
部227に出力し、逆量子化データ合成部227に合成
させる。
When the coding apparatus 101 does not generate the shared information, the coding apparatus 101 performs grouping between the coding apparatus 101 and the decoding apparatus 201 in advance, and only the first window in the same group has a spectrum. It is agreed that the data will be quantized and encoded as before and transmitted, and "0" will be transmitted as spectrum data for the other windows in the same group. As a result, the second dequantization unit 226 copies the spectrum data of the first window of each group based on the decoded information about the grouping, and copies the copied spectrum data to the second and subsequent ones in the same window. It is output to the inverse quantized data synthesizing unit 227 in association with the window and is synthesized by the inverse quantized data synthesizing unit 227.

【0111】また、符号化装置101において共有情報
を生成せず、必ずしも先頭ウィンドウのスペクトルデー
タを送信しない場合には、第2の逆量子化部226は、
復号化されたグルーピングに関する情報に基づいて、第
1の逆量子化部222の逆量子化結果を監視し、第1の
逆量子化部222が、あるウィンドウのスペクトルを復
元しているとき、逆量子化の結果、値が「0」となった
スペクトルデータを検出すると、第2の逆量子化部22
6は、同じグループ内の他のウィンドウの同じ周波数の
スペクトルデータを参照して、その値が「0」でなけれ
ばその値をコピーして逆量子化データ合成部227に出
力し、逆量子化データ合成部227に合成させる。
If the encoding apparatus 101 does not generate the shared information and does not necessarily transmit the spectrum data of the first window, the second dequantization unit 226
Based on the decoded grouping information, the dequantization result of the first dequantization unit 222 is monitored, and when the first dequantization unit 222 restores the spectrum of a certain window, the dequantization is performed. When the spectrum data whose value becomes “0” as a result of the quantization is detected, the second inverse quantization unit 22
6 refers to the spectrum data of the same frequency in another window in the same group, and if the value is not “0”, copies the value and outputs it to the dequantized data combining unit 227, and dequantizes it. The data combining unit 227 causes the data to be combined.

【0112】あるいは、第1の逆量子化部222が、あ
るウィンドウのスペクトルを復元しているとき、スペク
トル値がすべて「0」となった場合、第2の逆量子化部
226は、同じグループ内の他のウィンドウのスペクト
ルを参照して、「0」以外の値のスペクトルデータを含
むウィンドウ内のスペクトルデータをコピーし、スペク
トル値がすべて「0」となったウィンドウに対応付けて
逆量子化データ合成部227に出力するとしてもよい。
Alternatively, when the first dequantization unit 222 restores the spectrum of a window and all the spectrum values are “0”, the second dequantization unit 226 determines that the same group The spectrum data in the window including the spectrum data of values other than "0" is copied with reference to the spectrum of other windows in the table, and the inverse quantization is performed by associating with the window in which all the spectrum values are "0". It may be output to the data synthesizing unit 227.

【0113】また、共有判定部138は、同一グループ
内で複数のウィンドウのスペクトルデータを「0」に置
換しないで第1の量子化部131に出力してもよい。こ
の場合、復号化装置201において、第1の逆量子化部
222があるウィンドウのスペクトルを復元していると
き、第2の逆量子化部226は、逆量子化の結果、値が
「0」となったスペクトルデータを検出すると、同じグ
ループ内の他のウィンドウの同じ周波数のスペクトルデ
ータを参照して、(a)最初に見つけた「0」でないス
ペクトルデータをコピーする。または、(b)スペクト
ル値が最大のスペクトルデータをコピーするとしてもよ
いし、(c)最小のスペクトルデータをコピーするとし
てもよい。
Further, the sharing determination section 138 may output the spectrum data of a plurality of windows in the same group to the first quantization section 131 without replacing it with "0". In this case, in the decoding device 201, when the first dequantization unit 222 restores the spectrum of the window, the second dequantization unit 226 has a value of “0” as a result of dequantization. When the spectrum data that becomes is referred to, the spectrum data of the same frequency in another window in the same group is referred to, and (a) the first non-zero spectrum data found is copied. Alternatively, (b) the spectrum data having the largest spectrum value may be copied, or (c) the spectrum data having the smallest spectrum value may be copied.

【0114】さらにこの場合、復号化装置201におい
て、第1の逆量子化部222が、あるウィンドウのスペ
クトルを復元しているとき、スペクトル値がすべて
「0」となった場合、第2の逆量子化部226は、同じ
グループ内の他のウィンドウのスペクトルを参照して、
「0」以外の値のスペクトルデータを含むウィンドウの
うちで(a)スペクトルのピークの値が最大となるウィ
ンドウのスペクトルデータをコピーするとしてもよい
し、(b)エネルギーが最大となるウィンドウのスペク
トルデータをコピーするとしてもよい。
Further, in this case, in the decoding device 201, when the first dequantization unit 222 restores the spectrum of a certain window, if the spectrum values are all “0”, the second dequantization unit The quantizer 226 refers to the spectra of other windows in the same group,
Among windows including spectrum data having values other than “0”, (a) the spectrum data of the window having the maximum peak value of the spectrum may be copied, or (b) the spectrum of the window having the maximum energy. You may copy the data.

【0115】以上のように、本実施の形態によれば、8
つウィンドウのうちいくつかのスペクトルデータを、ス
ペクトルが相似する他のウィンドウと共有することによ
って、スペクトルデータの再現性の低下を最小限に抑え
ながらも、伝送する符号化音響ビットストリームのデー
タ量を削減することができるという効果がある。
As described above, according to the present embodiment, 8
By sharing some of the spectral data in one of the two windows with other windows with similar spectra, the amount of data in the coded acoustic bitstream to be transmitted can be reduced while minimizing the loss of reproducibility of the spectral data. The effect is that it can be reduced.

【0116】なお、本実施の形態においても、復号化装
置201において、第2の逆量子化部226がコピーし
たスペクトルデータの振幅を必要に応じて調整してもよ
いことはいうまでもない。振幅の調整は各スペクトルデ
ータに予め決められた係数、例えば0.5を乗じる。こ
の係数は固定値でもよいし、帯域ごとに変更してもよい
し、第1の逆量子化部222より出力されるスペクトル
データに応じて変更してもよい。なお今回の説明におい
ては予め定めた係数を用いるが、補助情報として第2の
符号化信号に付加してもよい。または係数としてスケー
ルファクター値を第2の符号化信号に付加してもよい
し、係数として量子化値を第2の符号化信号に付加して
もよい。
It is needless to say that also in the present embodiment, the amplitude of the spectrum data copied by the second dequantization unit 226 may be adjusted in the decoding apparatus 201 as necessary. To adjust the amplitude, each spectrum data is multiplied by a predetermined coefficient, for example, 0.5. This coefficient may be a fixed value, may be changed for each band, or may be changed according to the spectrum data output from the first inverse quantization unit 222. Although a predetermined coefficient is used in this description, it may be added to the second coded signal as auxiliary information. Alternatively, a scale factor value as a coefficient may be added to the second encoded signal, or a quantized value as a coefficient may be added to the second encoded signal.

【0117】また、本実施の形態において、フラグが
「0」のウィンドウについても、高域部のスペクトルデ
ータを「0」に置換してしまい、代わりに高域部のデー
タとして実施の形態1で説明した補助情報を生成すると
してもよい。この場合、第2の符号化信号内に共有情報
と、補助情報とを符号化する。すなわち、符号化装置1
02において、フラグが「0」のウィンドウについては
低域部スペクトルデータのみを従来どおり量子化及び符
号化し、高域部スペクトルデータとして「0」を量子化
及び符号化する。フラグが「0」のウィンドウについ
て、実施の形態1で説明した高域部スペクトルを表す補
助情報を生成し、共有情報と補助情報とを組み合わせて
符号化するようにする。これに対応して、復号化装置2
01では、共有情報のフラグが「0」のウィンドウにつ
いては、低域部スペクトルデータを従来と同様、第1の
符号化信号を逆量子化することによって復元し、高域部
スペクトルデータを前記補助情報に基づいて復元する。
共有情報のフラグが「1」のウィンドウについては、フ
ラグが「0」のウィンドウにおいてこのように復元され
た全域のスペクトルデータをコピーして復元する。
Further, in the present embodiment, even for a window whose flag is "0", the spectrum data in the high frequency band is replaced with "0", and instead the data in the high frequency band is used in the first embodiment. The auxiliary information described may be generated. In this case, the shared information and the auxiliary information are coded in the second coded signal. That is, the encoding device 1
In 02, for the window whose flag is "0", only the low band spectrum data is quantized and coded as usual, and "0" is quantized and coded as the high band spectrum data. For the window whose flag is "0", the auxiliary information representing the high frequency band spectrum described in the first embodiment is generated, and the shared information and the auxiliary information are combined and encoded. In response to this, the decoding device 2
In 01, in the window in which the flag of the shared information is “0”, the low frequency band spectrum data is restored by dequantizing the first coded signal in the same manner as in the conventional case, and the high frequency band spectrum data is added to the auxiliary data. Restore based on information.
For the window with the shared information flag of "1", the spectral data of the entire region thus restored in the window with the flag of "0" is copied and restored.

【0118】(実施の形態3)以下では、図13〜図1
6を用いて本実施の形態における符号化装置102及び
復号化装置202について、実施の形態1と異なる点に
ついてのみ説明する。図13は、本発明の符号化装置1
02及び復号化装置202の構成を示すブロック図であ
る。 <符号化装置102>符号化装置102は、LONGブ
ロックにおいて量子化の結果、絶対最大スペクトルに隣
接するため量子化値が「0」となったスペクトルデータ
を復元し、復元したスペクトルデータを少ないデータ量
で復号化装置202に伝送する。符号化装置102は、
音響信号入力部111、変換部121、第1の量子化部
151、第1の符号化部152、第2の量子化部15
3、第2の符号化部154及びストリーム出力部160
から構成される。
(Embodiment 3) In the following, FIGS.
6, the encoding device 102 and the decoding device 202 in the present embodiment will be described only about the differences from the first embodiment. FIG. 13 shows an encoding device 1 of the present invention.
2 is a block diagram showing the configurations of 02 and a decoding device 202. FIG. <Encoding Device 102> The encoding device 102 restores the spectrum data whose quantization value is “0” because it is adjacent to the absolute maximum spectrum as a result of the quantization in the LONG block, and uses the restored spectrum data in a small amount of data. The quantity is transmitted to the decoding device 202. The encoding device 102
Acoustic signal input unit 111, conversion unit 121, first quantization unit 151, first coding unit 152, second quantization unit 15
3, the second encoding unit 154, and the stream output unit 160
Composed of.

【0119】音響信号入力部111は、周波数44.1
kHzのサンプリング周波数でサンプリングされたMP
EG−2 AACと同様の入力信号であるデジタル音響
データを、約23.2msec(1024サンプルご
と)のサイクルで、その前後の512サンプルをオーバ
ーラップさせて切り出す。
The acoustic signal input section 111 has a frequency of 44.1.
MP sampled at a sampling frequency of kHz
Digital acoustic data, which is an input signal similar to that of EG-2 AAC, is cut out in a cycle of about 23.2 msec (every 1024 samples) by overlapping 512 samples before and after that.

【0120】変換部121は、MDCTを用いて、入力
信号1024点を前後512サンプルのデータとオーバ
ーラップさせて2048サンプルの時間軸データを、2
048サンプルのスペクトルデータに変換する。さら
に、変換部121は、MDCTでは左右対称なスペクト
ルデータとなるため、片方の1024サンプルのスペク
トルデータを、それぞれ1サンプル以上(実用的には4
の倍数)のスペクトルデータを含む複数のスケールファ
クターバンドに分類する。ここでは、サンプリング周波
数が44.1kHzのデジタル音響データを入力するの
で、LONGブロック1フレームに含まれるスケールフ
ァクターバンドの数は49個である。
The transform unit 121 uses MDCT to overlap the 1024 input signal points with the data of 512 samples before and after, and convert the time axis data of 2048 samples to 2
Convert to spectral data of 048 samples. Furthermore, since the conversion unit 121 produces bilaterally symmetrical spectrum data in MDCT, one or more samples of the spectrum data of one of the 1024 samples (practically 4
Multiple scale factor bands containing spectral data of multiples of. Here, since digital audio data having a sampling frequency of 44.1 kHz is input, the number of scale factor bands included in one frame of the LONG block is 49.

【0121】第1の量子化部151は、変換部121の
出力するスペクトルデータを入力し、入力されたスペク
トルデータの各スケールファクターバンドにつき、それ
ぞれスケールファクターを決定するとともに、決定した
スケールファクターでそのスケールファクターバンド内
のスペクトルを量子化し、量子化結果である量子化値を
第1の符号化部152に出力する。
The first quantizing unit 151 inputs the spectrum data output from the converting unit 121, determines the scale factor for each scale factor band of the input spectral data, and determines the scale factor with the determined scale factor. The spectrum in the scale factor band is quantized, and the quantized value that is the quantized result is output to the first encoding unit 152.

【0122】第1の符号化部152は、第1の量子化部
151で量子化されたスペクトルデータ1024サンプ
ルに対応する各スケールファクターバンド内の量子化値
及びその量子化に用いられたスケールファクターの差分
などを、第1の符号化信号としてハフマン符号化して所
定のストリーム用のフォーマットに変換する。
The first coding unit 152 has a quantization value in each scale factor band corresponding to the 1024 samples of the spectrum data quantized by the first quantization unit 151 and a scale factor used for the quantization. Is subjected to Huffman coding as a first coded signal and converted into a predetermined stream format.

【0123】第2の量子化部153は、第1の量子化部
151の量子化結果を監視し、各スケールファクターバ
ンドにおいて、絶対最大スペクトルデータ(絶対値が最
大となるスペクトルデータ)に隣接するために第1の量
子化部151の量子化によって量子化値が「0」となっ
た前後各5サンプル、合計10サンプルのスペクトルデ
ータを特定する。第2の量子化部153は、特定したス
ペクトルデータに対して変換部121から入力したスペ
クトル値を、符号化装置102と復号化装置202との
間であらかじめ定めたスケールファクターを用いて量子
化し、量子化値のみを、より少ないデータ量で表現して
第2の符号化部154に出力する。
The second quantizing unit 153 monitors the quantization result of the first quantizing unit 151 and is adjacent to the absolute maximum spectrum data (spectrum data having the maximum absolute value) in each scale factor band. Therefore, the spectrum data of each of the 5 samples before and after the quantized value becomes “0” by the quantization of the first quantizing unit 151, that is, a total of 10 samples is specified. The second quantization unit 153 quantizes the spectrum value input from the conversion unit 121 with respect to the specified spectrum data, using a predetermined scale factor between the encoding device 102 and the decoding device 202, Only the quantized value is expressed with a smaller data amount and output to the second encoding unit 154.

【0124】第2の符号化部154は、第2の量子化部
153が出力した量子化値のみを所定のストリーム用の
フォーマットにハフマン符号化し、第2の符号化信号と
して出力する。第2の量子化部153で用いられたスケ
ールファクターは、符号化しない。
The second encoder 154 Huffman-encodes only the quantized value output by the second quantizer 153 into a predetermined stream format and outputs it as a second encoded signal. The scale factor used in the second quantizer 153 is not encoded.

【0125】ストリーム出力部160は、第1の符号化
部152から出力される第1の符号化信号にヘッダ情報
及びその他必要に応じた副情報を付加してMPEG−2
AACの符号化ビットストリームに変換し、かつ第2
の符号化部154から出力された第2の符号化信号を、
上記ビットストリーム中の従来の復号化装置では無視さ
れる又はその動作が規定されていない領域に格納する。
The stream output section 160 adds header information and other sub-information as necessary to the first coded signal output from the first coding section 152 to make MPEG-2.
Convert to an AAC encoded bitstream, and
The second encoded signal output from the encoding unit 154 of
The bit stream is stored in an area which is ignored by the conventional decoding device or whose operation is not specified.

【0126】<復号化装置202>復号化装置202
は、ピークに隣接するため量子化によって量子化値が
「0」となったスペクトルデータを、復号化された第2
の符号化信号に従って復元する復号化装置であって、ス
トリーム入力部260、第1の復号化部251、第1の
逆量子化部252、第2の復号化部253、第2の逆量
子化部254、逆量子化データ合成部255、逆変換部
231及び音響信号出力部241から構成される。
<Decoding Device 202> Decoding Device 202
Is adjacent to the peak, the spectral data whose quantized value becomes “0” by the quantization is the second decoded data.
A decoding device that restores the encoded signal according to the above-described encoded signal, the stream input unit 260, a first decoding unit 251, a first dequantization unit 252, a second decoding unit 253, and a second dequantization unit. It is composed of a unit 254, an inverse quantized data synthesizing unit 255, an inverse transforming unit 231, and an acoustic signal output unit 241.

【0127】ストリーム入力部260は、符号化装置1
02において生成された符号化ビットストリームを入力
し、入力した符号化ビットストリームから第1の符号化
信号と第2の符号化信号とを取り出して、それぞれ第1
の復号化部251と第2の復号化部253とに出力す
る。
The stream input section 260 includes the encoding device 1
The encoded bit stream generated in 02 is input, the first encoded signal and the second encoded signal are extracted from the input encoded bit stream, and the first encoded signal and the second encoded signal are extracted, respectively.
To the second decoding unit 251 and the second decoding unit 253.

【0128】第1の復号化部251は、ストリーム入力
部260の出力する第1の符号化信号を入力し、ハフマ
ン符号化されたデータをストリーム用のフォーマットか
ら量子化データに復号化する。第1の逆量子化部252
は、第1の復号化部251により復号化された量子化デ
ータを逆量子化し、再生帯域22.05kHz、102
4サンプルのスペクトルデータを出力する。
The first decoding section 251 receives the first coded signal output from the stream input section 260 and decodes the Huffman coded data from the stream format into quantized data. First dequantization unit 252
Dequantizes the quantized data decoded by the first decoding unit 251, and reproduces the band of 22.05 kHz, 102
Output the spectral data of 4 samples.

【0129】第2の復号化部253は、ストリーム入力
部260の出力する第2の符号化信号を入力し、入力さ
れた第2の符号化信号を復号して、各スケールファクタ
ーバンドにおける絶対最大スペクトルに隣接する前後各
5サンプルの量子化値を出力する。
The second decoding section 253 inputs the second coded signal output from the stream input section 260, decodes the input second coded signal, and outputs the absolute maximum in each scale factor band. The quantized value of each of the 5 samples before and after which it adjoins a spectrum is output.

【0130】第2の逆量子化部254は、第2の復号化
部253の出力である量子化値を所定のスケールファク
ターを用いて逆量子化し、絶対最大スペクトルの前後に
隣接する各10サンプルのスペクトルデータを生成す
る。第2の逆量子化部254は、第1の逆量子化部25
2から出力されたスペクトルデータをもとに、絶対最大
スペクトルの前後に隣接していたために量子化値が
「0」となった10サンプルのスペクトルデータの周波
数を特定し、生成した10サンプルのスペクトルデータ
を、特定された周波数に対応付けて逆量子化データ合成
部255に出力する。
The second dequantization section 254 dequantizes the quantized value output from the second decoding section 253 using a predetermined scale factor, and samples each adjacent 10 samples before and after the absolute maximum spectrum. Generate the spectral data of. The second dequantization unit 254 is the first dequantization unit 25.
Based on the spectrum data output from 2, the frequency of the spectrum data of 10 samples whose quantized value became “0” because they were adjacent before and after the absolute maximum spectrum was specified, and the spectrum of the generated 10 samples The data is output to the dequantized data synthesizing unit 255 in association with the specified frequency.

【0131】逆量子化データ合成部255は、第1の逆
量子化部252の出力であるスペクトルデータと、第2
の逆量子化部254の出力であるスペクトルデータとを
合成し、逆変換部231に出力する。具体的には、逆量
子化データ合成部255は、第2の逆量子化部254か
ら周波数に対応付けて出力されたスペクトルデータの値
で、第1の逆量子化部252の出力であるその周波数の
スペクトルデータを置換する。逆変換部231は、逆量
子化データ合成部255で合成された周波数軸上の10
24サンプルのスペクトルデータを、IMDCTを用い
て時間軸上の音響信号に変換する。音響信号出力部24
1は、逆変換部231で得られた時間軸上のサンプルデ
ータを順次組み合わせ、デジタル音響出力データとして
出力する。
The inverse quantized data synthesizer 255 includes the spectrum data output from the first inverse quantizer 252 and the second
The spectrum data output from the inverse quantization unit 254 of 1 is combined and output to the inverse conversion unit 231. Specifically, the inverse quantized data synthesizer 255 is the value of the spectrum data output from the second inverse quantizer 254 in association with the frequency, which is the output of the first inverse quantizer 252. Replace frequency spectral data. The inverse transforming unit 231 uses the inverse quantized data synthesizing unit 255 to synthesize 10 signals on the frequency axis.
The spectral data of 24 samples is converted into an acoustic signal on the time axis using IMDCT. Acoustic signal output unit 24
1 sequentially combines the sample data on the time axis obtained by the inverse conversion unit 231, and outputs it as digital audio output data.

【0132】以上のように、本発明の符号化装置102
及び復号化装置202によれば、各スケールファクター
バンドにおける絶対最大スペクトルデータの前後のスペ
クトルデータを第1の量子化部151とは異なるスケー
ルファクターを用いて符号化することにより、量子化値
が「0」となっていたスペクトルデータを復元するので
再生帯域全域におけるピーク近辺の精度が向上し、より
高い音質での符号化を行うことができるという効果があ
る。
As described above, the encoding device 102 of the present invention.
Also, according to the decoding device 202, the quantized value is “1” by encoding the spectrum data before and after the absolute maximum spectrum data in each scale factor band using a scale factor different from that of the first quantization unit 151. Since the spectrum data that has been set to "0" is restored, the accuracy in the vicinity of the peak in the entire reproduction band is improved, and it is possible to perform encoding with higher sound quality.

【0133】なお、ここでは、第2の逆量子化部254
は、変換部121からの出力であるスペクトルデータを
用いて量子化を行ったが、必ずしも変換部121からの
出力を用いなくてもよく、例えば、第1の量子化部15
1の量子化値を逆量子化して用いてもよい。この場合の
符号化装置102の構成を、以下の図14に示す。
Here, the second inverse quantizer 254 is used.
Quantized using the spectrum data that is the output from the conversion unit 121, but the output from the conversion unit 121 does not necessarily have to be used. For example, the first quantization unit 15
The quantized value of 1 may be inversely quantized and used. The configuration of the encoding device 102 in this case is shown in FIG. 14 below.

【0134】図14は、符号化装置102及び復号化装
置202の他の構成を示すブロック図である。符号化装
置102は、音響信号入力部111、変換部121、第
1の量子化部151、第1の符号化部152、第2の量
子化部156、第2の符号化部154、逆量子化部15
5及びストリーム出力部160から構成される。
FIG. 14 is a block diagram showing another configuration of the encoding device 102 and the decoding device 202. The encoding device 102 includes an acoustic signal input unit 111, a conversion unit 121, a first quantization unit 151, a first encoding unit 152, a second quantization unit 156, a second encoding unit 154, and an inverse quantum. Conversion unit 15
5 and the stream output unit 160.

【0135】第2の量子化部156は、逆量子化部15
5を介して第1の量子化部151の量子化結果を監視
し、第1の量子化部151において量子化されたスペク
トルデータのうち、絶対最大スペクトルデータの前後に
隣接するために量子化値が「0」となった10サンプル
のスペクトルデータを特定するとともに、特定されたス
ペクトルデータを逆量子化部155から入力し、所定の
スケールファクターを用いて量子化する。
The second quantizing unit 156 is the inverse quantizing unit 15
5, the quantization result of the first quantization unit 151 is monitored, and among the spectrum data quantized by the first quantization unit 151, the quantization value is set because it is adjacent before and after the absolute maximum spectrum data. The spectrum data of 10 samples having "0" is specified, and the specified spectrum data is input from the inverse quantization unit 155 and quantized using a predetermined scale factor.

【0136】逆量子化部155は、第1の量子化部15
1の量子化結果である量子化値を逆量子化し、その量子
化値とそれに対応するスペクトル値とを第2の量子化部
156に出力する。上記のように構成された符号化装置
102及び復号化装置202の動作について、以下に図
15及び図16を用いて説明する。
The inverse quantizer 155 has the first quantizer 15
The quantized value that is the quantized result of 1 is inversely quantized, and the quantized value and the spectrum value corresponding to the quantized value are output to the second quantizing unit 156. Operations of the encoding apparatus 102 and the decoding apparatus 202 configured as above will be described below with reference to FIGS. 15 and 16.

【0137】符号化装置102の第1の量子化部151
において、従来と同様、伝送路の転送レートに符号化デ
ータ量を合わせるようスケールファクターを調整して量
子化を行っていると、絶対最大スペクトルデータの前後
のスペクトルデータが、連続的に「0」になってしまう
ことがしばしば起こる。このような量子化値を、そのま
ま復号化装置202において復元すると、絶対最大スペ
クトルデータのみが正しく復元され、その両側に隣接す
るスペクトルデータはいずれも「0」となってしまい、
その分が量子化誤差となって、復号化装置202から出
力される音響信号の音質が劣化してしまうという問題が
ある。
First quantizer 151 of encoding apparatus 102
In the same manner as before, when the quantization is performed by adjusting the scale factor so as to match the encoded data amount with the transfer rate of the transmission line, the spectrum data before and after the absolute maximum spectrum data is continuously "0". Often happens. When such a quantized value is restored in the decoding device 202 as it is, only the absolute maximum spectrum data is correctly restored, and the spectrum data adjacent to both sides thereof become “0”,
There is a problem that the amount becomes a quantization error and the sound quality of the acoustic signal output from the decoding device 202 deteriorates.

【0138】このため、スケールファクターの値を調整
することによって絶対最大スペクトルデータの前後のス
ペクトルデータを「0」にならないように量子化しよう
とすると、今度は絶対最大スペクトルデータを含む近隣
のスペクトルデータの量子化値がいずれも大きな数値と
なってしまう。これらを符号化した符号化ビットストリ
ームのデータ量は、量子化値の最大値に依存し、量子化
値の最大値が大きくなるほど、符号化ビットストリーム
のデータ量が増大する傾向にある。このため、符号化ビ
ットストリームを伝送路を介して伝送する点において、
この方法は現実的でない。
Therefore, if the spectrum data before and after the absolute maximum spectrum data is quantized so as not to be "0" by adjusting the value of the scale factor, this time the neighboring spectrum data including the absolute maximum spectrum data will be quantized. The quantized values of will be large numbers. The data amount of the encoded bitstream obtained by encoding these depends on the maximum value of the quantized value, and the larger the maximum value of the quantized value, the more the data amount of the encoded bitstream tends to increase. Therefore, in transmitting the encoded bit stream through the transmission path,
This method is not realistic.

【0139】図15は、従来の符号化装置300と本発
明の符号化装置102との量子化結果の違いを具体値を
用いて示すテーブル500である。まず、従来の符号化
装置300において、テーブル500のように、例えば
{10、40、100、30}というスペクトルデータ
501が変換部320から出力された場合に、量子化部
331において、符号化ビットストリームの1フレーム
分のデータ量に応じてスケールファクターを調整し、量
子化を行うと、量子化値502が例えば{0、0、1、
0}のようになり、絶対最大スペクトルデータ「10
0」に隣接するスペクトルデータの値が「0」になって
しまう。従来の符号化装置300では、この量子化値5
02を採用せざるを得ず、この量子化値502が符号化
される。この結果、これを入力した復号化装置400で
は、逆量子化部422によって復元されるスペクトルデ
ータ505の値が{0、0、100、0}となってしま
う。
FIG. 15 is a table 500 showing the difference in the quantization result between the conventional coding apparatus 300 and the coding apparatus 102 of the present invention using concrete values. First, in the conventional encoding device 300, when spectrum data 501 such as {10, 40, 100, 30} is output from the conversion unit 320, as in the table 500, the quantization unit 331 generates encoded bits. When the scale factor is adjusted according to the amount of data for one frame of the stream and quantization is performed, the quantized value 502 becomes, for example, {0, 0, 1,
0}, and the absolute maximum spectrum data “10
The value of the spectrum data adjacent to "0" will be "0". In the conventional encoding device 300, the quantization value 5
No. 02 has to be adopted, and this quantized value 502 is encoded. As a result, in the decoding apparatus 400 that receives this, the value of the spectrum data 505 restored by the dequantization unit 422 becomes {0, 0, 100, 0}.

【0140】これに対し、本発明の符号化装置102で
は、同じ{10、40、100、30}というスペクト
ルデータ501が変換部121から出力された場合、第
1の量子化部151による量子化値502は、やはり、
{0、0、1、0}となる。本発明の符号化装置102
では、このような場合、第1の量子化部151において
は、量子化値502をそのまま出力するようにしてお
く。符号化装置102では、これを補うため、さらに第
2の量子化部153において、同じスペクトルデータに
対して所定のスケールファクターを用いて量子化を行
う。第2の量子化部153による量子化値503が
{1、4、10、3}であったとすると、量子化値の最
小値が「1」となっているので、これ以上スケールファ
クターを小さくしていくとこの値が「0」になってしま
う。従って、量子化値503が、前後のスペクトルデー
タが「0」にならない範囲で符号化データのデータ量を
最も低減した量子化値であるが、それでも量子化値の最
大値は「10」となる。
On the other hand, in the encoding device 102 of the present invention, when the same spectrum data 501 of {10, 40, 100, 30} is output from the conversion unit 121, the first quantization unit 151 performs quantization. The value 502 is
It becomes {0, 0, 1, 0}. Encoding device 102 of the present invention
Then, in such a case, the first quantization unit 151 outputs the quantized value 502 as it is. In the encoding device 102, in order to compensate for this, the second quantizing unit 153 further quantizes the same spectrum data using a predetermined scale factor. If the quantized value 503 by the second quantizer 153 is {1, 4, 10, 3}, the minimum quantized value is "1", so the scale factor should be reduced further. This value becomes "0" as you go. Therefore, the quantized value 503 is the quantized value in which the data amount of the coded data is reduced most in the range where the spectral data before and after does not become “0”, but the maximum quantized value is still “10”. .

【0141】これに対し第2の量子化部153では、さ
らに量子化値のデータ量を低減するため、その量子化結
果が量子化値503{1、4、10、3}であれば、こ
の量子化値を、例えば量子化値504{1、2、0、
2}というように指数関数表示などを用いて表す。
On the other hand, in the second quantizing section 153, in order to further reduce the data amount of the quantized value, if the quantized result is the quantized value 503 {1, 4, 10, 3}, this The quantized value is, for example, quantized value 504 {1, 2, 0,
2} is expressed using exponential function display or the like.

【0142】具体的には、先頭サンプルの「1」は、2
の1乗として「2」を表し、第2サンプルの「2」は、
2の2乗として「4」を表す。第3サンプルの「0」
は、この位置のスペクトルデータが絶対最大スペクトル
データであることを示している。絶対最大スペクトルデ
ータのスペクトル値は、第1の符号化信号から得られる
(第1の量子化部151で求められた)スケールファク
ターとその量子化値「1」とから正しく求められる。こ
のように各スケールファクターバンド内の絶対最大スペ
クトルデータのスペクトル値の符号化を省略することに
より、第2の符号化信号のデータ量をさらに低減するこ
とができるという効果がある。第4サンプルの「2」
は、2の2乗として「4」を表す。このような表現は、
第2の量子化部153で得られた量子化値503{1、
4、10、3}とは正確に一致しないが、量子化値50
4{1、2、0、2}のように各サンプルの量子化値を
高々2ビットで表すことができる。復号化装置202に
おいて、第1の符号化信号から得られる量子化値502
と、第2の符号化信号から得られる量子化値504とに
基づいてスペクトルデータを復元すると、スペクトルデ
ータ505{20、40、100、40}のようにな
る。
Specifically, the first sample "1" is 2
"2" is expressed as the first power of, and "2" in the second sample is
"4" is represented as the square of 2. "0" in the third sample
Indicates that the spectral data at this position is the absolute maximum spectral data. The spectrum value of the absolute maximum spectrum data is correctly obtained from the scale factor (obtained by the first quantization unit 151) obtained from the first encoded signal and its quantized value "1". By omitting the encoding of the spectrum value of the absolute maximum spectrum data in each scale factor band in this way, the data amount of the second encoded signal can be further reduced. "2" of the fourth sample
Represents "4" as the square of 2. Such an expression is
The quantized value 503 {1, obtained by the second quantizer 153,
4, 10, 3} does not match exactly, but the quantized value is 50
The quantized value of each sample can be represented by at most 2 bits like 4 {1, 2, 0, 2}. In the decoding device 202, the quantized value 502 obtained from the first encoded signal
When the spectrum data is restored based on the quantized value 504 obtained from the second encoded signal and the quantized value 504, spectrum data 505 {20, 40, 100, 40} is obtained.

【0143】このように、符号化装置102によれば、
第2の量子化部153の量子化結果を上記のように表す
ことによって、第2の符号化信号のデータ量を最小限に
抑えつつ、従来の方法ではデータ量を低減しようとする
とすべて「0」になってしまっていたピークの前後のス
ペクトルデータを、大まかではあるがおおよその値で復
元することができ、原音に対してより忠実な音響信号を
復元することができるという効果がある。
In this way, according to the encoding device 102,
By expressing the quantization result of the second quantization unit 153 as described above, when the data amount of the second coded signal is suppressed to the minimum while the data amount is reduced to "0" in the conventional method. The spectrum data before and after the peak that has become “” can be restored with a rough but approximate value, and an acoustic signal more faithful to the original sound can be restored.

【0144】なお、ここでは、第2の量子化部153の
量子化結果を「2」のべき乗で表したが、底の値は
「2」である必要はないし、また整数である必要もな
く、どのような数値であってもよい。さらに、第2の量
子化部153の量子化結果を表す関数は指数である必要
はなく、他の関数であってもよい。
Here, the quantization result of the second quantizing unit 153 is represented by a power of "2", but the base value does not have to be "2", and it need not be an integer. , Any numerical value may be used. Furthermore, the function representing the quantization result of the second quantization unit 153 does not need to be an exponent, and may be another function.

【0145】図16は、符号化装置102によるピーク
周辺の量子化誤差の補正の一例を示す図である。図16
(a)は、図13及び図14に示した変換部121の出
力であるスペクトルの一部を示す波形図である。同図に
おいて、一点鎖線で示す範囲は1つのスケールファクタ
ーバンド(sfb)を示しており、破線は当該スケール
ファクターバンドの絶対最大スペクトルデータの周波数
を示している。さらに、二点鎖線で示す範囲は絶対最大
スペクトルの前後に隣接する合計10サンプルのスペク
トルデータを示している。図16(b)は、図13及び
図14に示した第1の量子化部151による図16
(a)のスペクトル部分の量子化結果の一例を示す図で
ある。図16(c)は、図13及び図14に示した第2
の量子化部153、156による図16(a)のスペク
トル部分の量子化結果の一例を示す図である。図16
(a)、図16(b)及び図16(c)において横軸は
周波数を表している。また、図16(a)において縦軸
はスペクトル値を表している。また、図16(b)及び
図16(c)において縦軸は量子化値を表している。
FIG. 16 is a diagram showing an example of correction of the quantization error around the peak by the encoding device 102. FIG.
13A is a waveform diagram showing a part of the spectrum output from the conversion unit 121 shown in FIGS. 13 and 14. FIG. In the figure, the range indicated by the alternate long and short dash line shows one scale factor band (sfb), and the broken line shows the frequency of the absolute maximum spectrum data of the scale factor band. Further, the range indicated by the chain double-dashed line shows the spectrum data of a total of 10 samples adjacent before and after the absolute maximum spectrum. FIG. 16B is a diagram obtained by the first quantizer 151 shown in FIGS. 13 and 14.
It is a figure which shows an example of the quantization result of the spectrum part of (a). FIG. 16C is the second diagram shown in FIGS. 13 and 14.
FIG. 17 is a diagram showing an example of a quantization result of the spectrum part of FIG. 16A by the quantization units 153 and 156 of FIG. FIG.
In (a), FIG. 16 (b), and FIG. 16 (c), the horizontal axis represents frequency. In addition, in FIG. 16A, the vertical axis represents the spectrum value. 16B and 16C, the vertical axis represents the quantized value.

【0146】1つのスケールファクターバンドのスペク
トルデータは、同一スケールファクターを用いて正規化
され、量子化される。例えば、図16(a)のように絶
対最大スペクトルデータが比較的大きな値をとる場合、
そのスケールファクターを1フレーム全体のビット量に
基づいて調整すると、スケールファクターの値を小さく
せざるを得ない。この結果、図16(b)のように、量
子化結果として、絶対最大スペクトルデータのみが
「0」以外の値をもち、それ以外のスペクトルデータの
値はすべて「0」になる場合がしばしば生じる。第1の
量子化部151は、このような量子化結果を、そのまま
第1の符号化部152に出力する。符号化装置102に
おいては、これに対してさらに、第2の量子化部153
による図16(c)のような量子化結果を第2の符号化
信号として伝送する。第2の量子化部153では、絶対
最大スペクトルデータの量子化値として「0」を出力
し、その前後10サンプルについて量子化を行う。
The spectral data of one scale factor band is normalized and quantized using the same scale factor. For example, when the absolute maximum spectrum data has a relatively large value as shown in FIG.
If the scale factor is adjusted based on the bit amount of one frame as a whole, the value of the scale factor cannot help being reduced. As a result, as shown in FIG. 16B, as a result of quantization, only the absolute maximum spectrum data has a value other than "0", and the values of the other spectrum data often become "0". . The first quantization unit 151 outputs such a quantization result as it is to the first encoding unit 152. In the encoding device 102, on the other hand, the second quantizer 153
The quantization result as shown in FIG. 16 (c) is transmitted as the second coded signal. The second quantizer 153 outputs "0" as the quantized value of the absolute maximum spectrum data, and quantizes 10 samples before and after that.

【0147】第2の量子化部153においては、あらか
じめ定めたスケールファクターを用いて量子化を行うの
で、その値が第1の量子化部151が用いたスケールフ
ァクターとあまり変わらない場合には、第1の量子化部
151において「0」になった量子化値が第2の量子化
部153において「0」以外の値をとるとは必ずしもい
えない。しかし、第2の量子化部153に対し、あらか
じめスケールファクターバンドごとに適切なスケールフ
ァクターを定めておくことによって、より多くのスケー
ルファクターバンドにおいて、「0」になった第1の量
子化部151の量子化結果を図16(c)のように復元
することができる。
Since the second quantizer 153 quantizes using a predetermined scale factor, if the value is not much different from the scale factor used by the first quantizer 151, It cannot always be said that the quantized value which has become “0” in the first quantizer 151 takes a value other than “0” in the second quantizer 153. However, by defining an appropriate scale factor for each scale factor band in advance in the second quantizing unit 153, the first quantizing unit 151 that has become “0” in more scale factor bands. The quantization result of can be restored as shown in FIG.

【0148】すなわち、第2の量子化部153は、第1
の量子化部151の量子化結果が図16(b)のように
なるスペクトルデータにつき、それらのスペクトル値
を、図13に示した変換部121又は図14に示した逆
量子化部155から取得し、符号化装置102と復号化
装置202との間であらかじめ定めたスケールファクタ
ーを用いて量子化を行うとともに、その量子化結果を、
より短いビット量で表し、第2の符号化部154に出力
する。このように、第2の量子化部153では、符号
化装置102と復号化装置202との間であらかじめ定
めたスケールファクター及び関数を用いることによっ
て、これらのスケールファクター及び関数を符号化しな
い。絶対最大スペクトルデータを量子化しない。絶
対最大スペクトルデータの前後に隣接する10サンプル
の量子化値をさらに関数表現する。これらのことによ
り、第2の符号化信号のデータ量を最低限に抑えること
ができる。
That is, the second quantizer 153
16B is obtained from the transform unit 121 shown in FIG. 13 or the inverse quantization unit 155 shown in FIG. 14 for the spectrum data for which the quantization result of the quantization unit 151 of FIG. Then, quantization is performed between the encoding device 102 and the decoding device 202 using a predetermined scale factor, and the quantization result is
It is expressed by a shorter bit amount and is output to the second encoding unit 154. As described above, the second quantizer 153 does not encode these scale factors and functions by using the scale factors and functions that are predetermined between the encoding device 102 and the decoding device 202. Never quantize absolute maximum spectral data. The quantized values of 10 samples adjacent before and after the absolute maximum spectrum data are further expressed as a function. With these, the data amount of the second coded signal can be minimized.

【0149】なお、本実施の形態においては絶対最大ス
ペクトルデータに隣接するために、第1の量子化部15
1による量子化結果が連続して「0」になったスペクト
ルデータの量子化を、第2の量子化部153においてや
り直す場合について説明したが、量子化のやり直しの対
象となるスペクトルデータは必ずしも連続していなくて
もよく、絶対最大スペクトルデータの近隣で量子化値が
「0」となっているものであれば、該当するスペクトル
データ同士は隣接していなくても上記と同様にして、復
号化されたスペクトル値の補正を行うことができる。具
体的には、第2の量子化部153は、第1の量子化部1
51の量子化結果から、絶対最大スペクトルデータの近
隣で量子化値が「0」となったスペクトルデータを、絶
対最大スペクトルデータの両側にそれぞれ5サンプル特
定し、特定されたスペクトルデータを、すでに説明した
ようにあらかじめ定めたスケールファクターを用いて量
子化を行うとともに、その量子化結果を、より短いビッ
ト量で表し、第2の符号化部154に出力する。復号化
装置202では、第1の逆量子化部252の逆量子化結
果から、絶対最大スペクトルデータの近隣で量子化値が
「0」となったスペクトルデータを、絶対最大スペクト
ルデータの両側にそれぞれ5サンプル特定し、特定され
たスペクトルデータに対応付けて、それぞれ第2の符号
化信号から復号化及び逆量子化することによって得られ
たスペクトル値を逆量子化データ合成部255に出力す
る。また、上記実施の形態においては、第2の量子化部
153は、絶対最大スペクトルデータに隣接する前後の
合計10サンプルについて量子化を行ったが、このサン
プル数は必ずしも前後各5サンプルである必要はなく、
5サンプルより多くても少なくてもよい。また、第2の
量子化部153が各フレームの符号化ビットストリーム
のデータ量に応じてサンプル数を決めてもよい。この場
合には、第2の符号化信号内に、各サンプルの量子化値
とサンプル数とを組み合わせて符号化すればよい。
In the present embodiment, the first quantizing unit 15 is provided because it is adjacent to the absolute maximum spectrum data.
Although the case where the second quantization unit 153 redoes the quantization of the spectrum data in which the quantization result by 1 is continuously “0” has been described, the spectrum data to be quantized again is not necessarily continuous. If the quantized value is "0" in the vicinity of the absolute maximum spectrum data, the corresponding spectrum data may be decoded in the same manner as above even if they are not adjacent to each other. It is possible to correct the spectral values that have been obtained. Specifically, the second quantizer 153 is the first quantizer 1
From the quantization result of 51, spectrum data having a quantized value of “0” in the vicinity of the absolute maximum spectrum data is identified by 5 samples on both sides of the absolute maximum spectrum data, and the identified spectrum data has already been described. As described above, the quantization is performed using the predetermined scale factor, and the quantization result is represented by a shorter bit amount and output to the second encoding unit 154. In the decoding device 202, from the dequantization result of the first dequantization unit 252, the spectrum data having a quantized value of “0” in the vicinity of the absolute maximum spectrum data is provided on both sides of the absolute maximum spectrum data, respectively. Five samples are specified, and the spectrum values obtained by decoding and dequantizing the second encoded signal are output to the dequantized data combining unit 255 in association with the specified spectrum data. Further, in the above embodiment, the second quantizer 153 quantizes a total of 10 samples before and after the absolute maximum spectrum data, but the number of samples need not necessarily be 5 samples before and 5 samples after. Not,
It may be more or less than 5 samples. Further, the second quantizing unit 153 may determine the number of samples according to the data amount of the coded bitstream of each frame. In this case, the quantized value of each sample and the number of samples may be combined and coded in the second coded signal.

【0150】また、本実施の形態においては、第2の符
号化信号として伝送される量子化値に対応するスケール
ファクターを、予め定めた値にしたが、スケールファク
ターバンドごとに最適なスケールファクター値を計算
し、第2の符号化信号に付加して伝送してもよい。例え
ば、量子化値の最大値が「7」となる様にスケールファ
クターを選択すれば、量子化値の伝送に必要なデータ量
がより少なくて済むという効果がある。
Further, in the present embodiment, the scale factor corresponding to the quantized value transmitted as the second coded signal is set to a predetermined value, but the optimum scale factor value is set for each scale factor band. May be calculated and added to the second encoded signal for transmission. For example, if the scale factor is selected so that the maximum quantized value is “7”, there is an effect that the amount of data required to transmit the quantized value can be smaller.

【0151】なお、本実施の形態においては、第2の符
号化信号内に第2の量子化部153による量子化値の
み、または量子化値とスケールファクターのみを符号化
したが、これに限ったものでなくてよい。すなわち、符
号化装置102において、各スケールファクターバンド
の絶対最大スペクトルデータの前後に隣接する10サン
プルの量子化値がすべて「0」になった場合、所定のス
ケールファクターを用いて量子化を行うとともに、この
上さらに、実施の形態1で説明した高域部スペクトルを
表す補助情報を生成し、第2の量子化部153の量子化
結果と補助情報とを組み合わせて符号化するようにして
もよい。この場合、高域部の量子化値及びスケールファ
クターを伝送せず、復号化装置202において前記補助
情報に基づき高域部スペクトルデータを復元する。な
お、SHORTブロックにおける補助情報については図
9、図10及び実施の形態1のなお書きにおいて説明し
たが、LONGブロックについても同様にして補助情報
を生成することができる。ただし、ここではLONGブ
ロックであるので、高域部と低域部とをサンプル数が半
分の位置で区切るとするとSHORTブロックでは高域
部64サンプルのところ、LONGブロックでは高域部
512サンプルにつき補助情報を生成する。また、スケ
ールファクターバンドもLONGブロックのスケールフ
ァクターバンドに従う。このようにすれば、高域部の量
子化値及びスケールファクターの分だけ、符号化ビット
ストリームのデータ量をさらに低減することができると
いう効果がある。
In this embodiment, only the quantized value by the second quantizing section 153 or only the quantized value and the scale factor are coded in the second coded signal, but the present invention is not limited to this. It doesn't have to be a thing. That is, in the encoding apparatus 102, when all the quantized values of 10 samples adjacent before and after the absolute maximum spectrum data of each scale factor band become “0”, the quantization is performed using a predetermined scale factor. Further, the auxiliary information representing the high frequency band spectrum described in the first embodiment may be generated, and the quantization result of the second quantization unit 153 and the auxiliary information may be combined and encoded. . In this case, the quantization value and the scale factor of the high frequency band are not transmitted, and the decoding device 202 restores the high frequency band spectrum data based on the auxiliary information. Although the auxiliary information in the SHORT block has been described in FIGS. 9 and 10 and the rewriting of the first embodiment, the auxiliary information can be similarly generated in the LONG block. However, since it is a LONG block here, if the high-frequency part and the low-frequency part are divided at a position where the number of samples is half, 64 blocks of the high-frequency part in the SHORT block and 512 samples of the high-frequency part in the LONG block are supplemented. Generate information. Further, the scale factor band also follows the scale factor band of the LONG block. By doing so, there is an effect that the data amount of the encoded bit stream can be further reduced by the quantization value and the scale factor in the high frequency band.

【0152】なおこの補助情報としては、各スケールフ
ァクターバンドに1つの補助情報を生成しているが、2
つ以上のスケールファクターバンド毎に1つの補助情報
を生成してもよいし、1つのスケールファクターバンド
に2つ以上の補助情報を生成してもよい。なお本実施例
における補助情報は、チャンネル毎に補助情報を符号化
してもよいし、2つ以上のチャンネルに対して1つの補
助情報を符号化してもよい。
As this auxiliary information, one auxiliary information is generated for each scale factor band.
One piece of auxiliary information may be generated for each of two or more scale factor bands, or two or more pieces of auxiliary information may be generated for one scale factor band. The auxiliary information in this embodiment may be encoded for each channel, or one auxiliary information may be encoded for two or more channels.

【0153】なおこの場合において、補助情報に基づい
て高域部スペクトルを復元する際に、低域側のスペクト
ルデータを高域側のスペクトルデータとしてコピーして
いるが、これに限らず、高域側のスペクトルデータは第
2の符号化信号のみから生成してもよい。また本実施例
における符号化装置及び復号化装置の構成は、従来の符
号化装置に第2の量子化部及び第2の符号化部を追加
し、かつ、復号化装置に第2の復号化部及び第2の逆量
子化部を追加しただけのものであるため、既存の符号化
装置及び復号化装置を大幅に変更することなく実現する
ことができる。
In this case, when the high frequency band spectrum is restored based on the auxiliary information, the low frequency band spectrum data is copied as the high frequency band spectrum data, but the present invention is not limited to this. The side spectral data may be generated only from the second coded signal. In addition, the configurations of the encoding device and the decoding device in the present embodiment are such that the second quantizing unit and the second encoding unit are added to the conventional encoding device, and the second decoding is performed in the decoding device. Since it is merely the addition of the section and the second dequantization section, it can be realized without significantly changing the existing coding apparatus and decoding apparatus.

【0154】なお本実施例においては従来技術としてM
PEG−2 AACを例に挙げて説明したが、他の音響
符号化方式にも適用できるし、既存しない新しい音響符
号化方式にも適用できることは明らかである。なお本実
施例においても、実施の形態1と同様、図4(b)の様
に第2の符号化信号を第1の符号化信号の後に付加して
もよく、また、図4(c)のようにヘッダ情報の直後に
第2の符号化信号を付加してもよい。ただし、本実施の
形態の場合、LONGブロックであるので、1フレーム
分の第1の符号化信号は1024サンプルの音響信号に
対応している。このようにしておくことによって、従来
の復号化装置400においてもこの符号化ビットストリ
ームを支障なく再生することができる。また第1の符号
化信号の中に第2の符号化信号を組み込んでもよいし、
ヘッダ情報に組み込んでもよいし、それらの組み込みの
ために連続した領域を確保しなくてもよい。またこれら
に限ったものでなくてもよい。図4(a)の様にヘッダ
情報と符号化情報の中に非連続に第2の符号化信号を組
み込んだ場合のデータ配置図を示す。また、図5のよう
に第2の符号化信号を、第1の符号化信号を格納したビ
ットストリームとは全く別のストリームに格納してもよ
い。このようにすることにより、入力音響信号の基本的
な部分を予め伝送又は蓄積しておき、必要に応じて高域
情報を後から付加することができるという効果がある。
In this embodiment, M is used as a conventional technique.
Although the PEG-2 AAC has been described as an example, it is apparent that the present invention can be applied to other acoustic coding schemes and to new acoustic coding schemes that do not exist. Also in this embodiment, as in the first embodiment, the second coded signal may be added after the first coded signal as shown in FIG. 4B, and FIG. As described above, the second coded signal may be added immediately after the header information. However, in the case of the present embodiment, since it is a LONG block, the first coded signal for one frame corresponds to an acoustic signal of 1024 samples. By doing so, even in the conventional decoding device 400, this coded bit stream can be reproduced without any trouble. Also, the second coded signal may be incorporated into the first coded signal,
It may be embedded in the header information, or a continuous area may not be secured for the incorporation. Further, it is not limited to these. FIG. 4A is a data layout diagram when the second coded signal is discontinuously incorporated in the header information and the coded information as shown in FIG. Further, as shown in FIG. 5, the second coded signal may be stored in a completely different stream from the bit stream in which the first coded signal is stored. By doing so, there is an effect that the basic part of the input audio signal can be transmitted or accumulated in advance, and the high frequency information can be added later if necessary.

【0155】なお本実施例においては、量子化部及び符
号化部は2つとしたが、これに限定されるものではな
く、3つ以上の量子化部及び復号化部を備えてもよい。
なお本実施例においては、復号化部及び逆量子化部は2
つとしたが、これに限定されるものではなく、3つ以上
の復号化部及び逆量子化部を備えてもよい。
In the present embodiment, the number of quantizers and encoders is two, but the number of quantizers and decoders is not limited to this, and three or more quantizers and decoders may be provided.
In the present embodiment, the decoding unit and the dequantization unit are 2
However, the present invention is not limited to this, and three or more decoding units and inverse quantization units may be provided.

【0156】以上の処理は、ハードウェアで実現するこ
とはもちろん、ソフトウェアでも実現でき、また、一部
をハードウェアで実現し、残りをソフトウェアで実現す
るという構成でも実施できる。
The above processing can be realized not only by hardware but also by software, or by a structure in which a part is realized by hardware and the rest is realized by software.

【0157】なお、本発明の符号化装置100、10
1、102は、コンテンツを配信する配信システムの放
送局側に備えられ、本発明の復号化装置200、20
1、202を備える受信装置に、音響信号として本発明
の音響符号化ビットストリームを出力するとしてもよ
い。
The coding devices 100 and 10 of the present invention are as follows.
1, 102 are provided on the broadcasting station side of a distribution system for distributing contents, and are decoding devices 200, 20 of the present invention.
The audio coded bitstream of the present invention may be output as an audio signal to the receiving device including the elements 1 and 202.

【0158】[0158]

【発明の効果】以上のように本発明の符号化装置によれ
ば、変換手段は、入力された音響信号を符号化する符号
化装置であって、入力音響信号を一定時間ごとに切り出
して周波数スペクトルに変換することにより、1フレー
ム時間ごとに、スペクトルデータの集合からなる組を複
数個生成する。前記共有判定手段は、前記変換手段によ
って得られた前記組同士を比較し、それら組同士のスペ
クトルが所定の判断基準を満たす範囲で相似する場合、
一方の組の高域部のスペクトルデータを他方の組におい
て共有すると判定する。置換手段は、高域部スペクトル
データを共有すると判定された前記他方の組につき、そ
の組の高域部スペクトルデータを所定値に置換する。第
1量子化手段は、前記置換手段による置換処理の後、前
記各組のスペクトルデータを量子化する。第1符号化手
段は、前記第1量子化手段による量子化結果を符号化す
る。出力手段は、前記第1符号化手段によって符号化さ
れたデータを出力する。
As described above, according to the coding apparatus of the present invention, the conversion means is a coding apparatus for coding the input acoustic signal, and the input acoustic signal is cut out at regular intervals to obtain the frequency. By converting into a spectrum, a plurality of sets each consisting of a set of spectrum data are generated every one frame time. The sharing determination means compares the pairs obtained by the conversion means, and when the spectra of the pairs are similar to each other in a range satisfying a predetermined determination criterion,
It is determined that the high band spectral data of one set is shared by the other set. The replacing means replaces the high band spectral data of the other set with a predetermined value for the other set determined to share the high band spectral data. The first quantizing means quantizes the spectral data of each set after the replacement processing by the replacing means. The first encoding means encodes the quantization result obtained by the first quantization means. The output means outputs the data encoded by the first encoding means.

【0159】従って、変換手段が、1フレーム時間ごと
に、スペクトルデータの集合からなる組を複数個生成す
る場合、本来的に、切り出しにおいて時間的に隣接する
組同士ではスペクトルが相似する可能性が高い。これに
対し、本発明の符号化装置においては、共有判定手段に
よる判定に基づいて、互いに相似する前記他方の組につ
いては、高域部スペクトルデータを量子化及び符号化せ
ず、前記一方の組の高域部スペクトルデータを代用す
る。具体的には、前記他方の組につき、その組の高域部
スペクトルデータを所定値に置換してしまう。この所定
値を例えば「0」とすると、その部分の量子化及び符号
化の処理を簡略化することができるとともに、高域部の
符号化データの量を大幅に削減することができるという
効果がある。
Therefore, when the conversion means generates a plurality of sets each consisting of a set of spectrum data for each frame time, there is a possibility that the spectra are originally similar to each other in the temporally adjacent sets. high. On the other hand, in the encoding device of the present invention, based on the determination by the sharing determination means, for the other set that is similar to each other, the high band spectrum data is not quantized and encoded, and the one set is not set. Substitute the high-frequency spectrum data of. Specifically, for the other set, the high frequency band spectrum data of that set is replaced with a predetermined value. If this predetermined value is set to, for example, "0", the quantization and coding processing of that portion can be simplified, and the amount of coded data in the high frequency region can be significantly reduced. is there.

【0160】これに対応して、本発明の復号化装置によ
れば、判定手段は、前記第1逆量子化手段の逆量子化結
果を監視し、前記第1逆量子化手段によって出力された
高域部スペクトルデータの値が所定値となっている場
合、その組を前記他方の組であると判定する。第2逆量
子化手段は、前記判定手段の判定に基づいて、前記第1
逆量子化手段の逆量子化結果から前記一方の組の高域部
を表すスペクトルデータをコピーし、コピーしたスペク
トルデータを前記他方の組に対応付けて出力する。音響
信号出力手段は、前記第1逆量子化手段によって出力さ
れた高域部スペクトルデータであって、第2逆量子化手
段によって対応付けられている組の高域部スペクトルデ
ータの値を、前記第2逆量子化手段によって出力された
高域部スペクトルデータの値で置換した後、逆変換し、
時間軸上の音響信号として出力する。これにおいて、第
2逆量子化手段は、前記判定手段の判定に基づいて、前
記一方の組の高域部を表すスペクトルデータをコピー
し、コピーしたスペクトルデータを前記他方の組に対応
付けて出力する。
In response to this, according to the decoding apparatus of the present invention, the judging means monitors the dequantization result of the first dequantizing means and outputs it by the first dequantizing means. When the value of the high frequency band spectrum data is a predetermined value, the set is determined to be the other set. The second dequantization means is based on the judgment of the judgment means,
From the dequantization result of the dequantization means, the spectrum data representing the high frequency part of the one set is copied, and the copied spectrum data is output in association with the other set. The acoustic signal output means outputs the value of the high frequency band spectrum data of the set which is the high frequency band spectrum data output by the first dequantization means and which is associated by the second dequantization means. After substituting with the value of the high frequency band spectrum data output by the second inverse quantizing means, inverse transformation is performed,
Output as an acoustic signal on the time axis. In this, the second dequantization means copies the spectrum data representing the high frequency part of the one set based on the determination of the determination means, and outputs the copied spectrum data in association with the other set. To do.

【0161】これによって、本発明の復号化装置におい
ては、1フレームに付き、少なくとも一組分の高域部デ
ータを入力し、それを前記判定手段の判定に基づいて、
前記他方の組にコピーすることによって復元することが
できるので、従来に比べて、より高域部の豊かな高音質
な音響信号を再生することができるという効果がある。
As a result, in the decoding device of the present invention, at least one set of high frequency band data is input for one frame, and based on the judgment of the judgment means,
Since the data can be restored by copying it to the other set, there is an effect that it is possible to reproduce a high-quality sound signal having a richer high frequency band as compared with the related art.

【0162】また、本発明の符号化装置によれば、前記
共有判定手段は、前記組同士のスペクトルが所定の判断
基準を満たす範囲で相似する場合に、前記一方の組の高
域部に加えてさらに低域部のスペクトルデータを、他方
の組において共有すると判定し、前記置換手段は、スペ
クトルデータを共有すると判定された前記他方の組につ
き、入力されるその組の高域部に加えてさらに低域部の
スペクトルデータを所定値に置換する。
Further, according to the encoding device of the present invention, the sharing determination means adds to the high-frequency part of the one set when the spectra of the sets are similar to each other in a range satisfying a predetermined determination criterion. Furthermore, it is determined that the spectrum data of the low frequency part is shared by the other pair, and the replacing means adds the high frequency part of the pair for the other pair determined to share the spectrum data. Further, the spectrum data in the lower frequency band is replaced with a predetermined value.

【0163】従って、前記組同士のスペクトルが所定の
判断基準を満たす範囲で相似する場合には、高域部に加
えてさらに低域部のスペクトルデータを所定値に置換す
るので、この所定値を例えば「0」とすると、その部分
の量子化及び符号化の処理を簡略化することができると
ともに、音響信号の符号化データの量を、低域部の分ま
で、より大幅に削減することができるという効果があ
る。
Therefore, when the spectra of the pairs are similar to each other within a range satisfying a predetermined judgment criterion, the spectrum data of the low band part in addition to the high band part is replaced with a predetermined value. For example, when it is set to “0”, the quantization and coding process of that part can be simplified, and the amount of coded data of the acoustic signal can be significantly reduced to the low frequency part. The effect is that you can do it.

【0164】これに対応して、本発明の復号化装置にお
いて、第1復号化手段は、入力符号化データ中の前記第
1符号化手段によって符号化されたデータを復号化す
る。第1逆量子化手段は、第1復号化手段の復号化結果
を逆量子化し、前記各組のスペクトルデータを出力す
る。判定手段は、前記第1逆量子化手段の逆量子化結果
を監視し、前記第1逆量子化手段によって出力された全
スペクトルデータの値が所定値となっている場合、その
組を前記他方の組であると判定する。第2逆量子化手段
は、前記判定手段の判定に基づいて、前記第1逆量子化
手段の逆量子化結果から前記一方の組の全スペクトルデ
ータをコピーし、コピーしたスペクトルデータを前記他
方の組に対応付けて出力する。音響信号出力手段は、前
記第1逆量子化手段によって出力されたスペクトルデー
タであって、第2逆量子化手段によって対応付けられて
いる組の全スペクトルデータの値を、前記第2逆量子化
手段によって出力されたスペクトルデータの値で置換し
た後、逆変換し、時間軸上の音響信号として出力する。
Correspondingly, in the decoding device of the present invention, the first decoding means decodes the data encoded by the first encoding means in the input encoded data. The first dequantization means dequantizes the decoding result of the first decoding means and outputs the spectrum data of each set. The determination means monitors the dequantization result of the first dequantization means, and if the value of all the spectrum data output by the first dequantization means is a predetermined value, the set is set to the other one. It is determined to be a set of. The second dequantization means copies all the spectrum data of the one set from the dequantization result of the first dequantization means based on the judgment of the judgment means, and the copied spectrum data of the other set. Output in association with the set. The acoustic signal output means outputs the spectrum data outputted by the first dequantization means, and the values of all the spectrum data of the set associated by the second dequantization means, by the second dequantization. After replacing with the value of the spectrum data output by the means, it is inversely transformed and output as an acoustic signal on the time axis.

【0165】従って、本発明の復号化装置によれば、1
フレームに付き、少なくとも一組分の全域データを入力
し、それを前記判定手段の判定に基づいて、前記他方の
組にコピーすることによって復元するので、従来に比べ
て、低域部は所定の判断基準の範囲によって多少の誤差
を生じるが、1フレームに付き、少なくとも一組分入力
される高域部データに基づいて、より高域部の豊かな高
音質な音響信号を再生することができるという効果があ
る。
Therefore, according to the decoding apparatus of the present invention, 1
Since at least one set of whole-area data is input to the frame and is restored by copying it to the other set based on the judgment of the judging means, the low-frequency part has a predetermined value as compared with the conventional one. Although some errors occur depending on the range of the judgment standard, it is possible to reproduce a high-quality sound signal rich in the higher frequency band based on the high frequency band data input for at least one set per frame. There is an effect.

【0166】さらに、本発明の符号化装置において、変
換手段は、入力音響信号を一定時間ごとに切り出して周
波数スペクトルに変換する。第1量子化手段は、前記変
換手段によって得られたスペクトルデータを量子化す
る。第2量子化手段は、前記第1量子化手段に入力され
たスペクトルデータのうち、第1量子化手段において、
スペクトルのピークに隣接したスペクトルデータの量子
化結果が連続して所定値となったものを所定の正規化係
数を用いて量子化し直す。第1符号化手段は、前記第1
量子化手段の量子化結果を符号化する。第2符号化手段
は、前記第2量子化手段の量子化結果を符号化する。出
力手段とを前記第1符号化手段によって符号化されたデ
ータは、前記第2符号化手段によって符号化されたデー
タとを出力する。
Further, in the encoding apparatus of the present invention, the conversion means cuts out the input acoustic signal at regular time intervals and converts it into a frequency spectrum. The first quantizing means quantizes the spectrum data obtained by the converting means. The second quantizing means, in the spectral data input to the first quantizing means, in the first quantizing means,
When the quantization result of the spectrum data adjacent to the peak of the spectrum has a predetermined value continuously, it is re-quantized using a predetermined normalization coefficient. The first encoding means is the first
The quantization result of the quantization means is encoded. The second encoding means encodes the quantization result of the second quantization means. The data encoded by the first encoding means by the output means outputs the data encoded by the second encoding means.

【0167】従って、本発明の符号化装置によれば、第
2量子化手段が、第1量子化手段において、スペクトル
のピークに隣接したスペクトルデータの量子化結果が連
続して所定値となったものを所定の正規化係数を用いて
量子化し直すので、ピークに隣接したスペクトルデータ
の量子化結果を、所定値で連続しない値に量子化し直す
ことができる。すなわち、ピークに隣接するスペクトル
データの量子化誤差を、第2量子化手段の量子化によっ
て補正することができるという効果がある。
Therefore, according to the encoding apparatus of the present invention, the second quantizing means continuously quantizes the spectrum data adjacent to the peak of the spectrum to the predetermined value in the first quantizing means. Since the thing is re-quantized using a predetermined normalization coefficient, the quantization result of the spectrum data adjacent to the peak can be re-quantized to a value which is not continuous at a predetermined value. That is, there is an effect that the quantization error of the spectrum data adjacent to the peak can be corrected by the quantization of the second quantization means.

【0168】これに対応して、本発明の復号化装置にお
いて、符号化データ分離手段は、入力符号化データか
ら、前記第2符号化手段によって符号化されたデータを
分離する。第1復号化手段は、入力符号化データ中の前
記第1符号化手段によって符号化されたデータを復号化
する。第1逆量子化手段は、前記第1復号化手段の復号
化結果を逆量子化し、前記各バンドのスペクトルデータ
を出力する。第2復号化手段は、前記第2符号化手段に
よって符号化されたデータを復号化する。第2逆量子化
手段は、前記第2復号化手段の復号化結果を所定の正規
化係数を用いて逆量子化し、前記各バンドにおいてピー
クとなるスペクトルデータに隣接したため、前記第1量
子化手段による量子化結果が所定値となった連続するス
ペクトルデータを復元する。音響信号出力手段は、前記
第1逆量子化手段によって出力されたスペクトルデータ
のうち、前記バンドごとに、1スペクトルデータの前後
に隣接し、かつ、いずれも連続して所定値となる複数の
スペクトルデータの値を、前記第2逆量子化手段によっ
て復元されたスペクトルデータの値で置換した後、逆変
換し、時間軸上の音響信号として出力する。
Correspondingly, in the decoding device of the present invention, the encoded data separating means separates the data encoded by the second encoding means from the input encoded data. The first decoding means decodes the data encoded by the first encoding means in the input encoded data. The first dequantization means dequantizes the decoding result of the first decoding means and outputs the spectrum data of each band. The second decoding means decodes the data encoded by the second encoding means. The second dequantization means dequantizes the decoding result of the second decoding means using a predetermined normalization coefficient, and since it is adjacent to the spectrum data having a peak in each band, the first quantization means Then, the continuous spectrum data whose quantization result is a predetermined value is restored. The acoustic signal output means includes a plurality of spectra which are adjacent to each other before and after one spectrum data of the spectrum data output by the first dequantization means, and each of which continuously has a predetermined value. The data value is replaced with the value of the spectrum data restored by the second inverse quantization means, and then inversely transformed and output as an acoustic signal on the time axis.

【0169】従って、本発明の復号化装置によれば、第
2逆量子化手段は、前記各バンドにおいてピークとなる
スペクトルデータに隣接したため、前記第1量子化手段
による量子化結果が所定値となった連続するスペクトル
データを復元するので、ピークに隣接するスペクトルデ
ータの量子化誤差を、第2量子化手段の量子化によって
補正することができる。この結果、音響信号の再生帯域
の全域において、スペクトルのピーク周辺の音響信号
を、より原音に忠実に再生することができるという効果
がある。
Therefore, according to the decoding device of the present invention, since the second dequantization means is adjacent to the spectrum data having the peak in each band, the quantization result by the first quantization means has a predetermined value. Since the lost continuous spectrum data is restored, the quantization error of the spectrum data adjacent to the peak can be corrected by the quantization of the second quantization means. As a result, there is an effect that the acoustic signal around the peak of the spectrum can be reproduced more faithfully to the original sound in the entire reproduction band of the acoustic signal.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の符号化装置及び復号化装置の構成を示
すブロック図である。
FIG. 1 is a block diagram showing configurations of an encoding device and a decoding device according to the present invention.

【図2】図1に示した符号化装置において処理される音
響信号の変換過程を示す図である。
FIG. 2 is a diagram showing a conversion process of an acoustic signal processed in the encoding device shown in FIG.

【図3】図1に示した共有判定部による高域部データの
共有の一例を示す図である。
FIG. 3 is a diagram showing an example of sharing of high frequency band data by a sharing determination unit shown in FIG. 1.

【図4】図1に示したストリーム出力部によって第2の
符号化信号(共有情報)が格納されるビットストリーム
のデータ構造を示す図である。
FIG. 4 is a diagram showing a data structure of a bitstream in which a second encoded signal (shared information) is stored by the stream output unit shown in FIG.

【図5】図1に示したストリーム出力部によって第2の
符号化信号(共有情報)が格納されるビットストリーム
の他のデータ構造を示す図である。
5 is a diagram showing another data structure of a bitstream in which a second encoded signal (shared information) is stored by the stream output unit shown in FIG.

【図6】図1に示した第1の量子化部のスケールファク
ター決定処理における動作を示すフローチャートであ
る。
FIG. 6 is a flowchart showing an operation in a scale factor determination process of the first quantizer shown in FIG.

【図7】図1に示した共有判定部の1フレームの共有判
定処理における動作の一例を示すフローチャートであ
る。
7 is a flowchart showing an example of an operation in a one-frame sharing determination process of the sharing determination unit shown in FIG.

【図8】図1に示した第2の逆量子化部の高域部スペク
トルデータのコピー処理における動作を示すフローチャ
ートである。
8 is a flowchart showing an operation in a copy process of high frequency band spectrum data of the second dequantization unit shown in FIG. 1. FIG.

【図9】図1に示した共有判定部によってSHORTブ
ロックの1ウィンドウにつき生成される補助情報(スケ
ールファクター)の具体例を示すスペクトル波形図であ
る。
9 is a spectrum waveform diagram showing a specific example of auxiliary information (scale factor) generated for one window of a SHORT block by the sharing determination unit shown in FIG.

【図10】図1に示した共有判定部の補助情報(スケー
ルファクター)計算処理における動作を示すフローチャ
ートである。
10 is a flowchart showing an operation in auxiliary information (scale factor) calculation processing of a sharing determination unit shown in FIG.

【図11】符号化装置及び復号化装置の構成を示すブロ
ック図である。
FIG. 11 is a block diagram showing configurations of an encoding device and a decoding device.

【図12】図11に示した共有判定部によるスペクトル
データの共有の一例を示す図である。
12 is a diagram showing an example of sharing of spectrum data by a sharing determination unit shown in FIG.

【図13】本発明の符号化装置及び復号化装置の構成を
示すブロック図である。
FIG. 13 is a block diagram showing the configurations of an encoding device and a decoding device according to the present invention.

【図14】符号化装置及び復号化装置の他の構成を示す
ブロック図である。
FIG. 14 is a block diagram showing another configuration of the encoding device and the decoding device.

【図15】従来の符号化装置と本発明の符号化装置との
量子化結果の違いを具体値を用いて示すテーブルであ
る。
FIG. 15 is a table showing the difference in quantization result between the conventional encoding device and the encoding device of the present invention using concrete values.

【図16】符号化装置によるピーク周辺の量子化誤差の
補正の一例を示す図である。
FIG. 16 is a diagram showing an example of correction of a quantization error around a peak by the encoding device.

【図17】従来のMPEG−2 AAC方式による符号
化装置及び復号化装置の構成を示すブロック図である。
FIG. 17 is a block diagram showing a configuration of a conventional MPEG-2 AAC encoding device and decoding device.

【符号の説明】[Explanation of symbols]

100 符号化装置 110 音響信号入力部 120 変換部 131 第1の量子化部 132 第1の符号化部 134 第2の符号化部 137 共有判定部 140 ストリーム出力部 200 復号化装置 210 ストリーム入力部 221 第1の復号化部 222 第1の逆量子化部 223 第2の復号化部 224 第2の逆量子化部 225 逆量子化データ合成部 230 逆変換部 240 音響信号出力部 100 encoder 110 Acoustic signal input section 120 converter 131 First Quantizer 132 first encoding unit 134 Second Encoding Unit 137 Sharing determination unit 140 stream output section 200 Decoding device 210 Stream input section 221 First Decoding Unit 222 First dequantization unit 223 second decoding unit 224 Second dequantization unit 225 Dequantized Data Synthesis Unit 230 Inverse converter 240 Acoustic signal output section

【手続補正書】[Procedure amendment]

【提出日】平成15年1月10日(2003.1.1
0)
[Submission date] January 10, 2003 (2003.1.1
0)

【手続補正1】[Procedure Amendment 1]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】特許請求の範囲[Name of item to be amended] Claims

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【特許請求の範囲】[Claims]

【手続補正2】[Procedure Amendment 2]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0018[Correction target item name] 0018

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0018】[0018]

【課題を解決するための手段】上記課題に鑑みて、本発
明の符号化装置は、入力された音響信号を符号化する符
号化装置であって、入力音響信号を一定時間ごとに切り
出して周波数スペクトルに変換することにより、1フレ
ーム時間ごとに、周波数スペクトルの時間変化を示す
のウィンドウからなるショートブロックスペクトルを
生成する変換手段と、前記変換手段によって得られた前
ウィンドウ同士を比較し、それらウィンドウ同士のス
ペクトルが所定の判断基準を満たす範囲で相似するか否
かを判定する共有判定手段と、前記ウィンドウ同士のス
ペクトルが前記範囲内で相似する場合、他のウィンドウ
高域部スペクトルを共有する共有ウィンドウにつき、
その共有ウィンドウの高域部スペクトルデータを所定値
に置換する置換手段と、前記置換手段による置換処理の
後、前記各ウィンドウのスペクトルデータを量子化する
第1量子化手段と、前記第1量子化手段による量子化結
果を符号化する第1符号化手段と、前記第1符号化手段
によって符号化されたデータを出力する出力手段とを備
えることを特徴とする。
In view of the above-mentioned problems, an encoding apparatus of the present invention is an encoding apparatus for encoding an input acoustic signal, the input acoustic signal being cut out at regular intervals to obtain a frequency. A conversion means for generating a short block spectrum composed of a plurality of windows showing a time change of the frequency spectrum by converting into a spectrum, and the conversion means obtains the short block spectrum. comparing the window together, whether spectrum thereof windows each other to similar in the range satisfying the predetermined criteria
A shared determination means for determining whether said window between the scan
If the vectors are similar within the above range, another window
With regard to the shared window to share the high-frequency band spectrum of,
Replacement means for replacing the high frequency band spectrum data of the shared window with a predetermined value, first quantization means for quantizing the spectrum data of each window after the replacement processing by the replacement means, and the first quantization. It is characterized by further comprising: first encoding means for encoding the quantization result by the means, and output means for outputting the data encoded by the first encoding means.

【手続補正3】[Procedure 3]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0019[Correction target item name] 0019

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0019】これに対応して、本発明の復号化装置は、
音響信号を表した入力符号化データを復号化する復号化
装置であって、前記入力符号化データ中の第1の領域に
記録されている第1符号化データを復号化する第1復号
化手段と、前記第1復号化手段による復号化結果を逆量
子化し、1フレーム時間ごとに、周波数スペクトルの時
間変化を示す複数のショートブロックスペクトルを出力
する第1逆量子化手段と、前記第1逆量子化手段による
逆量子化結果を監視し、前記第1逆量子化手段によって
出力された前記ウィンドウのうち、周波数高域部スペ
クトルデータの値が所定値となっている場合、そのウィ
ンドウを、ウィンドウ内の高域部スペクトルデータを他
のウィンドウの高域部スペクトルデータを参照して生成
する参照ウィンドウであると判定する判定手段と、前記
判定手段の判定に基づいて、前記第1逆量子化手段によ
逆量子化結果から前記参照ウィンドウに参照される
ウィンドウである被参照ウィンドウの高域部スペクトル
データをコピーし、コピーしたスペクトルデータを前記
参照ウィンドウに対応付けて出力する第2逆量子化手段
と、前記第1逆量子化手段によって出力された前記所定
値の高域部スペクトルデータであって、前記参照ウィン
ドウの高域部スペクトルデータの値を、前記第2逆量子
化手段によって対応付けられ出力された前記被参照ウィ
ンドウの高域部スペクトルデータの値で置換した後、逆
変換し、時間軸上の音響信号として出力する音響信号出
力手段とを備えることを特徴とする。
In response to this, the decoding apparatus of the present invention is
A decoding device for decoding input coded data representing an acoustic signal , comprising: a first area in the input coded data;
A first decoding means for decoding the first encoded data that is recorded, the decoding results by the first decoding means and inverse quantization, every one frame time, when the frequency spectrum
First dequantizing means for outputting a plurality of short block spectra showing inter-change, and a result of dequantizing by the first dequantizing means is monitored and output by the first dequantizing means. among the windows were, when the value of the space <br/> Kutorudeta frequency higher band has become a predetermined value, the WE
The high frequency spectrum data in the window
Generated by referring to the high band spectral data of the window
Determining means for determining that the reference window is a reference window to be used, and the first dequantizing means based on the determination by the determining means .
From the inverse quantization result , the reference window is referenced.
Copy the high frequency spectrum data of the referenced window , which is the window , and copy the spectrum data
A second inverse quantization means for outputting in association with the reference window, the predetermined output by the first inverse quantization means
A higher frequency band spectrum data value, the reference Win
The value of the high frequency band spectrum data of the dough is associated with the second dequantization means and output by the referenced wave.
After replacing with the value of the high frequency band spectrum data of the window , it is inversely transformed and is output as an acoustic signal on the time axis.

【手続補正4】[Procedure amendment 4]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0020[Correction target item name] 0020

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0020】また、本発明の符号化装置によれば、前記
共有判定手段は、前記ウィンドウ同士のスペクトルが所
定の判断基準を満たす範囲で相似するか否かを判定し、
前記置換手段は、前記ウィンドウ同士のスペクトルが前
記範囲内で相似する場合、他のウィンドウの高域部スペ
クトルを共有する共有ウィンドウにつき、その共有ウィ
ンドウのさらに低域部のスペクトルデータを所定値に置
換する。
Further, according to the encoding device of the present invention, the sharing determination means determines whether or not the spectra of the windows are similar to each other within a range satisfying a predetermined determination criterion,
The replacement means is arranged such that the spectrum between the windows is
When similar in the range, the high frequency range of other windows
For each sharing window that shares the story,
Spectral data of the further low-frequency portion of the window substituted to a predetermined value.

【手続補正5】[Procedure Amendment 5]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0021[Correction target item name] 0021

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0021】これに対応して、本発明の復号化装置にお
いて、前記判定手段は、前記第1逆量子化手段によって
出力された前記各ウィンドウにおいて全スペクトルデー
タの値が所定値となっている場合、そのウィンドウを前
参照ウィンドウであると判定し、前記第2逆量子化手
段は、前記判定手段による判定に基づいて、前記第1逆
量子化手段の逆量子化結果から、所定の前記被参照ウィ
ンドウさらに低域部を含んだ全スペクトルデータをコ
ピーし、コピーしたスペクトルデータを前記参照ウィン
ドウに対応付けて出力し、前記音響信号出力手段は、前
記参照ウィンドウの全スペクトルデータの値を、前記第
2逆量子化手段によって対応付けられ出力された前記被
参照ウィンドウのスペクトルデータの値で置換した後、
逆変換し、時間軸上の音響信号として出力する。
Correspondingly, in the decoding device of the present invention, the determining means is such that the values of all spectrum data in each of the windows output by the first dequantizing means are predetermined values. , The window is determined to be the reference window , and the second dequantizer
The stage , based on the determination by the determining means , determines the predetermined referenced wave from the dequantization result of the first dequantizing means.
All spectral data including the low-frequency part of the window are copied, and the copied spectral data is used for the reference window.
Output in association with the dough , the acoustic signal output means,
The values of all the spectrum data in the reference window are associated with the second dequantization means and output by the output target.
After substituting with the values of the spectral data in the reference window ,
Inverse transform, you output as an acoustic signal on the time axis.

【手続補正6】[Procedure correction 6]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0022[Name of item to be corrected] 0022

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0022】さらに、本発明の符号化装置は、さらに、
前記第1量子化手段に入力されたスペクトルデータのう
ち、第1量子化手段による量子化の結果、スペクトルの
ピークに近接したスペクトルデータであって量子化結果
が所定値となったものを所定の正規化係数を用いて量子
化し直す第2量子化手段と前記第2量子化手段の量子
化結果を符号化する第2符号化手段とを備え前記出力
手段は、前記第1符号化手段によって符号化されたデー
タと、前記第2符号化手段によって符号化されたデータ
とを出力する。
Further, the encoding device of the present invention further comprises:
Among the spectrum data input to the first quantizing means, the spectrum data which is close to the peak of the spectrum as a result of the quantization by the first quantizing means and has a predetermined quantizing result has a predetermined value. comprising a second quantizing means for re-quantized using the normalization factor, and a second encoding means for encoding the quantized result of the second quantization means, the output
The means outputs the data encoded by the first encoding means and the data encoded by the second encoding means.

【手続補正7】[Procedure Amendment 7]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0023[Name of item to be corrected] 0023

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0023】これに対応して、本発明の復号化装置は、
さらに、前記入力符号化データ中の第2の領域から、
じスペクトルデータについて前記第1符号化データとは
異なる所定の正規化係数を用いて量子化された第2符号
化データを分離する第2符号化データ分離手段と前記
第2符号化データを復号化する第2復号化手段と、前記
第1復号化手段による復号化結果を監視して、前記復号
化結果のうち連続して所定値となる部分を特定し、特定
された部分に対応する前記第2復号化手段による復号化
結果を、前記所定の正規化係数を用いて逆量子化し、
数のスペクトルデータを生成する第2逆量子化手段と、
前記第1逆量子化手段によって出力されたスペクトルデ
ータのうち、前記特定された部分のスペクトルデータの
値を、前記第2逆量子化手段によって生成されたスペク
トルデータの値で置換した後、逆変換し、時間軸上の音
響信号として出力する音響信号出力手段とを備える。
In response to this, the decoding device of the present invention is
Further, from the second region in the input encoded data, the
Regarding the same spectrum data, the first encoded data is
Second code quantized using different predetermined normalization coefficient
A second coded data separating means for separating data, the
A second decoding means for decoding second coded data, wherein
The decoding result by the first decoding means is monitored and the decoding is performed.
Specify the part that has a predetermined value continuously in the conversion result and specify
The decoding result by said second decoding means corresponding to the portion, and inverse quantized using said predetermined normalization factor, double
Second dequantization means for generating a number of spectral data;
After replacing the value of the spectrum data of the specified portion of the spectrum data output by the first dequantization unit with the value of the spectrum data generated by the second dequantization unit, the inverse transform is performed. And an audio signal output means for outputting as an audio signal on the time axis.

【手続補正8】[Procedure Amendment 8]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0102[Correction target item name] 0102

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0102】例えば、共有判定部138が、第1ウィン
ドウと第2ウィンドウとで第1ウィンドウのスペクトル
データを共有し、かつ、第3ウィンドウ以降のウィンド
ウでも第3ウィンドウのスペクトルデータを共有すると
判定した場合、第2ウィンドウ及び第4から第8ウィン
ドウのスペクトル値をすべて「0」にし、共有情報「0
1011111」を生成する。この結果、第1の量子化
部131において共有判定部138から出力されたスペ
クトルデータを量子化する場合に、第2ウィンドウ及び
第4から第8ウィンドウのスペクトル値がすべて「0」
であるため、従来と比べてさらに少ないデータ量で量子
化することができる。
For example, the sharing determination unit 138 determines that the first window and the second window share the spectrum data of the first window , and the windows after the third window also share the spectrum data of the third window . In this case, all the spectrum values of the second window and the fourth to eighth windows are set to “0”, and the shared information “0” is set.
1011111 ”is generated. As a result, when the spectrum data output from the sharing determination unit 138 is quantized by the first quantization unit 131, all the spectrum values of the second window and the fourth to eighth windows are “0”.
Therefore, it is possible to quantize with a smaller amount of data compared to the conventional one.

【手続補正9】[Procedure Amendment 9]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0158[Correction target item name] 0158

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0158】[0158]

【発明の効果】以上のように本発明の符号化装置は、
力された音響信号を符号化する符号化装置であって、入
力音響信号を一定時間ごとに切り出して周波数スペクト
ルに変換することにより、1フレーム時間ごとに、周波
スペクトルの時間変化を示す複数のウィンドウからな
るショートブロックスペクトルを生成する変換手段と、
前記変換手段によって得られた前記ウィンドウ同士を比
較し、それらウィンドウ同士のスペクトルが所定の判断
基準を満たす範囲で相似するか否かを判定する共有判定
手段と、前記ウィンドウ同士のスペクトルが前記範囲内
で相似する場合、他のウィンドウの高域部スペクトルを
共有する共有ウィンドウにつき、その共有ウィンドウ
高域部スペクトルデータを所定値に置換する置換手段
と、前記置換手段による置換処理の後、前記各ウィンド
のスペクトルデータを量子化する第1量子化手段と、
前記第1量子化手段による量子化結果を符号化する第1
符号化手段と、前記第1符号化手段によって符号化され
たデータを出力する出力手段とを備える
Encoding apparatus of the present invention as described above, according to the present invention, there is provided a coding apparatus for coding an input audio signal, by converting the frequency spectrum cut out an input audio signal at predetermined time intervals Frequency at every 1 frame time
It consists of several windows that show the time variation of several spectra.
A conversion means for generating a short block spectrum ,
A sharing determination that compares the windows obtained by the conversion means and determines whether the spectra of the windows are similar to each other within a range satisfying a predetermined determination criterion.
Means and the spectrum between the windows is within the range
In the case of similar, per shared window <br/> share a high frequency band spectrum of the other windows, replacement means for replacing the higher band spectrum data of the shared window to a predetermined value
If, after replacement process by the replacement section, each window
A first quantizing means for quantizing the spectral data of c .
First for encoding the quantized result of the first quantizing means
The encoding means and the output means for outputting the data encoded by the first encoding means are provided .

【手続補正10】[Procedure Amendment 10]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0159[Name of item to be corrected] 0159

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0159】従って、変換手段が、1フレーム時間ごと
に、周波数スペクトルの時間変化を示す複数のウィンド
ウからなるショートブロックスペクトルを生成する場
合、本来的に、切り出しにおいて時間的に隣接するウィ
ンドウ同士ではスペクトルが相似する可能性が高い。こ
れに対し、本発明の符号化装置においては、共有判定手
段による判定に基づいて、互いに相似する前記共有ウィ
ンドウについては、高域部スペクトルデータを量子化及
び符号化せず、前記他のウィンドウの高域部スペクトル
データを代用する。具体的には、前記共有ウィンドウ
つき、そのウィンドウの高域部スペクトルデータを所定
値に置換してしまう。この所定値を例えば「0」とする
と、その部分の量子化及び符号化の処理を簡略化するこ
とができるとともに、高域部の符号化データの量を大幅
に削減することができるという効果がある。
Therefore, the converting means is configured to display a plurality of windows indicating the time change of the frequency spectrum for each frame time.
When generating a short block spectra consisting of c inherently Wie temporally adjacent in cut
It is highly likely that spectra will be similar between windows . On the other hand, in the encoding device of the present invention, based on the judgment by the sharing judgment means, the sharing wisdom that is similar to each other is shared.
For windows , the high-frequency spectrum data is not quantized and encoded, and the high-frequency spectrum data of the other window is used instead. Specifically, per <br/> in the shared window, thus replacing the high frequency band spectrum data of the window to a predetermined value. If this predetermined value is set to, for example, "0", the quantization and coding processing of that portion can be simplified, and the amount of coded data in the high frequency region can be significantly reduced. is there.

【手続補正11】[Procedure Amendment 11]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0160[Name of item to be corrected] 0160

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0160】これに対応する本発明の復号化装置は、音
響信号を表した入力符号化データを復号化する復号化装
置であって、前記入力符号化データ中の第1の領域に記
録されている第1符号化データを復号化する第1復号化
手段と、前記第1復号化手段による復号化結果を逆量子
化し、1フレーム時間ごとに、周波数スペクトルの時間
変化を示す複数のショートブロックスペクトルを出力す
る第1逆量子化手段と、前記第1逆量子化手段による
量子化結果を監視し、前記第1逆量子化手段によって出
力された前記ウィンドウのうち、周波数高域部スペク
トルデータの値が所定値となっている場合、そのウィン
ドウを、ウィンドウ内の高域部スペクトルデータを他の
ウィンドウの高域部スペクトルデータを参照して生成す
る参照ウィンドウであると判定する判定手段と、前記判
定手段の判定に基づいて、前記第1逆量子化手段による
逆量子化結果から前記参照ウィンドウに参照されるウ
ィンドウである被参照ウィンドウの高域部スペクトルデ
ータをコピーし、コピーしたスペクトルデータを前記
照ウィンドウに対応付けて出力する第2逆量子化手段
と、前記第1逆量子化手段によって出力された前記所定
値の高域部スペクトルデータであって、前記参照ウィン
ドウの高域部スペクトルデータの値を、前記第2逆量子
化手段によって対応付けられ出力された前記被参照ウィ
ンドウの高域部スペクトルデータの値で置換した後、逆
変換し、時間軸上の音響信号として出力する音響信号出
力手段とを備える。
The decoding apparatus of the present invention corresponding to this is
Decoding device for decoding input coded data representing a sound signal
In the first area of the input coded data.
First decoding for decoding recorded first encoded data
Means and inverse decoding the decoding result by the first decoding means.
The frequency spectrum time for each frame time.
Output multiple short block spectra showing changes
That a first inverse quantization means, the inverse quantization result by the first inverse quantization means to monitor, among the windows that have been output by said first inverse quantization means, spectrum of the frequency high-band portion <br / > If the value of the torque data is the specified value, the win
Dow the high frequency spectrum data in the window
Generated by referring to the high band spectral data of the window
A determination unit that the reference window that, based on the determination of the determination means, from <br/> inverse quantization result by the first inverse quantization means, is referred to the reference window c
Copy the higher frequency band spectrum data of the referenced window is Indou, the ginseng spectral data copied
Second dequantizing means for outputting in association with the illumination window
And the predetermined value output by the first dequantization means.
A higher frequency band spectrum data value, the reference Win
The value of the high frequency band spectrum data of the dough is associated with the second dequantization means and output by the referenced wave.
After replacing it with the value of the high frequency band spectrum data of the window , it is inversely transformed and output as an acoustic signal on the time axis.
And means of force.

【手続補正12】[Procedure Amendment 12]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0161[Correction target item name] 0161

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0161】これによって、本発明の復号化装置におい
ては、1フレームに付き、少なくとも1つの被参照ウィ
ンドウの高域部データを入力し、それを前記判定手段の
判定に基づいて、前記参照ウィンドウにコピーすること
によって生成することができるので、従来に比べて、よ
り高域部の豊かな高音質な音響信号を再生することがで
きるという効果がある。
As a result, in the decoding apparatus of the present invention, at least one referenced window is included in one frame.
Enter the higher frequency band data window, based on it to determine the determination means, can be generated by copying to said reference windows, as compared with conventional rich high sound quality and more high-frequency portion There is an effect that various acoustic signals can be reproduced.

【手続補正13】[Procedure Amendment 13]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0162[Correction target item name] 0162

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0162】また、本発明の符号化装置によれば、前記
共有判定手段は、前記ウィンドウ同士のスペクトルが所
定の判断基準を満たす範囲で相似するか否かを判定し、
前記置換手段は、前記ウィンドウ同士のスペクトルが前
記範囲内で相似する場合、他のウィンドウの高域部スペ
クトルを共有する共有ウィンドウにつき、その共有ウィ
ンドウのさらに低域部のスペクトルデータを所定値に置
換する。
According to the encoding device of the present invention, the sharing determination means determines whether or not the spectra of the windows are similar to each other within a range satisfying a predetermined determination criterion,
The replacement means is arranged such that the spectrum between the windows is
When similar in the range, the high frequency range of other windows
For each sharing window that shares the story,
Replace the spectral data in the lower band of the window with a predetermined value.

【手続補正14】[Procedure Amendment 14]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0163[Correction target item name] 0163

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0163】従って、前記ウィンドウ同士のスペクトル
が所定の判断基準を満たす範囲で相似する場合には、高
域部に加えてさらに低域部のスペクトルデータを所定値
に置換するので、この所定値を例えば「0」とすると、
その部分の量子化及び符号化の処理を簡略化することが
できるとともに、音響信号の符号化データの量を、低域
部の分まで、より大幅に削減することができるという効
果がある。
Therefore, when the spectra of the windows are similar to each other within a range satisfying a predetermined criterion, the spectrum data of the low band in addition to the high band is replaced with a predetermined value. For example, "0"
It is possible to simplify the processing of quantization and coding of that portion, and it is possible to significantly reduce the amount of encoded data of the acoustic signal up to the low frequency portion.

【手続補正15】[Procedure Amendment 15]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0164[Name of item to be corrected] 0164

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0164】これに対応して、本発明の復号化装置にお
いて、前記判定手段は、前記第1逆量子化手段によって
出力された前記各ウィンドウにおいて全スペクトルデー
タの値が所定値となっている場合、そのウィンドウを前
参照ウィンドウであると判定し、前記第2逆量子化手
段は、前記判定手段による判定に基づいて、前記第1逆
量子化手段の逆量子化結果から、所定の前記被参照ウィ
ンドウさらに低域部を含んだ全スペクトルデータをコ
ピーし、コピーしたスペクトルデータを前記参照ウィン
ドウに対応付けて出力し、前記音響信号出力手段は、前
記参照ウィンドウの全スペクトルデータの値を、前記第
2逆量子化手段によって対応付けられ出力された前記被
参照ウィンドウのスペクトルデータの値で置換した後、
逆変換し、時間軸上の音響信号として出力する。
Correspondingly, in the decoding device of the present invention, the judging means determines that the values of all spectrum data in each of the windows output by the first dequantizing means are predetermined values. , The window is determined to be the reference window , and the second dequantizer
The stage , based on the determination by the determining means , determines the predetermined referenced wave from the dequantization result of the first dequantizing means.
All spectral data including the low-frequency part of the window are copied, and the copied spectral data is used for the reference window.
Output in association with the dough , the acoustic signal output means,
The values of all the spectrum data in the reference window are associated with the second dequantization means and output by the output target.
After substituting with the values of the spectral data in the reference window ,
Inverse conversion is performed and output as an acoustic signal on the time axis.

【手続補正16】[Procedure Amendment 16]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0165[Name of item to be corrected] 0165

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0165】従って、本発明の復号化装置によれば、1
フレームに付き、少なくとも1つの被参照ウィンドウ
の全域データを入力し、それを前記判定手段の判定に基
づいて、前記参照ウィンドウにコピーすることによって
生成するので、従来に比べて、低域部は所定の判断基準
の範囲によって多少の誤差を生じるが、1フレームに付
き、少なくとも1つのウィンドウ分入力される高域部デ
ータに基づいて、より高域部の豊かな高音質な音響信号
を再生することができるという効果がある。
Therefore, according to the decoding apparatus of the present invention, 1
By inputting the whole area data for at least one referenced window for each frame and copying it to the reference window based on the judgment of the judging means.
Since it is generated , the low-frequency part has some error depending on the range of the predetermined criterion compared to the conventional one, but the higher-frequency part is higher based on the high-frequency part data input for at least one window per frame. There is an effect that it is possible to reproduce a high-quality sound signal with a rich range.

【手続補正17】[Procedure Amendment 17]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0166[Name of item to be corrected] 0166

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0166】さらに、本発明の符号化装置は、さらに、
記第1量子化手段に入力されたスペクトルデータのう
ち、第1量子化手段による量子化の結果、スペクトルの
ピークに近接したスペクトルデータであって量子化結果
が所定値となったものを所定の正規化係数を用いて量子
化し直す第2量子化手段と、前記第2量子化手段の量子
化結果を符号化する第2符号化手段とを備え、前記出力
手段は、前記第1符号化手段によって符号化されたデー
、前記第2符号化手段によって符号化されたデータ
とを出力する。
Furthermore, the encoding apparatus of the present invention further comprises:
Of the spectral data input before Symbol first quantization means, the result of the quantization by the first quantization means, quantization result a spectral data close to the peak of the spectrum
Comprising a second quantizing means for re-quantizing, and a second encoding means for encoding the quantized result of the second quantizing means but with a predetermined normalization coefficient that becomes definite place, the the output means outputs the data encoded by said first encoding means and data encoded by the second encoding means.

【手続補正18】[Procedure 18]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0167[Correction target item name] 0167

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0167】従って、本発明の符号化装置によれば、第
2量子化手段が、第1量子化手段において、スペクトル
のピークに近接したスペクトルデータの量子化結果が連
続して所定値となったものを所定の正規化係数を用いて
量子化し直すので、ピークに隣接したスペクトルデータ
の量子化結果を、所定値で連続しない値に量子化し直す
ことができる。すなわち、ピークに隣接するスペクトル
データの量子化誤差を、第2量子化手段の量子化によっ
て補正することができるという効果がある。
Therefore, according to the encoding device of the present invention, the second quantizing means has the first quantizing means in which the quantizing result of the spectrum data close to the peak of the spectrum has a predetermined value continuously. Since the thing is re-quantized using a predetermined normalization coefficient, the quantization result of the spectrum data adjacent to the peak can be re-quantized to a value which is not continuous at a predetermined value. That is, there is an effect that the quantization error of the spectrum data adjacent to the peak can be corrected by the quantization of the second quantization means.

【手続補正19】[Procedure Amendment 19]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0168[Name of item to be corrected] 0168

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0168】これに対応して、本発明の復号化装置は、
さらに、前記入力符号化データ中の第2の領域から、同
じスペクトルデータについて前記第1符号化データとは
異なる所定の正規化係数を用いて量子化された第2符号
化データを分離する第2符号化データ分離手段と、前
第2符号化データを復号化する第2復号化手段と、前記
第1復号化手段による復号化結果を監視して、前記復号
化結果のうち連続して所定値となる部分を特定し、特定
された部分に対応する前記第2復号化手段による復号化
結果を、前記所定の正規化係数を用いて逆量子化し、
数のスペクトルデータを生成する第2逆量子化手段と、
記第1逆量子化手段によって出力されたスペクトルデ
ータのうち、前記特定された部分のスペクトルデータの
値を、前記第2逆量子化手段によって生成されたスペク
トルデータの値で置換した後、逆変換し、時間軸上の音
響信号として出力する音響信号出力手段とを備える
In response to this, the decoding apparatus of the present invention is
Furthermore, from the second area in the input coded data ,
Regarding the same spectrum data, the first encoded data is
Second code quantized using different predetermined normalization coefficient
A second coded data separating means for separating data, before Symbol
Second decoding means for decoding the second encoded data ;
The decoding result by the first decoding means is monitored and the decoding is performed.
Specify the part that has a predetermined value continuously in the conversion result and specify
The decoding result by said second decoding means corresponding to the portion, and inverse quantized using said predetermined normalization factor, double
Second dequantization means for generating a number of spectral data ;
Of the spectral data outputted by the pre-Symbol first inverse quantization means, the values of the spectral data of the identified portion, was replaced by the value of the spectral data generated by said second inverse quantization means, inverse And an audio signal output means for converting and outputting as an audio signal on the time axis.

【手続補正20】[Procedure amendment 20]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】0169[Name of item to be corrected] 0169

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【0169】従って、本発明の復号化装置によれば、第
2逆量子化手段は、前記各バンドにおいてピークとなる
スペクトルデータに近接したため、前記第1量子化手段
による量子化結果が所定値となった連続するスペクトル
データを生成するので、ピークに近接するスペクトルデ
ータの量子化誤差を、第2量子化手段の量子化によって
補正することができる。この結果、音響信号の再生帯域
の全域において、スペクトルのピーク周辺の音響信号
を、より原音に忠実に再生することができるという効果
がある。
Therefore, according to the decoding apparatus of the present invention, since the second dequantization means is close to the spectrum data having the peak in each band, the quantization result by the first quantization means has a predetermined value. Since the generated continuous spectrum data is generated , the quantization error of the spectrum data near the peak can be corrected by the quantization of the second quantization means. As a result, there is an effect that the acoustic signal around the peak of the spectrum can be reproduced more faithfully to the original sound in the entire reproduction band of the acoustic signal.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 津島 峰生 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 (72)発明者 田中 直也 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 Fターム(参考) 5D045 DA20 5J064 AA00 BA09 BA16 BB12 BC02 BC14 BC16 BC17 BC18 BC29 BD02 BD03    ─────────────────────────────────────────────────── ─── Continued front page    (72) Inventor Mineo Tsushima             1006 Kadoma, Kadoma-shi, Osaka Matsushita Electric             Sangyo Co., Ltd. (72) Inventor Naoya Tanaka             1006 Kadoma, Kadoma-shi, Osaka Matsushita Electric             Sangyo Co., Ltd. F-term (reference) 5D045 DA20                 5J064 AA00 BA09 BA16 BB12 BC02                       BC14 BC16 BC17 BC18 BC29                       BD02 BD03

Claims (41)

【特許請求の範囲】[Claims] 【請求項1】 入力された音響信号を符号化する符号化
装置であって、 入力音響信号を一定時間ごとに切り出して周波数スペク
トルに変換することにより、1フレーム時間ごとに、ス
ペクトルデータの集合からなる組を複数個生成する変換
手段と、 前記変換手段によって得られた前記組同士を比較し、そ
れら組同士のスペクトルが所定の判断基準を満たす範囲
で相似する場合、一方の組の高域部のスペクトルデータ
を他方の組において共有すると判定する共有判定手段
と、 高域部スペクトルデータを共有すると判定された前記他
方の組につき、その組の高域部スペクトルデータを所定
値に置換する置換手段と、 前記置換手段による置換処理の後、前記各組のスペクト
ルデータを量子化する第1量子化手段と、 前記第1量子化手段による量子化結果を符号化する第1
符号化手段と、 前記第1符号化手段によって符号化されたデータを出力
する出力手段とを備えることを特徴とする符号化装置。
1. An encoding device for encoding an input acoustic signal, wherein the input acoustic signal is cut out at constant time intervals and converted into a frequency spectrum, whereby a set of spectrum data is extracted every frame time. When a plurality of conversion means for generating a plurality of sets are compared with each other obtained by the conversion means, and the spectra of the pairs are similar to each other in a range satisfying a predetermined criterion, the high-frequency part of one pair Share determination means for determining that the other set of spectrum data is to be shared, and replacement means for replacing the high range spectrum data of the other set with a predetermined value for the other set determined to share the high range spectrum data. A first quantizing means for quantizing the spectral data of each set after the replacement processing by the replacing means; and a quantum by the first quantizing means. First to encode the results
An encoding apparatus comprising: an encoding unit; and an output unit that outputs the data encoded by the first encoding unit.
【請求項2】 前記符号化装置は、さらに、 前記一方の組と前記他方の組との高域部につき、同一周
波数のスペクトルデータの平均値を求め、求められた各
平均値をスペクトル値とするスペクトルデータで前記一
方の組の高域部スペクトルデータを置換する平均手段を
備え、 前記第1量子化手段は、前記平均手段と前記置換手段と
による置換処理の後、前記各組のスペクトルデータを量
子化することを特徴とする請求項1記載の符号化装置。
2. The encoding device further obtains an average value of spectrum data of the same frequency for the high band part of the one set and the other set, and sets each obtained average value as a spectrum value. Averaging means for substituting the one set of high frequency band spectral data with the spectral data for performing the replacement processing by the averaging means and the replacing means, and then the spectral data of each set. Is quantized.
【請求項3】 前記符号化装置は、さらに、 前記各組につき、前記共有判定手段による判定結果を表
す共有情報を生成する共有情報生成手段と、 生成された前記共有情報を符号化する第2符号化手段と
を備え、 前記出力手段は、前記第1符号化手段によって符号化さ
れたデータと前記第2符号化手段によって符号化された
データとを出力することを特徴とする請求項1又は請求
項2記載の符号化装置。
3. The encoding apparatus further includes, for each of the sets, shared information generation means for generating shared information indicating a determination result by the sharing determination means, and second encoding for the generated shared information. The encoding means is provided, and the output means outputs the data encoded by the first encoding means and the data encoded by the second encoding means. The encoding device according to claim 2.
【請求項4】 前記共有判定手段は、 前記各組におけるスペクトルのエネルギー差を求め、求
めたエネルギー差が所定のしきい値未満である場合に共
有すると判定することを特徴とする請求項1〜3のいず
れか1項に記載の符号化装置。
4. The sharing determination means determines an energy difference between spectra in each of the sets, and determines that the energy is shared when the calculated energy difference is less than a predetermined threshold value. The encoding device according to any one of 3 above.
【請求項5】 前記共有判定手段は、 前記各組においてピークとなるスペクトルデータの周波
数位置を比較し、前記比較結果に基づいて共有すると判
定することを特徴とする請求項1〜3のいずれか1項に
記載の符号化装置。
5. The sharing determination means compares frequency positions of spectrum data having peaks in each of the sets, and determines sharing based on the comparison result. The encoding device according to item 1.
【請求項6】 前記共有判定手段は、 前記各組におけるスペクトルデータを、所定の関数を用
いて変換し、得られた変換結果を比較するとともに、前
記比較結果に基づいて共有すると判定することを特徴と
する請求項1〜3のいずれか1項に記載の符号化装置。
6. The sharing determination means converts the spectrum data in each set using a predetermined function, compares the obtained conversion results, and determines to share based on the comparison result. The encoding device according to any one of claims 1 to 3, which is characterized.
【請求項7】 前記符号化装置は、さらに、 前記一方の各組におけるスペクトルデータのうち、周波
数の高域部のスペクトルデータの特徴を表す補助情報を
生成する補助情報生成手段を備え、 前記第2符号化手段は、前記共有情報に加えてさらに、
生成された前記補助情報を符号化し、 前記置換手段は、前記一方の各組の共有される高域部ス
ペクトルデータを所定値に置換し、 前記出力手段は、前記第1符号化手段によって符号化さ
れたデータと、前記第2符号化手段によって符号化され
たデータとを出力することを特徴とする請求項3〜6の
いずれか1項に記載の符号化装置。
7. The encoding device further comprises auxiliary information generating means for generating auxiliary information representing a characteristic of spectral data in a high frequency part of the spectrum data in each of the one set. 2 encoding means, in addition to the shared information,
The generated auxiliary information is coded, the replacement unit replaces the shared high frequency band spectrum data of each of the one set with a predetermined value, and the output unit is coded by the first coding unit. The encoded device according to any one of claims 3 to 6, wherein the encoded data and the data encoded by the second encoding means are output.
【請求項8】 前記補助情報生成手段は、複数の周波数
のバンドに分けられた前記スペクトルデータにつき、高
域部の各バンドにおいて、ピークとなるスペクトルデー
タを量子化した値が一定値となる正規化係数を計算し、
計算された正規化係数を前記補助情報として生成するこ
とを特徴とする請求項7記載の符号化装置。
8. The auxiliary information generating means has a normal value that a value obtained by quantizing the spectrum data that becomes a peak in each band of a high frequency band of the spectrum data divided into a plurality of frequency bands is a constant value. Calculate the conversion factor,
The encoding device according to claim 7, wherein the calculated normalization coefficient is generated as the auxiliary information.
【請求項9】 前記補助情報生成手段は、複数のバンド
に分けられた前記スペクトルデータにつき、高域部の各
バンドにおいてピークとなるスペクトルデータを、前記
各バンドに共通の正規化係数を用いて量子化し、その量
子化結果を前記補助情報として生成することを特徴とす
る請求項7記載の符号化装置。
9. The auxiliary information generating means uses, for the spectral data divided into a plurality of bands, spectral data having a peak in each band of a high frequency band by using a normalization coefficient common to each band. 8. The encoding device according to claim 7, wherein the quantization is performed and a result of the quantization is generated as the auxiliary information.
【請求項10】 前記補助情報生成手段は、複数のバン
ドに分けられた前記スペクトルデータにつき、高域部の
各バンドにおいてピークとなるスペクトルデータの周波
数位置を前記補助情報として生成することを特徴とする
請求項7記載の符号化装置。
10. The auxiliary information generating means generates, as the auxiliary information, the frequency position of the spectrum data having a peak in each band of the high frequency band of the spectrum data divided into a plurality of bands. The encoding device according to claim 7.
【請求項11】 前記スペクトルデータはMDCT係数
であって、前記補助情報生成手段は、複数のバンドに分
けられた前記スペクトルデータにつき、高域部の所定周
波数位置におけるスペクトルデータの正負を示す符号を
前記補助情報として生成することを特徴とする請求項7
記載の符号化装置。
11. The spectrum data is an MDCT coefficient, and the auxiliary information generating means, for the spectrum data divided into a plurality of bands, gives a sign indicating whether the spectrum data is positive or negative at a predetermined frequency position in a high frequency band. The data is generated as the auxiliary information.
Encoding device described.
【請求項12】 前記補助情報生成手段は、複数のバン
ドに分けられた前記スペクトルデータにつき、高域部の
各バンドにおいて、当該バンド内のスペクトルと最も近
似する低域部のスペクトルを特定する情報を前記補助情
報として生成することを特徴とする請求項7記載の符号
化装置。
12. The auxiliary information generating means specifies, for each of the high frequency bands of the spectrum data divided into a plurality of bands, a low frequency band spectrum that is closest to the spectrum in the corresponding band. The encoding device according to claim 7, wherein is generated as the auxiliary information.
【請求項13】 前記低域部のスペクトルを特定する情
報は、特定された低域部スペクトルの前記バンドを特定
する番号であることを特徴とする請求項12記載の符号
化装置。
13. The encoding apparatus according to claim 12, wherein the information for specifying the low-frequency band spectrum is a number for specifying the band of the specified low-frequency spectrum.
【請求項14】 前記補助情報生成手段は、前記高域部
スペクトルの振幅の増幅比率を表すあらかじめ定めた係
数を前記補助情報に付加することを特徴とする請求項7
〜13のいずれか1項に記載の符号化装置。
14. The auxiliary information generating means adds a predetermined coefficient representing an amplification ratio of the amplitude of the high frequency band spectrum to the auxiliary information.
The encoding device according to any one of 1 to 13.
【請求項15】 前記出力手段は、さらに、 前記第1符号化手段によって符号化されたデータを所定
のフォーマットに定められた符号化音響ストリームに変
換するとともに、前記符号化音響ストリーム内の領域で
あって、符号化規約では使用が制約されていない領域
に、前記第2符号化手段によって符号化されたデータを
格納して出力するストリーム出力部を備えることを特徴
とする請求項3〜14のいずれか1項に記載の符号化装
置。
15. The output means further converts the data coded by the first coding means into a coded audio stream defined in a predetermined format, and at the same time, in an area within the coded audio stream. The stream output unit for storing and outputting the data encoded by the second encoding unit is provided in an area of which the use is not restricted by the encoding protocol. The encoding device according to any one of claims.
【請求項16】 前記ストリーム出力部は、さらに、 前記第2符号化手段によって符号化されたデータに、第
2符号化手段によって符号化されたことを示す識別情報
を付加する識別情報付加部を備え、 前記ストリーム出力部は、前記識別情報が付加されたデ
ータを、符号化規約では使用が制約されていない前記領
域に格納することを特徴とする請求項15記載の符号化
装置。
16. The stream output unit further includes an identification information addition unit that adds identification information indicating that the data has been encoded by the second encoding unit to the data encoded by the second encoding unit. 16. The encoding device according to claim 15, wherein the stream output unit stores the data to which the identification information is added in the area where use is not restricted by an encoding rule.
【請求項17】 前記出力手段は、さらに、 前記第1符号化手段によって符号化されたデータを所定
のフォーマットに定められた符号化音響ストリームに変
換するとともに、前記第2符号化手段によって符号化さ
れたデータを、前記符号化音響ストリームとは異なるス
トリームに格納して出力する第2ストリーム出力部を備
えることを特徴とする請求項3〜14のいずれか1項に
記載の符号化装置。
17. The output means further converts the data encoded by the first encoding means into an encoded audio stream defined in a predetermined format, and encodes by the second encoding means. The encoding device according to any one of claims 3 to 14, further comprising: a second stream output unit that stores the generated data in a stream different from the encoded acoustic stream and outputs the stream.
【請求項18】 前記共有判定手段は、前記組同士のス
ペクトルが所定の判断基準を満たす範囲で相似する場合
に、前記一方の組の高域部に加えてさらに低域部のスペ
クトルデータを、他方の組において共有すると判定し、 前記置換手段は、スペクトルデータを共有すると判定さ
れた前記他方の組につき、入力されるその組の高域部に
加えてさらに低域部のスペクトルデータを所定値に置換
することを特徴とする請求項1又は請求項3〜17のい
ずれか1項に記載の符号化装置。
18. The sharing determination means, when the spectra of the pairs are similar to each other in a range satisfying a predetermined determination criterion, in addition to the high-frequency portion of the one pair, the spectrum data of a low-frequency portion, It is determined to be shared in the other set, the replacement means, for the other set determined to share the spectrum data, in addition to the high band part of the set to be input, further spectral data of the low band part is a predetermined value. The encoding device according to claim 1 or any one of claims 3 to 17, characterized in that.
【請求項19】 入力された音響信号を符号化する符号
化装置であって、 入力音響信号を一定時間ごとに切り出して周波数スペク
トルに変換する変換手段と、 前記変換手段によって得られたスペクトルデータを量子
化する第1量子化手段と、 前記第1量子化手段に入力されたスペクトルデータのう
ち、第1量子化手段による量子化の結果、スペクトルの
ピークに近接したスペクトルデータであって量子化結果
が所定値となったものを所定の正規化係数を用いて量子
化し直す第2量子化手段と、 前記第1量子化手段の量子化結果を符号化する第1符号
化手段と、 前記第2量子化手段の量子化結果を符号化する第2符号
化手段と、 前記第1符号化手段によって符号化されたデータと、前
記第2符号化手段によって符号化されたデータとを出力
する出力手段とを備えることを特徴とする符号化装置。
19. An encoding device for encoding an input acoustic signal, comprising: converting means for extracting the input acoustic signal at regular time intervals and converting it into a frequency spectrum; and spectrum data obtained by the converting means. A first quantizing means for quantizing, and, out of the spectrum data input to the first quantizing means, the result of quantization by the first quantizing means is spectrum data close to the peak of the spectrum Second quantizing means for requantizing a value of which is a predetermined value using a predetermined normalizing coefficient; first coding means for coding the quantization result of the first quantizing means; Second encoding means for encoding the quantization result of the quantizing means, data encoded by the first encoding means, and data encoded by the second encoding means are output. An encoding device comprising:
【請求項20】 前記第2量子化手段は、量子化し直し
た量子化結果を、符号化した際により少ないデータ量と
なるよう、所定の関数を用いて変換することを特徴とす
る請求項19記載の符号化装置。
20. The second quantizing means transforms the requantized quantization result using a predetermined function so that a smaller data amount can be obtained when encoded. Encoding device described.
【請求項21】 前記第1量子化手段は、周波数のバン
ドごとにスペクトルデータを量子化し、 前記第2量子化手段は、前記各バンドにおいてピークと
なるスペクトルデータを量子化せず、所定値で表すこと
を特徴とする請求項19又は請求項20記載の符号化装
置。
21. The first quantizing means quantizes the spectrum data for each frequency band, and the second quantizing means does not quantize the spectrum data having a peak in each band, and a predetermined value is used. 21. The encoding device according to claim 19, wherein the encoding device is represented.
【請求項22】 前記第2量子化手段は、さらに、 第2量子化手段の量子化結果が所定ビット数となるよう
さらに前記正規化係数を調整する正規化係数調整部を備
え、 前記第2量子化手段は、調整された正規化係数を用いて
量子化し直し、その量子化結果とともに前記正規化係数
を出力することを特徴とする請求項21記載の符号化装
置。
22. The second quantization means further comprises a normalization coefficient adjustment unit for further adjusting the normalization coefficient so that the quantization result of the second quantization means has a predetermined number of bits, and the second quantization means 22. The encoding apparatus according to claim 21, wherein the quantization means re-quantizes using the adjusted normalization coefficient and outputs the normalization coefficient together with the quantization result.
【請求項23】 請求項1記載の符号化装置によって符
号化された符号化データを入力し、入力した符号化デー
タを復号化する復号化装置であって、 入力符号化データ中の前記第1符号化手段によって符号
化されたデータを復号化する第1復号化手段と、 第1復号化手段の復号化結果を逆量子化し、前記各組の
スペクトルデータを出力する第1逆量子化手段と、 前記第1逆量子化手段の逆量子化結果を監視し、前記第
1逆量子化手段によって出力された高域部スペクトルデ
ータの値が所定値となっている場合、その組を前記他方
の組であると判定する判定手段と、 前記判定手段の判定に基づいて、前記第1逆量子化手段
の逆量子化結果から前記一方の組の高域部を表すスペク
トルデータをコピーし、コピーしたスペクトルデータを
前記他方の組に対応付けて出力する第2逆量子化手段
と、 前記第1逆量子化手段によって出力された高域部スペク
トルデータであって、第2逆量子化手段によって対応付
けられている組の高域部スペクトルデータの値を、前記
第2逆量子化手段によって出力された高域部スペクトル
データの値で置換した後、逆変換し、時間軸上の音響信
号として出力する音響信号出力手段とを備えることを特
徴とする復号化装置。
23. A decoding device for inputting encoded data encoded by the encoding device according to claim 1 and decoding the input encoded data, wherein the first encoded data in the input encoded data is the first encoded data. First decoding means for decoding the data coded by the coding means, and first dequantization means for dequantizing the decoding result of the first decoding means and outputting the spectrum data of each set. Monitoring the dequantization result of the first dequantization means, and when the value of the high frequency band spectrum data output by the first dequantization means is a predetermined value, the set is set to the other one. Determination means for determining a pair, and based on the determination of the determination means, from the dequantization result of the first dequantization means, the spectral data representing the high-frequency part of the one set is copied and copied. Spectral data on the other side A second dequantization unit that outputs the high-band part spectrum data that is output by the first dequantization unit and that is associated with the second dequantization unit. After replacing the value of the high frequency band spectrum data with the value of the high frequency band spectrum data output by the second dequantization means, inverse conversion is performed and an acoustic signal output means for outputting as an acoustic signal on the time axis is provided. A decoding device comprising.
【請求項24】 請求項3記載の符号化装置によって符
号化された符号化データを入力し、入力した符号化デー
タを復号化する復号化装置であって、 入力符号化データから、符号化された前記共有情報を分
離する符号化データ分離手段と、 入力符号化データ中の前記第1符号化手段によって符号
化されたデータを復号化する第1復号化手段と、 第1復号化手段の復号化結果を逆量子化し、前記各組の
スペクトルデータを出力する第1逆量子化手段と、 入力符号化データから分離された前記共有情報を復号化
する第2復号化手段と、 復号化された前記共有情報に基づいて、前記第1逆量子
化手段の逆量子化結果から前記一方の組の高域部を表す
スペクトルデータをコピーし、コピーしたスペクトルデ
ータを前記他方の組に対応付けて出力する第2逆量子化
手段と、 前記第1逆量子化手段によって出力された高域部スペク
トルデータであって、第2逆量子化手段によって対応付
けられている組の高域部スペクトルデータの値を、前記
第2逆量子化手段によって出力された高域部スペクトル
データの値で置換した後、逆変換し、時間軸上の音響信
号として出力する音響信号出力手段とを備えることを特
徴とする復号化装置。
24. A decoding device for inputting the encoded data encoded by the encoding device according to claim 3 and decoding the input encoded data, wherein the encoded data is encoded from the input encoded data. Coded data separation means for separating the shared information, first decoding means for decoding the data coded by the first coding means in the input coded data, and decoding of the first decoding means A first dequantization means for dequantizing the quantization result and outputting the spectrum data of each set, and a second decoding means for decoding the shared information separated from the input coded data, and Based on the shared information, the spectrum data representing the high band part of the one set is copied from the dequantization result of the first dequantization unit, and the copied spectrum data is output in association with the other set. Do 2 dequantization means, and the highband spectrum data output by the first dequantization means, the values of a set of highband spectrum data associated by the second dequantization means, Decoding, comprising: an acoustic signal output unit that substitutes the value of the high frequency band spectrum data output by the second dequantization unit, performs inverse conversion, and outputs as an acoustic signal on the time axis. apparatus.
【請求項25】 請求項7記載の符号化装置によって符
号化された符号化データを入力し、入力した符号化デー
タを復号化する復号化装置であって、 入力符号化データから、符号化された前記共有情報と前
記補助情報とを分離する符号化データ分離手段と、 入力符号化データ中の前記第1符号化手段によって符号
化されたデータを復号化する第1復号化手段と、 第1復号化手段の復号化結果を逆量子化し、前記各組の
スペクトルデータを出力する第1逆量子化手段と、 符号化された前記共有情報と前記補助情報とを復号化す
る第2復号化手段と、復号化された前記共有情報と前記
補助情報とに基づいて、前記一方の組の高域部を表すス
ペクトルデータを復元し、復元したスペクトルデータを
前記他方の組に対応付けて出力する第2逆量子化手段
と、 前記第1逆量子化手段によって出力された高域部スペク
トルデータであって、第2逆量子化手段によって対応付
けられている組の高域部スペクトルデータの値を、前記
第2逆量子化手段によって出力された高域部スペクトル
データの値で置換した後、逆変換し、時間軸上の音響信
号として出力する音響信号出力手段とを備えることを特
徴とする復号化装置。
25. A decoding device for inputting the encoded data encoded by the encoding device according to claim 7 and decoding the input encoded data, wherein the encoded data is encoded from the input encoded data. An encoded data separating unit that separates the shared information and the auxiliary information; a first decoding unit that decodes the data encoded by the first encoding unit in the input encoded data; First dequantizing means for dequantizing the decoding result of the decoding means and outputting the spectrum data of each set; and second decoding means for decoding the shared information and the auxiliary information that have been encoded. And, based on the decoded shared information and the auxiliary information, restore the spectrum data representing the high band part of the one set, and output the restored spectrum data in association with the other set. 2 inverse quantization And the values of the high band spectral data of the set, which is the high band spectral data output by the first dequantizing means and is associated by the second dequantizing means, with the second inverse. A decoding device, comprising: an acoustic signal output means for performing inverse transformation after replacing with a value of the high frequency band spectrum data output by the quantizing means, and outputting as an acoustic signal on a time axis.
【請求項26】 請求項8記載の符号化装置によって符
号化された符号化データを入力し、入力した符号化デー
タを復号化する復号化装置であって、 前記第2逆量子化手段は、復号化された前記補助情報中
の前記正規化係数を用いて、高域部の各バンドに共通し
た所定値であって、前記各バンドにおける所定のスペク
トルデータに対応する量子化値を逆量子化し、逆量子化
された結果のスペクトルデータが各バンドにおいてピー
クとなるよう高域部スペクトルデータを生成することを
特徴とする請求項25記載の復号化装置。
26. A decoding device, which receives the encoded data encoded by the encoding device according to claim 8 and decodes the input encoded data, wherein the second dequantizing means comprises: Using the normalized coefficient in the decoded auxiliary information, the quantization value that is a predetermined value that is common to each band of the high frequency band and that corresponds to the predetermined spectrum data in each band is dequantized. 26. The decoding apparatus according to claim 25, wherein the high frequency band spectrum data is generated so that the spectrum data as a result of the dequantization has a peak in each band.
【請求項27】 請求項9記載の符号化装置によって符
号化された符号化データを入力し、入力した符号化デー
タを復号化する復号化装置であって、 前記第2逆量子化手段は、復号化された前記補助情報中
の量子化値を、高域部の各バンドにおいて共通の所定値
である正規化係数を用いて逆量子化し、逆量子化された
結果のスペクトルデータが前記各バンドにおいてピーク
となるよう高域部スペクトルデータを生成することを特
徴とする請求項25記載の復号化装置。
27. A decoding device for inputting the encoded data encoded by the encoding device according to claim 9, and decoding the input encoded data, wherein the second dequantizing means is The quantized value in the decoded auxiliary information is inversely quantized using a normalization coefficient that is a predetermined value that is common in each band of the high frequency band, and the spectrum data of the inversely quantized result is each band. 26. The decoding device according to claim 25, wherein the high frequency band spectrum data is generated so that it has a peak at.
【請求項28】 請求項10記載の符号化装置によって
符号化された符号化データを入力し、入力された符号化
データを復号化する復号化装置であって、 前記第2逆量子化手段は、復号化された前記補助情報中
の周波数位置が、高域部の各バンドにおいてピークとな
るよう高域部スペクトルデータを生成することを特徴と
する請求項25記載の復号化装置。
28. A decoding device for inputting the encoded data encoded by the encoding device according to claim 10 and decoding the input encoded data, wherein the second dequantization means is 26. The decoding device according to claim 25, wherein the high frequency band spectrum data is generated such that the frequency position in the decoded auxiliary information has a peak in each band of the high frequency band.
【請求項29】 請求項11記載の符号化装置によって
符号化された符号化データを入力し、入力された符号化
データを復号化する復号化装置であって、 前記第2逆量子化手段は、高域部の所定周波数位置にお
けるスペクトルデータが、生成された前記補助情報中の
前記符号をもつ高域部スペクトルデータを生成すること
を特徴とする請求項25記載の復号化装置。
29. A decoding device for inputting the encoded data encoded by the encoding device according to claim 11, and decoding the input encoded data, wherein the second dequantization means is 26. The decoding device according to claim 25, wherein the spectrum data at a predetermined frequency position in the high frequency band generates high frequency band spectrum data having the code in the generated auxiliary information.
【請求項30】 請求項12記載の符号化装置によって
符号化された符号化データを入力し、入力された符号化
データを復号化する復号化装置であって、 前記第2逆量子化手段は、高域部の前記各バンドにおい
て、前記第1逆量子化手段によって出力される低域部ス
ペクトルデータのうち、復号化された前記補助情報によ
って特定される低域部スペクトルデータをコピーし、高
域部スペクトルデータを出力することを特徴とする請求
項25記載の復号化装置。
30. A decoding device for inputting the encoded data encoded by the encoding device according to claim 12, and decoding the input encoded data, wherein the second dequantization means is , In each band of the high frequency band, the low frequency band spectrum data specified by the decoded auxiliary information is copied from the low frequency band spectrum data output by the first dequantization means, 26. The decoding device according to claim 25, which outputs the spectrum data of the region.
【請求項31】 請求項16記載の符号化装置から、所
定のフォーマットに定められた符号化音響ストリームを
入力し、入力された符号化音響ストリームを復号化する
復号化装置であって、 前記符号化データ分離手段は、入力符号化音響ストリー
ム内の符号化規約では使用が制限されていない領域から
データを抽出し、 前記第1復号化手段は、前記入力符号化音響ストリーム
から、前記第1符号化手段によって符号化されたデータ
を復号化し、 前記第2復号化手段は、前記抽出されたデータを解析
し、当該データ中に、前記第2符号化手段によって符号
化されたことを示す前記識別情報が含まれている場合に
は、当該識別情報を除く前記抽出されたデータから前記
共有情報を復号化することを特徴とする請求項24記載
の復号化装置。
31. A decoding device for inputting a coded audio stream defined in a predetermined format from the coding device according to claim 16, and decoding the input coded audio stream. The encoded data separation means extracts data from an area of which the use is not restricted by the encoding convention in the input encoded audio stream, and the first decoding means extracts the data from the input encoded acoustic stream by the first code. Decoding the data encoded by the encoding means, the second decoding means analyzing the extracted data, and identifying in the data that the data has been encoded by the second encoding means. The decoding apparatus according to claim 24, wherein when the information is included, the shared information is decoded from the extracted data excluding the identification information.
【請求項32】 請求項18記載の符号化装置によって
符号化された符号化データを入力し、入力した符号化デ
ータを復号化する復号化装置であって、 入力符号化データ中の前記第1符号化手段によって符号
化されたデータを復号化する第1復号化手段と、 第1復号化手段の復号化結果を逆量子化し、前記各組の
スペクトルデータを出力する第1逆量子化手段と、 前記第1逆量子化手段の逆量子化結果を監視し、前記第
1逆量子化手段によって出力された全スペクトルデータ
の値が所定値となっている場合、その組を前記他方の組
であると判定する判定手段と、 前記判定手段の判定に基づいて、前記第1逆量子化手段
の逆量子化結果から前記一方の組の全スペクトルデータ
をコピーし、コピーしたスペクトルデータを前記他方の
組に対応付けて出力する第2逆量子化手段と、 前記第1逆量子化手段によって出力されたスペクトルデ
ータであって、第2逆量子化手段によって対応付けられ
ている組の全スペクトルデータの値を、前記第2逆量子
化手段によって出力されたスペクトルデータの値で置換
した後、逆変換し、時間軸上の音響信号として出力する
音響信号出力手段とを備えることを特徴とする復号化装
置。
32. A decoding device for inputting the encoded data encoded by the encoding device according to claim 18 and decoding the input encoded data, wherein the first encoded data in the input encoded data is the first encoded data. First decoding means for decoding the data coded by the coding means, and first dequantization means for dequantizing the decoding result of the first decoding means and outputting the spectrum data of each set. Monitoring the dequantization result of the first dequantization means, and when the value of all spectrum data output by the first dequantization means is a predetermined value, the set is set to the other set. Based on the determination means for determining that there is, the total spectrum data of the one set from the inverse quantization result of the first inverse quantization means, the copied spectrum data of the other Compatible with groups The second dequantization means for outputting and the spectrum data output by the first dequantization means, the values of all the spectrum data of the set associated by the second dequantization means A decoding device, comprising: an acoustic signal output unit that substitutes the value of the spectrum data output by the second inverse quantization unit, and then inversely transforms and outputs as an acoustic signal on a time axis.
【請求項33】 請求項18記載の符号化装置によって
符号化された符号化データを入力し、入力した符号化デ
ータを復号化する復号化装置であって、 入力符号化データから、符号化された前記共有情報を分
離する符号化データ分離手段と、 入力符号化データ中の前記第1符号化手段によって符号
化されたデータを復号化する第1復号化手段と、 第1復号化手段の復号化結果を逆量子化し、前記各組の
スペクトルデータを出力する第1逆量子化手段と、 入力符号化データから分離された前記共有情報を復号化
する第2復号化手段と、 復号化された前記共有情報に基づいて、前記第1逆量子
化手段の逆量子化結果から前記一方の組の全スペクトル
データをコピーし、コピーしたスペクトルデータを前記
他方の組に対応付けて出力する第2逆量子化手段と、 前記第1逆量子化手段によって出力されたスペクトルデ
ータであって、第2逆量子化手段によって対応付けられ
ている組の全スペクトルデータの値を、前記第2逆量子
化手段によって出力されたスペクトルデータの値で置換
した後、逆変換し、時間軸上の音響信号として出力する
音響信号出力手段とを備えることを特徴とする復号化装
置。
33. A decoding device for inputting coded data coded by the coding device according to claim 18, and decoding the input coded data, the coded data being coded from the input coded data. Coded data separation means for separating the shared information, first decoding means for decoding the data coded by the first coding means in the input coded data, and decoding of the first decoding means A first dequantization means for dequantizing the quantization result and outputting the spectrum data of each set, and a second decoding means for decoding the shared information separated from the input coded data, and A second inverse that copies all the spectrum data of the one set from the dequantization result of the first dequantization unit based on the shared information and outputs the copied spectrum data in association with the other set. amount Quantization means and the spectrum data output by the first dequantization means, and the values of all the spectrum data of the set associated by the second dequantization means are converted by the second dequantization means. A decoding device comprising: an acoustic signal output means for performing inverse conversion after replacing the output spectrum data value and outputting as an acoustic signal on a time axis.
【請求項34】 請求項19記載の符号化装置によって
符号化された符号化データを入力し、入力した符号化デ
ータを復号化する復号化装置であって、 入力符号化データから、前記第2符号化手段によって符
号化されたデータを分離する符号化データ分離手段と、 入力符号化データ中の前記第1符号化手段によって符号
化されたデータを復号化する第1復号化手段と、 前記第1復号化手段の復号化結果を逆量子化し、前記各
バンドのスペクトルデータを出力する第1逆量子化手段
と、 前記第2符号化手段によって符号化されたデータを復号
化する第2復号化手段と、 前記第2復号化手段の復号化結果を所定の正規化係数を
用いて逆量子化し、前記各バンドにおいてピークとなる
スペクトルデータに隣接したため、前記第1量子化手段
による量子化結果が所定値となった連続するスペクトル
データを復元する第2逆量子化手段と、 前記第1逆量子化手段によって出力されたスペクトルデ
ータのうち、前記バンドごとに、1スペクトルデータの
前後に隣接し、かつ、いずれも連続して所定値となる複
数のスペクトルデータの値を、前記第2逆量子化手段に
よって復元されたスペクトルデータの値で置換した後、
逆変換し、時間軸上の音響信号として出力する音響信号
出力手段とを備えることを特徴とする復号化装置。
34. A decoding device for inputting the encoded data encoded by the encoding device according to claim 19 and decoding the input encoded data, wherein the second encoded data is converted into the second encoded data from the input encoded data. Coded data separation means for separating the data coded by the coding means; first decoding means for decoding the data coded by the first coding means in the input coded data; The first dequantizing means for dequantizing the decoding result of the first decoding means and outputting the spectrum data of each band, and the second decoding for decoding the data encoded by the second encoding means Means, and the decoding result of the second decoding means is inversely quantized using a predetermined normalization coefficient, and is adjacent to the spectrum data having a peak in each band, so that the first quantization means Second dequantization means for restoring continuous spectrum data whose sub-result is a predetermined value, and one spectrum data before and after one spectrum data among the spectrum data output by the first dequantization means. After replacing the values of a plurality of spectrum data that are adjacent to each other and each of which continuously has a predetermined value with the value of the spectrum data restored by the second inverse quantization means,
A decoding device, comprising: an acoustic signal output unit that performs inverse conversion and outputs as an acoustic signal on a time axis.
【請求項35】 請求項20記載の符号化装置によって
符号化された符号化データを入力し、入力した符号化デ
ータを復号化する復号化装置であって、 入力符号化データから、前記第2符号化手段によって符
号化されたデータを分離する符号化データ分離手段と、 入力符号化データ中の前記第1符号化手段によって符号
化されたデータを復号化する第1復号化手段と、 前記第1復号化手段の復号化結果を逆量子化し、前記各
バンドのスペクトルデータを出力する第1逆量子化手段
と、 前記第2符号化手段によって符号化されたデータを復号
化する第2復号化手段と、 前記第2復号化手段の復号化結果を所定の関数を用いて
逆変換した上、所定の正規化係数を用いて逆量子化し、
前記各バンドにおいてピークとなるスペクトルデータに
隣接したため、前記第1量子化手段による量子化結果が
所定値となった連続するスペクトルデータを復元する第
2逆量子化手段と、 前記第1逆量子化手段によって出力されたスペクトルデ
ータのうち、前記バンドごとに、1スペクトルデータの
前後に隣接し、かつ、いずれも連続して所定値となる複
数のスペクトルデータの値を、前記第2逆量子化手段に
よって復元されたスペクトルデータの値で置換した後、
逆変換し、時間軸上の音響信号として出力する音響信号
出力手段とを備えることを特徴とする復号化装置。
35. A decoding device for inputting the encoded data encoded by the encoding device according to claim 20 and decoding the input encoded data, wherein the second encoded data is extracted from the input encoded data. Coded data separation means for separating the data coded by the coding means; first decoding means for decoding the data coded by the first coding means in the input coded data; The first dequantizing means for dequantizing the decoding result of the first decoding means and outputting the spectrum data of each band, and the second decoding for decoding the data encoded by the second encoding means Means and inversely transforming the decoding result of the second decoding means using a predetermined function, and then inverse quantizing using a predetermined normalization coefficient,
Second dequantization means for reconstructing continuous spectrum data whose quantization result by the first quantization means has a predetermined value, since the spectrum data is adjacent to the peak spectrum data in each band, and the first dequantization means Of the spectrum data output by the means, a plurality of spectrum data values that are adjacent before and after one spectrum data for each band, and that are all continuously predetermined values, are used as the second dequantization means. After substituting with the values of the spectral data restored by
A decoding device, comprising: an acoustic signal output unit that performs inverse conversion and outputs as an acoustic signal on a time axis.
【請求項36】 請求項22記載の符号化装置によって
符号化された符号化データを入力し、入力した符号化デ
ータを復号化する復号化装置であって、 入力符号化データから、前記第2符号化手段によって符
号化されたデータを分離する符号化データ分離手段と、 入力符号化データ中の前記第1符号化手段によって符号
化されたデータを復号化する第1復号化手段と、 前記第1復号化手段の復号化結果を逆量子化し、前記各
バンドのスペクトルデータを出力する第1逆量子化手段
と、 前記第2符号化手段によって符号化されたデータを復号
化する第2復号化手段と、 前記第2復号化手段の復号化結果から前記調整された正
規化係数と前記第2量子化手段による量子化結果とを抽
出し、抽出された量子化結果を前記所定の関数を用いて
逆変換した上、抽出された前記正規化係数を用いて逆量
子化し、前記各バンドにおいてピークとなるスペクトル
データに隣接したため、前記第1量子化手段による量子
化結果が所定値となった連続するスペクトルデータを復
元する第2逆量子化手段と、 前記第1逆量子化手段によって出力されたスペクトルデ
ータのうち、前記バンドごとに、1スペクトルデータの
前後に隣接し、かつ、いずれも連続して所定値となる複
数のスペクトルデータの値を、前記第2逆量子化手段に
よって復元されたスペクトルデータの値で置換した後、
逆変換し、時間軸上の音響信号として出力する音響信号
出力手段とを備えることを特徴とする復号化装置。
36. A decoding device for inputting the encoded data encoded by the encoding device according to claim 22, and decoding the input encoded data, wherein the second encoded data is converted into the second encoded data from the input encoded data. Coded data separation means for separating the data coded by the coding means; first decoding means for decoding the data coded by the first coding means in the input coded data; The first dequantizing means for dequantizing the decoding result of the first decoding means and outputting the spectrum data of each band, and the second decoding for decoding the data encoded by the second encoding means Means for extracting the adjusted normalization coefficient and the quantization result by the second quantization means from the decoding result of the second decoding means, and using the extracted quantization result by using the predetermined function. Reverse conversion In addition, since it is dequantized by using the extracted normalization coefficient and is adjacent to the spectrum data that has a peak in each band, continuous spectrum data in which the quantization result by the first quantization means has a predetermined value A second dequantization unit that restores, and among the spectrum data output by the first dequantization unit, adjacent to one spectrum data before and after each spectrum data for each band, and all of them are continuously predetermined values. After replacing the values of the plurality of spectrum data with the values of the spectrum data restored by the second inverse quantization means,
A decoding device, comprising: an acoustic signal output unit that performs inverse conversion and outputs as an acoustic signal on a time axis.
【請求項37】 入力された音響信号を符号化する符号
化装置に用いられるプログラムであって、 コンピュータを請求項1〜22のいずれか1項記載の符
号化装置が備える各手段として機能させるプログラム。
37. A program used in an encoding device for encoding an input acoustic signal, the program causing a computer to function as each unit included in the encoding device according to claim 1. .
【請求項38】 符号化装置によって符号化された符号
化データを入力し、入力された符号化データを復号化す
る復号化装置に用いられるプログラムであって、 コンピュータを請求項23〜36のいずれか1項記載の
復号化装置が備える各手段として機能させるプログラ
ム。
38. A program used in a decoding device for inputting encoded data encoded by an encoding device and decoding the input encoded data, comprising a computer. A program that causes each unit included in the decoding device according to item 1 to function.
【請求項39】 請求項37記載のプログラムを記録し
たコンピュータ読み取り可能な記録媒体。
39. A computer-readable recording medium recording the program according to claim 37.
【請求項40】 請求項38記載のプログラムを記録し
たコンピュータ読み取り可能な記録媒体。
40. A computer-readable recording medium in which the program according to claim 38 is recorded.
【請求項41】 低ビットレートのビットストリームに
圧縮符号化された音響データを記録媒体または伝送媒体
を介して配信するための音響データ配信システムであっ
て、 請求項1、3、7〜12、18〜20及び22のいずれ
か1項に記載の符号化装置と請求項23〜36のいずれ
か1項に記載の復号化装置とから構成されることを特徴
とする音響データ配信システム。
41. An acoustic data distribution system for distributing acoustic data compressed and encoded into a low bit rate bit stream through a recording medium or a transmission medium, wherein the acoustic data distribution system comprises: An audio data distribution system comprising the encoding device according to any one of 18 to 20 and 22 and the decoding device according to any one of claims 23 to 36.
JP2001381807A 2001-11-02 2001-12-14 Encoding device, decoding device, and encoding method Expired - Fee Related JP3984468B2 (en)

Priority Applications (16)

Application Number Priority Date Filing Date Title
JP2001381807A JP3984468B2 (en) 2001-12-14 2001-12-14 Encoding device, decoding device, and encoding method
PCT/JP2002/011254 WO2003038812A1 (en) 2001-11-02 2002-10-30 Audio encoding and decoding device
CN02809440.9A CN1288622C (en) 2001-11-02 2002-10-30 Encoding and decoding device
EP02775411A EP1440432B1 (en) 2001-11-02 2002-10-30 Audio encoding and decoding device
EP02775413A EP1440433B1 (en) 2001-11-02 2002-10-30 Audio encoding and decoding device
PCT/JP2002/011255 WO2003038389A1 (en) 2001-11-02 2002-10-30 Encoding device, decoding device and audio data distribution system
DE60204038T DE60204038T2 (en) 2001-11-02 2002-10-30 DEVICE FOR CODING BZW. DECODING AN AUDIO SIGNAL
DE60208426T DE60208426T2 (en) 2001-11-02 2002-10-30 DEVICE FOR SIGNAL CODING, SIGNAL DECODING AND SYSTEM FOR DISTRIBUTING AUDIO DATA
PCT/JP2002/011256 WO2003038813A1 (en) 2001-11-02 2002-10-30 Audio encoding and decoding device
EP02775412A EP1440300B1 (en) 2001-11-02 2002-10-30 Encoding device, decoding device and audio data distribution system
DE60204039T DE60204039T2 (en) 2001-11-02 2002-10-30 DEVICE FOR CODING AND DECODING AUDIO SIGNALS
CN02803419.8A CN1209744C (en) 2001-11-02 2002-10-30 Coding device and decoding device
CNB02803421XA CN1324558C (en) 2001-11-02 2002-10-30 Coding device and decoding device
US10/285,609 US7283967B2 (en) 2001-11-02 2002-11-01 Encoding device decoding device
US10/285,627 US7392176B2 (en) 2001-11-02 2002-11-01 Encoding device, decoding device and audio data distribution system
US10/285,633 US7328160B2 (en) 2001-11-02 2002-11-01 Encoding device and decoding device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001381807A JP3984468B2 (en) 2001-12-14 2001-12-14 Encoding device, decoding device, and encoding method

Publications (2)

Publication Number Publication Date
JP2003186499A true JP2003186499A (en) 2003-07-04
JP3984468B2 JP3984468B2 (en) 2007-10-03

Family

ID=27592365

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001381807A Expired - Fee Related JP3984468B2 (en) 2001-11-02 2001-12-14 Encoding device, decoding device, and encoding method

Country Status (1)

Country Link
JP (1) JP3984468B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7205910B2 (en) 2002-08-21 2007-04-17 Sony Corporation Signal encoding apparatus and signal encoding method, and signal decoding apparatus and signal decoding method
JP2007523366A (en) * 2004-01-20 2007-08-16 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション Audio coding based on block sequencing
JP2009198612A (en) * 2008-02-19 2009-09-03 Fujitsu Ltd Encoding device, encoding method and encoding program
JP2011509428A (en) * 2007-12-31 2011-03-24 エルジー エレクトロニクス インコーポレイティド Audio signal processing method and apparatus
US8645127B2 (en) 2004-01-23 2014-02-04 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US8805696B2 (en) 2001-12-14 2014-08-12 Microsoft Corporation Quality improvement techniques in an audio encoder

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8805696B2 (en) 2001-12-14 2014-08-12 Microsoft Corporation Quality improvement techniques in an audio encoder
US9443525B2 (en) 2001-12-14 2016-09-13 Microsoft Technology Licensing, Llc Quality improvement techniques in an audio encoder
US7205910B2 (en) 2002-08-21 2007-04-17 Sony Corporation Signal encoding apparatus and signal encoding method, and signal decoding apparatus and signal decoding method
JP2007523366A (en) * 2004-01-20 2007-08-16 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション Audio coding based on block sequencing
US8645127B2 (en) 2004-01-23 2014-02-04 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP2014240963A (en) * 2004-01-23 2014-12-25 マイクロソフト コーポレーション Efficient decoding of digital media spectral data using wide-sense perceptual similarity
JP2017037311A (en) * 2004-01-23 2017-02-16 マイクロソフト テクノロジー ライセンシング,エルエルシー Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP2011509428A (en) * 2007-12-31 2011-03-24 エルジー エレクトロニクス インコーポレイティド Audio signal processing method and apparatus
US9659568B2 (en) 2007-12-31 2017-05-23 Lg Electronics Inc. Method and an apparatus for processing an audio signal
JP2009198612A (en) * 2008-02-19 2009-09-03 Fujitsu Ltd Encoding device, encoding method and encoding program

Also Published As

Publication number Publication date
JP3984468B2 (en) 2007-10-03

Similar Documents

Publication Publication Date Title
EP1440432B1 (en) Audio encoding and decoding device
EP1801784B1 (en) Audio signal encoding and decoding device, method, program and recording medium
RU2422987C2 (en) Complex-transform channel coding with extended-band frequency coding
JP4899359B2 (en) Signal encoding apparatus and method, signal decoding apparatus and method, program, and recording medium
US7333929B1 (en) Modular scalable compressed audio data stream
USRE46082E1 (en) Method and apparatus for low bit rate encoding and decoding
JP2005202248A (en) Audio encoding device and frame region allocating circuit of audio encoding device
JP2011059714A (en) Signal encoding device and method, signal decoding device and method, and program and recording medium
EP1905034A1 (en) Virtual source location information based channel level difference quantization and dequantization method
JP3923783B2 (en) Encoding device and decoding device
US7583804B2 (en) Music information encoding/decoding device and method
JP3255022B2 (en) Adaptive transform coding and adaptive transform decoding
JP2003150198A (en) Voice encoding device and voice decoding device
JP2003186499A (en) Encoding device and decoding device
JP4317355B2 (en) Encoding apparatus, encoding method, decoding apparatus, decoding method, and acoustic data distribution system
JP2004246038A (en) Speech or musical sound signal encoding method, decoding method, encoding device, decoding device, encoding program, and decoding program
JP2006047561A (en) Audio signal encoding device and audio signal decoding device
JP2003195894A (en) Encoding device, decoding device, encoding method, and decoding method
JP2820096B2 (en) Encoding and decoding methods
JP2005004119A (en) Sound signal encoding device and sound signal decoding device
JP2002157000A (en) Encoding device and decoding device, encoding processing program and decoding processing program, recording medium with recorded encoding processing program or decoding processing program, and broadcasting system using encoding device or decoding device
JP2003029797A (en) Encoder, decoder and broadcasting system
JP2001109497A (en) Audio signal encoding device and audio signal encoding method
JP5569476B2 (en) Signal encoding apparatus and method, signal decoding apparatus and method, program, and recording medium
JPH10233691A (en) Encoding system and decoding system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070403

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070518

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070612

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070706

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100713

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3984468

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110713

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110713

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120713

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120713

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130713

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees