JPH09200056A - Audio signal coding method and audio signal coder - Google Patents
Audio signal coding method and audio signal coderInfo
- Publication number
- JPH09200056A JPH09200056A JP8026004A JP2600496A JPH09200056A JP H09200056 A JPH09200056 A JP H09200056A JP 8026004 A JP8026004 A JP 8026004A JP 2600496 A JP2600496 A JP 2600496A JP H09200056 A JPH09200056 A JP H09200056A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- information
- residual
- band
- supplied
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、デジタル音響信号
等をデータ圧縮する符号化方法と符号化装置に係り、特
に、符号化前のデジタル音響信号(元信号)に対して、
これを圧縮した符号化信号から伸張して得られる復号化
信号を、情報欠落のない(Loss Less )状態で再生する
ことができる、音響信号符号化方法及びその装置に関す
るものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a coding method and a coding apparatus for compressing a digital audio signal or the like, and more particularly to a digital audio signal (original signal) before coding.
The present invention relates to an audio signal coding method and an apparatus therefor capable of reproducing a decoded signal obtained by decompressing the compressed coded signal in a state without information loss (Loss Less).
【0002】[0002]
【従来の技術】一般に、単純にデジタル変換された音響
信号は、ホワイトノイズのようなランダムデータでない
限り何らかの連続性または冗長性を持っており、この性
質を用いたいくつかの可逆圧縮方式(Loss Less 圧縮方
式)が知られている。そして、この時間軸上の隣り合う
サンプルが相関性(連続性)を持つことは音響信号を観
察すれば容易に把握できる。また、音響信号の振幅分布
には一般に偏りがあり、これをデジタル化した信号は、
各ビットが「0」または「1」となる生起確率に規則性
が見られる。この偏りが大きくなると音響信号の持つ冗
長度も拡大する。2. Description of the Related Art Generally, a sound signal simply digitally converted has some continuity or redundancy unless it is random data such as white noise, and some lossless compression methods (Loss Less compression method) is known. The fact that adjacent samples on this time axis have correlation (continuity) can be easily understood by observing the acoustic signal. In addition, the amplitude distribution of the acoustic signal generally has a bias, and the digitized signal is
There is regularity in the occurrence probability that each bit is "0" or "1". When this bias increases, the redundancy of the acoustic signal also increases.
【0003】本発明者は、従来、可逆符号化方式として
は不適当とされた周波数変換符号化方式に対して時間領
域の補正を用いることにより、効率的かつ完全な可逆性
を保持した音響信号の符号化方式及びその復号化方式を
特願平7−211220号にて出願した。The present inventor has used the time domain correction for the frequency conversion coding method, which has been conventionally considered unsuitable as the lossless coding method, and thereby efficiently and completely retains the reversibility of the acoustic signal. The encoding system and the decoding system thereof were applied for in Japanese Patent Application No. 7-2111220.
【0004】この出願による音響信号符号化装置では、
音響信号の持つ周波数分布の偏差を利用するために、周
波数領域情報生成部においてデジタル音響信号を帯域分
割した後、個々の帯域について求めたエネルギー値を基
に、情報量に応じたビット配分により量子化されたサン
プル値を周波数領域の情報として符号化し、時間領域情
報生成部において、周波数領域情報生成部から供給され
る量子化後のサンプル値を逆量子化し、これを時間領域
信号へ再変換するために帯域合成を行われた後の信号と
元信号との残差信号を時間領域の情報として符号化し、
この両者を多重化部において多重化することにより、可
逆圧縮の符号化を行っていた。In the acoustic signal encoding device according to this application,
In order to use the deviation of the frequency distribution of the acoustic signal, the frequency domain information generator divides the digital acoustic signal into bands, and then based on the energy value obtained for each band, quantum distribution is performed by bit allocation according to the amount of information. The encoded sample value is encoded as frequency domain information, and the time domain information generation unit dequantizes the quantized sample value supplied from the frequency domain information generation unit and reconverts it into a time domain signal. In order to encode the residual signal of the signal after the band synthesis and the original signal as time domain information,
Reversible compression encoding was performed by multiplexing both of these in a multiplexing unit.
【0005】そして、音響信号復号化装置で、供給され
た多重化信号を周波数領域の情報と残差信号とに分離
し、周波数領域の情報を帯域合成した後に残差信号によ
って補正することにより、元信号と同一のデジタル音響
信号を得ていた。Then, in the acoustic signal decoding device, the supplied multiplexed signal is separated into frequency domain information and residual signal, and the frequency domain information is band-combined and then corrected by the residual signal. I was getting the same digital audio signal as the original signal.
【0006】なお、復号後信号が完全に元信号と一致す
るために、符号化装置における帯域合成部と復号化装置
における帯域合成部とは共通な構成を持ち、演算精度及
び丸め処理は同一手法を取るようにしていた。この結
果、符号化装置において帯域合成された信号と元信号と
の差分値を求め、これを時間領域の情報として符号化し
伝送することで、復号化装置において帯域合成後の信号
に時間領域の補正値を加算し復号された信号は元信号と
完全に同じになる。Since the decoded signal completely matches the original signal, the band synthesizing unit in the encoding device and the band synthesizing unit in the decoding device have a common configuration, and the calculation accuracy and the rounding process are the same method. I was trying to take it. As a result, the difference value between the band-combined signal and the original signal in the encoding device is obtained, and this is encoded and transmitted as information in the time domain, so that the decoding device corrects the time domain in the signal after the band combination. The added signal and the decoded signal become exactly the same as the original signal.
【0007】そして、音響信号を周波数領域と時間領域
の両者の情報を多重化し符号化する可逆圧縮符号化方式
及びその復号化方式は、音響信号を周波数領域で扱うこ
とによって、信号の持つスペクトル分布の偏差から生じ
る冗長性を信号の種類(様々なジャンルのオーディオソ
ース)によらず効果的に削減することができ、さらに時
間領域信号である残差信号を補正のために用いることで
確実に元信号への復元を可能としている。また、この方
式は周波数領域単体で符号化する場合に比べ、周波数領
域信号の量子化精度を厳密に算出しなくても完全可逆圧
縮を行うことができる。The lossless compression coding method and the decoding method for multiplexing and coding the information of both the frequency domain and the time domain of the acoustic signal are the spectral distribution of the signal by treating the acoustic signal in the frequency domain. The redundancy caused by the deviation of can be effectively reduced regardless of the type of signal (audio sources of various genres), and the residual signal, which is a time domain signal, can be used for correction to ensure the original. It is possible to restore the signal. In addition, this method can perform completely lossless compression without strictly calculating the quantization accuracy of the frequency domain signal, as compared with the case of encoding in the frequency domain alone.
【0008】また、可逆符号化方式とは異なるが、帰還
構造を取り入れた音響信号処理方式としては、機械振動
音等のノイズ成分、例えば空調のファンの音や自動車の
エンジン音を積極的に削減する能動的騒音制御方式があ
る。これらは自らの信号(ノイズ成分)を解析し、逆位
相成分を元信号と重ねることによってノイズ成分として
扱われる音響信号を打ち消している。この帰還構造を取
り入れた方式は、例えば、特開平5−80777号等に
開示されている。Although different from the reversible coding system, as an acoustic signal processing system incorporating a feedback structure, noise components such as mechanical vibration noise, for example, noise of an air conditioning fan or engine sound of an automobile is actively reduced. There are active noise control methods. These analyze the own signal (noise component) and cancel the acoustic signal treated as a noise component by superimposing the antiphase component on the original signal. A method incorporating this feedback structure is disclosed in, for example, Japanese Patent Application Laid-Open No. 5-80777.
【0009】そして、同じく帰還構造を取り入れた音響
信号処理方式として、復号後の信号と元信号との差を元
信号に帰還し、符号化を繰り返すことによって聴覚心理
モデルが原因となり生じた量子化ノイズを低減すること
を目的とした高能率符号化方式が特開平4−18501
7号に開示されている。Similarly, as an acoustic signal processing method incorporating a feedback structure, the difference between the decoded signal and the original signal is fed back to the original signal, and the encoding is repeated, thereby causing the quantization caused by the psychoacoustic model. A high-efficiency coding method aimed at reducing noise is disclosed in Japanese Patent Laid-Open No. 18501/1991.
No. 7.
【0010】[0010]
【発明が解決しようとする課題】先に本発明者が特願平
7−211220号にて出願した音響信号の可逆符号化
方式及び復号化方式は、時間領域の残差信号の符号化に
おけるグループ毎のビット配分を決定する手段におい
て、グループ内サンプルの振幅最大値を表現することが
可能な最小限のビット数を目安にして残差信号のビット
配分を決定していた。DISCLOSURE OF INVENTION Problems to be Solved by the Invention The lossless encoding method and the decoding method of the acoustic signal, which the present inventor applied for in Japanese Patent Application No. 7-211220, are grouped in encoding the residual signal in the time domain. In the means for determining the bit allocation for each, the bit allocation of the residual signal has been determined by using the minimum number of bits capable of expressing the maximum amplitude value of the samples in the group as a guide.
【0011】ここで、符号化される時間領域の残差信号
は帯域合成のときの演算誤差によって生じる。この演算
誤差は確率統計論に従えば、量子化ステップ幅Δのとき
の一回の乗算においては、図11に示すように、±Δ/
2の範囲で均一に分布する。そして、この演算誤差を含
むデータの加算を繰り返すと、生成される最終データに
含まれる演算誤差は、加算回数をnとすると図12に示
すように、±n×Δ/2の範囲の正規分布を形成するこ
とになる。この演算誤差は入力信号とは独立の関係にあ
り、残差信号の総情報量は総演算量に比例する。情報学
においてシャノンの定理より導かれる符号化情報量には
限界値があり、この場合、時間領域情報の符号化におけ
る符号化情報量の限界値は、先の残差信号の総情報量と
なる。Here, the time domain residual signal to be encoded is caused by a calculation error at the time of band synthesis. According to the probability statistics theory, this calculation error is ± Δ / in one multiplication with a quantization step width Δ, as shown in FIG.
It is evenly distributed in the range of 2. When the addition of the data including the calculation error is repeated, the calculation error included in the final data generated has a normal distribution in the range of ± n × Δ / 2 as shown in FIG. Will be formed. This calculation error is independent of the input signal, and the total information amount of the residual signal is proportional to the total calculation amount. In informatics, there is a limit value for the coded information amount derived from Shannon's theorem. In this case, the limit value of the coded information amount in the time domain information coding is the total information amount of the residual signal. .
【0012】例えば、グループ内のそれぞれのサンプル
がほぼ同じ大きさの振幅であり、残差信号の平均振幅値
とビット割当量によって決まる最大許容振幅値との差が
小さければ、符号化総情報量は残差信号の総情報量に接
近し効果的な符号化が成されていることになる。一方、
グループ内の他のサンプルに対し著しく振幅の大きい残
差信号が存在する(標準偏差が大きい残差信号群)場合
は、この信号を表現するために他のサンプルが情報を持
たない上位ビットを数多く所有しなければならないた
め、符号化情報量は残差信号の総情報量よりはるかに大
きくなり、時間領域の情報量が増大して非効率的な符号
化が行われていることになる。For example, if each sample in the group has substantially the same amplitude and the difference between the average amplitude value of the residual signal and the maximum allowable amplitude value determined by the bit allocation amount is small, the total encoded information amount Indicates that effective coding is performed by approaching the total information amount of the residual signal. on the other hand,
If there is a residual signal with a significantly larger amplitude than the other samples in the group (a group of residual signals with a large standard deviation), many other high-order bits for which this sample has no information to represent this signal. Since it must be owned, the amount of coded information is much larger than the total amount of information of the residual signal, and the amount of information in the time domain increases, resulting in inefficient coding.
【0013】そして、帯域合成フィルタ演算のように加
算回数が多くなるほど、このような標準偏差の大きい残
差信号群となり、情報を持たない上位ビットを多く抱え
込んで符号化効率を下げていた。As the number of additions increases as in the band synthesizing filter calculation, the residual signal group has such a large standard deviation that many high-order bits without information are held and the coding efficiency is lowered.
【0014】また、帰還構造を取り入れることによって
ノイズ成分を積極的に打ち消す方法は、聴感上の気にな
るノイズ成分を除去するものであり、特定の周波数帯を
対象としたもので、演算誤差のように帯域内にまんべん
なく分散されるノイズ信号に適用することは困難であっ
た。さらに、演算誤差によって生じるノイズ成分そのも
のの総量を減らすことはできなかった。したがって、音
響信号を伝送するために、演算誤差によるノイズ成分を
符号化する際に、従来の能動的騒音制御方式をそのまま
適用しても符号化情報量を低減することはできなかっ
た。Further, the method of positively canceling the noise component by introducing the feedback structure is to remove the noise component which is annoying to the auditory sense, and is intended for a specific frequency band, which causes a calculation error. As described above, it is difficult to apply it to a noise signal that is evenly distributed in the band. Furthermore, it has not been possible to reduce the total amount of noise components themselves caused by the calculation error. Therefore, when the noise component due to the calculation error is encoded to transmit the acoustic signal, it is not possible to reduce the encoded information amount even if the conventional active noise control method is applied as it is.
【0015】そして、聴覚心理モデルを原因として生じ
る量子化誤差を帰還構造を取り入れることによって抑圧
する方法は、非可逆圧縮であるので、本出願の目的(後
述する)である演算誤差振幅値分布の平坦化とは意図が
異なっている。さらに、この方法は、際だった量子化誤
差を防止するために残差信号を元信号の調整に用いてい
る。この方法は聴覚心理モデルを使う以上量子化誤差は
常に存在し、この量子化誤差を聴感上聞き分けられない
帯域に分散することで、聴覚心理モデルによる圧縮を行
っていないCD(コンパクトディスク)に匹敵する音響
信号を提供しようとするものである。したがって、量子
化誤差の帰還によって聴覚心理モデルを改善しているこ
とになるので、可逆符号化を目的とした特願平7−21
1220号の音響信号の可逆符号化方式に用いても効果
をあげることは困難である。Since the method of suppressing the quantization error caused by the psychoacoustic model by incorporating the feedback structure is the lossy compression, the calculation error amplitude value distribution which is the purpose of the present application (described later) is The intention is different from flattening. Moreover, this method uses the residual signal to adjust the original signal to prevent significant quantization errors. This method always has a quantization error as long as it uses a psychoacoustic model, and by dispersing this quantization error in a band that cannot be perceived by the sense of hearing, it is comparable to a CD (compact disc) that is not compressed by the psychoacoustic model. It is intended to provide an acoustic signal that Therefore, since the psychoacoustic model is improved by the feedback of the quantization error, Japanese Patent Application No. 7-21 which aims at the reversible encoding.
Even if it is used for the lossless encoding method of the audio signal No. 1220, it is difficult to improve the effect.
【0016】また、この特願平7−211220号の音
響信号の可逆符号化方式において、符号化効率を向上さ
せるためには、グループ内残差信号の振幅平均値をその
ブロックのビット配分によって定められる最大許容振幅
値に近づけてグループ毎のビット配分を低減することが
好ましい。すなわち、個々のグループ内残差信号の振幅
平均値が大きくても最大振幅値が下がれば、ビット配分
を減少させることが可能であることを利用し、符号化品
質を向上させることができる。In the lossless coding method for acoustic signals of Japanese Patent Application No. 7-211220, in order to improve the coding efficiency, the average amplitude value of the intra-group residual signal is determined by the bit allocation of the block. It is preferable to reduce the bit allocation for each group closer to the maximum allowable amplitude value. That is, it is possible to improve the coding quality by utilizing the fact that the bit allocation can be reduced if the maximum amplitude value decreases even if the average amplitude value of the residual signals in each group is large.
【0017】そして、入力信号と独立の関係にある演算
誤差によって生じる残差成分の総情報量は、入力信号の
種類に関係なく、確率論に従ったある一定の情報量とな
るので、本出願人が先に出願した音響信号符号化方式に
対して従来の帰還構造を取り入れても符号化情報量の削
減を行うことはできなかった。Since the total amount of information of the residual component generated by the calculation error which is independent of the input signal is a certain amount of information according to the probability theory regardless of the type of the input signal, the present application It was not possible to reduce the amount of coded information even if the conventional feedback structure was adopted for the acoustic signal coding method that a person previously applied for.
【0018】そこで、本発明は時間領域の情報量を削減
するために、ブロック毎の残差信号の平均化を図るべく
残差信号の分析を行い、これに基づいたパルス信号を生
成し元信号に付加させ再符号化を実行することにより、
時間領域のビット配分を低減し、符号化総情報量の少な
い、効率的かつ完全な可逆性を保持した音響信号の符号
化方式を提供することを目的とする。Therefore, according to the present invention, in order to reduce the amount of information in the time domain, the residual signal is analyzed in order to average the residual signal for each block, and a pulse signal based on this is generated to generate the original signal. , And re-encoding,
An object of the present invention is to provide an audio signal encoding method that reduces the bit allocation in the time domain, has a small amount of encoded total information, and that maintains efficient and complete reversibility.
【0019】[0019]
【課題を解決するための手段】上記目的を達成するため
の手段として、元信号として供給される時間領域情報の
デジタル音響信号を帯域分割して符号化した周波数領域
情報のデジタル音響信号とする第1の工程と、この第1
の工程にて符号化された周波数領域情報のデジタル音響
信号を帯域合成したデジタル音響信号と前記元信号とし
て供給される時間領域情報のデジタル音響信号との残差
信号を時間領域情報として生成する第2の工程と、この
第2の工程にて符号化された時間領域情報の残差信号を
構成するフレーム内で各サンプルの情報量を平均化する
ためのパルス信号を発生させて前記元信号に付加する第
3の工程とよりなり、前記残差信号と前記周波数領域情
報のデジタル音響信号とを多重化して出力することを特
徴とする音響信号符号化方法、及び、元信号として供給
される時間領域情報のデジタル音響信号を一時記録する
入力信号合成部と、この入力信号合成部より供給される
時間領域情報のデジタル音響信号を帯域分割する帯域分
割フィルタと、この帯域分割フィルタより供給される前
記周波数領域情報のデジタル音響信号を符号化する量子
化器と、この量子化器より供給される信号を逆量子化す
る逆量子化器と、この逆量子化器より供給される信号を
帯域合成して時間領域情報の信号へ再変換する帯域合成
フィルタと、この帯域合成フィルタより供給される時間
領域情報の信号と前記元信号として供給される時間領域
情報のデジタル音響信号との残差信号を生成する残差計
算部と、この残差計算部より供給される前記残差信号を
構成するフレーム内で各サンプルの情報量を平均化する
ためのパルス信号を生成し、前記入力信号合成部に出力
するパルス生成器と、前記残差計算部より供給される前
記残差信号と前記量子化器より供給される信号とを多重
化する多重化部とを有することを特徴とする音響信号符
号化装置を提供しようとするものである。As means for achieving the above object, a digital acoustic signal of frequency domain information obtained by band-dividing and encoding a digital acoustic signal of time domain information supplied as an original signal is provided. Step 1 and this first
Generating a residual signal as time-domain information between the digital acoustic signal obtained by band-synthesizing the digital acoustic signal of the frequency domain information encoded in the step of (1) and the digital acoustic signal of the time domain information supplied as the original signal. In the second step, a pulse signal for averaging the information amount of each sample is generated in the frame forming the residual signal of the time domain information coded in the second step, and the original signal is generated. And a third step of adding, wherein the residual signal and the digital acoustic signal of the frequency domain information are multiplexed and output, and an audio signal encoding method, and a time supplied as an original signal. An input signal synthesizing unit for temporarily recording the digital acoustic signal of the domain information, a band division filter for band-dividing the digital acoustic signal of the time domain information supplied from the input signal synthesizing unit, Quantizer for encoding the digital acoustic signal of the frequency domain information supplied from the band division filter, dequantizer for dequantizing the signal supplied from this quantizer, and dequantizer A band synthesizing filter for band-synthesizing the supplied signals to re-convert it into a signal of time domain information, and a signal of the time domain information supplied from this band synthesizing filter and a digital sound of the time domain information supplied as the original signal. And a residual calculation unit for generating a residual signal with the signal, and a pulse signal for averaging the information content of each sample in the frame constituting the residual signal supplied from the residual calculation unit. A pulse generator for outputting to the input signal synthesizer, and a multiplexer for multiplexing the residual signal supplied from the residual calculator and the signal supplied from the quantizer. Special It is intended to provide an acoustic signal encoding apparatus according to.
【0020】[0020]
【発明の実施の形態】演算過程における四捨五入などに
よる誤差成分は、不確定要素を含むので予測することが
できない。演算過程における誤差成分は、入力データ及
び演算に必要な係数等の値に誤差を含まないと仮定すれ
ば、乗算におけるある定められた任意の演算精度を保証
するために、その演算精度以下となる情報が四捨五入に
よって上位にまるめられることによって生じることにな
る。先の出願ではこの演算誤差を時間領域の補正情報と
して符号化していたが、この時間領域部分は情報圧縮さ
れておらず、この部分においては冗長性が残されてい
た。BEST MODE FOR CARRYING OUT THE INVENTION The error component due to rounding in the calculation process cannot be predicted because it includes an uncertain factor. The error component in the calculation process is equal to or lower than the calculation precision in order to guarantee a certain predetermined calculation precision in the multiplication, assuming that the input data and the values of the coefficients required for the calculation do not include an error. It occurs when information is rounded up to the top. In the previous application, this calculation error was coded as correction information in the time domain, but this time domain portion was not information-compressed, and redundancy was left in this portion.
【0021】時間領域の情報を効率的に符号化するに
は、ブロック化されたグループ内サンプルの振幅値を平
均化し、この平均値に合わせたビット割り当てを行うよ
うにすればよい。あるブロック(フレーム)内の残差信
号のサンプル群が図13(A)で示されるサンプル群で
あったとすると、このサンプル群の最大値Maxを表現
するには、最低7ビットが必要となる。したがって、こ
の残差信号グループのビット割当を7ビットにしなけれ
ばならないが、この残差信号のMax値(以後Max信
号とする)を6ビットで表現できる値に低減すれば、M
ax信号を含む残差信号のグループのビット割当を6ビ
ットにして、1ビット削減することができる。In order to efficiently code the information in the time domain, the amplitude values of the blocked intra-group samples may be averaged and the bit allocation may be performed in accordance with this average value. If the sample group of the residual signal in a certain block (frame) is the sample group shown in FIG. 13A, at least 7 bits are required to express the maximum value Max of this sample group. Therefore, the bit allocation of this residual signal group must be 7 bits, but if the Max value of this residual signal (hereinafter referred to as the Max signal) is reduced to a value that can be represented by 6 bits, M
The bit allocation of the group of residual signals including the ax signal can be reduced to 1 bit by setting 6 bits.
【0022】Max信号を低減する方法としては、パル
ス信号をMax信号の位置に付加することにより行う。
即ち、本発明ではMax信号の振幅値を調整し符号反転
したパルス信号を元信号に加え、再度、周波数変換、逆
変換を施している。この場合、出力される信号は、図1
3(A)に示す残差信号に図13(B)に示すパルス信
号を重ね合わした図13(C)に示すような新たな残差
信号が出力されることになる。As a method of reducing the Max signal, a pulse signal is added to the position of the Max signal.
That is, in the present invention, the amplitude value of the Max signal is adjusted and the sign-inverted pulse signal is added to the original signal, and frequency conversion and inverse conversion are performed again. In this case, the output signal is as shown in FIG.
A new residual signal as shown in FIG. 13 (C) is output by superimposing the pulse signal shown in FIG. 13 (B) on the residual signal shown in FIG. 3 (A).
【0023】これは、図14(A)に示すようなパルス
信号を周波数領域へ展開した後、さらに時間領域へ再展
開すると(その周波数変換法や演算精度によって異なる
が)、図14(B)に示すように、パルス信号の位置を
中心としてその周囲のサンプリング点に、わずかながら
分散または量子化による演算誤差を原因とする微小なパ
ルス信号(ノイズ信号)が現れることから、図13
(A)に示す残差信号のMax信号の位置にパルス信号
を付加した後に周波数変換、逆変換を施したものは、図
13(B)に示すパルス信号を重ね合わせた図13
(C)に示す残差信号となる。なお、図14(B)に示
されるこれらのノイズ信号は、パルス信号と比較して非
常に微小な信号であるため、他のサンプリング点の信号
にはほとんど影響を与えない。This is because when a pulse signal as shown in FIG. 14 (A) is expanded in the frequency domain and then further expanded in the time domain (depending on the frequency conversion method and calculation accuracy), FIG. 14 (B) As shown in FIG. 13, since a minute pulse signal (noise signal) caused by a calculation error due to dispersion or quantization appears slightly at the sampling points around the position of the pulse signal as shown in FIG.
13A is obtained by adding the pulse signal to the position of the Max signal of the residual signal shown in FIG. 13A and then performing frequency conversion and inverse conversion.
The residual signal shown in (C) is obtained. Since these noise signals shown in FIG. 14B are extremely small signals as compared with the pulse signals, they hardly affect the signals at other sampling points.
【0024】また、残差信号グループ(フレーム)の中
には図13(A)に示す残差信号のように、1サンプル
のみ突出しているものだけでなく、複数サンプルが他の
グループ内信号に比べて大きい場合も存在する。しか
し、その場合は、複数回に渡ってパルス信号をMax信
号に重ね合わせる処理を行えば、対象とするグループ内
においてより平均化された残差信号を得ることができ
る。また、予め、グループ内の残差信号の情報量より削
減可能なビット割当数を計算し、複数のパルス信号から
なる元信号調整パルス群を重ね合わせることにより、一
度に平均化された残差信号を得るようにしてもよい。以
下に示す実施例では、複数回に渡って重ね合わせる場合
について説明している。In the residual signal group (frame), not only the residual signal shown in FIG. 13 (A), in which only one sample is projected, but a plurality of samples are included in signals in other groups. There are cases where it is larger than that. However, in that case, if the pulse signal is superimposed on the Max signal a plurality of times, a more averaged residual signal can be obtained in the target group. In addition, the number of bit allocations that can be reduced from the information amount of the residual signal in the group is calculated in advance, and the original signal adjustment pulse group composed of a plurality of pulse signals is superposed to obtain the residual signal averaged at one time. May be obtained. In the embodiment described below, the case where the layers are overlapped a plurality of times has been described.
【0025】以上説明したように、時間領域上の残差信
号を把握して適当なパルス信号を生成し、これを元信号
と重ね合わせてから再度符号化を行うことによって、時
間領域情報の効率的な情報圧縮を成し得ることができ
る。これを本出願人が先に出願した音響信号符号化方法
に適用することにより、より一層符号化効率を向上させ
ることができる。As described above, by grasping the residual signal in the time domain, generating an appropriate pulse signal, superimposing this on the original signal, and encoding again, the efficiency of the time domain information is improved. Information compression can be achieved. By applying this to the acoustic signal coding method previously filed by the applicant, the coding efficiency can be further improved.
【0026】[0026]
【実施例】本発明の音響信号符号化方法及び音響信号符
号化装置の一実施例を図面と共に説明する。図1は本発
明の音響信号符号化装置の一実施例を示す構成図であ
り、図6はその動作を示すフローチャート図である。そ
して、各図を参考にして、音響信号符号化方法の一実施
例についても同時に説明する。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of an acoustic signal coding method and an acoustic signal coding device of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing an embodiment of an audio signal encoding apparatus of the present invention, and FIG. 6 is a flow chart showing its operation. An embodiment of the acoustic signal coding method will be described at the same time with reference to the drawings.
【0027】図1に示す音響信号符号化装置は、パルス
発生器12、入力信号合成部13、周波数領域情報生成
部A、時間領域情報生成部B及び多重化部(多重化器)
9により構成されている。そして、周波数領域情報生成
部Aは、帯域分割フィルタ1、最大値選択部2、ビット
配分部3、量子化器4とにより構成され、時間領域情報
生成部Bは、逆量子化器5、帯域合成フィルタ6、遅延
器7、残差計算部8とにより構成されている。また、入
力されるデジタル音響信号は、フレームを処理単位とす
るブロックで形成されている。本実施例では、1フレー
ムを形成する音響信号を1チャンネルあたり512サン
プル、帯域分割幅を32バンドとしている。The acoustic signal coding apparatus shown in FIG. 1 includes a pulse generator 12, an input signal synthesizer 13, a frequency domain information generator A, a time domain information generator B and a multiplexer (multiplexer).
9. The frequency domain information generation unit A includes a band division filter 1, a maximum value selection unit 2, a bit allocation unit 3, and a quantizer 4, and the time domain information generation unit B includes an inverse quantizer 5 and a band. It is composed of a synthesis filter 6, a delay unit 7, and a residual calculation unit 8. Further, the input digital audio signal is formed of blocks in which a frame is a processing unit. In this embodiment, the acoustic signal forming one frame is 512 samples per channel, and the band division width is 32 bands.
【0028】そして、最下位ビット精度は任意のビット
幅で固定するが、ここでは16ビットの固定量子化精度
とし、これ以下の情報は四捨五入によって上位ビット
(最下位ビットである16ビット目)に反映する。周波
数領域のビット配分情報は4ビットでコード0〜16ビ
ットを表現し、時間領域のビット配分は3ビットでコー
ド0〜8ビットを表現するものとする。The least significant bit precision is fixed to an arbitrary bit width, but here, fixed quantization precision of 16 bits is used, and information below this is rounded to the upper bit (the 16th bit which is the least significant bit). reflect. The bit allocation information in the frequency domain represents 4 bits to represent a code 0 to 16 bits, and the time domain bit allocation represents 3 bits to represent a code 0 to 8 bits.
【0029】ここで、時間領域のビット配分幅はフィル
タの特性によるものであり、帯域合成にかかる積和演算
中の乗算回数に委ねられる。この演算での誤差の蓄積の
最悪値が時間配分ビット幅以内であれば、周波数領域の
ビット配分幅が最終的な量子化精度を保証することにな
る。本実施例では3ビットでコード化を行っているの
で、16ビット量子化精度を保証している。また、ビッ
ト配分幅を4ビットで表現すれば、24ビットの量子化
精度を持つ入力音響信号の可逆圧縮が可能となる。但し
この場合、時間領域情報が増大して符号化品質が悪くな
るため、周波数領域情報との効率的な情報量配分が必要
となる。Here, the bit allocation width in the time domain depends on the characteristics of the filter, and is left to the number of multiplications during the product-sum calculation for band synthesis. If the worst value of the accumulated error in this operation is within the time allocation bit width, the bit allocation width in the frequency domain guarantees the final quantization accuracy. In this embodiment, since encoding is performed with 3 bits, 16-bit quantization accuracy is guaranteed. If the bit allocation width is represented by 4 bits, it is possible to perform reversible compression of the input acoustic signal having a quantization accuracy of 24 bits. However, in this case, since the time domain information increases and the coding quality deteriorates, it is necessary to efficiently distribute the information amount with the frequency domain information.
【0030】そして、4ビットの周波数領域ビット配分
表を表1に示し、3ビットの時間領域ビット配分表を表
2に示す。なお、配分無しがコード0で、配分がある場
合は符号ビットを含めた形でコード2〜コード最大値の
間で設定している。A 4-bit frequency domain bit allocation table is shown in Table 1, and a 3-bit time domain bit allocation table is shown in Table 2. It should be noted that the code 0 indicates that there is no distribution, and if there is distribution, it is set between the code 2 and the code maximum value including the sign bit.
【0031】[0031]
【表1】 [Table 1]
【0032】[0032]
【表2】 [Table 2]
【0033】次に、図1に示す音響信号符号化装置の動
作について説明する。入力されるデジタル音響信号(元
信号)は、後述する遅延器7に供給されると共に入力信
号合成部13に供給される。そして、入力信号合成部1
3にて元信号を一時記録してから帯域分割フィルタ1に
出力される。この帯域分割フィルタ1では、時間領域情
報である入力信号を周波数領域情報へと展開している
(ステップ101)。ここでは、サブバンドフィルタを
32バンド等分割とし、そのバンド幅Wを次式のように
設定している。なお、出力されるサブバンドデータの精
度は前述したように最下位ビット精度である16ビット
とする。Next, the operation of the acoustic signal coding apparatus shown in FIG. 1 will be described. The input digital audio signal (original signal) is supplied to the delay device 7 described later and also to the input signal synthesis unit 13. Then, the input signal synthesizer 1
The original signal is temporarily recorded at 3 and then output to the band division filter 1. The band division filter 1 develops the input signal, which is time domain information, into frequency domain information (step 101). Here, the sub-band filter is equally divided into 32 bands, and the band width W thereof is set as in the following equation. The precision of the output subband data is 16 bits, which is the least significant bit precision as described above.
【0034】 W=(サンプリング周波数×0.5)/32 (Hz)W = (sampling frequency × 0.5) / 32 (Hz)
【0035】また、この帯域分割フィルタ1及び後述す
る帯域合成フィルタ6としては、例えばDCTのような
直交変換を行うフィルタ、フィルタの原理を利用したサ
ブバンドフィルタ、基底とする波形に信号を分解し表現
するウェーブレット変換、さらには、周波数変換の代表
的な方法であるフーリエ変換等が挙げられる。そして、
本発明では、時間領域の情報成分も利用していることか
ら、帯域分割合成後の信号が完全な元信号に戻る必要は
ないので、何れの周波数変換方法を用いても良い。本実
施例では説明を具体的にするために、512タップのサ
ブバンドフィルタ(ポリフェイズフィルタ)を用いるこ
とにする。なお、遅延は帯域分割合成を通して480サ
ンプル分生じる。As the band division filter 1 and the band synthesis filter 6 described later, for example, a filter for performing an orthogonal transformation such as DCT, a subband filter using the principle of the filter, a signal which is decomposed into a base waveform is used. The wavelet transform to be expressed, and further Fourier transform, which is a typical method of frequency transform, can be used. And
In the present invention, since the information component in the time domain is also used, it is not necessary to return the signal after the band division synthesis to the complete original signal, so any frequency conversion method may be used. In the present embodiment, a 512-tap subband filter (polyphase filter) will be used for concrete description. Note that the delay is generated by 480 samples through the band division synthesis.
【0036】帯域分割フィルタ1にて32バンド等分割
された周波数領域情報の音響信号は、最大値選択部2及
び量子化器4に供給される。最大値選択部2では、1フ
レーム内に存在する32バンド各々につき、16個(5
12/32個)あるサブバンドデータ(振幅値)または
エネルギー値の絶対値比較を行い、その最大値Sを選択
して出力する(ステップ102)。The acoustic signal of the frequency domain information divided into 32 equal bands by the band division filter 1 is supplied to the maximum value selection unit 2 and the quantizer 4. In the maximum value selection unit 2, for each of 32 bands existing in one frame, 16 (5
The absolute value comparison of certain sub-band data (amplitude value) or energy value is performed (12/32), and the maximum value S is selected and output (step 102).
【0037】そして、最大値選択部2より出力されるサ
ブバンドデータの最大値Sは、ビット配分部3に供給さ
れる。ビット配分部3では、各帯域(バンド)の最大値
Sを表1に示す周波数領域ビット配分表に参照して、3
2バンドそれぞれに対して割り当てられるビット数を決
定する(ステップ103)。ここでのビット配分は、表
1に示すように、最大値サンプルを2の補数表示で表現
するために、最小限必要なビット数に対応して行われ
る。Then, the maximum value S of the sub-band data output from the maximum value selection unit 2 is supplied to the bit allocation unit 3. The bit allocation unit 3 refers to the maximum value S of each band in the frequency domain bit allocation table shown in Table 1 and
The number of bits allocated to each of the two bands is determined (step 103). The bit allocation here is performed corresponding to the minimum number of bits required to represent the maximum value sample in 2's complement notation, as shown in Table 1.
【0038】量子化器4では、ビット配分部3より供給
されるビット配分情報に基づいて、帯域分割フィルタ1
より供給される周波数領域情報の音響信号の各サブバン
ドデータのビット数を削減する(ステップ104)。こ
こでの削減は、符号ビットと同一である上位ビットを符
号ビットを除いて(16−割当ビット数)個の削減とな
る。このサブバンドデータのビット数削減の例を表3に
示す。In the quantizer 4, based on the bit allocation information supplied from the bit allocation unit 3, the band division filter 1
The number of bits of each subband data of the acoustic signal of the frequency domain information supplied by the above is reduced (step 104). The reduction here is (16-the number of allocated bits) reductions of the upper bits that are the same as the sign bits, excluding the sign bits. Table 3 shows an example of reducing the number of bits of the subband data.
【0039】[0039]
【表3】 [Table 3]
【0040】表3に示すように、10進数で表したサブ
バンドデータが、6,31,84,…,12,54であ
るとき、これらの絶対値の最大値は−94となり、ビッ
ト配分情報(割当ビット数)は、表1より8ビットとな
る。したがって、16ビットのサブバンドデータのう
ち、下位7ビットと符号ビットとしての最上位ビット
(signビット)とを合わせたデータ(8ビット)を量子
化データとし、上位第2〜第9の8ビットを削減ビット
としている。これは、符号ビット部分を1ビットのsign
ビットを残して、削減したことと等価である。As shown in Table 3, when the sub-band data represented by a decimal number is 6, 31, 84, ..., 12, 54, the maximum absolute value of these is −94, and the bit allocation information is (Number of allocated bits) is 8 bits from Table 1. Therefore, of the 16-bit subband data, the data (8 bits) obtained by combining the lower 7 bits and the most significant bit (sign bit) as a sign bit is used as the quantized data, and the upper 2nd to 9th 8 bits are used. Is a reduction bit. This is a 1-bit sign bit part
It is equivalent to reducing the bit leaving.
【0041】したがって、逆量子化ではビット配分情報
より、この削減された上位ビットを指定数だけ符号ビッ
ト(signビット)で埋めればよい。この様にして量子化
されたサブバンドデータとビット配分情報は、多重化器
(多重化部)9に出力されると共に、サブバンドデータ
を時間領域へ再変換処理をするために、逆量子化器5に
出力される。Therefore, in the inverse quantization, it is only necessary to fill the reduced number of high-order bits with the designated number of sign bits according to the bit allocation information. The subband data and the bit allocation information quantized in this way are output to a multiplexer (multiplexing unit) 9 and, at the same time, inversely quantized in order to retransform the subband data into the time domain. Output to the container 5.
【0042】逆量子化器5における逆量子化は、符号ビ
ットと同一コードを上位ビットに(16−割当ビット
数)個付け加えることにより行われる(ステップ10
5)。したがって、このような量子化及び逆量子化にお
いては、その演算中に何ら演算に関わる制約、例えば四
捨五入等を行わないため、量子化誤差が生じることはな
い。The inverse quantization in the inverse quantizer 5 is performed by adding the same code as the sign bit to the upper bits (16-the number of allocated bits) (step 10).
5). Therefore, in such quantization and dequantization, no constraint relating to the operation, such as rounding off, is performed during the operation, so that the quantization error does not occur.
【0043】逆量子化器5での逆量子化によって、最下
位ビット精度(本実施例では16ビット)に揃えられた
サブバンドデータは、帯域合成フィルタ6に供給されて
時間領域情報の信号に変換される(ステップ106)。
この帯域合成フィルタ6における帯域合成処理では、演
算精度、フィルタ係数精度、演算過程及び出力段のデー
タに対する丸め処理を、後述する復号化装置の帯域合成
フィルタ6と完全に一致させる必要がある。The sub-band data aligned to the least significant bit precision (16 bits in this embodiment) by the inverse quantizer 5 is supplied to the band synthesizing filter 6 and converted into a signal of time domain information. It is converted (step 106).
In the band synthesizing process in the band synthesizing filter 6, it is necessary that the calculation precision, the filter coefficient precision, the calculating process, and the rounding process for the data of the output stage are completely matched with the band synthesizing filter 6 of the decoding device described later.
【0044】また、一般にデジタル音響信号処理にはD
SP(Digital Signal Processer)がよく用いられる。
そこで、この帯域合成フィルタ6における帯域合成処理
をDSPを例にとって説明する。帯域合成フィルタ6に
用いるDSPの内部演算ブロック構成を図3に示す。こ
こで使用するDSPは、例えば16ビット×16ビット
の固定小数点とし、内部演算精度、及びメモリ内部のデ
ータ幅を16ビットとする。Generally, D is used for digital audio signal processing.
SP (Digital Signal Processor) is often used.
Therefore, the band synthesizing process in the band synthesizing filter 6 will be described by taking the DSP as an example. FIG. 3 shows the internal operation block configuration of the DSP used for the band synthesis filter 6. The DSP used here is, for example, a fixed point of 16 bits × 16 bits, and the internal calculation precision and the data width inside the memory are 16 bits.
【0045】サブバンドフィルタなどでの帯域分割合成
は、主として積和演算によって変換が行われる。したが
って、帯域合成フィルタ6は、乗算器、加算器及び入出
力段のレジスタで構成されており、演算過程で必要な各
種係数用メモリ及び中間データ用のメモリ(演算用メモ
リ)と入出力バスにて接続されている。In the band division synthesis with the sub-band filter or the like, the conversion is mainly performed by the sum of products operation. Therefore, the band synthesizing filter 6 is composed of a multiplier, an adder, and a register of an input / output stage, and is used as a memory for various coefficients and a memory for intermediate data (operation memory) and an input / output bus required in the arithmetic process. Connected.
【0046】同図において、入力データ(サブバンドデ
ータ)とこの入力データに対応するフィルタ係数データ
とが、それぞれ16ビットの入力用データバスを介して
乗算器21に順次入力される。この入力データは、逆量
子化器5から出力されるデータが図示しないメモリ内に
16ビット精度で格納され、必要なデータが乗算器21
に随時供給されている。また、フィルタ係数データは、
同じく図示しない各種係数用メモリに16ビット精度で
予め格納されている。そして、この乗算器21は、入力
データにフィルタ係数データを乗算して32ビットのデ
ータとして出力している。In the figure, input data (subband data) and filter coefficient data corresponding to this input data are sequentially input to the multiplier 21 via a 16-bit input data bus. As the input data, the data output from the dequantizer 5 is stored in a memory (not shown) with 16-bit precision, and the necessary data is the multiplier 21.
It is supplied to us from time to time. Also, the filter coefficient data is
Similarly, it is stored in advance in 16-bit precision in various coefficient memories (not shown). Then, the multiplier 21 multiplies the input data by the filter coefficient data and outputs it as 32-bit data.
【0047】この乗算器21の出力は、32ビット+α
の加算器23に供給されている。このαは上位拡張ビッ
トを指す。なお、積和演算は32ビット幅のバスを用
い、それ以外は16ビットのバスを用いている。そし
て、加算器23からの出力は、一旦レジスタ22に蓄積
され、このレジスタ22の出力と次の乗算器21からの
出力とが加算器23にて加算され、次の演算のためにレ
ジスタ22に蓄積されるという状態を入力データがなく
なるまで、繰り返される。The output of the multiplier 21 is 32 bits + α
Is supplied to the adder 23. This α indicates a high-order extension bit. A 32-bit bus is used for the product-sum operation, and a 16-bit bus is used for other operations. Then, the output from the adder 23 is temporarily accumulated in the register 22, and the output of this register 22 and the output of the next multiplier 21 are added by the adder 23 and stored in the register 22 for the next calculation. The state of being accumulated is repeated until there is no input data.
【0048】そして、一次積和演算が終了すると、加算
器23からの出力は32ビット精度のデータのままレジ
スタ24に供給され、16ビット精度のデータに丸め処
理され、図示しない演算用メモリに出力する。この演算
用メモリは、32ビットから丸め処理を受けた16ビッ
ト精度のデータを格納して、二次積和演算を行うため
に、乗算器21に出力している。そして、同様にして、
二次積和演算が行われると、レジスタ24からデータ出
力として、16ビット精度のデータ(時間領域情報の音
響信号)が残差計算部8に出力される。When the primary product-sum operation is completed, the output from the adder 23 is supplied to the register 24 as it is as 32-bit precision data, rounded to 16-bit precision data, and output to an operation memory (not shown). To do. This operation memory stores 16-bit precision data that has been rounded from 32 bits and outputs it to the multiplier 21 for performing the quadratic product sum operation. And in the same way,
When the quadratic product sum operation is performed, 16-bit precision data (acoustic signal of time domain information) is output from the register 24 to the residual calculation unit 8 as data output.
【0049】ここで、乗算器21は各16ビット精度の
データ入力に対して32ビット精度のデータ出力である
ため、演算誤差が生じることはない。そして、各メモリ
に格納する場合に16ビット精度の丸め処理を行ってい
るが、加算器23では、積和演算中のオーバーフローや
アンダーフローに備えて十分なビット数の整数域(上位
拡張ビット)を確保している。したがって、丸め処理が
行われるのは、メモリに格納する場合、または最終出力
値を得るときに限られるので、余分な演算誤差が積み重
なることはない。Since the multiplier 21 outputs 32-bit precision data for each 16-bit precision data input, no arithmetic error occurs. Then, when the data is stored in each memory, rounding processing with 16-bit precision is performed. However, in the adder 23, an integer range (upper extension bits) of a sufficient number of bits is prepared for overflow or underflow during the product-sum operation. Has been secured. Therefore, the rounding process is performed only when storing it in the memory or when obtaining the final output value, and therefore, no extra calculation error is accumulated.
【0050】上記のような帯域分割合成の演算がなされ
て、図1の帯域合成フィルタ6から出力される16ビッ
ト精度の時間領域情報の音響信号(復号後信号)と、遅
延器7に入力されているデジタル音響信号(元信号)と
が、残差計算部8に供給され、帯域分割フィルタ1及び
帯域合成フィルタ6での帯域分割合成にて発生した演算
誤差を算出して、残差信号として出力する(ステップ1
07)。なお、ここでは残差信号を24サンプルのブロ
ックとして取り扱う。そして、このブロック内の最大値
を表現するために最低必要なビット数をブロックビット
幅とし、これを3ビットでコード化する。表2に残差信
号とブロックビット幅の関係を示す。表2において、ビ
ット配分として示されている数字が、ブロックビット幅
であり、ブロック内の残差信号の絶対値の最大値Mによ
って、その数値が定まっている。The band division synthesis operation as described above is performed, and the acoustic signal (post-decoding signal) of 16-bit precision time domain information output from the band synthesis filter 6 in FIG. 1 is input to the delay unit 7. The digital acoustic signal (original signal) that has been generated is supplied to the residual calculation unit 8 and the calculation error that has occurred in the band division synthesis in the band division filter 1 and the band synthesis filter 6 is calculated to obtain a residual signal. Output (Step 1
07). The residual signal is treated as a block of 24 samples here. Then, the minimum number of bits required to express the maximum value in this block is set as the block bit width, and this is encoded with 3 bits. Table 2 shows the relationship between the residual signal and the block bit width. In Table 2, the number shown as the bit allocation is the block bit width, and the numerical value is determined by the maximum value M of the absolute value of the residual signal in the block.
【0051】なお、帯域分割フィルタ1及び帯域合成フ
ィルタ6を通過した復号後信号は、フィルタ固有の遅延
によって時間軸が遅れているので、元信号を遅延器7を
介して残差計算部8に供給することにより(ステップ1
08)、復号後信号との時間軸を揃えている。Since the time axis of the decoded signal that has passed through the band division filter 1 and the band synthesis filter 6 is delayed due to the delay peculiar to the filter, the original signal is passed through the delay unit 7 to the residual calculation unit 8. By supplying (Step 1
08), the time axis of the decoded signal is aligned.
【0052】このフィルタ固有の遅延について、図4と
共に簡単に説明する。同図(A)に示すような時間領域
情報のデジタル音響信号(元信号)を帯域分割フィルタ
1に供給すると、元信号はフィルタバンクに32サンプ
ルづつシフトしながら蓄積され、随時32個のサブバン
ドサンプルを生成する(同図(B))。そして、帯域合
成フィルタ6においては、サブバンドサンプルはフィル
タバンクに32サンプルづつシフトしながら蓄積され、
随時32個の出力信号(時間軸に変換された復号後信
号)を生成する(同図(C))。このとき、一連の帯域
分割合成にて生じる遅延は480サンプル分であり、復
号後信号は、元信号に対して、480サンプル遅れて同
じデータが出力される。したがって、遅延器7では48
0サンプル分遅延させてフィルタ固有の遅延を吸収し
(同図(D))、残差計算部8における残差信号の算出
を可能にしている。The delay peculiar to this filter will be briefly described with reference to FIG. When a digital acoustic signal (original signal) of time domain information as shown in FIG. 3A is supplied to the band-splitting filter 1, the original signal is accumulated in the filter bank while shifting by 32 samples, and 32 subbands at any time. A sample is generated ((B) in the figure). Then, in the band synthesis filter 6, the sub-band samples are accumulated in the filter bank while shifting by 32 samples,
32 output signals (decoded signals converted to the time axis) are generated at any time ((C) in the same figure). At this time, the delay caused by a series of band division synthesis is 480 samples, and the decoded signal outputs the same data with a delay of 480 samples with respect to the original signal. Therefore, in the delay device 7, 48
The sample is delayed by 0 sample to absorb the delay peculiar to the filter ((D) in the figure), and the residual signal can be calculated in the residual calculation section 8.
【0053】そして、残差計算部8より出力される残差
信号は、パルス発生器12に出力される。そして、この
パルス発生器12より必要に応じてパルスが出力され、
入力信号合成部13にて、元信号に付加している(ステ
ップ112)。ここで、このパルス発生器12の構成図
を図8に示して、以下に説明する。残差計算部8から出
力された残差信号は、パルス発生器12内のグループ内
残差信号平均情報量算出部31及び割当可能範囲外残差
信号検出部33に供給される。The residual signal output from the residual calculator 8 is output to the pulse generator 12. Then, a pulse is output from the pulse generator 12 as needed,
The input signal synthesizer 13 adds the original signal (step 112). Here, the configuration of the pulse generator 12 is shown in FIG. 8 and will be described below. The residual signal output from the residual calculating unit 8 is supplied to the intra-group residual signal average information amount calculating unit 31 and the allocatable range residual signal detecting unit 33 in the pulse generator 12.
【0054】そして、グループ内残差信号平均情報量算
出部31にて、所定グループ内の平均的な振幅値(残差
信号平均情報量)を求め、目標ビット割当算出部32に
出力している。なお、ここでは残差信号の絶対値を基に
平均値を求めている。また、実際の情報量は符号ビット
を含み、求めた平均情報量は実際より1ビット分少ない
ため、ビット割当値を算出する際にはこのことを考慮す
る必要がある。Then, the in-group residual signal average information amount calculating section 31 obtains an average amplitude value (residual signal average information amount) in a predetermined group and outputs it to the target bit allocation calculating section 32. . Note that, here, the average value is obtained based on the absolute value of the residual signal. Further, the actual amount of information includes code bits, and the calculated average amount of information is one bit smaller than the actual amount, so this must be taken into consideration when calculating the bit allocation value.
【0055】目標ビット割当算出部32では、最適なビ
ット配分を行うための処理を行う(ステップ110)。
個々の残差信号のサンプルを全て平均化することができ
るならば、グループ内残差信号を表現するための割当ビ
ットの最下限値は、供給される残差信号平均情報量を表
すことができるビット数となる。しかしながら、実際に
は、個々の残差信号のサンプルは、何の規則性もない演
算誤差から生じているため、平均化は非常に困難であ
る。したがって、残差信号平均情報量がこの割当ビット
の最下限値に近い場合、その割当ビット数では表現でき
ない残差信号のサンプルが生じる可能性がある。そこ
で、目標ビット割当値の決定は、割当ビットの最下限値
に対して幾らかの余裕度を含んだ状態で行う方が良い。The target bit allocation calculator 32 performs a process for optimal bit allocation (step 110).
If all the samples of the individual residual signals can be averaged, then the minimum value of the allocated bits for representing the intra-group residual signal can represent the residual signal average information content supplied. It is the number of bits. However, in practice, the individual residual signal samples are very difficult to average because they result from arithmetic errors that have no regularity. Therefore, when the residual signal average information amount is close to the lower limit value of this allocated bit, a sample of the residual signal that cannot be represented by the allocated bit number may occur. Therefore, it is better to determine the target bit allocation value in a state in which some margin is included with respect to the minimum value of the allocation bit.
【0056】この目標割当ビットの決定について図7に
例をあげて説明する。図中の(a)及び(b)で示され
る実際の残差信号平均振幅値は、どちらも7ビットで表
現される。しかしながら、目標ビット割当値算出のため
のしきい値を余裕度を含めて同図のように設定すると、
(b)で示される残差信号平均振幅値を有する残差信号
ブロックは、目標ビット割当も7ビットとなるが、
(a)で示される残差信号平均振幅値を有する残差信号
ブロックは、目標ビット割当値算出のためのしきい値を
越えているので目標ビット割当が8ビットとなる。な
お、この余裕度(目標ビット割当値算出のためのしきい
値)は、同図では割当ビット中のMSBビットで表現で
きる最小値と最大値の中心に設定しているが、帯域分割
合成における量子化精度や演算処理ステップ数に応じて
調整することができる。The determination of the target allocation bit will be described with reference to FIG. The actual residual signal average amplitude values shown by (a) and (b) in the figure are both represented by 7 bits. However, if the threshold value for calculating the target bit allocation value is set as shown in FIG.
In the residual signal block having the residual signal average amplitude value shown in (b), the target bit allocation is also 7 bits,
Since the residual signal block having the average residual signal amplitude value shown in (a) exceeds the threshold value for calculating the target bit allocation value, the target bit allocation is 8 bits. Note that this margin (threshold value for calculating the target bit allocation value) is set at the center of the minimum value and the maximum value that can be represented by the MSB bits in the allocation bits in FIG. It can be adjusted according to the quantization accuracy and the number of arithmetic processing steps.
【0057】そして、帰還回数を重ねるほど残差信号は
平均化されるので、余裕度を下げて設定し、さらに割当
ビット数を少なくすることもできる。しかしながら、帰
還回数の増加は演算ステップ数を増加させ、処理速度の
低下をもたらすので、実際には、用いる周波数変換法に
よって生じる演算誤差の標準偏差を基に、符号化効率と
処理速度の兼ね合いから余裕度を設定することになる。Since the residual signal is averaged as the number of times of feedback is increased, the margin can be set lower and the number of allocated bits can be further reduced. However, an increase in the number of times of feedback increases the number of calculation steps, resulting in a decrease in processing speed. Therefore, in practice, based on the standard deviation of the calculation error caused by the frequency conversion method used, there is a tradeoff between coding efficiency and processing speed. The margin will be set.
【0058】目標ビット割当算出部32から出力される
目標ビット割当値は、割当可能範囲外残差信号検出部3
3に供給される。割当可能範囲外残差信号検出部33で
は、残差計算部8から出力された残差信号のグループか
ら、割り当てられたビット数では表現しきれない残差信
号のサンプルを選別してパルス信号生成部34に出力し
ている(ステップ111→Y)。このとき、残差信号の
サンプル番号をパルス信号発生サンプル点として出力す
ると共に、残差信号の振幅値と目標ビット割当値による
表現可能範囲との差を同時に求めて出力する。なお、割
り当てられたビット数で表現可能な残差信号のサンプル
は、基本的にはパルス信号を生成する必要がないので、
パルス信号生成部34に出力しなくても良いが、目標ビ
ット割当値算出のためのしきい値に非常に近い場合に
は、近隣の残差信号のサンプルにパルス信号を付加した
際に目標ビット割当値算出のためのしきい値を越えてし
まうことがあるので、この場合にもパルス信号生成部3
4に出力するようにした方が帰還回数を少なくすること
ができる。The target bit allocation value output from the target bit allocation calculating unit 32 is the allocatable range residual signal detecting unit 3
3 is supplied. The allocatable range residual signal detection unit 33 selects a sample of the residual signal that cannot be represented by the allocated number of bits from the group of residual signals output from the residual calculation unit 8 and generates a pulse signal. It is output to the unit 34 (step 111 → Y). At this time, the sample number of the residual signal is output as a pulse signal generation sample point, and the difference between the amplitude value of the residual signal and the representable range by the target bit allocation value is simultaneously obtained and output. Note that the residual signal sample that can be represented by the number of allocated bits does not basically need to generate a pulse signal.
Although it does not have to be output to the pulse signal generation unit 34, when the pulse signal is very close to the threshold value for calculating the target bit allocation value, the target bit is added when the pulse signal is added to the sample of the residual signal in the neighborhood. Since the threshold for calculating the assigned value may be exceeded, the pulse signal generation unit 3 also in this case.
It is possible to reduce the number of times of returning by outputting to 4.
【0059】パルス信号生成部34では、パルス信号を
必要とする残差信号のサンプルに対して重ね合わせるパ
ルス信号の振幅値を決定し、その振幅値を有するパルス
信号を入力信号合成部13に出力する。このとき、目標
ビット割当値算出のためのしきい値よりも大きい(また
はしきい値付近の)振幅値を有する残差信号のサンプル
に対して、パルス信号を付加させて目標ビット割当値に
するためには、パルス信号の振幅値をうまく決定する必
要がある。The pulse signal generator 34 determines the amplitude value of the pulse signal to be superimposed on the sample of the residual signal which requires the pulse signal, and outputs the pulse signal having the amplitude value to the input signal synthesizer 13. To do. At this time, a pulse signal is added to the sample of the residual signal having an amplitude value larger (or near the threshold value) for calculating the target bit allocation value to make the target bit allocation value. In order to do so, it is necessary to properly determine the amplitude value of the pulse signal.
【0060】ここで、パルス信号の振幅値を決定する際
の基準の例を図10に示して、説明する。パルス信号の
振幅値は、残差信号の振幅値から目標ビット割当値によ
る表現可能範囲の3/4の値を差し引いた値を絶対値と
し、残差信号に対して逆符号を持つ振幅値とする。この
3/4という値は、目標ビット割当値で表現される値の
ちょうど中心に当たり、帰還を繰り返す際に発生するノ
イズ信号(図14参照)が他の残差信号のサンプルに対
して与える影響が最も少ない値である。Here, an example of a reference for determining the amplitude value of the pulse signal will be described with reference to FIG. The absolute value of the amplitude value of the pulse signal is the amplitude value of the residual signal minus the value of 3/4 of the representable range of the target bit allocation value, and the amplitude value with the opposite sign to the residual signal. To do. The value of 3/4 corresponds to the center of the value expressed by the target bit allocation value, and the noise signal (see FIG. 14) generated when the feedback is repeated affects the sample of other residual signals. This is the smallest value.
【0061】そして、入力信号合成部13では、一時記
録されている残差信号のグループの特定の残差信号のサ
ンプルにパルス発生器12より送られてくるパルス信号
を付加して帯域分割フィルタ1に出力する。以下、同様
にしてパルス信号を付加する残差信号のサンプルがなく
なるまで処理を繰り返し、全ての残差信号のサンプルの
振幅値が目標ビット割当値で表現される値になった際に
は(ステップ111→N)、量子化器4及び残差計算部
8からの信号を多重化器9に出力する。Then, in the input signal synthesizing section 13, the pulse signal sent from the pulse generator 12 is added to the sample of the specific residual signal of the temporarily recorded residual signal group, and the band division filter 1 is added. Output to. In the same manner, the process is repeated until there are no more residual signal samples to which the pulse signal is added, and when the amplitude values of all the residual signal samples become values represented by the target bit allocation value (step 111 → N), and outputs the signals from the quantizer 4 and the residual calculator 8 to the multiplexer 9.
【0062】なお、帰還することにより周波数変換する
信号に微妙な変化が加えられ、帯域分割フィルタ1から
出力されるデータが、最初にビット配分部3にて決定さ
れた周波数領域上でのビット配分を越える可能性が生じ
る。この場合はビット配分部3によるビット配分を増や
すのではなく、最初に決定されたビット配分内の最大値
又は最小値に置き換える。そして、周波数領域上の変化
はサンプルの値のみとし、ビット配分は初回に算出した
配分で最後まで行うものとする。このように、周波数領
域の情報量を固定することにより、時間領域情報の削減
を周波数領域上でのビット配分に左右されることなく行
うことができる。但し、反対に周波数領域上でのビット
配分が減少する場合には、ビット配分部3でのビット配
分を変更して周波数領域上の情報量を削減するようにし
ても良い。この場合は、より高能率な符号化を行うこと
ができる。It should be noted that the feedback causes a slight change in the frequency-converted signal, and the data output from the band division filter 1 is bit-allocated in the frequency domain initially determined by the bit-allocation unit 3. There is a possibility of exceeding. In this case, the bit allocation by the bit allocation unit 3 is not increased, but is replaced with the maximum value or the minimum value in the initially determined bit allocation. Then, the change in the frequency domain is limited to the sample value, and the bit allocation is performed to the end with the allocation calculated at the beginning. In this way, by fixing the amount of information in the frequency domain, it is possible to reduce time domain information without being affected by bit allocation in the frequency domain. However, conversely, when the bit allocation in the frequency domain decreases, the bit allocation in the bit allocation unit 3 may be changed to reduce the information amount in the frequency domain. In this case, more efficient encoding can be performed.
【0063】多重化器9では、量子化器4より供給され
るビット数の削減されたサブバンドデータ(周波数領域
情報のデジタル音響信号)と残差計算部8より供給され
る残差信号とに対して、フレーム同期ワード、各種モー
ドや補助情報、周波数領域の信号の補助情報(周波数領
域サイド情報)、さらに時間領域の信号の補助情報(時
間領域サイド情報)等を付加し、例えば図5に示すよう
に配列してビットストリームを生成する(ステップ10
9)。このように多重化して同一フレーム内に残差信号
を含めているので、復号化の時には、帯域合成処理され
時間領域に変換された信号を補正して復号化する際に要
する遅延量を減少させることができる。In the multiplexer 9, the sub-band data (digital acoustic signal of frequency domain information) with the reduced number of bits supplied from the quantizer 4 and the residual signal supplied from the residual calculator 8 are obtained. On the other hand, a frame synchronization word, various modes and auxiliary information, auxiliary information of frequency domain signals (frequency domain side information), further auxiliary information of time domain signals (time domain side information), etc. are added. Arrange as shown to generate a bitstream (step 10
9). Since the residual signal is included in the same frame after being multiplexed in this way, the amount of delay required for decoding by correcting the signal that has been band-synthesized and converted into the time domain at the time of decoding is reduced. be able to.
【0064】次に、図2に本発明の音響信号符号化装置
で符号化された音響信号を復号する音響信号復号化装置
の一実施例の構成図を示し、図7にその動作フローチャ
ートを示す。なお、図1の音響信号符号化装置に示した
逆量子化器5及び帯域合成フィルタ6と図2に示した逆
量子化器5及び帯域合成フィルタ6とは完全に同一構成
のものを使用している。Next, FIG. 2 shows a block diagram of an embodiment of an acoustic signal decoding apparatus for decoding an acoustic signal encoded by the acoustic signal encoding apparatus of the present invention, and FIG. 7 shows an operation flowchart thereof. . The inverse quantizer 5 and the band synthesizing filter 6 shown in the acoustic signal coding apparatus of FIG. 1 and the inverse quantizer 5 and the band synthesizing filter 6 shown in FIG. ing.
【0065】音響信号符号化装置にて符号化されたビッ
トストリームは分離化器10に供給されて、同期ワー
ド、モード、補助情報等を解読し、さらに周波数領域の
信号と時間領域の信号とに分離される(ステップ20
1)。分離後の周波数領域の信号は、帯域合成されるた
めにその前処理である逆量子化器5に供給される。ま
た、時間領域の信号は後に帯域合成フィルタ6を経た信
号に対し補正を行うために残差補正部11に供給され
る。The bit stream coded by the audio signal coding apparatus is supplied to the demultiplexer 10 to decode the synchronization word, the mode, the auxiliary information, etc., and further, the frequency domain signal and the time domain signal. Separated (step 20)
1). The signals in the frequency domain after separation are supplied to an inverse quantizer 5 which is a pre-processing for band synthesis. The signal in the time domain is supplied to the residual correction unit 11 to correct the signal that has passed through the band synthesis filter 6 later.
【0066】逆量子化器5は先に述べたように、帯域合
成フィルタ6と共に音響信号符号化装置で使用されてい
る逆量子化器5及び帯域合成フィルタ6と完全に同じも
のであり、その動作も同一である。そして、ここでも符
号ビットと同一コードを上位に(16−割当ビット数)
個、追加して出力している(ステップ202)。逆量子
化器5より出力される信号は、帯域合成フィルタ6に供
給されて、周波数領域の信号は時間領域の信号に変換さ
れる(ステップ203)。そして、逆量子化器5から帯
域合成フィルタ6までの処理過程は音響信号符号化装置
と全く同じであるため、符号化処理中に生じた元信号と
の誤差は、時間領域の信号として音響信号符号化装置か
ら供給される残差成分によって補正すれば、帯域合成後
の信号は元信号と全く同じ信号に戻ることになる。As described above, the inverse quantizer 5 is completely the same as the inverse quantizer 5 and the band synthesizing filter 6 used in the acoustic signal coding apparatus together with the band synthesizing filter 6, and its The operation is also the same. Also here, the same code as the sign bit is placed in the higher order (16-number of allocated bits).
Individually added and output (step 202). The signal output from the inverse quantizer 5 is supplied to the band synthesis filter 6, and the frequency domain signal is converted into the time domain signal (step 203). Since the process from the inverse quantizer 5 to the band synthesizing filter 6 is exactly the same as in the acoustic signal encoding device, the error with the original signal generated during the encoding process is the acoustic signal as a signal in the time domain. If corrected by the residual component supplied from the encoding device, the signal after band synthesis returns to the same signal as the original signal.
【0067】したがって、残差補正部11にて、帯域合
成フィルタ6より供給される時間領域の帯域合成後信号
に分離化器10より供給される時間領域補正信号(残差
信号)を加算することにより、元信号に復元している
(ステップ204)。なお、帯域合成フィルタ6におけ
る帯域合成処理にかかる遅延は音響信号符号化装置側で
調整されているので、時間領域の残差信号は帯域合成後
信号と時間軸が一致した状態で残差補正部12に供給さ
れている。即ち、残差信号は、音響信号符号化装置側に
おいて、帯域分割フィルタ1と帯域合成フィルタ6とを
通過した信号と、この信号に合わせて遅延させた元信号
とから生成されているので、元信号に対して480サン
プル分遅延しているが、周波数領域の信号は帯域合成フ
ィルタ6を介していないので、その分遅延量が少ない状
態で多重化されている。したがって、音響信号復号化装
置側で、周波数領域の信号が帯域合成フィルタ6を通過
した後の遅延量は、残差信号と同じになり、時間軸が一
致する。Therefore, the residual correction unit 11 adds the time domain correction signal (residual signal) supplied from the demultiplexer 10 to the time domain band synthesized signal supplied from the band synthesis filter 6. Thus, the original signal is restored (step 204). Since the delay involved in the band synthesizing process in the band synthesizing filter 6 is adjusted on the acoustic signal encoding device side, the residual signal in the time domain is the residual error correcting unit in the state where the time axis coincides with the post-band synthesizing signal. 12 are supplied. That is, the residual signal is generated from the signal that has passed through the band division filter 1 and the band synthesis filter 6 and the original signal delayed in accordance with this signal on the acoustic signal encoding device side. Although delayed by 480 samples with respect to the signal, since the signal in the frequency domain does not pass through the band synthesizing filter 6, the signal is multiplexed with a small delay amount. Therefore, on the acoustic signal decoding device side, the delay amount after the signal in the frequency domain has passed through the band synthesis filter 6 is the same as the residual signal, and the time axes match.
【0068】この結果、本発明の音響信号符号化装置に
入力されたデジタル音響信号(元信号)は、符号化信号
としてデータ圧縮された信号として伝送または蓄積さ
れ、この音響信号復号化装置によって、元信号と完全に
一致した復号化信号として出力することができる。As a result, the digital audio signal (original signal) input to the audio signal encoding device of the present invention is transmitted or stored as a data-compressed signal as an encoded signal, and this audio signal decoding device It can be output as a decoded signal that completely matches the original signal.
【0069】[0069]
【発明の効果】本発明の音響信号符号化方法及び音響信
号符号化装置は、周波数領域情報によって音響信号の持
つ特長を生かした効率的な圧縮符号化を行った上で、こ
の周波数領域情報を時間領域情報である残差信号によっ
て、適切かつ必要最小限の補正を行っているので、元信
号を確実に復号することができる。そして、本発明で
は、時間領域情報である残差信号も圧縮符号化を行って
いるので、より効率的な圧縮符号化が可能となるという
効果がある。The acoustic signal coding method and the acoustic signal coding device of the present invention perform efficient compression coding by making use of the characteristics of the acoustic signal by the frequency domain information, and then carry out this frequency domain information. Since the residual signal, which is time domain information, is appropriately and minimally corrected, the original signal can be surely decoded. Further, in the present invention, since the residual signal which is time domain information is also compression-encoded, there is an effect that more efficient compression-encoding is possible.
【図1】本発明の音響信号符号化装置の一実施例を示す
構成図である。FIG. 1 is a configuration diagram showing an embodiment of an audio signal encoding device of the present invention.
【図2】音響信号復号化装置の一実施例を示す構成図で
ある。FIG. 2 is a configuration diagram showing an embodiment of an audio signal decoding device.
【図3】帯域合成フィルタに用いられるDSPの内部演
算ブロック構成を示す構成図である。FIG. 3 is a configuration diagram showing an internal operation block configuration of a DSP used for a band synthesis filter.
【図4】フィルタ固有の遅延量を説明するための図であ
る。FIG. 4 is a diagram for explaining a delay amount specific to a filter.
【図5】ビットストリームの生成例を示す構成図であ
る。FIG. 5 is a configuration diagram illustrating a generation example of a bitstream.
【図6】本発明の音響信号符号化装置の動作例を示すフ
ローチャート図である。FIG. 6 is a flowchart showing an operation example of the acoustic signal encoding device of the present invention.
【図7】音響信号復号化装置の動作例を示すフローチャ
ート図である。FIG. 7 is a flowchart showing an operation example of the acoustic signal decoding device.
【図8】本発明の音響信号符号化装置を構成するパルス
発生器の一実施例を示す構成図である。FIG. 8 is a configuration diagram showing an embodiment of a pulse generator that constitutes the audio signal encoding device of the present invention.
【図9】目標ビット割当値の算出方法を説明するための
図である。FIG. 9 is a diagram for explaining a method of calculating a target bit allocation value.
【図10】パルス信号の振幅値決定を説明するための図
である。FIG. 10 is a diagram for explaining determination of an amplitude value of a pulse signal.
【図11】Nサンプルの演算誤差の確率分布を示すグラ
フである。FIG. 11 is a graph showing a probability distribution of N sample calculation errors.
【図12】加算回数nのときの演算誤差の確率分布を示
すグラフである。FIG. 12 is a graph showing a probability distribution of calculation errors when the number of additions is n.
【図13】パルス信号の付加による残差信号の変化を説
明するためのグラフである。FIG. 13 is a graph for explaining the change in the residual signal due to the addition of the pulse signal.
【図14】周波数変換、逆変換後のパルス信号の変化を
説明するためのグラフである。FIG. 14 is a graph for explaining changes in a pulse signal after frequency conversion and inverse conversion.
1 帯域分割フィルタ 2 最大値選択部 3 ビット配分部 4 量子化器 5 逆量子化器 6 帯域合成フィルタ 7 遅延器 8 残差計算部 9 多重化部(多重化器) 10 分離化器 11 残差補正部 12 パルス発生器 13 入力信号合成部 31 グループ内残差信号平均情報量算出部 32 目標ビット割当算出部 33 割当可能範囲外残差信号検出部 34 パルス信号生成部 A 周波数領域情報生成部 B 時間領域情報生成部 1 band division filter 2 maximum value selection unit 3 bit allocation unit 4 quantizer 5 inverse quantizer 6 band synthesis filter 7 delay device 8 residual calculation unit 9 multiplexing unit (multiplexer) 10 demultiplexer 11 residual error Correction unit 12 Pulse generator 13 Input signal synthesis unit 31 Intra-group residual signal average information amount calculation unit 32 Target bit allocation calculation unit 33 Outside allocatable range residual signal detection unit 34 Pulse signal generation unit A Frequency domain information generation unit B Time domain information generator
Claims (6)
ジタル音響信号を帯域分割して符号化した周波数領域情
報のデジタル音響信号とする第1の工程と、 この第1の工程にて符号化された周波数領域情報のデジ
タル音響信号を帯域合成したデジタル音響信号と前記元
信号として供給される時間領域情報のデジタル音響信号
との残差信号を時間領域情報として生成する第2の工程
と、 この第2の工程にて符号化された時間領域情報の残差信
号を構成するフレーム内で各サンプルの情報量を平均化
するためのパルス信号を発生させて前記元信号に付加す
る第3の工程とよりなり、 前記残差信号と前記周波数領域情報のデジタル音響信号
とを多重化して出力することを特徴とする音響信号符号
化方法。1. A first step of band-dividing and encoding a digital acoustic signal of time domain information supplied as an original signal to obtain a digital acoustic signal of frequency domain information, and encoding in the first step. A second step of generating, as time domain information, a residual signal between the digital sound signal obtained by band-synthesizing the digital sound signal of the frequency domain information and the digital sound signal of the time domain information supplied as the original signal; Third step of generating a pulse signal for averaging the information amount of each sample in a frame forming a residual signal of time domain information encoded in the second step and adding the pulse signal to the original signal An audio signal encoding method comprising: multiplexing the residual signal and the digital audio signal of the frequency domain information and outputting the multiplexed signal.
フレーム内で各サンプルの情報量の平均値から算出され
る目標ビット割当値のビット数に圧縮することを特徴と
する請求項1記載の音響信号符号化方法。2. The residual signal is compressed to the number of bits of a target bit allocation value calculated from the average value of the information amount of each sample in a frame forming the residual signal. 1. The audio signal encoding method according to 1.
ンプルの情報量の最大値が所定値以下になるまで前記第
1の工程〜第3の工程を繰り返すことを特徴とする請求
項1または請求項2記載の音響信号符号化方法。3. The first step to the third step are repeated until the maximum value of the information amount of each sample within a frame forming the residual signal becomes a predetermined value or less. Alternatively, the acoustic signal encoding method according to claim 2.
構成するフレーム内で各サンプルの情報量を平均化する
ためのパルス信号を複数同時に発生させて、前記残差信
号を構成する各サンプルの情報量を所定値以下にするこ
とを特徴とする請求項1または請求項2記載の音響信号
符号化方法。4. In the third step, a plurality of pulse signals for averaging the information amount of each sample are simultaneously generated in a frame forming the residual signal to form the residual signal. The acoustic signal coding method according to claim 1, wherein the information amount of the sample is set to a predetermined value or less.
ジタル音響信号を一時記録する入力信号合成部と、 この入力信号合成部より供給される時間領域情報のデジ
タル音響信号を帯域分割する帯域分割フィルタと、 この帯域分割フィルタより供給される前記周波数領域情
報のデジタル音響信号を符号化する量子化器と、 この量子化器より供給される信号を逆量子化する逆量子
化器と、 この逆量子化器より供給される信号を帯域合成して時間
領域情報の信号へ再変換する帯域合成フィルタと、 この帯域合成フィルタより供給される時間領域情報の信
号と前記元信号として供給される時間領域情報のデジタ
ル音響信号との残差信号を生成する残差計算部と、 この残差計算部より供給される前記残差信号を構成する
フレーム内で各サンプルの情報量を平均化するためのパ
ルス信号を生成し、前記入力信号合成部に出力するパル
ス生成器と、 前記残差計算部より供給される前記残差信号と前記量子
化器より供給される信号とを多重化する多重化部とを有
することを特徴とする音響信号符号化装置。5. An input signal synthesizing section for temporarily recording a digital acoustic signal of time domain information supplied as an original signal, and a band division for band-dividing the digital acoustic signal of time domain information supplied from this input signal synthesizing section. A filter, a quantizer for encoding the digital acoustic signal of the frequency domain information supplied by the band division filter, an inverse quantizer for inverse quantizing the signal supplied by the quantizer, and an inverse quantizer A band synthesizing filter for band-synthesizing the signals supplied from the quantizer and re-converting into a signal of time domain information, and a signal of the time domain information supplied from this band synthesizing filter and the time domain supplied as the original signal. A residual calculation unit for generating a residual signal with the digital audio signal of the information, and information of each sample in the frame constituting the residual signal supplied from the residual calculation unit. A pulse generator that generates a pulse signal for averaging the amount and outputs the pulse signal to the input signal combining unit, the residual signal supplied from the residual calculating unit, and the signal supplied from the quantizer. And a multiplexing unit that multiplexes the audio signal encoding apparatus.
サンプルの情報量の平均値から算出される目標ビット割
当値で表現できる最大表現値以下で定められる所定許容
情報量以上の情報量を有する前記残差信号のサンプルに
対して、このサンプルの情報量を前記所定許容情報量以
下にするための情報量を有する符号反転されたパルス信
号を前記パルス生成器にて生成することを特徴とする請
求項5記載の音響信号符号化装置。6. An information amount equal to or more than a predetermined permissible information amount defined below a maximum representation value that can be represented by a target bit allocation value calculated from an average value of information amounts of respective samples in a frame forming the residual signal. The pulse generator generates a sign-inverted pulse signal having an amount of information for making the amount of information of this sample equal to or less than the predetermined permissible amount of information for the sample of the residual signal having The acoustic signal encoding device according to claim 5.
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02600496A JP3257584B2 (en) | 1996-01-19 | 1996-01-19 | Acoustic signal encoding method and acoustic signal encoding device |
DE69629986T DE69629986T2 (en) | 1995-07-27 | 1996-07-26 | Method and device for coding digital acoustic signals |
US08/686,840 US5794179A (en) | 1995-07-27 | 1996-07-26 | Method and apparatus for performing bit-allocation coding for an acoustic signal of frequency region and time region correction for an acoustic signal and method and apparatus for decoding a decoded acoustic signal |
EP96305495A EP0756386B1 (en) | 1995-07-27 | 1996-07-26 | Method and apparatus for coding a digital, acoustic signal |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP02600496A JP3257584B2 (en) | 1996-01-19 | 1996-01-19 | Acoustic signal encoding method and acoustic signal encoding device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09200056A true JPH09200056A (en) | 1997-07-31 |
JP3257584B2 JP3257584B2 (en) | 2002-02-18 |
Family
ID=12181563
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP02600496A Expired - Lifetime JP3257584B2 (en) | 1995-07-27 | 1996-01-19 | Acoustic signal encoding method and acoustic signal encoding device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3257584B2 (en) |
-
1996
- 1996-01-19 JP JP02600496A patent/JP3257584B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP3257584B2 (en) | 2002-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5164834B2 (en) | Scaled compressed audio bitstream and codec using hierarchical filter bank and multi-channel joint coding | |
EP0966793B1 (en) | Audio coding method and apparatus | |
US6687663B1 (en) | Audio processing method and apparatus | |
US7613603B2 (en) | Audio coding device with fast algorithm for determining quantization step sizes based on psycho-acoustic model | |
US9111532B2 (en) | Methods and systems for perceptual spectral decoding | |
JP2010538318A (en) | Transition frequency adaptation between noise replenishment and band extension | |
KR100813193B1 (en) | Method and device for quantizing a data signal | |
KR20060113998A (en) | Audio coding | |
US20090132238A1 (en) | Efficient method for reusing scale factors to improve the efficiency of an audio encoder | |
JP2003523535A (en) | Method and apparatus for converting an audio signal between a plurality of data compression formats | |
KR100477701B1 (en) | An MPEG audio encoding method and an MPEG audio encoding device | |
JPH0946234A (en) | Acoustic signal encoding and decoding method, acoustic signal encoding and decoding device | |
JP4649351B2 (en) | Digital data decoding device | |
JP4627737B2 (en) | Digital data decoding device | |
JP3257584B2 (en) | Acoustic signal encoding method and acoustic signal encoding device | |
JP4641272B2 (en) | Digital data decoding device | |
JP4024185B2 (en) | Digital data encoding device | |
JPH10149197A (en) | Device and method for encoding | |
JP2001109497A (en) | Audio signal encoding device and audio signal encoding method | |
JP2004180057A (en) | Method and device for encoding digital data | |
JP2004180058A (en) | Method and device for encoding digital data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071207 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081207 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091207 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101207 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111207 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111207 Year of fee payment: 10 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121207 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121207 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131207 Year of fee payment: 12 |
|
EXPY | Cancellation because of completion of term |