JP2827410B2 - Efficient coding method for digital data - Google Patents

Efficient coding method for digital data

Info

Publication number
JP2827410B2
JP2827410B2 JP2061248A JP6124890A JP2827410B2 JP 2827410 B2 JP2827410 B2 JP 2827410B2 JP 2061248 A JP2061248 A JP 2061248A JP 6124890 A JP6124890 A JP 6124890A JP 2827410 B2 JP2827410 B2 JP 2827410B2
Authority
JP
Japan
Prior art keywords
block
band
time
bands
small
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2061248A
Other languages
Japanese (ja)
Other versions
JPH03263925A (en
Inventor
健三 赤桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2061248A priority Critical patent/JP2827410B2/en
Publication of JPH03263925A publication Critical patent/JPH03263925A/en
Priority to US08/029,988 priority patent/US5502789A/en
Application granted granted Critical
Publication of JP2827410B2 publication Critical patent/JP2827410B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、いわゆる高能率符号化によって入力ディジ
タルデータの符号化を行うディジタルデータの高能率符
号化方法に関するものである。
Description: BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a digital data high-efficiency encoding method for encoding input digital data by so-called high-efficiency encoding.

〔発明の概要〕[Summary of the Invention]

本発明は、入力ディジタルデータを分割した複数の帯
域毎に、複数のサンプルからなるブロックを形成し、各
帯域のブロック毎に直交変換を行い係数データを得るデ
ィジタルデータの高能率符号化方法であって、少なくと
も最も低域の帯域の直交変換前のブロックを時間的に複
数の小ブロックに分けてエネルギを検出し、そのエネル
ギに基づいて最も低域の帯域のブロック毎のデータの利
得を制御するようにしたことにより、直交変換等により
発生するノイズを低減することができ、特に、過渡性入
力によるノイズを低減することができるディジタルデー
タの高能率符号化装置を提供するものである。
The present invention relates to a high-efficiency encoding method for digital data in which a block composed of a plurality of samples is formed for each of a plurality of bands obtained by dividing input digital data, and orthogonal transform is performed for each block of each band to obtain coefficient data. At least the blocks before orthogonal transform of the lowest band are temporally divided into a plurality of small blocks to detect energy, and the gain of data for each block of the lowest band is controlled based on the energy. By doing so, it is possible to provide a high-efficiency digital data encoding apparatus capable of reducing noise generated by orthogonal transformation or the like, and in particular, reducing noise due to transient input.

〔従来の技術〕[Conventional technology]

オーディオ或いは音声等の信号の高能率符号化の手法
には種々あるが、例えば、時間軸上のオーディオ信号等
を複数の周波数帯域に分割して符号化する帯域分割符号
化(サブ・バンド・コーディング:SBC)や、時間軸の信
号を周波数軸上の信号に変換(直交変換)して複数の周
波数帯域に分割し各帯域毎に符号化するいわゆる変換符
号化等を挙げることができる。また、上述の帯域分割符
号化と変換符号化とを組み合わせた高能率符号化の手法
も考えられており、この場合には、例えば、上記帯域分
割符号化で帯域分割を行った後、該各帯域毎の信号を周
波数軸上の信号に直交変換し、これら各帯域の直交変換
された信号が、帯域毎に符号化される。ここで、上述し
た直交変換としては、例えば、入力オーディオ信号を所
定単位時間でブロック化し、該ブロック毎に高速フーリ
エ変換(FFT)を行うことで時間軸を周波数軸に変換す
るような直交変換がある。更に、直交変換された周波数
軸上のデータを帯域分割する際には、例えば人間の聴覚
特性を考慮した帯域分割が行われることがある。すなわ
ち、一般に臨界帯域(クリティカルバンド)と呼ばれて
いる高域程帯域幅が広くなるような帯域幅で、オーディ
オ信号を複数(例えば25バンド)の帯域に分割すること
がある。また、この時の各帯域毎のデータを符号化する
際には、各帯域毎に所定のビット配分、或いは、各帯域
毎に適応的なビット割当て(ビットアロケーション)に
よる上記FFT係数データの符号化が行われる。例えば、
上記ビットアロケーシヨンによる符号化の際には、該各
ブロック毎のFFT処理により得られる各帯域毎のFFT係数
データに対して、適応的な割当てビット数で符号化が行
われることになる。
There are various high-efficiency coding methods for signals such as audio and voice. For example, band division coding (sub-band coding) for dividing an audio signal or the like on a time axis into a plurality of frequency bands and coding them. : SBC), so-called transform coding in which a signal on the time axis is converted into a signal on the frequency axis (orthogonal transform), divided into a plurality of frequency bands, and encoded for each band. Further, a high-efficiency coding method combining the above-described band division coding and transform coding is also considered.In this case, for example, after performing band division by the band division coding, The signal for each band is orthogonally transformed into a signal on the frequency axis, and the orthogonally transformed signal for each band is encoded for each band. Here, as the above-described orthogonal transform, for example, an orthogonal transform that converts an input audio signal into blocks in a predetermined unit time and performs a fast Fourier transform (FFT) for each block to convert a time axis into a frequency axis is used. is there. Further, when band-dividing the orthogonally transformed data on the frequency axis, band division may be performed in consideration of, for example, human auditory characteristics. That is, an audio signal may be divided into a plurality of (for example, 25 bands) bands with a bandwidth that is generally higher in a higher band called a critical band (critical band). Further, at this time, when encoding data for each band, encoding of the FFT coefficient data by predetermined bit distribution for each band or adaptive bit allocation (bit allocation) for each band. Is performed. For example,
In the coding by the bit allocation, the FFT coefficient data for each band obtained by the FFT processing for each block is coded with an adaptive number of allocated bits.

ところで、一般に音に対する人間の聴覚特性には、マ
スキング効果と呼ばれるものがあり、当該マスキング効
果には、テンポラルマスキング効果と同時刻マスキング
効果等がある。上記同時刻マスキング効果とは、ある大
きな音と同時刻に発生する小さな音(或いはノイズ)が
当該大きな音によってマスクされて聞こえなくなるよう
な効果であり、上記テンポラルマスキング効果とは、大
きな音の時間的な前後の小さな音(ノイズ)が、この大
きな音にマスクされて聞こえなくなるような効果であ
る。このテンポラルマスキング効果において、上記大き
な音の時間的に後方のマスキングはフォワードマスキン
グと呼ばれ、また、時間的に前方のマスキングはバック
ワードマスキングと呼ばれている。また、テンポラルマ
スキングにおいては、人間の聴覚特性から、フォワード
マスキングの効果は長時間(例えば100msec程度)効く
ようになっているのに対し、バックワードマスキングの
効果は短時間(例えば5msec程度)となっている。更
に、上記マスキング効果のレベル(マスキング量)は、
フォワードマスキングが20dB程度で、バックワードマス
キングが30dB程度となっている。
By the way, there is generally called a masking effect in human auditory characteristics of sound, and the masking effect includes a temporal masking effect, a same-time masking effect, and the like. The same-time masking effect is an effect in which a small sound (or noise) generated at the same time as a certain loud sound is masked by the loud sound and becomes inaudible, and the temporal masking effect is a time of a loud sound. The effect is that small sounds (noise) before and after the target are masked by the loud sounds and become inaudible. In this temporal masking effect, the temporally backward masking of the loud sound is called forward masking, and the temporally forward masking is called backward masking. Further, in temporal masking, the effect of forward masking is effective for a long time (for example, about 100 msec), whereas the effect of backward masking is for a short time (for example, about 5 msec) due to human auditory characteristics. ing. Further, the level of the masking effect (masking amount) is
Forward masking is about 20 dB, and backward masking is about 30 dB.

〔発明が解決しようとする課題〕[Problems to be solved by the invention]

ここで、符号化の際に上述のように上記所定単位時間
ブロック内のオーディオ信号を高速フーリエ変換した場
合、該信号のデコード時には、逆高速フーリエ変換(IF
FT)が行われる。このようなエンコード、デコードによ
って得られる信号には、通常、これらFFT,IFFTにより発
生するノイズがブロック内全体に現れることになる。こ
のため、例えば、上記FFT,IFFTされるブロック内に過渡
的変化が生じている場合、すなわち例えば第5図に示す
ように、ブロック内の無信号(無音)部Uに、例えばカ
スタネットの打音による信号のように急激にレベルが増
大する信号Cが入って来ることでブロック内の信号の過
渡的変化が大きくなっているような場合には、上記FFT,
IFFT処理を施すことによるノイズが上記無信号部Uにも
現れることになる。すなわち、第6図に示すように上記
無信号部Uにも上記大レベルの信号部Cに起因したノイ
ズ成分が現れることになる。したがって、この信号を再
生すると、本来無信号であった部分でのノイズが目立つ
ようになる。
Here, when the audio signal in the predetermined unit time block is subjected to the fast Fourier transform at the time of encoding as described above, the inverse fast Fourier transform (IF
FT) is performed. In a signal obtained by such encoding and decoding, noise generated by the FFT and IFFT usually appears in the entire block. For this reason, for example, when a transient change occurs in the block subjected to the FFT / IFFT, for example, as shown in FIG. In the case where a signal C whose level sharply increases, such as a signal due to sound, enters and the transient change of the signal in the block becomes large, the FFT,
Noise due to the IFFT processing also appears in the non-signal portion U. That is, as shown in FIG. 6, a noise component caused by the large-level signal portion C also appears in the non-signal portion U. Therefore, when this signal is reproduced, noise in the portion where the signal was originally absent becomes noticeable.

このような過渡的変化のあるブロックをFFT,IFFT等で
処理することによって発生するノイズの、上記大レベル
信号部Cの時間的に後のノイズは、第7図に示すような
長時間のフォワードマスキングFMの効果でマスクされる
ため、耳につくことが少ない。しかし、該大レベル信号
部Cの時間的に前のノイズは、バックワードマスキング
BMの効果が短時間であるため、耳に付きやすくなる。す
なわち、当該バックワードマスキングBMの効果の作用す
る時間よりも前の時間のノイズは耳につく。
Of the noise generated by processing such a block having a transient change by FFT, IFFT, etc., the noise temporally behind the large-level signal portion C is a long-time forward noise as shown in FIG. Since it is masked by the effect of masking FM, it is less likely to be heard. However, the temporally preceding noise of the large-level signal section C is backward masking.
Because the effect of BM is short, it is easy to catch the ear. That is, noise at a time before the time when the effect of the backward masking BM acts is noticeable.

上述のようなバックワードマスキングBMの効果が期待
できない場合の対策としては、例えば、上記高速フーリ
エ変換処理が施される単位時間ブロック長を上記バック
ワードマスキングBMの効く時間範囲(例えば5msec)程
度に短くすることが考えられる。すなわち、上記大レベ
ル信号部CによるバックワードマスキングBMの効果が有
効に作用する時間まで、上記高能率符号化処理の際の時
間分解能を上げる(ブロック長を短くする)ことが考え
られる。
As a countermeasure in the case where the effect of the backward masking BM as described above cannot be expected, for example, the unit time block length in which the fast Fourier transform processing is performed is set to a time range (for example, 5 msec) in which the backward masking BM works. It can be shortened. That is, it is conceivable to increase the time resolution (shortening the block length) in the high-efficiency encoding processing until the time when the effect of the backward masking BM by the large-level signal portion C effectively works.

しかし、上述のようにフーリエ変換される単位時間ブ
ロック長を短くすることは、当該ブロック内のサンプル
数が減ることにほかならないため、当該フーリエ変換に
よる周波数分解能は逆に下がることになる。ところが、
人間の聴覚における周波数分析能力(周波数分解能)
は、一般に、高域ではさほど高くないが低域では高いも
のである。したがって、当該低域での周波数分解能を確
保する必要性から、現実には上述したように単位時間ブ
ロック長をあまり短くすることはできない。すなわち、
低域で時間分解能を上げることは好ましくない。
However, shortening the unit time block length to be Fourier-transformed as described above means nothing less than reducing the number of samples in the block, so that the frequency resolution by the Fourier transform is reduced. However,
Frequency analysis ability (frequency resolution) in human hearing
Is generally not so high in the high range but high in the low range. Therefore, since the frequency resolution in the low frequency band needs to be ensured, the unit time block length cannot be actually shortened as described above. That is,
It is not preferable to increase the time resolution in the low band.

なお、一般に、低域信号では定常区間が長く、逆に高
域信号では短いため、高域での時間分解能を高める(ブ
ロック長を短くする)ことは有効となる。
In general, a low-frequency signal has a long stationary section and a high-frequency signal has a short duration. Therefore, it is effective to increase the time resolution in a high frequency (shortening the block length).

そこで、本発明は、上述のような実情に鑑みて提案さ
れたものであり、高域では高い時間分解能を得ることが
でき、更に、低域では高い周波数分解能を得ることがで
き、かつ、時間分解能を上げることができない低域でブ
ロック内の大レベル信号部に起因したノイズの低減が可
能なディジタルデータの高能率符号化方法を提供するこ
とを目的とするものである。
Therefore, the present invention has been proposed in view of the above-described circumstances, and it is possible to obtain a high time resolution in a high frequency band, and further to obtain a high frequency resolution in a low frequency band, and It is an object of the present invention to provide a high-efficiency encoding method for digital data in which noise caused by a large-level signal portion in a block can be reduced in a low frequency range where the resolution cannot be increased.

〔課題を解決するための手段〕[Means for solving the problem]

本発明のディジタルデータの高能率符号化方法は、上
述の目的を達成するために提案されたものであり、入力
ディジタルデータを複数の帯域に分割し、分割された帯
域毎に複数のサンプルからなるブロックを形成し、各帯
域のブロック毎に直交変換を行い係数データを得るよう
にしたディジタルデータの高能率符号化方法であって、
少なくとも最も低域の帯域の直交交換前のブロックを時
間的に複数の小ブロックに分けて各小ブロック毎のエネ
ルギを検出し、その検出されたエネルギに基づいて、最
も低域の帯域の小ブロック毎のデータの利得を制御する
ようにしたものである。ここで、上記小ブロックのエネ
ルギ検出においては、少なくとも最も低域の帯域の直交
変換前のブロックのデータの過渡的変化を検出するよう
なこともでき、この場合、利得制御においては、例えば
エネルギ検出出力に基づいて、過渡的変化のある小ブロ
ックの利得を低下させるような制御を行うようにする。
また、上記ブロックを形成する際には、高域ではブロッ
ク長を長く(時間分解能を高く)し、低域では1ブロッ
ク内のサンプル数を増やす(周波数分解能を上げる)よ
うにすることができる。更に、量子化される各帯域毎の
係数データは、いわゆる臨界帯域での各帯域(例えば25
バンド)の係数データとすることができる。
The high-efficiency encoding method for digital data of the present invention has been proposed to achieve the above-mentioned object, and divides input digital data into a plurality of bands and comprises a plurality of samples for each divided band. A high-efficiency encoding method for digital data in which blocks are formed and coefficient data is obtained by performing orthogonal transformation for each block of each band,
At least the block before orthogonal exchange of the lowest band is divided into a plurality of small blocks in time, and the energy of each small block is detected. Based on the detected energy, the small block of the lowest band is detected. The gain of each data is controlled. Here, in the energy detection of the small block, it is possible to detect at least a transient change in data of the block before the orthogonal transform of the lowest band. In this case, for example, in the gain control, the energy detection is performed. Based on the output, control is performed to reduce the gain of a small block having a transient change.
Further, when forming the block, it is possible to increase the block length (increase the time resolution) in the high band and increase the number of samples in one block (increase the frequency resolution) in the low band. Furthermore, coefficient data for each band to be quantized is stored in each band (for example, 25
Band).

〔作用〕[Action]

本発明によれば、少なくとも最も低域の帯域の各小ブ
ロック毎に検出されたエネルギに応じた各小ブロック毎
の利得制御を行うことで、ブロック内のデータの直交変
換等によるノイズを低減するようにしている。
According to the present invention, by performing gain control for each small block according to the energy detected for each small block in at least the lowest band, noise due to orthogonal transformation of data in the block is reduced. Like that.

〔実施例〕〔Example〕

以下、本発明を適用した実施例について図面を参照し
ながら説明する。
Hereinafter, embodiments of the present invention will be described with reference to the drawings.

本発明のディジタルデータの高能率符号化方法が適用
される一実施例のディジタルデータの高能率符号化装置
は、オーディオ或いは音声等の入力ディジタルデータ
を、例えば、前述の高能率符号化の帯域分割符号化(SB
C)等によって符号化するものである。すなわち、本実
施例の高能率符号化装置では、第1図に示すように、い
わゆるミラーフィルタのQMF(quadrature mirror filte
r)41,42によって、入力端子30を介して供給される上記
入力ディジタルデータを、高域程帯域幅が広くなるよう
に複数の帯域に分割し、高速フーリエ変換(FFT)回路4
3,44,45によって、この分割された帯域毎に複数のサン
プルからなるブロックを形成して、これら各ブロック毎
に例えば高速フーリエ変換による直交変換(時間軸を周
波数軸に変換)を行うことで係数データ(FFT係数デー
タ)を得るようになっている。この時、上記ブロックを
形成する際には、高域ではブロック長を長くすることで
時間分解能を上げ、低域では1ブロック内のサンプル数
を増やして周波数分解能を上げるようにしている。な
お、本実施例では、上記量子化される各帯域毎の係数デ
ータは、いわゆる臨界帯域(クリティカルバンド)での
各帯域(例えば25バンド)の係数データとしており、該
FFT係数データを量子化処理部58によって適応的な割当
てビット数で量子化した後、出力端子31から出力するよ
うにしている。
The digital data high-efficiency encoding apparatus according to one embodiment to which the digital data high-efficiency encoding method of the present invention is applied, for example, converts input digital data such as audio or voice into the above-mentioned high-efficiency encoding band division. Encoding (SB
C) or the like. That is, in the high-efficiency encoding apparatus of the present embodiment, as shown in FIG. 1, a so-called mirror filter QMF (quadrature mirror filter) is used.
r) The input digital data supplied via the input terminal 30 is divided into a plurality of bands by 41 and 42 so that the higher the band, the wider the bandwidth, and a fast Fourier transform (FFT) circuit 4
3, 44, 45, a block composed of a plurality of samples is formed for each of the divided bands, and an orthogonal transform (for example, a time axis is converted to a frequency axis) by a fast Fourier transform is performed for each of these blocks. Coefficient data (FFT coefficient data) is obtained. At this time, when forming the block, the time resolution is increased by increasing the block length in the high frequency range, and the frequency resolution is increased by increasing the number of samples in one block in the low frequency range. In this embodiment, the coefficient data of each band to be quantized is coefficient data of each band (for example, 25 bands) in a so-called critical band (critical band).
The FFT coefficient data is quantized by the quantization processing unit 58 with an adaptive number of allocated bits, and then output from the output terminal 31.

ここで、本実施例装置においては、少なくとも最も低
域の帯域の直交変換前のブロックを複数の小ブロックに
分けて各小ブロック毎のエネルギを検出するエネルギ検
出回路50(或いはピークレベルを検出する回路としても
よい)と、上記小ブロックの利得を制御する利得制御手
段であるゲインコントロール回路60とを設け、上記エネ
ルギ検出回路50の出力によって上記ゲインコントロール
回路60の利得を制御するようにしている。例えば、無信
号時すなわちエネルギ値が0の時を基準(例えば0dB)
として、小ブロック内のエネルギの大きさに応じた量だ
け、当該小ブロックの利得を下げるように制御する。或
いは、ある任意のエネルギ値を基準として、その基準エ
ネルギ値よりも小ブロック内のエネルギが大きいとき
は、その基準エネルギ値と小ブロック内エネルギ値の差
に応じた量だけ当該小ブロックの利得を低下させ、逆に
基準エネルギ値よりも小さい時は利得を増加させる方向
に制御を行うようにする。すなわち、例えば、第2図の
(a)に示すように、上記FFT処理されるブロックB
を、複数の小ブロックBsに分けて、上記エネルギ検出回
路50で各小ブロックBs毎のエネルギを検出する。この
時、例えば無信号時の0dBを基準とした場合は、第2図
の(b)に示すように、当該エネルギ検出回路50の検出
出力に応じて、上記ゲインコントロール回路60で各小ブ
ロックBs毎のデータの利得を制御するようにする。この
ような利得制御を行うことで、エネルギの大きい信号の
直交変換等により発生するノイズのレベルを低減するこ
とが可能となる。なお、上述のように小ブロック単位で
エネルギ検出を行う場合、利得制御の行われるデータ
は、1小ブロック単位分の検出にかかる時間だけ遅延さ
れることになる。
Here, in the apparatus of the present embodiment, at least the block before orthogonal transformation of the lowest band is divided into a plurality of small blocks, and the energy detection circuit 50 (or the peak level is detected) for detecting the energy of each small block. Circuit) and a gain control circuit 60 as a gain control means for controlling the gain of the small block, and the gain of the gain control circuit 60 is controlled by the output of the energy detection circuit 50. . For example, when there is no signal, that is, when the energy value is 0 (for example, 0 dB)
Is controlled so as to lower the gain of the small block by an amount corresponding to the magnitude of the energy in the small block. Alternatively, when the energy in the small block is larger than the reference energy value with reference to an arbitrary energy value, the gain of the small block is increased by an amount corresponding to the difference between the reference energy value and the energy value in the small block. On the contrary, when it is smaller than the reference energy value, the control is performed in a direction to increase the gain. That is, for example, as shown in (a) of FIG.
Is divided into a plurality of small blocks Bs, and the energy detection circuit 50 detects the energy of each small block Bs. At this time, for example, when 0 dB at the time of no signal is used as a reference, as shown in FIG. 2B, each small block Bs is controlled by the gain control circuit 60 in accordance with the detection output of the energy detection circuit 50. The gain of data is controlled every time. By performing such gain control, it is possible to reduce the level of noise generated by orthogonal transformation of a signal having a large energy. When the energy detection is performed in small block units as described above, the data on which gain control is performed is delayed by the time required for detection in one small block unit.

また、上記エネルギ検出回路50は、少なくとも最も低
域の帯域の直交変換前のブロックのデータの過渡的変化
を検出するようなものとすることもできる。この場合、
例えば、上記エネルギ検出回路50では、逐次小ブロック
のエネルギを検出すると共に、隣接する前の小ブロック
と当該小ブロック間のエネルギの差或いは比率を求め、
この差或いは比率が所定値を越えた時(すなわち過渡的
変化のあった時)、上記ゲインコントロール回路60で、
当該過渡的変化のある小ブロックのゲインをコントロー
ルするようにする。例えば、過渡的変化のある小ブロッ
クのみ利得を低下させるような制御を行うようにして、
他の小ブロックではゲインコントロールを行わずに所定
の基準利得としておく。すなわち、上記ブロックB内に
例えば前述した第5図のような大レベル信号部Cが存在
するような場合、このブロックB内の上記大レベル信号
部Cのある小ブロックのみの利得を低下させるように制
御する。上述のように過渡的変化のある小ブロックの利
得を制御することで、この大レベル信号部Cの直交変換
等に起因するノイズのレベルを低減することが可能とな
る。更に、このような過渡的変化のある小ブロックのみ
を検出するような場合、上述のように逐次小ブロックの
エネルギを検出して比較するものの他、例えば、上記ブ
ロック内の全ての小ブロックのエネルギを計算した後
に、過渡的変化のある小ブロックのみを検出し、この小
ブロックの利得を低下させるようにすることも可能であ
る。このようにすることで、前述したテンポラルマスキ
ングを有効に利用することができない小ブロックのみを
検出することができるようになり、この検出された小ブ
ロックの利得を低下させるように制御することで、上述
同様直交変換等の起因するノイズを低減することができ
るようになる。なお、この場合は、1ブロック単位分の
遅延を行うことになる。
Further, the energy detection circuit 50 may be configured to detect a transient change in data of a block before orthogonal transformation of at least the lowest band. in this case,
For example, the energy detection circuit 50 sequentially detects the energy of the small block and calculates the energy difference or ratio between the adjacent small block and the small block.
When this difference or ratio exceeds a predetermined value (ie, when there is a transient change), the gain control circuit 60
The gain of the small block having the transient change is controlled. For example, by performing control such that the gain is reduced only for small blocks having a transient change,
In other small blocks, a predetermined reference gain is set without performing gain control. That is, when the large-level signal section C as shown in FIG. 5 exists in the block B, the gain of only a small block having the large-level signal section C in the block B is reduced. To control. As described above, by controlling the gain of a small block having a transient change, it becomes possible to reduce the level of noise caused by the orthogonal transformation of the large-level signal portion C and the like. Further, when only small blocks having such a transient change are detected, in addition to the method of sequentially detecting and comparing the energy of the small blocks as described above, for example, the energy of all the small blocks in the block may be detected. After calculating, it is also possible to detect only a small block having a transient change and reduce the gain of this small block. By doing so, it becomes possible to detect only the small blocks for which the temporal masking cannot be effectively used, and by controlling the gain of the detected small blocks to be reduced, As described above, noise caused by orthogonal transformation or the like can be reduced. In this case, a delay of one block unit is performed.

更に、前述のマスキング(テンポラルマスキング)を
考慮することで、各小ブロック毎の利得制御を行うか否
かをコントロールするようにしてもよい。すなわち、あ
る小ブロック内の信号によって隣接する小ブロックの信
号がマスキングされるような場合には、特にその隣接す
る小ブロックの利得を制御しなくともよい。
Furthermore, by considering the above-described masking (temporal masking), it may be possible to control whether or not to perform gain control for each small block. That is, when a signal in an adjacent small block is masked by a signal in a certain small block, it is not particularly necessary to control the gain of the adjacent small block.

上述のように、本発明実施例においては、小ブロック
毎の利得制御、或いは過渡的変化のある小ブロックのみ
の利得制御を行うようにすることで、低域での直交変換
等により発生するノイズを低減することができると共
に、上記大レベル信号部Cの直交変換等に起因して発生
するノイズも低減することが可能となる。
As described above, in the embodiment of the present invention, by performing gain control for each small block or gain control for only small blocks having a transient change, noise generated by orthogonal transform in a low band or the like is performed. Can be reduced, and noise generated due to the orthogonal transformation of the large-level signal portion C and the like can be reduced.

また、本実施例では、上記ブロックを形成する際に
は、高域ではブロック長を長く(時間分解能を高く)
し、低域では1ブロック内のサンプル数を増やす(周波
数分解能を高くする)ようにすることができる。
Further, in the present embodiment, when forming the above-mentioned block, the block length is increased in a high frequency range (time resolution is increased).
However, in the low frequency range, the number of samples in one block can be increased (frequency resolution can be increased).

すなわち再び第1図に戻って、入力端子30には例えば
48kHzのサンプリング周波数fsでサンプリングされたオ
ーディオのディジタルデータ(0〜24kHz)が供給され
ており、該ディジタルデータは上記QMF41,42により、高
域程帯域幅が広くなるように大まかに3つの帯域(0〜
6kHz,6kHz〜12kHz,12kHz〜24kHz)に分割される。上記Q
MF41では、上記0〜24kHzのディジタルデータが2分割
されて12kHz〜24kHzと0〜12kHzの2つの出力が得ら
れ、12kHz〜24kHzの出力は高速フーリエ変換回路43に、
0〜12kHzの出力はQMF42に送られる。QMF42へ送られた
0〜12kHzの出力は、該QMF42で更に2分割されて6kHz〜
12kHzと0〜6kHzの2つの出力が得られる。これら出力
は、高速フーリエ変換回路44,45にそれぞれ送られる。
That is, returning to FIG. 1 again, for example,
Audio digital data (0 to 24 kHz) sampled at a sampling frequency fs of 48 kHz is supplied, and the digital data is roughly divided into three bands (QMF41, 42) so that the higher the band, the wider the band becomes. 0 to
6kHz, 6kHz-12kHz, 12kHz-24kHz). Q above
In the MF 41, the digital data of 0 to 24 kHz is divided into two to obtain two outputs of 12 kHz to 24 kHz and 0 to 12 kHz. The outputs of 12 kHz to 24 kHz are output to the fast Fourier transform circuit 43.
The output of 0 to 12 kHz is sent to QMF42. The output of 0 to 12 kHz sent to QMF42 is further divided into two by QMF42 and
Two outputs of 12kHz and 0-6kHz are obtained. These outputs are sent to fast Fourier transform circuits 44 and 45, respectively.

各高速フーリエ変換回路43,44,45では、供給された各
帯域のデータの複数サンプルで1ブロックを構成し、当
該ブロック毎にフーリエ変換処理を施してFFT係数デー
タを得るようになっている。この時、上記高速フーリエ
変換回路43では、64サンプルで1ブロックを構成して、
このブロック毎に上記FFT係数データを得るようにして
いる。この結果、該12kHz〜24kHzの帯域での時間分解能
は、約2.67msecの高時間分解能となる。上記高速フーリ
エ変換回路44では、1ブロック64サンプルでFFT係数デ
ータを得ており、この結果、当該6kHz〜12kHzでの時間
分解能は約5.3msecとなる。また、上記高速フーリエ変
換回路45では、1ブロック128サンプルでFFT係数データ
を得ているため、該0〜6kHzでの時間分解能は約10.67m
secとなっている。
In each of the fast Fourier transform circuits 43, 44, and 45, one block is constituted by a plurality of samples of the supplied data of each band, and the Fourier transform process is performed for each block to obtain FFT coefficient data. At this time, the fast Fourier transform circuit 43 forms one block with 64 samples,
The FFT coefficient data is obtained for each block. As a result, the time resolution in the band of 12 kHz to 24 kHz is a high time resolution of about 2.67 msec. The fast Fourier transform circuit 44 obtains FFT coefficient data in 64 samples per block. As a result, the time resolution at 6 kHz to 12 kHz is about 5.3 msec. Further, in the fast Fourier transform circuit 45, since the FFT coefficient data is obtained by 128 samples per block, the time resolution at 0 to 6 kHz is about 10.67 m.
sec.

このように、本実施例においては、高域(12kHz〜24k
Hz)及び中域(6kHz〜12kHz)での時間分解能が2.67mse
c及び5.3msecとなっているため、前記大レベル信号部C
に起因した前述の第6図のようなノイズが発生しても、
この高域・中域では、上記ブロック内の当該大レベル信
号部Cによる上記バックワードマスキングを有効に利用
(効果の時間は5msec程度)することができる。また、
本実施例の装置では、低域での周波数分解能を確保する
必要性から、当該低域での時間分解能が上述のように1
0.67msecとなっており、更に、10.67msecの時間分解能
であっても、該低域でのブロック内の上記大レベル信号
部Cに起因するノイズに対応できるようにしている。す
なわち、上述したように、この低帯域の直交変換前のブ
ロックを複数の小ブロックに分けて、各小ブロック毎の
エネルギを検出し(或いは過渡的変化部のある小ブロッ
クを検出)し、この検出出力に応じて各小ブロック毎
(或いは過渡的変化部のある小ブロック)の利得を制御
することで、上記低域でのブロック内の上記大レベル信
号部Cの直交変換等によって発生するノイズに対応(ノ
イズを低減)できるようにしている。
As described above, in this embodiment, the high frequency range (12 kHz to 24 k
Hz) and the mid-range (6kHz to 12kHz) time resolution is 2.67mse
c and 5.3 msec, the large-level signal section C
Even if noise as shown in FIG.
In the high and middle ranges, the backward masking by the large-level signal portion C in the block can be effectively used (the effect time is about 5 msec). Also,
In the device of the present embodiment, since the frequency resolution in the low frequency band needs to be secured,
0.67 msec, and even with a time resolution of 10.67 msec, it is possible to cope with noise caused by the large-level signal portion C in the block in the low frequency band. That is, as described above, the block before the orthogonal transform of the low band is divided into a plurality of small blocks, and the energy of each small block is detected (or the small block having a transient change portion is detected). By controlling the gain of each small block (or a small block having a transient change portion) in accordance with the detection output, noise generated by orthogonal transformation of the large-level signal portion C in the block in the low-frequency range, and the like. (Noise reduction).

ここで、第3図に本実施例における周波数領域と時間
領域での分解能を示す。この第3図では、上述した帯域
分割,高速フーリエ変換等の処理の1単位を示し、b
(m,n)におけるm,nの2つのパラメータにより、ブロッ
クが指定されている。mは帯域ナンバーを、nは時間ナ
ンバーを示している。該第3図において、0〜6kHzの低
域では、各帯域の1ブロックが10.67msecの時間長(時
間分解能)となることを示している。また、6KHz〜12kH
zの中域では1ブロックの時間長が5.3msecとなること
を、12kHz〜24kHzの高域では1ブロックの時間長が2.67
msecとなることを示している。
Here, FIG. 3 shows the resolution in the frequency domain and the time domain in this embodiment. FIG. 3 shows one unit of processing such as the above-described band division and fast Fourier transform,
A block is specified by two parameters m and n in (m, n). m indicates a band number, and n indicates a time number. In FIG. 3, one block in each band has a time length (time resolution) of 10.67 msec in the low band of 0 to 6 kHz. Also, 6KHz ~ 12kHz
In the middle band, the time length of one block is 5.3 msec, and in the high band of 12 kHz to 24 kHz, the time length of one block is 2.67.
msec.

このように、本実施例においては、聴覚から必要とさ
れる周波数軸上の分解能と時間軸上の分解能を同時に満
足するような構成となっていて、低域(0〜6kHz)では
処理のサンプル数を多くして周波数分解能を上げ、高域
(12kHz〜24kHz)では帯域幅を広くする共に時間分解能
も上げている。中域(6kHz〜12kHzでも時間分解能を上
げている。また、上記エネルギ検出回路50及びゲインコ
ントロール回路60による検出、利得制御処理は低域のみ
で行っているため、例えば、全帯域で検出、利得制御を
行う場合よりも誤動作が少なくなっている。
As described above, in the present embodiment, the resolution on the frequency axis and the resolution on the time axis required from the auditory sense are simultaneously satisfied. The frequency resolution is increased by increasing the number, and in the high frequency range (12 kHz to 24 kHz), the bandwidth is widened and the time resolution is also increased. The time resolution is also increased in the middle band (6 kHz to 12 kHz. The detection and gain control processing by the energy detection circuit 50 and the gain control circuit 60 are performed only in the low band. The number of malfunctions is smaller than when performing control.

更に、本実施例では、量子化処理部58での量子化の際
に、人間の聴覚特性に基づくマスキングを考慮した適応
的な割当てビット数で量子化を行うようにしているた
め、上記各フーリエ変換回路の出力(FFT係数データ)
を、同様に人間の聴覚特性に基づいた臨界帯域の各帯域
(例えば25バンド)に対応させている。すなわち、上記
高速フーリエ変換回路43の出力が、臨界帯域の高域のバ
ンドB24とバンドンB25の2つの帯域と対応し、高速フー
リエ変換回路44の出力がバンドB21〜B23の3つの帯域
と、高速フーリエ変換回路45の出力が臨界帯域の低域の
バンドB1〜B20の20個の帯域と対応するようにされてい
る。
Further, in the present embodiment, at the time of quantization in the quantization processing unit 58, quantization is performed with an adaptively allocated number of bits in consideration of masking based on human auditory characteristics. Conversion circuit output (FFT coefficient data)
Is also associated with each of the critical bands (for example, 25 bands) based on the human auditory characteristics. That is, the output of the fast Fourier transform circuit 43 corresponds to the two bands of the higher critical band B24 and bandon B25, and the output of the fast Fourier transform circuit 44 corresponds to the three bands B21 to B23 and the high speed band. The output of the Fourier transform circuit 45 is made to correspond to 20 bands of the lower bands B1 to B20 of the critical band.

なお、本実施例の上述したような利得制御を行う場
合、デコーダ側には、上記量子化後のFFT係数データと
共にゲインコントロール情報も伝送され、このゲインコ
ントロール情報に基づいたデコード処理が施されるよう
になる。
In the case where the above-described gain control of the present embodiment is performed, gain control information is also transmitted to the decoder side together with the quantized FFT coefficient data, and a decoding process based on the gain control information is performed. Become like

上述した本実施例での周波数軸上の帯域分割の様子を
第4図に示す。
FIG. 4 shows a state of band division on the frequency axis in the above-described embodiment.

第4図において、低域(0〜6kHz)のバンドB1〜B20
での係数データ数は、例えば、バンドB1〜B8は各1個,
バンドB9〜B11は各2個,バンドB12とB13は各3個,バ
ンドB14〜B16は各4個,バンドB17とB18は各6個,バン
ドB19は9個,バンドB20は11個とする。中域(6kHz〜12
kHz)のバンドB21〜B23での係数データ数は、例えば、
バンドB21は7個,バンドB22は11個,バンドB23は14個
とする。また、高域(12kHz〜24kHz)のバンドB24とB25
での係数データ数は、例えば、各16個としている。
In FIG. 4, bands B1 to B20 in the low band (0 to 6 kHz)
The number of coefficient data in is, for example, one for each of bands B1 to B8,
Two bands B9 to B11, three bands B12 and B13, four bands B14 to B16, six bands B17 and B18, nine bands B19, and eleven bands B20. Mid frequency (6kHz-12
kHz), the number of coefficient data in bands B21 to B23 is, for example,
The number of bands B21 is 7, the number of bands B22 is 11, and the number of bands B23 is 14. Also, bands B24 and B25 for high frequency (12kHz ~ 24kHz)
Is 16 for example.

〔発明の効果〕〔The invention's effect〕

本発明のディジタルデータの高能率符号化方法におい
ては、少なくとも最も低帯域の直交変換前のブロックが
小ブロック化された各小ブロック毎のエネルギの検出出
力に基づいて小ブロックの利得を制御するようにしたこ
とにより、直交変換等により発生するノイズを低減する
ことができ、特に、過渡性入力によるノイズを低減する
ことが可能となる。
In the high-efficiency encoding method for digital data according to the present invention, the gain of a small block is controlled based on an energy detection output of each small block in which at least the block before the orthogonal transform in the lowest band is divided into small blocks. By doing so, it is possible to reduce noise generated by orthogonal transformation or the like, and in particular, it is possible to reduce noise due to transient input.

なお、高域では高い時間分解能を得ることができ、ま
た、時間分解能を高くできない低域では高い周波数分解
能を得ることができるようにもなっている。
In addition, a high time resolution can be obtained in a high frequency range, and a high frequency resolution can be obtained in a low frequency range where the time resolution cannot be increased.

【図面の簡単な説明】[Brief description of the drawings]

第1図は本発明実施例のディジタルデータの高能率符号
化装置の概略構成を示すブロック回路図、第2図は本発
明実施例装置によって利得が制御される小ブロックを説
明するための図、第3図は周波数領域と時間領域の分解
能を示す図、第4図は帯域分割の様子を示す図、第5図
は過渡的変化の存在する高速フーリエ変換前のデータを
説明するための図、第6図は高速フーリエ変換,逆高速
フーリエ変換後のノイズ発生を説明するための図、第7
図はテンポラルマスキングを説明するための図である。 41,42……QMF 43〜45……高速フーリエ変換回路 50……エネルギ検出回路 58……量子化処理部 60……ゲインコントロール回路
FIG. 1 is a block circuit diagram showing a schematic configuration of a high-efficiency digital data encoding apparatus according to an embodiment of the present invention. FIG. 2 is a view for explaining small blocks whose gain is controlled by the apparatus according to the embodiment of the present invention. FIG. 3 is a diagram showing resolutions in a frequency domain and a time domain, FIG. 4 is a diagram showing a state of band division, FIG. 5 is a diagram for explaining data before fast Fourier transform in which a transient change exists, FIG. 6 is a diagram for explaining generation of noise after fast Fourier transform and inverse fast Fourier transform.
The figure is a diagram for explaining temporal masking. 41, 42 QMF 43 to 45 Fast Fourier transform circuit 50 Energy detection circuit 58 Quantization processing unit 60 Gain control circuit

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】入力ディジタルデータを複数の帯域に分割
し、分割された帯域毎に複数のサンプルからなるブロッ
クを形成し、各帯域のブロック毎に直交変換を行い係数
データを得るようにしたディジタルデータの高能率符号
化方法であって、 少なくとも最も低域の帯域の直交変換前のブロックを時
間的に複数の小ブロックに分けて、各小ブロック毎のエ
ネルギを検出し、 上記検出されたエネルギに基づいて、上記最も低域の帯
域の小ブロック毎のデータの利得を制御するようにした ことを特徴とするディジタルデータの高能率符号化方
法。
1. A digital system in which input digital data is divided into a plurality of bands, a block including a plurality of samples is formed for each of the divided bands, and orthogonal transform is performed for each block of each band to obtain coefficient data. A high-efficiency coding method for data, wherein at least a block before orthogonal transform of the lowest band is divided into a plurality of small blocks, and energy of each small block is detected. A high-efficiency encoding method for digital data, wherein a gain of data for each small block in the lowest band is controlled based on the following.
JP2061248A 1990-03-07 1990-03-14 Efficient coding method for digital data Expired - Lifetime JP2827410B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2061248A JP2827410B2 (en) 1990-03-14 1990-03-14 Efficient coding method for digital data
US08/029,988 US5502789A (en) 1990-03-07 1993-03-12 Apparatus for encoding digital data with reduction of perceptible noise

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2061248A JP2827410B2 (en) 1990-03-14 1990-03-14 Efficient coding method for digital data

Publications (2)

Publication Number Publication Date
JPH03263925A JPH03263925A (en) 1991-11-25
JP2827410B2 true JP2827410B2 (en) 1998-11-25

Family

ID=13165742

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2061248A Expired - Lifetime JP2827410B2 (en) 1990-03-07 1990-03-14 Efficient coding method for digital data

Country Status (1)

Country Link
JP (1) JP2827410B2 (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3336617B2 (en) * 1993-05-31 2002-10-21 ソニー株式会社 Signal encoding or decoding apparatus, signal encoding or decoding method, and recording medium
DE69428030T2 (en) * 1993-06-30 2002-05-29 Sony Corp DIGITAL SIGNAL ENCODING DEVICE, RELATED DECODING DEVICE AND RECORDING CARRIER
TW327223B (en) * 1993-09-28 1998-02-21 Sony Co Ltd Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal
WO1995012920A1 (en) * 1993-11-04 1995-05-11 Sony Corporation Signal encoder, signal decoder, recording medium and signal encoding method
JP4548444B2 (en) * 2000-12-14 2010-09-22 ソニー株式会社 Encoding apparatus and method, decoding apparatus and method, and recording medium
JP3997522B2 (en) * 2000-12-14 2007-10-24 ソニー株式会社 Encoding apparatus and method, decoding apparatus and method, and recording medium
JP2003110429A (en) * 2001-09-28 2003-04-11 Sony Corp Coding method and device, decoding method and device, transmission method and device, and storage medium
US7277575B2 (en) * 2003-11-25 2007-10-02 Sony Corporation System and method for effectively performing an image data transformation procedure

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03132228A (en) * 1989-10-18 1991-06-05 Victor Co Of Japan Ltd System for encoding/decoding orthogonal transformation signal

Also Published As

Publication number Publication date
JPH03263925A (en) 1991-11-25

Similar Documents

Publication Publication Date Title
JP2913731B2 (en) Highly efficient digital data encoding method.
JP3134338B2 (en) Digital audio signal encoding method
JP3104400B2 (en) Audio signal encoding apparatus and method
CN101354885B (en) Active noise control system
JP3334419B2 (en) Noise reduction method and noise reduction device
JP3307138B2 (en) Signal encoding method and apparatus, and signal decoding method and apparatus
CN109391877A (en) Automatic tuning audio compressor is to prevent from being distorted
JP4000261B2 (en) Stereo sound signal processing method and apparatus
US9076425B2 (en) Apparatus and method for reducing digital noise of audio signal
JPH0435123A (en) Digital signal encoder
CN1902901A (en) System and method for enhanced subjective stereo audio
JP2827410B2 (en) Efficient coding method for digital data
JPH08166799A (en) Method and device for high-efficiency coding
JPH06242797A (en) Block size determining method of converting and encoding device
JP2913735B2 (en) Highly efficient digital data encoding method.
JP2870050B2 (en) Highly efficient digital data encoding method.
JP3089692B2 (en) Highly efficient digital data encoding method.
JP3402483B2 (en) Audio signal encoding device
JP3033158B2 (en) Digital signal encoder
JP3166407B2 (en) Noise reduction device
US5146222A (en) Method of coding an audio signal by using coding unit and an adaptive orthogonal transformation
JP3033150B2 (en) Audio signal quantization error reduction device
JP3089690B2 (en) Highly efficient digital data encoding method.
JP3070123B2 (en) Digital signal encoding apparatus and method
JP2998196B2 (en) Audio signal quantization error reduction device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080918

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090918

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090918

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100918

Year of fee payment: 12

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100918

Year of fee payment: 12