JP3060578B2 - Digital signal encoding method - Google Patents

Digital signal encoding method

Info

Publication number
JP3060578B2
JP3060578B2 JP3091189A JP9118991A JP3060578B2 JP 3060578 B2 JP3060578 B2 JP 3060578B2 JP 3091189 A JP3091189 A JP 3091189A JP 9118991 A JP9118991 A JP 9118991A JP 3060578 B2 JP3060578 B2 JP 3060578B2
Authority
JP
Japan
Prior art keywords
level
critical band
band
information
bits
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3091189A
Other languages
Japanese (ja)
Other versions
JPH04302536A (en
Inventor
健三 赤桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP3091189A priority Critical patent/JP3060578B2/en
Publication of JPH04302536A publication Critical patent/JPH04302536A/en
Application granted granted Critical
Publication of JP3060578B2 publication Critical patent/JP3060578B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、入力ディジタル信号の
符号化を行うディジタル信号の高能率符号化装置に関す
るものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a high efficiency digital signal encoding apparatus for encoding an input digital signal.

【0002】[0002]

【従来の技術】オーディオ, 音声等の信号の高能率符号
化においては、オーディオ,音声等の入力信号を時間軸
又は周波数軸で複数のチャンネルに分割すると共に、各
チャンネル毎のビット数を適応的に割当てるビットアロ
ケーシヨン(ビット割当て)による符号化技術がある。
例えば、オーディオ信号等の上記ビット割当てによる符
号化技術には、時間軸上のオーディオ信号等を複数の周
波数帯域に分割して符号化する帯域分割符号化(サブ・
バンド・コーディング:SBC)や、時間軸の信号を周
波数軸上の信号に変換(直交変換)して複数の周波数帯
域に分割し各帯域毎で適応的に符号化するいわゆる適応
変換符号化(ATC)、或いは、上記SBCといわゆる
適応予測符号化(APC)とを組み合わせ、時間軸の信
号を帯域分割して各帯域信号をベースバンド(低域)に
変換した後複数次の線形予測分析を行って予測符号化す
るいわゆる適応ビット割当て(APC−AB)等の符号
化技術がある。
BACKGROUND ART Audio, in high-efficiency encoding of the signal of voice, etc., audio, adaptive with, the number of bits of each channel is divided into a plurality of channels of the input signal in the time axis or the frequency axis such as voice There is a coding technique based on bit allocation (bit allocation).
For example, the encoding technique based on the above-mentioned bit allocation of an audio signal or the like includes band division encoding (sub-coding) in which an audio signal or the like on a time axis is divided into a plurality of frequency bands and encoded.
Band coding: SBC) or so-called adaptive conversion coding (ATC) in which a signal on the time axis is converted into a signal on the frequency axis (orthogonal conversion), divided into a plurality of frequency bands, and adaptively encoded for each band. Alternatively, the SBC is combined with so-called adaptive prediction coding (APC), a signal on the time axis is divided into bands, and each band signal is converted into a baseband (low band), and then a multi-order linear prediction analysis is performed. There is an encoding technique such as so-called adaptive bit allocation (APC-AB) for predictive encoding.

【0003】上記高能率符号化においては、時間軸上の
オーディオ信号等を、所定の単位時間毎に例えば高速フ
ーリエ変換(FFT)等の直交変換によって時間軸に直
交する軸(周波数軸)に変換し、その後複数の帯域に分
割して、これら分割された各帯域のFFT係数データを
適応的なビット割り当てによって符号化している。この
符号化データが伝送される。
In the above-mentioned high efficiency coding, an audio signal or the like on a time axis is transformed into an axis (frequency axis) orthogonal to the time axis by an orthogonal transformation such as a fast Fourier transform (FFT) every predetermined unit time. Then, the data is divided into a plurality of bands, and the FFT coefficient data of each of the divided bands is encoded by adaptive bit allocation. This encoded data is transmitted.

【0004】[0004]

【発明が解決しようとする課題】ところで、この各帯域
毎のFFT係数データを上記適応ビット割り当てにより
符号化する際には、例えば、上記周波数軸上のFFT係
数データをブロック化し、このブロック毎にいわゆるブ
ロックフローティング処理を施すことで、更にビット圧
縮を行う場合が多い。このため、後の復号化のための構
成には、上記帯域分割されると共に上記ブロック毎にブ
ロックフローティング処理されたFFT係数データと、
当該各ブロック毎のフローティング係数及び割り当てビ
ット数に応じたワード長情報からなるサブ情報とが伝送
されることになる。
When the FFT coefficient data for each band is encoded by the adaptive bit allocation, for example, the FFT coefficient data on the frequency axis is divided into blocks, and In many cases, bit compression is further performed by performing a so-called block floating process. For this reason, the configuration for later decoding includes FFT coefficient data that has been band-divided and subjected to block floating processing for each block,
The floating coefficient for each block and the sub information including the word length information corresponding to the number of allocated bits are transmitted.

【0005】しかし、上記高能率符号化においては、更
に圧縮効率を高めることが望まれている。
However, in the high-efficiency coding, it is desired to further increase the compression efficiency.

【0006】そこで、本発明は、上述のような実情に鑑
みて提案されたものであり、より高いビット圧縮が可能
なディジタル信号符号化方法を提供することを目的とす
るものである。
Accordingly, the present invention has been proposed in view of the above-described circumstances, and has as its object to provide a digital signal encoding method capable of performing higher bit compression.

【0007】[0007]

【課題を解決するための手段】本発明のディジタル信号
符号化方法は、上述の目的を達成するために提案された
ものであり、入力ディジタル信号を直交変換して臨界帯
域に分割し、当該臨界帯域毎のエネルギに基づいて設定
した各臨界帯域毎の許容ノイズレベルと当該各臨界帯域
毎のエネルギとの差分のレベルに応じたビット数で上記
各臨界帯域の信号成分を符号化すると共に、上記直交変
換後の信号成分をブロック化してこのブロック毎にブロ
ックフローティング処理を行い当該ブロック毎のフロー
ティング係数を伝送するディジタル信号符号化方法であ
って、上記ブロックフローティング処理を上記臨界帯域
よりも狭い帯域の小ブロック単位で行う場合には、上記
小ブロック毎に割り当てられるビット数に応じたワード
長の情報を伝送すると共に、上記臨界帯域毎のフローテ
ィング係数の代わりに上記臨界帯域内の信号レベル範囲
から所定レベル分だけ低い方へ指定範囲をずらした許容
ノイズレベルに関する情報を伝送するようにしたもので
ある。ここで、上記割当ビット数決定の際には、例え
ば、各臨界帯域毎のエネルギから人間の聴覚特性を考慮
していわゆるマスキング量を求め、このマスキング量に
基づく許容ノイズレベルを用いて各臨界帯域の割当ビッ
ト数を決定することが望ましい。また、上記所定レベル
としては、上記マスキング量に応じた量とすることが好
ましい。
SUMMARY OF THE INVENTION A digital signal encoding method according to the present invention has been proposed to achieve the above-mentioned object. An input digital signal is orthogonally transformed and divided into a critical band. Encoding the signal component of each critical band with the number of bits according to the level of the difference between the allowable noise level for each critical band and the energy for each critical band set based on the energy for each band, and A digital signal encoding method in which signal components after orthogonal transformation are divided into blocks, block floating processing is performed for each block, and floating coefficients for each block are transmitted, wherein the block floating processing is performed for a band narrower than the critical band. When the operation is performed in small block units, word length information corresponding to the number of bits allocated to each small block is transmitted. Together, in which so as to transmit the information about the allowable noise level shifted specified range from the signal level range in the critical band only to lower predetermined level content instead of the floating coefficient for each said critical band. Here, when determining the number of allocated bits, for example, a so-called masking amount is determined from the energy of each critical band in consideration of human auditory characteristics, and each critical band is determined using an allowable noise level based on the masking amount. Is desirably determined. Further, it is preferable that the predetermined level is an amount corresponding to the masking amount.

【0008】[0008]

【作用】本発明によれば、ブロックフローティング処理
が臨界帯域よりも狭い帯域の小ブロックについて行われ
る場合は、1つの臨界帯域内に複数の小ブロックが存在
することになり、この場合、各小ブロック毎のフローテ
ィング係数を伝送せずに、臨界帯域毎の許容ノイズレベ
ルに関する情報及びワード長情報を送るようにすること
で、フローティング係数のためのビット数を減らすこと
ができる。この時、許容ノイズレベルの指定範囲を臨界
帯域内の信号レベル範囲から所定レベル分だけ低い方へ
ずらすことで、この許容ノイズレベルに関する情報を更
に低減することが可能となる。
According to the present invention, when the block floating processing is performed on a small block having a band narrower than the critical band, a plurality of small blocks exist in one critical band. By transmitting the information on the allowable noise level and the word length information for each critical band without transmitting the floating coefficient for each block, the number of bits for the floating coefficient can be reduced. At this time, the information on the allowable noise level can be further reduced by shifting the specified range of the allowable noise level from the signal level range within the critical band by a predetermined level.

【0009】[0009]

【実施例】以下、本発明を適用した実施例について図面
を参照しながら説明する。本発明のディジタル信号符号
化方法は、入力ディジタル信号を例えば高速フーリエ変
換(FFT)で直交変換して人間の聴覚特性を考慮した
高域ほど帯域幅が広くなるようないわゆる臨界帯域(ク
リティカルバンド)に分割し、当該臨界帯域毎のエネル
ギに基づいて設定した各臨界帯域毎の許容ノイズレベル
と当該各臨界帯域毎のエネルギとの差分のレベルに応じ
たビット数で上記各臨界帯域の信号成分(FFT係数デ
ータ)を符号化すると共に、上記直交変換後の信号成分
をブロック化してこのブロック毎にブロックフローティ
ング処理を行い当該ブロック毎のフローティング係数を
伝送するディジタル信号符号化方法である。
Embodiments of the present invention will be described below with reference to the drawings. The digital signal encoding method according to the present invention employs a so-called critical band in which an input digital signal is orthogonally transformed by, for example, a fast Fourier transform (FFT) and the bandwidth becomes wider in a higher frequency band in consideration of human auditory characteristics. And the signal component of each of the critical bands is determined by the number of bits according to the level of the difference between the allowable noise level of each critical band and the energy of each critical band set based on the energy of each critical band. This is a digital signal encoding method that encodes FFT coefficient data), blocks signal components after the orthogonal transform, performs block floating processing for each block, and transmits floating coefficients for each block.

【0010】換言すれば、本実施例では、図1のフロー
チャートに示すような処理を行う。先ず、ステップS1
では上記直交変換後の信号成分をブロック化してこのブ
ロック毎にブロックフローティング処理を行い当該ブロ
ック毎のフローティング係数(フローティングレベル)
を決定する。ステップS2では後述するような臨界帯域
毎のエネルギに基づいて設定した各臨界帯域毎の許容ノ
イズレベルを決定し、ステップS3では上記各臨界帯域
毎の許容ノイズレベルと当該各臨界帯域毎のエネルギと
の差分のレベルに基づいて設定される割り当てビット数
に応じたワード長の情報を決定するようにしている。
In other words, in this embodiment, the processing shown in the flowchart of FIG. 1 is performed. First, step S1
Then, the signal components after the orthogonal transformation are divided into blocks, and a block floating process is performed for each block, and a floating coefficient (floating level) for each block is performed.
To determine. In step S2, the allowable noise level for each critical band set based on the energy for each critical band as described later is determined. In step S3, the allowable noise level for each critical band and the energy for each critical band are determined. Is determined based on the number of allocated bits set based on the level of the difference between the two.

【0011】ここで、本発明実施例において上記ブロッ
クフローティング処理を上記臨界帯域よりも狭い帯域の
小ブロック単位で行う場合には、上記ステップS4では
上記小ブロック毎に割り当てられるビット数に応じたワ
ード長の情報を求めて伝送すると共に、ステップS5及
びステップS6においては上記臨界帯域毎のフローティ
ング係数の代わりに上記臨界帯域内の信号レベル範囲か
ら所定レベル分(後述するマスキング量に基づくレベル
分)だけ低い方へ指定範囲をずらすようになされた許容
ノイズレベルに関する情報を求めて伝送するようにして
いる。具体的にいうと、上記臨界帯域内の信号レベル範
囲から上記所定レベル分だけ低い方に指定範囲をシフト
するような値が格納された量子化テーブルを用い、この
量子化テーブルから上記ステップS2で求められた許容
ノイズレベルに対応する値を出力して伝送するようにし
ている。
Here, in the embodiment of the present invention, when the block floating processing is performed in units of small blocks in a band narrower than the critical band, in step S4, a word corresponding to the number of bits allocated to each small block is used. The length information is obtained and transmitted, and in steps S5 and S6, a predetermined level (a level based on a masking amount described later) from the signal level range within the critical band is used instead of the floating coefficient for each critical band. Information about an allowable noise level that is shifted from a specified range to a lower one is obtained and transmitted. More specifically, a quantization table storing a value that shifts the specified range from the signal level range within the critical band to the lower side by the predetermined level is used. A value corresponding to the obtained allowable noise level is output and transmitted.

【0012】上述のように、許容ノイズレベルの指定範
囲をシフトさせるのは、次のような理由からである。先
ず、上記ステップS2で求めた許容ノイズレベルに関す
る情報をそのまま伝送するようにした場合、実際の信号
の取り得るダイナミックレンジと同じ指標を当該許容ノ
イズレベルに対して用いるのはムダが多い。すなわち、
許容ノイズレベルというのは、後述するように、人間の
聴覚特性を考慮したマスキング量に基づいて求められる
ものであるため、上記実際の信号レベルの最大値に対し
て必ずある一定レベル低いものとなるものである。例え
ば、上記許容ノイズレベルは、上記信号レベルに対して
約26dB程度低く取られるものである。このように、
上記信号レベルに対して、必ずある一定レベル低く取ら
れる許容ノイズレベルに対して、当該信号レベルの取り
うるダイナミックレンジをそのまま用いることは、非常
にムダであり、ビット数低減の観点からも好ましくな
い。このようなことから、本実施例では、上述したよう
に、上記臨界帯域内の信号レベル範囲から所定レベル分
だけ低い方へ指定範囲をずらすようになされた量子化テ
ーブルを用いるようにしている。これにより、少ないビ
ット数でも許容ノイズレベルを表現することが可能とな
る。換言すれば、少ないビット数でも上記シフトを行わ
ない場合と同じ分解能(精度)で許容ノイズレベルを表
すことができるようになる。したがって、許容ノイズレ
ベルの伝送のためのビット数を低減することが可能とな
る。
The reason why the specified range of the allowable noise level is shifted as described above is as follows. First, when the information on the permissible noise level obtained in step S2 is transmitted as it is, it is often wasteful to use the same index as the dynamic range that an actual signal can take for the permissible noise level. That is,
As will be described later, the allowable noise level is obtained based on the masking amount in consideration of the human auditory characteristics, so that the allowable noise level is always lower by a certain level than the maximum value of the actual signal level. Things. For example, the allowable noise level is about 26 dB lower than the signal level. in this way,
It is very wasteful to use the dynamic range that the signal level can take as it is with respect to the allowable noise level that is always lower by a certain level than the signal level, and it is not preferable from the viewpoint of reducing the number of bits. . For this reason, in the present embodiment, as described above, a quantization table is used which shifts the designated range from the signal level range within the critical band to a lower level by a predetermined level. As a result, the allowable noise level can be expressed with a small number of bits. In other words, the permissible noise level can be represented with the same resolution (accuracy) as in the case where the shift is not performed, even with a small number of bits. Therefore, it is possible to reduce the number of bits for transmitting an allowable noise level.

【0013】ところで、上述したように、臨界帯域より
も狭い帯域の小ブロックでフローティング処理を行う場
合とは、例えば図2に示すような場合を想定している。
この図2では、臨界帯域の高域すなわち帯域幅の広い臨
界帯域Bを示しており、この臨界帯域B内に複数の上記
ブロック(例えば4つの上記小ブロックb1〜b4)が
存在するような例を示している。
By the way, as described above, the case where the floating process is performed in a small block having a band narrower than the critical band is assumed, for example, as shown in FIG.
FIG. 2 shows a high critical band, that is, a critical band B having a wide bandwidth, and an example in which a plurality of the blocks (for example, the four small blocks b1 to b4) exist in the critical band B. Is shown.

【0014】通常、このように臨界帯域B内を小ブロッ
クb1〜b4に分割し、この小ブロック毎にブロックフ
ローティング処理を施すようにすると、後の復号化処理
の際には、各小ブロック毎のフローティング処理で得ら
れるフローティング係数と、各小ブロック毎の割り当て
ビット数に応じたワード長の情報とが必要となる。すな
わち、後の復号化のための構成に対しては、上記小ブロ
ック毎のフローティング係数の情報及び、該フローティ
ング係数のレベルと該臨界帯域の許容ノイズレベルとの
レベル差に基づく割り当てビット数に応じた各小ブロッ
ク毎のワード長の情報を伝送することが必要となる。換
言すれば、後の復号化の際には、上記フローティング係
数の情報から、上記ブロックフローティング処理におけ
る最上位ビット(MSB)が決まり、上記ワード長の情
報から最下位ビット(LSB)が決まって上記許容ノイ
ズレベルが決定される。更に各小ブロックのFFT係数
データ(メインデータ)から信号の大きさが決まるよう
になる。
Normally, when the inside of the critical band B is divided into small blocks b1 to b4 and the block floating processing is performed for each of the small blocks as described above, each of the small blocks is used in the subsequent decoding processing. , A floating coefficient obtained by the floating process and word length information corresponding to the number of bits allocated to each small block are required. That is, for the configuration for later decoding, it depends on the information of the floating coefficient for each small block and the number of bits allocated based on the level difference between the level of the floating coefficient and the allowable noise level of the critical band. It is necessary to transmit the word length information for each small block. In other words, at the time of subsequent decoding, the most significant bit (MSB) in the block floating processing is determined from the information on the floating coefficient, and the least significant bit (LSB) is determined from the information on the word length. An allowable noise level is determined. Further, the signal size is determined from the FFT coefficient data (main data) of each small block.

【0015】ここで、通常、上記フローティング係数の
情報は例えば6ビットで表され、上記ワード長の情報は
それぞれ例えば4ビットで表される。なお、直交変換が
DFT(離散的フーリエ変換)の場合、上記ワード長情
報は、大きさ(振幅)と位相若しくは実数部と虚数部を
上記4ビットで表すことになる。このため、例えば、1
つの臨界帯域Bを複数のフローティングブロック(小ブ
ロックb1〜b4)で分割した場合、当該ブロックフロ
ーティング処理の小ブロック数(すなわち帯域の分割
数)に応じた当該臨界帯域の全体の伝送ビット数は、表
1に示すようになる。
Normally, the information of the floating coefficient is represented by, for example, 6 bits, and the information of the word length is represented by, for example, 4 bits. When the orthogonal transform is a DFT (Discrete Fourier Transform), the word length information indicates a magnitude (amplitude) and a phase or a real part and an imaginary part by the four bits. Thus, for example, 1
When one critical band B is divided into a plurality of floating blocks (small blocks b1 to b4), the total number of transmission bits of the critical band according to the number of small blocks (that is, the number of band divisions) of the block floating process is: As shown in Table 1.

【表1】 [Table 1]

【0016】この表1において、臨界帯域を1つのブロ
ックで表した場合(1分割)は、フローティング係数に
6ビットで、ワード長に4ビットの合計10ビットが伝
送されることになる。また、臨界帯域を2つの小ブロッ
クで表した場合(2分割)は、フローティング係数に6
×2(=12ビット)、ワード長に4×2(=8ビッ
ト)で合計20ビットが伝送されることになる。以下同
様に、3分割した場合はフローティング係数に6×3
(=18ビット)でワード長に4×3(=12ビット)
の合計30ビット、また、4分割の場合はフローティン
グ係数に6×4(=24ビット)でワード長に4×4
(=16ビット)の合計40ビットが伝送される。上述
のように、1つの臨界帯域内のブロック数が増加するほ
ど伝送されるビット数も増加することになる。
In Table 1, when the critical band is represented by one block (one division), a total of 10 bits of 6 bits for the floating coefficient and 4 bits for the word length are transmitted. When the critical band is represented by two small blocks (divided into two), the floating coefficient is 6
× 2 (= 12 bits) and a word length of 4 × 2 (= 8 bits), a total of 20 bits are transmitted. Similarly, when divided into three, the floating coefficient is 6 × 3
(= 18 bits) and the word length is 4 × 3 (= 12 bits)
, A total of 30 bits, and in the case of four divisions, a floating coefficient is 6 × 4 (= 24 bits) and a word length is 4 × 4
(= 16 bits), a total of 40 bits are transmitted. As described above, as the number of blocks in one critical band increases, the number of transmitted bits also increases.

【0017】これに対し、本発明実施例の上記図2の例
においては、臨界帯域B内の上記各小ブロックb1〜b
4のフローティング係数Fc1〜Fc4の情報を伝送せ
ずに、臨界帯域Bに対して1つのみ設定される上記許容
ノイズレベルNLの情報と上記割り当てビット数に応じ
たワード長W1〜W4の情報を伝送するようにしてい
る。すなわち、後の復号化処理の際には、上記臨界帯域
Bの許容ノイズレベルNLの情報が伝送されて来れば、
当該許容ノイズレベルNLの情報と上記各小ブロックb
1〜b4のワード長W1〜W4の情報とに基づいて、上
記各小ブロックb1〜b4毎のフローティング係数Fc
1〜Fc4の情報を求めることができるため、このフロ
ーティング係数Fc1〜Fc4の情報を伝送しないよう
にしている。これにより、上記臨界帯域Bに対して4つ
必要な上記フローティング係数Fc1〜Fc4を伝送す
るためのビット数が低減できるようになる。
On the other hand, in the example of FIG. 2 of the embodiment of the present invention, each of the small blocks b1 to b
4 without transmitting the information of the floating coefficients Fc1 to Fc4, the information of the allowable noise level NL set only for the critical band B and the information of the word lengths W1 to W4 corresponding to the number of allocated bits. I try to transmit. That is, in the subsequent decoding process, if information on the allowable noise level NL of the critical band B is transmitted,
Information on the permissible noise level NL and each of the small blocks b
The floating coefficient Fc for each of the small blocks b1 to b4 based on the information on the word lengths W1 to W4 of the small blocks b1 to b4.
Since the information of the floating coefficients Fc1 to Fc4 can be obtained, the information of the floating coefficients Fc1 to Fc4 is not transmitted. Accordingly, the number of bits for transmitting the floating coefficients Fc1 to Fc4 required for the critical band B can be reduced.

【0018】なお、図2には、上記割り当てビット数を
求めるためのレベル差とワード長W1〜W4とが対応す
るものであるため、該ワード長W1〜W4を便宜的に図
中に示している。
In FIG. 2, the word lengths W1 to W4 are shown in the figure for convenience because the level difference for obtaining the number of allocated bits and the word lengths W1 to W4 correspond to each other. I have.

【0019】ここで、上記許容ノイズレベルNLは、上
述したように、人間の聴覚特性を考慮した臨界帯域毎に
求められており、当該臨界帯域では、1つの臨界帯域内
で許容ノイズレベルが略一定と考えることができるもの
である。したがって、上記図2の臨界帯域B内の各小ブ
ロックb1〜b4においても、許容ノイズレベルNLは
同レベルであると考えることができる。ただし、全体の
ダイナミックレンジを例えば120dBとし、上記フロ
ーティング係数を上記6ビットで表すと、該フローティ
ング係数は約2dBの精度を持つことになり、また、上
記ワード長情報を上記4ビットで表すと、該ワード長情
報は約6dBの精度となる。このため、上記図2の各小
ブロックb1〜b4において、後の復号化の際には、フ
ローティング係数Fc1〜Fc4と、上記ワード長W1
〜W4の情報とから決まる許容ノイズレベルNLは、約
2dBステップのズレを持つようになる。しかし、許容
ノイズレベルNLは、通常、略±3dBの範囲内に収ま
る。このようなことから、本実施例では、許容ノイズレ
ベルNLを臨界帯域B内で共通の荒い量子化と、臨界帯
域B内のフローティング処理の各小ブロックb1〜b4
それぞれの持つ細かい量子化との2段階で表して当該許
容ノイズレベルNLを精度高く共通値として設定してい
る。すなわち、本実施例では、許容ノイズレベルNLが
4ビットlogレベルであるため、この4ビットlog
で表しきれなかった許容ノイズレベルNLを2ビットl
ogで細かく表すようにしている。したがって本実施例
では、約6dBを4分割して1.5dB精度とすること
が可能となる。このように、上記許容ノイズレベルNL
が複数の小ブロックb1〜b4に渡って略等しいことを
用い、上記高精度のパラメータを上記フローティング係
数と許容ノイズレベルから選択する事でビット数を低減
することがてきることになる。このような図2の例にお
けるビット数低減の様子を上記表1と比較して表2に示
す。
Here, the permissible noise level NL is determined for each critical band in consideration of human auditory characteristics, as described above. In the critical band, the permissible noise level is substantially within one critical band. It can be considered constant. Therefore, it can be considered that the allowable noise level NL is the same in each of the small blocks b1 to b4 in the critical band B in FIG. However, if the entire dynamic range is, for example, 120 dB and the floating coefficient is represented by the 6 bits, the floating coefficient has an accuracy of about 2 dB, and if the word length information is represented by the 4 bits, The word length information has an accuracy of about 6 dB. For this reason, in each of the small blocks b1 to b4 in FIG. 2 described above, in the subsequent decoding, the floating coefficients Fc1 to Fc4 and the word length W1
The allowable noise level NL determined from the information of .about.W4 has a deviation of about 2 dB steps. However, the allowable noise level NL usually falls within a range of approximately ± 3 dB. For this reason, in the present embodiment, in the present embodiment, the allowable noise level NL is set to the common rough quantization in the critical band B, and the small blocks b1 to b4 of the floating process in the critical band B.
The permissible noise level NL is set as a common value with high precision in two stages, each of which has fine quantization. That is, in this embodiment, since the allowable noise level NL is a 4-bit log level, this 4-bit log level is used.
The allowable noise level NL that could not be expressed by
It is represented in detail by og. Therefore, in the present embodiment, it is possible to divide about 6 dB into four to achieve 1.5 dB accuracy. Thus, the allowable noise level NL
Is substantially equal across a plurality of small blocks b1 to b4, and the number of bits can be reduced by selecting the high-precision parameter from the floating coefficient and the allowable noise level. Table 2 shows how the number of bits is reduced in the example of FIG. 2 in comparison with Table 1 above.

【表2】 [Table 2]

【0020】この表2において、臨界帯域Bを1つのブ
ロックで表した場合(1分割)は、上記許容ノイズレベ
ルNLを4ビットで、ワード長Wを4ビットで伝送す
る。ただし、上記許容ノイズレベルNLにおいては、上
述したように、2dB分のズレを補償するための2ビッ
トを加えて(4+2ビット)いる。このため、該1分割
では合計10ビットが伝送されることになる。同じく、
臨界帯域Bを2つの小ブロックで表した場合(2分割)
は、許容ノイズレベルNLに4+2×2=8ビット、ワ
ード長Wに4×2=8ビットで合計16ビットが伝送さ
れることになる。以下同様に、3分割した場合は許容ノ
イズレベルNLに4+2×3=10ビット、ワード長W
に4×3=12ビットの合計22ビット、4分割(図2
の例)の場合は許容ノイズレベルNLに4+2×4=1
2ビット、ワード長Wに4×4=16ビットの合計28
ビットが伝送されることになる。このため、表1の例の
伝送ビット数を100%としてこの表2の例と比較する
と、表2の例の場合、1分割では同じく100%となる
のに対し、2分割では80%、3分割では73%、4分
割では70%のように、分割数(ブロック数)が増加す
る程、ビット低減率が向上するようになる。したがっ
て、本実施例の方法は非常に有効であることが理解でき
る。
In Table 2, when the critical band B is represented by one block (one division), the allowable noise level NL is transmitted by 4 bits and the word length W is transmitted by 4 bits. However, in the allowable noise level NL, as described above, 2 bits for compensating for a shift of 2 dB are added (4 + 2 bits). Therefore, a total of 10 bits are transmitted in the one division. Similarly,
When the critical band B is represented by two small blocks (divided into two)
Means that 4 + 2 × 2 = 8 bits for the allowable noise level NL and 4 × 2 = 8 bits for the word length W, for a total of 16 bits. Similarly, when the signal is divided into three parts, the allowable noise level NL becomes 4 + 2 × 3 = 10 bits and the word length W
2 × 4 = 3 = 12 bits, totaling 22 bits, divided into four (FIG. 2
In the case of Example 2), the allowable noise level NL is 4 + 2 × 4 = 1.
2 bits, word length W, 4 × 4 = 16 bits, total 28
Bits will be transmitted. Therefore, comparing the example of Table 2 with the example of Table 2 where the number of transmission bits in the example of Table 1 is 100%, the example of Table 2 has the same value of 100% for one division, but 80% and 3% for the two divisions. As the number of divisions (the number of blocks) increases, such as 73% for division and 70% for four divisions, the bit reduction rate increases. Therefore, it can be understood that the method of this embodiment is very effective.

【0021】すなわち、本実施例においては、上述した
図2のような臨界帯域B毎に上記許容ノイズレベルNL
に関する情報を伝送するようにした場合、上述したよう
に、上記臨界帯域B内の信号レベル範囲から所定レベル
分だけ低い方へ許容ノイズレベルNLの指定範囲をずら
すようにした量子化テーブルの出力を伝送するようにし
ている。このようにすることで、許容ノイズレベルNL
の伝送のためのビット数を低減することが可能となって
いる。
That is, in this embodiment, the allowable noise level NL is set for each critical band B as shown in FIG.
As described above, the output of the quantization table in which the specified range of the allowable noise level NL is shifted from the signal level range in the critical band B to the lower side by a predetermined level, as described above. I try to transmit. By doing so, the allowable noise level NL
It is possible to reduce the number of bits for transmission.

【0022】なお、この図2の例の場合のように、上記
許容ノイズレベルNLに対して例えば4ビットで表すよ
うにした場合には、上記4ビットで表せる範囲を上述の
ように所定レベル分低い方にシフトさせるようにする。
ただし、実際の許容ノイズレベルNLに関する情報は、
上記2dB分のズレを補償するための2ビット分の偏差
が付け加えられたものとなる。また、ワード長のW1〜
W4の情報の量子化は適応的でなく一様な量子化とされ
ている。
When the allowable noise level NL is represented by, for example, 4 bits as in the case of the example of FIG. 2, the range represented by the 4 bits is equal to the predetermined level as described above. Try to shift lower.
However, information on the actual allowable noise level NL is
A 2-bit deviation for compensating for the above-mentioned 2 dB deviation is added. In addition, word length W1
The quantization of the information of W4 is not adaptive but uniform.

【0023】更に、上記図2の例においては、1つの臨
界帯域B内の上記各ワード長W1〜Wの情報のうちで伝
送するのをワード長W1の情報のみとし、他のワード長
W2〜W4の情報を伝送しないようにすることも可能で
ある。すなわち、伝送するのは、該臨界帯域B内の各フ
ローティング係数Fc1〜Fc4の情報と、上記ワード
長W1の情報とする。換言すれば、後の復号化処理の際
には、1つのワード長W1の情報が伝送されて来れば、
各フローティング係数Fc1〜Fc4の情報に基づい
て、残りのワード長W2〜W4の情報を求めることがで
きる。具体的には、上記フローティング係数Fc1とワ
ード長W1とで許容ノイズレベルNLを求めることがで
き、該許容ノイズレベルNLを求めることができれば、
該許容ノイズレベルNLと上記フローティング係数Fc
2〜Fc4とから、上記残りのワード長W2〜W4を知
ることができるようになる。このようなことから、上記
残りのワード長W2〜W4の情報を伝送しないようにす
ることができ、したがって、臨界帯域Bに対して上記3
つのワード長W2〜W4の情報の伝送のためのビット数
が低減できるようになる。
Further, in the example of FIG. 2, among the information of the word lengths W1 to W in one critical band B, only the information of the word length W1 is transmitted, and the other word lengths W2 to W2 are transmitted. It is also possible not to transmit the information of W4. That is, information to be transmitted is information on the floating coefficients Fc1 to Fc4 in the critical band B and information on the word length W1. In other words, in the subsequent decoding process, if information of one word length W1 is transmitted,
The information on the remaining word lengths W2 to W4 can be obtained based on the information on the floating coefficients Fc1 to Fc4. Specifically, the allowable noise level NL can be obtained from the floating coefficient Fc1 and the word length W1, and if the allowable noise level NL can be obtained,
The allowable noise level NL and the floating coefficient Fc
2 to Fc4, the remaining word lengths W2 to W4 can be known. Therefore, it is possible to prevent the information of the remaining word lengths W2 to W4 from being transmitted.
The number of bits for transmitting information of two word lengths W2 to W4 can be reduced.

【0024】上述した本実施例のディジタル信号符号化
方法が適用される構成の例を図3に示す。
FIG. 3 shows an example of a configuration to which the above-described digital signal encoding method of the present embodiment is applied.

【0025】すなわちこの図3において、入力端子1に
供給された時間軸上のディジタルオーディオデータが、
高速フーリエ変換回路11に伝送される。この高速フー
リエ変換回路11では、上記時間軸上のオーディオデー
タが単位時間毎(単位ブロック)に周波数軸上のデータ
に変換され、実数成分値Reと虚数成分値Imとからな
るFFT係数データが得られる。これらFFT係数デー
タは振幅位相情報発生回路12に伝送され、当該振幅位
相情報発生回路12では上記実数成分値Reと虚数成分
値Imとから振幅情報Amと位相情報Phとが得られ
て、上記振幅情報Amの情報が出力されるようになる。
すなわち、一般に人間の聴覚は周波数領域の振幅(パワ
ー)には敏感であるが、位相についてはかなり鈍感であ
るため、本実施例では上記振幅情報Amのみを用いて上
記割当ビット数情報を得るようにしている。
That is, in FIG. 3, the digital audio data on the time axis supplied to the input terminal 1 is
The signal is transmitted to the fast Fourier transform circuit 11. The fast Fourier transform circuit 11 converts the audio data on the time axis into data on the frequency axis for each unit time (unit block), and obtains FFT coefficient data including a real component value Re and an imaginary component value Im. Can be These FFT coefficient data are transmitted to the amplitude / phase information generation circuit 12, and the amplitude / phase information generation circuit 12 obtains amplitude information Am and phase information Ph from the real component value Re and the imaginary component value Im. The information of the information Am is output.
That is, although human hearing is generally sensitive to the amplitude (power) in the frequency domain, it is rather insensitive to the phase. Therefore, in the present embodiment, the above-mentioned allocated bit number information is obtained using only the amplitude information Am. I have to.

【0026】上記振幅情報Amは、先ず帯域分割回路1
3に伝送される。該帯域分割回路13では、上記振幅情
報Amで表現された入力ディジタル信号をいわゆる臨界
帯域幅(クリティカルバンド)に分割している。この臨
界帯域幅とは、人間の聴覚特性(周波数分析能力)を考
慮したものであり、例えば0〜22kHzを25帯域に
分け、高い周波数帯域ほど帯域幅を広く選定しているも
のである。すなわち人間の聴覚は、一種のバンドパスフ
ィルタのような特性を有していて、この各フィルタによ
って分けられたバンドを臨界帯域と呼んでいる。
The amplitude information Am is first sent to the band dividing circuit 1
3 is transmitted. The band dividing circuit 13 divides the input digital signal represented by the amplitude information Am into a so-called critical bandwidth (critical band). The critical bandwidth is based on human auditory characteristics (frequency analysis capability). For example, 0 to 22 kHz is divided into 25 bands, and the higher the frequency band, the wider the bandwidth is selected. That is, human hearing has characteristics like a kind of band-pass filter, and the band divided by each filter is called a critical band.

【0027】上記帯域分割回路13で臨界帯域に分割さ
れた各帯域毎の上記振幅情報Amは、各々上記総和検出
回路14に伝送される。この総和検出回路14では、各
帯域毎のエネルギ(各帯域でのスペクトル強度)が、各
帯域内のそれぞれの振幅情報Amの総和(振幅情報Am
のピーク又は平均或いはエネルギ総和)をとることによ
り求められる。該総和検出回路14の出力すなわち各帯
域の総和のスペクトルは、一般にバークスペクトルと呼
ばれ、この各帯域のバークスペクトルSBは例えば図4
に示すようになる。ただし、図4では図示を簡略化する
ため、上記クリティカルバンドのバンド数を12の帯域
(B1 〜B12)で表現している。
The amplitude information Am for each band divided into critical bands by the band division circuit 13 is transmitted to the sum detection circuit 14, respectively. In the sum detection circuit 14, the energy for each band (spectral intensity in each band) is calculated by summing the amplitude information Am in each band (amplitude information Am).
By taking the peak or the average or the total energy). The output of the sum detection circuit 14, that is, the sum spectrum of each band is generally called a bark spectrum, and the bark spectrum SB of each band is, for example, as shown in FIG.
It becomes as shown in. However, in FIG. 4, the number of the critical bands is represented by 12 bands (B 1 to B 12 ) for simplicity of illustration.

【0028】ここで、上記バークスペクトルSBのいわ
ゆるマスキングに於ける影響を考慮するため、該バーク
スペクトルSBに所定の重みづけの関数を畳込む(コン
ボリューション)。このため、上記総和検出回路14の
出力すなわち該バークスペクトルSBの各値は、フィル
タ回路15に送られる。該フィルタ回路15は、例え
ば、入力データを順次遅延させる複数の遅延素子と、こ
れら遅延素子からの出力にフィルタ係数(重みづけの関
数)を乗算する複数の乗算器(例えば各帯域に対応する
25個の乗算器)と、各乗算器出力の総和をとる総和加
算器とから構成されるものである。このフィルタ回路1
5の各乗算器において、例えば、任意の帯域に対応する
乗算器Mでフィルタ係数1を、乗算器M−1でフィルタ
係数0.15を、乗算器M−2でフィルタ係数0.00
19を、乗算器M−3でフィルタ係数0.000008
6を、乗算器M+1でフィルタ係数0.4を、乗算器M
+2でフィルタ係数0.06を、乗算器M+3でフィル
タ係数0.007を各遅延素子の出力に乗算することに
より、上記バークスペクトルSBの畳込み処理が行われ
る。ただし、Mは1〜25の任意の整数である。この畳
込み処理により、図4中点線で示す部分の総和がとられ
る。なお、上記マスキングとは、人間の聴覚上の特性に
より、ある信号によって他の信号がマスクされて聞こえ
なくなる現象をいうものであり、このマスキング効果に
は、時間軸上のオーディオ信号に対するマスキング効果
と周波数軸上の信号に対するマスキング効果とがある。
すなわち、該マスキング効果により、マスキングされる
部分にノイズがあったとしても、このノイズは聞こえな
いことになる。このため、実際のオーディオ信号では、
このマスキングされる部分内のノイズは許容可能なノイ
ズとされる。
Here, in order to consider the influence of the bark spectrum SB on so-called masking, a predetermined weighting function is convolved with the bark spectrum SB (convolution). Therefore, the output of the sum detection circuit 14, that is, each value of the bark spectrum SB is sent to the filter circuit 15. The filter circuit 15 includes, for example, a plurality of delay elements for sequentially delaying input data and a plurality of multipliers (for example, 25 corresponding to each band) for multiplying an output from these delay elements by a filter coefficient (weighting function). Multipliers) and a sum adder for summing the outputs of the multipliers. This filter circuit 1
In each of the multipliers 5, for example, the multiplier M corresponding to an arbitrary band has the filter coefficient 1, the multiplier M- 1 has the filter coefficient 0.15, and the multiplier M- 2 has the filter coefficient 0.00.
19 is multiplied by a filter coefficient 0.000008 by the multiplier M-3.
6, the filter coefficient 0.4 by the multiplier M + 1 and the multiplier M
By multiplying the output of each delay element by the filter coefficient 0.06 by +2 and the filter coefficient 0.007 by the multiplier M + 3, the convolution process of the bark spectrum SB is performed. Here, M is an arbitrary integer of 1 to 25. By this convolution processing, the sum of the parts shown by the dotted lines in FIG. 4 is obtained. The masking refers to a phenomenon that a certain signal masks another signal and makes it inaudible due to human auditory characteristics.This masking effect includes a masking effect for an audio signal on a time axis. There is a masking effect on signals on the frequency axis.
That is, even if there is noise in the masked portion due to the masking effect, this noise will not be heard. Therefore, in an actual audio signal,
The noise in this masked portion is considered acceptable noise.

【0029】その後、上記フィルタ回路15の出力は引
算器16に送られる。該引算器16は、上記畳込んだ領
域での後述する許容可能なノイズレベルに対応するレベ
ルαを求めるものである。なお、当該許容可能なノイズ
レベル(許容ノイズレベル)に対応するレベルαは、後
述するように、逆コンボリューション処理を行うことに
よって、臨界帯域の各帯域毎の許容ノイズレベルとなる
ようなレベルである。ここで、上記引算器16には、上
記レベルαを求めるための許容関数(マスキングレベル
を表現する関数)が供給される。この許容関数を増減さ
せることで上記レベルαの制御を行っている。当該許容
関数は、後述する関数発生回路29から供給されている
ものである。
Thereafter, the output of the filter circuit 15 is sent to a subtractor 16. The subtracter 16 calculates a level α corresponding to an allowable noise level described later in the convolved area. The level α corresponding to the permissible noise level (permissible noise level) is, as described later, a level at which the permissible noise level of each critical band is obtained by performing inverse convolution processing. is there. Here, an allowance function (a function expressing a masking level) for obtaining the level α is supplied to the subtractor 16. The level α is controlled by increasing or decreasing the allowable function. The permissible function is supplied from a function generation circuit 29 described later.

【0030】すなわち、許容ノイズレベルに対応するレ
ベルαは、臨界帯域幅の帯域の低域から順に与えられる
番号をiとすると、次の式で求めることができる。 α=S−(n−ai) この式において、n,aは定数でa>0、Sは畳込み処
理されたバークスペクトルの強度であり、該式中(n−
ai)が許容関数となる。本実施例ではn=38,a=
1としており、この時の音質劣化はなく、良好な符号化
が行えた。
That is, the level α corresponding to the allowable noise level can be obtained by the following equation, where i is a number sequentially given from the lower band of the critical bandwidth. α = S− (n−ai) In this equation, n and a are constants and a> 0, and S is the intensity of the convolution-processed Bark spectrum.
ai) is an allowable function. In this embodiment, n = 38, a =
It was set to 1. At this time, there was no sound quality deterioration, and good encoding was performed.

【0031】このようにして、上記レベルαが求めら
れ、このデータは、割算器17に伝送される。当該割算
器17では、上記畳込みされた領域での上記レベルαを
逆コンボリューションするためのものである。したがっ
て、この逆コンボリューション処理を行うことにより、
上記レベルαからマスキングスペクトルが得られるよう
になる。すなわち、このマスキングスペクトルが許容ノ
イズスペクトルとなる。なお、上記逆コンボリューショ
ン処理は、複雑な演算を必要とするが、本実施例では簡
略化した割算器17を用いて逆コンボリューションを行
っている。
In this way, the level α is obtained, and this data is transmitted to the divider 17. The divider 17 is for inversely convolving the level α in the convolved region. Therefore, by performing this inverse convolution processing,
A masking spectrum can be obtained from the level α. That is, this masking spectrum becomes an allowable noise spectrum. Note that the above inverse convolution process requires a complicated operation, but in the present embodiment, inverse convolution is performed using a simplified divider 17.

【0032】次に、上記マスキングスペクトルは、合成
回路18を介して減算器19に伝送される。ここで、当
該減算器19には、上記総和検出回路14の出力すなわ
ち前述した総和検出回路14からのバークスペクトルS
Bが、遅延回路21を介して供給されている。したがっ
て、この減算器19で上記マスキングスペクトルとバー
クスペクトルSBとの減算演算が行われることで、図5
に示すように、上記バークスペクトルSBは、該マスキ
ングスペクトルMSのレベルで示すレベル以下がマスキ
ングされることになる。
Next, the masking spectrum is transmitted to a subtractor 19 via a synthesis circuit 18. Here, the subtractor 19 outputs the output of the sum detection circuit 14, that is, the bark spectrum S from the sum detection circuit 14 described above.
B is supplied via a delay circuit 21. Therefore, the subtractor 19 performs a subtraction operation between the masking spectrum and the bark spectrum SB, thereby obtaining a signal shown in FIG.
As shown in (1), the bark spectrum SB is masked below the level indicated by the level of the masking spectrum MS.

【0033】当該減算器19の出力は、上記許容ノイズ
レベル補正回路20を介してROM30に送られる。該
ROM30には、上記振幅情報Amの量子化に用いる複
数の割当ビット数情報が格納されており、上記減算回路
19の出力(上記各帯域のエネルギと上記ノイズレベル
設定手段の出力との差分のレベル)に応じた割当ビット
数情報を出力するようになっている。このROM30か
らの割当ビット数情報に基づいて、量子化回路24で
は、遅延回路23を介して供給されている振幅情報Am
の量子化を行う。すなわち、上記ROM30は、前述し
たような量子化テーブルを有するものである。また、出
力端子2からは、振幅情報Am等の量子化出力と共に、
上述した各小ブロックのワード長情報及び上記シフトさ
れた許容ノイズレベルに関する情報からなるサブ情報も
出力される。なお、遅延回路21は上記合成回路18以
前の各回路での遅延量を考慮して上記総和検出回路14
からのバークスペクトルSBを遅延させ、上記遅延回路
23は上記ROM30以前の各回路での遅延量を考慮し
て上記振幅情報Amを遅延させるために設けられてい
る。
The output of the subtracter 19 is sent to the ROM 30 via the allowable noise level correction circuit 20. The ROM 30 stores a plurality of pieces of assigned bit number information used for quantization of the amplitude information Am, and outputs the information of the subtraction circuit 19 (the difference between the energy of each band and the output of the noise level setting means). ), And outputs information on the number of allocated bits according to the level. Based on the allocated bit number information from the ROM 30, the quantization circuit 24 outputs the amplitude information Am supplied via the delay circuit 23.
Is quantized. That is, the ROM 30 has a quantization table as described above. Also, from the output terminal 2, together with the quantized output of the amplitude information Am and the like,
The sub information including the word length information of each small block and the information on the shifted allowable noise level is also output. It should be noted that the delay circuit 21 takes into account the amount of delay in each circuit before the synthesis circuit 18 and the sum detection circuit 14
The delay circuit 23 is provided to delay the amplitude information Am in consideration of the delay amount in each circuit before the ROM 30.

【0034】また、上述した合成回路18での合成の際
には、最小可聴カーブ発生回路22から供給される図6
に示すような人間の聴覚特性であるいわゆる最小可聴カ
ーブRCを示すデータと、上記マスキングスペクトルM
Sとを合成することができる。この最小可聴カーブにお
いて、雑音絶対レベルがこの最小可聴カーブ以下ならば
該雑音は聞こえないことになる。更に、該最小可聴カー
ブは、コーディングが同じであっても例えば再生時の再
生ボリュームの違いで異なるものとなる。ただし、現実
的なディジタルシステムでは、例えば16ビットダイナ
ミックレンジへの音楽のはいり方にはさほど違いがない
ので、例えば4kHz付近の最も耳に聞こえやすい周波
数帯域の量子化雑音が聞こえないとすれば、他の周波数
帯域ではこの最小可聴カーブのレベル以下の量子化雑音
は聞こえないと考えられる。したがって、このように例
えばシステムの持つワードレングスの4kHz付近の雑
音が聞こえない使い方をすると仮定し、この最小可聴カ
ーブRCとマスキングスペクトルMSとを共に合成する
ことで許容ノイズレベルを得るようにすると、この場合
の許容ノイズレベルは、図中斜線で示す部分までとする
ことができるようになる。なお、本実施例では、上記最
小可聴カーブの4kHzのレベルを、例えば20ビット
相当の最低レベルに合わせている。また、この図6は、
信号スペクトルSSも同時に示している。
In addition, at the time of synthesizing by the synthesizing circuit 18 described above, FIG.
And data indicating a so-called minimum audible curve RC which is a human auditory characteristic as shown in FIG.
And S can be synthesized. At this minimum audible curve, if the absolute noise level is below this minimum audible curve, the noise will not be heard. Further, even if the coding is the same, the minimum audible curve differs depending on, for example, a reproduction volume at the time of reproduction. However, in a realistic digital system, for example, there is not much difference in how to enter music into the 16-bit dynamic range. For example, if quantization noise in the most audible frequency band around 4 kHz is not heard, It is considered that quantization noise below the level of the minimum audible curve is not audible in other frequency bands. Therefore, assuming that the system is used so that noise around 4 kHz of the word length of the system cannot be heard, and an allowable noise level is obtained by synthesizing the minimum audible curve RC and the masking spectrum MS together, In this case, the permissible noise level can be set up to the shaded portion in the figure. In this embodiment, the 4 kHz level of the minimum audible curve is adjusted to the lowest level corresponding to, for example, 20 bits. Also, FIG.
The signal spectrum SS is also shown.

【0035】ここで、上記許容ノイズレベル補正回路2
0では、補正値決定回路28から送られてくるいわゆる
等ラウドネス曲線の情報に基づいて、上記減算器19か
らの許容ノイズレベルを補正している。すなわち、上記
補正値決定回路28からは、上記減算器19からの許容
ノイズレベルを、いわゆる等ラウドネス曲線の情報デー
タに基づいて補正させるための補正値データが出力さ
れ、この補正値データが上記許容ノイズレベル補正回路
20に伝送されることで、上記減算器19からの許容ノ
イズレベルの等ラウドネス曲線を考慮した補正がなされ
るようになる。なお、上記等ラウドネス曲線とは、人間
の聴覚特性に関するものであり、例えば1kHzの純音
と同じ大きさに聞こえる各周波数での音の音圧を求めて
曲線で結んだもので、ラウドネスの等感度曲線とも呼ば
れる。また、該等ラウドネス曲線は、図6に示した最小
可聴カーブRCと略同じ曲線を描くものである。該等ラ
ウドネス曲線においては、例えば4kHz付近では1k
Hzのところより音圧が8〜10dB下がっても1kH
zと同じ大きさに聞こえ、逆に50kHz付近では1k
Hzでの音圧よりも約15dB高くないと同じ大きさに
聞こえない。このため、上記最小可聴カーブのレベルを
越えた雑音(許容ノイズレベル)は、該等ラウドネス曲
線に応じたカーブで与えられる周波数特性を持つように
するのが良いことがわかる。このようなことから、上記
等ラウドネス曲線を考慮して上記許容ノイズレベルを補
正することは、人間の聴覚特性に適合していることがわ
かる。
Here, the allowable noise level correction circuit 2
In the case of 0, the allowable noise level from the subtractor 19 is corrected based on information of a so-called equal loudness curve sent from the correction value determination circuit 28. That is, the correction value determination circuit 28 outputs correction value data for correcting the allowable noise level from the subtractor 19 based on information data of a so-called equal loudness curve. By being transmitted to the noise level correction circuit 20, the allowable noise level from the subtracter 19 is corrected in consideration of the equal loudness curve. The above-mentioned equal loudness curve relates to human auditory characteristics. For example, the equal loudness curve is obtained by obtaining sound pressures of sounds at each frequency that sounds as loud as a pure sound of 1 kHz and connecting them with a curve. Also called a curve. In addition, the equal loudness curve draws substantially the same curve as the minimum audible curve RC shown in FIG. In the equal loudness curve, for example, 1 k
1 kHz even if the sound pressure falls 8-10 dB below the Hz
Sounds the same size as z, 1k around 50kHz
Unless it is higher than the sound pressure at Hz by about 15 dB, the sound cannot be heard at the same level. For this reason, it can be seen that noise exceeding the level of the minimum audible curve (allowable noise level) preferably has a frequency characteristic given by a curve corresponding to the equal loudness curve. From this, it can be seen that correcting the allowable noise level in consideration of the equal loudness curve is suitable for human auditory characteristics.

【0036】なお、本実施例においては、上述した最小
可聴カーブの合成処理を行わない構成とすることもでき
る。すなわち、この場合には、最小可聴カーブ発生回路
22,合成回路18が不要となり、上記引算器16から
の出力は、割算器17で逆コンボリューションされた
後、すぐに減算器19に伝送されることになる。
In this embodiment, a configuration may be adopted in which the above-described minimum audible curve synthesizing process is not performed. That is, in this case, the minimum audible curve generating circuit 22 and the synthesizing circuit 18 become unnecessary, and the output from the subtractor 16 is inversely convolved by the divider 17 and immediately transmitted to the subtractor 19. Will be done.

【0037】[0037]

【発明の効果】本発明のディジタル信号符号化方法にお
いては、入力ディジタル信号を直交変換して臨界帯域に
分割し、各臨界帯域毎の許容ノイズレベルに基づいた適
応的な割り当てビット数で各臨界帯域の信号成分を符号
化すると共に、直交変換後の信号成分をブロックフロー
ティング処理して得たフローティング係数を伝送するも
のであり、フローティング処理を臨界帯域よりも狭い帯
域の小ブロックで行う場合には、小ブロック毎に割り当
てられるビット数に応じたワード長の情報を伝送すると
共に、臨界帯域毎のフローティング係数の代わりに臨界
帯域内の信号レベル範囲から所定レベル分だけ低い方へ
指定範囲をずらした許容ノイズレベルに関する情報を伝
送するようにしたことで、許容ノイズレベルに関する情
報伝送のためのビット数を減らすことができ、したがっ
て、より高いビット圧縮が可能となる。
According to the digital signal encoding method of the present invention, an input digital signal is orthogonally transformed and divided into critical bands, and each critical band is adaptively allocated based on the allowable noise level of each critical band. In addition to encoding the signal components of the band and transmitting the floating coefficient obtained by performing block floating processing on the signal components after the orthogonal transformation, when performing the floating processing on a small block of a band narrower than the critical band, In addition to transmitting word length information according to the number of bits allocated to each small block, the designated range is shifted downward by a predetermined level from the signal level range in the critical band instead of the floating coefficient for each critical band. By transmitting the information on the allowable noise level, the video for transmitting the information on the allowable noise level is transmitted. It is possible to reduce the betting amount, therefore, allows higher bit compression.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明実施例のフローチャートである。FIG. 1 is a flowchart of an embodiment of the present invention.

【図2】フローティング処理を臨界帯域よりも狭いブロ
ックで行う場合を説明するための図である。
FIG. 2 is a diagram for explaining a case where floating processing is performed in a block narrower than a critical band.

【図3】本発明実施例の具体的構成を示すブロック回路
図である。
FIG. 3 is a block circuit diagram showing a specific configuration of an embodiment of the present invention.

【図4】バークスペクトルを示す図である。FIG. 4 is a diagram showing a bark spectrum.

【図5】マスキングスペクトルを示す図である。FIG. 5 is a diagram showing a masking spectrum.

【図6】最小可聴カーブ,マスキングスペクトルを合成
した図である。
FIG. 6 is a diagram in which a minimum audible curve and a masking spectrum are combined.

【符号の説明】[Explanation of symbols]

B・・・・・・・・・・帯域 b1〜b4・・・・・・ブロック W1〜W4・・・・・・ワード長 NL1〜NL4・・・・許容ノイズレベル B band b1 to b4 block W1 to W4 word length NL1 to NL4 allowable noise level

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) H03M 7/30 ──────────────────────────────────────────────────続 き Continued on the front page (58) Field surveyed (Int.Cl. 7 , DB name) H03M 7/30

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 入力ディジタル信号を直交変換して臨界
帯域に分割し、当該臨界帯域毎のエネルギに基づいて設
定した各臨界帯域毎の許容ノイズレベルと当該各臨界帯
域毎のエネルギとの差分のレベルに応じたビット数で上
記各臨界帯域の信号成分を符号化すると共に、上記直交
変換後の信号成分をブロック化してこのブロック毎にブ
ロックフローティング処理を行い当該ブロック毎のフロ
ーティング係数を伝送するディジタル信号符号化方法で
あって、上記ブロックフローティング処理を上記臨界帯
域よりも狭い帯域の小ブロック単位で行う場合には、上
記小ブロック毎に割り当てられるビット数に応じたワー
ド長の情報を伝送すると共に、上記臨界帯域毎のフロー
ティング係数の代わりに上記臨界帯域内の信号レベル範
囲から所定レベル分だけ低い方へ指定範囲をずらした許
容ノイズレベルに関する情報を伝送することを特徴とす
るディジタル信号符号化方法。
1. An input digital signal is orthogonally transformed and divided into critical bands, and a difference between an allowable noise level for each critical band set based on energy for each critical band and energy for each critical band is determined. The digital component that encodes the signal components of each critical band with the number of bits according to the level, blocks the signal components after the orthogonal transformation, performs block floating processing for each block, and transmits a floating coefficient for each block. In the signal encoding method, when the block floating process is performed in units of small blocks in a band narrower than the critical band, information of a word length according to the number of bits allocated to each of the small blocks is transmitted. A predetermined level from the signal level range in the critical band instead of the floating coefficient for each critical band. A digital signal encoding method for transmitting information on an allowable noise level shifted a designated range to a lower level.
JP3091189A 1991-03-29 1991-03-29 Digital signal encoding method Expired - Fee Related JP3060578B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3091189A JP3060578B2 (en) 1991-03-29 1991-03-29 Digital signal encoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3091189A JP3060578B2 (en) 1991-03-29 1991-03-29 Digital signal encoding method

Publications (2)

Publication Number Publication Date
JPH04302536A JPH04302536A (en) 1992-10-26
JP3060578B2 true JP3060578B2 (en) 2000-07-10

Family

ID=14019499

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3091189A Expired - Fee Related JP3060578B2 (en) 1991-03-29 1991-03-29 Digital signal encoding method

Country Status (1)

Country Link
JP (1) JP3060578B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8442262B2 (en) * 2003-12-19 2013-05-14 Creative Technology Ltd. Method and system to process a digital image

Also Published As

Publication number Publication date
JPH04302536A (en) 1992-10-26

Similar Documents

Publication Publication Date Title
KR100312664B1 (en) Digital Signal Encoding Method
JP3134338B2 (en) Digital audio signal encoding method
KR100293855B1 (en) High efficiency digital data encoding and decoding device
JP2861238B2 (en) Digital signal encoding method
JP3178026B2 (en) Digital signal encoding device and decoding device
JP3134337B2 (en) Digital signal encoding method
JP3278900B2 (en) Data encoding apparatus and method
JPH03117919A (en) Digital signal encoding device
JPH0435123A (en) Digital signal encoder
JPH05304479A (en) High efficient encoder of audio signal
JP3041967B2 (en) Digital signal coding device
JP3060578B2 (en) Digital signal encoding method
JP3336619B2 (en) Signal processing device
JP3060576B2 (en) Digital signal encoding method
JP3060577B2 (en) Digital signal encoding method
JP3089692B2 (en) Highly efficient digital data encoding method.
JP3089691B2 (en) Highly efficient digital data encoding method.
JP3070123B2 (en) Digital signal encoding apparatus and method
JP3010663B2 (en) Noise shaping circuit
JP2913695B2 (en) Digital signal encoding method
JP3134335B2 (en) Digital signal encoding method and digital signal decoding device
JP3132031B2 (en) High-efficiency coding of digital signals.
JP2913696B2 (en) Digital signal encoding method
JP2952878B2 (en) Digital signal processor
JP3033157B2 (en) Digital signal coding device

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000328

LAPS Cancellation because of no payment of annual fees