JPH04104618A - Digital signal coder - Google Patents
Digital signal coderInfo
- Publication number
- JPH04104618A JPH04104618A JP2221367A JP22136790A JPH04104618A JP H04104618 A JPH04104618 A JP H04104618A JP 2221367 A JP2221367 A JP 2221367A JP 22136790 A JP22136790 A JP 22136790A JP H04104618 A JPH04104618 A JP H04104618A
- Authority
- JP
- Japan
- Prior art keywords
- band
- noise level
- tonality
- circuit
- bands
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013139 quantization Methods 0.000 claims abstract description 17
- 230000000694 effects Effects 0.000 abstract description 7
- 230000006866 deterioration Effects 0.000 abstract description 6
- 230000006835 compression Effects 0.000 abstract description 2
- 238000007906 compression Methods 0.000 abstract description 2
- 230000000873 masking effect Effects 0.000 description 50
- 238000001228 spectrum Methods 0.000 description 26
- 238000001514 detection method Methods 0.000 description 15
- 230000015572 biosynthetic process Effects 0.000 description 13
- 238000003786 synthesis reaction Methods 0.000 description 13
- 230000005236 sound signal Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000000034 method Methods 0.000 description 6
- 230000002123 temporal effect Effects 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 101100087530 Caenorhabditis elegans rom-1 gene Proteins 0.000 description 1
- 206010011224 Cough Diseases 0.000 description 1
- 101100305983 Mus musculus Rom1 gene Proteins 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、入力ディジタル音声信号の符号化を行うディ
ジタル信号符号化装置に関するものである。DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a digital signal encoding device that encodes an input digital audio signal.
本発明は、入力音声信号を複数帯域に分割した各バンド
毎のエネルギとトーナリティとに基づいて他のバンドへ
の影響度を求めて各バンド毎の許容ノイズレベルを設定
し、この許容ノイズレベルと各バンドのエネルギとの差
に応じたビット数で各バンド成分の量子化を行うことに
より、また、各バンド毎のエネルギをフィルタ処理して
他のバンドへの影響度を計算すること、或いは、各バン
ドの信号成分を単一周波数成分とホワイトノイズ成分と
に分離してそれぞれ異なるフィルタ特性でフィルタ処理
して合成を行うこと、更に、各バンド毎のトーナリティ
を示す指標に応じてフィルタ特性を可変することにより
、低ビツトレートに圧縮しても音質劣化の少ない符号化
が可能なディジタル信号符号化装置を提供するものであ
る。The present invention divides an input audio signal into multiple bands, determines the degree of influence on other bands based on the energy and tonality of each band, sets an allowable noise level for each band, and sets the allowable noise level for each band. By quantizing each band component with the number of bits according to the difference from the energy of each band, or filtering the energy of each band to calculate the degree of influence on other bands, or The signal component of each band is separated into a single frequency component and a white noise component, and each is filtered and synthesized using different filter characteristics.Furthermore, the filter characteristics are varied according to an index indicating the tonality of each band. This provides a digital signal encoding device capable of encoding with little deterioration in sound quality even when compressed to a low bit rate.
(従来の技術〕
オーディオ、音声等の信号の高能率符号化においては、
オーディオ、音声等の入力信号を時間軸又は周波数軸で
複数のチャンネルに分割すると共に、各チャンネル毎の
ビット数を適応的に割当てるビットアロケーション(ビ
ット割当て)による符号化技術がある。例えば、オーデ
ィオ信号等の上記ビット割当てによる符号化技術には、
時間軸上のオーディオ信号等を複数の周波数帯域に分割
して符号化する帯域分割符号化(サブ・バンド・コーデ
ィング:5BC)や、時間軸の信号を周波数軸上の信号
に変換(直交変換)して複数の周波数帯域に分割し各帯
域毎で適応的に符号化するいわゆる適応変換符号化(A
TC) 、或いは、上記SBCといわゆる適応予測符号
化(APC)とを組み合わせ、時間軸の信号を帯域分割
して各帯域信号をベースバンド(低域)に変換した後複
数次の線形予測分析を行って予測符号化するいわゆる適
応ビット割当て(APC−AB)等の符号化技術がある
。(Prior art) In high-efficiency encoding of audio, voice, etc. signals,
2. Description of the Related Art There is an encoding technique using bit allocation that divides an input signal such as audio or voice into a plurality of channels on a time axis or a frequency axis and adaptively allocates the number of bits for each channel. For example, the encoding technology using the above-mentioned bit allocation for audio signals, etc.
Band division coding (sub-band coding: 5BC), which divides and encodes audio signals on the time axis into multiple frequency bands, and converts time-axis signals to signals on the frequency axis (orthogonal transformation) So-called adaptive transform coding (A
TC), or by combining the above SBC and so-called adaptive predictive coding (APC), dividing the time domain signal into bands and converting each band signal to the baseband (low band), and then performing multi-order linear predictive analysis. There are coding techniques such as so-called adaptive bit allocation (APC-AB) that performs predictive coding.
このような高能率符号化ては、近年人間の聴覚上の特性
におけるいわゆるマスキング特性を考慮した高能率符号
化の手法が盛んに試みられている。In recent years, many attempts have been made to develop high-efficiency encoding methods that take into account the so-called masking characteristics of human auditory characteristics.
該マスキングの効果とは、ある信号によって他の信号か
マスクされて聞こえなくなる現象をいうものであり、該
マスキング効果には、例えば周波数軸上のオーディオ信
号におけるマスキング効果かある。The masking effect refers to a phenomenon in which a certain signal masks another signal so that it becomes inaudible, and the masking effect includes, for example, a masking effect on an audio signal on the frequency axis.
ここで、上記周波数軸上のオーディオ信号に対するマス
キング効果においては、例えば、ある周波数f、の正弦
波W、かあった場合、人間の聴覚によるマスキング効果
を示すマスキングスペクトル(マスキングカーブ)MS
は、第8図のようになり、このマスキングスペクトルM
Sによって、図中斜線部で示す部分がマスキングされる
ことになる。すなわち、該マスキングスペクトルMS内
にノイズがあったとしても聞こえなくなるため、実際の
オーディオ信号では、該マスキングスペクトルMS内の
ノイズは許容可能となる。このため、上記正弦波W8の
場合の許容可能なノイズレベルは、第8図中jて示すレ
ベル以下のレベルとなる。Here, in the masking effect on the audio signal on the frequency axis, for example, if there is a sine wave W of a certain frequency f, a masking spectrum (masking curve) MS indicating the masking effect due to human hearing
is as shown in Fig. 8, and this masking spectrum M
By S, the shaded area in the figure is masked. That is, even if there is noise within the masking spectrum MS, it will not be audible, so that the noise within the masking spectrum MS can be tolerated in an actual audio signal. Therefore, the allowable noise level in the case of the sine wave W8 is lower than the level indicated by j in FIG.
またこのとき、該正弦波W、の周波数f6てマスキング
の効果か最も高く、該正弦波W、の周波数f、から離れ
るにしたかってマスキングの効果か低くなる。Also, at this time, the masking effect is highest at the frequency f6 of the sine wave W, and the masking effect decreases as the frequency moves away from the frequency f of the sine wave W.
このようなことから、上記高能率符号化の際に上述した
ようなマスキング効果を考慮して上記許容可能なノイズ
レベル以下の信号成分に対して量子化の割当てビット数
を減らすようにすることで、よりビットレートの低減か
可能となる。For this reason, when performing high-efficiency encoding, the number of bits allocated for quantization is reduced for signal components below the allowable noise level, taking into account the masking effect described above. , it becomes possible to further reduce the bit rate.
ところで、現在は、更にビットレートを低減することが
望まれている。しかし、ビットレートを更に低減するよ
うにすると、音質か劣化するようになり好ましくない。By the way, it is currently desired to further reduce the bit rate. However, if the bit rate is further reduced, the sound quality will deteriorate, which is not desirable.
そこで、本発明は、上述のような実情に鑑みて提案され
たものであり、より低ビツトレートに圧縮しても音質劣
化の少ない符号化を行うことのできるディジタル信号符
号化装置を提供することを目的とするものである。The present invention was proposed in view of the above-mentioned circumstances, and an object of the present invention is to provide a digital signal encoding device that can perform encoding with less deterioration in sound quality even when compressed to a lower bit rate. This is the purpose.
本発明のディジタル信号符号化装置は、上述の目的を達
成するために提案されたものであり、入力ディジタル信
号を複数の周波数帯域に分割する帯域分割手段と、上記
帯域分割手段により分割された各バンド毎のエネルギに
基づいて他のバンドへの影響度を計算して各バンド毎の
許容ノイズレベルを設定するノイズレベル設定手段と、
上記各バンド毎のトーナリティに応じて上記ノイズレベ
ル設定手段での他のバンドへの影響度を制御する制御手
段と、上記各バンドのエネルギと上記トーナリティに応
じて制御された許容ノイズレベルとの差に応じたビット
数で各バンドの信号成分を量子化する量子化手段とを有
してなるものであり、また、上記ノイズレベル設定手段
は、上記各バンド毎のエネルギか入力されて上記他のバ
ンドへの影響度を計算するフィルタ手段を有し、更に、
上記ノイズレベル設定手段は、各バンド毎の信号成分が
単一周波数成分とホワイトノイズ成分とに分離された各
成分がそれぞれ入力される各々特性の異なる2つのフィ
ルタ手段を有し、上記制御手段は、上記ノイズレベル設
定手段の上記各フィルタからの出力を合成するようにし
、また更に、上記制御手段は、各バンド毎にトーナリテ
ィを示す指標を検出し、該トーナリティを示す指標に応
じて上記ノイズレベル設定手段のフィルタ手段の特性を
可変するようにしたものである。The digital signal encoding device of the present invention has been proposed to achieve the above-mentioned object, and includes a band dividing means for dividing an input digital signal into a plurality of frequency bands, and a frequency band for each frequency band divided by the band dividing means. Noise level setting means that calculates the degree of influence on other bands based on the energy of each band and sets an allowable noise level for each band;
A control means for controlling the degree of influence of the noise level setting means on other bands according to the tonality of each band, and a difference between the energy of each band and the allowable noise level controlled according to the tonality. quantization means for quantizing the signal components of each band with the number of bits corresponding to It has a filter means for calculating the degree of influence on the band, and further,
The noise level setting means has two filter means each having different characteristics, into which the signal components of each band are separated into a single frequency component and a white noise component. , the outputs from the respective filters of the noise level setting means are synthesized, and furthermore, the control means detects an index indicating tonality for each band, and adjusts the noise level according to the index indicating tonality. The characteristics of the filter means of the setting means are made variable.
なお、一般に、トーナリティか高い信号成分による他バ
ンドへの影響度すなわちマスキング効果は大きく、逆に
トーナリティが低い信号成分でのマスキング効果は小さ
くなる。In general, a signal component with high tonality has a large influence on other bands, that is, a masking effect, and conversely, a signal component with low tonality has a small masking effect.
本発明によれば、入力ディジタル音声信号の各バンドの
信号成分を、各バンドのエネルギとトーナリティに応し
て制御された許容ノイズレベルとの差に応じたビット数
で量子化しているため、音質劣化を少なくすることがで
きる。According to the present invention, the signal components of each band of the input digital audio signal are quantized with the number of bits corresponding to the difference between the energy of each band and the allowable noise level controlled according to the tonality. Deterioration can be reduced.
以下、本発明を適用した実施例について図面を参照しな
から説明する。Embodiments to which the present invention is applied will be described below with reference to the drawings.
本実施例のディジタル信号符号化装置は、第1図に示す
第1の実施例装置及び第7図に示す第2の実施例装置の
ように、入力ディジタル音声信号を複数の周波数帯域に
分割する帯域分割回路13と、上記帯域分割回路13に
より分割された各バンド毎のエネルギに基づいて他のバ
ンドへの影響度(すなわち、あるバンドの信号によって
他のバントの信号かマスキングされる量)を計算して各
バンド毎の許容ノイズレベルを設定するノイズレベル設
定手段40と、上記各バンド毎のトーナリティに応して
上記ノイズレベル設定手段4oでの他のバンドへの影響
度を制御する制御手段41と、上記各バンドのエネルギ
と上記トーナリティに応して制御された許容ノイズレベ
ルとの差に応じたビット数で各バンドの信号成分を量子
化する量子化回路24とを有してなるものである。また
、上記ノイズレベル設定手段4oは、上記各バンド毎の
エネルギか入力されて上記他のバンドへの影響度を計算
するフィルタ手段としてのフィルタ回路15s、15w
(第1図)及び可変フィルタ回路15(第7図)を有し
てなるものである。更に、第1図に示すように、上記ノ
イズレベル設定手段40は、成分分離回路31によって
各バンド毎の信号成分が単一周波数成分とホワイトノイ
ズ成分とに分離されて得られた各成分がそれぞれ入力さ
れる各々特性の異なる2つの上記フィルタ回路15s、
15wを有し、上記制御手段41は、上記ノイズレベル
設定手段4oの上記各フィルタ回路からの出力を合成回
路32(及び合成回路18)で合成するようにしている
。また更に、第7図に示すように、上記制御手段41は
、トーナリティ指標検出回路51で各バンド毎にトーナ
リティを示す指標(例えば標準偏差等)を検出し、該ト
ーナリティを示す指標に応じて上記ノイズレベル設定手
段40の可変フィルタ回路15の特性を可変するように
したものである。上記量子化回路24からの量子化出力
は、本実施例のディジタル信号符号化装置の出力端子2
から出力されるようになる。The digital signal encoding apparatus of this embodiment divides an input digital audio signal into a plurality of frequency bands, as in the first embodiment shown in FIG. 1 and the second embodiment shown in FIG. Based on the band division circuit 13 and the energy of each band divided by the band division circuit 13, the degree of influence on other bands (that is, the amount by which the signal of one band masks the signal of another band) is determined. Noise level setting means 40 that calculates and sets an allowable noise level for each band, and control means that controls the degree of influence of the noise level setting means 4o on other bands according to the tonality of each band. 41, and a quantization circuit 24 that quantizes the signal component of each band with the number of bits corresponding to the difference between the energy of each band and the allowable noise level controlled according to the tonality. It is. Further, the noise level setting means 4o includes filter circuits 15s and 15w as filter means for receiving the energy of each band and calculating the degree of influence on the other bands.
(FIG. 1) and a variable filter circuit 15 (FIG. 7). Furthermore, as shown in FIG. 1, the noise level setting means 40 separates the signal component for each band into a single frequency component and a white noise component by the component separation circuit 31, and separates each component into a single frequency component and a white noise component. the two input filter circuits 15s each having different characteristics;
15w, and the control means 41 is configured to synthesize the outputs from the respective filter circuits of the noise level setting means 4o using the synthesis circuit 32 (and the synthesis circuit 18). Furthermore, as shown in FIG. 7, the control means 41 detects an index indicating tonality (for example, standard deviation, etc.) for each band with a tonality index detection circuit 51, and according to the index indicating tonality, The characteristics of the variable filter circuit 15 of the noise level setting means 40 are made variable. The quantized output from the quantization circuit 24 is sent to the output terminal 2 of the digital signal encoding device of this embodiment.
will be output from.
ここで、第1図及び第7図に示す本実施例のディジタル
信号符号化装置は、入力音声(オーディオ)信号を高速
フーリエ変換(FFT)して、時間軸の信号を周波数軸
に変換した後、符号化(再量子化)を行うものである。Here, the digital signal encoding device of this embodiment shown in FIGS. 1 and 7 performs fast Fourier transform (FFT) on an input voice (audio) signal to convert a time-axis signal into a frequency-axis signal. , which performs encoding (requantization).
すなわち、先ず第1図において、入力端子lへ供給され
た時間軸上の入力オーディオ信号は、高速フーリエ変換
回路11に伝送される。この高速フーリエ変換回路11
では、上記時間軸上のオーディオ信号が所定時間(単位
ブロック)毎に周波数軸上の信号に変換され、実数成分
値Reと虚数成分値1mとからなるFFT係数が得られ
る。これらFFT係数は振幅位相情報発生回路12に伝
送され、当該振幅位相情報発生回路12では上記実数成
分値Reと虚数成分値1mとから振幅値Amと位相値と
が得られて、該振幅値Amの情報か出力されるようにな
る。すなわち、一般に人間の聴覚は周波数領域の振幅(
パワー)には敏感であるが、位相についてはかなり鈍感
であるため、本実施例では上記振幅位相情報発生回路1
2の出力から上記振幅値Amのみを取り出し、これを本
発明実施例での入力ディジタル信号としている。That is, first, in FIG. 1, an input audio signal on the time axis supplied to the input terminal l is transmitted to the fast Fourier transform circuit 11. This fast Fourier transform circuit 11
Then, the audio signal on the time axis is converted into a signal on the frequency axis at every predetermined time (unit block), and an FFT coefficient consisting of a real component value Re and an imaginary component value 1m is obtained. These FFT coefficients are transmitted to the amplitude and phase information generation circuit 12, and the amplitude and phase information generation circuit 12 obtains an amplitude value Am and a phase value from the real component value Re and the imaginary component value 1m, and the amplitude value Am information will be output. In other words, human hearing generally depends on frequency domain amplitude (
Although it is sensitive to power), it is quite insensitive to phase, so in this embodiment, the amplitude and phase information generating circuit 1 is
Only the amplitude value Am is taken out from the output of No. 2, and this is used as the input digital signal in the embodiment of the present invention.
このようにして得られた振幅値Amの入力ディジタル信
号は、帯域分割回路13に伝送される。The input digital signal with the amplitude value Am thus obtained is transmitted to the band division circuit 13.
この帯域分割回路13では、上記振幅値Amで表現され
た入力ディジタル信号をいわゆる臨界帯域幅(クリティ
カルバンド)に分割している。当該クリティカルバンド
とは、人間の聴覚特性(周波数分析能力)を考慮したも
のであり、例えば0〜16に&を24バンド(或いは0
〜22に&を25バンド)に分け、高い周波数帯域はと
バンド幅を広く設定しているものである。すなわち、人
間の聴覚は、一種のバンドパスフィルタのような特性を
有していて、この各フィルタによって分けられたバンド
を臨界帯域と呼んでいる。ここで、第2図に上記クリテ
ィカルバンドを示す。ただし、この第2図では図示を簡
略化するため、上記クリティカルバンドのバンド数を1
2バンド(B、〜B12)で表現している。This band division circuit 13 divides the input digital signal expressed by the amplitude value Am into so-called critical bandwidths. The critical band is one that takes human auditory characteristics (frequency analysis ability) into consideration, and is, for example, 24 bands (or 0 to 16).
The frequency band is divided into 22 and 25 bands), and the high frequency band has a wide band width. That is, human hearing has characteristics like a kind of band-pass filter, and the bands divided by each filter are called critical bands. Here, FIG. 2 shows the critical band. However, in this Figure 2, in order to simplify the illustration, the number of critical bands is reduced to 1.
It is expressed in two bands (B, ~B12).
上記帯域分割回路13てクリティカルバントに分割され
た各バンド(例えば24バンド)毎の上記振幅値Amは
、上記ノイズレベル設定手段40に伝送される。このノ
イズレベル設定手段40は、各バンド毎のエネルギに基
づいて他のバンドへの影響度(マスキング量)を計算し
て各バンド毎の許容ノイズレベルを設定するものであり
、また、この許容ノイズレベルか各バンド毎のトーナリ
ティに応じて制御されるようになっている。The amplitude value Am for each band (for example, 24 bands) divided into critical bands by the band division circuit 13 is transmitted to the noise level setting means 40. This noise level setting means 40 calculates the degree of influence (masking amount) on other bands based on the energy of each band, and sets the allowable noise level for each band. It is controlled according to the level or tonality of each band.
ところで、一般に、単一周波数成分例えばサイン波成分
Siのようにトーナリティか高い信号成分は他バンドへ
の影響度すなわちマスキング効果が大きく、全帯域で−
様な例えばホワイトノイズ成分WNのようにトーナリテ
ィか低い信号成分は影響度(マスキング効果)が小さく
なることか知られている。By the way, in general, a signal component with high tonality, such as a single frequency component, for example, a sine wave component Si, has a large influence on other bands, that is, a masking effect, and -
It is known that a signal component with low tonality, such as a white noise component WN, has a small degree of influence (masking effect).
このようなことから、本実施例では、上記振幅値Amを
上記ノイズレベル設定手段40の成分分離回路31に送
り、この成分分離回路31て、上記各バンド毎の信号成
分から、上記単一周波数成分としてのサイン波成分Si
と、ホワイトノイズ成分WNとを分離するようにし、そ
の後、後述する制御手段41によって上記ノイズレベル
設定手段40の出力を制御して各バンド毎のトーナリテ
ィに応じた許容ノイズレベルを求めるようにしている。For this reason, in this embodiment, the amplitude value Am is sent to the component separation circuit 31 of the noise level setting means 40, and the component separation circuit 31 extracts the signal components of the single frequency from the signal components of each band. Sine wave component Si as a component
and a white noise component WN, and then a control means 41, which will be described later, controls the output of the noise level setting means 40 to obtain an allowable noise level according to the tonality of each band. .
上述のようなことを行うため、上記サイン波成分Si及
びホワイトノイズ成分WNは、各々サイン波成分総和検
出回路14s、 ホワイトノイズ成分総和検出回路14
wに伝送される。これら総和検出回路14s、+4wて
は、各バンド毎の上記サイン波成分Si又はホワイトノ
イズ成分WNのエネルギ(各バンドでのスペクトル強度
)か、各バンド内のそれぞれの振幅値Amの総和(振幅
値Amのピーク又は平均或いはエネルギ総和)をとるこ
とにより求められる。なお、各バンド毎の成分の総和ス
ペクトルは、一般にパークスペクトルと呼ばれ、この各
バンド毎のパークスペクトルSBは例えば第3図に示す
ようになる。すなわち、上記総和検出回路14s、14
wでは、上記サイン波成分St又はホワイトノイズ成分
WNの各バンド毎のパークスペクトルSBが求められる
。In order to perform the above, the sine wave component Si and white noise component WN are detected by a sine wave component sum detection circuit 14s and a white noise component sum detection circuit 14, respectively.
transmitted to w. These sum detection circuits 14s and +4w detect the energy (spectral intensity in each band) of the sine wave component Si or white noise component WN for each band, or the sum (amplitude value) of the respective amplitude values Am in each band. It is obtained by taking the peak, average, or total energy of Am. The sum spectrum of components for each band is generally called a park spectrum, and the park spectrum SB for each band is as shown in FIG. 3, for example. That is, the sum detection circuits 14s, 14
In w, the park spectrum SB for each band of the sine wave component St or white noise component WN is determined.
ここで、上記サイン波成分Si又はホワイトノイズ成分
WNのそれぞれのパークスペクトルSBのマスキングに
於ける影響を考慮するため、各パークスペクトルSBに
所定の重みづけの関数を畳込む(コンボリューション)
。すなわち、上記総和検出回路14s、14wの出力(
上記各パークスペクトルSB)の各値は、それぞれ上記
各バンド毎のエネルギが入力されて上記他バンドへの影
響度を計算するフィルタ手段であり、それぞれフィルタ
特性の異なる2つのフィルタ回路15s。Here, in order to consider the influence of the sine wave component Si or white noise component WN on masking of each park spectrum SB, each park spectrum SB is convolved with a predetermined weighting function (convolution).
. That is, the outputs of the summation detection circuits 14s and 14w (
Each value of each park spectrum SB) is a filter means to which the energy of each band is input and calculates the degree of influence on the other bands, and two filter circuits 15s each have different filter characteristics.
15Wに送られる。これらフィルタ回路15s。Sent to 15W. These filter circuits 15s.
15wは、それぞれ例えば第4図に示すように、人力デ
ータを順次遅延させる遅延(z−I)素子・・101、
−z〜101.+3・・と、これら各遅延素子からの出
力にフィルタ係数(重みづけの関数)を乗算する乗算器
・・102=−s〜102−、s・・と、総和加算器1
04とから構成されるものである。15w are delay (z-I) elements that sequentially delay human data, as shown in FIG. 4, respectively.
-z~101. +3..., a multiplier that multiplies the output from each of these delay elements by a filter coefficient (weighting function)...102=-s~102-, s..., and a summation adder 1
04.
この時上記各乗算器102..〜102.。、における
フィルタ係数は、上記サイン波成分St又はホワイトノ
イズ成分WNでそれぞさ予め定められた値とされており
、このため上記フィルタ回路15sと15Wとでは特性
が異なっている。具体的には、トーナリティの高い信号
成分が供給されるフィルタ回路15sでのフィルタ係数
は、他のバンドへの影響度が大きくなるようなフィルタ
特性が得られる係数とされ、また、トーナリティの低い
信号成分が供給される上記フィルタ回路15wでの係数
は、他のバンドの影響度が小さくなるような特性が得ら
れる係数とされている。各乗算器でこれらフィルタ係数
を各遅延素子の出力に乗算することにより、上記パーク
スペクトルSBの畳込み処理が行われる。なお、例えば
、この畳込み処理により、第3図中点線で示す部分の総
和(総和加算器104での加算)がとられ、この出力か
端子105から出力されるようになっている。At this time, each of the multipliers 102. .. ~102. . The filter coefficients in , are respectively predetermined values for the sine wave component St or the white noise component WN, and therefore the filter circuits 15s and 15W have different characteristics. Specifically, the filter coefficients in the filter circuit 15s to which signal components with high tonality are supplied are coefficients that provide filter characteristics such that the degree of influence on other bands is large, and the The coefficients in the filter circuit 15w to which the components are supplied are coefficients that provide characteristics such that the degree of influence of other bands is reduced. By multiplying the output of each delay element by these filter coefficients in each multiplier, convolution processing of the park spectrum SB is performed. For example, by this convolution process, the sum of the parts shown by the dotted line in FIG.
その後、上記各フィルタ回路15s、15wの出力はそ
れぞれ引算器16s、16wに送られる。Thereafter, the outputs of the filter circuits 15s and 15w are sent to subtracters 16s and 16w, respectively.
該引算器16s、16wは、上記サイン波成分Si又は
ホワイトノイズ成分WNのバンド毎に畳込んだ領域での
後述する許容ノイズレベルに対応するレベルαをそれぞ
れ求めるものである。なお、上記許容可能なノイズレベ
ルに対応するレベルαとは、後述するように、逆コンボ
リューション処理を行うことによってクリティカルバン
ドの各バンド毎の許容ノイズレベルとなるようなレベル
である。ここで、上記引算器16s、16wには、上記
レベルαを求めるための許容関数(マスキングレベルを
表現する関数)が供給される。この許容関数を増減させ
ることで、上記レベルαの制御を行っている。当咳許容
関数は、後述する関数発生回路29s、29wから供給
されている。The subtracters 16s and 16w each obtain a level α corresponding to a permissible noise level, which will be described later, in a region convolved for each band of the sine wave component Si or white noise component WN. Note that the level α corresponding to the above-mentioned allowable noise level is a level that becomes the allowable noise level for each critical band by performing inverse convolution processing, as will be described later. Here, the subtracters 16s and 16w are supplied with a tolerance function (a function expressing the masking level) for determining the level α. The level α is controlled by increasing or decreasing this tolerance function. The cough tolerance function is supplied from function generation circuits 29s and 29w, which will be described later.
すなわち、許容ノイズレベルに対応するレベルαは、ク
リティカルバンドのバンドの低域から順に与えられる番
号をiとすると、第(1)式で求めることができる。In other words, the level α corresponding to the allowable noise level can be determined by equation (1), where i is the number given in order from the low range of the critical band.
α= 5−(n−ai)・・・・・・・(1)二の第(
1)式において、n、aは定数でago、Sは畳込み処
理後のパークスペクトルの強度であり、第(1)式中(
n−ai)が許容関数となる。本実施例においては、例
えばn=38.a=1、或いは、n=24.a=1とさ
れる。α= 5-(n-ai)・・・・・・(1) Second (
In formula (1), n and a are constants, ago and S are the intensity of the park spectrum after convolution processing, and in formula (1), (
n-ai) becomes the tolerance function. In this embodiment, for example, n=38. a=1 or n=24. It is assumed that a=1.
上述のようにして、上記レベルαが求められ、各データ
は、それぞれ割算器17s、17wに伝送される。該割
算器17s、17wでは、上記それぞれ畳込み処理され
た領域での上記レベルαを逆コンボリューションするた
めのものである。したかって、これらの逆コンボリュー
ション処理を行うことにより、上記レベルαからマスキ
ングスペクトルが得られるようになる。すなわち、これ
らマスキングスペクトルが、上記サイン波成分S1とホ
ワイトノイズ成分WNでの許容ノイズレベルとなる。な
お、上記逆コンボリューション処理は複雑な演算を必要
とするが、本実施例装置では、簡略化した割算器17s
、17wを用いて逆コンボリューションを行っている。The level α is determined as described above, and each data is transmitted to the dividers 17s and 17w, respectively. The dividers 17s and 17w are for inversely convoluting the levels α in the respective regions subjected to the convolution processing. Therefore, by performing these inverse convolution processes, a masking spectrum can be obtained from the level α. That is, these masking spectra become the permissible noise level for the sine wave component S1 and the white noise component WN. Note that the above deconvolution process requires complicated calculations, but in the device of this embodiment, a simplified divider 17s
, 17w is used to perform inverse convolution.
なお、通常、マスキングスペクトルMSは、例えば第5
図に示すようになる。すなわち、後述するように、上記
ノ<−クスベクトルSBは、該マスキングスペクトルM
Sの各レベルで示すレベル以下がマスキングされること
になる。Note that, normally, the masking spectrum MS is, for example, the fifth
The result will be as shown in the figure. That is, as will be described later, the Nox vector SB is based on the masking spectrum M
Levels below the level indicated by each level of S will be masked.
次に、これら割算器17s、17wの出力は、制御手段
41に送られ合成される。この制御手段41では、先ず
合成回路32で合成かなされ、その後、合成回路18に
送られる。上記合成回路32て上記割算器17s、17
wの出力を合成することよって、上記ノイズレベル設定
手段40における他バンドへの影響度に、バンド毎のト
ーナリティが加味されることになる。すなわち、トーナ
リティの高いサイン波成分Stに基づく許容ノイズレベ
ルと、トーナリテイの低いホワイトノイズ成分WNに基
づく許容ノイズレベルとを合成することで、各バンド毎
のトーナリテイに応じた他バンドへの影響度が求められ
ることになる。また、上記合成回路18には、最小可聴
カーブ発生回路22からの出力も供給されている。した
かつて、上記合成回路18での合成の際には、最小可聴
カーブ発生回路22から供給される第6図に示すような
人間の聴覚特性であるいわゆる最小可聴カーブ(等ラウ
ドネス曲線)RCを示すデータと、上記合成回路32の
出力すなわち各バンド毎の許容ノイズレベルにトーナリ
ティが加味された出力である上記サイン波成分Siとホ
ワイトノイズ成分WNのマスキングスペクトルMSの合
成された出力とが合成されることになる。このように、
上記最小可聴カーブRCとマスキングスペクトルMSと
を共に合成することで、許容ノイズレベルは例えば、第
6図中斜線で示す部分まてとすることかできるようにな
り、量子化の際に図中斜線で示す部分の割当てビット数
を減らすことができるようになる。なお、この第6図は
、前述の第2図に示したクリティカルバンドて表されて
おり、信号スペクトルSSも同時に示している。Next, the outputs of these dividers 17s and 17w are sent to control means 41 and combined. In this control means 41, the signals are first synthesized in the synthesis circuit 32, and then sent to the synthesis circuit 18. The synthesis circuit 32 and the dividers 17s and 17
By combining the outputs of w, the tonality of each band is taken into consideration in the degree of influence on other bands in the noise level setting means 40. That is, by combining the allowable noise level based on the sine wave component St with high tonality and the allowable noise level based on the white noise component WN with low tonality, the degree of influence on other bands according to the tonality of each band can be reduced. You will be asked for it. The synthesis circuit 18 is also supplied with an output from a minimum audible curve generation circuit 22. Once, when the synthesis circuit 18 synthesizes, the so-called minimum audible curve (equal loudness curve) RC, which is the human auditory characteristic as shown in FIG. 6, is supplied from the minimum audible curve generation circuit 22. data and the combined output of the masking spectrum MS of the sine wave component Si and white noise component WN, which is the output of the synthesis circuit 32, that is, the output with tonality added to the allowable noise level for each band. It turns out. in this way,
By combining the above-mentioned minimum audible curve RC and masking spectrum MS, the allowable noise level can be set to, for example, the area shown by diagonal lines in Fig. 6. It becomes possible to reduce the number of allocated bits in the part shown by . Note that this FIG. 6 shows the critical band shown in FIG. 2 described above, and also shows the signal spectrum SS at the same time.
その後、上記合成回路18の出力は減算器19に伝送さ
れる。ここで、当該減算器19には、上記帯域分割回路
13からの各バンド毎の信号成分(成分分離回路31に
供給される前の信号成分)の振幅値Amの総和(振幅値
Amのピーク又は平均或いはエネルギ総和)をとる総和
検出回路14の出力か遅延回路21を介して供給されて
いる。Thereafter, the output of the synthesis circuit 18 is transmitted to a subtracter 19. Here, the subtracter 19 has a total sum of amplitude values Am (the peak of the amplitude value Am or The output of a summation detection circuit 14 which takes the average or energy summation is supplied via a delay circuit 21.
このため、当該減算器19では、上記各バンドのエネル
ギ総和すなわち各バンド毎ρ信号成分によるバークスペ
クYルSBと、上記制御手段41によって上記トーナリ
ティに応じて他のバンドへの影響度か制御されたノイズ
レベル設定手段40からの出力の許容ノイズレベル(マ
スキングスペクトルMS)との差を取る演算がなされる
。これより、各バンド毎の信号成分のパークスペクトル
SBのマスキングされるレベルが求められることになる
。Therefore, in the subtracter 19, the total energy of each band, that is, the bark spectrum YSB by the ρ signal component for each band, and the degree of influence on other bands are controlled by the control means 41 according to the tonality. A calculation is performed to calculate the difference between the output from the noise level setting means 40 and the allowable noise level (masking spectrum MS). From this, the level at which the park spectrum SB of the signal component of each band is masked is determined.
当該減算器19の出力は、ROM20を介して量子化回
路24に供給されている。ここで、上記ROM20は量
子化回路24での量子化の際の割当てビット数情報を格
納しており、上記減算器19の出力に応じた割当てビッ
ト数情報を出力するものである。したがって、上記量子
化回路24では、この減算器19の出力に応じて割当て
られた゛ビット数で、遅延回路23を介して供給されて
いる振幅値Amの量子化を行っている。すなわち、換言
すれば、当該量子化回路24では、上記クリティカルバ
ントの各バンドのエネルギと上記合成回路18の出力(
トーナリティに応じた許容ノイズレベル)との差のレベ
ルに応じて割当てられたビット数で上記各バンドの成分
を量子化することになる。なお、上記遅延回路21は上
記合成回路18以前の各回路での遅延量を考慮して設け
られ、上記遅延回路23は上記ROM20以前の各回路
での遅延量を考慮して上記振幅値Amを遅延させるため
に設けられている。The output of the subtracter 19 is supplied to a quantization circuit 24 via a ROM 20. Here, the ROM 20 stores information on the number of allocated bits during quantization in the quantization circuit 24, and outputs information on the number of allocated bits in accordance with the output of the subtracter 19. Therefore, the quantization circuit 24 quantizes the amplitude value Am supplied via the delay circuit 23 using the number of bits assigned according to the output of the subtracter 19. In other words, in the quantization circuit 24, the energy of each band of the critical band and the output (
The components of each band are quantized using the number of bits allocated according to the level of the difference from the permissible noise level (according to the tonality). The delay circuit 21 is provided in consideration of the amount of delay in each circuit before the synthesis circuit 18, and the delay circuit 23 determines the amplitude value Am in consideration of the amount of delay in each circuit before the ROM 20. It is designed to delay.
次に、第7図に示す第2の実施例装置において、ノイズ
レベル設定手段40及び制御手段41以外で第1図と同
様の構成には同じ指示符号を付して説明を省略する。こ
の第2の実施例では、制御回路41で各バンド毎のトー
ナリティを示す指標を検出し、このトーナリティを示す
指標に応じて、ノイズレベル設定手段40の可変フィル
タ15のフィルタ特性を可変することによって、この第
2の実施例においても、各バンド毎のトーナリティに応
じた許容ノイズレベルを求めることができるようにして
いる。Next, in the second embodiment of the apparatus shown in FIG. 7, the same components as those in FIG. 1 except for the noise level setting means 40 and the control means 41 are given the same reference numerals, and the explanation thereof will be omitted. In this second embodiment, the control circuit 41 detects an index indicating the tonality of each band, and the filter characteristics of the variable filter 15 of the noise level setting means 40 are varied according to the index indicating the tonality. Also in this second embodiment, it is possible to determine the allowable noise level according to the tonality of each band.
すなわち、この第2の実施例装置において、帯域分割回
路13からの各バンド毎の信号成分は、各バンド毎の信
号成分のエネルギ総和を求める総和検出回路14に送ら
れると共に、各バンド毎の信号成分から直接トーナリテ
ィを示す指標を検出するトーナリティ指標検出回路51
にも送られる。That is, in this second embodiment, the signal components for each band from the band division circuit 13 are sent to the summation detection circuit 14 that calculates the energy sum of the signal components for each band, and the signal components for each band are Tonality index detection circuit 51 that detects an index indicating tonality directly from the components
It will also be sent to
該トーナリティ指標検出回路51では、上記トーナリテ
ィの指標として例えば各バンド毎の信号成分の標準偏差
σや分散σ2等を用いることができる。すなわち、例え
ば標準偏差σは、
の式により算出される。この(2)式中でXlは変数、
Nは総数、Xは相加平均である。この標準偏差σにおい
て、該標準偏差σか大きい時はトーナリティが低いこと
になり、また標準偏差σか小さい時にはトーナリティが
高いことになる。勿論この標準偏差σに限らず他のもの
であってもよい。The tonality index detection circuit 51 can use, for example, the standard deviation σ, variance σ2, etc. of the signal components for each band as the tonality index. That is, for example, the standard deviation σ is calculated by the following formula. In this formula (2), Xl is a variable,
N is the total number and X is the arithmetic mean. Regarding this standard deviation σ, when the standard deviation σ is large, the tonality is low, and when the standard deviation σ is small, the tonality is high. Of course, the standard deviation is not limited to this standard deviation σ, and other values may be used.
この時、該トーナリティ指標検出回路51には、端子5
0から標準値が供給されている。この標準値は、上記標
準偏差σの値と比較することによって、各バンド毎の信
号成分のトーナリティの割合を検出するために用いられ
るものである。すなわち、例えば、該標準値と上記標準
偏差σの値との比から各バンド毎のトーナリティのパー
センテージを求めるようにする。このため、例えばトー
ナリティのパーセンテージが高い時は、第1の実施例で
のサイン波成分のような単一周波数成分が多いことにな
り、またトーナリティのパーセンテージが低い場合はホ
ワイトノイズ成分のような成分か多いことになる。At this time, the tonality index detection circuit 51 has a terminal 5.
Standard values are supplied starting from 0. This standard value is used to detect the tonality ratio of the signal component for each band by comparing it with the value of the standard deviation σ. That is, for example, the percentage of tonality for each band is determined from the ratio between the standard value and the value of the standard deviation σ. Therefore, for example, when the percentage of tonality is high, there will be many single frequency components such as the sine wave component in the first embodiment, and when the percentage of tonality is low, there will be many components such as white noise components. There will be many.
該トーナリティ指標検出回路51の出力はフィルタ係数
設定回路52に送られる。該フィルタ係数設定回路52
は、上記トーナリティの指標と標準値との比較結果に応
じた(トーナリティのパーセンテージに応じた)フィル
タ係数を出力するものであり、このフィルタ係数設定回
路52の出力か、上記可変フィルタ回路15に送られる
。当該可変フィルタ回路15も、前述の第4図と同様の
構成を有するものであり、各乗算器での乗算係数か、上
記フィルタ係数設定回路52からの上記トーナリティの
パーセンテージに応じたフィルタ係数となっている。し
たがって、該可変フィルタ回路15のフィルタ特性は、
上記フィルタ係数設定回路52からのフィルタ係数すな
わちトーナリティの検出結果に応じて可変されるように
なる。The output of the tonality index detection circuit 51 is sent to a filter coefficient setting circuit 52. The filter coefficient setting circuit 52
outputs a filter coefficient (according to the percentage of tonality) according to the comparison result between the tonality index and the standard value, and the output is sent from the filter coefficient setting circuit 52 or to the variable filter circuit 15. It will be done. The variable filter circuit 15 also has a configuration similar to that shown in FIG. ing. Therefore, the filter characteristics of the variable filter circuit 15 are:
The filter coefficient setting circuit 52 changes the filter coefficient in accordance with the detection result of the tonality.
この可変フィルタ15の出力か、第1図の引算器16s
、16w、関数発生回路29s 29w割算器+7s
、+7wと同様に動作する引算器16、関数発生回路2
91割算器17を介し、合成回路18に送られる。The output of this variable filter 15 or the subtracter 16s in FIG.
, 16w, function generation circuit 29s 29w divider +7s
, a subtracter 16 and a function generation circuit 2 that operate in the same way as +7w.
The signal is sent to the synthesis circuit 18 via the 91 divider 17.
更に1.ROM20からは合成回路18と遅延回路21
との出力の減算結果に応じた量子化割当てビット数の情
報が出力され、量子化回路24に送られる。これにより
、量子化回路24では、減算器19の出力に応じて割当
てられたビット数で、遅延回路23を介して供給されて
いる信号成分の量子化が行われる。すなわち、換言すれ
ば、該量子化回路24では、上記クリティカルバントの
各バンドのエネルギと上記合成回路18の出力(トーナ
リティに応じた許容ノイズレベル)との差のレベルに応
して割当てられたビット数で上記各バンドの成分か量子
化されることになる。Furthermore 1. From the ROM 20, a synthesis circuit 18 and a delay circuit 21
Information on the number of allocated bits for quantization according to the result of subtracting the output from is output and sent to the quantization circuit 24. Thereby, in the quantization circuit 24, the signal component supplied via the delay circuit 23 is quantized using the number of bits allocated according to the output of the subtracter 19. In other words, in the quantization circuit 24, bits are allocated according to the level of the difference between the energy of each band of the critical band and the output of the synthesis circuit 18 (allowable noise level according to tonality). The components of each of the above bands are quantized by the number.
上述のようなことから、第1図に示した第1の実施例及
び第7図に示した第2の実施例のディジタル信号符号化
装置においては、クリティカルバンドの各バンドのエネ
ルギと、トーナリティに応じた許容ノイズレベルとの差
のレベルに応して割当てられたビット数で上記各バンド
の成分が量子化されることにより、音質劣化を少なくし
てビットレートを低減することができるようになる。As described above, in the digital signal encoding apparatus of the first embodiment shown in FIG. 1 and the second embodiment shown in FIG. 7, the energy and tonality of each critical band are By quantizing the components of each of the above bands with the number of bits allocated according to the level of the difference from the corresponding allowable noise level, it becomes possible to reduce sound quality degradation and reduce the bit rate. .
なお、第1.第2の実施例では、時間軸上の入力信号を
高速フーリエ変換した出力の帯域分割を行っているが、
この高速フーリエ変換を行わずに時間軸の信号を直接帯
域分割するようにしてもよい。In addition, 1. In the second embodiment, band division is performed on the output of the fast Fourier transform of the input signal on the time axis.
The time axis signal may be directly band-divided without performing this fast Fourier transform.
また、上述した本発明実施例においては、周波数軸上の
信号におけるマスキング効果のみについて述べているが
、本発明は、この周波数軸でのマスキング効果と共に、
例えば時間軸上のいわゆるテンポラルマスキング効果を
も考慮したものとすることもできる。このテンポラルマ
スキング効果を上記周波数軸でのマスキングと共に用い
ることで、あるバンドの信号による他の時間の他のバン
ドへのトーナリティによる影響度を考慮した許容ノイズ
レベルを設定することができるようになり、より高いビ
ット圧縮が可能になる。Furthermore, in the embodiments of the present invention described above, only the masking effect on the signal on the frequency axis is described, but the present invention also provides the masking effect on the frequency axis as well as the masking effect on the signal on the frequency axis.
For example, a so-called temporal masking effect on the time axis may also be considered. By using this temporal masking effect together with masking on the frequency axis, it becomes possible to set an allowable noise level that takes into account the degree of influence of the tonality of a signal in a certain band on other bands at other times. Higher bit compression is possible.
ここで、上記テンポラルマスキング効果とは、大きな音
の時間的な前後の小さな音が、該大きな音にマスクされ
て聞こえなくなるような効果である。当該テンポラルマ
スキング効果において、上記大きな音の時間的に後方の
マスキングはフォワードマスキングと呼ばれ、また、時
間的に前方のマスキングはパックワードマスキングと呼
ばれている。また、当該テンポラルマスキングにおいて
は、人間の聴覚特性から、フォワードマスキングの効果
は長時間(例えば100m5ec程度)効くようになっ
ているのに対し、パックワードマスキングの効果は短時
間(例えば5 m5ec程度)となっている。更に、上
記マスキング効果のレベル(マスキング量)は、フォワ
ードマスキングが20dB程度で、パックワードマスキ
ングが30dB程度となっている。Here, the above-mentioned temporal masking effect is an effect in which small sounds temporally before and after a loud sound are masked by the loud sound and become inaudible. In the temporal masking effect, masking temporally behind the loud sound is called forward masking, and masking temporally forward is called packed word masking. In addition, in temporal masking, due to the characteristics of human hearing, the effect of forward masking is effective for a long time (for example, about 100 m5ec), whereas the effect of packed word masking is effective for a short time (for example, about 5 m5ec). It becomes. Further, the level of the masking effect (masking amount) is about 20 dB for forward masking and about 30 dB for packed word masking.
本発明のディジタル信号符号化装置においては、入力音
声信号を複数帯域に分割した各バンド毎のエネルギとト
ーナリティとに基づいて他のバンドへの影響度を求めて
各バンド毎の許容ノイズレベルを設定し、この許容ノイ
ズレベルと各バンドのエネルギとの差に応じたビット数
で各バンド成分の量子化を行うことにより、また、各バ
ンド毎のエネルギをフィルタ処理して他のバンドへの影
響度を計算すること、或いは、各バンドの信号成分を単
一周波数成分とホワイトノイズ成分とに分離してそれぞ
れ異なるフィルタ特性でフィルタ処理して合成を行うこ
と、更に、各バンド毎のトーナリティを示す指標に応じ
てフィルタ特性を可変することにより、低ビツトレート
に圧縮しても音質劣化の少ない符号化か可能となる。In the digital signal encoding device of the present invention, an input audio signal is divided into multiple bands, and based on the energy and tonality of each band, the degree of influence on other bands is determined, and the allowable noise level for each band is set. Then, by quantizing each band component with the number of bits according to the difference between this allowable noise level and the energy of each band, the energy of each band is also filtered to determine the influence on other bands. Alternatively, the signal component of each band can be separated into a single frequency component and a white noise component, each filtered with different filter characteristics, and then synthesized. Furthermore, an index indicating the tonality of each band can be calculated. By varying the filter characteristics according to the signal, it is possible to perform encoding with little deterioration in sound quality even when compressed to a low bit rate.
第1図は本発明の第1の実施例のディジタル信号符号化
装置の概略構成を示すブロック回路図、第2図はクリテ
ィカルバンドを示す図、第3図はパークスペクトルを示
す図、第4図はフィルタ回路を示す回路図、第5図はマ
スキングスペクトルを示す図、第6図は最小可聴カーブ
、マスキングスペクトルを合成した図、第7図は第2の
実施例のディジタル信号符号化装置の概略構成を示すブ
ロック回路図、第8図は人間の聴覚による周波数軸上の
信号におけるマスキングを説明するための図である。
13・・・・・・・・帯域分割回路
14s、14w、14・・・・・・総和検出回路15s
、15w、15・・・・・・フィルタ回路6s、16w
、16・・・・・・引算器7s、17w、17・・・・
・・割算器8.32・・合成回路
9・・・・・・・・減算器
0・・・・・・・・ROM
1,23・・遅延回路
2・・・・・・・・最小可聴カーブ発生回路4・・・・
・・・・量子化回路
0・・・・・・・・ノイズレベル設定手段l・・・・・
・・・制御手段
l・・・・・・・・トーナリティ指標検出回路2・・・
・・・・・フィルタ係数設定回路特許出願人 ソ
ニー株式会社FIG. 1 is a block circuit diagram showing a schematic configuration of a digital signal encoding device according to a first embodiment of the present invention, FIG. 2 is a diagram showing a critical band, FIG. 3 is a diagram showing a park spectrum, and FIG. 5 is a circuit diagram showing a filter circuit, FIG. 5 is a diagram showing a masking spectrum, FIG. 6 is a diagram in which the minimum audible curve and the masking spectrum are synthesized, and FIG. 7 is an outline of the digital signal encoding device of the second embodiment. FIG. 8, a block circuit diagram showing the configuration, is a diagram for explaining masking of signals on the frequency axis by human hearing. 13... Band division circuit 14s, 14w, 14... Sum detection circuit 15s
, 15w, 15... Filter circuit 6s, 16w
, 16...subtractor 7s, 17w, 17...
...Divider 8.32...Synthesizing circuit 9...Subtractor 0...ROM 1, 23...Delay circuit 2...Minimum Audible curve generation circuit 4...
...Quantization circuit 0...Noise level setting means L...
... Control means l ... Tonality index detection circuit 2 ...
...Filter coefficient setting circuit patent applicant Sony Corporation
Claims (4)
る帯域分割手段と、 上記帯域分割手段により分割された各バンド毎のエネル
ギに基づいて他のバンドへの影響度を計算して各バンド
毎の許容ノイズレベルを設定するノイズレベル設定手段
と、 上記各バンド毎のトーナリティに応じて上記ノイズレベ
ル設定手段での他のバンドへの影響度を制御する制御手
段と、 上記各バンドのエネルギと上記トーナリティに応じて制
御された許容ノイズレベルとの差に応じたビット数で各
バンドの信号成分を量子化する量子化手段とを有してな
ることを特徴とするディジタル信号符号化装置。(1) A band dividing means for dividing an input digital signal into a plurality of frequency bands; and a band dividing means for calculating the degree of influence on other bands based on the energy of each band divided by the band dividing means. noise level setting means for setting an allowable noise level; control means for controlling the degree of influence of the noise level setting means on other bands according to the tonality of each band; and the energy of each band and the tonality. 1. A digital signal encoding device comprising: quantization means for quantizing a signal component of each band with a number of bits corresponding to a difference from a permissible noise level controlled according to.
エネルギが入力されて上記他のバンドへの影響度を計算
するフィルタ手段を有することを特徴とする請求項(1
)記載のディジタル信号符号化装置。(2) The noise level setting means includes filter means for receiving the energy of each band and calculating the degree of influence on the other bands.
).
成分が単一周波数成分とホワイトノイズ成分とに分離さ
れた各成分がそれぞれ入力される各々特性の異なる2つ
のフィルタ手段を有し、上記制御手段は、上記ノイズレ
ベル設定手段の上記各フィルタからの出力を合成するこ
とを特徴とする請求項(2)記載のディジタル信号符号
化装置。(3) The noise level setting means has two filter means each having different characteristics, into which the signal components of each band are separated into a single frequency component and a white noise component. 3. The digital signal encoding apparatus according to claim 2, wherein the control means synthesizes outputs from each of the filters of the noise level setting means.
す指標を検出し、該トーナリティを示す指標に応じて上
記ノイズレベル設定手段のフィルタ手段の特性を可変す
ることを特徴とする請求項(2)記載のディジタル信号
符号化装置。(4) The control means detects an index indicating tonality for each band, and varies the characteristics of the filter means of the noise level setting means according to the index indicating tonality. ).
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2221367A JP3033157B2 (en) | 1990-08-24 | 1990-08-24 | Digital signal coding device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2221367A JP3033157B2 (en) | 1990-08-24 | 1990-08-24 | Digital signal coding device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04104618A true JPH04104618A (en) | 1992-04-07 |
JP3033157B2 JP3033157B2 (en) | 2000-04-17 |
Family
ID=16765687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2221367A Expired - Lifetime JP3033157B2 (en) | 1990-08-24 | 1990-08-24 | Digital signal coding device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3033157B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3089691B2 (en) | 1991-03-29 | 2000-09-18 | ソニー株式会社 | Highly efficient digital data encoding method. |
-
1990
- 1990-08-24 JP JP2221367A patent/JP3033157B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP3033157B2 (en) | 2000-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100293855B1 (en) | High efficiency digital data encoding and decoding device | |
US5157760A (en) | Digital signal encoding with quantizing based on masking from multiple frequency bands | |
US5260980A (en) | Digital signal encoder | |
RU2090973C1 (en) | Signal coding method | |
JP3134337B2 (en) | Digital signal encoding method | |
JP2751564B2 (en) | Digital signal coding device | |
US5268685A (en) | Apparatus with transient-dependent bit allocation for compressing a digital signal | |
JPH03117919A (en) | Digital signal encoding device | |
JPH03256411A (en) | High efficient encoder for digital data | |
JP3041967B2 (en) | Digital signal coding device | |
JPH04104618A (en) | Digital signal coder | |
JP3089692B2 (en) | Highly efficient digital data encoding method. | |
JP2870050B2 (en) | Highly efficient digital data encoding method. | |
JP3010663B2 (en) | Noise shaping circuit | |
JP2913695B2 (en) | Digital signal encoding method | |
JP2913696B2 (en) | Digital signal encoding method | |
KR100233762B1 (en) | Coding apparatus for digital signal | |
JP3060577B2 (en) | Digital signal encoding method | |
JP3060578B2 (en) | Digital signal encoding method | |
JP3060576B2 (en) | Digital signal encoding method | |
JP2797524B2 (en) | Digital signal encoding method | |
JP3089691B2 (en) | Highly efficient digital data encoding method. | |
JP3132031B2 (en) | High-efficiency coding of digital signals. | |
JPH03139923A (en) | Highly efficient encoder for digital data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080218 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090218 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100218 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100218 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110218 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110218 Year of fee payment: 11 |