JPH03117920A - Digital signal encoding device - Google Patents

Digital signal encoding device

Info

Publication number
JPH03117920A
JPH03117920A JP25579989A JP25579989A JPH03117920A JP H03117920 A JPH03117920 A JP H03117920A JP 25579989 A JP25579989 A JP 25579989A JP 25579989 A JP25579989 A JP 25579989A JP H03117920 A JPH03117920 A JP H03117920A
Authority
JP
Japan
Prior art keywords
band
circuit
energy
bits
digital signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP25579989A
Other languages
Japanese (ja)
Other versions
JP2913695B2 (en
Inventor
Yoshihito Fujiwara
藤原 義仁
Tomoko Umezawa
梅沢 知子
Masayuki Nishiguchi
正之 西口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP25579989A priority Critical patent/JP2913695B2/en
Publication of JPH03117920A publication Critical patent/JPH03117920A/en
Application granted granted Critical
Publication of JP2913695B2 publication Critical patent/JP2913695B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PURPOSE:To reduce the degradation in S/N on hearing by detecting the output information volume after quantization and correcting the number of assigned bits for quantization based on the error between this detection output and a target value, and the energy of each band to fix the information volume in a prescribed period. CONSTITUTION:The output information volume of a quantizing circuit 24 is detected by a data volume calculating circuit 26, and the error between this detection output and a prescribed target value (the target value of the bit rate for bit rate adjustment) from a terminal 3 is detected by an error detecting circuit 27. Thereafter, the correction value to correct the number of assigned bits of a quantizing circuit 24 based on this error output and the energy of each band is determined by a correction value determining circuit 28, and quantization is performed based on this correction value. Consequently, the information volume in the prescribed period is fixed. Thus, the degradation in S/N on hearing is reduced.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、入力ディジタル信号の符号化を行うディジタ
ル信号符号化装置に関するものである。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a digital signal encoding device that encodes an input digital signal.

〔発明の概要〕[Summary of the invention]

本発明は、入力ディジクル信号を複数の周波数帯域に分
割すると共に、高い周波数帯域ほどバンド幅を広く選定
し、各バンド毎のエネルギに基づいて各バンド単位の許
容ノイズレベルを設定し、各バンドのエネルギと設定さ
れた許容ノイズレベルの差のレベルに応じたビット数で
各バンドの成分を量子化するディジクル信号符号化装置
において、量子化後の出力情報量を検出し、この検出出
力と目標値の誤差及び各バンドのエネルギに基づいて、
量子化の際の割当てビット数を補正するようにして、所
定期間における情報量を一定化するようにしたことによ
り、簡単な構成で、信号劣化の少ないビットレート調整
(ビットバッキング)を行うことが可能で、特に、エネ
ルギの集中した周波数帯域にビット数を多く割当てるこ
とができるようにし、聴感上のS/Nを向上させること
が可能なディジタル信号符号化装置を提供するものであ
る。
The present invention divides an input digital signal into a plurality of frequency bands, selects a wider band width for a higher frequency band, sets an allowable noise level for each band based on the energy of each band, and In a digital signal encoding device that quantizes the components of each band with the number of bits according to the level of the difference between the energy and the set allowable noise level, the amount of output information after quantization is detected, and this detected output and the target value are Based on the error of and the energy of each band,
By correcting the number of allocated bits during quantization and making the amount of information constant over a given period, it is possible to perform bit rate adjustment (bit backing) with a simple configuration and with little signal deterioration. In particular, it is an object of the present invention to provide a digital signal encoding device that can allocate a large number of bits to a frequency band where energy is concentrated, and can improve the perceptual S/N.

〔従来の技術〕[Conventional technology]

オーディオ、音声等の信号の高能率符号化においては、
オーディオ、音声等の入力信号を時間軸又は周波数軸で
複数のチャンネルに分割すると共に、各チャンネル毎の
ビット数を適応的に割当てるビットアロケーション(ビ
ット割当て)による符号化技術がある。例えば、オーデ
ィオ信号等の上記ビット割当てによる符号化技術には、
時間軸上のオーディオ信号等を複数の周波数帯域に分割
して符号化する帯域分割符号化(サブ・バンド・コーデ
ィング:5BC)や、時間軸の信号を周波数軸上の信号
に変換(直交変換)して複数の周波数帯域に分割し各帯
域毎で適応的に符号化するいわゆる適応変換符号化(A
TC)、或いは、上記SBCといわゆる適応予測符号化
(APC)とを組み合わセ、時間軸の信号を帯域分割し
て各帯域信号をベースバンド(低域)に変換した後複数
次の線形予測分析を行って予測符号化するいわゆる適応
ビット割当て(APC−AB)等の符号化技術がある。
In high-efficiency encoding of audio, voice, etc. signals,
2. Description of the Related Art There is an encoding technique using bit allocation that divides an input signal such as audio or voice into a plurality of channels on a time axis or a frequency axis and adaptively allocates the number of bits for each channel. For example, the encoding technology using the above-mentioned bit allocation for audio signals, etc.
Band division coding (sub-band coding: 5BC), which divides and encodes audio signals on the time axis into multiple frequency bands, and converts time-axis signals to signals on the frequency axis (orthogonal transformation) So-called adaptive transform coding (A
TC), or by combining the above SBC and so-called adaptive predictive coding (APC), dividing the time domain signal into bands and converting each band signal to baseband (low band), followed by multi-order linear predictive analysis. There are encoding techniques such as so-called adaptive bit allocation (APC-AB) that performs predictive encoding.

ここで例えば、上記帯域分割符号化においては、圧縮効
率を上げるために、一定の単位時間ブロック毎のビット
レートを一定に保ちながら、帯域分割した各バンドに与
えるビット数を信号スペクトル強度の時間変動に応して
ダイナミックに(適応的に)変化させている。また、上
記適応変換符号化においては、周波数軸上でダイナミン
クに割当てビット数を変化させている。
For example, in the band division encoding described above, in order to increase compression efficiency, while keeping the bit rate for each unit time block constant, the number of bits given to each divided band is determined by the time fluctuation of the signal spectrum intensity. It changes dynamically (adaptively) according to the situation. Furthermore, in the adaptive transform encoding described above, the number of allocated bits is dynamically changed on the frequency axis.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

上述のようなビット数を適応的に割当てる高能率符号化
においては、ビット数の割当ての仕方しだいで単位ブロ
ック(単位時間ブロック或いは単位周波数ブロック)当
たりのビットレートが一定にならない場合が生じ、ビッ
トの過不足が起こる場合がある。すなわち、与えられた
ビットレートに対して、時間軸上或いは周波数軸上で信
号レベルの低い所ではビットが余り、信号レベルの高い
所ではビットが足りないという現象が起こることがある
In high-efficiency coding that adaptively allocates the number of bits as described above, the bit rate per unit block (unit time block or unit frequency block) may not be constant depending on how the number of bits is allocated. There may be an excess or deficiency of the amount. That is, for a given bit rate, there may occur a phenomenon in which there are excess bits in areas where the signal level is low on the time axis or frequency axis, and there are insufficient bits in areas where the signal level is high.

このようなビット数の過不足があった場合には、効果的
にビット数を調整するようなビットレート調整(いわゆ
るビットバンキング)の手法を用いる必要があった。
If there is such an excess or deficiency in the number of bits, it is necessary to use a bit rate adjustment method (so-called bit banking) to effectively adjust the number of bits.

このビットレート調整とは、単位ブロンクでビットが余
ったときには、この単位ブロックに与えるビット数を減
らし、ビットが足りないときには与えるビット数を増加
させるようにすることにより、全体のビットレートを一
定に調整するものである。当該ビットレート調整は、例
えば、第8図に示すような機能ブロックを用いて行うこ
とができると考えられる。この第8図において、入力デ
ィジタル信号に対して、割当てビット数決定機能ブロッ
ク90で量子化の際の割当てビット数を決定し、ビット
レート調整機能ブロック91で、′入力ディジタル信号
の単位ブロックのスペクトル強度に応じたビットレート
の調整(ビットバッキング)を行う。その後、ビットレ
ート調整されて決定されたビット数を用いて符号化機能
ブロック92で入力ディジタル信号の符号化(再量子化
)が行われて出力される。
This bit rate adjustment means that when there are excess bits in a unit block, the number of bits given to this unit block is reduced, and when there are insufficient bits, the number of bits given is increased, thereby keeping the overall bit rate constant. It is something to be adjusted. It is conceivable that the bit rate adjustment can be performed using functional blocks as shown in FIG. 8, for example. In FIG. 8, an allocated bit number determination function block 90 determines the allocated bit number for quantization with respect to the input digital signal, and a bit rate adjustment function block 91 determines the 'spectrum of a unit block of the input digital signal. Adjust the bit rate (bit backing) according to the strength. Thereafter, the input digital signal is encoded (requantized) in the encoding function block 92 using the number of bits determined by adjusting the bit rate and is output.

ところが、上記ビットレートm整機能ブロック92で行
われるビットレートの調整としては、未だ、簡単でかつ
信号の劣化が目立たない効果的な方法がなく、このため
、従来より、効果的なビットレート調整の方法の確立が
望まれている。特に、ビットレート調整の際に、ある帯
域に信号(スペクトル強度、エネルギ)が集中している
トーン性のあるソース(サイン波、トーンバースト波、
単楽器音等)については、その帯域部分で発生するノイ
ズが劣化として惑しられることが多く、この劣化を防ぐ
ための対処法の必要性があった。
However, as for the bit rate adjustment performed by the bit rate adjustment function block 92, there is still no effective method that is simple and does not cause noticeable signal deterioration. Establishment of a method is desired. In particular, when adjusting the bit rate, tonal sources (sine waves, tone burst waves,
With regard to single instrument sounds, etc., noise generated in that band is often misinterpreted as deterioration, and there is a need for a countermeasure to prevent this deterioration.

そこで、本発明は、上述のような実情に鑑みて提案され
たものであり、簡単な構成で、信号の劣化の目立たない
ピットレー日周整(ビットバンキング)を行うことがで
き、特に、トーン性のあるソースであっても劣化の少な
い信号符号化を行うことが可能なディジタル信号符号化
装置を提供することを目的とするものである。
Therefore, the present invention has been proposed in view of the above-mentioned actual situation, and it is possible to perform pit-lay daily adjustment (bit banking) with a simple configuration in which signal deterioration is not noticeable, and in particular, tones. It is an object of the present invention to provide a digital signal encoding device that can perform signal encoding with little deterioration even when using a certain source.

〔課題を解決するだめの手段〕[Failure to solve the problem]

本発明のディジタル信号符号化装置は、上述の目的を達
成するために提案されたものであり、例えば、第1図に
示すように、入力ディジタル信号を複数の周波数帯域に
分割すると共に、高い周波数帯域ほどバンド幅を広く選
定し、当該各バンド毎のエネルギに基づいて各バンド単
位の許容ノイズレベルを設定するノイズレベル設定手段
としての総和検出回路14及びフィルタ回路15と、上
記各バンドのエネルギと上記ノイズレベル設定手段の差
のレベルに応じたピッ)Iで上記各バンドの成分を量子
化する量子化回路24とを有するディジタル信号符号化
装置において、上記量子化回路24の出力情報量を検出
し、該検出出力と目標値の誤差及び上記各バンドのエネ
ルギに基づいて、上記量子化回路24の割当てビット数
を補正するようにして、所定期間における情報量を一定
化するようにしたものである。
The digital signal encoding device of the present invention has been proposed to achieve the above-mentioned object. For example, as shown in FIG. A total sum detection circuit 14 and a filter circuit 15 as noise level setting means for selecting a wider band width as the band increases, and setting an allowable noise level for each band based on the energy of each band, and the energy of each band. In a digital signal encoding device having a quantization circuit 24 that quantizes the components of each band with a pip corresponding to the level of the difference between the noise level setting means, the amount of information output from the quantization circuit 24 is detected. The number of bits allocated to the quantization circuit 24 is corrected based on the error between the detection output and the target value and the energy of each band, thereby making the amount of information constant in a predetermined period. be.

〔作用〕[Effect]

本発明によれば、全体のビットレートを一定に保ち、同
時に、各バンドのエネルギに基づいて割当てビット数を
一定足増減することで、エネルギの集中した帯域にビッ
ト数を多く割当てている。
According to the present invention, by keeping the overall bit rate constant and at the same time increasing or decreasing the number of allocated bits by a certain amount based on the energy of each band, a large number of bits is allocated to bands where energy is concentrated.

[実施例] 以下、本発明を適用した実施例について図面を参照しな
がら説明する。
[Example] Hereinafter, an example to which the present invention is applied will be described with reference to the drawings.

本実施例のディジタル信号符号化装置は、オーディオ或
いは音声等の入力ディジタル信号を、例えば、帯域分割
符号化(SBC)や、適応変換符号化(ATC)、適応
ビット割当て(APC−AB)等により高能率符号化す
るものである。そのため、本実施例装置では、入力ディ
ジタル信号を複数の周波数帯域に分割すると共に、高い
周波数帯域ほどバンド幅を広く選定している。すなわち
、後述する人間の聴覚特性を考慮したいわゆる臨界帯域
幅(クリティカルバンド)で上記入力ディジタル信号を
分割している。また、第1図に示すように、当該クリテ
ィカルバンドの各バンド毎の工ふルギ(又はピーク値、
平均値)に基づいて各バンド単位の許容ノイズレベルを
設定するノイズレベル設定手段としての総和検出回路1
4及びフィルタ回路15と、上記各バンドのエネルギと
上記ノイズレベル設定手段の差のレベルに応して割当て
られたビット数で上記各バンドの成分を量子化する■子
化回路24とを存するものである。ここで、上記量子化
回路24の出力情報量を後述するデータ量演算回路26
で検出し、該検出出力と端子3からの所定の目標値(ビ
ットレート調整のためのビットレートの目標値)との誤
差が後述する誤差検出回路27で検出される。その後、
後述する補正値決定回路28でこの誤差出力及び各バン
ドのエネルギに基づいて、上記量子化回路24の割当て
ビア)数を補正する補正値が決定され、この補正値に基
づいて量子化が行われている。このにょうにすることに
より、本実施例装置では、所定期間における情報量を一
定化(ビットレートの調整)を行うようにしている。
The digital signal encoding device of this embodiment converts an input digital signal such as audio or voice by, for example, band division coding (SBC), adaptive transform coding (ATC), adaptive bit allocation (APC-AB), etc. It performs high-efficiency encoding. Therefore, in the device of this embodiment, the input digital signal is divided into a plurality of frequency bands, and the higher the frequency band, the wider the bandwidth is selected. That is, the input digital signal is divided by a so-called critical band that takes into account the human auditory characteristics described later. In addition, as shown in Figure 1, the engineering value (or peak value,
Total sum detection circuit 1 as a noise level setting means for setting the allowable noise level for each band based on the average value)
4, a filter circuit 15, and a nucleation circuit 24 that quantizes the components of each band with the number of bits allocated according to the level of the difference between the energy of each band and the noise level setting means. It is. Here, the amount of information output from the quantization circuit 24 is determined by a data amount calculation circuit 26, which will be described later.
The error between the detection output and a predetermined target value (target value of bit rate for bit rate adjustment) from the terminal 3 is detected by an error detection circuit 27, which will be described later. after that,
A correction value determining circuit 28 (described later) determines a correction value for correcting the number of vias allocated in the quantization circuit 24 based on this error output and the energy of each band, and quantization is performed based on this correction value. ing. By doing this, in the device of this embodiment, the amount of information in a predetermined period is made constant (adjustment of bit rate).

その後、上記量子化回路24からの量子化出力は、パン
ツアメモリ25を介して本実施例のディジタル信号符号
化装置の出力端子2から出力されるようになる。
Thereafter, the quantized output from the quantization circuit 24 is outputted from the output terminal 2 of the digital signal encoding device of this embodiment via the panzer memory 25.

このため、第1図の装置に供給される信号が、例えば、
第2図Aに示すような信号スペクトルSSの信号である
場合、すなわち、ある帯域に信号(スペクトル強度、エ
ネルギ)が集中しているトーン性のあるソース(サイン
波、トーンバースト波、単楽器音等)である場合、上記
信号スペクトルSSに対して、ノイズスペクトルNSは
第2図中−点鎖線で示すようなものとなる。したがって
、第1図の本実施例装置においては、例えば、信号の周
波数分析を行い、各バンド毎のエネルギの割合を求め、
与えられた一定のビットに対してビント数が余った場合
には、信号エネルギに比例してエネルギの大きい帯域に
は多くのビット数を与え、小さい(少ない)帯域には少
ないビット配分でビットレートの調整を行う。これによ
り、第2図Bに示すように、ノイズスペクトルNSは、
第2図Bの図中点線で示すノイズスペクトルNSIのよ
うに補正される。逆に、ビットが不足する場合には、信
号エネルギに反比例してエネルギの少ない帯域からビッ
トを取り上げてそのビット数の不足した帯域に与える。
For this reason, the signal supplied to the apparatus of FIG.
If the signal has a signal spectrum SS as shown in Figure 2A, it is a tonal source (sine wave, tone burst wave, single instrument sound) in which the signal (spectral intensity, energy) is concentrated in a certain band. etc.), the noise spectrum NS becomes as shown by the dashed line in FIG. 2 with respect to the signal spectrum SS. Therefore, in the device of this embodiment shown in FIG. 1, for example, frequency analysis of the signal is performed to determine the energy ratio for each band,
If the number of bits is left over for a given fixed bit, the bit rate is increased by giving more bits to bands with higher energy in proportion to the signal energy and allocating fewer bits to bands with smaller (fewer) bits. Make adjustments. As a result, as shown in FIG. 2B, the noise spectrum NS is
The noise spectrum is corrected as indicated by the dotted line in FIG. 2B. Conversely, when there is a shortage of bits, bits are taken from a band with less energy in inverse proportion to the signal energy and applied to the band with the insufficient number of bits.

これにより、第2図Cに示すように、ノイズスペクトル
NSは、第2図Cの図中点線で示すノイズスペクトルN
Scのように補正される。
As a result, as shown in FIG. 2C, the noise spectrum NS becomes the noise spectrum N shown by the dotted line in FIG.
It is corrected as Sc.

ここで、第1図に示す本実施例のディジタル信号符号化
装置は、オーデイオ信号1音声信号等を高速フーリエ変
換(FFT)して、時間軸の信号を周波数軸に変換し、
符号化(再量子化)を行うものである。
Here, the digital signal encoding device of this embodiment shown in FIG. 1 performs fast Fourier transform (FFT) on the audio signal 1 audio signal etc. to convert the time axis signal into the frequency axis,
It performs encoding (requantization).

第1図において、入力端子lには、例えばオーディオ信
号が供給されており、この時間軸上のオーディオ信号が
高速フーリエ変換回路11に伝送される。この高速フー
リエ変換回路11では、上記時間軸上のオーディオ信号
が所定時間毎(単位ブロック)に周波数軸上の信号に変
換され、実数成分値Reと虚数成分値1mとからなるF
FT係数が得られる。これらFFT係数は振幅位相情報
発生回路12に伝送され、当該振幅位相情報発生回路1
2では上記実数成分値Reと虚数成分値Imとから振幅
値Amと位相値とが得られて、この振幅値Amの情報が
出力されるようになる。すなわち、一般に人間の聴覚は
周波数領域の振幅(パワー)には敏感であるが、位相に
ついてはかなり鈍感であるため、本実施例では上記振幅
位相情報発生回路I2の出力から上記振幅値Amのみを
取り出し、これを本発明実施例での入力ディジタル信号
としている。
In FIG. 1, an audio signal, for example, is supplied to an input terminal l, and this audio signal on the time axis is transmitted to a fast Fourier transform circuit 11. In this fast Fourier transform circuit 11, the audio signal on the time axis is converted into a signal on the frequency axis at every predetermined time (unit block), and F is made up of a real component value Re and an imaginary component value 1m.
The FT coefficient is obtained. These FFT coefficients are transmitted to the amplitude and phase information generation circuit 12, and the amplitude and phase information generation circuit 1
In step 2, an amplitude value Am and a phase value are obtained from the real component value Re and the imaginary component value Im, and information on this amplitude value Am is output. That is, in general, human hearing is sensitive to amplitude (power) in the frequency domain, but is quite insensitive to phase. Therefore, in this embodiment, only the amplitude value Am is calculated from the output of the amplitude and phase information generation circuit I2. This is taken out and used as an input digital signal in the embodiment of the present invention.

このようにして得られた振幅値Am等の入力ディジタル
信号は、帯域分割回路13に伝送される。
The input digital signal such as the amplitude value Am obtained in this way is transmitted to the band division circuit 13.

この帯域分割回路13では、上記振幅(I!!Amで表
現された入力ディジクル信号をいわゆる臨界帯域幅(ク
リティカルバンド)に分割している。このクリティカル
バンドとは、人間の聴覚特性(周波数分析能力)を考慮
したものであり、例えばO〜16kHzを24バンドに
分け、高い周波数帯域ほどバンド幅を広く選定している
ものである。すなわち人間の聴覚は、一種のバンドパス
フィルタのような特性を有していて、この各フィルタに
よって分けられたバンドを臨界帯域と呼んでいる。ここ
で、第3図に上記クリティカルバンドを示す。
This band division circuit 13 divides the input digital signal expressed by the amplitude (I!!Am) into a so-called critical band. This critical band is defined by human hearing characteristics (frequency analysis ability). ), for example, 0 to 16kHz is divided into 24 bands, and the higher the frequency band, the wider the bandwidth is selected.In other words, human hearing has characteristics like a kind of bandpass filter. The bands separated by these filters are called critical bands.The critical bands are shown in FIG.

ただし、この第3図では図示を簡略化するため、上記ク
リティカルバンドのバンド数を12バンド(S+〜B 
+z)で表現している。
However, in order to simplify the illustration in FIG. 3, the number of critical bands is 12 (S+ to B
+z).

上記帯域分割回路13でクリティカルバンドに分割され
た各バンド(例えば24バンド)毎の上記振幅値Amは
、各々上記総和検出回路14に伝送される。この総和検
出回路14では、各バンド毎のエネルギ(各バンドでの
スペクトル強度)が、各バンド内のそれぞれの振幅値A
mの総和(振幅値Amのピーク又は平均或いはエネルギ
総和)をとることにより求められる。該総和検出回路1
4の出力すなわち各バンドの総和のスペクトルは、一般
にパークスペクトルと呼ばれ、この各バンドのパークス
ペクトルSBは例えば第4図に示すようになる。
The amplitude value Am for each band (for example, 24 bands) divided into critical bands by the band division circuit 13 is transmitted to the sum detection circuit 14. In this summation detection circuit 14, the energy of each band (spectral intensity in each band) is determined by the amplitude value A of each band.
It is obtained by taking the summation of m (the peak or average of the amplitude value Am or the summation of energy). The sum detection circuit 1
4, that is, the spectrum of the sum of each band is generally called a park spectrum, and the park spectrum SB of each band is as shown in FIG. 4, for example.

ここで、上記パークスペクトルSBのいわゆるマスキン
グに於ける影響を考慮するため、該ハークスペクトルS
Bに所定の重みづけの関数を畳込む(コンボリューショ
ン)。このため、上記総和検出回路14の出力すなわち
該パークスペクトルSBの多値は、フィルタ回路15に
送られる。該フィルタ回路15は、第5図に示すように
、入力端子100からの入力データを順次遅延させる遅
延素子(Z−’) I Ol+、 101z ・・・1
01−z〜101−+・・・・101!3.10124
(クリティカルバンドに対応した例えば24個の遅延素
子)と、これら遅延素子1011〜101□、がらの出
力にフィルタ係数(重みづけの関数)を乗算する例えば
24個の乗算器102..102□・・・弓02い一3
〜102□、・・・・102□s、102□4と、総和
加算器104とから構成されるものである。
Here, in order to consider the influence of the park spectrum SB on so-called masking, the park spectrum S
B is convolved with a predetermined weighting function (convolution). Therefore, the output of the sum detection circuit 14, that is, the multi-value of the park spectrum SB, is sent to the filter circuit 15. As shown in FIG. 5, the filter circuit 15 includes delay elements (Z-') that sequentially delay input data from the input terminal 100.
01-z~101-+...101!3.10124
(for example, 24 delay elements corresponding to the critical band) and 24 multipliers 102. for example, which multiply the outputs of these delay elements 1011 to 101□ by a filter coefficient (weighting function). .. 102□・・・Bow 02-13
102□, . . . 102□s, 102□4, and a total adder 104.

この時、上記乗算器102□3〜102.I。、におい
て、例えば、乗算器102.3でフィルタ係数0、00
00086を、乗算器102.−、でフィルタ係数0.
0019を、乗算器102.1 でフィルタ係数0.1
5を、乗算器1028でフィルタ係数1を、乗算器10
2−−+でフィルタ係数0.4を、更に乗算器1021
゜2でフィルタ係数0,06を乗算し、乗算器102、
、ffでフィルタ係数0.007を各遅延素子の出力に
乗算することにより、上記パークスペクトルSBの畳込
み処理が行われる。この畳込み処理により、第4図中点
線で示す部分の総和がとられる。
At this time, the multipliers 102□3 to 102. I. , for example, the filter coefficients 0, 00 in the multiplier 102.3
00086 to multiplier 102. -, the filter coefficient is 0.
0019, multiplier 102.1 filter coefficient 0.1
5, filter coefficient 1 in multiplier 1028, multiplier 10
2--+ filter coefficient 0.4, and multiplier 1021
Multiply the filter coefficient 0,06 by ゜2, multiplier 102,
, ff is used to multiply the output of each delay element by a filter coefficient of 0.007, thereby performing the convolution process of the park spectrum SB. Through this convolution process, the sum of the parts shown by the dotted line in FIG. 4 is calculated.

なお、上記マスキングとは、人間の聴覚上の特性により
、ある信号によって他の信号がマスクされて間こえなく
なる現象をいうものであり、このマスキング効果には、
時間軸上のオーディオ信号に対するマスキング効果と周
波数軸上の信号に対するマスキング効果とがある。すな
わち、該マスキング効果により、マスキングされる部分
にノイズがあったとしても、このノイズは聞こえないこ
とになる。このため、実際のオーディオ信号では、この
マスキングされる部分内のノイズは許容可能なノイズと
される。
The masking mentioned above refers to a phenomenon in which one signal masks another signal so that it cannot be heard due to the characteristics of human hearing.This masking effect includes:
There are masking effects on audio signals on the time axis and masking effects on signals on the frequency axis. That is, due to the masking effect, even if there is noise in the masked portion, this noise will not be heard. Therefore, in an actual audio signal, noise within this masked portion is considered to be acceptable noise.

その後、上記フィルタ回路15の出力は引算器16に送
られる。該引算器16は、上記畳込んだ領域での後述す
る許容可能なノイズレベルに対応するレベルαを求める
ものである。なお、当該許容可能なノイズレベル(許容
ノイズレベル)に対応するレベルαは、後述するように
、逆コンボリューション処理を行うことによって、クリ
ティカルバンドの各バンド毎の許容ノイズレベルとなる
ようなレベルである。ここで、上記引算器16には、上
記レベルαを求めるための許容関数(マスキングレベル
を表現する関数)が供給される。この許容関数を増減さ
せることで上記レベルαの制御を行っている。当該許容
関数は、後述する関数発生回路29から供給されている
ものである。
Thereafter, the output of the filter circuit 15 is sent to a subtracter 16. The subtracter 16 is used to obtain a level α corresponding to an allowable noise level, which will be described later, in the convolved region. Note that the level α corresponding to the permissible noise level (tolerable noise level) is a level that becomes the permissible noise level for each critical band by performing inverse convolution processing, as described later. be. Here, the subtracter 16 is supplied with a tolerance function (a function expressing the masking level) for determining the level α. The level α is controlled by increasing or decreasing this tolerance function. The permissible function is supplied from a function generation circuit 29, which will be described later.

すなわち、許容ノイズレベルに対応するレベルαは、ク
リティカルバンドのバンドの低域から順に与えられる番
号をiとすると、第(1)式で求めることができる。
In other words, the level α corresponding to the allowable noise level can be determined by equation (1), where i is the number given in order from the low range of the critical band.

α=S−(n−ai)・・・・・・・(1)この第(1
)式において、n、aは定数でa〉0、Sは畳込み処理
されたパークスペクトルの強度であり、第(1)式中(
n−ai)が許容関数となる。本実施例ではn=38.
a=1としており、この時の音質劣化はなく、良好な符
号化が行えた。
α=S-(n-ai) (1) This (1st
), n and a are constants, a>0, S is the intensity of the convolved park spectrum, and in equation (1), (
n-ai) becomes the tolerance function. In this example, n=38.
With a=1, there was no deterioration in sound quality at this time, and good encoding was achieved.

このようにして、上記レベルαが求められ、このデータ
は、割算器17に伝送される。当該割算器17では、上
記畳込みされた領域での上記レベルαを逆コンボリュー
ションするためのものである。したがって、この逆コン
ボリューション処理を行うことにより、上記レベルαか
らマスキングスペクトルが得られるようになる。すなわ
ち、このマスキングスペクトルが許容ノイズスペクトル
となる。なお、上記逆コンポリューシヲン処理は、複雑
な演算を必要とするが、本実施例では簡略化した割算器
17を用いて逆コンボリューション番行っている。
In this way, the level α is determined and this data is transmitted to the divider 17. The divider 17 is for deconvoluting the level α in the convolved area. Therefore, by performing this inverse convolution process, a masking spectrum can be obtained from the level α. That is, this masking spectrum becomes the allowable noise spectrum. The inverse convolution process described above requires complicated calculations, but in this embodiment, a simplified divider 17 is used to perform the inverse convolution process.

次に、上記マスキングスペクトルは、合成回路18を介
して減算器19に伝送される。ここで、当該減算器19
には、上記総和検出回路14の出力すなわち前述した総
和検出回路14からのパークスペクトルSBが、遅延回
路21を介して供給されている。したがって、この減算
器19で上記マスキングスペクトルとパークスペクトル
SBとの減算演算が行われることで、第6図に示すよう
に、上記パークスペクトルSBは、該マスキングスペク
トルMSのレベルで示すレベル以下カマスキングされる
ことになる。
Next, the masking spectrum is transmitted to a subtracter 19 via a synthesis circuit 18. Here, the subtracter 19
The output of the summation detection circuit 14, that is, the park spectrum SB from the summation detection circuit 14 described above is supplied to the delay circuit 21 through a delay circuit 21. Therefore, by performing a subtraction operation between the masking spectrum and the park spectrum SB in the subtracter 19, as shown in FIG. 6, the park spectrum SB is lower than the level indicated by the masking spectrum MS. will be done.

当該減算器19の出力は、ROM20を介して量子化回
路24に供給されており、上記量子化回路24では、こ
の減算器19の出力に応じた割当てビット数で、遅延回
路23を介して供給されている振幅値Amの量子化を行
うことになる。すなわち、換言すれば、当vM R子化
回路24では、上記クリティカルバンドの各バンドのエ
ネルギと上記ノイズレベル設定手段の差のレベルに応じ
て割当てられたビット数で上記各バンドの成分を量子化
することになる。なお、上記遅延回路21は上記合成回
路18以前の各回路での遅延量を劣慮して上記総和検出
回路14からのパークスペクトルSBを遅延させ、上記
遅延回路23は上記ROM20以前の各回路での遅延量
を考慮して上記振幅値Amを遅延させるために設けられ
ている。また、上記ROM20は量子化の際の所定時間
毎の上記減算器19の出力を一時格納して送り出すため
に設けられている。
The output of the subtracter 19 is supplied to the quantization circuit 24 via the ROM 20, and the quantization circuit 24 supplies the output via the delay circuit 23 with the number of allocated bits corresponding to the output of the subtracter 19. The current amplitude value Am will be quantized. That is, in other words, the vMR conversion circuit 24 quantizes the components of each band with the number of bits allocated according to the level of the difference between the energy of each of the critical bands and the noise level setting means. I will do it. The delay circuit 21 delays the park spectrum SB from the summation detection circuit 14 by considering the amount of delay in each circuit before the synthesis circuit 18, and the delay circuit 23 delays the park spectrum SB from each circuit before the ROM 20. The amplitude value Am is provided to delay the amplitude value Am in consideration of the amount of delay. Further, the ROM 20 is provided to temporarily store and send out the output of the subtracter 19 at predetermined time intervals during quantization.

ここで、上記量子化回路24の量子化の際には、前述し
たように、上記量子化回路24の出力情報量を検出し、
該検出出力と目標値の誤差及び各バンドのエネルギに基
づいて、量子化の際の割当てビット数を補正するように
して、所定期間における情報量を一定化するようにして
いる。
Here, when the quantization circuit 24 performs quantization, as described above, the output information amount of the quantization circuit 24 is detected,
Based on the error between the detection output and the target value and the energy of each band, the number of bits allocated during quantization is corrected to keep the amount of information constant in a predetermined period.

このようなことを行うため、本実施例装置においては、
上記パンツアメモリ25からのデータは、データ量演算
回路26によってデータ量が求められた後、誤差検出回
路27に送られる。当該誤差検出回路27では、上記デ
ータ量と端子3からの所定の目標値(ビットレートl整
のためのビットレートの目標値)との誤差が検出され、
その誤差データは補正値決定回路28に伝送される。ま
た、この補正値決定回路2日には、単位ブロックのデー
タをメモリするメモリ33を介した総和検出回路14の
出力(エネルギ、スペクトル強度)も供給されている。
In order to do this, in the device of this embodiment,
The data from the panzer memory 25 is sent to the error detection circuit 27 after the data amount is calculated by the data amount calculation circuit 26. The error detection circuit 27 detects an error between the amount of data and a predetermined target value from the terminal 3 (target value of bit rate for adjusting bit rate l),
The error data is transmitted to the correction value determining circuit 28. The correction value determination circuit 2 is also supplied with the output (energy, spectral intensity) of the summation detection circuit 14 via the memory 33 that stores unit block data.

当該補正値決定回路28は、上記誤差データが正であれ
ばエネルギの大きい帯域により多くの補正値を与え、逆
に、上記誤差データが負であればエネルギの大きい帯域
に小さな補正値を与えるようにするものである。このよ
うな補正値が、ビット数補正回路31に伝送される。こ
のビット数補正回路31で、上記ROM20の出力を上
記補正値で補正することで、量子化の際の割当てビット
数の補正(ビットレートの調整)が行われることになり
、所定期間としての単位時間ブロックにおける情報量を
一定化するようになる。
The correction value determining circuit 28 applies a larger correction value to a band with high energy if the error data is positive, and, conversely, gives a small correction value to a band with high energy if the error data is negative. It is something to do. Such a correction value is transmitted to the bit number correction circuit 31. This bit number correction circuit 31 corrects the output of the ROM 20 with the correction value, thereby correcting the number of allocated bits during quantization (adjusting the bit rate), and The amount of information in a time block becomes constant.

このようなことから、エネルギ大の帯域では多くのビッ
ト数で量子化を行うことになり、エネルギ小の帯域では
少ないビット数で量子化を行うことになる。ここで、当
該ビット数補正回路31の出力は、四捨五入回路32を
介して上記量子化回路24に供給されているため、ビッ
ト数の細かな変化が矯正されている。
For this reason, in bands with high energy, quantization is performed with a large number of bits, and in bands with low energy, quantization is performed with a small number of bits. Here, since the output of the bit number correction circuit 31 is supplied to the quantization circuit 24 via the rounding circuit 32, small changes in the bit number are corrected.

なお、上述した合成回路18での合成の際には、最小可
聴カーブ発生回路22から供給される第7図に示すよう
な人間の聴覚特性であるいわゆる最小可聴カーブ(等ラ
ウドネス曲線)RCを示すデータと、上記マスキングス
ペクトルMSとを合成することができる。したがって、
この最小可聴カーブRCとマスキングスペクトルMSと
を共に合成することで、許容ノイズレベルは図中斜線で
示す部分までとすることができるようになり、量子化の
際に図中斜線で示す部分の割当てビット数を凍らすこと
ができるようになる。なお、この第7図は、前述の第3
図に示したクリティカルバンドで表されており、信号ス
ペクトルSSも同時に示している。
In addition, during the synthesis in the above-mentioned synthesis circuit 18, the so-called minimum audible curve (equal loudness curve) RC, which is the human auditory characteristic as shown in FIG. 7, is supplied from the minimum audible curve generation circuit 22. The data and the masking spectrum MS can be combined. therefore,
By combining this minimum audible curve RC and the masking spectrum MS, the allowable noise level can be reduced up to the shaded area in the figure, and when quantizing, the allocation of the shaded area in the figure It becomes possible to freeze the number of bits. Note that this figure 7 is similar to the above-mentioned figure 3.
It is represented by the critical band shown in the figure, and the signal spectrum SS is also shown at the same time.

ただし、本実施例においては、上述した最小可聴カーブ
の合成処理を行わない構成とすることもできる。すなわ
ち、この場合には、最小可聴カーブ発生回路222合成
回路18が不要となり、上記引算器16からの出力は、
割算器17で逆コンボリューションされた後、すぐに減
算器19に伝送されることになる。
However, in this embodiment, it is also possible to adopt a configuration in which the above-described minimum audible curve synthesis process is not performed. That is, in this case, the minimum audible curve generation circuit 222 and the synthesis circuit 18 are unnecessary, and the output from the subtracter 16 is as follows.
After being deconvolved in the divider 17, it is immediately transmitted to the subtracter 19.

すなわち、本実施例のディジクル信号符号化装置におい
ては、オーディオ信号を符号化する際に、上述したよう
にビットレートjJil整を行い、ノイズスペクトルの
形状が変化しないので、ビット数を凍らした場合でも、
聴感上の劣化が少なくてすむことになる。特に、トーン
性のあるソースであっても劣化の少ない信号符号化を行
うことが可能となる。またビットレート調整のアルゴリ
ズムが容易なのでハードウェアを簡単に構成することが
できる。
That is, in the digital signal encoding device of this embodiment, when encoding an audio signal, the bit rate is adjusted as described above, and the shape of the noise spectrum does not change, so even if the number of bits is frozen. ,
This results in less auditory deterioration. In particular, it becomes possible to perform signal encoding with little deterioration even for a source with tonal characteristics. Furthermore, since the bit rate adjustment algorithm is simple, the hardware can be configured easily.

本発明は、上述した第1図の実施例のように、入力ディ
ジタル信号を高速フーリエ変換して処理するいわゆる適
応変換符号化の他に、例えば、帯域分割符号化(SBC
)を行う装置にも適用することができる。この場合は、
信号をバンドバスフィルタ等で帯域骨i1Lで、この各
チャンネルに割り当てるビット数を、量子化手段の出力
情報量の検出出力と目標値の誤差及び各バンドのエネル
ギに基づいて、増減させるものとなる。当該帯域分割符
号化の場合も上述同様の効果を得ることができる。
In addition to so-called adaptive transform coding in which an input digital signal is processed by performing fast Fourier transform as in the embodiment shown in FIG.
) can also be applied to devices that perform in this case,
The signal is filtered using a bandpass filter or the like in the band i1L, and the number of bits allocated to each channel is increased or decreased based on the error between the detected output of the output information amount of the quantization means and the target value, and the energy of each band. . In the case of the band division encoding, the same effects as described above can be obtained.

〔発明の効果〕〔Effect of the invention〕

本発明のディジタル信号符号化装置においては、量子化
後の出力情報量を検出し、この検出出力と目標値の誤差
及び各バンドのエネルギに基づいて、量子化の際の割当
てビット数を補正するようにして、所定期間における情
報債を一定化するようにしたことにより、簡単な構成の
装置で、信号の劣化の目立たないビットレート調整(ビ
ットバンキング)を行うことが可能となる。特に、トー
ン性のあるソースであっても劣化の少ない信号符号化を
行うことが可能となる。したがって、聴感上のS/N劣
化を少なくすることができるようになる。
In the digital signal encoding device of the present invention, the amount of output information after quantization is detected, and the number of bits allocated during quantization is corrected based on the error between the detected output and the target value and the energy of each band. By making the information bond constant over a predetermined period in this manner, it becomes possible to perform bit rate adjustment (bit banking) with a device of simple configuration in which signal deterioration is not noticeable. In particular, it becomes possible to perform signal encoding with little deterioration even for a source with tonal characteristics. Therefore, it becomes possible to reduce the auditory S/N deterioration.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例のディジタル信号符号化装置
の概略構成を示すブロック回路図、第2図Aはビットレ
ート調整をする前のノイズスペクトルを示す特性図、第
2図Bはビットレート調整(ビット数余りの場合)後の
ノイズスペクトルを示す特性図、第2図Cはビットレー
ト調整(ビット数不足の場合)後のノイズスペクトルを
示す特性図、第3図はクリティカルバントを示す図、第
4図はパークスペクトルを示す図、第5図はフィルタ回
路を示す回路図、第6図はマスキングスペクトルを示す
図、第7図は最小可聴カーブ、マスキングスペクトルを
合成した図、第8図はビットレート調整のための機能ブ
ロック図である。 11・・・・・・・・高速フーリエ変換回路12・・・
・・・・・振幅位相情報発生回路3・・・・・・・・帯
域分割回路 4・・・・・・・・総和検出回路 5・・・・・・・・フィルタ回路 6・・・・・・・・引算器 7・・・・・・・・割算器 8・・・・・・・・合成回路 9・・・・・・・・減算器 O・・・・・・・・ROM ■、23・・遅延回路 2・・・・・・・・最小可聴カーブ発生回路4・・・・
・・・・型子化回路 5・・・・・・・・バッファメモリ 6・・・・・・・・データ量演算回路 7・・・・・・・・誤差検出回路 8・・・・・・・・補正値決定回路 9・・・・・・・・関数発生回路 1・・・・・・・・ビット数補正回路 2・・・・・・・・四捨五入回路 3・・・・・・・・メモリ
FIG. 1 is a block circuit diagram showing a schematic configuration of a digital signal encoding device according to an embodiment of the present invention, FIG. 2A is a characteristic diagram showing a noise spectrum before bit rate adjustment, and FIG. 2B is a bit A characteristic diagram showing the noise spectrum after rate adjustment (in the case of excess bits), Figure 2C is a characteristic diagram showing the noise spectrum after bit rate adjustment (in the case of insufficient bits), and Figure 3 shows the critical bunt. Figure 4 is a diagram showing the park spectrum, Figure 5 is a circuit diagram showing the filter circuit, Figure 6 is a diagram showing the masking spectrum, Figure 7 is the minimum audible curve and a diagram combining the masking spectrum, Figure 8 The figure is a functional block diagram for bit rate adjustment. 11... Fast Fourier transform circuit 12...
...... Amplitude phase information generation circuit 3 ...... Band division circuit 4 ...... Sum detection circuit 5 ...... Filter circuit 6 ... ...Subtractor 7...Divider 8...Synthesizing circuit 9...Subtractor O... ROM ■, 23...Delay circuit 2...Minimum audible curve generation circuit 4...
...Style generation circuit 5 ...Buffer memory 6 ...Data amount calculation circuit 7 ...Error detection circuit 8 ... ...Correction value determination circuit 9 ...Function generation circuit 1 ...Bit number correction circuit 2 ...Rounding circuit 3 ... ··memory

Claims (1)

【特許請求の範囲】 入力ディジタル信号を複数の周波数帯域に分割すると共
に、高い周波数帯域ほどバンド幅を広く選定し、当該各
バンド毎のエネルギに基づいて各バンド単位の許容ノイ
ズレベルを設定するノイズレベル設定手段と、 上記各バンドのエネルギと上記ノイズレベル設定手段の
差のレベルに応じたビット数で上記各バンドの成分を量
子化する量子化手段とを有するディジタル信号符号化装
置において、 上記量子化手段の出力情報量を検出し、該検出出力と目
標値の誤差及び上記各バンドのエネルギに基づいて、上
記量子化手段の割当てビット数を補正するようにして、
所定期間における情報量を一定化するようにしたことを
特徴とするディジタル信号符号化装置。
[Claims] A noise generating device that divides an input digital signal into a plurality of frequency bands, selects a wider band width for higher frequency bands, and sets an allowable noise level for each band based on the energy of each band. A digital signal encoding device comprising: a level setting means; and a quantization means for quantizing the components of each band with a number of bits corresponding to the level of the difference between the energy of each band and the noise level setting means, detecting the output information amount of the quantizing means, and correcting the number of bits allocated to the quantizing means based on the error between the detected output and the target value and the energy of each band;
A digital signal encoding device characterized in that the amount of information in a predetermined period is made constant.
JP25579989A 1989-09-30 1989-09-30 Digital signal encoding method Expired - Lifetime JP2913695B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25579989A JP2913695B2 (en) 1989-09-30 1989-09-30 Digital signal encoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25579989A JP2913695B2 (en) 1989-09-30 1989-09-30 Digital signal encoding method

Publications (2)

Publication Number Publication Date
JPH03117920A true JPH03117920A (en) 1991-05-20
JP2913695B2 JP2913695B2 (en) 1999-06-28

Family

ID=17283796

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25579989A Expired - Lifetime JP2913695B2 (en) 1989-09-30 1989-09-30 Digital signal encoding method

Country Status (1)

Country Link
JP (1) JP2913695B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06291679A (en) * 1992-09-11 1994-10-18 Matsushita Electric Ind Co Ltd Threshold value control quantization determining method for audio signal

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06291679A (en) * 1992-09-11 1994-10-18 Matsushita Electric Ind Co Ltd Threshold value control quantization determining method for audio signal

Also Published As

Publication number Publication date
JP2913695B2 (en) 1999-06-28

Similar Documents

Publication Publication Date Title
US5151941A (en) Digital signal encoding apparatus
US5490170A (en) Coding apparatus for digital signal
US5157760A (en) Digital signal encoding with quantizing based on masking from multiple frequency bands
US5268685A (en) Apparatus with transient-dependent bit allocation for compressing a digital signal
US5264846A (en) Coding apparatus for digital signal
KR100293855B1 (en) High efficiency digital data encoding and decoding device
RU2090973C1 (en) Signal coding method
EP0575110B1 (en) Compressing and expanding digital signals
JPH0435123A (en) Digital signal encoder
JPH04104617A (en) Digital signal coder
JP3041967B2 (en) Digital signal coding device
JPH03117920A (en) Digital signal encoding device
JP2913696B2 (en) Digital signal encoding method
JP3291948B2 (en) High-efficiency encoding method and apparatus, and transmission medium
JP3089692B2 (en) Highly efficient digital data encoding method.
JP3089691B2 (en) Highly efficient digital data encoding method.
JP3070123B2 (en) Digital signal encoding apparatus and method
JP2797524B2 (en) Digital signal encoding method
JP3033157B2 (en) Digital signal coding device
JP3060578B2 (en) Digital signal encoding method
JP3060577B2 (en) Digital signal encoding method
JP3060576B2 (en) Digital signal encoding method
JP3134335B2 (en) Digital signal encoding method and digital signal decoding device
JP3132031B2 (en) High-efficiency coding of digital signals.
JPH04302538A (en) Digital signal encoding device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080416

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090416

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090416

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100416

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100416

Year of fee payment: 11