JP3408140B2 - Information encoding method - Google Patents

Information encoding method

Info

Publication number
JP3408140B2
JP3408140B2 JP05949798A JP5949798A JP3408140B2 JP 3408140 B2 JP3408140 B2 JP 3408140B2 JP 05949798 A JP05949798 A JP 05949798A JP 5949798 A JP5949798 A JP 5949798A JP 3408140 B2 JP3408140 B2 JP 3408140B2
Authority
JP
Japan
Prior art keywords
encoding method
data
transmission amount
information encoding
smr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP05949798A
Other languages
Japanese (ja)
Other versions
JPH11261421A (en
Inventor
正人 夫馬
実幸 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP05949798A priority Critical patent/JP3408140B2/en
Publication of JPH11261421A publication Critical patent/JPH11261421A/en
Application granted granted Critical
Publication of JP3408140B2 publication Critical patent/JP3408140B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】この発明は情報符号化方法に
関し、特に、MDやDCCなどの記録媒体に情報を符号
化して書込むための情報符号化方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an information encoding method, and more particularly to an information encoding method for encoding and writing information on a recording medium such as MD or DCC.

【0002】[0002]

【従来の技術】図10はミニディスクシステムの構成を
示すブロック図である。図10を参照して、ミニディス
クシステムの主要な構成について説明する。ミニディス
ク1はカートリッジ2に収納されており、再生時には光
学ピックアップ3から読出された信号がRFアンプ4に
入力されてRF信号となる。ディスクに埋込まれたAD
IP信号はアドレスデコーダ5によってデコードされ、
サーボ制御のために使用される。RF信号はEFM/C
IRC/エンコーダ/デコーダ6,ショックプルーフメ
モリコントローラ7および音声圧縮ATRACエンコー
ダ/デコーダ8によってディジタル処理され、D/Aコ
ンバータ9によってアナログ信号に変換されてオーディ
オ信号が出力される。
2. Description of the Related Art FIG. 10 is a block diagram showing the structure of a mini disk system. The main configuration of the mini disk system will be described with reference to FIG. The mini disk 1 is housed in the cartridge 2, and the signal read from the optical pickup 3 is input to the RF amplifier 4 and becomes an RF signal during reproduction. AD embedded in disc
The IP signal is decoded by the address decoder 5,
Used for servo control. RF signal is EFM / C
The IRC / encoder / decoder 6, the shock proof memory controller 7 and the audio compression ATRAC encoder / decoder 8 perform digital processing, and the D / A converter 9 converts the digital processing into an analog signal to output an audio signal.

【0003】一方、録音時には、オーディオ入力信号が
A/Dコンバータ10によって量子化され、再生時と逆
の経路でディジタル処理される。その後、ヘッド駆動回
路11によって記録ヘッド12が駆動されてオーディオ
信号が磁界変調され、ディスク上に記録される。
On the other hand, at the time of recording, the audio input signal is quantized by the A / D converter 10 and digitally processed in the route opposite to that at the time of reproduction. After that, the recording head 12 is driven by the head drive circuit 11 so that the audio signal is magnetically modulated and recorded on the disk.

【0004】図11は図10に示した音声圧縮ATRA
Cエンコーダ/デコーダ8のうちのエンコーダ部分を示
すブロック図である。図11において、ATRAC(Ad
aptive TRansform Acoustic Coding)エンコーダは、M
Dシステムに採用される高能率圧縮方式であり、時間軸
データを直交変換により周波数軸データ、すなわちスペ
クトルデータに変換し、そのスペクトルデータを振り分
けてビットアロケーションしていく方式である。
FIG. 11 shows the voice compression ATRA shown in FIG.
3 is a block diagram showing an encoder portion of a C encoder / decoder 8. FIG. In FIG. 11, ATRAC (Ad
aptive TRansform Acoustic Coding) encoder is M
This is a high-efficiency compression method adopted in the D system, and is a method in which time-axis data is converted into frequency-axis data, that is, spectrum data by orthogonal transformation, and the spectrum data is distributed and bit-allocated.

【0005】再生されたオーディオ信号は帯域分割フィ
ルタ(QMF)81に入力されて2分割される。分割さ
れた一方の帯域のオーディオ信号は帯域分割フィルタ8
2によってさらに2帯域に分割され、元のオーディオ信
号は低域,中域,高域の3帯域に分割される。なお、帯
域分割フィルタ81で分割された他方の帯域のオーディ
オ信号は帯域分割フィルタ82の遅延量だけディレイ8
3によって遅延される。
The reproduced audio signal is input to a band division filter (QMF) 81 and divided into two. The divided audio signal of one band is a band division filter 8
It is further divided into two bands by 2, and the original audio signal is divided into three bands of low band, middle band and high band. The audio signal of the other band divided by the band division filter 81 is delayed by the delay amount of the band division filter 82.
Delayed by 3.

【0006】分割されたオーディオ信号はMDCT8
4,85,86によって改良離散コサイン変換されて時
系列のデータが周波数スペクトルデータに変換される。
変換された各帯域の周波数スペクトルデータはビットア
ロケーション+量子化回路90に入力される。
The divided audio signal is MDCT8
4,85,86 perform the improved discrete cosine transform to transform the time series data into frequency spectrum data.
The converted frequency spectrum data of each band is input to the bit allocation + quantization circuit 90.

【0007】前述の3帯域に分割されたオーディオ信号
はブロックサイズ選択回路87,88,89に入力され
て各帯域ごとのブロックサイズが決定されて聴覚心理分
析回路91に与えられる。聴覚心理分析回路91は可聴
外のデータを抽出し、ビットアロケーション+量子化回
路90でオーディオデータを量子化する際に可聴外のデ
ータを選択的に削除することによって伝送量を圧縮す
る。
The audio signal divided into the above-mentioned three bands is input to block size selection circuits 87, 88 and 89, the block size for each band is determined and given to the psychoacoustic analysis circuit 91. The psychoacoustic analysis circuit 91 extracts the non-audible data, and compresses the transmission amount by selectively deleting the non-audible data when the audio data is quantized by the bit allocation + quantization circuit 90.

【0008】ビットアロケーション+量子化回路90は
各帯域のスペクトルデータを聴覚心理分析回路91の聴
覚分析処理に基づいてアロケーションを行ない、各々処
理バンド幅で最適なビット数で正規化を行なってフォー
マッティングを決定し、多重化回路92に出力する。ま
た、聴覚心理分析回路91には、MDCT84,85,
86から低域,中域,高域の3帯域のスペクトルデータ
が与えられている。そして、聴覚心理分析回路91から
量子化ビット数であるワードレングスと正規化スケール
であるスケールファクタとが多重化回路92に与えられ
る。多重化回路92は多重化されたビットストリームを
出力する。
The bit allocation + quantization circuit 90 allocates the spectrum data of each band based on the auditory analysis processing of the psychoacoustic analysis circuit 91, performs normalization with the optimum number of bits in each processing bandwidth, and performs formatting. It is determined and output to the multiplexing circuit 92. Further, the psychoacoustic analysis circuit 91 includes MDCTs 84, 85,
From 86, spectral data of three bands of low band, middle band, and high band are given. Then, the psychoacoustic analysis circuit 91 gives the word length, which is the number of quantization bits, and the scale factor, which is the normalization scale, to the multiplexing circuit 92. The multiplexing circuit 92 outputs the multiplexed bit stream.

【0009】図12は図11に示した音声圧縮ATRA
Cエンコーダ/デコーダによる帯域分割とMDCTとの
関係を示す図である。0〜fs/2のオーディオデータ
は、図11の帯域分割フィルタ81,82によって0〜
fs/8の低域と、fs/8〜fs/4の中域と、fs
/4〜fs/2の高域に分割され、それぞれ128/1
28/256のスペクトルとなり、全帯域で512サン
プルとして表わされている。したがって、周波数分解能
は43Hzとなる。
FIG. 12 shows the voice compression ATRA shown in FIG.
It is a figure which shows the relationship between the band division by C encoder / decoder, and MDCT. The audio data of 0 to fs / 2 is 0 to 0 by the band division filters 81 and 82 in FIG.
Low range of fs / 8, mid range of fs / 8 to fs / 4, fs
Divided into high frequencies from / 4 to fs / 2, 128/1 each
The spectrum is 28/256, which is represented as 512 samples in the entire band. Therefore, the frequency resolution is 43 Hz.

【0010】また、このスペクトルデータは、ブロック
サイズ選択回路87,88,89によって図12に示す
ように、256/32,128/32,128/32に
分割されて示されている。
The spectrum data is divided into 256/32, 128/32 and 128/32 by the block size selection circuits 87, 88 and 89, as shown in FIG.

【0011】図13はATRACエンコーダに入力され
る時系列の音声信号を示す図であり、図14は図13に
示した音声信号を図11のQMF81,82によって帯
域分割し、MDCT84〜86によって変換された周波
数スペクトルデータを示す図であり、スペクトルの本数
はラフに示されている。図15はビットアロケーション
+量子化回路90によってスペクトルデータからエネル
ギ量を求めたシグナルレベルを示す図であり、図16は
マスキング計算を説明するための図である。
FIG. 13 is a diagram showing a time-series audio signal input to the ATRAC encoder, and FIG. 14 is a diagram showing that the audio signal shown in FIG. 13 is band-divided by the QMFs 81 and 82 of FIG. 11 and converted by the MDCTs 84 to 86. It is a figure which shows the frequency spectrum data produced, and the number of spectra is roughly shown. FIG. 15 is a diagram showing a signal level in which the amount of energy is obtained from spectrum data by the bit allocation + quantization circuit 90, and FIG. 16 is a diagram for explaining masking calculation.

【0012】聴覚心理分析回路91は聴覚心理分析処理
を行なう。聴覚心理では、マスキング効果と最小可聴特
性が考慮される。マスキング効果は図16のaに示すよ
うにある大きな音のスペクトルのまわりの斜線に示すス
ペクトルが大きな音にマスキングされて認識できないエ
リアが発生することをいう。図15に示すシグナルレベ
ルから図16のaに示すスペクトルが他のスペクトルに
及ぼすレベルの和を求めてマスキング計算を行なうこと
によって、図17に示すトータルマスキング量が決定さ
れる。
The psychoacoustic analysis circuit 91 performs a psychoacoustic analysis process. Auditory psychology takes into account masking effects and minimum audible characteristics. The masking effect means that an unrecognizable area occurs because the spectrum shown by the diagonal lines around the spectrum of a certain loud sound is masked by the loud sound as shown in FIG. The total masking amount shown in FIG. 17 is determined by calculating the sum of the levels of the spectrum shown in FIG. 16A affecting other spectra from the signal level shown in FIG. 15 and performing masking calculation.

【0013】図18は最小可聴特性カーブを示す図であ
る。最小可聴特性は、最小可聴限以下の音は可聴できな
いことを示す特性であり、4kHz付近で一番感度が良
くなり、高域と低域は感度が悪くなる。このため、1k
Hz〜5kHzの帯域ではSN比を大きくし、低域と高
域はそれに比べてSN比を落としても問題がないことに
なる。
FIG. 18 is a diagram showing a minimum audible characteristic curve. The minimum audible characteristic is a characteristic indicating that a sound below the minimum audible limit cannot be heard, and the sensitivity is highest around 4 kHz, and the sensitivity is low in the high and low frequencies. Therefore, 1k
There is no problem even if the SN ratio is increased in the band of Hz to 5 kHz and the SN ratio is lowered in the low band and the high band compared to that.

【0014】そこで、ビットアロケーション+量子化回
路90によって図15に示すシグナルレベルから図17
に示すトータルマスク量と図18に示した最大可聴特性
による最小可聴限以下のスペクトルが間引かれる。その
状態を図19に示す。
Therefore, the bit allocation + quantization circuit 90 converts the signal level shown in FIG.
The total mask amount shown in and the spectrum below the minimum audible limit due to the maximum audible characteristic shown in FIG. 18 are thinned out. The state is shown in FIG.

【0015】図19に示すシグナルレベルとマスクされ
るレベルとの比をSMR(Signal to Mask Ratio)と称
する。このSMRを正規化するために、聴覚心理分析回
路91から正規化するためのスケールとなるスケールフ
ァクタと、量子化ビット数であるワードレングスが多重
化回路92に与えられる。
The ratio between the signal level and the masked level shown in FIG. 19 is called SMR (Signal to Mask Ratio). In order to normalize this SMR, a scale factor serving as a scale for normalization and a word length that is the number of quantization bits are given to the multiplexing circuit 92 from the psychoacoustic analysis circuit 91.

【0016】SMRが何dBのときにワードレングスが
何ビットになるかは予め決められており、従来はたとえ
ばSMRが12〜18dBではワードレングスが2ビッ
トに割り付けられ、6dB以下では0ビットが割り付け
られていた。
The number of bits of the word length when the SMR is dB is predetermined, and conventionally, for example, when the SMR is 12 to 18 dB, the word length is assigned to 2 bits, and when the SMR is 6 dB or less, 0 bit is assigned. It was being done.

【0017】[0017]

【発明が解決しようとする課題】上述のごとく、アロケ
ーションに際して情報量の圧縮効果が大きいために、S
MRの非常に低いレベルの信号に対して0ビットが割り
付けられると、スペクトルデータがなくなってしまい、
周波数方向のスペクトルの連続性がなくなってしまい、
音質に問題を生じてしまうという欠点があった。
As described above, since the effect of compressing the amount of information at the time of allocation is great, S
When 0 bit is assigned to a signal of very low level of MR, spectrum data is lost,
The continuity of the spectrum in the frequency direction is lost,
There was a drawback that it caused a problem in sound quality.

【0018】それゆえに、この発明の主たる目的は、上
述のような問題に鑑みてなされたものであり、周波数方
向のスペクトルの連続性を確保できるような情報符号化
方法を提供することである。
Therefore, a main object of the present invention is to provide an information coding method capable of ensuring the continuity of spectrum in the frequency direction, in view of the above problems.

【0019】[0019]

【課題を解決するための手段】請求項1に係る発明は、
アナログデータを周波数データに変換し、この変換され
た所定の処理バンド幅内のスペクトルデータをエネルギ
換算してシグナルレベルを算定し、所定のマスキングレ
ベルに対する前記シグナルレベルの相対比に応じて当該
処理バンド内の量子化ビット数を所定の線形規則に従っ
て割付ける情報符号化方法であって、前記線形規則に従
えば割付ビット数がゼロとなる相対比領域に対しても、
前記線形規則に従って割付けられる最小の量子化ビット
数を強制的に割付けることを特徴とする。
The invention according to claim 1 is
The analog data is converted into frequency data, the converted spectrum data within the predetermined processing bandwidth is converted into energy to calculate the signal level, and the processing band is calculated according to the relative ratio of the signal level to the predetermined masking level. Is an information encoding method for allocating the number of quantized bits in accordance with a predetermined linear rule, and according to the linear rule, even for a relative ratio area in which the number of allocated bits is zero,
It is characterized in that the minimum number of quantization bits assigned according to the linear rule is forcibly assigned.

【0020】請求項2に係る発明は、請求項1におい
て、前記強制的に量子化ビット数を割付ける相対比領域
は、線形規則により限界とされる相対比とゼロデシベル
との中間までであることを特徴とする。
According to a second aspect of the present invention, in the first aspect, the relative ratio area for forcibly allocating the number of quantization bits is up to the middle of the relative ratio and the zero decibel which is the limit by the linear rule. It is characterized by

【0021】請求項3に係る発明は、請求項1または請
求項2において、前記アナログデータは音声データであ
って、前記マスキングレベルは人の聞こえ方によって設
定されるものであることを特徴とする。
According to a third aspect of the present invention, in the first or second aspect, the analog data is voice data, and the masking level is set according to how a person hears. .

【0022】請求項4に係る発明は、請求項3におい
て、前記符号化されたデータはミニディスクに記録され
るものであり、マスキングはスペクトル間の相関関係に
起因するマスキング効果と人の耳の最小可聴特性とを組
合せたものであることを特徴とする。
According to a fourth aspect of the present invention, in the third aspect, the coded data is recorded on a mini disc, and the masking is a masking effect caused by a correlation between spectra and a human ear. It is characterized by being combined with a minimum audible characteristic.

【0023】[0023]

【0024】[0024]

【0025】[0025]

【発明の実施の形態】図1はこの発明の一実施形態の動
作を説明するためのフローチャートであり、図2は図1
における伝送量調整動作を説明するためのフローチャー
トである。
1 is a flow chart for explaining the operation of an embodiment of the present invention, and FIG.
5 is a flowchart for explaining a transmission amount adjustment operation in FIG.

【0026】これらの図1および図2に示したフローチ
ャートによる処理は前述の図11に示したビットアロケ
ーション+量子化回路90によって実行される。すなわ
ち、ビットアロケーション+量子化回路90によってS
MRが正規化されて最適な伝送量が決定される。また、
前述の図14に示した各スペクトルデータからシグナル
レベルが計算される。このシグナルレベル計算では、ス
ペクトルデータをSとすると、スペクトルを次式で求め
ることによって、図15に示すようにエネルギ量で表わ
されたシグナルレベルが求められる。
The processes according to the flowcharts shown in FIGS. 1 and 2 are executed by the bit allocation + quantization circuit 90 shown in FIG. That is, the bit allocation + quantization circuit 90 causes S
The MR is normalized to determine the optimum transmission amount. Also,
The signal level is calculated from each spectrum data shown in FIG. In this signal level calculation, assuming that the spectrum data is S, the spectrum is obtained by the following equation, and thus the signal level represented by the energy amount is obtained as shown in FIG.

【0027】ΣS*S次に、マスキングレベルが計算さ
れる。マスキングレベルの計算は、前述の図16に示し
たように各スペクトルが他のスペクトルに及ぼすレベル
の和を求めることにより、全帯域に対するマスキングレ
ベルを計算できる。具体的には、クリティカルバンド単
位で他のクリティカルバンドからマスキングを受けるレ
ベルと、クリティカルバンドのマスキングレベルの総和
が求められ、前述の図17に示すマスキング量が求めら
れる。
ΣS * S Next, the masking level is calculated. The masking level can be calculated by calculating the sum of the levels that each spectrum exerts on other spectra as shown in FIG. Specifically, the sum of the masking level of the critical band and the level of masking from other critical bands in the critical band unit is calculated, and the masking amount shown in FIG. 17 is calculated.

【0028】最小可聴特性は、予め設定される。そし
て、最小可聴特性と計算されたマスキング量によってト
ータルマスキング計算が行なわれ、シグナルレベルから
トータルマスキングレベルが減算されてSMRが計算さ
れる。すなわち、図19に示す白抜きの部分が求められ
る。求められたSMRに対してビットアロケーションが
行なわれる。
The minimum audible characteristic is preset. Then, the total masking calculation is performed by the minimum audible characteristic and the calculated masking amount, and the SMR is calculated by subtracting the total masking level from the signal level. That is, the white part shown in FIG. 19 is obtained. Bit allocation is performed on the obtained SMR.

【0029】図3はワードレングスと量子化ビット数と
の関係を示す図であり、図4はSMRとワードレングス
との関係を示す図である。
FIG. 3 is a diagram showing the relationship between the word length and the number of quantization bits, and FIG. 4 is a diagram showing the relationship between the SMR and the word length.

【0030】ビットアロケーションでは、図3および図
4に示すように、SMRが何dBであるかによってワー
ドレングスWLのビット数が割当てられて伝送量が計算
される。
In the bit allocation, as shown in FIGS. 3 and 4, the number of bits of the word length WL is assigned according to how many dB the SMR is, and the transmission amount is calculated.

【0031】従来、前述の如くSMRをワードレングス
に割りつける際、SMRが12〜18dBではワードレ
ングスが2ビットに割りつけられ、12dB以下では0
ビットが割りつけられていた。これは、±の符号を表わ
すビットが必要なために最小の割付ビットが2ビットと
なり、よって図4に示すビット割付の線形的な規則に従
えば、最小のSMRが12dBまでとなるためである。
このように、アロケーションに際して情報量の圧縮効果
が大きいために、SMRの非常に低いレベルの信号に対
して0ビットが割りつけられると、スペクトルデータが
なくなってしまい、周波数方向のスペクトルの連続性や
必要な倍音成分がなくなってしまい、音質に問題を生じ
てしまう。
Conventionally, when the SMR is allocated to the word length as described above, the word length is allocated to 2 bits when the SMR is 12 to 18 dB and 0 when the SMR is 12 dB or less.
Bits were allocated. This is because the minimum allocated bit is 2 bits because the bit representing the sign of ± is required, and therefore the minimum SMR is up to 12 dB according to the linear rule of the bit allocation shown in FIG. .
In this way, since the effect of compressing the amount of information at the time of allocation is large, if 0 bit is allocated to a signal having a very low SMR level, the spectrum data will be lost, and the continuity of spectrum in the frequency direction and The necessary overtone component is lost, causing a problem in sound quality.

【0032】そこで、この発明の一実施形態では、図4
に示すように、SMRが6dB〜12dBのように低い
レベルの信号に対しても2ビットが割りつけられ、周波
数方向のスペクトルの連続性や倍音成分を確保して音質
が良好にされる。ただし、SMRがゼロの近傍になるま
で量子化ビットを割当てると、不要なノイズ音を拾い、
または音のバランスが悪化したりして、かえって耳障り
な音となってしまう。実験によれば、SMRが6程度ま
で量子化ビットを割当てると音質の改善効果は大きい
が、これよりも小さなSMRまで割当てると、ノイズ音
が気になってくる。前述の伝送量計算が適切でなけれ
ば、2分法が用いられてSMRの補正が行なわれる。
Therefore, in one embodiment of the present invention, FIG.
As shown in (2), 2 bits are allocated even to a signal with a low level such as SMR of 6 dB to 12 dB, and the continuity of the spectrum in the frequency direction and the overtone component are ensured to improve the sound quality. However, if the quantized bits are allocated until the SMR becomes close to zero, unwanted noise sounds are picked up,
Or, the sound balance may be deteriorated, which may result in an offensive sound. According to the experiment, if the quantized bits are assigned up to SMR of about 6, the effect of improving the sound quality is great, but if the SMR smaller than this is assigned, noise sound becomes a concern. If the above-mentioned transmission amount calculation is not appropriate, the bisection method is used to correct the SMR.

【0033】図5はSMR調整ツリーを示し、図6およ
び図7は2分法により伝送量を最適値に近づける様子を
示している。この実施形態では、128dBの調整が可
能なように最初のステップの調整値を32dBとし、ま
た、微調整のために±0.5dBのステップを設けてい
る。この微調整時の値は、パラメータなどの精度から求
められる。この2分法で伝送量を調整したときに、7ス
テップ目で収束した例を図6に示し、8ステップ目で収
束した例を図7に示す。
FIG. 5 shows an SMR adjustment tree, and FIGS. 6 and 7 show how the transmission amount is brought close to the optimum value by the bisection method. In this embodiment, the adjustment value of the first step is set to 32 dB so that the adjustment of 128 dB is possible, and a step of ± 0.5 dB is provided for fine adjustment. The value at the time of this fine adjustment is obtained from the accuracy of parameters and the like. FIG. 6 shows an example where the transmission amount is adjusted by the bisection method, and the example where the transmission amount is converged at the 7th step is shown in FIG.

【0034】図5のSMR調整ツリーが示すように、3
2dBから0.5dBへ2分されるステップは7ステッ
プである。図6に示すように、7ステップ目の処理後、
伝送量以下になっていれば調整を終了できるが、図7に
示すように7ステップ目の処理後、伝送量が以下になっ
ていない場合がある。この場合は、補正ステップとして
もう1ステップ設けて調整が行なわれる。
As shown in the SMR adjustment tree of FIG.
The number of steps to be divided into 2 from 2 dB to 0.5 dB is 7 steps. As shown in FIG. 6, after the processing of the seventh step,
If the transmission amount is less than or equal to the adjustment amount, the adjustment can be ended, but as shown in FIG. 7, the transmission amount may not be equal to or less than the value after the seventh step. In this case, another correction step is provided for adjustment.

【0035】この実施形態では、最終調整のステップで
ある7ステップ目と同じ値を用いて調整を行なってい
る。調整値を分割して伝送量を調整した場合、最適伝送
量に近づくが、必ずしも最適伝送量以下になる保証がな
い。伝送量の調整結果を確実に最適伝送量以下にするた
めに、最終調整ステップ値と同じ値にし、強制的に最適
伝送量以下になるようにされる。
In this embodiment, the adjustment is performed using the same value as in the seventh step which is the final adjustment step. When the transmission amount is adjusted by dividing the adjustment value, the transmission amount approaches the optimum transmission amount, but there is no guarantee that the transmission amount will be equal to or less than the optimum transmission amount. In order to ensure that the adjustment result of the transmission amount is less than or equal to the optimal transmission amount, the value is set to the same value as the final adjustment step value, and the transmission amount is forcibly reduced to or less than the optimal transmission amount.

【0036】SMRの調整は図2に示す手順で行なわれ
る。すなわち、まず図5に示すSMR調整ツリーに従っ
て、伝送量調整用の値Δがスタート値Δ=32dBに設
定される。前述したビットアロケーション法により伝送
量が計算され、その伝送量が最適伝送量より多いか少な
いかが判断される。多ければSMRの各帯域から32d
B引かれ、少なければSMRの各帯域に32dB加算さ
れる。次に、Δ値が32dBの1/2の16dBに設定
され、加減算後のSMRから伝送量が求められる。再び
その伝送量が最適伝送量より多いか少ないかが判断さ
れ、多ければSMRの各帯域から16dB引かれ、少な
ければSMRの各帯域に16dB加算される。
The SMR adjustment is performed according to the procedure shown in FIG. That is, first, the transmission amount adjustment value Δ is set to the start value Δ = 32 dB according to the SMR adjustment tree shown in FIG. The transmission amount is calculated by the bit allocation method described above, and it is determined whether the transmission amount is larger or smaller than the optimum transmission amount. 32d from each band of SMR if many
B is subtracted, and if less, 32 dB is added to each band of SMR. Next, the Δ value is set to 16 dB, which is ½ of 32 dB, and the transmission amount is obtained from the SMR after addition and subtraction. It is again determined whether the transmission amount is larger or smaller than the optimum transmission amount, and if it is larger, 16 dB is subtracted from each band of SMR, and if it is smaller, 16 dB is added to each band of SMR.

【0037】この処理が繰返され、Δが8,4,2,
1,0.5dBのように順次2分され、演算が行なわれ
る。この場合、図6に示すように7ステップ目で伝送量
が最適伝送量以下になれば、そのまま伝送量の調整が終
了するが、図7に示すように7ステップ目で最適伝送量
以下にならなかったときには、8ステップ目で最適伝送
量以下になるようにΔの値が設定され、強制的に伝送量
が最適値以下にされる。
This process is repeated, and Δ is 8, 4, 2,
The operation is sequentially performed by dividing into two such as 1 and 0.5 dB. In this case, if the transmission amount becomes less than or equal to the optimum transmission amount at the 7th step as shown in FIG. 6, the adjustment of the transmission amount is finished as it is, but if it becomes less than or equal to the optimum transmission amount at the 7th step as shown in FIG. If not, the value of Δ is set so as to be less than or equal to the optimum transmission amount in the eighth step, and the transmission amount is forcibly made less than or equal to the optimum value.

【0038】伝送量の調整をする際、調整用の値Δを境
界線として、SMRの量が加減算される。この境界線の
遷移を図8および図9に示す。図8は伝送量が7ステッ
プ目で最適伝送量以下になる場合であり、図9は伝送量
が7ステップ目で最適伝送量以下にならない場合であ
る。
When the transmission amount is adjusted, the SMR amount is added or subtracted with the adjustment value Δ as a boundary line. The transition of this boundary line is shown in FIGS. FIG. 8 shows the case where the transmission amount becomes less than or equal to the optimum transmission amount at the seventh step, and FIG. 9 shows the case where the transmission amount does not become less than or equal to the optimum transmission amount at the seventh step.

【0039】伝送量調整演算を7または8ステップ以下
で終了させたい場合は、次のような方法もある。すなわ
ち、伝送量の調整時に、最適伝送量から最適伝送量−δ
までの範囲にある場合、直ちに終了させる。このとき、
δの値は予め設定された任意の値である。たとえば、こ
の実施形態では、微調整の範囲であるδ=0.5とする
と良い結果が得られる。
If it is desired to complete the transmission amount adjustment calculation in 7 or 8 steps or less, the following method is also available. That is, when adjusting the transmission amount, the optimum transmission amount is changed to the optimum transmission amount −δ.
If it is in the range up to, terminate it immediately. At this time,
The value of δ is an arbitrary value set in advance. For example, in this embodiment, good results are obtained when δ = 0.5, which is the range of fine adjustment.

【0040】[0040]

【発明の効果】以上のように、この発明によれば、所定
の処理バンド幅内のスペクトルデータをエネルギ換算し
てシグナルレベルを算定し、所定のマスキングレベルに
対するシグナルレベルの相対比に応じて処理バンド内の
量子化ビット数を割付けるときに、相対比の小さい領域
では同一割付ビットに対応する相対比の幅を大きくする
ことによって、周波数方向のスペクトルの連続性を確保
できる。また、線形規則に従って割付ける場合には、線
形規則に従えば割付ビット数がゼロとなる相対比領域に
対しても強制的に量子化ビット数を割付けることによっ
て、周波数方向のスペクトルの連続性を確保することが
できる。
As described above, according to the present invention, the spectrum level within the predetermined processing bandwidth is converted into energy to calculate the signal level, and the signal level is processed according to the relative ratio of the signal level to the predetermined masking level. When the number of quantized bits in a band is allocated, the continuity of the spectrum in the frequency direction can be ensured by increasing the width of the relative ratio corresponding to the same allocated bit in the region where the relative ratio is small. Also, when allocating according to the linear rule, the continuity of the spectrum in the frequency direction is determined by forcibly allocating the quantization bit number even in the relative ratio area where the allocated bit number is zero according to the linear rule. Can be secured.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明の一実施形態の動作を説明するための
フローチャートである。
FIG. 1 is a flow chart for explaining the operation of an embodiment of the present invention.

【図2】図1における伝送量調整動作を説明するための
フローチャートである。
FIG. 2 is a flowchart for explaining a transmission amount adjustment operation in FIG.

【図3】ワードレングスと量子化ビット数との関係を示
す図である。
FIG. 3 is a diagram showing a relationship between a word length and the number of quantization bits.

【図4】SMRとワードレングスとの関係を示す図であ
る。
FIG. 4 is a diagram showing a relationship between SMR and word length.

【図5】SMR調整パターンを示す図である。FIG. 5 is a diagram showing an SMR adjustment pattern.

【図6】2分法により7ステップで収束した例を示す図
である。
FIG. 6 is a diagram showing an example of convergence in 7 steps by the bisection method.

【図7】2分法により伝送量がオーバーして8ステップ
で強制的に収束させた例を示す図である。
FIG. 7 is a diagram showing an example in which the transmission amount is exceeded by the dichotomy and forced convergence is performed in 8 steps.

【図8】伝送量が7ステップ目で最適伝送量以下になる
場合の遷移図である。
FIG. 8 is a transition diagram when the transmission amount becomes less than or equal to the optimum transmission amount in the seventh step.

【図9】伝送量が7ステップ目で最適伝送量以下になら
ない場合の遷移図である。
FIG. 9 is a transition diagram when the transmission amount does not fall below the optimum transmission amount in the seventh step.

【図10】ミニディスクシステムの構成を示すブロック
図である。
FIG. 10 is a block diagram showing a configuration of a mini disk system.

【図11】図10に示した音声圧縮ATRACエンコー
ダを示すブロック図である。
11 is a block diagram showing the audio compression ATRAC encoder shown in FIG.

【図12】図11に示した音声圧縮ATRACエンコー
ダによる帯域分割とMDCTとの関係を示す図である。
12 is a diagram showing a relationship between band division and MDCT by the audio compression ATRAC encoder shown in FIG.

【図13】ATRACエンコーダに入力される時系列の
音声信号を示す図である。
FIG. 13 is a diagram showing a time-series audio signal input to an ATRAC encoder.

【図14】図13に示した音声信号を帯域分割し、MD
CTによって変換された周波数スペクトルデータを示す
図である。
FIG. 14 is a band division of the audio signal shown in FIG.
It is a figure which shows the frequency spectrum data converted by CT.

【図15】スペクトルデータからエネルギ量を求めたシ
グナルレベルを示す図である。
FIG. 15 is a diagram showing a signal level in which the amount of energy is obtained from spectrum data.

【図16】マスキング計算を説明するための図である。FIG. 16 is a diagram for explaining masking calculation.

【図17】トータルマスク量を示す図である。FIG. 17 is a diagram showing a total mask amount.

【図18】最小可聴特性カーブを示す図である。FIG. 18 is a diagram showing a minimum audible characteristic curve.

【図19】図15に示したシグナルレベルと、図17の
トータルマスク量と、図18の最小可聴特性カーブを重
ねて示した図である。
FIG. 19 is a diagram in which the signal level shown in FIG. 15, the total mask amount of FIG. 17, and the minimum audible characteristic curve of FIG. 18 are superimposed.

【符号の説明】[Explanation of symbols]

81,82 QMF 83 ディレイ 84,85,86 MDCT 87,88,89 ブロックサイズ選択回路 90 ビットアロケーション+量子化回路 91 聴覚心理分析回路 92 多重化回路 81,82 QMF 83 delay 84,85,86 MDCT 87,88,89 Block size selection circuit 90-bit allocation + quantization circuit 91 Auditory psychological analysis circuit 92 Multiplexing circuit

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) H03M 7/30 G11B 20/10 311 ─────────────────────────────────────────────────── ─── Continuation of the front page (58) Fields surveyed (Int.Cl. 7 , DB name) H03M 7/30 G11B 20/10 311

Claims (4)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 アナログデータを周波数データに変換
し、この変換された所定の処理バンド幅内のスペクトル
データをエネルギ換算してシグナルレベルを算定し、所
定のマスキングレベルに対する前記シグナルレベルの相
対比に応じて当該処理バンド内の量子化ビット数を所定
の線形規則に従って割付ける情報符号化方法であって、 前記線形規則に従えば割付ビット数がゼロとなる相対比
領域に対しても、前記線形規則に従って割付けられる最
小の量子化ビット数を強制的に割付けることを特徴とす
る、情報符号化方法。
1. Converting analog data into frequency data
Then, the spectrum within this converted predetermined processing bandwidth
The signal level is calculated by converting the data into energy and
Phase of the signal level against a constant masking level
Predetermines the number of quantization bits in the processing band according to the comparison
Is an information encoding method for allocating according to the linear rule, and the relative ratio at which the number of allocated bits is zero according to the linear rule.
Even for regions, the maximum assigned according to the linear rule
Characterized by forcibly assigning a small number of quantization bits
Information encoding method.
【請求項2】 前記強制的に量子化ビット数を割付ける
相対比領域は、線形規則により限界とされる相対比とゼ
ロデシベルとの中間までであることを特徴とする、請求
項1に記載の情報符号化方法。
2. The number of quantization bits is forcibly assigned
The relative ratio area is defined as the relative ratio and
Claim, characterized in that it is up to the middle of the rodecibel
The information encoding method according to Item 1.
【請求項3】 前記アナログデータは音声データであっ
て、前記マスキングレベルは人の聞こえ方によって設定
されるものであることを特徴とする、請求項1または請
求項2に記載の情報符号化方法。
3. The analog data is voice data.
The masking level is set according to how people hear
Claim 1 or a contract, characterized in that
The information encoding method according to claim 2.
【請求項4】 前記符号化されたデータはミニディスク
に記録されるものであり、マスキングはスペクトル間の
相関関係に起因するマスキング効果と人の耳の最小可聴
特性とを組合せたものであることを特徴とする、請求項
3に記載の情報符号化方法。
4. The encoded data is a mini disc
Is recorded in the
Masking effect caused by correlation and minimum audibility of human ear
Claim, characterized in that it is a combination of characteristics and
3. The information encoding method described in 3.
JP05949798A 1998-03-11 1998-03-11 Information encoding method Expired - Lifetime JP3408140B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05949798A JP3408140B2 (en) 1998-03-11 1998-03-11 Information encoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05949798A JP3408140B2 (en) 1998-03-11 1998-03-11 Information encoding method

Publications (2)

Publication Number Publication Date
JPH11261421A JPH11261421A (en) 1999-09-24
JP3408140B2 true JP3408140B2 (en) 2003-05-19

Family

ID=13114993

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05949798A Expired - Lifetime JP3408140B2 (en) 1998-03-11 1998-03-11 Information encoding method

Country Status (1)

Country Link
JP (1) JP3408140B2 (en)

Also Published As

Publication number Publication date
JPH11261421A (en) 1999-09-24

Similar Documents

Publication Publication Date Title
JP3328532B2 (en) Digital data encoding method
JP3173218B2 (en) Compressed data recording method and apparatus, compressed data reproducing method, and recording medium
JP3123286B2 (en) Digital signal processing device or method, and recording medium
JP3334419B2 (en) Noise reduction method and noise reduction device
JP3765622B2 (en) Audio encoding / decoding system
JP3123290B2 (en) Compressed data recording device and method, compressed data reproducing method, recording medium
JPH08190764A (en) Method and device for processing digital signal and recording medium
EP0691751B1 (en) Method and device for compressing information, and device for recording/transmitting compressed information
JPH0816195A (en) Method and equipment for digital audio coding
US5754427A (en) Data recording method
JP2000330599A (en) Signal processing method and device, and information providing medium
US6128593A (en) System and method for implementing a refined psycho-acoustic modeler
EP0899892A2 (en) Signal processing apparatus and method, and information recording apparatus
JP3408140B2 (en) Information encoding method
JP3776004B2 (en) Encoding method of digital data
JP4271588B2 (en) Encoding method and encoding apparatus for digital data
JP3354472B2 (en) Information encoding method
JP2003177797A (en) Digital signal encoding device and digital signal recording device provided with the device
JP4822697B2 (en) Digital signal encoding apparatus and digital signal recording apparatus
JPH06289900A (en) Audio encoding device
JP4293833B2 (en) Digital signal recording / reproducing apparatus and control program therefor
JPH11330974A (en) Encoding method and device, decoding method and device, digital signal recording method and device, recording medium and digital transmitting method and device
JP3089476B2 (en) Audio signal quantization error reduction device
JP2993324B2 (en) Highly efficient speech coding system
US20030233228A1 (en) Audio coding system and method

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030218

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090314

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100314

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110314

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110314

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130314

Year of fee payment: 10