JP3334375B2 - Digital signal compression method and apparatus - Google Patents

Digital signal compression method and apparatus

Info

Publication number
JP3334375B2
JP3334375B2 JP26501294A JP26501294A JP3334375B2 JP 3334375 B2 JP3334375 B2 JP 3334375B2 JP 26501294 A JP26501294 A JP 26501294A JP 26501294 A JP26501294 A JP 26501294A JP 3334375 B2 JP3334375 B2 JP 3334375B2
Authority
JP
Japan
Prior art keywords
compression
frequency
digital signal
block
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP26501294A
Other languages
Japanese (ja)
Other versions
JPH08125544A (en
Inventor
浩之 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP26501294A priority Critical patent/JP3334375B2/en
Publication of JPH08125544A publication Critical patent/JPH08125544A/en
Application granted granted Critical
Publication of JP3334375B2 publication Critical patent/JP3334375B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、ディジタルオーディオ
信号等をビット圧縮した圧縮データの記録再生に関し、
特に、入力信号の周波数軸上の変化に応じて、情報圧縮
の為のフローティング及び/又は圧縮の為のビット配分
を行う時間と周波数によって細分化された小ブロックの
周波数的大きさを変化させるような、ディジタル信号圧
縮方法及び装置に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to recording and reproducing compressed data obtained by bit-compressing digital audio signals and the like.
In particular, according to the change on the frequency axis of the input signal, the frequency size of the small block subdivided according to the time and frequency at which the floating for information compression and / or the bit allocation for compression is performed is changed. The present invention relates to a digital signal compression method and apparatus.

【0002】[0002]

【従来の技術】本件出願人は、先に、入力されたディジ
タルオーディオ信号をビット圧縮し、所定のデータ量を
記録単位としてバースト的に記録するような技術を、例
えば特願平2−221364号、特願平2−22136
5号、特願平2−222821号、特願平2−2228
23号の各明細書及び図面等において提案している。
2. Description of the Related Art The applicant of the present invention has previously disclosed a technique for compressing an input digital audio signal into bits and recording the digital audio signal in bursts using a predetermined data amount as a recording unit, for example, in Japanese Patent Application No. 2-221364. , Japanese Patent Application No. 2-2136
No. 5, Japanese Patent Application No. 2-222821, Japanese Patent Application No. 2-2228
No. 23 has been proposed in the specification and drawings.

【0003】この技術は、記録媒体として光磁気ディス
クを用い、いわゆるCD−I(CD−インタラクティ
ブ)やCD−ROM XAのオーディオデータフォーマ
ットに規定されているAD(適応差分)PCMオーディ
オデータを記録再生するものであり、このADPCMデ
ータの例えば32セクタ分とインターリーブ処理のため
のリンキング用の数セクタとを記録単位として、光磁気
ディスクにバースト的に記録している。
This technology uses a magneto-optical disk as a recording medium and records and reproduces AD (adaptive difference) PCM audio data defined in an audio data format of a so-called CD-I (CD-interactive) or CD-ROM XA. The ADPCM data is recorded in a burst on the magneto-optical disk using, for example, 32 sectors of ADPCM data and several sectors for linking for interleave processing as a recording unit.

【0004】この光磁気ディスクを用いた記録再生装置
におけるADPCMオーディオにはいくつかのモードが
選択可能になっており、例えば通常のCDの再生時間に
比較して、2倍の圧縮率でサンプリング周波数が37.
8kHzのレベルA、4倍の圧縮率でサンプリング周波
数が37.8kHzのレベルB、8倍の圧縮率でサンプ
リング周波数が18.9kHzのレベルCが規定されて
いる。すなわち、例えば上記レベルBの場合には、ディ
ジタルオーディオデータが略々1/4に圧縮され、この
レベルBのモードで記録されたディスクの再生時間(プ
レイタイム)は、標準的なCDフォーマット(CD−D
Aフォーマット)の場合の4倍となる。これは、より小
型のディスクで標準12cmと同じ程度の記録再生時間
が得られることから、装置の小型化が図れることにな
る。
Several modes can be selected for the ADPCM audio in the recording / reproducing apparatus using this magneto-optical disk. For example, the sampling frequency is twice as high as the normal CD reproducing time at a compression ratio of twice. Is 37.
A level A of 8 kHz, a level B of a sampling frequency of 37.8 kHz with a 4 times compression ratio, and a level C of a sampling frequency of 18.9 kHz with an 8 times compression ratio are defined. That is, for example, in the case of the level B, the digital audio data is compressed to approximately 1/4, and the reproduction time (play time) of the disc recorded in this level B mode is a standard CD format (CD). -D
A format). Since a recording and reproducing time of the same order as a standard 12 cm can be obtained with a smaller disk, the size of the apparatus can be reduced.

【0005】ただし、ディスクの回転速度は標準的なC
Dと同じであるため、例えば上記レベルBの場合、所定
時間当たりその4倍の再生時間分の圧縮データが得られ
ることになる。このため、例えばセクタやクラスタ等の
時間単位で同じ圧縮データを重複して4回読み出すよう
にし、そのうちの1回分の圧縮データのみをオーディオ
再生にまわすようにしている。具体的には、スパイラル
状の記録トラックを走査(トラッキング)する際に、1
回転毎に元のトラック位置に戻るようなトラックジャン
プを行って、同じトラックを4回ずつ繰り返しトラッキ
ングするような形態で再生動作を進めることになる。こ
れは、例えば4回の重複読み取りの内、少なくとも1回
だけ正常な圧縮データが得られればよいことになり、外
乱等によるエラーに強く、特に携帯用小型機器に適用し
て好ましいものである。
However, the rotation speed of the disk is a standard C
Since it is the same as D, for example, in the case of the level B, compressed data for a reproduction time four times as long as the predetermined time is obtained. For this reason, for example, the same compressed data is read out four times in units of time such as sectors or clusters, and only one of the compressed data is used for audio reproduction. Specifically, when scanning (tracking) a spiral recording track, 1
A track jump is performed to return to the original track position for each rotation, and the reproduction operation proceeds in such a form that the same track is repeatedly tracked four times. This means that normal compressed data need only be obtained at least once out of, for example, four times of redundant reading, and is resistant to errors due to disturbances and the like, and is particularly preferable when applied to portable small devices.

【0006】さらに、本出願人は、効率良く、良好な圧
縮を実現するためのビット割当手法を特願平4−369
52号の明細書及び図面等において提案している。この
技術はビットの割当に際し、いわゆる臨界帯域(クリテ
ィカルバンド)等の各小ブロック中の代表値によって正
規化、いわゆるブロックフローティングを施し、各小ブ
ロック内の信号の大きさに依存したビット割り当てを、
当該小ブロックの対応する帯域に応じて重み付けして行
うというものである。この技術によれば各小ブロック内
のスペクトルの大きさに極端なばらつきが生じない場合
には、良好に圧縮を行うことが出来る。
Further, the present applicant has proposed a bit allocation method for realizing efficient and good compression in Japanese Patent Application No. 4-369.
No. 52 in the specification and drawings. In this technique, when allocating bits, normalization is performed by a representative value in each small block such as a so-called critical band (critical band), that is, so-called block floating is performed, and bit allocation depending on a signal size in each small block is performed.
The weighting is performed according to the band corresponding to the small block. According to this technique, when there is no extreme variation in the magnitude of the spectrum in each small block, it is possible to perform compression satisfactorily.

【0007】[0007]

【発明が解決しようとする課題】しかしながら、前述の
技術を応用してディジタルデータの圧縮を行った場合、
ブロックフローティングを施す為の各小ブロック内のス
ペクトルの大きさに極端なバラツキや特出するピーク成
分を含む信号、例えば、単信号或いは複数の正弦波や矩
形波の圧縮に際しては、ピークを含む各小ブロック内の
データの偏差が大きい為に、各小ブロック内の代表値で
ブロックフローティングを行った際の効率が低下する場
合が生じる。さらに、入力信号の状態、即ち、各小ブロ
ック内のスペクトルの大きさのバラツキや特出するピー
ク成分が変化した場合、先のブロックフローティングの
効率も変化する結果となり、時間軸方向の処理ブロック
で圧縮効率の大きな偏りが生じる場合がある。また、ブ
ロックフローティングの効率が低下した状態で圧縮の為
のビット配分を行うと、発生する量子化ノイズを許容ノ
イズレベル以下とする為に、冗長なビットの配分を必要
とする場合が生じ、重ねて圧縮効率の低下又は大きな偏
りを招く場合がある。
However, when digital data is compressed by applying the above-mentioned technology,
Signals containing extreme variances or characteristic peak components in the spectrum size in each small block for performing block floating, for example, when compressing a single signal or a plurality of sine waves or square waves, each signal including peaks Since the deviation of the data in the small block is large, the efficiency when the block floating is performed with the representative value in each small block may be reduced. Furthermore, when the state of the input signal, that is, the variation in the magnitude of the spectrum in each small block or the characteristic peak component changes, the efficiency of the previous block floating also changes, and the processing block in the time axis direction changes. A large bias in compression efficiency may occur. Also, if bit allocation for compression is performed in a state where the efficiency of block floating is reduced, redundant bits may need to be allocated in order to reduce the generated quantization noise to an allowable noise level or less. As a result, the compression efficiency may be reduced or a large bias may be caused.

【0008】この場合、前述の技術を用いた応用例の殆
どの場合において、記録媒体や伝送経路の都合上、使用
可能なビットレートの上限が規定される為、そのビット
レートの上限を圧縮効率の低い処理ブロックに合わせる
と、圧縮効率の高い処理ブロックでは、ビットが過剰な
状態となり、全体の圧縮効率の低下を招く。また、先の
上限を圧縮効率の高い処理ブロックに合わせると、圧縮
効率の低い処理ブロックにおいて、情報量が不足し、聴
感上の問題が無視できなくなる可能性が生じる。この問
題は、使用可能なビットレートが低くなる程、大きな問
題となり、入力信号による処理ブロックの圧縮効率の偏
差が大きいほど、より低いビットレート、言い換えれ
ば、より高い圧縮率を実現することが難しくなる。
In this case, the upper limit of the usable bit rate is specified in most cases of the application using the above-described technique because of the recording medium and the transmission path. If the processing block has a low compression ratio, the processing block having a high compression efficiency has an excessive number of bits, which causes a decrease in the overall compression efficiency. Further, if the upper limit is set to a processing block having a high compression efficiency, the amount of information is insufficient in a processing block having a low compression efficiency, and there is a possibility that a problem in audibility cannot be ignored. This problem becomes more serious as the available bit rate becomes lower, and it becomes more difficult to realize a lower bit rate, in other words, a higher compression rate, as the deviation of the compression efficiency of the processing block due to the input signal becomes larger. Become.

【0009】本発明はこの様な実情に鑑みてなされたも
のであり、入力信号の特性に関わらず、ブロックフロー
ティング並びに量子化の効率が低下することの無い情報
圧縮並びに情報圧縮の為のビット配分の手法が適用され
るディジタル信号圧縮方法及び装置の提供を目的とする
ものである。
SUMMARY OF THE INVENTION The present invention has been made in view of such circumstances, and regardless of the characteristics of an input signal, block floating and information compression without lowering the efficiency of quantization and bit allocation for information compression. It is an object of the present invention to provide a digital signal compression method and apparatus to which the above method is applied.

【0010】[0010]

【課題を解決するための手段】本発明に係るディジタル
信号圧縮方法及び装置は、上述の目的を達成するために
提案されたものであり、入力ディジタル信号を時間と周
波数について細分化した小ブロックに分配し、圧縮の為
のフローティングを施して情報圧縮する際に、上記入力
ディジタル信号の周波数軸上での変化量の積算値に応じ
て、上記フローティングを施す小ブロックの周波数軸上
での境界を決定し、決定した上記小ブロック毎にフロー
ティングを行うことを特徴とするものである。
SUMMARY OF THE INVENTION A digital signal compression method and apparatus according to the present invention has been proposed to achieve the above-mentioned object, and an input digital signal is divided into small blocks subdivided in time and frequency. When distributing and performing information compression by performing floating for compression, the boundary on the frequency axis of the small block to be subjected to floating is determined in accordance with the integrated value of the amount of change on the frequency axis of the input digital signal. It is characterized in that it is determined and floating is performed for each of the determined small blocks.

【0011】また、本発明のディジタル信号圧縮方法及
び装置は、入力信号の周波数軸上のスペクトルデータを
得、上記スペクトルデータから許容可能なノイズスペク
トルを求め、上記求めた許容可能なノイズスペクトルを
時間と周波数について細分化した小ブロックに分配し、
圧縮の為のビット割当を行い、入力信号の周波数軸上の
特性に応じて、圧縮の為のビット割当を行う小ブロック
の周波数的大きさを変化させてビット割当を最適化する
ことを特徴とする。
Further, the digital signal compression method and apparatus of the present invention obtain spectrum data on a frequency axis of an input signal, obtain an allowable noise spectrum from the spectrum data, and convert the obtained allowable noise spectrum into a time signal. And divided into small blocks subdivided for frequency,
Bit allocation for compression is performed, and the bit allocation is optimized by changing the frequency size of a small block for performing bit allocation for compression in accordance with the characteristics on the frequency axis of the input signal. I do.

【0012】さらに、本発明のディジタル信号圧縮方法
及び装置は、入力信号の周波数軸上の特性を算出する工
程又は手段と、入力信号を時間と周波数について細分化
した小ブロックに分配し、圧縮の為のフローティングを
施す工程又は手段と、周波数軸上のスペクトルデータを
得る工程又は手段と、上記スペクトルデータから許容可
能なノイズスペクトルを求める工程又は手段と、上記許
容可能なノイズスペクトルを時間と周波数について細分
化した小ブロックに分配し、圧縮の為のビット割当を行
う工程又は手段と、入力信号の周波数軸上の特性に応じ
て、圧縮の為のフローティングを施す時間と周波数につ
いて細分化した小ブロック及び/又は圧縮の為のビット
割当を行う時間と周波数について細分化した小ブロック
の周波数的大きさを変化させる工程又は手段とからな
り、上記ブロックフローティングの為の小ブロックとビ
ット割当の為の小ブロックを共に或いはそれぞれ独立し
て変化させることにより、ブロックフローティング並び
にビット割当を最適化することを特徴とする。
Further, the digital signal compression method and apparatus according to the present invention include a step or means for calculating a characteristic on the frequency axis of the input signal, and a method for distributing the input signal into small blocks subdivided in time and frequency, and A step or means for performing floating for obtaining the spectrum data on the frequency axis; a step or means for obtaining an allowable noise spectrum from the spectrum data; and A process or means for allocating bits to the subdivided small blocks and performing bit allocation for compression; and a small block subdivided in time and frequency for performing floating for compression in accordance with the characteristics on the frequency axis of the input signal. And / or the frequency size of small blocks subdivided in time and frequency for bit allocation for compression Changing the small block for block floating and the small block for bit allocation together or independently of each other to optimize block floating and bit allocation. I do.

【0013】また、本発明のディジタル信号圧縮方法及
び装置は、圧縮の為のブロックフローティングを施す時
間と周波数について細分化した小ブロック及び/又は圧
縮の為のビット割当を行う時間と周波数について細分化
した小ブロックの周波数的大きさを予め定め、この予め
定めた大きさを採用した際の圧縮効率と、入力信号の周
波数軸上の特性に応じて、圧縮の為のフローティングを
施す小ブロック及び/又は圧縮の為のビット割当を行う
小ブロックの周波数的大きさを変化させたときの圧縮効
率とを比較し、上記比較結果に応じてより高い効率で情
報圧縮を行える小ブロックの大きさを選択することを特
徴とする。
Further, the digital signal compression method and apparatus of the present invention provide a small block that is subdivided into time and frequency for performing block floating for compression and / or a subdivision into time and frequency that performs bit allocation for compression. The frequency size of the small block is determined in advance, and the small block and / or the floating block for compression are compressed in accordance with the compression efficiency when the predetermined size is adopted and the characteristics on the frequency axis of the input signal. Or, compare the compression efficiency when changing the frequency size of the small block for performing bit allocation for compression, and select the size of the small block that can perform information compression with higher efficiency according to the comparison result. It is characterized by doing.

【0014】ここで、本発明の各ディジタル信号圧縮方
法及び装置においては、圧縮の為のブロックフローティ
ングを施す時間と周波数について細分化した小ブロック
と、圧縮の為のビット割当を行う時間と周波数について
細分化した小ブロックとを、入力信号の周波数軸上の特
性に応じて、共通或いは独立して構成する。
Here, in each digital signal compression method and apparatus according to the present invention, a small block subdivided into time and frequency for performing block floating for compression, and time and frequency for performing bit allocation for compression. The subdivided small blocks are configured commonly or independently according to the characteristics on the frequency axis of the input signal.

【0015】[0015]

【0016】[0016]

【0017】[0017]

【0018】すなわち、本発明に係るディジタル信号圧
縮方法及び装置(高能率符号化方法及び装置)は、入力
信号の周波数軸上の特性を算出し、入力信号を時間と周
波数について細分化した小ブロックに分配し、圧縮の為
のフローティングを施し、入力信号の周波数軸上の特性
に応じて、フローティングを施す小ブロックの周波数的
大きさの制御を行い、最適なフローティングを施すこと
によって上述の問題を解決する。
That is, the digital signal compression method and apparatus (high-efficiency coding method and apparatus) according to the present invention calculate the characteristics of the input signal on the frequency axis and subdivide the input signal into time and frequency. The above problem is solved by performing floating for compression, controlling the frequency size of the small block to be floated according to the characteristics on the frequency axis of the input signal, and performing optimal floating. Resolve.

【0019】また、圧縮の為のビット割当を行うビット
割当を行う際に、入力信号の周波数軸上の特性に応じ
て、圧縮の為のビット割当を行う時間と周波数について
細分化した小ブロックの周波数的大きさ変化させること
によって上述の問題を解決する。
Further, when performing the bit allocation for performing the bit allocation for the compression, the time and the frequency for performing the bit allocation for the compression are divided into small blocks in accordance with the characteristics on the frequency axis of the input signal. The above problem is solved by changing the frequency magnitude.

【0020】さらには、上述のブロックフローティング
を施す為の時間と周波数について細分化した小ブロック
とビット配分の為の小ブロックを共に、或いは独立して
それぞれ変化させると一層、効果的である。
Further, it is more effective to change both the small block for subdividing the time and the frequency for performing the above-mentioned block floating and the small block for bit allocation independently or independently.

【0021】一方、ブロックフローティング及び/又は
ビット配分の為の時間と周波数に細分化された小ブロッ
クを入力信号の周波数軸上の特性に応じて求めた周波数
的大きさと予め、定めておいた当該小ブロックの周波数
的大きさを比較し、総合的に圧縮効率の高い大きさを選
択するとより効果的である。
On the other hand, a small block subdivided into time and frequency for block floating and / or bit allocation is determined in advance by a frequency magnitude obtained in accordance with the characteristics on the frequency axis of the input signal. It is more effective to compare the frequency size of the small blocks and select a size having a high compression efficiency overall.

【0022】[0022]

【作用】本発明のディジタル信号圧縮方法及び装置によ
れば、ブロックフローティング及び/又はビット配分の
効率の偏差が大きくなるような入力信号に対し、その効
率の偏差を小さく抑えるようなブロックフローティング
及び/またはビット配分を行う為の時間と周波数につい
て細分化した小ブロックの周波数的大きさの選択を行う
ことで効率の偏差の少ない圧縮を実現できる。これによ
り、圧縮の効率の低下を防ぐことができ、同一のビット
レートにおいてはより良好な音質を得ることができるよ
うになり、又、同一の音質においてはより低いビットレ
ートでの記録、伝送等を実現することが可能となる。
According to the digital signal compression method and apparatus of the present invention, for an input signal in which the deviation of the efficiency of block floating and / or bit allocation is large, the block floating and / or block for suppressing the deviation of the efficiency is small. Alternatively, by selecting the frequency size of a small block subdivided with respect to time and frequency for performing bit allocation, compression with a small deviation in efficiency can be realized. As a result, a decrease in compression efficiency can be prevented, and better sound quality can be obtained at the same bit rate, and recording, transmission, etc. at a lower bit rate at the same sound quality can be achieved. Can be realized.

【0023】[0023]

【実施例】先ず、図1は、本発明のディジタル信号圧縮
方法が適用される本発明のディジタル信号圧縮装置(圧
縮データ記録再生装置)の一実施例の概略構成を示すブ
ロック回路図である。
FIG. 1 is a block diagram showing a schematic configuration of an embodiment of a digital signal compression apparatus (compressed data recording / reproducing apparatus) of the present invention to which the digital signal compression method of the present invention is applied.

【0024】図1に示す圧縮データ記録再生装置におい
て、先ず記録媒体としては、スピンドルモータ51によ
り回転駆動される光磁気ディスク1が用いられる。光磁
気ディスク1に対するデータの記録時には、例えば光学
ヘッド53によりレーザ光を照射した状態で記録データ
に応じた変調磁界を磁気ヘッド54により印加すること
によって、いわゆる磁界変調記録を行い、光磁気ディス
ク1の記録トラックに沿ってデータを記録する。また再
生時には、光磁気ディススク1の記録トラックを光学ヘ
ッド53によりレーザ光でトレースして磁気光学的に再
生を行う。
In the compressed data recording / reproducing apparatus shown in FIG. 1, a magneto-optical disk 1 driven by a spindle motor 51 is used as a recording medium. When recording data on the magneto-optical disk 1, for example, a so-called magnetic field modulation recording is performed by applying a modulation magnetic field corresponding to the recording data with the magnetic head 54 while irradiating the laser light with the optical head 53. The data is recorded along the recording track of. At the time of reproduction, the recording track of the magneto-optical disk 1 is traced by a laser beam by the optical head 53, and reproduction is performed magneto-optically.

【0025】光学ヘッド53は、例えば、レーザダイオ
ード等のレーザ光源、コリメータレンズ、対物レンズ、
偏光ビームスプリッタ、シリンドリカルレンズ等の光学
部品及び所定パターンの受光部を有するフォトディテク
タ等から構成されている。この光学ヘッド53は、光磁
気ディスク1を介して上記磁気ヘッド54と対向する位
置に設けられている。光磁気ディスク1にデータを記録
するときには、後述する記録系のヘッド駆動回路66に
より磁気ヘッド54を駆動して記録データに応じた変調
磁界を印加すると共に、光学ヘッド53により光磁気デ
ィスク1の目的トラックにレーザ光を照射することによ
って、磁界変調方式により熱磁気記録を行う。またこの
光学ヘッド53は、目的トラックに照射したレーザ光の
反射光を検出し、例えばいわゆる非点収差法によりフォ
ーカスエラーを検出し、例えばいわゆるプッシュプル法
によりトラッキングエラーを検出する。光磁気ディスク
1からデータを再生するとき、光学ヘッド53は上記フ
ォーカスエラーやトラッキングエラーを検出すると同時
に、レーザ光の目的トラックからの反射光の偏光角(カ
ー回転角)の違いを検出して再生信号を生成する。
The optical head 53 includes, for example, a laser light source such as a laser diode, a collimator lens, an objective lens,
The optical system includes optical components such as a polarizing beam splitter and a cylindrical lens, and a photodetector having a light receiving portion having a predetermined pattern. The optical head 53 is provided at a position facing the magnetic head 54 via the magneto-optical disk 1. When data is recorded on the magneto-optical disk 1, the magnetic head 54 is driven by a recording-system head drive circuit 66, which will be described later, to apply a modulation magnetic field in accordance with the recorded data. By irradiating the track with laser light, thermomagnetic recording is performed by a magnetic field modulation method. The optical head 53 detects reflected light of the laser beam applied to the target track, detects a focus error by, for example, a so-called astigmatism method, and detects a tracking error by, for example, a so-called push-pull method. When reproducing data from the magneto-optical disk 1, the optical head 53 detects the focus error and the tracking error, and at the same time, detects the difference in the polarization angle (Kerr rotation angle) of the reflected light of the laser light from the target track and reproduces the data. Generate a signal.

【0026】光学ヘッド53の出力は、RF回路55に
供給される。このRF回路55は、光学ヘッド53の出
力から上記フォーカスエラー信号やトラッキングエラー
信号を抽出してサーボ制御回路56に供給するととも
に、再生信号を2値化して後述する再生系のデコーダ7
1に供給する。
The output of the optical head 53 is supplied to an RF circuit 55. The RF circuit 55 extracts the focus error signal and the tracking error signal from the output of the optical head 53 and supplies the focus error signal and the tracking error signal to the servo control circuit 56.
Feed to 1.

【0027】サーボ制御回路56は、例えばフォーカス
サーボ制御回路やトラッキングサーボ制御回路、スピン
ドルモータサーボ制御回路、スレッドサーボ制御回路等
から構成される。上記フォーカスサーボ制御回路は、上
記フォーカスエラー信号がゼロになるように、光学ヘッ
ド53の光学系のフォーカス制御を行う。また上記トラ
ッキングサーボ制御回路は、上記トラッキングエラー信
号がゼロになるように光学ヘッド53の光学系のトラッ
キング制御を行う。さらに上記スピンドルモータサーボ
制御回路は、光磁気ディスク1を所定の回転速度(例え
ば一定線速度)で回転駆動するようにスピンドルモータ
51を制御する。また、上記スレッドサーボ制御回路
は、システムコントローラ57により指定される光磁気
ディスク1の目的トラック位置に光学ヘッド53及び磁
気ヘッド54を移動させる。このような各種制御動作を
行うサーボ制御回路56は、該サーボ制御回路56によ
り制御される各部の動作状態を示す情報をシステムコン
トローラ57に送る。
The servo control circuit 56 comprises, for example, a focus servo control circuit, a tracking servo control circuit, a spindle motor servo control circuit, a thread servo control circuit and the like. The focus servo control circuit performs focus control of the optical system of the optical head 53 so that the focus error signal becomes zero. Further, the tracking servo control circuit performs tracking control of the optical system of the optical head 53 so that the tracking error signal becomes zero. Further, the spindle motor servo control circuit controls the spindle motor 51 so as to rotate the magneto-optical disk 1 at a predetermined rotation speed (for example, a constant linear speed). The thread servo control circuit moves the optical head 53 and the magnetic head 54 to target track positions of the magneto-optical disk 1 specified by the system controller 57. The servo control circuit 56 that performs such various control operations sends information indicating the operation state of each unit controlled by the servo control circuit 56 to the system controller 57.

【0028】システムコントローラ57にはキー入力操
作部58や表示部59が接続されている。このシステム
コントローラ57は、キー入力操作部58による操作入
力情報により指定される動作モードで記録系及び再生系
の制御を行う。またシステムコントローラ7は、光磁気
ディスク1の記録トラックからヘッダタイムやサブコー
ドのQデータ等により再生されるセクタ単位のアドレス
情報に基づいて、光学ヘッド53及び磁気ヘッド54が
トレースしている上記記録トラック上の記録位置や再生
位置を管理する。さらにシステムコントローラ57は、
データ圧縮率と上記記録トラック上の再生位置情報とに
基づいて表示部59に再生時間を表示させる制御を行
う。
A key input operation unit 58 and a display unit 59 are connected to the system controller 57. The system controller 57 controls a recording system and a reproduction system in an operation mode specified by operation input information from the key input operation unit 58. Further, the system controller 7 performs the above-described recording traced by the optical head 53 and the magnetic head 54 on the basis of the address information in the unit of sector reproduced from the recording track of the magneto-optical disk 1 by the header time and the Q data of the subcode. Manages recording and playback positions on a track. Further, the system controller 57
Control is performed to display the reproduction time on the display unit 59 based on the data compression ratio and the reproduction position information on the recording track.

【0029】この再生時間表示は、光磁気ディスク1の
記録トラックからいわゆるヘッダタイムやいわゆるサブ
コードQデータ等により再生されるセクタ単位のアドレ
ス情報(絶対時間情報)に対し、データ圧縮率の逆数
(例えば1/4圧縮のときには4)を乗算することによ
り、実際の時間情報を求め、これを表示部59に表示さ
せるものである。なお、記録時においても、例えば光磁
気ディスク等の記録トラックに予め絶対時間情報が記録
されている(プリフォーマットされている)場合に、こ
のプリフォーマットされた絶対時間情報を読み取ってデ
ータ圧縮率の逆数を乗算することにより、現在位置を実
際の記録時間で表示させることも可能である。
This reproduction time display is based on address information (absolute time information) in sector units reproduced from a recording track of the magneto-optical disk 1 by a so-called header time or so-called subcode Q data, etc. For example, in the case of 1/4 compression, the actual time information is obtained by multiplying by 4), and this is displayed on the display unit 59. At the time of recording, if absolute time information is recorded in advance on a recording track of a magneto-optical disk or the like (preformatted), the preformatted absolute time information is read and the data compression ratio is adjusted. By multiplying the reciprocal, the current position can be displayed by the actual recording time.

【0030】次にこのディスク記録再生装置の記録系に
おいて、入力端子60からのアナログオーディオ入力信
号AINがローパスフィルタ61を介してA/D変換器6
2に供給され、このA/D変換器62は上記アナログオ
ーディオ入力信号AINを量子化する。A/D変換器62
から得られたディジタルオーディオ信号は、ATC(Ad
aptive Transform Coding )PCMエンコーダ63に供
給される。また、入力端子67からのディジタルオーデ
ィオ入力信号DINがディジタル入力インターフェース回
路68を介してATCエンコーダ63に供給される。A
TCエンコーダ63は、上記入力信号AINを上記A/D
変換器62により量子化した所定転送速度のディジタル
オーディオPCMデータについて、ビット圧縮(データ
圧縮)処理を行う。ここではその圧縮率を4倍として説
明するが、本実施例はこの倍率には依存しない構成とな
っており、応用例により任意に選択が可能である。
Next, in the recording system of the disk recording / reproducing apparatus, the analog audio input signal AIN from the input terminal 60 is supplied to the A / D converter 6 via the low-pass filter 61.
The A / D converter 62 quantizes the analog audio input signal AIN. A / D converter 62
Digital audio signal obtained from the ATC (Ad
aptive Transform Coding) is supplied to the PCM encoder 63. The digital audio input signal DIN from the input terminal 67 is supplied to the ATC encoder 63 via the digital input interface circuit 68. A
The TC encoder 63 converts the input signal AIN into the A / D
Bit compression (data compression) processing is performed on the digital audio PCM data having a predetermined transfer rate quantized by the converter 62. Here, the compression ratio will be described as four times, but the present embodiment has a configuration that does not depend on this magnification and can be arbitrarily selected depending on the application example.

【0031】次にメモリ64は、データの書き込み及び
読み出しがシステムコントローラ57により制御され、
ATCエンコーダ63から供給されるATCデータを一
時的に記憶しておき、必要に応じてディスク上に記録す
るためのバッファメモリとして用いられている。すなわ
ち、例えばATCエンコーダ63から供給される圧縮オ
ーディオデータは、そのデータ転送速度が、標準的なC
D−DAフォーマットのデータ転送速度(75セクタ/
秒)の1/4、すなわち18.75セクタ/秒に低減さ
れており、この圧縮データがメモリ14に連続的に書き
込まれる。この圧縮データ(ATCデータ)は、前述し
たように4セクタにつき1セクタの記録を行えば足りる
が、このような4セクタおきの記録は事実上不可能に近
いため、後述するようなセクタ連続の記録を行うように
している。この記録は、休止期間を介して、所定の複数
セクタ(例えば32セクタ+数セクタ)から成るクラス
タを記録単位として、標準的なCD−DAフォーマット
と同じデータ転送速度(75セクタ/秒)でバースト的
に行われる。すなわちメモリ14においては、上記ビッ
ト圧縮レートに応じた18.75(=75/4)セクタ
/秒の低い転送速度で連続的に書き込まれたATCオー
ディオデータが、記録データとして上記75セクタ/秒
の転送速度でバースト的に読み出される。この読み出さ
れて記録されるデータについて、記録休止期間を含む全
体的なデータ転送速度は、上記18.75セクタ/秒の
低い速度となっているが、バースト的に行われる記録動
作の時間内での瞬時的なデータ転送速度は上記標準的な
75セクタ/秒となっている。従って、ディスク回転速
度が標準的なCD−DAフォーマットと同じ速度(一定
線速度)のとき、該CD−DAフォーマットと同じ記録
密度、記憶パターンの記録が行われることになる。
Next, writing and reading of data in the memory 64 are controlled by the system controller 57.
ATC data supplied from the ATC encoder 63 is temporarily stored, and is used as a buffer memory for recording on a disk as needed. That is, for example, the compressed audio data supplied from the ATC encoder 63 has a standard C
Data transfer rate of D-DA format (75 sectors /
Second), that is, 18.75 sectors / second, and the compressed data is continuously written to the memory 14. As described above, it is sufficient for this compressed data (ATC data) to record one sector per four sectors, but such recording every four sectors is practically impossible, so that a continuous sector as described later is used. I try to keep a record. This recording is performed in bursts at the same data transfer rate (75 sectors / second) as a standard CD-DA format by using a cluster composed of a predetermined plurality of sectors (for example, 32 sectors + several sectors) as a recording unit through a pause period. It is done on a regular basis. That is, in the memory 14, ATC audio data continuously written at a low transfer rate of 18.75 (= 75/4) sectors / second according to the bit compression rate is used as recording data. It is read out in bursts at the transfer speed. The overall data transfer speed of the read and recorded data, including the recording pause period, is as low as 18.75 sectors / sec. The instantaneous data transfer rate in the above is the standard 75 sectors / second. Therefore, when the disk rotation speed is the same speed (constant linear speed) as the standard CD-DA format, the same recording density and storage pattern as in the CD-DA format are recorded.

【0032】メモリ64から上記75セクタ/秒の(瞬
時的な)転送速度でバースト的に読み出されたATCオ
ーディオデータすなわち記録データは、エンコーダ65
に供給される。ここで、メモリ64からエンコーダ65
に供給されるデータ列において、1回の記録で連続記録
される単位は、複数セクタ(例えば32セクタ)から成
るクラスタ及び該クラスタの前後位置に配されたクラス
タ接続用の数セクタとしている。このクラスタ接続用セ
クタは、エンコーダ65でのインターリーブ長より長く
設定しており、インターリーブされても他のクラスタの
データに影響を与えないようにしている。
The ATC audio data, ie, recorded data, read from the memory 64 in a burst at the (instantaneous) transfer rate of 75 sectors / second is transferred to the encoder 65.
Supplied to Here, from the memory 64 to the encoder 65
In the data sequence supplied to the cluster, the unit continuously recorded in one recording is a cluster including a plurality of sectors (for example, 32 sectors) and several sectors for cluster connection arranged before and after the cluster. The cluster connection sector is set to be longer than the interleave length in the encoder 65, so that even if interleaved, data in other clusters is not affected.

【0033】エンコーダ65は、メモリ64から上述し
たようにバースト的に供給される記録データについて、
エラー訂正のための符号化処理(パリティ付加及びイン
ターリーブ処理)やEFM符号化処理などを施す。この
エンコーダ65による符号化処理の施された記録データ
が磁気ヘッド駆動回路66に供給される。この磁気ヘッ
ド駆動回路66は、磁気ヘッド54が接続されており、
上記記録データに応じた変調磁界を光磁気ディスク1に
印加するように磁気ヘッド54を駆動する。
As described above, the encoder 65 controls the recording data supplied from the memory 64 in a burst manner.
Encoding processing (parity addition and interleaving processing) for error correction, EFM encoding processing, and the like are performed. The recording data that has been subjected to the encoding process by the encoder 65 is supplied to the magnetic head drive circuit 66. The magnetic head drive circuit 66 is connected to the magnetic head 54,
The magnetic head 54 is driven so that a modulation magnetic field corresponding to the recording data is applied to the magneto-optical disk 1.

【0034】また、システムコントローラ57は、メモ
リ64に対する上述の如きメモリ制御を行うとともに、
このメモリ制御によりメモリ64からバースト的に読み
出される上記記録データを光磁気ディスク2の記録トラ
ックに連続的に記録するように記録位置の制御を行う。
この記録位置の制御は、システムコントローラ57によ
りメモリ64からバースト的に読み出される上記記録デ
ータの記録位置を管理して、光磁気ディスク1の記録ト
ラック上の記録位置を指定する制御信号をサーボ制御回
路56に供給することによって行われる。
The system controller 57 controls the memory 64 as described above,
By this memory control, the recording position is controlled so that the recording data read out from the memory 64 in a burst manner is continuously recorded on the recording track of the magneto-optical disk 2.
The recording position is controlled by controlling the recording position of the recording data read in a burst from the memory 64 by the system controller 57 and transmitting a control signal designating the recording position on the recording track of the magneto-optical disk 1 to a servo control circuit. 56.

【0035】次に、この光磁気ディスク記録再生ユニッ
トの再生系について説明する。この再生系は、上述の記
録系により光磁気ディスク1の記録トラック上に連続的
に記録された記録データを再生するためのものであり、
光学ヘッド53によって光磁気ディスク1の記録トラッ
クをレーザ光でトレースすることにより得られる再生出
力がRF回路55により2値化されて供給されるデコー
ダ71を備えている。この時光磁気ディスクのみではな
く、コンパクトディクス(CD:COMPACT DISC)と同じ
再生専用光ディスクの読み出しも行うことができる。
Next, the reproducing system of the magneto-optical disk recording / reproducing unit will be described. This reproducing system is for reproducing the recorded data continuously recorded on the recording tracks of the magneto-optical disk 1 by the recording system described above.
A decoder 71 is provided, in which a reproduction output obtained by tracing a recording track of the magneto-optical disk 1 with a laser beam by the optical head 53 is binarized by the RF circuit 55 and supplied. At this time, not only a magneto-optical disk but also a read-only optical disk similar to a compact disk (CD: COMPACT DISC) can be read.

【0036】デコーダ71は、上述の記録系におけるエ
ンコーダ65に対応するものであって、RF回路55に
より2値化された再生出力について、エラー訂正のため
の上述の如き復号化処理やEFM復号化処理などの処理
を行いオーディオデータを、正規の転送速度よりも早い
75セクタ/秒の転送速度で再生する。このデコーダ7
1により得られる再生データは、メモリ72に供給され
る。
The decoder 71 corresponds to the encoder 65 in the recording system described above, and performs the above-described decoding processing for error correction and EFM decoding on the reproduced output binarized by the RF circuit 55. Processing such as processing is performed to reproduce audio data at a transfer rate of 75 sectors / sec, which is faster than the normal transfer rate. This decoder 7
1 is supplied to the memory 72.

【0037】メモリ72は、データの書き込み及び読み
出しがシステムコントローラ57により制御され、デコ
ーダ71から75セクタ/秒の転送速度で供給される再
生データがその75セクタ/秒の転送速度でバースト的
に書き込まれる。また、このメモリ72は、上記75セ
クタ/秒の転送速度でバースト的に書き込まれた上記再
生データが正規の75セクタ/秒の転送速度18.75
セクタ/秒で連続的に読み出される。
In the memory 72, data writing and reading are controlled by the system controller 57, and reproduced data supplied from the decoder 71 at a transfer rate of 75 sectors / second is written in burst at the transfer rate of 75 sectors / second. It is. Also, in the memory 72, the reproduced data written in a burst at the transfer rate of 75 sectors / second is a regular transfer rate of 18.75 of 75 sectors / second.
It is read continuously at sectors / second.

【0038】システムコントローラ57は、再生データ
をメモリ72に75セクタ/秒の転送速度で書き込むと
ともに、メモリ72から上記再生データを上記18.7
5セクタ/秒の転送速度で連続的に読み出すようなメモ
リ制御を行う。また、システムコントローラ57は、メ
モリ72に対する上述の如きメモリ制御を行うととも
に、このメモリ制御によりメモリ72からバースト的に
書き込まれる上記再生データを光磁気ディスク1の記録
トラックから連続的に再生するように再生位置の制御を
行う。この再生位置の制御は、システムコントローラ5
7によりメモリ72からバースト的に読み出される上記
再生データの再生位置を管理して、光磁気ディスク1も
しくは光ディスク1の記録トラック上の再生位置を指定
する制御信号をサーボ制御回路56に供給することによ
って行われる。
The system controller 57 writes the reproduced data to the memory 72 at a transfer rate of 75 sectors / second, and writes the reproduced data from the memory 72 to the above 18.7.
Memory control is performed such that data is read continuously at a transfer rate of 5 sectors / second. Further, the system controller 57 performs the above-described memory control for the memory 72, and reproduces the reproduction data written in a burst from the memory 72 by the memory control from the recording track of the magneto-optical disk 1 continuously. Control the playback position. This playback position control is performed by the system controller 5.
7 controls the reproduction position of the reproduction data read out from the memory 72 in a burst manner and supplies a control signal specifying the reproduction position on the recording track of the magneto-optical disk 1 or the optical disk 1 to the servo control circuit 56. Done.

【0039】メモリ72から18.75セクタ/秒の転
送速度で連続的に読み出された再生データとして得られ
るATCオーディオデータは、ATCデコーダ73に供
給される。このATCデコーダ73は、ATCデータを
4倍にデータ伸張(ビット伸張)することで16ビット
のディジタルオーディオデータを再生する。このATC
デコーダ73からのディジタルオーディオデータは、D
/A変換器74に供給される。
ATC audio data obtained as reproduction data continuously read from the memory 72 at a transfer rate of 18.75 sectors / second is supplied to an ATC decoder 73. The ATC decoder 73 reproduces 16-bit digital audio data by expanding the ATC data by four times (bit expansion). This ATC
The digital audio data from the decoder 73 is D
/ A converter 74.

【0040】D/A変換器74は、ATCデコーダ73
から供給されるディジタルオーディオデータをアナログ
信号に変換して、アナログオーディオ出力信号AOUT を
形成する。このD/A変換器74により得られるアナロ
グオーデイオ信号AOUT は、ローパスフィルタ75を介
して出力端子76から出力される。
The D / A converter 74 includes an ATC decoder 73
Is converted into an analog signal to form an analog audio output signal AOUT. The analog audio signal AOUT obtained by the D / A converter 74 is output from an output terminal 76 via a low-pass filter 75.

【0041】次に、本発明のディジタル信号圧縮装置の
情報圧縮に適用される高能率圧縮符号化について詳述す
る。すなわち、オーディオPCM信号等の入力ディジタ
ル信号を、帯域分割符号化(SBC)、適応変換符号化
(ATC)及び適応ビット割当ての各技術を用いて高能
率符号化する技術について、図2以降を参照しながら説
明する。
Next, the high-efficiency compression coding applied to the information compression of the digital signal compression apparatus of the present invention will be described in detail. That is, refer to FIG. 2 et seq. For a technique of encoding an input digital signal such as an audio PCM signal using band division coding (SBC), adaptive conversion coding (ATC), and adaptive bit allocation. I will explain while.

【0042】図2に示す具体的な高能率符号化装置で
は、定常状態においては、入力ディジタル信号を複数の
周波数帯域に分割すると共に、最低域の隣接した2帯域
の帯域幅は同じで、より高い周波数帯域では高い周波数
帯域ほどバンド幅を広く選定し、各周波数帯域毎に直交
変換を行って、得られた周波数軸のスペクトルデータ
を、低域では、後述する人間の聴覚特性を考慮したいわ
ゆる臨界帯域幅(クリティカルバンド)毎に、中高域で
はブロックフローティング効率を考慮して臨界帯域幅を
細分化した帯域毎に、適応的にビット割当して符号化し
ている。通常このブロックが量子化雑音発生ブロックと
なる。このクリティカルバンドとは、人間の聴覚特性を
考慮して分割された周波数帯域であり、ある純音の周波
数近傍の同じ強さの狭帯域バンドノイズによって当該純
音がマスクされるときのそのノイズの持つ帯域のことで
ある。このクリティカルバンドは、高域ほど帯域幅が広
くなっており、上記0〜22kHzの全周波数帯域は例
えば25のクリティカルバンドに分割されている。
In the specific high-efficiency coding apparatus shown in FIG. 2, in the steady state, the input digital signal is divided into a plurality of frequency bands, and at the same time, the bandwidths of the two lowest adjacent bands are the same. In the high frequency band, the higher the frequency band, the wider the bandwidth is selected, the orthogonal transform is performed for each frequency band, and the spectrum data of the obtained frequency axis is used in the low frequency band. Bits are adaptively allocated and coded for each critical bandwidth (critical band) and for each band obtained by subdividing the critical bandwidth in consideration of block floating efficiency in the middle and high frequency bands. Usually, this block is a quantization noise generating block. The critical band is a frequency band divided in consideration of human auditory characteristics, and a band of a pure tone when the pure tone is masked by a narrow band noise near the frequency of the pure tone. That is. The bandwidth of this critical band increases as the frequency increases, and the entire frequency band of 0 to 22 kHz is divided into, for example, 25 critical bands.

【0043】さらに、本発明実施例においては、直交変
換の前に入力信号に応じて適応的にブロックサイズ(処
理ブロック長)を変化させると共に、入力信号に応じ
て、フローテイング処理を行うブロックフローティング
ユニットの大きさも変化させる処理を行い、圧縮後の情
報の使用効率が最適となるように量子化を行っている。
Further, in the embodiment of the present invention, before the orthogonal transformation, the block size (processing block length) is adaptively changed according to the input signal, and the block floating for performing the floating process according to the input signal. Processing for changing the size of the unit is performed, and quantization is performed so that the usage efficiency of the information after compression is optimized.

【0044】即ち、図2において、入力端子200には
例えばサンプリング周波数が44.1kHzの時、0〜
22kHzのオーディオPCM信号が供給されている。
この入力信号は、例えばいわゆるQMF等のフィルタか
らなる帯域分割フィルタ201により0〜11kHz帯
域と11kHz〜22kHz帯域とに分割され、0〜1
1kHz帯域の信号は同じくいわゆるQMF等のフィル
タからなる帯域分割フィルタ202により0〜5.5k
Hz帯域と5.5kHz〜11kHz帯域とに分割され
る。帯域分割フィルタ201からの11kHz〜22k
Hz帯域の信号は直交変換回路の一例であるMDCT回
路203に送られ、帯域分割フィルタ202からの5.
5kHz〜11kHz帯域の信号はMDCT回路204
に送られ、帯域分割フィルタ202からの0〜5.5k
Hz域の信号はMDCT回路205に送られることによ
り、それぞれMDCT処理される。
That is, in FIG. 2, when the sampling frequency is 44.1 kHz, for example,
An audio PCM signal of 22 kHz is supplied.
This input signal is divided into a band of 0 to 11 kHz and a band of 11 kHz to 22 kHz by a band division filter 201 composed of a filter such as a so-called QMF.
The signal in the 1 kHz band is also converted to a signal of 0 to 5.5 k
It is divided into a Hz band and a 5.5 kHz to 11 kHz band. 11 kHz to 22 k from the band division filter 201
The signal in the Hz band is sent to the MDCT circuit 203 which is an example of the orthogonal transform circuit,
The signal in the band of 5 kHz to 11 kHz is applied to the MDCT circuit 204.
From the band division filter 202 to 0 to 5.5 k
The signals in the Hz range are sent to the MDCT circuit 205 to be subjected to MDCT processing.

【0045】ここで、上述した入力ディジタル信号を複
数の周波数帯域に分割する手法の一例としてのQMFの
フィルタは、例えば文献「ディジタル・コーディング・
オブ・スピーチ・イン・サブバンズ」("Digital coding
of speech in subbands" R.E.Crochiere, Bell Syst.
Tech. J., Vol.55,No.8 1976) に述べられている。この
QMFのフィルタは、帯域を等バンド幅に2分割するも
のであり、当該フィルタにおいては上記分割した帯域を
後に合成する際にいわゆるエリアシングが発生しないこ
とが特徴となっている。
Here, a QMF filter as an example of a method of dividing the input digital signal into a plurality of frequency bands is described in, for example, the document “Digital Coding.
Of Speech in Subvans "(" Digital coding
of speech in subbands "RECrochiere, Bell Syst.
Tech. J., Vol.55, No.8 1976). This QMF filter divides a band into two equal bandwidths, and is characterized in that so-called aliasing does not occur when the divided bands are combined later.

【0046】また、文献「ポリフェイズ・クァドラチュ
ア・フィルターズ −新しい帯域分割符号化技術」("Po
lyphase Quadrature filters -A new subband coding t
echnique", Joseph H. Rothweiler ICASSP 83, BOSTON)
には、等帯域幅のフィルタ分割手法が述べられている。
このポリフェイズ・クァドラチュア・フィルタにおいて
は、信号を等バンド幅の複数の帯域に分割する際に一度
に分割できることが特徴となっている。
Also, a document “Polyphase Quadrature Filters—New Band Division Coding Technology” (“Po
lyphase Quadrature filters -A new subband coding t
echnique ", Joseph H. Rothweiler ICASSP 83, BOSTON)
Describes an equal bandwidth filter division technique.
This polyphase quadrature filter is characterized in that a signal can be divided at a time when divided into a plurality of bands of equal bandwidth.

【0047】さらに、上述した直交変換としては、例え
ば、入力オーディオ信号を所定単位時間(フレーム)で
ブロック化し、当該ブロック毎に高速フーリエ変換(F
FT)、離散コサイン変換(DCT)、モディファイド
DCT変換(MDCT)などを行うことで時間軸を周波
数軸に変換するような直交変換がある。このMDCTに
ついては、文献「時間領域エリアシング・キャンセルを
基礎とするフィルタ・バンク設計を用いたサブバンド/
変換符号化」("Subband/Transform Coding Using Filte
r Bank Designs Based on Time Domain Aliasing Cance
llation," J.P.Princen A.B.Bradley, Univ. of Surrey
Royal Melbourne Inst. of Tech. ICASSP 1987)に述べ
られている。
Further, as the above-mentioned orthogonal transform, for example, an input audio signal is divided into blocks in a predetermined unit time (frame), and a fast Fourier transform (F
FT), a discrete cosine transform (DCT), a modified DCT transform (MDCT), and the like, there are orthogonal transforms that transform the time axis into the frequency axis. This MDCT is described in the literature "Subband / Filter Using Filter Bank Design Based on Time Domain Aliasing Cancellation."
Transform Coding "(" Subband / Transform Coding Using Filte
r Bank Designs Based on Time Domain Aliasing Cance
llation, "JPPrincen ABBradley, Univ. of Surrey
Royal Melbourne Inst. Of Tech. ICASSP 1987).

【0048】ここで、各MDCT回路203、204、
205に供給する各帯域毎のブロックについての標準的
な入力信号に対する具体例を図3に示す。この図3の具
体例においては、3つのフィルタ出力信号は、各帯域ご
とに独立に各々複数の直交変換ブロックサイズを持ち、
信号の時間特性、周波数分布等により時間分解能を切り
換えられる様にしている。信号が時間的に準定常的であ
る場合には、直交変換ブロックサイズを11.6ms、
即ち、図3の(A)に示すロングモード(Long M
ode)と大きくし、信号が非定常的である場合には、
直交変換ブロックサイズを更に2分割、4分割とする。
図3の(B)のショートモード(Short Mod
e)のごとく、すべてを4分割で2.9msとする場合
や、図3の(C)のミドルモード A(Middle
Mode A)、図3の(D)のミドルモード B(M
iddle Mode B)のごとく、一部を2分割で
5.8ms、1部を4分割で2.9msの時間分解能と
することで、実際の複雑な入力信号に適応するようにな
っている。この直交変換ブロックサイズの分割は処理装
置の規模が許せば、さらに複雑な分割を行うと、より効
果的なことは明白である。このブロックサイズの決定は
図2のブロックサイズ決定回路206〜208で決定さ
れ、各MDCT回路203〜205に伝えられるととも
に、該当ブロックのブロックサイズ情報として出力端子
216〜218より出力される。
Here, each of the MDCT circuits 203, 204,
FIG. 3 shows a specific example of a standard input signal for a block for each band supplied to 205. In the specific example of FIG. 3, the three filter output signals each have a plurality of orthogonal transform block sizes independently for each band,
The time resolution can be switched according to the time characteristics and frequency distribution of the signal. If the signal is quasi-stationary in time, the orthogonal transform block size is 11.6 ms,
That is, the long mode (Long M) shown in FIG.
mode) and if the signal is non-stationary,
The orthogonal transform block size is further divided into two and four.
FIG. 3B shows a short mode (Short Mod).
As shown in FIG. 3E, when the whole is divided into four to make 2.9 ms, or in the middle mode A (Middle) shown in FIG.
Mode A), middle mode B (M) in FIG.
As in the case of idle mode B), a part has a time resolution of 5.8 ms in two divisions and a part has a time resolution of 2.9 ms in four divisions, thereby adapting to an actual complicated input signal. It is clear that the division of the orthogonal transform block size is more effective if more complicated division is performed if the scale of the processing device allows. The block size is determined by the block size determination circuits 206 to 208 in FIG. 2 and transmitted to the MDCT circuits 203 to 205 and output from the output terminals 216 to 218 as block size information of the corresponding block.

【0049】次に、ブロックサイズ決定回路の一具体例
の概略構成を表すブロック回路図をを図4に示す。ここ
では図2のブロック決定回路206を例に説明する。図
2のQMFからなる帯域分割フィルタ201の出力のう
ち、11kHz〜22kHzの出力は図4の入力端子4
01を介してパワー算出回路404に送られる。さら
に、図2の帯域分割フィルタ202の出力のうち、5.
5kHz〜11kHzの出力は図4の入力端子402を
介してパワー算出回路405へ、0〜5.5kHzの出
力は図4の入力端子403を介してパワー算出回路40
6へとそれぞれ送られる。また、図2のブロックサイズ
決定回路207、208は図4の入力端子401〜40
3へ入力される信号がブロックサイズ決定回路206の
場合と異なるだけで、動作は同一である。各ブロックサ
イズ決定回路206〜208におけるそれぞれの入力端
子401〜403はマトリクス構成となっており、即
ち、ブロックサイズ決定回路207の入力端子401に
は図2の帯域分割フィルタ202の5.5kHz〜11
kHzの出力が接続されており、同入力端子402には
0〜5.5kHzの出力が接続されている。ブロックサ
イズ決定回路208についても、同様である。
FIG. 4 is a block circuit diagram showing a schematic configuration of a specific example of the block size determining circuit. Here, the block determination circuit 206 of FIG. 2 will be described as an example. Among the outputs of the band division filter 201 composed of the QMF of FIG. 2, the output of 11 kHz to 22 kHz is input terminal 4 of FIG.
01 to the power calculation circuit 404. Further, among the outputs of the band division filter 202 in FIG.
The output of 5 kHz to 11 kHz is supplied to the power calculation circuit 405 via the input terminal 402 of FIG. 4, and the output of 0 to 5.5 kHz is supplied to the power calculation circuit 40 via the input terminal 403 of FIG.
6 respectively. Further, the block size determination circuits 207 and 208 in FIG.
The operation is the same, except that the signal input to 3 is different from that of the block size determination circuit 206. The input terminals 401 to 403 of each of the block size determination circuits 206 to 208 have a matrix configuration. That is, the input terminals 401 of the block size determination circuit 207 are connected to the 5.5 kHz to 11 of the band division filter 202 of FIG.
The output of 0 kHz is connected to the input terminal 402, and the output of 0 to 5.5 kHz is connected to the input terminal 402. The same applies to the block size determination circuit 208.

【0050】図4において、各パワー算出回路404〜
406は入力された時間波形を一定時間、積分すること
によって、各周波数帯域のパワーを求めている。この
際、積分する時間幅は上述の直交変換ブロックサイズの
うち、最小時間ブロック以下である必要がある。また、
上述の算出法以外、例えば直交変換ブロックサイズの最
小時間幅内の最大振幅の絶対値或いは振幅の平均値を代
表パワーとして用いても同様の効果が得られる。パワー
算出回路404の出力は変化分抽出回路408及びパワ
ー比較回路409に、パワー算出回路405、406の
出力はパワー比較回路409にそれぞれ送られる。変化
分抽出回路408ではパワー算出回路404より送られ
たパワーの微係数を求めてパワーの変化情報として、ブ
ロックサイズ1次決定回路410及びメモリ407へ送
る。メモリ407では、変化分抽出回路408より送ら
れたパワーの変化情報を上述の直交変換ブロックサイズ
の最大時間以上、蓄積する。これは時間的に隣接する直
交変換ブロックが直交変換の際のウィンドウ処理によ
り、互いに影響を与え合うため、時間的に隣接する1つ
前のブロックのパワー変化情報をブロックサイズ1次決
定回路410において必要とするためである。ブロック
サイズ1次決定回路410では変化分抽出回路408よ
り送られた該当ブロックのパワー変化情報とメモリ40
7より送られた時間的に隣接する該当ブロックの1つ前
のブロックのパワー変化情報をもとに、該当する周波数
帯域内のパワーの時間的変位から該当する周波数帯域の
直交変換ブロックサイズを決定する。この際、一定以上
の変位が認められた場合、より時間的に短い直交変換ブ
ロックイサイズを選択するわけであるが、その変位点
(境界値)は固定でも効果は得られる。さらに周波数に
比例した値、即ち、周波数が高い場合は大きな変位によ
って時間的に短いブロックサイズとなり、周波数が低い
場合は、高い場合のそれに比べ小さな変位で時間的に短
いブロックサイズに決定されると、より効果的である。
この値(境界値)はなめらかに変化することが望ましい
が、複数段階の階段状の変化であっても構わない。以上
のように決定されたブロックサイズはブロックサイズ修
正回路411へ伝送される。
In FIG. 4, each power calculation circuit 404-
Reference numeral 406 determines the power of each frequency band by integrating the input time waveform for a certain period of time. At this time, the time width for integration needs to be equal to or smaller than the minimum time block among the orthogonal transform block sizes described above. Also,
Other than the above calculation method, a similar effect can be obtained by using, for example, the absolute value or the average value of the maximum amplitude within the minimum time width of the orthogonal transform block size as the representative power. The output of the power calculation circuit 404 is sent to the change extraction circuit 408 and the power comparison circuit 409, and the outputs of the power calculation circuits 405 and 406 are sent to the power comparison circuit 409. The change extraction circuit 408 obtains the differential coefficient of the power sent from the power calculation circuit 404 and sends it to the block size primary determination circuit 410 and the memory 407 as power change information. The memory 407 stores the power change information sent from the change extraction circuit 408 for the maximum time of the orthogonal transform block size or more. This is because the temporally adjacent orthogonal transform blocks mutually influence each other by window processing at the time of orthogonal transform, so that the power change information of the immediately preceding temporally adjacent block is determined by the block size primary decision circuit 410. It is necessary. The block size primary determination circuit 410 and the power change information of the corresponding block sent from the change extraction circuit 408 and the memory 40
7, the orthogonal transform block size of the corresponding frequency band is determined from the temporal displacement of the power in the corresponding frequency band based on the power change information of the block immediately before the corresponding block temporally transmitted from 7. I do. In this case, if a displacement equal to or more than a certain value is recognized, a shorter time orthogonal transform block size is selected. However, the effect can be obtained even if the displacement point (boundary value) is fixed. Furthermore, when the value is proportional to the frequency, that is, when the frequency is high, a large displacement causes a short block size in time, and when the frequency is low, the block size is determined to be short in time with a small displacement compared to that in the high case. , Is more effective.
This value (boundary value) desirably changes smoothly, but may be a stepwise change in a plurality of stages. The block size determined as described above is transmitted to the block size correction circuit 411.

【0051】一方、パワー比較回路409において、各
パワー算出回路404〜406より送られた各周波数帯
域のパワー情報を同時刻及び時間軸上でマスキング効果
の発生する時間幅で比較を行い、パワー算出回路404
の出力周波数帯域に及ぼす他の周波数帯域の影響を求
め、ブロックサイズ修正回路411へ伝送する。ブロッ
クサイズ修正回路411ではパワー比較回路409より
送られたマスキング情報及びディレイ412〜414か
らなるディレイ群の各タップから送られた過去のブロッ
クサイズ情報を基に、ブロックサイズ1次決定回路41
0より送られたブロックサイズをより時間的に長いブロ
ックサイズを選択するよう修正をかけ、ディレイ412
及びウィンドウ形状決定回路415へ出力している。ブ
ロックサイズ修正回路411における作用は、該当周波
数帯域においてプリエコーが問題となる場合でも、他の
周波数帯域、特に該当周波数帯域より低い帯域におい
て、大きな振幅を持つ信号が存在した場合、そのマスキ
ング効果により、プリエコーが聴感上問題とならない、
或いは問題が軽減される場合があるという特性を利用し
ている。なお、上記マスキングとは、人間の聴覚上の特
性により、ある信号によって他の信号がマスクされて聞
こえなくなる現象をいうものであり、このマスキング効
果には、時間軸上のオーデイオ信号による時間軸マスキ
ング効果と、周波数軸上の信号による同時刻マスキング
効果とがある。これらのマスキング効果により、マスキ
ングされる部分にノイズがあったとしても、このノイズ
は聞こえないことになる。このため、実際のオーデイオ
信号では、このマスキングされる範囲内のノイズは許容
可能なノイズとされる。
On the other hand, in the power comparison circuit 409, the power information of each frequency band sent from each of the power calculation circuits 404 to 406 is compared at the same time and on the time axis with the time width at which the masking effect occurs, and the power calculation is performed. Circuit 404
The influence of another frequency band on the output frequency band is calculated and transmitted to the block size correction circuit 411. The block size correction circuit 411 is based on the masking information sent from the power comparison circuit 409 and the past block size information sent from each tap of the delay group consisting of the delays 412 to 414.
The block size sent from 0 was modified to select a longer block size in time, and the delay 412
And to the window shape determination circuit 415. The effect of the block size correction circuit 411 is that, even when a pre-echo is a problem in the relevant frequency band, if a signal having a large amplitude exists in another frequency band, particularly in a band lower than the relevant frequency band, the masking effect is obtained. Pre-echo does not cause a problem in hearing,
Alternatively, it utilizes the characteristic that the problem may be reduced. The masking refers to a phenomenon in which a certain signal masks another signal and becomes inaudible due to human auditory characteristics. The masking effect includes time-axis masking by an audio signal on a time axis. There is an effect and a simultaneous masking effect by a signal on the frequency axis. Due to these masking effects, even if there is noise in the masked portion, this noise will not be heard. For this reason, in an actual audio signal, noise within the masked range is regarded as acceptable noise.

【0052】次に、ディレイ412〜414では過去の
直交変換ブロックサイズを順に記録しておき、各タッ
プ、即ち、ディレイ412〜414の出力より、ブロッ
クサイズ決定回路411へ出力している。同時に、ディ
レイ412の出力は出力端子417へ、ディレイ41
2、413の出力はウィンドウ形状決定回路415へ接
続している。このディレイ412〜414からの出力は
ブロックサイズ修正回路411においてより長い時間幅
でのブロックサイズの変化を該当ブロックのブロックサ
イズの決定に役立てる働き、例えば、過去頻繁により時
間的に短いブロックサイズが選択されている場合は、時
間的に短いブロックサイズの選択を増やし、過去におい
て時間的に短いブロックサイズの選択がなされてない場
合においては、時間的に長いブロックサイズの選択を増
やす等の判断を可能としている。なお、このディレイ群
はウィンドウ決定回路415及び出力端子417に必要
なディレイ412、413を除けば、そのタップ数は装
置の実際的な構成、規模により増減させて用いられる場
合もある。ウィンドウ形状決定回路415ではブロック
サイズ修正回路411の出力、即ち、該当ブロックの時
間的に隣接する1つ後のブロックサイズとディレイ41
2の出力、即ち、該当ブロックのブロックサイズとディ
レイ413の出力、即ち、該当ブロックの時間的隣接す
る1つ前のブロックサイズとから、上述の図2の各MD
CT回路203〜205において使用されるウィンドウ
の形状を決定し、出力端子416へ出力する。図4の出
力端子417、即ち、ブロックサイズ情報と出力端子4
16、即ち、ウィンドウ形状情報が、図2のブロックサ
イズ決定回路206〜208の出力として各部へ接続さ
れる。
Next, in the delays 412 to 414, the past orthogonal transform block sizes are sequentially recorded, and are output to the block size determination circuit 411 from the outputs of the taps, ie, the outputs of the delays 412 to 414. At the same time, the output of the delay 412 is sent to the output terminal 417 and the delay 41
The outputs of 2, 413 are connected to a window shape determination circuit 415. The outputs from the delays 412 to 414 serve to help the block size correction circuit 411 determine the block size of the corresponding block based on a change in the block size over a longer time period. For example, a block size that is shorter in time in the past is frequently selected. If it is, it is possible to increase the selection of the block size that is short in time, and if the selection of the block size that is short in time has not been made in the past, it is possible to determine that the selection of the block size that is long in time is increased. And It should be noted that the number of taps of this delay group may be increased or decreased depending on the actual configuration and scale of the apparatus, except for the delays 412 and 413 required for the window determination circuit 415 and the output terminal 417. In the window shape determination circuit 415, the output of the block size correction circuit 411, that is, the block size of the next block which is temporally adjacent to the corresponding block and the delay 41
2 from the output of the block 2, ie, the block size of the block, and the output of the delay 413, ie, the immediately preceding block size of the block in question.
The shape of the window used in the CT circuits 203 to 205 is determined and output to the output terminal 416. The output terminal 417 shown in FIG.
16, ie, the window shape information is connected to each unit as an output of the block size determination circuits 206 to 208 in FIG.

【0053】ここでウィンドウ形状決定回路415にお
いて決定されるウィンドウの形状について説明する。図
5に隣接するブロックとウィンドウの形状の様子を示
す。図6の(a)〜(c)より判るように、図中点線及
び実線で示すように直交変換に使用されるウィンドウは
時間的に隣接するブロックとの間で重複する部分があ
り、本実施例では、隣接するブロックの中心まで重複す
る形状を採用しているため、隣接するブロックの直交変
換サイズによりウィンドウの形状が変化する。
Here, the window shape determined by the window shape determining circuit 415 will be described. FIG. 5 shows the shape of the adjacent block and window. As can be seen from FIGS. 6 (a) to 6 (c), the window used for the orthogonal transformation has a portion overlapping with the temporally adjacent block as shown by the dotted line and the solid line in FIG. In the example, since the shape overlapping the center of the adjacent block is adopted, the shape of the window changes depending on the orthogonal transformation size of the adjacent block.

【0054】図6には上記ウィンドウ形状の詳細を示
す。図6においてウィンドウ関数f(n)、g(n+
N)は次式(1)を満たす関数として与えられる。
FIG. 6 shows details of the window shape. In FIG. 6, window functions f (n) and g (n +
N) is given as a function satisfying the following equation (1).

【0055】 f(n)×f(L−1−n)=g(n)×g(L−1−n) f(n)×f(n)+g(n)×g(n)=1 ・・・(1) 0≦n≦L−1。F (n) × f (L-1-n) = g (n) × g (L-1-n) f (n) × f (n) + g (n) × g (n) = 1 ... (1) 0≤n≤L-1.

【0056】この式(1)におけるLは、隣接する変換
ブロック長が同一であればそのまま変換ブロック長とな
るが、隣接する変換ブロック長が異なる場合は、より短
いほうの変換ブロック長をLとし、より長い変換ブロッ
ク長をKとすると、ウィンドウが重複しない領域におい
ては、次式(2)として与えられる。
L in the equation (1) is the conversion block length if the adjacent conversion block lengths are the same, but if the adjacent conversion block lengths are different, the shorter conversion block length is set to L. , K is a longer conversion block length, and in a region where the windows do not overlap, it is given by the following equation (2).

【0057】 f(n)=g(n)=1 K≦n≦3K/2−L/2 f(n)=g(n)=0 3K/2+L≦n≦2K ・・・(2) この様にウィンドウの重複部分をできる限り長く取るこ
とにより、直交変換の際のスペクトルの周波数分解能を
良好なものとしている。以上の説明から明らかな様に、
直交変換に使用するウィンドウの形状は時間的に連続す
る3ブロック分の直交変換サイズが確定した後、決定さ
れる。したがって、図4の入力端子401〜403から
入力される信号のブロックと出力端子416、417か
ら出力される信号のブロックは本実施例において1ブロ
ック分の差異を生じている。
F (n) = g (n) = 1 K ≦ n ≦ 3K / 2−L / 2 f (n) = g (n) = 0 3K / 2 + L ≦ n ≦ 2K (2) In this way, by making the overlapping portion of the window as long as possible, the frequency resolution of the spectrum at the time of orthogonal transformation is improved. As is clear from the above explanation,
The shape of the window used for the orthogonal transform is determined after the orthogonal transform size of three temporally continuous blocks is determined. Therefore, in the present embodiment, there is a difference of one block between the signal blocks input from the input terminals 401 to 403 and the signal blocks output from the output terminals 416 and 417 in FIG.

【0058】また、図4のパワー算出回路405、40
6及びパワー比較回路409を省略しても図2のブロッ
クサイズ決定回路206〜208を構成することは可能
である。さらにウィンドウの形状を直交変換ブロックの
取りうる時間的に最小のブロックサイズに固定すること
によってその種類を1種類とし、図4のディレイ412
〜414及びブロックサイズ修正回路411並びにウィ
ンドウ形状決定回路415を省略して構成することも可
能である。特に、処理時間の遅延を好まない応用例にお
いては上述の省略により遅延の少ない構成となり、有効
に作用する。
The power calculation circuits 405 and 40 shown in FIG.
6 and the power comparison circuit 409 can be omitted to configure the block size determination circuits 206 to 208 in FIG. Further, by fixing the shape of the window to the minimum temporal block size that the orthogonal transform block can take, the type is made one type, and the type of the window is determined by the delay 412 shown in FIG.
414, the block size correction circuit 411, and the window shape determination circuit 415 may be omitted. Particularly, in an application example in which a delay in the processing time is not desired, the above-described omission causes a configuration with a small delay, which effectively operates.

【0059】再び図2において、各MDCT回路203
〜205にてMDCT処理されて得られた周波数軸上の
スペクトルデータ或いはMDCT係数データは、適応ビ
ット割当符号化回路210〜212、ブロックフローテ
ィングユニット決定回路219〜221及びビット配分
算出回路209に伝送している。ブロックフローティン
グユニット決定回路219〜221では、先のスペクト
ルデータ或いはMDCT係数データより、エネルギ或い
はパワーに集中度に応じてフローティング処理を行う単
位であるブロックフローティングのユニットを決定し、
適応ビット割当符号化回路210〜212に伝送すると
共に、前述のブロックサイズ情報、ウィンドウ形状情報
と合わせて、デコードする際の補助情報として出力端子
216〜218より出力している。
Referring again to FIG. 2, each MDCT circuit 203
The spectrum data or MDCT coefficient data on the frequency axis obtained by performing the MDCT processing in steps 205 to 205 are transmitted to adaptive bit allocation coding circuits 210 to 212, block floating unit determination circuits 219 to 221 and bit allocation calculation circuit 209. ing. The block floating unit determination circuits 219 to 221 determine a block floating unit, which is a unit for performing a floating process in accordance with the degree of concentration in energy or power, from the previous spectrum data or MDCT coefficient data,
The information is transmitted to the adaptive bit allocation encoding circuits 210 to 212 and output from the output terminals 216 to 218 as auxiliary information for decoding together with the above-described block size information and window shape information.

【0060】ここで、図7に図2のブロックフローティ
ングユニット決定回路219〜221の一具体例の概略
構成を表すブロック回路図を示す。この図7を用いてブ
ロックフローティングユニット決定回路の作用について
説明する。この図7において、入力端子301には、上
記各MDCT回路203〜205からの周波数軸上のス
ペクトルデータ或いはMDCT係数データが供給されて
いる。このスペクトルデータ或いはMDCT係数データ
は、変化分算出回路303に送られている。変化分算出
回路303では、スペクトルデータ或いはMDCT係数
データの強度を周波数で微分し、微係数を求めることに
よって、周波数毎の変化分を算出し、積算比較回路30
4へ伝送している。積算比較回路304では、周波数毎
の変化分データを周波数の低い順に積算し、しきい値出
力回路308より出力されるしきい値と比較している。
さらに、積算値がしきい値を越えた時点の周波数をユニ
ットの境界の周波数として、ブロックフローティングユ
ニット決定回路305に伝送すると共に、積算のデータ
をゼロにして再度、積算を開始し、全ての周波数の変化
分データについて上述の動作を行っている。しきい値出
力回路308では、ブロックフローティングユニット内
の変化量が一定以下となるように、しきい値を出力する
働きをしており、本実施例においては、周波数的に高域
ほどしきい値が大きくなるような傾斜配分を施して良好
な結果を得ている。このしきい値を応用例、入力信号等
によっても可変とするとより良好な結果が得られると共
に、応用例によっては定数とし、構成を簡易化すること
も可能である。
Here, FIG. 7 is a block circuit diagram showing a schematic configuration of one specific example of the block floating unit determination circuits 219 to 221 of FIG. The operation of the block floating unit determination circuit will be described with reference to FIG. In FIG. 7, an input terminal 301 is supplied with spectrum data or MDCT coefficient data on the frequency axis from the MDCT circuits 203 to 205. This spectrum data or MDCT coefficient data is sent to the variation calculating circuit 303. The variation calculating circuit 303 calculates the variation for each frequency by differentiating the intensity of the spectrum data or MDCT coefficient data with respect to frequency and obtaining a differential coefficient.
4 is transmitted. The integration and comparison circuit 304 integrates the variation data for each frequency in ascending order of frequency and compares it with the threshold value output from the threshold value output circuit 308.
Further, the frequency at the time when the integrated value exceeds the threshold value is transmitted to the block floating unit determination circuit 305 as the frequency of the unit boundary, the integration data is set to zero, the integration is started again, and all the frequencies are started. The above-described operation is performed for the change data. The threshold value output circuit 308 functions to output a threshold value so that the amount of change in the block floating unit is equal to or less than a certain value. And a good result has been obtained by applying a gradient distribution such that is large. If this threshold value is made variable depending on an application example, an input signal or the like, better results can be obtained, and depending on the application example, a constant can be used to simplify the configuration.

【0061】次に、ブロックフローティングユニット決
定回路305では、積算比較回路304より伝送された
ユニットの境界となる周波数と、入力端子302より入
力されるところの、図2のビット配分算出回路209の
出力であるビット配分を基にブロックフローティングユ
ニットを決定し、ユニット修正回路306及びエネルギ
ー算出回路307に伝送している。この際のブロックフ
ローティングユニットの境界は、基本的には上述の積算
比較回路304より伝送されたユニットの境界となる周
波数によって決定されるが、ビット配分の出力が、隣接
するユニットで共にゼロとなっている場合、ブロックフ
ローティングユニットを分離する利点が消滅するため
に、同一のブロックフローティングユニットとなるよう
に修正を行っている。また、ユニット修正回路306で
は、ブロックフローティングユニット決定回路305よ
り伝送されたブロックフローティングユニットの境界を
エネルギー算出回路307の出力と標準ユニット出力回
路307の出力から修正を行い、出力端子310より出
力し、図2の適応ビット割当符号化回路210〜212
及び出力端子216〜218に伝送している。エネルギ
ー算出回路307では、ブロックフローティングユニッ
ト決定回路305より伝送されたユニット内のスペクト
ルデータ或いはMDCT係数データをユニット毎に積算
することによって、ユニット毎のエネルギーを算出し、
ユニット修正回路306に伝送している。ユニット修正
回路306では、伝送されたユニット毎のエネルギーが
一定以下の場合には、該当ユニットを独立とせずに、隣
接するユニットと共通のユニットとしている。これは周
波数的に幅の狭い限られた部分で強度の大きいデータは
独立のユニットを構成し、同様に幅の狭い部分で小さい
データは独立のユニットを構成しないようにする働きを
している。
Next, in the block floating unit determination circuit 305, the frequency which becomes the boundary of the unit transmitted from the integration comparison circuit 304 and the output of the bit allocation calculation circuit 209 of FIG. The block floating unit is determined on the basis of the bit allocation, and transmitted to the unit correction circuit 306 and the energy calculation circuit 307. At this time, the boundary of the block floating unit is basically determined by the frequency serving as the boundary of the unit transmitted from the integration and comparison circuit 304, but the output of the bit allocation becomes zero in both adjacent units. In this case, since the advantage of separating the block floating unit disappears, the modification is performed so that the same block floating unit is used. Further, in the unit correction circuit 306, the boundary of the block floating unit transmitted from the block floating unit determination circuit 305 is corrected from the output of the energy calculation circuit 307 and the output of the standard unit output circuit 307, and output from the output terminal 310. The adaptive bit allocation encoding circuits 210 to 212 in FIG.
And output terminals 216-218. The energy calculation circuit 307 calculates the energy for each unit by integrating the spectrum data or MDCT coefficient data in the unit transmitted from the block floating unit determination circuit 305 for each unit,
The data is transmitted to the unit correction circuit 306. In the unit correction circuit 306, when the transmitted energy of each unit is equal to or less than a certain value, the corresponding unit is not made independent and is set as a common unit with an adjacent unit. This has the function of preventing high-intensity data from forming an independent unit in a limited portion with a narrow width in frequency, and similarly preventing small data from forming an independent unit in a narrow portion with a narrow width.

【0062】さらに、標準ユニット出力回路309で
は、標準ブロックフローティングユニットの構成、応用
例においては、最低域の隣接した2帯域の帯域幅は同じ
で、より高い周波数帯域では高い周波数帯域ほどバンド
幅を広く選定し、各周波数帯域毎に直交変換を行って、
得られた周波数軸のスペクトルデータを、低域では、前
述した人間の聴覚特性を考慮したいわゆる臨界帯域幅
(クリティカルバンド)毎に、中高域ではブロックフロ
ーティング効率を考慮して臨界帯域幅を細分化した帯域
毎に分割したユニットを出力している。応用例において
は、この標準ブロックフローティングユニッとは、量子
化の為のバンドと共通となっており、圧縮後のスペクト
ルデータ或いはMDCT係数データ部分以外のデータ
(補助データ)が少なくて済むという利点を持ってい
る。一方、ブロックフローティングの効率についてのみ
注目すると、変化の大きい部分を全て独立のユニットと
構成した場合が、最良となるが、その場合の先の補助デ
ータは増加する結果となる。従って、総合的な情報の有
効利用は、補助データの量との兼ね合いで決定される。
そこで、図7のユニット補正回路306では、上述のエ
ネルギー算出回路307の出力による補正後のユニット
における補助データの量とブロックフローティングの効
率並びに量子化の際に必要とする情報量を評価し、標準
ユニットを採用した場合よりも効率が良い場合のみ、先
に求めたユニットを採用している。
Further, in the standard unit output circuit 309, in the configuration of the standard block floating unit and in the applied example, the bandwidths of the two lowest bands adjacent to each other are the same, and the higher the frequency band, the higher the bandwidth. Widely selected, perform orthogonal transformation for each frequency band,
The obtained spectrum data on the frequency axis is subdivided into the critical band (critical band) in the low band for each so-called critical band in consideration of the human auditory characteristics described above, and the critical band in the middle and high band in consideration of the block floating efficiency. The unit divided for each divided band is output. In an application example, the standard block floating unit is common to a band for quantization, and has an advantage that data (auxiliary data) other than the compressed spectrum data or MDCT coefficient data portion can be reduced. have. On the other hand, focusing only on the efficiency of block floating, it is best if all the parts having large changes are configured as independent units. However, in this case, the number of auxiliary data increases. Therefore, the effective use of comprehensive information is determined in consideration of the amount of auxiliary data.
Therefore, the unit correction circuit 306 in FIG. 7 evaluates the amount of auxiliary data, the efficiency of block floating, and the amount of information required at the time of quantization in the unit after correction based on the output of the energy calculation circuit 307 described above. Only when the efficiency is higher than when the unit is adopted, the unit obtained earlier is adopted.

【0063】ここで、図8を用いて、上記ブロックフロ
ーティングユニットの作用について説明する。図8の
(a)は、図7の入力端子301より入力されたスペク
トルデータ或いはMDCT係数データの一部を示してい
る。ここで、標準ブロックフローティングユニットの構
成では、上記周波数部分においては、波線で範囲を示し
てあるような、3個の均等な周波数幅を持つブロックフ
ローティングユニット、N−1,N,N+1を構成する
ものとする。この状態において、N−1のユニットで
は、N−1(2)のデータのみ、他のデータよりも大き
く、このデータによってブロックフローティング係数が
決定される為に、N−1(2)以外のデータを先のブロ
ックフローティング係数で正規化すると、効率の悪い、
即ち、正規化後のデータの最上位桁のいくつかがゼロと
なる、結果となる。
Here, the operation of the block floating unit will be described with reference to FIG. FIG. 8A illustrates a part of the spectrum data or MDCT coefficient data input from the input terminal 301 of FIG. Here, in the configuration of the standard block floating unit, in the above-mentioned frequency portion, three block floating units N-1, N, and N + 1 having a uniform frequency width as indicated by broken lines are formed. Shall be. In this state, in the N-1 unit, only the data of N-1 (2) is larger than the other data, and the block floating coefficient is determined by this data. Is normalized by the preceding block floating coefficient,
That is, the result is that some of the most significant digits of the normalized data are zero.

【0064】図8の(b)中、実線のグラフは、図8の
(a)のスペクトルデータ或いはMDCT係数データを
周波数で微分した微係数、dP/dfを表している。さ
らに、同図中の棒グラフは前述の微係数、dP/dfを
積算した値、Σ(dP/df)を示している。ここで、
図7のしきい値出力回路308の出力値を同図中、一点
鎖線で示した値とすると、N−1(2)とN−1(3)
のデータ間で積算値、Σ(dP/df)が先のしきい値
を越えるため、ここにブロックフローティングユニッと
の境界が設定される。図8の(c)は、以上の様にして
求めた境界によって構成したブロックフローティングユ
ニットを示す図である。図より明らかなように、図8の
(c)では、最初のユニット、N’−1の周波数幅が狭
くなり、ユニット内の各データの偏差が減少している
為、図8(のa)と比較して、ブロックフローティング
の効率が改善している。また、前述のように、周波数の
低いデータから高いデータへと変化分の積算を行うよう
にしている為、データの大きな変化の直前がユニットの
境界となる場合が多くなり、ピークのデータの周波数の
低いほうの近傍のデータのブロックフローティング、並
びに量子化の制御が容易となる。従って、より低い周波
数音へのマスキングが周波数の高い音よりも効きにくい
という、聴覚上の特性にも合致しており、良好な圧縮が
実現できる。
In FIG. 8B, a solid line graph represents a differential coefficient, dP / df, obtained by differentiating the spectrum data or MDCT coefficient data of FIG. 8A with respect to frequency. Further, the bar graph in the figure shows a value obtained by integrating the above-described differential coefficient and dP / df, Σ (dP / df). here,
Assuming that the output value of the threshold value output circuit 308 in FIG. 7 is a value indicated by a dashed line in FIG. 7, N-1 (2) and N-1 (3)
Since the integrated value, Σ (dP / df), exceeds the above-mentioned threshold value between the above data, the boundary with the block floating unit is set here. FIG. 8C is a diagram showing a block floating unit constituted by the boundaries obtained as described above. As is clear from the figure, in FIG. 8C, since the frequency width of the first unit, N′−1, becomes narrow and the deviation of each data in the unit decreases, FIG. The efficiency of block floating is improved as compared with. In addition, as described above, since the integration of the change from low-frequency data to high-frequency data is performed, the boundary of the unit immediately before a large change in the data often becomes a unit boundary. , Block floating of the data in the lower neighborhood and quantization control are facilitated. Therefore, masking to lower frequency sounds is less effective than higher frequency sounds, which is consistent with the auditory characteristic, and good compression can be realized.

【0065】再び図2において、ビット配分算出回路2
09は、前述のクリティカルバンド及びブロックフロー
ティングユニット決定回路219〜221によって伝送
されたブロックフローティングを考慮して分割されたス
ペクトルデータに基づき、いわゆるマスキング効果等を
考慮してクリティカルバンド及びブロックフローティン
グを考慮した各分割帯域毎のマスキング量を求め、この
マスキング量とクリティカルバンド及びブロックフロー
ティングを考慮した各分割帯域毎のエネルギあるいはピ
ーク値等に基づいて、各帯域毎に割当ビット数を求め、
適応ビット割当符号化回路210〜212へ伝送してい
る。適応ビット割当符号化回路210〜212では各帯
域毎に割り当てられたビット数に応じて各スペクトルデ
ータ(あるいはMDCT係数データ)を量子化してい
る。このようにして符号化されたデータは、出力端子2
13〜215を介して取り出される。
Referring again to FIG. 2, bit allocation calculating circuit 2
09 is based on the spectrum data divided in consideration of the block floating transmitted by the above-described critical band and block floating unit determination circuits 219 to 221, and takes into account the so-called masking effect and the like, and takes the critical band and the block floating into consideration. The masking amount for each divided band is obtained, and the number of bits allocated to each band is obtained based on the masking amount and the energy or peak value of each divided band in consideration of the critical band and block floating.
It is transmitted to the adaptive bit allocation coding circuits 210 to 212. Adaptive bit allocation encoding circuits 210 to 212 quantize each spectrum data (or MDCT coefficient data) according to the number of bits allocated to each band. The data encoded in this manner is output to output terminal 2
13 to 215.

【0066】次に、図9は上記ビット割当算出回路20
9の一具体例の概略構成を示すブロック回路図である。
この図9を用いてビット割当算出回路の作用について説
明する。この図9において、入力端子701には、図2
のMDCT回路203〜205からの周波数軸上のスペ
クトルデータ或いはMDCT係数データが供給されてい
る。この周波数軸上の入力データは、帯域毎のエネルギ
算出回路702に送られて、上記マスキング量とクリテ
ィカルバンド及びブロックフローティングを考慮した各
分割帯域のエネルギが、例えば当該バンド内での各振幅
値の総和を計算すること等により求められる。この各バ
ンド毎のエネルギの代わりに、振幅値のピーク値、平均
値等が用いられることもある。このエネルギ算出回路7
02からの出力として、例えば各バンドの総和値のスペ
クトルを図10にSBとして示している。ただし、この
図10では、図示を簡略化するため、上記マスキング量
とクリティカルバンド及びブロックフローティングを考
慮した分割帯域数を12バンド(B1 〜B12)で表現し
ている。
Next, FIG. 9 shows the bit allocation calculating circuit 20.
9 is a block circuit diagram illustrating a schematic configuration of one specific example of Ninth Embodiment 9. FIG.
The operation of the bit allocation calculation circuit will be described with reference to FIG. In FIG. 9, the input terminal 701 is
The spectrum data or MDCT coefficient data on the frequency axis is supplied from the MDCT circuits 203 to 205. The input data on the frequency axis is sent to the energy calculation circuit 702 for each band, and the energy of each divided band in consideration of the masking amount and the critical band and the block floating is, for example, the value of each amplitude value in the band. It is obtained by calculating the sum. Instead of the energy for each band, a peak value or an average value of the amplitude value may be used. This energy calculation circuit 7
As an output from 02, for example, the spectrum of the sum value of each band is shown as SB in FIG. However, in FIG. 10, for simplicity of illustration, the number of divided bands in consideration of the masking amount, the critical band, and the block floating is represented by 12 bands (B1 to B12).

【0067】ここで、上記スペクトルSBのいわゆるマ
スキングに於ける影響を考慮するために、該スペクトル
SBに所定の重み付け関数を掛けて加算するような畳込
み(コンボリューション)処理を施す。このため、上記
帯域毎のエネルギ算出回路702の出力すなわち該スペ
クトルSBの各値は、畳込みフイルタ回路703に送ら
れる。該畳込みフイルタ回路703は、例えば、入力デ
ータを順次遅延させる複数の遅延素子と、これら遅延素
子からの出力にフイルタ係数(重み付け関数)を乗算す
る複数の乗算器(例えば各バンドに対応する25個の乗
算器)と、各乗算器出力の総和をとる総和加算器とから
構成されるものである。この畳込み処理により、図10
中点線で示す部分の総和がとられる。
Here, in order to consider the effect of the spectrum SB on so-called masking, a convolution process is performed such that the spectrum SB is multiplied by a predetermined weighting function and added. Therefore, the output of the energy calculation circuit 702 for each band, that is, each value of the spectrum SB is sent to the convolution filter circuit 703. The convolution filter circuit 703 includes, for example, a plurality of delay elements for sequentially delaying input data and a plurality of multipliers (for example, 25 corresponding to each band) for multiplying an output from these delay elements by a filter coefficient (weighting function). Multipliers) and a sum adder for summing the outputs of the multipliers. By this convolution processing, FIG.
The sum of the parts indicated by the dotted lines is calculated.

【0068】ここで、上記畳込みフイルタ回路703の
各乗算器の乗算係数(フイルタ係数)の一具体例を示す
と、任意のバンドに対応する乗算器Mの係数を1とする
とき、乗算器M−1で係数0.15を、乗算器M−2で
係数0.0019を、乗算器M−3で係数0.0000
086を、乗算器M+1で係数0.4を、乗算器M+2
で係数0.06を、乗算器M+3で係数0.007を各
遅延素子の出力に乗算することにより、上記スペクトル
SBの畳込み処理が行われる。ただし、Mは1〜25の
任意の整数である。
Here, a specific example of the multiplication coefficient (filter coefficient) of each multiplier of the convolution filter circuit 703 will be described. When the coefficient of the multiplier M corresponding to an arbitrary band is 1, the multiplier M-1 is a coefficient of 0.15, multiplier M-2 is a coefficient of 0.0019, and multiplier M-3 is a coefficient of 0.00000.
086, a coefficient 0.4 by a multiplier M + 1, and a multiplier M + 2
Is multiplied by the coefficient 0.06 by the multiplier M + 3 and the coefficient 0.007 by the multiplier M + 3, thereby performing the convolution processing of the spectrum SB. Here, M is an arbitrary integer of 1 to 25.

【0069】次に、上記畳込みフイルタ回路703の出
力は引算器704に送られる。該引算器704は、上記
畳込んだ領域での後述する許容可能なノイズレベルに対
応するレベルαを求めるものである。なお、当該許容可
能なノイズレベル(許容ノイズレベル)に対応するレベ
ルαは、後述するように、逆コンボリューション処理を
行うことによって、クリテイカルバンドの各バンド毎の
許容ノイズレベルとなるようなレベルである。ここで、
上記引算器704には、上記レベルαを求めるための許
容関数(マスキングレベルを表現する関数)が供給され
る。この許容関数を増減させることで上記レベルαの制
御を行っている。当該許容関数は、次に説明するような
(n−ai)関数発生回路705から供給されているも
のである。
Next, the output of the convolution filter circuit 703 is sent to a subtractor 704. The subtractor 704 calculates a level α corresponding to an allowable noise level described later in the convolved area. The level α corresponding to the permissible noise level (permissible noise level) is, as described later, a level at which the permissible noise level of each band of the critical band is obtained by performing inverse convolution processing. It is. here,
The subtractor 704 is supplied with an allowance function (a function expressing a masking level) for obtaining the level α. The level α is controlled by increasing or decreasing the allowable function. The permissible function is supplied from the (n-ai) function generation circuit 705 described below.

【0070】すなわち、許容ノイズレベルに対応するレ
ベルαは、クリテイカルバンドのバンドの低域から順に
与えられる番号をiとすると、次の(3)式で求めるこ
とができる。 α=S−(n−ai) ・・・(3) この(3)式において、n,aは定数でa>0、Sは畳
込み処理されたバークスペクトルの強度であり、(3)
式中(n−ai)が許容関数となる。本実施例では n=38,a=1 としており、この時の音質劣化はなく、良好な符号化が
行えた。
That is, the level α corresponding to the allowable noise level can be obtained by the following equation (3), where i is a number sequentially given from the lower band of the critical band. α = S− (n−ai) (3) In the equation (3), n and a are constants, a> 0, S is the intensity of the convolution-processed bark spectrum, and (3)
In the expression, (n-ai) is the allowable function. In the present embodiment, n = 38 and a = 1, and there was no deterioration in sound quality at this time, and good coding could be performed.

【0071】このようにして、上記レベルαが求めら
れ、このデータは、割算器706に伝送される。当該割
算器706では、上記畳込みされた領域での上記レベル
αを逆コンボリューションするためのものである。した
がって、この逆コンボリューション処理を行うことによ
り、上記レベルαからマスキングスペクトルが得られる
ようになる。すなわち、このマスキングスペクトルが許
容ノイズスペクトルとなる。なお、上記逆コンボリュー
ション処理は、複雑な演算を必要とするが、本実施例で
は簡略化した割算器706を用いて逆コンボリューショ
ンを行っている。
In this way, the level α is obtained, and this data is transmitted to the divider 706. The divider 706 is for inversely convolving the level α in the convolved area. Therefore, by performing the inverse convolution processing, a masking spectrum can be obtained from the level α. That is, this masking spectrum becomes an allowable noise spectrum. Note that the above inverse convolution process requires a complicated operation, but in the present embodiment, inverse convolution is performed using a simplified divider 706.

【0072】次に、上記マスキングスペクトルは、合成
回路707を介して減算器708に伝送される。ここ
で、当該減算器708には、上記帯域毎のエネルギ検出
回路702からの出力、すなわち前述したスペクトルS
Bが、遅延回路709を介して供給されている。したが
って、この減算器708で上記マスキングスペクトルと
スペクトルSBとの減算演算が行われることで、図11
示すように、上記スペクトルSBは、該マスキングスペ
クトルMSのレベルで示すレベル以下がマスキングされ
ることになる。
Next, the masking spectrum is transmitted to a subtractor 708 via a synthesis circuit 707. Here, the output from the energy detection circuit 702 for each band, that is, the spectrum S
B is supplied via a delay circuit 709. Therefore, the subtracter 708 performs a subtraction operation between the masking spectrum and the spectrum SB, thereby obtaining the signal shown in FIG.
As shown, the spectrum SB is masked below the level indicated by the level of the masking spectrum MS.

【0073】当該減算器708からの出力は、許容雑音
補正回路710を介し、出力端子711を介して取り出
され、例えば割当てビット数情報が予め記憶されたRO
M等(図示せず)に送られる。このROM等は、上記減
算回路708から許容雑音補正回路710を介して得ら
れた出力(上記各バンドのエネルギと上記ノイズレベル
設定手段の出力との差分のレベル)に応じ、各バンド毎
の割当ビット数情報を出力する。この割当ビット数情報
が図2の適応ビット割当符号化回路210〜212に送
られることで、図2のMDCT回路203〜205から
の周波数軸上の各スペクトルデータがそれぞれのバンド
毎に割り当てられたビット数で量子化されるわけであ
る。
The output from the subtracter 708 is taken out via an allowable noise correction circuit 710 and an output terminal 711.
M and the like (not shown). The ROM or the like assigns each band in accordance with the output (the level of the difference between the energy of each band and the output of the noise level setting means) obtained from the subtraction circuit 708 via the allowable noise correction circuit 710. Output bit number information. By transmitting the allocated bit number information to the adaptive bit allocation coding circuits 210 to 212 in FIG. 2, each spectrum data on the frequency axis from the MDCT circuits 203 to 205 in FIG. 2 is allocated to each band. It is quantized by the number of bits.

【0074】すなわち要約すれば、図2の適応ビット割
当符号化回路210〜212では、上記マスキング量と
クリテイカルバンド及びブロックフローティングを考慮
した各分割帯域のエネルギと上記ノイズレベル設定手段
の出力との差分のレベルに応じて割当てられたビット数
で上記各バンド毎のスペクトルデータを量子化すること
になる。なお、図9の遅延回路709は上記合成回路7
07以前の各回路での遅延量を考慮してエネルギ検出回
路702からのスペクトルSBを遅延させるために設け
られている。
That is, in summary, in the adaptive bit allocation coding circuits 210 to 212 of FIG. 2, the masking amount, the energy of each divided band in consideration of the critical band and block floating, and the output of the noise level setting means are output. The spectral data of each band is quantized by the number of bits allocated according to the level of the difference. Note that the delay circuit 709 in FIG.
It is provided to delay the spectrum SB from the energy detection circuit 702 in consideration of the amount of delay in each circuit before 07.

【0075】ところで、上述した合成回路707での合
成の際には、最小可聴カーブ発生回路712から供給さ
れる図12に示すような人間の聴覚特性であるいわゆる
最小可聴カーブRCを示すデータと、上記マスキングス
ペクトルMSとを合成することができる。この最小可聴
カーブにおいて、雑音絶対レベルがこの最小可聴カーブ
以下ならば該雑音は聞こえないことになる。この最小可
聴カーブは、コーデイングが同じであっても例えば再生
時の再生ボリユームの違いで異なるものとなが、現実的
なディジタルシステムでは、例えば16ビットダイナミ
ツクレンジへの音楽のはいり方にはさほど違いがないの
で、例えば4kHz付近の最も耳に聞こえやすい周波数
帯域の量子化雑音が聞こえないとすれば、他の周波数帯
域ではこの最小可聴カーブのレベル以下の量子化雑音は
聞こえないと考えられる。したがって、このように例え
ばシステムの持つワードレングスの4kHz付近の雑音
が聞こえない使い方をすると仮定し、この最小可聴カー
ブRCとマスキングスペクトルMSとを共に合成するこ
とで許容ノイズレベルを得るようにすると、この場合の
許容ノイズレベルは、図12中の斜線で示す部分までと
することができるようになる。なお、本実施例では、上
記最小可聴カーブの4kHzのレベルを、例えば20ビ
ット相当の最低レベルに合わせている。また、この図1
2は、信号スペクトルSSも同時に示している。
By the way, at the time of synthesizing by the synthesizing circuit 707, data indicating a so-called minimum audible curve RC which is a human auditory characteristic as shown in FIG. The masking spectrum MS can be synthesized. At this minimum audible curve, if the absolute noise level is below this minimum audible curve, the noise will not be heard. Although the minimum audible curve is different depending on the reproduction volume at the time of reproduction, for example, even if the coding is the same, in a realistic digital system, for example, the method of entering music into the 16-bit dynamic range is not considered. Since there is not much difference, if quantization noise in the most audible frequency band around 4 kHz is not heard, for example, it is considered that quantization noise below the level of the minimum audible curve is not heard in other frequency bands. . Therefore, assuming that the system is used in such a manner that noise around 4 kHz of the word length of the system cannot be heard, and an allowable noise level is obtained by synthesizing the minimum audible curve RC and the masking spectrum MS together, In this case, the allowable noise level can be set up to the shaded portion in FIG. In this embodiment, the 4 kHz level of the minimum audible curve is adjusted to the lowest level corresponding to, for example, 20 bits. FIG.
2 also shows the signal spectrum SS at the same time.

【0076】また、上記許容雑音補正回路710では、
補正情報出力回路713から送られてくる例えば等ラウ
ドネスカーブの情報に基づいて、上記減算器708から
の出力における許容雑音レベルを補正している。ここ
で、等ラウドネスカーブとは、人間の聴覚特性に関する
特性曲線であり、例えば1kHzの純音と同じ大きさに
聞こえる各周波数での音の音圧を求めて曲線で結んだも
ので、ラウドネスの等感度曲線とも呼ばれる。またこの
等ラウドネス曲線は、図11に示した最小可聴カーブR
Cと略同じ曲線を描くものである。この等ラウドネス曲
線においては、例えば4kHz付近では1kHzのとこ
ろより音圧が8〜10dB下がっても1kHzと同じ大
きさに聞こえ、逆に、50Hz付近では1kHzでの音
圧よりも約15dB高くないと同じ大きさに聞こえな
い。このため、上記最小可聴カーブのレベルを越えた雑
音(許容ノイズレベル)は、該等ラウドネス曲線に応じ
たカーブで与えられる周波数特性を持つようにするのが
良いことがわかる。このようなことから、上記等ラウド
ネス曲線を考慮して上記許容ノイズレベルを補正するこ
とは、人間の聴覚特性に適合していることがわかる。
In the allowable noise correction circuit 710,
The permissible noise level in the output from the subtracter 708 is corrected based on, for example, information on the equal loudness curve sent from the correction information output circuit 713. Here, the equal loudness curve is a characteristic curve relating to human auditory characteristics. For example, the loudness curve is obtained by calculating the sound pressure of sound at each frequency that sounds as loud as the pure tone of 1 kHz, and connecting the curves with each other. Also called a sensitivity curve. This equal loudness curve is the minimum audible curve R shown in FIG.
It draws substantially the same curve as C. In this equal loudness curve, for example, at around 4 kHz, even if the sound pressure falls by 8 to 10 dB below 1 kHz, it sounds as large as 1 kHz, and conversely, at around 50 Hz, the sound pressure must be about 15 dB higher than the sound pressure at 1 kHz. It doesn't sound the same size. For this reason, it can be seen that noise exceeding the level of the minimum audible curve (allowable noise level) should have a frequency characteristic given by a curve corresponding to the equal loudness curve. From this, it can be seen that correcting the allowable noise level in consideration of the equal loudness curve is suitable for human auditory characteristics.

【0077】さらに、補正情報出力回路713では、上
記適応ビット割当符号化回路210〜212における量
子化の際の出力情報量(データ量)の検出出力と、最終
符号化データのビットレート目標値との間の誤差の情報
に基づいて、上記許容ノイズレベルを補正するようにし
ている。これは、全てのビット割当単位ブロックに対し
て予め一時的な適応ビット割当を行って得られた総ビッ
ト数が、最終的な符号化出力データのビットレートによ
って定まる一定のビット数(目標値)に対して誤差を持
つことがあり、その誤差分を0とするように再度ビット
割当をするものである。すなわち、目標値よりも総割当
ビット数が少ないときには、差のビット数を各単位ブロ
ックに割り振って付加するようにし、目標値よりも総割
当ビット数が多いときには、差のビット数を各単位ブロ
ックに割り振って削るように作用する。
Further, the correction information output circuit 713 detects the output information amount (data amount) at the time of quantization in the adaptive bit allocation encoding circuits 210 to 212, and outputs the bit rate target value of the final encoded data. The permissible noise level is corrected based on the information on the error between. This is because the total number of bits obtained by previously performing temporary adaptive bit allocation for all bit allocation unit blocks is a fixed number of bits (target value) determined by the bit rate of the final encoded output data. May have an error, and the bits are allocated again so that the error becomes zero. That is, when the total number of allocated bits is smaller than the target value, the difference bit number is allocated to each unit block and added. When the total allocated bit number is larger than the target value, the difference bit number is set to each unit block. It works by allocating to and shaving.

【0078】以上のような動作を行うため、上記総割当
ビット数の上記目標値からの誤差を検出し、この誤差デ
ータに応じて補正情報出力回路713が各割当ビット数
を補正するための補正データを出力する。ここで、上記
誤差データがビット数不足を示す場合は、上記単位ブロ
ック当たり多くのビット数が使われることで上記データ
量が上記目標値よりも多くなっている場合を考えること
ができる。また、上記誤差データが、ビット数余りを示
すデータとなる場合は、上記単位ブロック当たり少ない
ビット数で済み、上記データ量が上記目標値よりも少な
くなっている場合を考えることができる。したがって、
上記補正情報出力回路713からは、この誤差データに
応じて、上記減算器708からの出力における許容ノイ
ズレベルを、例えば上記等ラウドネス曲線の情報データ
に基づいて補正させるための上記補正値のデータが出力
されるようになる。上述のような補正値が、上記許容雑
音補正回路710に伝送されることで、上記減算器70
8からの許容ノイズレベルが補正されるようになる。以
上説明したようなシステムでは、メイン情報として直交
変換出力スペクトルをサブ情報により処理したデータと
サブ情報としてブロックフローティングの状態を示すス
ケールファクタ、語長を示すワードレングスが得られ、
エンコーダからデコーダに送られる。
In order to perform the above operation, an error of the total allocated bit number from the target value is detected, and the correction information output circuit 713 corrects each of the allocated bit numbers according to the error data. Output data. Here, when the error data indicates that the number of bits is insufficient, it is possible to consider a case where the data amount is larger than the target value by using a large number of bits per unit block. Further, when the error data is data indicating the remainder of the number of bits, a case where the number of bits per unit block is small and the data amount is smaller than the target value can be considered. Therefore,
From the correction information output circuit 713, in accordance with the error data, the data of the correction value for correcting the allowable noise level in the output from the subtractor 708 based on, for example, the information data of the equal loudness curve is output. Will be output. By transmitting the correction value as described above to the allowable noise correction circuit 710, the subtractor 70
8 is corrected. In the system as described above, the data obtained by processing the orthogonal transform output spectrum with the sub-information as the main information and the scale factor indicating the block floating state as the sub-information, and the word length indicating the word length are obtained.
Sent from encoder to decoder.

【0079】図13は図1のATCデコーダ73、即
ち、上述のごとく高能率符号化されて記録媒体に記録さ
れた信号を再生して得た再生信号、又は伝送媒体を介し
て伝送されて受信された受信信号を、再び復号化するた
めの復号回路を示している。各帯域の量子化されたMD
CT係数、即ち、図2の出力端子213〜215の出力
信号と等価のデータは、復号回路入力107に与えら
れ、使用されたブロックサイズ情報及び、ブロックフロ
ーティング並びに量子化の為の小ブロックの周波数的長
さに関する情報、即ち、図2の出力端子216〜218
の出力信号と等価のデータは、入力端子108に与えら
れる。適応ビット割当復号化回路106では適応ビット
割当情報を用いてビット割当を解除する。次に逆直交変
換(IMDCT)回路103〜105では周波数軸上の
信号が時間軸上の信号に変換される。これらの部分帯域
の時間軸上信号は、帯域合成フィルタ(IQMF)回路
102、101により、全帯域信号に復号化される。
FIG. 13 shows the ATC decoder 73 shown in FIG. 1, that is, a reproduced signal obtained by reproducing a signal recorded on a recording medium after being highly efficient coded as described above, or transmitted and received via a transmission medium. 2 shows a decoding circuit for decoding the received signal again. Quantized MD of each band
The CT coefficients, that is, data equivalent to the output signals of the output terminals 213 to 215 in FIG. 2 are supplied to the decoding circuit input 107, and the used block size information and the frequency of the small block for block floating and quantization are used. 2, ie, the output terminals 216 to 218 of FIG.
Is provided to an input terminal 108. The adaptive bit allocation decoding circuit 106 releases bit allocation using the adaptive bit allocation information. Next, in the inverse orthogonal transform (IMDCT) circuits 103 to 105, signals on the frequency axis are converted into signals on the time axis. The signals on the time axis of these partial bands are decoded into full-band signals by band synthesis filter (IQMF) circuits 102 and 101.

【0080】なお、本発明は上記実施例のみに限定され
るものではなく、例えば、上記の記録再生媒体と信号圧
縮装置あるいは伸張装置と、さらには、信号圧縮装置と
伸張装置とは一体化されている必要はなく、記録媒体を
介せずに、その間をデータ転送用回線や光ケーブル,光
或いは電波による通信等で結ぶ事も可能である。更に例
えば、オーデイオPCM信号のみならず、ディジタル音
声(スピーチ)信号やディジタルビデオ信号等の信号処
理装置にも適用可能である。
The present invention is not limited to the above embodiment. For example, the above-described recording / reproducing medium and a signal compression device or a decompression device, or a signal compression device and a decompression device are integrated. It is not necessary to connect the data, and it is also possible to connect between them by a data transfer line, an optical cable, communication by light or radio waves, etc., without using a recording medium. Further, for example, the present invention is applicable not only to audio PCM signals but also to signal processing devices for digital audio (speech) signals and digital video signals.

【0081】また、上記ディジタル信号圧縮装置により
圧縮されたデータを記録媒体に記録することで、記録容
量の有効利用が図れる。また、この記録媒体としては、
上述した光ディスクのみならず、磁気ディスク、ICメ
モリ及びそのメモリを内蔵するカードや、磁気テープ等
の各種記録媒体とすることもできる。
Further, by recording the data compressed by the digital signal compression device on a recording medium, the recording capacity can be effectively used. In addition, as this recording medium,
Not only the above-described optical disk, but also various types of recording media such as a magnetic disk, an IC memory, a card incorporating the memory, and a magnetic tape can be used.

【0082】[0082]

【発明の効果】以上の説明からも明らかなように、本発
明のディジタル信号圧縮方法及び装置によれば、ブロッ
クフローティング及び/又はビット配分の効率の偏差が
大きくなるような入力信号、言い換えれば、ブロックフ
ローティング及び/又はビット配分の為の時間と周波数
について細分化された各小ブロック内の周波数軸上のデ
ータの大きさに極端なバラツキや特出するピーク成分を
含む信号に対し、その効率の偏差を小さく抑えるような
当該小ブロックの周波数的大きさの選択を行うことで圧
縮効率の偏差の少ないビットの配分を実現できる。これ
により、圧縮の効率の低下を防ぐことができ、同一のビ
ットレートにおいてはより良好な音質を得ることができ
るようになり、又、同一の音質においてはより低いビッ
トレートでの記録、伝送等を実現することが可能とな
る。従って、聴感上、音質の勝れた高能率な圧縮、伸張
を行うことができる。
As is apparent from the above description, according to the digital signal compression method and apparatus of the present invention, an input signal that increases the deviation of the efficiency of block floating and / or bit allocation, in other words, For signals containing extreme variations in the size of data on the frequency axis in each small block subdivided in time and frequency for block floating and / or bit allocation and peak components that stand out, By selecting the frequency size of the small block so as to keep the deviation small, it is possible to realize the distribution of bits with a small deviation in compression efficiency. As a result, a decrease in compression efficiency can be prevented, and better sound quality can be obtained at the same bit rate, and recording, transmission, etc. at a lower bit rate at the same sound quality can be achieved. Can be realized. Therefore, high-efficiency compression and decompression with excellent sound quality can be performed in terms of hearing.

【0083】[0083]

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明ディジタル信号圧縮装置の一実施例とし
ての圧縮データの記録再生装置(ディスク記録再生装
置)の構成例を示すブロック回路図である。
FIG. 1 is a block circuit diagram illustrating a configuration example of a compressed data recording / reproducing device (disk recording / reproducing device) as an embodiment of a digital signal compression device of the present invention.

【図2】本実施例のビットレート圧縮符号化に使用可能
な高能率圧縮符号化エンコーダの一具体例を示すブロッ
ク回路図である。
FIG. 2 is a block circuit diagram showing a specific example of a high-efficiency compression encoding encoder that can be used for bit rate compression encoding according to the embodiment.

【図3】ビット圧縮の際の直交変換ブロックの構造を表
す図である。
FIG. 3 is a diagram illustrating a structure of an orthogonal transform block at the time of bit compression.

【図4】直交変換ブロックサイズを決定する回路の構成
例を示すブロック回路図である。
FIG. 4 is a block circuit diagram illustrating a configuration example of a circuit that determines an orthogonal transform block size.

【図5】時間的に隣接する直交変換ブロックの時間的長
さの変化と直交変換時に用いるウィンドウ形状の関係を
示す図である。
FIG. 5 is a diagram illustrating a relationship between a change in temporal length of orthogonally adjacent orthogonal transform blocks and a window shape used at the time of orthogonal transform.

【図6】直交変換時に用いるウィンドウの形状の詳細例
を示す図である。
FIG. 6 is a diagram illustrating a detailed example of a window shape used at the time of orthogonal transformation.

【図7】ブロックフローティングユニットを決定する回
路の構成例を示すブロック回路図である。
FIG. 7 is a block circuit diagram illustrating a configuration example of a circuit that determines a block floating unit.

【図8】本実施例におけるブロックフローティング決定
回路の作用について、その経過を明示したスペクトルな
らびに微分、積算データを示す図である。
FIG. 8 is a diagram showing a spectrum clearly showing the progress of the operation of the block floating decision circuit in the present embodiment, as well as differential and integrated data.

【図9】ビット配分演算機能を実現する畳込み演算を利
用したビット配分算出回路の例を示すブロック回路図で
ある。
FIG. 9 is a block circuit diagram showing an example of a bit allocation calculation circuit using a convolution operation for realizing a bit allocation operation function.

【図10】各臨界帯域及びブロックフローティングを考
慮して分割された帯域のスペクトルを示す図である。
FIG. 10 is a diagram illustrating spectra of respective critical bands and bands divided in consideration of block floating.

【図11】マスキングスペクトルを示す図である。FIG. 11 is a diagram showing a masking spectrum.

【図12】最小可聴カーブ、マスキングスペクトルを合
成した図である。
FIG. 12 is a diagram in which a minimum audible curve and a masking spectrum are combined.

【図13】上記実施例のビットレート圧縮符号化に使用
可能な高能率圧縮符号化デコーダの一具体例を示すブロ
ック回路図である。
FIG. 13 is a block circuit diagram showing a specific example of a high-efficiency compression encoding decoder that can be used for the bit rate compression encoding of the embodiment.

【符号の説明】[Explanation of symbols]

201、202 帯域分割フィルタ 203〜205 直交変換回路(MDCT) 206〜208 ブロック決定回路 209 ビット配分算出回路 210〜212 適応ビット割当符号化回路 303 変化分算出回路 304 積算比較回路 305 ブロックフローティングユニット決定回路 306 ユニット修正回路 307 エネルギー算出回路 308 しきい値出力回路 309 標準ユニット出力回路 404〜406 パワー算出回路 407 メモリ 408 変化分抽出回路 409 パワー比較回路 410 ブロックサイズ1次決定回路 411 ブロックサイズ修正回路 412〜414 ディレイ 415 ウィンドウ形状決定回路 201, 202 Band division filter 203-205 Orthogonal transformation circuit (MDCT) 206-208 Block determination circuit 209 Bit allocation calculation circuit 210-212 Adaptive bit allocation coding circuit 303 Change calculation circuit 304 Integration comparison circuit 305 Block floating unit determination circuit 306 Unit correction circuit 307 Energy calculation circuit 308 Threshold output circuit 309 Standard unit output circuit 404 to 406 Power calculation circuit 407 Memory 408 Change extraction circuit 409 Power comparison circuit 410 Primary block size determination circuit 411 Block size correction circuit 412 414 delay 415 window shape determination circuit

Claims (10)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 入力ディジタル信号を時間と周波数につ
いて細分化した小ブロックに分配し、圧縮の為のフロー
ティングを施して情報圧縮するディジタル信号圧縮方法
において、 上記入力ディジタル信号の周波数軸上での変化量の積算
値に応じて、上記フローティングを施す小ブロックの周
波数軸上での境界を決定し、決定した上記小ブロック毎
にフローティングを行うことを特徴とするディジタル信
号圧縮方法。
1. A digital signal compression method for distributing an input digital signal into small blocks subdivided with respect to time and frequency, and performing floating for compression to compress information, wherein a change of the input digital signal on a frequency axis is provided. A digital signal compression method, comprising: determining a boundary on the frequency axis of a small block to be floated in accordance with an integrated value of an amount, and performing floating for each of the determined small blocks.
【請求項2】 上記周波数軸上での周波数の変化量の積
算値が、帯域に応じて予め定められた所定のしきい値を
越える周波数を、上記フローティングを施す小ブロック
の境界とすることを特徴とする請求項1記載のディジタ
ル信号圧縮方法。
2. The method according to claim 1, wherein a frequency of which the integrated value of the change in frequency on the frequency axis exceeds a predetermined threshold determined in accordance with a band is set as a boundary of the small block to be floated. 2. The digital signal compression method according to claim 1, wherein:
【請求項3】 入力ディジタル信号の周波数軸上のスペ
クトルデータを得、上記スペクトルデータから許容可能
なノイズスペクトルを求め、上記求めた許容可能なノイ
ズスペクトルを時間と周波数について細分化した小ブロ
ックに分配し、圧縮の為のビット割当を行い行って情報
圧縮するディジタル信号圧縮方法において、 上記入力ディジタル信号の周波数軸上での変化量の積算
値に応じて、圧縮の為のビット割当を行う小ブロックの
周波数軸上での境界を決定し、決定した上記小ブロック
毎にビット割当を行うことを特徴とするディジタル信号
圧縮方法。
3. Obtaining spectrum data on a frequency axis of an input digital signal, obtaining an allowable noise spectrum from the spectrum data, and distributing the obtained allowable noise spectrum into small blocks subdivided in time and frequency. In the digital signal compression method of performing information allocation by performing bit allocation for compression, a small block for performing bit allocation for compression in accordance with an integrated value of a change amount on the frequency axis of the input digital signal. A digital signal compression method, comprising determining a boundary on the frequency axis of (i) and assigning bits to each of the determined small blocks.
【請求項4】 上記周波数軸上での変化量の積算値が、
帯域に応じて予め定められた所定のしきい値を越える周
波数を、上記圧縮の為のビット割当を行う小ブロックの
境界とすることを特徴とする請求項2記載のディジタル
信号圧縮方法。
4. The integrated value of the amount of change on the frequency axis is:
3. The digital signal compression method according to claim 2, wherein a frequency exceeding a predetermined threshold value predetermined according to a band is set as a boundary of the small block to which the bit allocation for the compression is performed.
【請求項5】 ディジタル信号を情報圧縮するディジタ
ル信号圧縮方法において、 入力信号の周波数軸上の特性を算出する工程と、 入力信号を時間と周波数について細分化した小ブロック
に分配し、圧縮の為のフローティングを施す工程と、 周波数軸上のスペクトルデータを得る工程と、 上記スペクトルデータから許容可能なノイズスペクトル
を求る工程と、 上記許容可能なノイズスペクトルを時間と周波数につい
て細分化した小ブロックに分配し、圧縮の為のビット割
当を行う工程と、 入力信号の周波数軸上の特性に応じて、圧縮の為のフロ
ーティングを施す時間と周波数について細分化した小ブ
ロック及び/又は圧縮の為のビット割当を行う時間と周
波数について細分化した小ブロックの周波数的大きさを
変化させる工程とからなり、 上記ブロックフローティングの為の小ブロックとビット
割当の為の小ブロックを共に或いはそれぞれ独立して変
化させることにより、ブロックフローティング並びにビ
ット割当を最適化することを特徴とするディジタル信号
圧縮方法。
5. A digital signal compression method for compressing information of a digital signal, comprising the steps of: calculating a characteristic on a frequency axis of the input signal; distributing the input signal into small blocks subdivided in time and frequency; Performing a floating process, obtaining spectrum data on a frequency axis, obtaining an allowable noise spectrum from the spectrum data, and converting the allowable noise spectrum into small blocks subdivided with respect to time and frequency. A step of distributing and allocating bits for compression, and, according to characteristics on the frequency axis of the input signal, small blocks and / or bits for compression subdivided into time and frequency for performing floating for compression. Changing the frequency size of the small blocks subdivided for the time and frequency at which the allocation is performed, A digital signal compression method characterized by optimizing block floating and bit allocation by changing a small block for block floating and a small block for bit allocation together or independently.
【請求項6】 入力ディジタル信号を情報圧縮するディ
ジタル信号圧縮方法において、 圧縮の為のブロックフローティングを施す時間と周波数
について細分化した小ブロック及び/又は圧縮の為のビ
ット割当を行う時間と周波数について細分化した小ブロ
ックの周波数的大きさを予め定め、 この予め定めた大きさを採用した際の圧縮効率と、入力
ディジタル信号の周波数軸上での変化量の積算値に応じ
て、圧縮の為のフローティングを施す小ブロック及び/
又は圧縮の為のビット割当を行う小ブロックの周波数軸
上での境界を決定したときの圧縮効率とを比較し、 上記比較結果に応じて、より高い効率で情報圧縮を行え
る小ブロックの境界を選択することを特徴とするディジ
タル信号圧縮方法。
6. A digital signal compression method for compressing information of an input digital signal, wherein a time and a frequency for performing block floating for compression are divided into small blocks and / or a time and frequency for performing bit allocation for compression. The frequency size of the subdivided small blocks is determined in advance, and compression is performed in accordance with the compression efficiency when the predetermined size is adopted and the integrated value of the variation of the input digital signal on the frequency axis. Small blocks with floating of
Or, by comparing the compression efficiency when the boundary on the frequency axis of the small block for which bit allocation for compression is determined is determined, the boundary of the small block that can perform information compression with higher efficiency is determined according to the comparison result. A digital signal compression method characterized by selecting.
【請求項7】 入力ディジタル信号を時間と周波数につ
いて細分化した小ブロックに分配し、圧縮の為のフロー
ティングを施して情報圧縮するディジタル信号圧縮装置
において、 上記入力ディジタル信号の周波数軸上での変化量の積算
値に応じて、上記フローティングを施す小ブロックの周
波数軸上での境界を決定し、決定した上記小ブロック毎
にフローティングを行うことを特徴とするディジタル信
号圧縮装置。
7. A digital signal compressor for distributing an input digital signal into small blocks subdivided with respect to time and frequency, and performing floating for compression to compress information, wherein a change of the input digital signal on a frequency axis is provided. A digital signal compression apparatus characterized in that a boundary on the frequency axis of a small block to be floated is determined according to an integrated value of the amount, and floating is performed for each of the determined small blocks.
【請求項8】 入力信号の周波数軸上のスペクトルデー
タを得るスペクトルデータ形成手段と、 上記スペクトルデータから許容可能なノイズスペクトル
を求める許容ノイズスペクトル算出手段と、 上記許容ノイズスペクトル算出手段により求めた許容可
能なノイズスペクトルを時間と周波数について細分化し
た小ブロックに分配し、圧縮の為のビット割当を行うビ
ット割当手段とを有するディジタル信号圧縮装置におい
て、 上記入力ディジタル信号の周波数軸上での変化量の積算
値に応じて、圧縮の為のビット割当を行う小ブロックの
周波数軸上での境界を決定し、決定した上記小ブロック
毎にビット割当を最適化することを特徴とするディジタ
ル信号圧縮装置。
8. A spectrum data forming means for obtaining spectrum data on the frequency axis of the input signal, an allowable noise spectrum calculating means for obtaining an allowable noise spectrum from the spectrum data, and an allowable noise spectrum calculated by the allowable noise spectrum calculating means. A bit allocation means for distributing a possible noise spectrum into small blocks subdivided in time and frequency and allocating bits for compression, wherein the amount of change of the input digital signal on the frequency axis A digital signal compression apparatus for deciding a boundary on the frequency axis of a small block for performing bit allocation for compression in accordance with an integrated value of the small block, and optimizing bit allocation for each of the determined small blocks. .
【請求項9】(請求項8補正なし)ディジタル信号を情
報圧縮するディジタル信号圧縮装置において、 入力信号の周波数軸上の特性を算出する特性算出手段
と、 入力信号を時間と周波数について細分化した小ブロック
に分配し、圧縮の為のフローティングを施すブロックフ
ローティング手段と、 周波数軸上のスペクトルデータを得るスペクトルデータ
形成手段と、 上記スペクトルデータから許容可能なノイズスペクトル
を求める許容ノイズスペクトル算出手段と、 上記許容ノイズスペクトル算出手段により求めた許容ノ
イズスペクトルを時間と周波数について細分化した小ブ
ロックに分配し、圧縮の為のビット割当を行うビット割
当手段と、 入力信号の周波数軸上の特性に応じて、圧縮の為のフロ
ーティングを施す時間と周波数について細分化した小ブ
ロック及び/又は圧縮の為のビット割当を行う時間と周
波数について細分化した小ブロックの周波数的大きさを
変化させる大きさ制御手段とを有し、 上記ブロックフローティングの為の小ブロックとビット
割当の為の小ブロックを共に或いはそれぞれ独立して変
化させることにより、ブロックフローティング並びにビ
ット割当を最適化することを特徴とするディジタル信号
圧縮装置。
9. A digital signal compressing apparatus for compressing information of a digital signal, wherein a characteristic calculating means for calculating a characteristic on a frequency axis of the input signal, and the input signal is subdivided with respect to time and frequency. Block floating means for distributing to small blocks and performing floating for compression, spectrum data forming means for obtaining spectrum data on the frequency axis, allowable noise spectrum calculating means for obtaining an allowable noise spectrum from the spectrum data, Bit allocation means for distributing the permissible noise spectrum obtained by the permissible noise spectrum calculation means into small blocks subdivided with respect to time and frequency, and performing bit allocation for compression; and The time and frequency of floating for compression Size control means for changing the frequency size of the divided small blocks and / or the subdivided small blocks with respect to time and frequency for performing bit allocation for compression; A digital signal compression apparatus characterized in that block floating and bit allocation are optimized by changing small blocks for bit allocation together or independently of each other.
【請求項10】 入力ディジタル信号を情報圧縮するデ
ィジタル信号圧縮装置において、 圧縮の為のブロックフローティングを施す時間と周波数
について細分化した小ブロック及び/又は圧縮の為のビ
ット割当を行う時間と周波数について細分化した小ブロ
ックの周波数的大きさを予め定め、 この予め定めた大きさを採用した際の圧縮効率と、入力
信号の周波数軸上での変化量の積算値に応じて圧縮の為
のフローティングを施す小ブロック及び/又は圧縮の為
のビット割当を行う小ブロックの周波数軸上での境界を
決定したときの圧縮効率とを比較し、この比較結果に応
じて、より高い効率で情報圧縮を行える小ブロックの大
きさを選択するブロック決定手段を設けることを特徴と
するディジタル信号圧縮装置。
10. A digital signal compression apparatus for compressing information of an input digital signal, wherein a time and a frequency for performing block floating for compression are divided into small blocks and / or a time and frequency for performing bit allocation for compression. The frequency size of the subdivided small block is determined in advance, and the compression efficiency when this predetermined size is adopted and the floating for compression according to the integrated value of the change amount of the input signal on the frequency axis are determined. The compression efficiency when the boundary on the frequency axis of the small block to be subjected to the compression and / or the small block for performing the bit allocation for the compression is determined is compared, and the information compression is performed with higher efficiency according to the comparison result. A digital signal compression apparatus comprising a block determining means for selecting a size of a small block that can be performed.
JP26501294A 1994-10-28 1994-10-28 Digital signal compression method and apparatus Expired - Fee Related JP3334375B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26501294A JP3334375B2 (en) 1994-10-28 1994-10-28 Digital signal compression method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP26501294A JP3334375B2 (en) 1994-10-28 1994-10-28 Digital signal compression method and apparatus

Publications (2)

Publication Number Publication Date
JPH08125544A JPH08125544A (en) 1996-05-17
JP3334375B2 true JP3334375B2 (en) 2002-10-15

Family

ID=17411358

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26501294A Expired - Fee Related JP3334375B2 (en) 1994-10-28 1994-10-28 Digital signal compression method and apparatus

Country Status (1)

Country Link
JP (1) JP3334375B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69940918D1 (en) * 1998-02-26 2009-07-09 Sony Corp METHOD AND DEVICE FOR CODING / DECODING AND PROGRAMMING CARRIER AND DATA RECORDING CARRIER

Also Published As

Publication number Publication date
JPH08125544A (en) 1996-05-17

Similar Documents

Publication Publication Date Title
JP3123286B2 (en) Digital signal processing device or method, and recording medium
JP3173218B2 (en) Compressed data recording method and apparatus, compressed data reproducing method, and recording medium
KR100276788B1 (en) Digital signal processing apparatus, method and recording medium
JP3186307B2 (en) Compressed data recording apparatus and method
JP3123290B2 (en) Compressed data recording device and method, compressed data reproducing method, recording medium
JP3531177B2 (en) Compressed data recording apparatus and method, compressed data reproducing method
US5608713A (en) Bit allocation of digital audio signal blocks by non-linear processing
JP3200851B2 (en) Digital signal processing device, digital signal processing method, and data recording medium
JP3175446B2 (en) Information compression method and device, compressed information decompression method and device, compressed information recording / transmission device, compressed information reproducing device, compressed information receiving device, and recording medium
JPH08162964A (en) Information compression device and method therefor, information elongation device and method therefor and recording medium
JP4470304B2 (en) Compressed data recording apparatus, recording method, compressed data recording / reproducing apparatus, recording / reproducing method, and recording medium
JP3531178B2 (en) Digital signal processing apparatus and method
JP3334374B2 (en) Digital signal compression method and apparatus
JP3304717B2 (en) Digital signal compression method and apparatus
JP3334375B2 (en) Digital signal compression method and apparatus
JP3175456B2 (en) Digital signal processor
JP3186489B2 (en) Digital signal processing method and apparatus
JP3477735B2 (en) Compressed data conversion apparatus and method
JP3561923B2 (en) Digital signal processor
JP3552239B2 (en) Compressed data recording apparatus and method, and compressed data reproducing method
JPH07231259A (en) Method and device for processing digital signal and recording medium

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020702

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080802

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090802

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100802

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110802

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110802

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120802

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees