JPH07273659A - Method and device for processing digital signal and recording medium - Google Patents

Method and device for processing digital signal and recording medium

Info

Publication number
JPH07273659A
JPH07273659A JP7015838A JP1583895A JPH07273659A JP H07273659 A JPH07273659 A JP H07273659A JP 7015838 A JP7015838 A JP 7015838A JP 1583895 A JP1583895 A JP 1583895A JP H07273659 A JPH07273659 A JP H07273659A
Authority
JP
Japan
Prior art keywords
component
block
signal
value
digital signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7015838A
Other languages
Japanese (ja)
Other versions
JP3186489B2 (en
Inventor
Kenzo Akagiri
健三 赤桐
Yoshiaki Oikawa
芳明 及川
Hiroyuki Suzuki
浩之 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP01583895A priority Critical patent/JP3186489B2/en
Publication of JPH07273659A publication Critical patent/JPH07273659A/en
Application granted granted Critical
Publication of JP3186489B2 publication Critical patent/JP3186489B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PURPOSE:To reduce quantization noise and deterioration in sound quality even from a signal with a large tonality such as the signal of a trumpet sound. CONSTITUTION:The device is provided with band division filters 11, 12 decomposing a digital signal into plural frequency band components, MDCT circuits 13-15 obtaining signal components in a block having a definite time width and a definite frequency width, nonlinear processing circuits 40, 41, 42 applying nonlinear processing to an MDCT coefficient, and an adaptive bit coding circuit 18 quantizing the signal component for each block to implement information compression and providing outputs of both the signal component whose information is compressed and information compression parameters required for compressing the information for each block, and the nonlinear processing circuits 40, 41, 42 make a quantized value zero with a signal to noise ratio as to samples with smaller signal to noise ratio or increase the spectrum value when the signal tonality in the floating block in the high efficiency coding is high.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、例えばディジタルオー
ディオ信号等をビット圧縮した圧縮データを記録又は伝
送するディジタル信号処理方法及び装置と、このディジ
タル信号処理方法又は装置により圧縮された圧縮データ
を記録してなる記録媒体に関し、特に、トーナリティの
高い信号を含むディジタルオーディオ信号を扱うディジ
タル信号処理方法及び装置、並びに記録媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a digital signal processing method and apparatus for recording or transmitting compressed data obtained by bit-compressing, for example, a digital audio signal, and recording compressed data compressed by this digital signal processing method or apparatus. In particular, the present invention relates to a digital signal processing method and apparatus for handling a digital audio signal including a signal with high tonality, and a recording medium.

【0002】[0002]

【従来の技術】本件出願人は、先に、入力されたディジ
タルオーディオ信号をビット圧縮し、所定のデータ量を
記録単位としてバースト的に記録媒体に記録するような
技術を、例えば特開平4−105270号公報や、U.S.
Appln. S.N. 08/171,263 、USP 5,243,588 、USP 5,24
4,705 の各明細書及び図面等において提案している。
2. Description of the Related Art The applicant of the present invention has previously disclosed a technique for bit-compressing an input digital audio signal and recording it on a recording medium in a burst manner with a predetermined amount of data as a recording unit, for example, in Japanese Unexamined Patent Publication (Kokai) No. 105270 publication, US
Appln. SN 08 / 171,263, USP 5,243,588, USP 5,24
Proposed in each specification and drawings of 4,705.

【0003】なお、上記S.N. 08/171,263 の明細書及び
図面には、データ領域の記録位置を示す目録データがサ
ブコーディングされて記録されるリードイン領域に、上
記データ領域の記録内容に関する表示データをメインデ
ータとして記録したディスクと、このディスクにデータ
を記録する記録手段を有するディスク記録装置と、この
ディスクからデータを再生する再生手段及びその再生手
段により得られる表示データに応じた表示を行う表示手
段を有するディスク再生装置とが記載されている。ま
た、上記特開平4−105270号公報には、連続して
入力される入力データが順次書き込まれ、書き込まれた
入力データが該入力データの転送速度よりも速い転送速
度の記録データとして順次読み出されるメモリ手段と、
ディスク状記録媒体を回転させる速度の切り換え可能な
回転駆動手段と、上記ディスク状記録媒体に上記メモリ
手段から読み出される記録データを記録する記録手段
と、上記メモリ手段に記録されている上記入力データの
データ量が所定量以上になると上記記録データを所定量
だけ該メモリ手段から順次読み出し、上記メモリ手段に
所定データ量以上の書き込み空間を確保しておくように
メモリ制御を行うメモリ制御手段と、このメモリ制御手
段によりメモリ手段から不連続に順次読み出される上記
記録データを上記ディスク状記録媒体上の記録トラック
に連続的に記録するように記録位置の制御を行う記録制
御手段とを備えるディスク記録装置と、これに対応する
ディスク再生装置とが記載されている。また、USP 5,24
3,588 の明細書及び図面には、ディジタルデータを一時
記憶する記憶手段と、上記記憶手段からのディジタルデ
ータを一定数のセクタ毎にクラスタ化し、各クラスタの
接続部分にインターリーブ処理の際のインターリーブ長
より長いクラスタ接続用セクタを設け、ディジタルデー
タにインターリーブを施して上記ディスク状記録媒体に
記録する記録手段を有するディスク記録装置と、これに
対応するディスク再生装置とが記載されている。さら
に、USP 5,244,705 の各明細書及び図面には、圧縮オー
ディオデータ等が記録されるディスク状記録媒体におい
て、ディスク状記録媒体のデータ記録領域の内径寸法を
32mm〜50mmの範囲内の所定値に設定するとき、デー
タ記録領域の内径寸法が32mmのときの外径寸法は60
mm〜62mmの範囲内の値とし、データ記録領域の内径寸
法が50mmのときの外径寸法は71mm〜73mmの範囲内
の値とすることにより、小型携帯用のディスク記録/再
生装置に使用可能とすると共に、例えば圧縮率が1/4
の圧縮オーディオデータを記録することで標準的な12
cmCDと同程度の再生時間を実現可能としたものが記
載されている。
In the specification and drawings of the above-mentioned SN 08 / 171,263, in the lead-in area in which the index data indicating the recording position of the data area is subcoded and recorded, the display data concerning the recorded contents of the data area is displayed. A disc recorded as main data, a disc recording device having a recording unit for recording data on the disc, a reproducing unit for reproducing data from the disc, and a display unit for displaying according to display data obtained by the reproducing unit. And a disc reproducing apparatus having the same. Further, in the above-mentioned Japanese Patent Application Laid-Open No. 4-105270, input data that is continuously input is sequentially written, and the written input data is sequentially read as recording data having a transfer speed higher than the transfer speed of the input data. Memory means,
Rotational drive means capable of switching the speed of rotating the disk-shaped recording medium, recording means for recording the recording data read from the memory means on the disk-shaped recording medium, and input data recorded in the memory means. Memory control means for sequentially reading the recording data by a predetermined amount from the memory means when the data amount exceeds a predetermined amount, and performing memory control so as to secure a write space in the memory means for the predetermined data amount or more; A disk recording device comprising: a recording control means for controlling a recording position so as to continuously record the recording data, which is read out discontinuously from the memory means by the memory control means, on a recording track on the disc-shaped recording medium. , And a disc reproducing apparatus corresponding to this. Also, USP 5,24
In the specification and drawings of 3,588, the storage means for temporarily storing digital data, the digital data from the storage means is clustered into a certain number of sectors, and the interleave length at the time of interleaving processing is applied to the connection part of each cluster. There is described a disk recording apparatus having a long sector for sector connection, a recording means for interleaving digital data and recording it on the disk-shaped recording medium, and a disk reproducing apparatus corresponding thereto. Further, in each specification and drawings of USP 5,244,705, in the disk-shaped recording medium on which compressed audio data and the like are recorded, the inner diameter of the data recording area of the disk-shaped recording medium is set to a predetermined value within the range of 32 mm to 50 mm. When the inner diameter of the data recording area is 32 mm, the outer diameter is 60
By setting the value within the range of mm to 62 mm, and the outside diameter when the inside diameter of the data recording area is 50 mm, the outside diameter is within the range of 71 mm to 73 mm, so that it can be used in a compact portable disk recording / playback device. And, for example, the compression rate is 1/4
By recording compressed audio data of standard 12
It is described that a reproduction time comparable to that of cmCD can be realized.

【0004】上記各明細書及び図面等において提案して
いる技術は、記録媒体として光磁気ディスクを用い、い
わゆるコンパクト・ディスク(CD:Compact Disc)の
CD−I(CD−インタラクティブ)やCD−ROM
XAのオーディオデータフォーマットに規定されている
AD(適応差分)PCMオーディオデータを記録再生す
るものであり、このADPCMオーディオデータの例え
ば32セクタ分とインターリーブ処理のためのリンキン
グ用の数セクタとを記録単位として、ADPCMオーデ
ィオデータを光磁気ディスクにバースト的に記録してい
る。
The technology proposed in the above specifications and drawings uses a magneto-optical disk as a recording medium, and is a so-called compact disk (CD) CD-I (CD-interactive) or CD-ROM.
AD (adaptive difference) PCM audio data specified in the XA audio data format is recorded / reproduced. For example, 32 sectors of this ADPCM audio data and several sectors for linking for interleave processing are recorded as a recording unit. As an example, ADPCM audio data is recorded in a burst form on a magneto-optical disk.

【0005】この光磁気ディスクを用いた記録再生装置
におけるADPCMオーディオデータには、いくつかの
モードが選択可能になっており、例えば通常のCDの再
生時間に比較して、2倍の圧縮率でサンプリング周波数
が37.8kHzのレベルAのモード、4倍の圧縮率で
サンプリング周波数が37.8kHzのレベルBのモー
ド、8倍の圧縮率でサンプリング周波数が18.9kH
zのレベルCのモードがある。
Several modes can be selected for the ADPCM audio data in the recording / reproducing apparatus using this magneto-optical disk. For example, the compression rate is twice as high as that of a normal CD reproducing time. Level A mode with a sampling frequency of 37.8 kHz, level B mode with a compression rate of 4 times and a sampling frequency of 37.8 kHz, sampling frequency of 18.9 kHz with a compression rate of 8 times
There are z level C modes.

【0006】すなわち、例えば前記レベルBの場合に
は、ディジタルオーディオデータが略々1/4に圧縮さ
れ、このレベルBのモードで記録されたディスクの再生
時間(プレイタイム)は、標準的なCDフォーマット
(CD−DAフォーマット)の場合の4倍となる。これ
によれば、より小型のディスクで標準の直径12cmの
ディスクと同じ程度の記録再生時間が得られることか
ら、装置の小型化が図れることになる。
That is, for example, in the case of the level B, the digital audio data is compressed to approximately 1/4, and the reproduction time (play time) of the disc recorded in this level B mode is a standard CD. It is four times as large as in the case of the format (CD-DA format). According to this, since a recording / reproducing time of the same size as that of a standard disc having a diameter of 12 cm can be obtained with a smaller disc, the device can be miniaturized.

【0007】ただし、この光磁気ディスクを用いた記録
再生装置では、ディスクの回転速度は標準的なCDと同
じであるため、例えば前記レベルBの場合、所定時間当
たりその4倍の再生時間分の圧縮データが得られること
になる。このため、例えばセクタやクラスタ等の時間単
位で同じ圧縮データを重複して4回読み出すようにし、
そのうちの1回分の圧縮データのみをオーディオ再生に
まわすようにしている。具体的には、スパイラル状の記
録トラックを走査(トラッキング)する際に、1回転毎
に元のトラック位置に戻るようなトラックジャンプを行
って、同じトラックを4回ずつ繰り返しトラッキングす
るような形態で再生動作を進めることになる。これは、
例えば4回の重複読み取りの内、少なくとも1回だけ正
常な圧縮データが得られればよいことになり、外乱等に
よるエラーに強く、特に携帯用小型機器に適用して好ま
しいものである。
However, in the recording / reproducing apparatus using this magneto-optical disk, the rotational speed of the disk is the same as that of a standard CD. Therefore, for example, in the case of the level B, the reproducing time is four times as long as the predetermined time. Compressed data will be obtained. For this reason, for example, the same compressed data is read four times in duplicate in time units such as sectors and clusters.
Only the compressed data for one time is sent to the audio reproduction. Specifically, when scanning (tracking) a spiral recording track, a track jump is performed to return to the original track position for each rotation, and the same track is repeatedly tracked four times. Playback operation will proceed. this is,
For example, it is only necessary to obtain normal compressed data at least once out of four times of redundant reading, which is resistant to errors due to disturbances and the like, which is particularly preferable when applied to a small portable device.

【0008】さらに将来的には、半導体メモリを記録媒
体として用いることが考えられており、圧縮効率をさら
に高めるためには、追加のビット圧縮が行われる事が望
ましい。具体的には、半導体メモリを含むIC(集積回
路)をカード内に配したいわゆるICカードを用いてオ
ーディオ信号を記録再生するようなものであり、このI
Cカードに対して、ビット圧縮処理された圧縮データを
記録し、再生する。
Further, in the future, it is considered to use a semiconductor memory as a recording medium, and it is desirable to perform additional bit compression in order to further improve the compression efficiency. Specifically, an audio signal is recorded and reproduced using a so-called IC card in which an IC (integrated circuit) including a semiconductor memory is arranged in the card.
Compressed data that has been bit-compressed is recorded and reproduced on the C card.

【0009】このような半導体メモリを用いたICカー
ド等は、半導体技術の進歩に伴って記録容量の増大や低
価格化が実現されてゆくものであるが、市場に供給され
始めた初期段階では容量が不足気味で、また高価である
ことが考えられる。従って、例えば上記光磁気ディスク
等のような他の安価で大容量の記録媒体からICカード
等に内容を転送して頻繁に書き換えて使用することが充
分考えられる。具体的には、例えば上記光磁気ディスク
に収録されている複数の曲の内、好みの曲をICカード
にダビングするようにし、不要になれば他の曲と入れ換
える。このようにして、ICカードの内容書換えを頻繁
に行うことにより、少ない手持ち枚数のICカードで種
々の曲を戸外等で楽しむことができる。
IC cards and the like using such a semiconductor memory are expected to have an increased recording capacity and a lower price as the semiconductor technology advances, but at the initial stage when they are supplied to the market. It is thought that the capacity is low and expensive. Therefore, it is sufficiently conceivable to transfer the contents from another inexpensive and large-capacity recording medium such as the above-mentioned magneto-optical disk to an IC card or the like for frequent rewriting and use. Specifically, for example, of a plurality of songs recorded on the magneto-optical disk, a favorite song is dubbed to an IC card, and when it is no longer needed, it is replaced with another song. By frequently rewriting the contents of the IC card in this manner, various songs can be enjoyed outdoors, etc., with a small number of IC cards held in hand.

【0010】なお、本件出願人は、先にEUROPEAN PATEN
T APPLICATION publication number: 0 525 809 A2 (Da
te of publication 03.02.93)において、上述の圧縮デ
ータを生成するために好適な符号化方法を提案してい
る。
[0010] The applicant of the present invention has previously proposed that the EUROPEAN PATEN
T APPLICATION publication number: 0 525 809 A2 (Da
te of publication 03.02.93) proposes a suitable encoding method for generating the above-mentioned compressed data.

【0011】また、本件出願人は、EUROPEAN PATENT AP
PLICATION publication number : 0599 719 A1 (Date o
f publication 01.06.94)、EUROPEAN PATENT APPLICATI
ONpublication number : 0 601 566 A1 (Date of publi
cation 15.06.94)、及びInternational Publication Nu
mber : WO 94/19801 (International PublicationDate
: 1 September 1994)において、上述のICカードを利
用した記録/再生に好適な記録/再生システムを提案し
ている。
Further, the applicant of the present application is the EUROPEAN PATENT AP
PLICATION publication number: 0599 719 A1 (Date o
f publication 01.06.94), EUROPEAN PATENT APPLICATI
ONpublication number: 0 601 566 A1 (Date of publi
cation 15.06.94), and International Publication Nu
mber: WO 94/19801 (International Publication Date
: 1 September 1994) proposes a recording / reproducing system suitable for recording / reproducing using the above-mentioned IC card.

【0012】[0012]

【発明が解決しようとする課題】ところで、記録時間を
延ばすことを目的として高能率符号のビットレートを下
げて行くと、徐々に音質の劣化が目立つようになる。特
に、聴覚的な効果が効き難い音楽信号でこの事が顕著と
なる。
By the way, when the bit rate of the high efficiency code is lowered for the purpose of extending the recording time, the deterioration of the sound quality becomes gradually noticeable. This is especially noticeable for music signals for which the auditory effect is difficult to work.

【0013】そこで、本発明は、上述したようなことに
鑑み、記録時間を延ばすことを目的として高能率符号の
ビットレートを下げて行く場合に、アルゴリズムを複雑
化することなく、不自然な感じのない聴きやすい音質を
得ることができるディジタル信号処理方法及び装置と、
そのディジタル信号処理方法又は装置で処理された圧縮
データを記録してなる記録媒体を提供することを目的と
する。
Therefore, in view of the above, the present invention does not make the algorithm complicated and makes it feel unnatural when the bit rate of the high efficiency code is lowered for the purpose of extending the recording time. A digital signal processing method and device capable of obtaining sound quality that is easy to listen to,
It is an object of the present invention to provide a recording medium in which compressed data processed by the digital signal processing method or device is recorded.

【0014】[0014]

【課題を解決するための手段】本発明のディジタル信号
処理方法は、上述の目的を達成するために提案されたも
のであり、ディジタル信号を伝送するためのものであっ
て、入力ディジタル信号を、それぞれ複数の信号成分を
含む有限時間幅と有限周波数幅を持つ複数のブロック内
の信号成分に変換し、上記複数のブロックのうちの少な
くとも一部のブロック内の信号成分を非線形処理し、上
記非線形処理された上記信号成分を量子化することを特
徴とする。
DISCLOSURE OF THE INVENTION A digital signal processing method of the present invention is proposed for achieving the above-mentioned object, and is for transmitting a digital signal, wherein an input digital signal is Converting to a signal component in a plurality of blocks each having a finite time width and a finite frequency width including a plurality of signal components, nonlinearly processing the signal components in at least some of the plurality of blocks, and It is characterized in that the processed signal component is quantized.

【0015】また、本発明のディジタル信号処理装置
は、ディジタル信号を伝送するためのものであり、入力
ディジタル信号を、それぞれ複数の信号成分を含む有限
時間幅と有限周波数幅を持つ複数のブロック内の信号成
分に変換する変換手段と、上記複数のブロックのうちの
少なくとも一部のブロック内の信号成分を非線形処理す
る非線形処理手段と、上記非線形処理された上記信号成
分を量子化する符号化手段とを有してなることにより上
述の目的を達成する。
Further, the digital signal processing apparatus of the present invention is for transmitting a digital signal, and the input digital signal is stored in a plurality of blocks each having a finite time width and a finite frequency width each including a plurality of signal components. Transforming means for transforming the signal components into a signal component, non-linear processing means for performing non-linear processing on the signal components in at least some of the plurality of blocks, and encoding means for quantizing the non-linearly processed signal components. By having and, the above-mentioned object is achieved.

【0016】さらに、本発明の記録媒体は、ディジタル
信号をそれぞれ複数の信号成分を含む有限時間幅と有限
周波数幅を持つ複数のブロック内の信号成分に変換し、
上記複数のブロックのうちの少なくとも一部のブロック
内の信号成分を非線形処理し、上記非線形処理された上
記信号成分を量子化して生成した記録用データを、記録
してなることを特徴とするものである。
Further, the recording medium of the present invention converts a digital signal into a signal component in a plurality of blocks having a finite time width and a finite frequency width, each of which includes a plurality of signal components,
Non-linear processing of a signal component in at least a part of the plurality of blocks, and recording data generated by quantizing the non-linearly processed signal component is recorded. Is.

【0017】[0017]

【作用】本発明のディジタル信号処理方法及び装置、並
びに記録媒体においては、入力ディジタル信号が、それ
ぞれ複数の信号成分を含む有限時間幅と有限周波数幅を
持つ複数のブロック内の信号成分に変換され、この複数
のブロックのうちの少なくとも一部のブロック内の信号
成分が非線形処理され、この非線形処理された信号成分
が量子化されることにより、例えばトーナリティが高い
成分を含むブロックに関して非線形処理されたデータが
得られる。
In the digital signal processing method and apparatus and the recording medium of the present invention, an input digital signal is converted into signal components in a plurality of blocks each having a finite time width and a finite frequency width, each of which includes a plurality of signal components. , The signal components in at least some blocks of the plurality of blocks are non-linearly processed, and the non-linearly processed signal components are quantized, for example, non-linearly processed with respect to a block including a component with high tonality. Data is obtained.

【0018】[0018]

【実施例】以下、本発明の実施例について図面を参照し
ながら説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0019】先ず、図1に、本発明のディジタル信号処
理方法を実現する一実施例として、ディジタルオーディ
オ信号をビット圧縮した圧縮データの記録媒体への記録
再生を行う圧縮データ記録再生装置の概略構成を示す。
First, FIG. 1 shows a schematic configuration of a compressed data recording / reproducing apparatus for recording / reproducing compressed data obtained by bit-compressing a digital audio signal to / from a recording medium as an embodiment for realizing the digital signal processing method of the present invention. Indicates.

【0020】この図1の圧縮データ記録再生装置は、本
発明の記録媒体の一例である光磁気ディスク1に対して
圧縮データを記録再生するための光磁気ディスク記録再
生ユニットと、他の例の記録媒体としてのICカード2
に対して圧縮データの書き込み/読み出しを行うための
ICカード記録ユニットとの2つのユニットを、1つの
システムに組んで構成されている。
The compressed data recording / reproducing apparatus of FIG. 1 includes a magneto-optical disk recording / reproducing unit for recording / reproducing compressed data on / from a magneto-optical disk 1 which is an example of a recording medium of the present invention, and another example. IC card 2 as recording medium
It is configured by assembling two units, an IC card recording unit for writing / reading compressed data with respect to the above, into one system.

【0021】この光磁気ディスク記録再生ユニット側の
再生系で再生された信号を上記ICカード記録ユニット
で記録する際には、先ず、上記再生系の光磁気ディスク
1から光学ヘッド53によってデータが読み取られる。
このデータはデコーダ71に送られてEFM(8−1
4)復調やデインターリーブ処理や誤り訂正処理等が施
されて再生圧縮データとなされる。上記再生圧縮データ
は、上記ICカード記録ユニットのメモリ85に送ら
れ、一旦記憶される。上記メモリ85から読み出された
再生圧縮データに、エントロピィ符号化等を行う追加圧
縮器84による可変ビットレート符号化処理等の追加処
理が施され、その後、当該追加処理が施された再生圧縮
データがICカードインタフェース回路86を介してI
Cカード2に書き込まれる。このように、光磁気ディス
ク1から再生された圧縮データは、ATCデコーダ73
による伸張処理を受ける前の圧縮状態のままで上記IC
カード2に対する記録系に送られて、当該ICカード2
に書き込まれる。
When the signal reproduced by the reproducing system on the side of the magneto-optical disk recording / reproducing unit is recorded by the IC card recording unit, first, the data is read from the magneto-optical disk 1 of the reproducing system by the optical head 53. To be
This data is sent to the decoder 71 and EFM (8-1
4) Demodulation, deinterleave processing, error correction processing, etc. are performed to obtain reproduced compressed data. The reproduced compressed data is sent to the memory 85 of the IC card recording unit and temporarily stored therein. Reproduced compressed data read from the memory 85 is subjected to additional processing such as variable bit rate encoding processing by an additional compressor 84 that performs entropy encoding, and then the reproduced compressed data subjected to the additional processing. Via the IC card interface circuit 86
Written to C card 2. In this way, the compressed data reproduced from the magneto-optical disk 1 is the ATC decoder 73.
The above IC in the compressed state before being subjected to the expansion processing by
The IC card 2 is sent to the recording system for the card 2.
Written in.

【0022】ところで、通常の再生時すなわちオーディ
オ聴取のための再生時には、記録媒体すなわち光磁気デ
ィスク1から間歇的或いはバースト的に所定データ量単
位(例えば32セクタ+数セクタ)で圧縮データを読み
出し、これを伸張して連続的なオーディオ信号に変換し
ているが、上述のようないわゆるダビングを行う時に
は、光磁気ディスク1上の圧縮データを連続的に読み取
って、上記ICカード記録ユニットに送って記録してい
る。これによって、データ圧縮率に応じた高速の(短時
間の)ダビングが行える。
By the way, during normal reproduction, that is, during reproduction for listening to audio, compressed data is read from the recording medium, that is, the magneto-optical disk 1 in a predetermined data amount unit (for example, 32 sectors + several sectors) intermittently or in bursts. This is expanded and converted into a continuous audio signal. When performing the so-called dubbing as described above, the compressed data on the magneto-optical disk 1 is continuously read and sent to the IC card recording unit. I am recording. This enables high-speed (short-time) dubbing according to the data compression rate.

【0023】以下、図1に示す圧縮データ記録再生装置
の具体的な構成について詳細に説明する。
The specific structure of the compressed data recording / reproducing apparatus shown in FIG. 1 will be described below in detail.

【0024】図1に示す圧縮データ記録再生装置の光磁
気ディスク記録再生ユニットにおいて、記録媒体として
は、スピンドルモータ51により回転駆動される光磁気
ディスク1が用いられる。光磁気ディスク1に対するデ
ータの記録時には、例えば光学ヘッド53によりレーザ
光を照射した状態で記録データに応じた変調磁界を磁気
ヘッド54により印加することによって、いわゆる磁界
変調記録を行い、光磁気ディスク1の記録トラックに沿
ってデータを記録する。また、再生時には、光磁気ディ
スク1の記録トラックを光学ヘッド53によりレーザ光
でトレースして磁気光学的にデータの再生を行う。
In the magneto-optical disk recording / reproducing unit of the compressed data recording / reproducing apparatus shown in FIG. 1, a magneto-optical disk 1 rotatably driven by a spindle motor 51 is used as a recording medium. At the time of recording data on the magneto-optical disk 1, for example, so-called magnetic field modulation recording is performed by applying a modulation magnetic field according to the recording data with the magnetic head 54 while irradiating the optical head 53 with laser light, thereby performing so-called magnetic field modulation recording. Data is recorded along the recording track of. At the time of reproduction, the recording track of the magneto-optical disk 1 is traced with laser light by the optical head 53 to reproduce the data magneto-optically.

【0025】光学ヘッド53は、例えば、レーザダイオ
ード等のレーザ光源、コリメータレンズ、対物レンズ、
偏光ビームスプリッタ、シリンドリカルレンズ等の光学
部品及び所定パターンの受光部を有するフォトディテク
タ等から構成されている。この光学ヘッド53は、光磁
気ディスク1を介して上記磁気ヘッド54と対向する位
置に設けられている。光磁気ディスク1にデータを記録
するときには、記録系のヘッド駆動回路66により磁気
ヘッド54を駆動して記録データに応じた変調磁界を印
加すると共に、光学ヘッド53により光磁気ディスク1
の目的トラックにレーザ光を照射することによって、磁
界変調方式により熱磁気記録を行う。またこの光学ヘッ
ド53は、目的トラックに照射したレーザ光の反射光を
検出し、例えばいわゆる非点収差法によりフォーカスエ
ラーを検出し、例えばいわゆるプッシュプル法によりト
ラッキングエラーを検出する。光磁気ディスク1からデ
ータを再生するとき、光学ヘッド53は上記フォーカス
エラーやトラッキングエラーを検出すると同時に、レー
ザ光の目的トラックからの反射光の偏光角(カー回転
角)の違いを検出して再生信号を生成する。
The optical head 53 includes, for example, a laser light source such as a laser diode, a collimator lens, an objective lens,
It is composed of a polarization beam splitter, an optical component such as a cylindrical lens, and a photodetector having a light receiving portion of a predetermined pattern. The optical head 53 is provided at a position facing the magnetic head 54 through the magneto-optical disk 1. When recording data on the magneto-optical disk 1, the head driving circuit 66 of the recording system drives the magnetic head 54 to apply a modulation magnetic field according to the recording data, and at the same time, the optical head 53 drives the magneto-optical disk 1.
By irradiating the target track with laser light, thermomagnetic recording is performed by the magnetic field modulation method. Further, the optical head 53 detects the reflected light of the laser light applied to the target track, detects a focus error by, for example, a so-called astigmatism method, and detects a tracking error by, for example, a so-called push-pull method. When reproducing data from the magneto-optical disk 1, the optical head 53 detects the focus error and the tracking error, and at the same time, detects the difference in the polarization angle (Kerr rotation angle) of the reflected light of the laser light from the target track and reproduces it. Generate a signal.

【0026】光学ヘッド53の出力は、RF回路55に
供給される。このRF回路55は、光学ヘッド53の出
力から上記フォーカスエラー信号やトラッキングエラー
信号を抽出してサーボ制御回路56に供給するととも
に、再生信号を2値化して再生系のデコーダ71に供給
する。
The output of the optical head 53 is supplied to the RF circuit 55. The RF circuit 55 extracts the focus error signal and the tracking error signal from the output of the optical head 53 and supplies them to the servo control circuit 56, and binarizes the reproduction signal to supply it to the decoder 71 of the reproduction system.

【0027】サーボ制御回路56は、例えばフォーカス
サーボ制御回路やトラッキングサーボ制御回路、スピン
ドルモータサーボ制御回路、スレッドサーボ制御回路等
から構成される。上記フォーカスサーボ制御回路は、上
記フォーカスエラー信号がゼロになるように、光学ヘッ
ド53の光学系のフォーカス制御を行う。また上記トラ
ッキングサーボ制御回路は、上記トラッキングエラー信
号がゼロになるように光学ヘッド53の光学系のトラッ
キング制御を行う。さらに上記スピンドルモータサーボ
制御回路は、光磁気ディスク1を所定の回転速度(例え
ば一定線速度)で回転駆動するようにスピンドルモータ
51を制御する。また、上記スレッドサーボ制御回路
は、システムコントローラ57により指定される光磁気
ディスク1の目的トラック位置に光学ヘッド53及び磁
気ヘッド54を移動させる。このような各種制御動作を
行うサーボ制御回路56は、該サーボ制御回路56によ
り制御される各部の動作状態を示す情報をシステムコン
トローラ57に送る。
The servo control circuit 56 is composed of, for example, a focus servo control circuit, a tracking servo control circuit, a spindle motor servo control circuit, a sled servo control circuit and the like. The focus servo control circuit controls the focus of the optical system of the optical head 53 so that the focus error signal becomes zero. Further, the tracking servo control circuit controls the tracking of the optical system of the optical head 53 so that the tracking error signal becomes zero. Further, the spindle motor servo control circuit controls the spindle motor 51 so as to rotate the magneto-optical disk 1 at a predetermined rotation speed (for example, a constant linear speed). Further, the sled servo control circuit moves the optical head 53 and the magnetic head 54 to the target track position of the magneto-optical disk 1 designated by the system controller 57. The servo control circuit 56 that performs such various control operations sends information indicating the operating state of each unit controlled by the servo control circuit 56 to the system controller 57.

【0028】システムコントローラ57にはキー入力操
作部58や表示部59が接続されている。このシステム
コントローラ57は、キー入力操作部58による操作入
力情報により指定される動作モードで記録系及び再生系
の制御を行う。またシステムコントローラ57は、光磁
気ディスク1の記録トラックに記録されているいわゆる
ヘッダータイムやサブコードのQデータ等から再生され
るセクタ単位のアドレス情報に基づいて、光学ヘッド5
3及び磁気ヘッド54がトレースしている上記記録トラ
ック上の記録位置や再生位置を管理する。さらにシステ
ムコントローラ57は、キー入力操作部58により切り
換え選択されたATCエンコーダ63でのビット圧縮モ
ード情報や、RF回路55から再生系を介して得られる
再生データ内のビット圧縮モード情報に基づいて、この
ビット圧縮モードを表示部59に表示させると共に、該
ビット圧縮モードにおけるデータ圧縮率と上記記録トラ
ック上の再生位置情報とに基づいて表示部59に再生時
間を表示させる制御を行う。この再生時間表示は、光磁
気ディスク1の記録トラックに記録されているヘッダー
タイムやサブコードQデータ等から再生されるセクタ単
位のアドレス情報(絶対時間情報)に対し、上記ビット
圧縮モードにおけるデータ圧縮率の逆数(例えば1/4
圧縮のときには4)を乗算することにより、実際の時間
情報を求め、これを表示部59に表示させるものであ
る。なお、記録時においても、例えば光磁気ディスク等
の記録トラックに予め絶対時間情報が記録されている
(プリフォーマットされている)場合に、このプリフォ
ーマットされた絶対時間情報を読み取ってデータ圧縮率
の逆数を乗算することにより、現在位置を実際の記録時
間で表示させることも可能である。
A key input operation unit 58 and a display unit 59 are connected to the system controller 57. The system controller 57 controls the recording system and the reproducing system in the operation mode designated by the operation input information from the key input operation unit 58. Further, the system controller 57 uses the sector head unit address information reproduced from the so-called header time recorded on the recording track of the magneto-optical disk 1 or the Q data of the sub-code, etc.
3 and the recording position and the reproducing position on the recording track traced by the magnetic head 54 are managed. Further, the system controller 57, based on the bit compression mode information in the ATC encoder 63 switched and selected by the key input operation unit 58 and the bit compression mode information in the reproduction data obtained from the RF circuit 55 via the reproduction system, The bit compression mode is displayed on the display unit 59, and the reproduction time is displayed on the display unit 59 based on the data compression rate in the bit compression mode and the reproduction position information on the recording track. This reproduction time display is performed by compressing the data in the bit compression mode with respect to address information (absolute time information) in sector units reproduced from the header time recorded on the recording track of the magneto-optical disc 1 and the subcode Q data. Reciprocal of rate (eg 1/4
In the case of compression, the actual time information is obtained by multiplying by 4), and this is displayed on the display unit 59. Even at the time of recording, for example, when absolute time information is previously recorded (pre-formatted) on a recording track of a magneto-optical disk or the like, the pre-formatted absolute time information is read to determine the data compression rate. It is also possible to display the current position at the actual recording time by multiplying by the reciprocal.

【0029】次に、この圧縮データ記録再生装置の記録
再生系のうちの記録系において、入力端子60からのア
ナログオーディオ入力信号AINがローパスフイルタ61
を介してA/D変換器62に供給され、このA/D変換
器62は上記アナログオーディオ入力信号AINを量子化
(PCM)する。A/D変換器62から得られたディジ
タルオーディオ信号は、ATC(Adaptive Transform C
oding )エンコーダ63に供給される。また、入力端子
67からのディジタルオーディオ入力信号DINがディジ
タル入力インタフェース回路68を介してATCエンコ
ーダ63に供給される。ATCエンコーダ63は、上記
アナログオーディオ入力信号AINを上記A/D変換器6
2により量子化した所定転送速度のディジタルオーディ
オ信号又はディジタル入力インタフェース回路68を介
して供給されるディジタルオーディオ信号について、表
1に示すATC方式における各種モードに対応するビッ
ト圧縮(データ圧縮)処理を行うもので、上記システム
コントローラ57により動作モードが指定されるように
なっている。例えばBモードでは、サンプリング周波数
が44.1kHzでビットレートが64kbpsの圧縮
データ(ATCオーディオデータ)とされ、メモリ64
に供給される。このBモ−ドのステレオモードでのデー
タ転送速度は、上記標準のCD−DAのフォーマットの
データ転送速度(75セクタ/秒)の1/8(9.37
5セクタ/秒)に低減されている。
Next, in the recording system of the recording / reproducing system of this compressed data recording / reproducing apparatus, the analog audio input signal AIN from the input terminal 60 is supplied to the low-pass filter 61.
Is supplied to the A / D converter 62, and the A / D converter 62 quantizes (PCM) the analog audio input signal AIN. The digital audio signal obtained from the A / D converter 62 is an ATC (Adaptive Transform C
oding) is supplied to the encoder 63. Further, the digital audio input signal DIN from the input terminal 67 is supplied to the ATC encoder 63 via the digital input interface circuit 68. The ATC encoder 63 converts the analog audio input signal AIN into the A / D converter 6
A bit compression (data compression) process corresponding to various modes in the ATC system shown in Table 1 is performed on the digital audio signal quantized by 2 or the digital audio signal supplied through the digital input interface circuit 68 at a predetermined transfer rate. The operation mode is designated by the system controller 57. For example, in the B mode, compressed data (ATC audio data) having a sampling frequency of 44.1 kHz and a bit rate of 64 kbps is set in the memory 64.
Is supplied to. The data transfer rate in the B mode stereo mode is 1/8 (9.37) of the data transfer rate (75 sectors / second) of the standard CD-DA format.
5 sectors / second).

【0030】[0030]

【表1】 [Table 1]

【0031】ここで、図1の実施例においては、A/D
変換器62のサンプリング周波数が例えば上記標準的な
CD−DAフォーマットのサンプリング周波数である4
4.1kHzに固定されており、ATCエンコーダ63
においてもサンプリング周波数は維持され、ビット圧縮
処理が施されるようなものを想定している。この時:低
ビットレートモードになるほど、信号通過帯域は狭くし
て行くので、それに応じてローパスフイルタ61のカッ
トオフ周波数も切換制御する。すなわち、上記圧縮モー
ドに応じてA/D変換器62のローパスフイルタ61の
カットオフ周波数を同時に切換制御する。
Here, in the embodiment of FIG. 1, A / D
The sampling frequency of the converter 62 is, for example, the sampling frequency of the standard CD-DA format described above.
The ATC encoder 63 is fixed at 4.1 kHz.
Also in, it is assumed that the sampling frequency is maintained and bit compression processing is performed. At this time: the signal pass band becomes narrower as the low bit rate mode is set, and accordingly, the cutoff frequency of the low pass filter 61 is also switched and controlled. That is, the cutoff frequency of the low-pass filter 61 of the A / D converter 62 is simultaneously switched and controlled according to the compression mode.

【0032】次に、メモリ64は、データの書き込み及
び読み出しがシステムコントローラ57により制御さ
れ、ATCエンコーダ63から供給される圧縮されたオ
ーディオデータ(以下、ATCオーディオデータと言
う)を一時的に記憶しておき、必要に応じてディスク上
に記録するためのバッファメモリとして用いられてい
る。すなわち、例えば上記Bモ−ドのステレオのモード
において、ATCエンコーダ63から供給されるATC
オーディオデータは、そのデータ転送速度が、標準的な
CD−DAフォーマットのデータ転送速度(75セクタ
/秒)の1/8、すなわち9.375セクタ/秒に低減
されており、このATCオーディオデータがメモリ64
に連続的に書き込まれる。このATCオーディオデータ
は、前述したように8セクタにつき1セクタの記録を行
えば足りるが、このような8セクタおきの記録は事実上
不可能に近いため、後述するようなセクタ連続の記録を
行うようにしている。
Next, the memory 64 is controlled by the system controller 57 to write and read data, and temporarily stores compressed audio data (hereinafter referred to as ATC audio data) supplied from the ATC encoder 63. It is used as a buffer memory for recording on the disk as needed. That is, for example, in the B mode stereo mode, the ATC supplied from the ATC encoder 63.
The audio data has its data transfer rate reduced to 1/8 of the standard CD-DA format data transfer rate (75 sectors / second), that is, 9.375 sectors / second. Memory 64
Continuously written to. As described above, it is sufficient to record one sector for every eight sectors of this ATC audio data. However, since recording every eight sectors is practically impossible, continuous sector recording as described later is performed. I am trying.

【0033】この記録は、休止期間を介して、所定の複
数セクタ(例えば32セクタ+数セクタ)から成るクラ
スタを記録単位として、標準的なCD−DAフォーマッ
トと同じデータ転送速度(75セクタ/秒)でバースト
的に行われる。すなわちメモリ64においては、上記ビ
ット圧縮レートに応じた9.375(=75/8)セク
タ/秒の低い転送速度で連続的に書き込まれたBモ−ド
でステレオモードのATCオーディオデータが、記録デ
ータとして上記75セクタ/秒の転送速度でバースト的
に読み出される。この読み出されて記録されるデータに
ついて、記録休止期間を含む全体的なデータ転送速度
は、上記9.375セクタ/秒の低い速度となっている
が、バースト的に行われる記録動作の時間内での瞬時的
なデータ転送速度は上記標準的な75セクタ/秒となっ
ている。従って、ディスク回転速度が標準的なCD−D
Aフォーマットと同じ速度(一定線速度)のとき、該C
D−DAフォーマットと同じ記録密度、記憶パターンの
記録が行われる。
In this recording, a cluster consisting of a plurality of predetermined sectors (for example, 32 sectors + several sectors) is used as a recording unit for the same data transfer rate (75 sectors / second) as the standard CD-DA format through the pause period. ) Is done in a burst. That is, in the memory 64, the ATC audio data in the stereo mode is recorded in the B mode continuously written at the low transfer rate of 9.375 (= 75/8) sectors / second corresponding to the bit compression rate. The data is read in bursts at the transfer rate of 75 sectors / sec. The overall data transfer rate of the read and recorded data, including the recording pause period, is as low as 9.375 sectors / sec, but within the time of the recording operation performed in a burst manner. The instantaneous data transfer rate in the above is the standard 75 sectors / sec. Therefore, the disc rotation speed is a standard CD-D.
When the speed is the same as the A format (constant linear velocity), the C
The same recording density and storage pattern as those in the D-DA format are recorded.

【0034】メモリ64から上記75セクタ/秒の(瞬
時的な)転送速度でバースト的に読み出されたATCオ
ーディオデータすなわち記録データは、エンコーダ65
に供給される。ここで、メモリ64からエンコーダ65
に供給されるデータ列において、1回の記録で連続記録
される単位は、複数セクタ(例えば32セクタ)から成
るクラスタ及び該クラスタの前後位置に配されたクラス
タ接続用の数セクタとしている。このクラスタ接続用セ
クタは、エンコーダ65でのインターリーブ長より長く
設定しており、インターリーブされても他のクラスタの
データに影響を与えないようにしている。
The ATC audio data, that is, the recording data, which is burst-read from the memory 64 at the (instantaneous) transfer rate of 75 sectors / second is recorded by the encoder 65.
Is supplied to. Here, from the memory 64 to the encoder 65
In the data string supplied to the above, the unit of continuous recording in one recording is a cluster composed of a plurality of sectors (for example, 32 sectors) and several sectors for cluster connection arranged in the front and rear positions of the cluster. This cluster connection sector is set longer than the interleave length in the encoder 65 so that the data of other clusters will not be affected even if interleaved.

【0035】エンコーダ65は、メモリ64から上述し
たようにバースト的に供給される記録データについて、
エラー訂正のための符号化処理(パリティ付加及びイン
ターリーブ処理)やEFM処理などを施す。このエンコ
ーダ65による符号化処理が施された記録データが磁気
ヘッド駆動回路66に供給される。この磁気ヘッド駆動
回路66は、磁気ヘッド54が接続されており、上記記
録データに応じた変調磁界を光磁気ディスク1に印加す
るように磁気ヘッド54を駆動する。 また、システ
ムコントローラ57は、メモリ64に対する上述の如き
メモリ制御を行うとともに、このメモリ制御によりメモ
リ64からバースト的に読み出される上記記録データを
光磁気ディスク1の記録トラックに連続的に記録するよ
うに記録位置の制御を行う。この記録位置の制御は、シ
ステムコントローラ57によりメモリ64からバースト
的に読み出される上記記録データの記録位置を管理し
て、光磁気ディスク1の記録トラック上の記録位置を指
定する制御信号をサーボ制御回路56に供給することに
よって行われる。次に、この光磁気ディスク記録再生ユ
ニットの再生系について説明する。
The encoder 65, regarding the recording data supplied from the memory 64 in bursts as described above,
Encoding processing (parity addition and interleave processing) for error correction, EFM processing, and the like are performed. The recording data encoded by the encoder 65 is supplied to the magnetic head drive circuit 66. The magnetic head drive circuit 66 is connected to the magnetic head 54, and drives the magnetic head 54 so as to apply the modulation magnetic field according to the recording data to the magneto-optical disk 1. Further, the system controller 57 performs the above-mentioned memory control on the memory 64, and continuously records the above-mentioned recording data burst-read from the memory 64 on the recording track of the magneto-optical disk 1 by this memory control. Controls the recording position. The recording position is controlled by controlling the recording position of the recording data which is burst-read from the memory 64 by the system controller 57 and outputting a control signal for designating the recording position on the recording track of the magneto-optical disk 1 to the servo control circuit. By feeding 56. Next, the reproducing system of this magneto-optical disk recording / reproducing unit will be described.

【0036】この再生系は、上述の記録系により光磁気
ディスク1の記録トラック上に連続的に記録された記録
データを再生するためのものであり、光学ヘッド53に
よって光磁気ディスク1の記録トラックをレーザ光でト
レースすることにより得られる再生出力がRF回路55
により2値化されて供給されるデコーダ71を備えてい
る。なお、この再生系では、光磁気ディスクのみではな
く、いわゆるコンパクディスク(CD:Compact Disc)
と同じ再生専用光ディスクの読み出しも行うことができ
る。
This reproducing system is for reproducing the record data continuously recorded on the recording tracks of the magneto-optical disk 1 by the above-mentioned recording system, and the recording track of the magneto-optical disk 1 is made by the optical head 53. The reproduction output obtained by tracing the laser beam with the laser light is the RF circuit 55.
It is provided with a decoder 71 which is binarized by and supplied. In this reproducing system, not only a magneto-optical disc but also a so-called compact disc (CD: Compact Disc)
The same read-only optical disk can be read.

【0037】デコーダ71は、上述の記録系におけるエ
ンコーダ65に対応するものであって、RF回路55に
より2値化された再生出力について、エラー訂正のため
の復号化処理(デインターリーブ処理や誤り訂正処理)
やEFMの復調処理などの処理を行い上述のBモ−ドの
ステレオモードにおけるATCオーディオデータを、該
Bモ−ドのステレオモードにおける正規の転送速度より
も早い75セクタ/秒の転送速度で再生する。このデコ
ーダ71により得られる再生データは、メモリ72に供
給される。
The decoder 71 corresponds to the encoder 65 in the recording system described above, and performs decoding processing (deinterleave processing or error correction) for error correction on the reproduction output binarized by the RF circuit 55. processing)
ATC audio data in the B mode stereo mode described above is reproduced at a transfer rate of 75 sectors / sec which is faster than the normal transfer rate in the B mode stereo mode by performing processing such as EDM and EFM demodulation processing. To do. The reproduced data obtained by the decoder 71 is supplied to the memory 72.

【0038】メモリ72は、データの書き込み及び読み
出しがシステムコントローラ57により制御され、デコ
ーダ71から75セクタ/秒の転送速度で供給される再
生データがその75セクタ/秒の転送速度でバースト的
に書き込まれる。また、このメモリ72は、上記75セ
クタ/秒の転送速度でバースト的に書き込まれた上記再
生データがBモ−ドのステレオモードの正規の9.37
5セクタ/秒の転送速度で連続的に読み出される。
In the memory 72, writing and reading of data are controlled by the system controller 57, and reproduced data supplied from the decoder 71 at a transfer rate of 75 sectors / second is written in bursts at the transfer rate of 75 sectors / second. Be done. The memory 72 has a normal 9.37 in the stereo mode in which the reproduction data written in burst at the transfer rate of 75 sectors / second is in the B mode.
It is continuously read at a transfer rate of 5 sectors / second.

【0039】システムコントローラ57は、再生データ
をメモリ72に75セクタ/秒の転送速度で書き込むと
ともに、メモリ72から上記再生データを上記9.37
5セクタ/秒の転送速度で連続的に読み出すようなメモ
リ制御を行う。また、システムコントローラ57は、メ
モリ72に対する上述の如きメモリ制御を行うととも
に、このメモリ制御によりメモリ72にバースト的に書
き込まれる上記再生データを光磁気ディスク1の記録ト
ラックから連続的に再生するように再生位置の制御を行
う。この再生位置の制御は、システムコントローラ57
により光磁気ディスク1からバースト的に読み出される
上記再生データの再生位置を管理して、システムコント
ローラ57から、光磁気ディスク1もしくは光ディスク
1の記録トラック上の再生位置を指定する制御信号をサ
ーボ制御回路56に供給することによって行われる。
The system controller 57 writes the reproduced data in the memory 72 at a transfer rate of 75 sectors / second, and also writes the reproduced data from the memory 72 in the above 9.37.
Memory control is performed so that data is continuously read at a transfer rate of 5 sectors / second. Further, the system controller 57 performs the above-mentioned memory control on the memory 72, and continuously reproduces the above-mentioned reproduction data written in a burst in the memory 72 from the recording track of the magneto-optical disk 1 by this memory control. Controls the playback position. This playback position is controlled by the system controller 57.
Manages the reproduction position of the reproduction data read out in burst from the magneto-optical disc 1 by the servo controller, and outputs a control signal from the system controller 57 for designating the reproduction position on the recording track of the magneto-optical disc 1 or the optical disc 1. By feeding 56.

【0040】メモリ72から9.375セクタ/秒の転
送速度で連続的に読み出された再生データとして得られ
るBモ−ドのステレオモードにおけるATCオーディオ
データは、ATCデコーダ73に供給される。このAT
Cデコーダ73は、上記記録系のATCエンコーダ63
に対応するもので、システムコントローラ57により動
作モードが指定されて、例えば上記Bモ−ドのステレオ
モードにおけるATCオーディオデータを8倍にデータ
伸張(ビット伸張)することで16ビットのディジタル
オーディオデータを再生する。このATCデコーダ73
からのディジタルオーディオデータは、D/A変換器7
4に供給される。
ATC audio data in the B mode stereo mode obtained as reproduction data continuously read from the memory 72 at a transfer rate of 9.375 sectors / second is supplied to the ATC decoder 73. This AT
The C decoder 73 is a recording system ATC encoder 63.
The operation mode is designated by the system controller 57. For example, 16-bit digital audio data is expanded by 8-fold data expansion (bit expansion) of ATC audio data in the B mode stereo mode. Reproduce. This ATC decoder 73
Digital audio data from the D / A converter 7
4 is supplied.

【0041】D/A変換器74は、ATCデコーダ73
から供給されるディジタルオーディオデータをアナログ
信号に変換して、アナログオーディオ出力信号AOUT を
形成する。このD/A変換器74により得られるアナロ
グオーディオ出力信号AOUTは、ローパスフイルタ75
を介して出力端子76から出力される。
The D / A converter 74 is the ATC decoder 73.
The digital audio data supplied from the converter is converted into an analog signal to form an analog audio output signal AOUT. The analog audio output signal AOUT obtained by the D / A converter 74 is a low-pass filter 75.
Is output from the output terminal 76 via.

【0042】次に、この圧縮データ記録再生装置の上記
ICカード記録ユニットについて説明する。
Next, the IC card recording unit of this compressed data recording / reproducing apparatus will be described.

【0043】デコーダ71からのATCオーディオデー
タは、追加圧縮器84に送られて余剰ビットの除去及び
ゼロ語長処理等の処理がなされる。
The ATC audio data from the decoder 71 is sent to the additional compressor 84 and subjected to processing such as removal of surplus bits and zero word length processing.

【0044】ここで、本実施例では、ブロックフローテ
ィングの為のブロック内の最大値より著しく小さいスペ
クトル成分をゼロとする。この処理は、メモリ85に対
するデータの読み書きを伴いながら実行される。余剰ビ
ットの除去及びゼロ語長処理等を行う追加圧縮器84か
らの可変ビットレート圧縮符号化されたデータは、IC
カードインタフェース回路86を介してICカード2に
書き込まれる。勿論、本発明においては、余剰ビットの
除去及びゼロ語長処理等の可変ビットレ−ト圧縮は行わ
ないが、直交変換サイズを大きくしたり、サブ情報を持
つ周波数軸上のブロックフローティングの為のブロック
及び/又は量子化雑音が発生するブロックの周波数幅を
広げることで、より低いビットレートの定ビットレート
での書き込みを行うようにしても良い。
Here, in this embodiment, the spectral component which is significantly smaller than the maximum value in the block for the block floating is set to zero. This process is executed while reading / writing data from / to the memory 85. The variable bit rate compression-encoded data from the additional compressor 84, which removes excess bits and performs zero word length processing, is
It is written in the IC card 2 via the card interface circuit 86. Of course, in the present invention, variable bit rate compression such as removal of excess bits and zero word length processing is not performed, but a block for increasing the orthogonal transform size or for block floating on the frequency axis having sub information is used. And / or writing may be performed at a constant bit rate of a lower bit rate by widening the frequency width of a block in which quantization noise occurs.

【0045】上記光磁気ディスク記録再生ユニットの再
生系のデコーダ71からの圧縮データ(ATCオーディ
オデータ)が、伸張されずにそのまま上記ICカード記
録ユニットのメモリ85に送られるようになっている。
このデータ転送は、いわゆる高速ダビング時にシステム
コントローラ57がメモリ85等を制御することによっ
て行われる。このようにビットレートが低いATCオー
ディオデータを光磁気ディスク若しくは光ディスクから
ICカード2に書き込むことは、記録容量当たりの価格
が高いICカードを用いる場合に適している。なお、メ
モリ72からの圧縮データをメモリ85に送るようにし
てもよい。
The compressed data (ATC audio data) from the reproducing system decoder 71 of the magneto-optical disk recording / reproducing unit is directly sent to the memory 85 of the IC card recording unit without being expanded.
This data transfer is performed by the system controller 57 controlling the memory 85 and the like during so-called high-speed dubbing. Writing ATC audio data having a low bit rate from the magneto-optical disk or the optical disk to the IC card 2 is suitable when using an IC card having a high price per recording capacity. The compressed data from the memory 72 may be sent to the memory 85.

【0046】ここで、いわゆる高速ディジタルダビング
動作について説明する。
Here, a so-called high-speed digital dubbing operation will be described.

【0047】高速ディジタルダビング時には、キー入力
操作部58のダビング操作キー等を操作することによ
り、システムコントローラ57が高速ダビング制御処理
動作を実行する。具体的には、上記デコーダ71からの
圧縮データをそのままICカード記録ユニットのメモリ
85に送り、余剰ビットの除去及びゼロ語長処理等の処
理を行う追加圧縮器84により可変ビットレート符号化
を施して、ICカードインタフェース回路86を介して
ICカード2に書き込む。ここで、光磁気ディスク1に
例えば上記Bモ−ドのステレオモードにおけるATCオ
ーディオデータが記録されている場合には、デコーダ7
1からは8倍に圧縮されたディジタルオーディオデータ
が連続的に読み出されることになる。
At the time of high-speed digital dubbing, the system controller 57 executes the high-speed dubbing control processing operation by operating the dubbing operation keys of the key input operation unit 58. Specifically, the compressed data from the decoder 71 is sent to the memory 85 of the IC card recording unit as it is, and variable bit rate coding is performed by the additional compressor 84 that performs processing such as removal of excess bits and zero word length processing. Then, the data is written to the IC card 2 via the IC card interface circuit 86. If the ATC audio data in the B mode stereo mode is recorded on the magneto-optical disk 1, for example, the decoder 7
From 1, the digital audio data compressed by 8 times is continuously read.

【0048】従って、上記高速ダビング時には、光磁気
ディスク1から実時間で8倍(上記Bモ−ドのステレオ
モードの場合)の時間に相当する圧縮データが連続して
得られることになり、これに余剰ビットの除去及びゼロ
語長処理等の処理が施されて、一定ビットレート化され
たデータがICカード2に書き込まれるから、8倍の高
速ダビングを実現できる。なお、圧縮モードが異なれば
ダビング速度の倍率も異なってくる。また、圧縮の倍率
以上の高速でダビングを行わせるようにしてもよい。こ
の場合には、光磁気ディスク1を定常速度の何倍かの速
度で高速回転駆動する。
Therefore, at the time of high-speed dubbing, compressed data corresponding to a time which is eight times (in the case of the B mode stereo mode) in real time is continuously obtained from the magneto-optical disk 1. Since excess bits are removed and processing such as zero word length processing is performed on the data and the data having a constant bit rate is written to the IC card 2, eight times faster dubbing can be realized. If the compression mode is different, the magnification of the dubbing speed is also different. Also, dubbing may be performed at a high speed equal to or higher than the compression ratio. In this case, the magneto-optical disk 1 is driven to rotate at high speed at a speed several times the steady speed.

【0049】ところで、上記光磁気ディスク1には、図
2に示すように、ビット圧縮符号化されたデータが記録
されると同時に、該データを追加圧縮伸張ブロック3で
可変ビットレート符号化により圧縮符号化した際のデー
タ量(すなわちICカード2に書き込むために必要とさ
れるデータ記録容量)の情報が記録されている。こうす
ることによって、例えば光磁気ディスク1に記録されて
いる曲の内、ICカード2に書き込み可能な曲数や曲の
組合せ等を、これらのデータ量情報を読み取ることによ
り即座に知ることができる。もちろん可変ビットレート
モードではなく、固定ビットレートのより低ビットレー
トモードへの変換を追加圧縮伸張ブロック3で行なうこ
ともできる。
By the way, as shown in FIG. 2, bit-compressed data is recorded on the magneto-optical disk 1, and at the same time, the additional compression / expansion block 3 compresses the data by variable bit rate coding. Information on the amount of data when encoded (that is, the data recording capacity required for writing to the IC card 2) is recorded. By doing so, for example, the number of songs writable in the IC card 2 and the combination of the songs among the songs recorded on the magneto-optical disk 1 can be immediately known by reading the data amount information. . Of course, instead of the variable bit rate mode, conversion to a fixed bit rate lower bit rate mode can be performed by the additional compression / expansion block 3.

【0050】また逆に、ICカード2内に、可変ビット
レート符号化によりビット圧縮符号化されたデータのみ
ならず、ビット圧縮符号化したデータのデータ量情報も
書き込んでおくことにより、ICカード2から光磁気デ
ィスク1に曲等のデータを送って記録する際のデータ量
を迅速に知ることができる。もちろん、ICカード2内
には、可変ビットレート符号化でビット圧縮符号化され
たデータのみならず、固定ビットレートの低ビットレー
トモードのデータを書き込むこともできる。
On the contrary, by writing not only the data bit-compressed and encoded by the variable bit rate encoding but also the data amount information of the bit-compressed and encoded data in the IC card 2, the IC card 2 It is possible to quickly know the amount of data when transmitting and recording data such as music to the magneto-optical disk 1. Of course, not only the data bit-compressed and encoded by the variable bit rate encoding but also the data in the low bit rate mode of the fixed bit rate can be written in the IC card 2.

【0051】ここで、図3は、上記図1に示す構成の圧
縮データ記録再生装置5の正面外観を示しており、光磁
気ディスク又は光ディスクの挿入部6とICカード挿入
スロット7とが設けられている。もちろん、光磁気ディ
スク記録再生ユニットとICカード記録ユニットとは別
々のセットになっていてその間をケーブルで接続するよ
うにしてもよい。
Here, FIG. 3 shows a front appearance of the compressed data recording / reproducing apparatus 5 having the structure shown in FIG. 1, in which an inserting portion 6 for a magneto-optical disk or an optical disk and an IC card inserting slot 7 are provided. ing. Of course, the magneto-optical disk recording / reproducing unit and the IC card recording unit may be set separately and may be connected by a cable.

【0052】次に、ATCエンコーダ63における高能
率符号化について詳述する。すなわち、ディジタルオー
ディオ信号等の入力ディジタル信号を、帯域分割符号化
(SBC)、適応変換符号化(ATC)及び適応ビット
割当ての各技術を用いた高能率符号化の技術について、
図4以降の各図を参照しながら説明する。
Next, the high efficiency coding in the ATC encoder 63 will be described in detail. That is, a technique of high efficiency encoding of an input digital signal such as a digital audio signal using band division encoding (SBC), adaptive transform encoding (ATC) and adaptive bit allocation techniques is described.
The description will be made with reference to the drawings starting from FIG.

【0053】本発明のディジタル信号処理方法における
高能率符号化の処理を具体的に実現するATCエンコー
ダ63(以下、高能率符号化装置という)は、入力ディ
ジタル信号を複数の周波数帯域に分割すると共に、最低
域の2つの帯域の帯域幅は同じで、より高い周波数帯域
では高い周波数帯域ほどバンド幅を広く選定し、各周波
数帯域毎に直交変換を行って、得られた周波数軸のスペ
クトルデータを、低域では、後述する人間の聴覚特性を
考慮したいわゆる臨界帯域幅(クリテイカルバンド)毎
に、中高域ではブロックフローティング効率を考慮して
臨界帯域幅を細分化した帯域毎に、適応的にビット割当
して符号化している。通常、上述の直交変換のためのブ
ロックが量子化雑音の発生する単位である。さらに、本
実施例においては、直交変換の前に入力ディジタルオー
ディオ信号に応じて適応的にブロックサイズ(ブロック
長)を変化させると共に、該ブロック単位でフローティ
ング処理を行っている。
The ATC encoder 63 (hereinafter, referred to as a high efficiency coding device) for specifically realizing the high efficiency coding processing in the digital signal processing method of the present invention divides the input digital signal into a plurality of frequency bands. , The bandwidths of the two lowest bands are the same, and in the higher frequency band, the higher the frequency band, the wider the bandwidth is selected, and the orthogonal transform is performed for each frequency band to obtain the spectrum data of the obtained frequency axis. In the low frequency range, each so-called critical bandwidth (critical band) that takes into account human auditory characteristics, which will be described later, is adaptively adjusted, and in the middle and high frequencies, the critical bandwidth is subdivided in consideration of block floating efficiency. Bits are allocated and encoded. Usually, the block for the above-mentioned orthogonal transformation is a unit in which quantization noise occurs. Further, in the present embodiment, the block size (block length) is adaptively changed according to the input digital audio signal before the orthogonal transformation, and the floating process is performed for each block.

【0054】具体的には、図4において、入力端子10
には例えばサンプリング周波数が44.1kHzの時、
0〜22kHzのディジタルオーディオ信号が供給され
ている。この入力ディジタルオーディオ信号は、例えば
いわゆるQMF(QuadratureMirror filter)等のフィル
タからなる帯域分割フイルタ11により0〜11kHz
帯域と11k〜22kHz帯域とに分割され、0〜11
kHz帯域の信号は同じくいわゆるQMF等のフィルタ
からなる帯域分割フィルタ12により0〜5.5kHz
帯域と5.5k〜11kHz帯域とに分割される。帯域
分割フィルタ11からの11k〜22kHz帯域の信号
は直交変換回路の一例であるMDCT回路13に送ら
れ、帯域分割フィルタ12からの5.5k〜11kHz
帯域の信号はMDCT回路14に送られ、帯域分割フィ
ルタ12からの0〜5.5kHz帯域の信号はMDCT
回路15に送られることにより、それぞれMDCT処理
される。
Specifically, referring to FIG. 4, the input terminal 10
For example, when the sampling frequency is 44.1 kHz,
A digital audio signal of 0 to 22 kHz is supplied. This input digital audio signal is supplied to a band division filter 11 composed of a filter such as a so-called QMF (Quadrature Mirror filter) for 0 to 11 kHz.
Band and 11 to 22 kHz band divided into 0 to 11
A signal in the kHz band is also supplied to a band-dividing filter 12 which is also a so-called QMF filter or the like and has a frequency of 0 to 5.5 kHz.
It is divided into a band and a band of 5.5 to 11 kHz. A signal in the 11 kHz to 22 kHz band from the band division filter 11 is sent to the MDCT circuit 13 which is an example of an orthogonal transformation circuit, and 5.5 kHz to 11 kHz from the band division filter 12.
The band signal is sent to the MDCT circuit 14, and the 0 to 5.5 kHz band signal from the band division filter 12 is MDCT.
The MDCT processing is performed by being sent to the circuit 15.

【0055】ここで上述した入力ディジタル信号を複数
の周波数帯域に分割する手法としては、例えば上記QM
F等のフィルタによる分割手法がある。この分割手法は
文献「ディジタル・コーディング・オブ・スピーチ・イ
ン・サブバンズ」("Digitalcoding of speech in subba
nds" R.E.Crochiere, Bell Syst.Tech. J., Vol.55,N
o.8 1976) に述べられている。
As a method of dividing the above-mentioned input digital signal into a plurality of frequency bands, for example, the above QM is used.
There is a division method using a filter such as F. This segmentation method is described in the document "Digital coding of speech in subba".
nds "RE Crochiere, Bell Syst.Tech. J., Vol.55, N
o.8 1976).

【0056】また、文献「ポリフェィズ・クァドラチュ
ア・フィルターズ −新しい帯域分割符号化技術」("Po
lyphase Quadrature filters -A new subband coding t
echnique", Joseph H. Rothweiler ICASSP 83, BOSTON)
には、等帯域幅のフィルタ分割手法が述べられている。
In addition, the document "Polyphase Quadrature Filters-New Band Division Coding Technology"("Po
lyphase Quadrature filters -A new subband coding t
echnique ", Joseph H. Rothweiler ICASSP 83, BOSTON)
Describes an equal bandwidth filter partitioning technique.

【0057】また、上述した直交変換としては、例えば
入力オーディオ信号を所定単位時間でブロック化し、前
記ブロック毎に高速フーリエ変換(FFT)、離散コサ
イン変換(DCT)、変更離散コサイン変換(MDC
T)等を行うことで時間軸を周波数軸に変換するような
直交変換がある。上記MDCTについては、文献「時間
領域エリアシング・キャンセルを基礎とするフィルタ・
バンク設計を用いたサブバンド/変換符号化」("Subban
d/Transform Coding Using Filter Bank DesignsBased
on Time Domain Aliasing Cancellation," J.P.Princen
A.B.Bradley, Univ. of Surrey Royal Melbourne Ins
t. of Tech. ICASSP 1987)に述べられている。
As the above-mentioned orthogonal transform, for example, the input audio signal is divided into blocks in a predetermined unit time, and the fast Fourier transform (FFT), discrete cosine transform (DCT), and modified discrete cosine transform (MDC) are performed for each block.
There is an orthogonal transformation in which the time axis is transformed into the frequency axis by performing T) or the like. Regarding the above-mentioned MDCT, refer to the document "Filters based on time domain aliasing cancellation.
Subband / Transform Coding Using Bank Design "(" Subban
d / Transform Coding Using Filter Bank Designs Based
on Time Domain Aliasing Cancellation, "JPPrincen
ABBradley, Univ. Of Surrey Royal Melbourne Ins
t. of Tech. ICASSP 1987).

【0058】次に、標準的な入力ディジタルオーディオ
信号に対する各モードにおけるMDCT回路13、1
4、15でのブロックについての具体例を図5に示す。
Next, the MDCT circuits 13, 1 in each mode for a standard input digital audio signal.
FIG. 5 shows a specific example of the blocks at 4 and 15.

【0059】この図5の具体例において、上記図4の各
帯域分割フィルタ11,12からの3つのフィルタ出力
信号は、各々複数の直交変換ブロックサイズを有するM
DCT回路13、14、15によって、信号の時間特性
により、その時間分解能を切り換えられる。また、MD
CT回路13、14、15は、ビットレートが小さいモ
ード程、最大処理ブロックの時間長を長くし、信号通過
帯域幅を狭くする。
In the specific example of FIG. 5, the three filter output signals from the band division filters 11 and 12 of FIG. 4 each have M orthogonal transform block sizes.
The DCT circuits 13, 14 and 15 can switch the time resolution depending on the time characteristic of the signal. Also MD
The CT circuits 13, 14 and 15 increase the time length of the maximum processing block and narrow the signal pass bandwidth in the mode in which the bit rate is lower.

【0060】すなわち、この実施例では、Aモードの場
合、信号が時間的に準定常的であるときには直交変換ブ
ロックサイズを11.6msと大きくし、信号が非定常
的であるときには図5に示すように11kHz以下の帯
域で直交変換ブロックサイズを更に4分割とし、11k
Hz以上の帯域では直交変換ブロックサイズを8分割と
する。
That is, in this embodiment, in the A mode, the orthogonal transform block size is increased to 11.6 ms when the signal is quasi-stationary in time, and shown in FIG. 5 when the signal is non-stationary. In the band of 11 kHz or less, the orthogonal transform block size is further divided into 4
In the band of Hz or higher, the orthogonal transform block size is divided into eight.

【0061】Bモードの場合は、Aモードに比べて直交
変換ブロックの時間長が2倍長くなって23.2msと
なり、信号通過帯域幅は13kHzまでと狭くなる。ま
た、信号が時間的に準定常的である場合には直交変換ブ
ロックサイズを23.2msと大きくし、信号が非定常
的である場合には2分割して11.6msとする。さら
に、信号の非定常性がより強まったときは、図5に示す
ように11kHz以下の帯域では直交変換ブロックサイ
ズを更に4分割として合計8分割とし、11kHz以上
の帯域では直交変換ブロックサイズを更に8分割して合
計16分割とする。
In the B mode, the time length of the orthogonal transform block is twice as long as that in the A mode, which is 23.2 ms, and the signal pass bandwidth is narrowed to 13 kHz. When the signal is quasi-stationary in time, the orthogonal transform block size is increased to 23.2 ms, and when the signal is non-stationary, it is divided into 2 to 11.6 ms. Further, when the non-stationarity of the signal becomes stronger, as shown in FIG. 5, the orthogonal transform block size is further divided into four in the band of 11 kHz or less to be a total of eight, and the orthogonal transform block size is further increased in the band of 11 kHz or more. Eight divided into a total of 16 divided.

【0062】Cモードの場合は、直交変換ブロックの時
間長を34.8msまでとする。通過帯域は、5.5k
Hzに制限する。
In the C mode, the time length of the orthogonal transform block is set to 34.8 ms. Pass band is 5.5k
Limit to Hz.

【0063】Dモードの場合は、直交変換ブロックの時
間長を46.4msとする。
In the D mode, the time length of the orthogonal transform block is set to 46.4 ms.

【0064】ここで、各MDCT回路13、14、15
において、直交変換ブロックの時間長を2倍長くするの
を、低域側の帯域に限ることにより、AモードからBモ
ードへのビットレートの変換が容易となる。すなわち、
Aモードの低域側の直交変換した信号を逆直交変換し、
得られる信号を直交変換ブロックサイズが倍で直交変換
する。これは、全帯域を成す複数の帯域の信号を逆直交
変換してから、再びそれぞれの帯域毎に直交変換するの
に比較して容易である。また、これは例えば光磁気ディ
スクからICメモリカードへの高速転送をAモードから
Bモードへの変換を行いながら実行するのに都合がよ
い。これは、低域よりも高域の音響信号の方が、時間的
変動が大きいこと、信号対雑音比が小さくてもよいこと
がその根拠となる。
Here, each MDCT circuit 13, 14, 15
In the above, the bit length conversion from the A mode to the B mode is facilitated by limiting the time length of the orthogonal transform block to be twice as long as the low frequency band. That is,
The signal orthogonally transformed on the low frequency side of the A mode is inversely orthogonally transformed,
The obtained signal is subjected to orthogonal transform with a double orthogonal transform block size. This is easier than performing inverse orthogonal transform on signals in a plurality of bands forming the entire band and then performing orthogonal transform again for each band. Further, this is convenient for executing high-speed transfer from the magneto-optical disk to the IC memory card while converting from the A mode to the B mode. This is based on the fact that the acoustic signal in the high frequency range has a larger temporal variation and the signal-to-noise ratio may be smaller than that in the low frequency range.

【0065】なお、このとき、信号通過帯域幅は、13
kHzまでとする。この場合、11kHzから22kH
z帯域の信号において直交変換前のフィルタ出力信号を
1/2若しくは1/4サブサンプリングすることで、信
号通過帯域以上の帯域の為の無駄な信号処理を避けるこ
とができる。
At this time, the signal pass bandwidth is 13
Up to kHz. In this case, 11 kHz to 22 kHz
By sub-sampling the filter output signal before orthogonal transformation in the z-band signal by ½ or ¼, it is possible to avoid unnecessary signal processing for a band equal to or higher than the signal pass band.

【0066】以下Cモード、Dモードとなるにしたがっ
て直交変換ブロックの長さが長くなり、信号通過帯域幅
は狭くすることができる。もちろん、全てのモード間で
直交変換ブロックの長さ及び信号通過帯域幅が異なる必
要はなく、同じ値を取る場合もある。
In the following, the length of the orthogonal transform block becomes longer and the signal pass bandwidth can be made narrower in the C mode and the D mode. Of course, the length of the orthogonal transform block and the signal pass bandwidth do not have to be different between all modes, and the same value may be used in some cases.

【0067】また、例え低ビットレートモードの方が直
交変換ブロックの長さが長くなっていたとしても、時間
遅れを短くしたい用途のためには、そのモードが持つ複
数の直交変換ブロックサイズの内、短い直交変換ブロッ
クサイズを選択的に使って直交変換することで目的を達
成することができる。
Even if the length of the orthogonal transform block is longer in the low bit rate mode, for the purpose of reducing the time delay, the orthogonal transform block size among the plural orthogonal transform block sizes is included in the mode. The object can be achieved by selectively using a short orthogonal transform block size to perform orthogonal transform.

【0068】再び図4において、Aモードにおける各M
DCT回路13、14、15にてMDCT処理されて得
られた周波数軸上のスペクトルデータ(スペクトル成
分)あるいはMDCT係数データは、低域はいわゆる臨
界帯域(クリティカルバンド)毎にまとめられて、また
中高域はブロックフローティングの有効性を考慮して臨
界帯域幅を細分化して、後述する非線形処理回路40,
41,42を介した後、適応ビット割当符号化回路18
に送られている。なお、このクリティカルバンドとは、
人間の聴覚特性を考慮して分割された周波数帯域であ
り、ある純音の周波数近傍の同じ強さの狭帯域のノイズ
によって当該純音がマスクされるときのそのノイズの持
つ帯域のことである。このクリティカルバンドは、高域
ほど帯域幅が広くなっており、上記0〜22kHzの全
周波数帯域は例えば25のクリティカルバンドに分割さ
れている。
Referring again to FIG. 4, each M in the A mode
In the spectrum data (spectral components) on the frequency axis or the MDCT coefficient data obtained by the MDCT processing in the DCT circuits 13, 14 and 15, low frequencies are grouped into so-called critical bands (critical bands), and medium high The region is divided into the critical bandwidth in consideration of the effectiveness of the block floating, and the nonlinear processing circuit 40, which will be described later,
After passing through 41 and 42, the adaptive bit allocation encoding circuit 18
Have been sent to. In addition, with this critical band,
It is a frequency band divided in consideration of human auditory characteristics, and is a band of noise when a pure tone is masked by a narrow band noise of the same strength near the frequency of the pure tone. The critical band has a wider bandwidth in a higher frequency range, and the entire frequency band of 0 to 22 kHz is divided into, for example, 25 critical bands.

【0069】Bモードにおいて、直交変換ブロックサイ
ズをAモードの場合の2倍にしない信号が非定常的であ
る場合には、サブ情報を有するブロックの周波数幅を、
例えばAモードの2倍の周波数幅にとることにより、前
記ブロックの数を半減し、サブ情報を減らしている。こ
のようにして、低域は、直交変換ブロックサイズを2倍
にすることで、それ以外の帯域は、サブ情報を有するブ
ロックの周波数幅を大きくすることで、全帯域でのサブ
情報を減らすことができる。
In the B mode, when the signal that does not double the orthogonal transform block size in the A mode is non-stationary, the frequency width of the block having the sub information is
For example, by adopting a frequency width twice as wide as that of the A mode, the number of blocks is halved and sub information is reduced. In this way, the orthogonal transform block size is doubled in the low band, and the frequency width of the block having sub information is increased in the other bands, thereby reducing the sub information in the entire band. You can

【0070】次に、ビット配分算出回路43は、上記ク
リティカルバンド及びブロックフローティングを考慮し
て分割されたスペクトルデータに基づき、クリティカル
バンド及びブロックフローティングを考慮した各分割帯
域毎のエネルギ或いはピーク値等を求め、さらに、マス
キング量を考慮したこの各分割帯域毎のエネルギ或いは
ピーク値等に基づいて、各帯域毎に割り当てビット数を
求め、この情報を適応ビット割当符号化回路18に送
る。当該適応ビット割当符号化回路18では、各帯域毎
に割り当てられたビット数に応じて各スペクトルデータ
(或いはMDCT係数データ)を正規化及び量子化する
ようにしている。このようにして符号化されたデータ
は、出力端子19を介して取り出される。
Next, the bit allocation calculating circuit 43 calculates the energy or peak value of each divided band in consideration of the critical band and the block floating based on the spectrum data divided in consideration of the critical band and the block floating. Furthermore, the number of allocated bits is calculated for each band based on the energy or peak value of each divided band in consideration of the masking amount, and this information is sent to the adaptive bit allocation encoding circuit 18. The adaptive bit allocation encoding circuit 18 normalizes and quantizes each spectrum data (or MDCT coefficient data) according to the number of bits allocated for each band. The data encoded in this way is taken out via the output terminal 19.

【0071】次に、図6は上記ビット配分算出回路43
の一具体例の概略構成を示すブロック回路図である。こ
の図6において、入力端子21には、上記各非線形処理
回路40,41,42からの周波数軸上のスペクトルデ
ータが供給されている。
Next, FIG. 6 shows the bit allocation calculating circuit 43.
It is a block circuit diagram which shows schematic structure of one specific example. In FIG. 6, the input terminal 21 is supplied with spectrum data on the frequency axis from each of the nonlinear processing circuits 40, 41 and 42.

【0072】次にこの周波数軸上のスペクトルデータ
は、帯域毎のエネルギ算出回路22に送られて、クリテ
ィカルバンド及びブロックフローティングを考慮した各
分割帯域のエネルギが、例えば当該バンド内での各スペ
クトル成分の振幅値の総和を計算すること等により求め
られる。この各バンド毎のエネルギの代わりに、振幅値
のピーク値、平均値等を用いるようにしてもよい。この
エネルギ算出回路22からの出力として、例えば各バン
ドの総和値のスペクトルを図7の図中SBとして示して
いる。ただし、この図7では、図示を簡略化するため、
上記マスキング量とクリティカルバンド及びブロックフ
ローティングを考慮した分割帯域数を12バンド(B1
〜B12)で表現している。
Next, this spectrum data on the frequency axis is sent to the energy calculation circuit 22 for each band, and the energy of each divided band considering the critical band and block floating is, for example, each spectrum component in the band. It is obtained by calculating the sum of the amplitude values of. Instead of the energy for each band, a peak value, an average value, or the like of the amplitude value may be used. As the output from the energy calculating circuit 22, for example, the spectrum of the sum value of each band is shown as SB in the drawing of FIG. However, in FIG. 7, in order to simplify the illustration,
Considering the masking amount, critical band and block floating, the number of divided bands is 12 bands (B1
~ B12).

【0073】ここで、上記スペクトルSBのいわゆるマ
スキングに於ける影響を考慮するために、該スペクトル
SBに所定の重み付け関数を掛けて加算するような畳込
み(コンボリユーション)処理を施す。このため、上記
帯域毎のエネルギ算出回路22の出力すなわち該スペク
トルSBの各値は、畳込みフィルタ回路23に送られ
る。該畳込みフィルタ回路23は、例えば、入力データ
を順次遅延させる複数の遅延素子と、これら遅延素子か
らの出力に乗算係数(重み付け関数)を乗算する複数の
乗算器(例えば各バンドに対応する25個の乗算器)
と、各乗算器出力の総和をとる総和加算器とから構成さ
れるものである。この畳込み処理により、図7の図中点
線で示す部分の総和がとられる。なお、上記マスキング
とは、人間の聴覚上の特性により、ある信号によって他
の信号がマスクされて聞こえなくなる現象をいうもので
あり、このマスキング効果には、時間軸上のオーディオ
信号による時間軸マスキング効果と、周波数軸上の信号
による同時刻マスキング効果とがある。これらのマスキ
ング効果により、マスキングされる部分にノイズがあっ
たとしても、このノイズは聞こえないことになる。この
ため、実際のオーディオ信号では、このマスキングされ
る範囲内のノイズは許容可能なノイズとされる。
Here, in order to take into account the influence of the spectrum SB on so-called masking, a convolution process is performed such that the spectrum SB is multiplied by a predetermined weighting function and added. Therefore, the output of the energy calculation circuit 22 for each band, that is, each value of the spectrum SB is sent to the convolution filter circuit 23. The convolution filter circuit 23 includes, for example, a plurality of delay elements for sequentially delaying input data and a plurality of multipliers (for example, 25 corresponding to each band) for multiplying outputs from these delay elements by a multiplication coefficient (weighting function). Multipliers)
And a sum total adder that sums the outputs of the respective multipliers. By this convolution processing, the sum total of the portion indicated by the dotted line in FIG. 7 is obtained. Note that the masking is a phenomenon in which one signal is masked by another signal and becomes inaudible due to human auditory characteristics, and this masking effect includes a time axis masking by an audio signal on the time axis. There are an effect and a simultaneous masking effect by a signal on the frequency axis. Due to these masking effects, even if there is noise in the masked portion, this noise cannot be heard. Therefore, in the actual audio signal, the noise within the masked range is regarded as an acceptable noise.

【0074】ここで、上記畳込みフィルタ回路23の各
乗算器の乗算係数(フィルタ係数)の一具体例を示す
と、任意のバンドに対応する乗算器Mの係数を1とする
とき、乗算器M−1で係数0.15を、乗算器M−2で
係数0.0019を、乗算器M−3で係数0.0000
086を、乗算器M+1で係数0.4を、乗算器M+2
で係数0.06を、乗算器M+3で係数0.007を各
遅延素子の出力に乗算することにより、上記スペクトル
SBの畳込み処理が行われる。ただし、Mは1〜25の
任意の整数である。
Here, a specific example of the multiplication coefficient (filter coefficient) of each multiplier of the convolution filter circuit 23 will be described. When the coefficient of the multiplier M corresponding to an arbitrary band is 1, the multiplier M-1 gives a coefficient of 0.15, multiplier M-2 gives a coefficient of 0.0019, and multiplier M-3 gives a coefficient of 0.0000.
086, multiplier M + 1 gives a coefficient of 0.4, multiplier M + 2
By multiplying the output of each delay element by a coefficient of 0.06 with a coefficient of 0.007 with a multiplier M + 3, the convolution processing of the spectrum SB is performed. However, M is an arbitrary integer of 1 to 25.

【0075】次に、上記畳込みフィルタ回路23の出力
は引算器24に送られる。該引算器24は、上記畳込ん
だ領域での後述する許容可能な雑音レベルに対応するレ
ベルαを求めるものである。なお、当該許容可能な雑音
レベル(以下、許容ノイズレベルという)に対応するレ
ベルαは、後述するように、逆コンボリューション処理
を行うことによって、クリティカルバンドの各バンド毎
の許容ノイズレベルとなるようなレベルである。ここ
で、上記引算器24には、上記レベルαを求めるための
許容関数(マスキングレベルを表現する関数)が供給さ
れる。この許容関数を増減させることで上記レベルαの
制御を行っている。当該許容関数は、次に説明するよう
な(n−ai)関数発生回路25から供給されているも
のである。
Next, the output of the convolution filter circuit 23 is sent to the subtractor 24. The subtractor 24 obtains a level α corresponding to an allowable noise level described later in the convoluted area. The level α corresponding to the permissible noise level (hereinafter referred to as the permissible noise level) becomes the permissible noise level for each band of the critical band by performing the inverse convolution process as described later. It is a good level. Here, the subtractor 24 is supplied with an allowance function (function expressing a masking level) for obtaining the level α. The level α is controlled by increasing or decreasing this allowance function. The permissible function is supplied from the (n-ai) function generating circuit 25 described below.

【0076】すなわち、許容ノイズレベルに対応するレ
ベルαは、クリティカルバンドのバンドの低域から順に
与えられる番号をiとすると、次の(1)式で求めるこ
とができる。
That is, the level α corresponding to the allowable noise level can be obtained by the following equation (1), where i is the number given in order from the low band of the critical band.

【0077】α=S−(n−ai) ・・・(1) この(1)式において、n,aは定数でa>0、Sは畳
込み処理されたバークスペクトルの強度であり、(1)
式中(n-ai)が許容関数となる。本実施例ではn=38,
a=1としており、この時の音質劣化はなく、良好な符
号化が行えた。
Α = S- (n-ai) (1) In this equation (1), n and a are constants, a> 0, S is the intensity of the convolved Bark spectrum, and ( 1)
In the formula, (n-ai) is the allowable function. In this embodiment, n = 38,
Since a = 1, there was no sound quality deterioration at this time, and good encoding was possible.

【0078】このようにして、上記レベルαが求めら
れ、このデータは、割算器26に伝送される。当該割算
器26では、上記畳込みされた領域での上記レベルαを
逆コンボリユーションするためのものである。したがっ
て、この逆コンボリユーション処理を行うことにより、
上記レベルαからマスキングスペクトルが得られるよう
になる。すなわち、このマスキングスペクトルが許容ノ
イズスペクトルとなる。なお、上記逆コンボリユーショ
ン処理は、複雑な演算を必要とするが、本実施例では簡
略化した割算器26を用いて逆コンボリユーションを行
っている。
In this way, the level α is obtained, and this data is transmitted to the divider 26. The divider 26 is for inverse convolution of the level α in the convolved area. Therefore, by performing this inverse convolution process,
The masking spectrum can be obtained from the level α. That is, this masking spectrum becomes the allowable noise spectrum. Although the above-mentioned inverse convolution processing requires a complicated operation, in the present embodiment, the inverse convolution is performed using the simplified divider 26.

【0079】次に、上記マスキングスペクトルは、合成
回路27を介して減算器28に伝送される。ここで、当
該減算器28には、上記帯域毎のエネルギ検出回路22
からの出力、すなわち前述したスペクトルSBが、遅延
回路29を介して供給されている。したがって、この減
算器28で上記マスキングスペクトルとスペクトルSB
との減算演算が行われることで、図8に示すように、上
記スペクトルSBは、該マスキングスペクトルMSのレ
ベルで示すレベル以下がマスキングされることになる。
以下、マスキングされたスペクトルSBを許容雑音レベ
ルという当該減算器28からの出力は、許容雑音補正回
路30を介し、出力端子31から取り出され、例えば割
り当てビット数情報が予め記憶されたROM等(図示せ
ず)に送られる。このROM等は、上記減算回路28か
ら許容雑音補正回路30を介して得られた出力に応じ、
各バンド毎の割り当てビット数情報を出力する。この割
り当てビット数情報が上記適応ビット割当符号化回路1
8に送られることで、MDCT回路13、14、15か
らの周波数軸上の各スペクトルデータがそれぞれのバン
ド毎に割り当てられたビット数で量子化されるわけであ
る。
Next, the masking spectrum is transmitted to the subtractor 28 via the synthesizing circuit 27. Here, the subtractor 28 includes an energy detection circuit 22 for each band.
From the output signal, that is, the spectrum SB described above is supplied via the delay circuit 29. Therefore, the masking spectrum and the spectrum SB are obtained by the subtractor 28.
By performing the subtraction operation with and, the spectrum SB is masked below the level indicated by the level of the masking spectrum MS, as shown in FIG.
Hereinafter, the output from the subtractor 28, in which the masked spectrum SB is referred to as an allowable noise level, is taken out from the output terminal 31 via the allowable noise correction circuit 30, and, for example, the ROM or the like in which the allocated bit number information is stored in advance (see FIG. Sent (not shown). This ROM, etc., according to the output obtained from the subtraction circuit 28 via the allowable noise correction circuit 30,
Information on the number of allocated bits for each band is output. This allocation bit number information is the adaptive bit allocation encoding circuit 1 described above.
By being sent to the channel 8, the spectrum data on the frequency axis from the MDCT circuits 13, 14, and 15 are quantized by the number of bits assigned to each band.

【0080】すなわち要約すれば、適応ビット割当符号
化回路18では、上記マスキング量を考慮した各分割帯
域のエネルギに応じて割り当てられたビット数で上記各
バンド毎のスペクトルデータを量子化することになる。
なお、遅延回路29は上記合成回路27以前の各回路で
の遅延量を考慮してエネルギ検出回路22からのスペク
トルSBを遅延させるために設けられている。
In summary, the adaptive bit allocation encoding circuit 18 is to quantize the spectrum data for each band with the number of bits allocated according to the energy of each divided band in consideration of the masking amount. Become.
The delay circuit 29 is provided to delay the spectrum SB from the energy detection circuit 22 in consideration of the delay amount in each circuit before the synthesis circuit 27.

【0081】ところで、上述した合成回路27での合成
の際に、最小可聴カーブ発生回路32から供給される図
9に示すような人間の聴覚特性であるいわゆる最小可聴
カーブRCを示すデータと、上記マスキングスペクトル
MSとを合成するようにしてもよい。この最小可聴カー
ブRCにおいて、雑音の絶対レベルがこの最小可聴カー
ブRC以下ならば該雑音は聞こえないことになる。この
最小可聴カーブRCは、コーディングが同じであっても
例えば再生時の再生ボリュームの違いで異なるものとな
が、現実的なディジタルシステムでは、例えば16ビッ
トダイナミックレンジへの音楽のはいり方にはさほど違
いがないので、例えば4kHz付近の最も耳に聞こえや
すい周波数帯域の量子化雑音が聞こえないとすれば、他
の周波数帯域ではこの最小可聴カーブのレベル以下の量
子化雑音は聞こえないと考えられる。
By the way, at the time of synthesizing in the synthesizing circuit 27 described above, data indicating a so-called minimum audible curve RC which is a human auditory characteristic as shown in FIG. The masking spectrum MS may be combined. In this minimum audible curve RC, if the absolute level of noise is less than or equal to this minimum audible curve RC, the noise cannot be heard. Even if the coding is the same, the minimum audible curve RC is different due to the difference in the reproduction volume at the time of reproduction. However, in a realistic digital system, for example, how to enter music into a 16-bit dynamic range is not so much. Since there is no difference, if, for example, the quantization noise in the most audible frequency band near 4 kHz is not heard, it is considered that the quantization noise below the level of the minimum audible curve is not heard in other frequency bands.

【0082】したがって、例えば4kHz付近の雑音が
聞こえない使い方をするとし、この最小可聴カーブRC
とマスキングスペクトルMSとを共に合成することで許
容雑音レベルを得るようにし、この場合の許容雑音レベ
ルは、図9の図中の斜線で示す部分までとすることがで
きる。なお、本実施例では、上記最小可聴カーブの4k
Hzのレベルを、例えば20ビット相当の最低レベルに
合わせている。また、この図9は、信号スペクトルSS
も同時に示している。
Therefore, for example, assuming that the noise of around 4 kHz cannot be heard, the minimum audible curve RC
And the masking spectrum MS are combined together to obtain an allowable noise level. In this case, the allowable noise level can be up to the shaded portion in the drawing of FIG. In this embodiment, the minimum audible curve of 4k
The Hz level is adjusted to the lowest level equivalent to 20 bits, for example. Further, FIG. 9 shows the signal spectrum SS
Are also shown at the same time.

【0083】また、上記許容雑音補正回路30では、補
正情報出力回路33から送られてくる例えば等ラウドネ
スカーブの情報に基づいて、上記減算器28からの出力
における許容雑音レベルを補正している。ここで、等ラ
ウドネスカーブとは、人間の聴覚特性に関する特性曲線
であり、例えば1kHzの純音と同じ大きさに聞こえる
各周波数での音の音圧を求めて曲線で結んだもので、ラ
ウドネスの等感度曲線とも呼ばれる。またこの等ラウド
ネス曲線は、図9に示した最小可聴カーブRCと略同じ
曲線を描くものである。この等ラウドネス曲線において
は、例えば4kHz付近では1kHzのところより音圧
が8〜10dB下がっても1kHzと同じ大きさに聞こ
え、逆に、10kHz付近では1kHzでの音圧よりも
約15dB高くないと同じ大きさに聞こえない。このた
め、許容雑音補正回路30において、許容雑音レベル
を、等ラウドネス曲線と同じ周波数特性を持つようにす
るのが良いことがわかる。このようなことから、上記等
ラウドネス曲線を考慮して上記許容雑音レベルを補正す
ることは、人間の聴覚特性に適合していることがわか
る。
The allowable noise correction circuit 30 corrects the allowable noise level in the output from the subtractor 28 based on the information of the equal loudness curve sent from the correction information output circuit 33. Here, the equal loudness curve is a characteristic curve relating to human auditory characteristics, for example, a curve obtained by obtaining the sound pressure of sound at each frequency that sounds the same as a pure tone of 1 kHz, and connecting the curves. Also called sensitivity curve. Further, this equal loudness curve draws a curve substantially the same as the minimum audible curve RC shown in FIG. In this equal loudness curve, for example, in the vicinity of 4 kHz, even if the sound pressure drops by 8 to 10 dB from 1 kHz, it sounds as loud as 1 kHz. It doesn't sound the same. Therefore, it is preferable that the allowable noise correction circuit 30 has an allowable noise level having the same frequency characteristic as the equal loudness curve. From this, it can be seen that correcting the permissible noise level in consideration of the equal loudness curve is suitable for human auditory characteristics.

【0084】また、補正情報出力回路33において、上
記適応ビット割当符号化回路18での量子化の際の出力
情報量(データ量)と、最終符号化データのビットレー
ト目標値との間の誤差の情報に基づいて、上記許容雑音
レベルを補正する補正データを出力する。これは、全て
のビット割り当て単位ブロックに対して予め一時的な適
応ビット割り当てを行って得られた総ビット数が、最終
的な符号化出力データのビットレートによって定まる一
定のビット数(目標値)に対して誤差を持つことがあ
り、その誤差分を0とするように再度ビット割り当てを
するものである。すなわち、当該目標値よりも総割り当
てビット数が少ないときには、差のビット数を各単位ブ
ロックに割り振って付加するようにし、目標値よりも総
割り当てビット数が多いときには、差のビット数を各単
位ブロックに割り振って削るようにするわけである。
Further, in the correction information output circuit 33, the error between the output information amount (data amount) at the time of quantization in the adaptive bit allocation encoding circuit 18 and the bit rate target value of the final encoded data. Correction data for correcting the allowable noise level is output on the basis of the information of. This is because the total number of bits obtained by performing temporary adaptive bit allocation to all bit allocation unit blocks in advance is a fixed number of bits (target value) determined by the bit rate of the final encoded output data. May have an error, and bit allocation is performed again so that the error becomes 0. That is, when the total number of allocated bits is smaller than the target value, the difference bit number is allocated and added to each unit block, and when the total number of allocated bits is larger than the target value, the difference bit number is set in each unit. Allocate to blocks and delete.

【0085】具体的には、上記総割り当てビット数の上
記目標値からの誤差を検出し、この誤差データに応じて
補正情報出力回路33が各割り当てビット数を補正する
ための補正データを出力する。ここで、上記誤差データ
がビット数の不足を示す場合は、上記単位ブロック当た
り多くのビット数が使われることで上記データ量が上記
目標値よりも多くなっている場合である。また、上記誤
差データが、ビット数の余りを示すデータとなる場合
は、上記単位ブロック当たり少ないビット数で済み、上
記データ量が上記目標値よりも少なくなっている場合で
ある。したがって、上記補正情報出力回路33からは、
この誤差データに応じた上記減算器28からの許容雑音
レベルを、例えば上記等ラウドネス曲線の情報データに
基づいて補正させるための上記補正データが出力され
る。上述のような補正データが、上記許容雑音補正回路
30に伝送されることで、上記減算器28からの許容雑
音レベルが補正される。
Specifically, an error of the total allocated bit number from the target value is detected, and the correction information output circuit 33 outputs correction data for correcting each allocated bit number according to the error data. . Here, the case where the error data indicates a shortage of the number of bits is a case where the number of bits per unit block is used and the amount of data is larger than the target value. Further, when the error data is data indicating the remainder of the number of bits, the number of bits per unit block is small, and the amount of data is smaller than the target value. Therefore, from the correction information output circuit 33,
The correction data for correcting the allowable noise level from the subtractor 28 according to the error data is output based on, for example, the information data of the equal loudness curve. By transmitting the correction data as described above to the allowable noise correction circuit 30, the allowable noise level from the subtractor 28 is corrected.

【0086】以上説明したような高能率符号化装置で
は、メイン情報として量子化されたスペクトルデータが
出力されると共に、サブ情報としてブロックフローティ
ングの状態を示すスケールファクタ、語長を示すワード
レングスが出力される。もちろん、ワードレングス情報
は必須ではなく、ATCデコーダ73においてスケール
ファクタ情報から求めることもできる。
In the high-efficiency coding apparatus described above, the quantized spectrum data is output as the main information, and the scale factor indicating the block floating state and the word length indicating the word length are output as the sub information. To be done. Of course, the word length information is not essential, and can be obtained from the scale factor information in the ATC decoder 73.

【0087】ここで、前記ビット配分算出回路43は、
図10のような構成とすることもできる。この図10を
用いて、以上述べたビット配分手法とは異なる次のよう
な有効なビット配分手法について述べる。
Here, the bit allocation calculation circuit 43
It is also possible to adopt a configuration as shown in FIG. The following effective bit allocation method different from the bit allocation method described above will be described with reference to FIG.

【0088】上記図4における各非線形処理回路40,
41,42の出力は、図10の入力端子301を介し
て、帯域毎のエネルギを算出するエネルギ算出回路30
3に送られる。この帯域毎のエネルギ算出回路303で
は、上記臨界帯域(クリティカルバンド)又は高域では
更にクリティカルバンドを分割した帯域毎のエネルギ
が、例えば当該バンド内での各振幅値の2乗平均の平方
根を計算すること等により求められる。なお、この各バ
ンド毎のエネルギの代わりに、振幅値のピーク値や平均
値等を用いるようにしてもよい。また、上記エネルギ算
出回路303からの出力としては、例えば図7に示した
クリティカルバンド又は高域では更にクリティカルバン
ドを分割した帯域毎のスペクトル成分の総和値であるバ
ークスペクトルSBとしてもよい。
Each non-linear processing circuit 40 in FIG.
The outputs of 41 and 42 are energy calculation circuit 30 for calculating energy for each band via the input terminal 301 of FIG.
Sent to 3. In the energy calculation circuit 303 for each band, the energy for each band obtained by further dividing the critical band (critical band) or the critical band in the high band is calculated, for example, the square root of the root mean square of each amplitude value in the band. It is required by doing. Instead of the energy for each band, the peak value or average value of the amplitude values may be used. Further, the output from the energy calculation circuit 303 may be, for example, the Bark spectrum SB which is the sum of the spectral components of each band obtained by further dividing the critical band shown in FIG. 7 or the critical band in the high range.

【0089】ここで、本実施例において、MDCT係数
を伝送又は記録するのに使えるビット数を例えば100
Kbpsとすると、本実施例ではその100Kbpsを
用いた固定ビット配分パターンを作成する。本実施例に
おいては、上記固定ビット配分のためのビット割り当て
パターンが複数個用意されており、信号の性質によりパ
ターンを選択することが出来るようになっている。本実
施例では、上記100Kbpsに対応する短い時間のビ
ット量を各周波数に分布させた種々のパターンを、固定
ビット配分回路305が持っている。当該固定ビット配
分回路305は、特に、中低域と高域とのビット配分率
を違えたパターンを複数個有している。そして、信号の
大きさが小さいほど、高域への割り当て量が少ないパタ
ーンを選択するようにする。このようにすることで、小
さい信号の時ほど高域の感度が低下するラウドネス効果
を生かせる。なお、このときの信号の大きさとしては、
全帯域の信号の大きさを使用することも出来るが、例え
ばQMF等のフィルタ出力若しくはMDCT処理した出
力を利用することもできる。なお、MDCT係数を伝送
又は記録するのに使えるビット数(使用可能なビット数
の100Kbps)は、例えば使用可能総ビット数出力
回路302で設定される。この使用可能総ビット数は、
外部から入力することも可能である。
In this embodiment, the number of bits that can be used for transmitting or recording MDCT coefficients is 100, for example.
If Kbps is set, a fixed bit allocation pattern using the 100 Kbps is created in this embodiment. In this embodiment, a plurality of bit allocation patterns for the fixed bit allocation are prepared, and the pattern can be selected according to the characteristics of the signal. In the present embodiment, the fixed bit allocation circuit 305 has various patterns in which the bit amount of the short time corresponding to 100 Kbps is distributed to each frequency. The fixed bit allocation circuit 305 has a plurality of patterns in which the bit allocation ratios for the middle low band and the high band are different. Then, as the signal size is smaller, a pattern with a smaller amount of allocation to the high frequency band is selected. By doing so, the loudness effect in which the sensitivity in the high frequency range decreases as the signal becomes smaller can be used. In addition, as the magnitude of the signal at this time,
It is possible to use the signal magnitudes in all bands, but it is also possible to use, for example, a filter output such as QMF or an output obtained by MDCT processing. The number of bits that can be used to transmit or record the MDCT coefficient (the number of usable bits, 100 Kbps) is set by, for example, the total available bit number output circuit 302. The total number of usable bits is
It is also possible to input from the outside.

【0090】また、エネルギ依存のビット配分は、上記
100Kbpsに対応する短い時間のエネルギのdB値
に対してブロック毎に予め定められた係数をかけて重み
付けを行ない、このようにして得られた値に比例するよ
うに行なわれる。ここで、上記重み付け係数を低域に対
して大きな値になるように設定することにより、低域に
より多くのビットが割り当てられる事になる。なお、こ
のエネルギ依存のビット配分は、上記エネルギ算出回路
303の出力が供給されるエネルギ依存ビット配分回路
304が行っている。
The energy-dependent bit allocation is performed by weighting the dB value of energy for a short time corresponding to 100 Kbps by multiplying a predetermined coefficient for each block, and the value thus obtained. Is performed in proportion to. Here, by setting the weighting coefficient so that it has a large value in the low frequency band, more bits are allocated to the low frequency band. The energy-dependent bit allocation is performed by the energy-dependent bit allocation circuit 304 to which the output of the energy calculation circuit 303 is supplied.

【0091】すなわち、このエネルギ依存ビット配分回
路304においては、上記固定ビット配分回路305と
同様に重み付け係数を複数パターン用意し、この複数パ
ターンを入力信号によって切り替えるようにしたり、或
いは、例えば二つの重み付け係数のパターンを入力信号
によって内挿した重み付けパターンを用いてエネルギ依
存のビット配分を計算する。このように、本実施例にお
いては、入力信号によって重み付けの係数を変化させる
ことにより、より聴感に適合したビット割り当てが可能
となり、音質向上を図ることができる。
That is, in the energy-dependent bit allocation circuit 304, a plurality of patterns of weighting coefficients are prepared in the same manner as the fixed bit allocation circuit 305, and the plurality of patterns can be switched by the input signal, or, for example, two weights can be weighted. An energy-dependent bit allocation is calculated using a weighting pattern obtained by interpolating a pattern of coefficients with an input signal. As described above, in the present embodiment, by changing the weighting coefficient according to the input signal, it becomes possible to perform bit allocation more suited to the sense of hearing and improve the sound quality.

【0092】この図10において、上述したような固定
ビット配分パターンへの配分と例えばバークスペクトル
(スペクトルSB)に依存したビット配分との分割率
は、信号スペクトルの滑らかさを表す指標により決定さ
れる。すなわち、本実施例では、上記エネルギ算出回路
303の出力をスペクトル滑らかさ算出回路308に送
り、当該スペクトル滑らかさ算出回路308において、
信号スペクトルデータの隣接値間の差の絶対値の和を信
号スペクトルデータの和で割った値を指標として算出
し、この指標が上記ビット配分の分割率を求めるビット
分割率決定回路309に送られる。
In FIG. 10, the division ratio between the above-mentioned allocation to the fixed bit allocation pattern and the bit allocation depending on, for example, the Bark spectrum (spectrum SB) is determined by the index indicating the smoothness of the signal spectrum. . That is, in the present embodiment, the output of the energy calculation circuit 303 is sent to the spectrum smoothness calculation circuit 308, and the spectrum smoothness calculation circuit 308
A value obtained by dividing the sum of the absolute values of the differences between adjacent values of the signal spectrum data by the sum of the signal spectrum data is calculated as an index, and this index is sent to the bit division rate determination circuit 309 for obtaining the division rate of the bit allocation. .

【0093】上記ビット分割率決定回路309からの分
割率データは、上記固定ビット配分回路305の出力が
供給される乗算器312と、上記エネルギ依存ビット配
分回路304の出力が供給される乗算器311とに送ら
れる。これら乗算器312,311の出力が和算出回路
306に送られる。すなわち、固定ビット配分と帯域毎
の臨界帯域(クリティカルバンド)又は高域では更にク
リティカルバンドを分割した帯域毎のスペクトルのエネ
ルギに依存したビット配分の値の和が、上記和算出回路
306で演算されて、この演算結果が出力端子(各帯域
のビット割り当て量出力端子)307から適応ビット割
当符号化回路18に送られて量子化の際に使用される。
The division ratio data from the bit division ratio determining circuit 309 is supplied to the multiplier 312 to which the output of the fixed bit allocation circuit 305 is supplied and the multiplier 311 to which the output of the energy dependent bit distribution circuit 304 is supplied. Sent to. The outputs of these multipliers 312 and 311 are sent to the sum calculation circuit 306. That is, the sum of the fixed bit allocation and the critical band (critical band) for each band or the bit allocation value depending on the energy of the spectrum for each band obtained by further dividing the critical band in the high band is calculated by the sum calculation circuit 306. Then, the calculation result is sent from the output terminal (bit allocation amount output terminal of each band) 307 to the adaptive bit allocation encoding circuit 18 and used for quantization.

【0094】このときのビット割当の様子を図11,図
13に示す。また、これに対応する量子化雑音の様子を
図12,図14に示す。なお、図11,図12は信号の
スペクトルが割合平坦である場合を示し、図13,図1
4は信号スペクトルが高いトーナリティーを示す場合を
示している。また、図11及び図13の図中QS はエネ
ルギ依存分のビット量を示し、図中QF は固定ビット割
り当て分のビット量を示している。図12及び図14の
図中Lは信号レベルを示し、図中NS はエネルギ依存分
による雑音低下分を、図中NF は固定ビット割り当て分
による雑音レベルを示している。
The state of bit allocation at this time is shown in FIGS. The states of quantization noise corresponding to this are shown in FIGS. Note that FIGS. 11 and 12 show the case where the spectrum of the signal is flat, and FIGS.
4 shows the case where the signal spectrum shows high tonality. Further, Q S in the diagrams of FIGS. 11 and 13 indicates the bit amount for energy dependence, and Q F in the diagrams indicates the bit amount for fixed bit allocation. 12 and 14, L represents a signal level, N S represents a noise reduction amount due to energy dependence, and N F represents a noise level due to fixed bit allocation in the diagrams.

【0095】上記信号のスペクトルが割合平坦である場
合を示している図11及び図12において、通常、多量
の固定ビット割り当て分によるビット割り当ては、全帯
域にわたって大きい信号対雑音比を取るために役立つ。
しかし、この図11,図12のような場合、低域及び高
域では比較的少ないビット割り当てが使用されるように
なる。これは、聴覚的にこの帯域の重要度が小さいため
である。また、このとき、図11の図中QS に示すよう
に、若干のエネルギ依存のビット配分を行なう分(ビッ
ト)によって、信号の大きさが大きい帯域の雑音レベル
が選択的に低下させられる。したがって、信号のスペク
トルが割合平坦である場合には、この選択性も割合広い
帯域に渡って働くことになる。
In FIGS. 11 and 12, which show the case where the spectrum of the above signal is proportionally flat, bit allocation with a large amount of fixed bit allocation is usually useful for obtaining a large signal to noise ratio over the entire band. .
However, in the case of FIGS. 11 and 12, a relatively small number of bit allocations are used in the low band and the high band. This is because this band is acoustically less important. Further, at this time, as shown by Q S in the drawing of FIG. 11, the noise level in the band in which the signal magnitude is large is selectively lowered by the amount (bits) that is slightly energy-dependent bit allocation. Therefore, if the spectrum of the signal is relatively flat, this selectivity also works over a relatively wide band.

【0096】これに対して図12,図14に示すよう
に、信号スペクトルが高いトーナリティを示す場合に
は、図12の図中QS に示すように、多量のエネルギ依
存のビット配分を行なう分(ビット)による量子化雑音
の低下は極めて狭い帯域(図14の図中NS で示す帯
域)の雑音を低減するために使用される。これにより孤
立スペクトル成分を有する入力信号に対する量子化雑音
の特性の向上が達成される。また、同時に若干の固定ビ
ット割り当て分によるビット配分を行なう分(ビット)
により、広い帯域の雑音レベルが非選択的に低下させら
れる。
On the other hand, when the signal spectrum exhibits a high tonality as shown in FIGS. 12 and 14, a large amount of energy-dependent bit allocation is performed as indicated by Q S in the diagram of FIG. Quantization noise reduction by (bits) is used to reduce noise in a very narrow band (band indicated by N S in the drawing of FIG. 14). As a result, the improvement of the characteristics of the quantization noise with respect to the input signal having the isolated spectrum component is achieved. At the same time, a bit is allocated by a bit of fixed bit allocation (bit)
As a result, the noise level in a wide band is reduced non-selectively.

【0097】ブロック選択回路20は、十分に信号対雑
音比の取れないブロックを検出し、非線形処理回路4
0,41,42はそれぞれブロック選択回路20で検出
されたブロックに対し、次のような非線形信号処理を行
って量子化雑音を低減させる。すなわち、MDCT変換
出力である周波数軸上のスペクトルデータは、上記マス
キング量とクリティカルバンド及びブロックフローティ
ングを考慮した各分割帯域毎に、最大スペクトルデータ
に比較して小さいスペクトルデータの大きさをより大き
くするかゼロとする変換処理が行われる。
The block selection circuit 20 detects a block for which a sufficient signal-to-noise ratio cannot be obtained, and the non-linear processing circuit 4
Numerals 0, 41 and 42 perform the following non-linear signal processing on the blocks detected by the block selection circuit 20 to reduce the quantization noise. That is, the spectrum data on the frequency axis, which is the MDCT transform output, has a smaller spectrum data size than the maximum spectrum data for each divided band considering the masking amount, the critical band, and the block floating. Or a conversion process to zero is performed.

【0098】これについて図15を用いて説明する。This will be described with reference to FIG.

【0099】この図15には、あるブロックフローティ
ングの為の周波数ブロックn及びn+1のように、周波
数ブロックni(iは整数)それぞれに5本のスペクト
ルデータ(成分)が存在する場合が示されている。周波
数ブロックnの場合には、各スペクトル成分の大きさが
似通ったものであるため、ブロックフローティン及び各
スペクトル成分に共通の語長で量子化を行ったときに各
スペクトル成分の信号対雑音比が略同一となり、周波数
ブロックn内のスペクトル成分に共通のブロックフロー
ティング情報と語長情報を用いても、効率的に各スペク
トル成分に対して高い信号対雑音比を与えることができ
る。
FIG. 15 shows the case where five spectrum data (components) are present in each frequency block ni (i is an integer) like the frequency blocks n and n + 1 for floating a certain block. There is. In the case of the frequency block n, the size of each spectrum component is similar, so that the signal-to-noise ratio of each spectrum component when quantized with a common word length for the block floatin and each spectrum component. Are substantially the same, and even if the block floating information and the word length information common to the spectrum components in the frequency block n are used, a high signal-to-noise ratio can be efficiently given to each spectrum component.

【0100】これに比して、周波数ブロックn+1の場
合には、各スペクトル成分の大きさが似通っておらず特
に数少ないスペクトル成分が他の多数のスペクトル成分
よりも飛び抜けて大きい場合には、十分な信号対雑音比
が得られるスペクトル成分は少数となる。残りの多数の
スペクトル成分は著しく低い信号対雑音比を有すること
になる。この場合、レベルの大きいスペクトル成分によ
るマスキング効果が期待できそうであるが、このような
孤立したスペクトル成分のマスキング効果は雑音成分に
よるマスキング効果に比して著しく小さいことが知られ
ている。この結果、信号対雑音比の小さいスペクトル成
分は全体的に音質の劣化要因となる。
On the other hand, in the case of the frequency block n + 1, the size of each spectral component is not similar, and in particular, when the few spectral components are by far larger than many other spectral components, it is sufficient. The number of spectral components from which the signal-to-noise ratio can be obtained is small. The remaining large number of spectral components will have a significantly lower signal to noise ratio. In this case, a masking effect by a spectral component having a high level is expected to be expected, but it is known that such a masking effect by an isolated spectral component is significantly smaller than a masking effect by a noise component. As a result, the spectrum component having a small signal-to-noise ratio causes deterioration of the sound quality as a whole.

【0101】本発明では、このような信号対雑音比の大
きく取れないスペクトル成分についてはマスキングの効
果を判定して、もしもマスキングが効き難い場合には、
信号対雑音比の大きく取れないスペクトル成分は量子化
雑音が発生しないようにゼロビット配分を行って、量子
化値がゼロとなるようにするか、若しくはビット配分を
行う場合には信号対雑音比を大きくするようにスペクト
ル成分を大きくなるように変形した後に適応ビット割当
符号化回路18で正規化及び量子化処理を行うようにす
る。
According to the present invention, the effect of masking is judged for such a spectral component in which a large signal-to-noise ratio cannot be obtained, and if masking is difficult,
Spectral components for which a large signal-to-noise ratio cannot be obtained are assigned zero bits so that quantization noise does not occur, and the quantized value becomes zero, or the signal-to-noise ratio is set when bit allocation is performed. The adaptive bit allocation encoding circuit 18 performs normalization and quantization processing after transforming the spectral component so that it becomes larger.

【0102】非線形処理回路40,41,42の動作を
図16を用いて説明する。なお、周波数ブロックn+1
は、ブロック選択回路20によって非線形処理を行うブ
ロックとして選択されているものとする。
The operation of the non-linear processing circuits 40, 41 and 42 will be described with reference to FIG. The frequency block n + 1
Are selected as blocks to be subjected to nonlinear processing by the block selection circuit 20.

【0103】この図16において、ブロックフローティ
ングの為の周波数ブロックn+1のスペクトル成分A,
B,C,D,Eの5本について考える。この場合、スペ
クトル成分Bが最大値を与えるので、正規化のレベルは
このスペクトル成分Bで決定される。
In FIG. 16, the spectral component A of the frequency block n + 1 for the block floating,
Consider B, C, D, and E. In this case, since the spectral component B gives the maximum value, the level of normalization is determined by this spectral component B.

【0104】次に、正規化レベルから概略12dB低い
レベルとして第1の比較レベルを、18dB低いレベル
として第2の比較レベルを設定する。そして、第1の比
較レベルと第2の比較レベルの間のレベルのスペクトル
成分については、信号対雑音比を大きくするためにスペ
クトル成分の大きさを大きくする。上記スペクトル成分
の大きさを大きくする方法としては、正規化レベルから
6dB小さいレベルとする。
Next, the first comparison level is set as a level that is approximately 12 dB lower than the normalization level, and the second comparison level is set as a level that is 18 dB lower. Then, with respect to the spectrum component of the level between the first comparison level and the second comparison level, the size of the spectrum component is increased in order to increase the signal-to-noise ratio. As a method of increasing the magnitude of the spectral component, the level is set to 6 dB lower than the normalization level.

【0105】図16に示すように、このときスペクトル
成分Aは第2の比較レベルよりも小さい値を持つために
更に小さくされてスペクトル成分A’のように量子化出
力がゼロとなるようにされる。スペクトル成分Bは最大
値を持つため、なんらの変更をされない。スペクトル成
分Cは第1の比較レベルと第2の比較レベルの間にある
ため、大きくされてスペクトル成分C’のように変更す
る。以下、スペクトル成分D,Eは第2の比較レベルよ
りも小であるため、小さくされて量子化出力はゼロとな
る。なお、図16には無いが、第1の比較レベルよりも
大きいスペクトル成分については、そのままの値でも充
分に信号対雑音比が得られるため、特に処理は行われな
い。
As shown in FIG. 16, at this time, since the spectral component A has a value smaller than the second comparison level, it is further reduced so that the quantized output becomes zero like the spectral component A '. It Since the spectral component B has the maximum value, it is not changed at all. Since the spectral component C is between the first comparison level and the second comparison level, the spectral component C is increased to change like the spectral component C ′. Hereinafter, since the spectral components D and E are smaller than the second comparison level, they are reduced and the quantized output becomes zero. Although not shown in FIG. 16, no particular processing is performed on the spectrum component larger than the first comparison level, since the signal-to-noise ratio can be sufficiently obtained even with the value as it is.

【0106】このとき別の方法としては、第1及び第2
の比較レベルが、周波数ブロック内最大スペクトル成分
の値により可変であるようにすることもできる。その方
法としては、周波数ブロック内の最大スペクトル成分の
値が大きいほど第1の比較レベルが低下するようにする
か、又は周波数ブロック内の最大スペクトル成分の値が
大きいほど第2の比較レベルが上昇するようにさせる。
更には 周波数ブロック内の最大スペクトル成分の値が
大きいほど、第1の比較レベルが低下し、第2の比較レ
ベルが上昇する様にすることもできる。このように、第
1及び/又は第2の比較レベルを、周波数ブロック内の
最大スペクトル成分の値に応じて可変とすることによ
り、より聴覚に適合した選択が可能となる。また、音質
の変化は大きくなるが、第1の比較レベルより小さい値
のスペクトル成分については、すべてその量子化値がゼ
ロとなるように、各スペクトル成分をより小さい値とす
るようにしてもよい。
At this time, as another method, the first and second
It is also possible to make the comparison level of the variable according to the value of the maximum spectral component in the frequency block. As the method, the first comparison level decreases as the value of the maximum spectral component in the frequency block increases, or the second comparison level increases as the value of the maximum spectral component in the frequency block increases. Let them do it.
Further, the first comparison level may decrease and the second comparison level may increase as the value of the maximum spectral component in the frequency block increases. In this way, by making the first and / or second comparison level variable according to the value of the maximum spectral component in the frequency block, it is possible to make a selection more suitable for hearing. Further, although the change in sound quality becomes large, each spectrum component may be set to a smaller value so that the quantized value becomes zero for all spectrum components having a value smaller than the first comparison level. .

【0107】ブロック選択回路20において、以上のよ
うな非線形処理を周波数ブロック内で行うかどうかを決
める方法としては、ブロック選択回路20を上述したビ
ット配分算出回路43と同様の構成とし、MDCT回路
13,14,15の出力を用いて、仮のビット配分を演
算し、この仮のビット配分により決まる各周波数ブロッ
クの語長に基づいて選択しても良い。具体的には、量子
化雑音レベルが正規化レベルから24dB以下となる周
波数ブロックすなわち語長が4ビット以下となる周波数
ブロックのみを非線形処理の対象とする。
In the block selection circuit 20, as a method of determining whether or not the above-described nonlinear processing is performed in the frequency block, the block selection circuit 20 has the same configuration as that of the bit allocation calculation circuit 43 described above, and the MDCT circuit 13 is used. , 14 and 15 may be used to calculate the provisional bit allocation and selection may be made based on the word length of each frequency block determined by the provisional bit allocation. Specifically, only the frequency block having a quantization noise level of 24 dB or less from the normalization level, that is, the frequency block having a word length of 4 bits or less is subjected to the non-linear processing.

【0108】ブロック選択回路20において、以上のよ
うな非線形処理を周波数ブロック内で行うかどうかを決
める別の方法としては、各周波数ブロックのトーナリテ
ィを用いる方法がある。例えば、スペクトル成分の大き
さが大きい方から少なくとも一つのスペクトル成分の実
効値と残りのスペクトル成分の実効値との比をトーナリ
ティとして求めることにより判定する方法を用いる。
In the block selection circuit 20, another method of determining whether or not the above-mentioned nonlinear processing is performed in the frequency block is a method of using the tonality of each frequency block. For example, a method is used in which the ratio between the effective value of at least one spectral component and the effective value of the remaining spectral components is determined as the tonality from the largest spectral component, and a determination method is used.

【0109】ここで、本実施例では、この判定の際の実
効値の比として、スペクトル成分の大きさが最大となる
スペクトル成分すなわち最大の信号対雑音比を持つスペ
クトル成分の実効値と残りのスペクトル成分の実効値と
の比が10dB以上ある場合であり、かつ、周波数ブロ
ック内の最大スペクトル成分の値があるレベル以上であ
るときに非線形処理を行う周波数ブロックとして選択す
るようにする。本実施例では、ピークレベルから−40
dBを、このレベルとする。これにより、聴覚的にみて
違和感が起こり難い低レベル信号での不必要な処理を避
けることができる。
Here, in the present embodiment, as the ratio of the effective value at the time of this determination, the effective value of the spectral component having the maximum magnitude of the spectral component, that is, the effective value of the spectral component having the maximum signal-to-noise ratio and the remaining When the ratio of the spectrum component to the effective value is 10 dB or more and when the value of the maximum spectrum component in the frequency block is equal to or higher than a certain level, the frequency block is selected as the frequency block to be subjected to the non-linear processing. In this embodiment, −40 from the peak level
dB is at this level. As a result, it is possible to avoid unnecessary processing with a low-level signal, which is less likely to cause a sense of discomfort in terms of hearing.

【0110】また、このような非線形処理を行う周波数
帯域を特定の周波数帯域に限定することもできる。特に
非線形処理を行う帯域を高域に限定することで音質の変
化を最小限に止めることができる。このような非線形処
理が行われた後、実際のビット配分がビット配分算出回
路43で実行される。非線形処理により増大したスペク
トル成分とゼロとされたスペクトル成分を考慮して最終
的なビット配分が決定される。
Further, the frequency band in which such non-linear processing is performed can be limited to a specific frequency band. Especially, by limiting the band in which the non-linear processing is performed to the high frequency band, the change in the sound quality can be minimized. After such non-linear processing is performed, the actual bit allocation is executed by the bit allocation calculation circuit 43. The final bit allocation is determined in consideration of the spectral component increased by the non-linear processing and the spectral component zeroed.

【0111】以上説明したように、本実施例では、ブロ
ック内の最大値を除く信号成分の内、値の大きい成分に
ついては、その値をより大きくするような非線形処理を
行うことにより、信号対雑音比を大きくしてマスキング
効果を大きくすることができる。
As described above, in the present embodiment, among the signal components excluding the maximum value in the block, the component having a large value is subjected to the non-linear processing so as to increase the value, so that the signal pair The masking effect can be increased by increasing the noise ratio.

【0112】また、ブロック内の最大値を除く信号成分
の内、値の小さい成分については、その量子化値がゼロ
になるように、その値をより小さくするような非線形処
理を行うことにより、信号対雑音比の小さい信号から雑
音を発生しないようにすることができる。
Further, among the signal components excluding the maximum value in the block, the component having a small value is subjected to the non-linear processing such that the value is made smaller so that the quantized value becomes zero. It is possible to prevent noise from being generated from a signal having a low signal-to-noise ratio.

【0113】また、仮のビット配分により決まる語長が
ある長さ以下のブロックのみを上述の非線形処理の処理
対象とすることにより、音質劣化を最小に抑えることが
できる。
Further, by making only the blocks whose word lengths determined by the tentative bit allocation are less than or equal to a certain length as the processing targets of the above-mentioned non-linear processing, it is possible to minimize the sound quality deterioration.

【0114】さらに、上述の非線形処理を行うブロック
を、各ブロックのトーナリティに基づいて選択するよう
にしたことにより、必要なブロックのみを処理対象とす
ることができ、音質の変化を最小に抑えることができ
る。また、この時のトーナリティを、ブロック内信号成
分の内の少なくとも最大の信号対雑音比を持つ成分と、
その成分を除いたブロック内信号成分とから得られた
値、例えば、それぞれの成分の実効値の比から求めるこ
とにより、聴覚的にみて、マスキング効果の期待できな
いブロックのみを選択することができる。
Furthermore, by selecting the block for performing the above-mentioned non-linear processing based on the tonality of each block, it is possible to process only the necessary blocks and minimize the change in sound quality. You can In addition, the tonality at this time is defined as the component having at least the maximum signal-to-noise ratio among the signal components in the block,
By obtaining the value obtained from the intra-block signal component excluding the component, for example, the ratio of the effective value of each component, it is possible to select only the block for which the masking effect cannot be expected from the viewpoint of hearing.

【0115】なお、本発明は上記実施例のみに限定され
るものではなく、例えば、ディジタルオーディオ信号の
みならず、ディジタル音声(スピーチ)信号やディジタ
ルビデオ信号等の信号処理装置にも適用可能である。ま
た、上述した最小可聴カーブの合成処理を行わない構成
としてもよい。この場合には、最小可聴カーブ発生回路
32、合成回路27が不要となり、上記引算器24から
の出力は、割算器26で逆コンボリューションされた
後、直ちに減算器28に伝送されることになる。また、
ビット配分手法は多種多様であり、最も簡単には固定の
ビット配分若しくは信号の各帯域エネルギによる簡単な
ビット配分若しくは固定分と可変分を組み合わせたビッ
ト配分など使うことができる。また、光磁気ディスク1
を定常速度よりも速い回転速度で駆動することにより、
ビット圧縮率よりもさらに高速のダビングを行わせても
よい。この場合には、データ転送速度の許す範囲で高速
ダビングを行わせることができる。
The present invention is not limited to the above-mentioned embodiments, and is applicable not only to digital audio signals, but also to signal processing devices such as digital audio (speech) signals and digital video signals. . Further, the above-described minimum audible curve synthesizing process may not be performed. In this case, the minimum audible curve generating circuit 32 and the synthesizing circuit 27 are unnecessary, and the output from the subtractor 24 is inversely convolved by the divider 26 and then immediately transmitted to the subtractor 28. become. Also,
There are various kinds of bit allocation methods, and the simplest is to use fixed bit allocation, simple bit allocation by each band energy of a signal, or bit allocation combining fixed and variable components. In addition, the magneto-optical disk 1
By driving at a rotational speed faster than the steady speed,
The dubbing may be performed at a speed higher than the bit compression rate. In this case, high-speed dubbing can be performed within the range permitted by the data transfer rate.

【0116】次に、本発明のディジタル信号処理方法に
おける高能率符号化に対応する高能率復号化処理を具体
的に実現する高能率復号化装置を図17に示す。
Next, FIG. 17 shows a high-efficiency decoding apparatus for specifically realizing the high-efficiency decoding process corresponding to the high-efficiency encoding in the digital signal processing method of the present invention.

【0117】この図17において、入力端子152,1
54,156には前述した高能率符号化処理が施された
メイン情報である符号化データが供給され、これら符号
化データがそれぞれ対応する復号化回路146,14
7,148に送られる。また、各復号化回路146,1
47,148には、それぞれ対応する端子153,15
5,157を介してサブ情報である情報圧縮パラメータ
も供給される。これら各復号化回路146,147,1
48では、上記情報圧縮パラメータを用いて上記符号化
データの復号化を行って、周波数軸上のスペクトルデー
タを復元する。
In FIG. 17, the input terminals 152, 1
54 and 156 are supplied with the coded data that is the main information that has been subjected to the high-efficiency coding process described above, and the decoding circuits 146 and 14 to which these coded data correspond, respectively.
Sent to 7,148. In addition, each decoding circuit 146, 1
47 and 148 have terminals 153 and 15 respectively corresponding thereto.
Information compression parameters, which are sub-information, are also supplied via 5, 157. Each of these decoding circuits 146, 147, 1
At 48, the encoded data is decoded using the information compression parameter to restore the spectrum data on the frequency axis.

【0118】上記各復号化回路146,147,148
からの出力データは、それぞれ対応するIMDCT回路
143,144,145に送られる。これらIMDCT
回路143,144,145では前述したMDCT処理
に対応する逆変換であるIMDCT処理が行われる。す
なわち、上記復号化回路146,147,148からの
スペクトルデータの内の0〜5.5kHz帯域のスペク
トルデータに対しては、IMDCT回路145におい
て、また5.5〜11kHz帯域のスペクトルデータは
IMDCT回路144において、さらに11〜22kH
z帯域のスペクトルデータはIMDCT回路143にお
いて、それぞれIMDCT処理が施される。
Each of the above decoding circuits 146, 147, 148
The output data from each is sent to the corresponding IMDCT circuits 143, 144, 145. These IMDCT
The circuits 143, 144, and 145 perform IMDCT processing, which is an inverse transformation corresponding to the above-described MDCT processing. That is, for the spectrum data in the 0 to 5.5 kHz band among the spectrum data from the decoding circuits 146, 147 and 148, the IMDCT circuit 145 and the spectrum data in the 5.5 to 11 kHz band are used for the IMDCT circuit. In 144, further 11-22kH
The IMDCT circuit 143 performs IMDCT processing on the spectrum data in the z band.

【0119】さらに、上記IMDCT回路143の出力
は、前記帯域分割フィルタ11と逆の処理を行う帯域合
成フィルタ(IQMF)回路141に送られる。また、
IMDCT回路144、145の出力は、前記帯域分割
フィルタ12と逆の処理を行う帯域合成フィルタ(IQ
MF)回路142に送られる。この帯域合成フィルタ回
路142の出力も、上記帯域合成フィルタ回路141に
送られる。したがって、当該帯域合成フィルタ回路14
1からは、前記各帯域に分割された信号が合成されたデ
ィジタルオーディオ信号が得られることになる。このデ
ィジタルオーディオ信号が出力端子140から出力され
る。
Further, the output of the IMDCT circuit 143 is sent to a band synthesizing filter (IQMF) circuit 141 which performs a process reverse to that of the band dividing filter 11. Also,
The outputs of the IMDCT circuits 144 and 145 are output to a band synthesis filter (IQ) that performs a process reverse to that of the band division filter 12.
MF) circuit 142. The output of the band synthesis filter circuit 142 is also sent to the band synthesis filter circuit 141. Therefore, the band synthesis filter circuit 14
From 1, a digital audio signal obtained by synthesizing the signals divided into the respective bands is obtained. This digital audio signal is output from the output terminal 140.

【0120】[0120]

【発明の効果】すなわち、以上の説明からも明らかなよ
うに、本発明のディジタル信号処理方法及び装置、並び
に記録媒体においては、例えビット配分量の不足のため
に信号対雑音比が十分でない場合でも、ブロックフロー
ティングの為のブロック内の最大値を持つスペクトル成
分からの大きさの差によって、その差が小さい場合には
スペクトル成分の大きさを大きくなるように変更する
か、その差が大きい場合には量子化値をゼロとすること
によって、量子化雑音の音質に与える影響を低減する事
が可能である。したがって、本発明においては、例えば
トランペット音の信号のように、高能率符号化において
フローティングブロック内のトーナリティが大きい音の
信号に対する量子化雑音を低減して音質劣化を低減する
ことが可能となる。
As is apparent from the above description, in the digital signal processing method and apparatus and the recording medium of the present invention, when the signal-to-noise ratio is not sufficient due to the lack of the bit allocation amount. However, if the difference is small due to the difference in size from the spectral component with the maximum value in the block for block floating, change the size of the spectral component to be large, or if the difference is large By setting the quantization value to zero, it is possible to reduce the influence of the quantization noise on the sound quality. Therefore, in the present invention, it is possible to reduce the quantization noise for a signal of a sound having a large tonality in a floating block in high-efficiency coding, such as a signal of a trumpet sound, and reduce sound quality deterioration.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明のディジタル信号処理方法を実現する一
実施例としての圧縮データのディスク記録再生装置の構
成例を示すブロック回路図である。
FIG. 1 is a block circuit diagram showing a configuration example of a compressed data disk recording / reproducing apparatus as an embodiment for realizing a digital signal processing method of the present invention.

【図2】光磁気ディスクとICカードの記録内容を示す
図である。
FIG. 2 is a diagram showing recorded contents of a magneto-optical disk and an IC card.

【図3】本実施例装置の外観の一例を示す概略的な正面
図である。
FIG. 3 is a schematic front view showing an example of the external appearance of the apparatus of this embodiment.

【図4】本実施例のビットレート圧縮符号化に使用可能
な高能率圧縮符号化装置の一具体例を示すブロック回路
図である。
FIG. 4 is a block circuit diagram showing a specific example of a high-efficiency compression encoding apparatus that can be used for bit rate compression encoding according to the present embodiment.

【図5】ビット圧縮の各モードでの処理ブロックのデー
タ構造をあらわす図である。
FIG. 5 is a diagram showing a data structure of a processing block in each mode of bit compression.

【図6】ビット配分演算を行う一具体例のブロック回路
図である。
FIG. 6 is a block circuit diagram of a specific example for performing a bit allocation calculation.

【図7】各臨界帯域及びブロックフローティングを考慮
して分割された帯域のスペクトルを示す図である。
FIG. 7 is a diagram showing spectra of bands divided in consideration of each critical band and block floating.

【図8】マスキングスペクトルを示す図である。FIG. 8 is a diagram showing a masking spectrum.

【図9】最小可聴カーブ、マスキングスペクトルを合成
した図である。
FIG. 9 is a diagram in which a minimum audible curve and a masking spectrum are combined.

【図10】第2のビット配分法を実現する構成のブロッ
ク回路図である。
FIG. 10 is a block circuit diagram of a configuration that realizes a second bit allocation method.

【図11】第2のビット配分法において、信号スペクト
ルが平坦なときのノイズスペクトルを示す図である。
FIG. 11 is a diagram showing a noise spectrum when the signal spectrum is flat in the second bit allocation method.

【図12】第2のビット配分法において、信号スペクト
ルが平坦なときのビット割当を示す図である。
FIG. 12 is a diagram showing bit allocation when the signal spectrum is flat in the second bit allocation method.

【図13】第2のビット配分法において、信号スペクト
ルトのトーナリティが高いときのノイズスペクトルを示
す図である。
FIG. 13 is a diagram showing a noise spectrum when the tonality of a signal spectrum is high in the second bit allocation method.

【図14】第2のビット配分法において、信号スペクト
ルのトーナリティが高いときのビット割当を説明するた
めの図である。
FIG. 14 is a diagram for explaining bit allocation when the tonality of a signal spectrum is high in the second bit allocation method.

【図15】信号のトーナリティの違いにより生ずる信号
対雑音比の違いを説明するための図である。
FIG. 15 is a diagram for explaining a difference in signal-to-noise ratio caused by a difference in signal tonality.

【図16】信号対雑音比の低いブロックに対して適応す
る非線形変換を説明するための図である。
[Fig. 16] Fig. 16 is a diagram for explaining non-linear conversion adapted to a block having a low signal to noise ratio.

【図17】本実施例のビットレート圧縮符号化に使用可
能な高能率圧縮符号化装置の一具体例を示すブロック回
路図である。
FIG. 17 is a block circuit diagram showing a specific example of a high-efficiency compression encoding apparatus that can be used for bit rate compression encoding of this embodiment.

【符号の説明】[Explanation of symbols]

1 光磁気ディスク 2 ICカード 3 追加圧縮伸張ブロック 5 録音再生装置 6 光磁気ディスクスロット 7 ICカードスロット 11、12 帯域分割フイルタ 13、14、15 直交変換(MDCT)回路 18 適応ビット割当符号化回路 20 ブロック選択回路 22 帯域毎のエネルギ検出回路 23 畳込みフイルタ回路 27 合成回路 28 減算器 30 許容雑音補正回路 32 最小可聴カーブ発生回路 33 補正情報出力回路 40,41,42 非線形処理回路 43 ビット配分算出回路 53 光学ヘッド 54 磁気ヘッド 56 サーボ制御回路 57 システムコントローラ 62、83 A/D変換器 63 ATCエンコーダ 64、72、85 メモリ 65 エンコーダ 66 磁気ヘッド駆動回路 71 デコーダ 73 ATCデコーダ 74 D/A変換器 84 剰余ビット除去及び語長ゼロ処理回路 85 RAM 121 ローパスフィルタ 122、123 帯域分割フィルタ 124 高域信号処理回路 125 ダウンサンプリング回路 126、127、128 MDCT回路 129 ビット配分回路 141 142 帯域合成フィルタ 143 144 145 逆直交変換回路 146 147 148 復号化回路 301 帯域毎のエネルギ算出回路 302 スペクトルの滑らかさ算出回路 304 ビット分割率決定回路 305 使用可能な総ビット数 306 エネルギ依存のビット配分回路 307 固定のビット配分回路 308 ビットの和演算回路 1 Magneto-optical disk 2 IC card 3 Additional compression / expansion block 5 Recording / reproducing device 6 Magneto-optical disk slot 7 IC card slot 11, 12 Band division filter 13, 14, 15 Orthogonal transform (MDCT) circuit 18 Adaptive bit allocation encoding circuit 20 Block selection circuit 22 Energy detection circuit for each band 23 Convolution filter circuit 27 Synthesis circuit 28 Subtractor 30 Allowable noise correction circuit 32 Minimum audible curve generation circuit 33 Correction information output circuit 40, 41, 42 Non-linear processing circuit 43 Bit allocation calculation circuit 53 optical head 54 magnetic head 56 servo control circuit 57 system controller 62, 83 A / D converter 63 ATC encoder 64, 72, 85 memory 65 encoder 66 magnetic head drive circuit 71 decoder 73 ATC decoder 74 D / A conversion 84 Residue bit removal and word length zero processing circuit 85 RAM 121 Low pass filter 122, 123 Band division filter 124 High frequency signal processing circuit 125 Down sampling circuit 126, 127, 128 MDCT circuit 129 Bit allocation circuit 141 142 Band synthesis filter 143 144 144 145 Inverse orthogonal transformation circuit 146 147 148 Decoding circuit 301 Energy calculation circuit for each band 302 Spectrum smoothness calculation circuit 304 Bit division rate determination circuit 305 Total number of usable bits 306 Energy-dependent bit allocation circuit 307 Fixed bit allocation Circuit 308-bit sum operation circuit

Claims (39)

【特許請求の範囲】[Claims] 【請求項1】 ディジタル信号を伝送するためのディジ
タル信号処理方法において、 入力ディジタル信号を、それぞれ複数の信号成分を含む
有限時間幅と有限周波数幅を持つ複数のブロック内の信
号成分に変換し、 上記複数のブロックのうちの少なくとも一部のブロック
内の信号成分を非線形処理し、 上記非線形処理された上記信号成分を量子化することを
特徴とするディジタル信号処理方法。
1. A digital signal processing method for transmitting a digital signal, wherein an input digital signal is converted into a signal component in a plurality of blocks each having a finite time width and a finite frequency width, each signal component including a plurality of signal components, A digital signal processing method characterized by nonlinearly processing a signal component in at least a part of the plurality of blocks and quantizing the nonlinearly processed signal component.
【請求項2】 前記信号成分はスペクトル成分であり、 前記非線形処理は前記ブロック内の少なくとも最大値を
与えるスペクトル成分を除くスペクトル成分を大きく処
理することを特徴とする請求項1記載のディジタル信号
処理方法。
2. The digital signal processing according to claim 1, wherein the signal component is a spectral component, and the non-linear processing largely processes the spectral component excluding the spectral component which gives at least the maximum value in the block. Method.
【請求項3】 前記非線形処理は、前記ブロック内の少
なくとも最大の信号対雑音比を持つ信号成分を除く信号
成分を、その信号成分の前記量子化による量子化値がゼ
ロになるように処理することを特徴とする請求項1記載
のディジタル信号処理方法。
3. The non-linear processing processes signal components excluding a signal component having at least a maximum signal-to-noise ratio in the block such that a quantized value by the quantization of the signal component becomes zero. The digital signal processing method according to claim 1, wherein
【請求項4】 前記信号成分はスペクトル成分であり、 当該信号成分を正規化する処理をも行い、 前記非線形処理は、上記正規化における正規化レベルよ
り小さい第1の比較レベルと当該第1の比較レベルより
小さい第2の比較レベルの間の大きさを持つスペクトル
成分に対しては、そのスペクトル成分を大きくするか又
はそのスペクトル成分の前記量子化による量子化値がゼ
ロになるようにし、上記第2の比較レベルより小さい値
のスペクトル成分に対しては、そのスペクトル成分の前
記量子化による量子化値がゼロとなるように処理するこ
とを特徴とする請求項1記載のディジタル信号処理方
法。
4. The signal component is a spectral component, and a process of normalizing the signal component is also performed, and the non-linear process includes a first comparison level smaller than a normalization level in the normalization and the first comparison level. For a spectral component having a magnitude between the second comparison levels smaller than the comparison level, the spectral component is increased or the quantized value by the quantization of the spectral component is set to zero. 2. The digital signal processing method according to claim 1, wherein a spectral component having a value smaller than the second comparison level is processed so that the quantized value by the quantization of the spectral component becomes zero.
【請求項5】 前記第1の比較レベル及び第2の比較レ
ベルは、前記ブロック内の最大のスペクトル成分の値に
応じて可変とすることを特徴とする請求項4記載のディ
ジタル信号処理方法。
5. The digital signal processing method according to claim 4, wherein the first comparison level and the second comparison level are variable according to the value of the maximum spectral component in the block.
【請求項6】 前記ブロック内の最大のスペクトル成分
の値が大きいほど、前記第1の比較レベルが低下し、及
び/又は、上記第2の比較レベルが上昇することを特徴
とする請求項5記載のディジタル信号処理方法。
6. The larger the value of the maximum spectral component in the block, the lower the first comparison level and / or the second comparison level increases. The described digital signal processing method.
【請求項7】 前記非線形処理前の前記信号成分に基づ
いて求められたビット配分によって決定される語長が、
予め設定された語長よりも短いブロックを、上記非線形
処理を行うブロックとして選択することを特徴とする請
求項1記載のディジタル信号処理方法。
7. The word length determined by bit allocation obtained based on the signal component before the non-linear processing is:
2. The digital signal processing method according to claim 1, wherein a block shorter than a preset word length is selected as a block for performing the non-linear processing.
【請求項8】 前記信号成分はスペクトル成分であり、 各ブロック内の最大のスペクトル成分の値に基づいて、
前記非線形処理を行うブロックを選択することを特徴と
する請求項1記載のディジタル信号処理方法。
8. The signal component is a spectral component, and based on the value of the maximum spectral component in each block,
2. The digital signal processing method according to claim 1, wherein a block on which the non-linear processing is performed is selected.
【請求項9】 前記ブロックの最大のスペクトル成分の
値が所定値以上のとき、当該ブロックを前記非線形処理
を行うブロックとして選択することを特徴とする請求項
8記載のディジタル信号処理方法。
9. The digital signal processing method according to claim 8, wherein when the value of the maximum spectral component of the block is equal to or larger than a predetermined value, the block is selected as a block for performing the non-linear processing.
【請求項10】 各ブロックのトーナリティに基づい
て、前記非線形処理を行うブロックを選択することを特
徴とする請求項1記載のディジタル信号処理方法。
10. The digital signal processing method according to claim 1, wherein a block to be subjected to the non-linear processing is selected based on the tonality of each block.
【請求項11】 前記信号成分はスペクトル成分であ
り、 前記トーナリティは、ブロック内のスペクトル成分の内
の少なくとも最大の信号対雑音比を持つ成分でなる第1
の成分と、当該第1の成分を除くブロック内のスペクト
ル成分でなる第2の成分とに基づいて求めることを特徴
とする請求項10記載のディジタル信号処理方法。
11. The signal component is a spectral component, and the tonality is a component having at least a maximum signal-to-noise ratio among spectral components in a block.
11. The digital signal processing method according to claim 10, wherein the determination is performed based on the second component, which is a spectral component in the block excluding the first component.
【請求項12】 前記トーナリティは、前記第1の成分
から得られた第1の値と、前記第2の成分から得られた
第2の値との比であることを特徴とする請求項11記載
のディジタル信号処理方法。
12. The tonality is a ratio of a first value obtained from the first component and a second value obtained from the second component. The described digital signal processing method.
【請求項13】 前記第1の値は前記第1の成分の実効
値であり、前記第2の値は前記第2の成分の実効値であ
ることを特徴とする請求項12記載のディジタル信号処
理方法。
13. The digital signal according to claim 12, wherein the first value is an effective value of the first component, and the second value is an effective value of the second component. Processing method.
【請求項14】 ディジタル信号を伝送するためのディ
ジタル信号処理装置において、 入力ディジタル信号を、それぞれ複数の信号成分を含む
有限時間幅と有限周波数幅を持つ複数のブロック内の信
号成分に変換する変換手段と、 上記複数のブロックのうちの少なくとも一部のブロック
内の信号成分を非線形処理する非線形処理手段と、 上記非線形処理された上記信号成分を量子化する符号化
手段とを有してなることを特徴とするディジタル信号処
理装置。
14. A digital signal processing device for transmitting a digital signal, wherein the input digital signal is converted into a signal component in a plurality of blocks having a finite time width and a finite frequency width, each of which includes a plurality of signal components. Means, a non-linear processing means for performing non-linear processing on a signal component in at least a part of the plurality of blocks, and an encoding means for quantizing the non-linearly processed signal component. A digital signal processing device characterized by:
【請求項15】 前記信号成分はスペクトル成分であ
り、 前記非線形処理手段は前記ブロック内の少なくとも最大
値を与えるスペクトル成分を除くスペクトル成分を大き
くすることを特徴とする請求項14記載のディジタル信
号処理装置。
15. The digital signal processing according to claim 14, wherein the signal component is a spectral component, and the non-linear processing means increases the spectral component excluding the spectral component which gives at least the maximum value in the block. apparatus.
【請求項16】 前記非線形処理手段は、前記ブロック
内の少なくとも最大の信号対雑音比を持つ信号成分を除
く信号成分を、その信号成分の前記符号化手段の量子化
による量子化値がゼロになるようにすることを特徴とす
る請求項14記載のディジタル信号処理装置。
16. The non-linear processing means reduces a signal component excluding a signal component having at least the maximum signal-to-noise ratio in the block so that the quantized value of the signal component by the quantization of the encoding means becomes zero. 15. The digital signal processing device according to claim 14, wherein:
【請求項17】 前記信号成分はスペクトル成分であ
り、 前記符号化手段は上記信号成分を正規化し、 前記非線形処理手段は、上記正規化における正規化レベ
ルより小さい第1の比較レベルと当該第1の比較レベル
より小さい第2の比較レベルの間の大きさを持つスペク
トル成分に対しては、そのスペクトル成分を大きくする
か又はそのスペクトル成分の前記量子化による量子化値
がゼロになるようにし、上記第2の比較レベルより小さ
い値のスペクトル成分に対しては、そのスペクトル成分
の前記量子化による量子化値がゼロとなるようにするこ
とを特徴とする請求項14記載のディジタル信号処理装
置。
17. The signal component is a spectral component, the encoding unit normalizes the signal component, and the non-linear processing unit includes a first comparison level smaller than a normalization level in the normalization and the first comparison level. For a spectral component having a magnitude between the second comparison levels less than the comparison level of, the spectral component is increased or the quantized value of the quantization of the spectral component is zero, 15. The digital signal processing device according to claim 14, wherein for a spectral component having a value smaller than the second comparison level, the quantized value by the quantization of the spectral component becomes zero.
【請求項18】 前記第1の比較レベル及び第2の比較
レベルは、前記ブロック内の最大のスペクトル成分の値
に応じて可変とすることを特徴とする請求項17記載の
ディジタル信号処理装置。
18. The digital signal processing apparatus according to claim 17, wherein the first comparison level and the second comparison level are variable according to the value of the maximum spectral component in the block.
【請求項19】 前記ブロック内の最大のスペクトル成
分の値が大きいほど、前記第1の比較レベルが低下し、
及び/又は、前記第2の比較レベルが上昇することを特
徴とする請求項18記載のディジタル信号処理装置。
19. The larger the value of the maximum spectral component in the block, the lower the first comparison level,
19. The digital signal processing device according to claim 18, wherein the second comparison level is increased.
【請求項20】 前記非線形処理前の前記信号成分に基
づいて求められたビット配分によって決定される語長
が、予め設定された語長よりも短いブロックを、上記非
線形処理を行うブロックとして選択するブロック選択手
段を備えることを特徴とする請求項14記載のディジタ
ル信号処理装置。
20. A block having a word length determined by a bit allocation obtained based on the signal component before the non-linear processing shorter than a preset word length is selected as a block for performing the non-linear processing. 15. The digital signal processing device according to claim 14, further comprising block selecting means.
【請求項21】 前記信号成分はスペクトル成分であ
り、 各ブロック内の最大のスペクトル成分の値に基づいて、
前記非線形処理を行うブロックを選択するブロック選択
手段を備えることを特徴とする請求項14記載のディジ
タル信号処理装置。
21. The signal component is a spectral component, and based on the value of the maximum spectral component in each block,
15. The digital signal processing device according to claim 14, further comprising block selecting means for selecting a block for performing the non-linear processing.
【請求項22】 前記ブロック選択手段は、前記ブロッ
クの最大のスペクトル成分の値が所定値以上のとき、当
該ブロックを前記線形処理を行うブロックとして選択す
ることを特徴とする請求項21記載のディジタル信号処
理装置。
22. The digital device according to claim 21, wherein the block selection means selects the block as a block for performing the linear processing when the value of the maximum spectral component of the block is equal to or larger than a predetermined value. Signal processing device.
【請求項23】 各ブロックのトーナリティに基づい
て、前記非線形処理を行うブロックを選択するブロック
選択手段を備えることを特徴とする請求項14記載のデ
ィジタル信号処理装置。
23. The digital signal processing apparatus according to claim 14, further comprising block selecting means for selecting a block to be subjected to the non-linear processing based on the tonality of each block.
【請求項24】 前記信号成分はスペクトル成分であ
り、 前記トーナリティは、ブロック内のスペクトル成分の内
の少なくと最大の信号対雑音比を持つ成分でなる第1の
成分と、当該第1の成分を除くブロック内のスペクトル
成分でなる第2の成分とに基づいて求めることを特徴と
する請求項23記載のディジタル信号処理装置。
24. The signal component is a spectral component, and the tonality is a first component which is a component having at least a maximum signal-to-noise ratio among spectral components in a block, and the first component. 24. The digital signal processing device according to claim 23, wherein the digital signal processing device is obtained on the basis of a second component which is a spectral component in a block other than
【請求項25】 前記トーナリティは、前記第1の成分
から得られた第1の値と、前記第2の成分から得られた
第2の値との比であることを特徴とする請求項24記載
のディジタル信号処理装置。
25. The tonality is the ratio of a first value obtained from the first component to a second value obtained from the second component. The described digital signal processing device.
【請求項26】 前記第1の値は前記第1の成分の実効
値であり、前記第2の値は前記第2の成分の実効値であ
ることを特徴とする請求項25記載のディジタル信号処
理装置。
26. The digital signal according to claim 25, wherein the first value is an effective value of the first component and the second value is an effective value of the second component. Processing equipment.
【請求項27】 ディジタル信号をそれぞれ有限時間幅
と有限周波数幅を持つ複数のブロック内の信号成分に変
換し、上記複数のブロックのうちの少なくとも一部のブ
ロック内の信号成分を非線形処理し、上記非線形処理さ
れた上記信号成分を量子化して生成した記録用データ
を、記録してなることを特徴とする記録媒体。
27. A digital signal is converted into a signal component in a plurality of blocks each having a finite time width and a finite frequency width, and a signal component in at least a part of the plurality of blocks is nonlinearly processed, A recording medium, wherein recording data generated by quantizing the non-linearly processed signal component is recorded.
【請求項28】 前記信号成分はスペクトル成分であ
り、前記非線形処理は、前記ブロック内の少なくとも最
大値を与えるスペクトル成分を除くスペクトル成分を大
きく処理することを特徴とする請求項27記載の記録媒
体。
28. The recording medium according to claim 27, wherein the signal component is a spectral component, and the non-linear processing largely processes a spectral component excluding a spectral component which gives at least a maximum value in the block. .
【請求項29】 前記非線形処理は、前記ブロック内の
少なくとも最大の信号対雑音比を持つ信号成分を除く信
号成分を、その信号成分の前記量子化による量子化値が
ゼロになるように処理することを特徴とする請求項27
記載の記録媒体。
29. The non-linear process processes a signal component excluding a signal component having at least a maximum signal-to-noise ratio in the block such that a quantized value by the quantization of the signal component becomes zero. 28. The method according to claim 27, wherein
The recording medium described.
【請求項30】 前記信号成分はスペクトル成分であ
り、前記記録用データの生成の際には、上記信号成分を
正規化し、前記非線形処理は、上記正規化における正規
化レベルより小さい第1の比較レベルと当該第1の比較
レベルより小さい第2の比較レベルの間の大きさを持つ
スペクトル成分に対しては、そのスペクトル成分を大き
くするか又はそのスペクトル成分の前記量子化による量
子化値がゼロになるようにし、上記第2の比較レベルよ
り小さい値のスペクトル成分に対しては、そのスペクト
ル成分の前記量子化による量子化値がゼロとなるように
処理することを特徴とする請求項27記載の記録媒体。
30. The signal component is a spectral component, the signal component is normalized when the recording data is generated, and the non-linear processing is performed by a first comparison smaller than a normalization level in the normalization. For a spectral component having a magnitude between a level and a second comparison level smaller than the first comparison level, the spectral component is increased or the quantized value by the quantization of the spectral component is zero. 28. The spectral component having a value smaller than the second comparison level is processed so that the quantized value by the quantization of the spectral component becomes zero. Recording medium.
【請求項31】 前記第1の比較レベル及び第2の比較
レベルは、前記ブロック内の最大のスペクトル成分の値
に応じて可変であることを特徴とする請求項30記載の
記録媒体。
31. The recording medium according to claim 30, wherein the first comparison level and the second comparison level are variable according to the value of the maximum spectral component in the block.
【請求項32】 前記ブロック内の最大のスペクトル成
分の値が大きいほど、前記第1の比較レベルが低下し、
及び/又は、前記第2の比較レベルが上昇することを特
徴とする請求項31記載の記録媒体。
32. The larger the value of the maximum spectral component in the block, the lower the first comparison level,
32. The recording medium according to claim 31, wherein the second comparison level is increased.
【請求項33】 前記記録用データは、前記非線形処理
前の前記信号成分に基づいて求められたビット配分によ
って決定される語長が、予め設定された語長よりも短い
ブロックを、前記非線形処理を行うブロックとして選択
する処理を行って形成されることを特徴とする請求項2
7記載の記録媒体。
33. In the recording data, a block having a word length determined by a bit allocation obtained based on the signal component before the non-linear processing is shorter than a preset word length is subjected to the non-linear processing. 3. The block is formed by performing a process of selecting as a block for performing.
7. The recording medium according to 7.
【請求項34】 前記信号成分はスペクトル成分であ
り、前記記録用データは、各ブロック内の最大のスペク
トル成分の値に基づいて、前記非線形処理を行うブロッ
クを選択する処理を行って形成されることを特徴とする
請求項27記載の記録媒体。
34. The signal component is a spectral component, and the recording data is formed by performing a process of selecting a block to be subjected to the non-linear processing based on a value of a maximum spectral component in each block. 28. The recording medium according to claim 27, wherein:
【請求項35】 前記ブロックの最大のスペクトル成分
の値が、所定値以上のとき、当該ブロックを前記非線形
処理を行うブロックとして選択することを特徴とする請
求項34記載の記録媒体。
35. The recording medium according to claim 34, wherein when the value of the maximum spectral component of the block is equal to or larger than a predetermined value, the block is selected as a block for performing the non-linear processing.
【請求項36】 前記記録用データは、各ブロックのト
ーナリティに基づいて、前記非線形処理を行うブロック
を選択する処理を行って形成されることを特徴とする請
求項35記載の記録媒体。
36. The recording medium according to claim 35, wherein the recording data is formed by performing a process of selecting a block on which the non-linear process is performed based on the tonality of each block.
【請求項37】 前記トーナリティは、ブロック内のス
ペクトル成分の内の少なくとも最大の信号対雑音比を持
つ成分でなる第1の成分と、当該第1の成分を除くブロ
ック内のスペクトル成分でなる第2の成分とに基づいて
求められることを特徴とする請求項36記載の記録媒
体。
37. The tonality comprises a first component which is a component having at least a maximum signal-to-noise ratio among spectral components in a block and a spectral component in the block excluding the first component. The recording medium according to claim 36, wherein the recording medium is obtained based on the second component.
【請求項38】 前記トーナリティは、前記第1の成分
から得られた第1の値と、前記第2の成分から得られた
第2の値との比であることを特徴とする請求項37記載
の記録媒体。
38. The tonality is the ratio of a first value obtained from the first component to a second value obtained from the second component. The recording medium described.
【請求項39】 前記第1の値は前記第1の成分の実効
値であり、前記第2の値は前記第2の成分の実効値であ
ることを特徴とする請求項38記載の記録媒体。
39. The recording medium according to claim 38, wherein the first value is an effective value of the first component, and the second value is an effective value of the second component. .
JP01583895A 1994-02-09 1995-02-02 Digital signal processing method and apparatus Expired - Fee Related JP3186489B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP01583895A JP3186489B2 (en) 1994-02-09 1995-02-02 Digital signal processing method and apparatus

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP6-15117 1994-02-09
JP1511794 1994-02-09
JP01583895A JP3186489B2 (en) 1994-02-09 1995-02-02 Digital signal processing method and apparatus

Publications (2)

Publication Number Publication Date
JPH07273659A true JPH07273659A (en) 1995-10-20
JP3186489B2 JP3186489B2 (en) 2001-07-11

Family

ID=26351215

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01583895A Expired - Fee Related JP3186489B2 (en) 1994-02-09 1995-02-02 Digital signal processing method and apparatus

Country Status (1)

Country Link
JP (1) JP3186489B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6865534B1 (en) 1998-06-15 2005-03-08 Nec Corporation Speech and music signal coder/decoder
JP2010156990A (en) * 2002-06-17 2010-07-15 Dolby Lab Licensing Corp Audio information creation method
JP2022537033A (en) * 2019-06-17 2022-08-23 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン Audio encoders, audio decoders, and associated methods and computer programs with signal-dependent number and precision control

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6865534B1 (en) 1998-06-15 2005-03-08 Nec Corporation Speech and music signal coder/decoder
JP2010156990A (en) * 2002-06-17 2010-07-15 Dolby Lab Licensing Corp Audio information creation method
JP2013214103A (en) * 2002-06-17 2013-10-17 Dolby Lab Licensing Corp Audio information creation method
JP2022537033A (en) * 2019-06-17 2022-08-23 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン Audio encoders, audio decoders, and associated methods and computer programs with signal-dependent number and precision control

Also Published As

Publication number Publication date
JP3186489B2 (en) 2001-07-11

Similar Documents

Publication Publication Date Title
JP3123286B2 (en) Digital signal processing device or method, and recording medium
KR100268623B1 (en) Compressed data recording and/or reproducing apparatus and signal processing method
JP3123290B2 (en) Compressed data recording device and method, compressed data reproducing method, recording medium
EP0601566B1 (en) Digital signal processing apparatus and method
JP3173218B2 (en) Compressed data recording method and apparatus, compressed data reproducing method, and recording medium
JP3186307B2 (en) Compressed data recording apparatus and method
KR100341374B1 (en) Digital signal processing method, digital signal processing device and recording medium
JP3531177B2 (en) Compressed data recording apparatus and method, compressed data reproducing method
JP3200851B2 (en) Digital signal processing device, digital signal processing method, and data recording medium
JP3175446B2 (en) Information compression method and device, compressed information decompression method and device, compressed information recording / transmission device, compressed information reproducing device, compressed information receiving device, and recording medium
JP3185415B2 (en) Apparatus and method for reproducing and recording compressed data
JP4470304B2 (en) Compressed data recording apparatus, recording method, compressed data recording / reproducing apparatus, recording / reproducing method, and recording medium
JP3531178B2 (en) Digital signal processing apparatus and method
JP3186489B2 (en) Digital signal processing method and apparatus
JP3477735B2 (en) Compressed data conversion apparatus and method
JP3552239B2 (en) Compressed data recording apparatus and method, and compressed data reproducing method
JP3277880B2 (en) Data dubbing device
JP3064522B2 (en) Signal processing method and compressed data recording / reproducing device
JP3084815B2 (en) Data recording method and device
JP3334375B2 (en) Digital signal compression method and apparatus
JP3134368B2 (en) Compressed data recording / reproducing device
JPH08125543A (en) Method/device for compressing digital signal and recording medium
JPH0541024A (en) Compression data recording and reproducing device
JPH04304030A (en) Compression data recording and reproducing device
JPH07231259A (en) Method and device for processing digital signal and recording medium

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010410

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090511

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100511

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100511

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110511

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120511

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130511

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees