JPH09120647A - Audio signal-compressing/recording apparatus and audio signal-compressing apparatus and optical recording medium - Google Patents

Audio signal-compressing/recording apparatus and audio signal-compressing apparatus and optical recording medium

Info

Publication number
JPH09120647A
JPH09120647A JP6528196A JP6528196A JPH09120647A JP H09120647 A JPH09120647 A JP H09120647A JP 6528196 A JP6528196 A JP 6528196A JP 6528196 A JP6528196 A JP 6528196A JP H09120647 A JPH09120647 A JP H09120647A
Authority
JP
Japan
Prior art keywords
data
quantized
audio signal
quantizing
amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP6528196A
Other languages
Japanese (ja)
Inventor
Shoji Ueno
昭治 植野
Norihiko Fuchigami
徳彦 渕上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP6528196A priority Critical patent/JPH09120647A/en
Publication of JPH09120647A publication Critical patent/JPH09120647A/en
Priority to US09/655,046 priority patent/US6393203B1/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Optical Recording Or Reproduction (AREA)

Abstract

PROBLEM TO BE SOLVED: To record data to CD-ROMs or DVDs, by formatting compressed data, recording the formatted data to a recording medium in a CD format, and compressing audio signals with a high compression rate. SOLUTION: An A/D converter 1 quantizes audio signals input through an input terminal IN with a quantization bit number of 20 bits or larger and a sampling frequency of 44.1kHz or higher. The data are written in a memory 3 every 2<m> ((m) is a positive integer) per one channel via a signals-processing circuit 2. The 2<2> data are subjected to orthogonal transformation by an orthogonal transform circuit 10 thereby to obtain a frequency spectrum. The spectrum is processed by Huffman coding at a circuit 8 via a filter bank 6 having a plurality of filters 6a-6h and a switch circuit 7. Then, the data are normalized/ quantized at a quantization part 11 and, the quantized/compressed data are written to the memory 3. The data are input to a coding circuit 4, and output and formatted in a CD format at a circuit 5. The data are recorded by a recording head via an output terminal OUT2.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、オーディオ信号を
高能率符号化して光記録媒体に記録するオーディオ信号
圧縮記録装置及びそのためのオーディオ信号圧縮装置、
さらに光記録媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an audio signal compression recording apparatus for high efficiency encoding an audio signal and recording it on an optical recording medium, and an audio signal compression apparatus therefor.
Furthermore, it relates to an optical recording medium.

【0002】[0002]

【従来の技術】CD(コンパクトディスク)は1982
年に登場して十数年が経過し、現在では様々な展開によ
りディジタルストレージメディアとして定着している。
オーディオメディアの用途を考えると、サンプリング周
波数fs =44.1kHz、量子化ビット数=16ビッ
トのこのメディアは完全に成熟期に入っている。また、
この数年のスタジオ製作サイドでは、量子化ビット数の
20ビット化、24ビット化やfs =88.2kHz
化、96kHz化等のハイサンプリング化が進んでお
り、より高音質のマスタを基にしてCDを作成する動き
が出てきている。さらに、DVDと呼ばれる高密度ディ
スクがコンピュータなどのデータ用のデジタルディスク
として利用されようとしている。なお、デジタルディス
クとはCD、CD−ROM、DVDなどオーディオやビ
デオ信号がデジタル信号として記録された光ディスクを
いうものとする。
2. Description of the Related Art CD (Compact Disc) is 1982
Ten years have passed since it first appeared in the year, and now it has become established as a digital storage medium due to various developments.
Considering the use of audio media, this media with sampling frequency fs = 44.1 kHz and quantization bit rate = 16 bits is completely in its maturity stage. Also,
On the studio production side for the past few years, the number of quantization bits has been changed to 20 bits, 24 bits, and fs = 88.2 kHz.
High-sampling such as high-speed, 96-kHz, etc. is progressing, and there is a movement to create a CD based on a master with higher sound quality. Furthermore, a high-density disc called a DVD is about to be used as a digital disc for data in computers and the like. The digital disc means an optical disc such as a CD, a CD-ROM, a DVD in which audio and video signals are recorded as digital signals.

【0003】[0003]

【発明が解決しようとする課題】通常の音楽(オーディ
オ)用のCD(以下CD−DAという)はサンプリング
周波数fs =44.1kHz、量子化ビット数=16ビ
ットで2チャンネルのオーディオ信号を記録することが
できるが、これまでのCD−DAの規格では同一データ
量をCD−ROMのフォーマットで記録することができ
なかった。これは、CD−ROMのフォーマットには同
期信号(SYNC)やアドレスやモードを含むヘッダが
あるため、オーディオ信号を記録するための記録容量が
CD−DAより少ないためである。そのため、音質を向
上させるためにハイサンプリング化を行おうとしても、
現在のCD−DAを作成するためのデータ処理方式で
は、データ量が多くなり、CD−ROMに記録すること
はできなかった。一方、パソコンやその周辺機器の発達
と急速な普及により、CD−ROMドライブを介して、
音楽などを高音質で楽しみたいという要望がある。
An ordinary music (audio) CD (hereinafter referred to as CD-DA) records a two-channel audio signal with a sampling frequency fs = 44.1 kHz and a quantization bit number = 16 bits. However, the same data amount cannot be recorded in the CD-ROM format according to the conventional CD-DA standard. This is because the format of the CD-ROM has a header including a synchronization signal (SYNC), an address, and a mode, so that the recording capacity for recording the audio signal is smaller than that of the CD-DA. Therefore, even if you try to make high sampling to improve the sound quality,
In the current data processing method for creating a CD-DA, the amount of data is large and it is impossible to record the data on a CD-ROM. On the other hand, with the development and rapid spread of personal computers and their peripherals, through the CD-ROM drive,
There is a desire to enjoy music with high sound quality.

【0004】さらに、DVDと呼ばれるデジタルディス
クでは音声がリニアPCMにより圧縮されずに記録され
ているため、よりハイファイ性の高い記録のためにはデ
ータ量を要し、記録時間が短くなる。このディスクのた
めには、直交変換及び/又はハフマン符号によりデータ
処理してデータ量を削減するための圧縮を行って、DV
Dのフォーマットで記録する記録装置並びにかかる方式
で記録された光ディスクが考えられる。
Further, in a digital disc called a DVD, sound is recorded without being compressed by the linear PCM, so that a data amount is required for recording with high hi-finess and the recording time is shortened. For this disc, data is processed by orthogonal transform and / or Huffman code to perform compression for reducing the data amount, and DV is used.
A recording device for recording in the D format and an optical disc recorded by such a method are conceivable.

【0005】したがって、本発明は現在のCD−DA用
のデータ処理に比較して高い圧縮率により、量子化ビッ
ト数20ビット又はそれ以上、標本化周波数44.1k
Hz又はそれ以上の周波数で量子化して得たデータをC
D−ROMに記録することができるオーディオ信号圧縮
記録装置及びオーディオ信号圧縮装置並びに光記録媒体
を提供することを目的とする。
Therefore, according to the present invention, the number of quantization bits is 20 bits or more and the sampling frequency is 44.1 k due to the high compression rate as compared with the present data processing for CD-DA.
The data obtained by quantizing at a frequency of Hz or higher is C
An object of the present invention is to provide an audio signal compression recording device, an audio signal compression device and an optical recording medium which can be recorded in a D-ROM.

【0006】また、本発明は、CDバリエイション(サ
イズ・変調方式)の範囲内でデータフォーマットが一般
に異なると見られているDVDオーディオに記録するこ
とができるオーディオ信号圧縮記録装置及びオーディオ
信号圧縮装置並びに光記録媒体を提供することを目的と
する。
Further, the present invention provides an audio signal compression recording apparatus and an audio signal compression apparatus capable of recording on a DVD audio which is generally considered to have a different data format within the range of CD variation (size / modulation method). It is an object to provide an optical recording medium.

【0007】[0007]

【課題を解決するための手段】本発明は上記目的を達成
するために、オーディオ信号を量子化ビット数20ビッ
ト又はそれ以上、標本化周波数44.1kHz又はそれ
以上の周波数で量子化し、量子化された所定量の量子化
データ毎に直交変換及びハフマン符号を適用してデータ
量を削減・圧縮し、圧縮されたデータをCD−ROMX
A規格のモード2、フォーム2のユーザデータ領域又は
CD−ROM規格のモード2のユーザデータ領域に配す
るようフォーマッティングし、フォーマッティングされ
たデータを記録媒体に記録するようにしている。また、
本発明によれば光記録媒体としての高密度記録の可能な
新規格のDVDが提供され、DVDのユーザデータ領域
に上記の直交変換及びハフマン符号を適用してデータ量
を削減・圧縮し、圧縮されたデータを記録するようにし
ている。
In order to achieve the above object, the present invention quantizes an audio signal with a quantization bit number of 20 bits or more and a sampling frequency of 44.1 kHz or more, and quantizes it. The orthogonal transform and the Huffman code are applied to each of a predetermined amount of quantized data that has been compressed to reduce / compress the data amount, and the compressed data is stored in the CD-ROMX.
Formatting is performed so that the data is formatted in the user data area of mode 2 of the A standard or the form 2 or the user data area of mode 2 of the CD-ROM standard, and the formatted data is recorded on the recording medium. Also,
According to the present invention, a new standard DVD capable of high-density recording as an optical recording medium is provided, and the above orthogonal transform and Huffman code are applied to the user data area of the DVD to reduce / compress the data amount and compress it. The recorded data is recorded.

【0008】すなわち、本発明によれば、オーディオ信
号を量子化ビット数20ビット又はそれ以上、標本化周
波数44.1kHz又はそれ以上の周波数で量子化する
量子化手段と、前記量子化手段で量子化された所定量の
量子化データ毎に直交変換及びハフマン符号を適用して
データ量を圧縮するデータ圧縮手段と、前記データ圧縮
手段で圧縮されたデータをデジタルディスクのユーザデ
ータ領域に配するようフォーマッティングするフォーマ
ッティング手段と、前記フォーマッティング手段でフォ
ーマッティングされたデータをCDフォーマットとして
記録媒体に記録する手段とを、有するオーディオ信号圧
縮記録装置が提供される。
That is, according to the present invention, a quantizing means for quantizing an audio signal at a quantizing bit number of 20 bits or more and a sampling frequency of 44.1 kHz or more, and a quantizing means for quantizing Data compression means for compressing the data amount by applying orthogonal transformation and Huffman coding for each quantized predetermined amount of quantized data, and arranging the data compressed by the data compression means in the user data area of the digital disk There is provided an audio signal compression recording apparatus having formatting means for formatting and means for recording the data formatted by the formatting means in a recording medium as a CD format.

【0009】また、本発明によればオーディオ信号を量
子化ビット数20ビット又はそれ以上、標本化周波数4
4.1kHz又はそれ以上の周波数で量子化する量子化
手段と、前記量子化手段で量子化された所定量の量子化
データ毎に直交変換及びハフマン符号を適用してデータ
量を圧縮するデータ圧縮手段と、前記データ圧縮手段で
圧縮されたデータをCD−ROMXA規格のモード2、
フォーム2のユーザデータ領域に配するようフォーマッ
ティングするフォーマッティング手段と、前記フォーマ
ッティング手段でフォーマッティングされたデータをC
Dフォーマットとして記録媒体に記録する手段とを、有
するオーディオ信号圧縮記録装置が提供される。
Further, according to the present invention, the audio signal is quantized with a quantization bit number of 20 bits or more and a sampling frequency of 4 or more.
4. Quantizing means for quantizing at a frequency of 4.1 kHz or higher, and data compression for compressing the data quantity by applying orthogonal transformation and Huffman code for each predetermined quantity of quantized data quantized by the quantizing means. Means and the data compressed by the data compression means in the mode 2 of the CD-ROMXA standard,
Formatting means for formatting so as to arrange it in the user data area of the form 2, and C for the data formatted by the formatting means.
An audio signal compression recording device is provided which has a unit for recording the D format on a recording medium.

【0010】また、本発明によればオーディオ信号を量
子化ビット数20ビット又はそれ以上、標本化周波数4
4.1kHz又はそれ以上の周波数で量子化する量子化
手段と、前記量子化手段で量子化された所定量の量子化
データ毎に直交変換及びハフマン符号を適用してデータ
量を圧縮するデータ圧縮手段と、前記データ圧縮手段で
圧縮されたデータをDVDのユーザデータ領域に配する
ようフォーマッティングするフォーマッティング手段
と、前記フォーマッティング手段でフォーマッティング
されたデータをCDフォーマットとして記録媒体に記録
する手段とを、有するオーディオ信号圧縮記録装置が提
供される。
According to the present invention, an audio signal is quantized with a quantization bit number of 20 bits or more and a sampling frequency of 4 or more.
4. Quantizing means for quantizing at a frequency of 4.1 kHz or higher, and data compression for compressing the data quantity by applying orthogonal transformation and Huffman code for each predetermined quantity of quantized data quantized by the quantizing means. Means, formatting means for formatting the data compressed by the data compression means so as to be arranged in the user data area of the DVD, and means for recording the data formatted by the formatting means in a recording medium as a CD format. An audio signal compression recording device is provided.

【0011】なお、本発明は上記のようにオーディオ信
号圧縮記録装置として捉えられるが、さらに、再生専用
のディスクの製造のためには、CDフォーマットとして
記録する工程はディスク製造工場側のタスクとなる。し
たがって、本発明はオーディオ信号圧縮装置としても捉
えることができる。
Although the present invention can be regarded as an audio signal compression recording apparatus as described above, in order to manufacture a read-only disk, the step of recording as a CD format is a task of the disk manufacturing factory side. . Therefore, the present invention can be regarded as an audio signal compression device.

【0012】すなわち、オーディオ信号を量子化ビット
数20ビット又はそれ以上、標本化周波数44.1kH
z又はそれ以上の周波数で量子化する量子化手段と、前
記量子化手段で量子化された所定量の量子化データ毎に
直交変換及びハフマン符号を適用してデータ量を圧縮す
るデータ圧縮手段と、前記データ圧縮手段で圧縮された
データをデジタルディスクのユーザデータ領域に配する
ようフォーマッティングするフォーマッティング手段と
を、有するオーディオ信号圧縮装置が提供される。
That is, the audio signal is quantized with 20 or more quantization bits and the sampling frequency is 44.1 kHz.
a quantizing means for quantizing at a frequency of z or higher; and a data compressing means for compressing the data amount by applying orthogonal transformation and Huffman code for each predetermined amount of quantized data quantized by the quantizing means. , And a formatting means for formatting the data compressed by the data compression means so as to be arranged in the user data area of the digital disc.

【0013】また、本発明によればオーディオ信号を量
子化ビット数20ビット又はそれ以上、標本化周波数4
4.1kHz又はそれ以上の周波数で量子化する量子化
手段と、前記量子化手段で量子化された所定量の量子化
データ毎に直交変換及びハフマン符号を適用してデータ
量を圧縮するデータ圧縮手段と、前記データ圧縮手段で
圧縮されたデータをCD−ROMXA規格のモード2、
フォーム2のユーザデータ領域に配するようフォーマッ
ティングするフォーマッティング手段とを、有するオー
ディオ信号圧縮装置が提供される。
Further, according to the present invention, the audio signal is quantized with a quantization bit number of 20 bits or more and a sampling frequency of 4 or more.
4. Quantizing means for quantizing at a frequency of 4.1 kHz or higher, and data compression for compressing the data quantity by applying orthogonal transformation and Huffman code for each predetermined quantity of quantized data quantized by the quantizing means. Means and the data compressed by the data compression means in the mode 2 of the CD-ROMXA standard,
An audio signal compression device is provided which comprises a formatting means for formatting the data in the user data area of the form 2.

【0014】また、本発明によればオーディオ信号を量
子化ビット数20ビット又はそれ以上、標本化周波数4
4.1kHz又はそれ以上の周波数で量子化する量子化
手段と、前記量子化手段で量子化された所定量の量子化
データ毎に直交変換及びハフマン符号を適用してデータ
量を圧縮するデータ圧縮手段と、前記データ圧縮手段で
圧縮されたデータをDVDのユーザデータ領域に配する
ようフォーマッティングするフォーマッティング手段と
を、有するオーディオ信号圧縮装置が提供される。
Further, according to the present invention, the audio signal is quantized with a quantization bit number of 20 bits or more and a sampling frequency of 4 or more.
4. Quantizing means for quantizing at a frequency of 4.1 kHz or higher, and data compression for compressing the data quantity by applying orthogonal transformation and Huffman code for each predetermined quantity of quantized data quantized by the quantizing means. There is provided an audio signal compression apparatus comprising: means and formatting means for formatting the data compressed by the data compression means so as to be arranged in a user data area of a DVD.

【0015】また、本発明によればオーディオ信号を量
子化ビット数20ビット又はそれ以上、標本化周波数4
4.1kHz又はそれ以上の周波数で量子化し、量子化
された所定量の量子化データ毎に直交変換及びハフマン
符号を適用してデータ量を圧縮し、圧縮されたデータを
デジタルディスクのユーザデータ領域に配するようフォ
ーマッティングし、フォーマッティングされたデータを
CDフォーマットとして記録した光記録媒体が提供され
る。
Further, according to the present invention, the audio signal is quantized with a quantization bit number of 20 bits or more and a sampling frequency of 4 or more.
4. Quantize at a frequency of 4.1 kHz or more, apply orthogonal transformation and Huffman code for each quantized predetermined amount of quantized data to compress the data amount, and compress the compressed data to the user data area of the digital disk. There is provided an optical recording medium which is formatted so as to be placed on the optical disc and the formatted data is recorded as a CD format.

【0016】また、本発明によれば、オーディオ信号を
量子化ビット数20ビット又はそれ以上、標本化周波数
44.1kHz又はそれ以上の周波数で量子化し、量子
化された所定量の量子化データ毎に直交変換及びハフマ
ン符号を適用してデータ量を圧縮し、圧縮されたデータ
をCD−ROMXA規格のモード2、フォーム2のユー
ザデータ領域に配するようフォーマッティングし、フォ
ーマッティングされたデータをCDフォーマットとして
記録した光記録媒体が提供される。
According to the present invention, the audio signal is quantized at a quantization bit number of 20 bits or more and a sampling frequency of 44.1 kHz or more, and each quantized predetermined amount of quantized data is quantized. Orthogonal transformation and Huffman code are applied to compress the data amount, and the compressed data is formatted so as to be arranged in the user data area of mode 2 of the CD-ROMXA standard, and the formatted data is converted to the CD format. A recorded optical recording medium is provided.

【0017】また、本発明によればオーディオ信号を量
子化ビット数20ビット又はそれ以上、標本化周波数4
4.1kHz又はそれ以上の周波数で量子化し、量子化
された所定量の量子化データ毎に直交変換及びハフマン
符号を適用してデータ量を圧縮し、圧縮されたデータを
DVDのユーザデータ領域に配するようフォーマッティ
ングし、フォーマッティングされたデータをCDフォー
マットとして記録した光記録媒体が提供される。
According to the present invention, the audio signal is quantized with a quantization bit number of 20 bits or more and a sampling frequency of 4 or more.
Quantize at a frequency of 4.1 kHz or more, apply orthogonal transformation and Huffman code for each quantized predetermined amount of quantized data to compress the data amount, and store the compressed data in the user data area of the DVD. An optical recording medium is provided which is formatted for distribution and the formatted data is recorded as a CD format.

【0018】[0018]

【発明の実施の形態】本発明のオーディオ信号圧縮記録
装置及びオーディオ信号圧縮装置並びに光記録媒体の実
施の形態を好ましい実施例によって説明する。図1は本
発明のオーディオ信号圧縮記録装置の好ましい実施例を
示すブロック図である。入力端子INには例えば音楽信
号などのアナログ信号が供給され、出力端子OUTは図
示省略のCD原盤作成機、すなわちマスタリング装置に
必要に応じてプリマスタリング装置を介して接続され
る。マスタリング装置自体は従来のものと本質的に変ら
ないので、ここでは説明を省略する。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of an audio signal compression recording apparatus, an audio signal compression apparatus and an optical recording medium according to the present invention will be described with reference to preferred embodiments. FIG. 1 is a block diagram showing a preferred embodiment of an audio signal compression recording apparatus of the present invention. An analog signal such as a music signal is supplied to the input terminal IN, and the output terminal OUT is connected to a CD master making machine (not shown), that is, a mastering device via a premastering device as necessary. Since the mastering device itself is essentially the same as the conventional one, its explanation is omitted here.

【0019】図1の装置は入力端子INに接続されたA
/D変換器1と、その出力に接続された信号処理回路2
と、信号処理回路2に接続されたメモリ3と、信号処理
回路2の出力に接続されたCD−ROM符号化回路4
と、CD−ROM符号化回路4の出力に接続されたCD
符号化回路5を有している。CD−ROM符号化回路4
の出力は第1出力端子OUT1に接続され、CD符号化
回路5の出力は第2出力端子OUT2に接続されてい
る。なお、後述するように、CD符号化回路5は不要な
場合がある。
The device of FIG. 1 has an A connected to the input terminal IN.
/ D converter 1 and signal processing circuit 2 connected to its output
A memory 3 connected to the signal processing circuit 2 and a CD-ROM encoding circuit 4 connected to the output of the signal processing circuit 2.
And a CD connected to the output of the CD-ROM encoding circuit 4.
It has an encoding circuit 5. CD-ROM encoding circuit 4
Is connected to the first output terminal OUT1 and the output of the CD encoding circuit 5 is connected to the second output terminal OUT2. As described later, the CD encoding circuit 5 may be unnecessary.

【0020】A/D変換器1はオーディオ信号を量子化
ビット数20ビット又はそれ以上、標本化周波数44.
1kHz又はそれ以上の周波数で量子化する量子化手段
として動作する。標本化周波数は実施例により44.1
kHz(DVDの場合は48kHz)又は88.2kH
z(DVDの場合は96kHz)のいずれかになってい
るが、44.1kHz以上の適当な値とすることができ
る。音楽信号を対象とする場合は、通常左右の2チャン
ネルであるが、サラウンドその他の必要に応じて4チャ
ンネルや6チャンネルなどとすることができる。ここで
は2チャンネルである場合について説明する。A/D変
換器1で得られた量子化データは1チャンネルあたり2
m個(mは正の整数)を単位として、信号処理回路2を介
してメモリ3に書込まれる。その後、信号処理回路2が
この2m個のデータの処理を開始する。
The A / D converter 1 quantizes an audio signal with a quantization bit number of 20 bits or more and a sampling frequency of 44.
It operates as a quantizing means for quantizing at a frequency of 1 kHz or higher. The sampling frequency is 44.1 according to the embodiment.
kHz (48 kHz for DVD) or 88.2 kHz
It is either z (96 kHz in the case of DVD), but it can be set to an appropriate value of 44.1 kHz or more. In the case of targeting a music signal, it is usually two channels on the left and right, but it may be four channels, six channels, or the like depending on the surround and other needs. Here, the case of two channels will be described. The quantized data obtained by the A / D converter 1 is 2 per channel.
It is written in the memory 3 via the signal processing circuit 2 in units of m (m is a positive integer). Then, the signal processing circuit 2 starts processing the 2 m pieces of data.

【0021】図2は信号処理回路2の一例を示すブロッ
ク図である。2m個のデータは直交変換回路10にて直
交変換が施され、周波数スペクトルが得られる。この周
波数スペクトルをバンド分割のための複数のフィルタ6
a,6b,6c...6nを有するフィルタバンク6と
選択手段としてのスイッチ回路7を介して正規化部・量
子化部11に与え、バンド毎にまとめて正規化・量子化
する。ここで正規化レベル(ビット数)を補助情報、ス
ペクトルデータを主情報としてデータフレームとする。
このデータフレームをハフマン符号化回路8に与えて、
ハフマン符号化処理を行い、データ量を削減・圧縮する
とともに、コードブックのインデックスを補助情報、処
理データを主情報として、新たなデータフレームを作成
し、これを順次メモリ3に書き込む。次にメモリ3から
この新たなデータフレームを読み出し、アロケーション
回路9を介して図1のCD−ROM符号化回路4へ出力
する。
FIG. 2 is a block diagram showing an example of the signal processing circuit 2. The 2 m pieces of data are orthogonally transformed by the orthogonal transformation circuit 10 to obtain a frequency spectrum. A plurality of filters 6 for dividing the frequency spectrum into bands
a, 6b, 6c. . . It is given to the normalization section / quantization section 11 via the filter bank 6 having 6n and the switch circuit 7 as the selection means, and is normalized / quantized collectively for each band. Here, the normalization level (the number of bits) is used as auxiliary information, and the spectrum data is used as main information to form a data frame.
This data frame is given to the Huffman coding circuit 8,
A Huffman encoding process is performed to reduce / compress the data amount, a new data frame is created using the codebook index as auxiliary information and the processed data as main information, and this is sequentially written in the memory 3. Next, this new data frame is read from the memory 3 and output to the CD-ROM encoding circuit 4 of FIG. 1 via the allocation circuit 9.

【0022】CD−ROM符号化回路4では、図3によ
って後述する所定のフォーマットとなるように、各セク
タに同期信号(SYNC)やヘッダ、サブヘッダなどを
付加し、各セクタのユーザデータ領域に信号処理回路2
から与えられる圧縮オーディオデータを配して出力す
る。CD−ROM符号化回路4の出力データは第1出力
端子OUT1を介して出力され、例えば磁気テープに記
録されて、再生専用のCDを製造するためのプリマスタ
リング装置やマスタリング装置に供給される。一方、C
D−ROM符号化回路4の出力データは、書込み可能
な、いわゆるライトワンスタイプのCDの場合は、CD
符号化回路5に与えられ、CDフォーマット化され、第
2出力端子OUT2を介して図示省略の記録ヘッドによ
り記録される。
In the CD-ROM encoding circuit 4, a synchronization signal (SYNC), a header, a subheader, etc. are added to each sector so that a predetermined format described later with reference to FIG. Processing circuit 2
The compressed audio data given by is arranged and output. The output data of the CD-ROM encoding circuit 4 is output via the first output terminal OUT1, recorded on a magnetic tape, for example, and supplied to a premastering device or a mastering device for manufacturing a read-only CD. On the other hand, C
The output data of the D-ROM encoding circuit 4 is a CD in the case of a writable, so-called write-once type CD.
The data is supplied to the encoding circuit 5, is CD-formatted, and is recorded by a recording head (not shown) via the second output terminal OUT2.

【0023】次に図3と共に本発明のいくつかの態様に
ついて説明する。図3はCDの種々のフォーマットをセ
クタ単位で示したもので、第1段には通常の音楽用CD
である、CD−DAを示し、以下第2段から第6段まで
各種CD−ROMを示している。本発明の実施例として
は次の6つの態様がある。なお、DVDを示す図17に
ついては後述する。
Next, some aspects of the present invention will be described with reference to FIG. FIG. 3 shows various formats of the CD in sector units. The first stage is a normal music CD.
In the following, various CD-ROMs are shown from the second stage to the sixth stage. There are the following six modes as examples of the present invention. Note that FIG. 17 showing a DVD will be described later.

【0024】[0024]

【表1】 (1) CD−ROM XA モード2、フォーム2 (図3の6段目) 標本化周波数 :44.1kHz 量子化ビット数:20ビット (2) CD−ROM XA モード2、フォーム2 (図3の6段目) 標本化周波数 :88.2kHz 量子化ビット数:20ビット (3) CD−ROM モード2 (図3の4段目) 標本化周波数 :44.1kHz 量子化ビット数:20ビット (4) CD−ROM モード2 (図3の4段目) 標本化周波数 :88.2kHz 量子化ビット数:20ビット (5) DVD (図17) 標本化周波数 :48kHz 量子化ビット数:20ビット〜24ビット (6) DVD (図17) 標本化周波数 :96kHz 量子化ビット数:20ビット〜24ビット [Table 1] (1) CD-ROM XA mode 2, form 2 (6th stage in FIG. 3) Sampling frequency: 44.1 kHz Quantization bit number: 20 bits (2) CD-ROM XA mode 2, form 2 (6th stage of FIG. 3) Sampling frequency: 88.2 kHz Quantization bit number: 20 bits (3) CD-ROM mode 2 (4th stage of FIG. 3) Sampling frequency: 44.1 kHz Quantization bit number: 20 bits (4) CD-ROM mode 2 (4th stage of FIG. 3) Sampling frequency: 88.2 kHz Quantization bit number: 20 bits (5) DVD (FIG. 17) Sampling frequency: 48 kHz Quantization bit number: 20 to 24 bits (6) DVD (Fig. 17) Sampling frequency: 96 kHz Quantization bit number: 20 to 24 bits

【0025】CD−ROM XA モード2、フォーム
2ではユーザデータは2324バイトである。また、C
D−ROM モード2では、ユーザデータは2336バ
イトである。これらの規格では、比較的ユーザデータの
データ量、すなわちバイト数が多いので、1枚のディス
クに記録収納可能なデータ量が多く、有利である。
In the CD-ROM XA mode 2 and form 2, the user data is 2324 bytes. Also, C
In D-ROM mode 2, user data is 2336 bytes. According to these standards, since the data amount of user data, that is, the number of bytes is relatively large, a large amount of data can be recorded and stored in one disk, which is advantageous.

【0026】また、上記(1)、(2)のCD−ROM
XA モード2、フォーム2を用いた場合は、独自の
割当てのサブヘッダを規定することができる。サブヘッ
ダの内容を表2に示す。
The CD-ROM of the above (1) and (2)
When XA mode 2 and form 2 are used, it is possible to specify a subheader of unique allocation. Table 2 shows the contents of the subheader.

【0027】[0027]

【表2】 [Table 2]

【0028】上記サブヘッダ中、サブモードバイトのビ
ット5〜2をこの符号化IDに用いることで、サブヘッ
ダを見ながら、このフォーマットのデコードを行うこと
ができる。以下の表3と表4に、サブヘッダ中のサブモ
ードと、コーディング情報の内容を示す。サブヘッダに
はフォーマット時の条件を記録することができるが、そ
の手法として2つの方法がある。その一つはそのセクタ
のフォーマット条件を入れる方法であり、他の方法はフ
ォーマット条件を複数のセクタに分けて記録する方法で
あり、この場合これら複数のセクタの情報を集合して解
読可能となる。
By using bits 5 to 2 of the submode byte in the subheader as the coded ID, it is possible to decode this format while watching the subheader. Tables 3 and 4 below show the submode in the subheader and the content of the coding information. The conditions at the time of formatting can be recorded in the subheader, and there are two methods for that. One of them is a method of inserting the format condition of the sector, and the other is a method of recording the format condition by dividing it into a plurality of sectors. In this case, the information of the plurality of sectors can be collected and decoded. .

【0029】[0029]

【表3】 [Table 3]

【0030】[0030]

【表4】 [Table 4]

【0031】上記4つの態様中、標本化周波数が88.
2kHzである、(2)と(4)では、2ブロックで1
フレームを構成することとなる。したがって、44.1
kHzの場合と比較して、記録できる時間は半分とな
る。
In the above four modes, the sampling frequency is 88.
2 kHz, (2) and (4), 1 in 2 blocks
It constitutes a frame. Therefore, 44.1
The time that can be recorded is halved compared to the case of kHz.

【0032】上記実施例は、信号処理回路2が可逆圧縮
方式である場合について説明したが、本発明者らが先に
開発したいわゆる準可逆符号化方式のものを適用するこ
とにより、更にデータ量を圧縮することができる。以下
にこの方式について説明する。
In the above embodiment, the case where the signal processing circuit 2 is a reversible compression system has been described. However, by applying the so-called quasi-reversible coding system developed by the present inventors, the data amount can be further increased. Can be compressed. This method will be described below.

【0033】図4は図1の信号処理回路に本発明者らが
開発した音声の準可逆符号化装置を適用する場合の例を
示すブロック図、図5は図4における聴覚心理分析と符
号量調整処理を説明するためのフローチャート、図6は
図4の準可逆符号化装置と従来例における符号量不足時
の再量子化ノイズレベルの比較例を示す説明図、図7は
図4の準可逆符号化装置と従来例における聴感上の音質
比較例を示す説明図である。
FIG. 4 is a block diagram showing an example in which the quasi-reversible coding apparatus for speech developed by the present inventors is applied to the signal processing circuit of FIG. 1, and FIG. 5 is a psychoacoustic analysis and code amount in FIG. FIG. 6 is a flow chart for explaining the adjustment process, FIG. 6 is an explanatory view showing a comparative example of the requantization noise level when the code amount is insufficient in the semi-reversible coding apparatus of FIG. 4 and the conventional example, and FIG. It is explanatory drawing which shows the audio quality comparison example in an encoding device and a prior art example.

【0034】図4に示す装置では先ず、従来の周波数領
域処理のエンコーダと同様に、バッファ21が後段の窓
掛け・直交変換部22が直交変換する際に必要なフレー
ム分のPCM信号をバッファリングし、窓掛け・直交変
換部22はこのフレームデータに窓掛け(一般にはハニ
ング窓等の窓掛け)し、MDCT(変形離散コサイン変
換)等により直交変換し、この直交変換係数を複数のバ
ンドに分割する。正規化部23はこのバンド毎の正規化
係数(スケールファクタ)を決定し、バンド内の直交変
換係数を正規化する。量子化・符号化部24はこの正規
化後の係数を可逆に必要な精度で量子化し、必要であれ
ばエントロピー符号化する。
In the apparatus shown in FIG. 4, first, similarly to the conventional frequency domain processing encoder, the buffer 21 buffers the PCM signals for the frames necessary for the windowing / orthogonal transformation unit 22 in the subsequent stage to perform orthogonal transformation. Then, the windowing / orthogonal transformation unit 22 performs windowing (generally, windowing such as Hanning window) on this frame data, performs orthogonal transformation by MDCT (Modified Discrete Cosine Transform) or the like, and outputs the orthogonal transformation coefficients to a plurality of bands. To divide. The normalization unit 23 determines the normalization coefficient (scale factor) for each band and normalizes the orthogonal transform coefficient within the band. The quantizing / encoding unit 24 quantizes the coefficient after the normalization with a precision necessary for reversibility, and performs entropy coding if necessary.

【0035】そして、図4の例では、聴覚心理分析部2
5と符号量制御部26及び量子化・符号化部24が図5
に示すような処理を行う。図5において、先ず、量子化
・符号化部24により正規化された係数の1回目の量子
化ビット数(Bit[i])を決定し、符号量を見積もって総
符号量(Total bit )を算出する(ステップS1)。次
いでそのフレームの使用可能符号量(Avail bit )を確
認又は算出し(ステップS2)、次いで総符号量(Tota
l bit )と使用可能符号量(Avail bit )を比較するこ
とにより符号量が不足するか否かをチェックする(ステ
ップS3)。
In the example of FIG. 4, the psychoacoustic analysis unit 2
5, the code amount control unit 26, and the quantization / encoding unit 24 are shown in FIG.
The following processing is performed. In FIG. 5, first, the first quantization bit number (Bit [i]) of the coefficient normalized by the quantization / encoding unit 24 is determined, the code amount is estimated, and the total code amount (Total bit) is calculated. Calculate (step S1). Next, the usable code amount (Avail bit) of the frame is confirmed or calculated (step S2), and then the total code amount (Tota) is calculated.
It is checked whether or not the code amount is insufficient by comparing l bit) with the usable code amount (Avail bit) (step S3).

【0036】そして、符号量が不足する場合(Total bi
t >Avail bit )には、先ず、聴覚心理モデルのマスキ
ング効果と最小可聴限特性を考慮してバンドパワーp
[i] (=正規化値2 =scale[i]2 )からマスキングカー
ブm[i] を算出する(ステップS4)。この場合、マス
キングカーブm[i] は基準カーブcurve[i]とバンドパワ
ーp[i] を畳み込み演算することにより得られる。
When the code amount is insufficient (Total bi
t> Avail bit), first, the band power p considering the masking effect of the psychoacoustic model and the minimum audible limit characteristic.
A masking curve m [i] is calculated from [i] (= normalized value 2 = scale [i] 2 ) (step S4). In this case, the masking curve m [i] is obtained by convolving the reference curve curve [i] and the band power p [i].

【0037】次いで最小可聴限とマスキングカーブから
各バンドの標準ノイズレベルN[i]を算出し(ステップ
S5)、次いで標準ノイズレベルN[i] が高いバンドか
ら1ビットずつビット削減を行うことにより不足符号量
を各バンドに振り分ける。但し、バンドiにおいて1ビ
ット削減を行う毎にN[i]から6.0を減算し、ビット
削減が標準ノイズレベルN[i] と相似形になるようにす
る(ステップS6)。そして、このように各バンド毎に
最終的に決定された量子化ビット数で、量子化・符号化
部24で再量子化及び符号化する(ステップS7)。
Then, the standard noise level N [i] of each band is calculated from the minimum audibility limit and the masking curve (step S5), and then the bit is reduced by one bit from the band having the highest standard noise level N [i]. The insufficient code amount is distributed to each band. However, 6.0 is subtracted from N [i] every time one bit is reduced in band i so that the bit reduction is similar to the standard noise level N [i] (step S6). Then, the quantization / encoding unit 24 requantizes and encodes with the number of quantization bits finally determined for each band in this way (step S7).

【0038】また、ステップS3において符号量が不足
しない場合には、余剰ビットを各バンドに割り当て又は
パディングし(ステップS8)、その量子化ビット数
で、量子化・符号化部24で再量子化及び符号化する
(ステップS7)。フォーマット出力部26は一般に、
正規化係数(場合によっては量子化ビット数)と、符号
量制御部26の符号量制御情報と、それにヘッダ等の補
助情報を付加してフォーマット化(ビットストリーム
化)して伝送する。
If the code amount is not insufficient in step S3, surplus bits are assigned or padded to each band (step S8), and requantization is performed by the quantization / encoding unit 24 with the number of quantization bits. And encoding (step S7). The format output section 26 generally
The normalization coefficient (the number of quantization bits in some cases), the code amount control information of the code amount control unit 26, and auxiliary information such as a header are added to the normalization coefficient to format (bit stream) and transmit.

【0039】図6は図4の例と、従来のエンコーダにお
いて符号量不足時の再量子化ノイズレベルの設定例を比
較した場合を示している。上記例によれば、再量子化ノ
イズ聴覚心理モデルに応じてシェーピングされており、
ノイズ量が同じであっても聴感上ではノイズレベルが下
がった場合と同等の効果を得ることができる。したがっ
て、聴感上の音質劣化を最小限にして準可逆的に符号化
することができる。
FIG. 6 shows a case where the example of FIG. 4 is compared with an example of setting the requantization noise level when the code amount is insufficient in the conventional encoder. According to the above example, the requantization noise is shaped according to the psychoacoustic model,
Even if the noise amount is the same, the same effect as when the noise level is lowered can be obtained in terms of hearing. Therefore, it is possible to perform quasi-reversible encoding while minimizing the sound quality deterioration in hearing.

【0040】図7は従来例で非可逆符号化を行った場合
と、上記例の場合の音質の比較例を示し、図7(a)は
フレームの一部が非可逆となる場合、図7(b)はフレ
ームの大部分が非可逆となる場合を示す。図のように非
可逆となる区間において太線で示す本発明の方が細線で
示す従来例より音質を改善することができ、したがっ
て、符号化全体として安定した音質を得ることができ
る。また、本発明によれば、非可逆符号化を行った場合
の音質を十分確保することができるので、各フレームの
使用可能符号量が一定の「固定伝送レート」で伝送する
ことができ、したがって、非可逆フレームが大幅に増加
しても音質上の問題は発生しない。この結果、オーサリ
ングや再生装置側の符号量制御に関わる処理を大幅に簡
略化することができる。
FIG. 7 shows a comparative example of the sound quality in the case of lossy encoding in the conventional example and in the case of the above example. FIG. 7A shows the case where a part of the frame is lossy. (B) shows a case where most of the frame is irreversible. In the irreversible section as shown in the figure, the present invention shown by the thick line can improve the sound quality as compared with the conventional example shown by the thin line, and therefore stable sound quality can be obtained as a whole encoding. Further, according to the present invention, it is possible to sufficiently secure the sound quality when the lossy encoding is performed, and therefore, the usable code amount of each frame can be transmitted at a fixed “fixed transmission rate”. , Even if the number of irreversible frames is greatly increased, the sound quality problem does not occur. As a result, the processing relating to the authoring and the code amount control on the reproducing device side can be greatly simplified.

【0041】次に、信号処理回路の他の例について図8
乃至図14に沿って説明する。図8は図4同様、本発明
者らが開発した音声の準可逆符号化装置の他の例を示す
ブロック図、図9は図8における符号量補正値を算出す
る処理を説明するためのフローチャート、図10は符号
量偏差と符号量補正値の関係を示すグラフ、図11〜図
13は符号量補正前と補正後の符号量偏差ヒストグラム
を示す説明図、図14は図8における聴覚心理分析と符
号量調整処理を説明するためのフローチャート、図15
は図8の準可逆符号化装置と従来例における符号量過剰
時の再量子化ノイズレベルの比較例を示す説明図、図1
6は図8の準可逆符号化装置と従来例における聴感上の
音質比較例を示す説明図である。
Next, another example of the signal processing circuit is shown in FIG.
It will be described with reference to FIG. Similar to FIG. 4, FIG. 8 is a block diagram showing another example of the quasi-lossless coding apparatus for speech developed by the present inventors, and FIG. 9 is a flowchart for explaining the process for calculating the code amount correction value in FIG. 10 is a graph showing the relationship between the code amount deviation and the code amount correction value, FIGS. 11 to 13 are explanatory diagrams showing the code amount deviation histograms before and after the code amount correction, and FIG. 14 is a psychoacoustic analysis in FIG. 15 is a flowchart for explaining the code amount adjustment processing and FIG.
1 is an explanatory view showing a comparative example of the requantization noise level when the code amount is excessive in the semi-reversible encoding apparatus of FIG.
FIG. 6 is an explanatory diagram showing an audio quality comparison example between the semi-reversible encoding device of FIG. 8 and a conventional example.

【0042】図8に示す装置では、先ず、従来の周波数
領域処理のエンコーダと同様に、バッファ21が後段の
窓掛け・直交変換部22が直交変換する際に必要なフレ
ーム分のPCM信号をバッファリングし、窓掛け・直交
変換部22はこのフレームデータに窓掛け(一般にはハ
ニング窓等の窓掛け)し、MDCT(変形離散コサイン
変換)等により直交変換し、この直交変換係数を複数の
バンドに分割する。正規化部23はこのバンド毎の正規
化係数(スケールファクタ)を決定し、バンド内の直交
変換係数を正規化する。量子化・符号化部24はこの正
規化後の係数を可逆に必要な精度で量子化し、この場合
にも必要であればエントロピー符号化する。但し、図1
1に示す時間領域処理の場合よりエントロピ符号化の効
果は一般に少ない。
In the apparatus shown in FIG. 8, first, similarly to the conventional frequency domain processing encoder, the buffer 21 buffers the PCM signals for the frames necessary for the windowing / orthogonal transformation unit 22 in the subsequent stage to perform orthogonal transformation. Then, the windowing / orthogonal transformation unit 22 performs windowing (generally, windowing such as Hanning window) on this frame data, performs orthogonal transformation by MDCT (Modified Discrete Cosine Transform), etc. Split into. The normalization unit 23 determines the normalization coefficient (scale factor) for each band and normalizes the orthogonal transform coefficient within the band. The quantizing / encoding unit 24 quantizes the coefficient after the normalization with an accuracy required for reversibility, and also in this case, performs entropy encoding if necessary. However, FIG.
The effect of entropy coding is generally less than that of the time domain processing shown in FIG.

【0043】そして、この例では、聴覚心理分析部25
と符号量制御部26及び量子化・符号化部24が区間毎
の符号量補正値Adj に基づいて以下のような処理を行
う。先ず、本発明では、オーディオメディアを制作する
場合に、1曲(例えば4〜6分)又は全曲(例えば40
〜74分)等の長時間平均で符号量が目標値になるよう
に制御する方法であり、エンコード処理は2パスで行
う。具体的には、 (a)可逆符号化を仮定した1回目のエンコード処理を
行う。但し、各区間の使用符号量が得られればよく、実
際に量子化・符号化を行う必要はない。 (b)図9に示すように各区間の使用符号量と目標符号
量の差から各区間の符号量補正値Adj を算出する。 (c)2回目のエンコード処理を行う。この場合、可逆
符号化を仮定したビット割り当てを補正符号量と聴覚心
理モデルにより変更して量子化・符号化を行い、また、
ビット割り当て変更の情報を補助情報としてデコーダに
伝送する。
In this example, the psychoacoustic analysis unit 25
The code amount control unit 26 and the quantization / encoding unit 24 perform the following processing based on the code amount correction value Adj for each section. First, in the present invention, when producing an audio medium, one song (for example, 4 to 6 minutes) or all songs (for example, 40 songs).
(~ 74 minutes) and the like so that the code amount is controlled to a target value on a long-term average, and the encoding process is performed in two passes. Specifically, (a) the first encoding process is performed assuming lossless encoding. However, it is only necessary to obtain the used code amount of each section, and it is not necessary to actually perform quantization / encoding. (B) As shown in FIG. 9, the code amount correction value Adj of each section is calculated from the difference between the used code amount of each section and the target code amount. (C) Perform the second encoding process. In this case, bit allocation assuming reversible coding is changed by the correction code amount and the psychoacoustic model to perform quantization / coding, and
The bit allocation change information is transmitted to the decoder as auxiliary information.

【0044】次に、図9を参照して上記(b)における
符号量補正値Adj を算出する処理について説明する。 先ず、対象区間の使用符号量を入力して平均符号量T
mを算出し、目標符号量Tdとの差を評価する(ステッ
プS11、S12)。 次いで、符号量過剰な場合(平均符号量Tm>目標符
号量Td)には、各区間の使用符号量と目標符号量との
偏差Delta[bit](但し、過剰な場合に正)を算出し、こ
の偏差Delta[bit]を適当なステップ幅step[bit] で量子
化し、ヒストグラムを作成する(ステップS12→S1
3)。 次いで、ヒストグラムの偏差が負の領域の偏差総量S
mと、正の領域の偏差総量Spを以下のように算出する
(ステップS14)。
Next, the process of calculating the code amount correction value Adj in (b) above will be described with reference to FIG. First, the average code amount T is input by inputting the used code amount of the target section.
m is calculated, and the difference from the target code amount Td is evaluated (steps S11 and S12). Next, when the code amount is excessive (average code amount Tm> target code amount Td), the deviation Delta [bit] between the used code amount and the target code amount of each section is calculated (however, positive when excess). , The deviation Delta [bit] is quantized with an appropriate step width step [bit] to create a histogram (steps S12 → S1).
3). Next, the total deviation S in the area where the deviation of the histogram is negative
m and the total deviation Sp of the positive region are calculated as follows (step S14).

【0045】[0045]

【数1】 (Equation 1)

【0046】次いで、負の領域の偏差総量Smの比率
Sm/(Sm+Sp)が予め定めた値Bound (例えば
0.33等)より大きい場合には、以下のように各区間
毎の符号量補正値Adj を求める(ステップS15→S1
6)。
Next, when the ratio Sm / (Sm + Sp) of the total deviation Sm in the negative region is larger than a predetermined value Bound (eg 0.33), the code amount correction value for each section is as follows. Find Adj (step S15 → S1)
6).

【0047】[0047]

【数2】 (Equation 2)

【0048】’他方、比率Sm/(Sm+Sp)が値
Bound より小さい場合には、比率Sm/(Sm+Sp)
が値Bound より大きくなるようにヒストグラムのオフセ
ット値Off を決定し(ステップS15→S17)、以下
のように各区間毎の符号量補正値Adj を求める(ステッ
プS18)。
On the other hand, the ratio Sm / (Sm + Sp) is a value
If smaller than Bound, the ratio Sm / (Sm + Sp)
Is determined to be larger than the value Bound (step S15 → S17), and the code amount correction value Adj for each section is calculated as follows (step S18).

【0049】[0049]

【数3】 ここで、この手法を用いる理由は、ヒストグラムが極端
に「過剰」側に偏っている場合には、ある程度全フレー
ムにオフセットを掛けて補正する必要があるからであ
る。
(Equation 3) Here, the reason for using this method is that when the histogram is extremely biased toward the "excessive" side, it is necessary to apply an offset to all frames to correct it.

【0050】’また、ステップS12において平均符
号量Tm>目標符号量Tdでない場合には、平均符号量
Tmと目標符号量Tdに基づいて以下のように各区間で
一定の符号量補正値Adj を求める(ステップS19)。 Adj =(Td−Tm) [bit]
If the average code amount Tm> the target code amount Td is not satisfied in step S12, a constant code amount correction value Adj in each section is set as follows based on the average code amount Tm and the target code amount Td. Obtained (step S19). Adj = (Td-Tm) [bit]

【0051】図10は符号量偏差Delta[bit]と符号量補
正値Adj の関係を示し、偏差Delta[bit]が正であって大
きい程、補正値Adj も増大する。また、図11〜図13
は符号量補正前(実線)と補正後(破線)のヒストグラ
ムを示し、横軸がサンプル当たりの偏差(Delta /区間
当たりのサンプル数)を、また、縦軸が度数を示す。詳
しくは図11は上記のように補正値Adj を求めた場
合、また、図12、図13はそれぞれ上記 ’、’
のように補正値Adj を求めた場合を示している。
FIG. 10 shows the relationship between the code amount deviation Delta [bit] and the code amount correction value Adj. The correction value Adj increases as the deviation Delta [bit] is positive and larger. Also, FIGS.
Shows histograms before correction (solid line) and after correction (broken line), the horizontal axis shows deviation per sample (Delta / number of samples per section), and the vertical axis shows frequency. Specifically, FIG. 11 shows the case where the correction value Adj is obtained as described above, and FIG. 12 and FIG.
The case where the correction value Adj is obtained is shown as.

【0052】次に、図14を参照して聴覚心理分析と符
号量調整処理を説明する。図14において、先ず、量子
化・符号化部24により正規化された係数の1回目(可
逆方式)の量子化ビット数(Bit[i])を決定し、符号量
を見積もって総符号量(Total bit )を算出する(ステ
ップS21)。次いでそのフレームの符号量補正値Adj
を読み込み(ステップS22)、補正値Adj が負(Adj
<0)か否かをチェックする(ステップS23)。
Next, the psychoacoustic analysis and the code amount adjustment processing will be described with reference to FIG. In FIG. 14, first, the number of quantization bits (Bit [i]) for the first time (reversible method) of the coefficients normalized by the quantization / encoding unit 24 is determined, and the total amount of code ( Total bit) is calculated (step S21). Next, the code amount correction value Adj for that frame
(Step S22), the correction value Adj is negative (Adj
It is checked whether or not <0) (step S23).

【0053】そして、補正値Adj が負の場合(符号量削
減)には、先ず、聴覚心理モデルのマスキング効果と最
小可聴限特性を考慮してバンドパワーp[i] (=正規化
2=scale[i]2 )からマスキングカーブm[i] を算出
する(ステップS4)。この場合、マスキングカーブm
[i] は基準カーブcurve[i]とバンドパワーp[i] を畳み
込み演算することにより得られる。
When the correction value Adj is negative (reduction of code amount), first, the band power p [i] (= normalized value 2 = A masking curve m [i] is calculated from scale [i] 2 ) (step S4). In this case, masking curve m
[i] is obtained by convoluting the reference curve curve [i] and the band power p [i].

【0054】次いで最小可聴限とマスキングカーブから
各バンドの標準ノイズレベルN[i]を算出し(ステップ
S5)、次いで標準ノイズレベルN[i] が高いバンドか
ら1ビットずつビット削減を行うことにより符号量補正
値を各バンドに振り分ける。但し、バンドiにおいて1
ビット削減を行う毎にN[i] から6.0を減算し、ビッ
ト削減が標準ノイズレベルN[i] と相似形になるように
する(ステップS6)。そして、このように各バンド毎
に最終的に決定された量子化ビット数で、量子化・符号
化部24で再量子化及び符号化する(ステップS7)。
Next, the standard noise level N [i] of each band is calculated from the minimum audibility limit and the masking curve (step S5), and then bit reduction is performed bit by bit from the band having the highest standard noise level N [i]. The code amount correction value is assigned to each band. However, 1 in band i
Each time bit reduction is performed, 6.0 is subtracted from N [i] so that the bit reduction becomes similar to the standard noise level N [i] (step S6). Then, the quantization / encoding unit 24 requantizes and encodes with the number of quantization bits finally determined for each band in this way (step S7).

【0055】また、ステップS23において補正値Adj
が負でない場合(符号量増加)には、余剰ビットを各バ
ンドに割り当て又はパディングし(ステップS8)、そ
の量子化ビット数で、量子化・符号化部24で再量子化
及び符号化する(ステップS7)。フォーマット出力部
26は一般に、正規化係数(場合によっては量子化ビッ
ト数)と、符号量制御部26の符号量制御情報と、それ
にヘッダ等の補助情報を付加してフォーマット化(ビッ
トストリーム化)して伝送する。
In step S23, the correction value Adj
If is not negative (increased code amount), surplus bits are assigned or padded to each band (step S8), and the quantization / encoding unit 24 requantizes and encodes with the number of quantization bits ( Step S7). The format output unit 26 generally formats by adding a normalization coefficient (in some cases, the number of quantized bits), code amount control information of the code amount control unit 26, and auxiliary information such as a header to it (bitstream conversion). And then transmit.

【0056】したがって、上記例によれば、算術エント
ロピーが大きく、聴感エントロピーが小さい区間ほど、
より多くの符号量補正(削減)を受けることになり、聴
感に対応した符号量配分を行うことができる。また、図
15は図8の装置と、従来のエンコーダにおいて符号量
過剰時の再量子化ノイズレベルの設定例を比較した場合
を示し、この例によれば、非可逆符号化されるフレーム
においても再量子化ノイズ聴覚心理モデルに応じてシェ
ーピングされており、ノイズ量が同じであっても聴感上
ではノイズレベルが下がった場合と同等の効果を得るこ
とができる。したがって、聴感上の音質劣化を最小限に
して準可逆的に符号化することができる。
Therefore, according to the above example, the interval where the arithmetic entropy is large and the auditory entropy is small,
Since more code amount correction (reduction) is performed, the code amount can be distributed according to the sense of hearing. Further, FIG. 15 shows a case where the apparatus of FIG. 8 is compared with an example of setting the requantization noise level when the code amount is excessive in the conventional encoder. According to this example, even in a frame to be lossy encoded. Requantization noise is shaped according to the psychoacoustic model, and even if the noise amount is the same, it is possible to obtain the same effect as when the noise level is lowered in the sense of hearing. Therefore, it is possible to perform quasi-reversible encoding while minimizing the sound quality deterioration in hearing.

【0057】図16は従来例において非可逆符号化を行
った場合と、上記図8の例の場合の音質の比較例を示
し、図16(a)はフレームの一部が非可逆となる場
合、図16(b)はフレームの大部分が非可逆となる場
合を示す。図のように非可逆となる区間において太線で
示す本発明の方が細線で示す従来例より音質を改善する
ことができ、したがって、符号化全体として安定した音
質を得ることができる。
FIG. 16 shows a comparative example of the sound quality between the case of lossy encoding in the conventional example and the case of the example of FIG. 8 above. FIG. 16 (a) shows a case where a part of the frame is lossy. 16 (b) shows a case where most of the frame is irreversible. In the irreversible section as shown in the figure, the present invention shown by the thick line can improve the sound quality as compared with the conventional example shown by the thin line, and therefore stable sound quality can be obtained as a whole encoding.

【0058】次に本発明によるデータ圧縮率がどの程度
であるかについて検討する。表5は音楽の3つのジャン
ル別に、圧縮効果を実測あるいは予測した結果を示した
ものである。なお、表中の1段目の4桁の数値の上2桁
はビット数を、下2桁は標本化周波数を示している。各
ジャンルにおいて、5乃至10曲を選定して調査した。
Next, the data compression rate according to the present invention will be examined. Table 5 shows the result of actually measuring or predicting the compression effect for each of the three music genres. In the table, the upper two digits of the first four-digit numerical value indicate the number of bits, and the lower two digits indicate the sampling frequency. In each genre, 5 to 10 songs were selected and surveyed.

【0059】[0059]

【表5】 [Table 5]

【0060】表5中の数字は基のデータ量を100とし
たときの圧縮後のデータ量を示している。この表から分
るように、例えば、2044をクラシック音楽に適用す
ると、平均で40%、最大で48%の圧縮が可能であ
り、さらに2088をクラシック音楽に適用すると、平
均で57%、最大で64%の圧縮が可能であることが分
る。ポップスやジャズ・フュージョンではクラシック程
の圧縮はできないが、平均的に2044では18%から
28%、2088では39%から47%の圧縮率が得ら
れる。なお、表中、2088高域予想とは16kHz〜
20kHz又は13kHz〜20kHzのスペクトルの
スロープの傾向から20kHz以上の高域について予測
したものである。
The numbers in Table 5 show the data amount after compression when the base data amount is 100. As can be seen from this table, for example, when 2044 is applied to classical music, an average compression of 40% and maximum 48% is possible, and when 2088 is applied to classical music, average 57% and maximum is possible. It turns out that 64% compression is possible. Although it is not possible to compress as much as classical music in pops and jazz fusion, compression rates of 18% to 28% for 2044 and 39% to 47% for 2088 are obtained on average. In the table, 2088 high frequency prediction is 16 kHz-
It is a prediction for a high frequency band of 20 kHz or higher from the tendency of the slope of the spectrum of 20 kHz or 13 kHz to 20 kHz.

【0061】表5に示した圧縮の効果は、図4及び図8
に示した準可逆符号化装置を用いない場合のものであ
り、準可逆符号化装置を用いることにより、さらに圧縮
率を高くすることができる。
The effect of the compression shown in Table 5 is shown in FIGS.
This is a case where the quasi-lossless coding device shown in is not used, and the compression rate can be further increased by using the quasi-lossless coding device.

【0062】上記本発明の実施例の4つの態様は、その
いずれかを選択できるように、本発明の圧縮記録装置又
は圧縮装置の使用者が手動で図示省略のセレクトボタン
などを操作することにより、切り替えて使用できる構成
とすることができる。なお、標本化周波数を44.1k
Hzより高く設定した場合は、44.1kHzのときの
一定線速度より更に速い線速度となるよう、ディスクの
回転数を制御する必要がある。標本化周波数を44.1
kHzより高く設定した場合は、高域の周波数特性が改
善され、高音質化が図られる。図17はDVDのフォー
マットを図3と同様にセクタ単位で示すデータ配置模式
図である。図17に示されるように、DVDでは通常1
パックが2048バイト(1論理セクタ)で構成され、
その中のパケット(ユーザデータ)2034バイトが利
用できる。なお、図17において、「パックスタート」
は同期信号となるSYNCパターンを有し、「SCR」
は時間情報であるシステム・クロック・レファレンスで
あり、「Mux rate」は転送レート(マルチプレ
ックシングレート)であり、「パケット(ユーザデー
タ)」はパケットヘッダとデータなどからなる。
According to the four modes of the embodiment of the present invention described above, a user of the compression recording apparatus or the compression apparatus of the present invention manually operates a select button (not shown) or the like so that any one of them can be selected. , Can be switched and used. The sampling frequency is 44.1k.
When it is set higher than Hz, it is necessary to control the rotational speed of the disk so that the linear velocity becomes higher than the constant linear velocity at 44.1 kHz. Sampling frequency is 44.1
When the frequency is set higher than kHz, the high frequency characteristics are improved and the sound quality is improved. FIG. 17 is a schematic data layout diagram showing the format of a DVD in sector units as in FIG. As shown in FIG. 17, it is usually 1 for DVD.
The pack consists of 2048 bytes (1 logical sector),
2034 bytes of the packet (user data) in it can be used. In addition, in FIG. 17, "pack start"
Has a SYNC pattern that serves as a synchronization signal, and "SCR"
Is a system clock reference which is time information, "Mux rate" is a transfer rate (multiplexing rate), and "packet (user data)" is composed of a packet header and data.

【0063】[0063]

【発明の効果】以上説明したように本発明によれば、オ
ーディオ信号を量子化ビット数20ビット又はそれ以
上、標本化周波数44.1kHz又はそれ以上の周波数
で量子化し、量子化された所定量の量子化データ毎に直
交変換及びハフマン符号を適用してデータ量を圧縮し、
圧縮されたデータをCD−ROMXA規格のモード2、
フォーム2のユーザデータ領域、あるいはCD−ROM
規格のモード2のユーザデータ領域、あるいはDVDの
ユーザデータ領域に配するようフォーマッティングする
ようにしているので、音声信号を高圧縮率で圧縮して、
CD−ROMやDVDに記録することができ、CD−R
OMオーディオやDVDオーディオを実現することがで
きる。
As described above, according to the present invention, an audio signal is quantized with a quantization bit number of 20 bits or more and a sampling frequency of 44.1 kHz or more, and a quantized predetermined amount. Compress the data amount by applying orthogonal transformation and Huffman code for each quantized data of
Compressed data is converted into CD-ROM XA standard mode 2,
User data area of form 2 or CD-ROM
Since the formatting is performed so as to be arranged in the user data area of the standard mode 2 or the user data area of the DVD, the audio signal is compressed at a high compression rate,
Can be recorded on CD-ROM or DVD, CD-R
OM audio and DVD audio can be realized.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明のオーディオ信号圧縮記録装置の好まし
い実施例を示すブロック図である。
FIG. 1 is a block diagram showing a preferred embodiment of an audio signal compression recording apparatus of the present invention.

【図2】図1中の信号処理回路2の一例を示すブロック
図である。
FIG. 2 is a block diagram showing an example of a signal processing circuit 2 in FIG.

【図3】CDの種々のフォーマットをセクタ単位で示し
たデータ配置摸式図である。
FIG. 3 is a schematic diagram of data arrangement showing various formats of a CD in units of sectors.

【図4】図1中の信号処理回路2の他の例としての音声
の準可逆符号化装置の一例を示すブロック図である。
FIG. 4 is a block diagram showing an example of a quasi-lossless coding apparatus for speech as another example of the signal processing circuit 2 in FIG.

【図5】図4における聴覚心理分析と符号量調整処理を
説明するためのフローチャートである。
5 is a flowchart for explaining the psychoacoustic analysis and code amount adjustment processing in FIG.

【図6】図4の準可逆符号化装置と従来例における符号
量不足時の再量子化ノイズレベルの比較例を示す説明図
である。
FIG. 6 is an explanatory diagram showing a comparative example of requantization noise levels when the code amount is insufficient in the semi-reversible encoding device of FIG. 4 and a conventional example.

【図7】図4の準可逆符号化装置と従来例における聴感
上の音質比較例を示す説明図である。
FIG. 7 is an explanatory diagram showing a comparative example of auditory sound quality between the semi-reversible encoding device of FIG. 4 and a conventional example.

【図8】図1中の信号処理回路2のさらに他の例として
の音声の準可逆符号化装置の一例を示すブロック図であ
る。
8 is a block diagram showing an example of a quasi-reversible coding apparatus for speech as still another example of the signal processing circuit 2 in FIG.

【図9】図8における符号量補正値を算出する処理を説
明するためのフローチャートである。
9 is a flowchart for explaining a process of calculating a code amount correction value in FIG.

【図10】符号量偏差と符号量補正値の関係を示すグラ
フである。
FIG. 10 is a graph showing the relationship between code amount deviation and code amount correction value.

【図11】符号量補正前と補正後の符号量偏差ヒストグ
ラムを示す説明図である。
FIG. 11 is an explanatory diagram showing histograms of code amount deviations before and after code amount correction.

【図12】符号量補正前と補正後の符号量偏差ヒストグ
ラムを示す説明図である。
FIG. 12 is an explanatory diagram showing histograms of code amount deviations before and after code amount correction.

【図13】符号量補正前と補正後の符号量偏差ヒストグ
ラムを示す説明図である。
FIG. 13 is an explanatory diagram showing code amount deviation histograms before and after code amount correction.

【図14】図8における聴覚心理分析と符号量調整処理
を説明するためのフローチャートである。
FIG. 14 is a flowchart for explaining the psychoacoustic analysis and code amount adjustment processing in FIG.

【図15】図8の準可逆符号化装置と従来例における符
号量不足時の再量子化ノイズレベルの比較例を示す説明
図である。
FIG. 15 is an explanatory diagram showing a comparative example of the requantization noise level when the code amount is insufficient in the semi-reversible encoding device of FIG. 8 and the conventional example.

【図16】図8の準可逆符号化装置と従来例における聴
感上の音質比較例を示す説明図である。
16 is an explanatory diagram showing an audio quality comparison example between the semi-reversible encoding apparatus of FIG. 8 and a conventional example.

【図17】DVDのフォーマットをセクタ単位で示した
データ配置摸式図である。
FIG. 17 is a schematic diagram of data arrangement showing a DVD format in sector units.

【符号の説明】[Explanation of symbols]

1 A/D変換回路(量子化手段) 2 信号処理部(メモリ3とともにデータ圧縮手段を構
成する) 3 メモリ 4 CD−ROM符号化回路(フォーマッティング手
段) 5 CD符号化回路 6 フィルタバンク(バンド分割手段) 7 スイッチ回路(選択手段) 8 ハフマン符号化回路 9 アロケーション回路 10 直交変換回路 11 正規化部・量子化部 21 バッファ 22 窓掛け・直交変換部 23 正規化部 24 量子化・符号化部 25 聴覚心理分析部 26 符号量制御部 27 フォーマット化出力部 IN 入力端子 OUT1、OUT2 出力端子
DESCRIPTION OF SYMBOLS 1 A / D conversion circuit (quantization means) 2 Signal processing part (it comprises a data compression means with the memory 3) 3 Memory 4 CD-ROM encoding circuit (formatting means) 5 CD encoding circuit 6 Filter bank (band division) Means) 7 Switch circuit (selection means) 8 Huffman coding circuit 9 Allocation circuit 10 Orthogonal transformation circuit 11 Normalization / quantization unit 21 Buffer 22 Windowing / Orthogonal transformation unit 23 Normalization unit 24 Quantization / coding unit 25 Psychoacoustic analysis unit 26 Code amount control unit 27 Formatting output unit IN input terminal OUT1, OUT2 output terminal

Claims (13)

【特許請求の範囲】[Claims] 【請求項1】 オーディオ信号を量子化ビット数20ビ
ット又はそれ以上、標本化周波数44.1kHz又はそ
れ以上の周波数で量子化する量子化手段と、 前記量子化手段で量子化された所定量の量子化データ毎
に直交変換及びハフマン符号を適用してデータ量を圧縮
するデータ圧縮手段と、 前記データ圧縮手段で圧縮されたデータをデジタルディ
スクのユーザデータ領域に配するようフォーマッティン
グするフォーマッティング手段と、 前記フォーマッティング手段でフォーマッティングされ
たデータをCDフォーマットとして記録媒体に記録する
手段とを、 有するオーディオ信号圧縮記録装置。
1. A quantizing means for quantizing an audio signal at a quantizing bit number of 20 bits or more and a sampling frequency of 44.1 kHz or more, and a predetermined quantity quantized by the quantizing means. Data compression means for compressing the data amount by applying orthogonal transformation and Huffman code for each quantized data, and formatting means for formatting the data compressed by the data compression means to be arranged in the user data area of the digital disc, And a unit for recording the data formatted by the formatting unit on a recording medium as a CD format.
【請求項2】 オーディオ信号を量子化ビット数20ビ
ット又はそれ以上、標本化周波数44.1kHz又はそ
れ以上の周波数で量子化する量子化手段と、 前記量子化手段で量子化された所定量の量子化データ毎
に直交変換及びハフマン符号を適用してデータ量を圧縮
するデータ圧縮手段と、 前記データ圧縮手段で圧縮されたデータをデジタルディ
スクのユーザデータ領域に配するようフォーマッティン
グするフォーマッティング手段とを、 有するオーディオ信号圧縮装置。
2. A quantizing means for quantizing an audio signal at a quantizing bit number of 20 bits or more and a sampling frequency of 44.1 kHz or more, and a predetermined quantity quantized by the quantizing means. Data compression means for compressing the data amount by applying orthogonal transformation and Huffman code for each quantized data, and formatting means for formatting the data compressed by the data compression means to be arranged in the user data area of the digital disk. An audio signal compression device having.
【請求項3】 オーディオ信号を量子化ビット数20ビ
ット又はそれ以上、標本化周波数44.1kHz又はそ
れ以上の周波数で量子化し、量子化された所定量の量子
化データ毎に直交変換及びハフマン符号を適用してデー
タ量を圧縮し、圧縮されたデータをデジタルディスクの
ユーザデータ領域に配するようフォーマッティングし、
フォーマッティングされたデータをCDフォーマットと
して記録した光記録媒体。
3. An audio signal is quantized at a quantization bit number of 20 bits or more and a sampling frequency of 44.1 kHz or more, and orthogonal transformation and Huffman coding are performed for each quantized predetermined amount of quantized data. To compress the amount of data, format the compressed data into the user data area of the digital disc,
An optical recording medium that records formatted data in a CD format.
【請求項4】 オーディオ信号を量子化ビット数20ビ
ット又はそれ以上、標本化周波数44.1kHz又はそ
れ以上の周波数で量子化する量子化手段と、 前記量子化手段で量子化された所定量の量子化データ毎
に直交変換及びハフマン符号を適用してデータ量を圧縮
するデータ圧縮手段と、 前記データ圧縮手段で圧縮されたデータをCD−ROM
XA規格のモード2、フォーム2、あるいはCD−RO
M規格のモード2のユーザデータ領域に配するようフォ
ーマッティングするフォーマッティング手段と、 前記フォーマッティング手段でフォーマッティングされ
たデータをCDフォーマットとして記録媒体に記録する
手段とを、 有するオーディオ信号圧縮記録装置。
4. A quantizing means for quantizing an audio signal at a quantizing bit number of 20 bits or more and a sampling frequency of 44.1 kHz or more, and a predetermined quantity quantized by the quantizing means. Data compression means for compressing the data amount by applying orthogonal transform and Huffman code for each quantized data, and CD-ROM for the data compressed by the data compression means
XA standard mode 2, form 2, or CD-RO
An audio signal compression recording apparatus comprising: formatting means for formatting so as to be arranged in a user data area of M standard mode 2; and means for recording the data formatted by the formatting means in a recording medium as a CD format.
【請求項5】 オーディオ信号を量子化ビット数20ビ
ット又はそれ以上、標本化周波数44.1kHz又はそ
れ以上の周波数で量子化する量子化手段と、 前記量子化手段で量子化された所定量の量子化データ毎
に直交変換及びハフマン符号を適用してデータ量を圧縮
するデータ圧縮手段と、 前記データ圧縮手段で圧縮されたデータをCD−ROM
XA規格のモード2、フォーム2のユーザデータ領域に
配するようフォーマッティングするフォーマッティング
手段とを、 有するオーディオ信号圧縮装置。
5. A quantizing means for quantizing an audio signal at a quantizing bit number of 20 bits or more and a sampling frequency of 44.1 kHz or more, and a predetermined quantity quantized by the quantizing means. Data compression means for compressing the data amount by applying orthogonal transform and Huffman code for each quantized data, and CD-ROM for the data compressed by the data compression means
An audio signal compression apparatus comprising: a formatting means for formatting so as to be arranged in a user data area of mode 2, mode 2 of the XA standard.
【請求項6】 オーディオ信号を量子化ビット数20ビ
ット又はそれ以上、標本化周波数44.1kHz又はそ
れ以上の周波数で量子化し、量子化された所定量の量子
化データ毎に直交変換及びハフマン符号を適用してデー
タ量を圧縮し、圧縮されたデータをCD−ROMXA規
格のモード2、フォーム2、あるいはCD−ROM規格
のモード2のユーザデータ領域に配するようフォーマッ
ティングし、フォーマッティングされたデータをCDフ
ォーマットとして記録した光記録媒体。
6. An audio signal is quantized at a quantization bit number of 20 bits or more and a sampling frequency of 44.1 kHz or more, and orthogonal transformation and Huffman coding are performed for each quantized predetermined amount of quantized data. Is applied to compress the data amount, format the compressed data in the user data area of the CD-ROM XA standard mode 2, form 2, or the CD-ROM standard mode 2, and format the formatted data. An optical recording medium recorded in the CD format.
【請求項7】 オーディオ信号を量子化ビット数20ビ
ット又はそれ以上、標本化周波数44.1kHz又はそ
れ以上の周波数で量子化する量子化手段と、 前記量子化手段で量子化された所定量の量子化データ毎
に直交変換及びハフマン符号を適用してデータ量を圧縮
するデータ圧縮手段と、 前記データ圧縮手段で圧縮されたデータをDVDのユー
ザデータ領域に配するようフォーマッティングするフォ
ーマッティング手段と、 前記フォーマッティング手段でフォーマッティングされ
たデータをCDフォーマットとして記録媒体に記録する
手段とを、 有するオーディオ信号圧縮記録装置。
7. A quantizing means for quantizing an audio signal at a quantizing bit number of 20 bits or more and a sampling frequency of 44.1 kHz or more, and a predetermined quantity quantized by the quantizing means. Data compression means for compressing the data amount by applying orthogonal transform and Huffman code for each quantized data; formatting means for formatting the data compressed by the data compression means to be arranged in a user data area of a DVD; A device for recording the data formatted by the formatting device in a recording medium in a CD format, the audio signal compression recording device.
【請求項8】 前記オーディオ信号が2チャンネル信号
であり、前記データ圧縮手段が1チャンネルあたり2m
個(mは正の整数)又はそれ以上の量子化データ毎に前
記直交変換及びハフマン符号を適用してデータ量を圧縮
するよう構成されている請求項1、4、7のいずれか1
つに記載のオーディオ信号圧縮記録装置。
8. The audio signal is a two-channel signal, and the data compression means is 2 m per channel.
8. The data amount is compressed by applying the orthogonal transform and Huffman code for each (m is a positive integer) or more quantized data.
Audio signal compression recording device according to item 3.
【請求項9】 前記データ圧縮手段が前記オーディオ信
号を所定の区間長ごとにフレーム化する手段と、 前記フレーム内の信号を可逆方式で符号化するのに必要
な符号量を算出し、フレームで使用可能な符号量と比較
する符号量制御手段と、フレーム内の信号を聴覚心理モ
デルで分析する聴覚心理分析手段と、 フレーム符号量が使用可能符号量以下の場合にはフレー
ム内の信号を可逆方式で量子化し、フレーム符号量が使
用可能符号量を超える場合にはフレーム内の信号を前記
聴覚心理分析手段の出力に基づいて非可逆方式で量子化
する非可逆量子化手段とを、 有する請求項1、4、7、8のいずれか1つに記載のオ
ーディオ信号圧縮記録装置。
9. A means for the data compressing means to frame the audio signal for each predetermined section length, and a code amount required to encode the signal in the frame by a reversible method, A code amount control means for comparing with the usable code amount, a psychoacoustic analysis means for analyzing the signal in the frame by a psychoacoustic model, and a signal in the frame is reversible when the frame code amount is less than or equal to the usable code amount. Irreversible quantizing means for quantizing the signal in the frame by an irreversible method based on the output of the psychoacoustic analyzing means when the frame code quantity exceeds the usable code quantity. Item 9. The audio signal compression recording device according to any one of items 1, 4, 7, and 8.
【請求項10】 前記データ圧縮手段が前記オーディオ
信号を所定の区間長ごとにフレーム化するフレーム化手
段と、 符号化対象の全区間の可逆方式による目標符号量と実符
号量の差を算出し、各区間毎の符号量の過不足量に応じ
た補正値を算出する符号量補正値算出手段と、 フレーム内の信号を聴覚心理モデルで分析する聴覚心理
分析手段と、 全区間の平均符号量が目標符号量になるように前記符号
量補正値に基づいて各区間の信号を可逆方式で量子化す
るか又は前記聴覚心理分析手段の出力に基づいて非可逆
方式で量子化する非可逆量子化手段とを、 有する請求項1、4、7、8のいずれか1つに記載のオ
ーディオ信号圧縮記録装置。
10. A framing means for framing the audio signal for each predetermined section length by the data compression means, and calculating a difference between a target code amount and an actual code amount by a reversible method for all sections to be encoded. , A code amount correction value calculation means for calculating a correction value according to the excess or deficiency of the code amount for each section, a psychoacoustic analysis means for analyzing a signal in a frame with a psychoacoustic model, and an average code quantity for all sections Irreversible quantization in which the signal in each section is quantized by a reversible method based on the code amount correction value so that the target code amount becomes, or irreversibly quantized based on the output of the psychoacoustic analysis means. An audio signal compression recording apparatus according to any one of claims 1, 4, 7, and 8, further comprising:
【請求項11】 前記データ圧縮手段が、前記量子化さ
れた信号を直交変換する直交変換手段と、前記直交変換
手段により直交変換されたデータを複数のバンドに分割
するバンド分割手段と、前記バンド分割手段の出力信号
に応答可能なハフマン符号化回路と、前記バンド分割手
段によりバンド分割されたデータをバンド毎に前記ハフ
マン符号化回路に供給する選択手段とを有する請求項
1、4、7乃至10のいずれか1つに記載のオーディオ
信号圧縮記録装置。
11. The data compression means comprises orthogonal transformation means for orthogonally transforming the quantized signal, band division means for dividing the data orthogonally transformed by the orthogonal transformation means into a plurality of bands, and the band. 8. A Huffman coding circuit capable of responding to the output signal of the dividing means, and selecting means for supplying the band-divided data by the band dividing means to the Huffman coding circuit for each band. 10. The audio signal compression recording device according to any one of 10.
【請求項12】 オーディオ信号を量子化ビット数20
ビット又はそれ以上、標本化周波数44.1kHz又は
それ以上の周波数で量子化する量子化手段と、 前記量子化手段で量子化された所定量の量子化データ毎
に直交変換及びハフマン符号を適用してデータ量を圧縮
するデータ圧縮手段と、 前記データ圧縮手段で圧縮されたデータをDVDのユー
ザデータ領域に配するようフォーマッティングするフォ
ーマッティング手段とを、 有するオーディオ信号圧縮装置。
12. The number of quantization bits of an audio signal is 20.
Quantizing means for quantizing at a bit or more, a sampling frequency of 44.1 kHz or more, and orthogonal transform and Huffman code are applied for each predetermined amount of quantized data quantized by the quantizing means. An audio signal compression apparatus comprising: a data compression unit that compresses a data amount by a data compression unit; and a formatting unit that formats the data compressed by the data compression unit so as to be arranged in a user data area of a DVD.
【請求項13】 オーディオ信号を量子化ビット数20
ビット又はそれ以上、標本化周波数44.1kHz又は
それ以上の周波数で量子化し、量子化された所定量の量
子化データ毎に直交変換及びハフマン符号を適用してデ
ータ量を圧縮し、圧縮されたデータをDVDのユーザデ
ータ領域に配するようフォーマッティングし、フォーマ
ッティングされたデータをCDフォーマットとして記録
した光記録媒体。
13. An audio signal having a quantization bit number of 20.
Bits or more, quantized at a sampling frequency of 44.1 kHz or more, compressed the data amount by applying orthogonal transformation and Huffman code for each quantized predetermined amount of quantized data, and compressed An optical recording medium in which data is formatted so as to be arranged in a user data area of a DVD and the formatted data is recorded in a CD format.
JP6528196A 1995-08-22 1996-02-27 Audio signal-compressing/recording apparatus and audio signal-compressing apparatus and optical recording medium Withdrawn JPH09120647A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP6528196A JPH09120647A (en) 1995-08-22 1996-02-27 Audio signal-compressing/recording apparatus and audio signal-compressing apparatus and optical recording medium
US09/655,046 US6393203B1 (en) 1996-02-27 2000-09-05 Signal compressing apparatus

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP7-236156 1995-08-22
JP23615695 1995-08-22
JP6528196A JPH09120647A (en) 1995-08-22 1996-02-27 Audio signal-compressing/recording apparatus and audio signal-compressing apparatus and optical recording medium

Publications (1)

Publication Number Publication Date
JPH09120647A true JPH09120647A (en) 1997-05-06

Family

ID=26406418

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6528196A Withdrawn JPH09120647A (en) 1995-08-22 1996-02-27 Audio signal-compressing/recording apparatus and audio signal-compressing apparatus and optical recording medium

Country Status (1)

Country Link
JP (1) JPH09120647A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998021830A3 (en) * 1996-11-11 1998-06-25 Philips Electronics Nv Data compression/expansion using a rice encoder/decoder
EP0918332A2 (en) * 1997-11-21 1999-05-26 Victor Company of Japan, Ltd. Encoding apparatus of audio signal, audio disc and disc reproducing apparatus
EP0918331A2 (en) * 1997-11-21 1999-05-26 Victor Company of Japan, Ltd. Recording medium and signal processing apparatus
JP2001510619A (en) * 1997-11-29 2001-07-31 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Audio recording method and apparatus, record carrier, and playback apparatus
WO2003032296A1 (en) * 2001-10-03 2003-04-17 Sony Corporation Encoding apparatus and method, decoding apparatus and method, and recording medium recording apparatus and method

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998021830A3 (en) * 1996-11-11 1998-06-25 Philips Electronics Nv Data compression/expansion using a rice encoder/decoder
US7406252B2 (en) 1997-11-21 2008-07-29 Victor Company Of Japan, Ltd. Encoding apparatus of audio signal, audio disc and disc reproducing apparatus
US7450828B2 (en) 1997-11-21 2008-11-11 Victor Company Of Japan, Ltd. Recording medium and signal processing apparatus
US7248787B2 (en) 1997-11-21 2007-07-24 Jvc Victor Company Of Japan, Ltd. Encoding apparatus of audio signal, audio disc and disc reproducing apparatus
US7792416B2 (en) 1997-11-21 2010-09-07 Victor Company Of Japan, Ltd. Encoding apparatus of audio signal, audio disc and disc reproducing apparatus
US7616866B2 (en) 1997-11-21 2009-11-10 Victor Company Of Japan, Ltd. Encoding apparatus of audio signal, audio disc and disc reproducing apparatus
EP0918331A3 (en) * 1997-11-21 2003-08-06 Victor Company of Japan, Ltd. Recording medium and signal processing apparatus
US6618551B1 (en) 1997-11-21 2003-09-09 Jvc Victor Company Of Japan, Limited Encoding apparatus of audio signal, audio disc and disc reproducing apparatus
US7382700B2 (en) 1997-11-21 2008-06-03 Victor Company Of Japan, Ltd. Recording medium and signal processing apparatus
EP0918332A3 (en) * 1997-11-21 2000-08-30 Victor Company of Japan, Ltd. Encoding apparatus of audio signal, audio disc and disc reproducing apparatus
EP0918331A2 (en) * 1997-11-21 1999-05-26 Victor Company of Japan, Ltd. Recording medium and signal processing apparatus
US6738561B1 (en) 1997-11-21 2004-05-18 Victor Company Of Japan, Ltd. Recording medium and signal processing apparatus
EP0918332A2 (en) * 1997-11-21 1999-05-26 Victor Company of Japan, Ltd. Encoding apparatus of audio signal, audio disc and disc reproducing apparatus
US7450827B2 (en) 1997-11-21 2008-11-11 Victor Company Of Japan, Ltd. Recording medium and signal processing apparatus
JP2009289398A (en) * 1997-11-29 2009-12-10 Koninkl Philips Electronics Nv Method and device for recording audio, record carrier, and playback device
JP2001510619A (en) * 1997-11-29 2001-07-31 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Audio recording method and apparatus, record carrier, and playback apparatus
WO2003032296A1 (en) * 2001-10-03 2003-04-17 Sony Corporation Encoding apparatus and method, decoding apparatus and method, and recording medium recording apparatus and method
US7318026B2 (en) 2001-10-03 2008-01-08 Sony Corporation Encoding apparatus and method, decoding apparatus and method, and recording medium recording apparatus and method

Similar Documents

Publication Publication Date Title
US20080059204A1 (en) Signal compressing apparatus
US7126892B2 (en) Data record medium, data recording method and apparatus, and data transmitting method and apparatus
JP3937788B2 (en) Data recording method and apparatus, data reproducing method and apparatus, data editing method and apparatus
JPH09120647A (en) Audio signal-compressing/recording apparatus and audio signal-compressing apparatus and optical recording medium
JP4649901B2 (en) Method and apparatus for coded transmission of songs
US20050147004A1 (en) Audio data recording/reproduction system and audio data recording medium therefor
JPH09120645A (en) Audio signal-compressing/recording apparatus and audio signal-compressing apparatus and optical recording medium
JPH09120646A (en) Audio signal-compressing/recording apparatus and audio signal-compressing apparatus and optical recording medium
JP3454394B2 (en) Quasi-lossless audio encoding device
JP2002109824A (en) Method for recording digital audio signal and its device
JP3529542B2 (en) Signal transmission / recording / receiving / reproducing method and apparatus, and recording medium
JP2002351500A (en) Method of encoding digital data
Stuart et al. MLP lossless compression
JP3446926B2 (en) Optical disc device and recording method on optical disc
JPH0944198A (en) Quasi-reversible encoding device for voice
JP4293833B2 (en) Digital signal recording / reproducing apparatus and control program therefor
JPH0793892A (en) Semiconductor memory audio recording and reproducing device
JP3387084B2 (en) Recording medium, audio decoding device
Stuart et al. Lossless compression for dvd-audio
JP3346399B2 (en) Optical recording medium and audio decoding device
JP4399819B2 (en) Speech encoding method and speech decoding method
JPH1083198A (en) Digital signal processing method and device therefor
JP3346403B2 (en) Optical recording medium and audio decoding device
JP4399820B2 (en) Speech encoding method and speech decoding method
JP4378725B2 (en) Speech encoding method and speech decoding method

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20030506