JPH11195995A - Audio video compander - Google Patents

Audio video compander

Info

Publication number
JPH11195995A
JPH11195995A JP36060297A JP36060297A JPH11195995A JP H11195995 A JPH11195995 A JP H11195995A JP 36060297 A JP36060297 A JP 36060297A JP 36060297 A JP36060297 A JP 36060297A JP H11195995 A JPH11195995 A JP H11195995A
Authority
JP
Japan
Prior art keywords
bit allocation
scale factor
unit
sub
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP36060297A
Other languages
Japanese (ja)
Inventor
Tsutomu Imai
勉 今井
Tomohiro Ezaki
智宏 江崎
Fumishige Yatsugi
富美繁 矢次
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP36060297A priority Critical patent/JPH11195995A/en
Publication of JPH11195995A publication Critical patent/JPH11195995A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide an audio video compander that uses a microcomputer to apply compression to audio data in real time by means of software where the processing of bit arrangement occupying about half of the compression processing is formed in a table beforehand so as to reduce considerably processing. SOLUTION: The compander consists of a sub band analysis section 101 that processes data sampled at a prescribed interval by a prescribed number of samples and that divides data into 32 bands, a scaling section 102 that normalizes a maximum amplitude of an output of the sub band analysis section to obtain a scale factor, a scale factor selection information calculating section 103 that sets a common scale factor when a change magnitude of the scale factors is small, a bit arrangement selecting section 104 that selects an optimal bit arrangement table among bit arrangement tables, a bit arrangement table section 105 where quantized bits number of each sub band is formed in pluralities of tables, and an audio stream generating section 107.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、ビデオカメラ、電
子スチルカメラ、電話機等の画像音声圧縮伸長装置に関
するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a video / audio compression / expansion apparatus for a video camera, an electronic still camera, a telephone and the like.

【0002】[0002]

【従来の技術】音声圧縮伸長装置として、例えばISO/IE
C 11172-3:1993(E)(MPEG1 オーディオ)に記載されてい
る(以下、これを公知例とする)。
2. Description of the Related Art As an audio compression / decompression device, for example, ISO / IE
C 11172-3: 1993 (E) (MPEG1 audio) (hereinafter, this is a known example).

【0003】MPEG1 Audioは、LAYER
1、LAYER2、LAYER3の3つの方法に分けら
れる。LAYER1からLAYER2さらにLAYER
3となるにつれて、圧縮伸長処理は複雑になるが高音
質、高圧縮となる。
[0003] MPEG1 Audio is a LAYER
1, LAYER2, and LAYER3. LAYER1 to LAYER2 and LAYER
As the number becomes 3, the compression / decompression process becomes complicated, but the sound quality and the compression become high.

【0004】LAYER1のブロック図を図5、LAY
ER1のオーディオストリームを図6、LAYER2の
ブロック図を図7、LAYER2のオーディオストリー
ムを図8に示す。
FIG. 5 is a block diagram of LAYER1, and FIG.
An audio stream of ER1 is shown in FIG. 6, a block diagram of LAYER2 is shown in FIG. 7, and an audio stream of LAYER2 is shown in FIG.

【0005】図5において、501は入力された音声デ
ータを32の帯域に分割するサブバンド分析部、502
は32のサブバンドに分割されたデータの最大振幅をス
ケールファクタとするスケーリング部、503は入力さ
れた音声データを聴覚心理を利用して各帯域のビット割
り当てを算出する聴覚心理処理部、504はスケーリン
グ部502で求められたスケールファクタと聴覚心理処
理部503で算出されたビット配分とを用いてサブバン
ド分析部501で処理されたデータを量子化する量子化
部、505は図6に示したLAYER1のオーディオス
トリームを生成するオーディオストリーム生成部とから
構成される。
In FIG. 5, reference numeral 501 denotes a sub-band analyzer which divides input audio data into 32 bands, 502
Is a scaling unit that uses the maximum amplitude of data divided into 32 sub-bands as a scale factor, 503 is an psychoacoustic processing unit that calculates the bit allocation of each band using the psychoacoustic input audio data, and 504 is A quantizing unit that quantizes the data processed by the subband analyzing unit 501 using the scale factor obtained by the scaling unit 502 and the bit allocation calculated by the psychoacoustic processing unit 503, and a quantizing unit 505 illustrated in FIG. And an audio stream generation unit that generates an audio stream of LAYER1.

【0006】図7において、701は入力された音声デ
ータを32の帯域に分割するサブバンド分析部、702
は入力された音声データを聴覚心理を利用して各帯域の
ビット割り当てを算出する聴覚心理処理部、703は各
サブバンドの連続する12サンプル毎に最大振幅である
スケールファクタを算出し、変化量が少ないときには共
通化するスケールファクタ選択情報算出部、704は聴
覚心理処理部702で算出されたビット割り当てとスケ
ールファクタ選択情報算出部703で算出されたスケー
ルファクタとを用いてサブバンド分析部701で処理さ
れたデータを量子化する量子化部、705は図8に示し
たLAYER2のオーディオストリームを生成するオー
ディオストリーム生成部とから構成される。
In FIG. 7, reference numeral 701 denotes a sub-band analyzer for dividing input audio data into 32 bands;
Is a psychoacoustic processing unit that calculates the bit allocation of each band using the psychoacoustics of the input voice data, and 703 calculates the scale factor that is the maximum amplitude for every 12 consecutive samples of each subband, and calculates the amount of change. When the number is small, the scale factor selection information calculation unit 704, which is common, uses the bit allocation calculated by the psychoacoustic processing unit 702 and the scale factor calculated by the scale factor selection information calculation unit 703 to generate a sub-band analysis unit 701. A quantization unit 705 that quantizes the processed data includes an audio stream generation unit that generates the LAYER2 audio stream shown in FIG.

【0007】[0007]

【発明が解決しようとする課題】上述した公知例におい
て、オーディオの一連の圧縮処理には膨大の演算が必要
である。その膨大な演算量のために、マイコンを使用し
てソフトウエアでリアルタイムにオーディオデータを圧
縮処理することができないため、音声専用のLSIが必要
であった。
In the above-mentioned known example, an enormous amount of calculation is required for a series of audio compression processing. Because of the enormous amount of computation, audio data cannot be compressed and processed in real time by software using a microcomputer, so a dedicated LSI for audio was required.

【0008】[0008]

【課題を解決するための手段】上記課題を達成するため
に、本発明は、全処理の約半分の演算量を占める図5の
聴覚心理処理部503及び図7の聴覚心理処理部703
の演算量を最大限に削減することによりマイコンを使っ
てソフトウエアでリアルタイムに圧縮処理が実現でき
る。
In order to achieve the above object, the present invention provides a psychoacoustic processing unit 503 in FIG. 5 and a psychoacoustic processing unit 703 in FIG.
By reducing the amount of calculation to the maximum, compression processing can be realized in real time by software using a microcomputer.

【0009】[0009]

【発明の実施の形態】以下、本発明の実施例を図面を用
いて説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0010】まず、本発明の実施例の動作について説明
する。
First, the operation of the embodiment of the present invention will be described.

【0011】図4は、本発明の一実施例のシステムブロ
ック図である。同図において、401はレンズ、402
は撮像素子、403は撮像素子402より得られる撮像
信号をテレビジョン等で写す為の映像信号に変換するカ
メラ信号処理部、404はマイク、405は404のマ
イクで集められた音声をデジタルに変換するA/D変換
部、406はカメラ信号処理部103の映像信号を圧縮
しビデオストリームを生成するビデオ処理部、407は
A/D変換部405でデジタルに変換されたオーディオ
データを一時的に蓄えるオーディオバッファ、408は
ビデオ処理部406とオーディオバッファ407とから
構成されるMPEG CODEC部、409はオーディ
オバッファ407のオーディオデータを圧縮しオーディ
オストリームを生成するMPEG Audio部、41
0はビデオ処理部406で生成されたビデオストリーム
とMPEG Audio部409で生成されたオーディ
オストリームとを同期を取り1つのシステムストリーム
を生成する多重化部、411はビデオデータとオーディ
オデータを取込み圧縮しシステムストリームを生成する
MPEGカメラ、412はMPEGカメラ411で生成
されたシステムストリームを記録する記録媒体である。
FIG. 4 is a system block diagram of one embodiment of the present invention. In the figure, 401 is a lens, 402
Denotes an image sensor, 403 denotes a camera signal processing unit which converts an image signal obtained from the image sensor 402 into a video signal for photographing on a television or the like, 404 denotes a microphone, and 405 converts audio collected by the microphone 404 to digital. A / D converter 406, a video processor for compressing the video signal of the camera signal processor 103 to generate a video stream, and 407 temporarily store the audio data converted to digital by the A / D converter 405. An audio buffer 408 is an MPEG CODEC unit composed of a video processing unit 406 and an audio buffer 407, and 409 is an MPEG Audio unit 41 for compressing audio data in the audio buffer 407 and generating an audio stream.
A multiplexing unit 0 synchronizes the video stream generated by the video processing unit 406 with an audio stream generated by the MPEG audio unit 409 to generate one system stream. 411 captures and compresses video data and audio data. An MPEG camera 412 for generating a system stream is a recording medium for recording the system stream generated by the MPEG camera 411.

【0012】映像はレンズ401で集光され撮像素子4
02により撮像信号に変換されカメラ信号処理403で
映像信号に変換され、ビデオ処理部406でMPEGに
準拠したビデオストリームに圧縮される。一方音声は、
マイク404で集音されA/D変換部405でデジタル
に変換されオーディオバッファ407を介してMPEG
Audio部409でMPEG Audioに準拠した
オーディオストリームに圧縮される。多重化部411で
ビデオストリームとオーディオストリームとを同期をと
りMPEGシステムストリームに準拠した形式で記録媒
体412に記録される。
An image is condensed by a lens 401 and the image sensor 4
The video signal is converted into a video signal by a camera signal processing 403, and is compressed into a video stream compliant with MPEG by a video processing unit 406. On the other hand, audio
The sound is collected by the microphone 404, converted to digital by the A / D converter 405,
The audio unit 409 compresses the audio stream into an audio stream compliant with MPEG Audio. The multiplexing unit 411 synchronizes the video stream and the audio stream and records the video stream and the audio stream on the recording medium 412 in a format conforming to the MPEG system stream.

【0013】次に図4のMPEG Audio部409
での処理の第一の実施例を図1、図8、図12、図1
3、図14、図15、図16、図17、図18を用いて
説明する。
Next, the MPEG Audio unit 409 shown in FIG.
1, 8, 12, and 1 of the first embodiment of the processing in FIG.
3, FIG. 14, FIG. 15, FIG. 16, FIG. 17, FIG.

【0014】まず、図1について説明する。101はA
/D変換部405で処理されたオーディオデータを32
の帯域に分割するサブバンド分析部、102は32サブ
バンドに分割されたデータの最大振幅をスケールファク
タとするスケーリング部、103はスケールファクタの
変化量が少ないときには共通化するスケールファクタ選
択情報算出部、104はビット配分テーブル部の中から
最適のビット配分テーブルを選択するビット配分選択
部、105は各サブバンドの量子化ビット数をあらかじ
め複数個のテーブルとしてあるビット配分テーブル部、
106はスケーリング部102とスケールファクタ選択
算出部104で算出されたスケールファクタとビット配
分選択部104で選択されたビット配分テーブル部10
5とを用いてサブバンド分析101で処理されたデータ
を量子化する量子化部、107はヘッダ、ビット配分、
SCFSI(SCALEFACTOR SELECTION IMFORMATION、ス
ケールファクタ選択情報)、スケールファクタ、量子化
されたデータを図8に示したLAYER2のオーディオ
ストリームを生成するストリーム生成部である。
First, FIG. 1 will be described. 101 is A
The audio data processed by the / D conversion unit 405 is
, A scaling unit that uses the maximum amplitude of the data divided into 32 subbands as a scale factor, and a scale factor selection information calculation unit that is common when the change amount of the scale factor is small. , 104 is a bit allocation selection section for selecting an optimal bit allocation table from the bit allocation table section, 105 is a bit allocation table section in which the number of quantization bits of each subband is previously stored as a plurality of tables,
Reference numeral 106 denotes a scale factor calculated by the scaling unit 102 and the scale factor selection calculation unit 104, and the bit allocation table unit 10 selected by the bit allocation selection unit 104.
5, a quantization unit 107 for quantizing the data processed in the subband analysis 101, a header 107, a bit allocation,
A stream generation unit that generates an audio stream of LAYER2 shown in FIG. 8 using SCFSI (SCALEFACTOR SELECTION IMFORMATION, scale factor selection information), scale factor, and quantized data.

【0015】サブバンド分析101では32のサブバン
ドの帯域に分割される。この分割は全体域を32に等分
割するためサンプリング周波数が32KHzの場合には
500Hz単位となる。スケーリング部102では、サ
ブバンド分析101の出力データから各帯域毎に最大値
を求め各サブバンド毎に正規化する係数であるスケール
ファクタを各サブバンド毎に12サンプルを1ブロック
とする連続3ブロックに対して3つのスケールファクタ
を求め、図15のテーブルから適するindexを求め
る。スケールファクタ選択情報算出部103はスケーリ
ング部102で算出された3つのスケールファクタsc
f1、scf2、scf3から dscf1 = scf1 − scf2 dscf2 = scf2 − scf3・・・ (式1) を求め、dscf1とdscf2のclassを図16
からそれぞれ求め、classの値から図15に示され
ているスケールファクタのみで圧縮処理を行う。そのた
めスケールファクタは最小30個〜最大90個まで圧縮
される。
In the sub-band analysis 101, the band is divided into 32 sub-bands. Since this division divides the entire area equally into 32, when the sampling frequency is 32 KHz, the division is in units of 500 Hz. The scaling unit 102 calculates a maximum value for each band from the output data of the subband analysis 101, and sets a scale factor, which is a coefficient for normalizing for each subband, to three consecutive blocks in which 12 blocks are used as one block for each subband. Then, three scale factors are obtained, and a suitable index is obtained from the table of FIG. The scale factor selection information calculation unit 103 calculates the three scale factors sc calculated by the scaling unit 102.
dscf1 = scf1-scf2 dscf2 = scf2-scf3... (Equation 1) is obtained from f1, scf2, and scf3, and the class of dscf1 and dscf2 is shown in FIG.
From the value of class, and performs compression processing only with the scale factor shown in FIG. Therefore, the scale factor is compressed from a minimum of 30 to a maximum of 90.

【0016】例えば、scf1=20、scf1=2
2、scf3=18の場合には(式1)より、dscf
1=−2、dscf2=4となり、図16から、cla
ss1=2、class2=5となる。図17からブロ
ック1、ブロック2、ブロック3で量子化に使用するス
ケールファクタはそれぞれscf1、scf1、scf
3でありscf2は使用しないSCFSIには1がセッ
トされる。このようにしてスケールファクタの変化量が
少ないときには共通化をして圧縮能率を上げている。
For example, scf1 = 20, scf1 = 2
2, when scf3 = 18, dscf is obtained from (Equation 1).
1 = −2, dscf2 = 4, and from FIG.
ss1 = 2 and class2 = 5. From FIG. 17, the scale factors used for quantization in block 1, block 2, and block 3 are scf1, scf1, and scf, respectively.
1 is set to SCFSI which is 3 and scf2 is not used. In this way, when the change amount of the scale factor is small, the compression efficiency is increased by sharing the scale factor.

【0017】次に105のビット配分テーブルの一具体
例を図12、図13、図14に示す。この場合には、ス
ケールファクタの数を基にビット配分テーブルを選択し
ている。従来は、このビット配分は聴覚心理に基づいて
毎オーディオフレーム算出されており、この算出にはオ
ーディオ圧縮処理の約半分を占めているため、マイコン
を使ったリアルタイム圧縮処理の妨げとなっていた。本
発明では、このビット配分を算出する部分を削除してあ
らかじめテーブルとした。
Next, a specific example of the bit allocation table 105 is shown in FIGS. 12, 13 and 14. FIG. In this case, the bit allocation table is selected based on the number of scale factors. Conventionally, this bit allocation is calculated for each audio frame based on psychological psychology, and this calculation occupies about half of the audio compression processing, which hinders real-time compression processing using a microcomputer. In the present invention, the part for calculating the bit distribution is deleted to make a table in advance.

【0018】LAYER2ではサンプリング周波数とビ
ットレートにより使用できる最大サブバンド数、ビット
配分の値とそれに対応した量子化精度がテーブルで決め
られている。サンプリング周波数32KHz、ビットレ
ート128Kbpsの量子化精度テーブルを図16に示
す。この場合には32サブバンド中30サブバンドまで
使用できる。また、LAYER2の場合には量子化精度
が3、5、9のときには3つのサンプルを1つにして量
子化するグループコーディングで量子化される。
In LAYER2, the maximum number of sub-bands that can be used according to the sampling frequency and bit rate, the value of bit allocation, and the corresponding quantization precision are determined in a table. FIG. 16 shows a quantization accuracy table with a sampling frequency of 32 KHz and a bit rate of 128 Kbps. In this case, up to 30 subbands out of 32 subbands can be used. In the case of LAYER2, when the quantization precision is 3, 5, or 9, quantization is performed by group coding in which three samples are combined into one and quantized.

【0019】(1)はスケールファクタがすべて圧縮さ
れるときに使用されるテーブルで(11)はスケールフ
ァクタが最小で圧縮されるときに使用されるテーブルで
ある。(11)のスケールファクタが最小で圧縮される
ときに使用するテーブルの作成方法を次に説明する。
(1) is a table used when all the scale factors are compressed, and (11) is a table used when the scale factors are compressed to the minimum. A method of creating a table used when the scale factor of (11) is compressed to the minimum will be described below.

【0020】LAYER2、サンプリング周波数32K
Hz、ビットレート128Kbps、モノラルでの1オ
ーディオフレーム長801は、 1オーディオフレーム長=128[Kbps]×1152[サンプル]/32[KHz] =4608[bit] となる。図8のLAYER2のオーディオストリーム総
ビット数4608ビット中、ヘッダ802は32ビッ
ト、ビットアロケーション803は図16のnbalの
合計で94ビット、SCFSIは2ビット×30サブバ
ンド=60ビット、スケールファクタ804は6ビット
×30サブバンド×1個=180ビットである。よっ
て、サンプル805に割り当て可能なビット数は サンプルのビット数 = 4608−32−94−60−180 = 4242 [bit] である。まず、人が検知し難い比較的高域のサブバンド
であるサブバンド23〜サブバンド30は量子化精度3
のグループコーディング(量子化精度3の場合には3サ
ンプル合わせて5ビットで量子化される)とした。よっ
て、サブバンド23〜サブバンド30のビット数は5ビ
ット×7サブバンド×12=420ビット。よって、サ
ブバンド0〜サブバンド22に割り当て可能なビット数
は4242−420=3822ビットとなり、LAYE
R2では、サブバンド毎に12サンプルのデータを1ブ
ロックとして3ブロックまとめて処理するため、上記割
り当て可能なビット数を36で割ると106となる。こ
れを、サブバンド0〜サブバンド22に割り当てた。
LAYER2, sampling frequency 32K
One audio frame length 801 in Hz, bit rate 128 Kbps, and mona is 1 audio frame length = 128 [Kbps] × 1152 [samples] / 32 [KHz] = 4608 [bit]. 8, the header 802 is 32 bits, the bit allocation 803 is 94 bits in total of nbal of FIG. 16, the SCFSI is 2 bits × 30 subbands = 60 bits, and the scale factor 804 is 6 bits × 30 subbands × 1 = 180 bits. Therefore, the number of bits that can be allocated to the sample 805 is: number of bits of sample = 4608-32-94-60-180 = 4242 [bit]. First, the sub-bands 23 to 30, which are relatively high-frequency sub-bands that are hard to detect by humans, have a quantization accuracy of 3
(In the case of a quantization accuracy of 3, three samples are quantized with 5 bits). Therefore, the number of bits of the subbands 23 to 30 is 5 bits × 7 subbands × 12 = 420 bits. Therefore, the number of bits that can be allocated to subband 0 to subband 22 is 4242-420 = 3822 bits, and LAYE
In R2, since the data of 12 samples for each subband is processed as one block in three blocks, the number of assignable bits is divided by 36 to obtain 106. This is allocated to subbands 0 to 22.

【0021】次に(1)のスケールファクタが最大で圧
縮されるときに使用するテーブルの作成方法を説明す
る。
Next, a method of creating a table used when the scale factor (1) is compressed at the maximum will be described.

【0022】LAYER2、サンプリング周波数32K
Hz、ビットレート128Kbps、モノラルでの1オ
ーディオフレーム長は、同様に4608ビットであり4
608ビット中、ヘッダ802は32ビット、ビットア
ロケーション803は図16のnbalの合計で94ビ
ット、SCFSIは2ビット×30サブバンド=60ビ
ット、スケールファクタ804は6ビット×30サブバ
ンド×3個=540ビットである。よって、サンプル8
05に割り当て可能なビット数は サンプルのビット数 = 4608−32−94−60−540 = 3882 [bit] である。(11)の場合と同様にサブバンド23〜サブ
バンド30は量子化精度3のグループコーディング(量
子化精度3の場合には3サンプル合わせて5ビットで量
子化される)とした。よって、サブバンド23〜サブバ
ンド30のビット数は5ビット×7サブバンド×12=
420ビット。よって、サブバンド0〜サブバンド22
に割り当て可能なビット数は3882−420=346
2ビットとなり、LAYER2では、サブバンド毎に1
2サンプルのデータを1ブロックとして3ブロックまと
めて処理するため、上記割り当て可能なビット数を36
で割ると96となる。これを、サブバンド0〜サブバン
ド22に割り当てた。
LAYER2, sampling frequency 32K
Hz, a bit rate of 128 Kbps, and one audio frame length in monaural are also 4608 bits.
Among the 608 bits, the header 802 is 32 bits, the bit allocation 803 is 94 bits in total of nbal in FIG. 16, the SCFSI is 2 bits × 30 subbands = 60 bits, and the scale factor 804 is 6 bits × 30 subbands × 3 = 540 bits. Therefore, sample 8
The number of bits that can be assigned to 05 is: number of bits of sample = 4608-32-94-60-540 = 3882 [bit]. As in the case of (11), the subbands 23 to 30 are group-coded with a quantization accuracy of 3 (in the case of the quantization accuracy of 3, three samples are quantized by 5 bits in total). Therefore, the number of bits of subbands 23 to 30 is 5 bits × 7 subbands × 12 =
420 bits. Therefore, subband 0 to subband 22
Are 3882−420 = 346.
2 bits, and in LAYER2, 1 for each subband
In order to process two blocks of data as one block and process three blocks at a time, the number of bits that can be allocated is 36
Dividing by gives 96. This is allocated to subbands 0 to 22.

【0023】本発明では106ビットから96ビットの
1ビット単位のビット配分テーブルを作成したため図1
2、図13、図14に示したように11テーブルとし
た。ビット配分の振り分けには最小可聴限界(聴覚が検
知できる音の最小レベルであり音の周波数に依存する)
を基に振り分けたものである。つまり、人が検知し易い
帯域のサブバンドにビット割り当てを多くした。
According to the present invention, a bit allocation table in units of 1 bit from 106 bits to 96 bits is created.
2, 11 tables as shown in FIGS. Minimum audible limit for distribution of bit allocation (minimum level of sound that can be detected by hearing and depends on sound frequency)
It is sorted based on. That is, more bits are allocated to sub-bands of a band that is easily detected by humans.

【0024】ビット配分選択部104でどのビット配分
テーブルを選択するのかはスケールファクタ選択情報算
出部103で算出されたスケールファクタの総数を基に
して11のテーブルから最適のテーブルを選択してい
る。
The bit allocation table to be selected by the bit allocation selection unit 104 is selected from the eleven tables based on the total number of scale factors calculated by the scale factor selection information calculation unit 103.

【0025】このビット配分テーブルの選択は入力され
たもの(例えば音楽の種類)によって最適のテーブルを
選択することも考えられる。
For the selection of the bit distribution table, it is conceivable to select an optimum table according to the input one (for example, the type of music).

【0026】図12、図13、図14のテーブルは使用
できる最大サブバンド数すべてに割り当てる必要はな
く、例えば、サブバンド0〜サブバンド23に量子化ビ
ットを割り当てサブバンド24〜サブバンド29には0
を割り当てたビット配分テーブルも作成できる。
The tables in FIGS. 12, 13 and 14 do not need to be allocated to all of the maximum number of usable sub-bands. For example, quantization bits are allocated to sub-bands 0 to 23 and sub-bands 24 to 29 are allocated. Is 0
A bit distribution table to which "" is assigned can also be created.

【0027】次に図4のMPEG Audio部409
での処理の第二の実施例を図2、図8、図11、図15
を用いて説明する。
Next, the MPEG Audio unit 409 shown in FIG.
2, 8, 11, and 15 show a second embodiment of the processing in FIG.
This will be described with reference to FIG.

【0028】201はA/D変換部405で処理された
オーディオデータを32の帯域に分割するサブバンド分
析部、202は32サブバンドに分割されたデータの最
大振幅をスケールファクタとするスケーリング部、20
3はスケールファクタの変化量が少ないときには共通化
するスケールファクタ選択情報算出部、204は各サブ
バンドの量子化ビット数をあらかじめ複数個のテーブル
としてあるビット配分テーブル部、205はスケーリン
グ部202とスケールファクタ選択算出部203で算出
されたスケールファクタとビット配分テーブル部204
とを用いてサブバンド分析201で処理されたデータを
量子化する量子化部、206はヘッダ、ビット配分、S
CFSI、スケールファクタ、量子化されたデータを図
8に示したLAYER2のオーディオストリームを生成
するストリーム生成部である。
Reference numeral 201 denotes a subband analysis unit that divides the audio data processed by the A / D conversion unit 405 into 32 bands, 202 denotes a scaling unit that uses the maximum amplitude of the data divided into 32 subbands as a scale factor, 20
Numeral 3 denotes a scale factor selection information calculation unit for sharing when the amount of change in the scale factor is small, 204 denotes a bit distribution table unit in which the number of quantization bits of each subband is previously stored as a plurality of tables, and 205 denotes a scaling unit 202 and a scale unit. Scale factor calculated by factor selection calculation section 203 and bit distribution table section 204
The quantization unit 206 quantizes the data processed in the sub-band analysis 201 by using
This is a stream generation unit that generates a LAYER2 audio stream shown in FIG. 8 using CFSI, scale factor, and quantized data.

【0029】サブバンド分析201では32のサブバン
ドの帯域に分割される。この分割は全体域を32に等分
割するためサンプリング周波数が32KHzの場合には
500Hz単位となる。スケーリング部202では、サ
ブバンド分析201の出力データから各帯域毎に最大値
を求め各サブバンド毎に正規化する係数であるスケール
ファクタを各サブバンド毎に12サンプルを1ブロック
とする連続3ブロックに対して3つのスケールファクタ
を求め、図15のテーブルから適するindexを求め
る。スケールファクタ選択情報算出部203はスケーリ
ング部202で算出された3つのスケールファクタから
量子化で使用するスケールファクタを求める。ビット配
分テーブル204はあらかじめテーブルとしてある。
In the sub-band analysis 201, the band is divided into 32 sub-bands. Since this division divides the entire area equally into 32, when the sampling frequency is 32 KHz, the division is in units of 500 Hz. The scaling unit 202 calculates a maximum value for each band from the output data of the sub-band analysis 201, and sets a scale factor, which is a coefficient for normalizing for each sub-band, to three consecutive blocks in which each sub-band has 12 samples as one block. Then, three scale factors are obtained, and a suitable index is obtained from the table of FIG. The scale factor selection information calculation unit 203 obtains a scale factor used in quantization from the three scale factors calculated by the scaling unit 202. The bit distribution table 204 is a table in advance.

【0030】図11に一具体例のビット配分テーブルを
示す。第二の実施例ではこのビット配分テーブルを1つ
にした。ビット配分テーブルを1つにすることによりさ
らに演算量は減るがスケールファクタの変化量によって
実際には圧縮されないスケールファクタが生じるがビッ
ト配分テーブルが1つのため効率的にビットが割り当て
ることができず第一の実施例に比べて音質が悪くなって
しまう。
FIG. 11 shows a bit distribution table of one specific example. In the second embodiment, this bit distribution table is reduced to one. By using only one bit allocation table, the amount of calculation is further reduced, but a change in the scale factor causes a scale factor that is not actually compressed. However, since there is only one bit allocation table, bits cannot be allocated efficiently and The sound quality is worse than in the first embodiment.

【0031】図11のテーブルは使用できる最大サブバ
ンド数すべてに割り当てる必要はなく、例えば、サブバ
ンド0〜サブバンド23に量子化ビットを割り当てサブ
バンド24〜サブバンド29には0を割り当てたビット
配分テーブルも作成できる。MPEG Audio部4
09での処理の第三の実施例を図3、図6、図9、図1
0を用いて説明する。図3は、本発明のLAYER1で
のブロック図である。
The table in FIG. 11 does not need to be assigned to all of the maximum number of usable sub-bands. For example, quantization bits are assigned to sub-bands 0 to 23 and bits assigned to 0 are assigned to sub-bands 24 to 29. Distribution tables can also be created. MPEG Audio section 4
3, FIG. 6, FIG. 9, FIG.
Explanation will be made using 0. FIG. 3 is a block diagram of LAYER1 of the present invention.

【0032】301はA/D変換部405で処理された
オーディオデータを32の帯域に分割するサブバンド分
析部、302は各32サブバンドを何ビットで量子化す
るのかをあらかじめ定めてあるビット配分テーブル、3
03は32サブバンドに分割されたデータの最大振幅を
スケールファクタとするスケーリング部、304はスケ
ーリング部103で算出されたスケールファクタとビッ
ト配分テーブル302とを用いてサブバンド分析301
で処理されたデータを量子化する量子化部、305はス
ケールファクタと量子化されたデータを図6に示したL
AYER1のオーディオストリームを生成するストリー
ム生成部である。
Reference numeral 301 denotes a sub-band analysis unit which divides the audio data processed by the A / D conversion unit 405 into 32 bands, and 302 denotes a bit distribution which determines how many bits each of the 32 sub-bands is to be quantized. Table, 3
Reference numeral 03 denotes a scaling unit that uses the maximum amplitude of data divided into 32 subbands as a scale factor. Reference numeral 304 denotes a subband analysis 301 using the scale factor calculated by the scaling unit 103 and the bit allocation table 302.
The quantization unit 305 quantizes the data processed in step S 305. The scale factor and the quantized data are represented by L shown in FIG.
A stream generation unit that generates an AYER1 audio stream.

【0033】サブバンド分析301では32のサブバン
ドの帯域に分割される。この分割は全体域を32に等分
割するためサンプリング周波数が32KHzの場合には
LAYER2と同様に500Hz単位となる。スケーリ
ング部302では、サブバンド分析301の出力データ
から各帯域毎に最大値を求め各サブバンド毎に正規化す
る係数であるスケールファクタを求める。303のビッ
ト配分テーブルの一具体例を図9に示す。
In the sub-band analysis 301, the band is divided into 32 sub-bands. This division equally divides the entire area into 32, and when the sampling frequency is 32 KHz, the division is made in units of 500 Hz similarly to LAYER2. The scaling unit 302 obtains a maximum value for each band from the output data of the subband analysis 301 and obtains a scale factor that is a coefficient for normalizing each subband. FIG. 9 shows a specific example of the bit allocation table 303.

【0034】このビット配分テーブルは、サブバンド毎
に何ビットで量子化するのかを示すものである。LAY
ER1での実際の量子化ビット数は、前記規格書(ISO/
IEC11172-3:1993(E)(MPEG1 オーディオ)により 実際の量子化ビット数 = ビット配分テーブルの値 + 1 ・・・(式2) と定められている。しかし、ビット配分テーブルの値が
0の場合には実際の量子化ビット数は0ビットとなる。
This bit distribution table indicates how many bits are quantized for each subband. LAY
The actual number of quantization bits in ER1 is based on the standard (ISO / ISO
According to IEC11172-3: 1993 (E) (MPEG1 audio), the actual number of quantization bits = the value of the bit distribution table + 1 + 1 (Equation 2). However, when the value of the bit distribution table is 0, the actual number of quantization bits is 0.

【0035】従来は、このビット配分は聴覚心理に基づ
いて毎オーディオフレーム算出されており、この算出に
はオーディオ圧縮処理の約半分を占めているため、マイ
コンを使ったリアルタイム圧縮処理の妨げとなってい
た。本発明では、このビット配分を算出する部分を削除
してあらかじめテーブルとした。図9のビット配分テー
ブルの作成の一具体例を次に説明する。LAYER1、
サンプリング周波数32KHz、ビットレート128K
bps、モノラルでの1オーディオフレーム長601
は、 1オーディオフレーム長=128[Kbps]×384[サンプル]/32[KHz] = 1536 [bit] となる。図9では、毎フレーム32サブバンドすべて使
用するようにビット配分を決定した。
Conventionally, this bit allocation is calculated for each audio frame based on psychological psychology, and this calculation occupies about half of the audio compression processing, which hinders real-time compression processing using a microcomputer. I was In the present invention, the part for calculating the bit distribution is deleted to make a table in advance. A specific example of creating the bit distribution table of FIG. 9 will be described below. LAYER1,
Sampling frequency 32KHz, bit rate 128K
bps, one audio frame length 601 in monaural
Is as follows: 1 audio frame length = 128 [Kbps] × 384 [samples] / 32 [KHz] = 1536 [bit]. In FIG. 9, the bit allocation is determined so as to use all 32 subbands per frame.

【0036】次に、ビット配分テーブルの作成方法につ
いて図8、図9を用いて説明する。
Next, a method of creating a bit distribution table will be described with reference to FIGS.

【0037】図8のLAYER1のオーディオストリー
ム総ビット数1536ビット中、ヘッダ602は32ビ
ット、ビットアロケーション603は4ビット×32サ
ブバンド=128ビット、スケールファクタ604は6
ビット×32サブバンド=192ビットである。よっ
て、サンプル605に割り当て可能なビット数は サンプルのビット数 = 1536−32−128−192 = 1184 [bit] である。LAYER1では、サブバンド毎に12サンプ
ルのデータを処理するため、上記サンプルのビット数を
12で割りサンプルに割り当てるビット数を98ビット
にした。上記実際の量子化ビット数の式1よりビット配
分テーブルでの総ビット数は32を引いて66となる。
これを32サブバンドに振り分ける。図9に32のサブ
バンド(サブバンド0〜サブバンド31)に振り分けた
テーブルの様子を示す。図9よりサブバンド0でのビッ
ト配分は6であるため、実際の量子化ビット数は上記
(式2)より7ビットで量子化される。この振り分けは
最小可聴限界(聴覚が検知できる音の最小レベルであり
音の周波数に依存する)を基に振り分けたものである。
8, the header 602 has 32 bits, the bit allocation 603 has 4 bits × 32 subbands = 128 bits, and the scale factor 604 has 6 bits.
Bits × 32 subbands = 192 bits. Therefore, the number of bits that can be assigned to the sample 605 is: number of bits of sample = 1536-32-128-192 = 1184 [bit]. In LAYER1, in order to process data of 12 samples for each subband, the number of bits of the sample is divided by 12 and the number of bits allocated to the sample is set to 98 bits. The total number of bits in the bit allocation table is calculated by subtracting 32 from the expression 1 of the actual quantization bit number, and is 66.
This is distributed to 32 sub-bands. FIG. 9 shows a state of a table allocated to 32 sub-bands (sub-band 0 to sub-band 31). According to FIG. 9, since the bit allocation in subband 0 is 6, the actual number of quantization bits is quantized by 7 bits according to the above (Equation 2). This distribution is based on the minimum audible limit (the minimum level of sound that can be detected by hearing and depends on the frequency of the sound).

【0038】次にビット配分テーブルの第二の具体例を
図3、図10を用いて説明する。図10は32のサブバ
ンドの中24サブバンドのみを使用するビット配分テー
ブルである。まず24サブバンドを使用する場合のビッ
ト配分の総和を求める。仕様はLAYER1、サンプリ
ング周波数32KHz、ビットレート128Kbps、
モノラルである。1オーディオフレーム長は、第一の具
体例と同じく1536ビットである。
Next, a second specific example of the bit distribution table will be described with reference to FIGS. FIG. 10 is a bit allocation table using only 24 subbands out of 32 subbands. First, a total sum of bit allocation when using 24 subbands is obtained. Specifications are LAYER1, sampling frequency 32KHz, bit rate 128Kbps,
It is monaural. One audio frame length is 1536 bits as in the first specific example.

【0039】24のサブバンドを使用する場合には、図
8のLAYER1のオーディオストリーム総ビット数1
536ビット中、ヘッダ602は32ビット、ビットア
ロケーション603は4ビット×32サブバンド=12
8ビット、スケールファクタ604は6ビット×24サ
ブバンド=144ビットである。よって、サンプル60
5に割り当て可能なビット数は サンプルのビット数 = 1536−32−128−144 = 1232 [bit] である。第一の具体例と同様にLAYER1では、サブ
バンド毎に12サンプルのデータを処理するため、上記
サンプルのビット数を12で割りサンプルに割り当てる
ビット数を102ビットにした。上記実際の量子化ビッ
ト数の式1よりビット配分テーブルでの総ビット数は2
4を引いて78となる。これを24サブバンドに振り分
ける。図10に24のサブバンド(サブバンド0〜サブ
バンド23)に振り分けたテーブルの様子を示す。
When 24 subbands are used, the total number of bits of the audio stream of LAYER1 in FIG.
Of the 536 bits, the header 602 is 32 bits, and the bit allocation 603 is 4 bits × 32 subbands = 12
The 8-bit scale factor 604 is 6 bits × 24 subbands = 144 bits. Therefore, sample 60
The number of bits that can be assigned to 5 is the number of bits of the sample = 1536-32-128-144 = 1232 [bits]. As in the first specific example, in LAYER1, in order to process data of 12 samples for each subband, the number of bits of the sample is divided by 12 and the number of bits allocated to the sample is set to 102 bits. From the above equation 1 of the actual quantization bit number, the total number of bits in the bit distribution table is 2
Subtract 4 to get 78. This is allocated to 24 sub-bands. FIG. 10 shows a state of a table allocated to 24 sub-bands (sub-band 0 to sub-band 23).

【0040】図10よりサブバンド0でのビット配分は
8であるため、実際の量子化ビット数は上記(式1)よ
り9ビットで量子化される。この振り分けは最小可聴限
界(聴覚が検知できる音の最小レベルであり音の周波数
に依存する)を基に振り分けたものである。サブバンド
24〜サブバンド31でのビット配分は0であるためこ
れらのサブバンドでは量子化ビット数は0となる。
According to FIG. 10, since the bit allocation in subband 0 is 8, the actual number of quantization bits is quantized by 9 bits according to the above (Equation 1). This distribution is based on the minimum audible limit (the minimum level of sound that can be detected by hearing and depends on the frequency of the sound). Since the bit allocation in the subbands 24 to 31 is 0, the number of quantization bits in these subbands is 0.

【0041】つまり、24サブバンドのみ使用すること
により音声帯域が12KHzまでとなるが、各サブバン
ドに割り当てられる量子化ビット数が増加することにな
る。また、サブバンド分析101、スケーリング部10
2、量子化部104、ビットストリーム生成部105で
は32のサブバンドの中24サブバンドのみしか計算す
る必要がないため更に演算量が削減できる。
That is, by using only the 24 sub-bands, the audio band becomes up to 12 KHz, but the number of quantization bits allocated to each sub-band increases. The sub-band analysis 101 and the scaling unit 10
2. Since the quantization unit 104 and the bit stream generation unit 105 need to calculate only 24 subbands out of 32 subbands, the amount of calculation can be further reduced.

【0042】[0042]

【発明の効果】本発明によれば、毎フレーム求めていた
ビット割り当てをあらかじめテーブルとすることにより
オーディオ圧縮処理の演算量を削減できる。
According to the present invention, the amount of calculation for audio compression processing can be reduced by previously setting a bit allocation obtained for each frame as a table.

【0043】これにより、マイコンを使用してソフトウ
エアで音声圧縮処理を行えるため音声専用のLSIが不必
要となる。
As a result, since audio compression processing can be performed by software using a microcomputer, a dedicated LSI for audio is not required.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明による画像音声圧縮伸長装置の一実施例
を示すブロック図である。
FIG. 1 is a block diagram showing an embodiment of a video / audio compression / decompression device according to the present invention.

【図2】本発明による画像音声圧縮伸長装置の一実施例
を示すブロック図である。
FIG. 2 is a block diagram showing an embodiment of a video / audio compression / decompression device according to the present invention.

【図3】本発明による画像音声圧縮伸長装置の一実施例
を示すブロック図である。
FIG. 3 is a block diagram showing an embodiment of a video / audio compression / decompression device according to the present invention.

【図4】本発明による画像音声圧縮伸長装置の一実施例
を示すシステムブロック図である。
FIG. 4 is a system block diagram showing an embodiment of a video / audio compression / decompression device according to the present invention.

【図5】LAYER1の従来例のブロック図である。FIG. 5 is a block diagram of a conventional example of LAYER1.

【図6】LAYER1のオーディオストリームを説明す
る図である。
FIG. 6 is a diagram illustrating an audio stream of LAYER1.

【図7】LAYER2の従来例のブロック図である。FIG. 7 is a block diagram of a conventional example of LAYER2.

【図8】LAYER2のオーディオストリームを説明す
る図である。
FIG. 8 is a diagram illustrating an audio stream of LAYER2.

【図9】図1で使用するビット配分テーブルである。FIG. 9 is a bit distribution table used in FIG. 1;

【図10】図1で使用するビット配分テーブルである。FIG. 10 is a bit distribution table used in FIG. 1;

【図11】図2で使用するビット配分テーブルである。FIG. 11 is a bit distribution table used in FIG. 2;

【図12】図3で使用するビット配分テーブルである。FIG. 12 is a bit distribution table used in FIG. 3;

【図13】図3で使用するビット配分テーブルである。FIG. 13 is a bit distribution table used in FIG. 3;

【図14】図3で使用するビット配分テーブルである。FIG. 14 is a bit distribution table used in FIG. 3;

【図15】スケールファクタテーブルである。FIG. 15 is a scale factor table.

【図16】スケールファクタ選択情報算出部で使用する
図である。
FIG. 16 is a diagram used in a scale factor selection information calculation unit.

【図17】スケールファクタ選択情報算出部で使用する
図である。
FIG. 17 is a diagram used in a scale factor selection information calculation unit.

【図18】量子化部で量子化精度を示す図である。FIG. 18 is a diagram illustrating quantization accuracy in a quantization unit.

【符号の説明】[Explanation of symbols]

101・・・サブバンド分析部 102・・・スケーリング部 103・・・スケールファクタ選択情報算出部 104・・・ビット配分選択部 105・・・ビット配分テーブル部 106・・・量子化部 107・・・ビットストリーム生成部 108・・・MPEG Audio処理部 101: Subband analysis unit 102: Scaling unit 103: Scale factor selection information calculation unit 104: Bit allocation selection unit 105: Bit allocation table unit 106: Quantization unit 107 -Bit stream generation unit 108 ... MPEG Audio processing unit

───────────────────────────────────────────────────── フロントページの続き (72)発明者 矢次 富美繁 茨城県ひたちなか市稲田1410番地株式会社 日立製作所映像情報メディア事業部内 ──────────────────────────────────────────────────続 き Continuing on the front page (72) Inventor Fumishige Yagi 1410 Inada, Hitachinaka-shi, Ibaraki Pref. Hitachi, Ltd. Visual Information Media Division

Claims (12)

【特許請求の範囲】[Claims] 【請求項1】一定間隔でサンプリングされたデータを一
定サンプル数で処理をし32の帯域に分割するサブバン
ド分析部、サブバンド分析部の出力の最大振幅を正規化
しスケールファクタとするスケーリング部、スケールフ
ァクタの変化量が少ないときには共通化するスケールフ
ァクタ選択情報算出部、ビット配分テーブル部の中から
最適のビット配分テーブルを選択するビット配分選択
部、各サブバンドの量子化ビット数をあらかじめ複数個
のテーブルとしてあるビット配分テーブル部、選択され
たビット配分テーブルとスケールファクタとを用いて前
記サブバンド分析部で処理されたデータを量子化する量
子化部、ヘッダ、ビット配分、SCFSI(SCALEFACTO
R SELECTION IMFORMATION、スケールファクタ選択情
報)、各サブバンドのスケールファクタ、量子化された
データとからオーディオストリームを生成するオーディ
オストリーム生成部とからなることを特徴とする画像音
声圧縮伸長装置。
1. A sub-band analyzer for processing data sampled at a fixed interval with a fixed number of samples and dividing the data into 32 bands, a scaling unit for normalizing the maximum amplitude of the output of the sub-band analyzer and using the scale factor as a scale factor, When the change amount of the scale factor is small, a common scale factor selection information calculation unit, a bit allocation selection unit that selects an optimum bit allocation table from the bit allocation table unit, and a plurality of quantization bits in each subband in advance , A quantization unit for quantizing the data processed by the sub-band analysis unit using a selected bit allocation table and a scale factor, a header, a bit allocation, a SCFSI (SCALEFACTO)
An audio / video compression / decompression device comprising: an audio stream generation unit that generates an audio stream from R SELECTION IMFORMATION, scale factor selection information), a scale factor of each subband, and quantized data.
【請求項2】請求項1に記載のビット配分テーブル部は
フレーム毎に算出するのではなく、あらかじめテーブル
として固定であることを特徴とする画像音声圧縮伸長装
置。
2. The video / audio compression / expansion apparatus according to claim 1, wherein the bit allocation table section is not calculated for each frame, but is fixed as a table in advance.
【請求項3】請求項1に記載のビット配分テーブル部は
最大使用できるサブバンドすべてにビット配分を割り当
ててある複数のテーブルであることを特徴とする画像音
声圧縮伸長装置。
3. The video / audio compression / expansion apparatus according to claim 1, wherein the bit allocation table section is a plurality of tables in which bit allocation is allocated to all of the maximum usable subbands.
【請求項4】請求項1に記載のビット配分テーブル部は
最大使用できるサブバンドの中の数個のサブバンドにビ
ット配分を割り当ててあることを特徴とする画像音声圧
縮伸長装置。
4. The video / audio compression / expansion apparatus according to claim 1, wherein the bit allocation table section allocates bit allocation to several sub-bands among the maximum usable sub-bands.
【請求項5】一定間隔でサンプリングされたデータを一
定サンプル数で処理をし32の帯域に分割するサブバン
ド分析部、サブバンド分析部の出力の最大振幅を正規化
しスケールファクタとするスケーリング部、スケールフ
ァクタの変化量が少ないときには共通化するスケールフ
ァクタ選択情報算出部、各サブバンドの量子化ビット数
をあらかじめテーブルとしてあるビット配分テーブル
部、ビット配分テーブルとスケールファクタとを用いて
前記サブバンド分析部で処理されたデータを量子化する
量子化部、ヘッダ、ビット配分、SCFSI、各サブバ
ンドのスケールファクタ、量子化されたデータとからオ
ーディオストリームを生成するオーディオストリーム生
成部とからなることを特徴とする画像音声圧縮伸長装
置。
5. A sub-band analyzer for processing data sampled at a fixed interval with a fixed number of samples and dividing the data into 32 bands, a scaling unit for normalizing the maximum amplitude of the output of the sub-band analyzer and using the scale factor as a scale factor, When the change amount of the scale factor is small, a scale factor selection information calculation unit to be used in common, a bit allocation table unit in which the number of quantization bits of each subband is previously stored as a table, and the subband analysis using the bit allocation table and the scale factor. A quantization unit for quantizing the data processed by the unit, a header, bit allocation, SCFSI, a scale factor of each subband, and an audio stream generation unit for generating an audio stream from the quantized data. Video / audio compression / decompression device.
【請求項6】請求項5に記載のビット配分テーブル部は
フレーム毎に算出するのではなく、あらかじめテーブル
として固定であることを特徴とする画像音声圧縮伸長装
置。
6. A video / audio compression / decompression apparatus according to claim 5, wherein the bit allocation table section is not calculated for each frame, but is fixed as a table in advance.
【請求項7】請求項5に記載のビット配分テーブル部は
最大使用できるサブバンドすべてにビット配分を割り当
ててあることを特徴とする画像音声圧縮伸長装置。
7. A video / audio compression / decompression apparatus according to claim 5, wherein the bit allocation table section allocates bit allocation to all of the maximum usable subbands.
【請求項8】請求項5に記載のビット配分テーブル部は
最大使用できるサブバンドの中の数個のサブバンドにビ
ット配分を割り当ててあることを特徴とする画像音声圧
縮伸長装置。
8. A video / audio compression / decompression apparatus according to claim 5, wherein the bit allocation table section allocates bit allocation to several sub-bands among the maximum usable sub-bands.
【請求項9】一定間隔でサンプリングされたデータを一
定サンプル数で処理をし32の帯域に分割するサブバン
ド分析部、サブバンド分析部の出力の最大振幅を正規化
しスケールファクタとするスケーリング部、各サブバン
ドの量子化ビット数をあらかじめテーブルとしてあるビ
ット配分テーブル部、ビット配分テーブルとスケールフ
ァクタとを用いて前記サブバンド分析部で処理されたデ
ータを量子化する量子化部、ヘッダ、ビット配分、各サ
ブバンドのスケールファクタ、量子化されたデータとか
らオーディオストリームを生成するオーディオストリー
ム生成部とからなることを特徴とする画像音声圧縮伸長
装置。
9. A sub-band analyzer for processing data sampled at a fixed interval with a fixed number of samples and dividing the data into 32 bands, a scaling unit for normalizing the maximum amplitude of the output of the sub-band analyzer and using the scale factor as a scale factor, A bit allocation table unit that previously stores the number of quantization bits of each subband as a table, a quantization unit that quantizes the data processed by the subband analysis unit using the bit allocation table and the scale factor, a header, and a bit allocation And an audio stream generation unit for generating an audio stream from a scale factor of each sub-band and quantized data.
【請求項10】請求項9に記載のビット配分テーブル部
はフレーム毎に算出するのではなく、あらかじめテーブ
ルとして固定であることを特徴とする画像音声圧縮伸長
装置。
10. A video / audio compression / decompression apparatus according to claim 9, wherein the bit allocation table section is not calculated for each frame, but is fixed as a table in advance.
【請求項11】請求項9に記載のビット配分テーブル部
は32サブバンドすべてにビット配分を割り当ててある
ことを特徴とする画像音声圧縮伸長装置。
11. The video / audio compression / decompression device according to claim 9, wherein the bit allocation table section allocates bit allocation to all 32 subbands.
【請求項12】請求項9に記載のビット配分テーブル部
は32サブバンドの中の数個のサブバンドにビット配分
を割り当ててあることを特徴とする画像音声圧縮伸長装
置。
12. A video / audio compression / expansion apparatus according to claim 9, wherein the bit allocation table section allocates bit allocation to several sub-bands out of 32 sub-bands.
JP36060297A 1997-12-26 1997-12-26 Audio video compander Pending JPH11195995A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP36060297A JPH11195995A (en) 1997-12-26 1997-12-26 Audio video compander

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36060297A JPH11195995A (en) 1997-12-26 1997-12-26 Audio video compander

Publications (1)

Publication Number Publication Date
JPH11195995A true JPH11195995A (en) 1999-07-21

Family

ID=18470120

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36060297A Pending JPH11195995A (en) 1997-12-26 1997-12-26 Audio video compander

Country Status (1)

Country Link
JP (1) JPH11195995A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005338850A (en) * 2004-05-28 2005-12-08 Samsung Electronics Co Ltd Method and device for encoding and decoding digital signal
JP2016218465A (en) * 2011-07-13 2016-12-22 ▲ホア▼▲ウェイ▼技術有限公司Huawei Technologies Co.,Ltd. Method and apparatus for coding and decoding of audio signal

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005338850A (en) * 2004-05-28 2005-12-08 Samsung Electronics Co Ltd Method and device for encoding and decoding digital signal
JP2016218465A (en) * 2011-07-13 2016-12-22 ▲ホア▼▲ウェイ▼技術有限公司Huawei Technologies Co.,Ltd. Method and apparatus for coding and decoding of audio signal
US9984697B2 (en) 2011-07-13 2018-05-29 Huawei Technologies Co., Ltd. Audio signal coding and decoding method and device
JP2018106208A (en) * 2011-07-13 2018-07-05 ▲ホア▼▲ウェイ▼技術有限公司Huawei Technologies Co.,Ltd. Method and apparatus for coding and decoding of audio signal
US10546592B2 (en) 2011-07-13 2020-01-28 Huawei Technologies Co., Ltd. Audio signal coding and decoding method and device
US11127409B2 (en) 2011-07-13 2021-09-21 Huawei Technologies Co., Ltd. Audio signal coding and decoding method and device

Similar Documents

Publication Publication Date Title
KR100242864B1 (en) Digital signal coder and the method
EP2549475B1 (en) Segmenting audio signals into auditory events
JP3390013B2 (en) Encoding and decoding of wideband digital information signals
US6484140B2 (en) Apparatus and method for encoding a signal as well as apparatus and method for decoding signal
JP3297240B2 (en) Adaptive coding system
KR940006356A (en) Apparatus for compressing digital input signals as signal spectral dependent quantization bit assignments and noise spectral dependent quantization bit assignments
US5706392A (en) Perceptual speech coder and method
JP2001343997A (en) Method and device for encoding digital acoustic signal and recording medium
KR100750115B1 (en) Method and apparatus for encoding/decoding audio signal
KR100477701B1 (en) An MPEG audio encoding method and an MPEG audio encoding device
JP3254953B2 (en) Highly efficient speech coding system
JP4359949B2 (en) Signal encoding apparatus and method, and signal decoding apparatus and method
JPH07281697A (en) Audio signal decoder with mpeg specification
JPH11195995A (en) Audio video compander
JPH08307281A (en) Nonlinear quantization method and nonlinear inverse quantization method
JP3465341B2 (en) Audio signal encoding method
CN1447332A (en) Audio processing method and audio processor
JP3297238B2 (en) Adaptive coding system and bit allocation method
JP3201268B2 (en) Voice communication device
KR100287861B1 (en) Device and method of nonuniform quantization for channels in digital audio stereo mode
JP4618823B2 (en) Signal encoding apparatus and method
KR0152016B1 (en) Encoding and decoding system using variable bit allocation
JP3010637B2 (en) Quantization device and quantization method
JPH0750589A (en) Sub-band coding device
JP2000091920A (en) Image audio compressor

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040803

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041130