JP2001356798A - Encoding and decoding device for audio signal - Google Patents
Encoding and decoding device for audio signalInfo
- Publication number
- JP2001356798A JP2001356798A JP2001125699A JP2001125699A JP2001356798A JP 2001356798 A JP2001356798 A JP 2001356798A JP 2001125699 A JP2001125699 A JP 2001125699A JP 2001125699 A JP2001125699 A JP 2001125699A JP 2001356798 A JP2001356798 A JP 2001356798A
- Authority
- JP
- Japan
- Prior art keywords
- data
- hierarchical
- audio signal
- level
- band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】この発明は、オーディオ信号
符号化・復号化装置(以下、「オーディオレコーダ」と
いう)に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an audio signal encoding / decoding device (hereinafter, referred to as "audio recorder").
【0002】[0002]
【従来の技術】現在、小型のオーディオレコーダとして
は、一般に磁気テープを用いたテープレコーダが広く用
いられている。しかしテープレコーダは、複雑なメカニ
カルな部分や電磁変換部分を含むため、小型化には限界
があり、振動に弱い、また、電池寿命が短い、繰り返し
によるメカニカル部の磨耗がある、ランダムアクセスは
困難、録音/再生の立ち上がり速度にも限界がある等と
いった欠点がある。2. Description of the Related Art At present, a tape recorder using a magnetic tape is widely used as a small-sized audio recorder. However, tape recorders include complicated mechanical parts and electromagnetic conversion parts, so there is a limit to miniaturization, weakness to vibration, short battery life, mechanical parts wear due to repetition, random access is difficult However, there are drawbacks such as a limitation in the rising speed of recording / reproduction.
【0003】一方、近年の半導体技術の進歩は目覚まし
く、半導体メモリの大容量化が著しく進んでいる。これ
に伴い、半導体メモリのオーディオ記録や画像記録とい
ったAV分野への応用が種々考えられて来ている。半導
体メモリの音声(オーディオ)記録への応用例は、留守
番電話、各種おもちゃ、また駅のアナウンスマシーン
等、まだ記録時間は短いが、種々の製品に使用されてい
る。On the other hand, the progress of semiconductor technology in recent years has been remarkable, and the capacity of semiconductor memories has been significantly increased. Accordingly, various applications of the semiconductor memory to the AV field such as audio recording and image recording have been considered. Examples of applications of the semiconductor memory to audio (audio) recording are used in various products, such as answering machines, various toys, and announcement machines at stations, which have a short recording time but are still short.
【0004】[0004]
【発明が解決しようとする課題】従来の半導体メモリを
記録媒体としたオーディオレコーダは、オーディオ信号
を一定の情報量のまま記録するように構成されているの
で、記録時間は半導体メモリの容量で決定されてしま
い、記録中にメモリがなくなった場合などは、いったん
録音を中断し、新しい半導体メモリに交換するといった
作業が必要で、大切な情報が欠落する、もしくは、音楽
信号が途中で途切れてしまうといった問題点があった。Since an audio recorder using a conventional semiconductor memory as a recording medium is configured to record an audio signal with a constant information amount, the recording time is determined by the capacity of the semiconductor memory. If the memory is exhausted during recording, it is necessary to temporarily stop recording and replace it with a new semiconductor memory, and important information will be lost or the music signal will be interrupted on the way There was a problem.
【0005】また、従来の磁気テープを用いたテープレ
コーダや半導体メモリを記録媒体としたオーディオレコ
ーダは、オーディオ信号を固定長フレームで記録するよ
うに構成されているので、記録するオーディオデータを
一定のレートに圧縮する高能率符号化方式も、MPEG
のオーディオ符号化方式のように、1フレーム(例えば
384サンプル)のオーディオデータを固定長の符号化
フレームにするように符号化される。ところが、オーデ
ィオデータを所定の音質で圧縮する場合、各フレームの
情報量は異なる。例えば、無音部分はほとんど情報量が
なく、アタック音等の急激な変化を生じる部分では情報
量が多くなる。よって、1フレームの信号を固定長フレ
ームで符号化するような符号化方式では、情報量の少な
いフレームには必要以上のビットが割り当てられ、反対
に情報量の多いフレームには必要なビットが割り当てら
れないといった問題点が生じる。Further, since a conventional tape recorder using a magnetic tape or an audio recorder using a semiconductor memory as a recording medium is configured to record an audio signal in a fixed-length frame, audio data to be recorded is fixed. The high-efficiency encoding method that compresses to the rate is also MPEG
, Audio data of one frame (for example, 384 samples) is encoded into a fixed-length encoded frame. However, when audio data is compressed with a predetermined sound quality, the information amount of each frame is different. For example, a silent portion has little information amount, and a portion where an abrupt change such as an attack sound occurs has a large information amount. Therefore, in a coding method in which a signal of one frame is coded by a fixed-length frame, more bits are allocated to a frame having a small amount of information, and conversely, necessary bits are allocated to a frame having a large amount of information. There is a problem that it cannot be performed.
【0006】この発明は上記のような問題点を解決する
ためになされたもので、所定の容量の半導体メモリには
特に記録時間を設けないでも(勿論目安としての記録時
間はあるが)、録音の中断や音楽信号が途中で途切れる
ことなく、引き続き連続して記録できる半導体メモリオ
ーディオレコーダを得ることを目的とする。SUMMARY OF THE INVENTION The present invention has been made to solve the above-mentioned problem. Even if a semiconductor memory having a predetermined capacity is not provided with a recording time (of course, there is a recording time as a guide), the recording is performed. It is an object of the present invention to obtain a semiconductor memory audio recorder capable of continuously recording without interruption of music and without interruption of a music signal.
【0007】また、高音質でより効率よく半導体メモリ
に記録できる(記録時間を長くできる)半導体メモリオ
ーディオレコーダを得ることを目的とする。It is another object of the present invention to provide a semiconductor memory audio recorder capable of efficiently recording in a semiconductor memory with high sound quality (extending the recording time).
【0008】また、可変長フレームで記録されている半
導体メモリから記録データを高速再生することを目的と
する。It is another object of the present invention to reproduce recorded data from a semiconductor memory recorded in variable length frames at high speed.
【0009】更に、半導体メモリに記録されたデータか
ら無音部分等の不要な部分を飛ばし、必要なデータが記
録されている部分のみを再生することにより「早聞き」
が行える半導体メモリオーディオレコーダを得ることを
目的とする。Further, unnecessary portions such as silent portions are skipped from the data recorded in the semiconductor memory, and only the portion in which the necessary data is recorded is reproduced, thereby achieving "early listening".
It is an object of the present invention to obtain a semiconductor memory audio recorder capable of performing the following.
【0010】[0010]
【課題を解決するための手段】この発明に係るオーディ
オ信号符号化・復号化装置は、入力したディジタルオー
ディオ信号を周波数帯域に対応した変換係数に変換する
周波数変換手段と、得られた変換係数を聴覚心理特性に
基づくレベル変化に応じて分割することにより、人間の
聴覚特性に基づく優先順位の付けられたn個(nは2以
上の自然数)の第1〜第n符号化デ−タを生成する階層
化/量子化手段を備えたものである。SUMMARY OF THE INVENTION An audio signal encoding / decoding device according to the present invention comprises: frequency conversion means for converting an input digital audio signal into a conversion coefficient corresponding to a frequency band; By dividing according to the level change based on the psychoacoustic characteristics, n-th (n is a natural number of 2 or more) first to n-th encoded data items with priorities based on the human auditory characteristics are generated. This is provided with a layering / quantizing means for performing the above.
【0011】また、入力したディジタルオーディオ信号
を周波数帯域に対応した変換係数に変換する周波数変換
手段と、得られた変換係数を周波数の高低ならびに量子
化レベルの大小をパラメータとして分割し、人間の聴覚
特性に基づく優先順位の付けられたn個(nは2以上の
自然数)の第1〜第n符号化デ−タを生成する階層化/
量子化手段を備えたものである。Further, a frequency conversion means for converting an input digital audio signal into a conversion coefficient corresponding to a frequency band, and dividing the obtained conversion coefficient by using the frequency level and the quantization level as parameters to obtain a human auditory sense. Hierarchization for generating n (n is a natural number of 2 or more) first to n-th encoded data items with priorities based on characteristics
It is provided with quantization means.
【0012】また、入力したディジタルオーディオ信号
を周波数帯域に対応した変換係数に変換する周波数変換
手段と、得られた変換係数に対して以下に示すル−ルに
従う階層化及び量子化を施すことでn個(nは2以上の
自然数)の階層レベルに分割した符号化データを得る階
層化/量子化手段を備えたものである。 1.変換係数のうち、その周波数帯域が所定の周波数f
1までの変換係数であって、かつ、その量子化レベルが
MSB側から所定のビット数b1までの変換係数を選択
し、これを階層レベル1の符号化デ−タS1とする。 2.変換係数のうち、その周波数帯域が所定の周波数f
2(f2≧f1)までの変換係数であって、かつ、その
量子化レベルがMSB側から所定のビット数b2(b2
≧b1)までの変換係数を選択し、さらに、この信号か
ら階層レベル1の変換係数を差し引いた残差信号を階層
レベル2の符号化データS2とする。 3.変換係数のうち、その周波数帯域が所定の周波数f
n(fn≧fn−1)までの変換係数であって、かつ、
その量子化レベルがMSB側から所定のビット数bn
(bn≧bn−1)までの変換係数を選択し、さらに、
この信号から階層レベル1乃至階層レベルn−1の変換
係数を差し引いた残差信号を階層レベルnの符号化デ−
タSnとする。Further, frequency conversion means for converting an input digital audio signal into a conversion coefficient corresponding to a frequency band, and performing hierarchization and quantization on the obtained conversion coefficient according to the following rules. It is provided with hierarchical / quantizing means for obtaining encoded data divided into n (n is a natural number of 2 or more) hierarchical levels. 1. Of the transform coefficients, the frequency band is a predetermined frequency f
A transform coefficient whose transform level is up to 1 and whose quantization level is from the MSB side to a predetermined bit number b1 is selected, and this is set as coded data S1 of the hierarchical level 1. 2. Of the transform coefficients, the frequency band is a predetermined frequency f
2 (f2 ≧ f1), and the quantization level of the transform coefficient is a predetermined number of bits b2 (b2
The transform coefficients up to ≧ b1) are selected, and the residual signal obtained by subtracting the transform coefficient of the hierarchical level 1 from this signal is used as the encoded data S2 of the hierarchical level 2. 3. Of the transform coefficients, the frequency band is a predetermined frequency f
n (fn ≧ fn−1), and
The quantization level is a predetermined number of bits bn from the MSB side.
Select conversion coefficients up to (bn ≧ bn−1).
The residual signal obtained by subtracting the transform coefficients of the hierarchical level 1 to the hierarchical level n-1 from this signal is converted into the encoded data of the hierarchical level n.
Data Sn.
【0013】また、入力したディジタルオーディオ信号
を周波数帯域に対応した変換係数に変換する周波数変換
手段と、得られた変換係数から、聴覚心理特性に基づく
可聴信号成分を抽出するとともに、以下に示すル−ルに
従う階層化及び量子化を施してn個(nは2以上の自然
数)の階層レベルに分割した符号化データを得る階層化
/量子化手段を備えたものである。 1.可聴信号成分の変換係数のうち、その周波数帯域が
所定の周波数f1までの変換係数を選択し、これを階層
レベル1の符号化デ−タS1とする。 2.可聴信号成分の変換係数のうち、その周波数帯域が
所定の周波数f2(f2≧f1)までの変換係数を選択
し、さらに、この信号から階層レベル1の変換係数を差
し引いた残差信号を階層レベル2の符号化データS2と
する。 3.可聴信号成分の変換係数のうち、その周波数帯域が
所定の周波数fn(fn≧fn−1)までの変換係数を
選択し、さらに、この信号から階層レベル1乃至階層レ
ベルn−1の変換係数を差し引いた残差信号を階層レベ
ルnの符号化デ−タSnとする。Further, frequency conversion means for converting an input digital audio signal into a conversion coefficient corresponding to a frequency band, an audible signal component based on psychoacoustic characteristics is extracted from the obtained conversion coefficient, and And a hierarchical / quantizing means for obtaining encoded data divided into n (n is a natural number equal to or greater than 2) hierarchical levels by performing hierarchical processing and quantization according to the following rules. 1. Among the transform coefficients of the audible signal component, a transform coefficient whose frequency band is up to a predetermined frequency f1 is selected, and this is used as encoded data S1 of the hierarchical level 1. 2. Among the transform coefficients of the audible signal component, a transform coefficient whose frequency band is up to a predetermined frequency f2 (f2 ≧ f1) is selected, and a residual signal obtained by subtracting the transform coefficient of the hierarchical level 1 from this signal is converted to the hierarchical level. 2 coded data S2. 3. Among the conversion coefficients of the audible signal component, a conversion coefficient whose frequency band is up to a predetermined frequency fn (fn ≧ fn−1) is selected, and further, from this signal, conversion coefficients of the hierarchical levels 1 to n−1 are determined. The subtracted residual signal is used as encoded data Sn of the hierarchical level n.
【0014】また、階層レベルへの分割が聴覚心理特性
に基づくレベル変化に関連して行なわれるものである。
また、入力したディジタルオーディオ信号を所定サイズ
のブロックに分割する分割手段を具備し、周波数変換手
段は分割した各ブロックに対して変換を施すものであ
る。Further, division into hierarchical levels is performed in relation to level changes based on psychoacoustic characteristics.
In addition, the apparatus includes a dividing unit for dividing the input digital audio signal into blocks of a predetermined size, and the frequency converting unit converts each divided block.
【0015】また、周波数変換された変換係数を聴覚心
理特性に基づくレベル変化に応じて分割することによ
り、人間の聴覚特性に基づく階層的な優先順位が与えら
れた階層符号化オーディオデ−タと該階層符号化オーデ
ィオデ−タの階層レベルの識別コ−ドとを入力として、
該識別コ−ドに基づき階層符号化オーディオデ−タをそ
の階層レベルに応じて復号化することで、周波数帯域に
対応した変換係数を得る復号化手段と、得られた変換係
数に逆変換を施すことにより元のディジタルオーディオ
信号を得る周波数逆変換手段とを備えたものである。ま
た、周波数変換された変換係数を周波数の高低ならびに
量子化レベルの大小をパラメータとして分割することに
より、人間の聴覚特性に基づく階層的な優先順位が与え
られた階層符号化オーディオデ−タと該階層符号化オー
ディオデ−タの階層レベルの識別コ−ドとを入力とし
て、該識別コ−ドに基づき階層符号化オーディオデ−タ
をその階層レベルに応じて復号化することで、周波数帯
域に対応した変換係数を得る復号化手段と、得られた変
換係数に逆変換を施すことにより元のディジタルオーデ
ィオ信号を得る周波数逆変換手段とを備えたものであ
る。Further, by dividing the frequency-converted transform coefficient according to a level change based on the psychoacoustic characteristics, it is possible to obtain hierarchically encoded audio data to which hierarchical priorities based on human auditory characteristics are given. The identification code at the hierarchical level of the hierarchically encoded audio data is input,
Decoding means for obtaining a transform coefficient corresponding to a frequency band by decoding hierarchically encoded audio data in accordance with the hierarchical level based on the identification code; and performing inverse transform on the obtained transform coefficient. Frequency inversion means for obtaining an original digital audio signal by performing the application. Further, by dividing the frequency-converted transform coefficients using the level of the frequency and the magnitude of the quantization level as parameters, hierarchically encoded audio data to which hierarchical priorities based on human auditory characteristics are given, and By inputting the identification code at the hierarchical level of the hierarchically encoded audio data as input and decoding the hierarchically encoded audio data according to the hierarchical level based on the identification code, the frequency band can be obtained. It comprises decoding means for obtaining a corresponding transform coefficient, and frequency inverse transform means for performing an inverse transform on the obtained transform coefficient to obtain an original digital audio signal.
【0016】また、以下に示すル−ルに従った階層化及
び量子化が施され、人間の聴覚特性に基づく階層的な優
先順位が与えられた階層符号化オーディオデ−タと該階
層符号化オーディオデ−タの階層レベルの識別コ−ドと
を入力として、該識別コ−ドに基づき階層符号化オーデ
ィオデ−タをその階層レベルに応じて復号化すること
で、周波数帯域に対応した変換係数を得る復号化手段
と、得られた変換係数に逆変換を施すことにより元のデ
ィジタルオーディオ信号を得る周波数逆変換手段とを備
えたものである。 1.ディジタルオーディオ信号を周波数変換することで
得られる変換係数のうち、その周波数帯域が所定の周波
数f1までの変換係数であって、かつ、その量子化レベ
ルがMSB側から所定のビット数b1までの変換係数を
選択し、これを階層レベル1の符号化デ−タS1とす
る。 2.変換係数のうち、その周波数帯域が所定の周波数f
2(f2≧f1)までの変換係数であって、かつ、その
量子化レベルがMSB側から所定のビット数b2(b2
≧b1)までの変換係数を選択し、さらに、この信号か
ら階層レベル1の変換係数を差し引いた残差信号を階層
レベル2の符号化デ−タS2とする。 3.変換係数のうち、その周波数帯域が所定の周波数f
n(fn≧fn−1)までの変換係数であって、かつ、
その量子化レベルがMSB側から所定のビット数bn
(bn≧bn−1)までの変換係数を選択し、さらに、
この信号から階層レベル1乃至階層レベルn−1の変換
係数を差し引いた残差信号を階層レベルnの符号化デ−
タSnとする。Also, hierarchically encoded audio data that has been subjected to layering and quantization in accordance with the following rules and given hierarchical priorities based on human auditory characteristics, and the hierarchically encoded audio data: By inputting the identification code at the hierarchical level of the audio data and decoding the hierarchically encoded audio data according to the hierarchical level based on the identification code, the conversion corresponding to the frequency band is performed. It is provided with decoding means for obtaining coefficients, and frequency inverse transform means for performing an inverse transform on the obtained transform coefficients to obtain an original digital audio signal. 1. Among the conversion coefficients obtained by frequency-converting the digital audio signal, the frequency band is a conversion coefficient up to a predetermined frequency f1, and the quantization level is a conversion coefficient from the MSB side to a predetermined bit number b1. A coefficient is selected, and this is set as encoded data S1 of the hierarchical level 1. 2. Of the transform coefficients, the frequency band is a predetermined frequency f
2 (f2 ≧ f1), and the quantization level of the transform coefficient is a predetermined number of bits b2 (b2
The transform coefficients up to ≧ b1) are selected, and the residual signal obtained by subtracting the transform coefficient of the hierarchical level 1 from this signal is used as the encoded data S2 of the hierarchical level 2. 3. Of the transform coefficients, the frequency band is a predetermined frequency f
n (fn ≧ fn−1), and
The quantization level is a predetermined number of bits bn from the MSB side.
Select conversion coefficients up to (bn ≧ bn−1).
The residual signal obtained by subtracting the transform coefficients of the hierarchical level 1 to the hierarchical level n-1 from this signal is converted into the encoded data of the hierarchical level n.
Data Sn.
【0017】また、以下に示すル−ルに従った階層化及
び量子化が施され、人間の聴覚特性に基づく階層的な優
先順位が与えられた階層符号化オーディオデ−タと該階
層符号化オーディオデ−タの階層レベルの識別コ−ドと
を入力として、該識別コ−ドに基づき階層符号化オーデ
ィオデ−タをその階層レベルに応じて復号化すること
で、周波数帯域に対応した変換係数を得る復号化手段
と、得られた変換係数に逆変換を施すことにより元のデ
ィジタルオーディオ信号を得る周波数逆変換手段とを備
えたものである。 1.人間の聴覚心理特性に基づき抽出された可聴信号成
分の変換係数のうち、その周波数帯域が所定の周波数f
1までの変換係数を選択し、これを階層レベル1の符号
化デ−タS1とする。 2.可聴信号成分の変換係数のうち、その周波数帯域が
所定の周波数f2(f2≧f1)までの変換係数を選択
し、さらに、この信号から階層レベル1の変換係数を差
し引いた残差信号を階層レベル2の符号化デ−タS2と
する。 3.可聴信号成分の変換係数のうち、その周波数帯域が
所定の周波数fn(fn≧fn−1)までの変換係数を
選択し、さらに、この信号から階層レベル1乃至階層レ
ベルn−1の変換係数を差し引いた残差信号を階層レベ
ルnの符号化デ−タSnとする。Also, hierarchically encoded audio data that has been subjected to layering and quantization in accordance with the following rules and given hierarchical priorities based on human auditory characteristics, and the hierarchically encoded audio data: By inputting the identification code of the hierarchical level of the audio data as input and decoding the hierarchically encoded audio data according to the hierarchical level based on the identification code, conversion corresponding to the frequency band is performed. It comprises decoding means for obtaining coefficients, and frequency inverse transform means for performing an inverse transform on the obtained transform coefficients to obtain an original digital audio signal. 1. Of the transform coefficients of the audible signal component extracted based on the human psychoacoustic characteristics, the frequency band of the transform coefficient is a predetermined frequency f
The transform coefficients up to 1 are selected, and this is used as the encoded data S1 of the hierarchical level 1. 2. From the transform coefficients of the audible signal component, a transform coefficient whose frequency band is up to a predetermined frequency f2 (f2 ≧ f1) is selected, and a residual signal obtained by subtracting a transform coefficient of the hierarchical level 1 from this signal is converted to a hierarchical level. 2 coded data S2. 3. Among the conversion coefficients of the audible signal component, a conversion coefficient whose frequency band is up to a predetermined frequency fn (fn ≧ fn−1) is selected, and further, from this signal, conversion coefficients of the hierarchical levels 1 to n−1 are determined. The subtracted residual signal is used as encoded data Sn of the hierarchical level n.
【0018】また、入力したディジタルオーディオ信号
を周波数帯域に対応した変換係数に変換する周波数変換
手段と、ディジタルオーディオ信号の特性に応じて、再
生時、所定の音質が得られるように、変換係数に割り当
てるビットの割当情報を求めるビット割当手段と、変換
係数をビット割当情報に基づき量子化することで可変長
の量子化デ−タを得る量子化手段と、量子化デ−タと固
定長のビット割当情報から、可変長のフレ−ムデ−タを
得るフォーマッティング手段と、フレ−ムデ−タのフレ
−ム長を求めるフレ−ム長検出手段と、フレ−ム長に応
じて記録媒体への書き込みアドレスを制御するアドレス
制御手段とを備えたものである。Further, frequency conversion means for converting the input digital audio signal into a conversion coefficient corresponding to a frequency band, and a conversion coefficient for converting the conversion coefficient so as to obtain a predetermined sound quality at the time of reproduction according to the characteristics of the digital audio signal. Bit allocation means for obtaining allocation information of bits to be allocated, quantization means for obtaining variable-length quantized data by quantizing a transform coefficient based on bit allocation information, quantized data and fixed-length bits Formatting means for obtaining variable-length frame data from the allocation information; frame-length detecting means for obtaining the frame length of the frame data; and writing to a recording medium according to the frame length. Address control means for controlling an address.
【0019】また、ビット割当手段は、変換係数を周波
数帯域に応じて分割した各帯域の変換係数のエネルギ−
を求める帯域分割エネルギ−検出手段と、各帯域のエネ
ルギ−に基づいて各帯域の許容ノイズレベルを求める許
容ノイズレベル検出手段と、帯域分割エネルギ−検出手
段で求めた各帯域のエネルギ−と許容ノイズレベル検出
手段で求めた各帯域の許容ノイズレベルとの差から各帯
域に分割された変換係数に割り当てるビット数を求める
割当ビット検出手段とを備えたものである。Further, the bit allocating means converts the energy of the transform coefficient of each band obtained by dividing the transform coefficient according to the frequency band.
, An allowable noise level detecting means for obtaining an allowable noise level of each band based on the energy of each band, and an energy and an allowable noise of each band obtained by the band dividing energy detecting means. Allocation bit detection means for obtaining the number of bits to be allocated to the transform coefficient divided into each band from the difference between the allowable noise level of each band obtained by the level detection means.
【0020】また、入力したディジタルオーディオ信号
を複数のサブバンドデ−タに分割するサブバンド分割手
段と、ディジタルオーディオ信号の特性に応じて、再生
時、所定の音質が得られるように、各サブバンドデ−タ
に割り当てるビット割当情報を求めるビット割当手段
と、各サブバンドデ−タをビット割当情報に基づき量子
化することで可変長の量子化デ−タを得る量子化手段
と、量子化デ−タと固定長のビット割当情報から、可変
長のフレ−ムデ−タを得るフォ−マッティング手段と、
フレ−ムデ−タのフレ−ム長を求めるフレ−ム長検出手
段と、フレ−ム長に応じて記録媒体への書き込みアドレ
スを制御するアドレス制御手段とを備えたものである。Further, a sub-band dividing means for dividing the input digital audio signal into a plurality of sub-band data, and each sub-band data according to the characteristics of the digital audio signal so as to obtain a predetermined sound quality during reproduction. Bit allocating means for obtaining bit allocation information to be allocated to the sub-band, quantizing means for quantifying each subband data based on the bit allocation information to obtain variable length quantized data, quantized data and fixed length Formatting means for obtaining variable-length frame data from the bit allocation information of
It comprises frame length detecting means for obtaining the frame length of frame data, and address control means for controlling a write address on a recording medium in accordance with the frame length.
【0021】また、オーディオ信号の特性に応じて可変
長に量子化された量子化デ−タと該量子化デ−タの量子
化を決定する固定長のビット割当情報とからなるオーデ
ィオ信号復号化装置であって、フレ−ムデ−タから固定
長のビット割当情報を抽出し、得られたビット割当情報
からフレ−ムデ−タのフレ−ム長を求めるビット割当情
報およびフレ−ム長検出手段と、得られたフレ−ム長に
基づきフレ−ムデ−タから可変長に量子化された量子化
デ−タを抽出し、抽出した量子化データをビット割当情
報に基づき逆量子化する逆量子化手段とを備えたもので
ある。また、オーディオ信号の特性に応じて可変長に量
子化された量子化デ−タと該量子化デ−タの量子化を決
定する固定長のビット割当情報とからなるフレ−ムデ−
タから、可変長に量子化された量子化デ−タを抽出して
復号化するオーディオ信号復号化装置であって、フレ−
ムデ−タから固定長のビット割当情報を抽出し、得られ
たビット割当情報から可変長に量子化された量子化デ−
タに割り当てられたビット数を求め、該ビット数が所定
のしきい値を越えるフレ−ムデ−タを選択する再生フレ
−ム選択手段と、選択したフレ−ムデ−タから可変長に
量子化された量子化デ−タを抽出し、抽出した量子化デ
ータをビット割当情報に基づき逆量子化する逆量子化手
段とを備えたものである。An audio signal decoding system comprising quantized data quantized to a variable length in accordance with the characteristics of the audio signal and fixed-length bit allocation information for determining the quantization of the quantized data. An apparatus for extracting fixed-length bit allocation information from frame data, obtaining bit allocation information for obtaining the frame length of the frame data from the obtained bit allocation information, and frame length detecting means. Inverse quantum for extracting quantized data quantized to a variable length from the frame data based on the obtained frame length, and inversely quantizing the extracted quantized data based on the bit allocation information. Means. Also, frame data composed of quantized data quantized to a variable length according to the characteristics of the audio signal and fixed-length bit allocation information for determining the quantization of the quantized data.
An audio signal decoding device for extracting and decoding quantized data quantized to a variable length from data, comprising:
The fixed-length bit allocation information is extracted from the data, and the quantized data quantized to a variable length from the obtained bit allocation information.
Reproduction frame selecting means for obtaining the number of bits allocated to the data and selecting the frame data in which the number of bits exceeds a predetermined threshold value, and quantizing the selected frame data to a variable length. Inverse quantization means for extracting the quantized data thus obtained and inversely quantizing the extracted quantized data based on the bit allocation information.
【0022】[0022]
【発明の実施の形態】実施の形態1.以下、この発明の
実施の形態1を図について説明する。実施の形態1で
は、説明を簡単化するためにオーディオ符号化の階層符
号ブロック分割数を2として説明するが、分割数が増え
た場合でも、基本的な考え方は同じである。図1におい
て、1はオーディオ信号の入力端子、2は次段で必要な
オーディオレベルに合わせるオーディオアンプ、3はオ
ーディオ信号をディジタル信号に変換するA/D変換
器、4はディジタルオーディオ信号の階層符号化を行う
階層符号化器、5はオーディオ信号の記録媒体である半
導体メモリ、6は半導体メモリ5に階層符号化器4から
のオーディオ信号を所定のアドレスへ書き込み、また、
所定のアドレスからオーディオ信号を読み出して階層復
号化器7に送り出すメモリアドレス制御器、7は階層符
号化器4で符号化されたオーディオ信号を復号する階層
復号化器、8はディジタルオーディオ信号をアナログオ
ーディオ信号に変換するD/A変換器、9はD/A変換
器の出力を次段で必要なオーディオレベルに合わせるオ
ーディオアンプ、10はオーディオ信号の出力端子、1
4はクロック発生器である。DESCRIPTION OF THE PREFERRED EMBODIMENTS Embodiment 1 Hereinafter, a first embodiment of the present invention will be described with reference to the drawings. In the first embodiment, for the sake of simplicity, the number of hierarchical code block divisions for audio encoding will be described as 2. However, the basic concept is the same even when the number of divisions increases. In FIG. 1, reference numeral 1 denotes an input terminal of an audio signal, 2 denotes an audio amplifier for adjusting a required audio level in the next stage, 3 denotes an A / D converter for converting an audio signal into a digital signal, and 4 denotes a hierarchical code of the digital audio signal. 5, a semiconductor memory that is a recording medium for audio signals, 6 writes an audio signal from the hierarchical encoder 4 to a predetermined address in the semiconductor memory 5, and
A memory address controller for reading an audio signal from a predetermined address and sending it to a hierarchical decoder 7; a hierarchical decoder 7 for decoding the audio signal encoded by the hierarchical encoder 4; A D / A converter 9 for converting to an audio signal, 9 is an audio amplifier for adjusting the output of the D / A converter to a required audio level in the next stage, 10 is an audio signal output terminal, 1
4 is a clock generator.
【0023】図2,図3は、階層符号化器4において、
ディジタル化されたオーディオ信号を、2分割符号化を
行う構成例を示した図である。図2の構成例では、16
ビットのディジタルオーディオ信号を、上位8ビットを
階層符号ブロック1,下位8ビットを階層符号ブロック
2として分割する。FIG. 2 and FIG. 3 show that the hierarchical encoder 4
FIG. 3 is a diagram illustrating a configuration example in which a digitized audio signal is subjected to two-division encoding. In the configuration example of FIG.
In the digital audio signal of bits, the upper 8 bits are divided into a hierarchical code block 1 and the lower 8 bits are divided into a hierarchical code block 2.
【0024】また、図3の構成例では、4分割のサブバ
ンド分割フィルタ15でオーディオ周波数を4つのサブ
バンドに分割し、ビット割当器16で、各サブバンド毎
に階層符号ブロック1と階層符号ブロック2へのビット
割当てを定め、各サブバンド毎の階層符号ブロック1と
階層符号ブロック2の信号量の合計が、2分割となるよ
うにコントロールする。In the configuration example shown in FIG. 3, the audio frequency is divided into four sub-bands by a sub-band dividing filter 15 for four divisions, and a hierarchical code block 1 and a hierarchical code Bit allocation to block 2 is determined, and control is performed so that the total signal amount of hierarchical code block 1 and hierarchical code block 2 for each subband is divided into two.
【0025】図2,図3の何れの構成例の場合も、量子
化ビットの上位ビット側を優先順位の高い階層符号ブロ
ック1に割り当てることで、下位ビットの階層符号ブロ
ック2が欠落しても、、音質は劣化するが、オーディオ
信号を再現することができる。In each of the configuration examples shown in FIGS. 2 and 3, by assigning the higher-order bit side of the quantized bits to the higher-order hierarchical code block 1, even if the lower-order hierarchical code block 2 is lost. Although the sound quality is deteriorated, the audio signal can be reproduced.
【0026】また、図3の帯域分割を行う方式では、人
の聴感特性を考慮してビットの割当てを最適にすること
で、オーディオ信号が階層符号ブロック1だけになった
場合でも、音質の劣化を極力少なくすることができる。Further, in the band division method shown in FIG. 3, by optimizing the bit allocation in consideration of the human audibility, even if the audio signal is only the hierarchical code block 1, the sound quality is deteriorated. Can be reduced as much as possible.
【0027】図4は、半導体メモリ5上のメモリマップ
を示しており、オーディオ階層符号ブロックの識別コー
ドを記録する制御データエリアと、オーディオ信号を記
録するオーディオエリアAと、オーディオエリアBから
なる。図5は、オーディオ信号の半導体メモリ5への記
録状況を、時間経過にしたがって示したものである。FIG. 4 shows a memory map on the semiconductor memory 5, which comprises a control data area for recording an identification code of an audio hierarchical code block, an audio area A for recording an audio signal, and an audio area B. FIG. 5 shows how audio signals are recorded in the semiconductor memory 5 over time.
【0028】次に、まず、記録系の動作について説明す
る。図1において、入力端子1に入力されたオーディオ
信号は、オーディオアンプ2で所定のレベルに増幅さ
れ、A/D変換器3にてディジタル信号に変換され、階
層符号化器4に入力される。階層符号化器4では、ディ
ジタル化されたオーディオ信号を図2または図3に示し
た方法により、階層符号ブロック1に記録する信号と、
階層符号ブロック2に記録する信号の2つに分割する。Next, the operation of the recording system will be described first. In FIG. 1, an audio signal input to an input terminal 1 is amplified to a predetermined level by an audio amplifier 2, converted to a digital signal by an A / D converter 3, and input to a hierarchical encoder 4. In the hierarchical encoder 4, a signal for recording the digitized audio signal in the hierarchical code block 1 by the method shown in FIG.
The signal to be recorded in the hierarchical code block 2 is divided into two.
【0029】2つに分割された符号化信号は、半導体メ
モリ5に、図4に示すメモリマップのように記録され
る。記録の流れは、記録開始時は、図5(a)に示すよ
うにオーディオエリアAには符号器4で符号化された階
層符号ブロック1が、また、オーディオエリアBには階
層符号ブロック2が順番に記録される。図5(b)はオ
ーディオ信号が順次記録され、メモリ5がほぼ満杯にな
った状態を示している。The coded signal divided into two is recorded in the semiconductor memory 5 as shown in a memory map of FIG. At the start of recording, as shown in FIG. 5A, at the start of recording, the hierarchical code block 1 encoded by the encoder 4 is stored in the audio area A, and the hierarchical code block 2 is stored in the audio area B. Recorded in order. FIG. 5B shows a state in which audio signals are sequentially recorded and the memory 5 is almost full.
【0030】図5(c)は、さらに連続したオーディオ
信号を記録するために、優先順位の低い階層符号ブロッ
ク2のオーディオ信号の書き込みエリア(この場合はオ
ーディオエリアB)に上書きする形で、引き続き、オー
ディオ信号の階層符号ブロック1のみが記録される。FIG. 5 (c) shows an example of overwriting an audio signal writing area (in this case, audio area B) of the lower priority hierarchical code block 2 in order to record a further continuous audio signal. , Only the hierarchical code block 1 of the audio signal is recorded.
【0031】図5(d)は、このような上書きが行われ
て、記録エリアが満杯になった状態を示している。メモ
リアドレス制御器6は、メモリ容量検出器13からの信
号に応じて、図5で説明した流れになるように、メモリ
アドレスをコントロールする。また、階層レベルの識別
コードは、図5(a),(b)の場合は「階層レベル
1」ということで階層符号ブロック“00”が、また、
図5(c),(d)の場合は「階層レベル2」というこ
とで階層符号ブロック“01”が記録される。FIG. 5D shows a state where the overwriting is performed and the recording area is full. The memory address controller 6 controls the memory address in accordance with the signal from the memory capacity detector 13 so that the flow described with reference to FIG. 5A and 5B, the identification code at the hierarchical level is “hierarchical level 1”, and the hierarchical code block “00” is used.
In FIGS. 5C and 5D, the hierarchical code block “01” is recorded as “hierarchical level 2”.
【0032】再生時には、まず、階層レベル識別コード
再生器12で階層レベルの識別コードのチェックを行
い、“00”つまり「階層レベル1」の場合には、半導
体メモリ5のオーディオエリアAとオーディオエリアB
を順番にアクセスして、再生オーディオ信号を階層復号
化器7に出力する。また、階層レベルの識別コードが
“01”つまり「階層レベル2」の場合には、半導体メ
モリ5のオーディオエリアAから順番にアクセスして
(オーディオエリアAが終わると続けてオーディオエリ
アBをアクセスする)、再生オーディオ信号を階層復号
化器7に出力する。At the time of reproduction, first, a hierarchy level identification code is checked by the hierarchy level identification code reproducing unit 12. B
, And outputs the reproduced audio signal to the hierarchical decoder 7. When the identification code of the hierarchy level is “01”, that is, “hierarchy level 2”, the audio area A of the semiconductor memory 5 is accessed sequentially (the audio area B is accessed after the audio area A ends). ), And outputs the reproduced audio signal to the hierarchical decoder 7.
【0033】階層復号化器7では、半導体メモリ5から
の再生信号を「階層レベル1」、「階層レベル2」のい
ずれの場合もディジタルオーディオ信号を復号するよう
に構成されている(「階層レベル2」の再生信号の場合
は、階層レベル識別符号コードにより階層符号ブロック
2の信号に零を入力すればよい)。The hierarchical decoder 7 is configured to decode the reproduced signal from the semiconductor memory 5 into a digital audio signal in any of "hierarchical level 1" and "hierarchical level 2"("hierarchicallevel"). In the case of the reproduction signal of "2", zero may be input to the signal of the hierarchical code block 2 by the hierarchical level identification code code).
【0034】階層復号化器7の出力は、D/A変換器8
によりアナログオーディオ信号に変換され、オーディオ
アンプ9で所定のオーデイオレベルに増幅されて、出力
端子10から出力される。なお、サンプリングクロック
等の記録再生時にシステム全体で必要なクロックは、ク
ロック発生器14より供給される。The output of the hierarchical decoder 7 is a D / A converter 8
Is converted into an analog audio signal, amplified by the audio amplifier 9 to a predetermined audio level, and output from the output terminal 10. Note that a clock necessary for the entire system at the time of recording and reproduction, such as a sampling clock, is supplied from the clock generator 14.
【0035】実施の形態2.図6は、この発明の実施の
形態2のブロック回路で、図1と同一符号はそれぞれ同
一部分を示しており、17は階層符号化器4で符号化さ
れたオーディオ信号の全てを記録できる記録容量に余裕
のある第1の半導体メモリ、18はオーディオデータ保
存用として所定の容量を持つ(着脱式ができるメモリカ
ード等)第2の半導体メモリ、19は階層レベル変換器
で、第1の半導体メモリ17から第2の半導体メモリ1
8にオーディオ信号をダビングする際、メモリ容量検出
器13から出力されるオーディオ記録時間に応じて、第
2の半導体メモリ18のメモリ容量に丁度合うように、
ブロック符号化の優先順位の低い階層符号ブロックを欠
落させることによって、全体の信号量をコントロールす
る。Embodiment 2 FIG. 6 shows a block circuit according to a second embodiment of the present invention, in which the same reference numerals as in FIG. 1 denote the same parts, and reference numeral 17 denotes a recording capable of recording all of the audio signals encoded by the hierarchical encoder 4. A first semiconductor memory having a sufficient capacity, 18 is a second semiconductor memory having a predetermined capacity for storing audio data (such as a removable memory card), and 19 is a hierarchical level converter, which is a first semiconductor memory. From the memory 17 to the second semiconductor memory 1
When dubbing the audio signal to the memory 8, the memory capacity of the second semiconductor memory 18 is justified according to the audio recording time output from the memory capacity detector 13.
The entire signal amount is controlled by omitting layer code blocks having lower priority in block coding.
【0036】20は第1のメモリアドレス制御器で、第
1の半導体メモリ17に階層符号化器4からのオーディ
オ信号を所定のアドレスに記録する制御、および、第1
の半導体メモリ17から第2の半導体メモリ18にダビ
ングする場合に、転送速度を速くして第1の半導体メモ
リ17のデータを読み出す制御を行う。21は第2のメ
モリアドレス制御器で、第2の半導体メモリからオーデ
ィオ信号を所定のアドレスから読み出す制御、および、
第1の半導体メモリ17から第2の半導体メモリ18に
ダビングする場合に転送速度を速くして第2の半導体メ
モリにデータを書き込む制御を行う。Reference numeral 20 denotes a first memory address controller, which controls the audio signal from the hierarchical encoder 4 to be recorded at a predetermined address in the first semiconductor memory 17;
When dubbing from the first semiconductor memory 17 to the second semiconductor memory 18, the transfer speed is increased and control for reading data from the first semiconductor memory 17 is performed. Reference numeral 21 denotes a second memory address controller which controls reading of an audio signal from a second semiconductor memory from a predetermined address;
When dubbing from the first semiconductor memory 17 to the second semiconductor memory 18, the transfer speed is increased to control writing data to the second semiconductor memory.
【0037】次に、記録系の動作について説明する。入
力端子1に入力されたオーディオ信号は、オーディオア
ンプ2で所定のレベルに増幅され、A/D変換器3にて
ディジタル信号に変換され、階層符号化器4に入力され
る。階層符号化器4では、図2または図3に示したよう
に、優先順位を持った2つの階層符号ブロックの信号に
符号化される。ここで優先順位の低い階層符号ブロック
が欠落して優先順位の高い階層符号ブロックのみとなっ
た場合でも、音質は劣化するもののオーディオ信号が正
常に再生できることは、実施の形態1と同様である。
2つのブロックに分割されて符号化されたオーディオ信
号は、第1のメモリアドレス制御器20からのアドレス
信号に従って第1の半導体メモリ17に記録される。第
1の半導体メモリ17は容量的に余裕があるので、入力
されたオーディオ信号は全て記録されることになる。Next, the operation of the recording system will be described. The audio signal input to the input terminal 1 is amplified to a predetermined level by the audio amplifier 2, converted to a digital signal by the A / D converter 3, and input to the hierarchical encoder 4. In the hierarchical encoder 4, as shown in FIG. 2 or FIG. 3, the signals are encoded into signals of two hierarchical code blocks having priority. Here, as in the first embodiment, even when a hierarchical code block with a low priority is lost and only a hierarchical code block with a high priority is left, the audio signal can be normally reproduced though the sound quality is deteriorated, as in the first embodiment.
The audio signal divided into two blocks and encoded is recorded in the first semiconductor memory 17 according to the address signal from the first memory address controller 20. Since the first semiconductor memory 17 has a sufficient capacity, all the input audio signals are recorded.
【0038】次に、第1の半導体メモリ17から第2の
半導体メモリ18へのダビング動作について説明する。
メモリ容量検出器13は、第1の半導体メモリ17に書
き込まれたオーディオ信号の記録時間を検出し、この検
出信号を階層レベル変換器19に送り、ここで第2の半
導体メモリ18のメモリ容量と比較され、信号を減らす
必要があるか否か、あるとすればどの程度削減させれば
よいかを判断し、削減する場合には比率に応じて階層レ
ベルを変える。つまり、優先順位の低い階層符号ブロッ
クを欠落させる。Next, the dubbing operation from the first semiconductor memory 17 to the second semiconductor memory 18 will be described.
The memory capacity detector 13 detects the recording time of the audio signal written in the first semiconductor memory 17 and sends this detection signal to the hierarchical level converter 19, where the memory capacity of the second semiconductor memory 18 is determined. A comparison is made to determine whether or not the signal needs to be reduced, and if so, how much the signal should be reduced. If so, the hierarchical level is changed according to the ratio. That is, a hierarchical code block having a low priority is deleted.
【0039】この実施の形態2では、データの分割数を
2としているが、この分割数を多くとればとるほど記録
時間と音質の劣化度合いをきめ細やかに制御することが
でき、より半導体メモリを効率よく使用することができ
る(記録時間と音質の劣化度合いは直線的な関係にな
る)。In the second embodiment, the number of data divisions is set to 2. However, as the number of divisions increases, the recording time and the degree of deterioration in sound quality can be more finely controlled. It can be used efficiently (the recording time and the degree of deterioration of sound quality have a linear relationship).
【0040】さらに、この階層レベルを階層レベル識別
コード発生器11に送り、識別コードも同時に第2の半
導体メモリ18の制御エリアに記録する。また、ダビン
グ時には、第1のメモリアドレス制御器20と第2のメ
モリアドレス制御器21のアドレッシングを高速に動作
させ、メモリのアクセススピードの許す範囲内で高速ダ
ビングさせる。この高速ダビングの機能は、記録媒体
(半導体メモリ)が2組あるにもかかわらず、あたかも
1つで記録しているように見せるために重要な機能であ
る。Further, this hierarchy level is sent to the hierarchy level identification code generator 11, and the identification code is simultaneously recorded in the control area of the second semiconductor memory 18. At the time of dubbing, the addressing of the first memory address controller 20 and the second memory address controller 21 is operated at high speed, and high-speed dubbing is performed within a range allowed by the memory access speed. This high-speed dubbing function is an important function to make it appear as if recording is performed by one recording medium even though there are two recording media (semiconductor memories).
【0041】再生時には、まず、階層レベル識別コード
再生器12が第2の半導体メモリ18の制御エリアから
識別コードを判定し、その結果を第2のメモリアドレス
制御器21に送る。第2のメモリアドレス制御器21
は、階層レベルに応じて所定のアドレスから順番に第2
の半導体メモリ18から再生信号を読み出す。At the time of reproduction, first, the hierarchy level identification code reproducer 12 determines the identification code from the control area of the second semiconductor memory 18 and sends the result to the second memory address controller 21. Second memory address controller 21
Are the second addresses in order from a predetermined address according to the hierarchy level.
The readout signal is read from the semiconductor memory 18 of FIG.
【0042】階層復号化器7は、いずれの階層レベルの
再生信号であってもそれぞれに応じて復号を行う。階層
復号化器7の出力はD/A変換器8によりアナログオー
ディオ信号に変換され、オーディオアンプ9で所定のオ
ーデイオレベルに増幅されて出力端子10から出力され
る。なお、再生に必要なサンプリングクロック等のクロ
ックは、クロック発生器14から供給される。The hierarchical decoder 7 decodes a reproduced signal of any hierarchical level in accordance with each signal. The output of the hierarchical decoder 7 is converted into an analog audio signal by a D / A converter 8, amplified to a predetermined audio level by an audio amplifier 9, and output from an output terminal 10. Note that a clock such as a sampling clock required for reproduction is supplied from the clock generator 14.
【0043】実施の形態3.以下、この発明の実施の形
態3を図7〜図11について説明する。この実施の形態
3では、階層符号化の階層符号ブロック分割数を4とし
て説明するが、異なる分割数の場合でも考え方は同じで
ある。図7において、図1と同一符号はそれぞれ同一部
分を示しており、22はディジタルオーディオ信号の階
層符号化器、23はメモリアドレス制御器で、半導体メ
モリ5に階層符号化器22からのオーディオ信号を所定
のアドレスへ階層毎に分類して書き込み、また、所定の
アドレスから各階層のオーディオ信号を読み出し、さら
に、半導体メモリ5の容量を検出し、半導体メモリ5が
満杯になると、既に書き込まれたデータのうち上記階層
符号化器22により優先順位の低い階層符号ブロックと
して書き込まれたデータのメモリエリアから順次時間的
に連続したオーディオ信号を上書きするように制御す
る。24は階層符号化器22で符号化さたオーディオ信
号を復号する階層復号化器である。Embodiment 3 Hereinafter, a third embodiment of the present invention will be described with reference to FIGS. In the third embodiment, a description will be given assuming that the number of divisions of the hierarchical code block in the hierarchical coding is 4, but the concept is the same even when the division number is different. In FIG. 7, the same reference numerals as those in FIG. 1 denote the same parts. Reference numeral 22 denotes a hierarchical encoder for digital audio signals, and reference numeral 23 denotes a memory address controller. Is written to a predetermined address for each layer, and an audio signal of each layer is read from the predetermined address. Further, the capacity of the semiconductor memory 5 is detected, and when the semiconductor memory 5 is full, the data is already written. Among the data, control is performed so as to overwrite temporally continuous audio signals from the memory area of the data written as the hierarchical code block having the lower priority by the hierarchical encoder 22. Reference numeral 24 denotes a hierarchical decoder that decodes the audio signal encoded by the hierarchical encoder 22.
【0044】図8,図9は階層符号化器22において、
ディジタルオーディオ信号を4分割して階層符号化を行
う内容を説明するための図である。まず図8において、
入力された原オーディオ信号から信号の分類を行う、つ
まり人間の聴覚特性である最小可聴限により元々聞こえ
ない信号と、マスキング効果により聞こえなくなった信
号と、さらに聞こえる信号の3つに大別する。次にこの
中から聞こえる信号のみを選択し、図9に示す周波数特
性に従って、さらに4つの階層レベルに分割することを
示している。FIGS. 8 and 9 show the hierarchical encoder 22.
FIG. 4 is a diagram for describing the content of performing hierarchical coding by dividing a digital audio signal into four parts. First, in FIG.
The signals are classified based on the input original audio signal. That is, the signals are roughly classified into three types: a signal that cannot be heard originally due to the minimum audibility, which is a human auditory characteristic, a signal that cannot be heard due to the masking effect, and a signal that can be heard further. Next, only signals that can be heard from these are selected, and are further divided into four hierarchical levels according to the frequency characteristics shown in FIG.
【0045】図10は階層レベル4の階層符号化器22
の構成、および半導体メモリ5への記録方式について説
明するための図で、27はA/D変換器3でディジタル
信号に変換されたオーディオ信号を所定のブロックに帯
域分割する分割フィルタ、28は分割された信号をMD
CTにより直行変換するMDCT変換器、29は入力信
号の変化に応じてMDCT28の変換ブロックサイズを
設定するブロックサイズ設定器、30はMDCT28の
係数を聴覚心理に基づいてクリティカルバンドに従って
グルーピングを行うグルーピング器、31は図8、図9
に示したオーディオ信号の分類によって、聞こえない信
号を除去し、聞こえる信号を4つの階層レベルに階層化
して量子化する階層化/量子化器、32は聞こえる信号
のみをどのように各周波数帯域にビット配分するかを決
めるダイナミックビット配分器、33はMDCT28の
ブロックに応じてスケールファクタを決定するスケール
ファクタ算出器、34は半導体メモリ5に記録するため
に記録フォーマット化するためのフォーマッティング器
である。また、図10の右側には半導体メモリ5に階層
符号化データを記録する概念を示している。FIG. 10 shows the hierarchical encoder 22 of the hierarchical level 4.
Is a diagram for explaining the configuration of the audio signal and the recording method for the semiconductor memory 5, wherein 27 is a division filter for dividing the audio signal converted into a digital signal by the A / D converter 3 into predetermined blocks, and 28 is a division filter. MD signal
MDCT converter for performing orthogonal transformation by CT, 29 is a block size setting unit for setting a conversion block size of MDCT 28 according to a change in an input signal, and 30 is a grouping device for grouping coefficients of MDCT 28 according to a critical band based on psychological psychology. , 31 are FIGS. 8, 9
According to the classification of the audio signal shown in the above, the inaudible signal is removed, and the audible signal is hierarchized into four hierarchical levels and quantized. A dynamic bit allocator 33 for deciding whether to allocate bits, a scale factor calculator 33 for determining a scale factor in accordance with the blocks of the MDCT 28, and a formatting device 34 for formatting a recording for recording in the semiconductor memory 5. On the right side of FIG. 10, the concept of recording hierarchically encoded data in the semiconductor memory 5 is shown.
【0046】図11は半導体メモリ5上のメモリマップ
を示す図で、階層レベルの識別コードを記録する制御デ
ータエリア、オーディオ信号を記録するオーディオエリ
ア(階層レベル1〜階層レベル4)からなる。また、図
11中の(1)から(4)は、オーディオ信号の半導体
メモリ5への記録状態を時間経過に応じて示したもので
ある。つまり(1)は階層レベル4で符号化したオーデ
ィオ信号がメモリ満杯にまで記録された状態、(2)は
(1)の状況を経過し、さらに連続してオーディオ信号
を記録した場合で、階層レベル4の記録エリアに階層レ
ベル1〜3で上書きした状態、(3)は(2)の状況を
経過し、さらに連続してオーディオ信号を記録した場合
で、階層レベル3の記録エリアまで階層レベル1〜2で
上書きした状態、(4)は(3)の状況を経過し、さら
に連続してオーディオ信号を記録した場合で、階層レベ
ル2の記録エリアまで階層レベル1で上書きした状態
(メモリ上の全ての信号が階層レベル1になる)を示し
ている。FIG. 11 is a diagram showing a memory map on the semiconductor memory 5, which is composed of a control data area for recording a hierarchy level identification code and an audio area for recording an audio signal (hierarchical level 1 to hierarchical level 4). In addition, (1) to (4) in FIG. 11 show the recording state of the audio signal in the semiconductor memory 5 as time elapses. That is, (1) shows a state in which an audio signal coded at the hierarchical level 4 is recorded until the memory is full, and (2) shows a case in which the audio signal is recorded continuously after the situation of (1). In the state where the recording area of level 4 is overwritten with the hierarchical levels 1 to 3, the state (3) is the case where the situation of (2) is passed and the audio signal is further continuously recorded. (4) is a state in which the audio signal has been continuously recorded after the situation of (3), and the recording area of the hierarchical level 2 has been overwritten at the hierarchical level 1 (on the memory). Are all at the hierarchical level 1).
【0047】次に、記録時の実施の形態1と異なる部分
の動作について説明する。A/D変換器3にてディジタ
ル信号に変換され、階層符号化器22に入力されたオー
ディオ信号は、階層符号化器22で図8,図9,図10
に示した方法により階層符号化データに変換されて半導
体メモリ5に記録される。この階層符号化器22では、
まず、オーディオ信号を分割フィルタ27により所定の
ブロックに分割し、一方、ブロックサイズ設定器29に
よりMDCTを行うサンプルサイズを決定する。切り出
したサンプルの振幅の変化が少ない場合はMDCTのブ
ロックサイズを大きくし、また振幅の変化が大きい場合
はMDCTのブロックサイズを小さくしてプリエコーの
発生を抑える。Next, the operation of a portion different from that of the first embodiment during recording will be described. The audio signal converted into a digital signal by the A / D converter 3 and input to the hierarchical encoder 22 is output from the hierarchical encoder 22 as shown in FIGS.
Is converted to hierarchically encoded data and recorded in the semiconductor memory 5 by the method shown in FIG. In this hierarchical encoder 22,
First, the audio signal is divided into predetermined blocks by the division filter 27, and a sample size for performing MDCT is determined by the block size setting unit 29. If the change in the amplitude of the extracted sample is small, the block size of the MDCT is increased, and if the change in the amplitude is large, the MDCT block size is reduced to suppress the occurrence of pre-echo.
【0048】MDCT変換器28では、分割フィルタ2
7で分割された周波数帯域毎にMDCTの変換を行い、
各変換係数は聴覚心理に基づいたグルーピング器30に
よりクリティカルバンド毎にグルーピングされ、階層化
/量子化器31により下記に示すルールに従って4つの
帯域に分割される。図9にその帯域とレンジを示す。In the MDCT converter 28, the divided filter 2
Performs MDCT conversion for each frequency band divided by 7,
Each transform coefficient is grouped for each critical band by a grouping unit 30 based on psychoacoustics, and divided into four bands by a hierarchical / quantizer 31 according to the following rules. FIG. 9 shows the band and range.
【0049】1.まず階層レベル1として、複数の周波
数帯域に分割された各係数の中から、低域の係数から所
定の周波数帯域f1までの係数を選択し、かつその係数
の量子化レベルもMSB側から所定のビット数を選択
し、これを階層レベル1の符号化データS1とする。1. First, as the hierarchical level 1, a coefficient from a low-frequency coefficient to a predetermined frequency band f1 is selected from among the coefficients divided into a plurality of frequency bands, and the quantization level of the coefficient is also predetermined from the MSB side. The number of bits is selected, and this is set as encoded data S1 of the hierarchical level 1.
【0050】2.次に階層レベル2として、f1 よりも
高い所定の周波数帯域f2 までの係数を選択し、かつそ
の係数の量子化レベルもMSB側から階層レベル1より
も多い所定のビット数を選択し、この信号から各係数毎
に対応する階層レベル1の係数の信号成分を引いた残差
信号を、階層レベル2の符号化データS2 とする。2. Next, as the hierarchy level 2, a coefficient up to a predetermined frequency band f2 higher than f1 is selected, and the quantization level of the coefficient is also selected from the MSB side to a predetermined bit number larger than the hierarchy level 1, The residual signal obtained by subtracting the signal component of the coefficient of the hierarchical level 1 corresponding to each coefficient from the above is defined as the encoded data S2 of the hierarchical level 2.
【0051】3.次に階層レベル3として、f2よりも
高い所定の周波数帯域f3までの係数を選択し、かつそ
の係数の量子化レベルもMSB側から階層レベル2より
も多い所定のビット数を選択し、この信号から各係数毎
に対応する階層レベル1,2および3の係数の信号成分
を引いた残差信号を、階層レベル3の符号化データS3
とする。3. Next, as the hierarchy level 3, a coefficient up to a predetermined frequency band f3 higher than f2 is selected, and the quantization level of the coefficient is also selected from the MSB side to a predetermined number of bits larger than the hierarchy level 2, and this signal Is obtained by subtracting the signal components of the coefficients of the hierarchical levels 1, 2, and 3 corresponding to each coefficient from the coded data S3 of the hierarchical level 3.
And
【0052】4.同様に、階層レベル4として、f3よ
りも高域の所定の周波数帯域f4までの係数を選択し、
かつその係数の量子化レベルもMSB側から階層レベル
3で選択したよりも多い所定のビット数を選択し、この
信号から各係数毎に対応する階層レベル1、2および3
の係数の信号成分を引いた残差信号を、階層レベル4の
符号化データS4とする。4. Similarly, as hierarchical level 4, a coefficient up to a predetermined frequency band f4 higher than f3 is selected,
Also, the quantization level of the coefficient is selected from the MSB side as a predetermined number of bits larger than that selected at the hierarchical level 3, and from this signal, the hierarchical levels 1, 2 and 3 corresponding to each coefficient are selected.
The residual signal obtained by subtracting the signal component of the coefficient is used as the encoded data S4 of the hierarchical level 4.
【0053】一方、ダイナミックビット配分器32で
は、MDCTのブロック単位で各周波数帯域毎にどのよ
うにビットを配分するかを決定し、またスケールファク
タ算出器33ではMDCTのブロック単位で各係数の最
大値を抽出し、この最大値で各サンプルの値を正規化す
る。フォーマッティング器34では、スケールファク
タ、ビット配分、階層化されたデータ(S1、S2、S
3、S4)の3つをフォーマッティングし、半導体メモ
リ5に送る。On the other hand, the dynamic bit allocation unit 32 determines how bits are allocated to each frequency band in units of MDCT blocks, and the scale factor calculator 33 determines the maximum value of each coefficient in units of MDCT blocks. Extract the value and normalize the value of each sample with this maximum. In the formatting device 34, the scale factor, bit allocation, and hierarchical data (S1, S2, S
3, and S4) are formatted and sent to the semiconductor memory 5.
【0054】半導体メモリ5に送られた階層化されたオ
ーディオ信号は、メモリアドレス制御器23により図1
0右側に示すように、まず、階層レベル4で半導体メモ
リ5に各階層レベル毎に分類して記録していく。半導体
メモリ5が満杯になって記録メモリが無くなると、次に
階層レベル4で書き込まれていたメモリエリアに、連続
したオーディオ信号を階層レベル1〜3で上書きしてい
く。この状態をメモリマップ上で表現したのが図11で
ある。上記の説明は図11(1)→(2)の記録状態を
示したものである。階層レベル識別コード発生器25
は、図11(1)の状態では最大階層レベル4というこ
とで識別コード“11”を、また図11(2)の状態を
最大階層レベル3ということで識別コード“10”を発
生して半導体メモリ5の制御データエリアに記録する。The hierarchized audio signal sent to the semiconductor memory 5 is sent to the memory address controller 23 in FIG.
As shown on the right side of FIG. 0, first, the hierarchical level 4 is classified and recorded in the semiconductor memory 5 for each hierarchical level. When the semiconductor memory 5 becomes full and the recording memory is exhausted, a continuous audio signal is overwritten at the hierarchical levels 1 to 3 in the memory area written at the hierarchical level 4 next. FIG. 11 shows this state on a memory map. The above description shows the recording state of FIG. 11 (1) → (2). Hierarchical level identification code generator 25
Generates an identification code "11" in the state of FIG. 11 (1) for the maximum hierarchy level 4 and an identification code "10" in the state of FIG. It is recorded in the control data area of the memory 5.
【0055】同様に、図11(2)→(3)→(4)と
記録状態が進むのと同時に階層レベルも3→2→1とな
り、記録すべき識別コードも“10”→“01”→“0
0”となる。この場合、記録時間は最終的には半導体メ
モリ5上が階層レベル1のみのオーディオ信号になった
場合が最大であり、各階層レベル(1〜4)の情報量が
同じとすれば、図11(1)の状態よりも記録されたオ
ーディオ品質は劣化するものの記録時間は4倍になる。Similarly, at the same time as the recording state proceeds as shown in FIG. 11 (2) → (3) → (4), the hierarchical level also changes from 3 → 2 → 1, and the identification code to be recorded is “10” → “01”. → "0
0 ". In this case, the recording time is the maximum when the audio signal of the hierarchy level 1 is finally recorded on the semiconductor memory 5 and the information amount of each hierarchy level (1 to 4) is the same. Then, the recorded audio quality is lower than that in the state of FIG. 11A, but the recording time is quadrupled.
【0056】再生時には、先ず階層レベル識別コード再
生器26により階層レベル識別コードのチェックを行
う。この情報をメモリアドレス制御器23が受け、図1
1のメモリマップに従って記録されたオーディオ信号を
半導体メモリ5から読みだしていく。まず識別コードが
“11”、つまり階層レベル4の場合には、図11
(1)のメモリマップに従って階層レベル1〜4の信号
を読みだしていく。識別コードが“10”つまりレベル
3の場合には、図11(2)のメモリマップに従って階
層レベル1〜3の信号を読みだしていく。以下同様に、
識別コードが“01”で階層レベル2の場合には図11
(3)のメモリマップに従って階層レベル1〜2の信号
を、識別コード“00”で階層レベル1の場合には図1
1(4)のメモリマップに従って階層レベル1の信号を
読みだしていく。At the time of reproduction, first, the hierarchy level identification code is checked by the hierarchy level identification code reproducer 26. This information is received by the memory address controller 23, and FIG.
The audio signal recorded according to the memory map 1 is read from the semiconductor memory 5. First, in the case where the identification code is “11”, that is, at the hierarchical level 4, FIG.
The signals of hierarchy levels 1 to 4 are read out according to the memory map of (1). If the identification code is "10", that is, level 3, signals of hierarchical levels 1 to 3 are read out according to the memory map of FIG. Similarly,
11 when the identification code is “01” and the hierarchical level is 2
According to the memory map of (3), signals of hierarchy levels 1 and 2 are identified by the identification code "00" and the signal of hierarchy level 1 is used in FIG.
The signal of the hierarchy level 1 is read out according to the memory map of 1 (4).
【0057】階層復号化器24では、半導体メモリ5か
ら読み出された信号は、階層レベル識別コード再生器2
6からの識別信号により、その階層レベルに応じた復号
化を行うように構成されている。階層復号化器24の出
力はD/A変換器8によりアナログオーディオ信号に変
換され、所定のオーデイオレベルに増幅するオーディオ
アンプ9を経て、オーディオ出力端子10から出力され
る。また記録再生時におけるサンプリングクロック等の
システム全体に必要となるクロックはクロック発生器1
4より供給される。In the hierarchical decoder 24, the signal read from the semiconductor memory 5 is converted to the hierarchical level identification code reproducer 2.
6, the decoding is performed in accordance with the hierarchical level. The output of the hierarchical decoder 24 is converted into an analog audio signal by the D / A converter 8, and is output from the audio output terminal 10 via the audio amplifier 9 for amplifying to a predetermined audio level. Clocks necessary for the entire system such as a sampling clock at the time of recording / reproduction are clock generator 1
4.
【0058】実施の形態4.次に、この発明の実施の形
態4を図12,図13について説明する。図12は実施
の形態4のブロック回路図で、図7と同一符号は、それ
ぞれ同一部分を示している。図12において、35はア
ドレス切換器で、書き込みアドレス発生器36からのメ
モリアドレスと、読み出しアドレス発生器37からのメ
モリアドレスを切り換える。書き込みアドレス発生器3
6は半導体メモリ5に階層符号化したオーディオ信号を
書き込むためのアドレスを発生する。読み出しアドレス
発生器37はクロック分周器39からの再生クロックに
従って半導体メモリ5から階層符号化されたオーディオ
信号を読み出すためのアドレスを発生する。38は階層
レベル判定器で、オーディオ信号の再生スピードによ
り、階層復号化器24に与えられる復号演算時間が変わ
るため(つまり、再生スピードが上がれば所定のオーデ
ィオサンプル数の復号に与えられる演算時間は短くな
り、逆に再生スピードが下がれば所定のオーディオサン
プル数の復号に与えられる演算時間は長くなる:通常、
階層符号化器や復号化器はDSP(Digital S
ignal Processor)等を用いソフトウェ
ア処理を行う場合が多く、またこのDSP自身もかなり
の高速演算を実行しているので、オーディオ信号の再生
スピードが早くなったからといって、同様にDSPの演
算時間を高速にする事は出来ない)、与えられた演算時
間内に復号可能な階層レベルを判定して階層復号化器2
4に知らせる。39はクロック分周器で、再生スピード
設定スイッチからの信号によりクロック発生器14で発
生したクロックを分周し読み出しアドレス発生器37に
送出する。40は再生スピード設定器を構成するスイッ
チである。Embodiment 4 Next, a fourth embodiment of the present invention will be described with reference to FIGS. FIG. 12 is a block circuit diagram of the fourth embodiment. The same reference numerals as those in FIG. 7 denote the same parts. In FIG. 12, an address switch 35 switches between a memory address from a write address generator 36 and a memory address from a read address generator 37. Write address generator 3
Reference numeral 6 denotes an address for writing a hierarchically encoded audio signal in the semiconductor memory 5. The read address generator 37 generates an address for reading the hierarchically encoded audio signal from the semiconductor memory 5 according to the reproduction clock from the clock frequency divider 39. Numeral 38 denotes a hierarchical level determiner, which changes the decoding operation time given to the hierarchical decoder 24 depending on the reproduction speed of the audio signal (that is, if the reproduction speed increases, the operation time given for decoding a predetermined number of audio samples becomes The shorter the playback speed, and conversely the slower the playback speed, the longer the computation time given to decoding a given number of audio samples:
Hierarchical encoders and decoders are DSP (Digital S)
In many cases, software processing is performed by using a signal processor, etc., and the DSP itself performs a considerably high-speed calculation. Therefore, even if the reproduction speed of the audio signal is increased, the calculation time of the DSP is similarly reduced. High speed cannot be achieved), and a hierarchical level that can be decoded within a given operation time is determined and the hierarchical decoder 2
Inform 4 Reference numeral 39 denotes a clock frequency divider which divides the frequency of the clock generated by the clock generator 14 based on a signal from the reproduction speed setting switch and sends it to the read address generator 37. Reference numeral 40 denotes a switch constituting a reproduction speed setting device.
【0059】図13は実施の形態4のオーディオ復号時
間と再生スピードの関係を示した図で、図13(a),
(b)は通常再生時に、4つの階層レベルの信号全てが
復号できる場合を示している。一方、図13(c),
(d)は再生スピードを2倍速にした場合で、2つの階
層レベルの信号しか復号演算が間に合わないことを示し
ている。FIG. 13 is a diagram showing the relationship between the audio decoding time and the reproduction speed according to the fourth embodiment.
(B) shows a case where all four hierarchical level signals can be decoded during normal reproduction. On the other hand, FIG.
(D) shows a case in which the reproduction speed is doubled, and only two hierarchical levels of signals can be decoded in time.
【0060】次に、記録時の実施の形態3と異なる部分
の動作について説明する。階層符号化器22で階層符号
化されたオーディオ信号は、書き込みアドレス発生器3
6で発生した書き込みアドレスがアドレス切り換え器3
5で選択されて半導体メモリ5に与えられ、所定のアド
レスに記録される。Next, the operation of a portion different from that of the third embodiment during recording will be described. The audio signal hierarchically encoded by the hierarchical encoder 22 is output to the write address generator 3.
The write address generated in step 6 is the address switch 3
5 is given to the semiconductor memory 5 and recorded at a predetermined address.
【0061】再生時には、まず、アドレス切り換え器3
5により半導体メモリ5の読み出しアドレスが読み出し
アドレス発生器37に切り換わる。読み出しアドレス発
生器37では、再生スピード設定器40で設定された
(この例では、通常再生スピードに対してUP,DOW
Nで制御するように構成されている)読み出しスピード
に従ってクロック分周器39で読み出しアドレス発生器
37に与えるクロックを作り出す。半導体メモリ5から
は設定された再生スピードに従ってオーディオ信号が読
みだされ、階層復号化器24で復号される。この場合の
復号階層レベルは、図13に示したようにオーディオ信
号の再生スピードにより、階層復号化器24に与えられ
る復号演算時間が変わるため、与えられた演算時間内に
復号可能な階層レベルを階層レベル判定器38にて判定
される。At the time of reproduction, first, the address switch 3
5, the read address of the semiconductor memory 5 is switched to the read address generator 37. In the read address generator 37, the reproduction speed is set by the reproduction speed setting unit 40 (in this example, UP and DOW are set for the normal reproduction speed).
The clock divider 39 generates a clock to be supplied to the read address generator 37 in accordance with the read speed. An audio signal is read from the semiconductor memory 5 according to the set reproduction speed, and is decoded by the hierarchical decoder 24. In this case, since the decoding operation time given to the layer decoder 24 changes according to the reproduction speed of the audio signal as shown in FIG. 13, the decoding hierarchy level that can be decoded within the given operation time is changed. The determination is made by the hierarchy level determiner 38.
【0062】図13(a),(b)の通常再生時では、
4つの階層レベルの信号全てが復号でき、一方図13
(c),(d)の再生スピードを2倍速にした場合で
は、2つの階層レベルの信号まで正常に復号演算が可能
なことを示している。再生スピードを倍にすると、再生
オーディオ信号は全て2倍の周波数になる、つまり5k
Hzの信号成分は10kHzに、また10kHzの信号
成分は20kHzにシフトするので、実際的には10k
Hz以上の信号は可聴帯域をオーバーすることになり、
高域成分の多い階層レベル3または4の復号は殆ど必要
でなくなる。このことからも図13(c),(d)のよ
うに、階層レベル1〜2のみを復号する方式は非常に適
した方法といえる。階層復号化器24の出力はD/A変
換器8によりアナログオーディオ信号に変換され、所定
のオーデイオレベルに増幅するオーディオアンプ9を経
て、オーディオ出力端子10から出力される。In the normal reproduction shown in FIGS. 13A and 13B,
All four hierarchical level signals can be decoded, while FIG.
When the reproduction speed in (c) and (d) is doubled, it indicates that decoding operation can be normally performed up to signals of two hierarchical levels. When the reproduction speed is doubled, the reproduced audio signals all have a double frequency, that is, 5k.
Hz signal component shifts to 10 kHz and 10 kHz signal component shifts to 20 kHz.
The signal above Hz will exceed the audible band,
Decoding of hierarchical level 3 or 4 having many high-frequency components is almost unnecessary. From this, as shown in FIGS. 13C and 13D, a method of decoding only the hierarchical levels 1 and 2 is a very suitable method. The output of the hierarchical decoder 24 is converted into an analog audio signal by the D / A converter 8, and is output from the audio output terminal 10 via the audio amplifier 9 for amplifying to a predetermined audio level.
【0063】実施の形態5.以下、本発明の実施の形態
5を図に基づいて説明する。実施の形態5のブロック回
路図は実施の形態3の図7と同様であるので図示は省略
する。また、本実施の形態5による半導体メモリオーデ
ィオレコーダの階層符号化の概念図も実施の形態3の図
8と同様であるので図示は省略する。Embodiment 5 Hereinafter, a fifth embodiment of the present invention will be described with reference to the drawings. The block circuit diagram of the fifth embodiment is the same as that of the third embodiment shown in FIG. Also, the conceptual diagram of the hierarchical coding of the semiconductor memory audio recorder according to the fifth embodiment is the same as that of FIG.
【0064】図14は、本実施の形態5の階層符号化器
22の階層レベルの分割の態様を示す図で、階層符号化
の方法が実施の形態3と異なる。以下、階層符号化の符
号ブロック分割数を、実施の形態3と同様に4とし、入
力された原オーディオ信号の分類も、実施の形態3の図
8と同様に、人間の聴覚特性である最小可聴限により元
々聞こえない信号と、マスキング効果により聞こえなく
なった信号と、聞こえる信号の3つに大別し、この中か
ら聞こえる信号のみを選択して、さらに図14に示す周
波数特性に従って4つの階層レベルに分割する。FIG. 14 is a diagram showing a manner of dividing the hierarchical level of the hierarchical encoder 22 according to the fifth embodiment. The hierarchical encoding method is different from that of the third embodiment. Hereinafter, the code block division number of the hierarchical coding is set to 4 similarly to the third embodiment, and the classification of the input original audio signal is the minimum which is the human auditory characteristic similarly to FIG. 8 of the third embodiment. Signals that cannot be heard originally due to audibility, signals that cannot be heard due to the masking effect, and signals that can be heard are roughly classified into three, and only signals that can be heard are selected from these signals. Divide into levels.
【0065】すなわち、図14において、マスキングレ
ベルを超える可聴成分を情報量が等しくなるように、階
層レベル1から階層レベル4までに周波数方向で4分割
し、さらに全体の情報量は所望のビットレートを満たす
ようにする。That is, in FIG. 14, the audible component exceeding the masking level is divided into four in the frequency direction from the hierarchical level 1 to the hierarchical level 4 so that the information amount is equal, and the entire information amount is equal to the desired bit rate. To satisfy.
【0066】図15は本実施の形態5の階層符号化器2
2の構成と半導体メモリ5への記録方法を示す図であ
る。図において、41はサブバンドn分割フィルタで、
A/D変換器3でディジタル信号に変換されたオーディ
オ信号を複数のサブバンドに帯域分割する。42は可聴
成分抽出手段で、オーディオ信号をFFT変換により周
波数領域に変換し、聴覚特性に基づいたマスキングによ
り可聴成分のみを抽出する。43は各フレームのサブバ
ンドごとの情報量算出手段で、可聴成分抽出手段42に
より抽出された可聴成分に対し、6dBあたり1bit
の情報量を割り当てることにより、各サブバンドごとの
情報量を算出する。44は各フレームの情報量算出手段
で、サブバンドごとの情報量算出手段43より得られた
各サブバンドの情報量を合計して1符号化フレームあた
りの情報量を算出する。FIG. 15 shows the hierarchical encoder 2 according to the fifth embodiment.
FIG. 2 is a diagram showing a configuration 2 and a method of recording on a semiconductor memory 5. In the figure, reference numeral 41 denotes a subband n-division filter.
The audio signal converted into a digital signal by the A / D converter 3 is divided into a plurality of sub-bands. Reference numeral 42 denotes an audible component extracting means for converting an audio signal into a frequency domain by FFT transform, and extracting only audible components by masking based on auditory characteristics. Reference numeral 43 denotes an information amount calculating unit for each subband of each frame. The audible component extracted by the audible component extracting unit 42 is 1 bit per 6 dB.
The information amount of each subband is calculated by allocating the information amount of. Reference numeral 44 denotes an information amount calculating unit for each frame, which calculates the information amount per encoded frame by summing the information amounts of the respective subbands obtained by the information amount calculating unit 43 for each subband.
【0067】45は所望の符号化レートに基づきフレー
ムあたりの情報量Cを設定する符号化レートに基づくフ
レームあたりの情報量設定器、46は情報量コントロー
ル回路で、フレームの情報量算出手段44により算出さ
れた各フレームの情報量とそれまでに符号化されたフレ
ームに割り当てられた情報量の平均値である平均割当情
報量に従い、最終的な平均情報量が符号化レートに基づ
くフレームあたりの情報量設定器45により得られる設
定情報量Cに一致するように各フレームに割り当てる割
当情報量を算出する。47は各階層の帯域決定手段で、
情報量算出手段43により算出された各フレームのサブ
バンドごとの情報量と情報量コントロール回路46によ
り算出された割当情報量によりその割当情報量を与える
のに最適な各階層(K1からK4)の符号化帯域を決定
する。48はビットアロケーション回路で、各階層の帯
域決定手段47により得られた各階層に割り当てる帯域
情報に従い、各階層に対する割当帯域内の可聴成分に対
し、その大きさに従って再ビット割当を行う、49は量
子化回路で、ビットアロケーション回路48により得ら
れたビット割当情報に従い、各サブバンドデータを量子
化する。Reference numeral 45 denotes an information amount per frame setting unit for setting an information amount C per frame based on a desired encoding rate. Reference numeral 46 denotes an information amount control circuit. According to the calculated information amount of each frame and the average allocated information amount which is the average value of the information amounts allocated to the frames encoded up to that point, the final average information amount is information per frame based on the coding rate. The allocation information amount to be allocated to each frame is calculated so as to match the setting information amount C obtained by the amount setting unit 45. 47 is a band determining means of each layer,
Based on the information amount for each sub-band of each frame calculated by the information amount calculation means 43 and the allocation information amount calculated by the information amount control circuit 46, the optimum hierarchical level (K1 to K4) for giving the allocation information amount Determine the coding band. Reference numeral 48 denotes a bit allocation circuit, which re-allocates bits to audible components in an allocated band for each layer according to the size according to band information allocated to each layer obtained by the band determining means 47 for each layer. The quantization circuit quantizes each sub-band data according to the bit allocation information obtained by the bit allocation circuit 48.
【0068】50は階層符号化フォーマッティング器
で、各階層の帯域決定手段47により得られた各階層の
割当帯域情報と、ビットアロケーション回路48により
得られたビット割当情報と、量子化器49より得られた
データを階層符号化してフォーマットする。また、図1
5の右側には階層符号化データを半導体メモリ5に記録
する概念を示したものである。Numeral 50 denotes a hierarchical coding formatter, which allocates band information of each layer obtained by the band determining means 47 of each layer, bit allocation information obtained by the bit allocation circuit 48, and obtains information from the quantizer 49. The obtained data is hierarchically encoded and formatted. FIG.
5 shows the concept of recording hierarchically encoded data in the semiconductor memory 5.
【0069】半導体メモリ5上のメモリマップ、および
オーディオ信号の書込み手順は、実施の形態3で説明し
た図11と同じであるので、説明は省略する。The memory map on the semiconductor memory 5 and the procedure for writing the audio signal are the same as those in FIG.
【0070】次に、記録時の動作の実施の形態3と異な
る部分について説明する。階層符号化器22では、オー
ディオ信号より図8、図14に示した方法により階層符
号化データに変換され、半導体メモリ5に記録される。
この階層符号化器22では、まずオーディオ信号をサブ
バンドn分割フィルタ41によりn個のサブバンドに分
割し、同時に可聴成分抽出手段42において、オーディ
オ信号をFFT変換により周波数領域に直交変換し、周
波数領域で聴覚特性に基づいたマスキングレベルが求め
られ、可聴成分が抽出される。図16(a)に示すよう
に周波数スペクトラムとマスキングレベルの差が可聴成
分である。さらに、可聴成分はサブバンド分割によるサ
ブバンド帯域ごとにまとめられ、図16(b)に示すよ
うに各サブバンドごとの可聴成分が抽出される。Next, a description will be given of an operation at the time of recording which is different from the third embodiment. In the hierarchical encoder 22, the audio signal is converted into hierarchically encoded data by the method shown in FIGS. 8 and 14, and is recorded in the semiconductor memory 5.
In the hierarchical encoder 22, first, the audio signal is divided into n subbands by a subband n-division filter 41, and at the same time, the audio signal is orthogonally transformed into a frequency domain by FFT transform in an audible component extracting means 42. A masking level based on auditory characteristics is determined in the region, and audible components are extracted. As shown in FIG. 16A, the difference between the frequency spectrum and the masking level is the audible component. Further, the audible components are collected for each sub-band by sub-band division, and the audible components for each sub-band are extracted as shown in FIG.
【0071】次に、情報量算出手段43では、可聴成分
6dBに対し1bitの情報量を与えることにより図1
6(c)に示すように各サブバンド帯域に対する情報量
が算出される。そして、各フレームの情報量算出手段4
4にてn個のサブバンドの情報量が加算され、1フレー
ムの情報量が算出される。符号化レートに基づくフレー
ムあたりの情報量設定器45では、所望の符号化レート
を設定することによりそのビットレートに基づきフレー
ムあたりの情報量Cが算出され、情報量コントロール回
路46に送られる。Next, the information amount calculating means 43 gives an information amount of 1 bit to the audible component 6 dB, thereby giving an information amount of 1 bit.
As shown in FIG. 6 (c), the information amount for each sub-band is calculated. Then, the information amount calculating means 4 for each frame
In step 4, the information amounts of the n subbands are added, and the information amount of one frame is calculated. The information amount per frame setting unit 45 based on the coding rate calculates the information amount C per frame based on the bit rate by setting a desired coding rate, and sends it to the information amount control circuit 46.
【0072】情報量コントロール回路46では、それま
でに符号化されたフレームに割り当てられたフレームあ
たりの平均情報量に従い、最終的な平均割当情報量が符
号化レートに基づくフレームあたりの情報量設定器で設
定された情報量Cに一致するように、各フレームの情報
量算出手段44により算出された情報量に対し割当帯域
決定に用いる割当情報量を定める。例えば、それまでに
符号化されたフレームに割り当てられた総ビット数をs
um、符号化フレーム数をcountとすると、sum
をcountで割って得られる平均割当情報量(Mバ−
とする)が、符号化ビットレートより換算した1フレー
ムあたりの情報量Cより多い場合には割当情報量を減ら
すように、少ない場合には増やすようにコントロールす
る情報量コントロール係数(K=C/Mバ−とする)
を、各フレームの情報量算出手段44により算出された
情報量(mとする)に乗算し、割当情報量(M=mKと
する)を算出する。In the information amount control circuit 46, the final average allocated information amount is determined by the information amount setting unit per frame based on the coding rate in accordance with the average information amount per frame allocated to the frames encoded up to that time. Is determined for the information amount calculated by the information amount calculation means 44 of each frame so as to match the information amount C set in the above. For example, let s be the total number of bits allocated to frames encoded so far.
If um and the number of encoded frames are count, sum
Is divided by count to obtain the average allocated information amount (M bar).
Is larger than the information amount C per frame converted from the coding bit rate, the information amount control coefficient (K = C / (M bar)
Is multiplied by the information amount (m) calculated by the information amount calculating means 44 of each frame to calculate an allocated information amount (M = mK).
【0073】次に、各階層の帯域決定手段47では、情
報量算出手段43により得られた各サブバンドごとの情
報量と、情報量コントロール回路46により得られた割
当情報量により各階層ごとに割当情報量でカバーできる
帯域を算出し、それを各階層の帯域とする。例えば、オ
ーディオ信号を16のサブバンドに分割し各サブバンド
ごとの情報量を算出したものが図17に示すような値で
あったとすると、そのフレームに対する割当情報量が4
3ビットであった場合、階層レベル1(K1)から階層
レベル4(K4)の各階層レベルに対し割り当てる情報
量を等情報量とすることにより、各階層に対し割り当て
ることのできる情報量はそれぞれ10ビットとなる。Next, the band determining means 47 for each layer uses the information amount for each subband obtained by the information amount calculating means 43 and the allocated information amount obtained by the information amount control circuit 46 for each layer. A band that can be covered by the allocation information amount is calculated, and is set as a band of each layer. For example, if the value obtained by dividing the audio signal into 16 subbands and calculating the information amount for each subband is as shown in FIG. 17, the allocation information amount for that frame is 4
In the case of 3 bits, the amount of information allocated to each hierarchical level from the hierarchical level 1 (K1) to the hierarchical level 4 (K4) is made equal, so that the information amount that can be allocated to each layer is It becomes 10 bits.
【0074】各フレームに対する情報量の割当は、以下
の手順で行う。まず、K1の割当帯域を求める。最低帯
域のサブバンド1の情報量が10ビットであることか
ら、このサブバンドのみでK1の割当情報量10ビット
になるため、K1の符号化帯域として割り当てることの
できる帯域は1サブバンドとなる。次に、K2の割当帯
域を求める。K1に割り当てた帯域以上のサブバンドか
らサブバンド2とサブバンド3の情報量を加算すると1
0(6+4)ビットとなり、K2の割当ビット10ビッ
トに一致する。よってK2の符号化帯域として割り当て
ることのできる帯域は、2、3サブバンドである。同様
に、K2に割り当てた帯域以上のサブバンドであるサブ
バンド4からサブバンド6までの情報量を加算すると1
0ビットとなり、K3の割当情報量と一致し、サブバン
ド7からサブバンド10までの情報量を加算すると10
ビットとなり、K4の割当情報量と一致する。The allocation of the information amount to each frame is performed in the following procedure. First, an assigned band of K1 is obtained. Since the information amount of the sub-band 1 of the lowest band is 10 bits, the information amount of K1 is 10 bits only with this sub-band. Therefore, the band that can be allocated as the encoding band of K1 is 1 sub-band. . Next, an assigned band of K2 is obtained. When the information amount of subband 2 and subband 3 is added from the subbands equal to or greater than the band allocated to K1, 1
The number of bits becomes 0 (6 + 4), which coincides with 10 bits assigned to K2. Therefore, the bands that can be allocated as the K2 coding band are a few subbands. Similarly, when the information amount from subband 4 to subband 6 which is a subband equal to or larger than the band allocated to K2 is added, 1
It becomes 0 bits, which is equal to the allocation information amount of K3, and when the information amount from subband 7 to subband 10 is added, 10 bits
Bits, which is equal to the allocation information amount of K4.
【0075】これにより、各階層に割り当てることので
きる帯域は、それぞれ図17に示すように、1サブバン
ド、2、3サブバンド、4〜6サブバンド、7〜10サ
ブバンドとなる。ビットアロケーション回路48では、
各階層の帯域決定手段47により得られた各階層への割
当帯域情報と、可聴成分抽出手段42により得られた可
聴成分により、各階層の割当帯域内の可聴成分に対し、
その大きさに従って再ビット割当がなされる。例えば、
図17に示すように、各階層レベルK1〜K4に対し帯
域割当された場合、K1帯域はサブバンド1のみの1サ
ブバンド、K2帯域はサブバンド2、3の2サブバン
ド、K3帯域はサブバンド4〜6の3サブバンド、K4
帯域はサブバンド7〜10の4サブバンドとなる。As a result, the bands that can be allocated to each layer are, as shown in FIG. 17, one subband, two subbands, four to six subbands, and seven to ten subbands. In the bit allocation circuit 48,
Based on the allocated band information to each layer obtained by the band determining means 47 of each layer and the audible component obtained by the audible component extracting means 42, the audible component in the allocated band of each layer is
Re-bit allocation is performed according to the size. For example,
As shown in FIG. 17, when bands are allocated to the respective hierarchical levels K1 to K4, the K1 band is one subband of only subband 1, the K2 band is two subbands of subbands 2 and 3, and the K3 band is a subband. 3 subbands of bands 4 to 6, K4
The bands are four subbands of subbands 7 to 10.
【0076】よって、階層レベル1ではサブバンド1の
可聴成分に対し、6dBあたり1ビットのビット割当が
行われ、次に階層レベル2ではサブバンド2、3の可聴
成分に対し、可聴成分の大きさに従って6dBあたり1
ビットが再ビット割当され、さらに階層レベル3ではサ
ブバンド4、5、6の可聴成分に対し、階層レベル4で
はサブバンド7、8、9、10の可聴成分に対し再ビッ
ト割当される。量子化器49では、ビットアロケーショ
ン回路48より得られた各サブバンドに対するビット割
当情報に従い、サブバンドn分割フィルタ41より得ら
れるサブバンドデータが量子化される。階層符号化フォ
ーマッティング器50では、各階層の帯域決定手段47
より得られる各階層の割当帯域情報に従い、ビット割当
情報と量子化データが各階層ごとにフォーマッティング
され、半導体メモリ5に送られる。 以上のような階層
符号化器22により符号化されたデータは、各フレーム
の情報量は可変長であるが、1フレーム内に含まれる各
階層の情報量は等情報量となる。Therefore, at the hierarchical level 1, one bit per 6 dB is allocated to the audible component of the subband 1, and then at the hierarchical level 2, the size of the audible component is According to 1 per 6dB
The bits are re-bit-assigned, and the hierarchy level 3 is re-assigned to the audible components of sub-bands 4, 5, and 6, and the hierarchy level 4 is re-assigned to the audible components of sub-bands 7, 8, 9, and 10. The quantizer 49 quantizes the sub-band data obtained from the sub-band n-division filter 41 according to the bit allocation information for each sub-band obtained from the bit allocation circuit 48. In the hierarchical coding formatter 50, the band determining means 47 of each layer
The bit allocation information and the quantized data are formatted for each layer according to the obtained allocation band information of each layer, and sent to the semiconductor memory 5. In the data encoded by the hierarchical encoder 22 as described above, the information amount of each frame is variable length, but the information amount of each layer included in one frame is the same information amount.
【0077】半導体メモリ5に送られた階層化されたオ
ーディオ信号は、メモリアドレス制御器23により図1
5の右側に示すように、まず階層レベル4で半導体メモ
リ5に各階層毎に分類して記録していく。半導体メモリ
5が満杯になると、階層4の書き込まれていたメモリエ
リアに連続したオーディオ信号を階層レベル3で上書き
していく。この図15は、概念を示したもので各フレー
ムの情報量が等しいように書かれているが、実際には可
変長フレームで符号化されるため、半導体メモリ5は、
各フレームの情報量に応じて記憶できるようにコントロ
ールされる。The hierarchized audio signal sent to the semiconductor memory 5 is supplied to the memory address controller 23 as shown in FIG.
As shown on the right side of 5, the data is first classified and recorded in the semiconductor memory 5 at the hierarchical level 4. When the semiconductor memory 5 becomes full, a continuous audio signal is overwritten at the hierarchy level 3 in the memory area where the hierarchy 4 has been written. Although FIG. 15 shows the concept and is written so that the information amount of each frame is equal, the semiconductor memory 5 is actually encoded in a variable-length frame.
It is controlled so that it can be stored according to the information amount of each frame.
【0078】この状態をメモリマップ上で表現したのが
図11であって、上記の説明は図11(1)→(2)の
記録状態を示したものである。階層レベル識別コード発
生器25では、図11(1)の状態では最大階層レベル
4ということで識別コード“11”を、また図11
(2)の状態を最大階層レベル3ということで識別コー
ド“10”を記録する。同様に、図11(2)→(3)
→(4)と記録状態が進むと同時に階層レベルも3→2
→1となり記録すべき識別コードも“10”→“01”
→“00”となる。この場合記録時間は最終的には半導
体メモリ上が階層1のみのオーディオ信号になった場合
が最大であり、各階層(1〜4)の情報量が同じとすれ
ば図11(1)の状態よりも、記録されたオーディオ品
質は劣化するものの記録時間は4倍になる。FIG. 11 shows this state on the memory map. The above description shows the recording state shown in FIG. 11 (1) → (2). In the hierarchical level identification code generator 25, in the state of FIG.
The identification code "10" is recorded because the state of (2) is the maximum hierarchy level 3. Similarly, FIG. 11 (2) → (3)
→ (4) As the recording state progresses, the hierarchy level is also 3 → 2
→ 1 and the identification code to be recorded is also “10” → “01”
→ "00". In this case, the recording time is the maximum when the audio signal of the hierarchy 1 is finally recorded on the semiconductor memory. If the information amount of each hierarchy (1 to 4) is the same, the state of FIG. Although the recorded audio quality deteriorates, the recording time is quadrupled.
【0079】再生時には、まず階層レベル識別コード再
生器26により階層レベル識別コードのチェックを行
う。この情報をメモリアドレス制御器23が受け、図1
1のメモリマップに従って記録されたオーディオ信号を
半導体メモリ5から読みだしていく。まづ識別コードが
“11”つまり階層レベル4の場合には、図11(1)
のメモリマップに従って階層1〜4の信号を読みだして
いく。識別コードが“10”つまりレベル3の場合に
は、図11(2)のメモリマップに従って階層レベル1
〜3の信号を読みだしていく。At the time of reproduction, first, the hierarchy level identification code is checked by the hierarchy level identification code reproducer 26. This information is received by the memory address controller 23, and FIG.
The audio signal recorded according to the memory map 1 is read from the semiconductor memory 5. First, when the identification code is "11", that is, at the hierarchical level 4, FIG.
In accordance with the memory map shown in FIG. When the identification code is "10", that is, at the level 3, the hierarchical level 1 according to the memory map of FIG.
3 signals are read out.
【0080】以下、同様に、識別コードが“01”で階
層レベル2の場合には図11(3)のメモリマップに従
って階層レベル1〜2の信号を、識別コード“00”で
階層レベル1の場合には図11(4)のメモリマップに
従って階層レベル1の信号を読みだしていく。階層復号
化器24では、半導体メモリ5から読み出された信号
は、階層レベル識別コード再生器26からの識別信号に
より、その階層レベルに応じた復号化を行うように構成
されている。階層復号化器24の出力はD/A変換器8
によりアナログオーディオ信号に変換され、所定のオー
デイオレベルに増幅するオーディオアンプ9を経て、オ
ーディオ出力端子10から出力される。Similarly, when the identification code is "01" and the hierarchical level is 2, the signals of the hierarchical levels 1 and 2 are converted to the hierarchical level 1 by the identification code "00" according to the memory map of FIG. In this case, the signal of the hierarchical level 1 is read out according to the memory map of FIG. The hierarchical decoder 24 is configured to decode the signal read from the semiconductor memory 5 according to the identification level from the hierarchical level identification code reproducer 26 according to the hierarchical level. The output of the hierarchical decoder 24 is the D / A converter 8
The audio signal is converted into an analog audio signal, and is output from an audio output terminal 10 through an audio amplifier 9 that amplifies the audio signal to a predetermined audio level.
【0081】実施の形態6.次に、本発明の実施の形態
6について説明する。図18は実施の形態6による半導
体メモリオーディオレコーダの階層符号化器の構成を示
す図である。図において、41はサブバンドn分割フィ
ルタで、A/D変換器3でディジタル信号に変換された
オーディオ信号を複数のサブバンドに帯域分割する。4
2は可聴成分抽出手段で、オーディオ信号をFFT変換
により周波数領域に変換し、聴覚特性に基づいたマスキ
ングにより可聴成分のみを抽出する。45は符号化レー
トに基づくフレームあたりの情報量設定器で、所望の符
号化レートに基づきフレームあたりの情報量Cを設定す
る。48はビットアロケーション回路で、各階層の帯域
決定手段54により得られた一サイクルの各階層に割り
当てる帯域情報に基づき、各フレームごとに各階層に対
する割当帯域内の可聴成分に対し、その大きさに従って
再ビット割当を行う。49は量子化回路で、ビットアロ
ケーション回路48により得られたビット割当情報に従
い、各サブバンドデータを量子化する。Embodiment 6 FIG. Next, a sixth embodiment of the present invention will be described. FIG. 18 is a diagram showing the configuration of the hierarchical encoder of the semiconductor memory audio recorder according to the sixth embodiment. In the figure, reference numeral 41 denotes a sub-band n-division filter, which divides an audio signal converted into a digital signal by the A / D converter 3 into a plurality of sub-bands. 4
Reference numeral 2 denotes an audible component extracting unit which converts an audio signal into a frequency domain by FFT transform, and extracts only audible components by masking based on auditory characteristics. Reference numeral 45 denotes an information amount setting unit per frame based on a coding rate, and sets an information amount C per frame based on a desired coding rate. Reference numeral 48 denotes a bit allocation circuit, based on the band information to be assigned to each layer in one cycle obtained by the band determining means 54 for each layer, and for each frame, an audible component in an assigned band for each layer according to its size. Re-bit allocation is performed. A quantization circuit 49 quantizes each sub-band data according to the bit allocation information obtained by the bit allocation circuit 48.
【0082】50は階層符号化フォーマッティング器
で、各階層の帯域決定手段54により得られた各階層の
割当帯域情報とビットアロケーション回路48により得
られたビット割当情報と、量子化器49により得られた
データを階層符号化しフォーマットする。51は平均情
報量算出手段で、可聴成分抽出手段42により抽出され
た可聴成分の一定時間あたりの平均値をとり、その平均
値に対し、6dBあたり1bitの情報量を割り当てる
ことにより、各フレームの各サブバンドごとの平均情報
量を算出する。52は各フレームの瞬時情報量算出手段
で、可聴成分抽出手段42により得られる可聴成分のあ
る最大サブバンド情報SBmaxから各符号化フレーム
ごとの情報量を算出する。53は情報量コントロール回
路で、各フレームの瞬時情報量算出手段52より得られ
る瞬時情報量と、それまでに符号化されたフレームに割
り当てられた平均割当情報量に従い、最終的な平均情報
量が符号化レートに基づくフレームあたりの情報量設定
器45により得られる設定情報量Cに一致するように、
一サイクルの区間割当情報量を算出する。54は各階層
の帯域決定手段でで、平均情報量算出手段51により算
出された各フレームのサブバンドごとの平均情報量と、
情報量コントロール回路53により算出された区間割当
情報量により、その割当情報量を与えるのに最適な各階
層レベル(K1からK4)の一サイクルの各階層の符号
化帯域を決定する。Numeral 50 denotes a hierarchical coding formatter, which is obtained by the band determiner 54 of each layer, the bit allocation information obtained by the bit allocation circuit 48, and the bit allocation information obtained by the quantizer 49. Data is hierarchically encoded and formatted. Reference numeral 51 denotes an average information amount calculation unit which takes an average value of the audible components extracted by the audible component extraction unit 42 per fixed time and assigns an information amount of 1 bit per 6 dB to the average value to thereby obtain an average information amount of each frame. The average information amount for each sub-band is calculated. Reference numeral 52 denotes an instantaneous information amount calculating unit for each frame, which calculates an information amount for each encoded frame from the maximum subband information SBmax having an audible component obtained by the audible component extracting unit 42. Reference numeral 53 denotes an information amount control circuit, which determines the final average information amount according to the instantaneous information amount obtained by the instantaneous information amount calculation means 52 of each frame and the average allocated information amount allocated to the frames encoded up to that time. In order to match the setting information amount C obtained by the information amount setting unit 45 per frame based on the coding rate,
A section allocation information amount for one cycle is calculated. 54 is a band determining means of each layer, and the average information amount for each subband of each frame calculated by the average information amount calculating means 51;
Based on the section allocation information amount calculated by the information amount control circuit 53, a coding band of each layer in one cycle of each layer level (K1 to K4) optimal for providing the allocation information amount is determined.
【0083】図19は実施の形態6による平均情報量算
出手段のサブバンドごとの平均情報量算出動作を示すフ
ローチャート図である。FIG. 19 is a flowchart showing the operation of calculating the average information amount for each subband by the average information amount calculating means according to the sixth embodiment.
【0084】図20は実施の形態6による情報量コント
ロール手段における区間割当情報量算出動作を示すフロ
ーチャート図である。FIG. 20 is a flowchart showing a section allocation information amount calculation operation in the information amount control means according to the sixth embodiment.
【0085】図21は実施の形態6による各階層の帯域
決定手段54における割当帯域決定動作を示すフローチ
ャート図である。FIG. 21 is a flowchart showing the operation of determining the allocated band in the band determining means 54 of each layer according to the sixth embodiment.
【0086】図22は実施の形態6によるビットアロケ
ーション回路48におけるビット割当動作を示すフロー
チャート図である。FIG. 22 is a flow chart showing a bit allocation operation in bit allocation circuit 48 according to the sixth embodiment.
【0087】次に、動作について説明する。階層符号化
器22では、まず、オーディオ信号をサブバンドn分割
フィルタ41によりn個のサブバンドに分割し、同時
に、可聴成分抽出手段42においてオーディオ信号をF
FT変換により周波数領域に直交変換し、周波数領域で
聴覚特性に基づいたマスキングレベルが求められ、可聴
成分が抽出される。図16(a)に示すように周波数ス
ペクトラムとマスキングレベルの差が可聴成分である。
さらに、可聴成分はサブバンド分割によるサブバンド帯
域ごとにまとめられ、図16(b)に示すように各サブ
バンドごとの可聴成分が抽出される。Next, the operation will be described. In the hierarchical encoder 22, first, the audio signal is divided into n subbands by the subband n division filter 41, and at the same time, the audio signal is
The orthogonal transform into the frequency domain is performed by the FT transform, a masking level based on the auditory characteristics is obtained in the frequency domain, and an audible component is extracted. As shown in FIG. 16A, the difference between the frequency spectrum and the masking level is the audible component.
Further, the audible components are collected for each sub-band by sub-band division, and the audible components for each sub-band are extracted as shown in FIG.
【0088】次に、平均情報量算出手段51では、図1
9のフローチャート図に示すように、可聴成分抽出手段
42により抽出された各サブバンドごとの可聴成分をX
フレーム分累積加算し、加算後Xで除算することにより
可聴成分のXフレーム分の平均値を算出し、その平均可
聴成分に対し、6dBあたり1bitの情報量を与える
ことによりXフレーム分の平均情報量が算出され、これ
が次の1サイクル(Xフレーム分)の帯域決定に使用さ
れる。各フレームの瞬時情報量算出手段52では、可聴
成分抽出手段42より得られる可聴成分の存在する最大
の帯域(SBmaxとする)から、瞬時情報量を以下の
方法で推定する。Next, in the average information amount calculating means 51, FIG.
As shown in the flowchart of FIG. 9, the audible component for each sub-band extracted by the audible component
The average value for the X frames of the audible component is calculated by accumulating and adding the frames, and dividing by X after the addition, and by giving the information amount of 1 bit per 6 dB to the average audible component, the average information for the X frame is obtained. The amount is calculated and used for the band determination in the next one cycle (for X frames). The instantaneous information amount calculating means 52 for each frame estimates the instantaneous information amount from the maximum band (hereinafter, referred to as SBmax) in which the audible component is obtained by the audible component extracting means 42 by the following method.
【0089】図23〜25は、実施の形態6による瞬時
情報量決定手段での可聴成分の存在する最大の帯域SB
maxと情報量の関係を示す図であるが、これらのデー
タからわかるように、SBmaxと情報量はほぼ比例関
係にあるため、SBmaxから情報量を推定できる。こ
の実施の形態6では、瞬時情報量をSBmaxと情報量
の関係を利用した推定により求めているが、可聴成分に
対し、6dBあたり1bitの情報量を与え、各サブバ
ンドの情報量の加算により算出してもよい。FIGS. 23 to 25 show the maximum band SB in which the audible component exists in the instantaneous information amount determining means according to the sixth embodiment.
FIG. 5 is a diagram showing the relationship between max and the amount of information. As can be seen from these data, since SBmax and the amount of information are substantially proportional, the amount of information can be estimated from SBmax. In the sixth embodiment, the instantaneous information amount is obtained by estimation using the relationship between SBmax and the information amount. However, an information amount of 1 bit per 6 dB is given to the audible component, and the information amount of each subband is added. It may be calculated.
【0090】符号化レートに基づくフレームあたりの情
報量設定器45では、所望の符号化レートを設定するこ
とによりそのビットレートに基づきフレームあたりの情
報量Cが算出され、情報量コントロール回路53に送ら
れる。情報量コントロール回路53では、それまでに符
号化されたフレームに割り当てられたフレームあたりの
平均情報量に従い、最終的な平均割当情報量が符号化レ
ートに基づくフレームあたりの情報量設定器で設定され
た情報量Cに一致するように、各フレームの瞬時情報量
算出手段52により算出された瞬時情報量に対し1サイ
クルの区間割当情報量を定める。The information amount per frame setting unit 45 based on the coding rate calculates the information amount C per frame based on the bit rate by setting a desired coding rate. Can be In the information amount control circuit 53, the final average allocated information amount is set by the information amount setting unit per frame based on the coding rate according to the average information amount per frame allocated to the frames encoded up to that time. The one-cycle section allocation information amount is determined for the instantaneous information amount calculated by the instantaneous information amount calculation means 52 of each frame so as to match the information amount C thus obtained.
【0091】情報量コントロール回路53の動作を図2
0のフローチャートに示す。区間割当情報量MN バ−
は、Xフレームを1サイクルと、1サイクルごとにそれ
までに符号化されたフレームの平均割当情報量Mバ−に
応じて、例えば次式のように算出される。MN バ−=C
+(C−Mバ−)ここでCは符号化レートに基づく1フ
レームあたりの情報量であり、最終的に平均割当情報量
がこの値となるようにMN バ−がコントロールされる。
また、1サイクルの間、毎フレームごとに瞬時情報量算
出回路52より算出された瞬時情報量mに情報量コント
ロール係数Kを乗算することにより瞬時割当情報量Mが
算出される。また、瞬時割当情報量の平均値による平均
割当情報量Mバ−および情報量コントロール係数Kは1
サイクルごとに更新される。The operation of the information amount control circuit 53 is shown in FIG.
0 is shown in the flowchart. Section allocation information amount MN bar
Is calculated according to the following equation, for example, according to the average allocation information amount M bar of frames that have been encoded for one cycle of the X frame and for each cycle. MN bar = C
+ (CM bar) where C is the information amount per frame based on the coding rate, and the MN bar is controlled so that the average allocated information amount finally becomes this value.
Also, during one cycle, the instantaneous allocation information amount M is calculated by multiplying the instantaneous information amount m calculated by the instantaneous information amount calculation circuit 52 for each frame by the information amount control coefficient K. The average allocation information amount M bar and the information amount control coefficient K based on the average value of the instantaneous allocation information amount are 1
Updated every cycle.
【0092】次に、各階層の帯域決定手段54では、図
21のフローチャートに示すように、1サイクルごとに
各サブバンドごとの平均情報量算出手段51により得ら
れた各サブバンドごとの平均情報量と、情報量コントロ
ール回路53により得られた1サイクル間の区間割当情
報量を入力し、区間割当情報量を4分割することにより
各階層あたりの割当情報量を算出し、各階層ごとに割当
情報量でカバーできる帯域を低域側より算出し、それを
各階層の割当帯域とする。ビットアロケーション回路4
8では、各階層の帯域決定手段54により得られた各階
層への1サイクル間の割当帯域情報と、可聴成分抽出手
段42により得られた可聴成分が入力される。各階層の
割当帯域内の可聴成分に対しその大きさに従って再ビッ
ト割当がなされる。Next, as shown in the flow chart of FIG. 21, the band determining means 54 of each hierarchical level obtains the average information of each subband obtained by the average information amount calculating means 51 of each subband every cycle. The amount and the section allocation information amount for one cycle obtained by the information amount control circuit 53 are input, and the section allocation information amount is divided into four to calculate the allocation information amount for each layer, and the allocation is performed for each layer. The band that can be covered by the information amount is calculated from the low band side, and the calculated band is assigned to each layer. Bit allocation circuit 4
At 8, information on the allocated band for one cycle to each layer obtained by the band determining means 54 of each layer and the audible component obtained by the audible component extracting means 42 are input. Re-bit allocation is performed on the audible component in the allocated band of each layer according to the size.
【0093】量子化器49では、ビットアロケーション
回路48より得られた各サブバンドに対するビット割当
情報に従い、サブバンドn分割フィルタ41より得られ
るサブバンドデータが量子化される。階層符号化フォー
マッティング器50では、各階層の帯域決定手段54よ
り得られる各階層の割当帯域情報に従い、ビット割当情
報と量子化データが各階層ごとにフォーマッティングさ
れ、半導体メモリ5に送られる。The quantizer 49 quantizes the subband data obtained from the subband n-division filter 41 according to the bit allocation information for each subband obtained from the bit allocation circuit 48. In the hierarchical coding formatter 50, the bit allocation information and the quantized data are formatted for each layer according to the allocated band information of each layer obtained by the band determining means 54 of each layer, and sent to the semiconductor memory 5.
【0094】実施の形態7.次に、本発明の実施の形態
7について説明する。図26は実施の形態7によるメモ
リオーディオレコーダの階層符号化器の構成を示すブロ
ック回路図で図18と同一符号はそれぞれ同一部分を示
しており、55は各フレームのサブバンドごとの情報量
算出手段43により算出されたサブバンドごとの情報量
を平滑化してサブバンドごとの平均情報量を算出するロ
ーパスフィルタ、56は情報量コントロール回路46に
より得られる瞬時割当情報量を平滑化して平均割当情報
量を算出するローパスフィルタである。Embodiment 7 FIG. Next, a seventh embodiment of the present invention will be described. FIG. 26 is a block circuit diagram showing the configuration of the hierarchical encoder of the memory audio recorder according to the seventh embodiment. The same reference numerals as in FIG. A low-pass filter for smoothing the information amount for each sub-band calculated by the means 43 to calculate an average information amount for each sub-band; This is a low-pass filter for calculating the amount.
【0095】図27は実施の形態7の情報量コントロー
ル回路46の構成を示す図で、57はコンパレータで、
情報量設定器45より得られる所望のビットレートに従
ったフレームあたりの情報量とビットアロケーション回
路48よりえられるビット割当情報量の差分を抽出す
る。58は抽出された差分を平滑化するローパスフィル
タ、59はローパスフィルタにより平滑化された差分値
を符号化比率に変換する変換器、60は乗算器で、符号
化比率変換器59により算出された符号化比Kを各フレ
ームの情報量算出手段44により得られる情報量に乗算
し、割当情報量を算出する。FIG. 27 is a diagram showing the configuration of the information amount control circuit 46 according to the seventh embodiment.
The difference between the information amount per frame according to the desired bit rate obtained from the information amount setting unit 45 and the bit allocation information amount obtained from the bit allocation circuit 48 is extracted. 58 is a low-pass filter for smoothing the extracted difference, 59 is a converter for converting the difference value smoothed by the low-pass filter into an encoding ratio, and 60 is a multiplier, which is calculated by the encoding ratio converter 59. The information amount obtained by the information amount calculation means 44 of each frame is multiplied by the coding ratio K to calculate the allocated information amount.
【0096】次に、実施の形態7の動作について説明す
る。階層符号化器22では、まずオーディオ信号をサブ
バンドn分割フィルタ41によりn個のサブバンドに分
割し、同時に可聴成分抽出手段42において、オーディ
オ信号をFFT変換により周波数領域に直交変換し、周
波数領域で聴覚特性に基づいたマスキングレベルが求め
られ、可聴成分が抽出される。図16(a)に示すよう
に周波数スペクトラムとマスキングレベルの差が可聴成
分である。さらに、可聴成分はサブバンド分割によるサ
ブバンド帯域ごとにまとめられ、図16(b)に示すよ
うに各サブバンドごとの可聴成分が抽出される。次に情
報量算出手段では可聴成分6dBに対し1bitの情報
量を与えることにより図16(c)に示すように各サブ
バンド帯域に対する情報量が算出される。Next, the operation of the seventh embodiment will be described. In the hierarchical encoder 22, first, the audio signal is divided into n subbands by a subband n-division filter 41, and at the same time, the audio signal is orthogonally transformed by an audible component extracting means 42 into a frequency domain by FFT transform. A masking level based on the auditory characteristics is determined, and an audible component is extracted. As shown in FIG. 16A, the difference between the frequency spectrum and the masking level is the audible component. Further, the audible components are collected for each sub-band by sub-band division, and the audible components for each sub-band are extracted as shown in FIG. Next, the information amount calculating means calculates the information amount for each subband band as shown in FIG. 16C by giving 1-bit information amount to the audible component 6 dB.
【0097】そして、ローパスフィルタ55にてサブバ
ンド毎の情報量が平滑化され、サブバンドごとの平均情
報量が得られる。一方、各フレームの瞬時情報量算出手
段52では、n個のサブバンドの情報量が加算され、1
フレームの情報量が算出される。符号化レートに基づく
フレームあたりの情報量設定器45では、所望の符号化
レートを設定することによりそのビットレートに基づき
フレームあたりの情報量Cが算出され、情報量コントロ
ール回路53に送られる。情報量コントロール回路53
では、それまでに符号化されたフレームに割り当てられ
たフレームあたりの平均情報量に従い最終的な平均割当
情報量が符号化レートに基づくフレームあたりの情報量
設定器で設定された情報量Cに一致するように、各フレ
ームの情報量算出手段44により算出された情報量に対
し瞬時割当情報量を定める。Then, the information amount for each sub-band is smoothed by the low-pass filter 55, and the average information amount for each sub-band is obtained. On the other hand, in the instantaneous information amount calculating means 52 for each frame, the information amounts of n subbands are added and 1
The information amount of the frame is calculated. In the information amount per frame setting unit 45 based on the coding rate, the information amount per frame C is calculated based on the bit rate by setting a desired coding rate, and is sent to the information amount control circuit 53. Information amount control circuit 53
Then, according to the average amount of information per frame allocated to the frames encoded so far, the final average allocated amount of information matches the information amount C set by the information amount per frame setter based on the coding rate. In such a manner, the instantaneous allocation information amount is determined for the information amount calculated by the information amount calculation means 44 of each frame.
【0098】そして、ローパスフィルタ56にて瞬時割
当情報量が平滑化され平均割当情報量が算出される。次
に各階層の帯域決定手段47では、ローパスフィルタ5
5により得られた平滑化された各サブバンドごとの情報
量と、ローパスフィルタ56により得られた平滑化され
た割当情報量を入力し、平均割当情報量を4分割するこ
とにより各階層あたりの割当情報量を算出し、各階層ご
とに割当情報量でカバーできる帯域を低域側より算出
し、それを各階層の割当帯域とする。Then, the instantaneous allocation information amount is smoothed by the low-pass filter 56, and the average allocation information amount is calculated. Next, the band determining means 47 of each layer outputs the low-pass filter 5
5 and the smoothed allocation information amount obtained by the low-pass filter 56 are input, and the average allocation information amount is divided into four parts to thereby divide the average allocation information amount into four. The allocation information amount is calculated, and the band that can be covered by the allocation information amount for each layer is calculated from the low band side, and is set as the allocation band of each layer.
【0099】ビットアロケーション回路48では、各階
層の帯域決定手段47により得られた各階層への割当帯
域情報と、可聴成分抽出手段42により得られた可聴成
分により、各階層の割当帯域内の可聴成分に対し、その
大きさに従って再ビット割当がなされる。量子化器49
では、ビットアロケーション回路48より得られた各サ
ブバンドに対するビット割当情報に従い、サブバンドn
分割フィルタ41より得られるサブバンドデータが量子
化される。階層符号化フォーマッティング器50では、
各階層の帯域決定手段47より得られる各階層の割当帯
域情報に従い、ビット割当情報と量子化データが各階層
ごとにフォーマッティングされ、半導体メモリ5に送ら
れる。The bit allocation circuit 48 uses the audible component obtained by the audible component extraction means 42 and the audible component obtained by the audible component extraction means 42 to obtain the audible signal within the allocated band of each layer. The components are re-bit-allocated according to their size. Quantizer 49
In accordance with the bit allocation information for each subband obtained from the bit allocation circuit 48, the subband n
The sub-band data obtained from the division filter 41 is quantized. In the hierarchical coding formatter 50,
According to the allocated band information of each layer obtained from the band determining means 47 of each layer, the bit allocation information and the quantized data are formatted for each layer and sent to the semiconductor memory 5.
【0100】次に、情報量コントロール回路53での情
報量コントロール動作について述べる。情報量コントロ
ール回路53では、まずコンパレータ57により情報量
設定器45より得られる所望のビットレートに従ったフ
レームあたりの情報量とビットアロケーション回路48
よりえられるビット割当情報量の差分が抽出され、ロー
パスフィルタ58により抽出された差分が平滑化され
る。次に符号化比率変換器59でローパスフィルタ58
により平滑化された差分値が符号化比率に変換され、乗
算器60にて符号化比率変換器59により算出された符
号化比Kを各フレームの情報量算出手段44により得ら
れる情報量に乗算し、割当情報量が算出される。以上の
動作により、所望のビットレートと割当情報の差の累積
値に従い緩やかに情報量を制御することにより可変長フ
レーム符号化における情報量を平均的に所定のビットレ
ートにコントロールしている。Next, the information amount control operation in the information amount control circuit 53 will be described. In the information amount control circuit 53, first, the information amount per frame according to the desired bit rate obtained from the information amount setting unit 45 by the comparator 57 and the bit allocation circuit 48
The difference in the obtained bit allocation information amount is extracted, and the difference extracted by the low-pass filter 58 is smoothed. Next, a low-pass filter 58 is output by an encoding ratio converter 59.
Is converted into a coding ratio, and the multiplier 60 multiplies the coding ratio K calculated by the coding ratio converter 59 by the information amount obtained by the information amount calculating means 44 of each frame. Then, the allocation information amount is calculated. With the above operation, the amount of information in variable-length frame coding is controlled on average to a predetermined bit rate by gently controlling the amount of information according to the accumulated value of the difference between the desired bit rate and the allocation information.
【0101】以上のように入力されたオーディオ信号に
基づいてビット割当可変、帯域可変で各階層の符号を構
成する階層符号化を用いることにより、高音質で効率よ
く記録でき、また記録時間に捕らわれずに最適な音質で
記録再生できるメモリオーディオレコーダが得られる。As described above, by using hierarchical coding in which each layer code is variable by variable bit allocation and variable band based on the input audio signal, high-quality sound can be efficiently recorded, and the recording time is limited. Thus, a memory audio recorder that can record and reproduce with optimum sound quality can be obtained.
【0102】実施の形態8.図28は、この発明の実施
の形態8のブロック回路図で、図1と同一符号はそれぞ
れ同一部分を示している。この実施の形態8では、オー
ディオ信号を周波数領域に変換したデータを量子化する
場合について説明するが、量子化するデータはサブバン
ドデータでもよい。図28において、61は符号化器6
2に入力されるディジタルオーディオデータ、63は時
間−周波数領域変換回路(以下、「周波数領域変換回
路」という)で、入力されたディジタルオーディオデー
タ61を周波数領域に変換する。64は周波数領域変換
回路63により変換された変換係数データ、65はビッ
ト割当回路で、入力されたオーディオ信号の特性に基づ
いて所定の音質を得るように変換係数データ64に対す
るビット割当を定める。66はビット割当回路65によ
り定められたビット割当情報、67は量子化回路で、周
波数領域変換回路63により得られた変換係数データ6
4をビット割当回路65より与えられたビット数で量子
化する。68は量子化回路67により量子化された量子
化データ、69はビット割当情報66と量子化データ6
8をフォーマッティングするフォーマッティング回路、
70はビット割当情報66によりフレーム長を算出する
フレーム長算出回路、71はフレーム長算出回路70よ
り算出されたフレーム長に従って書き込みアドレスを制
御する書き込みアドレス制御回路で、63,65,6
7,69,70,71で符号化器62を構成している。Embodiment 8 FIG. FIG. 28 is a block circuit diagram of Embodiment 8 of the present invention, and the same reference numerals as in FIG. 1 denote the same parts. In the eighth embodiment, a case will be described in which data obtained by converting an audio signal into a frequency domain is quantized. However, data to be quantized may be subband data. In FIG. 28, reference numeral 61 denotes an encoder 6
The digital audio data 63 input to 2 is a time-frequency domain conversion circuit (hereinafter referred to as “frequency domain conversion circuit”), which converts the input digital audio data 61 to the frequency domain. Reference numeral 64 denotes conversion coefficient data converted by the frequency domain conversion circuit 63, and reference numeral 65 denotes a bit allocation circuit, which determines bit allocation to the conversion coefficient data 64 so as to obtain a predetermined sound quality based on characteristics of an input audio signal. 66 is bit allocation information determined by the bit allocation circuit 65, 67 is a quantization circuit, and transform coefficient data 6 obtained by the frequency domain conversion circuit 63.
4 is quantized by the number of bits given by the bit allocation circuit 65. 68 is the quantized data quantized by the quantizing circuit 67, 69 is the bit allocation information 66 and the quantized data 6
A formatting circuit for formatting 8;
70 is a frame length calculation circuit for calculating a frame length based on the bit allocation information 66, 71 is a write address control circuit for controlling a write address according to the frame length calculated by the frame length calculation circuit 70, 63, 65, 6
The encoder 62 is composed of 7, 69, 70 and 71.
【0103】5は符号化データを記憶する半導体メモ
リ、72は半導体メモリ5より取り出されたビット割当
情報、73はビット割当情報およびフレーム長算出回路
で、ビット割当情報72を一時バッファに蓄え、このビ
ット割当情報72よりフレーム長を算出する。74は読
みだしアドレス制御回路で、入力されるフレーム長に従
って必要な量子化データ75を半導体メモリ5より読み
出すように読みだしアドレスを制御する。75は半導体
メモリ5から読みだされた量子化データ、76はビット
割当情報72により与えられたビット数の量子化データ
75を逆量子化する逆量子化回路で、73,74,76
で復号化器77を構成している。Reference numeral 5 denotes a semiconductor memory for storing encoded data; 72, bit allocation information extracted from the semiconductor memory 5; 73, a bit allocation information and frame length calculation circuit which stores the bit allocation information 72 in a temporary buffer. The frame length is calculated from the bit allocation information 72. A read address control circuit 74 controls a read address such that necessary quantized data 75 is read from the semiconductor memory 5 in accordance with the input frame length. Reference numeral 75 denotes quantized data read from the semiconductor memory 5, and 76 denotes an inverse quantization circuit for inversely quantizing the quantized data 75 having the number of bits given by the bit allocation information 72.
Constitute the decoder 77.
【0104】図29は図28中に示すビット割当回路6
5の構成を示したものである。図29において、78は
帯域分割エネルギ算出回路で、係数データ64を複数の
周波数帯域に分割し、各帯域のエネルギを算出する。7
9は許容ノイズレベル算出回路で、帯域分割エネルギ算
出回路78で算出された各帯域のエネルギに基づいて各
帯域の許容ノイズレベルを算出する。80はビット割当
算出回路で、許容ノイズレベル算出回路79で算出され
た各帯域の許容ノイズレベルと、各帯域のエネルギの差
に応じて各帯域に分けられた変換係数に割り当てるビッ
ト数を決める。FIG. 29 shows bit allocation circuit 6 shown in FIG.
5 shows the configuration of FIG. In FIG. 29, reference numeral 78 denotes a band division energy calculation circuit that divides the coefficient data 64 into a plurality of frequency bands and calculates the energy of each band. 7
Reference numeral 9 denotes an allowable noise level calculation circuit that calculates an allowable noise level of each band based on the energy of each band calculated by the band division energy calculation circuit 78. Reference numeral 80 denotes a bit allocation calculation circuit that determines the number of bits to be allocated to the transform coefficient divided into each band according to the difference between the allowable noise level of each band calculated by the allowable noise level calculation circuit 79 and the energy of each band.
【0105】図30は、符号化器62により高能率符号
化された1フレームの符号化データを示すフォーマット
図である。1フレームの符号化データは、固定長のビッ
ト割当情報と可変長の量子化データで構成される。FIG. 30 is a format diagram showing encoded data of one frame which has been highly efficiently encoded by the encoder 62. One frame of coded data includes fixed-length bit allocation information and variable-length quantized data.
【0106】図31は、ビット割当回路65でビット算
出に用いられる、マスキングスレッショルドと最小可聴
限の関係を示す図である。図32は、各帯域のエネルギ
と、算出された許容ノイズレベルを示す図である。FIG. 31 is a diagram showing the relationship between the masking threshold and the minimum audible limit used for bit calculation in the bit allocation circuit 65. FIG. 32 is a diagram illustrating the energy of each band and the calculated allowable noise level.
【0107】図33は、半導体メモリ5上に符号化デー
タを記録する際に、ビット割当情報66と量子化データ
68を、補助情報記録エリアと量子化データ記録エリア
に分けて記録する場合において、高速再生をする場合の
動作を示す図である。FIG. 33 shows the case where bit allocation information 66 and quantized data 68 are recorded separately in an auxiliary information recording area and a quantized data recording area when recording encoded data on the semiconductor memory 5. FIG. 9 is a diagram illustrating an operation when performing high-speed playback.
【0108】次に、実施の形態8の記録時の動作につい
て説明する。A/D変換器3にてディジタルデータに変
換されたオーディオ信号61は、符号化器62の時間−
周波数領域変換回路63に入力され、時間−周波数領域
変換回路63で一定のサンプルごとにブロック化され、
そのフレーム単位で周波数領域に変換され、変換係数デ
ータ64はビット割当回路65に入力される。ビット割
当回路65では、所定の音質を満たすように入力された
オーディオ信号の特性に基づいたビット割当が行われ
る。ビット割当回路65で決められたビット割当情報6
6は量子化回路67に入力される。量子化回路67で
は、入力されたビット割当情報66に基づいて変換係数
データ64が割り当てられたビット数で量子化される。
ビット割当情報66と量子化データ68は、フォーマッ
ティング回路69にてフォーマットされる。また、ビッ
ト割当情報66はフレーム長算出回路70に入力され、
フレーム長算出回路70では、変換係数に割り当てられ
たビット数とそのビット数で量子化される変換係数の数
により、量子化データに割り当てられた全ビット数が求
められ、これに補助情報として送られる固定長のビット
割当情報のビット数を加えられて符号化された1フレー
ムの長さが算出され、書き込みアドレス制御回路71に
送られる。Next, the operation at the time of recording according to the eighth embodiment will be described. The audio signal 61 converted into digital data by the A / D converter 3 is converted into a time signal
The signal is input to the frequency domain conversion circuit 63, and is divided into blocks by a fixed number of samples in the time-frequency domain conversion circuit 63
The conversion coefficient data 64 is converted into the frequency domain on a frame basis, and is input to the bit allocation circuit 65. The bit allocation circuit 65 performs bit allocation based on the characteristics of the input audio signal so as to satisfy a predetermined sound quality. Bit allocation information 6 determined by bit allocation circuit 65
6 is input to the quantization circuit 67. In the quantization circuit 67, the transform coefficient data 64 is quantized based on the input bit allocation information 66 by the number of allocated bits.
The bit allocation information 66 and the quantized data 68 are formatted by a formatting circuit 69. The bit allocation information 66 is input to the frame length calculation circuit 70,
In the frame length calculating circuit 70, the total number of bits allocated to the quantized data is obtained from the number of bits allocated to the transform coefficient and the number of transform coefficients quantized by the number of bits, and transmitted as auxiliary information. The length of one encoded frame is calculated by adding the number of bits of the fixed-length bit allocation information to be written, and sent to the write address control circuit 71.
【0109】このように、所定の音質が得られるように
ビット割当され、そのビット数で量子化された量子化デ
ータと、割り当てられたビット割当情報を記録すること
により、一定長の1フレームのオーディオデータを可変
長に符号化するような符号化法を、以下、「フレーム長
可変符号化」という。書き込みアドレス制御回路71で
は、入力されたフレーム長に従って書き込みアドレスが
発生され、フォーマッティングされた圧縮データが半導
体メモリ5に書き込まれ、書き込みアドレスがフレーム
長に従って移動される。その結果、半導体メモリ5には
符号化データがフレーム長可変で連続的に記録される。In this way, by assigning bits so as to obtain a predetermined sound quality and recording the quantized data quantized by the number of bits and the assigned bit allocation information, one frame of a fixed length is recorded. An encoding method that encodes audio data to a variable length is hereinafter referred to as “frame length variable encoding”. The write address control circuit 71 generates a write address according to the input frame length, writes the formatted compressed data into the semiconductor memory 5, and moves the write address according to the frame length. As a result, encoded data is continuously recorded in the semiconductor memory 5 with a variable frame length.
【0110】次に、再生時には、半導体メモリ5より固
定長のビット割当情報72が読みだされ、ビット割当情
報バッファ73に蓄えられる。ビット割当情報バッファ
73では、入力されたビット割当情報より量子化データ
に割当られたビット数が算出され、読みだしアドレス制
御回路74に送られる。読みだしアドレス制御回路74
では、入力された量子化データの符号長にしたがって読
みだしアドレスが発生され、半導体メモリ5より量子化
データ75が読みだされる。読みだされた量子化データ
75は、逆量子化回路76において、ビット割当情報バ
ッファ73より入力されるビット割当情報にしたがっ
て、与えられたビット数の量子化データが逆量子化さ
れ、復号される。復号化器77の出力はD/A変換器8
によりアナログオーディオ信号に変換され、所定のオー
デイオレベルに増幅するオーディオアンプ9を経て、オ
ーディオ出力端子10から出力される。Next, at the time of reproduction, fixed-length bit allocation information 72 is read from the semiconductor memory 5 and stored in the bit allocation information buffer 73. In the bit allocation information buffer 73, the number of bits allocated to the quantized data is calculated from the input bit allocation information, and sent to the read address control circuit 74. Read address control circuit 74
Then, a read address is generated according to the code length of the input quantized data, and the quantized data 75 is read from the semiconductor memory 5. The read quantized data 75 is inversely quantized and decoded in the inverse quantization circuit 76 according to the bit allocation information input from the bit allocation information buffer 73 according to the given number of bits. . The output of the decoder 77 is the D / A converter 8
The audio signal is converted into an analog audio signal, and is output from an audio output terminal 10 through an audio amplifier 9 that amplifies the audio signal to a predetermined audio level.
【0111】次に、上記半導体メモリレコーダの符号化
器62中のビット割当回路65におけるビット割当動作
を図29について説明する。入力された変換係数データ
64は、帯域分割エネルギ算出回路78にて複数の周波
数帯域に分割され、各帯域の変換係数より平均エネルギ
が算出される。算出された各帯域のエネルギは許容ノイ
ズレベル算出回路79に入力され、許容ノイズレベルが
算出される。許容ノイズレベルの算出には、人間の聴覚
特性を考慮して聴感上劣化の少ない圧縮を行うため、マ
スキング効果、最小可聴限特性等が用いられる。ここ
で、マスキング効果とは、ある周波数帯域のレベルの大
きな音によって他の周波数帯域の音がマスクされる効果
であり、最小可聴限とは、人間の聞こえる最小レベルの
音である。Next, the bit allocation operation in the bit allocation circuit 65 in the encoder 62 of the semiconductor memory recorder will be described with reference to FIG. The input conversion coefficient data 64 is divided into a plurality of frequency bands by a band division energy calculation circuit 78, and an average energy is calculated from the conversion coefficients of each band. The calculated energy of each band is input to the allowable noise level calculating circuit 79, and the allowable noise level is calculated. In calculating the allowable noise level, a masking effect, a minimum audible limit characteristic, and the like are used in order to perform compression with less deterioration in audibility in consideration of human auditory characteristics. Here, the masking effect is an effect in which a sound in a certain frequency band is masked by a sound having a high level in another frequency band, and the minimum audible limit is a sound of a minimum level that can be heard by a human.
【0112】図31に各帯域のエネルギに対してマスキ
ング効果、最小可聴限により許容ノイズレベルが算出さ
れる例を示す。図31において、S1〜S10は10箇
の周波数帯域に分割された場合の各周波数帯域のエネル
ギを示す。各帯域のエネルギから左右に伸びた斜線は、
その帯域の音によりマスキングされる領域を示す。ま
た、破線の特性曲線は最小可聴限を示す。各周波数帯域
の許容ノイズレベルは、他の周波数帯域からのマスキン
グレベルと最小可聴限のうち最大レベルのものが選ばれ
る。図31の例において、選ばれた各周波数帯域の許容
ノイズレベルを図32中に横線で示す。許容ノイズレベ
ル算出回路79で算出された許容ノイズレベルと各帯域
のエネルギは、割当ビット算出回路80に入力される。
割当ビット算出回路80では、許容ノイズレベル以下の
音は聞こえないため、許容ノイズレベルを超える帯域の
音に対し、各周波数帯域のエネルギと許容ノイズレベル
の差に応じたビット数を算出し、ビット割当情報66を
出力する。このように割り当てられたビット数は、入力
されたオーディオ信号の性質に基づくものであり、1フ
レームの符号化に割り当てられるビット数は可変であ
る。FIG. 31 shows an example in which an allowable noise level is calculated based on the masking effect and the minimum audibility for the energy of each band. In FIG. 31, S1 to S10 indicate the energy of each frequency band when divided into ten frequency bands. The diagonal lines extending left and right from the energy of each band
The area masked by the sound in that band is shown. The characteristic curve indicated by the broken line indicates the minimum audible limit. As the allowable noise level of each frequency band, the maximum noise level is selected from the masking levels from other frequency bands and the minimum audible level. In the example of FIG. 31, the allowable noise level of each selected frequency band is indicated by a horizontal line in FIG. The allowable noise level calculated by the allowable noise level calculation circuit 79 and the energy of each band are input to the allocation bit calculation circuit 80.
Since the allocated bit calculation circuit 80 does not hear sounds below the allowable noise level, the number of bits according to the difference between the energy of each frequency band and the allowable noise level is calculated for the sound in the band exceeding the allowable noise level, and the number of bits is calculated. The assignment information 66 is output. The number of bits allocated in this way is based on the properties of the input audio signal, and the number of bits allocated for encoding one frame is variable.
【0113】以上のように、ビット割当された1フレー
ムの符号化データは、図30に示すように固定長のビッ
ト割当情報と、割り当てられたビット数で量子化された
可変長の量子化データに符号化され、フォーマッティン
グされる。このように固定長のビット割当情報を補助情
報とすることにより、量子化データに割り当てられたビ
ット数が算出できるので、可変長フレームでの符号化が
可能である。また、半導体メモリ5ではアドレスの制御
により記録位置を高速でランダムに決めれるので、可変
長フレームの符号の記録が可能である。As described above, the coded data of one frame to which bits have been allocated is composed of fixed-length bit allocation information and variable-length quantized data quantized by the allocated number of bits, as shown in FIG. And formatted. By using the fixed-length bit allocation information as the auxiliary information as described above, the number of bits allocated to the quantized data can be calculated, so that encoding in a variable-length frame is possible. Further, in the semiconductor memory 5, the recording position can be randomly determined at high speed by controlling the address, so that the code of the variable length frame can be recorded.
【0114】また、可変長フレームの符号を図30に示
すようなフォーマットで記録せず、半導体メモリ5上
に、補助情報を記録するエリアと量子化データを記録す
るエリアを設け、補助情報を記録するエリアにビット割
当情報66を固定長で連続的に記録し、量子化データ6
8を記録するエリアに可変長の量子化データを連続的に
記録するようにする。これにより、補助情報エリアの固
定長のビット割当情報により量子化データの記録された
アドレスを算出し、所定のフレーム間隔で量子化データ
を読みだして復号することにより、高速再生が可能とな
る。Also, the code of the variable length frame is not recorded in the format as shown in FIG. 30, but an area for recording auxiliary information and an area for recording quantized data are provided on the semiconductor memory 5 to record the auxiliary information. Bit allocation information 66 is continuously recorded at a fixed length in an area where
The variable length quantized data is continuously recorded in the area where 8 is recorded. Thus, the address at which the quantized data is recorded is calculated based on the fixed-length bit allocation information in the auxiliary information area, and the quantized data is read out and decoded at a predetermined frame interval, thereby enabling high-speed reproduction.
【0115】図33にこの一例を示す。図33の例で
は、アドレス0より999が補助情報(ビット割当情
報)記録エリア、アドレス1000より量子化データ記
録エリアとなっており、アドレス0より20ビットでビ
ット割当情報が記録されている。ビット割当情報の中に
示されている数字は、ビット割当情報より算出される量
子化データの1フレームのビット数であり、量子化デー
タ記録エリアには、この数字で示される量子化データが
可変長で連続記録されている。図中の丸で囲まれた数字
はフレーム番号を示す。よって、ビット割当情報中の数
字に量子化データ記録エリアの最初のアドレス1000
を加算することにより、量子化データの記録されている
最初のアドレスが算出できる。ゆえに、まず補助情報中
のビット割当情報を読みだし、読みだしたビット割当情
報より量子化データの記録されているアドレスを算出
し、5フレーム毎に算出されたアドレスより量子化デー
タを読みだし、復号することにより5倍速の高速再生が
可能となる。量子化データの読みだしは、図33中の二
重丸で囲まれた番号のフレーム1、6、11、16・・
・・の順で行われ、読みだされるフレームのアドレス
は、1000、1378、1723、2112・・・・
となる。FIG. 33 shows an example of this. In the example of FIG. 33, 999 is an auxiliary information (bit allocation information) recording area from address 0, and a quantized data recording area is from address 1000. Bit allocation information is recorded in 20 bits from address 0. The number indicated in the bit allocation information is the number of bits of one frame of the quantized data calculated from the bit allocation information, and the quantized data indicated by the number is variable in the quantized data recording area. It is recorded continuously in long. The numbers circled in the figure indicate frame numbers. Therefore, the number in the bit allocation information is replaced with the first address 1000 of the quantized data recording area.
Is added, the first address where the quantized data is recorded can be calculated. Therefore, first, the bit allocation information in the auxiliary information is read, the address where the quantized data is recorded is calculated from the read bit allocation information, and the quantized data is read from the address calculated every five frames. By decoding, high-speed reproduction of 5 times speed becomes possible. The reading of the quantized data is performed using frames 1, 6, 11, 16,...
The addresses of frames to be read out and read in the order of 1000, 1378, 1723, 2112,.
Becomes
【0116】上記のように、入力されたオーディオ信号
に基づいて所定の音質が得られるようフレーム長可変で
ビット割当を行い、ビット割当情報と量子化データに符
号化するフレーム長可変符号化方式を用い、可変長フレ
ームで高速ランダムアクセス可能な半導体メモリに記憶
させることにより、高音質で効率よく記録でき、長時間
記録可能な半導体メモリレコーダが得られる。As described above, a variable frame length encoding method for allocating bits with variable frame lengths to obtain a predetermined sound quality based on an input audio signal, and encoding the bits into bit allocation information and quantized data. By using and storing the variable-length frames in a semiconductor memory capable of high-speed random access, a semiconductor memory recorder capable of efficiently recording with high sound quality and capable of recording for a long time is obtained.
【0117】実施の形態9.次に、この発明の実施の形
態9を図について説明する。図34において、図28と
同一符号はそれぞれ同一部分を示しており、81は再生
フレーム選択回路で、ビット割当情報により量子化デー
タに割り当てられたビット数を算出し、割り当てられた
ビット数が、所定のしきい値を超えたフレームのみを再
生フレームとして選択する。82は再生フレーム選択回
路81により得られる再生フレーム選択情報と再生フレ
ームのビット割当情報、83は再生フレーム選択回路8
1で算出された量子化データの符号長と再生フレーム選
択情報である。Embodiment 9 FIG. Next, a ninth embodiment of the present invention will be described with reference to the drawings. In FIG. 34, the same reference numerals as those in FIG. 28 denote the same parts, respectively. Reference numeral 81 denotes a reproduction frame selection circuit which calculates the number of bits allocated to the quantized data based on the bit allocation information. Only a frame exceeding a predetermined threshold is selected as a reproduction frame. Reference numeral 82 denotes reproduction frame selection information and reproduction frame bit allocation information obtained by the reproduction frame selection circuit 81, and reference numeral 83 denotes a reproduction frame selection circuit 8.
It is the code length of the quantized data calculated in step 1 and the reproduction frame selection information.
【0118】実施の形態9の記録時の動作は、実施の形
態1と同様であるので説明は省略する。次に、再生時の
「早聞き動作」について説明する。ここでの「早聞き」
とは、データを一定の間隔で連続的に飛ばすことによる
高速再生、あるいは再生速度を速めることによる早聞き
ではなく、半導体メモリレコーダを会議メモ等会話の記
録に用いた場合に、無音部分あるいは周囲の雑音のみで
会話の記録されていない部分を飛ばすことにより、必要
な会話部分のみを連続的に再生することによる早聞きで
ある。The operation at the time of recording according to the ninth embodiment is the same as that of the first embodiment, and therefore the description is omitted. Next, the “quick listening operation” during reproduction will be described. "Early listening" here
This means that when a semiconductor memory recorder is used for recording conversations such as meeting memos, it is not a high-speed playback by continuously skipping data at a fixed interval or a fast listening by increasing the playback speed. By skipping the part where the conversation is not recorded only by the noise of the utterance, it is possible to perform the early listening by continuously reproducing only the necessary conversation part.
【0119】半導体メモリ5より固定長のビット割当情
報72が読みだされ、再生フレーム選択回路81に入力
される。再生フレーム選択回路81では、ビット割当情
報72により1フレームの量子化データに割り当てられ
たビット数が算出される。ここで、実施の形態8におい
て述べたような方法でビット割当がされている場合、無
音部分においては全変換係数が最小可聴限以下のレベル
となるため、量子化データに割り当てられるビット数は
0となる。The fixed-length bit allocation information 72 is read from the semiconductor memory 5 and input to the reproduction frame selection circuit 81. The reproduction frame selection circuit 81 calculates the number of bits allocated to one frame of quantized data based on the bit allocation information 72. Here, when bits are allocated by the method as described in the eighth embodiment, the number of bits allocated to the quantized data is 0 since all transform coefficients are at a level below the minimum audible level in a silent part. Becomes
【0120】また、雑音のみが記録されている部分にお
いても、全体のレベルが小さいため量子化データに割り
当てられるビット数は非常に少なくなる。よって、1フ
レームに割り当てられているビット数に所定のしきい値
を設け、割り当てられたビット数がそのしきい値を超え
ないフレームについては、無音部分または雑音部分とし
て再生されず、しきい値を超えたフレームについて再生
フレーム選択情報とビット割当情報82が逆量子化回路
76に送られる。Further, even in a portion where only noise is recorded, the number of bits allocated to the quantized data is very small because the overall level is small. Therefore, a predetermined threshold value is provided for the number of bits allocated to one frame, and a frame in which the allocated number of bits does not exceed the threshold value is not reproduced as a silent portion or a noise portion. The reproduction frame selection information and the bit allocation information 82 are transmitted to the inverse quantization circuit 76 for the frames exceeding the limit.
【0121】また、再生フレーム選択回路81にて算出
された1フレームの量子化データに対する符号長と再生
フレーム選択情報83は、読みだしアドレス制御回路7
4に送られる。読みだしアドレス制御回路74では、再
生フレームとして選択されたフレームが入力された場合
には、ともに入力された量子化データの符号長にしたが
って読みだしアドレスが発生され、半導体メモリ5より
量子化データ75が読みだされる。The code length and the reproduction frame selection information 83 for one frame of the quantized data calculated by the reproduction frame selection circuit 81 are read from the read address control circuit 7.
4 When a frame selected as a reproduction frame is input, the read address control circuit 74 generates a read address in accordance with the code length of the quantized data that has been input, and the quantized data 75 is output from the semiconductor memory 5. Is read.
【0122】また、再生フレームとして選択されなかっ
たフレームでは、量子化データに割り当てられたビット
数分アドレスを移動する。読みだされた量子化データ7
5は逆量子化回路76においてフレーム選択情報ととも
に入力されるビット割当情報82にしたがって与えられ
たビット数の量子化データが逆量子化され、復号され
る。復号化器77の出力はD/A変換器8によりアナロ
グオーディオ信号に変換され、所定のオーデイオレベル
に増幅するオーディオアンプ9を経て、オーディオ出力
端子10から出力される。In a frame not selected as a reproduction frame, the address is shifted by the number of bits assigned to the quantized data. Read quantized data 7
In 5, the quantized data of the given number of bits is inversely quantized and decoded in the inverse quantization circuit 76 in accordance with the bit allocation information 82 input together with the frame selection information. The output of the decoder 77 is converted into an analog audio signal by the D / A converter 8 and output from the audio output terminal 10 through the audio amplifier 9 for amplifying the audio signal to a predetermined audio level.
【0123】以上のように、入力された信号に基づきビ
ット割当を行うフレーム長可変符号化では、無音部分等
情報量の少ないフレームはビット割当は非常に少ないの
で、上記のようにビット割当が所定のしきい値を超えた
フレームのみを再生することにより、無音区間等を飛ば
し、音声の記録されている部分のみを早聞き再生でき
る。As described above, in the variable frame length coding in which bit allocation is performed based on an input signal, frames with a small amount of information, such as silent portions, have very few bit allocations. By reproducing only the frames exceeding the threshold value, the silent section and the like can be skipped, and only the portion where the voice is recorded can be played back at a high speed.
【0124】[0124]
【発明の効果】以上のようにこの発明によれば、オーデ
ィオ信号の符号化に優先順位を持たせた階層符号化方式
を用いたことと、記録媒体の半導体メモリのランダムア
クセス性を駆使することにより、半導体メモリオーディ
オレコーダの記録時間を切り換えるように構成したの
で、記録媒体に定められた記録時間にとらわれないで常
に最適な音質(記録時間が短い時は最高の音質で記録さ
れ、記録時間が長くなるにつれて音質は劣化する)で記
録再生できる半導体メモリオーディオレコーダが得られ
る効果がある。As described above, according to the present invention, it is possible to use the hierarchical coding method which gives priority to the encoding of the audio signal and make full use of the random access property of the semiconductor memory of the recording medium. Thus, the recording time of the semiconductor memory audio recorder is switched, so that the recording is always performed at the optimum sound quality regardless of the recording time specified for the recording medium (when the recording time is short, the recording is performed at the highest sound quality, (Sound quality deteriorates as the length increases.) There is an effect that a semiconductor memory audio recorder capable of recording and reproducing can be obtained.
【0125】また、オーディオ信号の符号化に優先順位
を持った階層符号化を用いたことと、記録媒体としての
半導体メモリのランダムアクセス性を駆使することによ
り、半導体メモリ記録再生装置の記録時間をフレキシブ
ルになるように構成したので、記録媒体に定められた記
録時間にとらわれないで常に最適な音質(記録時間が短
い時は高音質で記録され、記録時間が長くなるにつれて
音質は劣化する)で記録再生でき、かつ可変速再生も可
能な半導体メモリオーディオレコーダが得られる効果が
ある。Also, the use of hierarchical coding with priority in audio signal coding and the random accessibility of a semiconductor memory as a recording medium make it possible to reduce the recording time of a semiconductor memory recording / reproducing apparatus. Because it is configured to be flexible, it always has the optimal sound quality regardless of the recording time specified for the recording medium (high-quality sound is recorded when the recording time is short, and sound quality deteriorates as the recording time becomes longer). There is an effect that a semiconductor memory audio recorder capable of recording and reproduction and variable speed reproduction can be obtained.
【0126】また、オーディオ信号の符号化に優先順位
を持った階層符号化を用いたことと、その階層符号化の
方法を各階層の情報量に応じて最適なビット割当を行う
可変長フレーム符号化を用いながら各階層の情報量を等
しくするようなものとしたこと、および記録媒体として
の半導体メモリのランダムアクセス性を駆使することに
より、半導体メモリ記録再生装置の記録時間をフレキシ
ブルになるように構成したので、記録媒体に定められた
記録時間にとらわれないで常に最適な音質(記録時間が
短い時は高音質で記録され、記録時間が長くなるにつれ
て音質は劣化する)で記録再生でき、かつ可変速再生も
可能な半導体メモリオーディオレコーダが得られる効果
がある。Also, the use of hierarchical coding with priority for audio signal coding and the method of hierarchical coding are described by using a variable-length frame code for performing optimal bit allocation according to the information amount of each layer. In order to make the recording time of the semiconductor memory recording / reproducing device flexible by using the same amount of information in each layer while using the optimization, and making full use of the random accessibility of the semiconductor memory as a recording medium. With this configuration, recording and reproduction can always be performed at an optimum sound quality (when the recording time is short, recording is performed at a high sound quality, and when the recording time is prolonged, the sound quality deteriorates) regardless of the recording time determined for the recording medium, and There is an effect that a semiconductor memory audio recorder capable of variable speed reproduction can be obtained.
【0127】また、入力オーディオ信号の特性に基づい
て所定の音質を保つようなビット割当を行い、補助情報
としてビット割当情報を記録し、このビット割当情報よ
り可変長フレームで符号化できるフレーム長可変符号化
方式を用いたことと、ビット割当情報を利用して半導体
メモリにアクセスするアドレスを制御することにより、
記録媒体の半導体メモリの高速ランダムアクセス性を駆
使し、半導体メモリオーディオ記録再生装置に効率よく
記録できるようにしたので、高音質で記録時間の長い半
導体メモリオーディオ記録再生装置が得られる効果があ
る。Further, based on the characteristics of the input audio signal, bit allocation is performed so as to maintain a predetermined sound quality, bit allocation information is recorded as auxiliary information, and a frame length variable which can be encoded in a variable length frame from this bit allocation information. By using the encoding method and controlling the address for accessing the semiconductor memory using the bit allocation information,
By making full use of the high-speed random access property of the semiconductor memory of the recording medium and efficiently recording on the semiconductor memory audio recording / reproducing apparatus, there is an effect that a semiconductor memory audio recording / reproducing apparatus having high sound quality and a long recording time can be obtained.
【0128】また、半導体メモリ上に補助情報記録エリ
アと量子化データ記録エリアを設け、補助情報記録エリ
アに固定長で連続的にビット割当情報を記録するように
したので、可変長フレームでも高速再生が可能となる効
果がある。Further, the auxiliary information recording area and the quantized data recording area are provided on the semiconductor memory, and the bit allocation information is continuously recorded at a fixed length in the auxiliary information recording area. There is an effect that becomes possible.
【0129】また、フレーム長可変符号化によるビット
割当情報を利用し、情報量が所定のしきい値を超えるフ
レームのみを再生するようにしたので、非常に簡単な回
路構成で「早聞き」が可能な半導体メモリオーディオ記
録再生装置が得られる効果がある。Also, since only frames whose information amount exceeds a predetermined threshold value are reproduced by using the bit allocation information by the variable frame length encoding, "early listening" can be realized with a very simple circuit configuration. There is an effect that a possible semiconductor memory audio recording / reproducing device can be obtained.
【図1】 この発明の実施の形態1による半導体メモリ
オーディオレコーダのブロック回路図である。FIG. 1 is a block circuit diagram of a semiconductor memory audio recorder according to Embodiment 1 of the present invention.
【図2】 実施の形態1の階層符号化方式の一構成例を
示す図である。FIG. 2 is a diagram illustrating a configuration example of a hierarchical coding scheme according to the first embodiment.
【図3】 実施の形態1の階層符号化方式の他の構成例
を示す図である。FIG. 3 is a diagram illustrating another configuration example of the hierarchical coding scheme according to the first embodiment.
【図4】 実施の形態1の半導体メモリのメモリマップ
である。FIG. 4 is a memory map of the semiconductor memory according to the first embodiment;
【図5】 実施の形態1のオーディオ信号の半導体メモ
リへの記録経過を示した図である。FIG. 5 is a diagram showing a recording process of an audio signal in the semiconductor memory according to the first embodiment.
【図6】 この発明の実施の形態2による半導体メモリ
オーディオレコーダのブロック回路図である。FIG. 6 is a block circuit diagram of a semiconductor memory audio recorder according to Embodiment 2 of the present invention.
【図7】 この発明の実施の形態3による半導体メモリ
オーディオ記録再生装置のブロック回路図である。FIG. 7 is a block circuit diagram of a semiconductor memory audio recording / reproducing apparatus according to Embodiment 3 of the present invention.
【図8】 実施の形態3の階層符号化の概念を説明する
ための図である。FIG. 8 is a diagram for explaining the concept of hierarchical coding according to the third embodiment.
【図9】 実施の形態3の階層符号化の階層レベルを示
す周波数特性図である。FIG. 9 is a frequency characteristic diagram showing hierarchical levels of hierarchical encoding according to the third embodiment.
【図10】 実施の形態3の階層符号化器の構成と半導
体メモリへの記録方式の概念を示す図である。FIG. 10 is a diagram illustrating a configuration of a hierarchical encoder according to a third embodiment and a concept of a recording method in a semiconductor memory.
【図11】 実施の形態3の半導体メモリのメモリマッ
プである。FIG. 11 is a memory map of the semiconductor memory according to the third embodiment;
【図12】 この発明の実施の形態4による半導体メモ
リオーディオ記録再生装置のブロック回路図である。FIG. 12 is a block circuit diagram of a semiconductor memory audio recording / reproducing apparatus according to Embodiment 4 of the present invention.
【図13】 実施の形態4のオーディオ復号時間とオー
ディオ再生時間の関係を示す図である。FIG. 13 is a diagram illustrating a relationship between an audio decoding time and an audio reproduction time according to the fourth embodiment.
【図14】 本発明の実施の形態5〜7による半導体メ
モリオーディオ記録再生装置の階層符号化の階層レベル
を示す周波数特性図である。FIG. 14 is a frequency characteristic diagram showing hierarchical levels of hierarchical encoding of the semiconductor memory audio recording and reproducing devices according to the fifth to seventh embodiments of the present invention.
【図15】 実施の形態5の階層符号化器の構成と半導
体メモリへの記録方式の概念を示す図である。FIG. 15 is a diagram illustrating a configuration of a hierarchical encoder according to a fifth embodiment and a concept of a recording method in a semiconductor memory.
【図16】 実施の形態5〜7の階層符号化器における
可聴成分の抽出と情報量算出の様子を示す図である。FIG. 16 is a diagram illustrating a state of extraction of an audible component and calculation of an information amount in the hierarchical encoder according to the fifth to seventh embodiments.
【図17】 実施の形態5〜7の階層符号化器における
各階層の割当帯域決定の様子を示す図である。FIG. 17 is a diagram illustrating a manner of determining an allocated band of each layer in the layer encoders according to the fifth to seventh embodiments.
【図18】 実施の形態6の階層符号化器の構成を示す
図である。FIG. 18 is a diagram illustrating a configuration of a hierarchical encoder according to a sixth embodiment.
【図19】 実施の形態6の情報量算出手段のサブバン
ドごとの平均情報量算出動作を示すフローチャート図で
ある。FIG. 19 is a flowchart illustrating an average information amount calculation operation for each subband by an information amount calculation unit according to the sixth embodiment.
【図20】 実施の形態6の情報量コントロール手段に
おける区間割当情報量を算出する動作を示すフローチャ
ート図である。FIG. 20 is a flowchart showing an operation of calculating a section allocation information amount in the information amount control means of the sixth embodiment.
【図21】 実施の形態6の各階層の帯域決定手段にお
ける割当帯域決定動作を示すフローチャート図である。FIG. 21 is a flowchart illustrating an allocated band determining operation in a band determining unit of each layer according to the sixth embodiment.
【図22】 実施の形態6のビットアロケーション回路
におけるビット割当動作を示すフローチャート図であ
る。FIG. 22 is a flowchart illustrating a bit allocation operation in the bit allocation circuit according to the sixth embodiment.
【図23】 実施の形態6の瞬時情報量決定手段におけ
る可聴成分の存在する最大の帯域SBmaxと情報量の
関係を示す図である。FIG. 23 is a diagram showing the relationship between the maximum band SBmax in which an audible component exists and the information amount in the instantaneous information amount determining means of the sixth embodiment.
【図24】 実施の形態6の瞬時情報量決定手段におけ
る可聴成分の存在する最大の帯域SBmaxと情報量の
関係を示す図である。FIG. 24 is a diagram showing the relationship between the maximum band SBmax in which an audible component exists and the information amount in the instantaneous information amount determining means according to the sixth embodiment.
【図25】 実施の形態6の瞬時情報量決定手段におけ
る可聴成分の存在する最大の帯域SBmaxと情報量の
関係を示す図である。FIG. 25 is a diagram showing the relationship between the maximum band SBmax in which an audible component exists and the information amount in the instantaneous information amount determining means of the sixth embodiment.
【図26】 本発明の実施の形態7による半導体メモリ
オーディオ記録再生装置の階層符号化器の構成を示した
図である。FIG. 26 is a diagram showing a configuration of a hierarchical encoder of a semiconductor memory audio recording / playback device according to a seventh embodiment of the present invention.
【図27】 実施の形態7の階層符号化器の情報量コン
トロール回路の構成を示す図である。FIG. 27 is a diagram illustrating a configuration of an information amount control circuit of the hierarchical encoder according to the seventh embodiment.
【図28】 この発明の実施の形態8による半導体メモ
リオーディオ記録再生装置のブロック回路図である。FIG. 28 is a block circuit diagram of a semiconductor memory audio recording / reproducing device according to an eighth embodiment of the present invention.
【図29】 実施の形態8の符号化器のビット割当回路
の構成を示す図である。FIG. 29 is a diagram illustrating a configuration of a bit allocation circuit of the encoder according to the eighth embodiment.
【図30】 実施の形態8のフレーム長可変符号化方式
による符号化フレームのフォーマットを示す図である。FIG. 30 is a diagram illustrating a format of an encoded frame according to the variable frame length encoding method according to the eighth embodiment.
【図31】 実施の形態8の符号化器のビット割当回路
でのマスキング効果と最小可聴限を用いた許容ノイズレ
ベルの算出の様子を示した図である。FIG. 31 is a diagram illustrating a state of calculation of an allowable noise level using a masking effect and a minimum audibility in the bit allocation circuit of the encoder according to the eighth embodiment.
【図32】 実施の形態8の符号化器のビット割当回路
での各帯域の許容ノイズレベルとエネルギの様子を示し
た図である。FIG. 32 is a diagram illustrating a state of an allowable noise level and energy of each band in a bit allocation circuit of an encoder according to an eighth embodiment.
【図33】 実施の形態8による高速再生を説明するた
めのメモリマップである。FIG. 33 is a memory map for describing high-speed playback according to the eighth embodiment.
【図34】 この発明の実施の形態9による半導体メモ
リオーディオ記録再生装置のブロック回路図である。FIG. 34 is a block circuit diagram of a semiconductor memory audio recording / reproducing apparatus according to Embodiment 9 of the present invention.
3 A/D変換器、4 階層符号化器、5 半導体メモ
リ、6 メモリアドレス制御器、7 階層復号化器、8
D/A変換器、11 階層レベル識別コード発生器、
12 階層レベル識別コード再生器、13 メモリ容量
検出器、15 サブバンド分割フイルタ、16 ビット
割当器、17 第1の半導体メモリ、18 第2の半導
体メモリ、19 階層レベル変換器、20 第1のメモ
リアドレス制御器、21 第2のメモリアドレス制御器
22 階層符号化器、23 メモリアドレス制御器、2
4 階層復号化器、25 階層レベル識別コード発生
器、26 階層レベル識別コード再生器、27 分割フ
ィルタ、28 MDCT、29 ブロックサイズ設定
器、30 グルーピング器、31 階層化/量子化器、
32 ダイナミックビット配分器、33 スケールファ
クタ算出器、34 フォーマッティング器、35 アド
レス切換器、36 書き込みアドレス発生器、37 読
み出しアドレス発生器、38 階層レベル判定器、39
クロック分周器、40 再生スピード設定器、41
サブバンドn分割フィルタ、42 可聴成分抽出手段、
43 各フレームのサブバンドごとの情報量算出手段、
44 各フレームの情報量算出手段、45 符号化レー
トに基づくフレームあたりの情報量設定器、46 情報
量コントロール回路、47 各階層の帯域決定手段、5
1 各サブバンドごとの平均情報量算出手段、52 各
フレームの瞬時情報量算出手段、53 情報量コントロ
ール回路、54 各階層の帯域決定手段、55 サブバ
ンド毎の情報量平滑化フィルタ、56 割当情報量平滑
化フィルタ、57 情報量比較器、58 差分情報量平
滑化フィルタ、59 符号化比率変換器、62 符号化
器、65 ビット割当回路、67 量子化回路、70
フレーム長算出回路、71 書き込みアドレス制御回
路、73 ビット割当情報バッファおよびフレーム長算
出回路、74 読みだしアドレス制御回路、77 復号
化器、78 帯域分割エネルギ算出回路、79 許容ノ
イズレベル算出回路、80 割当ビット算出回路、81
再生フレーム選択回路、82 再生フレーム選択情報
およびビット割当情報、83 再生フレーム選択情報お
よび量子化データの符号長。3 A / D converter, 4 layer encoder, 5 semiconductor memory, 6 memory address controller, 7 layer decoder, 8
D / A converter, 11 hierarchical level identification code generator,
12 hierarchy level identification code regenerator, 13 memory capacity detector, 15 subband split filter, 16 bit allocator, 17 first semiconductor memory, 18 second semiconductor memory, 19 hierarchy level converter, 20 first memory Address controller, 21 second memory address controller 22 hierarchical encoder, 23 memory address controller, 2
4 layer decoder, 25 layer level identification code generator, 26 layer level identification code reproducer, 27 division filter, 28 MDCT, 29 block size setting unit, 30 grouper, 31 layerer / quantizer,
32 dynamic bit allocator, 33 scale factor calculator, 34 formatter, 35 address switcher, 36 write address generator, 37 read address generator, 38 hierarchical level determiner, 39
Clock divider, 40 Playback speed setting device, 41
Subband n division filter, 42 audible component extraction means,
43 information amount calculating means for each subband of each frame,
44 information amount calculation means for each frame; 45 information amount setting device per frame based on coding rate; 46 information amount control circuit; 47 band determination means for each layer;
1 average information amount calculation means for each subband, 52 instantaneous information amount calculation means for each frame, 53 information amount control circuit, 54 band determination means for each layer, 55 information amount smoothing filter for each subband, 56 allocation information Amount smoothing filter, 57 information amount comparator, 58 difference information amount smoothing filter, 59 coding ratio converter, 62 encoder, 65 bit allocation circuit, 67 quantization circuit, 70
Frame length calculation circuit, 71 write address control circuit, 73 bit allocation information buffer and frame length calculation circuit, 74 read address control circuit, 77 decoder, 78 band division energy calculation circuit, 79 allowable noise level calculation circuit, 80 allocation Bit calculation circuit, 81
Reproduction frame selection circuit, 82 Reproduction frame selection information and bit allocation information, 83 Reproduction frame selection information and code length of quantized data.
───────────────────────────────────────────────────── フロントページの続き (31)優先権主張番号 特願平5−18050 (32)優先日 平成5年1月7日(1993.1.7) (33)優先権主張国 日本(JP) (72)発明者 石田 禎宣 東京都千代田区丸の内二丁目2番3号 三 菱電機株式会社内 Fターム(参考) 5D045 DA20 5J064 AA01 BC01 BC02 BC06 BC07 BC16 BC21 BD01 ──────────────────────────────────────────────────続 き Continued on the front page (31) Priority claim number Japanese Patent Application No. 5-1850 (32) Priority date January 7, 1993 (1.7.1.7) (33) Priority claim country Japan (JP) (72) Inventor Yoshinobu Ishida 2-3-2 Marunouchi, Chiyoda-ku, Tokyo F-term in Mitsubishi Electric Corporation (reference) 5D045 DA20 5J064 AA01 BC01 BC02 BC06 BC07 BC16 BC21 BD01
Claims (15)
波数帯域に対応した変換係数に変換する周波数変換手段
と、 得られた変換係数を聴覚心理特性に基づくレベル変化に
応じて分割することにより、人間の聴覚特性に基づく優
先順位の付けられたn個(nは2以上の自然数)の第1
〜第n符号化デ−タを生成する階層化/量子化手段を備
えたことを特徴とするオーディオ信号符号化装置。1. A frequency conversion means for converting an input digital audio signal into a conversion coefficient corresponding to a frequency band, and dividing the obtained conversion coefficient in accordance with a level change based on psychoacoustic characteristics to provide a human auditory sense. N (n is a natural number of 2 or more) first priority-ordered based on characteristics
An audio signal encoding apparatus, comprising: a layering / quantizing means for generating the n-th encoded data.
波数帯域に対応した変換係数に変換する周波数変換手段
と、 得られた変換係数を周波数の高低ならびに量子化レベル
の大小をパラメータとして分割し、人間の聴覚特性に基
づく優先順位の付けられたn個(nは2以上の自然数)
の第1〜第n符号化デ−タを生成する階層化/量子化手
段を備えたことを特徴とするオーディオ信号符号化装
置。2. A frequency conversion means for converting an input digital audio signal into a conversion coefficient corresponding to a frequency band, and dividing the obtained conversion coefficient by using a frequency level and a quantization level as parameters to obtain a human auditory sense. N (n is a natural number of 2 or more) with priorities based on characteristics
An audio signal encoding apparatus comprising a layering / quantizing means for generating the first to n-th encoded data.
波数帯域に対応した変換係数に変換する周波数変換手段
と、 得られた変換係数に対して以下に示すル−ルに従う階層
化及び量子化を施すことでn個(nは2以上の自然数)
の階層レベルに分割した符号化データを得る階層化/量
子化手段を備えたことを特徴とするオーディオ信号符号
化装置。 1.前記変換係数のうち、その周波数帯域が所定の周波
数f1までの変換係数であって、かつ、その量子化レベ
ルがMSB側から所定のビット数b1までの変換係数を
選択し、これを階層レベル1の符号化デ−タS1とす
る。 2.前記変換係数のうち、その周波数帯域が所定の周波
数f2(f2≧f1)までの変換係数であって、かつ、
その量子化レベルがMSB側から所定のビット数b2
(b2≧b1)までの変換係数を選択し、さらに、この
信号から前記階層レベル1の変換係数を差し引いた残差
信号を階層レベル2の符号化データS2とする。 3.前記変換係数のうち、その周波数帯域が所定の周波
数fn(fn≧fn−1)までの変換係数であって、か
つ、その量子化レベルがMSB側から所定のビット数b
n(bn≧bn−1)までの変換係数を選択し、さら
に、この信号から前記階層レベル1乃至階層レベルn−
1の変換係数を差し引いた残差信号を階層レベルnの符
号化デ−タSnとする。3. A frequency conversion means for converting an input digital audio signal into a conversion coefficient corresponding to a frequency band, and performing hierarchization and quantization according to the following rules on the obtained conversion coefficient. n (n is a natural number of 2 or more)
An audio signal encoding apparatus, comprising: a layering / quantizing means for obtaining encoded data divided into hierarchical levels. 1. Among the transform coefficients, a transform coefficient whose frequency band is a transform coefficient up to a predetermined frequency f1 and whose quantization level is from the MSB side to a predetermined number of bits b1 is selected, and is selected as a hierarchical level 1 Coded data S1. 2. Among the conversion coefficients, the frequency band is a conversion coefficient up to a predetermined frequency f2 (f2 ≧ f1), and
The quantization level is a predetermined number of bits b2 from the MSB side.
The transform coefficients up to (b2 ≧ b1) are selected, and the residual signal obtained by subtracting the transform coefficient of the hierarchical level 1 from this signal is used as the encoded data S2 of the hierarchical level 2. 3. Of the transform coefficients, the frequency band is a transform coefficient up to a predetermined frequency fn (fn ≧ fn−1), and the quantization level is a predetermined number of bits b from the MSB side.
n (bn.gtoreq.bn-1), and further, from this signal, the hierarchical levels 1 to n-
The residual signal obtained by subtracting the transform coefficient of 1 is used as the coded data Sn of the hierarchical level n.
波数帯域に対応した変換係数に変換する周波数変換手段
と、 得られた変換係数から、聴覚心理特性に基づく可聴信号
成分を抽出するとともに、以下に示すル−ルに従う階層
化及び量子化を施してn個(nは2以上の自然数)の階
層レベルに分割した符号化データを得る階層化/量子化
手段を備えたことを特徴とするオーディオ信号符号化装
置。 1.前記可聴信号成分の変換係数のうち、その周波数帯
域が所定の周波数f1までの変換係数を選択し、これを
階層レベル1の符号化デ−タS1とする。 2.前記可聴信号成分の変換係数のうち、その周波数帯
域が所定の周波数f2(f2≧f1)までの変換係数を
選択し、さらに、この信号から前記階層レベル1の変換
係数を差し引いた残差信号を階層レベル2の符号化デー
タS2とする。 3.前記可聴信号成分の変換係数のうち、その周波数帯
域が所定の周波数fn(fn≧fn−1)までの変換係
数を選択し、さらに、この信号から前記階層レベル1乃
至階層レベルn−1の変換係数を差し引いた残差信号を
階層レベルnの符号化デ−タSnとする。4. A frequency conversion means for converting an input digital audio signal into a conversion coefficient corresponding to a frequency band, and extracting an audible signal component based on psychoacoustic characteristics from the obtained conversion coefficient. Audio signal encoding characterized by comprising layering / quantizing means for performing layering and quantization in accordance with a rule to obtain encoded data divided into n (n is a natural number of 2 or more) hierarchical levels. apparatus. 1. Among the transform coefficients of the audible signal component, a transform coefficient whose frequency band is up to a predetermined frequency f1 is selected, and this is defined as hierarchical level 1 encoded data S1. 2. From among the transform coefficients of the audible signal component, a transform coefficient whose frequency band is up to a predetermined frequency f2 (f2 ≧ f1) is selected. It is assumed that the encoded data S2 is at the hierarchical level 2. 3. From among the transform coefficients of the audible signal component, transform coefficients whose frequency band is up to a predetermined frequency fn (fn ≧ fn−1) are selected, and further, from this signal, the transform of the hierarchical levels 1 to n−1 is performed. The residual signal from which the coefficient has been subtracted is coded data Sn of the hierarchical level n.
に基づくレベル変化に関連して行なわれることを特徴と
する請求項2または請求項3記載のオーディオ信号符号
化装置。5. The audio signal encoding apparatus according to claim 2, wherein the division into the hierarchical levels is performed in association with a level change based on psychoacoustic characteristics.
定サイズのブロックに分割する分割手段を具備し、周波
数変換手段は前記分割した各ブロックに対して変換を施
すことを特徴とする請求項1〜請求項4のいずれか1項
記載のオーディオ信号符号化装置。6. The apparatus according to claim 1, further comprising a dividing unit for dividing the input digital audio signal into blocks of a predetermined size, wherein the frequency converting unit performs a conversion on each of the divided blocks. 5. The audio signal encoding device according to claim 4.
性に基づくレベル変化に応じて分割することにより、人
間の聴覚特性に基づく階層的な優先順位が与えられた階
層符号化オーディオデ−タと該階層符号化オーディオデ
−タの階層レベルの識別コ−ドとを入力として、該識別
コ−ドに基づき前記階層符号化オーディオデ−タをその
階層レベルに応じて復号化することで、周波数帯域に対
応した変換係数を得る復号化手段と、 得られた変換係数に逆変換を施すことにより元のディジ
タルオーディオ信号を得る周波数逆変換手段とを備えた
ことを特徴とするオーディオ信号復号化装置。7. Hierarchical coded audio data to which hierarchical priorities based on human auditory characteristics are given by dividing the frequency-converted transform coefficients according to level changes based on auditory psychological characteristics. By inputting the identification code at the hierarchical level of the hierarchically encoded audio data as input and decoding the hierarchically encoded audio data according to the hierarchical level based on the identification code, the frequency An audio signal decoding apparatus comprising: decoding means for obtaining a transform coefficient corresponding to a band; and frequency inverse transform means for performing an inverse transform on the obtained transform coefficient to obtain an original digital audio signal. .
低ならびに量子化レベルの大小をパラメータとして分割
することにより、人間の聴覚特性に基づく階層的な優先
順位が与えられた階層符号化オーディオデ−タと該階層
符号化オーディオデ−タの階層レベルの識別コ−ドとを
入力として、該識別コ−ドに基づき前記階層符号化オー
ディオデ−タをその階層レベルに応じて復号化すること
で、周波数帯域に対応した変換係数を得る復号化手段
と、 得られた変換係数に逆変換を施すことにより元のディジ
タルオーディオ信号を得る周波数逆変換手段とを備えた
ことを特徴とするオーディオ信号復号化装置。8. A hierarchically encoded audio data to which hierarchical priorities based on human auditory characteristics are given by dividing the frequency-transformed transform coefficients using the level of frequency and the level of quantization level as parameters. Inputting the hierarchically encoded audio data and the identification code at the hierarchical level of the hierarchically encoded audio data, and decoding the hierarchically encoded audio data according to the hierarchical level based on the identification code. Audio signal decoding comprising: decoding means for obtaining a transform coefficient corresponding to a frequency band; and frequency inverse transform means for performing an inverse transform on the obtained transform coefficient to obtain an original digital audio signal. Device.
子化が施され、人間の聴覚特性に基づく階層的な優先順
位が与えられた階層符号化オーディオデ−タと該階層符
号化オーディオデ−タの階層レベルの識別コ−ドとを入
力として、該識別コ−ドに基づき前記階層符号化オーデ
ィオデ−タをその階層レベルに応じて復号化すること
で、周波数帯域に対応した変換係数を得る復号化手段
と、 得られた変換係数に逆変換を施すことにより元のディジ
タルオーディオ信号を得る周波数逆変換手段とを備えた
ことを特徴とするオーディオ信号復号化装置。 1.ディジタルオーディオ信号を周波数変換することで
得られる変換係数のうち、その周波数帯域が所定の周波
数f1までの変換係数であって、かつ、その量子化レベ
ルがMSB側から所定のビット数b1までの変換係数を
選択し、これを階層レベル1の符号化デ−タS1とす
る。 2.前記変換係数のうち、その周波数帯域が所定の周波
数f2(f2≧f1)までの変換係数であって、かつ、
その量子化レベルがMSB側から所定のビット数b2
(b2≧b1)までの変換係数を選択し、さらに、この
信号から前記階層レベル1の変換係数を差し引いた残差
信号を階層レベル2の符号化デ−タS2とする。 3.前記変換係数のうち、その周波数帯域が所定の周波
数fn(fn≧fn−1)までの変換係数であって、か
つ、その量子化レベルがMSB側から所定のビット数b
n(bn≧bn−1)までの変換係数を選択し、さら
に、この信号から前記階層レベル1乃至階層レベルn−
1の変換係数を差し引いた残差信号を階層レベルnの符
号化デ−タSnとする。9. Hierarchical coded audio data that has been hierarchized and quantized according to the following rules and has been given a hierarchical priority based on human auditory characteristics, and said hierarchical coding By inputting the identification code at the hierarchical level of the audio data as input, the hierarchically encoded audio data is decoded according to the hierarchical level based on the identification code, so as to correspond to the frequency band. An audio signal decoding apparatus comprising: decoding means for obtaining a transform coefficient; and frequency inverse transform means for performing an inverse transform on the obtained transform coefficient to obtain an original digital audio signal. 1. Among the conversion coefficients obtained by frequency-converting the digital audio signal, the frequency band is a conversion coefficient up to a predetermined frequency f1, and the quantization level is a conversion coefficient from the MSB side to a predetermined bit number b1. A coefficient is selected, and this is set as encoded data S1 of the hierarchical level 1. 2. Among the conversion coefficients, the frequency band is a conversion coefficient up to a predetermined frequency f2 (f2 ≧ f1), and
The quantization level is a predetermined number of bits b2 from the MSB side.
The transform coefficients up to (b2 ≧ b1) are selected, and the residual signal obtained by subtracting the transform coefficient of the hierarchical level 1 from this signal is used as the encoded data S2 of the hierarchical level 2. 3. Of the transform coefficients, the frequency band is a transform coefficient up to a predetermined frequency fn (fn ≧ fn−1), and the quantization level is a predetermined number of bits b from the MSB side.
n (bn.gtoreq.bn-1), and further, from this signal, the hierarchical levels 1 to n-
The residual signal obtained by subtracting the transform coefficient of 1 is used as the coded data Sn of the hierarchical level n.
量子化が施され、人間の聴覚特性に基づく階層的な優先
順位が与えられた階層符号化オーディオデ−タと該階層
符号化オーディオデ−タの階層レベルの識別コ−ドとを
入力として、該識別コ−ドに基づき前記階層符号化オー
ディオデ−タをその階層レベルに応じて復号化すること
で、周波数帯域に対応した変換係数を得る復号化手段
と、 得られた変換係数に逆変換を施すことにより元のディジ
タルオーディオ信号を得る周波数逆変換手段とを備えた
ことを特徴とするオーディオ信号復号化装置。 1.人間の聴覚心理特性に基づき抽出された可聴信号成
分の変換係数のうち、その周波数帯域が所定の周波数f
1までの変換係数を選択し、これを階層レベル1の符号
化デ−タS1とする。 2.前記可聴信号成分の変換係数のうち、その周波数帯
域が所定の周波数f2(f2≧f1)までの変換係数を
選択し、さらに、この信号から前記階層レベル1の変換
係数を差し引いた残差信号を階層レベル2の符号化デ−
タS2とする。 3.前記可聴信号成分の変換係数のうち、その周波数帯
域が所定の周波数fn(fn≧fn−1)までの変換係
数を選択し、さらに、この信号から前記階層レベル1乃
至階層レベルn−1の変換係数を差し引いた残差信号を
階層レベルnの符号化デ−タSnとする。10. Hierarchical coded audio data that has been hierarchized and quantized in accordance with the following rules, and given a hierarchical priority based on human auditory characteristics, and said hierarchical coding By inputting the identification code at the hierarchical level of the audio data as input and decoding the hierarchically encoded audio data according to the hierarchical level based on the identification code, it is possible to cope with the frequency band. An audio signal decoding device comprising: decoding means for obtaining a transform coefficient; and frequency inverse transform means for performing an inverse transform on the obtained transform coefficient to obtain an original digital audio signal. 1. Of the transform coefficients of the audible signal component extracted based on the human psychoacoustic characteristics, the frequency band of the transform coefficient is a predetermined frequency f
The transform coefficients up to 1 are selected, and this is used as the encoded data S1 of the hierarchical level 1. 2. From among the transform coefficients of the audible signal component, a transform coefficient whose frequency band is up to a predetermined frequency f2 (f2 ≧ f1) is selected. Hierarchical level 2 encoded data
Data S2. 3. From among the transform coefficients of the audible signal component, transform coefficients whose frequency band is up to a predetermined frequency fn (fn ≧ fn−1) are selected, and further, from this signal, the transform of the hierarchical levels 1 to n−1 is performed. The residual signal from which the coefficient has been subtracted is coded data Sn of the hierarchical level n.
周波数帯域に対応した変換係数に変換する周波数変換手
段と、 前記ディジタルオーディオ信号の特性に応じて、再生
時、所定の音質が得られるように、前記変換係数に割り
当てるビットの割当情報を求めるビット割当手段と、 前記変換係数を前記ビット割当情報に基づき量子化する
ことで可変長の量子化デ−タを得る量子化手段と、 前記量子化デ−タと固定長の前記ビット割当情報から、
可変長のフレ−ムデ−タを得るフォーマッティング手段
と、 前記フレ−ムデ−タのフレ−ム長を求めるフレ−ム長検
出手段と、 前記フレ−ム長に応じて記録媒体への書き込みアドレス
を制御するアドレス制御手段とを備えたことを特徴とす
るオーディオ信号符号化装置。11. A frequency conversion means for converting an input digital audio signal into a conversion coefficient corresponding to a frequency band, and said converting means for obtaining a predetermined sound quality at the time of reproduction according to characteristics of said digital audio signal. Bit allocation means for obtaining allocation information of bits allocated to coefficients; quantization means for obtaining variable-length quantized data by quantizing the transform coefficient based on the bit allocation information; And the fixed-length bit allocation information,
Formatting means for obtaining variable-length frame data; frame-length detecting means for obtaining a frame length of the frame data; and an address for writing to a recording medium according to the frame length. An audio signal encoding device comprising: an address control unit for controlling the audio signal.
帯域に応じて分割した各帯域の変換係数のエネルギ−を
求める帯域分割エネルギ−検出手段と、 各帯域のエネルギ−に基づいて各帯域の許容ノイズレベ
ルを求める許容ノイズレベル検出手段と、 前記帯域分割エネルギ−検出手段で求めた各帯域のエネ
ルギ−と前記許容ノイズレベル検出手段で求めた各帯域
の許容ノイズレベルとの差から各帯域に分割された変換
係数に割り当てるビット数を求める割当ビット検出手段
とを備えたことを特徴とする請求項11記載のオーディ
オ信号符号化装置。12. A bit allocation means, comprising: a band division energy detecting means for obtaining energy of a transform coefficient of each band obtained by dividing a transform coefficient according to a frequency band; and an allowance of each band based on the energy of each band. An allowable noise level detecting means for obtaining a noise level; and dividing into respective bands based on a difference between an energy of each band obtained by the band dividing energy detecting means and an allowable noise level of each band obtained by the allowable noise level detecting means. 12. The audio signal encoding apparatus according to claim 11, further comprising an allocation bit detection unit for obtaining the number of bits allocated to the transformed coefficient.
複数のサブバンドデ−タに分割するサブバンド分割手段
と、 前記ディジタルオーディオ信号の特性に応じて、再生
時、所定の音質が得られるように、各サブバンドデ−タ
に割り当てるビット割当情報を求めるビット割当手段
と、 前記各サブバンドデ−タを前記ビット割当情報に基づき
量子化することで可変長の量子化デ−タを得る量子化手
段と、 前記量子化デ−タと固定長の前記ビット割当情報から、
可変長のフレ−ムデ−タを得るフォ−マッティング手段
と、 前記フレ−ムデ−タのフレ−ム長を求めるフレ−ム長検
出手段と、 前記フレ−ム長に応じて記録媒体への書き込みアドレス
を制御するアドレス制御手段とを備えたことを特徴とす
るオーディオ信号符号化装置。13. A sub-band dividing means for dividing an input digital audio signal into a plurality of sub-band data, and each sub-band data according to the characteristics of the digital audio signal so as to obtain a predetermined sound quality during reproduction. Bit allocation means for obtaining bit allocation information to be allocated to the data; quantizing means for obtaining variable-length quantized data by quantizing each of the sub-band data based on the bit allocation information; Data and the fixed-length bit allocation information,
Formatting means for obtaining variable-length frame data; frame-length detecting means for obtaining a frame length of the frame data; and a recording medium for recording on a recording medium according to the frame length. An audio signal encoding device comprising: an address control unit that controls a write address.
に量子化された量子化デ−タと該量子化デ−タの量子化
を決定する固定長のビット割当情報とからなるオーディ
オ信号復号化装置であって、 前記フレ−ムデ−タから固定長のビット割当情報を抽出
し、得られたビット割当情報から前記フレ−ムデ−タの
フレ−ム長を求めるビット割当情報およびフレ−ム長検
出手段と、 得られたフレ−ム長に基づき前記フレ−ムデ−タから可
変長に量子化された量子化デ−タを抽出し、抽出した量
子化データを前記ビット割当情報に基づき逆量子化する
逆量子化手段とを備えたことを特徴とするオーディオ信
号復号化装置。14. An audio signal decoding system comprising quantized data quantized to a variable length according to characteristics of an audio signal and fixed-length bit allocation information for determining quantization of the quantized data. An apparatus for extracting bit allocation information of a fixed length from the frame data, and obtaining bit allocation information and a frame length of the frame data from the obtained bit allocation information. Detecting means for extracting quantized data quantized to a variable length from the frame data based on the obtained frame length, and extracting the extracted quantized data into an inverse quantum based on the bit allocation information; An audio signal decoding device comprising:
に量子化された量子化デ−タと該量子化デ−タの量子化
を決定する固定長のビット割当情報とからなるフレ−ム
デ−タから、可変長に量子化された量子化デ−タを抽出
して復号化するオーディオ信号復号化装置であって、 前記フレ−ムデ−タから固定長のビット割当情報を抽出
し、得られたビット割当情報から可変長に量子化された
量子化デ−タに割り当てられたビット数を求め、該ビッ
ト数が所定のしきい値を越えるフレ−ムデ−タを選択す
る再生フレ−ム選択手段と、 選択したフレ−ムデ−タから可変長に量子化された量子
化デ−タを抽出し、抽出した量子化データを前記ビット
割当情報に基づき逆量子化する逆量子化手段とを備えた
ことを特徴とするオーディオ信号復号化装置。15. A frame data comprising quantized data quantized to a variable length according to characteristics of an audio signal and fixed-length bit allocation information for determining quantization of the quantized data. An audio signal decoding device for extracting and decoding quantized data quantized to a variable length from data, wherein fixed-length bit allocation information is extracted from the frame data. The number of bits allocated to quantized data quantized to a variable length is obtained from the allocated bit information, and the reproduction frame selection for selecting frame data in which the number of bits exceeds a predetermined threshold value. Means for extracting quantized data quantized to variable length from the selected frame data, and dequantizing means for dequantizing the extracted quantized data based on the bit allocation information. An audio signal decoding device characterized in that:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001125699A JP3481918B2 (en) | 1992-04-20 | 2001-04-24 | Audio signal encoding / decoding device |
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9964792 | 1992-04-20 | ||
JP4-198463 | 1992-07-24 | ||
JP4-198464 | 1992-07-24 | ||
JP19846492 | 1992-07-24 | ||
JP19846392 | 1992-07-24 | ||
JP4-99647 | 1993-01-07 | ||
JP1805093 | 1993-01-07 | ||
JP5-18050 | 1993-01-07 | ||
JP2001125699A JP3481918B2 (en) | 1992-04-20 | 2001-04-24 | Audio signal encoding / decoding device |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP09313693A Division JP3371462B2 (en) | 1992-04-20 | 1993-04-20 | Audio signal recording / playback device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001356798A true JP2001356798A (en) | 2001-12-26 |
JP3481918B2 JP3481918B2 (en) | 2003-12-22 |
Family
ID=27519988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001125699A Expired - Lifetime JP3481918B2 (en) | 1992-04-20 | 2001-04-24 | Audio signal encoding / decoding device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3481918B2 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007286146A (en) * | 2006-04-13 | 2007-11-01 | Nippon Telegr & Teleph Corp <Ntt> | Adaptive block length encoding device, its method, program and recording medium |
JP2008228327A (en) * | 2008-04-08 | 2008-09-25 | Canon Inc | Decoding method and apparatus |
CN114093362A (en) * | 2021-12-01 | 2022-02-25 | 阳光保险集团股份有限公司 | Audio conversion method and device, electronic equipment and readable storage medium |
-
2001
- 2001-04-24 JP JP2001125699A patent/JP3481918B2/en not_active Expired - Lifetime
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007286146A (en) * | 2006-04-13 | 2007-11-01 | Nippon Telegr & Teleph Corp <Ntt> | Adaptive block length encoding device, its method, program and recording medium |
JP4658852B2 (en) * | 2006-04-13 | 2011-03-23 | 日本電信電話株式会社 | Adaptive block length encoding apparatus, method thereof, program and recording medium |
JP2008228327A (en) * | 2008-04-08 | 2008-09-25 | Canon Inc | Decoding method and apparatus |
CN114093362A (en) * | 2021-12-01 | 2022-02-25 | 阳光保险集团股份有限公司 | Audio conversion method and device, electronic equipment and readable storage medium |
Also Published As
Publication number | Publication date |
---|---|
JP3481918B2 (en) | 2003-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5752221A (en) | Method of efficiently recording an audio signal in semiconductor memory | |
JP3123286B2 (en) | Digital signal processing device or method, and recording medium | |
JP3173218B2 (en) | Compressed data recording method and apparatus, compressed data reproducing method, and recording medium | |
JP3123290B2 (en) | Compressed data recording device and method, compressed data reproducing method, recording medium | |
GB2260069A (en) | Compressed digital signal processing apparatus and method and storage medium | |
JP2006011456A (en) | Method and device for coding/decoding low-bit rate and computer-readable medium | |
JP2005338850A (en) | Method and device for encoding and decoding digital signal | |
JP2000059227A (en) | Encoding and decoding device and its method | |
JP3371462B2 (en) | Audio signal recording / playback device | |
JP3481918B2 (en) | Audio signal encoding / decoding device | |
JP3416403B2 (en) | MPEG audio decoder | |
JP2001175292A (en) | Audio signal encoding/decoding device | |
JP3776004B2 (en) | Encoding method of digital data | |
JPH1070467A (en) | Audio signal coding/decoding device and audio signal reproducing device | |
JPH06289900A (en) | Audio encoding device | |
JPH1083623A (en) | Signal recording method, signal recorder, recording medium and signal processing method | |
JP3454394B2 (en) | Quasi-lossless audio encoding device | |
JPH06309895A (en) | Semiconductor memory audio recording and reproducing device | |
JPH0793892A (en) | Semiconductor memory audio recording and reproducing device | |
JP3175456B2 (en) | Digital signal processor | |
JP3334374B2 (en) | Digital signal compression method and apparatus | |
JP2000078018A (en) | Voice coding system and device and data recording medium | |
JPH06338861A (en) | Method and device for processing digital signal and recording medium | |
JP3527758B2 (en) | Information recording device | |
JP2000293199A (en) | Voice coding method and recording and reproducing device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071010 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081010 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091010 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091010 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101010 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111010 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121010 Year of fee payment: 9 |