JP3371462B2 - Audio signal recording / playback device - Google Patents
Audio signal recording / playback deviceInfo
- Publication number
- JP3371462B2 JP3371462B2 JP09313693A JP9313693A JP3371462B2 JP 3371462 B2 JP3371462 B2 JP 3371462B2 JP 09313693 A JP09313693 A JP 09313693A JP 9313693 A JP9313693 A JP 9313693A JP 3371462 B2 JP3371462 B2 JP 3371462B2
- Authority
- JP
- Japan
- Prior art keywords
- hierarchical
- information amount
- audio signal
- amount
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
【0001】[0001]
【産業上の利用分野】この発明は、オーディオ信号を記
録、再生するオーディオ信号記録・再生装置(以下、
「オーディオレコーダ」という)に関するものである。BACKGROUND OF THE INVENTION The present invention records audio signals.
Audio signal recording / playback device for recording and playing (hereinafter,
"Audio recorder").
【0002】[0002]
【従来の技術】現在、小型のオーディオレコーダとして
は、一般に磁気テープを用いたテープレコーダが広く用
いられている。しかしテープレコーダは、複雑なメカニ
カルな部分や電磁変換部分を含むため、小型化には限界
があり、振動に弱い、また、電池寿命が短い、繰り返し
によるメカニカル部の磨耗がある、ランダムアクセスは
困難、録音/再生の立ち上がり速度にも限界がある等と
いった欠点がある。2. Description of the Related Art At present, a tape recorder using a magnetic tape is widely used as a small audio recorder. However, since the tape recorder includes complicated mechanical parts and electromagnetic conversion parts, there is a limit to miniaturization, it is weak against vibration, the battery life is short, the mechanical part is worn repeatedly, and random access is difficult. However, there are drawbacks such as a limited start-up speed for recording / playback.
【0003】一方、近年の半導体技術の進歩は目覚まし
く、半導体メモリの大容量化が著しく進んでいる。これ
に伴い、半導体メモリのオーディオ記録や画像記録とい
ったAV分野への応用が種々考えられて来ている。半導
体メモリの音声(オーディオ)記録への応用例は、留守
番電話、各種おもちゃ、また駅のアナウンスマシーン
等、まだ記録時間は短いが、種々の製品に使用されてい
る。On the other hand, the recent progress in semiconductor technology has been remarkable, and the capacity of semiconductor memories has been significantly increased. Along with this, various applications to the AV field such as audio recording and image recording of a semiconductor memory have been considered. The application examples of the semiconductor memory to voice recording are used for various products such as answering machines, various toys, and station announcement machines, although the recording time is still short.
【0004】[0004]
【発明が解決しようとする課題】従来の半導体メモリを
記録媒体としたオーディオレコーダは、オーディオ信号
を一定の情報量のまま記録するように構成されているの
で、記録時間は半導体メモリの容量で決定されてしま
い、記録中にメモリがなくなった場合などは、いったん
録音を中断し、新しい半導体メモリに交換するといった
作業が必要で、大切な情報が欠落する、もしくは、音楽
信号が途中で途切れてしまうといった問題点があった。Since an audio recorder using a conventional semiconductor memory as a recording medium is configured to record an audio signal with a constant amount of information, the recording time is determined by the capacity of the semiconductor memory. If the memory runs out during recording, it will be necessary to temporarily stop recording and replace it with a new semiconductor memory, and important information will be lost or the music signal will be interrupted halfway. There was a problem such as.
【0005】また、従来の磁気テープを用いたテープレ
コーダや半導体メモリを記録媒体としたオーディオレコ
ーダは、オーディオ信号を固定長フレームで記録するよ
うに構成されているので、記録するオーディオデータを
一定のレートに圧縮する高能率符号化方式も、MPEG
のオーディオ符号化方式のように、1フレーム(例えば
384サンプル)のオーディオデータを固定長の符号化
フレームにするように符号化される。ところが、オーデ
ィオデータを所定の音質で圧縮する場合、各フレームの
情報量は異なる。例えば、無音部分はほとんど情報量が
なく、アタック音等の急激な変化を生じる部分では情報
量が多くなる。よって、1フレームの信号を固定長フレ
ームで符号化するような符号化方式では、情報量の少な
いフレームには必要以上のビットが割り当てられ、反対
に情報量の多いフレームには必要なビットが割り当てら
れないといった問題点が生じる。Further, since a conventional tape recorder using a magnetic tape and an audio recorder using a semiconductor memory as a recording medium are configured to record an audio signal in a fixed length frame, the audio data to be recorded is fixed. The high-efficiency coding method of compressing to the rate is also MPEG
As in the audio encoding method of, the audio data of one frame (for example, 384 samples) is encoded so as to be a fixed-length encoded frame. However, when the audio data is compressed with a predetermined sound quality, the information amount of each frame is different. For example, the silent portion has almost no information amount, and the information amount increases at the portion where abrupt changes such as attack sounds occur. Therefore, in an encoding method in which a signal of one frame is encoded by a fixed length frame, more bits than necessary are allocated to a frame having a small amount of information and conversely, necessary bits are allocated to a frame having a large amount of information. There is a problem that it is not possible.
【0006】この発明は上記のような問題点を解決する
ためになされたもので、所定の容量の半導体メモリには
特に記録時間を設けないでも(勿論目安としての記録時
間はあるが)、録音の中断や音楽信号が途中で途切れる
ことなく、引き続き連続して記録できる半導体メモリオ
ーディオレコーダを得ることを目的とする。The present invention has been made to solve the above-mentioned problems, and a semiconductor memory having a predetermined capacity can be recorded even if no recording time is provided (although there is a recording time as a guide). It is an object of the present invention to obtain a semiconductor memory audio recorder capable of continuously recording without interruption of music or interruption of music signal.
【0007】また、高音質でより効率よく半導体メモリ
に記録できる(記録時間を長くできる)半導体メモリオ
ーディオレコーダを得ることを目的とする。It is another object of the present invention to obtain a semiconductor memory audio recorder which can record in a semiconductor memory with high sound quality more efficiently (recording time can be lengthened).
【0008】また、可変長フレームで記録されている半
導体メモリから記録データを高速再生することを目的と
する。It is another object of the present invention to reproduce recorded data at high speed from a semiconductor memory recorded in variable length frames.
【0009】更に、半導体メモリに記録されたデータか
ら無音部分等の不要な部分を飛ばし、必要なデータが記
録されている部分のみを再生することにより「早聞き」
が行える半導体メモリオーディオレコーダを得ることを
目的とする。Furthermore, "quick listening" is performed by skipping unnecessary portions such as silent portions from the data recorded in the semiconductor memory and reproducing only the portion in which the necessary data is recorded.
It is an object of the present invention to obtain a semiconductor memory audio recorder capable of performing.
【0010】[0010]
【課題を解決するための手段】この発明に係るオーディ
オ信号記録装置は、オーディオ信号をディジタル信号に
符号化して記録媒体に記録するオーディオ信号記録装置
であって、オーディオ信号を複数の階層符号ブロックに
分割し、優先順位の低い階層符号ブロックが欠如しても
優先順位の高い階層符号ブロックのみでオーディオ信号
が復号できるように各階層符号ブロックに優先順位を持
たせて符号化する階層符号化手段と、上記記録媒体の記
憶容量が所定量に達した場合に優先順位の低い階層符号
ブロックのオーディオ信号が書き込まれている記録エリ
アから順次優先順位の高い階層符号ブロックのオーディ
オ信号を上書きする制御手段と、上記記録媒体に記録さ
れるオーディオ信号の階層レベルの識別信号を該記録媒
体に記録する識別信号記録手段とを備えたことを特徴と
する。 An audio device according to the present invention
The signal recording device converts the audio signal into a digital signal.
Audio signal recording apparatus for encoding and recording on recording medium
And the audio signal into multiple hierarchical code blocks
Even if there is a lack of hierarchical code blocks
Audio signal with only high priority hierarchical code blocks
Has a priority in each hierarchical code block so that
A layered encoding means for performing additional encoding, and the recording medium described above.
Hierarchical code with lower priority when the storage capacity reaches a predetermined amount
The recording area where the audio signal of the block is written.
Audio from hierarchical code blocks with higher priority
Control means for overwriting the audio signal and recorded on the recording medium.
The identification signal of the hierarchical level of the audio signal to be recorded
An identification signal recording means for recording on the body,
To do.
【0011】この発明に係るオーディオ信号再生装置
は、オーディオ信号をディジタル信号に変換し、この信
号を最も優先順位の低い階層ブロックから順に符号化す
る階層符号化手段により複数の階層ブロックに分割し、
記録媒体に記録したオーディオ信号を再生するオーディ
オ信号再生装置であって、上記記録媒体の読み出し速度
を可変できる可変速再生制御手段と、上記階層化された
オーディオデータの階層レベルが低い信号のみの復号で
は復号処理時間が短く、復号する階層レベルが高くなる
に従って復号処理時間が長くなる階層復号化手段と、上
記可変速再生制御手段の再生速度から上記階層復号化手
段に割り当てられる復号時間を求め、この時間内に復号
可能な階層レベルを判断して、上記階層復号化手段に指
示を出す復号階層レベル判定手段とを備えたことを特徴
とする。 Audio signal reproducing apparatus according to the present invention
Converts the audio signal into a digital signal and
Codes in order from the hierarchical block with the lowest priority.
Divided into a plurality of hierarchical blocks by the hierarchical coding means
Audio that plays back audio signals recorded on a recording medium
A signal reproducing device, the reading speed of the recording medium
Variable speed reproduction control means that can change the
Decoding only signals with low audio data hierarchy levels
Takes less time to decrypt and higher levels of decryption
According to the hierarchical decoding means
Based on the reproduction speed of the variable speed reproduction control means, the hierarchical decoding
Find the decoding time assigned to the stage and decode within this time
Judge the possible hierarchy levels and instruct the above hierarchy decoding means.
And a decoding hierarchy level determining means for outputting an indication.
And
【0012】この発明に係るオーディオ信号記録装置
は、オーディオ信号をディジタル信号に符号化して記録
媒体に記録するオーディオ信号記録装置において、オー
ディオ信号を複数の階層ブロックに分割し、各階層ブロ
ックに優先順位を持たせ、最も優先順位の低い階層ブロ
ックから順に欠如していってもオーディオ品質は劣化す
るものの、正常なオーディオ信号の復号が可能な階層符
号化手段を備え、その階層符号化手段において入力した
ディジタルオーディオ信号を複数の周波数帯域に分割す
るサブバンド分割手段、入力したディジタルオーディオ
信号を周波数領域に直交変換し聴覚特性に基づいて可聴
成分を抽出する可聴成分抽出手段、可聴成分より各フレ
ームごとにサブバンドごとの情報量を算出する第1の情
報量算出手段、サブバンドごとの情報量の総計により各
フレームの情報量を算出する第2の情報量算出手段、最
終的な平均割当情報量が所望のビットレートに近づくよ
うに割当帯域を決定するための割当情報量をコントロー
ルする制御手段、及びサブバンドごとの情報量と割当情
報量に基づき各階層に割り当てた帯域の情報量の合計が
各階層あたりの割当情報量に一致するように低域側から
各階層の割当帯域を決定する帯域決定手段を有し、各フ
レームごとに割当帯域と割当情報量を可変とすることを
特徴とする。 Audio signal recording apparatus according to the present invention
Records audio signals encoded into digital signals
In an audio signal recording device for recording on a medium,
Divide the audio signal into multiple hierarchical blocks and
Priorities to the hierarchy and the lowest priority hierarchy block.
Audio quality deteriorates even if the
Although it is a hierarchical code that can decode a normal audio signal
A coding means is provided, and the data is input in the hierarchical coding means.
Split a digital audio signal into multiple frequency bands
Sub-band dividing means, input digital audio
The signal is orthogonally transformed into the frequency domain and audible based on auditory characteristics
Audible component extraction means for extracting components,
The first information that calculates the amount of information for each subband for each
Each is based on the information volume calculation means and the total amount of information for each sub-band.
A second information amount calculating means for calculating the information amount of the frame,
The final average allocated information amount approaches the desired bit rate.
Control the amount of allocated information to determine the allocated bandwidth.
Control means, and the amount of information and allocation information for each sub-band.
The total amount of bandwidth information allocated to each tier is
From the low frequency side so that it matches the amount of assigned information for each layer
It has a band deciding unit that decides the allocated band of each tier.
It is possible to change the allocation bandwidth and allocation information amount for each frame.
Characterize.
【0013】この発明に係るオーディオ信号記録装置
は、オーディオ信号を複数の階層ブロックに分割し、各
階層ブロックに優先順位を持たせて、最も優先順位の低
い階層ブロックから順に欠如していってもオーディオ品
質は劣化するものの、正常なオーディオ信号の復号が可
能な階層符号化手段を備えたオーディオ信号記録装置に
おいて、入力したディジタルオーディオ信号を複数の周
波数帯域に分割するサブバンド分割手段、入力したディ
ジタルオーディオ信号を周波数領域に直交変換し聴覚特
性に基づいて可聴成分を抽出する可聴成分抽出手段、各
フレームごとに可聴成分を用いて瞬時情報量を算出する
瞬時情報量算出手段、割当帯域を一定とする数フレーム
を1サイクルとし、1サイクルの可聴成分の平均値から
サブバンドごとの平均情報量を算出する平均情報量算出
手段、最終的な平均割当情報量が所望のビットレートに
近づくように各フレームの瞬時情報量に対し、1サイク
ルの区間割当情報量を平均割当情報量に従って増減させ
るようコントロールする制御手段、及びサブバンドごと
の平均情報量と区間割当情報量に基づき各階層に割り当
てた帯域の情報量の合計が各階層あたりの区間割当情報
量に一致するように低域側から1サイクル間の各階層の
割当帯域を決定する帯域決定手段を有し、1サイクルご
とに得られる各階層の割当帯域に対し、各フレームごと
に各割当帯域内の可聴成分に対し、その大きさに従って
再ビット割当を行うことにより、1サイクルごとに割当
帯域を1フレームごとに割当情報量を可変とすることを
特徴とする。 Audio signal recording apparatus according to the present invention
Divides the audio signal into multiple hierarchical blocks,
Hierarchical blocks are given priority so that they have the lowest priority.
Audio products even if they are lacking in order from the highest hierarchical block
Normal quality audio signal can be decoded although quality is degraded
Audio signal recording apparatus equipped with an effective hierarchical encoding means
The input digital audio signal
Sub-band dividing means for dividing into wave number bands, input di
The digital audio signal is orthogonally transformed into the frequency domain and
Audible component extraction means for extracting audible components based on sex,
Calculate the amount of instantaneous information using the audible component for each frame
Instantaneous information amount calculation means, several frames with constant allocated bandwidth
Is set as 1 cycle, and from the average value of the audible components of 1 cycle
Calculate the average information amount to calculate the average information amount for each subband
Means, the final average allocation information amount to the desired bit rate
One cycle for the amount of instantaneous information in each frame
Increase or decrease the section allocation information amount according to the average allocation information amount.
Control means to control so that each sub-band
Assigned to each layer based on the average amount of information and section allocation information amount
The total amount of bandwidth information is the section allocation information for each tier
To match the amount of each layer for one cycle from the low frequency side
Each cycle has a bandwidth determining means for determining the allocated bandwidth.
For each bandwidth allocated to each layer,
For each audible component in each allocated band according to its magnitude
Allocate every cycle by reallocating bits
It is possible to change the amount of allocated information for each frame
Characterize.
【0014】この発明に係るオーディオ信号記録装置
は、オーディオ信号を複数の階層ブロックに分割し、各
階層ブロックに優先順位を持たせて、最も優先順位の低
い階層ブロックから順に欠如していってもオーディオ品
質は劣化するものの、正常なオーディオ信号の復号が可
能な階層符号化手段を備えたオーディオ信号記録装置に
おいて、入力したディジタルオーディオ信号を複数の周
波数帯域に分割するサブバンド分割手段、入力したディ
ジタルオーディオ信号を周波数領域に直交変換し聴覚特
性に基づいて可聴成分を抽出する可聴成分抽出手段、可
聴成分より各フレームごとにサブバンドごとの情報量を
算出する情報量算出手段、サブバンドごとの情報量から
各フレームごとに瞬時情報量を算出する瞬時情報量算出
手段、サブバンドごとの情報量の変化を平滑化する第1
の平滑化手段、最終的な平均割当情報量が所望のビット
レートに近づくように各フレームの瞬時情報量に対し、
瞬時割当情報量を平均割当情報量に従って増減させるよ
うにコントロールする制御手段、瞬時割当情報量の変化
を平滑化する第2の平滑化手段、及びサブバンドごとの
平滑化された情報量と平滑化された割当情報量に基づ
き、各フレームごとに各階層に割り当てた帯域の情報量
の合計が各階層あたりの割当情報量に一致するように低
域側から各階層の割当帯域を決定する帯域決定手段を有
し、各フレームごとに緩やかに変化する各階層の割当帯
域に対し、各フレームごとに各割当帯域内の可聴成分に
対し、その大きさに従って再ビット割当を行なうことに
より、各フレームで割当帯域を緩やかに変化させ、その
割当帯域内の割当情報量を可変とすることを特徴とす
る。 Audio signal recording apparatus according to the present invention
Divides the audio signal into multiple hierarchical blocks,
Hierarchical blocks are given priority so that they have the lowest priority.
Audio products even if they are lacking in order from the highest hierarchical block
Normal quality audio signal can be decoded although quality is degraded
Audio signal recording apparatus equipped with an effective hierarchical encoding means
The input digital audio signal
Sub-band dividing means for dividing into wave number bands, input di
The digital audio signal is orthogonally transformed into the frequency domain and
Audible component extraction means for extracting the audible component based on sex,
The amount of information for each subband for each frame from the listening component
Information amount calculation means to calculate, from the information amount for each sub-band
Instantaneous information amount calculation that calculates the instantaneous information amount for each frame
First means for smoothing changes in the amount of information for each subband
Smoothing means, the final average allocation information amount is the desired bit
For the instantaneous information amount of each frame to approach the rate,
Increase or decrease the instantaneous allocation information amount according to the average allocation information amount.
Control means to control like this
A second smoothing means for smoothing
Based on the smoothed information amount and the smoothed assigned information amount
Information amount of the bandwidth allocated to each layer for each frame
Is low so that the total of
Bandwidth determination means to determine bandwidth allocation for each layer from the area side
However, the allocation band of each layer that changes slowly for each frame
Audible components in each allocated band for each frame
On the other hand, reallocating bits according to its size
Change the allocated bandwidth gently in each frame,
The feature is that the amount of allocation information in the allocated bandwidth is variable
It
【0015】また、所望のビットレートに従ったフレー
ム当たりの情報量とビット割当情報量の差分を抽出する
比較手段、抽出した差分を平滑化する第3の平滑化手
段、及び上記第3の平滑化手段からの差分を符号化比率
に変換する変換手段を有し、所望のビットレートと割当
情報の差の累積値に従い緩やかに変化する符号化比率
を、各フレームの情報量に乗算することによって割当情
報量を制御することにより可変長フレーム符号化におけ
る情報量を平均的に所定のビットレートに制御すること
を特徴とする。 In addition, the frame according to the desired bit rate
Extract the difference between the amount of information per program and the amount of bit allocation information
Comparison means, third smoothing means for smoothing the extracted difference
Stage, and the difference from the third smoothing means is the coding ratio.
It has a conversion means to convert to the desired bit rate and allocation
Coding ratio that changes gently according to the cumulative value of the information difference
Is calculated by multiplying the information amount of each frame by
In variable-length frame coding by controlling the amount of information
Control the amount of information to be averaged to a predetermined bit rate
Is characterized by.
【0016】[0016]
【0017】[0017]
【0018】[0018]
【0019】[0019]
【0020】[0020]
【作用】この発明のオーディオ信号記録装置によれば、
オーディオ信号をディジタル信号に符号化して記録媒体
に記録するに際し、オーディオ信号を複数の階層符号ブ
ロックに分割し、各階層符号ブロックに優先順位を持た
せて符号化し、記録媒体の記憶容量が所定量に達した場
合に優先順位の低い階層符号ブロックのオーディオ信号
が書き込まれている記録エリアから順次優先順位の高い
階層符号ブロックのオーディオ信号を上書きし、上記記
録媒体に記録されるオーディオ信号の階層レベルの識別
信号を該記録媒体に記録するようにした。 According to the audio signal recording apparatus of the present invention,
Recording medium by encoding audio signals into digital signals
When recording the audio signal on the
Divide into locks and give priority to each hierarchical code block
If the storage capacity of the recording medium reaches a specified amount,
Audio signal of hierarchical code block with low priority
From the recording area in which the
Overwrite the audio signal of the hierarchical code block and
Identification of hierarchical levels of audio signals recorded on recording media
The signal was recorded on the recording medium.
【0021】この発明のオーディオ信号再生装置によれ
ば、オーディオ信号をディジタル信号に変換され、この
信号を最も優先順位の低い階層ブロックから順に符号化
され階層符号化により複数の階層ブロックに分割されて
記録媒体に記録されたオーディオ信号を再生するに際
し、上記記録媒体の読み出し速度を可変とし、上記階層
化されたオーディオデータの階層レベルが低い信号のみ
の復号では復号処理時間が短く、復号する階層レベルが
高くなるに従って復号処理時間が長くなるように階層復
号化を行い、上記記録媒体の読み出して再生する再生速
度から階層復号化に割り当てられる復号時間を求め、こ
の時間内に復号可能な階層レベルを判断して、階層復号
化を施すべき復号可能な階層レベルを判定するようにし
た。 According to the audio signal reproducing apparatus of the present invention
For example, an audio signal is converted into a digital signal,
Encode signal in order of lowest priority hierarchical block
Is divided into multiple hierarchical blocks by hierarchical coding
When playing back the audio signal recorded on the recording medium
The read speed of the recording medium is variable, and
Only signals with low hierarchical level of encrypted audio data
Decoding process takes a short time, and the hierarchical level
Hierarchical recovery is performed so that the decoding processing time becomes longer as it gets higher.
Playback speed for encoding and reading the above recording medium for playback
Degree to obtain the decoding time assigned to hierarchical decoding.
Determining the level that can be decoded within the time
To determine the decodable hierarchy level that should be
It was
【0022】この発明のオーディオ信号記録装置によれ
ば、オーディオ信号をディジタル信号に符号化して記録
媒体に記録するに際し、オーディオ信号を複数の階層ブ
ロックに分割し、各階層ブロックに優先順位を持たせ、
最も優先順位の低い階層ブロックから順に欠如していっ
てもオーディオ品質は劣化するものの、正常なオーディ
オ信号の復号が可能な階層符号化において、入力したデ
ィジタルオーディオ信号を複数の周波数帯域(サブバン
ド)に分割し、入力したディジタルオーディオ信号を周
波数領域に直交変換し聴覚特性に基づいて可聴成分を抽
出し、可聴成分より各フレームごとにサブバンドごとの
第1の情報量を算出し、サブバンドごとの情報量の総計
により各フレームの第2の情報量を算出し、最終的な平
均割当情報量が所望のビットレートに近づくように割当
帯域を決定するための割当情報量をコントロールし、及
びサブバンドごとの情報量と割当情報量に基づき各階層
に割り当てた帯域の情報量の合計が各階層あたりの割当
情報量に一致するように低域側から各階層の割当帯域を
決定し、各フレームごとに割当帯域と割当情報量を可変
とするようにした。 According to the audio signal recording apparatus of the present invention
For example, audio signals are encoded into digital signals and recorded
When recording on a medium, the audio signal is
Divide into locks, give priority to each hierarchical block,
The hierarchical blocks with the lowest priority are missing in order.
Audio quality is degraded, but normal audio
In the hierarchical coding that can decode the
The digital audio signal is divided into multiple frequency bands (subbands).
Input) and divides the input digital audio signal.
Orthogonal transform to the wave number domain and extract audible components based on auditory characteristics
From each audible component for each sub-band for each frame
Calculate the first amount of information and total the amount of information for each subband
The second information amount of each frame is calculated by
Allocation so that the amount of information uniformly allocated approaches the desired bit rate
It controls the amount of allocated information to determine the bandwidth and
Each layer based on the amount of information and the amount of assigned information for each subband
The total amount of bandwidth information allocated to each layer
Allocate the bandwidth of each layer from the low frequency side to match the amount of information.
Decide and change allocation bandwidth and allocation information amount for each frame
I decided to.
【0023】この発明のオーディオ信号記録装置によれ
ば、オーディオ信号を複数の階層ブロックに分割し、各
階層ブロックに優先順位を持たせて、最も優先順位の低
い階層ブロックから順に欠如していってもオーディオ品
質は劣化するものの、正常なオーディオ信号の復号が可
能な階層符号化を行ってオーディオ信号を記録するに際
し、入力したディジタルオーディオ信号を複数の周波数
帯域(サブバンド)に分割し、入力したディジタルオー
ディオ信号を周波数領域に直交変換し聴覚特性に基づい
て可聴成分を抽出し、各フレームごとに可聴成分を用い
て瞬時情報量を算出し、割当帯域を一定とする数フレー
ムを1サイクルとして当該1サイクルの可聴成分の平均
値からサブバンドごとの平均情報量を算出し、最終的な
平均割当情報量が所望のビットレートに近づくように各
フレームの瞬時情報量に対して1サイクルの区間割当情
報量を平均割当情報量に従って増減させるようコントロ
ールし、及びサブバンドごとの平均情報量と区間割当情
報量に基づき各階層に割り当てた帯域の情報量の合計が
各階層あたりの区間割当情報量に一致するように低域側
から1サイクル間の各階層の割当帯域を決定し、1サイ
クルごとに得られる各階層の割当帯域に対し、各フレー
ムごとに各割当帯域内の可聴成分に対し、その大きさに
従って再ビット割当を行うことにより、1サイクルごと
に割当帯域を1フレームごとに割当情報量を可変とする
ようにした。 According to the audio signal recording apparatus of the present invention
For example, divide the audio signal into multiple hierarchical blocks,
Hierarchical blocks are given priority so that they have the lowest priority.
Audio products even if they are lacking in order from the highest hierarchical block
Normal quality audio signal can be decoded although quality is degraded
When recording an audio signal with effective hierarchical coding
The input digital audio signal at multiple frequencies.
It is divided into bands (subbands) and the input digital audio
Orthogonal transform of Dio signal to frequency domain and based on auditory characteristics
To extract the audible component, and use the audible component for each frame
The instantaneous amount of information is calculated by
The average of the audible components in the 1 cycle
The average amount of information for each subband is calculated from the values, and the final
The average allocation information amount is adjusted so that it approaches the desired bit rate.
1-cycle section allocation information for instantaneous information amount of frame
Control to increase / decrease the amount of information according to the average amount of assigned information.
And the average amount of information and section allocation information for each subband.
The total amount of bandwidth information allocated to each tier is
Low-frequency side to match the section allocation information amount for each layer
To determine the allocated bandwidth of each layer for one cycle from
For each bandwidth allocated to each layer, each frame
For each audible component in each allocated band,
Therefore, by re-allocating bits,
The allocation bandwidth is made variable for each frame.
I did it.
【0024】この発明のオーディオ信号記録装置によれ
ば、オーディオ信号を複数の階層ブロックに分割し、各
階層ブロックに優先順位を持たせて、最も優先順位の低
い階層ブロックから順に欠如していってもオーディオ品
質は劣化するものの、正常なオーディオ信号の復号が可
能な階層符号化を行ってオーディオ信号を記録するに際
し、入力したディジタルオーディオ信号を複数の周波数
帯域(サブバンド)に分割し、入力したディジタルオー
ディオ信号を周波数領域に直交変換し聴覚特性に基づい
て可聴成分を抽出し、可聴成分より各フレームごとにサ
ブバンドごとの情報量を算出し、サブバンドごとの情報
量から各フレームごとに瞬時情報量を算出し、サブバン
ドごとの情報量の変化を平滑化する第1の平滑化行い、
最終的な平均割当情報量が所望のビットレートに近づく
ように各フレームの瞬時情報量に対し、瞬時割当情報量
を平均割当情報量に従って増減させるようにコントロー
ルし、瞬時割当情報量の変化を平滑化する第2の平滑化
を行い、及びサブバンドごとの平滑化された情報量と平
滑化された割当情報量に基づき、各フレームごとに各階
層に割り当てた帯域の情報量の合計が各階層あたりの割
当情報量に一致するように低域側から各階層の割当帯域
を決定し、各フレームごとに緩やかに変化する各階層の
割当帯域に対し、各フレームごとに各割当帯域内の可聴
成分に対し、その大きさに従って再ビット割当を行なう
ことにより、各フレームで割当帯域を緩やかに変化さ
せ、その割当帯域内の割当情報量を可変とすることを特
徴とする。 According to the audio signal recording apparatus of the present invention
For example, divide the audio signal into multiple hierarchical blocks,
Hierarchical blocks are given priority so that they have the lowest priority.
Audio products even if they are lacking in order from the highest hierarchical block
Normal quality audio signal can be decoded although quality is degraded
When recording an audio signal with effective hierarchical coding
The input digital audio signal at multiple frequencies.
It is divided into bands (subbands) and the input digital audio
Orthogonal transform of Dio signal to frequency domain and based on auditory characteristics
To extract the audible components, and to support each frame from the audible components.
Information for each subband is calculated by calculating the amount of information for each band.
The amount of instantaneous information is calculated for each frame from
The first smoothing that smoothes the change in the amount of information for each
The final average allocated information amount approaches the desired bit rate
The instantaneous allocation information amount for each frame
Control to increase / decrease according to the average allocation information amount
Second smoothing for smoothing changes in the instantaneous allocation information amount
, And smoothed information amount and sub-band for each sub-band.
Each floor for each frame based on the amount of allocated information
The total amount of bandwidth information allocated to each layer is the percentage of each layer.
Allocated bandwidth of each layer from the low frequency side to match this information amount
Of each layer that gradually changes for each frame
The audible signal within each allocated band for each frame
Re-allocate components according to their size
This allows the allocated bandwidth to be changed gently in each frame.
In this case, the amount of allocation information within the allocated bandwidth is variable.
To collect.
【0025】また、所望のビットレートに従ったフレー
ム当たりの情報量とビット割当情報量の差分を抽出し、
該抽出した差分を平滑化する第3の平滑化を行い、及び
上記第3の平滑化後の差分を符号化比率に変換し、所望
のビットレートと割当情報の差の累積値に従い緩やかに
変化する符号化比率を、各フレームの情報量に乗算する
ことによって割当情報量を制御することにより可変長フ
レーム符号化における情報量を平均的に所定のビットレ
ートに制御するように構成した。 In addition, the frame according to the desired bit rate
Extract the difference between the information amount per bit and the bit allocation information amount,
Performing a third smoothing to smooth the extracted difference, and
The third smoothed difference is converted into a coding ratio, and the desired
Gradually according to the cumulative value of the difference between the bit rate and the allocation information
Multiply the amount of information in each frame by the changing coding ratio
By controlling the amount of information allocated by
The amount of information in ram coding is averaged over a predetermined bit rate.
Configured to control.
【0026】[0026]
【0027】[0027]
【0028】[0028]
【0029】[0029]
【0030】[0030]
【0031】[0031]
【0032】[0032]
【0033】[0033]
【0034】[0034]
【0035】[0035]
【0036】[0036]
【実施例】実施例1.
以下、この発明の実施例1を図について説明する。実施
例1では、説明を簡単化するためにオーディオ符号化の
階層符号ブロック分割数を2として説明するが、分割数
が増えた場合でも、基本的な考え方は同じである。図1
において、1はオーディオ信号の入力端子、2は次段で
必要なオーディオレベルに合わせるオーディオアンプ、
3はオーディオ信号をディジタル信号に変換するA/D
変換器、4はディジタルオーディオ信号の階層符号化を
行う階層符号化器、5はオーディオ信号の記録媒体であ
る半導体メモリ、6は半導体メモリ5に階層符号化器4
からのオーディオ信号を所定のアドレスへ書き込み、ま
た、所定のアドレスからオーディオ信号を読み出して階
層復号化器7に送り出すメモリアドレス制御器、7は階
層符号化器4で符号化されたオーディオ信号を復号する
階層復号化器、8はディジタルオーディオ信号をアナロ
グオーディオ信号に変換するD/A変換器、9はD/A
変換器の出力を示談で必要なオーディオレベルに合わせ
るオーディオアンプ、10はオーディオ信号の出力端
子、14はクロック発生器である。EXAMPLES Example 1. Embodiment 1 of the present invention will be described below with reference to the drawings. In the first embodiment, in order to simplify the description, the number of hierarchical code block divisions for audio encoding is set to 2, but the basic idea is the same even when the number of divisions increases. Figure 1
, 1 is an audio signal input terminal, 2 is an audio amplifier for adjusting the audio level required in the next stage,
3 is an A / D for converting an audio signal into a digital signal
A converter, 4 is a hierarchical encoder for hierarchically encoding a digital audio signal, 5 is a semiconductor memory which is a recording medium of an audio signal, 6 is a semiconductor memory 5 and a hierarchical encoder 4
The memory address controller for writing the audio signal from the specified address to the specified address, and reading the audio signal from the specified address and sending it to the hierarchical decoder 7, and 7 is for decoding the audio signal encoded by the hierarchical encoder 4. Hierarchical decoder, 8 is a D / A converter for converting a digital audio signal into an analog audio signal, and 9 is a D / A
An audio amplifier 10 for adjusting the output of the converter to an audio level required for negotiations, 10 is an output terminal of an audio signal, and 14 is a clock generator.
【0037】図2,図3は、階層符号化器4において、
ディジタル化されたオーディオ信号を、2分割符号化を
行う構成例を示した図である。図2の構成例では、16
ビットのディジタルオーディオ信号を、上位8ビットを
階層符号ブロック1,下位8ビットを階層符号ブロック
2として分割する。FIGS. 2 and 3 show that in the hierarchical encoder 4,
It is the figure which showed the example of a structure which performs the 2 division encoding of the digitized audio signal. In the configuration example of FIG. 2, 16
The high-order 8 bits of the bit digital audio signal are divided into the hierarchical code block 1 and the lower 8 bits are divided into the hierarchical code block 2.
【0038】また、図3の構成例では、4分割のサブバ
ンド分割フィルタ15でオーディオ周波数を4つのサブ
バンドに分割し、ビット割当器16で、各サブバンド毎
に階層符号ブロック1と階層符号ブロック2へのビット
割当てを定め、各サブバンド毎の階層符号ブロック1と
階層符号ブロック2の信号量の合計が、2分割となるよ
うにコントロールする。Further, in the configuration example of FIG. 3, the audio frequency is divided into four subbands by the four-division subband division filter 15, and the bit allocator 16 makes the hierarchical code block 1 and the hierarchical code for each subband. Bit allocation to block 2 is determined, and control is performed so that the sum of the signal amounts of hierarchical code block 1 and hierarchical code block 2 for each subband is divided into two.
【0039】図2,図3の何れの構成例の場合も、量子
化ビットの上位ビット側を優先順位の高い階層符号ブロ
ック1に割り当てることで、下位ビットの階層符号ブロ
ック2が欠落しても、、音質は劣化するが、オーディオ
信号を再現することができる。In both the configuration examples of FIGS. 2 and 3, by assigning the higher-order bit side of the quantized bit to the higher-order hierarchical code block 1, even if the lower-order hierarchical code block 2 is missing. ,, although the sound quality is deteriorated, the audio signal can be reproduced.
【0040】また、図3の帯域分割を行う方式では、人
の聴感特性を考慮してビットの割当てを最適にすること
で、オーディオ信号が階層符号ブロック1だけになった
場合でも、音質の劣化を極力少なくすることがきる。Further, in the band division method of FIG. 3, the bit allocation is optimized in consideration of human hearing characteristics, so that the sound quality is deteriorated even when the audio signal is only the hierarchical code block 1. Can be reduced as much as possible.
【0041】図4は、半導体メモリ5上のメモリマップ
を示しており、オーディオ階層符号ブロックの識別コー
ドを記録する制御データエリアと、オーディオ信号を記
録するオーディオエリアAと、オーディオエリアBから
なる。図5は、オーディオ信号の半導体メモリ5への記
録状況を、時間経過にしたがって示したものである。FIG. 4 shows a memory map on the semiconductor memory 5, which is composed of a control data area for recording an identification code of an audio hierarchical code block, an audio area A for recording an audio signal, and an audio area B. FIG. 5 shows how an audio signal is recorded in the semiconductor memory 5 with the lapse of time.
【0042】次に、まず、記録系の動作について説明す
る。図1において、入力端子1に入力されたオーディオ
信号は、オーディオアンプ2で所定のレベルに増幅さ
れ、A/D変換器3にてディジタル信号に変換され、階
層符号化器4に入力される。階層符号化器4では、ディ
ジタル化されたオーディオ信号を図2または図3に示し
た方法により、階層符号ブロック1に記録する信号と、
階層符号ブロック2に記録する信号の2つに分割する。Next, the operation of the recording system will be described first. In FIG. 1, the audio signal input to the input terminal 1 is amplified to a predetermined level by the audio amplifier 2, converted into a digital signal by the A / D converter 3, and input to the hierarchical encoder 4. In the hierarchical encoder 4, a signal for recording the digitized audio signal in the hierarchical code block 1 by the method shown in FIG. 2 or 3,
It is divided into two signals to be recorded in the hierarchical code block 2.
【0043】2つに分割された符号化信号は、半導体メ
モリ5に、図4に示すメモリマップのように記録され
る。記録の流れは、記録開始時は、図5(a)に示すよ
うにオーディオエリアAには符号器4で符号化された階
層符号ブロック1が、また、オーディオエリアBには階
層符号ブロック2が順番に記録される。図5(b)はオ
ーディオ信号が順次記録され、メモリ5がほぼ満杯にな
った状態を示している。The coded signal divided into two is recorded in the semiconductor memory 5 as shown in the memory map of FIG. At the start of recording, as shown in FIG. 5A, the recording flow is such that the hierarchical code block 1 encoded by the encoder 4 is present in the audio area A and the hierarchical code block 2 is present in the audio area B. It is recorded in order. FIG. 5B shows a state where the audio signals are sequentially recorded and the memory 5 is almost full.
【0044】図5(c)は、さらに連続したオーディオ
信号を記録するために、優先順位の低い階層符号ブロッ
ク2のオーディオ信号の書き込みエリア(この場合はオ
ーディオエリアB)に上書きする形で、引き続き、オー
ディオ信号の階層符号ブロック1のみが記録される。FIG. 5C shows that the audio signal writing area (audio area B in this case) of the hierarchical code block 2 having a lower priority is overwritten in order to record a more continuous audio signal. , Only the hierarchical code block 1 of the audio signal is recorded.
【0045】図5(d)は、このような上書きが行われ
て、記録エリアが満杯になった状態を示している。メモ
リアドレス制御器6は、メモリ容量検出器13からの信
号に応じて、図5で説明した流れになるように、メモリ
アドレスをコントロールする。また、階層レベルの識別
コードは、図5(a),(b)の場合は「階層レベル
1」ということで階層符号ブロック“00”が、また、
図5(c),(d)の場合は「階層レベル2」というこ
とで階層符号ブロック“01”が記録される。FIG. 5D shows a state where the recording area is full due to such overwriting. The memory address controller 6 controls the memory address according to the signal from the memory capacity detector 13 so that the flow described in FIG. In the case of FIGS. 5A and 5B, the hierarchy level identification code is "hierarchical level 1", which means that the hierarchical code block "00"
In the case of FIGS. 5C and 5D, the layer code block "01" is recorded because it is "layer level 2".
【0046】再生時には、まず、階層レベル識別コード
再生器12で階層レベルの識別コードのチェックを行
い、“00”つまり「階層レベル1」の場合には、半導
体メモリ5のオーディオエリアAとオーディオエリアB
を順番にアクセスして、再生オーディオ信号を階層復号
化器7に出力する。また、階層レベルの識別コードが
“01”つまり「階層レベル2」の場合には、半導体メ
モリ5のオーディオエリアAから順番にアクセスして
(オーディオエリアAが終わると続けてオーディオエリ
アBをアクセスする)、再生オーディオ信号を階層復号
化器7に出力する。At the time of reproduction, first, the hierarchy level identification code reproducer 12 checks the identification code of the hierarchy level. In the case of "00", that is, "hierarchical level 1", the audio area A and audio area of the semiconductor memory 5 are checked. B
Are sequentially accessed to output the reproduced audio signal to the hierarchical decoder 7. When the identification code of the hierarchy level is "01", that is, "hierarchy level 2", the semiconductor memory 5 is sequentially accessed from the audio area A (when the audio area A ends, the audio area B is continuously accessed. ), And outputs the reproduced audio signal to the hierarchical decoder 7.
【0047】階層復号化器7では、半導体メモリ5から
の再生信号を「階層レベル1」、「階層レベル2」のい
ずれの場合もディジタルオーディオ信号を復号するよう
に構成されている(「階層レベル2」の再生信号の場合
は、階層レベル識別符号コードにより階層符号ブロック
2の信号に零を入力すればよい)。The hierarchical decoder 7 is configured to decode the reproduced signal from the semiconductor memory 5 into a digital audio signal in both cases of "layer level 1" and "layer level 2"("layerlevel"). In the case of the reproduction signal of "2", zero may be input to the signal of the hierarchical code block 2 by the hierarchical level identification code.
【0048】階層復号化器7の出力は、D/A変換器8
によりアナログオーディオ信号に変換され、オーディオ
アンプ9で所定のオーデイオレベルに増幅されて、出力
端子10から出力される。なお、サンプリングクロック
等の記録再生時にシステム全体で必要なクロックは、ク
ロック発生器14より供給される。The output of the hierarchical decoder 7 is the D / A converter 8
Is converted into an analog audio signal by the audio amplifier 9, amplified by the audio amplifier 9 to a predetermined audio level, and output from the output terminal 10. It should be noted that a clock required for the entire system during recording / reproduction such as a sampling clock is supplied from the clock generator 14.
【0049】実施例2.
図6は、この発明の実施例2のブロック回路で、図1と
同一符号はそれぞれ同一部分を示しており、17は階層
符号化器4で符号化されたオーディオ信号の全てを記録
できる記録容量に余裕のある第1の半導体メモリ、18
はオーディオデータ保存用として所定の容量を持つ(着
脱式ができるメモリカード等)第2の半導体メモリ、1
9は階層レベル変換器で、第1の半導体メモリ17から
第2の半導体メモリ18にオーディオ信号をダビングす
る際、メモリ容量検出器13から出力されるオーディオ
記録時間に応じて、第2の半導体メモリ18のメモリ容
量に丁度合うように、ブロック符号化の優先順位の低い
階層符号ブロックを欠落させることによって、全体の信
号量をコントロールする。Example 2. FIG. 6 is a block circuit of a second embodiment of the present invention, in which the same reference numerals as those in FIG. 1 indicate the same parts, and 17 is a recording capacity capable of recording all of the audio signals encoded by the hierarchical encoder 4. First semiconductor memory with room to spare, 18
Is a second semiconductor memory having a predetermined capacity for storing audio data (a removable memory card or the like), 1
Reference numeral 9 denotes a hierarchical level converter which, when dubbing an audio signal from the first semiconductor memory 17 to the second semiconductor memory 18, determines the second semiconductor memory according to the audio recording time output from the memory capacity detector 13. The total signal amount is controlled by dropping the hierarchical code blocks having the low priority of block coding so as to exactly match the memory capacity of 18.
【0050】20は第1のメモリアドレス制御器で、第
1の半導体メモリ17に階層符号化器4からのオーディ
オ信号を所定のアドレスに記録する制御、および、第1
の半導体メモリ17から第2の半導体メモリ18にダビ
ングする場合に、転送速度を速くして第1の半導体メモ
リ17のデータを読み出す制御を行う。21は第2のメ
モリアドレス制御器で、第2の半導体メモリからオーデ
ィオ信号を所定のアドレスから読み出す制御、および、
第1の半導体メモリ17から第2の半導体メモリ18に
ダビングする場合に転送速度を速くして第2の半導体メ
モリにデータを書き込む制御を行う。Reference numeral 20 is a first memory address controller which controls the first semiconductor memory 17 to record the audio signal from the hierarchical encoder 4 at a predetermined address, and the first memory address controller 20.
When dubbing from the semiconductor memory 17 to the second semiconductor memory 18, the transfer speed is increased to control the reading of the data of the first semiconductor memory 17. Reference numeral 21 denotes a second memory address controller, which controls to read an audio signal from a second semiconductor memory at a predetermined address, and
When dubbing from the first semiconductor memory 17 to the second semiconductor memory 18, the transfer speed is increased to control writing of data to the second semiconductor memory.
【0051】次に、記録系の動作について説明する。入
力端子1に入力されたオーディオ信号は、オーディオア
ンプ2で所定のレベルに増幅され、A/D変換器3にて
ディジタル信号に変換され、階層符号化器4に入力され
る。階層符号化器4では、図2または図3に示したよう
に、優先順位を持った2つの階層符号ブロックの信号に
符号化される。ここで優先順位の低い階層符号ブロック
が欠落して優先順位の高い階層符号ブロックのみとなっ
た場合でも、音質は劣化するもののオーディオ信号が正
常に再生できることは、実施例1と同様である。 2つ
のブロックに分割されて符号化されたオーディオ信号
は、第1のメモリアドレス制御器17からのアドレス信
号に従って第1の半導体メモリ17に記録される。第1
の半導体メモリ17は容量的に余裕があるので、入力さ
れたオーディオ信号は全て記録されることになる。Next, the operation of the recording system will be described. The audio signal input to the input terminal 1 is amplified to a predetermined level by the audio amplifier 2, converted into a digital signal by the A / D converter 3, and input to the hierarchical encoder 4. As shown in FIG. 2 or 3, the hierarchical encoder 4 encodes the signals of two hierarchical code blocks having priorities. Similar to the first embodiment, the audio signal can be normally reproduced even though the sound quality is deteriorated even when the hierarchical code block having the low priority is omitted and only the hierarchical code block having the high priority is left. The audio signal divided into two blocks and encoded is recorded in the first semiconductor memory 17 according to the address signal from the first memory address controller 17. First
Since the semiconductor memory 17 has a sufficient capacity, all the input audio signals will be recorded.
【0052】次に、第1の半導体メモリ17から第2の
半導体メモリ18へのダビング動作について説明する。
メモリ容量検出器13は、第1の半導体メモリ17に書
き込まれたオーディオ信号の記録時間を検出し、この検
出信号を階層レベル変換器19に送り、ここで第2の半
導体メモリ18のメモリ容量とが比較され、信号を減ら
す必要があるか否か、あるとすればどの程度削減させれ
ばよいかを判断し、削減する場合には比率に応じて階層
レベルを変える。つまり、優先順位の低い階層符号ブロ
ックを欠落させる。Next, the dubbing operation from the first semiconductor memory 17 to the second semiconductor memory 18 will be described.
The memory capacity detector 13 detects the recording time of the audio signal written in the first semiconductor memory 17, and sends this detection signal to the hierarchical level converter 19, where the memory capacity of the second semiconductor memory 18 and Are compared to determine whether or not the signal needs to be reduced, and if so, how much to reduce, and when reducing, the hierarchy level is changed according to the ratio. That is, the hierarchical code block with the lower priority is dropped.
【0053】この実施例2では、データの分割数を2と
しているが、この分割数を多くとればとるほど記録時間
と音質の劣化度合いをきめ細やかに制御することがで
き、より半導体メモリを効率よく使用することができる
(記録時間と音質の劣化度合いは直線的な関係にな
る)。In the second embodiment, the number of divisions of the data is set to 2. However, the larger the number of divisions, the finer the control of the recording time and the deterioration degree of the sound quality, and the more efficient the semiconductor memory is. It can be used often (the recording time and the degree of sound quality deterioration have a linear relationship).
【0054】さらに、この階層レベルを階層レベル識別
コード発生器11に送り、識別コードも同時に第2の半
導体メモリ18の制御エリアに記録する。また、ダビン
グ時には、第1のメモリアドレス制御器17と第2のメ
モリアドレス制御器18のアドレッシングを高速に動作
させ、メモリのアクセススピードの許す範囲内で高速に
ダビングさせる。この高速ダビングの機能は、記録媒体
(半導体メモリ)が2組あるにもかかわらず、あたかも
1つで記録しているように見せるために重要な機能であ
る。Further, this hierarchical level is sent to the hierarchical level identification code generator 11, and the identification code is simultaneously recorded in the control area of the second semiconductor memory 18. Further, at the time of dubbing, the addressing of the first memory address controller 17 and the second memory address controller 18 is operated at a high speed, and the dubbing is performed at a high speed within the range permitted by the memory access speed. This high-speed dubbing function is an important function to make it appear as if one recording is performed, even though there are two sets of recording media (semiconductor memories).
【0055】再生時には、まず、階層レベル識別コード
再生器12が第2の半導体メモリ18の制御エリアから
識別コードを判定し、その結果を第2のメモリアドレス
制御器21に送る。第2のメモリアドレス制御器21
は、階層レベルに応じて所定のアドレスから順番に第2
の半導体メモリ18から再生信号を読み出す。At the time of reproduction, first, the hierarchy level identification code reproducer 12 determines the identification code from the control area of the second semiconductor memory 18, and sends the result to the second memory address controller 21. Second memory address controller 21
Is the second from the predetermined address in order according to the hierarchy level.
The read signal is read from the semiconductor memory 18 of FIG.
【0056】階層復号化器7は、いずれの階層レベルの
再生信号であってもそれぞれに応じて復号を行う。階層
復号化器7の出力はD/A変換器8によりアナログオー
ディオ信号に変換され、オーディオアンプ9で所定のオ
ーデイオレベルに増幅されて出力端子10から出力され
る。なお、再生に必要なサンプリングクロック等のクロ
ックは、クロック発生器14から供給される。The hierarchical decoder 7 decodes the reproduced signal of any hierarchical level according to each. The output of the hierarchical decoder 7 is converted into an analog audio signal by the D / A converter 8, amplified by the audio amplifier 9 to a predetermined audio level, and output from the output terminal 10. A clock such as a sampling clock required for reproduction is supplied from the clock generator 14.
【0057】実施例3.
以下、この発明の実施例3を図7〜図11について説明
する。この実施例3では、階層符号化の階層符号ブロッ
ク分割数を4として説明するが、異なる分割数の場合で
も考え方は同じである。図7において、図1と同一符号
はそれぞれ同一部分を示しており、22はディジタルオ
ーディオ信号の階層符号化器、23はメモリアドレル制
御器で、半導体メモリ5に階層符号化器22からのオー
ディオ信号を所定のアドレスへ階層毎に分類して書き込
み、また、所定のアドレスから各階層のオーディオ信号
を読み出し、さらに、半導体メモリ5の容量を検出し、
半導体メモリ5が満杯になると、既に書き込まれたデー
タのうち上記階層符号化器22により優先順位の低い階
層符号ブロックとして書き込まれたデータのメモリエリ
アから順次時間的に連続したオーディオ信号を上書きす
るように制御する。24は階層符号化器22で符号化さ
たオーディオ信号を復号する階層復号化器である。[0057] real施例3. The third embodiment of the present invention will be described below with reference to FIGS. In the third embodiment, the number of hierarchical code block divisions for hierarchical encoding is four, but the idea is the same even when the number of divisions is different. In FIG. 7, the same reference numerals as those in FIG. 1 denote the same parts, 22 is a digital audio signal hierarchical encoder, 23 is a memory adrel controller, and the audio signal from the hierarchical encoder 22 is stored in the semiconductor memory 5. Is written into a predetermined address for each layer, the audio signal of each layer is read from the predetermined address, and the capacity of the semiconductor memory 5 is detected.
When the semiconductor memory 5 becomes full, the audio signals which have been sequentially written over are sequentially overwritten from the memory area of the data written as the low-priority hierarchical code block by the hierarchical encoder 22 among the already written data. To control. A hierarchical decoder 24 decodes the audio signal encoded by the hierarchical encoder 22.
【0058】図8,図9は階層符号化器22において、
ディジタルオーディオ信号を4分割して階層符号化を行
う内容を説明するための図である。まず図8において、
入力された原オーディオ信号から信号の分類を行う、つ
まり人間の聴覚特性である最小可聴限により元々聞こえ
ない信号と、マスキング効果により聞こえなくなった信
号と、さらに聞こえる信号の3つに大別する。次にこの
中から聞こえる信号のみを選択し、図9に示す周波数特
性に従って、さらに4つの階層レベルに分割することを
示している。8 and 9 show the hierarchical encoder 22 in which
It is a figure for demonstrating the content which divides | segments a digital audio signal into 4 and performs hierarchical encoding. First, in FIG.
Signals are classified from the input original audio signals, that is, they are roughly classified into three types: a signal that cannot be heard originally due to the minimum audibility limit which is a human auditory characteristic, a signal that cannot be heard due to a masking effect, and a signal that can be heard further. Next, it is shown that only the signal heard from among these is selected and further divided into four hierarchical levels according to the frequency characteristics shown in FIG.
【0059】図10は階層レベル4の階層符号化器22
の構成、および半導体メモリ5への記録方式について説
明するための図で、27はA/D変換器3でディジタル
信号に変換されたオーディオ信号を所定のブロックに帯
域分割する分割フィルタ、28は分割された信号をMD
CTにより直行変換するMDCT変換器、29は入力信
号の変化に応じてMDCT28の変換ブロックサイズを
設定するブロックサイズ設定器、30はMDCT28の
係数を聴覚心理に基づいてクリティカルバンドに従って
グルーピングを行うグルーピング器、31は図8、図9
に示したオーディオ信号の分類によって、聞こえない信
号を除去し、聞こえる信号を4つの階層レベルに階層化
して量子化する階層化/量子化器、32は聞こえる信号
のみをどのように各周波数帯域にビット配分するかを決
めるダイナミックビット配分器、33はMDCT28の
ブロックに応じてスケールファクタを決定するスケール
ファクタ算出器、34は半導体メモリ5に記録するため
に記録フォーマット化するためのフォーマッティング器
である。また、図10の右側には半導体メモリ5に階層
符号化データを記録する概念を示している。FIG. 10 shows a hierarchical level 22 hierarchical encoder 22.
2 and a recording method for recording in the semiconductor memory 5, 27 is a division filter for dividing the audio signal converted into a digital signal by the A / D converter 3 into predetermined blocks, and 28 is a division filter. MD of the signal
MDCT converter that performs orthogonal transform by CT, 29 is a block size setting device that sets the conversion block size of MDCT 28 according to the change of the input signal, and 30 is a grouping device that groups the coefficients of MDCT 28 according to the critical band based on auditory psychology. , 31 are shown in FIGS.
According to the classification of the audio signals shown in, a layering / quantizer for removing inaudible signals and layering and quantizing the audible signals into four hierarchical levels, 32 is a method of only audible signals in each frequency band A dynamic bit allocator that determines whether to allocate bits, 33 is a scale factor calculator that determines a scale factor according to a block of the MDCT 28, and 34 is a formatter for recording and formatting for recording in the semiconductor memory 5. The right side of FIG. 10 shows the concept of recording hierarchically encoded data in the semiconductor memory 5.
【0060】図11は半導体メモリ5上のメモリマップ
を示す図で、階層レベルの識別コードを記録する制御デ
ータエリア、オーディオ信号を記録するオーディオエリ
ア(階層レベル1〜階層レベル4)からなる。また、図
11中の(1)から(4)は、オーディオ信号の半導体
メモリ5への記録状態を時間経過に応じて示したもので
ある。つまり(1)は階層レベル4で符号化したオーデ
ィオ信号がメモリ満杯にまで記録された状態、(2)は
(1)の状況を経過し、さらに連続してオーディオ信号
を記録した場合で、階層レベル4の記録エリアに階層レ
ベル1〜3で上書きした状態、(3)は(2)の状況を
経過し、さらに連続してオーディオ信号を記録した場合
で、階層レベル3の記録エリアまで階層レベル1〜2で
上書きした状態、(4)は(3)の状況を経過し、さら
に連続してオーディオ信号を記録した場合で、階層レベ
ル2の記録エリアまで階層レベル1で上書きした状態
(メモリ上の全ての信号が階層レベル1になる)を示し
ている。FIG. 11 is a diagram showing a memory map on the semiconductor memory 5, which is composed of a control data area for recording identification codes of hierarchical levels and an audio area for recording audio signals (hierarchical level 1 to hierarchical level 4). Further, (1) to (4) in FIG. 11 show the recording state of the audio signal in the semiconductor memory 5 with the passage of time. That is, (1) is a state in which the audio signal encoded at the hierarchical level 4 is recorded up to the memory full, (2) is the case where the situation in (1) has passed and the audio signal is continuously recorded. In the state where the recording area of level 4 is overwritten with hierarchical levels 1 to 3, (3) is the case where the situation of (2) has passed and the audio signal is continuously recorded, the hierarchical level up to the recording area of hierarchical level 3 1 to 2 overwriting state, (4) when the situation of (3) has passed and audio signals are continuously recorded, the recording area of hierarchy level 2 is overwritten in hierarchy level 1 (on the memory All the signals of (become the hierarchical level 1).
【0061】次に、記録時の実施例1と異なる部分の動
作について説明する。A/D変換器3にてディジタル信
号に変換され、階層符号化器22に入力されたオーディ
オ信号は、階層符号化器22で図8,図9,図10に示
した方法により階層符号化データに変換されて半導体メ
モリ5に記録される。この階層符号化器22では、ま
ず、オーディオ信号を分割フィルタ27により所定のブ
ロックに分割し、一方、ブロックサイズ設定器29によ
りMDCTを行うサプルサイズを決定する。切り出した
サンプルの振幅の変化が少ない場合はMDCTのブロッ
クサイズを大きくし、また振幅の変化が大きい場合はM
DCTのブロックサイズを小さくしてプリエコーの発生
を抑える。Next, the operation of the portion different from the first embodiment at the time of recording will be described. The audio signal converted into a digital signal by the A / D converter 3 and input to the hierarchical encoder 22 is hierarchically encoded data by the method shown in FIGS. 8, 9 and 10 in the hierarchical encoder 22. And is recorded in the semiconductor memory 5. In the hierarchical coder 22, first, the audio signal is divided into predetermined blocks by the division filter 27, while the block size setting unit 29 determines the supple size for MDCT. If there is little change in the amplitude of the clipped sample, increase the block size of MDCT, and if the change in amplitude is large, M
The block size of the DCT is reduced to suppress the occurrence of pre-echo.
【0062】MDCT変換器28では、分割フィルタ2
7で分割された周波数帯域毎にMDCTの変換を行い、
各変換係数は聴覚心理に基づいたグルーピング器30に
よりクリティカルバンド毎にグルーピングされ、階層化
/量子化器31により下記に示すルールに従って4つの
帯域に分割される。図9にその帯域とレンジを示す。In the MDCT converter 28, the division filter 2
MDCT conversion is performed for each frequency band divided in 7.
The transform coefficients are grouped into critical bands by the grouping unit 30 based on auditory psychology, and divided into four bands by the layering / quantizing unit 31 according to the following rules. FIG. 9 shows the band and range.
【0063】1.まず階層レベル1として、複数の周波
数帯域に分割された各係数の中から、低域の係数から所
定の周波数帯域f1までの係数を選択し、かつその係数
の量子化レベルもMSB側から所定のビット数を選択
し、これを階層レベル1の符号化データS1とする。1. First, as hierarchical level 1, coefficients from a low frequency band to a predetermined frequency band f1 are selected from the coefficients divided into a plurality of frequency bands, and the quantization level of the coefficient is also predetermined from the MSB side. The number of bits is selected and used as encoded data S1 of hierarchical level 1.
【0064】2.次に階層レベル2として、f1 よりも
高い所定の周波数帯域f2 までの係数を選択し、かつそ
の係数の量子化レベルもMSB側から階層レベル1より
も多い所定のビット数を選択し、この信号から各係数毎
に対応する階層レベル1の係数の信号成分を引いた残差
信号を、階層レベル2の符号化データS2 とする。2. Next, as the hierarchical level 2, a coefficient up to a predetermined frequency band f2 higher than f1 is selected, and the quantization level of the coefficient is also selected from the MSB side by a predetermined number of bits larger than the hierarchical level 1, and this signal is selected. The residual signal obtained by subtracting the signal component of the coefficient of the layer level 1 corresponding to each coefficient from is defined as the encoded data S2 of the layer level 2.
【0065】3.次に階層レベル3として、f2よりも
高い所定の周波数帯域f3までの係数を選択し、かつそ
の係数の量子化レベルもMSB側から階層レベル2より
も多い所定のビット数を選択し、この信号から各係数毎
に対応する階層レベル1,2および3の係数の信号成分
を引いた残差信号を、階層レベル3の符号化データS3
とする。3. Next, as the hierarchical level 3, a coefficient up to a predetermined frequency band f3 higher than f2 is selected, and the quantization level of the coefficient is also selected from the MSB side by a predetermined number of bits larger than the hierarchical level 2, and this signal is selected. To the residual signal obtained by subtracting the signal components of the coefficients of the hierarchical levels 1, 2, and 3 corresponding to each coefficient from the encoded data S3 of the hierarchical level 3.
And
【0066】4.同様に、階層レベル4として、f3よ
りも高域の所定の周波数帯域f4までの係数を選択し、
かつその係数の量子化レベルもMSB側から階層レベル
3で選択したよりも多い所定のビット数を選択し、この
信号から各係数毎に対応する階層レベル1、2および3
の係数の信号成分を引いた残差信号を、階層レベル4の
符号化データS4とする。4. Similarly, as hierarchical level 4, coefficients up to a predetermined frequency band f4 higher than f3 are selected,
Also, the quantization level of the coefficient is selected from the MSB side by a predetermined number of bits larger than that selected in the hierarchical level 3, and from this signal, the corresponding hierarchical levels 1, 2, and 3 for each coefficient are selected.
The residual signal obtained by subtracting the signal component of the coefficient is used as the encoded data S4 of the hierarchical level 4.
【0067】一方、ダイナミックビット配分器32で
は、MDCTのブロック単位で各周波数帯域毎にどのよ
うにビットを配分するかを決定し、またスケールファク
タ算出器33ではMDCTのブロック単位で各係数の最
大値を抽出し、この最大値で各サンプルの値を正規化す
る。フォーマッティング器34では、スケールファク
タ、ビット配分、階層化されたデータ(S1、S2、S
3、S4)の3つをフォーマッティングし、半導体メモ
リ5に送る。On the other hand, the dynamic bit allocator 32 determines how to allocate bits for each frequency band in MDCT block units, and the scale factor calculator 33 determines the maximum of each coefficient in MDCT block units. Extract the value and normalize the value of each sample by this maximum value. In the formatter 34, the scale factor, bit allocation, and hierarchical data (S1, S2, S
3, S4) are formatted and sent to the semiconductor memory 5.
【0068】半導体メモリ5に送られた階層化されたオ
ーディオ信号は、メモリアドレス制御器23により図1
0右側に示すように、まず、階層レベル4で半導体メモ
リ5に各階層レベル毎に分類して記録していく。半導体
メモリ5が満杯になって記録メモリが無くなると、次に
階層レベル4で書き込まれていたメモリエリアに、連続
したオーディオ信号を階層レベル1〜3で上書きしてい
く。この状態をメモリマップ上で表現したのが図11で
ある。上記の説明は図11(1)→(2)の記録状態を
示したものである。階層レベル識別コード発生器25
は、図11(1)の状態では最大階層レベル4というこ
とで識別コード“11”を、また図11(2)の状態を
最大階層レベル3ということで識別コード“10”を発
生して半導体メモリ5の制御データエリアに記録する。The hierarchical audio signal sent to the semiconductor memory 5 is shown in FIG.
As shown on the right side of FIG. 0, first, at the hierarchical level 4, the semiconductor memory 5 is classified and recorded for each hierarchical level. When the semiconductor memory 5 becomes full and the recording memory runs out, the continuous audio signal is overwritten by the hierarchical levels 1 to 3 in the memory area written in the next hierarchical level 4. FIG. 11 shows this state on the memory map. The above description shows the recording state of FIG. 11 (1) → (2). Hierarchical level identification code generator 25
In the state of FIG. 11 (1), the identification code “11” is generated because it is the maximum hierarchy level 4, and in the state of FIG. 11 (2) is the maximum hierarchy level 3, the identification code “10” is generated. It is recorded in the control data area of the memory 5.
【0069】同様に、図11(2)→(3)→(4)と
記録状態が進のと同時に階層レベルも3→2→1とな
り、記録すべき識別コードも“10”→“01”→“0
0”となる。この場合、記録時間は最終的には半導体メ
モリ5上が階層レベル1のみのオーディオ信号になった
場合が最大であり、各階層レベル(1〜4)の情報量が
同じとすれば、図11(1)の状態よりも記録されたオ
ーディオ品質は劣化するものの記録時間は4倍になる。Similarly, as the recording state progresses as shown in FIG. 11 (2) → (3) → (4), the hierarchical level becomes 3 → 2 → 1 and the identification code to be recorded is also “10” → “01”. → "0
In this case, the maximum recording time is when the semiconductor memory 5 finally becomes an audio signal of only the hierarchical level 1, and the information amount of each hierarchical level (1 to 4) is the same. If so, the recorded audio quality will be lower than that in the state of FIG. 11A, but the recording time will be four times longer.
【0070】再生時には、先ず符号レベル識別コード再
生器16により階層レベル識別コードのチェックを行
う。この情報をメモリアドレス制御器6が受け、図11
のメモリマップに従って記録されたオーディオ信号を半
導体メモリ5から読みだしていく。まず識別コードが
“15”、つまり階層レベル4の場合には、図11
(1)のメモリマップに従って階層レベル1〜4の信号
を読みだしていく。識別コードが“10”つまりレベル
3の場合には、図11(2)のメモリマップに従って階
層レベル1〜3の信号を読みだしていく。以下同様に、
識別コードが“01”で階層レベル2の場合には図11
(3)のメモリマップに従って階層レベル1〜2の信号
を、識別コード“00”で階層レベル1の場合には図1
1(4)のメモリマップに従って階層レベル1の信号を
読みだしていく。At the time of reproduction, first, the code level identification code reproducer 16 checks the hierarchical level identification code. The memory address controller 6 receives this information, and FIG.
The audio signal recorded in accordance with the memory map is read from the semiconductor memory 5. First, when the identification code is “15”, that is, when the hierarchy level is 4,
The signals of hierarchical levels 1 to 4 are read out according to the memory map of (1). When the identification code is "10", that is, level 3, the signals of the hierarchical levels 1 to 3 are read out according to the memory map of FIG. And so on
When the identification code is “01” and the hierarchy level is 2,
According to the memory map of (3), the signals of the hierarchical levels 1 and 2 are identified by FIG.
The signal of the hierarchical level 1 is read according to the memory map of 1 (4).
【0071】階層復号化器23では、半導体メモリ5か
らの読み出された信号は、階層化レベル識別コード再生
器16からの識別信号により、その階層レベルに応じた
復号化を行うように構成されている。階層復号化器23
の出力はD/A変換器8によりアナログオーディオ信号
に変換され、所定のオーデイオレベルの増幅するオーデ
ィオアンプ9を経て、オーディオ出力端子10から出力
される。また記録再生時におけるサンプリングクロック
等のシステム全体に必要となるクロックはクロック発生
器14より供給される。In the hierarchical decoder 23, the signal read from the semiconductor memory 5 is decoded by the identification signal from the hierarchical level identification code regenerator 16 according to the hierarchical level. ing. Hierarchical decoder 23
The output of is converted into an analog audio signal by the D / A converter 8 and is output from the audio output terminal 10 through the audio amplifier 9 which amplifies a predetermined audio level. A clock required for the entire system such as a sampling clock during recording / reproduction is supplied from the clock generator 14.
【0072】実施例4.
次に、この発明の実施例4を図12,図13について説
明する。図12は実施例4のブロック回路図で、図7と
同一符号は、それぞれ同一部分を示している。図12に
おいて、35はアドレス切換器で、書き込みアドレス発
生器36からのメモリアドレスと、読み出しアドレス発
生器37からのメモリアドレスを切り換える。書き込み
アドレス発生器36は半導体メモリ5に階層符号化した
オーディオ信号を書き込むためのアドレスを発生する。
読み出しアドレス発生器37はクロック分周器39から
の再生クロックに従って半導体メモリ5から階層符号化
されたオーディオ信号を読み出すためのアドレスを発生
する。38は階層レベル判定器で、オーディオ信号の再
生スピードにより、階層復号化器24に与えられる復号
演算時間が変わるため(つまり、再生スピードが上がれ
ば所定のオーディオサンプル数の復号に与えられる演算
時間は短くなり、逆に再生スピードが下がれば所定のオ
ーディオサンプル数の復号に与えられる演算時間は長く
なる:通常、階層符号化器や復号化器はDSP(Dig
ital Signal Prosessor)等を用
いソフトウェア処理を行う場合が多く、またこのDSP
自信もかなりの高速演算を実行しているので、オーディ
オ信号の再生スピードが早くなったからといって、同様
にDSPの演算時間を高速にする事は出来ない)、与え
られた演算時間内に復号可能な階層レベルを判定して階
層復号化器23に知らせる。39はクロック分周器で、
再生スピード設定スイッチからの信号によりクロック発
生器14で発生したクロックを分周し読み出しアドレス
発生器37に送出する。40は再生スピード設定器を構
成するスイッチである。Example 4. Next, a fourth embodiment of the present invention will be described with reference to FIGS. FIG. 12 is a block circuit diagram of the fourth embodiment, and the same reference numerals as those in FIG. 7 denote the same parts. In FIG. 12, reference numeral 35 is an address switch, which switches between the memory address from the write address generator 36 and the memory address from the read address generator 37. The write address generator 36 generates an address for writing the hierarchically encoded audio signal in the semiconductor memory 5.
The read address generator 37 generates an address for reading the hierarchically encoded audio signal from the semiconductor memory 5 according to the reproduction clock from the clock frequency divider 39. Reference numeral 38 denotes a hierarchical level determiner, which changes the decoding calculation time given to the hierarchical decoder 24 depending on the reproduction speed of the audio signal (that is, if the reproduction speed increases, the calculation time given for decoding a predetermined number of audio samples will be The shorter the playback speed is, the longer the computation time required for decoding a predetermined number of audio samples is. In general, the hierarchical encoder and the decoder are DSP (Dig).
It is often the case that software processing is performed using an
Confidence is also performing a fairly high-speed operation, so just because the playback speed of the audio signal has become faster, it is not possible to increase the DSP operation time either), and the decoding is performed within the given operation time. It determines the possible hierarchy levels and informs the hierarchy decoder 23. 39 is a clock divider,
The clock generated by the clock generator 14 is frequency-divided by the signal from the reproduction speed setting switch and sent to the read address generator 37. Reference numeral 40 is a switch that constitutes a reproduction speed setting device.
【0073】図13は実施例4のオーディオ復号時間と
再生スピードの関係を示した図で、図13(a),
(b)は通常再生時に、4つの階層レベルの信号全てが
復号できる場合を示している。一方、図13(c),
(d)は再生スピードを2倍速にした場合で、2つの階
層レベルの信号しか復号演算が間に合わないことを示し
ている。FIG. 13 is a diagram showing the relationship between the audio decoding time and the reproduction speed according to the fourth embodiment.
(B) shows a case where all four hierarchical level signals can be decoded during normal reproduction. On the other hand, FIG.
(D) shows that when the reproduction speed is doubled, the decoding operation can be completed only for the signals of two hierarchical levels.
【0074】次に、記録時の実施例3と異なる部分の動
作について説明する。階層符号化器22で階層符号化さ
れたオーディオ信号は、書き込みアドレス発生器36で
発生した書き込みアドレスがアドレス切り換え器35で
選択されて半導体メモリ5に与えられ、所定のアドレス
に記録される。Next, the operation of the portion different from that of the third embodiment at the time of recording will be described. In the audio signal hierarchically encoded by the hierarchical encoder 22, the write address generated by the write address generator 36 is selected by the address switch 35, is applied to the semiconductor memory 5, and is recorded at a predetermined address.
【0075】再生時には、まず、アドレス切り換え器3
5により半導体メモリ5の読み出しアドレスが読み出し
アドレス発生器37に切り換わる。読み出しアドレス発
生器37では、再生スピード設定器40で設定された
(この例では、通常再生スピードに対してUP,DOW
Nで制御するように構成されている)読み出しスピード
に従ってクロック分周器39で読み出しアドレス発生器
37に与えるクロックを作り出す。半導体メモリ5から
は設定された再生スピードに従ってオーディオ信号が読
みだされ、階層復号化器24で復号される。この場合の
復号階層レベルは、図13に示したようにオーディオ信
号の再生スピードにより、階層復号化器24に与えられ
る復号演算時間が変わるため、与えられた演算時間内に
復号可能な階層レベルを階層レベル判定器40にて判定
される。At the time of reproduction, first, the address switch 3
5, the read address of the semiconductor memory 5 is switched to the read address generator 37. In the read address generator 37, it is set by the reproduction speed setting device 40.
A clock divider 39 produces a clock for the read address generator 37 according to the read speed (configured to be controlled by N). An audio signal is read from the semiconductor memory 5 according to the set reproduction speed, and is decoded by the hierarchical decoder 24. The decoding hierarchy level in this case changes the decoding operation time given to the hierarchy decoder 24 depending on the reproduction speed of the audio signal as shown in FIG. It is determined by the hierarchy level determiner 40.
【0076】図13(a),(b)の通常再生時では、
4つの階層レベルの信号全てが復号でき、一方図13
(c),(d)の再生スピードを2倍速にした場合で
は、2つの階層レベルの信号まで正常に復号演算が可能
なことを示している。再生スピードを倍にすると、再生
オーディオ信号は全て2倍の周波数になる、つまり5k
Hzの信号成分は10kHzに、また10kHzの信号
成分は20kHzにシフトするので、実際的には10k
Hz以上の信号は可聴帯域をオーバーすることになり、
高域成分の多い階層レベル3または4の復号は殆ど必要
でなくなる。このことからも図13(c),(d)のよ
う様、階層レベル1〜2のみを復号する方式は非常に適
した方法といえる。階層復号化器24の出力はD/A変
換器8によりアナログオーディオ信号に変換され、所定
のオーデイオレベルの増幅するオーディオアンプ9を経
て、オーディオ出力端子10から出力される。In the normal reproduction shown in FIGS. 13 (a) and 13 (b),
All four hierarchical level signals can be decoded, while FIG.
It is shown that when the reproduction speeds of (c) and (d) are doubled, the decoding operation can be normally performed up to the signals of two hierarchical levels. If the playback speed is doubled, the playback audio signals will all have twice the frequency, ie 5k.
Since the signal component of Hz shifts to 10 kHz and the signal component of 10 kHz shifts to 20 kHz, it is practically 10 k.
Signals above Hz will exceed the audible range,
Decoding of hierarchical levels 3 or 4 having many high frequency components is almost unnecessary. From this, it can be said that the method of decoding only the hierarchical levels 1 and 2 as shown in FIGS. 13C and 13D is a very suitable method. The output of the hierarchical decoder 24 is converted into an analog audio signal by the D / A converter 8 and is output from the audio output terminal 10 through the audio amplifier 9 which amplifies a predetermined audio level.
【0077】実施例5.
以下、本発明の実施例5を図に基づいて説明する。実施
例5のブルック回路図は実施例3の図7と同様であるの
で図示は省略する。また、本実施例5による半導体メモ
リオーディオレコーダの階層符号化の概念図も実施例3
の図8と同様であるので図示は省略する。Example 5. Embodiment 5 of the present invention will be described below with reference to the drawings. The Brook circuit diagram of the fifth embodiment is similar to that of the third embodiment shown in FIG. In addition, the conceptual diagram of the hierarchical encoding of the semiconductor memory audio recorder according to the fifth embodiment is also the third embodiment.
Since it is the same as FIG. 8 of FIG.
【0078】図14は、本実施例5の階層符号化器22
の階層レベルの分割の態様を示す図で、階層符号化の方
法が実施例3と異なる。以下、階層符号化の符号ブロッ
ク分割数を、実施例3と同様に4とし、入力された原オ
ーディオ信号の分類も、実施例3の図8と同様に、人間
の聴覚特性である最小可聴限により元々聞こえない信号
と、マスキング効果により聞こえなくなった信号と、聞
こえる信号の3つに大別し、この中から聞こえる信号の
みを選択して、さらに図14に示す周波数特性に従って
4つの階層レベルに分割する。FIG. 14 is a hierarchical encoder 22 according to the fifth embodiment.
FIG. 10 is a diagram showing a mode of division of the hierarchical level of FIG. Hereinafter, the number of code block divisions of hierarchical coding is set to 4 as in the third embodiment, and the classification of the input original audio signal is the minimum audibility limit which is a human auditory characteristic as in FIG. 8 of the third embodiment. Therefore, the signals that cannot be heard, the signals that cannot be heard due to the masking effect, and the signals that can be heard are roughly divided into three, and only the signals that can be heard are selected. To divide.
【0079】すなわち、図14において、マスキングレ
ベルを超える可聴成分を情報量が等しくなるように、階
層レベル1から階層レベル4までに周波数方向で4分割
し、さらに全体の情報量は所望のビットレートを満たす
ようにする。That is, in FIG. 14, the audible components exceeding the masking level are divided into four in the frequency direction from hierarchical level 1 to hierarchical level 4 so that the information amount becomes equal, and the total information amount is the desired bit rate. To meet.
【0080】図15は本実施例5の階層符号化器22の
構成と半導体メモリ5への記録方法を示す図である。図
において、41はサブバンドn分割フィルタで、A/D
変換器3でディジタル信号に変換されたオーディオ信号
を複数のサブバンドに帯域分割する。42は可聴成分抽
出手段で、オーディオ信号をFFT変換により周波数領
域に変換し、聴覚特性に基づいたマスキングにより可聴
成分のみを抽出する。43は各フレームのサブバンドご
との情報量算出手段で、可聴成分抽出手段42により抽
出された可聴成分に対し、6dBあたり1bitの情報
量を割り当てることにより、各サブバンドごとの情報量
を算出する。44は各フレームの情報量算出手段でで、
サブバンドごとの情報量算出手段43より得られた各サ
ブバンドの情報量を合計して1符号化フレームあたりの
情報量を算出する。FIG. 15 is a diagram showing the structure of the hierarchical encoder 22 of the fifth embodiment and the method of recording in the semiconductor memory 5. In the figure, 41 is a sub-band n division filter, which is an A / D
The audio signal converted into the digital signal by the converter 3 is band-divided into a plurality of subbands. Reference numeral 42 denotes an audible component extracting means that transforms the audio signal into a frequency domain by FFT conversion and extracts only the audible component by masking based on the auditory characteristics. Reference numeral 43 is an information amount calculating means for each sub-band of each frame, and the information amount of each sub-band is calculated by allocating an information amount of 1 bit per 6 dB to the audible component extracted by the audible component extracting means 42. .. 44 is an information amount calculation means for each frame,
The information amount of each sub-band obtained by the information amount calculation means 43 for each sub-band is summed to calculate the information amount per one encoded frame.
【0081】45は所望の符号化レートに基づきフレー
ムあたりの情報量Cを設定する符号化レートに基づくフ
レームあたりの情報量設定器、46は情報量コントロー
ル回路で、レームの情報量算出手段44により算出され
た各フレームの情報量とそれまでに符号化されたフレー
ムに割り当てられた情報量の平均値である平均割当情報
量に従い、最終的な平均情報量が符号化レートに基づく
フレームあたりの情報量設定器45により得られる設定
情報量Cに一致するように各フレームに割り当てる割当
情報量を算出する。47は各階層の帯域決定手段で、情
報量算出手段43により算出された各フレームのサブバ
ンドごとの情報量と情報量コントロール回路46により
算出された割当情報量によりその割当情報量を与えるの
に最適な各階層(K1からK4)の符号化帯域を決定す
る。48はビットアロケーション回路で、各階層の帯域
決定手段47により得られた各階層に割り当てる帯域情
報に従い、各階層に対する割当帯域内の可聴成分に対
し、その大きさに従って再ビット割当を行う、49は量
子化回路で、ビットアロケーション回路48により得ら
れたビット割当情報に従い、各サブバンドデータを量子
化する。Reference numeral 45 is an information amount setting unit per frame based on the coding rate for setting the information amount C per frame based on the desired coding rate, and 46 is an information amount control circuit, which is used by the information amount calculating means 44 of the Laem. According to the average allocation information amount, which is the average value of the calculated information amount of each frame and the information amount allocated to the frames encoded up to that point, the final average information amount is the information per frame based on the encoding rate. The allocation information amount assigned to each frame is calculated so as to match the setting information amount C obtained by the amount setting unit 45. Reference numeral 47 is a band determining means for each layer, which gives the allocated information amount by the information amount for each sub-band of each frame calculated by the information amount calculating means 43 and the allocated information amount calculated by the information amount control circuit 46. The optimum coding band of each layer (K1 to K4) is determined. Reference numeral 48 is a bit allocation circuit, which performs re-bit allocation according to the size of the audible component in the allocated band for each layer according to the band information allocated to each layer obtained by the band determining unit 47 of each layer. The quantization circuit quantizes each subband data according to the bit allocation information obtained by the bit allocation circuit 48.
【0082】50は階層符号化フォーマッティング器
で、各階層の帯域決定手段47により得られた各階層の
割当帯域情報と、ビットアロケーション回路48により
得られたビット割当情報と、量子化器49より得られた
データを階層符号化してフォーマットする。また、図1
5の右側には階層符号化データを半導体メモリ5に記録
する概念を示したものである。Numeral 50 is a hierarchical coding formatter, which is allocated band information of each layer obtained by the band determining means 47 of each layer, bit allocation information obtained by the bit allocation circuit 48, and obtained by the quantizer 49. The encoded data is hierarchically encoded and formatted. Also, FIG.
The right side of 5 shows the concept of recording hierarchically encoded data in the semiconductor memory 5.
【0083】半導体メモリ5上のメモリマップ、および
オーディオ信号の書込み手順は、実施例3で説明した図
11と同じであるので、説明は省略する。Since the memory map on the semiconductor memory 5 and the procedure for writing the audio signal are the same as those in FIG. 11 described in the third embodiment, the description thereof will be omitted.
【0084】次に、記録時の動作の実施例3と異なる部
分について説明する。階層化符号化器22では、オーデ
ィオ信号より図8、図14に示した方法により階層符号
化データに変換され、半導体メモリ5に記録される。こ
の階層符号化器22では、まずオーディオ信号をサブバ
ンドn分割フィルタ41によりn個のサブバンドに分割
し、同時に可聴成分抽出手段42において、オーディオ
信号をFFT変換により周波数領域に直交変換し、周波
数領域で聴覚特性に基づいたマスキングレベルが求めら
れ、可聴成分が抽出される。図16(a)に示すように
周波数スペクトラムとマスキングレベルの差が可聴成分
である。さらに、可聴成分はサブバンド分割によるサブ
バンド帯域ごとにまとめられ、図16(b)に示すよう
に各サブバンドごとの可聴成分が抽出される。Next, a part of the operation at the time of recording different from that of the third embodiment will be described. In the hierarchical encoder 22, the audio signal is converted into hierarchical encoded data by the method shown in FIGS. 8 and 14 and recorded in the semiconductor memory 5. In the hierarchical encoder 22, first, the audio signal is divided into n sub-bands by the sub-band n division filter 41, and at the same time, the audible component extracting means 42 orthogonally transforms the audio signal into the frequency domain by the FFT transformation, and The masking level based on the auditory characteristics is obtained in the region, and the audible component is extracted. As shown in FIG. 16A, the difference between the frequency spectrum and the masking level is the audible component. Furthermore, the audible components are grouped into subband bands by subband division, and the audible components of each subband are extracted as shown in FIG. 16 (b).
【0085】次に、情報量算出手段43では、可聴成分
6dBに対し1bitの情報量を与えることにより図1
6(c)に示すように各サブバンド帯域に対する情報量
が算出される。そして、各フレームの情報量算出手段4
4にてn個のサブバンドの情報量が加算され、1フレー
ムの情報量が算出される。符号化レートに基づくフレー
ムあたりの情報量設定器45では、所望の符号化レート
を設定することによりそのビットレートに基づきフレー
ムあたりの情報量Cが算出され、情報量コントロール回
路46に送られる。Next, in the information amount calculating means 43, the amount of information of 1 bit is given to the audible component of 6 dB, as shown in FIG.
As shown in 6 (c), the amount of information for each subband band is calculated. Then, the information amount calculation means 4 of each frame
At 4, the information amount of n subbands is added to calculate the information amount of one frame. The information amount per frame setting unit 45 based on the coding rate sets the desired coding rate to calculate the information amount C per frame based on the bit rate and sends it to the information amount control circuit 46.
【0086】情報量コントロール回路46では、それま
でに符号化されたフレームに割り当てられたフレームあ
たりの平均情報量に従い、最終的な平均割当情報量が符
号化レートに基づくフレームあたりの情報量設定器で設
定された情報量Cに一致するように、各フレームの情報
量算出手段44により算出された情報量に対し割当帯域
決定に用いる割当情報量を定める。例えば、それまでに
符号化されたフレームに割り当てられた総ビット数をs
um、符号化フレーム数をcountとすると、sum
をcountで割って得られる平均割当情報量(Mバ−
とする)が、符号化ビットレートより換算した1フレー
ムあたりの情報量Cより多い場合には割当情報量を減ら
すように、少ない場合には増やすようにコントロールす
る情報量コントロール係数(K=C/Mバ−とする)
を、各フレームの情報量算出手段44により算出された
情報量(mとする)に乗算し、割当情報量(M=mKと
する)を算出する。In the information amount control circuit 46, according to the average information amount per frame assigned to the frames encoded up to that time, the final average assigned information amount is the information amount per frame setting unit based on the encoding rate. The allocated information amount used for determining the allocated bandwidth is determined with respect to the information amount calculated by the information amount calculation means 44 of each frame so as to match the information amount C set in (4). For example, let s be the total number of bits assigned to the previously encoded frames.
If um and the number of encoded frames are count, then sum
Average allocation information amount (M bar)
Is larger than the information amount C per frame converted from the encoding bit rate, the information amount control coefficient (K = C / M-bar)
Is multiplied by the information amount (assumed to be m) calculated by the information amount calculation means 44 for each frame to calculate the allocated information amount (assumed to be M = mK).
【0087】次に、各階層の帯域決定手段47では、情
報量算出手段43により得られた各サブバンドごとの情
報量と、情報量コントロール回路46により得られた割
当情報量により各階層ごとに割当情報量でカバーできる
帯域を算出し、それを各階層の帯域とする。例えば、オ
ーディオ信号を16のサブバンドに分割し各サブバンド
ごとの情報量を算出したものが図17に示すような値で
あったとすると、そのフレームに対する割当情報量が4
3ビットであった場合、階層レベル1(K1)から階層
レベル4(K4)の各階層レベルに対し割り当てる情報
量を等情報量とすることより、各階層に対し割り当てる
ことのできる情報量はそれぞれ10ビットとなる。Next, in the band determining means 47 of each layer, the information amount for each sub-band obtained by the information amount calculating means 43 and the allocated information amount obtained by the information amount control circuit 46 are used for each layer. A band that can be covered by the amount of allocated information is calculated and used as the band of each layer. For example, if the value obtained by dividing the audio signal into 16 sub-bands and calculating the information amount for each sub-band has a value as shown in FIG. 17, the assigned information amount for that frame is 4
When the number of bits is 3 bits, the amount of information that can be assigned to each layer is determined by setting the amount of information that is assigned to each layer level from layer level 1 (K1) to layer level 4 (K4) to be equal information amount. It will be 10 bits.
【0088】各フレームに対する情報量の割当は、以下
の手順で行う。まず、K1の割当帯域を求める。最低帯
域のサブバンド1の情報量が10ビットであることか
ら、このサブバンドのみでK1の割当情報量10ビット
になるため、K1の符号化帯域として割り当てることの
できる帯域は1サブバンドとなる。次に、K2の割当帯
域を求める。K1に割り当てた帯域以上のサブバンドか
らサブバンド2とサブバンド3の情報量を加算すると1
0(6+4)ビットとなり、K2の割当ビット10ビッ
トに一致する。よってK2の符号化帯域として割り当て
ることのできる帯域は、2、3サブバンドである。同様
に、K2に割り当てた帯域以上のサブバンドであるサブ
バンド4からサブバンド6までの情報量を加算すると1
0ビットとなり、K3の割当情報量と一致し、サブバン
ド7からサブバンド10までの情報量を加算すると10
ビットとなり、K4の割当情報量と一致する。The information amount is assigned to each frame in the following procedure. First, the allocated bandwidth of K1 is obtained. Since the information amount of subband 1 of the lowest band is 10 bits, the allocation information amount of K1 is 10 bits only in this subband, and the band that can be allocated as the coding band of K1 is 1 subband. . Next, the allocated bandwidth of K2 is obtained. When the information amounts of subband 2 and subband 3 are added from subbands equal to or more than the band allocated to K1, 1
It becomes 0 (6 + 4) bits, which corresponds to 10 bits allocated to K2. Therefore, the bands that can be allocated as the K2 coding band are a few subbands. Similarly, when the information amounts from subband 4 to subband 6 which are subbands equal to or more than the band allocated to K2 are added, 1
It becomes 0 bits, which matches the allocation information amount of K3, and when the information amounts from subband 7 to subband 10 are added, it becomes 10
It becomes a bit and matches the allocation information amount of K4.
【0089】これにより、各階層に割り当てることので
きる帯域は、それぞれ図17に示すように、1サブバン
ド、2、3サブバンド、4〜6サブバンド、7〜10サ
ブバンドとなる。ビットアロケーション回路48では、
各階層の帯域決定手段47により得られた各階層への割
当帯域情報と、可聴成分抽出手段42により得られた可
聴成分により、各階層の割当帯域内の可聴成分に対し、
その大きさに従って再ビット割当がなされる。例えば、
図17に示すように、各階層レベルK1〜K4に対し帯
域割当された場合、K1帯域はサブバンド1のみの1サ
ブバンド、K2帯域はサブバンド2、3の2サブバン
ド、K3帯域はサブバンド4〜6の3サブバンド、K4
帯域はサブバンド7〜10の4サブバンドとなる。As a result, the bands that can be allocated to the respective layers are 1 subband, 2 3 subbands, 4 to 6 subbands, and 7 to 10 subbands, as shown in FIG. In the bit allocation circuit 48,
Based on the band allocation information for each layer obtained by the band determining unit 47 of each layer and the audible component obtained by the audible component extracting unit 42, for the audible component in the band allocated for each layer,
Re-bit allocation is performed according to the size. For example,
As shown in FIG. 17, when bands are allocated to the respective hierarchical levels K1 to K4, the K1 band is one subband of only subband 1, the K2 band is subbands 2 and 3 of 2 subbands, and the K3 band is subband. Band 4-6, 3 subbands, K4
The bands are 4 subbands of subbands 7 to 10.
【0090】よって、階層レベル1ではサブバンド1の
可聴成分に対し、6dBあたり1ビットのビット割当が
行われ、次に階層レベル2ではサブバンド2、3の可聴
成分に対し、可聴成分の大きさに従って6dBあたり1
ビットが再ビット割当され、さらに階層レベル3ではサ
ブバンド4、5、6の可聴成分に対し、階層レベル4で
はサブバンド7、8、9、10の可聴成分に対し再ビッ
ト割当される。量子化器49では、ビットアロケーショ
ン回路48より得られた各サブバンドに対するビット割
当情報に従い、サブバンドn分割フィルタ41より得ら
れるサブバンドデータが量子化される。階層符号化フォ
ーマッティング器50では、各階層の帯域決定手段47
より得られる各階層の割当帯域情報に従い、ビット割当
情報と量子化データが各階層ごとにフォーマッティング
され、半導体メモリ5に送られる。 以上のような階層
符号化器22により符号化されたデータは、各フレーム
の情報量は可変長であるが、1フレーム内に含まれる各
階層の情報量は等情報量となる。Therefore, at the hierarchical level 1, 1 bit per 6 dB is allocated to the audible component of the subband 1, and then at the hierarchical level 2, the audible component of the subbands 2 and 3 is larger than the audible component. 1 per 6 dB according to
Bits are re-bit-allocated and further sub-bands 4, 5 and 6 audible components at hierarchical level 3 and sub-bands 7, 8, 9, 10 audible components at hierarchical level 4 are re-allocated. The quantizer 49 quantizes the subband data obtained by the subband n division filter 41 according to the bit allocation information for each subband obtained by the bit allocation circuit 48. In the layered coding formatter 50, the band determination means 47 of each layer.
The bit allocation information and the quantized data are formatted for each layer according to the allocation band information of each layer obtained as described above, and are sent to the semiconductor memory 5. In the data encoded by the layer encoder 22 as described above, the information amount of each frame has a variable length, but the information amount of each layer included in one frame is an equal amount of information.
【0091】半導体メモリ5に送られた階層化されたオ
ーディオ信号は、メモリアドレス制御器23により図1
5の右側に示すように、まず階層レベル4で半導体メモ
リ5に各階層毎に分類して記録していく。半導体メモリ
5が満杯になると、階層4の書き込まれていたメモリエ
リアに連続したオーディオ信号を階層レベル3で上書き
していく。この図15は、概念を示したもので各フレー
ムの情報量が等しいように書かれているが、実際には可
変長フレームで符号化されるため、半導体メモリ5は、
各フレームの情報量に応じて記憶できるようにコントロ
ールされる。The hierarchical audio signal sent to the semiconductor memory 5 is output by the memory address controller 23 as shown in FIG.
As shown on the right side of FIG. 5, the semiconductor memory 5 is first classified and recorded in the semiconductor memory 5 at the hierarchy level 4. When the semiconductor memory 5 becomes full, a continuous audio signal is overwritten in the memory area in which the layer 4 is written at the layer level 3. This FIG. 15 shows the concept, and it is written so that the information amount of each frame is equal, but since it is actually encoded with a variable length frame, the semiconductor memory 5 is
It is controlled so that it can be stored according to the information amount of each frame.
【0092】この状態をメモリマップ上で表現したのが
図11であって、上記の説明は図11(1)→(2)の
記録状態を示したものである。階層レベル識別コード発
生器25では、図11(1)の状態では最大階層レベル
4ということで識別コード“15”を、また図11
(2)の状態を最大階層レベル3ということで識別コー
ド“10”を記録する。同様に、図11(2)→(3)
→(4)と記録状態が進と同時に階層レベルも3→2→
1となり記録すべき識別コードも“10”→“01”→
“00”となる。この場合記録時間は最終的には半導体
メモリ上が階層1のみのオーディオ信号になった場合が
最大であり、各階層(1〜4)の情報量が同じとすれば
図11(1)の状態よりも、記録されたオーディオ品質
は劣化するものの記録時間は4倍になる。FIG. 11 shows this state on the memory map, and the above description shows the recording state of FIG. 11 (1) → (2). In the hierarchy level identification code generator 25, in the state of FIG. 11 (1), the identification code "15" is given because the maximum hierarchy level is 4.
Since the state of (2) is the maximum hierarchy level 3, the identification code "10" is recorded. Similarly, FIG. 11 (2) → (3)
→ (4) As the recording status progresses, the hierarchy level also increases from 3 → 2 →
It becomes 1 and the identification code to be recorded is also “10” → “01” →
It becomes "00". In this case, the maximum recording time is when the audio signal of only the layer 1 finally becomes the semiconductor memory, and if the information amount of each layer (1 to 4) is the same, the state of FIG. However, although the recorded audio quality is deteriorated, the recording time is quadrupled.
【0093】再生時には、まず階層レベル識別コード再
生器26により階層レベル識別コードのチェックを行
う。この情報をメモリアドレス制御器23が受け、図1
1のメモリマップに従って記録されたオーディオ信号を
半導体メモリ5から読みだしていく。まづ識別コードが
“15”つまり階層レベル4の場合には、図11(1)
のメモリマップに従って階層1〜4の信号を読みだして
いく。識別コードが“10”つまりレベル3の場合に
は、図11(2)のメモリマップに従って階層レベル1
〜3の信号を読みだしていく。At the time of reproduction, first, the hierarchy level identification code reproducer 26 checks the hierarchy level identification code. This information is received by the memory address controller 23, and FIG.
The audio signal recorded according to the memory map 1 is read from the semiconductor memory 5. When the identification code is "15", that is, the layer level 4 is shown in FIG.
The signals of layers 1 to 4 are read out according to the memory map of. When the identification code is “10”, that is, level 3, the hierarchy level 1 is set according to the memory map of FIG. 11 (2).
Read the signals of ~ 3.
【0094】以下、同様に、識別コードが“01”で階
層レベル2の場合には図11(3)のメモリマップに従
って階層レベル1〜2の信号を、識別コード“00”で
階層レベル1の場合には図11(4)のメモリマップに
従って階層レベル1の信号を読みだしていく。階層復号
化器24では、半導体メモリ5から読み出された信号
は、階層レベル識別コード再生器26からの識別信号に
より、その階層レベルに応じた復号化を行うように構成
されている。階層復号化器24の出力はD/A変換器8
によりアナログオーディオ信号に変換され、所定のオー
デイオレベルの増幅するオーディオアンプ9を経て、オ
ーディオ出力端子10から出力される。Similarly, when the identification code is "01" and the hierarchy level is 2, the signals of the hierarchy levels 1 and 2 are identified by the identification code "00" in the hierarchy level 1 according to the memory map of FIG. In this case, the signal of the hierarchical level 1 is read out according to the memory map of FIG. 11 (4). The hierarchical decoder 24 is configured so that the signal read from the semiconductor memory 5 is decoded according to the hierarchical level by the identification signal from the hierarchical level identification code regenerator 26. The output of the hierarchical decoder 24 is the D / A converter 8
Is converted into an analog audio signal by the audio amplifier 9 and is output from an audio output terminal 10 through an audio amplifier 9 which amplifies a predetermined audio level.
【0095】実施例6.
次に、本発明の実施例6について説明する。図18は実
施例6による半導体メモリオーディオレコーダの階層符
号化器の構成を示す図である。図において、41はサブ
バンドn分割フィルタで、A/D変換器3でディジタル
信号に変換されたオーディオ信号を複数のサブバンドに
帯域分割する。42は可聴成分抽出手段で、オーディオ
信号をFFT変換により周波数領域に変換し、聴覚特性
に基づいたマスキングにより可聴成分のみを抽出する。
45は符号化レートに基づくフレームあたりの情報量設
定器で、所望の符号化レートに基づきフレームあたりの
情報量Cを設定する。48はビットアロケーション回路
で、各階層の帯域決定手段54により得られた一サイク
ルの各階層に割り当てる帯域情報に基づき、各フレーム
ごとに各階層に対する割当帯域内の可聴成分に対し、そ
の大きさに従って再ビット割当を行う。49は量子化回
路で、ビットアロケーション回路51により得られたビ
ット割当情報に従い、各サブバンドデータを量子化す
る。Example 6. Next, a sixth embodiment of the present invention will be described. FIG. 18 is a diagram showing the configuration of the hierarchical encoder of the semiconductor memory audio recorder according to the sixth embodiment. In the figure, reference numeral 41 denotes a subband n division filter, which divides the audio signal converted into a digital signal by the A / D converter 3 into a plurality of subbands. Reference numeral 42 denotes an audible component extracting means that transforms the audio signal into a frequency domain by FFT conversion and extracts only the audible component by masking based on the auditory characteristics.
Reference numeral 45 is an information amount setting unit per frame based on the coding rate, and sets the information amount C per frame based on the desired coding rate. Reference numeral 48 denotes a bit allocation circuit, which is based on the band information allocated to each layer of one cycle obtained by the band determining unit 54 of each layer, and according to the size of the audible component in the band allocated to each layer for each frame. Perform re-bit allocation. Reference numeral 49 is a quantizing circuit, which quantizes each subband data in accordance with the bit allocation information obtained by the bit allocation circuit 51.
【0096】50は階層符号化フォーマッティング器
で、各階層の帯域決定手段47により得られた各階層の
割当帯域情報とビットアロケーション回路48により得
られたビット割当情報と、量子化器49により得られた
データを階層符号化しフォーマットする。51は平均情
報量算出手段で、可聴成分抽出手段42により抽出され
た可聴成分の一定時間あたりの平均値をとり、その平均
値に対し、6dBあたり1bitの情報量を割り当てる
ことにより、各フレームの各サブバンドごとの平均情報
量を算出する。52は各フレームの瞬時情報量算出手段
で、可聴成分抽出手段42により得られる可聴成分のあ
る最大サブバンド情報SBmaxから各符号化フレーム
ごとの情報量を算出する。53は情報量コントロール回
路で、各フレームの瞬時情報量算出手段52より得られ
る瞬時情報量と、それまでに符号化されたフレームに割
り当てられた平均割当情報量に従い、最終的な平均情報
量が符号化レートに基づくフレームあたりの情報量設定
器45により得られる設定情報量Cに一致するように、
一サイクルの区間割当情報量を算出する。54は各階層
の帯域決定手段でで、平均情報量算出手段51により算
出された各フレームのサブバンドごとの平均情報量と、
情報量コントロール回路53により算出された区間割当
情報量により、その割当情報量を与えるのに最適な各階
層レベル(K1からK4)の一サイクルの各階層の符号
化帯域を決定する。Reference numeral 50 denotes a hierarchical coding formatter, which is obtained by a quantizer 49, and allocation bandwidth information of each layer obtained by the band determining means 47 of each layer, bit allocation information obtained by the bit allocation circuit 48. The data is hierarchically encoded and formatted. Reference numeral 51 denotes an average information amount calculating means, which takes an average value of the audible components extracted by the audible component extracting means 42 for a certain period of time, and assigns an information amount of 1 bit per 6 dB to the average value, so Calculate the average amount of information for each subband. Reference numeral 52 denotes an instantaneous information amount calculating means for each frame, which calculates the information amount for each encoded frame from the maximum subband information SBmax having an audible component obtained by the audible component extracting means 42. Reference numeral 53 denotes an information amount control circuit, which determines the final average information amount according to the instantaneous information amount obtained from the instantaneous information amount calculating means 52 of each frame and the average assigned information amount assigned to the frames encoded up to that point. In order to match the setting information amount C obtained by the information amount setting unit 45 per frame based on the coding rate,
The section allocation information amount for one cycle is calculated. Reference numeral 54 is a band determining means for each layer, which is an average information amount for each sub-band of each frame calculated by the average information amount calculating means 51.
Based on the section allocation information amount calculated by the information amount control circuit 53, the optimum coding band of each layer of one cycle of each layer level (K1 to K4) for giving the allocation information amount is determined.
【0097】図19は実施例6による平均情報量算出手
段のサブバンドごとの平均情報量算出動作を示すフロー
チャート図である。FIG. 19 is a flow chart showing the average information amount calculating operation for each sub-band by the average information amount calculating means according to the sixth embodiment.
【0098】図20は実施例6による情報量コントロー
ル手段における区間割当情報量算出動作を示すフローチ
ャート図である。FIG. 20 is a flow chart showing the section allocation information amount calculation operation in the information amount control means according to the sixth embodiment.
【0099】図21は実施例6による各階層の帯域決定
手段54における割当帯域決定動作を示すフローチャー
ト図である。FIG. 21 is a flow chart showing the allocated bandwidth determining operation in the bandwidth determining means 54 of each layer according to the sixth embodiment.
【0100】図22は実施例6によるビットアロケーシ
ョン回路48におけるビット割当動作を示すフローチャ
ート図である。FIG. 22 is a flow chart showing the bit allocation operation in the bit allocation circuit 48 according to the sixth embodiment.
【0101】次に、動作について説明する。階層符号化
器22では、まず、オーディオ信号をサブバンドn分割
フィルタ41によりn個のサブバンドに分割し、同時
に、可聴成分抽出手段42においてオーディオ信号をF
FT変換により周波数領域に直交変換し、周波数領域で
聴覚特性に基づいたマスキングレベルが求められ、可聴
成分が抽出される。図16(a)に示すように周波数ス
ペクトラムとマスキングレベルの差が可聴成分である。
さらに、可聴成分はサブバンド分割によるサブバンド帯
域ごとにまとめられ、図16(b)に示すように各サブ
バンドごとの可聴成分が抽出される。Next, the operation will be described. In the hierarchical encoder 22, first, the audio signal is divided into n subbands by the subband n division filter 41, and at the same time, the audio signal is F
The FT transform orthogonally transforms into the frequency domain, the masking level based on the auditory characteristics is obtained in the frequency domain, and the audible component is extracted. As shown in FIG. 16A, the difference between the frequency spectrum and the masking level is the audible component.
Furthermore, the audible components are grouped into subband bands by subband division, and the audible components of each subband are extracted as shown in FIG. 16 (b).
【0102】次に、平均情報量算出手段51では、図1
9のフローチャート図に示すように、可聴成分抽出手段
42により抽出された各サブバンドごとの可聴成分をX
フレーム分累積加算し、加算後Xで除算することにより
可聴成分のXフレーム分の平均値を算出し、その平均可
聴成分に対し、6dBあたり1bitの情報量を与える
ことによりXフレーム分の平均情報量が算出され、これ
が次の1サイクル(Xフレーム分)の帯域決定に使用さ
れる。各フレームの瞬時情報量算出手段52では、可聴
成分抽出手段42より得られる可聴成分の存在する最大
の帯域(SBmaxとする)から、瞬時情報量を以下の
方法で推定する。Next, in the average information amount calculating means 51, as shown in FIG.
As shown in the flowchart of FIG. 9, the audible component for each sub-band extracted by the audible component extracting means 42 is X.
The average value for X frames of the audible component is calculated by cumulatively adding for frames and dividing by X after addition, and the average information for X frames is given by giving the information amount of 1 bit per 6 dB to the average audible component. The quantity is calculated and used for bandwidth determination for the next cycle (X frames). The instantaneous information amount calculating means 52 for each frame estimates the instantaneous information amount from the maximum band (SBmax) in which the audible component exists, which is obtained by the audible component extracting means 42, by the following method.
【0103】図23〜25は、実施例6による瞬時情報
量決定手段での可聴成分の存在する最大の帯域SBma
xと情報量の関係を示す図であるが、これらのデータか
らわかるように、SBmaxと情報量はほぼ比例関係に
あるため、SBmaxから情報量を推定できる。この実
施例6では、瞬時情報量をSBmaxと情報量の関係を
利用した推定により求めているが、可聴成分に対し、6
dBあたり1bitの情報量を与え、各サブバンドの情
報量の加算により算出してもよい。23 to 25 show the maximum band SBma in which the audible component exists in the instantaneous information amount determining means according to the sixth embodiment.
Although it is a diagram showing the relationship between x and the information amount, as can be seen from these data, SBmax and the information amount are in a substantially proportional relationship, so the information amount can be estimated from SBmax. In the sixth embodiment, the instantaneous information amount is obtained by estimation using the relationship between SBmax and the information amount.
It may be calculated by giving an information amount of 1 bit per dB and adding the information amount of each subband.
【0104】符号化レートに基づくフレームあたりの情
報量設定器45では、所望の符号化レートを設定するこ
とによりそのビットレートに基づきフレームあたりの情
報量Cが算出され、情報量コントロール回路46に送ら
れる。情報量コントロール回路53では、それまでに符
号化されたフレームに割り当てられたフレームあたりの
平均情報量に従い、最終的な平均割当情報量が符号化レ
ートに基づくフレームあたりの情報量設定器で設定され
た情報量Cに一致するように、各フレームの瞬時情報量
算出手段52により算出された瞬時情報量に対し1サイ
クルの区間割当情報量を定める。The information amount per frame setting unit 45 based on the coding rate calculates the information amount C per frame based on the bit rate by setting a desired coding rate and sends it to the information amount control circuit 46. To be In the information amount control circuit 53, the final average assigned information amount is set by the information amount per frame setting unit based on the encoding rate according to the average information amount per frame assigned to the frames encoded so far. The section allocation information amount of one cycle is determined with respect to the instantaneous information amount calculated by the instantaneous information amount calculating means 52 of each frame so as to match the information amount C.
【0105】情報量コントロール回路53の動作を図2
0のフローチャートに示す。区間割当情報量MN バ−
は、Xフレームを1サイクルと、1サイクルごとにそれ
までに符号化されたフレームの平均割当情報量Mバ−に
応じて、例えば次式のように算出される。
MN バ−=C+(C−Mバ−)
ここでCは符号化レートに基づく1フレームあたりの情
報量であり、最終的に平均割当情報量がこの値となるよ
うにMN バ−がコントロールされる。また、1サイクル
の間、毎フレームごとに瞬時情報量算出回路52より算
出された瞬時情報量mに情報量コントロール係数Kを乗
算することにより瞬時割当情報量Mが算出される。ま
た、瞬時割当情報量の平均値による平均割当情報量Mバ
−および情報量コントロール係数Kは1サイクルごとに
更新される。The operation of the information amount control circuit 53 is shown in FIG.
0 is shown in the flowchart. Section allocation information amount MN bar
Is calculated according to, for example, the following equation in accordance with the average allocation information amount M bar of the frames that have been encoded for each cycle of X frames and each cycle. MN bar = C + (CM bar) where C is the information amount per frame based on the coding rate, and the MN bar is controlled so that the average allocated information amount finally becomes this value. It In addition, the instantaneous allocation information amount M is calculated by multiplying the information amount control coefficient K by the instantaneous information amount m calculated by the instantaneous information amount calculation circuit 52 for each frame during one cycle. Further, the average allocation information amount M bar and the information amount control coefficient K based on the average value of the instantaneous allocation information amount are updated every cycle.
【0106】次に、各階層の帯域決定手段54では、図
21のフローチャートに示すように、1サイクルごとに
各サブバンドごとの平均情報量算出手段51により得ら
れた各サブバンドごとの平均情報量と、情報量コントロ
ール回路53により得られた1サイクル間の区間割当情
報量を入力し、区間割当情報量を4分割することにより
各階層あたりの割当情報量を算出し、各階層ごとに割当
情報量でカバーできる帯域を低域側より算出し、それを
各階層の割当帯域とする。ビットアロケーション回路4
8では、各階層の帯域決定手段54により得られた各階
層への1サイクル間の割当帯域情報と、可聴成分抽出手
段42により得られた可聴成分が入力される。各階層の
割当帯域内の可聴成分に対しその大きさに従って再ビッ
ト割当がなされる。Next, in the band determining means 54 of each layer, as shown in the flow chart of FIG. 21, the average information for each sub-band obtained by the average information amount calculating means 51 for each sub-band for each cycle. Amount and the section allocation information amount for one cycle obtained by the information amount control circuit 53 are input, and the section allocation information amount is divided into four to calculate the allocation information amount for each hierarchy, and the allocation information is allocated for each hierarchy. The bandwidth that can be covered by the amount of information is calculated from the low frequency side, and this is used as the allocated bandwidth of each layer. Bit allocation circuit 4
In 8, the band allocation information for one cycle for each layer obtained by the band determining unit 54 of each layer and the audible component obtained by the audible component extracting unit 42 are input. Re-allocation is performed according to the size of the audible component in the allocated band of each layer.
【0107】量子化器49では、ビットアロケーション
回路48より得られた各サブバンドに対するビット割当
情報に従い、サブバンドn分割フィルタ41より得られ
るサブバンドデータが量子化される。階層符号化フォー
マッティング器53では、各階層の帯域決定手段54よ
り得られる各階層の割当帯域情報に従い、ビット割当情
報と量子化データが各階層ごとにフォーマッティングさ
れ、半導体メモリ5に送られる。The quantizer 49 quantizes the subband data obtained by the subband n division filter 41 according to the bit allocation information for each subband obtained by the bit allocation circuit 48. The hierarchical coding formatter 53 formats the bit allocation information and the quantized data for each layer according to the allocated band information for each layer obtained from the band determination unit 54 for each layer, and sends it to the semiconductor memory 5.
【0108】実施例7.
次に、本発明の実施例7について説明する。図26は実
施例7によるメモリオーディオレコーダの階層符号化器
の構成を示すブロック回路図で図18と同一符号はそれ
ぞれ同一部分を示しており、55は各フレームのサブバ
ンドごとの情報量算出手段43により算出されたサブバ
ンドごとの情報量を平滑化してサブバンドごとの平均情
報量を算出するローパスフィルタ、56は情報量コント
ロール回路46により得られる瞬時割当情報量を平滑化
して平均割当情報量を算出するローパスフィルタであ
る。Example 7. Next, a seventh embodiment of the present invention will be described. FIG. 26 is a block circuit diagram showing the configuration of the hierarchical encoder of the memory audio recorder according to the seventh embodiment, and the same reference numerals as those in FIG. A low-pass filter that smoothes the information amount for each sub-band calculated by 43 to calculate the average information amount for each sub-band, and 56 smooths the instantaneous allocation information amount obtained by the information amount control circuit 46 and averages the allocation information amount. Is a low-pass filter that calculates
【0109】図27は実施例7の情報量コントロール回
路46の構成を示す図で、57はコンパレータで、情報
量設定器45より得られる所望のビットレートに従った
フレームあたりの情報量とビットアロケーション回路5
1よりえられるビット割当情報量の差分を抽出する。5
8は抽出された差分を平滑化するローパスフィルタ、5
9はローパスフィルタにより平滑化された差分値を符号
化比率に変換する変換器、60は乗算器で、符号化比率
変換器59により算出された符号化比Kを各フレームの
情報量算出手段44により得られる情報量に乗算し、割
当情報量を算出する。FIG. 27 is a diagram showing the configuration of the information amount control circuit 46 of the seventh embodiment. Reference numeral 57 denotes a comparator, which is an information amount per frame and bit allocation according to a desired bit rate obtained from the information amount setting unit 45. Circuit 5
The difference in the bit allocation information amount obtained from 1 is extracted. 5
8 is a low-pass filter for smoothing the extracted difference, 5
Reference numeral 9 is a converter for converting the difference value smoothed by the low-pass filter into a coding ratio, 60 is a multiplier, and the coding ratio K calculated by the coding ratio converter 59 is used as the information amount calculation means 44 for each frame. The information amount obtained by is multiplied to calculate the assigned information amount.
【0110】次に、実施例7の動作について説明する。
階層符号化器22では、まずオーディオ信号をサブバン
ドn分割フィルタ41によりn個のサブバンドに分割
し、同時に可聴成分抽出手段42において、オーディオ
信号をFFT変換により周波数領域に直交変換し、周波
数領域で聴覚特性に基づいたマスキングレベルが求めら
れ、可聴成分が抽出される。図16(a)に示すように
周波数スペクトラムとマスキングレベルの差が可聴成分
である。さらに、可聴成分はサブバンド分割によるサブ
バンド帯域ごとにまとめられ、図16(b)に示すよう
に各サブバンドごとの可聴成分が抽出される。次に情報
量算出手段では可聴成分6dBに対し1bitの情報量
を与えることにより図16(c)に示すように各サブバ
ンド帯域に対する情報量が算出される。Next, the operation of the seventh embodiment will be described.
In the hierarchical encoder 22, first, the audio signal is divided into n subbands by the subband n division filter 41, and at the same time, in the audible component extracting means 42, the audio signal is orthogonally transformed into the frequency domain by the FFT transformation, and the frequency domain is obtained. At, the masking level based on the auditory characteristics is obtained, and the audible component is extracted. As shown in FIG. 16A, the difference between the frequency spectrum and the masking level is the audible component. Furthermore, the audible components are grouped into subband bands by subband division, and the audible components of each subband are extracted as shown in FIG. 16 (b). Next, the information amount calculation means gives the amount of information of 1 bit to the audible component of 6 dB to calculate the amount of information for each subband band as shown in FIG.
【0111】そして、ローパスフィルタ55にてサブバ
ンド毎の情報量が平滑化され、サブバンドごとの平均情
報量が得られる。一方、各フレームの瞬時情報量算出手
段52では、n個のサブバンドの情報量が加算され、1
フレームの情報量が算出される。符号化レートに基づく
フレームあたりの情報量設定器45では、所望の符号化
レートを設定することによりそのビットレートに基づき
フレームあたりの情報量Cが算出され、情報量コントロ
ール回路53に送られる。情報量コントロール回路53
では、それまでに符号化されたフレームに割り当てられ
たフレームあたりの平均情報量に従い最終的な平均割当
情報量が符号化レートに基づくフレームあたりの情報量
設定器で設定された情報量Cに一致するように、各フレ
ームの情報量算出手段44により算出された情報量に対
し瞬時割当情報量を定める。Then, the low pass filter 55 smoothes the information amount for each sub-band and obtains the average information amount for each sub-band. On the other hand, in the instantaneous information amount calculating means 52 of each frame, the information amount of n subbands is added to obtain 1
The information amount of the frame is calculated. The information amount per frame setting unit 45 based on the coding rate sets the desired coding rate to calculate the information amount C per frame based on the bit rate and sends it to the information amount control circuit 53. Information amount control circuit 53
Then, according to the average information amount per frame assigned to the encoded frames so far, the final average assigned information amount matches the information amount C set by the information amount per frame setting unit based on the encoding rate. Thus, the instantaneous allocation information amount is determined with respect to the information amount calculated by the information amount calculation means 44 of each frame.
【0112】そして、ローパスフィルタ56にて瞬時割
当情報量が平滑化され平均割当情報量が算出される。次
に各階層の帯域決定手段47では、ローパスフィルタ5
5により得られた平滑化された各サブバンドごとの情報
量と、ローパスフィルタ56により得られた平滑化され
た割当情報量を入力し、平均割当情報量を4分割するこ
とにより各階層あたりの割当情報量を算出し、各階層ご
とに割当情報量でカバーできる帯域を低域側より算出
し、それを各階層の割当帯域とする。Then, the low-pass filter 56 smooths the instantaneous allocation information amount and calculates the average allocation information amount. Next, in the band determination means 47 of each layer, the low pass filter 5
5 is input, and the smoothed allocation information amount obtained by the low-pass filter 56 is input, and the average allocation information amount is divided into four to divide the average allocation information amount into four. The allocation information amount is calculated, the band that can be covered by the allocation information amount for each layer is calculated from the low band side, and this is set as the allocation band for each layer.
【0113】ビットアロケーション回路51では、各階
層の帯域決定手段47により得られた各階層への割当帯
域情報と、可聴成分抽出手段42により得られた可聴成
分により、各階層の割当帯域内の可聴成分に対し、その
大きさに従って再ビット割当がなされる。量子化器49
では、ビットアロケーション回路48より得られた各サ
ブバンドに対するビット割当情報に従い、サブバンドn
分割フィルタ41より得られるサブバンドデータが量子
化される。階層符号化フォーマッティング器50では、
各階層の帯域決定手段47より得られる各階層の割当帯
域情報に従い、ビット割当情報と量子化データが各階層
ごとにフォーマッティングされ、半導体メモリ5に送ら
れる。In the bit allocation circuit 51, the audible band within each layer is audible by the band allocation information for each layer obtained by the band determining unit 47 of each layer and the audible component obtained by the audible component extracting unit 42. The components are re-bit-allocated according to their magnitude. Quantizer 49
Then, according to the bit allocation information for each sub-band obtained from the bit allocation circuit 48, the sub-band n
The subband data obtained by the division filter 41 is quantized. In the hierarchical coding formatter 50,
The bit allocation information and the quantized data are formatted for each layer according to the allocated band information for each layer obtained from the band determining unit 47 for each layer and sent to the semiconductor memory 5.
【0114】次に、情報量コントロール回路53での情
報量コントロール動作について述べる。情報量コントロ
ール回路53では、まずコンパレータ57により情報量
設定器45より得られる所望のビットレートに従ったフ
レームあたりの情報量とビットアロケーション回路48
よりえられるビット割当情報量の差分が抽出され、ロー
パスフィルタ58により抽出された差分が平滑化され
る。次に符号化比率変換器59でローパスフィルタ58
により平滑化された差分値が符号化比率に変換され、乗
算器60にて符号化比率変換器59により算出された符
号化比Kを各フレームの情報量算出手段44により得ら
れる情報量に乗算し、割当情報量が算出される。以上の
動作により、所望のビットレートと割当情報の差の累積
値に従い緩やかに情報量を制御することにより可変長フ
レーム符号化における情報量を平均的に所定のビットレ
ートにコントロールしている。Next, the information amount control operation in the information amount control circuit 53 will be described. In the information amount control circuit 53, first, the information amount per frame and the bit allocation circuit 48 according to the desired bit rate obtained from the information amount setting unit 45 by the comparator 57.
The difference in the obtained bit allocation information amount is extracted, and the difference extracted by the low-pass filter 58 is smoothed. Next, the coding ratio converter 59 uses the low pass filter 58.
The difference value smoothed by is converted into a coding ratio, and the multiplier 60 multiplies the coding ratio K calculated by the coding ratio converter 59 by the information amount obtained by the information amount calculating means 44 of each frame. Then, the allocation information amount is calculated. By the above operation, the information amount in variable-length frame coding is controlled to a predetermined bit rate on average by gently controlling the information amount according to the accumulated value of the difference between the desired bit rate and the allocation information.
【0115】以上のように入力されたオーディオ信号に
基づいてビット割当可変、帯域可変で各階層の符号を構
成する階層符号化を用いることにより、高音質で効率よ
く記録でき、また記録時間に捕らわれずに最適な音質で
記録再生できるメモリオーディオレコーダが得られる。As described above, by using the hierarchical coding in which the code of each layer is configured by variable bit allocation and variable band based on the input audio signal, it is possible to efficiently record with high sound quality and to be captured in the recording time. It is possible to obtain a memory audio recorder that can record and reproduce with optimum sound quality without having to do so.
【0116】実施例8.
図28は、この発明の実施例8のブロック回路図で、図
1と同一符号はそれぞれ同一部分を示している。この実
施例8では、オーディオ信号を周波数領域に変換したデ
ータを量子化する場合について説明するが、量子化する
データはサブバンドデータでもよい。図28において、
61は符号化器62に入力されるディジタルオーディオ
データ、63は時間−周波数領域変換回路(以下、「周
波数領域変換回路」という)で、入力されたディジタル
オーディオデータ61を周波数領域に変換する。64は
周波数領域変換回路63により変換された変換係数デー
タ、65はビット割当回路で、入力されたオーディオ信
号の特性に基づいて所定の音質を得るように変換係数デ
ータ64に対するビット割当を定める。66はビット割
当回路65により定められたビット割当情報、67は量
子化回路で、周波数領域変換回路63により得られた変
換係数データ64をビット割当回路65より与えられた
ビット数で量子化する。68は量子化回路67により量
子化された量子化データ、69はビット割当情報66と
量子化データ68をフォーマッティングするフォーマッ
ティング回路、70はビット割当情報66によりフレー
ム長を算出するフレーム長算出回路、71はフレーム長
算出回路70より算出されたフレーム長に従って書き込
みアドレスを制御する書き込みアドレス制御回路で、6
3,65,67,69,70,71で符号化器62を構
成している。Example 8. 28 is a block circuit diagram of an eighth embodiment of the present invention, and the same reference numerals as those in FIG. 1 denote the same parts. In the eighth embodiment, the case where the data obtained by converting the audio signal into the frequency domain is quantized will be described, but the quantized data may be subband data. In FIG. 28,
Reference numeral 61 is digital audio data input to the encoder 62, and 63 is a time-frequency domain conversion circuit (hereinafter referred to as "frequency domain conversion circuit"), which converts the input digital audio data 61 into a frequency domain. Reference numeral 64 is transform coefficient data converted by the frequency domain transform circuit 63, and 65 is a bit allocation circuit, which determines bit allocation for the transform coefficient data 64 so as to obtain a predetermined sound quality based on the characteristics of the input audio signal. Reference numeral 66 is bit allocation information defined by the bit allocation circuit 65, and 67 is a quantization circuit, which quantizes the transform coefficient data 64 obtained by the frequency domain conversion circuit 63 with the number of bits given by the bit allocation circuit 65. Reference numeral 68 is quantized data quantized by the quantization circuit 67, 69 is a formatting circuit that formats the bit allocation information 66 and the quantized data 68, 70 is a frame length calculation circuit that calculates the frame length based on the bit allocation information 66, 71 Is a write address control circuit for controlling the write address according to the frame length calculated by the frame length calculation circuit 70.
An encoder 62 is composed of 3, 65, 67, 69, 70 and 71.
【0117】5は符号化データを記憶する半導体メモ
リ、72は半導体メモリ5より取り出されたビット割当
情報、73はビット割当情報およびフレーム長算出回路
で、ビット割当情報72を一時バッファに蓄え、このビ
ット割当情報72よりフレーム長を算出する。74は読
みだしアドレス制御回路で、入力されるフレーム長に従
って必要な量子化データ75を半導体メモリ5より読み
出すように読みだしアドレスを制御する。75は半導体
メモリ5から読みだされた量子化データ、76はビット
割当情報72により与えられたビット数の量子化データ
75を逆量子化する逆量子化回路で、73,74,76
で復号化器77を構成している。Reference numeral 5 is a semiconductor memory for storing coded data, 72 is bit allocation information extracted from the semiconductor memory 5, 73 is bit allocation information and a frame length calculation circuit, which stores the bit allocation information 72 in a temporary buffer. The frame length is calculated from the bit allocation information 72. A read address control circuit 74 controls the read address so that the required quantized data 75 is read from the semiconductor memory 5 in accordance with the input frame length. Reference numeral 75 is quantized data read from the semiconductor memory 5, and 76 is an inverse quantization circuit for inversely quantizing the quantized data 75 having the number of bits given by the bit allocation information 72.
And constitutes the decoder 77.
【0118】図29は図28中に示すビット割当回路6
5の構成を示したものである。図29において、78は
帯域分割エネルギ算出回路で、係数データ64を複数の
周波数帯域に分割し、各帯域のエネルギを算出する。7
9は許容ノイズレベル算出回路で、帯域分割エネルギ算
出回路78で算出された各帯域のエネルギに基づいて各
帯域の許容ノイズレベルを算出する。80はビット割当
算出回路で、許容ノイズレベル算出回路79で算出され
た各帯域の許容ノイズレベルと、各帯域のエネルギの差
に応じて各帯域に分けられた変換係数に割り当てるビッ
ト数を決める。FIG. 29 shows the bit allocation circuit 6 shown in FIG.
5 shows the configuration of No. 5. In FIG. 29, a band division energy calculation circuit 78 divides the coefficient data 64 into a plurality of frequency bands and calculates the energy of each band. 7
An allowable noise level calculation circuit 9 calculates an allowable noise level of each band based on the energy of each band calculated by the band division energy calculation circuit 78. Reference numeral 80 denotes a bit allocation calculation circuit, which determines the number of bits allocated to the conversion coefficient divided into each band according to the difference between the allowable noise level of each band calculated by the allowable noise level calculation circuit 79 and the energy of each band.
【0119】図30は、符号化器71により高能率符号
化された1フレームの符号化データを示すフォーマット
図である。1フレームの符号化データは、固定長のビッ
ト割当情報と可変長の量子化データで構成される。FIG. 30 is a format diagram showing coded data of one frame, which is coded by the encoder 71 with high efficiency. One frame of encoded data is composed of fixed-length bit allocation information and variable-length quantized data.
【0120】図31は、ビット割当回路65でビット算
出に用いられる、マスキングスレッショルドと最小可聴
限の関係を示す図である。図32は、各帯域のエネルギ
と、算出された許容ノイズレベルを示す図である。FIG. 31 is a diagram showing the relationship between the masking threshold and the minimum audible limit, which is used for bit calculation in the bit allocation circuit 65. FIG. 32 is a diagram showing the energy of each band and the calculated allowable noise level.
【0121】図33は、半導体メモリ5上に符号化デー
タを記録する際に、ビット割当情報66と量子化データ
68を、補助情報記録エリアと量子化データ記録エリア
に分けて記録する場合において、高速再生をする場合の
動作を示す図である。FIG. 33 shows a case where the bit allocation information 66 and the quantized data 68 are separately recorded in the auxiliary information recording area and the quantized data recording area when the encoded data is recorded in the semiconductor memory 5. It is a figure which shows operation | movement at the time of performing a high speed reproduction.
【0122】次に、実施例8の記録時の動作について説
明する。A/D変換器3にてディジタルデータに変換さ
れたオーディオ信号61は、符号化器62の時間−周波
数領域変換回路63に入力され、時間−周波数領域変換
回路63で一定のサンプルごとにブロック化され、その
フレーム単位で周波数領域に変換され、変換係数データ
64はビット割当回路65に入力される。ビット割当回
路65では、所定の音質を満たすように入力されたオー
ディオ信号の特性に基づいたビット割当が行われる。ビ
ット割当回路65で決められたビット割当情報66は量
子化回路67に入力される。量子化回路67では、入力
されたビット割当情報66に基づいて変換係数データ6
4が割り当てられたビット数で量子化される。ビット割
当情報66と量子化データ68は、フォーマッティング
回路69にてフォーマットされる。また、ビット割当情
報66はフレーム長算出回路70に入力され、フレーム
長算出回路70では、変換係数に割り当てられたビット
数とそのビット数で量子化される変換係数の数により、
量子化データに割り当てられた全ビット数が求められ、
これに補助情報として送られる固定長のビット割当情報
のビット数を加えられて符号化された1フレームの長さ
が算出され、書き込みアドレス制御回路71に送られ
る。Next, the recording operation of the eighth embodiment will be described. The audio signal 61 converted into digital data by the A / D converter 3 is input to the time-frequency domain conversion circuit 63 of the encoder 62, and the time-frequency domain conversion circuit 63 forms a block for each fixed sample. The converted coefficient data 64 is converted into a frequency domain in frame units, and the converted coefficient data 64 is input to the bit allocation circuit 65. The bit allocation circuit 65 performs bit allocation based on the characteristics of the input audio signal so as to satisfy a predetermined sound quality. The bit allocation information 66 determined by the bit allocation circuit 65 is input to the quantization circuit 67. In the quantization circuit 67, the transform coefficient data 6 is generated based on the input bit allocation information 66.
4 is quantized with the allocated number of bits. The bit allocation information 66 and the quantized data 68 are formatted by the formatting circuit 69. Further, the bit allocation information 66 is input to the frame length calculation circuit 70, and in the frame length calculation circuit 70, according to the number of bits assigned to the transform coefficient and the number of transform coefficients quantized by the number of bits,
The total number of bits assigned to the quantized data is calculated,
The number of bits of fixed-length bit allocation information sent as auxiliary information is added to this to calculate the length of one encoded frame, which is sent to the write address control circuit 71.
【0123】このように、所定の音質が得られるように
ビット割当され、そのビット数で量子化された量子化デ
ータと、割り当てられたビット割当情報を記録すること
により、一定長の1フレームのオーディオデータを可変
長に符号化するような符号化法を、以下、「フレーム長
可変符号化」という。書き込みアドレス制御回路71で
は、入力されたフレーム長に従って書き込みアドレスが
発生され、フォーマッティングされた圧縮データが半導
体メモリ5に書き込まれ、書き込みアドレスがフレーム
長に従って移動される。その結果、半導体メモリ5には
符号化データがフレーム長可変で連続的に記録される。As described above, by recording the quantized data that is bit-allocated so as to obtain a predetermined sound quality and quantized by the number of bits and the allocated bit allocation information, one frame of a fixed length is recorded. An encoding method for encoding audio data in a variable length is hereinafter referred to as "frame length variable encoding". In the write address control circuit 71, a write address is generated according to the input frame length, the formatted compressed data is written in the semiconductor memory 5, and the write address is moved according to the frame length. As a result, encoded data is continuously recorded in the semiconductor memory 5 with a variable frame length.
【0124】次に、再生時には、半導体メモリ5より固
定長のビット割当情報72が読みだされ、ビット割当情
報バッファ73に蓄えられる。ビット割当情報バッファ
73では、入力されたビット割当情報より量子化データ
に割当られたビット数が算出され、読みだしアドレス制
御回路74に送られる。読みだしアドレス制御回路74
では、入力された量子化データの符号長にしたがって読
みだしアドレスが発生され、半導体メモリ5より量子化
データ75が読みだされる。読みだされた量子化データ
75は、逆量子化回路76において、ビット割当情報バ
ッファ73より入力されるビット割当情報にしたがっ
て、与えられたビット数の量子化データが逆量子化さ
れ、復号される。復号化器77の出力はD/A変換器8
によりアナログオーディオ信号に変換され、所定のオー
デイオレベルの増幅するオーディオアンプ9を経て、オ
ーディオ出力端子10から出力される。Next, at the time of reproduction, the fixed-length bit allocation information 72 is read from the semiconductor memory 5 and stored in the bit allocation information buffer 73. In the bit allocation information buffer 73, the number of bits allocated to the quantized data is calculated from the input bit allocation information and sent to the read address control circuit 74. Read address control circuit 74
Then, a read address is generated according to the code length of the input quantized data, and the quantized data 75 is read from the semiconductor memory 5. The quantized data 75 read out is inversely quantized and decoded by the inverse quantization circuit 76 according to the bit allocation information input from the bit allocation information buffer 73. . The output of the decoder 77 is the D / A converter 8
Is converted into an analog audio signal by the audio amplifier 9 and is output from an audio output terminal 10 through an audio amplifier 9 which amplifies a predetermined audio level.
【0125】次に、上記半導体メモリレコーダの符号化
器62中のビット割当回路65におけるビット割当動作
を図29について説明する。入力された変換係数データ
64は、帯域分割エネルギ算出回路78にて複数の周波
数帯域に分割され、各帯域の変換係数より平均エネルギ
が算出される。算出された各帯域のエネルギは許容ノイ
ズレベル算出回路79に入力され、許容ノイズレベルが
算出される。許容ノイズレベルの算出には、人間の聴覚
特性を考慮して聴感上劣化の少ない圧縮を行うため、マ
スキング効果、最小可聴限特性等が用いられる。ここ
で、マスキング効果とは、ある周波数帯域のレベルの大
きな音によって他の周波数帯域の音がマスクされる効果
であり、最小可聴限とは、人間の聞こえる最小レベルの
音である。Next, the bit allocation operation in the bit allocation circuit 65 in the encoder 62 of the semiconductor memory recorder will be described with reference to FIG. The input conversion coefficient data 64 is divided into a plurality of frequency bands by the band division energy calculation circuit 78, and the average energy is calculated from the conversion coefficient of each band. The calculated energy of each band is input to the allowable noise level calculation circuit 79, and the allowable noise level is calculated. To calculate the allowable noise level, a masking effect, a minimum audible limit characteristic, etc. are used in order to perform compression with little deterioration in hearing in consideration of human auditory characteristics. Here, the masking effect is an effect in which a sound with a high level in a certain frequency band masks a sound in another frequency band, and the minimum audible limit is a sound with a minimum level that a human can hear.
【0126】図31に各帯域のエネルギに対してマスキ
ング効果、最小可聴限により許容ノイズレベルが算出さ
れる例を示す。図31において、S1〜S10は10箇
の周波数帯域に分割された場合の各周波数帯域のエネル
ギを示す。各帯域のエネルギから左右に伸びた斜線は、
その帯域の音によりマスキングされる領域を示す。ま
た、破線の特性曲線は最小可聴限を示す。各周波数帯域
の許容ノイズレベルは、他の周波数帯域からのマスキン
グレベルと最小可聴限のうち最大レベルのものが選ばれ
る。図31の例において、選ばれた各周波数帯域の許容
ノイズレベルを図32中に横線で示す。許容ノイズレベ
ル算出回路79で算出された許容ノイズレベルと各帯域
のエネルギは、割当ビット算出回路80に入力される。
割当ビット算出回路80では、許容ノイズレベル以下の
音は聞こえないため、許容ノイズレベルを超える帯域の
音に対し、各周波数帯域のエネルギと許容ノイズレベル
の差に応じたビット数を算出し、ビット割当情報66を
出力する。このように割り当てられたビット数は、入力
されたオーディオ信号の性質に基づくものであり、1フ
レームの符号化に割り当てられるビット数は可変であ
る。FIG. 31 shows an example in which the allowable noise level is calculated by the masking effect and the minimum audible limit for the energy in each band. In FIG. 31, S1 to S10 represent energy in each frequency band when divided into 10 frequency bands. The diagonal lines extending from the energy of each band to the left and right are:
The area masked by the sound in that band is shown. Also, the dashed characteristic curve indicates the minimum audible limit. As the allowable noise level of each frequency band, the maximum level of the masking level from other frequency bands and the minimum audible limit is selected. In the example of FIG. 31, the allowable noise level of each selected frequency band is shown by a horizontal line in FIG. The allowable noise level calculated by the allowable noise level calculating circuit 79 and the energy of each band are input to the allocated bit calculating circuit 80.
Since the allocated bit calculation circuit 80 does not hear the sound below the allowable noise level, it calculates the number of bits corresponding to the difference between the energy of each frequency band and the allowable noise level for the sound in the band exceeding the allowable noise level. The allocation information 66 is output. The number of bits allocated in this way is based on the property of the input audio signal, and the number of bits allocated for encoding one frame is variable.
【0127】以上のように、ビット割当された1フレー
ムの符号化データは、図30に示すように固定長のビッ
ト割当情報と、割り当てられたビット数で量子化された
可変長の量子化データに符号化され、フォーマッテング
される。このように固定長のビット割当情報を補助情報
とすることにより、量子化データに割り当てられたビッ
ト数が算出できるので、可変長フレームでの符号化が可
能である。また、半導体メモリ5ではアドレスの制御に
より記録位置を高速でランダムに決めれるので、可変長
フレームの符号の記録が可能である。As described above, the bit-assigned encoded data of one frame is the fixed-length bit assignment information and the variable-length quantized data quantized by the assigned number of bits as shown in FIG. Is encoded and formatted. By using the fixed-length bit allocation information as the auxiliary information in this way, the number of bits allocated to the quantized data can be calculated, so that coding in a variable-length frame is possible. Further, in the semiconductor memory 5, since the recording position can be randomly determined at high speed by controlling the address, it is possible to record the code of the variable length frame.
【0128】また、可変長フレームの符号を図30に示
すようなフォーマットで記録せず、半導体メモリ5上
に、補助情報を記録するエリアと量子化データを記録す
るエリアを設け、補助情報を記録するエリアにビット割
当情報66を固定長で連続的に記録し、量子化データ6
8を記録するエリアに可変長の量子化データを連続的に
記録するようにする。これにより、補助情報エリアの固
定長のビット割当情報により量子化データの記録された
アドレスを算出し、所定のフレーム間隔で量子化データ
を読みだして復号することにより、高速再生が可能とな
る。The variable length frame code is not recorded in the format as shown in FIG. 30, but an area for recording auxiliary information and an area for recording quantized data are provided on the semiconductor memory 5, and auxiliary information is recorded. The bit allocation information 66 is continuously recorded with a fixed length in the area
Variable length quantized data is continuously recorded in the area for recording 8. As a result, the address at which the quantized data is recorded is calculated based on the fixed-length bit allocation information of the auxiliary information area, and the quantized data is read out and decoded at a predetermined frame interval, which enables high-speed reproduction.
【0129】図33にこの一例を示す。図33の例で
は、アドレス0より999が補助情報(ビット割当情
報)記録エリア、アドレス1000より量子化データ記
録エリアとなっており、アドレス0より20ビットでビ
ット割当情報が記録されている。ビット割当情報の中に
示されている数字は、ビット割当情報より算出される量
子化データの1フレームのビット数であり、量子化デー
タ記録エリアには、この数字で示される量子化データが
可変長で連続記録されている。図中の丸で囲まれた数字
はフレーム番号を示す。よって、ビット割当情報中の数
字に量子化データ記録エリアの最初のアドレス1000
を加算することにより、量子化データの記録されている
最初のアドレスが算出できる。ゆえに、まず補助情報中
のビット割当情報を読みだし、読みだしたビット割当情
報より量子化データの記録されているアドレスを算出
し、5フレーム毎に算出されたアドレスより量子化デー
タを読みだし、復号することにより5倍速の高速再生が
可能となる。量子化データの読みだしは、図33中の二
重丸で囲まれた番号のフレーム1、6、11、16・・
・・の順で行われ、読みだされるフレームのアドレス
は、1000、1378、1723、2112・・・・
となる。FIG. 33 shows an example of this. In the example of FIG. 33, addresses 0 to 999 are auxiliary information (bit allocation information) recording areas and addresses 1000 are quantized data recording areas, and bit allocation information is recorded in 20 bits from address 0. The number shown in the bit allocation information is the number of bits in one frame of the quantized data calculated from the bit allocation information, and the quantized data indicated by this number is variable in the quantized data recording area. It has been recorded continuously for a long time. The numbers circled in the figure indicate frame numbers. Therefore, the number in the bit allocation information is set to the first address 1000 of the quantized data recording area.
By adding, the first address in which the quantized data is recorded can be calculated. Therefore, first, the bit allocation information in the auxiliary information is read, the address where the quantized data is recorded is calculated from the read bit allocation information, and the quantized data is read from the address calculated every 5 frames, Decoding enables high-speed reproduction at 5 times speed. Reading of the quantized data is performed by using frames 1, 6, 11, 16 ... With numbers surrounded by double circles in FIG.
The addresses of the frames that are read out in this order are 1000, 1378, 1723, 2112 ...
Becomes
【0130】上記のように、入力されたオーディオ信号
に基づいて所定の音質が得られるようフレーム長可変で
ビット割当を行い、ビット割当情報と量子化データに符
号化するフレーム長可変符号化方式を用い、可変長フレ
ームで高速ランダムアクセス可能な半導体メモリに記憶
されることにより、高音質で効率のよく記録でき、長時
間記録可能な半導体メモリレコーダが得られる。As described above, a variable frame length encoding method is used in which bit allocation is performed with variable frame length so as to obtain a predetermined sound quality based on the input audio signal, and bit allocation information and quantized data are encoded. By using it and storing it in a semiconductor memory capable of high-speed random access in a variable length frame, it is possible to obtain a semiconductor memory recorder capable of recording with high sound quality and with high efficiency and capable of recording for a long time.
【0131】実施例9.
次に、この発明の実施例9を図について説明する。図3
4において、図28と同一符号はそれぞれ同一部分を示
しており、81は再生フレーム選択回路で、ビット割当
情報により量子化データに割り当てられたビット数を算
出し、割り当てられたビット数が、所定のしきい値を超
えたフレームのみを再生フレームとして選択する。82
は再生フレーム選択回路81により得られる再生フレー
ム選択情報と再生フレームのビット割当情報、83は再
生フレーム選択回路81で算出された量子化データの符
号長と再生フレーム選択情報である。Example 9. Next, a ninth embodiment of the present invention will be described with reference to the drawings. Figure 3
In FIG. 4, the same reference numerals as those in FIG. 28 indicate the same parts, and 81 is a reproduction frame selection circuit, which calculates the number of bits allocated to the quantized data by the bit allocation information, and the allocated number of bits is a predetermined value. Only frames that exceed the threshold of are selected as playback frames. 82
Is the reproduction frame selection information and the reproduction frame bit allocation information obtained by the reproduction frame selection circuit 81, and 83 is the code length of the quantized data calculated by the reproduction frame selection circuit 81 and the reproduction frame selection information.
【0132】実施例9の記録時の動作は、実施例1と同
様であるので説明は省略する。次に、再生時の「早聞き
動作」について説明する。ここでの「早聞き」とは、デ
ータを一定の間隔で連続的に飛ばすことによる高速再
生、あるいは再生速度を速めることによる早聞きではな
く、半導体メモリレコーダを会議メモ等会話の記録に用
いた場合に、無音部分あるいは周囲の雑音のみで会話の
記録されていない部分を飛ばすことにより、必要な会話
部分のみを連続的に再生することによる早聞きである。Since the recording operation of the ninth embodiment is the same as that of the first embodiment, its explanation is omitted. Next, the “fast-listening operation” during reproduction will be described. "Fast-listening" is not high-speed playback by continuously skipping data at regular intervals or fast-listening by increasing the playback speed, but a semiconductor memory recorder was used to record conversations such as conference memos. In this case, the quick listening is performed by continuously reproducing only the necessary conversational part by skipping the unrecorded part of the conversation only by the silent part or the ambient noise.
【0133】半導体メモリ5より固定長のビット割当情
報72が読みだされ、再生フレーム選択回路81に入力
される。再生フレーム選択回路81では、ビット割当情
報72により1フレームの量子化データに割り当てられ
たビット数が算出される。ここで、実施例8において述
べたような方法でビット割当がされている場合、無音部
分においては全変換係数が最小可聴限以下のレベルとな
るため、量子化データに割り当てられるビット数は0と
なる。The fixed length bit allocation information 72 is read from the semiconductor memory 5 and input to the reproduction frame selection circuit 81. In the reproduction frame selection circuit 81, the number of bits allocated to the quantized data of one frame is calculated by the bit allocation information 72. Here, when bits are allocated by the method as described in the eighth embodiment, the number of bits allocated to the quantized data is 0 because all the transform coefficients have a level below the minimum audible limit in the silent part. Become.
【0134】また、雑音のみが記録されている部分にお
いても、全体のレベルが小さいため量子化データに割り
当てられるビット数は非常に少なくなる。よって、1フ
レームに割り当てられているビット数に所定のしきい値
を設け、割り当てられたビット数がそのしきい値を超え
ないフレームについては、無音部分または雑音部分とし
て再生されず、しきい値を超えたフレームについて再生
フレーム選択情報とビット割当情報82が逆量子化回路
76に送られる。Further, even in the portion where only noise is recorded, the number of bits assigned to the quantized data is very small because the whole level is small. Therefore, a predetermined threshold value is set for the number of bits assigned to one frame, and a frame whose assigned number of bits does not exceed the threshold value is not reproduced as a silent part or a noise part, and the threshold value is The reproduction frame selection information and the bit allocation information 82 are sent to the dequantization circuit 76 for the frames exceeding.
【0135】また、再生フレーム選択回路81にて算出
された1フレームの量子化データに対する符号長と再生
フレーム選択情報83は、読みだしアドレス制御回路7
4に送られる。読みだしアドレス制御回路74では、再
生フレームとして選択されたフレームが入力された場合
には、ともに入力された量子化データの符号長にしたが
って読みだしアドレスが発生され、半導体メモリ5より
量子化データ75が読みだされる。The code length for the quantized data of one frame calculated by the reproduction frame selection circuit 81 and the reproduction frame selection information 83 are read out by the read address control circuit 7.
Sent to 4. In the read address control circuit 74, when a frame selected as a reproduction frame is input, a read address is generated according to the code length of the input quantized data, and the quantized data 75 is generated from the semiconductor memory 5. Is read out.
【0136】また、再生フレームとして選択されなかっ
たフレームでは、量子化データに割り当てられたビット
数分アドレスを移動する。読みだされた量子化データ7
5は逆量子化回路76においてフレーム選択情報ととも
に入力されるビット割当情報82にしたがって与えられ
たビット数の量子化データが逆量子化され、復号され
る。復号化器77の出力はD/A変換器8によりアナロ
グオーディオ信号に変換され、所定のオーデイオレベル
の増幅するオーディオアンプ9を経て、オーディオ出力
端子10から出力される。In the frame not selected as the reproduction frame, the address is moved by the number of bits assigned to the quantized data. Quantized data read out 7
In the dequantization circuit 76, the quantized data of the number of bits given according to the bit allocation information 82 input together with the frame selection information is dequantized and decoded in the dequantization circuit 76. The output of the decoder 77 is converted into an analog audio signal by the D / A converter 8 and is output from the audio output terminal 10 through the audio amplifier 9 which amplifies a predetermined audio level.
【0137】以上のように、入力された信号に基づきビ
ット割当を行うフレーム長可変符号化では、無音部分等
情報量の少ないフレームはビット割当は非常に少ないの
で、上記のようにビット割当が所定のしきい値を超えた
フレームのみを再生することにより、無音区間等を飛ば
し、音声の記録されている部分のみを早聞き再生でき
る。As described above, in frame length variable coding in which bit allocation is performed based on the input signal, a frame with a small amount of information such as a silent part has a very small bit allocation. By playing back only the frames that exceed the threshold value of 1, the silent sections can be skipped, and only the recorded portion of the voice can be played back fast.
【0138】[0138]
【発明の効果】以上のように、この発明のオーディオ信
号記録装置によれば、オーディオ信号をディジタル信号
に符号化して記録媒体に記録するオーディオ信号記録装
置であって、オーディオ信号を複数の階層符号ブロック
に分割し、優先順位の低い階層符号ブロックが欠如して
も優先順位の高い階層符号ブロックのみでオーディオ信
号が復号できるように各階層符号ブロックに優先順位を
持たせて符号化する階層符号化手段と、上記記録媒体の
記憶容量が所定量に達した場合に優先順位の低い階層符
号ブロックのオーディオ信号が書き込まれている記録エ
リアから順次優先順位の高い階層符号ブロックのオーデ
ィオ信号を上書きする制御手段と、上記記録媒体に記録
されるオーディオ信号の階層レベルの識別信号を該記録
媒体に記録する識別信号記録手段とを備えるので、記録
媒体の記録時間を伸ばすことができ、記録容量の有効活
用が可能である。 As described above, the audio signal of the present invention is used.
According to the No. recording device , an audio signal is converted into a digital signal.
Audio signal recording device for encoding into a recording medium and recording to a recording medium
The audio signal into multiple hierarchical code blocks.
And lack of lower priority hierarchical code blocks
Audio signals only with hierarchical code blocks with high priority.
Prioritize each hierarchical code block so that the
A hierarchical encoding means for carrying and encoding the recording medium,
Hierarchical code with lower priority when the storage capacity reaches a certain amount
Signal in which the audio signal of the signal block is written.
The order of hierarchical code blocks with higher priority from the rear
Control means for overwriting the audio signal and recording on the recording medium
The identification signal of the hierarchical level of the audio signal to be recorded
Since the identification signal recording means for recording on the medium is provided,
The recording time of the medium can be extended and the recording capacity can be effectively utilized.
Can be used.
【0139】この発明に係るオーディオ信号再生装置
は、オーディオ信号をディジタル信号に変換し、この信
号を最も優先順位の低い階層ブロックから順に符号化す
る階層符号化手段により複数の階層ブロックに分割し、
記録媒体に記録したオーディオ信号を再生するオーディ
オ信号再生装置であって、上記記録媒体の読み出し速度
を可変できる可変速再生制御手段と、上記階層化された
オーディオデータの階層レベルが低い信号のみの復号で
は復号処理時間が短く、復号する階層レベルが高くなる
に従って復号処理時間が長くなる階層復号化手段と、上
記可変速再生制御手段の再生速度から上記階層復号化手
段に割り当てられる復号時間を求め、この時間内に復号
可能な階層レベルを判断して、上記階層復号化手段に指
示を出す復号階層レベル判定手段とを備えるので、復号
可能な階層レベルについて復号可能であり、可変速再生
において正常な際声音を出力可能である。 Audio signal reproducing apparatus according to the present invention
Converts the audio signal into a digital signal and
Codes in order from the hierarchical block with the lowest priority.
Divided into a plurality of hierarchical blocks by the hierarchical coding means
Audio that plays back audio signals recorded on a recording medium
A signal reproducing device, the reading speed of the recording medium
Variable speed reproduction control means that can change the
Decoding only signals with low audio data hierarchy levels
Takes less time to decrypt and higher levels of decryption
According to the hierarchical decoding means
Based on the reproduction speed of the variable speed reproduction control means, the hierarchical decoding
Find the decoding time assigned to the stage and decode within this time
Judge the possible hierarchy levels and instruct the above hierarchy decoding means.
Since the decoding hierarchy level determining means for issuing
Decodable for all possible hierarchy levels, variable speed playback
It is possible to output a voice sound when normal.
【0140】この発明に係るオーディオ信号記録装置
は、オーディオ信号をディジタル信号に符号化して記録
媒体に記録するオーディオ信号記録装置において、オー
ディオ信号を複数の階層ブロックに分割し、各階層ブロ
ックに優先順位を持たせ、最も優先順位の低い階層ブロ
ックから順に欠如していってもオーディオ品質は劣化す
るものの、正常なオーディオ信号の復号が可能な階層符
号化手段を備え、その階層符号化手段において入力した
ディジタルオーディオ信号を複数の周波数帯域に分割す
るサブバンド分割手段、入力したディジタルオーディオ
信号を周波数領域に直交変換し聴覚特性に基づいて可聴
成分を抽出する可聴成分抽出手段、可聴成分より各フレ
ームごとにサブバンドごとの情報量を算出する第1の情
報量算出手段、サブバンドごとの情報量の総計により各
フレームの情報量を算出する第2の情報量算出手段、最
終的な平均割当情報量が所望のビットレートに近づくよ
うに割当帯域を決定するための割当情報量をコントロー
ルする制御手段、及びサブバンドごとの情報量と割当情
報量に基づき各階層に割り当てた帯域の情報量の合計が
各階層あたりの割当情報量に一致するように低域側から
各階層の割当帯域を決定する帯域決定手段を有し、各フ
レームごとに割当帯域と割当情報量を可変とするので、
符号化する信号の情報量に合わせて、各フレーム毎に割
当情報量を可変とする可変長符号化による階層符号化を
可能とする。 Audio signal recording apparatus according to the present invention
Records audio signals encoded into digital signals
In an audio signal recording device for recording on a medium,
Divide the audio signal into multiple hierarchical blocks and
Priorities to the hierarchy and the lowest priority hierarchy block.
Audio quality deteriorates even if the
Although it is a hierarchical code that can decode a normal audio signal
A coding means is provided, and the data is input in the hierarchical coding means.
Split a digital audio signal into multiple frequency bands
Sub-band dividing means, input digital audio
The signal is orthogonally transformed into the frequency domain and audible based on auditory characteristics
Audible component extraction means for extracting components,
The first information that calculates the amount of information for each subband for each
Each is based on the information volume calculation means and the total amount of information for each sub-band.
A second information amount calculating means for calculating the information amount of the frame,
The final average allocated information amount approaches the desired bit rate.
Control the amount of allocated information to determine the allocated bandwidth.
Control means, and the amount of information and allocation information for each sub-band.
The total amount of bandwidth information allocated to each tier is
From the low frequency side so that it matches the amount of assigned information for each layer
It has a band deciding unit that decides the allocated band of each tier.
Since the allocated bandwidth and the amount of allocated information can be changed for each frame,
It is divided for each frame according to the amount of information of the signal to be encoded.
Hierarchical coding by variable length coding that makes the amount of information variable
It is possible.
【0141】この発明に係るオーディオ信号記録装置
は、オーディオ信号を複数の階層ブロックに分割し、各
階層ブロックに優先順位を持たせて、最も優先順位の低
い階層ブロックから順に欠如していってもオーディオ品
質は劣化するものの、正常なオーディオ信号の復号が可
能な階層符号化手段を備えたオーディオ信号記録装置に
おいて、入力したディジタルオーディオ信号を複数の周
波数帯域に分割するサブバンド分割手段、入力したディ
ジタルオーディオ信号を周波数領域に直交変換し聴覚特
性に基づいて可聴成分を抽出する可聴成分抽出手段、各
フレームごとに可聴成分を用いて瞬時情報量を算出する
瞬時情報量算出手段、割当帯域を一定とする数フレーム
を1サイクルとし、1サイクルの可聴成分の平均値から
サブバンドごとの平均情報量を算出する平均情報量算出
手段、最終的な平均割当情報量が所望のビットレートに
近づくように各フレームの瞬時情報量に対し、1サイク
ルの区間割当情報量を平均割当情報量に従って増減させ
るようコントロールする制御手段、及びサブバンドごと
の平均情報量と区間割当情報量に基づき各階層に割り当
てた帯域の情報量の合計が各階層あたりの区間割当情報
量に一致するように低域側から1サイクル間の各階層の
割当帯域を決定する帯域決定手段を有し、1サイクルご
とに得られる各階層の割当帯域に対し、各フレームごと
に各割当帯域内の可聴成分に対し、その大きさに従って
再ビット割当を行うことにより、1サイクルごとに割当
帯域を1フレームごとに割当情報量を可変とするので、
符号化する信号の情報量にあわせて、1サイクルごとの
割当帯域に対して1フレーム毎の割当情報量を可変とす
る、可変長符号化による階層符号化を可能とする。 Audio signal recording apparatus according to the present invention
Divides the audio signal into multiple hierarchical blocks,
Hierarchical blocks are given priority so that they have the lowest priority.
Audio products even if they are lacking in order from the highest hierarchical block
Normal quality audio signal can be decoded although quality is degraded
Audio signal recording apparatus equipped with an effective hierarchical encoding means
The input digital audio signal
Sub-band dividing means for dividing into wave number bands, input di
The digital audio signal is orthogonally transformed into the frequency domain and
Audible component extraction means for extracting audible components based on sex,
Calculate the amount of instantaneous information using the audible component for each frame
Instantaneous information amount calculation means, several frames with constant allocated bandwidth
Is set as 1 cycle, and from the average value of the audible components of 1 cycle
Calculate the average information amount to calculate the average information amount for each subband
Means, the final average allocation information amount to the desired bit rate
One cycle for the amount of instantaneous information in each frame
Increase or decrease the section allocation information amount according to the average allocation information amount.
Control means to control so that each sub-band
Assigned to each layer based on the average amount of information and section allocation information amount
The total amount of bandwidth information is the section allocation information for each tier
To match the amount of each layer for one cycle from the low frequency side
Each cycle has a bandwidth determining means for determining the allocated bandwidth.
For each bandwidth allocated to each layer,
For each audible component in each allocated band according to its magnitude
Allocate every cycle by reallocating bits
Since the amount of allocated information is variable for each frame,
Depending on the amount of information of the signal to be encoded,
The amount of allocation information for each frame can be changed with respect to the allocated bandwidth
Hierarchical coding by variable length coding is possible.
【0142】この発明に係るオーディオ信号記録装置
は、オーディオ信号を複数の階層ブロックに分割し、各
階層ブロックに優先順位を持たせて、最も優先順位の低
い階層ブロックから順に欠如していってもオーディオ品
質は劣化するものの、正常なオーディオ信号の復号が可
能な階層符号化手段を備えたオーディオ信号記録装置に
おいて、入力したディジタルオーディオ信号を複数の周
波数帯域に分割するサブバンド分割手段、入力したディ
ジタルオーディオ信号を周波数領域に直交変換し聴覚特
性に基づいて可聴成分を抽出する可聴成分抽出手段、可
聴成分より各フレームごとにサブバンドごとの情報量を
算出する情報量算出手段、サブバンドごとの情報量から
各フレームごとに瞬時情報量を算出する瞬時情報量算出
手段、サブバンドごとの情報量の変化を平滑化する第1
の平滑化手段、最終的な平均割当情報量が所望のビット
レートに近づくように各フレームの瞬時情報量に対し、
瞬時割当情報量を平均割当情報量に従って増減させるよ
うにコントロールする制御手段、瞬時割当情報量の変化
を平滑化する第2の平滑化手段、及びサブバンドごとの
平滑化された情報量と平滑化された割当情報量に基づ
き、各フレームごとに各階層に割り当てた帯域の情報量
の合計が各階層あたりの割当情報量に一致するように低
域側から各階層の割当帯域を決定する帯域決定手段を有
し、各フレームごとに緩やかに変化する各階層の割当帯
域に対し、各フレームごとに各割当帯域内の可聴成分に
対し、その大きさに従って再ビット割当を行なうことに
より、各フレームで割当帯域を緩やかに変化させ、その
割当帯域内の割当情報量を可変とするので、可変長フレ
ーム符号化による階層符号化を可能とする。 Audio signal recording apparatus according to the present invention
Divides the audio signal into multiple hierarchical blocks,
Hierarchical blocks are given priority so that they have the lowest priority.
Audio products even if they are lacking in order from the highest hierarchical block
Normal quality audio signal can be decoded although quality is degraded
Audio signal recording apparatus equipped with an effective hierarchical encoding means
The input digital audio signal
Sub-band dividing means for dividing into wave number bands, input di
The digital audio signal is orthogonally transformed into the frequency domain and
Audible component extraction means for extracting the audible component based on sex,
The amount of information for each subband for each frame from the listening component
Information amount calculation means to calculate, from the information amount for each sub-band
Instantaneous information amount calculation that calculates the instantaneous information amount for each frame
First means for smoothing changes in the amount of information for each subband
Smoothing means, the final average allocation information amount is the desired bit
For the instantaneous information amount of each frame to approach the rate,
Increase or decrease the instantaneous allocation information amount according to the average allocation information amount.
Control means to control like this
A second smoothing means for smoothing
Based on the smoothed information amount and the smoothed assigned information amount
Information amount of the bandwidth allocated to each layer for each frame
Is low so that the total of
Bandwidth determination means to determine bandwidth allocation for each layer from the area side
However, the allocation band of each layer that changes slowly for each frame
Audible components in each allocated band for each frame
On the other hand, reallocating bits according to its size
Change the allocated bandwidth gently in each frame,
Since the amount of allocation information within the allocated bandwidth is variable, it is possible to
Hierarchical coding by frame coding is possible.
【0143】また、所望のビットレートに従ったフレー
ム当たりの情報量とビット割当情報量の差分を抽出する
比較手段、抽出した差分を平滑化する第3の平滑化手
段、及び上記第3の平滑化手段からの差分を符号化比率
に変換する変換手段を有し、所望のビットレートと割当
情報の差の累積値に従い緩やかに変化する符号化比率
を、各フレームの情報量に乗算することによって割当情
報量を制御することにより可変長フレーム符号化におけ
る情報量を平均的に所定のビットレートに制御するの
で、可変長フレーム符号化における情報量を平均的に所
定のビットレートにコントロールできる。 Also, the frame rate according to the desired bit rate
Extract the difference between the amount of information per program and the amount of bit allocation information
Comparison means, third smoothing means for smoothing the extracted difference
Stage, and the difference from the third smoothing means is the coding ratio.
It has a conversion means to convert to the desired bit rate and allocation
Coding ratio that changes gently according to the cumulative value of the information difference
Is calculated by multiplying the information amount of each frame by
In variable-length frame coding by controlling the amount of information
Control the amount of information to be averaged to a predetermined bit rate
The average amount of information in variable length frame coding is
You can control to a constant bit rate.
【図1】この発明の実施例1による半導体メモリオーデ
ィオレコーダのブロック回路図である。FIG. 1 is a block circuit diagram of a semiconductor memory audio recorder according to a first embodiment of the present invention.
【図2】実施例1の階層符号化方式の一構成例を示す図
である。FIG. 2 is a diagram illustrating a configuration example of a hierarchical coding system according to a first embodiment.
【図3】実施例1の階層符号化方式の他の構成例を示す
図である。FIG. 3 is a diagram illustrating another configuration example of the hierarchical encoding system according to the first embodiment.
【図4】実施例1の半導体メモリのメモリマップであ
る。FIG. 4 is a memory map of the semiconductor memory according to the first embodiment.
【図5】実施例1のオーディオ信号の半導体メモリへの
記録経過を示した図である。FIG. 5 is a diagram showing a recording process of recording an audio signal in Example 1 in a semiconductor memory.
【図6】この発明の実施例2による半導体メモリオーデ
ィオレコーダのブロック回路図である。FIG. 6 is a block circuit diagram of a semiconductor memory audio recorder according to a second embodiment of the present invention.
【図7】この発明の実施例3による半導体メモリオーデ
ィオ記録再生装置のブロック回路図である。FIG. 7 is a block circuit diagram of a semiconductor memory audio recording / reproducing apparatus according to a third embodiment of the present invention.
【図8】実施例3の階層符号化の概念を説明するための
図である。FIG. 8 is a diagram for explaining the concept of hierarchical coding according to the third embodiment.
【図9】実施例3の階層符号化の階層レベルを示す周波
数特性図である。FIG. 9 is a frequency characteristic diagram showing hierarchical levels of hierarchical coding according to the third embodiment.
【図10】実施例3の階層符号化器の構成と半導体メモ
リへの記録方式の概念を示す図である。FIG. 10 is a diagram showing a concept of a configuration of a hierarchical encoder and a recording system in a semiconductor memory according to a third embodiment.
【図11】実施例3の半導体メモリのメモリマップであ
る。FIG. 11 is a memory map of a semiconductor memory according to a third embodiment.
【図12】この発明の実施例4による半導体メモリオー
ディオ記録再生装置のブロック回路図である。FIG. 12 is a block circuit diagram of a semiconductor memory audio recording / reproducing apparatus according to Embodiment 4 of the present invention.
【図13】実施例4のオーディオ復号時間とオーディオ
再生時間の関係を示す図である。FIG. 13 is a diagram showing a relationship between an audio decoding time and an audio reproduction time according to the fourth embodiment.
【図14】本発明の実施例5〜7による半導体メモリオ
ーディオ記録再生装置の階層符号化の階層レベルを示す
周波数特性図である。FIG. 14 is a frequency characteristic diagram showing hierarchical levels of hierarchical encoding of the semiconductor memory audio recording / reproducing apparatus according to Examples 5 to 7 of the present invention.
【図15】実施例5の階層符号化器の構成と半導体メモ
リへの記録方式の概念を示す図である。FIG. 15 is a diagram showing a configuration of a hierarchical encoder and a concept of a recording system in a semiconductor memory according to a fifth embodiment.
【図16】実施例5〜7の階層符号化器における可聴成
分の抽出と情報量算出の様子を示す図である。FIG. 16 is a diagram showing how audible components are extracted and the amount of information is calculated in the layered encoders of Embodiments 5 to 7.
【図17】実施例5〜7の階層符号化器における各階層
の割当帯域決定の様子を示す図である。[Fig. 17] Fig. 17 is a diagram illustrating a state of determining an allocation band of each layer in a layer encoder of Examples 5 to 7.
【図18】実施例6の階層符号化器の構成を示す図であ
る。[Fig. 18] Fig. 18 is a diagram illustrating the configuration of a hierarchical encoder according to a sixth embodiment.
【図19】実施例6の情報量算出手段のサブバンドごと
の平均情報量算出動作を示すフローチャート図である。FIG. 19 is a flowchart showing an average information amount calculation operation for each subband by the information amount calculation means of the sixth embodiment.
【図20】実施例6の情報量コントロール手段における
区間割当情報量を算出する動作を示すフローチャート図
である。FIG. 20 is a flowchart showing the operation of calculating the section allocation information amount in the information amount control means of the sixth embodiment.
【図21】実施例6の各階層の帯域決定手段における割
当帯域決定動作を示すフローチャート図である。FIG. 21 is a flow chart showing the operation of determining the allocated bandwidth in the bandwidth determining means of each layer of the sixth embodiment.
【図22】実施例6のビットアロケーション回路におけ
るビット割当動作を示すフローチャート図である。FIG. 22 is a flowchart showing the bit allocation operation in the bit allocation circuit of the sixth embodiment.
【図23】実施例6の瞬時情報量決定手段における可聴
成分の存在する最大の帯域SBmaxと情報量の関係を
示す図である。FIG. 23 is a diagram showing the relationship between the maximum band SBmax in which an audible component exists and the information amount in the instantaneous information amount determination means of the sixth embodiment.
【図24】実施例6の瞬時情報量決定手段における可聴
成分の存在する最大の帯域SBmaxと情報量の関係を
示す図である。FIG. 24 is a diagram showing the relationship between the maximum band SBmax in which an audible component exists and the information amount in the instantaneous information amount determining means of the sixth embodiment.
【図25】実施例6の瞬時情報量決定手段における可聴
成分の存在する最大の帯域SBmaxと情報量の関係を
示す図である。FIG. 25 is a diagram showing the relationship between the maximum band SBmax in which an audible component exists and the amount of information in the instantaneous information amount determination means of the sixth embodiment.
【図26】本発明の実施例7による半導体メモリオーデ
ィオ記録再生装置の階層符号化器の構成を示した図であ
る。FIG. 26 is a diagram showing the structure of a hierarchical encoder of a semiconductor memory audio recording / reproducing apparatus according to Example 7 of the present invention.
【図27】実施例7の階層符号化器の情報量コントロー
ル回路の構成を示す図である。[Fig. 27] Fig. 27 is a diagram illustrating the configuration of an information amount control circuit of a hierarchical encoder according to a seventh embodiment.
【図28】この発明の実施例8による半導体メモリオー
ディオ記録再生装置のブロック回路図である。FIG. 28 is a block circuit diagram of a semiconductor memory audio recording / reproducing apparatus according to Embodiment 8 of the present invention.
【図29】実施例8の符号化器のビット割当回路の構成
を示す図である。FIG. 29 is a diagram showing the configuration of a bit allocation circuit of the encoder according to the eighth embodiment.
【図30】実施例8のフレーム長可変符号化方式による
符号化フレームのフォーマットを示す図である。FIG. 30 is a diagram showing a format of a coded frame according to the variable frame length coding method of the eighth embodiment.
【図31】実施例8の符号化器のビット割当回路でのマ
スキング効果と最小可聴限を用いた許容ノイズレベルの
算出の様子を示した図である。FIG. 31 is a diagram showing a manner of calculating an allowable noise level using the masking effect and the minimum audible limit in the bit allocation circuit of the encoder of the eighth embodiment.
【図32】実施例8の符号化器のビット割当回路での各
帯域の許容ノイズレベルとエネルギの様子を示した図で
ある。FIG. 32 is a diagram showing the permissible noise level and energy of each band in the bit allocation circuit of the encoder of the eighth embodiment.
【図33】実施例8による高速再生を説明するためのメ
モリマップである。FIG. 33 is a memory map for explaining high speed reproduction according to the eighth embodiment.
【図34】この発明の実施例9による半導体メモリオー
ディオ記録再生装置のブロック回路図である。FIG. 34 is a block circuit diagram of a semiconductor memory audio recording / reproducing apparatus according to Embodiment 9 of the present invention.
3 A/D変換器
4 階層符号化器
5 半導体メモリ
6 メモリアドレス制御器
7 階層復号化器
8 D/A変換器
11 階層レベル識別コード発生器
12 階層レベル識別コード再生器
13 メモリ容量検出器
15 サブバンド分割フイルタ
16 ビット割当器
17 第1の半導体メモリ
18 第2の半導体メモリ
19 階層レベル変換器
20 第1のメモリアドレス制御器
21 第2のメモリアドレス制御器
22 階層符号化器
23 メモリアドレス制御器
24 階層復号化器
25 階層レベル識別コード発生器
26 階層レベル識別コード再生器
27 分割フィルタ
28 MDCT
29 ブロックサイズ設定器
30 グルーピング器
31 階層化/量子化器
32 ダイナミックビット配分器
33 スケールファクタ算出器
34 フォーマッティング器
35 アドレス切換器
36 書き込みアドレス発生器
37 読み出しアドレス発生器
38 階層レベル判定器
39 クロック分周器
40 再生スピード設定器
41 サブバンドn分割フィルタ
42 可聴成分抽出手段
43 各フレームのサブバンドごとの情報量算出手段
44 各フレームの情報量算出手段
45 符号化レートに基づくフレームあたりの情報量設
定器
46 情報量コントロール回路
47 各階層の帯域決定手段
51 各サブバンドごとの平均情報量算出手段
52 各フレームの瞬時情報量算出手段
53 情報量コントロール回路
54 各階層の帯域決定手段
55 サブバンド毎の情報量平滑化フィルタ
56 割当情報量平滑化フィルタ
57 情報量比較器
58 差分情報量平滑化フィルタ
59 符号化比率変換器
62 符号化器
65 ビット割当回路
67 量子化回路
70 フレーム長算出回路
71 書き込みアドレス制御回路
73 ビット割当情報バッファおよびフレーム長算出回
路
74 読みだしアドレス制御回路
77 復号化器
78 帯域分割エネルギ算出回路
79 許容ノイズレベル算出回路
80 割当ビット算出回路
81 再生フレーム選択回路
82 再生フレーム選択情報およびビット割当情報
83 再生フレーム選択情報および量子化データの符号
長3 A / D converter 4 Hierarchical encoder 5 Semiconductor memory 6 Memory address controller 7 Hierarchical decoder 8 D / A converter 11 Hierarchical level identification code generator 12 Hierarchical level identification code regenerator 13 Memory capacity detector 15 Sub-band division filter 16 Bit allocator 17 First semiconductor memory 18 Second semiconductor memory 19 Hierarchical level converter 20 First memory address controller 21 Second memory address controller 22 Hierarchical encoder 23 Memory address control Device 24 Hierarchical decoder 25 Hierarchical level identification code generator 26 Hierarchical level identification code regenerator 27 Division filter 28 MDCT 29 Block size setting device 30 Grouping device 31 Hierarchization / quantization device 32 Dynamic bit allocation device 33 Scale factor calculator 34 Formatting device 35 Address switching device 36 Built-in address generator 37 Read address generator 38 Hierarchical level determiner 39 Clock frequency divider 40 Reproduction speed setter 41 Subband n division filter 42 Audible component extraction means 43 Information amount calculation means 44 for each subband of each frame Information amount calculating means for frame 45 Information amount setting device per frame based on coding rate 46 Information amount control circuit 47 Band determining means for each layer 51 Average information amount calculating means for each subband 52 Instantaneous information amount calculation for each frame Means 53 Information amount control circuit 54 Band determining means 55 for each layer Information amount smoothing filter 56 for each sub-band Allocation information amount smoothing filter 57 Information amount comparator 58 Difference information amount smoothing filter 59 Coding ratio converter 62 Code 65 bit allocation circuit 67 quantization circuit 70 frame length calculation times Path 71 Write address control circuit 73 Bit allocation information buffer and frame length calculation circuit 74 Read address control circuit 77 Decoder 78 Band division energy calculation circuit 79 Allowable noise level calculation circuit 80 Allocation bit calculation circuit 81 Reproduction frame selection circuit 82 Reproduction Frame selection information and bit allocation information 83 Reproduction frame selection information and code length of quantized data
───────────────────────────────────────────────────── フロントページの続き (31)優先権主張番号 特願平5−18050 (32)優先日 平成5年1月7日(1993.1.7) (33)優先権主張国 日本(JP) 前置審査 (56)参考文献 特開 昭64−53642(JP,A) 特開 平3−117181(JP,A) 特開 平3−117921(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/00 ─────────────────────────────────────────────────── ─── Continuation of the front page (31) Priority claim number Japanese Patent Application No. 5-18050 (32) Priority date January 7, 1993 (Jan. 1, 1993) (33) Priority claim country Japan (JP) Preliminary examination (56) References JP-A-64-53642 (JP, A) JP-A-3-117181 (JP, A) JP-A-3-117921 (JP, A) (58) Fields investigated (Int. Cl. 7 , DB name) G10L 19/00
Claims (6)
化して記録媒体に記録するオーディオ信号記録装置であ
って、オーディオ信号を複数の階層符号ブロックに分割
し、優先順位の低い階層符号ブロックが欠如しても優先
順位の高い階層符号ブロックのみでオーディオ信号が復
号できるように各階層符号ブロックに優先順位を持たせ
て符号化する階層符号化手段と、上記記録媒体の記憶容
量が所定量に達した場合に優先順位の低い階層符号ブロ
ックのオーディオ信号が書き込まれている記録エリアか
ら順次優先順位の高い階層符号ブロックのオーディオ信
号を上書きする制御手段と、上記記録媒体に記録される
オーディオ信号の階層レベルの識別信号を該記録媒体に
記録する識別信号記録手段とを備えたことを特徴とする
オーディオ信号記録装置。1. An audio signal recording apparatus for encoding an audio signal into a digital signal and recording it on a recording medium, wherein the audio signal is divided into a plurality of hierarchical code blocks, and a hierarchical code block with a low priority is lacking. In the case where the storage capacity of the recording medium reaches a predetermined amount, a hierarchical coding means for coding each hierarchical code block with priority so that an audio signal can be decoded only by a hierarchical code block having a high priority. Control means for sequentially overwriting the audio signals of the hierarchical code blocks of higher priority from the recording area in which the audio signals of the hierarchical code blocks of lower priority are sequentially written, and the hierarchical level of the audio signals recorded on the recording medium. An audio signal recording device, comprising: an identification signal recording means for recording an identification signal on the recording medium. apparatus.
し、この信号を最も優先順位の低い階層ブロックから順
に符号化する階層符号化手段により複数の階層ブロック
に分割し、記録媒体に記録したオーディオ信号を再生す
るオーディオ信号再生装置であって、上記記録媒体の読
み出し速度を可変できる可変速再生制御手段と、上記階
層化されたオーディオデータの階層レベルが低い信号の
みの復号では復号処理時間が短く、復号する階層レベル
が高くなるに従って復号処理時間が長くなる階層復号化
手段と、上記可変速再生制御手段の再生速度から上記階
層復号化手段に割り当てられる復号時間を求め、この時
間内に復号可能な階層レベルを判断して、上記階層復号
化手段に指示を出す復号階層レベル判定手段とを備えた
ことを特徴とするオーディオ信号再生装置。2. An audio signal recorded on a recording medium by dividing an audio signal into a digital signal and dividing the signal into a plurality of hierarchical blocks by hierarchical coding means for sequentially coding from the hierarchical block having the lowest priority. An audio signal reproducing device for reproducing, wherein a variable speed reproduction control means capable of varying a read speed of the recording medium and a decoding process time is short in decoding only a signal having a low hierarchical level of the hierarchical audio data. The hierarchical decoding means that the decoding processing time becomes longer as the hierarchical level becomes higher, and the decoding time assigned to the hierarchical decoding means is obtained from the reproduction speed of the variable speed reproduction control means, and the hierarchy that can be decoded within this time is obtained. A decoding hierarchy level determining means for determining a level and giving an instruction to the hierarchy decoding means. Audio signal playback device.
化して記録媒体に記録するオーディオ信号記録装置にお
いて、オーディオ信号を複数の階層ブロックに分割し、
各階層ブロックに優先順位を持たせ、最も優先順位の低
い階層ブロックから順に欠如していってもオーディオ品
質は劣化するものの、正常なオーディオ信号の復号が可
能な階層符号化手段を備え、その階層符号化手段におい
て入力したディジタルオーディオ信号を複数の周波数帯
域に分割するサブバンド分割手段、入力したディジタル
オーディオ信号を周波数領域に直交変換し聴覚特性に基
づいて可聴成分を抽出する可聴成分抽出手段、可聴成分
より各フレームごとにサブバンドごとの情報量を算出す
る第1の情報量算出手段、サブバンドごとの情報量の総
計により各フレームの情報量を算出する第2の情報量算
出手段、最終的な平均割当情報量が所望のビットレート
に近づくように割当帯域を決定するための割当情報量を
コントロールする制御手段、及びサブバンドごとの情報
量と割当情報量に基づき各階層に割り当てた帯域の情報
量の合計が各階層あたりの割当情報量に一致するように
低域側から各階層の割当帯域を決定する帯域決定手段を
有し、各フレームごとに割当帯域と割当情報量を可変と
することを特徴とするオーディオ信号記録装置。3. An audio signal recording apparatus for encoding an audio signal into a digital signal and recording it on a recording medium, wherein the audio signal is divided into a plurality of hierarchical blocks,
Each hierarchical block is given a priority, and even if the hierarchical blocks having the lowest priority are lacking in order, the audio quality is deteriorated, but a hierarchical coding unit capable of decoding a normal audio signal is provided, and the hierarchical block is provided. Subband dividing means for dividing the input digital audio signal into a plurality of frequency bands in the encoding means, audible component extracting means for orthogonally converting the input digital audio signal into the frequency domain, and extracting audible components based on auditory characteristics, audible A first information amount calculating means for calculating the information amount for each sub-band for each frame from the component, a second information amount calculating means for calculating the information amount for each frame by the total information amount for each sub-band, and finally Controls the amount of allocation information for determining the allocated bandwidth so that the average allocation information amount approaches the desired bit rate. The allocated bandwidth of each layer from the low frequency side so that the total amount of information of the bandwidth allocated to each layer based on the control means and the amount of information for each subband and the amount of allocated information matches the amount of allocated information for each layer. An audio signal recording apparatus having a band determining unit for determining, and varying an allocation band and an allocation information amount for each frame.
分割し、各階層ブロックに優先順位を持たせて、最も優
先順位の低い階層ブロックから順に欠如していってもオ
ーディオ品質は劣化するものの、正常なオーディオ信号
の復号が可能な階層符号化手段を備えたオーディオ信号
記録装置において、入力したディジタルオーディオ信号
を複数の周波数帯域に分割するサブバンド分割手段、入
力したディジタルオーディオ信号を周波数領域に直交変
換し聴覚特性に基づいて可聴成分を抽出する可聴成分抽
出手段、各フレームごとに可聴成分を用いて瞬時情報量
を算出する瞬時情報量算出手段、割当帯域を一定とする
数フレームを1サイクルとし、1サイクルの可聴成分の
平均値からサブバンドごとの平均情報量を算出する平均
情報量算出手段、最終的な平均割当情報量が所望のビッ
トレートに近づくように各フレームの瞬時情報量に対
し、1サイクルの区間割当情報量を平均割当情報量に従
って増減させるようコントロールする制御手段、及びサ
ブバンドごとの平均情報量と区間割当情報量に基づき各
階層に割り当てた帯域の情報量の合計が各階層あたりの
区間割当情報量に一致するように低域側から1サイクル
間の各階層の割当帯域を決定する帯域決定手段を有し、
1サイクルごとに得られる各階層の割当帯域に対し、各
フレームごとに各割当帯域内の可聴成分に対し、その大
きさに従って再ビット割当を行うことにより、1サイク
ルごとに割当帯域を1フレームごとに割当情報量を可変
とすることを特徴とするオーディオ信号記録装置。4. An audio signal is divided into a plurality of hierarchical blocks, each hierarchical block is given a priority order, and even if the hierarchical blocks are lacking in order from the lowest priority block, the audio quality is deteriorated, but is normal. In an audio signal recording device equipped with a hierarchical encoding means capable of decoding various audio signals, a subband dividing means for dividing an input digital audio signal into a plurality of frequency bands, and an orthogonal transformation of the input digital audio signal into a frequency domain Then, an audible component extracting means for extracting an audible component based on the auditory characteristics, an instantaneous information amount calculating means for calculating an instantaneous information amount by using the audible component for each frame, and several frames having a fixed allocation band as one cycle, An average information amount calculating means for calculating the average information amount for each subband from the average value of the audible components in one cycle, Control means for controlling to increase or decrease the section allocation information amount for one cycle according to the average allocation information amount with respect to the instantaneous information amount of each frame so that the final average allocation information amount approaches the desired bit rate, and for each subband Based on the average information amount and the section allocation information amount, the total band information amount allocated to each tier matches the section allocation information amount for each layer Has a band determining means for determining,
For the allocated bandwidth of each layer obtained for each cycle, re-bit allocation is performed for each audible component in each allocated bandwidth for each frame according to the size of the audible component, and the allocated bandwidth is determined for each frame for each frame. An audio signal recording device characterized in that the allocation information amount is variable.
分割し、各階層ブロックに優先順位を持たせて、最も優
先順位の低い階層ブロックから順に欠如していってもオ
ーディオ品質は劣化するものの、正常なオーディオ信号
の復号が可能な階層符号化手段を備えたオーディオ信号
記録装置において、入力したディジタルオーディオ信号
を複数の周波数帯域に分割するサブバンド分割手段、入
力したディジタルオーディオ信号を周波数領域に直交変
換し聴覚特性に基づいて可聴成分を抽出する可聴成分抽
出手段、可聴成分より各フレームごとにサブバンドごと
の情報量を算出する情報量算出手段、サブバンドごとの
情報量から各フレームごとに瞬時情報量を算出する瞬時
情報量算出手段、サブバンドごとの情報量の変化を平滑
化する第1の平滑化手段、最終的な平均割当情報量が所
望のビットレートに近づくように各フレームの瞬時情報
量に対し、瞬時割当情報量を平均割当情報量に従って増
減させるようにコントロールする制御手段、瞬時割当情
報量の変化を平滑化する第2の平滑化手段、及びサブバ
ンドごとの平滑化された情報量と平滑化された割当情報
量に基づき、各フレームごとに各階層に割り当てた帯域
の情報量の合計が各階層あたりの割当情報量に一致する
ように低域側から各階層の割当帯域を決定する帯域決定
手段を有し、各フレームごとに緩やかに変化する各階層
の割当帯域に対し、各フレームごとに各割当帯域内の可
聴成分に対し、その大きさに従って再ビット割当を行な
うことにより、各フレームで割当帯域を緩やかに変化さ
せ、その割当帯域内の割当情報量を可変とすることを特
徴とするオーディオ信号記録装置。5. An audio signal is divided into a plurality of hierarchical blocks, each hierarchical block is given a priority order, and even if the hierarchical blocks are lacking in order from the lowest priority block, the audio quality is deteriorated, but is normal. In an audio signal recording device equipped with a hierarchical encoding means capable of decoding various audio signals, a subband dividing means for dividing an input digital audio signal into a plurality of frequency bands, and an orthogonal transformation of the input digital audio signal into a frequency domain Audible component extraction means for extracting audible components based on auditory characteristics, information amount calculation means for calculating the amount of information for each subband for each frame from the audible components, instantaneous information for each frame from the amount of information for each subband Instantaneous information amount calculating means for calculating the amount, first smoothing for smoothing changes in the information amount for each subband Means, control means for controlling to increase or decrease the instantaneous allocation information amount according to the average allocation information amount with respect to the instantaneous information amount of each frame so that the final average allocation information amount approaches the desired bit rate, instantaneous allocation information amount Second smoothing means for smoothing the change of the, and the sum of the information amount of the band allocated to each layer for each frame based on the smoothed information amount for each subband and the smoothed allocation information amount. Has a band determining means for determining the allocated band of each layer from the low frequency side so that the same as the allocated information amount for each layer, and for each band of the layer that changes gently for each frame, For each audible component in each allocated band, re-bit allocation is performed according to its size, so that the allocated band is gradually changed in each frame, and the amount of allocated information in the allocated band can be changed. Audio signal recording apparatus characterized by a.
たりの情報量とビット割当情報量の差分を抽出する比較
手段、抽出した差分を平滑化する第3の平滑化手段、及
び上記第3の平滑化手段からの差分を符号化比率に変換
する変換手段を有し、所望のビットレートと割当情報の
差の累積値に従い緩やかに変化する符号化比率を、各フ
レームの情報量に乗算することによって割当情報量を制
御することにより可変長フレーム符号化における情報量
を平均的に所定のビットレートに制御することを特徴と
する請求項5記載のオーディオ信号記録装置。6. A comparing means for extracting a difference between an information amount per frame and a bit allocation information amount according to a desired bit rate, a third smoothing means for smoothing the extracted difference, and the third smoothing. By converting the difference from the encoding means into an encoding ratio, and multiplying the information amount of each frame by the encoding ratio that gradually changes according to the cumulative value of the difference between the desired bit rate and the allocation information. 6. The audio signal recording device according to claim 5, wherein the amount of information in variable length frame coding is controlled to a predetermined bit rate on average by controlling the amount of assigned information.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09313693A JP3371462B2 (en) | 1992-04-20 | 1993-04-20 | Audio signal recording / playback device |
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9964792 | 1992-04-20 | ||
JP4-198463 | 1992-07-24 | ||
JP4-198464 | 1992-07-24 | ||
JP19846492 | 1992-07-24 | ||
JP19846392 | 1992-07-24 | ||
JP4-99647 | 1993-01-07 | ||
JP1805093 | 1993-01-07 | ||
JP5-18050 | 1993-01-07 | ||
JP09313693A JP3371462B2 (en) | 1992-04-20 | 1993-04-20 | Audio signal recording / playback device |
Related Child Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9113024A Division JPH1070467A (en) | 1997-04-30 | 1997-04-30 | Audio signal coding/decoding device and audio signal reproducing device |
JP2000389453A Division JP2001175292A (en) | 1992-04-20 | 2000-12-21 | Audio signal encoding/decoding device |
JP2001125699A Division JP3481918B2 (en) | 1992-04-20 | 2001-04-24 | Audio signal encoding / decoding device |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH06259099A JPH06259099A (en) | 1994-09-16 |
JP3371462B2 true JP3371462B2 (en) | 2003-01-27 |
Family
ID=27519986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP09313693A Expired - Fee Related JP3371462B2 (en) | 1992-04-20 | 1993-04-20 | Audio signal recording / playback device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3371462B2 (en) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10233692A (en) * | 1997-01-16 | 1998-09-02 | Sony Corp | Audio signal coder, coding method, audio signal decoder and decoding method |
MY122474A (en) | 1998-02-17 | 2006-04-29 | Matsushita Electric Ind Co Ltd | Recording apparatus for performing hierarchical overwrite recording of video and/or audio data to a recording medium |
US6463177B1 (en) * | 1998-11-04 | 2002-10-08 | Sharp Laboratories Of America, Inc. | Dynamic management of embedded coded images in a digital storage device |
JP4822816B2 (en) * | 2005-11-14 | 2011-11-24 | キヤノン株式会社 | Audio signal encoding apparatus and method |
WO2006054583A1 (en) | 2004-11-18 | 2006-05-26 | Canon Kabushiki Kaisha | Audio signal encoding apparatus and method |
JP2008228327A (en) * | 2008-04-08 | 2008-09-25 | Canon Inc | Decoding method and apparatus |
EP2357649B1 (en) | 2010-01-21 | 2012-12-19 | Electronics and Telecommunications Research Institute | Method and apparatus for decoding audio signal |
-
1993
- 1993-04-20 JP JP09313693A patent/JP3371462B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH06259099A (en) | 1994-09-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3123286B2 (en) | Digital signal processing device or method, and recording medium | |
JP3173218B2 (en) | Compressed data recording method and apparatus, compressed data reproducing method, and recording medium | |
JP3123290B2 (en) | Compressed data recording device and method, compressed data reproducing method, recording medium | |
US5752221A (en) | Method of efficiently recording an audio signal in semiconductor memory | |
EP0966109A2 (en) | Audio coding method, audio coding apparatus, and data storage medium | |
JP2006011456A (en) | Method and device for coding/decoding low-bit rate and computer-readable medium | |
GB2260069A (en) | Compressed digital signal processing apparatus and method and storage medium | |
WO1995010886A1 (en) | Digital signal processor, digital signal processing method and data recording medium | |
JP3371462B2 (en) | Audio signal recording / playback device | |
JP2002533790A (en) | Adaptive bit allocator and audio encoder | |
JP3481918B2 (en) | Audio signal encoding / decoding device | |
US6463405B1 (en) | Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband | |
JP3466507B2 (en) | Audio coding method, audio coding device, and data recording medium | |
JPH1070467A (en) | Audio signal coding/decoding device and audio signal reproducing device | |
JP2001175292A (en) | Audio signal encoding/decoding device | |
JP3531178B2 (en) | Digital signal processing apparatus and method | |
JPH06289900A (en) | Audio encoding device | |
JPH1083623A (en) | Signal recording method, signal recorder, recording medium and signal processing method | |
JP3454394B2 (en) | Quasi-lossless audio encoding device | |
JP3334374B2 (en) | Digital signal compression method and apparatus | |
JP3175456B2 (en) | Digital signal processor | |
JP2002351500A (en) | Method of encoding digital data | |
JPH0793892A (en) | Semiconductor memory audio recording and reproducing device | |
JP4271588B2 (en) | Encoding method and encoding apparatus for digital data | |
JP3301886B2 (en) | Variable rate speech coding method and apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071122 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081122 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081122 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091122 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091122 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101122 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111122 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |