JP2000347697A - Voice record regenerating device and record medium - Google Patents

Voice record regenerating device and record medium

Info

Publication number
JP2000347697A
JP2000347697A JP11155536A JP15553699A JP2000347697A JP 2000347697 A JP2000347697 A JP 2000347697A JP 11155536 A JP11155536 A JP 11155536A JP 15553699 A JP15553699 A JP 15553699A JP 2000347697 A JP2000347697 A JP 2000347697A
Authority
JP
Japan
Prior art keywords
audio
data
level
recording
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11155536A
Other languages
Japanese (ja)
Inventor
Shigeru Ota
茂 太田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Columbia Co Ltd
Original Assignee
Nippon Columbia Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Columbia Co Ltd filed Critical Nippon Columbia Co Ltd
Priority to JP11155536A priority Critical patent/JP2000347697A/en
Publication of JP2000347697A publication Critical patent/JP2000347697A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

PROBLEM TO BE SOLVED: To easily detect stored voice level even if the voice data of a sub-band is not decoded by detecting a voice signal or the voice level of voice data, and adding data showing detected voice level to an assistant data part of a frame format. SOLUTION: An encode/decode part 110 performs compression process of input voice data, and converts into the signal of specified frame format. A system microcomputer 103 controls this operation, and controls voice data to be compression/expansion processed to be temporarily stored and read out. When the encode/decode part 110 compresses and converts a voice signal, the system microcomputer 103 adds the data of the voice level of the voice signal to the assistant data part of the specified frame format, and further at reading out the signal, the data of the voice level added to the assistant data part of the specified frame format is detected to change the gain of electronic volume 108 according to the height.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、音声圧縮データを
記録再生する音声記録再生装置及び記録媒体に関する。
The present invention relates to an audio recording / reproducing apparatus for recording / reproducing audio compressed data and a recording medium.

【0002】[0002]

【従来の技術】聴覚心理特性を利用し、聴覚の感度が低
い細部の情報量を省略することで情報量を削減する音声
圧縮方法の代表的なものにMPEG(Moving Picture Ex
pertsGroup)オーディオがある。MPEGオーディオに
はMPEG1、MPEG2、MPEG4の3種類の音声
圧縮処理方法が規格化され、さらに、MPEG1にはLa
yer1、Layer2、Layer3の3種類の音声圧縮のモードあ
る。
2. Description of the Related Art MPEG (Moving Picture Exclusive) is a typical audio compression method for reducing the amount of information by using the psychoacoustic characteristics and omitting the amount of information with low sensitivity to hearing.
pertsGroup) There is audio. Three types of audio compression processing methods, MPEG1, MPEG2 and MPEG4, have been standardized for MPEG audio.
There are three types of audio compression modes: yer1, Layer2, and Layer3.

【0003】MPEG1オーディオのLayer1の音声圧縮
処理方法は、384サンプルの音声データを一つの処理
単位として、入力する音声信号を異なる周波数帯域の3
2のサブバンド(以下、SBという。)に分割して量子
化し、各サブバンドのサンプルデータの波形の最大振幅
が略1.0となるように正規化したときの比率であるス
ケールファクター(scale factor。以下、SFとい
う。)と各SBに適正にビットを割り当てるビットアロ
ケーションを用いて音声圧縮するものである。
The MPEG1 audio layer 1 audio compression processing method uses 384 samples of audio data as one processing unit to convert an input audio signal into three different frequency bands.
2 sub-bands (hereinafter referred to as SBs), quantized, and normalized by a factor such that the maximum amplitude of the sample data waveform of each sub-band is approximately 1.0. (hereinafter, referred to as SF) and bit allocation that appropriately allocates bits to each SB.

【0004】MPEG1オーディオのLayer2は、Layer1
の音声圧縮の処理に加え、384×3サンプルの音声デ
ータを一つの処理単位とし、複数のデータ転送速度に対
して各データ転送速度毎に準備された圧縮処理用のテー
ブルを用いてビット割り当てを行い高品質・高効率に音
声符号化を行う音声圧縮方法である。
[0004] Layer 2 of MPEG1 audio is layer 1
In addition to the audio compression processing described above, audio data of 384 × 3 samples are used as one processing unit, and bit allocation is performed using a compression processing table prepared for each data transfer rate for a plurality of data transfer rates. This is a voice compression method that performs voice coding with high quality and high efficiency.

【0005】MPEG2オーディオのLayer2は、基本的
にMPEG1のステレオをマルチチャンネルに拡張した
もの、或いはサンプリング周波数を1/2にして遅い速
度でデータ伝送を行えるようにしたものであるが、音声
圧縮の方法はMPEG1と同じ技術が用いられている。
したがって、MPEG2についての説明は省略する。
[0005] Layer 2 of MPEG2 audio is basically an extension of the stereo of MPEG1 to multi-channels, or a structure in which the sampling frequency is reduced to 1/2 so that data can be transmitted at a low speed. The method uses the same technology as MPEG1.
Therefore, description of MPEG2 is omitted.

【0006】MPEG1オーディオのLayer3は、Layer2
の音声圧縮方法の処理に、エリアシングを起こしにくい
周波数分割方法である変形離散コサイン変換と圧縮処理
の過程で出てくるパラメータの出現確率に偏りがあるこ
とに着目した符号長を可変とするエントロピー(ハフマ
ン)符号化等の処理を用いることにより、更に高効率の
符号化を行う音声圧縮方法である。MPEGオーディオ
の概要は最新MPEG教科書(1994年8月初版、
(株)アスキー出版、変形離散コサイン変換はP.176、エ
ントロピー符号化はP.17)に記載されている。
[0006] Layer 3 of MPEG1 audio is Layer 2
In the processing of the audio compression method, the variable discrete cosine transform, which is a frequency division method that is unlikely to cause aliasing, and the entropy that makes the code length variable, focusing on the bias in the appearance probabilities of parameters appearing in the process of compression processing (Huffman) This is a speech compression method that performs encoding with higher efficiency by using processing such as encoding. An overview of MPEG audio is available in the latest MPEG textbook (first published in August 1994,
ASCII Modified Discrete Cosine Transform is described on page 176, and entropy coding is described on page 17).

【0007】上述した圧縮データを再生するとき、記録
されている音声データの音声レベルの大きさに合わせて
出力レベルの大きさを自動的に変化させるようにした音
声記録再生装置がある。この場合、圧縮した音声データ
を伸張する処理を行ったのち、その音声レベルを検出す
るという手段を用いる。
There is an audio recording / reproducing apparatus which automatically changes the output level in accordance with the audio level of recorded audio data when reproducing the above-mentioned compressed data. In this case, a means for performing processing for expanding compressed audio data and then detecting the audio level is used.

【0008】[0008]

【発明が解決しようとする課題】しかしながら、音声レ
ベルを検知するために音声データの再生を行うための復
号処理を行う必要があり、音声レベルを検知するまでに
複雑な処理を要することになる。本発明の目的は、SB
の音声データを復号しなくても、記録されている音声レ
ベルを容易に検出することができる音声記録再生装置及
び記録媒体を得ることである。
However, it is necessary to perform a decoding process for reproducing the audio data in order to detect the audio level, and a complicated process is required until the audio level is detected. The object of the present invention is
It is an object of the present invention to provide an audio recording / reproducing apparatus and a recording medium capable of easily detecting a recorded audio level without decoding the audio data.

【0009】[0009]

【課題を解決するための手段】本発明は、音声信号を圧
縮伸張して記録再生する音声記録再生装置において、音
声信号を異なる音声周波数帯域のサブバンドに分割し、
量子化して音声データとする帯域分割手段と、マスキン
グ閾値を算出するマスキング閾値算出手段と、前記音声
データのレベルと前記マスキング閾値とを比較するレベ
ル比較手段と、前記レベル比較手段の比較結果に基づい
て前記サブバンドにビットを割り当てるビットアロケー
ション手段と、前記ビットアロケーション手段が前記サ
ブバンドに割り当てたビット数の音声データを再量子化
する再量子化手段と、音声信号または音声データの音声
レベルを検出する音声レベル検出手段と、前記音声レベ
ル検出手段が検出した音声レベルを示すデータをフレー
ムフォーマットの補助データ部に付加するよう信号変換
する信号変換手段と、前記フレームフォーマットの信号
の再生に際し、前記音声レベルを示すデータにもとづき
音声レベル制御部の利得を制御する制御手段を備える音
声記録再生装置である。
According to the present invention, there is provided an audio recording / reproducing apparatus for recording / reproducing an audio signal by compressing / expanding the audio signal, wherein the audio signal is divided into sub-bands of different audio frequency bands,
Band dividing means for quantizing to audio data, masking threshold calculating means for calculating a masking threshold, level comparing means for comparing the level of the audio data with the masking threshold, and a comparison result of the level comparing means Bit allocation means for allocating bits to the sub-bands, re-quantization means for re-quantizing voice data of the number of bits allocated to the sub-bands by the bit allocation means, and detecting a voice level of a voice signal or voice data. Audio level detecting means for converting the audio level detected by the audio level detecting means into a supplementary data portion of a frame format. Audio level control unit based on data indicating the level An audio recording and reproducing apparatus comprises control means for controlling the gain.

【0010】また、本発明は、音声信号を圧縮伸張して
記録再生する音声記録再生装置において、前記ビットア
ロケーション手段は、前記サブバンドのサンプルデータ
のスケールファクターを演算し、前記音声レベル検出部
は、前記スケールファクターの最大値を検出し、前記制
御手段は、前記スケールファクターの最大値を前記補助
データ部に付加する音声記録再生装置である。
The present invention also relates to an audio recording / reproducing apparatus for recording / reproducing an audio signal by compressing / expanding the audio signal, wherein the bit allocation means calculates a scale factor of the sample data of the sub-band, and the audio level detecting section comprises: An audio recording / reproducing apparatus for detecting a maximum value of the scale factor and adding the maximum value of the scale factor to the auxiliary data section.

【0011】また、本発明は、音声信号を圧縮伸張して
記録再生する音声記録再生装置において、前記音声レベ
ル検出部は、前記音声記録再生装置に入力する音声信号
または音声データの音声レベルを検出し、前記制御手段
は、前記声レベルを前記補助データ部に付加する音声記
録再生装置である。
The present invention also relates to an audio recording and reproducing apparatus for recording and reproducing an audio signal by compressing and expanding the audio signal, wherein the audio level detecting section detects an audio level of an audio signal or audio data input to the audio recording and reproducing apparatus. The control means is a voice recording / reproducing apparatus for adding the voice level to the auxiliary data section.

【0012】また、本発明は、スケールファクターのデ
ータと音声信号または音声データを圧縮したオーディオ
データを配置したフレームフォーマットの信号を記録す
る記録媒体において、前記フレームフォーマットの補助
データ部に前記スケールファクターの最大値または前記
スケールファクターの平均値を配置して記録した記録媒
体である。
The present invention also relates to a recording medium for recording a signal in a frame format in which data of a scale factor and an audio signal or audio data obtained by compressing audio data are recorded. This is a recording medium in which a maximum value or an average value of the scale factors is arranged and recorded.

【0013】[0013]

【発明の実施の形態】BEST MODE FOR CARRYING OUT THE INVENTION

【発明の実施の形態】本発明の実施例の音声記録再生装
置について説明する。図1は本発明の一実施例の音声再
生装置の構成を示すブロック図である。
DESCRIPTION OF THE PREFERRED EMBODIMENTS An audio recording / reproducing apparatus according to an embodiment of the present invention will be described. FIG. 1 is a block diagram showing a configuration of an audio reproducing apparatus according to one embodiment of the present invention.

【0014】記録媒体101は、音声圧縮した音声デー
タをMPEGオーディオ規格のフレームフォーマットの
信号で記録する記録媒体である。本実施例では記録媒体
として、ICメモリを使用する。
The recording medium 101 is a recording medium for recording audio data that has been subjected to audio compression in the form of a signal in the frame format of the MPEG audio standard. In this embodiment, an IC memory is used as a recording medium.

【0015】インターフェース部102は、記録媒体1
01から読み取った音声データをエンコード/デコード
部110に転送し、エンコード/デコード部110で伸
張した音声データを音声再生回路部112に転送する。
また、外部から入力されるディジタルオーディオデータ
をエンコード/デコード部110に転送し音声圧縮し、
エンコード/デコード部110で所定のフレームフォー
マットの信号に変換し記録媒体101に記録する。
The interface unit 102 includes the recording medium 1
Then, the audio data read from “01” is transferred to the encoding / decoding unit 110, and the audio data expanded by the encoding / decoding unit 110 is transferred to the audio reproduction circuit unit 112.
Further, the digital audio data input from the outside is transferred to the encoding / decoding unit 110, and the audio is compressed.
The signal is converted into a signal of a predetermined frame format by the encoding / decoding unit 110 and recorded on the recording medium 101.

【0016】音声再生回路部112は、デジタルフィル
ター(D/F、Digital Filter)106、デジタルアナ
ログ変換器(D/A、Digital Analog Converter)10
7、電子ボリューム108及びバッファ回路109を備
える。
The audio reproducing circuit unit 112 includes a digital filter (D / F, Digital Filter) 106 and a digital / analog converter (D / A, Digital Analog Converter) 10.
7, an electronic volume 108 and a buffer circuit 109 are provided.

【0017】エンコード/デコード部110は、インタ
ーフェース部102から入力される入力音声データを後
述するMPEG1の圧縮処理を行い、所定のフレームフ
ォーマットの信号に変換する。また、所定のフレームフ
ォーマットの信号に変換された圧縮音声データを伸張処
理する。
The encoding / decoding unit 110 performs compression processing of MPEG1 described later on the input audio data input from the interface unit 102, and converts it into a signal of a predetermined frame format. In addition, the compressed audio data converted into a signal of a predetermined frame format is expanded.

【0018】システムマイコン103は、エンコード/
デコード部110の動作を制御するとともに、圧縮伸張
処理をする音声データをメモリ111に一時的に記憶及
び読み出す等の制御を行う。また、システムマイコン1
03は、エンコード/デコード部110が音声信号を圧
縮して所定のフレームフォーマットの信号に変換する際
に、音声信号の音声レベルのデータを所定のフレームフ
ォーマットの補助データ部に付加し、さらに所定のフレ
ームフォーマットの信号を読み出すときに補助データ部
に付加した音声レベルのデータを検出してその大きさに
基づいて電子ボリューム108の利得を変化させる制御
を行う。また、システムマイコン103は、操作部10
4から送信される信号を受信して音声記録再生装置の動
作を制御し、表示部105へ表示する表示データを送信
する等の音声記録再生装置全体の動作の制御を行う。
The system microcomputer 103 performs encoding /
In addition to controlling the operation of the decoding unit 110, it also performs control such as temporarily storing and reading audio data for compression / expansion processing in the memory 111. Also, the system microcomputer 1
03, when the encode / decode unit 110 compresses the audio signal and converts it into a signal of a predetermined frame format, the data of the audio level of the audio signal is added to the auxiliary data part of the predetermined frame format, When reading out the signal of the frame format, the data of the audio level added to the auxiliary data portion is detected, and the control of changing the gain of the electronic volume 108 based on the magnitude is performed. Further, the system microcomputer 103 includes the operation unit 10
4 to control the operation of the audio recording / reproducing apparatus, and control the operation of the entire audio recording / reproducing apparatus, such as transmitting display data to be displayed on the display unit 105.

【0019】操作部104は、音声記録再生装置の録音
再生の開始及び停止等を指示する指示釦を備える。表示
部105は、操作部104の操作状態または記録再生し
ている音声のレベル等を表示する。
The operation unit 104 has an instruction button for instructing start and stop of recording and reproduction of the audio recording and reproducing apparatus. The display unit 105 displays the operation state of the operation unit 104, the level of the sound being recorded and reproduced, and the like.

【0020】図2は、本発明の第1の実施例である音声
記録再生装置のエンコード/デコード部の構成を説明す
る図である。
FIG. 2 is a diagram for explaining the configuration of the encoding / decoding section of the audio recording / reproducing apparatus according to the first embodiment of the present invention.

【0021】帯域分割部201は、複数のフィルタを用
いて音声周波数帯域を複数の周波数帯域に帯域分割する
フィルタバンクを備え、入力音声データを量子化する信
号処理回路である。入力音声データは32の異なるSB
に分割されて量子化される。
The band dividing unit 201 is a signal processing circuit that includes a filter bank for dividing a voice frequency band into a plurality of frequency bands using a plurality of filters, and quantizes input voice data. Input audio data consists of 32 different SBs
And quantized.

【0022】マスキング閾値算出部202は、高速フー
リエ変換(FFT、Fast Fourier Transform)処理によ
り各SBのパワーレベルを算出し、聴覚心理特性を利用
しマスキングの閾値を求める。マスキングとは、例え
ば、静寂な環境ではせせらぎの音を聞き取れるが、嵐の
中では聞き取れないことが有るというように二つの音が
同時に発生している場合、小さい方の音が大きい方の音
によって聞こえなくなる状態をいう。また、マスキング
閾値とは、あるSBにおける音声信号が隣接する音声に
よってマスキングされる最大音声レベルである。
The masking threshold calculation unit 202 calculates the power level of each SB by fast Fourier transform (FFT, Fast Fourier Transform) processing, and obtains a masking threshold using psychoacoustic characteristics. Masking means, for example, that in a quiet environment, the sound of a babbling can be heard, but in a storm it may not be heard. A state in which you cannot hear. The masking threshold is a maximum audio level at which an audio signal in a certain SB is masked by adjacent audio.

【0023】ビットアロケーション/スケールファクタ
演算部203は、マスキング閾値算出部202から出力
されるマスキング閾値と各SBの音声データのレベルか
ら判断して各SBに適正なビット数の配分を行う。再量
子化部204は、各SBに適正なビット数の配分を行っ
た後、配分されたビット数で音声データの再量子化を行
い圧縮した音声データを出力する。また、ビットアロケ
ーション/スケールファクタ演算部203は、SB内の
サンプルデータの波形を最大振幅が略1.0となるよう
に正規化したときのサンプルデータの波形の最大振幅値
と再量子化し圧縮した音声データが表す音声レベルの最
大振幅値との比率(圧縮データの倍率)を示すスケール
ファクタ(SF、scale factor)を演算して出力する。
音声データは、再量子化されたデータと演算したSFの
データによって正確な音声信号として表わせられる。
The bit allocation / scale factor calculation unit 203 determines the masking threshold value output from the masking threshold value calculation unit 202 and the level of the audio data of each SB, and allocates an appropriate number of bits to each SB. After allocating an appropriate number of bits to each SB, the requantization unit 204 re-quantizes the audio data with the allocated number of bits and outputs compressed audio data. Further, the bit allocation / scale factor calculation unit 203 requantizes and compresses the waveform of the sample data in the SB to the maximum amplitude value of the sample data when the waveform is normalized so that the maximum amplitude becomes approximately 1.0. A scale factor (SF) indicating the ratio of the audio level represented by the audio data to the maximum amplitude value (magnification of the compressed data) is calculated and output.
The audio data is represented as an accurate audio signal by the requantized data and the calculated SF data.

【0024】フォーマティング部205は、同期信号、
MPEGオーディオの各種モードの識別子を含んだヘッ
ダ情報、ビットアロケーション/スケールファクタ演算
部203で確定した各SBに割り当てられたビット数、
SF及び再量子化部104で再量子化した音声データを
MPEG1オーディオ規格のフレームフォーマットの信
号に変換して出力する。
The formatting unit 205 includes a synchronization signal,
Header information including identifiers of various modes of MPEG audio, the number of bits allocated to each SB determined by the bit allocation / scale factor calculation unit 203,
The audio data re-quantized by the SF and re-quantization unit 104 is converted into a signal of a frame format of the MPEG1 audio standard and output.

【0025】レベル比較部206は、各SBに割り当て
られたビット数で音声データを再量子化したときに生じ
る量子化ノイズのレベルとマスキング閾値とを比較し、
さらに、各SBにおける信号レベルとマスキング閾値の
レベルの差を予め決められている基準値と比較する。比
較した結果はビットアロケーション/スケールファクタ
演算部203に送られ、ビットアロケーション/スケー
ルファクタ演算部203は、比較した結果に基づいて各
SBに割り当てるビット数を決める。
The level comparing section 206 compares the level of quantization noise generated when the audio data is requantized with the number of bits allocated to each SB with a masking threshold,
Further, the difference between the signal level in each SB and the level of the masking threshold is compared with a predetermined reference value. The comparison result is sent to the bit allocation / scale factor calculation unit 203, and the bit allocation / scale factor calculation unit 203 determines the number of bits to be allocated to each SB based on the comparison result.

【0026】インターフェース部102から入力される
入力音声データは、帯域分割部201に入力されて32
に分割されたSB毎の音声データに変換される。また同
時に、インターフェース部102から入力される入力音
声データは、マスキング閾値算出部202に入力されF
FT(Fast Fourier Transform)処理されて、各SB毎に
パワーレベルが算出される。各SB毎のパワーレベルが
算出されることにより、マスキング閾値算出部202は
マスキング効果による各SBのマスキング閾値を出力す
る。
The input audio data input from the interface unit 102 is input to the
Is converted into audio data for each SB divided into. At the same time, the input voice data input from the interface unit 102 is input to the
FT (Fast Fourier Transform) processing is performed, and a power level is calculated for each SB. By calculating the power level for each SB, the masking threshold calculation unit 202 outputs a masking threshold of each SB due to the masking effect.

【0027】ビットアロケーション/スケールファクタ
演算部203において、マスキング閾値は帯域分割部2
01の出力である各SB内の音声データの信号レベルと
比較され、予め決められた割り当て可能なビット総数に
収まるように各SBに割り当てるビット数が決定され
る。ビット数を各SBに割り当てる処理手順は、はじめ
に32のSBの中からダイナミックレンジの最も大きい
SBを選択する。各SBをスキャンして量子化ノイズ対
マスキング閾値比(NMR)の最も大きいSBを選択
し、そのSBにビット数の一部を割り当てる。SBに割
り当てられたビット数により量子化ノイズが変化してN
MRが変化するので、再度NMRを計算した後に引き続
きSBをスキャンしNMRの最も大きいSBを選択し、
そのSBにビット数の一部を割り当てて再度NMRを計
算するという処理を繰り返し続けて割り当て可能なビッ
ト数が全て割り当てられるまで繰り返し行う。その後、
各SB毎に割り当てられたビット数にしたがって、再量
子化部204で各SBに割り当てられた音声データを再
量子化し圧縮した音声データとする。
In the bit allocation / scale factor calculation unit 203, the masking threshold is
01 is compared with the signal level of the audio data in each SB, which is the output of 01, and the number of bits to be assigned to each SB is determined so as to be within a predetermined total number of assignable bits. In the processing procedure for assigning the number of bits to each SB, first, the SB having the largest dynamic range is selected from the 32 SBs. Each SB is scanned to select the SB having the largest quantization noise to masking threshold ratio (NMR), and a portion of the number of bits is assigned to the SB. The quantization noise changes according to the number of bits allocated to the SB and N
Since the MR changes, the SB is scanned again after calculating the NMR again, and the SB having the largest NMR is selected.
The process of allocating a part of the number of bits to the SB and calculating the NMR again is repeated until the allocatable bits are all allocated. afterwards,
According to the number of bits assigned to each SB, the requantization unit 204 re-quantizes and compresses the audio data assigned to each SB into audio data.

【0028】フォーマッティング部205でMPEG1
オーディオ規格で決められたフレームフォーマットの信
号となるようにスケールファクタ(SF)や音声データ
等のデータを配置して出力する。
In the formatting unit 205, MPEG1
Data such as a scale factor (SF) and audio data are arranged and output so as to be a signal of a frame format determined by an audio standard.

【0029】図4は、音声を圧縮伸張して記録再生する
音声記録再生装置において、入力音声データが異なるS
Bに分割されてビットが割り当てられた音声データを説
明する図である。
FIG. 4 shows an audio recording / reproducing apparatus for recording / reproducing a voice by compressing / expanding the voice, and in which the input voice data is different.
FIG. 9 is a diagram illustrating audio data divided into B and assigned bits.

【0030】図4(a)の縦軸は、各SBにおける入力
音声データの音声レベルと聴覚心理特性を利用して得ら
れたマスキングの閾値(斜線部)のレベルを示す。また
横軸は、各SBの番号を示しており、SB0側が低い周
波数でSB31側が高い周波数である。図4(a)は、
入力音声データの音声レベルがマスキング閾値より大き
いほどダイナミックレンジが大きく、多くのビット数を
必要とすることを示している。
The vertical axis of FIG. 4 (a) shows the level of the masking threshold (hatched portion) obtained by using the audio level of the input audio data and the psychoacoustic characteristics in each SB. The horizontal axis indicates the number of each SB, with the SB0 side having a low frequency and the SB31 side having a high frequency. FIG. 4 (a)
The dynamic range is larger as the audio level of the input audio data is larger than the masking threshold, indicating that more bits are required.

【0031】図4(b)は、ビットアロケーション/ス
ケールファクタ演算部103によって各SB内に割り当
てられたビット数で音声データを再量子化したときの状
態を示す図である。縦軸は、各SBに割り当てられる音
声データのビット数であり、再量子化部204で各SB
の音声データを再量子化するときの量子化ビット数とな
る。横軸はSBの番号を示し、SB0側が低い周波数で
SB31側が高い周波数である。図4(a)、(b)で
示すように入力音声データの音声レベルがマスキング閾
値より大きいSBほどビット数が多く割り当てられる。
FIG. 4B is a diagram showing a state when the audio data is requantized by the bit number allocated in each SB by the bit allocation / scale factor calculation unit 103. The vertical axis represents the number of bits of audio data allocated to each SB.
Is the number of quantization bits when re-quantizing the audio data. The horizontal axis indicates the SB number, with the SB0 side being a low frequency and the SB31 side being a high frequency. As shown in FIGS. 4A and 4B, as the SB of the input audio data whose audio level is higher than the masking threshold, the number of bits is allocated more.

【0032】SB26、SB29についてはマスキング
閾値より音声レベルが低いので、ビットが割り当てられ
ていない。また、SB27はマスキング閾値より音声レ
ベルが高いが、音声レベルがマスキング閾値より大きい
SBに優先的にビットを割り当てるアルゴリズムのた
め、ビットが割り当てられていない。
No bits are assigned to SB26 and SB29 because the audio level is lower than the masking threshold. Further, although the sound level of the SB 27 is higher than the masking threshold, no bit is allocated to the SB 27 because the algorithm preferentially allocates bits to SBs whose voice level is higher than the masking threshold.

【0033】次に、MPEG1オーディオ規格のフレー
ムフォーマットについて説明する。図5は、本実施例の
音声記録再生装置に使用するMPEG1オーディオのフ
レームフォーマットにおける各種データの配置を説明す
る模式図である。
Next, the frame format of the MPEG1 audio standard will be described. FIG. 5 is a schematic diagram illustrating the arrangement of various data in the MPEG1 audio frame format used in the audio recording / reproducing apparatus of the present embodiment.

【0034】ヘッダー(header) 部には、フレームの開
始を示す同期信号(sync word:1111 1111 1111)が配置
される。エラーチェック(error check) 部には、エラー
検出情報が配置される。オーディオデータ(audio data)
部には、オーディオサンプルのデータとして、32のS
Bの音声データを符号化する順番を表すアロケーション
(allocation)のデータ、SB内のサンプルデータの波形
を最大振幅が略1.0となるように正規化したときの比
率(圧縮データの倍率)を表すスケールファクタ(scale
factor)のデータ、及び音声データを分割したオーディ
オサンプルデータ(圧縮データ)が配置される。マルチ
チャンネル拡張(mc extension)部は、MPEG1をM
PEG2マルチチャンネルとするための拡張部分であ
る。補助データ (ancillary data) 部は、補助データと
して使用される部分である。
A synchronization signal (sync word: 1111 1111 1111) indicating the start of a frame is arranged in the header section. Error detection information is arranged in an error check section. Audio data
In the section, 32 S
Allocation indicating the order of encoding the audio data of B
(allocation) data, the scale factor (scale of the compressed data) representing the ratio when the waveform of the sample data in the SB is normalized so that the maximum amplitude becomes approximately 1.0.
factor) and audio sample data (compressed data) obtained by dividing the audio data. The multi-channel extension (mc extension) unit converts MPEG1 to M
This is an extension part for making a PEG2 multi-channel. The ancillary data part is the part used as auxiliary data.

【0035】次に、本発明の一実施例の音声記録再生装
置における音声レベルを検出する動作について説明す
る。図6は、本実施例の音声記録再生装置における音声
レベルを検出する動作を説明するフローチャートであ
る。
Next, an operation of detecting an audio level in the audio recording / reproducing apparatus according to one embodiment of the present invention will be described. FIG. 6 is a flowchart illustrating an operation of detecting an audio level in the audio recording and reproducing apparatus according to the present embodiment.

【0036】はじめに、最初に読みとるフレームデータ
のフレーム番号を1に設定して、圧縮音声データの最初
のフレームデータを読みとりメモリ111に転送し記憶
する。(ST601)、(ST602)
First, the frame number of the frame data to be read first is set to 1, and the first frame data of the compressed audio data is read and transferred to the memory 111 for storage. (ST601), (ST602)

【0037】次に、スケールファクタ(SF)の最大値
を記憶したメモリのデータをクリアする。(ST60
3) システムマイコン103は、メモリ111に転送された
フレームのデータから各SBのスケールファクタ(S
F)のデータを低い周波数側のSBから順次読み出す。
MPEG1オーディオLayer1のモノラルモード及びサン
プリング周波数(fs)=32KHZとした場合、1フレ
ーム当たり32個のSFのデータがある。(ST60
4)、(ST605)
Next, the data in the memory storing the maximum value of the scale factor (SF) is cleared. (ST60
3) The system microcomputer 103 calculates the scale factor (S) of each SB from the frame data transferred to the memory 111.
The data of F) is sequentially read from the SB on the lower frequency side.
When the monaural mode of the MPEG1 audio layer 1 and the sampling frequency (fs) = 32 KHZ, there are 32 SF data per frame. (ST60
4), (ST605)

【0038】MPEG1オーディオの場合、SFのデー
タは+6dBから−118dBまで2dBステップとなってい
る。読み出した各SBのSFのデータを順次比較し、メ
モリに記憶したSFの最大値を更新していくことでその
フレームにおけるSFの最大値を求めることができる。
求めた最終値をそのフレームの最大レベルのデータとす
る。(ST606)、(ST607)、(ST608)
In the case of MPEG1 audio, SF data is in 2 dB steps from +6 dB to -118 dB. By sequentially comparing the read SF data of each SB and updating the maximum value of the SF stored in the memory, the maximum value of the SF in the frame can be obtained.
The obtained final value is used as the maximum level data of the frame. (ST606), (ST607), (ST608)

【0039】最初のフレームについて最大レベルのSF
のデータが確定したら、読みとりフレームのフレーム番
号に1を加えて次のフレームのデータをメモリ111に
読み取り、同じ手順でそのフレームの最大レベルのSF
のデータとして求めるという動作を繰り返す。(ST6
09)、(ST610)
The maximum level of SF for the first frame
Is determined, 1 is added to the frame number of the read frame, the data of the next frame is read into the memory 111, and the SF of the maximum level of that frame is read in the same procedure.
Is repeated. (ST6
09), (ST610)

【0040】以上の動作手順で示すように、圧縮音声デ
ータを伸張処理することなく、SFのデータのみを読み
取ることで各々のフレームにおける最大レベルを検出す
ることができる。
As shown in the above operation procedure, the maximum level in each frame can be detected by reading only the SF data without expanding the compressed audio data.

【0041】図7は、本実施例の音声記録再生装置にお
いて、再生時に自動的に電子ボリュームの利得を制御す
る動作を説明するフローチャートである。
FIG. 7 is a flowchart for explaining the operation of automatically controlling the gain of the electronic volume at the time of reproduction in the audio recording / reproducing apparatus of this embodiment.

【0042】はじめに、プログラム曲の音声レベルを検
出する指示を操作部104に備えられた指示釦で行う。
(ST701)
First, an instruction for detecting the audio level of the program tune is performed using an instruction button provided on the operation unit 104.
(ST701)

【0043】システムマイコン103は、操作部104
の指示釦の指示によりプログラム曲内の1番目のフレー
ムから順に各フレームのSFの最大値のデータである
(SF)frame.max.nを検索する。ここで、nは1〜N
であり、Nは1曲のプログラムのフレーム数である。
(ST702)
The system microcomputer 103 includes an operation unit 104
(SF) frame.max.n, which is data of the maximum value of SF of each frame, is searched in order from the first frame in the program music according to the instruction of the instruction button. Here, n is 1 to N
, And N is the number of frames of one music program.
(ST702)

【0044】プログラム曲内の各フレームのSFの最大
値のデータ(SF)frame.max.nの平均値(SF)prog
ram.av.を計算する。(SF)program.av.は次の式で求
められる。 (SF)program.av.=Σ(SF)frame.max.n/N、
(n=1〜N)、Nは1曲のプログラムのフレーム数
(ST703)
Average value (SF) prog of maximum value data (SF) frame.max.n of SF of each frame in the program music
Calculate ram.av. (SF) program.av. Is obtained by the following equation. (SF) program.av. = Σ (SF) frame.max.n / N,
(N = 1 to N), where N is the number of frames of one program (ST703)

【0045】ST703で求めた平均値(SF)progra
m.av.を記録媒体内のプログラム曲を管理する記録情報
部に記録する。(ST704)
The average value (SF) progra obtained in ST703
m.av. is recorded in the recording information section for managing the program music in the recording medium. (ST704)

【0046】操作部104に備えられた再生開始釦を操
作すると、システムマイコン103は、記録媒体内のプ
ログラム曲を管理する記録情報部に記録した平均値を読
み取り、その値に基づいて電子ボリューム108の利得
を自動的に変えるよう制御する。(ST705)、(S
T706)
When the reproduction start button provided on the operation unit 104 is operated, the system microcomputer 103 reads the average value recorded in the recording information section for managing the program music in the recording medium, and based on the value, the electronic volume 108 Is controlled to automatically change the gain. (ST705), (S
T706)

【0047】電子ボリューム108の利得が変えられた
後、音声データは復調されて音声回路部112に入力さ
れアナログ信号として出力される。(ST707)
After the gain of the electronic volume 108 is changed, the audio data is demodulated, input to the audio circuit unit 112, and output as an analog signal. (ST707)

【0048】図8は、本実施例の他の音声記録再生装置
において、フレームフォーマット信号の補助データ部の
データを使用しない場合の電子ボリュームの利得を制御
する動作を説明するフローチャートである。
FIG. 8 is a flow chart for explaining the operation of controlling the gain of the electronic volume when the data of the auxiliary data part of the frame format signal is not used in another audio recording / reproducing apparatus of this embodiment.

【0049】はじめに、プログラム曲の音声レベルを検
出する指示を操作部104に備えられた指示釦で行う。
(ST801)
First, an instruction for detecting the audio level of the program music is made by using an instruction button provided on the operation unit 104.
(ST801)

【0050】各フレームごとに32のSBに与えられた
SFのデータ(SF)iを読み出し、読み出した(S
F)i(i=0〜31)の平均値(SF)frame.av.nを
求める。(SF)frame.av.は次の式で表せられる。 (SF)frame.av.n=Σ(SF)i/32、(i=0〜
31、n=n) 求めた(SF)frame.av.nの値を各フレームの平均音声
レベルとして内部メモリに記憶する。(ST802)
The data (SF) i of the SF given to the 32 SBs for each frame is read and read (S
F) Find an average value (SF) frame.av.n of i (i = 0 to 31). (SF) frame.av. Is represented by the following equation. (SF) frame.av.n = Σ (SF) i / 32, (i = 0 to
31, n = n) The obtained value of (SF) frame.av.n is stored in the internal memory as the average audio level of each frame. (ST802)

【0051】ST802で求めた各フレームの平均音声
レベル(SF)frame.av.n(n=1〜N)を用いてプロ
グラム曲の全体にわたっての平均値(SF)program.a
v.を計算する。(SF)program.av.は次の式で求めら
れる。 (SF)program.av.=Σ(SF)frame.av.n/N、
(n=1〜N)、Nは1曲のプログラムのフレーム数 (ST803)
Using the average audio level (SF) frame.av.n (n = 1 to N) of each frame obtained in ST802, the average value (SF) program.a over the entire program music piece
Calculate v. (SF) program.av. Is obtained by the following equation. (SF) program.av. = Σ (SF) frame.av.n / N,
(N = 1 to N), where N is the number of frames of one tune program (ST803)

【0052】ST803で求めた平均値のデータ(S
F)program.av.を記録媒体内のプログラム曲を管理す
る記録情報部に記録する。(ST804)
The average value data (S
F) Program.av. Is recorded in the recording information section for managing the program music in the recording medium. (ST804)

【0053】操作部104に備えられた再生開始釦を操
作すると、システムマイコン103は、記録媒体内の記
録情報部に記録した平均値のデータ(SF)program.a
v.を読み取り、その値に基づいて電子ボリューム108
の利得を自動的に変えるよう制御する。(ST870
5)、(ST706)
When the reproduction start button provided on the operation unit 104 is operated, the system microcomputer 103 causes the average value data (SF) program.a recorded in the recording information section in the recording medium.
v. and read the electronic volume 108 based on the value.
Is controlled to automatically change the gain. (ST870
5), (ST706)

【0054】電子ボリューム108の利得が変えられた
後、音声データは復調されて音声回路部112に入力さ
れアナログ信号として出力される。(ST807)
After the gain of the electronic volume 108 is changed, the audio data is demodulated, input to the audio circuit unit 112, and output as an analog signal. (ST807)

【0055】各プログラム曲の平均音声レベルの情報又
は最初のプログラム曲の音声レベルを基準とした各プロ
グラム曲の平均音声レベルの偏差の情報をプログラム曲
を管理する記録情報として記録媒体に記録することによ
り、再生時に圧縮音声データをデコードし音声レベルを
確認するという動作を行わなくてもプログラム曲の音声
レベルを知ることができる。プログラム曲の再生を指示
したとき、それぞれのプログラム曲の記録情報である平
均音声レベルのデータを読み取ることにより、電子ボリ
ューム308の利得を調整して聴感上同じ程度のレベル
で連続して再生できるようになる。
Information on the average audio level of each program music or information on the deviation of the average audio level of each program music based on the audio level of the first program music is recorded on a recording medium as recording information for managing the program music. Thereby, the audio level of the program music can be known without performing the operation of decoding the compressed audio data and checking the audio level at the time of reproduction. When the reproduction of the program music is instructed, by reading the data of the average audio level, which is the recording information of each program music, the gain of the electronic volume 308 is adjusted so that the reproduction can be performed continuously at the same level in the sense of hearing. become.

【0056】次に、本発明の第2の実施例の音声記録再
生装置について説明する。図3は、本発明の第2の実施
例の音声記録再生装置のエンコードデコード部の構成を
説明する図である。
Next, an audio recording / reproducing apparatus according to a second embodiment of the present invention will be described. FIG. 3 is a diagram for explaining the configuration of the encode / decode section of the audio recording / reproducing apparatus according to the second embodiment of the present invention.

【0057】図3に示される音声記録再生装置の構成
は、図2に示される音声記録再生装置の構成のスケール
ファクタ最大値検出部207を音声レベル検出部207
aに換えたものであり、その他の構成は同じである。音
声レベル検出部207aは、音声圧縮処理する前の入力
音声データの音声レベルを検出する。
The configuration of the audio recording / reproducing apparatus shown in FIG. 3 is different from the configuration of the audio recording / reproducing apparatus shown in FIG.
a, and the other configuration is the same. The audio level detection unit 207a detects the audio level of the input audio data before the audio compression processing.

【0058】検出された音声レベルのデータは、フォー
マティング部205に送られ、所定のフレームフォーマ
ットの補助データ部に付加されたのち、記録媒体101
に記録される。本実施例においては、所定のフレームフ
ォーマットの補助データ部に付加された音声レベルのデ
ータは、同じフレームの音声レベルをそのまま表すもの
ではなく、同じ音声レベルのデータが複数のフレームに
わたって配置されることもある。
The data of the detected audio level is sent to the formatting unit 205 and added to the auxiliary data unit of a predetermined frame format.
Will be recorded. In the present embodiment, the audio level data added to the auxiliary data part of the predetermined frame format does not directly represent the audio level of the same frame, and the data of the same audio level is arranged over a plurality of frames. There is also.

【0059】音声データの再生時においては、その音声
データの音声レベルを補助データ部に付加されたデータ
を用いて求めたプログラム曲の平均音声レベルのデータ
に基づいて電子ボリュームの利得を変えることは本発明
の第1の実施例と同じである。
At the time of reproducing the audio data, it is not possible to change the gain of the electronic volume based on the data of the average audio level of the program music obtained by using the data added to the auxiliary data section. This is the same as the first embodiment of the present invention.

【0060】上述した説明の音声記録再生装置は、記録
媒体としてICメモリを使用したが、記録媒体としてC
D(Compact Disc)、MD(Mini Disc)、DVD(Digital
Versatile Disc)、PD(Phase Change Disc)を使用した
光ディスク、光磁気ディスク又は相変化光ディスクであ
っても良く、又、磁気ハードディスクであっても良い。
The above-described audio recording / reproducing apparatus uses an IC memory as a recording medium.
D (Compact Disc), MD (Mini Disc), DVD (Digital
An optical disk, a magneto-optical disk or a phase change optical disk using a Versatile Disc (PD) or a Phase Change Disc (PD) may be used, or a magnetic hard disk may be used.

【0061】[0061]

【発明の効果】本発明により、サブバンド(SB)の音
声データをデコードしなくても、記録されている音声レ
ベルを容易に検出することができ、検出した音声レベル
のデータに基づいて再生する音声の出力レベルを制御し
て再生する複数のプログラム曲の音声レベルをほぼ同じ
とする音声記録再生装置及び記録媒体を得ることがであ
る。
According to the present invention, the recorded audio level can be easily detected without decoding the audio data of the sub-band (SB), and reproduction is performed based on the detected audio level data. An object of the present invention is to provide an audio recording / reproducing apparatus and a recording medium in which the audio levels of a plurality of program tunes to be reproduced by controlling the audio output level are substantially the same.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例の音声再生装置の構成を示す
ブロック図である。
FIG. 1 is a block diagram illustrating a configuration of an audio playback device according to an embodiment of the present invention.

【図2】本発明の第1の実施例である音声記録再生装置
のエンコード/デコード部を説明する図である。
FIG. 2 is a diagram illustrating an encoding / decoding unit of the audio recording / reproducing apparatus according to the first embodiment of the present invention.

【図3】本発明の第2の実施例である音声記録再生装置
のエンコード/デコード部を説明する図である。
FIG. 3 is a diagram illustrating an encoding / decoding unit of an audio recording / reproducing apparatus according to a second embodiment of the present invention.

【図4】音声を圧縮伸張して記録再生する音声記録再生
装置において、入力音声データが異なるSBに分割され
てビットが割り当てられた音声データを説明する図であ
る。
FIG. 4 is a diagram illustrating audio data in which input audio data is divided into different SBs and bits are assigned in an audio recording / reproducing apparatus that records and reproduces audio by compressing and expanding the audio.

【図5】本実施例の音声記録再生装置に使用するMPE
G1オーディオのフレームフォーマットにおける各種デ
ータの配置を説明する模式図である。
FIG. 5 is an MPE used in the audio recording / reproducing apparatus of the embodiment.
FIG. 3 is a schematic diagram illustrating an arrangement of various data in a G1 audio frame format.

【図6】本実施例の音声記録再生装置における音声レベ
ルを検出する動作を説明するフローチャートである。
FIG. 6 is a flowchart illustrating an operation of detecting an audio level in the audio recording / reproducing apparatus of the embodiment.

【図7】本実施例の音声記録再生装置において、再生時
に自動的に電子ボリュームの利得を制御する動作を説明
するフローチャートである。
FIG. 7 is a flowchart illustrating an operation of automatically controlling the gain of the electronic volume at the time of reproduction in the audio recording / reproducing apparatus of the present embodiment.

【図8】本実施例の他の音声記録再生装置において、フ
レームフォーマット信号の補助データ部を使用しない場
合の電子ボリュームの利得を制御する動作を説明するフ
ローチャートである。
FIG. 8 is a flowchart illustrating an operation of controlling the gain of the electronic volume in a case where the auxiliary data portion of the frame format signal is not used in another audio recording / reproducing apparatus of the embodiment.

【符号の説明】[Explanation of symbols]

101 記録媒体(ICメモリ)、 102 イン
ターフェース部 103 システムマイコン、 104 操作
部 105 表示部、 106 D/
F 107 D/A、 108 電子
ボリューム 109 バッファ回路、 110 エン
コード/デコード部 111 メモリ、 112 音声
再生回路部 201 帯域分割部、 202 マス
キング閾値算出部 203 ビットアロケーション/スケールファクター
演算部 204 再量子化部、 205 フォ
ーマッティング部 206 レベル比較判別部 207 スケールファクター最大値検出部 207a 音声レベル検出部
Reference Signs List 101 recording medium (IC memory), 102 interface unit 103 system microcomputer, 104 operation unit 105 display unit, 106 D /
F 107 D / A, 108 electronic volume 109 buffer circuit, 110 encoding / decoding unit 111 memory, 112 audio reproduction circuit unit 201 band division unit, 202 masking threshold calculation unit 203 bit allocation / scale factor calculation unit 204 requantization unit, 205 Formatting section 206 Level comparison / determination section 207 Scale factor maximum value detection section 207a Audio level detection section

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 音声信号を圧縮伸張して記録再生する音
声記録再生装置において、音声信号を異なる音声周波数
帯域のサブバンドに分割し、量子化して音声データとす
る帯域分割手段と、マスキング閾値を算出するマスキン
グ閾値算出手段と、前記音声データのレベルと前記マス
キング閾値とを比較するレベル比較手段と、前記レベル
比較手段の比較結果にもとづいて前記サブバンドにビッ
トを割り当てるビットアロケーション手段と、前記ビッ
トアロケーション手段が前記サブバンドに割り当てたビ
ット数の音声データを再量子化する再量子化手段と、音
声信号または音声データの音声レベルを検出する音声レ
ベル検出手段と、前記音声レベル検出手段が検出した音
声レベルを示すデータをフレームフォーマットの補助デ
ータ部に付加するよう信号変換する信号変換手段と、前
記フレームフォーマットの信号の再生に際し、前記音声
レベルを示すデータにもとづき音声レベル制御部の利得
を制御する制御手段を備えることを特徴とする音声記録
再生装置。
1. An audio recording / reproducing apparatus for compressing / expanding an audio signal to record / reproduce the audio signal, wherein the audio signal is divided into sub-bands of different audio frequency bands, quantized to obtain audio data, and a masking threshold is set. Masking threshold calculating means for calculating, level comparing means for comparing the level of the audio data with the masking threshold, bit allocation means for allocating bits to the sub-band based on the comparison result of the level comparing means, Requantization means for requantizing the audio data of the number of bits allocated to the subband by the allocation means, audio level detection means for detecting the audio level of the audio signal or audio data, and detection by the audio level detection means Data indicating the audio level is added to the auxiliary data section of the frame format. An audio recording / reproducing apparatus comprising: a signal conversion unit for converting a signal; and a control unit for controlling a gain of an audio level control unit based on data indicating the audio level when reproducing the signal of the frame format.
【請求項2】 前記請求項1に記載の音声記録再生装置
において、前記ビットアロケーション手段は、前記サブ
バンドのサンプルデータのスケールファクターを演算
し、前記音声レベル検出部は、前記スケールファクター
の最大値を検出し、前記制御手段は、前記スケールファ
クターの最大値を前記補助データ部に付加することを特
徴とする音声記録再生装置。
2. The audio recording / reproducing apparatus according to claim 1, wherein the bit allocation means calculates a scale factor of the sample data of the sub-band, and the audio level detecting section calculates a maximum value of the scale factor. Wherein the control means adds the maximum value of the scale factor to the auxiliary data section.
【請求項3】 前記請求項1に記載の音声記録再生装置
において、前記音声レベル検出部は、前記音声記録再生
装置に入力する音声信号または音声データの音声レベル
を検出し、前記制御手段は、前記声レベルを前記補助デ
ータ部に付加することを特徴とする音声記録再生装置。
3. The audio recording / reproducing apparatus according to claim 1, wherein the audio level detecting unit detects an audio level of an audio signal or audio data input to the audio recording / reproducing apparatus, and the control unit includes: A voice recording / reproducing apparatus, wherein the voice level is added to the auxiliary data section.
【請求項4】 スケールファクターのデータと音声デー
タを圧縮したオーディオデータを配置したフレームフォ
ーマットの信号を記録する記録媒体において、前記フレ
ームフォーマットの補助データ部に前記スケールファク
ターの最大値または前記スケールファクターの平均値を
配置して記録したことを特徴とする記録媒体。
4. A recording medium for recording a signal in a frame format in which data of a scale factor and audio data obtained by compressing audio data are arranged, wherein a maximum value of the scale factor or a value of the scale factor is stored in an auxiliary data portion of the frame format. A recording medium characterized by arranging and recording average values.
JP11155536A 1999-06-02 1999-06-02 Voice record regenerating device and record medium Withdrawn JP2000347697A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11155536A JP2000347697A (en) 1999-06-02 1999-06-02 Voice record regenerating device and record medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11155536A JP2000347697A (en) 1999-06-02 1999-06-02 Voice record regenerating device and record medium

Publications (1)

Publication Number Publication Date
JP2000347697A true JP2000347697A (en) 2000-12-15

Family

ID=15608220

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11155536A Withdrawn JP2000347697A (en) 1999-06-02 1999-06-02 Voice record regenerating device and record medium

Country Status (1)

Country Link
JP (1) JP2000347697A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008145716A (en) * 2006-12-08 2008-06-26 Victor Co Of Japan Ltd Voice signal processor
JP2008197199A (en) * 2007-02-09 2008-08-28 Matsushita Electric Ind Co Ltd Audio encoder and audio decoder
JP2009532738A (en) * 2006-04-04 2009-09-10 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション Audio signal volume measurement and improvement in MDCT region
JP2014053768A (en) * 2012-09-07 2014-03-20 Alpine Electronics Inc Broadcasting receiver

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009532738A (en) * 2006-04-04 2009-09-10 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション Audio signal volume measurement and improvement in MDCT region
US8504181B2 (en) 2006-04-04 2013-08-06 Dolby Laboratories Licensing Corporation Audio signal loudness measurement and modification in the MDCT domain
JP2008145716A (en) * 2006-12-08 2008-06-26 Victor Co Of Japan Ltd Voice signal processor
JP2008197199A (en) * 2007-02-09 2008-08-28 Matsushita Electric Ind Co Ltd Audio encoder and audio decoder
JP2014053768A (en) * 2012-09-07 2014-03-20 Alpine Electronics Inc Broadcasting receiver

Similar Documents

Publication Publication Date Title
JP3123286B2 (en) Digital signal processing device or method, and recording medium
JP3123290B2 (en) Compressed data recording device and method, compressed data reproducing method, recording medium
EP0851423A1 (en) Audio player and recorder employing semiconductor memory as a recording medium
JPH08190764A (en) Method and device for processing digital signal and recording medium
JP2001134295A (en) Encoder and encoding method, recorder and recording method, transmitter and transmission method, decoder and decoding method, reproducing device and reproducing method, and recording medium
JP3304750B2 (en) Lossless encoder, lossless recording medium, lossless decoder, and lossless code decoder
JP2000347697A (en) Voice record regenerating device and record medium
JP2002314429A (en) Signal processor and signal processing method
US6463405B1 (en) Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
JP3304739B2 (en) Lossless encoder, lossless recording medium, lossless decoder, and lossless code decoder
US20020038216A1 (en) Compression data recording apparatus, recording method, compression data recording and reproducing apparatus, recording and reproducing method, and recording medium
JP2005149608A (en) Audio data recording/reproducing system and audio data recording medium therefor
JPH0863901A (en) Method and device for recording signal, signal reproducing device and recording medium
JP2002351500A (en) Method of encoding digital data
JP2000293199A (en) Voice coding method and recording and reproducing device
JP3481918B2 (en) Audio signal encoding / decoding device
JP3383202B2 (en) Digital data decoding method and decoding device
JP2816052B2 (en) Audio data compression device
JP3334375B2 (en) Digital signal compression method and apparatus
JP3490655B2 (en) Audio signal decoder
JP3173296B2 (en) Compression code transmission device
JP2001069089A (en) Digital signal recorder, digital signal recording method and recording medium
JP2000138591A (en) Audio reproducing device
JP2004341384A (en) Digital signal recording/reproducing apparatus and its control program
JP2002304198A (en) Device and method for signal processing

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060905