JP2001324996A - Method and device for reproducing mp3 music data - Google Patents
Method and device for reproducing mp3 music dataInfo
- Publication number
- JP2001324996A JP2001324996A JP2000142589A JP2000142589A JP2001324996A JP 2001324996 A JP2001324996 A JP 2001324996A JP 2000142589 A JP2000142589 A JP 2000142589A JP 2000142589 A JP2000142589 A JP 2000142589A JP 2001324996 A JP2001324996 A JP 2001324996A
- Authority
- JP
- Japan
- Prior art keywords
- music data
- frequency
- frequency component
- reproducing
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 13
- 230000008859 change Effects 0.000 claims description 15
- 230000002123 temporal effect Effects 0.000 claims description 14
- 230000002194 synthesizing effect Effects 0.000 claims description 8
- 230000006835 compression Effects 0.000 claims description 7
- 238000007906 compression Methods 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 description 5
- 238000013139 quantization Methods 0.000 description 5
- 238000000354 decomposition reaction Methods 0.000 description 4
- 239000002131 composite material Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、MPEG−1 Audio La
yer3(以下、MP3という)規格で不可逆圧縮された
音楽データ(MP3音楽データ)を、原音に近い音域で
再生するための音楽データ再生方法及び装置に関する。[0001] The present invention relates to an MPEG-1 Audio La.
The present invention relates to a music data reproducing method and apparatus for reproducing music data (MP3 music data) irreversibly compressed according to the yer3 (hereinafter referred to as MP3) standard in a range close to the original sound.
【0002】[0002]
【従来の技術】従来、コンピュータ上で音声(音楽)を
扱うデータ規格の中には、WAVデータ形式が代表的で
ある。WAVデータ形式では、CD(コンパクト・ディ
スク)並の音質でデータ化できる。2. Description of the Related Art Conventionally, a WAV data format is a typical data standard for handling sound (music) on a computer. In the WAV data format, data can be converted to sound quality comparable to a CD (compact disk).
【0003】ところが、WAVデータ形式では、1秒間
の音声(音楽)の録音に192KB(キロバイド)必要
となる。この容量(192KB)は、96000文字の
テキストデータの量に相当するものであり、一般に3分
程度の音楽を録音しようとすると、50MB(メガバイ
ド)前後の容量が必要となる。これは、膨大なデータサ
イズであり、コンピュータでは扱い難いものであった。However, in the WAV data format, 192 KB (kilobyte) is required for recording sound (music) for one second. This capacity (192 KB) is equivalent to the amount of text data of 96,000 characters. Generally, when recording music for about 3 minutes, a capacity of about 50 MB (megabyte) is required. This was an enormous data size, which was difficult to handle on a computer.
【0004】ところで、近年、MP3という圧縮技術が
提唱され、前記WAVデータを1/0〜1/12に圧縮
することができるようになった。In recent years, a compression technique called MP3 has been proposed, and it has become possible to compress the WAV data to 1/0 to 1/12.
【0005】MP3は、正式には、Motion Picture Exp
ect Group−1(MPEG−1)Audio Layer3といい、元の
音楽データを不可逆圧縮するものである。[0005] MP3 is formally known as Motion Picture Exp.
ect Group-1 (MPEG-1) Audio Layer 3, which irreversibly compresses original music data.
【0006】ここで、従来は、音声(音楽)ファイルを
ネット上で公開する手段としては、「リアルオーディ
オ」や「WAVファイル」等が適用されていたが、この
2つには一長一短があり、「リアルオーディオ」は、リ
アルタイムに音声(音楽)を配信することが可能である
が、CD並の音質とは程遠く、一方、「WAVファイ
ル」は、音質はCD並であるが、ファイルサイズが前述
のように非常に大きいなっていた。Heretofore, as a means for publishing audio (music) files on the Internet, "real audio", "WAV files", and the like have conventionally been applied, but these two have advantages and disadvantages. "Real audio" can deliver audio (music) in real time, but it is far from the sound quality of a CD. On the other hand, "WAV file" has the sound quality of a CD but the file size described above. Was getting so big.
【0007】これに対して、このMP3の再生音質は、
前述の如くCD並を維持することができ、しかもデータ
サイズも1/10〜1/12程度と極めて小さいため、
コンピュータ(インターネットを含む)でも取り扱いが
容易である。On the other hand, the reproduction sound quality of this MP3 is
As described above, the CD level can be maintained and the data size is extremely small, about 1/10 to 1/12.
Computers (including the Internet) are easy to handle.
【0008】ここで、MP3は、そのデータサイズを縮
小するために、不要な周波数(超高音域と、超低音域)
をカットしている。このように、人間の聴覚特性を使
い、ぎりぎりまでデータサイズを削ることで、データの
縮小化が図れている。このような、周波数カットは、基
本的にはこの帯域の周波数は人間がとんど感じる(聞こ
える)ことはなく、問題ないとされていた。Here, MP3 uses unnecessary frequencies (ultra high frequency range and ultra low frequency range) in order to reduce the data size.
Has been cut. As described above, the data can be reduced by using the human auditory characteristics to reduce the data size to the last minute. In such a frequency cut, basically, it is considered that a frequency in this band is hardly felt (audible) by a human, and is not a problem.
【0009】[0009]
【発明が解決しようとする課題】しかしながら、出願人
は、人間の聴覚が、上記のように実際に音として感じて
いる周波数帯域のみで音の感じているのではなく、音の
空間的な広がりを感じるためには、上記カットした超高
音域が重要な要素であることを見出した。SUMMARY OF THE INVENTION However, the applicant does not sense that the human hearing senses sound only in the frequency band that is actually felt as sound as described above, but rather the spatial spread of sound. It was found that the above cut super-treble is an important factor in order to feel the sound.
【0010】従って、CD並の音質とされていたMP3
音楽データを再生した場合、音自体はほぼ忠実に再生す
ることはできるが、音の広がりという概念的なものが足
りず、空間的な広がりに乏しい音になっている。[0010] Therefore, the MP3 which has the sound quality equivalent to that of a CD
When music data is reproduced, the sound itself can be reproduced almost faithfully, but the concept of sound spread is not enough, and the sound is poor in spatial spread.
【0011】本発明は上記事実を考慮し、MP3音楽デ
ータの再生時にも、音の空間的な広がりを持たせ、より
高いレベルの音質で再生することができるMP3音楽デ
ータ再生方法及び装置を得ることが目的である。In view of the above facts, the present invention provides a method and apparatus for reproducing MP3 music data, which allows the sound to be spread spatially and reproduced at a higher level of sound quality even when reproducing MP3 music data. That is the purpose.
【0012】[0012]
【課題を解決するための手段】本発明に係るMP3音楽
データ再生方法は、MPEG−1 Audio Layer3(以下、M
P3という)規格で不可逆圧縮された音楽データ(MP
3音楽データ)を、原音に近い音域で再生するための音
楽データ再生方法であって、前記MP3音楽データの周
波数成分から基音を抽出し、この基音から倍音となる周
波数成分を生成し、生成した倍音の周波数成分の内、超
高音域の周波数成分のみを残して、その他をカットし、
当該残った超高音域の周波数成分を、前記基音に対する
ゲインに基づいて増幅し、前記MP3音楽データから音
色の時間的変化特性を抽出し、この時間的変化特性に基
づいて、前記増幅された超音域の周波数成分と、元のM
P3音楽データの周波数成分と、を合成して再生する、
ことを特徴としている。また、この発明において、前記
カットする周波数成分が16KHz以下である。SUMMARY OF THE INVENTION An MP3 music data reproducing method according to the present invention is an MPEG-1 Audio Layer 3 (hereinafter referred to as M-1).
P3) music data (MP
3 music data) in a range close to the original sound, in which a fundamental tone is extracted from the frequency component of the MP3 music data, and a frequency component to be a harmonic is generated from the fundamental tone and generated. Of the frequency components of the overtones, leave only the frequency components in the ultra-high frequency range and cut the others,
The remaining ultra-high frequency components are amplified based on the gain for the fundamental tone, a temporal change characteristic of the timbre is extracted from the MP3 music data, and based on the temporal change characteristic, the amplified ultra-high frequency component is amplified. The frequency component of the range and the original M
Synthesizes and reproduces the frequency component of the P3 music data,
It is characterized by: Further, in the present invention, the frequency component to be cut is 16 KHz or less.
【0013】本発明に係るMP3音楽データ再生装置
は、MPEG−1 Audio Layer3(以下、MP3という)規
格で不可逆圧縮された音楽データ(MP3音楽データ)
を、原音に近い音域で再生するための音楽データ再生装
置であって、エンコードされたMP3音楽データが入力
される入力手段と、前記入力手段に入力されたMP3の
音楽データの周波数成分から基音を抽出する基音抽出手
段と、前記基音抽出手段で抽出した基音から倍音となる
周波数成分を生成する倍音周波数成分生成手段と、前記
倍音周波数成分生成手段で生成した倍音の周波数成分の
内、MP3への圧縮時にカットされるしきい値を超える
高音域周波数成分を残し、ノイズとなる前記しきい値以
下の周波数成分をカットするノイズカット手段と、前記
ノイズカット手段でカットされた後の周波数成分を、前
記基音に対するゲインに基づいて増幅する増幅手段と、
前記MP3音楽データから音色の時間的変化特性を抽出
する時間的変化特性抽出手段と、前記時間的特性変化抽
出手段で抽出された音色の時間的変化特性に基づいて、
前記増幅手段で増幅された超音域の周波数成分と、元の
MP3音楽データの周波数成分と、を同期させながら合
成する合成手段と、前記合成手段で合成された合成MP
3音楽データを再生する再生手段と、を有している。An MP3 music data reproducing apparatus according to the present invention provides music data (MP3 music data) irreversibly compressed according to the MPEG-1 Audio Layer 3 (hereinafter referred to as MP3) standard.
A music data reproducing apparatus for reproducing in a range close to the original sound, an input means to which encoded MP3 music data is input, and a base tone from a frequency component of the MP3 music data input to the input means. A fundamental frequency extracting means for extracting, a harmonic frequency component generating means for generating a frequency component to be a harmonic from the fundamental frequency extracted by the fundamental frequency extracting means, and a frequency component of the harmonics generated by the harmonic frequency component generating means to MP3. A high frequency range component that exceeds a threshold value that is cut during compression, and a noise cut unit that cuts a frequency component equal to or less than the threshold value that becomes noise, and a frequency component that has been cut by the noise cut unit, Amplifying means for amplifying based on a gain for the fundamental tone,
A temporal change characteristic extracting means for extracting a temporal change characteristic of a timbre from the MP3 music data; and a temporal change characteristic of the timbre extracted by the temporal characteristic change extracting means.
Synthesizing means for synthesizing the supersonic frequency component amplified by the amplifying means and the frequency component of the original MP3 music data while synchronizing; and a synthetic MP synthesized by the synthesizing means.
And reproduction means for reproducing the three music data.
【0014】また、この発明のおいて、前記しきい値が
16KHzであることを特徴とする。Further, according to the present invention, the threshold value is 16 KHz.
【0015】上記発明によれば、MP3音楽データは、
不可逆圧縮されるため、解凍したときに、元の周波数成
分とは異なり、特に、高音域の周波数成分(例えば、1
6KHz以上)が圧縮時に完全にカットされるため、解凍
時はこの帯域はなくなっている。この高音域は、人間が
聞こえることがない帯域であるのに、空間的な広がりを
考えた場合には、必要な音域である。According to the above invention, the MP3 music data is
Due to lossy compression, when decompressed, it differs from the original frequency component, and in particular, the frequency components in the high frequency range (for example, 1
(6 kHz or more) is completely cut during compression, so this band is lost during decompression. This treble range is a band in which humans cannot hear, but is necessary when considering spatial expansion.
【0016】そこで、MP3音楽データの周波数成分か
ら基音を抽出する。すなわち、音楽データの周波数成分
は、その多くが基音と倍音が合成された複合音であり、
その音の成分中、最も周波数が低く強い成分である基音
を抽出する。Therefore, the fundamental tone is extracted from the frequency components of the MP3 music data. In other words, most of the frequency components of the music data are complex tones in which fundamental and overtones are synthesized,
Among the components of the sound, a fundamental tone having the lowest frequency and a strong component is extracted.
【0017】前述のように、基音に倍音を合成したのが
複合音であるため、基音が抽出できれば、その倍音を合
成することで、基本的には、元の周波数特性とほぼ同一
の周波数特性が生成できるはずである。しかし、実際は
単音自体が単一であることはないため、通常の周波数帯
域での前記基音と倍音とが合成された複合音はノイズと
なる。As described above, since the overtone is synthesized with the fundamental tone, it is a composite tone. If the fundamental tone can be extracted, the overtone is synthesized, so that the fundamental frequency characteristic is basically the same as the original frequency characteristic. Should be able to be generated. However, since a single tone is not actually a single tone, a complex tone obtained by synthesizing the fundamental tone and the overtone in a normal frequency band becomes noise.
【0018】一方、16KHz以上の周波数帯域では、こ
の合成された複合音が空間的な広がりを作る音として機
能するため、高音域の周波数成分のみを残して、その他
をカットする。その後、この高音域の周波数成分を基音
に対するゲインに基づいて増幅する。On the other hand, in the frequency band of 16 KHz or more, since the synthesized composite sound functions as a sound that creates a spatial spread, the other frequencies are cut off while leaving only the high frequency range frequency components. After that, the high frequency range frequency component is amplified based on the gain for the fundamental tone.
【0019】一方、前記MP3音楽データから音色の時
間的変化特性を抽出することで、この時間的変化特性に
基づいて、前記増幅された超音域の周波数成分と、元の
MP3音楽データの周波数成分と、を同期させながら合
成することができる。この合成された合成MP3音楽デ
ータを再生すると、音の広がりとして必要であった高音
域の周波数帯域に音圧が存在するため、さらにCD等の
音質に近づけることができる。On the other hand, by extracting the temporal change characteristic of the timbre from the MP3 music data, based on the temporal change characteristic, the frequency component of the amplified supersonic range and the frequency component of the original MP3 music data are extracted. Can be synthesized while synchronizing. When this synthesized MP3 music data is reproduced, the sound pressure is present in the high frequency band required for the spread of sound, so that the sound quality can be made closer to that of a CD or the like.
【0020】[0020]
【発明の実施の形態】(MP3音楽データ生成(圧
縮))MP3の圧縮の基本は、音の無駄な部分を取り去
って、指定されたビットレートに収まるようにすること
である。基の音楽がCDに記憶された音楽データの場
合、ビットレートは約1400キロビットであり、これ
から9/10の不要な部分を取り去ることで、128キ
ロビットのMP3音楽データを作成することができる。BEST MODE FOR CARRYING OUT THE INVENTION (MP3 Music Data Generation (Compression)) The basic principle of MP3 compression is to remove useless parts of sound so that it fits in a specified bit rate. When the original music is music data stored on a CD, the bit rate is about 1400 kilobits, and by removing unnecessary parts of 9/10 from this, 128 kilobits of MP3 music data can be created.
【0021】上記不要部分を取り去るには、図1に示さ
れる過程を経ることで実行される。The removal of the unnecessary portion is performed through the process shown in FIG.
【0022】基の音楽データ(例えば、音楽CD)は、
分岐されて、一方がサブバンド分解部10へ入力され、
他方がフーリエ変換(周波数分析)部12へ入力され
る。The original music data (eg, music CD)
It is branched, and one is input to the sub-band decomposition unit 10,
The other is input to the Fourier transform (frequency analysis) unit 12.
【0023】サブバンド分解部10では、まず、基の音
楽データ(例えば音楽CD)を1/32のサンプリング
周波数でサンプリングし直す。このように、周波数の範
囲を釘ってサンプリングし直し、基の音楽データに含ま
れる周波数成分毎にデータの性質を調べることが可能と
なる。The subband decomposition section 10 first resamples the original music data (for example, music CD) at a sampling frequency of 1/32. In this way, it is possible to narrow down the frequency range and perform sampling again to check the properties of the data for each frequency component included in the original music data.
【0024】一方、フーリエ変換部12でフーリエ変換
された結果から、どの部分が他の音に掻き消されてしま
い、不要となるものを判断する心理聴覚評価部14へ送
られる。On the other hand, from the result of the Fourier transform performed by the Fourier transform unit 12, the sound is discarded by other sounds and sent to a psychological auditory evaluation unit 14 for determining what is unnecessary.
【0025】上記サブバンド分解部10と心理聴覚評価
部14との結果はMDCT(変形離散コサイン)部16
へ送られ、サブバンド分解されたデータをさらに細かく
周波数単位のデータに変換する。この段階でデジタル化
された数値から、周波数における表記に変換され、量子
化部18へ送られる。量子化部18では、MDCT部1
6及び心理聴覚評価部14のそれぞれの周波数成分を数
値化し、周波数領域ごとに、適当に除算処理が施され
る。すなわち、量子化部18では、心理聴覚評価によっ
て得られた結果から、どの周波数に何ビットを割り当て
る得てるかが決まる。The results of the subband decomposition section 10 and the psychological auditory evaluation section 14 are converted into an MDCT (Modified Discrete Cosine) section 16.
The subband-decomposed data is further converted into data in frequency units. At this stage, the digitized numerical value is converted into a notation in frequency and sent to the quantization unit 18. In the quantization unit 18, the MDCT unit 1
6 and the frequency components of the psychological auditory evaluation unit 14 are digitized, and division processing is appropriately performed for each frequency domain. That is, the quantization unit 18 determines which bits are assigned to which frequency from the result obtained by the psychological auditory evaluation.
【0026】量子化部18での処理結果は、ハフマン符
号化部20において、可逆圧縮され、データは圧縮さ
れ、MP3音楽データが作成される。 (MP3音楽データの再生)ここで、MP3音楽データ
の再生は、可逆圧縮されたものを解凍したデータを専用
のソフトウェア等で再生処理を行うのが一般的である
が、本実施の形態では、符号化されたMP3音楽データ
を以下の手順で処理している。The processing result of the quantization unit 18 is losslessly compressed in the Huffman encoding unit 20, the data is compressed, and MP3 music data is created. (Reproduction of MP3 music data) Here, the reproduction of the MP3 music data is generally performed by reproducing the data obtained by decompressing the losslessly compressed data using dedicated software or the like. The encoded MP3 music data is processed in the following procedure.
【0027】図2に示される如く、ステップ100で符
号化されたMP3音楽データを取込み、次いでステップ
102でMP3音楽データの周波数成分から基音を抽出
すると共にこの基音から倍音を生成する。As shown in FIG. 2, in step 100, the encoded MP3 music data is fetched, and then in step 102, a fundamental tone is extracted from the frequency components of the MP3 music data, and harmonics are generated from the fundamental tone.
【0028】次のステップ104では、前記合成音(基
音+倍音)の周波数成分の内、16KHz以上の周波数帯
域のみを残し、それ以外をノイズとしてカットする。1
6KHz以上の周波数帯域では、この合成された複合音が
空間的な広がりを作る音として機能する。In the next step 104, of the frequency components of the synthesized sound (fundamental tone + overtone), only the frequency band of 16 KHz or more is left, and the rest is cut as noise. 1
In a frequency band of 6 KHz or more, the synthesized composite sound functions as a sound that creates a spatial spread.
【0029】その後、ステップ106では、この高音域
の周波数成分を基音に対するゲインに基づいて増幅した
後、ステップ108へ移行する。Thereafter, in step 106, the frequency components in the high frequency range are amplified based on the gain for the fundamental tone, and then the process proceeds to step 108.
【0030】一方、ステップ110では、上記ステップ
102からステップ106の処理と同時に、エンベロー
プが抽出され、ステップ108において、前記増幅され
たデータをエンベロープフォロワー回路を通すことで、
基のMP3音楽データとの同期をとり、次いでステップ
112で、増幅された超音域の周波数成分と、元のMP
3音楽データの周波数成分と、を同期させながら合成す
る(合成MP3音楽データ)。この合成MP3音楽デー
タを専用のソフトウェア等で再生処理する(ステップ1
14)On the other hand, in step 110, the envelope is extracted simultaneously with the processing of steps 102 to 106, and in step 108, the amplified data is passed through an envelope follower circuit.
Synchronize with the original MP3 music data, and then in step 112, the amplified supersonic frequency component and the original MP3
The frequency components of the three music data are synthesized while synchronizing them (synthesized MP3 music data). The synthesized MP3 music data is reproduced by a dedicated software or the like (step 1).
14)
【実施例】基のMP3音楽データと合成MP3音楽デー
タを、それぞれ音楽CDデータと比較するため、以下の
表1に示すシステムを使用した。EXAMPLES In order to compare the original MP3 music data and the synthesized MP3 music data with the music CD data, the system shown in Table 1 below was used.
【0031】[0031]
【表1】 上記システムにおいて、まず、CD音源(Sample Rate
44.1KHz)をProtoolsハードウェア経由LOGIC AUDIOに取
込んだ後(以後このファイルをファイルAという)、PE
AK 2.1+Shockwave Export XTRA でMP3ファイルに変
換する。[Table 1] In the above system, first, the CD sound source (Sample Rate
After importing 44.1KHz) to LOGIC AUDIO via Protools hardware (hereinafter this file is called file A), PE
Convert to MP3 file with AK 2.1 + Shockwave Export XTRA.
【0032】このファイルAをSound Jam MPにて再生
し、Protools ハードウェア経由PCM-7040にコピーし、
再びProtools ハードウェア経由でLOGIC AUDIOに取込む
(以後このファイルをファイルBという)。以上の2種
類のファイルAとファイルB同時に再生し、それぞれの
周波数特性Spectra Fooにて測定した。This file A is reproduced by Sound Jam MP and copied to PCM-7040 via Protools hardware.
Import to LOGIC AUDIO again via Protools hardware (this file will be referred to as file B hereinafter). The above two types of file A and file B were reproduced at the same time, and their frequency characteristics were measured with Spectra Foo.
【0033】ファイルBへの変換の際の最も大きな変化
として、ファイルB側には、16KHz以上の音声が存
在しないことが認められた。 この2種類のファイルの
周波数特性をほぼ同一のものとするため、ファイルB側
を元に、DUY DSPider , MacDSP FilterBank , Waves Re
naissance EQ を使用して、新たに16KHz以上の音
声成分(ノイズ成分)を作り出し、ファイルBに付加し
た(以後このファイルをファイルCという)。その結
果、ファイルCは、音源をMP3ファイルにエンコーデ
ィング、デコーディングした後もCDクオリティの音に
戻すことができた。As the largest change in the conversion to the file B, it was recognized that the sound of 16 kHz or more does not exist on the file B side. In order to make the frequency characteristics of these two types of files almost the same, DUY DSPider, MacDSP FilterBank, Waves Re
Using the naissance EQ, a new audio component (noise component) of 16 kHz or more was created and added to the file B (hereinafter, this file is referred to as file C). As a result, file C was able to return to CD quality sound even after the sound source was encoded and decoded into an MP3 file.
【0034】つまり、MP3エンコーディング及びデコ
ーディングの際に失われる16KHz以上の音声成分
を、MP3プレーヤー等のハードウェアに上記の実験で
作り出したノイズ成分を発生させる装置を内蔵すること
により、MP3のCD音源のサウンドクオリティに戻す
ことができる。That is, by incorporating a device for generating a noise component created in the above experiment into hardware such as an MP3 player, the audio component of 16 KHz or more which is lost during MP3 encoding and decoding, the MP3 CD You can restore the sound quality of the sound source.
【0035】[0035]
【発明の効果】以上説明した如く本発明に係るMP3音
楽データ再生方法及び装置は、MP3音楽データの再生
時にも、音の空間的な広がりを持たせ、より高いレベル
の音質で再生することができるという優れた効果を有す
る。As described above, the method and apparatus for reproducing MP3 music data according to the present invention can provide a sound with a wider space and reproduce at a higher level of sound quality even when reproducing MP3 music data. It has an excellent effect of being able to.
【図1】MP3音楽データを生成するための制御ブロッ
ク図である。FIG. 1 is a control block diagram for generating MP3 music data.
【図2】MP3音楽データの16KHz以上の周波数帯
域に倍音によるノイズを付加するための手順を示す流れ
図である。FIG. 2 is a flowchart showing a procedure for adding overtone noise to a frequency band of 16 kHz or more of MP3 music data.
【図3】同一の音楽データの周波数特性図であり、
(A)CDオリジナル(ファイルA)、(B)はMP3
ノイズ付加前、(C)MP3ノイズ付加後を示す。FIG. 3 is a frequency characteristic diagram of the same music data;
(A) CD original (file A), (B) MP3
Shown before adding noise, and (C) after adding MP3 noise.
10 サブバンド分解部 12 フーリエ変換部 14 心理聴覚評価部 16 MDCT部 18 量子化部 20 ハフマン符号化部 Reference Signs List 10 Subband decomposition unit 12 Fourier transform unit 14 Psychological hearing evaluation unit 16 MDCT unit 18 Quantization unit 20 Huffman coding unit
Claims (4)
という)規格で不可逆圧縮された音楽データ(MP3音
楽データ)を、原音に近い音域で再生するための音楽デ
ータ再生方法であって、 前記MP3音楽データの周波数成分から基音を抽出し、 この基音から倍音となる周波数成分を生成し、 生成した倍音の周波数成分の内、超高音域の周波数成分
のみを残して、その他をカットし、 当該残った超高音域の周波数成分を、前記基音に対する
ゲインに基づいて増幅し、 前記MP3音楽データから音色の時間的変化特性を抽出
し、この時間的変化特性に基づいて、前記増幅された超
音域の周波数成分と、元のMP3音楽データの周波数成
分と、を合成して再生する、ことを特徴としたMP3音
楽データ再生方法。1. An MPEG-1 Audio Layer 3 (hereinafter, MP3)
A music data reproduction method for reproducing music data (MP3 music data) irreversibly compressed according to a standard in a range close to the original sound, comprising extracting a fundamental tone from a frequency component of the MP3 music data, Generate a frequency component that will be a harmonic, and, of the frequency components of the generated harmonic, leave only the frequency component in the ultra-high frequency range and cut off the others.The remaining frequency component in the ultra-high frequency range is used as a gain for the fundamental frequency. Amplifying based on the above, extracting a temporal change characteristic of the timbre from the MP3 music data, and based on the temporal change characteristic, the amplified frequency component of the supersonic range, the frequency component of the original MP3 music data, A method for reproducing MP3 music data, comprising: synthesizing and reproducing.
下であることを特徴とする請求項1記載のMP3音楽デ
ータ再生方法。2. The MP3 music data reproducing method according to claim 1, wherein the frequency component to be cut is 16 KHz or less.
という)規格で不可逆圧縮された音楽データ(MP3音
楽データ)を、原音に近い音域で再生するための音楽デ
ータ再生装置であって、 エンコードされたMP3音楽データが入力される入力手
段と、 前記入力手段に入力されたMP3の音楽データの周波数
成分から基音を抽出する基音抽出手段と、 前記基音抽出手段で抽出した基音から倍音となる周波数
成分を生成する倍音周波数成分生成手段と、 前記倍音周波数成分生成手段で生成した倍音の周波数成
分の内、MP3への圧縮時にカットされるしきい値を超
える高音域周波数成分を残し、ノイズとなる前記しきい
値以下の周波数成分をカットするノイズカット手段と、 前記ノイズカット手段でカットされた後の周波数成分
を、前記基音に対するゲインに基づいて増幅する増幅手
段と、 前記MP3音楽データから音色の時間的変化特性を抽出
する時間的変化特性抽出手段と、 前記時間的特性変化抽出手段で抽出された音色の時間的
変化特性に基づいて、前記増幅手段で増幅された超音域
の周波数成分と、元のMP3音楽データの周波数成分
と、を同期させながら合成する合成手段と、 前記合成手段で合成された合成MP3音楽データを再生
する再生手段と、を有するMP3音楽データ再生装置。3. An MPEG-1 Audio Layer 3 (hereinafter, MP3)
A music data reproduction device for reproducing music data (MP3 music data) irreversibly compressed according to a standard in a range close to the original sound, and input means for inputting encoded MP3 music data; A fundamental tone extracting means for extracting a fundamental tone from a frequency component of the MP3 music data input to the means; a harmonic frequency component generating means for producing a frequency component to be a harmonic from the fundamental tone extracted by the fundamental tone extracting means; Noise cut means for cutting out frequency components below the threshold value which become noise while leaving high frequency range frequency components exceeding a threshold value which is cut during compression to MP3 among frequency components of harmonics generated by the generation means; Amplifying means for amplifying the frequency component cut by the noise cut means based on a gain for the fundamental tone; A temporal change characteristic extracting means for extracting a temporal change characteristic of the timbre from the MP3 music data; and a super-amplifier amplified by the amplifying means based on the temporal change characteristic of the timbre extracted by the temporal characteristic change extractor. MP3 music data reproduction comprising: synthesizing means for synthesizing frequency components of a musical range and frequency components of original MP3 music data while synchronizing; and reproducing means for reproducing the synthesized MP3 music data synthesized by the synthesizing means. apparatus.
徴とする請求項3記載のMP3音楽データ再生装置。4. The MP3 music data reproducing apparatus according to claim 3, wherein said threshold value is 16 KHz.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000142589A JP2001324996A (en) | 2000-05-15 | 2000-05-15 | Method and device for reproducing mp3 music data |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000142589A JP2001324996A (en) | 2000-05-15 | 2000-05-15 | Method and device for reproducing mp3 music data |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001324996A true JP2001324996A (en) | 2001-11-22 |
Family
ID=18649521
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000142589A Pending JP2001324996A (en) | 2000-05-15 | 2000-05-15 | Method and device for reproducing mp3 music data |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2001324996A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003071829A1 (en) * | 2002-02-21 | 2003-08-28 | Add Eleco. Inc. | Rapidly optimized wireless microphone system and method for controlling thereof |
WO2010075784A1 (en) * | 2008-12-31 | 2010-07-08 | 华为技术有限公司 | Method and device for obtaining pitch gain, encoder and decoder |
JP2012078866A (en) * | 2002-06-17 | 2012-04-19 | Dolby Lab Licensing Corp | Audio coding system using characteristics of decoded signal to adapt synthesized spectral components |
-
2000
- 2000-05-15 JP JP2000142589A patent/JP2001324996A/en active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003071829A1 (en) * | 2002-02-21 | 2003-08-28 | Add Eleco. Inc. | Rapidly optimized wireless microphone system and method for controlling thereof |
JP2012078866A (en) * | 2002-06-17 | 2012-04-19 | Dolby Lab Licensing Corp | Audio coding system using characteristics of decoded signal to adapt synthesized spectral components |
JP2012103718A (en) * | 2002-06-17 | 2012-05-31 | Dolby Lab Licensing Corp | Audio coding system using characteristics of decoded signal to adapt synthesized spectral components |
WO2010075784A1 (en) * | 2008-12-31 | 2010-07-08 | 华为技术有限公司 | Method and device for obtaining pitch gain, encoder and decoder |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4478183B2 (en) | Apparatus and method for stably classifying audio signals, method for constructing and operating an audio signal database, and computer program | |
US8687818B2 (en) | Method for dynamically adjusting the spectral content of an audio signal | |
JP2006011456A (en) | Low bit rate encoding / decoding method and apparatus and computer-readable medium | |
WO2003007480A1 (en) | Audio signal decoding device and audio signal encoding device | |
JP2006048043A (en) | High frequency restoration method and apparatus for audio data | |
JP5651980B2 (en) | Decoding device, decoding method, and program | |
GB2403881A (en) | Automatic classification/identification of similarly compressed audio files | |
JP2005531014A (en) | Audio coding method and apparatus using harmonic components | |
JP3824607B2 (en) | Improved audio encoding and / or decoding method and apparatus using time-frequency correlation | |
EP1259956A1 (en) | Method of and apparatus for converting an audio signal between data compression formats | |
CN101010729A (en) | Method and device for transcoding | |
US20040083094A1 (en) | Wavelet-based compression and decompression of audio sample sets | |
US20080133250A1 (en) | Method and Related Device for Improving the Processing of MP3 Decoding and Encoding | |
JP2001324996A (en) | Method and device for reproducing mp3 music data | |
EP3575989B1 (en) | Method and device for processing multimedia data | |
JP2003280691A (en) | Voice processing method and voice processor | |
KR100433984B1 (en) | Method and Apparatus for Encoding/decoding of digital audio | |
KR20080112000A (en) | Encoding / Decoding Method Using Tone Similarity | |
Cavagnolo et al. | Introduction to Digital Audio Compression | |
KR101281945B1 (en) | Apparatus and method for coding audio | |
WO2002005433A1 (en) | A method, a device and a system for compressing a musical and voice signal | |
JP5892395B2 (en) | Encoding apparatus, encoding method, and program | |
JP2007108440A (en) | Voice signal compressing device, voice signal decompressing device, voice signal compression method, voice signal decompression method, and program | |
Reyes et al. | A new perceptual entropy-based method to achieve a signal adapted wavelet tree in a low bit rate perceptual audio coder | |
Wittenburg | Effects of Compression on Linguistically Relevant Speech Analysis Parameters |