JP2004310054A - Music file generation apparatus, music file generation method, and recording medium - Google Patents

Music file generation apparatus, music file generation method, and recording medium Download PDF

Info

Publication number
JP2004310054A
JP2004310054A JP2004017202A JP2004017202A JP2004310054A JP 2004310054 A JP2004310054 A JP 2004310054A JP 2004017202 A JP2004017202 A JP 2004017202A JP 2004017202 A JP2004017202 A JP 2004017202A JP 2004310054 A JP2004310054 A JP 2004310054A
Authority
JP
Japan
Prior art keywords
data
singing voice
midi
format
bgm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004017202A
Other languages
Japanese (ja)
Inventor
Hirohito Kimoto
裕仁 木本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SUNS K KK
Original Assignee
SUNS K KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SUNS K KK filed Critical SUNS K KK
Priority to JP2004017202A priority Critical patent/JP2004310054A/en
Publication of JP2004310054A publication Critical patent/JP2004310054A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To permit the utilization of music consisting of a singing voice and a BGM (background music), as the ringing tone, even in the present kind of mobile phone that is not equipped with a large-capacity memory, the MP3 (MPEG 1-Audio Layer-3) recorder, or the like. <P>SOLUTION: There are provided with a singing voice extraction part 2 for extracting the singing voice of a person from digital sound source data 11 and for obtaining singing voice data 12 according to the ADPCM (adaptive differential pulse code modulation) format, a BGM generation part 13 for generating the BGM data 13 according to the MIDI (music instrument digital interface) format, an MIDI adjustment part 4 for generating simulated singing voice data according to the MIDI format matching with the extracted singing voice and for adding it to the BGM data 13, and a file generation part 5 for processing the singing voice data 12 and the BGM + simulated singing voice data 14 into one music file 15. The overall amount of the data is reduced by heavily limiting the band with respect to the singing voice part and by generating the BGM part according to the MIDI format, and the quality of the reproduced singing voice can be maintained so as to be not less than a prescribed level, by supplementing the deteriorated singing voice part due to the band limitation with the MIDI data. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、楽曲ファイル生成装置、楽曲ファイル生成方法および特定データ構造を有する楽曲ファイルの記録媒体に関し、特に、人間の歌声とBGM(Back Ground Music)とから成る楽曲ファイルの生成方法および当該楽曲ファイルのデータ構造に関するものである。   The present invention relates to a music file generation device, a music file generation method, and a music file recording medium having a specific data structure, and more particularly to a music file generation method including a human singing voice and BGM (Back Ground Music) and the music file. This is related to the data structure.

今や携帯電話は爆発的に普及し、誰もが持っている機器の1つになった。当初の携帯電話では、着信音は極めて単調なパターン音を繰り返す程度のものしかなかった。しかしやがて、より個性的なものを求める市場ニーズに対応して、MIDI(Music Instrument Digital Interface)データを利用して作成したメロディで着信音を鳴らす、いわゆる「着信メロディ」が登場した。   Now, mobile phones have exploded and become one of the devices that everyone has. In the early days of mobile phones, the only ring tone was that of repeating a very monotonous pattern sound. In time, however, a so-called “ringing melody,” in which a melody created using MIDI (Music Instrument Digital Interface) data sounds a ringtone in response to a market need for a more individual thing, has appeared.

また、数年前にはPCM音源を内蔵した携帯電話も登場し、このPCM音源を利用してアーティスト等の声で着信音を鳴らす、いわゆる「着信ボイス」も今では実現されている。これらの着信メロディや着信ボイスは、インターネット上のサイトから所望のものをダウンロードして利用することができるようになっている。ユーザは自分好みのコンテンツを携帯電話にダウンロードすることにより、携帯電話を「自分」独自のものに仕立て上げることが可能である。   A few years ago, a mobile phone with a built-in PCM sound source also appeared, and a so-called “ringing voice” that uses the PCM sound source to sound a ringtone with the voice of an artist or the like has been realized. These ringtones and voices can be downloaded and used from sites on the Internet. The user can tailor the mobile phone to his / her own by downloading the content he / she likes to the mobile phone.

最近では、携帯電話機の進歩により、CD(コンパクトディスク)等に記録されている楽曲そのものを携帯電話の着信音として利用する(単なるメロディ音や単なる人間の声でなく、人間の歌声とBGMとが一体となった楽曲そのものを着信音とする)システム(以下「着うた」システムと称する)が新たに提供されている。この種の着うたシステムでは、CD音源から一部を切り出し、それをMP3(MPEG1 Audio Layer-3)等の形式で圧縮したデータを配信用のコンテンツとして用いている。   Recently, with the progress of mobile phones, music recorded on a compact disk (CD) or the like is used as a ringtone of the mobile phone (not just a melody sound or a mere human voice, but a human singing voice and BGM). A system (hereinafter, referred to as a “ringing song” system) in which the integrated music itself is used as a ringtone is newly provided. In this kind of ringing song system, a part is cut out from a CD sound source, and the data is compressed in a format such as MP3 (MPEG1 Audio Layer-3) and used as content for distribution.

しかしながら、従来の着うたシステムでは、CD音源の一部を単純に切り出して配信用コンテンツとしている。そのため、従来の着信メロディ(MIDIデータ)や着信ボイス(PCMデータ)に比べて着うたのコンテンツはデータ量が非常に大きくなり、これをダウンロードして利用するためには携帯電話に大きな容量のメモリが必要になる。   However, in the conventional ringing song system, a part of the CD sound source is simply cut out and used as distribution content. Therefore, compared to the conventional ring tone melody (MIDI data) and ring tone voice (PCM data), the amount of data of the ringing song becomes very large, and a large-capacity memory is required in the mobile phone in order to download and use it. Will be needed.

少なくとも1つの楽曲として認識できる程度に着うたを再生するためには、それなりの時間分だけCD音源を切り出す必要がある。よって、切り出したデータをMP3形式で圧縮したとしても、既存の携帯電話機が備える少ない容量のメモリでは対応し切れない。また、既存の携帯電話機は、MIDI音源やPCM音源の再生機能は備えているが、MP3形式のデータの再生機能は備えていない。   In order to reproduce a ringing song to the extent that it can be recognized as at least one music piece, it is necessary to cut out a CD sound source for a certain amount of time. Therefore, even if the clipped data is compressed in the MP3 format, it cannot be coped with with a small capacity memory provided in the existing mobile phone. Existing mobile phones have a function of playing back MIDI sound sources and PCM sound sources, but do not have a function of playing back data in MP3 format.

以上のことから、従来の着うたシステムでは、非常に大きな容量のメモリを持ち、かつMP3形式のデコーダを備えた新機種でないとサービスを利用することができないという問題があった。着信メロディや着信ボイスが大きなブームとなったのは、携帯電話が標準で備えていたMIDI音源の再生機能とPCM音源の再生機能とをそのまま利用できたことが1つの要因である。したがって、着うたに関しても、既存の機種でもサービスを利用できるようにすることが望まれる。   As described above, the conventional ringing song system has a problem that the service cannot be used unless it is a new model having a very large capacity memory and an MP3 format decoder. One of the reasons why the ringing melody and the ringing voice became large boom was that the reproduction function of the MIDI sound source and the reproduction function of the PCM sound source, which were provided as standard in the mobile phone, could be used as they were. Therefore, it is desired that the service can be used even with the existing model for the ringing song.

本発明は、このような実情に鑑みて成されたものであり、大容量のメモリやMP3デコーダ等を備えていない現行の携帯電話機でも、歌声とBGMとから成る楽曲を着信音として利用できるようにすることを目的とする。   The present invention has been made in view of such circumstances, and enables a current mobile phone not provided with a large-capacity memory, an MP3 decoder, or the like to use a tune composed of singing voice and BGM as a ring tone. The purpose is to.

本発明の楽曲ファイル生成装置は、歌声と当該歌声以外の音声とが混合して成るデジタル音声データから上記歌声を抽出し、PCM形式の歌声データを得る歌声抽出手段と、MIDI形式のBGMデータを生成するとともに、上記歌声抽出手段により抽出した歌声に合わせてMIDI形式の模擬歌声データを生成し、上記BGMデータに対して上記模擬歌声データを付加してMIDIデータの調整を行うMIDI生成手段と、上記歌声抽出手段により生成されたPCM形式の歌声データと上記MIDI生成手段により生成されたMIDI形式のBGM+模擬歌声データとを1つの楽曲ファイルに加工するファイル生成手段とを備えたことを特徴とする。上記歌声以外の音声は、例えばBGMまたは雑音である。   The music file generation device of the present invention extracts singing voice from digital voice data composed of a mixture of singing voice and voice other than the singing voice, and obtains singing voice data in PCM format and BGM data in MIDI format. MIDI generating means for generating, simulating singing voice data in MIDI format in accordance with the singing voice extracted by the singing voice extracting means, and adding the simulated singing voice data to the BGM data to adjust the MIDI data; File generating means for processing the singing voice data in the PCM format generated by the singing voice extracting means and the BGM + simulated singing voice data in the MIDI format generated by the MIDI generating means into one music file. . The voice other than the singing voice is, for example, BGM or noise.

本発明の他の態様では、上記歌声抽出手段は、上記歌声と上記歌声以外の音声とが混合して成るデジタル音声データに対して、上記歌声に対応する所定の周波数帯域まで帯域制限する処理を行うことを特徴とする。   In another aspect of the present invention, the singing voice extracting means performs a process of band-limiting digital voice data obtained by mixing the singing voice and voices other than the singing voice to a predetermined frequency band corresponding to the singing voice. It is characterized by performing.

本発明の他の態様では、上記ファイル生成手段により生成される楽曲ファイルは、上記MIDI生成手段により生成されたMIDI形式のBGM+模擬歌声データを再生するためのMIDI再生制御情報と、上記歌声抽出手段により生成されたPCM形式の歌声データを上記模擬歌声データに同期させて再生するためのPCM再生制御情報とを含んで構成されることを特徴とする。   In another aspect of the present invention, the music file generated by the file generating means includes MIDI reproduction control information for reproducing the MIDI format BGM + simulated singing voice data generated by the MIDI generating means, and the singing voice extracting means. And PCM reproduction control information for reproducing the singing voice data in the PCM format generated by the above in synchronization with the simulated singing voice data.

また、本発明の楽曲ファイル生成方法は、歌声と当該歌声以外の音声とが混合して成るデジタル音声データから上記歌声を抽出し、PCM形式の歌声データを得る第1のステップと、MIDI形式のBGMデータを生成する第2のステップと、上記第1のステップで抽出した歌声に合わせてMIDI形式の模擬歌声データを生成し、上記第2のステップで生成したBGMデータに対して上記模擬歌声データを付加してMIDIデータの調整を行う第3のステップと、上記第1のステップで生成されたPCM形式の歌声データと上記第3のステップで調整が行われたMIDI形式のBGM+模擬歌声データとを1つの楽曲ファイルに加工する第4のステップとを有することを特徴とする。   The music file generating method according to the present invention further includes a first step of extracting the singing voice from digital voice data obtained by mixing a singing voice and a voice other than the singing voice to obtain PCM format singing voice data; A second step of generating BGM data; generating simulated singing voice data in MIDI format in accordance with the singing voice extracted in the first step; and simulating the singing voice data with respect to the BGM data generated in the second step. A third step of adjusting the MIDI data by adding the singing voice data, the PCM-format singing voice data generated in the first step, the MIDI-format BGM + simulated singing voice data adjusted in the third step, and Into a single music file.

本発明の他の態様では、上記第1のステップでは、上記歌声と当該歌声以外の音声とが混合して成るデジタル音声データに対して、上記歌声に対応する所定の周波数帯域まで帯域制限する処理を行うことを特徴とする。   In another aspect of the present invention, in the first step, a process of band-limiting digital voice data composed of a mixture of the singing voice and voices other than the singing voice to a predetermined frequency band corresponding to the singing voice. Is performed.

本発明の他の態様では、上記第4のステップでは、上記第2のステップで生成されたPCM形式の歌声データと、上記第3のステップで生成されたMIDI形式のBGM+模擬歌声データとの再生タイミングを同期させる調整処理を行うことを特徴とする。   In another aspect of the present invention, in the fourth step, the singing voice data in the PCM format generated in the second step and the BGM + simulated singing voice data in the MIDI format generated in the third step are reproduced. An adjustment process for synchronizing timing is performed.

本発明の他の態様では、上記第4のステップで生成される楽曲ファイルは、上記第3のステップで生成されたMIDI形式のBGM+模擬歌声データを再生するためのMIDI再生制御情報と、上記第2のステップで生成されたPCM形式の歌声データを上記模擬歌声データに同期させて再生するためのPCM再生制御情報とを含むことを特徴とする。   In another aspect of the present invention, the music file generated in the fourth step includes MIDI reproduction control information for reproducing the MIDI format BGM + simulated singing voice data generated in the third step; PCM reproduction control information for reproducing the PCM format singing voice data generated in step 2 in synchronization with the simulated singing voice data.

また、本発明のコンピュータ読み取り可能な記録媒体は、PCM形式の歌声データから成るPCMデータと、MIDI形式のBGMデータに対して、上記PCMデータの歌声に合わせて生成されたMIDI形式の模擬歌声データが付加されたMIDIデータとを含み、上記PCMデータと上記MIDIデータとが1つのファイルに統合されて成るデータ構造を有する楽曲ファイルが記録されたことを特徴とする。   Further, the computer readable recording medium of the present invention is a computer readable singing voice data in the MIDI format generated according to the singing voice of the PCM data with respect to the PCM data including the singing voice data in the PCM format and the BGM data in the MIDI format. And music data having a data structure in which the PCM data and the MIDI data are integrated into one file.

本発明の他の態様では、上記楽曲ファイルは、上記MIDIデータを再生するためのMIDI再生制御情報と、上記PCMデータを上記MIDIデータに同期させて再生するためのPCM再生制御情報とを含むことを特徴とする。   In another aspect of the present invention, the music file includes MIDI playback control information for playing back the MIDI data, and PCM playback control information for playing back the PCM data in synchronization with the MIDI data. It is characterized by.

以上説明したように本発明によれば、現行の携帯電話機種の着信音に関するファイル容量の制限範囲内に収まる程度まで楽曲ファイルのデータ量を削減することができるとともに、再生音声の品質も所定レベル以上に維持することができる。これにより、大容量のメモリやMP3デコーダ等を備えていない現行の携帯電話機種でも着うたのサービスが利用できるようにすることができる。   As described above, according to the present invention, it is possible to reduce the data amount of the music file to the extent that it falls within the limited range of the file capacity for the ringtone of the current mobile phone type, and the quality of the reproduced sound is also at a predetermined level. The above can be maintained. As a result, it is possible to use the ringtone service even with the current mobile phone type that does not include a large-capacity memory, an MP3 decoder, and the like.

以下、本発明の一実施形態を図面に基づいて説明する。
図1は、本実施形態に係る楽曲ファイル生成システムの一構成例を示す図である。図1に示すように、本実施形態の楽曲ファイル生成システム100は、録音部1、歌声抽出部2、BGM生成部3、MIDI調整部4およびファイル生成部5を備えて構成されている。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
FIG. 1 is a diagram illustrating a configuration example of a music file generation system according to the present embodiment. As shown in FIG. 1, the music file generation system 100 of the present embodiment includes a recording unit 1, a singing voice extraction unit 2, a BGM generation unit 3, a MIDI adjustment unit 4, and a file generation unit 5.

録音部1は、CD(Compact Disc)やDVD(Digital Versatile Disk)等のデジタル音源データをコンピュータのハードディスク等にWAV形式で録音するものである。例えば、市販のCDをパーソナルコンピュータ(以下、パソコン)のCDドライブにセットし、パソコン内蔵のハードディスクに録音することにより、WAV形式のデジタル音源データ11を得ることができる。   The recording unit 1 records digital sound source data such as a CD (Compact Disc) and a DVD (Digital Versatile Disk) on a hard disk or the like of a computer in a WAV format. For example, by setting a commercially available CD in a CD drive of a personal computer (hereinafter, a personal computer) and recording the data on a hard disk built in the personal computer, the digital sound source data 11 in the WAV format can be obtained.

なお、WAV形式は、Windows(登録商標)標準の音声ファイル形式であり、WAVE形式とも呼ばれる。デジタル音声信号を記録するための保存形式として規定されている。圧縮方式は任意のものを利用することが可能である。デフォルトではPCM(無圧縮)方式やADPCM(Adaptive Differential Pulse Code Modulation)方式などの圧縮方式に対応している。   The WAV format is a Windows (registered trademark) standard audio file format, and is also called a WAVE format. It is defined as a storage format for recording digital audio signals. Any compression method can be used. By default, it supports compression methods such as the PCM (no compression) method and the ADPCM (Adaptive Differential Pulse Code Modulation) method.

歌声抽出部2は、人間の歌声とBGMとが混合しているWAV形式のデジタル音源データ11から所望の数小節分(例えば、楽曲の先頭部分やサビ部分)を切り出し、それからBGMを廃棄して人間の歌声の部分だけを抽出する。このとき、携帯電話に実装されている再生形式に従って、WAV形式のデジタル音源データ11をADPCM形式の歌声データ12に変換する。   The singing voice extracting section 2 cuts out a desired few measures (for example, the beginning or climax part of a music piece) from the WAV format digital sound source data 11 in which human singing voice and BGM are mixed, and then discards the BGM. Extract only the human singing voice part. At this time, the digital audio data 11 in the WAV format is converted into the singing voice data 12 in the ADPCM format according to the reproduction format implemented in the mobile phone.

具体的には、例えばCDであれば44.1KHzでサンプリングされたデジタル音源データ11に対して、人間の歌声に対応する所定の周波数帯域(4KHzまたは8KHz)まで帯域制限する処理を行う。すなわち、4KHzまたは8KHzに相当する一定時間ごとにデジタル音源データ11をサンプリングする。単なるサンプリングではPCM形式となるが、ここでは更に音が連続的に変化すること利用して、直前のサンプリングデータとの差を記録することによってデータ量を減らす。これがADPCM形式である。   Specifically, for example, in the case of a CD, the digital sound source data 11 sampled at 44.1 KHz is subjected to band limitation up to a predetermined frequency band (4 KHz or 8 KHz) corresponding to a human singing voice. That is, the digital sound source data 11 is sampled at regular intervals corresponding to 4 KHz or 8 KHz. Although the PCM format is used for simple sampling, the amount of data is reduced by recording the difference from the immediately preceding sampled data by utilizing the fact that the sound continuously changes. This is the ADPCM format.

BGM生成部3は、MIDI形式のBGMデータ13を生成するものである。ここでは、例えばパソコンにMIDI音源を備え、当該パソコンにインストールされたシーケンスソフトと呼ばれるアプリケーションプログラムを利用して、DTM(Desk Top Music)によりBGMを生成する。ここで生成するBGMデータ13は、歌声抽出部2で廃棄した部分に相当するBGMである。なお、DTMはMIDIデータの生成法の一例であり、本発明はこの生成法に限定されるものではない。   The BGM generation unit 3 generates BGM data 13 in the MIDI format. Here, for example, a personal computer is provided with a MIDI sound source, and BGM is generated by DTM (Desk Top Music) using an application program called sequence software installed in the personal computer. The BGM data 13 generated here is BGM corresponding to the portion discarded by the singing voice extraction unit 2. Note that DTM is an example of a method of generating MIDI data, and the present invention is not limited to this method.

歌声抽出部2で抽出した歌声データ12と、BGM生成部3で生成したBGMデータ13とを合わせれば、CD等のデジタル音源と同じ元の楽曲ができる。歌声データ12は元のデジタル音源データ11を大幅に帯域制限して生成したものであり、データ量はかなり削減されている。また、BGMデータ13はMIDI形式なので、元々データ量は少ない。よって、単にCD音源から一部を切り出してMP3形式で圧縮したデータに比べて、データ量は格段に少なくなっている。   If the singing voice data 12 extracted by the singing voice extraction unit 2 and the BGM data 13 generated by the BGM generation unit 3 are combined, the same original music as a digital sound source such as a CD can be created. The singing voice data 12 is generated by greatly band-limiting the original digital sound source data 11, and the data amount is considerably reduced. Further, since the BGM data 13 is in the MIDI format, the data amount is originally small. Therefore, the data amount is much smaller than that of data simply cut out from a CD sound source and compressed in the MP3 format.

ただし、歌声抽出部2により抽出した歌声データ12には劣化が生じており、そのまま再生しても殆ど人間の声として認識できない。サンプリング周波数を大きくすれば劣化を抑制できるが、歌声データ12のデータ量が大きくなってしまう。そこで本実施形態では、人間の歌声をMIDIデータによってブーストさせることで、歌声データ12のデータ量の肥大化を回避しながら、出力される歌声の品質を一定レベル以上に維持する手法をとっている。そのために利用するのがMIDI調整部4である。   However, the singing voice data 12 extracted by the singing voice extraction unit 2 is deteriorated, and can be hardly recognized as a human voice even if reproduced as it is. Although the deterioration can be suppressed by increasing the sampling frequency, the data amount of the singing voice data 12 increases. Therefore, in the present embodiment, a method is used in which the quality of the output singing voice is maintained at a certain level or more while boosting the singing voice of the human with MIDI data, thereby avoiding an increase in the data amount of the singing voice data 12. . The MIDI adjusting unit 4 is used for that purpose.

MIDI調整部4では、歌声抽出部2で抽出した歌声の音程やテンポ、音色、音量などに合わせて、当該歌声を模擬したMIDI形式の模擬歌声データを生成する。そして、この模擬歌声データをBGMデータに付加してMIDIデータの調整を行う。このMIDIデータの調整も、例えばDTMにより行う。   The MIDI adjusting unit 4 generates simulated singing voice data in the MIDI format that simulates the singing voice in accordance with the pitch, tempo, tone, volume, etc. of the singing voice extracted by the singing voice extracting unit 2. Then, the simulated singing voice data is added to the BGM data to adjust the MIDI data. The adjustment of the MIDI data is also performed by, for example, DTM.

ここで生成した模擬歌声データを単独で再生しても、人間の歌声には聞こえない。しかし、歌声抽出部2により抽出された歌声データ12と同時に再生すると、ADPCM形式の歌声データ12で劣化した部分がMIDI形式の模擬歌声データによってきれいに補われ、人間の歌声として良好に聞こえるようになる。   Even if the simulated singing voice data generated here is reproduced alone, it cannot be heard as a human singing voice. However, when played back simultaneously with the singing voice data 12 extracted by the singing voice extracting unit 2, the portion degraded by the singing voice data 12 in the ADPCM format is complemented by the simulated singing voice data in the MIDI format, and can be heard well as human singing voice. .

ファイル生成部5は、歌声抽出部2で生成されたADPCM形式の歌声データ12と、MIDI調整部4で調整が行われたMIDI形式のBGM+模擬歌声データ14とを1つの楽曲ファイル15に加工する処理を行う。ここで生成する楽曲ファイル15は、携帯電話のキャリア独自のフォーマットに合わせて書き出したものである。例えばドコモ社の場合、MFi(Melody Format for i-mode:i-modeは登録商標)に従ってMLD形式の楽曲ファイル15を生成する。   The file generation unit 5 processes the singing voice data 12 in ADPCM format generated by the singing voice extraction unit 2 and the BGM + simulated singing voice data 14 in MIDI format adjusted by the MIDI adjustment unit 4 into one music file 15. Perform processing. The music file 15 generated here is written out according to a format unique to the carrier of the mobile phone. For example, in the case of DOCOMO, the music file 15 in the MLD format is generated according to MFi (Melody Format for i-mode: i-mode is a registered trademark).

上述のように、ADPCMの歌声データ12とMIDIの模擬歌声データとをずれなく同時に再生することが重要である。したがって、MLD形式の楽曲ファイル15を生成する際には、歌声データ12とBGM+模擬歌声データ14との再生タイミングを同期させる調整を行う。具体的には、MLDフォーマットで定義されているバイナリの演奏位置情報(演奏の開始位置と終了位置、発音時間など)を、歌声データ12とBGM+模擬歌声データ14との双方について適切に設定する。   As described above, it is important to reproduce the singing voice data 12 of ADPCM and the simulated singing voice data of MIDI at the same time without deviation. Therefore, when generating the music file 15 in the MLD format, an adjustment is made to synchronize the reproduction timing of the singing voice data 12 and the BGM + simulated singing voice data 14. Specifically, binary performance position information (start position and end position of performance, sounding time, etc.) defined in the MLD format is appropriately set for both the singing voice data 12 and the BGM + simulated singing voice data 14.

以上のように構成した楽曲ファイル生成システム100の各機能ブロック1〜5は、実際にはコンピュータのCPUあるいはMPU、RAM、ROMなどを備えて構成され、RAMやROMに記憶されたプログラムが動作することによって実現できる。   Each of the functional blocks 1 to 5 of the music file generation system 100 configured as described above is actually configured to include a CPU or an MPU, a RAM, a ROM, and the like of a computer, and a program stored in the RAM or the ROM operates. This can be achieved by:

図2は、楽曲ファイル15のデータ構造をイメージ的に示す概念図である。一般的にMLDファイルは、ファイルそのものの識別子を含むファイルヘッダ部、ファイルのデータについての情報を含むデータインフォメーション部、楽曲の実データを含むトラック部の3つを有しているが、図2はトラック部の構造を模擬的に示している。   FIG. 2 is a conceptual diagram conceptually showing the data structure of the music file 15. Generally, an MLD file has three parts: a file header part containing an identifier of the file itself, a data information part containing information on data of the file, and a track part containing actual music data. 4 schematically shows the structure of a track portion.

図2に示すように、楽曲ファイル15は、ADPCM形式の歌声データ12とMIDI形式のBGM+模擬歌声データ14とを含んでいる。図2において、横軸は時間方向を示し、ハッチングを付した部分がそれぞれBGM21、模擬歌声22、歌声23の再生タイミングを表している。この図2の例では、MIDIのBGM21は最初から最後まで一貫して流れ、その途中の2箇所でMIDIの模擬歌声22が流れる。この模擬歌声22が流れるのと同時に、ADPCMの歌声23も流れる、というイメージを示している。   As shown in FIG. 2, the music file 15 includes singing voice data 12 in ADPCM format and BGM + simulated singing voice data 14 in MIDI format. In FIG. 2, the horizontal axis indicates the time direction, and the hatched portions indicate the reproduction timing of the BGM 21, the simulated singing voice 22, and the singing voice 23, respectively. In the example of FIG. 2, the MIDI BGM 21 flows continuously from the beginning to the end, and the MIDI singing voice 22 flows at two points in the middle. The image shows that the singing voice 23 of ADPCM also flows at the same time as the simulated singing voice 22 flows.

MIDI形式のBGM+模擬歌声データ14は、BGM21の部分と模擬歌声22の部分とが別々のMIDIデータとして生成されていても良いし、1つのMIDIデータとして生成されていても良い。前者の場合は、BGM21の演奏位置情報と模擬歌声22の演奏位置情報とを別個に設定する。後者の場合は、BGM21と模擬歌声22とが和音データとして定義される。すなわち、模擬歌声22が流れないタイミングではBGM21だけの和音、模擬歌声22が流れるタイミングではBGM21と模擬歌声22とを合わせた和音として1つのMIDIデータが定義される。この場合は、当該1つのMIDIデータに対して演奏位置情報を設定する。   In the BGM + simulated singing voice data 14 in the MIDI format, the portion of the BGM 21 and the portion of the simulated singing voice 22 may be generated as separate MIDI data, or may be generated as one piece of MIDI data. In the former case, the performance position information of the BGM 21 and the performance position information of the simulated singing voice 22 are set separately. In the latter case, the BGM 21 and the simulated singing voice 22 are defined as chord data. That is, one MIDI data is defined as a chord of the BGM 21 only at a timing when the simulated singing voice 22 does not flow, and as a chord combining the BGM 21 and the simulated singing voice 22 at a timing at which the simulated singing voice 22 flows. In this case, performance position information is set for the one MIDI data.

一方、ADPCM形式の歌声データ12に関しては、歌声23が模擬歌声22と同時に流れるように、歌声23の演奏位置情報を設定する。   On the other hand, with respect to the singing voice data 12 in the ADPCM format, the performance position information of the singing voice 23 is set so that the singing voice 23 flows simultaneously with the simulated singing voice 22.

このように、本実施形態の楽曲ファイル15は、MIDI形式のBGM+模擬歌声データ14を適切なタイミングで再生するために必要なMIDI再生制御情報と、ADPCM形式の歌声データ12をBGM+模擬歌声データ14に同期させて適切なタイミングで再生するために必要なPCM再生制御情報とを含んで構成されている。   As described above, the music file 15 of the present embodiment includes the MIDI reproduction control information necessary for reproducing the BGM + simulated singing voice data 14 in the MIDI format at an appropriate timing, and the singing voice data 12 in the ADPCM format as the BGM + simulated singing voice data 14. And PCM reproduction control information necessary for reproducing at an appropriate timing in synchronization with.

図3は、本実施形態による楽曲ファイル生成方法の処理手順を示すフローチャートである。図3において、まず録音部1により、CDやDVD等のデジタル音源データ11をコンピュータのハードディスク等にWAV形式で録音する(ステップS1)。次に歌声抽出部2により、録音したWAV形式のデジタル音源データ11から所望の一部分(楽曲の先頭部分やサビ部分など)を切り出す(ステップS2)。切り出す部分は1箇所に限らず、複数箇所でも良い。また、切り出した複数箇所を連結して1つにまとめても良い。   FIG. 3 is a flowchart illustrating a processing procedure of the music file generation method according to the present embodiment. In FIG. 3, the recording section 1 first records digital sound source data 11 such as a CD or DVD on a hard disk or the like of a computer in a WAV format (step S1). Next, the singing voice extracting unit 2 cuts out a desired portion (such as a head portion or a chorus portion) of the recorded WAV format digital sound source data 11 (step S2). The cut-out portion is not limited to one location, but may be a plurality of locations. Also, a plurality of cut out portions may be connected to be combined into one.

この切り出し処理は、キーボードやマウス等を用いて成されたユーザからの指示に従って行うようにしても良いし、コンピュータが自動的に行うようにしても良い。コンピュータが自動的に行う場合、例えば楽曲の先頭部分を切り出す際には、切り出す小節数を指示することにより、該当する部分を自動的に切り出すことが可能である。また、サビ部分を切り出す際には、バックコーラスの開始、音量の変化、曲調の変化などを検出することによってサビ部分を予測し、これを自動的に切り出すようにすることが可能である。   This cutout process may be performed according to a user's instruction made using a keyboard, a mouse, or the like, or may be automatically performed by a computer. When the computer automatically performs, for example, when cutting out the beginning of a song, it is possible to automatically cut out the corresponding portion by designating the number of measures to be cut out. Further, when cutting out the rust portion, it is possible to predict the rust portion by detecting the start of the back chorus, a change in volume, a change in tune, and the like, and to cut out the rust portion automatically.

歌声抽出部2は更に、切り取ったデジタル音源データ11に対して、人間の歌声に対応する所定の周波数帯域(4KHzまたは8KHz)まで帯域制限する処理を行うことにより、BGMを廃棄して人間の歌声だけを抽出する(ステップS3)。これにより、ADPCM形式の歌声データ12を生成する。なお、切り出し処理をユーザからの指示に基づいて行う場合は、ステップS2とステップS3の処理は順番が逆でも良い。   The singing voice extracting unit 2 further performs a process of band-limiting the cut-out digital sound source data 11 to a predetermined frequency band (4 KHz or 8 KHz) corresponding to a human singing voice, thereby discarding the BGM and discarding the human singing voice. Is extracted (step S3). Thereby, the singing voice data 12 in the ADPCM format is generated. When the cutout process is performed based on an instruction from the user, the order of steps S2 and S3 may be reversed.

また、BGM生成部3において、歌声抽出部2で廃棄した部分に相当するBGMデータ13を、例えばDTMによりMIDI形式で生成する(ステップS4)。MIDI形式のBGMデータ13は、携帯電話の各機種の内蔵音源に依存するところが大きい。そのため、MML(Music Markup Language)にて機種毎に表現方法を調整する(ステップS5)。次に、MIDI調整部4において、歌声抽出部2で抽出した歌声を模擬したMIDI形式の模擬歌声データを生成し、BGMデータに付加してMIDIデータの調整を行う(ステップS6)。なお、ステップS1〜S3の処理と、ステップS4〜S6の処理とは順番が逆でも良い。   The BGM generator 3 generates BGM data 13 corresponding to the portion discarded by the singing voice extractor 2 in the MIDI format by, for example, DTM (step S4). The BGM data 13 in the MIDI format largely depends on the built-in sound source of each model of the mobile phone. Therefore, the expression method is adjusted for each model in MML (Music Markup Language) (step S5). Next, the MIDI adjustment unit 4 generates simulated singing voice data in the MIDI format that simulates the singing voice extracted by the singing voice extraction unit 2, adds the simulated singing voice data to the BGM data, and adjusts the MIDI data (step S6). Note that the order of the processing of steps S1 to S3 and the processing of steps S4 to S6 may be reversed.

最後に、ファイル生成部5により、ステップS1〜S3で生成されたADPCM形式の歌声データ12と、ステップS4〜S6で生成されたMIDI形式のBGM+模擬歌声データ14とを1つの楽曲ファイル15に加工する(ステップS7)。ここでは、携帯電話のキャリアのフォーマットに合わせてバイナリデータでファイルを書き出す。上述の例ではドコモ社のMLD形式について説明したが、au社であればPMD形式、Jフォン社であればSMD形式に合わせて楽曲ファイル15を生成する。1つの楽曲について複数キャリアの楽曲ファイル15を生成しても良い。   Lastly, the file generation unit 5 processes the singing voice data 12 in ADPCM format generated in steps S1 to S3 and the BGM + simulated singing voice data 14 in MIDI format generated in steps S4 to S6 into one music file 15. (Step S7). Here, a file is written in binary data according to the format of the carrier of the mobile phone. In the above example, the MLD format of DoCoMo was described, but the music file 15 is generated according to the PMD format for au, and the SMD format for J-phone. A music file 15 of a plurality of carriers may be generated for one music.

図4は、上述のようにして生成した楽曲ファイル15を利用した本実施形態に係る音楽配信システムの構成例を示す図である。図4において、300は楽曲ファイル15の配信を行う音楽配信サーバ、400は楽曲ファイル15の配信を受ける携帯電話であり、これらはインターネット500に接続可能とされている。   FIG. 4 is a diagram illustrating a configuration example of a music distribution system according to the present embodiment using the music file 15 generated as described above. In FIG. 4, reference numeral 300 denotes a music distribution server that distributes the music file 15, and 400 denotes a mobile phone that receives the distribution of the music file 15, which can be connected to the Internet 500.

図4に示すように、音楽配信サーバ300は、楽曲ファイル取得部31、再生プログラム取得部32、顧客情報取得部33、データベース(DB)登録部34、配信楽曲DB35、配信プログラムDB36、顧客DB37、カプセル化部38、顧客情報参照部39および通信部40を備えて構成されている。   As shown in FIG. 4, the music distribution server 300 includes a music file acquisition unit 31, a reproduction program acquisition unit 32, a customer information acquisition unit 33, a database (DB) registration unit 34, a distribution music DB 35, a distribution program DB 36, a customer DB 37, It comprises an encapsulation unit 38, a customer information reference unit 39, and a communication unit 40.

楽曲ファイル取得部31は、楽曲ファイル生成システム100により生成された楽曲ファイル15を音楽配信サーバ300内に取得するものである。再生プログラム取得部32は、再生プログラム生成システム200によって生成された音楽再生プログラム(音楽再生プレーヤ)を音楽配信サーバ300内に取得するものである。   The music file acquisition unit 31 acquires the music file 15 generated by the music file generation system 100 into the music distribution server 300. The reproduction program acquisition section 32 acquires the music reproduction program (music reproduction player) generated by the reproduction program generation system 200 into the music distribution server 300.

これらの楽曲ファイル取得部31および再生プログラム取得部32では、具体的には、CDやフレキシブルディスク等の記録媒体を介して楽曲ファイル15や音楽再生プログラムを音楽配信サーバ300内に取り込んだり、インターネット500あるいはその他のネットワーク(図示せず)を介して楽曲ファイル15や音楽再生プログラムを音楽配信サーバ300内に取り込んだりする。   More specifically, the music file acquisition unit 31 and the reproduction program acquisition unit 32 import the music file 15 and the music reproduction program into the music distribution server 300 via a recording medium such as a CD or a flexible disk, or use the Internet 500 Alternatively, the music file 15 and the music reproduction program are loaded into the music distribution server 300 via another network (not shown).

音楽再生プログラムは、楽曲ファイル15に記録されている演奏位置情報に従ってBGM21、模擬歌声22、歌声23の演奏を指示するためのものである。これは、携帯電話内蔵のシンセサイザに対してADPCM形式の歌声データ12の演奏を指示するPCM再生制御プログラムと、シンセサイザに対してMIDI形式のBGM+模擬歌声データ14の演奏を指示するMIDI再生制御プログラムとを含んでいる。この音楽再生プログラムも、携帯電話の各キャリアが持つ仕様の違いに合わせて作り込まれる。   The music reproduction program is for instructing the performance of the BGM 21, the simulated singing voice 22, and the singing voice 23 in accordance with the performance position information recorded in the music file 15. The PCM playback control program instructs the synthesizer built in the mobile phone to play the singing voice data 12 in the ADPCM format, the MIDI playback control program instructs the synthesizer to play the BGM + simulated singing voice data 14 in the MIDI format. Contains. This music playback program is also tailored to the differences in the specifications of each mobile phone carrier.

顧客情報取得部33は、顧客に関する各種の情報(例えば氏名、ユーザID、パスワード、顧客が使用している携帯電話400のキャリアや機種など)を取得するものである。具体的には、ユーザが携帯電話400からインターネット500を介して音楽配信サーバ300に最初にアクセスしてきたときに、ユーザに対して情報入力を要求する(例えば、情報入力画面を提示する)ことによって、必要な顧客情報を取得する。   The customer information acquisition unit 33 acquires various information about the customer (for example, name, user ID, password, carrier and model of the mobile phone 400 used by the customer). Specifically, when the user first accesses the music distribution server 300 from the mobile phone 400 via the Internet 500, the user requests information input (for example, presents an information input screen). , Get the required customer information.

DB登録部34は、楽曲ファイル取得部31により取得された様々な仕様に対応する楽曲ファイル15を、着うた用の楽曲データファイルとして配信楽曲DB35に登録する。また、再生プログラム取得部32により取得された様々な仕様に対応する音楽再生プログラムを配信プログラムDB36に登録する。また、顧客情報取得部33により取得された顧客情報を顧客DB37に登録する。配信楽曲DB35は、本発明の記録媒体を構成する。   The DB registration unit 34 registers the music files 15 corresponding to various specifications acquired by the music file acquisition unit 31 in the distribution music DB 35 as music data files for ringing songs. In addition, music playback programs corresponding to various specifications acquired by the playback program acquisition unit 32 are registered in the distribution program DB 36. In addition, the customer information acquired by the customer information acquisition unit 33 is registered in the customer DB 37. The distribution music DB 35 constitutes a recording medium of the present invention.

カプセル化部38は、ユーザからの配信要求に応じて、そのユーザが使用している携帯電話400のキャリアと機種に対応する楽曲ファイル15を配信楽曲DB35から読み出すとともに、当該携帯電話400のキャリアと機種に対応する音楽再生プログラムを配信プログラムDB36から読み出して、それらをカプセル化してコンカチファイルを作成する。顧客情報参照部39は、ユーザから楽曲の配信要求があったときに、顧客DB37を参照することによって要求元のユーザが使用している携帯電話400のキャリアと機種を把握し、カプセル化部38に伝える処理を行う。   In response to the distribution request from the user, the encapsulation unit 38 reads the music file 15 corresponding to the carrier and model of the mobile phone 400 used by the user from the distribution music DB 35, and reads the music file 15 with the carrier of the mobile phone 400. The music reproduction program corresponding to the model is read from the distribution program DB 36, and the music reproduction program is encapsulated to create a concatenation file. When there is a music distribution request from the user, the customer information reference unit 39 refers to the customer DB 37 to grasp the carrier and model of the mobile phone 400 used by the requesting user, and the encapsulation unit 38 Perform the process of telling

カプセル化は、楽曲ファイル15のバイナリデータと音楽再生プログラムのバイナリデータとを一緒にして単一のファイルとする処理であり、生成されたオブジェクトが自己完結型で一元管理されるJava(登録商標)のクラス配信処理を利用して、電話の着信時にプログラムの起動が掛かる仕組みとして実装する。なお、楽曲ファイル15に音楽再生プログラムをカプセル化する方法としては、楽曲配信の要求があった時点で動的に組み合わせを行う方法と、事前のバッチ処理で静的な組み合わせをあらかじめ用意する方法とがあり、本実施形態はその何れにも対応可能である。   Encapsulation is a process in which the binary data of the music file 15 and the binary data of the music reproduction program are combined into a single file, and the generated object is a self-contained, unified management of Java (registered trademark). Implement as a mechanism to start the program when a call arrives using the class distribution process of As a method of encapsulating the music reproduction program in the music file 15, there are a method of dynamically combining at the time of a music distribution request and a method of preparing a static combination in advance by batch processing in advance. This embodiment can deal with any of them.

また、配信するファイルは、Javaファイルに従った方式と、任意のファイルフォーマットを制定して自己ファイル再生のプロトコルに従った方式との何れを採ることも可能である。配信するファイルについて、物理的な分割構成は問題でなく、論理的な単一ファイル構成になっていることが必要である。論理的な単一性に関しては、実装環境を構築するプロセスが、ユーザが楽曲をダウンロードしているときの操作性において完結性を満たしていれば良い。   Further, the file to be distributed can adopt either a method according to a Java file or a method according to a protocol for reproducing an own file by establishing an arbitrary file format. Regarding the file to be distributed, the physical division configuration is not a problem, and it is necessary that the file be a logical single file configuration. Regarding logical unity, it is only necessary that the process of constructing the mounting environment satisfies the completeness in the operability when the user downloads the music.

通信部40は、インターネット500を介して携帯電話400との間で通信に関する処理を行う。例えば、携帯電話400から送られてくる顧客情報を顧客情報取得部33に伝える処理を行う。また、携帯電話400から送られてくる所望の楽曲の配信要求を受信し、それをカプセル化部38や顧客情報参照部39に伝える処理を行う。また、カプセル化部38により生成されたコンカチファイルを要求元の携帯電話400に配信する処理も行う。コンカチファイル中に含まれる楽曲ファイル15を記憶する携帯電話400内のメモリ(図示せず)も、本発明の記録媒体を構成する。   The communication unit 40 performs processing related to communication with the mobile phone 400 via the Internet 500. For example, a process of transmitting the customer information sent from the mobile phone 400 to the customer information acquisition unit 33 is performed. In addition, a process of receiving a distribution request of a desired music sent from the mobile phone 400 and transmitting the request to the encapsulation unit 38 and the customer information reference unit 39 is performed. Further, a process of distributing the concatenation file generated by the encapsulation unit 38 to the mobile phone 400 of the request source is also performed. A memory (not shown) in the mobile phone 400 that stores the music file 15 included in the concatenation file also constitutes a recording medium of the present invention.

以上に説明した音楽配信サーバ300内の各機能ブロック31〜34,38〜40は、CPUあるいはMPU、ROM、RAMなどを備えて構成される制御部(図示せず)によってその動作が制御されるようになっている。また、各DB35〜37は、例えばハードディスク等の記録媒体により構成されている。   The operation of each of the functional blocks 31 to 34, 38 to 40 in the music distribution server 300 described above is controlled by a control unit (not shown) including a CPU or an MPU, a ROM, a RAM, and the like. It has become. Each of the DBs 35 to 37 is configured by a recording medium such as a hard disk, for example.

次に、上記のように構成した本実施形態による音楽配信システムの動作を、図5のフローチャートを参照しながら説明する。図5は、音楽配信サーバ300における楽曲配信および顧客登録の動作を示すフローチャートである。   Next, the operation of the music distribution system according to the present embodiment configured as described above will be described with reference to the flowchart of FIG. FIG. 5 is a flowchart showing the operations of music distribution and customer registration in the music distribution server 300.

図5に示すように、音楽配信サーバ300内の図示しない制御部は、携帯電話400から通信部40に対してアクセスがあったかどうかを判定する(ステップS11)。携帯電話400からアクセスがあった場合、制御部は更に、その携帯電話400のユーザにパスワードが既に設定されているかどうかを判定する(ステップS12)。ここでは、パスワード入力を伴ってアクセスが行われたかどうかを判定する。   As shown in FIG. 5, a control unit (not shown) in music distribution server 300 determines whether or not mobile phone 400 has accessed communication unit 40 (step S11). If there is access from the mobile phone 400, the control unit further determines whether a password has already been set for the user of the mobile phone 400 (step S12). Here, it is determined whether or not access has been performed with password input.

そのユーザにパスワードが設定されていない場合、制御部は通信部40を用いて所定の情報入力画面を携帯電話400に提示することにより、ユーザに顧客情報の入力を促す。そして、これに対応して入力された顧客情報を顧客情報取得部33が取得し、DB登録部34が顧客DB37に登録する(ステップS13)。その後で制御部は、そのユーザに対して固有のパスワードを発行する(ステップS14)。   If a password has not been set for the user, the control unit uses the communication unit 40 to present a predetermined information input screen to the mobile phone 400, thereby prompting the user to input customer information. Then, the customer information acquisition unit 33 acquires the customer information input correspondingly, and the DB registration unit 34 registers the customer information in the customer DB 37 (step S13). After that, the control unit issues a unique password to the user (step S14).

上記ステップS12でユーザに既にパスワードが発行されていたと判断した場合(パスワード入力を伴ってアクセスが行われた場合)および上記ステップS14でパスワードが新たに発行された場合には、制御部はそのパスワードに関する承認処理を行う(ステップS15)。パスワードが間違っているような場合には、その旨の警告メッセージを出力して処理を中断する。   If it is determined in step S12 that a password has already been issued to the user (if access has been performed with password input) and if a new password has been issued in step S14, the control unit determines that password. An approval process is performed (step S15). If the password is incorrect, a warning message to that effect is output and the processing is interrupted.

一方、パスワードの承認が済んだ場合、制御部は、通信部40を用いて会員専用の音源メニュー画面を携帯電話400に提示する(ステップS16)。この音源メニュー画面を通じて、ユーザは自分が所望する楽曲のダウンロードを音楽配信サーバ300に要求することができる。制御部は、携帯電話400から所望の楽曲の配信要求が有ったか否かを判定し(ステップS17)、要求がない場合はステップS11の処理に戻る。   On the other hand, if the password has been approved, the control unit presents a member-specific sound source menu screen to the mobile phone 400 using the communication unit 40 (step S16). Through this sound source menu screen, the user can request the music distribution server 300 to download the desired music. The control unit determines whether or not there has been a request for distribution of the desired music from the mobile phone 400 (step S17), and if not, returns to the process of step S11.

楽曲の配信要求があった場合、顧客情報参照部39は、顧客DB37を参照することによって要求元の携帯電話400のキャリアと機種を把握し、それをカプセル化部38に伝える(ステップS18)。カプセル化部38は、顧客情報参照部39より伝えられたキャリアと機種に対応する音楽再生プログラムを配信プログラムDB36から読み出すとともに、ユーザから配信要求された楽曲で顧客情報参照部39より伝えられたキャリアと機種に対応する楽曲ファイル15を配信楽曲DB35から読み出して、それらをカプセル化してコンカチファイルを作成する(ステップS19)。   If there is a music distribution request, the customer information reference unit 39 grasps the carrier and model of the requesting mobile phone 400 by referring to the customer DB 37, and transmits it to the encapsulation unit 38 (step S18). The encapsulation unit 38 reads out the music reproduction program corresponding to the carrier and the model transmitted from the customer information reference unit 39 from the distribution program DB 36, and the carrier transmitted from the customer information reference unit 39 in the music requested to be distributed by the user. Then, the music file 15 corresponding to the model is read from the distribution music DB 35 and encapsulated to create a concatenation file (step S19).

最後に、カプセル化部38によって作成されたコンカチファイルを通信部40が携帯電話400に配信する(ステップS20)。このコンカチファイルを受信した携帯電話400では、その中に含まれている音楽再生プログラムによって楽曲ファイル15の再生を実行する。   Finally, the communication unit 40 distributes the concatenation file created by the encapsulation unit 38 to the mobile phone 400 (step S20). The mobile phone 400 that has received the concatenation file executes the reproduction of the music file 15 by the music reproduction program included therein.

以上詳しく説明したように、本実施形態によれば、CD等のデジタル音源を歌声部分とBGM部分とに分離し、歌声部分については大幅に帯域制限を行ってADPCM形式にすることによりデータ量を削減し、BGM部分についてはMIDI形式にてデータを生成することによりデータ量を削減した。これにより、CD音源等を単に切り取ってMP3形式で圧縮する従来の方式に比べて、データ量を格段に少なくすることができる。また、帯域制限を行うことによって劣化した歌声部分はMIDIデータによって補うようにしたので、再生される歌声の品質も所定レベル以上に維持することができる。   As described above in detail, according to the present embodiment, a digital sound source such as a CD is separated into a singing voice portion and a BGM portion, and the singing voice portion is largely band-limited to have an ADPCM format to reduce the data amount. The amount of data was reduced by generating data in the MIDI format for the BGM portion. As a result, the data amount can be remarkably reduced as compared with the conventional method in which a CD sound source or the like is simply cut out and compressed in the MP3 format. Further, since the singing voice portion degraded by the band limitation is compensated for by the MIDI data, the quality of the singing voice to be reproduced can be maintained at a predetermined level or more.

したがって、現行の携帯電話機種の着信音に関する制約事項であるファイル容量の制限(例えばドコモ社の場合は10Kbyte)を守りながら、一定レベル以上の品質が保証された着うた音声を携帯電話に配信して再生することが可能となる。すなわち、本実施形態によれば、大容量のメモリやMP3デコーダ等を備えていない現行の携帯電話機種でも着うたのサービスが利用できるようになる。   Therefore, while maintaining the file size limitation (for example, 10 Kbytes in the case of DoCoMo), which is a restriction on the ringtone of the current mobile phone type, ringtone voices whose quality is guaranteed to a certain level or higher are distributed to the mobile phone. It becomes possible to reproduce. That is, according to the present embodiment, the service of the ringing song can be used even with the current mobile phone type that does not include a large-capacity memory, an MP3 decoder, and the like.

なお、上記実施形態では、携帯電話の着信音用として楽曲ファイル15を生成する例について説明したが、必ずしも着信音用に限定されるものではない。小さいメモリ容量で歌声とBGMとから成る楽曲を再生する必要があるシステムに対しては、本実施形態の楽曲ファイル15を適用することが可能である。この場合に楽曲ファイル15を記憶する記録媒体としては、CD−ROM、フレキシブルディスク、ハードディスク、磁気テープ、光ディスク、光磁気ディスク、DVD、不揮発性メモリカード等を用いることができ、これらも本発明の記録媒体を構成する。   In the above-described embodiment, an example has been described in which the music file 15 is generated for a ringtone of a mobile phone, but the present invention is not necessarily limited to the case of generating a music file. The music file 15 of the present embodiment can be applied to a system that needs to reproduce music composed of singing voice and BGM with a small memory capacity. In this case, as a recording medium for storing the music file 15, a CD-ROM, a flexible disk, a hard disk, a magnetic tape, an optical disk, a magneto-optical disk, a DVD, a non-volatile memory card, and the like can be used. Construct a recording medium.

また、上記実施形態では、録音部1はCDやDVD等のデジタル音源データをコンピュータのハードディスク等にWAV形式で録音するものである例について説明したが、これに限定されない。例えば、カラオケボックスやゲームセンター等の娯楽施設でカラオケをバックにユーザが歌った歌声をマイクから入力してWAV形式で録音するものであっても良い。この場合、歌声だけでなく周囲の雑音も同時に録音されてしまうが、歌声抽出部2、BGM生成部3、MIDI調整部4、ファイル生成部5によって上記実施形態と同様の処理を行うことにより、ユーザ自身の歌声で雑音もない良好な着うたファイルを生成することができる。   Further, in the above-described embodiment, an example has been described in which the recording unit 1 records digital sound source data such as a CD or a DVD in a hard disk or the like of a computer in a WAV format, but is not limited thereto. For example, a singing voice sung by a user with a karaoke back at a recreation facility such as a karaoke box or a game center may be input from a microphone and recorded in a WAV format. In this case, not only the singing voice but also the surrounding noise is recorded at the same time, but the singing voice extracting unit 2, the BGM generating unit 3, the MIDI adjusting unit 4, and the file generating unit 5 perform the same processing as in the above embodiment, It is possible to generate a good ringing song file with no noise in the user's own singing voice.

この例において、録音部1の機能を備えた録音装置をカラオケボックスやゲームセンター等の娯楽施設に独立して設置し、歌声抽出部2、BGM生成部3、MIDI調整部4、ファイル生成部5の機能を当該録音装置とは別の編集用コンピュータが備えるようにすることが可能である。その場合、録音部1にて録音されたデータは、CD、フレキシブルディスク、ハードディスク、磁気テープ、光ディスク、光磁気ディスク、DVD、MD、不揮発性メモリカード等の記録媒体を介して編集用コンピュータに入力するようにしても良いし、インターネット等の通信ネットワークを介して録音装置から編集用コンピュータに送信するようにしても良い。生成した着うたファイルについても、通信ネットワークを介して編集用コンピュータからユーザの携帯電話に送信するようにしても良い。   In this example, a recording device having the function of the recording unit 1 is installed independently in an entertainment facility such as a karaoke box or a game center, and a singing voice extraction unit 2, a BGM generation unit 3, a MIDI adjustment unit 4, a file generation unit 5 Can be provided in an editing computer separate from the recording device. In this case, data recorded by the recording unit 1 is input to an editing computer via a recording medium such as a CD, a flexible disk, a hard disk, a magnetic tape, an optical disk, a magneto-optical disk, a DVD, an MD, and a nonvolatile memory card. The recording may be transmitted from the recording device to the editing computer via a communication network such as the Internet. The generated ringing song file may also be transmitted from the editing computer to the user's mobile phone via the communication network.

また、録音部1、歌声抽出部2、BGM生成部3、MIDI調整部4、ファイル生成部5の機能を全て備えた装置をカラオケボックスやゲームセンター等の娯楽施設に設置するようにしても良い。この場合、BGM生成部3は、歌声を録音する際にカラオケとして再生するMIDI形式のBGMデータをあらかじめ保持しておく機能に置き換えることが可能である。つまり、あらかじめ保持しておいたMIDI形式のBGMデータを歌声の録音の際に再生するとともに、同じBGMデータと録音音声から抽出した歌声データとを用いて着うたファイルを生成する。このときMIDI調整部4では、カラオケに合わせて録音された歌声の音程やテンポ、音色、音量などを解析し、その結果に合わせてMIDI形式の擬似歌声データを生成してBGMデータに付加する。   A device having all of the functions of the recording unit 1, the singing voice extracting unit 2, the BGM generating unit 3, the MIDI adjusting unit 4, and the file generating unit 5 may be installed in an entertainment facility such as a karaoke box or a game center. . In this case, the BGM generation unit 3 can be replaced with a function of holding MIDI-format BGM data to be reproduced as karaoke when recording a singing voice. That is, the BGM data in the MIDI format stored in advance is reproduced at the time of recording the singing voice, and a ringing song file is generated using the same BGM data and the singing voice data extracted from the recorded voice. At this time, the MIDI adjusting unit 4 analyzes the pitch, tempo, tone, volume, etc. of the singing voice recorded in accordance with the karaoke, generates MIDI-like pseudo singing voice data according to the analysis result, and adds the data to the BGM data.

その他、上記説明した実施形態は、本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその精神、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。   In addition, the above-described embodiment is merely an example of the embodiment for carrying out the present invention, and the technical scope of the present invention should not be interpreted in a limited manner. That is, the present invention can be embodied in various forms without departing from the spirit or main features thereof.

さらに、本発明の他の形態を以下にまとめて記載しておく。
1.楽曲ファイルをデータ配信サーバから要求元の端末に配信するデータ配信システムであって、
請求項1に記載の楽曲ファイル生成装置により生成された楽曲ファイルをあらかじめ蓄積しておくデータ蓄積手段と、
上記端末のそれぞれの仕様に対応する再生プログラムをあらかじめ蓄積しておく再生プログラム蓄積手段と、
上記要求元の端末から所望のデータの配信要求があったときに、上記データ蓄積手段から該当する楽曲ファイルを読み出すとともに、上記要求元の端末の仕様に対応する再生プログラムを上記再生プログラム蓄積手段から読み出して、上記楽曲ファイルと上記再生プログラムとを上記要求元の端末に送信する送信手段とを備えたことを特徴とするデータ配信システム。
2.上記送信手段は、上記楽曲ファイルと上記再生プログラムとを論理的に1つのファイルにカプセル化するカプセル化手段を含むことを特徴とする上記第1項に記載のデータ配信システム。
3.楽曲ファイルを要求元の端末に配信するデータ配信サーバであって、
請求項1に記載の楽曲ファイル生成装置により生成された楽曲ファイルを記憶するデータ記憶手段と、
上記端末のそれぞれの仕様に対応する再生プログラムを記憶する再生プログラム記憶手段と、
上記要求元の端末から所望のデータの配信要求があったときに、上記データ記憶手段から該当する楽曲ファイルを読み出すとともに、上記要求元の端末の仕様に対応する再生プログラムを上記再生プログラム記憶手段から読み出して、上記楽曲ファイルと上記再生プログラムとを上記要求元の端末に送信する送信手段とを備えたことを特徴とするデータ配信サーバ。
4.上記送信手段は、上記楽曲ファイルと上記再生プログラムとを論理的に1つのファイルにカプセル化するカプセル化手段を含むことを特徴とする上記第3項に記載のデータ配信サーバ。
Further, other embodiments of the present invention will be described below.
1. A data distribution system that distributes a music file from a data distribution server to a requesting terminal,
Data storage means for storing in advance a music file generated by the music file generation device according to claim 1;
Playback program storage means for storing in advance playback programs corresponding to the respective specifications of the terminal,
When there is a request for distribution of desired data from the requesting terminal, the corresponding music file is read from the data storage means, and a reproduction program corresponding to the specification of the requesting terminal is read from the reproduction program storage means. A data distribution system, comprising: transmission means for reading and transmitting the music file and the reproduction program to the requesting terminal.
2. 2. The data distribution system according to claim 1, wherein the transmission unit includes an encapsulation unit that logically encapsulates the music file and the reproduction program into one file.
3. A data distribution server that distributes a music file to a requesting terminal,
Data storage means for storing a music file generated by the music file generation device according to claim 1;
Reproduction program storage means for storing a reproduction program corresponding to each specification of the terminal,
When there is a request for distribution of desired data from the requesting terminal, the corresponding music file is read from the data storage means, and a reproduction program corresponding to the specification of the requesting terminal is read from the reproduction program storage means. A data distribution server, comprising: transmission means for reading and transmitting the music file and the reproduction program to the requesting terminal.
4. 4. The data distribution server according to claim 3, wherein the transmission unit includes an encapsulation unit that logically encapsulates the music file and the reproduction program into one file.

本発明は、大容量のメモリやMP3デコーダ等を備えていない現行の携帯電話機でも、歌声とBGMとから成る楽曲を着信音として利用できるようにするのに有用である。   INDUSTRIAL APPLICABILITY The present invention is useful for making a tune composed of a singing voice and BGM available as a ring tone even in a current mobile phone not provided with a large-capacity memory or an MP3 decoder.

本実施形態に係る楽曲ファイル生成システムの構成例を示す図である。It is a figure showing the example of composition of the music file generation system concerning this embodiment. 本実施形態に係る楽曲ファイルのデータ構造を示す概念図である。It is a conceptual diagram showing the data structure of the music file concerning this embodiment. 本実施形態による楽曲ファイル生成方法の処理手順を示すフローチャートである。It is a flowchart which shows the processing procedure of the music file generation method by this embodiment. 本実施形態による音楽配信システムの構成例を示す図である。It is a figure showing the example of composition of the music distribution system by this embodiment. 本実施形態による音楽配信サーバにおける楽曲配信および顧客登録の動作を示すフローチャートである。It is a flowchart which shows the operation | movement of music distribution and customer registration in the music distribution server by this embodiment.

符号の説明Explanation of reference numerals

1 録音部
2 歌声抽出部
3 BGM生成部
4 MIDI調整部
5 ファイル生成部
11 WAV形式のデジタル音源データ
12 ADPCM形式の歌声データ
13 MIDI形式のBGMデータ
14 MIDI形式のBGM+模擬歌声データ
15 MLD形式の楽曲ファイル
21 BGM
22 模擬歌声
23 歌声
31 楽曲ファイル取得部
32 再生プログラム取得部
33 顧客情報取得部
34 DB登録部
35 配信楽曲DB
36 配信プログラムDB
37 顧客DB
38 カプセル化部
39 顧客情報参照部
40 通信部
100 楽曲ファイル生成システム
200 再生プログラム生成システム
300 音楽配信サーバ
400 携帯電話
500 インターネット
Reference Signs List 1 recording unit 2 singing voice extracting unit 3 BGM generating unit 4 MIDI adjusting unit 5 file generating unit 11 digital sound source data in WAV format 12 singing voice data in ADPCM format 13 BGM data in MIDI format 14 BGM + simulated singing voice data in MIDI format 15 MLD format Music file 21 BGM
22 Simulated singing voice 23 Singing voice 31 Music file acquisition unit 32 Reproduction program acquisition unit 33 Customer information acquisition unit 34 DB registration unit 35 Distribution music DB
36 Distribution program DB
37 Customer DB
38 Encapsulation unit 39 Customer information reference unit 40 Communication unit 100 Music file generation system 200 Playback program generation system 300 Music distribution server 400 Mobile phone 500 Internet

Claims (13)

歌声と当該歌声以外の音声とが混合して成るデジタル音声データから上記歌声を抽出し、PCM形式の歌声データを得る歌声抽出手段と、
MIDI形式のBGMデータを生成するとともに、上記歌声抽出手段により抽出した歌声に合わせてMIDI形式の模擬歌声データを生成し、上記BGMデータに対して上記模擬歌声データを付加してMIDIデータの調整を行うMIDI生成手段と、
上記歌声抽出手段により生成されたPCM形式の歌声データと上記MIDI生成手段により生成されたMIDI形式のBGM+模擬歌声データとを1つの楽曲ファイルに加工するファイル生成手段とを備えたことを特徴とする楽曲ファイル生成装置。
Singing voice extracting means for extracting the singing voice from digital voice data composed of a mixture of a singing voice and a voice other than the singing voice and obtaining singing voice data in PCM format;
In addition to generating MIDI-format BGM data, it generates MIDI-format simulated singing data in accordance with the singing voice extracted by the singing voice extracting means, and adds the simulated singing data to the BGM data to adjust the MIDI data. MIDI generating means for performing;
File generating means for processing the singing voice data in the PCM format generated by the singing voice extracting means and the BGM + simulated singing voice data in the MIDI format generated by the MIDI generating means into one music file. Music file generation device.
上記歌声以外の音声はBGMであることを特徴とする請求項1に記載の楽曲ファイル生成装置。 The music file generation device according to claim 1, wherein the voice other than the singing voice is BGM. 上記歌声以外の音声は雑音であることを特徴とする請求項1に記載の楽曲ファイル生成装置。 The music file generating apparatus according to claim 1, wherein the voice other than the singing voice is noise. 上記歌声抽出手段は、上記歌声と上記歌声以外の音声とが混合して成るデジタル音声データに対して、上記歌声に対応する所定の周波数帯域まで帯域制限する処理を行うことを特徴とする請求項1に記載の楽曲ファイル生成装置。 The said singing voice extraction means performs the process which carries out band limitation to the predetermined frequency band corresponding to the said singing voice with respect to the digital voice data which mixed the said singing voice and the voice other than the said singing voice. 2. The music file generation device according to 1. 上記ファイル生成手段により生成される楽曲ファイルは、上記MIDI生成手段により生成されたMIDI形式のBGM+模擬歌声データを再生するためのMIDI再生制御情報と、上記歌声抽出手段により生成されたPCM形式の歌声データを上記模擬歌声データに同期させて再生するためのPCM再生制御情報とを含んで構成されることを特徴とする請求項1に記載の楽曲ファイル生成装置。 The music file generated by the file generating means includes MIDI reproduction control information for reproducing the MIDI-format BGM + simulated singing voice data generated by the MIDI generating means, and the PCM-format singing voice generated by the singing voice extracting means. The music file generating apparatus according to claim 1, further comprising PCM reproduction control information for reproducing data in synchronization with the simulated singing voice data. 歌声と当該歌声以外の音声とが混合して成るデジタル音声データから上記歌声を抽出し、PCM形式の歌声データを得る第1のステップと、
MIDI形式のBGMデータを生成する第2のステップと、
上記第1のステップで抽出した歌声に合わせてMIDI形式の模擬歌声データを生成し、上記第2のステップで生成したBGMデータに対して上記模擬歌声データを付加してMIDIデータの調整を行う第3のステップと、
上記第1のステップで生成されたPCM形式の歌声データと上記第3のステップで調整が行われたMIDI形式のBGM+模擬歌声データとを1つの楽曲ファイルに加工する第4のステップとを有することを特徴とする楽曲ファイル生成方法。
A first step of extracting the singing voice from digital voice data composed of a mixture of a singing voice and a voice other than the singing voice to obtain singing voice data in PCM format;
A second step of generating MIDI-format BGM data;
MIDI simulated singing data is generated in accordance with the singing voice extracted in the first step, and the simulated singing data is added to the BGM data generated in the second step to adjust the MIDI data. 3 steps,
A fourth step of processing the PCM-format singing voice data generated in the first step and the MIDI-format BGM + simulated singing data adjusted in the third step into one music file; A music file generation method characterized by the following.
上記歌声以外の音声はBGMであることを特徴とする請求項6に記載の楽曲ファイル生成方法。 7. The music file generation method according to claim 6, wherein the voice other than the singing voice is BGM. 上記歌声以外の音声は雑音であることを特徴とする請求項6に記載の楽曲ファイル生成方法。 The music file generating method according to claim 6, wherein the voice other than the singing voice is noise. 上記第1のステップでは、上記歌声と当該歌声以外の音声とが混合して成るデジタル音声データに対して、上記歌声に対応する所定の周波数帯域まで帯域制限する処理を行うことを特徴とする請求項6に記載の楽曲ファイル生成方法。 In the first step, band limiting is performed on digital audio data obtained by mixing the singing voice and voices other than the singing voice to a predetermined frequency band corresponding to the singing voice. Item 7. A music file generation method according to Item 6. 上記第4のステップでは、上記第2のステップで生成されたPCM形式の歌声データと、上記第3のステップで生成されたMIDI形式のBGM+模擬歌声データとの再生タイミングを同期させる調整処理を行うことを特徴とする請求項6に記載の楽曲ファイル生成方法。 In the fourth step, an adjustment process for synchronizing the reproduction timing of the PCM format singing voice data generated in the second step and the MIDI format BGM + simulated singing voice data generated in the third step is performed. 7. The music file generation method according to claim 6, wherein: 上記第4のステップで生成される楽曲ファイルは、上記第3のステップで生成されたMIDI形式のBGM+模擬歌声データを再生するためのMIDI再生制御情報と、上記第2のステップで生成されたPCM形式の歌声データを上記模擬歌声データに同期させて再生するためのPCM再生制御情報とを含むことを特徴とする請求項6に記載の楽曲ファイル生成方法。 The music file generated in the fourth step includes MIDI playback control information for reproducing the MIDI format BGM + simulated singing voice data generated in the third step, and the PCM generated in the second step. 7. The music file generation method according to claim 6, further comprising PCM reproduction control information for reproducing the singing voice data in a format synchronized with the simulated singing voice data. PCM形式の歌声データから成るPCMデータと、
MIDI形式のBGMデータに対して、上記PCMデータの歌声に合わせて生成されたMIDI形式の模擬歌声データが付加されたMIDIデータとを含み、
上記PCMデータと上記MIDIデータとが1つのファイルに統合されて成るデータ構造を有する楽曲ファイルが記録されたコンピュータ読み取り可能な記録媒体。
PCM data comprising singing voice data in PCM format;
MIDI data including MIDI data to which BGM data in the MIDI format and simulated singing data in the MIDI format generated according to the singing voice of the PCM data are added;
A computer-readable recording medium on which a music file having a data structure in which the PCM data and the MIDI data are integrated into one file is recorded.
上記楽曲ファイルは、上記MIDIデータを再生するためのMIDI再生制御情報と、上記PCMデータを上記MIDIデータに同期させて再生するためのPCM再生制御情報とを含むことを特徴とする請求項12に記載のコンピュータ読み取り可能な記録媒体。 13. The music file according to claim 12, wherein the music file includes MIDI reproduction control information for reproducing the MIDI data, and PCM reproduction control information for reproducing the PCM data in synchronization with the MIDI data. The computer-readable recording medium according to the above.
JP2004017202A 2003-03-24 2004-01-26 Music file generation apparatus, music file generation method, and recording medium Pending JP2004310054A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004017202A JP2004310054A (en) 2003-03-24 2004-01-26 Music file generation apparatus, music file generation method, and recording medium

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003081401 2003-03-24
JP2004017202A JP2004310054A (en) 2003-03-24 2004-01-26 Music file generation apparatus, music file generation method, and recording medium

Publications (1)

Publication Number Publication Date
JP2004310054A true JP2004310054A (en) 2004-11-04

Family

ID=33478144

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004017202A Pending JP2004310054A (en) 2003-03-24 2004-01-26 Music file generation apparatus, music file generation method, and recording medium

Country Status (1)

Country Link
JP (1) JP2004310054A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241123A (en) * 2006-03-10 2007-09-20 Pioneer Electronic Corp Apparatus, method and program for processing data, and recording medium
JP2008233247A (en) * 2007-03-16 2008-10-02 Yamaha Corp Distribution device and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241123A (en) * 2006-03-10 2007-09-20 Pioneer Electronic Corp Apparatus, method and program for processing data, and recording medium
JP2008233247A (en) * 2007-03-16 2008-10-02 Yamaha Corp Distribution device and program

Similar Documents

Publication Publication Date Title
US6093880A (en) System for prioritizing audio for a virtual environment
KR100496620B1 (en) Musical composition reproducing apparatus, portable terminal, musical composition reproducing method, and storage medium
KR101136974B1 (en) Playback apparatus and playback method
JP2002091440A (en) Performance information converting method and its device and recording medium and sound source device
JPH1173182A (en) System for forming, distributing, storing and executing music work file and method therefor
US7442870B2 (en) Method and apparatus for enabling advanced manipulation of audio
JP2010014823A (en) Musical piece information control device
KR100457052B1 (en) Song accompanying and music playing service system and method using wireless terminal
US20040193429A1 (en) Music file generating apparatus, music file generating method, and recorded medium
JP2004178496A (en) Data structure of multimedia file, file delivery method, file delivery device, and program
JP2004310054A (en) Music file generation apparatus, music file generation method, and recording medium
JP2011197344A (en) Server
WO2004010411A1 (en) Data distribution system and method, data distribution server, data distribution program, music composition file generation method, and recording medium
JP4213058B2 (en) Karaoke device that can output model vocals
JP2006154777A (en) Music generation system
JPWO2004010411A1 (en) Data distribution system and method
JP4595827B2 (en) Music playback device and data file production tool
JP3620467B2 (en) Communication terminal
KR102387273B1 (en) Ring-back tone service system and method based on speech synthesis
JP3178462B2 (en) Music data distribution device
JP2007079413A (en) Audio reproduction device, audio distribution system, audio reproduction program and authoring program
KR20030073914A (en) how to make a sound resource into handset bell sound by user editing himself
JP3675361B2 (en) Communication terminal
JP2003022072A (en) Portable communication terminal and server device
JP2004145236A (en) Method and system for distribution service of music data such as ringtone melody customizable by user

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060314

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060711