JP4595828B2 - Audio playback device - Google Patents

Audio playback device Download PDF

Info

Publication number
JP4595828B2
JP4595828B2 JP2006037629A JP2006037629A JP4595828B2 JP 4595828 B2 JP4595828 B2 JP 4595828B2 JP 2006037629 A JP2006037629 A JP 2006037629A JP 2006037629 A JP2006037629 A JP 2006037629A JP 4595828 B2 JP4595828 B2 JP 4595828B2
Authority
JP
Japan
Prior art keywords
data
audio
audio data
reproducing
multimedia file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006037629A
Other languages
Japanese (ja)
Other versions
JP2007219054A (en
Inventor
隆宏 川嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2006037629A priority Critical patent/JP4595828B2/en
Publication of JP2007219054A publication Critical patent/JP2007219054A/en
Application granted granted Critical
Publication of JP4595828B2 publication Critical patent/JP4595828B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、オーディオデータのストリーミング再生を行うオーディオ再生装置及びマルチメディアファイルのファイルフォーマットに関する。   The present invention relates to an audio playback apparatus that performs streaming playback of audio data and a file format of a multimedia file.

従来、映像や音声などのマルチメディアデータを再生する方法として、ダウンロード再生とストリーミング再生の二種類が知られている。ダウンロード再生とは、端末が通信回線からマルチメディアデータを全て引き出し、端末内部のメモリに蓄積した後に再生する方式である。   2. Description of the Related Art Conventionally, two types of download reproduction and streaming reproduction are known as methods for reproducing multimedia data such as video and audio. Download playback is a method in which a terminal pulls out all multimedia data from a communication line and stores it in a memory inside the terminal for playback.

圧縮オーディオデータとMIDI(Musical Instruments Digital Interface)データと画像データ、テキストデータとから構成されるフォーマットファイルは、このダウンロード再生によりユーザの端末に提供されている。   A format file composed of compressed audio data, MIDI (Musical Instruments Digital Interface) data, image data, and text data is provided to the user's terminal by this download reproduction.

一方、ストリーミング再生とは、端末が通信回線からマルチメディアデータを受信しながら同時に再生する方式である。ストリーミング再生の場合、最初にいくらかのデータをバッファメモリに蓄えておき、再生しつつ受信することでデータを確保していく。   On the other hand, streaming reproduction is a method in which a terminal simultaneously reproduces multimedia data received from a communication line. In the case of streaming reproduction, first, some data is stored in a buffer memory, and data is secured by receiving it while reproducing it.

図5はストリーミング再生を示す模式図であり、再生ポインタは端末で現在再生されているデータの位置を示すポインタであり、読み込みポインタは端末で通信回線から現在受信しているデータの位置を示すポインタである。   FIG. 5 is a schematic diagram showing streaming playback, where the playback pointer is a pointer indicating the position of data currently being played back on the terminal, and the read pointer is a pointer indicating the position of data currently being received from the communication line at the terminal. It is.

データを再生する速度よりもデータを読み込む速度の方が速ければ、読み込みポインタが常に再生ポインタよりも時間軸上で先に位置することになるため、ユーザはデータが蓄積されるのを待たずに、端末でマルチメディアデータを再生することができる。   If the data reading speed is faster than the data reproducing speed, the reading pointer will always be located on the time axis before the reproduction pointer, so the user does not wait for the data to accumulate. Multimedia data can be played on the terminal.

逆に、データを再生する速度よりもデータを読み込む速度の方が遅ければ、再生中に読み込みポインタが再生ポインタの位置へと接近した時点で、端末は再生に必要なデータをバッファメモリに蓄積する必要があり、この間マルチメディアファイルの再生は中断される。   On the other hand, if the data reading speed is slower than the data reproducing speed, the terminal stores data necessary for reproduction in the buffer memory when the reading pointer approaches the position of the reproduction pointer during reproduction. During this time, the playback of the multimedia file is interrupted.

PC(Personal Computer)で行われている動画や音声のストリーミング再生では、端末側のデータ受信速度に合わせて配信データの量を調整し、途中で中断することなくストリーミング再生が行われるようにしている。近年、携帯電話機においても、音楽や映像の配信サービスが開始され始めており、ストリーミング再生の技術は重要な位置づけとなっている。
なお、本出願に関する従来技術の参考文献として、特許文献1が知られている。
特開2001−331176号公報
In streaming playback of video and audio performed on a PC (Personal Computer), the amount of distribution data is adjusted according to the data reception speed on the terminal side, and streaming playback is performed without interruption in the middle. . In recent years, music and video distribution services have also begun to be started in mobile phones, and streaming playback technology has become an important position.
Note that Patent Document 1 is known as a reference of the prior art related to this application.
JP 2001-331176 A

しかし、PCで行われている動画や音声のストリーミング再生は、フレーム単位のデータである動画や音声を全て送るものであるため、ストリーミング再生時のデータ容量が大きい。   However, streaming playback of moving images and audio performed on a PC sends all moving images and audio that are frame-based data, and therefore has a large data capacity during streaming playback.

また、圧縮オーディオデータとMIDIデータと画像データ、テキストデータとから構成されるフォーマットファイルは、データ容量は小さいものの、シーケンスデータであるMIDIデータをフレーム単位で処理することが困難であるため、ストリーミング再生による配信が実現されていない。   A format file composed of compressed audio data, MIDI data, image data, and text data has a small data capacity, but it is difficult to process MIDI data as sequence data in units of frames. Distribution by is not realized.

本発明は上記事情を考慮してなされたもので、その目的は、圧縮オーディオデータとMIDIデータと画像データ、テキストデータとから構成されるマルチメディアファイルでストリーミング再生を可能にするファイルフォーマット及びオーディオ再生装置を提供することにある。   The present invention has been made in view of the above circumstances, and its object is to provide a file format and audio playback that enable streaming playback of multimedia files composed of compressed audio data, MIDI data, image data, and text data. To provide an apparatus.

本発明は上記の課題を解決するためになされたもので、本発明は、オーディオデータと、当該オーディオデータと同期して再生されるシーケンスデータと、当該オーディオデータが格納された位置を示す位置情報とを含むマルチメディアファイルであって、前記オーディオデータが前記シーケンスデータ及び前記位置情報より後に受信されるように配置されたファイルフォーマットのマルチメディアファイルを受信する受信手段と、前記受信手段で受信したマルチメディアファイルを逐次格納するバッファ手段と、前記オーディオデータを再生するオーディオデータ再生手段と、前記シーケンスデータを再生するシーケンスデータ再生手段と、前記バッファ手段に格納されたマルチメディアファイルを読み込み、前記オーディオデータ再生手段及び前記シーケンスデータ再生手段を制御する制御手段とを具備し、前記制御手段は、前記バッファ手段から読み込む前記マルチメディアファイルの読み込み位置が前記位置情報によって示される位置に到達したときに、前記バッファ手段が前記マルチメディアファイル中のオーディオデータを格納し始めたと判断し、前記オーディオデータのストリーミング再生と前記シーケンスデータの再生を開始することを特徴とするオーディオ再生装置である。 The present invention has been made to solve the above-described problems. The present invention relates to audio data, sequence data reproduced in synchronization with the audio data, and position information indicating a position where the audio data is stored. a multimedia file including bets, a receiving means for the audio data receives a multimedia file arrangement file format to be received later than the sequence data and the location information, received by said receiving means Buffer means for sequentially storing multimedia files, audio data reproducing means for reproducing the audio data, sequence data reproducing means for reproducing the sequence data, reading the multimedia file stored in the buffer means, and the audio Data player And comprising a control Gosuru control means the sequence data reproduction hand stage, wherein, when the read position of the multimedia file to be read from said buffer means reaches a position indicated by the position information, the determines that the buffer means is started to store the audio data in the multimedia file is an audio reproducing apparatus, characterized in that to start the playback of streaming reproduction and the sequence data of the audio data.

また、発明は、上記の発明において、前記シーケンスデータは、演奏データ、画像データ、テキストデータのいずれかを含むことを特徴とする。 The present invention, in the above invention, the sequence data is characterized in that it comprises performance data, image data, one of the text data.

また、本発明は、上記の発明において、前記オーディオデータは圧縮されたデータであり、前記マルチメディアファイルは、前記オーディオデータの圧縮形式に関する圧縮情報をさらに含み、前記圧縮されたオーディオデータを伸張して前記オーディオデータ再生手段へと出力するオーディオデコード手段をさらに具備し、前記制御手段は、前記バッファ手段から前記圧縮情報を読み込むと、当該圧縮情報を前記オーディオデコード手段に登録することを特徴とする。 Further, the present invention is the above invention, wherein the audio data is compressed data, and the multimedia file further includes compression information relating to a compression format of the audio data, and decompresses the compressed audio data. Audio decoding means for outputting to the audio data reproducing means, and when the control means reads the compression information from the buffer means, the compression information is registered in the audio decoding means. .

本発明によれば、MIDI等の演奏データや画像データ、テキストデータをオーディオデータより先に受信するようなファイルフォーマットであるため、オーディオ再生装置がオーディオデータを受信しストリーミング再生を行う際には、オーディオデータと同期して演奏データの再生や画像データ・テキストデータの表示を行うことが可能である。したがって、演奏データ等のシーケンスデータを含むマルチメディアファイルにおいても、ストリーミング再生を行うことができる。   According to the present invention, since the file format is such that performance data such as MIDI, image data, and text data are received prior to the audio data, when the audio playback device receives the audio data and performs streaming playback, It is possible to reproduce performance data and display image data and text data in synchronization with audio data. Accordingly, streaming reproduction can be performed even in a multimedia file including sequence data such as performance data.

また、マルチメディアファイルの圧縮オーディオデータを受信した時点でストリーミング再生を開始することが可能であるため、マルチメディアファイルの全体を受信後に再生を行うダウンロード再生と比較して、再生までの待ち時間を短縮することができる。   In addition, since it is possible to start streaming playback when the compressed audio data of a multimedia file is received, the waiting time until playback is reduced compared to download playback in which playback is performed after the entire multimedia file is received. It can be shortened.

以下、図面を参照して本発明の実施形態について説明する。図1は、本発明の実施形態に係る携帯電話機(オーディオ再生装置)の構成を示す構成図である。図1において、携帯電話機1内のCPU101は携帯電話機内の各部を制御するCPU(Central Processing Unit)である。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a configuration diagram showing the configuration of a mobile phone (audio playback device) according to an embodiment of the present invention. In FIG. 1, a CPU 101 in the mobile phone 1 is a CPU (Central Processing Unit) that controls each part in the mobile phone.

ROM102は、CPU101が実行するプログラム等を保持するROM(Read Only Memory)である。RAM103は、CPU101が使用するメモリ領域を提供するRAM(Random Access Memory)である。   The ROM 102 is a ROM (Read Only Memory) that holds programs executed by the CPU 101. The RAM 103 is a RAM (Random Access Memory) that provides a memory area used by the CPU 101.

通信インタフェース104は、外部のネットワークと接続するためのインタフェースである。描画モジュール105は、CPU101から入力するグラフィックデータ(画像データ)およびテキストデータに基づいて、ディスプレイ106への表示を制御するものである。ディスプレイ106は、描画モジュール105の出力を表示する表示器である。   The communication interface 104 is an interface for connecting to an external network. The drawing module 105 controls display on the display 106 based on graphic data (image data) and text data input from the CPU 101. The display 106 is a display that displays the output of the drawing module 105.

音源107は、図3のMIDI Track Chunk内に格納されたMIDI形式のメロディデータ(演奏データ)を解釈し、FM(Frequency Modulation)方式やWT(Wave Table)方式によってデジタル楽音データを生成する音源である。図3のファイルフォーマットについては後述する。   The tone generator 107 is a tone generator that interprets MIDI melody data (performance data) stored in the MIDI Track Chunk of FIG. 3 and generates digital musical tone data by FM (Frequency Modulation) method or WT (Wave Table) method. is there. The file format in FIG. 3 will be described later.

DSP部108は、圧縮形式のオーディオデータに対してリアルタイムでのデコード処理等を行うDSP(Digital Signal Processor)である。D/A部109は、DSP部108でデコードされたオーディオデータまたは、音源107で生成されたデジタル楽音データをアナログ音声信号に変換するDAC(Digital-to-Analog Converter)である。   The DSP unit 108 is a DSP (Digital Signal Processor) that performs real-time decoding processing or the like on compressed audio data. The D / A unit 109 is a DAC (Digital-to-Analog Converter) that converts the audio data decoded by the DSP unit 108 or the digital musical tone data generated by the sound source 107 into an analog audio signal.

スピーカ110(オーディオデータ再生手段)は、D/A部109で変換されたアナログ音声信号を発音するスピーカである。バスライン111は、携帯電話機内の各部を相互に接続するバスラインである。 The speaker 110 (audio data reproducing means) is a speaker that produces an analog audio signal converted by the D / A unit 109. The bus line 111 is a bus line that interconnects each part in the mobile phone.

なお、本実施形態の携帯電話機1は図1に示した機能以外に電話機能を備えているほか、電子メールによるファイルを送受信する機能およびインターネットによりファイルを取得する機能を備えている。   In addition to the functions shown in FIG. 1, the cellular phone 1 according to the present embodiment has a telephone function, a function for transmitting / receiving files by e-mail, and a function for acquiring files via the Internet.

図2は、受信側の携帯電話機1と送信側の配信サーバ2とで構成されるシステムにおける機能構成図を示す図である。図2において、配信サーバ2内のデータディスク21は、多くのマルチメディアファイルを格納するメモリである。   FIG. 2 is a diagram illustrating a functional configuration diagram in a system including the mobile phone 1 on the reception side and the distribution server 2 on the transmission side. In FIG. 2, a data disk 21 in the distribution server 2 is a memory for storing many multimedia files.

図3は、マルチメディアファイルのフォーマット構造の一例を示した図である。図3において、フォーマット構造内のデータはChunk単位で管理される。Contents Info Chunkには、コンテンツの種別やコンテンツ複製許可等の、ファイル管理用のデータが格納される。   FIG. 3 is a diagram showing an example of the format structure of the multimedia file. In FIG. 3, data in the format structure is managed in chunk units. Contents Info Chunk stores data for file management such as content type and content duplication permission.

Optional Data Chunkには、楽曲データの固有情報が含まれ、Master Audio Track Chunkの情報を示すデータが格納される。具体的には、MP3、AAC HEといった圧縮オーディオの種別情報と、Master Audio Track Chunk中の圧縮オーディオのデータを格納する位置のファイル先頭からのポインタ(以下では、オーディオポインタと呼ぶ。)と、当該圧縮オーディオデータがモノラルかステレオかを示す情報と、当該圧縮オーディオデータのビットレート情報である。   Optional Data Chunk includes unique information of music data and stores data indicating information of Master Audio Track Chunk. Specifically, the compressed audio type information such as MP3 and AAC HE, the pointer from the beginning of the file at the position where the compressed audio data in the Master Audio Track Chunk is stored (hereinafter referred to as the audio pointer), and the like. Information indicating whether the compressed audio data is monaural or stereo, and bit rate information of the compressed audio data.

なお、特許請求の範囲に記載のヘッダとは、図3のContents Info Chunk及びOptional Data Chunkを指し、位置情報とはオーディオポインタを指す。また、圧縮情報とは、上述の圧縮オーディオの種別情報や、モノラルかステレオかの情報、ビットレート情報等を指す。   The header described in the claims refers to the Contents Info Chunk and Optional Data Chunk in FIG. 3, and the position information refers to the audio pointer. The compressed information refers to the above-described compressed audio type information, monaural or stereo information, bit rate information, and the like.

MIDI Track Chunkには、音源107によって再生されるシーケンスデータ等が格納される。Setup Data Chunkには、MIDI Track Chunk全体における設定パラメータや音色パラメータ、エフェクトデータ等が格納される。Sequence Data Chunkには、音源107によって再生されるシーケンスデータが格納される。   The MIDI Track Chunk stores sequence data reproduced by the sound source 107. Setup Data Chunk stores setup parameters, tone parameters, effect data, etc. for the entire MIDI Track Chunk. In the Sequence Data Chunk, sequence data reproduced by the sound source 107 is stored.

ここで、シーケンスデータとは、時間情報を持つMIDIイベントの集合体である。MIDIイベントは、例えば、発音イベント(ノートオン/オフ)や音色イベント(プログラムチェンジ)、音量変更やパンポット変更のためのイベント(コントロールチェンジ)、ピッチ変更イベント(ピッチチェンジ)等である。   Here, the sequence data is a collection of MIDI events having time information. The MIDI event is, for example, a sound generation event (note on / off), a tone color event (program change), a volume change or pan pot change event (control change), a pitch change event (pitch change), or the like.

Graphics Track Chunkには、ディスプレイ106に表示を行うための描画シーケンスデータ、グラフィックデータ(画像データ)、テキストデータ等が格納される。Setup Data Chunkには、Graphics Track Chunk全体における設定パラメータが格納される。Sequence Data Chunkには、ディスプレイ106に描画するためのシーケンスデータが格納される。   The Graphics Track Chunk stores drawing sequence data, graphic data (image data), text data, and the like for display on the display 106. Setup Data Chunk stores setting parameters for the entire Graphics Track Chunk. Sequence data for drawing on the display 106 is stored in the Sequence Data Chunk.

ここで、シーケンスデータは、座標を指定するための数値表現(Coordinates)と表示タイミングや表示時間長等を指定するための数値表現(Duration)で表され、テキストや画像を時間に同期して表示、消去するためのシーケンスが記述される。 Here, the sequence data is represented by a numerical expression (Coordinates) for specifying coordinates and a numerical expression (Duration) for specifying display timing, display time length, etc., and text and images are displayed in synchronization with time. A sequence for erasing is described.

Graphics Track Chunkは複数の仮想プレーンを持つ表示デバイスを想定しており、Graphics Track Chunkには各仮想プレーンに対応したSequence Data Chunkを複数格納することができる。この場合、実際の表示デバイス(ディスプレイ106)には仮想プレーンを合成した結果が表示される。Master Audio Track Chunkには圧縮オーディオのバイナリデータが格納される。   The Graphics Track Chunk assumes a display device having a plurality of virtual planes, and the Graphics Track Chunk can store a plurality of Sequence Data Chunks corresponding to each virtual plane. In this case, the result of combining the virtual planes is displayed on the actual display device (display 106). Master Audio Track Chunk stores binary data of compressed audio.

図3に示したマルチメディアファイルフォーマットにおいては、ストリーミング再生を可能とするために、Master Audio Track Chunkをフォーマットの最後に配置し、最後に受信されるようにする。なお、ストリーミング再生中に必要としないデータはMaster Audio Track Chunkの後方に配置してもよい。   In the multimedia file format shown in FIG. 3, in order to enable streaming playback, the Master Audio Track Chunk is placed at the end of the format so that it can be received at the end. Data that is not required during streaming playback may be placed behind the Master Audio Track Chunk.

図2に戻って、配信サーバ2内のファイルコントローラ22は、ユーザからの楽曲のリクエストを受けると、リクエストされた楽曲に対応するマルチメディアファイルをデータディスク21から読み込み、送信コントローラ23へと出力するものである。送信コントローラ23は、ファイルコントローラ22からの指示に基づき、入力したマルチメディアファイルのストリーム送信を行うものである。   Returning to FIG. 2, when the file controller 22 in the distribution server 2 receives a music request from the user, the file controller 22 reads a multimedia file corresponding to the requested music from the data disk 21 and outputs it to the transmission controller 23. Is. The transmission controller 23 performs stream transmission of the input multimedia file based on an instruction from the file controller 22.

携帯電話機1内の受信コントローラ11はCPU101の一機能であり、送信コントローラ23からストリーム送信されたデータを受信し、逐次メモリバッファ12へと格納するものである。メモリバッファ12は、ストリーミング再生を行うためのバッファメモリとして図1のRAM103内に設けられたメモリ領域である。   The reception controller 11 in the cellular phone 1 is a function of the CPU 101, and receives data stream-transmitted from the transmission controller 23 and sequentially stores it in the memory buffer 12. The memory buffer 12 is a memory area provided in the RAM 103 of FIG. 1 as a buffer memory for performing streaming reproduction.

プレイヤー13は、CPU101の一機能であり、メモリバッファ12からマルチメディアファイルの情報を逐次読取り、マルチメディアファイル中に含まれる各種データを必要なデコーダモジュールに送るものである。   The player 13 is a function of the CPU 101, and sequentially reads the information of the multimedia file from the memory buffer 12, and sends various data included in the multimedia file to the necessary decoder module.

また、プレイヤー13は、マルチメディアファイル中のそれぞれのSequence Data Chunk内のシーケンスデータの時間を管理し、シーケンスに従い、それぞれのモジュールに指示するものである。音源107は、前述したとおり、MIDIデータをリアルタイムに解釈しデジタル楽音データを出力するモジュールである。   The player 13 manages the time of the sequence data in each Sequence Data Chunk in the multimedia file, and instructs each module according to the sequence. As described above, the sound source 107 is a module that interprets MIDI data in real time and outputs digital musical tone data.

オーディオデコーダ14は、図1のDSP部108の一機能であり、MP3やAACといった特定の圧縮オーディオフォーマットから、リニアなオーディオフォーマットにリアルタイムでデコードするものである。音源107及びオーディオデコーダの出力はミックスされてD/A部109へ入力され、スピーカ110から発音される。   The audio decoder 14 is a function of the DSP unit 108 in FIG. 1 and decodes a specific compressed audio format such as MP3 or AAC into a linear audio format in real time. The outputs of the sound source 107 and the audio decoder are mixed and input to the D / A unit 109, and sounded from the speaker 110.

グラフィックデコーダ15は、図1のDSP部108の一機能であり、マルチメディアファイル中のJPEGやPNGといった特定のグラフィックデータ(画像データ)を読み取り、ディスプレイ106に表示するための実データにデコードするモジュールである。   The graphic decoder 15 is a function of the DSP unit 108 in FIG. 1, and is a module that reads specific graphic data (image data) such as JPEG or PNG in the multimedia file and decodes it into actual data to be displayed on the display 106. It is.

テキストデコーダ16は、図1のDSP部108の一機能であり、マルチメディアファイル中の歌詞を記述したテキストデータを読み取り、テキストからフォントに置き換え、ディスプレイ106に表示するための実データにデコードするモジュールである。   The text decoder 16 is a function of the DSP unit 108 shown in FIG. 1, and reads text data describing lyrics in a multimedia file, replaces the text with a font, and decodes the actual data for display on the display 106. It is.

描画モジュール105は、グラフィックデコーダ15及びテキストデコーダ16からの出力を元に、描画の時刻シーケンスに従って、歌詞のワイプや画像の移動、表示切替などの処理を行い、ディスプレイ106に表示するものである。   The drawing module 105 performs processing such as lyric wiping, image movement, and display switching in accordance with a drawing time sequence based on outputs from the graphic decoder 15 and the text decoder 16 and displays them on the display 106.

次に、上述した実施形態の動作を、図2の機能構成図及び図4のフローチャートを参照して説明する。図4は、図1の携帯電話機1でマルチメディアファイルのストリーミング再生を行う手順を示すフローチャートである。   Next, the operation of the above-described embodiment will be described with reference to the functional configuration diagram of FIG. 2 and the flowchart of FIG. FIG. 4 is a flowchart showing a procedure for performing streaming playback of a multimedia file on the mobile phone 1 of FIG.

携帯電話機1のユーザが配信サーバ2に対して楽曲のリクエストを行うと、配信サーバ2内のファイルコントローラ22は、リクエストされた楽曲に対応するマルチメディアファイルをデータディスク21から読み込み、送信コントローラ23を経由してストリーム配信を開始する。   When the user of the mobile phone 1 makes a music request to the distribution server 2, the file controller 22 in the distribution server 2 reads the multimedia file corresponding to the requested music from the data disk 21 and sets the transmission controller 23. Start streaming via.

送信コントローラ23からストリーム配信されたデータを携帯電話機1内の受信コントローラ11が受信すると、逐次メモリバッファ12に格納していく。プレイヤー13は、メモリバッファ12にデータが格納され始めると、メモリバッファ12からマルチメディアファイルの読み込みを開始する(ステップS401)。   When the reception controller 11 in the mobile phone 1 receives the data stream-distributed from the transmission controller 23, the data is sequentially stored in the memory buffer 12. When the data starts to be stored in the memory buffer 12, the player 13 starts reading the multimedia file from the memory buffer 12 (step S401).

プレイヤー13は、最初に受信するマルチメディアファイルのContents Info Chunk及びOptional Data Chunkから、ファイル内に含まれる圧縮オーディオデータの情報を取得する(ステップS402)。プレイヤー13は、圧縮オーディオ種別情報などの各種情報を読み込んでオーディオデコーダ14に登録し、オーディオデータのデコードを行えるように準備を行う。また、プレイヤー13はファイル中の圧縮オーディオデータの位置を示すオーディオポインタをセットする(ステップS403)。   The player 13 acquires information on the compressed audio data included in the file from the Contents Info Chunk and Optional Data Chunk of the multimedia file received first (step S402). The player 13 reads various information such as compressed audio type information and registers it in the audio decoder 14 and prepares to decode the audio data. In addition, the player 13 sets an audio pointer indicating the position of the compressed audio data in the file (step S403).

プレイヤー13が、次に受信するMIDI Track Chunkを読み込むと(ステップS404)、MIDIデータ中のシーケンスデータを読み込み、マルチメディアファイルの再生スタートと同時に音源107へ時刻シーケンスに従ってイベントを送信できるように準備する(ステップS405)。   When the player 13 reads the next received MIDI Track Chunk (step S404), it reads the sequence data in the MIDI data and prepares to transmit the event according to the time sequence to the sound source 107 simultaneously with the start of playback of the multimedia file. (Step S405).

プレイヤー13が、次に受信するGraphic Track Chunkを読み込むと(ステップS406)、Graphic Track Chunk中のJPEGやPNGといった特定のグラフィックデータ(画像データ)を読み取り、マルチメディアファイルの再生スタートと同時にディスプレイ106へ時刻シーケンスに従って表示できるように準備する(ステップS407)。   When the player 13 reads the next received Graphic Track Chunk (step S406), the player 13 reads specific graphic data (image data) such as JPEG or PNG in the Graphic Track Chunk and simultaneously displays the multimedia file on the display 106. Preparation is made so that it can be displayed according to the time sequence (step S407).

プレイヤー13が、メモリバッファ12における読み込み位置がステップS403でセットしたオーディオポインタの位置まで到達したかを判定する(ステップS408)。メモリバッファ12からプレイヤー13が読み込むファイルポインタの位置がオーディオポインタの位置まで到達すると、すなわち、メモリバッファ12がマルチメディアファイル中の圧縮オーディオデータを格納し始めていることが確認されると(ステップS408:Yes)、マルチメディアファイル全体のストリーミング再生が開始される(ステップS409)。   The player 13 determines whether the reading position in the memory buffer 12 has reached the position of the audio pointer set in step S403 (step S408). When the position of the file pointer read by the player 13 from the memory buffer 12 reaches the position of the audio pointer, that is, when it is confirmed that the memory buffer 12 starts to store the compressed audio data in the multimedia file (step S408: Yes), streaming playback of the entire multimedia file is started (step S409).

ストリーミング再生が開始されると、プレイヤー13はメモリバッファ12からMaster Audio Track Chunkに格納されている圧縮オーディオデータを逐次読み込み、オーディオデコーダ14へと出力する。オーディオデコーダ14は、入力した圧縮オーディオデータをリニアなオーディオデータにデコードし、スピーカ110から再生する(ステップS410)。   When streaming playback is started, the player 13 sequentially reads compressed audio data stored in the Master Audio Track Chunk from the memory buffer 12 and outputs the compressed audio data to the audio decoder 14. The audio decoder 14 decodes the input compressed audio data into linear audio data and reproduces it from the speaker 110 (step S410).

プレイヤー13は、MIDIデータ部分に関しては、時刻シーケンスに従ってメモリバッファ12から逐次音源107へとイベントを出力する。音源107は、入力したイベントにしたがって楽音を生成し、スピーカ110から再生する。   For the MIDI data portion, the player 13 sequentially outputs events from the memory buffer 12 to the sound source 107 according to the time sequence. The sound source 107 generates a musical sound according to the input event and reproduces it from the speaker 110.

なお、オーディオデコーダ14及び音源107からの出力は、D/A部109によりアナログ信号に変換され、アンプ増幅された後にスピーカ110から再生される。   The outputs from the audio decoder 14 and the sound source 107 are converted into analog signals by the D / A unit 109, amplified by the amplifier, and then reproduced from the speaker 110.

一方、グラフィックデータ(画像データ)やテキストデータは、メモリバッファ12から逐次描画モジュール105に出力される。描画モジュール105では、描画時刻シーケンスに従って、歌詞のワイプや画像の移動、表示切替などの処理が行われ、ディスプレイ106に表示される。   On the other hand, graphic data (image data) and text data are sequentially output from the memory buffer 12 to the drawing module 105. The drawing module 105 performs processes such as wiping of lyrics, image movement, and display switching in accordance with the drawing time sequence, and is displayed on the display 106.

すなわち、ストリーミング再生においては、マルチメディアファイルに圧縮されて含まれるオーディオデータの再生を行いながら、マルチメディアファイル内に示された時刻シーケンスに従って、MIDI音源を再生し、かつ画像やテキストをディスプレイ106に表示する。   That is, in streaming playback, while playing back audio data that is compressed into a multimedia file, a MIDI sound source is played according to the time sequence indicated in the multimedia file, and images and text are displayed on the display 106. indicate.

以後、プレイヤー13がメモリバッファ12から読み込む位置がマルチメディアファイルの終了地点に到達するまで、ステップS410のストリーミング再生を行う。マルチメディアファイルの終了地点まで到達すると(ステップS411:Yes)、プレイヤー13はストリーミング処理を終了する。   Thereafter, the streaming reproduction in step S410 is performed until the position where the player 13 reads from the memory buffer 12 reaches the end point of the multimedia file. When reaching the end point of the multimedia file (step S411: Yes), the player 13 ends the streaming process.

本実施形態では、MIDIデータや画像データ、テキストデータを圧縮オーディオデータより先に受信するようなファイルフォーマットであるため、携帯電話機1が圧縮オーディオデータを受信しストリーミング再生を行う際には、当該オーディオデータと同期してMIDIデータの再生や画像データ・テキストデータの表示を行うことが可能である。したがって、MIDIデータ等のシーケンスデータを含むマルチメディアファイルにおいても、ストリーミング再生を行うことができる。   In the present embodiment, since the file format is such that MIDI data, image data, and text data are received prior to the compressed audio data, when the mobile phone 1 receives the compressed audio data and performs streaming playback, the audio data is received. It is possible to reproduce MIDI data and display image data and text data in synchronization with the data. Therefore, streaming reproduction can be performed even in a multimedia file including sequence data such as MIDI data.

また、図3に示すファイルフォーマットを用いることにより、オーディオデータにMIDIデータやテキストデータを加えることが可能であるため、圧縮オーディデータの入ったカラオケやアニメーションのコンテンツ等をストリーミング再生で配信することができる。   Also, by using the file format shown in FIG. 3, it is possible to add MIDI data or text data to the audio data, so that karaoke or animation contents containing compressed audio data can be distributed by streaming playback. it can.

以上、本発明の実施形態を詳述してきたが、具体的な構成は本実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。例えば、オーディオデータは特定の形式で圧縮されている必要はなく、圧縮されていないオーディオデータに対しても本発明を適用できる。   As mentioned above, although embodiment of this invention was explained in full detail, the concrete structure is not restricted to this embodiment, The design change etc. of the range which does not deviate from the summary of this invention are included. For example, the audio data does not need to be compressed in a specific format, and the present invention can be applied to uncompressed audio data.

本発明は、オーディオデータのストリーミング再生が可能な携帯電話機等のオーディオ再生装置に用いて好適である。   The present invention is suitable for use in an audio playback device such as a mobile phone capable of streaming playback of audio data.

本発明の実施形態に係る携帯電話機の構成を示す構成図である。It is a block diagram which shows the structure of the mobile telephone which concerns on embodiment of this invention. 受信側の携帯電話機1と送信側の配信サーバ2とで構成されるシステムにおける機能構成図を示す図である。It is a figure which shows the function block diagram in the system comprised with the mobile telephone 1 of the receiving side, and the delivery server 2 of the transmission side. マルチメディアファイルのフォーマット構造の一例を示した図である。It is the figure which showed an example of the format structure of a multimedia file. 図1の携帯電話機1でマルチメディアファイルのストリーミング再生を行う手順を示すフローチャートである。6 is a flowchart showing a procedure for performing streaming playback of a multimedia file on the mobile phone 1 of FIG. 1. ストリーミング再生を示す模式図である。It is a schematic diagram which shows streaming reproduction.

符号の説明Explanation of symbols

11…受信コントローラ(受信手段)、12…メモリバッファ(バッファ手段)、13…プレイヤー(制御手段)、14…オーディオデコーダ(オーディオデコード手段)、15…グラフィックデコーダ、16…テキストデコーダ、21…データディスク、22…ファイルコントローラ、23…送信コントローラ、101…CPU、102…ROM、103…RAM、104…通信インタフェース、105…描画モジュール、106…ディスプレイ(シーケンスデータ再生手段)、107…音源、108…DSP部、109…D/A部、110…スピーカ(オーディオデータ再生手段)、111…バスライン   DESCRIPTION OF SYMBOLS 11 ... Reception controller (reception means), 12 ... Memory buffer (buffer means), 13 ... Player (control means), 14 ... Audio decoder (audio decoding means), 15 ... Graphic decoder, 16 ... Text decoder, 21 ... Data disc , 22 ... File controller, 23 ... Transmission controller, 101 ... CPU, 102 ... ROM, 103 ... RAM, 104 ... Communication interface, 105 ... Drawing module, 106 ... Display (sequence data reproducing means), 107 ... Sound source, 108 ... DSP Part 109, D / A part 110, speaker (audio data reproducing means) 111, bus line

Claims (3)

オーディオデータと、当該オーディオデータと同期して再生されるシーケンスデータと、当該オーディオデータが格納された位置を示す位置情報とを含むマルチメディアファイルであって、前記オーディオデータが前記シーケンスデータ及び前記位置情報より後に受信されるように配置されたファイルフォーマットのマルチメディアファイルを受信する受信手段と、
前記受信手段で受信したマルチメディアファイルを逐次格納するバッファ手段と、
前記オーディオデータを再生するオーディオデータ再生手段と、
前記シーケンスデータを再生するシーケンスデータ再生手段と、
前記バッファ手段に格納されたマルチメディアファイルを読み込み、前記オーディオデータ再生手段及び前記シーケンスデータ再生手段を制御する制御手段と
を具備し、
前記制御手段は、前記バッファ手段から読み込む前記マルチメディアファイルの読み込み位置が前記位置情報によって示される位置に到達したときに、前記バッファ手段が前記マルチメディアファイル中のオーディオデータを格納し始めたと判断し、前記オーディオデータのストリーミング再生と前記シーケンスデータの再生を開始することを特徴とするオーディオ再生装置。
A multimedia file including audio data , sequence data reproduced in synchronization with the audio data, and position information indicating a position where the audio data is stored , wherein the audio data is the sequence data and the position Receiving means for receiving a multimedia file in a file format arranged to be received after the information ;
Buffer means for sequentially storing multimedia files received by the receiving means;
Audio data reproducing means for reproducing the audio data;
Sequence data reproducing means for reproducing the sequence data;
The read multimedia file stored in the buffer means, comprising a said audio data reproducing means and the sequence data reproducing hand stage braking Gosuru control means,
Wherein, when the read position of the multimedia file to be read from said buffer means reaches a position indicated by the position information, determines that the buffer means is started to store the audio data in the multimedia files audio reproduction apparatus characterized by starting the playback of streaming reproduction and the sequence data of the audio data.
前記シーケンスデータは、演奏データ、画像データ、テキストデータのいずれかを含むことを特徴とする請求項1に記載のオーディオ再生装置。   2. The audio reproduction apparatus according to claim 1, wherein the sequence data includes any one of performance data, image data, and text data. 前記オーディオデータは圧縮されたデータであり、
前記マルチメディアファイルは、前記オーディオデータの圧縮形式に関する圧縮情報をさらに含み、
前記圧縮されたオーディオデータを伸張して前記オーディオデータ再生手段へと出力するオーディオデコード手段をさらに具備し、
前記制御手段は、前記バッファ手段から前記圧縮情報を読み込むと、当該圧縮情報を前記オーディオデコード手段に登録することを特徴とする請求項1又は請求項2に記載のオーディオ再生装置。
The audio data is compressed data;
The multimedia file further includes compression information related to a compression format of the audio data,
An audio decoding means for decompressing the compressed audio data and outputting the decompressed audio data to the audio data reproducing means;
3. The audio reproducing apparatus according to claim 1, wherein when the compressed information is read from the buffer means, the control means registers the compressed information in the audio decoding means. 4.
JP2006037629A 2006-02-15 2006-02-15 Audio playback device Expired - Fee Related JP4595828B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006037629A JP4595828B2 (en) 2006-02-15 2006-02-15 Audio playback device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006037629A JP4595828B2 (en) 2006-02-15 2006-02-15 Audio playback device

Publications (2)

Publication Number Publication Date
JP2007219054A JP2007219054A (en) 2007-08-30
JP4595828B2 true JP4595828B2 (en) 2010-12-08

Family

ID=38496450

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006037629A Expired - Fee Related JP4595828B2 (en) 2006-02-15 2006-02-15 Audio playback device

Country Status (1)

Country Link
JP (1) JP4595828B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5391684B2 (en) * 2008-12-24 2014-01-15 ヤマハ株式会社 Electronic keyboard instrument and program for realizing the control method
JP5645327B2 (en) * 2011-06-28 2014-12-24 パイオニア株式会社 DISTRIBUTION DEVICE, DISTRIBUTION METHOD, DISTRIBUTION CONTROL COMPUTER PROGRAM, REPRODUCTION DEVICE, REPRODUCTION METHOD, REPRODUCTION CONTROL COMPUTER PROGRAM, AND DISTRIBUTION SYSTEM
WO2013014749A1 (en) * 2011-07-26 2013-01-31 パイオニア株式会社 Computer program for distribution control, distribution method, and distribution device; computer program for playback control, playback method, playback device; and distribution system
JP5953687B2 (en) * 2011-09-26 2016-07-20 ヤマハ株式会社 Information processing apparatus and program

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07272415A (en) * 1994-03-28 1995-10-20 Toshiba Corp Recording medium and reproducer thereof
JPH08102141A (en) * 1994-09-29 1996-04-16 Victor Co Of Japan Ltd Data compressing and recording method and decoding and reproducing method for compressed data
JPH1074092A (en) * 1996-08-30 1998-03-17 Yamaha Corp Karaoke device
JPH11341350A (en) * 1998-05-28 1999-12-10 Yamaha Corp Multimedia information editing and reproducing device, recording medium with multimedia information reproduction program and recording medium with sequence information respectively recorded on them
JP2001036423A (en) * 1999-05-20 2001-02-09 Yamaha Corp Program reproduction system and program reproduction method
JP2001331176A (en) * 2000-05-23 2001-11-30 Yamaha Corp Music reproduction method, multimedia data reproduction method, server client system and server device
JP2003015675A (en) * 2001-07-04 2003-01-17 Sega Miyuujitsuku Netsutowaakusu:Kk Communication karaoke system, karaoke sever, and karaoke terminal
JP2003050591A (en) * 2002-05-07 2003-02-21 Yamaha Corp Musical performance output device
JP2004191515A (en) * 2002-12-09 2004-07-08 Kenwood Corp Contents distribution system, and equipment and method for contents reproduction

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07272415A (en) * 1994-03-28 1995-10-20 Toshiba Corp Recording medium and reproducer thereof
JPH08102141A (en) * 1994-09-29 1996-04-16 Victor Co Of Japan Ltd Data compressing and recording method and decoding and reproducing method for compressed data
JPH1074092A (en) * 1996-08-30 1998-03-17 Yamaha Corp Karaoke device
JPH11341350A (en) * 1998-05-28 1999-12-10 Yamaha Corp Multimedia information editing and reproducing device, recording medium with multimedia information reproduction program and recording medium with sequence information respectively recorded on them
JP2001036423A (en) * 1999-05-20 2001-02-09 Yamaha Corp Program reproduction system and program reproduction method
JP2001331176A (en) * 2000-05-23 2001-11-30 Yamaha Corp Music reproduction method, multimedia data reproduction method, server client system and server device
JP2003015675A (en) * 2001-07-04 2003-01-17 Sega Miyuujitsuku Netsutowaakusu:Kk Communication karaoke system, karaoke sever, and karaoke terminal
JP2003050591A (en) * 2002-05-07 2003-02-21 Yamaha Corp Musical performance output device
JP2004191515A (en) * 2002-12-09 2004-07-08 Kenwood Corp Contents distribution system, and equipment and method for contents reproduction

Also Published As

Publication number Publication date
JP2007219054A (en) 2007-08-30

Similar Documents

Publication Publication Date Title
US7268287B2 (en) Music data providing apparatus, music data reception apparatus and program
US20020189426A1 (en) Portable mixing recorder and method and program for controlling the same
JP2009157272A (en) Audio playback device
US20050163322A1 (en) Apparatus and method for playing and storing three-dimensional stereo sound in communication terminal
JP4595828B2 (en) Audio playback device
CN112562638A (en) Voice preview method and device and electronic equipment
JP4404091B2 (en) Content distribution server and terminal for distributing content frames for playing music
KR20080099006A (en) Method and apparatus for mixing and adding sound effect in audio data using digital audio player
JP2002196754A (en) Data compression method, data transmission method and data reproducing method
JP3780751B2 (en) Karaoke device and karaoke system
JP4229058B2 (en) Terminal device and recording medium
JP3859200B2 (en) Portable mixing recording apparatus, control method therefor, and program
CN2909452Y (en) Electronic musical instrument for playback received musice
JP2002182658A (en) Musical piece data delivery method, musical piece data delivery system, musical piece data delivery apparatus musical piece data delivery program
JP2009205039A (en) Audio data conversion/reproduction system, audio data conversion device and audio data reproduction device
JP2009163192A (en) Audio reproduction device and audio reproduction system
JP2007079413A (en) Audio reproduction device, audio distribution system, audio reproduction program and authoring program
JPH10319977A (en) Karaoke (sign-along machine) playing device and portable test hearing terminal for karaoke
JP4114344B2 (en) Karaoke data playback device
JP2009237275A (en) Music data receiver, music data distributor and program for achieving the respective control methods for controlling the music data receiver and the music data distributor, respectively
JP2004364243A (en) Speech processor and speech processing method
JP3592373B2 (en) Karaoke equipment
JP2007108382A (en) Portable terminal
JP4419432B2 (en) Karaoke equipment
KR200347188Y1 (en) Apparatus for playing/storing three-dimensional sound in communication terminal

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100730

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100824

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100906

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131001

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees