JP4352409B2 - Multimedia coded data separation and transmission device - Google Patents

Multimedia coded data separation and transmission device Download PDF

Info

Publication number
JP4352409B2
JP4352409B2 JP2005282821A JP2005282821A JP4352409B2 JP 4352409 B2 JP4352409 B2 JP 4352409B2 JP 2005282821 A JP2005282821 A JP 2005282821A JP 2005282821 A JP2005282821 A JP 2005282821A JP 4352409 B2 JP4352409 B2 JP 4352409B2
Authority
JP
Japan
Prior art keywords
audio
encoded data
data
video
reproduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005282821A
Other languages
Japanese (ja)
Other versions
JP2007095163A (en
Inventor
孝朗 山辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2005282821A priority Critical patent/JP4352409B2/en
Publication of JP2007095163A publication Critical patent/JP2007095163A/en
Application granted granted Critical
Publication of JP4352409B2 publication Critical patent/JP4352409B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、物理的に離れた状態にあるビデオ再生装置及びオーディオ再生装置において、1つのマルチメディア符号化データに含まれるビデオデータ及びオーディオデータの同期再生を可能とする処理を行うマルチメディア符号化データ分離伝送装置に関する。   The present invention relates to multimedia encoding for performing processing that enables synchronous reproduction of video data and audio data included in one multimedia encoded data in a physically separated video playback apparatus and audio playback apparatus. The present invention relates to a data separation and transmission apparatus.

なお、本明細書では、一般的な輝度信号や色差信号のようなビデオ情報(映像情報)を含むデータをビデオデータと呼び、リニアPCM(Pulse Code Modulation:パルス符号化方式)やアナログ音声信号のようなオーディオ情報(音声情報)を含むデータをオーディオデータと呼ぶことにする。また、ビデオデータが圧縮された符号化データをビデオ符号化データと呼び、オーディオデータが圧縮された符号化データをオーディオ符号化データと呼ぶことにする。したがって、ビデオ符号化データ及びオーディオ符号化データは、ビデオデータ及びオーディオデータに含まれる。また、本明細書では、ビデオ符号化データ及びオーディオ符号化データの両方を含むデータをマルチメディア符号化データと呼ぶことにする。   In this specification, data including video information (video information) such as general luminance signals and color difference signals is referred to as video data, and linear PCM (Pulse Code Modulation) or analog audio signal Data including such audio information (voice information) will be referred to as audio data. Also, encoded data in which video data is compressed is referred to as video encoded data, and encoded data in which audio data is compressed is referred to as audio encoded data. Therefore, the video encoded data and the audio encoded data are included in the video data and the audio data. In this specification, data including both video encoded data and audio encoded data is referred to as multimedia encoded data.

従来、ビデオデータ及びオーディオデータを、物理的に離れたそれぞれの再生装置(ビデオ再生装置及びオーディオ再生装置)にて同期再生を行う技術がいくつか提案されており、この技術に関連して、視聴者の多様なニーズに適した製品も発売されている。例えば、無線伝送を利用したものに、赤外領域の光信号としてオーディオデータを伝送するデータ伝送装置と、この光信号を受光装置で受光し、光信号から電気信号に変換してオーディオ再生を行うヘッドフォンとにより構成されている赤外線伝送方式のオーディオ再生システムが存在している。   Conventionally, several techniques for synchronously reproducing video data and audio data on respective physically separated playback apparatuses (video playback apparatus and audio playback apparatus) have been proposed. Products suitable for the diverse needs of consumers are also on the market. For example, for data transmission using wireless transmission, a data transmission device that transmits audio data as an optical signal in the infrared region, and the optical signal is received by a light receiving device and converted from an optical signal to an electrical signal for audio reproduction. There exists an infrared transmission type audio reproduction system composed of headphones.

なお、電波を用いた伝送方式としては、最近では5GHz(ギガヘルツ)帯を用いたIEEE802.11a、2.4GHz帯を用いたIEEE802.11bとIEEE802.11gが知られている。また、例えば、ブルートゥース(Bluetooth)(登録商標)などの短距離無線伝送方式もオーディオデータの転送に利用されている。これらの電波を用いたデータ伝送は送受信ユニットを小型化することが可能であり、特にブルートゥース(登録商標)に関してはコストも低く、また光を利用した無線通信と比較して伝送可能な範囲も広いため非常に利便性が高い。   Recently, IEEE802.11a using 5 GHz (gigahertz) band and IEEE802.11b and IEEE802.11g using 2.4 GHz band are known as transmission systems using radio waves. For example, a short-range wireless transmission method such as Bluetooth (registered trademark) is also used for transferring audio data. Data transmission using these radio waves can reduce the size of the transmission / reception unit. In particular, the cost of Bluetooth (registered trademark) is low, and the transmission range is wide compared to wireless communication using light. Because it is very convenient.

また、リアスピーカの配置によってマルチチャンネル再生環境を構築する際、リアスピーカにまで伸延させるスピーカコードが邪魔になるという問題が発生するが、この問題を解決するために、リアスピーカにアンプを搭載させるとともに無線信号受信装置を設け、リアスピーカに向けてオーディオデータを電波信号(無線信号)で伝送することで、リアスピーカへのオーディオデータの供給を行うオーディオ再生システムが存在している。   Also, when constructing a multi-channel playback environment by arranging rear speakers, there is a problem that the speaker cord that extends to the rear speakers gets in the way. In order to solve this problem, an amplifier is mounted on the rear speakers. In addition, there is an audio reproduction system that is provided with a wireless signal receiving device and transmits audio data to the rear speaker as a radio signal (wireless signal), thereby supplying the audio data to the rear speaker.

上述の例として挙げたビデオデータ及びオーディオデータの同期再生は、通常はスピーカコード又はヘッドフォンコードを通じてスピーカに供給され、スピーカにおいて振動エネルギーに戻されるオーディオデータの電気信号を、光信号又は電波信号などの無線信号に変換して伝送することで、物理的に離れた位置に存在するオーディオ出力装置におけるオーディオ出力を可能とするものである。したがって、上述の同期再生は、ビデオデータとオーディオデータとのタイミングを計りながら処理を行うものではなく、同期再生に関しては、ビデオ再生装置及びオーディオ再生装置におけるビデオデータ及びオーディオデータの出力タイミングに依存している。   The synchronized playback of video data and audio data given as an example above is usually supplied to a speaker through a speaker cord or a headphone cord, and an electrical signal of audio data returned to vibration energy in the speaker is converted into an optical signal or a radio signal. By converting the signal into a wireless signal and transmitting it, audio output can be performed in an audio output device that is located physically apart. Therefore, the above-described synchronized playback is not performed while measuring the timing of video data and audio data, and the synchronized playback depends on the output timing of video data and audio data in the video playback device and audio playback device. ing.

一方、下記の特許文献1には、物理的に離れた状態にあるビデオ再生装置及びオーディオ再生装置において、マルチメディア符号化データに含まれるビデオデータ及びオーディオデータの同期再生を実現するための技術が開示されている。特許文献1に開示されている技術では、例えば、映像再生装置と音声再生装置(ヘッドフォン)とが無線媒体によって接続されており、映像再生装置は、ビデオデータの再生を行うとともに、オーディオ符号化データを音声再生装置に対して供給する。音声再生装置は、映像再生装置から受信したオーディオ符号化データの復号処理を行って、その音声を出力する。また、音声再生装置は、再生開始時には、入出力バッファ容量、通信遅延、復号遅延などを考慮してビデオ再生と同期した音声再生を図るとともに、再生過程においては、例えば、映像再生装置との間におけるクロック同期を利用して、映像出力と音声出力とのずれ量を計測し、音声再生速度を変更することによって、ずれの解消を行うことが可能である。   On the other hand, the following Patent Document 1 discloses a technique for realizing synchronized playback of video data and audio data included in multimedia encoded data in a video playback device and an audio playback device that are physically separated from each other. It is disclosed. In the technique disclosed in Patent Document 1, for example, a video playback device and an audio playback device (headphones) are connected by a wireless medium. The video playback device plays back video data and also encodes audio encoded data. Is supplied to the audio reproducing apparatus. The audio reproduction device performs a decoding process on the audio encoded data received from the video reproduction device and outputs the audio. In addition, the audio playback device performs audio playback synchronized with video playback in consideration of input / output buffer capacity, communication delay, decoding delay, and the like at the start of playback. It is possible to eliminate the deviation by measuring the amount of deviation between the video output and the audio output using the clock synchronization and changing the audio reproduction speed.

次に、従来の技術に係るマルチメディア符号化データを再生するマルチメディア符号化データ再生装置の内部構成について説明する。   Next, an internal configuration of a multimedia encoded data reproducing apparatus that reproduces multimedia encoded data according to a conventional technique will be described.

図5は、従来の技術に係るマルチメディア符号化データ再生装置の一例を示すブロック図である。なお、図5に示すマルチメディア符号化データ再生装置は、マルチメディア符号化データ内に含まれるビデオデータ及びオーディオデータの同期再生を行うものであり、例えば、ポータブル型DVDプレーヤに相当する。   FIG. 5 is a block diagram showing an example of a multimedia encoded data reproducing apparatus according to the prior art. Note that the multimedia encoded data playback device shown in FIG. 5 performs synchronized playback of video data and audio data included in the multimedia encoded data, and corresponds to, for example, a portable DVD player.

図5に図示されているマルチメディア符号化データ再生装置1000は、マルチメディアストリームバッファ1001、システムストリーム分離部1002、オーディオ復号部1003、ビデオ復号部1004、制御部(CPU:Central Processing Unit)1005、オーディオデータバッファ1006、ビデオデータバッファ1007、スピーカ1008、モニタ1009を有している。   The multimedia encoded data reproduction apparatus 1000 shown in FIG. 5 includes a multimedia stream buffer 1001, a system stream separation unit 1002, an audio decoding unit 1003, a video decoding unit 1004, a control unit (CPU: Central Processing Unit) 1005, An audio data buffer 1006, a video data buffer 1007, a speaker 1008, and a monitor 1009 are provided.

図5において、マルチメディアストリームバッファ1001は、例えば、マルチメディア符号化データを格納するDVDディスクである。例えば、マルチメディアストリームバッファ1001から光ピックアップを用いて読み込まれたシステムストリームは、システムストリーム分離部1002においてビデオストリームとオーディオストリームとに分離され、オーディオストリームはオーディオ復号部1003において、ビデオストリームはビデオ復号部1004において、それぞれ圧縮されたデータの復号処理が施される。なお、符号化データ、ストリーム、ビットストリームは同意語であり、符号化されたデータは、一般的にストリームと呼ばれている。   In FIG. 5, a multimedia stream buffer 1001 is, for example, a DVD disk that stores multimedia encoded data. For example, a system stream read from the multimedia stream buffer 1001 using an optical pickup is separated into a video stream and an audio stream by a system stream separation unit 1002, and the audio stream is decoded by an audio decoding unit 1003 and the video stream is video decoded. The unit 1004 performs a decoding process on each compressed data. Note that encoded data, a stream, and a bit stream are synonyms, and the encoded data is generally called a stream.

オーディオ復号部1003で復号されたオーディオデータや、ビデオ復号部1004で復号されたビデオデータは、出力用バッファ(オーディオデータバッファ1006又はビデオデータバッファ1007)にいったん蓄積される。そして、システムストリームに記述された時間情報に基づいて再生制御を行う制御部1005によって、オーディオデータバッファ1006からのオーディオデータ出力や、ビデオデータバッファ1007からのビデオデータ出力の制御が行われる。オーディオデータバッファ1006から出力されたオーディオデータは、スピーカ1008を通じて音声化され、ビデオデータバッファ1007から出力されたビデオデータは、モニタ1009を通じて映像化される。   The audio data decoded by the audio decoding unit 1003 and the video data decoded by the video decoding unit 1004 are temporarily stored in an output buffer (audio data buffer 1006 or video data buffer 1007). The control unit 1005 that performs playback control based on time information described in the system stream controls audio data output from the audio data buffer 1006 and video data output from the video data buffer 1007. The audio data output from the audio data buffer 1006 is converted into audio through the speaker 1008, and the video data output from the video data buffer 1007 is converted into an image through the monitor 1009.

このように、ビデオデータ及びオーディオデータの同期再生は、マルチメディア符号化データ再生装置1000内の制御部1005で管理され、例えば、オーディオ復号部1003やビデオ復号部1004、あるいは出力用バッファ(オーディオデータバッファ1006やビデオデータバッファ1007)を制御することで実現される。   As described above, the synchronous reproduction of the video data and the audio data is managed by the control unit 1005 in the multimedia encoded data reproduction apparatus 1000. For example, the audio decoding unit 1003, the video decoding unit 1004, or an output buffer (audio data) This is realized by controlling the buffer 1006 and the video data buffer 1007).

また、図6は、従来の技術に係る分離型マルチメディア符号化データ再生装置の一例を示すブロック図であり、図7は、従来の技術に係る分離型マルチメディア符号化データ再生装置の一例を示す外観図である。なお、図6及び図7に示す分離型マルチメディア符号化データ再生装置は、例えば物理的に離れたヘッドフォンやスピーカに対して、光又は電波によってオーディオデータの無線伝送を行うものである。   FIG. 6 is a block diagram illustrating an example of a separated multimedia encoded data reproducing apparatus according to a conventional technique. FIG. 7 illustrates an example of a separated multimedia encoded data reproducing apparatus according to a conventional technique. FIG. The separated multimedia encoded data reproducing apparatus shown in FIGS. 6 and 7 wirelessly transmits audio data by light or radio waves to, for example, physically separated headphones and speakers.

図6に図示されている分離型マルチメディア符号化データ再生装置は、マルチメディア符号化データ再生伝送装置2001と、オーディオ再生装置2002とを有している。図6に示す分離型マルチメディア符号化データ再生装置は、例えば図7に図示されているように、マルチメディア符号化データ再生伝送装置2001として機能し、映像出力を行うモニタや操作ボタンなどを有する本体装置3001と、オーディオ再生装置2002として機能するヘッドフォン3002とのセットに相当する。すなわち、図6に図示されている分離型マルチメディア符号化データ再生装置は、図5に図示されているマルチメディア符号化データ再生装置からオーディオ再生装置を分離し、無線によってオーディオデータの伝送を行うように構成されている。   The separation type multimedia encoded data reproduction apparatus shown in FIG. 6 includes a multimedia encoded data reproduction transmission apparatus 2001 and an audio reproduction apparatus 2002. The separation type multimedia encoded data reproduction apparatus shown in FIG. 6 functions as a multimedia encoded data reproduction transmission apparatus 2001, for example, as shown in FIG. 7, and has a monitor for performing video output, operation buttons, and the like. This corresponds to a set of a main device 3001 and a headphone 3002 that functions as the audio playback device 2002. That is, the separated multimedia encoded data reproduction device shown in FIG. 6 separates the audio reproduction device from the multimedia encoded data reproduction device shown in FIG. 5, and transmits audio data wirelessly. It is configured as follows.

図6に図示されているマルチメディア符号化データ再生伝送装置2001は、マルチメディアストリームバッファ2101、システムストリーム分離部2102、オーディオ復号部2103、ビデオ復号部2104、制御部2105、オーディオデータバッファ2106、ビデオデータバッファ2107、モニタ2109、オーディオデータ送信部2110を有している。ただし、後述のように、オーディオ復号部2103は必ずしも実装される必要はない。   The multimedia encoded data reproduction / transmission apparatus 2001 shown in FIG. 6 includes a multimedia stream buffer 2101, a system stream separation unit 2102, an audio decoding unit 2103, a video decoding unit 2104, a control unit 2105, an audio data buffer 2106, and a video. A data buffer 2107, a monitor 2109, and an audio data transmission unit 2110 are included. However, as will be described later, the audio decoding unit 2103 is not necessarily implemented.

なお、図5に図示されているマルチメディア符号化データ再生装置1000と比較した場合、図5のマルチメディア符号化データ再生装置1000は、スピーカ1008から音声を出力する一方、図6に図示されているマルチメディア符号化データ再生伝送装置2001は、オーディオデータ送信部2110を通じてオーディオ再生装置2002に、オーディオデータを無線伝送するように構成されている点で異なっているが、その他の機能(各ブロックの機能)は基本的に同一である。   When compared with the multimedia encoded data reproduction apparatus 1000 shown in FIG. 5, the multimedia encoded data reproduction apparatus 1000 of FIG. 5 outputs audio from the speaker 1008, while shown in FIG. The multimedia encoded data reproduction / transmission device 2001 is different in that it is configured to wirelessly transmit audio data to the audio reproduction device 2002 through the audio data transmission unit 2110. The function) is basically the same.

一方、図6に図示されているオーディオ再生装置2002は、オーディオデータ受信部2201、オーディオ復号部2202、オーディオデータバッファ2203、スピーカ2204を有している。マルチメディア符号化データ再生伝送装置2001から送られてくるオーディオデータは、オーディオデータ受信部2201で受信された後、オーディオ復号部2202による復号処理と、オーディオデータバッファ2203によるバッファを経て、スピーカ2204から音声出力される。   On the other hand, the audio playback device 2002 illustrated in FIG. 6 includes an audio data receiving unit 2201, an audio decoding unit 2202, an audio data buffer 2203, and a speaker 2204. The audio data transmitted from the multimedia encoded data reproduction / transmission apparatus 2001 is received by the audio data receiving unit 2201, and after being decoded by the audio decoding unit 2202 and the buffer by the audio data buffer 2203, the audio data is received from the speaker 2204. Sound is output.

なお、マルチメディア符号化データ再生伝送装置2001にオーディオ復号部2103が実装されている場合には、オーディオ再生装置2002にオーディオ復号部2202が実装される必要はなく、逆に、オーディオ再生装置2002にオーディオ復号部2202が実装されている場合には、マルチメディア符号化データ再生伝送装置2001にオーディオ復号部2103が実装される必要はない。   Note that when the audio decoding unit 2103 is implemented in the multimedia encoded data reproduction / transmission device 2001, the audio decoding unit 2202 does not need to be implemented in the audio reproduction device 2002, and conversely, in the audio reproduction device 2002. When the audio decoding unit 2202 is installed, the audio decoding unit 2103 need not be installed in the multimedia encoded data reproduction / transmission apparatus 2001.

例えば、マルチメディア符号化データ再生伝送装置2001にオーディオ復号部2103が実装されている場合には、オーディオ再生装置2002への無線伝送に伴う遅延やバッファ遅延を考慮した分を加味して、マルチメディア符号化データ再生伝送装置2001の制御部2105でビデオデータやオーディオデータの出力タイミング制御を行うことで、図5に図示されているマルチメディア符号化データ再生装置1000と同様に、ビデオデータ及びオーディオデータの同期再生を実現することが可能となる。   For example, when the audio decoding unit 2103 is mounted in the multimedia encoded data reproduction / transmission device 2001, the multimedia is taken into account in consideration of delays associated with wireless transmission to the audio reproduction device 2002 and buffer delay. The control unit 2105 of the encoded data reproduction / transmission apparatus 2001 controls the output timing of video data and audio data, so that the video data and the audio data are the same as the multimedia encoded data reproduction apparatus 1000 shown in FIG. Can be realized.

一方、逆にオーディオ再生装置2002にオーディオ復号部2202が実装されている場合には、上述の特許文献1に開示されている技術のように、マルチメディア符号化データ再生伝送装置2001及びオーディオ再生装置2002がそれぞれ参照している基準時刻のずれ量を調べることによってビデオデータの出力タイミングとオーディオデータの出力タイミングとのずれを調整したり、単位時間当たりのオーディオデータバッファ蓄積量の変化度合いから、オーディオ再生装置2002においてオーディオデータの出力タイミングを制御したりする必要がある。なお、ビデオデータの出力タイミングとオーディオデータの出力タイミングとのずれは、物理的に分離した本体側のマルチメディア符号化データ再生伝送装置2001の基準動作周波数と、ヘッドフォン側のオーディオ再生装置2002の基準動作周波数とが異なるために生じる現象である。   On the other hand, when the audio decoding unit 2202 is mounted on the audio reproduction device 2002, the multimedia encoded data reproduction / transmission device 2001 and the audio reproduction device, as in the technique disclosed in Patent Document 1 described above. The difference between the output timing of the video data and the output timing of the audio data is adjusted by examining the shift amount of the reference time each referred to by 2002, and the audio data buffer storage amount per unit time is adjusted based on the change degree of the audio data buffer. It is necessary to control the output timing of audio data in the playback apparatus 2002. Note that the difference between the output timing of the video data and the output timing of the audio data is based on the reference operating frequency of the multimedia encoded data playback / transmission apparatus 2001 on the main body side and the reference of the audio playback apparatus 2002 on the headphone side. This is a phenomenon that occurs because the operating frequency is different.

また、図8には、従来の技術におけるマルチメディアシステムストリームの代表であるMPEG−2(Motion Picture Experts Group - 2)のシステムストリームのデータ構造が図示されている。なお、図8には一例として、PS(Program Stream:プログラムストリーム)と呼ばれる主に蓄積系メディアに記録される場合に用いられるフォーマットが図示されている。MPEG−2のシステムストリームのデータ構造の別の代表的なフォーマットとしては、TS(Transport Stream:トランスポートストリーム)が規定されているが、このTSは、主に通信や放送系のアプリケーションに利用されるものであり、以下では、蓄積メディアの再生を行うことを想定して、主にPSフォーマットについて説明する。   FIG. 8 shows a data structure of a system stream of MPEG-2 (Motion Picture Experts Group-2), which is a representative multimedia system stream in the prior art. FIG. 8 shows, as an example, a format used when recording on a storage medium called PS (Program Stream). As another typical format of the data structure of the MPEG-2 system stream, TS (Transport Stream) is defined. This TS is mainly used for communication and broadcasting applications. In the following, the PS format will be mainly described assuming that the storage medium is reproduced.

PSは一般的なマルチメディアシステムストリームであり、ビデオデータ、オーディオデータ、時間情報などを含む補助情報が所定の単位量で細分化された後、多重化された構造を有している。PSは、複数の可変長のPES(Packetized Elementary Stream)パケットが更に複数連続したPSパックにより構成されている。ここで、Elementary Stream(エレメンタリストリーム)はESと呼ばれるビデオ要素データ、オーディオ要素データである。   PS is a general multimedia system stream, and has a structure in which auxiliary information including video data, audio data, time information, etc. is subdivided into a predetermined unit amount and then multiplexed. The PS is configured by a PS pack in which a plurality of variable length PES (Packetized Elementary Stream) packets are further continued. Here, Elementary Stream (elementary stream) is video element data and audio element data called ES.

PSパック内のPESパケットは、同時刻に再生されるべきオーディオESやビデオESが集まったものである。さらに、PESパケット内のヘッダには、スタートコード、ストリームの種類(ビデオ、オーディオ、データ)データ長が含まれており、さらに、PESのオプション情報を記述する部分(PES_header_option_data)が用意されている。このオプション情報の中には、PTS(ビデオやオーディオの表示又は出力時間)やDTS(復号開始時間)といった時間を管理する情報が含まれており、ビデオとオーディオの同期再生を実現する指標として用いることが可能となっている。
特開2004−7140号公報(図1、4、7)
The PES packet in the PS pack is a collection of audio ES and video ES to be reproduced at the same time. Further, the header in the PES packet includes a start code, a stream type (video, audio, data) data length, and a part (PES_header_option_data) describing PES option information. The option information includes information for managing time such as PTS (video or audio display or output time) and DTS (decoding start time), and is used as an index for realizing synchronized playback of video and audio. It is possible.
JP 2004-7140 A (FIGS. 1, 4, and 7)

上述のように、マルチメディア符号化データの再生の際に、ビデオデータの再生(モニタへの出力)を行うビデオ再生装置とは、物理的に離れた場所に存在するオーディオ再生装置に対して、リアルタイムにオーディオデータを無線伝送することで、ビデオ再生装置におけるビデオ再生と、オーディオ再生装置におけるオーディオ再生との同時再生が行われている。   As described above, when playing back multimedia encoded data, a video playback device that plays back video data (output to a monitor) is an audio playback device that is physically separated from the audio playback device. By wirelessly transmitting audio data in real time, simultaneous playback of video playback on the video playback device and audio playback on the audio playback device is performed.

ところで、最近では公共の場での電波を利用する場合のマナーについて、身体的影響も含め、社会的に問題視されている。特に電車内や病院のような公的機関内での携帯電話の利用は、周囲の人々への騒音や人体への危険性などが懸念されており、事実上の使用制限がかけられている。電波を利用したオーディオデータの送信についても同様のことが当てはまる。したがって、ビデオデータとの同期再生の際に、電波を用いてオーディオデータをリアルタイムに無線伝送することは、各家庭内の閉じられた空間や周囲に影響を及ぼさない空間であれば非常に有効な技術であるが、電波の利用が好ましくない状況においては、あまり好適な技術であるとは言えない。   By the way, recently, manners when using radio waves in public places are regarded as social problems including physical effects. In particular, the use of mobile phones in public institutions such as trains and hospitals is concerned with noise to the people around them and danger to the human body, and there are practical restrictions on their use. The same applies to the transmission of audio data using radio waves. Therefore, when synchronized playback with video data, wireless transmission of audio data in real time using radio waves is very effective if it is a closed space in each home or a space that does not affect the surroundings. Although it is a technology, it cannot be said to be a very suitable technology in situations where the use of radio waves is not preferred.

したがって、ビデオデータとオーディオデータの同期再生の際に、物理的に離れた場所に存在するオーディオ再生装置に対して、電波を利用してリアルタイムにオーディオデータを無線伝送することは、特に、電車の中や公共性の高い施設の中での使用に適していない。すなわち、例えば、上述のブルートゥース(登録商標)や5GHz帯又は2.4GHz帯を用いた伝送方式などの電波を利用して、リアルタイムにオーディオデータの無線伝送を行うことは、基本的に避ける必要がある。   Therefore, when synchronized playback of video data and audio data, wireless transmission of audio data in real time using radio waves to an audio playback device that is located physically apart is particularly important for trains. Not suitable for use in medium or highly public facilities. That is, for example, wireless transmission of audio data in real time using the above-described Bluetooth (registered trademark), a transmission method using a 5 GHz band or a 2.4 GHz band, or the like must be basically avoided. is there.

一方、ヘッドフォンやスピーカにコードが接続していないワイヤレス接続は、ユーザに対して、高い利便性を有する快適な環境を提供することができる。例えば、ワイヤレスな状態を保ちながら、かつ電波を用いずにオーディオデータを無線伝送する技術としては、上述のように、赤外線などの光を利用した無線伝送方式(赤外線無線伝送方式)が有効である。   On the other hand, wireless connection in which a cord is not connected to headphones or speakers can provide a comfortable environment with high convenience to the user. For example, as described above, a wireless transmission method (infrared wireless transmission method) using light such as infrared rays is effective as a technique for wirelessly transmitting audio data without using radio waves while maintaining a wireless state. .

ビデオデータとオーディオデータの同期再生の際に、物理的に離れた場所に存在するオーディオ再生装置に対して、リアルタイムにオーディオデータを伝送するために光を利用した無線伝送方式を採用した場合、オーディオデータの送信側(図6に図示されているマルチメディア符号化データ再生伝送装置2001に対応)、及びオーディオデータの受信側(図6に図示されているオーディオ再生装置2002に対応)の両方に光の送受信を行うための光送受信ユニットを設け、この光送受信ユニットを介して、オーディオデータがリアルタイムに送信されるようにする必要がある。しかしながら、この光送受信ユニットは、電波を利用した送受信ユニットに比べて高価であるという問題、光送受信ユニットは小型化が困難なため、装置(例えば、DVDプレーヤの本体やヘッドフォン)自体の小型化が妨げられてしまうという問題などが生じる。   When synchronized playback of video data and audio data, if a wireless transmission method using light is used to transmit audio data in real time to an audio playback device that is physically located, audio Light is transmitted to both the data transmission side (corresponding to the multimedia encoded data reproduction / transmission apparatus 2001 shown in FIG. 6) and the audio data reception side (corresponding to the audio reproduction apparatus 2002 shown in FIG. 6). It is necessary to provide an optical transmission / reception unit for performing transmission / reception of audio data, and to transmit audio data in real time via this optical transmission / reception unit. However, this optical transmission / reception unit is more expensive than a transmission / reception unit using radio waves, and it is difficult to reduce the size of the optical transmission / reception unit. The problem of being disturbed arises.

上述のように、オーディオデータの無線伝送に電波を用いた場合には、装置のコストの低減化や小型化などを実現することは可能となるが、例えば、電波が人体に与える影響などを始めとして周囲の環境に与える影響を十分に考慮する必要があるという課題が生じる。一方、オーディオデータの無線伝送に光を用いた場合には、電波の利用時に生じる周囲の環境への影響を考慮する必要はなくなるが、光送受信ユニットの設置に伴うコストアップや、装置の大型化や高重量化などによって、利便性が低下するという課題が生じる。これらの課題に鑑みながら、ヘッドフォンやスピーカなどのワイヤレス接続を維持し、マルチメディア符号化データの快適な再生環境を実現することが望ましい。   As described above, when radio waves are used for wireless transmission of audio data, it is possible to reduce the cost and size of the apparatus. However, for example, the effects of radio waves on the human body, etc. As a result, there arises a problem that it is necessary to sufficiently consider the influence on the surrounding environment. On the other hand, when light is used for wireless transmission of audio data, it is not necessary to consider the impact on the surrounding environment that occurs when radio waves are used, but this increases the costs associated with the installation of optical transceiver units and increases the size of the device. There is a problem that convenience is reduced due to the increase in weight and the like. In view of these problems, it is desirable to maintain a wireless connection such as headphones and speakers and to realize a comfortable reproduction environment for multimedia encoded data.

本発明は、上記の課題を解決するために、ビデオ再生装置とオーディオ再生装置とが物理的に離れた場所に存在し、無線によって接続している状態(ワイヤレス接続状態)の利便性を維持したまま、例えば公共性の高い場所などを始めとする電波使用が制限されている環境においても、簡易な構成によってビデオデータとオーディオデータの同期再生を実現することを可能にするマルチメディア符号化データ分離伝送装置を提供することを目的とする。   In order to solve the above problems, the present invention maintains the convenience of a state in which the video playback apparatus and the audio playback apparatus are physically separated and connected wirelessly (wireless connection state). Multimedia encoded data separation that enables synchronized playback of video and audio data with a simple configuration, even in environments where radio wave usage is restricted, such as in highly public places An object is to provide a transmission apparatus.

上記の目的を達成するため、本発明によれば、ビデオ符号化データと、オーディオ符号化データと、前記各符号化データの再生時間の管理を行うための時間情報を含む補助情報とが多重化されたマルチメディア符号化データが記録されている記録媒体から、前記マルチメディア符号化データを読み出すマルチメディア符号化データ読み出し手段と、
前記マルチメディア符号化データ読み出し手段で読み出された前記マルチメディア符号化データから、前記オーディオ符号化データ及び前記補助情報を分離抽出するマルチメディア符号化データ分離手段と、
前記オーディオ符号化データに係るオーディオ再生が所定のオーディオ再生装置において行われるように、前記マルチメディア符号化データ分離手段で分離抽出された前記オーディオ符号化データ及び前記補助情報を再構成するオーディオ再構成手段と、
前記オーディオ再構成手段で再構成された前記オーディオ符号化データ及び前記補助情報を、前記所定のオーディオ再生装置に送信するデータ送信手段
前記オーディオ再構成手段で再構成された前記オーディオ符号化データ及び前記補助情報を、前記所定のオーディオ再生装置に送信した後における、前記マルチメディア符号化データの再生動作に係る外部からの指示を入力するための操作入力手段と、
前記操作入力手段で入力された前記再生動作に係る再生位置を示す時間情報を含む前記補助情報と、前記再生動作の開始指示を行うための操作情報とを、前記所定のオーディオ再生装置に無線を介して送信する無線信号送信手段と、
前記マルチメディア符号化データに含まれる前記ビデオ符号化データに関し、前記操作入力手段で入力された前記再生動作に係る前記再生位置以降の復号処理を行うビデオ復号手段と、
前記ビデオ復号手段における前記ビデオ符号化データの復号処理によって生成されたビデオデータによる映像を視覚的に表示する映像表示手段とを、
有するマルチメディア符号化データ分離伝送装置が提供される。
To achieve the above object, according to this onset bright, and encoded video data, and audio encoded data, said auxiliary information including time information for managing the playback time of each encoded data is multiplexed Multimedia encoded data reading means for reading the multimedia encoded data from a recording medium on which the encoded multimedia encoded data is recorded;
Multimedia encoded data separating means for separating and extracting the audio encoded data and the auxiliary information from the multimedia encoded data read by the multimedia encoded data reading means;
Audio reconfiguration for reconstructing the audio encoded data and the auxiliary information separated and extracted by the multimedia encoded data separation means so that audio reproduction related to the audio encoded data is performed in a predetermined audio reproduction device Means,
Said audio encoded data and the auxiliary information reconstructed by the audio reconstruction means, and a data transmission means for transmitting to said predetermined audio reproduction apparatus,
An instruction from the outside regarding the reproduction operation of the multimedia encoded data after the audio encoded data and the auxiliary information reconstructed by the audio reconstructing means are transmitted to the predetermined audio reproducing device is input. Operation input means for
The auxiliary information including time information indicating the reproduction position related to the reproduction operation input by the operation input unit and the operation information for instructing the start of the reproduction operation are wirelessly transmitted to the predetermined audio reproduction device. Wireless signal transmission means for transmitting via
Video decoding means for performing decoding processing after the reproduction position related to the reproduction operation input by the operation input means with respect to the video encoded data included in the multimedia encoded data;
Video display means for visually displaying video based on video data generated by the decoding process of the video encoded data in the video decoding means;
An apparatus for separating and transmitting multimedia encoded data is provided.

本発明は、上記の構成を有しており、ビデオ再生装置とオーディオ再生装置とが物理的に離れた場所に存在し、無線によって接続している状態(ワイヤレス接続状態)を維持したまま、例えば公共性の高い場所などを始めとする電波使用が制限されている環境においても、簡易な構成によってビデオデータとオーディオデータの同期再生を実現し、ワイヤレス接続に係る利便性の維持、装置の低コスト化、装置の小型化や低重量化を可能にするという効果を有している。   The present invention has the above-described configuration, and the video playback apparatus and the audio playback apparatus exist in physically separated locations and maintain a wireless connection state (wireless connection state), for example, Even in environments where radio wave use is restricted, such as in highly public places, it is possible to achieve synchronized playback of video data and audio data with a simple configuration, maintain the convenience of wireless connection, and reduce the cost of equipment And having the effect of enabling downsizing and weight reduction of the apparatus.

以下、本発明を実施するための形態について図面を参照しながら説明する。本発明の実施の形態におけるビデオデータとオーディオデータの同期再生方法は、再生前の準備段階(前工程段階)、実際にユーザが視聴を行う再生段階(後工程段階)の2つの段階に大きく分けられる。   Hereinafter, embodiments for carrying out the present invention will be described with reference to the drawings. The synchronized playback method of video data and audio data according to the embodiment of the present invention is roughly divided into two stages: a preparation stage before playback (pre-process stage) and a playback stage (post-process stage) in which the user actually watches. It is done.

まず、図1を参照しながら、再生前の準備段階である前工程段階について説明する。図1は本発明の実施の形態において、前工程段階に係る処理を行うマルチメディア符号化データ分離伝送装置及びオーディオ再生装置の構成の一例を示すブロック図である。   First, the pre-process stage, which is a pre-reproduction stage, will be described with reference to FIG. FIG. 1 is a block diagram showing an example of the configuration of a multimedia encoded data separating and transmitting apparatus and an audio reproducing apparatus that perform processing related to the previous process stage in the embodiment of the present invention.

図1には、マルチメディア符号化データ分離伝送装置100と、オーディオ再生装置200とが図示されている。図1に図示されているマルチメディア符号化データ分離伝送装置100は、マルチメディアストリームバッファ101、システムストリーム分離部102、オーディオストリームバッファ103、補助情報バッファ104、オーディオストリーム再構成部105、オーディオストリーム送信部106を有している。また、図1に図示されているオーディオ再生装置200は、オーディオストリーム受信部201、オーディオストリームバッファ202、後工程段階に係る処理を行う後工程処理部203を有している。   FIG. 1 shows a multimedia encoded data separation / transmission apparatus 100 and an audio reproduction apparatus 200. A multimedia encoded data separation / transmission apparatus 100 shown in FIG. 1 includes a multimedia stream buffer 101, a system stream separation unit 102, an audio stream buffer 103, an auxiliary information buffer 104, an audio stream reconstruction unit 105, and an audio stream transmission. Part 106 is provided. 1 includes an audio stream receiving unit 201, an audio stream buffer 202, and a post-process processing unit 203 that performs a process related to a post-process stage.

マルチメディアストリームバッファ101は、マルチメディア符号化データを格納することが可能な記憶媒体であり、例えば、このマルチメディア符号化データ分離伝送装置100の本体がDVDプレーヤであればDVDディスクに相当し、携帯電話機やPDA(Personal Digital Assistance)を始めとするマルチメディア再生機能を有する情報端末であれば、HDD(Hard Disc Drive:ハードディスクドライブ)や半導体メモリなどに相当する。なお、ここでは、ユーザが視聴を所望するコンテンツに係るマルチメディアシステムストリームが、このマルチメディアストリームバッファ101にあらかじめ格納されているものとする。   The multimedia stream buffer 101 is a storage medium capable of storing multimedia encoded data. For example, if the main body of the multimedia encoded data separating / transmitting apparatus 100 is a DVD player, it corresponds to a DVD disk. An information terminal having a multimedia playback function such as a mobile phone or PDA (Personal Digital Assistance) corresponds to an HDD (Hard Disc Drive), a semiconductor memory, or the like. Here, it is assumed that the multimedia system stream related to the content that the user desires to view is stored in advance in the multimedia stream buffer 101.

一般に、マルチメディア符号化データはビデオデータとオーディオデータ、更にはコンテンツの内容を符号化した情報や、コンテンツ識別情報、その他の補助情報(特に、時間情報及び属性情報を含む)によって構成されており、それぞれ個別の符号化方式に従って情報圧縮された後(情報圧縮されない場合もある)、それぞれが多重化されてシステムストリーム(マルチメディアシステムストリーム)が生成される。したがって、ビデオ符号化データやオーディオ符号化データを復号する際には、あらかじめシステムストリームからそれぞれの要素(エレメンタリストリーム)が分離抽出される必要がある。   In general, multimedia encoded data is composed of video data and audio data, as well as information obtained by encoding content, content identification information, and other auxiliary information (including time information and attribute information in particular). After the information is compressed according to the respective encoding methods (the information may not be compressed), each is multiplexed to generate a system stream (multimedia system stream). Therefore, when decoding video encoded data or audio encoded data, it is necessary to extract and extract each element (elementary stream) from the system stream in advance.

マルチメディアストリームバッファ101から読み出されたシステムストリームは、システムストリーム分離部102において、オーディオストリームと、システムストリームに付随する補助情報(特に、時間情報及び属性情報を含む)とに分離される。システムストリーム分離部102における分離後、オーディオストリームはオーディオストリームバッファ103に、補助情報は補助情報バッファ104にそれぞれ格納される。   The system stream read from the multimedia stream buffer 101 is separated into an audio stream and auxiliary information (particularly including time information and attribute information) associated with the system stream by the system stream separation unit 102. After separation by the system stream separation unit 102, the audio stream is stored in the audio stream buffer 103, and the auxiliary information is stored in the auxiliary information buffer 104.

オーディオストリームの伝送先となるオーディオ再生装置200では、単にシステムストリーム分離部102で分離されたオーディオストリームのみが提供されても再生を行うことはできない。すなわち、オーディオ再生装置200でオーディオストリームの再生を行う場合には、このオーディオストリームに付随するコンテンツの情報や再生時間管理を行うための補助情報が必要である。そこで、マルチメディア符号化データ分離伝送装置100のオーディオストリーム再構成部105は、オーディオストリームバッファ103に格納されているオーディオストリームに、補助情報バッファ104に格納されている補助情報を多重化して、新たなオーディオストリームを再構成する。なお、再構成されたオーディオストリームは、オーディオ再生装置200で再生可能な状態に生成される。   The audio playback device 200 that is the transmission destination of the audio stream cannot perform playback even if only the audio stream separated by the system stream separation unit 102 is provided. That is, when an audio stream is played back by the audio playback device 200, content information accompanying the audio stream and auxiliary information for managing playback time are required. Therefore, the audio stream reconstructing unit 105 of the multimedia encoded data separation and transmission apparatus 100 multiplexes the auxiliary information stored in the auxiliary information buffer 104 into the audio stream stored in the audio stream buffer 103, and creates a new one. The correct audio stream. The reconstructed audio stream is generated so that it can be played back by the audio playback device 200.

オーディオストリーム再構成部105で再構成されたオーディオストリームは、オーディオストリーム送信部106を通じて、マルチメディア符号化データ分離伝送装置100から物理的に離れたオーディオ再生装置200に伝送される。なお、マルチメディア符号化データ分離伝送装置100からオーディオ再生装置200へのオーディオストリームの伝送方式は、特に限定されるものではなく、例えばUSB(Universal Serial Bus)を介した有線伝送や、赤外光や電波を用いた無線伝送などを採用することが可能である。また、例えばオーディオストリーム再構成部105で再構成されたオーディオストリームが可搬性の記憶媒体に格納され、この可搬性の記憶媒体の着脱によって、マルチメディア符号化データ分離伝送装置100からオーディオ再生装置200に、再構成されたオーディオストリームが移動されてもよい。   The audio stream reconstructed by the audio stream reconstructing unit 105 is transmitted through the audio stream transmitting unit 106 to the audio reproducing device 200 physically separated from the multimedia encoded data separation / transmission device 100. Note that the transmission method of the audio stream from the multimedia encoded data separation transmission device 100 to the audio reproduction device 200 is not particularly limited, and for example, wired transmission via USB (Universal Serial Bus), infrared light, or the like. Or wireless transmission using radio waves can be employed. Further, for example, the audio stream reconstructed by the audio stream reconstructing unit 105 is stored in a portable storage medium, and the audio reproduction apparatus 200 is separated from the multimedia encoded data separation / transmission apparatus 100 by attaching / detaching the portable storage medium. Alternatively, the reconstructed audio stream may be moved.

一方、例えば、オーディオストリーム送信部106から送信されたオーディオストリームは、オーディオ再生装置200のオーディオストリーム受信部201で受信され、オーディオ再生装置200内に設けられているオーディオストリームバッファ202に格納されて、再生前の準備(前工程段階)が終了となる。なお、オーディオストリームバッファ202に格納された、再構成されたオーディオストリームは、後工程段階の際に後工程処理部203で再生処理されるが、後工程処理部203に関しては後で詳述する。   On the other hand, for example, the audio stream transmitted from the audio stream transmission unit 106 is received by the audio stream reception unit 201 of the audio reproduction device 200, stored in the audio stream buffer 202 provided in the audio reproduction device 200, Preparation before reproduction (pre-process stage) is completed. Note that the reconstructed audio stream stored in the audio stream buffer 202 is reproduced by the post-process processing unit 203 at the post-process stage. The post-process processing unit 203 will be described in detail later.

以上のように、前工程段階では、マルチメディア符号化データ分離伝送装置100において、マルチメディア符号化データからオーディオストリーム及び補助情報がいったん分離された後、オーディオストリームに補助情報が多重化されて、ビデオストリームを除いた状態でオーディオストリームが再構成される。そして、この再構成されたオーディオストリームが、オーディオ再生装置200にあらかじめ格納される。前工程段階において、再構成されたオーディオストリームがオーディオ再生装置200にあらかじめ格納されることにより、実際の再生処理(後述の後工程段階)の際には、マルチメディア符号化データ分離伝送装置100からオーディオ再生装置200に、オーディオデータがリアルタイムで伝送される必要がなくなる。   As described above, in the pre-process stage, after the audio stream and the auxiliary information are once separated from the multimedia encoded data in the multimedia encoded data separating and transmitting apparatus 100, the auxiliary information is multiplexed into the audio stream, The audio stream is reconstructed without the video stream. The reconstructed audio stream is stored in the audio playback device 200 in advance. In the pre-process stage, the reconstructed audio stream is stored in the audio playback apparatus 200 in advance, so that the multimedia encoded data separation / transmission apparatus 100 can perform the actual playback process (the post-process stage described later). Audio data need not be transmitted to the audio playback device 200 in real time.

次に、実際にユーザが視聴を行う再生段階である後工程段階について説明する。図2は本発明の実施の形態において、後工程段階に係る処理を行うマルチメディア符号化データ再生装置の構成の一例を示すブロック図である。   Next, a post-process stage, which is a playback stage where the user actually watches, will be described. FIG. 2 is a block diagram showing an example of a configuration of a multimedia encoded data reproducing apparatus that performs processing related to a post-process stage in the embodiment of the present invention.

図2に図示されている分離型マルチメディア符号化データ再生装置は、マルチメディア符号化データ再生装置300と、オーディオ再生装置200とを有している。図2に図示されているマルチメディア符号化データ再生装置300は、マルチメディアストリームバッファ301、システムストリーム分離部302、補助情報抽出部303、ビデオ復号部304、制御部305、補助情報/操作情報送信部306、ビデオデータバッファ307、モニタ308を有している。なお、マルチメディア符号化データ再生装置300は、モニタ308から映像出力を行うことが可能なビデオ再生装置である。   The separation type multimedia encoded data reproduction apparatus shown in FIG. 2 includes a multimedia encoded data reproduction apparatus 300 and an audio reproduction apparatus 200. The multimedia encoded data playback device 300 shown in FIG. 2 includes a multimedia stream buffer 301, a system stream separation unit 302, an auxiliary information extraction unit 303, a video decoding unit 304, a control unit 305, and auxiliary information / operation information transmission. Section 306, video data buffer 307, and monitor 308. Note that the multimedia encoded data playback device 300 is a video playback device that can output video from the monitor 308.

一方、図2に図示されているオーディオ再生装置200は、図1に図示されているオーディオ再生装置200と同一であり、オーディオストリームバッファ202に、再構成されたオーディオストリームが格納されている。また、図2には、再構成されたオーディオストリームの再生処理を行うためのオーディオ再生装置200の構成要素(図1に図示されている後工程処理部203)の詳細に関しても図示されている。すなわち、図2に図示されているオーディオ再生装置200は、オーディオストリーム受信部201、オーディオストリームバッファ202、補助情報/操作情報受信部204、制御部205、オーディオ復号部206、オーディオデータバッファ207、スピーカ208を有している。   On the other hand, the audio playback device 200 illustrated in FIG. 2 is the same as the audio playback device 200 illustrated in FIG. 1, and a reconfigured audio stream is stored in the audio stream buffer 202. FIG. 2 also shows details of the components of the audio playback device 200 (the post-processing unit 203 shown in FIG. 1) for performing playback processing of the reconstructed audio stream. That is, the audio playback device 200 illustrated in FIG. 2 includes an audio stream receiving unit 201, an audio stream buffer 202, an auxiliary information / operation information receiving unit 204, a control unit 205, an audio decoding unit 206, an audio data buffer 207, a speaker. 208.

なお、図1に図示されているマルチメディア符号化データ分離伝送装置100と、図2に図示されているマルチメディア符号化データ再生装置300とは同一の装置で実現されることが好ましいが、異なる装置によって実現されてもよい。   The multimedia encoded data separation / transmission apparatus 100 shown in FIG. 1 and the multimedia encoded data reproduction apparatus 300 shown in FIG. 2 are preferably implemented by the same apparatus, but are different. It may be realized by a device.

すなわち、例えば、図7に図示されている本体装置3001によって、図2に図示されているマルチメディア符号化データ再生装置300を実現し、図7に図示されているヘッドフォン3002によって、図2に図示されているオーディオ再生装置200を実現した場合、図1に図示されているマルチメディア符号化データ分離伝送装置100の機能を、本体装置3001に設けて、図1に図示されているマルチメディア符号化データ分離伝送装置100と、図2に図示されているマルチメディア符号化データ再生装置300の両方の機能を1つの装置によって実現することが好ましい。しかしながら、例えば、図1に図示されているマルチメディア符号化データ分離伝送装置100を、固定型のDVDプレーヤやPC(Personal Computer:パーソナルコンピュータ)などによって実現する一方、本体装置3001には、図2に図示されているマルチメディア符号化データ再生装置300の機能のみを設けることも可能である。この場合には、ユーザは固定型のDVDプレーヤやPCでオーディオデータの再構成を行い、この再構成されたオーディオデータが、オーディオ再生装置200にあらかじめ格納されるとともに、図7に図示されている本体装置3001を用いてオーディオ再生装置200の再生制御が行われる。   That is, for example, the multimedia encoded data reproduction device 300 shown in FIG. 2 is realized by the main body device 3001 shown in FIG. 7, and the headphone 3002 shown in FIG. 1 is provided, the main body apparatus 3001 is provided with the function of the multimedia encoded data separation / transmission apparatus 100 shown in FIG. 1, and the multimedia encoding shown in FIG. It is preferable that the functions of both the data separation and transmission apparatus 100 and the multimedia encoded data reproduction apparatus 300 shown in FIG. 2 are realized by one apparatus. However, for example, the multimedia encoded data separation / transmission apparatus 100 shown in FIG. 1 is realized by a fixed DVD player, a personal computer (PC), or the like. It is also possible to provide only the function of the multimedia encoded data reproduction device 300 shown in FIG. In this case, the user reconstructs audio data using a fixed DVD player or PC, and the reconstructed audio data is stored in advance in the audio playback device 200 and is shown in FIG. Playback control of the audio playback device 200 is performed using the main body device 3001.

図2に図示されているマルチメディア符号化データ再生装置300において、例えば、ユーザの操作によってコンテンツの再生指示が行われた場合には、まず、再生対象のコンテンツに係るマルチメディア符号化データが、マルチメディアストリームバッファ301から読み出される。なお、再生対象のコンテンツは、上述のように、図1に図示されているマルチメディア符号化データ分離伝送装置100によって再構成処理が行われており、そのコンテンツに係る再構成されたオーディオデータは、既にオーディオ再生装置200に格納されているものとする。   In the multimedia encoded data reproduction device 300 shown in FIG. 2, for example, when a content reproduction instruction is given by a user operation, first, the multimedia encoded data related to the content to be reproduced is Read from the multimedia stream buffer 301. Note that, as described above, the content to be played is reconstructed by the multimedia encoded data separation and transmission apparatus 100 shown in FIG. 1, and the reconstructed audio data related to the content is Suppose that it is already stored in the audio playback device 200.

システムストリーム分離部302は、マルチメディアストリームバッファ301からシステムストリームを読み込んで分離処理を行い、システムストリーム内に記述されているビデオ・オーディオ同期再生用の補助情報を含むデータを補助情報抽出部303に出力する一方、ビデオストリームをビデオ復号部304に出力する。   The system stream separation unit 302 reads the system stream from the multimedia stream buffer 301 and performs separation processing, and sends data including auxiliary information for video / audio synchronized playback described in the system stream to the auxiliary information extraction unit 303. On the other hand, the video stream is output to the video decoding unit 304.

ビデオ復号部304は、システムストリーム分離部302で分離されたビデオストリームを、ビデオ1フレーム分の各々の画素データを表現する輝度信号と色差信号に変換するなどのビデオ復号処理を行って、処理後のビデオデータをフレームバッファなどのビデオデータバッファ307に出力する。ビデオデータはいったんビデオデータバッファ307に格納された後、制御部305からの出力命令に従ってモニタ308に伝送され、モニタ308を通じて映像出力される。   The video decoding unit 304 performs a video decoding process such as converting the video stream separated by the system stream separation unit 302 into a luminance signal and a color difference signal representing each pixel data for one frame of video, and performs post-processing. Are output to a video data buffer 307 such as a frame buffer. The video data is once stored in the video data buffer 307, then transmitted to the monitor 308 in accordance with an output command from the control unit 305, and video is output through the monitor 308.

一方、補助情報抽出部303は、システムストリーム分離部302で分離された補助情報を含むデータから、コンテンツを識別するためのコンテンツ識別情報や、再生時の位置を示す時間情報などの同期再生に必要な情報を抽出して補助情報とし、この補助情報を補助情報/操作情報送信部306に供給する。補助情報/操作情報送信部306は、制御部305からの指示に従って、コンテンツ識別情報や再生すべきデータの位置などを示す時間情報が含まれる補助情報、ユーザによる動作指示などが含まれる操作情報をオーディオ再生装置200に送信する。なお、補助情報には、例えば、上述のようにシステムストリーム内の時間情報や、コンテンツを識別するコンテンツ識別情報が含まれている。また、操作情報の一例は、例えば、再生開始/再生停止の指示や特殊再生の開始/停止の指示などの指示情報である。なお、本明細書では、再生開始/再生停止や特殊再生の開始/停止などを含め、その他の様々なコンテンツの再生に係る動作を再生動作と呼ぶ。また、補助情報/操作情報送信部306は、上記の補助情報と操作情報とを1つの情報にまとめて、オーディオ再生装置200に送信してもよい。   On the other hand, the auxiliary information extraction unit 303 is necessary for synchronized playback of content identification information for identifying content and time information indicating a position at the time of playback from the data including the auxiliary information separated by the system stream separation unit 302. This information is extracted as auxiliary information, and this auxiliary information is supplied to the auxiliary information / operation information transmitting unit 306. In accordance with an instruction from the control unit 305, the auxiliary information / operation information transmission unit 306 receives operation information including content identification information, auxiliary information including time information indicating the position of data to be reproduced, and operation instructions by the user. The data is transmitted to the audio playback device 200. The auxiliary information includes, for example, time information in the system stream and content identification information for identifying content as described above. An example of the operation information is instruction information such as an instruction to start / stop playback or an instruction to start / stop special playback. In the present specification, operations related to playback of various other contents including start / stop of playback and start / stop of special playback are referred to as playback operations. Further, the auxiliary information / operation information transmission unit 306 may combine the auxiliary information and the operation information into one information and transmit the information to the audio playback device 200.

例えば、マルチメディア符号化データ再生装置300に設けられている操作パネル(図2には不図示)などを用いてユーザが操作入力を行った場合、この操作内容を示す操作情報が制御部305を通じて補助情報/操作情報送信部306に供給されるとともに、この操作情報に関連する補助情報が補助情報抽出部303から読み出されて、補助情報/操作情報送信部306を通じてオーディオ再生装置200に送信される。   For example, when a user inputs an operation using an operation panel (not shown in FIG. 2) provided in the multimedia encoded data reproduction apparatus 300, operation information indicating the operation content is transmitted through the control unit 305. While being supplied to the auxiliary information / operation information transmission unit 306, auxiliary information related to the operation information is read from the auxiliary information extraction unit 303 and transmitted to the audio reproduction device 200 through the auxiliary information / operation information transmission unit 306. The

マルチメディア符号化データ再生装置300の補助情報/操作情報送信部306から送信された補助情報や操作情報は、オーディオ再生装置200の補助情報/操作情報受信部204で受信され、制御部205に送られる。例えば、補助情報として、再生すべきコンテンツを識別するコンテンツ識別情報や再生すべきコンテンツの再生開始位置を示す時間情報が含まれており、操作情報として再生開始を指示する情報が含まれている場合には、オーディオ再生装置200は、この時間情報に対応した位置のオーディオエレメンタリストリームをオーディオストリームバッファ202から読み出し、オーディオ復号部206で操作情報に応じた復号処理(ここでは通常の再生処理)を行うことにより、オーディオデータは、オーディオデータバッファ207を経て、スピーカ208より音声出力される。   The auxiliary information / operation information transmitted from the auxiliary information / operation information transmission unit 306 of the multimedia encoded data reproduction device 300 is received by the auxiliary information / operation information reception unit 204 of the audio reproduction device 200 and transmitted to the control unit 205. It is done. For example, when the auxiliary information includes content identification information for identifying the content to be played back, time information indicating the playback start position of the content to be played back, and information for instructing the start of playback as operation information The audio playback device 200 reads out an audio elementary stream at a position corresponding to this time information from the audio stream buffer 202, and the audio decoding unit 206 performs a decoding process (normal playback process here) according to the operation information. As a result, the audio data is output as audio from the speaker 208 via the audio data buffer 207.

なお、マルチメディア符号化データ再生装置300における映像の再生(モニタ308による映像表示)と、オーディオ再生装置200における音声の再生(スピーカ208からの音声出力)との同期付けが行われる必要がある。この同期処理は、ビデオデータ復号遅延やフレームバッファ蓄積遅延などによって生じるビデオ系の遅延量と、時間情報の補助情報伝送遅延、オーディオ符号化データ復号遅延、オーディオデータ蓄積遅延などによって生じるオーディオ系の遅延量との関係に従って、マルチメディア符号化データ再生装置300からオーディオ再生装置200に対する操作情報の送信タイミング(音声再生指示タイミング)や、映像の再生タイミングを図るためにマルチメディア符号化データ再生装置300内で伝送されるビデオ再生開始タイミングなどがあらかじめ適切なタイミングに設定されることによって実現される。すなわち、補助情報や操作情報の送信による再生指示のタイミングに加えて、各処理における遅延を考慮した映像及び音声のそれぞれの出力タイミングを設定することにより、映像再生及び音声再生のずれをなくして同期させることが可能となる。   Note that it is necessary to synchronize the reproduction of video (video display by the monitor 308) in the multimedia encoded data reproduction device 300 and the reproduction of audio (audio output from the speaker 208) in the audio reproduction device 200. This synchronization processing is based on the video system delay amount caused by the video data decoding delay and the frame buffer accumulation delay, and the audio system delay caused by the auxiliary information transmission delay of the time information, the audio encoded data decoding delay, the audio data accumulation delay, etc. According to the relationship with the amount, the transmission information of the operation information (audio reproduction instruction timing) from the multimedia encoded data reproduction apparatus 300 to the audio reproduction apparatus 200 and the multimedia encoded data reproduction apparatus 300 in order to determine the video reproduction timing This is realized by setting the video reproduction start timing transmitted in the above to an appropriate timing in advance. In other words, in addition to the timing of the playback instruction by transmitting auxiliary information and operation information, by setting the output timing of video and audio taking into account the delay in each process, synchronization between video playback and audio playback is eliminated. It becomes possible to make it.

続いて、図3及び図4を参照しながら、図1に図示されているマルチメディア符号化データ分離伝送装置100において再構成されたオーディオストリーム(すなわち、オーディオ再生装置200にあらかじめ格納されたオーディオデータ)の構造について説明する。図3は、本発明の実施の形態において、再構成されたオーディオストリームの構造の第1の例を示す図であり、図4は、本発明の実施の形態において、再構成されたオーディオストリームの構造の第2の例を示す図である。   Subsequently, referring to FIGS. 3 and 4, the audio stream reconstructed in the multimedia encoded data separating and transmitting apparatus 100 shown in FIG. 1 (that is, the audio data stored in advance in the audio reproducing apparatus 200). ) Will be described. FIG. 3 is a diagram illustrating a first example of a structure of a reconstructed audio stream according to the embodiment of the present invention. FIG. 4 is a diagram illustrating a structure of a reconstructed audio stream according to the embodiment of the present invention. It is a figure which shows the 2nd example of a structure.

まず、再構成されるオーディオデータには、コンテンツのビデオデータとオーディオデータとの対応を示すためのコンテンツ識別情報(例えばファイル名やプログラム名)に相当する情報が含まれる必要がある。さらに、再構成されるオーディオデータには、所定の単位時間でフレーム化されて符号化されたオーディオストリームの持つフレーム単位又はデータ長単位の位置を示す時間情報が含まれる必要がある。なお、これらの時間情報は、図8に図示されている従来のPSのPTSに相当する。再構成されるオーディオデータは、図3に図示されているように、コンテンツの識別を可能とするコンテンツ識別情報に続いて、所定のデータ長単位のオーディオデータ(オーディオES)と、このオーディオデータの再生出力時間を含む時間情報とが一体となった構造を有することが可能である。   First, the reconstructed audio data needs to include information corresponding to content identification information (for example, a file name or a program name) for indicating the correspondence between the video data of the content and the audio data. Furthermore, the reconstructed audio data needs to include time information indicating the position of the frame unit or the data length unit of the audio stream that is framed and encoded in a predetermined unit time. These pieces of time information correspond to the conventional PS PTS shown in FIG. As shown in FIG. 3, the reconstructed audio data includes content identification information that enables identification of content, audio data (audio ES) in a predetermined data length unit, and audio data of this audio data. It is possible to have a structure in which time information including reproduction output time is integrated.

図3に図示されている再構成されたオーディオストリームは、上述のように、フレーム単位又はデータ長単位で時間情報が与えられている構造を有している。なお、オーディオ再生装置200では、復号処理の前、又は復号処理と同時に、オーディオESのみを抽出する処理を行う必要があるが、その処理量は極めて少なく、オーディオ再生装置200に与える処理負荷は軽微なものである。   The reconstructed audio stream shown in FIG. 3 has a structure in which time information is given in frame units or data length units as described above. Note that in the audio playback device 200, it is necessary to perform processing for extracting only the audio ES before or simultaneously with the decoding processing, but the amount of processing is extremely small, and the processing load applied to the audio playback device 200 is light. Is something.

また、図3に図示されているオーディオデータは、所定量のオーディオESに対して時間情報が付加されている一体構造を有しており、オーディオ復号部206においてオーディオ再生の時間管理が行われるが、時間情報を含む補助情報(例えば、時間情報及びデータ長)をオーディオESとは分離して、例えば図4に図示されているように、補助情報部分とオーディオ部分とを別データ(別ファイル)としたり、あるいは、分離されている補助情報部分及びオーディオES部分をそのまま結合して、前半の補助情報部分をオーディオストリームに対するヘッダ部とする構造としたりすることも可能である。この場合には、例えば、オーディオ再生装置200の制御部205が補助情報を読み出して、時間管理を行うことが可能である。   The audio data shown in FIG. 3 has an integrated structure in which time information is added to a predetermined amount of audio ES, and audio playback time management is performed in the audio decoding unit 206. Auxiliary information including time information (eg, time information and data length) is separated from the audio ES, and the auxiliary information portion and the audio portion are separated from each other as shown in FIG. Alternatively, the separated auxiliary information portion and audio ES portion can be combined as they are, and the first half auxiliary information portion can be used as a header portion for the audio stream. In this case, for example, the control unit 205 of the audio playback device 200 can read the auxiliary information and perform time management.

また、マルチメディアストリームバッファ101に格納されているオーディオのPSが集合したストリームが、マルチメディア符号化データ分離伝送装置100からオーディオ再生装置200に伝送されるようにし、オーディオ再生装置200において、このオーディオのPSが集合したストリームを格納することも可能である。この場合、オーディオ再生装置200の同期再生処理に係る処理負荷は増加するが、マルチメディア符号化データ再生装置300におけるオーディオストリームの再構成の際の処理負荷が軽減されるため、特に、前工程処理におけるデータ伝送の高速化や、前工程処理に要する時間の短縮化などが期待できる。   Also, a stream in which audio PS stored in the multimedia stream buffer 101 is aggregated is transmitted from the multimedia encoded data separating and transmitting apparatus 100 to the audio reproducing apparatus 200, and the audio reproducing apparatus 200 uses this audio. It is also possible to store a stream in which the PSs are aggregated. In this case, although the processing load related to the synchronous playback processing of the audio playback device 200 increases, the processing load when the audio stream is reconstructed in the multimedia encoded data playback device 300 is reduced. Can be expected to speed up data transmission and shorten the time required for pre-processing.

次に、本発明に係る後工程処理(ビデオデータ及びオーディオデータの同期再生処理)を含む動作の流れについて説明する。なお、ここでは、既に上述の前工程処理が完了しており、オーディオデータ(オーディオES)が、時間情報やコンテンツ識別情報などを含む補助情報と共に、オーディオ再生装置200のオーディオストリームバッファ202にあらかじめ格納されているものとする。   Next, the flow of operations including post-process processing (synchronized playback processing of video data and audio data) according to the present invention will be described. Here, the above-described pre-process has already been completed, and audio data (audio ES) is stored in advance in the audio stream buffer 202 of the audio playback device 200 together with auxiliary information including time information and content identification information. It is assumed that

例えば、ユーザ操作によってコンテンツの再生命令が供給された場合、マルチメディア符号化データ再生装置300は、ビデオストリームを復号してモニタ308に出力する一方、モニタ308における映像出力と同一の時刻に対応している音声がオーディオ再生装置200のスピーカ208から出力されるように、コンテンツ識別情報(どのコンテンツを再生するかを示す情報)、再生中のストリームから抽出された時間情報(コンテンツのどのオーディオESから再生を開始するかを示す情報)、ユーザによって要求された動作を示す操作情報(例えば、通常再生や特殊再生などの動作を示す情報)をオーディオ再生装置200に送信する。なお、マルチメディア符号化データ再生装置300からオーディオ再生装置200に対するコンテンツ識別情報、時間情報、操作情報などを含む補助情報の伝送は、オーディオデータの処理遅延、ビデオデータやオーディオデータの処理遅延、無線伝送の遅延などが考慮された所定のタイミングで行われる。   For example, when a content playback command is supplied by a user operation, the multimedia encoded data playback device 300 decodes the video stream and outputs the decoded video stream to the monitor 308, while corresponding to the same time as the video output on the monitor 308. Content identification information (information indicating which content is to be played back) and time information extracted from the stream being played back (from which audio ES of the content) so that the current audio is output from the speaker 208 of the audio playback device 200 Information indicating whether to start reproduction), and operation information indicating an operation requested by the user (for example, information indicating an operation such as normal reproduction or special reproduction) is transmitted to the audio reproduction apparatus 200. Note that transmission of auxiliary information including content identification information, time information, operation information, and the like from the multimedia encoded data playback device 300 to the audio playback device 200 is a processing delay of audio data, a processing delay of video data and audio data, and wireless It is performed at a predetermined timing in consideration of transmission delay and the like.

例えば、あるコンテンツの再生命令が制御部305に伝達された場合、制御部305はビデオ復号部304に復号開始命令を発するとともに、外部のオーディオ再生装置200に対して、コンテンツ識別情報や時間情報と共に再生開始命令を発信する。また、再生停止命令も同様に、時間情報と共にマルチメディア符号化データ再生装置300からオーディオ再生装置200に発信される。これにより、オーディオ再生装置200のオーディオ再生は、マルチメディア符号化データ再生装置300におけるビデオ再生と常に同期されるようになる。   For example, when a playback command for a certain content is transmitted to the control unit 305, the control unit 305 issues a decoding start command to the video decoding unit 304, and also transmits content identification information and time information to the external audio playback device 200. Send a playback start command. Similarly, a playback stop command is transmitted from the multimedia encoded data playback device 300 to the audio playback device 200 together with time information. As a result, the audio playback of the audio playback device 200 is always synchronized with the video playback of the multimedia encoded data playback device 300.

上述のように、マルチメディア符号化データ再生装置300とオーディオ再生装置200とは物理的に分離された装置であり、基準となる動作周波数が異なるため、それぞれの動作に時間的なずれが生じる可能性がある。一般的に、このずれは装置のクロック精度に依存するものであるが、このずれは微小なものであるため、ユーザがずれを知覚するまでに時間がかかることもある。したがって、最初に再生を開始する際にのみ制御信号を発信して再生開始タイミングを同期させた後は、基本的にそのまま映像と音声とは同期し続けるので、再生終了時までビデオ再生装置及びオーディオ再生装置を自走させることも可能である。   As described above, the multimedia encoded data playback device 300 and the audio playback device 200 are physically separated devices and have different reference operating frequencies, so that there may be a time lag between the operations. There is sex. In general, this deviation depends on the clock accuracy of the apparatus, but since this deviation is minute, it may take time for the user to perceive the deviation. Therefore, after synchronizing the playback start timing by sending a control signal only when starting playback for the first time, the video and audio are basically kept in sync as they are. It is also possible to make the playback device self-run.

一方、特に、コンテンツの再生時間が長い場合などには、ユーザが知覚できる程度まで、映像と音声との間にずれが生じる可能性がある。このようなずれに対応するため、マルチメディア符号化データ再生装置300からオーディオ再生装置200に対して時間情報を定期的に送信し、オーディオ再生装置200は、同期再生のずれを検知し、マルチメディア符号化データ再生装置300から定期的に送られてくる時間情報に従って、オーディオ再生の時間管理を行うことも可能である。ずれが検知された場合には、オーディオ再生装置200は、例えば、従来の技術(特許文献1に開示されている技術)のようにユーザに違和感を与えないように配慮しながら、オーディオデータを適当なサンプル分だけ挿入又は削除することで、定期的にずれの補正を行うことによって、常にビデオとオーディオの同期付けが継続されるようにすることが可能である。   On the other hand, especially when the playback time of the content is long, there is a possibility that a gap between the video and the audio will occur to the extent that the user can perceive. In order to deal with such a deviation, the time information is periodically transmitted from the multimedia encoded data reproduction device 300 to the audio reproduction device 200, and the audio reproduction device 200 detects the deviation of the synchronous reproduction, and the multimedia reproduction is performed. It is also possible to perform audio playback time management according to the time information periodically sent from the encoded data playback device 300. When the deviation is detected, the audio playback device 200 appropriately selects the audio data while taking care not to give the user a sense of incongruity as in the conventional technique (the technique disclosed in Patent Document 1), for example. By inserting or deleting as many samples as possible, it is possible to keep video and audio synchronized at all times by periodically correcting the deviation.

また、ユーザがずれを知覚した段階で、ユーザ自身がずれの補正指示を行うことによって、マルチメディア符号化データ再生装置300からオーディオ再生装置200に対して再生開始命令が再度発信され、ビデオとオーディオの同期再生を再設定できるようにすることも可能である。ユーザの操作による同期の再設定は、必要に応じてずれの補正を行うものである。したがって、マルチメディア符号化データ再生装置300からオーディオ再生装置200に対する時間情報の送信は、同期再生の再設定が必要な場合のみ行われることとなり、必要最低限の無線伝送によって同期再生を維持することが可能となるという利点を有している。   Further, when the user perceives the shift, the user himself / herself issues a shift correction instruction, whereby a reproduction start command is transmitted again from the multimedia encoded data playback device 300 to the audio playback device 200, and video and audio are transmitted. It is also possible to re-set the synchronized playback. The resetting of the synchronization by the user operation is to correct the deviation as necessary. Therefore, transmission of time information from the multimedia encoded data playback device 300 to the audio playback device 200 is performed only when resetting of synchronous playback is necessary, and the synchronous playback is maintained by the minimum necessary wireless transmission. Has the advantage of being possible.

また、マルチメディア符号化データ再生装置300からオーディオ再生装置200への補助情報及び操作情報の送信に、光無線通信ではなく、電波による無線伝送方式を採用してもよい。本発明は、従来の技術のようにリアルタイムでオーディオデータ伝送を行うものではなく、マルチメディア符号化データ再生装置300とオーディオ再生装置200との間で、伝送量の極めて少ない制御信号及び応答信号のやり取りが行われるに過ぎず、電波の利用が好ましくないとされる環境下においても、周囲に影響を与える可能性が非常に小さいと言える。   In addition, for transmitting auxiliary information and operation information from the multimedia encoded data reproduction device 300 to the audio reproduction device 200, a radio transmission method using radio waves instead of optical wireless communication may be adopted. The present invention does not perform audio data transmission in real time as in the prior art, but between the multimedia encoded data reproduction device 300 and the audio reproduction device 200, a control signal and a response signal with a very small amount of transmission. It can be said that the possibility of affecting the surroundings is extremely small even in an environment where only exchange is performed and the use of radio waves is not preferable.

以上、説明したように、本発明によれば、マルチメディア符号化データ再生装置(ビデオ再生装置)とオーディオ再生装置とが物理的に離れた場所に存在し、無線によって接続している状態において、あらかじめマルチメディア符号化データ分離伝送装置で、マルチメディア符号化データからオーディオデータを再構成して、再構成されたオーディオデータをオーディオ再生装置にあらかじめ格納しておき、コンテンツの再生を行う場合には、マルチメディア符号化データ再生装置からオーディオ再生装置に対して、遅延を考慮したタイミングで、再生開始命令(あるいは、その他の操作命令)が無線を介して送信されるようにすることによって、リアルタイムでオーディオデータを無線伝送することなく、ビデオデータとオーディオデータの同期再生を実現することが可能となる。   As described above, according to the present invention, in a state where the multimedia encoded data playback device (video playback device) and the audio playback device are physically separated and connected wirelessly, When the audio data is reconstructed from the multimedia encoded data in advance by the multimedia encoded data separating and transmitting apparatus, the reconstructed audio data is stored in the audio reproducing apparatus in advance, and the content is reproduced. The reproduction start command (or other operation command) is transmitted from the multimedia encoded data reproduction device to the audio reproduction device at a timing taking delay into consideration in real time. Video data and audio data without wireless transmission of audio data It is possible to realize synchronized playback.

なお、上述の実施の形態に記載されている構成や動作は一例にすぎず、本発明は、上述の実施の形態の記載に限定されるものではない。また、本発明を説明するために図示されているブロック図の各構成要素は機能を表すものであり、これらの各構成要素は、ハードウェア、ソフトウェア、あるいは、ハードウェアとソフトウェアの組み合わせによって実現可能である。   Note that the configurations and operations described in the above embodiment are merely examples, and the present invention is not limited to the description of the above embodiment. In addition, each component of the block diagram illustrated for explaining the present invention represents a function, and each of these components can be realized by hardware, software, or a combination of hardware and software. It is.

また、本発明によれば、下記の態様も提供される。   Moreover, according to this invention, the following aspect is also provided.

本発明の第3の態様によれば、ビデオ符号化データと、オーディオ符号化データと、前記各符号化データの再生時間の管理を行うための時間情報を含む補助情報とが多重化されたマルチメディア符号化データが記録されている記録媒体から、前記マルチメディア符号化データを読み出すマルチメディア符号化データ読み出し手段と、
前記マルチメディア符号化データ読み出し手段で読み出された前記マルチメディア符号化データから、前記オーディオ符号化データ及び前記補助情報を分離抽出するマルチメディア符号化データ分離手段と、
前記オーディオ符号化データに係るオーディオ再生が行われるように、前記マルチメディア符号化データ分離手段で分離抽出された前記オーディオ符号化データ及び前記補助情報を再構成するオーディオ再構成手段と、
前記オーディオ再構成手段で再構成された前記オーディオ符号化データ及び前記補助情報を、所定のオーディオ再生装置において読み取り可能な記録媒体に格納するデータ格納手段とを、
有するマルチメディア符号化データ分離装置が提供される。
According to the third aspect of the present invention, the video encoded data, the audio encoded data, and the auxiliary information including time information for managing the reproduction time of each encoded data are multiplexed. Multimedia encoded data reading means for reading the multimedia encoded data from a recording medium on which the encoded media data is recorded;
Multimedia encoded data separating means for separating and extracting the audio encoded data and the auxiliary information from the multimedia encoded data read by the multimedia encoded data reading means;
Audio reconstructing means for reconstructing the audio encoded data and the auxiliary information separated and extracted by the multimedia encoded data separating means so that audio reproduction related to the audio encoded data is performed;
Data storage means for storing the audio encoded data and the auxiliary information reconstructed by the audio reconstruction means in a recording medium readable by a predetermined audio reproduction device;
A multimedia encoded data separation device is provided.

また、本発明の第4の態様によれば、上記の本発明の第1〜3の態様において、前記オーディオ再構成手段は、前記オーディオ符号化データ及び前記補助情報のそれぞれを統合して、統合された前記オーディオ符号化データ及び前記補助情報をそれぞれ別データとするか、あるいは、統合された前記オーディオ符号化データに対して、統合された前記補助情報がヘッダ部として付加された構造のデータを生成することによって、前記オーディオ符号化データ及び前記補助情報の再構成を行うように構成されているマルチメディア符号化データ分離伝送装置又はマルチメディア符号化データ分離装置が提供される。   According to the fourth aspect of the present invention, in the first to third aspects of the present invention, the audio reconstruction means integrates each of the audio encoded data and the auxiliary information. The audio encoded data and the auxiliary information that have been combined are set as separate data, respectively, or the data that has the structure in which the integrated auxiliary information is added as a header to the integrated audio encoded data. A multimedia encoded data separation / transmission apparatus or a multimedia encoded data separation apparatus configured to reconstruct the audio encoded data and the auxiliary information by generating is provided.

また、本発明の第5の態様によれば、上記の本発明の第1〜3の態様において、前記オーディオ再構成手段は、前記オーディオ符号化データ及び前記補助情報をMPEG−2のプログラムストリームフォーマットによって多重化することによって、前記オーディオ符号化データ及び前記補助情報の再構成を行うように構成されているマルチメディア符号化データ分離伝送装置又はマルチメディア符号化データ分離装置が提供される。   According to a fifth aspect of the present invention, in the first to third aspects of the present invention, the audio reconstructing means converts the audio encoded data and the auxiliary information into an MPEG-2 program stream format. Thus, a multimedia encoded data separation / transmission apparatus or multimedia encoded data separation apparatus configured to reconstruct the audio encoded data and the auxiliary information is provided.

また、本発明の第6の態様によれば、ビデオ符号化データと、オーディオ符号化データと、前記各符号化データの再生時間の管理を行うための時間情報を含む補助情報とが多重化されたマルチメディア符号化データから前記オーディオ符号化データ及び前記補助情報がいったん分離された後、オーディオ符号化データのオーディオ再生が行われるように再構成された前記オーディオ符号化データ及び前記補助情報を格納するデータ格納手段と、
再生動作に係る再生位置を示す時間情報を含む前記補助情報と、前記再生動作の開始指示を行うための操作情報とを、所定のビデオ再生装置から無線を介して受信する無線信号受信手段と、
前記無線信号受信手段で受信した前記補助情報及び前記操作情報に基づいて、前記データ格納手段に格納されている前記オーディオ符号化データに関し、前記再生動作に係る前記再生位置以降の復号処理を行うオーディオ復号手段と、
前記オーディオ復号手段で復号された前記オーディオ符号化データの音声を出力する音声出力手段とを、
有するオーディオ再生装置が提供される。
According to the sixth aspect of the present invention, video encoded data, audio encoded data, and auxiliary information including time information for managing the reproduction time of each encoded data are multiplexed. The audio encoded data and the auxiliary information are reconfigured so that audio reproduction of the audio encoded data is performed after the audio encoded data and the auxiliary information are once separated from the multimedia encoded data. Data storage means,
Radio signal receiving means for receiving the auxiliary information including time information indicating a reproduction position related to a reproduction operation and operation information for instructing to start the reproduction operation from a predetermined video reproduction device via radio;
Audio for performing decoding processing after the reproduction position related to the reproduction operation on the audio encoded data stored in the data storage unit based on the auxiliary information and the operation information received by the wireless signal reception unit Decryption means;
Audio output means for outputting the audio encoded data decoded by the audio decoding means;
An audio playback device is provided.

また、本発明の第7の態様によれば、上記の本発明の第6の態様において、前記無線信号受信手段が、赤外線を用いた光無線伝送によって無線信号の伝送を行うように構成されているオーディオ再生装置が提供される。   According to a seventh aspect of the present invention, in the sixth aspect of the present invention, the wireless signal receiving means is configured to transmit a wireless signal by optical wireless transmission using infrared rays. An audio playback device is provided.

また、本発明の第8の態様によれば、ビデオ符号化データと、オーディオ符号化データと、前記各符号化データの再生時間の管理を行うための時間情報を含む補助情報とが多重化されたマルチメディア符号化データが記録されている記録媒体から、前記マルチメディア符号化データを読み出すマルチメディア符号化データ読み出し手段と、
前記マルチメディア符号化データの再生動作に係る外部からの指示を入力するための操作入力手段と、
前記操作入力手段で入力された前記再生動作に係る再生位置を示す時間情報を含む前記補助情報と、前記再生動作の開始指示を行うための操作情報とを、前記マルチメディア符号化データに含まれる前記オーディオ符号化データがあらかじめ格納されている所定のオーディオ再生装置に無線を介して送信する無線信号送信手段と、
前記マルチメディア符号化データに含まれる前記ビデオ符号化データに関し、前記操作入力手段で入力された前記再生動作に係る前記再生位置以降の復号処理を行うビデオ復号手段と、
前記ビデオ復号手段における前記ビデオ符号化データの復号処理によって生成されたビデオデータによる映像を視覚的に表示する映像表示手段と、
前記無線信号送信手段による前記補助情報及び前記操作情報の送信に基づくタイミングで、前記操作入力手段で入力された前記再生動作に係る前記再生位置以降の映像出力を開始するように制御するビデオ再生制御手段とを、
有するビデオ再生装置が提供される。
According to the eighth aspect of the present invention, video encoded data, audio encoded data, and auxiliary information including time information for managing the reproduction time of each encoded data are multiplexed. Multimedia encoded data reading means for reading the multimedia encoded data from the recording medium on which the multimedia encoded data is recorded;
Operation input means for inputting an external instruction relating to the reproduction operation of the multimedia encoded data;
The multimedia encoded data includes the auxiliary information including time information indicating the playback position related to the playback operation input by the operation input means and operation information for instructing to start the playback operation. Wireless signal transmission means for wirelessly transmitting to a predetermined audio reproduction device in which the audio encoded data is stored in advance;
Video decoding means for performing decoding processing after the reproduction position related to the reproduction operation input by the operation input means with respect to the video encoded data included in the multimedia encoded data;
Video display means for visually displaying video based on video data generated by the decoding process of the video encoded data in the video decoding means;
Video reproduction control for controlling to start video output after the reproduction position related to the reproduction operation input by the operation input means at a timing based on transmission of the auxiliary information and the operation information by the wireless signal transmission means Means,
A video playback device is provided.

また、本発明の第9の態様によれば、上記の本発明の第8の態様において、前記無線信号送信手段が、赤外線を用いた光無線伝送によって無線信号の伝送を行うように構成されているビデオ再生装置が提供される。   According to a ninth aspect of the present invention, in the eighth aspect of the present invention, the wireless signal transmitting means is configured to transmit a wireless signal by optical wireless transmission using infrared rays. A video playback device is provided.

本発明は、ビデオ再生装置とオーディオ再生装置とが物理的に離れた場所に存在し、無線によって接続している状態を維持したまま、例えば公共性の高い場所などを始めとする電波使用が制限されている環境においても、簡易な構成によってビデオデータとオーディオデータの同期再生を実現し、ワイヤレス接続に係る利便性の維持、装置の低コスト化、装置の小型化や低重量化を可能にするという効果を有しており、物理的に離れた状態にあるビデオ再生装置及びオーディオ再生装置において、1つのマルチメディア符号化データに含まれるビデオデータ及びオーディオデータの同期再生を可能とするための技術に適用可能である。   The present invention limits the use of radio waves, such as in highly public places, while the video playback apparatus and the audio playback apparatus exist in physically separated locations and remain connected wirelessly. Even in an environment where video data and audio data are synchronized with a simple configuration, the convenience of wireless connection can be maintained, the cost of the device can be reduced, and the size and weight of the device can be reduced. Technology for enabling synchronized playback of video data and audio data contained in one multimedia encoded data in a video playback device and an audio playback device that are physically separated from each other It is applicable to.

本発明の実施の形態において、前工程段階に係る処理を行うマルチメディア符号化データ分離伝送装置及びオーディオ再生装置の構成の一例を示すブロック図である。In the embodiment of the present invention, it is a block diagram showing an example of the configuration of a multimedia encoded data separation and transmission apparatus and an audio playback apparatus that perform processing according to the previous process stage. 本発明の実施の形態において、後工程段階に係る処理を行うマルチメディア符号化データ再生装置の構成の一例を示すブロック図である。In the embodiment of the present invention, it is a block diagram showing an example of a configuration of a multimedia encoded data reproduction device that performs processing related to a post-process stage. 本発明の実施の形態において、再構成されたオーディオストリームの構造の第1の例を示す図である。In the embodiment of the present invention, it is a diagram showing a first example of the structure of a reconstructed audio stream. 本発明の実施の形態において、再構成されたオーディオストリームの構造の第2の例を示す図である。In the embodiment of the present invention, it is a figure which shows the 2nd example of the structure of the reconfigure | reconstructed audio stream. 従来の技術に係るマルチメディア符号化データ再生装置の一例を示すブロック図である。It is a block diagram which shows an example of the multimedia coding data reproducing | regenerating apparatus based on a prior art. 従来の技術に係る分離型マルチメディア符号化データ再生装置の一例を示すブロック図である。It is a block diagram which shows an example of the separation type | mold multimedia coding data reproduction apparatus based on a prior art. 従来の技術に係る分離型マルチメディア符号化データ再生装置の一例を示す外観図である。It is an external view which shows an example of the separation type | mold multimedia coding data reproduction apparatus based on a prior art. 従来の技術におけるマルチメディアシステムストリームの代表であるMPEG−2のシステムストリームのデータ構造の一例を示す図である。It is a figure which shows an example of the data structure of the system stream of MPEG-2 which is a representative of the multimedia system stream in a prior art.

符号の説明Explanation of symbols

100 マルチメディア符号化データ分離伝送装置
101、301、1001、2101 マルチメディアストリームバッファ
102、302、1002、2102 システムストリーム分離部
103、202 オーディオストリームバッファ
104 補助情報バッファ
105 オーディオストリーム再構成部
106 オーディオストリーム送信部
200、2002 オーディオ再生装置
201 オーディオストリーム受信部
203 後工程処理部
204 補助情報/操作情報受信部
205、305、1005、2105 制御部
206、1003、2103、2202 オーディオ復号部
207、1006、2106、2203 オーディオデータバッファ
208、1008、2204 スピーカ
300、1000 マルチメディア符号化データ再生装置
303 補助情報抽出部
304、1004、2104 ビデオ復号部
306 補助情報/操作情報送信部
307、1007、2107 ビデオデータバッファ
308、1009、2109 モニタ
2001 マルチメディア符号化データ再生伝送装置
2110 オーディオデータ送信部
2201 オーディオデータ受信部
3001 本体装置
3002 ヘッドフォン
100 Multimedia Encoded Data Separation / Transmission Device 101, 301, 1001, 2101 Multimedia Stream Buffer 102, 302, 1002, 2102 System Stream Separation Unit 103, 202 Audio Stream Buffer 104 Auxiliary Information Buffer 105 Audio Stream Reconstruction Unit 106 Audio Stream Transmitter 200, 2002 Audio playback device 201 Audio stream receiver 203 Post-process processor 204 Auxiliary information / operation information receiver 205, 305, 1005, 2105 Controller 206, 1003, 2103, 2202 Audio decoder 207, 1006, 2106 2203 Audio data buffer 208, 1008, 2204 Speaker 300, 1000 Multimedia encoded data reproduction device 303 Auxiliary information extraction unit 304, 1004, 2104 Video decoding unit 306 Auxiliary information / operation information transmission unit 307, 1007, 2107 Video data buffer 308, 1009, 2109 Monitor 2001 Multimedia encoded data reproduction / transmission device 2110 Audio data transmission unit 2201 Audio data receiver 3001 Main unit 3002 Headphone

Claims (1)

ビデオ符号化データと、オーディオ符号化データと、前記各符号化データの再生時間の管理を行うための時間情報を含む補助情報とが多重化されたマルチメディア符号化データが記録されている記録媒体から、前記マルチメディア符号化データを読み出すマルチメディア符号化データ読み出し手段と、
前記マルチメディア符号化データ読み出し手段で読み出された前記マルチメディア符号化データから、前記オーディオ符号化データ及び前記補助情報を分離抽出するマルチメディア符号化データ分離手段と、
前記オーディオ符号化データに係るオーディオ再生が所定のオーディオ再生装置において行われるように、前記マルチメディア符号化データ分離手段で分離抽出された前記オーディオ符号化データ及び前記補助情報を再構成するオーディオ再構成手段と、
前記オーディオ再構成手段で再構成された前記オーディオ符号化データ及び前記補助情報を、前記所定のオーディオ再生装置に送信するデータ送信手段
前記オーディオ再構成手段で再構成された前記オーディオ符号化データ及び前記補助情報を、前記所定のオーディオ再生装置に送信した後における、前記マルチメディア符号化データの再生動作に係る外部からの指示を入力するための操作入力手段と、
前記操作入力手段で入力された前記再生動作に係る再生位置を示す時間情報を含む前記補助情報と、前記再生動作の開始指示を行うための操作情報とを、前記所定のオーディオ再生装置に無線を介して送信する無線信号送信手段と、
前記マルチメディア符号化データに含まれる前記ビデオ符号化データに関し、前記操作入力手段で入力された前記再生動作に係る前記再生位置以降の復号処理を行うビデオ復号手段と、
前記ビデオ復号手段における前記ビデオ符号化データの復号処理によって生成されたビデオデータによる映像を視覚的に表示する映像表示手段とを、
有するマルチメディア符号化データ分離伝送装置。
Recording medium on which multimedia encoded data in which video encoded data, audio encoded data, and auxiliary information including time information for managing the reproduction time of each encoded data are multiplexed is recorded From the multimedia encoded data reading means for reading the multimedia encoded data,
Multimedia encoded data separating means for separating and extracting the audio encoded data and the auxiliary information from the multimedia encoded data read by the multimedia encoded data reading means;
Audio reconfiguration for reconstructing the audio encoded data and the auxiliary information separated and extracted by the multimedia encoded data separation means so that audio reproduction related to the audio encoded data is performed in a predetermined audio reproduction device Means,
Said audio encoded data and the auxiliary information reconstructed by the audio reconstruction means, and a data transmission means for transmitting to said predetermined audio reproduction apparatus,
An instruction from the outside regarding the reproduction operation of the multimedia encoded data after the audio encoded data and the auxiliary information reconstructed by the audio reconstructing means are transmitted to the predetermined audio reproducing device is input. Operation input means for
The auxiliary information including time information indicating the reproduction position related to the reproduction operation input by the operation input unit and the operation information for instructing the start of the reproduction operation are wirelessly transmitted to the predetermined audio reproduction device. Wireless signal transmission means for transmitting via
Video decoding means for performing decoding processing after the reproduction position related to the reproduction operation input by the operation input means with respect to the video encoded data included in the multimedia encoded data;
Video display means for visually displaying video based on video data generated by the decoding process of the video encoded data in the video decoding means;
A multimedia encoded data separation / transmission apparatus.
JP2005282821A 2005-09-28 2005-09-28 Multimedia coded data separation and transmission device Active JP4352409B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005282821A JP4352409B2 (en) 2005-09-28 2005-09-28 Multimedia coded data separation and transmission device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005282821A JP4352409B2 (en) 2005-09-28 2005-09-28 Multimedia coded data separation and transmission device

Publications (2)

Publication Number Publication Date
JP2007095163A JP2007095163A (en) 2007-04-12
JP4352409B2 true JP4352409B2 (en) 2009-10-28

Family

ID=37980708

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005282821A Active JP4352409B2 (en) 2005-09-28 2005-09-28 Multimedia coded data separation and transmission device

Country Status (1)

Country Link
JP (1) JP4352409B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007096708A (en) * 2005-09-28 2007-04-12 Victor Co Of Japan Ltd Video reproducing device and audio reproducing device

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5009362B2 (en) 2007-03-30 2012-08-22 シャープ株式会社 Liquid crystal display
JP5590186B2 (en) * 2008-05-23 2014-09-17 ヤマハ株式会社 AV system
JP4964833B2 (en) * 2008-06-23 2012-07-04 日本電信電話株式会社 Information presentation control apparatus and information presentation control method
EP2533547A1 (en) * 2011-06-10 2012-12-12 Koninklijke KPN N.V. Method and system for providing a synchronised user experience from multiple modules
US9819839B2 (en) 2012-10-30 2017-11-14 Mitsubishi Electric Corporation Audio/video reproduction system, video display device, and audio output device for synchronizing decoding of video frames by the video display device to decoding of audio frames by the audio output device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007096708A (en) * 2005-09-28 2007-04-12 Victor Co Of Japan Ltd Video reproducing device and audio reproducing device
JP4556185B2 (en) * 2005-09-28 2010-10-06 日本ビクター株式会社 Video playback device and audio playback device

Also Published As

Publication number Publication date
JP2007095163A (en) 2007-04-12

Similar Documents

Publication Publication Date Title
KR101868280B1 (en) Information processing apparatus, information processing method, and computer-readable recording medium
EP2827600B1 (en) Image processing device, image reproduction device, and image reproduction system
US8665370B2 (en) Method for synchronized playback of wireless audio and video and playback system using the same
JP4515465B2 (en) Moving picture photographing apparatus and moving picture photographing method, moving picture reproducing apparatus and moving picture reproducing method for reproducing a video signal recorded on a recording medium
JP4352409B2 (en) Multimedia coded data separation and transmission device
JPWO2006137425A1 (en) Audio encoding apparatus, audio decoding apparatus, and audio encoded information transmission apparatus
TW200830874A (en) Image information transmission system, image information transmitting apparatus, image information receiving apparatus, image information transmission method, image information transmitting method, and image information receiving method
JP4613674B2 (en) Audio playback device
JP4715306B2 (en) STREAM CONTROL DEVICE, STREAM REPRODUCTION METHOD, VIDEO RECORDING / REPRODUCTION SYSTEM
CN101212588A (en) Audio/video playing system and method capable of playing audio and video signals synchronously
KR20050052717A (en) System and method for transcording stream data except audio data
KR20110025367A (en) Method and device for multimedia transcoding client
JP2002100113A (en) Reproducing device, reproducing method, transmission method and storage medium
JP4556185B2 (en) Video playback device and audio playback device
JP4501854B2 (en) Video / audio recording device
JP7153832B2 (en) Video transmission system and video transmission method
JP4289055B2 (en) Transcoder and recording / reproducing apparatus using the same
JP2011151784A (en) Moving image multiplexing apparatus, video and audio recording apparatus and moving image multiplexing method
JP2007158431A (en) Video recording device and video recording and reproducing device
US20120082435A1 (en) Moving image display device
JP5700853B2 (en) Digital data recording / reproducing device
JP5161323B2 (en) Reproduction method and apparatus
JP4189211B2 (en) Audio data transmission method
JP2008135989A (en) Video reproduction system, synchronization method for video reproduction and video reproduction terminal
JP2004153631A (en) Digital image and sound recorder

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090403

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090601

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090703

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090716

R151 Written notification of patent or utility model registration

Ref document number: 4352409

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120807

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120807

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120807

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120807

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130807

Year of fee payment: 4