JP4007575B2 - Image / audio bitstream splitting device - Google Patents

Image / audio bitstream splitting device Download PDF

Info

Publication number
JP4007575B2
JP4007575B2 JP2001325456A JP2001325456A JP4007575B2 JP 4007575 B2 JP4007575 B2 JP 4007575B2 JP 2001325456 A JP2001325456 A JP 2001325456A JP 2001325456 A JP2001325456 A JP 2001325456A JP 4007575 B2 JP4007575 B2 JP 4007575B2
Authority
JP
Japan
Prior art keywords
image
audio
chunk
generating
bitstream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2001325456A
Other languages
Japanese (ja)
Other versions
JP2003134480A (en
Inventor
悟史 宮地
茂之 酒澤
康弘 滝嶋
正裕 和田
淳一 木村
徹 横山
教洋 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
KDDI Corp
Original Assignee
Hitachi Ltd
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, KDDI Corp filed Critical Hitachi Ltd
Priority to JP2001325456A priority Critical patent/JP4007575B2/en
Publication of JP2003134480A publication Critical patent/JP2003134480A/en
Application granted granted Critical
Publication of JP4007575B2 publication Critical patent/JP4007575B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Time-Division Multiplex Systems (AREA)
  • Television Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は画像・音声ビットストリーム分割装置に関し、特に、画像・音声を圧縮符号化したビットストリームを多重化し、かつ長いコンテンツを分割して格納することで、再生を開始するまでの受信時間の短縮や、途中からの再生を可能にする画像・音声ビットストリーム分割装置に関する。
【0002】
【従来の技術】
従来の画像・音声ビットストリーム分割格納装置を、図6、図7および図8を参照して説明する。従来の画像・音声ビットストリーム分割格納装置は、図6に示されているように、画像エンコーダ11、音声エンコーダ12、画像ビットストリームバッファ13、音声ビットストリームバッファ14、多重化部15、チャンク生成タイマパルス発生部16、ファイル生成部17およびファイル格納部18から構成されている。
【0003】
前記多重化部15は、図7に示されているように、数フレームを蓄積できるバッファ21,22、該バッファ22に接続された遅延手段23、バッファ24、および前記バッファ21と22の入力側に接続されたスイッチング部25,26から構成されている。
【0004】
さて、図6の画像エンコーダ11で逐次生成されるビットストリームは、1画像フレームの符号化完了と同時に画像ビットストリームバッファ13に入力される。また、これと同時に、音声エンコーダ12で逐次生成されるビットストリームは、1音声フレームの符号化完了と同時に音声ビットストリームバッファ14に入力される。多重化部15には、チャンク生成タイマパルス発生部16から、一定間隔毎にチャンク生成タイマパルスTiが入力され、数フレームの塊(チャンク)毎に、画像・音声ビットストリームを交互に多重化し、ファイル生成部17へと出力する。
【0005】
すなわち、前記チャンク生成タイマパルスTiが多重化部15に入力すると、前記スイッチング部25,26がオンになり、それまでに符号化され、画像ビットストリームバッファ13,音声ビットストリームバッファ14に蓄積されていたデータが、バッファ21,22に転送される。次いで、バッファ21に転送された画像ビットストリームがバッファ24に送られ、その後に、遅延手段23で遅延された音声ビットストリームがバッファ24で結合される。そして、ファイル生成部17へ出力される。
【0006】
多重化部15に入力される画像フレームと音声フレームの時間間隔は一般に異なっており、さらに、一方が他方の整数倍になっていない場合が一般的である。ファイル生成部17では、入力された多重化ビットストリームに対して、ヘッダ情報を付加して1つのファイルとして出力する。その際、一定の間隔毎に、ヘッダ情報を付加して分割格納する。
【0007】
図8は、チャンク生成動作の説明図である。図中の(a)は画像ビットストリーム、(b)は音声ビットストリームを示す。多重化部15には、一定時間間隔毎にチャンク生成タイミングT1、T2、T3、・・・が入力され、該多重化部15は、その時点で生成完了している画像・音声フレームが、バッファ21,22に入力する。したがって、多重化部15は、前記チャンク生成タイミングT1、T2、T3、・・・が入力された時点で生成完了している画像・音声のフレーム単位ビットストリームを、それぞれ画像チャンク、音声チャンクとして構成し、ファイルとして出力する。
【0008】
なお、コンテンツが長い場合には、受信時間を短縮する、あるいは途中からの再生を容易にするために、一定のチャンク数に達したら別ファイルとして分割出力したり、または同一ファイル内において、分割ヘッダを挿入して分割格納するのが一般的である。
【0009】
【発明が解決しようとする課題】
図8から明らかなように、従来の方式では、チャンク先頭のフレーム再生時刻は、画像ビットストリームaと音声ビットストリームbとでは一致しない。音声ビットストリームbのチャンク先頭の再生時刻(例えば、t1)が画像ビットストリームaの再生時刻(例えば、t1’)より早い場合や、遅い場合(例えば、t2、t2’)がある。
【0010】
コンテンツ途中の分割点から再生を行う場合、画像・音声の同期を取るために再生時刻の補正を行わなければならない。しかしながら、一般の復号再生装置においては、音声ビットストリームは1つの圧縮フレームがサンプリング周波数に同期した連続音声信号に復号されるため、フレーム単位に離散的な時間間隔で復号表示すればよい画像に対して時間調整が非常に困難であるという問題、さらに画像が先であったり、音声が先であったりすると、同期制御が複雑となり困難になるという問題があった。
【0011】
本発明の目的は、前記した従来技術の問題点を解消し、復号再生時に、画像・音声の同期制御をできるだけ容易にする形式でチャンク生成、または分割することを可能とする画像・音声ビットストリーム分割装置を提供することにある。
【0012】
【課題を解決するための手段】
前記した目的を達成するために、本発明は、画像および音声ビットストリームを、それぞれ複数フレーム毎に塊(チャンク)にし、画像チャンクおよび音声チャンクを交互に配置する等して1つのストリームとして多重化し、かつ複数チャンク毎に分割してファイルに書き出す画像・音声ビットストリーム分割装置において、該チャンクを生成するためのチャンク生成タイミング信号を一定時間間隔毎に発生するチャンク生成タイミング信号発生装置と、該チャンク生成タイミング信号直後の画像フレームの直前までの画像ビットストリームが多重化手段に読み込み完了されるまで待ち、該読み込みの完了している画像ビットストリームを1つの画像チャンクとして生成する画像チャンク生成手段と、該完了時点で読み込みの完了している音声フレームのビットストリームまでを1つの音声チャンクとして生成する音声チャンク生成手段と、複数チャンク毎に分割する手段を具備した点に第1の特徴がある。
【0013】
この特徴によれば、チャンク先頭の音声フレームの再生時刻を、常に、画像フレームの再生時刻と同じかあるいは先にすることが可能となる。
【0014】
また、本発明は、該チャンクを生成するためのチャンク生成タイミング信号を一定時間間隔毎に発生するチャンク生成タイミング信号発生装置と、分割点となるチャンクに限り、チャンク生成タイミング信号直後の画像フレームの直前までの画像ビットストリームが多重化手段に読み込み完了されるまで待ち、該読み込みの完了している画像ビットストリームを1つの画像チャンクとして生成する画像チャンク生成手段と、該完了時点で読み込みの完了している音声フレームのビットストリームまでを1つの音声チャンクとして生成する音声チャンク生成手段と、複数チャンク毎に分割すると共に前記分割点の信号を出力する手段とを具備した点に第2の特徴がある。
【0015】
この特徴によれば、分割点となるチャンクにおいては、必ず、チャンク先頭の音声フレームの再生時刻を、常に、画像フレームの再生時刻と同じかあるいは先にすることが可能となる。
【0016】
【発明の実施の形態】
以下に、図面を参照して、本発明を詳細に説明する。図1は、本発明の一実施形態の構成を示すブロック図、図2は、その主要部の動作を説明するためのタイミングチャートである。なお、図1の図6と同一の符号は同一または同等物を示し、それらの動作の説明は省略する。
【0017】
画像ビットストリームバッファ13は、画像エンコーダ11から符号化されたビットストリームの1フレームを受け取ると、フレーム単位通知信号qを出力する。該フレーム単位通知信号qは、AND回路22の一方の入力端子に入力する。また、チャンク生成タイマパルス発生部16は、一定間隔毎にチャンク生成タイマパルスTiを生成する。該チャンク生成タイマパルスTiはホールド回路21に入力し、ホールドされる。この結果、該ホールド回路21の出力は、図2のrのようになる。
【0018】
さて、チャンク生成タイマパルスTiがホールド回路21に入力されると、図2に示されているように、ホールド回路21の出力rはH(ハイ)レベルとなりAND回路22の他方の端子に入力する。その後、フレーム単位通知信号q1が入力すると、該信号q1はAND回路22を通ってチャンク生成信号s1として多重化部15に入力する。そうすると、多重化部15は該チャンク生成信号s1をトリガ信号として、チャンクを生成する。ホールド回路21は、該チャンク生成信号s1によりリセットされる。
【0019】
すなわち、多重化部15は、図2に示されているように、画像ビットストリームaと音声ビットストリームbを、チャンク生成信号s1のタイミングで分割する。明らかなように、画像ビットストリームaのフレームの境界はチャンク生成信号s1と一致するので、該フレームの境界(例えば、a1,a2)で分割される。しかしながら、音声ビットストリームbは音声フレームの境界と一致するとは限らない。一致しない場合は、その時点で生成完了している音声のフレームを境界(例えば、b1、b2)とする。
【0020】
この結果、本実施形態によれば、チャンク先頭の音声フレームの再生時刻を、画像フレームの再生時刻と同じかあるいは先にすることが可能となる。換言すれば、チャンク先頭の音声フレームの再生時刻が、画像フレームの再生時刻より後になることは決してなくなる。したがって、ファイルの途中の分割点からの再生の際、画像フレームを音声フレームとの時間差分だけ遅延させれば、画像と音声とを同期させることができるので、従来の方式で問題となっていた画像・音声の同期制御が複雑になるのを防止することができるようになる。また、この結果、再生端末の小型化、低価格化などが行えるようになる。
【0021】
なお、前記ホールド回路21とAND回路22は、チャンクを生成するためのチャンク生成タイミング信号直後の画像フレームの直前までの画像ビットストリームが多重化手段に読み込み完了されるまで待つ手段の一具体例ということができる。
【0022】
次に、本発明の第2実施形態を、図3、図4を参照して説明する。一般に、ファイル構成としては、例えば図4に示されているように、複数のチャンクに一つのヘッダを付けるようになされ、該ヘッダが付された箇所が分割点となる。この実施形態は、該分割点においてのみ、チャンク先頭の音声フレームの再生時刻が、画像フレームの再生時刻と同じかあるいは先になるようにしたものである。なお、図3の図1と同一または同等の符号は同一物を示し、説明を省略する。
【0023】
図3に示されているように、この実施形態では、チャンク生成タイマパルス16とAND回路22の出力との間に、スイッチング手段23が接続された、ホールド回路21およびAND回路22と並列の回路が接続されている。該スイッチング手段23は、ファイル生成部17からのファイル分割点信号mによりオフとなり、それ以外はオンとなる。したがって、ファイル分割点においてのみ、チャンク先頭の音声フレームの再生時刻が、画像フレームの再生時刻と同じかあるいは先になる。
【0024】
次に、本発明の第3実施形態を、図5を参照して説明する。この実施形態は、分割点のないファイル、例えば、最初にだけヘッダがあって、それ以降にはヘッダが入っていないファイルに、分割点(ヘッダ)を入れることができるようにしたものである。
【0025】
ファイル格納部31には、前記分割点のないファイルが格納されている。ファイル読込部32は、該ファイル格納部31からファイルを読みだし、画像/音声多重分離部33に送る。画像/音声多重分離部33はファイルから画像データと音声データとに分離し、それぞれは、図1の画像ビットストリームバッファ13と音声ビットストリームバッファ14に送られる。以降は、図1の動作と同じであるので説明を省略する。なお、図5の34を、図3の対応する構成に置き換えてもよい。
【0026】
ファイル生成部17からは、分割点の入ったファイルを出力することができる。したがって、この実施形態によれば、分割点のないファイルを、分割点の入ったファイルに変換できるようになる。
【0027】
本発明で形成されファイル格納部に格納されたファイルを再生する場合には、まずヘッダがデコードされ、インデックスが取り出される。n(nは、正の整数)番目の分割点から再生する場合には、該インデックスからn番目の分割点の音声および画像の再生時刻が取得され、次いで、(音声再生時刻−画像再生時刻)分だけ画像再生を遅延させ、以降は順に、画像、音声が再生される。これにより、画像と音声の再生を整合させることができる。
【0028】
本発明によれば、時間調整が非常に困難な音声ビットストリームを時間遅延する必要が全くなくなる。
【0029】
【発明の効果】
以上の説明から明らかなように、請求項1〜4の発明によれば、チャンク先頭の音声フレームの再生時刻を、常に、画像フレームの再生時刻と同じかあるいは先にすることが可能となる。したがって、ファイルの途中の分割点からの再生の際、画像フレームを音声フレームとの時間差分だけ遅延させれば、画像と音声とを同期させることができるので、従来の方式で問題となっていた画像・音声の同期制御が複雑になるのを防止することができるようになる。
【0030】
また、請求項2の発明によれば、ヘッダが付された箇所である分割点においてのみ、チャンク先頭の音声フレームの再生時刻が、常に画像フレームの再生時刻と同じかあるいは先になるようにすることができる。また、請求項4の発明によれば、分割点のないファイルを、分割点の入ったファイルに変換できるようになる。
【図面の簡単な説明】
【図1】 本発明の第1実施形態の構成を示すブロック図である。
【図2】 第1実施形態の要部の信号およびチャンク生成のタイミングチャートである。
【図3】 本発明の第2実施形態の構成を示すブロック図である。
【図4】 ファイル構成の説明図である。
【図5】 本発明の第3実施形態の構成を示すブロック図である。
【図6】 従来の画像・音声ビットストリーム分割装置の構成を示すブロック図である。
【図7】 多重化部の一具体例を示すブロック図である。
【図8】 従来のチャンク生成のタイミングチャートである。
【符号の説明】
11・・・画像エンコーダ、12・・・音声エンコーダ、13・・・画像ビットストリームバッファ、14・・・音声ビットストリームバッファ、15・・・多重化部、16・・・チャンク生成タイマパルス発生部、17・・・ファイル生成部、18・・・ファイル格納部、21・・・ホールド回路、22・・・AND回路、23・・・スイッチング部。
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image / audio bitstream dividing apparatus, and in particular, shortens a reception time until reproduction starts by multiplexing a bitstream obtained by compressing and encoding an image / audio and dividing and storing a long content. In addition, the present invention relates to an image / audio bitstream dividing device that enables reproduction from the middle.
[0002]
[Prior art]
A conventional image / audio bitstream divided storage apparatus will be described with reference to FIGS. 6, 7 and 8. FIG. As shown in FIG. 6, the conventional image / audio bitstream divided storage apparatus includes an image encoder 11, an audio encoder 12, an image bitstream buffer 13, an audio bitstream buffer 14, a multiplexing unit 15, and a chunk generation timer. The pulse generator 16, the file generator 17, and the file storage 18 are configured.
[0003]
As shown in FIG. 7, the multiplexing unit 15 includes buffers 21 and 22 that can store several frames, delay means 23 connected to the buffer 22, a buffer 24, and input sides of the buffers 21 and 22. It is comprised from the switching parts 25 and 26 connected to.
[0004]
Now, the bit stream sequentially generated by the image encoder 11 of FIG. 6 is input to the image bit stream buffer 13 simultaneously with the completion of encoding of one image frame. At the same time, the bit stream sequentially generated by the audio encoder 12 is input to the audio bit stream buffer 14 simultaneously with the completion of encoding of one audio frame. The multiplexing unit 15 receives the chunk generation timer pulse Ti from the chunk generation timer pulse generation unit 16 at regular intervals, and alternately multiplexes the image / audio bitstream for each chunk (chunk). Output to the file generation unit 17.
[0005]
That is, when the chunk generation timer pulse Ti is input to the multiplexing unit 15, the switching units 25 and 26 are turned on, encoded so far, and stored in the image bit stream buffer 13 and the audio bit stream buffer 14. The transferred data is transferred to the buffers 21 and 22. Next, the image bit stream transferred to the buffer 21 is sent to the buffer 24, and then the audio bit stream delayed by the delay means 23 is combined in the buffer 24. Then, it is output to the file generation unit 17.
[0006]
The time interval between the image frame and the audio frame input to the multiplexing unit 15 is generally different, and in general, one is not an integer multiple of the other. The file generation unit 17 adds header information to the input multiplexed bit stream and outputs it as one file. At that time, the header information is added and stored separately at regular intervals.
[0007]
FIG. 8 is an explanatory diagram of the chunk generation operation. In the figure, (a) shows an image bit stream, and (b) shows an audio bit stream. Chunk generation timings T1, T2, T3,... Are input to the multiplexing unit 15 at regular time intervals, and the multiplexing unit 15 stores the image / sound frame that has been generated at that time as a buffer. 21 and 22 are input. Therefore, the multiplexing unit 15 configures the image and audio frame-by-frame bitstreams that have been generated when the chunk generation timings T1, T2, T3,... Are input as image chunks and audio chunks, respectively. And output as a file.
[0008]
If the content is long, in order to shorten the reception time or facilitate playback from the middle, if the number of chunks reaches a certain number, it is output separately as a separate file, or within the same file, the split header In general, it is divided and stored.
[0009]
[Problems to be solved by the invention]
As is apparent from FIG. 8, in the conventional method, the frame playback time at the beginning of the chunk does not match between the image bit stream a and the audio bit stream b. There are cases where the playback time (for example, t1) at the beginning of the chunk of the audio bitstream b is earlier or later (for example, t2, t2 ′) than the playback time (for example, t1 ′) of the image bitstream a.
[0010]
When playback is performed from a dividing point in the middle of the content, the playback time must be corrected in order to synchronize the image and audio. However, in a general decoding / playback apparatus, since an audio bitstream is decoded into a continuous audio signal in which one compressed frame is synchronized with a sampling frequency, an image that may be decoded and displayed at discrete time intervals in units of frames. Therefore, there is a problem that time adjustment is very difficult, and further, there is a problem that the synchronization control becomes complicated and difficult when the image is first and the sound is first.
[0011]
An object of the present invention is to solve the above-described problems of the prior art, and an image / audio bitstream that enables chunk generation or division in a format that facilitates image / audio synchronization control as much as possible during decoding and reproduction. It is to provide a dividing device.
[0012]
[Means for Solving the Problems]
In order to achieve the above-described object, the present invention multiplexes an image and an audio bitstream into a single stream by chunking each of a plurality of frames and alternately arranging image and audio chunks. And a chunk generation timing signal generation device for generating a chunk generation timing signal for generating the chunk at regular time intervals in an image / audio bitstream splitting device that divides the data into a plurality of chunks and writes the file to a file , and the chunk Image chunk generation means for waiting until the image bit stream immediately before the image frame immediately after the generation timing signal is read into the multiplexing means and generating the read image bit stream as one image chunk ; Sound that has been read at the time of completion A voice chunk generating means for generating up to bit stream of frames as one audio chunk, there is a first feature in that and means for dividing each of a plurality chunks.
[0013]
According to this feature, the playback time of the audio frame at the beginning of the chunk can always be the same as or earlier than the playback time of the image frame.
[0014]
In addition, the present invention provides a chunk generation timing signal generation device that generates a chunk generation timing signal for generating the chunk at regular time intervals, and a chunk of the image frame immediately after the chunk generation timing signal only for the chunk that becomes a division point. Wait until the previous image bitstream is completely read by the multiplexing means, and the image chunk generating means for generating the image bitstream that has been read as a single image chunk , and the reading is completed at the time of completion. There is a second feature in that audio chunk generating means for generating up to a bit stream of an audio frame as one audio chunk and means for dividing the chunk into a plurality of chunks and outputting the signal at the division point are provided. .
[0015]
According to this feature, in the chunk that becomes the division point, the playback time of the audio frame at the beginning of the chunk can always be the same as or earlier than the playback time of the image frame.
[0016]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, the present invention will be described in detail with reference to the drawings. FIG. 1 is a block diagram showing the configuration of an embodiment of the present invention, and FIG. 2 is a timing chart for explaining the operation of the main part. Note that the same reference numerals as those in FIG. 6 in FIG.
[0017]
When receiving one frame of the encoded bit stream from the image encoder 11, the image bit stream buffer 13 outputs a frame unit notification signal q. The frame unit notification signal q is input to one input terminal of the AND circuit 22. Further, the chunk generation timer pulse generator 16 generates a chunk generation timer pulse Ti at regular intervals. The chunk generation timer pulse Ti is input to the hold circuit 21 and held. As a result, the output of the hold circuit 21 is as indicated by r in FIG.
[0018]
When the chunk generation timer pulse Ti is input to the hold circuit 21, the output r of the hold circuit 21 becomes H (high) level and is input to the other terminal of the AND circuit 22, as shown in FIG. . Thereafter, when the frame unit notification signal q1 is input, the signal q1 passes through the AND circuit 22 and is input to the multiplexing unit 15 as the chunk generation signal s1. Then, the multiplexing unit 15 generates a chunk using the chunk generation signal s1 as a trigger signal. The hold circuit 21 is reset by the chunk generation signal s1.
[0019]
That is, as illustrated in FIG. 2, the multiplexing unit 15 divides the image bit stream a and the audio bit stream b at the timing of the chunk generation signal s1. As can be seen, the frame boundary of the image bitstream a coincides with the chunk generation signal s1, and is thus divided at the frame boundary (for example, a1, a2). However, the audio bitstream b does not always coincide with the audio frame boundary. If they do not match, the frame of the voice that has been generated at that time is set as a boundary (for example, b1, b2).
[0020]
As a result, according to this embodiment, the playback time of the audio frame at the beginning of the chunk can be the same as or earlier than the playback time of the image frame. In other words, the playback time of the audio frame at the beginning of the chunk will never be later than the playback time of the image frame. Therefore, when playing back from a division point in the middle of a file, if the image frame is delayed by a time difference from the audio frame, the image and the audio can be synchronized, which is a problem in the conventional method. It becomes possible to prevent the image / sound synchronization control from becoming complicated. As a result, the reproduction terminal can be reduced in size and price.
[0021]
The hold circuit 21 and the AND circuit 22 are specific examples of means for waiting until the image bit stream immediately before the image frame immediately after the chunk generation timing signal for generating the chunk is read into the multiplexing means. be able to.
[0022]
Next, a second embodiment of the present invention will be described with reference to FIGS. In general, as shown in FIG. 4, for example, as shown in FIG. 4, a single header is attached to a plurality of chunks, and a portion to which the header is attached is a division point. In this embodiment, only at the division point, the playback time of the audio frame at the beginning of the chunk is the same as or earlier than the playback time of the image frame. 3 that are the same as or equivalent to those in FIG.
[0023]
As shown in FIG. 3, in this embodiment, a circuit in parallel with the hold circuit 21 and the AND circuit 22 in which the switching means 23 is connected between the chunk generation timer pulse 16 and the output of the AND circuit 22. Is connected. The switching means 23 is turned off by the file division point signal m from the file generation unit 17, and is turned on otherwise. Therefore, only at the file division point, the playback time of the audio frame at the beginning of the chunk is the same as or earlier than the playback time of the image frame.
[0024]
Next, a third embodiment of the present invention will be described with reference to FIG. In this embodiment, a division point (header) can be entered in a file having no division point, for example, a file having a header only at the beginning and no header after that.
[0025]
The file storage unit 31 stores files without the division points. The file reading unit 32 reads the file from the file storage unit 31 and sends it to the image / sound demultiplexing unit 33. The image / audio demultiplexing unit 33 separates image data and audio data from the file, and sends them to the image bit stream buffer 13 and the audio bit stream buffer 14 in FIG. Subsequent operations are the same as those in FIG. Note that 34 in FIG. 5 may be replaced with the corresponding configuration in FIG.
[0026]
The file generator 17 can output a file containing division points. Therefore, according to this embodiment, a file without division points can be converted into a file with division points.
[0027]
When playing back a file formed in the present invention and stored in the file storage unit, the header is first decoded and the index is extracted. In the case of playing from the nth (n is a positive integer) division point, the reproduction time of the audio and image at the nth division point is acquired from the index, and then (audio reproduction time-image reproduction time) The image reproduction is delayed by the amount, and thereafter the image and the sound are reproduced in order. Thereby, the reproduction of the image and the sound can be matched.
[0028]
According to the present invention, there is no need to time delay an audio bitstream that is very difficult to adjust in time.
[0029]
【The invention's effect】
As is apparent from the above description, according to the first to fourth aspects of the invention, the playback time of the audio frame at the beginning of the chunk can always be the same as or earlier than the playback time of the image frame. Therefore, when playing back from a division point in the middle of a file, if the image frame is delayed by a time difference from the audio frame, the image and the audio can be synchronized, which is a problem in the conventional method. It becomes possible to prevent the image / sound synchronization control from becoming complicated.
[0030]
According to the invention of claim 2, the playback time of the audio frame at the beginning of the chunk is always the same as or ahead of the playback time of the image frame only at the division point where the header is added. be able to. According to the invention of claim 4, a file having no division point can be converted into a file having division points.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of a first embodiment of the present invention.
FIG. 2 is a timing chart of signal and chunk generation of the main part of the first embodiment.
FIG. 3 is a block diagram showing a configuration of a second exemplary embodiment of the present invention.
FIG. 4 is an explanatory diagram of a file configuration.
FIG. 5 is a block diagram showing a configuration of a third exemplary embodiment of the present invention.
FIG. 6 is a block diagram showing a configuration of a conventional image / audio bitstream dividing apparatus.
FIG. 7 is a block diagram illustrating a specific example of a multiplexing unit.
FIG. 8 is a timing chart of conventional chunk generation.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 11 ... Image encoder, 12 ... Audio encoder, 13 ... Image bit stream buffer, 14 ... Audio bit stream buffer, 15 ... Multiplexer, 16 ... Chunk generation timer pulse generator , 17 ... file generation unit, 18 ... file storage unit, 21 ... hold circuit, 22 ... AND circuit, 23 ... switching unit.

Claims (4)

画像および音声ビットストリームを、それぞれ複数フレーム毎に塊(チャンク)にし、画像チャンクおよび音声チャンクを交互に配置する等して1つのストリームとして多重化し、かつ複数チャンク毎に分割してファイルに書き出す画像・音声ビットストリーム分割装置において、
該チャンクを生成するためのチャンク生成タイミング信号を一定時間間隔毎に発生するチャンク生成タイミング信号発生装置と、
チャンク生成タイミング信号直後の画像フレームの直前までの画像ビットストリームが多重化手段に読み込み完了されるまで待ち、該読み込みの完了している画像ビットストリームを1つの画像チャンクとして生成する画像チャンク生成手段と、
該完了時点で読み込みの完了している音声フレームのビットストリームまでを1つの音声チャンクとして生成する音声チャンク生成手段と、
複数チャンク毎に分割する手段を具備したことを特徴とする画像・音声ビットストリーム分割装置。
An image and an audio bitstream are each chunked into a plurality of frames, multiplexed as a single stream by alternately arranging image chunks and audio chunks, and divided into a plurality of chunks and written to a file. In the audio bitstream splitting device,
A chunk generation timing signal generating device for generating a chunk generation timing signal for generating the chunk at regular time intervals;
Image chunk generating means image bit stream immediately before the image frame immediately after the chunk generation timing signal wait until the completion of reading to the multiplexing means, for generating a video bit stream that completion of the loading as one image chunk When,
Audio chunk generation means for generating up to a bit stream of an audio frame that has been read at the time of completion as one audio chunk;
Video and audio bit stream dividing device is characterized in that and means for dividing each of a plurality chunks.
画像および音声ビットストリームを、それぞれ複数フレーム毎に塊(チャンク)にし、画像チャンクおよび音声チャンクを交互に配置する等して1つのストリームとして多重化し、かつ複数チャンク毎に分割してファイルに書き出す画像・音声ビットストリーム分割装置において、
該チャンクを生成するためのチャンク生成タイミング信号を一定時間間隔毎に発生するチャンク生成タイミング信号発生装置と、
分割点となるチャンクに限り、チャンク生成タイミング信号直後の画像フレームの直前までの画像ビットストリームが多重化手段に読み込み完了されるまで待ち、該読み込みの完了している画像ビットストリームを1つの画像チャンクとして生成する画像チャンク生成手段と、
該完了時点で読み込みの完了している音声フレームのビットストリームまでを1つの音声チャンクとして生成する音声チャンク生成手段と、
複数チャンク毎に分割すると共に前記分割点の信号を出力する手段とを具備したことを特徴とする画像・音声ビットストリーム分割装置。
An image and an audio bitstream are each chunked into a plurality of frames, multiplexed as a single stream by alternately arranging image chunks and audio chunks, and divided into a plurality of chunks and written to a file. In the audio bitstream splitting device,
A chunk generation timing signal generating device for generating a chunk generation timing signal for generating the chunk at regular time intervals;
Only for chunks that are division points, wait until the image bitstream immediately before the image frame immediately after the chunk generation timing signal is read into the multiplexing means, and the read image bitstream is read into one image chunk. Image chunk generation means to generate as
Audio chunk generation means for generating up to a bit stream of an audio frame that has been read at the time of completion as one audio chunk;
An image / audio bitstream dividing apparatus comprising: means for dividing a plurality of chunks and outputting a signal at the division point .
前記画像ビットストリームを生成するための画像符号化手段と、前記音声ビットストリームを生成するための音声符号化手段をさらに設けたことを特徴とする前記請求項1又は2に記載の画像・音声ビットストリーム分割装置。  The image / audio bit according to claim 1 or 2, further comprising image encoding means for generating the image bitstream and audio encoding means for generating the audio bitstream. Stream split device. 分割されていない画像および音声ビットストリームが多重化されたビットストリームファイルを読み込む手段と、
該読み込んだ画像および音声ビットストリームを多重分離する手段とをさらに備え、
多重分離された画像および音声ビットストリームを、それぞれ前記画像チャンクおよび音声チャンクを生成する手段に入力するようにしたことを特徴とする前記請求項1又は2に記載の画像・音声ビットストリーム分割装置。
Means for reading a bitstream file in which undivided image and audio bitstreams are multiplexed;
Means for demultiplexing the read image and audio bitstreams;
3. The image / audio bitstream dividing apparatus according to claim 1, wherein the demultiplexed image and audio bitstream are input to means for generating the image chunk and audio chunk , respectively .
JP2001325456A 2001-10-23 2001-10-23 Image / audio bitstream splitting device Expired - Lifetime JP4007575B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001325456A JP4007575B2 (en) 2001-10-23 2001-10-23 Image / audio bitstream splitting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001325456A JP4007575B2 (en) 2001-10-23 2001-10-23 Image / audio bitstream splitting device

Publications (2)

Publication Number Publication Date
JP2003134480A JP2003134480A (en) 2003-05-09
JP4007575B2 true JP4007575B2 (en) 2007-11-14

Family

ID=19142018

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001325456A Expired - Lifetime JP4007575B2 (en) 2001-10-23 2001-10-23 Image / audio bitstream splitting device

Country Status (1)

Country Link
JP (1) JP4007575B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5474417B2 (en) * 2009-06-19 2014-04-16 株式会社エルモ社 Movie data generation apparatus, movie data generation system, movie data generation method, and computer program
JP5331773B2 (en) * 2010-10-14 2013-10-30 株式会社ソニー・コンピュータエンタテインメント Video playback device, information processing device, and video playback method

Also Published As

Publication number Publication date
JP2003134480A (en) 2003-05-09

Similar Documents

Publication Publication Date Title
US7359006B1 (en) Audio module supporting audio signature
JP3666625B2 (en) Data recording method and data recording apparatus
US8676038B2 (en) Recording/reproducing apparatus, recording apparatus, reproducing apparatus, recording method, reproducing method and computer program
JPH09205618A (en) Dynamic image sound expansion reproduction device and dynamic image sound synchronization controller
AU751335B2 (en) Video and audio signal processing
JP4541517B2 (en) Recording device
KR20020064783A (en) Method and device for generating a multiplexed mpeg signal
JP3185863B2 (en) Data multiplexing method and apparatus
KR100975175B1 (en) Information processing device and method, program, and recording medium
US20080124043A1 (en) Multiplexing apparatus, multiplexing method, and computer product
US6122020A (en) Frame combining apparatus
JP4007575B2 (en) Image / audio bitstream splitting device
JP4534168B2 (en) Information processing apparatus and method, recording medium, and program
US9420278B2 (en) Audiovisual content generation method for multistage high-speed reproduction
JPH0898160A (en) Data multiplexing device
KR100240331B1 (en) Apparatus for synchronizing a video and an audio signals for a decoder system
JP2011151784A (en) Moving image multiplexing apparatus, video and audio recording apparatus and moving image multiplexing method
JP3944845B2 (en) Information processing apparatus and method, recording medium, and program
JP3536493B2 (en) Authoring system, encoder and multiplexer used in the system, and method for generating multiple bit streams
JP2005303816A (en) Animation reproducing device
JPH10271482A (en) Synchronous reproduction control method and system for coded video
JPH11127435A (en) Device for decoding compression-encoded video and voice signal
JP3907973B2 (en) Data transmission device
JPH10164141A (en) Multimedia multiplexing system
JP4167415B2 (en) Synchronization processing apparatus and synchronization processing method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040922

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061122

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070122

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070822

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070827

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100907

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4007575

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110907

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120907

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130907

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term