JP2004201266A - Image data reproducing apparatus - Google Patents

Image data reproducing apparatus Download PDF

Info

Publication number
JP2004201266A
JP2004201266A JP2003130811A JP2003130811A JP2004201266A JP 2004201266 A JP2004201266 A JP 2004201266A JP 2003130811 A JP2003130811 A JP 2003130811A JP 2003130811 A JP2003130811 A JP 2003130811A JP 2004201266 A JP2004201266 A JP 2004201266A
Authority
JP
Japan
Prior art keywords
file
information
image data
random access
box
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003130811A
Other languages
Japanese (ja)
Inventor
Yoji Notoya
陽司 能登屋
Yoshinori Matsui
義徳 松井
Tadamasa Toma
正真 遠間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2003130811A priority Critical patent/JP2004201266A/en
Publication of JP2004201266A publication Critical patent/JP2004201266A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an image data reproducing apparatus capable of speedily carrying out random access processing of a file wherein motion picture data or the like are multiplexed. <P>SOLUTION: The image data reproducing apparatus is provided with: a file input part 201 for capturing a file; a temporary data file storage part 202 for temporarily holding the input file; a data file analytic part 203 for analyzing file header information of the input file; a data decoding part 204 for reading substance data from the temporary data file storage part 202 and decoding the data based upon the analyzed result; a data reproducing part 205 for reproducing the decoded substance data; an RA information table generating part 206 for tabulating random access information generated based upon the analyzed result of the data file analytic part 203; a file output part 207 for integrating the RA information table and the input file to output a new file; and a file storage part 208 for storing the outputted file. <P>COPYRIGHT: (C)2004,JPO&NCIPI

Description

【0001】
【発明の属する技術の分野】
本発明は、画像データや音声データ等を多重化したファイルを再生する装置に関し、特に、再生位置の変更や早送り再生等のランダムアクセスを容易にするための技術に関する。
【0002】
【従来の技術】
近年のネットワーク技術の発展を受けて、インターネット等の広域ネットワーク上にあるサーバ装置からファイルをダウンロードして動画像データを再生する画像データ再生装置が開発されている。特に、マルチメディアという言葉が多用される昨今においては、ファイルに音声データやテキストデータ等のメディアデータが複合されている場合が多く、画像データ再生装置は、音声トラック、テキストトラック等のように様々なトラックを同時に再生できることが求められている。
【0003】
この画像データ再生装置は、MPEG−4(Moving Picture Experts Group Phase4)等の圧縮符号化方式によって符号化された動画像データ等を含むファイルをダウンロードによって装置内に取り込み、動画像データ等を復号化して再生する。このとき、動画像データと音声データとが複合されていれば、画像データ再生装置は動画像データと音声データとを分離し、各データ間の同期を図って復号化し再生する。
【0004】
一方、サーバ装置がファイルをダウンロード配信するためのファイルフォーマットとしてMP4ファイルフォーマットが注目されている。本明細書においては、このファイルフォーマットの一例として、MP4ファイルフォーマットを用いて説明することとする。
【0005】
このMP4ファイルフォーマットは、1999年に国際標準化団体MPEG(Moving Picture Experts Group)で制定されたものである。このMP4ファイルフォーマットに基づいて生成されるMP4ファイルは、階層化された複数のボックスからなるボックス構造とされ、実体データを格納するためのボックスに、符号化された動画像データや音声データ等が多重化されて格納されている。そして、画像データ再生装置に読み込まれたMP4ファイルは、装置内において多重化された動画像データや音声データ等が分離されて復号化されることになる。ここで、画像データ再生装置が動画像データや音声データ等を復号化する際の処理単位をフレームといい、各データは複数のフレームから構成される。
【0006】
しかし、制定当初のMP4ファイルフォーマットには、画像データ再生装置がMP4ファイルのダウンロードを完了する前に動画像データの再生を開始する再生方法、いわゆる擬似ストリーミング再生に適していないという問題があった。その理由は、MP4ファイルに含まれる動画像データや音声データについて、各動画像フレームや各音声フレームのサイズや多重化順序等の多重化分離を行なうために必要な情報や、各動画像フレームおよび各音声フレームの表示時刻情報等の同期再生を行なうために必要な情報が、ファイルの先頭に位置するファイルヘッダ部に一括して格納されるというファイル構造の特徴にあった。
【0007】
すなわち、制定当初のMP4ファイルフォーマットは上記のようなファイル構造とされるため、画像データ再生装置は、ファイルヘッダ部のダウンロードを完了するまで、MP4ファイルに含まれる動画像データ等の再生を開始することができず、ファイルヘッダ部のサイズが大きい程、ダウンロードに要する時間が長くなってしまう。特に長時間のデータを含むファイルでは、その分ファイルヘッダ部も大きくなって、ダウンロードに時間がかかり、画像データ再生装置が再生を開始することができるまで多くの時間を要するという問題もあった。
【0008】
このような問題を解決するために、多重化分離情報や同期再生情報と、動画像データや音声データ等の実体データとを、交互に配置するMP4ファイルフォーマットが提案され、標準化の動きが進められており、例えば、非特許文献1が開示されている。
【0009】
図20は、上記標準化が進められている従来のMP4ファイルフォーマットの構造を示す図である。
このMP4ファイル100は、動画像データの符号化方式等、ファイル全体の属性情報(ヘッダ情報)を格納するムービーボックス101と、動画像データ等の実体データを格納するムービーデータボックス102と、ムービーフラグメント列103とから構成され、階層化された複数のボックスからなるボックス構造とされる点において、上記制定当初のMP4ファイルと共通するが、ムービーフラグメント列103を含む点において、上記制定当初のMP4ファイルと異なる。
【0010】
このムービーフラグメント列103は、所定の時間単位で区切られたムービーフラグメント104を繰り返し配列して構成されたものであり、MP4ファイルの拡張領域と呼ばれる。これに対して、上記のムービーボックス101とムービーデータボックス102とは、MP4ファイルの基本領域と呼ばれる。なお、上記所定の時間単位は、常に一定であるとは限らず、例えば、復号化装置のバッファメモリの容量を考慮して、符号化装置において調整されることがあり、このような場合は、結果的に上記所定の時間単位は略一定となることもある。
【0011】
ムービーフラグメント104は、上記所定の時間単位に含まれる動画像データ等に関する多重化分離情報および同期再生情報等を格納するムービーフラグメントボックス105と、上記所定の時間単位に含まれる動画像データ等の実体データを格納するフラグメントデータボックス106とから構成される。
【0012】
ムービーフラグメントボックス105は、上記所定の時間単位に含まれる動画像データ等に関する多重化分離情報および同期再生情報等、ムービーフラグメント104のヘッダ情報を格納するボックスである。このムービーフラグメントボックス105は、動画像トラックまたは音声トラック等のようにいずれか1種類のトラックに関するデータについての多重化分離情報および同期再生情報を格納するトラックフラグメントボックス107を含む。すなわち、1つのムービーフラグメント104に含まれるトラックの種類の数と同数以上のトラックフラグメントボックス107が含められることになり、1つのムービーフラグメント104に動画像データと音声データとが含まれる場合は、少なくとも2つのトラックフラグメントボックス107が用意されることになる。なお、ここで、同数以上とは、1つのトラックに対して複数のトラックフラグメントボックス107が用意される場合があることを意味するものであり、例えば、動画像トラックに関するデータについての多重化分離情報および同期再生情報が2つのトラックフラグメントボックス107に格納され、音声トラックに関するデータについての多重化分離情報および同期再生情報が、1つのトラックフラグメントボックス107に格納されて、合計3つのトラックフラグメントボックス107が用意されることもある。
【0013】
このトラックフラグメントボックス107は、上記所定の時間単位よりも細かい単位で区切られたトラックランボックス108を複数個備えており、トラックランボックス108は、さらに、複数個のエントリ109から構成される。
エントリ109は、復号化の処理単位となるフレームに関する情報、すなわち、多重化分離情報や同期再生情報等を記述するためのフィールド群である。そして、動画像トラックに関するトラックフラグメントボックス107に含まれるトラックランボックス108においては、エントリ109のフィールドに動画像フレームが画面内符号化フレーム(いわゆるイントラフレーム)であるか否かを示す情報が記述される場合もある。一般に、動画像データは、このイントラフレームを一定数の動画像フレーム毎に繰り返し配置する構造をとることが多く、このような構造で繰り返し配置される1つの単位をGOP(Group Of Picture)という。そして、このGOP単位で、エントリ109をトラックランボックス108に格納することが想定されている。
【0014】
また、このエントリ109には、各データ間の同期再生を図るために同期サンプルフラグがセットされる場合があり、この場合、そのエントリ109のフィールドに同期サンプルフラグ情報が記述され、この記述は動画像フレームがイントラフレームであることを示す情報が記述されていることと同じ意味を有する。
【0015】
また、フラグメントデータボックス106は、対応するムービーフラグメントボックス105において指し示されるフレームの実体データを格納するボックスであり、フレームを構成するサンプルが格納されている。
なお、これらMP4ファイル100を構成する各ボックスは、それぞれボックスヘッダ部110とボックスデータ格納部111とから構成され、ボックスヘッダ部110には、ボックスのサイズ情報を格納するボックスサイズ112とボックスの種類を識別するための文字列を格納するボックスタイプ113とが少なくとも含まれている。また、ボックスデータ格納部111には、そのボックスの下の階層のボックスが格納されたり、情報を記述するためのフィールドが並べられたりする。
【0016】
このように、所定の時間単位で区切られた動画像データや音声データに関する多重化分離情報および同期再生情報を格納するムービーフラグメントボックス105と、対応する実体データを格納するフラグメントデータボックス106とからなるムービーフラグメント104を繰り返し配列するという構造とされる。すなわち、先に述べた制定当初のMP4ファイルは、所定の時間単位で区切ることなく、多重化分離情報および同期再生情報等を全てムービーボックスに格納し、実体データを全てムービーデータボックスに格納していたため、前述のようにヘッダ情報を格納するムービーボックス101のサイズが大きくなり、動画像データや音声データを格納しているムービーデータボックス102の最初の部分を取得するまでに時間がかかるという問題があった。これを解決するために、このMP4ファイル100は、拡張領域であるムービーフラグメント列103を設け、この中に大部分の動画像データや音声データを格納することで、ムービーボックス101のサイズを小さくし、再生開始までの時間を短くできるようにした(非特許文献1参照。)。
【0017】
【非特許文献1】
ISO/IEC JTC1/SC29/WG11 MPEG、ISO/IEC 14496−1 「ISO Media File format specification」、2001年7月20日
【0018】
【発明が解決しようとする課題】
しかしながら、上記のようなファイル構造とされるMP4ファイルフォーマットは、画像データ再生装置によるランダムアクセスが困難であるという問題がある。ここで、ランダムアクセスとは、例えば、再生位置を10秒後に移動させたり、早送り再生を行なったりする処理動作を意味する。この問題についてより詳しく説明する。
【0019】
ランダムアクセスを行なうに際して、画像データ再生装置は、ユーザインターフェースを介してユーザからのランダムアクセス指示を受け付け、その指示に従ってMP4ファイルに含まれる動画像データ等の再生開始位置(復号開始位置)を迅速に決定し、動画像データ等を復号化して再生する必要がある。
【0020】
また、通常、MPEG−4等の高能率圧縮符号化方式によって生成される動画像データ等は、イントラフレームおよび画面間符号化フレーム(いわゆる予測フレーム)の動画像フレームから構成されている。この予測フレームは、復号化を終えた動画像フレームのデータを参照しながら復号化を行なうフレームであるので、ランダムアクセスによる再生開始位置を予測フレームとすると、正しく再生することができず、再生画像が乱れてしまう等の支障がある。そのため、ランダムアクセスによる再生開始位置は、イントラフレームであることが必要とされる。
【0021】
従って、画像データ再生装置は、例えば再生位置を10秒後に移動させるランダムアクセス指示を入力すると、現在復号化中の動画像フレームから10秒先に相当する動画像フレームまでに介在する全ての動画像フレームを格納するムービーフラグメントボックス105を解析し、さらに、それら一つ一つについて動画像データを含むトラックフラグメントボックス107を解析し、さらに、一つ一つについてトラックランボックス108を解析し、というように、非常に小さな単位に至るまで大量のボックスを解析して、再生継続時間をカウントし、ランダムアクセス後の再生開始位置となる10秒先の動画像フレームを決定しなければならない。また、画像データ再生装置は、10秒先に相当する動画像フレームがイントラフレームであるかどうかを判断しなければならない。そして、イントラフレームでない場合は、その直近のイントラフレームを探してランダムアクセス後の再生開始位置となる動画像フレームを決定しなければならない。
【0022】
このように、従来におけるMP4ファイルフォーマットは、ランダムアクセスに際して画像データ再生装置にかかる負荷が大きく、画像データ再生装置がランダムアクセス後の再生開始位置を決定するまでに時間がかかってしまい、その間ユーザを待たせなければならないという不都合がある。
【0023】
一方、従来のMP4ファイルフォーマットは、インターネット上のサーバ装置からダウンロードしながら再生する擬似ストリーミング再生等に用いることを一つの目的としているため、ダウンロードが完了していない部分へ再生位置を移動させることはできず、ダウンロードが完了している部分へのみ再生位置を移動させることができる。従って、MP4ファイルのデータ再生におけるランダムアクセスは、画像データ再生装置がMP4ファイルを一旦ダウンロード再生した後に改めて再生する際に使用される場合が多いと想定される。
【0024】
また、従来のMP4ファイルフォーマットはダウンロード配信において使用することを想定しているので、通信時間や通信料の観点からMP4ファイルのファイルサイズを小さくすることが望まれている。特に、ダウンロードしたデータ量に応じて課金される移動体通信においては、通信料が割高にならないようにファイルサイズを可能な限り縮小させなければならないという問題もある。
【0025】
そこで、本発明は、かかる問題点および事情に鑑みてなされたものであり、ダウンロードするファイルのサイズを増加させることなく、動画像データや音声データ等を多重化したファイルのランダムアクセス処理を迅速に実行することができる画像データ再生装置を提供することを目的とする。
【0026】
【課題を解決するための手段】
上記の目的を達成するために、本発明に係る画像データ再生装置は、画像データと、音声データおよびテキストデータのうち少なくとも1つとを多重化してなるファイルを再生する画像データ再生装置であって、前記ファイルを前記画像データ再生装置に取り込むファイル入力手段と、前記入力手段が取り込んだ入力ファイルを一時的に記憶するための領域を有するファイル一時記憶手段と、前記ファイル一時記憶手段に格納されている前記入力ファイルを読み込んで、前記入力ファイルに含まれる前記画像データ、音声データまたはテキストデータの分離および同期再生をするためのファイルヘッダ情報を解析するファイル解析手段と、前記ファイル解析手段が解析した前記ファイルヘッダ情報に基づいて前記一時記憶手段に格納されている前記入力ファイルに含まれる前記画像データ、音声データまたはテキストデータを読み出して復号する復号手段と、前記復号手段が復号した前記画像データ、音声データまたはテキストデータを再生して表示装置に出力する再生手段と、前記ファイル解析手段が解析したファイルヘッダ情報に基づいて、前記入力ファイルに含まれる前記画像データ、音声データまたはテキストデータにランダムアクセスするためのランダムアクセス情報を生成するランダムアクセス情報生成手段と、前記ランダムアクセス情報生成手段が生成した前記ランダムアクセス情報を参照して、前記入力ファイルの解析位置の変更を指示する解析位置変更指示を前記ファイル解析手段に出力する再生位置制御手段とを備え、前記ファイル解析手段は、前記再生位置制御手段が出力する前記解析位置変更指示に基づいて、前記ファイル一時記憶手段に格納されている前記入力ファイルの読み込み位置を変更し、前記入力ファイルに含まれる前記画像データ、音声データまたはテキストデータのファイルヘッダ情報を解析することを特徴とする。
【0027】
これによって、最初のファイル再生時に、単独で復号化可能なフレームに関するヘッダ情報の位置を示す情報、すなわちランダムアクセス情報を生成するので、迅速なランダムアクセス再生を実現することができる。
ここで、前記ランダムアクセス情報生成手段は、前記入力ファイルに含まれるメディアデータ毎に前記ランダムアクセス情報を生成するとしてもよい。これによって、入力されるファイルに様々なトラックが複合されている場合でも、それぞれのトラック毎のランダムアクセス情報を参照することで、ランダムアクセス再生の処理を迅速にすることができるという効果が発揮される。
【0028】
また、本発明に係る画像データ再生装置は、さらに、前記ランダムアクセス情報生成手段が生成した前記ランダムアクセス情報を含むファイルを出力するファイル出力手段を備え、前記ランダムアクセス情報生成手段は、前記入力ファイルが階層化された構造である場合に、前記入力ファイルに含まれるメディアデータ毎に前記ランダムアクセス情報を記述するための第1階層と、前記第1階層を集積させた第2階層とを生成し、前記ファイル出力手段は、前記第2階層を前記入力ファイルと一体化させて、前記ランダムアクセス情報を含むファイルを出力するのが好ましい。
【0029】
これによって、最初のファイル再生時に生成したランダムアクセス情報をファイル出力するので、次のファイル再生時におけるランダムアクセス再生の迅速化に寄与することができる装置が実現される。
さらに、前記ファイル出力手段は、前記入力ファイルと一体化された前記第2階層の開始位置を示す位置情報を生成し、当該位置情報を前記入力ファイルと一体化させて、前記ランダムアクセス情報を含むファイルを出力するとしてもよい。
【0030】
これによって、ランダムアクセス情報が格納されている部分の読み込みを迅速に行なうことができるので、ランダムアクセス再生をより迅速に実行することができる。
なお、本発明は、このような画像データ再生装置として実現することができるだけでなく、このような画像データ再生装置が備える特徴的な手段をステップとする画像データ再生方法として実現したり、それらのステップをコンピュータに実行させるプログラムとして実現したりすることもできる。そして、そのようなプログラムは、CD−ROM等の記録媒体やインターネット等の伝送媒体を介して配信することができるのは言うまでもない。
【0031】
【発明の実施の形態】
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
(実施の形態1)
図1は、本発明の実施の形態1に係る画像データ再生装置の構成を示すブロック図である。
【0032】
この画像データ再生装置200は、MPEG−4等の圧縮符号化方式によって符号化された動画像データや音声データ等を復号化して再生する装置であり、MP4ファイルを装置内に取り込むファイル入力部201、装置内に取り込まれるMP4ファイルを一時的に格納するデータファイル一時記憶部202、MP4ファイルのヘッダ情報を読み出して解析するデータファイル解析部203、MP4ファイルに含まれる実体データを復号化するデータ復号化部204、復号化された実体データを再生し、ディスプレイ等の表示装置に出力するデータ再生部205、ランダムアクセスを迅速に処理するためのランダムアクセス情報テーブル(以下、「RA情報テーブル」という。)を生成するRA情報テーブル生成部206、入力が完了したMP4ファイルとRA情報テーブルとを多重化して、新たなMP4ファイルを出力するファイル出力部207および出力されたMP4ファイルを格納するファイル格納部208を備える。
【0033】
ファイル入力部201は、インターネット上のサーバ装置に格納されているMP4ファイルをダウンロードして画像データ再生装置内に取り込む処理部であり、サーバ装置とインターネット等を介して通信を行なうための通信インターフェース等によって実現される。このファイル入力部201は、MP4ファイルをファイル先頭から順次ダウンロードして装置内に取り込み、データファイル一時記憶部202に順次蓄積させていく。
【0034】
データファイル一時記憶部202は、ファイル入力部201が取り込むMP4ファイルを一時的に保持する記憶部であり、RAM(Random Access Memory)やハードディスク等の記憶装置によって実現される。
データファイル解析部203は、データファイル一時記憶部202に蓄積されていくMP4ファイルからヘッダ情報を読み出して解析する処理部であり、CPUやメモリによって実現される。ここにいうMP4ファイルのヘッダ情報とは、ムービーボックスに含まれるファイル全体のヘッダ情報やムービーフラグメントボックスに含まれる多重化分離情報や同期再生情報等のムービーフラグメントのヘッダ情報を意味する。また、このデータファイル解析部203は、MP4ファイルのヘッダ情報を解析した結果に基づいて、フレームの境界位置や再生時刻に関する情報等、動画像データ等を復号するために必要な復号指示情報をデータ復号化部204に出力する。さらに、このデータファイル解析部203は、MP4ファイルのヘッダ情報を解析した結果に基づいてランダムアクセス情報(以下、「RA情報」という。)をRA情報テーブル生成部206に出力する。
【0035】
データ復号化部204は、データファイル解析部203から受け取った復号指示情報に基づいて、データファイル一時記憶部202に蓄積されていくMP4ファイルから動画像データや音声データ等の実体データを読み込んで復号化する処理部であり、CPUやメモリを備えたデコーダによって実現される。
【0036】
データ再生部205は、データ復号化部204が復号化した実体データを再生してディスプレイ等の表示装置やスピーカに出力する処理部であり、DSP(Digital Signal Processor)等のマイクロプロセッサやVRAM(Video Random Access Memory)を備えたチップ、または、ビデオカード等によって実現される。
【0037】
RA情報テーブル生成部206は、データファイル解析部203から受け取ったRA情報に基づいてRA情報テーブルを生成する処理部であり、CPUやメモリによって実現される。ここにいうRA情報とは、ランダムアクセス後の再生開始位置とすべきフレームのヘッダ情報に関する位置情報および時刻情報であり、RA情報テーブルとは、RA情報を集積させたテーブルである。なお、このRA情報およびRA情報テーブルについては、後に詳しく説明することとする。
【0038】
ファイル出力部207は、ダウンロードが完了してデータファイル一時記憶部202に蓄積されたMP4ファイル、すなわち装置内への入力が完了したMP4ファイルを読み出すとともに、RA情報テーブル生成部206からRA情報テーブルを受け取って入力完了MP4ファイルの末尾に追加し、入力完了MP4ファイルとRA情報テーブルとを多重化して新たなMP4ファイルを出力する処理部であり、CPUやメモリによって実現される。
【0039】
ファイル格納部208は、ファイル出力部207が出力したMP4ファイルを格納する記憶部であり、ハードディスク等の記憶装置や、光磁気ディスク、SDメモリーカード等の記録媒体等によって実現される。
ここで、この画像データ再生装置200が出力するMP4ファイルの構造について説明する。
【0040】
図2は、本実施の形態1に係る画像データ再生装置200により生成されるMP4ファイルのファイル構造を示す図である。
図2に示すように、画像データ再生装置200により生成されるMP4ファイル300は、ムービーボックス301、ムービーデータボックス302、ムービーフラグメント列303およびRA情報テーブル310から構成され、主にRA情報テーブル310を含む点において従来におけるMP4ファイル100と異なる。
【0041】
このMP4ファイル300は、まず、このMP4ファイル300のうちムービーボックス301、ムービーデータボックス302およびムービーフラグメント列303の部分が、画像データ再生装置200のファイル入力部201から順次取り込まれ、次に、画像データ再生装置200のファイル出力部207においてRA情報テーブル310の部分が追加されることによって生成される。
【0042】
すなわち、画像データ再生装置200のファイル入力部201に取り込まれる段階において、画像データ再生装置200に入力されるMP4ファイルは、従来におけるMP4ファイル100と同様の構成とされる。
このMP4ファイル300の生成過程を説明するために、図2では、図20と異なりムービーフラグメント列303を構成するボックス階層をより具体的に示す。
【0043】
ムービーフラグメント列303は、複数のムービーフラグメント304が繰り返し配列されたものであり、ムービーフラグメント304は、ムービーフラグメントボックス305とフラグメントデータボックス306とを交互に配置して構成されている。ここで、ムービーフラグメントボックス305のボックスヘッダ部には、ムービーフラグメントボックス305の種別を示す文字列”moof”が格納されており、これによってこのボックスが、ムービーフラグメントボックス305であることを示している。また、図示を省略しているが、この種別を示す文字列の直前には、このボックスのサイズ情報が付与されている。さらに、ムービーフラグメントボックス305のボックスヘッダ部には、”moof”の他に、ファイルの先頭から何番目のムービーフラグメントボックス305であるかを示す数字が格納されている。
【0044】
また、ムービーフラグメントボックス305のボックスデータ格納部に格納されているトラックフラグメントボックス307のボックスヘッダ部には、トラックフラグメントボックス307の種別を示す文字列”traf”が格納されており、これによってこのボックスがトラックフラグメントボックス307であることを示し、この種別を示す文字列の直前に、このボックスのサイズ情報が付与されている。そして、トラックフラグメントボックス307のボックスヘッダ部には、格納しているトラックのトラック番号情報が格納されていて、どのトラックであるかがわかるようになっている。なお、前述のように、トラックフラグメントボックス307はヘッダデータであり、これが指し示すデータはフラグメントデータボックス306に格納されている。すなわち、あるトラックフラグメントボックス307が、これを格納するムービーフラグメントボックス305の中の何番目のトラックフラグメントボックス307であるかを示す情報は付与されておらず、画像データ再生装置200が、トラックフラグメントボックス307が出現する度にカウントする。
【0045】
さらに、トラックフラグメントボックス307のボックスデータ格納部に格納されているトラックランボックス308のボックスヘッダ部には、トラックランボックス308の種別を示す文字列”trun”が格納されており、これによってこのボックスがトラックランボックス308であることを示し、この種別を示す文字列の直前に、このボックスのサイズ情報が付与されている。また、トラックランボックス308のボックスデータ格納部に格納されているエントリ309のフィールドには、そのエントリ309の指し示す動画像データや音声データ等の最小単位の表示継続時間情報やイントラフレームであるか否かを示す情報が記述されている。なお、ファイルを作成する装置によっては、ムービーボックス301にムービー全体のサンプルに関する同期サンプルフラグ情報のデフォルト値を格納したり、トラックフラグメントボックス307にそのボックスに含まれるサンプルに関する同期サンプルフラグ情報や継続時間長情報のデフォルト値を格納したりする場合もある。
【0046】
ここでは、トラックランボックス308に含まれる最初のエントリ309がイントラフレームを示すものである場合には、トラックランボックス308のフィールドにイントラフレームを示す情報が記述されることとし、そのエントリ309に同期サンプルフラグがセットされている場合には、トラックランボックス308のフィールドに同期サンプルフラグ情報が記述されることとする。
【0047】
そして、フラグメントデータボックス306のボックスヘッダ部には、フラグメントデータボックス306の種別を示す文字列”mdat”が格納されており、これによってこのボックスがフラグメントデータボックス306であることを示し、この種別を示す文字列の直前に、このボックスのサイズ情報が付与されている。さらに、フラグメントボックス306のボックスデータ格納部には、ムービーフラグメントボックス305内に格納されている全てのエントリ309それぞれが指し示すフレームを構成するサンプルがエントリの順番に格納されている。
【0048】
図2では、第1のムービーフラグメントボックス305内の第1のトラックフラグメントボックス307に含まれる第1トラックランボックス308の第1エントリ309に同期サンプルフラグS1がセットされており、また、第2のムービーフラグメントボックス305内の第1のトラックフラグメントボックス307に含まれる第1トラックランボックス308の第2エントリ309に同期サンプルフラグS2がセットされている。従って、同期サンプルフラグS1は、第1のトラックランボックス308のフィールドに同期サンプルフラグ情報が記述されることになり、同期サンプルフラグS2は、セットされているエントリ309のフィールドに同期サンプルフラグ情報が記述されることになる。さらに、同期サンプルフラグS1によって、第1のフラグメントデータボックス306に含まれる最初のサンプルがイントラフレームI1であることが示されていることとなる。
【0049】
すなわち、これら同期サンプルフラグがセットされているエントリ309に、ランダムアクセス後の再生開始位置とすべきフレームのヘッダ情報が格納されているといえるので、画像データ再生装置200は、これらのエントリ309に関する位置情報および時刻情報を集積してRA情報テーブル310を生成する。
【0050】
ここで、RA情報テーブル310の生成過程について図を用いて説明する。
図3は、本実施の形態1に係る画像データ再生装置がRA情報テーブルを生成する処理手順を示すフロー図である。
まず、データファイル解析部203は、ムービーフラグメント304に含まれる最初のムービーフラグメントボックス305を読み込む(S10)。続いて、そのムービーフラグメントボックス305に含まれる最初のトラックフラグメントボックス307を読み込む(S11)。さらに、データファイル解析部203は、ボックスの階層を深めて、最初のトラックフラグメントボックス307に含まれる最初のトラックランボックス308を読み込む(S12)。
【0051】
ここで、データファイル解析部203は、このトラックランボックス308のフィールドに同期サンプルフラグ情報が記述されているか否かを解析する(S13)。
トラックランボックス308のフィールドに同期サンプルフラグ情報が記述されている場合、データファイル解析部203は、同期サンプルフラグの位置情報や時刻情報をRA情報としてRA情報テーブル生成部206に出力し、RA情報テーブル生成部206はこの情報をRA情報テーブル310に追加する(S14)。
【0052】
一方、トラックランボックス308のフィールドに同期サンプルフラグ情報が記述されていない場合、データファイル解析部203は、さらにボックスの階層を深めて、第1のトラックランボックス308に含まれるエントリ309を順次読み込む(S15)。
【0053】
ここで、データファイル解析部203は、順次読み込んだエントリ309のフィールドに同期サンプルフラグ情報が含まれているか否かを解析する(S16)。
【0054】
エントリ309のフィールドに同期サンプルフラグ情報が記述されている場合、先に述べたトラックランボックス308のフィールドに同期サンプルフラグ情報が記述されている場合と同様に、RA情報テーブル生成部206は、データファイル解析部203がRA情報として出力する同期サンプルフラグの位置情報や時刻情報をRA情報テーブル310に追加する(S14)。
【0055】
一方、エントリ309のフィールドに同期サンプルフラグ情報が記述されていない場合、データファイル解析部203は、次のトラックランボックス308を読み込む。RA情報テーブル生成部206にRA情報として同期サンプルフラグの位置情報や時刻情報がRA情報テーブル310に追加された場合も同様に、次のトラックランボックス308を読み込む。
【0056】
ここで、トラックフラグメントボックス307に次のトラックランボックス308があれば、画像データ再生装置200はS12〜S14までの処理を繰り返し、トラックフラグメントボックス307に次のトラックランボックス308がなければ、データファイル解析部203は、次のトラックフラグメントボックス307を読み込む(S17)。
【0057】
また、同様に、ムービーフラグメントボックス305に次のトラックフラグメントボックス307があれば、画像データ再生装置200はS11〜S17までの処理を繰り返し、ムービーフラグメントボックス305に次のトラックフラグメントボックス307がなければ、データファイル解析部203は、次のムービーフラグメントボックス305を読み込む(S18)。
【0058】
その後、次のムービーフラグメントボックス305があれば、画像データ再生装置200は、S11〜S18までの処理を繰り返し、次のムービーフラグメントボックス305がなければ、RA情報テーブル生成部206は、データファイル解析部203からRA情報終了情報を受け取り、生成したRA情報テーブル310をファイル出力部207に出力する(S19)。そして、最終的には、RA情報テーブル310は、ファイル出力部207によってボックス構造に成形され、入力完了MP4ファイルの最後に結合されて新たなMP4ファイル300の一部として出力される(S20)。
【0059】
なお、上記のように、ムービーボックス301にムービー全体のサンプルに関する同期サンプルフラグ情報のデフォルト値が格納され、トラックフラグメントボックス307にそのボックスに含まれるサンプルに関する同期サンプルフラグ情報や継続時間長情報のデフォルト値が格納されている場合には、画像データ再生装置200は、これらのデフォルト値を取得してメモリに保持しておく。そして、トラックランボックス308が省略されていれば、トラックフラグメントボックス307、ムービーボックス301の順に参照し、これらのデフォルト値を用いてRA情報テーブル310を生成する。
【0060】
このような過程を経て生成されるRA情報テーブル310に含まれる情報やデータ構造について図4を用いて説明する。
図4(a)は、RA情報テーブル310に含まれるデータの中身を示す図である。
【0061】
RA情報テーブル310は、テーブルに格納されるRA情報の数と同数の行を有し、1行に1つのRA情報を記述する構成とされる。
そして、1つのRA情報は、同期サンプルフラグ情報が記述されているエントリ309によって指し示されるフレームの再生時刻を示す時間311、そのエントリ309が含まれるムービーフラグメントボックス305が、ファイル先頭から何バイト目に位置するかを示す”moof”の開始位置312、そのエントリ309が何番目のトラックフラグメントボックス307に含まれるかを示す”traf”番号313、そのエントリ309が何番目のトラックランボックス308に含まれるかを示す”trun”番号314、そのエントリ309が何番目のエントリ309であるかを示すエントリ番号315、および、そのエントリ309によって指し示されるフレームはファイル先頭から何バイト目に位置するかを示すデータの開始位置316のフィールドから構成されている。
【0062】
図4(b)は、RA情報テーブル310のデータ構造を示す図である。
上述のように、RA情報テーブル310は、ファイル出力部207によってボックス構造に変換される(図3のS20)。
ボックス構造に変換されたRA情報テーブル310は、MP4ファイル300を構成するその他のボックスと同様に、ボックスヘッダ部317とボックスデータ格納部318とから構成される。ボックスヘッダ部317は、ボックスのサイズ情報を格納するボックスサイズ317aと、ボックスの種類を識別するための文字列を格納するボックスタイプ317bとを少なくとも含んでおり、これらのフィールドには例えば、夫々4バイトが割り当てられる。なお、このボックスヘッダ部317にRA情報テーブル310のバージョンやフラグ情報を示すバージョンフラグ情報を格納することとしてもよい。
【0063】
また、ボックスヘッダ部317に続いて位置するボックスデータ格納部318には、RA情報テーブル310に含まれるRA情報の数を示すRA情報テーブルに含まれるサンプルフラグ数319が格納されており、その後ろにRA情報を構成するフィールド311〜316が並べられる。これらのフィールドのデータ長は、ここでは、サンプルフラグ数319のフィールドに、4バイトを割り当て、このRA情報を構成するフィールドには、時間311に4バイト、”moof”の開始位置312に4バイト、”traf”番号313に1バイト、”trun”番号314に1バイト、エントリ番号315に2バイト、データの開始位置316に4バイトを割り当てるとして説明するが、データ量の削減のためにその他のデータ長であってもよく、このデータ長を示す情報を、RA情報テーブル310に持たせることとしてもよい。
【0064】
このように、本実施の形態1に係る画像データ再生装置200は、最初のファイル再生段階、すなわちMP4ファイルをダウンロードしながら再生する段階において、ファイルの再生と同時に、ランダムアクセス時に再生開始位置とすべきフレーム、例えばイントラフレーム等のヘッダ情報に関する位置情報および時刻情報を抽出する。そして、画像データ再生装置200は、この位置情報等を集積してダウンロードの完了後にMP4ファイルの末尾に追加し、新たなMP4ファイルとして出力する。すなわち、画像データ再生装置200は、最初のファイル再生段階において、ランダムアクセスを迅速に処理するための情報を生成して出力するので、ダウンロード後の再生時におけるランダムアクセス再生の迅速化に寄与することができる。
【0065】
次に、本実施の形態1の第1変形例について説明する。
上記実施の形態1では、画像データ再生装置200において、データファイル解析部203がRA情報をRA情報テーブル生成部206に出力し、RA情報テーブル生成部206でRA情報テーブルが生成されることとした。
【0066】
これに対して第1変形例では、上記実施の形態1と略同一の構成とされる画像データ再生装置において、データファイル解析部が、動画像トラック用RA情報および音声トラック用RA情報等のようにトラック毎のRA情報をRA情報テーブル生成部に出力し、RA情報テーブル生成部でトラック毎のRA情報テーブルが生成される。
【0067】
そのため、第1変形例に係る画像データ再生装置が生成するMP4ファイルの構造は、上記画像データ再生装置200が生成するMP4ファイルと異なる。以下、第1変形例に係る画像データ再生装置により生成されるMP4ファイルの構造について、生成過程を含めて説明することとする。
【0068】
図5は、本実施の形態1の第1変形例に係る画像データ再生装置により生成されるMP4ファイルのファイル構造を示す図である。
このMP4ファイル400は、ムービーボックス401、ムービーデータボックス402、ムービーフラグメント列403およびRA情報テーブル列410から構成されており、RA情報テーブルが複数含まれている点において、上記MP4ファイル300と異なる。
【0069】
なお、このMP4ファイル400も、画像データ再生装置に取り込まれる段階では、従来におけるMP4ファイル100の構成と同様の構成とされる。
RA情報テーブル列410は、複数のRA情報テーブルが繰り返し配列されたものであり、ボックス構造に成形されている。すなわち、このRA情報テーブル列410は、MP4ファイル400のその他のボックスと同様に、ボックスヘッダ部411とボックスデータ格納部412とから構成される。そして、RA情報テーブル列410の先頭に位置するボックスヘッダ部411は、ボックスのサイズ情報を格納するボックスサイズ411aと、ボックスの種別を表す文字列を格納するボックスタイプ411bとを少なくとも含んでおり、これらのフィールドには例えば、夫々4バイトが割り当てられる。なお、このボックスヘッダ部411にRA情報テーブル列410のバージョンやフラグ情報を示すバージョンフラグ情報を格納することとしてもよい。
【0070】
また、ボックスヘッダ部411に続いて位置するボックスデータ格納部412には、RA情報テーブル列410に含まれるRA情報テーブルの数を示すRA情報テーブル数413が格納されており、その後に例えば、動画像トラック用RA情報テーブル414M、音声トラック用RA情報テーブル414Aおよびテキストトラック用RA情報テーブル414T等のトラック毎に生成されたRA情報テーブルが格納される。
【0071】
このトラック毎に生成されるRA情報テーブルは、図5に示すように、トラックの種類にかかわらず全て同一の構成とすることができ、また、トラックの種類毎に異なる構成としてもよい。なお、ここでは、トラックの種類毎に同一の構成として、動画像トラック用RA情報テーブル414Mと音声トラック用RA情報テーブル414Aとを用いて説明することとする。
【0072】
動画像トラック用RA情報テーブル414Mは、動画像トラックに関するRA情報を集積したテーブルである。この動画像トラック用RA情報テーブル414Mの先頭には、どのトラックに関するRA情報テーブルであるかを示すユニークな文字列を記述するフィールドであるトラックID415Mが含まれている。そして、このトラックID415Mに続いて、テーブルに含まれるサンプルフラグ数416Mのフィールドが含まれ、その後にRAエントリ417Mが並べられる。なお、RAエントリ417Mとは、上記実施の形態1のRA情報テーブル310における時間311からデータの開始位置316までのフィールドを一まとめにしたフィールド群を意味するものとする。
【0073】
一方、音声トラック用RA情報テーブル414Aは、音声トラックに関するRA情報を集積したテーブルである。この音声トラック用RA情報テーブル414Aも、動画像トラック用RA情報テーブル414Mと同様に、先頭にトラックID415Aが含まれている。そして、このトラックID415Aに続いて、テーブルに含まれるサンプルフラグ数416Aが含まれ、その後にRAエントリ417Aが並べられる。
【0074】
そして、図5に示すように、動画像トラック用RA情報テーブル414MにおけるRAエントリ417Mの順番と、音声トラック用RA情報テーブル414AにおけるRAエントリ417Aの順番とが一致するRAエントリ同士で同期再生を行なうことができるようにRA情報テーブル414Mおよび414Aが生成される。
【0075】
また、一般に、音声トラックの場合、動画像トラックにおける予測フレームのように既に復号化したフレームのデータを参照しながら復号化を行なうものではなく、どの音声フレームから復号化しても再生することができるので、動画像トラック用RA情報テーブル414Mのように、テーブルに追加する情報をイントラフレームであることを示すエントリに限る必要がない。従って、音声トラックに関するRA情報は、例えば音声フレームの再生時刻に一定時間間隔という規則性を持たせ、その規則性に従って配列された音声フレームのヘッダ情報に関する時刻情報および位置情報であればよい。
【0076】
または、音声フレームの再生時刻に、動画像フレームと同調させて動画像トラック用RA情報テーブル414MにおけるRAエントリ417Mのフィールドに記述されている再生時刻の値と最も近い再生時刻を有するものという規則性を持たせることとしてもよい。動画像フレームのサンプルレートと音声フレームのサンプルレートとは夫々異なるため、動画像フレームと音声フレームとの再生時刻は必ずしも一致するとは限らない。しかし、この規則性によれば、動画像フレームの再生時刻と音声フレームの再生時刻とがずれる場合でも、近似している再生時刻および”moof”の開始位置をRAエントリ417Mおよび417Aに夫々記述し、これらを参照することによって、ランダムアクセス後における動画像データの再生開始時刻と音声データの再生開始時刻とを略一致させることができるようになる。
【0077】
さらにいえば、音声トラックに関するRA情報は、動画像フレームとの同期再生が図られている音声フレームのヘッダ情報に関する時刻情報および位置情報であってもよい。
すなわち、音声トラック用RA情報テーブル414Aは、テーブルに含まれるサンプルフラグ数416Aの後に、例えば、所定の規則性に従って配列された音声フレームの再生時刻を示すフィールドを並べたり、また、動画像フレームとの同期再生が図られている音声フレームに対応するヘッダの位置情報等を示すフィールドを並べたりしてもよく、これらのフィールドを交互に並べることとしてもよい。
【0078】
このように、第1変形例に係る画像データ再生装置によれば、動画像トラック用RA情報テーブルや音声トラック用RA情報テーブルのように、トラック毎のRA情報テーブルを含んだMP4ファイル400が生成されるので、装置内に取り込まれるMP4ファイルに様々なトラックが複合されている場合でも、ダウンロード後の再生時におけるランダムアクセス再生の迅速化に寄与することができる。
【0079】
続いて、本実施の形態1の第2変形例および第3変形例について説明する。
上記実施の形態1では、MP4ファイル300は、画像データ再生装置200において、装置内に取り込まれるMP4ファイルの末尾にRA情報テーブル310が追加されることによって生成されることとした。
【0080】
これに対して第2変形例では、装置内に取り込まれるMP4ファイルから、MP4ファイルと、RA情報テーブルファイルとが分かれて生成される。
そのため、第2変形例に係る画像データ再生装置の構成要素は、上記画像データ再生装置200の構成と異なる。以下、第2変形例に係る画像データ再生装置について、上記画像データ再生装置200と異なる点を中心に説明することとする。
【0081】
図6は、本実施の形態1の第2変形例に係る画像データ再生装置の構成を示すブロック図である。
この第2変形例に係る画像データ再生装置200Bは、主に、RA情報テーブルファイル出力部219と、RA情報テーブルファイル格納部220とを備える点において、上記画像データ再生装置200と異なる。
【0082】
RA情報テーブルファイル出力部219は、RA情報テーブル生成部216から出力されるRA情報テーブルを受け取って、RA情報テーブルをボックス構造に成形し、ファイル化してRA情報テーブルファイルを出力する処理部であり、CPUやメモリによって実現される。
【0083】
RA情報テーブルファイル格納部220は、RA情報テーブルファイル出力部219が出力したRA情報テーブルファイルを格納する記憶部であり、ハードディスク等の記憶装置や、光磁気ディスク、SDメモリーカード等の記録媒体等によって実現される。
【0084】
画像データ再生装置200Bをこのような構成とすることで、RA情報テーブルファイルをMP4ファイルと分離させて生成することができるので、MP4ファイル格納部218に格納されるMP4ファイルのファイルサイズを最小限にした状態のまま、別の画像データ再生装置等に再送信することができる。また、フレキシブルディスク等の容易に運搬可能な記録媒体等によって、RA情報テーブルファイルのみをその他の画像データ再生装置にコピーする等、RA情報テーブルファイルの利用範囲を広げることもできる。
【0085】
なお、RA情報テーブルファイルと出力されるMP4ファイルとのファイル間の関連付けを示すことが必要となるが、RA情報テーブルファイルのファイル名をMP4ファイルのファイル名と同一にし、拡張子のみを異ならせる等の所定の関連付け規則を定めておき、RA情報テーブルファイル出力部219において、その規則に従ってRA情報テーブルファイルを出力することとすればよい。具体的に説明すると、例えば、MP4ファイルであることを示す拡張子が”.mp4”であり、RA情報テーブルファイルであることを示す拡張子が”.rat”であるとして、出力されるMP4ファイルのファイル名が、”aaa.mp4”であれば、RA情報テーブルファイルを”aaa.rat”として出力すればよい。
【0086】
これに対して第3変形例では、装置内に取り込まれるMP4ファイルから、RA情報テーブルファイルと、MP4ファイルと、そして両ファイル間の関連付けを管理する関連付け管理ファイルとが生成される。
そのため、第3変形例に係る画像データ再生装置の構成要素は、上記画像データ再生装置200Bの構成と異なる。以下、第3変形例に係る画像データ再生装置について、上記画像データ再生装置200Bと異なる点を中心に説明することとする。
【0087】
図7は、本実施の形態1の第3変形例に係る画像データ再生装置の構成を示すブロック図である。
この第3変形例に係る画像データ再生装置200Cは、主に、ファイル情報管理部231と、管理ファイル格納部232とを備える点において、上記画像データ再生装置200Bと異なる。
【0088】
ファイル情報管理部231は、キーボード等の入力装置を介して画像データ再生装置200C内に入力されるユーザからのファイル名指示に従って、出力されるMP4ファイルのファイル名と、RA情報テーブルファイルのファイル名とを決定して、MP4ファイル名情報をMP4ファイル出力部227に出力し、RA情報テーブルファイル名情報をRA情報テーブルファイル出力部229に出力すると共に、両ファイル間の関連付け規則をファイル化し、関連付け管理ファイルとして出力する処理部であり、CPUやメモリ等によって実現される。
【0089】
管理ファイル格納部232は、ファイル情報管理部231が出力した関連付け管理ファイルを格納する記憶部であり、ハードディスク等の記憶装置や、光磁気ディスク、SDメモリーカード等の記録媒体等によって実現される。
画像データ再生装置200Cをこのような構成として、RA情報テーブルファイルをMP4ファイルと分離させて生成する際に、両ファイル間の関連付け規則について別途ファイルを生成することによって、ユーザにファイル名を設定する裁量を与えることもできる。
【0090】
このように、本実施の形態1およびその変形例に係る画像データ再生装置によって生成されるMP4ファイルとRA情報テーブルとの関係には、複数のパターンが考えられる。
【0091】
図8(a)〜(c)は、MP4ファイルとRA情報テーブルとの関係を説明するための図である。
図8(a)は、本実施の形態1に係る画像データ再生装置200により生成されるファイルを示す図である。本実施の形態1に係る画像データ再生装置200によれば、図20に示す構成のMP4ファイル100は、装置内に取り込まれると、RA情報テーブル310が末尾に追加されて、RA情報テーブル310が一体となった新たなMP4ファイル300として出力される。
【0092】
図8(b)は、第2変形例に係る画像データ再生装置200Bにより生成されるファイルを示す図である。画像データ再生装置200Bによれば、図20に示す構成のMP4ファイル100は、装置内に取り込まれると、図20に示す構成と略同じ構成のMP4ファイル320として出力されると共に、これと分離してRA情報テーブルファイル321が出力されることになる。この場合、上述したようにRA情報テーブルファイル321は、出力MP4ファイル320との間の所定の関連付け規則に従ってファイル名が決定される関係にある。
【0093】
図8(c)は、第3変形例に係る画像データ再生装置200Cにより生成されるファイルを示す図である。画像データ再生装置200Cによれば、図20に示す構成のMP4ファイル100は、装置内に取り込まれると、図20に示す構成と略同じ構成のMP4ファイル330として出力されると共に、これと分離してRA情報テーブルファイル331と関連付け管理ファイル332とが出力されることになる。この場合、上述したようにRA情報テーブルファイル331と出力MP4ファイル330との間の関連付けは、関連付け管理ファイル332によって管理されているので、関連付け管理ファイル332がRA情報テーブルファイル331と出力MP4ファイル330とを仲介する関係にある。
【0094】
以上説明したように、本実施の形態1およびその変形例によれば、画像データ再生装置において、最初のファイル再生時にランダムアクセスを迅速に処理するための情報を生成するので、ランダムアクセス再生の迅速化に寄与することができる。
【0095】
(実施の形態2)
次に、本発明の実施の形態2について図面を用いて説明する。
上記実施の形態1では、ランダムアクセスを迅速に処理するためのRA情報テーブルを生成する画像データ再生装置について説明したが、本実施の形態2では、生成されたRA情報テーブルを利用する画像データ再生装置について説明する。そのため、本実施の形態2に係る画像データ再生装置の構成要素は、上記実施の形態1に係る画像データ再生装置200と異なる。以下、この異なる点を中心に説明することとする。
【0096】
図9は、本発明の実施の形態2に係る画像データ再生装置の構成を示すブロック図である。
この画像データ再生装置500は、主に、再生位置制御部507を備えており、ファイル出力部およびファイル格納部等を備えていない点において上記実施の形態1に係る画像データ再生装置200と異なる。
【0097】
再生位置制御部507は、RA情報テーブル生成部506から出力されるRA情報テーブルを受け取って、ランダムアクセス後の再生位置を指示する解析位置指示情報を出力する処理部であり、CPUやメモリによって実現される。この再生位置制御部507は、キーボードやマウス等の入力装置を介して画像データ再生装置500内に入力されるユーザからの再生位置変更指示(ランダムアクセス指示)に従って、RA情報テーブルを参照しランダムアクセス後の再生位置を決定して解析位置指示情報をデータファイル解析部503に出力する。
【0098】
そして、上記実施の形態1と異なり、データファイル解析部503は、この解析位置指示情報に従ってMP4ファイルのヘッダ情報を解析し、その結果に基づいて復号指示情報をデータ復号化部504に出力する。
また、RA情報テーブル生成部506は、全てのRA情報を集積させてRA情報テーブルを生成して出力することとしてもよいが、ダウンロード再生中にRA情報テーブルを利用することができるようにするため、所定の数のRA情報を集積させ、所定の間隔で順次RA情報テーブルを生成し出力するのが望ましい。
【0099】
このような構成とされる画像データ再生装置500では、RA情報テーブルがファイル出力されないため、MP4ファイルのダウンロード再生中、または、データファイル一時記憶部502にダウンロード済みのMP4ファイルが保持されている間にランダムアクセス再生が可能である。これは、ダウンロード後のMP4ファイルを画像データ再生装置500の外部記憶装置に出力することが禁止されているような場合に対応するためであり、データファイル一時記憶部502からMP4ファイルが削除されると、RA情報テーブルも破棄されることになる。また、MP4ファイルのうちダウンロードが完了していない部分についてはデータそのものが存在せず、この部分へのランダムアクセスができないので、MP4ファイルのダウンロード再生中においては、ダウンロードが完了した部分へのランダムアクセスが可能である。
【0100】
このように、本実施の形態2に係る画像データ再生装置500は、最初のファイル再生段階において、ファイルの再生と同時に、ランダムアクセス時に再生開始位置とすべきフレームのヘッダ情報に関する位置情報および時刻情報等を集積したRA情報テーブルを生成し、このテーブルに記述されている情報を用いてランダムアクセス再生を行なうので、迅速なランダムアクセス再生を実現することができる。
【0101】
次に、本実施の形態2の第1変形例について説明する。
上記実施の形態2では、画像データ再生装置500において、生成されたRA情報テーブルはファイル出力されず、またダウンロード後のMP4ファイルもファイル出力されないこととした。
【0102】
これに対して第1変形例では、画像データ再生装置において、生成されたRA情報テーブルとダウンロード後のMP4ファイルとをファイル出力する。
そのため、第1変形例に係る画像データ再生装置の構成要素は、上記画像データ再生装置500の構成要素と異なる。以下、第1変形例に係る画像データ再生装置について、この異なる点を中心に説明する。
【0103】
図10は、本実施の形態2の第1変形例に係る画像データ再生装置の構成を示すブロック図である。
この画像データ再生装置500Aは、主に、ファイル出力部518とファイル格納部519とを備えている点において上記実施の形態2に係る画像データ再生装置500と異なる。
【0104】
ファイル出力部518は、装置内への入力が完了したMP4ファイルを読み出すとともに、RA情報テーブル生成部516から全てのRA情報が集積されたRA情報テーブルを受け取って、入力完了MP4ファイルの末尾に追加し、入力完了MP4ファイルとRA情報テーブルとを多重化して新たなMP4ファイルを出力する処理部であり、CPUやメモリによって実現される。
【0105】
ファイル格納部519は、ファイル出力部518が出力したMP4ファイルを格納する記憶部であり、ハードディスク等の記憶装置や、光磁気ディスク、SDメモリーカード等の記録媒体等によって実現される。
【0106】
そして、RA情報テーブル生成部516は、上記画像データ再生装置500におけるRA情報テーブル生成部506と同様に、所定の数のRA情報を集積させ、所定の間隔で順次RA情報テーブルを生成し再生位置制御部517に出力する一方で、RA情報を蓄積させて全てのRA情報を集積させたRA情報テーブルをファイル出力部518に出力する。
【0107】
なお、RA情報テーブル生成部516は、所定の数のRA情報を集積させ、所定の間隔で順次RA情報テーブルを生成し再生位置制御部517およびファイル出力部518に出力し、ファイル出力部518において、全てのRA情報を集積させたRA情報テーブルを生成し、入力完了MP4ファイルの末尾に追加することとしてもよい。
【0108】
また、生成されるRA情報テーブルの構造は、上記実施の形態1におけるRA情報テーブル310または上記実施の形態1の第1変形例に係るRA情報テーブル列410と同一である。
【0109】
このように、第1変形例に係る画像データ再生装置500Aによれば、最初のファイル再生段階において、ファイルの再生と同時に、ランダムアクセス時に再生開始位置とすべきフレームのヘッダ情報に関する位置情報および時刻情報等を集積したRA情報テーブルを生成し、このテーブルに記述されている情報を用いてランダムアクセス再生を行なうので、迅速なランダムアクセス再生を実現することができ、また、ダウンロードが完了した後にはランダムアクセスを迅速に処理するための情報をファイル出力することができるので、上記実施の形態2と異なり、MP4ファイルのダウンロード後であって、データファイル一時記憶部512からMP4ファイルが削除された後においても、ランダムアクセス再生の迅速化に寄与することもできる。
【0110】
さらに続いて、本実施の形態2の第2変形例について説明する。
上記実施の形態2および第1変形例では、画像データ再生装置500および500Aにおいて、RA情報テーブルが生成されることとした。
これに対して第2変形例では、画像データ再生装置は、RA情報テーブルを生成することなく、既に生成されたRA情報テーブルを読み込んでランダムアクセス再生に用いる。
【0111】
そのため、第2変形例に係る画像データ再生装置の構成要素は、上記画像データ再生装置500および500Aの構成要素と異なる。以下、第2変形例に係る画像データ再生装置について、この異なる点を中心に説明する。
図11は、本発明の実施の形態2の第2変形例に係る画像データ再生装置の構成を示すブロック図である。
【0112】
この画像データ再生装置500Bは、主に、RA情報テーブルファイル格納部527を備えており、RA情報テーブル生成部等を備えていない点において上記実施の形態2および第1変形例に係る画像データ再生装置500および500Aと異なる。
【0113】
RA情報テーブルファイル格納部527は、例えば、上記実施の形態1の第2変形例に係る画像データ再生装置200B等において既に生成されたRA情報テーブルファイルを格納している記憶部であり、ハードディスク等の記憶装置や、SDメモリーカードやフレキシブルディスク等の容易に運搬可能な記録媒体等によって実現される。
【0114】
そして、再生位置制御部526は、キーボードやマウス等の入力装置を介して画像データ再生装置500B内に入力されるユーザからのランダムアクセス指示に従って、RA情報テーブルファイル格納部527からRA情報テーブルを読み込み、これを参照してランダムアクセス後の再生位置を決定し解析位置指示情報をデータファイル解析部523に出力する。
【0115】
画像データ再生装置500Bをこのように構成することで、ダウンロード再生されるMP4ファイルに関するRA情報テーブルファイルが既に生成されている場合には、RA情報テーブルを生成する必要がないので、ランダムアクセス再生をさらに迅速に行なうことができる。なお、この場合においても、MP4ファイルのうちダウンロードが完了していない部分については、RA情報テーブルファイルには全てのRA情報が記述されているが、データそのものが存在しないため、ダウンロードが完了した部分へのランダムアクセスが可能である。
【0116】
以上説明したように、本実施の形態2およびその変形例によれば、画像データ再生装置において、最初のファイル再生時にランダムアクセスを迅速に処理するための情報を生成してこの情報を利用したり、既に生成されている情報を読み込んで利用したりするので、ランダムアクセス再生を迅速に行なうことができる。
【0117】
(実施の形態3)
さらに、本発明の実施の形態3について図面を用いて説明する。
上記実施の形態1では、主としてRA情報テーブルを生成する画像データ再生装置について説明し、上記実施の形態2では、主としてRA情報テーブルを利用する画像データ再生装置について説明した。すなわち、上記実施の形態1および2では、ランダムアクセスを迅速に処理するため、RA情報テーブルをボックス構造に成形して生成したり、ボックス構造に成形されたRA情報テーブルを利用したりする画像データ再生装置について説明した。
【0118】
これに対して、本実施の形態3における画像データ再生装置では、トラック毎のRA情報を格納するボックスを生成し、さらに、これらのボックスをまとめて格納するためのボックスを生成する。そのため、本実施の形態3に係る画像データ再生装置の構成要素は、上記実施の形態1および2に係る画像データ再生装置のそれと異なる。以下、この異なる点を中心に説明することとする。
【0119】
図12は、本発明の実施の形態3に係る画像データ再生装置の構成を示すブロック図である。
この画像データ再生装置600は、主に、RA情報格納ボックス生成部606を備えている点で、上記実施の形態1および2に係る画像データ再生装置と異なる。
【0120】
RA情報格納ボックス生成部606は、データファイル解析部603からRA情報を受け取って、トラック毎のRA情報を格納するトラックRA情報格納ボックスを生成するとともに、このトラックRA情報格納ボックスをまとめて格納するRA情報格納ボックスを生成する処理部であり、CPUやメモリ等によって実現される。このトラックRA情報格納ボックスおよびRA情報格納ボックスについては、後に詳しく説明することとする。
【0121】
そして、再生位置制御部607は、キーボードやマウス等の入力装置を介して画像データ再生装置600内に入力されるユーザからのランダムアクセス指示に従って、RA情報格納ボックス生成部606からRA情報格納ボックスを読み込み、これを参照してランダムアクセス後の再生位置を決定し解析位置指示情報をデータファイル解析部603に出力する。
【0122】
また、ファイル出力部608は、装置内への入力が完了したMP4ファイルを読み出すとともに、RA情報格納ボックス生成部606からRA情報格納ボックスを受け取って、入力完了MP4ファイルと一体化させて新たなMP4ファイルを出力する。
【0123】
なお、再生位置制御部607は、MP4ファイルのダウンロード再生中にRA情報格納ボックスを利用することができるようにするため、RA情報格納ボックス生成部606において生成途中のRA情報格納ボックスを読み込むことができるものとする。
【0124】
次に、この画像データ再生装置600により生成されるMP4ファイルの構造について説明する。
図13は、本発明の実施の形態3に係る画像データ再生装置600により生成されるMP4ファイルのファイル構造を示す図である。
【0125】
図13に示すように、このMP4ファイル700は、ムービーボックス701、ムービーデータボックス702、ムービーフラグメント列703およびRA情報格納ボックス704から構成され、RA情報格納ボックス704を含む点において上記MP4ファイル300等と異なる。
【0126】
なお、このMP4ファイル700も、画像データ再生装置600に取り込まれる段階では、従来におけるMP4ファイル100の構成と同様の構成とされる。
RA情報格納ボックス704は、トラックRA情報格納ボックス706をまとめて格納するボックスであり、MP4ファイル700のその他のボックスと同様に、ボックスヘッダ部705とボックスデータ格納部とから構成され、このボックスデータ格納部に複数のトラックRA情報格納ボックス706が格納されている。
【0127】
このRA情報格納ボックス704のボックスヘッダ部705は、RA情報格納ボックス704のサイズ情報を格納するボックスサイズというフィールドと、RA情報格納ボックス704ボックスの種別を表す文字列として、例えば、”mfra”という文字列を格納するボックスタイプというフィールドとを少なくとも含んでいる。また、このボックスヘッダ部705は、RA情報格納ボックス704のバージョンやフラグ情報を示すバージョンフラグ情報や、ボックス内に含まれるトラックRA情報格納ボックス706の数を示す情報を格納するフィールドを備えることとしてもよい。なお、これらのフィールドには、例えば夫々4バイトが割り当てられる。
【0128】
トラックRA情報格納ボックス706は、動画像トラックRA情報格納ボックス等、トラック毎のRA情報を格納するボックスであり、MP4ファイル700のその他のボックスと同様に、ボックスヘッダ部707とボックスデータ格納部とから構成され、このボックスデータ格納部に、トラックID708、ボックスに含まれるサンプルフラグ数709および複数のRA情報が格納されている。
【0129】
このトラックRA情報格納ボックス706のボックスヘッダ部707は、トラックRA情報格納ボックス706のサイズ情報を格納するボックスサイズというフィールドと、トラックRA情報格納ボックス706のボックスの種別を表す文字列として、例えば、”tfra”という文字列を格納するボックスタイプというフィールドとを少なくとも含んでいる。
【0130】
また、トラックRA情報格納ボックス706のボックスデータ格納部は、どのトラックに関するRA情報が格納されているかを示すトラックID708のフィールド、トラックRA情報格納ボックス706に含まれるRA情報の数を示すボックスに含まれるサンプルフラグ数709のフィールド、およびRA情報を構成するフィールドを含んでいる。
【0131】
なお、トラックID708およびボックスに含まれるサンプルフラグ数709のフィールドは、ボックスヘッダ部707に格納されることとしてもよく、また、トラックRA情報格納ボックス706に関するバージョンフラグ情報をボックスヘッダ部707に格納してもよい。
【0132】
そして、RA情報を構成するフィールドは、上記実施の形態1および2と同様の構成とされ、割り当てられるバイトは固定長とされる。一方、RA情報を構成するフィールド以外のトラックRA情報格納ボックス706内の各フィールドには、例えば、夫々4バイトが割り当てられることとする。
【0133】
ここで、画像データ再生装置600によるランダムアクセス再生の処理方法について、図14および図15を用いて説明する。
図14(a)は、本実施の形態3に係る画像データ再生装置600によるランダムアクセス再生の第1の処理方法を説明するための図であり、図15は、図14(a)に基づく画像データ再生装置の処理手順を示すフロー図である。
【0134】
まず、図15に示すように、画像データ再生装置600の再生位置制御部607は、ユーザからランダムアクセス指示の入力を受け取ると(S50)、RA情報格納ボックス生成部606からRA情報格納ボックスの読み込みを試みる(S51)。
【0135】
このとき、RA情報格納ボックス生成部606にRA情報格納ボックスがない場合、すなわち、図14(a)に示すケース1の場合、再生位置制御部607は、MP4ファイルに含まれる全てのトラックに関するRA情報が含まれていないと判断する。そのため、再生位置制御部607は、データファイル解析部603に高速再生による再生位置の移動指示を出力する(S57)。ここで、高速再生による再生位置の移動とは、通常の再生速度よりも早い速度で、従来における再生位置移動と同様に、MP4ファイルのヘッダ情報を解析し、フレーム一つ一つを復号化しながら再生継続時間をカウントし、ランダムアクセス後の再生開始位置となるフレームに移動することをいう。
【0136】
その後、データファイル解析部603は、移動後の再生位置に関する復号指示情報をデータ復号化部604に出力し、データ復号化部604が復号化した実体データをデータ再生部605が再生することになる(S58)。但し、この場合、移動後の再生位置が必ずしもイントラフレームであるとは限らないため、移動後のデータ再生が正しく復号化できるものであるという保証を得ることはできない。なお、正しく復号化できないことを避けるために、ランダムアクセスの動作を諦めて、通常の再生速度を維持することとしてもよい。
【0137】
一方、RA情報格納ボックス生成部606にRA情報格納ボックスがある場合、再生位置制御部607は、RA情報格納ボックスに含まれるトラックRA情報格納ボックスの読み込みを試みる(S52)。
このとき、トラックRA情報格納ボックスがない場合、すなわち、図14(a)に示すケース2の場合、再生位置制御部607は、トラックに関するRA情報が含まれていないと判断する。そのため、再生位置制御部607は、データファイル解析部603に高速再生による再生位置の移動指示を出力する(S57)。
【0138】
その後、データファイル解析部603は、移動後の再生位置に関する復号指示情報をデータ復号化部604に出力し、データ復号化部604が復号化した実体データをデータ再生部605が再生することになる(S58)。
これに対して、トラックRA情報格納ボックスがある場合、再生位置制御部607は、トラックRA情報格納ボックスに含まれるエントリ情報の読み込みを試みる(S53)。
【0139】
ここで、エントリ情報がない場合、すなわち、図14(a)に示すケース3の場合、再生位置制御部607は、そのトラックに関して、全てのサンプルがランダムアクセス可能であると判断する。そのため、再生位置制御部607は、ランダムアクセス指示における指定時間の最寄りのサンプルを再生開始位置とするために再生位置の移動指示をデータファイル解析部603に出力する(S55)。そして、データファイル解析部603は、MP4ファイルのヘッダ情報に含まれるフレームの再生継続時間をカウントして、ランダムアクセス指示の指定時間の最寄りのサンプルを移動後の再生位置とし(S56)、復号指示情報をデータ復号化部604に出力する。
【0140】
その後、データ復号化部604は、実体データを復号化し、データ再生部605は、復号された実体データを再生する(S58)。この場合、移動後の再生位置は、全てのサンプルがランダムアクセス可能であるため、移動後のデータ再生が正しく復号化できるものであるという保証を得ることができる。
【0141】
一方、エントリ情報がある場合、すなわち、図14(a)に示すケース4の場合、再生位置制御部607は、エントリ情報に示されたサンプルがランダムアクセス可能であると判断する。そのため、再生位置制御部607は、トラックRA情報格納ボックス内でランダムアクセス指示の指定時間に合致するエントリ情報を検索して、ランダムアクセス後の再生開始位置を決定し、データファイル解析部603に解析位置指示情報を出力する(S54)。
【0142】
その後、データファイル解析部603は、解析位置指示情報に基づいて、復号指示情報をデータ復号化部604に出力し、データ復号化部604が復号化した実体データをデータ再生部605が再生する(S58)。
【0143】
なお、図14(a)に示すケース3に該当する具体例として、音声トラックのようにいずれのサンプルからもランダムアクセスが可能である場合に、トラックRA情報格納ボックスにエントリ情報を格納しないことでRA情報格納ボックスのサイズを小さくさせる場合が考えられる。また、図14(a)に示すケース1および2に該当する具体例としては、RA情報格納ボックスの生成途中で読み込みを禁止する制限が設定されている場合等が考えられる。この場合、再生位置制御部607は、データファイル解析部603に高速再生による再生位置の移動指示を出力することとしているが(S57)、移動指示を出力しないでランダムアクセスを行なわないこととしてもよい。そして、RA情報格納ボックスの生成が完了した後に、ランダムアクセス指示を受け付けることとしてもよい。
【0144】
図14(b)は、本実施の形態3に係る画像データ再生装置600によるランダムアクセス再生の第2の処理方法を説明するための図である。
この第2の処理方法は、図14(a)に示す第1の処理方法と、ケース2およびケース3の場合の再生位置制御部607による取り扱いが異なる。
【0145】
図14(b)に示すケース2の場合、再生位置制御部607は、全てのサンプルがランダムアクセス可能であると判断する。そのため、再生位置制御部607は、ランダムアクセス指示における指定時間の最寄りのサンプルを再生開始位置とするために再生位置の移動指示をデータファイル解析部603に出力する。
【0146】
また、図14(b)に示すケース3の場合、再生位置制御部607は、そのトラックに関して、全てのサンプルがランダムアクセスできない、または、ファイルの先頭に位置するサンプルからのみ再生が可能であると判断する。そのため、再生位置制御部607は、例えば、ユーザからのランダムアクセス指示の入力を一切受け付けない、または、ユーザからのランダムアクセス指示の入力は、ファイルの先頭に移動する場合にのみ受け付け、ファイルの先頭に移動するための再生位置の移動指示をデータファイル解析部603に出力することのみを行なう。
【0147】
このように、画像データ再生装置600は、ランダムアクセス再生の処理方法において、RA情報格納ボックス等の有無に応じて処理手順を変更することができるので、トラックRA情報格納ボックスやエントリ情報の構成を自由に設定することができる。また、RA情報格納ボックスからRA情報を抽出することができない等の支障があっても、柔軟に対応することができる。
【0148】
以上説明したように、本実施の形態3によれば、画像データ再生装置において、トラック毎のRA情報を格納するボックスと、このボックスをまとめて格納するボックスとを生成して出力することができるので、ランダムアクセス再生の迅速化に寄与することができる。また、ボックスに格納されているRA情報を用いてランダムアクセスを行なうので、迅速なランダムアクセス再生を実現することできる。
【0149】
(実施の形態4)
さらに続いて、本発明の実施の形態4について説明する。
上記実施の形態3では、RA情報格納ボックスをMP4ファイルの末尾に追加して新たなMP4ファイルを出力する画像データ再生装置について説明した。
【0150】
これに対して、本実施の形態4における画像データ再生装置では、さらに、このRA情報格納ボックスへのアクセスを容易にすることができるための情報を含むMP4ファイルを出力する。そのため、本実施の形態4に係る画像データ再生装置が出力するMP4ファイルは、上記実施の形態3に係る画像データ再生装置が出力するMP4ファイルと構造を異にする。以下、この異なる点を中心に説明する。なお、本実施の形態4に係る画像データ再生装置の構成要素は、上記実施の形態3に係る画像データ再生装置と略同一であるため、装置のブロック図は、図12を参照することとする。
【0151】
図16は、本実施の形態4に係る画像データ再生装置により生成されるMP4ファイルのファイル構造を示す図である。
このMP4ファイル710は、ムービーボックス711、ムービーデータボックス712、ムービーフラグメント列713およびRA情報格納ボックス714から構成される。この点において、上記実施の形態3におけるMP4ファイル700と共通するが、RA情報格納ボックス714にRA情報格納オフセットボックス717を含む点において、上記MP4ファイル700と異なる。
【0152】
なお、このMP4ファイル710も、画像データ再生装置に取り込まれる段階では、従来におけるMP4ファイル100の構成と同様の構成とされる。
このRA情報格納オフセットボックス717は、RA情報格納ボックス714がMP4ファイル710の先頭または末尾から何バイト目に開始するかを示すRA情報格納ボックスのオフセット情報を格納するボックスであり、MP4ファイル710を構成するその他のボックスと同様に、ボックスヘッダ部とボックスデータ格納部とから構成される。
【0153】
このRA情報格納オフセットボックス717のボックスヘッダ部は、このボックスのサイズ情報を示すボックスサイズ718というフィールドと、このボックスの種別を表す文字列として、例えば、”mfro”という文字列を格納するボックスタイプ719というフィールドとを少なくとも含んでおり、それぞれのフィールドには、例えば、4バイトが割り当てられる。
【0154】
また、RA情報格納オフセットボックス717のボックスデータ格納部は、RA情報格納ボックスのオフセット情報を記述するためのRA情報格納ボックスオフセット情報717aのフィールドを含んでおり、このフィールドにも例えば、4バイトが割り当てられる。このオフセット情報717aをRA情報格納ボックス714のサイズ情報とすることで、画像データ再生装置は、MP4ファイル710の最後尾から、オフセット情報717aまで遡って読み込むことによって、RA情報格納ボックス714に容易にアクセスすることができるようになる。
【0155】
このRA情報格納オフセットボックス717は、例えば、RA情報格納ボックス生成部606においてRA情報格納ボックス714が生成される際に、ボックスの輪郭がまず生成され、ファイル出力部608においてRA情報格納ボックス714が入力完了MP4ファイルの末尾に追加される際に、ボックス内部のフィールドに情報が記述されることによって生成される。
【0156】
なお、RA情報格納オフセットボックス717には、ボックスタイプ719のフィールドに続いて、このボックスのバージョン情報等を示すフィールドが含まれる場合もあるが、本実施の形態4では、ボックスサイズ718、ボックスタイプ719およびオフセット情報717aの3つのフィールドからなり、合計12バイトの固定サイズであることとする。
【0157】
ここで、本実施の形態4に係る画像データ再生装置がRA情報を取得する手順について説明する。
図17は、本実施の形態4に係る画像データ再生装置によるRA情報の取得手順を示すフロー図である。
【0158】
RA情報の取得に限らず、通常、画像データ再生装置は、MP4ファイルを読み込むにあたって、ファイルの先頭に位置するボックスに格納されている情報を順次取得していく。その一方で、画像データ再生装置は、MP4ファイルの末尾を検索し、末尾から順番に遡ってボックスに格納されている情報を取得することもできる。
【0159】
RA情報格納ボックス714は、MP4ファイル710の末尾に位置するものであるため、画像データ再生装置は、MP4ファイルの末尾からRA情報格納ボックス714のオフセット情報が格納されているボックスを検索する(S60)。
【0160】
ここで、オフセット情報が格納されているボックス、すなわち、RA情報格納オフセットボックス717が見つかって、そのボックスに含まれるRA情報格納ボックスオフセット情報717aが見つかった場合(S61)、画像データ再生装置は、オフセット情報に基づいてRAデータの開始位置、すなわち、RA情報格納ボックス714の先頭に読み込み位置を移動させる(S62)。
【0161】
ここで、画像データ再生装置は、そのオフセット情報とRAデータとが一致するか否か、すなわち、オフセット情報の正当性をテストする(S62)。このとき、画像データ再生装置は、オフセット情報によって移動したファイル読み込み位置が、RA情報格納ボックス714の先頭位置と一致するか否かをもって判断する。なお、このテストについては、後に図を用いて詳しく説明する。
【0162】
そして、オフセット情報とRAデータとが一致する場合には、画像データ再生装置は、RA情報格納ボックス714の先頭からボックス内に格納されているRAデータを順次取得していく(S64)。
一方、RA情報格納オフセットボックス717が見つからない、または、RA情報格納オフセットボックス717が見つかっても、そのボックスに含まれるRA情報格納ボックスオフセット情報が見つからない場合(S61)や、オフセット情報とRAデータとが一致しない場合(S63)には、画像データ再生装置は、通常の情報取得方法、すなわち、ファイルの先頭に位置するボックスに格納されている情報を順次取得して、RA情報格納ボックス714からRAデータを取得することになる(S65)。
【0163】
ここで、上記オフセット情報の正当性に関するテストについて図を用いて説明する。
図18(a)は、本実施の形態4に係る画像データ再生装置によるRA情報の第1の取得手順を説明するための図である。
【0164】
まず、画像データ再生装置は、MP4ファイル710の末尾を探して、末尾から順番に遡ってボックスに格納されている情報を取得する(S70)。
図18(a)では、RA情報格納ボックスオフセット情報717aのフィールドに、”240”バイトというオフセット情報が記述されているが、この段階では、”240”バイトという数字がRA情報格納ボックスのオフセット情報であることが確証できないため、画像データ再生装置は、さらに遡ってボックスに格納されている情報を取得し(S71)、この数字がRA情報格納ボックスのオフセット情報であるか否かをテストする。
【0165】
ここで、本実施の形態4では、RA情報格納オフセットボックス717は合計12バイトの固定サイズであるとしたので、画像データ再生装置は、MP4ファイル710の最後尾から12バイト分遡った位置のボックスサイズ718のフィールドに”12”というサイズ情報が記述されていることを確認し、次に、ボックスタイプ719のフィールドに文字列”mfro”が記述されていることを確認すれば、この後に続く4バイトのフィールドは、RA情報格納ボックスオフセット情報717aであると判断する。
【0166】
すなわち、この段階で、画像データ再生装置は、先に取得した”240”バイトという情報がRA情報格納ボックスのオフセット情報であると決定することができる。
【0167】
次に、画像データ再生装置は、この”240”バイトというRA情報格納ボックスのオフセット情報に従って、MP4ファイル710の末尾から240バイト分遡った部分に読み込み位置を移動させる(S72)。
【0168】
そして、画像データ再生装置は、読み込み位置を移動させた後、MP4ファイル710の末尾に向けてボックスに格納されている情報を取得し(S73)、上記オフセット情報の正当性をテストする。
ここで、画像データ再生装置は、RA情報格納ボックス714のボックスヘッダ部715のフィールドに記述されている文字列”mfra”を取得すると、読み込み中のボックスがRA情報格納ボックス714であることを判断する。
【0169】
続いて、RA情報格納ボックス714に格納されているトラックRA情報格納ボックス716のボックスヘッダ部のフィールドに記述されているボックスのサイズ情報を夫々のトラックRA情報格納ボックス716毎に取得する。図18(a)では、夫々”110”バイトのサイズを有する2つのトラックRA情報格納ボックス716を示している。
【0170】
そして、画像データ再生装置は、全てのトラックRA情報格納ボックス716のサイズ(”110”バイト+”110”バイト)と、先に取得したRA情報格納オフセットボックス717のサイズ(”12”バイト)と、RA情報格納ボックス714のボックスヘッダ部715のフィールドに割り当てられているバイトサイズ(4バイト+4バイト)との合計が、RA情報格納ボックス714のボックスヘッダ部715のフィールドに記述されているボックスのサイズ情報(”240”バイト)と一致するか否かを判断する。
【0171】
このようなテストを経て、上記オフセット情報の正当性が判断され、これらのテストを通過すると、画像データ再生装置は、上記オフセット情報は正当であるとして、RA情報格納ボックス714に格納されているRA情報を取得する(S74)。
【0172】
ところで、RA情報格納ボックスのオフセット情報を記述する箇所として、上記のようなRA情報格納オフセットボックス717に記述する他に、例えば、MP4ファイルのファイル全体のヘッダ情報を格納しているムービーボックスに記述することもできる。
【0173】
この場合、画像データ再生装置によるランダムアクセス情報の取得手順は、以下のようになる。
図18(b)は、本実施の形態4に係る画像データ再生装置によるRA情報の第2の取得手順を説明するための図である。
【0174】
まず、画像データ再生装置は、MP4ファイル720の先頭に位置するムービーボックス721に格納されている情報を順次取得する(S80)。ここで、画像データ再生装置は、ムービーボックス721に格納されているRA情報格納ボックスオフセット情報721aのフィールドに記述されている”xxx”バイトという情報を取得すると(S81)、MP4ファイルの先頭から”xxx”バイト目に読み込み位置を移動させる(S82)。
【0175】
そして、画像データ再生装置は、読み込み位置を移動させた後、MP4ファイル720の末尾に向けてボックスに格納されている情報を取得し(S83)、上記オフセット情報の正当性をテストする。
ここで、画像データ再生装置は、RA情報格納ボックス724のボックスヘッダ部725のフィールドに記述されている文字列”mfra”を取得すると、読み込み中のボックスがRA情報格納ボックス724であると決定し、上記オフセット情報の正当性を判断する。
【0176】
そして、このテストを通過すると、画像データ再生装置は、上記オフセット情報は正当であるとして、RA情報格納ボックス724に格納されているトラックRA情報格納ボックス等のRA情報726を取得する(S84)。
このように、RA情報格納ボックスのオフセット情報の記述箇所として、ムービーボックス721を用いることもできる。
【0177】
以上説明したように、本実施の形態4によれば、画像データ再生装置において、RA情報格納ボックスの開始位置を示すオフセット情報を生成して出力するので、このオフセット情報を用いてRA情報格納ボックスの読み込みを迅速にすることができ、ひいては、迅速なランダムアクセス再生を実現することができる。
【0178】
(適用例)
ここで、本発明に係る画像データ再生装置の適用例について図を用いて説明する。
図19は、本発明に係る画像データ再生装置の適用例を示す図である。
本発明に係る画像データ再生装置は、MP4ファイルをインターネット等の通信回線を介して受信したり、送信したりする画像配信システム等に使用されうる。
【0179】
図19に示すように、この画像配信システムは、サーバ装置801、ネットワーク通信網802、携帯電話機803およびパーソナルコンピュータ804から構成される。
【0180】
ここで、携帯電話機803およびパーソナルコンピュータ804が、本発明に係る画像データ再生装置に対応する。
すなわち、携帯電話機803やパーソナルコンピュータ804は、画像データや音声データ等を多重化したMP4ファイルを配信するサーバ装置801から、ネットワーク通信網802を介して、MP4ファイルをダウンロードする。
【0181】
図19に示すように、パーソナルコンピュータ804で再生されるMP4ファイルには、画像データ、音声データおよびテキストデータが多重化されて含まれており、パーソナルコンピュータ804は、このMP4ファイルをダウンロードしながら再生し、ディスプレイの画面上に再生中の動画像を表示する。
【0182】
このとき、パーソナルコンピュータ804は、MP4ファイルの先頭から順次ダウンロードして、パーソナルコンピュータ804に内蔵されているメモリやハードディスクに一旦保持し、CPU等を用いて、メモリ等に保持しているヘッダ情報からRA情報を生成し、RA情報を集積させてRA情報テーブルまたはRA情報格納ボックスを生成する。
【0183】
このとき、パーソナルコンピュータ804は、MP4ファイルを再生している間、MP4ファイルのファイル全体のヘッダ情報と順次生成されるRA情報とをメモリ等に保持しておく。
【0184】
ここで、例えば、ユーザが、マウス等によって画面の下方に位置するバー805を左方向にスライドさせる操作、すなわち再生位置を前に戻す操作を実行すると、パーソナルコンピュータ804は、メモリ等に保持しているMP4ファイルのファイル全体のヘッダ情報と生成されたRA情報とを参照することによって、迅速なランダムアクセスを行ない、スライド後のバーの位置から動画像を再生して、ディスプレイの画面上に表示することができる。
【0185】
このように、本発明に係る画像データ再生装置は、動画像データや音声データ等が多重化されたファイルを読み込んで再生する装置として、特に、画像配信システムにおける受信再生装置となるパーソナルコンピュータや携帯電話機として利用することができ、この画像データ再生装置によれば、ランダムアクセス再生を迅速に行なうための情報を生成し、この情報を用いてランダムアクセス再生を行なうので、ユーザは、再生される動画像を、ストレスを感じることなく楽しむことができる。
【0186】
なお、ここで補足すると、パーソナルコンピュータ804が、既にRA情報格納ボックスが含まれるMP4ファイルをCD−ROM等の記録媒体から読み出して再生するような場合には、パーソナルコンピュータ804は、まず、MP4ファイルのファイル全体のヘッダ情報を格納するムービーボックスとRA情報格納ボックスとを読み込み、MP4ファイルの再生の間、これらのボックスをそのままメモリに保持しておく、または、これらのボックスを解析した結果得られた情報をメモリ等に保持しておく。そして、パーソナルコンピュータ804は、ユーザからランダムアクセスの指示を受け付けると、メモリ等に保持しているこれらのボックスを参照して解析し、または、メモリ等に保持しているこれらのボックスを解析した結果得られた情報を参照することによって、上記と同様に、迅速なランダムアクセスを実行する。
【0187】
以上、本発明に係る画像データ再生装置について、各実施の形態等に基づいて説明したが、本発明は、これらの実施の形態等に限定されるものではない。
例えば、上記各実施の形態では、画像データ再生装置内に入力される動画像ファイルとして、MP4ファイルを用いて説明しているが、MP4ファイル以外であってもよく、例えば、MPEG−2トランスポートストリームのファイル等であってもよい。
【0188】
また、上記各実施の形態では、MP4ファイルの画像データ再生装置内への取り込みは、ダウンロードによることとしているが、MP4ファイルを格納している光磁気ディスク等の記録媒体を読み込んで、装置内に取り込むこととしてもよい。
【0189】
そして、上記各実施の形態では、RA情報格納テーブルまたはRA情報格納ボックスについて、MP4ファイルと一体化して出力する場合に、MP4ファイルの末尾に追加することとしているが、追加する箇所はこれに限られるものではなく、例えば、RA情報テーブルをムービーボックス内に格納することとしてもよい。
【0190】
さらに、上記各実施の形態において、RA情報を構成するフィールドに割り当てられるバイト数は固定長であるとしているが、MP4ファイルのサイズに柔軟に対応させるため、各フィールドは、可変長であるとしてもよい。例えば、”traf”番号、”trun”番号および”エントリ”番号について、フィールドのビット長を1〜4バイトの中から選択可能とするために、これらのフィールドのバイト長を指定するためのフィールドを、図4等に示すデータ構造に追加して、MP4ファイルのサイズが大きい場合には、各フィールドに2バイトずつを割り当てる等とすることもできる。
【0191】
【発明の効果】
以上の説明から明らかなように、本発明に係る画像データ再生装置によれば、最初のファイル再生時に、単独で復号化可能なフレームに関するヘッダ情報の位置を示す情報、すなわちランダムアクセス情報を生成するので、迅速なランダムアクセス再生を実現することが可能になるという効果が奏される。
【0192】
また、最初のファイル再生時に生成したランダムアクセス情報をファイル出力するので、次のファイル再生時におけるランダムアクセス再生の迅速化に寄与することができる。
さらに、ランダムアクセス情報が格納されている部分の読み込みを迅速に行なうことができるので、ランダムアクセス再生をより迅速に実行することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1に係る画像データ再生装置の構成を示すブロック図である。
【図2】本発明の実施の形態1に係る画像データ再生装置により生成されるMP4ファイルのファイル構造を示す図である。
【図3】本発明の実施の形態1に係る画像データ再生装置がランダムアクセス情報テーブルを生成する処理手順を示すフロー図である。
【図4】ランダムアクセス情報テーブルを示す図であり、(a)は、テーブルに含まれるデータの中身を示す図であり、(b)は、テーブルのデータ構造を示す図である。
【図5】本発明の実施の形態1の第1変形例に係る画像データ再生装置により生成されるMP4ファイルのファイル構造を示す図である。
【図6】本発明の実施の形態1の第2変形例に係る画像データ再生装置の構成を示すブロック図である。
【図7】本発明の実施の形態1の第3変形例に係る画像データ再生装置の構成を示すブロック図である。
【図8】MP4ファイルとランダムアクセス情報テーブルとの関係を説明するための図であり、(a)は、本発明の実施の形態1に係る画像データ再生装置により生成されるファイルを示す図であり、(b)は、本発明の実施の形態1の第2変形例に係る画像データ再生装置により生成されるファイルを示す図であり、(c)は、本発明の実施の形態1の第3変形例に係る画像データ再生装置により生成されるファイルを示す図である。
【図9】本発明の実施の形態2に係る画像データ再生装置の構成を示すブロック図である。
【図10】本発明の実施の形態2の第1変形例に係る画像データ再生装置の構成を示すブロック図である。
【図11】本発明の実施の形態2の第2変形例に係る画像データ再生装置の構成を示すブロック図である。
【図12】本発明の実施の形態3に係る画像データ再生装置の構成を示すブロック図である。
【図13】本発明の実施の形態3に係る画像データ再生装置により生成されるMP4ファイルのファイル構造を示す図である。
【図14】本発明の実施の形態3に係る画像データ再生装置によるランダムアクセスの処理を説明するための図であり、(a)は、第1の処理方法を説明するための図であり、(b)は、第2の処理方法を説明するための図である。
【図15】図14(a)に基づく画像データ再生装置の処理手順を示すフロー図である。
【図16】本発明の実施の形態4に係る画像データ再生装置により生成されるMP4ファイルのファイル構造を示す図である。
【図17】本発明の実施の形態4に係る画像データ再生装置によるランダムアクセス情報の取得手順を示すフロー図である。
【図18】本発明の実施の形態4に係る画像データ再生装置によるランダムアクセス情報の取得手順を説明するため図であり、(a)は、第1の取得手順を説明するための図であり、(b)は、第2の取得手順を説明するための図である。
【図19】本発明に係る画像データ再生装置の適用例を示す図である。
【図20】従来におけるMP4ファイルのファイル構造を示す図である。
【符号の説明】
100、300、320、330、400、700、710、720 MP4ファイル
101、301、401、701、711、721 ムービーボックス
102、302、402、702、712、722 ムービーデータボックス
103、303、403、703、713、723 ムービーフラグメント列
104、304 ムービーフラグメント
105、305 ムービーフラグメントボックス
106、306 フラグメントデータボックス
107、307 トラックフラグメントボックス
108、308 トラックランボックス
109、309 エントリ
110、317、411、705、707、715、725 ボックスヘッダ部
111、318、412 ボックスデータ格納部
112、317a、411a、718 ボックスサイズ
113、317b、411b、719 ボックスタイプ
200、200B、200C、500、500A、500B、600 画像データ再生装置
201、211、221、501、511、521、601 ファイル入力部
202、212、222、502、512、522、602 データファイル一時記憶部
203、213、223、503、513、523、603 データファイル解析部
204、214、224、504、514、524、604 データ復号化部
205、215、225、505、515、525、605 データ再生部
206、216、226、506、516 RA情報テーブル生成部
207、518、608 ファイル出力部
208、519、609 ファイル格納部
217、227 MP4ファイル出力部
218、228 MP4ファイル格納部
219、229 RA情報テーブルファイル出力部
220、230、527 RA情報テーブルファイル格納部
231 ファイル情報管理部
232 管理ファイル格納部
310 RA情報テーブル
311 時間
312 moofの開始位置
313 traf番号
314 trun番号
315 エントリ番号
316 データの開始位置
319 RA情報テーブルに含まれるサンプルフラグ数
321、331 RA情報テーブルファイル
332 関連付け管理ファイル
410 RA情報テーブル列
413 RA情報テーブル数
414A 音声トラック用RA情報テーブル
414M 動画像トラック用RA情報テーブル
414T テキストトラック用RA情報テーブル
415A、415M、708 トラックID
416A、416M テーブルに含まれるサンプルフラグ数
417A、417M RAエントリ
507、517、526、607 再生位置制御部
606 RA情報格納ボックス生成部
704、714、724 RA情報格納ボックス
706、716 トラックRA情報格納ボックス
709 ボックスに含まれるサンプルフラグ数
717 RA情報格納オフセットボックス
717a、721a RA情報格納ボックスオフセット情報
726 RA情報
801 サーバ装置
802 ネットワーク通信網
803 携帯電話機
804 パーソナルコンピュータ
805 バー
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an apparatus for reproducing a file in which image data, audio data, and the like are multiplexed, and more particularly to a technique for facilitating random access such as changing a reproduction position and fast-forward reproduction.
[0002]
[Prior art]
With the development of network technology in recent years, an image data reproducing apparatus that downloads a file from a server device on a wide area network such as the Internet and reproduces moving image data has been developed. In particular, in recent years where the word multimedia is frequently used, media data such as audio data and text data are often compounded in a file, and the image data reproducing apparatus has various types of data such as an audio track and a text track. It is required to be able to reproduce various tracks at the same time.
[0003]
The image data reproducing apparatus downloads a file including moving image data and the like encoded by a compression encoding method such as MPEG-4 (Moving Picture Experts Group Phase 4) into the apparatus by downloading and decodes the moving image data and the like. To play. At this time, if the moving image data and the audio data are combined, the image data reproducing apparatus separates the moving image data and the audio data, decodes and reproduces the data in synchronization with each other.
[0004]
On the other hand, the MP4 file format has attracted attention as a file format for a server device to download and distribute a file. In this specification, the description will be made using the MP4 file format as an example of this file format.
[0005]
This MP4 file format was established in 1999 by the international standardization organization MPEG (Moving Picture Experts Group). An MP4 file generated based on the MP4 file format has a box structure including a plurality of hierarchically arranged boxes. Encoded moving image data, audio data, and the like are stored in boxes for storing entity data. It is multiplexed and stored. Then, in the MP4 file read by the image data reproducing device, moving image data, audio data, and the like multiplexed in the device are separated and decoded. Here, a unit of processing when the image data reproducing apparatus decodes moving image data, audio data, and the like is called a frame, and each data is composed of a plurality of frames.
[0006]
However, the MP4 file format originally established had a problem that it was not suitable for a reproduction method for starting reproduction of moving image data before the image data reproduction device completed downloading the MP4 file, that is, so-called pseudo streaming reproduction. The reason is that, for moving image data and audio data included in the MP4 file, information necessary for performing demultiplexing such as the size and the multiplexing order of each moving image frame and each audio frame, and each moving image frame and audio data. The file structure is characterized in that information necessary for synchronous reproduction such as display time information of each audio frame is collectively stored in a file header portion located at the head of the file.
[0007]
That is, since the MP4 file format at the beginning of the establishment has the above-described file structure, the image data reproducing apparatus starts reproducing the moving image data and the like included in the MP4 file until the download of the file header section is completed. However, the larger the size of the file header portion, the longer the time required for downloading. Particularly, for a file including long-time data, the file header becomes large accordingly, and it takes a long time to download, and there is also a problem that it takes much time until the image data reproducing apparatus can start reproducing.
[0008]
In order to solve such a problem, an MP4 file format in which multiplex separation information and synchronous reproduction information and entity data such as moving image data and audio data are alternately arranged has been proposed, and the standardization has been promoted. For example, Non-Patent Document 1 is disclosed.
[0009]
FIG. 20 is a diagram showing the structure of a conventional MP4 file format that has been standardized.
The MP4 file 100 includes a movie box 101 for storing attribute information (header information) of the entire file such as an encoding method of moving image data, a movie data box 102 for storing entity data such as moving image data, and a movie fragment. In the point that it has a box structure composed of a plurality of hierarchized boxes, it is common to the MP4 file at the beginning of the establishment, but in that it includes the movie fragment column 103, And different.
[0010]
The movie fragment sequence 103 is formed by repeatedly arranging movie fragments 104 divided by a predetermined time unit, and is called an extended area of the MP4 file. On the other hand, the movie box 101 and the movie data box 102 are called basic areas of the MP4 file. The predetermined time unit is not always constant, and may be adjusted in the encoding device in consideration of, for example, the capacity of the buffer memory of the decoding device. In such a case, As a result, the predetermined time unit may be substantially constant.
[0011]
The movie fragment 104 includes a movie fragment box 105 for storing demultiplexing information and synchronous reproduction information for moving image data and the like included in the predetermined time unit, and an entity for moving image data and the like included in the predetermined time unit. And a fragment data box 106 for storing data.
[0012]
The movie fragment box 105 is a box for storing header information of the movie fragment 104, such as multiplexing / demultiplexing information and synchronous reproduction information relating to moving image data and the like included in the predetermined time unit. The movie fragment box 105 includes a track fragment box 107 for storing multiplex separation information and synchronous reproduction information for data on any one type of track such as a moving image track or an audio track. That is, as many track fragment boxes 107 as the number of types of tracks included in one movie fragment 104 are included. When one movie fragment 104 includes moving image data and audio data, at least Two track fragment boxes 107 are prepared. Here, the same number or more means that a plurality of track fragment boxes 107 may be prepared for one track. For example, multiplex separation information on data related to a moving image track is used. And synchronous reproduction information are stored in two track fragment boxes 107, and multiplex separation information and synchronous reproduction information on data relating to audio tracks are stored in one track fragment box 107, so that a total of three track fragment boxes 107 are stored. May be provided.
[0013]
The track fragment box 107 includes a plurality of track run boxes 108 divided in units smaller than the predetermined time unit. The track run box 108 further includes a plurality of entries 109.
The entry 109 is a group of fields for describing information on a frame that is a processing unit of decoding, that is, demultiplexing information, synchronous reproduction information, and the like. In the track run box 108 included in the track fragment box 107 related to the moving image track, information indicating whether the moving image frame is an intra-frame coded frame (so-called intra frame) is described in a field of the entry 109. In some cases. In general, moving image data often has a structure in which the intra frames are repeatedly arranged for a fixed number of moving image frames, and one unit repeatedly arranged in such a structure is called a GOP (Group Of Picture). Then, it is assumed that the entry 109 is stored in the track run box 108 for each GOP.
[0014]
In some cases, a synchronization sample flag is set in this entry 109 in order to achieve synchronous reproduction between data. In this case, the synchronization sample flag information is described in the field of the entry 109, and this description is This has the same meaning as describing information indicating that the image frame is an intra frame.
[0015]
The fragment data box 106 is a box that stores the entity data of the frame pointed to by the corresponding movie fragment box 105, and stores samples forming the frame.
Each box constituting the MP4 file 100 includes a box header section 110 and a box data storage section 111. The box header section 110 has a box size 112 for storing box size information and a box type. And a box type 113 that stores a character string for identifying In the box data storage unit 111, a box of a layer below the box is stored, and fields for describing information are arranged.
[0016]
As described above, the movie fragment box 105 stores the demultiplexing information and the synchronized reproduction information relating to the moving image data and the audio data separated by the predetermined time unit, and the fragment data box 106 stores the corresponding entity data. The structure is such that the movie fragments 104 are repeatedly arranged. That is, in the MP4 file at the beginning of the above-mentioned establishment, all demultiplexing information and synchronous reproduction information are stored in a movie box without delimiting in a predetermined time unit, and all entity data are stored in a movie data box. Therefore, as described above, the size of the movie box 101 storing the header information becomes large, and it takes time to acquire the first part of the movie data box 102 storing the moving image data and the audio data. there were. In order to solve this, the MP4 file 100 is provided with a movie fragment sequence 103 which is an extended area, and stores most of moving image data and audio data therein, thereby reducing the size of the movie box 101. Thus, the time until the start of reproduction can be shortened (see Non-Patent Document 1).
[0017]
[Non-patent document 1]
ISO / IEC JTC1 / SC29 / WG11 MPEG, ISO / IEC 14496-1 "ISO Media File format specification", July 20, 2001
[0018]
[Problems to be solved by the invention]
However, the MP4 file format having the above file structure has a problem that random access by the image data reproducing apparatus is difficult. Here, the random access means, for example, a processing operation of moving the reproduction position after 10 seconds or performing fast-forward reproduction. This problem will be described in more detail.
[0019]
When performing random access, the image data reproducing apparatus receives a random access instruction from a user via a user interface, and promptly sets a reproduction start position (decoding start position) of moving image data or the like included in the MP4 file according to the instruction. It is necessary to make a decision and decode and reproduce the moving image data and the like.
[0020]
In general, moving image data and the like generated by a high-efficiency compression encoding method such as MPEG-4 are composed of intra-frame and inter-image encoded frames (so-called predicted frames). Since the predicted frame is a frame for which decoding is performed with reference to the data of the video frame that has been decoded, if the reproduction start position by random access is set to the predicted frame, the reproduction cannot be performed correctly. There is an obstacle such as disorder. Therefore, the reproduction start position by random access needs to be an intra frame.
[0021]
Therefore, for example, when a random access instruction to move the reproduction position after 10 seconds is input to the image data reproducing apparatus, all the moving images intervening from the moving image frame currently being decoded to the moving image frame corresponding to 10 seconds ahead are input. Analyze the movie fragment box 105 for storing frames, further analyze the track fragment box 107 containing moving image data for each of them, and further analyze the track run box 108 for each one. In addition, it is necessary to analyze a large number of boxes down to a very small unit, count the reproduction duration, and determine a moving image frame 10 seconds ahead, which is a reproduction start position after random access. Further, the image data reproducing device must determine whether the moving image frame corresponding to 10 seconds ahead is an intra frame. If the frame is not an intra frame, the nearest intra frame must be searched to determine a moving image frame to be a reproduction start position after random access.
[0022]
As described above, in the conventional MP4 file format, the load on the image data reproducing apparatus at the time of random access is large, and it takes time for the image data reproducing apparatus to determine the reproduction start position after the random access. There is an inconvenience of having to wait.
[0023]
On the other hand, the conventional MP4 file format has one purpose of being used for pseudo-streaming playback or the like in which playback is performed while downloading from a server device on the Internet. Therefore, it is not possible to move the playback position to a portion where downloading has not been completed. It is not possible to move the playback position only to the part where the download has been completed. Therefore, it is presumed that the random access in the data reproduction of the MP4 file is often used when the image data reproducing apparatus once downloads and reproduces the MP4 file and then reproduces it again.
[0024]
Further, since the conventional MP4 file format is assumed to be used for download distribution, it is desired to reduce the file size of the MP4 file from the viewpoint of communication time and communication fee. In particular, in mobile communication which is charged in accordance with the amount of downloaded data, there is also a problem that the file size must be reduced as much as possible so that communication charges do not become expensive.
[0025]
Therefore, the present invention has been made in view of such problems and circumstances, and can quickly perform random access processing of a file multiplexed with moving image data and audio data without increasing the size of a file to be downloaded. It is an object of the present invention to provide an image data reproducing device that can be executed.
[0026]
[Means for Solving the Problems]
In order to achieve the above object, an image data reproducing apparatus according to the present invention is an image data reproducing apparatus that reproduces a file obtained by multiplexing image data and at least one of audio data and text data, File input means for taking the file into the image data reproducing device, file temporary storage means having an area for temporarily storing the input file taken by the input means, and the file stored in the file temporary storage means A file analysis unit that reads the input file and analyzes file header information for separating and synchronously reproducing the image data, audio data, or text data included in the input file; and Stored in the temporary storage means based on the file header information. Decoding means for reading and decoding the image data, audio data or text data contained in the input file, and reproducing means for reproducing the image data, audio data or text data decoded by the decoding means and outputting it to a display device Based on the file header information analyzed by the file analysis means, random access information generation means for generating random access information for random access to the image data, audio data or text data included in the input file, A reproduction position control unit that outputs an analysis position change instruction for instructing a change of an analysis position of the input file to the file analysis unit with reference to the random access information generated by the random access information generation unit, The file analysis means may include the playback position The reading position of the input file stored in the file temporary storage unit is changed based on the analysis position change instruction output by the control unit, and the image data, audio data, or text data of the image data included in the input file is changed. It is characterized by analyzing file header information.
[0027]
Thereby, at the time of the first file reproduction, information indicating the position of the header information relating to a frame that can be independently decoded, that is, random access information is generated, so that rapid random access reproduction can be realized.
Here, the random access information generating means may generate the random access information for each media data included in the input file. As a result, even when various tracks are compounded in the input file, the random access reproduction process can be speeded up by referring to the random access information for each track. You.
[0028]
Further, the image data reproducing device according to the present invention further includes a file output unit that outputs a file including the random access information generated by the random access information generating unit, wherein the random access information generating unit includes the input file. Has a layered structure, generates a first layer for describing the random access information for each media data included in the input file, and a second layer in which the first layer is integrated. Preferably, the file output unit outputs the file including the random access information by integrating the second layer with the input file.
[0029]
As a result, since the random access information generated at the time of the first file reproduction is output to a file, a device that can contribute to speeding up of the random access reproduction at the time of the next file reproduction is realized.
Further, the file output unit generates position information indicating a start position of the second hierarchy integrated with the input file, integrates the position information with the input file, and includes the random access information. You may output a file.
[0030]
As a result, the portion in which the random access information is stored can be read quickly, so that random access reproduction can be executed more quickly.
It should be noted that the present invention can be realized not only as such an image data reproducing apparatus, but also as an image data reproducing method in which the characteristic means provided in such an image data reproducing apparatus is used as a step. It can also be realized as a program that causes a computer to execute the steps. Needless to say, such a program can be distributed via a recording medium such as a CD-ROM or a transmission medium such as the Internet.
[0031]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
(Embodiment 1)
FIG. 1 is a block diagram showing a configuration of an image data reproducing device according to Embodiment 1 of the present invention.
[0032]
The image data reproducing device 200 is a device that decodes and reproduces moving image data, audio data, and the like encoded by a compression encoding method such as MPEG-4, and a file input unit 201 that imports an MP4 file into the device. A data file temporary storage unit 202 for temporarily storing an MP4 file taken into the apparatus, a data file analysis unit 203 for reading and analyzing header information of the MP4 file, and a data decoding for decoding entity data included in the MP4 file. A data reproducing unit 205 that reproduces the decoded entity data and outputs it to a display device such as a display, and a random access information table (hereinafter referred to as an “RA information table”) for quickly processing random access. ) Generating the RA information table generation unit 206, 4 the file and the RA information table by multiplexing, comprising a file storage unit 208 for storing the MP4 file that is a file output unit 207 and an output for outputting a new MP4 file.
[0033]
The file input unit 201 is a processing unit that downloads an MP4 file stored in a server device on the Internet and loads the MP4 file into the image data reproducing device, and includes a communication interface for communicating with the server device via the Internet or the like. It is realized by. The file input unit 201 sequentially downloads the MP4 files from the beginning of the file, takes them into the device, and sequentially stores them in the data file temporary storage unit 202.
[0034]
The data file temporary storage unit 202 is a storage unit that temporarily stores the MP4 file captured by the file input unit 201, and is realized by a storage device such as a RAM (Random Access Memory) or a hard disk.
The data file analysis unit 203 is a processing unit that reads and analyzes header information from an MP4 file stored in the data file temporary storage unit 202, and is realized by a CPU and a memory. Here, the header information of the MP4 file means header information of the entire file included in the movie box, header information of the movie fragment such as demultiplexing information and synchronous reproduction information included in the movie fragment box. The data file analysis unit 203 also outputs decoding instruction information necessary for decoding moving image data, such as information on a frame boundary position and a reproduction time, based on the result of analyzing the header information of the MP4 file. Output to decoding section 204. Further, the data file analysis unit 203 outputs random access information (hereinafter, referred to as “RA information”) to the RA information table generation unit 206 based on the result of analyzing the header information of the MP4 file.
[0035]
The data decoding unit 204 reads and decodes actual data such as moving image data and audio data from the MP4 file accumulated in the data file temporary storage unit 202 based on the decoding instruction information received from the data file analysis unit 203. This is realized by a decoder including a CPU and a memory.
[0036]
The data reproducing unit 205 is a processing unit that reproduces the entity data decoded by the data decoding unit 204 and outputs the entity data to a display device such as a display or a speaker, and a microprocessor such as a DSP (Digital Signal Processor) or a VRAM (Video). This is realized by a chip having a random access memory, a video card, or the like.
[0037]
The RA information table generation unit 206 is a processing unit that generates an RA information table based on the RA information received from the data file analysis unit 203, and is realized by a CPU and a memory. The RA information here is position information and time information relating to header information of a frame to be a reproduction start position after random access, and the RA information table is a table in which RA information is accumulated. The RA information and the RA information table will be described later in detail.
[0038]
The file output unit 207 reads the MP4 file that has been downloaded and accumulated in the data file temporary storage unit 202, that is, the MP4 file that has been completely input into the device, and reads the RA information table from the RA information table generation unit 206. This is a processing unit that receives and adds it to the end of the input completed MP4 file, multiplexes the input completed MP4 file and the RA information table, and outputs a new MP4 file, and is realized by a CPU and a memory.
[0039]
The file storage unit 208 is a storage unit that stores the MP4 file output by the file output unit 207, and is realized by a storage device such as a hard disk, or a recording medium such as a magneto-optical disk or an SD memory card.
Here, the structure of the MP4 file output by the image data reproducing device 200 will be described.
[0040]
FIG. 2 is a diagram showing a file structure of an MP4 file generated by the image data reproducing device 200 according to the first embodiment.
As shown in FIG. 2, the MP4 file 300 generated by the image data reproducing apparatus 200 includes a movie box 301, a movie data box 302, a movie fragment sequence 303, and an RA information table 310. It differs from the conventional MP4 file 100 in that it includes.
[0041]
In the MP4 file 300, first, portions of the movie box 301, the movie data box 302, and the movie fragment string 303 in the MP4 file 300 are sequentially taken in from the file input unit 201 of the image data reproducing apparatus 200. It is generated by adding the part of the RA information table 310 in the file output unit 207 of the data reproducing apparatus 200.
[0042]
That is, at the stage of being taken into the file input unit 201 of the image data reproducing apparatus 200, the MP4 file input to the image data reproducing apparatus 200 has the same configuration as the conventional MP4 file 100.
In order to explain the generation process of the MP4 file 300, FIG. 2 shows the box hierarchy constituting the movie fragment sequence 303 more specifically, unlike FIG.
[0043]
The movie fragment row 303 is obtained by repeatedly arranging a plurality of movie fragments 304. The movie fragment 304 is configured by alternately arranging movie fragment boxes 305 and fragment data boxes 306. Here, a character string “moof” indicating the type of the movie fragment box 305 is stored in the box header portion of the movie fragment box 305, which indicates that the box is the movie fragment box 305. . Although not shown, immediately before the character string indicating the type, the size information of the box is added. Further, in the box header portion of the movie fragment box 305, in addition to "moof", a number indicating the number of the movie fragment box 305 from the beginning of the file is stored.
[0044]
A character string “traf” indicating the type of the track fragment box 307 is stored in the box header section of the track fragment box 307 stored in the box data storage section of the movie fragment box 305. Indicates a track fragment box 307, and size information of this box is added immediately before the character string indicating the type. In the box header section of the track fragment box 307, the track number information of the stored track is stored so that it can be identified which track is. Note that, as described above, the track fragment box 307 is header data, and the data pointed to by this is stored in the fragment data box 306. That is, information indicating the order of the track fragment box 307 in the movie fragment box 305 that stores the track fragment box 307 is not added, and the image data reproducing apparatus 200 Each time 307 appears, it is counted.
[0045]
Further, a character string "trun" indicating the type of the track run box 308 is stored in the box header section of the track run box 308 stored in the box data storage section of the track fragment box 307. Indicates the track run box 308, and size information of the box is added immediately before the character string indicating the type. In the field of the entry 309 stored in the box data storage unit of the track run box 308, display continuation time information of the minimum unit such as moving image data and audio data indicated by the entry 309, and whether or not the frame is an intra frame. Is described. Depending on the device that creates the file, the movie box 301 may store the default value of the synchronous sample flag information relating to the sample of the entire movie, or the track fragment box 307 may store the synchronous sample flag information relating to the sample included in that box, The default value of the length information may be stored.
[0046]
Here, when the first entry 309 included in the track run box 308 indicates an intra frame, information indicating an intra frame is described in the field of the track run box 308, and the information is synchronized with the entry 309. When the sample flag is set, the synchronous sample flag information is described in the field of the track run box 308.
[0047]
A character string "mdat" indicating the type of the fragment data box 306 is stored in the box header portion of the fragment data box 306, thereby indicating that this box is the fragment data box 306, and Immediately before the character string shown, the size information of this box is added. Further, in the box data storage section of the fragment box 306, samples forming the frames indicated by all the entries 309 stored in the movie fragment box 305 are stored in the order of the entries.
[0048]
In FIG. 2, the synchronization sample flag S1 is set in the first entry 309 of the first track run box 308 included in the first track fragment box 307 in the first movie fragment box 305, and the second The synchronization sample flag S2 is set in the second entry 309 of the first track run box 308 included in the first track fragment box 307 in the movie fragment box 305. Therefore, the synchronous sample flag S1 describes the synchronous sample flag information in the field of the first track run box 308, and the synchronous sample flag S2 describes the synchronous sample flag information in the field of the set entry 309. Will be described. Further, the synchronization sample flag S1 indicates that the first sample included in the first fragment data box 306 is the intra frame I1.
[0049]
That is, since it can be said that the header information of the frame to be the reproduction start position after random access is stored in the entry 309 in which the synchronous sample flag is set, the image data reproducing apparatus 200 relates to the entry 309. The RA information table 310 is generated by accumulating the position information and the time information.
[0050]
Here, the generation process of the RA information table 310 will be described with reference to the drawings.
FIG. 3 is a flowchart showing a processing procedure in which the image data reproducing device according to the first embodiment generates an RA information table.
First, the data file analysis unit 203 reads the first movie fragment box 305 included in the movie fragment 304 (S10). Subsequently, the first track fragment box 307 included in the movie fragment box 305 is read (S11). Furthermore, the data file analysis unit 203 reads the first track run box 308 included in the first track fragment box 307 by deepening the box hierarchy (S12).
[0051]
Here, the data file analysis unit 203 analyzes whether or not the synchronous sample flag information is described in the field of the track run box 308 (S13).
When the synchronous sample flag information is described in the field of the track run box 308, the data file analysis unit 203 outputs the position information and the time information of the synchronous sample flag as RA information to the RA information table generation unit 206, and outputs the RA information The table generator 206 adds this information to the RA information table 310 (S14).
[0052]
On the other hand, when the synchronous sample flag information is not described in the field of the track run box 308, the data file analysis unit 203 further deepens the layer of the box and sequentially reads the entries 309 included in the first track run box 308. (S15).
[0053]
Here, the data file analysis unit 203 analyzes whether or not the field of the sequentially read entry 309 includes the synchronization sample flag information (S16).
[0054]
When the synchronous sample flag information is described in the field of the entry 309, the RA information table generation unit 206 performs the same processing as in the case where the synchronous sample flag information is described in the field of the track run box 308 described above. The position information and the time information of the synchronous sample flag output as RA information by the file analysis unit 203 are added to the RA information table 310 (S14).
[0055]
On the other hand, when the synchronous sample flag information is not described in the field of the entry 309, the data file analysis unit 203 reads the next track run box 308. When the position information and the time information of the synchronous sample flag are added to the RA information table 310 as RA information in the RA information table generation unit 206, the next track run box 308 is similarly read.
[0056]
Here, if there is a next track run box 308 in the track fragment box 307, the image data reproducing apparatus 200 repeats the processing from S12 to S14, and if there is no next track run box 308 in the track fragment box 307, the data file The analysis unit 203 reads the next track fragment box 307 (S17).
[0057]
Similarly, if there is a next track fragment box 307 in the movie fragment box 305, the image data reproducing apparatus 200 repeats the processing from S11 to S17, and if there is no next track fragment box 307 in the movie fragment box 305, The data file analysis unit 203 reads the next movie fragment box 305 (S18).
[0058]
Thereafter, if there is a next movie fragment box 305, the image data reproducing apparatus 200 repeats the processing from S11 to S18. If there is no next movie fragment box 305, the RA information table generation unit 206 proceeds to the data file analysis unit. The RA information end information is received from 203, and the generated RA information table 310 is output to the file output unit 207 (S19). Finally, the RA information table 310 is formed into a box structure by the file output unit 207, combined with the end of the input completed MP4 file, and output as a part of the new MP4 file 300 (S20).
[0059]
As described above, the default value of the synchronous sample flag information relating to the sample of the entire movie is stored in the movie box 301, and the default value of the synchronous sample flag information and the default duration time information relating to the sample included in the box is stored in the track fragment box 307. When the values are stored, the image data reproducing device 200 acquires these default values and stores them in the memory. If the track run box 308 is omitted, the track fragment box 307 and the movie box 301 are referred to in this order, and the RA information table 310 is generated using these default values.
[0060]
The information and data structure included in the RA information table 310 generated through such a process will be described with reference to FIG.
FIG. 4A is a diagram showing the contents of data included in the RA information table 310.
[0061]
The RA information table 310 has the same number of rows as the number of RA information stored in the table, and is configured to describe one piece of RA information in one row.
One piece of RA information includes a time 311, which indicates the reproduction time of the frame indicated by the entry 309 in which the synchronous sample flag information is described, and a movie fragment box 305 including the entry 309, indicating the number of bytes from the beginning of the file. The start position 312 of “moof” indicating that the entry 309 is located in the “track” box 313, the “traf” number 313 indicating that the entry 309 is included in the track fragment box 307, and the entry 309 is included in the track run box 308. Number 314 indicating the entry 309, the entry number 315 indicating the entry 309, and the byte number of the frame indicated by the entry 309 from the beginning of the file. Start position of the indicated data And a 16 field.
[0062]
FIG. 4B shows the data structure of the RA information table 310.
As described above, the RA information table 310 is converted into a box structure by the file output unit 207 (S20 in FIG. 3).
The RA information table 310 converted into the box structure includes a box header section 317 and a box data storage section 318, like the other boxes constituting the MP4 file 300. The box header section 317 includes at least a box size 317a for storing box size information and a box type 317b for storing a character string for identifying the type of the box. Bytes are allocated. The box header section 317 may store version flag information indicating the version of the RA information table 310 and flag information.
[0063]
The box data storage unit 318 located following the box header unit 317 stores the number of sample flags 319 included in the RA information table indicating the number of RA information included in the RA information table 310. The fields 311 to 316 constituting the RA information are arranged. In this case, the data length of these fields is 4 bytes assigned to the field of 319 sample flags, and 4 bytes are assigned to the field constituting the RA information at the time 311 and 4 bytes at the start position 312 of “moof”. , One byte is assigned to the “traf” number 313, one byte is assigned to the “trun” number 314, two bytes are assigned to the entry number 315, and four bytes are assigned to the data start position 316. The data length may be used, and information indicating this data length may be provided in the RA information table 310.
[0064]
As described above, the image data reproducing apparatus 200 according to the first embodiment sets the reproduction start position at the time of random access at the same time as the reproduction of the file in the first file reproduction stage, that is, the stage of reproducing while downloading the MP4 file. Position information and time information on header information such as a power frame, for example, an intra frame, are extracted. Then, the image data reproducing apparatus 200 accumulates the position information and the like, adds it to the end of the MP4 file after the download is completed, and outputs it as a new MP4 file. That is, since the image data reproducing device 200 generates and outputs information for quickly processing random access at the first file reproducing stage, it is possible to contribute to speeding up random access reproducing at the time of reproducing after downloading. Can be.
[0065]
Next, a first modified example of the first embodiment will be described.
In the first embodiment, in the image data reproducing apparatus 200, the data file analysis unit 203 outputs the RA information to the RA information table generation unit 206, and the RA information table generation unit 206 generates the RA information table. .
[0066]
On the other hand, in the first modified example, in the image data reproducing apparatus having substantially the same configuration as that of the first embodiment, the data file analysis unit performs the processing such as the moving image track RA information and the audio track RA information. The RA information for each track is output to the RA information table generator, and the RA information table generator generates the RA information table for each track.
[0067]
Therefore, the structure of the MP4 file generated by the image data reproducing device according to the first modification is different from the MP4 file generated by the image data reproducing device 200. Hereinafter, the structure of the MP4 file generated by the image data reproducing device according to the first modification will be described including the generation process.
[0068]
FIG. 5 is a diagram showing a file structure of an MP4 file generated by the image data reproducing device according to the first modification of the first embodiment.
The MP4 file 400 includes a movie box 401, a movie data box 402, a movie fragment column 403, and an RA information table column 410, and differs from the MP4 file 300 in that a plurality of RA information tables are included.
[0069]
The MP4 file 400 has the same configuration as that of the conventional MP4 file 100 at the stage of being loaded into the image data reproducing apparatus.
The RA information table column 410 is obtained by repeatedly arranging a plurality of RA information tables, and is formed in a box structure. That is, the RA information table column 410 includes a box header section 411 and a box data storage section 412, like the other boxes of the MP4 file 400. The box header section 411 located at the top of the RA information table column 410 includes at least a box size 411a for storing box size information and a box type 411b for storing a character string representing the type of the box. For example, each of these fields is assigned 4 bytes. The box header 411 may store version flag information indicating the version of the RA information table column 410 and flag information.
[0070]
Further, in the box data storage unit 412 located following the box header unit 411, an RA information table number 413 indicating the number of RA information tables included in the RA information table column 410 is stored. The RA information table generated for each track, such as the image track RA information table 414M, the audio track RA information table 414A, and the text track RA information table 414T, is stored.
[0071]
As shown in FIG. 5, the RA information table generated for each track may have the same configuration regardless of the type of track, or may have a different configuration for each type of track. Here, the same configuration will be described for each type of track using the moving image track RA information table 414M and the audio track RA information table 414A.
[0072]
The moving image track RA information table 414M is a table in which RA information on moving image tracks is accumulated. The head of the moving image track RA information table 414M includes a track ID 415M, which is a field for describing a unique character string indicating which track the RA information table is related to. Then, following the track ID 415M, a field of the number of sample flags 416M included in the table is included, and the RA entry 417M is arranged after that. Note that the RA entry 417M means a field group in which fields from the time 311 to the data start position 316 in the RA information table 310 of the first embodiment are grouped.
[0073]
On the other hand, the audio track RA information table 414A is a table in which RA information on audio tracks is integrated. The audio track RA information table 414A also includes a track ID 415A at the beginning, similarly to the moving image track RA information table 414M. Following the track ID 415A, the number of sample flags 416A included in the table is included, and the RA entry 417A is arranged after that.
[0074]
Then, as shown in FIG. 5, synchronous reproduction is performed between RA entries in which the order of the RA entries 417M in the moving picture track RA information table 414M matches the order of the RA entries 417A in the audio track RA information table 414A. The RA information tables 414M and 414A are generated so as to be able to perform the operations.
[0075]
In general, in the case of an audio track, decoding is not performed by referring to data of already decoded frames like a predicted frame in a moving image track, and decoding can be performed from any audio frame. Therefore, unlike the moving image track RA information table 414M, the information to be added to the table does not need to be limited to an entry indicating an intra frame. Therefore, the RA information relating to the audio track may be, for example, time information and position information relating to the header information of the audio frames arranged according to the regularity by giving the reproduction time of the audio frame regular intervals.
[0076]
Alternatively, the regularity that the reproduction time of the audio frame has the reproduction time closest to the value of the reproduction time described in the field of the RA entry 417M in the moving image track RA information table 414M in synchronization with the moving image frame. May be provided. Since the sample rate of the moving image frame and the sample rate of the audio frame are different from each other, the reproduction times of the moving image frame and the audio frame do not always match. However, according to this regularity, even when the playback time of the moving image frame and the playback time of the audio frame are different, the approximate playback time and the start position of “moof” are described in the RA entries 417M and 417A, respectively. By referring to these, the reproduction start time of the moving image data and the reproduction start time of the audio data after the random access can be substantially matched.
[0077]
Furthermore, the RA information on the audio track may be time information and position information on the header information of the audio frame that is synchronized with the moving image frame.
That is, in the audio track RA information table 414A, for example, after the number of sample flags 416A included in the table, for example, a field indicating a reproduction time of an audio frame arranged according to a predetermined regularity is arranged, or a moving image frame and Fields indicating the position information and the like of the header corresponding to the audio frame for which the synchronous reproduction is to be performed may be arranged, or these fields may be arranged alternately.
[0078]
As described above, according to the image data reproducing apparatus according to the first modification, the MP4 file 400 including the RA information table for each track, such as the moving image track RA information table and the audio track RA information table, is generated. Therefore, even when various tracks are combined in the MP4 file taken into the device, it is possible to contribute to speeding up random access reproduction at the time of reproduction after download.
[0079]
Subsequently, a second modified example and a third modified example of the first embodiment will be described.
In the first embodiment, the MP4 file 300 is generated in the image data reproducing apparatus 200 by adding the RA information table 310 to the end of the MP4 file taken into the apparatus.
[0080]
On the other hand, in the second modified example, an MP4 file and an RA information table file are generated separately from the MP4 file taken into the device.
Therefore, the components of the image data reproduction device according to the second modification are different from the configuration of the image data reproduction device 200. Hereinafter, the image data reproducing device according to the second modified example will be described focusing on differences from the image data reproducing device 200.
[0081]
FIG. 6 is a block diagram illustrating a configuration of an image data reproducing device according to a second modification of the first embodiment.
The image data reproducing device 200B according to the second modification is different from the image data reproducing device 200 mainly in including an RA information table file output unit 219 and an RA information table file storage unit 220.
[0082]
The RA information table file output unit 219 is a processing unit that receives the RA information table output from the RA information table generation unit 216, shapes the RA information table into a box structure, converts the RA information table into a file, and outputs an RA information table file. , And is realized by a CPU and a memory.
[0083]
The RA information table file storage unit 220 is a storage unit that stores the RA information table file output by the RA information table file output unit 219, and includes a storage device such as a hard disk, a recording medium such as a magneto-optical disk, and an SD memory card. It is realized by.
[0084]
With this configuration of the image data reproducing device 200B, the RA information table file can be generated separately from the MP4 file. Therefore, the file size of the MP4 file stored in the MP4 file storage unit 218 can be minimized. In this state, the image data can be retransmitted to another image data reproducing device or the like. Further, the use range of the RA information table file can be expanded, for example, by copying only the RA information table file to another image data reproducing apparatus using a recording medium or the like that can be easily transported such as a flexible disk.
[0085]
It is necessary to indicate the association between the RA information table file and the output MP4 file, but the file name of the RA information table file is made the same as the file name of the MP4 file, and only the extension is made different. The RA information table file output unit 219 may output an RA information table file in accordance with the rules. More specifically, for example, it is assumed that the extension indicating the MP4 file is “.mp4” and the extension indicating the RA information table file is “.rat”. Is "aaa.mp4", the RA information table file may be output as "aaa.rat".
[0086]
On the other hand, in the third modified example, an RA information table file, an MP4 file, and an association management file for managing the association between the two files are generated from the MP4 file taken into the device.
Therefore, the components of the image data reproduction device according to the third modification are different from the configuration of the image data reproduction device 200B. Hereinafter, the image data reproducing device according to the third modified example will be described focusing on the differences from the image data reproducing device 200B.
[0087]
FIG. 7 is a block diagram illustrating a configuration of an image data reproducing device according to a third modification of the first embodiment.
The image data reproducing device 200C according to the third modification is different from the image data reproducing device 200B mainly in including a file information management unit 231 and a management file storage unit 232.
[0088]
The file information management unit 231 is configured to output a file name of an MP4 file and a file name of an RA information table file according to a file name instruction from a user input into the image data reproducing apparatus 200C via an input device such as a keyboard. Is output, the MP4 file name information is output to the MP4 file output unit 227, the RA information table file name information is output to the RA information table file output unit 229, and the association rule between the two files is converted to a file. This is a processing unit that outputs as a management file, and is realized by a CPU, a memory, and the like.
[0089]
The management file storage unit 232 is a storage unit that stores the association management file output by the file information management unit 231 and is realized by a storage device such as a hard disk, or a recording medium such as a magneto-optical disk or an SD memory card.
When the image data reproducing device 200C is configured as described above and the RA information table file is generated separately from the MP4 file, a file is separately generated for an association rule between the two files, thereby setting a file name to the user. Discretion can also be given.
[0090]
As described above, a plurality of patterns can be considered for the relationship between the MP4 file generated by the image data reproducing device according to the first embodiment and the modification thereof and the RA information table.
[0091]
FIGS. 8A to 8C are diagrams for explaining the relationship between the MP4 file and the RA information table.
FIG. 8A is a diagram showing a file generated by the image data reproducing device 200 according to the first embodiment. According to the image data reproducing apparatus 200 according to the first embodiment, when the MP4 file 100 having the configuration shown in FIG. 20 is taken into the apparatus, the RA information table 310 is added to the end, and the RA information table 310 It is output as an integrated new MP4 file 300.
[0092]
FIG. 8B is a diagram showing a file generated by the image data reproducing device 200B according to the second modification. According to the image data reproducing device 200B, the MP4 file 100 having the configuration shown in FIG. 20 is output as an MP4 file 320 having substantially the same configuration as that shown in FIG. As a result, the RA information table file 321 is output. In this case, as described above, the RA information table file 321 has a relationship in which the file name is determined according to a predetermined association rule with the output MP4 file 320.
[0093]
FIG. 8C is a diagram showing a file generated by the image data reproducing device 200C according to the third modification. According to the image data reproducing device 200C, the MP4 file 100 having the configuration shown in FIG. 20 is output as an MP4 file 330 having substantially the same configuration as that shown in FIG. As a result, the RA information table file 331 and the association management file 332 are output. In this case, since the association between the RA information table file 331 and the output MP4 file 330 is managed by the association management file 332 as described above, the association management file 332 is stored in the RA information table file 331 and the output MP4 file 330. And a relationship that mediates.
[0094]
As described above, according to the first embodiment and its modification, in the image data reproducing apparatus, information for quickly processing random access is generated at the time of the first file reproduction. It can contribute to the conversion.
[0095]
(Embodiment 2)
Next, a second embodiment of the present invention will be described with reference to the drawings.
In the first embodiment, an image data reproducing apparatus that generates an RA information table for quickly processing random access has been described. In the second embodiment, an image data reproducing apparatus that uses a generated RA information table is described. The device will be described. Therefore, the components of the image data reproducing device according to the second embodiment are different from those of the image data reproducing device 200 according to the first embodiment. Hereinafter, this different point will be mainly described.
[0096]
FIG. 9 is a block diagram showing a configuration of an image data reproducing device according to Embodiment 2 of the present invention.
The image data reproducing device 500 mainly includes a reproduction position control unit 507, and differs from the image data reproducing device 200 according to the first embodiment in that the image data reproducing device 500 does not include a file output unit and a file storage unit.
[0097]
The playback position control unit 507 is a processing unit that receives the RA information table output from the RA information table generation unit 506, and outputs analysis position indication information indicating a playback position after random access, and is implemented by a CPU or a memory. Is done. The reproduction position control unit 507 refers to the RA information table and performs random access according to a reproduction position change instruction (random access instruction) from the user input into the image data reproduction device 500 via an input device such as a keyboard or a mouse. The subsequent playback position is determined, and analysis position indication information is output to the data file analysis unit 503.
[0098]
Then, different from the first embodiment, the data file analysis unit 503 analyzes the header information of the MP4 file according to the analysis position indication information, and outputs the decoding instruction information to the data decoding unit 504 based on the analysis result.
Further, the RA information table generation unit 506 may generate and output an RA information table by integrating all RA information. However, in order to use the RA information table during download reproduction, It is desirable to accumulate a predetermined number of pieces of RA information and generate and output an RA information table sequentially at predetermined intervals.
[0099]
In the image data reproducing apparatus 500 having such a configuration, since the RA information table is not output as a file, the reproduction of the MP4 file is performed or the downloaded MP4 file is held in the data file temporary storage unit 502. Random access reproduction is possible. This is to cope with a case where outputting the downloaded MP4 file to the external storage device of the image data reproducing device 500 is prohibited, and the MP4 file is deleted from the data file temporary storage unit 502. Then, the RA information table is also discarded. Also, since the data itself does not exist in the part of the MP4 file that has not been completely downloaded and random access to this part is not possible, during the MP4 file download / playback, the random access to the downloaded part is not performed. Is possible.
[0100]
As described above, the image data reproducing apparatus 500 according to the second embodiment performs the position reproduction and the time information regarding the header information of the frame to be set as the reproduction start position at the time of random access simultaneously with the reproduction of the file in the first file reproduction stage. Is generated, and random access reproduction is performed using the information described in this table. Therefore, rapid random access reproduction can be realized.
[0101]
Next, a first modification of the second embodiment will be described.
In the second embodiment, in the image data reproducing apparatus 500, the generated RA information table is not output as a file, and the downloaded MP4 file is not output as a file.
[0102]
On the other hand, in the first modified example, the generated RA information table and the downloaded MP4 file are output as files in the image data reproducing apparatus.
Therefore, the components of the image data reproducing device according to the first modification are different from the components of the image data reproducing device 500. Hereinafter, the image data reproducing device according to the first modified example will be described focusing on this difference.
[0103]
FIG. 10 is a block diagram showing a configuration of an image data reproducing device according to a first modification of the second embodiment.
This image data reproducing apparatus 500A is different from the image data reproducing apparatus 500 according to the second embodiment mainly in that it has a file output section 518 and a file storage section 519.
[0104]
The file output unit 518 reads the MP4 file that has been completely input into the device, receives the RA information table in which all RA information is integrated from the RA information table generation unit 516, and adds it to the end of the input completed MP4 file. This is a processing unit that multiplexes the input completed MP4 file and the RA information table and outputs a new MP4 file, and is realized by a CPU and a memory.
[0105]
The file storage unit 519 is a storage unit that stores the MP4 file output by the file output unit 518, and is realized by a storage device such as a hard disk, or a recording medium such as a magneto-optical disk or an SD memory card.
[0106]
The RA information table generator 516, like the RA information table generator 506 in the image data reproducing apparatus 500, accumulates a predetermined number of RA information, sequentially generates an RA information table at predetermined intervals, and generates a reproduction position. While outputting to the control unit 517, the RA information is accumulated, and an RA information table in which all the RA information is accumulated is output to the file output unit 518.
[0107]
The RA information table generation unit 516 accumulates a predetermined number of RA information, sequentially generates RA information tables at predetermined intervals, and outputs the RA information tables to the reproduction position control unit 517 and the file output unit 518. Alternatively, an RA information table in which all RA information are integrated may be generated and added to the end of the input completed MP4 file.
[0108]
The structure of the generated RA information table is the same as RA information table 310 in the first embodiment or RA information table column 410 according to the first modification of the first embodiment.
[0109]
As described above, according to the image data reproducing apparatus 500A according to the first modification, in the first file reproducing step, at the same time as the reproduction of the file, the position information and the time regarding the header information of the frame to be the reproduction start position at the time of random access are set. An RA information table in which information and the like are integrated is generated, and random access reproduction is performed using the information described in this table. Therefore, rapid random access reproduction can be realized, and after the download is completed, Since information for promptly processing random access can be output to a file, unlike the second embodiment, after the MP4 file is downloaded and after the MP4 file is deleted from the data file temporary storage unit 512 Can also contribute to speeding up random access playback Kill.
[0110]
Next, a second modification of the second embodiment will be described.
In the second embodiment and the first modification, the RA information table is generated in the image data reproducing devices 500 and 500A.
On the other hand, in the second modification, the image data reproducing device reads the already generated RA information table and uses it for random access reproduction without generating the RA information table.
[0111]
Therefore, the components of the image data reproducing device according to the second modification are different from the components of the image data reproducing devices 500 and 500A. Hereinafter, the image data reproducing device according to the second modified example will be described focusing on this difference.
FIG. 11 is a block diagram showing a configuration of an image data reproducing device according to a second modification of the second embodiment of the present invention.
[0112]
The image data reproducing apparatus 500B mainly includes an RA information table file storage unit 527, and does not include an RA information table generation unit and the like. Different from devices 500 and 500A.
[0113]
The RA information table file storage unit 527 is, for example, a storage unit that stores an RA information table file already generated in the image data reproducing apparatus 200B or the like according to the second modification of the first embodiment, and is a hard disk or the like. , And an easily transportable recording medium such as an SD memory card or a flexible disk.
[0114]
Then, the reproduction position control unit 526 reads the RA information table from the RA information table file storage unit 527 according to a random access instruction from the user input into the image data reproduction device 500B via an input device such as a keyboard or a mouse. With reference to this, the reproduction position after random access is determined, and the analysis position indication information is output to the data file analysis unit 523.
[0115]
By configuring the image data reproducing device 500B in this manner, if an RA information table file for an MP4 file to be downloaded and reproduced has already been generated, it is not necessary to generate an RA information table. It can be done more quickly. In this case as well, for the part of the MP4 file for which the download has not been completed, all RA information is described in the RA information table file, but since the data itself does not exist, the part for which the download has been completed is not performed. Random access to is possible.
[0116]
As described above, according to the second embodiment and its modification, the image data reproducing apparatus generates information for quickly processing random access at the time of the first file reproduction and uses this information. Since information that has already been generated is read and used, random access reproduction can be performed quickly.
[0117]
(Embodiment 3)
Further, Embodiment 3 of the present invention will be described with reference to the drawings.
In the first embodiment, an image data reproducing apparatus that mainly generates an RA information table has been described, and in the second embodiment, an image data reproducing apparatus that mainly uses an RA information table has been described. That is, in the first and second embodiments, in order to quickly process random access, the RA information table is formed into a box structure and generated, or image data using the RA information table formed into a box structure is used. The playback device has been described.
[0118]
On the other hand, in the image data reproducing apparatus according to the third embodiment, a box for storing RA information for each track is generated, and a box for collectively storing these boxes is generated. Therefore, the components of the image data reproducing device according to the third embodiment are different from those of the image data reproducing devices according to the first and second embodiments. Hereinafter, this different point will be mainly described.
[0119]
FIG. 12 is a block diagram showing a configuration of an image data reproducing device according to Embodiment 3 of the present invention.
The image data reproducing apparatus 600 is different from the image data reproducing apparatuses according to the first and second embodiments mainly in that an RA information storage box generating unit 606 is provided.
[0120]
The RA information storage box generation unit 606 receives the RA information from the data file analysis unit 603, generates a track RA information storage box for storing RA information for each track, and stores the track RA information storage box collectively. A processing unit that generates an RA information storage box, and is realized by a CPU, a memory, and the like. The track RA information storage box and the RA information storage box will be described later in detail.
[0121]
Then, the reproduction position control unit 607 transmits the RA information storage box from the RA information storage box generation unit 606 in accordance with a random access instruction from the user input into the image data reproduction device 600 via an input device such as a keyboard or a mouse. The data is read, the reproduction position after random access is determined with reference to this, and the analysis position indication information is output to the data file analyzer 603.
[0122]
Also, the file output unit 608 reads the MP4 file whose input to the device has been completed, receives the RA information storage box from the RA information storage box generation unit 606, and integrates it with the input completed MP4 file to create a new MP4 file. Output a file.
[0123]
Note that the reproduction position control unit 607 reads the RA information storage box that is being generated by the RA information storage box generation unit 606 so that the RA information storage box can be used during the download reproduction of the MP4 file. I can do it.
[0124]
Next, the structure of the MP4 file generated by the image data reproducing device 600 will be described.
FIG. 13 is a diagram showing a file structure of an MP4 file generated by the image data reproducing device 600 according to Embodiment 3 of the present invention.
[0125]
As shown in FIG. 13, the MP4 file 700 is composed of a movie box 701, a movie data box 702, a movie fragment string 703, and an RA information storage box 704, and includes the RA information storage box 704. And different.
[0126]
It should be noted that the MP4 file 700 also has the same configuration as that of the conventional MP4 file 100 at the stage of being loaded into the image data reproducing device 600.
The RA information storage box 704 is a box that collectively stores the track RA information storage boxes 706 and, like the other boxes of the MP4 file 700, is composed of a box header section 705 and a box data storage section. A plurality of track RA information storage boxes 706 are stored in the storage unit.
[0127]
The box header section 705 of the RA information storage box 704 has a field called box size for storing the size information of the RA information storage box 704 and a character string indicating the type of the RA information storage box 704, for example, "mfra". At least a box type field for storing a character string is included. The box header section 705 includes a field for storing version flag information indicating the version and flag information of the RA information storage box 704 and information indicating the number of track RA information storage boxes 706 included in the box. Is also good. Note that each of these fields is assigned, for example, 4 bytes.
[0128]
The track RA information storage box 706 is a box for storing RA information for each track, such as a moving image track RA information storage box. Like the other boxes of the MP4 file 700, the box RA section 707 and the box data storage section In this box data storage section, a track ID 708, the number of sample flags 709 included in a box, and a plurality of pieces of RA information are stored.
[0129]
The box header section 707 of the track RA information storage box 706 includes a box size field for storing the size information of the track RA information storage box 706 and a character string indicating the type of the box of the track RA information storage box 706, for example. At least a box type field that stores a character string “tfra” is included.
[0130]
The box data storage section of the track RA information storage box 706 includes a track ID 708 field indicating which track the RA information is stored in, and a box indicating the number of RA information included in the track RA information storage box 706. 709, and a field constituting RA information.
[0131]
Note that the field of the track ID 708 and the number of sample flags 709 included in the box may be stored in the box header section 707, and version flag information on the track RA information storage box 706 is stored in the box header section 707. You may.
[0132]
The fields constituting the RA information have the same configuration as in the first and second embodiments, and the allocated bytes have a fixed length. On the other hand, each field in the track RA information storage box 706 other than the fields constituting the RA information is assigned, for example, 4 bytes.
[0133]
Here, a processing method of random access reproduction by the image data reproducing apparatus 600 will be described with reference to FIGS.
FIG. 14A is a diagram for explaining a first processing method of random access reproduction by the image data reproducing device 600 according to the third embodiment, and FIG. 15 is an image based on FIG. It is a flowchart which shows the processing procedure of a data reproduction apparatus.
[0134]
First, as shown in FIG. 15, when receiving a random access instruction from the user (S50), the reproduction position control unit 607 of the image data reproduction apparatus 600 reads the RA information storage box from the RA information storage box generation unit 606. (S51).
[0135]
At this time, if there is no RA information storage box in the RA information storage box generation unit 606, that is, in case 1 shown in FIG. 14A, the reproduction position control unit 607 determines the RA information for all the tracks included in the MP4 file. It is determined that the information is not included. Therefore, the reproduction position control unit 607 outputs an instruction to move the reproduction position by the high-speed reproduction to the data file analysis unit 603 (S57). Here, the movement of the playback position by the high-speed playback means that the header information of the MP4 file is analyzed at a speed higher than the normal playback speed, and the frame information is decoded one by one, similarly to the conventional playback position movement. This refers to counting the playback continuation time and moving to a frame serving as a playback start position after random access.
[0136]
After that, the data file analysis unit 603 outputs decoding instruction information relating to the reproduction position after the movement to the data decoding unit 604, and the data reproduction unit 605 reproduces the entity data decoded by the data decoding unit 604. (S58). However, in this case, since the reproduction position after the movement is not always an intra frame, it cannot be guaranteed that the data reproduction after the movement can be correctly decoded. Note that, in order to avoid inaccurate decoding, the operation of random access may be abandoned and the normal reproduction speed may be maintained.
[0137]
On the other hand, if the RA information storage box generation unit 606 has an RA information storage box, the playback position control unit 607 attempts to read the track RA information storage box included in the RA information storage box (S52).
At this time, when there is no track RA information storage box, that is, in case 2 shown in FIG. 14A, the reproduction position control unit 607 determines that RA information regarding the track is not included. Therefore, the reproduction position control unit 607 outputs an instruction to move the reproduction position by the high-speed reproduction to the data file analysis unit 603 (S57).
[0138]
After that, the data file analysis unit 603 outputs decoding instruction information relating to the reproduction position after the movement to the data decoding unit 604, and the data reproduction unit 605 reproduces the entity data decoded by the data decoding unit 604. (S58).
On the other hand, if there is a track RA information storage box, the reproduction position control unit 607 attempts to read entry information included in the track RA information storage box (S53).
[0139]
Here, when there is no entry information, that is, in case 3 shown in FIG. 14A, the reproduction position control unit 607 determines that all samples can be randomly accessed with respect to the track. Therefore, the reproduction position control unit 607 outputs a reproduction position moving instruction to the data file analysis unit 603 in order to set the nearest sample at the designated time in the random access instruction as the reproduction start position (S55). Then, the data file analysis unit 603 counts the reproduction continuation time of the frame included in the header information of the MP4 file, sets the sample closest to the specified time of the random access instruction as the moved reproduction position (S56), and sets the decoding instruction. The information is output to the data decoding unit 604.
[0140]
After that, the data decoding unit 604 decodes the substantial data, and the data reproducing unit 605 reproduces the decrypted substantial data (S58). In this case, since all the samples can be randomly accessed at the playback position after the movement, it is possible to obtain a guarantee that the data playback after the movement can be correctly decoded.
[0141]
On the other hand, when there is entry information, that is, in case 4 shown in FIG. 14A, the reproduction position control unit 607 determines that the sample indicated in the entry information can be randomly accessed. Therefore, the playback position control unit 607 searches the track RA information storage box for entry information that matches the designated time of the random access instruction, determines a playback start position after random access, and analyzes the data file analysis unit 603. The position indication information is output (S54).
[0142]
After that, the data file analysis unit 603 outputs the decoding instruction information to the data decoding unit 604 based on the analysis position instruction information, and the data reproduction unit 605 reproduces the entity data decoded by the data decoding unit 604 ( S58).
[0143]
As a specific example corresponding to Case 3 shown in FIG. 14A, when random access is possible from any sample such as an audio track, entry information is not stored in the track RA information storage box. There is a case where the size of the RA information storage box is reduced. Further, as a specific example corresponding to cases 1 and 2 shown in FIG. 14A, a case where a restriction is set to prohibit reading during the generation of the RA information storage box can be considered. In this case, the playback position control unit 607 outputs an instruction to move the playback position by high-speed playback to the data file analysis unit 603 (S57), but may not perform the random access without outputting the movement instruction. . Then, after the generation of the RA information storage box is completed, a random access instruction may be received.
[0144]
FIG. 14B is a diagram for explaining a second processing method of random access reproduction by the image data reproduction device 600 according to the third embodiment.
This second processing method is different from the first processing method shown in FIG. 14A in the handling by the playback position control unit 607 in case 2 and case 3.
[0145]
In case 2 shown in FIG. 14B, the reproduction position control unit 607 determines that all the samples can be randomly accessed. Therefore, the reproduction position control unit 607 outputs a reproduction position movement instruction to the data file analysis unit 603 so that the nearest sample at the designated time in the random access instruction is set as the reproduction start position.
[0146]
In case 3 shown in FIG. 14B, the playback position control unit 607 determines that all samples cannot be randomly accessed for that track or that playback can be performed only from the sample located at the beginning of the file. to decide. For this reason, the reproduction position control unit 607 does not accept any input of a random access instruction from the user, for example, or accepts an input of a random access instruction from the user only when moving to the beginning of the file. Only the output of the instruction to move the reproduction position to the data file analysis unit 603 is performed.
[0147]
As described above, in the random access reproduction processing method, the image data reproducing apparatus 600 can change the processing procedure according to the presence or absence of the RA information storage box or the like. Can be set freely. Further, even if there is a trouble such as the inability to extract RA information from the RA information storage box, it is possible to flexibly cope with the trouble.
[0148]
As described above, according to the third embodiment, the image data reproducing apparatus can generate and output a box for storing RA information for each track and a box for storing the boxes collectively. Therefore, it is possible to contribute to speeding up random access reproduction. Further, since random access is performed using RA information stored in the box, quick random access reproduction can be realized.
[0149]
(Embodiment 4)
Next, a fourth embodiment of the present invention will be described.
In the third embodiment, the description has been given of the image data reproducing apparatus that outputs the new MP4 file by adding the RA information storage box to the end of the MP4 file.
[0150]
On the other hand, the image data reproducing apparatus according to the fourth embodiment further outputs an MP4 file including information for facilitating access to the RA information storage box. Therefore, the MP4 file output by the image data reproducing apparatus according to the fourth embodiment has a different structure from the MP4 file output by the image data reproducing apparatus according to the third embodiment. Hereinafter, the different point will be mainly described. Note that the components of the image data reproducing apparatus according to the fourth embodiment are substantially the same as those of the image data reproducing apparatus according to the third embodiment, and therefore a block diagram of the apparatus is shown in FIG. .
[0151]
FIG. 16 is a diagram showing a file structure of an MP4 file generated by the image data reproducing device according to the fourth embodiment.
The MP4 file 710 includes a movie box 711, a movie data box 712, a movie fragment string 713, and an RA information storage box 714. This point is common to the MP4 file 700 in the third embodiment, but differs from the MP4 file 700 in that the RA information storage box 714 includes an RA information storage offset box 717.
[0152]
It should be noted that the MP4 file 710 also has the same configuration as that of the conventional MP4 file 100 at the stage of being loaded into the image data reproducing apparatus.
The RA information storage offset box 717 is a box for storing the offset information of the RA information storage box indicating the number of bytes from the start or end of the MP4 file 710 that the RA information storage box 714 starts. Like the other boxes to be configured, the box includes a box header section and a box data storage section.
[0153]
The box header portion of the RA information storage offset box 717 includes a box size 718 indicating size information of the box and a box type storing a character string “mfro” as a character string indicating the type of the box. 719, and each field is assigned, for example, 4 bytes.
[0154]
Further, the box data storage section of the RA information storage offset box 717 includes a field of RA information storage box offset information 717a for describing the offset information of the RA information storage box. Assigned. By using the offset information 717a as the size information of the RA information storage box 714, the image data reproducing apparatus can easily read the RA information storage box 714 from the end of the MP4 file 710 by reading back to the offset information 717a. You will be able to access it.
[0155]
For example, when the RA information storage box generation unit 606 generates the RA information storage box 714, the outline of the box is first generated, and the RA information storage box 714 is generated in the file output unit 608. When it is added to the end of the input completion MP4 file, it is generated by describing information in a field inside the box.
[0156]
Note that the RA information storage offset box 717 may include a field indicating box version information and the like following the field of the box type 719, but in the fourth embodiment, the box size 718 and the box type 719 and offset information 717a, and has a fixed size of 12 bytes in total.
[0157]
Here, a procedure in which the image data reproducing device according to the fourth embodiment acquires RA information will be described.
FIG. 17 is a flowchart showing a procedure for acquiring RA information by the image data reproducing device according to the fourth embodiment.
[0158]
In addition to obtaining the RA information, the image data reproducing apparatus usually sequentially obtains information stored in a box located at the head of the MP4 file when reading the MP4 file. On the other hand, the image data reproducing device can also search for the end of the MP4 file and acquire the information stored in the box in order from the end.
[0159]
Since the RA information storage box 714 is located at the end of the MP4 file 710, the image data reproducing apparatus searches for a box in which the offset information of the RA information storage box 714 is stored from the end of the MP4 file (S60). ).
[0160]
Here, when the box storing the offset information, that is, the RA information storage offset box 717 is found and the RA information storage box offset information 717a included in the box is found (S61), the image data reproducing apparatus The read position is moved to the start position of the RA data, that is, the head of the RA information storage box 714 based on the offset information (S62).
[0161]
Here, the image data reproducing device tests whether or not the offset information matches the RA data, that is, tests the validity of the offset information (S62). At this time, the image data reproducing apparatus determines whether or not the file reading position moved by the offset information matches the head position of the RA information storage box 714. This test will be described later in detail with reference to the drawings.
[0162]
When the offset information and the RA data match, the image data reproducing device sequentially acquires the RA data stored in the RA information storage box 714 from the top of the box (S64).
On the other hand, when the RA information storage offset box 717 is not found, or even when the RA information storage offset box 717 is found, the RA information storage box offset information included in the box is not found (S61), or the offset information and the RA data If they do not match (S63), the image data reproducing apparatus sequentially acquires the information stored in the box located at the head of the file by the normal information acquisition method, and reads the information from the RA information storage box 714 from the RA information storage box 714. RA data is obtained (S65).
[0163]
Here, a test regarding the validity of the offset information will be described with reference to the drawings.
FIG. 18A is a diagram for explaining a first acquisition procedure of RA information by the image data reproducing device according to the fourth embodiment.
[0164]
First, the image data reproducing device searches for the end of the MP4 file 710, and acquires information stored in the box in order from the end (S70).
In FIG. 18A, the offset information of “240” bytes is described in the field of the RA information storage box offset information 717a, but at this stage, the number of “240” bytes is the offset information of the RA information storage box. Therefore, the image data reproducing device obtains the information stored in the box further back (S71), and tests whether or not this number is the offset information of the RA information storage box.
[0165]
Here, in the fourth embodiment, since the RA information storage offset box 717 has a fixed size of a total of 12 bytes, the image data reproducing apparatus sets the box at the position 12 bytes back from the end of the MP4 file 710. After confirming that the size information “12” is described in the field of the size 718 and then confirming that the character string “mfro” is described in the field of the box type 719, the following 4 It is determined that the byte field is RA information storage box offset information 717a.
[0166]
That is, at this stage, the image data reproducing apparatus can determine that the information of “240” bytes acquired earlier is the offset information of the RA information storage box.
[0167]
Next, the image data reproducing device moves the reading position to a portion that is 240 bytes ahead of the end of the MP4 file 710 according to the offset information of the RA information storage box of “240” bytes (S72).
[0168]
Then, after moving the reading position, the image data reproducing device acquires information stored in the box toward the end of the MP4 file 710 (S73), and tests the validity of the offset information.
Here, upon acquiring the character string “mfra” described in the field of the box header section 715 of the RA information storage box 714, the image data reproducing device determines that the box being read is the RA information storage box 714. I do.
[0169]
Subsequently, the size information of the box described in the field of the box header portion of the track RA information storage box 716 stored in the RA information storage box 714 is obtained for each track RA information storage box 716. FIG. 18A shows two track RA information storage boxes 716 each having a size of "110" bytes.
[0170]
Then, the image data reproducing apparatus determines the size (“110” bytes + “110” bytes) of all the track RA information storage boxes 716 and the size (“12” bytes) of the RA information storage offset box 717 obtained earlier. , The sum of the byte size (4 bytes + 4 bytes) allocated to the field of the box header section 715 of the RA information storage box 714 is the number of bytes described in the field of the box header section 715 of the RA information storage box 714. It is determined whether it matches the size information ("240" bytes).
[0171]
After such a test, the validity of the offset information is determined. If the test passes the test, the image data reproducing apparatus determines that the offset information is valid and stores the RA in the RA information storage box 714. Information is acquired (S74).
[0172]
By the way, as a place to describe the offset information of the RA information storage box, in addition to the description in the RA information storage offset box 717 as described above, for example, the description is described in a movie box storing the header information of the entire file of the MP4 file. You can also.
[0173]
In this case, the procedure for acquiring random access information by the image data reproducing device is as follows.
FIG. 18B is a diagram for explaining a second acquisition procedure of RA information by the image data reproducing device according to the fourth embodiment.
[0174]
First, the image data reproducing device sequentially acquires information stored in the movie box 721 located at the head of the MP4 file 720 (S80). Here, when the image data reproducing device obtains the information “xxx” bytes described in the field of the RA information storage box offset information 721a stored in the movie box 721 (S81), it starts from the beginning of the MP4 file. The reading position is moved to the “xxx” ”byte (S82).
[0175]
Then, after moving the reading position, the image data reproducing device acquires the information stored in the box toward the end of the MP4 file 720 (S83), and tests the validity of the offset information.
Here, upon acquiring the character string “mfra” described in the field of the box header section 725 of the RA information storage box 724, the image data reproducing device determines that the box being read is the RA information storage box 724. The validity of the offset information is determined.
[0176]
After passing this test, the image data reproducing apparatus determines that the offset information is valid, and obtains the RA information 726 such as the track RA information storage box stored in the RA information storage box 724 (S84).
As described above, the movie box 721 can be used as a location where the offset information of the RA information storage box is described.
[0177]
As described above, according to the fourth embodiment, the image data reproducing apparatus generates and outputs the offset information indicating the start position of the RA information storage box. Can be read quickly, and as a result, quick random access reproduction can be realized.
[0178]
(Application example)
Here, an application example of the image data reproducing apparatus according to the present invention will be described with reference to the drawings.
FIG. 19 is a diagram showing an application example of the image data reproducing device according to the present invention.
The image data reproducing apparatus according to the present invention can be used for an image distribution system or the like that receives or transmits an MP4 file via a communication line such as the Internet.
[0179]
As shown in FIG. 19, the image distribution system includes a server device 801, a network communication network 802, a mobile phone 803, and a personal computer 804.
[0180]
Here, the mobile phone 803 and the personal computer 804 correspond to the image data reproducing device according to the present invention.
That is, the mobile phone 803 and the personal computer 804 download the MP4 file via the network communication network 802 from the server device 801 that distributes the MP4 file in which image data, audio data, and the like are multiplexed.
[0181]
As shown in FIG. 19, the MP4 file reproduced by the personal computer 804 includes multiplexed image data, audio data, and text data, and the personal computer 804 reproduces the MP4 file while downloading it. Then, the moving image being reproduced is displayed on the display screen.
[0182]
At this time, the personal computer 804 sequentially downloads the MP4 file from the beginning, temporarily stores the MP4 file in a memory or a hard disk built in the personal computer 804, and uses a CPU or the like to convert the header information stored in the memory or the like. RA information is generated, and the RA information is integrated to generate an RA information table or RA information storage box.
[0183]
At this time, while the MP4 file is being reproduced, the personal computer 804 holds the header information of the entire file of the MP4 file and the RA information sequentially generated in a memory or the like.
[0184]
Here, for example, when the user performs an operation of sliding the bar 805 located below the screen to the left with a mouse or the like, that is, an operation of returning the playback position to the front, the personal computer 804 holds the data in a memory or the like. Quick random access is performed by referring to the header information of the entire MP4 file and the generated RA information, and the moving image is reproduced from the position of the bar after the slide and displayed on the display screen. be able to.
[0185]
As described above, the image data reproducing apparatus according to the present invention is a device for reading and reproducing a file in which moving image data, audio data, and the like are multiplexed. According to this image data reproducing apparatus, information for quickly performing random access reproduction is generated, and random access reproduction is performed using this information. You can enjoy the statue without stress.
[0186]
It should be noted that, in a case where the personal computer 804 reads an MP4 file already including the RA information storage box from a recording medium such as a CD-ROM and reproduces the MP4 file, the personal computer 804 first reads the MP4 file. A movie box for storing header information of the entire file and an RA information storage box are read in, and during playback of the MP4 file, these boxes are kept in the memory as they are, or a result obtained by analyzing these boxes is obtained. The stored information is stored in a memory or the like. Then, when the personal computer 804 receives a random access instruction from the user, the personal computer 804 refers to these boxes stored in a memory or the like and performs analysis, or analyzes the boxes stored in a memory or the like. By referring to the obtained information, a quick random access is executed as described above.
[0187]
As described above, the image data reproducing apparatus according to the present invention has been described based on the embodiments and the like, but the present invention is not limited to these embodiments and the like.
For example, in each of the above embodiments, the description has been made using the MP4 file as the moving image file input into the image data reproducing apparatus. However, the moving image file may be other than the MP4 file. It may be a stream file or the like.
[0188]
Further, in each of the above embodiments, the capture of the MP4 file into the image data reproducing apparatus is performed by downloading. However, a recording medium such as a magneto-optical disk storing the MP4 file is read and read into the apparatus. It may be taken in.
[0189]
In each of the above embodiments, the RA information storage table or the RA information storage box is added to the end of the MP4 file when it is output integrally with the MP4 file. For example, the RA information table may be stored in the movie box.
[0190]
Further, in each of the above embodiments, the number of bytes allocated to the fields constituting the RA information is assumed to be fixed length. However, in order to flexibly cope with the size of the MP4 file, each field may have a variable length. Good. For example, for the “traf” number, “trun” number, and “entry” number, a field for designating the byte length of these fields is set so that the bit length of the field can be selected from 1 to 4 bytes. In addition to the data structure shown in FIG. 4 and the like, when the size of the MP4 file is large, 2 bytes may be assigned to each field.
[0191]
【The invention's effect】
As is clear from the above description, according to the image data reproducing apparatus of the present invention, at the time of the first file reproduction, information indicating the position of the header information relating to the frame that can be decoded independently, that is, random access information is generated. Therefore, there is an effect that it is possible to realize quick random access reproduction.
[0192]
Further, since the random access information generated at the time of the first file playback is output to a file, it is possible to contribute to speeding up the random access playback at the time of the next file playback.
Furthermore, since the portion in which the random access information is stored can be read quickly, random access reproduction can be executed more quickly.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of an image data reproducing device according to Embodiment 1 of the present invention.
FIG. 2 is a diagram showing a file structure of an MP4 file generated by the image data reproducing device according to the first embodiment of the present invention.
FIG. 3 is a flowchart showing a processing procedure in which the image data reproducing device according to Embodiment 1 of the present invention generates a random access information table.
4A and 4B are diagrams illustrating a random access information table. FIG. 4A is a diagram illustrating the contents of data included in the table, and FIG. 4B is a diagram illustrating a data structure of the table.
FIG. 5 is a diagram showing a file structure of an MP4 file generated by an image data reproducing device according to a first modification of the first embodiment of the present invention.
FIG. 6 is a block diagram showing a configuration of an image data reproducing device according to a second modification of the first embodiment of the present invention.
FIG. 7 is a block diagram illustrating a configuration of an image data reproducing device according to a third modification of the first embodiment of the present invention.
FIG. 8 is a diagram for explaining a relationship between an MP4 file and a random access information table. FIG. 8A is a diagram showing a file generated by the image data reproducing device according to the first embodiment of the present invention. (B) is a diagram showing a file generated by the image data reproducing device according to the second modification of the first embodiment of the present invention, and (c) is a diagram showing a file generated by the image data reproducing device according to the first embodiment of the present invention. FIG. 15 is a diagram showing a file generated by an image data reproducing device according to a third modification.
FIG. 9 is a block diagram showing a configuration of an image data reproducing device according to Embodiment 2 of the present invention.
FIG. 10 is a block diagram showing a configuration of an image data reproducing device according to a first modification of the second embodiment of the present invention.
FIG. 11 is a block diagram showing a configuration of an image data reproducing device according to a second modification of the second embodiment of the present invention.
FIG. 12 is a block diagram showing a configuration of an image data reproducing device according to Embodiment 3 of the present invention.
FIG. 13 is a diagram showing a file structure of an MP4 file generated by the image data reproducing device according to the third embodiment of the present invention.
FIG. 14 is a diagram for explaining a random access process by the image data reproducing device according to the third embodiment of the present invention; FIG. 14A is a diagram for explaining a first processing method; (B) is a figure for explaining the 2nd processing method.
FIG. 15 is a flowchart showing a processing procedure of the image data reproducing apparatus based on FIG.
FIG. 16 is a diagram showing a file structure of an MP4 file generated by an image data reproducing device according to Embodiment 4 of the present invention.
FIG. 17 is a flowchart showing a procedure for acquiring random access information by the image data reproducing apparatus according to Embodiment 4 of the present invention.
FIG. 18 is a diagram for explaining a procedure for acquiring random access information by the image data reproducing apparatus according to Embodiment 4 of the present invention, and FIG. 18A is a diagram for explaining a first acquisition procedure. (B) is a diagram for explaining a second acquisition procedure.
FIG. 19 is a diagram illustrating an application example of the image data reproducing device according to the present invention.
FIG. 20 is a diagram showing a file structure of a conventional MP4 file.
[Explanation of symbols]
100, 300, 320, 330, 400, 700, 710, 720 MP4 files
101, 301, 401, 701, 711, 721 movie box
102, 302, 402, 702, 712, 722 Movie data box
103, 303, 403, 703, 713, 723 Movie fragment sequence
104, 304 movie fragment
105, 305 Movie fragment box
106, 306 Fragment data box
107,307 Truck fragment box
108,308 Truck run box
109,309 entries
110, 317, 411, 705, 707, 715, 725 Box header section
111, 318, 412 box data storage
112, 317a, 411a, 718 Box size
113, 317b, 411b, 719 Box type
200, 200B, 200C, 500, 500A, 500B, 600 Image data reproducing apparatus
201, 211, 221, 501, 511, 521, 601 File input unit
202, 212, 222, 502, 512, 522, 602 Data file temporary storage unit
203, 213, 223, 503, 513, 523, 603 Data file analysis unit
204, 214, 224, 504, 514, 524, 604 Data decoding unit
205, 215, 225, 505, 515, 525, 605 Data reproducing unit
206, 216, 226, 506, 516 RA information table generator
207, 518, 608 File output unit
208, 519, 609 File storage
217, 227 MP4 file output unit
218, 228 MP4 file storage
219, 229 RA information table file output unit
220, 230, 527 RA information table file storage
231 File Information Management Unit
232 management file storage
310 RA information table
311 hours
Start position of 312 moof
313 traf number
314 trun number
315 entry number
316 Start position of data
319 Number of sample flags included in RA information table
321,331 RA information table file
332 Association management file
410 RA information table column
413 Number of RA information tables
414A RA information table for audio track
414M RA information table for video track
414T RA information table for text track
415A, 415M, 708 Track ID
Number of sample flags included in the 416A and 416M tables
417A, 417M RA entry
507, 517, 526, 607 Playback position control unit
606 RA information storage box generation unit
704, 714, 724 RA information storage box
706, 716 Track RA information storage box
709 Number of sample flags included in the box
717 RA information storage offset box
717a, 721a RA information storage box offset information
726 RA information
801 server device
802 network communication network
803 mobile phone
804 personal computer
805 bar

Claims (32)

画像データと、音声データおよびテキストデータのうち少なくとも1つとを多重化してなるファイルを再生する画像データ再生装置であって、
前記ファイルを前記画像データ再生装置に取り込むファイル入力手段と、
前記入力手段が取り込んだ入力ファイルを一時的に記憶するための領域を有するファイル一時記憶手段と、
前記ファイル一時記憶手段に格納されている前記入力ファイルを読み込んで、前記入力ファイルに含まれる前記画像データ、音声データまたはテキストデータの分離および同期再生をするためのファイルヘッダ情報を解析するファイル解析手段と、
前記ファイル解析手段が解析した前記ファイルヘッダ情報に基づいて前記一時記憶手段に格納されている前記入力ファイルに含まれる前記画像データ、音声データまたはテキストデータを読み出して復号する復号手段と、
前記復号手段が復号した前記画像データ、音声データまたはテキストデータを再生して表示装置に出力する再生手段と、
前記ファイル解析手段が解析したファイルヘッダ情報に基づいて、前記入力ファイルに含まれる前記画像データ、音声データまたはテキストデータにランダムアクセスするためのランダムアクセス情報を生成するランダムアクセス情報生成手段と、
前記ランダムアクセス情報生成手段が生成した前記ランダムアクセス情報を参照して、前記入力ファイルの解析位置の変更を指示する解析位置変更指示を前記ファイル解析手段に出力する再生位置制御手段とを備え、
前記ファイル解析手段は、前記再生位置制御手段が出力する前記解析位置変更指示に基づいて、前記ファイル一時記憶手段に格納されている前記入力ファイルの読み込み位置を変更し、前記入力ファイルに含まれる前記画像データ、音声データまたはテキストデータのファイルヘッダ情報を解析する
ことを特徴とする画像データ再生装置。
An image data reproducing apparatus for reproducing a file obtained by multiplexing image data with at least one of audio data and text data,
File input means for loading the file into the image data reproducing device;
File temporary storage means having an area for temporarily storing the input file captured by the input means,
File analysis means for reading the input file stored in the file temporary storage means and analyzing file header information for separating and synchronously reproducing the image data, audio data or text data contained in the input file When,
Decoding means for reading and decoding the image data, audio data or text data contained in the input file stored in the temporary storage means based on the file header information analyzed by the file analysis means,
Reproduction means for reproducing the image data, audio data or text data decoded by the decoding means and outputting the reproduced data to a display device;
Based on the file header information analyzed by the file analysis means, random access information generation means for generating random access information for random access to the image data, audio data or text data included in the input file,
Playback position control means for outputting to the file analysis means an analysis position change instruction for instructing a change in the analysis position of the input file, with reference to the random access information generated by the random access information generation means,
The file analysis unit changes a reading position of the input file stored in the file temporary storage unit based on the analysis position change instruction output by the reproduction position control unit, and includes the read file included in the input file. An image data reproducing apparatus for analyzing file header information of image data, audio data or text data.
前記ランダムアクセス情報は、
前記入力ファイルに含まれる前記画像データのイントラフレームに関する前記ファイルヘッダ情報を読み込むための位置情報である
ことを特徴とする請求項1記載の画像データ再生装置。
The random access information,
2. The image data reproducing apparatus according to claim 1, wherein the position information is position information for reading the file header information relating to an intra frame of the image data included in the input file.
前記ファイルヘッダ情報を読み込むための位置情報は、
前記入力ファイルが階層化された構造であり、階層毎の識別番号が割り当てられている場合に、前記ファイルヘッダ情報の位置を表す前記識別番号である
ことを特徴とする請求項2記載の画像データ再生装置。
The position information for reading the file header information is:
3. The image data according to claim 2, wherein the input file has a hierarchical structure, and when the identification number is assigned to each layer, the input file is the identification number indicating the position of the file header information. Playback device.
前記ランダムアクセス情報は、さらに、
前記イントラフレームの再生時刻に関する情報を含む
ことを特徴とする請求項2記載の画像データ再生装置。
The random access information further includes:
3. The image data reproducing apparatus according to claim 2, further comprising information on a reproduction time of said intra frame.
前記ランダムアクセス情報は、さらに、
前記イントラフレームの開始位置に関する情報を含む
ことを特徴とする請求項2記載の画像データ再生装置。
The random access information further includes:
3. The image data reproducing apparatus according to claim 2, further comprising information on a start position of said intra frame.
前記ランダムアクセス情報は、
前記ファイルヘッダ情報を読み込むための位置情報を複数含んでいる
ことを特徴とする請求項2記載の画像データ再生装置。
The random access information,
3. The image data reproducing apparatus according to claim 2, wherein a plurality of pieces of position information for reading the file header information are included.
前記ランダムアクセス情報生成手段は、
前記入力ファイルに含まれるメディアデータ毎に前記ランダムアクセス情報を生成する
ことを特徴とする請求項1記載の画像データ再生装置。
The random access information generating means,
2. The image data reproducing apparatus according to claim 1, wherein the random access information is generated for each media data included in the input file.
前記ランダムアクセス情報は、
前記入力ファイルに含まれる前記音声データに関するものである場合に、前記音声データのフレームに関する前記ファイルヘッダ情報を読み込むための位置情報を、所定の規則性に従って複数含んでいる
ことを特徴とする請求項7記載の画像データ再生装置。
The random access information,
The method according to claim 1, wherein when the data is related to the audio data included in the input file, a plurality of pieces of position information for reading the file header information related to the frame of the audio data are included in accordance with a predetermined regularity. 8. The image data reproducing device according to 7.
前記ランダムアクセス情報は、
前記入力ファイルに含まれる前記画像データのイントラフレームの再生時刻に直近の再生時刻を有する前記音声データのフレームに関する前記ファイルヘッダ情報を読み込むための位置情報を複数含んでいる
ことを特徴とする請求項8記載の画像データ再生装置。
The random access information,
The image processing apparatus according to claim 1, further comprising: a plurality of position information for reading the file header information regarding a frame of the audio data having a reproduction time closest to a reproduction time of an intra frame of the image data included in the input file. 9. The image data reproducing device according to item 8.
前記画像データ再生装置は、さらに、
前記ランダムアクセス情報生成手段が生成した前記ランダムアクセス情報を含むファイルを出力するファイル出力手段を備える
ことを特徴とする請求項1記載の画像データ再生装置。
The image data reproducing device further includes:
2. The image data reproducing apparatus according to claim 1, further comprising a file output unit that outputs a file including the random access information generated by the random access information generation unit.
前記ランダムアクセス情報生成手段は、
前記入力ファイルが階層化された構造である場合に、前記入力ファイルに含まれるメディアデータ毎に前記ランダムアクセス情報を記述するための第1階層と、前記第1階層を集積させた第2階層とを生成し、
前記ファイル出力手段は、
前記第2階層を前記入力ファイルと一体化させて、前記ランダムアクセス情報を含むファイルを出力する
ことを特徴とする請求項10記載の画像データ再生装置。
The random access information generating means,
When the input file has a hierarchical structure, a first layer for describing the random access information for each media data included in the input file, and a second layer in which the first layer is integrated. Produces
The file output means,
The image data reproducing apparatus according to claim 10, wherein the second hierarchy is integrated with the input file, and a file including the random access information is output.
前記ファイル出力手段は、
前記入力ファイルと一体化された前記第2階層の開始位置を示す位置情報を生成し、当該位置情報を前記入力ファイルと一体化させて、前記ランダムアクセス情報を含むファイルを出力する
ことを特徴とする請求項11記載の画像データ再生装置。
The file output means,
Generating position information indicating a start position of the second layer integrated with the input file, integrating the position information with the input file, and outputting a file including the random access information. The image data reproducing apparatus according to claim 11, wherein
前記第2階層の開始位置を示す位置情報は、
前記第2階層の末尾に記述される
ことを特徴とする請求項12記載の画像データ再生装置。
The position information indicating the start position of the second hierarchy is:
13. The image data reproducing device according to claim 12, wherein the image data reproducing device is described at the end of the second hierarchy.
前記第2階層の開始位置を示す位置情報は、
前記第2階層のバイトサイズである
ことを特徴とする請求項13記載の画像データ再生装置。
The position information indicating the start position of the second hierarchy is:
14. The image data reproducing apparatus according to claim 13, wherein the second layer has a byte size.
前記再生位置制御手段は、
前記第2階層の開始位置を示す位置情報を参照して読み込み位置を移動させ、前記ランダムアクセス情報を取得する
ことを特徴とする請求項14記載の画像データ再生装置。
The reproduction position control means,
15. The image data reproducing device according to claim 14, wherein the random access information is acquired by moving a reading position with reference to position information indicating a start position of the second hierarchy.
前記再生位置制御手段は、
前記第2階層の開始位置を示す位置情報を参照して読み込み位置を移動させ、前記第2階層の開始位置であることを確かめた後に、前記ランダムアクセス情報の取得を行なう
ことを特徴とする請求項15記載の画像データ再生装置。
The reproduction position control means,
The method according to claim 11, wherein the random access information is obtained after moving the reading position with reference to the position information indicating the start position of the second hierarchy, and confirming that the read position is the start position of the second hierarchy. Item 16. The image data reproducing device according to Item 15.
前記第2階層の開始位置を示す位置情報は、
前記ファイルヘッダ情報を記述するためのフィールドに記述される
ことを特徴とする請求項12記載の画像データ再生装置。
The position information indicating the start position of the second hierarchy is:
13. The image data reproducing device according to claim 12, wherein the image data is described in a field for describing the file header information.
前記ファイル出力手段は、
前記第2階層を前記入力ファイルの末尾に配置して、前記入力ファイルと一体化させる
ことを特徴とする請求項11記載の画像データ再生装置。
The file output means,
12. The image data reproducing apparatus according to claim 11, wherein the second layer is arranged at the end of the input file and is integrated with the input file.
前記再生位置制御手段は、
前記入力ファイルに前記第2階層、前記第1階層、および前記ランダムアクセス情報が含まれているか否かを判断し、
前記第2階層が含まれていない場合、または、前記第2階層が含まれており、前記第1階層が含まれていない場合に、前記解析位置変更指示を出力せず、
前記第2階層および前記第1階層が含まれている場合に、前記解析位置変更指示を出力する
ことを特徴とする請求項11記載の画像データ再生装置。
The reproduction position control means,
Determining whether the input file includes the second layer, the first layer, and the random access information;
When the second hierarchy is not included, or when the second hierarchy is included and the first hierarchy is not included, the analysis position change instruction is not output,
The image data reproducing apparatus according to claim 11, wherein the analysis position change instruction is output when the second hierarchy and the first hierarchy are included.
前記ファイル出力手段は、
前記ランダムアクセス情報生成手段が生成した前記ランダムアクセス情報を前記ファイル一時記憶手段に格納されている前記入力ファイルに多重化して、前記ランダムアクセス情報を含むファイルを出力する
ことを特徴とする請求項10記載の画像データ再生装置。
The file output means,
11. The file according to claim 10, wherein the random access information generated by the random access information generating unit is multiplexed with the input file stored in the file temporary storage unit, and a file including the random access information is output. The image data reproducing device according to the above.
前記ファイル出力手段は、
前記ランダムアクセス情報生成手段が生成した前記ランダムアクセス情報を含むファイルと、前記ファイル一時記憶手段に格納されている前記入力ファイルと、前記ランダムアクセス情報を含むファイルと前記入力ファイルとの関連付け情報を含むファイルとを出力する
ことを特徴とする請求項10記載の画像データ再生装置。
The file output means,
A file including the random access information generated by the random access information generating unit, the input file stored in the file temporary storage unit, and association information between the file including the random access information and the input file are included. 11. The image data reproducing apparatus according to claim 10, wherein the apparatus outputs a file.
画像データと、音声データおよびテキストデータのうち少なくとも1つとを多重化してなるファイルを再生する画像データ再生方法であって、
前記ファイルを取り込むファイル入力ステップと、
前記入力ステップにおいて、取り込まれた入力ファイルを一時的に保持するための記憶領域に格納するファイル一時格納ステップと、
前記記憶領域に格納されている前記入力ファイルを読み込んで、前記入力ファイルに含まれる前記画像データ、音声データまたはテキストデータの分離および同期再生をするためのファイルヘッダ情報を解析するファイル解析ステップと、
前記ファイル解析ステップにおいて、解析された前記ファイルヘッダ情報に基づいて前記記憶領域に格納されている前記入力ファイルに含まれる前記画像データ、音声データまたはテキストデータを読み出して復号する復号ステップと、
前記復号ステップにおいて、復号された前記画像データ、音声データまたはテキストデータを再生して表示装置に出力する再生ステップと、
前記ファイル解析ステップにおいて、解析されたファイルヘッダ情報に基づいて、前記入力ファイルに含まれる前記画像データ、音声データまたはテキストデータにランダムアクセスするためのランダムアクセス情報を生成するランダムアクセス情報生成ステップと、
前記ランダムアクセス情報生成ステップにおいて、生成された前記ランダムアクセス情報を参照して、前記入力ファイルの解析位置の変更を指示する解析位置変更指示を前記ファイル解析ステップに出力する再生位置制御ステップとを含み、
前記ファイル解析ステップにおいて、前記再生位置制御ステップにおいて出力される前記解析位置変更指示に基づいて、前記記憶領域に格納されている前記入力ファイルの読み込み位置を変更し、前記入力ファイルに含まれる前記画像データ、音声データまたはテキストデータのファイルヘッダ情報を解析する
ことを特徴とする画像データ再生方法。
An image data reproducing method for reproducing a file obtained by multiplexing image data and at least one of audio data and text data,
A file input step of capturing the file;
In the input step, a file temporary storage step of storing the input file in a storage area for temporarily holding the input file,
A file analysis step of reading the input file stored in the storage area and analyzing file header information for separating and synchronously reproducing the image data, audio data, or text data included in the input file,
In the file analysis step, a decoding step of reading and decoding the image data, audio data or text data included in the input file stored in the storage area based on the analyzed file header information,
A reproducing step of reproducing the decoded image data, audio data or text data and outputting the reproduced data to a display device,
In the file analysis step, based on the analyzed file header information, a random access information generating step of generating random access information for random access to the image data, audio data or text data included in the input file,
A reproduction position control step of outputting to the file analysis step an analysis position change instruction for instructing a change of the analysis position of the input file, with reference to the generated random access information in the random access information generation step. ,
In the file analysis step, a reading position of the input file stored in the storage area is changed based on the analysis position change instruction output in the reproduction position control step, and the image included in the input file is changed. An image data reproducing method characterized by analyzing file header information of data, audio data or text data.
前記画像データ再生方法は、さらに、
前記ランダムアクセス情報ステップにおいて生成された前記ランダムアクセス情報を含むファイルを出力するファイル出力ステップを含む
ことを特徴とする請求項22記載の画像データ再生方法。
The image data reproducing method further includes:
23. The image data reproducing method according to claim 22, further comprising a file output step of outputting a file including the random access information generated in the random access information step.
前記ランダムアクセス情報生成ステップにおいて、
前記入力ファイルが階層化された構造である場合に、前記入力ファイルに含まれるメディアデータ毎に前記ランダムアクセス情報を記述するための第1階層と、前記第1階層を集積させた第2階層とを生成し、
前記ファイル出力ステップにおいて、
前記第2階層を前記入力ファイルと一体化させて、前記ランダムアクセス情報を含むファイルを出力する
ことを特徴とする請求項23記載の画像データ再生方法。
In the random access information generating step,
When the input file has a hierarchical structure, a first layer for describing the random access information for each media data included in the input file, and a second layer in which the first layer is integrated. Produces
In the file output step,
24. The image data reproducing method according to claim 23, wherein the second hierarchy is integrated with the input file to output a file including the random access information.
前記ファイル出力ステップにおいて、
前記入力ファイルと一体化された前記第2階層の開始位置を示す位置情報を生成し、当該位置情報を前記入力ファイルと一体化させて、前記ランダムアクセス情報を含むファイルを出力する
ことを特徴とする請求項24記載の画像データ再生方法。
In the file output step,
Generating position information indicating a start position of the second layer integrated with the input file, integrating the position information with the input file, and outputting a file including the random access information. The image data reproducing method according to claim 24, wherein
前記再生位置制御ステップにおいて、
前記第2階層の開始位置を示す位置情報を参照して読み込み位置を移動させ、前記ランダムアクセス情報を取得する
ことを特徴とする請求項25記載の画像データ再生方法。
In the reproduction position control step,
26. The image data reproducing method according to claim 25, wherein the random access information is acquired by moving a reading position with reference to position information indicating a start position of the second hierarchy.
前記ランダムアクセス情報生成ステップにおいて生成される前記ランダムアクセス情報は、
前記入力ファイルに含まれる前記画像データのイントラフレームに関する前記ファイルヘッダ情報を読み込むための位置情報である
ことを特徴とする請求項22記載の画像データ再生方法。
The random access information generated in the random access information generating step,
23. The image data reproducing method according to claim 22, wherein the position information is position information for reading the file header information relating to an intra frame of the image data included in the input file.
前記ランダムアクセス情報生成ステップにおいて、
前記入力ファイルに含まれるメディアデータ毎に前記ランダムアクセス情報を生成する
ことを特徴とする請求項22記載の画像データ再生方法。
In the random access information generating step,
The method according to claim 22, wherein the random access information is generated for each piece of media data included in the input file.
画像データ再生装置のためのプログラムであって、
画像データと、音声データおよびテキストデータのうち少なくとも1つとを多重化してなるファイルを取り込むファイル入力ステップと、
前記入力ステップにおいて、取り込まれた入力ファイルを一時的に保持するための記憶領域に格納するファイル一時格納ステップと、
前記記憶領域に格納されている前記入力ファイルを読み込んで、前記入力ファイルに含まれる前記画像データ、音声データまたはテキストデータの分離および同期再生をするためのファイルヘッダ情報を解析するファイル解析ステップと、
前記ファイル解析ステップにおいて、解析された前記ファイルヘッダ情報に基づいて前記記憶領域に格納されている前記入力ファイルに含まれる前記画像データ、音声データまたはテキストデータを読み出して復号する復号ステップと、
前記復号ステップにおいて、復号された前記画像データ、音声データまたはテキストデータを再生して表示装置に出力する再生ステップと、
前記ファイル解析ステップにおいて、解析されたファイルヘッダ情報に基づいて、前記入力ファイルに含まれる前記画像データ、音声データまたはテキストデータにランダムアクセスするためのランダムアクセス情報を生成するランダムアクセス情報生成ステップと、
前記ランダムアクセス情報生成ステップにおいて、生成された前記ランダムアクセス情報を参照して、前記入力ファイルの解析位置の変更を指示する解析位置変更指示を前記ファイル解析ステップに出力する再生位置制御ステップとを含み、
前記ファイル解析ステップにおいて、前記再生位置制御ステップにおいて出力される前記解析位置変更指示に基づいて、前記記憶領域に格納されている前記入力ファイルの読み込み位置を変更し、前記入力ファイルに含まれる前記画像データ、音声データまたはテキストデータのファイルヘッダ情報を解析する画像データ再生方法における各ステップをコンピュータに実行させる
ことを特徴とするプログラム。
A program for an image data reproducing device,
A file input step of capturing a file obtained by multiplexing image data, at least one of audio data and text data,
In the input step, a file temporary storage step of storing the input file in a storage area for temporarily holding the input file,
A file analysis step of reading the input file stored in the storage area and analyzing file header information for separating and synchronously reproducing the image data, audio data, or text data included in the input file,
In the file analysis step, a decoding step of reading and decoding the image data, audio data or text data included in the input file stored in the storage area based on the analyzed file header information,
A reproducing step of reproducing the decoded image data, audio data or text data and outputting the reproduced data to a display device,
In the file analysis step, based on the analyzed file header information, a random access information generating step of generating random access information for random access to the image data, audio data or text data included in the input file,
A reproduction position control step of outputting to the file analysis step an analysis position change instruction for instructing a change of the analysis position of the input file, with reference to the generated random access information in the random access information generation step. ,
In the file analysis step, a reading position of the input file stored in the storage area is changed based on the analysis position change instruction output in the reproduction position control step, and the image included in the input file is changed. A program for causing a computer to execute each step in an image data reproducing method for analyzing file header information of data, audio data, or text data.
ファイルが記録されたコンピュータに読み取り可能な記録媒体であって、
前記ファイルには、
画像データ、音声データまたはテキストデータのうち少なくとも1つのメディアデータと、
前記メディアデータの分離および同期再生をするためのヘッダ情報と、
前記メディアデータを構成するフレームのうち、単独で復号化可能なフレームに関するヘッダ情報の位置情報を集積したランダムアクセス情報とが含まれている
ことを特徴とする記録媒体。
A computer-readable recording medium on which the file is recorded,
The file contains
At least one media data of image data, audio data or text data,
Header information for separating and synchronously reproducing the media data;
A recording medium characterized by including random access information in which position information of header information relating to a frame that can be independently decoded among frames constituting the media data is integrated.
前記ファイルには、さらに、
2以上の前記メディアデータと、
夫々の前記メディアデータに夫々対応する前記ランダムアクセス情報とが含まれている
ことを特徴とする請求項30記載の記録媒体。
The file further includes:
Two or more of the media data;
31. The recording medium according to claim 30, wherein each piece of said media data includes said corresponding random access information.
前記ファイルは、階層化された構造を有し、
前記ファイルには、前記メディアデータ毎の前記ランダムアクセス情報を記述するための第1階層と、前記第1階層を集積させた第2階層とが含まれており、
前記ファイルには、さらに、
前記第2階層の開始位置を示す位置情報が含まれている
ことを特徴とする請求項31記載の記録媒体。
The file has a hierarchical structure,
The file includes a first layer for describing the random access information for each of the media data, and a second layer obtained by integrating the first layer.
The file further includes:
32. The recording medium according to claim 31, wherein position information indicating a start position of the second hierarchy is included.
JP2003130811A 2002-05-28 2003-05-08 Image data reproducing apparatus Withdrawn JP2004201266A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003130811A JP2004201266A (en) 2002-05-28 2003-05-08 Image data reproducing apparatus

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2002154345 2002-05-28
JP2002201989 2002-07-10
JP2002201990 2002-07-10
JP2002306072 2002-10-21
JP2003130811A JP2004201266A (en) 2002-05-28 2003-05-08 Image data reproducing apparatus

Publications (1)

Publication Number Publication Date
JP2004201266A true JP2004201266A (en) 2004-07-15

Family

ID=32777284

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003130811A Withdrawn JP2004201266A (en) 2002-05-28 2003-05-08 Image data reproducing apparatus

Country Status (1)

Country Link
JP (1) JP2004201266A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007166553A (en) * 2005-12-16 2007-06-28 Canon Inc Moving image processing apparatus and moving image processing method
JP2009296365A (en) * 2008-06-05 2009-12-17 Toshiba Corp Video recording and playback equipment, video recording method, and video playback method
JPWO2008126311A1 (en) * 2007-03-30 2010-07-22 富士通株式会社 Video recording method and information processing apparatus
JP2012175608A (en) * 2011-02-24 2012-09-10 Nec Personal Computers Ltd Converter, information distribution device, communication system, control method, and program
JP2013034226A (en) * 2012-09-26 2013-02-14 Canon Inc Information transmitter and control method and program of the same
JP2013051607A (en) * 2011-08-31 2013-03-14 Canon Inc Data processing apparatus, method and control program
JP2013523031A (en) * 2010-05-13 2013-06-13 ゼットティーイー コーポレーション Method and broadcasting apparatus for realizing high-speed response to control process of multimedia file

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007166553A (en) * 2005-12-16 2007-06-28 Canon Inc Moving image processing apparatus and moving image processing method
JP4724551B2 (en) * 2005-12-16 2011-07-13 キヤノン株式会社 Moving image processing apparatus and moving image processing method
JPWO2008126311A1 (en) * 2007-03-30 2010-07-22 富士通株式会社 Video recording method and information processing apparatus
JP4985766B2 (en) * 2007-03-30 2012-07-25 富士通株式会社 Video recording method and information processing apparatus
JP2009296365A (en) * 2008-06-05 2009-12-17 Toshiba Corp Video recording and playback equipment, video recording method, and video playback method
JP4679609B2 (en) * 2008-06-05 2011-04-27 株式会社東芝 Video recording / reproducing apparatus, video recording method and video reproducing method
US8260114B2 (en) 2008-06-05 2012-09-04 Kabushiki Kaisha Toshiba Video recording and playback equipment, video recording method, video playback method, and video recording and playback method
JP2013523031A (en) * 2010-05-13 2013-06-13 ゼットティーイー コーポレーション Method and broadcasting apparatus for realizing high-speed response to control process of multimedia file
KR101408021B1 (en) * 2010-05-13 2014-06-17 지티이 코포레이션 Method and playing device for realizing fast response in multimedia file control process
JP2012175608A (en) * 2011-02-24 2012-09-10 Nec Personal Computers Ltd Converter, information distribution device, communication system, control method, and program
JP2013051607A (en) * 2011-08-31 2013-03-14 Canon Inc Data processing apparatus, method and control program
JP2013034226A (en) * 2012-09-26 2013-02-14 Canon Inc Information transmitter and control method and program of the same

Similar Documents

Publication Publication Date Title
US7139470B2 (en) Navigation for MPEG streams
KR100750520B1 (en) Encoded stream generating device and method, data transmission system and method, and editing system and method
KR20050013050A (en) Moving picture data reproducing device
KR100729224B1 (en) Exteneded Multimedia File Structure and Multimedia File Producting Method and Multimedia File Executing Method
US7228055B2 (en) Recording apparatus, video camera and computer program
EP1758402A1 (en) Mobile Terminal MP4 download with segmentation and reassembly due to limited memory.
US8050539B2 (en) Data recording/reproducing apparatus and method
US7558296B2 (en) Multiplexer and demultiplexer
JP2005229587A (en) Multiplex system conversion device
JP2011103688A (en) Reproducing method
US20080104123A1 (en) Data structure of metadata and reproduction method of the same
EP2012322A1 (en) Recording/reproducing apparatus, recording apparatus, reproducing apparatus, recording method, reproducing method and computer program
KR100901921B1 (en) Method for recording of program data, recording medium stored thereon a computer program product for performing the method and digital audio or video recorder
KR101432994B1 (en) Method for creating and reproducing media metadata based on media object and apparatus thereof
JP2004201266A (en) Image data reproducing apparatus
JP2004282703A (en) Data processor
JP5094993B2 (en) REPRODUCTION DEVICE, REPRODUCTION METHOD, AND SYSTEM INTEGRATED CIRCUIT
JP2007267144A (en) Method for distributing information, server device and program
JP3581085B2 (en) Secondary content generation system and method, and recording medium recording secondary content generation program
JP4114868B2 (en) Multiplexer and multiplexing method
JP4280701B2 (en) Data file editing method and apparatus, control program, and storage medium
JP2004096474A (en) Reproducing method and system of moving picture data
JPWO2010134479A1 (en) Movie display device
KR101275555B1 (en) Method and apparatus for reproducing multi media, and multi-media file format thereof
JP2010086615A (en) Multiplexing device, program, and multiplexing method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060131

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20060908