JP4040343B2 - 動画像処理装置 - Google Patents
動画像処理装置 Download PDFInfo
- Publication number
- JP4040343B2 JP4040343B2 JP2002092334A JP2002092334A JP4040343B2 JP 4040343 B2 JP4040343 B2 JP 4040343B2 JP 2002092334 A JP2002092334 A JP 2002092334A JP 2002092334 A JP2002092334 A JP 2002092334A JP 4040343 B2 JP4040343 B2 JP 4040343B2
- Authority
- JP
- Japan
- Prior art keywords
- key frame
- information
- moving image
- file
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
【発明の属する技術分野】
本発明は、フレーム内予測符号化により生成されたキーフレームとフレーム間予測符号化により生成された非キーフレームから成る動画像符号化情報を所定のファイル形式で記録する動画像処理装置に係わり、詳しくは、ファイル中に格納されたキーフレームを指定するインデックスを作成する機能の改良に関する。
【0002】
【従来の技術】
動画像処理機能を有する装置の1つとして、例えば、カメラから入力される動画像情報を符号化して動画像符号化情報を生成する一方、マイクから入力された音声信号を符号化して音声符号化情報を生成し、これら動画像符号化情報と音声符号化情報を多重化して記録する動画像記録装置が知られている。
【0003】
この種の装置では、動画像情報及び音声信号の符号化に際し、MPEG−4の圧縮技術を用いたものがある。
【0004】
現在、ISO(International Organisation for Standard)において標準化されているMPEG−4動画圧縮技術では、画像を時系列に圧縮し、高能率圧縮符号化方法を提供している。
【0005】
MPEG−4の動画像を構成する画像は、Iピクチャ(キーフレームともいう)、Pピクチャ、Bピクチャの3種類に分類することができる。
【0006】
Iピクチャは、Intra符号化画像、すなわち、フレーム内符号化画像であり、フレーム間予測を用いずに画像の全てがイントラ符号化されている画像である。
【0007】
Pピクチャは、Predictive符号化画像、すなわち、フレーム間順方向予測符号化画像であり、IまたはPピクチャからの予測を行なうことによって画像が構成されている。
【0008】
Bピクチャは、Bidirectionally Predictive符号化情報、すなわち、双方向予測符号化画像であり、順方向フレーム間予測符号と逆方向フレーム間予測符号と内挿的フレーム間予測符号とから画面が構成されている。
【0009】
上述したMPEG−4の動画圧縮技術により生成された動画像符号化ストリームを、蓄積メディアに保存する場合、一般的に音声符号化ストリームと多重し、一つのファイルとして保存する。
【0010】
具体的なファイルフォーマットの例として、MPEG−4ファイルフォーマット(以下、MP4という)などがある。MP4は、MPEG−4のシステムの一部として規格化されている。
【0011】
一方、蓄積メディアに蓄積されたファイルを再生する場合、ユーザはランダムアクセス機能を要求し、この要求に従い、ファイル中に記録された動画像符号化ストリームの中の任意の動画像にアクセスして当該動画像から順に再生を開始する。
【0012】
しかしながら、上述したようにMPEG−4動画像符号化ストリームはIピクチャ、Pピクチャ、Bピクチャから構成されており、任意の動画像にアクセスしても初めから完全な画像が復号されない可能性がある。
【0013】
すなわち、ユーザがファイルにランダムアクセスした時、Iピクチャの位置から再生を開始すれば、Iピクチャはフレーム内符号化画像であり、それ自体のみで完全な1枚の画像を復号することができるので、問題なく再生することができる。
【0014】
しかし、ユーザがランダムアクセスした時にPピクチャ若しくはBピクチャの位置から再生を開始しようとすると、これらは予測符号化画像であるため、構成する画面を復号するためにはそのフレーム以前のフレーム情報が必要となり、完全な画像が復号されないことになり、画面には乱れた動画像が表示されることとなる。
【0015】
このような状況の回避策として、ユーザがランダムアクセスした時にPピクチャ若しくはBピクチャにアクセスしようとした時、自動的にその直前のIピクチャから復号を開始させるようにする方法がある。このような方法を適用することで、乱れた動画像を表示させることなくランダムアクセス時の再生を開始することができる。
【0016】
上述したMP4ファイル形式に従った動画像記録機能を有する従来の動画像記録装置においても、このような対策が施されている。
【0017】
具体的には、MP4のヘッダには、全てのフレームの位置がファイルの先頭からのオフセットのバイト数と、Iピクチャのフレーム番号が列挙されている。
【0018】
勿論、MP4のヘッダ情報は上述した2つの情報(オフセットのバイト数、Iピクチャのフレーム番号)の他に様々な情報が含まれるが、最低限、これら2つの情報を利用することで上述したランダムアクセス機能を実現している。
【0019】
例えば、フレーム数がNの動画像の場合、オフセット値を利用して以下のような方法によりランダムアクセス再生に対応できる。ここで、キーフレームはフレーム番号0番から10フレーム毎に0,10,20,…というように挿入されているものとする。また、フレームのファイル先頭からのオフセットは、Pn(0≦n<N)とする。
【0020】
この場合、ユーザがx番目のフレームにランダムアクセスすると仮定すると、Iピクチャが列挙されているテーブルからxよりも小さい値を検索する。この検索の結果、x´がx番目のフレームの直前のIピクチャとなる。
【0021】
次に、x´のファイル中の位置をMP4ヘッダから求めることで所定のフレームx´からアクセスすることができる。
【0022】
しかしながら、かかる従来の動画像記録装置では、MP4ヘッダにIピクチャのフレーム番号を列挙する必要があるため、フレーム数が増大するにつれてIピクチャのフレーム番号の列挙する数も増えることになる。
【0023】
従って、ヘッダの処理(Iピクチャのフレーム番号の列挙)に関するオーバヘッドが増大し、かつIピクチャのフレーム番号を列挙するテーブルがフレーム数に合わせて可変長になるため、処理が複雑になっていた。
【0024】
【発明が解決しようとする課題】
このように、キーフレーム(Iピクチャ)と非キーフレーム(PおよびBピクチャ)から成る動画像符号化情報を1つのファイルとして記録する従来の動画像記録装置では、ファイル中に格納されたキーフレームのインデックス情報(例えば、フレーム番号)を格納するインデックス領域(MP4ヘッダ)が可変長であったため、フレーム数が増大するにつれてキーフレームのインデックス情報をインデックス領域に列挙する数も増え、該インデックス領域へのインデックス情報の書き込みに関するオーバヘッドが増大するという問題点があった。
【0025】
また、キーフレームのインデックス情報を列挙するインデックス領域がフレーム数に合わせて可変長になるため、処理が複雑になるという問題点があった。
【0026】
本発明は上記問題点を除去し、キーフレームのインデックス情報を列挙するインデックス領域のオーバヘッド増大を抑えると共に、キーフレームの数が増えるに従ってインデックス領域が増大することを防止しつつ管理の簡略化も図れる動画像処理装置を提供することを目的とする。
【0027】
【課題を解決するための手段】
上記目的を達成するために、請求項1記載の発明は、フレーム内予測符号化により生成されたキーフレームとフレーム間予測符号化により生成された非キーフレームが時系列で混在する動画像符号化情報を所定のファイル形式で記録する際、前記ファイル中に格納されたキーフレームを指定するインデックスを作成する動画像処理装置において、前記動画像符号化情報の記録時、ファイル展開用メモリに前記ファイル形式に従った固定長のインデックス領域を確保し、該ファイルに前記キーフレームが格納される毎に前記インデックス領域の空き領域に当該キーフレームを指定するためのキーフレーム情報を追加書き込みする書込み処理手段と、前記キーフレーム情報を新たに書込むことにより前記インデックス領域が記憶許容量を超えると判断された場合、該インデックス領域に既に記憶されているキーフレーム情報を間引いて空き領域を確保する間引き処理手段とを具備することを特徴とする。
【0028】
請求項2記載の発明は、上記請求項1記載の発明において、前記間引き処理手段は、既に記憶されているキーフレーム情報を交互に間引く処理手段から成ることを特徴とする。
【0029】
請求項3記載の発明は、上記請求項1記載の発明において、前記間引き処理手段は、既に記憶されているキーフレーム情報をキーフレームの重要度に応じて間引く処理手段から成ることを特徴とする。
【0030】
請求項4記載の発明は、上記請求項1乃至3のいずれか記載の発明において、前記キーフレーム情報は、該当するキーフレームのサンプル番号であることを特徴とする。
【0031】
請求項5記載の発明は、上記請求項1乃至3のいずれか記載の発明において、前記キーフレーム情報は、該当するキーフレームの再生時刻であることを特徴とする。
【0032】
請求項6記載の発明は、上記請求項1乃至3のいずれか記載の発明において、前記キーフレーム情報は、該当するキーフレームの前記ファイルの先頭からのオフセット位置を示す情報であることを特徴とする。
【0033】
上記請求項1記載の発明によれば、キーフレーム情報を書込むインデックス領域を固定長としておき、インデックス領域が記憶許容量を超えるような場合は、該インデックス領域に既に記憶されているキーフレーム情報を間引いて新たなフレーム情報を追加することができる。これにより、入力するキーフレーム数が増えてもインデックス領域に列挙するキーフレーム情報数を増大させずに済み、該インデックス領域へのキーフレーム情報の書き込みに関するオーバヘッドを固定できると共に、インデックス領域を常に固定長に保つことでインデックスの管理も簡略化できる。
【0034】
上記請求項2記載の発明によれば、インデックス領域が記憶許容量を超える場合、既に記憶されているキーフレーム情報を交互に間引くため、記録後のキーフレーム情報のインデックスとしての間隔をほぼ均等に保つことができ、該キーフレーム情報にランダムアクセスして再生する場合にもアクセス間隔の偏りを小さくできる。
【0035】
上記請求項3記載の発明によれば、既に記憶されているキーフレーム情報をキーフレームの重要度に応じて間引くため、例えばテレビ画像を記録する場合に、コマーシャル直後のキーフレームや、シーンチェンジ時のキーフレーム等を最も高い優先度とすることで、これら重要な部分から再生するといった使い方が可能になる。
【0036】
上記請求項4記載の発明によれば、キーフレーム情報は、該当するキーフレームのサンプル番号としたため、このサンプル番号を基に該当するキーフレームにアクセスして再生開始できる。
【0037】
上記請求項5記載の発明によれば、キーフレーム情報は、該当するキーフレームの再生時刻としたため、この再生時刻を基に該当するキーフレームにアクセスして再生開始できる。
【0038】
上記請求項6記載の発明によれば、キーフレーム情報は、該当するキーフレームの当該ファイルの先頭からのオフセット位置を示す情報としたため、このオフセット位置を基に該当するキーフレームにアクセスして再生開始できる。
【0039】
【発明の実施の形態】
以下、本発明の実施の形態について添付図面を参照して詳細に説明する。
【0040】
図1は、本発明に係わる動画像処理装置100の全体構成を示すブロック図である。
【0041】
この動画像処理装置100は、音声を音声信号に変換するマイク部101、マイク部101等から入力される音声信号を符号化する音声符号化部102、動画像を撮影して動画像情報を生成するカメラ部103、カメラ部103等から入力された動画像情報を符号化する動画像符号化部104、音声符号化部102から入力される音声符号化情報及び動画像符号化部104から入力される動画像符号化情報を基に所定ファイルフォーマットのファイルを生成するファイル生成部105、ファイル生成部105により生成されるファイルを保持し外部記憶装置150に渡すローカルメモリ106、外部装置から音声信号や動画像情報を入力する際のインタフェースを司る外部インタフェース(I/F)部107、通信路とのインタフェースを司る通信インタフェース(I/F)部108、装置全体の制御を行なう制御部109を具備して構成される。
【0042】
この動画像処理装置100では、例えば、マイク部101から入力する音声信号及びカメラ部103から入力する動画像情報を以下の方法で外部記録装置150に記録する。
【0043】
この場合、マイク部101から入力された音声信号は音声符号化部102により符号化され、音声符号化情報としてファイル生成部105に入力される。この音声符号化部102による音声符号化方法は、例えば、MPEG-4 Audio AACとする。
【0044】
一方、カメラ部103から入力された動画像情報は動画像符号化部104により符号化され、動画像符号化情報としてファイル生成部105に入力される。この動画像符号化部104による動画像符号化方法は、例えば、MPEG-4 Videoとする。
【0045】
ファイル生成部105は、入力されるMPEG−4の音声符号化情報及び動画像符号化情報を基に所定ファイルフォーマット(この例では、MP4)に従ってファイルを生成し、ファイルイメージをローカルメモリ106に展開する。
【0046】
ファイル生成部105によるファイル生成完了後、ローカルメモリ106に展開されたファイルイメージは外部記憶装置150に転送され、記憶される。
【0047】
なお、ここでの説明では、音声信号についてはマイク部101からの入力としているが、これ限らず、ファイルに記録された音声信号を入力したり、外部I/F部107を介して例えばテレビ等の外部装置からの音声信号を入力したり、ネットワークに流れている音声信号を通信I/F部108を介して入力するようにしても良い。
【0048】
また、動画像情報については、カメラ部103からの入力としているが、これ限らず、ファイルに記録された動画像情報を入力したり、外部I/F部107を介して例えばテレビ等の外部装置からの動画像情報を入力したり、ネットワークに流れている動画像情報を通信I/F部108を介して入力するようにしても良い。
【0049】
また、ローカルメモリ106に展開されたファイルイメージの扱いについても、外部記憶装置150に記憶するばかりでなく、制御部109、通信I/F部108を介して他のネットワーク内の装置に転送するようにしても良い。
【0050】
次に、ファイル生成部105におけるファイル生成動作について更に詳しく説明する。
【0051】
上述の如く、この動画像記憶装置100の音声符号化部102では、例えば、マイク部101から入力された音声信号を(MPEG-4 Audio AAC)により符号化して出力し、動画像符号化部104は、例えば、カメラ部103から入力される動画像情報を(MPEG-4 Video)により符号化して出力する。
【0052】
その際、動画像符号化部104では、(MPEG-4 Video)の圧縮符号化方法を採用しているために、カメラ部103から入力する動画像情報を基に、1つのフレーム内の動画像情報だけを用いて符号化されたIピクチャと、前のフレームとの間のフレーム間予測により符号化されたPピクチャと、前後フレームとの間で順方向と逆方向のフレーム間予測手法を用いて符号化されたBピクチャが生成される。
【0053】
一方、上記Iピクチャ、Pピクチャ、Bピクチャが混在して時系列で入力するファイル生成部105では、これら入力情報を基にMP4(MPEG−4のファイルフォーマット)に従って1つのファイルを生成する。
【0054】
このファイル生成処理は、上記MP4ファイルフォーマットに従ったファイルイメージをローカルメモリ106に展開しながら行う。
【0055】
ここで、MP4ファイルフォーマットの構成について、図2を参照して説明する。
【0056】
図2は、ファイル生成部105におけるファイル生成時にローカルメモリ106に展開されるMP4ファイルイメージを示す図である。
【0057】
図2からも分かるように、MP4ファイルフォーマットの構成は、ヘッダ情報を格納するMoovボックス(ヘッダ情報格納部)と、実際の符号化情報を格納するMdatボックス(符号化情報格納部)から構成される。MoovボックスとMdatボックスは、共に、可変長な領域である。
【0058】
また、Moovボックスは、Chunk Offsetボックス(オフセット情報格納テーブル)、Sample Sizeボックス(データサイズ情報格納テーブル)、Time to Sampleボックス(再生時刻情報格納テーブル)、Sync Sampleボックス(サンプル番号情報格納テーブル)などから構成される。
【0059】
ファイル生成部105は、入力する音声符号化情報及び動画像符号化情報を基にファイルを生成する際、ローカルメモリ106内に図2に示すようなMoovボックス領域21及びMdatボックス領域22を確保する。
【0060】
Mdatボックス領域22には、音声符号化情報及び動画像符号化情報が格納される。これら音声符号化情報及び動画像符号化情報のMdatボックス領域22への格納方法は、音声符号化情報及び動画像符号化情報が1フレーム以下に分割されていなければ任意に格納することができる。
【0061】
一方、音声符号化情報及び動画像符号化情報の当該ファイル中の位置や再生時刻であるプレゼンテーション・タイム・スタンプ(PTS)は、Moovボックス領域21に格納される。
【0062】
Moovボックス領域21とMdatボックス領域22は、固定長領域でも可変長領域でも良い。ここでは、説明を簡単にする意味で、Moovボックス領域21とMdatボックス領域22は固定長領域であるものとして以下の説明を続ける。より具体的には、Moovボックス領域21の領域長をM1バイト、Mdatボックス領域22の領域長をM2バイト固定とする。
【0063】
ファイル生成部105は、音声符号化情報と動画像符号化情報の入力を受けると、これら符号化情報のデータ長とMdatボックス領域22の空き領域とを比較し、該符号化情報をMdatボックス領域22に格納可能であると判断された場合、当該符号化情報をMdatボックス領域22に格納する。
【0064】
これと同時に、ファイル生成部105は、該符号化情報の先頭のMdatボックス領域22の先頭アドレスからのオフセットアドレス、データサイズ及びPTSを当該ファイルのMoovボックス領域21に格納する。
【0065】
このうちのオフセットアドレスはChunk Offsetボックス211、上記データサイズはSample Sizeボックス212、上記PTSはTime to Sampleボックス213にそれぞれ格納される。
【0066】
これらの各ボックスは、全て可変長のボックスである。つまり、符号化情報が追加される毎にこれらの各ボックスには対応する各情報が個々に追加格納されることになる。
【0067】
なお、MP4ファイルフォーマットとしてファイルを構築するためには、上記の各ボックス以外に他のボックスも必要となるが、ここでは、本発明のファイル生成機能に関連するボックスのみを示し、他は省略している。
【0068】
さて、ファイル生成部105に入力された符号化情報が動画像符号化情報の場合で、かつ、その動画像符号化情報がキーフレーム(Iピクチャ)の場合、当該ファイルのSync Sampleボックス214には、当該キーフレームのサンプル番号が追加される。
【0069】
ここで、Sync Sampleボックス214は、固定長領域のボックスである。ファイル生成部105は、MP4ファイルフォーマットに従ってローカルメモリ106内にMoovボックス領域21及びMdatボックス領域22を確保する際、該Moovボックス領域21内に固定長サイズのSync Sampleボックス214を確保する。
【0070】
次に、Sync Sampleボックス214の詳しい構成について説明する。
【0071】
図3は、Sync Sampleボックス214のテーブル構成を示す図である。
【0072】
このSync Sampleボックス214は、エントリー数フィールド30とエントリーフィールド40から構成される。
【0073】
エントリーフィールド40には、キーフレームのサンプル番号が順次格納され、エントリー数フィールド30には、上記エントリーフィールド40に格納されるエントリー(キーフレームのサンプル番号)の数が格納される。
【0074】
上述したように、Sync Sampleボックス214は固定長領域のため、この固定長領域の記憶許容エントリー数を超えたエントリー(キーフレームのサンプル番号)を格納することはできない。
【0075】
そこで、この画像処理装置100のファイル生成部105では、Sync Sampleボックス214のエントリーフィールド40が全て埋まった場合には、既にこのエントリーフィールド40に格納されているキーフレームのサンプル番号を幾つか間引いて空き領域を確保することで、更になるエントリの追加を可能にする。
【0076】
このファイル生成部105による間引き処理について具体例を挙げてより詳しく説明する。
【0077】
図4は、ファイル生成部105のエントリー間引き処理に係わるSync Sampleボックス214の格納情報の遷移を示す図である。
【0078】
なお、この例では、Sync Sampleボックス214におけるエントリーフィールド40の記憶許容エントリー数を“10”とする。
【0079】
この条件を満たす固定長サイズのエントリーフィールド40に対して何もキーフレームのサンプル番号が格納されていない状態では、図4(a)に示すように、エントリー数フィールド30には“0”が格納されている。
【0080】
この状態で、キーフレームのサンプル番号例えば“0”が入力されると、図4(b)に示すように、エントリー数フィールド30の値が“1”に更新され、エントリーフィールド40の1番目の領域にはこの時のキーフレームのサンプル番号“0”が格納される。
【0081】
以後、キーフレームのサンプル番号10,20,30,…が順次1つずつ入力されると、エントリー数フィールド30の値が順次1ずつ更新され、エントリーフィールド40の1番目,2番目,3番目,…の領域にはこの時のキーフレームのサンプル番号“10”,“20”,“30”,…が順次格納される。
【0082】
図4(c)は、上記手順に従った格納処理により、エントリーフィールド40の10個の記憶領域が全て埋まった時の格納状態を示している。
【0083】
この状態から、更にキーフレームのサンプル番号“100”が入力されてくると、ファイル生成部105は、まず、エントリーフィールド40の2番目、4番目、6番目、8番目、10番目の領域に既に記憶されているエントリーを削除し、次いで3番目、5番目、7番目、9番目の領域に既に格納されているエントリーを順次上詰めにしたうえで、エントリー数フィールド30の値を“5”に更新する。
【0084】
そのうえで、更に、ファイル生成部105は、図4(d)に示すように、エントリーフィールド40の6番目の領域にこの時のキーフレームのサンプル番号“100”を格納し、これに合わせてエントリー数フィールド30の値を“6”に更新する。
【0085】
これ以後、ファイル生成部105は、上記同様の手順で、入力されるキーフレームのサンプル番号をエントリーフィールド40の空き領域に順次格納し、かつ該格納数に合わせてエントリー数フィールド30の値を順次更新していくと共に、エントリーフィールド40の記憶領域が全て埋まった時には、既にエントリーフィールド40に格納されているエントリーを例えば格納領域順に交互に間引いて空き領域を確保しながら該空き領域へのエントリーの記録処理を続ける。
【0086】
図5は、ファイル生成部105におけるエントリーフィールド40へのキーフレームのサンプル番号追加処理を示すフローチャートである。
【0087】
ファイル生成部105は、ファイルの記録処理が開始されることにより、記録対象の動画像符号化情報を順次入力し(ステップS501)、この入力された動画像情報がキーフレームであるかどうかを判断する(ステップS502)。
【0088】
ここで、動画像符号化情報がキーフレームでないと判断されると(ステップS502NO)、次いでファイル生成部105は、記録処理が終了したかどうかを判断し(ステップS503)、記録処理が終了したと判断された場合(ステップS503YES)は処理を終了し、記録処理が終了していないと判断された場合(ステップS503NO)は、ステップS501に戻り、次の動画像符号化情報を入力する。
【0089】
一方、上記ステップS501で入力された動画像符号化情報がキーフレームであると判断されると(ステップS502YES)、次いでファイル生成部105は、記録開始に先立ち、MP4ファイルフォーマットに従ってローカルメモリ106に確保したMoovボックス領域21とMdatボックス領域22のうち、Moovボックス領域21のSync Sampleボックス214内のエントリーフィールド40にキーフレームのサンプル番号を追加可能かどうかを判断する(ステップS504)。
【0090】
具体的には、Sync Sampleボックス214のエントリー数フィールド30の値を確認し、この値に1を加算することによりエントリーフィールド40の記憶許容エントリー数“10”を超えるかいなか(つまり、キーフレームのサンプル番号を新たに書込むことによりエントリーフィールド40が記憶許容量を超えるかどうか)で上記追加の可否を判断する。
【0091】
ここで、エントリーフィールド40にキーフレームのサンプル番号を新たに追加可能であると判断された場合(ステップS504YES)、新たに入力したキーフレームのサンプル番号をエントリーフィールド40に格納し、かつエントリー数フィールド30の値を更新(ステップS506)した後、ステップS503に戻り、次の動画像符号化情報の入力を続行する。
【0092】
これに対して、エントリーフィールド40にキーフレームのサンプル番号を新たに追加できないと判断された場合(ステップS504NO)、エントリーフィールド40に既に格納されているキーフレームのサンプル番号を適宜間引く処理を行う(ステップS505)。
【0093】
具体的には、例えば、上述したように、既にエントリーフィールド40に格納されているキーフレームのサンプル番号を格納領域順に交互に間引いて空き領域を確保する。
【0094】
この間引き処理が終了した後、エントリーフィールド40にはキーフレームのサンプル番号を記憶できる空き領域が確保されることになる。
【0095】
これにより、ファイル生成部105は、ステップS505でエントリーフィールド40の間引き処理を行った後、ステップS506に進み、新たに入力したキーフレームのサンプル番号をエントリーフィールド40の空き領域に格納し、これに合わせてエントリー数フィールド30の値を更新する。
【0096】
その後、ファイル生成部105はステップS501に戻り、次の動画像符号化情報を入力する。そして、この入力された動画像符号化情報がキーフレームである場合(ステップS502YES)には、該キーフレームを対象として上記一連のサンプル番号追加記録処理(ステップS504→S506若しくはステップS504→S505→S506)を記録終了時(ステップS503YES)まで継続する。
【0097】
以上の処理によりSync Sample214ボックスに格納されたキーフレームのサンプル番号は、該Sync Sampleボックス214を含むファイルのMdatボックス領域22に記憶されたキーフレームをランダムアクセス機能によりアクセスして再生する際のインデックス情報として用いられる。
【0098】
再生動作の一例を挙げると、上記ファイルを外部記憶装置150に記録した後、この外部装置150を動画像再生装置に接続し、該動画像再生装置から上記MP4ファイルをランダムアクセスして再生するといった運用が考えられる。
【0099】
この時、動画像再生装置では、ランダムアクセス機能を用いて、MP4ファイルのSync Sampleボックス214内のエントリーフィールド40に記憶されたキーフレームのサンプル番号を参照して、同ファイルのMdatボックス領域22に格納されたフレーム中のキーフレームにアクセスし、該キーフレームから順に再生を開始させる。
【0100】
このように、本発明の動画像処理装置100では、ファイルに記録された動画像符号化情報をランダムアクセス機能により任意のキーフレームから再生開始させるにあたって、キーフレームを指示するためのキーフレーム情報(インデックス情報)を格納するインデックス領域を固定長とし、該インデックス領域が記憶許容量を超える状況下で新たなキーフレームが入力された場合、既に格納されているキーフレーム情報を適宜間引いて空き領域を確保し、この空き領域に新たなキーフレームに対応するキーフレーム情報を追加するようにしたため、入力するキーフレーム数が増えてもインデックス領域に列挙するキーフレーム情報数を増大させずに済み、該インデックス領域へのキーフレーム情報の書き込みに関するオーバヘッドを固定できると共に、インデックス領域を常に固定長に維持することでインデックスの管理も簡略化できる。
【0101】
ここで、インデックス領域が記憶許容量を超える場合、既に記憶されているキーフレーム情報を交互に間引くようにすれば、記録後のキーフレーム情報のインデックスとしての間隔をほぼ均等に保つことができ、該キーフレーム情報にランダムアクセスして再生する場合にもアクセス間隔の偏りを小さくできる。
【0102】
なお、上記実施例では、キーフレームを指定するためのキーフレーム情報(インデックス情報)をファイルのヘッダ部に付加しているが、当該インデックス情報は必ずしもファイルのヘッダ部にある必要はなく、ファイルの任意の場所にあっても良い。
【0103】
また、MP4ファイルフォーマットとは別のファイルフォーマットの形でインデックス情報を保持するものであっても良い。即ち、MP4ファイルフォーマットに限定せず、同等の機能を実現する別のファイルフォーマットでも同様のことが行える。
【0104】
また、上記実施例では、キーフレームのインデックス情報として、キーフレーム情報の中でも特にキーフレームのサンプル番号を例に挙げたが、インデックス情報はこれに限らず、キーフレームのファイル先頭からのオフセット値や再生時刻などを用いても良い。
【0105】
インデックス情報として上記いずれのキーフレーム情報を用いる場合も、その格納領域(インデックス領域:オフセット値を用いる場合は、図2のChunk Offsetボックス211。再生時刻を用いる場合は、図2のTime to Sampleボックス213)は固定長サイズとし、キーフレーム情報を新たに書込むことによりインデックス領域が記憶許容量を超えると判断された場合、該インデックス領域に既に記憶されているキーフレーム情報を間引いて空き領域を確保する間引き処理を行えば良い。
【0106】
また、インデックス情報の間引き方法も、上記実施例のように格納領域順に交互に間引く処理に限られるものではなく、例えば、キーフレームの重要度に応じ、重要度の低いものから順に対応するキーフレーム情報を間引くようにしても良い。
【0107】
キーフレームの重要度の一例としては、例えば、テレビ番組を録画する時のファイル生成において、コマーシャル(CM)直後のキーフレームや、シーンチェンジ時に相当する部分のキーフレーム等を最も高い優先度とすることが考えられる。
【0108】
これにより、例えば、CM直後のキーフレームを最優先度とした場合、上記録画ファイルを再生する際、CMの直後の重要な内容のIフレームにランダムにアクセスしてそこから再生開始させることができ、重要な内容を見逃さずに済む。
【0109】
この他、本発明は、上記し、且つ図面に示す実施例に限定することなく、その要旨を変更しない範囲内で適宜変形して実施できるものである。
【0110】
【発明の効果】
以上説明したように、本発明によれば、キーフレームを指定するためのキーフレーム情報を書込むインデックス領域を固定長とし、キーフレーム情報を新たに書込むことによりインデックス領域が記憶許容量を超えると判断された場合、該インデックス領域に既に記憶されているキーフレーム情報を間引いて空き領域を確保するようにしたため、入力するキーフレーム数が増えてもインデックス領域に列挙するキーフレーム情報数を増大させずに済み、該インデックス領域へのキーフレーム情報の書き込みに関するオーバヘッドを固定できると共に、インデックス領域を常に固定長に保つことでインデックスの管理も簡略化できる。
【図面の簡単な説明】
【図1】本発明に係わる動画像処理装置の全体構成を示すブロック図。
【図2】ローカルメモリに展開されるMP4ファイルイメージを示す図。
【図3】ファイルヘッダ部のSync Sampleボックスのテーブル構成を示す図。
【図4】エントリー間引き処理に係わるSync Sampleボックスの格納情報の遷移を示す図。
【図5】ファイル生成部でのキーフレームサンプル番号追加処理を示すフローチャート。
【符号の説明】
100 動画像処理装置
101 マイク部
102 音声符号化部
103 カメラ部
104 動画像符号化部
105 ファイル生成部
106 ローカルメモリ
107 外部インタフェース(I/F)部
108 通信インタフェース(I/F)部
109 制御部
150 外部記憶装置
21 Moovボックス領域
211 Chunk Offsetボックス
212 Sample Sizeボックス
213 Time to Sampleボックス
214 Sync Sampleボックス
30 エントリー数フィールド
40 エントリーフィールド
22 Mdatボックス領域
Claims (6)
- フレーム内予測符号化により生成されたキーフレームとフレーム間予測符号化により生成された非キーフレームが時系列で混在する動画像符号化情報を所定のファイル形式で記録する際、前記ファイル中に格納されたキーフレームを指定するインデックスを作成する動画像処理装置において、
前記動画像符号化情報の記録時、ファイル展開用メモリに前記ファイル形式に従った固定長のインデックス領域を確保し、該ファイルに前記キーフレームが格納される毎に前記インデックス領域の空き領域に当該キーフレームを指定するためのキーフレーム情報を追加書き込みする書込み処理手段と、
前記キーフレーム情報を新たに書込むことにより前記インデックス領域が記憶許容量を超えると判断された場合、該インデックス領域に既に記憶されているキーフレーム情報を間引いて空き領域を確保する間引き処理手段と
を具備することを特徴とする動画像処理装置。 - 前記間引き処理手段は、既に記憶されているキーフレーム情報を交互に間引く処理手段から成ることを特徴とする請求項1記載の動画像処理装置。
- 前記間引き処理手段は、既に記憶されているキーフレーム情報をキーフレームの重要度に応じて間引く処理手段から成ることを特徴とする請求項1記載の動画像処理装置。
- 前記キーフレーム情報は、該当するキーフレームのサンプル番号であることを特徴とする請求項1乃至3のいずれか記載の動画像処理装置。
- 前記キーフレーム情報は、該当するキーフレームの再生時刻であることを特徴とする請求項1乃至3のいずれか記載の動画像処理装置。
- 前記キーフレーム情報は、該当するキーフレームの前記ファイルの先頭からのオフセット位置を示す情報であることを特徴とする請求項1乃至3のいずれか記載の動画像処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002092334A JP4040343B2 (ja) | 2002-03-28 | 2002-03-28 | 動画像処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002092334A JP4040343B2 (ja) | 2002-03-28 | 2002-03-28 | 動画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003289495A JP2003289495A (ja) | 2003-10-10 |
JP4040343B2 true JP4040343B2 (ja) | 2008-01-30 |
Family
ID=29237190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002092334A Expired - Fee Related JP4040343B2 (ja) | 2002-03-28 | 2002-03-28 | 動画像処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4040343B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4864460B2 (ja) * | 2004-02-04 | 2012-02-01 | パナソニック株式会社 | 再生装置、再生方法およびプログラム |
JP2006221714A (ja) | 2005-02-09 | 2006-08-24 | Toshiba Corp | 符号化ディジタルオーディオ再生装置 |
KR101162171B1 (ko) * | 2005-09-22 | 2012-07-02 | 엘지전자 주식회사 | 동영상 촬영 기능이 구비된 이동통신 단말기의 동작방법 |
JP5086879B2 (ja) | 2008-04-21 | 2012-11-28 | キヤノン株式会社 | 画像処理装置及びその制御方法及びプログラム |
JP5047080B2 (ja) | 2008-07-03 | 2012-10-10 | キヤノン株式会社 | 画像処理装置及びその制御方法及びプログラム |
JP5210091B2 (ja) | 2008-08-29 | 2013-06-12 | キヤノン株式会社 | 画像処理装置及びその制御方法、撮像装置、プログラム |
JP5111315B2 (ja) | 2008-09-24 | 2013-01-09 | キヤノン株式会社 | 画像処理装置及び画像処理方法及びプログラム |
US8560558B2 (en) | 2010-04-28 | 2013-10-15 | Fujitsu Limited | Computer product, search apparatus, management apparatus, search method, and management method |
-
2002
- 2002-03-28 JP JP2002092334A patent/JP4040343B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2003289495A (ja) | 2003-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4769717B2 (ja) | 画像復号化方法 | |
US6848117B1 (en) | Video-on-demand system capable of performing a high-speed playback at a correct speed | |
US20060050140A1 (en) | Wireless communication terminal and its method for generating moving picture using still image | |
JPH08336111A (ja) | ビデオ・オン・デマンドシステムにおける映像再生位置割り出し方式 | |
JP2008262686A (ja) | 同報通信データを記録するための方法、および、装置 | |
KR20040045893A (ko) | 정보 파일을 이용한 트릭 플레이 | |
KR20040039852A (ko) | 프레임 인덱스를 이용한 트릭 플레이 구현방법 | |
JP5175375B2 (ja) | ストリーミング制約の変更に基づく動的品質調整 | |
KR20060059782A (ko) | 영상신호의 스케일러블 프로그레시브 다운로딩을 지원하는방법 | |
JP4684319B2 (ja) | データ記録方法、データ編集方法およびデータ復号方法、並びにその装置、及び記録媒体 | |
US20100166387A1 (en) | Method and apparatus for playing video data of high bit rate format by a player capable of playing video data of low bit rate format | |
US20080175559A1 (en) | Image process apparatus and method thereof | |
JP4380585B2 (ja) | 映像再生装置 | |
JP2007036495A (ja) | 再生装置、圧縮装置、記録装置及び再生方法 | |
JP4040343B2 (ja) | 動画像処理装置 | |
JP4778428B2 (ja) | メディアファイルの形成方法 | |
US20070133951A1 (en) | Offspeed playback in a video editing system of video data compressed using long groups of pictures | |
JPH08154230A (ja) | 動画符号化データの媒体蓄積方法 | |
KR20020069724A (ko) | 디지털 영상 기록/재생 장치의 영상 데이터 관리방법 | |
JP4145103B2 (ja) | 動画データの再生方法及び再生装置 | |
JP3073948B2 (ja) | ディジタル動画像復号化装置、及びディジタル動画像復号化方法 | |
US9025931B2 (en) | Recording apparatus, recording method, and program | |
JP2007166553A (ja) | 動画像処理装置及び動画像処理方法 | |
JP2007122502A (ja) | フレームバッファ管理プログラム、プログラム記憶媒体、および管理方法。 | |
JP3036579B2 (ja) | Vodシステムにおける特殊再生方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050316 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071107 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101116 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101116 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101116 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111116 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121116 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131116 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |