JP2006074531A - データ記録再生装置及び方法 - Google Patents

データ記録再生装置及び方法 Download PDF

Info

Publication number
JP2006074531A
JP2006074531A JP2004256386A JP2004256386A JP2006074531A JP 2006074531 A JP2006074531 A JP 2006074531A JP 2004256386 A JP2004256386 A JP 2004256386A JP 2004256386 A JP2004256386 A JP 2004256386A JP 2006074531 A JP2006074531 A JP 2006074531A
Authority
JP
Japan
Prior art keywords
data
moving image
key frame
file format
control data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004256386A
Other languages
English (en)
Inventor
Toshiyuki Nakagawa
利之 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004256386A priority Critical patent/JP2006074531A/ja
Priority to US11/219,479 priority patent/US8050539B2/en
Publication of JP2006074531A publication Critical patent/JP2006074531A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/32Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
    • G11B27/327Table of contents
    • G11B27/329Table of contents on a disc [VTOC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

【課題】 ISOベースメディアファイル形式及び類似形式のマルチメディアデータの特殊再生処理の効率化を実現すること。
【解決手段】 マルチメディアデータ中の動画像データ中のキーフレームを特定する情報を再生制御データとして生成し、再生制御データを、マルチメディアデータの所定位置に配置する。特殊再生時には、この再生制御データを用いることで、ランダムアクセス等に用いるキーフレームを容易に特定、読み出して再生することが可能である。再生制御データをマルチメディアデータの、従来機器が無視する領域に配置することで、ファイル互換性も維持することができる。
【選択図】 図3

Description

本発明は、動画像データを含むマルチメディアデータを記録、再生する技術に関し、特に、ISOベースメディアファイル形式又は類似形式を有するマルチメディアデータの特殊再生を効率的に処理するための技術に関する。
近年、携帯電話機やPDA、パーソナルコンピュータ(PC)、その他様々なコンピューティングデバイスの処理能力は格段に向上し、動画像や音声といったマルチメディアデータを容易に取り扱うことが可能になりつつある。
このような動画像や音声を圧縮符号化する技術も進歩し、国際標準規格としてISO(International Organization for Standardization)によって規格化されたMPEG−2方式やMPEG−4方式などが知られている。これらMPEG圧縮符号化方式においては、予測符号化の違いにより、I、P、Bの3種類のピクチャ(VOP)によって画像が構成される。Iピクチャはフレーム内符号化画像、Pピクチャは過去の画像を用いたフレーム間順方向予測符号化画像、Bピクチャは過去と未来の画像を用いた双方向予測符号化画像である。
このうち他のピクチャなしで復号できるのはIピクチャのみである。したがって、ランダムアクセスや早送り等の特殊再生ような前後関係の崩れるような操作は、復号の基準となるIピクチャにアクセスすることにより実現される。
しかしながら、このようなランダムアクセス時のIピクチャへのアクセスは複雑な処理であるため、復号時の処理を効率化し、遅延を小さくすることが望まれる。そこで、MPEG−2方式で圧縮符号化された画像データの記録再生装置において、Iピクチャデータを確実に得て、特殊再生をスムーズに行う手法が提案されている(例えば、特許文献1、特許文献2参照)。
また、ISOでは、メディアの交換、管理、編集を容易にする、柔軟で拡張可能なメディアファイル形式のための基本フォーマットとして、ISOベースメディアファイル形式(ISO Base Media File Format)(以下、単に「ISOファイル形式」と記載)を規格化している(ISO/IEC 14496-12)。
このISOファイル形式をベースとして、特定の符号化形式のデータを記録するために拡張されたファイル形式も規格化されており、MPEG−4方式の動画像・音声符号化データを記録するためのMP4ファイル形式(ISO/IEC 14496-14)や、Motion JPEG 2000ファイル形式(ISO/IEC 15444-3)、AVCファイル形式(ISO/IEC 14496-15)、第3世代移動体通信システムの標準化プロジェクトである3GPPファイル形式(3rd Generation Partnership Project)、3GPPから派生したプロジェクト3GPP2ファイル形式(3rd Generation Partnership Project 2)などが標準化されている。
ISOファイル形式(及びISOファイル形式をベースとする上述のファイル形式)は、Boxと呼ばれる以下のような入れ子型のデータ構造で構成される。
class Box {
unsigned int(32) size;
byte type[4];
byte data[];
};
sizeは、Boxのデータ長を示すフィールドである。
typeは、Boxの種類を示すフィールドで、各Boxに対して割り当てられている4文字(4バイト)の識別子がセットされる。
dataは、Boxが内包するデータの実体であり、内容はtypeによって異なる。尚、Boxは階層構造を持つことができ、一つ以上のBoxを内包することが可能になっているため、dataは他のBoxになることもある。
図1は、ISOファイル形式で定義されているBoxの一覧を示す図である。
図1において、左から6列目までの列は、ISOファイル形式で定義されているBoxの種類と、その包含関係を示す。一番右の列には、該当する行のBoxの説明が示される。
上述したように各Boxには、その種類を識別するための4バイトのtypeが割り当てられており、通常は4文字の英数字で表現される。この4文字のtypeが左6列中に記載されている。以降の説明では、特定のBoxを示すためにこのtypeを用いて表現する。
あるBoxが他のBoxを包含する関係は、列同士の位置関係によって示している。このテーブルでは、ある列のBoxは、その列よりも右側に位置する列で示されるBoxを包含していることを表している。例えば、上から二番目の行で示される'moov'は、'mvhd'、'trak'、'mvex'を含んでいることを意味する。
図2は、ISOファイル形式のデータ構造を単純化して示す図である。
ISOファイル形式のBox構成は通常、図2で示されるように、動画像や音声サンプルの管理情報のような、メディアデータのメタデータを格納するためのmoov201と、動画像や音声のサンプルデータのような実際のメディアデータを格納するmdat202とから構成される。
moov201内には、個々のメディアデータに対応するtrakと呼ばれるBox203が包含される。また、mdat202内のメディアデータは、チャンク(chunk)と呼ばれる動画像や音声の連続する複数サンプルのセットに分割されて格納されており、mdat202のdataフィールドにはチャンクの配列が格納される。なお、このチャンクのサイズや含まれるサンプルの個数には特に制約はなく、環境や状況に応じて任意の大きさやサンプル数を持つチャンクを構成し、格納することが出来る。
このようなISOファイル形式においては、ランダムアクセス(特殊再生)処理用の情報として、ランダムアクセスポイントを特定するためのデータ構造が規定されている。
ランダムアクセスは主にstbl204に含まれている子Boxを使うことによって行われる。
stts(time-to-sample)205は、トラックのサンプルがどの時刻と対応するかを示している。与えられた時刻以前の最初のサンプルを見つけるために、このBoxを使用する。尚、ここではstts205を例に挙げたが、図1のcttsと呼ばれるBoxを使用しても、同様に与えられた時刻以前の最初のサンプルを見つけることが可能である。
しかし、見つかったサンプルはランダムアクセスポイントではないかもしれない為、最も近いランダムアクセスポイントを見つけるには更に以下のBoxを調べる必要がある。
stss(sync sample table)206は、どのサンプルが実際のランダムアクセスポイントであるかを示す。このBoxを使用すると、与えられた時刻以前の最初のサンプル番号を探すことが出来る。stss206が無い場合は、すべてのサンプルがランダムアクセスポイントであることを示しているため、ランダムアクセスは容易になる。
この時点で、ランダムアクセスのために使用すべきサンプル番号を見つけることができた。次に、このサンプル番号がどのチャンクに配置されているかを決定するため、stsc(sample-to-chunk)207を使用する。
更に、そのチャンクがどこで始まるかを解決するためにstco(chunk offset)208を使用する。尚、ここではstcoを例に挙げたが、図1のco64(64bit chunk offeset)と呼ばれるBoxを使用しても、同様にチャンクのオフセット位置を知ることが可能である。
このオフセットから出発し、このチャンク内での目的のサンプルが配置されている位置までの間に存在する各サンプルのサイズをstsz(sample size)209から取得し、サイズの総和を計算する。この総サイズを目的のチャンクオフセット位置に加えた位置が、目的とするサンプルの開始位置となる。
このようにして得られるサンプルの開始位置及びサイズを用いて、mdat202からランダムアクセスに用いるサンプルデータを特定することが可能になる。
特開平11−261964号公報 特開2000−224543号公報
しかしながら、上記特許文献1に提案される方式は、多重化された動画像や音声データとは別に記録した管理ファイルを用いて、高速再生の効率化を実現するための手法であり、例えばコンテンツデータのコピーなどにより、コンテンツと対応する管理ファイルとの関連が壊れると、効率的な高速再生を実現することができなくなるといった問題を有している。
また、上記特許文献2に提案される方式は、MPEG−2方式による画像データの記録再生装置における効率的な特殊再生を実現するための手法であり、ISOベースメディアファイル形式の特殊再生時の処理を効率的に行う手法については言及されていない。
また、ISOファイル形式データの特殊再生を行うためには、上述したようなランダムアクセスポイントを特定するデータ構造を用いた演算処理により、所望のデータへアクセスすることが可能であるが、ヘッダの構成及び関連が複雑であるため、その演算処理にも時間がかかる。
本発明は以上の課題に鑑みて成されたものであり、ISOファイル形式又は類似形式を有するマルチメディアデータの特殊再生に必要なフレーム抽出処理を効率化することを目的とする。
上述の目的を達成するため、例えば本発明のデータ記録装置は、符号化された動画像データから、ランダムアクセス可能なキーフレームを検出するキーフレーム検出手段と、キーフレーム検出手段によって検出されたキーフレームの各々に対し、動画像データ中での時間位置及びデータ位置を特定可能な情報を含む再生制御データを生成する制御データ生成手段と、動画像データと、再生制御データとを含んだマルチメディアデータを生成するマルチメディアデータ生成手段とを有することを特徴とする。
また、上述の目的は、符号化された動画像データと、当動画像データ中に含まれるランダムアクセス可能なキーフレームの時間位置及びデータ位置を特定可能な情報を含む再生制御データを含むマルチメディアデータを再生するためのデータ再生装置であって、特殊再生要求によって指定された再生開始時刻と、再生制御データとから、再生を行うべき動画像データ中のキーフレームを特定するデータ特定手段と、再生制御データを用いて、再生を行うべき動画像データ中のキーフレームのデータを動画像データから読み出す読み出し手段と、読み出したキーフレームデータを復号化し、再生する再生手段とを有することを特徴とする本発明のデータ再生装置によっても達成される。
また、上述の目的は、本発明のデータ記録装置とデータ再生装置とからなるデータ記録再生装置によっても達成される。
また、上述の目的は、コンピュータを本発明のデータ記録装置とデータ再生装置の少なくとも一方として機能させるプログラム及び、当該プログラムを格納したコンピュータ読み取り可能な記録媒体によっても達成される。
また、上述の目的は、符号化された動画像データから、ランダムアクセス可能なキーフレームを検出するキーフレーム検出ステップと、キーフレーム検出手段によって検出されたキーフレームの各々に対し、動画像データ中での時間位置及びデータ位置を特定可能な情報を含む再生制御データを生成する制御データ生成ステップと、動画像データと、再生制御データとを含んだマルチメディアデータを生成するマルチメディアデータ生成ステップとを有することを特徴とするデータ記録方法によっても達成される。
また、上述の目的は、符号化された動画像データと、当動画像データ中に含まれるランダムアクセス可能なキーフレームの時間位置及びデータ位置を特定可能な情報を含む再生制御データを含むマルチメディアデータを再生するためのデータ再生方法であって、特殊再生要求によって指定された再生開始時刻と、再生制御データとから、再生を行うべき動画像データ中のキーフレームを特定するデータ特定ステップと、再生制御データを用いて、再生を行うべき動画像データ中のキーフレームのデータを動画像データから読み出す読み出しステップと、読み出したキーフレームデータを復号化し、再生する再生ステップとを有することを特徴とするデータ再生方法によっても達成される。
このような構成により、本発明によれば、ISOファイル形式又は類似形式を有するマルチメディアデータの特殊再生に必要なフレーム抽出処理を効率化することができる。
以下、添付図面を参照して、本発明をISOファイル形式のデータ構造を記録再生する装置に適用した好適な実施形態に従って詳細に説明する。
なお、本実施形態はコンテンツデータがISOファイル形式である場合について説明するが、ISOファイル形式に限らず、ISOファイル形式をベースとする他のファイル形式、例えば上述したMP4ファイル形式やAVCファイル形式や3GPPファイル形式など、類似のファイル形式およびアーキテクチャを用いるコンテンツデータに対しても、本発明を適用することが可能である。
また、以下に説明する具体的な構成や手法は例示的かつ非限定的なものであり、他の同等物、変形物などを利用可能であることは当業者にとって容易に理解されるであろう。
[第1の実施形態]
(記録装置)
図3は、本発明の一実施形態としてのデータ記録装置の基本構成例を示すと共に、各回路間でのデータの流れを示す図である。
図3に示すように、データ記録装置は、動画像符号化回路300、キーフレーム検出回路301、データ記録回路302、マルチメディアデータ記憶装置303、制御データ生成回路304により構成されている。
図4は、本実施形態のデータ記録装置におけるデータ記録処理の例を説明するフローチャートである。
動画像符号化回路300は、ビデオカメラ等の入力装置や、外部記憶装置から入力された動画像を符号化する(ステップS401)。図3では、これらの入力装置や記憶装置は図示しない。ここで、動画像符号化回路300は、例えば周知のMPEG−4、H.263方式にて動画像を高能率符号化する回路である。
動画像符号化回路300において符号化された動画像データは、データ記録回路302へ入力される。
データ記録回路302は、動画像符号化回路300から入力された符号化された動画像データをサンプル単位でマルチメディアデータ記憶装置303へ記録する(ステップS402)。本実施形態では、ISOファイル形式のデータ構造に基づいて記録するものとする。
ここで、サンプルは通常、ビデオの個々のフレーム、時間的に連続する一連のビデオフレーム、あるいは時間的に連続するオーディオの一部といった単位であるが、本実施形態では簡単のため動画像の個々のフレームを1サンプルとして説明する。
キーフレーム検出回路301は、ステップS402でマルチメディア記憶装置303に記録された動画像サンプルの符号化の種類を解析し(ステップS403)、キーフレームか否かを判断する(ステップS404)。ここでの判断は、符号化された動画像サンプルがIフレームかP及びBフレームかを解析し、Iフレームであった場合には、動画像データがキーフレームであると判断する。
ステップS404で、動画像データの符号化の種類がキーフレームでないと判断された場合には、特殊再生制御データは生成されず、そのまま動画像データ記録処理を継続するか否かを判断し(ステップS408)、継続すると判断された場合にはステップS401へ処理を戻す。
ステップS404で、動画像データの符号化の種類がキーフレームであると判断された場合には、特殊再生制御データを生成するべく、ステップS405〜ステップS407へと処理を移行する。
キーフレーム検出回路301は、ステップS402でデータ記録回路302がマルチメディアデータ記憶装置303へ記録した動画像サンプルの記録位置とサイズとタイムスタンプを検出する(ステップS405)。
検出した動画像サンプルの記録位置とサイズとタイムスタンプ情報は、制御データ生成回路304へ入力され、制御データ構造に従って制御データが生成される。
図5は、本発明のデータ処理装置によって生成される制御データ構造を示す図である。
RandomAccessPointBox(以下、rdap)は、上述したISOファイル形式で定義されているBoxを拡張したデータ構造であり、メディアのランダムアクセスを容易にするための情報、具体的にはキーフレームを動画像データ中で時間的、位置的に特定する情報を提供し、図2で示されるISOファイル形式で定義されているBox一覧のUser Data Box(udta)か Free Space Box(free,skip)に含まれるBoxとして定義する。udtaとfree、skipの内容は定義されておらず、本実施形態で記録される制御データを理解しない従来の再生装置において、これらBox及びその中に含まれるBoxであるrdapは無視されることになる。また、これら未定義のBoxは、通常はアクセスされないBoxであると言うこともできる。
図5に示すように、rdapは、entry_count、sample_timestamp、sample_offset、sample_sizeの4つのフィールドから構成されている。entry_countは後に続くテーブルのエントリ数を与える整数を示し、sample_timestampはストリームのランダムアクセス可能なタイムスタンプを与える整数を示し、sample_offsetはランダムアクセス可能なサンプルの記録位置(ファイルオフセット)を与える整数を示し、sample_sizeはランダムアクセス可能なサンプルのサイズを与える整数を示す。
制御データ生成回路304は、キーフレーム検出回路301から検出したキーフレームの情報を受け取ると、ランダムアクセス可能なサンプルの総数をカウントするために、上述したrdspのentry_countをインクリメントする(ステップS406)と共に、サンプルの記録位置、サイズ、タイムスタンプ情報をそれぞれsample_offset、sample_size、sample_timestampの各フィールドに設定する(ステップS407)。
このようにして、制御データ生成回路305において特殊再生制御データが生成されると、動画像データ記録処理を継続するか否かを判断し(ステップS408)、継続すると判断された場合にはステップS401へ処理を戻す。このようにして、記録終了までの一連の動画像フレームに対して、特殊再生制御データが生成されることになる。
ステップS408で記録を終了すると判断された場合には、制御データ生成回路305において生成された制御データは、データ記録回路302を介してマルチメディアデータ記憶装置303の所定の領域へ記録される(ステップS409)。
図6は、本発明のデータ記録装置によって生成される特殊再生制御データの例である。
タイムスタンプ600はミリ秒単位の時刻であり、動画像601は動画像符号化回路300において符号化された一連の動画像フレームである。図6に示すように、100ミリ秒間隔で動画像フレームが符号化されるものとする。また、時刻0ミリ秒及び時刻1000ミリ秒のタイムスタンプが付けられたフレームはフレーム内符号化され(I−VOP)、それ以外のタイムスタンプが付けられたフレームはフレーム間予測符号化されている(B−VOP又はP−VOP)ものとする。
制御データ602は、タイムスタンプ0ミリ秒としてフレーム内符号化された動画像フレームに対して生成された制御データである。
この時点では、ランダムアクセス可能なサンプルの総数は1つであるため、entry_count603の値は1となっている。また、動画像フレームのタイムスタンプは0ミリ秒であり、記録位置はオフセット0xa868バイト、動画像フレームのサイズは0xf2eバイトであるため、sample_timestamp604の値は0、sample_offset605の値は0xa868、sample_size606の値は0xf2eと設定される。
後続する、タイムスタンプ100ミリ秒から900ミリ秒の各動画像フレームは、フレーム間予測符号化されたフレームであるため、これらフレームに対して制御データは生成されない。
制御データ607は、タイムスタンプ1000ミリ秒としてフレーム内符号化された動画像フレームに対して生成された制御データである。
制御データ607は、ランダムアクセス可能なサンプルの総数が2つとなったため、entry_count608の値は制御データ602のentry_count603からインクリメントされて2となる。また、新たに動画像フレームのタイムスタンプは1000ミリ秒であり、記録位置はオフセット0xba3bバイト、動画像フレームのサイズは0xec7バイトであるため、sample_timestamp609の値は0x3e8、sample_offset610の値は0xba3b、sample_size611の値は0xec7が、それぞれ制御データ602に対して追加される。
以降の一連の動画像フレームにおいても同様の処理がなされ、生成された制御データは、記録終了時にISOファイル612の末尾に上述したfree Box内のrdap613として記録されることになる。
(再生装置)
続いて、本発明の一実施形態としてのデータ再生装置について詳細に説明する。
図7は、本発明の一実施形態としてのデータ再生装置の基本構成例を示すと共に、各回路間でのデータの流れを示す図である。
図7に示すように、データ再生装置は、マルチメディアデータ記憶装置700、再生制御回路701、制御データ抽出回路702、符号化メディアデータ抽出回路703、動画像復号化回路704、出力機器705により構成されている。
図8は、本実施形態のデータ再生装置におけるマルチメディアデータの特殊再生処理を説明するフローチャートである。
再生制御回路701は、ユーザからの特殊再生要求を受信すると(ステップS801)、制御データ抽出回路702へマルチメディアデータ中の特殊再生制御データを抽出するよう要求する。
制御データ抽出回路702は、マルチメディアデータ記憶装置700に記録されている再生対象となるISOファイルに、特殊再生制御データが記録されているか否かを判断する(ステップS802)。ここでの判断は、上述したデータ記録装置によって記録された、ISOファイルのfree Box中に記録されているrdapを検索し、rdapが存在しない場合、若しくはrdsp内のエントリ数(entry_count)の値が0である場合、特殊再生制御データは記録されていないと判断される。
ステップS802で、特殊再生制御データが無いと判断された場合には、上述した背景技術において説明したような、従来の特殊再生処理(ステップS809)により再生制御がなされ、ランダムアクセス等の特殊再生が行われることになる。
ステップS802で、特殊再生制御データがあると判断された場合には、ISOファイルに記録されている特殊再生制御データrdapを抽出し(ステップS803)、再生制御回路701へと入力する。
再生制御回路701は、例えばユーザによる再生中の早送りボタン押下などによって発生される特殊再生要求によって指定された再生開始時刻tと、制御データ抽出回路702から入力された特殊再生制御データとから、最適な動画像サンプルを検出する必要がある。
そのため再生制御回路701は、再生開始要求によって指定された時刻t以前の最初のランダムアクセス可能なサンプルを見つけるべく、まず、制御データの各エントリのタイムスタンプ(rdapのsample_timestamp)から、時刻t以前の最初のタイムスタンプを探索する(ステップS804)。
続いて、探索したタイムスタンプと同一エントリに記録されているオフセット(sample_offset)とサイズ(sample_size)を抽出する(ステップS805)。
このようにして抽出したオフセットとサイズは、再生開始要求によって指定された時刻t以前の最初のランダムアクセス可能なサンプルの、ISOファイル中のオフセット(記録位置)とサイズを示している。これらの情報は、符号化メディアデータ抽出回路703へ入力され、符号化メディア抽出回路703では、入力されたオフセットとサイズのサンプルデータをマルチメディアデータ記憶装置700に記録されているISOファイルから抽出する(ステップS806)。
符号化メディアデータ抽出回路703によって抽出されたデータは、動画像復号化回路704へ入力され、符号化された動画像データサンプルが復号化される(ステップS807)。復号化された動画像データは、ディスプレイに代表される出力機器705に供給され、再生される(ステップS808)。
図9は、本実施形態のデータ再生装置が特殊再生制御データを用いて特殊再生する例である。ISOファイル612は、図6で説明した本実施形態のデータ記録装置によって作成されたISOファイルであり、制御データrdap613を含んでいる。
制御データ613中のエントリ数(entry_count902)は0x64であり、ランダムアクセス可能なサンプルの総数が100サンプルであることを示している。
また、rdap613中の各エントリは図6と同様に、第一番目のエントリは、タイムスタンプ0ミリ秒(sample_timestamp604)、記録位置は0xa868バイト(sample_offset605)、サイズ0xf2eバイト(sample_size606)のサンプル900に対して記録されている。第二番目のエントリは、タイムスタンプ1000(=0x3e8)ミリ秒(sample_timestamp609)、記録位置は0xba3bバイト(sample_offset610)、サイズ0xec7バイト(sample_size611)のサンプル901である。その他のエントリについての説明は省略する。
このような制御データを含むISOファイル612に対して、ユーザからの特殊再生要求を受信した場合、例えばタイムスタンプ1200ミリ秒へのランダムアクセス要求を受信すると、本実施形態のデータ再生装置は最適な動画像サンプルを見つけるために、制御データ613の各エントリのタイムスタンプから1200ミリ秒以前の最初のタイムスタンプであるタイムスタンプ1000ミリ秒(sample_timestamp609)を検出する。
検出したタイムスタンプ(sample_timestamp609)は制御データ613中の第二番目のエントリであるため、同じく第二番目のエントリに記録されている位置情報(sample_offset610)とサイズ(sample_size611)情報に従って、ISOファイル612のオフセット0xba3bバイトの位置からサイズ0xec7バイトのサンプルデータ901が抽出され、復号されることになる。
このように、本実施形態によれば、特殊再生に用いる再生制御データをISOファイル形式を用いて記録し、またこの特殊再生制御データを用いて特殊再生を行うことにより、ISOファイル形式データの特殊再生(ランダムアクセスや早送り等)時の、複雑なフレーム抽出処理の効率化を図ることができる。また、再生制御データを従来機器が無視する領域に配置することで、規格に対する影響がない形式でデータを記録し、従来の再生装置装置においても再生可能なデータを記録することができる。
[他の実施形態]
上述の実施形態では、記録装置が動画像データの符号化処理を行う機能を有していたが、符号化済みのデータを取得し、そのデータに対して図4のステップS402以降の処理を行っても良い。すなわち、符号化済み動画データに対し、上述した制御データを追加する機能のみを有する記録装置であっても良い。
実施形態に係る記録装置、再生装置を別々の装置として説明したが、記録装置と再生装置の機能を併せ持つ記録再生装置であってもよいことは言うまでもない。
尚、前述した実施形態の機能を実現するソフトウェアのプログラムを、記録媒体から直接、或いは有線/無線通信を用いて当該プログラムを実行可能なコンピュータを有するシステム又は装置に供給し、そのシステム或いは装置のコンピュータが該供給されたプログラムを実行することによって同等の機能が達成される場合も本発明に含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータに供給、インストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明の機能処理を実現するためのコンピュータプログラム自体も本発明に含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等、プログラムの形態を問わない。
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、磁気テープ等の磁気記録媒体、MO、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD−R、DVD−RW等の光/光磁気記憶媒体、不揮発性の半導体メモリなどがある。
有線/無線通信を用いたプログラムの供給方法としては、コンピュータネットワーク上のサーバに本発明を形成するコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイル等、クライアントコンピュータ上で本発明を形成するコンピュータプログラムとなりうるデータファイル(プログラムデータファイル)を記憶し、接続のあったクライアントコンピュータにプログラムデータファイルをダウンロードする方法などが挙げられる。この場合、プログラムデータファイルを複数のセグメントファイルに分割し、セグメントファイルを異なるサーバに配置することも可能である。
つまり、本発明の機能処理をコンピュータで実現するためのプログラムデータファイルを複数のユーザに対してダウンロードさせるサーバ装置も本発明に含む。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件を満たしたユーザに対して暗号化を解く鍵情報を、例えばインターネットを介してホームページからダウンロードさせることによって供給し、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
ISOファイル形式で定義されているBoxの一覧を示す図である。 ISOファイル形式のデータ構造を単純化して示す図である。 本発明の一実施形態としてのデータ記録装置の基本構成例を示すと共に、各回路間でのデータの流れを示す図である。 本発明の実施形態に係るデータ記録装置におけるデータ記録処理の例を説明するフローチャートである。 本発明の実施形態に係るデータ記録装置によって生成される制御用データの構造例を示す図である。 本発明の実施形態に係るデータ記録装置によって生成される制御用データの具体例を示す図である。 本発明の一実施形態としてのデータ再生装置の基本構成例を示すと共に、各回路間でのデータの流れを示す図である。 本発明の実施形態に係るデータ再生装置におけるデータ再生処理の例を説明するフローチャートである。 本発明の実施形態に係るデータ再生装置が制御データを用いて特殊再生する具体的な処理の例を説明する図である。

Claims (16)

  1. 符号化された動画像データから、ランダムアクセス可能なキーフレームを検出するキーフレーム検出手段と、
    前記キーフレーム検出手段によって検出されたキーフレームの各々に対し、前記動画像データ中での時間位置及びデータ位置を特定可能な情報を含む再生制御データを生成する制御データ生成手段と、
    前記動画像データと、前記再生制御データとを含んだマルチメディアデータを生成するマルチメディアデータ生成手段とを有することを特徴とするデータ記録装置。
  2. 前記時間位置及びデータ位置を特定可能な情報が、各キーフレームの時刻情報、データサイズ及びデータ記録位置情報であることを特徴とする請求項1記載のデータ記録装置。
  3. 前記再生制御データが、前記キーフレーム検出手段で検出された前記動画像データ中のキーフレーム総数を更に含むことを特徴とする請求項2記載のデータ記録装置。
  4. 前記マルチメディア生成手段が、前記再生制御データを、前記マルチメディアデータの、前記再生制御データを理解しない再生装置が無視する領域に配置することを特徴とする請求項1乃至請求項3のいずれか1項に記載のデータ記録装置。
  5. 前記マルチメディアデータ生成手段が、前記マルチメディアデータを、ISOベースメディアファイル形式、MP4ファイル形式、Motion JPEG 2000ファイル形式、AVCファイル形式、3GPPファイル形式、3GPP2ファイル形式のいずれかに準拠した形式で生成し、前記再生制御データを前記各ファイル形式におけるUser Data Box又はFree Space Box内に配置することを特徴とする請求項4記載のデータ記録装置。
  6. 前記動画像データが、フレーム内符号化されたフレーム及びフレーム間符号化されたフレームを含み、前記キーフレームが前記フレーム内符号化されたフレームであることを特徴とする請求項1乃至請求項5のいずれか1項に記載のデータ記録装置。
  7. 符号化された動画像データと、当該動画像データ中に含まれるランダムアクセス可能なキーフレームの時間位置及びデータ位置を特定可能な情報を含む再生制御データを含むマルチメディアデータを再生するためのデータ再生装置であって、
    前記特殊再生要求によって指定された再生開始時刻と、前記再生制御データとから、再生を行うべき前記動画像データ中のキーフレームを特定するデータ特定手段と、
    前記再生制御データを用いて、前記再生を行うべき前記動画像データ中のキーフレームのデータを前記動画像データから読み出す読み出し手段と、
    前記読み出したキーフレームデータを復号化し、再生する再生手段とを有することを特徴とするデータ再生装置。
  8. 前記時間位置及びデータ位置を特定可能な情報が、前記動画像データに含まれる各キーフレームの時刻情報、データサイズ及びデータ記録位置情報であることを特徴とする請求項7記載のデータ再生装置。
  9. 前記マルチメディアデータが、ISOベースメディアファイル形式、MP4ファイル形式、Motion JPEG 2000ファイル形式、AVCファイル形式、3GPPファイル形式、3GPP2ファイル形式のいずれかに準拠した形式を有し、前記再生制御データが前記各ファイル形式におけるUser Data Box又はFree Space Box内に配置されることを特徴とする請求項7又は請求項8記載のデータ再生装置。
  10. 前記マルチメディアデータが前記再生制御データを含まない場合、前記データ特定手段が、前記マルチメディアデータに含まれる前記動画像データのメタデータを用いて前記再生を行うべき前記動画像データ中のキーフレームの時間位置及びデータ位置を特定可能な情報を生成し、
    前記読み出し手段が、前記データ特定手段が前記メタデータから生成した情報を用いて前記読み出しを行うことを特徴とする請求項9記載のデータ再生装置。
  11. 前記再生制御データが、前記動画像データ中のキーフレーム総数を含み、前記データ特定手段が、前記キーフレーム総数が0の場合には前記再生制御データが無いと判定することを特徴とする請求項10記載のデータ再生装置。
  12. 請求項1乃至請求項6のいずれか1項に記載のデータ記録装置と、請求項7乃至請求項11のいずれか1項に記載のデータ再生装置とからなるデータ記録再生装置。
  13. コンピュータを請求項1乃至請求項6のいずれか1項に記載のデータ記録装置と、請求項7乃至請求項11のいずれか1項に記載のデータ再生装置の少なくとも一方として機能させるプログラム。
  14. 請求項13記載のプログラムを格納したコンピュータ読み取り可能な記録媒体。
  15. 符号化された動画像データから、ランダムアクセス可能なキーフレームを検出するキーフレーム検出ステップと、
    前記キーフレーム検出手段によって検出されたキーフレームの各々に対し、前記動画像データ中での時間位置及びデータ位置を特定可能な情報を含む再生制御データを生成する制御データ生成ステップと、
    前記動画像データと、前記再生制御データとを含んだマルチメディアデータを生成するマルチメディアデータ生成ステップとを有することを特徴とするデータ記録方法。
  16. 符号化された動画像データと、当該動画像データ中に含まれるランダムアクセス可能なキーフレームの時間位置及びデータ位置を特定可能な情報を含む再生制御データを含むマルチメディアデータを再生するためのデータ再生方法であって、
    前記特殊再生要求によって指定された再生開始時刻と、前記再生制御データとから、再生を行うべき前記動画像データ中のキーフレームを特定するデータ特定ステップと、
    前記再生制御データを用いて、前記再生を行うべき前記動画像データ中のキーフレームのデータを前記動画像データから読み出す読み出しステップと、
    前記読み出したキーフレームデータを復号化し、再生する再生ステップとを有することを特徴とするデータ再生方法。
JP2004256386A 2004-09-03 2004-09-03 データ記録再生装置及び方法 Withdrawn JP2006074531A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004256386A JP2006074531A (ja) 2004-09-03 2004-09-03 データ記録再生装置及び方法
US11/219,479 US8050539B2 (en) 2004-09-03 2005-09-02 Data recording/reproducing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004256386A JP2006074531A (ja) 2004-09-03 2004-09-03 データ記録再生装置及び方法

Publications (1)

Publication Number Publication Date
JP2006074531A true JP2006074531A (ja) 2006-03-16

Family

ID=35996322

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004256386A Withdrawn JP2006074531A (ja) 2004-09-03 2004-09-03 データ記録再生装置及び方法

Country Status (2)

Country Link
US (1) US8050539B2 (ja)
JP (1) JP2006074531A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011061281A (ja) * 2009-09-07 2011-03-24 Mitsubishi Electric Corp メディアファイル修復方法、メディアファイル作成方法及びメディアファイル再生方法並びに装置
US8190002B2 (en) 2009-03-23 2012-05-29 Seiko Epson Corporation Image supplying device, image supply system, image supplying method, and computer program product
DE102012215362A1 (de) 2011-08-31 2013-02-28 Canon Kabushiki Kaisha Datenverarbeitungsvorrichtung, verfahren und steuerprogramm
JP2013126097A (ja) * 2011-12-14 2013-06-24 Canon Inc 記録装置
JP2013125563A (ja) * 2011-12-14 2013-06-24 Canon Inc 記録装置
US8644597B2 (en) 2007-06-11 2014-02-04 Samsung Electronics Co., Ltd System and method for generating and regenerating 3D image files based on 2D image media standards

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009075495A1 (en) * 2007-12-10 2009-06-18 Samsung Electronics Co., Ltd. System and method for generating and reproducing image file including 2d image and 3d stereoscopic image
KR100924757B1 (ko) * 2008-01-25 2009-11-05 전자부품연구원 입체형 비디오 파일 포맷 및 그에 따른 입체형 비디오파일을 기록한 컴퓨터로 판독 가능한 기록매체
KR20090088772A (ko) * 2008-02-15 2009-08-20 삼성전자주식회사 슬라이드 쇼를 위한 영상파일을 생성 및 재생하기 위한시스템 및 방법
EP2150059A1 (en) * 2008-07-31 2010-02-03 Vodtec BVBA A method and associated device for generating video
CN101888540B (zh) * 2009-05-13 2012-09-05 中兴通讯股份有限公司 一种在流媒体文件中承载ts流的方法及装置
KR101995270B1 (ko) * 2012-04-25 2019-07-03 삼성전자주식회사 비디오 데이터를 재생하는 방법 및 장치
CN107147947B (zh) * 2017-05-11 2018-07-13 腾讯科技(深圳)有限公司 关键帧识别方法及装置
GB2585052B (en) * 2019-06-26 2023-07-26 Canon Kk Method and apparatus for encapsulating panorama images in a file

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3966571B2 (ja) * 1997-04-02 2007-08-29 エルエスアイ ロジック コーポレーション デジタル・ビデオ・ディスクにおけるサブ・ピクチャ・ユニットの高速再生システム及び方法
JP3510784B2 (ja) 1998-03-12 2004-03-29 シャープ株式会社 動画像記録方法、再生方法
JP3351757B2 (ja) 1999-01-27 2002-12-03 松下電器産業株式会社 ディジタル記録再生装置
JP2003173625A (ja) * 2001-12-04 2003-06-20 Hitachi Ltd ファイル変換方法、ファイル変換装置、及びファイル生成装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8644597B2 (en) 2007-06-11 2014-02-04 Samsung Electronics Co., Ltd System and method for generating and regenerating 3D image files based on 2D image media standards
US8190002B2 (en) 2009-03-23 2012-05-29 Seiko Epson Corporation Image supplying device, image supply system, image supplying method, and computer program product
JP2011061281A (ja) * 2009-09-07 2011-03-24 Mitsubishi Electric Corp メディアファイル修復方法、メディアファイル作成方法及びメディアファイル再生方法並びに装置
DE102012215362A1 (de) 2011-08-31 2013-02-28 Canon Kabushiki Kaisha Datenverarbeitungsvorrichtung, verfahren und steuerprogramm
US8867895B2 (en) 2011-08-31 2014-10-21 Canon Kabushiki Kaisha Data processing apparatus, method, and control program
JP2013126097A (ja) * 2011-12-14 2013-06-24 Canon Inc 記録装置
JP2013125563A (ja) * 2011-12-14 2013-06-24 Canon Inc 記録装置
US8649657B2 (en) 2011-12-14 2014-02-11 Canon Kabushiki Kaisha Recording apparatus
US8750689B2 (en) 2011-12-14 2014-06-10 Canon Kabushiki Kaisha Recording apparatus

Also Published As

Publication number Publication date
US8050539B2 (en) 2011-11-01
US20060051057A1 (en) 2006-03-09

Similar Documents

Publication Publication Date Title
US8050539B2 (en) Data recording/reproducing apparatus and method
KR100618473B1 (ko) Mpeg 스트림 네비게이션을 제공하기 위한 방법, 머신 판독 가능 매체, 장치 및 시스템
KR100860201B1 (ko) 통합 멀티미이어 콘텐츠를 저장하는 저장 매체와, 이를 기반으로 하는 멀티미디어 서비스 제공 시스템 및 그 방법
KR100686521B1 (ko) 비디오 및 메타데이터의 통합을 위한 비디오 멀티미디어응용 파일 형식의 인코딩/디코딩 방법 및 시스템
Pea et al. Video workflow in the learning sciences: Prospects of emerging technologies for augmenting work practices
JP2000069442A (ja) 動画システム
JP2006081146A (ja) シーンチェンジ情報をビデオビットストリーム中に埋め込むシステムおよびその方法
US11356749B2 (en) Track format for carriage of event messages
RU2315370C2 (ru) Носитель данных, на котором записаны аудиовизуальные данные с информацией о событии, устройство воспроизведения и способ их воспроизведения
US20110222835A1 (en) Application Tracks in Audio/Video Containers
US20050276572A1 (en) Providing audio-visual content
JP2007048378A (ja) 記録装置、記録方法、記録方法のプログラム及び記録方法のプログラムを記録した記録媒体
JP2015109131A (ja) ファイル生成方法、再生方法、ファイル生成装置、再生装置および記録媒体
WO2015083354A1 (ja) ファイル生成方法、再生方法、ファイル生成装置、再生装置および記録媒体
JP4280701B2 (ja) データファイルの編集方法及び装置及び制御プログラム及び記憶媒体
US20040151473A1 (en) Audio/video data recording/reproduction apparatus, system, and method, recording medium recorded by them, audio/video data reproduction apparatus, and data structure
RU2690163C2 (ru) Устройство обработки информации и способ обработки информации
JP4378157B2 (ja) データ処理方法および装置
KR101995270B1 (ko) 비디오 데이터를 재생하는 방법 및 장치
KR100660024B1 (ko) 미디어 자원 어드레싱 방법 및 장치와 그 기록 매체
KR101034758B1 (ko) 통합 멀티미디어 파일의 초기 실행 방법과 이를 위한시스템
JP2007318545A (ja) データ送信装置、データ受信装置、データ送信方法及びデータ受信方法
GB2421394A (en) Providing Audio-Visual Content
JP2004128872A (ja) 画像処理装置及びその方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
JP2003235012A (ja) ファイル及びコンテンツ管理

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20071106