JP2005020339A - Moving image decoding apparatus - Google Patents

Moving image decoding apparatus Download PDF

Info

Publication number
JP2005020339A
JP2005020339A JP2003182112A JP2003182112A JP2005020339A JP 2005020339 A JP2005020339 A JP 2005020339A JP 2003182112 A JP2003182112 A JP 2003182112A JP 2003182112 A JP2003182112 A JP 2003182112A JP 2005020339 A JP2005020339 A JP 2005020339A
Authority
JP
Japan
Prior art keywords
data
unit
encoded
time
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003182112A
Other languages
Japanese (ja)
Inventor
Kengo Nishimura
憲吾 西村
Junko Yagi
順子 八木
Michihiro Matsumoto
道弘 松本
Takaharu Morohashi
隆治 諸橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2003182112A priority Critical patent/JP2005020339A/en
Publication of JP2005020339A publication Critical patent/JP2005020339A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a moving image decoding apparatus capable of seeking for the multiplexed data not including frame information. <P>SOLUTION: Multiplexed data 100 (A, V, T) are stored in a storage memory 13 through an input/output interface 11 (step ST1). Next, a data size Sall for the multiplexed data itself, a whole regenerating time Tall for regenerating the whole data, and a regenerating time Tseek up to a specified time are obtained (step ST2). A data position Sseek corresponding to the specified time is searched from the multiplexed data 100 using the ratio of the whole regenerating time Tall to the regenerating time Tseek up to the specified time (step ST3). The frame corresponding to the determined data position Sseek (encoded moving image data (A4)) is separated from the multiplexed data, and decoded for output on a display device 2 through an input/output interface 15. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
この発明は、符号化された動画像データ(符号化された動画像データ)を復号化する装置に関し、さらに詳しくは、符号化動画像データのシーク動作の制御に関する。
【0002】
【従来の技術】
今日、情報技術の発展により、ASFやMP4などの多重化規格に基づいて蓄積メディアに圧縮保存された音声や動画像(映像)を再生して楽しむことが可能となった。このようなAVデータ(多重化データ)を復号化して再生するにあたって、シーク動作(ユーザによって指定された時刻(指定時刻)に対応するフレームを検索する動作)は、内容検索を容易にかつ迅速に行うために重要な機能である。このシーク動作を行う際、多重化データに含まれるフレーム情報を用いてシーク対象となるフレームを検索していた。多重化データの中にフレーム情報が含まれている場合は、フレーム情報に含まれる各基準画像のフレームに対する表示時刻であるPTS情報と指定時刻を比較することで、最も近い時刻でのフレームでの符号化動画像データが多重化データのどの位置に存在しているか一意に検索することが可能である。
【0003】
【発明が解決しようとする課題】
また、ユーザは自作した音声や動画像(映像)を独自に多重化し蓄積メディアに圧縮保存することも可能となった。しかし、ユーザが自作した多重化データ(AVデータ)の中には、フレーム情報を含まないものが存在する。フレーム情報が存在しない多重化データに対して上述の手法でシーク動作を行うことは困難である。
【0004】
この発明の目的は、フレーム情報が存在しない符号化動画像データに対してシーク動作を行うことができる動画像復号化装置を提供することである。
【0005】
【課題を解決するための手段】
この発明の1つの局面に従うと、動画像復号化装置は、符号化された動画像データを復号化する装置であって、取得部と、検索部と、復号化部とを備える。符号化動画像データは、複数のフレームを含む。また、符号化動画像データは、AVデータに多重化されている。取得部は、AVデータのデータサイズとAVデータの再生時間と指定時刻とを取得する。指定時刻は、外部より指定される表示時刻を示す。検索部は、取得部で得られた情報(AVデータのデータサイズ,AVデータの再生時間,指定時刻)を用いてAVデータの中から指定時刻に対応するデータ位置を検索する。復号化部は、検索部によって得られたデータ位置に対応するフレームを復号化する。
【0006】
上記動画像復号化装置では、AVデータのデータサイズ,AVデータの再生時間,指定時刻を用いて、AVデータの再生時間における指定時刻の時間軸上での位置を求める。具体的には、AVデータ全体のデータサイズと、AVデータ全体の再生時間と指定時刻との比率とにより、指定時刻に対応するフレームのデータが含まれるデータ位置を計算する。よって、フレーム情報の存在しない符号化動画像データに対してシーク動作を行うことができる。
【0007】
この発明のもう1つの局面に従うと、動画像復号化装置は、符号化された動画像データを復号化する装置であって、取得部と、検索部と、復号化部とを備える。符号化動画像データは、複数のフレームを含む。また、符号化動画像データは、AVデータに多重化されている。取得部は、ビットレートと指定時刻とを取得する。ビットレートは、単位時間当たりに消費されるAVデータのデータ量を示す。検索部は、ビットレートを用いて指定時刻に対応するデータ位置を検索する。
【0008】
上記動画像復号化装置では、ビットレートは、単位時間当たりに上記動画像復号化装置に入力することによって消費されるAVデータのデータ量を示す。検索部は、ビットレートと指定時刻とを用いて指定時刻に対応するフレームデータのデータ位置(AVデータにおける先頭からのデータ位置)を計算する。よって、フレーム情報の存在しない符号化動画像データに対してシーク動作を行うことができる。
【0009】
好ましくは、前記AVデータは、符号化動画像データと他の符号化データとが所定の配列単位で多重化されている。上記動画像復号化装置は、判定部と、再構成部とをさらに備える。判定部は、AVデータの配列単位のデータサイズが所定のサイズを超えているか否かを判定する。再構成部は、AVデータの配列単位のデータサイズが所定のサイズを超えていると判定部で判定されたとき、AVデータの配列単位のデータサイズが所定のサイズ以下になるようにAVデータ内の各符号化データの並びを変更する。
【0010】
フレーム情報が存在しないAVデータに対してシーク動作を行う場合、AVデータに含まれる各符号化データの結合順序によって不可能な場合がある。例えば、AVデータがデータの先頭から半分までに符号化動画像データ(A)を含み、データの半分から最後までに他の符号化データ(B)を含むように多重化されているとする。このAVデータに対して上記全体再生時間と上記指定時刻との関係を用いてデータ位置を検索した。結果、データの先頭からデータ全体に対して3/4の位置がデータ位置として検索されたとする。すると、復号化されるのは、後者の他の符号化データ(B)のみで符号化動画像データは全く復号化されない。このように、AVデータに含まれる符号化データの結合順序が偏ってしまうとシーク動作をうまく行うことができない。
【0011】
上記動画像復号化装置では、AVデータに含まれる各符号化データにおける配列単位のデータサイズが所定のサイズを超えるとき、配列単位のデータサイズが所定のサイズ以下になるようにAVデータ内の各符号化データの並びを変更する。つまり、AVデータに含まれる各符号化データの結合順序の偏りが大きい時AVデータ内の各符号化データの並びを変更する。よって上記のような問題を解消することができ、シーク動作を行うことができる。
【0012】
この発明のさらにもう1つの局面に従うと、動画像復号化装置は、AVデータに多重化されている符号化動画像データを復号化する装置であって、判定部と、再構成部と、フレーム情報作成部とを備える。AVデータは、符号化動画像データと他の符号化動画像データとが所定の配列単位で多重化されている。符号化動画像データは、複数のフレームを含む。判定部は、AVデータの配列単位のデータサイズが所定のサイズを超えているか否かを判定する。再構成部は、AVデータの配列単位のデータサイズが所定のサイズを超えていると判定部で判定されたとき、AVデータの配列単位のデータサイズが所定のサイズ以下になるようにAVデータ内の各符号化データの並びを変更する。フレーム情報作成部は、再構成部によって並びが変更されたAVデータについてのフレーム情報を作成し、作成したフレーム情報を当該AVデータに付加する。フレーム情報は、AVデータに含まれているフレームの時間軸上における並びを示す情報を含む。
【0013】
上記動画像復号化装置では、各符号化データの結合順序を変更したAVデータに対してフレーム情報を付加する。よって、フレーム情報の表示時刻とユーザの指定時刻とを比較して、時間軸上で最も近いフレームの表示時刻を検索することによってシーク動作を行うことができる。
【0014】
【発明の実施の形態】
以下、この発明の実施の形態を図面を参照して詳しく説明する。なお、図中同一または相当部分には同一の符号を付しその説明は繰り返さない。
【0015】
(第1の実施形態)
第1の実施形態による動画像再生システムの全体構成を図1に示す。このシステムは、所定の多重化規格(例えばASFやMP4など)に従って多重化されているAVデータ(多重化データ100)に含まれる符号化動画像データの再生を行う。このシステムでは、ユーザによって指定された位置(時刻)から符号化動画像データを再生することができる(シーク動作)。このシステムは、動画像復号化装置1と、表示装置2とを備える。動画像復号化装置1は、入出力インターフェイス11,15と、CPU12と、蓄積メモリ13と、フレームバッファ14とを備える。入出力インターフェイス11は、外部からの多重化データ100の入力処理を行う。CPU12は、多重化データ100の解析、多重化データ100の分離、符号化動画像データの復号化、および指定時刻情報200に応じて全体のコントロールを行う。指定時刻情報200は、ユーザによって指示される表示時刻(指定時刻)を示す。蓄積メモリ13は、多重化データ100、および符号化動画像データを蓄積する。フレームバッファ14は、復号化された動画像データ(フレームデータ)を蓄積する。入出力インターフェイス15は、フレームバッファ14に蓄積されたフレームデータを表示装置2へ出力する。
【0016】
次に、図1に示した動画像再生システムの動作について説明する。ここではシーク動作について説明する。シーク動作は、多重化データ100(AVデータ)の中からユーザに指定された表示時刻に対応するフレームを表示する処理である。以下、シーク動作について図2を参照しつつ説明する。
【0017】
〔ステップST1〕
入出力インターフェイス11を介して多重化データ100が動画像復号化装置1に入力される。多重化データ100の一例を図3に示す。多重化データ100は、符号化動画像データ(V),符号化音声・オーディオデータ(A),符号化テキストデータ(T)などが所定の配列単位(図3に示した多重化データ100の場合、符号化動画像データ(V)・符号化音声・オーディオデータ(A)・符号化テキストデータ(T)の配列単位はそれぞれ1パケットである。1パケットには少なくとも1つ以上のフレームが含まれている。)で多重化されたデータ(AVデータ)である。
【0018】
〔ステップST2〕
次に、CPU12は、多重化データ100に含まれるストリーム情報の中から、多重化データ自身のデータサイズSallとそのデータ全体を再生する全体再生時間Tallとを取得する。また、指定時刻情報200が示す指定時刻を取得して、データの先頭から指定時刻までの再生時間Tseekを求める。
【0019】
〔ステップST3〕
次に、CPU12は、データサイズSallと全体再生時間Tallと指定時刻までの再生時間Tseekとを用いて、多重化データ100の中から指定時刻に対応するデータ位置Sseekを検索する。データ位置Sseekはデータの先頭からの位置を示す。
【0020】
以下に、図4を参照し、データ位置Sseekの検索方法を説明する。
【0021】
図4のように、多重化データ自身のデータサイズSallに対して全体再生時間Tallと指定時刻までの再生時間Tseekとの比率を用いて、数1のようにデータ位置Sseekを検索する。
【0022】
【数1】

Figure 2005020339
【0023】
〔ステップST4〕
次に、CPU12は、多重化データの中から検索したデータ位置Sseek以降の符号化動画像データのパケットV4を分離する。次に、そのパケットV4の中から一番先頭のフレームを分離する。分離されたフレームは蓄積メモリ13に蓄積される。
【0024】
〔ステップST5〕
次に、CPU12は、蓄積されたフレームを復号化する。
【0025】
〔ステップST6〕
次に、CPU12は、復号化したフレームV4をフレームバッファ14に蓄積する。
【0026】
〔ステップST7〕
次に、入出力インターフェイス15は、復号化したフレームを表示装置2へ出力する。
【0027】
以上のように、第1の実施形態では、シーク動作時にデータサイズSallと、全体再生時間Tallと、指定時刻までの再生時間Tseekとを用いて、データ位置Sseekを決定することによって、フレーム情報が存在しない場合もシーク動作を行うことができる。
【0028】
なお、シーク動作後に通常再生を行う場合では、シーク動作によって表示したフレーム以降の符号化動画像データをデータの先頭に近い順番にて復号化して、復号化した順番にて表示装置2へ出力する。
【0029】
(第2の実施形態)
第2の実施形態による動画像再生システムの全体構成は図1に示したものと同じであるがCPU12の動作が異なる。第2の実施形態は、データ位置Sseekを検索する際、データサイズSallと全体再生時間Tallとに代えてビットレートRmuxを用いる。
【0030】
次に、第2の実施形態による動画像再生システムにおけるシーク動作について、図5を参照しつつ説明する。
【0031】
〔ステップST1〕
入出力インターフェイス11を介して多重化データ100が動画像復号化装置1に入力される。
【0032】
〔ステップST11〕
次に、CPU12は、多重化データ100に含まれるストリーム情報の中から、ビットレートRmuxを取得する。また、指定時刻情報200が示す指定時刻を取得して、データの先頭から指定時刻までの再生時間Tseekを求める。ビットレートRmuxは、単位時間あたりに動画像復号化装置1へ入力される多重化データ100のデータ量を示す。
【0033】
〔ステップST12〕
次に、CPU12は、ビットレートRmuxと、指定時刻までの再生時間Tseekとを用いて多重化データ100の中から指定時刻に対応するデータ位置Sseekを検索する。データ位置Sseekは多重化データ100の先頭に対しての位置を示す。
【0034】
以下に、図6を参照してデータ位置Sseekの検索方法を説明する。
【0035】
ビットレートRmuxは単位時間あたりに出力するデータ量を示すので、指定時刻までを再生する時間Tseekとの積を求めるとデータ位置Sseekが算出される。つまり、数2のように示すことができる。
【0036】
【数2】
Figure 2005020339
【0037】
次に、第1の実施形態と同様に、ステップST4〜ステップST7における処理が行われる。
【0038】
以上のように、第2の実施形態によれば、ビットレート情報Rmuxと、指定時刻までの再生時間Tseekとを用いてデータ位置Sseekを検索することによって、フレーム情報がない場合もシーク動作を行うことができる。
【0039】
(第3の実施形態)
第3の実施形態による動画像再生システムの全体構成は図1に示したものと同じであるがCPU12の動作が異なる。多重化データの中にフレーム情報がない場合で、かつ動画像データ、音声・オーディオデータ、テキストデータのどれか1つのデータが、それぞれに設定された一定のサイズ以上同じデータが並んで配置されていた場合、第1〜第2の実施形態で説明した手法を用いても、ユーザから指示された表示時刻のフレームデータを表示するシーク動作を行うことが困難となってしまう。そこで第3の実施形態では、そのような多重化データに対しても動画像データ、音声・オーディオデータ、テキストデータがそれぞれ一定サイズを超えないような形式へと再構成することで、容易にシーク動作を行うことを可能とする。
【0040】
次に、第3の実施形態による動画像再生システムにおけるシーク動作について、図7を参照しつつ説明する。
【0041】
〔ステップST1〕
入出力インターフェイス11を介して多重化データ100が動画像復号化装置1に入力される。
【0042】
〔ステップST21〕
次に、CPU12は、多重化データ100の先頭からデータを走査し多重化データ100に含まれている各符号化データ(動画像データ,音声・オーディオデータ,テキストデータ)の配列単位(多重化単位)を調べる。各符号化データの配列単位は、同じ種類の符号化データのパケットが連続する区間を示す。具体的には、図8のように音声・オーディオデータ(A)の配列単位はA1〜A6の区間(6パケット)であり、動画像データ(V)の配列単位はV1〜V5の区間(5パケット)であり、テキストデータ(T)の配列単位はT1〜T5(5パケット)である。各データの配列単位(A,V,T)を調べた結果が図8のように各データに定められたサイズ(As,Vs,Ts)を超える場合にはステップST22へ進み、各データに定められたサイズを超えない場合には、ステップST2に進む。
【0043】
〔ステップST22〕
次に、CPU12は、動画像データ、音声オーディオデータ、テキストデータをそれぞれのデータに対して定められたサイズ以下で連続するように分割し、分割されたそれぞれのデータに対してデータの種類に関係なく表示時間の順番に並べて多重化する。すなわち、各符号化データの配列単位を定められたサイズ以下になるように分割し、分割した各データを、図9のように各符号化データの先頭に存在するものから順に多重化する。
【0044】
〔ステップST2〜ステップST7〕
次に、第1の実施形態と同様に、ステップST2からステップST7の処理が行われる。
【0045】
以上のように、多重化データ100を再構成することによって、多重化データ100に含まれる各データの配列単位が定められたサイズを超える場合でかつフレーム情報が存在しない場合でもシーク動作を行うことができる。
【0046】
なお、ステップST21より後の処理(ステップST2〜ステップST7)は、第2の実施形態のステップST11〜ステップST7における処理を代わりに行ってもよい。
【0047】
(第4の実施形態)
第4の実施形態による動画像再生システムの全体構成は図1に示したものと同じであるがCPU12の動作が異なる。第4の実施形態は、第3の実施形態において構成を新たにした多重化データに対してフレーム情報を作成し付加する。
【0048】
次に、第4の実施形態による動画像再生システムにおけるシーク動作について、図10を参照しつつ説明する。
【0049】
〔ステップST1〕
入出力インターフェイス11を介して多重化データ100が動画像復号化装置1に入力される。
【0050】
〔ステップST21,ステップST22〕
次に、ステップST21における処理を行い、多重化データ100に含まれている各符号化データの配列単位(A,V,T)を調べる。各符号化データの配列単位を調べた結果が図8のように定められたサイズ(As,Vs,Ts)を超える場合にはステップST22における処理を行う。定められたサイズを超えない場合にはステップST31に進む。
【0051】
〔ステップST31〕
次に、CPU12は、多重化データ100またはステップST22で新たに構成した多重化データを解析する。つまり、多重化データ(多重化データ200または新たに構築された多重化データ)に含まれる各符号化データの配列単位の並びを調べて表示時刻情報を取得する。CPU12は、表示時刻情報を基にフレーム情報(図11参照)を作成して付加する。
【0052】
〔ステップST32〕
次に、CPU12は、フレーム情報の表示時刻(PTS情報)とユーザによって指示された指定時刻とを比較する。そして、最も時間軸上で近い表示時刻に対応する符号化動画像データのフレームをフレーム情報を付加した多重化データの中から検索する。
【0053】
〔ステップST33〕
次に、CPU12は、検索したフレーム以降の符号化動画像データを多重化データ100またはステップST22で新たに構成した多重化データより分離する。分離された符号化動画像データのフレームは蓄積メモリ13に蓄積される。
【0054】
〔ステップST5からステップST7〕
次に、ステップST5〜ステップST7における処理が行われる。
【0055】
以上のように、フレーム情報を作成し多重化データ100に付加することによって、ユーザが指示した時刻に対応するデータ位置をフレーム情報を参照するだけで取得でき、容易にシーク動作を行うことができる。
【0056】
【発明の効果】
この発明による動画像復号化装置では、フレーム情報が含まれていない多重化データに対してユーザが指示する時刻のフレームを表示するシーク動作を行う場合、従来の技術ではシーク動作自体を行うことが困難であったが、多重化データのファイルサイズ、もしくはビットレートを用いることでシーク動作が可能となる。また、多重化データを再構成する手段を備えることにより、より容易にシーク動作を行うことができる形式へと再構成することができる。
【図面の簡単な説明】
【図1】この発明の第1の実施形態における動画像復号化装置の全体構成を示すブロック図である。
【図2】図1に示した動画像復号化装置による処理の手順を示したフローチャートである。
【図3】図1に示した多重化データの一例である。
【図4】図2に示した指定時刻に対応するデータ位置の検索方法を示す図である。
【図5】この発明の第2の実施形態における処理の手順を示したフローチャートである。
【図6】図5に示した指定時刻に対応するデータ位置の検索方法を示す図である。
【図7】この発明の第3の実施形態における処理の手順を示したフローチャートである。
【図8】各データに定められたサイズを超えて連続して各データが並んでいる多重化データの一例である。
【図9】図7に示した多重化データを並び替える方法について示す図である。
【図10】この発明の第4の実施形態における処理の手順を示したフローチャートである。
【図11】フレーム情報の一例である。
【符号の説明】
1 動画像復号化装置
2 表示装置
11,15 入出力インターフェイス
12 CPU
13 蓄積メモリ
14 フレームバッファ
100 多重化データ
200 指定時刻情報[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an apparatus for decoding encoded moving image data (encoded moving image data), and more particularly to control of a seek operation of encoded moving image data.
[0002]
[Prior art]
Today, with the development of information technology, it has become possible to play and enjoy audio and video (video) compressed and stored in storage media based on multiplexing standards such as ASF and MP4. When such AV data (multiplexed data) is decoded and played back, a seek operation (an operation for searching for a frame corresponding to a time (specified time) specified by the user) is an easy and quick content search. It is an important function to do. When this seek operation is performed, a frame to be seeked is searched using frame information included in the multiplexed data. When frame information is included in the multiplexed data, the PTS information, which is the display time for each reference image frame included in the frame information, is compared with the specified time, so that the frame at the nearest time is It is possible to uniquely search at which position in the multiplexed data the encoded moving image data exists.
[0003]
[Problems to be solved by the invention]
In addition, users can now independently multiplex their own voices and moving images (videos) and save them on storage media. However, some multiplexed data (AV data) created by the user does not include frame information. It is difficult to perform a seek operation on multiplexed data for which no frame information exists using the above-described method.
[0004]
An object of the present invention is to provide a moving picture decoding apparatus capable of performing a seek operation on encoded moving picture data having no frame information.
[0005]
[Means for Solving the Problems]
According to one aspect of the present invention, a video decoding device is a device that decodes encoded video data, and includes an acquisition unit, a search unit, and a decoding unit. The encoded moving image data includes a plurality of frames. The encoded moving image data is multiplexed with AV data. The acquisition unit acquires the data size of the AV data, the reproduction time of the AV data, and the specified time. The designated time indicates a display time designated from the outside. The retrieval unit retrieves the data position corresponding to the designated time from the AV data using the information (AV data size, AV data reproduction time, designated time) obtained by the obtaining unit. The decoding unit decodes a frame corresponding to the data position obtained by the search unit.
[0006]
In the moving picture decoding apparatus, the position of the designated time on the time axis in the reproduction time of the AV data is obtained using the data size of the AV data, the reproduction time of the AV data, and the designated time. Specifically, the data position including the frame data corresponding to the specified time is calculated based on the data size of the entire AV data and the ratio between the reproduction time of the entire AV data and the specified time. Therefore, it is possible to perform a seek operation on encoded moving image data having no frame information.
[0007]
According to another aspect of the present invention, a video decoding device is a device that decodes encoded video data, and includes an acquisition unit, a search unit, and a decoding unit. The encoded moving image data includes a plurality of frames. The encoded moving image data is multiplexed with AV data. The acquisition unit acquires a bit rate and a specified time. The bit rate indicates the amount of AV data consumed per unit time. The search unit searches for a data position corresponding to the specified time using the bit rate.
[0008]
In the moving picture decoding apparatus, the bit rate indicates the amount of AV data consumed by being input to the moving picture decoding apparatus per unit time. The search unit calculates the data position of the frame data corresponding to the specified time (data position from the beginning in the AV data) using the bit rate and the specified time. Therefore, it is possible to perform a seek operation on encoded moving image data having no frame information.
[0009]
Preferably, in the AV data, encoded moving image data and other encoded data are multiplexed in a predetermined arrangement unit. The moving picture decoding apparatus further includes a determination unit and a reconstruction unit. The determination unit determines whether the data size of the array unit of the AV data exceeds a predetermined size. When the determination unit determines that the data size of the array unit of the AV data exceeds a predetermined size, the reconstruction unit includes the AV data so that the data size of the array unit of the AV data is equal to or less than the predetermined size. The order of each encoded data is changed.
[0010]
When a seek operation is performed on AV data for which no frame information exists, it may not be possible depending on the combination order of encoded data included in the AV data. For example, it is assumed that AV data is multiplexed so that the encoded moving image data (A) is included in the first half of the data and the other encoded data (B) is included in the half of the data from the last. A data position was searched for the AV data using the relationship between the total reproduction time and the specified time. As a result, it is assumed that a 3/4 position is retrieved as the data position from the top of the data to the entire data. Then, only the other encoded data (B) is decoded, and the encoded moving image data is not decoded at all. As described above, when the combination order of the encoded data included in the AV data is biased, the seek operation cannot be performed well.
[0011]
In the moving picture decoding apparatus, when the data size of the array unit in each encoded data included in the AV data exceeds a predetermined size, each data in the AV data is set so that the data size of the array unit is equal to or less than the predetermined size. Change the sequence of encoded data. That is, when there is a large deviation in the coupling order of the encoded data included in the AV data, the arrangement of the encoded data in the AV data is changed. Therefore, the above problems can be solved and a seek operation can be performed.
[0012]
According to yet another aspect of the present invention, a video decoding device is a device that decodes encoded video data multiplexed with AV data, and includes a determination unit, a reconstruction unit, a frame, And an information creation unit. In AV data, encoded moving image data and other encoded moving image data are multiplexed in a predetermined arrangement unit. The encoded moving image data includes a plurality of frames. The determination unit determines whether the data size of the array unit of the AV data exceeds a predetermined size. When the determination unit determines that the data size of the array unit of the AV data exceeds a predetermined size, the reconstruction unit includes the AV data so that the data size of the array unit of the AV data is equal to or less than the predetermined size. The order of each encoded data is changed. The frame information creation unit creates frame information for the AV data whose arrangement has been changed by the reconstruction unit, and adds the created frame information to the AV data. The frame information includes information indicating the arrangement on the time axis of frames included in the AV data.
[0013]
In the video decoding apparatus, frame information is added to AV data in which the order of combining encoded data is changed. Therefore, the seek operation can be performed by comparing the display time of the frame information with the user-specified time and searching for the display time of the closest frame on the time axis.
[0014]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In the drawings, the same or corresponding parts are denoted by the same reference numerals, and description thereof will not be repeated.
[0015]
(First embodiment)
FIG. 1 shows the overall configuration of a moving image playback system according to the first embodiment. This system reproduces encoded moving image data included in AV data (multiplexed data 100) multiplexed according to a predetermined multiplexing standard (for example, ASF or MP4). In this system, encoded moving image data can be reproduced from a position (time) designated by the user (seek operation). This system includes a moving picture decoding apparatus 1 and a display apparatus 2. The moving picture decoding apparatus 1 includes input / output interfaces 11 and 15, a CPU 12, a storage memory 13, and a frame buffer 14. The input / output interface 11 performs input processing of multiplexed data 100 from the outside. The CPU 12 analyzes the multiplexed data 100, separates the multiplexed data 100, decodes the encoded moving image data, and performs overall control according to the specified time information 200. The designated time information 200 indicates a display time (designated time) designated by the user. The storage memory 13 stores the multiplexed data 100 and the encoded moving image data. The frame buffer 14 stores the decoded moving image data (frame data). The input / output interface 15 outputs the frame data stored in the frame buffer 14 to the display device 2.
[0016]
Next, the operation of the moving image reproduction system shown in FIG. 1 will be described. Here, the seek operation will be described. The seek operation is a process of displaying a frame corresponding to the display time designated by the user from the multiplexed data 100 (AV data). Hereinafter, the seek operation will be described with reference to FIG.
[0017]
[Step ST1]
Multiplexed data 100 is input to the moving picture decoding apparatus 1 via the input / output interface 11. An example of the multiplexed data 100 is shown in FIG. The multiplexed data 100 includes encoded moving image data (V), encoded audio / audio data (A), encoded text data (T) and the like in a predetermined arrangement unit (in the case of the multiplexed data 100 shown in FIG. 3). The arrangement unit of the encoded moving image data (V), the encoded audio data, the audio data (A), and the encoded text data (T) is one packet, and each packet includes at least one frame. Data) (AV data) multiplexed.
[0018]
[Step ST2]
Next, the CPU 12 acquires from the stream information included in the multiplexed data 100 the data size Sall of the multiplexed data itself and the total playback time Tall for playing back the entire data. Also, the designated time indicated by the designated time information 200 is acquired, and the reproduction time Tseek from the beginning of the data to the designated time is obtained.
[0019]
[Step ST3]
Next, the CPU 12 searches the multiplexed data 100 for a data position Sseek corresponding to the specified time using the data size Sall, the total playback time Tall, and the playback time Tseek until the specified time. The data position Sseek indicates the position from the beginning of the data.
[0020]
Hereinafter, a method of searching for the data position Sseek will be described with reference to FIG.
[0021]
As shown in FIG. 4, the data position Sseek is searched as shown in Equation 1 using the ratio between the total playback time Tall and the playback time Tseek until the specified time with respect to the data size Sall of the multiplexed data itself.
[0022]
[Expression 1]
Figure 2005020339
[0023]
[Step ST4]
Next, the CPU 12 separates the encoded moving image data packet V4 after the data position Sseek searched from the multiplexed data. Next, the first frame is separated from the packet V4. The separated frames are stored in the storage memory 13.
[0024]
[Step ST5]
Next, the CPU 12 decodes the accumulated frame.
[0025]
[Step ST6]
Next, the CPU 12 stores the decoded frame V4 in the frame buffer 14.
[0026]
[Step ST7]
Next, the input / output interface 15 outputs the decoded frame to the display device 2.
[0027]
As described above, in the first embodiment, the frame information is determined by determining the data position Sseek using the data size Sall, the total playback time Tall, and the playback time Tseek up to the specified time during the seek operation. The seek operation can be performed even when it does not exist.
[0028]
When normal playback is performed after the seek operation, the encoded moving image data after the frame displayed by the seek operation is decoded in the order close to the head of the data, and is output to the display device 2 in the decoded order. .
[0029]
(Second Embodiment)
The overall configuration of the moving image playback system according to the second embodiment is the same as that shown in FIG. 1, but the operation of the CPU 12 is different. In the second embodiment, when searching for the data position Sseek, the bit rate Rmux is used instead of the data size Sall and the total playback time Tall.
[0030]
Next, a seek operation in the moving image reproduction system according to the second embodiment will be described with reference to FIG.
[0031]
[Step ST1]
Multiplexed data 100 is input to the moving picture decoding apparatus 1 via the input / output interface 11.
[0032]
[Step ST11]
Next, the CPU 12 acquires the bit rate Rmux from the stream information included in the multiplexed data 100. Also, the designated time indicated by the designated time information 200 is acquired, and the reproduction time Tseek from the beginning of the data to the designated time is obtained. The bit rate Rmux indicates the amount of multiplexed data 100 input to the video decoding device 1 per unit time.
[0033]
[Step ST12]
Next, the CPU 12 searches the multiplexed data 100 for the data position Sseek corresponding to the specified time using the bit rate Rmux and the reproduction time Tseek until the specified time. The data position Sseek indicates a position with respect to the head of the multiplexed data 100.
[0034]
Hereinafter, a method for searching for the data position Sseek will be described with reference to FIG.
[0035]
Since the bit rate Rmux indicates the amount of data to be output per unit time, the data position Sseek is calculated when the product of the reproduction time Tseek until the specified time is obtained. In other words, it can be expressed as in Equation 2.
[0036]
[Expression 2]
Figure 2005020339
[0037]
Next, similarly to the first embodiment, the processes in steps ST4 to ST7 are performed.
[0038]
As described above, according to the second embodiment, the seek operation is performed even when there is no frame information by searching the data position Sseek using the bit rate information Rmux and the reproduction time Tseek up to the specified time. be able to.
[0039]
(Third embodiment)
The overall configuration of the moving image playback system according to the third embodiment is the same as that shown in FIG. 1, but the operation of the CPU 12 is different. When there is no frame information in the multiplexed data, and any one of moving image data, audio / audio data, and text data is arranged side by side with the same data more than a predetermined size set for each. In this case, even if the methods described in the first to second embodiments are used, it is difficult to perform a seek operation for displaying the frame data at the display time instructed by the user. Therefore, in the third embodiment, seek is easily performed by reconfiguring such multiplexed data into a format in which moving image data, audio / audio data, and text data do not exceed a certain size. It is possible to perform an operation.
[0040]
Next, a seek operation in the moving image reproduction system according to the third embodiment will be described with reference to FIG.
[0041]
[Step ST1]
Multiplexed data 100 is input to the moving picture decoding apparatus 1 via the input / output interface 11.
[0042]
[Step ST21]
Next, the CPU 12 scans the data from the head of the multiplexed data 100, and arranges each encoded data (moving image data, audio / audio data, text data) included in the multiplexed data 100 (multiplex unit). ) The unit of arrangement of each encoded data indicates a section in which packets of the same type of encoded data are continuous. Specifically, as shown in FIG. 8, the arrangement unit of voice / audio data (A) is a section (6 packets) of A1 to A6, and the arrangement unit of moving image data (V) is a section of V1 to V5 (5 Packet), and the arrangement unit of the text data (T) is T1 to T5 (5 packets). If the result of checking the array unit (A, V, T) of each data exceeds the size (As, Vs, Ts) determined for each data as shown in FIG. If it does not exceed the specified size, the process proceeds to step ST2.
[0043]
[Step ST22]
Next, the CPU 12 divides the moving image data, the audio audio data, and the text data so as to be continuous within a predetermined size for each data, and relates to the data type for each divided data. Instead, they are multiplexed in the order of display time. That is, the array unit of each encoded data is divided so as to be equal to or smaller than a predetermined size, and each divided data is multiplexed in order from the one existing at the head of each encoded data as shown in FIG.
[0044]
[Step ST2 to Step ST7]
Next, similarly to the first embodiment, the processing from step ST2 to step ST7 is performed.
[0045]
As described above, by reconstructing the multiplexed data 100, a seek operation is performed even when the arrangement unit of each data included in the multiplexed data 100 exceeds a predetermined size and no frame information exists. Can do.
[0046]
Note that the processing after step ST21 (step ST2 to step ST7) may be performed instead of the processing in step ST11 to step ST7 of the second embodiment.
[0047]
(Fourth embodiment)
The overall configuration of the moving image playback system according to the fourth embodiment is the same as that shown in FIG. 1, but the operation of the CPU 12 is different. In the fourth embodiment, frame information is created and added to the multiplexed data having a new configuration in the third embodiment.
[0048]
Next, a seek operation in the moving image reproduction system according to the fourth embodiment will be described with reference to FIG.
[0049]
[Step ST1]
Multiplexed data 100 is input to the moving picture decoding apparatus 1 via the input / output interface 11.
[0050]
[Step ST21, Step ST22]
Next, the process in step ST21 is performed, and the array unit (A, V, T) of each encoded data included in the multiplexed data 100 is examined. If the result of checking the array unit of each encoded data exceeds the size (As, Vs, Ts) defined as shown in FIG. 8, the process in step ST22 is performed. If the predetermined size is not exceeded, the process proceeds to step ST31.
[0051]
[Step ST31]
Next, the CPU 12 analyzes the multiplexed data 100 or the multiplexed data newly configured in step ST22. That is, the display time information is obtained by examining the arrangement of the array units of each encoded data included in the multiplexed data (multiplexed data 200 or newly constructed multiplexed data). The CPU 12 creates and adds frame information (see FIG. 11) based on the display time information.
[0052]
[Step ST32]
Next, the CPU 12 compares the display time (PTS information) of the frame information with the designated time designated by the user. Then, the frame of the encoded moving image data corresponding to the display time closest on the time axis is searched from the multiplexed data to which the frame information is added.
[0053]
[Step ST33]
Next, the CPU 12 separates the encoded moving image data after the searched frame from the multiplexed data 100 or the multiplexed data newly configured in step ST22. The separated frame of encoded moving image data is stored in the storage memory 13.
[0054]
[Step ST5 to Step ST7]
Next, processing in step ST5 to step ST7 is performed.
[0055]
As described above, by creating the frame information and adding it to the multiplexed data 100, the data position corresponding to the time designated by the user can be obtained simply by referring to the frame information, and the seek operation can be easily performed. .
[0056]
【The invention's effect】
In the moving picture decoding apparatus according to the present invention, when performing a seek operation for displaying a frame at a time designated by a user for multiplexed data not including frame information, the conventional technique may perform the seek operation itself. Although difficult, a seek operation can be performed by using the file size or bit rate of the multiplexed data. Also, by providing means for reconfiguring multiplexed data, it can be reconfigured into a format that allows a seek operation to be performed more easily.
[Brief description of the drawings]
FIG. 1 is a block diagram showing an overall configuration of a moving picture decoding apparatus according to a first embodiment of the present invention.
FIG. 2 is a flowchart showing a processing procedure performed by the video decoding device shown in FIG. 1;
FIG. 3 is an example of multiplexed data shown in FIG. 1;
4 is a diagram showing a method for searching for a data position corresponding to the designated time shown in FIG. 2. FIG.
FIG. 5 is a flowchart showing a processing procedure in the second embodiment of the present invention;
6 is a diagram showing a method for searching for a data position corresponding to the designated time shown in FIG.
FIG. 7 is a flowchart showing a processing procedure in the third embodiment of the present invention;
FIG. 8 is an example of multiplexed data in which each data is continuously arranged exceeding the size determined for each data.
9 is a diagram showing a method for rearranging multiplexed data shown in FIG. 7; FIG.
FIG. 10 is a flowchart showing a processing procedure in the fourth embodiment of the present invention.
FIG. 11 is an example of frame information.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 1 Moving image decoding apparatus 2 Display apparatus 11,15 Input / output interface 12 CPU
13 Storage memory 14 Frame buffer 100 Multiplexed data 200 Designated time information

Claims (4)

AVデータに多重化されている符号化動画像データを復号化する装置であって、
前記符号化動画像データは複数のフレームを含み、
前記装置は、
前記AVデータのデータサイズと、前記AVデータの再生時間と、外部より指定される表示時刻を示す指定時刻とを取得する取得部と、
前記取得部によって取得されたデータサイズ,再生時間,指定時刻を用いて前記AVデータの中から前記指定時刻に対応するデータ位置を検索する検索部と、
前記検索部で得られたデータ位置に対応するフレームを復号化する復号化部とを備える
ことを特徴とする動画像復号化装置。
An apparatus for decoding encoded video data multiplexed with AV data,
The encoded moving image data includes a plurality of frames,
The device is
An acquisition unit that acquires a data size of the AV data, a reproduction time of the AV data, and a designated time indicating a display time designated from outside;
A search unit for searching for a data position corresponding to the specified time from the AV data using the data size, playback time, and specified time acquired by the acquisition unit;
A moving picture decoding apparatus comprising: a decoding unit that decodes a frame corresponding to a data position obtained by the search unit.
AVデータに多重化されている符号化動画像データを復号化する装置であって、
前記装置は、
前記符号化動画像データは複数のフレームを含み、
前記AVデータのビットレートと、外部より指定される表示時刻を示す指定時刻とを取得する取得部と、
前記取得部によって取得された出力速度情報および指定時刻を用いて前記AVデータの中から前記指定時刻に対応するデータ位置を検索する検索部と、
前記検索部で得られたデータ位置に対応したフレームを復号化する復号化部とを備え、
前記ビットレートは、単位時間当たりに消費されるAVデータのデータ量を示す
ことを特徴とする動画像復号化装置。
An apparatus for decoding encoded video data multiplexed with AV data,
The device is
The encoded moving image data includes a plurality of frames,
An acquisition unit for acquiring a bit rate of the AV data and a designated time indicating a display time designated from outside;
A search unit for searching for a data position corresponding to the specified time from the AV data using the output speed information acquired by the acquiring unit and the specified time;
A decoding unit for decoding a frame corresponding to the data position obtained by the search unit,
The video decoding apparatus, wherein the bit rate indicates a data amount of AV data consumed per unit time.
請求項1または請求項2において、
前記AVデータは、
前記符号化動画像データと他の符号化データとが所定の配列単位で多重化されており、
前記動画像復号化装置はさらに、
前記AVデータの配列単位のデータサイズが所定のサイズを超えているか否かを判定する判定部と、
前記AVデータの配列単位のデータサイズが所定のサイズを超えていると前記判定部で判定されたとき、前記AVデータの配列単位のデータサイズが前記所定のサイズ以下になるように前記AVデータ内の各符号化データの並びを変更する再構成部とを備える
ことを特徴とする動画像復号化装置。
In claim 1 or claim 2,
The AV data is
The encoded moving image data and other encoded data are multiplexed in a predetermined array unit,
The video decoding device further includes:
A determination unit for determining whether or not the data size of the array unit of the AV data exceeds a predetermined size;
When the determination unit determines that the data size of the array unit of the AV data exceeds a predetermined size, the data size in the AV data is set so that the data size of the array unit of the AV data is equal to or less than the predetermined size. And a reconstructing unit that changes the arrangement of the encoded data.
AVデータに多重化されている符号化動画像データを復号化する装置であって、
前記AVデータは、
前記符号化動画像データと他の符号化データとが所定の配列単位で多重化されており、
前記装置は、
前記AVデータの配列単位のデータサイズが所定のサイズを超えているか否かを判定する判定部と、
前記前記AVデータの配列単位のデータサイズが所定のサイズを超えていると前記判定部で判定されたとき、前記AVデータの配列単位のデータサイズが前記所定のサイズ以下になるように前記AVデータ内の各符号化データの並びを変更する再構成部と、
前記再構成部によって並びが変更されたAVデータについてのフレーム情報を作成し、作成したフレーム情報を当該AVデータに付加するフレーム情報作成部とを備え、
前記フレーム情報は、
当該AVデータに含まれているフレームの時間軸上における並びを示す情報を含む
ことを特徴とする動画像復号化装置。
An apparatus for decoding encoded video data multiplexed with AV data,
The AV data is
The encoded moving image data and other encoded data are multiplexed in a predetermined array unit,
The device is
A determination unit for determining whether or not the data size of the array unit of the AV data exceeds a predetermined size;
When the determination unit determines that the data size of the array unit of the AV data exceeds a predetermined size, the AV data is set so that the data size of the array unit of the AV data is equal to or less than the predetermined size. A reconstruction unit for changing the order of each encoded data in
A frame information creation unit that creates frame information for the AV data whose arrangement has been changed by the reconstruction unit, and adds the created frame information to the AV data;
The frame information is
A moving picture decoding apparatus comprising information indicating a sequence on a time axis of frames included in the AV data.
JP2003182112A 2003-06-26 2003-06-26 Moving image decoding apparatus Pending JP2005020339A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003182112A JP2005020339A (en) 2003-06-26 2003-06-26 Moving image decoding apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003182112A JP2005020339A (en) 2003-06-26 2003-06-26 Moving image decoding apparatus

Publications (1)

Publication Number Publication Date
JP2005020339A true JP2005020339A (en) 2005-01-20

Family

ID=34182584

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003182112A Pending JP2005020339A (en) 2003-06-26 2003-06-26 Moving image decoding apparatus

Country Status (1)

Country Link
JP (1) JP2005020339A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7773476B2 (en) 2005-02-24 2010-08-10 Kabushiki Kaisha Toshiba Apparatus for reproducing encoded data

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7773476B2 (en) 2005-02-24 2010-08-10 Kabushiki Kaisha Toshiba Apparatus for reproducing encoded data

Similar Documents

Publication Publication Date Title
TWI259719B (en) Apparatus and method for reproducing summary
JP4584250B2 (en) Video processing device, integrated circuit of video processing device, video processing method, and video processing program
US20030035648A1 (en) Navigation for MPEG streams
US8009232B2 (en) Display control device, and associated method of identifying content
JP2004194338A (en) Method and system for producing slide show
KR20050013050A (en) Moving picture data reproducing device
JP4253139B2 (en) Frame information description method, frame information generation apparatus and method, video reproduction apparatus and method, and recording medium
BRPI0609951A2 (en) recording apparatus, reproducing apparatus, recording / reproducing apparatus, recording program and storage media, and playback program and storage media
JP2003510626A (en) Subtitle MP3 player having subtitle information display function, subtitle MP3 information structure, and subtitle MP3 information reproducing method
KR100604831B1 (en) Audio and video player synchronizing ancillary word and image to audio and method thereof
JP2004153764A (en) Meta-data production apparatus and search apparatus
JP2008178090A (en) Video processing apparatus
JP2003272349A (en) Information processor and method, recording medium, and program
JP2005020339A (en) Moving image decoding apparatus
JP6641230B2 (en) Video playback device and video playback method
JP6089970B2 (en) Video data reduction device and playback device
JP3540761B2 (en) Computer system and video playback method
JP2004297229A (en) Image processor, image processing method, image processing system using it, and program
JP2006352587A (en) Information processor
JP2009253342A (en) Information processing device and method
JP3894362B2 (en) Multiple moving image viewing apparatus and recording medium
JP2004088530A (en) Moving picture audio data storage management apparatus and editing method
JP2006074759A (en) Apparatus for browsing plural moving images, and distribution apparatus
JP3979566B2 (en) Time-varying text information segmentation device with moving images
JP4105975B2 (en) Video / audio playback device