WO2003041407A1

WO2003041407A1 - Moving picture coding apparatus

Info

Publication number: WO2003041407A1
Application number: PCT/JP2002/011383
Authority: WO
Inventors: Maki Takahashi; Toshio Nomura
Original assignee: Sharp Kabushiki Kaisha
Priority date: 2001-11-05
Filing date: 2002-10-31
Publication date: 2003-05-15
Also published as: JPWO2003041407A1; JP4215643B2

Description

明細書動画像符号化装置技術分野

本発明は、複数の部品画像データによつて構成される動画像データを符号化する動画像符号化装置に関するものである。背景技術

複数の部品画像データからなる動画像データを符号化する従来技術としては、例えば特開平 1 0— 3 3 6 6 6 9号公報で示されている動画像符号化装置が知られている。この動画像符号ィヒ装置は、再生装置での動画像符号化データへの任意の時刻からの再生を実現するため、部品画像データ毎に、周期的にランダムァクセスの基点となるキーフレームを設け、当該フレームを符号化するものである。このように符号化することで、再生装置では、任意のキーフレームからの部品画像データの再生を容易に行うことが可能となる。また、任意の時刻からのデー夕を再生する場合には、全ての部品画像データに対して指定時刻の直前のキーフレームを検索し、それ以降の部品画像符号化データを復号し指定時刻以降の画像を表示することにより実現することができる。

しかしながら、上述した従来の動画像符号化装置においては、部品画像データ毎に異なる周期でキーフレームが作成されるため、再生装置で所定の時刻の画像を表示するには、当該時刻の画像を構成する部品画像の復号だけでなく、部品画像毎に当該時刻直前のキ一フレームから当該時刻までの全ての符号化データを復号しなければならなかった。そのため、高速再生や巻き戻し再生等の特殊再生を行うことが困難であるという問題があった。

本発明は、上記課題に鑑みてなされたものであり、高速再生や巻き戻し再生等の特殊再生を容易に実現することが可能な動画像符号化装置を提供するものである。発明の開示

本発明は、上記の目的を達成するため、次の構成を有する。

本願の第 1の発明は、複数の部品画像データからなる動画像データを符号ィ匕する動画像符号化装置であって、前記部品画像データを符号化し、部分画像符号化データを生成する部品画像符号化部と、前記部品画像符号化部が所定再生時刻の当該部品画像データをキーフレームとして符号化するか否かを制御するキーフレーム制御部とを備え、前記キ一フレーム制御部が、所定再生時刻の動画像デ一夕を構成する全ての部品画像データをキ一フレームとして符号化するよう制御することを特徴とする。

本願の第 2の発明は、前記キーフレーム制御部が、所定の時間間隔で周期的にキーフレームを生成するよう制御を行うことを特徴とする。

本願の第 3の発明は、前記キーフレーム制御部が、キーフレームとして符号化すべき動画像データの再生時刻の時間情報を前記部品画像符号ィヒ部に通知することでキーフレーム生成の制御を行い、前記部品画像符号ィ匕部が、前記キ一フレーム制御部から通知された時間情報に従つて、当該再生時刻以降の直近の部品画像データをキーフレームと判定し、当該再生時刻の部品画像データをキ一フレームとして符号化することを特徴とする。

本願の第 4の発明は、前記キーフレーム制御部が、キーフレームとして符号化すべき動画像データの再生時刻の時間情報を前記部品画像符号化部に通知することでキーフレーム生成の制御を行い、前記部品画像符号ィ匕部が、前記キーフレーム制御部から通知された時間情報に従って、当該再生時刻に部品画像データが存在しない場合には、直近の部品画像データから補間された部品画像デ一夕を作成し、当該部品画像データをキーフレームとして符号化することを特徴とする。本願の第 5の発明は、前記部品画像符号化部が、前記部品画像デ一夕をフレーム内符号化もしくはフレーム間符号ィ匕を用いて符号ィ匕し、キーフレームはフレーム内符号ィ匕を用いて符号ィ匕することを特徴とする。

本願の第 6の発明は、さらに動画像データを解析する画像解析部を備え、前記キ一フレーム制御部が、前記画像解析部による画像解析結果を基にキ一フレームを決定することを特徴とする。

本願の第 7の発明は、前記部品画像符号化デ一夕をパケット多重化する多重化部を備え、前記多重化部が生成するバケツ卜が、分割された複数の部品画像符号化データに加え、付加情報として当該パケットにキ一フレームとして符号ィ匕された部品画像符号化データの存在を示すフラグを含み、更にキーフレームが存在する場合には、当該再生時刻を示す時刻情報を含むことを特徴とする。

本願の第 8の発明は、前記部品画像符号化データをパケット多重化する多重化部を備え、前記多重化部が生成するバケツ卜が、分割された複数の部品画像符号化デ一夕に加え、付加情報として当該パケッ卜に含まれるキ一フレームの再生時刻を示す時刻情報を含み、当該バケツトにキーフレームが含まれていない場合には、該時刻情報には無効な時刻情報を設定することを特徴とする。図面の簡単な説明

図 1は、本発明の第 1の実施形態における動画像符号化装 ttの概略構成を示すブロック図である。

図 2は、複数の部品画像デ一夕から構成される動画像データを示す模式図である。

図 3は、本発明の第 1の実施形態における部品画像符号化部の動作を示すフ口一チヤ一卜である。

図 4は、本発明の第 1の実施形態における部品画像符号化部の動作（フレーム間相関利用時）を示すフローチャートである。図 5は、本発明の第 1の実施形態における動画像符号化装置により生成された動画像符号化データのデータ構成を示す説明図である。

図 6は、本発明の第 2の実施形態における動画像符号化装置の概略構成を示すブロック図である。

図 7は、本発明の第 3の実施形態における動画像符号化装置の概略構成を示すブロック図である。

図 8は、本発明の第 3の実施形態における動画像符号化装置により生成される動画像符号化デ一夕の構成を示す説明図である。発明を実施するための最良の形態

以下、本発明の実施の形態について、図面を参照しながら説明する。なお、以下の説明では、図 2に示すように 2つの部品画像デ一夕から構成される動画像データを取り扱う場合について説明する。ここで部品画像デ一夕とは矩形あるいは任意の形状をした画像データであり、形状が時間の経過と共に変ィヒするものであってもかまわない。図 2 ( a ) は背景を表す矩形の部品画像データ O B J 1、図 2 ( b ) は人物を表す任意形状の部品画像デ一夕 O B J 2であり、図 2 ( d ) は、これら 2つの部品画像データから構成された動画像デ一夕である。図 2 ( b ) における〇B J 2は被写体である人物の形状をした任意形状の部品画像データであるが、このような任意形状の部品画像データを作成するのが困難な場合には、図 2 ( c ) に示すように被写体となる人物を含む一定の大きさの矩形領域を. O B J 3とし、図 2 ( e )に示すような O B J 1、 O B J 3から構成される動画像デー夕を取り扱ってもかまわない。また、フレームとは所定時刻における任意の形状. をした部品画像データを指し、キーフレームとは部品画像符号ィ匕データに対するランダムアクセスの基点であり、当該符号化データ単体で復号及び表示可能なフレームを指すものとして説明する。

図 1は本発明の第 1の実施形態における動画像符号化装置を示すプロック図である。本実施形態の動画像符号化装置は、部品画像符号化部 1一 1、 1一 2、キーフレーム制御部 2を備えている。当該動画像符号化装置に入力される動画像デー夕は、部品画像データ O B J 1、 O B J 2毎に異なる部品画像符号化部 1 _ 1、 1 - 2に入力され、個別に符号化が行われる。

図 1のブロック図では省略したが、本実施形態の動画像符号化装置の入力動画像データを生成する手段として、撮像装置を加えた構成としてもよい。また撮像装置の代わりに、動画像復号部を加え、既存の動画像符号化データを再符号化する構成としてもよい。

なお、部品画像データ O B J 1 , O B J 2の符号化方式は、例えば MP E G— 4のように、部品画像データを扱う符号化方式であれば、どのような符号化方式を用いてもかまわない。また、部品画像デ一夕 0 B J 1、 O B J 2はそれぞれ異なる符号化方式で符号化されてもかまわない。

キ一フレーム制御部 2は、部品画像符号化部 1— 1、 1—2に対し、生成された部品画像符号ィ匕データに対するランダムアクセスの基点となるキーフレーム生成の制御を行う。キ一フレーム生成の制御は、符号化すべき動画像データの再生時刻の時刻情報を部品画像符号化部 1一 1、 1一 2に対し通知することで行う。また、キ一フレーム制御部 2は、キーフレームが所定の時間間隔で周期的に生成されるように制御を行い、部品画像符号化部 1— 1、 1—2に対して同じ時刻情報を通知する。部品画像符号化部 1一 1、 1 _ 2は、通知された時刻情報に従つて、それぞれ部品画像デ一夕 O B J 1、〇B J 2の当該再生時刻のフレームをキ一フレームとして符号化する。 °

本実施形態の動画像符号化装置では、動画像データを構成する全ての部品画像データが同期して周期的にキーフレームとして符号化されるので、再生装置では、所定の周期で生成されたキ一フレームのみを選択的に復号、表示を行うことで、高速再生や巻き戻し再生等の特殊再生を容易に行うことが可能である。

なお、キーフレーム生成の制御は、キーフレームとして符号化する部品画像デー夕の再生時刻の時刻情報を通知することで行うものとしたが、キーフレームを符号化するフレーム間隔や時間間隔を予め部品画像の符号化開始に先立って通知する方法でもかまわない。また、キーフレームを生成する周期は固定としても、符号化する動画像データに応じて外部から指定できるようにしてもかまわない。次に、部品画像符号化の詳細について説明する。図 3は部品画像 1フレームを符号化する際の部品画像符号化部 1— 1、 1—2の動作を示すフローチャートである。まずは、当該部品画像データの符号化対象フレームの再生時刻 Tと、キーフレーム制御部 2によって指定されたキ一フレームとして符号化すべき動画像データの再生時刻 T Oを比較する（ステップ 0 0 1 )。

Tく T Oの場合、当該フレームを通常のフレームとして符号化し（ステップ 0

1 0 ) 処理を終了する。 T = T 0あるいは T>T 0の場合、既に当該キーフレ一ムが符号化完了しているか否かを示すフラグ Fを判定する (ステップ 0 0 2 )。ただし、フラグ Fはキ一フレーム制御部 2から新たな時刻情報が通知されるたびた別途 F = F A L S Eに初期化されているものとする。

F = F AL S Eの場合、当該キ一フレームはまだ符号化されていないので、 F

= T RUEに設定し（ステップ 0 2 0 )、当該フレームをキ一フレームとして符号化し（ステップ 0 2 1 )、処理を終了する。 F = T RUEの場合、既に当該キーフレームの符号ィ匕は完了しているので通常フレームとして符号化し（ステップ 0 1 0 )、処理を終了する。

以上のように部品画像データの符号化を行うことで、キーフレーム制御部 2が指定した再生時刻 T 0以降の最初のフレームがキーフレームとして符号ィ匕される。ただし、再生装置で任意のフレームからの再生が必要とされない場合には、キ一フレーム制御部 2が指定した再生時刻 T 0以外をキーフレームとして符号化しなくてもかまわない。

また、部品画像データの符号化方式に、フレーム間の相関を利用した符号化方式を用いる場合には、キ一フレームは当該フレームの符号化データ単体での復号及び再生を保証するためフレーム間の相関は利用せず、必ずィントラピクチャとして符号化しなければならず、この場合の部品画像符号ィ匕部 1 _ 1、 1— 2の動作フ口一は図 4に示すようになる。すなわち、ステップ 0 2 1においては、当該フレームをキーフレームとしてフレーム内符号化（イントラ符号化）を行う。次に、符号ィ匕された動画像データの構成例と再生装置におけるキーフレームの働きについて図 5を用いて説明する。図 5においては、再生時刻 T O、 T l、 T

2のフレームをキ一フレームとして符号ィ匕するようキーフレーム制御部 2が制御を行った場合に生成された動画像符号化デ一夕について、符号化されたフレームを再生時刻順に図示している。

図 5 ( a ) は、再生時刻 T 0、 T l、 Τ 2における入力部品画像デ一タ〇B J

1、 O B J 2が存在する場合を示している。この場合、部品画像データ〇B J 1、

O B J 2共、再生時刻 T Oのフレームがキーフレームとして符号ィ匕されている。再生装直で任意の時刻からの動画像データを再生する場合には、当該時刻直前のキーフレームから復号し、当該時刻以降のフレームを表示することで再生可能である。また、高速再生、巻き戻し再生は、所定の周期でキーフレ一ムとして符号化された時刻 T 0、 T 1、 T 2におけるキーフレ一ムのみ順或いは逆順に再生することで可能である。

図 5 ( b ) は、例えば人物が移動しながら画面内にフレームインしてくる場合等、入力部品画像データの出現開始時刻が異なる場合の例である。部品画像デー夕 0 B J 2は再生時刻 T 0時点ではまだデータが存在しておらず、再生時刻 T 0 のフレームに代わつて部品画像デ一夕 O B J 2の出現した再生時刻 T 3のフレームがキ一フレームとして符号化されている。

この場合も、図 5 ( a ) と同様の方法で、任意の時刻からの動画像データの再生、高速再生、巻き戻し再生が可能である。ただし、高速再生、巻き戻し再生を行う場合には、所定の周期でキーフレームとして符号化された、 T O , T l、 T

2におけるフレームのみ順或いは逆順に再生することに注意する。この時、 Τ 3 における部品画像データ〇B J 2のキーフレームは、再生時刻 T 3以降 T 1未満の再生時刻からの再生を開始する場合にのみ利用する。

また、上記の説明では、入力部品画像データのフレームレートが同一であるものとして説明しているが、フレームレ一トの異なる部品画像データを取り扱う場合には、次のように処理することで対応することができる。例えば部品画像データ〇 B J 2のフレームレ一トが部品画像データ 0 B J 1の 3分の 1の場合の例を図 5 ( c ) に示す。

この例では、入力部品画像データとして、再生時刻 T l、丁2には〇：6 2のデータが存在しない塲合を示している。このような場合には、再生時刻 Τ 1、 Τ 2における部品画像データ〇B J 2のフレ一ムを、直近のフレームから補間した補間画像として作成し、キーフレームとして符号化することで図 5 ( a)、 ( b ) と同様に再生装置では高速再生等を実現すること力 Sできる。

次に、本発明の第 2の実施形態について、図 6とともに説明するが、上述した第 1の実施形態と同一部分には同一符号を付し、その説明は省略する。図 6は本実施形態における動画像符号化装置のブロック図である。本実施形態の動画像符号化装置は、第 1の実施形態における動画像符号化装置の構成に加え、動画像デ一夕の解析を行う画像解析部 3を備えて構成している。

本実施形態の動画像符号化装置においては、入力動画像データ O B J 1 , O B J 2は部品画像符号化部 1一 1、 1一 2で符号化されると共に、画像解析部 3に入力される。画像解析部 3は動画像データの特徴を解析することでシーンチェンジの検出を行う。キーフレーム制御部 2は画像解析部 3の解析結果を基に、シーンチェンジが発生したと判断された当該フレームをキーフレームとして符号化するよう部品画像符号化部 1一 1、 1一 2の制御を行う。

画像解析部 3が行うシーンチェンジの検出は、例えば、部品画像データの輝度値の急激な時間変化や、動画像データを構成する部品画像データ数の変化を検出することで行う。また、部品画像符号化部 1— 1、 1—2が部品画像デ一夕の符号化のために、同様の画像解析を行う機能を備える場合には、画像解析部 3の機能を部品画像符号化部 1一 1、 1—2が兼ねてもかまわない。シーンチェンジに合わせてキ一フレームの生成を行うことで、再生装置では、動画像データを構成するシーン毎の正確な頭出しを容易に実現することができる。

ところで、複数の部品画像符号化データから成る動画像符号化データを扱う場合、複数の部品画像データをバケツト多重化し 1つの多重化動画像符号化データとして、伝送或いは蓄積するのが一般的である。

次に、本発明の第 3の実施形態として複数の部品画像符号化データをパケット多重ィ匕する場合について、図 7及び図 8とともに説明するが、上述した第 1の実施形態と同一部分には同一符号を付し、その説明は省略する。図 7は本実施形態における動画像符号化装置のブロック図である。

本実施形態の動画像符号化装置は、第 1の実施形態における動画像符号化装置の構成に加え、複数の部品画像符号化データをバケツト多重化し 1つの動画像符号化データにまとめる多重化部 4を備えて構成している。多重化部 4は、複数の部品画像データをパケット多重化すると共に、キーフレームに関する情報を付加した多重化動画像符号化デ一タを出力する。

本実施形態の動画像符号化装置の特徴を説明するため、当該動画像符号化装置が生成する動画像符号化デ一夕の構成について、図 8を用いて説明する。動画像符号化データは、複数のパケット P 1から P nによって構成され、各パケット P iには、例えば 1フレーム単位に分割された複数の部品画像符号化データ P i一 D 1から P i— Dmと付加情報が格納されている。

付加情報は、当該パケット内にキーフレームの符号化データが存在することを示すフラグとキーフレームが存在する場合には、当該キーフレームの再生時刻を示す時間情報から成り、再生装置が当該付加情報を用いることで、多重分離することなく、所定時刻のキ一フレーム検索が可能になる。

さらに、当該パケット内にキ一フレームの符号化データが存在することを示すフラグとキーフレームが存在する場合には、一定の周期で生成されたキーフレームを含むパケットだけを選択的に多重分離することが可能なため、高速再生、巻き戻し再生等の特殊再生を行う場合に、不要なバケツトの多重分離を省略することができる。また、キーフレームの存在を示すフラグを省略し、各パケットに当該パケットに含まれるキ一フレームの再生時刻の時刻情報を付加する構成として、キーフレームが含まれないバケツトには無効な時刻情報を設定することでキーフレームの有無を判定可能としてもかまわない。

また、パケット毎にキ一フレームに関する情報を付加する代わりに、キ一フレームの当該再生時刻と当該キーフレームを含むパケットの識別子との組を付加情報として、動画像符号ィ匕データの先頭や最後にまとめて出力する構成でもかまわない。

以上のように、本発明の動画像符号化装置においては、周期的にキーフレームを符号化することで、動画像符号化デ一夕の任意の時刻からの再生を実現すると共に、全ての部品画像データのキーフレーム符号化時刻を一致させることで、再生装置が高速再生や巻き戻し再生等の特殊再生を容易に実現可能な動画像符号化データを作成することができる。

また、本発明の動画像符号化装置においては、生成される動画像符号化デ一夕を構成するパケットに付加情報として、当該バケツ卜にキーフレームの符号化データが存在するか否かを示すフラグを付加し、当該フラグを参照することで、動画像符号化デ一タ内のキーフレームを容易に検索することが可能である。

さらに、キ一フレームのみを復号し、高速再生や巻き戻し再生を実現する場合には、該フラグを参照することで、キーフレームを含むパケットのみを選択的に多重分離することが可能であり、不要なバケツトの多重分離を省略することができる。産業上の利用可能性本発明に係る動画像符号化装置は、複数の部品画像データによつて構成される動画像データを符号化するにあたり、高速再生や巻き戻し再生等の特殊再生を行う動画像符号化装置に適している。

Claims

請求の範囲

1 . 複数の部品画像デ一夕からなる動画像データを符号化する動画像符号化装置であって、

前記部品画像デ一タを符号化し、部分画像符号化データを生成する部品画像符号化部と、

前記部品画像符号化部が所定再生時刻の当該部品画像データをキーフレームとして符号ィ匕するか否かを制御するキーフレーム制御部とを備え、

前記キーフレーム制御部は、所定再生時刻の動画像データを構成する全ての部品画像データをキ一フレームとして符号化するよう制御することを特徴とする動画像符号化装置。

2 . 前記請求の範囲第 1項に記載の動画像符号化装置において、

前記キーフレーム制御部は、所定の時間間隔で周期的にキーフレームを生成するよう制御を行うことを特徴とする動画像符号化装置。

3 . 前記請求の範囲第 1項又は第 2項に記載の動画像符号化装置において、前記キーフレーム制御部は、キーフレームとして符号化すべき動画像デ一夕の再生時刻の時間情報を前記部品画像符号化部に通知することでキーフレーム生成の制御を行い、

前記部品画像符号化部は、前記キーフレーム制御部から通知された時間情報に従って、当該再生時刻以降の直近の部品画像データをキーフレームと判定し、当該再生時刻の部品画像データをキーフレームとして符号化することを特徴とする動画像符号化装置。

4. 前記請求の範囲第 1項又は第 2項に記載の動画像符号化装置において、前記キーフレーム制御部は、キーフレームとして符号化すべき動画像デ一夕の再生時刻の時間情報を前記部品画像符号化部に通知することでキーフレーム生成の制御を行い、前記部品画像符号化部は、前記キーフレーム制御部から通知された時間情報に従って、当該再生時刻に部品画像データが存在しない場合には、直近の部品画像データから補間された部品画像データを作成し、当該部品画像データをキーフレームとして符号化することを特徴とする動画像符号化装置。

5 . 前記請求の範囲第 1項乃至第 4項のいずれかに記載の動画像符号化装置において、

前記部品画像符号化部は、前記部品画像データをフレーム内符号化もしくはフレーム間符号化を用いて符号化し、キーフレームはフレーム内符号化を用いて符号化することを特徴とする動画像符号化装置。

6 . 前記請求の範囲第 1項乃至第 5項のいずれかに記載の動画像符号化装置において、

動画像データを解析する画像解析部を備え、

前記キーフレーム制御部は、前記画像解析部による画像解析結果を基にキーフレームを決定することを特徴とする動画像符号化装置。

7 . 前記請求の範囲第 1項乃至第 6項のいずれかに記載の動画像符号化装置において、

前記部品画像符号化デ一夕をパケット多重化する多重化部を備え、

前記多重化部が生成するバケツトは、分割された複数の部品画像符号ィ匕データに加え、付加情報として当該パケットにキ一フレームとして符号ィヒされた部品画像符号化データの存在を示すフラグを含み、更にキ一フレームが存在する場合には、当該再生時刻を示す時刻情報を含むことを特徴とする動画像符号化装置。

8 . 前記請求の範囲第 1項乃至第 6項のいずれかに記載の動画像符号化装置において、

前記部品画像符号化データをバケツト多重化する多重化部を備え、

前記多重化部が生成するパケットは、分割された複数の部品画像符号化デ一夕に加え、付加情報として当該バケツトに含まれるキーフレームの再生時刻を示す時刻情報を含み、当該パケットにキーフレームが含まれていない場合には、該時刻情報には無効な時刻情報を設定することを特徴とする動画像符号化装置。