JP2015073156A - 画像処理装置、情報処理装置、撮像装置、制御方法、及びプログラム - Google Patents
画像処理装置、情報処理装置、撮像装置、制御方法、及びプログラム Download PDFInfo
- Publication number
- JP2015073156A JP2015073156A JP2013206807A JP2013206807A JP2015073156A JP 2015073156 A JP2015073156 A JP 2015073156A JP 2013206807 A JP2013206807 A JP 2013206807A JP 2013206807 A JP2013206807 A JP 2013206807A JP 2015073156 A JP2015073156 A JP 2015073156A
- Authority
- JP
- Japan
- Prior art keywords
- moving image
- image
- images
- moving
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】再生装置において遷移効果を変更可能な動画像を生成する。
【解決手段】画像処理装置は、複数の画像を取得し、取得した複数の画像を順次切り替えながら進行する第1及び第2の動画像を含む1つの動画像であって、再生方式に応じて第1及び第2の動画像のいずれかを再生可能な1つの動画像を生成する。このとき、第2の動画像の再生において再生されるフレームには、第1の動画像のフレームが含まれる。
【選択図】図1
【解決手段】画像処理装置は、複数の画像を取得し、取得した複数の画像を順次切り替えながら進行する第1及び第2の動画像を含む1つの動画像であって、再生方式に応じて第1及び第2の動画像のいずれかを再生可能な1つの動画像を生成する。このとき、第2の動画像の再生において再生されるフレームには、第1の動画像のフレームが含まれる。
【選択図】図1
Description
本発明は、画像処理装置、情報処理装置、撮像装置、制御方法、及びプログラムに関し、特に階層符号化技術に関する。
デジタルカメラ等のデジタルデータとして撮像画像を記録する撮像装置の普及により、撮像した画像の管理はPC等の情報処理装置で行われることが増えてきている。このような情報処理装置では、画像の閲覧を行う際に画像送り等の操作をユーザに課さずに自動で画像が切り替わりながら提示される、所謂スライドショーによる閲覧が従来可能である。
近年、スライドショーによる画像閲覧の際には、画像の切り替わりにディゾルブやフェードイン/アウト等の使用するトランジション(遷移効果)を設定してスライドショー再生することが可能である。遷移効果における遷移効果の選択は、装置による自動設定だけでなく、ユーザが任意に選択することも可能である。従って、ユーザはスライドショー再生する画像のシーンに合わせて好みの遷移効果を選択し、スライドショー再生することができる。
ところで、遷移効果の付加は画像閲覧をより魅力的あるいはより印象的にする効果をもたらす。故に、ユーザは閲覧対象の画像群に対して所望の背に効果設定を行ったスライドショーを、例えば他のユーザの使用するPC等の他の情報処理装置においても再生可能とすることを望むことがある。しかしながら、スライドショーは通常1つの装置内でのみ使用されるものであるため、他の装置において同一の画像群に対してスライドショー再生を行ったとしても、所望の遷移効果設定が反映されたものとならないことがあった。特許文献1は、このような異なる装置の間でも同一の画像群に対して同様のスライドショー再生が行われるよう、2次元コードを用いて設定された遷移効果を他の装置に伝送する装置が開示されている。
しかしながら、特許文献1のような遷移効果の授受により複数の装置で同様のスライドショー再生を行う方法は、装置が遷移効果を反映したスライドショー再生を行えることが前提となっている。遷移効果は、上述したディゾルブやフェードイン/アウトのような簡素なものだけでなく、3次元効果のような、その生成に一定の演算能力やハードウェアを必要とするものも含まれる。従って、複数の装置が同一のハードウェア構成や演算能力を有さない場合、遷移効果の授受だけでは装置間で同様のスライドショー再生を行えない可能性がある。
一方、符号化された動画像データは、符号化に係るコーデックさえ有する装置であれば、通常再生することができる。つまり、スライドショーを動画像データとして記録することで同一のスライドショーを様々な装置において再生可能とすることができる。しかしながら、スライドショーを動画像として構成する場合、通常、遷移効果は作成した段階で決定した1種類に限定されてしまうため、再生を行う装置において異なる遷移効果が付加されたスライドショーとして再生することはできなかった。
本発明は、上述の問題点に鑑みてなされたものであり、再生装置において遷移効果を変更可能な動画像を生成可能な画像処理装置、情報処理装置、撮像装置、制御方法、及びプログラムを提供することを目的とする。
前述の目的を達成するために、本発明の画像処理装置は、以下の構成を備えることを特徴とする。具体的には画像処理装置は、複数の画像を取得する取得手段と、取得手段により取得された複数の画像を互いに異なる遷移方式で順次切り替えながら進行する第1及び第2の動画像を含む1つの動画像であって、再生方式に応じて第1及び第2の動画像のいずれかを再生可能な1つの動画像を生成する生成手段と、を有し、第2の動画像の再生において再生されるフレームには、第1の動画像のフレームが含まれることを特徴とする。
このような構成により本発明によれば、再生装置において遷移効果を変更可能な動画像を生成することが可能となる。
[実施形態]
以下、本発明の例示的な実施形態について、図面を参照して詳細に説明する。なお、以下に説明する一実施形態は、画像処理装置の一例としての、階層符号化した符号化動画像を生成可能なエンコーダに、本発明を適用した例を説明する。しかし、本発明は、PCやデジタルカメラ等、階層符号化した符号化動画像を生成することが可能な任意の機器に適用可能である。
以下、本発明の例示的な実施形態について、図面を参照して詳細に説明する。なお、以下に説明する一実施形態は、画像処理装置の一例としての、階層符号化した符号化動画像を生成可能なエンコーダに、本発明を適用した例を説明する。しかし、本発明は、PCやデジタルカメラ等、階層符号化した符号化動画像を生成することが可能な任意の機器に適用可能である。
《エンコーダ100の構成》
図1は、本発明の実施形態に係るエンコーダ100の機能構成を示したブロック図である。本実施形態ではエンコーダ100は、例えばPC等の情報処理装置に外部ハードウェアとして接続される、動画像の符号化に係る処理のみを行う装置として説明する。エンコーダ100は、入力としてスライドショーの生成に係る静止画像(対象画像群)を順次受信し、スライドショーに係る1つの符号化動画像を生成し、出力する。
図1は、本発明の実施形態に係るエンコーダ100の機能構成を示したブロック図である。本実施形態ではエンコーダ100は、例えばPC等の情報処理装置に外部ハードウェアとして接続される、動画像の符号化に係る処理のみを行う装置として説明する。エンコーダ100は、入力としてスライドショーの生成に係る静止画像(対象画像群)を順次受信し、スライドショーに係る1つの符号化動画像を生成し、出力する。
なお、図1に示されるエンコーダ100が有する各ブロックは、不図示の制御部により制御されるものとする。具体的には制御部は、同じく不図示のROMに記憶された制御プログラムをRAMに展開して実行することにより、各ブロックの動作を制御する。本実施形態ではエンコーダ100は、H.265(ITU‐T Rec. H.265)方式で符号化を行いスライドショーに係る動画像を生成するものとして説明する。しかしながら、本発明の実施はこれに限られるものではなく、特に時間方向の階層符号化方式を採用する符号化方式(例えばH.264 SVC)が使用されてよい。
動画像化処理部101は、入力された複数の静止画像(以下、単に画像)を用いてスライドショーに係る動画像(スライドショー動画像)のフレームを生成する。スライドショー動画像では入力された複数の画像が順次切り替わりながら進行するように各フレームが構成されている。動画像化処理部101は、入力された複数の画像から、複数の画像の切り替えに係る遷移方式(トランジション)が異なる2種類のスライドショー動画像のフレームを生成する。
本実施形態では簡単のため、動画像化処理部101は2種類のスライドショー動画像を生成するものとして説明するが、動画像化処理部101において生成されるスライドショー動画像は遷移方式が異なっていれば3種類以上生成されてもよい。また簡単のため2種類のスライドショー動画像にはそれぞれ、スライドイン/アウトやフェードイン/アウト等の特殊な遷移効果が付加される遷移方式と、単に画像が連続するフレーム間で特殊な遷移効果なく切り替わる遷移方式が採用されるものとする。また遷移方式が異なるスライドショー動画像とは、切り替えが発生する同一の画像ペアに対して付加される遷移効果が異なっていればよい。即ち、スライドショー動画像に含まれる遷移効果が1種類に制限される必要はなく、同一の遷移効果が含まれていたとしても、複数の画像の切り替えにおいていずれかの遷移効果が異なっていれば2つのスライドショー動画像は遷移方式が異なる動画像に相当する。
また本実施形態ではスライドショー動画像のフレームは、図2に示されるような入力された画像そのもの(ベース画像)、あるいは入力された2つのベース画像間を遷移している経過を示すトランジション画像のいずれかで構成されるものとして説明する。即ち、本実施形態で動画像化処理部101が生成するスライドショー動画像は、全フレームがベース画像で構成される特殊な遷移効果を含まない動画像と、ベース画像及びトランジション画像で構成される特殊な遷移効果を含む動画像の2種類である。これらの動画像は最終的に後述する多重化処理部109において1つの符号化動画像に統合されるため、データ量の削減を考慮して後者の動画像はベース画像そのもので構成されるフレームを含まずに構成されてよい。なお、本発明の実施はこれに限られるものではなく、フレーム内に複数の画像(ベース画像またはトランジション画像)が配置される、フレームにおいて背景画像の一部の領域に画像が重畳される等でフレームは構成されてよい。またさらに動画像化処理部101は、フレームの生成において所定のフォントデータやアイコンデータ、あるいは音声データを多重化させてもよい。
動画像化処理部101は、このようにして生成したスライドショー動画像のフレーム、即ちベース画像とトランジション画像とを、各々を識別する識別情報を関連付けて予測方法決定部102及び予測符号化処理部103に出力する。
予測方法決定部102は、入力されたベース画像及びトランジション画像に基づいて、符号化対象であるこれらの画像内に設定されたブロックごとに、符号化において使用する予測方法を決定し、予測符号化用パラメータに含めて出力する。予測方法の決定において予測方法決定部102は、メモリ104から読み出した先行して符号化されたフレームの復号画像あるいは入力された他の画像を用いて、簡易的な画面内予測あるいは動き検出を含む画面間予測処理を行い符号化効率を示す評価値を算出する。そして予測方法決定部102は、該評価値に基づき、符号化効率を最適とする予測方式を決定する。なお、これらの符号化効率に応じた予測方法の決定は、符号化を行う対象画像(フレーム)がPスライスまたはBスライスである場合の処理である。このとき予測方法決定部102は、画面内予測を行う場合は画面内予測画素ブロックサイズ及び画面内予測モード等の画面内予測符号化用パラメータを決定して予測符号化処理部103に出力する。また画面間予測を行う場合には、参照画像フレーム、画素ブロック分割パターン、動きベクトル等の画面間予測符号化用パラメータを決定して予測符号化処理部103に出力する。なお、符号化を行う対象画像がIスライスである場合は、予測方法決定部102は画面内予測画素ブロックサイズ及び予測モードを決定し、予測符号化処理部103に出力する。
〈予測方法決定処理〉
ここで、本実施形態の予測方法決定部102で実行される予測方法決定処理について、図3のフローチャートを用いてその詳細を説明する。
ここで、本実施形態の予測方法決定部102で実行される予測方法決定処理について、図3のフローチャートを用いてその詳細を説明する。
S301で、予測方法決定部102は、予測方法を決定する対象である対象画像がベース画像であるか否かを判断する。具体的には予測方法決定部102は、対象画像に関連付けられた識別情報を参照し、本ステップの判断を行う。予測方法決定部102は、対象画像がベース画像であると判断した場合は処理をS302に移し、ベース画像ではない、即ちトランジション画像であると判断した場合は処理をS303に移す。
S302で、予測方法決定部102は、予測方法の決定に参照する画像(参照画像)として、メモリ104に記憶されたベース画像に対応する復号画像の中から、対応する画像を設定する。
一方、対象画像がトランジション画像である場合は、予測方法決定部102はS303で、予測方法の決定に参照画像を設定する。具体的には予測方法決定部102は、メモリ104に格納されたベース画像及びトランジション画像の復号画像のうちの対応する画像、あるいは入力された対象画像以外の画像のうちの対応する画像を、参照画像として設定する。
本実施形態では、図4に示されるようにベース画像はベース画像のみ、トランジション画像はベース画像あるいはトランジション画像を用いて復号が可能なように、符号化で参照される参照画像が制御される。このようにして生成された各スライドショー動画像のフレームを各々異なる階層に符号化することで、ベース画像のみで構成された動画像は、符号化動画像から他の階層に符号化されたトランジション画像を参照することなく再生することが可能となる。この場合、ベース画像のみで構成された動画像が下位の階層に符号化され、トランジション画像のみで構成された動画像が上位の階層に符号化されていることが前提となる。
S304で、予測方法決定部102は、S302またはS303において設定された参照画像と対応画像とを用いて予測方法を決定する。このとき、予測方法決定部102は、対応画像がI、P、Bスライスのいずれであるか等の情報と算出した評価値を参照して、対応画像について採用する予測方法を決定する。なお、上述の復号に係る観点から、ベース画像に対しては、画面内予測符号化のみが行われるように予測方法が決定されてもよい。
予測符号化処理部103は、予測方法決定部102から受信した予測符号化用パラメータを参照し、参照画像として設定された復号画像あるいは符号化対象画素ブロックの周辺に位置する復号画像を用いて予測画像を生成する。具体的には予測符号化処理部103は、復号画像の各ブロックに対応する復号データ、あるいは子符号化対象ブロックに隣接する復号画素を用いて、ブロックごとに予測画像を生成する。そして予測符号化処理部103は、対象画像のブロックごとに、予測画像との差分となる予測残差信号を生成し、直交変換・量子化部105に出力する。
メモリ104は、例えば揮発性メモリである。メモリ104は、後述する局所復号部106において復号された復号画像を一時的に格納する格納領域として用いられる。
直交変換・量子化部105は、対象画像のブロックごとの予測残差信号に対して直交変換処理した後、後述する符号量制御部107から入力された量子化パラメータに応じた量子化ステップで量子化処理する。直交変換・量子化部105は、処理の結果得られた量子化データをエントロピー符号化部108及び局所復号部106に出力する。
局所復号部106は、入力された量子化データに対して逆量子化処理、逆直交変換処理を適用し、対応する対象画像について予測符号化処理部103で使用された予測画像を加算することでブロックごとに復号データを生成する。局所復号部106は、復号データをメモリ104に出力し、格納させる。また局所復号部106は、対象画像に対応する複合データに対してデブロッキングフィルタ処理を適用し、復号画像を生成してメモリ104に格納させる。
エントロピー符号化部108は、入力された量子化データに対してスライス単位にCABAC(コンテキスト適応型2値算術符号化)によるエントロピー符号化処理を行う。エントロピー符号化部108は、2値化部、2値化データメモリ、コンテキスト計算部、算術符号下部で構成される。ここで、2値化部は、入力された多値データを2値化し、2値化データを生成し、2値化データメモリは、2値化部により生成された2値化データを格納する。またコンテキスト計算部は2値化データの発生確率をコンテキストに応じて計算して保持し、算術符号下部は、コンテキスト計算部により供給される発生確率に応じて算術符号化を行う。これらの構成を用いて符号化されたデータはスライス単位に多重化処理部109に伝送される。一方でエントロピー符号化部108は、エントロピー符号化により発生した符号量の情報を符号量制御部107に出力する。
符号量制御部107は、符号化ピクチャバッファをオーバーフローまたはアンダーフローさせないように符号化データの符号量を制御する。符号量制御部107は、エントロピー符号化部108から入力されたエントロピー符号化後の発生符号量の情報に基づいて量子化パラメータを生成し、直交変換・量子化部105に伝送する。
多重化処理部109は、エントロピー符号化部108から出力された符号化データを階層符号化し、1つの符号化動画像に係る所定単位の情報を生成する。また多重化処理部109は、必要に応じてシステム情報、再生補助情報等を多重化して符号化動画像を生成する。
本実施形態では多重化処理部109は、時間方向階層化符号化方式を用い、基準層にベース画像のみで構成された動画像に対応する符号化データ、その上位層にトランジション画像のみで構成された動画像に対応する符号化データを含めて符号化動画像を生成する。このとき、階層は時間方向のアップサンプリングを可能にする、即ち時間分解能を拡張するように構成される。図2及び図4に示したように、ベース画像のみで構成されたスライドショー動画像に対し、トランジション画像のみで構成されたスライドショー動画像のフレームレートは高く設定され、前者の動画像のフレーム間を補間するフレームを有している。従って、多重化処理部109は、下位の層である基準層(ベースレイヤ)に対しフレームレートの低いベース画像のみの動画像を配置し、上位の層であるエンハンスドレイヤに対し、フレームレートの高いトランジション画像のみの動画像を配置する。これにより、図5(a)に示されるように、ベースレイヤのみを復号した場合は、ベース画像のみで構成された動画像が再生される。また図5(b)に示されるように、ベースレイヤに加えてエンハンスドレイヤを復号した場合は、(より高いフレームレートの)ベース及びトランジション画像で構成された動画像が再生される動画像を生成することができる。即ち、多重化処理部109において生成された符号化動画像は、復号に用いる階層の設定により、遷移方式が異なる動画像を再生することが可能である。
〈データ構成〉
ここで、本実施形態のエンコーダ100において生成される符号化動画像のデータ構成について、図6を参照して詳細を説明する。
ここで、本実施形態のエンコーダ100において生成される符号化動画像のデータ構成について、図6を参照して詳細を説明する。
ベース画像のみで構成された動画像の符号化データとトランジション画像のみで構成された動画像の符号化データとを異なる階層に配置する構成は、図6に示されるように時間階層を特定する識別子Temporal ID(TID)により実現される。図の例では下位の層に配置されるベース画像のみで構成された動画像に対してはTID0が割り当てられ、上位の層に配置されるトランジション画像のみで構成された動画像に対してはTID1が割り当てられる。
H.265では、映像符号化処理を扱うビデオ符号化層(VCL:Video Coding Layer)と実際の伝送・蓄積のシステムとの間にネットワーク抽象化層(NAL:Network Abstraction Layer)が規定されている。またNALは、NALヘッダとRBSP(Row Byte Sequence Payload)から構成されるNALユニットと呼ばれる単位でパケット化されている。NALヘッダによりNALユニットの種類は識別できるようになっており、続くRBSPに実際の符号化データが格納される。NALユニットの種類には、主に映像符号化データ全体に関する情報であるVPS(Video Parameter Set)、映像符号化データのシーケンスに関する情報であるSPS(Sequence Parameter Set)、映像符号化データのピクチャに関する情報であるPPS(Picture Parameter Set)、映像符号化データ(ここでは総称してVCLと呼ぶ)がある。ここで、VCLは、AU(Access Unit)と呼ばれる単位で格納される。AUは、AUの先頭である事を示すAUD(Access Unit Delimter)、映像符号化データの付加情報であるSEI(Supplemental Enhancement Information)とVCL等で構成される。
図6に示された例では、AU(TID0)がベース画像のみの動画像に対応するVCLを含むAUであり、AU(TID1)がトランジション画像のみの動画像に対応するVCLを含むAUである。即ち、このように構成された符号化動画像について、TID0のAUのみを復号することで、図5(a)のようなベース画像のみで構成された動画像を生成することができる。またTID0のAUとTID1のAUとを復号することで、図5(b)のようなベース画像とトランジション画像で構成された動画像を生成することができる。
なお、本実施形態ではハードウェアとしてエンコーダ100が備える各ブロックにおいて処理が実現されるものとして説明したが、本発明の実施はこれに限らず、各ブロックの処理は該各ブロックと同様の処理を行うプログラムで実現されてもよい。また、例えばPC等の情報処理装置において本発明に係るアプリケーション等が実行される場合に、ユーザによる所望の遷移方式を選択を受け付けた上で、該方式に従い符号化動画像の生成を行うようにしてもよい。このとき、生成された符号化動画像は例えばDVD等の記録媒体に記録されることで、任意の再生装置における読み出しにより、該再生装置において設定されたスライドショー動画像の再生が可能となる。また、例えばデジタルカメラ等の撮像装置において、本発明に係る符号化処理が実行される場合に、ユーザは撮像により取得されて撮像装置の記録手段に記録されている画像から、複数の遷移方式を用いる動画像が符号化された符号化動画像を生成可能であってもよい。この場合も同様に、メモリカード等の記録媒体に記録されることで、他の再生装置において同様の効果が得られる。
また、本実施形態では特殊な遷移効果が付加されたスライドショー動画像と付加されていないスライドショー動画像の2種類を1つの符号化動画像に階層符号化するものとして説明したが、本発明の実施はこれに限られるものではない。即ち、設けられるエンハンスドレイヤは1種類に限定されるものではないため、異なる遷移方式を用いる動画像がさらに異なるエンハンスドレイヤに配置された構成としてもよい。また本実施形態では時間分解能を拡張する階層符号化方式を採用して説明したが、本発明の実施はこれに限られるものではない。即ち、本発明は、異なる遷移方式を用いる動画像を、復号時に各々復号の有無を選択可能な複数の階層それぞれに符号化した符号化動画像を生成するものであればよい。この場合、上位の層の復号の際に下位の層の符号化データを含む2以上のフレームを参照して復号が行われることが好ましい。
以上説明したように、本実施形態の画像処理装置は、再生装置において遷移効果を変更可能な動画像を生成することができる。具体的には画像処理装置は、複数の画像を取得し、取得した複数の画像を順次切り替えながら進行する第1及び第2の動画像を含む1つの動画像であって、再生方式に応じて第1及び第2の動画像のいずれかを再生可能な1つの動画像を生成する。このとき、第2の動画像の再生において再生されるフレームには、第1の動画像のフレームが含まれる。
[変形例]
上述した実施形態では多重化処理部109において2種類のスライドショー動画像が階層符号化された符号化動画像の構成についてのみ説明した。本変形例では、符号化動画像に対して、さらに再生補助情報が多重化される場合の態様について説明する。
上述した実施形態では多重化処理部109において2種類のスライドショー動画像が階層符号化された符号化動画像の構成についてのみ説明した。本変形例では、符号化動画像に対して、さらに再生補助情報が多重化される場合の態様について説明する。
《エンコーダ100の構成》
図7は、本変形例に係るエンコーダ100の機能構成を示したブロック図である。図示されるように、本変形例のエンコーダ100は上述した実施形態のエンコーダ100と同一の構成を有するため、該構成については同一の参照番号を付して説明を省略する。以下、本変形例のエンコーダ100にのみ存在する再生補助情報生成部701について説明する。
図7は、本変形例に係るエンコーダ100の機能構成を示したブロック図である。図示されるように、本変形例のエンコーダ100は上述した実施形態のエンコーダ100と同一の構成を有するため、該構成については同一の参照番号を付して説明を省略する。以下、本変形例のエンコーダ100にのみ存在する再生補助情報生成部701について説明する。
再生補助情報生成部701は、符号化動画像が再生された場合に、再生された動画像の画面内に設定した特定の領域に予め定められた情報を所定の期間保持して重畳表示させるための再生補助情報(SEI)を生成する。SEIには、ユーザ定義のシンタクスを使用可能なuser data SEIが用意されており、user data unregistered SEIを利用してユーザ定義の再生補助情報を生成することが可能である。
図8(a)に、user data unregistered SEIのシンタクスを例示する。シンタクス要素の内、user_data_payload_byte領域にユーザ定義情報を格納することが可能である。またuser data unregistered SEIにユーザ定義情報が格納されていることをuuid_iso_iec_11578によりUUIDとして識別可能にしておくことで、ユーザ定義情報を再生装置に認識させ、利用させることが可能となる。
再生補助情報生成部701は、動画像化処理部101から入力された領域情報及び時間情報に基づく画像領域保持情報をSEIとして生成する。ここでは、user_data_payload_byte領域に格納するための画像領域保持情報を「area_hold_info」、そのSEIを「area_hold_info SEI」と呼ぶものとし、そのシンタクスの定義例を図8(b)に示す。
図8(b)において「area_num」は、画面内に幾つの画像保持領域があるかを示す領域であり、その個数を示している。「area_x」、「area_y」は、それぞれ画面内に対する各画像保持領域の左上の水平座標、垂直座標を画素単位で示し、「area_width」、「area_height」は、それぞれ各画像保持領域の水平画素数、垂直画素数を示す。また「area_hold_time」は、画面領域を保持する時間情報を示す領域であり、単位は実時間(ms)であるものとするが、フレーム数等で表現してもよい。
ここで、図9に示されるような、座標(x0,y0)を起点とする画像領域と座標(x1,y1)を起点とする画面領域内の2つの画面保持領域について具体例を示す。2つの画面保持領域に対する画像領域保持情報は、「area_num」に「2」が格納され、それぞれの画像領域情報は、以下のように格納される。なお、画面領域を保持する時間は共通に3秒(3000ms)であるものとする。
・座標(x0,y0)を起点とする画像領域は、
area_x[0]=50
area_y[0]=50
area_width[0]=480
area_height[0]=160
area_hold_time[0]=3000
・座標(x1,y1)を起点とする画像領域は、
area_x[1]=1230
area_y[1]=910
area_width[1]=640
area_height[1]=120
area_hold_time[1]=3000
・座標(x0,y0)を起点とする画像領域は、
area_x[0]=50
area_y[0]=50
area_width[0]=480
area_height[0]=160
area_hold_time[0]=3000
・座標(x1,y1)を起点とする画像領域は、
area_x[1]=1230
area_y[1]=910
area_width[1]=640
area_height[1]=120
area_hold_time[1]=3000
このように生成した「area_hold_info SEI」を再生補助情報として符号化データに多重化しておくことで、図10に示すように再生装置側で「area_hold_info SEI」に基づき画面内の所定領域を所定時間保持して表示する事が可能となる。図10の例では、画像の切り替えに係る遷移を示すフレームについて、上述の2つの領域に例えば画像名及び撮影日の情報が表示される例を締めしている。
以上のようにベース画像とトランジション画像を異なる時間階層で符号化することにより、1つの符号化データで異なる2つのスライドショー効果を実現可能とし、再生補助情報により更に異なるスライドショー効果を実現することが可能となる。
[その他の実施形態]
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (15)
- 複数の画像を取得する取得手段と、
前記取得手段により取得された前記複数の画像を互いに異なる遷移方式で順次切り替えながら進行する第1及び第2の動画像を含む1つの動画像であって、再生方式に応じて前記第1及び第2の動画像のいずれかを再生可能な1つの動画像を生成する生成手段と、を有し、
前記第2の動画像の再生において再生されるフレームには、前記第1の動画像のフレームが含まれる
ことを特徴とする画像処理装置。 - 前記生成手段は、前記第1の動画像を再生可能な再生方式及び前記第2の動画像を再生可能な再生方式のいずれでも再生可能なように符号化することで前記1つの動画像を生成することを特徴とする請求項1に記載の画像処理装置。
- 前記1つの動画像において前記第1及び第2の動画像は、それぞれの動画像を再生可能な再生方式に対応した識別子により識別されることを特徴とする請求項2に記載の画像処理装置。
- 前記生成手段は、前記第1の動画像の他のフレームのみを参照して前記第1の動画像のフレームを符号化し、前記第1の動画像のフレーム及び前記第2の動画像の他のフレームを参照して前記第2の動画像のフレームを符号化することを特徴とする請求項2または3に記載の画像処理装置。
- 前記第1及び第2の動画像は、各々異なる階層に符号化され、
前記第2の動画像は、前記第1の動画像よりもフレームレートが高く、前記第1の動画像の時間分解能を拡張する動画像であることを特徴とする請求項3乃至4のいずれか1項に記載の画像処理装置。 - 前記第2の動画像は、前記第1の動画像と同一のフレームを含まずに符号化されることを特徴とする請求項5に記載の画像処理装置。
- 前記生成手段は、前記1つの動画像を再生した場合に前記複数の画像の切り替えに係る遷移を示すフレームについては、特定の領域に重畳表示する予め定められた情報を付加して生成することを特徴とする請求項1乃至6のいずれか1項に記載の画像処理装置。
- 前記第1の動画像のフレームには、前記複数の画像のうちの2以上の画像に基づく画像が含まれず、
前記第2の動画像のフレームには、前記複数の画像のうちの2以上の画像に基づく画像が含まれる
ことを特徴とする請求項1乃至7のいずれか1項に記載の画像処理装置。 - 前記第1の動画像は、前記複数の画像の切り替えに特殊な遷移効果を使用しない遷移方式を用いた動画像であることを特徴とする請求項1乃至8のいずれか1項に記載の画像処理装置。
- 複数の画像を取得する取得手段と、
前記取得手段により取得された前記複数の画像を互いに異なる遷移方式で順次切り替えながら進行する第1及び第2の動画像の各々について切り替えに係る遷移方式を決定する決定手段と、
前記第1及び第2の動画像を含む1つの動画像であって、再生方式に応じて前記第1及び第2の動画像のいずれかを再生可能な1つの動画像を生成する生成手段と、
前記生成手段により生成された前記1つの動画像を記録手段に記録する制御手段と、を有し、
前記第2の動画像の再生において再生されるフレームには、前記第1の動画像のフレームが含まれる
ことを特徴とする情報処理装置。 - 撮像により得られた画像を記録手段に記録する撮像手段と、
前記記録手段に記録されている複数の画像を取得する取得手段と、
前記取得手段により取得された前記複数の画像を互いに異なる遷移方式で順次切り替えながら進行する第1及び第2の動画像を含む1つの動画像であって、再生方式に応じて前記第1及び第2の動画像のいずれかを再生可能な1つの動画像を生成する生成手段と、
前記生成手段により生成された前記1つの動画像を前記記録手段に記録する制御手段と、を有し、
前記第2の動画像の再生において再生されるフレームには、前記第1の動画像のフレームが含まれる
ことを特徴とする撮像装置。 - 画像処理装置の取得手段が、複数の画像を取得する取得工程と、
前記画像処理装置の生成手段が、前記取得工程において取得された前記複数の画像を互いに異なる遷移方式で順次切り替えながら進行する第1及び第2の動画像を含む1つの動画像であって、再生方式に応じて前記第1及び第2の動画像のいずれかを再生可能な1つの動画像を生成する生成工程と、を有し、
前記第2の動画像の再生において再生されるフレームには、前記第1の動画像のフレームが含まれる
ことを特徴とする画像処理装置の制御方法。 - 情報処理装置の取得手段が、複数の画像を取得する取得工程と、
前記情報処理装置の決定手段が、前記取得工程において取得された前記複数の画像を互いに異なる遷移方式で順次切り替えながら進行する第1及び第2の動画像の各々について切り替えに係る遷移方式を決定する決定工程と、
前記情報処理装置の生成手段が、前記第1及び第2の動画像を含む1つの動画像であって、再生方式に応じて前記第1及び第2の動画像のいずれかを再生可能な1つの動画像を生成する生成工程と、
前記情報処理装置の制御手段が、前記生成工程において生成された前記1つの動画像を記録手段に記録する制御工程と、を有し、
前記第2の動画像の再生において再生されるフレームには、前記第1の動画像のフレームが含まれる
ことを特徴とする情報処理装置の制御方法。 - 撮像により得られた画像を記録手段に記録する撮像手段を有する撮像装置の制御方法であって、
前記撮像装置の取得手段が、前記記録手段に記録されている複数の画像を取得する取得工程と、
前記撮像装置の生成手段が、前記取得工程において取得された前記複数の画像を互いに異なる遷移方式で順次切り替えながら進行する第1及び第2の動画像を含む1つの動画像であって、再生方式に応じて前記第1及び第2の動画像のいずれかを再生可能な1つの動画像を生成する生成工程と、
前記撮像装置の制御手段が、前記生成工程において生成された前記1つの動画像を前記記録手段に記録する制御工程と、を有し、
前記第2の動画像の再生において再生されるフレームには、前記第1の動画像のフレームが含まれる
ことを特徴とする撮像装置の制御方法。 - コンピュータを、請求項1乃至9のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013206807A JP2015073156A (ja) | 2013-10-01 | 2013-10-01 | 画像処理装置、情報処理装置、撮像装置、制御方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013206807A JP2015073156A (ja) | 2013-10-01 | 2013-10-01 | 画像処理装置、情報処理装置、撮像装置、制御方法、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015073156A true JP2015073156A (ja) | 2015-04-16 |
Family
ID=53015257
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013206807A Pending JP2015073156A (ja) | 2013-10-01 | 2013-10-01 | 画像処理装置、情報処理装置、撮像装置、制御方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015073156A (ja) |
-
2013
- 2013-10-01 JP JP2013206807A patent/JP2015073156A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114009053A (zh) | 用于视频编码和解码的装置、方法和计算机程序 | |
CN113498606A (zh) | 用于视频编码和解码的装置、方法和计算机程序 | |
JP2005094168A (ja) | ファイル構造及びそれを用いる画像記録装置並びに画像再生装置 | |
KR20070122156A (ko) | 서브-프레임 메타데이터를 이용한 적응적 비디오 프로세싱회로 및 플레이어 | |
WO2015199040A1 (ja) | Dmm予測部、画像復号装置、および画像符号化装置 | |
CN112153391B (zh) | 视频编码的方法、装置、电子设备及存储介质 | |
TW200910975A (en) | Video encoding method and decoding method, apparatuses therefor, programs therefor, and storage media for storing the programs | |
JP7376705B2 (ja) | ポイントクラウドデータ送信装置、ポイントクラウドデータ送信方法、ポイントクラウドデータ受信装置およびポイントクラウドデータ受信方法 | |
US11388437B2 (en) | View-position and angle dependent processing of point cloud data | |
CN110708557A (zh) | 解码器中的视频解码方法和设备、计算机设备 | |
US20240107049A1 (en) | Information processing device and information processing method | |
JP7434574B2 (ja) | ポイントクラウドデータ送信装置、ポイントクラウドデータ送信方法、ポイントクラウドデータ受信装置及びポイントクラウドデータ受信方法 | |
CN111182308A (zh) | 视频解码方法、装置、计算机设备及存储介质 | |
JP6209026B2 (ja) | 画像符号化装置及びその制御方法 | |
WO2013146636A1 (ja) | 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラム | |
US9648336B2 (en) | Encoding apparatus and method | |
KR101584111B1 (ko) | 클라우드 컴퓨팅을 이용한 멀티미디어 서비스 품질 향상 방법 및 이를 위한 기기 | |
WO2016002494A1 (ja) | 情報処理装置および方法 | |
JP7488355B2 (ja) | ラップアラウンド動き補償に基づく画像符号化/復号化方法及び装置、並びにビットストリームを保存した記録媒体 | |
JP2015073213A (ja) | 画像復号装置、画像符号化装置、符号化データ変換装置、および、注目領域表示システム | |
JP2015073156A (ja) | 画像処理装置、情報処理装置、撮像装置、制御方法、及びプログラム | |
JP2011146847A (ja) | 画像再生制御装置、画像再生制御方法および撮像装置 | |
JP2009164937A (ja) | 動画像の多重化方法とファイル読み込み方法及び装置,並びにそのプログラムとコンピュータ読み取り可能な記録媒体 | |
JP2020080479A (ja) | 動画記録再生装置、動画伝送システムおよび方法 | |
JP2016072941A (ja) | Dmm予測装置、画像復号装置、および画像符号化装置 |