JP2005252753A - 画像処理装置、位置ずれ記憶方法、及びシーン記憶方法 - Google Patents
画像処理装置、位置ずれ記憶方法、及びシーン記憶方法 Download PDFInfo
- Publication number
- JP2005252753A JP2005252753A JP2004061715A JP2004061715A JP2005252753A JP 2005252753 A JP2005252753 A JP 2005252753A JP 2004061715 A JP2004061715 A JP 2004061715A JP 2004061715 A JP2004061715 A JP 2004061715A JP 2005252753 A JP2005252753 A JP 2005252753A
- Authority
- JP
- Japan
- Prior art keywords
- scene
- image
- positional deviation
- images
- amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Processing (AREA)
- Television Signal Processing For Recording (AREA)
- Image Analysis (AREA)
Abstract
【課題】 複数の画像から、パンシーンやパノラマ画像を生成することができるシーンを特定するために、動画像の再生や静止画像の表示を行って確認しなければならず、手間が掛かっていた。
【解決手段】 時系列に隣り合う2つのフレーム画像間の位置ずれ量を推定し、推定した位置ずれ量を、時系列上で後となるフレーム画像のフレーム番号と共に位置ずれ情報として記憶しておく。この位置ずれ情報を用い、位置ずれ量が左右に連続するフレーム番号を特定してパンシーンを特定し、また、位置ずれ量から推定されるデジタルビデオカメラの動き量を順次足し合わせてしきい値と比較して、パノラマ画像を生成することができるシーンを特定する。そして、特定した各シーンの開始及び終了フレーム番号を、それぞれ記憶しておく。この記憶された開始及び終了フレーム番号を確認することで、パンシーンやパノラマ画像を生成することができるシーンを、簡易に特定することができる。
【選択図】 図1
【解決手段】 時系列に隣り合う2つのフレーム画像間の位置ずれ量を推定し、推定した位置ずれ量を、時系列上で後となるフレーム画像のフレーム番号と共に位置ずれ情報として記憶しておく。この位置ずれ情報を用い、位置ずれ量が左右に連続するフレーム番号を特定してパンシーンを特定し、また、位置ずれ量から推定されるデジタルビデオカメラの動き量を順次足し合わせてしきい値と比較して、パノラマ画像を生成することができるシーンを特定する。そして、特定した各シーンの開始及び終了フレーム番号を、それぞれ記憶しておく。この記憶された開始及び終了フレーム番号を確認することで、パンシーンやパノラマ画像を生成することができるシーンを、簡易に特定することができる。
【選択図】 図1
Description
本発明は、動画像等の複数の画像から成る画像群から、時系列に並んだ一連の画像群として、パンもしくはチルトと呼ばれるカメラワークで撮影された画像群や、パノラマ画像または縦長画像などの合成画像を生成することができる画像群を、簡易に特定することが可能な技術に関する。
従来、動画像等の複数の画像から成る画像群から、パノラマ画像を生成し、生成したパノラマ画像を表示または印刷したいという要望があった。一般に、パノラマ画像は、デジタルビデオカメラ等の撮影装置を左右のいずれかの方向に移動させる、いわゆるパンと呼ばれるカメラワークで撮影された複数の画像を合成して生成されるので、まず、複数の時系列に並んだ一連の画像群(以下、「シーン」と呼ぶ)として、パンで撮影されたシーン(以下、「パンシーン」と呼ぶ)を特定する必要があった。そして、更に、この特定したパンシーンから、所望の大きさのパノラマ画像を生成することができるシーンを特定する必要があった。
なお、複数の画像からパノラマ画像を生成して印刷する方法の一例として、下記の特許文献に記載されたものが知られている。
なお、複数の画像からパノラマ画像を生成して印刷する方法の一例として、下記の特許文献に記載されたものが知られている。
従来、動画像等の複数の画像から成る画像群から、前述のパンシーンや、パノラマ画像を生成することができるシーンを特定するためには、動画像を再生したり、静止画像を表示して、ユーザが確認しなければならず、手間が掛かるという問題があった。
以上の課題は、横長のパノラマ画像を生成する場合だけでなく、縦長の画像を生成する場合にもあった。すなわち、縦長画像を生成する場合には、パンシーン及びパノラマ画像を生成することができるシーンではなく、撮影装置を上下のいずれかの方向に移動させる、いわゆるチルトと呼ばれるカメラワークで撮影されたシーン(以下、「チルトシーン」と呼ぶ)や、縦長画像を生成することができるシーンを特定する必要があり、そのようなシーンを特定するのにも手間が掛かるという問題があった。
本発明は、従来技術における前述の課題を解決するためになされたものであり、複数の画像から成る画像群から、パンもしくはチルトシーンなどのカメラワークシーン、またはパノラマ画像もしくは縦長画像などの合成画像を生成することができるシーン(以下、「合成画像生成可能シーン」と呼ぶ)を、簡易に特定することが可能な技術を提供することを目的とする。
以上の課題は、横長のパノラマ画像を生成する場合だけでなく、縦長の画像を生成する場合にもあった。すなわち、縦長画像を生成する場合には、パンシーン及びパノラマ画像を生成することができるシーンではなく、撮影装置を上下のいずれかの方向に移動させる、いわゆるチルトと呼ばれるカメラワークで撮影されたシーン(以下、「チルトシーン」と呼ぶ)や、縦長画像を生成することができるシーンを特定する必要があり、そのようなシーンを特定するのにも手間が掛かるという問題があった。
本発明は、従来技術における前述の課題を解決するためになされたものであり、複数の画像から成る画像群から、パンもしくはチルトシーンなどのカメラワークシーン、またはパノラマ画像もしくは縦長画像などの合成画像を生成することができるシーン(以下、「合成画像生成可能シーン」と呼ぶ)を、簡易に特定することが可能な技術を提供することを目的とする。
前述の課題の少なくとも一部を解決するために、本発明の画像処理装置は、時系列に並んだ複数の画像から成る画像群から、各画像間の位置ずれ量をそれぞれ推定する位置ずれ量推定部と、推定した前記位置ずれ量を、前記画像群における各画像の時系列上の位置と対応付けて、それぞれ記憶する記憶部と、を備えることを要旨とする。
このようにすれば、記憶された位置ずれ量を用いて、画像群からパンもしくはチルトシーンなどのカメラワークシーン、またはパノラマ画像もしくは縦長画像などの合成画像を生成することができる合成画像生成可能シーンを特定することができる。従って、ユーザは、画像群を再生したり表示したりして確認せずに、簡易にこれらシーンを特定することができる。
また、本発明の画像処理装置は、時系列に並んだ複数の画像から成る画像群における、各画像間の位置ずれ量を、各画像の時系列上の位置と対応付けて表す位置ずれ情報に基づいて、前記画像群において、前記位置ずれ量が略一定方向の位置ずれを示す画像が複数ほぼ連続している箇所を、所定のカメラワークシーンとして特定するシーン特定部と、特定した前記カメラワークシーンの、前記画像群における時系列上の位置を記憶する記憶部と、を備えることを要旨とする。
静止した被写体を撮影装置で撮影した場合、撮影された各画像間の位置ずれは、撮影装置の動きにのみ起因して生じることになる。従って、位置ずれ量が略一定方向の位置ずれを示す画像が複数ほぼ連続している箇所を特定することで、撮影装置の動き量が略一定方向の動きを示す画像群、すなわち、パン,チルトなど所定のカメラワークで撮影されたシーンを特定することができる。そして、この特定したカメラワークシーンの、前記画像群における時系列上の位置を記憶することで、ユーザは、この記憶された時系列上の位置を確認することにより、カメラワークシーンを簡易に特定することができる。
なお、前述のカメラワークシーンは、パンシーンもしくはチルトシーンであってもよい。合成画像生成可能シーンを、更に特定し易くなるからである。
また、本発明の画像処理装置は、時系列に並んだ複数の画像から成る画像群における、各画像間の位置ずれ量を、各画像の時系列上の位置と対応付けて表す位置ずれ情報に基づいて、前記画像群において、前記位置ずれ量が略一定方向の位置ずれを示す画像が複数ほぼ連続し、かつ、それら複数の画像間の前記位置ずれ量の合計量が所定量以上となる箇所を、合成画像生成可能シーンとして特定するシーン特定部と、特定した前記合成画像生成可能シーンの、前記画像群における時系列上の位置を記憶する記憶部と、を備えることを要旨とする。
合成画像は、略一定方向にずれた複数の画像を重ね合わせて生成することができる。そして、このようにして生成される合成画像の大きさは、各画像の略一定方向のずれ量を合計した合計量に基づいて算出される。従って、この合計量に対して予め目標量を定めておき、前述ように、位置ずれ量が略一定方向の位置ずれを示す画像が複数ほぼ連続し、かつ、それら複数の画像間の位置ずれ量の合計量が、この目標量以上となる箇所を特定することで、所望の大きさの合成画像を生成することができるシーン(合成画像生成可能シーン)を特定することができる。
そして、この特定した合成画像生成可能シーンの、前記画像群における時系列上の位置を記憶することで、ユーザは、この記憶された時系列上の位置を確認することにより、合成画像生成可能シーンを簡易に特定することができる。
そして、この特定した合成画像生成可能シーンの、前記画像群における時系列上の位置を記憶することで、ユーザは、この記憶された時系列上の位置を確認することにより、合成画像生成可能シーンを簡易に特定することができる。
また、前記記憶部は、前記合成画像生成可能シーンの、前記画像群における時系列上の位置と共に、少なくとも、前記合計量を表す情報を併せて記憶することが好ましい。
このようにすることで、ユーザは、記憶された合計量を表す情報を確認することにより、特定した合成画像生成可能シーンから生成することができる合成画像の大きさを、実際に合成画像を生成せずに簡易に確認することができる。
なお、上記した画像群は、動画像であってもよい。
このようにすることで、ユーザは、記憶された合計量を表す情報を確認することにより、特定した合成画像生成可能シーンから生成することができる合成画像の大きさを、実際に合成画像を生成せずに簡易に確認することができる。
なお、上記した画像群は、動画像であってもよい。
なお、本発明は、以下に示すような種々の態様で実現することが可能である。
(1) 位置ずれ記憶方法及びシーン記憶方法
(2)上述の画像処理装置や、位置ずれ記憶方法及びシーン記憶方法を実現するためのコンピュータプログラム。
(1) 位置ずれ記憶方法及びシーン記憶方法
(2)上述の画像処理装置や、位置ずれ記憶方法及びシーン記憶方法を実現するためのコンピュータプログラム。
本発明をコンピュータプログラムまたはそのプログラムを記録した記録媒体として構成する場合には、上述の画像処理装置の動作を制御するプログラム全体として構成するものとしてもよいし、本発明の機能を果たす部分のみを構成するものとしてもよい。また、記録媒体としては、フレキシブルディスクやCD−ROM、DVD−ROM/RAM、光磁気ディスク、ICカード、メモリカード、磁気テープ、ROMカートリッジ、パンチカード、バーコードなどの符号が印刷された印刷物、コンピュータの内部記憶装置(RAMやROMなどのメモリ)および外部記憶装置などコンピュータが読み取り可能な種々の媒体を利用できる。
以下、本発明を実施するための最良の形態を実施例に基づいて以下の順序で説明する。
A.実施例:
A1.装置構成:
A2.具体的な動作:
A2−1.位置ずれ量推定及び記憶処理:
A2−2.パン/チルトシーン特定及び記憶処理:
A2−3.パノラマ/縦長サブシーン特定及び記憶処理:
A3.実施例の効果:
B.変形例:
B1.変形例1:〜B10.変形例10:
A.実施例:
A1.装置構成:
A2.具体的な動作:
A2−1.位置ずれ量推定及び記憶処理:
A2−2.パン/チルトシーン特定及び記憶処理:
A2−3.パノラマ/縦長サブシーン特定及び記憶処理:
A3.実施例の効果:
B.変形例:
B1.変形例1:〜B10.変形例10:
A.実施例:
A1.装置構成:
本実施例における画像処理装置の概要構成について、図1を用いて説明する。
図1は、本実施例における画像処理装置の概要構成を示す説明図である。画像処理装置10は、コンピュータ100と、コンピュータ100にデータを入力するための装置として、キーボード113,マウス114,及びDVDドライブ110と、画像等を出力する装置として、ディスプレイ112,及びプリンタ111と、を備えている。
DVDドライブ110は、挿入されるDVD110aに記録されている動画像データを読み出すことができる。
コンピュータ100は、CPU101,ハードディスク102,メモリ103,及び入出力インタフェース部104を備えており、それぞれ内部バス105によって接続されている。ここで、入出力インタフェース部104は、コンピュータ100に対して、前述のキーボード113,マウス114,DVDドライブ110,ディスプレイ112,及びプリンタ111を、それぞれ接続するためのインタフェース群からなる。
A1.装置構成:
本実施例における画像処理装置の概要構成について、図1を用いて説明する。
図1は、本実施例における画像処理装置の概要構成を示す説明図である。画像処理装置10は、コンピュータ100と、コンピュータ100にデータを入力するための装置として、キーボード113,マウス114,及びDVDドライブ110と、画像等を出力する装置として、ディスプレイ112,及びプリンタ111と、を備えている。
DVDドライブ110は、挿入されるDVD110aに記録されている動画像データを読み出すことができる。
コンピュータ100は、CPU101,ハードディスク102,メモリ103,及び入出力インタフェース部104を備えており、それぞれ内部バス105によって接続されている。ここで、入出力インタフェース部104は、コンピュータ100に対して、前述のキーボード113,マウス114,DVDドライブ110,ディスプレイ112,及びプリンタ111を、それぞれ接続するためのインタフェース群からなる。
コンピュータ100では、所定のオペレーティングシステムの下、アプリケーションプログラム102pが実行されることになる。なお、このオペレーティングシステムには、各種ドライバが組み込まれ、前述のキーボード113,マウス114,DVDドライブ110,ディスプレイ112,及びプリンタ111が制御される。このアプリケーションプログラム102pが起動され、メモリ103にロードされると、CPU101は、アプリケーションプログラム102pを実行することにより、位置ずれ量推定部101a,パン/チルトシーン特定部101b,サブシーン特定部101c,及び表示処理部101dとして機能することになる。
ハードディスク102には、前述のアプリケーションプログラム102pの他、動画像データ102a,位置ずれ情報102b,規定シーン情報102c,パン/チルトシーン情報102d,及びサブシーン情報102eが記憶される。なお、これらの記憶される情報については、後ほど説明する。
ハードディスク102には、前述のアプリケーションプログラム102pの他、動画像データ102a,位置ずれ情報102b,規定シーン情報102c,パン/チルトシーン情報102d,及びサブシーン情報102eが記憶される。なお、これらの記憶される情報については、後ほど説明する。
なお、位置ずれ量推定部101aは、請求項に記載の位置ずれ量推定部に該当し、パン/チルトシーン特定部101b及びサブシーン特定部101cは、請求項記載のシーン特定部に該当する。
A2.具体的な動作:
A2−1.位置ずれ量推定及び記憶処理:
まず、位置ずれ量推定及び記憶処理について、図1〜図4を用いて説明する。
図2は、本実施例における位置ずれ量推定及び記憶処理の手順を示すフローチャートである。この位置ずれ量推定及び記憶処理が実行される前に、DVD110aに保存されている動画像データ102aが、DVDドライブ110を介してハードディスク102に書き込まれ、記憶されているものとする。
この動画像データ102aは、複数のフレーム画像データからなる。なお、このフレーム画像データは、動画像の1コマに相当する静止画像(フレーム画像)を表す。
なお、動画像データ102aの表す動画像は、静止した被写体をデジタルビデオカメラ(図示省略)を動かしながら撮影した動画像であるものとする。
A2−1.位置ずれ量推定及び記憶処理:
まず、位置ずれ量推定及び記憶処理について、図1〜図4を用いて説明する。
図2は、本実施例における位置ずれ量推定及び記憶処理の手順を示すフローチャートである。この位置ずれ量推定及び記憶処理が実行される前に、DVD110aに保存されている動画像データ102aが、DVDドライブ110を介してハードディスク102に書き込まれ、記憶されているものとする。
この動画像データ102aは、複数のフレーム画像データからなる。なお、このフレーム画像データは、動画像の1コマに相当する静止画像(フレーム画像)を表す。
なお、動画像データ102aの表す動画像は、静止した被写体をデジタルビデオカメラ(図示省略)を動かしながら撮影した動画像であるものとする。
まず、図1に示す位置ずれ量推定部101aは、ハードディスク102に記憶されている動画像データ102aを読み出して、メモリ103に記憶させる(ステップS200)。
続いて、位置ずれ量推定部101aは、フレーム番号を示す変数kに初期値1を代入する(ステップS202)。フレーム番号とは、動画像データ102aにおける、各フレーム画像データの時系列上での順番を意味し、最初のフレーム画像データから順番に1,2,...と、位置ずれ量推定部101aにより定められる番号である。
なお、以下、フレーム番号n(n=1,2,...)のフレーム画像を、フレーム画像F(n)と表すものとする。
続いて、位置ずれ量推定部101aは、フレーム番号を示す変数kに初期値1を代入する(ステップS202)。フレーム番号とは、動画像データ102aにおける、各フレーム画像データの時系列上での順番を意味し、最初のフレーム画像データから順番に1,2,...と、位置ずれ量推定部101aにより定められる番号である。
なお、以下、フレーム番号n(n=1,2,...)のフレーム画像を、フレーム画像F(n)と表すものとする。
続いて、位置ずれ量推定部101aは、フレーム番号k及びk+1のフレーム画像データを、それぞれメモリ103に記憶させた動画像データ102aから抽出する(ステップS204)。
続いて、位置ずれ量推定部101aは、抽出したフレーム画像データの表すフレーム画像F(k)及びフレーム画像F(k+1)を、それぞれ基準フレーム画像及び対象フレーム画像と定めて、基準フレーム画像に対する対象フレーム画像の位置ずれ量を推定する(ステップS206)。ここで、位置ずれ量について、図3を用いて説明する。
続いて、位置ずれ量推定部101aは、抽出したフレーム画像データの表すフレーム画像F(k)及びフレーム画像F(k+1)を、それぞれ基準フレーム画像及び対象フレーム画像と定めて、基準フレーム画像に対する対象フレーム画像の位置ずれ量を推定する(ステップS206)。ここで、位置ずれ量について、図3を用いて説明する。
図3は、本実施例における位置ずれ量を示す説明図である。図3において(A)は、抽出されたフレーム画像F(k)とフレーム画像F(k+1)とを示し、(B)は、フレーム画像F(k)とフレーム画像F(k+1)とを、画像全体が一致するように重ね合わせた状態を示し、(C)は、フレーム画像F(k)に対してフレーム画像F(k+1)を、フレーム画像F(k)及びF(k+1)を撮影した際のデジタルビデオカメラ(図示省略)の動き量だけずらして重ね合わせた状態を示す。
図3において、凸型の図形は、フレーム画像F(k)及びF(k+1)に写し出された被写体を示す。なお、図3(B)において、フレーム画像F(k)に写し出された凸型の被写体を分かり易く示すため、その輪郭を破線で示している。
フレーム画像F(k)及びF(k+1)は、デジタルビデオカメラを動かしながら撮影されているので、図3(B)に示すように、フレーム画像F(k)及びF(k+1)を重ね合わせると、図3(B)の太線の矢印に示すように、フレーム画像F(k+1)に写し出された凸型の被写体は、フレーム画像F(k)に写し出された凸型の被写体に対して位置がずれることになる。以下において、このずれを「位置ずれ」と呼ぶものとする。
そして、図3(B)に示すように、X−Y座標系を定めるものとして、この位置ずれの量を、以下のように表すものとする。すなわち、位置ずれ量のX方向の成分をuとし、Y方向の成分をvとし、位置ずれ量(u,v)と表す。なお、以下、位置ずれ量のX方向の成分uを「横ずれ量u」、位置ずれのY方向成分vを「縦ずれ量v」と呼ぶ。
この位置ずれ量(u,v)は、画像間のずれを推定する一般的な手法である、パターンマッチ法や勾配法等により推定されるものとする。
そして、図3(B)に示すように、X−Y座標系を定めるものとして、この位置ずれの量を、以下のように表すものとする。すなわち、位置ずれ量のX方向の成分をuとし、Y方向の成分をvとし、位置ずれ量(u,v)と表す。なお、以下、位置ずれ量のX方向の成分uを「横ずれ量u」、位置ずれのY方向成分vを「縦ずれ量v」と呼ぶ。
この位置ずれ量(u,v)は、画像間のずれを推定する一般的な手法である、パターンマッチ法や勾配法等により推定されるものとする。
なお、この位置ずれは、凸型の被写体が静止しているので、デジタルビデオカメラの動きにのみ起因して生じる。従って、フレーム画像F(k)及びフレーム画像F(k+1)を撮影した際のデジタルビデオカメラの動き量は、横ずれ量u及び縦ずれ量vの符号をそれぞれ反転させた(−u,−v)と表される。そして、フレーム画像F(k+1)をフレーム画像F(k)に対して、このデジタルビデオカメラの動き量(−u,−v)だけずらして重ねると、図3(C)に示すように、それぞれのフレーム画像に写し出された凸型の被写体は一致することになる。
続いて、位置ずれ量推定部101aは、ステップS206で推定した位置ずれ量(u,v)を、対象フレーム画像F(k+1)のフレーム番号であるk+1と共に、位置ずれ情報102bとしてメモリ103に記憶させる(ステップS208)。
続いて、位置ずれ量推定部101aは、フレーム番号k+1のフレーム画像データが、動画像データ102aにおける最後のフレーム画像データであるか否かを判定する(ステップS210)。最後のフレーム画像データでないと判定した場合には、位置ずれ量推定部101aは、変数kの値を1増加する(ステップS212)。
そして、ステップS210において、最後のフレーム画像データであると判定するまで、位置ずれ量推定部101aは、ステップS204〜ステップS212の処理を繰り返し実行する。
そして、ステップS210において、最後のフレーム画像データであると判定するまで、位置ずれ量推定部101aは、ステップS204〜ステップS212の処理を繰り返し実行する。
ステップS212において、変数kの値を1ずつ増加することにより、位置ずれ量推定部101aは、ステップS206において、基準フレーム画像及び対象フレーム画像の組み合わせを、フレーム画像F(1)及びF(2)、フレーム画像F(2)及びF(3)、...と、最後のフレーム画像が対象フレーム画像となる組み合わせになるまで、順次ずらして定めることになる。
従って、ステップS210において、フレーム番号k+1のフレーム画像データが、最後のフレーム画像データであると判定した場合、メモリ103には、動画像を構成する全てのフレーム画像について、それぞれ隣り合うフレーム画像間の位置ずれ量(u,v)が、フレーム番号k+1と対応して、位置ずれ情報102bとして記憶されていることになる。
従って、ステップS210において、フレーム番号k+1のフレーム画像データが、最後のフレーム画像データであると判定した場合、メモリ103には、動画像を構成する全てのフレーム画像について、それぞれ隣り合うフレーム画像間の位置ずれ量(u,v)が、フレーム番号k+1と対応して、位置ずれ情報102bとして記憶されていることになる。
ここで、位置ずれ情報102bについて、図4を用いて説明する。図4は、本実施例における位置ずれ情報102bを示す説明図である。本実施例では、動画像データ102aは、2000枚のフレーム画像のフレーム画像データからなるものとする。従って、位置ずれ情報102bとしては、例えば、フレーム画像F(1)に対するフレーム画像F(2)の位置ずれ量(−3,−2)が、フレーム番号2と対応するように、フレーム番号2000までの各フレーム画像間の位置ずれ量が、それぞれの位置ずれ量を推定する際に対象フレーム画像と定められた、フレーム画像F(k+1)のフレーム番号k+1と対応して、メモリ103に記憶されることになる。
その後、ステップS210において、フレーム番号k+1のフレーム画像データが、最後のフレーム画像データであると判定した場合、位置ずれ量推定部101aは、メモリ103に記憶させた位置ずれ情報102bを読み出して、ハードディスク102に書き込んで記憶させる(ステップS214)。
そして、ステップS214が終了すると、位置ずれ量推定及び記憶処理は終了する。
そして、ステップS214が終了すると、位置ずれ量推定及び記憶処理は終了する。
A2−2.パン/チルトシーン特定及び記憶処理:
パン/チルトシーンは、デジタルビデオカメラを左右/上下のいずれかの方向に移動させながら撮影された、時系列に並んだ一連のフレーム画像群である。ここで、前述のように、位置ずれ量を(u,v)とすると、デジタルビデオカメラの動き量は、(−u,−v)となるので、横ずれ量uが、+X方向または−X方向に連続するフレーム群を特定することで、デジタルビデオカメラを左または右に移動させながら撮影したパンシーンを特定することができる。また、同様にして、縦ずれ量vが、+Y方向または−Y方向に連続するフレーム群を特定することで、デジタルビデオカメラを上または下に移動させながら撮影したチルトシーンを特定することができる。
本実施例では、このようにしてパン/チルトシーンを特定し、特定したパン/チルトシーンに係わる情報をハードディスク102に記憶する。以下、パン/チルトシーン特定及び記憶処理について、図1及び図4〜7を用いて詳細を説明する。
なお、図3に示す、フレーム画像F(k)及びF(k+1)のように、2枚のフレーム画像から成るフレーム画像群もシーンと呼ぶことができるが、本実施例においては、各シーンは、3枚以上のフレーム画像からなるものとする。
パン/チルトシーンは、デジタルビデオカメラを左右/上下のいずれかの方向に移動させながら撮影された、時系列に並んだ一連のフレーム画像群である。ここで、前述のように、位置ずれ量を(u,v)とすると、デジタルビデオカメラの動き量は、(−u,−v)となるので、横ずれ量uが、+X方向または−X方向に連続するフレーム群を特定することで、デジタルビデオカメラを左または右に移動させながら撮影したパンシーンを特定することができる。また、同様にして、縦ずれ量vが、+Y方向または−Y方向に連続するフレーム群を特定することで、デジタルビデオカメラを上または下に移動させながら撮影したチルトシーンを特定することができる。
本実施例では、このようにしてパン/チルトシーンを特定し、特定したパン/チルトシーンに係わる情報をハードディスク102に記憶する。以下、パン/チルトシーン特定及び記憶処理について、図1及び図4〜7を用いて詳細を説明する。
なお、図3に示す、フレーム画像F(k)及びF(k+1)のように、2枚のフレーム画像から成るフレーム画像群もシーンと呼ぶことができるが、本実施例においては、各シーンは、3枚以上のフレーム画像からなるものとする。
図5は、本実施例におけるパン/チルトシーン特定及び記憶処理の手順を示すフローチャートである。
まず、図1に示すパン/チルトシーン特定部101bは、ハードディスク102に記憶された動画像データ102aを読み出して、メモリ103に記憶させる(ステップS300)。
続いて、パン/チルトシーン特定部101bは、メモリ103に記憶させた動画像データ102aの表す動画像を規定シーンに分割して、各規定シーンの規定シーン番号及び開始/終了フレーム番号を、規定シーン情報102cとしてメモリ103に記憶させる(ステップS302)。
続いて、パン/チルトシーン特定部101bは、メモリ103に記憶させた動画像データ102aの表す動画像を規定シーンに分割して、各規定シーンの規定シーン番号及び開始/終了フレーム番号を、規定シーン情報102cとしてメモリ103に記憶させる(ステップS302)。
ここで、規定シーン分割とは、例えば、山を撮影したシーンから海を撮影したシーンに切り替わるような場合、このシーンの切り替わりを特定し、それぞれのシーンを規定シーンとして、動画像を分割しておくものである。
なお、動画像を規定シーンに分割する方法としては、以下のようなシーン分割方法を用いるものとする。すなわち、動画像データ102aに基づき、それぞれのフレーム画像の各画素値の平均値を求め、時系列に並んだ2つのフレーム画像について、この求めた各画素値の平均値の差分を、更に求める。そして、この求めた各画素値の平均値の差分が、或るしきい値以上となった場合に、この差分が求められた2つのフレーム画像間を、シーンの切り替わりと特定し、この2つのフレーム画像を、規定シーンの終了フレーム画像、及び次の規定シーンの開始フレーム画像とする。
なお、規定シーン番号は、規定シーンに分割された順番に1,2,...と、パン/チルトシーン特定部101bにより定められる番号である。
なお、動画像を規定シーンに分割する方法としては、以下のようなシーン分割方法を用いるものとする。すなわち、動画像データ102aに基づき、それぞれのフレーム画像の各画素値の平均値を求め、時系列に並んだ2つのフレーム画像について、この求めた各画素値の平均値の差分を、更に求める。そして、この求めた各画素値の平均値の差分が、或るしきい値以上となった場合に、この差分が求められた2つのフレーム画像間を、シーンの切り替わりと特定し、この2つのフレーム画像を、規定シーンの終了フレーム画像、及び次の規定シーンの開始フレーム画像とする。
なお、規定シーン番号は、規定シーンに分割された順番に1,2,...と、パン/チルトシーン特定部101bにより定められる番号である。
ここで、規定シーン情報102cについて、図6を用いて説明する。図6は、本実施例における規定シーン情報102cを示す説明図である。本実施例では、前述の規定シーン分割により、動画像データ102aの表す動画像が5つの規定シーンに分割されたものとする。従って、図6に示すように、この5つの規定シーンについて、それぞれ規定シーン番号及び開始/終了フレーム番号が、規定シーン情報102cとしてメモリ103に記憶される。
続いて、パン/チルトシーン特定部101bは、メモリ103に記憶させた規定シーン情報102cを、ハードディスク102に書き込み、記憶させる(ステップS304)。
続いて、パン/チルトシーン特定部101bは、ハードディスク102に記憶させた、位置ずれ情報102b及び規定シーン情報102cを読み出して、メモリ103に記憶させる(ステップS306)。
続いて、パン/チルトシーン特定部101bは、ハードディスク102に記憶させた、位置ずれ情報102b及び規定シーン情報102cを読み出して、メモリ103に記憶させる(ステップS306)。
続いて、パン/チルトシーン特定部101bは、規定シーン番号を示す変数iに、初期値1を代入する(ステップS308)。
続いて、パン/チルトシーン特定部101bは、i番目の規定シーンにおいて、パンシーンを特定する(ステップS310)。以下、ステップS310の処理について、図4及び図6を用いて具体的に説明する。
続いて、パン/チルトシーン特定部101bは、i番目の規定シーンにおいて、パンシーンを特定する(ステップS310)。以下、ステップS310の処理について、図4及び図6を用いて具体的に説明する。
パン/チルトシーン特定部101bは、まず、i番目の規定シーンの開始及び終了フレーム番号を、規定シーン情報102cから得る。最初にステップS310を実行する時には、i=1であるので、1番目の規定シーンについて、図6に示す規定シーン情報102cから、その開始及び終了フレーム番号である、1及び340を得ることになる。
次に、パン/チルトシーン特定部101bは、i番目の規定シーンに対応した横ずれ量uを、位置ずれ情報102bから特定する。前述のように、i=1の場合、1番目の規定シーンの開始フレーム番号は1であるが、フレーム画像F(1)に対するフレーム画像F(2)の位置ずれ量は、図4に示すように、フレーム番号2と対応して記憶されている。従って、1番目の規定シーンに対応した横ずれ量uとして、図4に示す位置ずれ情報102bから、フレーム番号2からフレーム番号340までの横ずれ量uである、−3,−4,...−6を特定する。
次に、パン/チルトシーン特定部101bは、i番目の規定シーンに対応した横ずれ量uを、位置ずれ情報102bから特定する。前述のように、i=1の場合、1番目の規定シーンの開始フレーム番号は1であるが、フレーム画像F(1)に対するフレーム画像F(2)の位置ずれ量は、図4に示すように、フレーム番号2と対応して記憶されている。従って、1番目の規定シーンに対応した横ずれ量uとして、図4に示す位置ずれ情報102bから、フレーム番号2からフレーム番号340までの横ずれ量uである、−3,−4,...−6を特定する。
次に、パン/チルトシーン特定部101bは、特定した横ずれ量uの中で、+X方向(プラス)の値または0が2つ以上連続する、もしくは−X方向(マイナス)の値または0が2つ以上連続する、複数の横ずれ量uを検索する。従って、i=1の場合、フレーム番号2からフレーム番号340までの横ずれ量uにおいて、フレーム番号2からフレーム番号7までの横ずれ量uは、図4に示すように、いずれもマイナスの値または0であるので、このフレーム番号2からフレーム番号7の横ずれ量uを、最初に見つけることになる。
そして、この見つけたフレーム番号2からフレーム番号7までの横ずれ量uに対応した、フレーム画像F(1)〜フレーム画像F(7)を、最初のパンシーンであると特定する。
以下同様にして、i番目の規定シーンにおいて、全てのパンシーンを特定する。
そして、この見つけたフレーム番号2からフレーム番号7までの横ずれ量uに対応した、フレーム画像F(1)〜フレーム画像F(7)を、最初のパンシーンであると特定する。
以下同様にして、i番目の規定シーンにおいて、全てのパンシーンを特定する。
続いて、パン/チルトシーン特定部101bは、i番目の規定シーンにおいて、ステップS310で特定した全てのパンシーンに関し、それぞれ、そのパンシーンの開始及び終了フレーム番号を、パン/チルトシーン番号及びパンフラグと共に、パン/チルトシーン情報102dとしてメモリ103に記憶させる(ステップS312)。ここで、パン/チルトシーン番号とは、パンシーンまたはチルトシーンが特定された順番に1,2,...とパン/チルトシーン特定部101bにより定められる番号であり、パンフラグとは、特定されたシーンがパンシーンであることを示す識別子である。
続いて、パン/チルトシーン特定部101bは、i番目の規定シーンにおいて、チルトシーンを特定する(ステップS314)。チルトシーンを特定する方法としては、パンシーンを特定する方法と同様であるので、詳細な説明を省略する。
続いて、パン/チルトシーン特定部101bは、ステップS314で特定したチルトシーンの開始及び終了フレーム番号を、パン/チルトシーン番号及びチルトフラグと共に、パン/チルトシーン情報102dとしてメモリ103に記憶させる(ステップS316)。ここで、チルトフラグとは、特定されたシーンがチルトシーンであることを示す識別子である。
続いて、パン/チルトシーン特定部101bは、i番目の規定シーンが、最後の規定シーンであるか否かを判定する(ステップS318)。最後の規定シーンでないと判定した場合には、パン/チルトシーン特定部101bは、変数iの値を1増加する(ステップS320)。
そして、ステップS318において、i番目の規定シーンが最後の規定シーンであると判定するまで、パン/チルトシーン特定部101bは、ステップS310〜ステップS320の処理を繰り返し実行する。従って、パン/チルトシーン特定部101bは、全ての規定シーンについて、パン/チルトシーンを特定し、それぞれのパン/チルトシーンについてパン/チルトシーン番号,パン/チルトフラグ,及び開始/終了フレーム番号を、パン/チルトシーン情報102dとして、メモリ103に記憶させることになる。
そして、ステップS318において、i番目の規定シーンが最後の規定シーンであると判定するまで、パン/チルトシーン特定部101bは、ステップS310〜ステップS320の処理を繰り返し実行する。従って、パン/チルトシーン特定部101bは、全ての規定シーンについて、パン/チルトシーンを特定し、それぞれのパン/チルトシーンについてパン/チルトシーン番号,パン/チルトフラグ,及び開始/終了フレーム番号を、パン/チルトシーン情報102dとして、メモリ103に記憶させることになる。
ここで、パン/チルトシーン情報102dについて、図7を用いて説明する。図7は、本実施例におけるパン/チルトシーン情報102dを示す説明図である。なお、図7に示すP及びCは、それぞれパンフラグP及びチルトフラグCを示す。
本実施例では、図6に示す5つの規定シーンから、それぞれ1つずつパンもしくはチルトシーンが特定されたものとする。この場合、図7に示すように、特定された5つのパン/チルトシーンについて、それぞれパン/チルトシーン番号,パン/チルトフラグ,及び開始/終了フレーム番号が、パン/チルトシーン情報102dとして、メモリ103に記憶されることになる。例えば、前述の1番目の規定シーンで最初に特定されたフレーム画像F(1)〜フレーム画像F(7)のパンシーンについては、パン/チルトシーン番号=1、パンフラグP、開始フレーム番号=1、及び終了フレーム番号=7と記憶されている。
本実施例では、図6に示す5つの規定シーンから、それぞれ1つずつパンもしくはチルトシーンが特定されたものとする。この場合、図7に示すように、特定された5つのパン/チルトシーンについて、それぞれパン/チルトシーン番号,パン/チルトフラグ,及び開始/終了フレーム番号が、パン/チルトシーン情報102dとして、メモリ103に記憶されることになる。例えば、前述の1番目の規定シーンで最初に特定されたフレーム画像F(1)〜フレーム画像F(7)のパンシーンについては、パン/チルトシーン番号=1、パンフラグP、開始フレーム番号=1、及び終了フレーム番号=7と記憶されている。
ステップS318において、i番目の規定シーンが最後の規定シーンであると判定すると、パン/チルトシーン特定部101bは、メモリ103に記憶させたパン/チルトシーン情報102dを読み出して、ハードディスク102に書き込んで記憶させる(ステップS322)。
そして、ステップS322が終了すると、パン/チルトシーン特定及び記憶処理は終了する。
そして、ステップS322が終了すると、パン/チルトシーン特定及び記憶処理は終了する。
A2−3.パノラマ/縦長サブシーン特定及び記憶処理:
前述したパンシーンまたはチルトシーンに含まれる複数のフレーム画像を合成することにより、パノラマ画像または縦長画像を生成することができる。しかし、生成されるパノラマ画像または縦長画像の大きさは、フレーム画像同士の重なり具合によって異なる。そこで、所望の大きさのパノラマ画像または縦長画像を得るためには、パンシーンまたはチルトシーンから、合成画像生成可能シーンを特定する必要がある。
なお、以下において、所望の大きさのパノラマ画像を生成することができる合成画像生成可能シーンを「パノラマサブシーン」と呼び、所望の大きさの縦長画像を生成することができる合成画像生成可能シーンを「縦長サブシーン」と呼ぶものとする。
まず、パンシーンに含まれる複数のフレーム画像を合成して生成されるパノラマ画像の大きさについて、図8を用いて説明する。
前述したパンシーンまたはチルトシーンに含まれる複数のフレーム画像を合成することにより、パノラマ画像または縦長画像を生成することができる。しかし、生成されるパノラマ画像または縦長画像の大きさは、フレーム画像同士の重なり具合によって異なる。そこで、所望の大きさのパノラマ画像または縦長画像を得るためには、パンシーンまたはチルトシーンから、合成画像生成可能シーンを特定する必要がある。
なお、以下において、所望の大きさのパノラマ画像を生成することができる合成画像生成可能シーンを「パノラマサブシーン」と呼び、所望の大きさの縦長画像を生成することができる合成画像生成可能シーンを「縦長サブシーン」と呼ぶものとする。
まず、パンシーンに含まれる複数のフレーム画像を合成して生成されるパノラマ画像の大きさについて、図8を用いて説明する。
図8は、本実施例におけるパンシーンに含まれる3枚のフレーム画像から合成して生成されるパノラマ画像の大きさを示す説明図である。
図8において、(A)は、デジタルビデオカメラを動かして撮影した動画像のうち、フレーム画像F(k)及びF(k+1)の連続する2枚のフレーム画像を、図3(C)に示した場合と同様に、フレーム画像F(k)に対して、フレーム画像F(k+1)を、デジタルビデオカメラの動き量だけずらして重ねた状態を示す。また、図8において(B)は、(A)に示すフレーム画像F(k)及びF(k+1)に対し、更に、フレーム画像F(k+2)をデジタルビデオカメラの動き量だけずらして重ねた状態を示す。
図8において、(A)は、デジタルビデオカメラを動かして撮影した動画像のうち、フレーム画像F(k)及びF(k+1)の連続する2枚のフレーム画像を、図3(C)に示した場合と同様に、フレーム画像F(k)に対して、フレーム画像F(k+1)を、デジタルビデオカメラの動き量だけずらして重ねた状態を示す。また、図8において(B)は、(A)に示すフレーム画像F(k)及びF(k+1)に対し、更に、フレーム画像F(k+2)をデジタルビデオカメラの動き量だけずらして重ねた状態を示す。
図8において、フレーム画像F(k)及びF(k+1)を撮影した際のデジタルビデオカメラの動き量を、動き量M1(r1,s1)とし、フレーム画像F(k+1)及びF(k+2)を撮影した際のデジタルビデオカメラの動き量を、動き量M2(r2,s2)とし、それぞれ太い破線の矢印で示す。図8に示すように、動き量M1及びM2のX方向の成分r1及びr2は、共に+X方向を示し、フレーム画像F(k)〜F(k+2)で、+X方向のパンシーンとなっている。
また、図8において、フレーム画像F(k)〜F(k+2)のそれぞれの縦及び横の長さを、Hf及びWfと示す。
また、図8において、フレーム画像F(k)〜F(k+2)のそれぞれの縦及び横の長さを、Hf及びWfと示す。
このように、フレーム画像F(k)〜F(k+2)を、それぞれデジタルビデオカメラの動き量である動き量M1及び動き量M2だけずらして重ねると、図3(C)に示す凸型の被写体のように、フレーム画像同士が重なる部分において、写し出された被写体は一致することになる。従って、フレーム画像F(k)〜F(k+2)を合成してパノラマ画像を生成することができる。
そして、これらフレーム画像F(k)〜F(k+2)から生成することができるパノラマ画像の領域は、本実施例において、以下のように定めるものとする。すなわち、フレーム画像F(k)とフレーム画像F(k+1)との重なり部分を含む、図8(A)に示す領域Aに対し、図8(B)に示すように、更にフレーム画像F(k+2)を重ねる。そして、この領域Aとフレーム画像F(k+2)との重なり部分を含む、図8(B)に示す領域Pを、パノラマ画像の領域と定める。
なお、フレーム画像F(k)〜F(k+2)は、+X方向のパンシーンであるので、領域Pの左辺の位置は、フレーム画像F(k)の左辺の位置に一致しており、また、領域Pの右辺の位置は、フレーム画像F(k+2)の右辺の位置に一致している。
一方、領域Pの上辺の位置は、フレーム画像F(k)に対して、最も+Y方向にずれたフレーム画像F(k+1)の上辺の位置に一致している。また、領域Pの下辺の位置は、フレーム画像F(k)に対して、最も−Y方向にずれたフレーム画像F(k+2)の下辺の位置に一致している。
一方、領域Pの上辺の位置は、フレーム画像F(k)に対して、最も+Y方向にずれたフレーム画像F(k+1)の上辺の位置に一致している。また、領域Pの下辺の位置は、フレーム画像F(k)に対して、最も−Y方向にずれたフレーム画像F(k+2)の下辺の位置に一致している。
ここで、領域Pの横の長さWpは、図8(B)に示すように、Wf+|Xz(+)|と表される。なお、Xz(+)は、動き量M1及び動き量M2の、それぞれのX方向成分r1及びr2を足し合わせた値である。
一方、領域Pの縦の長さHpは、図8(B)に示すように、Hf−(|Yz(+)|+|Yz(−)|)と表される。なお、Yz(+)は、動き量M1のY方向成分s1であり、また、Yz(−)は、動き量M1及び動き量M2の、それぞれのY方向成分s1及びs2を、足し合わせた値である。
一方、領域Pの縦の長さHpは、図8(B)に示すように、Hf−(|Yz(+)|+|Yz(−)|)と表される。なお、Yz(+)は、動き量M1のY方向成分s1であり、また、Yz(−)は、動き量M1及び動き量M2の、それぞれのY方向成分s1及びs2を、足し合わせた値である。
従って、|Xz(+)|が大きくなるほど、パノラマ画像の横の長さWpは長くなり、
|Yz(+)|+|Yz(−)|が小さくなるほど、パノラマ画像の縦の長さHpは長くなる。そこで、本実施例では、パノラマ画像の横の長さWp,縦の長さHpが、それぞれ或る程度長くなるように、予め|Xz(+)|及び|Yz(+)|+|Yz(−)|に対して、それぞれ、しきい値Tx及びしきい値Tyを定めておき、|Xz(+)|がしきい値Tx以上になると共に、|Yz(+)|+|Yz(−)|がしきい値Tyよりも小さくなるシーンを、パノラマサブシーンとして特定する。
|Yz(+)|+|Yz(−)|が小さくなるほど、パノラマ画像の縦の長さHpは長くなる。そこで、本実施例では、パノラマ画像の横の長さWp,縦の長さHpが、それぞれ或る程度長くなるように、予め|Xz(+)|及び|Yz(+)|+|Yz(−)|に対して、それぞれ、しきい値Tx及びしきい値Tyを定めておき、|Xz(+)|がしきい値Tx以上になると共に、|Yz(+)|+|Yz(−)|がしきい値Tyよりも小さくなるシーンを、パノラマサブシーンとして特定する。
なお、この|Yz(+)|+|Yz(−)|のしきい値Tyとしては、フレーム画像の縦の長さの、10%以下の値を設定することが望ましい。
なお、仮に、フレーム画像F(k)〜F(k+2)が−X方向のパンシーンである場合には、動き量M1及び動き量M2の、それぞれのX方向成分r1及びr2を足し合わせた値を、Xz(−)と表すものとする。
なお、仮に、フレーム画像F(k)〜F(k+2)が−X方向のパンシーンである場合には、動き量M1及び動き量M2の、それぞれのX方向成分r1及びr2を足し合わせた値を、Xz(−)と表すものとする。
次に、Xz(+),Xz(−),Yz(+),及びYz(−)の求め方について、図4,図7,及び図9を用いて具体的に説明する。
図9は、本実施例におけるXz(+),Xz(−),Yz(+)及びYz(−)の求め方を示す説明図である。
図9において、フレーム画像F(1)〜F(4)は、図7に示す1番目のパンシーンの開始フレーム画像であるフレーム画像F(1)から4番目のフレーム画像F(4)までの4枚のフレーム画像を示しており、それぞれデジタルビデオカメラの動き量だけずらして重ねている。
なお、このデジタルビデオカメラの動き量は、図4に示す位置ずれ情報102bのうち、フレーム画像F(1)〜F(4)に対応した、フレーム番号2〜4の横ずれ量u及び縦ずれ量vを、それぞれ符号を反転させて求めている。具体的には、デジタルビデオカメラの動き量のX方向成分は、+3,+4,+2となり、また、デジタルビデオカメラの動き量のY方向成分は、+2,−3,+4となる。なお、図9において、それぞれの値をフレーム画像F(1)〜F(4)と合わせて示している。
また、図9において、領域P1は、フレーム画像F(1)〜F(4)を合成して生成することができるパノラマ画像の領域を示す。
図9において、フレーム画像F(1)〜F(4)は、図7に示す1番目のパンシーンの開始フレーム画像であるフレーム画像F(1)から4番目のフレーム画像F(4)までの4枚のフレーム画像を示しており、それぞれデジタルビデオカメラの動き量だけずらして重ねている。
なお、このデジタルビデオカメラの動き量は、図4に示す位置ずれ情報102bのうち、フレーム画像F(1)〜F(4)に対応した、フレーム番号2〜4の横ずれ量u及び縦ずれ量vを、それぞれ符号を反転させて求めている。具体的には、デジタルビデオカメラの動き量のX方向成分は、+3,+4,+2となり、また、デジタルビデオカメラの動き量のY方向成分は、+2,−3,+4となる。なお、図9において、それぞれの値をフレーム画像F(1)〜F(4)と合わせて示している。
また、図9において、領域P1は、フレーム画像F(1)〜F(4)を合成して生成することができるパノラマ画像の領域を示す。
まず、Xz(+)は、図9に示すように、フレーム画像F(1)からフレーム画像F(4)までのデジタルビデオカメラの動き量のX方向成分、+3,+4,+2を全て足し合わせた+9となる。また、Xz(−)は、フレーム画像F(1)〜F(4)が+X方向のパンシーンなので、0とする。
一方、Yz(+)及びYz(−)は次のように求める。すなわち、デジタルビデオカメラの動き量のY方向成分を+2から順番に、−3,+4と1つずつ値を足し合わせていき、+2,−1,+3と合計値を順次求める。そして、合計値を求める度に、それまでに求められた合計値のうちでプラスの値で最大となる値、及びマイナスの値で最小となる値と、この求めた合計値と、を比較する。そして、求めた合計値がプラスの値で最大となる値よりも大きければ、求めた合計値をYz(+)とし、求めた合計値がマイナスの値で最小となる値よりも小さければ、求めた合計値をYz(−)とする。
具体的には、+2に−3を足し合わせ、合計値−1を求めた段階では、Yz(+)及びYz(−)は、+2及び−1であるが、更に+4を足し合わせ、合計値+3を求めた段階で、Yz(+)は、+2から、より大きな+3に変わることになり、最終的にYz(+)及びYz(−)は、+3及び−1となる。
なお、仮に、合計値が常にマイナス(プラス)である場合には、Yz(+)(Yz(−))は0とする。
具体的には、+2に−3を足し合わせ、合計値−1を求めた段階では、Yz(+)及びYz(−)は、+2及び−1であるが、更に+4を足し合わせ、合計値+3を求めた段階で、Yz(+)は、+2から、より大きな+3に変わることになり、最終的にYz(+)及びYz(−)は、+3及び−1となる。
なお、仮に、合計値が常にマイナス(プラス)である場合には、Yz(+)(Yz(−))は0とする。
以上、パノラマ画像について説明したが、縦長画像についても同様であるので説明を省略する。
続いて、パノラマ/縦長サブシーン特定及び記憶処理について、図1,図4,図7,図9及び図10を用いて説明する。
図10は、本実施例におけるパノラマ/縦長サブシーン特定及び記憶処理の手順を示すフローチャートである。
なお、本実施例では、このパノラマ/縦長サブシーン特定及び記憶処理が実行される前に、予め、前述の|Xz(+)|及び|Xz(−)|のしきい値Tx=8が定められ、また、|Yz(+)|+|Yz(−)|のしきい値Ty=5が定められているものとする。
なお、本実施例では、このパノラマ/縦長サブシーン特定及び記憶処理が実行される前に、予め、前述の|Xz(+)|及び|Xz(−)|のしきい値Tx=8が定められ、また、|Yz(+)|+|Yz(−)|のしきい値Ty=5が定められているものとする。
まず、図1に示すサブシーン特定部101cは、ハードディスク102に記憶された、位置ずれ情報102b及びパン/チルトシーン情報102dを読み出して、メモリ103に記憶させる(ステップS400)。
続いて、サブシーン特定部101cは、パン/チルトシーン番号を示す変数jに、初期値1を代入する(ステップS402)。
続いて、サブシーン特定部101cは、パン/チルトシーン番号を示す変数jに、初期値1を代入する(ステップS402)。
続いて、サブシーン特定部101cは、メモリ103に記憶させたパン/チルトシーン情報102dからj番目のパン/チルトシーンのパン/チルトフラグを抽出し、更に、メモリ103に記憶させた位置ずれ情報102bから、j番目のパン/チルトシーンに対応する位置ずれ量を抽出する(ステップS404)。
最初にステップS404を実行する時には、j=1であるので、サブシーン特定部101cは、図7に示すパン/チルトシーン情報102dから、1番目のパンシーンのパン/チルトフラグであるパンフラグPを抽出する。また、図7に示すように、1番目のパンシーンは、フレーム画像F(1)〜F(7)からなるので、サブシーン特定部101cは、図4に示す位置ずれ情報102bから、これらフレーム画像F(1)〜F(7)に対応したフレーム番号2〜7の位置ずれ量を抽出する。
最初にステップS404を実行する時には、j=1であるので、サブシーン特定部101cは、図7に示すパン/チルトシーン情報102dから、1番目のパンシーンのパン/チルトフラグであるパンフラグPを抽出する。また、図7に示すように、1番目のパンシーンは、フレーム画像F(1)〜F(7)からなるので、サブシーン特定部101cは、図4に示す位置ずれ情報102bから、これらフレーム画像F(1)〜F(7)に対応したフレーム番号2〜7の位置ずれ量を抽出する。
続いて、サブシーン特定部101cは、ステップS404において抽出したパン/チルトフラグに基づき、j番目のパン/チルトシーンが、パンシーンであるか否かを判定する(ステップS406)。そして、サブシーン特定部101cは、j番目のパン/チルトシーンがパンシーンであると判定すると、パノラマサブシーン特定処理(ステップS407)を実行し、パンシーンでない、すなわち、チルトシーンであると判定すると、縦長サブシーン特定処理(ステップS408)を実行する。
j=1の場合、ステップS404において、図7に示すパン/チルトシーン情報102dから、1番目のパンシーンのパン/チルトフラグであるパンフラグPを抽出しているので、サブシーン特定部101cは、パノラマサブシーン特定処理(ステップS407)を実行することになる。
j=1の場合、ステップS404において、図7に示すパン/チルトシーン情報102dから、1番目のパンシーンのパン/チルトフラグであるパンフラグPを抽出しているので、サブシーン特定部101cは、パノラマサブシーン特定処理(ステップS407)を実行することになる。
パノラマサブシーン特定処理(ステップS407)では、サブシーン特定部101cは、まず、前述のようにして、デジタルビデオカメラの動き量のX方向成分またはY方向成分を順次足し合わせてXz(+),Xz(−),Yz(+),及びYz(−)を求める。次に、|Xz(+)|もしくは|Xz(−)|がしきい値Tx以上であるか否かを判定し、更に、|Yz(+)|+|Yz(−)|がしきい値Tyよりも小さいか否かを判定する。そして、|Xz(+)|もしくは|Xz(−)|がしきい値Tx以上であり、かつ、|Yz(+)|+|Yz(−)|がしきい値Tyよりも小さくなった時に、パノラマサブシーンとして特定する。
具体的には、図4に示す位置ずれ情報102bから求めたデジタルビデオカメラの動き量においては、図9に示すように、フレーム画像F(4)を重ねた段階で、|Xz(+)|は9となり、初めてしきい値Txの8以上となり、また、この時、|Yz(+)|+|Yz(−)|は4となり、しきい値Tyの5よりも小さくなっているので、フレーム画像F(1)〜F(4)を、最初のパノラマサブシーンとして特定する。なお、同様にして、次のパノラマサブシーンとして、フレーム画像F(5)〜F(7)を特定することになる。そして、1番目のパンシーンについて、全てのパノラマサブシーンが特定されることになる。
以上、パノラマサブシーン特定処理(ステップS407)について説明したが、縦長サブシーン特定処理(ステップS408)も同様の処理であるので、説明を省略する。
以上、パノラマサブシーン特定処理(ステップS407)について説明したが、縦長サブシーン特定処理(ステップS408)も同様の処理であるので、説明を省略する。
ステップS407において、j番目のパンシーンに含まれる全てのパノラマサブシーンを特定すると、サブシーン特定部101cは、特定したパノラマサブシーンのサブシーン番号,パン/チルトフラグ,開始/終了フレーム番号,Xz(+),Xz(−),Yz(+),及びYz(−)を、サブシーン情報102eとしてメモリ103に記憶させる(ステップS409)。
なお、サブシーン番号とは、パノラマサブシーンまたは縦長サブシーンが特定された順番に1,2,...とサブシーン特定部101cにより定められる番号である。
また、ステップS408において、j番目のチルトシーンに含まれる全ての縦長サブシーンを特定すると、サブシーン特定部101cは、特定した縦長サブシーンのサブシーン番号,パン/チルトフラグ,開始/終了フレーム番号,Xz(+),Xz(−),Yz(+),及びYz(−)を、サブシーン情報102eとしてメモリ103に記憶させる(ステップS410)。
なお、サブシーン番号とは、パノラマサブシーンまたは縦長サブシーンが特定された順番に1,2,...とサブシーン特定部101cにより定められる番号である。
また、ステップS408において、j番目のチルトシーンに含まれる全ての縦長サブシーンを特定すると、サブシーン特定部101cは、特定した縦長サブシーンのサブシーン番号,パン/チルトフラグ,開始/終了フレーム番号,Xz(+),Xz(−),Yz(+),及びYz(−)を、サブシーン情報102eとしてメモリ103に記憶させる(ステップS410)。
続いて、サブシーン特定部101cは、j番目のパン/チルトシーンが、最後のパン/チルトシーンであるか否かを判定する(ステップS412)。最後のパン/チルトシーンでないと判定した場合には、サブシーン特定部101cは、変数jの値を1増加する(ステップS414)。
そして、ステップS412において、j番目のパン/チルトシーンが最後のパン/チルトシーンであると判定するまで、サブシーン特定部101cは、ステップS404〜ステップS414の処理を繰り返し実行する。従って、サブシーン特定部101cは、全てのパン/チルトシーンについて、パノラマ/縦長サブシーンを特定し、それぞれのパノラマ/縦長サブシーンについてサブシーン番号,パン/チルトフラグ,開始/終了フレーム番号,Xz(+),Xz(−),Yz(+),及びYz(−)を、サブシーン情報102eとして、メモリ103に記憶させることになる。
そして、ステップS412において、j番目のパン/チルトシーンが最後のパン/チルトシーンであると判定するまで、サブシーン特定部101cは、ステップS404〜ステップS414の処理を繰り返し実行する。従って、サブシーン特定部101cは、全てのパン/チルトシーンについて、パノラマ/縦長サブシーンを特定し、それぞれのパノラマ/縦長サブシーンについてサブシーン番号,パン/チルトフラグ,開始/終了フレーム番号,Xz(+),Xz(−),Yz(+),及びYz(−)を、サブシーン情報102eとして、メモリ103に記憶させることになる。
ここで、サブシーン情報102eについて、図11を用いて説明する。図11は、本実施例におけるサブシーン情報102eを示す説明図である。図11に示すように、前述の最初に特定されたフレーム画像F(1)〜F(4)のパノラマサブシーン、及び次に特定されたフレーム画像F(5)〜F(7)のパノラマサブシーンついて、それぞれのサブシーン番号,パン/チルトフラグ,開始/終了フレーム番号,Xz(+),Xz(−),Yz(+),及びYz(−)が、特定された順序で記憶されている。なお、他のパノラマ/縦長サブシーンについても、サブシーン情報102eとして、特定された順序で記憶されることになるが、図11では省略している。
ステップS412において、j番目のパン/チルトシーンが最後のパン/チルトシーンであると判定すると、サブシーン特定部101cは、メモリ103に記憶させたサブシーン情報102eを読み出して、ハードディスク102に書き込んで記憶させる(ステップS416)。
そして、ステップS416が終了すると、パノラマ/縦長サブシーン特定及び記憶処理は終了する。
そして、ステップS416が終了すると、パノラマ/縦長サブシーン特定及び記憶処理は終了する。
A3.実施例の効果:
以上説明したように、画像処理装置10は、動画像データ102aから位置ずれ量を推定し、この推定した位置ずれ量を、この位置ずれ量を推定した際に対象フレーム画像と定めたフレーム画像のフレーム番号に対応させて、位置ずれ情報102bとして記憶する。従って、この位置ずれ情報102bを用いることにより、動画像の中からパン/チルトシーンまたはパノラマ/縦長サブシーンを特定することができる。
また、画像処理装置10は、特定したパン/チルトシーン及びパノラマ/縦長サブシーンについて、開始/終了フレーム番号を、パン/チルトシーン情報102d及びサブシーン情報102eとして記憶するので、ユーザは、動画像を再生して確認しなくても、これらパン/チルトシーン情報102d及びサブシーン情報102eを確認することで、パン/チルトシーン、またはパノラマ/縦長サブシーンを簡易に特定することができる。
また、画像処理装置10は、特定したパノラマ/縦長サブシーンについて、開始/終了フレーム番号の他に、パン/チルトフラグ,Xz(+),Xz(−),Yz(+),及びYz(−)もサブシーン情報102eとして記憶するので、実際に複数のフレーム画像を合成してパノラマ/縦長画像を生成しなくても、動画像データの中から生成することができる、パノラマ/縦長画像の大きさを簡易に確認することができる。
以上説明したように、画像処理装置10は、動画像データ102aから位置ずれ量を推定し、この推定した位置ずれ量を、この位置ずれ量を推定した際に対象フレーム画像と定めたフレーム画像のフレーム番号に対応させて、位置ずれ情報102bとして記憶する。従って、この位置ずれ情報102bを用いることにより、動画像の中からパン/チルトシーンまたはパノラマ/縦長サブシーンを特定することができる。
また、画像処理装置10は、特定したパン/チルトシーン及びパノラマ/縦長サブシーンについて、開始/終了フレーム番号を、パン/チルトシーン情報102d及びサブシーン情報102eとして記憶するので、ユーザは、動画像を再生して確認しなくても、これらパン/チルトシーン情報102d及びサブシーン情報102eを確認することで、パン/チルトシーン、またはパノラマ/縦長サブシーンを簡易に特定することができる。
また、画像処理装置10は、特定したパノラマ/縦長サブシーンについて、開始/終了フレーム番号の他に、パン/チルトフラグ,Xz(+),Xz(−),Yz(+),及びYz(−)もサブシーン情報102eとして記憶するので、実際に複数のフレーム画像を合成してパノラマ/縦長画像を生成しなくても、動画像データの中から生成することができる、パノラマ/縦長画像の大きさを簡易に確認することができる。
B.変形例
なお、本発明は、前述の実施例や実施形態に限られるものではなく、その要旨を逸脱しない範囲において、種々の態様において実施することが可能であり、例えば以下のような変形も可能である。
なお、本発明は、前述の実施例や実施形態に限られるものではなく、その要旨を逸脱しない範囲において、種々の態様において実施することが可能であり、例えば以下のような変形も可能である。
B1.変形例1:
前述の実施例では、図1に示すハードディスク102にサブシーン情報102eを記憶させるが、このサブシーン情報102eを用いて、動画像におけるパノラマ/縦長サブシーンの時間的な位置や、パノラマ/縦長サブシーンから生成することができるパノラマ/縦長画像の大きさを、簡易に確認することができる確認ウィンドウを、図1に示すディスプレイ112に表示するようにしてもよい。以下、このような確認ウィンドウについて、図12を用いて説明する。
前述の実施例では、図1に示すハードディスク102にサブシーン情報102eを記憶させるが、このサブシーン情報102eを用いて、動画像におけるパノラマ/縦長サブシーンの時間的な位置や、パノラマ/縦長サブシーンから生成することができるパノラマ/縦長画像の大きさを、簡易に確認することができる確認ウィンドウを、図1に示すディスプレイ112に表示するようにしてもよい。以下、このような確認ウィンドウについて、図12を用いて説明する。
図12は、変形例1におけるパノラマ/縦長サブシーン及びパノラマ/縦長画像の大きさを確認するための確認ウィンドウを示す説明図である。
図12において、(A)は、パノラマサブシーン及びパノラマ画像サイズを確認する場合の確認ウィンドウWを示し、(B)は、縦長サブシーン及び縦長画像サイズを確認する場合の確認ウィンドウWを示す。
なお、この確認ウィンドウWは、図1に示す表示処理部101dによって生成されて、ディスプレイ112に表示される。
図12において、(A)は、パノラマサブシーン及びパノラマ画像サイズを確認する場合の確認ウィンドウWを示し、(B)は、縦長サブシーン及び縦長画像サイズを確認する場合の確認ウィンドウWを示す。
なお、この確認ウィンドウWは、図1に示す表示処理部101dによって生成されて、ディスプレイ112に表示される。
確認ウィンドウWは、動画像表示部21,動画像操作部22,インジケータ24,画像サイズ表示部28,切り換え部29,及びタイトルバー30からなる。インジケータ24は、スライダ25及びサブシーン位置表示部26からなる。
インジケータ24は、その幅が動画像表示部21に表示される動画像の時間的な長さを示しており、パノラマ/縦長サブシーンを示すサブシーン位置表示部26によって、動画像におけるパノラマ/縦長サブシーンの時間的な位置及び時間的な長さを示している。
インジケータ24は、その幅が動画像表示部21に表示される動画像の時間的な長さを示しており、パノラマ/縦長サブシーンを示すサブシーン位置表示部26によって、動画像におけるパノラマ/縦長サブシーンの時間的な位置及び時間的な長さを示している。
ユーザが、図1に示すハードディスク102に記憶された動画像データ102aをキーボード113やマウス114の操作により指定すると、表示処理部101dは、指定された動画像データ102aの表す動画像の開始フレーム画像を、動画像表示部21に表示すると共に、指定された動画像データ102aのファイル名「動画.avi」を、タイトルバー30に表示する。
そして、ユーザが、キーボード113やマウス114の操作により、切り換え部29において「パノラマ画像」を選択すると、表示処理部101dは、サブシーン情報102eをメモリ103に読み出し、全てのパノラマサブシーンの開始/終了フレーム番号を確認する。そして、表示処理部101dは、この開始/終了フレーム番号から、それぞれのパノラマサブシーンのこの動画像における時間的な位置及び時間的な長さを決定し、図12(A)に示すように、インジケータ24上に、それぞれのパノラマサブシーンを表すサブシーン位置表示部26を表示する。なお、動画像データ102aの表す動画像には3つのパノラマサブシーンが含まれており、図12(A)に示すように、3つのサブシーン位置表示部26がインジケータ24上に表示されている。
ユーザが、マウス114の操作によりポインタ27を動かし、図12(A)に示すように、スライダ25を最初のサブシーン位置表示部26に重ねて、最初のサブシーン位置表示部26を指定すると、表示処理部101dは、メモリ103に読み出されたサブシーン情報102eの中から、最初のパノラマサブシーンのXz(+),Xz(−),Yz(+),及びYz(−)を抽出し、パノラマ画像の縦及び横の長さを算出する。そして、表示処理部101dは、この算出したパノラマ画像の縦及び横の長さの値に基づき、図12に示すように、画像サイズ表示部28にパノラマ画像サイズを表示する。
また、ユーザが、最初のサブシーン位置表示部26を指定した状態で、ポインタ27により動画像操作部22にある再生ボタン23を選択すると、表示処理部101dは、動画像表示部21に、この最初のパノラマサブシーンを再生する。
一方、ユーザが、切り換え部29において、「縦長画像」を選択すると、表示処理部101dは、今度は、縦長サブシーンを表すサブシーン位置表示部26を、インジケータ24上に表示する。なお、動画像データ102aの表す動画像には3つの縦長サブシーンが含まれており、図12(B)に示すように、3つのサブシーン位置表示部26がインジケータ24上に表示されている。また、図12(B)に示すように、2番目の縦長サブシーンがスライダ25によって指定されており、この縦長サブシーンから生成することができる縦長画像の大きさが、画像サイズ表示部28に表示されている。
なお、以上説明した確認ウィンドウWを、ディスプレイ112に代えて、プリンタ111に出力するようにしてもよい。また、サブシーン位置表示部26に代えて、各パン/チルトシーンを示すパン/チルトシーン位置表示部を表示させるようにしてもよい。なお、この場合、メモリ103には、サブシーン情報102eに代えて、パン/チルトシーン情報102dを読み出すようにする。
以上説明したように、パノラマ/縦長サブシーンの動画像における時間的な位置及び時間的な長さを、インジケータ24上のサブシーン位置表示部26として表示するので、ユーザは、動画像を再生して確認しなくても、動画像に含まれているパノラマ/縦長サブシーンを簡易に特定することができる。
また、サブシーン位置表示部26と共に、生成することができるパノラマ/縦長画像の大きさも表示するので、実際に複数のフレーム画像を合成してパノラマ/縦長画像を生成しなくても、パノラマ/縦長画像の大きさを簡易に確認することができる。
また、サブシーン位置表示部26と共に、生成することができるパノラマ/縦長画像の大きさも表示するので、実際に複数のフレーム画像を合成してパノラマ/縦長画像を生成しなくても、パノラマ/縦長画像の大きさを簡易に確認することができる。
B2.変形例2:
前述の実施例では、パンシーンを特定する際に、図5に示すステップS310において、+X方向(プラス)の値または0が2つ以上連続する、もしくは−X方向(マイナス)の値または0が2つ以上連続する複数の横ずれ量uを検索して、これら複数の横ずれ量uに対応した一連のフレーム画像群をパンシーンとして特定していたが、1つもしくは2つ以上飛び飛びで、+X方向(プラス)の値または0が2つ以上連続する、もしくは−X方向(マイナス)の値または0が連続する横ずれ量uを検索するようにしてもよい。
なお、チルトシーンを特定する際にも、図5に示すステップS314において、同様な処理を行うようにしてもよい。
このようにすることで、他のフレーム画像と比較して極端な位置ずれとなる1枚もしくは2枚以上のフレーム画像を除いて、より多くのフレーム画像群を1つのパン/チルトシーンとして特定することができる。また、より多くのフレーム画像群を1つのパン/チルトシーンとして特定することができるので、このパン/チルトシーンから、より大きなパノラマ/縦長画像を生成することができるパノラマ/縦長サブシーンを特定することができることになる。
前述の実施例では、パンシーンを特定する際に、図5に示すステップS310において、+X方向(プラス)の値または0が2つ以上連続する、もしくは−X方向(マイナス)の値または0が2つ以上連続する複数の横ずれ量uを検索して、これら複数の横ずれ量uに対応した一連のフレーム画像群をパンシーンとして特定していたが、1つもしくは2つ以上飛び飛びで、+X方向(プラス)の値または0が2つ以上連続する、もしくは−X方向(マイナス)の値または0が連続する横ずれ量uを検索するようにしてもよい。
なお、チルトシーンを特定する際にも、図5に示すステップS314において、同様な処理を行うようにしてもよい。
このようにすることで、他のフレーム画像と比較して極端な位置ずれとなる1枚もしくは2枚以上のフレーム画像を除いて、より多くのフレーム画像群を1つのパン/チルトシーンとして特定することができる。また、より多くのフレーム画像群を1つのパン/チルトシーンとして特定することができるので、このパン/チルトシーンから、より大きなパノラマ/縦長画像を生成することができるパノラマ/縦長サブシーンを特定することができることになる。
B3.変形例3:
前述の実施例では、図1に示すように、位置ずれ情報102b,規定シーン情報102c,パン/チルトシーン情報102d,及びサブシーン情報102eを、動画像データ102aとは別のデータとして、ハードディスク102に記憶させるようにしていたが、これらの情報を、動画像データ102aのヘッダ部等に記憶し、動画像データ101aの一部として、ハードディスク102に記憶させるようにしてもよい。
前述の実施例では、図1に示すように、位置ずれ情報102b,規定シーン情報102c,パン/チルトシーン情報102d,及びサブシーン情報102eを、動画像データ102aとは別のデータとして、ハードディスク102に記憶させるようにしていたが、これらの情報を、動画像データ102aのヘッダ部等に記憶し、動画像データ101aの一部として、ハードディスク102に記憶させるようにしてもよい。
B4.変形例4:
前述の実施例では、図2に示すステップS206において、フレーム画像F(k)及びフレーム画像F(k+1)を、それぞれ基準フレーム画像及び対象フレーム画像として定めていたが、逆に、フレーム画像F(k+1)を基準フレーム画像とし、また、フレーム画像F(k)を対象フレーム画像として定めるようにしてもよい。
この場合、ステップS206では、位置ずれ量(u,v)ではなく、デジタルビデオカメラの動き量(−u,−v)を推定することになり、また、ステップS208では、位置ずれ情報102bとして、位置ずれ量(u,v)ではなく、デジタルビデオカメラの動き量(−u,−v)を記憶することになる。
前述の実施例では、図2に示すステップS206において、フレーム画像F(k)及びフレーム画像F(k+1)を、それぞれ基準フレーム画像及び対象フレーム画像として定めていたが、逆に、フレーム画像F(k+1)を基準フレーム画像とし、また、フレーム画像F(k)を対象フレーム画像として定めるようにしてもよい。
この場合、ステップS206では、位置ずれ量(u,v)ではなく、デジタルビデオカメラの動き量(−u,−v)を推定することになり、また、ステップS208では、位置ずれ情報102bとして、位置ずれ量(u,v)ではなく、デジタルビデオカメラの動き量(−u,−v)を記憶することになる。
B5.変形例5:
前述の実施例では、図2に示すステップS206において推定した位置ずれ量を、ステップS208において、対象フレーム画像のフレーム番号と共にメモリ103に記憶させていたが、対象フレーム画像のフレーム番号に代えて、基準フレーム画像のフレーム番号と共に記憶させるようにしてもよい。
前述の実施例では、図2に示すステップS206において推定した位置ずれ量を、ステップS208において、対象フレーム画像のフレーム番号と共にメモリ103に記憶させていたが、対象フレーム画像のフレーム番号に代えて、基準フレーム画像のフレーム番号と共に記憶させるようにしてもよい。
B6.変形例6:
前述の実施例では、図10に示すステップS409及びステップS410において、Xz(+),Xz(−),Yz(+),及びYz(−)をメモリ103に記憶するようにしていたが、これらXz(+),Xz(−),Yz(+),及びYz(−)に代えて、Xz(+),Xz(−),Yz(+),及びYz(−)から算出される、パノラマ/縦長画像の縦及び横の長さを、それぞれ記憶するようにしてもよい。
前述の実施例では、図10に示すステップS409及びステップS410において、Xz(+),Xz(−),Yz(+),及びYz(−)をメモリ103に記憶するようにしていたが、これらXz(+),Xz(−),Yz(+),及びYz(−)に代えて、Xz(+),Xz(−),Yz(+),及びYz(−)から算出される、パノラマ/縦長画像の縦及び横の長さを、それぞれ記憶するようにしてもよい。
B7.変形例7:
前述の実施例では、動画像データ102aは、デジタルビデオカメラで撮影した動画像を表すデータであるものとしたが、デジタルカメラの連写等により得られた、時系列に並んだ複数の静止画像を表すデータであってもよい。
前述の実施例では、動画像データ102aは、デジタルビデオカメラで撮影した動画像を表すデータであるものとしたが、デジタルカメラの連写等により得られた、時系列に並んだ複数の静止画像を表すデータであってもよい。
B8.変形例8:
前述の実施例では、図5に示すステップS302において、動画像データ102aの表す動画像を規定シーンに分割していたが、このステップS302の処理を省略しても構わない。
ステップS302の処理では、シーンの切り替わりを特定して動画像を規定シーンに分割するが、このシーンの切り替わりを挟んだ2つのフレーム画像間の位置ずれ量は、例えば、山を撮影したフレーム画像と海を撮影したフレーム画像との間の位置ずれ量のように、同じシーン内の隣り合う2つのフレーム画像間の位置ずれ量に比べて、大きく変化することになる。従って、図5に示すステップS310もしくはステップS314において、このシーンの切り替わりを挟んだ2つのフレーム画像を、同一のパンシーンもしくはチルトシーンとして特定する可能性が低いからである。
前述の実施例では、図5に示すステップS302において、動画像データ102aの表す動画像を規定シーンに分割していたが、このステップS302の処理を省略しても構わない。
ステップS302の処理では、シーンの切り替わりを特定して動画像を規定シーンに分割するが、このシーンの切り替わりを挟んだ2つのフレーム画像間の位置ずれ量は、例えば、山を撮影したフレーム画像と海を撮影したフレーム画像との間の位置ずれ量のように、同じシーン内の隣り合う2つのフレーム画像間の位置ずれ量に比べて、大きく変化することになる。従って、図5に示すステップS310もしくはステップS314において、このシーンの切り替わりを挟んだ2つのフレーム画像を、同一のパンシーンもしくはチルトシーンとして特定する可能性が低いからである。
B9.変形例9:
前述の実施例では、動画像データ102a,位置ずれ情報102b,規定シーン情報102c,パン/チルトシーン情報102d,及びサブシーン情報102eは、全てハードディスク102に記憶され、また、ハードディスク102から読み出されていたが、ハードディスク102に代えて、DVD110aに記憶され、また、DVD110aから読み出されるようにしてもよい。
このようにすることで、コンピュータ100に搭載されたハードディスク102の容量が小さい場合でも、位置ずれ量推定及び記憶処理、パン/チルトシーン特定及び記憶処理、及びパノラマ/縦長サブシーン特定及び記憶処理を実行することができる。
前述の実施例では、動画像データ102a,位置ずれ情報102b,規定シーン情報102c,パン/チルトシーン情報102d,及びサブシーン情報102eは、全てハードディスク102に記憶され、また、ハードディスク102から読み出されていたが、ハードディスク102に代えて、DVD110aに記憶され、また、DVD110aから読み出されるようにしてもよい。
このようにすることで、コンピュータ100に搭載されたハードディスク102の容量が小さい場合でも、位置ずれ量推定及び記憶処理、パン/チルトシーン特定及び記憶処理、及びパノラマ/縦長サブシーン特定及び記憶処理を実行することができる。
B10.変形例10:
前述の実施例では、動画像データ102aが記録されている記録媒体として、DVD110aを用いていたが、DVD110aに代えて、MO,CD−R/RW,磁気テープ,メモリカード等、他の記録媒体を用いることも可能である。
前述の実施例では、動画像データ102aが記録されている記録媒体として、DVD110aを用いていたが、DVD110aに代えて、MO,CD−R/RW,磁気テープ,メモリカード等、他の記録媒体を用いることも可能である。
10...画像処理装置
21...動画像表示部
22...動画像操作部
23...再生ボタン
24...インジケータ
25...スライダ
26...サブシーン位置表示部
27...ポインタ
28...画像サイズ表示部
29...切り換え部
30...タイトルバー
100...コンピュータ
101...CPU
101a...位置ずれ量推定部
101b...パン/チルトシーン特定部
101c...サブシーン特定部
101d...表示処理部
102...ハードディスク
102a...動画像データ
102b...位置ずれ情報
102c...規定シーン情報
102d...パン/チルトシーン情報
102e...サブシーン情報
102p...アプリケーションプログラム
103...メモリ
104...入出力インタフェース部
105...内部バス
110...DVDドライブ
110a...DVD
111...プリンタ
112...ディスプレイ
113...キーボード
114...マウス
W...確認ウィンドウ
21...動画像表示部
22...動画像操作部
23...再生ボタン
24...インジケータ
25...スライダ
26...サブシーン位置表示部
27...ポインタ
28...画像サイズ表示部
29...切り換え部
30...タイトルバー
100...コンピュータ
101...CPU
101a...位置ずれ量推定部
101b...パン/チルトシーン特定部
101c...サブシーン特定部
101d...表示処理部
102...ハードディスク
102a...動画像データ
102b...位置ずれ情報
102c...規定シーン情報
102d...パン/チルトシーン情報
102e...サブシーン情報
102p...アプリケーションプログラム
103...メモリ
104...入出力インタフェース部
105...内部バス
110...DVDドライブ
110a...DVD
111...プリンタ
112...ディスプレイ
113...キーボード
114...マウス
W...確認ウィンドウ
Claims (13)
- 画像処理装置であって、
時系列に並んだ複数の画像から成る画像群から、各画像間の位置ずれ量をそれぞれ推定する位置ずれ量推定部と、
推定した前記位置ずれ量を、前記画像群における各画像の時系列上の位置と対応付けて、それぞれ記憶する記憶部と、
を備える画像処理装置。 - 画像処理装置であって、
時系列に並んだ複数の画像から成る画像群における、各画像間の位置ずれ量を、各画像の時系列上の位置と対応付けて表す位置ずれ情報に基づいて、前記画像群において、前記位置ずれ量が略一定方向の位置ずれを示す画像が複数ほぼ連続している箇所を、所定のカメラワークシーンとして特定するシーン特定部と、
特定した前記カメラワークシーンの、前記画像群における時系列上の位置を記憶する記憶部と、
を備える画像処理装置。 - 請求項2に記載の画像処理装置であって、
前記所定のカメラワークシーンは、パンシーンもしくはチルトシーンであることを特徴とする画像処理装置。 - 画像処理装置であって、
時系列に並んだ複数の画像から成る画像群における、各画像間の位置ずれ量を、各画像の時系列上の位置と対応付けて表す位置ずれ情報に基づいて、前記画像群において、前記位置ずれ量が略一定方向の位置ずれを示す画像が複数ほぼ連続し、かつ、それら複数の画像間の前記位置ずれ量の合計量が所定量以上となる箇所を、合成画像生成可能シーンとして特定するシーン特定部と、
特定した前記合成画像生成可能シーンの、前記画像群における時系列上の位置を記憶する記憶部と、
を備える画像処理装置。 - 請求項4に記載の画像処理装置であって、
前記記憶部は、前記合成画像生成可能シーンの、前記画像群における時系列上の位置と共に、少なくとも、前記合計量を表す情報を併せて記憶することを特徴とする画像処理装置。 - 請求項1ないし請求項5のいずれかに記載の画像処理装置であって、
前記画像群は、動画像であることを特徴とする画像処理装置。 - 画像間の位置ずれ量を記憶部に記憶するための位置ずれ記憶方法であって、
(a)時系列に並んだ複数の画像から成る画像群から、各画像間の位置ずれ量をそれぞれ推定する工程と、
(b)推定した前記位置ずれ量を、前記画像群における各画像の時系列上の位置と対応付けて、前記記憶部にそれぞれ記憶する工程と、
を備える位置ずれ記憶方法。 - シーンを記憶部に記憶するためのシーン記憶方法であって、
(a)時系列に並んだ複数の画像から成る画像群における、各画像間の位置ずれ量を、各画像の時系列上の位置と対応付けて表す位置ずれ情報に基づいて、前記画像群において、前記位置ずれ量が略一定方向の位置ずれを示す画像が複数ほぼ連続している箇所を、所定のカメラワークシーンとして特定する工程と、
(b)特定した前記カメラワークシーンの、前記画像群における時系列上の位置を前記記憶部に記憶する工程と、
を備えるシーン記憶方法。 - シーンを記憶部に記憶するためのシーン記憶方法であって、
(a)時系列に並んだ複数の画像から成る画像群における、各画像間の位置ずれ量を、各画像の時系列上の位置と対応付けて表す位置ずれ情報に基づいて、前記画像群において、前記位置ずれ量が略一定方向の位置ずれを示す画像が複数ほぼ連続し、かつ、それら複数の画像間の前記位置ずれ量の合計量が所定量以上となる箇所を、合成画像生成可能シーンとして特定する工程と、
(b)特定した前記合成画像生成可能シーンの、前記画像群における時系列上の位置を前記記憶部に記憶する工程と、
を備えるシーン記憶方法。 - 画像間の位置ずれ量を記憶部に記憶するためのプログラムであって、
時系列に並んだ複数の画像から成る画像群から、各画像間の位置ずれ量をそれぞれ推定する機能と、
推定した前記位置ずれ量を、前記画像群における各画像の時系列上の位置と対応付けて、前記記憶部にそれぞれ記憶する機能と、
をコンピュータに実現させるためのプログラム。 - シーンを記憶部に記憶するためのプログラムであって、
時系列に並んだ複数の画像から成る画像群における、各画像間の位置ずれ量を、各画像の時系列上の位置と対応付けて表す位置ずれ情報に基づいて、前記画像群において、前記位置ずれ量が略一定方向の位置ずれを示す画像が複数ほぼ連続している箇所を、所定のカメラワークシーンとして特定する機能と、
特定した前記カメラワークシーンの、前記画像群における時系列上の位置を前記記憶部に記憶する機能と、
をコンピュータに実現させるためのプログラム。 - シーンを記憶部に記憶するためのプログラムであって、
時系列に並んだ複数の画像から成る画像群における、各画像間の位置ずれ量を、各画像の時系列上の位置と対応付けて表す位置ずれ情報に基づいて、前記画像群において、前記位置ずれ量が略一定方向の位置ずれを示す画像が複数ほぼ連続し、かつ、それら複数の画像間の前記位置ずれ量の合計量が所定量以上となる箇所を、合成画像生成可能シーンとして特定する機能と、
特定した前記合成画像生成可能シーンの、前記画像群における時系列上の位置を前記記憶部に記憶する機能と、
をコンピュータに実現させるためのプログラム。 - 請求項10ないし請求項12のいずれかに記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004061715A JP2005252753A (ja) | 2004-03-05 | 2004-03-05 | 画像処理装置、位置ずれ記憶方法、及びシーン記憶方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004061715A JP2005252753A (ja) | 2004-03-05 | 2004-03-05 | 画像処理装置、位置ずれ記憶方法、及びシーン記憶方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005252753A true JP2005252753A (ja) | 2005-09-15 |
Family
ID=35032809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004061715A Pending JP2005252753A (ja) | 2004-03-05 | 2004-03-05 | 画像処理装置、位置ずれ記憶方法、及びシーン記憶方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005252753A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012089259A (ja) * | 2010-10-15 | 2012-05-10 | Hitachi High-Technologies Corp | 走査型電子顕微鏡 |
JP2013123229A (ja) * | 2012-12-27 | 2013-06-20 | Morpho Inc | 画像処理装置、画像処理方法及び画像処理プログラム |
JP5531194B2 (ja) * | 2011-07-06 | 2014-06-25 | 株式会社モルフォ | 画像処理装置、画像処理方法及び画像処理プログラム |
-
2004
- 2004-03-05 JP JP2004061715A patent/JP2005252753A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012089259A (ja) * | 2010-10-15 | 2012-05-10 | Hitachi High-Technologies Corp | 走査型電子顕微鏡 |
JP5531194B2 (ja) * | 2011-07-06 | 2014-06-25 | 株式会社モルフォ | 画像処理装置、画像処理方法及び画像処理プログラム |
US8831376B2 (en) | 2011-07-06 | 2014-09-09 | Morpho, Inc. | Image processing device, image processing method and storage medium |
US8976280B2 (en) | 2011-07-06 | 2015-03-10 | Morpho, Inc. | Distortion estimating image processing device, method, and non-transitory storage medium |
JP2013123229A (ja) * | 2012-12-27 | 2013-06-20 | Morpho Inc | 画像処理装置、画像処理方法及び画像処理プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7974492B2 (en) | Image data reproducing apparatus with changing proportions of combined enlarged images, method of controlling same and control program therefor | |
JP4549260B2 (ja) | 記録再生装置、記録再生方法、及びコンピュータプログラム | |
US20110043639A1 (en) | Image Sensing Apparatus And Image Processing Apparatus | |
JP2005277531A (ja) | 動画像処理装置 | |
EP1657923A1 (en) | Moving image data processing | |
US7634130B2 (en) | Moving image generating apparatus, moving image generating method and moving image generating program | |
JP5393237B2 (ja) | 画像表示装置及びその制御方法、並びにプログラム及び記憶媒体 | |
JP2020028096A (ja) | 画像処理装置、画像処理装置の制御方法及びプログラム | |
JP2004234624A (ja) | 静止画像生成装置、静止画像生成方法、静止画像生成プログラム、および静止画像生成プログラムを記録した記録媒体 | |
JP2006246307A (ja) | 画像データ処理装置 | |
US11494974B2 (en) | Information processing apparatus, method of controlling information processing apparatus, and storage medium | |
JP5753418B2 (ja) | 画像処理装置 | |
JP4497761B2 (ja) | 画像処理装置及びインデックス作成方法 | |
JP2016181023A (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
JP4513357B2 (ja) | 画像の出力に用いる出力装置に適した画像データの生成 | |
JP2005252753A (ja) | 画像処理装置、位置ずれ記憶方法、及びシーン記憶方法 | |
JP2000348165A (ja) | 情景表示装置 | |
JP4292995B2 (ja) | 動画中の特定シーンの静止画の生成 | |
JP2006005533A (ja) | 動画像の再生時における画像の動きの速度調整 | |
JP2010193026A (ja) | 画像再生装置、画像再生方法およびプログラム | |
JP2006041586A (ja) | 画像再生表示装置 | |
JP2005117182A (ja) | 画像表示装置、画像表示方法、プログラム及び記録媒体 | |
US8340465B2 (en) | Device, method and program for processing image | |
JP4489661B2 (ja) | スライドショー生成装置ならびにその制御方法およびその制御プログラム | |
JP2005135091A (ja) | 画像処理装置及び画像処理方法 |