実施形態1.
図1に、本発明の実施形態を適用した画像処理装置の構成例を示す。ここでは、説明を簡単にするため、動画像の撮影中に、ユーザからの静止画像取得要求があった場合を考える。
図1において、実施形態の画像処理装置は、少なくとも蓄積画像列管理器102、順方向画像間解析器103、逆方向画像間解析器104、判定器105、制御器106を有している。
蓄積画像列管理器102は、制御器106からの制御情報に応じて、動画像として撮影された画像フレームを画像列入力101として順次取得する機能を有する。所定の枚数の画像フレームを蓄積し、蓄積時の時刻情報、蓄積された画像フレームを管理する機能を有する。蓄積されている画像フレームの枚数が所定の枚数を満たしている場合には、画像フレームを新たに蓄積する際に、蓄積されている画像列のうち、最も古い画像フレームから破棄し、新たに画像列入力として取得した画像フレームを、蓄積されている画像列の最後尾の位置に追加するといったFIFO方式で画像列の蓄積状態を管理するような機能を備えていると良い。蓄積画像列管理器102は、蓄積画像列管理情報に基づいて格納されている画像列の状態を管理する機能を有するとともに、必要に応じて、制御器106に対して蓄積画像列管理情報を供給する機能を有する。ここで、蓄積画像列管理情報には、処理の進捗状況を把握し、次に処理すべき画像列に関する情報や、現状で出力候補となっている代表画像のフレーム位置や、現在処理している階層の情報や、判定器105によって選択された順方向や逆方向の判定情報などが含まれると良い。更に、ユーザが実際に要求を行った第1静止画像取得要求の時刻に対応するフレーム位置、およびこの位置から、所定の時刻、またはユーザがあらかじめ指定した時刻、または学習結果から特定された時刻のいずれかの分だけ過去にさかのぼった時点を、ユーザからの第2静止画像取得要求とし、その時刻に直近の動画像フレームを解析の開始位置とした解析開始位置などが含まれると更に良い構成となる。また、画像間解析の処理量を軽減するために、画像のクロッピング領域情報を含むと更に良い構成となる。
また、蓄積画像列管理器102は、制御情報、蓄積画像列管理情報に基づいて供給すべき対象となっている画像列を特定し、必要に応じて順方向画像間解析器103、逆方向画像間解析器104に特定した少なくとも2枚の画像列を供給する機能を有する。ここで、蓄積画像列管理器102は、順方向画像間解析器103に対しては、供給すべき画像列のうち、時間的に過去側のフレーム位置の画像を参照画像、時間的に未来側のフレーム位置の画像を対象画像として供給する機能を有する。また、蓄積画像列管理器102は、逆方向画像間解析器104に対しては、供給すべき画像列のうち、時間的に未来側のフレーム位置の画像を参照画像、時間的に過去側のフレーム位置の画像を対象画像として供給する機能を有する。ここで、画像間解析の処理量を軽減するために、制御器106からの制御情報に応じて、供給する画像列に対し、画像のクロッピング領域情報に基づいて画像の切り抜き領域を特定し、切り抜き処理を行った上で、順方向画像間解析器103および逆方向画像間解析器104に供給する機能を備えると良い。
また、蓄積画像列管理器102は、制御情報、蓄積画像列管理情報に基づいて、出力対象となっている画像を画像列出力107として供給する機能を有する。また、制御器106から制御情報を取得し、要求に基づいて現状で出力候補となっている代表画像が、動画像内のどの範囲の画像列から抽出されたものかを示す画像列の範囲情報を特定し、代表画像の画像列出力とともに画像列の範囲情報を出力する機能を有すると更に良い構成となる。
順方向画像間解析器103は、蓄積画像列管理器102から解析対象となっている少なくとも2枚の画像列を参照画像および対象画像として取得する機能を有する。取得した参照画像および対象画像に対して所定の画像間解析を行い、画像間の類似度を評価する機能を有する。また、評価結果である類似度情報を判定器105に供給する機能を有する。
逆方向画像間解析器104は、蓄積画像列管理器102から解析対象となっている少なくとも2枚の画像列を参照画像および対象画像として取得する機能を有する。取得した参照画像および対象画像に対して所定の画像間解析を行い、画像間の類似度を評価する機能を有する。また、評価結果である類似度情報を判定器105に供給する機能を有する。
判定器105は、順方向画像間解析器103及び逆方向画像間解析器104から供給される順方向の類似度情報および逆方向の類似度情報を取得する機能を有する。取得した順方向の類似度情報と逆方向の類似度情報とを比較し、順方向と逆方向のどちらの画像間解析が有効であったかを判定する機能を有する。類似度情報の判定結果である判定情報を制御器106に供給する機能を有する。ここで判定情報は、順方向が選択されたか、逆方向が選択されたかを特定することができる情報であれば良い。例えば、順方向と逆方向をそれぞれ+と−、または1と0などのフラグ情報で表現されたものが望ましい。
制御器106は、蓄積画像列管理器102に対して制御情報を供給する機能を有する。ここで、制御情報は、蓄積画像列管理器102に対して画像列入力の制御、画像列出力の制御、蓄積画像列管理情報の更新制御に関する情報を少なくとも含むと良い。ここで、制御器106は、ユーザからの直接的な解析開始要求である第1静止画像取得要求があった時刻に基づいて、ユーザが実際に要求を行った第1静止画像取得要求の時刻と、ユーザが実際に所望している静止画像を含む時刻との時間的なズレの時刻分だけ、第1静止画像取得要求があった時刻から過去にさかのぼった時刻を、ユーザからの第2静止画像取得要求として解析開始位置を特定する機能を有する。
次に動作を説明する。
図2は、本実施形態の画像処理装置の制御器106による解析開始位置の導出例を示す概念図である。
例えば、図2のように、動画像の撮影中のある時刻において、ユーザが静止画像を取得したいと考えて、カメラのシャッターボタンを押下したとする。しかし、ユーザが静止画像を取得したいと考えたシャッターボタンを押そうと思ったフレーム位置1401と、実際にユーザがシャッターボタンを押下した時刻のフレーム位置1402との間には、静止画像を認識して実際にシャッターボタンを操作するまでの時間差が少なからず生じる。
この操作までの時間差を、図2に示す矢印1403の補正によって、できる限りユーザがシャッターボタンを押そうと思った位置1401に近づける。そのため、制御器106は、ユーザが実際にシャッターボタンを押したフレーム位置である第1静止画像取得要求の時刻に対応するフレーム位置1402から、所定の時刻、またはユーザからあらかじめ指定した時刻、または学習結果から特定された時刻のいずれかの分だけ過去にさかのぼった時点を、ユーザからの第2静止画像取得要求とし、その時刻に直近の動画像フレームを解析の開始位置とした解析開始位置1404として求める。
このようにして、制御器106は、解析開始位置1404を特定する機能を有する。このような解析開始位置1404を特定し、図2の1405のように所定の画像間解析によって特定することで、ユーザが所望していた位置である画像1401に近く、また、静止画像として鑑賞に堪えうる品質を備えた画像1406を特定する。つまり、この特定された画像1406を静止画像1410として出力することで、第1静止画像取得要求があった時刻のフレーム位置1402に対応する画像を出力として得られる静止画像1408や、解析開始位置1404に対応する画像を出力として得られる静止画像1409よりも、画像内に含まれるノイズや、手ブレ、動きボケ等が少なく、より情報量が多い画像を得ることが可能となる。
また、このような機能の他に、制御器106は、特定した解析開始位置に関する情報を制御情報として蓄積画像列管理器102に供給する機能と、判定器105からの判定情報を取得する機能と、取得した判定情報を制御情報として蓄積画像列管理器102に通知する機能と、蓄積画像列管理器102から蓄積画像列管理情報を取得し、現在の蓄積画像列管理器102内の画像列の格納状況を把握し、本発明の画像処理装置の動作状況を制御する機能を有する。つまり、制御器106は、蓄積画像列管理情報から、処理の進捗状況を把握し、次に処理すべき画像列の特定や、現状で出力候補となっている代表画像のフレーム位置や、処理の階層や、判定器105によって選択された順方向や逆方向の判定情報などを把握する機能を有する。
なお、制御器106は、現状で出力候補となっている代表画像が、動画像内のどの範囲の画像列から抽出されたものかを示す画像列の範囲情報を特定し、必要に応じて蓄積画像列管理器102に画像列出力とともに画像列の範囲情報を出力するように要求する制御情報を供給する機能を有すると更に良い構成となる。
また、制御器106は、必要に応じて画像間解析の処理量を軽減するために、蓄積画像列管理器102が画像列を供給する際に、供給する画像列に対し、切り抜き領域であるクロッピング領域に基づいて画面の切り抜き処理を行った上で供給するように制御するために、クロッピング領域に関する情報を伴った制御情報を蓄積画像列管理器102に供給する機能を有すると良い。ここで、クロッピング領域情報は、所定の領域をあらかじめ設定しておくようにしても構わない。また、例えば、図3の1501、1502、1503のように、フォーカスなどのカメラパラメータに連動してクロッピング領域の大きさや位置を変更することができるようにしても構わない。
図3は、本実施形態の画像処理装置における、クロッピング領域の設定例を示す概念図である。
ここで、図3(a)の1501は蓄積されている画像の全体、1502はクロッピング領域、1503はフォーカス位置を表している。また、フォーカス位置とクロッピング領域との関係は、図3の1502と1503のように、クロッピング領域の中央にフォーカス位置がくるような位置関係であっても構わない。また、図3(b)の蓄積されている画像の全体1504、クロッピング領域1505、フォーカス位置1506のように、フォーカス位置1506とクロッピング領域1505との関係が所定の関係であっても構わない。
次に、図4を用いて本発明の図1の構成の動作について説明する。
図4は、図1に示す本実施形態の画像処理装置の動作を説明したフローチャートである。
まず、制御器106は、画像列の蓄積を開始させるための制御情報を蓄積画像列管理器102に供給する。動画像の撮影が開始されると、画像列入力101として順次撮影された画像列が蓄積画像列管理器102に供給される。
蓄積画像列管理器102は、画像列入力101として供給される画像列であるそれぞれの画像フレームを取得し、所定の枚数になるまで蓄積を行う。所定の枚数を超える場合には、FIFO方式で最も古い時刻に格納された画像フレームを破棄し、新たに取得した画像フレームを最後尾に追加する。このような処理により、入力された画像列を蓄積する(ステップS101)。
制御器106は、例えば動画像の撮影中にユーザが静止画像を記録したいと考えてシャッターボタンを押すなどの動作によって生じる、ユーザからの解析開始要求の有無を監視する。ユーザからの解析開始要求があった場合(ステップS102 YES)は、ステップS103に進む。また、ユーザからの解析開始要求がない場合(ステップS102 NO)は、ステップS101に戻り、画像列の蓄積が継続される。
制御器106は、ユーザからの解析開始要求があったことを確認すると、画像列の蓄積を中断させるための制御情報を蓄積画像列管理器102に供給する。すると、蓄積画像列管理器102は、取得した制御情報に応じて画像列の蓄積を中断し、蓄積画像列管理情報に対して初期化を行うことで解析処理の準備を行う。
また、制御器106は、ユーザからの直接的な解析開始要求である第1静止画像取得要求があった時刻に基づいて、ユーザが実際に要求を行った第1静止画像取得要求の時刻と、ユーザが実際に所望している静止画像を含む時刻との時間的なズレの時刻分だけ、第1静止画像取得要求があった時刻から過去にさかのぼった時刻を、ユーザからの第2静止画像取得要求として解析開始位置を特定し、特定した解析開始位置を蓄積画像列管理器102に供給する。すると、蓄積画像列管理器102は、取得した解析開始位置を蓄積画像列管理情報に反映する。これにより、解析開始位置をユーザが実際に所望した静止画像の時刻位置に近づけた上で、解析を開始することができる。
次に、制御器106は、解析処理の実行を制御するために、蓄積画像列管理器102から蓄積画像列管理情報を取得し、次に処理すべき画像列を特定する。特定した画像列の情報に基づいて制御情報を蓄積画像列管理器102に供給する。
蓄積画像列管理器102は、制御器106から次に処理すべき画像列に関する制御情報を取得し、解析対象となる少なくとも2枚の画像フレームを画像列として特定する。特定した画像列を、順方向画像間解析器103および逆方向画像間解析器104に供給する。特定した画像列を供給する際に、順方向画像間解析器103に対しては、供給すべき画像列のうち、時間的に過去側のフレーム位置の画像を参照画像、時間的に未来側のフレーム位置の画像を対象画像として供給する。また、逆方向画像間解析器104に対しては、供給すべき画像列のうち、時間的に未来側のフレーム位置の画像を参照画像、時間的に過去側のフレーム位置の画像を対象画像として供給する。
その後、順方向画像間解析器103および逆方向画像間解析器104は、それぞれ参照画像および対象画像を蓄積画像列管理部102から取得することで、解析対象となる画像列を取得する(ステップS103)。その後のステップS104およびステップS105は、並列動作を行うように構成されているが、ステップS104およびステップS105をどちらか一方ずつ順次動作によって処理を行うように構成することも可能であり、これらの構成によって特に限定されるものではないことに注意する。
解析対象となる画像列が取得されると、順方向画像間解析器103は、取得した参照画像および対象画像に対して所定の順方向画像間解析を行い(ステップS104)、画像間の類似度を評価し、評価結果である類似度情報を判定器105に供給する。
同様に、逆方向画像間解析器104は、取得した参照画像および対象画像に対して所定の逆方向画像間解析を行い(ステップS105)、画像間の類似度を評価し、評価結果である類似度情報を判定器105に供給する。
判定器105は、順方向画像間解析器103および逆方向画像間解析器104から順方向の類似度情報および逆方向の類似度情報を取得すると、それぞれの類似度情報を比較して順方向と逆方向のどちらの画像間解析が有効であったかを判定する。この判定により、解析対象となっていた画像列から有効な画像フレームを選定し(ステップS106)、類似度情報の判定結果である判定情報を制御器106に供給する。
制御器106は、判定器105から取得した判定情報に基づき、解析対象となっていた画像列の判定情報を制御情報として蓄積画像列管理器102に供給する。
蓄積画像列管理器102では、取得した判定情報に関する制御情報に基づいて、蓄積画像列管理情報に対して判定情報を反映させるとともに、現状において出力対象となる画像の位置情報を更新する(ステップS107)。その後、次の解析に備えるために、蓄積画像列管理情報を更新することで、画像列の管理情報を更新する(ステップS108)。
次に、制御器106は、蓄積画像列管理器102から蓄積画像列管理情報を取得し、次の解析対象となる画像列が存在するか否かを判定する(ステップS109)。
ここで、次の解析対象の画像列が存在する場合(ステップS109 YES)、制御器106は、ステップS103に戻り、上述のように解析処理を継続する。
これに対し、次の解析対象の画像列が存在しない場合(ステップS109 NO)、制御器106は、蓄積画像列管理情報から、出力候補となっている代表画像のフレーム位置を特定するとともに、その代表画像が、動画像内のどの範囲の画像列から抽出されたものかを示す画像列の範囲情報を特定し、必要に応じて蓄積画像列管理器102に画像列出力とともに画像列の範囲情報を出力するように要求する制御情報を供給する。
その後、蓄積画像列管理器102は、制御器106から画像出力に関する制御情報を取得することで、出力すべき画像を特定し、画像を出力する(ステップS110)。また、画像列の範囲情報も必要に応じて出力する。
このように、本実施形態1では、図4に一例として示す画像処理を行うことで、ユーザからの静止画像取得要求があった時刻から、必要に応じてユーザが実際に所望した静止画像が存在する時刻までのずれを補正して解析開始位置を特定し、順方向および逆方向の所定の画像間の解析処理を行うことにより、ユーザが実際に所望した静止画像により近く、静止画像として鑑賞に堪えうる品質を備えた静止画像を抽出することが可能となる。
実施形態2.
次に、本発明の実施形態2として、図1に示す実施形態1の画像処理装置における順方向画像間解析器233および逆方向画像間解析器234を、詳細に構成した図5、図6および図7について説明する。
図5は、実施形態2の画像処理装置における順方向画像間解析器233および逆方向画像間解析器234の構成例を示す図である。
図5において、順方向画像間解析器233は、第1画像列取得器203、第1ME器204、第1MC器205、第1A LPF器206、差分器207a、第1B LPF器208、差分器209a、第1L成分類似度評価器210、第1H成分類似度評価器211を有している。
また、図5において、逆方向画像間解析器234は、第2画像列取得器212、第2ME器213、第2MC器214、第2A LPF器215、差分器216a、第2B LPF器217、差分器218a、第2L成分類似度評価器219、第2H成分類似度評価器220を有している。
なお、図5に示す本実施形態2の場合、図1と異なり、制御器222から順方向画像間解析器233および逆方向画像間解析器234へ制御信号が入力しているのは、本実施形態2の順方向画像間解析器233および逆方向画像間解析器234がそれぞれ第1画像列取得器203または第2画像列取得器212を有しており、それらを制御する必要があり、図1に示す実施形態1では、第1画像列取得器203または第2画像列取得器212の機能を蓄積画像列管理器102が有していたからである。従って、本実施形態2でも、第1画像列取得器203または第2画像列取得器212の機能を蓄積画像列管理器202が有するように構成した場合、制御器222から順方向画像間解析器233および逆方向画像間解析器234へ入力する制御信号は不要となる。
図6は、実施形態2の画像処理装置における順方向画像間解析器233および逆方向画像間解析器234の他の構成例を示す図である。
図6の構成では、図5における差分器207aを第1A HPF器207b、差分器209aを第1B HPF器209b、差分器216aを第2A HPF器216b、差分器218aを第2B HPF器218bの構成要素によって代替したものである。これらは共に、供給された画像情報から高周波数成分を抽出し、H成分情報を生成するためのものである。本発明においてこれらの構成要素は、H成分情報を生成するための構成要素であれば良い。
図7は、実施形態2の画像処理装置における順方向画像間解析器233および逆方向画像間解析器234の、さらに他の構成例を示す図である。
図7は、図5における差分器207aの後段に第1Aノイズ除去器401、差分器209aの後段に第1Bノイズ除去器402、差分器216aの後段に第2Aノイズ除去器403、差分器218aの後段に第2Bノイズ除去器404の構成要素を追加した構成となっている。
以後、本発明の詳細に関する説明は図7に基づいて進めるものとする。また、図1の構成要素と同等の機能を有する場合には説明を省略する。
図7において、制御器222は、図1に示す実施形態1の制御器106の機能を有していると共に、さらに第1画像列取得器203および第2画像列取得器212に関する動作を制御するために、それぞれに対して画像列を取得するための制御情報を供給する機能を有する。
蓄積画像列管理器202は、図1に示す実施形態1の蓄積画像列管理器102の機能を有していると共に、順方向画像間解析器233を構成する第1画像列取得器203と、逆方向画像間解析器234を構成する第2画像列取得器212とに、処理対象となる画像列を供給する機能を有する。
第1画像列取得器203は、制御器222からの制御情報に応じて、蓄積画像列管理器202から、順方向の画像間解析処理を行うための参照画像、対象画像の画像列を取得する機能を有する。つまり、取得した画像列において、参照画像のフレーム位置は対象画像のフレーム位置よりも過去側の画像が得られている。取得した参照画像および対象画像を第1ME器204に供給する機能を有する。第1画像列取得器203は、参照画像を第1MC器205に供給する機能を有する。また、取得した対象画像を第1B LPF器208および差分器209aに供給する機能を有する。
第1ME器204は、第1画像列取得器203から参照画像および対象画像を取得すると共に、所定の動き推定を行い、動きベクトル情報を生成する機能を有する。この所定の動き推定においては、例えばMPEG−1,MPEG−2,MPEG−4,同AVC/SVC等といった画像間相関を利用した動画像符号化において用いられるような、対象画像を重複なく所定の矩形領域に分割し、対応する動きベクトル情報を参照画像内から特定するような動き推定方法によるものであっても構わない。また、対象画像の領域分割を行う際に、所定の任意形状の領域分割を行った後に、対応する任意形状領域の動きベクトル情報を参照画像内から特定するような動き推定方法によるものであれば更に良い構成となる。第1ME器204は、生成した動きベクトル情報を第1MC器205に供給する機能を有する。
第1MC器205は、第1画像列取得器203から参照画像を取得するとともに、第1ME器204から、動きベクトル情報を取得する機能を有する。取得した参照画像および動きベクトル情報に基づいて、所定の動き補償を行い、予測画像を生成する機能を有する。この所定の動き補償においては、動き推定と同様に、例えばMPEG−1,MPEG−2,MPEG−4,同AVC/SVC等といった画像間相関を利用した動画像符号化において用いられるような、動きベクトル情報を用いて参照画像から特定された領域を利用して予測画像を生成するような動き補償方法によるものであっても構わない。また、任意形状の領域分割情報と、任意形状領域に対応する動きベクトル情報によって、参照画像から対応する任意形状領域を特定し、このような領域を利用して予測画像を生成するような動き補償方法によるものであれば更に良い構成となる。また、領域分割情報は、第1ME器204から供給されるように構成しても良いし、また、第1画像列取得器203から対象画像を取得して、再度任意形状の領域分割処理を行うことで、生成しても良い。第1MC器は、生成した予測画像を第1A LPF器206および差分器207aに供給する機能を有する。
第1A LPF器206は、第1MC器205から予測画像を取得し、所定の低周波数帯域通過特性を持つフィルタを用いて予測画像に対してフィルタリング処理を行い、予測画像の低周波数成分情報(L成分情報)を生成する機能を有する。第1A LPF器206は、生成した予測画像のL成分情報を、差分器207aおよび第1L成分類似度評価器210に供給する機能を有する。
差分器207aは、第1MC器205から予測画像を取得するとともに、第1A LPF器206から予測画像のL成分情報を取得し、予測画像から予測画像のL成分情報を減算することで予測画像に含まれる高周波数成分情報(H成分情報)を生成する機能を有する。この差分器207aは、図6で示される第1A HPF器207bのような、所定の高周波数帯域通過特性を持つフィルタを用いて予測画像に対してフィルタリング処理を行い、予測画像のH成分情報を生成する機能を有するような構成要素によって代用するような構成とすることもできる。差分器207aは、生成した予測画像のH成分情報を第1Aノイズ除去器401に供給する機能を有する。ここで、生成した予測画像のH成分情報を第1H成分類似度評価器211に供給するような構成とすることで、図5と同等の構成とすることができる。
第1Aノイズ除去器401は、差分器207aから予測画像のH成分情報を取得し、所定のノイズ除去処理を行った後に、ノイズ除去後の予測画像のH成分情報を、第1H成分類似度評価器211に供給する機能を有する。ここで、ノイズ除去処理は、所定の範囲を閾値とした、H成分情報に含まれる微小ノイズの除去ができることが望ましい。
第1B LPF器208は、第1画像列取得器203から対象画像を取得し、所定の低周波数帯域通過特性を持つフィルタを用いて対象画像に対してフィルタリング処理を行い、対象画像のL成分情報を生成する機能を有する。第1B LPF器208は、生成した対象画像のL成分情報を、差分器209aおよび第1L成分類似度評価器210に供給する機能を有する。
差分器209aは、第1画像列取得器203から対象画像を取得するとともに、第1B LPF器208から対象画像のL成分情報を取得し、対象画像から対象画像のL成分情報を減算することで対象画像に含まれるH成分情報を生成する機能を有する。この差分器209aは、図6で示される第1B HPF器209bのような、所定の高周波数帯域通過特性を持つフィルタを用いて対象画像に対してフィルタリング処理を行い、対象画像のH成分情報を生成する機能を有するような構成要素によって代用するような構成とすることもできる。差分器209aは、生成した対象画像のH成分情報を第1Bノイズ除去器402に供給する機能を有する。ここで、生成した対象画像のH成分情報を第1H成分類似度評価器211に供給するような構成とすることで、図5と同等の構成とすることができる。
第1Bノイズ除去器402は、差分器209aから対象画像のH成分情報を取得し、所定のノイズ除去処理を行った後に、ノイズ除去後の対象画像のH成分情報を、第1H成分類似度評価器211に供給する機能を有する。ここで、ノイズ除去処理は、所定の範囲を閾値とした、H成分情報に含まれる微小ノイズの除去ができることが望ましい。
第1L成分類似度評価器210は、第1A LPF器206から予測画像のL成分情報を取得するとともに、第1B LPF器208から対象画像のL成分情報を取得する機能を有する。取得した予測画像のL成分情報と、対象画像のL成分情報とを、所定の類似度評価方法に基づいて、順方向におけるL成分情報の類似度情報(順方向L成分類似度情報)を生成し、判定器221に供給する機能を有する。ここで、所定の類似度評価方法としては、例えば予測画像のL成分情報と対象画像のL成分情報との差分値dLの二乗平均平方根(RMSE: Root Mean Squared Error)によって評価するようにすると良い。これは、差分値dLを二乗した上で相加平均し、平方根をとったものである。この値が大きいほど、類似度は低くなる。また、計算を簡単にする必要がある場合には、誤差の絶対値和(SAD: Sum of Absolute Differences)によって評価するようにしても構わない。SADにおいても、値が大きいほど類似度は低くなる。これらの誤差の評価値を類似度情報とすると良い構成となる。また、必要に応じて、予測画像のL成分情報および対象画像のL成分情報のRMSEもしくはSADによって評価し、順方向予測L成分誤差情報、順方向対象L成分誤差情報として判定器221に供給するようにすると更に良い構成となる。ここで、予測画像のL成分情報および対象画像のL成分情報のRMSEもしくはSADによって評価を行う際に、予測画像のL成分情報と対象画像のL成分情報との平均画像を生成し、この平均画像と予測画像のL成分情報との差分画像に対してRMSEもしくはSADによって評価し、順方向予測L成分平均誤差情報を生成し、判定器221に供給するようにすると更に良い構成となる。同様に、この平均画像と対象画像のL成分情報との差分画像に対してRMSEもしくはSADによって評価し、順方向対象L成分平均誤差情報を生成し、判定器221に供給するようにすると更に良い構成となる。
ここで、L成分情報の類似度情報を生成する際の、各成分情報に関する詳細を示す一例として、図8を参照しながら説明する。
図8(a)は、予測画像のL成分情報の例を示す。この図8(a)で示される例では、解析対象となっている画像列には円形の動物体が含まれている。この図8(a)では、予測画像が生成される際に、動きベクトル情報に基づいて動き補償が行われることで、対象画像との画面内の空間的な位相差が抑えられている。しかし、この例では、参照画像内の物体の輪郭に動きブレが生じていたため、801の部分のように輪郭が不明瞭になっている。
図8(b)は、対象画像のL成分情報の例を示す。この図8(b)で示される例では、対象画像内の物体は、803の部分のようにブレの少ない輪郭になっている。このような予測画像のL成分情報と、対象画像のL成分情報との間で差分を行うと、図8(c)のような状態となる。
図8(c)のような差分画像は、RMSEやSADによる評価を行う際に用いられる。図8(a)、図8(b)、および図8(c)における成分情報の推移を確認するため、同じ空間位置808、810、812の領域内における同一ラインの成分情報をそれぞれ示したものが、図8(d)、図8(e)、図8(f)である。
図8(d)に示す成分情報809は予測画像のL成分情報における領域808内の1ライン分であり、図8(e)に示す成分情報811は対象画像のL成分情報における領域810内の1ライン分であり、図8(f)に示す成分情報813は、差分画像における領域812内の1ライン分を表している。
図8(d)に示す成分情報809は、動きボケ等を多く含んでいることから、輪郭周辺の信号が急峻ではなく、また全体的に信号成分が低くなっている。図8(e)に示す成分情報811は、動きボケが少ないため、輪郭部分の信号が比較的急峻であり、信号成分も比較的高い。このような図8(d)に示す成分情報809と、図8(e)に示す成分情報811との間で差分を行うことで、図8(f)に示す成分情報813を得る。成分情報813では、図8(f)に示すように、成分情報同士がより近い値であれば、得られる差分の成分情報の絶対値も小さくなる。この例のように、参照画像に動きボケや、動物体の変形や新たな物体の出現・消失などによる動き補償の失敗により成分情報が劣化しているものと差分を行うと、得られる差分の成分情報の絶対値は大きくなる。
したがって、予測画像のL成分情報および対象画像のL成分情報との類似度評価を行うことによって、手ブレや動きボケ、動物体の変形や新たな物体の出現・消失などによって生じる、画面内の大局的な変化を評価することを可能にする。
仮に、このL成分情報の類似度評価において、解析対象となっている画像間の類似度があまり高くないと判断された場合、予測画像のL成分情報から順方向予測L成分誤差情報もしくは順方向予測L成分平均誤差情報、対象画像のL成分情報から順方向対象L成分誤差情報もしくは順方向対象L成分平均誤差情報に基づいて、解析対象となっている画像列から、次の解析対象として重要となる画像を選択するようにすることが望ましい。
図7に戻り、第1H成分類似度評価器211は、第1Aノイズ除去器401からノイズ除去後の予測画像のH成分情報を取得するとともに、第1Bノイズ除去器402からノイズ除去後の対象画像のH成分情報を取得する機能を有する。取得したノイズ除去後の予測画像のH成分情報と、ノイズ除去後の対象画像のH成分情報とを、所定の類似度評価方法に基づいて、順方向におけるH成分情報の類似度情報(順方向H成分類似度情報)を生成し、判定器221に供給する機能を有する。ここで、所定の類似度評価方法としては、例えば、ノイズ除去後の予測画像のH成分情報とノイズ除去後の対象画像のH成分情報との差分値dHの二乗平均平方根(RMSE: Root Mean Squared Error)によって評価するようにすると良い。これは、差分値dHを二乗した上で相加平均し、平方根をとったものである。この値が大きいほど、類似度は低くなる。また、計算を簡単にする必要がある場合には、誤差の絶対値和(SAD: Sum of Absolute Differences)によって評価するようにしても構わない。SADにおいても、値が大きいほど類似度は低くなる。これらの誤差の評価値を類似度情報とすると良い構成となる。また、必要に応じて、予測画像のH成分情報および対象画像のH成分情報のRMSEもしくはSADによって評価し、順方向予測H成分誤差情報、順方向対象H成分誤差情報として判定器221に供給するようにすると更に良い構成となる。ここで、予測画像のH成分情報および対象画像のH成分情報のRMSEもしくはSADによって評価を行う際に、予測画像のH成分情報と対象画像のH成分情報との平均画像を生成し、この平均画像と予測画像のH成分情報との差分画像に対してRMSEもしくはSADによって評価し、順方向予測H成分平均誤差情報を生成し、判定器221に供給するような構成でも構わない。同様に、この平均画像と対象画像のH成分情報との差分画像に対してRMSEもしくはSADによって評価し、順方向対象H成分平均誤差情報を生成し、判定器221に供給するような構成でも構わない。
ここで、H成分情報の類似度情報を生成する際の、各成分情報に関する詳細を示す一例として、図9を参照しながら説明する。
図9(a)は、予測画像のH成分情報の例を示す。この図9(a)で示される例では、解析対象となっている画像列には円形の動物体が含まれている。この図9(a)では、予測画像が生成される際に、動きベクトル情報に基づいて動き補償が行われることで、対象画像との画面内の空間的な位相差が抑えられている。しかし、この例では、参照画像内の物体の輪郭に動きブレが生じていたため、901の部分のように輪郭が不明瞭になっている。
図9(b)は、対象画像のH成分情報の例を示す。この図9(b)で示される例では、対象画像内の物体は、903の部分のようにブレの少ない輪郭になっている。このような予測画像のH成分情報と、対象画像のH成分情報との間で差分を行うと、図9(c)のような状態となる。図9(c)のような差分画像は、RMSEやSADによる評価を行う際に用いられる。
図9(a)、図9(b)、および図9(c)における成分情報の推移を確認するため、同じ空間位置908、910、912の領域内における同一ラインの成分情報をそれぞれ示したものが、図9(d)、図9(e)、図9(f)である。
図9(d)に示す成分情報909は予測画像のH成分情報における領域908内の1ライン分であり、図9(e)に示す成分情報911は対象画像のH成分情報における領域910内の1ライン分であり、図9(f)に示す成分情報913は差分画像における領域912内の1ライン分を表している。
図9(d)に示す成分情報909は、動きボケ等を多く含んでいることから、輪郭周辺の信号が急峻ではなく、また信号成分が輪郭周辺に広く分布している。
図9(e)に示す成分情報911は、動きボケが少ないため、輪郭部分の信号が比較的急峻であり、信号成分も大きく、また輪郭部分に集中している。
このような成分情報909と成分情報911との間で差分を行うことで、図9(f)に示す成分情報913を得る。成分情報913では、図9(f)に示すように、成分情報同士がより近い値であれば、得られる差分の成分情報の絶対値も小さくなる。この例のように、参照画像に動きボケや、動物体の変形や新たな物体の出現・消失などによる動き補償の失敗により成分情報が劣化しているものと差分を行うと、得られる差分の成分情報の絶対値は大きくなる。特に、この例のように図9(d)に示す成分情報909の最大値と、図9(e)に示す成分情報911の最大値の位置がずれていると、差分を行った際に信号成分が十分相殺されず、得られる差分の成分情報の絶対値はより大きくなる。また、動きボケ等により、輪郭部分が不鮮明であると、図9(d)に示す成分情報909のようなH成分情報となる傾向が強い。
このような成分情報909,911との差分によって得られる図9(f)に示す成分情報913は、大きな値が比較的広い範囲に渡って分布する傾向が強い。このような特徴から、このH成分情報に対して類似度を評価することによって、画像間でどの程度手ブレや動きボケ、画面内のテクスチャ情報が変化しているかを判断することが可能である。
したがって、予測画像のH成分情報および対象画像のH成分情報との類似度評価を行うことによって、手ブレや動きボケ、動物体の変形や新たな物体の出現・消失などによって生じる、輪郭部分のズレや、動物体の変化といった、画面内の局所的な変化を評価することを可能にする。
仮に、このH成分情報の類似度評価において、解析対象となっている画像間の類似度があまり高くないと判断された場合、予測画像のH成分情報から順方向予測H成分誤差情報もしくは順方向予測H成分平均誤差情報、対象画像のH成分情報から順方向対象H成分誤差情報もしくは順方向対象H成分平均誤差情報に基づいて、解析対象となっている画像列から、次の解析対象として重要となる画像を選択するようにすることが望ましい。
また、重要となる画像を選択する際には、輪郭部分や画面内のテクスチャ情報がより鮮明なものを選択することが、静止画像としてより品質の高いものを選択することにつながる。
よって、例えば順方向予測H成分誤差情報と順方向対象H成分誤差情報とを比較することによって画像を選択しなければならない場合には、これらの値が高い方を選択するように構成すると良い構成となる。
図7に戻り、第2画像列取得器212は、第1画像列取得器203と同等の機能を有する。
第2画像列取得器212は、制御器222からの制御情報に応じて、蓄積画像列管理器202から、逆方向の画像間解析処理を行うための参照画像、対象画像の画像列を取得する機能を有する。つまり、取得した画像列において、参照画像のフレーム位置は対象画像のフレーム位置よりも未来側の画像が得られている。取得した参照画像および対象画像を第2ME器213に供給する機能を有する。第2画像列取得器212は、参照画像を第2MC器214に供給する機能を有する。また、取得した対象画像を第2B LPF器217および差分器218aに供給する機能を有する。
第2ME器213は、第1ME器204と同等の機能を有する。第2ME器213は、第2画像列取得器212から参照画像と対象画像を取得し、所定の動き推定を行うことにより動きベクトル情報を生成する機能を有する。また、生成した動きベクトル情報を第2MC器214に供給する機能を有する。
第2MC器214は、第1MC器205と同等の機能を有する。第2MC器214は、第2画像列取得器212から参照画像を取得するとともに、第2ME器213から動きベクトル情報を取得し、所定の動き補償を行うことにより、予測画像を生成する機能を有する。また、生成した予測画像を第2A LPF器215および差分器216aに供給する機能を有する。
第2A LPF器215は、第1A LPF器206と同等の機能を有する。第2A LPF器215は、第2MC器214から予測画像を取得し、所定のフィルタリング処理を行うことで、予測画像のL成分情報を生成する機能を有する。また、生成したL成分情報を、差分器216aおよび第2L成分類似度評価器219に供給する機能を有する。
差分器216aは、差分器207aと同等の機能を有する。差分器216aは、第2MC器214から予測画像を取得するとともに、第2A LPF器215から予測画像のL成分情報を取得する機能を有する。また、取得した予測画像から予測画像のL成分情報を減算することで、予測画像のH成分情報を生成し、第2Aノイズ除去器403に供給する機能を有する。ここで、生成した予測画像のH成分情報を第2H成分類似度評価器220に供給するような構成とすることで、図5と同等の構成とすることができる。
第2Aノイズ除去器403は、第1Aノイズ除去器401と同等の機能を有する。差分器216aから予測画像のH成分情報を取得し、所定のノイズ除去処理を行った後、ノイズ除去後の予測画像のH成分情報を第2H成分類似度判定器220に供給する機能を有する。
第2B LPF器217は、第1B LPF器208と同等の機能を有する。第2B LPF器217は、第2画像列取得器212から対象画像を取得し、所定のフィルタリング処理を行うことで対象画像のL成分情報を生成する機能を有する。また、生成した対象画像のL成分情報を差分器218aおよび第2L成分類似度評価器219に供給する機能を有する。
差分器218aは、差分器209aと同等の機能を有する。差分器218aは、第2画像列取得器212から対象画像を取得するとともに、第2B LPF器217から対象画像のL成分情報を取得する機能を有する。また、取得した対象画像から対象画像のL成分情報を減算することで、対象画像のH成分情報を生成し、第2Bノイズ除去器404に供給する機能を有する。ここで、生成した対象画像のH成分情報を第2H成分類似度評価器220に供給するような構成とすることで、図5と同等の構成とすることができる。
第2Bノイズ除去器404は、第1Bノイズ除去器402と同等の機能を有する。第2Bノイズ除去器404は、差分器218aから対象画像のH成分情報を取得し、所定のノイズ除去処理を行った後、ノイズ除去後の対象画像のH成分情報を第2H成分類似度評価器220に供給する機能を有する。
第2L成分類似度評価器219は、第1L成分類似度評価器210と同等の機能を有する。第2L成分類似度評価器219は、第2A LPF器215から予測画像のL成分情報を取得するとともに、第2B LPF器217から対象画像のL成分情報を取得する機能を有する。また、取得した予測画像のL成分情報と、対象画像のL成分情報とを、所定の類似度評価方法に基づいて、逆方向におけるL成分情報の類似度情報(逆方向L成分類似度情報)を生成し、判定器221に供給する機能を有する。
第2H成分類似度評価器220は、第1H成分類似度評価器211と同等の機能を有する。第2H成分類似度評価器220は、第2Aノイズ除去器403からノイズ除去後の予測画像のH成分情報を取得するとともに、第2Bノイズ除去器404からノイズ除去後の対象画像のH成分情報を取得する機能を有する。また、取得したノイズ除去後の予測画像のH成分情報と、ノイズ除去後の対象画像のH成分情報とを、所定の類似度評価方法に基づいて、逆方向におけるH成分情報の類似度情報(逆方向H成分類似度情報)を生成し、判定器221に供給する機能を有する。
判定器221は、第1L成分類似度評価器210から順方向L成分類似度情報、第1H成分類似度評価器211から順方向H成分類似度情報、第2L成分類似度評価器219から逆方向L成分類似度情報、第2H成分類似度評価器220から逆方向H成分類似度情報を取得する機能を有する。また、判定器221は、必要に応じて、第1L成分類似度評価器210から順方向予測L成分誤差情報もしくは順方向予測L成分平均誤差情報、順方向対象L成分誤差情報もしくは順方向対象L成分平均誤差情報を取得する機能を有する。また、判定器221は、必要に応じて、第1H成分類似度評価器211から順方向予測H成分誤差情報もしくは順方向予測H成分平均誤差情報、順方向対象H成分誤差情報もしくは順方向対象H成分平均誤差情報を取得する機能を有する。また、判定器221は、必要に応じて、第2L成分類似度評価器219から逆方向予測L成分誤差情報もしくは逆方向予測L成分平均誤差情報、逆方向対象L成分誤差情報もしくは逆方向対象L成分平均誤差情報を取得する機能を有する。また、判定器221は、必要に応じて、第2H成分類似度評価器220から逆方向予測H成分誤差情報もしくは逆方向予測H成分平均誤差情報、逆方向対象H成分誤差情報もしくは逆方向対象H成分平均誤差情報を取得する機能を有する。判定器221は、取得した順方向のL成分およびH成分の類似度情報と、逆方向のL成分およびH成分の類似度情報とを比較し、順方向と逆方向の画像間解析のどちらが有効であったかを判定する機能を有する。
ここで、判定器221における判定方法は、例えば、L成分類似度情報とH成分類似度情報に対して所定の重み付け係数を乗算した後に加算することで、方向別の類似度情報を生成し、その後、生成した順方向の類似度情報と、逆方向の類似度情報とを比較することで有効な方向を判定する。
また、判定器221は、類似度情報の判定結果である判定情報を制御器222に供給する機能を有する。ここで判定情報は、順方向が選択されたか、逆方向が選択されたかを特定することができる情報であれば良い。例えば、順方向と逆方向をそれぞれ+と−、または1と0などのフラグ情報で表現されたものが望ましい。また、生成した類似度情報を用いて順方向と逆方向の類似度情報を比較する際に、所定の閾値と比較して類似度が高くないと判断された場合には、必要に応じて取得した、順方向側の処理から得られる、順方向予測L成分誤差情報もしくは順方向予測L成分平均誤差情報、順方向対象L成分誤差情報もしくは順方向対象L成分平均誤差情報、および、順方向予測H成分誤差情報もしくは順方向予測H成分平均誤差情報、順方向対象H成分誤差情報もしくは順方向対象H成分平均誤差情報、そして逆方向側の処理から得られる、逆方向予測L成分誤差情報もしくは逆方向予測L成分平均誤差情報、逆方向対象L成分誤差情報もしくは逆方向対象L成分平均誤差情報、および、逆方向予測H成分誤差情報もしくは逆方向予測H成分平均誤差情報、逆方向対象H成分誤差情報もしくは逆方向対象H成分平均誤差情報、に対して所定の重み付け係数を乗算した後に加算することで、方向別の誤差情報もしくは平均誤差情報を生成し、その後、生成した順方向の誤差情報もしくは平均誤差情報と、逆方向の誤差情報もしくは平均誤差情報と、を比較することで有効な方向を判定するような方法であると良い。
次に、図10を用いて、図7に示すように構成された実施形態2の順方向画像間解析器233および逆方向画像間解析器234の各構成要素の動作について説明する。
図10は、図7に示す順方向画像間解析器233および逆方向画像間解析器234における画像間解析を行う際の動作を説明したフローチャートである。
以下の説明では、順方向の画像間解析に関する動作の説明を行う。逆方向の画像間解析に関する動作に関しては、第2画像列取得器212が取得する画像列である参照画像と対象画像が異なるものの、それ以外の処理動作に関しては、順方向の画像間解析と同様であることから、説明を省略する。
まず、制御器222は、解析処理の実行を制御するために、蓄積画像列管理器202から蓄積画像列管理情報を取得し、次に処理すべき画像列を特定し、特定した画像列の情報に基づいて制御情報を蓄積画像列管理器202に供給する。また、第1画像列取得器203および第2画像列取得器212に対して、制御情報を供給することで、動作開始の制御を行う。
蓄積画像列管理器202は、制御器222から次に処理すべき画像列に関する制御情報を取得し、解析対象となる少なくとも2枚の画像フレームを画像列として特定する。特定した画像列を、第1画像列取得器203および第2画像列取得器212に供給する。特定した画像列を供給する際に、順方向である第1画像列取得器203に対しては、供給すべき画像列のうち、時間的に過去側のフレーム位置の画像を参照画像、時間的に未来側のフレーム位置の画像を対象画像として供給する。また、逆方向である第2画像列取得器212に対しては、供給すべき画像列のうち、時間的に未来側のフレーム位置の画像を参照画像、時間的に過去側のフレーム位置の画像を対象画像として供給する。
すると、実施形態2における順方向画像間解析器233内では、第1画像列取得器203は、制御器222からの要求に応じて、蓄積画像列管理器202から、参照画像および対象画像を取得し(ステップS201)、取得した参照画像および対象画像を第1ME器204に供給する。また、取得した参照画像を少なくとも第1MC器205に供給する。更に、取得した対象画像を第1B LPF器208および差分器209aに供給する。
次に、第1ME器204が第1画像列取得器203から参照画像および対象画像を取得すると、これらの画像列を利用して所定の動き推定を行い(ステップS202)、動きベクトル情報を生成し、第1MC器205に供給する。
第1MC器205は、第1画像列取得器203から少なくとも参照画像を取得するとともに、第1ME器204から動きベクトル情報を取得する。取得した参照画像と動きベクトル情報を利用して、所定の動き補償を行って(ステップS203)、予測画像を生成し、第1A LPF器206および差分器207aに供給する。
予測画像の生成が終わると、第1A LPF器206は、第1MC器205から予測画像を取得し、取得した予測画像に対して所定のフィルタリング処理を行い、予測画像のL成分情報を生成することで、予測画像の低周波数成分を抽出する(ステップS204)。その後、生成した予測画像のL成分情報を差分器207aおよび第1L成分類似度評価器210に供給する。
その後、差分器207aは、第1MC器205から予測画像を取得するとともに、第1A LPF器206から予測画像のL成分情報を取得する。取得した予測画像から予測画像のL成分情報を減算し、予測画像のH成分情報を生成することで、対象画像の高周波数成分を抽出する(ステップS207)。その後、生成した予測画像のH成分情報を第1ノイズ除去器401に供給する。
すると、第1Aノイズ除去器401は、予測画像のH成分情報を取得し、所定のノイズ除去を行う(ステップS208)ことで、ノイズ除去後の予測画像のH成分情報を生成し、第1H成分類似度評価器211に供給する。
以上のような予測画像に対する処理と並列して、以下の対象画像に対する処理が行われる。
つまり、まず、第1B LPF器208では、第1画像列取得器203から対象画像を取得し、所定のフィルタリング処理を行うことにより対象画像のL成分情報を生成することで、対象画像の低周波数成分を抽出する(ステップS205)。その後、生成した対象成分のL成分情報を差分器209aおよび第1L成分類似度評価器210に供給する。
すると、差分器209aは、第1画像列取得器203から対象画像を取得するとともに、第1B LPF器208から対象画像のL成分情報を取得して、取得した対象画像から対象画像のL成分情報を減算し、対象画像のH成分情報を生成することで、対象画像の高周波数成分を抽出する(ステップS209)。その後、差分器209aは、生成した対象画像のH成分情報を第1Bノイズ除去器402に供給する。
次に、第1Bノイズ除去器402は、対象画像のH成分情報を取得し、所定のノイズ除去を行う(ステップS210)ことで、ノイズ除去後の対象画像のH成分情報を生成し、第1H成分類似度評価器211に供給する。
それぞれのL成分情報が生成されると、第1L成分類似度評価器210は、第1A LPF器206から予測画像のL成分情報を取得するとともに、第1B LPF器208から対象画像のL成分情報を取得し、所定の類似度評価方法に基づいて、低周波数成分の類似度を評価する(ステップS206)。その後、評価結果である順方向のL成分類似度情報は、判定器221に供給される。
同様に、それぞれのH成分情報が生成されると、第1H成分類似度評価器211は、第1Aノイズ除去器401からノイズ除去後の予測画像のH成分情報を取得するとともに、第1Bノイズ除去器402からノイズ除去後の対象画像のH成分情報を取得し、所定の類似度判定方法に基づいて、高周波数成分の類似度を評価する(ステップS211)。その後、評価結果である順方向のH成分類似度情報は、判定器221に供給される。
このように、本実施形態の画像処理装置では、上述のような画像間解析処理を行うことにより、順方向における類似度情報を生成し、また、同様に逆方向の画像間解析を行うことで、逆方向における類似度情報を生成し、これらの順方向および逆方向の類似度情報に基づいて、判定器221は所定の判定を行うことで、解析対象となっている画像列の、どちら側からの画像間相関が高いかを特定し、どちらの画像を後の解析対象とすべきかを判断することができる。
次に、本実施形態の画像処理方法によって出力候補となる代表画像が特定されていく手順をより詳細に説明するため、図11、図12、図13を用いて以下に説明する。
図11において、501は、図7の蓄積画像列管理器202で保持されている画像列の状態の一例を示している。
蓄積画像列管理器202は、画像列入力を蓄積しておくための手段として、所定の枚数の画像列を格納できるフレームバッファ(図示せず)を備え、制御器222の制御に応じて入力画像列を蓄積する。フレームバッファは、フレームバッファ内の格納位置を特定するためのフレーム位置に関する情報、すなわちフレーム位置情報もしくは単にフレーム位置に基づいて、格納された画像を管理する。
図11の画像列501では、便宜上、解析開始位置に対応する画像をフレーム位置0とし、この画像よりも一つ前の過去の画像をフレーム位置1とするように、格納された時刻が過去に進むほど、順次フレーム位置の番号が増加するように番号付けされているものとする。
また、格納されている画像は、フレーム位置による管理の他に、画像が生成された時刻に関する情報、すなわち時刻情報と関連付けられているものとする。つまり、蓄積画像列管理器202では、入力される画像列は、それぞれの時刻情報とともに蓄積される。
図11における画像列501では、はじめに、解析開始位置に対応するフレーム位置の画像が、代表画像の候補として設定される。図11では、黒く塗りつぶしたフレーム501aで表現されている。ここでは、フレーム位置0の画像が代表画像の候補として選択される。
次に、蓄積されている画像列において、時間方向に対して階層の概念を導入する。例えば、現在蓄積されている画像列は、毎秒30フレーム(以後、30fpsという。)のフレームレートで撮影されたものであるとする。この30fpsの時間間隔の階層を、ここでは0階層とする。このような画像列に対して、図11の画像列501のように画像を2枚ずつ1組として扱い、この時間間隔で1枚分の画像を表現した場合には、15fpsの時間間隔で表現されることになる。
このような時間間隔の階層を−1階層とする。つまり、このように階層が1つ下がる毎にフレームレートが半分になるように、画像列の組を構成することを、ここでは時間方向に対するディアディック(dyadic)な階層構造と称することにする。このようなディアディックな階層構造を実現するためには、時間間隔の階層を1つ下げてフレームレートを半分にする際に、組となっていた2枚の画像のうち、時間的に過去側の画像、もしくは時間的に未来側の画像のどちらか一方の対応する時刻の画像を残すことによって、この2枚分の時間間隔を表現することになる。この画像の残し方によって、フレームレートが半分になった後の画像列は、画像間の時間間隔が等間隔の画像列になったり、不等間隔の画像列になったりする。例えば、フレームレートを半分にする際に、常に過去側の画像を残すようにした場合には、画像間の時間間隔が等間隔の画像列となる。未来側の画像を残すようにした場合も同様に時間間隔が等間隔の画像列となる。また、画像の残し方が一定でない場合、例えば、所定の判定方法に基づいて残す画像を切り替えるような場合には、時間間隔が不等間隔の画像列となる。ただし、所定の判定方法に基づいて残す画像を切り替えるような場合であっても、判定の結果、常に一方の画像を残すような処理が行われた場合には、時間間隔が等間隔の画像列となる。本実施形態の画像処理装置における画像間解析では、この画像の残し方を、順方向の画像間解析と逆方向の画像間解析の結果から得られる類似度によって制御することから、一般に、画像間の時間間隔が不等間隔の画像列が生成される。ただし、類似度による判定の結果、常に一方の画像を残すような処理が行われた場合には、時間間隔が等間隔の画像列が生成される場合もある。よって、本発明では、画像間の時間間隔が等間隔の画像列も、不等間隔の画像列、不等間隔部分を一部に有する画像列も対象とする。
本実施形態の画像処理装置における画像間解析では、まず、解析対象となる少なくとも2枚の画像列を特定する必要があるため、まず、フレームバッファ内に保持されている画像列に対して、−1階層となるように、画像列の組を考える。
最初の解析対象となる2枚の画像列は、図11の画像列502で示されるフレーム位置0と、フレーム位置1である。この解析対象となっている画像列において、順方向の画像間解析を行う場合には、過去側のフレームであるフレーム位置1の画像を参照画像とし、未来側のフレームであるフレーム位置0の画像を対象画像とする。
そして、これらの順方向の画像列に対して順方向の動き推定(ME)および動き補償(MC)を行うことで、図11の503aのような成分情報を得る。
ここで、対象画像に対しては解析方向の特定を容易にするために、順方向を意味する「+」記号を付している。また、逆方向の画像間解析を行う場合には、未来側のフレームであるフレーム位置0の画像を参照画像とし、過去側のフレームであるフレーム位置1の画像を対象画像とする。そして、これらの逆方向の画像列に対して逆方向のMEおよびMCを行うことで、図11の503bのような成分情報を得る。ここで、対象画像に対しては解析方向の特定を容易にするために、逆方向を意味する「−」記号を付している。
その後、図11の503aおよび503bに対して所定の類似度評価および判定により、出力候補となる代表画像として有効な画像が含まれる方向の画像列を選択する。
図11の504では、順方向の画像間解析が有効であったと判断されている。その後、参照画像として設定されたフレーム位置1の画像を、次の解析対象の画像とする。ここでは、参照画像側のフレーム位置を次の解析対象の画像としている。これは、参照画像に対してMCを行った予測画像との類似度比較においても、十分対象画像との類似度が高いということから、より情報量が多く含まれていると考えられる参照画像側のフレーム位置の画像を選択する構成をとっている。しかし、MCによる影響を受けていない対象画像側のフレーム位置を重視した構成とし、対象画像側のフレーム位置の画像を選択するような構成としても構わない。また、今回の組には、代表画像の候補となるフレーム位置が含まれているため、この代表画像候補位置を更新する。ここでは、フレーム位置1が新たな代表画像候補位置として新たに設定される。同様の処理を図11の画像列506,510、514の画像列に対しても行う。
ここで、図11の画像列502に隣接している画像列506以外の画像列は、代表画像候補位置の画像との画像間解析を行う必要が生じた時点で解析をするように動作を制御すると、処理に無駄のない、より良い構成となる。ここでは、説明を簡単にするため、同一階層の解析処理は全て行ったものとすると、図11の画像列505,509,513,517のような、−1階層の画像列が得られる。
図12は、−2階層の画像列を得るための処理を示すための図である。
−2階層では、−1階層の画像列として得られた画像列で2枚ずつ1組として扱うことから、組となった2枚の画像列は、0階層においては4枚の画像列から選別された画像列となる。この様子を示したものが図12の画像列601である。
つまり、フレーム位置1とフレーム位置2の画像列は、フレーム位置0からフレーム位置3までの4枚の画像列から選別されたものであり、この画像列の範囲がフレーム位置1とフレーム位置2の画像列の影響範囲、つまり類似度が高いグループと考えることができる。
−2階層の画像列を得るための処理は、図11と同様であり、−1階層の画像列において、2枚ずつ1組として扱い、図12の画像列602が示すような解析対象となる画像列を特定する。画像列602では、フレーム位置1およびフレーム位置2の画像列が解析対象となる。その後、同様の画像間解析を行い、順方向の解析結果が選択され、順方向の参照画像に対応するフレーム位置の画像が選択される。また、今回の組には、代表画像の候補となるフレーム位置が含まれているため、この代表画像候補位置を更新する。ここでは、フレーム位置2が新たな代表画像候補位置として新たに設定される。同様の処理を図12の画像列606の画像列に対しても行う。
図13は、−3階層の画像列を得るための処理を示すための図である。
−3階層の画像列を得るための処理は、図11および図12と同様であり、−2階層の画像列において、2枚ずつ1組として扱い、図13の画像列702が示すような解析対象となる画像列を特定する。画像列702では、フレーム位置2およびフレーム位置7の画像列が解析対象となる。その後、同様の画像間解析を行い、逆方向の解析結果が選択され、逆方向の参照画像に対応するフレーム位置の画像が選択される。また、今回の組には、代表画像の候補となるフレーム位置が含まれているため、この代表画像候補位置を更新する。ここでは、前の階層、つまりここでは−2階層における代表画像候補位置がフレーム位置2と同じであるため、この代表画像候補位置を維持する。
−3階層の画像列を得るための処理は、図11および図12と同様であり、−2階層の画像列において、2枚ずつ1組として扱い、図13の画像列702が示すような解析対象となる画像列を特定する。画像列702では、フレーム位置2およびフレーム位置7の画像列が解析対象となる。その後、同様の画像間解析を行い、順方向の解析結果が選択され、順方向の参照画像に対応するフレーム位置の画像が選択される。また、今回の組には、代表画像の候補となるフレーム位置が含まれているため、この代表画像候補位置を更新する。ここでは、前の階層、つまりここでは−2階層における代表画像候補位置がフレーム位置2と同じであるため、この代表画像候補位置を維持する。
ここで、本実施形態の画像処理装置による画像間解析処理では、フレームバッファ内の画像列に対して画像間解析を行い、1枚の代表画像が特定された時点で少なくとも終了し、特定された代表画像と、必要に応じて代表画像の影響範囲である画像列の範囲に関する情報を出力する。そのため、図13では、代表画像はフレーム位置2の画像である。また、画像列の範囲は、現在の階層である−3階層よりも一つ上、つまりここでは−2階層の、フレーム位置2が属する画像列の範囲を特定し、必要に応じて代表画像とともに出力するようにすると良い。
そして、図13の画像列706が示すように、最終的に出力される代表画像のフレーム位置は、最初に設定されたフレーム位置である解析開始位置からずれた位置となっている。これは、本実施形態の画像処理装置の画像間解析処理によって、最初の解析開始位置の画像が静止画像として十分な品質ではないと判断されて、より静止画像としてふさわしい、静止画像として鑑賞に堪えうる品質を備えた静止画像としてフレーム2の位置の画像が抽出された結果と言える。
実施形態3.
実施形態3は、図1、図5、図6、図7により示す実施形態1,2の画像処理装置の機能を、図14および図15に示すコンピュータである中央処理制御装置1203、1303がプログラムの実行により実現するようにしたものである。
図14は、本実施形態3の画像処理プログラムにより動作する情報処理装置の一例の構成図を示す。
同図において、情報処理装置1200は、各種の情報を入力するための入力装置1201と、各種の情報を出力するための出力装置1202と、本発明の画像処理プログラムにより動作する中央処理制御装置1203と、外部記憶装置1204と、中央処理制御装置1203による演算処理の際の作業領域など用いる一時記憶装置1205と、外部と通信するための通信装置1206とが、双方向のバス1207により接続された構成とされている。
中央処理制御装置1203は、本発明の画像処理プログラムが記録媒体から、あるいは通信ネットワークを介して配信されて通信装置1206により取り込まれ、蓄積画像列管理器102に相当する蓄積画像列管理手段1208、順方向画像間解析器103,233に相当する順方向画像間解析手段1209、逆方向画像間解析器104,234に相当する逆方向画像間解析手段1210、判定器105に相当する判定手段1211、制御器106に相当する制御手段1212、の各機能を少なくとも有し、図1に示す画像処理装置と同様の動作をソフトウェア処理により実行する。
図15は、実施形態3の画像処理プログラムにより動作する情報処理装置の別の一例の構成図を示す。
同図において、情報処理装置1300は、各種の情報を入力するための入力装置1301と、各種の情報を出力するための出力装置1302と、本発明の画像処理プログラムにより動作する中央処理制御装置1303と、外部記憶装置1304と、中央処理制御装置1303による演算処理の際の作業領域など用いる一時記憶装置1305と、外部と通信するための通信装置1306とが、双方向のバス1307により接続された構成とされている。
中央処理制御装置1303は、本発明の画像処理プログラムが記録媒体から、あるいは通信ネットワークを介して配信されて通信装置1306により取り込まれ、蓄積画像列管理器202に相当する蓄積画像列管理手段1308、判定器221に相当する判定手段1311、制御器222に相当する制御手段1312、を備え、更に順方向画像解析手段1309を構成する、第1画像列取得器203に対応する第1画像取得手段1321、逆方向画像解析手段1310を構成する、第2画像列取得器212に対応する第2画像列取得手段1322、また、順方向画像解析手段1309および逆方向画像解析手段1310を構成する、第1ME器204、第2ME器213を代用するためのME手段1313、第1MC器205、第2MC器214を代用するためのMC手段1314、第1A LPF器206、第1B LPF器208、第2A LPF器215、第2B LPF器217を代用するためのLPF手段1315、図6の構成と同等の動作をするための手段として、第1A HPF器207b、第1B HPF器209b、第2A HPF器216b、第2B HPF器218bを代用するためのHPF手段1316、図5および図7の構成と同等の動作をするための手段として、差分器207a、差分器209a、差分器216a、差分器218aを代用するための差分手段1317、図7の構成と同等の動作をするための手段として、第1Aノイズ除去器401、第1Bノイズ除去器402、第2Aノイズ除去器403、第2Bノイズ除去器404を代用するためのノイズ除去手段1318、第1L成分類似度評価器210、第2L成分類似度評価器219を代用するためのL成分類似度評価手段1319、第1H成分類似度評価器211、第2H成分類似度評価器220を代用するためのH成分類似度評価手段1320、の各機能を少なくとも有し、図5、図6、図7に示す画像処理装置と同様の動作をソフトウェア処理により実行する。
従って、本実施形態3の画像処理装置でも、上記実施形態1,2と同様の画像間解析処理を、プログラムの実行により行うことにより、順方向における類似度情報を生成し、また、同様に逆方向の画像間解析を行うことで、逆方向における類似度情報を生成し、これらの順方向および逆方向の類似度情報に基づいて判定器が所定の判定を行うことで、解析対象となっている画像列の、どちら側からの画像間相関が高いかを特定し、どちらの画像を後の解析対象とすべきかを判断することができる。