本発明は、複数の画像信号を用いて超解像度補間することにより、高解像度のデジタル画像信号を再構成する画像処理装置、画像処理方法、プログラムおよび半導体集積回路に関する。
近年、低解像度の画像を高解像の画像やシーケンスに変える方法が、コンピュータ科学者と画像処理専門家に、強い関心を引きつけている。これらの方法は、超解像、超解像補間または超解像再構成として一般的に呼ばれている。超解像における基本的な考えは、1枚の画像では欠けている画像の詳細を再構成するために、低解像度の複数の画像における画素のサブピクセル単位の動きを利用することである。
それらは、コストの高い高性能撮像素子を使用することなく画像の解像度を改善する効率的な方法を提供するので、超解像は、特に画像取得の局面で有用である。
図1Aは、従来の画像収集システムのブロック図である。
図1Aに示すように、サンプリング部120は、あらかじめ定められたサンプリング周波数で入力画像101をサンプリングする。処理/記録部150は、さらに画像処理あるいは記録媒体への記録をする。入力画像がサンプリング部120のナイキスト周波数より高い映像周波数を含む場合には、サンプリングされた画像でのエイリアシングつまり折り返しノイズが発生する。これは、図1Bで示すように、アンチエイリアシングフィルタ(折り返しノイズ防止フィルタ)110によって避けられる。アンチエイリアシングフィルタ110は、サンプリングの前に、ナイキスト周波数を越える映像周波数を除去するローパスフィルタである。それゆえに、図1Bに示される従来の画像取得再生装置は、折り返しノイズがない画像190を出力する。
図2A〜2C、図3A〜3Eを用いて従来のアンチエイリアシングフィルタ110の機能について説明する。簡潔さのために、説明は、1次元の信号に限定する。これらの図において左側に示されるグラフは、空間領域での信号を示す。横軸xは一次元の空間座標あるいは時間軸を示し、縦軸は輝度を示す。一方、右側のグラフは、周波数領域に(フーリエ)変換された信号を示す。横軸ωは周波数(ラジアン)を示し、縦軸は周波数の強度を示す。ωNはナイキスト周波数を示す。
図2Aは、広い周波数スペクトルFをもつ高速に変化する映像信号を示す。この信号のサンプリングは、図2Bで図式的に表示されるDirac櫛gによる乗算として表される。Dirac櫛のフーリエ変換もまた、Dirac櫛Gである。空間領域での2つのシグナルの乗算が周波数領域に変換された信号の畳み込みと一致するので、サンプル信号のスペクトルF*Gは、図2Cの右に示された形状をもつ。つまり、サンプル信号のスペクトルF*G(実線)は、周期的に変換及び複製された複数のスペクトル(破線)の合計である。
図2Cに示されるように、変換され複製されたスペクトル(破線)が重なっている。特定の周波数のサンプル信号のスペクトルパワーは、その特定の周波数へのいわゆるエイリアスである他の周波数からの影響によって、汚染される。空間領域では、エイリアシングは、モアレ・パターンや、滑らかな輪郭線部分に発生するジャギーのように、明瞭で目立つノイズになる。
エイリアシングを防ぐには、サンプリングで、スペクトルが重なるのを妨げる必要がある。これは、図3Bに示されるローパスフィルタhAAによって初期信号を帯域制限することで、達成される。アンチエイリアシング・フィルタ120は、ローパスフィルタhAAの特性を持つ。
図3Aは、映像信号fを示し、図3Bは、空間領域における畳み込み、あるいは周波数領域の乗算により、その信号を帯域制限するローパスフィルタhAAを示している。図3Cは、映像信号f(破線)と比較した、ローパスフィルタリングの結果f*hAA(実線)を表す。
上記で説明したように、サンプリングは、空間領域において、Dirac櫛gをその信号に乗算したものに相当し、周波数領域において、Dirac櫛Gによる畳込みに相当する(図3D)。その信号のスペクトルが帯域制限されるので、変換され複製されたスペクトルF*HAAは、もはや重ならず(図3E)、それによってエイリアシングが生じない。
次に、超解像補間を備える従来の画像取得システムについて説明する。図4Aは、サンプリング部120、処理/記録部150、超解像補間部160を備える従来の画像収集システムの構成を示すブロック図である。入力画像101は、サンプリング部120に送られる。サンプリング部120は、あらかじめ定められたサンプリング周波数で入力画像101をサンプリングすることにより、デジタル化された画像を生成する。処理/記録部150は、デジタル化された画像を低解像度出力画像191として、オリジナルのサンプリング解像度で出力する。あるいは、低解像度出力画像は、超解像補間部160に出力される。超解像補間部160は、低解像度出力画像に対して調解像補間することによって、オリジナルのサンプリング解像度より優れた解像度の高解像度出力画像192を出力する。
図4Bは、図4Aで示されるシステムにアンチエイリアシングフィルタ110が付加された従来の画像収集システムの構成を示すブロック図である。図4Bのシステムは、図4Aと比べて、入力画像がサンプリングの前にアンチエイリアシングフィルタ110によってフィルタリングする点が異なっている。よって、折り返しノイズが除去されるので、低解像度出力画像191の画質は向上される。しかし、アンチエイリアシング・フィルタリングにより、超解像補間部160によって出力される高解像度出力画像192は、低解像度の画像よりも高精細な画像を全く含んでいない。
図5を参照して、超解像について説明する。従来の超解像再構成方法は、基本的に2つのステップから成る。第1のステップでは、動き推定と位置合わせが行なわれる。動き推定は、対象となる低解像度画像に対する参照画像の動きをサブピクセルで推定することである。位置合わせは、個々の参照画像において推定されたサブピクセル単位の動き(あるいは位置ずれ)を、対象となる低解像度画像に対応する高解像度のグリッド520に登録することである。
第2のステップでは、一様でない補間テクニックが用いられる。これは、再構成すべき高解像度画像530を生成するために高解像度のグリッド520の各々のポイントに補間された値を得ることである。これは、例えば特許文献1に開示されている。
特開2000−339450号公報
しかしながら、上記従来技術によれば、アンチエイリアシングフィルタ110を備えるシステム(図4B)は、エイリアシングを防止しかつ位置合わせを容易にする反面、超解像後の画像の精細さを低減させるという問題がある。逆に、アンチエイリアシングフィルタ110を備えないシステム(図4A)では、位置合わせを困難にする反面、超解像後の画像の精細さを増加させてもエイリアシングが発生するという問題がある。言い換えれば、アンチエイリアシングフィルタ110の存在により、エイリアシングの防止および位置合わせの容易化と、超解像の精細化とはトレードオフの関係にあるという問題がある。
以下この問題について図面を用いて説明する。
図6A〜6Cは、空間及び周波数領域における超解像補間の効果を示している。図6Aは、アンダーサンプルされたシグナルf・gとエイリアシングをもつ対応するスペクトルF*Gを示す。図6Bは、従来の補間法によって、アンダーサンプルされたシグナルの解像度を増大させた結果を示している。サンプリング定理により、アンダーサンプルされた信号は、ナイキスト周波数ωNよりも高い映像周波数に関する情報をもっていない。よって、アップサンプリングによって、スペクトルの繰り返し性が減少されるが、そのスペクトルは、ナイキスト周波数ωNとアリアス周波数(図6Bの右側の実線)の間においてゼロとなる。
しかしながら、超解像補間は、サンプリング部のナイキスト周波数ωNより高い映像周波数620を再構成するために、アップサンプルされた信号における折り返しノイズ610を利用することができる。図6Cで示すように、このように再構成された信号は、1つの山型の部分において、その高い解像度でオリジナル信号をサンプリングすることによって得られる信号に似ている。
上述したように、付加情報がサブピクセルのシフトによって複数の低解像度の画像から抜き出されるので、超解像補間はサンプリング定理と矛盾することはない。要するに、超解像補間は、周波数領域でエイリアシング要素をソートすることができて、低解像度画像自体からは明らかでない、ある解像度で画像の精細を再構成するために、ナイキスト周波数を越えるギャップを埋めることができる。よって、折り返しノイズは、超解像補間にとって重要である。
他方、折り返しノイズは、大幅に動き推定を妨げることがある。この問題の有名な例は、西部劇において反対方向で回転するように見える馬車のスポーク車輪である。この現象は時間領域でのエイリアシングによるものであるが、同じ問題は空間領域でのアンダーサンプルで起こる。したがって、動き推定を行うことができるように、アンチエイリアシング・フィルタリングを使用する必要もある。しかし、それは超解像補間のための条件付きである。
図7Aは、図1Bに示すアンチエイリアシングフィルタを使用したときの効果を示している。図7Aは、アンチエイリアシングフィルタをかけられ、サンプリングされた図3Eの信号を示している。この信号をアップサンプルすると、すなわち付加サンプリングポイントrを追加すると、図7Bの右側に示されるスペクトルになる。図6Bの前の例に似ているように、周波数領域でのその信号の繰り返し性は、ナイキスト周波数ωNとそのエイリアスを越えたギャップを残したまま、減少している。しかしながら、前の例とは対照的に、高映像周波数は、アンチエイリアシングフィルタによって除去され、エイリアシング成分を生成するために折り重ねされていない。それゆえに、これらの周波数に関する情報は消失し、もはや再構成されない。
デジタル画像収集システムは、通常、撮像素子における解像度の制約を受ける。サンプリングされた画像で識別することができるかできない内容に関する実際的な制約は別として、限られたサンプリング解像度は、また、目立つアーチファクト(例えばモアレ・パターン)をもたらすことがある。これらのアーチファクトは、忠実にこれらのパターンを再現するには十分に高いとはいえない解像度で、精細パターンを含んだオリジナル画像をサンプリングすることに起因している。これは、アンダーサンプルされたシグナルにおける、よく知られた、エイリアシングの一例である。したがって、従来のデジタル画像収集システムは、これらの目立つアーチファクトを防ぐために画像をサンプリングする前にアンチエイリアシングフィルタを用いている。アンチエイリアシングフィルタは、基本的に、どのようにでもサンプリングしても、精細なパターンを除去するので、オリジナル画像をぼやけさせ、これによって、モアレ・パターンの形成を防いでいる。しかし、この従来のアプローチで、アンチエイリアシングフィルタによって取られる内容は、永久に消失して、超解像テクニックによって再構成されることができない。
本発明は、エイリアシングの防止および位置合わせの容易化と、超解像の精細化とを共に達成する画像処理装置、画像処理方法、プログラムおよび半導体集積回路を提供する目的とする。
上記課題を解決するため本発明の画像処理装置は、画像信号をフィルタリングするフィルタ手段と、フィルタリングされた画像信号を予め定められたサンプリング周波数でサンプリングすることにより、第1解像度の第1デジタル画像信号を生成するサンプリング手段と、サンプリング手段から得られる複数の第1デジタル画像信号を用いて超解像度補間することにより、当該第1解像度よりも高い第2解像度の第2デジタル画像信号を再構成する超解像手段とを備え、前記フィルタ手段は、前記サンプリング周波数の1/2倍のナイキスト周波数以下の周波数成分を通過させるとともに、ナイキスト周波数以上で前記第2解像度で表現可能な最高周波数以下の周波数成分の一部を通過させる。このように、サンプリング解像度のナイキスト周波数を超える映像周波数を制御可能に一部残することが、本発明の特徴的な手法である。これにより、エイリアシングの防止および位置合わせの容易化と、超解像の精細化とを共に達成することができる。
ここで、前記画像処理装置は、さらに、前記第2デジタル画像信号をフィルタリングするフィルタであって、前記フィルタ手段と逆のフィルタ特性を有する逆フィルタ手段を備えてもよい。
ここで、前記逆フィルタ手段は、前記ナイキスト周波数以下の周波数成分を減衰させ、ナイキスト周波数以上で前記第2解像度で表現可能な最高周波数以下の周波数成分の一部を通過させるようにしてもよい。
ここで、前記逆フィルタ手段は、前記ナイキスト周波数以下の周波数成分を通過させ、ナイキスト周波数以上の周波数成分を強調するようにしてもよい。
この構成によれば、逆フィルタ手段は、フィルタ手段によって減衰した第2解像度のデジタル画像の高周波成分を拡大することができる。つまり、よりシャープな第2解像度の画像信号が得られる。
好ましくは、エイリアシング制御フィルタのフィルタ特性は、適応的に入力画像のコンテンツに従ってセットされる。エイリアシング制御フィルタの最適な減衰係数は、画像コンテンツに依存する。つまり、ナイキスト周波数に近い映像周波数における詳細な内容の量に依存する。画像コンテンツにエイリアシング制御フィルタを用いることで、超解像補間のための多くの情報できるだけ残しておくことで、低解像度のデジタル画像における可視折り返しノイズが抑制される。
ここで、前記フィルタ手段の特性は、前記ナイキスト周波数から前記最高周波数間までの範囲内で減衰勾配を有し、前記最高周波数の周波数成分は0に減衰されるようにしてもよい。
ここで、複数の第1解像度のデジタル画像信号は、映像シーケンスに対応することが望ましい。こうすれば、複数の低解像度の第1画像信号は、ビデオカメラによって簡単に記録されることができる。さらに、ビデオカメラによってとられる映像シーケンスは、相互のサブピクセル単位の移動を含む。これによって、超解像のための基礎的な準備がなされる。
ここで、超解像手段は、複数の高解像デジタル画像を再構成するようにしてもよい。その複数の高解像の第2デジタル画像は、映像シーケンスを高解像度に再構成したものに対応する。このように、低解像度の映像シーケンスを記録することができて、全く同じ内容の高解像度のバージョンを出力することができる。
また、本発明の画像処理方法、プログラム、半導体集積回路は、上記と同様の構成を有する。
本発明の画像処理装置によれば、エイリアシングの防止および位置合わせの容易化と、超解像の精細化とを共に達成することができる。また、超解像による高解像度の(第2解像度の)デジタル画像の高周波成分を拡大することによって、よりシャープな高解像度の画像信号が得られる。
図1Aは、従来の画像収集システムの構成を示すブロック図である。
図1Bは、アンチエイリアシング・フィルタリングによる従来の画像収集システムの構成を示すブロック図である。
図2Aは、空間及び周波数領域での入力信号の図である。
図2Bは、空間及び周波数領域で、サンプリングステップで使われる、Dirac櫛の図である。
図2Cは、空間及び周波数領域でサンプリングされた入力信号の図である。
図3Aは、空間及び周波数領域での入力信号の図である。
図3Bは、空間及び周波数領域でのローパスフィルターの図である。
図3Cは、空間及び周波数領域でのローパス・フィルターをかけられた入力信号の図である。
図3Dは、空間及び周波数領域での、サンプリングステップで使われる、Dirac櫛の図である。
図3Eは、空間及び周波数領域での、ローパスフィルターがかけられた入力信号の図である。
図4Aは、超解像補間による従来の画像収集システムの構成を示すブロック図である。
図4Bは、超解像補間とアンチエイリアシング・フィルタリングによる従来の画像収集システムの構成を示すブロック図である。
図5は、画像記憶と超解像再構成での補間を示す図である。
図6Aは、空間及び周波数領域でのサンプリングされた入力信号の図である。
図6Bは、空間及び周波数領域での、解像度が強化された信号の図である。
図6Cは、空間及び周波数領域での、超解像補間を用いて解像度が強化された信号の図である。
図7Aは、空間及び周波数領域での、アンチエイリアシングフィルタをかけられてサンプリングされた入力信号の図である。
図7Bは、空間及び周波数領域での、アンチエイリアシングフィルタをかけられてサンプリングされた入力信号に適用される超解像補間の図である。
図8は、本発明の実施形態の画像処理装置の構成を示すブロック図である。
図9Aは、空間及び周波数領域での入力信号の図である。
図9Bは、本発明の実施形態における、空間及び周波数領域でのローパスフィルターの図である。
図9Cは、本発明の実施形態における、空間及び周波数領域でのローパスフィルターがかけられた入力信号の図である。
図10は、逆減衰フィルタの構成例を示す図である。
図11Aは、エイリアシング制御フィルタのフィルタ特性例を示す図である。
図11Bは、エイリアシング制御フィルタのフィルタ特性例を示す図である。
図11Cは、エイリアシング制御フィルタのフィルタ特性例を示す図である。
図12Aは、逆減衰フィルタのフィルタ特性例を示す図である。
図12Bは、逆減衰フィルタのフィルタ特性例を示す図である。
図12Cは、逆減衰フィルタのフィルタ特性例を示す図である。
図13Aは、本発明の実施形態における、空間及び周波数領域でのローパスフィルターがかけられサンプリングされた入力信号の図である。
図13Bは、本発明の実施形態における、空間及び周波数領域での超解像補間の図である。
図13Cは、本発明の実施形態における、空間及び周波数領域での、逆減衰フィルターがかけられ超解像補間がされた入力信号の図である。
図14Aは、本発明の実施形態における、エイリアシング制御と減衰係数0.4の逆減衰フィルタのフィルタ特性を示す図である。
図14Bは、本発明の実施形態における、エイリアシング制御と減衰係数0.2の逆減衰フィルタのフィルタ特性を示す図である。
図15は、本発明の実施形態における、階層的な映像エンコーダの構成を示すブロック図である。
図16は、本発明の実施形態における、階層的な映像デコーダの構成を示すブロック図である。
符号の説明
101 入力画像
110 アンチエイリアシングフィルタ
120 サンプリング部
120 フィルタ
150 処理/記録部
160 超解像補間部
190 画像
190、191、520 低解像度出力画像
192、530 高解像度出力画像
520 グリッド
530 高解像度画像
610 ノイズ
620 映像周波数
1001 入力画像
1002 高解像度映像信号
1010 エイリアシング制御フィルタ
1020 サンプリング部
1021 ダウンサンプリング部
1051、1052、1053 符号化部
1054、1055 加算器
1056、1057 復号化部
1060 超解像補間部
1070 逆減衰フィルタ
1091、1098 低解像度出力画像
1092、1099 高解像度出力画像
1095、1096 ビットストリーム
本発明の実施の形態における画像処理装置は、画像信号をフィルタリングするフィルタ手段と、フィルタリングされた画像信号を予め定められたサンプリング周波数でサンプリングすることにより、第1解像度の第1デジタル画像信号を生成するサンプリング手段と、サンプリング手段から得られる複数の第1デジタル画像信号を用いて超解像度化することにより、当該第1解像度よりも高い第2解像度の第2デジタル画像信号を再構成する超解像手段とを備えている。
ここでフィルタ手段は、単純なアンチエイリアスフィルタとして機能するのではなく、アンチエイリアス制御フィルタとして機能する。アンチエイリアス制御フィルタとしてのフィルタ手段は、サンプリング周波数の1/2倍のナイキスト周波数以下の周波数成分を通過させるだけでなく、ナイキスト周波数以上で前記第2解像度で表現可能な最高周波数以下の周波数成分の一部をも通過させる。つまり、フィルタ手段は、ナイキスト周波数を越える周波数を完全に除去していないで、ナイキスト周波数以上で前記第2解像度で表現可能な最高周波数以下の周波数成分の一部を通過させる。ナイキスト周波数以上で前記最高周波数以下の周波数成分は、エイリアシングの原因となるが、超解像による高精細化には欠かせない成分でもある。ナイキスト周波数より上の映像周波数は、低解像度出力画像1091において目立つ折り返しノイズを減らすために除去ではなく減衰される。このようにサンプリングされて記録された画像は、サンプリング解像度より高い解像度で高解像出力画像を生成するための超解像補間部1060によって、高精細化することができる。加えて、エイリアシングの原因となる周波数成分が減衰されるので、超解像における動き推定の精度を劣化させずに、位置合わせを精度よくすることができる。
また、画像処理装置は、さらに、逆フィルタ特性を備える。この逆特性フィルタは、第2デジタル画像信号をフィルタリングするフィルタであって、前記フィルタ手段と逆のフィルタ特性を有する。これにより、逆フィルタ手段は、フィルタ手段によって減衰した第2解像度のデジタル画像の高周波成分を拡大または強調することができる。つまり、よりシャープな第2解像度の画像信号が得られる。
図8は、本発明の第一の実施形態における画像処理装置の構成例を示すブロック図である。同図の画像処理装置は、エイリアシング制御フィルタ1010、サンプリング部1020、処理/記録部1030、超解像補間部1060、逆減衰フィルタ1070を備える。
入力画像1001は、サンプリングの前に、エイリアシング制御フィルタ1010に入力される。入力画像は、光学システムで生成されるアナログ画像であってもよいし、他の撮像装置等から伝送されているデジタル画像であってもよい。
エイリアシング制御フィルタ1010は、上記フィルタ手段に相当し、サンプリングされた画像の超解像補間を可能にするために、サンプリング1020のナイキスト周波数を越える周波数を完全には除去していない。その代わりに、ナイキスト周波数より上の映像周波数は、低解像度出力画像1091において目立つ折り返しノイズを減らすために減衰される。
例えば、エイリアシング制御フィルタ1010は、イメージセンサの上流で用いられる光学(ぼかし)フィルタの形態で実装されてもよいし、そのサンプリング解像度よりも高い入力解像度のデジタルイメージ情報で動作するデジタルフィルタの形態で実装されてもよい。前者の場合、サンプリング部1020は、CCDのようなデジタル・イメージセンサーであってもよい。後者の場合、サンプリング部1020は、エイリアシング制御フィルタ1010が、入力画像1001をフィルタリングしてダウンサンプルした画像を生成するという意味において、エイリアシング制御フィルタ1010と同一であってもよい。
サンプリング部1020は、フィルタリングされた画像信号を予め定められたサンプリング周波数でサンプリングすることにより、第1解像度(以下低解像度と呼ぶ)のデジタル画像信号を生成する。
処理/記録部1050は、サンプリング部1020からの低解像度のデジタル画像をそのまま低解像度出力画像1091として出力すると同時に、超解像補間部1060にも出力する。また、処理/記録部1030は、他の画像処理あるいは記録媒体への記録をしてもよい。
超解像補間部1060は、処理/記録部1030からから得られる低解像度の複数のデジタル画像信号を用いて超解像度化することにより、第1解像度よりも高い第2解像度(以下高解像度と呼ぶ)のデジタル画像信号を再構成する。
逆減衰フィルタ1070は、上記逆フィルタ手段として機能し、超解像補間部1060からの高解像度画像を、フィルタリングする。
さらに、低解像度出力画像1091や再構成された高解像度出力画像1092は、さらに出力部によって出力されてもよい。出力部は、出力画像を表示する表示装置、出力画像を格納する格納装置、伝送路を介して出力画像を符号化して伝送する符号化伝送装置、あるいは、画像認識又は動き推定部のような画像処理手段等に接続されていてもよい。
低解像のみ、高解像のみ、あるいは、低解像及び高解像の出力画像が出力部を介して出力されるか否かは、下流装置の必要性や能力、例えば、表示解像度、記録容量、伝送帯域、計算能力等に依存している。
次に、上記画像処理装置の動作について、図面を用いて詳細に説明する。
図9A〜9Cを用いてエイリアス制御フィルタ1010の機能について説明する。説明の便宜上、1次元の信号に限定する。これらの図において左側に示されるグラフは、空間領域での信号を示す。横軸xは一次元の空間座標あるいは時間軸を示し、縦軸は輝度を示す。一方、右側のグラフは、周波数領域に(フーリエ)変換された信号を示す。横軸ωは周波数(ラジアン)を示し、縦軸は周波数の強度を示す。ωNはナイキスト周波数を示す。
図9Aは入力信号fを示す。図9Bはエイリアシング制御フィルタ1010の特性hACを示す。図9Cはエイリアシング制御フィルタ1010で入力信号1001をフィルタリングしたときの結果f*hACを示している。
エイリアシング制御フィルタ1010は、サンプリング部1020におけるナイキスト周波数ωNを越える全ての周波数を除去しているわけではないことに注意されたい。その代わりに、高い画像周波数は、周波数依存減衰ファクタによって、ナイキスト周波数ではそのまま(減衰なし)で、超解像補間手段の解像度で表される最も高い画像周波数に対応する周波数でゼロ(除去)となるように、減衰される。その結果、空間領域でのこのフィルタのインパルス応答hACは、図3Bで示されるアンチエイリアシングフィルタのインパルス応答hAAよりも狭い。このようにエイリアシング制御フィルタ1010によってフィルターをかけられた入力信号は、ナイキスト周波数を越える映像周波数から成る(図9C参照)。
図13Aは、エイリアシング制御フィルタ1010によってフィルターをかけられた入力信号をサンプリングした結果を示している。この図13Aは図3Eと似ているが、ナイキスト周波数を越える映像周波数の一部を残す点で異なっている。ナイキスト周波数より高い映像周波数の存在により、フィルターをかけられた入力信号のスペクトルは、オーバーラップし、弱いエイリアシングが生じている(図13Aにおいてハッチングされた領域310、320)。しかしながら、エイリアシング制御フィルタ1010により、折り返しノイズの振幅は、減少している。それゆえに、このように得られた低解像度の画像は、図4Aに示される従来の画像収集システムによる低解像度の画像出力と比較して、改善された画質を示している。
さらに、折り返しノイズの抑制により、動き推定は、サブピクセル・レベルでより正確に推定される。それは超解像補間における位置合わせに必要である。残っている折り返しノイズは、サンプリング解像度によりも優れた解像度で画像の内容を抽出する超解像補間部1060によって利用されることができる。理想的には、周波数領域でのエイリアシングは、図13Bで実線として示される再構成された信号に至って、完全に解消される。
しかし、再構成された信号は、なお、エイリアシング制御フィルタ1010の特性により、高周波数成分が減衰する(ハッチングされた領域330)。これは、エイリアシング制御フィルタ1010の効果を補正するための、映像周波数を増幅する逆減衰フィルタ1070によって、是正される。その結果、オリジナルの入力信号は、高精細に再構成される(図13C参照)。
この説明では、逆減衰フィルタ1070は、補間が意味する超解像補間部1060の出力を受け取る別々の装置であるとして、説明されている。しかし、本発明は、この点に制限されるものではない。逆に、逆減衰フィルタは、超解像補間部1060の一部であってもよい。特に、オリジナルの入力信号から、観測された低解像度画像を生成する観測モデルの一部であってもよい。
図9Bで示されるエイリアシング制御フィルタ1010の特性は、例示に過ぎず、本発明を制限するものではない。図11A〜図11Cに示すように、複数種類のフィルタ特性を切り替え可能なエイリアシング制御フィルタ1010が、本発明の目的を達成するのに用いてもよい。望ましくは、そのフィルタは、ナイキスト周波数まで一定のゲインを持ち、その周波数を超えると一定の減衰率を持つのがよい。ナイキスト周波数を越えた周波数における最適な減衰率は、画像コンテンツに依存して、図11A〜図11Cのフィルタ特性を適応的に切り替えてもよい。望ましくは、減衰率は、折り返しノイズを回避するに十分な強度の高周波周波数成分を残すことが好ましい。そうでなければ、減衰率は、できるだけ弱い方が好ましい。すなわち、減衰率は、超解像補間部1060による高精細化を実現するために、1以下の値でよい。
実験では、ナイキスト周波数を越えた周波数では、減衰率が望ましくは0.5から0.1であることがわかった。
エイリアス制御フィルタ1010は、アナログ画像信号をサンプリングするフィルタでも、デジタル画像信号をダウンサンプリングするフィルタであってもよい。図10は、後者に対応するエイリアス制御フィルタ1010の一構成例を示す図である。同図のエイリアス制御フィルタ1010は、(2N+1)個の乗算器と1個の加算器とを備える。(2N+1)の乗算器は、連続する(2N+1)の画素(サンプル)P-N〜PNと、(2N+1)の重み係数(タップ係数)W-N〜WNとが入力される。フィルタ特性は重み係数の組み合わせにより定められる。加算器は(2N+1)個の乗算結果を加算し、P0に対応する新たな画素P’を出力する。新たな画素P’の集合は低解像度画像を構成する。
逆減衰フィルタ1070のフィルタ特性はエイリアシング制御フィルタ1010と逆の特性である。それゆえに、逆減衰フィルタ1070は、ナイキスト周波数までは単一ゲインをもち、その周波数を超えると特定の強調特性をもつ。望ましくは、ナイキスト周波数を超える周波数での利得は、エイリアシング制御フィルタ1010の減衰係数と一致する2から10である。
図12A〜図12Cは、図11A〜図11Cのフィルタ特性と逆の特性を持つ逆減衰フィルタ1070の特性を示す図である。逆減衰フィルタ1070は、エイリアス制御フィルタ1010と連動して、これらのフィルタ特性を切り替え可能であり、前記ナイキスト周波数以下の周波数成分を通過させ(利得1)、ナイキスト周波数以上の周波数成分を強調する(利得2〜10)。このような逆減衰フィルタ1070は、図10と同様の回路により構成できる。エイリアス制御フィルタ1010と逆のフィルタ特性は重み係数の組み合わせにより定められる。
なお、逆減衰フィルタ1070は、ナイキスト周波数以下の周波数成分を減衰させ(例えば一定の利得0.5)、ナイキスト周波数以上で前記第2解像度で表現可能な最高周波数以下の周波数成分の一部を通過させる(例えば利得1)ようにしてもよい。
技術的には、エイリアシング制御フィルタ1010と逆減衰フィルタ1070は、望ましくは、有限インパルス応答フィルタとして実装される。図14A、図14Bは、減衰率0.4(図14Aでの1101a)と0.2(図14Bでの1101b)の9タップの2つのエイリアシング制御フィルタ1010の例を示している。それぞれは、理想的な逆減衰フィルタ(1102a、1102b)と、それらの有限(9タップまたは11タップ)の実装(図14Aと図14Bの中の破線)に対応する。
上記の画像処理装置では、複数の低解像度画像中の1つの対象画像に注目して説明してきた。しかし、本発明は、1つの画像への適用に限られず、むしろ、画像のシーケンスに対する取得、処理及び再生に適用されてもよい。たとえば、映像アプリケーション、または、マルチビュー画像、つまり、異なる角度から同じシーンを同時に記録して得られる画像や映像等である。
次に、本発明を動画符号化装置に適用した好ましい実施例を、図15と図16を参照して説明する。
図15は、本発明の階層的な動画符号化装置の構成を示すブロック図である。デジタル高解像度入力画像1002は、エイリアシング制御フィルタ1010によってフィルタリングされ、次のダウンサンプリング部1021によって生じる折り返しノイズの量を制御する。ダウンサンプリング部1021は、フィルタリングされた入力映像信号をダウンサンプリングすることにより、低い解像度のディジタル映像信号を出力する。ダウンサンプルされた映像信号は、例えば、限られた表示能力しかない移動体装置での表示に適用することができる。符号化部1051は、ダウンサンプルされた映像信号を符号化し、圧縮さえたデジタル映像信号を、ビットストリーム1(1095)として出力する。符号化部1051は、MPEG−2またはH.264/MPEG4−AVC規格に従った規格の伝送ベースの映像エンコーダでよい。しかしながら、本発明は、特定のタイプのエンコーダに限定されない。むしろ、本発明は、映像信号を符号化してデジタル・ビットストリームにするエンコーダであればどんなタイプでも実現され得る。
このビットストリーム1は、参照映像信号を生成するために内部の符号化部1053に送られる。この参照映像信号は、圧縮低解像度のビットストリーム1から、高解像度の映像信号を再構成するために、超解像補間部1060に送られる。超解像補間部1060から生成される高解像映像信号は、逆減衰フィルタ1070によりフィルタリングされる。
再構成された信号の解像度は、望ましくは高解像度入力画像1002の解像度と一致する。
超解像補間技術を用いることで、超解像補間部1060におけるアップサンプリングは、フレーム単位で実行することができない。
その代わりに、その再構成は、連続フレームのシーケンスからとられる複数の画像に基づく。それにもかかわらず、再構成は、マクロ・ブロック・レベルで実行されることができる。つまり、複数の画像が連続フレームからの複数のマクロ・ブロックに対応してもよい。さらに、超解像補間は、一般に映像エンコーダの一部である動き検出/補償部によって算出される動きベクトル・データを用いてもよい。望ましくは、符号化部1051または符号化部1052によって検出された運動ベクトルMVは、超解像補間のために使われてもよい。あるいは、より正確な動きベクトルが、超解像補間部1060によって推定されてもよい。
加算器1054は、高解像度入力画像1002から再構成された信号を減ずることにより、圧縮低解像度の映像信号から再構成されることができなかった画像情報を含んだ差信号を生成する。差信号は、差信号を符号化してビットストリーム2(1096)とするために、第一の符号化部1051と類似した種類の第二の符号化部1052に送られる。
このようにして、高解像度入力画像1002は、2つの圧縮映像信号、つまり、減少された解像度の映像情報を含んだビットストリーム1と、オリジナルの映像信号と、超解像補間及び逆減衰による低解像度信号から再構成された映像信号との間での差分を含んだビットストリーム2とに符号化される。ストリーム1は、限られた表示および/または計算能力をもつ移動通信装置等で利用する際に独立して復号できるという意味において、自己完結型のストリームである。その目的のために、折り返しノイズの量を減らすエイリアシング制御フィルタ1010によって、画質は最適化され得る。
ビットストリーム1、ビットストリーム2は、一つのビットストリームに多重化され、映像信号1002と一致する階層的に符号化された圧縮映像信号となる。多重化されたビットストリームは、表示能力やデコーダにかかわりなく、伝送され、記録されてもよい。多重化されたビットストリームは、このように、最大の解像度で入力信号を示している。しかしながら、超解像補間と逆減衰処理により、高解像度の冗長性は、除去され、画質に対して逆に影響を与えることなく、高圧縮比を可能にしている。
エイリアシング制御フィルタ1010は、一方で、映像データの低解像度バージョンに対する画質の最適化を可能とし、他方で、最大の解像度の映像データに対する全体的な符号化効率の最適化を可能にしている。ダウンサンプリング部1021のナイキスト周波数を越える映像周波数の減衰を強くすればするほど、折り返しノイズが抑制され、低解像度バージョンの画質は、よりよくなる。しかしながら、非常に小さい量のエイリアシング要素は、超解像補間を弱め、低解像度バージョンからの高解像度映像データの予測を悪化させる。これによって、加算器1054における大きな差信号となり、ビットストリーム2の符号量が増加する。
図16は、本発明の動画復号化装置の構成を示すブロック図である。上記の動画符号化装置から出力されたビットストリーム1、2(1095、1096)は、それぞれ、復号化部1056と1057に送られる。復号化部1056の低解像度出力画像1098は、符号化された映像信号1002の低解像度バージョンと一致する。復号化部1056の出力は、また、低解像度バージョンから高解像度の映像信号を再構成するために、逆減衰フィルタ1070が続く超解像補間部1060に送られる。望ましくは、ビットストリーム1を復号化するために必要な動きベクトル情報(MV)が、超解像補間部1060にも送られてもよい。あるいは、より正確な運動ベクトルが、超解像補間部1060によって推定されてもよい。図5とともに説明したように、この動きベクトルは高解像度のグリッドに低解像度の画像を登録するために利用してもよい。復号化部1057の出力は、上記の差信号を表し、加算器1055によって再構成された高解像度の映像信号に加算される。これによって、符号化された映像信号1002と一致する伸長された高解像度出力画像1099が生成される。
復号化装置の表示及び計算能力に依存して、復号化部1056のみを実装して、低解像度画像のみを復号してもよい。これによって、回路規模の縮小化とともに、装置の製造と動作における低コスト化が実現される。
一方、全く同様に多重化されたビットストリームが、最大の解像度の映像信号を再生するために、高画質復号化装置によっては、復号化されてもよい。超解像と逆減衰処理によって、映像データにおける冗長性は、大幅に減少し、符号化効率が改善される。高品質の復号化装置は、このように従来の映像符号化手法で動作する復号化装置よりも少ない符号化データの量を受信して処理することで、映像信号を再生できる。
上述したように、エイリアシング制御フィルタ1010の最適フィルタ特性は、画像コンテンツに依存してもよい。すなわち、ナイキスト周波数以上の十分な周波数成分が超解像補間として利用されながらも、ダウンサンプルされた映像画像における可視の折り返しノイズが抑制されることを達成するために、エイリアシング制御フィルタ1010のフィルタ特性を映像信号1002の画像コンテンツに適応させるとよい。その結果、逆減衰フィルタ1070のフィルタ特性も、同様にして適応されるのがよい。好適な実施形態では、ビデオ画像は、その後、リアルタイムでエイリアシング制御フィルタ1010と逆減衰フィルタ1070のフィルタ特性をセットするために、画像アナライザ(不図示)によって分析される。
エイリアシング制御フィルタ1010の最適な減衰係数は、たとえば、入力映像に含まれる内容の量に依存してもよい。特に、ナイキスト周波数の近くの映像周波数における内容は、折り返しノイズに敏感である。エイリアシング制御フィルタ1010の減衰係数は、このようにナイキスト周波数の近くに周波数範囲における入力映像信号のスペクトルパワーに従って制御されてもよい。
図15と図16に示される動画符号化装置と動画復号化装置のセットにおいて、動画符号化装置における逆減衰フィルタ1070で用いられているフィルタ特性は、デコーダに通知するようにしてもよい。動画復号化装置における逆減衰フィルタ1070のフィルタ特性は、高解像度出力画像1099を再生するように、適応させることができる。
フィルタ特性の通知は、ビットストリーム1096に通知情報を挿入することによって実現される。通知情報は、フィルタについての全ての定義からなる、例えば、有限インパルス応答フィルタのようなフィルタ係数のフォームで、あるいは、減衰係数としきい値周波数のような特定のパラメータからなる。
本発明の動画符号化装置は、折り返しノイズを除去するよりはむしろ制御するエイリアシング制御フィルタ1010を備えることで、超解像補間技術による超解像画像の改善された画質を達成する。本発明の好ましい実施形態は、改善され符号化効率をもつ階層的な映像データ圧縮と伸張に関する。映像データは、2つのビットストリームに符号化される。ビットストリーム1は、映像データの低解像度のバージョンの自己内蔵型表現である。ビットストリーム2は、最大の解像度の映像データとその超解像再構成との間の差分を含むだけである。
上記のように、本実施形態における画像符号化装置は、エイリアシング制御1010によって減衰した高解像度の映像信号の映像周波数を拡大するためのエイリアシング制御フィルタ101と逆の特性でフィルターをかける逆減衰フィルタ1070を含む。そして、減算器1054が差分を出力するために、オリジナル高解像度入力画像から逆減衰フィルタの出力を減じ、その差信号を出力する。それによって、高周波成分の再現性が高まり、より鋭い画像が得られる。このように、ビットストリーム2で符号化されなければならないデータ量は、改善された全体的なコード化効率にまで減少される。
エイリアシング制御フィルタ1010のフィルタ特性は、適応的に高解像度入力画像15のコンテンツに応じて切り替えてもよい。このように、超解像補間にとって、できるだけ多くの情報を残すことができ、折り返しノイズは低解像度のディジタルビデオ信号で抑制されることができる。
エイリアシング制御フィルタのフィルタ特性の情報は、動画復号化装置に通知することが望ましい。フィルタ特性の情報は、ビットストリーム2に挿入すればよい。フィルタ特性の情報は、フィルタ係数のリストでもよい。フィルタ特性の情報は、限界周波数と減衰係数を含んでいてもよい。逆減衰フィルタ1070の特性を取得することにより、動画復号化装置は高解像度のディジタルビデオ信号を復号化することができる。
動画復号化装置によって推定される動きベクトル情報は、高解像度の映像信号を再構成するために入力として超解像再構成手段に送られてもよい。連続画像間におけるサブピクセルの動き情報は、超解像補間のために必要である。その情報は、動き補償において事前に決定された動きベクトル情報から抽出される。このように、計算の効率は、改善される。
画像符号化装置は、ビットストリーム1とビットストリーム2とを多重化して入力映像信号を表示している出力ビットストリームにするビットストリーム・マルチプレクサを更に含むようにしてもよい。このように、符号化された映像データは、一つの通信路を通して簡単に伝送されることができるか、記憶媒体に記憶されることができる。
望ましくは、2つの符号化部うちの少なくとも1つは、伝送ベースの映像圧縮規格に従って、入力信号をビットストリームに符号化する。伝送ベースの映像エンコーダ(例えばMPEG−IIまたはH.264/AVCエンコーダ)は、先端技術であり、最適な性能とコード化効率を提供する。
また、本実施形態における動画復号化装置は、高解像度の参照映像信号を再構成するためにそのような逆減衰フィルタ1070を使っている画像符号化装置によって符号化された映像データを復号化する。このように、符号化対象の映像信号における冗長度を効率的に除去することで、高い符号化効率が達成される。
逆減衰フィルタのフィルタ特性は、エンコーダから通知されるフィルタ特性の情報に従って、セットすることが望ましい。フィルタ特性の情報は、ビットストリーム2から抽出してもよい。フィルタ特性の情報は、フィルタ係数のリストでもよい。フィルタ特性の情報は、限界周波数と減衰係数でもよい。動画復号化装置は、このように高解像度のディジタルビデオ信号の品質を最適化するためにその逆減衰を適応させることができる。
望ましくは、復号化部1056によって見つけられる動きベクトル情報(MV)は、高解像度の映像信号を再構成するために、入力として超解像補間部160に送られてもよい。連続画像間におけるサブピクセルの動き情報は、超解像補間のために必要とされる。その情報は、動き補償において決定される動きベクトル情報から抽出される。このように、計算の効率は、改善されることができる。
望ましくは、ビットストリーム・デマルチプレクサが備えられてもよい。ビットストリーム・デマルチプレクサは、入力ビットストリームから、ビットストリーム1、ビットストリームに分離するために使われる。このように、一つの伝送チャネルを通して伝送された、あるいは、記憶媒体に記憶された符号化された映像データは、簡単に復号化される。
望ましくは、2つの復号化部のうちの少なくとも1つは、伝送ベースの映像圧縮規格に従って、入力ビットストリームを復号化してもよい。 なお、上記各実施の形態等に示した各ブロック図は、典型的には集積回路装置であるLSIとして実現可能である。このLSIは1チップ化されても良いし、複数チップ化されても良い。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
なお、各ブロック図は、その中心的な部分をプロセッサおよびプログラムによっても実現可能である。
本発明は、画像処理装置、動画像符号化装置、動画像復号装置に適しており、特に、動画像記録再生装置、ビデオカメラ、テレビカメラなどに適している。
本発明は、複数の画像信号を用いて超解像度補間することにより、高解像度のデジタル画像信号を再構成する画像処理装置、画像処理方法、プログラムおよび半導体集積回路に関する。
近年、低解像度の画像を高解像の画像やシーケンスに変える方法が、コンピュータ科学者と画像処理専門家に、強い関心を引きつけている。これらの方法は、超解像、超解像補間または超解像再構成として一般的に呼ばれている。超解像における基本的な考えは、1枚の画像では欠けている画像の詳細を再構成するために、低解像度の複数の画像における画素のサブピクセル単位の動きを利用することである。
それらは、コストの高い高性能撮像素子を使用することなく画像の解像度を改善する効率的な方法を提供するので、超解像は、特に画像取得の局面で有用である。
図1Aは、従来の画像収集システムのブロック図である。
図1Aに示すように、サンプリング部120は、あらかじめ定められたサンプリング周波数で入力画像101をサンプリングする。処理/記録部150は、さらに画像処理あるいは記録媒体への記録をする。入力画像がサンプリング部120のナイキスト周波数より高い映像周波数を含む場合には、サンプリングされた画像でのエイリアシングつまり折り返しノイズが発生する。これは、図1Bで示すように、アンチエイリアシングフィルタ(折り返しノイズ防止フィルタ)110によって避けられる。アンチエイリアシングフィルタ110は、サンプリングの前に、ナイキスト周波数を越える映像周波数を除去するローパスフィルタである。それゆえに、図1Bに示される従来の画像取得再生装置は、折り返しノイズがない画像190を出力する。
図2A〜2C、図3A〜3Eを用いて従来のアンチエイリアシングフィルタ110の機能について説明する。簡潔さのために、説明は、1次元の信号に限定する。これらの図において左側に示されるグラフは、空間領域での信号を示す。横軸xは一次元の空間座標あるいは時間軸を示し、縦軸は輝度を示す。一方、右側のグラフは、周波数領域に(フーリエ)変換された信号を示す。横軸ωは周波数(ラジアン)を示し、縦軸は周波数の強度を示す。ωNはナイキスト周波数を示す。
図2Aは、広い周波数スペクトルFをもつ高速に変化する映像信号を示す。この信号のサンプリングは、図2Bで図式的に表示されるDirac櫛gによる乗算として表される。Dirac櫛のフーリエ変換もまた、Dirac櫛Gである。空間領域での2つのシグナルの乗算が周波数領域に変換された信号の畳み込みと一致するので、サンプル信号のスペクトルF*Gは、図2Cの右に示された形状をもつ。つまり、サンプル信号のスペクトルF*G(実線)は、周期的に変換及び複製された複数のスペクトル(破線)の合計である。
図2Cに示されるように、変換され複製されたスペクトル(破線)が重なっている。特定の周波数のサンプル信号のスペクトルパワーは、その特定の周波数へのいわゆるエイリアスである他の周波数からの影響によって、汚染される。空間領域では、エイリアシングは、モアレ・パターンや、滑らかな輪郭線部分に発生するジャギーのように、明瞭で目立つノイズになる。
エイリアシングを防ぐには、サンプリングで、スペクトルが重なるのを妨げる必要がある。これは、図3Bに示されるローパスフィルタhAAによって初期信号を帯域制限することで、達成される。アンチエイリアシングフィルタ110は、ローパスフィルタhAAの特性を持つ。
図3Aは、映像信号fを示し、図3Bは、空間領域における畳み込み、あるいは周波数領域の乗算により、その信号を帯域制限するローパスフィルタhAAを示している。図3Cは、映像信号f(破線)と比較した、ローパスフィルタリングの結果f*hAA(実線)を表す。
上記で説明したように、サンプリングは、空間領域において、Dirac櫛gをその信号に乗算したものに相当し、周波数領域において、Dirac櫛Gによる畳込みに相当する(図3D)。その信号のスペクトルが帯域制限されるので、変換され複製されたスペクトルF*HAAは、もはや重ならず(図3E)、それによってエイリアシングが生じない。
次に、超解像補間を備える従来の画像取得システムについて説明する。図4Aは、サンプリング部120、処理/記録部150、超解像補間部160を備える従来の画像収集システムの構成を示すブロック図である。入力画像101は、サンプリング部120に送られる。サンプリング部120は、あらかじめ定められたサンプリング周波数で入力画像101をサンプリングすることにより、デジタル化された画像を生成する。処理/記録部150は、デジタル化された画像を低解像度出力画像191として、オリジナルのサンプリング解像度で出力する。あるいは、低解像度出力画像は、超解像補間部160に出力される。超解像補間部160は、低解像度出力画像に対して超解像補間することによって、オリジナルのサンプリング解像度より優れた解像度の高解像度出力画像192を出力する。
図4Bは、図4Aで示されるシステムにアンチエイリアシングフィルタ110が付加された従来の画像収集システムの構成を示すブロック図である。図4Bのシステムは、図4Aと比べて、入力画像がサンプリングの前にアンチエイリアシングフィルタ110によってフィルタリングする点が異なっている。よって、折り返しノイズが除去されるので、低解像度出力画像191の画質は向上される。しかし、アンチエイリアシング・フィルタリングにより、超解像補間部160によって出力される高解像度出力画像192は、低解像度の画像よりも高精細な画像を全く含んでいない。
図5を参照して、超解像について説明する。従来の超解像再構成方法は、基本的に2つのステップから成る。第1のステップでは、動き推定と位置合わせが行なわれる。動き推定は、対象となる低解像度画像に対する参照画像の動きをサブピクセルで推定することである。位置合わせは、個々の参照画像において推定されたサブピクセル単位の動き(あるいは位置ずれ)を、対象となる低解像度画像に対応する高解像度のグリッド520に登録することである。
第2のステップでは、一様でない補間テクニックが用いられる。これは、再構成すべき高解像度画像530を生成するために高解像度のグリッド520の各々のポイントに補間された値を得ることである。これは、例えば特許文献1に開示されている。
特開2000−339450号公報
しかしながら、上記従来技術によれば、アンチエイリアシングフィルタ110を備えるシステム(図4B)は、エイリアシングを防止しかつ位置合わせを容易にする反面、超解像後の画像の精細さを低減させるという問題がある。逆に、アンチエイリアシングフィルタ110を備えないシステム(図4A)では、位置合わせを困難にする反面、超解像後の画像の精細さを増加させてもエイリアシングが発生するという問題がある。言い換えれば、アンチエイリアシングフィルタ110の存在により、エイリアシングの防止および位置合わせの容易化と、超解像の精細化とはトレードオフの関係にあるという問題がある。
以下この問題について図面を用いて説明する。
図6A〜6Cは、空間及び周波数領域における超解像補間の効果を示している。図6Aは、アンダーサンプルされたシグナルf・gとエイリアシングをもつ対応するスペクトルF*Gを示す。図6Bは、従来の補間法によって、アンダーサンプルされたシグナルの解像度を増大させた結果を示している。サンプリング定理により、アンダーサンプルされた信号は、ナイキスト周波数ωNよりも高い映像周波数に関する情報をもっていない。よって、アップサンプリングによって、スペクトルの繰り返し性が減少されるが、そのスペクトルは、ナイキスト周波数ωNとアリアス周波数(図6Bの右側の実線)の間においてゼロとなる。
しかしながら、超解像補間は、サンプリング部のナイキスト周波数ωNより高い映像周波数620を再構成するために、アップサンプルされた信号における折り返しノイズ610を利用することができる。図6Cで示すように、このように再構成された信号は、1つの山型の部分において、その高い解像度でオリジナル信号をサンプリングすることによって得られる信号に似ている。
上述したように、付加情報がサブピクセルのシフトによって複数の低解像度の画像から抜き出されるので、超解像補間はサンプリング定理と矛盾することはない。要するに、超解像補間は、周波数領域でエイリアシング要素をソートすることができて、低解像度画像自体からは明らかでない、ある解像度で画像の精細を再構成するために、ナイキスト周波数を越えるギャップを埋めることができる。よって、折り返しノイズは、超解像補間にとって重要である。
他方、折り返しノイズは、大幅に動き推定を妨げることがある。この問題の有名な例は、西部劇において反対方向で回転するように見える馬車のスポーク車輪である。この現象は時間領域でのエイリアシングによるものであるが、同じ問題は空間領域でのアンダーサンプルで起こる。したがって、動き推定を行うことができるように、アンチエイリアシング・フィルタリングを使用する必要もある。しかし、それは超解像補間のための条件付きである。
図7Aは、図1Bに示すアンチエイリアシングフィルタを使用したときの効果を示している。図7Aは、アンチエイリアシングフィルタをかけられ、サンプリングされた図3Eの信号を示している。この信号をアップサンプルすると、すなわち付加サンプリングポイントrを追加すると、図7Bの右側に示されるスペクトルになる。図6Bの前の例に似ているように、周波数領域でのその信号の繰り返し性は、ナイキスト周波数ωNとそのエイリアスを越えたギャップを残したまま、減少している。しかしながら、前の例とは対照的に、高映像周波数は、アンチエイリアシングフィルタによって除去され、エイリアシング成分を生成するために折り重ねされていない。それゆえに、これらの周波数に関する情報は消失し、もはや再構成されない。
デジタル画像収集システムは、通常、撮像素子における解像度の制約を受ける。サンプリングされた画像で識別することができるかできない内容に関する実際的な制約は別として、限られたサンプリング解像度は、また、目立つアーチファクト(例えばモアレ・パターン)をもたらすことがある。これらのアーチファクトは、忠実にこれらのパターンを再現するには十分に高いとはいえない解像度で、精細パターンを含んだオリジナル画像をサンプリングすることに起因している。これは、アンダーサンプルされたシグナルにおける、よく知られた、エイリアシングの一例である。したがって、従来のデジタル画像収集システムは、これらの目立つアーチファクトを防ぐために画像をサンプリングする前にアンチエイリアシングフィルタを用いている。アンチエイリアシングフィルタは、基本的に、どのようにでもサンプリングしても、精細なパターンを除去するので、オリジナル画像をぼやけさせ、これによって、モアレ・パターンの形成を防いでいる。しかし、この従来のアプローチで、アンチエイリアシングフィルタによって取られる内容は、永久に消失して、超解像テクニックによって再構成されることができない。
本発明は、エイリアシングの防止および位置合わせの容易化と、超解像の精細化とを共に達成する画像処理装置、画像処理方法、プログラムおよび半導体集積回路を提供することを目的とする。
上記課題を解決するため本発明の画像処理装置は、画像信号をフィルタリングするフィルタ手段と、フィルタリングされた画像信号を予め定められたサンプリング周波数でサンプリングすることにより、第1解像度の第1デジタル画像信号を生成するサンプリング手段と、サンプリング手段から得られる複数の第1デジタル画像信号を用いて超解像度補間することにより、当該第1解像度よりも高い第2解像度の第2デジタル画像信号を再構成する超解像手段とを備え、前記フィルタ手段は、前記サンプリング周波数の1/2倍のナイキスト周波数以下の周波数成分を通過させるとともに、ナイキスト周波数以上で前記第2解像度で表現可能な最高周波数以下の周波数成分の一部を通過させる。このように、サンプリング解像度のナイキスト周波数を超える映像周波数を制御可能に一部残することが、本発明の特徴的な手法である。これにより、エイリアシングの防止および位置合わせの容易化と、超解像の精細化とを共に達成することができる。
ここで、前記画像処理装置は、さらに、前記第2デジタル画像信号をフィルタリングするフィルタであって、前記フィルタ手段と逆のフィルタ特性を有する逆フィルタ手段を備えてもよい。
ここで、前記逆フィルタ手段は、前記ナイキスト周波数以下の周波数成分を減衰させ、ナイキスト周波数以上で前記第2解像度で表現可能な最高周波数以下の周波数成分の一部を通過させるようにしてもよい。
ここで、前記逆フィルタ手段は、前記ナイキスト周波数以下の周波数成分を通過させ、ナイキスト周波数以上の周波数成分を強調するようにしてもよい。
この構成によれば、逆フィルタ手段は、フィルタ手段によって減衰した第2解像度のデジタル画像の高周波成分を拡大することができる。つまり、よりシャープな第2解像度の画像信号が得られる。
好ましくは、エイリアシング制御フィルタのフィルタ特性は、適応的に入力画像のコンテンツに従ってセットされる。エイリアシング制御フィルタの最適な減衰係数は、画像コンテンツに依存する。つまり、ナイキスト周波数に近い映像周波数における詳細な内容の量に依存する。画像コンテンツにエイリアシング制御フィルタを用いることで、超解像補間のための多くの情報をできるだけ残しておくことで、低解像度のデジタル画像における可視折り返しノイズが抑制される。
ここで、前記フィルタ手段の特性は、前記ナイキスト周波数から前記最高周波数間までの範囲内で減衰勾配を有し、前記最高周波数の周波数成分は0に減衰されるようにしてもよい。
ここで、複数の第1解像度のデジタル画像信号は、映像シーケンスに対応することが望ましい。こうすれば、複数の低解像度の第1画像信号は、ビデオカメラによって簡単に記録されることができる。さらに、ビデオカメラによってとられる映像シーケンスは、相互のサブピクセル単位の移動を含む。これによって、超解像のための基礎的な準備がなされる。
ここで、超解像手段は、複数の高解像デジタル画像を再構成するようにしてもよい。その複数の高解像の第2デジタル画像は、映像シーケンスを高解像度に再構成したものに対応する。このように、低解像度の映像シーケンスを記録することができて、全く同じ内容の高解像度のバージョンを出力することができる。
また、本発明の画像処理方法、プログラム、半導体集積回路は、上記と同様の構成を有する。
本発明の画像処理装置によれば、エイリアシングの防止および位置合わせの容易化と、超解像の精細化とを共に達成することができる。また、超解像による高解像度の(第2解像度の)デジタル画像の高周波成分を拡大することによって、よりシャープな高解像度の画像信号が得られる。
本発明の実施の形態における画像処理装置は、画像信号をフィルタリングするフィルタ手段と、フィルタリングされた画像信号を予め定められたサンプリング周波数でサンプリングすることにより、第1解像度の第1デジタル画像信号を生成するサンプリング手段と、サンプリング手段から得られる複数の第1デジタル画像信号を用いて超解像度化することにより、当該第1解像度よりも高い第2解像度の第2デジタル画像信号を再構成する超解像手段とを備えている。
ここでフィルタ手段は、単純なアンチエイリアスフィルタとして機能するのではなく、アンチエイリアス制御フィルタとして機能する。アンチエイリアス制御フィルタとしてのフィルタ手段は、サンプリング周波数の1/2倍のナイキスト周波数以下の周波数成分を通過させるだけでなく、ナイキスト周波数以上で前記第2解像度で表現可能な最高周波数以下の周波数成分の一部をも通過させる。つまり、フィルタ手段は、ナイキスト周波数を越える周波数を完全に除去しないで、ナイキスト周波数以上で前記第2解像度で表現可能な最高周波数以下の周波数成分の一部を通過させる。ナイキスト周波数以上で前記最高周波数以下の周波数成分は、エイリアシングの原因となるが、超解像による高精細化には欠かせない成分でもある。ナイキスト周波数より上の映像周波数は、低解像度出力画像1091において目立つ折り返しノイズを減らすために除去ではなく減衰される。このようにサンプリングされて記録された画像は、サンプリング解像度より高い解像度で高解像出力画像を生成するための超解像補間部1060によって、高精細化することができる。加えて、エイリアシングの原因となる周波数成分が減衰されるので、超解像における動き推定の精度を劣化させずに、位置合わせを精度よくすることができる。
また、画像処理装置は、さらに、逆フィルタ特性を備える。この逆特性フィルタは、第2デジタル画像信号をフィルタリングするフィルタであって、前記フィルタ手段と逆のフィルタ特性を有する。これにより、逆フィルタ手段は、フィルタ手段によって減衰した第2解像度のデジタル画像の高周波成分を拡大または強調することができる。つまり、よりシャープな第2解像度の画像信号が得られる。
図8は、本発明の実施形態における画像処理装置の構成例を示すブロック図である。同図の画像処理装置は、エイリアシング制御フィルタ1010、サンプリング部1020、処理/記録部1050、超解像補間部1060、逆減衰フィルタ1070を備える。
入力画像1001は、サンプリングの前に、エイリアシング制御フィルタ1010に入力される。入力画像は、光学システムで生成されるアナログ画像であってもよいし、他の撮像装置等から伝送されているデジタル画像であってもよい。
エイリアシング制御フィルタ1010は、上記フィルタ手段に相当し、サンプリングされた画像の超解像補間を可能にするために、サンプリング部1020のナイキスト周波数を越える周波数を完全には除去していない。その代わりに、ナイキスト周波数より上の映像周波数は、低解像度出力画像1091において目立つ折り返しノイズを減らすために減衰される。
例えば、エイリアシング制御フィルタ1010は、イメージセンサの上流で用いられる光学(ぼかし)フィルタの形態で実装されてもよいし、そのサンプリング解像度よりも高い入力解像度のデジタルイメージ情報で動作するデジタルフィルタの形態で実装されてもよい。前者の場合、サンプリング部1020は、CCDのようなデジタル・イメージセンサであってもよい。後者の場合、サンプリング部1020は、エイリアシング制御フィルタ1010が、入力画像1001をフィルタリングしてダウンサンプルした画像を生成するという意味において、エイリアシング制御フィルタ1010と同一であってもよい。
サンプリング部1020は、フィルタリングされた画像信号を予め定められたサンプリング周波数でサンプリングすることにより、第1解像度(以下低解像度と呼ぶ)のデジタル画像信号を生成する。
処理/記録部1050は、サンプリング部1020からの低解像度のデジタル画像をそのまま低解像度出力画像1091として出力すると同時に、超解像補間部1060にも出力する。また、処理/記録部1050は、他の画像処理あるいは記録媒体への記録をしてもよい。
超解像補間部1060は、処理/記録部1050から得られる低解像度の複数のデジタル画像信号を用いて超解像度化することにより、第1解像度よりも高い第2解像度(以下高解像度と呼ぶ)のデジタル画像信号を再構成する。
逆減衰フィルタ1070は、上記逆フィルタ手段として機能し、超解像補間部1060からの高解像度画像を、フィルタリングする。
さらに、低解像度出力画像1091や再構成された高解像度出力画像1092は、さらに出力部によって出力されてもよい。出力部は、出力画像を表示する表示装置、出力画像を格納する格納装置、伝送路を介して出力画像を符号化して伝送する符号化伝送装置、あるいは、画像認識又は動き推定部のような画像処理手段等に接続されていてもよい。
低解像のみ、高解像のみ、あるいは、低解像及び高解像の出力画像が出力部を介して出力されるか否かは、下流装置の必要性や能力、例えば、表示解像度、記録容量、伝送帯域、計算能力等に依存している。
次に、上記画像処理装置の動作について、図面を用いて詳細に説明する。
図9A〜9Cを用いてエイリアシング制御フィルタ1010の機能について説明する。説明の便宜上、1次元の信号に限定する。これらの図において左側に示されるグラフは、空間領域での信号を示す。横軸xは一次元の空間座標あるいは時間軸を示し、縦軸は輝度を示す。一方、右側のグラフは、周波数領域に(フーリエ)変換された信号を示す。横軸ωは周波数(ラジアン)を示し、縦軸は周波数の強度を示す。ωNはナイキスト周波数を示す。
図9Aは入力信号fを示す。図9Bはエイリアシング制御フィルタ1010の特性hACを示す。図9Cはエイリアシング制御フィルタ1010で入力画像1001をフィルタリングしたときの結果f*hACを示している。
エイリアシング制御フィルタ1010は、サンプリング部1020におけるナイキスト周波数ωNを越える全ての周波数を除去しているわけではないことに注意されたい。その代わりに、高い画像周波数は、周波数依存減衰ファクタによって、ナイキスト周波数ではそのまま(減衰なし)で、超解像補間手段の解像度で表される最も高い画像周波数に対応する周波数でゼロ(除去)となるように、減衰される。その結果、空間領域でのこのフィルタのインパルス応答hACは、図3Bで示されるアンチエイリアシングフィルタのインパルス応答hAAよりも狭い。このようにエイリアシング制御フィルタ1010によってフィルタをかけられた入力信号は、ナイキスト周波数を越える映像周波数から成る(図9C参照)。
図13Aは、エイリアシング制御フィルタ1010によってフィルタをかけられた入力信号をサンプリングした結果を示している。この図13Aは図3Eと似ているが、ナイキスト周波数を越える映像周波数の一部を残す点で異なっている。ナイキスト周波数より高い映像周波数の存在により、フィルタをかけられた入力信号のスペクトルは、オーバーラップし、弱いエイリアシングが生じている(図13Aにおいてハッチングされた領域310、320)。しかしながら、エイリアシング制御フィルタ1010により、折り返しノイズの振幅は、減少している。それゆえに、このように得られた低解像度の画像は、図4Aに示される従来の画像収集システムによる低解像度の画像出力と比較して、改善された画質を示している。
さらに、折り返しノイズの抑制により、動き推定は、サブピクセル・レベルでより正確に推定される。それは超解像補間における位置合わせに必要である。残っている折り返しノイズは、サンプリング解像度によりも優れた解像度で画像の内容を抽出する超解像補間部1060によって利用されることができる。理想的には、周波数領域でのエイリアシングは、図13Bで実線として示される再構成された信号に至って、完全に解消される。
しかし、再構成された信号は、なお、エイリアシング制御フィルタ1010の特性により、高周波成分が減衰する(ハッチングされた領域330)。これは、エイリアシング制御フィルタ1010の効果を補正するための、映像周波数を増幅する逆減衰フィルタ1070によって、是正される。その結果、オリジナルの入力信号は、高精細に再構成される(図13C参照)。
この説明では、逆減衰フィルタ1070は、補間が意味する超解像補間部1060の出力を受け取る別々の装置であるとして、説明されている。しかし、本発明は、この点に制限されるものではない。逆に、逆減衰フィルタは、超解像補間部1060の一部であってもよい。特に、オリジナルの入力信号から、観測された低解像度画像を生成する観測モデルの一部であってもよい。
図9Bで示されるエイリアシング制御フィルタ1010の特性は、例示に過ぎず、本発明を制限するものではない。図11A〜図11Cに示すように、複数種類のフィルタ特性を切り替え可能なエイリアシング制御フィルタ1010が、本発明の目的を達成するのに用いてもよい。望ましくは、そのフィルタは、ナイキスト周波数まで一定のゲインを持ち、その周波数を超えると一定の減衰率を持つのがよい。ナイキスト周波数を越えた周波数における最適な減衰率は、画像コンテンツに依存して、図11A〜図11Cのフィルタ特性を適応的に切り替えてもよい。望ましくは、減衰率は、折り返しノイズを回避するに十分な強度の高周波成分を残すことが好ましい。そうでなければ、減衰率は、できるだけ弱い方が好ましい。すなわち、減衰率は、超解像補間部1060による高精細化を実現するために、1以下の値でよい。
実験では、ナイキスト周波数を越えた周波数では、減衰率が望ましくは0.5から0.1であることがわかった。
エイリアシング制御フィルタ1010は、アナログ画像信号をサンプリングするフィルタでも、デジタル画像信号をダウンサンプリングするフィルタであってもよい。図10は、後者に対応するエイリアシング制御フィルタ1010の一構成例を示す図である。同図のエイリアシング制御フィルタ1010は、(2N+1)個の乗算器と1個の加算器とを備える。(2N+1)の乗算器は、連続する(2N+1)の画素(サンプル)P-N〜PNと、(2N+1)の重み係数(タップ係数)W-N〜WNとが入力される。フィルタ特性は重み係数の組み合わせにより定められる。加算器は(2N+1)個の乗算結果を加算し、P0に対応する新たな画素P’を出力する。新たな画素P’の集合は低解像度画像を構成する。
逆減衰フィルタ1070のフィルタ特性はエイリアシング制御フィルタ1010と逆の特性である。それゆえに、逆減衰フィルタ1070は、ナイキスト周波数までは単一ゲインをもち、その周波数を超えると特定の強調特性をもつ。望ましくは、ナイキスト周波数を超える周波数での利得は、エイリアシング制御フィルタ1010の減衰係数と一致する2から10である。
図12A〜図12Cは、図11A〜図11Cのフィルタ特性と逆の特性を持つ逆減衰フィルタ1070の特性を示す図である。逆減衰フィルタ1070は、エイリアシング制御フィルタ1010と連動して、これらのフィルタ特性を切り替え可能であり、前記ナイキスト周波数以下の周波数成分を通過させ(利得1)、ナイキスト周波数以上の周波数成分を強調する(利得2〜10)。このような逆減衰フィルタ1070は、図10と同様の回路により構成できる。エイリアシング制御フィルタ1010と逆のフィルタ特性は重み係数の組み合わせにより定められる。
なお、逆減衰フィルタ1070は、ナイキスト周波数以下の周波数成分を減衰させ(例えば一定の利得0.5)、ナイキスト周波数以上で前記第2解像度で表現可能な最高周波数以下の周波数成分の一部を通過させる(例えば利得1)ようにしてもよい。
技術的には、エイリアシング制御フィルタ1010と逆減衰フィルタ1070は、望ましくは、有限インパルス応答フィルタとして実装される。図14A、図14Bは、減衰率0.4(図14Aでの1101a)と0.2(図14Bでの1101b)の9タップの2つのエイリアシング制御フィルタ1010の例を示している。それぞれは、理想的な逆減衰フィルタ(1102a、1102b)と、それらの有限(9タップまたは11タップ)の実装(図14Aと図14Bの中の破線)に対応する。
上記の画像処理装置では、複数の低解像度画像中の1つの対象画像に注目して説明してきた。しかし、本発明は、1つの画像への適用に限られず、むしろ、画像のシーケンスに対する取得、処理及び再生に適用されてもよい。たとえば、映像アプリケーション、または、マルチビュー画像、つまり、異なる角度から同じシーンを同時に記録して得られる画像や映像等である。
次に、本発明を動画符号化装置に適用した好ましい実施例を、図15と図16を参照して説明する。
図15は、本発明の階層的な動画符号化装置の構成を示すブロック図である。高解像度入力画像1002は、エイリアシング制御フィルタ1010によってフィルタリングされ、次のダウンサンプリング部1021によって生じる折り返しノイズの量を制御する。ダウンサンプリング部1021は、フィルタリングされた入力映像信号をダウンサンプリングすることにより、低い解像度のデジタル映像信号を出力する。ダウンサンプルされた映像信号は、例えば、限られた表示能力しかない移動体装置での表示に適用することができる。符号化部1051は、ダウンサンプルされた映像信号を符号化し、圧縮さえたデジタル映像信号を、ビットストリーム1(1095)として出力する。符号化部1051は、MPEG−2またはH.264/MPEG4−AVC規格に従った規格の伝送ベースの映像エンコーダでよい。しかしながら、本発明は、特定のタイプのエンコーダに限定されない。むしろ、本発明は、映像信号を符号化してデジタル・ビットストリームにするエンコーダであればどんなタイプでも実現され得る。
このビットストリーム1は、参照映像信号を生成するために内部の符号化部1053に送られる。この参照映像信号は、圧縮低解像度のビットストリーム1から、高解像度の映像信号を再構成するために、超解像補間部1060に送られる。超解像補間部1060から生成される高解像映像信号は、逆減衰フィルタ1070によりフィルタリングされる。
再構成された信号の解像度は、望ましくは高解像度入力画像1002の解像度と一致する。
超解像補間技術を用いることで、超解像補間部1060におけるアップサンプリングは、フレーム単位で実行することができない。
その代わりに、その再構成は、連続フレームのシーケンスからとられる複数の画像に基づく。それにもかかわらず、再構成は、マクロ・ブロック・レベルで実行されることができる。つまり、複数の画像が連続フレームからの複数のマクロ・ブロックに対応してもよい。さらに、超解像補間は、一般に映像エンコーダの一部である動き検出/補償部によって算出される動きベクトル・データを用いてもよい。望ましくは、符号化部1051または符号化部1052によって検出された運動ベクトルMVは、超解像補間のために使われてもよい。あるいは、より正確な動きベクトルが、超解像補間部1060によって推定されてもよい。
加算器1054は、高解像度入力画像1002から再構成された信号を減ずることにより、圧縮低解像度の映像信号から再構成されることができなかった画像情報を含んだ差信号を生成する。差信号は、差信号を符号化してビットストリーム2(1096)とするために、第一の符号化部1051と類似した種類の第二の符号化部1052に送られる。
このようにして、高解像度入力画像1002は、2つの圧縮映像信号、つまり、減少された解像度の映像情報を含んだビットストリーム1と、オリジナルの映像信号と、超解像補間及び逆減衰による低解像度信号から再構成された映像信号との間での差分を含んだビットストリーム2とに符号化される。ビットストリーム1は、限られた表示および/または計算能力をもつ移動通信装置等で利用する際に独立して復号できるという意味において、自己完結型のストリームである。その目的のために、折り返しノイズの量を減らすエイリアシング制御フィルタ1010によって、画質は最適化され得る。
ビットストリーム1、ビットストリーム2は、一つのビットストリームに多重化され、高解像度入力画像1002と一致する階層的に符号化された圧縮映像信号となる。多重化されたビットストリームは、表示能力やデコーダにかかわりなく、伝送され、記録されてもよい。多重化されたビットストリームは、このように、最大の解像度で入力信号を示している。しかしながら、超解像補間と逆減衰処理により、高解像度の冗長性は、除去され、画質に対して逆に影響を与えることなく、高圧縮比を可能にしている。
エイリアシング制御フィルタ1010は、一方で、映像データの低解像度バージョンに対する画質の最適化を可能とし、他方で、最大の解像度の映像データに対する全体的な符号化効率の最適化を可能にしている。ダウンサンプリング部1021のナイキスト周波数を越える映像周波数の減衰を強くすればするほど、折り返しノイズが抑制され、低解像度バージョンの画質は、よりよくなる。しかしながら、非常に小さい量のエイリアシング要素は、超解像補間を弱め、低解像度バージョンからの高解像度映像データの予測を悪化させる。これによって、加算器1054における大きな差信号となり、ビットストリーム2の符号量が増加する。
図16は、本発明の動画復号化装置の構成を示すブロック図である。上記の動画符号化装置から出力されたビットストリーム1、2(1095、1096)は、それぞれ、復号化部1056と1057に送られる。復号化部1056の低解像度出力画像1098は、符号化された高解像度入力画像1002の低解像度バージョンと一致する。復号化部1056の出力は、また、低解像度バージョンから高解像度の映像信号を再構成するために、逆減衰フィルタ1070が続く超解像補間部1060に送られる。望ましくは、ビットストリーム1を復号化するために必要な動きベクトル情報(MV)が、超解像補間部1060にも送られてもよい。あるいは、より正確な運動ベクトルが、超解像補間部1060によって推定されてもよい。図5とともに説明したように、この動きベクトルは高解像度のグリッドに低解像度の画像を登録するために利用してもよい。復号化部1057の出力は、上記の差信号を表し、加算器1055によって再構成された高解像度の映像信号に加算される。これによって、符号化された高解像度入力画像1002と一致する伸長された高解像度出力画像1099が生成される。
復号化装置の表示及び計算能力に依存して、復号化部1056のみを実装して、低解像度画像のみを復号してもよい。これによって、回路規模の縮小化とともに、装置の製造と動作における低コスト化が実現される。
一方、全く同様に多重化されたビットストリームが、最大の解像度の映像信号を再生するために、高画質復号化装置によっては、復号化されてもよい。超解像と逆減衰処理によって、映像データにおける冗長性は、大幅に減少し、符号化効率が改善される。高品質の復号化装置は、このように従来の映像符号化手法で動作する復号化装置よりも少ない符号化データの量を受信して処理することで、映像信号を再生できる。
上述したように、エイリアシング制御フィルタ1010の最適フィルタ特性は、画像コンテンツに依存してもよい。すなわち、ナイキスト周波数以上の十分な周波数成分が超解像補間として利用されながらも、ダウンサンプルされた映像画像における可視の折り返しノイズが抑制されることを達成するために、エイリアシング制御フィルタ1010のフィルタ特性を高解像度入力画像1002の画像コンテンツに適応させるとよい。その結果、逆減衰フィルタ1070のフィルタ特性も、同様にして適応されるのがよい。好適な実施形態では、ビデオ画像は、その後、リアルタイムでエイリアシング制御フィルタ1010と逆減衰フィルタ1070のフィルタ特性をセットするために、画像アナライザ(不図示)によって分析される。
エイリアシング制御フィルタ1010の最適な減衰係数は、たとえば、入力映像に含まれる内容の量に依存してもよい。特に、ナイキスト周波数の近くの映像周波数における内容は、折り返しノイズに敏感である。エイリアシング制御フィルタ1010の減衰係数は、このようにナイキスト周波数の近くに周波数範囲における入力映像信号のスペクトルパワーに従って制御されてもよい。
図15と図16に示される動画符号化装置と動画復号化装置のセットにおいて、動画符号化装置における逆減衰フィルタ1070で用いられているフィルタ特性は、デコーダに通知するようにしてもよい。動画復号化装置における逆減衰フィルタ1070のフィルタ特性は、高解像度出力画像1099を再生するように、適応させることができる。
フィルタ特性の通知は、ビットストリーム1096に通知情報を挿入することによって実現される。通知情報は、フィルタについての全ての定義からなる、例えば、有限インパルス応答フィルタのようなフィルタ係数のフォームで、あるいは、減衰係数としきい値周波数のような特定のパラメータからなる。
本発明の動画符号化装置は、折り返しノイズを除去するよりはむしろ制御するエイリアシング制御フィルタ1010を備えることで、超解像補間技術による超解像画像の改善された画質を達成する。本発明の好ましい実施形態は、改善され符号化効率をもつ階層的な映像データ圧縮と伸長に関する。映像データは、2つのビットストリームに符号化される。ビットストリーム1は、映像データの低解像度のバージョンの自己内蔵型表現である。ビットストリーム2は、最大の解像度の映像データとその超解像再構成との間の差分を含むだけである。
上記のように、本実施形態における画像符号化装置は、エイリアシング制御フィルタ1010によって減衰した高解像度の映像信号の映像周波数を拡大するためのエイリアシング制御フィルタ1010と逆の特性でフィルタをかける逆減衰フィルタ1070を含む。そして、加算器1054が差分を出力するために、オリジナル高解像度入力画像から逆減衰フィルタの出力を減じ、その差信号を出力する。それによって、高周波成分の再現性が高まり、より鋭い画像が得られる。このように、ビットストリーム2で符号化されなければならないデータ量は、改善された全体的なコード化効率にまで減少される。
エイリアシング制御フィルタ1010のフィルタ特性は、適応的に高解像度入力画像15のコンテンツに応じて切り替えてもよい。このように、超解像補間にとって、できるだけ多くの情報を残すことができ、折り返しノイズは低解像度のディジタルビデオ信号で抑制されることができる。
エイリアシング制御フィルタのフィルタ特性の情報は、動画復号化装置に通知することが望ましい。フィルタ特性の情報は、ビットストリーム2に挿入すればよい。フィルタ特性の情報は、フィルタ係数のリストでもよい。フィルタ特性の情報は、限界周波数と減衰係数を含んでいてもよい。逆減衰フィルタ1070の特性を取得することにより、動画復号化装置は高解像度のディジタルビデオ信号を復号化することができる。
動画復号化装置によって推定される動きベクトル情報は、高解像度の映像信号を再構成するために入力として超解像再構成手段に送られてもよい。連続画像間におけるサブピクセルの動き情報は、超解像補間のために必要である。その情報は、動き補償において事前に決定された動きベクトル情報から抽出される。このように、計算の効率は、改善される。
画像符号化装置は、ビットストリーム1とビットストリーム2とを多重化して入力映像信号を表示している出力ビットストリームにするビットストリーム・マルチプレクサを更に含むようにしてもよい。このように、符号化された映像データは、一つの通信路を通して簡単に伝送されることができるか、記憶媒体に記憶されることができる。
望ましくは、2つの符号化部うちの少なくとも1つは、伝送ベースの映像圧縮規格に従って、入力信号をビットストリームに符号化する。伝送ベースの映像エンコーダ(例えばMPEG−IIまたはH.264/AVCエンコーダ)は、先端技術であり、最適な性能とコード化効率を提供する。
また、本実施形態における動画復号化装置は、高解像度の参照映像信号を再構成するためにそのような逆減衰フィルタ1070を使っている画像符号化装置によって符号化された映像データを復号化する。このように、符号化対象の映像信号における冗長度を効率的に除去することで、高い符号化効率が達成される。
逆減衰フィルタのフィルタ特性は、エンコーダから通知されるフィルタ特性の情報に従って、セットすることが望ましい。フィルタ特性の情報は、ビットストリーム2から抽出してもよい。フィルタ特性の情報は、フィルタ係数のリストでもよい。フィルタ特性の情報は、限界周波数と減衰係数でもよい。動画復号化装置は、このように高解像度のディジタルビデオ信号の品質を最適化するためにその逆減衰を適応させることができる。
望ましくは、復号化部1056によって見つけられる動きベクトル情報(MV)は、高解像度の映像信号を再構成するために、入力として超解像補間部160に送られてもよい。連続画像間におけるサブピクセルの動き情報は、超解像補間のために必要とされる。その情報は、動き補償において決定される動きベクトル情報から抽出される。このように、計算の効率は、改善されることができる。
望ましくは、ビットストリーム・デマルチプレクサが備えられてもよい。ビットストリーム・デマルチプレクサは、入力ビットストリームから、ビットストリーム1、ビットストリーム2に分離するために使われる。このように、一つの伝送チャネルを通して伝送された、あるいは、記憶媒体に記憶された符号化された映像データは、簡単に復号化される。
望ましくは、2つの復号化部のうちの少なくとも1つは、伝送ベースの映像圧縮規格に従って、入力ビットストリームを復号化してもよい。なお、上記各実施の形態等に示した各ブロック図は、典型的には集積回路装置であるLSIとして実現可能である。このLSIは1チップ化されても良いし、複数チップ化されても良い。ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
なお、各ブロック図は、その中心的な部分をプロセッサおよびプログラムによっても実現可能である。
本発明は、画像処理装置、動画像符号化装置、動画像復号装置に適しており、特に、動画像記録再生装置、ビデオカメラ、テレビカメラなどに適している。
図1Aは、従来の画像収集システムの構成を示すブロック図である。
図1Bは、アンチエイリアシング・フィルタリングによる従来の画像収集システムの構成を示すブロック図である。
図2Aは、空間及び周波数領域での入力信号の図である。
図2Bは、空間及び周波数領域で、サンプリングステップで使われる、Dirac櫛の図である。
図2Cは、空間及び周波数領域でサンプリングされた入力信号の図である。
図3Aは、空間及び周波数領域での入力信号の図である。
図3Bは、空間及び周波数領域でのローパスフィルタの図である。
図3Cは、空間及び周波数領域でのローパスフィルタがかけられた入力信号の図である。
図3Dは、空間及び周波数領域でのサンプリングステップで使われる、Dirac櫛の図である。
図3Eは、空間及び周波数領域でのローパスフィルタがかけられた入力信号の図である。
図4Aは、超解像補間による従来の画像収集システムの構成を示すブロック図である。
図4Bは、超解像補間とアンチエイリアシング・フィルタリングによる従来の画像収集システムの構成を示すブロック図である。
図5は、画像記憶と超解像再構成での補間を示す図である。
図6Aは、空間及び周波数領域でのサンプリングされた入力信号の図である。
図6Bは、空間及び周波数領域での解像度が強化された信号の図である。
図6Cは、空間及び周波数領域での超解像補間を用いて解像度が強化された信号の図である。
図7Aは、空間及び周波数領域での、アンチエイリアシングフィルタをかけられてサンプリングされた入力信号の図である。
図7Bは、空間及び周波数領域での、アンチエイリアシングフィルタをかけられてサンプリングされた入力信号に適用される超解像補間の図である。
図8は、本発明の実施形態の画像処理装置の構成を示すブロック図である。
図9Aは、空間及び周波数領域での入力信号の図である。
図9Bは、本発明の実施形態における、空間及び周波数領域でのローパスフィルタの図である。
図9Cは、本発明の実施形態における、空間及び周波数領域でのローパスフィルタがかけられた入力信号の図である。
図10は、逆減衰フィルタの構成例を示す図である。
図11Aは、エイリアシング制御フィルタのフィルタ特性例を示す図である。
図11Bは、エイリアシング制御フィルタのフィルタ特性例を示す図である。
図11Cは、エイリアシング制御フィルタのフィルタ特性例を示す図である。
図12Aは、逆減衰フィルタのフィルタ特性例を示す図である。
図12Bは、逆減衰フィルタのフィルタ特性例を示す図である。
図12Cは、逆減衰フィルタのフィルタ特性例を示す図である。
図13Aは、本発明の実施形態における、空間及び周波数領域でのローパスフィルタがかけられサンプリングされた入力信号の図である。
図13Bは、本発明の実施形態における、空間及び周波数領域での超解像補間の図である。
図13Cは、本発明の実施形態における、空間及び周波数領域での、逆減衰フィルタがかけられ超解像補間がされた入力信号の図である。
図14Aは、本発明の実施形態における、エイリアシング制御と減衰係数0.4の逆減衰フィルタのフィルタ特性を示す図である。
図14Bは、本発明の実施形態における、エイリアシング制御と減衰係数0.2の逆減衰フィルタのフィルタ特性を示す図である。
図15は、本発明の実施形態における、階層的な映像エンコーダの構成を示すブロック図である。
図16は、本発明の実施形態における、階層的な映像デコーダの構成を示すブロック図である。
符号の説明
101 入力画像
110 アンチエイリアシングフィルタ
120 サンプリング部
150 処理/記録部
160 超解像補間部
190、191 低解像度出力画像
192 高解像度出力画像
520 グリッド
530 高解像度画像
610 ノイズ
620 映像周波数
1001 入力画像
1002 高解像度入力画像
1010 エイリアシング制御フィルタ
1020 サンプリング部
1021 ダウンサンプリング部
1051、1052、1053 符号化部
1054、1055 加算器
1056、1057 復号化部
1060 超解像補間部
1070 逆減衰フィルタ
1091、1098 低解像度出力画像
1092、1099 高解像度出力画像
1095、1096 ビットストリーム