JP2012118923A - 領域分割装置及び領域分割方法 - Google Patents
領域分割装置及び領域分割方法 Download PDFInfo
- Publication number
- JP2012118923A JP2012118923A JP2010270464A JP2010270464A JP2012118923A JP 2012118923 A JP2012118923 A JP 2012118923A JP 2010270464 A JP2010270464 A JP 2010270464A JP 2010270464 A JP2010270464 A JP 2010270464A JP 2012118923 A JP2012118923 A JP 2012118923A
- Authority
- JP
- Japan
- Prior art keywords
- image
- region
- corresponding point
- area division
- boundary candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
【課題】動画像の領域分割を適切に行うこと。
【解決手段】領域分割装置は、動画像の隣接フレーム間の画素ごとの対応を推定する対応点推定手段11と、原画像から複数の解像度の画像を生成し、ノイズを付加し、類似の画素を結合し、当該画像を合成して境界候補画像を生成する境界候補画像生成手段12と、対応点の確からしさを表す信頼度関数を対応点に関するコスト関数を用いて求め、信頼度関数により算出する画素の信頼度に応じて領域分割する領域分割手段13と、境界候補画像と領域分割処理結果との差分に応じて信頼度関数を補正する対応点情報補正手段15と、前回の領域分割と、信頼度関数が補正された今回の領域分割との一致度に基づいて領域分割の適否を判定し、領域分割が適当でなければ対応点情報補正手段15と領域分割手段13による処理を繰り返し実行させ、領域分割が適当であれば領域分割処理を終了させる繰り返し条件規定手段14と、を備える。
【選択図】図4
【解決手段】領域分割装置は、動画像の隣接フレーム間の画素ごとの対応を推定する対応点推定手段11と、原画像から複数の解像度の画像を生成し、ノイズを付加し、類似の画素を結合し、当該画像を合成して境界候補画像を生成する境界候補画像生成手段12と、対応点の確からしさを表す信頼度関数を対応点に関するコスト関数を用いて求め、信頼度関数により算出する画素の信頼度に応じて領域分割する領域分割手段13と、境界候補画像と領域分割処理結果との差分に応じて信頼度関数を補正する対応点情報補正手段15と、前回の領域分割と、信頼度関数が補正された今回の領域分割との一致度に基づいて領域分割の適否を判定し、領域分割が適当でなければ対応点情報補正手段15と領域分割手段13による処理を繰り返し実行させ、領域分割が適当であれば領域分割処理を終了させる繰り返し条件規定手段14と、を備える。
【選択図】図4
Description
本発明は、領域分割装置及び領域分割方法に関する。
従来、多くの画像処理のためのアルゴリズムが研究されている。特に、物体認識やシーン理解などの分野において、スーパーピクセルと呼ばれる小領域を用いることで認識精度や処理時間の向上につながることが報告されている。スーパーピクセルとは、輝度や色等の性質が比較的似ているピクセルを複数まとめた小領域を指す。一般に、一枚の画像から得られるスーパーピクセルの数は、ピクセルの数と比較して、非常に少なくなる。このためアルゴリズムの処理単位をピクセルからスーパーピクセルに変更することで、処理時間を低減させることが可能となる。
具体的な手法として、例えば、静止画から画像の色の連続性などを利用して領域を分割する手法が提案されている。
具体的な手法として、例えば、静止画から画像の色の連続性などを利用して領域を分割する手法が提案されている。
また、動画に対して領域分割を実施する情報処理装置が開示されている(例えば特許文献1)。これによると、あらかじめ取得した動画像について対象を検出する場合に、例えば背景が複雑である場合や、対象が突然出現する場合、対象が突然消滅する場合、対象の一部が隠れる場合などであっても、対象を検出することが可能である。
また、パターン分析に基づく動きベクトルの補正装置が開示されている(例えば特許文献2)。これによると、動きベクトルの推定エラーによって補間映像で発生するブロックアーティファクトのような画質低下現象を、効果的に改善できる。
また、スーパーピクセルを算出するための手法が研究されている。例えば、非特許文献1に記載されているGraph-based手法や、非特許文献2に記載されているMeanShift手法や、非特許文献3に記載されているNormalized Cut手法がある。また特許文献3には、時間方向に安定したスーパーピクセルの算出方法が記載されている。
D.Felzenszwalb, and D.Huttenlocher, "Efficient graph-based image segmentation" International Journal of Computer Vision, vol.59, no.2, pp.167-181, Sep.2004
D,Comaniciu, and P.Meer, "Mean shift; a robust approach toward feature space analysis" IEEE Trans. Pattern Analysis and Machine Intelligence, vol.24, no.5, May.2002
J.Shi, and J. Malik, "Normalized cuts and image segmentation" IEEE Trans. Pattern Analysis and Machine Intelligence, vol.22, no.8, pp.888-905, Aug.2000
しかしながら従来手法では、カメラが移動している状況下で撮影した動画像からスーパーピクセルを直接算出する場合には、円形等の限られた形状の物体の追跡にしか用いることができないことや、スーパーピクセルの形状が安定せず、物体認識に悪影響を及ぼすことがあった。また、カメラの移動に依存せずに領域を安定して得ようとする場合には、処理対象となる動画像の全フレームを時間と空間からなる3次元空間とみなして処理を行う必要があり、あらかじめ取得した動画像に対してバッチ処理を行うという手順になることから、逐次処理が不可能であった。
Graph-based手法([Felzenszwalb & Huttenlocher 2004])では、領域内の相違性と領域間の相違性を比較することによって領域分割を行うため、画素値が大きく変化するようなサイズの小さい領域を無視して領域分割を行う性質を持つ。ただし、ノイズなどに弱く、動きの小さい連続する2フレームであっても、処理結果が大きく異なるという問題がある。
MeanShift手法([Comaniciu & Meer 2002])では、色及び画像中の位置を特徴量としてMean Shiftを行うことで、輝度変化の少ない領域をまとめるよう、領域を分割する性質がある。一方で、輝度変化が大きい場合、多数の小領域が発生し安定しないという問題がある。
Normalized Cut手法([Shi & Malik 2000])では、ピクセル間の類似度を表す親和度行列を生成し、その固有値問題を解くことによってスーパーピクセルの算出を行なう。このとき生成されるスーパーピクセルの形状は矩形に近く、領域のサイズが比較的均一になる。一方で、大規模な行列の固有値問題を計算するため、非常に多くの計算量が必要であり、動画像のような多数の画像を処理する際には問題となる。
特許文献3の方法では、隣接フレーム間の差分と過去フレームの領域間境界の累積を利用して、時間方向の安定化を図っている。しかしながら、背景が固定されている必要があり、カメラが移動する場合には安定しないという問題があった。
MeanShift手法([Comaniciu & Meer 2002])では、色及び画像中の位置を特徴量としてMean Shiftを行うことで、輝度変化の少ない領域をまとめるよう、領域を分割する性質がある。一方で、輝度変化が大きい場合、多数の小領域が発生し安定しないという問題がある。
Normalized Cut手法([Shi & Malik 2000])では、ピクセル間の類似度を表す親和度行列を生成し、その固有値問題を解くことによってスーパーピクセルの算出を行なう。このとき生成されるスーパーピクセルの形状は矩形に近く、領域のサイズが比較的均一になる。一方で、大規模な行列の固有値問題を計算するため、非常に多くの計算量が必要であり、動画像のような多数の画像を処理する際には問題となる。
特許文献3の方法では、隣接フレーム間の差分と過去フレームの領域間境界の累積を利用して、時間方向の安定化を図っている。しかしながら、背景が固定されている必要があり、カメラが移動する場合には安定しないという問題があった。
本発明はこのような問題点を解決するためになされたものであり、画像全体の変化を捉えるという性質を保ちながら、背景や物体の移動に依存せず、時間方向の安定性を有する領域分割を行う、領域分割装置及び領域分割方法を提供することを目的とする。
本発明にかかる領域分割装置は、動画像の隣接フレーム間のピクセルごとの対応点を推定する対応点推定手段と、前記動画像の原画像から複数の解像度の画像を生成し、当該複数の解像度の各解像度の画像に対してノイズを付加し、隣接する画素間の相違性をもとに類似の画素を結合し、当該複数の解像度の画像に対する前記結合結果を合成することで、領域の境界候補を示す境界候補画像を生成する境界候補画像生成手段と、前記対応点の確からしさを表す信頼度関数を、前記対応点に関するコスト関数を用いて求め、当該信頼度関数により算出する前記ピクセルの信頼度に応じて領域の分割を行う領域分割手段と、前記境界候補画像生成手段で生成された前記境界候補画像と、前記領域分割手段による領域分割処理結果との差分を求め、当該差分に応じて、前記信頼度関数を補正する対応点情報補正手段と、前回の前記領域分割手段による領域分割と、前記対応点情報補正手段により前記信頼度関数が補正された後の今回の前記領域分割手段による領域分割との一致度に基づいて、領域分割の適否を判定し、前記領域分割手段による領域分割が適当でないと判定した場合には、前記対応点情報補正手段による処理と前記領域分割手段による処理を繰り返し実行させ、前記領域分割手段による領域分割が適当であると判定した場合には領域分割処理を終了させる繰り返し条件規定手段と、を備える。
これによるとgraph-based手法をもとに、その特徴である局所的な輝度変化に依存せず、画像全体の変化を捉えるという性質を保ちながら、時間方向の安定性も有する手法を提供することができる。より具体的にはgraph-based手法に対し、以下の2つの補正を行うことで安定性を実現する。1つ目は前フレームとの対応情報を用いた領域内相違性の補正、2つ目は境界候補の検出による対応情報に関する信頼度の補正である。
これによるとgraph-based手法をもとに、その特徴である局所的な輝度変化に依存せず、画像全体の変化を捉えるという性質を保ちながら、時間方向の安定性も有する手法を提供することができる。より具体的にはgraph-based手法に対し、以下の2つの補正を行うことで安定性を実現する。1つ目は前フレームとの対応情報を用いた領域内相違性の補正、2つ目は境界候補の検出による対応情報に関する信頼度の補正である。
これによると、現フレームと前フレームの各画素がどのように対応しているかを推定し、その対応関係と信頼度を用いて前フレームの処理結果を現フレームに反映させることで、移動体を含む動画像やカメラが移動する動画像に対しても、前フレームの結果を利用して、時間方向に安定したスーパーピクセルを得ることが可能となる。また、フレーム単位で処理を行なうアプローチをとっており、オンライン処理(逐次処理)が可能となる。
したがって、動画像の領域分割を適切に行うことができる。
したがって、動画像の領域分割を適切に行うことができる。
実施の形態1.
以下、図面を参照して本発明の実施の形態について説明する。図1は、領域分割装置100のブロック図である。
領域分割装置100は、対応点推定手段11と、境界候補画像生成手段12と、領域分割手段13と、繰り返し条件規定手段14と、対応点情報補正手段15と、を備える。領域分割装置100は、例えば、マイクロコンピュータ(CPU)を有する演算回路と、プログラムメモリやデータメモリその他のRAMやROM等を有する記憶装置等と、を備えるコンピュータである。
以下、図面を参照して本発明の実施の形態について説明する。図1は、領域分割装置100のブロック図である。
領域分割装置100は、対応点推定手段11と、境界候補画像生成手段12と、領域分割手段13と、繰り返し条件規定手段14と、対応点情報補正手段15と、を備える。領域分割装置100は、例えば、マイクロコンピュータ(CPU)を有する演算回路と、プログラムメモリやデータメモリその他のRAMやROM等を有する記憶装置等と、を備えるコンピュータである。
対応点推定手段11は、隣接フレーム間において対応しているピクセル(画素)の対応関係を推定する。例えば、現フレームの特定の画素と対応する、直前フレームの対応画素を推定する。ここで、対応点推定手段11が推定した対応関係の情報を、対応点情報とする。また、対応点推定手段11による対応点推定は、コスト関数を用いるブロックマッチング法などにより行う。
なお、対応点推定の手法は、全ピクセルの対応をとることができる手法であれば、ブロックマッチング法に限られない。但し、その場合にはコスト関数を別途計算する必要がある。
なお、対応点推定の手法は、全ピクセルの対応をとることができる手法であれば、ブロックマッチング法に限られない。但し、その場合にはコスト関数を別途計算する必要がある。
境界候補画像生成手段12は、対応点情報の補正に用いる境界候補画像を生成する。図2に、境界候補画像生成例を示す。また図3に境界候補画像の生成手順を示す。
境界候補画像生成手段12は、図2のように原画像から複数の解像度の画像を生成する。例えばオリジナルの解像度のほか、4分の1スケール、16分の1スケール、64分の1のスケールの画像を用意する。図3のように境界候補画像生成手段12は、各解像度の画像に対してランダムノイズを付加して、それぞれの画像に、提案手法のベースとしている手法である[Felzenszwalb & Huttenlocher 2004]を適用する処理を行う。その後、境界候補画像生成手段12は、処理結果の画像を合成することで、境界候補画像を生成する。境界候補画像の生成については、後に詳述する。
なお、原画像から生成する複数の解像度の画像は上記に限られない。例えば、さらに128分の1スケールの画像を用いることとしても良い。また例えば、処理対象の画像が小さい場合に64分の1スケールの画像を用いず、オリジナルの解像度の画像と、4分の1スケールの画像と、16分の1スケールの画像のみを用いることとしても良い。
境界候補画像生成手段12は、図2のように原画像から複数の解像度の画像を生成する。例えばオリジナルの解像度のほか、4分の1スケール、16分の1スケール、64分の1のスケールの画像を用意する。図3のように境界候補画像生成手段12は、各解像度の画像に対してランダムノイズを付加して、それぞれの画像に、提案手法のベースとしている手法である[Felzenszwalb & Huttenlocher 2004]を適用する処理を行う。その後、境界候補画像生成手段12は、処理結果の画像を合成することで、境界候補画像を生成する。境界候補画像の生成については、後に詳述する。
なお、原画像から生成する複数の解像度の画像は上記に限られない。例えば、さらに128分の1スケールの画像を用いることとしても良い。また例えば、処理対象の画像が小さい場合に64分の1スケールの画像を用いず、オリジナルの解像度の画像と、4分の1スケールの画像と、16分の1スケールの画像のみを用いることとしても良い。
領域分割手段13は、領域の結合および分割を行う。より具体的には、領域分割手段13は、対応点推定に用いたコスト関数から信頼度関数を求め、この信頼度に基づいて特定の領域を結合または分割の判定を行い、判定結果に基づいて処理を実行する。
なお、領域分割手段13は、対応点情報補正手段15により信頼度関数が補正されると、補正された信頼度関数に基づいて、領域の結合および分割を実行する。
なお、領域分割手段13は、対応点情報補正手段15により信頼度関数が補正されると、補正された信頼度関数に基づいて、領域の結合および分割を実行する。
繰り返し条件規定手段14は、領域分割処理の終了の判定を行う。繰り返し条件規定手段14により規定された終了条件が満たされると、領域分割処理は終了する。
対応点情報補正手段15は、境界候補画像生成手段12が生成した境界候補画像を用いて対応点の補正を行う。具体的には対応点情報補正手段15は、領域分割手段13で求めた信頼度関数の補正を行う。
次に、領域分割装置100の動作について説明する。図4は、領域分割装置100の動作のフローチャートである。
対応点推定手段11は、ブロックマッチング法を用いて対応点の推定を行う(ステップS1)。ここで、ブロックマッチング法は、以下のコスト関数を最小化する点を一定の範囲から探索する。
ここで、式(1)および式(2)において、xはフレーム内画素番号、uc,vcは画素番号xに対応する現フレームの画像座標、up,vpは前フレームの画像座標、chはRGBの色チャンネル、Ic (ch)(u,v),Ip (ch)(u,v)は座標(u,v)における色チャンネルchにおける現フレームと前フレームの画素値、bはブロックサイズを指定するパラメータである。
本手法では、探索範囲を規定するパラメータRblockに対して、探索範囲を
とする。
本手法では、探索範囲を規定するパラメータRblockに対して、探索範囲を
境界候補画像生成手段12は、境界候補画像を生成する(ステップS2)。境界候補画像生成手段12は、原画像から複数の解像度の画像を生成し、生成した各解像度の画像に対しランダムノイズを付加する。例えば、図2に示したように、ある1フレームについて4つの異なる解像度の画像を生成し、それぞれの画像にランダムノイズを付加する。なお、各解像度の画像に対してランダムノイズを付加した画像は、それぞれ複数枚が生成される。より具体的には、オリジナルの解像度、4分の1スケール、16分の1スケール、64分の1スケールのそれぞれの画像に対し、ランダムノイズが付加された画像が、それぞれ複数枚ずつ生成される。異なる解像度の画像を利用することにより、重要度が大きくないと考えられる箇所から受ける影響を抑制する。
境界候補画像生成手段12は、図3に示したようにランダムノイズを加え、[Felzenszwalb & Huttenlocher 2004]を適用し結合結果画像を求め、各解像度ごとの結合結果画像を合成することにより境界候補画像を生成する。ここで、[Felzenszwalb & Huttenlocher 2004]は、隣接する画素間の相違性をもとに、類似している画素を結合することによって、結合結果画像を求める。ただし、[Felzenszwalb & Huttenlocher 2004]は、ノイズに影響を受け領域形状が変動しやすい性質をもっている。そのため、それぞれの画像に対してランダムノイズを付加することで、画像中に存在する重要度の高い領域境界を取得することができる。
境界候補画像生成手段12は、具体的には、各解像度の画像ごとに複数のノイズを付加した画像を作成し、各ノイズ付加画像ごとに[Felzenszwalb & Huttenlocher 2004]を適用し結合画像を求める。このとき、各ノイズ付加画像に対する結合画像の領域境界を1、それ以外を0とする2値画像へ変換する。この変換された画像を、各解像度ごとにノイズ付加画像の数で平均して加算することで、各解像度結合結果合成画像を得る。
尚、前記では複数のノイズを付加した画像を作成しているが、1種類のノイズを付加した画像を使用してもよい。この場合はノイズ付加画像の数で平均化する必要はない。
さらに、境界候補画像生成手段12は、各解像度結合結果合成画像に重みを付け加算し、境界候補画像が生成される。
ここで、解像度ごとの重みは、その合計が1となるように処理対象となる動画像に適切な値を適宜選択する。この重みを用いて境界候補画像Ibdは、平均化された解像度ごとの画像すなわち各解像度結合結果合成画像をIiとして、次式のように計算される。
例えば、重みの設定方法として、全解像度に対して均一な重みの設定や、各解像度の画像サイズをSi、原画像のサイズをS0、各解像度の画像に対する重みをwiとして、次式のような設定が考えられる。
ここで生成された境界候補画像と、領域分割処理結果の差分により、色が似ているために対応点推定を誤った場合に発生する分割漏れを検知することできる。
尚、前記では複数のノイズを付加した画像を作成しているが、1種類のノイズを付加した画像を使用してもよい。この場合はノイズ付加画像の数で平均化する必要はない。
さらに、境界候補画像生成手段12は、各解像度結合結果合成画像に重みを付け加算し、境界候補画像が生成される。
ここで、解像度ごとの重みは、その合計が1となるように処理対象となる動画像に適切な値を適宜選択する。この重みを用いて境界候補画像Ibdは、平均化された解像度ごとの画像すなわち各解像度結合結果合成画像をIiとして、次式のように計算される。
領域分割手段13は、領域の結合および分割を行う(ステップS3)。
領域分割手段13は、各画素をノード(頂点)とするグラフを作成する。具体的には、入力フレーム画像の各画素に対してノードを設定し、ノード間をエッジ(辺)により接続してなるグラフを作成する。すなわち、各画素に対応するノードと、互いに隣接する画素同士の隣接関係を表すエッジとにより構成される無向グラフを作成する。また、エッジにより接続されるノードに対応する画素間の相違度を、エッジの重みwとして算出する。
次に、領域分割手段13は、エッジの重みwを昇順にソートし、画素ごとの信頼度関数を計算する。ここで信頼度関数は対応点の確からしさを表し、ステップS1の対応点推定の際に用いたコスト関数から、以下のように定める。
ここで、up,x、vp,xは画素番号xに対する前フレームの対応点座標、sは滑らかさを指定するパラメータ、tはコスト関数に対する閾値である。ここで、tの繰り返し処理の初期値は、(コスト関数の画像全体にわたる平均)+(コスト関数の画像全体にわたる標準偏差)*3によって定義する。また、tの初期値としてコスト関数の平均を用いることにより、動画像毎にコスト関数が変化する状況に対応でき、ノイズに対してロバストになると考えられる。
ここで領域分割手段13は現フレームにおいて、ある領域単位の信頼度を、当該領域中に存在する各画素単位の信頼度の平均の値とする。この信頼度関数を定義することにより、動画像毎に変化する各画素単位の信頼度を平均化することができ、ノイズに対してロバストになると考えられる。
なお上記では標準偏差を3倍するものとしているが、対応点推定の誤りをなるべく許容しないようにするため、標準偏差に掛ける倍率を3倍より小さくしても良い。また、対応点推定の誤りを許容する設定とするために倍率を上げてもよく、例えば、標準偏差に4倍を掛けるものしても良い。
領域分割手段13は、各画素をノード(頂点)とするグラフを作成する。具体的には、入力フレーム画像の各画素に対してノードを設定し、ノード間をエッジ(辺)により接続してなるグラフを作成する。すなわち、各画素に対応するノードと、互いに隣接する画素同士の隣接関係を表すエッジとにより構成される無向グラフを作成する。また、エッジにより接続されるノードに対応する画素間の相違度を、エッジの重みwとして算出する。
次に、領域分割手段13は、エッジの重みwを昇順にソートし、画素ごとの信頼度関数を計算する。ここで信頼度関数は対応点の確からしさを表し、ステップS1の対応点推定の際に用いたコスト関数から、以下のように定める。
ここで領域分割手段13は現フレームにおいて、ある領域単位の信頼度を、当該領域中に存在する各画素単位の信頼度の平均の値とする。この信頼度関数を定義することにより、動画像毎に変化する各画素単位の信頼度を平均化することができ、ノイズに対してロバストになると考えられる。
なお上記では標準偏差を3倍するものとしているが、対応点推定の誤りをなるべく許容しないようにするため、標準偏差に掛ける倍率を3倍より小さくしても良い。また、対応点推定の誤りを許容する設定とするために倍率を上げてもよく、例えば、標準偏差に4倍を掛けるものしても良い。
次に、上述の信頼度を用いて、隣接フレーム間で領域がどのように対応しているかを割り当てる。より具体的には、領域分割手段13はステップS1で推定した対応点を用いて、現フレームの全画素について、前フレームのどの領域に属していたかという情報を割り当てる。このとき、それぞれの画素に割り当てられる情報は、どの領域に属しているかを示す領域番号である。
次に、もっとも小さいエッジの重みw(e)を1つ選択する。ここで、現フレームの各領域に対応する前フレームの領域番号を、
によって定義する。なお、tag(x)は各画素が前フレームで属していたと推定された領域番号である。この領域間対応関係と信頼度から、補正項fを計算する。補正項fは以下のように定義する。
ここで、conf(Ci,Cj)は領域Ci,Cjの信頼度の積によって定義される。またrs、rdはパラメータであり、通常はそれぞれ1とする。
次に領域分割手段13は、前述の補正項をもとに、次の条件を用いて領域の結合判定を行う。ここで領域の結合判定は、セグメンテーション基準D(Ci,Cj)について、式(10)を用いて評価することにより行う。
このとき、それぞれの式は、
とする。m(C)は領域内で結合済みの境界重みの平均値、sd(C)は領域内で結合済み境界重みの標準偏差、kは領域の粒度をコントロールするパラメータである。なお、式(10)のDif(Ci,Cj)は2つの領域間にある境界の重みの最小値によって定義される。
式(10)の条件Dがfalseとなった場合には、2つの領域を結合する。ここで領域の結合を行った場合には、式(12)に基づき、Int(C)を更新し、更にタグ番号及び信頼度を再計算する。式(10)の条件Dがtrueとなった場合には、2つの領域は分割した状態とする。
式(10)の条件Dがfalseとなった場合には、2つの領域を結合する。ここで領域の結合を行った場合には、式(12)に基づき、Int(C)を更新し、更にタグ番号及び信頼度を再計算する。式(10)の条件Dがtrueとなった場合には、2つの領域は分割した状態とする。
もっとも小さいエッジの重みw(e)についての処理が終了したら、w(e)の次に小さいエッジの重みについて、同様の処理を実行する。この処理を、処理するエッジがなくなるまで繰り返し行う。
その後、一定サイズ以下の微小な領域を周囲の領域と結合する。
その後、一定サイズ以下の微小な領域を周囲の領域と結合する。
繰り返し条件規定手段14は、繰り返し処理の停止判定により、領域分割処理の終了の判定を行う(ステップS4)。
具体的には、ステップS1乃至ステップS3の処理により、多くの場合には分割された領域が安定するが、信頼度が高いにもかかわらず誤った対応点を推定してしまう場合がある。例えば図5は、白い雲を背景とするかすんだ建物壁面において、誤った対応点推定を行った例である。このような状況に対応するため、ステップS3と、ステップS2で作成した境界候補画像を用いた対応点推定の補正(ステップS5)を繰り返し行うが、繰り返し条件規定手段14は、この繰り返し処理の停止判定基準を設ける。
具体的には、ステップS1乃至ステップS3の処理により、多くの場合には分割された領域が安定するが、信頼度が高いにもかかわらず誤った対応点を推定してしまう場合がある。例えば図5は、白い雲を背景とするかすんだ建物壁面において、誤った対応点推定を行った例である。このような状況に対応するため、ステップS3と、ステップS2で作成した境界候補画像を用いた対応点推定の補正(ステップS5)を繰り返し行うが、繰り返し条件規定手段14は、この繰り返し処理の停止判定基準を設ける。
繰り返し条件規定手段14は、繰り返し処理の初回の処理結果をS0、2回目以降の処理結果をSiとするとき、その一致度FIT(S0,Si)を以下の手順により算出する。
まず、S0中の各画素について、Siの同じ位置の画素に境界が存在すれば、境界が一致したとみなす。次に、S0の全画素について一致しているかどうかを計算する。次に、p=(一致した画素数/S0の境界画素数)、r=(一致した画素数/Siの境界画素数)から、FIT(S0,Si)=2pr/(p+r)とする。
まず、S0中の各画素について、Siの同じ位置の画素に境界が存在すれば、境界が一致したとみなす。次に、S0の全画素について一致しているかどうかを計算する。次に、p=(一致した画素数/S0の境界画素数)、r=(一致した画素数/Siの境界画素数)から、FIT(S0,Si)=2pr/(p+r)とする。
繰り返し条件規定手段14は、一致度FIT(S0,Si)を用いて、停止基準STOP(S0,Si)を次のように定義する。
ここで、thFは、一致度に関するパラメータである。
式(14)の停止基準STOP(S0,Si)がtrueとなった場合、繰り返し処理を終了する(ステップS4でYes)。または、式(14)の停止基準STOP(S0,Si)がfalseであっても、パラメータTを事前に決定しておき、繰り返し回数がこの値を超えた場合、繰り返し処理を終了する(ステップS4でYes)。それ以外の場合には、ステップS5に進む(ステップS4でNo)。
式(14)の停止基準STOP(S0,Si)がtrueとなった場合、繰り返し処理を終了する(ステップS4でYes)。または、式(14)の停止基準STOP(S0,Si)がfalseであっても、パラメータTを事前に決定しておき、繰り返し回数がこの値を超えた場合、繰り返し処理を終了する(ステップS4でYes)。それ以外の場合には、ステップS5に進む(ステップS4でNo)。
対応点情報補正手段15は、境界候補画像生成手段12が生成した境界候補画像を用いて対応点の補正を行う(ステップS5)。具体的には、対応点情報から算出された信頼度関数を補正する。
まず対応点情報補正手段15は、現在の領域分割結果から境界を表す2値画像Isegmを作成する。Isegmと、ステップS2で算出された境界領域候補画像Ibdの差分画像Isubを、式(15)の計算により求める。
ここで、境界候補画像は幅のある境界を生成しており、Isegmは幅のない境界を生成している。したがって2値画像Isegmは、境界候補画像に対応して、4画素分膨張させたものを用いるのが望ましい。これにより差分画像Isubの生成時において、境界候補画像と2値画像Isegmの、境界の幅の差に基づいて発生する悪影響を抑えることができる。
次に、差分画像Isubをもとに、信頼度補正情報を算出する。差分画像Isubの各画素xを中心とするRsub×Rsubの矩形領域R(x)を考え、信頼度補正情報を式(16)で定義する。
このときRsubは、矩形領域R(x)のサイズを表すパラメータであり、E(Isub)、dminはそれぞれ矩形領域内における差分画像の画素値平均と、矩形領域内での中心画素から差分画像の境界点までの距離の最小値である。
図6は、距離が最小となる点を示す図である。中心となる画素から下方向に2画素離れた位置にある画素が、境界存在点のうちの距離最小点dminである。また例えば、上方向に2画素かつ右方向に2画素の場所にある境界存在点の画素との距離は、2√2となる。
なお、σ=(Rsub−1)/4とする。
図6は、距離が最小となる点を示す図である。中心となる画素から下方向に2画素離れた位置にある画素が、境界存在点のうちの距離最小点dminである。また例えば、上方向に2画素かつ右方向に2画素の場所にある境界存在点の画素との距離は、2√2となる。
なお、σ=(Rsub−1)/4とする。
上述の補正情報を用いて、信頼度関数中のコスト関数に関する閾値tを、式(17)および式(18)に従って更新することにより、信頼度の補正を行う。
ここで、cは、
を満たすパラメータである。t0はステップS3の説明で既述したように、(コスト関数の画像全体にわたる平均)+(コスト関数の画像全体にわたる標準偏差)*3とする。
次に、本実施の形態による領域分割手法の有用性を示す。図7は、人工的に作成した画像と、実際に撮影して作成した実画像を用いて、境界ベースで評価を行った結果のグラフである。図8は図7と同様の図を用いて、領域ベースで評価を行った結果のグラフである。図7および図8において、それぞれ各手法の隣接フレーム間の安定度を縦軸とし、1を最大として値が大きいほど安定度が高いものとする。横軸はフレーム番号であり、それぞれ取得した動画の0フレームから80フレームについて示している。
ここで比較対象として、スーパーピクセル算出手法として広く用いられている3手法([Felzenszwalb & Huttenlocher 2004],[Comaniciu & Meer 2002],[Shi & Malik 2000])および、固定カメラの場合に時間方向安定化を図っている特許文献3の方法の合計4手法による結果を、図7および図8に同時に示す。
ここで比較対象として、スーパーピクセル算出手法として広く用いられている3手法([Felzenszwalb & Huttenlocher 2004],[Comaniciu & Meer 2002],[Shi & Malik 2000])および、固定カメラの場合に時間方向安定化を図っている特許文献3の方法の合計4手法による結果を、図7および図8に同時に示す。
図7によると、実施の形態1で示した手法(提案手法)は、境界ベースによる評価においていずれの手法よりも安定度が高く、もっとも良い結果となっていることがわかる。また図8によると、実施の形態1で示した手法(提案手法)は、領域ベースによる評価においていずれの手法よりも安定度が高く、もっとも良い結果となっていることがわかる。
したがって、実施の形態1で示した手法は、境界ベースおよび領域ベースのいずれにおいても、他の比較手法に比べて安定度が高いという結果が得られている。
したがって、実施の形態1で示した手法は、境界ベースおよび領域ベースのいずれにおいても、他の比較手法に比べて安定度が高いという結果が得られている。
図9に人工的に作成した画像に対する処理例を示す。実施の形態1による処理結果を(a1)乃至(a4)に示す。また図9において、b行は特許文献3の方法による処理結果、c行は[Felzenszwalb & Huttenlocher 2004]による処理結果、d行は[Comaniciu & Meer 2002]による処理結果、e行は[Shi & Malik 2000]による処理結果である。
なお、左から1列目は8フレーム目、2列目は13フレーム目、3列目は18フレーム目、4列目は23フレーム目である。
これによると、実施の形態1にかかる処理により、領域分割がもっとも効果的に行われている様子がわかる。
なお、左から1列目は8フレーム目、2列目は13フレーム目、3列目は18フレーム目、4列目は23フレーム目である。
これによると、実施の形態1にかかる処理により、領域分割がもっとも効果的に行われている様子がわかる。
図10に実際に撮影した画像に対する処理例を示す。実施の形態1による処理結果を(a1)乃至(a4)に示す。また図10において、b行は特許文献3の方法による処理結果、c行は[Felzenszwalb & Huttenlocher 2004]による処理結果、d行は[Comaniciu & Meer 2002]による処理結果、e行は[Shi & Malik 2000]による処理結果である。
なお、左から1列目は14フレーム目、2列目は23フレーム目、3列目は32フレーム目、4列目は41フレーム目である。
これによると、実施の形態1にかかる処理により、領域分割がもっとも効果的に行われている様子がわかる。
なお、左から1列目は14フレーム目、2列目は23フレーム目、3列目は32フレーム目、4列目は41フレーム目である。
これによると、実施の形態1にかかる処理により、領域分割がもっとも効果的に行われている様子がわかる。
これにより対応点推定を行って領域分割を行うことで、時間方向に安定した状態で領域分割を行うことができる。
また、対応点推定を行う際に求めるコスト関数に基づく信頼度関数を用いることで、対応点推定の明らかな誤りによる影響を抑制できる。
さらに、境界候補画像を用いた逐次的な補正を行うことで、分割すべき境界付近に存在する対応点推定の微妙な誤りによる影響を制御することができる。
したがって、画像の領域分割を適切に行うことができる。
また、対応点推定を行う際に求めるコスト関数に基づく信頼度関数を用いることで、対応点推定の明らかな誤りによる影響を抑制できる。
さらに、境界候補画像を用いた逐次的な補正を行うことで、分割すべき境界付近に存在する対応点推定の微妙な誤りによる影響を制御することができる。
したがって、画像の領域分割を適切に行うことができる。
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。例えば対応点情報補正手段15は、Isegmは4画素の膨張を行うこととしたが、これに限られず、8画素の膨張を行うこととしても良い。
11 対応点推定手段
12 境界候補画像生成手段
13 領域分割手段
14 繰り返し条件規定手段
15 対応点情報補正手段
100 領域分割装置
12 境界候補画像生成手段
13 領域分割手段
14 繰り返し条件規定手段
15 対応点情報補正手段
100 領域分割装置
Claims (4)
- 動画像の隣接フレーム間のピクセルごとの対応点を推定する対応点推定手段と、
前記動画像の原画像から複数の解像度の画像を生成し、当該複数の解像度の各解像度の画像に対してノイズを付加し、隣接する画素間の相違性をもとに類似の画素を結合し、当該複数の解像度の画像に対する前記結合結果を合成することで、領域の境界候補を示す境界候補画像を生成する境界候補画像生成手段と、
前記対応点の確からしさを表す信頼度関数を、前記対応点に関するコスト関数を用いて求め、当該信頼度関数により算出する前記ピクセルの信頼度に応じて領域の分割を行う領域分割手段と、
前記境界候補画像生成手段で生成された前記境界候補画像と、前記領域分割手段による領域分割処理結果との差分を求め、当該差分に応じて、前記信頼度関数を補正する対応点情報補正手段と、
前回の前記領域分割手段による領域分割と、前記対応点情報補正手段により前記信頼度関数が補正された後の今回の前記領域分割手段による領域分割との一致度に基づいて、領域分割の適否を判定し、前記領域分割手段による領域分割が適当でないと判定した場合には、前記対応点情報補正手段による処理と前記領域分割手段による処理を繰り返し実行させ、前記領域分割手段による領域分割が適当であると判定した場合には領域分割処理を終了させる繰り返し条件規定手段と、を備える、領域分割装置。 - 前記境界候補画像生成手段では、前記動画像の原画像から複数の解像度の画像を生成し、当該複数の解像度の各解像度の画像に対して複数のノイズを付加し、各ノイズを付加された画像ごとに隣接する画素間の相違性をもとに類似の画素を結合し、当該各ノイズ付加画像に対する前記結合結果を合成して各解像度に対する結合結果画像を求め、当該複数の解像度の画像に対して前記各解像度の結合結果画像を合成することで、領域の境界候補を示す境界候補画像を生成する請求項1に記載の領域分割装置。
- 動画像の隣接フレーム間のピクセルごとの対応点を推定し、
前記動画像の原画像から複数の解像度の画像を生成し、当該複数の解像度の各解像度の画像に対してノイズを付加し、隣接する画素間の相違性をもとに類似の画素を結合し、当該複数の解像度の画像に対する前記結合結果を合成することで、領域の境界候補を示す境界候補画像を生成し、
前記対応点の確からしさを表す信頼度関数を、前記対応点に関するコスト関数を用いて求め、当該信頼度関数により算出する前記ピクセルの信頼度に応じて領域の分割を行い、
前記境界候補画像と、領域分割処理結果との差分を求め、当該差分に応じて、前記信頼度関数を補正し、
前回の領域分割と、前記信頼度関数が補正された後の今回の領域分割との一致度に基づいて、領域分割の適否を判定し、領域分割が適当でないと判定した場合には、前記信頼度関数を補正する処理と前記ピクセルの信頼度に応じて領域の分割を行う処理を繰り返し実行させ、領域分割が適当であると判定した場合には領域分割処理を終了させる、領域分割方法。 - 前記動画像の原画像から複数の解像度の画像を生成し、当該複数の解像度の各解像度の画像に対して複数のノイズを付加し、各ノイズを付加された画像ごとに隣接する画素間の相違性をもとに類似の画素を結合し、当該各ノイズ付加画像に対する前記結合結果を合成して各解像度に対する結合結果画像を求め、当該複数の解像度の画像に対して前記各解像度の結合結果画像を合成することで、領域の境界候補を示す境界候補画像を生成する請求項3に記載の領域分割方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010270464A JP2012118923A (ja) | 2010-12-03 | 2010-12-03 | 領域分割装置及び領域分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010270464A JP2012118923A (ja) | 2010-12-03 | 2010-12-03 | 領域分割装置及び領域分割方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012118923A true JP2012118923A (ja) | 2012-06-21 |
Family
ID=46501634
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010270464A Pending JP2012118923A (ja) | 2010-12-03 | 2010-12-03 | 領域分割装置及び領域分割方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012118923A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017091549A (ja) * | 2015-11-13 | 2017-05-25 | 本田技研工業株式会社 | 単一のカメラを用いた移動物体検出のための方法およびシステム |
JP2021022236A (ja) * | 2019-07-29 | 2021-02-18 | セコム株式会社 | 分類信頼度算出装置、領域分割装置、学習装置、分類信頼度算出方法、学習方法、分類信頼度算出プログラム、及び学習プログラム |
JP7551447B2 (ja) | 2020-10-19 | 2024-09-17 | 日立交通テクノロジー株式会社 | 異物検出装置、異物検出システム、異物検出方法 |
-
2010
- 2010-12-03 JP JP2010270464A patent/JP2012118923A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017091549A (ja) * | 2015-11-13 | 2017-05-25 | 本田技研工業株式会社 | 単一のカメラを用いた移動物体検出のための方法およびシステム |
JP2021022236A (ja) * | 2019-07-29 | 2021-02-18 | セコム株式会社 | 分類信頼度算出装置、領域分割装置、学習装置、分類信頼度算出方法、学習方法、分類信頼度算出プログラム、及び学習プログラム |
JP7334083B2 (ja) | 2019-07-29 | 2023-08-28 | セコム株式会社 | 分類信頼度算出装置、領域分割装置、学習装置、分類信頼度算出方法、学習方法、分類信頼度算出プログラム、及び学習プログラム |
JP7551447B2 (ja) | 2020-10-19 | 2024-09-17 | 日立交通テクノロジー株式会社 | 異物検出装置、異物検出システム、異物検出方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109598744B (zh) | 一种视频跟踪的方法、装置、设备和存储介质 | |
US8948448B2 (en) | Method and apparatus for trajectory estimation, and method for segmentation | |
US9196021B2 (en) | Video enhancement using related content | |
CN106254885B (zh) | 数据处理系统、执行运动估计的方法 | |
US10818018B2 (en) | Image processing apparatus, image processing method, and non-transitory computer-readable storage medium | |
JP5333440B2 (ja) | 処理システム、画像処理方法および画像処理用プログラム | |
CN105574891B (zh) | 检测图像中的运动目标的方法及系统 | |
CN107968946B (zh) | 视频帧率提升方法及装置 | |
CN102930559B (zh) | 图像处理的方法及装置 | |
JP5091994B2 (ja) | 動きベクトル検出装置 | |
TW201345262A (zh) | 影像處理電路及影像處理方法 | |
CN111052184A (zh) | 动态图像处理装置、显示装置、动态图像处理方法以及控制程序 | |
JP2006513478A (ja) | 効率的な予測画像のパラメータの推定 | |
CN111754429A (zh) | 运动矢量后处理方法和装置、电子设备及存储介质 | |
US20120176536A1 (en) | Adaptive Frame Rate Conversion | |
CN107810520B (zh) | 图像处理装置和方法 | |
JP2012118923A (ja) | 領域分割装置及び領域分割方法 | |
CN112084855B (zh) | 一种基于改进ransac方法对视频流的外点剔除方法 | |
JP6057629B2 (ja) | 画像処理装置、その制御方法、および制御プログラム | |
US9106926B1 (en) | Using double confirmation of motion vectors to determine occluded regions in images | |
JP5059855B2 (ja) | 大域的動き推定方法 | |
CN103618904B (zh) | 基于像素的运动估计方法及装置 | |
JP2006521740A (ja) | 動きベクトル決定方法 | |
CN112770118B (zh) | 视频帧图像运动估计方法及相关设备 | |
JP2017201454A (ja) | 画像処理装置及びプログラム |