JP6448109B2 - 映像領域分割装置および映像領域分割プログラム - Google Patents
映像領域分割装置および映像領域分割プログラム Download PDFInfo
- Publication number
- JP6448109B2 JP6448109B2 JP2013264623A JP2013264623A JP6448109B2 JP 6448109 B2 JP6448109 B2 JP 6448109B2 JP 2013264623 A JP2013264623 A JP 2013264623A JP 2013264623 A JP2013264623 A JP 2013264623A JP 6448109 B2 JP6448109 B2 JP 6448109B2
- Authority
- JP
- Japan
- Prior art keywords
- cluster
- clusters
- node
- cost
- adjacent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Image Analysis (AREA)
Description
また、このグラフカット法に対して前景および背景の尤度情報に改良を加えたグラブカット法も知られている(例えば、非特許文献2参照)。
本発明は、上記事情に鑑みてなされたものであり、簡易な操作によって、映像から所望の映像領域を高精度且つ効率的に抽出することができる、映像領域分割装置および映像領域分割プログラムを提供することを目的とする。
まず、後述する映像領域分割装置に適用されるクラスタ情報生成装置(クラスタ情報生成部)について説明する。
クラスタ情報生成装置は、入力として領域分割の対象となる映像と、領域分割処理のための少数のパラメータを与えることで、映像の色情報のみから被写体領域の抽出に対して適切な領域分割結果を取得できるようにするものである。
本実施形態において、映像の領域分割とは、時空間領域を有する映像について、ある領域に対して一意に識別する領域ID(識別番号)を割り振ること、及び、その領域IDを割り振られた時空間領域を特定できるようにすることである。そして、その各領域は被写体として同一の物体領域を占めるとともに、可能な限り時空間領域として大きな領域を構成することが望まれるものである。すなわち、映像の被写体領域の抽出において適切な領域分割とは、「同じ被写体領域には同じ領域IDが割り振られ、それが時空間領域として大きく構成されること」と「異なる被写体領域には同じ領域IDが割り振られないこと」を満たすものである。
また、被写体領域の抽出においては、領域分割処理の結果に対して、被写体領域を特定(指定)するためにユーザによる手動の領域指定が伴うことを前提とするものである。つまり、本実施形態による領域分割処理は、要求に応じてユーザは任意の複数の被写体領域を指定するプロセスを経る。例えば、人物が写っている映像に対して、ある要求では人物全体の抽出を行うために、人物全体を指定する場合もあれば、別の要求では顔と頭だけを抽出する場合もある。つまり、領域分割処理の結果から被写体を抽出する際に、抽出する部分に汎用性があるように領域分割を行うものである。
本実施形態におけるクラスタ情報生成装置1の構成について、図1を参照して説明する。図1に示すように、本実施形態に係るクラスタ情報生成装置1(クラスタ情報生成部)は、クラスタ化処理部10と、クラスタ統合処理部20と、クラスタ再分割処理部30と、を備え、領域分割処理の対象である映像と処理のためのパラメータとを入力し、入力した映像を領域分割するものである。
クラスタ統合処理部20は、第2段階の処理として、隣接クラスタ間の代表色の差に基づいて第1段階の処理で過分割されたクラスタの統合処理を行うものである。
クラスタ再分割処理部30は、最後の第3段階の処理として、第2段階の処理で統合された領域を、所定の再分割条件に基づいて、第1段階の処理で分割されたクラスタを単位として、領域の再分割をするものである。
また、本実施形態では、第3段階の処理結果である最終的な領域分割結果を、領域ID(再分割領域ID)ごとに領域を色分けした領域ID分布映像と、領域の代表色で色分けした領域代表色映像として出力できるように構成されている。
なお、本実施形態に係るクラスタ情報生成装置1は、CPU、メモリ、ハードディスクなどの記憶装置などを備えた一般的なコンピュータを用いて、各処理部として機能させることで実現することができる。
本実施形態で用いる平均値シフト法による映像のクラスタ化処理は、非特許文献5に記載された手法と同様の手法を用いるものである。本実施形態においては、平均値シフト法による分割領域を制御するために、空間(フレーム内の座標で表される2次元の空間)、時間(フレーム番号又は時刻で表される1次元の空間)及び色空間(RGB、HSV,L*a*b*などの色の3要素で表される3次元の空間)ごとに、それぞれ独立に繰り返し重み付け平均化処理を行うための計算範囲(バンド幅(カーネル半径))を定める。すなわち、平均値シフト法によるクラスタ化処理のためのパラメータとして、それぞれ一定の空間バンド幅、時間バンド幅及び色空間バンド幅を指定することにより、時空間的に近隣にあり、かつ、色空間上での距離が近い(色が類似している)画素の集合ごとに1つのクラスタを形成し、映像を複数のクラスタに領域分割する。
なお、時空間的に近傍となる範囲は、空間バンド幅及び時間バンド幅によって定められる。また、色空間上で距離が近いかどうかは、色空間バンド幅で定められる。すなわち、クラスタの粒度(クラスタの大きさ)は、これらのバンド幅によって調整することができる。
クラスタ化処理手段11は、クラスタごとの代表色を算出するとともに、クラスタごとにクラスタを一意に識別するクラスタIDを付与し、これらのデータを処理結果として、グラフ化処理手段12に出力する。なお、クラスタの代表色とは、そのクラスタの代表的な色であり、具体的には各クラスタにおける平均値シフト処理の収束値を使用することができる。
図4にグラフの例を示す。図4において、各ノードに示した「0」〜「5」の数字はクラスタIDを示している。すなわち、グラフとは、本例では時空間的に隣接するクラスタ間の接続状態を示すデータである。ここで、エッジで接続されたノード(クラスタ)同士は互いに隣接していることを示し、エッジは、所定のコスト関数で定められるコストを有するものである。ノードであるクラスタ間の代表色の差が小さいほどノード間の類似度は高くなり、コスト関数で定められるコストの値は大きくなる。このコストは、後記するグラフカット処理において、このエッジを切断するために要するコストを示すものである。
なお、グラフ化処理手段12によってグラフ化処理を行う段階では、クラスタの統合処理が行われていない。従って、グラフ化処理手段12は、映像中のすべてのクラスタをノードとする1つのグラフを作成する。また、グラフ化処理手段12は、前記した隣接クラスタマトリックスにおいて、互いに隣接するクラスタ間のすべてのエッジについて、前記したコスト関数によってコストを算出する。
クラスタデータ記憶手段13に記憶されたデータは、クラスタ統合処理部20の隣接クラスタ統合処理手段21によって参照される。
クラスタ化処理部10は、異なる被写体に属する領域が同一のクラスタに含まれないよう、過分割な状態にクラスタ化するため、クラスタ統合処理部20は、細かく分割され過ぎたクラスタを大きな領域に統合するためのものである。
このとき、隣接クラスタ統合処理手段21は、統合するかどうかを判定するためのパラメータとして、クラスタ間の代表色の差の上限値を示す閾値を外部から入力する。この閾値は、クラスタ化処理手段11がクラスタ化のために用いた色空間についてのバンド幅を基準にした十分に大きな値とする。例えば、この閾値を色空間バンド幅の半分程度とすることができる。これによって、クラスタ化処理手段11によって過分割状態に分割されたクラスタを統合することができる。
隣接クラスタ統合処理手段21は、処理結果である統合領域データとして、統合領域ごとに、グラフデータと統合領域の代表色とを、統合領域IDに対応付けて統合領域データ記憶手段22に記憶する。
統合領域データ記憶手段22に記憶されたデータは、クラスタ再分割処理部30の再分割条件検出処理手段31によって参照される。
クラスタ統合処理部20は、代表色が類似する隣接クラスタを統合するため、統合領域には、例えば、移動する被写体がたまたま類似する色を有する他の被写体と映像内で交差することがあると、これらの被写体の領域を統合することがある。本実施形態に係るクラスタ情報生成装置1は、異なる被写体に属するクラスタを、同一の領域IDが割当てられる領域として統合しないようにするために、一度統合した領域から、異なる被写体に属するクラスタを検出して、異なる被写体に属するクラスタ同士を互いに異なる領域に再分割するものである。
ここで、再分割条件とは、1つの統合領域に、異なる被写体に属するクラスタが統合されているかどうかを判断する条件のことである。
なお、再分割条件の詳細については後記する。
なお、再分割処理手段32は、再分割領域ごとに、再分割領域を一意に識別する再分割領域IDを付与するとともに、再分割領域の代表色を算出する。代表色としては、例えば、再分割領域を構成するクラスタの代表色の平均値とすることができる。再分割処理手段32は、処理結果である再分割領域データとして、再分割領域に含まれるクラスタのIDのリストと代表色とを、再分割領域IDに対応付けて再分割領域データ記憶手段33に記憶する。
なお、再分割処理の詳細については後記する。
再分割領域データ記憶手段33に記憶されたデータは、例えば、外部の映像編集装置などによって、領域ID分布映像や領域代表色映像の作成のために用いられる。
次に、適宜図面を参照してクラスタ情報生成装置1の動作であるクラスタ情報生成処理について説明する。
まず、図2を参照(適宜図1参照)して、クラスタ情報生成処理の概要について説明する。
図2に示すように、クラスタ情報生成装置1は、クラスタ化処理手段11によって、処理対象となる映像とクラスタ処理のためのパラメータとして、空間バンド幅、時間バンド幅及び色空間バンド幅を外部から入力し、平均値シフト法による映像のクラスタ化処理を行う(ステップS10)。
クラスタ情報生成装置1は、再分割条件検出処理手段31によって、ステップS13で選択された統合領域についてのデータを統合領域データ記憶手段22から読み出し、選択された統合領域に含まれるクラスタの中から、所定の条件に一致するクラスタ対を検出する(ステップS14)。
一方、すべての統合領域について再分割処理が終了している場合は(ステップS16でYes)、クラスタ情報生成装置1は、クラスタ情報生成処理を終了する。
以上のように、クラスタ情報生成装置1は、クラスタ化処理の際の3つのバンド幅、及びクラスタ統合処理のためのクラスタ間の色差の閾値という少数のパラメータを用いて領域分割を行うことができる。また、クラスタ単位で、時空間で隣接する領域の統合と再分割とを行うため、空間方向だけでなく、時間方向についても適切に統合された領域分割を行うことができる。
図3に示した映像は、クラスタ化処理手段11によって、すでに平均値シフト法により過分割な状態にクラスタ化され、グラフ化処理手段12によって、クラスタの隣接状態が分析された第1段階を終了し、更に第2段階である隣接クラスタ統合処理手段21による統合処理が終了した状態を示すものである。図3中において、数字「0」〜「5」は、それぞれクラスタIDを示している。この映像は、画面の中央付近に縦長の長方形の物体(例えば円柱)OBJ1が静止しており、円形の物体(例えば球体)OBJ2が、長方形の物体OBJ1の背後を画面の左側から右側に向かって通過している様子を示すものである。また、フレーム1からフレーム4に向かって順次に時間が経過するものとする。
なお、図3においては、この後の、第3段階である再分割処理の説明を容易にするために、第2段階である隣接クラスタの統合処理で1つの統合領域に統合されるクラスタのみを示している。このため、他の統合領域に統合される背景(周辺領域)は、ここでは処理対象として考慮しないこととする。
すなわち、図3に表されたクラスタC0〜C5は、1つの統合領域に含まれる1組のクラスタ群を構成するものである。
なお、隣接クラスタマトリックスは、統合処理によってクラスタの隣接状態が変化しないため、統合領域ごとに分割せずに、映像全体で1つのまま保持するようにしてもよい。
このように、第2段階で生成された統合領域は、色の類似したクラスタが、時空間方向に多数接続された大きな領域となる。この統合領域は、クラスタを統合したものであるので、各統合領域にはその構成要素である第1段階の分割領域であるクラスタの構成リストが生成できる。
第3段階では、各統合領域に対して、各統合領域を構成するクラスタを単位とした再分割を行うものである。
る。一般的には画素をノードとして、画素間及びソースノード、シンクノードと呼ばれる特殊なノード間をエッジで接続し、そのエッジを切断するエネルギーを最小化するエッジ切断の組合せを見つけることで領域分割などの問題を解決する手法である(例えば、非特許文献2参照)。
本実施形態では、クラスタをノードとする統合領域のグラフにおいて、互いに分割するクラスタ対の2つのクラスタの一方をソースノード、他方をシンクノードとし、ソースノードとシンクノードとを分割するために切断するエッジのエネルギーの総和を最小にするエッジの切断の組合せを見つけ、切断するものである。
次に、図6及び図7を参照(適宜図1参照)して、図2におけるステップS14である再分割条件検出処理の詳細について説明する。
前記したように、本実施形態における再分割処理は、クラスタを最小単位として行う。ここで、1つの統合領域に含まれる1対のクラスタに着目したときに、この統合領域を構成するクラスタが空間的に2以上のクラスタ群に分離した状態のフレームにおいて(この状態を、分離クラスタがある状態、又は分離フレームという)、着目したそのクラスタ対が統合領域に属する他の隣接クラスタを順次に経由しても互いに到達可能(接続可能)でないことを、そのクラスタ対を再分割する条件とする。互いに到達可能でないクラスタ対とは、言い換えれば、クラスタ対を構成する2つのクラスタが、その分離フレームにおいて、それぞれ異なるクラスタ群に属するクラスタ対のことである。
再分割条件検出処理は、このような条件を満たすクラスタ対の検出を行う処理である。なお、クラスタ群は、1個のクラスタから構成されていてもよく、2以上のクラスタから構成されていてもよい。
図3に示した例では、静止する物体OBJ1の領域内のクラスタC0,C1,C4,C5の1つと、移動する物体OBJ2の領域内のクラスタC2,C3の1つとからなるクラスタ対が、このような条件を満たす。
リックスを生成する。初期状態としてはクラスタ対の分離状態情報として何も情報がない状態とする(ステップS20)。
次に、クラスタ情報生成装置1は、再分割条件検出処理手段31によって、最初のフレームを1つ選択する(ステップS21)。なお、再分割処理条件検出処理において、調査するフレームは、フレーム番号順でなくともよい。
クラスタ情報生成装置1は、再分割条件検出処理手段31によって、選択したフレームにおいて、分離クラスタがあるかどうかを確認する(ステップS22)。
一方、次のフレームがない場合は(ステップS25でNo)、クラスタ情報生成装置1は、再分割条件検出処理を終了する。
以上のように、クラスタ情報生成装置1は、再分割条件検出処理手段31によって、すべてのフレームについて分離クラスタの有無を調査し、分離クラスタがあるフレームについて、互いに到達可能であるクラスタ対であることを示す情報と、映像中に互いに到達可能でない状態となるフレームが存在することを示す情報とを、それぞれ到達可能クラスタマトリックスと、分離クラスタマトリックスとに登録する。
図3に示した例における分離クラスタについて説明すると、第1フレームにおいては、クラスタC0,C1,C5からなるクラスタ群と、クラスタC2からなるクラスタ群とが、互いに隣接していない。従って、第1フレームおいては、分離クラスタがある状態(分離フレーム)である。
一方、第2フレーム及び第3フレームにおいては、すべてのクラスタで1つのクラスタ群を構成しているため、分離クラスタがない状態(分離フレームではない)である。
また、第4フレームは、クラスタC4,C1,C5からなるクラスタ群と、クラスタC3からなるクラスタ群とが、互いに隣接していないため、分離クラスタがある状態である。
まず、到達可能クラスタマトリックス作成処理について説明する。
到達可能クラスタマトリックスとは、空間的に隣接するクラスタを経由して他方のクラスタに到達可能であるクラスタ対であることを示す情報のことである。
ステップS22において、分離クラスタがある場合は、クラスタ情報生成装置1は、再分割条件検出処理手段31によって、図7(a)に示すような、その分離フレームについての到達可能クラスタマトリックスを作成する。図7(a)に示した到達可能クラスタマトリックスにおいて、上端の行及び左端の列に記載された「0」〜「5」は、処理対象の統合領域のうち、現在処理を行っている分離フレームに含まれるクラスタのクラスタIDを示しており、マトリックス中に「v」が記された行列に対応するクラスタ対が、互いにその分離フレーム内にて到達可能であることを示す。すなわち、あるフレームにおいて分離クラスタがある場合に、そのフレームに含まれるクラスタについて、互いに到達可能なクラスタ対であることを示す情報が到達可能クラスタマトリックスに登録される。なお、到達可能クラスタマトリックスには、任意のクラスタ対が到達可能であるかどうかを示す情報が登録されればよいため、到達可能でないクラスタ対であること示す情報を記録するようにしてもよい。
図7(a)に示した到達可能クラスタマトリックスは、図3に示した第1フレームについて調査した結果を示している。従って、第1フレームについての到達可能クラスタマトリックスにおいて、「0」と「1」、「0」と「5」、及び「1」と「5」で示される行列要素に「v」が登録される。なお、クラスタ対の順番は交換できるため、行と列とは入れ替えた行列要素にも「v」が登録される。
このため、ここでは到達可能クラスタマトリックス作成処理について、先に説明を進める。
図3に示した映像例は、第4フレームが最後のフレームであるから、ここで到達可能クラスタマトリックスの作成は終了する。
次に、分離クラスタマトリックス更新処理について説明する。
前記したように、予め、ステップS20において、統合領域を構成するすべてのクラスタ対を対象とした分離クラスタマトリックスの初期状態を生成しておく。初期状態としてはクラスタ対の分離状態情報として何も情報がない状態とする。本例では、図7(c)に示す分離クラスタマトリックスにおいて、すべての要素が空欄の状態のマトリックスを生成する。
そして、ステップS22において、分離クラスタがある場合は(Yes)、クラスタ情報生成装置1は、再分割条件検出処理手段31によって、図7(c)に示すように、分離クラスタマトリックスを更新する。図7(c)に示した分離クラスタマトリックスにおいて、上端の行及び左端の列に記載された「0」〜「5」は、処理対象の統合領域に含まれるクラスタのクラスタIDを示しており、マトリックス中に「x」が記された行列に対応するクラスタ対(ペア)が、映像中に互いに到達可能でない状態となるフレームが存在することを示す。すなわち、あるフレームにおいて分離クラスタがある場合に、そのフレームに含まれるクラスタについて、互いに到達可能でないクラスタ対であることを示す情報が分離クラスタマトリックスに登録される。
図3に示した映像例は、第4フレームが最後のフレームであるから、ここで分離クラスタマトリックスの作成は終了する。なお、この段階の分離クラスタマトリックスは初期値として、次の処理に用いられる。
次に、図8乃至図10を参照(適宜図1参照)して、図2におけるステップS15である再分割処理の詳細について説明する。
再分割処理は、図5に示した隣接クラスタマトリックス及び図7(c)に示した分離クラスタマトリックスを用いて、統合領域ごとにグラフカット処理を行うものである。
ここで、分割対象ペアの検出方法について説明する。
分割対象ペアを検出する条件は、図7(c)に示した分離クラスタマトリックスに登録されたクラスタ対であることである。すなわち、映像中の分離クラスタがある何れかのフレームにおいて互いに到達可能でないクラスタ対を分離対象ペアとして検出する。
ここでは、隣接クラスタマトリックスに登録されているクラスタ対であるクラスタC0とクラスタC2とのクラスタ対を選択することとする。
なお、ソースノード及びシンクノードとは、互いに分割される1対のノードのことであり、次工程の処理であるグラフカット処理S33において、これらのノード間を直接に接続するエッジ、及び/又は他のノードを経由して間接に接続されるエッジが切断される。
次に、クラスタ情報生成装置1は、再分割処理手段32によって、ステップS32で割当てたソースノード及びシンクノード間のグラフカット処理を行う(ステップS33)。
グラフカット処理は、ソースノード及びシンクノード間を直接及び/又は間接に接続するエッジを切断して、ソースノードに接続されるノードと、シンクノードに接続されるノードとに分割する際に、切断するエッジのエネルギーの総和が最小となる組み合わせのエッジを切断する手法である。ここで、エッジのエネルギーとは、例えば、式(1)で示したコスト関数で計算されるコストのことである。
図9に示すように、ソースノードとしてN0を、シンクノードとしてN2を割り当て、隣接するエッジをそのままソースノードとシンクノード間をつなぐエッジ(t−link)とする。グラフカット処理は、このソースノードとシンクノードとを与えることで、ソースノードに属するノード群とシンクノードに属するノード群の2つに分割するための切断方法について、それを最小コストで行う切断方法を得ることができるアルゴリズムを実装した処理である。各エッジのコストは、クラスタデータ記憶手段13に記憶されているグラフ化処理手段12による処理結果であるグラフデータを参照して用いることができる。
そのため、この場合は、切断方法CT1に従ってエッジE02,E12が切断され、この統合領域のグラフから、ノードN2が分断される。すなわち、この統合領域は、クラスタC0,C1,C3,C5,C4からなるクラスタ群と、クラスタC2からなるクラスタ群と、の2つの領域に分割される。
図10(a)は、ノードN2(クラスタC2)とノードN0,N1(クラスタC0,C1)との間のエッジE02,E12(図9参照)が切断された後の状態のグラフを示したものである。
分離クラスタマトリックス更新処理S34では、グラフカット処理S33によって再分割された結果に基づいて、図7(a)に示した分離クラスタマトリックスを更新する。すなわち、分離クラスタマトリックスに登録されたクラスタから、グラフカット処理S33により分断されたクラスタを除外する。
このとき、元の統合領域についてのデータから、クラスタC2についてのクラスタデータも削除するものとする。図3に示した映像例では、分割されるのはクラスタC2のみであるが、複数のクラスタがクラスタC2とともに分割される場合は、統合領域データからそれらのクラスタに関するデータも削除する。
これに伴い、分離クラスタマトリックスを2つに分割する。そして、分割された新たな統合領域についても、分割対象ペアが存在しなくなるまで順次に再分割処理が行われる。
一方、分割対象ペアが残存する場合は(ステップS35でYes)、ステップS30に戻って、クラスタ情報生成装置1は再分割処理手段32によって再分割処理を続ける。
これによって、この統合領域のグラフは、図11(a)に示すよう、統合処理直後の統合領域から、クラスタC2に加えて、更にクラスタC3が分断された状態となる。このグラフカット処理の結果に基づき、クラスタC2に加えて、クラスタC3に関するデータを削除する分離クラスタマトリックスの更新を行う(ステップS34)。その結果、分離クラスタマトリックスは、図11(b)に示すようになる。なお、図11(b)において、ハッチングを施した要素データが削除されたことを示している。
また、ピクセル単位での取り扱いではなく、過分割な状態にクラスタ化された領域を単位として、統合と再分割とを行って領域分割が成されるため、処理するデータ量は極めて小さくなり、インタラクティブなレスポンスが可能である。統合と再分割を行うことにより、均一なパラメータでは制御の難しかった領域の粒度を適応的に制御することができ、「同一の被写体領域はなるべく時空間的に大きく構成され」、「異なる被写体領域には同じ領域IDが割り振られない」ように領域分割することができる。
このような場合においても、特に時間方向への領域情報の継承のため、第2段階の統合処理に用いる色情報の閾値として、比較的に緩い設定とすることでその継承性を向上することが可能である。
本実施形態では、統合処理によって同一の領域に統合された異なる被写体領域を、再分割して被写体ごとの領域に適切に分割することができる。
本実施形態は、「同一の被写体領域はなるべく時空間的に大きく構成され」、「異なる被写体領域には同じ領域IDが割り振られない」ように、領域分割を行うことができる。
次に、実施例1として、抽象的な被写体の映像を入力映像として、クラスタ情報生成処理を行った結果について説明する。
図12は、実施例1で用いた映像であり、30個のフレームからなる映像の内の、第1フレームと、第10フレームと、第30フレームとを示したものである。映像中には、縦長の長方形の2つの被写体OBJ1、OBJ3が画面の中央付近に並置されており、これらの被写体OBJ1,OBJ3は静止している。また、これらの被写体OBJ1、OBJ3は、ともに被写体全域でほぼ一様な赤色をしている。なお、OBJ1については、中心部において、円形の被写体OBJ2よりも小さな一部の領域で、他の部分の赤色に極めて類似するが異なる色の分布となった部分を持っている。また、円形の被写体OBJ2は、被写体全域でほぼ一様な赤色をしており、被写体OBJ1と類似した色である。また、被写体OBJ2は、第1フレームから第30フレームにかけて、画面の左側から右側に向かって移動し、被写体OBJ1の背後を通過するものである。また、背景となる被写体OBJ4は、被写体全域が一様な黄色で経時変化はしない。
図13(a)は、第1段階の領域分割処理であるクラスタ化処理の結果示すものである。図13(a)は、クラスタごとに色分けした映像である領域ID(クラスタID)分布映像を示したものである。図13(a)において、異なるハッチングを施した領域は、異なるクラスタとして領域分割されていることを示す。この段階の領域分割では、被写体OBJ1が、縦方向に3つの領域に分割され、被写体OBJ2も独立した1つのクラスタとして領域分割されている。
次に、実施例2として、ビデオカメラを用いて撮影した映像を入力映像として、クラスタ情報生成処理を行った結果について説明する。
図14Aから図14Cは、実施例1で用いた映像であり、図14A、図14B及び図14Cは、74個のフレームからなる映像の内の、それぞれ第23フレーム、第27フレーム及び第31フレームを示したものである。この映像において、黒い服を着た人物が画面内を右から左に向かって歩いており、白い服を着た人物が画面内を左から右に向かって歩いており、両人物は画面の中央付近で、黒い服を着た人物が手前側となるように交差する。また、両者が交差する画面中央付近の背景には、黒っぽい色の樹木があり、何れも黒っぽい両人物の頭部が、背景の樹木と交差するフレームがある。また、両人物以外の背景は、ほぼ静止している。
図15Aは、第1段階の領域分割処理であるクラスタ化処理の結果示すものである。図15Aは、クラスタごとに色分けした映像である領域ID(クラスタID)分布映像を示したものである。色の濃さの異なる領域は、異なるクラスタとして領域分割されていることを示す。但し、原画像では、クラスタごとに色分けされているが、図15Aでは、白黒の階調画像に変換して示しているため、異なるクラスタに領域分割されているかどうか分かりにくい部分もある。なお、図15B及び図15Cも同様である。
図15Aに示すように、第1段階では、異なる被写体の領域が同じクラスタに領域分割されることがなく、人物のズボンや上着なども個々のクラスタからは元の形状が判別できない程度の過分割な状態に領域分割されていることが分かる。
図15Bに示すように、類似した色のクラスタが統合され、例えば、人物のズボンや上着などの領域のクラスタが大きく統合されているのが分かる。一方、図中に矢印で示した領域である人物の頭部、手前(右側)の人物の上着、及び背景の樹木について、色が互いに類似しており、かつ、映像中で交差するフレームがあるため、これらの異なる被写体の領域のクラスタが1つの領域に統合されている。
図15Cに示すように、クラスタ再分割処理により、図15Cに矢印で示した異なる被写体のクラスタが統合された領域が、被写体ごとに異なる領域に再分割されているのが分かる。また、人物のズボンなどは再び細かく過分割されることが抑制され、適切に再分割されていることが分かる。このため、特に手作業で被写体の領域指定を行うためには、より好適に領域分割されているのが分かる。
図16は、本実施形態である映像領域分割装置の機能構成を示すブロック図である。同図に示すように、映像領域分割装置100は、上述したクラスタ情報生成部1と、シード情報取得部2と、隣接項計算部3と、クラスタ平均画素数計算部4と、尤度項計算部5と、分割部6とを備える。
図17は、時空間分割されたクラスタに対するグラフを簡略化し模式的に表した図である。本実施形態におけるグラフは画像空間を時間方向に拡張した時空間の領域を対象とするものであるが、同図では、便宜上、時間方向を省略したクラスタを概念的に表している。同図において、グラフgは、時空間分割された各クラスタに対応したクラスタノードと、ソースノード(物体ノード)Sと、シンクノード(背景ノード)Tとを有する。クラスタノードには、物体シード(obj seed)として指定されたクラスタノードと、背景シード(bkg seed)として指定されたクラスタノードとが含まれる。隣接クラスタ間には、それぞれのクラスタを繋ぐエッジ(n−link)が設けられる。また、ソースノードと全てのクラスタそれぞれとの間には、それらを繋ぐエッジ(t−link)が設けられる。また、シンクノードと全てのクラスタそれぞれとの間には、それらを繋ぐエッジ(t−link)が設けられる。分割部6は、これらのエッジにコストを付与し、例えば、グラフ理論のアルゴリズムの一つであるmax−flowアルゴリズム(非特許文献1参照)を適用して、各クラスタがソースノードSまたはシンクノードTいずれかに属するように分割する。
m個のクラスタからなるクラスタ集合Pを、ユーザが指定する物体領域とそれ以外の背景領域とに分割する場合について説明する。各クラスタp∈Pに対して割り振るラベルのベクトルを、A={A1,A2,・・・,Am}とする。各Ap(p=1,2,3,・・・,m)は、物体“obj”または背景“bkg”いずれかのラベルである。また、クラスタpに隣接するクラスタ群をN、隣接クラスタをq∈Nとする。ここで、クラスタの振り分けにおいて生じるコストは、下記の式(2)のコスト関数E(A)として表される。
図21は、映像領域分割装置100の処理手順を示すフローチャートである。
ステップS101において、クラスタ情報生成部1は、映像を構成する画素を、時空間において複数のクラスタに分割し、これら複数のクラスタと各クラスタの代表色を示す色情報と隣接するクラスタを示すクラスタ隣接情報とを含むクラスタ情報を生成する。
Claims (4)
- 映像を構成する画素を、時空間において複数のクラスタに分割し、前記複数のクラスタと各クラスタの代表色を示す色情報と隣接するクラスタを示すクラスタ隣接情報とを含むクラスタ情報を生成するクラスタ情報生成部と、
特定のクラスタが物体または背景のいずれに属するかを示すシード情報を取得するシード情報取得部と、
前記クラスタ情報生成部が生成した前記クラスタ情報と前記シード情報取得部が取得した前記シード情報とに基づいて、クラスタが背景であることを前提としたクラスタの代表色の第1条件付き確率分布、およびクラスタが物体であることを前提としたクラスタの代表色の第2条件付き確率分布を求め、前記シード情報と前記第1条件付き確率分布と前記第2条件付き確率分布とに基づいて、あるクラスタと物体ノードとの間の第1コストおよび前記クラスタと背景ノードとの間の第2コストとを計算する尤度項計算部と、
前記クラスタ情報に基づいて、隣接するクラスタにおいて色の差が大きいほど低い第3コストを計算する隣接項計算部と、
各クラスタに対応するクラスタノードと物体に対応する物体ノードと背景に対応する背景ノードとを有し、前記クラスタノードと前記物体ノードとの間のエッジが前記第1コストに対応し、前記クラスタノードと前記背景ノードとの間のエッジが前記第2コストに対応し、隣接するクラスタノード間のエッジが前記第3コストに対応するグラフを、それぞれのクラスタノードが前記物体ノードまたは前記背景ノードのいずれか一方のみと連結になるように、グラフカット法によりコストが小さくなるよう二分する分割部と、
を備える映像領域分割装置であって、
前記クラスタ情報生成部は、
前記映像に属する前記画素を、映像中の異なる被写体が同一の領域として分割されない状態にある過分割クラスタに分割するクラスタ化処理部と、
前記クラスタ化処理部によって分割された前記過分割クラスタの代表色に基づいて隣接する前記過分割クラスタを統合クラスタとして統合する処理を行うクラスタ統合処理部と、
前記クラスタ統合処理部によって統合された前記統合クラスタを、異なる前記被写体に属する前記過分割クラスタが統合されているかどうかを判断するための所定の再分割条件に基づいて、前記過分割クラスタを単位として、前記再分割条件に該当する過分割クラスタ対が互いに異なる領域に属するよう再分割することによって前記クラスタとするクラスタ再分割処理部と、を備える、
映像領域分割装置。 - 前記再分割条件は、1つの前記統合クラスタに含まれる1対の前記過分割クラスタに関して、当該1対の前記過分割クラスタが空間的に2以上のクラスタ群に分離した状態のフレームにおいて、当該1対の前記過分割クラスタが当該統合クラスタに属する他の隣接過分割クラスタを順次に経由しても互いに到達可能ではない場合に当該1対の前記過分割クラスタが再分割されるものであることを表す条件である、
請求項1に記載の映像領域分割装置。 - 映像を構成する画素を、時空間において複数のクラスタに分割し、前記複数のクラスタと各クラスタの代表色を示す色情報と隣接するクラスタを示すクラスタ隣接情報とを含むクラスタ情報を生成するクラスタ情報生成部と、
特定のクラスタが物体または背景のいずれに属するかを示すシード情報を取得するシード情報取得部と、
前記クラスタ情報生成部が生成した前記クラスタ情報と前記シード情報取得部が取得した前記シード情報とに基づいて、クラスタが背景であることを前提としたクラスタの代表色の第1条件付き確率分布、およびクラスタが物体であることを前提としたクラスタの代表色の第2条件付き確率分布を求め、前記シード情報と前記第1条件付き確率分布と前記第2条件付き確率分布とに基づいて、あるクラスタと物体ノードとの間の第1コストおよび前記クラスタと背景ノードとの間の第2コストとを計算する尤度項計算部と、
前記クラスタ情報に基づいて、隣接するクラスタにおいて色の差が大きいほど低い第3コストを計算する隣接項計算部と、
各クラスタに対応するクラスタノードと物体に対応する物体ノードと背景に対応する背景ノードとを有し、前記クラスタノードと前記物体ノードとの間のエッジが前記第1コストに対応し、前記クラスタノードと前記背景ノードとの間のエッジが前記第2コストに対応し、隣接するクラスタノード間のエッジが前記第3コストに対応するグラフを、それぞれのクラスタノードが前記物体ノードまたは前記背景ノードのいずれか一方のみと連結になるように、グラフカット法によりコストが小さくなるよう二分する分割部と、
前記クラスタ情報に基づいて、クラスタごとのフレームあたりのクラスタ平均画素数を計算するクラスタ平均画素数計算部と、
を備える映像領域分割装置であって、
前記尤度項計算部は、前記クラスタ平均画素数計算部が計算した前記クラスタ平均画素数によって重み付けて前記第1コストおよび前記第2コストを計算する、
映像領域分割装置。 - コンピュータを、
請求項1から3までのいずれか一項に記載の映像領域分割装置
として機能させるための映像領域分割プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013264623A JP6448109B2 (ja) | 2013-12-20 | 2013-12-20 | 映像領域分割装置および映像領域分割プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013264623A JP6448109B2 (ja) | 2013-12-20 | 2013-12-20 | 映像領域分割装置および映像領域分割プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015121901A JP2015121901A (ja) | 2015-07-02 |
JP6448109B2 true JP6448109B2 (ja) | 2019-01-09 |
Family
ID=53533469
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013264623A Expired - Fee Related JP6448109B2 (ja) | 2013-12-20 | 2013-12-20 | 映像領域分割装置および映像領域分割プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6448109B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105208398B (zh) * | 2015-09-22 | 2018-06-19 | 西南交通大学 | 一种获取道路实时背景图的方法 |
JP6336952B2 (ja) * | 2015-09-30 | 2018-06-06 | セコム株式会社 | 群衆解析装置 |
JP2017126304A (ja) * | 2016-01-15 | 2017-07-20 | 富士ゼロックス株式会社 | 画像処理装置、画像処理方法、画像処理システムおよびプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004178569A (ja) * | 2002-11-12 | 2004-06-24 | Matsushita Electric Ind Co Ltd | データ分類装置、物体認識装置、データ分類方法及び物体認識方法 |
JP2006190188A (ja) * | 2005-01-07 | 2006-07-20 | Toyota Motor Corp | 領域分割方法 |
-
2013
- 2013-12-20 JP JP2013264623A patent/JP6448109B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2015121901A (ja) | 2015-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6458394B2 (ja) | 対象追跡方法及び対象追跡装置 | |
Bauer et al. | The potential of automatic methods of classification to identify leaf diseases from multispectral images | |
Ta et al. | Graph-based tools for microscopic cellular image segmentation | |
JP2021512446A (ja) | 画像処理方法、電子機器および記憶媒体 | |
JP6497579B2 (ja) | 画像合成システム、画像合成方法、画像合成プログラム | |
US10957055B2 (en) | Methods and systems of searching for an object in a video stream | |
Ranganathan | Real life human movement realization in multimodal group communication using depth map information and machine learning | |
AU2018267620A1 (en) | Method and system for unsupervised image segmentation using a trained quality metric | |
Arunachalam et al. | Computer aided image segmentation and classification for viable and non-viable tumor identification in osteosarcoma | |
JP5965764B2 (ja) | 映像領域分割装置及び映像領域分割プログラム | |
JP6624877B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
Venkatesan et al. | Face recognition system with genetic algorithm and ANT colony optimization | |
CN108320281B (zh) | 一种基于多特征扩散的图像显著性检测方法及终端 | |
JP6448109B2 (ja) | 映像領域分割装置および映像領域分割プログラム | |
Wu et al. | Video saliency prediction with optimized optical flow and gravity center bias | |
Borovec et al. | Fully automatic segmentation of stained histological cuts | |
CN104766068A (zh) | 一种多规则融合的随机游走舌像提取方法 | |
Teixeira et al. | Object segmentation using background modelling and cascaded change detection | |
CN106022310B (zh) | 基于htg-hog和stg特征的人体行为识别方法 | |
Nguyen et al. | An efficient combination of RGB and depth for background subtraction | |
Bravo-Reyna et al. | Recognition of the damage caused by the cogollero worm to the corn plant, Using artificial vision | |
Fuad et al. | A review on methods of identifying and counting aedes aegypti larvae using image segmentation technique | |
Wang et al. | Image segmentation incorporating double-mask via graph cuts | |
Lin et al. | Foreground object detection in highly dynamic scenes using saliency | |
JP4750758B2 (ja) | 注目領域抽出方法、注目領域抽出装置、コンピュータプログラム、及び、記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161031 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170908 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171003 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180424 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180621 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20181026 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181203 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6448109 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |