JP6468580B2 - スーパーピクセルライフサイクル管理のための方法 - Google Patents

スーパーピクセルライフサイクル管理のための方法 Download PDF

Info

Publication number
JP6468580B2
JP6468580B2 JP2013236831A JP2013236831A JP6468580B2 JP 6468580 B2 JP6468580 B2 JP 6468580B2 JP 2013236831 A JP2013236831 A JP 2013236831A JP 2013236831 A JP2013236831 A JP 2013236831A JP 6468580 B2 JP6468580 B2 JP 6468580B2
Authority
JP
Japan
Prior art keywords
superpixel
frame
superpixels
frames
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013236831A
Other languages
English (en)
Other versions
JP2014099178A (ja
JP2014099178A5 (ja
Inventor
レゾ マティアス
レゾ マティアス
ジャカルスキー ヨエルン
ジャカルスキー ヨエルン
ローゼンハン ボーデ
ローゼンハン ボーデ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP13305157.3A external-priority patent/EP2765556A1/en
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2014099178A publication Critical patent/JP2014099178A/ja
Publication of JP2014099178A5 publication Critical patent/JP2014099178A5/ja
Application granted granted Critical
Publication of JP6468580B2 publication Critical patent/JP6468580B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/174Segmentation; Edge detection involving the use of two or more images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Control Of Indicators Other Than Cathode Ray Tubes (AREA)

Description

本発明は、ビデオシーケンス用の時間的に整合性のあるスーパーピクセルを生成する方法および装置に関する。より詳細には、本発明は、一連のフレームのうちのフレームに関連するスーパーピクセルに関するライフサイクル管理に対処する。
スーパーピクセルアルゴリズムは、セグメンテーション、イメージ解析、分類などの、多種多様なコンピュータビジョンアプリケーションのための、非常に有用で、ますます普及している前処理ステップを表す。類似のピクセルをいわゆるスーパーピクセルにグループ化することは、イメージプリミティブの大きな削減となる。この結果、後続の処理ステップに関する計算効率が向上し、ピクセルレベルでは計算上実現不可能なより複雑なアルゴリズムが可能となり、領域ベースの特徴に関する空間サポートを生み出す。
スーパーピクセルアルゴリズムは、ピクセルをスーパーピクセルとしてグループ化する。スーパーピクセルはローカル、コヒーレントであり、注目のスケールでのセグメンテーションに必要な構造の大部分を保持する(例えば、非特許文献1参照。)。上記の文書でさらに明記されているように、スーパーピクセルは、サイズおよび形状において大まかに均質であるべきである。多くのスーパーピクセル方法が主に静止画像を対象としており、したがってビデオシーケンスに対して適用されたときに、限定された時間的整合性を提供するだけであり、または全く時間的整合性を提供しないが、一部の方法はビデオシーケンスを対象とする(例えば、非特許文献2〜5参照。)。これらの方法は、時間的整合性の問題に対処し始める。
X.Ren他、"Learning a classification model for segmentation"、IEEE International Conference on Computer Vision(ICCV)2003、10〜17頁 O.Veksler他、"Superpixels and Supervoxels in an Energy Optimization Framework"、in Computer Vision − ECCV 2010、vol.6315 K.Daniilidis他、Eds.Springer Berlin/Heidelberg 2010、211〜224頁 A.Levinshtein他、"Spatiotemporal Closure"、in Computer Vision − ACCV 2010、vol.6492 R.Kimmel他、Eds.Springer Berlin/Heidelberg 2011、369〜382頁 R.Achanta他、"SLIC superpixels compared to state-of-The-art superpixel methods"、IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.34(2012)、2274〜2282頁 G.Zeng他、"Structure-sensitive superpixels via geodesic distance"、2011 IEEE International Conference on Computer Vision(ICCV)、447〜454頁 C.L.Zitnick他、"Stereo for image-based rendering using image over-segmentation"、International Journal of Computer Vision, Vol.75(2007)、49〜65頁
本発明の目的は、一連のフレームのうちのフレームに関連する、時間的に整合性のあるスーパーピクセルの処理をさらに改善することである。
本発明によれば、一連のフレームのうちのフレームに関連するスーパーピクセルのライフサイクル管理のための方法が、
スーパーピクセルの面積が指定された第1の値よりも小さくなった場合、フレーム内のスーパーピクセルを終了するステップと、
スーパーピクセルの面積が指定された第2の値よりも大きくなった場合、フレーム内のスーパーピクセルを分離するステップと、
を含む。
したがって、一連のフレームのうちのフレームに関連するスーパーピクセルのライフサイクル管理のための装置が、
スーパーピクセルの面積が指定された第1の値よりも小さくなった場合、フレーム内のスーパーピクセルを終了するように構成された終了ユニットと、
スーパーピクセルの面積が指定された第2の値よりも大きくなった場合、フレーム内のスーパーピクセルを分離するように構成された分離ユニットと、
を備える。
同様に、コンピュータ可読記憶媒体が、一連のフレームのうちのフレームに関連するスーパーピクセルのライフサイクル管理をイネーブルする命令をその中に格納しており、命令は、コンピュータによって実行されるとき、コンピュータに、
スーパーピクセルの面積が指定された第1の値よりも小さくなった場合、フレーム内のスーパーピクセルを終了させ、
スーパーピクセルの面積が指定された第2の値よりも大きくなった場合、フレーム内のスーパーピクセルを分離させる。
本発明によれば、寿命、すなわち持続時間が、ビデオシーケンスについて生成される、時間的に整合性のあるスーパーピクセルについて決定される。サイズ制約および形状制約に違反することなく持続時間が最大化される。一般には、本発明は、大きくなり過ぎるスーパーピクセルが分離され、小さくなり過ぎるスーパーピクセルが終了するので、時間的に整合性のあるスーパーピクセルの均質なサイズを保証する。最大化された持続時間は、スーパーピクセルの追従を改善し、それにより、より良好なシーンおよびシーケンス理解が得られる。好ましくは、分離数と終了数の平衡が保たれ、したがってビデオフレーム当たりのスーパーピクセル数が本質的に一定に保たれる。スーパーピクセルを分離または終了する判断は、ビデオボリュームに沿ってシフトされるスライディングウィンドウ内部のスーパーピクセルの解析から得られる情報に基づく。
有利には、誤りのある時間的整合性を有するスーパーピクセルを検出および訂正するために、方法は、
第1のフレーム内のスーパーピクセルのインスタンスと、一連のフレームのうちの後のフレーム内のスーパーピクセルのインスタンスとの間の類似性を決定するステップと、
決定された類似性を閾値と比較するステップと、
類似性が閾値未満である場合、後続のフレーム内のスーパーピクセルを、新しい時間的に整合性のあるスーパーピクセルで置き換えるステップと、
をさらに含む。
したがって、好都合には、装置は、
第1のフレーム内のスーパーピクセルのインスタンスと、一連のフレームのうちの後のフレーム内のスーパーピクセルのインスタンスとの間の類似性を決定するように構成された決定部と、
求めた類似性を閾値と比較するように構成された比較部と、
類似性が閾値未満である場合、後続のフレーム内のスーパーピクセルを、新しい時間的に整合性のあるスーパーピクセルで置き換えるように構成された置換部と、
をさらに備える。
スライディングウィンドウ内の時間的に整合性のあるスーパーピクセルのインスタンスに関する類似性チェックが導入される。スライディングウィンドウ内の時間的に整合性のあるスーパーピクセルの2つまたはさらに多くのインスタンス間の類似性が決定される。それがある閾値未満である場合、スライディングウィンドウのすべての将来のフレーム内のスーパーピクセルのインスタンスが、第1の将来のフレームで開始する新しい時間的に整合性のあるスーパーピクセルのインスタンスで置き換えられる。この方法は、オプティカルフローが後続のフレームへの十分に信頼性の高い投射をし損なう場合に引き起こされる可能性のある、誤りのある時間的整合性を有するスーパーピクセルに関する検出およびスタートオーバ戦略(detection and start over strategy)を提供する。さらに、それは、ビデオボリュームの急激で破壊的な変化があった場合、スタートオーバへの道を提供する。したがって、それは、誤って時間的に整合性があるとみなされるスーパーピクセルによる後続の処理ステップに対して引き起こされる歪みを最小限に抑える。それによって、それは、信頼性の高い時間的整合性を有するスーパーピクセルのフローを増強する。
より良い理解のために、次に図を参照しながら以下の説明において本発明がより詳細に説明される。本発明がこの例示的な実施形態に限定されないこと、および添付の特許請求の範囲で定義される本発明の範囲から逸脱することなく、特定の特徴を適宜組み合わせ、および/または修正することもできることを理解されたい。
スライディングウィンドウ方法を示す図である。 いわゆるデスクシーケンスのイメージ5を示す図である。 いわゆるデスクシーケンスのイメージ40を示す図である。 ライフサイクル管理を使用する図2のイメージに関する輪郭線イメージおよびセグメントマップを示す図である。 ライフサイクル管理のない図2のイメージに関する輪郭線イメージおよびセグメントマップを示す図である。 ライフサイクル管理を使用する図3のイメージに関する輪郭線イメージおよびセグメントマップを示す図である。 ライフサイクル管理のない図3のイメージに関する輪郭線イメージおよびセグメントマップを示す図である。 スーパーピクセルのライフサイクルを管理する方法の実装を概略的に示す図である。 誤りのある時間的整合性を有するスーパーピクセルを検出および訂正する方法を概略的に示す図である。 図8および図9の方法を実装するように構成された装置を示す図である。
以下では、統一された観点からエネルギーを最小限に抑えるクラスタリングに基づくスーパーピクセルの作成についての簡単な考察が与えられる。それは、非特許文献6〜8に記載されている方法に基づく。3つの方法は、スーパーピクセルの生成をクラスタリング問題として考える。イメージピクセルは、各次元がピクセルの色チャネルまたはイメージ座標に対応する多次元空間内のデータ点として見える。スーパーピクセルは、この多次元空間内のクラスタによって表され、各データ点は1つのクラスタにのみ割り当てることができる。このデータ点割当てはオーバーセグメンテーションを決定する。
こうした方法を一般化するために、クラスタk∈Kに割り当てられるべきすべてのn∈Nデータ点について必要なエネルギーE(n,k)を合計する、エネルギー関数Etotalが定義される。
上式で、Nは全ピクセル数であり、関数s(・)は、データ点が現在割り当てられているクラスタのラベルkを返す。所与のクラスタ数Kについて、Etotalを最小限に抑えるクラスタのコンステレーションを見つけることにより、エネルギーに関する最適なオーバーセグメンテーションを生成することができる。3つの方法は主に、エネルギー項E(n,k)の定義が異なる。
全エネルギー関数Etotalを最小限に抑えるために、方法は、局所的に最適な解に収束する反復的なロイドのアルゴリズムを使用する。グリッド状初期化後に、各反復が、割当てステップおよび更新ステップの2つのステップで実施される。割当てステップでは、各データ点が、エネルギー項がその最小値を有するクラスタに割り当てられる。こうした割当てに基づいて、クラスタ中心パラメータが更新ステップで再推定される。こうした2つのステップの反復は、割当てステップの変化なしが検出されるまで、または最大反復回数が実施されるまで続行される。
非特許文献8によって説明される方法は、クラスタ内のデータ点の分散を、平均ベクトルμおよび共分散行列Σを有する多変量ガウス分布としてモデル化する。エネルギー項は、クラスタkに属するデータ点nの確率に反比例するように定義される。
イメージピクセルの色および位置の分布は、統計的に独立していると仮定される。したがって、同時確率分布を、2つのガウス分布(1つが色について、1つが空間範囲について)の乗算に分解することができる。反復的な最適化方式において、色空間内の共分散行列が固定に保たれ、空間範囲に関する共分散行列が、各反復で更新される。
上記のアルゴリズムの簡易版が、非特許文献6によって提示され、SLICスーパーピクセルと呼ばれる。非特許文献8による方法とは対照的に、色および空間範囲に関する固定の共分散行列が仮定され、その主対角線の外側の要素は0である。さらに、色次元に関する分散は等しく、ならびに空間範囲に関する分散は等しい。固定された共分散を省略することができるので、ガウス分布の平均のみが問題である。これにより、データ点nとクラスタkの中心との間の距離D(n,k)に正比例するエネルギー項E(n,k)が得られる。
非特許文献6では、以下のデータ点nとクラスタkの中心との間の距離D(n,k)が導入される。
上式で、dlab(n,k)およびdxy(n,k)は、それぞれCIELAB色空間および像平面内のユークリッド距離である。
であるとして、スケール化係数m/Sは、2つの距離の、その最大振幅に対する正規化によるものである。ユーザが定義するパラメータmは、構造感度と、生成されるスーパーピクセルの密集度との兼ね合いを制御する。
非特許文献7では、エネルギー関数Etotalが、トレードオフ係数λによって重み付けされた2つのエネルギー項に分離され、トレードオフ係数λの機能は、式(4)中のmと同様である。第1のエネルギー項は、データ点と、その割り当てられたクラスタkの中心との間の測地的距離に依存し、第2の項は、平均面積から面積が外れるクラスタ、したがってスーパーピクセルにペナルティを与える。
測地的距離を使用することは、非特許文献6で使用されている直接的なピクセル比較と比べて、経路に沿って色偏差にペナルティを与えることを可能にする。
スーパーピクセルの空間範囲が事前に限定されるので、割当てステップでは、各クラスタ中心の周りの限定された探索ウィンドウ内だけでピクセルを探索することで十分である。これにより、計算の複雑さが著しく低減される。得られるセグメントの空間的接続性を実施するために、後処理ステップが、対応するスーパーピクセルの主な質量に接続されない分離割合を、その最も近い、直接的に接続された近隣に割り当てる。
時間的に整合性のあるスーパーピクセルに関する改良型の方法が、本発明者らによって最近開発された。それは、非特許文献6のSLICスーパーピクセルに触発されたものである。しかし、短時間整合性を好む非特許文献6のスーパーボクセル方法について行われるように、ビデオボリューム内のクラスタリングに関する時間的距離を導入する代わりに、スーパーピクセルに関する元の5D特徴空間が、複数のフレームを含むグローバル色部分空間と、フレームレベルのローカル空間部分空間とに分離される。この概念は、色クラスタリングがグローバルに行われ、空間クラスタリングがローカルに行われることである。したがって、それぞれの時間的に整合性のあるスーパーピクセルは、範囲内のすべてのフレームについて単一の統一された色中心を有し、各フレームについて別々の空間中心を有する。後者はフレームレベルにおいて空間的局所性を保持し、前者は時間的整合性を保証する。この方法は、ほとんどの場合、シーン内の色は急激には変化しないという観察によって動機付けされる。したがって、合致するイメージ領域の色、したがって関連するスーパーピクセルの平均色は、第1の近似では、複数のフレームにわたってほぼ一定である。対照的に、位置は、シーン内の動きに応じて著しく変動する可能性がある。
ビデオシーケンスに関する時間的に整合性のあるスーパーピクセルの生成のために、W個の連続するフレームを含むスライディングウィンドウが、フレームごとにビデオボリュームに沿ってシフトされる。W=5個の連続するフレームを含むスライディングウィンドウの視覚化が図1に示されている。フレームtが現フレームであり、図示される例では、スライディングウィンドウの中心にある。このフレームについて、スーパーピクセルを生成すべきである。前フレームt−1およびt−2はいわゆる過去フレームである。そのスーパーピクセルセグメンテーションが固定され、もはや変更されない。しかし、それらはスライディングウィンドウ内部にあるので、そのスーパーピクセルセグメンテーションは、最適化方式の各反復で更新されるグローバル色中心を通じて、現フレームならびに将来フレームにおけるスーパーピクセル生成に影響を及ぼす。スライディングウィンドウ内の将来フレーム、すなわち図示する例ではt+1およびt+2も、現フレームでのスーパーピクセル生成に対する影響を有する。しかし、過去フレームとは対照的に、そのスーパーピクセルセグメンテーションは固定されず、したがって各反復で変化する可能性がある。将来フレームは、シーンの変化に適応する助けとなるのに対して、過去フレームは保守的であり、見つかったグローバル色中心を保存するように試みる。好ましくは、将来フレーム数Fおよび過去フレーム数Pは、W=F+P+1とともに、ユーザによって指定され、非対称でもよい。将来フレーム数を超えて使用される過去フレーム数が多いほど、色中心の更新はより保守的になる。過去フレーム数を超えて使用される将来フレーム数が多いほど、更新がより適応的になる。スライディングウィンドウが前方にシフトされるとき、スライディングウィンドウを去るフレームの結果が保存され、スライディングウィンドウに入る新しいフレームが読み込まれる。
初期化として、最新のフレームの空間中心が、スライディングウィンドウに入る新しいフレームに投射される。この中心に割り当てられたすべてのピクセルにわたって計算された、密なオプティカルフローの重み付き平均が使用される。中心の投射はまた、探索ウィンドウを初期化し、これは複雑さを低減するのに重要である。このスライディングウィンドウ方法では、提案されるスーパーピクセルアルゴリズムは、ビデオボリュームにおける変化に適応する。
一般には、生成されるスーパーピクセルは、時間的に整合するだけではなく、ビデオボリューム内の最大寿命も有するべきである。後者は、経時的に、時間的に整合性のあるスーパーピクセルの良好な識別を可能にし、長期追従への第1のステップである。
ビデオコンテンツに対するスーパーピクセル生成の適応により、いくぶん均質なサイズという制約を破る傾向のある、安定して収縮または成長するスーパーピクセルが可能となる。したがって、スーパーピクセルを終了すべきとき、またはそれを分離する必要があるときを判断しなければならない。これは、時間的に整合性のあるスーパーピクセルのライフサイクル管理と呼ばれる。この方法では、このことが、スーパーピクセルがスライディングウィンドウのフレーム内を占めるピクセルエリアをトレースすることによって達成される。したがって、終了条件および分離条件が定義され、それが以下で説明される。
面積の減少は、収縮するスーパーピクセルに関するスライディングウィンドウでは線形であると仮定される。この仮定に基づいて、以下の終了条件が作成される。
A(k,t+F)+ρ・ΔA(k)≦0 (6)
上式で、A(k,t+F)は、スライディングウィンドウの最後の将来フレームt+F内のスーパーピクセルkの面積であり、ΔA(k)は、スーパーピクセルkに関するエリアの傾きであり、ρは、終了を実施または延期することのできる、ユーザが選択した重み付けするパラメータである。F>1に関する傾きΔA(k)は以下のように計算される。
原理上は、複数の将来フレームからのエリアサンプルを使用してΔA(k)を計算することができる。スーパーピクセルの終了は、最終的には以下のように行われる。終了するスーパーピクセルの空間中心が、スライディングウィンドウの最後のフレーム、すなわちフレームt+Fから除去される。結果として、このフレームが現フレームとなったとき、このスーパーピクセルにピクセルは割り当てられない。その代わり、このスーパーピクセルに以前に割り当てられたピクセルが、隣接するスーパーピクセルに割り当てられる。以下で説明する例では、2つの将来フレーム、すなわちF=2、およびρ=2が使用される。
F=1である場合、将来フレームおよび現フレームのみを使用してΔA(k)を計算することができる。
無限の成長を防止するために、以下の分離条件が定義される。
上式で、
は目標とする平均スーパーピクセルサイズであり、νは、平均サイズからの許容される最大偏差を制御する、ユーザが選択したパラメータであり、ρは、分離を実施または延期することのできる、ユーザが選択した重み付けするパラメータである。以下で論じられる例では、ν=1.5およびρ=0である。
分離条件がスーパーピクセルについて合致した場合、これを置き換える2つの新しいスーパーピクセルが生成される。置換は最新のフレームで行われる。スーパーピクセルのグローバル色中心がコピーされる間、2つの新しい空間中心が、スーパーピクセルの最大の固有ベクトルに沿って逆方向にシフトされる。
フレーム当たりのスーパーピクセル数はユーザが定義した値Kと常に合致するので、スーパーピクセルバランシングと呼ばれるライフサイクル管理の最後の処理ステップが、終了および分離後に適用される。スーパーピクセル数の平衡を保つために、終了数τと分離数σの差δは常に0となるべきである。
δ=τ−σ (9)
式(9)の差δが正である場合、最大のδ個のスーパーピクセルが、上述と同様に分離される。同様に、δが負である場合、最小のδ個のスーパーピクセルが終了する。δが偶然0であった場合、システムは既に平衡状態である。
ある場合には、オプティカルフローがイメージ領域について欠乏し、前フレーム内のスーパーピクセルによってカバーされるイメージ内容が、投射される探索ウィンドウ内にもはやない。さらに、ビデオボリュームにおける急激で破壊的な変化がある可能性もある。そうした稀なケースに対して方法を強固なものとするために、スタートオーバを開始することが最良である。したがって、有利には、ライフサイクル管理が追加のスタートオーバ条件で補足される。スーパーピクセルが現フレームについて生成された後、類似性チェックが適用される。
この目的で、それぞれの時間的に整合性のあるスーパーピクセルの2つのインスタンスが、類似性についてチェックされ、一方のインスタンスはフレームt+F、すなわちスライディングウィンドウの最後のフレームであり、他方のインスタンスは、フレームt−P、すなわちスライディングウィンドウの第1のフレームである。この類似性チェックについて、ヒストグラム比較(例えばχ2検定)、特徴、および/または記述子マッチング、色差などの異なるオプションが可能である。
そのような類似性チェックの1つの実現は、以下の観測に基づく。一般に、そうしたケースでは、スライディングウィンドウの第1のフレームt−Pと最後のフレームt+F内のスーパーピクセルkの平均色の著しい違いがある。平均色間のユークリッド距離が閾値Γよりも大きく異なる場合、スーパーピクセルkが、フレームt+1、すなわち第1の将来フレームから始まる新しいスーパーピクセルにより置き換えられる。それによって、ローカル空間中心が保たれ、新しいグローバル色中心が導入される。フレームt+Fについて、置き換えられたスーパーピクセルkの平均色により新しい色中心が初期化される。CIELABについて、色空間Γ=30が誤り検出と保持との間の良好な平衡を与えることが判明した。
スライディングウィンドウ方法の中で、基本的には、上述の反復的最適化手順をクラスタリングについて維持することができる。スライディングウィンドウの各現フレームについて、何回かのI回の反復が実施され、割当てステップおよび更新ステップが適用される。割当てステップでは、スライディングウィンドウの各フレーム内の各ピクセルについて、式(4)を使用してスーパーピクセル中心までの距離が計算される。色距離dlabは、グローバル色中心までのユークリッド距離であり、dxyは、フレームレベルにおけるローカル空間中心までの距離である。更新ステップでは、このスーパーピクセルに割り当てられるスライディングウィンドウのすべてのフレーム内のピクセルの色値を使用して、新しいグローバル色中心が計算される。対応するフレーム内のこのスーパーピクセルに割り当てられるピクセルのイメージ座標のみを使用して、空間中心がフレームごとに更新される。
始めは、スライディングウィンドウは空である。スライディングウィンドウに入るビデオシーケンスの第1のフレームが、シード摂動を含むグリッド状構造内のクラスタ中心をシーディングすることによって初期化される。このフレームは索引t+Fに配置される。ビデオシーケンスの残りのフレームは、上述のように初期化される。提案されるスライディングウィンドウ方法では、時間的に整合性のあるスーパーピクセルに関するこのアルゴリズムはストリーミングも可能であり、したがって原理上はリアルタイム処理をイネーブルすることに触れておく。
以下では、ライフサイクル管理(LCM)の利点を示す例が与えられる。図2および3は、ビデオシーケンスからの2つのイメージ、すなわちいわゆるデスクシーケンスのイメージ5および40をそれぞれ示す。図4および5は、ライフサイクル管理と共に(図4)、およびライフサイクル管理なしで(図4)生成されたデスクシーケンスのイメージ5に関する等高線図(左側)およびセグメントマップを示す。図6および7は、ライフサイクル管理と共に(図6)、およびライフサイクル管理なしで(図7)生成されたデスクシーケンスのイメージ40に関する輪郭線イメージおよびセグメントマップを示す。シーケンスの先頭での結果、すなわちイメージ5に関する結果はほぼ同一であるが、イメージ40に関する2つのバージョンの間の違いは、特に輪郭線イメージおよびセグメントマップの左側および右側で明らかである。
上記で提示されたライフサイクル管理の定量的分析に加えて、以下では、いくつかの定量化結果が示される。これについて、面積の分散(VoA)ならびに平均等周商(mean iso−perimetric quotient)Qが使用される。面積の分散は、サイズの均質性に関する指標であり、平均面積によって正規化されるスーパーピクセルの面積の分散として計算される。スーパーピクセルkの等周商Qは、円に対する類似性に関する尺度であり、したがって密集度に関する尺度である。それは以下のように計算され、ただしL(k)は外周であり、A(k)はスーパーピクセルkの面積である。
以下の表1は、k=512個のスーパーピクセルを使用してデスクシーケンスについて生成された結果を示す。ライフサイクル管理がない場合、面積の分散が著しく高くなり、一方Qは同一であることは明らかである。以下の結果は、シーケンスのすべてのフレームにわたる平均である。
図8は、スーパーピクセルのライフサイクルを管理する方法の実装を概略的に示す。任意選択の第1のステップでは、フレームのシーケンスの現フレームと後のフレームとの間のスーパーピクセルによって占められる面積の変化が決定される(1)。スーパーピクセルの面積が指定の第1の値よりも小さくなった場合、スーパーピクセルは後のフレームにおいて終了する(2)。スーパーピクセルの面積が指定の第2の値よりも大きくなった場合、スーパーピクセルは後のフレームにおいて分離される(3)。
図9は、ライフサイクル管理の更なる特徴、すなわち誤りのある時間的整合性を有するスーパーピクセルを検出および訂正する方法を概略的に示す。第1のフレーム内のスーパーピクセルのインスタンスと、一連のフレームのうちの後のフレーム内のスーパーピクセルのインスタンスとの間の類似性が決定される(4)。次いで、決定された類似性が閾値と比較される(5)。類似性が閾値未満である場合、スーパーピクセルが、後続のフレーム内の新しい時間的に整合性のあるスーパーピクセルにより置き換えられる(6)。
図8および図9の方法を実施するように構成された装置10が、図10に概略的に示されている。装置10は、一連のフレームを受け取る入力と、受信したフレームに関するスーパーピクセルを生成する処理部12とを有する。比較部13が、フレームのシーケンスの現フレームと後のフレームとの間のスーパーピクセルによって占められる面積の変化を決定する(1)ように構成される。終了部14が、スーパーピクセルの面積が指定の第1の値よりも小さくなった場合、後のフレームにおいてスーパーピクセルを終了する(2)ように構成される。さらに、分離部15が、スーパーピクセルの面積が指定の第2の値よりも大きくなった場合、後のフレームにおいてスーパーピクセルを分離する(3)ように構成される。好ましくは、装置10は、第1のフレーム内のスーパーピクセルのインスタンスと、一連のフレームのうちの後のフレーム内のスーパーピクセルのインスタンスとの間の類似性を決定する(4)ように構成された決定部16をさらに備える。別の比較部17が、求めた類似性を閾値と比較する(5)ように構成される。類似性が閾値未満である場合、後続のフレーム内のスーパーピクセルを、新しい時間的に整合性のあるスーパーピクセルで置き換える(6)ように構成される置換部18がさらに設けられる。いずれの場合も、得られるスーパーピクセルが、出力19を介して出力される。もちろん、様々な要素のうちの2つ以上を同様に単一の要素として組み合わせることができる。
ここで例としていくつかの付記を記載する。
(付記1)
一連のフレームのうちのフレームに関連するスーパーピクセルのライフサイクル管理のための方法であって、
前記スーパーピクセルの面積が指定された第1の値よりも小さくなった場合、フレーム内の前記スーパーピクセルを終了するステップ(2)と、
前記スーパーピクセルの前記面積が指定された第2の値よりも大きくなった場合、前記フレーム内の前記スーパーピクセルを分離するステップ(3)と、
を含む、前記方法。
(付記2)
フレーム当たりのスーパーピクセル数を本質的に一定に保つために、スーパーピクセルの終了数とスーパーピクセルの分離数の平衡を取るステップをさらに含む、付記1に記載の方法。
(付記3)
第1のフレーム内の前記スーパーピクセルのインスタンスと、前記一連のフレームのうちの後のフレーム内の前記スーパーピクセルのインスタンスとの間の類似性を求めるステップ(4)と、
前記決定された類似性を閾値と比較するステップ(5)と、
前記類似性が前記閾値未満である場合、後続のフレーム内の前記スーパーピクセルを、新しい時間的に整合性のあるスーパーピクセルにより置き換えるステップ(6)と、
をさらに含む、付記1または2に記載の方法。
(付記4)
一連のフレームのうちのフレームに関連するスーパーピクセルのライフサイクル管理のための装置(10)であって、
前記スーパーピクセルの面積が指定された第1の値よりも小さくなった場合、フレーム内の前記スーパーピクセルを終了する(2)ように構成された終了部(14)と、
前記スーパーピクセルの前記面積が指定された第2の値よりも大きくなった場合、前記フレーム内の前記スーパーピクセルを分離する(3)ように構成された分離部(15)と、
を備えることを特徴とする、前記装置(10)。
(付記5)
第1のフレーム内の前記スーパーピクセルのインスタンスと、前記一連のフレームのうちの後のフレーム内の前記スーパーピクセルのインスタンスとの間の類似性を求める(4)ように構成された決定部(17)と、
前記決定された類似性を閾値と比較する(5)ように構成された比較部(18)と、
前記類似性が前記閾値未満である場合、後続のフレームにおいて前記スーパーピクセルを、新しい時間的に整合性のあるスーパーピクセルにより置き換える(6)ように構成された置換ユニット(19)と、
をさらに備える、付記4に記載の装置(10)。
(付記6)
一連のフレームのうちのフレームに関連するスーパーピクセルのライフサイクル管理をイネーブルする命令をその中に格納しているコンピュータ可読記憶媒体であって、前記命令は、コンピュータによって実行されるとき、前記コンピュータに、
前記スーパーピクセルの面積が指定された第1の値よりも小さくなった場合、フレーム内の前記スーパーピクセルを終了させ(2)、
前記スーパーピクセルの前記面積が指定された第2の値よりも大きくなった場合、前記フレーム内の前記スーパーピクセルを分離させる(3)、前記コンピュータ可読記憶媒体。

Claims (5)

  1. 一連のフレームのうちのフレームに関連するスーパーピクセルのライフサイクル管理のための方法であって、
    前記スーパーピクセルの面積が指定された第1の値よりも小さくなった場合、フレーム内の前記スーパーピクセルを終了するステップと、
    前記スーパーピクセルの前記面積が指定された第2の値よりも大きくなった場合、前記フレーム内の前記スーパーピクセルを分離するステップと、
    フレーム当たりのスーパーピクセル数を本質的に一定に保つために、スーパーピクセルの終了数とスーパーピクセルの分離数の平衡を取るステップと、
    を含む、前記方法。
  2. 第1のフレーム内の前記スーパーピクセルのインスタンスと、前記一連のフレームのうちの後のフレーム内の前記スーパーピクセルのインスタンスとの間の類似性を決定するステップと、
    前記決定された類似性を閾値と比較するステップと、
    前記類似性が前記閾値未満である場合、後続のフレーム内の前記スーパーピクセルを、新しいスーパーピクセルにより置き換えるステップと、
    をさらに含む、請求項1に記載の方法。
  3. 一連のフレームのうちのフレームに関連するスーパーピクセルのライフサイクル管理のための装置であって、
    前記スーパーピクセルの面積が指定された第1の値よりも小さくなった場合、フレーム内の前記スーパーピクセルを終了するように構成された終了部と、
    前記スーパーピクセルの前記面積が指定された第2の値よりも大きくなった場合、前記フレーム内の前記スーパーピクセルを分離するように構成された分離部と、
    を備え
    フレーム当たりのスーパーピクセル数を本質的に一定に保つために、スーパーピクセルの終了数とスーパーピクセルの分離数の平衡を取る、前記装置。
  4. 第1のフレーム内の前記スーパーピクセルのインスタンスと、前記一連のフレームのうちの後のフレーム内の前記スーパーピクセルのインスタンスとの間の類似性を決定するように構成された決定部と、
    前記決定された類似性を閾値と比較するように構成された比較部と、
    前記類似性が前記閾値未満である場合、後続のフレームにおいて前記スーパーピクセルを、新しいスーパーピクセルにより置き換えるように構成された置換ユニットと、
    をさらに備える、請求項に記載の装置。
  5. 一連のフレームのうちのフレームに関連するスーパーピクセルのライフサイクル管理をイネーブルする命令を含むコンピュータプログラムであって、前記命令は、コンピュータによって実行されるとき、前記コンピュータに、
    前記スーパーピクセルの面積が指定された第1の値よりも小さくなった場合、フレーム内の前記スーパーピクセルを終了させ、
    前記スーパーピクセルの前記面積が指定された第2の値よりも大きくなった場合、前記フレーム内の前記スーパーピクセルを分離させ、
    フレーム当たりのスーパーピクセル数を本質的に一定に保つために、スーパーピクセルの終了数とスーパーピクセルの分離数の平衡を取る、前記コンピュータプログラム。
JP2013236831A 2012-11-15 2013-11-15 スーパーピクセルライフサイクル管理のための方法 Expired - Fee Related JP6468580B2 (ja)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
EP12306418 2012-11-15
EP12306418.0 2012-11-15
EP12306419.8 2012-11-15
EP12306419 2012-11-15
EP13305157.3A EP2765556A1 (en) 2013-02-08 2013-02-08 Method for superpixel life cycle management
EP13305157.3 2013-02-08

Publications (3)

Publication Number Publication Date
JP2014099178A JP2014099178A (ja) 2014-05-29
JP2014099178A5 JP2014099178A5 (ja) 2016-12-28
JP6468580B2 true JP6468580B2 (ja) 2019-02-13

Family

ID=49582529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013236831A Expired - Fee Related JP6468580B2 (ja) 2012-11-15 2013-11-15 スーパーピクセルライフサイクル管理のための方法

Country Status (10)

Country Link
US (2) US9105109B2 (ja)
EP (1) EP2733666B1 (ja)
JP (1) JP6468580B2 (ja)
KR (1) KR102128121B1 (ja)
CN (1) CN103824267B (ja)
AU (1) AU2013248207A1 (ja)
BR (1) BR102013029357A2 (ja)
CA (1) CA2832250A1 (ja)
MX (1) MX2013013320A (ja)
TW (1) TWI596574B (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2013248207A1 (en) * 2012-11-15 2014-05-29 Thomson Licensing Method for superpixel life cycle management
WO2015022208A1 (en) 2013-08-16 2015-02-19 Thomson Licensing Method and apparatus for generating temporally consistent superpixels
AU2013273784B2 (en) * 2013-12-20 2016-06-02 Canon Kabushiki Kaisha Method, system and apparatus for updating a scene model
US20150363664A1 (en) * 2014-06-13 2015-12-17 Nokia Corporation Method, Apparatus and Computer Program Product for Image Processing
CN106447653B (zh) * 2016-09-09 2019-01-15 河海大学 基于空间约束的卡方变换的多时相遥感影像变化检测方法
CN108122001B (zh) * 2017-12-13 2022-03-11 北京小米移动软件有限公司 图像识别方法及装置
CN108257188A (zh) * 2017-12-29 2018-07-06 重庆锐纳达自动化技术有限公司 一种运动目标检测方法
US10460156B2 (en) * 2018-03-06 2019-10-29 Sony Corporation Automated tracking and retaining of an articulated object in a sequence of image frames
KR102187211B1 (ko) 2018-04-23 2020-12-04 코그넥스코오포레이션 스테레오-시간적 이미지 시퀀스들로부터 향상된 3-d 데이터 재구성을 위한 방법들 및 장치
SE542050C2 (en) * 2018-04-24 2020-02-18 Superannotate Ai Inc Method for merging superpixels
US20200356811A1 (en) * 2019-05-09 2020-11-12 Insurance Services Office, Inc. Computer Vision Systems and Methods for Machine Learning Using a Set Packing Framework

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5321667A (en) * 1993-04-27 1994-06-14 Raytheon Company Sonar systems
JP2000306104A (ja) * 1999-04-26 2000-11-02 Matsushita Electric Ind Co Ltd 画像領域分割方法及び装置
CN1311408C (zh) * 2003-08-13 2007-04-18 瑞昱半导体股份有限公司 图像处理装置及其方法
US7433497B2 (en) 2004-01-23 2008-10-07 Hewlett-Packard Development Company, L.P. Stabilizing a sequence of image frames
US7349803B2 (en) * 2004-10-18 2008-03-25 Trex Enterprises Corp. Daytime stellar imager
CN100543757C (zh) * 2007-11-09 2009-09-23 北京航空航天大学 高可靠性数字集成电路设计方法
US20110176577A1 (en) * 2008-12-08 2011-07-21 California Institute Of Technology Superpixel multi-waveband photodetector array for remote temperature measurement
EP2494924A1 (en) * 2009-10-27 2012-09-05 Hitachi Medical Corporation Ultrasonic imaging device, ultrasonic imaging method and program for ultrasonic imaging
US20120075440A1 (en) * 2010-09-28 2012-03-29 Qualcomm Incorporated Entropy based image separation
JP5036084B2 (ja) * 2010-10-14 2012-09-26 シャープ株式会社 映像処理装置、映像処理方法、及びプログラム
GB2489272B (en) * 2011-03-23 2013-03-13 Toshiba Res Europ Ltd An image processing system and method
US8428363B2 (en) * 2011-04-29 2013-04-23 Mitsubishi Electric Research Laboratories, Inc. Method for segmenting images using superpixels and entropy rate clustering
US8577170B2 (en) * 2011-09-15 2013-11-05 Microsoft Corporation Shadow detection in a single image
CN102637253B (zh) * 2011-12-30 2014-02-19 清华大学 基于视觉显著性和超像素分割的视频前景目标提取方法
WO2013112064A1 (en) * 2012-01-25 2013-08-01 Intel Corporation Content-aware image resizing using superpixels
EP2639745A1 (en) * 2012-03-16 2013-09-18 Thomson Licensing Object identification in images or image sequences
US20130300750A1 (en) * 2012-05-10 2013-11-14 Nokia Corporation Method, apparatus and computer program product for generating animated images
EP2680226B1 (en) * 2012-06-26 2016-01-20 Thomson Licensing Temporally consistent superpixels
AU2013248207A1 (en) * 2012-11-15 2014-05-29 Thomson Licensing Method for superpixel life cycle management

Also Published As

Publication number Publication date
TWI596574B (zh) 2017-08-21
CN103824267A (zh) 2014-05-28
US20140133751A1 (en) 2014-05-15
KR102128121B1 (ko) 2020-06-29
MX2013013320A (es) 2014-05-22
US20150332480A1 (en) 2015-11-19
CA2832250A1 (en) 2014-05-15
JP2014099178A (ja) 2014-05-29
KR20140063440A (ko) 2014-05-27
BR102013029357A2 (pt) 2017-05-02
EP2733666A1 (en) 2014-05-21
CN103824267B (zh) 2019-06-04
TW201423668A (zh) 2014-06-16
US9105109B2 (en) 2015-08-11
US9349194B2 (en) 2016-05-24
EP2733666B1 (en) 2017-03-29
AU2013248207A1 (en) 2014-05-29

Similar Documents

Publication Publication Date Title
JP6468580B2 (ja) スーパーピクセルライフサイクル管理のための方法
Feng et al. Local background enclosure for RGB-D salient object detection
Li et al. Manhattan-world urban reconstruction from point clouds
Li et al. Building extraction from remotely sensed images by integrating saliency cue
US8571272B2 (en) Techniques for enabling or establishing the use of face recognition algorithms
CN109522908A (zh) 基于区域标签融合的图像显著性检测方法
US20110243381A1 (en) Methods for tracking objects using random projections, distance learning and a hybrid template library and apparatuses thereof
US10121254B2 (en) Methods and systems of detecting object boundaries
WO2017181892A1 (zh) 前景分割方法及装置
US9519837B2 (en) Tracking using multilevel representations
US9153203B2 (en) Temporally consistent superpixels
Khelifi et al. A novel fusion approach based on the global consistency criterion to fusing multiple segmentations
Amer et al. Monocular extraction of 2.1 d sketch using constrained convex optimization
Chiverton et al. Automatic bootstrapping and tracking of object contours
Mignotte et al. A precision-recall criterion based consensus model for fusing multiple segmentations
CN114170558A (zh) 用于视频处理的方法、系统、设备、介质和产品
CN109785367B (zh) 三维模型追踪中外点滤除方法和装置
Fu et al. Graph construction for salient object detection in videos
Ai et al. Geometry preserving active polygon-incorporated sign detection algorithm
Dupont et al. Extraction of layers of similar motion through combinatorial techniques
EP2765556A1 (en) Method for superpixel life cycle management
Gupta et al. 3dfs: Deformable dense depth fusion and segmentation for object reconstruction from a handheld camera
Tasli et al. User assisted stereo image segmentation
Le et al. Region-Based multiscale spatiotemporal saliency for video
Reso et al. Superpixels for video content using a contour-based em optimization

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20160121

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20160121

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20160125

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20160603

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20160610

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161114

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161114

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180109

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180704

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181218

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20181220

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20181227

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190110

R150 Certificate of patent or registration of utility model

Ref document number: 6468580

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees