JP6849101B2 - 高速で漸進的なスーパーボクセルベースの時空間ビデオセグメンテーション法 - Google Patents

高速で漸進的なスーパーボクセルベースの時空間ビデオセグメンテーション法 Download PDF

Info

Publication number
JP6849101B2
JP6849101B2 JP2019558618A JP2019558618A JP6849101B2 JP 6849101 B2 JP6849101 B2 JP 6849101B2 JP 2019558618 A JP2019558618 A JP 2019558618A JP 2019558618 A JP2019558618 A JP 2019558618A JP 6849101 B2 JP6849101 B2 JP 6849101B2
Authority
JP
Japan
Prior art keywords
voxels
super
segmentation
group
video content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019558618A
Other languages
English (en)
Other versions
JP2020518081A (ja
Inventor
シュン シュー
シュン シュー
章 中村
章 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JP2020518081A publication Critical patent/JP2020518081A/ja
Application granted granted Critical
Publication of JP6849101B2 publication Critical patent/JP6849101B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/77Retouching; Inpainting; Scratch removal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/162Segmentation; Edge detection involving graph-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20072Graph-based image processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Television Systems (AREA)

Description

本発明は、ビデオセグメンテーションに関する。具体的には、本発明は、スーパーボクセルベースのビデオセグメンテーションに関する。
ビデオセグメンテーションは、特に解像度が高く時間が長いビデオを処理する際には非常に困難なタスクである。ビデオセグメンテーションは、ビデオ処理における重要なタスクであり、ノイズ除去及び超解像などの他の多くのタスクの前処理段階としての役割を果たす。解像度が高く時間が長いビデオの場合、高品質ビデオセグメンテーションは、大量の計算を伴うため依然として困難なタスクである。
スーパーボクセルベースの時空間ビデオセグメンテーション法の2段階アーキテクチャが、速度及び拡張性を保証する。計算集約的な第1段階は、高効率のスーパーボクセルセグメンテーション法を使用する。第2段階は、予めグループ化されたスーパーボクセルにわたって実行され、従って時間的及び空間的複雑性が大幅に低い。第1段階で展開される漸進的セグメンテーションスキームでは、実行不可能な場合がある全てのデータのメモリへのロードを伴わずに莫大な入力量を一部ずつセグメント化することができる。同時に、漸進的セグメンテーションがシームアーチファクト(seam artifacts)を効果的に防ぎ、全量処理の結果と事実上同一のセグメンテーション結果をもたらすことができる。
1つの態様では、装置の非一時的メモリにプログラムされる方法が、ビデオコンテンツを取得するステップと、ビデオコンテンツを一群のスーパーボクセルにセグメント化するステップと、一群のスーパーボクセルをセグメントにグループ化するステップと、を含む。一群のスーパーボクセルの各群内のボクセルは、色、テクスチャ又はこれらの両方が視覚的に類似する。色、テクスチャ又はこれらの両方を比較照合することによって、ボクセルが色において視覚的に類似すると判断するステップが実行される。ビデオコンテンツを一群のスーパーボクセルにセグメント化するステップは、オーバーセグメンテーションを含む。スーパーボクセル間の境界が保持される。ビデオコンテンツを一群のスーパーボクセルにセグメント化するステップは、単純線形反復クラスタリングによって実行される。ビデオコンテンツを一群のスーパーボクセルにセグメント化するステップは、ビデオコンテンツを時空間要素に分割することによる部分毎のセグメンテーションである漸進的セグメンテーションを使用し、時空間要素は、走査線順に逐次処理される。漸進的セグメンテーションは前線再処理戦略を使用し、この前線再処理戦略は、各要素を処理すると、処理済みのボクセルをマークするマスクアレイが保持され、セグメンテーション前にどのボクセルもマークされておらず、セグメンテーション後に、要素の前線境界上のスーパーボクセルに属するボクセルを除く全てのボクセルがマークされ、次の要素がセグメント化される前に、全ての処理済みの隣接要素のマークされていないボクセルが現在の要素に追加され、選択されたセグメンテーション法を使用してボクセルが全てスーパーボクセルにセグメント化されることを含む。スーパーボクセルをさらに大きなセグメントにグループ化するステップは、個々のボクセルの代わりにスーパーボクセルをグループ化するグラフベースのセグメンテーションアルゴリズムを修正することに基づく。一群のスーパーボクセルをセグメントにグループ化するステップは、スーパーボクセルの色ヒストグラム間のX2距離を測定することを含む、2つのスーパーボクセル間の相違点を測定するステップを含む。
別の態様では、システムが、レンズと、ビデオコンテンツを取得するように構成されたセンサと、ビデオコンテンツを一群のスーパーボクセルにセグメント化し、一群のスーパーボクセルをセグメントにグループ化するように構成された処理コンポーネントと、を備える。一群のスーパーボクセルの各群内のボクセルは、色、テクスチャ又はこれらの両方が視覚的に類似する。色が視覚的に類似するボクセルは、色、テクスチャ又はこれらの両方を比較照合することによって実行される。ビデオコンテンツを一群のスーパーボクセルにセグメント化することは、オーバーセグメンテーションを含む。スーパーボクセル間の境界が保持される。ビデオコンテンツを一群のスーパーボクセルにセグメント化することは、単純線形反復クラスタリングによって実行される。ビデオコンテンツを一群のスーパーボクセルにセグメント化することは、ビデオコンテンツを時空間要素に分割することによる部分毎のセグメンテーションである漸進的セグメンテーションを使用し、時空間要素は、走査線順に逐次処理される。漸進的セグメンテーションは前線再処理戦略を使用し、この前線再処理戦略は、各要素を処理すると、処理済みのボクセルをマークするマスクアレイが保持され、セグメンテーション前にどのボクセルもマークされておらず、セグメンテーション後に、要素の前線境界上のスーパーボクセルに属するボクセルを除く全てのボクセルがマークされ、次の要素がセグメント化される前に、全ての処理済みの隣接要素のマークされていないボクセルが現在の要素に追加され、選択されたセグメンテーション法を使用してボクセルが全てスーパーボクセルにセグメント化されることを含む。スーパーボクセルをさらに大きなセグメントにグループ化することは、個々のボクセルの代わりにスーパーボクセルをグループ化するグラフベースのセグメンテーションアルゴリズムを修正することに基づく。一群のスーパーボクセルをセグメントにグループ化することは、スーパーボクセルの色ヒストグラム間のX2距離を測定することを含む、2つのスーパーボクセル間の相違点を測定することを含む。
別の態様では、カメラ装置が、レンズと、ビデオコンテンツを取得するように構成されたセンサと、ビデオコンテンツを一群のスーパーボクセルにセグメント化し、一群のスーパーボクセルをセグメントにグループ化する、アプリケーションを記憶する非一時的メモリと、メモリに結合されて、アプリケーションを処理するように構成された処理コンポーネントと、備える。一群のスーパーボクセルの各群内のボクセルは、色、テクスチャ又はこれらの両方が視覚的に類似する。色、テクスチャ又はこれらの両方を比較照合することによって、ボクセルが色において視覚的に類似すると判断するステップが実行される。ビデオコンテンツを一群のスーパーボクセルにセグメント化することは、オーバーセグメンテーションを含む。スーパーボクセル間の境界が保持される。ビデオコンテンツを一群のスーパーボクセルにセグメント化することは、単純線形反復クラスタリングによって実行される。ビデオコンテンツを一群のスーパーボクセルにセグメント化することは、ビデオコンテンツを時空間要素に分割することによる部分毎のセグメンテーションである漸進的セグメンテーションを使用し、時空間要素は、走査線順に逐次処理される。漸進的セグメンテーションは前線再処理戦略を使用し、この前線再処理戦略は、各要素を処理すると、処理済みのボクセルをマークするマスクアレイが保持され、セグメンテーション前にどのボクセルもマークされておらず、セグメンテーション後に、要素の前線境界上のスーパーボクセルに属するボクセルを除く全てのボクセルがマークされ、次の要素がセグメント化される前に、全ての処理済みの隣接要素のマークされていないボクセルが現在の要素に追加され、選択されたセグメンテーション法を使用してボクセルが全てスーパーボクセルにセグメント化されることを含む。スーパーボクセルをさらに大きなセグメントにグループ化することは、個々のボクセルの代わりにスーパーボクセルをグループ化するグラフベースのセグメンテーションアルゴリズムを修正することに基づく。一群のスーパーボクセルをセグメントにグループ化することは、スーパーボクセルの色ヒストグラム間のX2距離を測定することを含む、2つのスーパーボクセル間の相違点を測定することを含む。
いくつかの実施形態によるセグメンテーションフレームワークの全体的ワークフロー図である。 いくつかの実施形態による漸進的セグメンテーションフレームワークのワークフロー図である。 いくつかの実施形態によるスーパーボクセルベースの時空間ビデオセグメンテーション法のフローチャートである。 いくつかの実施形態によるスーパーボクセルベースの時空間ビデオセグメンテーション法を実行するように構成された例示的なコンピュータ装置のブロック図である。
高速かつ拡張可能なビデオセグメンテーション法について説明する。この方法は、高速であるとともに2段階方式で機能する。最も計算コストが高い第1段階は、極めて効率的な方法によって行われる。この方法は、1つには非常に大きなビデオシーケンスを効果的に取り扱うことができる新規の漸進的処理スキームを使用する効率的なセグメンテーション法に起因して拡張性が高い。
このビデオセグメンテーション法は、2つの段階を含む。第1段階では、時空間量としてのビデオをスーパーボクセルにセグメント化する。この段階は最も計算コストが高い段階であり、従って高効率アルゴリズムを利用する。さらに、漸進的スキームが、大規模ビデオ入力を処理してフレームワーク全体に高い拡張性もたらすように設計される。第2段階では、スーパーボクセルを、視覚的に一貫した意味的に重要なさらに大きなセグメントにさらにグループ化する。図1に、セグメンテーションフレームワークの全体的ワークフローを示しており、本明細書ではこれらのステップの詳細について説明する。
時空間スーパーボクセルセグメンテーション
2段階フレームワークの第1段階では、ピクセル、特にビデオ入力のボクセルを、スーパーボクセルと呼ばれるグループにセグメント化する。1つのスーパーボクセルにグループ化されたボクセルは、色及び/又はテクスチャの点で視覚的に類似する。色及び/又はテクスチャの点での視覚的類似性は、色値及び/又はテクスチャ値の比較照合などのあらゆる方法で判定することができる。通常、原ビデオでは、1つの視覚的に一貫した領域(例えば、物体の一部)が複数のスーパーボクセルにセグメント化され、従ってこのようなセグメンテーションは、しばしばオーバーセグメンテーションと呼ばれる。入力ビデオをスーパーボクセルにオーバーセグメント化する目的は、後の段階で処理すべき視覚単位の量を劇的に減少させることである。通常、1つのスーパーボクセルは102〜103個のボクセルを含むので、その後のモジュールの処理の複雑性を2又は3段階(2 or 3 magnitudes)低下させることができる。オーバーセグメンテーションは、原入力における(例えば、前景オブジェクトと背景との間の)顕著な境界を維持すべきである。換言すれば、スーパーボクセル間の境界は、原入力における全ての重要な境界を含むべきである。
このステップでは、あらゆる適度に良好なスーパーボクセルセグメンテーション法を使用することができる。しかしながら、このステップは、全ての入力ボクセルにわたって動作するという理由で最も計算コストが高いので、フレームワーク全体の総合的な速度及び拡張性をもたらすために効率性の高い方法が好ましい。いくつかの実施形態では、適度に良好なセグメンテーション品質をもたらすことができる(ボクセルの数に関する線形複雑度を有する)非常に効率的な方法である単純線形反復クラスタリング(Simple Linear Iterative Clustering:SLIC)と呼ばれる方法を利用する。
大規模ビデオ入力のための漸進的セグメンテーションスキーム
ビデオシーケンス、特に解像度が高く時間が長いビデオシーケンスは、全体をメモリにロードして処理するのが困難である。ビデオセグメンテーションのためのスケーラブルフレームワークは、大規模入力を全体として処理する必要なく操作するためのスキームを伴うべきである。第1段階は一部ずつ行われ、漸進的セグメンテーションと呼ばれる。図2は、いくつかの実施形態による漸進的セグメンテーションフレームワークのワークフロー図である。
漸進的セグメンテーションスキームでは、最初に原ビデオの容量をさらに小さな時空間チャンク(spatial−temporal chunks)に分割する。その後、これらのチャンクを走査線順に逐次処理する。
これらのチャンクをそのまま単純に処理すると、あらゆる隣接チャンクの対間の境界上に人工的な継ぎ目が生じるようになる。漸進的セグメンテーションスキームでは、この問題を解決するために前線再処理戦略(front−line retreating strategy)を使用する。前線再処理戦略は、本明細書で説明するように機能する。
各チャンクを処理すると、処理済みのボクセルをマークするマスクアレイ(mask array)が保持される。セグメンテーション前には、どのボクセルもマークされていないことが明らかである。セグメンテーション後には、このチャンクの前線境界(例えば、このチャンクといずれかの処理済みのチャンクとの間の境界)上のスーパーボクセルに属するボクセルを除く全てのボクセルがマークされる。次のチャンクの処理前に、全ての処理済みの隣接チャンクのマークされていないボクセルを現在のチャンクに追加し、選択されたセグメンテーション法を使用して、これらのボクセルを全てスーパーボクセルにセグメント化する。
スーパーボクセル上におけるグラフベースのセグメンテーション
グラフベースのセグメンテーションは、視覚的に一貫した意味的に重要なセグメンテーションをもたらすことができる方法である。元々の方法は、画像セグメンテーションのために設計されたものであり、ピクセルに対して作用する(例えば、ピクセルをセグメントにグループ化する)。本明細書で説明する方法は、時空間スーパーボクセルに作用するように適合されたものである。主な相違点は、処理すべき基本要素(ノード)としてボクセルをスーパーボクセルに置き換える点である。従って、本来のボクセルの距離測度は、2つのスーパーボクセル間の相違点を測定する距離に置き換わる。スーパーボクセルは、空間的に接続されたボクセルの集合(ensemble)であるため、さらに高度なメトリックを使用することができる。1つの可能性は、スーパーボクセルの色ヒストグラム間のX2距離を使用することである。特定の用途に応じて、他の側面(例えば、テクスチャ又は動き)に関する相違点を測定する他のメトリックを含めることもできる。
図3に、いくつかの実施形態によるスーパーボクセルベースの時空間ビデオセグメンテーション法のフローチャートを示す。ステップ300において、ビデオコンテンツを取得又は送信する。例えば、デジタルカムコーダを使用してビデオを撮影する。別の例では、1つの装置から別の装置にビデオコンテンツを送信する。ステップ302において、ビデオコンテンツをスーパーボクセルにセグメント化する。ステップ304において、スーパーボクセルをさらに大きなセグメントにグループ化する。いくつかの実施形態では、さらに少ない又はさらに多くのステップを実行することができる。いくつかの実施形態では、ステップの順序を変更することができる。
図4は、いくつかの実施形態によるスーパーボクセルベースの時空間ビデオセグメンテーション法を実行するように構成された例示的なコンピュータ装置のブロック図である。コンピュータ装置400は、画像及びビデオなどの情報の取得、記憶、計算、処理、通信及び/又は表示のために使用することができる。一般に、コンピュータ装置400を実装するのに適したハードウェア構造は、ネットワークインターフェイス402、メモリ404、プロセッサ406、(単複の)I/O装置408、バス410及び記憶装置412を含む。プロセッサの選択は、十分な速度の好適なプロセッサを選択する限り重要ではない。メモリ404は、当業で周知のいずれかの従来のコンピュータメモリとすることができる。記憶装置412は、ハードドライブ、CDROM、CDRW、DVD、DVDRW、高精細ディスク/ドライブ、ウルトラHDドライブ、フラッシュメモリカード、又はその他のいずれかの記憶装置を含むことができる。コンピュータ装置400は、1又は2以上のネットワークインターフェイス402を含むことができる。ネットワークインターフェイスの例としては、イーサネット又は他のタイプのLANに接続されたネットワークカードが挙げられる。(単複の)I/O装置408は、キーボード、マウス、モニタ、画面、プリンタ、モデム、タッチ画面、ボタンインターフェイス及びその他の装置のうちの1つ又は2つ以上を含むことができる。記憶装置412及びメモリ404には、スーパーボクセルベースの時空間ビデオセグメンテーション法を実行するために使用されるスーパーボクセルベースの時空間ビデオセグメンテーションアプリケーション430が記憶されて、アプリケーションが通常処理されるように処理される可能性が高い。コンピュータ装置400には、図4に示すものよりも多くの又は少ないコンポーネントを含めることもできる。いくつかの実施形態では、スーパーボクセルベースの時空間ビデオセグメンテーションハードウェア420が含まれる。図4のコンピュータ装置400は、スーパーボクセルベースの時空間ビデオセグメンテーション法のためのアプリケーション430及びハードウェア420を含むが、スーパーボクセルベースの時空間ビデオセグメンテーション法は、ハードウェア、ファームウェア、ソフトウェア、又はこれらのあらゆる組み合わせでコンピュータ装置上に実装することもできる。例えば、いくつかの実施形態では、スーパーボクセルベースの時空間ビデオセグメンテーションアプリケーション430がメモリにプログラムされ、プロセッサを用いて実行される。別の例として、いくつかの実施形態では、スーパーボクセルベースの時空間ビデオセグメンテーションハードウェア420が、スーパーボクセルベースの時空間ビデオセグメンテーション法を実行するように特別に設計されたゲートを含むプログラムされたハードウェアロジックである。
いくつかの実施形態では、スーパーボクセルベースの時空間ビデオセグメンテーション430が、複数のアプリケーション及び/又はモジュールを含む。いくつかの実施形態では、モジュールが、1又は2以上のサブモジュールをさらに含む。いくつかの実施形態では、これよりも少ない又はさらなるモジュールを含めることもできる。
好適なコンピュータ装置の例としては、パーソナルコンピュータ、ラップトップコンピュータ、コンピュータワークステーション、サーバ、メインフレームコンピュータ、ハンドヘルドコンピュータ、携帯情報端末、セルラ/携帯電話機、スマート家電、ゲーム機、デジタルカメラ、デジタルカムコーダ、カメラ付き電話機、スマートホン、ポータブル音楽プレーヤ、タブレットコンピュータ、モバイル装置、ビデオプレーヤ、ビデオディスクライタ/プレーヤ(DVDライタ/プレーヤ、高精細ディスクライタ/プレーヤ、超高精細ディスクライタ/プレーヤなど)、テレビ、家庭用エンターテイメントシステム、スマートジュエリ(例えば、スマートウォッチ)、又はその他のあらゆる好適なコンピュータ装置が挙げられる。
本明細書で説明したスーパーボクセルベースの時空間ビデオセグメンテーション法を利用するには、デジタルカムコーダなどの装置を使用してビデオを取得する。スーパーボクセルベースの時空間ビデオセグメンテーション法は、この取得データを処理するために自動的に使用される。スーパーボクセルベースの時空間ビデオセグメンテーション法は、ユーザの関与を伴わずに自動的に実行することができる。
動作時には、スーパーボクセルベースの時空間ビデオセグメンテーション法の2段階アーキテクチャが、速度及び拡張性を保証する。計算集約的な第1段階は、高効率のスーパーボクセルセグメンテーション法を使用する。第2段階は、予めグループ化されたスーパーボクセルにわたって実行され、従って時空間的複雑度が大幅に低い。第1段階で展開される漸進的セグメンテーションスキームでは、実行不可能な場合がある全てのデータのメモリへのロードを伴わずに莫大な入力量を一部ずつセグメント化することができる。同時に、漸進的セグメンテーションがシームアーチファクトを効果的に防ぎ、全量処理の結果と事実上同一のセグメンテーション結果をもたらすことができる。
高速で漸進的なスーパーボクセルベースの時空間ビデオセグメンテーション法のいくつかの実施形態
1.装置の非一時的メモリにプログラムされる方法であって、
a.ビデオコンテンツを取得するステップと、
b.ビデオコンテンツを一群のスーパーボクセルにセグメント化するステップと、
c.一群のスーパーボクセルをセグメントにグループ化するステップと、を含む方法。
2.一群のスーパーボクセルの各群内のボクセルは、色、テクスチャ又はこれらの両方が視覚的に類似する、条項1の方法。
3.色、テクスチャ又はこれらの両方を比較照合することによって、ボクセルが色において視覚的に類似すると判断するステップを実行する、条項2の方法。
4.ビデオコンテンツを一群のスーパーボクセルにセグメント化するステップは、オーバーセグメンテーションを含む、条項1の方法。
5. スーパーボクセル間の境界が保持される、条項4の方法。
6.ビデオコンテンツを一群のスーパーボクセルにセグメント化するステップは、単純線形反復クラスタリングによって実行される、条項1の方法。
7.ビデオコンテンツを一群のスーパーボクセルにセグメント化するステップは、ビデオコンテンツを時空間要素に分割することによる部分毎のセグメンテーションである漸進的セグメンテーションを使用し、時空間要素は、走査線順に逐次処理される、条項1の方法。
8.漸進的セグメンテーションは前線再処理戦略を使用し、この前線再処理戦略は、各要素を処理すると、処理済みのボクセルをマークするマスクアレイが保持され、セグメンテーション前にどのボクセルもマークされておらず、セグメンテーション後に、要素の前線境界上のスーパーボクセルに属するボクセルを除く全てのボクセルがマークされ、次の要素がセグメント化される前に、全ての処理済みの隣接要素のマークされていないボクセルが現在の要素に追加され、選択されたセグメンテーション法を使用してボクセルが全てスーパーボクセルにセグメント化されることを含む、条項7の方法。
9.スーパーボクセルをさらに大きなセグメントにグループ化するステップは、個々のボクセルの代わりにスーパーボクセルをグループ化するグラフベースのセグメンテーションアルゴリズムを修正することに基づく、条項1の方法。
10.一群のスーパーボクセルをセグメントにグループ化するステップは、スーパーボクセルの色ヒストグラム間のX2距離を測定することを含む、2つのスーパーボクセル間の相違点を測定するステップを含む、条項1の方法。
11.システムであって、
a.レンズと、
b.ビデオコンテンツを取得するように構成されたセンサと、
c.ビデオコンテンツを一群のスーパーボクセルにセグメント化し、一群のスーパーボクセルをセグメントにグループ化するように構成された処理コンポーネントと、を備えるシステム。
12.一群のスーパーボクセルの各群内のボクセルは、色、テクスチャ又はこれらの両方が視覚的に類似する、条項11のシステム。
13.色、テクスチャ又はこれらの両方を比較照合することによって、ボクセルが色において視覚的に類似すると判断することを実行する、条項12のシステム。
14.ビデオコンテンツを一群のスーパーボクセルにセグメント化することは、オーバーセグメンテーションを含む、条項11のシステム。
15.スーパーボクセル間の境界が保持される、条項14のシステム。
16.ビデオコンテンツを一群のスーパーボクセルにセグメント化することは、単純線形反復クラスタリングによって実行される、条項11のシステム。
17.ビデオコンテンツを一群のスーパーボクセルにセグメント化することは、ビデオコンテンツを時空間要素に分割することによる部分毎のセグメンテーションである漸進的セグメンテーションを使用し、時空間要素は、走査線順に逐次処理される、条項11のシステム。
18.漸進的セグメンテーションは前線再処理戦略を使用し、この前線再処理戦略は、各要素を処理すると、処理済みのボクセルをマークするマスクアレイが保持され、セグメンテーション前にどのボクセルもマークされておらず、セグメンテーション後に、要素の前線境界上のスーパーボクセルに属するボクセルを除く全てのボクセルがマークされ、次の要素がセグメント化される前に、全ての処理済みの隣接要素のマークされていないボクセルが現在の要素に追加され、選択されたセグメンテーション法を使用してボクセルが全てスーパーボクセルにセグメント化されることを含む、条項17のシステム。
19.スーパーボクセルをさらに大きなセグメントにグループ化することは、個々のボクセルの代わりにスーパーボクセルをグループ化するグラフベースのセグメンテーションアルゴリズムを修正することに基づく、条項11のシステム。
20.一群のスーパーボクセルをセグメントにグループ化することは、スーパーボクセルの色ヒストグラム間のX2距離を測定することを含む、2つのスーパーボクセル間の相違点を測定することを含む、条項11のシステム。
21.カメラ装置であって、
a.レンズと、
b.ビデオコンテンツを取得するように構成されたセンサと、
c.
i.ビデオコンテンツを一群のスーパーボクセルにセグメント化し、
ii.一群のスーパーボクセルをセグメントにグループ化する、
アプリケーションを記憶する非一時的メモリと、
d.メモリに結合されて、アプリケーションを処理するように構成された処理コンポーネントと、備えるカメラ装置。
22.一群のスーパーボクセルの各群内のボクセルは、色、テクスチャ又はこれらの両方が視覚的に類似する、条項21のカメラ装置。
23.色、テクスチャ又はこれらの両方を比較照合することによって、ボクセルが色において視覚的に類似すると判断することを実行する、条項22のカメラ装置。
24.ビデオコンテンツを一群のスーパーボクセルにセグメント化することは、オーバーセグメンテーションを含む、条項21のカメラ装置。
25.スーパーボクセル間の境界が保持される、条項24のカメラ装置。
26.ビデオコンテンツを一群のスーパーボクセルにセグメント化することは、単純線形反復クラスタリングによって実行される、条項21のカメラ装置。
27.ビデオコンテンツを一群のスーパーボクセルにセグメント化することは、ビデオコンテンツを時空間要素に分割することによる部分毎のセグメンテーションである漸進的セグメンテーションを使用し、時空間要素は、走査線順に逐次処理される、条項21のカメラ装置。
28.漸進的セグメンテーションは前線再処理戦略を使用し、この前線再処理戦略は、各要素を処理すると、処理済みのボクセルをマークするマスクアレイが保持され、セグメンテーション前にどのボクセルもマークされておらず、セグメンテーション後に、要素の前線境界上のスーパーボクセルに属するボクセルを除く全てのボクセルがマークされ、次の要素がセグメント化される前に、全ての処理済みの隣接要素のマークされていないボクセルが現在の要素に追加され、選択されたセグメンテーション法を使用してボクセルが全てスーパーボクセルにセグメント化されることを含む、条項27のカメラ装置。
29.スーパーボクセルをさらに大きなセグメントにグループ化することは、個々のボクセルの代わりにスーパーボクセルをグループ化するグラフベースのセグメンテーションアルゴリズムを修正することに基づく、条項21のカメラ装置。
30.一群のスーパーボクセルをセグメントにグループ化することは、スーパーボクセルの色ヒストグラム間のX2距離を測定することを含む、2つのスーパーボクセル間の相違点を測定することを含む、条項21のカメラ装置。
本発明の構成及び動作の原理を容易に理解できるように、詳細を含む特定の実施形態に関して本発明を説明した。本明細書におけるこのような特定の実施形態及びこれらの実施形態の詳細についての言及は、本明細書に添付する特許請求の範囲を限定することを意図したものではない。当業者には、特許請求の範囲によって定められる本発明の趣旨及び範囲から逸脱することなく、例示のために選択した実施形態において他の様々な修正を行えることが容易に明らかになるであろう。
300 ビデオコンテンツを取得
302 ビデオコンテンツをスーパーボクセルにセグメント化
304 スーパーボクセルをさらに大きなセグメントにグループ化

Claims (24)

  1. 装置の非一時的メモリにプログラムされる方法であって、
    a.ビデオコンテンツを取得するステップと、
    b.前記ビデオコンテンツを一群のスーパーボクセルにセグメント化するステップと、
    c.前記一群のスーパーボクセルをセグメントにグループ化するステップと、
    を含み、
    前記ビデオコンテンツを一群のスーパーボクセルにセグメント化するステップは、前記ビデオコンテンツを時空間要素に分割することによる部分毎のセグメンテーションである漸進的セグメンテーションを使用し、前記時空間要素は、走査線順に逐次処理され、
    前記漸進的セグメンテーションは前線再処理戦略を使用し、該前線再処理戦略は、各要素を処理すると、処理済みのボクセルをマークするマスクアレイが保持され、セグメンテーション前にどのボクセルもマークされておらず、セグメンテーション後に、要素の前線境界上のスーパーボクセルに属するボクセルを除く全てのボクセルがマークされ、次の要素がセグメント化される前に、全ての処理済みの隣接要素のマークされていないボクセルが現在の要素に追加され、選択されたセグメンテーション法を使用して前記ボクセルが全てスーパーボクセルにセグメント化されることを含む、
    ことを特徴とする方法。
  2. 前記一群のスーパーボクセルの各群内の前記ボクセルは、色、テクスチャ又はこれらの両方が視覚的に類似する、
    請求項1に記載の方法。
  3. 前記色、前記テクスチャ又はこれらの両方を比較照合することによって、前記ボクセルが色において視覚的に類似すると判断するステップを実行する、
    請求項2に記載の方法。
  4. 前記ビデオコンテンツを前記一群のスーパーボクセルにセグメント化するステップは、オーバーセグメンテーションを含む、
    請求項1に記載の方法。
  5. スーパーボクセル間の境界が保持される、
    請求項4に記載の方法。
  6. 前記ビデオコンテンツを一群のスーパーボクセルにセグメント化するステップは、単純線形反復クラスタリングによって実行される、
    請求項1に記載の方法。
  7. スーパーボクセルをさらに大きなセグメントにグループ化するステップは、個々のボクセルの代わりにスーパーボクセルをグループ化するグラフベースのセグメンテーションアルゴリズムを修正することに基づく、
    請求項1に記載の方法。
  8. 前記一群のスーパーボクセルを前記セグメントにグループ化するステップは、前記スーパーボクセルの色ヒストグラム間の距離を測定することを含む、2つのスーパーボクセル間の相違点を測定するステップを含む、
    請求項1に記載の方法。
  9. a.レンズと、
    b.ビデオコンテンツを取得するように構成されたセンサと、
    c.前記ビデオコンテンツを一群のスーパーボクセルにセグメント化し、該一群のスーパーボクセルをセグメントにグループ化するように構成された処理コンポーネントと、
    を備え、
    前記ビデオコンテンツを一群のスーパーボクセルにセグメント化することは、前記ビデオコンテンツを時空間要素に分割することによる部分毎のセグメンテーションである漸進的セグメンテーションを使用し、前記時空間要素は、走査線順に逐次処理され、
    前記漸進的セグメンテーションは前線再処理戦略を使用し、該前線再処理戦略は、各要素を処理すると、処理済みのボクセルをマークするマスクアレイが保持され、セグメンテーション前にどのボクセルもマークされておらず、セグメンテーション後に、要素の前線境界上のスーパーボクセルに属するボクセルを除く全てのボクセルがマークされ、次の要素がセグメント化される前に、全ての処理済みの隣接要素のマークされていないボクセルが現在の要素に追加され、選択されたセグメンテーション法を使用して前記ボクセルが全てスーパーボクセルにセグメント化されることを含む、
    ことを特徴とするシステム。
  10. 前記一群のスーパーボクセルの各群内の前記ボクセルは、色、テクスチャ又はこれらの両方が視覚的に類似する、
    請求項9に記載のシステム。
  11. 前記色、前記テクスチャ又はこれらの両方を比較照合することによって、前記ボクセルが色において視覚的に類似すると判断することを実行する、
    請求項10に記載のシステム。
  12. 前記ビデオコンテンツを前記一群のスーパーボクセルにセグメント化することは、オーバーセグメンテーションを含む、
    請求項9に記載のシステム。
  13. スーパーボクセル間の境界が保持される、
    請求項12に記載のシステム。
  14. 前記ビデオコンテンツを一群のスーパーボクセルにセグメント化することは、単純線形反復クラスタリングによって実行される、
    請求項9に記載のシステム。
  15. スーパーボクセルをさらに大きなセグメントにグループ化することは、個々のボクセルの代わりにスーパーボクセルをグループ化するグラフベースのセグメンテーションアルゴリズムを修正することに基づく、
    請求項9に記載のシステム。
  16. 前記一群のスーパーボクセルを前記セグメントにグループ化することは、前記スーパーボクセルの色ヒストグラム間の距離を測定することを含む、2つのスーパーボクセル間の相違点を測定することを含む、
    請求項9に記載のシステム。
  17. a.レンズと、
    b.ビデオコンテンツを取得するように構成されたセンサと、
    c.
    i.前記ビデオコンテンツを一群のスーパーボクセルにセグメント化し、
    ii.前記一群のスーパーボクセルをセグメントにグループ化する、
    アプリケーションを記憶する非一時的メモリと、
    d.前記メモリに結合されて、前記アプリケーションを処理するように構成された処理コンポーネントと、
    を備え、
    前記ビデオコンテンツを一群のスーパーボクセルにセグメント化することは、前記ビデオコンテンツを時空間要素に分割することによる部分毎のセグメンテーションである漸進的セグメンテーションを使用し、前記時空間要素は、走査線順に逐次処理され、
    前記漸進的セグメンテーションは前線再処理戦略を使用し、該前線再処理戦略は、各要素を処理すると、処理済みのボクセルをマークするマスクアレイが保持され、セグメンテーション前にどのボクセルもマークされておらず、セグメンテーション後に、要素の前線境界上のスーパーボクセルに属するボクセルを除く全てのボクセルがマークされ、次の要素がセグメント化される前に、全ての処理済みの隣接要素のマークされていないボクセルが現在の要素に追加され、選択されたセグメンテーション法を使用して前記ボクセルが全てスーパーボクセルにセグメント化されることを含む、
    ことを特徴とするカメラ装置。
  18. 前記一群のスーパーボクセルの各群内の前記ボクセルは、色、テクスチャ又はこれらの両方が視覚的に類似する、
    請求項17に記載のカメラ装置。
  19. 前記色、前記テクスチャ又はこれらの両方を比較照合することによって、前記ボクセルが色において視覚的に類似すると判断することを実行する、
    請求項18に記載のカメラ装置。
  20. 前記ビデオコンテンツを前記一群のスーパーボクセルにセグメント化することは、オーバーセグメンテーションを含む、
    請求項17に記載のカメラ装置。
  21. スーパーボクセル間の境界が保持される、
    請求項20に記載のカメラ装置。
  22. 前記ビデオコンテンツを一群のスーパーボクセルにセグメント化することは、単純線形反復クラスタリングによって実行される、
    請求項17に記載のカメラ装置。
  23. スーパーボクセルをさらに大きなセグメントにグループ化することは、個々のボクセルの代わりにスーパーボクセルをグループ化するグラフベースのセグメンテーションアルゴリズムを修正することに基づく、
    請求項17に記載のカメラ装置。
  24. 前記一群のスーパーボクセルを前記セグメントにグループ化することは、前記スーパーボクセルの色ヒストグラム間の距離を測定することを含む、2つのスーパーボクセル間の相違点を測定することを含む、
    請求項17に記載のカメラ装置。
JP2019558618A 2017-07-11 2018-06-29 高速で漸進的なスーパーボクセルベースの時空間ビデオセグメンテーション法 Active JP6849101B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/646,711 2017-07-11
US15/646,711 US10304192B2 (en) 2017-07-11 2017-07-11 Fast, progressive approach to supervoxel-based spatial temporal video segmentation
PCT/IB2018/054834 WO2019012365A1 (en) 2017-07-11 2018-06-29 RAPID AND PROGRESSIVE APPROACH FOR SUPERVOXEL-BASED SPATIOTEMPORAL VIDEO SEGMENTATION

Publications (2)

Publication Number Publication Date
JP2020518081A JP2020518081A (ja) 2020-06-18
JP6849101B2 true JP6849101B2 (ja) 2021-03-24

Family

ID=63080230

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019558618A Active JP6849101B2 (ja) 2017-07-11 2018-06-29 高速で漸進的なスーパーボクセルベースの時空間ビデオセグメンテーション法

Country Status (5)

Country Link
US (1) US10304192B2 (ja)
JP (1) JP6849101B2 (ja)
KR (1) KR102300522B1 (ja)
CN (1) CN110622214B (ja)
WO (1) WO2019012365A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200011340A (ko) * 2018-07-24 2020-02-03 삼성메디슨 주식회사 초음파 영상 장치 및 그 표시 방법

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110533667B (zh) * 2019-07-29 2022-12-02 西安电子科技大学 基于图像金字塔融合的肺部肿瘤ct影像3d分割方法
CN112348816B (zh) * 2021-01-07 2021-06-01 北京明略软件系统有限公司 脑磁共振图像分割方法、存储介质及电子装置
CN113870282A (zh) * 2021-09-29 2021-12-31 吴春 一种茶叶筛查方法、筛查系统及可存储介质
CN117152446B (zh) * 2023-10-31 2024-02-06 昆明理工大学 一种基于高斯曲率和局部凹凸性的改进lccp点云分割方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2384732B1 (es) 2010-10-01 2013-05-27 Telefónica, S.A. Método y sistema para segmentación de primer plano de imágenes en tiempo real.
AU2011265383A1 (en) * 2011-12-20 2013-07-04 Canon Kabushiki Kaisha Geodesic superpixel segmentation
SG11201407941UA (en) * 2012-06-01 2014-12-30 Agency Science Tech & Res Robust graph representation and matching of retina images
EP2680226B1 (en) 2012-06-26 2016-01-20 Thomson Licensing Temporally consistent superpixels
AU2012244276A1 (en) * 2012-10-30 2014-05-15 Canon Kabushiki Kaisha Method, apparatus and system for detecting a supporting surface region in an image
IN2013CH05313A (ja) * 2013-11-18 2015-05-29 Nokia Corp
US9430499B2 (en) * 2014-02-18 2016-08-30 Environmental Systems Research Institute, Inc. Automated feature extraction from imagery
GB2523329A (en) * 2014-02-20 2015-08-26 Nokia Technologies Oy Method, apparatus and computer program product for image segmentation
GB2523330A (en) * 2014-02-20 2015-08-26 Nokia Technologies Oy Method, apparatus and computer program product for segmentation of objects in media content
CN105303519A (zh) * 2014-06-20 2016-02-03 汤姆逊许可公司 用于生成时间一致的超像素的方法和装置
EP2980754A1 (en) * 2014-07-28 2016-02-03 Thomson Licensing Method and apparatus for generating temporally consistent superpixels
AU2014280948A1 (en) * 2014-12-24 2016-07-14 Canon Kabushiki Kaisha Video segmentation method
US9760801B2 (en) * 2015-05-12 2017-09-12 Lawrence Livermore National Security, Llc Identification of uncommon objects in containers
CN105590100B (zh) * 2015-12-23 2018-11-13 北京工业大学 基于判别性超体素的人体动作识别方法
US10229337B2 (en) * 2016-02-16 2019-03-12 Ecole Polytechnique Federale De Lausanne (Epfl) Scale-adaptive media item segmentation technique
US10200727B2 (en) * 2017-03-29 2019-02-05 International Business Machines Corporation Video encoding and transcoding for multiple simultaneous qualities of service

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200011340A (ko) * 2018-07-24 2020-02-03 삼성메디슨 주식회사 초음파 영상 장치 및 그 표시 방법
KR102655278B1 (ko) 2018-07-24 2024-04-08 삼성메디슨 주식회사 초음파 영상 장치 및 그 표시 방법

Also Published As

Publication number Publication date
CN110622214B (zh) 2023-05-30
WO2019012365A1 (en) 2019-01-17
KR102300522B1 (ko) 2021-09-13
JP2020518081A (ja) 2020-06-18
US20190019292A1 (en) 2019-01-17
US10304192B2 (en) 2019-05-28
KR20190129984A (ko) 2019-11-20
CN110622214A (zh) 2019-12-27

Similar Documents

Publication Publication Date Title
JP6849101B2 (ja) 高速で漸進的なスーパーボクセルベースの時空間ビデオセグメンテーション法
Lin et al. Real-time high-resolution background matting
CN110136056B (zh) 图像超分辨率重建的方法和装置
Tursun et al. The state of the art in HDR deghosting: A survey and evaluation
US20200005468A1 (en) Method and system of event-driven object segmentation for image processing
US9558712B2 (en) Unified optimization method for end-to-end camera image processing for translating a sensor captured image to a display image
TWI543610B (zh) 電子裝置及其影像選擇方法
US20220222776A1 (en) Multi-Stage Multi-Reference Bootstrapping for Video Super-Resolution
US9454806B2 (en) Efficient approximate-nearest-neighbor (ANN) search for high-quality collaborative filtering
CN108337551B (zh) 一种屏幕录制方法、存储介质及终端设备
KR20110033801A (ko) L₁거리 척도에 기초한 국소 이미지 유사성 측정 방법
CN108229346B (zh) 使用有符号的前景提取与融合的视频摘要
US20230214981A1 (en) Method for detecting appearance defects of a product and electronic device
WO2018058476A1 (zh) 一种图像校正方法及装置
CN111882565A (zh) 一种图像二值化方法、装置、设备及存储介质
US20190230381A1 (en) Compressing multiple video files using localized camera meta data
US20130223697A1 (en) Face detection-processing circuit and image pickup device including the same
CN111754411B (zh) 图像降噪方法、图像降噪装置及终端设备
CN113497886B (zh) 视频处理方法、终端设备及计算机可读存储介质
JP6521278B2 (ja) 効率的なパッチベースのビデオノイズ除去方法
JP2022190958A (ja) ショット境界検出装置、ショット境界学習装置及びそれらのプログラム
Amintoosi et al. Video enhancement through image registration based on structural similarity
JP6563964B2 (ja) 映像生成装置、映像生成方法、プログラム
Sari et al. An Approach For Stitching Satellite Images In A Bigdata Mapreduce Framework
US9508020B2 (en) Image processing system with artifact suppression mechanism and method of operation thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191025

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201005

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201104

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210215

R151 Written notification of patent or utility model registration

Ref document number: 6849101

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151