JP7403175B2 - 画像を分割する方法 - Google Patents

画像を分割する方法 Download PDF

Info

Publication number
JP7403175B2
JP7403175B2 JP2021537099A JP2021537099A JP7403175B2 JP 7403175 B2 JP7403175 B2 JP 7403175B2 JP 2021537099 A JP2021537099 A JP 2021537099A JP 2021537099 A JP2021537099 A JP 2021537099A JP 7403175 B2 JP7403175 B2 JP 7403175B2
Authority
JP
Japan
Prior art keywords
pixels
curvature
image
iii
segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021537099A
Other languages
English (en)
Other versions
JP2022514978A (ja
Inventor
ビール,シャビエール
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mintt
Original Assignee
Mintt
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mintt filed Critical Mintt
Publication of JP2022514978A publication Critical patent/JP2022514978A/ja
Application granted granted Critical
Publication of JP7403175B2 publication Critical patent/JP7403175B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/187Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S17/00Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
    • G01S17/88Lidar systems specially adapted for specific applications
    • G01S17/89Lidar systems specially adapted for specific applications for mapping or imaging
    • G01S17/8943D imaging with simultaneous measurement of time-of-flight at a 2D array of receiver pixels, e.g. time-of-flight cameras or flash lidar
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/04Indexing scheme for image data processing or generation, in general involving 3D image data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20152Watershed segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30181Earth observation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Electromagnetism (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Ultra Sonic Daignosis Equipment (AREA)

Description

本発明は、画像のセグメンテーション方法に関する。
画像は、典型的には、多数のピクセルからなる。画像の特定の処理および/または情報抽出動作中に、画像を、操作がより容易な1つまたは複数のピクセルのグループに分割することが有用であり得る。これを行うために、画像セグメンテーション技術が使用される。
これらの技術は、典型的には、例えば、物体の検出、抽出、記述、追跡または認識を含む後続の目的のために、画像内の物体の領域を背景領域から分離することを可能にする。
対象とする後続の目的および画像の種類に多かれ少なかれ適合する多くの画像セグメンテーション技術がある。しかしながら、これらの技術には、有効性の点でいくつかの欠点がある。繰り返す欠陥は、セグメンテーションの効率を制限し、オーバーセグメンテーション画像のさらなる処理において時間を浪費する画像オーバーセグメンテーションである。
本発明の目的は、既知の画像セグメンテーション技術よりも効率的な画像のセグメンテーション方法を提供することである。
この目的のために、本発明は、画像のセグメンテーション方法であって、コンピュータ実施され、
(0)画像のピクセルを選択するステップと、
(i)ピクセルの各々における曲率を評価するステップであって、
曲率の値の領域が有限数の値に離散化され、曲率が離散化された領域において評価される、ステップと、
(ii)画像に基づいて地形起伏を定義するステップであって、ピクセルの各々の高度は、ステップ(i)で評価された曲率に対応する、ステップと、
(iii)ステップ(ii)で定義された地形起伏の流域を計算して、集水域を画定するステップと、
(iv)ステップ(iii)で計算された流域に基づいてピクセルの分割を定義するステップと、
(v)ステップ(iv)で定義された分割に基づいて、画像の1つまたは複数のピクセルのグループへのセグメンテーションを定義するステップと
を含む、セグメンテーション方法を提供する。
本発明による方法は、特に効率的な方法で画像をセグメンテーションすることを可能にする。
実際、本方法は、この画像上に表される物体および/またはシーンの幾何学形状が考慮されるという意味で、幾何学的に自然な画像のセグメンテーションを得ることを可能にする。これは、ステップ(i)で評価された曲率が、例えば、各ピクセルの2次元空間データおよび/または各ピクセルの階調、および/または3D画像の各ピクセルの深度測定において、この幾何学形状を少なくとも部分的に符号化するためである。ステップ(ii)で定義された地形起伏は、より高い曲率を有するピクセルを起伏として強調表示する。ステップ(iii)で計算された流域は、当業者に知られている任意の技術、例えば、好ましくは流域セグメンテーション方法に従って計算することができる。この流域は、例えば曲率がゼロの背景壁とは異なる、より高い曲率を有するため、シーン内の物体領域および/または物体のエッジを更新することを可能にする。したがって、エッジは、曲率の連続性に従って完全に自然な方法で現れ、流域は、最大曲率の場所(したがって、不連続性)を正確にマークする。最後に、この流域は、ステップ(iv)において、ピクセルを流域によって分離される異なるグループに分割することを可能にし、これらのグループはシーンの物体領域に対応する。
本発明による方法の大きな効率は、有利にはピクセルの曲率を考慮に入れ、(潜在的に任意に)近接したピクセルのグループ化に依存しないという事実にあり、そのようなグループ化は、一般に、オーバーセグメンテーション、すなわち、多すぎるピクセルのグループへのセグメンテーション、または、例えば、グループ内で互いに接続されていないピクセルのグループを含む欠陥のあるセグメンテーションの原因。
ステップ(i)における「曲率の値の領域が有限数の値に離散化され、曲率が離散化された領域において評価される」という用語は、「曲率は有限数の値に離散化される」と(より簡潔に、当業者の通常の専門用語によれば)考慮することと完全に等価である。特に、ステップ(i)は、離散化された形態で評価された曲率を考慮に入れることを意図しているため、幾何学的に自然で特に効率的なセグメンテーション方法を提供することを可能にする。実際、そのような離散化された形態は、ほぼ同一の実際の曲率である2つの隣接ピクセルが同一の離散化された形態で評価される曲率を有するように、曲率の可能な値のスペクトルを大幅に低減することを可能にする。これは、有利には、ステップ(ii)において地形起伏を定義することを回避することを可能にし、これらはオーバーセグメンテーションを引き起こす可能性がある、多数の小さな地形変動の形態で画像内の不正確さおよび/またはノイズを反映する。このようにして、ステップ(v)で得られるセグメンテーションはより良好な品質のものとなり、方法は比較的効率的となる。好ましくは、曲率が離散化される有限数の値は、100~1600の値、より好ましくは150~1200の値、さらにより好ましくは200~800の値である。選択されるピクセルの数よりもはるかに小さいことが好ましい。
好ましくは、画像は3D画像である。有利には、3D画像は、各ピクセルが曲率の幾何学的に自然な定義を可能にする深度データを含むように、3Dカメラ(または3D撮像システム)によって取り込まれた画像である。特に、この場合、3D画像は、(3次元の)ボクセルではなく、(2.5次元の)ピクセルで構成されることが好ましい。
本発明による方法は、3Dカメラによって取り込まれたシーンを分析するのに特に有用である。その場合、シーンの分析は、好ましくは、例えば医療の状況において、または例えば3Dカメラによって時間通りまたは連続的に撮影される人物の転倒を検出するために、様々な目的のために使用される。
本発明による方法は、任意のタイプの3D画像に適している。好ましくは、3D画像は、飛行時間型カメラから生成された画像である。そのような3Dカメラは当業者に知られている。そのような3Dカメラでは、深度の知覚は、3Dカメラの範囲内の物体から反射された光波面の形状から得られる。有利には、飛行時間型カメラは、物体および/またはシーンの完全な走査を必要とせずに、非常に短時間で複数の3D画像の取得を可能にする。
より正確には、この場合、本発明による方法は、飛行時間型カメラによって生成された3D画像のセグメンテーション方法からなる。
それにもかかわらず、本発明による方法は、飛行時間型カメラから生成された3D画像に決して限定されない。構造化光カメラ、ステレオカメラ、LIDAR、レーダ、またはソナーなどの撮像システムによって取り込まれた画像は、本発明の範囲外にはならない。より一般的には、本発明による方法は、当業者に知られている任意の他の性質の画像をセグメンテーションするために使用することができる。
本明細書の文脈において、「ピクセル」の概念は当業者に知られていると仮定される。簡単に言えば、ピクセルは画素である。3D画像内のピクセルは深度測定値を含むので、3次元空間で表現することができ、その3次元空間内の値を用いてノイズの多い測定値(またはランダム変数)として解釈することができ、それによって画像をポイントのクラウドと関連付けることができる。
本明細書の文脈において、「曲率」は、多かれ少なかれ湾曲した特徴の定量的尺度を指す。リーマン多様体のポイントにおける曲率、例えばガウス曲率を評価することが知られている。本発明の文脈において、ピクセルにおいて評価される曲率のこの概念は、ピクセルに関連するポイントのクラウドを少なくとも局所的に補間する多様体のポイントにおける曲率に優先的に対応する。いくつかの曲率定義のうちの1つに関連する曲率を提供するそのような曲率を計算するいくつかの方法がある。このような曲率算出方法の選択に応じて、画像のセグメンテーションは変動しやすい。しかしながら、本発明は、画像のピクセルにおける(離散化された)曲率評価からの地形起伏の定義に主に基づいているため、この選択に限定されない。曲率計算方法および選択された離散化にかかわらず、ステップ(i)で評価された曲率は、画像の基礎となる幾何学形状を効果的に取り込む。特に、幾何学的に自然な画像のセグメンテーションを得るという観点からの本発明による方法の有効性は、ステップ(i)の好ましい実施に依存しない。ステップ(i)の曲率の評価が主成分分析に基づくそのような好ましい実施は、以下で主張および論じられ、これは好ましくはノイズの多い測定値(またはランダム変数)として解釈されるピクセルの集合に(少なくとも局所的に)適用される。
本明細書の文脈において、「離散化」(およびその派生語、例えば「離散化する」)という用語は、連続データ(すなわち、値の連続空間、典型的には実区間において任意の値をとることができるものである)の離散データ(すなわち、値の離散空間において任意の値をとることができるもの)への変換、または同様に、連続領域の離散(および好ましくは有限)領域への変換として理解されるべきである。そのような離散化は、例えば、そのような各連続データを最も近い離散値に(好ましくは、値の実際の線上の通常のユークリッド距離に対して)投影することによって、または換言すれば、連続データに最もよく近似する離散値を選択することによって行うことができる。非常に基本的な例として、区間[0,10]が11個の自然値0、1、2、3、4、5、6、7、8、9および10に離散化される場合、この区間の連続データは、従来の丸めによってこの離散セットに投影され得る。例えば、この離散化により得られる離散空間では、連続空間[0,10]における5.23864の評価が5となる。したがって、連続空間において5に近いと評価される2つの値は、離散空間において正確に5となる。これは、曲率が好ましくは値の連続空間において評価され、次いで連続空間を離散化することによって得られた値の離散空間において離散化された形態で評価されるように、ステップ(i)に適用される。
より具体的には、好ましくは、ステップ(i)は、
-領域からなる実有界区間内の曲率を評価する第1のサブステップと、
-区間を有限数の値に離散化する第2のサブステップと
を含む。
好ましくは、これはまた、離散化された形態で、すなわち離散化された区間で曲率を(再)評価する第3のサブステップを含む。
特に、ステップ(i)は、一方では、(領域に対応する連続空間を構成する)実有界区間に属する特定の実数としての各ピクセルにおける曲率の評価を含み、他方では、この区間を有限数の値に離散化することを含み、これにより、この離散化は、そのような各曲率値に適用される。好ましい区間は、[0,r]に対応する閉じた有界区間であり、r>0である。当業者は、[0,r]:={x∈R:0≦x≦r}を知っている。そのような実際の閉じた有界区間は(例えば、区間上でこの同じ有限数の連続的に等距離のポイントを選択することによって)有限数の値に容易かつ効率的に離散化することができるので、曲率をそのような区間でその値をとると考えることが特に有利である。これは、実数線のポイントの連続体においてその値をとるリーマン幾何学の古典的な規則的な曲率には当てはまらない。実際、リーマン曲率の評価において、そのような無限の連続空間を説明する有限数の値を選択することは明らかではない。好ましくは、区間は[0,1/3]である。値r=1/3は、曲率に係数を掛けることで変更できるため、あまり重要ではない。以下では、本発明の文脈に完全に適合し、[0,1/3]における曲率を評価することを可能にするステップ(i)の好ましい実施が与えられる。この区間は、有利には、n個の値(n>1の場合、好ましくは100~1600、より好ましくは150~1200、さらにより好ましくは200~800の任意の自然数)に容易に離散化することができることに留意されたい。例えば、値(m/3)(n-1)-1からなる離散空間を考え、mは0~n-1の間の自然数で変化する。
本明細書の文脈において、「地形起伏」という用語は、好ましくは、表面の高度変動の尺度を指す。この用語の意味は、優先的に、地形学の分野で有するものに対応する。ステップ(ii)で定義された地形起伏は、画像のピクセルにおける高度の関連付けに対応する。
本明細書の文脈において、「流域」の概念には、好ましくは、地形学の分野の意味と同等の意味が与えられる。したがって、これは、地理的に「集水域」と呼ばれる、地形起伏を1つまたは複数の領域に分割する境界である。流域によって分離されたこのような隣接領域では、水、例えば雨水は、第1または第2の領域内のポイントから流れるかどうかに応じて、これらの領域のうちの1つのみにおいて異なる方向に流れる。この流域の概念は、連続的な地形起伏上で古典的に定義される。本発明の文脈では、地形起伏はピクセル単位で定義されるため、主に離散的である。この文脈には、流域の概念のいくつかの定義がある。本発明自体は、いかなるポイントにおいても、流域計算方法の選択によって限定されない。実際、本発明は、少なくとも、画像のピクセルにおける曲率から得られる地形起伏に基づいてこの流域計算を実行するという特徴に基づいており、特定の計算方法のこの選択に基づいていない。特に、幾何学的に自然な画像のセグメンテーションを得るという観点からの本発明による方法の有利な特徴は、ステップ(iii)の好ましい実施に依存しない。さらに、本発明のこの概要において後述するように、ステップ(ii)~(v)が好ましくは既知の流域セグメンテーション方法によって実施される、流域を計算するいくつかの方法がある。
本明細書の文脈では、セットの「分割」という用語は、セットの各要素が1つのみのサブセットに属するように、セットをサブセットに分割することである。典型的には、画像のセグメンテーションは、画像を構成するピクセルの1つまたは複数のピクセルのグループへの分割であり、これらのグループに基づき、もはや各ピクセルに基づかず、画像のさらなる処理および/または解析を容易にする。この処理および/またはこの解析を容易にするために、画像のセグメンテーションが効率的に行われることが重要である。
有利には、本発明による方法は、ステップ(0)のために選択されたピクセルに対してステップ(iv)で定義された分割に基づいてステップ(v)で効率的な画像セグメンテーションを定義することを可能にし、その結果、セグメンテーションのピクセルの各グループは、この分割の唯一のサブセットを含む。セグメンテーションの1つまたは複数のピクセルのグループは、ステップ(iii)で計算された流域によって排他的に分離される。
好ましくは、画像はピクセルのセットからなり、ステップ(0)で選択されるピクセルはそのセット内のすべてのピクセルからなる。これにより、画像のすべてのピクセルに基づいてより正確な地形起伏を得ることができ、したがって、その流域をより正確に計算することができ、したがって、画像のより正確なセグメンテーションを定義することができる。本発明はこの実施形態に限定されず、ステップ(0)で選択されたピクセルのセットは、画像を構成するピクセルのセットのすべてのピクセルを含まなくてもよい。特に、ステップ(0)で選択されたピクセルは、画像のピクセルの少なくとも50%、より好ましくは少なくとも90%を含むことが好ましい。有利には、この場合、方法のステップ(i)~(iii)は、画像のすべてのピクセルがステップ(0)から選択される場合よりも速く実行される。
ここで、各ピクセルにおける曲率を評価するためのステップ(i)の好ましい実施を紹介する。
本発明の好ましい実施形態によれば、3D画像について、ステップ(i)は、以下のサブステップ、
(i.1)曲率が評価されるピクセルごとに隣接ピクセルの集合を定義するステップと、
(i.2)隣接ピクセルの共分散行列を計算するステップと、
(i.3)ステップ(i.2)で計算された共分散行列の固有値を計算するステップと、
(i.4)ステップ(i.3)で計算された固有値に基づいて曲率を評価するステップと
を含む。
これらのサブステップは、より好ましくは、ステップ(i)の上述の第1のサブステップに含まれる。
ステップ(i)のこの好ましい実施形態は、各ピクセルにおける曲率の迅速かつ容易な計算を可能にする。局所的な曲率計算が使用されるべきであることに基づいて、ピクセルは離散構造を形成するという事実を十分に考慮する。この目的のために、ピクセルにおける曲率は、ピクセル近傍の局所的な幾何学形状を反映する、問題のピクセルを囲むいくつかの隣接ピクセルに対して評価される。これらの隣接ピクセルは、好ましくは、曲率が評価されるべきピクセルを含む。これらは、本明細書で前述したように、共分散行列を計算するために、3次元空間内の値を有するノイズの多い測定値(またはランダム変数)として解釈される。したがって、曲率が評価されるピクセルの隣接ピクセルについて、P1,2,3,...,として示され、N∈N\{0}であり、1≦j≦Nについて、ピクセルPが3次元空間内でトリプレットに関連する場合、
Figure 0007403175000001
これらのピクセルの重心がトリプレットに対応する場合、
Figure 0007403175000002
次に、隣接ピクセルの共分散行列は、以下に対応し、
Figure 0007403175000003
共分散行列のこの好ましい表現は、当業者に知られている従来の行列表記を使用する。特に、指数tは行列の転置に対応する。
サイズ(3、3)の対称性であるこの共分散行列、その対角化の問題、ならびにその固有値および固有ベクトルの計算に対処することができる。前述の好ましい文脈において、λ1≦λ2≦λ3が、昇順に並べられたステップ(i.3)において計算された固有値を指定する場合、(サブステップ(i.4)において評価された)曲率は、好ましくは、以下の値に一致し、
Figure 0007403175000004
この数は、隣接ピクセルを補間する多様体の曲率として解釈される。したがって、有利には、ステップ(i)のこの好ましい実施形態は、ピクセルにおける曲率の単純かつ明示的な表現を提供する。後者は、実際の閉じた有界区間[0,1/3]においてその値をとる。次いで、この区間は、好ましくは(例えば、先に与えられた例のうちの1つに従って)(好ましくはステップ(i)の上述の第2のサブステップにおいて)有限数の値に離散化され、この離散化は(例えば、前述したように、離散化された区間に最も近い離散値への丸めおよび/または投影に従って)評価された曲率に適用される。それにもかかわらず、曲率について述べた有理数は、任意選択的に、離散値として直接使用することができる。
具体的には、ステップ(i.2)および(i.3)は、好ましくは、隣接ピクセルの主成分分析によって実施される。そのような解析は、上記で説明した計算を介して、共分散行列の固有ベクトルに関連する隣接ピクセルの主分散軸を定義することを可能にする。有利には、好ましくは、隣接ピクセルの補間多様体に対する法線ベクトルをこれらの固有ベクトルから取得することができ、その結果、曲率が評価されるピクセルの向きを決定することができる。簡単に説明すると、ステップ(i.3)はまた好ましくは、ステップ(i.2)で計算された共分散行列の固有ベクトルの計算を含み、
ステップ(i)は、以下のサブステップ、
(i.5)ステップ(i.3)で計算された固有ベクトルに基づいて、曲率がステップ(i.4)で評価されるピクセルの向きを決定するステップを含む。
この向きは、ピクセルの向きをその隣接ピクセルのうちの1つまたは複数の向きと比較することによって、本発明による方法によって得られたセグメンテーションを検証するのに有用である。このようにして、ステップ(iv)の分割のピクセルのグループ、およびこれらのピクセルのグループによって表される物体領域の全体的な向きを強調表示することができる。さらに、この概要で後述するように、向きは、ステップ(v)のセグメンテーションのピクセルのグループに対する追加のセグメンテーションプロセスで使用することもできる。この目的のために、ステップ(v)のセグメンテーションのピクセルのグループの1つのエッジ上のピクセルに関連付けられた向きおよび/または他のパラメータは、ステップ(v)のセグメンテーションのピクセルの別のグループの隣接するエッジ上のピクセルの向きおよび/または他のパラメータと比較され、これら2つのピクセルのグループが画像の同じ平面または同じ物体領域の一部を形成する可能性があるかどうかを判定する。
好ましくは、ステップ(i)の前述の好ましい実施形態のいずれか1つによれば、ステップ(i.1)で定義された隣接ピクセルの集合は、曲率が評価されるピクセルを含む最大100個のピクセルを含む。これらの最大100個のピクセルは、好ましくは、正方形、ディスク、楕円形、長方形、菱形、十字形の中の幾何学形状に分布する。しかしながら、別の幾何学的形態は本発明の範囲外ではない。さらにより好ましくは、隣接ピクセルの集合は、曲率が評価されるピクセルを中心とする、9つのピクセルの辺を有する正方形に実質的に分布する最大81個のピクセルからなる。「隣接ピクセル」という用語は、好ましくは最も近い隣接ピクセルを指す。しかしながら、この用語は、第2および/または第3および/または第4の最も近い隣接ピクセルの任意選択の選択を排除することはできない。
好ましくは、隣接ピクセルの集合は、曲率が評価されるピクセルを含み、曲率が評価されるピクセルを中心とする5ピクセルの正方形に実質的に分布する最大25ピクセルからなる。
より好ましくは、この集合は、曲率が評価されるべきピクセルを中心とする、3ピクセルの辺を有する正方形に実質的に分布する9つのピクセルからなる。9つの隣接ピクセルのこの構成は、隣接ピクセルの数を最小限に抑えながら、各方向のピクセルの変化を考慮に入れた曲率を評価することを可能にし、これは、有利には曲率の計算の複雑さ、したがってこの曲率を数値的に評価するのに必要な時間を最小限に抑えることになるので、有利である。ここで、流域の計算のためのステップ(iii)の好ましい実施について論じる。
好ましくは、ステップ(iii)の流域は、流域セグメンテーション方法で使用されるものと同様のアルゴリズム技術に基づいて計算される。そのような方法は、当業者に一般的に知られている。地形起伏に基づいて、起伏の氾濫の仮想シミュレーションによる流域の計算が提案される。この氾濫は、例えば、起伏の局所的な最小標高のポイントからの水の上昇によって、または起伏全体にわたる降雨と同様の水の全体的な流出によってシミュレートすることができる。したがって、ステップ(iii)のこれら2つの実施形態によれば、ステップ(iii)は、好ましくは、以下のサブステップ、
(iii.1)ステップ(i)で評価された曲率が局所的に最小であるピクセルのサブセットを決定するステップと、
(iii.2)ピクセルのサブセットのピクセルの各々からの水の仮想上昇によって地形起伏の氾濫をシミュレートするステップと、
(iii.3)ステップ(iii.2)のシミュレーションに基づいて流域を計算するステップと
を含む。
または、以下のサブステップ、
(iii.1´)ピクセルの各々からの仮想的な水の流出による地形起伏の氾濫をシミュレートするステップと、
(iii.2´)ステップ(iii.1´)のシミュレーションに基づいて流域を計算するステップと
を含む。
有利には、前述のように流域を計算するためのアルゴリズム方法は、ステップ(0)で選択されたピクセル数において線形複雑性を有し、これにより、非常に高速かつ効率的な性能が可能になる。
実際には、本発明による方法が適用される画像は、異なるソースからの不正確さおよび/またはノイズを含む可能性が高い。このようにして、画像上に表現される表面は、時々、オーバーセグメンテーションにつながる可能性がある小さな変化を受ける。本発明による方法の効率にもかかわらず、特に3D画像では、画像上のこれらの不正確さおよび/またはノイズを可能な限り制限することが望ましい。したがって、本方法は、好ましくは、以下の技術的特徴、
-ステップ(0)および/またはステップ(i)の前に、画像を前処理するステップであって、前処理ステップは好ましくは画像のノイズを低減するためのフィルタリングを含む、ステップ、および/または
-ステップ(v)で定義されたセグメンテーションのピクセルのグループに対する後処理ステップのうちの1つまたは複数を含む。
前述の後処理ステップは、当業者に知られているセグメンテーションプロセスのいずれか1つのステップを含むことができる。次いで、ステップ(v)で定義されたセグメンテーションが画像のさらなる処理および/または分析を実行するために最も効率的であることを保証するために、本発明による方法の後に順次使用される。この後処理は、好ましくは、ステップ(v)で定義されたセグメンテーションからの画像内の隣接ピクセルのグループの比較を含む。この比較の目的は、隣接ピクセルの2つのそのようなグループが画像の同じ平面および/または同じ物体領域の一部であり得るかどうかを判定することである。2つのそのようなグループの併合および/またはグループ化は、それらが実際に比較を考慮して画像の同じ平面または同じ物体領域の一部であり得る場合、優先的に実行される。このようにして、本発明のこの特定の実施形態による方法は、特に効率的な方法で連続的な平面および/または表面を配置することを可能にする。
好ましくは、本発明のこの概要において前述したように、この比較は、ピクセルのグループのエッジにおけるピクセルの向きに基づいて行われ、向きは、好ましくはピクセルに対して主成分分析技術を使用して、ステップ(i)において計算された。
本発明はまた、本発明による方法の実施形態のいずれかによる方法を実行するための手段を備えるコンピュータシステムを提供する。本発明はまた、コンピュータプログラムが実行されると、本発明の任意の一実施形態による方法を実行させる命令を含むコンピュータプログラムを提供する。本発明はまた、前述のコンピュータプログラムが記憶されるコンピュータ可読媒体を提供する。
コンピュータシステムは、好ましくは、以下のハードウェアまたはコンピュータ機器、
-任意のアルゴリズム、好ましくはPC型アーキテクチャまたは埋め込み型アーキテクチャ(ARM)のアルゴリズムを実行するためのプロセッサを有する少なくとも1つのコンピュータと、
-アプリケーションおよび/またはアルゴリズムに特有のASICタイプの集積回路と、
-製造後に再構成可能(または再プログラム可能)であるFPGAタイプの論理集積回路と
のうちの少なくとも1つを備える。
コンピュータ可読媒体は、デジタル情報を記憶することができる任意の媒体または媒体のセットを意味する。コンピュータ可読媒体は、例えば、以下の要素、すなわち、デジタルメモリ、サーバ、USBキー、コンピュータのうちの少なくとも1つを備えることができる。クラウドにあってもよい。
本発明による方法のすべての実施形態およびすべての利点は、必要な変更を加えて、本発明によるコンピュータシステム、本発明によるコンピュータプログラム、および本発明によるコンピュータ可読媒体に置き換えられる。
本発明は、特定の実施形態に関連して上述されたが、これらは例示的なものであり、限定的であると見なされるべきではない。一般に、本発明が本発明の概要に示されたおよび/または記載された例に限定されないことは、当業者には明らかであろう。本発明は、新規な特徴の各々およびそれらのすべての組み合わせを含む。
本発明の概要の理解は、添付の図1によって完了することができる。
本発明による画像セグメンテーション方法の簡略化されたフローチャートを表す。図示されたステップ(0)、(i)、(ii)、(iii)、(iv)および(v)は、特許請求され、本発明の概要に記載されたステップ(0)、(i)、(ii)、(iii)、(iv)および(v)に対応する。これらのステップは、この順序で実行される。
一般に、本明細書の図面または図は概略的なものであり、限定的なものではない。図面における参照番号および/または文字の存在は、これらの番号および/または文字が特許請求の範囲に示されている場合であっても、限定するものではない。図面の描画は縮尺通りではない。さらに、同様の要素は同様の参照符号で示されており、同じまたは同様の要素は図中で同じ参照符号を有することがある。
最初に、3D画像のための本発明による方法の簡単な例が提示され、画像のピクセルの大部分が好ましくはステップ(0)のために選択される。
一例として、素壁の前に置かれた球体、例えば風船からなるシーンから正面の3D画像が取得されたとする。この場合、ステップ(i)において、壁に関連するピクセルにおける曲率は実質的に0であり、球に関連付けられたピクセルにおける曲率は、0とは明らかに異なる厳密に正の数である。ステップ(ii)において、定義づけられる地形起伏は、球に関連するピクセルに対応する位置を除いて、実質的に平坦である。これらの位置では、球体のエッジ付近に急激な上昇が観察され、この上昇は円形であり、シーンの正面に露出された球体の面の中央のピクセルに対応する窪みを囲む。画像は3D画像であるため、画像上の球のエッジのピクセルと露出面の中央のピクセルとの間の区別は、3D画像のピクセルの深度測定を考慮して行われる。ステップ(iii)において、流域は、前述の急激な上昇に対する地形起伏に対応するほぼ円であることが明らかである。このようにして、ステップ(iv)において、ピクセルは、2つのグループ、すなわち、流域によって囲まれた球のグループと、壁のグループとに分割される。この基本的な例では、球を壁の前で有利な方法で強調表示することができる。
ここで、飛行時間型カメラから生成された3D画像を分割するための本発明による方法の高い効率を示す例を開発する。
一例として、3D画像は、実物体および/または実シーン上の角度、例えばシーン内の2つの壁の間の接合角を表すと仮定される。飛行時間型カメラによって取り込まれたそのような画像の場合、角度は、取得された3D画像上で、2つの壁を接続する曲線になり、その結果、これらの壁の間の接合部に続く急な角度の不連続性はない。したがって、2つの壁の間の接合部に関連付けられたピクセルにおける曲率の概念は、十分に定義され、有限数に関連付けられる。さらに、これに関連して本発明による方法の別の利点は、ステップ(iii)が、壁の面からの3D画像のセグメンテーションの実施を可能にすることであり、これは、壁の面が実質的にゼロの曲率であるためである。次いで、好ましくは、流域セグメンテーション方法ステップによる地形起伏の仮想氾濫によって、アルゴリズム的に計算された流域は、上記で説明したように、後者の近傍がより大きいが依然として明確に定義された曲率を呈するため、2つの壁の各々およびそれらの接合部を明確に区別することを可能にする。これに関連して、例えば、所定の半径に基づいて近くのピクセルをグループ化するセグメンテーション方法は、これらの2つの壁に関連付けられたピクセルの、多数のグループへの分割を作成し、その結果、2つの壁の各々およびそれらの接合部は、3D画像のセグメンテーションの終わりに明確に区別することができない。これは、本発明による方法が、特にそのような飛行時間型カメラによって取得された画像上で効率的、正確かつ迅速である理由である。これらのカメラは非常によく知られており、現在市場で広く使用されている。したがって、本発明による方法がこの文脈において有効であることは一層有利である。
要約すると、本発明は、画像のピクセルにおける曲率の評価に適用される流域セグメンテーションを含むコンピュータ実施画像のセグメンテーション方法に関する。
より具体的におよび/またはより一般的には、本発明による方法は、ピクセルを含む画像のセグメンテーション方法として説明することができ、方法は、コンピュータ実施され、以下のステップ、
(A)各ピクセルにおける曲率を評価するステップと、
(B)ステップ(A)の曲率の評価に流域セグメンテーションアルゴリズム方法を適用するステップと
を含む。
特許請求された発明によるセグメンテーション方法は、ステップ(i)(および/または(A))で評価された曲率の離散化を含む。しかしながら、本発明の代替の実施形態では、ステップ(i)がステップ「(i)各ピクセルにおける曲率を評価するステップ、このステップは、サブステップ(i.1)~(i.4)を含む」に置き換えられる、本発明による(3D)画像のセグメンテーション方法が提案される(後者は、本発明の概要に記載されている)。実際、曲率の離散化はこの代替実施形態では言及されていないが、本発明の概要に記載されている曲率の計算方法の多くの利点は、この代替実施形態にそれ自体の発明の状態を与えるのに十分である。この場合、ステップ(i)(および/または(A))は次に主成分分析によって実施される。
この文書において、動詞「備える」ならびにその変形、同義語および活用形の使用は、言及されたもの以外の要素の存在を決して排除することができないことに留意されたい。同様に、要素を導入するための本明細書における不定冠詞「a」、「one」、または定冠詞「the」の使用は、これらの要素の複数の存在を排除するものではない。
本明細書の文脈において、「コンピュータ」は、好ましくは、本発明による方法を実行することができる任意の計算ユニットを意味すると理解される。そのようなコンピュータは、例えば、プロセッサ、および/またはコンピュータネットワーク、および/またはプログラマブルユニット、および/またはデータ処理システム、および/またはサーバを備えることができる。
「コンピュータ可読媒体」は、好ましくは、デジタル情報を記憶することができる任意の媒体または媒体のセットである。そのような媒体は、例えば、デジタルメモリ、および/またはサーバ、および/またはUSBスティック、および/またはコンピュータを含むことができる。

Claims (18)

  1. 画像のセグメンテーション方法であって、
    該方法はコンピュータ実施され、
    (0)前記画像のピクセルを選択するステップと、
    (i)前記ピクセルの各々における曲率を評価するステップであって、
    該曲率の値の領域が有限数の値に離散化され、該曲率が前記離散化された領域において評価される、ステップと、
    (ii)前記画像に基づいて地形起伏を定義するステップであって、前記ピクセルの各々の高度は、ステップ(i)で評価された前記曲率に対応する、ステップと、
    (iii)ステップ(ii)で定義された前記地形起伏の流域を計算して、集水域を画定するステップと、
    (iv)ステップ(iii)で計算された前記流域に基づいて前記ピクセルの分割を定義するステップと、
    (v)ステップ(iv)で定義された前記分割に基づいて、前記画像の1つまたは複数のピクセルのグループへのセグメンテーションを定義するステップと、
    を含む、セグメンテーション方法。
  2. ステップ(0)は、前記画像のすべての前記ピクセルを選択することを特徴とする、請求項1に記載のセグメンテーション方法。
  3. ステップ(i)が、
    -前記領域からなる実有界区間内の前記曲率を評価する第1のサブステップと、
    前記区間を有限数の値に離散化する第2のサブステップと、を含むことを特徴とする、請求項1または2のいずれか一項に記載のセグメンテーション方法。
  4. 前記区間は、[0,r]に対応する閉じた有界区間に対応し、r>0であることを特徴とする、請求項3に記載のセグメンテーション方法。
  5. 前記画像が3D画像であることを特徴とする、請求項1から4のいずれか一項に記載のセグメンテーション方法。
  6. 前記3D画像は、飛行時間型カメラから生成されることを特徴とする、請求項5に記載のセグメンテーション方法。
  7. ステップ(i)が、以下のサブステップ、
    (i.1)前記曲率が評価されるピクセルごとに隣接ピクセルの集合を定義するステップと、
    (i.2)前記隣接ピクセルの共分散行列を計算するステップと、
    (i.3)ステップ(i.2)で計算された前記共分散行列の固有値を計算するステップと、
    (i.4)ステップ(i.3)で計算された前記固有値に基づいて前記曲率を評価するステップと、
    を含むことを特徴とする、請求項5または6に記載の方法。
  8. 前記曲率が値、
    Figure 0007403175000005
    と一致し、λ1≦λ2≦λ3であり、昇順に並べられたステップ(i.3)で計算された前記固有値を指定していることを特徴とする、請求項7に記載の方法。
  9. ステップ(i.1)で定義された隣接ピクセルの前記集合は、前記曲率が評価される前記ピクセルを含み、前記曲率が評価される前記ピクセルを中心とする、9ピクセルの辺を有する正方形に実質的に分布する最大81ピクセルからなることを特徴とする、請求項7または8に記載の方法。
  10. ステップ(i.1)で定義された隣接ピクセルの前記集合は、前記曲率が評価される前記ピクセルを中心とする、3ピクセルの辺を有する正方形に実質的に分布する9ピクセルからなることを特徴とする、請求項9に記載の方法。
  11. 前記ステップ(i.3)はまた、ステップ(i.2)で計算された前記共分散行列固有ベクトルの計算を含み、
    ステップ(i)は、以下のサブステップ、
    (i.5)ステップ(i.3)で計算された前記固有ベクトルに基づいて、前記曲率がステップ(i.4)で評価される前記ピクセルの向きを決定するステップを含むことを特徴とする、請求項7から10のいずれか一項に記載の方法。
  12. ステップ(iii)は、以下のサブステップ、
    (iii.1)ステップ(i)で評価された前記曲率が局所的に最小である前記ピクセルのサブセットを決定するステップと、
    (iii.2)前記ピクセルの前記サブセットの前記ピクセルの各々からの水の仮想上昇によって前記地形起伏の氾濫をシミュレートするステップと、
    (iii.3)ステップ(iii.2)シミュレーションに基づいて前記流域を計算するステップと、
    を含むことを特徴とする、請求項1から11のいずれか一項に記載の方法。
  13. ステップ(iii)は、以下のサブステップ、
    (iii.1´)前記ピクセルの各々からの仮想的な水の流出による前記地形起伏の氾濫をシミュレートするステップと、
    (iii.2´)ステップ(iii.1´)シミュレーションに基づいて前記流域を計算するステップと、
    を含むことを特徴とする、請求項1から11のいずれか一項に記載の方法。
  14. ステップ(0)の前に前記画像を前処理するステップを含み、前記前処理するステップは、前記画像のノイズを低減するためのフィルタリングを含むことを特徴とする、請求項1から13のいずれか一項に記載の方法。
  15. ステップ(v)で定義された前記セグメンテーションのピクセルのグループに対する後処理ステップをさらに含むことを特徴とする、請求項1から14のいずれか一項に記載の方法。
  16. 請求項1から15のいずれか一項に記載の方法を実行するための手段を備える、コンピュータシステム。
  17. 命令を含むコンピュータプログラムであって、前記命令が、前記コンピュータプログラムが実行されると請求項1から15のいずれか一項に記載の方法を実行させる、コンピュータプログラム。
  18. 請求項17に記載のコンピュータプログラムが記憶されたコンピュータ可読媒体。
JP2021537099A 2018-12-27 2019-12-23 画像を分割する方法 Active JP7403175B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
BE20185955A BE1026937B1 (fr) 2018-12-27 2018-12-27 Méthode de segmentation d'une image
BEBE2018/5955 2018-12-27
PCT/EP2019/086962 WO2020136180A1 (fr) 2018-12-27 2019-12-23 Méthode de segmentation d'une image

Publications (2)

Publication Number Publication Date
JP2022514978A JP2022514978A (ja) 2022-02-16
JP7403175B2 true JP7403175B2 (ja) 2023-12-22

Family

ID=65268697

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021537099A Active JP7403175B2 (ja) 2018-12-27 2019-12-23 画像を分割する方法

Country Status (6)

Country Link
US (1) US20220076426A1 (ja)
EP (1) EP3903282B1 (ja)
JP (1) JP7403175B2 (ja)
BE (1) BE1026937B1 (ja)
ES (1) ES2949334T3 (ja)
WO (1) WO2020136180A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007528045A (ja) 2003-06-16 2007-10-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 画像のセグメント化
US20150078648A1 (en) 2013-09-13 2015-03-19 National Cheng Kung University Cell image segmentation method and a nuclear-to-cytoplasmic ratio evaluation method using the same
US20180082109A1 (en) 2016-09-20 2018-03-22 Apple Inc. Curvature-based face detector

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007528045A (ja) 2003-06-16 2007-10-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 画像のセグメント化
US20150078648A1 (en) 2013-09-13 2015-03-19 National Cheng Kung University Cell image segmentation method and a nuclear-to-cytoplasmic ratio evaluation method using the same
US20180082109A1 (en) 2016-09-20 2018-03-22 Apple Inc. Curvature-based face detector

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ROMSTAD, Bard、他1名,Mean-curvature watersheds: A simple method for segmentation of a digital elevation model into terrain units [オンライン],2012年,p.1-18,インターネット:<URL: https://duo-utv.uio.no/bitstream/handle/123456789/2300/9159.pdf>

Also Published As

Publication number Publication date
ES2949334T3 (es) 2023-09-27
BE1026937B1 (fr) 2020-07-28
BE1026937A1 (fr) 2020-07-24
EP3903282B1 (fr) 2023-06-07
EP3903282C0 (fr) 2023-06-07
US20220076426A1 (en) 2022-03-10
EP3903282A1 (fr) 2021-11-03
JP2022514978A (ja) 2022-02-16
WO2020136180A1 (fr) 2020-07-02

Similar Documents

Publication Publication Date Title
Wolff et al. Point cloud noise and outlier removal for image-based 3D reconstruction
JP6261489B2 (ja) 3次元点群から平面を抽出する、方法、画像処理装置およびプログラムを記憶した非一次的なコンピュータ可読媒体
Hamzah et al. Stereo matching algorithm based on per pixel difference adjustment, iterative guided filter and graph segmentation
Bódis-Szomorú et al. Fast, approximate piecewise-planar modeling based on sparse structure-from-motion and superpixels
EP2118854B1 (en) Exemplar/pde-based technique to fill null regions and corresponding accuracy assessment
US8786595B2 (en) Systems and methods for estimating a parameter for a 3D model
US6990228B1 (en) Image processing apparatus
JP2012530323A (ja) 3次元シーンの区分的平面再構成
CN113178009B (zh) 一种利用点云分割和网格修补的室内三维重建方法
KR101909544B1 (ko) 평면 검출 장치 및 방법
WO2014190037A1 (en) Parameter estimation for mesh segmentation using random walks
WO2020019245A1 (zh) 透明物体的三维重建方法、装置、计算机设备及存储介质
FR2999325A1 (fr) Procede iteratif de determination d&#39;une image en deux dimensions ou trois dimensions a partir de signaux issus de tomographie par rayons x
Bódis-Szomorú et al. Efficient edge-aware surface mesh reconstruction for urban scenes
Saponaro et al. Reconstruction of textureless regions using structure from motion and image-based interpolation
Zhou et al. Three-dimensional (3D) reconstruction of structures and landscapes: A new point-and-line fusion method
CN113838069A (zh) 基于平面度约束的点云分割方法和系统
JP7403175B2 (ja) 画像を分割する方法
KR20190068168A (ko) 3차원 영상 생성 장치 및 방법
CN116051980B (zh) 基于倾斜摄影的建筑识别方法、系统、电子设备及介质
Cao et al. Patch layout generation by detecting feature networks
CN116168384A (zh) 点云目标检测方法、装置、电子设备及存储介质
JP2005165969A (ja) 画像処理装置、及び方法
CN107808160B (zh) 三维建筑物提取方法和装置
CN112800829B (zh) 一种基于三维测量的物体局部破损程度的识别方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220927

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230914

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231205

R150 Certificate of patent or registration of utility model

Ref document number: 7403175

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150