JP2003502744A - デジタル画像セグメント化のための方法および装置 - Google Patents
デジタル画像セグメント化のための方法および装置Info
- Publication number
- JP2003502744A JP2003502744A JP2001503135A JP2001503135A JP2003502744A JP 2003502744 A JP2003502744 A JP 2003502744A JP 2001503135 A JP2001503135 A JP 2001503135A JP 2001503135 A JP2001503135 A JP 2001503135A JP 2003502744 A JP2003502744 A JP 2003502744A
- Authority
- JP
- Japan
- Prior art keywords
- pixel
- edge
- image
- pixels
- digital image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 182
- 238000003709 image segmentation Methods 0.000 title description 13
- 239000002131 composite material Substances 0.000 claims abstract description 34
- 230000008569 process Effects 0.000 claims description 95
- 239000013598 vector Substances 0.000 claims description 40
- 238000001914 filtration Methods 0.000 claims description 14
- 238000012360 testing method Methods 0.000 claims description 8
- 238000009499 grossing Methods 0.000 claims description 6
- 230000007704 transition Effects 0.000 claims 2
- 238000012804 iterative process Methods 0.000 claims 1
- 230000011218 segmentation Effects 0.000 abstract description 57
- 238000000844 transformation Methods 0.000 abstract 2
- 230000009466 transformation Effects 0.000 abstract 2
- 238000013459 approach Methods 0.000 description 10
- 230000001680 brushing effect Effects 0.000 description 9
- 238000003708 edge detection Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000009826 distribution Methods 0.000 description 7
- 230000000717 retained effect Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 238000010237 hybrid technique Methods 0.000 description 6
- 230000000750 progressive effect Effects 0.000 description 6
- 238000012937 correction Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000003247 decreasing effect Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 241000023320 Luma <angiosperm> Species 0.000 description 3
- 239000011248 coating agent Substances 0.000 description 3
- 238000000576 coating method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 210000000601 blood cell Anatomy 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 208000019838 Blood disease Diseases 0.000 description 1
- 102100029777 Eukaryotic translation initiation factor 3 subunit M Human genes 0.000 description 1
- 101100321669 Fagopyrum esculentum FA02 gene Proteins 0.000 description 1
- 101001012700 Homo sapiens Eukaryotic translation initiation factor 3 subunit M Proteins 0.000 description 1
- 241000270295 Serpentes Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000000740 bleeding effect Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 239000012084 conversion product Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 208000014951 hematologic disease Diseases 0.000 description 1
- 208000018706 hematopoietic system disease Diseases 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- NQLVQOSNDJXLKG-UHFFFAOYSA-N prosulfocarb Chemical compound CCCN(CCC)C(=O)SCC1=CC=CC=C1 NQLVQOSNDJXLKG-UHFFFAOYSA-N 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 208000007056 sickle cell anemia Diseases 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/181—Segmentation; Edge detection involving edge growing; involving edge linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20016—Hierarchical, coarse-to-fine, multiscale or multiresolution image processing; Pyramid transform
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Apparatus For Radiation Diagnosis (AREA)
- Image Generation (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
Abstract
(57)【要約】
画像セグメント化器は正確に画像をセグメント化する1以上の技術を使用する。すなわち、不完全に区分されたセグメントを塗りつぶすための革新的な十分な塗りつぶしの使用と、複数の縮尺変換の使用と、別の縮尺からのセグメント化の結果を用いて、1つの縮尺におけるセグメント化を導くことと、複数の色平面の合成物である合成画像を使用してエッジを検出することと、エッジ画素の複数のクラス使用してエッジチェーンを生成することと、複数の縮尺された変換を使用してエッジチェーンを生成することと、および/または別の縮尺で検出されたエッジに基づく1つの縮尺における擬似エッジをフィルタリングすることとを含む。
Description
【0001】
(関連出願の相互参照)
本出願は、1999年6月11日に出願された米国仮特許出願第60/139
、134号からの優先権を主張する。本明細書中、同出願の開示内容の全体を参
考のため全ての目的のために援用する。
、134号からの優先権を主張する。本明細書中、同出願の開示内容の全体を参
考のため全ての目的のために援用する。
【0002】
(発明の分野)
本発明は概して画像処理に関し、より詳細には、画像の画素色値に基づいて画
像をセグメントに自動的にセグメント化することが必要な場合における画像のセ
グメント化の問題に関する。
像をセグメントに自動的にセグメント化することが必要な場合における画像のセ
グメント化の問題に関する。
【0003】
(発明の背景)
画像のセグメント化は、1つの画像を一連の非オーバーラップ部分またはセグ
メントに区分化するプロセスであり、これらの一連の非オーバーラップ部分また
はセグメントが一体となって、画像全体を構成する。画像のセグメント化は、多
くの用途に有用であり、用途の一例として機械学習がある。
メントに区分化するプロセスであり、これらの一連の非オーバーラップ部分また
はセグメントが一体となって、画像全体を構成する。画像のセグメント化は、多
くの用途に有用であり、用途の一例として機械学習がある。
【0004】
機械学習にでは、画像は一連のセグメントにセグメント化され、その画像から
の指定セグメントまたは別の画像が、その一連のセグメントと比較される。機械
が指定セグメントとセグメント化された画像からの1つ以上のセグメントとの整
合に成功すると、その機械は、適切な結論を導き出す。例えば、画像のセグメン
ト化を用いて奇形の血球を識別して、鎌状赤血球貧血等の血液の疾患を判定する
ことができる。この例において、指定されたセグメントは、病気にかかった血液
細胞である。1つの所与の画像中のセグメントの整合数を数えることにより、患
者の血液の相対的健康度を判定することができる。他の用途として、画像領域の
圧縮および処理をその領域のセグメントに依存して行う用途がある。
の指定セグメントまたは別の画像が、その一連のセグメントと比較される。機械
が指定セグメントとセグメント化された画像からの1つ以上のセグメントとの整
合に成功すると、その機械は、適切な結論を導き出す。例えば、画像のセグメン
ト化を用いて奇形の血球を識別して、鎌状赤血球貧血等の血液の疾患を判定する
ことができる。この例において、指定されたセグメントは、病気にかかった血液
細胞である。1つの所与の画像中のセグメントの整合数を数えることにより、患
者の血液の相対的健康度を判定することができる。他の用途として、画像領域の
圧縮および処理をその領域のセグメントに依存して行う用途がある。
【0005】
本明細書中において用いる用語として、画像という用語は、多次元信号から導
出されたデータである。多次元信号は、自然にまたは人工的に発生または生成さ
れ得る。この多次元信号(多次元信号の次元数は、1、2、3またはそれ以上で
あり得る)は画素色値のアレイとして表現され得、これにより、アレイ中に配置
され、各画素の色値に従って着色された画素が、画像を表現する。各画素は1つ
のロケーションを有し、また、各画素を、当該ロケーションにおける点としてま
たは当該画素周囲の領域を満たす形状としてみなすことができ、これにより、当
該画像中の任意の点を、画素領域の「中」にあると見なすかあるいは当該画素の
一部であると見なす。画像自身は、ディスプレイ上または印刷ページ上の多次元
画素アレイ、メモリ中に格納されたアレイ、あるいは、送信されて画像を表現す
るデータ信号であり得る。多次元画素アレイは、2次元画像用の2次元アレイ、
3次元画像用の3次元アレイ、または他のいくつかの数の次元であり得る。
出されたデータである。多次元信号は、自然にまたは人工的に発生または生成さ
れ得る。この多次元信号(多次元信号の次元数は、1、2、3またはそれ以上で
あり得る)は画素色値のアレイとして表現され得、これにより、アレイ中に配置
され、各画素の色値に従って着色された画素が、画像を表現する。各画素は1つ
のロケーションを有し、また、各画素を、当該ロケーションにおける点としてま
たは当該画素周囲の領域を満たす形状としてみなすことができ、これにより、当
該画像中の任意の点を、画素領域の「中」にあると見なすかあるいは当該画素の
一部であると見なす。画像自身は、ディスプレイ上または印刷ページ上の多次元
画素アレイ、メモリ中に格納されたアレイ、あるいは、送信されて画像を表現す
るデータ信号であり得る。多次元画素アレイは、2次元画像用の2次元アレイ、
3次元画像用の3次元アレイ、または他のいくつかの数の次元であり得る。
【0006】
画像は、物理的空間または平面の画像であるか、あるいは、シミュレートされ
、かつ/またはコンピュータにより生成される空間あるいは平面の画像であり得
る。コンピュータグラフィックの分野において、共通の画像は、コンピュータに
より生成される3次元空間(例えば、オブジェクトの幾何モデルオブジェクトお
よび3次元空間中の光源)の2次元のビューである。1つの画像は、1つの画像
または複数の画像のうちの1つであり得、適切な時間的順序で構成されると、動
画を形成する。本明細書中、これを映像シーケンスと呼ぶ。
、かつ/またはコンピュータにより生成される空間あるいは平面の画像であり得
る。コンピュータグラフィックの分野において、共通の画像は、コンピュータに
より生成される3次元空間(例えば、オブジェクトの幾何モデルオブジェクトお
よび3次元空間中の光源)の2次元のビューである。1つの画像は、1つの画像
または複数の画像のうちの1つであり得、適切な時間的順序で構成されると、動
画を形成する。本明細書中、これを映像シーケンスと呼ぶ。
【0007】
1つの画像がセグメント化されると、その画像は、複数のセグメントによって
表現される。画像全体を含む1つのセグメントが劣化する場合も、本明細書中に
おいて用いられるセグメントの定義の範囲内であるが、典型的なセグメント化で
は、1つの画像を少なくとも2つのセグメントに分割する。多くの画像において
、セグメント化では、画像を背景セグメントおよび1つ以上の前景セグメントに
分割する。
表現される。画像全体を含む1つのセグメントが劣化する場合も、本明細書中に
おいて用いられるセグメントの定義の範囲内であるが、典型的なセグメント化で
は、1つの画像を少なくとも2つのセグメントに分割する。多くの画像において
、セグメント化では、画像を背景セグメントおよび1つ以上の前景セグメントに
分割する。
【0008】
1つのセグメント化方法において、1つの画像のセグメント化を、各セグメン
トが、画素色値がセグメント内ではおおよそ均一であるが画像のエッジにおいて
劇的に変化するような1つの画像領域を表現するように行う。この工程の実施に
おいて、領域は接続される(すなわち、画素を、領域から出ることなく、領域中
の任意の1画素から領域中の他の任意の画素へと画素単位で移動させることが可
能となる)。
トが、画素色値がセグメント内ではおおよそ均一であるが画像のエッジにおいて
劇的に変化するような1つの画像領域を表現するように行う。この工程の実施に
おいて、領域は接続される(すなわち、画素を、領域から出ることなく、領域中
の任意の1画素から領域中の他の任意の画素へと画素単位で移動させることが可
能となる)。
【0009】
画素色値は、任意の数の画素色空間から選択され得る。共通に用いられる1つ
の色空間はYUV色空間として知られ、1つの画素色値を3つの成分(Y、U、
V)記述し、Y成分は、グレースケール強度または輝度を指し、U成分およびV
成分は、2つのクロミナンス成分を指す。YUV色空間は一般的には、テレビ用
途において見受けられる。別の共通の色空間をRGB色空間と呼び、R成分、G
成分およびB成分はそれぞれ、赤色成分、緑色成分および青色成分を指す。RG
B色空間は一般的には、コンピュータグラフィック表現においてCYMB(シア
ン、黄色、マゼンダ、黒色)と共に見受けられ、コンピュータプリンタで用いら
れることが多い。
の色空間はYUV色空間として知られ、1つの画素色値を3つの成分(Y、U、
V)記述し、Y成分は、グレースケール強度または輝度を指し、U成分およびV
成分は、2つのクロミナンス成分を指す。YUV色空間は一般的には、テレビ用
途において見受けられる。別の共通の色空間をRGB色空間と呼び、R成分、G
成分およびB成分はそれぞれ、赤色成分、緑色成分および青色成分を指す。RG
B色空間は一般的には、コンピュータグラフィック表現においてCYMB(シア
ン、黄色、マゼンダ、黒色)と共に見受けられ、コンピュータプリンタで用いら
れることが多い。
【0010】
画像セグメント化の一例を図1中に示す。図1において、画像10は、背景1
5上のシャツ20である。色(図1中のシャツ20の陰影は、背景15またはポ
ケット70、80の色と異なる色を示す)に基づいて、この画像をセグメントに
セグメント化することができる。従って、この実施例において、背景15、シャ
ツ20、ボタン30、40、50、60およびポケット70、80を、別個のセ
グメントにセグメント化する。この実施例において、各セグメントが極めて異な
る色を有し、かつ、画像10中のオブジェクトが画素境界においてきちんと終端
している場合、セグメント化は簡単なプロセスである。しかし、一般的には、画
像セグメントを正確に生成することは困難な問題であり、この問題は、(例えば
、「コンピュータ視覚」研究の分野において)広く研究されている。セグメント
化が困難となる場合が多い1つの理由として、典型的な画像は様々なソースから
導出されたノイズを含む(例えば、画像を物理的デバイスにより取得し、画像が
良好に規定された境界を持たない領域も含む場合におけるデジタル化プロセスの
場合。但し、これに限定されない)ことがある。
5上のシャツ20である。色(図1中のシャツ20の陰影は、背景15またはポ
ケット70、80の色と異なる色を示す)に基づいて、この画像をセグメントに
セグメント化することができる。従って、この実施例において、背景15、シャ
ツ20、ボタン30、40、50、60およびポケット70、80を、別個のセ
グメントにセグメント化する。この実施例において、各セグメントが極めて異な
る色を有し、かつ、画像10中のオブジェクトが画素境界においてきちんと終端
している場合、セグメント化は簡単なプロセスである。しかし、一般的には、画
像セグメントを正確に生成することは困難な問題であり、この問題は、(例えば
、「コンピュータ視覚」研究の分野において)広く研究されている。セグメント
化が困難となる場合が多い1つの理由として、典型的な画像は様々なソースから
導出されたノイズを含む(例えば、画像を物理的デバイスにより取得し、画像が
良好に規定された境界を持たない領域も含む場合におけるデジタル化プロセスの
場合。但し、これに限定されない)ことがある。
【0011】
画像セグメント化のタスクにアプローチする方法はいくつか有り、このような
方法をグループ化すると以下のようになる:1)ヒストグラムベースのセグメン
ト化;2)従来のエッジベースのセグメント化;3)領域ベースのセグメント化
;および4)ハイブリッドセグメント化。これらの方法において、他のアプロー
チのうちいくつかが組み合わされている。以下、これらのアプローチについてそ
れぞれ説明する。
方法をグループ化すると以下のようになる:1)ヒストグラムベースのセグメン
ト化;2)従来のエッジベースのセグメント化;3)領域ベースのセグメント化
;および4)ハイブリッドセグメント化。これらの方法において、他のアプロー
チのうちいくつかが組み合わされている。以下、これらのアプローチについてそ
れぞれ説明する。
【0012】
(1.ヒストグラムベースのセグメント化)
ヒストグラム技術に基づいたセグメント化は、各セグメント中の色分布の判定
に依存する。この技術では、セグメント化の際、画像の色面のうち1つの色面(
典型的には、強度色面(画像のグレースケール部位ともいう))のみを用いる。
この技術を行う際、プロセッサは、その面における画素色値のヒストグラムを作
成する。ヒストグラムは、一連の「間隔」を有するグラフであり、「間隔」はそ
れぞれ、1つの軸に沿って配列された値の範囲と、他の軸に沿って示される各範
囲内の値が発生する回数の全数とを示す。各セグメントにおける色分布がおおよ
そガウス分布またはベル形状の分布となり、画像全体の色分布がガウス分布の総
計となると仮定することにより、このヒストグラムを用いて、各セグメント中の
画素数を判定することができる。ヒストグラムベースの技術では、間隔のサイズ
を変更(すなわち、値範囲を増加または低減)して、高い点または低い点を探す
ことにより、個々のガウス曲線を回復させようとする。分布を確認した後、各画
素をその対応する強度範囲と共にセグメントに割り当てる。
に依存する。この技術では、セグメント化の際、画像の色面のうち1つの色面(
典型的には、強度色面(画像のグレースケール部位ともいう))のみを用いる。
この技術を行う際、プロセッサは、その面における画素色値のヒストグラムを作
成する。ヒストグラムは、一連の「間隔」を有するグラフであり、「間隔」はそ
れぞれ、1つの軸に沿って配列された値の範囲と、他の軸に沿って示される各範
囲内の値が発生する回数の全数とを示す。各セグメントにおける色分布がおおよ
そガウス分布またはベル形状の分布となり、画像全体の色分布がガウス分布の総
計となると仮定することにより、このヒストグラムを用いて、各セグメント中の
画素数を判定することができる。ヒストグラムベースの技術では、間隔のサイズ
を変更(すなわち、値範囲を増加または低減)して、高い点または低い点を探す
ことにより、個々のガウス曲線を回復させようとする。分布を確認した後、各画
素をその対応する強度範囲と共にセグメントに割り当てる。
【0013】
このヒストグラムによる方法には欠点が数多くある。色分布がガウス分布であ
るという基本的仮定は単なる推定に過ぎず、全ての画像に対して正確にはなり得
ない。さらに、2つの別個の領域が同一の強度を持つ場合、それらの領域は同じ
セグメントであると見なされる。さらに、ヒストグラムによって回復されたガウ
ス分布は、終端部が切れていることによりいくつかの画素が無くなっているため
、不完全である。さらに、このセグメント化方法は、セグメント数が既知であり
、全セグメントがおおよそ同じサイズであることを必要要件とするため、半自動
的な方法に過ぎない。
るという基本的仮定は単なる推定に過ぎず、全ての画像に対して正確にはなり得
ない。さらに、2つの別個の領域が同一の強度を持つ場合、それらの領域は同じ
セグメントであると見なされる。さらに、ヒストグラムによって回復されたガウ
ス分布は、終端部が切れていることによりいくつかの画素が無くなっているため
、不完全である。さらに、このセグメント化方法は、セグメント数が既知であり
、全セグメントがおおよそ同じサイズであることを必要要件とするため、半自動
的な方法に過ぎない。
【0014】
(2.従来のエッジベースのセグメント化)
従来のエッジベースのセグメント化では、色の差またはグレースケール強度を
用いて、1画像中の様々な領域を描写するエッジ画素を判定する。このアプロー
チでは典型的には、エッジ画素が識別できれば、そのエッジ画素は画像中の別個
の領域を完全に収容し、これによりセグメントが示されることを仮定している。
しかし、従来のエッジ検出技術では、画像中のノイズまたは他のアーティファク
トのために、エッジ画素中に実際に存在する画素全てを識別することはできない
。いくつかのエッジ画素が見付からない場合、何らかの複数の別個の領域が誤っ
て1セグメントとして識別され得る。
用いて、1画像中の様々な領域を描写するエッジ画素を判定する。このアプロー
チでは典型的には、エッジ画素が識別できれば、そのエッジ画素は画像中の別個
の領域を完全に収容し、これによりセグメントが示されることを仮定している。
しかし、従来のエッジ検出技術では、画像中のノイズまたは他のアーティファク
トのために、エッジ画素中に実際に存在する画素全てを識別することはできない
。いくつかのエッジ画素が見付からない場合、何らかの複数の別個の領域が誤っ
て1セグメントとして識別され得る。
【0015】
(3.領域ベースのセグメント化)
領域ベースのセグメント化では、同種の領域を検出して、その領域をセグメン
トとして指定しようとする。1つのクラスの領域ベースのアプローチは画像中の
小さな均一の領域と共に開始し、色値が非常に似ている近隣領域をマージして、
より大きな領域を形成しようとする。逆に、別のクラスの領域ベースのアプロー
チは画像全体と共に開始し、その画像を複数の同質の領域に分割しようとする。
これらのアプローチでは両方とも、何らかの同質性要件が満たされていない領域
において画像中に裂け目が生じる。
トとして指定しようとする。1つのクラスの領域ベースのアプローチは画像中の
小さな均一の領域と共に開始し、色値が非常に似ている近隣領域をマージして、
より大きな領域を形成しようとする。逆に、別のクラスの領域ベースのアプロー
チは画像全体と共に開始し、その画像を複数の同質の領域に分割しようとする。
これらのアプローチでは両方とも、何らかの同質性要件が満たされていない領域
において画像中に裂け目が生じる。
【0016】
第1のクラスの領域ベースのセグメント化アプローチは、オリジナルの画像を
分割する方法に応じてセグメントエッジの近似値を求める点において制約がある
。第2のクラスの領域ベースのアプローチの問題は、作成されたセグメントが、
実際に基礎となったセグメントに対して歪む傾向がある点である。
分割する方法に応じてセグメントエッジの近似値を求める点において制約がある
。第2のクラスの領域ベースのアプローチの問題は、作成されたセグメントが、
実際に基礎となったセグメントに対して歪む傾向がある点である。
【0017】
(4.ハイブリッドセグメント化)
ハイブリッド技術の目的は、今までの複数のセグメント化プロセスからのプロ
セスを組み合わせて画像セグメント化を改良することである。殆どのハイブリッ
ド技術は、エッジセグメント化と領域ベースのセグメント化との組み合わせであ
り、これらのプロセスのうち1つを用いて画像をセグメント化して、次に他のプ
ロセスを続けて行う。ハイブリッド技術は、1つのプロセスを単独で行う場合よ
りも良好なセグメントを生成しようとするものであるが、ハイブリッド方法では
、ユーザに有意な量の指導を行い、またセグメント化対象画像の知識も事前に必
要であるため、完全に自動化されたセグメント化用途には不適切であることが分
かっている。
セスを組み合わせて画像セグメント化を改良することである。殆どのハイブリッ
ド技術は、エッジセグメント化と領域ベースのセグメント化との組み合わせであ
り、これらのプロセスのうち1つを用いて画像をセグメント化して、次に他のプ
ロセスを続けて行う。ハイブリッド技術は、1つのプロセスを単独で行う場合よ
りも良好なセグメントを生成しようとするものであるが、ハイブリッド方法では
、ユーザに有意な量の指導を行い、またセグメント化対象画像の知識も事前に必
要であるため、完全に自動化されたセグメント化用途には不適切であることが分
かっている。
【0018】
(発明の要旨)
本発明は、上記のセグメント化プロセスの問題の多くを解決する。本発明の1
つの実施形態による画像セグメント化器において、画像セグメント化器は、1つ
以上の技術を用いて画像を正確にセグメント化する。このような技術としては、
不完全に境界付けられたセグメントを塗りつぶす漸進的な塗りつぶし(floo
d fill)の利用、1つのスケールでのセグメント化において複数のスケー
リング変換とセグメント化の先導とを用いて、別のスケールからの結果を得る工
程、複数の色面の合成物である合成画像を用いてエッジを検出する工程、複数の
クラスのエッジ画素を用いてエッジ鎖を生成する工程、複数のスケーリング変換
を用いてエッジ鎖を生成する工程、および/または別のスケールにおいて検出さ
れたエッジに基づいてスプリアスエッジを1つのスケールでフィルタリングする
工程を含む。
つの実施形態による画像セグメント化器において、画像セグメント化器は、1つ
以上の技術を用いて画像を正確にセグメント化する。このような技術としては、
不完全に境界付けられたセグメントを塗りつぶす漸進的な塗りつぶし(floo
d fill)の利用、1つのスケールでのセグメント化において複数のスケー
リング変換とセグメント化の先導とを用いて、別のスケールからの結果を得る工
程、複数の色面の合成物である合成画像を用いてエッジを検出する工程、複数の
クラスのエッジ画素を用いてエッジ鎖を生成する工程、複数のスケーリング変換
を用いてエッジ鎖を生成する工程、および/または別のスケールにおいて検出さ
れたエッジに基づいてスプリアスエッジを1つのスケールでフィルタリングする
工程を含む。
【0019】
本明細書中に開示する本発明の本質および利点のさらなる理解は、本明細書の
残りの部分および添付の図面を参照することにより実現され得る。
残りの部分および添付の図面を参照することにより実現され得る。
【0020】
(具体的な実施形態の説明)
セグメント化は、デジタル画像を画像の「セグメント」と呼ばれる成分に細分
化するプロセスである。色値ベースのセグメント化プロセスにおいて、各セグメ
ントは、図1に示すようにまた発明の背景中に記述されているように、画像中の
色値の急激な変化または鋭敏な変化によって境界付けられた領域を示す。本明細
書中に詳細に説明する多くの実施例において、画像は2次元信号を示すが、当業
者であれば、本明細書の開示内容を読めば、本明細書中に説明する方法および装
置は他の次元数にも適合可能であることを理解するはずである。
化するプロセスである。色値ベースのセグメント化プロセスにおいて、各セグメ
ントは、図1に示すようにまた発明の背景中に記述されているように、画像中の
色値の急激な変化または鋭敏な変化によって境界付けられた領域を示す。本明細
書中に詳細に説明する多くの実施例において、画像は2次元信号を示すが、当業
者であれば、本明細書の開示内容を読めば、本明細書中に説明する方法および装
置は他の次元数にも適合可能であることを理解するはずである。
【0021】
図2は、本発明の1つの実施形態による、画像のセグメント解像度(defi
nition)を生成するセグメント化器100を含むシステムのブロック図で
ある。セグメント化器100は、画像データ102を自身の入力として受け取り
、セグメントリスト104を出力する。画像データ102のフォーマットおよび
セグメントリスト104は、画像の特性、画像の格納要件およびセグメント化プ
ロセスに関連しない他の処理に応じて異なり得るが、画像データ102の1つの
形態の格納物として画素色値のアレイがあり、これは、恐らくは、圧縮され、多
くの可能な業界における標準的な画像フォーマット(例えば、生データ、ビット
マップ、MPEG、JPEG、GIF等)のうち1つのフォーマットで格納され
る。メモリにおいて、画像データ102は、値の2次元アレイとして格納され得
、各値は画素色値である。画素色値は、複数の成分を有し得る。例えば、1つの
画像は、1024×768の画素アレイであり得、各画素の色値は、0〜255
の3つの(赤、緑、青)成分値によって表現される。セグメントリスト104の
フォーマットは、ランレングス符号化によって順序付けられた中央画素のリスト
(これは、以下の図6を参照して規定される)として、または、各セグメントの
境界を含む画像画素として、格納され得る。
nition)を生成するセグメント化器100を含むシステムのブロック図で
ある。セグメント化器100は、画像データ102を自身の入力として受け取り
、セグメントリスト104を出力する。画像データ102のフォーマットおよび
セグメントリスト104は、画像の特性、画像の格納要件およびセグメント化プ
ロセスに関連しない他の処理に応じて異なり得るが、画像データ102の1つの
形態の格納物として画素色値のアレイがあり、これは、恐らくは、圧縮され、多
くの可能な業界における標準的な画像フォーマット(例えば、生データ、ビット
マップ、MPEG、JPEG、GIF等)のうち1つのフォーマットで格納され
る。メモリにおいて、画像データ102は、値の2次元アレイとして格納され得
、各値は画素色値である。画素色値は、複数の成分を有し得る。例えば、1つの
画像は、1024×768の画素アレイであり得、各画素の色値は、0〜255
の3つの(赤、緑、青)成分値によって表現される。セグメントリスト104の
フォーマットは、ランレングス符号化によって順序付けられた中央画素のリスト
(これは、以下の図6を参照して規定される)として、または、各セグメントの
境界を含む画像画素として、格納され得る。
【0022】
セグメント化器100が、対象となる画像データを保持するフレームバッファ
110と、識別されたまたは識別対象のセグメント周囲のデータを保持するセグ
メントテーブル112と、フレームバッファ110上で動作してセグメント化器
100において提供されるプログラム命令116に従ってセグメントデータを生
成するプロセッサ114とを含む様子を示す。以下、プログラム命令116のい
くつかの局面について説明するが、これらの局面は、セグメント化の方法および
プロセスの一部または全てに対応するプログラム命令を含み、本明細書中に説明
するセグメント化を支持し得る。
110と、識別されたまたは識別対象のセグメント周囲のデータを保持するセグ
メントテーブル112と、フレームバッファ110上で動作してセグメント化器
100において提供されるプログラム命令116に従ってセグメントデータを生
成するプロセッサ114とを含む様子を示す。以下、プログラム命令116のい
くつかの局面について説明するが、これらの局面は、セグメント化の方法および
プロセスの一部または全てに対応するプログラム命令を含み、本明細書中に説明
するセグメント化を支持し得る。
【0023】
図3は、セグメントリスト104を用いることが可能なシステムを示す。図3
中に示すように、恐らくは従来の画像生成技術または画像捕獲技術を用いて画像
生成器200は画像を生成し、当該画像を表現するデータを画像データ102と
して格納する。セグメント化器(例えば、図2中に示すセグメント化器100)
を用いて、上述したようなセグメントリスト104を生成する。画像生成器20
0は、セグメントリスト104をセグメントフィールド生成器201に提供する
。このセグメントフィールド生成器201は、各セグメント用のデータを生成す
る。このようなデータは、ラベルと、クリッカブルリンク(例えば、Unifo
rm Resource Locatorまたは「URL」)と、画像から必ず
しも抽出されないが画像のセグメントと関連付けられた他のデータとを含み得る
。
中に示すように、恐らくは従来の画像生成技術または画像捕獲技術を用いて画像
生成器200は画像を生成し、当該画像を表現するデータを画像データ102と
して格納する。セグメント化器(例えば、図2中に示すセグメント化器100)
を用いて、上述したようなセグメントリスト104を生成する。画像生成器20
0は、セグメントリスト104をセグメントフィールド生成器201に提供する
。このセグメントフィールド生成器201は、各セグメント用のデータを生成す
る。このようなデータは、ラベルと、クリッカブルリンク(例えば、Unifo
rm Resource Locatorまたは「URL」)と、画像から必ず
しも抽出されないが画像のセグメントと関連付けられた他のデータとを含み得る
。
【0024】
画像データ102、セグメントリスト104およびセグメントフィールドを、
ウェブページとして格納し、ウェブサーバ202にによって供給する。次いで、
当該画像および関連データを、ブラウザ206または他のウェブクライアント(
図示せず)を用いて、インターネット204を介してウェブサーバ202から取
り出すことが可能となる。
ウェブページとして格納し、ウェブサーバ202にによって供給する。次いで、
当該画像および関連データを、ブラウザ206または他のウェブクライアント(
図示せず)を用いて、インターネット204を介してウェブサーバ202から取
り出すことが可能となる。
【0025】
ここで図4を参照して、画像データの1つの構成と、データ信号として送信す
ることが可能な関連データとを図4中に示す。この実施例において、画像データ
250を(恐らくは業界において標準的なフォーマットの)信号として送信し、
その後、セグメントリスト260およびセグメントフィールド270の送信を行
う。
ることが可能な関連データとを図4中に示す。この実施例において、画像データ
250を(恐らくは業界において標準的なフォーマットの)信号として送信し、
その後、セグメントリスト260およびセグメントフィールド270の送信を行
う。
【0026】
図5は、非常に単純化した画像と、その結果得られるセグメント化結果とを示
す。図示のように、画像500は、3つのセグメント(2つの多角形の前景セグ
メントおよび背景セグメント)を含む。セグメント化器100は、画像500を
処理して、セグメントリスト510を生成する。図中に示すように、「Seg
#1」とラベル付けされたセグメントは背景セグメントを示し、「Seg #2
」とラベル付けされたセグメントは、点A、B、C、EおよびD間の(点Aにお
いて多角形が終端している)多角形によって境界付けられた前景セグメントを示
し、「Seg #3」とラベル付けされたセグメントは、点F、G、K、J、I
およびH間の(点Fにおいて多角形が終端している)多角形によって境界付けら
れた前景セグメントを示す。もちろん、セグメント化される典型的な画像は通常
はこれほど良好には規定されないため、本明細書中に記載する方法の一部または
全てに、セグメント境界を正確に識別することが必要になり得る。
す。図示のように、画像500は、3つのセグメント(2つの多角形の前景セグ
メントおよび背景セグメント)を含む。セグメント化器100は、画像500を
処理して、セグメントリスト510を生成する。図中に示すように、「Seg
#1」とラベル付けされたセグメントは背景セグメントを示し、「Seg #2
」とラベル付けされたセグメントは、点A、B、C、EおよびD間の(点Aにお
いて多角形が終端している)多角形によって境界付けられた前景セグメントを示
し、「Seg #3」とラベル付けされたセグメントは、点F、G、K、J、I
およびH間の(点Fにおいて多角形が終端している)多角形によって境界付けら
れた前景セグメントを示す。もちろん、セグメント化される典型的な画像は通常
はこれほど良好には規定されないため、本明細書中に記載する方法の一部または
全てに、セグメント境界を正確に識別することが必要になり得る。
【0027】
本明細書中用いられる「中央画素(midpixel)」という用語は、画像
画素に対して画像中に配置される論理点を指す。セグメントのエッジは中央画素
から中央画素へと走り、これによって、セグメントの各側部上にある画像画素を
分離する。中央画素は好適には、画像画素が存在する同じ点上には位置しないが
、画像画素間に収められる。中央画素を4つの相互隣接する画像画素(または非
矩形の画像画素アレイ上の相互隣接する画像画素によって規定される他の最小多
角形)によって規定される矩形の中心部に配置することは必要ではないが、一般
的に言えば、中央画素に中心部がある方が構成がし易くなるため、好適である。
画素に対して画像中に配置される論理点を指す。セグメントのエッジは中央画素
から中央画素へと走り、これによって、セグメントの各側部上にある画像画素を
分離する。中央画素は好適には、画像画素が存在する同じ点上には位置しないが
、画像画素間に収められる。中央画素を4つの相互隣接する画像画素(または非
矩形の画像画素アレイ上の相互隣接する画像画素によって規定される他の最小多
角形)によって規定される矩形の中心部に配置することは必要ではないが、一般
的に言えば、中央画素に中心部がある方が構成がし易くなるため、好適である。
【0028】
上記のような構成を図6中に示す。図6中、画像600は、画像画素(例えば
、画像画素602)と、画像画素間に発生する中央画素604とを含む。明らか
なように、中央画素604全てが上から下へと(または下から上へと)並ぶ順番
で走るようにエッジを規定した場合、そのエッジは、別個のエッジの左側の画像
画素をエッジの右側の画像画素から分離する。
、画像画素602)と、画像画素間に発生する中央画素604とを含む。明らか
なように、中央画素604全てが上から下へと(または下から上へと)並ぶ順番
で走るようにエッジを規定した場合、そのエッジは、別個のエッジの左側の画像
画素をエッジの右側の画像画素から分離する。
【0029】
中央画素がエッジの一部である場合または中央画素がエッジとして提案される
場合、その中央画素をエッジ画素と呼ぶ。従って、エッジはエッジ画素の鎖とな
り、1つのセグメントの画像画素を、これらの画像画素を取り囲むエッジ鎖によ
って境界付けることが可能となる。いくつかの場合において、1つのセグメント
は、1つのエッジ上に正確に存在する画像画素を含む。1つの画像画素が2つの
セグメント間のエッジ上に正確に収まる(これは、例えば、斜めのエッジおよび
中心にあるエッジ画素の場合に発生する)場合、1つ以上の様々な均衡破壊(t
ie−breaking)ルーチンを用いて、当該画像画素を従属させるべきセ
グメントを判定することができる。本明細書中においてより詳細に説明するよう
に、エッジ画素は、画素色値が比較的大きく変化する画像中の近似点である。
場合、その中央画素をエッジ画素と呼ぶ。従って、エッジはエッジ画素の鎖とな
り、1つのセグメントの画像画素を、これらの画像画素を取り囲むエッジ鎖によ
って境界付けることが可能となる。いくつかの場合において、1つのセグメント
は、1つのエッジ上に正確に存在する画像画素を含む。1つの画像画素が2つの
セグメント間のエッジ上に正確に収まる(これは、例えば、斜めのエッジおよび
中心にあるエッジ画素の場合に発生する)場合、1つ以上の様々な均衡破壊(t
ie−breaking)ルーチンを用いて、当該画像画素を従属させるべきセ
グメントを判定することができる。本明細書中においてより詳細に説明するよう
に、エッジ画素は、画素色値が比較的大きく変化する画像中の近似点である。
【0030】
以下本明細書中に記載するセグメント化プロセスは、複数の工程シーケンスを
含む。これらの工程全てを行う必要はなく、本明細書において行うこれらの工程
を記載した順序で行う必要も無い。先ず、以下のシーケンスについて説明する。
含む。これらの工程全てを行う必要はなく、本明細書において行うこれらの工程
を記載した順序で行う必要も無い。先ず、以下のシーケンスについて説明する。
【0031】
1)漸進的塗りつぶし−異なる刷毛塗りサイズを用いて、不完全に境界付けら
れ得た領域を漸進的に塗りつぶす。
れ得た領域を漸進的に塗りつぶす。
【0032】
2)多スケールセグメント化−オリジナルの画像に複数の「スケール」変換を
行って、1つのスケール変換からのセグメントを用いて、別のスケールでのセグ
メント化を先導する。
行って、1つのスケール変換からのセグメントを用いて、別のスケールでのセグ
メント化を先導する。
【0033】
3)合成物エッジ検出−複数の色面の合成物である合成画像を用いて、エッジ
を検出する。
を検出する。
【0034】
4)多クラスエッジ鎖化−複数のクラスのエッジ画素を用いてエッジ鎖を生成
する。
する。
【0035】
5)多スケールエッジ鎖化−複数のスケールからの情報を用いて、エッジ鎖を
生成する。
生成する。
【0036】
6)エッジ鎖フィルタリング−様々な文脈エッジ特性(例えば、多スケーリン
グ、映像シーケンス化、動的スケール)を用いて、無関係のエッジ鎖をフィルタ
リングする。
グ、映像シーケンス化、動的スケール)を用いて、無関係のエッジ鎖をフィルタ
リングする。
【0037】
以下、上記の工程について、必要に応じて図面を参照しながらより詳細に説明
し、その後、上記工程の有用な組み合わせについても説明する。
し、その後、上記工程の有用な組み合わせについても説明する。
【0038】
(1.漸進的塗りつぶし)
漸進的な塗りつぶしプロセスでは、(恐らくは不完全な)エッジ鎖から閉セグ
メント境界を生成する。このプロセスでは、1つの画像に少なくともいくつかの
エッジ鎖が有ると仮定し、1つのエッジ鎖は、順序付きリスト中において隣接す
るエッジ画素間の線セグメントと論理的に接続されたエッジ画素の順序付きリス
トである。1つの所与の画像のエッジ鎖を、複数の方法で生成することが可能で
ある(例えば、本明細書中に記載するエッジ鎖生成プロセス等)。図7は、エッ
ジ鎖650の一例を示す。エッジ鎖650は、6個のエッジ画素652と、これ
らのエッジ画素を接続する線セグメントとによって規定される。
メント境界を生成する。このプロセスでは、1つの画像に少なくともいくつかの
エッジ鎖が有ると仮定し、1つのエッジ鎖は、順序付きリスト中において隣接す
るエッジ画素間の線セグメントと論理的に接続されたエッジ画素の順序付きリス
トである。1つの所与の画像のエッジ鎖を、複数の方法で生成することが可能で
ある(例えば、本明細書中に記載するエッジ鎖生成プロセス等)。図7は、エッ
ジ鎖650の一例を示す。エッジ鎖650は、6個のエッジ画素652と、これ
らのエッジ画素を接続する線セグメントとによって規定される。
【0039】
一般的には、これから説明する漸進的な塗りつぶしプロセスでは、大きいもの
から小さいものへと行う刷毛塗りシーケンスを用いて、見込みセグメントを「塗
りつぶす」。刷毛塗り部は、論理ウィンドウまたは画素単位で表現される所与の
形状である。例えば、1つの起こり得る刷毛塗り部として、6×6の画素からな
る四角形のウィンドウがあり、別の起こり得る刷毛塗り部として、各側部に7個
の画素がある六角形ウィンドウがある。見込みセグメントを塗りつぶす工程は、
刷毛塗り部で画像画素を被覆し、画像画素にセグメント値(すなわち、セグメン
トに対する基準として用いることが可能な値または数値)を割り当て、刷毛塗り
部を画像周囲で移動させるプロセスである。この刷毛塗り部を画像周囲で移動さ
せる工程は、刷毛塗り部がエッジ鎖の任意の部位を被覆せず、かつ、刷毛塗り部
が、別様に割り当てられた画像画素(すなわち、既に被覆され、かつ、画像画素
を被覆するために現在セグメント値が割り当てられようとしている画像画素と異
なるセグメント値が割り当てられた画像画素)を被覆しないように、行う。1つ
のエッジ鎖または別様に割り当てられた画像画素での被覆を行うことなく刷毛塗
り部シーケンスが到達することが可能な一連の画像画素は、見込みセグメントと
関連付けられた一連の画像画素である。
から小さいものへと行う刷毛塗りシーケンスを用いて、見込みセグメントを「塗
りつぶす」。刷毛塗り部は、論理ウィンドウまたは画素単位で表現される所与の
形状である。例えば、1つの起こり得る刷毛塗り部として、6×6の画素からな
る四角形のウィンドウがあり、別の起こり得る刷毛塗り部として、各側部に7個
の画素がある六角形ウィンドウがある。見込みセグメントを塗りつぶす工程は、
刷毛塗り部で画像画素を被覆し、画像画素にセグメント値(すなわち、セグメン
トに対する基準として用いることが可能な値または数値)を割り当て、刷毛塗り
部を画像周囲で移動させるプロセスである。この刷毛塗り部を画像周囲で移動さ
せる工程は、刷毛塗り部がエッジ鎖の任意の部位を被覆せず、かつ、刷毛塗り部
が、別様に割り当てられた画像画素(すなわち、既に被覆され、かつ、画像画素
を被覆するために現在セグメント値が割り当てられようとしている画像画素と異
なるセグメント値が割り当てられた画像画素)を被覆しないように、行う。1つ
のエッジ鎖または別様に割り当てられた画像画素での被覆を行うことなく刷毛塗
り部シーケンスが到達することが可能な一連の画像画素は、見込みセグメントと
関連付けられた一連の画像画素である。
【0040】
例えば、図8について考察する。図8は、画像700および刷毛塗り部702
を示し、この画像は、印が付いているようなエッジ鎖701を有する。刷毛塗り
部702のサイズが分かっており、刷毛塗り部702が三角形領域704中に配
置された場合、塗りつぶし処理は、領域704の上部にあるギャップ705を通
じて「流出(bleed)」しない。なぜならば、刷毛塗り部702は、エッジ
鎖の一部を被覆しなければ、ギャップ705を通じて適合し得ないからである。
漸進的な塗りつぶしプロセスの第1の工程では、図示のサイズの刷毛塗りを用い
て、領域704、四角形領域706および背景領域708を刷毛塗りする。この
第1の工程をから得られる1つの結果として、いくつかの(この場合は殆どの)
画像画素が各セグメントと関連付けられることがある。これらの画像画素のいく
つかは、セグメントと関連付けられない。なぜならば、エッジ鎖を被覆しないと
刷毛塗り部702はこれらの画素に到達できないからである。
を示し、この画像は、印が付いているようなエッジ鎖701を有する。刷毛塗り
部702のサイズが分かっており、刷毛塗り部702が三角形領域704中に配
置された場合、塗りつぶし処理は、領域704の上部にあるギャップ705を通
じて「流出(bleed)」しない。なぜならば、刷毛塗り部702は、エッジ
鎖の一部を被覆しなければ、ギャップ705を通じて適合し得ないからである。
漸進的な塗りつぶしプロセスの第1の工程では、図示のサイズの刷毛塗りを用い
て、領域704、四角形領域706および背景領域708を刷毛塗りする。この
第1の工程をから得られる1つの結果として、いくつかの(この場合は殆どの)
画像画素が各セグメントと関連付けられることがある。これらの画像画素のいく
つかは、セグメントと関連付けられない。なぜならば、エッジ鎖を被覆しないと
刷毛塗り部702はこれらの画素に到達できないからである。
【0041】
1つの実施例において、プロセッサは、刷毛塗り部を画像内の各アクセス可能
なロケーションに移動させ、この際、エッジ鎖または別様に割り当てられた画像
画素を被覆しないように注意する。各刷毛塗りロケーションにおいて、プロセッ
サは、基礎となる中央画素および画像画素について考える。刷毛塗り部がエッジ
画素あるいはエッジ鎖または別様に割り当てられた画像画素を被覆する場合、そ
の刷毛塗り部は効果を持たず、次の位置に移動される。しかし、刷毛塗り部がエ
ッジ画素、エッジ鎖または別様に割り当てられた画像画素のどの部位も被覆して
いない場合、プロセッサは、基礎となる画像画素を調査する。基礎となる画像画
素のうちいずれかがあるセグメントと既に関連付けられている場合、これらの基
礎となる画像画素を全てそのセグメントに割り当てるか、または、そうでない場
合、基礎となる画像画素全てを新規セグメントに割り当てる。1つの画素を刷毛
塗りする場合、プロセッサは、その近接画像画素について考え、その画像画素を
、いずれのエッジ鎖を横切ることなく、最も近接する画像画素を有するセグメン
トに割り当てる。
なロケーションに移動させ、この際、エッジ鎖または別様に割り当てられた画像
画素を被覆しないように注意する。各刷毛塗りロケーションにおいて、プロセッ
サは、基礎となる中央画素および画像画素について考える。刷毛塗り部がエッジ
画素あるいはエッジ鎖または別様に割り当てられた画像画素を被覆する場合、そ
の刷毛塗り部は効果を持たず、次の位置に移動される。しかし、刷毛塗り部がエ
ッジ画素、エッジ鎖または別様に割り当てられた画像画素のどの部位も被覆して
いない場合、プロセッサは、基礎となる画像画素を調査する。基礎となる画像画
素のうちいずれかがあるセグメントと既に関連付けられている場合、これらの基
礎となる画像画素を全てそのセグメントに割り当てるか、または、そうでない場
合、基礎となる画像画素全てを新規セグメントに割り当てる。1つの画素を刷毛
塗りする場合、プロセッサは、その近接画像画素について考え、その画像画素を
、いずれのエッジ鎖を横切ることなく、最も近接する画像画素を有するセグメン
トに割り当てる。
【0042】
別の実施例において、プロセッサは、2つの刷毛塗り部を、検出されたエッジ
鎖それぞれのいずれかの側部上に移動させ、これらのエッジ鎖のいずれかの側部
上の画像画素を別のセグメントに割り当てる。さらに別の実施例において、プロ
セッサは、刷毛塗り部を画像上の任意の未処理ロケーション上に配置し、その刷
毛塗り部を、エッジ鎖を被覆することなく到達することが可能な近接ロケーショ
ンに移動させる。
鎖それぞれのいずれかの側部上に移動させ、これらのエッジ鎖のいずれかの側部
上の画像画素を別のセグメントに割り当てる。さらに別の実施例において、プロ
セッサは、刷毛塗り部を画像上の任意の未処理ロケーション上に配置し、その刷
毛塗り部を、エッジ鎖を被覆することなく到達することが可能な近接ロケーショ
ンに移動させる。
【0043】
別の実施例において、プロセッサは、逓減する刷毛塗り部のシーケンスを用い
て新規セグメントを交互に作成し、先行セグメントを拡大させる。従って、奇数
のパスは新規セグメントを作成し、偶数のパスは、先行作成されたセグメントを
拡大させ得る。
て新規セグメントを交互に作成し、先行セグメントを拡大させる。従って、奇数
のパスは新規セグメントを作成し、偶数のパスは、先行作成されたセグメントを
拡大させ得る。
【0044】
さらに別の実施例において、プロセッサは、各色成分中にエッジ鎖シーケンス
を作成し、これらのエッジ鎖を組み合わせて、エッジ鎖ピクチャの合成物を作成
する。この組み合わせは、各色成分中にエッジ鎖を結合(union)したもの
または各色成分中でエッジ鎖を交差(intersection)させたものの
いずれかであり得る。
を作成し、これらのエッジ鎖を組み合わせて、エッジ鎖ピクチャの合成物を作成
する。この組み合わせは、各色成分中にエッジ鎖を結合(union)したもの
または各色成分中でエッジ鎖を交差(intersection)させたものの
いずれかであり得る。
【0045】
プロセッサが第1の刷毛塗り部(または複数の刷毛塗り部)を画像を介して送
った後、画像画素のうちいくつかを、セグメントに割り当てる。これらの画像画
素は、(複数の)刷毛塗り部にとってアクセス可能であった画像の部位を表現す
る。次いで、プロセッサは、その画像を介して、より小さな刷毛塗り部を用いて
別のパスを作成する。この第2のパスにおいて、プロセッサは、そのより小さな
刷毛塗り部に同じ処理を行い、より大きな刷毛塗り部にとって「到達不可能な」
画像画素(すなわち、刷毛塗り部が(やはりエッジ画素、エッジ鎖または別様に
割り当てられた画像画素を被覆せずに)被覆できない画像画素)に対して被覆お
よび割当てを行う。後続のパスについても、プロセッサが最小の刷毛塗り部(例
えば、1画素の刷毛塗り部)を有するパスを作成するまで、逓減する刷毛塗り部
を用いて、このプロセスを繰り返す。
った後、画像画素のうちいくつかを、セグメントに割り当てる。これらの画像画
素は、(複数の)刷毛塗り部にとってアクセス可能であった画像の部位を表現す
る。次いで、プロセッサは、その画像を介して、より小さな刷毛塗り部を用いて
別のパスを作成する。この第2のパスにおいて、プロセッサは、そのより小さな
刷毛塗り部に同じ処理を行い、より大きな刷毛塗り部にとって「到達不可能な」
画像画素(すなわち、刷毛塗り部が(やはりエッジ画素、エッジ鎖または別様に
割り当てられた画像画素を被覆せずに)被覆できない画像画素)に対して被覆お
よび割当てを行う。後続のパスについても、プロセッサが最小の刷毛塗り部(例
えば、1画素の刷毛塗り部)を有するパスを作成するまで、逓減する刷毛塗り部
を用いて、このプロセスを繰り返す。
【0046】
好適には、初期の刷毛塗り部のサイズは、セグメントを規定するエッジ鎖にお
いて受容可能な最大ギャップよりも少なくとも1画素分大きなサイズである。例
えば、1つのより大きなエッジ鎖において、2つのエッジ鎖のエッジ間の長さが
5画素以下の長さをギャップとして見なす場合、初期刷毛塗り部は、6×6の画
素四角形であり得る。このような構成を用いると、初期刷毛塗り部がギャップか
ら「流出」して、2つのセグメントを不正確に組み合わせことが無くなる。この
初期刷毛塗り部の後、後続のより小さな刷毛塗り部がギャップから流出し得るが
、その流出量は限られている。なぜならば、ギャップの両側には先行して割り当
てられた画像画素が有り、刷毛塗り部の動きを限定するからである。
いて受容可能な最大ギャップよりも少なくとも1画素分大きなサイズである。例
えば、1つのより大きなエッジ鎖において、2つのエッジ鎖のエッジ間の長さが
5画素以下の長さをギャップとして見なす場合、初期刷毛塗り部は、6×6の画
素四角形であり得る。このような構成を用いると、初期刷毛塗り部がギャップか
ら「流出」して、2つのセグメントを不正確に組み合わせことが無くなる。この
初期刷毛塗り部の後、後続のより小さな刷毛塗り部がギャップから流出し得るが
、その流出量は限られている。なぜならば、ギャップの両側には先行して割り当
てられた画像画素が有り、刷毛塗り部の動きを限定するからである。
【0047】
図9は、この点を示す。図9は、エッジ鎖800にギャップが有る様子を示す
。エッジ鎖800は、2つのセグメント802、804を分離させる。先行する
刷毛塗りパスにおいて、画像画素の一部をセグメントに割り当て、一部の画像画
素(例えば、ギャップ近隣の画像画素)は、刷毛塗りでは到達不可能である。小
さな刷毛塗り部を用いる場合、刷毛塗り部は、ギャップの両側にある残りの未割
り当て画素全てに到達するほど小さい大きさであり得、その結果、最初に処理さ
れた任意のセグメントから流出が発生する。これを回避するために、プロセッサ
は、ギャップのいずれかの側部から未割り当て画素上に2つの刷毛塗り部を送り
、これにより、ギャップの両側を均等に塗りつぶすようにする。
。エッジ鎖800は、2つのセグメント802、804を分離させる。先行する
刷毛塗りパスにおいて、画像画素の一部をセグメントに割り当て、一部の画像画
素(例えば、ギャップ近隣の画像画素)は、刷毛塗りでは到達不可能である。小
さな刷毛塗り部を用いる場合、刷毛塗り部は、ギャップの両側にある残りの未割
り当て画素全てに到達するほど小さい大きさであり得、その結果、最初に処理さ
れた任意のセグメントから流出が発生する。これを回避するために、プロセッサ
は、ギャップのいずれかの側部から未割り当て画素上に2つの刷毛塗り部を送り
、これにより、ギャップの両側を均等に塗りつぶすようにする。
【0048】
小さな刷毛塗り部からの望ましくない流出をさらに限定するために、1つのパ
ス中に2つの刷毛塗り部を走らせて、各刷毛塗り部をギャップの各側部上に配置
するか、または、画像画素をセグメントに割り当てるプロセスにおいて、1つの
刷毛塗り部を側部毎に交互させることができる。いくつかの場合(例えば、図7
中に示す画像画素660の場合)において、1画素分の刷毛塗り部でも、いくつ
かの画像画素(例えば、エッジ鎖が交差する画像画素)に到達するのに不十分で
ある。最小の刷毛塗り部を用いたパスが完成した後に、これらの到達不可能な画
素を処理することができる。
ス中に2つの刷毛塗り部を走らせて、各刷毛塗り部をギャップの各側部上に配置
するか、または、画像画素をセグメントに割り当てるプロセスにおいて、1つの
刷毛塗り部を側部毎に交互させることができる。いくつかの場合(例えば、図7
中に示す画像画素660の場合)において、1画素分の刷毛塗り部でも、いくつ
かの画像画素(例えば、エッジ鎖が交差する画像画素)に到達するのに不十分で
ある。最小の刷毛塗り部を用いたパスが完成した後に、これらの到達不可能な画
素を処理することができる。
【0049】
到達不可能な画素を処理する1つのプロセスとして、均衡破壊方式を用いて、
1つの到達不可能な画素を、到達不可能な画素に集まるセグメントの1つに割り
当てるプロセスがある。1つの均衡破壊方式では、画像画素における勾配と、各
競合(contending)セグメントにおける最も近接する画像画素におけ
る勾配とを考慮して、画像画素を、到達不可能な画像画素における勾配に大きさ
および方向が最も近接する勾配を有する最も近接する画像画素を含むセグメント
に割り当てる。勾配はベクトル導関数である。
1つの到達不可能な画素を、到達不可能な画素に集まるセグメントの1つに割り
当てるプロセスがある。1つの均衡破壊方式では、画像画素における勾配と、各
競合(contending)セグメントにおける最も近接する画像画素におけ
る勾配とを考慮して、画像画素を、到達不可能な画像画素における勾配に大きさ
および方向が最も近接する勾配を有する最も近接する画像画素を含むセグメント
に割り当てる。勾配はベクトル導関数である。
【0050】
プロセスにおいて各画像画素をセグメントと関連付けた後は、各セグメントの
境界のロケーションは容易に見付かる。以下に説明するように、漸進的な塗りつ
ぶしプロセスを他のプロセスと組み合わせて、セグメント境界をより正確に判定
してもよい。
境界のロケーションは容易に見付かる。以下に説明するように、漸進的な塗りつ
ぶしプロセスを他のプロセスと組み合わせて、セグメント境界をより正確に判定
してもよい。
【0051】
(2.多スケールセグメント化)
セグメント化器は、1つの画像から開始して、解像度を漸進的に低くして(こ
れは、「スケール」としても知られる)画像を複数回変換して、より大きく、よ
り支配的なフィーチャに関する情報のみをスケール単位で保持する。これらの変
換を行う方法は他にも複数ある(例えば、平滑化または類似のフィルタを使用す
る方法)。特定の画像に有用であり得る1組の変換として、ガウス平滑化フィル
タのアレイがあり、各フィルタは、異なる特性距離を有する。
れは、「スケール」としても知られる)画像を複数回変換して、より大きく、よ
り支配的なフィーチャに関する情報のみをスケール単位で保持する。これらの変
換を行う方法は他にも複数ある(例えば、平滑化または類似のフィルタを使用す
る方法)。特定の画像に有用であり得る1組の変換として、ガウス平滑化フィル
タのアレイがあり、各フィルタは、異なる特性距離を有する。
【0052】
1つの多スケールのセグメント化プロセスにおいて、変換された画像を疎な画
像から微細な画像の順番で処理する。このプロセスにおいて、最も疎な画像は、
最も広範囲な平滑化フィルタを用いた変換物である。典型的には、最も疎な画像
は、画像のより大きなフィーチャのみを保持する。最も微細な画像は、最も小さ
な特性距離で円滑化フィルタによって変換された画像またはそのオリジナルで円
滑化フィルタによって変換された画像のいずれかである。
像から微細な画像の順番で処理する。このプロセスにおいて、最も疎な画像は、
最も広範囲な平滑化フィルタを用いた変換物である。典型的には、最も疎な画像
は、画像のより大きなフィーチャのみを保持する。最も微細な画像は、最も小さ
な特性距離で円滑化フィルタによって変換された画像またはそのオリジナルで円
滑化フィルタによって変換された画像のいずれかである。
【0053】
プロセスは、最も疎な画像のセグメント化処理を行ってその最も疎な画像の一
連のセク゛メントを規定することにより、継続する。このセク゛メント化プロセスは、上述し た漸進的塗りつぶしプロセスであるか、または、1つの画像に行なわれるいくつ
かの他のセク゛メントプロセスであり得る。最も疎な画像にセク゛メント化プロセスを施した 後、その画像の一連のセク゛メントを、その後のより微細な画像に行なわれるセク゛メント化 プロセスにおいて用いる。
連のセク゛メントを規定することにより、継続する。このセク゛メント化プロセスは、上述し た漸進的塗りつぶしプロセスであるか、または、1つの画像に行なわれるいくつ
かの他のセク゛メントプロセスであり得る。最も疎な画像にセク゛メント化プロセスを施した 後、その画像の一連のセク゛メントを、その後のより微細な画像に行なわれるセク゛メント化 プロセスにおいて用いる。
【0054】
例えば、2番目に疎な画像を上述したようにセグメント化するが、その際、2
番目に疎な画像中のセグメントが最も疎な画像中のセグメントを1つ以上含まな
いようにする制約を設ける。言い換えれば、第2の画像中のセグメントは、第1
の画像中のセグメントの各サブセットである。
番目に疎な画像中のセグメントが最も疎な画像中のセグメントを1つ以上含まな
いようにする制約を設ける。言い換えれば、第2の画像中のセグメントは、第1
の画像中のセグメントの各サブセットである。
【0055】
プロセスは、先行してセグメント化された画像のセグメントを用いて、次に疎
な画像の各々について継続する。各先行画像のセグメントは自身の先行画像のサ
ブセットとなるように制約されるため、いずれの変換後の画像のセグメントも、
いずれのより疎な画像中の任意のセグメントのセグメントのサブセットとなる。
な画像の各々について継続する。各先行画像のセグメントは自身の先行画像のサ
ブセットとなるように制約されるため、いずれの変換後の画像のセグメントも、
いずれのより疎な画像中の任意のセグメントのセグメントのサブセットとなる。
【0056】
この「サブセット」による制約を実行する1つの方法として、画像を無制限に
セグメント化して、より疎な画像中のセグメントを1つ以上交差するセグメント
を全て細分化する方法がある。上記した漸進的な塗りつぶしプロセスによってセ
グメント化を行う場合、サブセットによる制約を実行する別の方法を用いてもよ
い。後者の方法の場合、より疎な画像のセグメント境界を処理対象の画像中のエ
ッジ鎖として付加して、サブセットによる制約を達成する。
セグメント化して、より疎な画像中のセグメントを1つ以上交差するセグメント
を全て細分化する方法がある。上記した漸進的な塗りつぶしプロセスによってセ
グメント化を行う場合、サブセットによる制約を実行する別の方法を用いてもよ
い。後者の方法の場合、より疎な画像のセグメント境界を処理対象の画像中のエ
ッジ鎖として付加して、サブセットによる制約を達成する。
【0057】
(3.合成物のエッジの検出)
上述した漸進的な塗りつぶしプロセスおよび多スケールのセグメント化プロセ
スは、画像および一連のエッジ鎖上で動作し、1つのエッジ鎖は、順序付きの一
連のエッジ画素である。エッジ鎖は、エッジ画素から生成される。上記の方法で
は他のエッジ検出方法も用いてよいが、画素色値が複数の色成分を含む場合に特
に有用な1つの方法は、合成物のエッジを検出するプロセスであり、以下、この
プロセスについて説明する。
スは、画像および一連のエッジ鎖上で動作し、1つのエッジ鎖は、順序付きの一
連のエッジ画素である。エッジ鎖は、エッジ画素から生成される。上記の方法で
は他のエッジ検出方法も用いてよいが、画素色値が複数の色成分を含む場合に特
に有用な1つの方法は、合成物のエッジを検出するプロセスであり、以下、この
プロセスについて説明する。
【0058】
合成物のエッジを検出するプロセスにおいて、異なる色成分からの情報を組み
合わせて1つの合成画像を形成し、合成画像中の各画素色値は、対応する画像画
素の色値の成分と、恐らくは周囲の画像画素の色値との関数となる。次いで、こ
の合成画像を用いて、中央画素におけるエッジ画素部分を判定する。合成画像中
のエッジ画素を判定した後、これらのエッジ画素を、エッジ鎖にリンクさせるこ
とができる。
合わせて1つの合成画像を形成し、合成画像中の各画素色値は、対応する画像画
素の色値の成分と、恐らくは周囲の画像画素の色値との関数となる。次いで、こ
の合成画像を用いて、中央画素におけるエッジ画素部分を判定する。合成画像中
のエッジ画素を判定した後、これらのエッジ画素を、エッジ鎖にリンクさせるこ
とができる。
【0059】
以下、合成画像の処理を行う3つの方法について説明する。第1の方法では、
色情報を組み合わせた後にエッジ画素を判定し、一方、第2の方法では、各色面
のエッジ画素を判定した後でその結果を組み合わせて一連の合成物のエッジの画
素を得る。「色面」という用語は、画素色値のN次元のアレイである画像を指し
、各画素は、当該画素に割り当てられた複数の色画像のうち1つのみを保持する
。例えば、各画素に赤の値、緑の値および青の値が割り当てられた場合、各画素
が自身の割り当て値として赤値のみを有する場合、その画像は赤色面の色面画像
である。
色情報を組み合わせた後にエッジ画素を判定し、一方、第2の方法では、各色面
のエッジ画素を判定した後でその結果を組み合わせて一連の合成物のエッジの画
素を得る。「色面」という用語は、画素色値のN次元のアレイである画像を指し
、各画素は、当該画素に割り当てられた複数の色画像のうち1つのみを保持する
。例えば、各画素に赤の値、緑の値および青の値が割り当てられた場合、各画素
が自身の割り当て値として赤値のみを有する場合、その画像は赤色面の色面画像
である。
【0060】
この第1の方法において、1画素当たりの勾配ベクトルのアレイを含む合成勾
配画像を、当該画素の色成分値から計算する。次いで、この合成勾配画像を処理
して、エッジ画素を検出する。
配画像を、当該画素の色成分値から計算する。次いで、この合成勾配画像を処理
して、エッジ画素を検出する。
【0061】
合成勾配画像を生成する1つのプロセスでは、各色面中の各画素における勾配
に基づいて、当該画素の合成物勾配を生成する。このプロセスでは、1つの画素
の合成物勾配は、当該画素における各色面中の勾配に改変ベクトルを付加して得
たものである。改変ベクトルの付加量は、色面が2つ以上ある場合に、個々のベ
クトルの符号を必要に応じて変更して、1つの半平面内の全ての加数の方向を保
持して、改変される。
に基づいて、当該画素の合成物勾配を生成する。このプロセスでは、1つの画素
の合成物勾配は、当該画素における各色面中の勾配に改変ベクトルを付加して得
たものである。改変ベクトルの付加量は、色面が2つ以上ある場合に、個々のベ
クトルの符号を必要に応じて変更して、1つの半平面内の全ての加数の方向を保
持して、改変される。
【0062】
図10を用いて、このような改変ベクトルの付加について説明する。図10中
に示すように、画素Aの各色面中のベクトルは、1つの半円よりも小さな方向の
範囲を有するため、合成物の勾配は、ちょうど各成分中のベクトルの総和となる
。同じことが画素BおよびCにも当てはまる。しかし、画素Dの全てのベクトル
の方向を含む半円の配向(orientation)は無い。後者の場合におい
て、ベクトルが付加される前に、これらのベクトルの1つの符号は反転する(す
なわち、反対方向を向く)。
に示すように、画素Aの各色面中のベクトルは、1つの半円よりも小さな方向の
範囲を有するため、合成物の勾配は、ちょうど各成分中のベクトルの総和となる
。同じことが画素BおよびCにも当てはまる。しかし、画素Dの全てのベクトル
の方向を含む半円の配向(orientation)は無い。後者の場合におい
て、ベクトルが付加される前に、これらのベクトルの1つの符号は反転する(す
なわち、反対方向を向く)。
【0063】
実際には、この改変ベクトルを付加する工程では、所与のエッジ上の任意の所
与の点において2つのベクトルがあり、これらの2つのベクトルは、エッジに対
する法線(normal)またはエッジに対する接線(tangent)を規定
する点を表す。その結果、勾配ベクトルを反転させ、かつ、勾配ベクトルが同じ
エッジを表現することが可能となる。付加ベクトルが全て半円中に収まることを
確実にすることによって、1つの成分勾配ベクトルの寄与度が別の成分勾配ベク
トルの寄与度を相殺する可能性が低くなる。
与の点において2つのベクトルがあり、これらの2つのベクトルは、エッジに対
する法線(normal)またはエッジに対する接線(tangent)を規定
する点を表す。その結果、勾配ベクトルを反転させ、かつ、勾配ベクトルが同じ
エッジを表現することが可能となる。付加ベクトルが全て半円中に収まることを
確実にすることによって、1つの成分勾配ベクトルの寄与度が別の成分勾配ベク
トルの寄与度を相殺する可能性が低くなる。
【0064】
加数が半円中に収まることを確実にすることにより、勾配の極性は、自身の総
和による結果に大きな影響を与えなくなる。多くの画像において、極性の変化は
、画像の物理的特性に対応する。YUV画像の各色成分中のエッジの極性は一般
的には、互いに独立する。例えば、明るい緑色の領域が暗い赤色の領域に変化す
ると、「Y」は増加し、「V」は減少する。
和による結果に大きな影響を与えなくなる。多くの画像において、極性の変化は
、画像の物理的特性に対応する。YUV画像の各色成分中のエッジの極性は一般
的には、互いに独立する。例えば、明るい緑色の領域が暗い赤色の領域に変化す
ると、「Y」は増加し、「V」は減少する。
【0065】
いくつかの色空間において、色成分は、均等に重み付けされた付加量に大きな
影響を持ち得る。これは、全体的な色の差またはいくつかの色空間において勾配
が非常に大きくなる(これは、エッジが顕著であることを反映している)傾向の
ためである。このような場合、正規化ファクターを付加する前に色成分を重み付
けすることができる。良好な正規化ファクターは、各色面において勾配の大きさ
用の類似の重みが得られるスカラー値である。例えば、輝度色面とクロミナンス
色面との間の動的範囲が、平均勾配の大きさが輝度色面において画像のサンプリ
ングまたは1つの画像にわたるクロミナンス色面に対する輝度色面の2倍も大き
くなるような値である場合、ベクトルを付加する前に2で除算することにより、
輝度ベクトルを正規化することができる。
影響を持ち得る。これは、全体的な色の差またはいくつかの色空間において勾配
が非常に大きくなる(これは、エッジが顕著であることを反映している)傾向の
ためである。このような場合、正規化ファクターを付加する前に色成分を重み付
けすることができる。良好な正規化ファクターは、各色面において勾配の大きさ
用の類似の重みが得られるスカラー値である。例えば、輝度色面とクロミナンス
色面との間の動的範囲が、平均勾配の大きさが輝度色面において画像のサンプリ
ングまたは1つの画像にわたるクロミナンス色面に対する輝度色面の2倍も大き
くなるような値である場合、ベクトルを付加する前に2で除算することにより、
輝度ベクトルを正規化することができる。
【0066】
合成勾配画像を生成する別のプロセスでは、各画素について、当該画素におけ
る最大の大きさの色成分ベクトルと等しいかまたはその関数である合成物勾配を
生成する。ベクトルを付加する代わりに最大ベクトルを取るこのプロセスにおい
て、正規化ファクターを、比較を行う前に付加してもよく、これにより、最大の
大きさのベクトルを選択する。
る最大の大きさの色成分ベクトルと等しいかまたはその関数である合成物勾配を
生成する。ベクトルを付加する代わりに最大ベクトルを取るこのプロセスにおい
て、正規化ファクターを、比較を行う前に付加してもよく、これにより、最大の
大きさのベクトルを選択する。
【0067】
合成物勾配ベクトルがどのように生成されようと、合成物勾配ベクトルは、集
合して合成勾配画像を形成する。その合成勾配画像から、エッジ画素を判定し、
これらのエッジ画素で形成されたエッジ鎖を得て、当該画像にセグメント化プロ
セスを行うことができる。
合して合成勾配画像を形成する。その合成勾配画像から、エッジ画素を判定し、
これらのエッジ画素で形成されたエッジ鎖を得て、当該画像にセグメント化プロ
セスを行うことができる。
【0068】
(4.多クラスエッジ鎖化)
上述したように、1つの画像のエッジ画素を識別した後、これらのエッジ画素
を用いてエッジ鎖を識別し、セグメント化プロセスにおいてこれらのエッジ鎖を
用いる。本明細書において説明するエッジ鎖を識別する(「エッジ鎖化」)プロ
セスにおいて、エッジ画素を、複数のクラスにクラス分けする。ここで詳細に説
明する実施例において、図11を参照して、複数のクラスを2つのクラスにクラ
ス分けして、「強いエッジ画素」と「弱いエッジ画素」として指定する。エッジ
画素は、色値が比較的大きく変化する1画像中の近似点(例えば、画像1110
における画素1102(1)から画素1104(1)への変化)である。
を用いてエッジ鎖を識別し、セグメント化プロセスにおいてこれらのエッジ鎖を
用いる。本明細書において説明するエッジ鎖を識別する(「エッジ鎖化」)プロ
セスにおいて、エッジ画素を、複数のクラスにクラス分けする。ここで詳細に説
明する実施例において、図11を参照して、複数のクラスを2つのクラスにクラ
ス分けして、「強いエッジ画素」と「弱いエッジ画素」として指定する。エッジ
画素は、色値が比較的大きく変化する1画像中の近似点(例えば、画像1110
における画素1102(1)から画素1104(1)への変化)である。
【0069】
以下、各クラスのエッジ画素を識別する2つの方法、すなわち、勾配方法およ
びラプラシアン方法について説明する。勾配方法について図12〜13を参照し
て説明し、ラプラシアン方法について図14を参照して説明する。
びラプラシアン方法について説明する。勾配方法について図12〜13を参照し
て説明し、ラプラシアン方法について図14を参照して説明する。
【0070】
勾配方法の場合、勾配方向において色値の勾配が局部的に最大となる中央画素
をエッジ画素として識別する。局部的最大部は、関数値が一方の側部上の周囲の
点関数値よりも大きく、かつ、もう一方の側部上の周囲の点における関数値以上
である点である。
をエッジ画素として識別する。局部的最大部は、関数値が一方の側部上の周囲の
点関数値よりも大きく、かつ、もう一方の側部上の周囲の点における関数値以上
である点である。
【0071】
例えば、図12について考察する。図12は、1つの画像の中間点のアレイを
示す−画像の画像画素は図示していない。複数の中間点を図示しているが、この
うちのいくつかは、「A」〜「I」でラベル付けされている。エッジ点Aがエッ
ジ画素であるか否かを判定する勾配プロセスにおいて、エッジ点Aがエッジ画素
である場合、エッジ画素のクラス(すなわち、中央画素A〜Iの勾配)について
考える。
示す−画像の画像画素は図示していない。複数の中間点を図示しているが、この
うちのいくつかは、「A」〜「I」でラベル付けされている。エッジ点Aがエッ
ジ画素であるか否かを判定する勾配プロセスにおいて、エッジ点Aがエッジ画素
である場合、エッジ画素のクラス(すなわち、中央画素A〜Iの勾配)について
考える。
【0072】
勾配方法において、プロセッサは、中央画素B〜Iの中から、中央画素Aの勾
配方向と同じ方向を向く中央画素Aから生じる光線に最も近接する第2の中央画
素を選択する。2つの中央画素が光線から等距離である場合、均衡破壊の法則を
用いて、最も近接する中央画素を選択してもよい。図12の実施例において、最
も近接する中央画素は中央画素Cである。中央画素Aおよび最も近接する中央画
素Cと一直線上にある第3の中央画素がある。この実施例において、この第3の
中央画素は画素Hである。各中央画素(例えば、中央画素A、CおよびH)にお
いて、勾配を規定することができる。図12中の矢印は、これらの3つの中央画
素の勾配の大きさおよび方向を示す。
配方向と同じ方向を向く中央画素Aから生じる光線に最も近接する第2の中央画
素を選択する。2つの中央画素が光線から等距離である場合、均衡破壊の法則を
用いて、最も近接する中央画素を選択してもよい。図12の実施例において、最
も近接する中央画素は中央画素Cである。中央画素Aおよび最も近接する中央画
素Cと一直線上にある第3の中央画素がある。この実施例において、この第3の
中央画素は画素Hである。各中央画素(例えば、中央画素A、CおよびH)にお
いて、勾配を規定することができる。図12中の矢印は、これらの3つの中央画
素の勾配の大きさおよび方向を示す。
【0073】
中央画素Aの勾配の大きさが中央画素Cまたは中央画素Hのうちの一方の勾配
の大きさよりも大きく、かつ、中央画素Cまたは中央画素Hのうちのもう一方の
勾配の大きさ以上である場合、中央画素Aは、強いエッジ画素として識別される
。
の大きさよりも大きく、かつ、中央画素Cまたは中央画素Hのうちのもう一方の
勾配の大きさ以上である場合、中央画素Aは、強いエッジ画素として識別される
。
【0074】
中央画素Aが強いエッジ画素として識別されない場合、中央画素Aを試験して
、中央画素Aが弱いエッジ画素の基準を満たすか否かを判定する。図13は、中
央画素が弱いエッジ画素であるか否かを判定するプロセスを示す。図13中に示
すように、中央画素Aは、弱いエッジ画素の状態であると見なされている。これ
を行うために、中央画素A中を通り、かつ、中央画素Aの勾配方向に平行な線(
図13中、線1302として図示する)について考える。近隣の中央画素B〜I
は四角形を規定し、線1302は、この四角形と2点において交差する(図13
中、点1304(1)および1304(2)として図示する)。
、中央画素Aが弱いエッジ画素の基準を満たすか否かを判定する。図13は、中
央画素が弱いエッジ画素であるか否かを判定するプロセスを示す。図13中に示
すように、中央画素Aは、弱いエッジ画素の状態であると見なされている。これ
を行うために、中央画素A中を通り、かつ、中央画素Aの勾配方向に平行な線(
図13中、線1302として図示する)について考える。近隣の中央画素B〜I
は四角形を規定し、線1302は、この四角形と2点において交差する(図13
中、点1304(1)および1304(2)として図示する)。
【0075】
中央画素Aにおける勾配と、点1304(1)および1304(2)の各々と
を、補間を通じて発見することができる。中央画素Aの勾配大きさが点1304
(1)または点1304(2)の1つの勾配大きさよりも大きく、かつ、点13
04(1)または点1304(2)のもう一方の勾配以上である場合、中央画素
Aは、弱いエッジ画素として指定される。そうではない場合、中央画素Aは中央
画素として指定されない。
を、補間を通じて発見することができる。中央画素Aの勾配大きさが点1304
(1)または点1304(2)の1つの勾配大きさよりも大きく、かつ、点13
04(1)または点1304(2)のもう一方の勾配以上である場合、中央画素
Aは、弱いエッジ画素として指定される。そうではない場合、中央画素Aは中央
画素として指定されない。
【0076】
典型的な画像の場合、弱いエッジ画素数の方が、強いエッジ画素数よりも多い
。なぜならば、弱いエッジ画素は一般的には、画像中の色あるいは強度の漸進的
変化または鮮明なコントラストに対応し、強いエッジ画素は一般的には、鮮明コ
ントラストおよび不鮮明なコントラストのみに対応するからである。
。なぜならば、弱いエッジ画素は一般的には、画像中の色あるいは強度の漸進的
変化または鮮明なコントラストに対応し、強いエッジ画素は一般的には、鮮明コ
ントラストおよび不鮮明なコントラストのみに対応するからである。
【0077】
ここで図14を参照して、ラプラシアン方法について説明する。説明は、4つ
の画像画素1410、1420、1430、1440によって規定された矩形内
に配置された中央画素1405のエッジ画素状態を判定する工程を参照して行う
。4つの画像画素をそれぞれ、符号「+」または「−」(これらの符号は、当該
画像画素におけるラプラシアン関数の符号を示す)でラベル付けする。ラプラシ
アンは、ベクトル2次導関数(second vector derivati
ve)である。1つの画像において、画素色値に適用されるラプラシアン関数の
ゼロ交差が、エッジ画素である。ラプラシアンのゼロ交差が発生するのは、ラプ
ラシアンの2次導関数がゼロとなる場所である。
の画像画素1410、1420、1430、1440によって規定された矩形内
に配置された中央画素1405のエッジ画素状態を判定する工程を参照して行う
。4つの画像画素をそれぞれ、符号「+」または「−」(これらの符号は、当該
画像画素におけるラプラシアン関数の符号を示す)でラベル付けする。ラプラシ
アンは、ベクトル2次導関数(second vector derivati
ve)である。1つの画像において、画素色値に適用されるラプラシアン関数の
ゼロ交差が、エッジ画素である。ラプラシアンのゼロ交差が発生するのは、ラプ
ラシアンの2次導関数がゼロとなる場所である。
【0078】
中央画素1405を収容する矩形がゼロ交差を含む場合、中央画素1405は
エッジ画素となる。画素ロケーションが離散している場合、ゼロ交差のロケーシ
ョンを計算することは、不可能であるか、または、計算が困難である。しかし、
画像画素におけるラプラシアンの符号は、矩形中にゼロ交差が存在する可能性を
示す。従って、このラプラシアン方法では、4つの周囲画像画素の各々における
ラプラシアン関数の符号が垂直方向および水平方向双方において異なる(すなわ
ち、右上の画素および左下の画素が1つの符号を有し、右下の画素および左上の
画素が別の符号を有する)場合、中央画素を強いエッジ画素として識別する。上
記の符号が、1つの符号の1つのインスタンスであり、かつ、もう一方の符号の
3つのインスタンスである符号の場合、または、垂直方向および水平方向の両方
において等しい各符号の2つのインスタンスである場合、中央画素は弱いエッジ
画素として識別される。4つの画像画素全てについて符号が同じである場合、中
央画素はエッジ画素ではないと識別される。
エッジ画素となる。画素ロケーションが離散している場合、ゼロ交差のロケーシ
ョンを計算することは、不可能であるか、または、計算が困難である。しかし、
画像画素におけるラプラシアンの符号は、矩形中にゼロ交差が存在する可能性を
示す。従って、このラプラシアン方法では、4つの周囲画像画素の各々における
ラプラシアン関数の符号が垂直方向および水平方向双方において異なる(すなわ
ち、右上の画素および左下の画素が1つの符号を有し、右下の画素および左上の
画素が別の符号を有する)場合、中央画素を強いエッジ画素として識別する。上
記の符号が、1つの符号の1つのインスタンスであり、かつ、もう一方の符号の
3つのインスタンスである符号の場合、または、垂直方向および水平方向の両方
において等しい各符号の2つのインスタンスである場合、中央画素は弱いエッジ
画素として識別される。4つの画像画素全てについて符号が同じである場合、中
央画素はエッジ画素ではないと識別される。
【0079】
エッジ画素の複数のクラスを識別する2つの方法について説明してきたが、代
わりに他の適切な方法を用いてもよい。エッジ画素のクラスを識別して得られる
結果を図15中に示す。図15中の画像は、2つのセグメント(すなわち、黒色
画素の内側セグメントおよび白色画素の外側セグメント)を含む。強いエッジ画
素および弱いエッジ画素を識別して行ったエッジ画素検出プロセスの結果を図示
する;図15中、非エッジの中央画素は省略した。一般的には、強いエッジ画素
は、画像の大きくかつ/または明確な変化(例えば、鮮明なコントラスト)に対
応する中央画素であり、一方、弱いエッジ画素は、実際の色エッジによってまた
は色流出あるいはノイズによって生じた可能性のある画像の僅かな変化を反映す
る。
わりに他の適切な方法を用いてもよい。エッジ画素のクラスを識別して得られる
結果を図15中に示す。図15中の画像は、2つのセグメント(すなわち、黒色
画素の内側セグメントおよび白色画素の外側セグメント)を含む。強いエッジ画
素および弱いエッジ画素を識別して行ったエッジ画素検出プロセスの結果を図示
する;図15中、非エッジの中央画素は省略した。一般的には、強いエッジ画素
は、画像の大きくかつ/または明確な変化(例えば、鮮明なコントラスト)に対
応する中央画素であり、一方、弱いエッジ画素は、実際の色エッジによってまた
は色流出あるいはノイズによって生じた可能性のある画像の僅かな変化を反映す
る。
【0080】
異なるクラスのエッジ画素を識別した後、エッジ鎖を識別することができる。
1つのエッジ鎖を、順序付きの一連のエッジ画素として識別する。異なるクラス
のエッジ画素からエッジ鎖を識別する1つの方法として、任意の強いエッジ画素
から開始して、その強いエッジ画素をエッジ鎖の1つの終端部としてエッジ鎖に
付加する方法がある。次いで、付加されたエッジ画素の最も近接する近隣中央画
素を別の強いエッジ画素用に探す。近隣中央画素が1つの存在する場合、エッジ
画素をエッジ鎖の成長する終端部に付加することにより、エッジ鎖を近隣まで延
長させる。1つの強いエッジ画素近隣部が1つ以上存在する場合、勾配が最も近
く、エッジ画素の勾配に対して直角方向のエッジ画素を選択する。さらなる試験
として、各近隣部における勾配の大きさを考えることが可能である。最も近接す
る近隣部中に強いエッジ画素が無い場合、エッジを弱いエッジ画素である近隣部
まで延長させる。最も近接する近隣部中に強いエッジ画素が1つより多く存在す
る場合、複数の強いエッジ画素から選択を行う場合に用いる試験と同様の試験を
用いて、最良の選択物を選択する。エッジ鎖を継続するための強いエッジ画素ま
たは弱いエッジ画素が存在しない場合、鎖は停止し、プロセスは、別の任意の強
いエッジ画素を探す。
1つのエッジ鎖を、順序付きの一連のエッジ画素として識別する。異なるクラス
のエッジ画素からエッジ鎖を識別する1つの方法として、任意の強いエッジ画素
から開始して、その強いエッジ画素をエッジ鎖の1つの終端部としてエッジ鎖に
付加する方法がある。次いで、付加されたエッジ画素の最も近接する近隣中央画
素を別の強いエッジ画素用に探す。近隣中央画素が1つの存在する場合、エッジ
画素をエッジ鎖の成長する終端部に付加することにより、エッジ鎖を近隣まで延
長させる。1つの強いエッジ画素近隣部が1つ以上存在する場合、勾配が最も近
く、エッジ画素の勾配に対して直角方向のエッジ画素を選択する。さらなる試験
として、各近隣部における勾配の大きさを考えることが可能である。最も近接す
る近隣部中に強いエッジ画素が無い場合、エッジを弱いエッジ画素である近隣部
まで延長させる。最も近接する近隣部中に強いエッジ画素が1つより多く存在す
る場合、複数の強いエッジ画素から選択を行う場合に用いる試験と同様の試験を
用いて、最良の選択物を選択する。エッジ鎖を継続するための強いエッジ画素ま
たは弱いエッジ画素が存在しない場合、鎖は停止し、プロセスは、別の任意の強
いエッジ画素を探す。
【0081】
全てのエッジ画素を処理するかまたは考慮し終えるまでこのプロセスを繰り返
し、その結果、1つの画像について一連のエッジ鎖が得られる。次いで、これら
のエッジ鎖をセグメント化プロセスにおいて用いて、画像をセグメント化する。
し、その結果、1つの画像について一連のエッジ鎖が得られる。次いで、これら
のエッジ鎖をセグメント化プロセスにおいて用いて、画像をセグメント化する。
【0082】
(5.多スケールでのエッジ鎖の生成)
より疎なスケール画像は、複数の変換された画像の表現物を用いて、より微細
なスケール画像を先導することができる。より疎なスケールが先導することがで
きるのは、スケールにわたってエッジ画素が関連付けられている場合である。エ
ッジ画素の関連付けが発生するのは、1つのスケール中のエッジ画素が、同一ま
たは類似の勾配大きさおよび方向を同じエッジ画素としてまたは別のスケールの
近接エッジ画素として有する場合である。2つの勾配ベクトルの同一性または類
似性は、スケール間の重み付けファクターを考慮する試験である。
なスケール画像を先導することができる。より疎なスケールが先導することがで
きるのは、スケールにわたってエッジ画素が関連付けられている場合である。エ
ッジ画素の関連付けが発生するのは、1つのスケール中のエッジ画素が、同一ま
たは類似の勾配大きさおよび方向を同じエッジ画素としてまたは別のスケールの
近接エッジ画素として有する場合である。2つの勾配ベクトルの同一性または類
似性は、スケール間の重み付けファクターを考慮する試験である。
【0083】
本発明による、1つの多スケールエッジ鎖を生成するプロセスでは、複数のス
ケール画像からのエッジ画素を用いて、複数のスケール画像からのエッジ鎖を識
別する。より微細なスケール画像は、より疎なスケール画像よりもより多くのエ
ッジを持つ傾向があるため、より微細なスケール画像中のエッジ鎖を識別するリ
ンク付けルーチンでは、エッジ鎖の終端部において、エッジ鎖を延長させること
が可能な複数のエッジ画素が発生する場合が多い。選択するエッジ画素を判定す
るいくつかの方法については上述の通りである。複数のスケール画像が利用可能
である場合、この選択プロセスを洗練させることができる。
ケール画像からのエッジ画素を用いて、複数のスケール画像からのエッジ鎖を識
別する。より微細なスケール画像は、より疎なスケール画像よりもより多くのエ
ッジを持つ傾向があるため、より微細なスケール画像中のエッジ鎖を識別するリ
ンク付けルーチンでは、エッジ鎖の終端部において、エッジ鎖を延長させること
が可能な複数のエッジ画素が発生する場合が多い。選択するエッジ画素を判定す
るいくつかの方法については上述の通りである。複数のスケール画像が利用可能
である場合、この選択プロセスを洗練させることができる。
【0084】
1つのアプローチにおいて、プロセスにおいて近隣エッジ画素の中から選択を
行なわなければならず、かつ、エッジ鎖がより疎なスケールに対して識別されて
いる場合、プロセスは、選択の際、エッジ鎖をエッジ鎖に沿ってより疎なスケー
ルで延長させるエッジ画素を贔屓する(favor)。例えば、図16の場合に
ついて考える。図16は、中央画素アレイ1600を示し、エッジ画素が塗りつ
ぶされた円として図示し、非エッジ画素の中央画素を白抜きの円(open c
ircle)として図示している。エッジ鎖が識別されており、エッジ鎖の終端
部がエッジ画素1605にあると仮定する。このリンク付けプロセスでは、エッ
ジ鎖をエッジ画素1610またはエッジ画素1615に延長させるための判定を
行なわなければならない。さらに、中央画素アレイ1600は、エッジ画素を先
行アレイよりもより微細なスケールで識別した結果得られたものであると仮定し
、また、先行のより疎なアレイにおいて、エッジ鎖が、エッジ画素1605およ
びエッジ画素1610とは関連付けられたがエッジ画素1615とは関連付けら
れていないエッジ画素を含むものとして識別されたと仮定する。この場合、リン
ク付けプロセスはエッジ画素1610を贔屓する。
行なわなければならず、かつ、エッジ鎖がより疎なスケールに対して識別されて
いる場合、プロセスは、選択の際、エッジ鎖をエッジ鎖に沿ってより疎なスケー
ルで延長させるエッジ画素を贔屓する(favor)。例えば、図16の場合に
ついて考える。図16は、中央画素アレイ1600を示し、エッジ画素が塗りつ
ぶされた円として図示し、非エッジ画素の中央画素を白抜きの円(open c
ircle)として図示している。エッジ鎖が識別されており、エッジ鎖の終端
部がエッジ画素1605にあると仮定する。このリンク付けプロセスでは、エッ
ジ鎖をエッジ画素1610またはエッジ画素1615に延長させるための判定を
行なわなければならない。さらに、中央画素アレイ1600は、エッジ画素を先
行アレイよりもより微細なスケールで識別した結果得られたものであると仮定し
、また、先行のより疎なアレイにおいて、エッジ鎖が、エッジ画素1605およ
びエッジ画素1610とは関連付けられたがエッジ画素1615とは関連付けら
れていないエッジ画素を含むものとして識別されたと仮定する。この場合、リン
ク付けプロセスはエッジ画素1610を贔屓する。
【0085】
いくつかの実施形態において、より疎なスケールのエッジ鎖を判定し、これ以
上の問い合わせを行なわずにエッジ画素1610をエッジ鎖に付加する。別の実
施形態において、他のファクターをより疎なスケールでの対応と共に考慮する。
さらに別の実施形態において、図17(a)および(b)中に示すようにより疎
なスケールのエッジ鎖がエッジ鎖をギャップにわたって継続させるべきであるこ
とを示す場合、中央画素がエッジ画素でなはない場合にでも、中央画素が選択さ
れ得る。図17(a)および(b)中に示すように、中央画素1705は、より
微細なスケールでのエッジ画素ではないため、エッジ鎖1710、1712は、
各中央画素1705に到達しない。しかし、より疎なスケールにおいて、対応す
る中央画素はエッジ画素であり、エッジ鎖中には含まれない。従って、中央画素
1705をより微細なスケールでエッジ鎖に付加し、その結果、エッジ鎖171
0およびエッジ鎖1715を接合する接続が得られる。さらに、異なるより微細
なスケールエッジ鎖からのエッジ画素を同じエッジ鎖とより疎なスケールで関連
付けることもできる。このような場合、2つのより微細なスケールエッジ鎖を、
疎なエッジ鎖ジオメトリの大部分でできるだけ大きく重複するように、接合する
。
上の問い合わせを行なわずにエッジ画素1610をエッジ鎖に付加する。別の実
施形態において、他のファクターをより疎なスケールでの対応と共に考慮する。
さらに別の実施形態において、図17(a)および(b)中に示すようにより疎
なスケールのエッジ鎖がエッジ鎖をギャップにわたって継続させるべきであるこ
とを示す場合、中央画素がエッジ画素でなはない場合にでも、中央画素が選択さ
れ得る。図17(a)および(b)中に示すように、中央画素1705は、より
微細なスケールでのエッジ画素ではないため、エッジ鎖1710、1712は、
各中央画素1705に到達しない。しかし、より疎なスケールにおいて、対応す
る中央画素はエッジ画素であり、エッジ鎖中には含まれない。従って、中央画素
1705をより微細なスケールでエッジ鎖に付加し、その結果、エッジ鎖171
0およびエッジ鎖1715を接合する接続が得られる。さらに、異なるより微細
なスケールエッジ鎖からのエッジ画素を同じエッジ鎖とより疎なスケールで関連
付けることもできる。このような場合、2つのより微細なスケールエッジ鎖を、
疎なエッジ鎖ジオメトリの大部分でできるだけ大きく重複するように、接合する
。
【0086】
さらに、より疎なスケールのエッジ鎖がより微細なスケールで関連付けられた
鎖よりも長い図18(a)〜(c)中に示すように、リンク付けプロセスでは、
より微細なスケールエッジ鎖を適切に延伸する。この工程は、「エッジ鎖延伸」
と呼ばれる。図示の実施例において、より微細なスケール(図18(b))にお
いて、鎖は中央画素2302において停止し、より疎なスケール画像エッジ鎖は
中央画素を中央画素2202から中央画素2201へと1つだけ多く継続させる
点を除いて、2つの鎖は、同じエッジ画素を同じ順序で有する(図18(a))
。次いで、このプロセスでは、図18(c)中に示すように、より微細なエッジ
鎖を継続させて、中央画素2301へのリンク付けを行う。
鎖よりも長い図18(a)〜(c)中に示すように、リンク付けプロセスでは、
より微細なスケールエッジ鎖を適切に延伸する。この工程は、「エッジ鎖延伸」
と呼ばれる。図示の実施例において、より微細なスケール(図18(b))にお
いて、鎖は中央画素2302において停止し、より疎なスケール画像エッジ鎖は
中央画素を中央画素2202から中央画素2201へと1つだけ多く継続させる
点を除いて、2つの鎖は、同じエッジ画素を同じ順序で有する(図18(a))
。次いで、このプロセスでは、図18(c)中に示すように、より微細なエッジ
鎖を継続させて、中央画素2301へのリンク付けを行う。
【0087】
図19(a)および(b)中に示すように、エッジ鎖を完全に生成した後、リ
ンク付けルーチンは、さらにいくつかの中央画素をエッジの各終端部に付加し得
る。これは、エッジ鎖間の小さなギャップを塞ぎ、しばしば所与の領域を完全に
封入する効果を有する。1つ以上の画素を図19(a)中に示す各エッジ鎖に付
加することによって、図19(b)中に示すように、未封入領域を完全に境界付
けられる。
ンク付けルーチンは、さらにいくつかの中央画素をエッジの各終端部に付加し得
る。これは、エッジ鎖間の小さなギャップを塞ぎ、しばしば所与の領域を完全に
封入する効果を有する。1つ以上の画素を図19(a)中に示す各エッジ鎖に付
加することによって、図19(b)中に示すように、未封入領域を完全に境界付
けられる。
【0088】
エッジ鎖リンク付けにおいて多スケール関連付けを用いる際の基本的プロセス
の変更例において、複数のクラスのエッジ画素を用いることができる。1つの実
施形態において、そのクラスの近隣部とより疎なスケールからの任意の関連付け
とに基づいて、エッジ鎖をエッジ画素終端部から別の中央画素へと延長させる。
例えば、リンク付けプロセスでは先ず第1に、強いエッジ画素のみについて考え
、対応するエッジ鎖延長をより疎なスケールで探し、次いで、強いエッジ画素ま
たは関連付けが見付からない場合、弱いエッジ画素について考える。別の変更例
において、リンク付けプロセスでは、先ず第1に強いエッジ画素について考え、
次いで、弱いエッジ画素について考え、そして、エッジ画素がより微細なスケー
ルで見付からない場合、強いエッジ画素または弱いエッジ画素を用いる対応する
エッジ鎖の延長のみより疎なスケールで探す。
の変更例において、複数のクラスのエッジ画素を用いることができる。1つの実
施形態において、そのクラスの近隣部とより疎なスケールからの任意の関連付け
とに基づいて、エッジ鎖をエッジ画素終端部から別の中央画素へと延長させる。
例えば、リンク付けプロセスでは先ず第1に、強いエッジ画素のみについて考え
、対応するエッジ鎖延長をより疎なスケールで探し、次いで、強いエッジ画素ま
たは関連付けが見付からない場合、弱いエッジ画素について考える。別の変更例
において、リンク付けプロセスでは、先ず第1に強いエッジ画素について考え、
次いで、弱いエッジ画素について考え、そして、エッジ画素がより微細なスケー
ルで見付からない場合、強いエッジ画素または弱いエッジ画素を用いる対応する
エッジ鎖の延長のみより疎なスケールで探す。
【0089】
(6.エッジ鎖のフィルタリング)
図20(a)は、エッジ鎖を識別するプロセスから得られたエッジ鎖の画像で
ある。このエッジ鎖画像において、セグメントエッジに対応しない短いエッジ鎖
が多数有る。このようなスプリアスエッジが発生し得るのは、主にデジタル化エ
ラーまたは画像中の陰影の軽微な変更の結果、エッジ鎖が作成されたときである
。
ある。このエッジ鎖画像において、セグメントエッジに対応しない短いエッジ鎖
が多数有る。このようなスプリアスエッジが発生し得るのは、主にデジタル化エ
ラーまたは画像中の陰影の軽微な変更の結果、エッジ鎖が作成されたときである
。
【0090】
図20(b)〜(e)は、閾値ルーチンを各スケールで画像に適用した後の結
果である。閾値ルーチンは、静的スライディングスケールまたは動的スライディ
ングスケールを用いて、図20(b)〜(e)の画像を生成することができる。
静的な方法において、エッジ鎖が基準線の長さ要件および最低強度要件の両方を
満たさない場合、エッジ鎖を除去する。
果である。閾値ルーチンは、静的スライディングスケールまたは動的スライディ
ングスケールを用いて、図20(b)〜(e)の画像を生成することができる。
静的な方法において、エッジ鎖が基準線の長さ要件および最低強度要件の両方を
満たさない場合、エッジ鎖を除去する。
【0091】
この動的スライディングスケール試験は、より包括的である。長さ閾値および
強度閾値を関連させ、これにより、鎖が長くなるほど、エッジ鎖を保持するため
に満たすことが必要な強度閾値はより低くなる。同様に、エッジ鎖が明るくなる
ほど、長さ閾値は低くなる。
強度閾値を関連させ、これにより、鎖が長くなるほど、エッジ鎖を保持するため
に満たすことが必要な強度閾値はより低くなる。同様に、エッジ鎖が明るくなる
ほど、長さ閾値は低くなる。
【0092】
1つの実施例において、閾値化に関係無く、エッジ鎖を、スケールにわたって
保持する。具体的には、エッジ鎖をスケールにわたって関連付け、より疎なスケ
ールでの閾値化で生き残ったエッジ鎖をより微細なスケールで保持する。この工
程は、エッジ鎖が(より疎なスケールと別に考えたときに)より微細なスケール
での閾値化では生き残らない場合にでも、行う。別の実施例において、先行映像
フレームからの鎖は、エッジ鎖が廃棄されるのを防ぎ得る。
保持する。具体的には、エッジ鎖をスケールにわたって関連付け、より疎なスケ
ールでの閾値化で生き残ったエッジ鎖をより微細なスケールで保持する。この工
程は、エッジ鎖が(より疎なスケールと別に考えたときに)より微細なスケール
での閾値化では生き残らない場合にでも、行う。別の実施例において、先行映像
フレームからの鎖は、エッジ鎖が廃棄されるのを防ぎ得る。
【0093】
図21は、入力画像のオリジンが映像シーケンスである状況を示す。各スケー
ルにおけるエッジ鎖情報をフレームにわたって保持している点に留意されたい。
図21(a)は、先行映像フレームを示す。図21(b)は、現在の映像フレー
ムを示す。図21(c)は、先行フレームに基づいた閾値化を行った後の現在の
フレームを示す。
ルにおけるエッジ鎖情報をフレームにわたって保持している点に留意されたい。
図21(a)は、先行映像フレームを示す。図21(b)は、現在の映像フレー
ムを示す。図21(c)は、先行フレームに基づいた閾値化を行った後の現在の
フレームを示す。
【0094】
閾値化を行い、エッジ鎖40011を保持した後の先行フレームを示す。現在
のフレームのエッジ鎖は、エッジ鎖40020、40021および40022を
含む。エッジ鎖40011および40021がフレームに亘って関連付けられて
いるのは、エッジ鎖40011および40021が同一のロケーションおよび類
似の勾配で画素を共有しているからである。現在のフレームにおいて、エッジ鎖
40020は、上述した閾値化試験に合格したため、保持される。しかし、エッ
ジ鎖40021または40022のいずれも閾値化試験に合格しないないため、
除去候補となる。フレーム上で矛盾の無いセグメント化が行なわれることを確実
にするために、エッジ鎖40021を保持する。なぜならば、エッジ鎖4002
1は、先行フレームにおいて保持されたエッジ鎖40011と関連付けられてい
るからである。逆に、エッジ鎖40022は保持されない。なぜならば、エッジ
鎖40022は閾値試験に合格せず、先行フレーム中に保持されたエッジ鎖と関
連付けられていないからである。
のフレームのエッジ鎖は、エッジ鎖40020、40021および40022を
含む。エッジ鎖40011および40021がフレームに亘って関連付けられて
いるのは、エッジ鎖40011および40021が同一のロケーションおよび類
似の勾配で画素を共有しているからである。現在のフレームにおいて、エッジ鎖
40020は、上述した閾値化試験に合格したため、保持される。しかし、エッ
ジ鎖40021または40022のいずれも閾値化試験に合格しないないため、
除去候補となる。フレーム上で矛盾の無いセグメント化が行なわれることを確実
にするために、エッジ鎖40021を保持する。なぜならば、エッジ鎖4002
1は、先行フレームにおいて保持されたエッジ鎖40011と関連付けられてい
るからである。逆に、エッジ鎖40022は保持されない。なぜならば、エッジ
鎖40022は閾値試験に合格せず、先行フレーム中に保持されたエッジ鎖と関
連付けられていないからである。
【0095】
(7.組み合わせ)
上記においてセグメント化を改良するための6つの方法および対応する装置に
ついて説明した。これらの方法および装置の1つ以上は、セグメント化プロセス
をさらに向上させるために組み合わせが可能である。例えば、漸進的な塗りつぶ
しを複数のスケールにわたって用いることが可能であり、塗りつぶしプロセスを
最も疎なスケールで行い、次いで、より疎なスケールでのセグメントを用いて、
より微細なスケールでのセグメント化を先導する。
ついて説明した。これらの方法および装置の1つ以上は、セグメント化プロセス
をさらに向上させるために組み合わせが可能である。例えば、漸進的な塗りつぶ
しを複数のスケールにわたって用いることが可能であり、塗りつぶしプロセスを
最も疎なスケールで行い、次いで、より疎なスケールでのセグメントを用いて、
より微細なスケールでのセグメント化を先導する。
【0096】
別の組み合わせとしては、合成物エッジ検出と複数のクラスのエッジ検出との
組み合わせがある。この組み合わせを用いると、エッジ検出プロセスは、各色面
上で別個に動作して、強いエッジ画素および弱いエッジ画素を識別し、次いで、
異なる色面からのエッジ画素を組み合せることにより、フィルタリングを行う。
組み合わせがある。この組み合わせを用いると、エッジ検出プロセスは、各色面
上で別個に動作して、強いエッジ画素および弱いエッジ画素を識別し、次いで、
異なる色面からのエッジ画素を組み合せることにより、フィルタリングを行う。
【0097】
別の改変例において、強いエッジ画素および弱いエッジ画素を識別した後かつ
エッジ鎖を識別する前に、色情報を後の段階で用いる。エッジ画素を識別するル
ーチンは、各スケールにおいて2つの合成物エッジ画素画像を生成する。第1の
画像は、全色面からの全ての強いエッジ画素から構成され、第2の画像は、任意
の色面からの全ての弱いエッジ画素から構成される。同じエッジ画素が複数の色
成分で設計される場合もある。この状況において、エッジ画素は、合成画像中に
一度だけ含まれる。1)エッジ画素が異なる色成分中の同一のロケーションを共
有する場合または2)エッジ画素が異なる色成分中の同一のアレイロケーション
を共有し、かつ、類似の勾配を有する場合の2つの条件のうち1つが満たされた
場合、複数の色成分中のエッジ画素は、同一のものとして指定される。
エッジ鎖を識別する前に、色情報を後の段階で用いる。エッジ画素を識別するル
ーチンは、各スケールにおいて2つの合成物エッジ画素画像を生成する。第1の
画像は、全色面からの全ての強いエッジ画素から構成され、第2の画像は、任意
の色面からの全ての弱いエッジ画素から構成される。同じエッジ画素が複数の色
成分で設計される場合もある。この状況において、エッジ画素は、合成画像中に
一度だけ含まれる。1)エッジ画素が異なる色成分中の同一のロケーションを共
有する場合または2)エッジ画素が異なる色成分中の同一のアレイロケーション
を共有し、かつ、類似の勾配を有する場合の2つの条件のうち1つが満たされた
場合、複数の色成分中のエッジ画素は、同一のものとして指定される。
【0098】
さらに別の組み合わせとして、エッジ鎖を各成分中で発見し、次いで、それら
のエッジ鎖を合成物する方法がある。詳細には、先ず、各色成分中で発見された
局部的極値を、当該画像の他の色成分中で発見された極値と別に保存する。この
リンク付けプロセスでは、各色成分中のエッジ画素を別個にリンク付けし、次い
で、エッジ鎖を組み合わせて1つの合成画像にすることにより、エッジ鎖を作成
する。1つの色成分の勾配によって判定されたエッジ鎖のうちいくつかが、残り
の色成分の勾配によって判定されたエッジ鎖に類似していることが(恐らくでは
あるが)可能であるため、このリンク付けプロセスは、類似の鎖を合体(coa
lesce)させて、(恐らくはより長い鎖およびより少ないギャップを形成す
る)1つの鎖にする。同じスケールのエッジ鎖は、以下の基準のうち1つ以上を
満たした場合、類似する:1)全ての点において同一である;2)自身の画素の
大部分を互いに共有している;3)(差が微小な範囲に収まって)ジオメトリが
同じであるが、ごく少数の画素分だけオフセットしている;4)同じより疎なス
ケールエッジ鎖と別のスケールで関連付けられている。
のエッジ鎖を合成物する方法がある。詳細には、先ず、各色成分中で発見された
局部的極値を、当該画像の他の色成分中で発見された極値と別に保存する。この
リンク付けプロセスでは、各色成分中のエッジ画素を別個にリンク付けし、次い
で、エッジ鎖を組み合わせて1つの合成画像にすることにより、エッジ鎖を作成
する。1つの色成分の勾配によって判定されたエッジ鎖のうちいくつかが、残り
の色成分の勾配によって判定されたエッジ鎖に類似していることが(恐らくでは
あるが)可能であるため、このリンク付けプロセスは、類似の鎖を合体(coa
lesce)させて、(恐らくはより長い鎖およびより少ないギャップを形成す
る)1つの鎖にする。同じスケールのエッジ鎖は、以下の基準のうち1つ以上を
満たした場合、類似する:1)全ての点において同一である;2)自身の画素の
大部分を互いに共有している;3)(差が微小な範囲に収まって)ジオメトリが
同じであるが、ごく少数の画素分だけオフセットしている;4)同じより疎なス
ケールエッジ鎖と別のスケールで関連付けられている。
【0099】
さらに別の組み合わせにおいて、上記のプロセス全てを組み合わせて、改良さ
れたセグメント化プロセスを形成する。
れたセグメント化プロセスを形成する。
【0100】
上記の記載は例示的なものであって、限定的なものではない。本明細書の開示
内容を読めば、当業者にとって本発明の多くの改変例が明らかとなる。従って、
本発明の範囲は、上記の記載で判断されるべきではなく、本明細書中の特許請求
の範囲およびその全範囲における均等物によって判断されるべきである。
内容を読めば、当業者にとって本発明の多くの改変例が明らかとなる。従って、
本発明の範囲は、上記の記載で判断されるべきではなく、本明細書中の特許請求
の範囲およびその全範囲における均等物によって判断されるべきである。
【図1】
図1は、簡単な画像セグメント化プロセスを示す画像である。
【図2】
図2は、画像をセグメント化する装置のブロック図である。
【図3】
図3は、セグメント化された画像を用いることが可能なシステムのブロック図
である。
である。
【図4】
図4は、画像および関連するセグメントデータを含むデータストリームを示す
。
。
【図5】
図5は、対応する画像に関するセグメントリストが現れる様式を示す。
【図6】
図6は、黒色画像画素および白色画像画素の画像中のエッジ画素を示す。小さ
くて、薄く影色の付いた画素で示すエッジ画素が、黒色画像画素と白色画像画素
との間に介在している。
くて、薄く影色の付いた画素で示すエッジ画素が、黒色画像画素と白色画像画素
との間に介在している。
【図7】
図7は、画像画素の2つのセグメント間のエッジ鎖を示す。
【図8】
図8は、漸進的な刷毛塗り部(brush)を用いて画像をセグメント化する
様子を示す。
様子を示す。
【図9】
図9は、エッジ鎖のいずれかの側部において画像を部分的に塗りつぶす様子を
示す。
示す。
【図10】
図10は、3つの色成分それぞれにおける画素の勾配を示す。
【図11】
図11は、画像画素、エッジ画素およびエッジを備える画像を示す。
【図12】
図12は、勾配技術を用いてエッジ画素が強い部分を判定するプロセスを示す
。
。
【図13】
図13は、勾配技術を用いてエッジ画素が弱い部分を判定するプロセスを示す
。
。
【図14】
図14は、ラプラシアン技術を用いてエッジ画素が強い部分を判定するプロセ
スを示す。
スを示す。
【図15】
図15は、画像画素およびエッジ画素が識別された(強いエッジ画素および弱
いエッジ画素を含む)を備える画像を示す。
いエッジ画素を含む)を備える画像を示す。
【図16】
図16は、エッジ鎖を生成する際にエッジ画素から選択を行うプロセスを示す
。
。
【図17】
図17は、エッジ鎖を小さなギャップに亘って継続させるプロセスを示す。
【図17a】
図17(a)は、ギャップを有する2つのエッジ鎖を示す。
【図17b】
図17(b)は、ギャップが塗りつぶされた様子を示す。
【図18】
図18は、1つ以上のスケールからエッジ鎖をリンク付けするプロセスを示す。
【図18a】
図18(a)は、より疎なスケールからのエッジ鎖を示す。
【図18b】
図18(b)は、より微細なスケールからのエッジ鎖を示す。
【図18c】
図18(c)は、上記の組み合わせを示す。
【図19】
図19は、エッジ鎖を延長するプロセスを示す。
【図19a】
図19(a)は、エッジ鎖を延長する前の画像を示す。
【図19b】
図19(b)は、エッジ鎖を延長した後の画像を示す。
【図20a】
図20(a)は、様々な程度のエッジ鎖のフィルタリングを施した画像である
。
。
【図20b】
図20(b)は、様々な程度のエッジ鎖のフィルタリングを施した画像である
。
。
【図20c】
図20(c)は、様々な程度のエッジ鎖のフィルタリングを施した画像である
。
。
【図20d】
図20(d)は、様々な程度のエッジ鎖のフィルタリングを施した画像である
。
。
【図20e】
図20(e)は、様々な程度のエッジ鎖のフィルタリングを施した画像である
。
。
【図21a】
図21(a)は、映像フレームにわたってエッジ鎖フィルタリングを行うプロ
セスを示す。
セスを示す。
【図21b】
図21(b)は、映像フレームにわたってエッジ鎖フィルタリングを行うプロ
セスを示す。
セスを示す。
【図21c】
図21(c)は、映像フレームにわたってエッジ鎖フィルタリングを行うプロ
セスを示す。
セスを示す。
【手続補正書】
【提出日】平成13年12月17日(2001.12.17)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0001
【補正方法】削除
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0017
【補正方法】変更
【補正の内容】
【0017】
(4.ハイブリッドセグメント化)
ハイブリッド技術の目的は、今までの複数のセグメント化プロセスからのプロ
セスを組み合わせて画像セグメント化を改良することである。殆どのハイブリッ
ド技術は、エッジセグメント化と領域ベースのセグメント化との組み合わせであ
り、これらのプロセスのうち1つを用いて画像をセグメント化して、次に他のプ
ロセスを続けて行う。ハイブリッド技術は、1つのプロセスを単独で行う場合よ
りも良好なセグメントを生成しようとするものであるが、ハイブリッド方法では
、ユーザに有意な量の指導を行い、またセグメント化対象画像の知識も事前に必
要であるため、完全に自動化されたセグメント化用途には不適切であることが分
かっている。 簡単な記載に値する様々な参考文献が存在する。G.W.Cookらによる、 「Multiresolution Sequential Edge Lin
king」、Proceedings of the Internation
al Conference on Image Processing(IC IP)、Los Alimitos、US、IEEE Comp.Soc.Pr ess、1995年10月23日、pages41−44、XP0006241 76、ISBN:0−7803−3122−2では、グレイスケール画像のエッ ジ検出が考慮される。M.Liらによる、「Pyramid Edge Dte ction for Color Images」Optical Engin eering、Society of Photo−Optical Inst rumentation Engineers、Bellingham、US、 vol.36、no.5、1997年5月1日、pages1431−1437 、XP000692376、ISSN:0091−3286では、色画像内のエ ッジ検出の言及が見出される。S.Chunらによる「Region Comp etition:Unifying Snakes、Region Growi ng、and Bayes/MDL for Multiband Image Segmentation、 IEEE Transactions on Pattern Analysis and Machine Intelli gence」、vol.18、no.9、1996年9月、pages884− 900では、グレイレベルでの画像セグメント化の問題は、連続的な閉じたエッ ジ輪郭を検出することを伴って、色またはテクスチャ画像が言及される。J.P .Derutinらによる、「Edge and Region Image Segmentation Processes on the Parall el Vision Machine Transvision」、Compu ter Architectures for Machine Percep tion、1993 Proceedings、1993年11月、pages 410−420では、輪郭チェーン生成が概説されている。この文献は、元の画 像からの指向性勾配を生成して、勾配の局所的な最大値(少なくとも2つの閾値 を使用して取り出された勾配の局所的最大値)のヒステリシス閾値を取り出すこ と、および連結されたエッジポイントのリンクされたリストを生成すること含む 。E.Saberらによる、「Fusion of Color and Ed ge Information for Improved Segmenta tion and Edge Linking」1996 IEEE Inte rnational Conference on Acoustics、Sp eech、and Signal Processing(ICASSP−96 )、Conference Proceedings、 1996、vol.4 、pages2176−2179では、色画像内のエッジ検出は、各色チャンネ ル内のエッジを検出することによって実行され得、次いでその結果を重ね合わせ る。
セスを組み合わせて画像セグメント化を改良することである。殆どのハイブリッ
ド技術は、エッジセグメント化と領域ベースのセグメント化との組み合わせであ
り、これらのプロセスのうち1つを用いて画像をセグメント化して、次に他のプ
ロセスを続けて行う。ハイブリッド技術は、1つのプロセスを単独で行う場合よ
りも良好なセグメントを生成しようとするものであるが、ハイブリッド方法では
、ユーザに有意な量の指導を行い、またセグメント化対象画像の知識も事前に必
要であるため、完全に自動化されたセグメント化用途には不適切であることが分
かっている。 簡単な記載に値する様々な参考文献が存在する。G.W.Cookらによる、 「Multiresolution Sequential Edge Lin
king」、Proceedings of the Internation
al Conference on Image Processing(IC IP)、Los Alimitos、US、IEEE Comp.Soc.Pr ess、1995年10月23日、pages41−44、XP0006241 76、ISBN:0−7803−3122−2では、グレイスケール画像のエッ ジ検出が考慮される。M.Liらによる、「Pyramid Edge Dte ction for Color Images」Optical Engin eering、Society of Photo−Optical Inst rumentation Engineers、Bellingham、US、 vol.36、no.5、1997年5月1日、pages1431−1437 、XP000692376、ISSN:0091−3286では、色画像内のエ ッジ検出の言及が見出される。S.Chunらによる「Region Comp etition:Unifying Snakes、Region Growi ng、and Bayes/MDL for Multiband Image Segmentation、 IEEE Transactions on Pattern Analysis and Machine Intelli gence」、vol.18、no.9、1996年9月、pages884− 900では、グレイレベルでの画像セグメント化の問題は、連続的な閉じたエッ ジ輪郭を検出することを伴って、色またはテクスチャ画像が言及される。J.P .Derutinらによる、「Edge and Region Image Segmentation Processes on the Parall el Vision Machine Transvision」、Compu ter Architectures for Machine Percep tion、1993 Proceedings、1993年11月、pages 410−420では、輪郭チェーン生成が概説されている。この文献は、元の画 像からの指向性勾配を生成して、勾配の局所的な最大値(少なくとも2つの閾値 を使用して取り出された勾配の局所的最大値)のヒステリシス閾値を取り出すこ と、および連結されたエッジポイントのリンクされたリストを生成すること含む 。E.Saberらによる、「Fusion of Color and Ed ge Information for Improved Segmenta tion and Edge Linking」1996 IEEE Inte rnational Conference on Acoustics、Sp eech、and Signal Processing(ICASSP−96 )、Conference Proceedings、 1996、vol.4 、pages2176−2179では、色画像内のエッジ検出は、各色チャンネ ル内のエッジを検出することによって実行され得、次いでその結果を重ね合わせ る。
─────────────────────────────────────────────────────
フロントページの続き
(81)指定国 EP(AT,BE,CH,CY,
DE,DK,ES,FI,FR,GB,GR,IE,I
T,LU,MC,NL,PT,SE),OA(BF,BJ
,CF,CG,CI,CM,GA,GN,GW,ML,
MR,NE,SN,TD,TG),AP(GH,GM,K
E,LS,MW,MZ,SD,SL,SZ,TZ,UG
,ZW),EA(AM,AZ,BY,KG,KZ,MD,
RU,TJ,TM),AE,AG,AL,AM,AT,
AU,AZ,BA,BB,BG,BR,BY,CA,C
H,CN,CR,CU,CZ,DE,DK,DM,DZ
,EE,ES,FI,GB,GD,GE,GH,GM,
HR,HU,ID,IL,IN,IS,JP,KE,K
G,KP,KR,KZ,LC,LK,LR,LS,LT
,LU,LV,MA,MD,MG,MK,MN,MW,
MX,MZ,NO,NZ,PL,PT,RO,RU,S
D,SE,SG,SI,SK,SL,TJ,TM,TR
,TT,TZ,UA,UG,US,UZ,VN,YU,
ZA,ZW
(72)発明者 チェン, ジョン エス.
アメリカ合衆国 カリフォルニア 94087,
サニーベイル, ハノーバー アベニュ
ー 873
(72)発明者 クック, デイビッド エル.
アメリカ合衆国 カリフォルニア 94086,
サニーベイル, ノース ウォルフェ
ロード ナンバー817 355
Fターム(参考) 5B080 FA02 GA25
5L096 AA02 AA06 BA08 BA12 DA01
EA03 FA06 FA15 FA72 GA17
GA55
Claims (27)
- 【請求項1】 デジタル画像内のエッジを検出する方法であって、該デジタ
ル画像は画素のアレイを含み、各画素は、画素位置および画素色値を有し、該エ
ッジは該デジタル画像の1つのセグメントを表現する画素と該デジタル画像内の
別のセグメント表現する画素との間の該アレイにおける遷移を表現し、該方法は
、 1以上のフィルタリングされた画像を生成する工程であって、各フィルタリン
グされた画像は、該複数のフィルタリングされた画像のそれぞれについて異なる
フィルタを用いて該デジタル画像のフィルタリングの結果であり、該異なるフィ
ルタは該デジタル画像から異なる解像度のセグメントを提供する、工程と、 該デジタル画像内の該画素のアレイの間で色シフトを識別することによって該
デジタル画像内のエッジを識別する工程と、 該1以上のフィルタリングされた画像の該画素の間で色シフトを識別すること
によって該デジタル画像内のさらなるエッジを識別する工程と、 該さらに識別された少なくともいくつかのエッジからの第2の解像度の該画像
におけるさらに閉じたセグメント境界を生成する工程であって、 第2の解像度の画像の該少なくともいくつかの閉じたセグメントの境界は、第
1の解像度の画像の閉じたセグメントの境界のサブセットである、 を含む、方法。 - 【請求項2】 前記1以上のフィルタリングされた画像は、アイデンティテ
ィフィルタを用いて生成された1つのフィルタリングされた画像を含む複数のフ
ィルタリングされた画像であって、それにより該複数のフィルタリングされた画
像の1つとして前記デジタル画像を含む、請求項1に記載の方法。 - 【請求項3】 前記異なるフィルタは異なるスケールの解像度のフィルタで
ある、請求項1に記載の方法。 - 【請求項4】 前記異なるフィルタは、異なるウインドウサイズを有する平
滑化フィルタである、請求項1に記載の方法。 - 【請求項5】 前記異なるフィルタは、異なる画素解像度に間引き、それに
より前記1以上のフィルタリングされた画像にわたって画素アレイのサイズを変
動させる、請求項1に記載の方法。 - 【請求項6】 前記フィルタは、 様々な勾配の多項式次数の勾配フィルタである、請求項1に記載の方法。
- 【請求項7】 前記異なるフィルタはラプラジアンフィルタである、請求項
1に記載の方法。 - 【請求項8】 前記デジタル画像は、単色平面として表わされ、各画素色値
は、該単色平面でシェードを表現するスカラー値によって表現される、請求項1
に記載の方法。 - 【請求項9】 画素に対する各画素色値は、多成分ベクトルであり、該画素
に対する前記スカラー値は該画素色値ベクトルの成分の関数である、請求項8に
記載の方法。 - 【請求項10】 前記画素色値ベクトルの成分の関数は、照度関数である、
請求項9に記載の方法。 - 【請求項11】 前記画素色値ベクトルの成分の関数は、加算である、請求
項9に記載の方法。 - 【請求項12】 前記画素色値ベクトルの成分の関数は、重み付き加算であ
る、請求項9に記載の方法。 - 【請求項13】 デジタル画像内のエッジを検出する方法であって、該デジ
タル画像は、画素のアレイを含み、各画素は、画素領域および画素色値を有し、
エッジは該デジタル画像の1つのセグメントを表現する該画素と該デジタル画像
の別のセグメントを表現する画素との間のアレイの境界を表現し、 該デジタル画像のエッジポイントを識別する工程であって、該エッジポイント
は、画素領域であるポイント領域間の画素の該アレアレイ内のポイントである、
工程と、 より多くの所定のクラスのエッジポイントおよびより少ない所定のクラスのエ
ッジポイントを含む複数のエッジポイントのクラスを識別する工程であって、該
より多くの所定のクラスにおけるエッジポイントは、該より少ない所定のクラス
のエッジポイントよりも該デジタル画像のセグメントのエッジを表現する可能性
がより高い、工程と、 エッジポイントチェーンを形成するための該より多くの所定のクラスの隣接す
るエッジポイントをリンクすることによってエッジを識別する工程と、 ギャップがエッジポイントチェーン間に存在する場合、該より少ない所定のク
ラスにおいてエッジポイントを識別して該エッジポイントチェーンにおけるギャ
ップを測定する、工程と、 該デジタル画像内で該エッジの表現として該エッジポイントチェーンを用いる
工程と を含む、方法。 - 【請求項14】 前記画素アレイは、矩形アレイであり、該画素アレイにお
いて4つの互いに隣接する画素によって規定される矩形の中心に各エッジポイン
トを位置付ける工程をさらに含む、請求項13に記載の方法。 - 【請求項15】 前記複数のクラスは2より多くのクラスを含み、各クラス
が、他のクラスの相対的確実性から整列可能で異なる各クラスの相対的確実性を
有する該クラス内の前記エッジポイントに関連付けられる相対的確実性を有し、
該方法は、より少ない所定のクラスのエッジポイントが用いられる前であるが、
より多くの所定のクラスエッジポイントが用いられた後にエッジチェーンを結合
する際に用いるためのクラス内のエッジポイントを識別する工程をさらに含む、
請求項13に記載の方法。 - 【請求項16】 デジタル画像内のエッジを検出する方法であって、該デジ
タル画像は画素のアレイを含み、各画素は、画素領域および画素色値を有し、画
素色値は、色空間においてベクトルとして表現可能であり、エッジは該デジタル
画像の1つのセグメントを表現する該画素と該デジタル画像の別のセグメントを
表現する画素との間のアレイの境界を表現し、該方法は、 該デジタル画像を複数の色平面画像に分離する工程と、 該色平面画像の各々をフィルタリングして各色平面に対する極値画像を形成す
る工程であって、極値画像は該画素のアレイに対応する値のアレイであり、該画
素のアレイに対応する値のアレイは、画素のアレイの対応する位置における極値
を表現する、工程と、 該複数の極値画像を組み合わせて合成極値画像を形成する工程であって、 所与画素に対して、各色平面に対する別の画像の値のアレイから対応する値の
変更されベクトル追加を実行する工程を含み、 該変更されたベクトル追加は、閾値テストを満たす場合、追加の前に値の符号
を取り出す工程を含む、工程と、 該合成極値画像を用いて該デジタル画像内のエッジを検出する工程と を含む、方法。 - 【請求項17】 前記複数の色平面は、2つ以上の色平面である、請求項1
6に記載の方法。 - 【請求項18】 前記複数の色平面は、3つの色平面である、請求項16に
記載の方法。 - 【請求項19】 前記複数の色平面は、輝度色平面および2つのクロミナン
ス色平面を含む、請求項16に記載の方法。 - 【請求項20】 前記複数の色平面は、赤色平面、青色平面、および緑色平
面を含む、請求項16に記載の方法。 - 【請求項21】 前記複数の色平面は、シアン色平面、黄色平面、マジェン
タ色平面、および黒色平面を含む、請求項16に記載の方法。 - 【請求項22】 デジタル画像内のエッジを検出する方法であって、該デジ
タル画像は画素のアレイを含み、各画素のアレイは画素領域および画素色値を有
し、各画素色値は、色空間においてベクトルとして表現可能であり、エッジは、
該デジタル画像の1つのセグメントを表現する画素と該デジタル画像の別のセグ
メントを表現する画素との間で該アレイの境界を表現し、該方法は、 該デジタル画像を複数の色平面画像に分離する工程であって、該色平面画像は
画素色値ベクトルの1成分に対応する画素値を有する画素のアレイである、工程
と、 1以上のフィルタリングされた画像を生成する工程であって、各フィルタリン
グされた画像は該複数のフィルタリングされた画像のそれぞれについて異なるフ
ィルタを使用して該色平面画像の1つをフィルタリングした結果であって、該異
なるフィルタは該デジタル画像からのセグメントの異なる解像度を提供する、工
程と、 該色平面画像内の該画素のアレイ間の色シフトを識別することによって該デジ
タル画像内のエッジを識別する工程と、 少なくともいくつかの該識別されたエッジからの第1の解像度の色平面画像の
閉じたセグメント境界を生成する工程であって、 少なくともいくつかの該識別されたエッジおよび閉じたセグメント境界は、第
2の解像度のフィルタリングされた色平面画像に伝播する、工程と 該1以上のフィルタリングされた画像の該画素のアレイ間の色シフトを識別す
ることによって該デジタル画像内のさらなるエッジを識別する工程と 少なくともいくつかのさらに識別されたエッジからの第2の解像度の色平面画
像のさらに閉じた境界を生成する工程であって、 第2の解像度の該色平面画像の該少なくともいくつかのさらに閉じたセグメン
ト境界は、第1の解像度の該色平面の閉じたセグメント境界のサブセットである
、工程と を含む、方法。 - 【請求項23】 デジタル画像内のエッジを検出する方法であって、該デジ
タル画像は画素のアレイを含み、各画素は画素領域および画素色値を有し、各画
素色値は、色空間においてベクトルとして表現可能であり、エッジは、該デジタ
ル画像の1つのセグメントを表現する画素と該デジタル画像の別のセグメントを
表現する画素との間にある該アレイの境界を表現し、該方法は、 該デジタル画像のエッジポイントを識別する工程であって、該エッジポイント
は、画素領域であるポイント領域間で該画素のアレイ内のポイントである、工程
と、 より多くの所定のクラスのエッジポイントおよびより少ない所定のクラスのエ
ッジポイントを含む複数のクラスのエッジポイントを識別する工程であって、該
より多くの所定のクラスのエッジポイントは、該より少ない所定のクラスのエッ
ジポイントよりも該デジタル画像のセグメントのエッジを表現する可能性がより
高く、該エッジポイントのクラスは、該エッジポイント付近の画素に対する画素
色値ベクトルの成分値の関数である、工程と、 エッジポイントチェーンを形成するために該より多くの所定のクラスの隣接す
るエッジポイントをリンクすることによってエッジを識別する工程と、 エッジポイントチェーン間にギャップが存在する場合、該より少ない所定のク
ラスおいてエッジポイントを識別して、該エッジポイントチェーン内のギャップ
を測定する工程と、 該デジタル画像内の該エッジの表現として該エッジポイントチェーンを使用す
る、工程と を含む、方法。 - 【請求項24】 デジタル画像内で物体のエッジによって規定される複数の
セグメントに該デジタル画像をセグメント化する方法であって、該デジタル画像
は、画素のアレイを含み、該画素は画素領域および画素色値を有し、該エッジは
該デジタル画像の1つのセグメントを表現する画素と該デジタル画像の別のセグ
メントを表現する画素との間で該アレイの遷移を表現し、該方法は、 エッジチェーンのセットを識別する工程であって、エッジチェーンは2つのセ
グメント間の境界を表現し、少なくとも1つのエッジチェーンはセグメントを囲
みかつ規定する閉じたループの一部ではない、工程と、 エッジチェーンにおけるギャップに対する最大許容可能な閾値を設定する工程
と、 第1のブラシが任意のエッジチェーンをオーバーラップしないように該アレイ
内の第1の領域において該第1のブラシを配置する工程であって、該ブラシは、
該アレイにわたって移動可能な画素インドウであり、該第1のブラシは、該第1
のブラシがエッジチェーンと重なることなく該最大許容可能な閾値よりも広くな
いエッジチェーンにおけるギャップを通過できないような画素インドウの大きさ
である、工程と、 画素をセグメントに関連付ける工程であって、該セグメントに関連付けられる
各画素は、該第1のブラシが、該第1のブラシの幅よりも小さいギャップを通過
する必要なく、該第1の領域から該第1のブラシによって到達可能な画素である
、工程と、 該アレイ内の第2および以後の領域に配置された該第1のブラシを使用して他
の画素を他のセグメントに関連付ける工程と、 該アレイの第2の領域および以後の領域に位置付けられる該第1のブラシを用
いて他の画素を他のセグメントに関連付ける工程と、 該位置付け工程および関連付け工程において未だ関連付けられていない画素を
関連付けるために、該第1のブラシよりも小さい第2のブラシを用いて該位置付
けする工程および関連付ける工程を繰り返す工程と、 を含む、方法。 - 【請求項25】 前記第1のブラシは矩形画素インドウであり、該矩形画素
インドウの各辺は、前記最大許容可能閾値よりも1つ大きい画素数である、請求
項24に記載の方法。 - 【請求項26】 前記繰り返す工程は、単一画素の領域を有するブラシが使
用されるまで連続的により小さいブラシを用いて実行される、請求項24に記載
の方法。 - 【請求項27】 前記繰り返しの処理が各ブラシについて実施された後に画
素がまた、割り当てられていない場合、割り当てられていない画素をセグメント
に割り当てる工程をさらに含む、請求項26に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13913499P | 1999-06-11 | 1999-06-11 | |
US60/139,134 | 1999-06-11 | ||
PCT/US2000/015942 WO2000077735A1 (en) | 1999-06-11 | 2000-06-09 | Method and apparatus for digital image segmentation |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003502744A true JP2003502744A (ja) | 2003-01-21 |
Family
ID=22485268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001503135A Pending JP2003502744A (ja) | 1999-06-11 | 2000-06-09 | デジタル画像セグメント化のための方法および装置 |
Country Status (10)
Country | Link |
---|---|
EP (4) | EP1329848A3 (ja) |
JP (1) | JP2003502744A (ja) |
KR (1) | KR100698334B1 (ja) |
CN (1) | CN1260680C (ja) |
AT (2) | ATE241831T1 (ja) |
AU (1) | AU5603300A (ja) |
DE (2) | DE60003032T2 (ja) |
IL (1) | IL146978A (ja) |
TW (1) | TW516008B (ja) |
WO (1) | WO2000077735A1 (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2002236659A1 (en) | 2000-12-19 | 2002-07-01 | Pulsent Corporation | Adaptive transforms |
AU2002235252A1 (en) | 2000-12-19 | 2002-07-01 | Pulsent Corporation | Deblurring and re-blurring image segments |
TW573433B (en) | 2000-12-20 | 2004-01-21 | Pulsent Corp | Efficiently adaptive double pyramidal coding |
TWI233751B (en) | 2000-12-20 | 2005-06-01 | Pts Corp | Method of filling exposed areas in digital images |
JP4351411B2 (ja) * | 2001-02-01 | 2009-10-28 | エイ・ティ・アンド・ティ・コーポレーション | 画素を分類するための方法およびシステム |
US6901169B2 (en) | 2001-02-01 | 2005-05-31 | At & T Corp. | Method and system for classifying image elements |
US7133564B2 (en) | 2001-02-28 | 2006-11-07 | Altera Corporation | Dynamic chain-based thresholding using global characteristics |
KR20040035593A (ko) | 2001-03-07 | 2004-04-29 | 피티에스 코포레이션 | 모션 매칭을 위한 국부적 제약 |
AU2002255684A1 (en) | 2001-03-07 | 2002-09-19 | Pulsent Corporation | Predictive edge extension into uncovered regions |
FR2825817B1 (fr) * | 2001-06-07 | 2003-09-19 | Commissariat Energie Atomique | Procede de traitement d'images pour l'extraction automatique d'elements semantiques |
US6999620B1 (en) | 2001-12-10 | 2006-02-14 | Hewlett-Packard Development Company, L.P. | Segmenting video input using high-level feedback |
US6690823B2 (en) | 2002-01-31 | 2004-02-10 | Pts Corporation | Method and apparatus for partitioning an arbitrarily-shaped area |
US6985623B2 (en) | 2002-06-10 | 2006-01-10 | Pts Corporation | Scene change detection by segmentation analysis |
US6909749B2 (en) | 2002-07-15 | 2005-06-21 | Pts Corporation | Hierarchical segment-based motion vector encoding and decoding |
US7295711B1 (en) | 2002-10-23 | 2007-11-13 | Altera Corporation | Method and apparatus for merging related image segments |
US7426306B1 (en) | 2002-10-24 | 2008-09-16 | Altera Corporation | Efficient use of keyframes in video compression |
US7639741B1 (en) | 2002-12-06 | 2009-12-29 | Altera Corporation | Temporal filtering using object motion estimation |
US7038697B2 (en) | 2003-02-25 | 2006-05-02 | Microsoft Corporation | Color gradient paths |
US7522762B2 (en) * | 2003-04-16 | 2009-04-21 | Inverness Medical-Biostar, Inc. | Detection, resolution, and identification of arrayed elements |
US8385657B2 (en) | 2007-08-01 | 2013-02-26 | Yeda Research And Development Co. Ltd. | Multiscale edge detection and fiber enhancement using differences of oriented means |
RU2382407C1 (ru) * | 2008-11-21 | 2010-02-20 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Способ и система для обнаружения лица |
TWI401614B (zh) | 2010-02-05 | 2013-07-11 | Pixart Imaging Inc | 資料轉換方法及資料轉換裝置 |
JP2013196308A (ja) * | 2012-03-19 | 2013-09-30 | Ricoh Co Ltd | 画像処理装置、画像処理方法、プログラムおよび記録媒体 |
CN104021391B (zh) * | 2013-03-01 | 2019-03-26 | 北京三星通信技术研究有限公司 | 处理超声图像的方法和装置以及乳腺癌诊断设备 |
CN103489190B (zh) * | 2013-09-26 | 2016-05-11 | 中国科学院深圳先进技术研究院 | 图像特征曲线提取方法及系统 |
CN104915927B (zh) * | 2014-03-11 | 2018-08-07 | 株式会社理光 | 视差图像优化方法及装置 |
CN105469446A (zh) | 2014-09-05 | 2016-04-06 | 富泰华工业(深圳)有限公司 | 点云网格简化系统及方法 |
CN105608459B (zh) | 2014-10-29 | 2018-09-14 | 阿里巴巴集团控股有限公司 | 商品图片的分割方法及其装置 |
CN112884794B (zh) * | 2019-11-29 | 2022-12-02 | 北京航空航天大学 | 生成图像方法、装置、电子设备和计算机可读介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4685071A (en) * | 1985-03-18 | 1987-08-04 | Eastman Kodak Company | Method for determining the color of a scene illuminant from a color image |
JPH06203157A (ja) * | 1992-10-14 | 1994-07-22 | Fujitsu Ltd | カラー画像処理方法および装置 |
US5365596A (en) * | 1992-12-17 | 1994-11-15 | Philip Morris Incorporated | Methods and apparatus for automatic image inspection of continuously moving objects |
JPH10191020A (ja) * | 1996-12-20 | 1998-07-21 | Canon Inc | 被写体画像切出し方法及び装置 |
-
2000
- 2000-06-09 EP EP02028167A patent/EP1329848A3/en not_active Withdrawn
- 2000-06-09 EP EP00941314A patent/EP1190387B1/en not_active Expired - Lifetime
- 2000-06-09 AT AT00941314T patent/ATE241831T1/de not_active IP Right Cessation
- 2000-06-09 JP JP2001503135A patent/JP2003502744A/ja active Pending
- 2000-06-09 EP EP02028169.7A patent/EP1321898B1/en not_active Expired - Lifetime
- 2000-06-09 KR KR1020017015977A patent/KR100698334B1/ko not_active IP Right Cessation
- 2000-06-09 AT AT02028168T patent/ATE486330T1/de not_active IP Right Cessation
- 2000-06-09 CN CNB008116229A patent/CN1260680C/zh not_active Expired - Fee Related
- 2000-06-09 DE DE60003032T patent/DE60003032T2/de not_active Expired - Lifetime
- 2000-06-09 DE DE60045162T patent/DE60045162D1/de not_active Expired - Lifetime
- 2000-06-09 EP EP02028168A patent/EP1320070B1/en not_active Expired - Lifetime
- 2000-06-09 WO PCT/US2000/015942 patent/WO2000077735A1/en active IP Right Grant
- 2000-06-09 AU AU56033/00A patent/AU5603300A/en not_active Abandoned
- 2000-06-12 TW TW089111451A patent/TW516008B/zh not_active IP Right Cessation
-
2001
- 2001-12-06 IL IL146978A patent/IL146978A/en not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
CN1260680C (zh) | 2006-06-21 |
EP1321898A3 (en) | 2004-08-04 |
ATE486330T1 (de) | 2010-11-15 |
EP1321898A2 (en) | 2003-06-25 |
EP1320070A2 (en) | 2003-06-18 |
DE60045162D1 (de) | 2010-12-09 |
TW516008B (en) | 2003-01-01 |
EP1329848A2 (en) | 2003-07-23 |
EP1329848A9 (en) | 2004-12-22 |
WO2000077735A1 (en) | 2000-12-21 |
EP1320070B1 (en) | 2010-10-27 |
EP1320070A3 (en) | 2004-08-04 |
EP1190387B1 (en) | 2003-05-28 |
AU5603300A (en) | 2001-01-02 |
DE60003032D1 (de) | 2003-07-03 |
KR20020021795A (ko) | 2002-03-22 |
EP1321898A9 (en) | 2004-12-22 |
EP1320070A9 (en) | 2004-12-22 |
ATE241831T1 (de) | 2003-06-15 |
DE60003032T2 (de) | 2004-04-01 |
EP1190387A1 (en) | 2002-03-27 |
IL146978A (en) | 2006-12-31 |
EP1329848A3 (en) | 2004-08-04 |
EP1321898B1 (en) | 2017-02-22 |
CN1370309A (zh) | 2002-09-18 |
KR100698334B1 (ko) | 2007-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2003502744A (ja) | デジタル画像セグメント化のための方法および装置 | |
US6778698B1 (en) | Method and apparatus for digital image segmentation | |
US9251429B2 (en) | Superpixel-based refinement of low-resolution foreground segmentation | |
Seul et al. | Practical algorithms for image analysis with CD-ROM: description, examples, and code | |
US6803920B2 (en) | Method and apparatus for digital image segmentation using an iterative method | |
EP1304651A2 (en) | Background-based image segmentation | |
US8103058B2 (en) | Detecting and tracking objects in digital images | |
US6360002B2 (en) | Object extracting method using motion picture | |
JP2005505870A (ja) | 画像の異なる領域を識別をするための方法及び装置 | |
US8687895B2 (en) | Image processing apparatus, image processing method, and computer-readable medium | |
JP2006509292A (ja) | セグメント化されたイメージから偽エッジを除去するための装置及び方法 | |
US7133564B2 (en) | Dynamic chain-based thresholding using global characteristics | |
US7502525B2 (en) | System and method for edge detection of an image | |
Huang et al. | Image segmentation using edge detection and region distribution | |
Veeravasarapu et al. | Fast and fully automated video colorization | |
Chang et al. | Texture-based color image segmentation using local contrast information | |
Prabha et al. | PREDICTION AND QUALITY ANALYSIS OF RICE USING ANN CLASSIFIER | |
Nabeel et al. | Optimizing image segmentation by selective fusion of histogram based K-means clustering | |
Shabu et al. | Detection of Brain Tumour by Image Fusion using SVM Classifier | |
Tsougarakis et al. | Content-based object segmentation in video sequences | |
Chen et al. | Integrating Color and Gradient into Real-time Curve Tracking | |
Galbiati | Image segmentation method using reduction and amplification | |
BROTHUHN et al. | dist (A, B)=| CA-Cal’ | |
Shabu et al. | 1. Faculty of Computing, Sathyabama University, Chennai, India 2. Computer Science Department, Sri Venketeshwara College of Engineering, Sriperumbudur, India | |
BROTHUHN et al. | Multiresolution Segmentation and Pattern Matching for Sensing People Applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20060627 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20060913 |