JP2004054922A - デジタル画像作成方法 - Google Patents
デジタル画像作成方法 Download PDFInfo
- Publication number
- JP2004054922A JP2004054922A JP2003162546A JP2003162546A JP2004054922A JP 2004054922 A JP2004054922 A JP 2004054922A JP 2003162546 A JP2003162546 A JP 2003162546A JP 2003162546 A JP2003162546 A JP 2003162546A JP 2004054922 A JP2004054922 A JP 2004054922A
- Authority
- JP
- Japan
- Prior art keywords
- image
- digital image
- pixel
- standard deviation
- mask
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000003909 pattern recognition Methods 0.000 claims abstract description 11
- 238000003708 edge detection Methods 0.000 claims description 29
- 238000001514 detection method Methods 0.000 claims description 24
- 230000002708 enhancing effect Effects 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 abstract description 7
- 238000004422 calculation algorithm Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 15
- 230000011218 segmentation Effects 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 7
- 238000003709 image segmentation Methods 0.000 description 7
- 230000000873 masking effect Effects 0.000 description 7
- 238000013459 approach Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 210000000887 face Anatomy 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001054 cortical effect Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 208000001848 dysentery Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 210000000857 visual cortex Anatomy 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
- G06T5/92—Dynamic range modification of images or parts thereof based on global image properties
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
【解決手段】デジタル画像の各ピクセルの値をピクセルの定義された近傍におけるピクセルのグレイ・レベルの標準偏差値で置き換えることによって画像の局所的標準偏差を評価して、マスク画像を生成する。次に、元のデジタル画像とマスク画像とを組み合わせることによって、所望のデジタル画像を作成する。
【選択図】図1a
Description
【発明の属する技術分野】
本発明は、物体認識に関し、特に、デジタル画像の物体認識システムにおける輪郭検出及び表面検出手法に関する。本発明は、顕著な(prominent)物体のセグメント化に有利に利用可能であり、また、配向された線セグメント(すなわちエッジ)を使用して比較的大きい物体を認識するエッジ検出アルゴリズムに利用可能である。
【0002】
【従来の技術】
自動情景解析や物体識別を実行可能なパターン認識及び物体認識システムは、多種の業務のために使用することができる。
【0003】
画像内の物体を認識するには、最初に、物体に属している画像部分(前景)を物体に属していない画像部分(背景)から切り離すことが必要である。このプロセスは、通常、「画像セグメント化」と呼ばれる。物体をその背景にかかわりなく認識しなければならないので、画像セグメント化はデジタル画像における物体認識のための基本的な前提条件である。このステップを実行可能なアルゴリズムは、「セグメント化アルゴリズム」と呼ばれる。
【0004】
標準的なアルゴリズムの大部分は、物体はある程度良好に規定された境界によって背景から切り出されるという事実を利用する。最初に、配向された線セグメント(oriented line segments)等の小さな「基本的特徴(elementary feature)」に画像を分解することによってセグメント化ステップを実行する。その後、これら基本的特徴がより大きい物体を構築するために使用される。従って、セグメント化された物体は基本的特徴を用いて記述される。
【0005】
この手法は、次のような2つの主要な問題を持つ。
【0006】
第1の問題は、デジタル画像の輝度値から物体の境界を抽出する適切な方法の選択である。物体と背景との間の輝度変化が小さい場合、または物体内の輝度変化が物体と背景の間の輝度変化と同等である場合、この問題は一層悪化する。この問題を克服するため、画像の視覚的外観を改善して、物体と背景の間のコントラストを増幅しようとする多くの画像強調手法が用いられる。
【0007】
第2の問題は、基本的特徴のセットから物体を構築する適切な方法の選択である。画像が2以上の物体を含む場合、または、物体が多数の紛らわしい物体(クラッタ)によって囲まれている場合、この問題は一層悪化する。
【0008】
画像セグメント化に関連する重要な問題は、良好なセグメント化アルゴリズムを選択し、それらの性能を測定し、情景解析システムに及ぼす影響を理解することである。
【0009】
従来技術において、物体のセグメント化及び物体認識の問題を解決する種々の手法が存在する。本発明の理念を理解するため、それらの基本的な特徴のいくつかを簡単に述べる。
【0010】
1.ヒストグラムしきい値法
屋外のカラー画像のセグメント化に有利に適用できるしきい値手法が提案されている(非特許文献1参照)。これは、カラーヒストグラム及び色相ヒストグラムを構築することに基づくものである。映像はその最も明瞭に分離した頂点でしきい値化される。すべてのヒストグラム内に分離した頂点が観察されなくなるまで、画像のセグメント化された部分の各々に対してプロセスが繰り返される。
【0011】
非特許文献2には、一次元のグレイ・レベル情報を使用するよりも、画像の二次元ヒストグラムの使用がセグメント化のためのしきい値の発見に役立つことが提案されている。二次元ヒストグラムにおいては、点ピクセルに関する情報が、それらピクセルの近傍の局所グレイ・レベルの平均値と共に使用される。
【0012】
2.エッジ・ベースのセグメント化
非特許文献3には、画像セグメント化のためにピクセル近傍の要素を使用する方法が記載されている。
【0013】
非特許文献4には、境界解析を介して自然情景のセグメント化を実行するために使用される一組のアルゴリズムが開示されている。これらのアルゴリズムの目的は、情景内の物体の境界を正しく特定することである。
【0014】
非特許文献5では、エッジ・ベースの画像セグメント化手法が用いられている。ここでは、非類似領域の混合を起こしうる小さいギャップのために、エッジ・ベースのセグメント化があまりうまくいかないことが示されている。
【0015】
非特許文献6には、変分理論を使用して画像セグメント化を行う新しい適応型しきい値アルゴリズムが提案されている。
【0016】
非特許文献7には、エッジ検出に基づいた画像処理の手法が記載されている。
【0017】
上記手法の他に、ガボール関数(GF:Gabor Function)や他の同様のウエーブレットに基づく画像表現が、画像符号化及び画像圧縮、強調及び復元、またはテクスチャ解析などの多くのアプリケーションにおいて非常に有用であることが分かっている。さらに、GFは単純な皮質セルの受容野に対して良好な近似を提供するので、マルチ・スケールのフィルタリング方式、例えば、視覚皮質における画像表現の現行モデルにおいて、頻繁に使用されている。しかし、GFは直交関数ではなく、従って普通ではない二重基底関数に基づくので、古典的ガボール展開は計算処理コストがかかる。再構築は、反復型アルゴリズム、人工ニューラル・ネットワーク(ANN)の使用、または大規模行列の逆変換を必要とする。これらの問題は、冗長なマルチ・スケールのフィルタリングの実装によって部分的に解決することができる。多くのウエーブレットの中には、(ガウス導関数、可変フィルタなどのような)異なる基本関数を使用する多解像度ピラミッド及び関連手法がある。
【0018】
GFに基づく手法には以下のような利点がある。
【0019】
・空間領域及び周波数領域における結合局所化(joint localization)の最大化
・任意のバンド幅を使用して空間的位置、周波数及び方向の連続体に対してGFを自由に調整することができる柔軟性
・GFが、2つの分離可能なフィルタの和として正確に表現可能であるという方向選択性を持つ唯一の生物学的にもっともらしいフィルタであるという事実
・多種のアプリケーションにおける良好な性能
これらすべての理由により、ガボール関数は、画像解析及びマシン・ビジョン(machine vision)という多目的の環境における初期の処理タスクの実行に特に適している。
【0020】
非特許文献8には、非特定の物体を認識するための画像セグメント化を提供する注意制御システムが開示されている。C. Shannonによって導入された情報理論に基づいて、デジタル画像の局所情報の内容が推定される。これによって、画像部分の期待情報内容に関する尺度として画像エントロピーが使用される。この点について、マスク・サイズ、サブサンプリング因子、エントロピーしきい値及び形態的演算子(morphological operators)の特定パラメータ等の種々のパラメータにより、特定の問題及び特定のタスクに適した画像処理が可能になる。
【0021】
【非特許文献1】
R. B. Ohlander著、「Analysis of Natural Scenes」、PhD Thesis, Carnegie Institute of Technology, Dept. of Computer Science, Carnegie−Mellon University, Pittsburgh, PA, 1975
【0022】
【非特許文献2】
L. Li, J. Gong及びW. Chen著、「Gray−Level Image Thresholding Based on a Fisher Linear Projection of a Two−Dimensional Histogram」、Pattern Recognition, vol. 30, No. 5, pp. 743−749, 1997
【0023】
【非特許文献3】
N. Ahuja, A. Rosenfeld及びR.M. Haralick著、「Neighbor Gray Levels as Features in Pixel Classification」、Pattern Recognition, vol. 12, pp.251−260, 1980
【0024】
【非特許文献4】
J.M. Prager著、「Extracting and Labeling Boundary Segments in Natural Scenes」、IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 2, No. 1, pp.16−27, 1980
【0025】
【非特許文献5】
W.A. Perkins著、「Area Segmentation of Images using Edge Points」、IEEE Transactions on Pattern Recognition and Machine Intelligence, vol. 2, No. 1, pp. 8−15, 1980
【0026】
【非特許文献6】
F.H.Y. Chan, F.K. Lam及びH. Zhu著、「Adaptive Thresholding by Variational Method」、IEEE Transactions on Image Processing, vol. 2, No. 3, pp.168−174, 1998
【0027】
【非特許文献7】
C. Goerick及びM. Brauckmann著、「Local Orientation Coding and Neural Network Classifiers with an Application to Real−Time Car Detection and Tracking」、W.G. Kropatsch and H. Bischof [editors], Mustererkennung 1994, Proceedings of the 16th Symposium of the DAGM and the 18th Workshop of the OAGM, Springer−Verlag, 1994
【0028】
【非特許文献8】
T. Kalinke及びW. von Seelen著、「Entropie als Mass des lokalen Informationsgehalts in Bildern zur Realisierung einer Aufmerksamkeitssteuerung」、Internal Report 96−07, Institut fur Neuroinformatik der Ruhr−Universitat Bochum, 1996, published in Mustererkennung 1996, pp.627−634, Springer−Verlag, Berlin/Heidelberg, 1996
【0029】
【発明が解決しようとする課題】
(例えばエッジ検出に基づく)最適な物体認識システムを構築する多くの試みにもかかわらず、既知のアルゴリズムは、線分とエッジが非常に近接及び/または交差している位置における物体セグメント化に問題のあることが多いことが分かっている。従来のエッジ検出アルゴリズムは、非常に小さい(単純または複雑に連結する)複数の画像パッチを認識できるにすぎないので、例えば交差する線分によって生じる局所的なあいまいさを解決することは不可能である。従って、基となる認識システムは、入り乱れた背景(cluttered background)上の多数の小さな物体と、異なる部品から成る1つの大きな物体とを区別することができない。このため、認識するべき物体の輪郭に関するグローバルな情報が必要となる。一般に、これらの問題は、多くの異なる物体を含む画像の場合、または入り乱れた背景上に物体がある場合に生じる。
【0030】
別の問題は、これらの物体認識システムは、使用した画像または画像ファミリーに対して調整が必要であることである。さらに、線分及びエッジ(事象)を同時に検出し分類することができるアルゴリズムはいまだにほとんど存在しない。
【0031】
上述の説明に鑑みて、本発明は、後続のエッジ検出処理をより効率的にする手法を提供することを目的とする。
【0032】
【課題を解決するための手段】
本発明の第1の側面によると、後続のパターン認識処理のためのデジタル画像を作成する方法が提供される。この方法は、デジタル画像内の顕著な物体を強調する。デジタル画像の各ピクセルの値をピクセルの定義された近傍における当該ピクセルのグレイ・レベルの標準偏差値で置き換えることによって画像の局所的標準偏差が評価され、マスク画像が生成される。次に、元のデジタル画像を生成されたマスク画像と組み合わせる。
【0033】
元の画像をマスク画像と組み合わせるとき、マスク画像の加重値は調整可能である。
【0034】
マスク画像の加重値は、調整可能な加重マスクとマスク画像を組み合わせることによって調整することができる。
【0035】
元のデジタル画像の一部分だけをマスク画像と組み合わせるように加重マスクを設計することもできる。
【0036】
本発明の別の側面によると、後続のパターン認識のためのデジタル画像を作成する方法が提供される。この方法はデジタル画像内の顕著な物体を強調する。これによって、エッジのない面に属するデジタル画像のピクセルが画像の局所的標準偏差を評価することによって検出される。
【0037】
デジタル画像の各ピクセルの値をピクセルの定義された近傍における当該ピクセルのグレイ・レベルの標準偏差値で置き換えることによって画像の局所的標準偏差が評価され、マスク画像を生成することができる。次に、元のデジタル画像がマスク画像と組み合わされ、組み合わせ画像が生成される。最後に、この組み合わせ画像に対してエッジ検出が実行される。
【0038】
元のデジタル画像をマスク画像と組み合わせるステップは、1つの面に属すると評価されたデジタル画像の領域内でエッジ検出を禁止するように実行することができる。
【0039】
元のデジタル画像をマスク画像と組み合わせるステップは、1つの面に属していないと評価されたデジタル画像の領域内でエッジ検出を禁止するように実行することもできる。
【0040】
エッジ検出は、組み合わせ画像と配向ガボール・パッチの畳み込みによって実行することができる。
【0041】
局所的標準偏差を評価するステップは、2つの直交直角方向において実行して、1つの面領域の境界の主方向を示す標準偏差ベクトルを定義することができる。
【0042】
主方向の複数ピクセルの値を強調する一方、主方向から離れたピクセルの値を抑制することができる。
【0043】
局所的標準偏差を評価するステップのためのしきい値は調整可能である。
【0044】
局所的標準偏差を評価するステップの前に、元のデジタル画像をローパス・フィルタリングすることができる。
【0045】
前記画像の平均グレイ・レベルに応じたしきい値関数をローパス・フィルタリングされたデジタル画像やマスク画像に適用して、コントラストを強調することができる。
【0046】
本発明のさらに別の側面によると、コンピュータ装置上で実行されるとき上述した方法を実施するコンピュータ・ソフトウェア・プログラム、及びこのコンピュータ・ソフトウェア・プログラムが記録された記録媒体が提供される。
【0047】
最後に、本発明は、上述の方法を実施する手段を提供するシステムを提案する。
【0048】
【発明の実施の形態】
本発明は、異なる空間スケール及び異なる画像特徴からの情報を、それらの結合様相(appearance)に対する統計的依存性を利用することによって、同時に評価するように特に最適化される。そのような依存性は局所エッジ検出プロセスを建設的に誘導するため適用される。
【0049】
本発明の主要な概念に従って提案される手法は、後続のパターン認識プロセスS6のためのデジタル画像102を作成する。この方法は、デジタル画像102における顕著な(prominent)物体を強調する。
【0050】
以下の説明では、「エッジ」、「エッジのない(edge−free)」などの用語は、本発明に従ったプロセスによって実行された「解釈(分析)」の意味に常に理解されなければならないことに注意されたい。
【0051】
本手法は、基本的に、図1a、1bに示されているS1〜S6の6つのステップに分割することができる。以下、これらのステップの詳細を説明する。図2a、2bに示されている手順のハードウェア実施形態のブロック図についても説明する。各図中の参照記号で示されている記号の意味は、「符号の説明」に記載してある。
【0052】
第1のステップS1において、認識されるべきデジタル入力画像A(i,j)が、標準偏差σ1を有するガウシアン・カーネルh(i,j)と畳み込みされる。畳み込みは、図2a及び図2bにおけるローパス・フィルタ202によって実現され、上記入力画像A(i,j)を平滑化することによってノイズ及び微細な部分を減少させる。これによって、上記ピクセルのインデックスi及びjは、それぞれ画像のx軸及びy軸方向を指すこととなる。
【0053】
次のステップS2は、ローパス・フィルタリングされた画像のコントラストを強調する。シグモイドしきい値関数Θ1(・)を適用することによって全体の構造が復元され、次式が成立する。
【0054】
【数1】
ここで、アスタリスク(*)は畳み込み演算を示し、シグモイドしきい値関数Θ1(・)は、例えば、次式によって表すことができる。
【0055】
【数2】
ここで、μ1はしきい値関数Θ1(・)の勾配係数であり、Nは画像におけるピクセルの数を表し、θ1は適用されるしきい値を表す。
【0056】
前記しきい値θ1は、ローパス・フィルタリングされた入力画像B(i,j)の平均グレイ・レベル<B>に従って自動的に選択される。従って、このステップの自動的な局所較正(自動較正)が実現可能である。
【0057】
次のステップS3において、同じエッジなし領域に属しているデジタル画像のピクセルが検出される。従って、本発明に従ったプロセスによって実施される「解釈」に従ってエッジの存在を示していない領域によって1つの面が定義される。従って、画像は、エッジによってではなく、隣接している(エッジなしの)面を定義することによって、分離される。
【0058】
次式によって、観察されたピクセルによって記述される点(i,j)の局所的(環状の)近傍γ(i,j)の範囲内のグレイ・レベルの局所標準偏差σC, γ (i,j)を計算することによって、同じエッジなし領域に属しているピクセルの検出を実行することができる。
【0059】
【数3】
そして、ステップS1及びステップS2の適用の後に取得された結果C(i,j)を使用して、次式が得られる。
【0060】
【数4】
ここで、
γ(i,j)は、観察されたピクセルによって記述される点(i,j)の局所的(環状の)近傍を表し、
<C>γ (i,j)は、ノイズ・フィルタリングを適用した(S1)後の点(i,j)の周囲の環境γ(i,j)の範囲内の画像C(i,j)のグレイ・レベルの局所的平均を表し、
σC, γ (i,j)は、環境γ(i,j)の範囲内の画像C(i,j)のグレイ・レベルの局所的標準偏差を表し、
Pは、環境γ(i,j)におけるピクセルの数である。
【0061】
この目的のため、各ピクセルの値は、それぞれのピクセルによって記述される点(i,j)の周囲の近傍γの範囲内のグレイ・レベルの標準偏差値σC, γ (i,j)によって置き換えられ、この結果、画像D(i,j)が得られる。環状の環境γのサイズと共にガウシアン・ローパス・フィルタ202の標準偏差σ1(幅)が面検出ステップS3の空間スケールを定義する。
【0062】
特定の実施形態によれば、局所的標準偏差は、二次元の標準偏差ベクトルを生成するため、2つの直交方向において計算することができる。こうして、標準偏差ベクトルが、画像の顕著な物体の輪郭の支配(主)方向を表す。従って、そのような主方向が強調される一方、副次的方向が抑制されるならば、物体の輪郭をさらに強調することができる。
【0063】
次のステップS4において、非常に急な勾配μ2を持つ別のシグモイドしきい値関数Θ2(・)を使用して、それぞれの面に属していないピクセルからそれぞれの面に属しているピクセルを分離することによって、コントラストを強化することができる。
【0064】
【数5】
これによって、それぞれの面内に存在するピクセルにゼロに近いか等しい値が割り当てられる。
【0065】
シグモイドしきい値関数Θ2(・)は、次式によって表すことができる。
【0066】
【数6】
ここで、μ2はしきい値関数Θ2(・)の勾配係数であり、Nは画像中のピクセル数を表し、θ2は適用されるしきい値を表す。
【0067】
前記しきい値θ2は、上述のように定義された画像D(i,j)の平均グレイ・レベル<D>に従って決定される。これによって、このステップS4の自動的な局所較正(自動較正)が達成される。
【0068】
次に、ステップS5aまたはステップS5bにおいて、元の画像が前のステップの結果である画像E(i,j)と組み合わせられる(「マスキング」される)。このマスキングは次式を適用することによって実行される。
【0069】
【数7】
ここで、合成演算子(〇)は、元の画像102と面の画像106のピクセル単位の乗算S5a(または加算S5b)によって置き換えることができる。このピクセル単位の乗算または加算は、演算子「×」(または「+」)によってそれぞれ表されている。
【0070】
このステップにおいて、面画像106の加重係数λが、面画像106を調整可能な加重マスクと組み合わせることによって調整される。加重係数λは、面検出S3が後続のエッジ検出S6をどの程度強力に決定するかを制御する。加重係数λは、画像102全体に対して一様に、または、対象とする特定の領域について個別に、選択することができる。
【0071】
別の選択肢として、元のデジタル画像102の一部分だけが面画像106と組み合わせられるように加重マスクを設計することもできる。
【0072】
最後のステップS6において、画像F(i,j)に対してエッジ検出が実行される。同一のエッジなし面に属していると見なされる領域におけるエッジ検出が禁止され、従ってエッジ検出はエッジを含む領域に限定されるので、エッジ検出の効率が向上する。精細エッジ検出S6は、全体的な輪郭が存在する画像102の部分に対してのみ適用される。
【0073】
代替的に、エッジを含む領域におけるエッジ検出を禁止して、画像内の顕著な物体を抑制することもできる点に注意されたい。これは、ステップS5aまたはステップS5bにおいて、それぞれ反転マスキングを使用することによって実施することができる。
【0074】
エッジ検出は、例えば、配向ガボール・パッチを用いた輪郭画像F(i,j)の畳み込みによって実行することができる。ガボール・カーネルの標準偏差σ2(幅)は、例えば3x3ピクセルのサイズのように、可能な限り小さくなければならない。対照的に、ガウシアン・カーネルの標準偏差σ1(幅)は、例えば12x12ピクセルのサイズのように、比較的大きくなければならない。この点について、局所的標準偏差σC, γ (i,j)の推定のために必要とされる近傍γのサイズは、σ1とσ2の間で選択されなければならない点に注意されたい。本発明の一実施形態では、直径が5ピクセルの環状パッチが使用される。
【0075】
図1a及び図1bに示した動作を実行するプログラムはコンピュータ読取可能記憶媒体に記憶することができ、この記憶されたプログラムは、物体検出を実行するためにコンピュータ・システム上で実行可能である。 コンピュータ読取可能記憶媒体は、プログラムを一時的に記憶する装置であっても良く、例えば、ネットワーク(例えばインターネット)または通信回線(例えば電話線)を経由して送信されるプログラムを受け取るサーバまたはクライアントの機能を果たすコンピュータ・システムにおける揮発性メモリ(すなわちRAM)を含む。本発明は、図2a及び図2bに示すハードウェアで実施することができる。
【0076】
本発明の利点は次のようにまとめられる。
・本発明に従った概念は、異なるスケールで並列に動作することができる。
・粗いスケールにおいては、画像は類似の同質の領域にセグメント化され、これらの領域は面と解釈される。
・これは、局所的エッジ検出とは無関係に、全体の物体境界を効率的に選択する。
・局所的なあいまいさは、全体の面と局所的エッジ情報を統合することによって解消される。
・ノイズ及び小さな細部は抑制され、画像認識のロバスト性をもたらす。
・本発明に従った手法のパラメータは、画像の平均グレイ・レベルに従って自動的に調整される。
【図面の簡単な説明】
【図1a】デジタル画像によって表された顕著な物体の面及びエッジの検出に使用される物体認識システムをサポートするために適用可能な、本発明に従った物体検出アルゴリズムの機能の概要を示すチャートである。
【図1b】デジタル画像によって表された顕著な物体の面及びエッジの検出に使用される物体認識システムをサポートするために適用可能な、本発明に従った物体検出アルゴリズムの機能の概要を示すチャートである。
【図2a】物体認識システムのハードウェア実施形態のブロック図である。
【図2b】物体認識システムのハードウェア実施形態のブロック図である。
【符号の説明】
100a 本発明に従った物体検出アルゴリズムの機能的な概要を示す第1のフローチャート。このアルゴリズムは、入力画像102とその表面画像106をピクセル単位で乗算(×)することによるマスキング(S5a)に基づいて、デジタル化された画像により表された顕著な画像の表面及びエッジを検出するために使用される物体検出システムをサポートするために適用することができる。
100b 本発明に従った物体検出アルゴリズムの機能的な概要を示す第2のフローチャート。このアルゴリズムは、入力画像102とその表面画像106をピクセル単位で加算(+)することによるマスキング(S5b)に基づいて、デジタル化された画像により表された顕著な画像の表面及びエッジを検出するために使用される物体検出システムをサポートするために適用することができる。
102 2つのカメラ・アイを備えたアンドロイドとして機能するプロトタイプのロボットの人工的な頭部を表す元の入力画像A(i,j)。
104 元の入力画像102とガウシアン・カーネルh(i,j)の畳み込みを実行してノイズの影響(S1)を低減し、さらに第1のコントラスト強化(S2)をした後に得られる、ローパス・フィルタリングされた入力画像C(i,j)。
106 ローパス・フィルタリングされた入力画像の局所偏差評価(S3)及び第2のコントラスト強化(S4)に基づいて表面検出を適用した後に得られる、粗い物体輪郭を有する表面画像E(i,j)。ここで、検出された単一のまたは複数の接続された領域に属するピクセルは黒にされており、検出された表面の輪郭は白のままである。
108 表面画像106と元の入力画像102のピクセル単位での加算(+)または乗算(×)を適用することによって、表面画像106のマスキング(S5)を適用した後に得られる、精細な物体輪郭を有する輪郭画像F(i,j)。
110a 輪郭画像108に対して水平方向に向いた線分についてエッジ(方向)検出(S6)を適用した後の第1の結果画像F(i,j)。
110b、110d 輪郭画像108に対して斜め方向に向いた線分についてエッジ(方向)検出(S6)を適用した後の第2及び第4の結果画像F(i,j)。
110c 輪郭画像108に対して垂直方向に向いた線分について、エッジ(方向)検出を適用した後の第3の結果画像F(i,j)。
200a 入力画像102とその表面画像106をピクセル単位で乗算(×)することによるマスキングに基づいた、物体検出システムのハードウェア実装形態の第1の簡潔なブロック図。
200b 入力画像102とその表面画像106をピクセル単位で加算(+)することによるマスキングに基づいた、物体検出システムのハードウェア実装形態の第2の簡潔なブロック図。
202 平滑化及びノイズ低減用のローパス・フィルタ。
204 局所分散検出器(local−variance detector)
204a 局所分散検出器204の局所平均検出器(local−average detector)
204b 局所分散検出器204の乗算要素
204c 局所分散検出器204の加算要素
204d 前記入力画像104の1ピクセルを表す観察点(i,j)の周りの円形環境γ(i,j)におけるローパス・フィルタリングされた入力画像104の局所標準偏差を計算するための平方根計算ユニット。
205a コントラスト強化のためにシグモイドしきい値関数Θ1(・)を用いる第1のしきい値要素。
205b コントラスト強化のためにシグモイドしきい値関数Θ2(・)を用いる第2のしきい値要素。
206 表面画像106に重み付け要素λを乗算するために使用される乗算要素。これは、表面検出(S3)が後続のエッジ検出を決定する強度を制御する。
206a 重み付けされた表面画像106で元の入力画像102をマスキングするために使用される乗算要素。
206b 重み付けされた表面画像106で前記入力画像102をマスキングするために用いられる加算要素。
208 エッジ検出オペレータDε(・)を用いるエッジ検出器。
S1 ステップ1:ローパス・フィルタとガウシアン・カーネルh(i,j)を用いたローパス・フィルタリング。
S2 ステップ2:第1のコントラスト強化
S3 ステップ3:局所分散ベースの表面検出
S4 ステップ4:第2のコントラスト強化
S5a ステップ5a:表面画像106と元の入力画像102のピクセル単位の乗算(×)
S5b ステップ5b:表面画像106と元の入力画像102のピクセル単位の加算(+)
S6 ステップ6:エッジ(方向)検出
Claims (21)
- デジタル画像内の顕著な物体を強調して、後続のパターン認識処理のためのデジタル画像を作成する方法であって、
前記デジタル画像の各ピクセルの値をピクセルの定義された近傍における前記ピクセルのグレイ・レベルの標準偏差値で置き換えることによって画像の局所的標準偏差を評価して、マスク画像を生成するステップと、
元のデジタル画像を前記マスク画像と組み合わせるステップと、
を含むことを特徴とするデジタル画像作成方法。 - 元のデジタル画像をマスク画像と組み合わせる前記ステップにおいて、マスク画像の加重値が調整可能であることを特徴とする、請求項1に記載のデジタル画像作成方法。
- 前記マスク画像の加重値は、前記マスク画像を調整可能な加重マスクと組み合わせることによって調整されることを特徴とする、請求項2に記載のデジタル画像作成方法。
- 前記元のデジタル画像の一部分だけを前記マスク画像と組み合わせられるように前記加重マスクが設計されていることを特徴とする、請求項2または請求項3に記載のデジタル画像作成方法。
- デジタル画像における顕著な物体を強調して、後続のパターン認識のためデジタル画像を作成する方法であって、
前記画像の局所的標準偏差を評価することによって、エッジのない面に属するデジタル画像のピクセルを検出するステップを含むことを特徴とする、デジタル画像作成方法。 - デジタル画像内のエッジを検出する方法であって、
前記デジタル画像の各ピクセルの値をピクセルの定義された近傍における前記ピクセルのグレイ・レベルの標準偏差値で置き換えることによって画像の局所的標準偏差を評価して、マスク画像を生成するステップと、
元のデジタル画像を前記マスク画像と組み合わせて、組み合わせ画像を生成するステップと、
前記組み合わせ画像に対してエッジ検出を実行するステップと、
を含むことを特徴とする、デジタル画像のエッジ検出方法。 - 元のデジタル画像をマスク画像と組み合わせる前記ステップが、1つの面に属すると評価されたデジタル画像の領域内で前記エッジ検出が禁止されるように設計されることを特徴とする、請求項6に記載のエッジ検出方法。
- 元のデジタル画像をマスク画像と組み合わせる前記ステップが、1つの面に属していないと評価されたデジタル画像の領域内で前記エッジ検出が禁止されるように設計されることを特徴とする、請求項6に記載のエッジ検出方法。
- 前記エッジ検出が、前記組み合わせ画像と配向ガボール・パッチの畳み込みによって実行されることを特徴とする、請求項6乃至請求項8のいずれか1項に記載のエッジ検出方法。
- 局所的標準偏差を評価する前記ステップが2つの直交方向において実行され、1つの面領域の境界の主方向を示す標準偏差ベクトルを定義することを特徴とする、請求項1乃至請求項9のいずれか1項に記載の方法。
- 主方向のピクセルの値が強調され、主方向から離れたピクセルの値が抑制されることを特徴とする、請求項10に記載の方法。
- 局所的標準偏差を評価する前記ステップのためのしきい値が調整可能であることを特徴とする、請求項1乃至請求項11のいずれか1項に記載の方法。
- 局所的標準偏差を評価する前記ステップの前に、元のデジタル画像がローパス・フィルタリングされることを特徴とする、請求項1乃至請求項12のいずれかに記載の方法。
- 前記画像の平均グレイ・レベルに応じたしきい値関数が、前記ローパス・フィルタリングされたデジタル画像及び/または前記マスク画像に適用されて、前記コントラストを強調することを特徴とする、請求項1乃至請求項13のいずれか1項に記載の方法。
- コンピュータ装置上で実行されるとき、請求項1乃至請求項14のいずれか1項に記載の方法を実施することを特徴とするコンピュータ・ソフトウェア・プログラム。
- 請求項15に記載のコンピュータ・ソフトウェア・プログラムを記録することを特徴とする記録媒体。
- デジタル画像内の顕著な物体を強調して、後続のパターン認識のためのデジタル画像を作成するシステムであって、
前記デジタル画像の各ピクセルの値をピクセルの定義された近傍における前記ピクセルのグレイ・レベルの標準偏差値で置き換えることによって画像の局所的標準偏差を評価して、マスク画像を生成する手段と、
元のデジタル画像を前記マスク画像と組み合わせる手段と、
を含むことを特徴とするデジタル画像作成システム。 - デジタル画像内の顕著な物体を強調して、後続のパターン認識のためのデジタル画像を作成するシステムであって、
前記画像の局所的標準偏差を評価することによってエッジのない面に属するデジタル画像のピクセルを検出する手段を備えることを特徴とするデジタル画像作成システム。 - デジタル画像のエッジを検出するシステムであって、
デジタル画像の各ピクセルの値をピクセルの定義された近傍における前記ピクセルのグレイ・レベルの標準偏差値で置き換えることによって画像の局所的標準偏差を評価して、マスク画像を生成する手段と、
元のデジタル画像を前記マスク画像と組み合わせて、組み合わせ画像を生成する手段と、
前記組み合わせ画像に対してエッジを検出する手段と、
を備えることを特徴とするエッジ検出システム。 - 入力画像をガウシアン・カーネルでローパス・フィルタリングするステップと、
ローパス・フィルタリングされた画像のコントラストを強調するステップと、
前記デジタル画像の各ピクセルの値を対応するピクセルの定義された近傍における前記ピクセルのグレイ・レベルの標準偏差値によって置き換えることによって、局所的分散に基づいて画像の面を検出するステップと、
前記画像のコントラストを強調して強調された画像を取得するステップと、
元の画像を前記強調された画像と組み合わせて輪郭画像を取得するステップと、
前記輪郭画像の配向エッジを検出するステップと、
を含むことを特徴とする物体認識方法。 - 入力画像をガウシアン・カーネルでフィルタリングするローパス・フィルタと、
ローパス・フィルタリングされた画像のコントラストを強調する第1の強調セクションと、
前記デジタル画像の各ピクセルの値を対応するピクセルの定義された近傍における前記ピクセルのグレイ・レベルの標準偏差値によって置き換えることによって、局所的分散に基づいて画像の面を検出する第1の検出セクションと、
画像のコントラストを強調して強調された画像を取得する第2の増強セクションと、
元の画像を前記強調された画像と組み合わせて輪郭画像を取得する組み合わせセクションと、
前記輪郭画像の配向エッジを検出する第2の検出セクションと、
を備えることを特徴とする物体認識装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02012736 | 2002-06-07 | ||
EP02014189A EP1387315B1 (en) | 2002-06-07 | 2002-06-25 | Preparation of a digital image with subsequent edge detection |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004054922A true JP2004054922A (ja) | 2004-02-19 |
JP4480958B2 JP4480958B2 (ja) | 2010-06-16 |
Family
ID=30116889
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003162546A Expired - Fee Related JP4480958B2 (ja) | 2002-06-07 | 2003-06-06 | デジタル画像作成方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7356185B2 (ja) |
EP (1) | EP1387315B1 (ja) |
JP (1) | JP4480958B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009508200A (ja) * | 2005-09-09 | 2009-02-26 | キネティック リミテッド | 画像領域の自動選定 |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7596265B2 (en) | 2004-09-23 | 2009-09-29 | Hewlett-Packard Development Company, L.P. | Segmenting pixels in an image based on orientation-dependent adaptive thresholds |
US20100260396A1 (en) * | 2005-12-30 | 2010-10-14 | Achiezer Brandt | integrated segmentation and classification approach applied to medical applications analysis |
EP2183703A1 (en) * | 2007-08-01 | 2010-05-12 | Yeda Research And Development Company Limited | Multiscale edge detection and fiber enhancement using differences of oriented means |
US8700166B2 (en) * | 2008-08-07 | 2014-04-15 | Massachusetts Institute Of Technology | Coding for visual prostheses |
US8004588B2 (en) | 2008-08-27 | 2011-08-23 | Seiko Epson Corporation | Image processing procedure for receiving mosaic image data and calculating vertical and horizontal-direction color difference components for each pixel |
US8588535B2 (en) | 2010-09-15 | 2013-11-19 | Sharp Laboratories Of America, Inc. | Methods and systems for estimation of compression noise |
US8600188B2 (en) | 2010-09-15 | 2013-12-03 | Sharp Laboratories Of America, Inc. | Methods and systems for noise reduction and image enhancement |
US8532429B2 (en) | 2010-09-28 | 2013-09-10 | Sharp Laboratories Of America, Inc. | Methods and systems for noise reduction and image enhancement involving selection of noise-control parameter |
US8175411B2 (en) | 2010-09-28 | 2012-05-08 | Sharp Laboratories Of America, Inc. | Methods and systems for estimation of compression noise |
US8538193B2 (en) | 2010-09-28 | 2013-09-17 | Sharp Laboratories Of America, Inc. | Methods and systems for image enhancement and estimation of compression noise |
US8600172B2 (en) * | 2011-03-16 | 2013-12-03 | Sensormatic Electronics, LLC | Video based matching and tracking by analyzing one or more image abstractions |
CN102289669B (zh) * | 2011-08-10 | 2015-05-13 | 刘艳 | 基于灰度梯度序列的数字图像特征提取方法 |
JP5816486B2 (ja) * | 2011-08-18 | 2015-11-18 | オリンパス株式会社 | 蛍光観察装置および蛍光観察システム並びに蛍光観察装置の蛍光画像処理方法 |
GB2542911B (en) * | 2011-10-14 | 2017-07-26 | Solentim Ltd | Method of and apparatus for analysis of a sample of biological tissue cells |
CN104346781A (zh) * | 2014-10-27 | 2015-02-11 | 北京航空航天大学 | 一种利用数学形态学切换变换构造形态学对比度算子的矿物图像增强方法 |
US20160292874A1 (en) * | 2015-03-30 | 2016-10-06 | General Electric Company | Methods and systems for automatic segmentation |
DE102015226400A1 (de) * | 2015-12-22 | 2017-06-22 | Siemens Healthcare Gmbh | Automatisierte Ermittlung von Konturen auf Basis einer iterativen Rekonstruktion |
US10373316B2 (en) * | 2017-04-20 | 2019-08-06 | Ford Global Technologies, Llc | Images background subtraction for dynamic lighting scenarios |
KR102041310B1 (ko) * | 2017-08-02 | 2019-11-07 | 세메스 주식회사 | 기판 처리 장치 및 기판의 안착 상태 판단 방법 |
CN109255794B (zh) * | 2018-09-05 | 2020-11-13 | 华南理工大学 | 一种标准件深度全卷积特征边缘检测方法 |
CN111080663B (zh) * | 2019-12-30 | 2020-09-22 | 广西科技大学 | 一种基于动态感受野的仿生型轮廓检测方法 |
CN113033550B (zh) * | 2021-03-15 | 2022-04-15 | 合肥联宝信息技术有限公司 | 一种图像的检测方法、装置及计算机可读介质 |
CN115830013B (zh) * | 2023-02-08 | 2023-05-16 | 磐石重工(青岛)股份有限公司 | 基于机器视觉的压力容器焊缝缺陷检测方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4571635A (en) * | 1984-02-17 | 1986-02-18 | Minnesota Mining And Manufacturing Company | Method of image enhancement by raster scanning |
DE3853628T2 (de) * | 1988-09-07 | 1995-09-28 | Agfa Gevaert Nv | Digitalbildverarbeitung unter Berücksichtigung der Standardabweichung. |
US5081692A (en) * | 1991-04-04 | 1992-01-14 | Eastman Kodak Company | Unsharp masking using center weighted local variance for image sharpening and noise suppression |
US5999639A (en) * | 1997-09-04 | 1999-12-07 | Qualia Computing, Inc. | Method and system for automated detection of clustered microcalcifications from digital mammograms |
US6198089B1 (en) * | 1999-03-31 | 2001-03-06 | The Hong Kong University Of Science And Technology | Steerable and scalable spatial filters |
-
2002
- 2002-06-25 EP EP02014189A patent/EP1387315B1/en not_active Expired - Lifetime
-
2003
- 2003-06-05 US US10/456,209 patent/US7356185B2/en not_active Expired - Fee Related
- 2003-06-06 JP JP2003162546A patent/JP4480958B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009508200A (ja) * | 2005-09-09 | 2009-02-26 | キネティック リミテッド | 画像領域の自動選定 |
Also Published As
Publication number | Publication date |
---|---|
US7356185B2 (en) | 2008-04-08 |
EP1387315B1 (en) | 2007-09-12 |
US20040037466A1 (en) | 2004-02-26 |
JP4480958B2 (ja) | 2010-06-16 |
EP1387315A1 (en) | 2004-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4480958B2 (ja) | デジタル画像作成方法 | |
US10339643B2 (en) | Algorithm and device for image processing | |
US7653238B2 (en) | Image filtering based on comparison of pixel groups | |
Sharma et al. | A comparative study of edge detectors in digital image processing | |
Mlsna et al. | Gradient and Laplacian edge detection | |
US6621937B1 (en) | Removing chroma noise from digital images by using variable shape pixel neighborhood regions | |
JP2016505186A (ja) | エッジ保存・ノイズ抑制機能を有するイメージプロセッサ | |
Rosenfeld | Image pattern recognition | |
US8965141B2 (en) | Image filtering based on structural information | |
EP1789920A1 (en) | Feature weighted medical object contouring using distance coordinates | |
JP2004519759A (ja) | 画像内の関心領域を決定するための方法及び装置及び画像伝送方法及び装置 | |
US6574374B1 (en) | Enhancing image compression performance by morphological processing | |
WO2014133584A1 (en) | Image processor with multi-channel interface between preprocessing layer and one or more higher layers | |
Narváez et al. | Point cloud denoising using robust principal component analysis | |
Dogra et al. | An efficient image integration algorithm for night mode vision applications | |
Forczmański et al. | Simple and robust facial portraits recognition under variable lighting conditions based on two-dimensional orthogonal transformations | |
Saleem et al. | Survey on color image enhancement techniques using spatial filtering | |
Shu et al. | Side window weighted median image filtering | |
Lindahl | Study of local binary patterns | |
Tu et al. | Constant time bilateral filtering for color images | |
Singh et al. | Threshold modeling for cellular logic array processing based edge detection algorithm | |
Borraa | An Efficient Shape Adaptive Techniques for the Digital Image Denoising | |
Shinde et al. | Image object saliency detection using center surround contrast | |
Patel et al. | Study of noise removal techniques for digital images | |
Asokan et al. | 2D discrete cosine transform for fusion of multitemporal satellite images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060410 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090414 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090709 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090811 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100302 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100317 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130326 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140326 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |