JP2004054922A - デジタル画像作成方法 - Google Patents

デジタル画像作成方法 Download PDF

Info

Publication number
JP2004054922A
JP2004054922A JP2003162546A JP2003162546A JP2004054922A JP 2004054922 A JP2004054922 A JP 2004054922A JP 2003162546 A JP2003162546 A JP 2003162546A JP 2003162546 A JP2003162546 A JP 2003162546A JP 2004054922 A JP2004054922 A JP 2004054922A
Authority
JP
Japan
Prior art keywords
image
digital image
pixel
standard deviation
mask
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003162546A
Other languages
English (en)
Other versions
JP4480958B2 (ja
Inventor
Marc-Oliver Gewaltig
マルク−オリヴァー・ゲワルティヒ
Kerner Edgar
エドガー・ケルナー
Ursula Koerner
ウルスラ・コーナー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Research Institute Europe GmbH
Original Assignee
Honda Research Institute Europe GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Research Institute Europe GmbH filed Critical Honda Research Institute Europe GmbH
Publication of JP2004054922A publication Critical patent/JP2004054922A/ja
Application granted granted Critical
Publication of JP4480958B2 publication Critical patent/JP4480958B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/92Dynamic range modification of images or parts thereof based on global image properties
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】デジタル画像内の顕著な物体を強調して、後に続くパターン認識プロセスで使用されるデジタル画像を効率的に作成する。
【解決手段】デジタル画像の各ピクセルの値をピクセルの定義された近傍におけるピクセルのグレイ・レベルの標準偏差値で置き換えることによって画像の局所的標準偏差を評価して、マスク画像を生成する。次に、元のデジタル画像とマスク画像とを組み合わせることによって、所望のデジタル画像を作成する。
【選択図】図1a

Description

【0001】
【発明の属する技術分野】
本発明は、物体認識に関し、特に、デジタル画像の物体認識システムにおける輪郭検出及び表面検出手法に関する。本発明は、顕著な(prominent)物体のセグメント化に有利に利用可能であり、また、配向された線セグメント(すなわちエッジ)を使用して比較的大きい物体を認識するエッジ検出アルゴリズムに利用可能である。
【0002】
【従来の技術】
自動情景解析や物体識別を実行可能なパターン認識及び物体認識システムは、多種の業務のために使用することができる。
【0003】
画像内の物体を認識するには、最初に、物体に属している画像部分(前景)を物体に属していない画像部分(背景)から切り離すことが必要である。このプロセスは、通常、「画像セグメント化」と呼ばれる。物体をその背景にかかわりなく認識しなければならないので、画像セグメント化はデジタル画像における物体認識のための基本的な前提条件である。このステップを実行可能なアルゴリズムは、「セグメント化アルゴリズム」と呼ばれる。
【0004】
標準的なアルゴリズムの大部分は、物体はある程度良好に規定された境界によって背景から切り出されるという事実を利用する。最初に、配向された線セグメント(oriented line segments)等の小さな「基本的特徴(elementary feature)」に画像を分解することによってセグメント化ステップを実行する。その後、これら基本的特徴がより大きい物体を構築するために使用される。従って、セグメント化された物体は基本的特徴を用いて記述される。
【0005】
この手法は、次のような2つの主要な問題を持つ。
【0006】
第1の問題は、デジタル画像の輝度値から物体の境界を抽出する適切な方法の選択である。物体と背景との間の輝度変化が小さい場合、または物体内の輝度変化が物体と背景の間の輝度変化と同等である場合、この問題は一層悪化する。この問題を克服するため、画像の視覚的外観を改善して、物体と背景の間のコントラストを増幅しようとする多くの画像強調手法が用いられる。
【0007】
第2の問題は、基本的特徴のセットから物体を構築する適切な方法の選択である。画像が2以上の物体を含む場合、または、物体が多数の紛らわしい物体(クラッタ)によって囲まれている場合、この問題は一層悪化する。
【0008】
画像セグメント化に関連する重要な問題は、良好なセグメント化アルゴリズムを選択し、それらの性能を測定し、情景解析システムに及ぼす影響を理解することである。
【0009】
従来技術において、物体のセグメント化及び物体認識の問題を解決する種々の手法が存在する。本発明の理念を理解するため、それらの基本的な特徴のいくつかを簡単に述べる。
【0010】
1.ヒストグラムしきい値法
屋外のカラー画像のセグメント化に有利に適用できるしきい値手法が提案されている(非特許文献1参照)。これは、カラーヒストグラム及び色相ヒストグラムを構築することに基づくものである。映像はその最も明瞭に分離した頂点でしきい値化される。すべてのヒストグラム内に分離した頂点が観察されなくなるまで、画像のセグメント化された部分の各々に対してプロセスが繰り返される。
【0011】
非特許文献2には、一次元のグレイ・レベル情報を使用するよりも、画像の二次元ヒストグラムの使用がセグメント化のためのしきい値の発見に役立つことが提案されている。二次元ヒストグラムにおいては、点ピクセルに関する情報が、それらピクセルの近傍の局所グレイ・レベルの平均値と共に使用される。
【0012】
2.エッジ・ベースのセグメント化
非特許文献3には、画像セグメント化のためにピクセル近傍の要素を使用する方法が記載されている。
【0013】
非特許文献4には、境界解析を介して自然情景のセグメント化を実行するために使用される一組のアルゴリズムが開示されている。これらのアルゴリズムの目的は、情景内の物体の境界を正しく特定することである。
【0014】
非特許文献5では、エッジ・ベースの画像セグメント化手法が用いられている。ここでは、非類似領域の混合を起こしうる小さいギャップのために、エッジ・ベースのセグメント化があまりうまくいかないことが示されている。
【0015】
非特許文献6には、変分理論を使用して画像セグメント化を行う新しい適応型しきい値アルゴリズムが提案されている。
【0016】
非特許文献7には、エッジ検出に基づいた画像処理の手法が記載されている。
【0017】
上記手法の他に、ガボール関数(GF:Gabor Function)や他の同様のウエーブレットに基づく画像表現が、画像符号化及び画像圧縮、強調及び復元、またはテクスチャ解析などの多くのアプリケーションにおいて非常に有用であることが分かっている。さらに、GFは単純な皮質セルの受容野に対して良好な近似を提供するので、マルチ・スケールのフィルタリング方式、例えば、視覚皮質における画像表現の現行モデルにおいて、頻繁に使用されている。しかし、GFは直交関数ではなく、従って普通ではない二重基底関数に基づくので、古典的ガボール展開は計算処理コストがかかる。再構築は、反復型アルゴリズム、人工ニューラル・ネットワーク(ANN)の使用、または大規模行列の逆変換を必要とする。これらの問題は、冗長なマルチ・スケールのフィルタリングの実装によって部分的に解決することができる。多くのウエーブレットの中には、(ガウス導関数、可変フィルタなどのような)異なる基本関数を使用する多解像度ピラミッド及び関連手法がある。
【0018】
GFに基づく手法には以下のような利点がある。
【0019】
・空間領域及び周波数領域における結合局所化(joint localization)の最大化
・任意のバンド幅を使用して空間的位置、周波数及び方向の連続体に対してGFを自由に調整することができる柔軟性
・GFが、2つの分離可能なフィルタの和として正確に表現可能であるという方向選択性を持つ唯一の生物学的にもっともらしいフィルタであるという事実
・多種のアプリケーションにおける良好な性能
これらすべての理由により、ガボール関数は、画像解析及びマシン・ビジョン(machine vision)という多目的の環境における初期の処理タスクの実行に特に適している。
【0020】
非特許文献8には、非特定の物体を認識するための画像セグメント化を提供する注意制御システムが開示されている。C. Shannonによって導入された情報理論に基づいて、デジタル画像の局所情報の内容が推定される。これによって、画像部分の期待情報内容に関する尺度として画像エントロピーが使用される。この点について、マスク・サイズ、サブサンプリング因子、エントロピーしきい値及び形態的演算子(morphological operators)の特定パラメータ等の種々のパラメータにより、特定の問題及び特定のタスクに適した画像処理が可能になる。
【0021】
【非特許文献1】
R. B. Ohlander著、「Analysis of Natural Scenes」、PhD Thesis, Carnegie Institute of Technology, Dept. of Computer Science, Carnegie−Mellon University, Pittsburgh, PA, 1975
【0022】
【非特許文献2】
L. Li, J. Gong及びW. Chen著、「Gray−Level Image Thresholding Based on a Fisher Linear Projection of a Two−Dimensional Histogram」、Pattern Recognition, vol. 30, No. 5, pp. 743−749, 1997
【0023】
【非特許文献3】
N. Ahuja, A. Rosenfeld及びR.M. Haralick著、「Neighbor Gray Levels as Features in Pixel Classification」、Pattern Recognition, vol. 12, pp.251−260, 1980
【0024】
【非特許文献4】
J.M. Prager著、「Extracting and Labeling Boundary Segments in Natural Scenes」、IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 2, No. 1, pp.16−27, 1980
【0025】
【非特許文献5】
W.A. Perkins著、「Area Segmentation of Images using Edge Points」、IEEE Transactions on Pattern Recognition and Machine Intelligence, vol. 2, No. 1, pp. 8−15, 1980
【0026】
【非特許文献6】
F.H.Y. Chan, F.K. Lam及びH. Zhu著、「Adaptive Thresholding by Variational Method」、IEEE Transactions on Image Processing, vol. 2, No. 3, pp.168−174, 1998
【0027】
【非特許文献7】
C. Goerick及びM. Brauckmann著、「Local Orientation Coding and Neural Network Classifiers with an Application to Real−Time Car Detection and Tracking」、W.G. Kropatsch and H. Bischof [editors], Mustererkennung 1994, Proceedings of the 16th Symposium of the DAGM and the 18th Workshop of the OAGM, Springer−Verlag, 1994
【0028】
【非特許文献8】
T. Kalinke及びW. von Seelen著、「Entropie als Mass des lokalen Informationsgehalts in Bildern zur Realisierung einer Aufmerksamkeitssteuerung」、Internal Report 96−07, Institut fur Neuroinformatik der Ruhr−Universitat Bochum, 1996, published in Mustererkennung 1996, pp.627−634, Springer−Verlag, Berlin/Heidelberg, 1996
【0029】
【発明が解決しようとする課題】
(例えばエッジ検出に基づく)最適な物体認識システムを構築する多くの試みにもかかわらず、既知のアルゴリズムは、線分とエッジが非常に近接及び/または交差している位置における物体セグメント化に問題のあることが多いことが分かっている。従来のエッジ検出アルゴリズムは、非常に小さい(単純または複雑に連結する)複数の画像パッチを認識できるにすぎないので、例えば交差する線分によって生じる局所的なあいまいさを解決することは不可能である。従って、基となる認識システムは、入り乱れた背景(cluttered background)上の多数の小さな物体と、異なる部品から成る1つの大きな物体とを区別することができない。このため、認識するべき物体の輪郭に関するグローバルな情報が必要となる。一般に、これらの問題は、多くの異なる物体を含む画像の場合、または入り乱れた背景上に物体がある場合に生じる。
【0030】
別の問題は、これらの物体認識システムは、使用した画像または画像ファミリーに対して調整が必要であることである。さらに、線分及びエッジ(事象)を同時に検出し分類することができるアルゴリズムはいまだにほとんど存在しない。
【0031】
上述の説明に鑑みて、本発明は、後続のエッジ検出処理をより効率的にする手法を提供することを目的とする。
【0032】
【課題を解決するための手段】
本発明の第1の側面によると、後続のパターン認識処理のためのデジタル画像を作成する方法が提供される。この方法は、デジタル画像内の顕著な物体を強調する。デジタル画像の各ピクセルの値をピクセルの定義された近傍における当該ピクセルのグレイ・レベルの標準偏差値で置き換えることによって画像の局所的標準偏差が評価され、マスク画像が生成される。次に、元のデジタル画像を生成されたマスク画像と組み合わせる。
【0033】
元の画像をマスク画像と組み合わせるとき、マスク画像の加重値は調整可能である。
【0034】
マスク画像の加重値は、調整可能な加重マスクとマスク画像を組み合わせることによって調整することができる。
【0035】
元のデジタル画像の一部分だけをマスク画像と組み合わせるように加重マスクを設計することもできる。
【0036】
本発明の別の側面によると、後続のパターン認識のためのデジタル画像を作成する方法が提供される。この方法はデジタル画像内の顕著な物体を強調する。これによって、エッジのない面に属するデジタル画像のピクセルが画像の局所的標準偏差を評価することによって検出される。
【0037】
デジタル画像の各ピクセルの値をピクセルの定義された近傍における当該ピクセルのグレイ・レベルの標準偏差値で置き換えることによって画像の局所的標準偏差が評価され、マスク画像を生成することができる。次に、元のデジタル画像がマスク画像と組み合わされ、組み合わせ画像が生成される。最後に、この組み合わせ画像に対してエッジ検出が実行される。
【0038】
元のデジタル画像をマスク画像と組み合わせるステップは、1つの面に属すると評価されたデジタル画像の領域内でエッジ検出を禁止するように実行することができる。
【0039】
元のデジタル画像をマスク画像と組み合わせるステップは、1つの面に属していないと評価されたデジタル画像の領域内でエッジ検出を禁止するように実行することもできる。
【0040】
エッジ検出は、組み合わせ画像と配向ガボール・パッチの畳み込みによって実行することができる。
【0041】
局所的標準偏差を評価するステップは、2つの直交直角方向において実行して、1つの面領域の境界の主方向を示す標準偏差ベクトルを定義することができる。
【0042】
主方向の複数ピクセルの値を強調する一方、主方向から離れたピクセルの値を抑制することができる。
【0043】
局所的標準偏差を評価するステップのためのしきい値は調整可能である。
【0044】
局所的標準偏差を評価するステップの前に、元のデジタル画像をローパス・フィルタリングすることができる。
【0045】
前記画像の平均グレイ・レベルに応じたしきい値関数をローパス・フィルタリングされたデジタル画像やマスク画像に適用して、コントラストを強調することができる。
【0046】
本発明のさらに別の側面によると、コンピュータ装置上で実行されるとき上述した方法を実施するコンピュータ・ソフトウェア・プログラム、及びこのコンピュータ・ソフトウェア・プログラムが記録された記録媒体が提供される。
【0047】
最後に、本発明は、上述の方法を実施する手段を提供するシステムを提案する。
【0048】
【発明の実施の形態】
本発明は、異なる空間スケール及び異なる画像特徴からの情報を、それらの結合様相(appearance)に対する統計的依存性を利用することによって、同時に評価するように特に最適化される。そのような依存性は局所エッジ検出プロセスを建設的に誘導するため適用される。
【0049】
本発明の主要な概念に従って提案される手法は、後続のパターン認識プロセスS6のためのデジタル画像102を作成する。この方法は、デジタル画像102における顕著な(prominent)物体を強調する。
【0050】
以下の説明では、「エッジ」、「エッジのない(edge−free)」などの用語は、本発明に従ったプロセスによって実行された「解釈(分析)」の意味に常に理解されなければならないことに注意されたい。
【0051】
本手法は、基本的に、図1a、1bに示されているS1〜S6の6つのステップに分割することができる。以下、これらのステップの詳細を説明する。図2a、2bに示されている手順のハードウェア実施形態のブロック図についても説明する。各図中の参照記号で示されている記号の意味は、「符号の説明」に記載してある。
【0052】
第1のステップS1において、認識されるべきデジタル入力画像A(i,j)が、標準偏差σを有するガウシアン・カーネルh(i,j)と畳み込みされる。畳み込みは、図2a及び図2bにおけるローパス・フィルタ202によって実現され、上記入力画像A(i,j)を平滑化することによってノイズ及び微細な部分を減少させる。これによって、上記ピクセルのインデックスi及びjは、それぞれ画像のx軸及びy軸方向を指すこととなる。
【0053】
次のステップS2は、ローパス・フィルタリングされた画像のコントラストを強調する。シグモイドしきい値関数Θ(・)を適用することによって全体の構造が復元され、次式が成立する。
【0054】
【数1】
Figure 2004054922
ここで、アスタリスク(*)は畳み込み演算を示し、シグモイドしきい値関数Θ(・)は、例えば、次式によって表すことができる。
【0055】
【数2】
Figure 2004054922
ここで、μはしきい値関数Θ(・)の勾配係数であり、Nは画像におけるピクセルの数を表し、θは適用されるしきい値を表す。
【0056】
前記しきい値θは、ローパス・フィルタリングされた入力画像B(i,j)の平均グレイ・レベル<B>に従って自動的に選択される。従って、このステップの自動的な局所較正(自動較正)が実現可能である。
【0057】
次のステップS3において、同じエッジなし領域に属しているデジタル画像のピクセルが検出される。従って、本発明に従ったプロセスによって実施される「解釈」に従ってエッジの存在を示していない領域によって1つの面が定義される。従って、画像は、エッジによってではなく、隣接している(エッジなしの)面を定義することによって、分離される。
【0058】
次式によって、観察されたピクセルによって記述される点(i,j)の局所的(環状の)近傍γ(i,j)の範囲内のグレイ・レベルの局所標準偏差σC, γ (i,j)を計算することによって、同じエッジなし領域に属しているピクセルの検出を実行することができる。
【0059】
【数3】
Figure 2004054922
そして、ステップS1及びステップS2の適用の後に取得された結果C(i,j)を使用して、次式が得られる。
【0060】
【数4】
Figure 2004054922
ここで、
γ(i,j)は、観察されたピクセルによって記述される点(i,j)の局所的(環状の)近傍を表し、
<C>γ (i,j)は、ノイズ・フィルタリングを適用した(S1)後の点(i,j)の周囲の環境γ(i,j)の範囲内の画像C(i,j)のグレイ・レベルの局所的平均を表し、
σC, γ (i,j)は、環境γ(i,j)の範囲内の画像C(i,j)のグレイ・レベルの局所的標準偏差を表し、
Pは、環境γ(i,j)におけるピクセルの数である。
【0061】
この目的のため、各ピクセルの値は、それぞれのピクセルによって記述される点(i,j)の周囲の近傍γの範囲内のグレイ・レベルの標準偏差値σC, γ (i,j)によって置き換えられ、この結果、画像D(i,j)が得られる。環状の環境γのサイズと共にガウシアン・ローパス・フィルタ202の標準偏差σ(幅)が面検出ステップS3の空間スケールを定義する。
【0062】
特定の実施形態によれば、局所的標準偏差は、二次元の標準偏差ベクトルを生成するため、2つの直交方向において計算することができる。こうして、標準偏差ベクトルが、画像の顕著な物体の輪郭の支配(主)方向を表す。従って、そのような主方向が強調される一方、副次的方向が抑制されるならば、物体の輪郭をさらに強調することができる。
【0063】
次のステップS4において、非常に急な勾配μを持つ別のシグモイドしきい値関数Θ(・)を使用して、それぞれの面に属していないピクセルからそれぞれの面に属しているピクセルを分離することによって、コントラストを強化することができる。
【0064】
【数5】
Figure 2004054922
これによって、それぞれの面内に存在するピクセルにゼロに近いか等しい値が割り当てられる。
【0065】
シグモイドしきい値関数Θ(・)は、次式によって表すことができる。
【0066】
【数6】
Figure 2004054922
ここで、μはしきい値関数Θ(・)の勾配係数であり、Nは画像中のピクセル数を表し、θは適用されるしきい値を表す。
【0067】
前記しきい値θは、上述のように定義された画像D(i,j)の平均グレイ・レベル<D>に従って決定される。これによって、このステップS4の自動的な局所較正(自動較正)が達成される。
【0068】
次に、ステップS5aまたはステップS5bにおいて、元の画像が前のステップの結果である画像E(i,j)と組み合わせられる(「マスキング」される)。このマスキングは次式を適用することによって実行される。
【0069】
【数7】
Figure 2004054922
ここで、合成演算子(〇)は、元の画像102と面の画像106のピクセル単位の乗算S5a(または加算S5b)によって置き換えることができる。このピクセル単位の乗算または加算は、演算子「×」(または「+」)によってそれぞれ表されている。
【0070】
このステップにおいて、面画像106の加重係数λが、面画像106を調整可能な加重マスクと組み合わせることによって調整される。加重係数λは、面検出S3が後続のエッジ検出S6をどの程度強力に決定するかを制御する。加重係数λは、画像102全体に対して一様に、または、対象とする特定の領域について個別に、選択することができる。
【0071】
別の選択肢として、元のデジタル画像102の一部分だけが面画像106と組み合わせられるように加重マスクを設計することもできる。
【0072】
最後のステップS6において、画像F(i,j)に対してエッジ検出が実行される。同一のエッジなし面に属していると見なされる領域におけるエッジ検出が禁止され、従ってエッジ検出はエッジを含む領域に限定されるので、エッジ検出の効率が向上する。精細エッジ検出S6は、全体的な輪郭が存在する画像102の部分に対してのみ適用される。
【0073】
代替的に、エッジを含む領域におけるエッジ検出を禁止して、画像内の顕著な物体を抑制することもできる点に注意されたい。これは、ステップS5aまたはステップS5bにおいて、それぞれ反転マスキングを使用することによって実施することができる。
【0074】
エッジ検出は、例えば、配向ガボール・パッチを用いた輪郭画像F(i,j)の畳み込みによって実行することができる。ガボール・カーネルの標準偏差σ(幅)は、例えば3x3ピクセルのサイズのように、可能な限り小さくなければならない。対照的に、ガウシアン・カーネルの標準偏差σ(幅)は、例えば12x12ピクセルのサイズのように、比較的大きくなければならない。この点について、局所的標準偏差σC, γ (i,j)の推定のために必要とされる近傍γのサイズは、σとσの間で選択されなければならない点に注意されたい。本発明の一実施形態では、直径が5ピクセルの環状パッチが使用される。
【0075】
図1a及び図1bに示した動作を実行するプログラムはコンピュータ読取可能記憶媒体に記憶することができ、この記憶されたプログラムは、物体検出を実行するためにコンピュータ・システム上で実行可能である。 コンピュータ読取可能記憶媒体は、プログラムを一時的に記憶する装置であっても良く、例えば、ネットワーク(例えばインターネット)または通信回線(例えば電話線)を経由して送信されるプログラムを受け取るサーバまたはクライアントの機能を果たすコンピュータ・システムにおける揮発性メモリ(すなわちRAM)を含む。本発明は、図2a及び図2bに示すハードウェアで実施することができる。
【0076】
本発明の利点は次のようにまとめられる。
・本発明に従った概念は、異なるスケールで並列に動作することができる。
・粗いスケールにおいては、画像は類似の同質の領域にセグメント化され、これらの領域は面と解釈される。
・これは、局所的エッジ検出とは無関係に、全体の物体境界を効率的に選択する。
・局所的なあいまいさは、全体の面と局所的エッジ情報を統合することによって解消される。
・ノイズ及び小さな細部は抑制され、画像認識のロバスト性をもたらす。
・本発明に従った手法のパラメータは、画像の平均グレイ・レベルに従って自動的に調整される。
【図面の簡単な説明】
【図1a】デジタル画像によって表された顕著な物体の面及びエッジの検出に使用される物体認識システムをサポートするために適用可能な、本発明に従った物体検出アルゴリズムの機能の概要を示すチャートである。
【図1b】デジタル画像によって表された顕著な物体の面及びエッジの検出に使用される物体認識システムをサポートするために適用可能な、本発明に従った物体検出アルゴリズムの機能の概要を示すチャートである。
【図2a】物体認識システムのハードウェア実施形態のブロック図である。
【図2b】物体認識システムのハードウェア実施形態のブロック図である。
【符号の説明】
100a 本発明に従った物体検出アルゴリズムの機能的な概要を示す第1のフローチャート。このアルゴリズムは、入力画像102とその表面画像106をピクセル単位で乗算(×)することによるマスキング(S5a)に基づいて、デジタル化された画像により表された顕著な画像の表面及びエッジを検出するために使用される物体検出システムをサポートするために適用することができる。
100b 本発明に従った物体検出アルゴリズムの機能的な概要を示す第2のフローチャート。このアルゴリズムは、入力画像102とその表面画像106をピクセル単位で加算(+)することによるマスキング(S5b)に基づいて、デジタル化された画像により表された顕著な画像の表面及びエッジを検出するために使用される物体検出システムをサポートするために適用することができる。
102 2つのカメラ・アイを備えたアンドロイドとして機能するプロトタイプのロボットの人工的な頭部を表す元の入力画像A(i,j)。
104 元の入力画像102とガウシアン・カーネルh(i,j)の畳み込みを実行してノイズの影響(S1)を低減し、さらに第1のコントラスト強化(S2)をした後に得られる、ローパス・フィルタリングされた入力画像C(i,j)。
106 ローパス・フィルタリングされた入力画像の局所偏差評価(S3)及び第2のコントラスト強化(S4)に基づいて表面検出を適用した後に得られる、粗い物体輪郭を有する表面画像E(i,j)。ここで、検出された単一のまたは複数の接続された領域に属するピクセルは黒にされており、検出された表面の輪郭は白のままである。
108 表面画像106と元の入力画像102のピクセル単位での加算(+)または乗算(×)を適用することによって、表面画像106のマスキング(S5)を適用した後に得られる、精細な物体輪郭を有する輪郭画像F(i,j)。
110a 輪郭画像108に対して水平方向に向いた線分についてエッジ(方向)検出(S6)を適用した後の第1の結果画像F(i,j)。
110b、110d 輪郭画像108に対して斜め方向に向いた線分についてエッジ(方向)検出(S6)を適用した後の第2及び第4の結果画像F(i,j)。
110c 輪郭画像108に対して垂直方向に向いた線分について、エッジ(方向)検出を適用した後の第3の結果画像F(i,j)。
200a 入力画像102とその表面画像106をピクセル単位で乗算(×)することによるマスキングに基づいた、物体検出システムのハードウェア実装形態の第1の簡潔なブロック図。
200b 入力画像102とその表面画像106をピクセル単位で加算(+)することによるマスキングに基づいた、物体検出システムのハードウェア実装形態の第2の簡潔なブロック図。
202 平滑化及びノイズ低減用のローパス・フィルタ。
204 局所分散検出器(local−variance detector)
204a 局所分散検出器204の局所平均検出器(local−average detector)
204b 局所分散検出器204の乗算要素
204c 局所分散検出器204の加算要素
204d 前記入力画像104の1ピクセルを表す観察点(i,j)の周りの円形環境γ(i,j)におけるローパス・フィルタリングされた入力画像104の局所標準偏差を計算するための平方根計算ユニット。
205a コントラスト強化のためにシグモイドしきい値関数Θ(・)を用いる第1のしきい値要素。
205b コントラスト強化のためにシグモイドしきい値関数Θ(・)を用いる第2のしきい値要素。
206 表面画像106に重み付け要素λを乗算するために使用される乗算要素。これは、表面検出(S3)が後続のエッジ検出を決定する強度を制御する。
206a 重み付けされた表面画像106で元の入力画像102をマスキングするために使用される乗算要素。
206b 重み付けされた表面画像106で前記入力画像102をマスキングするために用いられる加算要素。
208 エッジ検出オペレータDε(・)を用いるエッジ検出器。
S1 ステップ1:ローパス・フィルタとガウシアン・カーネルh(i,j)を用いたローパス・フィルタリング。
S2 ステップ2:第1のコントラスト強化
S3 ステップ3:局所分散ベースの表面検出
S4 ステップ4:第2のコントラスト強化
S5a ステップ5a:表面画像106と元の入力画像102のピクセル単位の乗算(×)
S5b ステップ5b:表面画像106と元の入力画像102のピクセル単位の加算(+)
S6 ステップ6:エッジ(方向)検出

Claims (21)

  1. デジタル画像内の顕著な物体を強調して、後続のパターン認識処理のためのデジタル画像を作成する方法であって、
    前記デジタル画像の各ピクセルの値をピクセルの定義された近傍における前記ピクセルのグレイ・レベルの標準偏差値で置き換えることによって画像の局所的標準偏差を評価して、マスク画像を生成するステップと、
    元のデジタル画像を前記マスク画像と組み合わせるステップと、
    を含むことを特徴とするデジタル画像作成方法。
  2. 元のデジタル画像をマスク画像と組み合わせる前記ステップにおいて、マスク画像の加重値が調整可能であることを特徴とする、請求項1に記載のデジタル画像作成方法。
  3. 前記マスク画像の加重値は、前記マスク画像を調整可能な加重マスクと組み合わせることによって調整されることを特徴とする、請求項2に記載のデジタル画像作成方法。
  4. 前記元のデジタル画像の一部分だけを前記マスク画像と組み合わせられるように前記加重マスクが設計されていることを特徴とする、請求項2または請求項3に記載のデジタル画像作成方法。
  5. デジタル画像における顕著な物体を強調して、後続のパターン認識のためデジタル画像を作成する方法であって、
    前記画像の局所的標準偏差を評価することによって、エッジのない面に属するデジタル画像のピクセルを検出するステップを含むことを特徴とする、デジタル画像作成方法。
  6. デジタル画像内のエッジを検出する方法であって、
    前記デジタル画像の各ピクセルの値をピクセルの定義された近傍における前記ピクセルのグレイ・レベルの標準偏差値で置き換えることによって画像の局所的標準偏差を評価して、マスク画像を生成するステップと、
    元のデジタル画像を前記マスク画像と組み合わせて、組み合わせ画像を生成するステップと、
    前記組み合わせ画像に対してエッジ検出を実行するステップと、
    を含むことを特徴とする、デジタル画像のエッジ検出方法。
  7. 元のデジタル画像をマスク画像と組み合わせる前記ステップが、1つの面に属すると評価されたデジタル画像の領域内で前記エッジ検出が禁止されるように設計されることを特徴とする、請求項6に記載のエッジ検出方法。
  8. 元のデジタル画像をマスク画像と組み合わせる前記ステップが、1つの面に属していないと評価されたデジタル画像の領域内で前記エッジ検出が禁止されるように設計されることを特徴とする、請求項6に記載のエッジ検出方法。
  9. 前記エッジ検出が、前記組み合わせ画像と配向ガボール・パッチの畳み込みによって実行されることを特徴とする、請求項6乃至請求項8のいずれか1項に記載のエッジ検出方法。
  10. 局所的標準偏差を評価する前記ステップが2つの直交方向において実行され、1つの面領域の境界の主方向を示す標準偏差ベクトルを定義することを特徴とする、請求項1乃至請求項9のいずれか1項に記載の方法。
  11. 主方向のピクセルの値が強調され、主方向から離れたピクセルの値が抑制されることを特徴とする、請求項10に記載の方法。
  12. 局所的標準偏差を評価する前記ステップのためのしきい値が調整可能であることを特徴とする、請求項1乃至請求項11のいずれか1項に記載の方法。
  13. 局所的標準偏差を評価する前記ステップの前に、元のデジタル画像がローパス・フィルタリングされることを特徴とする、請求項1乃至請求項12のいずれかに記載の方法。
  14. 前記画像の平均グレイ・レベルに応じたしきい値関数が、前記ローパス・フィルタリングされたデジタル画像及び/または前記マスク画像に適用されて、前記コントラストを強調することを特徴とする、請求項1乃至請求項13のいずれか1項に記載の方法。
  15. コンピュータ装置上で実行されるとき、請求項1乃至請求項14のいずれか1項に記載の方法を実施することを特徴とするコンピュータ・ソフトウェア・プログラム。
  16. 請求項15に記載のコンピュータ・ソフトウェア・プログラムを記録することを特徴とする記録媒体。
  17. デジタル画像内の顕著な物体を強調して、後続のパターン認識のためのデジタル画像を作成するシステムであって、
    前記デジタル画像の各ピクセルの値をピクセルの定義された近傍における前記ピクセルのグレイ・レベルの標準偏差値で置き換えることによって画像の局所的標準偏差を評価して、マスク画像を生成する手段と、
    元のデジタル画像を前記マスク画像と組み合わせる手段と、
    を含むことを特徴とするデジタル画像作成システム。
  18. デジタル画像内の顕著な物体を強調して、後続のパターン認識のためのデジタル画像を作成するシステムであって、
    前記画像の局所的標準偏差を評価することによってエッジのない面に属するデジタル画像のピクセルを検出する手段を備えることを特徴とするデジタル画像作成システム。
  19. デジタル画像のエッジを検出するシステムであって、
    デジタル画像の各ピクセルの値をピクセルの定義された近傍における前記ピクセルのグレイ・レベルの標準偏差値で置き換えることによって画像の局所的標準偏差を評価して、マスク画像を生成する手段と、
    元のデジタル画像を前記マスク画像と組み合わせて、組み合わせ画像を生成する手段と、
    前記組み合わせ画像に対してエッジを検出する手段と、
    を備えることを特徴とするエッジ検出システム。
  20. 入力画像をガウシアン・カーネルでローパス・フィルタリングするステップと、
    ローパス・フィルタリングされた画像のコントラストを強調するステップと、
    前記デジタル画像の各ピクセルの値を対応するピクセルの定義された近傍における前記ピクセルのグレイ・レベルの標準偏差値によって置き換えることによって、局所的分散に基づいて画像の面を検出するステップと、
    前記画像のコントラストを強調して強調された画像を取得するステップと、
    元の画像を前記強調された画像と組み合わせて輪郭画像を取得するステップと、
    前記輪郭画像の配向エッジを検出するステップと、
    を含むことを特徴とする物体認識方法。
  21. 入力画像をガウシアン・カーネルでフィルタリングするローパス・フィルタと、
    ローパス・フィルタリングされた画像のコントラストを強調する第1の強調セクションと、
    前記デジタル画像の各ピクセルの値を対応するピクセルの定義された近傍における前記ピクセルのグレイ・レベルの標準偏差値によって置き換えることによって、局所的分散に基づいて画像の面を検出する第1の検出セクションと、
    画像のコントラストを強調して強調された画像を取得する第2の増強セクションと、
    元の画像を前記強調された画像と組み合わせて輪郭画像を取得する組み合わせセクションと、
    前記輪郭画像の配向エッジを検出する第2の検出セクションと、
    を備えることを特徴とする物体認識装置。
JP2003162546A 2002-06-07 2003-06-06 デジタル画像作成方法 Expired - Fee Related JP4480958B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02012736 2002-06-07
EP02014189A EP1387315B1 (en) 2002-06-07 2002-06-25 Preparation of a digital image with subsequent edge detection

Publications (2)

Publication Number Publication Date
JP2004054922A true JP2004054922A (ja) 2004-02-19
JP4480958B2 JP4480958B2 (ja) 2010-06-16

Family

ID=30116889

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003162546A Expired - Fee Related JP4480958B2 (ja) 2002-06-07 2003-06-06 デジタル画像作成方法

Country Status (3)

Country Link
US (1) US7356185B2 (ja)
EP (1) EP1387315B1 (ja)
JP (1) JP4480958B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009508200A (ja) * 2005-09-09 2009-02-26 キネティック リミテッド 画像領域の自動選定

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7596265B2 (en) 2004-09-23 2009-09-29 Hewlett-Packard Development Company, L.P. Segmenting pixels in an image based on orientation-dependent adaptive thresholds
EP1974313A4 (en) * 2005-12-30 2011-11-16 Yeda Res & Dev MEDICAL APPLICATION ANALYSIS INTEGRATED SEGMENTATION AND CLASSIFICATION APPROACH
WO2009018445A1 (en) * 2007-08-01 2009-02-05 Yeda Research & Development Co. Ltd. Multiscale edge detection and fiber enhancement using differences of oriented means
WO2010017448A1 (en) * 2008-08-07 2010-02-11 Massachusetts Institute Of Technology Coding for visual prostheses
US8004588B2 (en) 2008-08-27 2011-08-23 Seiko Epson Corporation Image processing procedure for receiving mosaic image data and calculating vertical and horizontal-direction color difference components for each pixel
US8588535B2 (en) 2010-09-15 2013-11-19 Sharp Laboratories Of America, Inc. Methods and systems for estimation of compression noise
US8600188B2 (en) 2010-09-15 2013-12-03 Sharp Laboratories Of America, Inc. Methods and systems for noise reduction and image enhancement
US8538193B2 (en) 2010-09-28 2013-09-17 Sharp Laboratories Of America, Inc. Methods and systems for image enhancement and estimation of compression noise
US8175411B2 (en) 2010-09-28 2012-05-08 Sharp Laboratories Of America, Inc. Methods and systems for estimation of compression noise
US8532429B2 (en) 2010-09-28 2013-09-10 Sharp Laboratories Of America, Inc. Methods and systems for noise reduction and image enhancement involving selection of noise-control parameter
US8600172B2 (en) 2011-03-16 2013-12-03 Sensormatic Electronics, LLC Video based matching and tracking by analyzing one or more image abstractions
CN102289669B (zh) * 2011-08-10 2015-05-13 刘艳 基于灰度梯度序列的数字图像特征提取方法
JP5816486B2 (ja) * 2011-08-18 2015-11-18 オリンパス株式会社 蛍光観察装置および蛍光観察システム並びに蛍光観察装置の蛍光画像処理方法
GB2542911B (en) * 2011-10-14 2017-07-26 Solentim Ltd Method of and apparatus for analysis of a sample of biological tissue cells
CN104346781A (zh) * 2014-10-27 2015-02-11 北京航空航天大学 一种利用数学形态学切换变换构造形态学对比度算子的矿物图像增强方法
US20160292874A1 (en) * 2015-03-30 2016-10-06 General Electric Company Methods and systems for automatic segmentation
DE102015226400A1 (de) * 2015-12-22 2017-06-22 Siemens Healthcare Gmbh Automatisierte Ermittlung von Konturen auf Basis einer iterativen Rekonstruktion
US10373316B2 (en) * 2017-04-20 2019-08-06 Ford Global Technologies, Llc Images background subtraction for dynamic lighting scenarios
KR102041310B1 (ko) * 2017-08-02 2019-11-07 세메스 주식회사 기판 처리 장치 및 기판의 안착 상태 판단 방법
CN109255794B (zh) * 2018-09-05 2020-11-13 华南理工大学 一种标准件深度全卷积特征边缘检测方法
CN111080663B (zh) * 2019-12-30 2020-09-22 广西科技大学 一种基于动态感受野的仿生型轮廓检测方法
CN113033550B (zh) * 2021-03-15 2022-04-15 合肥联宝信息技术有限公司 一种图像的检测方法、装置及计算机可读介质
CN115830013B (zh) * 2023-02-08 2023-05-16 磐石重工(青岛)股份有限公司 基于机器视觉的压力容器焊缝缺陷检测方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4571635A (en) * 1984-02-17 1986-02-18 Minnesota Mining And Manufacturing Company Method of image enhancement by raster scanning
EP0357842B1 (en) * 1988-09-07 1995-04-19 Agfa-Gevaert N.V. Digital image processing taking into account the standard deviation
US5081692A (en) * 1991-04-04 1992-01-14 Eastman Kodak Company Unsharp masking using center weighted local variance for image sharpening and noise suppression
US5999639A (en) * 1997-09-04 1999-12-07 Qualia Computing, Inc. Method and system for automated detection of clustered microcalcifications from digital mammograms
US6198089B1 (en) * 1999-03-31 2001-03-06 The Hong Kong University Of Science And Technology Steerable and scalable spatial filters

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009508200A (ja) * 2005-09-09 2009-02-26 キネティック リミテッド 画像領域の自動選定

Also Published As

Publication number Publication date
JP4480958B2 (ja) 2010-06-16
EP1387315B1 (en) 2007-09-12
EP1387315A1 (en) 2004-02-04
US20040037466A1 (en) 2004-02-26
US7356185B2 (en) 2008-04-08

Similar Documents

Publication Publication Date Title
JP4480958B2 (ja) デジタル画像作成方法
US10339643B2 (en) Algorithm and device for image processing
US7653238B2 (en) Image filtering based on comparison of pixel groups
Sharma et al. A comparative study of edge detectors in digital image processing
US6621937B1 (en) Removing chroma noise from digital images by using variable shape pixel neighborhood regions
Mlsna et al. Gradient and Laplacian edge detection
JP2016505186A (ja) エッジ保存・ノイズ抑制機能を有するイメージプロセッサ
Rosenfeld Image pattern recognition
US8965141B2 (en) Image filtering based on structural information
WO2006024974A1 (en) Feature weighted medical object contouring using distance coordinates
JP2004519759A (ja) 画像内の関心領域を決定するための方法及び装置及び画像伝送方法及び装置
US6574374B1 (en) Enhancing image compression performance by morphological processing
Cho et al. Effective five directional partial derivatives-based image smoothing and a parallel structure design
WO2014133584A1 (en) Image processor with multi-channel interface between preprocessing layer and one or more higher layers
Narváez et al. Point cloud denoising using robust principal component analysis
Forczmański et al. Simple and robust facial portraits recognition under variable lighting conditions based on two-dimensional orthogonal transformations
Dogra et al. An efficient image integration algorithm for night mode vision applications
Dryanovski et al. Real-time pose estimation with RGB-D camera
Saleem et al. Survey on color image enhancement techniques using spatial filtering
Shu et al. Side window weighted median image filtering
Tu et al. Constant time bilateral filtering for color images
Singh et al. Threshold modeling for cellular logic array processing based edge detection algorithm
Iiyama et al. Super-resolution texture mapping from multiple view images
Shinde et al. Image object saliency detection using center surround contrast
Patel et al. Study of noise removal techniques for digital images

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060410

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090414

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090709

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090811

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100302

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100317

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130326

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140326

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees