JP2004054922A

JP2004054922A - デジタル画像作成方法

Info

Publication number: JP2004054922A
Application number: JP2003162546A
Authority: JP
Inventors: Marc-Oliver Gewaltig; マルク−オリヴァー・ゲワルティヒ; Kerner Edgar; エドガー・ケルナー; Ursula Koerner; ウルスラ・コーナー
Original assignee: Honda Research Institute Europe GmbH
Current assignee: Honda Research Institute Europe GmbH
Priority date: 2002-06-07
Filing date: 2003-06-06
Publication date: 2004-02-19
Anticipated expiration: 2023-06-06
Also published as: US7356185B2; EP1387315A1; EP1387315B1; JP4480958B2; US20040037466A1

Abstract

【課題】デジタル画像内の顕著な物体を強調して、後に続くパターン認識プロセスで使用されるデジタル画像を効率的に作成する。
【解決手段】デジタル画像の各ピクセルの値をピクセルの定義された近傍におけるピクセルのグレイ・レベルの標準偏差値で置き換えることによって画像の局所的標準偏差を評価して、マスク画像を生成する。次に、元のデジタル画像とマスク画像とを組み合わせることによって、所望のデジタル画像を作成する。
【選択図】図１ａ

Description

【０００１】
【発明の属する技術分野】
本発明は、物体認識に関し、特に、デジタル画像の物体認識システムにおける輪郭検出及び表面検出手法に関する。本発明は、顕著な（ｐｒｏｍｉｎｅｎｔ）物体のセグメント化に有利に利用可能であり、また、配向された線セグメント（すなわちエッジ）を使用して比較的大きい物体を認識するエッジ検出アルゴリズムに利用可能である。
【０００２】
【従来の技術】
自動情景解析や物体識別を実行可能なパターン認識及び物体認識システムは、多種の業務のために使用することができる。
【０００３】
画像内の物体を認識するには、最初に、物体に属している画像部分（前景）を物体に属していない画像部分（背景）から切り離すことが必要である。このプロセスは、通常、「画像セグメント化」と呼ばれる。物体をその背景にかかわりなく認識しなければならないので、画像セグメント化はデジタル画像における物体認識のための基本的な前提条件である。このステップを実行可能なアルゴリズムは、「セグメント化アルゴリズム」と呼ばれる。
【０００４】
標準的なアルゴリズムの大部分は、物体はある程度良好に規定された境界によって背景から切り出されるという事実を利用する。最初に、配向された線セグメント（ｏｒｉｅｎｔｅｄ　ｌｉｎｅ　ｓｅｇｍｅｎｔｓ）等の小さな「基本的特徴（ｅｌｅｍｅｎｔａｒｙ　ｆｅａｔｕｒｅ）」に画像を分解することによってセグメント化ステップを実行する。その後、これら基本的特徴がより大きい物体を構築するために使用される。従って、セグメント化された物体は基本的特徴を用いて記述される。
【０００５】
この手法は、次のような２つの主要な問題を持つ。
【０００６】
第１の問題は、デジタル画像の輝度値から物体の境界を抽出する適切な方法の選択である。物体と背景との間の輝度変化が小さい場合、または物体内の輝度変化が物体と背景の間の輝度変化と同等である場合、この問題は一層悪化する。この問題を克服するため、画像の視覚的外観を改善して、物体と背景の間のコントラストを増幅しようとする多くの画像強調手法が用いられる。
【０００７】
第２の問題は、基本的特徴のセットから物体を構築する適切な方法の選択である。画像が２以上の物体を含む場合、または、物体が多数の紛らわしい物体（クラッタ）によって囲まれている場合、この問題は一層悪化する。
【０００８】
画像セグメント化に関連する重要な問題は、良好なセグメント化アルゴリズムを選択し、それらの性能を測定し、情景解析システムに及ぼす影響を理解することである。
【０００９】
従来技術において、物体のセグメント化及び物体認識の問題を解決する種々の手法が存在する。本発明の理念を理解するため、それらの基本的な特徴のいくつかを簡単に述べる。
【００１０】
１．ヒストグラムしきい値法
屋外のカラー画像のセグメント化に有利に適用できるしきい値手法が提案されている（非特許文献１参照）。これは、カラーヒストグラム及び色相ヒストグラムを構築することに基づくものである。映像はその最も明瞭に分離した頂点でしきい値化される。すべてのヒストグラム内に分離した頂点が観察されなくなるまで、画像のセグメント化された部分の各々に対してプロセスが繰り返される。
【００１１】
非特許文献２には、一次元のグレイ・レベル情報を使用するよりも、画像の二次元ヒストグラムの使用がセグメント化のためのしきい値の発見に役立つことが提案されている。二次元ヒストグラムにおいては、点ピクセルに関する情報が、それらピクセルの近傍の局所グレイ・レベルの平均値と共に使用される。
【００１２】
２．エッジ・ベースのセグメント化
非特許文献３には、画像セグメント化のためにピクセル近傍の要素を使用する方法が記載されている。
【００１３】
非特許文献４には、境界解析を介して自然情景のセグメント化を実行するために使用される一組のアルゴリズムが開示されている。これらのアルゴリズムの目的は、情景内の物体の境界を正しく特定することである。
【００１４】
非特許文献５では、エッジ・ベースの画像セグメント化手法が用いられている。ここでは、非類似領域の混合を起こしうる小さいギャップのために、エッジ・ベースのセグメント化があまりうまくいかないことが示されている。
【００１５】
非特許文献６には、変分理論を使用して画像セグメント化を行う新しい適応型しきい値アルゴリズムが提案されている。
【００１６】
非特許文献７には、エッジ検出に基づいた画像処理の手法が記載されている。
【００１７】
上記手法の他に、ガボール関数（ＧＦ：Ｇａｂｏｒ　Ｆｕｎｃｔｉｏｎ）や他の同様のウエーブレットに基づく画像表現が、画像符号化及び画像圧縮、強調及び復元、またはテクスチャ解析などの多くのアプリケーションにおいて非常に有用であることが分かっている。さらに、ＧＦは単純な皮質セルの受容野に対して良好な近似を提供するので、マルチ・スケールのフィルタリング方式、例えば、視覚皮質における画像表現の現行モデルにおいて、頻繁に使用されている。しかし、ＧＦは直交関数ではなく、従って普通ではない二重基底関数に基づくので、古典的ガボール展開は計算処理コストがかかる。再構築は、反復型アルゴリズム、人工ニューラル・ネットワーク（ＡＮＮ）の使用、または大規模行列の逆変換を必要とする。これらの問題は、冗長なマルチ・スケールのフィルタリングの実装によって部分的に解決することができる。多くのウエーブレットの中には、（ガウス導関数、可変フィルタなどのような）異なる基本関数を使用する多解像度ピラミッド及び関連手法がある。
【００１８】
ＧＦに基づく手法には以下のような利点がある。
【００１９】
・空間領域及び周波数領域における結合局所化（ｊｏｉｎｔ　ｌｏｃａｌｉｚａｔｉｏｎ）の最大化
・任意のバンド幅を使用して空間的位置、周波数及び方向の連続体に対してＧＦを自由に調整することができる柔軟性
・ＧＦが、２つの分離可能なフィルタの和として正確に表現可能であるという方向選択性を持つ唯一の生物学的にもっともらしいフィルタであるという事実
・多種のアプリケーションにおける良好な性能
これらすべての理由により、ガボール関数は、画像解析及びマシン・ビジョン（ｍａｃｈｉｎｅ　ｖｉｓｉｏｎ）という多目的の環境における初期の処理タスクの実行に特に適している。
【００２０】
非特許文献８には、非特定の物体を認識するための画像セグメント化を提供する注意制御システムが開示されている。Ｃ．　Ｓｈａｎｎｏｎによって導入された情報理論に基づいて、デジタル画像の局所情報の内容が推定される。これによって、画像部分の期待情報内容に関する尺度として画像エントロピーが使用される。この点について、マスク・サイズ、サブサンプリング因子、エントロピーしきい値及び形態的演算子（ｍｏｒｐｈｏｌｏｇｉｃａｌ　ｏｐｅｒａｔｏｒｓ）の特定パラメータ等の種々のパラメータにより、特定の問題及び特定のタスクに適した画像処理が可能になる。
【００２１】
【非特許文献１】
Ｒ．　Ｂ．　Ｏｈｌａｎｄｅｒ著、「Ａｎａｌｙｓｉｓ　ｏｆ　Ｎａｔｕｒａｌ　Ｓｃｅｎｅｓ」、ＰｈＤ　Ｔｈｅｓｉｓ，　Ｃａｒｎｅｇｉｅ　Ｉｎｓｔｉｔｕｔｅ　ｏｆ　Ｔｅｃｈｎｏｌｏｇｙ，　Ｄｅｐｔ．　ｏｆ　Ｃｏｍｐｕｔｅｒ　Ｓｃｉｅｎｃｅ，　Ｃａｒｎｅｇｉｅ−Ｍｅｌｌｏｎ　Ｕｎｉｖｅｒｓｉｔｙ，　Ｐｉｔｔｓｂｕｒｇｈ，　ＰＡ，　１９７５
【００２２】
【非特許文献２】
Ｌ．　Ｌｉ，　Ｊ．　Ｇｏｎｇ及びＷ．　Ｃｈｅｎ著、「Ｇｒａｙ−Ｌｅｖｅｌ　Ｉｍａｇｅ　Ｔｈｒｅｓｈｏｌｄｉｎｇ　Ｂａｓｅｄ　ｏｎ　ａ　Ｆｉｓｈｅｒ　Ｌｉｎｅａｒ　Ｐｒｏｊｅｃｔｉｏｎ　ｏｆ　ａ　Ｔｗｏ−Ｄｉｍｅｎｓｉｏｎａｌ　Ｈｉｓｔｏｇｒａｍ」、Ｐａｔｔｅｒｎ　Ｒｅｃｏｇｎｉｔｉｏｎ，　ｖｏｌ．　３０，　Ｎｏ．　５，　ｐｐ．　７４３−７４９，　１９９７
【００２３】
【非特許文献３】
Ｎ．　Ａｈｕｊａ，　Ａ．　Ｒｏｓｅｎｆｅｌｄ及びＲ．Ｍ．　Ｈａｒａｌｉｃｋ著、「Ｎｅｉｇｈｂｏｒ　Ｇｒａｙ　Ｌｅｖｅｌｓ　ａｓ　Ｆｅａｔｕｒｅｓ　ｉｎ　Ｐｉｘｅｌ　Ｃｌａｓｓｉｆｉｃａｔｉｏｎ」、Ｐａｔｔｅｒｎ　Ｒｅｃｏｇｎｉｔｉｏｎ，　ｖｏｌ．　１２，　ｐｐ．２５１−２６０，　１９８０
【００２４】
【非特許文献４】
Ｊ．Ｍ．　Ｐｒａｇｅｒ著、「Ｅｘｔｒａｃｔｉｎｇ　ａｎｄ　Ｌａｂｅｌｉｎｇ　Ｂｏｕｎｄａｒｙ　Ｓｅｇｍｅｎｔｓ　ｉｎ　Ｎａｔｕｒａｌ　Ｓｃｅｎｅｓ」、ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｐａｔｔｅｒｎ　Ａｎａｌｙｓｉｓ　ａｎｄ　Ｍａｃｈｉｎｅ　Ｉｎｔｅｌｌｉｇｅｎｃｅ，　ｖｏｌ．　２，　Ｎｏ．　１，　ｐｐ．１６−２７，　１９８０
【００２５】
【非特許文献５】
Ｗ．Ａ．　Ｐｅｒｋｉｎｓ著、「Ａｒｅａ　Ｓｅｇｍｅｎｔａｔｉｏｎ　ｏｆ　Ｉｍａｇｅｓ　ｕｓｉｎｇ　Ｅｄｇｅ　Ｐｏｉｎｔｓ」、ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｐａｔｔｅｒｎ　Ｒｅｃｏｇｎｉｔｉｏｎ　ａｎｄ　Ｍａｃｈｉｎｅ　Ｉｎｔｅｌｌｉｇｅｎｃｅ，　ｖｏｌ．　２，　Ｎｏ．　１，　ｐｐ．　８−１５，　１９８０
【００２６】
【非特許文献６】
Ｆ．Ｈ．Ｙ．　Ｃｈａｎ，　Ｆ．Ｋ．　Ｌａｍ及びＨ．　Ｚｈｕ著、「Ａｄａｐｔｉｖｅ　Ｔｈｒｅｓｈｏｌｄｉｎｇ　ｂｙ　Ｖａｒｉａｔｉｏｎａｌ　Ｍｅｔｈｏｄ」、ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｉｍａｇｅ　Ｐｒｏｃｅｓｓｉｎｇ，　ｖｏｌ．　２，　Ｎｏ．　３，　ｐｐ．１６８−１７４，　１９９８
【００２７】
【非特許文献７】
Ｃ．　Ｇｏｅｒｉｃｋ及びＭ．　Ｂｒａｕｃｋｍａｎｎ著、「Ｌｏｃａｌ　Ｏｒｉｅｎｔａｔｉｏｎ　Ｃｏｄｉｎｇ　ａｎｄ　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋ　Ｃｌａｓｓｉｆｉｅｒｓ　ｗｉｔｈ　ａｎ　Ａｐｐｌｉｃａｔｉｏｎ　ｔｏ　Ｒｅａｌ−Ｔｉｍｅ　Ｃａｒ　Ｄｅｔｅｃｔｉｏｎ　ａｎｄ　Ｔｒａｃｋｉｎｇ」、Ｗ．Ｇ．　Ｋｒｏｐａｔｓｃｈ　ａｎｄ　Ｈ．　Ｂｉｓｃｈｏｆ　［ｅｄｉｔｏｒｓ］，　Ｍｕｓｔｅｒｅｒｋｅｎｎｕｎｇ　１９９４，　Ｐｒｏｃｅｅｄｉｎｇｓ　ｏｆ　ｔｈｅ　１６ｔｈ　Ｓｙｍｐｏｓｉｕｍ　ｏｆ　ｔｈｅ　ＤＡＧＭ　ａｎｄ　ｔｈｅ　１８ｔｈ　Ｗｏｒｋｓｈｏｐ　ｏｆ　ｔｈｅ　ＯＡＧＭ，　Ｓｐｒｉｎｇｅｒ−Ｖｅｒｌａｇ，　１９９４
【００２８】
【非特許文献８】
Ｔ．　Ｋａｌｉｎｋｅ及びＷ．　ｖｏｎ　Ｓｅｅｌｅｎ著、「Ｅｎｔｒｏｐｉｅ　ａｌｓ　Ｍａｓｓ　ｄｅｓ　ｌｏｋａｌｅｎ　Ｉｎｆｏｒｍａｔｉｏｎｓｇｅｈａｌｔｓ　ｉｎ　Ｂｉｌｄｅｒｎ　ｚｕｒ　Ｒｅａｌｉｓｉｅｒｕｎｇ　ｅｉｎｅｒ　Ａｕｆｍｅｒｋｓａｍｋｅｉｔｓｓｔｅｕｅｒｕｎｇ」、Ｉｎｔｅｒｎａｌ　Ｒｅｐｏｒｔ　９６−０７，　Ｉｎｓｔｉｔｕｔ　ｆｕｒ　Ｎｅｕｒｏｉｎｆｏｒｍａｔｉｋ　ｄｅｒ　Ｒｕｈｒ−Ｕｎｉｖｅｒｓｉｔａｔ　Ｂｏｃｈｕｍ，　１９９６，　ｐｕｂｌｉｓｈｅｄ　ｉｎ　Ｍｕｓｔｅｒｅｒｋｅｎｎｕｎｇ　１９９６，　ｐｐ．６２７−６３４，　Ｓｐｒｉｎｇｅｒ−Ｖｅｒｌａｇ，　Ｂｅｒｌｉｎ／Ｈｅｉｄｅｌｂｅｒｇ，　１９９６
【００２９】
【発明が解決しようとする課題】
（例えばエッジ検出に基づく）最適な物体認識システムを構築する多くの試みにもかかわらず、既知のアルゴリズムは、線分とエッジが非常に近接及び／または交差している位置における物体セグメント化に問題のあることが多いことが分かっている。従来のエッジ検出アルゴリズムは、非常に小さい（単純または複雑に連結する）複数の画像パッチを認識できるにすぎないので、例えば交差する線分によって生じる局所的なあいまいさを解決することは不可能である。従って、基となる認識システムは、入り乱れた背景（ｃｌｕｔｔｅｒｅｄ　ｂａｃｋｇｒｏｕｎｄ）上の多数の小さな物体と、異なる部品から成る１つの大きな物体とを区別することができない。このため、認識するべき物体の輪郭に関するグローバルな情報が必要となる。一般に、これらの問題は、多くの異なる物体を含む画像の場合、または入り乱れた背景上に物体がある場合に生じる。
【００３０】
別の問題は、これらの物体認識システムは、使用した画像または画像ファミリーに対して調整が必要であることである。さらに、線分及びエッジ（事象）を同時に検出し分類することができるアルゴリズムはいまだにほとんど存在しない。
【００３１】
上述の説明に鑑みて、本発明は、後続のエッジ検出処理をより効率的にする手法を提供することを目的とする。
【００３２】
【課題を解決するための手段】
本発明の第１の側面によると、後続のパターン認識処理のためのデジタル画像を作成する方法が提供される。この方法は、デジタル画像内の顕著な物体を強調する。デジタル画像の各ピクセルの値をピクセルの定義された近傍における当該ピクセルのグレイ・レベルの標準偏差値で置き換えることによって画像の局所的標準偏差が評価され、マスク画像が生成される。次に、元のデジタル画像を生成されたマスク画像と組み合わせる。
【００３３】
元の画像をマスク画像と組み合わせるとき、マスク画像の加重値は調整可能である。
【００３４】
マスク画像の加重値は、調整可能な加重マスクとマスク画像を組み合わせることによって調整することができる。
【００３５】
元のデジタル画像の一部分だけをマスク画像と組み合わせるように加重マスクを設計することもできる。
【００３６】
本発明の別の側面によると、後続のパターン認識のためのデジタル画像を作成する方法が提供される。この方法はデジタル画像内の顕著な物体を強調する。これによって、エッジのない面に属するデジタル画像のピクセルが画像の局所的標準偏差を評価することによって検出される。
【００３７】
デジタル画像の各ピクセルの値をピクセルの定義された近傍における当該ピクセルのグレイ・レベルの標準偏差値で置き換えることによって画像の局所的標準偏差が評価され、マスク画像を生成することができる。次に、元のデジタル画像がマスク画像と組み合わされ、組み合わせ画像が生成される。最後に、この組み合わせ画像に対してエッジ検出が実行される。
【００３８】
元のデジタル画像をマスク画像と組み合わせるステップは、１つの面に属すると評価されたデジタル画像の領域内でエッジ検出を禁止するように実行することができる。
【００３９】
元のデジタル画像をマスク画像と組み合わせるステップは、１つの面に属していないと評価されたデジタル画像の領域内でエッジ検出を禁止するように実行することもできる。
【００４０】
エッジ検出は、組み合わせ画像と配向ガボール・パッチの畳み込みによって実行することができる。
【００４１】
局所的標準偏差を評価するステップは、２つの直交直角方向において実行して、１つの面領域の境界の主方向を示す標準偏差ベクトルを定義することができる。
【００４２】
主方向の複数ピクセルの値を強調する一方、主方向から離れたピクセルの値を抑制することができる。
【００４３】
局所的標準偏差を評価するステップのためのしきい値は調整可能である。
【００４４】
局所的標準偏差を評価するステップの前に、元のデジタル画像をローパス・フィルタリングすることができる。
【００４５】
前記画像の平均グレイ・レベルに応じたしきい値関数をローパス・フィルタリングされたデジタル画像やマスク画像に適用して、コントラストを強調することができる。
【００４６】
本発明のさらに別の側面によると、コンピュータ装置上で実行されるとき上述した方法を実施するコンピュータ・ソフトウェア・プログラム、及びこのコンピュータ・ソフトウェア・プログラムが記録された記録媒体が提供される。
【００４７】
最後に、本発明は、上述の方法を実施する手段を提供するシステムを提案する。
【００４８】
【発明の実施の形態】
本発明は、異なる空間スケール及び異なる画像特徴からの情報を、それらの結合様相（ａｐｐｅａｒａｎｃｅ）に対する統計的依存性を利用することによって、同時に評価するように特に最適化される。そのような依存性は局所エッジ検出プロセスを建設的に誘導するため適用される。
【００４９】
本発明の主要な概念に従って提案される手法は、後続のパターン認識プロセスＳ６のためのデジタル画像１０２を作成する。この方法は、デジタル画像１０２における顕著な（ｐｒｏｍｉｎｅｎｔ）物体を強調する。
【００５０】
以下の説明では、「エッジ」、「エッジのない（ｅｄｇｅ−ｆｒｅｅ）」などの用語は、本発明に従ったプロセスによって実行された「解釈（分析）」の意味に常に理解されなければならないことに注意されたい。
【００５１】
本手法は、基本的に、図１ａ、１ｂに示されているＳ１〜Ｓ６の６つのステップに分割することができる。以下、これらのステップの詳細を説明する。図２ａ、２ｂに示されている手順のハードウェア実施形態のブロック図についても説明する。各図中の参照記号で示されている記号の意味は、「符号の説明」に記載してある。
【００５２】
第１のステップＳ１において、認識されるべきデジタル入力画像Ａ（ｉ，ｊ）が、標準偏差σ_１を有するガウシアン・カーネルｈ（ｉ，ｊ）と畳み込みされる。畳み込みは、図２ａ及び図２ｂにおけるローパス・フィルタ２０２によって実現され、上記入力画像Ａ（ｉ，ｊ）を平滑化することによってノイズ及び微細な部分を減少させる。これによって、上記ピクセルのインデックスｉ及びｊは、それぞれ画像のｘ軸及びｙ軸方向を指すこととなる。
【００５３】
次のステップＳ２は、ローパス・フィルタリングされた画像のコントラストを強調する。シグモイドしきい値関数Θ_１（・）を適用することによって全体の構造が復元され、次式が成立する。
【００５４】
【数１】

ここで、アスタリスク（＊）は畳み込み演算を示し、シグモイドしきい値関数Θ_１（・）は、例えば、次式によって表すことができる。
【００５５】
【数２】

ここで、μ_１はしきい値関数Θ_１（・）の勾配係数であり、Ｎは画像におけるピクセルの数を表し、θ_１は適用されるしきい値を表す。
【００５６】
前記しきい値θ_１は、ローパス・フィルタリングされた入力画像Ｂ（ｉ，ｊ）の平均グレイ・レベル＜Ｂ＞に従って自動的に選択される。従って、このステップの自動的な局所較正（自動較正）が実現可能である。
【００５７】
次のステップＳ３において、同じエッジなし領域に属しているデジタル画像のピクセルが検出される。従って、本発明に従ったプロセスによって実施される「解釈」に従ってエッジの存在を示していない領域によって１つの面が定義される。従って、画像は、エッジによってではなく、隣接している（エッジなしの）面を定義することによって、分離される。
【００５８】
次式によって、観察されたピクセルによって記述される点（ｉ，ｊ）の局所的（環状の）近傍γ（ｉ，ｊ）の範囲内のグレイ・レベルの局所標準偏差σ_Ｃ， _γ _{（ｉ，ｊ）}を計算することによって、同じエッジなし領域に属しているピクセルの検出を実行することができる。
【００５９】
【数３】

そして、ステップＳ１及びステップＳ２の適用の後に取得された結果Ｃ（ｉ，ｊ）を使用して、次式が得られる。
【００６０】
【数４】

ここで、
γ（ｉ，ｊ）は、観察されたピクセルによって記述される点（ｉ，ｊ）の局所的（環状の）近傍を表し、
＜Ｃ＞_γ _{（ｉ，ｊ）}は、ノイズ・フィルタリングを適用した（Ｓ１）後の点（ｉ，ｊ）の周囲の環境γ（ｉ，ｊ）の範囲内の画像Ｃ（ｉ，ｊ）のグレイ・レベルの局所的平均を表し、
σ_Ｃ， _γ _{（ｉ，ｊ）}は、環境γ（ｉ，ｊ）の範囲内の画像Ｃ（ｉ，ｊ）のグレイ・レベルの局所的標準偏差を表し、
Ｐは、環境γ（ｉ，ｊ）におけるピクセルの数である。
【００６１】
この目的のため、各ピクセルの値は、それぞれのピクセルによって記述される点（ｉ，ｊ）の周囲の近傍γの範囲内のグレイ・レベルの標準偏差値σ_Ｃ， _γ _{（ｉ，ｊ）}によって置き換えられ、この結果、画像Ｄ（ｉ，ｊ）が得られる。環状の環境γのサイズと共にガウシアン・ローパス・フィルタ２０２の標準偏差σ_１（幅）が面検出ステップＳ３の空間スケールを定義する。
【００６２】
特定の実施形態によれば、局所的標準偏差は、二次元の標準偏差ベクトルを生成するため、２つの直交方向において計算することができる。こうして、標準偏差ベクトルが、画像の顕著な物体の輪郭の支配（主）方向を表す。従って、そのような主方向が強調される一方、副次的方向が抑制されるならば、物体の輪郭をさらに強調することができる。
【００６３】
次のステップＳ４において、非常に急な勾配μ_２を持つ別のシグモイドしきい値関数Θ_２（・）を使用して、それぞれの面に属していないピクセルからそれぞれの面に属しているピクセルを分離することによって、コントラストを強化することができる。
【００６４】
【数５】

これによって、それぞれの面内に存在するピクセルにゼロに近いか等しい値が割り当てられる。
【００６５】
シグモイドしきい値関数Θ_２（・）は、次式によって表すことができる。
【００６６】
【数６】

ここで、μ_２はしきい値関数Θ_２（・）の勾配係数であり、Ｎは画像中のピクセル数を表し、θ_２は適用されるしきい値を表す。
【００６７】
前記しきい値θ_２は、上述のように定義された画像Ｄ（ｉ，ｊ）の平均グレイ・レベル＜Ｄ＞に従って決定される。これによって、このステップＳ４の自動的な局所較正（自動較正）が達成される。
【００６８】
次に、ステップＳ５ａまたはステップＳ５ｂにおいて、元の画像が前のステップの結果である画像Ｅ（ｉ，ｊ）と組み合わせられる（「マスキング」される）。このマスキングは次式を適用することによって実行される。
【００６９】
【数７】

ここで、合成演算子（〇）は、元の画像１０２と面の画像１０６のピクセル単位の乗算Ｓ５ａ（または加算Ｓ５ｂ）によって置き換えることができる。このピクセル単位の乗算または加算は、演算子「×」（または「＋」）によってそれぞれ表されている。
【００７０】
このステップにおいて、面画像１０６の加重係数λが、面画像１０６を調整可能な加重マスクと組み合わせることによって調整される。加重係数λは、面検出Ｓ３が後続のエッジ検出Ｓ６をどの程度強力に決定するかを制御する。加重係数λは、画像１０２全体に対して一様に、または、対象とする特定の領域について個別に、選択することができる。
【００７１】
別の選択肢として、元のデジタル画像１０２の一部分だけが面画像１０６と組み合わせられるように加重マスクを設計することもできる。
【００７２】
最後のステップＳ６において、画像Ｆ（ｉ，ｊ）に対してエッジ検出が実行される。同一のエッジなし面に属していると見なされる領域におけるエッジ検出が禁止され、従ってエッジ検出はエッジを含む領域に限定されるので、エッジ検出の効率が向上する。精細エッジ検出Ｓ６は、全体的な輪郭が存在する画像１０２の部分に対してのみ適用される。
【００７３】
代替的に、エッジを含む領域におけるエッジ検出を禁止して、画像内の顕著な物体を抑制することもできる点に注意されたい。これは、ステップＳ５ａまたはステップＳ５ｂにおいて、それぞれ反転マスキングを使用することによって実施することができる。
【００７４】
エッジ検出は、例えば、配向ガボール・パッチを用いた輪郭画像Ｆ（ｉ，ｊ）の畳み込みによって実行することができる。ガボール・カーネルの標準偏差σ_２（幅）は、例えば３ｘ３ピクセルのサイズのように、可能な限り小さくなければならない。対照的に、ガウシアン・カーネルの標準偏差σ_１（幅）は、例えば１２ｘ１２ピクセルのサイズのように、比較的大きくなければならない。この点について、局所的標準偏差σ_Ｃ， _γ _{（ｉ，ｊ）}の推定のために必要とされる近傍γのサイズは、σ_１とσ_２の間で選択されなければならない点に注意されたい。本発明の一実施形態では、直径が５ピクセルの環状パッチが使用される。
【００７５】
図１ａ及び図１ｂに示した動作を実行するプログラムはコンピュータ読取可能記憶媒体に記憶することができ、この記憶されたプログラムは、物体検出を実行するためにコンピュータ・システム上で実行可能である。　コンピュータ読取可能記憶媒体は、プログラムを一時的に記憶する装置であっても良く、例えば、ネットワーク（例えばインターネット）または通信回線（例えば電話線）を経由して送信されるプログラムを受け取るサーバまたはクライアントの機能を果たすコンピュータ・システムにおける揮発性メモリ（すなわちＲＡＭ）を含む。本発明は、図２ａ及び図２ｂに示すハードウェアで実施することができる。
【００７６】
本発明の利点は次のようにまとめられる。
・本発明に従った概念は、異なるスケールで並列に動作することができる。
・粗いスケールにおいては、画像は類似の同質の領域にセグメント化され、これらの領域は面と解釈される。
・これは、局所的エッジ検出とは無関係に、全体の物体境界を効率的に選択する。
・局所的なあいまいさは、全体の面と局所的エッジ情報を統合することによって解消される。
・ノイズ及び小さな細部は抑制され、画像認識のロバスト性をもたらす。
・本発明に従った手法のパラメータは、画像の平均グレイ・レベルに従って自動的に調整される。
【図面の簡単な説明】
【図１ａ】デジタル画像によって表された顕著な物体の面及びエッジの検出に使用される物体認識システムをサポートするために適用可能な、本発明に従った物体検出アルゴリズムの機能の概要を示すチャートである。
【図１ｂ】デジタル画像によって表された顕著な物体の面及びエッジの検出に使用される物体認識システムをサポートするために適用可能な、本発明に従った物体検出アルゴリズムの機能の概要を示すチャートである。
【図２ａ】物体認識システムのハードウェア実施形態のブロック図である。
【図２ｂ】物体認識システムのハードウェア実施形態のブロック図である。
【符号の説明】
１００ａ　本発明に従った物体検出アルゴリズムの機能的な概要を示す第１のフローチャート。このアルゴリズムは、入力画像１０２とその表面画像１０６をピクセル単位で乗算（×）することによるマスキング（Ｓ５ａ）に基づいて、デジタル化された画像により表された顕著な画像の表面及びエッジを検出するために使用される物体検出システムをサポートするために適用することができる。
１００ｂ　本発明に従った物体検出アルゴリズムの機能的な概要を示す第２のフローチャート。このアルゴリズムは、入力画像１０２とその表面画像１０６をピクセル単位で加算（＋）することによるマスキング（Ｓ５ｂ）に基づいて、デジタル化された画像により表された顕著な画像の表面及びエッジを検出するために使用される物体検出システムをサポートするために適用することができる。
１０２　２つのカメラ・アイを備えたアンドロイドとして機能するプロトタイプのロボットの人工的な頭部を表す元の入力画像Ａ（ｉ，ｊ）。
１０４　元の入力画像１０２とガウシアン・カーネルｈ（ｉ，ｊ）の畳み込みを実行してノイズの影響（Ｓ１）を低減し、さらに第１のコントラスト強化（Ｓ２）をした後に得られる、ローパス・フィルタリングされた入力画像Ｃ（ｉ，ｊ）。
１０６　ローパス・フィルタリングされた入力画像の局所偏差評価（Ｓ３）及び第２のコントラスト強化（Ｓ４）に基づいて表面検出を適用した後に得られる、粗い物体輪郭を有する表面画像Ｅ（ｉ，ｊ）。ここで、検出された単一のまたは複数の接続された領域に属するピクセルは黒にされており、検出された表面の輪郭は白のままである。
１０８　表面画像１０６と元の入力画像１０２のピクセル単位での加算（＋）または乗算（×）を適用することによって、表面画像１０６のマスキング（Ｓ５）を適用した後に得られる、精細な物体輪郭を有する輪郭画像Ｆ（ｉ，ｊ）。
１１０ａ　輪郭画像１０８に対して水平方向に向いた線分についてエッジ（方向）検出（Ｓ６）を適用した後の第１の結果画像Ｆ（ｉ，ｊ）。
１１０ｂ、１１０ｄ　輪郭画像１０８に対して斜め方向に向いた線分についてエッジ（方向）検出（Ｓ６）を適用した後の第２及び第４の結果画像Ｆ（ｉ，ｊ）。
１１０ｃ　輪郭画像１０８に対して垂直方向に向いた線分について、エッジ（方向）検出を適用した後の第３の結果画像Ｆ（ｉ，ｊ）。
２００ａ　入力画像１０２とその表面画像１０６をピクセル単位で乗算（×）することによるマスキングに基づいた、物体検出システムのハードウェア実装形態の第１の簡潔なブロック図。
２００ｂ　入力画像１０２とその表面画像１０６をピクセル単位で加算（＋）することによるマスキングに基づいた、物体検出システムのハードウェア実装形態の第２の簡潔なブロック図。
２０２　平滑化及びノイズ低減用のローパス・フィルタ。
２０４　局所分散検出器（ｌｏｃａｌ−ｖａｒｉａｎｃｅ　ｄｅｔｅｃｔｏｒ）
２０４ａ　局所分散検出器２０４の局所平均検出器（ｌｏｃａｌ−ａｖｅｒａｇｅ　ｄｅｔｅｃｔｏｒ）
２０４ｂ　局所分散検出器２０４の乗算要素
２０４ｃ　局所分散検出器２０４の加算要素
２０４ｄ　前記入力画像１０４の１ピクセルを表す観察点（ｉ，ｊ）の周りの円形環境γ（ｉ，ｊ）におけるローパス・フィルタリングされた入力画像１０４の局所標準偏差を計算するための平方根計算ユニット。
２０５ａ　コントラスト強化のためにシグモイドしきい値関数Θ_１（・）を用いる第１のしきい値要素。
２０５ｂ　コントラスト強化のためにシグモイドしきい値関数Θ_２（・）を用いる第２のしきい値要素。
２０６　表面画像１０６に重み付け要素λを乗算するために使用される乗算要素。これは、表面検出（Ｓ３）が後続のエッジ検出を決定する強度を制御する。
２０６ａ　重み付けされた表面画像１０６で元の入力画像１０２をマスキングするために使用される乗算要素。
２０６ｂ　重み付けされた表面画像１０６で前記入力画像１０２をマスキングするために用いられる加算要素。
２０８　エッジ検出オペレータＤε（・）を用いるエッジ検出器。
Ｓ１　ステップ１：ローパス・フィルタとガウシアン・カーネルｈ（ｉ，ｊ）を用いたローパス・フィルタリング。
Ｓ２　ステップ２：第１のコントラスト強化
Ｓ３　ステップ３：局所分散ベースの表面検出
Ｓ４　ステップ４：第２のコントラスト強化
Ｓ５ａ　ステップ５ａ：表面画像１０６と元の入力画像１０２のピクセル単位の乗算（×）
Ｓ５ｂ　ステップ５ｂ：表面画像１０６と元の入力画像１０２のピクセル単位の加算（＋）
Ｓ６　ステップ６：エッジ（方向）検出

Claims

デジタル画像内の顕著な物体を強調して、後続のパターン認識処理のためのデジタル画像を作成する方法であって、
前記デジタル画像の各ピクセルの値をピクセルの定義された近傍における前記ピクセルのグレイ・レベルの標準偏差値で置き換えることによって画像の局所的標準偏差を評価して、マスク画像を生成するステップと、
元のデジタル画像を前記マスク画像と組み合わせるステップと、
を含むことを特徴とするデジタル画像作成方法。
元のデジタル画像をマスク画像と組み合わせる前記ステップにおいて、マスク画像の加重値が調整可能であることを特徴とする、請求項１に記載のデジタル画像作成方法。
前記マスク画像の加重値は、前記マスク画像を調整可能な加重マスクと組み合わせることによって調整されることを特徴とする、請求項２に記載のデジタル画像作成方法。
前記元のデジタル画像の一部分だけを前記マスク画像と組み合わせられるように前記加重マスクが設計されていることを特徴とする、請求項２または請求項３に記載のデジタル画像作成方法。
デジタル画像における顕著な物体を強調して、後続のパターン認識のためデジタル画像を作成する方法であって、
前記画像の局所的標準偏差を評価することによって、エッジのない面に属するデジタル画像のピクセルを検出するステップを含むことを特徴とする、デジタル画像作成方法。
デジタル画像内のエッジを検出する方法であって、
前記デジタル画像の各ピクセルの値をピクセルの定義された近傍における前記ピクセルのグレイ・レベルの標準偏差値で置き換えることによって画像の局所的標準偏差を評価して、マスク画像を生成するステップと、
元のデジタル画像を前記マスク画像と組み合わせて、組み合わせ画像を生成するステップと、
前記組み合わせ画像に対してエッジ検出を実行するステップと、
を含むことを特徴とする、デジタル画像のエッジ検出方法。
元のデジタル画像をマスク画像と組み合わせる前記ステップが、１つの面に属すると評価されたデジタル画像の領域内で前記エッジ検出が禁止されるように設計されることを特徴とする、請求項６に記載のエッジ検出方法。
元のデジタル画像をマスク画像と組み合わせる前記ステップが、１つの面に属していないと評価されたデジタル画像の領域内で前記エッジ検出が禁止されるように設計されることを特徴とする、請求項６に記載のエッジ検出方法。
前記エッジ検出が、前記組み合わせ画像と配向ガボール・パッチの畳み込みによって実行されることを特徴とする、請求項６乃至請求項８のいずれか１項に記載のエッジ検出方法。
局所的標準偏差を評価する前記ステップが２つの直交方向において実行され、１つの面領域の境界の主方向を示す標準偏差ベクトルを定義することを特徴とする、請求項１乃至請求項９のいずれか１項に記載の方法。
主方向のピクセルの値が強調され、主方向から離れたピクセルの値が抑制されることを特徴とする、請求項１０に記載の方法。
局所的標準偏差を評価する前記ステップのためのしきい値が調整可能であることを特徴とする、請求項１乃至請求項１１のいずれか１項に記載の方法。
局所的標準偏差を評価する前記ステップの前に、元のデジタル画像がローパス・フィルタリングされることを特徴とする、請求項１乃至請求項１２のいずれかに記載の方法。
前記画像の平均グレイ・レベルに応じたしきい値関数が、前記ローパス・フィルタリングされたデジタル画像及び／または前記マスク画像に適用されて、前記コントラストを強調することを特徴とする、請求項１乃至請求項１３のいずれか１項に記載の方法。
コンピュータ装置上で実行されるとき、請求項１乃至請求項１４のいずれか１項に記載の方法を実施することを特徴とするコンピュータ・ソフトウェア・プログラム。
請求項１５に記載のコンピュータ・ソフトウェア・プログラムを記録することを特徴とする記録媒体。
デジタル画像内の顕著な物体を強調して、後続のパターン認識のためのデジタル画像を作成するシステムであって、
前記デジタル画像の各ピクセルの値をピクセルの定義された近傍における前記ピクセルのグレイ・レベルの標準偏差値で置き換えることによって画像の局所的標準偏差を評価して、マスク画像を生成する手段と、
元のデジタル画像を前記マスク画像と組み合わせる手段と、
を含むことを特徴とするデジタル画像作成システム。
デジタル画像内の顕著な物体を強調して、後続のパターン認識のためのデジタル画像を作成するシステムであって、
前記画像の局所的標準偏差を評価することによってエッジのない面に属するデジタル画像のピクセルを検出する手段を備えることを特徴とするデジタル画像作成システム。
デジタル画像のエッジを検出するシステムであって、
デジタル画像の各ピクセルの値をピクセルの定義された近傍における前記ピクセルのグレイ・レベルの標準偏差値で置き換えることによって画像の局所的標準偏差を評価して、マスク画像を生成する手段と、
元のデジタル画像を前記マスク画像と組み合わせて、組み合わせ画像を生成する手段と、
前記組み合わせ画像に対してエッジを検出する手段と、
を備えることを特徴とするエッジ検出システム。
入力画像をガウシアン・カーネルでローパス・フィルタリングするステップと、
ローパス・フィルタリングされた画像のコントラストを強調するステップと、
前記デジタル画像の各ピクセルの値を対応するピクセルの定義された近傍における前記ピクセルのグレイ・レベルの標準偏差値によって置き換えることによって、局所的分散に基づいて画像の面を検出するステップと、
前記画像のコントラストを強調して強調された画像を取得するステップと、
元の画像を前記強調された画像と組み合わせて輪郭画像を取得するステップと、
前記輪郭画像の配向エッジを検出するステップと、
を含むことを特徴とする物体認識方法。
入力画像をガウシアン・カーネルでフィルタリングするローパス・フィルタと、
ローパス・フィルタリングされた画像のコントラストを強調する第１の強調セクションと、
前記デジタル画像の各ピクセルの値を対応するピクセルの定義された近傍における前記ピクセルのグレイ・レベルの標準偏差値によって置き換えることによって、局所的分散に基づいて画像の面を検出する第１の検出セクションと、
画像のコントラストを強調して強調された画像を取得する第２の増強セクションと、
元の画像を前記強調された画像と組み合わせて輪郭画像を取得する組み合わせセクションと、
前記輪郭画像の配向エッジを検出する第２の検出セクションと、
を備えることを特徴とする物体認識装置。