JPH0264783A - 形状認識方式 - Google Patents
形状認識方式Info
- Publication number
- JPH0264783A JPH0264783A JP1064967A JP6496789A JPH0264783A JP H0264783 A JPH0264783 A JP H0264783A JP 1064967 A JP1064967 A JP 1064967A JP 6496789 A JP6496789 A JP 6496789A JP H0264783 A JPH0264783 A JP H0264783A
- Authority
- JP
- Japan
- Prior art keywords
- image
- filter
- peaks
- laplacian
- shape
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 53
- 238000012545 processing Methods 0.000 claims description 9
- 238000003672 processing method Methods 0.000 claims description 6
- 238000013459 approach Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000006073 displacement reaction Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 101100117236 Drosophila melanogaster speck gene Proteins 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000012015 optical character recognition Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000004626 scanning electron microscopy Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
1権分立
本発明は、カメラ又はその他の手段によって得た画像に
おける形状を認識する為の画像処理方式に関するもので
ある。特に、本方式は、該形状の記述を形成する為に結
合させることの可能な画像内の形状のプリミティブの形
状要素を派生させることを可能とする。次いで、この記
述は、既知の形状のライブラリーをインデックス即ち索
引する為に使用することが可能である。
おける形状を認識する為の画像処理方式に関するもので
ある。特に、本方式は、該形状の記述を形成する為に結
合させることの可能な画像内の形状のプリミティブの形
状要素を派生させることを可能とする。次いで、この記
述は、既知の形状のライブラリーをインデックス即ち索
引する為に使用することが可能である。
災米韮1
画像処理における最も困難な問題の1つは、画像認識で
ある。画像認識は、例えば、光学的文字認識、品質管理
、遠隔検知、及びその他の多数の適用に対して、画像か
ら情報内容を注出する態様でカメラ又はその他の手段を
使用して得た画像を処理することを必要とする。自動化
した画像認識の為に多くの異なったアプローチが試みら
れている。
ある。画像認識は、例えば、光学的文字認識、品質管理
、遠隔検知、及びその他の多数の適用に対して、画像か
ら情報内容を注出する態様でカメラ又はその他の手段を
使用して得た画像を処理することを必要とする。自動化
した画像認識の為に多くの異なったアプローチが試みら
れている。
最も古いアプローチの1つは、統計的パターン認識であ
り、それは認識作業にとって関連性があると思われる幾
つかの測定値からベクトルを形成することを必要とする
。次いで、この多次元ベクトルの起工次元空間位置を、
既知の形状の大きな組に対する同様に発生されたベクト
ルの位置と比較し、且つその形状のカテゴリーが最も近
似しているかに基づいて統計的な決定を行う。このアプ
ローチは簡単であり且つ特別化したドメイン内において
良好に動作させることが可能である。主要な欠点として
は、それが不完全であるということである。ベクトル測
定がどのようなものであるべきかということに対しては
何等実際的な理論は存在しない。
り、それは認識作業にとって関連性があると思われる幾
つかの測定値からベクトルを形成することを必要とする
。次いで、この多次元ベクトルの起工次元空間位置を、
既知の形状の大きな組に対する同様に発生されたベクト
ルの位置と比較し、且つその形状のカテゴリーが最も近
似しているかに基づいて統計的な決定を行う。このアプ
ローチは簡単であり且つ特別化したドメイン内において
良好に動作させることが可能である。主要な欠点として
は、それが不完全であるということである。ベクトル測
定がどのようなものであるべきかということに対しては
何等実際的な理論は存在しない。
画像認識の別のアプローチとしてテンプレートマツチン
グと呼ばれる方法がある。このテンプレートマツチング
において、認識されるべき形状の各々の画像を格納し、
且つ各々を未知の画像形状と比較してどれが最も類似し
ているかを決定する。
グと呼ばれる方法がある。このテンプレートマツチング
において、認識されるべき形状の各々の画像を格納し、
且つ各々を未知の画像形状と比較してどれが最も類似し
ているかを決定する。
このアプローチは簡単であり且つある特別化した適用に
おいて使用するのに容易であるが、ドメインが拡張され
ると格納及びサーチ時間の両方において非常に高価とな
ることがある。更に、格納したテンプレートの静的特性
から別の制限が発生する。この方法の全体的な鋭敏性を
著しく減少させることなしに、形状定義においである種
の柔軟性を許容することは困難である。
おいて使用するのに容易であるが、ドメインが拡張され
ると格納及びサーチ時間の両方において非常に高価とな
ることがある。更に、格納したテンプレートの静的特性
から別の制限が発生する。この方法の全体的な鋭敏性を
著しく減少させることなしに、形状定義においである種
の柔軟性を許容することは困難である。
これらの弱点の幾つかを解消するこのテンプレートアプ
ローチの変形例においては、完全な形状ではなくよりプ
リミティブな形状成分に対してテンプレートを使用する
。例えば、種々のコーナー即ち角部やエツジ即ち端部に
対してのテンプレートを使用して成る形状の記述を構築
する。次いで、この記述を統計的なパターン認識方式へ
供給することが可能であるか、又はそれを使用して構造
的記述を構築することが可能である。
ローチの変形例においては、完全な形状ではなくよりプ
リミティブな形状成分に対してテンプレートを使用する
。例えば、種々のコーナー即ち角部やエツジ即ち端部に
対してのテンプレートを使用して成る形状の記述を構築
する。次いで、この記述を統計的なパターン認識方式へ
供給することが可能であるか、又はそれを使用して構造
的記述を構築することが可能である。
画像認識への第3のアプローチは、成る形状の幾何学的
構成の記述を構築し次いでその記述を既知の形状のカタ
ログへのインデックスとして使用することを試みんとし
ている。このアプローチは。
構成の記述を構築し次いでその記述を既知の形状のカタ
ログへのインデックスとして使用することを試みんとし
ている。このアプローチは。
ルックアップは全てを検査することを必要としないので
、既知の形状の非常に大きなデータベースを取り扱う可
能性を持っている。更に、サーチホーム(search
homes)として任意に微細の区別を行うことが可
能である。然°し乍ら、それを動作させる為には、項目
がそれらの記述から信頼性をもって見出すことが可能で
あるように形状カタログを組織することが必要である。
、既知の形状の非常に大きなデータベースを取り扱う可
能性を持っている。更に、サーチホーム(search
homes)として任意に微細の区別を行うことが可
能である。然°し乍ら、それを動作させる為には、項目
がそれらの記述から信頼性をもって見出すことが可能で
あるように形状カタログを組織することが必要である。
且−血
本発明は、以上の点に鑑みなされたものであって上述し
た如き従来技術の欠点を解消し、カメラその他の手段を
使用して得られた画像において形状を認識する方式を提
供することを目的とする。
た如き従来技術の欠点を解消し、カメラその他の手段を
使用して得られた画像において形状を認識する方式を提
供することを目的とする。
皇−双
本発明方式は、プリミティブ(初光特徴)の形状要素を
派生し該形状要素の記述を構築する為の基礎として使用
する手段を提供する。該記述が完成すると、それを既知
の形状のライブラリーへのインデックス即ち索引として
使用することが可能である。該記述が構築されるプリミ
ティブ要素は、任意の画像から派生させることが可能で
あり且つそれらが派生する構成された形状のスケールに
関しての明示的な制御を許容する。更に、該プリミティ
ブ要素は、幾何学的凸形状の位置へ信頼性をもって結合
されている。任意の与えられたスケールにおいて、要素
の幾何学的配列を、形状特性を記述する為の基礎として
使用することが可能であり、且つこれらの記述を、コン
ピュータ認識方式における既知の形状のカタログの調査
を駆動する為に使用することが可能である。
派生し該形状要素の記述を構築する為の基礎として使用
する手段を提供する。該記述が完成すると、それを既知
の形状のライブラリーへのインデックス即ち索引として
使用することが可能である。該記述が構築されるプリミ
ティブ要素は、任意の画像から派生させることが可能で
あり且つそれらが派生する構成された形状のスケールに
関しての明示的な制御を許容する。更に、該プリミティ
ブ要素は、幾何学的凸形状の位置へ信頼性をもって結合
されている。任意の与えられたスケールにおいて、要素
の幾何学的配列を、形状特性を記述する為の基礎として
使用することが可能であり、且つこれらの記述を、コン
ピュータ認識方式における既知の形状のカタログの調査
を駆動する為に使用することが可能である。
好適実施例において、はぼ帯域応答を持った空間的コン
ボリューション(畳み込み)フィルタをカメラ画像へ適
用し且つフィルタ出力の符号を使用して二進画像を発生
する。十分に粗いスケールにおいて、この画像は離隔し
た形状を単一の斑点形状(blob−shaped)領
域へ変化する傾向がある。
ボリューション(畳み込み)フィルタをカメラ画像へ適
用し且つフィルタ出力の符号を使用して二進画像を発生
する。十分に粗いスケールにおいて、この画像は離隔し
た形状を単一の斑点形状(blob−shaped)領
域へ変化する傾向がある。
次いで、二進化なしで同一のコンボリューションオペレ
ータ(演算子)を再度この二進画像へ適用し、且つ第2
コンボリューション画像の出力におけるピークを決定す
る。別の実施例においては、第2コンボリユーシヨンオ
ペレータは適用されず、且つ該ピークは第1コンボリユ
ーシヨンからの非二進化画像内において捜索される。い
ずれの場合においても、これらのピークは、形状記述を
構築する為のプリミティブ要素として使用される。この
タイプのプリミティブに基づいての形状記述の1例は、
コンボリューションオペレータの寸法が減少される場合
に、各ピークの運動方向に沿って大きなコンボリューシ
ョンオペレータで得られるピーク位置を記録する。
ータ(演算子)を再度この二進画像へ適用し、且つ第2
コンボリューション画像の出力におけるピークを決定す
る。別の実施例においては、第2コンボリユーシヨンオ
ペレータは適用されず、且つ該ピークは第1コンボリユ
ーシヨンからの非二進化画像内において捜索される。い
ずれの場合においても、これらのピークは、形状記述を
構築する為のプリミティブ要素として使用される。この
タイプのプリミティブに基づいての形状記述の1例は、
コンボリューションオペレータの寸法が減少される場合
に、各ピークの運動方向に沿って大きなコンボリューシ
ョンオペレータで得られるピーク位置を記録する。
尖胤件
以下、添付の図面を参考に2本発明の具体的実施の態様
に付いて詳細に説明する。
に付いて詳細に説明する。
(1)本方式の動作方法
形状認識は、その形状にとって重要性がより少ない側面
を無視乃至はデエンファシス(脱強調)する一方、関連
性のある画像形状の側面を補足する記述を構築する問題
として捕らえることが可能である。このことは、情報を
廃棄することを意味するものではない。むしろ、形状認
識の問題は、かなりの程度、どの情報が問題であり且つ
どの情報がその作業を混乱させるかを組織化する問題で
ある。例えば、物体内の質量の相対的幾何学的分布は、
大略、物体の形状の重要な決定因子である。
を無視乃至はデエンファシス(脱強調)する一方、関連
性のある画像形状の側面を補足する記述を構築する問題
として捕らえることが可能である。このことは、情報を
廃棄することを意味するものではない。むしろ、形状認
識の問題は、かなりの程度、どの情報が問題であり且つ
どの情報がその作業を混乱させるかを組織化する問題で
ある。例えば、物体内の質量の相対的幾何学的分布は、
大略、物体の形状の重要な決定因子である。
一方、該物体の寸法、位置、及び配向は、通常、その重
要性はより少ない。然し乍ら、カメラ等の検知装置から
の情報は、配置、質量分布、及び主体及び画像形成環境
の種々の特性を混乱させる。
要性はより少ない。然し乍ら、カメラ等の検知装置から
の情報は、配置、質量分布、及び主体及び画像形成環境
の種々の特性を混乱させる。
従って、物体の照明又は転位における変化が画素アレイ
の状態を完全に変化させるので、画像形状に関連するが
、フレームグラバ−(frame grabber)即
ち骨組み採取器のバッファにおける画素値は、形状カタ
ログへのインデックスとしては非常に有用なものではな
い。
の状態を完全に変化させるので、画像形状に関連するが
、フレームグラバ−(frame grabber)即
ち骨組み採取器のバッファにおける画素値は、形状カタ
ログへのインデックスとしては非常に有用なものではな
い。
認識問題に対する解決法は、最初に、記述において何を
表すか、即ちどの情報が関連性があるか及びその情報を
どのように組織化すべきであるかの決定を必要とする。
表すか、即ちどの情報が関連性があるか及びその情報を
どのように組織化すべきであるかの決定を必要とする。
例えば、人間の形状の記述は、多分、指の関節よりも手
足の数に一層多くのエンファシス即ち強調性を置くこと
となる。表現法を形式化させると、例えばカメラ画像等
の入手可能なセンサーデータからそれを派生させる為の
実際的な手段を開発せねばならない。表現法は通常反転
可能でない反転用画像投影を必要とするので、認識問題
を解決するがそれ自身派生可能ではない表@法を提案す
ることは容易である。以下に説明する形状認識の為に使
用されるプリミティブ要素は、計算可能性の拘束条件で
認識問題の必要性をバランスさせることを試みる。
足の数に一層多くのエンファシス即ち強調性を置くこと
となる。表現法を形式化させると、例えばカメラ画像等
の入手可能なセンサーデータからそれを派生させる為の
実際的な手段を開発せねばならない。表現法は通常反転
可能でない反転用画像投影を必要とするので、認識問題
を解決するがそれ自身派生可能ではない表@法を提案す
ることは容易である。以下に説明する形状認識の為に使
用されるプリミティブ要素は、計算可能性の拘束条件で
認識問題の必要性をバランスさせることを試みる。
本発明は、二次元形状の画像における安定な形状に関連
する位置を派生する為の方法を提供する。
する位置を派生する為の方法を提供する。
これらの形状関連位置は1本明細書においては、プリミ
ティブと言及される。これらのプリミティブ位置は、簡
単で、安定で、且つ敏感な形状記述を構築する為に使用
することが可能である。これらは、効果的な記述を単に
二三のプリミティブで構築することが可能であり、且つ
該記述は何等特定のタイプの形状に対して調整されない
という意味において簡単である。これらは、並進、回転
、及びスケーリング等の形状に関連しない多くの効果に
対して著しく変化することがないという意味において安
定である。これらは、また、異なったレベルのスケール
における変化に対して妥当な程度に安定でもある。例え
ば、1つの単語のイタリック表示及び非イタリック表示
の両方共がそれらの全体的形状に対する非常に類似した
記述となる。
ティブと言及される。これらのプリミティブ位置は、簡
単で、安定で、且つ敏感な形状記述を構築する為に使用
することが可能である。これらは、効果的な記述を単に
二三のプリミティブで構築することが可能であり、且つ
該記述は何等特定のタイプの形状に対して調整されない
という意味において簡単である。これらは、並進、回転
、及びスケーリング等の形状に関連しない多くの効果に
対して著しく変化することがないという意味において安
定である。これらは、また、異なったレベルのスケール
における変化に対して妥当な程度に安定でもある。例え
ば、1つの単語のイタリック表示及び非イタリック表示
の両方共がそれらの全体的形状に対する非常に類似した
記述となる。
感度は安定性の反対であるように見えるが、安定性及び
感度の両方が、異なったタイプの情報を係脱させる記述
によって達成される。従って、例えば、イタリック表示
の効果は、単語の全体的な形状の記述から分離される。
感度の両方が、異なったタイプの情報を係脱させる記述
によって達成される。従って、例えば、イタリック表示
の効果は、単語の全体的な形状の記述から分離される。
第2図は、本発明形状認識方式の動作の1例を与える為
の以下の説明において使用される1組(8個)のテスト
画像である。第2図は、プリント即ち印字した名前の灰
色レベル画像から構成されている。第2a図乃至第2d
図における画像は、異なったカメラの設定及び位置での
同一の主体(名刺)に関してのものである。例えば、画
像2dは、著しく焦点ずれを起している状態である。
の以下の説明において使用される1組(8個)のテスト
画像である。第2図は、プリント即ち印字した名前の灰
色レベル画像から構成されている。第2a図乃至第2d
図における画像は、異なったカメラの設定及び位置での
同一の主体(名刺)に関してのものである。例えば、画
像2dは、著しく焦点ずれを起している状態である。
第2e図乃至第2h図は、用紙上に何回か1つの名前を
印字したものであるが、各回において、異なったフォン
ト寸法又はスタイルが使用されている。印字した名前の
画像を使用して、この発明において使用される形状プリ
ミティブの挙動について説明する。然し乍ら1本発明の
技術はその他の主体乃至は物体に対しても適用可能であ
ることを理解すべきである。例えば、本方式は、プリン
ト回路基板、又はその他の多数の物体、又は画像の一部
に対して使用することが可能である。
印字したものであるが、各回において、異なったフォン
ト寸法又はスタイルが使用されている。印字した名前の
画像を使用して、この発明において使用される形状プリ
ミティブの挙動について説明する。然し乍ら1本発明の
技術はその他の主体乃至は物体に対しても適用可能であ
ることを理解すべきである。例えば、本方式は、プリン
ト回路基板、又はその他の多数の物体、又は画像の一部
に対して使用することが可能である。
第1図は、本発明プロセスの好適実施例を示したブロッ
ク図である。そこに示した如く、本発明方法は、第2図
に示した画像のいずれかの如き画像の中において形状を
認識すべき画像を採取するカメラ10で開始する。本発
明のその他の実施例においては、例えばその他のタイプ
のセンサーモジュールによって発生されるフローフィー
ルド画像の如きレンジ画像又はその他のタイプの画像を
使用する。レンジ画像において、イメージセンサからオ
フセットした走査レーザビームからのバララックス入力
を使用する。このことは、処理の為に異なった画像を提
供する。
ク図である。そこに示した如く、本発明方法は、第2図
に示した画像のいずれかの如き画像の中において形状を
認識すべき画像を採取するカメラ10で開始する。本発
明のその他の実施例においては、例えばその他のタイプ
のセンサーモジュールによって発生されるフローフィー
ルド画像の如きレンジ画像又はその他のタイプの画像を
使用する。レンジ画像において、イメージセンサからオ
フセットした走査レーザビームからのバララックス入力
を使用する。このことは、処理の為に異なった画像を提
供する。
第1図に示した如く、カメラ10からの強度画像(又は
レンジ又はその他の画像)がガウシアンコンボリューシ
ョンオペレータ12のラプラシアンへ供給される。この
ガウシアン(Gaussian)は二次元ガウシアンで
あって、低空間周波数の幾何学的構造を保存しながら高
空間周波数を減衰させる態様で該画像を低域濾波即ちロ
ーパスフィルタ動作すべく機能する。該ガウシアンの寸
法は、フィルタした画像内に構造が残るスケールを制御
する。
レンジ又はその他の画像)がガウシアンコンボリューシ
ョンオペレータ12のラプラシアンへ供給される。この
ガウシアン(Gaussian)は二次元ガウシアンで
あって、低空間周波数の幾何学的構造を保存しながら高
空間周波数を減衰させる態様で該画像を低域濾波即ちロ
ーパスフィルタ動作すべく機能する。該ガウシアンの寸
法は、フィルタした画像内に構造が残るスケールを制御
する。
該ラプラシアンオペレータは、輝度変化割合における局
所的最大値が発生するローパスフィルタした画像の位置
を検出する。これらの位置は、該ラプラシアンがゼロの
値を持つ場合の位置と密接に一致する。第1図に図示し
たその他の動作のみならず該コンボリューションを行う
為の特定の装置について以下に説明する。
所的最大値が発生するローパスフィルタした画像の位置
を検出する。これらの位置は、該ラプラシアンがゼロの
値を持つ場合の位置と密接に一致する。第1図に図示し
たその他の動作のみならず該コンボリューションを行う
為の特定の装置について以下に説明する。
低周波数構造を向上させる為に多数の異なったタイプの
フィルタを使用することが可能であるが、好適実施例に
おいては、ガウシアン(2a )コンポリューシ目ンオ
ペレータのラプラシアンを使用する。該ガウシアンは、
二次元ガウシアンであって、低空間周波数での幾何学的
構造を保存する一方高空間周波数を減衰する態様で該画
像をローパスフィルタすべく機能する。該ガウシアンの
寸法は、構造が該フィルタした画像内に残存するスケー
ルを制御する。該ラプラシアン項は、輝度変化割合にお
ける局所的最大値が発生するローパスフィルタした画像
内の位置を検出する。これらの位置は、該ラプラシアン
がゼロの値を持った位置と密接に一致する。以下の条件
は公知である。
フィルタを使用することが可能であるが、好適実施例に
おいては、ガウシアン(2a )コンポリューシ目ンオ
ペレータのラプラシアンを使用する。該ガウシアンは、
二次元ガウシアンであって、低空間周波数での幾何学的
構造を保存する一方高空間周波数を減衰する態様で該画
像をローパスフィルタすべく機能する。該ガウシアンの
寸法は、構造が該フィルタした画像内に残存するスケー
ルを制御する。該ラプラシアン項は、輝度変化割合にお
ける局所的最大値が発生するローパスフィルタした画像
内の位置を検出する。これらの位置は、該ラプラシアン
がゼロの値を持った位置と密接に一致する。以下の条件
は公知である。
(”a)*r=” (G傘■)ミG串 (2中I)尚、
2はラプラシアンであり、Gはガウシアンであり、■は
画像を表し、且つ傘はコンボリューション即ち畳み込み
を表している。従って、オペレータが適用される順番は
、結果に影響を与えることはない。
2はラプラシアンであり、Gはガウシアンであり、■は
画像を表し、且つ傘はコンボリューション即ち畳み込み
を表している。従って、オペレータが適用される順番は
、結果に影響を与えることはない。
ガウシアンコンボリューションオペレータのラプラシア
ンの適用及び結果の符号を取ることにより、第2図の画
像から第3図の画像が形成される。
ンの適用及び結果の符号を取ることにより、第2図の画
像から第3図の画像が形成される。
二進化ステップは、第1図におけるブロック16で表さ
れる。理解される如く、画像が一度スキャン即ち走査さ
れ且つデジタル化されると、このような動作は、適宜プ
ログラムされた従来の汎用デジタルコンピュータを使用
して実施することが可能である。このことが可能ではあ
るが、従来のデジタルコンピュータの使用は、不所望の
程度に遅く、単一の画像を処理するのに30秒以上のオ
ーダを必要とする。本方式のコマーシャルな適用は処理
を一層迅速に行うことを必要とするので、特別のアーキ
テクチャ−を持ったプロセサを使用して必要な計算を実
施する。このプロセサは、第9図乃至第13図に関連し
て以下に説明する。
れる。理解される如く、画像が一度スキャン即ち走査さ
れ且つデジタル化されると、このような動作は、適宜プ
ログラムされた従来の汎用デジタルコンピュータを使用
して実施することが可能である。このことが可能ではあ
るが、従来のデジタルコンピュータの使用は、不所望の
程度に遅く、単一の画像を処理するのに30秒以上のオ
ーダを必要とする。本方式のコマーシャルな適用は処理
を一層迅速に行うことを必要とするので、特別のアーキ
テクチャ−を持ったプロセサを使用して必要な計算を実
施する。このプロセサは、第9図乃至第13図に関連し
て以下に説明する。
画像のガウシアンコンボリューションのラプラシアンを
近似する為の幾つかのアプローチがある。
近似する為の幾つかのアプローチがある。
例えば、ガウシアンが、
1くσi/σe(2(2)
のような空間定数σC及びσiを持っており且つガウシ
アンが同一の体積を持つべく正規化されている場合の2
つのガウシアンコンボリューションの差異は、ガウシア
ンコンボリューションのラプラシアンの非常に近い近似
を与える。ガウシアンコンボリューションのラプラシア
ンは、また、バンドパスフィルタとして考えることも可
能である。
アンが同一の体積を持つべく正規化されている場合の2
つのガウシアンコンボリューションの差異は、ガウシア
ンコンボリューションのラプラシアンの非常に近い近似
を与える。ガウシアンコンボリューションのラプラシア
ンは、また、バンドパスフィルタとして考えることも可
能である。
何故ならば、該ガウシアンは、ローパス動作即ち低域通
過動作であり、且つ該ラプラシアンはバイパス動作即ち
高域通過動作だからである。いずれの動作も、中心周波
数のいずれの側においても非常にシャープなロールオフ
を有するものではない。
過動作であり、且つ該ラプラシアンはバイパス動作即ち
高域通過動作だからである。いずれの動作も、中心周波
数のいずれの側においても非常にシャープなロールオフ
を有するものではない。
上述した如き特性を有するどのようなフィルタも本発明
で使用するアプローチに対して適当なものである。重要
なことであるが、畳み込んだ信号の符号のみが使用され
、その際に該コンボリューション即ち畳み込みのゼロ公
差位置に依存する。
で使用するアプローチに対して適当なものである。重要
なことであるが、畳み込んだ信号の符号のみが使用され
、その際に該コンボリューション即ち畳み込みのゼロ公
差位置に依存する。
第3図は、該画像中の文字の寸法の程度の中心直径を有
する大きなコンボリューションオペレータに対して第2
図の画像のガウシアンコンボリューションのラプラシア
ンの符号(SLOG)表示を表している。第3図の画像
は、画像を得る為に使用したカメラからのビデオ信号を
5LOGコンポリユーシ目ンフイルタ12を介して通過
させ且つその結果を二進化させることによって得られる
。
する大きなコンボリューションオペレータに対して第2
図の画像のガウシアンコンボリューションのラプラシア
ンの符号(SLOG)表示を表している。第3図の画像
は、画像を得る為に使用したカメラからのビデオ信号を
5LOGコンポリユーシ目ンフイルタ12を介して通過
させ且つその結果を二進化させることによって得られる
。
このフィルタへのスケール入力は、コンボリューション
核の画素における直径を設定する。該フィルタの出力の
正又は負の符号のみを保持し、且つそれは、第3図に表
われる画像である。第3図のSLOG表示は、第2図の
例からの単語の全体的な包絡線形状を示す二進画像の注
出を可能とさせる。従って、符号パターンは画像表面上
のテキストの全体的位置へ結合されており、より微細な
特徴部に対してのいずれかの特定の位置に結合されるも
のではないので、画像中に存在するフリンジ効果、干渉
、ぼけ、al、ノイズ等の歪にによって影響を受けるこ
とはない。従って、この技術は、パターンの粗いスケー
ルの構造を捕捉し且つ高周波ノイズによって比較的影響
を受けることはない。
核の画素における直径を設定する。該フィルタの出力の
正又は負の符号のみを保持し、且つそれは、第3図に表
われる画像である。第3図のSLOG表示は、第2図の
例からの単語の全体的な包絡線形状を示す二進画像の注
出を可能とさせる。従って、符号パターンは画像表面上
のテキストの全体的位置へ結合されており、より微細な
特徴部に対してのいずれかの特定の位置に結合されるも
のではないので、画像中に存在するフリンジ効果、干渉
、ぼけ、al、ノイズ等の歪にによって影響を受けるこ
とはない。従って、この技術は、パターンの粗いスケー
ルの構造を捕捉し且つ高周波ノイズによって比較的影響
を受けることはない。
従って、それは、典型的には著しいノイズを示すカメラ
画像に理想的に適している。
画像に理想的に適している。
第2図又は第3図に示した形状を記述する為に使用する
ことが可能な多くの異なった技術がある。
ことが可能な多くの異なった技術がある。
いずれかの図の二進画像又はそのgt界の外形、又は外
形における屈曲点等の派生物を記述として使用すること
が可能である。然し乍ら、これらのアプローチは、複雑
且つ不安定となる傾向がある。
形における屈曲点等の派生物を記述として使用すること
が可能である。然し乍ら、これらのアプローチは、複雑
且つ不安定となる傾向がある。
更に、それらは、完全に離隔した形状を持つことに過度
に依存する。対照的に、本発明の形状特性は、形状の質
量が集中されている位置に焦点を置く。例えば、第3a
図乃至第3d図における中心形状の球根状端部又は第3
e図乃至第3h図における端部及び中間右側位置である
。これらの位置は、該図面において際だっており、且つ
それらの空間配列は、CathyをKeithから区I
llする為の形状コードを形成する為に使用することが
可能である。
に依存する。対照的に、本発明の形状特性は、形状の質
量が集中されている位置に焦点を置く。例えば、第3a
図乃至第3d図における中心形状の球根状端部又は第3
e図乃至第3h図における端部及び中間右側位置である
。これらの位置は、該図面において際だっており、且つ
それらの空間配列は、CathyをKeithから区I
llする為の形状コードを形成する為に使用することが
可能である。
更に詳細に説明すると、ここでの目的とするところは、
5LOG表示における質量集中の中心を識別することで
ある。これら中心は、例えば、第3図中の黒い部分の平
均密度が局所的に最大となる位置である。これは、スケ
ールの特定乃至は比特性である。成る点において中心と
なる与えられたスケールにおける平均質量密度を測定す
る1方法は、その位置を中心とする円形面積にわたって
の5LOG値の積分値を計算することである。その積分
値の大きさが、離隔物体の中心等の質量中心の幾つかの
種類を識別するが、矩形固体の中心等の一層緻密な濃度
の幾つかを識別するものではない。これら後者の質量集
中形態は、狭い範囲のスケールにわたって目立つより弱
い効果であり且つより強いグローバルな質量中心によっ
て支配されている。これらの−層弱いスケール特定質量
中心は、例えばガウシアンコンボリューションのラプラ
シン等の広帯域フィルタによって強調させることが可能
である。この選択性フィルタ動作は狭い帯域ピークの相
対的振幅を十分に急増させてそれらを検出可能とさせる
。
5LOG表示における質量集中の中心を識別することで
ある。これら中心は、例えば、第3図中の黒い部分の平
均密度が局所的に最大となる位置である。これは、スケ
ールの特定乃至は比特性である。成る点において中心と
なる与えられたスケールにおける平均質量密度を測定す
る1方法は、その位置を中心とする円形面積にわたって
の5LOG値の積分値を計算することである。その積分
値の大きさが、離隔物体の中心等の質量中心の幾つかの
種類を識別するが、矩形固体の中心等の一層緻密な濃度
の幾つかを識別するものではない。これら後者の質量集
中形態は、狭い範囲のスケールにわたって目立つより弱
い効果であり且つより強いグローバルな質量中心によっ
て支配されている。これらの−層弱いスケール特定質量
中心は、例えばガウシアンコンボリューションのラプラ
シン等の広帯域フィルタによって強調させることが可能
である。この選択性フィルタ動作は狭い帯域ピークの相
対的振幅を十分に急増させてそれらを検出可能とさせる
。
該コンボリューションフィルタは、中心取り巻き形状を
持っている。即ち、そのことは、二進画像の場合に、該
フィルタの中心領域の直径をマツチング即ち整合する直
径を持った円形状符号斑点において最大の応答を与える
ことを意味する。それは、また、少なくとも部分的に円
形円板に類似する領域の中心近傍で局所的最大値を発生
する。
持っている。即ち、そのことは、二進画像の場合に、該
フィルタの中心領域の直径をマツチング即ち整合する直
径を持った円形状符号斑点において最大の応答を与える
ことを意味する。それは、また、少なくとも部分的に円
形円板に類似する領域の中心近傍で局所的最大値を発生
する。
第4図は、第1図の計算を第2(e)図に適用した場合
の結果の大きさのプロットを示している。
の結果の大きさのプロットを示している。
入力画像におけるCathyという名前の各場合に4個
のピークがあることに注意されたい。
のピークがあることに注意されたい。
第3図のフィルタ形状において膨張部を識別する為の1
技術は、二進符号表示に対して更にガウシアン(LOG
)フィルタのラプラシアンを適用することである。この
ステップは、第1図において第2フイルタ16によって
表されている。フィルタ16は、パイプライン型での第
2フイルタか。
技術は、二進符号表示に対して更にガウシアン(LOG
)フィルタのラプラシアンを適用することである。この
ステップは、第1図において第2フイルタ16によって
表されている。フィルタ16は、パイプライン型での第
2フイルタか。
又はデータをフィルタ12へ再度導入するフィードバッ
クループのいずれかから構成することが可能である。使
用される特定のシステムは、画像が処理される速度に主
に依存する。該コンボリューションフィルタは、中心取
り巻き形状を持っており、それは、二進画像の場合に、
該フィルタの中心領域の直径とマツチングする直径を持
った円形形状で最大の応答を与える。該オペレータは、
また、少なくとも部分的に円形状の円板に類似する領域
の中心近傍で局所的な最大値を発生する。
クループのいずれかから構成することが可能である。使
用される特定のシステムは、画像が処理される速度に主
に依存する。該コンボリューションフィルタは、中心取
り巻き形状を持っており、それは、二進画像の場合に、
該フィルタの中心領域の直径とマツチングする直径を持
った円形形状で最大の応答を与える。該オペレータは、
また、少なくとも部分的に円形状の円板に類似する領域
の中心近傍で局所的な最大値を発生する。
第4図は、第3d図へガウシアンコンボリューションオ
ペレータのラプラシンを適用した結果のマグニチュード
即ち大きさのプロットである。第4図において、初期画
像における名前Ca t kh yの各場合に対して、
3個の強いピークと4番目のより弱いピークとが存在し
ている。
ペレータのラプラシンを適用した結果のマグニチュード
即ち大きさのプロットである。第4図において、初期画
像における名前Ca t kh yの各場合に対して、
3個の強いピークと4番目のより弱いピークとが存在し
ている。
LOGコンボリューション動作16をLOGコンボリュ
ーションオペレータの第1適用の符号結果へ適用すると
、結果的に得られる表面のピークが検出される。第5a
図乃至第5d図の各々は、第2図の画像の各々に対して
の対応するLOGSLOGピークのみならず、5個の漸
進的により微細なスケールでの5LOG表示のオーバー
レイを示している。本方法により見出されたピークは、
5LOG表示上にオーバーレイ即ち重畳させた小さな円
として示されている。第5図において、各形状に対して
識別されるピーク位置は、該形状が明確な端部、屈曲部
、又は接続部を持つ位置において発生する傾向がある。
ーションオペレータの第1適用の符号結果へ適用すると
、結果的に得られる表面のピークが検出される。第5a
図乃至第5d図の各々は、第2図の画像の各々に対して
の対応するLOGSLOGピークのみならず、5個の漸
進的により微細なスケールでの5LOG表示のオーバー
レイを示している。本方法により見出されたピークは、
5LOG表示上にオーバーレイ即ち重畳させた小さな円
として示されている。第5図において、各形状に対して
識別されるピーク位置は、該形状が明確な端部、屈曲部
、又は接続部を持つ位置において発生する傾向がある。
このことは、第5a図乃至第5d図の右側端部に沿って
の微細スケール図面において特に明らかである。第6図
は、第2e図乃至第2h図の画像に関しての同一の処理
の効果を図示している。
の微細スケール図面において特に明らかである。第6図
は、第2e図乃至第2h図の画像に関しての同一の処理
の効果を図示している。
ピークが発見されると、該ピークは該画像の形状記述を
構成する為の方法として使用される。このことを達成す
る為の好適方法を第7図にブロック図で示しである。そ
こに示した如く、該カメラからの画像は、第1図乃至第
6図に示したのと同一の態様で処理されるが、2つの異
なったスケールで処理され、最初のスケールはフィルタ
12a及び16aへ適用され且つ第2のスケールはフイ
ルタ12b及び16aへ適用される。第7図は異なった
スケールで画像を処理する為の2つの異なった組の装置
を示しているが、同一の装置を使用して両方のスケール
を処理することを可能とする為に多重動作を使用するこ
とが可能である。どの方法を使用するかの選択は、完成
した画像が所望される速度に主に依存する。好適実施例
において、該スケールの1つは、かなり粗いスケールで
あり、その場合、全単語は単一の斑点に凝縮され、一方
他のスケールは最初のものよりも約り0%小さい。
構成する為の方法として使用される。このことを達成す
る為の好適方法を第7図にブロック図で示しである。そ
こに示した如く、該カメラからの画像は、第1図乃至第
6図に示したのと同一の態様で処理されるが、2つの異
なったスケールで処理され、最初のスケールはフィルタ
12a及び16aへ適用され且つ第2のスケールはフイ
ルタ12b及び16aへ適用される。第7図は異なった
スケールで画像を処理する為の2つの異なった組の装置
を示しているが、同一の装置を使用して両方のスケール
を処理することを可能とする為に多重動作を使用するこ
とが可能である。どの方法を使用するかの選択は、完成
した画像が所望される速度に主に依存する。好適実施例
において、該スケールの1つは、かなり粗いスケールで
あり、その場合、全単語は単一の斑点に凝縮され、一方
他のスケールは最初のものよりも約り0%小さい。
更に2画像の中心に最も近い物体にラベルを付ける為に
粗いスケールの表示において通常領域ラベラー19が使
用される。このラベルを付けた領域は、その区域内に存
在するピークのみに対して一層微細なスケール処理の注
意を制限する為に使用される。
粗いスケールの表示において通常領域ラベラー19が使
用される。このラベルを付けた領域は、その区域内に存
在するピークのみに対して一層微細なスケール処理の注
意を制限する為に使用される。
第8図は、第2図の画像に対して本発明方法の適用を示
している。第8a図乃至第8h図の各々の支配的に黒い
上部部分は1画像の中心に最も近い粗いスケール符号斑
点の、そのスケール及びより微細なスケールからのピー
クとのオーバーレイ即ち重畳である。より大きな円は粗
いスケールのピークを表しており、一方より微細な円は
より微細なスケールのピークを表している。スケールに
おいて変化と共にピークの移動、及びピークの分岐は、
異なったスケールでの形状における構造間の関係に起因
する。短いベクトルと共に粗いピークを示す第8a図乃
至第8h図の各々の下側部分は、微細スケールでの近く
のピークへの方向を表している。これらの角度記述は、
時折の付加又は削除を除いて、第8a図乃至第8d図及
び第8e図乃至第8h図の組の各々において、類似して
いることに注意されたい。重要なことであるが、該ピー
クの位置は、いずれかの基準位置に関してではなく、互
いに関して記述することが可能である。
している。第8a図乃至第8h図の各々の支配的に黒い
上部部分は1画像の中心に最も近い粗いスケール符号斑
点の、そのスケール及びより微細なスケールからのピー
クとのオーバーレイ即ち重畳である。より大きな円は粗
いスケールのピークを表しており、一方より微細な円は
より微細なスケールのピークを表している。スケールに
おいて変化と共にピークの移動、及びピークの分岐は、
異なったスケールでの形状における構造間の関係に起因
する。短いベクトルと共に粗いピークを示す第8a図乃
至第8h図の各々の下側部分は、微細スケールでの近く
のピークへの方向を表している。これらの角度記述は、
時折の付加又は削除を除いて、第8a図乃至第8d図及
び第8e図乃至第8h図の組の各々において、類似して
いることに注意されたい。重要なことであるが、該ピー
クの位置は、いずれかの基準位置に関してではなく、互
いに関して記述することが可能である。
第8a図乃至第8h図の各々の下側部分は、形状インデ
ックスシステムに対する基礎を与えている。
ックスシステムに対する基礎を与えている。
更に、ピークの「質量中心」の位置は、画像の解釈にお
ける不明確性、例えば正面上側か裏返しか等の不明確性
を解消する為の手段を提供している。
ける不明確性、例えば正面上側か裏返しか等の不明確性
を解消する為の手段を提供している。
幾つかの適用に適した本発明の別の実施例において、二
進化ステップ15及び第2フイルタ動作16(第1図参
照)は省略される。この場合に、ピークが第1フィルタ
画像中において検出され、且つこれらのピークはプリミ
ティブ要素として使用される。第7図に関して説明した
のと同一の態様において、コンボリューションオペレー
タスケールにおける変化に伴うピークの移動は形状イン
デックス動作に対する基礎を与えている。
進化ステップ15及び第2フイルタ動作16(第1図参
照)は省略される。この場合に、ピークが第1フィルタ
画像中において検出され、且つこれらのピークはプリミ
ティブ要素として使用される。第7図に関して説明した
のと同一の態様において、コンボリューションオペレー
タスケールにおける変化に伴うピークの移動は形状イン
デックス動作に対する基礎を与えている。
フィルタシステム及びここに記載するその結果得られる
ピーク、及びそれらから形状記述を構築する為の方法は
、広い範囲の認識問題に適用可能である0例えば、形状
表現方法は、フォント独立単語及び文字認識において使
用することが可能である。現在の光学文字読取システム
は、各フォント即ち文字スタイルに対して特別の装置を
必要とする。ここに示した如く、単語形状は、テキスト
資料において共通に使用される単語を識別する為に使用
することが可能であり1個別的な文字を識別する為に同
様の方法が使用される。以下に説明する如く、比較的廉
価なハードウェアを使用して、この方法を高速で動作さ
せることが可能である。
ピーク、及びそれらから形状記述を構築する為の方法は
、広い範囲の認識問題に適用可能である0例えば、形状
表現方法は、フォント独立単語及び文字認識において使
用することが可能である。現在の光学文字読取システム
は、各フォント即ち文字スタイルに対して特別の装置を
必要とする。ここに示した如く、単語形状は、テキスト
資料において共通に使用される単語を識別する為に使用
することが可能であり1個別的な文字を識別する為に同
様の方法が使用される。以下に説明する如く、比較的廉
価なハードウェアを使用して、この方法を高速で動作さ
せることが可能である。
更に、この技術は、プリントした漢字の認識を可能とし
、漢字は、プリントしたローマ字の如く、粗いスケール
での比較的簡単なものから微細なスケールでの次第に一
層複雑なものへ明確に構成された形状を持っている。
、漢字は、プリントしたローマ字の如く、粗いスケール
での比較的簡単なものから微細なスケールでの次第に一
層複雑なものへ明確に構成された形状を持っている。
本明細書に記載した方法のその他の使用方法としては、
回路基板上の部品の形状を記述するものである。例えば
、品質管理検査の為に、例えば基板の部品登録の如く、
合格及び不合格状態の間の差異は、比較的簡単なピーク
記述の比較から見出すことが可能である。本明細書に説
明する方法は、ハイレベルでシステムに教えた問題の種
類を広範囲に変化させる為のテストを可能とさせる。
回路基板上の部品の形状を記述するものである。例えば
、品質管理検査の為に、例えば基板の部品登録の如く、
合格及び不合格状態の間の差異は、比較的簡単なピーク
記述の比較から見出すことが可能である。本明細書に説
明する方法は、ハイレベルでシステムに教えた問題の種
類を広範囲に変化させる為のテストを可能とさせる。
(2)本発明方法を実施する装置
第9図は、本発明の方法を実施する為の装置の第1の部
分を示している。好適実施例において、カメラ10によ
って得られるパターン又は物体の画像が、例えば、ビジ
コンカメラ、CCDカメラ。
分を示している。好適実施例において、カメラ10によ
って得られるパターン又は物体の画像が、例えば、ビジ
コンカメラ、CCDカメラ。
スキャニング電子顕微鏡等の従来の光学的技術を使用し
て得られる。画゛像が得られると、必要に応じて、アナ
ログ・デジタル変換器43を使用して。
て得られる。画゛像が得られると、必要に応じて、アナ
ログ・デジタル変換器43を使用して。
デジタル化され、且つフィルタ動作を行って、パターン
内の低周波数構造をエンハンス即ち向上させる一方、高
周波数情報を減衰させる。その結果は、第3図に図示し
た如きフィルタ画像が得られる。説明の便宜上、好適実
施例において、フィルタされるべきパターンはほぼ50
0X500個の画素から構成されると仮定する。
内の低周波数構造をエンハンス即ち向上させる一方、高
周波数情報を減衰させる。その結果は、第3図に図示し
た如きフィルタ画像が得られる。説明の便宜上、好適実
施例において、フィルタされるべきパターンはほぼ50
0X500個の画素から構成されると仮定する。
デジタル化した画素パターンが得られると、本方法の第
1ステツプは、ラプラシアン機能を適用することである
。結果に影響を与えること無しに、ラプラシアン又はガ
ウシアン機能のいずれかを最初に適用することが可能で
あるが、最初にラプラシアン機能を適用することにより
成る利点が得られる。特に、最初にラプラシアン機能を
適用することによって、ビデオ信号がゼロ上に中心位置
決めされ且つ次いで平滑化される。このことは、ガウシ
アン機能が最初に適用される場合に存在するような広い
範囲の信号を特性付ける為にnピッ1〜数が必要とされ
ることはないので、nビット整数分解能の良好な使用を
可能とさせる。最初にラプラシアンを適用することによ
り、コンボリューション値を所定の範囲内に維持する為
にガウシアンパイプラインを介して必要とされるスケー
リングの量を減少させることが可能である。
1ステツプは、ラプラシアン機能を適用することである
。結果に影響を与えること無しに、ラプラシアン又はガ
ウシアン機能のいずれかを最初に適用することが可能で
あるが、最初にラプラシアン機能を適用することにより
成る利点が得られる。特に、最初にラプラシアン機能を
適用することによって、ビデオ信号がゼロ上に中心位置
決めされ且つ次いで平滑化される。このことは、ガウシ
アン機能が最初に適用される場合に存在するような広い
範囲の信号を特性付ける為にnピッ1〜数が必要とされ
ることはないので、nビット整数分解能の良好な使用を
可能とさせる。最初にラプラシアンを適用することによ
り、コンボリューション値を所定の範囲内に維持する為
にガウシアンパイプラインを介して必要とされるスケー
リングの量を減少させることが可能である。
7点正規化ガウシアンオペレータでのコンボリューショ
ン即ち畳み込みは、典型的なラプラシアンフィルタ画像
の振幅を約2の係数だけ減少させる。従って、好適実施
例において、該シフトは、各7点ガウシアンオペレータ
に対して右側へ1ビツト少なくなる。換言すると、出力
信号の振幅は、各7点ガウシアンオペレータの適用の後
に、約2の係数だけ即ち約2倍急増される。必要とされ
るハードウェアにおいて、このことは、各爾後の7点ガ
ウシアンオペレータで1ビツトの精度を獲得することを
可能とする。従って、4個のこのようなオペレータを持
った好適なシステム即ち方式において、4ビツト獲得さ
れるか、又は等価的に、最終出力において同一の精度を
得る一方、パイプラインデータ幅において4個のビット
を節約する。
ン即ち畳み込みは、典型的なラプラシアンフィルタ画像
の振幅を約2の係数だけ減少させる。従って、好適実施
例において、該シフトは、各7点ガウシアンオペレータ
に対して右側へ1ビツト少なくなる。換言すると、出力
信号の振幅は、各7点ガウシアンオペレータの適用の後
に、約2の係数だけ即ち約2倍急増される。必要とされ
るハードウェアにおいて、このことは、各爾後の7点ガ
ウシアンオペレータで1ビツトの精度を獲得することを
可能とする。従って、4個のこのようなオペレータを持
った好適なシステム即ち方式において、4ビツト獲得さ
れるか、又は等価的に、最終出力において同一の精度を
得る一方、パイプラインデータ幅において4個のビット
を節約する。
500画素正方形画像40が第9図の上部に示しである
。ラプラシアン機能が画素Cへ適用される場合、画素A
乃至Eの各々に対する典型的には8ビット精度の二進値
が検索され且つ適宜重み付けされねばならない。第9図
の装置は、所望の画素を検索する為の1技術を示してい
る。所望のパターンがカメラ10及びA−D変換器43
からの非インターレースビデオラスクスキャンとして得
られると、成る与えられた時間において、画素Aがライ
ン45上に供給される。その時間に、ライン46は、4
99個画素前に受は取った値であるBを保持する。同様
に、ライン47,48,49は、Aよりも500個、5
01個、1ooo個の画素前に受は取った画素C,D、
Eを夫々保持する。従って、この形態は、5個の同時的
なサンプルを発生し、第9図の上部に示した如き画像か
らの交差パターンを形成する。注意すべきことであるが
、次の画素が45に到着すると、サンプルの全交差パタ
ーンがラスタースキャンに続いて画像上で1個の画素を
右へ移動させる。各画素に対する値が検索されると、そ
れは爾後処理へ供給される前にラッチさせることが可能
である。第9図に示した遅延要素50は1例えば、シフ
トレジスタ又はランダムアクセスメモリ等の既知の遅延
要素である。
。ラプラシアン機能が画素Cへ適用される場合、画素A
乃至Eの各々に対する典型的には8ビット精度の二進値
が検索され且つ適宜重み付けされねばならない。第9図
の装置は、所望の画素を検索する為の1技術を示してい
る。所望のパターンがカメラ10及びA−D変換器43
からの非インターレースビデオラスクスキャンとして得
られると、成る与えられた時間において、画素Aがライ
ン45上に供給される。その時間に、ライン46は、4
99個画素前に受は取った値であるBを保持する。同様
に、ライン47,48,49は、Aよりも500個、5
01個、1ooo個の画素前に受は取った画素C,D、
Eを夫々保持する。従って、この形態は、5個の同時的
なサンプルを発生し、第9図の上部に示した如き画像か
らの交差パターンを形成する。注意すべきことであるが
、次の画素が45に到着すると、サンプルの全交差パタ
ーンがラスタースキャンに続いて画像上で1個の画素を
右へ移動させる。各画素に対する値が検索されると、そ
れは爾後処理へ供給される前にラッチさせることが可能
である。第9図に示した遅延要素50は1例えば、シフ
トレジスタ又はランダムアクセスメモリ等の既知の遅延
要素である。
第10図は、獲得した画素値のラプラシアンを得る為の
装置を示している。与えられた画素位置でのラプラシア
ン機能に対する満足のいく近似は、重み4をその特定の
画素へ適用し且つ重み−1を該特定画素の上側、下側、
右側及び左側の画素へ適用することである。第10図に
示した如く1画素A及び已に対する画素値は加算器60
へ供給され、一方画素り及びEに対するものは加算器6
1へ供給される。その結果、加算器60は、ライン62
上に出力信号A+Bを供給し、一方加算器61はライン
63上に出力信号D+Eを供給する。
装置を示している。与えられた画素位置でのラプラシア
ン機能に対する満足のいく近似は、重み4をその特定の
画素へ適用し且つ重み−1を該特定画素の上側、下側、
右側及び左側の画素へ適用することである。第10図に
示した如く1画素A及び已に対する画素値は加算器60
へ供給され、一方画素り及びEに対するものは加算器6
1へ供給される。その結果、加算器60は、ライン62
上に出力信号A+Bを供給し、一方加算器61はライン
63上に出力信号D+Eを供給する。
次いで、ライン62及び63上で信号を受は取るべく接
続されている別の加算器64は、全ての画素A、B、D
及びEの和を表す出力信号をライン65上に供給する。
続されている別の加算器64は、全ての画素A、B、D
及びEの和を表す出力信号をライン65上に供給する。
画素Cに対する画素値がシフタ66へ供給される。該画
素値を2個分の位置左へシフトさせることによって、該
値は実効的に4で乗算され、且つ該結果はライン67上
を減算器68へ供給される。
素値を2個分の位置左へシフトさせることによって、該
値は実効的に4で乗算され、且つ該結果はライン67上
を減算器68へ供給される。
減算器68は、ライン65上に供給される和を、ライン
67上の四重に重み付けされた値と結合させて、入力画
像の画素Cにおけるラプラシアンを近似する新たな値を
得る。従って、出力68は。
67上の四重に重み付けされた値と結合させて、入力画
像の画素Cにおけるラプラシアンを近似する新たな値を
得る。従って、出力68は。
入力画像のラプラシアンのビデオラスター信号を担持す
る。この信号は次のステージ即ち段の処理、即ちガウシ
アン畳み込み器、へ供給される。
る。この信号は次のステージ即ち段の処理、即ちガウシ
アン畳み込み器、へ供給される。
ガウシアンコンボリューションが適用される態様を第1
2図及び第13図に示しである。好適実施例において、
二次元ガウシアンコンボリューションを一次元ガウシア
ンコンボリューションの成分に分解することが可能であ
るという事実を使用する。このことは、二次元ガウシア
ンは2個の一次元ガウシアンの積として表現することが
可能であるという事実を基礎としている。即ち、G(x
、y)=exp[−(x”+y”)/ a ”]
(3)=exp[−x2/ a ”]exp[−
y”/ a 2] (4)=G(ス)G(y)
(5)このこと
は、二次元コンボリューション積分を以下の如くに分解
することを許容する。
2図及び第13図に示しである。好適実施例において、
二次元ガウシアンコンボリューションを一次元ガウシア
ンコンボリューションの成分に分解することが可能であ
るという事実を使用する。このことは、二次元ガウシア
ンは2個の一次元ガウシアンの積として表現することが
可能であるという事実を基礎としている。即ち、G(x
、y)=exp[−(x”+y”)/ a ”]
(3)=exp[−x2/ a ”]exp[−
y”/ a 2] (4)=G(ス)G(y)
(5)このこと
は、二次元コンボリューション積分を以下の如くに分解
することを許容する。
G(x、y)参I(x、y)
:/、 jI、G(u、v)I[(x−u)、(y、v
)ldudv (6)= f G(v)f
G(u)I[(x−u)、(y−v)コdudv
(7)−唖 −閃 =G(y)*[G(x)−I(x、y)]
(8)尚、I(x、y)はコンボリュー
ションされる即ち畳み込まれるべき入力画像である。
)ldudv (6)= f G(v)f
G(u)I[(x−u)、(y−v)コdudv
(7)−唖 −閃 =G(y)*[G(x)−I(x、y)]
(8)尚、I(x、y)はコンボリュー
ションされる即ち畳み込まれるべき入力画像である。
従って、二次元ガウシアンコンボリューションは、2個
のカスケード接続した一次元コンポリューションによっ
て達成することが可能であり、そのほうが計算的にはか
なり廉価となる。−次元ガウシアンオペレータは、−次
元での二項分布によって近似させることが可能である。
のカスケード接続した一次元コンポリューションによっ
て達成することが可能であり、そのほうが計算的にはか
なり廉価となる。−次元ガウシアンオペレータは、−次
元での二項分布によって近似させることが可能である。
例えば、7点二項分布1,6,15,20,15,6.
1はガウシアンに極めて近いものである。好適実施例に
おいて、3点二項オペレータは、1,2.1の重みで三
回使用されて、7点二項分布でのコンボリューション即
ち畳み込みの効果を発生させる。この選択は、特に効率
的なハードウェハ構成を可能とさせ、且つ第11図に示
しである。
1はガウシアンに極めて近いものである。好適実施例に
おいて、3点二項オペレータは、1,2.1の重みで三
回使用されて、7点二項分布でのコンボリューション即
ち畳み込みの効果を発生させる。この選択は、特に効率
的なハードウェハ構成を可能とさせ、且つ第11図に示
しである。
第11図は、3点機構G、の動作を示している。
デジタルラスター人力が、2個の直列接続された遅延要
素の入力へ印加される。これらの遅延要素は、両方共、
それらの入力端子及び出力端子間にn個の画素の遅延を
導入する。尚、nは水平コンボリューションに対して1
個又は2個の画素と等しく、且つnは垂直コンボリュー
ションに対して画像ライン長さ又はその2倍の長さに等
しい。これらの遅延要素から、画像内において互いにn
個の画素だけ離隔されている3つの同時的な値A、B及
びCが得られる。A及びCは加算器70へ印加され、且
つその和はシフタ72のライン71へ供給される。シフ
タ72は、A+Cの和を右へ1つの位置シフトさせ、実
際上それを2で除算する。
素の入力へ印加される。これらの遅延要素は、両方共、
それらの入力端子及び出力端子間にn個の画素の遅延を
導入する。尚、nは水平コンボリューションに対して1
個又は2個の画素と等しく、且つnは垂直コンボリュー
ションに対して画像ライン長さ又はその2倍の長さに等
しい。これらの遅延要素から、画像内において互いにn
個の画素だけ離隔されている3つの同時的な値A、B及
びCが得られる。A及びCは加算器70へ印加され、且
つその和はシフタ72のライン71へ供給される。シフ
タ72は、A+Cの和を右へ1つの位置シフトさせ、実
際上それを2で除算する。
ライン73上の出力信号が、画素B用の二進値に関連し
て加算器74へ供給される。その際に加算器74は、ラ
イン75上に、画素Bの値と画素A及びCの値の和の半
分に等しい値との和に等しい値を供給する。正しい振幅
を維持する為に、この結果をシフタ76によって右へ1
つの位置シフトさせ、且つその結果をライン77上へ供
給する。
て加算器74へ供給される。その際に加算器74は、ラ
イン75上に、画素Bの値と画素A及びCの値の和の半
分に等しい値との和に等しい値を供給する。正しい振幅
を維持する為に、この結果をシフタ76によって右へ1
つの位置シフトさせ、且つその結果をライン77上へ供
給する。
ライン77上の結果は、3点二項分布によって平滑化さ
せた入力信号である。該ガウシアンに対するより微細な
近似を得るために、第11図の手順を、第12図に示し
た如く、1回を超えて繰返し行うことが可能である。
せた入力信号である。該ガウシアンに対するより微細な
近似を得るために、第11図の手順を、第12図に示し
た如く、1回を超えて繰返し行うことが可能である。
第12図は、第11図の3個の3点ガウシアンコンボリ
ューション要素G1のパイプラインがどのようにして構
成されているかを示している。この装置は、入力ビデオ
ストリームを、−次元ガウシアンG7に対する7点二項
近似でコンボリューション操作即ち畳み込み操作する。
ューション要素G1のパイプラインがどのようにして構
成されているかを示している。この装置は、入力ビデオ
ストリームを、−次元ガウシアンG7に対する7点二項
近似でコンボリューション操作即ち畳み込み操作する。
該遅延要素が1個の画素の遅延を発生すべく設定されて
いると、これは水平ガウシアンコンボリューションであ
る。
いると、これは水平ガウシアンコンボリューションであ
る。
該遅延要素が該画像のライン長に設定されていると、こ
れは垂直コンボリューションである。各G、オペレータ
のG、オペレータの1つは、上述した理由の為に正規化
操作を包含するものではない。
れは垂直コンボリューションである。各G、オペレータ
のG、オペレータの1つは、上述した理由の為に正規化
操作を包含するものではない。
7×7二次元ガウシアンコンボリューションを達成する
為に、一方が水平コンボリューション用に設定された遅
延を有しており且つ他方が垂直コンボリューション用に
設定された遅延を有する2個のG7要素を使用する。第
8図の下側部分は、G 7 x 7要素を発生する為に
2個のG7要素のパイプラインを使用する本発明技術を
示している。実際上、上述した7×7オペレータよりも
大きなガウシアンフィルタを必要とする。上述した如き
類似の技術を使用して、任意の大きさのフィルタを構築
することが可能である。然し乍ら1本発明者はより効率
的なアプローチを見出した。07X、フィルタの適用の
後、入力信号を十分にローパスフィルタ処理しており、
従って1つおきの画素のみをサンプルする爾後のオペレ
ータがエリアシング即ち折り返し現象の問題の影響を受
けることがない。
為に、一方が水平コンボリューション用に設定された遅
延を有しており且つ他方が垂直コンボリューション用に
設定された遅延を有する2個のG7要素を使用する。第
8図の下側部分は、G 7 x 7要素を発生する為に
2個のG7要素のパイプラインを使用する本発明技術を
示している。実際上、上述した7×7オペレータよりも
大きなガウシアンフィルタを必要とする。上述した如き
類似の技術を使用して、任意の大きさのフィルタを構築
することが可能である。然し乍ら1本発明者はより効率
的なアプローチを見出した。07X、フィルタの適用の
後、入力信号を十分にローパスフィルタ処理しており、
従って1つおきの画素のみをサンプルする爾後のオペレ
ータがエリアシング即ち折り返し現象の問題の影響を受
けることがない。
従って、14X14ガウシアンコンボリユーシヨンは、
その水平遅延を1個の画素から2個の画素へ且つその垂
直遅延を1本のライン長から2本のライン長へ増加させ
ることによってそ・の点を拡布させたG787オペレー
タによって近似させることが可能である。
その水平遅延を1個の画素から2個の画素へ且つその垂
直遅延を1本のライン長から2本のライン長へ増加させ
ることによってそ・の点を拡布させたG787オペレー
タによって近似させることが可能である。
第13図は、スタート時にラプラシアンオペレータを有
するビデオパイプライン内に実効的に21×21のガウ
シアンコンボリューションオペレータを発生する為の2
個の078.要素を示している。その結果は2Gフィル
タ画像である。このフィルタ画像の符号のみが保存され
且つフィルタ16へ供給される(第1図参照)。上述し
たパイプラインシステムの代わりに、フィードバックシ
ステムが使用される場合、フィルタ12からの値の符号
は、該フィルタが該フィルタを介しての2回目の通過に
対しての入力値として該符号を使用するその後の処理の
為に使用可能となる迄、−時的に格納される。いずれの
場合においても、第9図乃至第13図に関連して説明し
た如く同一の技術を使用して二進画像を再度フィルタさ
せる。然し乍ら、この場合、画素値の符号だけではなく
、実際の画素値が保存される。第4図に示した如く、こ
れらの実際の画素値は結果として得られる表示における
ピークを決定する場合に使用される。
するビデオパイプライン内に実効的に21×21のガウ
シアンコンボリューションオペレータを発生する為の2
個の078.要素を示している。その結果は2Gフィル
タ画像である。このフィルタ画像の符号のみが保存され
且つフィルタ16へ供給される(第1図参照)。上述し
たパイプラインシステムの代わりに、フィードバックシ
ステムが使用される場合、フィルタ12からの値の符号
は、該フィルタが該フィルタを介しての2回目の通過に
対しての入力値として該符号を使用するその後の処理の
為に使用可能となる迄、−時的に格納される。いずれの
場合においても、第9図乃至第13図に関連して説明し
た如く同一の技術を使用して二進画像を再度フィルタさ
せる。然し乍ら、この場合、画素値の符号だけではなく
、実際の画素値が保存される。第4図に示した如く、こ
れらの実際の画素値は結果として得られる表示における
ピークを決定する場合に使用される。
ピーク位置を決定する為の1つの技術はソフトウェアを
使用する。少なくとも最初の3つの行のラスクスキャン
画像が供給された後に、3X3画素の左上角部のグルー
プがレジスタ内にロードされ、且つテストを実施して、
中央の画素(2番目の行、2番目の画素)が、例えば1
0%である予め指定したスレッシュホールド量だけ他の
画素の各々よりも一層大きいかどうかを決定する。その
結果大きいものである場合には、この中央画素のアドレ
スを保存する。次いで、行1乃至3の各々における画素
2乃至4をテストする為に、左上角部の画素から右へ1
個の画素分3×3画素マトリクスをシフトさせることに
よって、該テストを継続させる。全画像をスキャンした
後に、該メモリは、該画像がスキャンされた特定のスケ
ールに対して全てのピーク位置を包含する。該ピークの
位置を決定する為に上述したプロセスは、第7図におけ
るブロック17a及び17bの各々を表す。
使用する。少なくとも最初の3つの行のラスクスキャン
画像が供給された後に、3X3画素の左上角部のグルー
プがレジスタ内にロードされ、且つテストを実施して、
中央の画素(2番目の行、2番目の画素)が、例えば1
0%である予め指定したスレッシュホールド量だけ他の
画素の各々よりも一層大きいかどうかを決定する。その
結果大きいものである場合には、この中央画素のアドレ
スを保存する。次いで、行1乃至3の各々における画素
2乃至4をテストする為に、左上角部の画素から右へ1
個の画素分3×3画素マトリクスをシフトさせることに
よって、該テストを継続させる。全画像をスキャンした
後に、該メモリは、該画像がスキャンされた特定のスケ
ールに対して全てのピーク位置を包含する。該ピークの
位置を決定する為に上述したプロセスは、第7図におけ
るブロック17a及び17bの各々を表す。
装置のコスト及び所望の実行速度に依存して、上述した
ソフトウェアプロセスの代わりに特別目的乃至は専用ハ
ードウェアを使用することが可能である。この様な専用
ハードウェアは、第9図に示した形態のものであり、単
に5個の画素値A乃至Eのみにラッチ入力する代わりに
、9個の画素値がラッチされ、次いでテストされて、中
央画素が予め定めたスレッシュホールドだけ周囲の画素
よりも大きいかどうかを決定する。
ソフトウェアプロセスの代わりに特別目的乃至は専用ハ
ードウェアを使用することが可能である。この様な専用
ハードウェアは、第9図に示した形態のものであり、単
に5個の画素値A乃至Eのみにラッチ入力する代わりに
、9個の画素値がラッチされ、次いでテストされて、中
央画素が予め定めたスレッシュホールドだけ周囲の画素
よりも大きいかどうかを決定する。
全てのピークを見つけた後に、それらのアドレスを適宜
のメモリ内に格納する。次いで、粗いスケールのピーク
を、近くのより小さなスケールのピークに対するサーチ
の為のオリジン即ち源として使用する。微細スケールの
ピークに対するサーチは粗いスケールのピークの任意の
距離内において実行することが可能であるが、好適実施
例においては、ガウシアンコンボリューションのより微
細なラプラシアンのオペレータ直径を使用する。
のメモリ内に格納する。次いで、粗いスケールのピーク
を、近くのより小さなスケールのピークに対するサーチ
の為のオリジン即ち源として使用する。微細スケールの
ピークに対するサーチは粗いスケールのピークの任意の
距離内において実行することが可能であるが、好適実施
例においては、ガウシアンコンボリューションのより微
細なラプラシアンのオペレータ直径を使用する。
このサーチは、ソフトウェアによって行われ、且つ完了
すると、粗いピークが近くの小さなピークのアドレス又
はその他の識別表示で注釈付けされる。次いで、矩形座
標から極座標への従来の変換技術を使用して、小さなピ
ークに対する角度を計算する。その結果を、第8a図乃
至第8 h図の各々の下側部分に示しである。好適実施
例において。
すると、粗いピークが近くの小さなピークのアドレス又
はその他の識別表示で注釈付けされる。次いで、矩形座
標から極座標への従来の変換技術を使用して、小さなピ
ークに対する角度を計算する。その結果を、第8a図乃
至第8 h図の各々の下側部分に示しである。好適実施
例において。
粗いピークと小さなピークとの間の角度関係のみが決定
される。然し乍ら、該ピークの間の変位は、座標変換の
結果であり、且つ変位が重要な場合の適用の為に包含さ
せることが可能である。
される。然し乍ら、該ピークの間の変位は、座標変換の
結果であり、且つ変位が重要な場合の適用の為に包含さ
せることが可能である。
本方法におけるこの段階において、与えられた「斑点」
内の粗いスケールのピークの各々に対して小さなスケー
ルのピークのリストがある。次いで、該粗いピークを介
してのベストフィツトライン即ちあてはめラインを、例
えば最小二乗近似法を使用して、決定し、その形状をそ
の情報を使用して記述する。好適実施例において、この
ことは、第7図の形状記述ブロック2o内のソフトウェ
アによって達成される。該記述は、該ラインに沿っての
中心点又はその他の基準点に関しての各ピークの位置、
その粗いピークがそのラインのどれほど上側又は下側に
あるかの表示、及び該粗いスケールのピークから該小さ
なスケールのピークへのベクトルのリストを包含してい
る。次いで、この情報をルックアップテーブル内におい
て使用し、該テーブル内にターゲット即ち目的の形状を
格納する。該テーブル内の形状は、多様な方法でインデ
ックス即ち索引付けすることが可能であり、例えば該ベ
クトルに基づくグループ内の個々の種類分けをして、該
粗い測定によって決定されるグループによってインデッ
クスさせることが可能である。使用される特定のインデ
ックス方式は1木刀式が適用される適用場面に主に依存
する。
内の粗いスケールのピークの各々に対して小さなスケー
ルのピークのリストがある。次いで、該粗いピークを介
してのベストフィツトライン即ちあてはめラインを、例
えば最小二乗近似法を使用して、決定し、その形状をそ
の情報を使用して記述する。好適実施例において、この
ことは、第7図の形状記述ブロック2o内のソフトウェ
アによって達成される。該記述は、該ラインに沿っての
中心点又はその他の基準点に関しての各ピークの位置、
その粗いピークがそのラインのどれほど上側又は下側に
あるかの表示、及び該粗いスケールのピークから該小さ
なスケールのピークへのベクトルのリストを包含してい
る。次いで、この情報をルックアップテーブル内におい
て使用し、該テーブル内にターゲット即ち目的の形状を
格納する。該テーブル内の形状は、多様な方法でインデ
ックス即ち索引付けすることが可能であり、例えば該ベ
クトルに基づくグループ内の個々の種類分けをして、該
粗い測定によって決定されるグループによってインデッ
クスさせることが可能である。使用される特定のインデ
ックス方式は1木刀式が適用される適用場面に主に依存
する。
以上、本発明の具体的実施の態様に付いて詳細に説明し
たが、本発明はこれら具体例にのみ限定されるへきもの
では無く、本発明の技術的範囲を逸脱すること無しに種
々の変形が可能であることは勿論である。
たが、本発明はこれら具体例にのみ限定されるへきもの
では無く、本発明の技術的範囲を逸脱すること無しに種
々の変形が可能であることは勿論である。
第1図は本発明の好適実施例の一部を示したブロック図
、第2図(a)乃至(h)は形状認識方式用の例として
使用されるプリントした名前の1組のグレイレベル画像
の各説明図、第3図(a)乃至(h)は第2図の画像の
ガウシアンコンボリューションのラプラシアンの符号の
1組の表示の各説明図、第4図は第3図のデータの1つ
の場合のガウシアンのラプラシアン表示の斜視表面プロ
ットの説明図、第5図(a)乃至(d)は第2a図乃至
第2d図の画像へ適用した場合の第1図のプロセスによ
って見つけられたピークの一連の画像を示した各説明図
、第6図は第2e図乃至第2h図の画像へ適用した場合
の第1図のプロセスによって見つけられたピークの一連
の画像を示した各説明図、第7図は形状記述を発生する
為に適用した場合の本発明方法の好適実施例のブロック
図、第8図(a)乃至(h)は第2図の画像へ適用した
場合の第7図に示したプロセスの出力を示した一連の各
説明図、第9図はビデオ速度でラプラシアンを計算する
為に画素値を回収する為の好適技術を示したブロック図
、第10図は第9図において回収した画素値のラプラシ
アンを得る為の好適技術を示したブロック図、第11図
はビデオ速度でガウシアンコンボリューションを得る為
の好適技術の基本的計算要素のブロック図、第12図は
ラプラシアンフィルタ信号の7×7二次元ガウシアンコ
ンボリューションを計算する為の第11図の技術の繰返
し適用を行う構成を示した概略図、第13図はラプラシ
アンコンボリューションの21×21ガウシアンを効率
的に発生する為に2個の7×7ガウシアン要素を持った
ラプラシアンの結合を示したブロック図、である。 (符号の説明) 10:カメラ 43 : A/D変換器 50:遅延要素 60.61.64 :加算器 68:減算機 図面の浄9.1.−(内容に変更なし)FIG、J。 (al fb+ el +dl 5l il+ hl +dl FIG=5゜ (al (C bl C1 +1+ FIG、j。 id+ FIG、J。 (d h) 1al FIG、J。 bl el +d) FIG、JO。 テ゛ジタルどチオ41号 (竿Nmへン FIG、−庄 F(θ1 FIG、+2゜ FIG、J3゜ 手続補正書防式) 平成元年9月6日
、第2図(a)乃至(h)は形状認識方式用の例として
使用されるプリントした名前の1組のグレイレベル画像
の各説明図、第3図(a)乃至(h)は第2図の画像の
ガウシアンコンボリューションのラプラシアンの符号の
1組の表示の各説明図、第4図は第3図のデータの1つ
の場合のガウシアンのラプラシアン表示の斜視表面プロ
ットの説明図、第5図(a)乃至(d)は第2a図乃至
第2d図の画像へ適用した場合の第1図のプロセスによ
って見つけられたピークの一連の画像を示した各説明図
、第6図は第2e図乃至第2h図の画像へ適用した場合
の第1図のプロセスによって見つけられたピークの一連
の画像を示した各説明図、第7図は形状記述を発生する
為に適用した場合の本発明方法の好適実施例のブロック
図、第8図(a)乃至(h)は第2図の画像へ適用した
場合の第7図に示したプロセスの出力を示した一連の各
説明図、第9図はビデオ速度でラプラシアンを計算する
為に画素値を回収する為の好適技術を示したブロック図
、第10図は第9図において回収した画素値のラプラシ
アンを得る為の好適技術を示したブロック図、第11図
はビデオ速度でガウシアンコンボリューションを得る為
の好適技術の基本的計算要素のブロック図、第12図は
ラプラシアンフィルタ信号の7×7二次元ガウシアンコ
ンボリューションを計算する為の第11図の技術の繰返
し適用を行う構成を示した概略図、第13図はラプラシ
アンコンボリューションの21×21ガウシアンを効率
的に発生する為に2個の7×7ガウシアン要素を持った
ラプラシアンの結合を示したブロック図、である。 (符号の説明) 10:カメラ 43 : A/D変換器 50:遅延要素 60.61.64 :加算器 68:減算機 図面の浄9.1.−(内容に変更なし)FIG、J。 (al fb+ el +dl 5l il+ hl +dl FIG=5゜ (al (C bl C1 +1+ FIG、j。 id+ FIG、J。 (d h) 1al FIG、J。 bl el +d) FIG、JO。 テ゛ジタルどチオ41号 (竿Nmへン FIG、−庄 F(θ1 FIG、+2゜ FIG、J3゜ 手続補正書防式) 平成元年9月6日
Claims (1)
- 【特許請求の範囲】 1、画素を有する画像を処理する方法において、前記画
像へガウシアンコンボリューションの第1ラプラシアン
を適用して第1フィルタ画像を発生し、前記第1フィル
タ画像内の各画素の符号を注出して第2フィルタ画像を
与え、前記第2フィルタ画像へガウシアンコンボリュー
ションの第2ラプラシアンを付与して第2フィルタ画像
を与え、前記第3フィルタ画像内の第2組のピークを検
出する、上記各ステップを有することを特徴とする画像
処理方法。 2、特許請求の範囲第1項において、前記第3フィルタ
画像内の前記第1組のピークから前記画像の記述を確立
するステップを有することを特徴とする画像処理方法。 3、特許請求の範囲第1項において、前記画像に対して
より小さなオペレータを持ったガウシアンコンボリュー
ションの第3ラプラシアンを付与して第4フィルタ画像
を発生し、前記第4フィルタ画像内の各画素の符号を注
出して第5フィルタ画像を与え、前記同一のより小さな
オペレータを持ったガウシアンコンボリューションの第
4ラプラシアンを前記第5フィルタ画像へ適用して第6
フィルタ画像を与え、前記第6フィルタ画像において第
2組のピークを検出する、上記各ステップを有すること
を特徴とする画像処理方法。 4、特許請求の範囲第3項において、前記第1組のピー
ク及び前記第2組のピークの両方から前記画像の記述を
確立するステップを有することを特徴とする画像処理方
法。 5、特許請求の範囲第4項において、前記確立するステ
ップが、前記第2組のピークのどれが前記第1組のピー
クのものの特定した距離内に配設されているかを検出し
、且つ前記第1組のピークの各1つと前記第1組の前記
1つの特定した距離内に配設されている前記第2の組の
ピークのものとの間の角度関係を決定する、上記各ステ
ップを有することを特徴とする画像処理方法。 6、特許請求の範囲第5項において、前記第1組のピー
クを介してのベストフィットライン、前記ベストフィッ
トライン上の点に関して前記第1組の各ピークの座標、
及び角度関係を決定することによって前記画像を特性付
けるステップを有することを特徴とする画像処理方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US07/169,798 US4905296A (en) | 1986-07-22 | 1988-03-18 | System for shape recognition |
US169,798 | 1988-03-18 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0264783A true JPH0264783A (ja) | 1990-03-05 |
Family
ID=22617225
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1064967A Pending JPH0264783A (ja) | 1988-03-18 | 1989-03-18 | 形状認識方式 |
Country Status (4)
Country | Link |
---|---|
US (1) | US4905296A (ja) |
EP (1) | EP0338677B1 (ja) |
JP (1) | JPH0264783A (ja) |
DE (1) | DE68924612T2 (ja) |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5020006A (en) * | 1989-05-03 | 1991-05-28 | Hewlett-Packard Company | Method for finding a reference point |
JPH03260782A (ja) * | 1990-03-09 | 1991-11-20 | Eastman Kodak Japan Kk | パターン認識装置 |
CA2044404C (en) * | 1990-07-31 | 1998-06-23 | Dan S. Bloomberg | Self-clocking glyph shape codes |
US5168147A (en) * | 1990-07-31 | 1992-12-01 | Xerox Corporation | Binary image processing for decoding self-clocking glyph shape codes |
USRE38758E1 (en) * | 1990-07-31 | 2005-07-19 | Xerox Corporation | Self-clocking glyph shape codes |
US5168531A (en) * | 1991-06-27 | 1992-12-01 | Digital Equipment Corporation | Real-time recognition of pointing information from video |
US10361802B1 (en) | 1999-02-01 | 2019-07-23 | Blanding Hovenweep, Llc | Adaptive pattern recognition based control system and method |
US8352400B2 (en) | 1991-12-23 | 2013-01-08 | Hoffberg Steven M | Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore |
EP0663645A3 (en) * | 1994-01-13 | 1996-07-03 | Eastman Kodak Co | Bitmap registration through gradient descent. |
US5684894A (en) * | 1994-11-28 | 1997-11-04 | Eastman Kodak Company | Scale specific and robust line/edge encoding of images |
US5867211A (en) * | 1995-10-27 | 1999-02-02 | Northrop Grumman Corporation | Apparatus and method for removing offset and shading from a video signal |
IT1292830B1 (it) * | 1997-03-28 | 1999-02-11 | Gd Spa | Metodo e dispositivo di controllo di oggetti di valore o di sicurezza in particolare banconote. |
IT1292829B1 (it) * | 1997-03-28 | 1999-02-11 | Gd Spa | Metodo e dispositivo per il controllo di banconote. |
JPH1125222A (ja) * | 1997-07-08 | 1999-01-29 | Sharp Corp | 文字切り出し方法及び文字切り出し装置 |
US6185316B1 (en) | 1997-11-12 | 2001-02-06 | Unisys Corporation | Self-authentication apparatus and method |
US7904187B2 (en) | 1999-02-01 | 2011-03-08 | Hoffberg Steven M | Internet appliance system and method |
AU2001229639A1 (en) * | 2000-01-19 | 2001-07-31 | California Institute Of Technology | Word recognition using silhouette bar codes |
US6940998B2 (en) | 2000-02-04 | 2005-09-06 | Cernium, Inc. | System for automated screening of security cameras |
US7046851B2 (en) | 2000-11-08 | 2006-05-16 | California Institute Of Technology | Image and video indexing scheme for content analysis |
US7392287B2 (en) * | 2001-03-27 | 2008-06-24 | Hemisphere Ii Investment Lp | Method and apparatus for sharing information using a handheld device |
AU2002319621A1 (en) * | 2001-07-17 | 2003-03-03 | Amnis Corporation | Computational methods for the segmentation of images of objects from background in a flow imaging instrument |
US7711174B2 (en) * | 2004-05-13 | 2010-05-04 | The Charles Stark Draper Laboratory, Inc. | Methods and systems for imaging cells |
US7907769B2 (en) * | 2004-05-13 | 2011-03-15 | The Charles Stark Draper Laboratory, Inc. | Image-based methods for measuring global nuclear patterns as epigenetic markers of cell differentiation |
TWI256232B (en) * | 2004-12-31 | 2006-06-01 | Chi Mei Comm Systems Inc | Mobile communication device capable of changing man-machine interface |
US8607151B2 (en) * | 2006-08-01 | 2013-12-10 | Nvidia Corporation | Method and system for debugging a graphics pipeline subunit |
US8432448B2 (en) | 2006-08-10 | 2013-04-30 | Northrop Grumman Systems Corporation | Stereo camera intrusion detection system |
GB0705223D0 (en) * | 2007-03-19 | 2007-04-25 | Univ Sussex | Method, apparatus and computer program for analysing medical image data |
US7982734B2 (en) * | 2007-08-01 | 2011-07-19 | Adobe Systems Incorporated | Spatially-varying convolutions for rendering soft shadow effects |
US7970237B2 (en) * | 2007-08-01 | 2011-06-28 | Adobe Systems Incorporated | Spatially-varying convolutions for rendering glossy reflection effects |
US8737703B2 (en) | 2008-01-16 | 2014-05-27 | The Charles Stark Draper Laboratory, Inc. | Systems and methods for detecting retinal abnormalities |
US8718363B2 (en) * | 2008-01-16 | 2014-05-06 | The Charles Stark Draper Laboratory, Inc. | Systems and methods for analyzing image data using adaptive neighborhooding |
US9168104B2 (en) * | 2008-06-23 | 2015-10-27 | John Richard Dein | Intra-operative system for identifying and tracking surgical sharp objects, instruments, and sponges |
WO2010124062A1 (en) * | 2009-04-22 | 2010-10-28 | Cernium Corporation | System and method for motion detection in a surveillance video |
TWI417428B (zh) * | 2009-05-27 | 2013-12-01 | Univ Nat Central | Continuous micro - anodic electroplating device and method thereof |
US9607202B2 (en) * | 2009-12-17 | 2017-03-28 | University of Pittsburgh—of the Commonwealth System of Higher Education | Methods of generating trophectoderm and neurectoderm from human embryonic stem cells |
US9390322B2 (en) * | 2013-07-09 | 2016-07-12 | 3M Innovative Properties Company | Systems and methods for note content extraction and management by segmenting notes |
KR102206060B1 (ko) | 2013-11-19 | 2021-01-21 | 삼성전자주식회사 | 전자 장치의 효과 디스플레이 방법 및 그 전자 장치 |
US9646225B2 (en) * | 2015-08-21 | 2017-05-09 | Sony Corporation | Defocus estimation from single image based on Laplacian of Gaussian approximation |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4472786A (en) * | 1982-04-23 | 1984-09-18 | The United States Of America As Represented By The Secretary Of The Navy | Analog Gaussian convolver |
US4532548A (en) * | 1983-01-27 | 1985-07-30 | Hughes Aircraft Company | Resolution enhancement and zoom |
US4658372A (en) * | 1983-05-13 | 1987-04-14 | Fairchild Camera And Instrument Corporation | Scale-space filtering |
US4685071A (en) * | 1985-03-18 | 1987-08-04 | Eastman Kodak Company | Method for determining the color of a scene illuminant from a color image |
US5119444A (en) * | 1986-07-22 | 1992-06-02 | Schlumberger Technologies, Inc. | System for expedited computation of laplacian and gaussian filters and correlation of their outputs for image processing |
-
1988
- 1988-03-18 US US07/169,798 patent/US4905296A/en not_active Expired - Lifetime
-
1989
- 1989-03-17 EP EP89302631A patent/EP0338677B1/en not_active Expired - Lifetime
- 1989-03-17 DE DE68924612T patent/DE68924612T2/de not_active Expired - Fee Related
- 1989-03-18 JP JP1064967A patent/JPH0264783A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
DE68924612T2 (de) | 1996-04-04 |
DE68924612D1 (de) | 1995-11-30 |
EP0338677B1 (en) | 1995-10-25 |
US4905296A (en) | 1990-02-27 |
EP0338677A3 (en) | 1992-05-20 |
EP0338677A2 (en) | 1989-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0264783A (ja) | 形状認識方式 | |
US11854173B2 (en) | System and method for finding lines in an image with a vision system | |
EP2138978B1 (en) | System and method for finding stable keypoints in a picture image using localized scale space properties | |
US7340089B2 (en) | Geometric pattern matching using dynamic feature combinations | |
US5647027A (en) | Method of image enhancement using convolution kernels | |
JP2002157591A (ja) | 対象物認識システム及び方法 | |
CN102982528A (zh) | 图像处理装置及图像处理方法 | |
US7630560B2 (en) | Increasing accuracy of discrete curve transform estimates for curve matching in four or more dimensions | |
JPH09231359A (ja) | 画像処理方法 | |
Ghita et al. | Computational approach for edge linking | |
US9858481B2 (en) | Identifying consumer products in images | |
CN117788798A (zh) | 目标检测方法、装置、视觉检测系统及电子设备 | |
CN110704667B (zh) | 一种基于语义信息的快速相似图检测方法 | |
Tsai et al. | Real-time textureless object detection and recognition based on an edge-based hierarchical template matching algorithm | |
CN116030236A (zh) | 针对移动应用页面中动态区域的快速检测方法 | |
JPH0962838A (ja) | 高速パターンマッチング方法 | |
JP3016687B2 (ja) | 画像処理装置 | |
Surekha et al. | Implementation of High Performance Speeded Up Robust features Detection | |
JP4243577B2 (ja) | 類似画像検索装置、方法およびプログラム | |
JP3447717B2 (ja) | 画像処理装置 | |
Apostolescu et al. | Image processing for feature detection and extraction | |
Mustafa | Quick Dissimilarity Detection for Center-Based Binary Images Via Smart Mapping | |
Sameer | A General Overview on the Categories of Image Features Extraction Techniques: A Survey | |
Liu et al. | A new fast and robust template matching with randomness | |
Amiri et al. | Survey of HARRIS, SIFT and SURF Feature Points |