JP2010134957A - パターン認識方法 - Google Patents
パターン認識方法 Download PDFInfo
- Publication number
- JP2010134957A JP2010134957A JP2010023965A JP2010023965A JP2010134957A JP 2010134957 A JP2010134957 A JP 2010134957A JP 2010023965 A JP2010023965 A JP 2010023965A JP 2010023965 A JP2010023965 A JP 2010023965A JP 2010134957 A JP2010134957 A JP 2010134957A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- descriptor
- invariant
- fourier
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
- G06V30/422—Technical drawings; Geographical maps
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
- G06V10/431—Frequency domain transformation; Autocorrelation
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Image Analysis (AREA)
- Character Discrimination (AREA)
Abstract
【課題】単純化された態様でパターン認識を行うこと。
【解決手段】パターン検出ステップ2と、このパターン検出ステップ2において得られたパターンの特性付けを行う特性付与ステップ3と、この特性付与ステップ3において得られたパターンの認識を行う認識ステップ4と、を順に行うパターン認識方法であって、パターン特性付与ステップにおいては、MF (p,q)をパターンのフーリエ−メリーン変換としかつp,qを回転およびスケール変化のそれぞれに対応したパターンの不変量を示す係数としたときに、フーリエ−メリーン空間内におけるパターンDF (p,q)の不変量記述子を得る。
【選択図】図1
【解決手段】パターン検出ステップ2と、このパターン検出ステップ2において得られたパターンの特性付けを行う特性付与ステップ3と、この特性付与ステップ3において得られたパターンの認識を行う認識ステップ4と、を順に行うパターン認識方法であって、パターン特性付与ステップにおいては、MF (p,q)をパターンのフーリエ−メリーン変換としかつp,qを回転およびスケール変化のそれぞれに対応したパターンの不変量を示す係数としたときに、フーリエ−メリーン空間内におけるパターンDF (p,q)の不変量記述子を得る。
【選択図】図1
Description
本発明は、パターンの向きやサイズにかかわらずにパターン認識を行えるようなパターン認識方法に関するものである。
本発明は、デジタルイメージ処理に応用することができる。より詳細には、例えば技術文書といったような文書の認識の分野に応用することができる。
向きにかかわらずパターン認識が行えるような2つのパターン認識方法が公知である。すなわち、
−パターンの向きを予め計算し、基準位置へとパターンをもってくるように補正する、という方法。
−向き調整を一切行わないようなパターン認識方法。
−パターンの向きを予め計算し、基準位置へとパターンをもってくるように補正する、という方法。
−向き調整を一切行わないようなパターン認識方法。
パターンの向きを補正することをベースとしたパターン認識方法は、パターンの変形をもたらす。この変形は、使用されている方法(K−NN法(K−最隣接法)、神経ネットワーク)にかかわらず、パターンの分類を困難なものとしてしまう。例えば、光学的キャラクターの認識の場合には、このことは、不適切なキャラクターを作ってしまうこととなる。
この現象は、構造化された文字の認識が要望されている場合には、問題とはならない。なぜなら、構造化された文字は、通常、一定の向きとされているからであり、段落や単語や限られた数のキャラクターフォントや他の構造的情報によってもたらされる文脈を有しているからである。この文脈は、認識の曖昧さを解決するのに有用な予備情報のかなりの部分をもたらす。
技術図面や地図の場合には、注釈や地名に対応した文字の向きは、かなりばらつきを有している。文字を、文書全体にわたって一般化することはできない。なぜなら、キャラクター列の書式が、記述されている対象物に応じて変化するからである。いくつものタイプのフォントが使用されているとともに、キャラクターのサイズや字の太さなども、様々である。したがって、そのような文書においては確かに文脈があるけれども、その文脈は、局所的なものでしかない。すなわち、図面の局所領域に制限されたものである。
向きを補正しないパターン処理方法においては、パターンは、回転変換や並進移動変換や規定変換に関して不変の特定の記述子を使用して記述される。この記述を行うために、このような方法においては、構造基本単位の抽出、あるいは、問題を上記各変換に関して不変とする分類技術の使用、のいずれかを必要とする。
公知の主要な方法においては、不変モーメント抽出、円内基本単位抽出、あるいは、認識すべきパターンの外郭線上におけるフーリエ記述子の抽出、のいずれかを使用している。
Faouzi Ghorbel,A complete invariant description for gray-level images by the harmonic analysis approach,Pattern Recognition Letters 15,1994年10月,第1043〜1051頁
不変モーメント抽出においては、パターンを正確に記述するために、非常に大きな次数のモーメントを必要とする。モーメントの次数におけるこの伝搬は、計算値の動特性やエラー伝搬に基づく分類の問題をもたらすことがある。
したがって、パターンからの不変モーメントの抽出は、かなり複雑なアルゴリズムを生成する。このことにより、パターン認識処理における処理速度が、かなり遅くなる。
円内基本単位抽出方法においては、中心からプローブを送出するようなを円でもってパターン囲むことによってパターンを記述する。このプローブは、円の半径に応じたパターンのスペクトル形状を記述するために使用される。各パターンに対して十分な数の半径を形成することによって、パターンの特性値からなる表を作ることができる。パターンを決定するには、表中の値を、基準値と比較する。
円内基本単位抽出方法も、また、かなり複雑なアルゴリズムを生成する。例えば、認識すべきパターンが記号に対応している場合には、円内基本素子の使用は、必要に応じて、この場合には様々なプローブに対して多数の半径を形成することによって、かなり多数の数値を含んだ表を作ることとなってしまう。
加えて、これら方法は、イメージ上のノイズ感受性(信号/雑音比)に関連した問題をもたらす。
パターンの外郭線上におけるフーリエ記述子の抽出は、かなりの数の問題をもたらす。
まず第1に、スケールや向きの変更に関して不変であるような信頼性高くかつ関連した基本単位を決定することが困難であり、不可能でさえある。第2に、記述子が完全ではなく(記述子からのイメージの再構成が可能である)、このことは、記述子の弱さを伝達する。最後に、実験により、計算ノイズに対する感受性を小さく維持しつつ完全に記述されるパターンから関連次数を決定することが困難であることが示された。
本発明は、上記欠点を有していない。本発明は、パターン検出ステップと、このパターン検出ステップにおいて得られたパターンの特性付けを行う特性付与ステップと、この特性付与ステップにおいて得られたパターンの認識を行う認識ステップと、を順に行うパターン認識方法に関するものである。本発明においては、パターン特性付与ステップにおいて、MF (p,q)をパターンのフーリエ−メリーン変換としかつp,qを回転およびスケール変化のそれぞれに対応したパターンの不変量を示す係数としたときに、次式のようにして、フーリエ−メリーン空間内におけるパターンの不変量記述子DF (p,q)が得られる。
DF(p,q)=MF(p,q)[MF(1,1)]−q|MF(1,1)|q[MF(1,0)]−p
本発明によるパターン認識方法は、すべてのタイプのパターンに対して応用することができる。例えば、パターンは、曲線(閉塞していても閉塞していなくても良い)および/または表面を規定する有限数のポイントからなる組とすることができる。
本発明の利点は、パターンの全体的文脈を無視することによって、また、パターンに対して形状変換を施すことなく、パターン認識が行えることである。
多くの背景において、パターンどうしは、互いにくっついていることもあり得るし、互いにオーバーラップしていることもあり得る。これらパターンの認識は、困難な問題点をもたらす。本発明による方法は、この種の問題点に対する有効な解決手段をもたらす。
図1は、本発明によるパターン認識方法のブロック図を示している。
このパターン認識方法は、以下の連続した4つの主要ステップを具備している。すなわち、
−オリジナルイメージIを前処理することにより、前処理済みイメージIS を生成するという前処理ステップ1と、
−前処理済みイメージIS 内に含まれているパターンFを検出するという検出ステップ2と、
−検出されたパターンFを特性づけることにより、パターンFの記述子を形成するという特性付与ステップ3と、
−当該パターンの記述子を基準記述子と比較することにより、パターン認識を行うパターン認識ステップと、
を具備している。
−オリジナルイメージIを前処理することにより、前処理済みイメージIS を生成するという前処理ステップ1と、
−前処理済みイメージIS 内に含まれているパターンFを検出するという検出ステップ2と、
−検出されたパターンFを特性づけることにより、パターンFの記述子を形成するという特性付与ステップ3と、
−当該パターンの記述子を基準記述子と比較することにより、パターン認識を行うパターン認識ステップと、
を具備している。
まず最初に、前処理ステップ1においては、オリジナルイメージIを走査することによって、ソースイメージを形成する。
例えば、イメージIは、例えば15.75ドット/mm(400dpi(ドットパーインチ))よりも大きいような、高解像度の8ビットフォーマットで走査される。次に、ソースイメージが処理されて、ソースイメージの中の興味のある領域が形成される。ソースイメージは、例えばしきい値によって処理される。例えば、しきい値アルゴリズムによってソースイメージのグレーレベルヒストグラムから形成されたしきい値レベルを適用することによって処理される。このしきい値は、ソースイメージのヒストグラム内に、いくつかの(少なくとも2つの)カテゴリーのグレーレベルを形成するために使用される。例えば、これらカテゴリーのうちの少なくとも1つは、ソースイメージの背景に対応しており、保持されることはない。すなわち、この場合、背景モードは、ソースイメージ内においてゼロへとリセットされる。この処理により、ソースイメージのうちの興味のある領域を形成するために使用されるマスクを演繹することができる。マスキングイメージは、ソースイメージにマスクを適用することによって得られる。したがって、このマスキングイメージは、この時点において、オリジナルイメージIの中で、重要なものとして選択された要素だけを含有している。
次に、このマスキングイメージに対して局所的処理が行われる。つまり、適用可能なしきい値を、しきい値アルゴリズムを使用して、マスキングイメージに対して適用する。これにより、しきい値処理されたイメージIS が得られる。マスキングイメージに対して実行されるしきい値処理は、ソースイメージに対して直接的に実行される場合よりも、より厳密なものである。特に、この処理を行うことにより、しきい値処理をソースイメージに対して直接的に行った場合になされていたであろうものよりも、イメージの詳細を識別することができる。
ステップ2は、しきい値処理済みイメージIS 内において認識すべきパターンを検出するために、行われる。
文字や記号の認識結果が付与されることとなるパターンは、特定の形状および統計学的特性を備えた要素の組によって、イメージ内に示されている。
本発明の第1応用例においては、このパターン検出ステップは、パターン関連要素抽出ステップを備えている。パターン関連要素は、外郭線抽出器により、また、外郭線内に含まれているポイントを検出し得るよう走査アルゴリズムを外郭線内部に適用することにより、抽出される。このような関連要素抽出ステップに対する特許出願は、“Document, particularly technical drawing, pattern recognition and segmentation process”と題して、1998年5月7日付けで本出願人によって出願されている。以下、この抽出ステップについて説明する。
関連要素抽出器を使用して文字が抽出される。パターン認識を行うべきパターンに対しての文字や記号だけを保持するために、要素のサイズに対してのフィルタリングが行われ、文字や記号のサイズとして不適切なサイズを有したものが除外される。
第1ステップの第1ステージにおいては、抽出操作が、しきい値処理済みイメージIS 内に存在する関連画素クラスターに対して、行われる。このようにして、各々が同様の画素クラスターすなわちパターンをを表しているような基本イメージが、形成される。
これらパターンは、形状的基準に従って並べ替えられる。セグメント化操作を行うことにより、パターンに対してラベル付けが行われ、形状的基準に従ったパターンの分類が行われる。セグメント化操作によって、文書を表した物理的「層」からなる組が形成される。形状に従ってパターンを並べ替えることにより、各パターンに対して特別化された認識アルゴリズムを適用することができる。
このようにして形成されたいくつかの物理的層の各々は、ソースイメージIS に対してのマスクと見なすことができる。ソースイメージIS に対してこのようなマスクを適用することによって、認識のためのパターンを含有したイメージ領域を抽出することができる。このようにして、各物理的層を使用して、ソースイメージIS のグレーレベル内に、対応情報を得ることができる。
次に、イメージのセグメント化を改良するために、認識のための各パターンに対して、しきい値処理を行うことができる。認識のためのパターンに対する新たなしきい値が決定されると、このパターンに対して、新たなサイクルを繰り返すことができる。つまり、パターンを、関連マスクのサイズによって再度セグメント化することができる。次に、ソースイメージIS 内に含有されているように思われるパターンを分離することができる。関連要素抽出アルゴリズムとしては、多数のものが存在する。好ましくは、本発明において使用される関連要素抽出アルゴリズムは、外郭線抽出器をベースとしたものである。外郭線抽出器をベースとしたアルゴリズムの利点は、要素のうちの幾何形状的基本単位および構造的基本単位(重心、周縁部、閉塞、等)を含むことができることである。
本発明の第2応用例においては、パターン検出ステップは、検出すべきパターンを指定する予備ステップを備えている。検出されるべきパターンの事前指定をベースとしたこのパターン認識の使用は、複数の含有パターンの中からパターンを識別する際に特に有効である。検出されるべき文字や記号のリストに関する予備知識は、要素解析アルゴリズムにおいて考慮すべき前提条件の設定を容易なものとする。本発明のこの第2応用例においては、パターン検出ステップにおいて、上述のような抽出ステップを行う必要はない。
ステップ3は、ステップ2において得られたパターンFの特性付与ステップである。本発明においては、この特性付与ステップは、フーリエ−メリーン変換を使用して不変記述子を得るために、使用される。
F(ρ,θ)を、極座標系(ρ,θ)において規定されたパターンとする。フーリエ−メリーン変換は、次式によって示される。
ここで、σ0 は、積分収束の問題を満たすために機能的に決定されたパラメータであって、σ0 >0である。これにより、スケール変化や回転に関して不変であることが保証される。
デカルト座標(x,y)への変換は、次式(2)によって与えられる。この場合、σ0 =1である。
式(1)(2)において使用されている「p」および「q」は、パターンF(ρ,θ)の、それぞれ、回転に関しての不変性をもたらす係数(p)およびスケール変化に関しての不変性をもたらす係数(q)である。
イメージは、複数のポイントからなる有限個の組である。次式(3)は、式(2)の離散変数バージョンである。
式(3)は、複素数係数の、パターンFとフィルタhとの間への畳込み積分(コンボルーション)である。
フーリエ−メリーン変換は、本質的には、スケール因子および回転に関して不変ではない。しかしながら、次式のようにして、不変記述子DF(p,q) を演繹することができる。
DF(p,q)=MF(p,q)[MF(1,1)]−q|MF(1,1)|q[MF(1,0)]−p
式(4)において最も興味深い点は、この式を使用することによって、任意のパターンから、スケール変化や向き変化に関して全体的に不変であるような特性を有したベクトルを抽出できることである。
互いに異なるサイズや向きとされていても同一パターンであれば同一の不変ベクトルを有していることにより、様々な向きを有した文字や記号の認識に際してこの式を適用することは、非常に有利である。
式(3)は、完全性という性質を有している。有利には、本発明によるパターンの記述子は、パターンの完全な記述を可能とする。モードp,qを抽出することにより、パターンのスケール要因や回転要因に関して不変の記述子が得られる。「p」および「q」として可能な値の数は、必要とされるパターン特性付与精度と、記憶しておくべきフィルタ数と、の間の妥協として選択される。
多数の数の試料に関する統計的テストによって、比較的低次数のパターンについての不変計算でもって十分にパターン識別が行えることにより、本方法の強度が示される。多数の例示が、係数p、qに対しての0〜4次に制限された計算であっても優秀な認識率が十分に得られることを示している。
ステップ4は、パターン認識ステップであって、このステップにおいては、フーリエ−メリーン変換において得られた記述子DF を基準記述子と比較する。本発明においては、パターン認識ステップは、基準記述子の学習ステップを備えている。ステップ4は、原理支配神経ネットワークに応じて適用される。
神経ネットワークは、相互連結された複数の基本セルからなる組として説明することができる。
ニューロンと称される各神経セルは、同じタイプのいくつかの他のニューロンと相互連結されている。他のニューロンに対しての各ニューロンの相互連結構造は、ネットワーク体系を形成しており、ネットワークの推論可能性つまり学習可能性と意志決定可能性とに関して、無視できない影響を有している。ネットワーク構造は、ネットワーク動作モードに応じて、時間的に一定のものとすることも、時間的に可変のものとすることも、できる。このように、個々の体系に応じて、すべてのニューロンが互いに相互連結されているネットワークもあるし、複数のニューロンが複数の層を形成するようにして配置されていてデータのやりとりが層どうしの間で行われるようになっているネットワークもある。
各基本セルの構造は、比較的標準的であって、通常、ヒトの神経を単純化したモデルをベースとしている。この基本構造は、通常、1組をなす複数の入力ポート(ヒトの脳におけるシナプスを表している)と、1つの出力ポートと、を備えて構成されている。基本セルの動作は、非常に単純なものである。というのは、この動作においては、入力ポートに到達するデジタル値の関数として出力ポートのレベル(デジタル値)を計算するからである。したがって、各セルは、「シナプス係数」として公知のニューロン入力ポートに応じた、非常に単純化された計算容量しか有していない。ニューロンのシナプス係数は、各ニューロン入力ポートに対して割り当てられた重みに対応している。
各入力ポート上において、各ニューロンは、1組をなすデジタル値を受領し、入力ポートやシナプス係数やセル計算関数に応じた値を再送出する。
神経ネットワークの動作は、2つのステージに分けることができる。すなわち、学習ステージとテストステージとに分けることができる。学習ステージは、ヒトの学習ステージと同等のものである。なぜなら、このステージにおいては、知りたいことのすべてをネットワークに対して教えるというステップを行うからである。このステップにおいては、ネットワークは、置換および構築ステージにあり、実行されるすべての計算の目的は、ネットワークの応答を予想された応答とするよう、シナプス係数値を計算して最適化することである。テストステージにおいては、ネットワークは、通常、もはや変更されることがなく、供給された入力に対して単に応答を返すのみである。
学習ステージにおいては、テストステージにおいて要求されるであろうデータを代理するようなデータセットを、神経ネットワークに対して付与する。このデータセットは、学習ベースと称される。学習ベースの項目がネットワークに対して供給されたときには、ネットワークは、学習ベースとネットワーク応答との間の最適な対応関係を見出すために、様々なアルゴリズムを使用して、シナプス係数の値を構築し最適化する。
テストステージにおいては、項目がネットワークに対して供給され、供給された項目が、デジタル値の組へと変換されるすなわちデジタル値の組によって表現される。そして、ネットワークは、入力と様々なシナプス係数との関数として、応答を提示する。
文献レベルにおいて多数の学習手法が記載されており、学習手法は、選択されたアルゴリズムとネットワーク構造とに依存する。文献には、かなり幅広い種類のネットワーク構造が記載されている。このうち、いくつかの主要な傾向に注目することができる。つまり、
−複数層知覚をベースとした組合せネットワーク。
−完全な連結が行われている動的ネットワーク。
−競合ネットワーク(Kohonen ネットワーク、LVQ(「学習ベクトルの量子化」)ネットワーク、等)。
−再循環ネットワーク、つまり、出力ポートから入力ポートへとループが形成されたネットワーク。
−局所連結ネットワーク。
−時間遅延型神経ネットワーク(TDNN)。
−適用型構造ネットワーク。
−複数層知覚をベースとした組合せネットワーク。
−完全な連結が行われている動的ネットワーク。
−競合ネットワーク(Kohonen ネットワーク、LVQ(「学習ベクトルの量子化」)ネットワーク、等)。
−再循環ネットワーク、つまり、出力ポートから入力ポートへとループが形成されたネットワーク。
−局所連結ネットワーク。
−時間遅延型神経ネットワーク(TDNN)。
−適用型構造ネットワーク。
したがって、学習アルゴリズムは、採用されているネットワーク構造に依存する。文献においては、多数の学習手法が知られているけれども、いくつかのものは、実施が容易であることから、広く知れ渡っているように思われる。これらのうち、傾斜後方伝搬アルゴリズム(複数層知覚をベースとしたネットワーク)と、ニューロンどうしの間の競合をベースとしたアルゴリズム(Kohonen) と、に着目することができる。
上述のように、学習ステージは、テストステージにおいてプロセスに対して要求されるであろうデータを代理するようなデータセットを、神経ネットワークに対して付与するという段階を含んでいる。
本発明においては、テストステージにおいて処理すべきデータは、フーリエ−メリーン変換において得られた記述子DF を備えている。よって、学習ステージにおいて神経ネットワークに対して提示されるデータは、基準記述子を形成するために使用された項目を含んでいる。テストステージにおいては、フーリエ−メリーン変換において得られた記述子DF が、基準記述子と比較される。
有利には、本発明においては、基準記述子の決定は、非常に単純である。なぜなら、基準記述子の決定が、例えば0〜4次といったような比較的低次数のp、qを備えたフーリエ−メリーン不変量を使用したパターンの記述をベースとしているからである。
本発明における好ましい応用においては、選択された学習手法は、競合ネットワークのタイプである。
図2は、本発明の第1応用例におけるパターン認識方法の使用を示すフローチャートである。
より詳細には、図2は、検出された関連パターンの認識に際してのフーリエ−メリーン変換の非決定論的使用を示している。非決定論的使用とは、検出されるべきパターンの予備指定を行わないような、本発明によるパターン認識方法の使用を意味している。
第1設定ステップ5は、認識されるべきパターンの回転およびスケール変化のそれぞれに関する不変量に係わる係数p、qに対して割り当てるべき値を選択するために、行われる。
ステップ5の次には、ステップ6として、フーリエ−メリーン変換のフィルタの計算が行われ、記憶される。すなわち、p、qの値に基づいて、フィルタMF (p,q)が計算される。
ステップ6の次には、イメージ読込ステップ7が行われ、このイメージ読込ステップ7においては、イメージが導入されて走査される。ステップ7の次のステップ8においては、イメージの走査とセグメント化されたパターンの検出とが行われる。このステップにおいては、パターンの関連クラスターを決定する。
ステップ8の次には、検出されたパターンの関連要素の計算ステップ9が行われる。そして、次なるステップ10においては、パターンの関連要素に基づいて、フーリエ−メリーン不変量記述子が計算される。
ステップ10において得られた不変記述子は、その後、ステップ11において、学習ステップ(図示せず)によって得られている基準記述子D(r)と比較される。
イメージの全体が走査され終わると、パターン認識方法が完了する(ステップ13)。そうでなければ、ステップ8へと戻る。
図3は、本発明の第2応用例におけるパターン認識方法の使用を示すフローチャートである。
より詳細には、図3は、検出された関連パターンの認識に際してのフーリエ−メリーン変換の決定論的使用を示している。決定論的使用とは、検出されるべきパターンの予備指定を行うような、本発明によるパターン認識方法の使用を意味している。
この場合には、パターン認識に対して干渉を起こす傾向のあるデータセットから予め指定されたパターンを識別して認識することができる。本発明においては、予め指定されたパターンは、完全であり全体的であり安定であるという特性を有した不変量記述子によって記述される。
第1ステップ14は、上記設定ステップ5に対応している。
ステップ14の次には、フーリエ−メリーン変換の基準フィルタの選択ステップ15が行われる。すなわち、前もって位置決めされたパターンに対応したフーリエ−メリーンフィルタが選択される。
そして、フーリエ−メリーン変換の基準フィルタに対応した基準記述子が、計算される。この方法においては、基準記述子の学習ステップを備えている。
ステップ15の次には、イメージ読込ステップ16が行われ、このイメージ読込ステップ16は、上記ステップ7と同一である。すなわち、このステップ16においては、イメージが導入されて走査される。ステップ16の次のステップ17においては、イメージが、スライドウィンドウによって走査される。イメージの各ウィンドウにおいて、イメージに対してフーリエ−メリーンフィルタの畳込み積分が計算される(ステップ17の後のステップ18)。この計算によって、不変量記述子が演繹される。
不変量記述子と基準記述子とが対応していれば、パターンが認識され格納される(ステップ21)。対応しておらず、かつ、イメージ全体の走査が終了すれば、パターン認識方法が完了する(ステップ22)。対応しておらず、かつ、イメージ全体の走査が終了していなければ、ステップ17へと戻る。
1 前処理ステップ
2 検出ステップ
3 特性付与ステップ
4 認識ステップ
2 検出ステップ
3 特性付与ステップ
4 認識ステップ
Claims (2)
- パターン認識方法であって、
イメージのパターンF(ρ,θ)を検出し、
p,qを、回転およびスケール変化のそれぞれに対応したパターンの不変量を示す係数としたときに、さらに、MF (p,q)を、次式によって表されるパターンのフーリエ−メリーン変換としたときに、
DF(p,q)=MF(p,q)[MF(1,1)]−q|MF(1,1)|q[MF(1,0)]−p
のようにして、フーリエ−メリーン空間内におけるパターンF(ρ,θ)の不変量記述子DF (p,q)を決定し、
前記パターンの前記不変量記述子と基準記述子とを比較することにより、前記パターンを認識することを特徴とする方法。 - システムであって、
学習ステージとテストステージとを実行し得るよう構成された神経ネットワークを具備してなり、
前記学習ステージにおいては、前記テストステージにおいて要求されるデータを代理するようなデータセットを、前記神経ネットワークに対して付与し、
前記データセットを使用することにより、基準記述子が形成され、
前記テストステージにおいて要求される前記データが、フーリエ−メリーン変換によって得られた請求項1における不変量記述子DF (p,q)を備え、
前記テストステージにおいては、前記不変量記述子DF (p,q)と前記基準記述子とが比較されることを特徴とするシステム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9902632A FR2790571B1 (fr) | 1999-03-03 | 1999-03-03 | Procede de reconnaissance de formes |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000057251A Division JP2000259766A (ja) | 1999-03-03 | 2000-03-02 | パターン認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010134957A true JP2010134957A (ja) | 2010-06-17 |
Family
ID=9542766
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000057251A Ceased JP2000259766A (ja) | 1999-03-03 | 2000-03-02 | パターン認識方法 |
JP2010023965A Pending JP2010134957A (ja) | 1999-03-03 | 2010-02-05 | パターン認識方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000057251A Ceased JP2000259766A (ja) | 1999-03-03 | 2000-03-02 | パターン認識方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US6694054B1 (ja) |
EP (1) | EP1035493A1 (ja) |
JP (2) | JP2000259766A (ja) |
CA (1) | CA2299859A1 (ja) |
FR (1) | FR2790571B1 (ja) |
NO (1) | NO20001089L (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050096999A1 (en) * | 2003-11-05 | 2005-05-05 | Chicago Mercantile Exchange | Trade engine processing of mass quote messages and resulting production of market data |
US7831491B2 (en) * | 2003-11-05 | 2010-11-09 | Chicago Mercantile Exchange Inc. | Market data message format |
US7599867B1 (en) | 2004-06-30 | 2009-10-06 | Trading Technologies International, Inc. | System and method for chart pattern recognition and analysis in an electronic trading environment |
GB0427737D0 (en) * | 2004-12-17 | 2005-01-19 | Univ Cambridge Tech | Method of identifying features within a dataset |
JP4107302B2 (ja) * | 2005-03-22 | 2008-06-25 | セイコーエプソン株式会社 | 印刷装置、画像処理装置、印刷方法、画像処理方法、および変換テーブルの作成方法 |
JP4686762B2 (ja) * | 2005-06-07 | 2011-05-25 | 独立行政法人産業技術総合研究所 | 三次元形状の位置あわせ方法及びプログラム |
WO2007016936A1 (en) * | 2005-07-29 | 2007-02-15 | Telecom Italia, S.P.A. | Automatic biometric identification based on face recognition and support vector machines |
WO2007073425A2 (en) * | 2005-09-22 | 2007-06-28 | Iq Company | Graphical forecasting interface |
US8116553B2 (en) * | 2007-10-03 | 2012-02-14 | Siemens Product Lifecycle Management Software Inc. | Rotation invariant 2D sketch descriptor |
US11164248B2 (en) | 2015-10-12 | 2021-11-02 | Chicago Mercantile Exchange Inc. | Multi-modal trade execution with smart order routing |
US11288739B2 (en) | 2015-10-12 | 2022-03-29 | Chicago Mercantile Exchange Inc. | Central limit order book automatic triangulation system |
US11486721B2 (en) * | 2018-09-30 | 2022-11-01 | Strong Force Intellectual Capital, Llc | Intelligent transportation systems |
EP3856596A4 (en) | 2018-09-30 | 2022-10-12 | Strong Force Intellectual Capital, LLC | INTELLIGENT TRANSPORT SYSTEMS |
FR3113432B1 (fr) | 2020-08-12 | 2022-08-05 | Thibault Autheman | Procede de classification automatique d’images |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0628476A (ja) * | 1992-07-09 | 1994-02-04 | Nec Corp | 画像信号の処理装置 |
JPH08226961A (ja) * | 1995-02-21 | 1996-09-03 | Tech Res & Dev Inst Of Japan Def Agency | 自動目標識別装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5274714A (en) * | 1990-06-04 | 1993-12-28 | Neuristics, Inc. | Method and apparatus for determining and organizing feature vectors for neural network recognition |
GB9201006D0 (en) * | 1992-01-17 | 1992-03-11 | Philip Electronic And Associat | Classifying faces |
US6282300B1 (en) * | 2000-01-21 | 2001-08-28 | Signafy, Inc. | Rotation, scale, and translation resilient public watermarking for images using a log-polar fourier transform |
-
1999
- 1999-03-03 FR FR9902632A patent/FR2790571B1/fr not_active Expired - Lifetime
-
2000
- 2000-02-29 EP EP00400548A patent/EP1035493A1/fr not_active Ceased
- 2000-03-01 US US09/516,361 patent/US6694054B1/en not_active Expired - Lifetime
- 2000-03-01 CA CA002299859A patent/CA2299859A1/en not_active Abandoned
- 2000-03-02 JP JP2000057251A patent/JP2000259766A/ja not_active Ceased
- 2000-03-02 NO NO20001089A patent/NO20001089L/no not_active Application Discontinuation
-
2010
- 2010-02-05 JP JP2010023965A patent/JP2010134957A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0628476A (ja) * | 1992-07-09 | 1994-02-04 | Nec Corp | 画像信号の処理装置 |
JPH08226961A (ja) * | 1995-02-21 | 1996-09-03 | Tech Res & Dev Inst Of Japan Def Agency | 自動目標識別装置 |
Also Published As
Publication number | Publication date |
---|---|
CA2299859A1 (en) | 2000-09-03 |
EP1035493A1 (fr) | 2000-09-13 |
JP2000259766A (ja) | 2000-09-22 |
US6694054B1 (en) | 2004-02-17 |
FR2790571B1 (fr) | 2003-04-04 |
NO20001089L (no) | 2000-09-04 |
NO20001089D0 (no) | 2000-03-02 |
FR2790571A1 (fr) | 2000-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2010134957A (ja) | パターン認識方法 | |
US8750619B2 (en) | Character recognition | |
EP0363828A2 (en) | Method and apparatus for adaptive learning type general purpose image measurement and recognition | |
US20200134382A1 (en) | Neural network training utilizing specialized loss functions | |
CN111898621A (zh) | 一种轮廓形状识别方法 | |
CN113221956B (zh) | 基于改进的多尺度深度模型的目标识别方法及装置 | |
CN111553422A (zh) | 手术器械自动识别回收方法及系统 | |
CN115527072A (zh) | 一种基于稀疏空间感知与元学习的芯片表面缺陷检测方法 | |
CN114444566A (zh) | 一种图像伪造检测方法、装置以及计算机存储介质 | |
Bhanu et al. | Introduction to the special section on learning in computer vision | |
CN116912604B (zh) | 模型训练方法、图像识别方法、装置以及计算机存储介质 | |
CN113688821A (zh) | 一种基于深度学习的ocr文字识别方法 | |
CN111339974B (zh) | 一种现代陶瓷与古陶瓷的鉴别方法 | |
US11715288B2 (en) | Optical character recognition using specialized confidence functions | |
CN115170854A (zh) | 基于端到端的PCANetV2的图像分类方法和系统 | |
CN112613341A (zh) | 训练方法及装置、指纹识别方法及装置、电子设备 | |
Rodrigues et al. | Feature extraction using contour projection | |
Acula et al. | Offline Signature Verification System using CNN Algorithm Combined with Histogram of Oriented Gradients | |
Roy et al. | Recognizing Bangla Handwritten Numerals: A Hybrid Model | |
Toyama et al. | A new fitness function for shape detection using genetic algorithm | |
Ansari et al. | Copy-Move (Cloning) Image Forgery Detection using Wavelets and Projection Profiling | |
Egorov et al. | Using neural networks to recognize text labels of raster navigation maps | |
Kaméus et al. | Comparing Convolutional Neural Networks to traditional methods and the human eye for copy-move forgery detection | |
CN113554038A (zh) | 一种纸币水印图像lbp特征图的计算方法 | |
JP2023005937A (ja) | 機械学習モデルを用いて被判別データのクラス判別処理を実行する方法、情報処理装置、及び、コンピュータープログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20100517 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110708 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110712 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120814 |