JP3618796B2 - パターン認識方法および装置 - Google Patents
パターン認識方法および装置 Download PDFInfo
- Publication number
- JP3618796B2 JP3618796B2 JP24386194A JP24386194A JP3618796B2 JP 3618796 B2 JP3618796 B2 JP 3618796B2 JP 24386194 A JP24386194 A JP 24386194A JP 24386194 A JP24386194 A JP 24386194A JP 3618796 B2 JP3618796 B2 JP 3618796B2
- Authority
- JP
- Japan
- Prior art keywords
- pixel
- lattice
- box
- matrix
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Description
【産業上の利用分野】
本発明は、一般的には画像処理、特に、光学式文字のようなパターン認識に関するものであって、具体的には、検出済みパターンを格子ボックスに分割し、前記ボックスの連結度と画素密度とを、参照パターンの中で、対応する連結度と画素密度とに比較することによって実現するものである。
【0002】
【従来の技術】
パターン認識に関しては過去さまざまな方法が提案されてきた。特に、光学式文字認識(OCR)の分野では、多大な研究開発が実施されてきた。例えば、S.N.Srihari, V.Govindaraju, J.J.Hull, R.K.Fenrich and S.Lam による「パターン認識、文字認識と光学式文字認識装置」”Pattern Recognition, Character Recognition and Optical Character Readers” 技術報告 CEDAR−TR−91−1(米国、ニューヨーク州、バッファロー市所在のニューヨーク州立大学のドキュメント分析と認識センター、1991年5月発行)を参照されたい。
【0003】
OCRに関する従来の方法には実にさままざまなアプローチがある。例えば、初期の研究には、検出した画像のビットマップを既知文字のテンプレートに重ね合わすという試みがあった。しかし、この方法には、フォントの相違、ずれ、拡大、縮小などの要因に極度に影響されるという問題があった。その他には、検出した文字の中から特定の特徴だけを抽出するという試みもあった。しかし、その成果は、特徴の選択と処理の方法によって大きく異なってしまうという問題があった。
【0004】
Nakano他による米国特許第3,846,752号では、文字の密度分布を利用した文字認識が開示されている。この装置では、密度分布の周波数スペクトルを既知文字に対応した密度分布の周波数スペクトルと比較し、フーリエ変換スペクトルのパターンが検出済みの文字のスペクトルに最も類似している既知文字が認識済み文字として出力される。
【0005】
Marshall他による米国特許第4,817,176号では、振幅と位相が相違する場合にフーリエ変換を使用してさまざまな補正を実施するパターン認識手法が開示されている。
【0006】
Henrichon、Jr.他による米国特許第3,930,231号では、パターン密度の検出と特徴の認識に多重セル格子の使用が開示されている。この方式では、検出された文字に対して認識可能な個々の特徴の有無を調べてベクトル信号を生成し、既知文字を示すベクトルと前記ベクトルを比較する。
【0007】
Ginsburgによる米国特許第3、993,976号では、変換を使用して空間周波数を獲得するパターン分析が開示されている。この方式では、空間周波数をフィルターにかけて、パターン情報を抽出し、検出済みパターンが有する一般形状、端点、テクスチャ、および深さに関する情報を決定する。
【0008】
Henshawによる米国特許第4,513,441号では、2つの画像を重ね合わせ、位相の相違を調べることによって、画像を比較する方法が開示されている。
【0009】
その他の従来技術について紹介する。Chang他による米国特許第4,225,850号では、フーリエ変換手法を使用して特定の画像フィールド内で指紋画像を含まない領域を検出する方法が開示されている。Masaki他による米国特許第4,547,800号では、処理対象の画像に対して平行変換と回転を与えてから、基準画像情報と比較することによって、処理対象の画像の位置偏差を検出する方法が開示されている。Yoda他による米国特許第4,346,405号では、テレビの画面をブロックに分割して、画面内の視覚情報をX−Yデータで処理することによって、テレビ画像の一時的な変化を検出する方法が開示されている。Bahler他による米国特許第4,241,329号では、スペクトル統計情報を使用して、連続音声信号内のキーワードを認識する音声認識手法が開示されている。Srivastavaによる米国特許第3,760,356号では、2進数値の集合の中から極大の2進数を決定する手法が開示されている。
【0010】
OCRにニューラル・ネットワークを適用する研究も実施されてきた。例えば、J.Loncelle他による「光学式文字認識および協調型ニューラル・ネットワーク技法」”Optical Character Recognition and Cooperating Neural Networks Techniques”(人工ニューラル・ネットワーク第2巻、I.Aleksander and J.Taylor, Ed., Elsevier Science 出版社、1992年発行)および A.Khotanzad と J.Lu による「ニューラル・ネットワークを使用した不変画像表現の分類」”Clasification of Invariant Image Representations Using a Neural Network”、(IEEE 音響、音声、信号処理に関するトランザクション第6章 pp.1028−1038,1990年6月発行)に、ニューラル・ネットワークに基づいたOCRシステムが説明されている。
【0011】
【発明が解決しようとする課題】
従来の手法はいずれも、大量の雑音により画像が破壊されてしまった場合に、光学式文字やその他のパターンを既知パターンの集合の中の1つに対応するものとして認識することができないという問題があった。OCRシステムの性能を改善するためには、認識手法を、雑音に対して強靱であり、かつ計算が簡単であるようにする必要がある。そこで本発明は、従来の認識手法はいずれも固有の欠点があるので、認識方式として複数の代替手順と冗長手順を用意し、これらの手順を組み合わせて、個々の手順のどれよりも信頼性の高いものにすることによって、認識の信頼性を向上させることを課題とする。
【0012】
【問題を解決するための手段】
前記課題を解決するために、本発明では、入力された画像内に含まれる文字画像を囲む最少境界矩形内の画像を、複数の画素で構成される文字画像パターンとして抽出する抽出ステップと、
前記抽出ステップで抽出された文字画像パターンを所定の分割数の格子ボックスに分割する分割ステップと、
前記分割された文字画像パターンの格子ボックスに基づいて、該文字画像パターンの特徴量を表す複数の特徴マトリックスを生成する生成ステップと、
参照記憶部に予め格納されている複数のテンプレートそれぞれに関する複数の特徴マトリックスと、前記生成ステップで生成された前記文字画像パターンに関する複数の特徴マトリックスとをそれぞれ比較する比較ステップと、
前記比較の結果、前記文字画像パターンに類似すると判定されたテンプレートに基づいて、前記文字画像パターンの文字候補を認識する認識ステップとを有し、
前記生成ステップは、前記格子ボックス間の水平方向の連結に基づいて生成される水平方向隣接マトリックスと、前記格子ボックス間の垂直方向の連結に基づいて生成される垂直方向隣接マトリックスと、前記各格子ボックス内の画素密度に基づいて生成される画素密度マトリックスのうち、少なくともいずれか2つを前記複数の特徴マトリックスとして生成するステップであって、
前記生成ステップで前記水平方向隣接マトリックスを生成する際は、前記格子ボックスの垂直方向分割線が少なくとも1つの画素を横切っている場合、該横切っている画素とその左の画素とが両方ONのとき、もしくは該横切っている画素とその右の画素とが両方ONのときに、当該横切っている画素を含む格子ボックス間は連結されているものとして該格子ボックス間に対応するエントリをONとし、更に、前記格子ボックスの垂直方向分割線が画素を横切っていない場合、該垂直方向分割線を挟む画素が両方ともONのときに、該垂直方向分割線を挟む画素を含む格子ボックス間は連結されているものとして該格子ボックス間に対応するエントリをONとし、更に、前記ONにされたエントリ以外のエントリをOFFとすることにより、前記水平方向隣接マトリックスを生成し、
一方、前記生成ステップで前記垂直方向隣接マトリックスを生成する際は、前記格子ボックスの水平方向分割線が少なくとも1つの画素を横切っている場合、該横切っている画素とその上の画素とが両方ONのとき、もしくは該横切っている画素とその下の画素とが両方ONのときに、当該横切っている画素を含む格子ボックス間は連結されているものとして該格子ボックス間に対応するエントリをONとし、更に、前記格子ボックスの水平方向分割線が画素を横切っていない場合、該水平方向分割線を挟む画素が両方ともONのときに、該水平方向分割線を挟む画素を含むボックス間は連結されているものとして該格子ボックス間に対応するエントリをONとし、更に、前記ONにされたエントリ以外のエントリをOFFとすることにより、前記垂直方向隣接マトリックスを生成し、
一方、前記生成ステップで前記画素密度マトリックスを生成する際は、格子ボックス内のONの領域が所定の割合以上であれば該格子ボックスに対応するエントリをONとし、更に格子ボックス内のONの領域が前記所定の割合より低ければ該格子ボックスに対応するエントリをOFFとすることにより、前記画素密度マトリックスを生成することを特徴とする。
【0013】
本発明の1つの側面として、更に、前記認識ステップで複数の文字候補が認識された場合、前記最小境界矩形の大きさ、位置、アスペクト比の少なくともいずれか1つを用いて、最良の文字候補を選択する選択ステップを有することを特徴とする。
【0014】
本発明のもう1つの側面として、前記認識ステップでは、前記比較ステップによる比較の結果として導出されたハミング距離に基づいて、前記文字画像パターンに類似するテンプレートを求めて、前記文字候補を認識することを特徴とする。
【0015】
本発明のもう1つの側面として、前記参照記憶部に予め格納されている複数のテンプレートそれぞれに関する複数の特徴マトリックスは、前記各テンプレートを前記所定の分割数の格子ボックスに分割し、該分割されたテンプレートの格子ボックスに基づいて生成されて、格納されていることを特徴とする。
【0016】
さらに、前記課題を解決するために、本発明では、入力された画像内に含まれる文字画像を囲む最少境界矩形内の画像を、複数の画素で構成される文字画像パターンとして抽出する抽出手段と、
前記抽出手段で抽出された文字画像パターンを所定の分割数の格子ボックスに分割する分割手段と、
前記分割された文字画像パターンの格子ボックスに基づいて、該文字画像パターンの特徴量を表す複数の特徴マトリックスを生成する生成手段と、
参照記憶部に予め格納されている複数のテンプレートそれぞれに関する複数の特徴マトリックスと、前記生成手段で生成された前記文字画像パターンに関する複数の特徴マトリックスとをそれぞれ比較する比較手段と、
前記比較の結果、前記文字画像パターンに類似すると判定されたテンプレートに基づいて、前記文字画像パターンの文字候補を認識する認識手段とを有し、
前記生成手段は、前記格子ボックス間の水平方向の連結に基づいて生成される水平方向隣接マトリックスと、前記格子ボックス間の垂直方向の連結に基づいて生成される垂直方向隣接マトリックスと、前記各格子ボックス内の画素密度に基づいて生成される画素密度マトリックスのうち、少なくともいずれか2つを前記複数の特徴マトリックスとして生成する手段であって、
前記生成手段で前記水平方向隣接マトリックスを生成する際は、前記格子ボックスの垂直方向分割線が少なくとも1つの画素を横切っている場合、該横切っている画素とその左の画素とが両方ONのとき、もしくは該横切っている画素とその右の画素とが両方ONのときに、当該横切っている画素を含む格子ボックス間は連結されているものとして該格子ボックス間に対応するエントリをONとし、更に、前記格子ボックスの垂直方向分割線が画素を横切っていない場合、該垂直方向分割線を挟む画素が両方ともONのときに、該垂直方向分割線を挟む画素を含む格子ボックス間は連結されているものとして該格子ボックス間に対応するエントリをONとし、更に、前記ONにされたエントリ以外のエントリをOFFとすることにより、前記水平方向隣接マトリックスを生成し、
一方、前記生成手段で前記垂直方向隣接マトリックスを生成する際は、前記格子ボックスの水平方向分割線が少なくとも1つの画素を横切っている場合、該横切っている画素とその上の画素とが両方ONのとき、もしくは該横切っている画素とその下の画素とが両方ONのときに、当該横切っている画素を含む格子ボックス間は連結されているものとして該格子ボックス間に対応するエントリをONとし、更に、前記格子ボックスの水平方向分割線が画素を横切っていない場合、該水平方向分割線を挟む画素が両方ともONのときに、該水平方向分割線を挟む画素を含むボックス間は連結されているものとして該格子ボックス間に対応するエントリをONとし、更に、前記ONにされたエントリ以外のエントリをOFFとすることにより、前記垂直方向隣接マトリックスを生成し、
一方、前記生成手段で前記画素密度マトリックスを生成する際は、格子ボックス内のONの領域が所定の割合以上であれば該格子ボックスに対応するエントリをONとし、更に格子ボックス内のONの領域が前記所定の割合より低ければ該格子ボックスに対応するエントリをOFFとすることにより、前記画素密度マトリックスを生成することを特徴とする。
【0017】
本発明によれば、パターン認識用の装置(100)は、スキャナ(102)、フレーマ(104)、マトリックス・プロセッサ(106)、ハミング・プロセッサ(108)、およびパレート・プロセッサ(110)で構成される。
【0018】
【実施例】
以下、本発明の実施例を図面を参照して説明する。
図1に、本発明の好適な実施例にかかるパターン認識システム100を示す。簡略化して説明すると、システム100は5つの機能的なブロックで構成されている。スキャナ102は、認識対象となるパターンを含む、走査済み画像を示す画素値の2次元配列を獲得するのに使用される。フレーマ104は、パターンを他の画像要素から分離し、そのパターンを以下に定義する最小境界枠若しくは境界矩形枠(bounding rectangle)で囲むことによって、パターンを検出する。マトリックス・プロセッサ106は、前記検出済みパターンを処理して、垂直隣接マトリックス、水平隣接マトリックス、および、画素密度マトリックスを生成する。ハミング・プロセッサ108は、マトリックス・プロセッサ106によって生成されたマトリックスを入力として受け取り、テンプレート・パターンからのマトリックスと前記マトリックスを比較し、検出済みパターンとテンプレートの1つからの対応したマトリックスの組み合わせごとに距離ベクトルを生成する。パレート・プロセッサ110は、ハミング・プロセッサ108によって生成された距離ベクトルを入力として受け取り、パレートの非劣解(Pareto non−inferiority)またはパレート最適(Pareto optimal)な解と呼ばれる条件を満足する距離ベクトルを生成するテンプレートを認識候補として選択するが、もし複数の候補がある場合は、その候補の中から1つを認識済みパターンとして選択する。
【0019】
図2は、システム100の物理的なブロック図である。各ブロックは、図1に示したブロック102、104、106、108、110の機能を実現するための構成要素を示している。好適な実施例では、スキャナ102を走査装置202で実現し、具体的には、ヒュレッドパッカード社が開発したScanJet IIcモデルで、解像度が400dpiで、各画素が8ビットの階調で量子化される装置を使用する。フレーマ104、マトリックス・プロセッサ106、ハミング・プロセッサ108、およびパレート・プロセッサ110は、それぞれマイクロプロセッサ206を中心として、参照記憶装置204、サンプル記憶装置208、処理プログラム記憶装置210で実現する。好適な実施例では、既存の汎用IBM互換機で66MHzの80486マイクロプロセッサを搭載したパソコンをマイクロプロセッサ206、参照記憶装置204、サンプル記憶装置208、処理プログラム記憶装置210用に使用する。なお、複数の代替物理装置と実装形態を用意して図1に示した機能を実現できることは明白である。
【0020】
図3は、文字xに対応した文字ビットマップ300である。このビットマップ300は、スキャナ102とフレーマ104の操作によって得られる。操作中に、スキャナ102は、走査対象上の、典型的には1枚の紙上の画像に対応する画素表現を獲得する。通常、この対象には複数の離散パターンで構成される画像が存在している。例えば、図1では、Exampleという単語で構成されている画像がスキャナ102に入力されているところを示している。フレーマ104は、従来の分割手法を使用して走査済み画像をその構成要素である離散パターン、すなわち、“E”、“x”、“a”、“m”、“p”、“l”、“e”という文字に対応するパターンに分離する。フレーマ104は、前記離散画像を包含する最小境界枠301も決定する。最小境界枠301は、個々の離散パターン(この例では文字“x”に相当する)を完全に包含できる最小の矩形として定義される。スキャナによって生成されたパターンは画素で表現されているので、最小境界矩形301は、スキャナ102で走査された前記パターンの画素で表現された画素境界と同じ境界になる。言い換えると、最小境界矩形の幅と高さはそれぞれに対応する画素数(整数値)に等しくなる。図3では、ビットマップ300の画素、例えば302は、比較的細い線で示されており、アラビア数字と小文字の英字で参照される。従って、図3に示す文字“x”のパターンに対する最小境界枠は、高さが24画素で幅が24画素になる。説明を簡単にするために、ここでは個々の画素は1桁の2進数で表現されるものとする。すなわち、白は画素の値が0で黒は画素の値が1に対応する。しかし、本発明に準拠して、複数桁の2進数で画素を表現したり複数の値を使って画素を表現する階調または色表現を採用することができることは明らかである。
【0021】
ビットマップ300を規定する最小境界枠を定義した後に、ビットマップ300を格子ボックスに分割する。図3では、前記格子ボックスが細い線で示されており、ローマ数字と英大文字で参照される。説明を簡単にするために、図3のビットマップ300では、幅が16格子ボックスで高さが16格子ボックスに分割してある。好適な実施例では、高さが16格子ボックスで幅が16格子ボックスに分割している。しかし、必ずしも四角形になるように分割する必要はなく、すなわち高さと幅が同じ格子ボックスにする必要がないのであって、格子ボックス数を変えることができることは明白である。また、必要な分割数が決定されたら、最小境界枠の大きさにかかわらず任意の分割数を採用できることも明白である。例えば、10ポイントで文字“x”のビットマップを作成する場合は最小境界枠の矩形301の高さを31画素にし幅を29画素にすることもできし、18ポイントで文字“x”のビットマップを作成する場合は最小境界枠の矩形301の高さを57画素にし幅を55画素にすることもできる。いずれの場合でもビットマップ300は、同じ数のボックスに分割して処理される。検出されたパターンのサイズは、この分割によって実効的に正規化されるので、フォントのサイズや書体(例えばボールド体など)が異なった文字を認識する場合でも別のテンプレートを用意する必要がない。
【0022】
前記について図4を参照しながらさらに説明する。図4は、文字“j”を表しているビットマップ400である。この例では、文字“j”の高さが図3の文字“x”と同じ24画素である。従って、ビットマップ300の最小境界矩形301とビットマップ400の最小境界矩形401の高さは両方とも同じ24画素である。しかし、この例の文字“j”は図3の文字“x”よりも幅が狭い。具体的には、最小境界矩形401の幅は12画素しかないのに、最小境界矩形301の幅は24画素もある。このような相違があるが、図4の太線で区切り、ローマ数字と英大文字で示しているように、ビットマップ400は、幅が16格子ボックス、高さが16格子ボックスに分割されている。
【0023】
図5は、本発明による光学式文字認識のフローチャートである。最初の処理501は、テンプレート集合内の個々のテンプレート文字ごとに参照量を作成し格納する。1つのテンプレート集合には、1つまたは複数のサイズ、書体、フォントで印刷可能な文字が含まれている。好適な実施例では、フォントは一定で、サイズとして12ポイント、10ポイント、8ポイントが選べる単一のテンプレート集合を使用している。前記の印字可能な文字は、図3に示したビットマップ300および図4に示したビットマップ400のような最小境界矩形で定義されたサイズを持っているビットマップとして表現される。前記ビットマップはそれぞれ図3と図4に示したような格子ボックスに分割される。
【0024】
好適な実施例では、各テンプレート文字のビットマップから3つの量が作成される。便宜上、画素値1は画像の黒色部分を表し、画素値0は画像の白色部分を表すものと仮定する。まず、水平方向に隣接しているボックスが連結されているかどうかを示す水平隣接マトリックスが、以下で説明するように作成される。ここで図3に戻って説明を続ける。
【0025】
連結度を決定するために、次の2つの場合に分けて検討する。
(a) 例えば、I−GとI−Hの2つのボックスの間を分割している線304が、1つまたは複数の画素1−k(分割境界層)を横切っている場合。
(b) 例えば、分割線303が画素(非分割境界層)を横切っていない場合。
【0026】
(a)の場合は、図3のI−GとI−Hの2つのボックスおよび複数の画素1−kと2−kの間を線304が横切っており、前記分割線304の両側に最も近い画素1−j、2−j、1−l、2−lについて検討する。以下の説明では、垂直方向の連結度の分析を中心にし、水平方向の対応する説明は括弧内に示す。垂直方向(水平)方向の分割線304について検討すると、線304上の画素1−kと2−kは、最近傍左(上)列(行)の1−jと2−jと一緒に考慮される。前記画素の集合は、「境界層」と呼ばれ、jとkの2つの列(行)と、そのボックスの1つの列(行)内で画素若しくは部分画素(この例では2個の画素)が存するだけの全ての行(列)とからなる。境界層の行(列)の1つの中で少なくとも1組の画素が両方ともオン、つまり1になっている場合に、ボックスI−GとI−Hは連結されているものとみなされる。このような条件を満たす画素の組がない場合は、次の境界層を調べる。この例では、列kおよび最近傍の右側(下)の列(行)、この例では第l列内の画素の集合を調べる。このようにして、2番目の境界層は、画素1−k、2−k、および 1−l、2−lで構成される。前記境界層の行(列)の1つの中で少なくとも1つの画素の組が両方ともオン、つまり1になっている場合に、ボックスI−GとI−Hは連結されているものとみなされる。従って、2つの境界層のどちらかで少なくとも1つの画素の組が両方ともオンになっている場合に、ボックスI−GとI−Hは連結されているものとみなされる。
【0027】
(b)の場合は、I−FとI−Gの2つのボックスについて、分割線303に最も近い画素1−j、2−j、1−i、2−iを調べる。境界層の2つの要素で構成される行(列)で少なくとも1つの画素の組が両方ともオンになっている場合に、ボックスは連結されているものとみなされる。
【0028】
連結度について定義できたので、n×n格子ボックスに対する水平隣接マトリックスをn行とn−1列で構成するマトリックスとして定義することができる。なお、対応しているボックスがその右側の次のボックスに接続している場合に、マトリックス集合内の各エントリが1に設定されているものとする。前記マトリックスの場合は、n−1列しか必要とされないのは、前記定義によれば、ボックスの最右側の列に対して別々に連結度を示す必要がないからである。図3のビットマップ300の例では、ボックスI−AとボックスI−Bが連結されているので、水平連結マトリックス上で対応するエントリは1になるはずである。ボックスI−BとボックスI−Cも連結されているので、マトリックス上で対応するエントリも1になるはずである。しかし、ボックスI−CとボックスI−Dは連結されていないので、マトリックス上で対応するエントリは0になるはずである。従って、図3のビットマップ300に対応する水平隣接マトリックスの全体は図6のようになる。
【0029】
各テンプレート文字のビットマップから2番目に作成するマトリックスは垂直隣接マトリックスである。垂直隣接マトリックスは、水平隣接マトリックスで使用した定義に対応した連結度の定義を使用して、各ボックスと、垂直方向に隣接しているボックスとの連結度を示している。前記定義によれば、n×n格子ボックスに対応した垂直隣接マトリックスのサイズは、n−1行×n列になる。マトリックスの各構成要素は、前記ボックスの直下で隣接しているボックスに対応している連結度を表している。従って、図3のビットマップ300に対応する垂直隣接マトリックスの全体は図7のようになる。
【0030】
各テンプレート文字のビットマップから3番目に作成するマトリックスは画素密度マトリックスである。画素密度マトリックスは、各ボックスが黒または白の画素のどちらかで明確にマークされているかどうかを示している。ボックスの50%以上の領域が黒(1つまたは複数の画素の値が1である)でマークされている場合に、前記ボックスに対応しているマトリックスには値1が割り当てられる。それ以外の場合は、マトリックスのエントリに値0が割り当てられる。n×n格子ボックスに対応した画素密度マトリックスのサイズは、n行 ×n 列になる。図3のビットマップに対応する画素密度マトリックスは図8のようになる。
【0031】
本発明に基づいてこうした量の定義に他の方式を採用できることは明白である。しかし、これまで説明してきた量は、図5で説明してきた方法で使用すれば有効であった。前記量集合を使用する利点の1つは、個々の量が、最適な文字候補を選択するための評価リストになることである。この意味では前記量は冗長になる。また、個々の量が準拠している情報が異なるので、前記量は相互の関連性がない。例えば、水平マトリックスと垂直マトリックスは、直角に交わる方向性情報に基づいているが、画素密度マトリックスは方向性情報には基づいていない。従って、1つのマトリックスが誤って破壊されても他の2つのマトリックスには影響がでないのである。
【0032】
前記マトリックスを使用すれば、ポイント・サイズ、書体、フォントが異なる文字でも、必ずしも同一ではないが類似しているマトリックスに写像することができるという効果がある。例えば、飾りのない10ポイントのタイムズ・ローマン・フォント文字に対するマトリックスは、飾りのない12ポイントのタイムズ・ローマン・フォント文字に対するマトリックスと同じに扱うことができ、さらに、ボールド体の14ポイントのクーリエ・フォント文字に対するマトリックスと同じように扱うことができる。従って、サイズ、書体、フォントが異なる文字を認識する場合でも1セットのマトリックスで十分であることが多い。また、フォント、書体、サイズごとにそれぞれ別々のデータを格納する場合に比べて、記憶量が少なくて済む。
【0033】
水平隣接マトリックス、垂直隣接マトリックス、および画素密度マトリックスが作成され、図2の参照記憶装置204に格納されると、処理は502へ続く。ここでは、図1のスキャナ102および図2の走査装置202で説明したサンプル文字のビットマップが獲得される。次の503では、図1のフレーマで説明したサンプル文字のビットマップが決定される。この時点で、図3のビットマップ300のような最小境界枠で規定された文字ビットマップが獲得される。
【0034】
次の504では、前記501で各テンプレート文字ごとに作成され格納されたマトリックスからサンプル文字のマトリックスまでの距離が測定される。好適な実施例では、ハミング距離が距離の測定に使用される。例えば、テンプレート・マトリックスTとサンプル・マトリックスSの2つのマトリックスが与えられ、どちらのマトリックスのサイズも同じで、各要素の値が1(黒であることを示す)または0(白であることを示す)である合計がNであるとする。TとSの両方で値が1である要素の数をCbで表し、TとSの両方で値が0である要素の数をCwで表すと、テンプレート・マトリックスTとサンプル・マトリックスSとの間のハミング距離 H(T,S) は次のように定義される。
【0035】
H(T,S) = N − (Cb + Cw) …(式1)
【0036】
テンプレート文字と各サンプル文字との間のハミング距離が、垂直隣接マトリックス、水平隣接マトリックス、および画素密度マトリックスのそれぞれに対して決定される。次に、この3つの寸法値内の単一のハミング距離ベクトルを使用して、テンプレート文字と任意のサンプル文字との間の距離が決定される。
【0037】
次の505では、パレートの非劣解またはパレートの最適と呼ばれる文字集合が決定される。ハミング距離に対応するベクトルの少なくとも1つの構成要素を増加させないで、あるテンプレート文字を別のテンプレート文字と置換できない場合に、そのテンプレート文字は、パレートの非劣解またはパレートの最適であるという。例えば、次のようなテンプレート文字とそれに対応したハミング・ベクトルが与えられた場合について検討する。
【0038】
【表1】
【0039】
上記の例では、γとδが候補文字になる。
【0040】
テキストの1行で文字サイズに変更がないと仮定した場合は、すべての非劣解な文字、すなわち選択された候補およびその行で関連した文字画像が順次格納されていく。この処理は、行末に至るまで継続される。その後の処理については後述する。文字サイズの変更が検出されると、全行ではなく1つまたは複数の単語といった単位でグループ化される。
【0041】
次の506では、非劣解候補の集合には複数の非劣解候補が含まれている可能性があるので、そのような複数の非劣解候補があるかどうかが検査される。そのような候補が1つしかなかった場合は、次の507で、その候補が認識済み文字として選択される。それ以外の場合は、508で、前記行内に処理対象の文字が残っているかどうか、言い換えると、今完了した処理が行末の文字であるかどうかが判定される。処理対象の文字がまだある場合は、502へ戻って、別のサンプル文字のビットマップが獲得され、前記の処理が繰り返される。行内に処理対象の文字が残っていない場合は、507で認識された文字が確定する。次に、509で、現在行の文字サイズに対応する幾何学パラメータ値の表の集合が選択される。次の510では、選択された表を使って、未認識ビットマップごとに、表に格納されている期待パラメータ値と一致しない文字候補が削除される。複数の候補が未認識として残っている場合は、次の511で、未認識ビットマップごとに最良の残っている文字が、文脈に基づいて認識済み文字として選択される。この時点で、全行の認識処理が完了し、次の512で、処理対象の行が残っているかどうかが判定される。処理対象の行がまだある場合は、502へ戻って、前記の処理が繰り返される。それ以外の場合は、ここで処理が完了する。
【0042】
上記で説明したパラメータ値の表を使用して、類似文字の曖昧性を解決する。たとえば、度数記号(°)と数値のゼロ(0)を隣接マトリックスと画素密度マトリックスだけで表したときには、前記の表を利用しなければ区別できないことがある。曖昧性は、例えば、{cC}、{oO0}、{pP}、{sS}、{uU}、{vV}、{wW}、{xX}、{yY}、{zZ}のように文字の形が似ている場合、{Iil||!|}のように単一の細い垂直ストロークの場合、{−_|.’}のような矩形になっている場合、{^A}のように形が似ている場合に、曖昧性が発生する。
【0043】
好適な実施例では、図3の最小境界枠301に関連した3つのパラメータである、高さ、垂直位置、およびアスペクト比を使って曖昧性を解決する。
【0044】
1セットの高さテーブルは、文字に関する垂直方向の相対的なサイズを示す。例えば、クーリエ字体で10ポイントのフォントの場合は大文字の高さは32画素から33画素までの範囲になる。bdfhのようなアセンダー文字とpqjyのようなデセンダー文字を除いた、acnmのような英小文字の高さは25画素から27画素の範囲になる。数字は35画素から36画素の範囲になり、特殊記号は個別またはグループ化してそれぞれ別の高さの範囲になる。このような情報を使用すれば、例えば、“o”、“O”、“0”を認識する場合に、特定の状況でどの候補を廃棄すべきかを判定することができる。
【0045】
同様に、1セットの垂直位置テーブルは、現在行にある他の文字との相対的な関係で、最小境界枠を文字候補の集合ごとに配置する垂直方向の位置を示している。例えば、英小文字の“p”の垂直位置は、対応する英大文字“P”の位置より高くなるはずである。従って、この情報を使えば、特定の状況で不要な候補文字を削除することができる。
【0046】
文字のアスペクト比を使用すれば、前記パラメータ表により曖昧性を解決することができる。例えば、ダッシュ記号“−”のアスペクト比は下線“_”のアスペクト比とはまったく異なるので、この情報を使えば、特定の状況で不要な候補文字を削除することができる。
【0047】
記憶容量が制約要因にならなければ、それぞれの候補文字ごとにパラメータ集合を格納するテーブルを使用することができる。しかし、記憶容量を節約し、前記のテーブルの構造を簡素化するためには、文字をカテゴリー別にグループ化するとよい。例えば、好適な実施例では、枠の高さというカテゴリーで文字をグループ化している。例えば、曖昧性のない正常な形としては“a”、曖昧性があるが正常な形は“c”、アセンダーの小文字としては“b”、曖昧性のないアセンダーの大文字としては“B”、曖昧性のあるアセンダーの大文字としては“C”アセンダーの数字としては“0”、デセンダー小文字としては“g”、アセンダーでかつデセンダーとしては“j”、特殊文字(高い)としては“$”、特殊文字(中)としては“*”、特殊文字(小)としては“−”がある。
【0048】
前記パラメータ値は、上記で説明した3つの測値で非常に近似する可能性があるので、前記パラメータを複数使用しなければ明確に識別できない曖昧な文字もいくつかある。さらに、候補文字の集合に対して特別な処理が必要になる場合もある。例えば、“i”、“l”、“1”に相当するフォントは類似しているので、幾何学パラメータを使用しただけでは効果的識別することができないことがある。このような文字が候補集合内に残っている場合は、例えば、“i”のように2つの連結された要素で構成されているかどうか、または“l”や“1”のように単独の要素であるかどうかについて検査が実施される。
【0049】
前記手法が特定の候補集合に対して有効でない場合は、次の511で文脈依存手法で選択が実施される。それぞれ未処理の候補ごとに、すでに認識済みの文字という文脈で最も確率の高い候補が認識文字として選択される。好適な実施例では、候補を直前と直後の文字という文脈だけで比較しているが、文脈に対して他の比較手法を採用することも可能であることは明白である。文脈ベースの選択処理511は、確率度を格納した固定的なデータベースを使用すること、現在処理中のドキュメントに特有情報を格納している動的なデータベースを開発すること、または処理の進捗に応じて固定データベースを修正することで実現することができる。
【0050】
従って、パターン認識は、パターンの周囲を規定する最小境界枠を定義すること、前記パターンを格子ボックスに分割すること、前記分割済みのパターンから派生させたベクトルを、既知パターンから派生させたベクトルと比較すること、パレート非劣解候補パターンの集合を選択すること、および認識パターンを候補集合から選択することによって、実現される。
【0051】
前記の説明は好適な実施例の動作を説明するために記述されたものであって、本発明の範囲を限定することを意味しない。本発明の範囲は、前記特許請求項だけに限定されるべきである。前記の説明により、本発明の精神と範囲によって理解できる当業者にとってはさまざまな方法があることは明白である。
【0052】
【図面の簡単な説明】
【図1】本発明によるパターン認識用の装置の機能的なブロック図である。
【図2】本発明による、図1の装置の物理的なブロック図である。
【図3】本発明による、格子格子ボックスに分割された最小境界枠に囲まれたビットマップである。
【図4】本発明による、格子格子ボックスに分割された2番目に最小の境界枠に囲まれたビットマップである。
【図5】本発明による、パターン認識で使用される処理を示すフローチャートである。
【図6】ビットマップ300に対応する水平隣接マトリックスを示す図。
【図7】ビットマップ300に対応する垂直隣接マトリックスを示す図。
【図8】ビットマップ300に対応する画素密度マトリックスを示す図。
【符号の説明】
102 スキャナ
104 フレーマ
106 マトリックス・プロセッサ
108 ハミング・プロセッサ
110 パレート・プロセッサ
Claims (8)
- 入力された画像内に含まれる文字画像を囲む最少境界矩形内の画像を、複数の画素で構成される文字画像パターンとして抽出する抽出ステップと、
前記抽出ステップで抽出された文字画像パターンを所定の分割数の格子ボックスに分割する分割ステップと、
前記分割された文字画像パターンの格子ボックスに基づいて、該文字画像パターンの特徴量を表す複数の特徴マトリックスを生成する生成ステップと、
参照記憶部に予め格納されている複数のテンプレートそれぞれに関する複数の特徴マトリックスと、前記生成ステップで生成された前記文字画像パターンに関する複数の特徴マトリックスとをそれぞれ比較する比較ステップと、
前記比較の結果、前記文字画像パターンに類似すると判定されたテンプレートに基づいて、前記文字画像パターンの文字候補を認識する認識ステップとを有し、
前記生成ステップは、前記格子ボックス間の水平方向の連結に基づいて生成される水平方向隣接マトリックスと、前記格子ボックス間の垂直方向の連結に基づいて生成される垂直方向隣接マトリックスと、前記各格子ボックス内の画素密度に基づいて生成される画素密度マトリックスのうち、少なくともいずれか2つを前記複数の特徴マトリックスとして生成するステップであって、
前記生成ステップで前記水平方向隣接マトリックスを生成する際は、前記格子ボックスの垂直方向分割線が少なくとも1つの画素を横切っている場合、該横切っている画素とその左の画素とが両方ONのとき、もしくは該横切っている画素とその右の画素とが両方ONのときに、当該横切っている画素を含む格子ボックス間は連結されているものとして該格子ボックス間に対応するエントリをONとし、更に、前記格子ボックスの垂直方向分割線が画素を横切っていない場合、該垂直方向分割線を挟む画素が両方ともONのときに、該垂直方向分割線を挟む画素を含む格子ボックス間は連結されているものとして該格子ボックス間に対応するエントリをONとし、更に、前記ONにされたエントリ以外のエントリをOFFとすることにより、前記水平方向隣接マトリックスを生成し、
一方、前記生成ステップで前記垂直方向隣接マトリックスを生成する際は、前記格子ボックスの水平方向分割線が少なくとも1つの画素を横切っている場合、該横切っている画素とその上の画素とが両方ONのとき、もしくは該横切っている画素とその下の画素とが両方ONのときに、当該横切っている画素を含む格子ボックス間は連結されているものとして該格子ボックス間に対応するエントリをONとし、更に、前記格子ボックスの水平方向分割線が画素を横切っていない場合、該水平方向分割線を挟む画素が両方ともONのときに、該水平方向分割線を挟む画素を含むボックス間は連結されているものとして該格子ボックス間に対応するエントリをONとし、更に、前記ONにされたエントリ以外のエントリをOFFとすることにより、前記垂直方向隣接マトリックスを生成し、
一方、前記生成ステップで前記画素密度マトリックスを生成する際は、格子ボックス内のONの領域が所定の割合以上であれば該格子ボックスに対応するエントリをONとし、更に格子ボックス内のONの領域が前記所定の割合より低ければ該格子ボックスに対応するエントリをOFFとすることにより、前記画素密度マトリックスを生成する
ことを特徴とするパターン認識方法。 - 更に、前記認識ステップで複数の文字候補が認識された場合、前記最小境界矩形の大きさ、位置、アスペクト比の少なくともいずれか1つを用いて、最良の文字候補を選択する選択ステップを有することを特徴とする請求項1に記載のパターン認識方法。
- 前記認識ステップでは、前記比較ステップによる比較の結果として導出されたハミング距離に基づいて、前記文字画像パターンに類似するテンプレートを求めて、前記文字候補を認識することを特徴とする請求項1に記載のパターン認識方法。
- 前記参照記憶部に予め格納されている複数のテンプレートそれぞれに関する複数の特徴マトリックスは、前記各テンプレートを前記所定の分割数の格子ボックスに分割し、該分割されたテンプレートの格子ボックスに基づいて生成されて、格納されていることを特徴とする請求項1に記載のパターン認識方法。
- 入力された画像内に含まれる文字画像を囲む最少境界矩形内の画像を、複数の画素で構成される文字画像パターンとして抽出する抽出手段と、
前記抽出手段で抽出された文字画像パターンを所定の分割数の格子ボックスに分割する分割手段と、
前記分割された文字画像パターンの格子ボックスに基づいて、該文字画像パターンの特徴量を表す複数の特徴マトリックスを生成する生成手段と、
参照記憶部に予め格納されている複数のテンプレートそれぞれに関する複数の特徴マトリックスと、前記生成手段で生成された前記文字画像パターンに関する複数の特徴マトリックスとをそれぞれ比較する比較手段と、
前記比較の結果、前記文字画像パターンに類似すると判定されたテンプレートに基づいて、前記文字画像パターンの文字候補を認識する認識手段とを有し、
前記生成手段は、前記格子ボックス間の水平方向の連結に基づいて生成される水平方向隣接マトリックスと、前記格子ボックス間の垂直方向の連結に基づいて生成される垂直方向隣接マトリックスと、前記各格子ボックス内の画素密度に基づいて生成される画素密度マトリックスのうち、少なくともいずれか2つを前記複数の特徴マトリックスとして生成する手段であって、
前記生成手段で前記水平方向隣接マトリックスを生成する際は、前記格子ボックスの垂直方向分割線が少なくとも1つの画素を横切っている場合、該横切っている画素とその左の画素とが両方ONのとき、もしくは該横切っている画素とその右の画素とが両方ONのときに、当該横切っている画素を含む格子ボックス間は連結されているものとして該格子ボックス間に対応するエントリをONとし、更に、前記格子ボックスの垂直方向分割線が画素を横切っていない場合、該垂直方向分割線を挟む画素が両方ともONのときに、該垂直方向分割線を挟む画素を含む格子ボックス間は連結されているものとして該格子ボックス間に対応するエントリをONとし、更に、前記ONにされたエントリ以外のエントリをOFFとすることにより、前記水平方向隣接マトリックスを生成し、
一方、前記生成手段で前記垂直方向隣接マトリックスを生成する際は、前記格子ボックスの水平方向分割線が少なくとも1つの画素を横切っている場合、該横切っている画素とその上の画素とが両方ONのとき、もしくは該横切っている画素とその下の画素とが両方ONのときに、当該横切っている画素を含む格子ボックス間は連結されているものとして該格子ボックス間に対応するエントリをONとし、更に、前記格子ボックスの水平方向分割線が画素を横切っていない場合、該水平方向分割線を挟む画素が両方ともONのときに、該水平方向分割線を挟む画素を含むボックス間は連結されているものとして該格子ボックス間に対応するエントリをONとし、更に、前記ONにされたエントリ以外のエントリをOFFとすることにより、前記垂直方向隣接マトリックスを生成し、
一方、前記生成手段で前記画素密度マトリックスを生成する際は、格子ボックス内のONの領域が所定の割合以上であれば該格子ボックスに対応するエントリをONとし、更に格子ボックス内のONの領域が前記所定の割合より低ければ該格子ボックスに対応するエントリをOFFとすることにより、前記画素密度マトリックスを生成する
ことを特徴とするパターン認識装置。 - 更に、前記認識手段で複数の文字候補が認識された場合、前記最小境界矩形の大きさ、位置、アスペクト比の少なくともいずれか1つを用いて、最良の文字候補を選択する選択手段を有することを特徴とする請求項5に記載のパターン認識装置。
- 前記認識手段では、前記比較手段による比較の結果として導出されたハミング距離に基づいて、前記文字画像パターンに類似するテンプレートを求めて、前記文字候補を認識することを特徴とする請求項5に記載のパターン認識装置。
- 前記参照記憶部に予め格納されている複数のテンプレートそれぞれに関する複数の特徴マトリックスは、前記各テンプレートを前記所定の分割数の格子ボックスに分割し、該分割されたテンプレートの格子ボックスに基づいて生成されて、格納されていることを特徴とする請求項5に記載のパターン認識装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/138,864 US5539840A (en) | 1993-10-19 | 1993-10-19 | Multifont optical character recognition using a box connectivity approach |
US08/138864 | 1993-10-19 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07152867A JPH07152867A (ja) | 1995-06-16 |
JP3618796B2 true JP3618796B2 (ja) | 2005-02-09 |
Family
ID=22484004
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP24386194A Expired - Fee Related JP3618796B2 (ja) | 1993-10-19 | 1994-10-07 | パターン認識方法および装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US5539840A (ja) |
EP (1) | EP0649113B1 (ja) |
JP (1) | JP3618796B2 (ja) |
DE (1) | DE69426479T2 (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU701613B2 (en) * | 1995-01-24 | 1999-02-04 | Zhijie Zheng | Method and system for conjugate binary image analysis and processing |
US6259814B1 (en) | 1997-10-17 | 2001-07-10 | Canon Kabushiki Kaisha | Image recognition through localized interpretation |
US6763137B1 (en) * | 2000-09-14 | 2004-07-13 | Canon Kabushiki Kaisha | Recognition and clustering of connected components in bi-level images |
US8171567B1 (en) | 2002-09-04 | 2012-05-01 | Tracer Detection Technology Corp. | Authentication method and system |
US20040090439A1 (en) * | 2002-11-07 | 2004-05-13 | Holger Dillner | Recognition and interpretation of graphical and diagrammatic representations |
EP2081130B1 (en) | 2004-03-12 | 2013-07-24 | Ingenia Holdings Limited | Methods and apparatuses for creating authenticatable printed articles and subsequently verifying them |
EP2131315A3 (en) * | 2004-03-12 | 2011-01-26 | Ingenia Technology Limited | Authenticity verification by large scale illumination |
IL162878A0 (en) * | 2004-07-06 | 2005-11-20 | Hi Tech Solutions Ltd | Multi-level neural network based characters identification method and system |
GB2417592B (en) * | 2004-08-13 | 2006-07-26 | Ingenia Technology Ltd | Authenticity verification of articles |
GB2417074B (en) * | 2004-08-13 | 2007-11-21 | Ingenia Technology Ltd | Authenticity verification methods,products and apparatuses |
DE102005001224A1 (de) | 2004-09-03 | 2006-03-09 | Betriebsforschungsinstitut VDEh - Institut für angewandte Forschung GmbH | Verfahren zur Zuordnung eines digitalen Bildes in eine Klasse eines Klassifizierungssystems |
US7953983B2 (en) | 2005-03-08 | 2011-05-31 | Microsoft Corporation | Image or pictographic based computer login systems and methods |
RU2417448C2 (ru) * | 2005-07-27 | 2011-04-27 | Инджениа Холдингс Лимитед | Верификация аутентичности |
WO2007072044A1 (en) * | 2005-12-23 | 2007-06-28 | Ingenia Holdings (Uk) Limited | Optical authentication |
JP2007310577A (ja) * | 2006-05-17 | 2007-11-29 | Toshiba Corp | 描画データ抽出装置、方法、およびプログラム |
US8024775B2 (en) * | 2008-02-20 | 2011-09-20 | Microsoft Corporation | Sketch-based password authentication |
GB2466311B (en) | 2008-12-19 | 2010-11-03 | Ingenia Holdings | Self-calibration of a matching algorithm for determining authenticity |
GB2466465B (en) | 2008-12-19 | 2011-02-16 | Ingenia Holdings | Authentication |
US8458485B2 (en) | 2009-06-17 | 2013-06-04 | Microsoft Corporation | Image-based unlock functionality on a computing device |
GB2476226B (en) | 2009-11-10 | 2012-03-28 | Ingenia Holdings Ltd | Optimisation |
CN102385570A (zh) | 2010-08-31 | 2012-03-21 | 国际商业机器公司 | 字体匹配方法和系统 |
AU2011202415B1 (en) | 2011-05-24 | 2012-04-12 | Microsoft Technology Licensing, Llc | Picture gesture authentication |
ITBA20110038A1 (it) | 2011-07-12 | 2013-01-13 | D A Bi Mus Srl | Metodo e apparato per riconoscere testo in immagini digitali raffiguranti pagine di un documento antico |
US20130077856A1 (en) * | 2011-09-23 | 2013-03-28 | General Electric Company | Processes and systems for training machine typesets for character recognition |
US9053359B2 (en) | 2012-06-07 | 2015-06-09 | Konica Minolta Laboratory U.S.A., Inc. | Method and system for document authentication using Krawtchouk decomposition of image patches for image comparison |
US9230383B2 (en) * | 2012-12-28 | 2016-01-05 | Konica Minolta Laboratory U.S.A., Inc. | Document image compression method and its application in document authentication |
US9946945B2 (en) | 2016-04-08 | 2018-04-17 | Intelligent Security Systems Corporation | Systems and methods for recognizing symbols in images |
US10679101B2 (en) * | 2017-10-25 | 2020-06-09 | Hand Held Products, Inc. | Optical character recognition systems and methods |
US11887731B1 (en) * | 2019-04-22 | 2024-01-30 | Select Rehabilitation, Inc. | Systems and methods for extracting patient diagnostics from disparate |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3760356A (en) * | 1971-12-17 | 1973-09-18 | Honeywell Inf Systems | Technique for determining the extreme binary number from a set of binary numbers |
US3846752A (en) * | 1972-10-02 | 1974-11-05 | Hitachi Ltd | Character recognition apparatus |
US3993976A (en) * | 1974-05-13 | 1976-11-23 | The United States Of America As Represented By The Secretary Of The Air Force | Method and apparatus for pattern analysis |
US3930231A (en) * | 1974-06-10 | 1975-12-30 | Xicon Data Entry Corp | Method and system for optical character recognition |
US4241329A (en) * | 1978-04-27 | 1980-12-23 | Dialog Systems, Inc. | Continuous speech recognition method for improving false alarm rates |
US4225850A (en) * | 1978-11-15 | 1980-09-30 | Rockwell International Corporation | Non-fingerprint region indicator |
JPS6016673B2 (ja) * | 1978-12-25 | 1985-04-26 | 川崎重工業株式会社 | サ−ボ系における被検体認識装置 |
JPS5654479A (en) * | 1979-10-12 | 1981-05-14 | Hitachi Ltd | Picture image data processor |
JPS59136874A (ja) * | 1983-01-26 | 1984-08-06 | Fuji Electric Co Ltd | パタ−ン識別装置 |
US4547898A (en) * | 1983-03-11 | 1985-10-15 | Siemens Corporate Research & Support, Inc. | Apparatus for determining the two-dimensional connectivity of a prescribed binary variable associated with a surface |
US4513441A (en) * | 1983-08-02 | 1985-04-23 | Sparta, Inc. | Image comparison system |
US4783838A (en) * | 1984-12-26 | 1988-11-08 | Konishiroku Photo Industry Co., Ltd. | Image processing method and apparatus therefor |
US4754489A (en) * | 1985-10-15 | 1988-06-28 | The Palantir Corporation | Means for resolving ambiguities in text based upon character context |
US4817176A (en) * | 1986-02-14 | 1989-03-28 | William F. McWhortor | Method and apparatus for pattern recognition |
US4799270A (en) * | 1986-03-20 | 1989-01-17 | The Johns Hopkins University | Image classifier |
US5224179A (en) * | 1988-12-20 | 1993-06-29 | At&T Bell Laboratories | Image skeletonization method |
US5271068A (en) * | 1990-03-15 | 1993-12-14 | Sharp Kabushiki Kaisha | Character recognition device which divides a single character region into subregions to obtain a character code |
-
1993
- 1993-10-19 US US08/138,864 patent/US5539840A/en not_active Expired - Lifetime
-
1994
- 1994-10-07 JP JP24386194A patent/JP3618796B2/ja not_active Expired - Fee Related
- 1994-10-18 DE DE69426479T patent/DE69426479T2/de not_active Expired - Lifetime
- 1994-10-18 EP EP94307617A patent/EP0649113B1/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH07152867A (ja) | 1995-06-16 |
EP0649113A2 (en) | 1995-04-19 |
EP0649113B1 (en) | 2000-12-27 |
DE69426479D1 (de) | 2001-02-01 |
DE69426479T2 (de) | 2001-06-07 |
US5539840A (en) | 1996-07-23 |
EP0649113A3 (en) | 1995-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3618796B2 (ja) | パターン認識方法および装置 | |
US5687253A (en) | Method for comparing word shapes | |
US5253307A (en) | Image analysis to obtain typeface information | |
US5321770A (en) | Method for determining boundaries of words in text | |
Kumar et al. | A detailed review of feature extraction in image processing systems | |
US4903312A (en) | Character recognition with variable subdivisions of a character region | |
KR100658119B1 (ko) | 문자 인식 장치 및 방법 | |
US5557689A (en) | Optical word recognition by examination of word shape | |
US5410611A (en) | Method for identifying word bounding boxes in text | |
US5640466A (en) | Method of deriving wordshapes for subsequent comparison | |
JP4065460B2 (ja) | 画像処理方法及び装置 | |
Mehri et al. | Texture feature benchmarking and evaluation for historical document image analysis | |
US5416851A (en) | Image analysis based on location sampling | |
Lehal et al. | Feature extraction and classification for OCR of Gurmukhi script | |
US6272238B1 (en) | Character recognizing method and apparatus | |
US6256408B1 (en) | Speed and recognition enhancement for OCR using normalized height/width position | |
JPH0696278A (ja) | パターン認識方法及び装置 | |
US5703963A (en) | Character recognition apparatus that subdivides a character into subregions to obtain feature vectors | |
Vijay Kumar et al. | Machine recognition of printed Kannada text | |
Srinivas et al. | An overview of OCR research in Indian scripts | |
JPH05225394A (ja) | 文字認識システムの候補文字分類方法 | |
JP3623992B2 (ja) | 文字認識装置及び方法 | |
KR100317653B1 (ko) | 대용량인쇄체문자인식을위한특징추출방법 | |
JP2001506383A (ja) | ピクセルマトリクス上で文字認識を実行する方法 | |
JP2993533B2 (ja) | 情報処理装置及び文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040726 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040921 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041022 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041111 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071119 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081119 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081119 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091119 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101119 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101119 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111119 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121119 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131119 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |