JPH0737037A - 最近傍分類を認識する比較関数に基づくocr方法 - Google Patents

最近傍分類を認識する比較関数に基づくocr方法

Info

Publication number
JPH0737037A
JPH0737037A JP6102933A JP10293394A JPH0737037A JP H0737037 A JPH0737037 A JP H0737037A JP 6102933 A JP6102933 A JP 6102933A JP 10293394 A JP10293394 A JP 10293394A JP H0737037 A JPH0737037 A JP H0737037A
Authority
JP
Japan
Prior art keywords
template
vector
input
elements
comparison
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP6102933A
Other languages
English (en)
Inventor
Abi Aizaku Hatsudaa
アビ・アイザク ハッダー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JPH0737037A publication Critical patent/JPH0737037A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 三角不等式の原理を用いることにより高速化
された、最近傍を認識するためのより向上した、比較関
数に基づく高速OCRベクトル認識方法を提供すること
にある。 【構成】 入力ベクトルSは未分類シンボル(未知入力
文字)を定義し(S1)、T個のテンプレートベクトル
は分類済文字(メモリ内のアルファベットフォントの既
知文字)を定義する(S2)。最近傍分類は、入力ベク
トルとテンプレートベクトル間の最も近い一致により離
れたテンプレートを除くことで認識され、本OCR方法
は、反復サイクルを処理するにつれ離れた近傍を大量に
除く三角不等式を使って達成される(S3〜S7)。減
少する候補グループからのテンプレートベクトルの選択
順はランダムでも順序付けられてもよいが、テンプレー
ト文字の使用頻度や履歴推論、統計的可能性等で順序付
けられた選択は除去処理を最適化する結果、より少ない
反復で入力シンボルの最近傍分類を実現する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は入力記号のOCR分類に
関し、さらに詳しくは比較関数に基づいた最近傍(neare
st neighbor)分類方法に関するものである。
【0002】
【従来の技術】従来、入力文字のビットマップをライブ
ラリテンプレートのビットマップに照らして分類する際
に、比較関数が使用されてきた。入力とテンプレートと
の各照合(マッチング)における全画素比較の総数か
ら、最近似の一致を示す相関値が得られた。しかしなが
ら、こうした従来の相関技術は、遠いテンプレートを排
除したり認識手順の速度を早めるための、テンプレート
相互の比較や“三角不等式の原理(Triangle of Inequal
ity Principle)”は採用されていない。
【0003】本発明者により1992年9月1日に第0
7/937,732号として米国出願され、この米国出
願を優先権主張して1993年9月1日に特願平5−2
11765号として日本出願され、本出願と同一出願人
に譲渡されている「ピクセル重み付けによるテンプレー
トライブラリの強調方法(METHOD OF OCR TEMPLATE ENHA
NCEMENT BY PIXEL WEIGHTING) 」では、比較関数を使用
して、入力文字の特定のフォントに関してテンプレート
ライブラリを強調することが開示されている。
【0004】同じく本発明者により1993年1月22
日に第08/008,556号として米国出願され、こ
の米国出願を優先権主張して1994年1月24日に特
願平6−58483号として日本出願され、同じく同一
出願人に譲渡されている「ピクセル重み付けによるマル
チフォント・テンプレートライブラリの強調方法(METHO
D OF MULTI-FONT TEMPLATE ENHANCEMENT) 」では、テン
プレートサブクラスの規定を用いてライブラリテンプレ
ートの強調を行ない、入力文字のマルチフォント(multi
ple fonts)やその他の変形フォントに適用することが開
示されている。
【0005】マイケル T・オーチャード(Michael T.Or
chard) 著「高速な最近傍サーチアルゴリズム(A Fast N
earest Neighbor Search Algorithm)」(IEEE ICASSP c
onference at Toronto Canada 14-17 May 1991, Vol.
4, pages 2297-2300) では、最近傍サーチが開示されて
いる。ここには、スピーチコードブックや三角不等式の
原理(2298ページの図1)を用いた画像のカラー量
子化が含まれている。
【0006】
【発明が解決しようとする課題】従って、本発明の目的
は、最近傍を認識するためのより向上した、比較関数に
基づく高速OCRベクトル認識方法を提供することにあ
る。本発明の他の目的は、三角不等式の原理を用いるこ
とにより、高速化された比較関数に基づくOCRベクト
ル認識方法を提供することにある。
【0007】本発明のさらに他の目的は、上記の比較関
数に基づく方法であって、予めテンプレート間の比較値
を比較計算し、即座に使用できるように格納しておくO
CRベクトル認識方法を提供することにある。本発明の
他の目的は、上記の比較関数に基づく方法であって、各
反復のテンプレートベクトルの選択を体系的に行なうO
CRベクトル認識方法にある。
【0008】本方法のさらに他の目的や利点は、以下の
詳細な説明及び図面より明らかになるであろう。
【0009】
【課題を解決するための手段】簡潔に述べると、本発明
の上記のあるいはその他の目的は、比較関数に基づくO
CR方法で、T個のテンプレートベクトルのライブラリ
に対して入力ベクトルSの最近傍分類ベクトルを認識す
る方法を提供することにより達成される。入力ベクトル
Sは認識されるべき未分類記号を定義し、T個のテンプ
レートベクトルのライブラリは、マッチングに使用可能
な分類済みの文字を定義している。入力ベクトルSはエ
レメント列であり、各エレメントは数値を有している。
各テンプレートベクトル(T1,T2,…Ti…,T
T)も数値を有するエレメント列である。第1のテンプ
レートベクトルTi1st がライブラリから選択されて、
入力比較関数に基づいて入力ベクトルSと比較され、第
1の入力比較値V1st が生成される。第1の入力比較値
1st の関数として第1の比較閾値R1st が決定され
る。テンプレート相互の比較関数に基づいて、テンプレ
ート相互の比較値が第1のテンプレートベクトルTi
1st と(Tー1)個のその他のテンプレートベクトル
(T1,T2,…,TT)との間に供給される。ライブ
ラリのテンプレートベクトルで、テンプレート相互の比
較値が第1の比較閾値V1st 内であるものが同定され
て、テンプレートベクトルの第1の候補グループG1st
が形成される。このグループには入力ベクトルSの最近
傍分類ベクトルが含まれており、閾値外のテンプレート
相互の比較値を持つテンプレートベクトルはグループか
ら排除されている。第2のテンプレートベクトルTi
2nd が第1の候補グループG1st から選択され、入力ベ
クトルSと比較されて、第2の入力比較値V2nd が生成
される。テンプレート相互の比較値が、第2のテンプレ
ートベクトルTi2nd と第1の候補グループG1st 内の
選択されなかったテンプレートベクトルとの間に供給さ
れる。第1の候補グループG1st 内のテンプレートベク
トルで、テンプレート相互の比較値が第2の入力比較値
2nd により決定された値内であるものが同定されて、
第2の候補グループG2nd が形成される。第2のグルー
プには入力ベクトルSの最近傍分類ベクトルが含まれて
おり、第1の候補グループG1st からの閾値外のテンプ
レートベクトルはグループから排除されている。また、
以前の同定ステップで排除されたテンプレートベクトル
も第2のグループから排除されている。入力ベクトルS
の最近傍分類ベクトルである、単一の最終テンプレート
ベクトルTiFin を除く全テンプレートベクトルが排除
されるまで、選択ステップ,比較ステップ,決定ステッ
プ,テンプレート相互の比較値供給ステップ,同定ステ
ップが反復される。
【0010】
【実施例】
<一般的な例(図1参照)>比較関数に基づくOCR方
法は、T個のテンプレートベクトルのライブラリに対す
る入力ベクトルSの最近傍分類を認識するために使用さ
れる。入力ベクトルSは未分類記号(未知の入力文字)
を定義しており、T個のテンプレートベクトルは分類済
みの文字(メモリ内のアルファベットフォントの既知の
文字)を定義している。最近傍分類とは反復OCRマッ
チング技術であって、入力ベクトルとテンプレートベク
トルとの間で遠いテンプレートを排除することによっ
て、最も近い一致を認識するものである。最も近い一致
(最近傍)が入力記号の最適な同定結果となる。このO
CR方法では、反復サイクルが進むにつれて遠い近傍を
大量に排除する三角不等式の原理を用いることにより、
処理速度が増している。
【0011】未分類記号や各々の分類済みの文字は、E
次元の多次元空間の1点と見ることができる。各文字は
E次元空間に拡がるE個のエレメントを有するテンプレ
ートベクトルで定義される。テンプレートベクトルはE
t 次元のエレメントを有し、入力ベクトルSはEs 次元
のエレメントを有している。図1は、2次元平面10
(E=2)で表される分類済みの代表的な文字(ポイン
ト“A”,“B”,“C”,“D”,“E”,“F”,
“G”)を示している。各文字は、平面10の2次元座
標系の原点より伸びる2エレメントのテンプレートベク
トル(X,Y)により定義されている。平面10におけ
る文字ポイント位置は図示の都合だけによるものであ
り、いずれのE次元空間内のいずれの特定アルファベッ
トフォントの実際の最近傍関係を反映するものではな
い。未知のシンボルの点は、疑問符“?”により表され
ており、関係する入力ベクトルSも2エレメントのベク
トルである。
【0012】この比較関数に基づく反復方法は、テンプ
レートベクトルの内の1つ、例えば“B”を選択するこ
とにより処理が開始される。最初に選択されたテンプレ
ートベクトルは、比較関数を用いて入力べクトルS
(?)や他のテンプレートベクトル(A,C,E,F,
G)と比較される。この最初のテンプレートベクトル
“B”の比較により生成されたテンプレート相互の比較
値(以下、テンプレート比較値ともいう)が、選択され
たポイントBと他のテンプレートポイント間の相互の距
離(小文字の“a”,“c”,“d”,“e”,
“f”,“g”)である。入力比較値は、選択ポイント
Bと入力ポイント“?”間の距離(“r”)である。
【0013】三角不等式の原理が、ポイントB,ポイン
ト“?”及び他のいずれかのテンプレートポイント(ポ
イントCなど;三角形12参照)により形成される三角
形に適用される。この原理は、ポイントBを中心として
半径“2r”の円の外にある全てのテンプレートポイン
トが(ポイントCなど)、入力ポイント“?”よりもポ
イントBから離れた近傍であることを規定する。具体的
には、テンプレート間の比較値“c”は入力比較値
“r”の2倍より大きいので、最近傍からは排除される
ことになる。ポイントB及びポイント“?”と並んでい
るポイントDの場合、三角不等式の原理を適用すると直
線BD(線14参照)となる。線BDは中心近くにポイ
ント“?”を含み、線セグメントB?(“r”)と?D
とにより形成される。
【0014】離れたポイントは排除することができる。
それは、そうした基調をなす文字が未知の文字“?”と
の最近傍一致になる可能性がないからである。こうし
て、図1の仮説的な例では、文字A,C,D,Eは2r
より大きいテンプレート間の比較値を有し、次の反復サ
イクルから除外され、F及びGへと候補が絞られる。 <一般的な方法(図2参照)>比較関数に基づく反復O
CR方法の各ステップが図2に要約されており、以下に
詳細に説明される。
【0015】ステップS1:エレメント列の形で、未分
類シンボルの入力ベクトルSを供給する。各エレメント
は数値を有している。 ステップS2:T個のエレメント列の形で、T個のテン
プレートベクトル(T1,T2,…Ti…,TT)を供
給する。各エレメントは数値を有している。入力ベクト
ルエレメントとテンプレートベクトルエレメントとの数
値は、画素画像内の画素の強度レベル(グレイスケー
ル)でもよい(画素マトリックスの項参照)。あるい
は、各エレメントの数値はOCR特徴セット(ビジュア
ル・アスペクツの項参照)に含まれる特徴構造の数値で
もよい。一連の数値を含むその他の不明瞭な認識パラメ
ータ(モーメントなど)は、ベクトルのエレメントを形
成するのに使用することも可能である。
【0016】ステップS3:T個のテンプレートベクト
ルのライブラリより初期テンプレートベクトルTi1st
を選択する。選択は全く任意に行なうことができる。つ
まり、ライブラリ(もしくは後続のより小規模な候補グ
ループ)のいずれのテンプレートベクトルでも、初期ベ
クトル(もしくは選択されたベクトル)にすることが可
能である。選択の順序は固定にすることもできるが、ラ
イブラリに関連付けられた任意のシーケンスにしてもよ
い。例えば、A〜Z、a〜z、そして0〜9、のように
アルファベット順に行なうことができる。そうした固定
のシーケンスでは、同一のテンプレートベクトルが常に
初期ベクトルであり、続いて選択されるベクトルが、三
角不等式の原理によって進行するテンプレートベクトル
の排除に従って同じ順序になる。あるいは、使用頻度
(F/U)または履歴推論(HI)などのように、選択
を体系的に行なうことも可能である。
【0017】ステップS4:入力比較関数に基づいて、
初期テンプレートベクトルTi1stを入力ベクトルSと
比較し、初期入力比較値V1st を生成する。比較関数は
入力ベクトルSを各選択テンプレートベクトルと組織的
に組み合わせて、スカラー入力比較値の数列を生成する
ための数学的関係を表している。比較値は、類似性(lik
e entity) を比較するのに使用されるものであるから、
単位を導入するべきではない。比較関数は、比較ベクト
ル相互の相違を量化する相違型関数(相違関数の項参
照)にしてもよい。あるいは、比較関数は、比較ベクト
ル相互の類似を量化する類似型関数(類似関数の項参
照)でもよい。
【0018】ステップS5:初期入力比較値V1st の関
数として、初期比較閾値R1st を決定する。比較閾値
は、相違比較関数(図1参照)で用いられているよう
に、単純に入力比較値の2倍の値でもよいし、他のタイ
プの比較関数のためにより複雑な関係を表す値でもよ
い。 ステップS6:テンプレート間の比較関数に基づいて、
初期テンプレートベクトルTi1st と(Tー1)個の他
のテンプレートベクトル(T1,T2,…,TT)との
間のテンプレート相互の比較値を供給する。テンプレー
ト間の比較値もまたスカラー値である。テンプレート相
互の比較関数は入力比較関数と同一であっても、または
数学的に等価であってもよい。
【0019】ステップS7:T個のテンプレートのライ
ブラリ内で、初期比較閾値R1st 内のテンプレート比較
値を持つテンプレートベクトルを同定する。この最初の
同定ステップで、T個のテンプレートのライブラリに対
する入力ベクトルSの最近傍分類ベクトルを含む第1候
補グループG1st を形成する。第1グループは、閾値外
のテンプレート比較値を持つテンプレートベクトルを排
除している。
【0020】ステップS8:第1候補グループG1st
り、第2のテンプレートベクトルTi2nd を選択する。 ステップS9:入力比較関数に基づいて、第2のテンプ
レートベクトルTi2n d を入力ベクトルSと比較し、第
2の入力比較値V2nd を生成する。 ステップS10:テンプレート相互の比較関数に基づい
て、第2のテンプレートベクトルTi2nd と第1候補グ
ループG1st 内の選択されなかったテンプレートベクト
ルとの間のテンプレート相互の比較値を供給する。
【0021】ステップS11:第1候補グループG1st
内で、第2の入力比較値V2nd により決定された閾値内
のテンプレート比較値を持つテンプレートベクトルを同
定する。この第2の同定ステップで、入力ベクトルSの
最近傍分類ベクトルを含むテンプレートベクトルの第2
候補グループG2nd を形成する。第2候補グループは、
閾値外のテンプレート比較値を持つテンプレートベクト
ルを第1候補グループG1st から排除し、また、以前の
同定ステップで除外された全てのテンプレートベクトル
をも排除している。
【0022】ステップS12:選択ステップ,比較ステ
ップ,決定ステップ,テンプレート相互の比較値供給ス
テップ,同定ステップを、単一の最終テンプレートベク
トルTiFin を除く全てのテンプレートベクトルが排除
されるまで反復する。唯一残ったテンプレートベクトル
が、T個のテンプレートベクトルのライブラリに対する
入力ベクトルSの最近傍分類ベクトルとなる。
【0023】<比較ペアメモリ(図3及び図4参照)>
E次元空間内のT個のテンプレートベクトル間の特定の
関係は、照合(マッチング)のために新たな入力シンボ
ルが供給されても変化することはない。従ってテンプレ
ート相互の比較値(Ti Tj)の各々は一定であり、
反復サイクルの間に直ちに使用できるように、予め比較
されてメモリ装置に格納しておくことが可能である。テ
ンプレート比較値の全値(T1 T1,T1 T2,…,
TTTT)は、T列T行(図3参照)でT対Tの比較値
ペアを格納するメモリ30に格納され、T2 個のエント
リとなっている。選択テンプレートベクトルの列(また
は行)をアドレスすることにより、選択テンプレートベ
クトルとペアになったテンプレート比較値の全部を検索
できる。
【0024】T対Tメモリ30では、全てのテンプレー
ト比較値が2度現われる(1度は列によって、2度目は
行による)。同一のテンプレートベクトル(T1 T
1,T2 T2,…,Ti Ti,…,TT TT)間の
単純な同一エントリの比較値は、対角線上のセルに格納
されている。こうした比較値は相違関数に対して最小値
(例えば0)となり、類似関数に対しては最大値(例え
ば1)となる。截断型メモリ40(図4参照)に格納さ
れた比較値は、重複されないテンプレート比較値であ
り、エントリは(T2 ーT)/2個である。各テンプレ
ート比較値は1度(列によってのみ)しか現われず、単
純な同一比較値は除外されている。
【0025】<画素マトリックス(図5及び図6参照)
>入力ベクトルS及びテンプレートベクトルは、入力未
分類シンボルと画素マトリックスなどの直接見ることの
できる画像フォーマットの分類済み文字とを定義してい
る。図5では入力シンボルはシンボル“?”として示さ
れ、図6では選択テンプレートベクトルは文字“B”と
して示されている。これらの画像は、画素ビットマップ
メモリにデジタルデータとして格納されている前景画素
と背景画素間のコントラスト差で表現されている。各エ
レメントは1画素として格納されている。前景及び背景
は2値フォーマットの黒白データでもよいし、グレイス
ケール(またはカラー)フォーマットの明度(または色
調(shade) )レベルデータでもよい。
【0026】入力ベクトルマトリックス50(図5参
照)はPs 個の画素エレメントを有し、各テンプレート
ベクトルマトリックス60(図6参照)はPt 個の画素
エレメントを有している。未分類シンボルは、分類済み
の文字がテンプレートベクトルに定義されているのと同
一解像度の入力ベクトルマトリックスによって定義する
ことができる。同一解像度の場合、入力ベクトルマトリ
ックスの画素数Ps はテンプレートベクトルマトリック
スの画素数Pt に相当する。入力ベクトルの画素画像は
s 個の行とCs 個の列とを持つ画素マトリックスであ
り、T個のテンプレートベクトルの各々の画素画像はR
t 個の行とCt 個の列とを持つ画素マトリックスであ
る。入力ベクトルの画素画像における行数Rs と列数C
s とは、T個のテンプレートベクトルの各々の画素画像
における行数Rt と列数Ct に等しいことが好ましい。
あるいは、未分類シンボルは、以前に分類済みの文字と
異なる解像度で定義することもできる。その場合は、P
s (及びRs ,Cs )はPt (及びRt ,Ct )と等し
くならない。
【0027】未分類入力シンボルの解像度は、分類済み
のテンプレート文字の解像度の倍数“m”である。この
倍数の解像度では、入力ベクトルマトリックスにおける
画素数Ps はテンプレートベクトルの画素数Pt の倍数
“m”となる。例えば、倍数m=2とすると、Ps は2
400画素(60列40行のマトリックス)で、Pt
僅かに600画素(30列20行のマトリックス)とな
る。マトリックスの有益な解像度は、印刷文字を読み取
ってメモリ内のベクトルにするために用いるスキャナの
解像度の関数である。2400画素のマトリックス(6
0×40)は400dpi(dots per inch) のスキャナ
で得られ、600画素のマトリックス(30×20)は
200dpiのスキャナで得られる。
【0028】入力ベクトルマトリックスの画素数Ps
テンプレートベクトルの画素数Ptと一致するように、
“m”個の画素を持つ四角形の各画素グループを平均値
に置き換えることにより減少させられる。つまり、入力
ベクトルマトリックスの各画素のm×mの四角形は単一
の合成画素に代えられて、入力比較関数において使用さ
れる。あるいは、画素数Ps は、入力ベクトルマトリッ
クスのm行目毎の行全部とm列目毎の列全部だけを用い
ることで減少させてもよい。
【0029】分類済みのテンプレート文字の解像度を未
分類の入力シンボルの倍数“m”の解像度とすることも
可能である。その場合、Pt はPs の係数“m”とな
る。例えば、倍数m=3とすると、Ps は僅か1350
画素(45列30行のマトリックス)で、Pt は12,
150画素(135列90行のマトリックス)となる。
このケースでは、Pt がPs に一致するように、隣接画
素エレメントを平均するかあるいは3行目毎の行全部と
及び3列目毎の列全部だけを用いて減少させてもよい。
【0030】<視覚相(ビジュアル・アスペクツ)>入
力ベクトルSのエレメント列は、単に未分類シンボルの
ビジュアル・アスペクツ(visual aspects)を定義するだ
けであって、画素画像の説明で述べたような画像全体を
定義するものではない。T個のテンプレートベクトルの
各々のエレメント列は、未分類の文字の対応するビジュ
アル・アスペクツを限定する。入力シンボル及びテンプ
レート文字のビジュアル・アスペクツは、全体の高さ,
全体の幅,ストローク幅,主線の位置,補足的な線の位
置,画像密度,前景(黒)画素の総数,前景データの中
心部,距離及び角度(ウォークアラウンド(walk aroun
d) )に換算した前景データの輪郭などの特徴(feature)
セットとすることができる。
【0031】<相違関数>比較関数は相違関数(図1に
関連して前述したように)でもよい。この場合、各反復
で生成される入力比較値は、選択テンプレートベクトル
と入力ベクトルSとの間のユークリッド距離“r”とな
る。各反復で決定される比較閾値は、次の関係に基づい
て、ゼロから各反復で生成される入力比較値の2倍まで
の値となる。
【0032】Rkth =2×(CVkth )= 距離“r” k:OCR方法のk番目の反復サイクル R:k番目の反復の比較閾値 CV:k番目の反復の比較値 各反復における選択テンプレートベクトルと入力ベクト
ルSとの(そして他のテンプレートベクトルとの)比較
のための入力比較関数は、次のような減算相違関数であ
る。
【0033】CV(s,t)= {(s1 −t1)2 +(s2
2)2+…(sj −tj)2 …+(sn −tn)2}1/2 CV:生成された比較値 tj :選択テンプレートベクトルのj番目のエレメント sj :比較対象の入力ベクトルS(もしくは他のテンプ
レートベクトル)のj番目のエレメント n:ベクトルのエレメント数 前述のように、テンプレート間の比較関数は入力比較関
数と同一とすることができる。
【0034】あるいは、テンプレート間の比較関数は、
テンプレート間の比較関数を入力比較関数と異なった
(ただし数学的には同値の)ものにする正規化係数(nor
malization factors) (もしくは他の補正パラメータ(a
djustment parameters) )を含んでもよい。 <類似関数>比較関数は、反復が進行して入力ベクトル
Sが最近傍照合に近づくにつれて、増加する比較値を生
成する類似関数でもよい。類似関数は、次のような内積
の類似関数である。
【0035】CV={( s1 ・t1)+(s2 ・t2)+…
(sj ・tj)…+(sn ・tn)}/{( s1 2+…sj 2…+
n 2)・(t1 2+…tj 2…+tn 2)}1/2 CV:生成された比較値 tj :選択テンプレートベクトルのj番目のエレメント sj :比較対象の入力ベクトルS(または他のテンプレ
ートベクトル)のj番目のエレメント n:ベクトルのエレメント数 上記の類似関数も、多元空間における選択テンプレート
ベクトルと入力ベクトル(または他のテンプレートベク
トル)で作られる角の余弦である。この角度がゼロの時
に最大の類似1.00が得られる(Cos0o =1.0
0)。この角度が90度の時最小の類似0.00が得ら
れ、この時、例えば全てのエレメントが負でない値を持
つ(Cos90o =0.00)。この余弦の例では、ベ
クトルの長さは標準化されて共通の長さになっている。
【0036】<選択の順序>次第に減少する候補グルー
プよりテンプレートベクトルを選択する順序は、任意で
もよいし秩序だったものでもよい。決められた順序に従
った選択では、入力シンボルの最近傍分類をより少ない
反復で効果的に行なうことができる。選択順序は処理中
のテキストのタイプに応じたテンプレート文字の使用頻
度(F/U)に基づいて決めてもよい。あるいは、“履
歴推論(HI)”、すなわちいずれかの知られた文字の
後に(または前に)候補グループに残った文字の内のい
ずれかの特定の文字が来る、統計的な可能性に基づいて
決めてもよい。たいていの場合、通常の英語の用法を当
てはめることが可能である。これら2つの選択順序の決
定方法のいずれか(あるいは他の順序決定情報)を用い
ることにより、テンプレートの選択が連続して行なわ
れ、その条件下で入力される未知の入力シンボルに対す
る最適な一致が決定される。
【0037】以下の3つの例は、単語“Exampl
e”の7文字の最近傍高速化(NNA)分類を示してい
る(最初は任意な選択により、2番目はF/U順の選択
により、3番目はHI順の選択によって行なったもので
ある)。最初の情報は、これら3つの高速化分類例の各
々によって行なわれる反復における候補の減少を示すた
めの、NNAを活用することなく生成されたベースライ
ンデータである。3つの高速化分類例で使用されるテン
プレートと、一般的な94の文字フォントに含まれるベ
ースラインは次の通りである。
【0038】ABCDEFGHIJKLMNOPQRS
TUVWXYZ abcdefghijklmnopqrstuvwxy
z 0123456789!”#$%&´( )*+,ー ・/:;<=>?@[ \ ]^_`{ | }〜 .
【0039】ベースライン(非高速化):658反復 (7入力)×(94フォントテンプレート) ベースラインに使用されるテンプレートの選択は任意に
固定のシーケンスで、A〜Z、a〜z、0〜9、句読
点、符号の順である(上記参照)。
【0040】 任意NNA(順序決定を行なわない):232反復 入力文字 E x a m p l e 反復数 05 50 27 39 42 38 31 NNAにより、ベースラインの任意の固定選択から約3
分の1に反復数が減っている。各反復の後に残ったテン
プレートからの選択は、上記と同じ任意に固定の順序で
行なった。すなわち、“E”が5回目に選択され、
“x”が50回目等である。大部分のテンプレートは、
固定選択シーケンスが固定の順序の選択位置へ進み、固
定順序における夫々の位置で選択がおこなわれるよりも
かなり以前に、NNAより除外されている。
【0041】 使用頻度(F/U)順によるNNA:131反復 入力文字 E x a m p l e 反復数 35 46 03 14 21 11 01 F/U順の選択では、ベースラインの任意選択から約5
分の1に反復数が減っている。文字“e”(小文字活字
ケース)は通常の英語用法において最も頻繁に使用され
る文字であり、従って各入力文字に対する最初の選択文
字となっている。単語“Example”の最後の文字
も“e”であり、正確に最初の選択に分類されている。
他の入力文字は、F/Uデータに基づいたより多くの反
復を必要とした。入力文字“E”(大文字)はそれほど
頻繁に使用されず、従って35反復が必要となった。文
字“X”は最も使用頻度の低い文字の1つであり、分類
には45反復を要している。
【0042】 HI順の選択では、ベースラインの任意選択から10分
の1に反復数が減っている。文字“X”は文字“e”
(及び“E”)の後に頻繁に現われるので、5回目の反
復後に分類されている。“E”(大文字)で始まる単語
はそれほど多くないため、必要とされた反復数は33で
あった。単語“Example”の各入力文字に対する
HI順のテンプレート選択は、文字の下に示す通りであ
る。
【0043】<産業上の応用性>以上の説明から、本発
明の目的が達成されたことが当業者には明らかになるで
あろう。 <結び>尚、発明の概念を離れない範囲で、本発明の構
成及び実施例は種々に変更することが可能である。さら
に、図示の実施例の特徴は他の図面を用いて使用するこ
とも可能である。従って、本発明の範囲は以下の請求項
及びその権利範囲内の記載により限定される。
【0044】
【発明の効果】本発明により、最近傍を認識するための
より向上した、比較関数に基づく高速OCRベクトル認
識方法を提供できる。又、三角不等式の原理を用いるこ
とにより、高速化された比較関数に基づくOCRベクト
ル認識方法を提供できる。
【0045】又、上記の比較関数に基づく方法であっ
て、予めテンプレート間の比較値を比較計算し、即座に
使用できるように格納しておくOCRベクトル認識方法
を提供できる。又、上記の比較関数に基づく方法であっ
て、各反復のテンプレートベクトルの選択を体系的に行
なうOCRベクトル認識方法を提供できる。
【図面の簡単な説明】
【図1】本実施例の分類済みの文字を示す多元空間を2
次元的に表現した図である。
【図2】本実施例の反復OCR方法の基本的なステップ
を示すフローチャートである。
【図3】T×Tのテンプレート比較値の全値を示す比較
値ペアテーブルを示す図である。
【図4】(T2ーT)/2の重複のないテンプレート比
較値を示す比較値ペアテーブルを示す図である。
【図5】入力シンボル“?”の前景及び背景の画素を示
す画素マトリックス(ビットマップ)を示す図である。
【図6】選択されたテンプレート“B”の前景及び背景
の画素を示す画素マトリックス(ビットマップ)を示す
図である。

Claims (49)

    【特許請求の範囲】
  1. 【請求項1】 分類済みの文字を定義するT個のテンプ
    レートベクトルのライブラリにより、未分類のシンボル
    を定義する入力ベクトルSの最近傍分類を認識する比較
    関数に基づくOCR方法であって、 各エレメントが数値を持っているエレメント列の形で未
    分類のシンボルの入力ベクトルSを供給する工程と、 各エレメントが数値を持っているT個のエレメント列の
    形でT個のテンプレートベクトル(T1,T2,…,T
    i,TT)のライブラリを供給する工程と、 前記T個のテンプレートベクトル・ライブラリから初期
    テンプレートベクトルTi1st を選択する工程と、 入力比較関数に基づいて、前記初期テンプレートベクト
    ルTi1st を前記入力ベクトルSと比較して、初期入力
    比較値V1st を発生する工程と、 前記初期入力比較値V1st の関数として、初期比較閾値
    1st を決定する工程と、 テンプレート相互の比較関数に基づいて、前記初期テン
    プレートベクトルTi 1st と(T−1)個の他のテンプ
    レートベクトル(T1,T2,…,TT)間のテンプレ
    ート相互比較値を供給する工程と、 前記T個のテンプレートライブラリ中にあって前記初期
    比較閾値V1st 内のテンプレート相互比較値を有するテ
    ンプレートベクトルを同定して、T個のテンプレートラ
    イブラリの入力ベクトルSの最近傍分類を含み、閾値外
    のテンプレート相互比較値を有するテンプレートベクト
    ルを除くテンプレートベクトルの第1候補グループG
    1st を形成する工程と、 前記第1候補グループG1st から第2テンプレートベク
    トルTi2nd を選択する工程と、 入力比較関数に基づいて、前記第2テンプレートベクト
    ルTi2nd を前記入力ベクトルSと比較して、第2入力
    比較値V2nd を発生する工程と、 テンプレート相互の比較関数に基づいて、前記第2テン
    プレートベクトルTi 2nd と前記第1候補グループG
    1st 内の選択されなかったテンプレートベクトルとのテ
    ンプレート相互比較値を供給する工程と、 前記第1候補グループG1st 内にあって前記第2入力比
    較値V2nd により決定される閾値内のテンプレート相互
    比較値を有するテンプレートベクトルを同定して、入力
    ベクトルSの最近傍分類を含み、閾値外のテンプレート
    相互比較値を有するテンプレートベクトルを前記第1候
    補グループG1st から除き、以前の同定工程で除かれた
    全てのテンプレートベクトルも除くテンプレートベクト
    ルの第2候補グループG2nd を形成する工程と、 前記選択工程,比較工程,決定工程,テンプレート相互
    比較値供給工程,同定工程を、T個のテンプレートベク
    トルライブラリにおいて入力ベクトルSの最近傍分類と
    なる唯一の最終テンプレートベクトルTiFinを除く全て
    のテンプレートベクトルが除かれるまで繰り返す工程と
    を備えるOCR方法。
  2. 【請求項2】 前記テンプレート相互比較値はメモリ手
    段に格納されている請求項1記載のOCR方法。
  3. 【請求項3】 前記メモリ手段に格納されたテンプレー
    ト相互比較値は比較済みである請求項2記載のOCR方
    法。
  4. 【請求項4】 メモリ手段に格納された前記テンプレー
    ト相互比較値は、T 2 のエントリを含む請求項2記載の
    OCR方法。
  5. 【請求項5】 メモリ手段に格納された前記テンプレー
    ト相互比較値は、(T2 −T)/2のエントリを含む請
    求項2記載のOCR方法。
  6. 【請求項6】 前記入力ベクトルSはES 個のエレメン
    トを有し、各テンプレートベクトルはEt 個のエレメン
    トを有する請求項1記載のOCR方法。
  7. 【請求項7】 前記未分類のシンボルは、分類済の文字
    がテンプレートベクトルで定義される解像度と同じ解像
    度で入力ベクトルSにより定義され、入力ベクトルSの
    エレメント数ES はテンプレートベクトルのエレメント
    数Et と等しい請求項6記載のOCR方法。
  8. 【請求項8】 前記未分類のシンボルは、分類済の文字
    がテンプレートベクトルにより定義される解像度と異な
    る解像度で入力ベクトルSにより定義され、入力ベクト
    ルSのエレメント数ES はテンプレートベクトルのエレ
    メント数Etと等しくない請求項6記載のOCR方法。
  9. 【請求項9】 前記未分類入力シンボルの解像度は分類
    済のテンプレート文字の解像度の倍数mであり、入力ベ
    クトルSのエレメント数ES はテンプレートベクトル数
    t の倍数mである請求項8記載のOCR方法。
  10. 【請求項10】 入力ベクトルSのエレメント数ES
    は、入力ベクトルSのm個の連続するエレメントを入力
    比較関数で使用される1つの合成エレメントに平均化す
    ることによって、テンプレートベクトルのエレメント数
    t と一致するように減少される請求項9記載のOCR
    方法。
  11. 【請求項11】 ベクトルSのエレメント数ES は、入
    力比較関数に入力ベクトルSのm個毎のエレメントのみ
    の使用によって、テンプレートベクトルのエレメント数
    t と一致するように減少される請求項9記載のOCR
    方法。
  12. 【請求項12】 分類済のテンプレート文字の解像度は
    未分類の入力シンボルの解像度の倍数mであって、テン
    プレートベクトルのエレメント数Et は入力ベクトルの
    エレメント数ES の倍数mである請求項8記載のOCR
    方法。
  13. 【請求項13】 入力ベクトルSのエレメント数ES
    は、入力ベクトルSのm個の連続するエレメントを入力
    比較関数で使用される1つの合成エレメントに平均化す
    ることによって、テンプレートベクトルのエレメント数
    t と一致するように減少される請求項12記載のOC
    R方法。
  14. 【請求項14】 ベクトルSのエレメント数ES は、入
    力比較関数に入力ベクトルSのm個毎のエレメントのみ
    の使用によって、テンプレートベクトルのエレメント数
    t と一致するように減少される請求項12記載のOC
    R方法。
  15. 【請求項15】 前記入力比較関数はテンプレート相互
    の比較関数と数学的に等価である請求項1記載のOCR
    方法。
  16. 【請求項16】 前記比較関数は相違関数であって、各
    繰り返しで発生する入力比較値は選択されたテンプレー
    トベクトルと入力ベクトルSとの距離“r”であること
    を特徴とする請求項15記載のOCR方法。
  17. 【請求項17】 各繰り返しで決定される比較閾値は、
    以下の関係に対応して繰り返して発生する入力比較値の
    2倍であることを特徴とする請求項16記載のOCR方
    法。 Rkth =2×CVkth ここで、kはOCR方法のk番目の繰り返しサイクル、 Rはk番目の繰り返しの比較閾値、 CVはk番目の繰り返しの比較値である。
  18. 【請求項18】 各繰り返しで選択されたテンプレート
    ベクトルを入力ベクトルSと比較するための入力比較関
    数は、次の減法相違関数であることを特徴とする請求項
    17記載のOCR方法。 CV={(S1 −t12 +(S2 −t22 +…(S
    j −tj2+…(Sn −tn21/2 ここで、CVは発生される比較値、 tj は選択されたテンプレートベクトルのj番目のエレ
    メント、 Sj は比較中の入力ベクトルS(あるいは他のテンプレ
    ートベクトル)のj番目のエレメント、 nはベクトルのエレメント数である。
  19. 【請求項19】 前記比較関数は類似関数であることを
    特徴とする請求項15記載のOCR方法。
  20. 【請求項20】 前記類似関数は、次の内挿類似関数で
    あることを特徴とする請求項19記載のOCR方法。 CV=(S1 ・t1 )+(S2 ・t2 )+…(Sj ・t
    j )…+(Sn ・tn)/{(S1 2+…Sj 2 +…
    n 2)・(t1 2+…tj 2 +…tn 2)}1/2 ここで、CVは発生される比較値、 Sj は入力ベクトルSのj番目のエレメント、 tj は比較中のテンプレートのj番目のエレメント、 nはベクトルのエレメント数である。
  21. 【請求項21】 入力ベクトルSのエレメント列は未分
    類シンボルのビジュアル・アスペクツを定義し、T個の
    テンプレートベクトルのT個のエレメント列は分類済文
    字の対応するビジュアル・アスペクツを定義することを
    特徴とする請求項1記載のOCR方法。
  22. 【請求項22】 前記ビジュアル・アスペクツは未分類
    シンボルと分類済文字とを定義する特徴セットを備える
    ことを特徴とする請求項21記載のOCR方法。
  23. 【請求項23】 入力ベクトルSのエレメント列は未分
    類のシンボルの画像を定義し、T個のテンプレートベク
    トルのT個のエレメント列は分類済文字の画像を定義す
    ることを特徴とする請求項1記載のOCR方法。
  24. 【請求項24】 入力ベクトルSとT個のテンプレート
    ベクトルとで定義される画像は、前景及び背景のデジタ
    ルデータとしてピクセルビットマップメモリに格納され
    ることを特徴とする請求項23記載のOCR方法。
  25. 【請求項25】 入力ベクトルの各エレメントとT個の
    テンプレートベクトルの各エレメントとは、1つのピク
    セルのデジタルデータとして格納されることを特徴とす
    る請求項24記載のOCR方法。
  26. 【請求項26】 前景及び背景のデジタルデータはバイ
    ナリ形式であることを特徴とする請求項25記載のOC
    R方法。
  27. 【請求項27】 前景及び背景のデジタルデータはグレ
    ースケール形式の明度レベルデータであることを特徴と
    する請求項25記載のOCR方法。
  28. 【請求項28】 前景及び背景のデジタルデータはカー
    ラ形式の色調レベルデータであることを特徴とする請求
    項25記載のOCR方法。
  29. 【請求項29】 前記入力ベクトルSの画素画像の画素
    数Ps はT個のテンプレートベクトルの各々の画素画像
    の色素数Pt と等しいことを特徴とする請求項25記載
    のOCR方法。
  30. 【請求項30】 入力ベクトルSの画素画像はRs 個の
    ロウとCs 個のカラムとを有する画素マトリックスであ
    り、T個のテンプレートベクトルの各々の画素画像はR
    t 個のロウとCt 個のカラムとを有する画素マトリック
    スであることを特徴とする請求項29記載のOCR方
    法。
  31. 【請求項31】 入力ベクトルの各々の画素画像のロウ
    数Rs はT個のテンプレートベクトルの各々の画素画像
    のロウ数Rt と等しく、入力ベクトルSの画素画像のカ
    ラム数Cs はT個のテンプレートベクトルの各々の画素
    画像のカラム数Cs と等しいことを特徴とする請求項3
    0記載のOCR方法。
  32. 【請求項32】 各繰り返しでの候補グループに残った
    候補からのテンプレートベクトルの選択順は、ランダム
    シーケンスであることを特徴とする請求項1記載のOC
    R方法。
  33. 【請求項33】 各繰り返しでの候補グループに残った
    候補からのテンプレートベクトルの選択順は、ランダム
    固定シーケンスであることを特徴とする請求項1記載の
    OCR方法。
  34. 【請求項34】 各繰り返しでの候補グループに残った
    候補からのテンプレートベクトルの選択順は、分類済文
    字の使用頻度に基づくシーケンスであることを特徴とす
    るOCR方法。
  35. 【請求項35】 各繰り返しでの候補グループに残った
    候補からのテンプレートベクトルの選択順は、分類済文
    字の履歴推論に基づくシーケンスであることを特徴とす
    るOCR方法。
  36. 【請求項36】 比較関数に基づくOCR方法であっ
    て、 未分類のシンボルの入力ベクトルを供給する工程と、 T個のテンプレートベクトルのライブラリを供給する工
    程と、 T個のテンプレートベクトル・ライブラリからテンプレ
    ートベクトルを選択する工程と、 前記選択されたテンプレートベクトルを入力ベクトルと
    比較して、入力比較値を発生する工程と、 比較閾値を決定する工程と、 選択されたテンプレートベクトルとライブラリ間のテン
    プレート相互比較値を供給する工程と、 T個のテンプレートライブラリ中にあって決定された比
    較閾値内のテンプレート相互比較値を有するテンプレー
    トベクトルを同定して、閾値外のテンプレート相互比較
    値を有するテンプレートベクトルを除いた第1候補グル
    ープを形成する工程と、 前記選択工程,比較工程,決定工程,テンプレート相互
    比較値供給工程,固定工程を繰り返す工程とを備えるO
    CR方法。
  37. 【請求項37】 前記テンプレート相互比較値はメモリ
    手段に格納されている請求項36記載のOCR方法。
  38. 【請求項38】 前記メモリ手段に格納されたテンプレ
    ート相互比較値は比較済みである請求項37記載のOC
    R方法。
  39. 【請求項39】 メモリ手段に格納された前記テンプレ
    ート相互比較値は、T2 のエントリを含む請求項37記
    載のOCR方法。
  40. 【請求項40】 メモリ手段に格納された前記テンプレ
    ート相互比較値は、(T2 −T)/2のエントリを含む
    請求項37記載のOCR方法。
  41. 【請求項41】 前記入力ベクトルSはES 個のエレメ
    ントを有し、各テンプレートベクトルはEt 個のエレメ
    ントを有する請求項36記載のOCR方法。
  42. 【請求項42】 前記未分類のシンボルは、分類済の文
    字がテンプレートベクトルで定義される解像度と同じ解
    像度で入力ベクトルSにより定義され、入力ベクトルS
    のエレメント数ES はテンプレートベクトルのエレメン
    ト数Et と等しい請求項41記載のOCR方法。
  43. 【請求項43】 前記未分類のシンボルは、分類済の文
    字がテンプレートベクトルにより定義される解像度と異
    なる解像度で入力ベクトルSにより定義され、入力ベク
    トルSのエレメント数ES はテンプレートベクトルのエ
    レメント数E t と等しくない請求項41記載のOCR方
    法。
  44. 【請求項44】 前記未分類入力シンボルの解像度は分
    類済のテンプレート文字の解像度の倍数mであり、入力
    ベクトルSのエレメント数ES はテンプレートベクトル
    数Et の倍数mである請求項43記載のOCR方法。
  45. 【請求項45】 入力ベクトルSのエレメント数ES
    は、入力ベクトルSのm個の連続するエレメントを入力
    比較関数で使用される1つの合成エレメントに平均化す
    ることによって、テンプレートベクトルのエレメント数
    t と一致するように減少される請求項44記載のOC
    R方法。
  46. 【請求項46】 ベクトルSのエレメント数ES は、入
    力比較関数に入力ベクトルSのm個毎のエレメントのみ
    の使用によって、テンプレートベクトルのエレメント数
    t と一致するように減少される請求項44記載のOC
    R方法。
  47. 【請求項47】 分類済のテンプレート文字の解像度は
    未分類の入力シンボルの解像度の倍数mであって、テン
    プレートベクトルのエレメント数Et は入力ベクトルの
    エレメント数ES の倍数mである請求項43記載のOC
    R方法。
  48. 【請求項48】 入力ベクトルSのエレメント数ES
    は、入力ベクトルSのm個の連続するエレメントを入力
    比較関数で使用される1つの合成エレメントに平均化す
    ることによって、テンプレートベクトルのエレメント数
    t と一致するように減少される請求項47記載のOC
    R方法。
  49. 【請求項49】 ベクトルSのエレメント数ES は、入
    力比較関数に入力ベクトルSのm個毎のエレメントのみ
    の使用によって、テンプレートベクトルのエレメント数
    t と一致するように減少される請求項47記載のOC
    R方法。
JP6102933A 1993-05-17 1994-05-17 最近傍分類を認識する比較関数に基づくocr方法 Withdrawn JPH0737037A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US6283093A 1993-05-17 1993-05-17
US08/062830 1993-05-17

Publications (1)

Publication Number Publication Date
JPH0737037A true JPH0737037A (ja) 1995-02-07

Family

ID=22045106

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6102933A Withdrawn JPH0737037A (ja) 1993-05-17 1994-05-17 最近傍分類を認識する比較関数に基づくocr方法

Country Status (2)

Country Link
EP (1) EP0625764A3 (ja)
JP (1) JPH0737037A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0803066D0 (en) * 2008-02-20 2008-03-26 Siemens Medical Solutions Fast block matching
EP2154814A1 (en) * 2008-08-14 2010-02-17 Koninklijke Philips Electronics N.V. Scalable key distribution
US8150169B2 (en) * 2008-09-16 2012-04-03 Viewdle Inc. System and method for object clustering and identification in video

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5150425A (en) * 1991-08-30 1992-09-22 Eastman Kodak Company Character recognition method using correlation search

Also Published As

Publication number Publication date
EP0625764A2 (en) 1994-11-23
EP0625764A3 (en) 1995-07-19

Similar Documents

Publication Publication Date Title
US11715014B2 (en) System and method of character recognition using fully convolutional neural networks with attention
US4773099A (en) Pattern classification means for use in a pattern recognition system
US5438630A (en) Word spotting in bitmap images using word bounding boxes and hidden Markov models
US5745600A (en) Word spotting in bitmap images using text line bounding boxes and hidden Markov models
US5825919A (en) Technique for generating bounding boxes for word spotting in bitmap images
US5077807A (en) Preprocessing means for use in a pattern classification system
US5862259A (en) Pattern recognition employing arbitrary segmentation and compound probabilistic evaluation
EP0649113A2 (en) Multifont optical character recognition using a box connectivity approach
US5590220A (en) Bending point extraction method for optical character recognition system
EP3539052A1 (en) System and method of character recognition using fully convolutional neural networks with attention
Ebrahimi et al. A pictorial dictionary for printed farsi subwords
US5689584A (en) Method of and apparatus for pattern recognition and method of creating pattern recognition dictionary
US6052483A (en) Methods and apparatus for classification of images using distribution maps
Benouareth et al. HMMs with explicit state duration applied to handwritten Arabic word recognition
JPH0737037A (ja) 最近傍分類を認識する比較関数に基づくocr方法
Omachi et al. Structure extraction from decorated characters using multiscale images
CN109325138A (zh) 一种基于扩展与亚像素矩阵结合的图像快速识别方法
EP1010128B1 (en) Method for performing character recognition on a pixel matrix
Pornpanomchai et al. Printed Thai character recognition by genetic algorithm
EP0602955B1 (en) Text recognition
US20020126903A1 (en) Word recognizing apparatus for dynamically generating feature amount of word and method thereof
Gaceb et al. Graph b-coloring for automatic recognition of documents
CN112070116A (zh) 一种基于支持向量机的艺术画作自动分类系统及方法
Koga et al. Segmentation of Japanese handwritten characters using peripheral feature analysis
JP3361564B2 (ja) 高速マッチング方法及び装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20010731