JPH06168359A - ピクセル重み付けによるテンプレートライブラリの強調方法 - Google Patents

ピクセル重み付けによるテンプレートライブラリの強調方法

Info

Publication number
JPH06168359A
JPH06168359A JP5217765A JP21776593A JPH06168359A JP H06168359 A JPH06168359 A JP H06168359A JP 5217765 A JP5217765 A JP 5217765A JP 21776593 A JP21776593 A JP 21776593A JP H06168359 A JPH06168359 A JP H06168359A
Authority
JP
Japan
Prior art keywords
pixel
template
comparison
recognition
symbol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5217765A
Other languages
English (en)
Inventor
Abi Aizaku Hatsudaa
アビ・アイザク ハッダー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JPH06168359A publication Critical patent/JPH06168359A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 入力シンボルの認識において、L個の未強調
のイメージライブラリからG個の入力シンボルに対して
強調処理されたテンプレートを作ることを目的とする。 【構成】 既存のG個の入力シンボルのグループに関し
て、ライブラリ中の各イメージをグループのシンボルと
比較し、混同の可能性が最も高いイメージに重み付けす
ることによって、テンプレートが強調処理される。第1
比較C*と第2比較C**がG個の比較セットのそれぞれの
L個の比較の中から定められ、認識マージンが比較C*
C**の各対の間で定められる。最も小さい認識マージンM
*を形成する比較C*とC**のうち1対が選択されて、対応
するイメージIj*とIj**の1対が定められる。最も近い
ピクセルイメージIj*と2番目に近いピクセルイメージI
j* *がそれらの間の認識マージンを増加させるために重
み付け処理される。これらの処理は、ピクセルイメージ
のライブラリが十分に強調されたシンボルテンプレート
となるまで繰り返される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は入力シンボルの認識に関
し、特に光学的文字認識(OCR)において入力シンボ
ルとテンプレートとのマッチングを容易にするピクセル
テンプレートからなるテンプレートライブラリの強調方
法に関するものである。
【0002】
【従来の技術】従来、レーダの反射信号や文字ビットマ
ップなどの入力されるピクセルイメージを認識するため
には、相関係数が用いられてきた。入力されたピクセル
イメージは、ピクセルごとにライブラリのテンプレート
イメージと比較される。各イメージ/テンプレートのマ
ッチングにおけるピクセルの比較結果のすべての和が、
最も近いマッチングを表す相関係数となる。しかしなが
ら、これらの予め決められたテンプレートと相関をとる
方法では、ライブラリテンプレートを構成しているピク
セルのどんな変化や強調にも対応できない。
【0003】
【発明が解決しようとする課題】本発明は、光学的文字
の認識を改良するためのテンプレートライブラリの強調
方法を提供することを目的とする。また本発明は、主要
な比較と最大となる次の比較との間の最小のマージンを
極大化するテンプレートライブラリの強調方法を提供す
ることを目的とする。
【0004】また本発明は、ピクセルの重み付けにより
テンプレートと入力シンボルとの相違を強調するような
テンプレートライブラリの強調方法を提供することを目
的とする。また本発明は、ピクセルの重み付けによりテ
ンプレートと入力シンボルとの類似性を抑制するような
テンプレートライブラリの強調方法を提供することを目
的とする。
【0005】
【課題を解決するための手段】簡単に言えば、本発明の
これらのまたはその他の目的は、G個のピクセルシンボ
ルの強調処理された認識ピクセルテンプレート(T1 T2
T3…Ti…TG)のライブラリを提供するために、G個の既
存のピクセルシンボル(S1 S2 S3…Si…SG)に関して、
L個の未強調のピクセルイメージ(I1 I2 I3…Ij…IL)
の認識ライブラリを強調処理する方法を提供することに
より達成される。
【0006】すなわち、L個の未強調のピクセルイメー
ジ(I1 I2 I3…Ij…IL)のライブラリを与える行程と、
G個のピクセルシンボル(S1 S2 S3…Si…SG)のグルー
プを与える行程と、G個のピクセルシンボルの各々をL
個のピクセルイメージと比較して、G個のピクセルシン
ボルのそれぞれSiに対してL個の比較が1セットあり、
各ピクセルイメージIjに対して比較Cij をもつ比較の集
合があるような、各セットがL個の比較(C1 C2 C3…Cj
…CL)からなるG個のセットで構成されるG×L個の比
較を得る行程と、G個の比較セットのそれぞれのL個の
比較の中からピクセルシンボルSiと最も近い比較を持っ
た第1比較をCi* とし、G個の第1比較C*(C1* C2* C3
* …Ci* …CG* )の集合を形成する行程と、G個の比較
セットのそれぞれの残りのL−1個の比較の中からピク
セルシンボルSiと2番目に最も近い比較を持った第2比
較をCi**とし、G個の第2比較C** (C1** C2** C3**
Ci** …CG**)の集合を形成する行程と、比較C*とC**
のそれぞれの対の間の認識マージンであるG個の認識マ
ージン(M1 M2 M3…Mi…MG)を決定する行程と、G個の
比較の対のすべての中で最も小さな認識マージンM*を持
った1対の比較C*とC** を選択する行程と、比較C*とC
** の対に対応する1対のピクセルイメージI*とI**
定める行程と、選択された比較C*とC** の対に対応する
最も近いピクセルイメージI*、または2番目に近いピク
セルイメージI** 、またはそれらの両方に対し、あるピ
クセルに対して重み付け処理を施して認識マージンM*
増加させ、ピクセルイメージを最も近いピクセルテンプ
レートT*か、または2番目に近いピクセルテンプレート
T** 、またはそれらの両方としていく行程と、ピクセル
イメージのライブラリが、少なくともそのうちのいくつ
かが既存のG個のピクセルシンボル(S1 S2 S3…Si…S
G)のグループの対応するピクセルシンボルに現れない
重み付けされたピクセルずれをもつ強調処理されたシン
ボルテンプレート(T1T2 T3…Ti…TG)となるまで、前
記比較,設定,決定,選択及び重み付けの行程を繰り返
す行程とを備え、既存のG個のピクセルシンボル(S1 S
2 S3…Si…SG)のグループに関して、G個のピクセルシ
ンボルを強調処理した認識ピクセルテンプレート(T1 T
2 T3…Ti…TG)を提供することにより、L個の未強調の
ピクセルイメージ(I1 I2 I3…Ij…IL)の認識ライブラ
リの強調を行なうことを特徴とする。
【0007】
【実施例】
<強調の一般的方法(図1,図2)>光学的文字認識
(OCR)のために、予め存在するG個の入力シンボル
(ピクセルビットマップ)のグループに関して、L個の
未強調のイメージ(ピクセルビットマップ)が強調処理
されて、G個の入力シンボルのG個の強調処理された認
識テンプレート(ピクセルビットマップ)のライブラリ
が作られる。強調処理は、ライブラリにある各イメージ
をグループ内の各シンボルと比較し、混同の可能性が最
も高くなるようイメージに重み付けすることによって達
成される。
【0008】L個の未強調のイメージ(I1 I2 I3…Ij…
IL)は、図1の(a)のG×Lの比較行列の縦軸に沿っ
て並べられている。G個の既存の入力シンボルのグルー
プ(S1 S2 S3…Si…SG)は、行列の水平軸に沿って並べ
られている。G個の強調処理された認識テンプレート
(T1 T2 T3…Ti…TG)のライブラリは、G×L行列には
示されていない。しかしながら、G個の強調処理された
認識テンプレートのライブラリのためのシンボル/イメ
ージの比較(T11 T22 T33 …Tij …TGL)は、入力シンボ
ルが未強調のイメージと一致しているG×L行列の対角
線に沿って並べられている。この対角線上のテンプレー
トの関係は、シンボルとイメージとが各軸に沿って同じ
順で現れる、すなわち、Si=Ij, Si+1=Ij+1であることを
仮定している。小文字シンボルa〜zの比較行列が図1
の(b)に示されており、特に似ている文字“o”,
“c”,“e”の集団のシンボル/イメージ比較が示さ
れている。
【0009】テンプレート強調法の処理ステップが図2
のフローチャートにまとめられており、以下に詳しく述
べる。 ステップS1:以下の処理でG個の強調処理されたテン
プレートの特徴的なライブラリへと発展していく、L個
の未強調のピクセルイメージ(I1 I2 I3…Ij…IL)のラ
イブラリを与える。
【0010】ステップS2:目的の特定のユーザフォン
トにおけるG個のピクセルシンボル(S1 S2 S3… Si …
SG)のグループを与える。英数字の適用のための共通の
フォントは、Courier とTimes Roman である。一般的に
は、ユーザフォントは次のものを含む。 大文字 ABCDEFGHIJKLMNOPQRSTUVWXYZ 小文字 abcdefghijklmnopqrstuvwxyz 数字 1234567890 句読点 !@#$%^&*()_+-=[]{};'`:"~\|,<.>/? この強調処理技術は、レーダの反射信号や音素パターン
(スピーチフォント)を含む音声認識アプリケーション
など、他の認識アプリケーションに応用することができ
る。
【0011】強調処理されていないイメージのフォント
と入力シンボルとは、初期のシンボル/イメージの比較
を最大化し、テンプレートの発展に対し便利な初期状態
を与えるために、同一であってもよい。一方、初期のイ
メージフォントは、一般的なフォントである場合もあれ
ば、入力シンボルフォントの特別な先駆(precursor)フ
ォントである場合もあり、またランダムノイズに基づく
テンプレートであることさえあり得る。ライブラリ内の
イメージの数Lは、グループ内のシンボルの数Gと等し
いかまたは大きい。ライブラリは入力シンボル内に含ま
れていないイメージをもつこともある。これらの“アイ
ドルな”イメージはシンボル/イメージ比較に含まれ
ず、従って変わることはなくテンプレートになる。1つ
のイメージが2つの別の入力シンボルに対応して発展し
ていくことを避けるために、LはGより少なくないこと
が望ましい。
【0012】ステップS3:図1のG×L行列の内部に
示すように、G×L個の比較を得るためにG個の入力シ
ンボルの各々をL個の未強調のイメージと比較する。シ
ンボル/イメージ比較は、一般的な未強調イメージIjの
各ピクセルを、比較関数(後にコーシー・シュワルツの
項で詳しく議論する)に基づいて、一般的な入力シンボ
ルSiと比較することによってなされる。G×L個の比較
により、各入力シンボルに対してL個の比較が1セット
ずつ作られ、L個の比較を有するGセットの集合が作ら
れる。L個の比較を有する各セットは、未強調イメージ
Ijのそれぞれに対して比較Cij をもつ。一般的なシンボ
ルSiの比較の集合(Ci1 Ci2 Ci3 …Tij …CiL)が、Siの
列の上方に延びる。入力シンボル“o”(小文字)の英
数字イメージフォントに対する初期状態のL個の比較の
列が、図3の(a)にグラフで示されている。
【0013】ステップS4:Gセットの比較のそれぞれ
におけるL個の比較の中から、ピクセルシンボルSiに最
も近い比較を持っている第1比較を、C*とする。行方向
の第1比較の集合(C1* C2* C3* …Ci* …CL* )を形成
するG個の第1比較の全体をC*とする。入力シンボル
“o”(小文字)に対し最も高い比較Ci*を有するの
は、当然未強調のイメージ“o”(小文字)である。
【0014】ステップS5:Gセットの比較のそれぞれ
における残りのL−1個の比較の中から、ピクセルシン
ボルSiに2番目に近い比較を持っている第2比較を、C
** とする。第2比較C** にあるイメージは、入力シン
ボルと最も混同しやすいイメージである。行方向の第2
比較の集合(C1** C2** C3**… Ci** …CL**)を形成す
るG個の第2比較の全体をC** とする。第1比較および
第2比較の集合は、Gセットの列の各々から1対の比較
C*とC** とのG個の対を構成する。図3の(a)におけ
る入力シンボル“o”の2番目に高い比較C** は、未強
調のイメージ“c”(小文字)の第2比較o/cであ
る。シンボル“o”,“c”,“e”は、混同する可能
性の高い類似したイメージの集団を形成し、“アンチキ
ャラクタ”(アンチキャラクタと集団については次の項
を参照)となる。
【0015】ステップS6:第1比較C*および第2比較
C** との各対の間の認識マージンから成るG個の認識マ
ージン(M1 M2 M3… Mi …MG)を決定する。G個の認識
マージンの全体が Mと決定される。マージンM の大きさ
は、C*の値とC** の値の差である。o/cマージンは図
3の(a)に示すように0.12である。
【0016】ステップS7:定められたGセットの全比
較の中から、最も小さな認識マージンM*を持つ1つの比
較C*とC** の対を選択する。認識マージンが小さくなれ
ばなるほど、OCRで混同を起こす危険性が大きくな
る。 ステップS8:定められた比較C*とC** の基となるイメ
ージの1対をI*とI**とする。イメージI*は入力シンボ
ルSiと一致するものであり、イメージI** はSiと最も混
同する可能性の高いものである。
【0017】ステップS9:認識マージンM*を増加させ
るため、比較C*とC** との選択された対の基となる最も
近いピクセルイメージI*、または2番目に近いピクセル
イメージI** 、またはそれらの両方に対し、あるピクセ
ルに対して重み付け処理を施し、ピクセルイメージを最
も近いピクセルテンプレートT*か、または2番目に近い
ピクセルテンプレートT** が、またはそれら両方にして
いく。
【0018】ステップS10:ピクセルイメージが十分
に強調処理されたシンボルテンプレート(T1 T2 T3…Ti
…TG)になるまで、比較,同定,決定,選択,そして重
み付けの上記ステップを繰り返す。強調処理されたテン
プレートに発生した重み付けされたピクセルのずれは、
既にあるG個のピクセルシンボル(S1 S2 S3…Si…SG)
のグループの対応するピクセルシンボルにはない。
【0019】(終了)強調の重み付け処理は、入力シン
ボルとテンプレートとの間の最も小さい認識マージン
が、予め定められた" 安全な" 最小値より大きくなった
ときに終了する。すなわち、最もエラーを起こしそうな
シンボル/テンプレート比較であっても、十分に正しく
認識される高い可能性をもつ場合である。
【0020】処理はまた、最小のマージンの増加分が予
め定めた最小の増加分より小さくなった場合にも終了さ
れうる。すなわち、テンプレートの各々の繰り返しにお
いて認識マージンを変更するレートが無視できるほど小
さく、時間を消費する利点がない場合である。また、指
定された回数の重み付けの繰り返しが実行された場合、
もしくは予めめ割り当てられた処理時間を越えた場合
に、処理は終了される。時として、テンプレートの強調
処理が、第1比較と第2比較とのマージンの境における
“局部的極大”の存在により遅くなる場合がある。もし
局部的極大が不安定なものであるならば、あとに続く繰
り返しの間に解放され、強調処理はもとの妨げられない
スピードに戻る。しかしながら、もし局部的極大が安定
している場合には、強調処理は第1比較と第2比較との
間で永久にロックされてしまう。認識マージンは全く更
新されず、同じレベルに固定されたままとなる。
【0021】<アンチキャラクタ(図3の(a),図4
の(a),図5の(a)>シンボル“o”,“c”,
“e”は、混同の可能性の高い類似した形のイメージの
集団を生成する。強調処理で互いにコントラストをなす
ようになると、集団内の文字は相互に“アンチキャラク
タ”となる。最初は、“o”と“c”だけがアンチキャ
ラクタである(図3の(a)のグラフ中の“o”の列に
肉太線で示してある)。次に“o”のアンチキャラクタ
の集団は、“censu”のアンチキャラクタを含むよ
うに拡大する(図3の(b)のグラフ中の“o”の列に
肉太線で示してある)。小文字の類似したアンチキャラ
クタの他の集団としては、“f”と“t”や“h”と
“b”がある。句読点の類似の例として“,”と“;”
が挙げられる。特に難しい類似集団は、数字の“1”と
小文字の“l”と大文字の“I”とエクスクラメーショ
ンマーク“!”とにより形成される。類似したアンチキ
ャラクタの集団の中の各要素シンボルのためのテンプレ
ートは、それ自身を同じ集団中の他の要素から識別でき
なくてはならない。
【0022】小文字のシンボルa〜zの比較行列が図1
の(b)に示されており、特に類似文字“o”,
“c”,“e”の集団のシンボル/イメージ比較を示し
ている。入力シンボルフォント(小文字の“o”,
“c”,“e”を含む)は、アルファベット順に図1の
(b)の比較行列の水平軸に沿って並べられる。イメー
ジフォント(これもまた小文字の“o”,“c”,
“e”を含む)は縦軸に沿って並べられる。入力シンボ
ル“o”と各イメージとのL個の第1比較の初期のセッ
トが図1の(b)に示されており、入力シンボル“o”
の列に縦方向に並べられている。紙面節約のため、小文
字のイメージのみが図1の(b)に示されている。大文
字,数字,句読点は割愛する。
【0023】入力シンボル“o”(小文字)のL個の初
期比較の列を、図3の(a)のグラフに別のフォーマッ
トで示す。初期の強調処理していないイメージが、グラ
フのx軸に沿ってアルファベット順に並べられる。シン
ボル/イメージ比較の値(0と1.00の間)をy軸方向に
プロットしている。図3の(a)のグラフの“o”列
は、図1の(b)の小文字の比較行列に、より狭義には
水平軸に沿っての“o”の位置から上に延長した垂直軸
における“o”の文字との比較に基づいている。G個の
入力シンボルグループの各シンボルは、図3の(a)の
“o”のグラフに似たL個のシンボル/イメージ比較を
含んだ個別のイメージセットのグラフを持っている。入
力シンボル“c”に対する初期比較のイメージ列セット
のグラフが図4の(a)に示されており、“e”のイメ
ージ列セットのグラフが図5の(a)に示されている。
【0024】第1比較の段階で、G個の第1比較の全体
がC*として定められる。入力シンボル“o”(小文字)
のもっとも高い比較C*は、もちろん未強調のシンボル
“o”(小文字)である。図3の(a)の実施例におい
て、イメージフォントはシンボルフォントに対して一意
であるので、比較o/o(肉太線)は1.00という値を持
つ。入力シンボル“c”のC*はイメージ“c”で1.00の
値をとり(図4の(a)の肉太線を参照)、入力シンボ
ル“e”のC*はイメージ“e”(図5の(a)の肉太線
を参照)で1.00の値をとる。
【0025】第2比較において、G個の第2比較の全体
がC** として定められ、Gセットの比較のそれぞれに1
セットの比較C*とC** とのG個のセットが形成される。
図3の(a)における入力シンボル“o”の2番目に高
い比較C** は、英数字のライブラリの(L-1) 個のイメー
ジのうちのどれよりも“o”に近いシンボルである、未
強調のイメージ“c”(小文字)の比較o/c(肉太
線)である。イメージ“c”は入力シンボル“o”と一
致しないので、比較o/c(肉太線)は0.88の値しかな
い。図3の(a)における比較o/eは0.84より僅かに
小さい。入力シンボル“c”の場合(図4の(a)を参
照)、C** は比較c/o(肉太線)で値は0.88である。
入力シンボル“e”の場合(図5の(a)を参照)、C
** は比較e/o(肉太線)で値は0.86である。
【0026】各繰り返しで決定される認識マージンMの
大きさは、C*とC** の値の差である。初期のo/cマー
ジンは0.12であり(図3の(a)参照)、初期のc/o
マージンは0.12である(図4の(a)参照)。初期のe
/cマージンは0.14である(図5の(a)参照)。 <dM/dT*とdM/dT** の一般的な場合>ある入力シンボル
Siに関するテンプレートの強調処理は、一般的には、比
較C*とC** の選択されたセットを構成する第1比較C*
最大の第2比較C** との間の最小の認識マージンを、次
式にしたがって最大化にする処理を含む。
【0027】M = min[C* - max(C**)] の最大化 ここで、M はC*とC** 間の認識マージンであり、C*はラ
イブラリの中で入力シンボルSiに最も近いテンプレート
T*の第1比較であり、C** はライブラリの中で入力シン
ボルSiに2番目に近いテンプレートT** の第2比較であ
る。
【0028】認識マージンM のような多値関数は、数多
くの数値計算最適化処理により最大化され得る。図3,
図4,図5の実施例で採用されている処理は、“山上り
法(gradient ascent) ”や“最急上昇法(steepest asce
nt) ”であり、最小化問題において用いられる最急降下
法(steepest descent)と関連する。認識マージンMを
増やすため、C** を重み付けによって減少させるか、C*
を増加させるか、またはその両方を行わなくてはならな
い。テンプレートT** 内の漸次的な重み付けの効果は、
ビットマップにおけるピクセルのずれを引き起こし、C
** を減少させる。すなわち、複数回の重み付けの繰り
返しの後に、T** は入力シンボルSiとの類似性が減少
し、C** が低い値を持つようになる。
【0029】o/cマージンの増加の結果が、図3の
(b)の発展したテンプレート列セットのグラフに示さ
れている(図3の(a)の初期イメージのグラフの真下
に示されている)。“o”のテンプレートのグラフは、
テンプレート(小文字)に関する入力シンボル“o”
(小文字)に対するL個の比較の発展したセットを示し
ている。図3の(b)の発展したテンプレートのグラフ
は、図3の(a)の初期イメージのグラフと同じフォー
マットである。強調処理されたテンプレートは、グラフ
のx軸に沿ってアルファベット順に並べられている。比
較の値はy軸にプロットされている。o/cマージン
は、図3の(a)の初期イメージに示されている0.12か
ら、図3の(b)の発展したテンプレートのグラフに示
されている0.21に増加している。G個の入力シンボルの
各々は、図3の(b)の“o”のセットと同様なL個の
比較を含む個別のテンプレートセットのグラフを有し、
それは入力イメージセットのグラフから発展していく。
入力シンボル“c”に対する発展した比較のテンプレー
トの列セットのグラフが図4の(b)に、入力シンボル
“e”に対する発展した比較のテンプレートの列セット
のグラフが図5の(b)に示されている。
【0030】漸次的な重み付けの効果は、テンプレート
T*のビットマップにおいてピクセルのずれをも蓄積し、
C*をわずかに減少させる。すなわち、複数回の重み付け
の繰り返しの後、T*は入力シンボルSiと次第に似なくな
ってくる。しかしながら、Mは最大化されるので、各繰
り返しにおいてC*は1.00のレベルの近くに保たれる。比
較o/oにおける減少は、図3の(b)の発展したテン
プレートのグラフに見られる。比較o/oは、図3の
(a)における1.00から図3の(b)において0.96に減
少している。比較c/cもまた0.96に減少しており(図
4の(b)参照)、比較e/eも0.98に減少している
(図5の(b)参照)。シンボル/イメージの比較o/
cの場合(図3の(b)参照)、o/cマージンは増加
し、o/eマージンの0.21に近づく。o/cマージンが
o/eマージンより大きくなった場合には、C** は比較
o/cに代わって比較o/eに置き換えられる。繰り返
しが進むにつれ、テンプレートT** は、o/cマージン
とo/eマージンが“n”や“s”といった他のイメー
ジに対するマージンより小さくなるまで、テンプレート
“c”とテンプレート“e”との間を行き来する。認識
マージンが増加すると、アンチキャラクタの集団“o”
が図3の(b)に示すように“c”,“e”,“n”,
“s”,“u”を含むまでに広がる。“o”テンプレー
トをさらに強調していくと、“m”や“z”を含むまで
わずかに増加するであろう。図4の(b)に入力シンボ
ル“c”に対して0.75前後の比較値を持つアンチキャラ
クタの集団を示す。また図5の(b)に0.77前後の比較
値を持つアンチキャラクタの集団“c”,“o”,
“s”を示す。
【0031】最大マージンM は、比較−繰り返しサイク
ルにおいてテンプレートT*とテンプレートT** に次第に
重み付けをしていくことによって達成される。漸次的な
テンプレートの重みW*とW** とは、テンプレートT*とT
** との複数のベクトル要素に関する認識マージンの1
次微分(ベクトルの傾き)によって定められる。 dM/dT* = dC*/dT* - dC**/T* dM/dT** = dC*/dT** - dC**/T** 各繰り返しにおいてT*とT** とに加えられる単位重み
は、 W* = u*(dM/dT*) W** = u**(dM/dT**) である。ここで、 u*は、各比較の繰り返しにおけるdM/dT*の重み付けファ
クタミュー(mu) u** は、各比較の繰り返しにおける dM/dT**の重み付け
ファクタミュー(mu)である。
【0032】重み付けファクタu*とu** は、強調のアプ
リケーションに対応して同じである場合もあれば異なる
場合もある。一般的には、ミューが大きくなればM にお
いて大きな発展が起き、各繰り返しにおいて発展する率
が高くなる。しかしながら大きな発展は、M 関数の目的
とする最大値をすり抜け、繰り返し処理において不安定
な発振を始めることがあり得る。ミューの値が小さい
と、より遅くより安定となる。最大値に近づくために中
くらいのミューを採用し、より正確に最大値に達するた
めミューの値を減少させていく。
【0033】強調処理の各繰り返し“n”では、以下に
示すように古いテンプレートTnからわずかに異なる新し
いテンプレートTn+1が生成される。 T* n+1 = T* n + W* = T* n + u*(dM/dT*) = T* n + u*(dC*/dT*- dC**/dT*) T** n+1 = T** n + W** = T** n + u**(dM/dT**) = T** n + u**(dC*/dT**- dC**/dT**) 各繰り返しにおいて、T** とC** はT*とC*から大きくは
なれ、認識マージンMは大きくなる。第1比較と第2比
較C*とC** (新しいテンプレートT*とT** )の新しいセ
ットにより現在のものが置き換えられるまで、分離が続
けられる。
【0034】<“o”のアンチキャラクタ“cens
u”の発展>入力シンボル“o”と拡張したアンチキャ
ラクタの集団“c”,“e”,“n”,“s”,“u”
とに応じたテンプレートのライブラリの発展を以下に示
す。この繰り返しは、図3の(a)と(b)のグラフの
データと、重み付けファクタがu*= u** = 0.01で初期テ
ンプレート“o”がシンボル“o”に一致するという初
期条件とに基づいている。
【0035】n=0 において(繰り返し以前) テンプレートo0 = 入力シンボルo n=10において(10回の繰り返し後) テンプレートo10 =(テンプレートo) - 0.10( テン
プレートc) テンプレートc係数は、積 (n)(u) = (10)(0.01) = 0.1
0 。最初の1〜10回の繰り返しにおいて、C** のテン
プレートはテンプレートcだけであり、繰り返しあたり
のM の増加は早い。
【0036】n=16において テンプレートo16 =(テンプレートo0) - 0.13( テン
プレートc) - 0.03(テンプレートe) 11〜16の6回の繰り返しにおいて、C** のテンプレ
ートはテンプレートcとテンプレートeの間を行き来す
る。各係数は 3×0.01ずつ増え、繰り返しあたりのM の
増加はやや遅くなる。
【0037】n=28において テンプレートo28 = (テンプレートo0) - 0.17(テン
プレートc) - 0.07(テンプレートe) - 0.04(テンプ
レートn) 17〜28の12回の繰り返しにおいて、C** のテンプ
レートはテンプレートc,テンプレートe,テンプレー
トnの間を行き来する。各係数は4 ×0.01ずづ増える。
【0038】n=36において テンプレートo36 = (テンプレートo0) - 0.19(テン
プレートc) - 0.09(テンプレートe) - 0.06 (テ
ンプレートn) - 0.02 (テンプレートs) 29〜36の8回の繰り返しにおいて、C** のテンプレ
ートは、テンプレートc,テンプレートe,テンプレー
トn、テンプレートsの間を行き来する。各係数は2 ×
0.01ずづ増える。
【0039】n=51において テンプレートo51 = (テンプレートo0) - 0.22 (テ
ンプレートc) - 0.12(テンプレートe)- 0.09(テン
プレートn) - 0.05 (テンプレートs) - 0.03 (テ
ンプレートu) 37〜51の15回の繰り返しにおいて、C** のテンプ
レートは、テンプレートc,テンプレートe,テンプレ
ートn,テンプレートs,テンプレートuの間を行き来
する。各係数は3 ×0.01ずづ増え、繰り返しあたりのM
の増加は非常に遅い。
【0040】各入力シンボルとそれに関連する集団と
は、アンチキャラクタに対する比較が通常の比較値と認
識マージンへ発展するような、同様のシーケンスを持っ
ている。繰り返し処理が続くと、アンチキャラクタの数
が増えて発展の速度が鈍る。次の繰り返しでの強調にお
ける最小の改善が、求められるコンピュータ能力に見合
うだけの利益がなくなったときに、処理は終了される。
【0041】<比較関数:コーシー・シュワルツ>任意
の入力シンボルSiとライブラリテンプレート(T1 T2 T3
…Ti…TG)との比較関数は、テンプレートビットマップ
の各々とSiのビットマップとのピクセル単位での処理と
和とを含んでいる。ピクセル単位での処理は、入力シン
ボルSiに対する数値的な比較係数(Ci1 Ci2 Ci3 …Cij
…CiL)の集合を提供する。G×L個の比較は比較の数値
係数であり、その値は比較の下でのシンボルSiとテンプ
レートとのピクセル類似度の程度を表している。高い値
を持つ係数はSiとテンプレートとが近い比較であること
を表し、低い値はSiとテンプレートとが離れた比較であ
ることを表していることが好ましい。シンボルとテンプ
レートビットマップとのピクセルデータは、ビットマッ
プの中心に位置合わされ、順番に整列させておくことが
好ましい。ビットマップは、各ビットマップの対応する
ピクセル位置を提供するピクセルの行及び列が同じ番号
となるようx/y方向に拡大縮小処理をおこなっておく
のがよい。
【0042】任意の適当な比較関数には、シンボルのノ
ルム ||Si|| とテンプレートノルム||Ti|| とで除算さ
れたシンボルテンプレートの内積(対応するピクセルの
積の和)であるコーシー・シュワルツ関数といったもの
が使用されている。すなわち次式で表されるものであ
る。 コーシー・シュワルツ関数 = (Si)・(Ti) / (||Si||)(||
Ti||) 入力シンボルのビットマップに含まれる各ピクセルベク
トルは、テンプレートビットマップに含まれる対応する
ピクセルのベクトルと積算され、2つのノルムで除算さ
れる。ノルムは、ビットマップ中の各ピクセルの値の2
乗和のルートで定義される規格化係数である。各シンボ
ル/テンプレートのコーシー・シュワルツの比較は、図
3,図4,図5の縦軸に沿って示しているように、0 と
1.00の間の値を持つ比較係数を提供する。コーシー・シ
ュワルツ関数の上述の表現は、Siの項をあらかじめ規格
化することで次のように簡略化できる。
【0043】 コーシー・シュワルツ関数 = (Si)・(Ti) / (||Ti||) 新しく簡略化された表現のSiの項は、より複雑な始めの
項 (Si)/(||Si||) を表している。簡略化されたコーシ
ー・シュワルツ関数に置き換えると、強調処理は次のよ
うになる。第1比較として、 C*= (Si)・(T*) / ( ||T*|| ), 第2比較として、 C** = (Si)・(T**) / ( ||T**|| ), 数学的には、テンプレート強調処理とは、第1比較C*
最大の第2比較C** との最小の認識マージンを、(すべ
てのテンプレートにわたって)最大化するベクトルテン
プレート(T1 T2 T3…Ti…TG)の集合を見つけだす処理
である。
【0044】M = Min[C* - Max C**] の最大化 M = Min[(Si)・(T*) / (||T*||) - Max {(Si)・(T**)
/ (||T**||)}] の最大化 コーシー・シュワルツの比較関数の導関数は、次のよう
になる。 dM/dT* = dC*/dT* - dC**/dT* = Si/||T*|| - (Si・T*)T*/(||T*||)3 また、 dM/dT** = dC*/dT** - dC**/dT** = Si/||T**|| - (Si・T**)T**/(||T**||)3 <メタブラックとメタホワイトとフェーディング(図
6)>入力シンボルのビットマップと初期イメージのビ
ットマップとは、2値データフォーマット(1と0)で
あるか、または印刷されたフォントのトナー(またはイ
ンク)から走査されたトナーのグレースケールデータを
含む。走査や処理を行うことによって、グレースケール
(または2値データ)のレベルを歪ませる電気信号や機
械的な振動によるノイズ要素が生じる。繰り返しが進む
と、強調処理されたテンプレートは、任意のトナーのグ
レースケールやすでにビットマップにあるノイズ歪と
(和または差によって)結び付く漸次的な重み付けによ
って生成されるずれを大きくする。重み付けの増加分が
微少であることにより、すべての2値の初期イメージは
多値のテンプレートへ発展していく。グレースケールの
初期イメージは当然既に多値である。重み付け増加分が
既存のグレースケールに加えられ、印刷されたフォント
から得られる最も暗い黒や最も明るい白を越えた“メタ
ブラック”と“メタホワイト”のグレースケールレベル
を生じる。各アンチキャラクタにおける重み付けのずれ
の累積は、第2比較C** を減少させて認識マージンM を
増加させる。
【0045】図6の(a)〜(h)は、前に議論した入
力シンボル“o”に対する“censu”アンチキャラ
クタの例での、はじめの16回の繰り返しの間のメタブ
ラック,メタホワイト,重み付けの発展を示している。
これらの図は、“oce”のビットマップテンプレート
内で中央の水平方向のピクセルに沿った各ピクセルのグ
レースケールレベルを示している。
【0046】この中央行の横断面は、“oec”テンプ
レートの間に次のような決定的な差を含む。 1) “o”と“c”の両方とも白い中心領域を持つのに
対し、“e”は黒い水平な横線を持つ 2) “c”の右側の白いギャップ 3) “c”のギャップに対応する位置にある“o”の右
側の黒い線 図6の小文字のテンプレートに示された線の幅は、4ピ
クセルである。
【0047】図6の実施例でのビットマップピクセル
は、256レベルのグレースケールを有し、ゼロのハー
フトーンレベルの片側に128レベル有す。レベル+1
00は、印刷された文字のトナーで可能な最も黒い輝度
を表し、レベル−100は、白い紙の背景で可能なる最
も白い輝度を表す。行の断面は理想的な形で示され、四
角い角と完全に垂直な黒/白の境界とではノイズが無い
状態で示されている。トナーレベルより上のレベル+1
01から+128は、メタブラックの値のためにとって
あり、背景レベル以下のレベル−101から−128
は、メタホワイトの値のためにとってある。
【0048】図6の(a)は、繰り返し処理を行う前(n
=0) の初期の“o”のテンプレートの中央行を示す。
“o”の黒い左側の線と右側の線は4つの黒いピクセル
(+100)として格納されている。“o”の白い左と右の
マージンと中心領域は白いピクセル(-100)として格納
されている。図6の(b)は初期(n=0) の“c”テンプ
レートの対応する横断面を示しており、黒い左の線の4
つの黒いピクセルとピクセル行の残りの白いピクセルと
が示されている。白は、左と右のマージンと“c”の中
心領域と右側のギャップである。
【0049】(メタブラック メタホワイト)図6の
(c)と(d)は、テンプレート間の強調処理を10回
繰り返した後(n=10)の“o”と“c”の横断面を示し
ている。“o”の横断面には右側の線にわずかなメタブ
ラックのずれ(+100より大きい)が生じ、“c”の横断
面には右側のギャップにわずかなメタホワイトのずれ
(-100未満)が生じている。2つのテンプレートのビッ
トマップの対応するピクセルの符号が逆である場合、メ
タレベルがテンプレートに加えられる。すなわち、1つ
のテンプレートのあるピクセルが +(黒)であり、他の
テンプレートの対応するピクセルが -(白)である場合
である。この符号が反対のピクセルに対する付加的な効
果は、基本的な認識マージンの関係式、 M = min[C* - max(C**)] の最大化 により導入された両極性の発展によるものである。メタ
レベルは、選択されたC*とC** とのテンプレートの間の
違いを強調する。
【0050】(フェーディング)逆に、差分をとるフェ
ーディング効果は、対応するピクセルが同じ符号、両方
とも+ (黒)または- (白)をもつ場合に生じる。この
ように、n=10のテンプレートにおける白い左側のマージ
ンは、-100の最大の白(図6の(a)と(b)、n=0 )
から、輝度のより小さい白(図6の(c)と(d)、n=
10)へと発展している。両方のテンプレートの右のマー
ジンと白の中心領域もまた、輝度の小さい点から上の方
へ移動している。フェーディングレベルは、C*とC**
テンプレートの類似性を抑制する。
【0051】次の表は、重み付け係数 u=0.01 での10
回の繰り返しにおける、反対のピクセルのメタレベルと
同様のピクセルのフェーディングレベルとの発展を示し
ている。
【0052】 図6の(e)は、繰り返し処理前(n=0) における初期の
“e”テンプレートの中央行の横断面を示している。
“e”の水平な線は、大きな黒い領域(+100)として現
れている。11回目の繰り返しの際、“e”テンプレート
は“o”テンプレートに対しC** アンチキャラクタとな
る。
【0053】図6の(f)と(g)は、さらに6回の繰
り返しを行った後(n=16)の“o”と“e”の横断面を
示している。“e”の横断面は、水平な黒い線に沿って
メタブラックのずれが生じている。“e”の横断面と
“o”の横断面のどちらとも、両方のテンプレートの共
通の黒い領域により、左と右の線にわたってわずかに減
少している。“e”と“o”の横断面もまた、共通の白
い領域により左と右のマージンにわたってわずかに減少
している。違いを強調し類似を抑制するメタレベルとフ
ェーディングレベルとは、RMS規範の比較係数による
バランスとみなすことができる。各ビットマップ内のピ
クセルレベルの2乗和のルートは一定に保たれる。した
がって、進んだテンプレートの各メタレベルの発展に対
し、等しい発展と反対のフェーディングがある。
【0054】<結論>本発明における目的が以上述べた
ように達せられることは、当業者には明らかであろう。
本発明の概念から逸脱しない範囲で、ここで示された構
成や実施例におけるさまざまな変形ができることは言う
までもない。しかも、さまざまな図によって示された実
施例の特徴は別の図の実施例においても使用される。し
たがって、本発明の範囲は特許請求の範囲の文言および
法的に等価なものにより決められるものである。例え
ば、本発明はOCRに限定されず、ピクセルマッチング
によるいかなるパターン認識にも適用し得る。
【0055】
【発明の効果】本発明により、光学的文字の認識を改良
するためのテンプレートライブラリの強調方法を提供で
きる。また、主要な比較と最大となる次の比較との間の
最小のマージンを極大化するテンプレートライブラリの
強調方法を提供できる。また、ピクセルの重み付けによ
りテンプレートと入力シンボルとの相違を強調するよう
なテンプレートライブラリの強調方法を提供できる。ま
た、ピクセルの重み付けによりテンプレートと入力シン
ボルとの類似性を抑制するようなテンプレートライブラ
リの強調方法を提供できる。
【図面の簡単な説明】
【図1】本実施例で利用する比較行列を示す図であり、
(a)はG個の入力シンボルのグループとL個のイメー
ジのライブラリとのG×Lの比較を表している比較行列
(一般的な場合)を示し、(b)は小文字入力シンボル
a〜zと小文字イメージのライブラリとの比較行列を示
す図である。
【図2】テンプレート強調法における処理ステップを表
すフローチャートである。
【図3】ひとつの小文字入力シンボル“o”と図1の
(b)の小文字a〜zとの比較係数のグラフを示す図で
あり、(a)は初期イメージ比較係数のグラフを示し、
(b)は改善されたテンプレート比較係数のグラフを示
す図である。
【図4】ひとつの小文字入力シンボル“c”と図1の
(b)の小文字a〜zとの比較係数のグラフを示す図で
あり、(a)は初期イメージ比較係数のグラフを示し、
(b)は改善されたテンプレート比較係数のグラフを示
す図である。
【図5】ひとつの小文字入力シンボル”e”と図1の
(b)の小文字a〜zとの比較係数のグラフを示す図で
あり、(a)は初期イメージ比較係数のグラフを示し、
(b)は改善されたテンプレート比較係数のグラフを示
す図である。
【図6】強調処理中のメタレベルとフェーディングレベ
ルとの発展を示す図であり、(a),(c)及び(f)
は“o”テンプレートビットマップのピクセルの横断
面、(b)及び(d)は“c”テンプレートビットマッ
プのピクセルの横断面、(e)及び(g)は“e”テン
プレートビットマップのピクセルの横断面を示す図であ
る。

Claims (29)

    【特許請求の範囲】
  1. 【請求項1】 L個の未強調のピクセルイメージ(I1 I2
    I3…Ij…IL)のライブラリを与える行程と、 G個のピクセルシンボル(S1 S2 S3…Si…SG)のグルー
    プを与える行程と、 G個のピクセルシンボルの各々をL個のピクセルイメー
    ジと比較して、G個のピクセルシンボルのそれぞれSiに
    対してL個の比較が1セットあり、各ピクセルイメージ
    Ijに対して比較Cij をもつ比較の集合があるような、各
    セットがL個の比較(C1 C2 C3…Cj…CL)からなるG個
    のセットで構成されるG×L個の比較を得る行程と、 G個の比較セットのそれぞれのL個の比較の中からピク
    セルシンボルSiと最も近い比較を持った第1比較をCi*
    とし、G個の第1比較C*(C1* C2* C3* …Ci*…CG*
    の集合を形成する行程と、 G個の比較セットのそれぞれの残りのL−1個の比較の
    中からピクセルシンボルSiと2番目に最も近い比較を持
    った第2比較をCi**とし、G個の第2比較C**(C1** C2
    ** C3**… Ci** …CG**)の集合を形成する行程と、 比較C*とC** とのそれぞれの対の間の認識マージンであ
    るG個の認識マージン(M1 M2 M3…Mi…MG)を決定する
    行程と、 G個の比較の対のすべての中で最も小さな認識マージン
    M*を持った1対の比較C*とC** とを選択する行程と、 比較C*とC** との対に対応する1対のピクセルイメージ
    I*とI** とを定める行程と、 選択された比較C*とC** との対に対応する最も近いピク
    セルイメージI*、または2番目に近いピクセルイメージ
    I** 、またはそれらの両方に対し、あるピクセルに対し
    て重み付け処理を施して認識マージンM*を増加させ、ピ
    クセルイメージを最も近いピクセルテンプレートT*か、
    または2番目に近いピクセルテンプレートT** 、または
    それらの両方としていく行程と、 ピクセルイメージのライブラリが、少なくともそのうち
    のいくつかが既存のG個のピクセルシンボル(S1 S2 S3
    …Si…SG)のグループの対応するピクセルシンボルに現
    れない重み付けされたピクセルずれをもつ強調処理され
    たシンボルテンプレート(T1 T2 T3…Ti…TG)となるま
    で、前記比較,設定,決定,選択及び重み付けの行程を
    繰り返す行程とを備え、 既存のG個のピクセルシンボル(S1 S2 S3…Si…SG)の
    グループに関して、G個のピクセルシンボルを強調処理
    した認識ピクセルテンプレート(T1 T2 T3…Ti…TG)を
    提供することにより、L個の未強調のピクセルイメージ
    (I1 I2 I3…Ij…IL)の認識ライブラリの強調を行なう
    ことを特徴とするテンプレートライブラリの強調方法。
  2. 【請求項2】 ピクセルテンプレートの認識強調処理
    は、最も小さい認識マージンが予め定めた最小値より大
    きくなった場合に終了されることを特徴とする請求項1
    記載の方法。
  3. 【請求項3】 ピクセルテンプレートの認識強調処理
    は、最も小さい認識マージンにおける各繰り返しにおけ
    る増加量が予め定めた最小値より小さくなった場合に終
    了されることを特徴とする請求項1記載の方法。
  4. 【請求項4】 ピクセルテンプレートの認識強調処理
    は、ある回数の重み付けの繰り返しが実行された場合に
    終了されることを特徴とする請求項1記載の方法。
  5. 【請求項5】 ピクセルテンプレートの認識強調処理
    は、予め設定した繰り返し処理時間を越えた場合に終了
    されることを特徴とする請求項1記載の方法。
  6. 【請求項6】 ピクセルテンプレートの認識強調処理
    は、類似の形をしたテンプレートの集合の中の各テンプ
    レートが同じ認識マージンになり、相互にアンチキャラ
    クタとなった場合に終了されることを特徴とする請求項
    1記載の方法。
  7. 【請求項7】 LがGより大きく、GがTと同じである
    ことを特徴とする請求項1記載の方法。
  8. 【請求項8】 G個のピクセルシンボルのグループが英
    数字のシンボルであり、T個のピクセルテンプレートの
    ライブラリが重み付けされたピクセルずれにより強調さ
    れた同じ英数字であることを特徴とする請求項1記載の
    方法。
  9. 【請求項9】 LがGに等しく、GがTに等しいことを
    特徴とする請求項8記載の方法。
  10. 【請求項10】 G個のピクセルイメージがのライブラ
    リが、G個のピクセルシンボルのグループの英数字シン
    ボルに対応する英数字シンボルであることを特徴とする
    請求項9記載の方法。
  11. 【請求項11】 G個のピクセルイメージがのライブラ
    リが、G個のピクセルシンボルのグループの英数字シン
    ボルに対して同等の英数字シンボルであることを特徴と
    する請求項9記載の方法。
  12. 【請求項12】 G×L個の比較が、ピクセルシンボルS
    iとピクセルイメージIjとの間の類似の程度を表す比較
    の数値係数であることを特徴とする請求項1記載の方
    法。
  13. 【請求項13】 高い値を持つ係数がSiとIjの比較が近
    いことを表し、低い値を持つ係数がSiとIjの比較が遠い
    ことを表すことを特徴とする請求項12記載の方法。
  14. 【請求項14】 認識マージンが、選択された各々の対
    比較C*とC** の間の差であることを特徴とする請求項1
    2記載の方法。
  15. 【請求項15】 あるピクセルシンボルSiに関する認識
    強調処理が、ピクセルシンボルSiに対する比較C*とC**
    の選択された対を形成する第1比較C*と最大の第2比較
    C** の間の最小の認識マージンを、次の式: M = min[C* - max(C**)] の最大化 ここで、 MはC*とC** との認識マージン、C*はライブラ
    リの中で入力シンボルSiに最も近いテンプレートT*の第
    1比較、C** はライブラリの中で入力シンボルSiに2番
    目に近いテンプレートT** の第2比較、において最大に
    する処理を含むことを特徴とする請求項14記載の方
    法。
  16. 【請求項16】 最も近いピクセルイメージI*だけが重
    みづけされ、最も近いピクセルイメージI*を最も近いピ
    クセルテンプレートT*にすることを特徴とする請求項1
    5記載の方法。
  17. 【請求項17】 各繰り返しで最も近いピクセルテンプ
    レートT*に加えられる重みは、テンプレートT*に関する
    認識マージンM*の1次導関数: W* = u*(dM/dT*) = u*(dC*/dT* - dC**/dT*) ここで、 W* は各繰り返しで加えられる重み、 u* は d
    M/dT* の重み係数ミュー、であることを特徴とする請求
    項16記載の方法。
  18. 【請求項18】 強調処理の各繰り返しは、 T* n+1 = T* n + W* = T* n + u*(dM/dT*) = T* n + u*(dC*/dT* - dC**/dT*) ここで、n は繰り返しの数値、T* n+1 は新しいテンプレ
    ートT*、T* n は古いテンプレートT*、により古いテンプ
    レートT*とわずかに異なる新しいテンプレートT*を生成
    することを特徴とする請求項17記載の方法。
  19. 【請求項19】 2番目に近いピクセルイメージI**
    けが重みづけされ、2番目に近いピクセルイメージI**
    が2番目に近いピクセルテンプレートT** となることを
    特徴とする請求項15記載の方法。
  20. 【請求項20】 2番目に近いテンプレートT** に各繰
    り返しで加えられる重みは、テンプレートT** に関する
    認識マージンM** の1次導関数: W** = u**(dM/dT**) = u**(dC*/dT** - dC**/dT**) ここで、 W**は各繰り返しで加えられる重み、 u**は d
    M/dT* の重み係数ミュー、により定められることを特徴
    とする請求項19記載の方法。
  21. 【請求項21】 強調処理の各繰り返しは、 T** n+1 = T** n + W** = T** n + u**(dM/dT**) = T** n + u**(dC*/dT** - dC**/dT**) ここで、n は繰り返しの数値、T* n+1 は新しいテンプレ
    ートT** 、T* n は古いテンプレートT** 、により古いテ
    ンプレートT** とわずかに異なる新しいテンプレートT
    ** を生成することを特徴とする請求項20記載の方
    法。
  22. 【請求項22】 最も近いピクセルイメージI*と2番目
    に最も近いピクセルイメージI** は共に重みづけされ、
    最も近いピクセルイメージI*を最も近いピクセルテンプ
    レートT*とし、2番目に最も近いピクセルイメージI**
    を2番目に近いテンプレートT** とすることを特徴とす
    る請求項15記載の方法。
  23. 【請求項23】 各繰り返しでT* とT** に加えられる重
    みは、テンプレートT*とT** に関する認識マージンM*
    とM**の1次導関数: W* = u*(dM/dT*) = u*(dC*/dT* - dC**/dT*)) W** = u**(dM/dT**) = u**(dC*/dT** - dC**/dT**)) ここで、 W* は各繰り返しでT*に加えられる重み、 u*
    は dM/dT* の重み付けファクタ・ミュー、 W**は各繰り
    返しでT** に加えられる重み、 u**は dM/dT*の重み付
    けファクタ・ミュー、により定められることを特徴とす
    る請求項22記載の方法。
  24. 【請求項24】 重み付けファクター u* は重み付けフ
    ァクター u**と等しいことを特徴とする請求項23記載
    の方法。
  25. 【請求項25】 各繰り返しにおいて、 T* n+1 = T* n + W* = T* n + u*(dC*/dT* - dC**/d
    T*) T** n+1 = T** n + W** = T** n + u**(dC*/dT** - dC
    **/dT**) ここで、 nは繰り返しの数値、T* n+1 は新しいテンプレ
    ートT*、T* n は古いテンプレートT*、T** n+1は新しいテ
    ンプレート T**、T** nは古いテンプレート T**、により
    古いテンプレートTnからわずかに異なる新しいテンプレ
    ート Tn+1 を生成することを特徴とする請求項23記載
    の方法。
  26. 【請求項26】 比較Cjの各数値係数の値は、ピクセル
    シンボルSiの各ピクセルとピクセルイメージIjの各ピク
    セルとのピクセル単位での比較に基づくことを特徴とす
    る請求項12記載の方法。
  27. 【請求項27】 ピクセル単位での比較は、ピクセルシ
    ンボルSiの各ピクセルとピクセルイメージIjの各ピクセ
    ルとの内積であることを特徴とする請求項26記載の方
    法。
  28. 【請求項28】 ピクセル単位での比較はコーシー−シ
    ュワルツ関数: コーシー・シュワルツ関数 = (Si)・(Ti) / (||Si||)(||
    Ti||) ここで、(Si)は入力シンボル、(Ti)は強調処理されたテ
    ンプレート、(||Si||)はシンボルのノルム、(||Ti||)は
    テンプレートのノルム、に基づくことを特徴とする請求
    項26記載の方法。
  29. 【請求項29】 入力シンボルのピクセルイメージをテ
    ンプレートのライブラリとの比較に基づいて認識するパ
    ターン認識装置のテンプレートライブラリの強調方法で
    あって、 入力されたシンボルグループのピクセルイメージをテン
    プレートライブラリと比較する行程と、 比較結果の中から、最も高い類似性を示す値と第2の類
    似性を示す値との差が最小となる入力シンボルを選択す
    る行程と、 選択された入力シンボルの前記最も高い類似性を示す値
    と第2の類似性を示す値との差が開くように、前記テン
    プレートライブラリのピクセルデータを変更する行程
    と、 少なくとも最も高い類似性を示す値と第2の類似性を示
    す値との差が所定値以上になるように、前記比較,選択
    及び変更行程を繰り返す行程とを備えることを特徴とす
    るテンプレートライブラリの強調方法。
JP5217765A 1992-09-01 1993-09-01 ピクセル重み付けによるテンプレートライブラリの強調方法 Pending JPH06168359A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/937,732 US5379349A (en) 1992-09-01 1992-09-01 Method of OCR template enhancement by pixel weighting
US937732 1992-09-01

Publications (1)

Publication Number Publication Date
JPH06168359A true JPH06168359A (ja) 1994-06-14

Family

ID=25470328

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5217765A Pending JPH06168359A (ja) 1992-09-01 1993-09-01 ピクセル重み付けによるテンプレートライブラリの強調方法

Country Status (4)

Country Link
US (1) US5379349A (ja)
EP (1) EP0586217B1 (ja)
JP (1) JPH06168359A (ja)
DE (1) DE69319514T2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69423921T2 (de) * 1993-01-22 2000-08-17 Canon K.K., Tokio/Tokyo Verbesserung von Standardmustern zur Erkennung
JPH0749927A (ja) * 1993-08-09 1995-02-21 Nireco Corp パターン認識方法
US5909509A (en) * 1996-05-08 1999-06-01 Industrial Technology Research Inst. Statistical-based recognition of similar characters
US6473524B1 (en) 1999-04-14 2002-10-29 Videk, Inc. Optical object recognition method and system
US8175394B2 (en) * 2006-09-08 2012-05-08 Google Inc. Shape clustering in post optical character recognition processing
KR101486495B1 (ko) * 2006-09-08 2015-02-04 구글 인코포레이티드 사후 광학 문자 인식 처리에서의 형상 클러스터링 기법
US7697758B2 (en) * 2006-09-11 2010-04-13 Google Inc. Shape clustering and cluster-level manual identification in post optical character recognition processing
US7646921B2 (en) * 2006-09-11 2010-01-12 Google Inc. High resolution replication of document based on shape clustering
US7650035B2 (en) * 2006-09-11 2010-01-19 Google Inc. Optical character recognition based on shape clustering and multiple optical character recognition processes
CN102402693B (zh) * 2010-09-09 2014-07-30 富士通株式会社 处理包含字符的图像的方法和设备

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3191149A (en) * 1962-01-15 1965-06-22 Ibm Specimen identification apparatus with means for altering stored specimen reference functions
US3275986A (en) * 1962-06-14 1966-09-27 Gen Dynamics Corp Pattern recognition systems
US3209328A (en) * 1963-02-28 1965-09-28 Ibm Adaptive recognition system for recognizing similar patterns
US3267431A (en) * 1963-04-29 1966-08-16 Ibm Adaptive computing system capable of being trained to recognize patterns
US3539994A (en) * 1967-09-14 1970-11-10 Ibm Adaptive template pattern categorizing system
US3588823A (en) * 1968-03-28 1971-06-28 Ibm Mutual information derived tree structure in an adaptive pattern recognition system
US3548202A (en) * 1968-11-29 1970-12-15 Ibm Adaptive logic system for unsupervised learning
US5204914A (en) * 1991-08-30 1993-04-20 Eastman Kodak Company Character recognition method using optimally weighted correlation
US5159644A (en) * 1991-08-30 1992-10-27 Eastman Kodak Company Character recognition method using statistically weighted correlation

Also Published As

Publication number Publication date
DE69319514T2 (de) 1998-12-10
EP0586217A3 (en) 1994-09-21
EP0586217B1 (en) 1998-07-08
US5379349A (en) 1995-01-03
EP0586217A2 (en) 1994-03-09
DE69319514D1 (de) 1998-08-13

Similar Documents

Publication Publication Date Title
US4903312A (en) Character recognition with variable subdivisions of a character region
US6185341B1 (en) Image processing using vector data to reduce noise
US7054485B2 (en) Image processing method, apparatus and system
JP3618796B2 (ja) パターン認識方法および装置
JPS62221785A (ja) パタ−ン認識方式において使用する特徴抽出技術
JP2003145898A (ja) 画像品質判定方法、判定装置、判定プログラム
CN109784342A (zh) 一种基于深度学习模型的ocr识别方法及终端
JPH06168359A (ja) ピクセル重み付けによるテンプレートライブラリの強調方法
US8538157B2 (en) Device, method and computer program for detecting characters in an image
US8208736B2 (en) Method and system for adaptive recognition of distorted text in computer images
JP2002230551A (ja) 確率密度関数を用いたパターン認識装置および方法
US5187751A (en) Clustering system for optical character reader
Amara et al. Printed PAW recognition based on planar hidden Markov models
JPH0385597A (ja) 画像処理装置及び方法
JPH06259607A (ja) ピクセル重み付けによるマルチフォント・テンプレートライブラリの強調方法
KR19980058361A (ko) 한글 문자 인식 방법 및 시스템
EP0650136B1 (en) A comparison inequality function based method and apparatus for accelerated OCR correlation
JP3452160B2 (ja) 認識辞書学習システム
JPH0757048A (ja) 微細文字画像の拡大方法
JP5145862B2 (ja) 画像処理プログラムおよび画像処理装置
JP2022072841A (ja) モデル評価システム、モデル評価方法及びモデル評価プログラム
JPH0737037A (ja) 最近傍分類を認識する比較関数に基づくocr方法
JPH11120291A (ja) パタン認識システム
JPS5943480A (ja) 文字認識方法
JPH04343193A (ja) 2値化閾値設定方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20021213