JPH06259607A - ピクセル重み付けによるマルチフォント・テンプレートライブラリの強調方法 - Google Patents

ピクセル重み付けによるマルチフォント・テンプレートライブラリの強調方法

Info

Publication number
JPH06259607A
JPH06259607A JP6005848A JP584894A JPH06259607A JP H06259607 A JPH06259607 A JP H06259607A JP 6005848 A JP6005848 A JP 6005848A JP 584894 A JP584894 A JP 584894A JP H06259607 A JPH06259607 A JP H06259607A
Authority
JP
Japan
Prior art keywords
template
pixel
comparison
library
version
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP6005848A
Other languages
English (en)
Inventor
Abi Aizaku Hatsudaa
アビ・アイザク ハッダー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of JPH06259607A publication Critical patent/JPH06259607A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 (修正有) 【目的】 複数のバージョンをもつ複数クラスの光学的
シンボルの認識を改良する。 【構成】 ライブラリにある各イメージを各シンボル内
の各入力ピクセルバージョンに対しV×L個の比較を構
成し、混同の危険性が最も低くなるようイメージに重み
付けする。広がったピクセルバージョンを更にサブクラ
スに分割し、V組の比較の各々のL個の比較の中から、
第1比較C*と第2比較C** の対を定め、比較対の間の認
識マージンを決定し、最も小さな認識マージンMi * を持
った1対の比較Ci * とCi **を選択し、対応する1対のピ
クセルイメージIj * とIj **を定める。最も近いピクセル
イメージIj * 、又は2番目に近いピクセルイメージIj **
のあるピクセルに対して重み付けを施し、それらの間の
認識マージンMi * を増加させる。ピクセルイメージ(及
びサブイメージ)のライブラリが、強調されたシンボル
テンプレート(及びサブテンプレート)のライブラリと
なるまで繰り返す。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は複数クラスの入力シンボ
ルの認識に関し、特に光学的文字認識(OCR)におい
てシンボルクラス内の多様なピクセルバージョン(本明
細書においては、フォントの違いの基づくものをフォン
トバージョン,フォントの違いにシンボルの太さ等の違
いをも加えたものを一般的にピクセルバージョンと表現
する)に対応するピクセルテンプレートからなるテンプ
レートライブラリの強調方法に関するものである。
【0002】
【従来の技術】従来、レーダの反射信号や文字ビットマ
ップなどの入力されるピクセルイメージを認識するため
には、相関係数が用いられてきた。入力されたピクセル
イメージは、ピクセルごとにライブラリのテンプレート
イメージと比較される。各イメージ/テンプレートのマ
ッチングにおけるピクセルの比較結果のすべての和が、
最も近いマッチングを表す相関係数となる。しかしなが
ら、これらの予め決められたテンプレートと相関をとる
方法では、ライブラリテンプレートを構成しているピク
セルのどんな変化や強調にも対応できない。「ピクセル
重み付けによるテンプレートライブラリの強調方法」と
いう名称で、本願と同じ発明者Hadar Avi-Itzhakにより
1992年9 月1 日に出願された米国出願番号 07/937,732
(優先権主張されて平成5 年9 月1 日に日本出願された
特願平5-217765号)では、複数のフォントバージョンを
含むサブクラスを準備していないライブラリテンプレー
トの強調方法が開示されている。
【0003】
【発明が解決しようとする課題】本発明は、各クラスに
複数のバージョンをもつ複数クラスの光学的シンボルの
認識を改良するためのテンプレートライブラリの強調方
法を提供することを目的とする。また本発明は、第1比
較C*(あるシンボルクラスのある入力ピクセルバージョ
ンと対応するピクセルテンプレートとの比較)と、最大
となる第2比較C** (上記入力ピクセルバージョンと次
に近いテンプレートとの比較)とで定義される最小のマ
ージンを、最大化するテンプレートライブラリの強調方
法を提供することを目的とする。
【0004】また本発明は、同じシンボルクラス内で互
いに異なるピクセルバージョンからなるサブクラスを採
用し、ピクセルバージョンからなる各サブクラスのため
のサブテンプレートを提供するテンプレートライブラリ
の強調方法を提供することを目的とする。また本発明
は、各サブクラス内のピクセルバージョンが同じシンボ
ルクラス内の他のサブクラスに対応するサブテンプレー
トと比較されないようなテンプレートライブラリの強調
方法を提供することを目的とする。
【0005】また本発明は、複数のバージョンを持つシ
ンボルクラスのためのテンプレートライブラリで、テン
プレートの数を最小にするようなテンプレートライブラ
リの強調方法を提供することを目的とする。
【0006】
【課題を解決するための手段】簡単に言えば、本発明の
これらのまたはその他の目的は、G個のシンボルクラス
からなる既存のグループ(S1 S2 S3…Si…SG)に関し
て、L個の未強調のピクセルテンプレートあるいはイメ
ージのライブラリ(I1 I2 I3…Ij…IL)の認識を強調す
る方法を提供することにより達成される。少なくともい
くつかのシンボルクラスは、同じシンボルの複数のピク
セルバージョンを含む。G個のシンボルクラスの中に合
計V個のピクセルバージョンがある。本方法は、各強調
されたテンプレートがG個のシンボルクラスの各々に対
応するような、G個の認識が強調されたピクセルテンプ
レートのライブラリ(T1 T2 T3…Ti…TG)を提供する。
【0007】V個のピクセルバージョンの各々をL個の
ピクセルイメージ(未強調のテンプレート)の各々と比
較して、各組がL個の比較(C1 C2 C3…Cj…CL)からな
るV個の組から構成されるV×L個の比較を得る。L個
の比較からなる組は、V個のピクセルバージョンの各々
に対して形成される。比較の各組は、L個のイメージの
各イメージ(未強調のテンプレート)Ijとの比較Ciをも
つ。V組の比較の各々のL個の比較の中から、ピクセル
バージョンSiと最も近い比較を持った第1比較Ci * を定
める。V組の比較の各々の残りのL−1個の比較の中か
ら、ピクセルバージョンSiと2番目に近い比較を持った
第2比較Ci **を定める。V組の比較の各々から一対ずつ
のV個のCi * と Ci ** との対の集合が形成される。
【0008】比較Ci * とCi **の各々の対の間に1つの認
識マージンのV個の認識マージン(M1 M2 M3…Mi…MV
を決定する。V組の比較からのV個の比較の対のすべて
の中で、最も小さな認識マージンMi * を持った1対の比
較Ci * とCi ** を選択する。比較Ci * とCi ** の対に対応
する1対のピクセルイメージIj * とIj ** を定める。最
も近いピクセルイメージI*、または2番目に近いピクセ
ルイメージI** 、またはそれらの両方のあるピクセルに
対して重み付け処理を施す。重み付け処理されたイメー
ジ(未強調のテンプレート)は、選択された1つの比較
対 Ci*とCi **に対応し、比較対の間の認識マージンMi *
を増加させる。
【0009】ピクセルイメージのライブラリ(未強調の
テンプレート)が、シンボルテンプレートのうちの少な
くともいくつかが既存のG個のシンボルクラスのグルー
プ(S1 S2 S3…Si…SG)の対応するピクセルバージョン
には現れない重み付けされたピクセルずれをもつ強調さ
れたシンボルテンプレートのライブラリ(T1 T2 T3…Ti
…TG)となるまで、前記比較,設定,決定,選択及び重
み付けを繰り返す。
【0010】
【実施例】
<強調の一般的方法(図1,図2)>光学的文字認識
(OCR)のために、予め存在するG個の入力シンボル
のグループに関して、L個の未強調のイメージあるいは
テンプレート(ピクセルビットマップ)が強調処理され
る。強調処理によって、1つのテンプレートが各シンボ
ルクラスに対応する、G個の入力シンボルのG個の認識
強調されたテンプレート(ピクセルビットマップ)ライ
ブラリが作られる。シンボルクラスの中には、同一のシ
ンボルで複数のピクセルバージョンを持つものがあり、
合計V個のピクセルバージョンとなる。強調処理は、ラ
イブラリの各未強調テンプレートを各シンボルクラスの
各入力ピクセルバージョンと比較(V×L個の比較を構
成する)し、混同の危険性が最も高い未強調テンプレー
トを重み付けすることによって達成される。
【0011】L個の未強調の初期テンプレートライブラ
リ(イメージ I1 I2 I3 …Ij…IL)は、図1の(A)の
V×Lの比較行列の縦軸に沿って並べられている。G個
の既存のシンボルクラスのグループ(一般的シンボルク
ラス S1 S2 S3 …Si…SG)は、V×L行列の水平軸に沿
って並べられている。V個の入力ピクセルバージョンが
各シンボルクラスと関連づけて示されている。図1の
(A)の具体例においては、入力ピクセルバージョンは
3つの一般的な英数字フォントによって示されており、
シンボルクラスS1 と3つのピクセルバージョンS11, S
12, S13 から始まって、水平軸に沿って並べられてい
る。G個の認識強調されたテンプレートライブラリ(T1
T2 T3…Ti…TG)は、V×L行列には示されていない。
【0012】しかしながら、G個の認識強調されるテン
プレートライブラリのための3つのバージョン/イメー
ジ比較(テンプレート比較 T111 T121 T131, T212 T222
T23 2 …Ti1j Ti2j Ti3j …TG1L TG2L TG3L) は、V×
L行列の対角線に沿って並べられている。入力ピクセル
バージョンは、G個の認識強調されるテンプレートの未
強調の初期テンプレートあるいはイメージと一致する。
この対角線上のテンプレートの関係は、シンボルクラス
とイメージとが各軸に沿って同じ順で現れる、すなわ
ち、Si=Ij,及び Si+1=Ij+1であることを仮定している。
小文字シンボルクラスa〜z(3つのフォントとも)の
比較行列が図1の(B)に示されており、特に似ている
文字“o”,“c”,“e”の集団(cluster) のバージ
ョン/イメージ比較が示されている。
【0013】テンプレート強調法の処理ステップが図2
のフローチャートにまとめられており、以下に詳しく述
べる。ステップS1:以下の処理で、G個の強調された
テンプレートの特徴的なライブラリへと発展していく、
L個の未強調のピクセルテンプレートあるいはイメージ
ライブラリ(I1 I2 I3…Ij…IL)を与える。
【0014】ステップS2:目的の特定のユーザデザイ
ンフォントにおける複数のピクセルバージョンを持つG
個のシンボルクラスのグループ(S1 S2 S3…Si…SG)を
与える。英数字への適用のための共通のデザインフォン
トは、Courier とTimes Roman である。一般的には、ユ
ーザフォントは次のものを含む。 大文字 ABCDEFGHIJKLMNOPQRSTUVWXYZ 小文字 abcdefghijklmnopqrstuvwxyz 数字 1234567890 句読点 !#$%^&*()_+-=[]{}; ′`:" 〜\|,<.>/?・
【0015】しかしながら、本テンプレート強調技術は
一般的な方法であり、他のグラフィックシンボルに適用
することもできる。便宜のため、G個のシンボルクラス
のグループの3つのフォントバージョンを、図1の
(A)に示しておく。本テンプレート強調技術は2つの
フォントバージョンや、4つまたはもっと多くのフォン
トバージョンに適用可能である。異なるシンボルクラス
が異なった数のフォントバージョンを持つこともでき
る。一般的には、各シンボルクラスはn個のフォントバ
ージョン(S1 S2 S3…Sn)を持つ。ただし、nはそれぞ
れのシンボルクラスで同じ整数である必要はない。本強
調処理技術は、デザインフォントの変形や実装方法での
変形(サブクラス- サブテンプレートの項参照)に適用
することも可能である。この強調処理技術は、レーダの
反射信号や音素パターン(スピーチフォント)を含む音
声認識アプリケーションなどの、複数の入力バージョン
からなるクラスを含む他の認識アプリケーションに応用
することができる。
【0016】未強調の初期テンプレートのフォントは、
初期のバージョン/イメージ比較を最大化し、テンプレ
ートの発展に対し便利な初期状態を与えるために、入力
バージョンのフォントと似ていてよい。あるいは、未強
調の初期テンプレートのフォントは、入力バージョンの
フォントの一般的なフォントである場合もあれば、特別
な先駆(precursor) フォントである場合もあり、またラ
ンダムノイズに基づくテンプレートであることさえあり
得る。ライブラリ内の未強調テンプレートあるいはイメ
ージの数Lは、グループ内のシンボルの数Gと等しいか
または大きい。ライブラリには、シンボルクラスに含ま
れていないイメージが登録されることもある。これらの
“アイドルな”イメージは、バージョン/イメージ比較
には含まれず、従って変わったりテンプレートになるこ
とはない。1つのイメージが2つの別のシンボルクラス
の入力バージョンに対応して発展していくことを避ける
ために、LはGより少なくないことが望ましい。
【0017】ステップS3:図1のV×L行列の内部に
示すように、V×L個の比較を得るためにV個の入力ピ
クセルバージョンの各々をL個の未強調の初期テンプレ
ートの各々と比較する。バージョン/イメージ比較は、
一般的な未強調テンプレートIjの各ピクセルを、比較関
数(後にコーシー・シュワルツの項で詳しく議論する)
に基づいて、一般的なシンボルクラスの入力バージョン
の各ピクセルSiと比較することによってなされる。V×
L個の比較により、各入力ピクセルバージョンに対して
L個の比較が1組ずつ作られて、L個の比較を有するV
個の組の集合が形成される。L個の比較を有する各組
は、未強調テンプレートIjのそれぞれに対して比較Cij
を含む。一般的なシンボルクラスSiの3つのフォントバ
ージョン S i1, Si2, Si3の比較の組が、Siの上方に3つ
の隣あう列に沿って延びている。第1列(Ci11 Ci12
Ti1j … Ci1L )はフォントバージョン“Si1 ”のもの
であり、第2列(Ci21 Ci22 … Ti2j … Ci2L )はフォ
ントバージョン“Si2 ”のものであり、第3列(Ci31 C
i32 … Ti3j … Ci3L )はフォントバージョン“Si3
のものである。英数字イメージフォントに対して、
“o”のシンボルクラスのうち入力ピクセルバージョン
“o2 ”(小文字)の初期状態のL個の比較の列の組
が、図3の(A)に棒グラフで示されている。
【0018】ステップS4:V個の組の比較のそれぞれ
におけるL個の比較の中で、その組の入力ピクセルバー
ジョンに最も近い比較を持っている第1比較をC*とす
る。行方向の第1比較の集合(C1 * C2 * C3 * …Ci * …CV
* )を形成するV個の第1比較の全体をC*とする。入力
フォントバージョン“o2 ”(小文字)に対し最も高い
比較C*を有するのは、当然未強調のテンプレート“o
2 ”(小文字)である。“o”のシンボルクラスのフォ
ントバージョン“o1 ”乃至“o3 ”に対し最も高い比
較C*を有するのは、未強調のイメージ“o”である。1
つの未強調のイメージ(および強調されたテンプレー
ト)は、ピクセルバージョンの各クラスで1つ利用でき
る。
【0019】ステップS5:V個の組の比較のそれぞれ
における残りのL−1個の比較の中で、入力ピクセルバ
ージョンに2番目に近い比較を持っている第2比較をC
** とする。第2比較C** にある未強調テンプレート
は、入力ピクセルバージョンと最も混同しやすい未強調
テンプレートである。行方向の第2比較の集合(C1 ** C
2 * * C3 **… Ci ** …CV **)を形成するV個の第2比較の
全体をC** とする。第1比較および第2比較の集合は、
比較のV個の列の組の各々から1対のV個の比較C*とC
** の対を構成する。図3の(A)における入力バージ
ョン“o2 ”の2番目に高い比較C** は、未強調のテン
プレート“c”(小文字)との第2比較o2 /cであ
る。シンボルクラス“o”と“c”と“e”とは、混同
する可能性の高く“アンチキャラクタ”となる類似した
形状のイメージの集団を形成する(アンチキャラクタと
集団とについては次の項を参照)。
【0020】ステップS6:第1比較C*および第2比較
C** の各対の間に1つのV個の認識マージン(M1 M2 M3
… Mi …MV)を決定する。V個の認識マージンの全体M
が決定される。マージンMの大きさは、C*の値とC**
値との差である。初期のo2/cマージンは、図3の
(A)に示すデータ及び実例では0.12である。
【0021】ステップS7:比較のV個の対の全ての中
から、最も小さな認識マージンM*を持つ1つの比較C*
C** の対を選択する。認識マージンが小さくなればなる
ほど、入力ピクセルバージョンと未強調イメージとの間
のOCRでの混同を起こす危険性が大きくなる。ステッ
プS8:定められた比較C*とC** の基となる1対のイメ
ージをI*とI**とする。イメージI*は入力ピクセルバー
ジョンと一致する未強調テンプレートであり、イメージ
I** はそのピクセルバージョンと最も混同する可能性の
高いものである。
【0022】ステップS9:比較C*とC** との選択され
た対の基となる最も近いピクセルイメージI*、または2
番目に近いピクセルイメージI** 、またはそれらの両方
に対して、あるピクセルに重み付け処理を施す。重み付
けは、認識マージンM*を増加させ、ピクセルイメージを
最も近い強調されたピクセルテンプレートT*か、または
2番目に近い強調されたピクセルテンプレートT** か、
またはそれら両方にしていく。
【0023】ステップS10:未強調ピクセルイメージ
のライブラリが十分に強調されたシンボルテンプレート
(T1 T2 T3…Ti…TG)になるまで、比較,同定,決定,
選択,そして重み付けの上記ステップを繰り返す。強調
されたテンプレートに発生する重み付けされたピクセル
のずれは、既にあるG個のシンボルクラスのグループ
(S1 S2 S3…Si…SG)の対応するピクセルバージョン内
にはない。
【0024】(強調処理の終了)強調の重み付け処理
は、入力ピクセルバージョンとテンプレートとの間に発
生する最も小さい認識マージンが、予め定められた" 安
全な" 最小値より大きくなったときに終了する。すなわ
ち、最もエラーを起こしそうなバージョン/テンプレー
ト比較が十分に正しく認識される高い可能性をもつよう
になった場合である。
【0025】処理はまた、最小のマージンの増加分が予
め定めた最小の増加分より小さくなった場合に終了され
てもよい。すなわち、テンプレートの各々の繰り返しに
おいて認識マージンの変更速度が無視できるほど小さ
く、時間を消費する利点がない場合である。また、指定
された回数の重み付けの繰り返しが実行された場合、あ
るいは予め割り当てられた処理時間を越えた場合に、処
理が終了されてもよい。時として、テンプレートの強調
が、第1比較と第2比較とのマージンの境における“局
部的極大”の存在により遅くなる場合がある。もし局部
的極大が不安定なものであるならば、あとに続く繰り返
しの間に解除され、強調処理はもとの制約されないスピ
ードに戻る。しかしながら、もし局部的極大が安定して
いる場合には、強調処理は第1比較と第2比較との間で
永久にロックされてしまう。認識マージンは全く更新さ
れず、(ほぼ)同じレベルに固定されたままとなる。
【0026】<アンチキャラクタ(図3の(A),図4
の(A),図5の(A)>シンボルクラス“ o”,
“c”,“e”は、混同の可能性の高い類似した形状の
未強調イメージの集団を生成する。強調処理で互いにコ
ントラストをなすようになると、集団内の文字は相互に
“アンチキャラクタ”となる。すなわち、集団内の1つ
の要素が第1比較C*を構成し、同じ集団内の他の要素が
第2比較C**を構成する場合である。最初は、“o”と
“c”だけがアンチキャラクタである(図3の(A)の
“o2 ”の棒グラフ中に肉太線で示してある)。次に未
強調“o”テンプレートのアンチキャラクタの集団は、
“censu”のアンチキャラクタを含むように拡大す
る(図3の(B)“o2 ”の棒グラフ中に肉太線で示し
てある)。小文字の類似したアンチキャラクタの他の集
団としては、“f”と“t”や“h”と“b”がある。
句読点の類似の例として“,”と“;”が挙げられる。
特に難しい類似集団は、数字の“1”と小文字の“l”
と大文字の“I”とエクスクラメーションマーク“!”
とにより形成される。類似のアンチキャラクタの集団の
中の各要素のためのテンプレートは、自身を同じ集団中
の他の要素のテンプレートから識別できなくてはならな
い。
【0027】小文字のシンボルクラスa〜zのデザイン
フォントバージョンの比較行列が図1の(B)に示され
ており、特に類似文字“o”,“c”,“e”の集団の
バージョン/イメージ比較を示している。入力バージョ
ンフォント(小文字の“o1”,“o2 ”,“o3 ”,
“c1 ”,“c2 ”,“c3 ”,“e1 ”,“e2 ”,
“e3 ”を含む)は、図1の(B)の比較行列の水平軸
に沿ってアルファベット順に並べられている。未強調の
テンプレートイメージ(これもまた小文字の“o”,
“c”,“e”を含む)は縦軸に沿って並べられてい
る。入力バージョン“o2 ”と各未強調テンプレートと
のL個の比較の初期の組が図1の(B)に示されてお
り、入力バージョン“o2 ”の上方に縦方向に並べられ
ている。紙面節約のため、小文字のテンプレートのみが
図1の(B)に示されている。大文字,数字,句読点は
割愛する。
【0028】入力バージョン“o2 ”(小文字)のL個
の初期比較の列が、図3の(A)の未強調のテンプレー
トの棒グラフで水平方向に並べて示されている。初期の
未強調のテンプレートイメージが、棒グラフのx軸に沿
ってアルファベット順に並べられている。バージョン/
イメージ比較の値(0 と1.00の間)がy軸方向にプロッ
トされている。図3の(A)の“o2 ”の棒グラフは、
図1の(B)の小文字の比較行列に、より詳しくは水平
軸に沿う“o2 ”の位置から上に延長した垂直列におけ
る“o2 ”の比較に基づいている。シンボルクラス内の
各バージョンは、図3の(A)の“o2 ”の棒グラフに
似た、L個のバージョン/イメージ比較を含んだ別個の
未強調テンプレートの棒グラフを持っている。すなわ
ち、“o”のシンボルクラスは、“o1 ”の棒グラフ,
“o2 ”の棒グラフ,“o3 ”の棒グラフを持ってい
る。入力バージョン“c2 ”に対する初期比較の未強調
テンプレートの棒グラフが図4の(A)に示されてお
り、“e2 ”の未強調テンプレートの棒グラフが図5の
(A)に示されている。
【0029】第1比較の段階で、V個の第1比較の全体
C*が定められる。入力バージョン“o2 ”(小文字)の
もっとも高い比較C*は、もちろん未強調のテンプレート
“o”(小文字)である。図3の(A)の実施例におい
て、未強調のテンプレートイメージ“o”は、シンボル
クラス“o”の“o2 ”バージョンに対して一意である
ので、比較o2 /o(肉太線)は1.00という値を持つ。
しかしながら一般には、イメージ“o”は“o”入力バ
ージョンのいずれとも同一ではないので、o1/o比
較,o2 /o比較及びo3 /o比較は 1.00 に非常に近
い値をとる(しかし1.00ではない)。入力バージョン
“c2 ”のC*は未強調テンプレート“c”で1.00の値を
とり(図4の(A)の肉太線を参照)、入力バージョン
“e2 ”のC*は未強調テンプレート“e”で1. 00 の値
をとる(図5の(A)の肉太線を参照)。
【0030】第2比較において、V個の第2比較の全体
C** が定められ、比較のV個の組のそれぞれに1対のV
個の比較C*とC** との対が形成される。図3の(A)に
おける入力バージョン“o2 ”の2番目に高い比較C**
は、英数字のライブラリの他の(L−1)個のイメージ
のどれよりもバージョン“o2 ”に近い、未強調のテン
プレート“c”(小文字)の比較o2 /c(肉太線)で
ある。未強調テンプレート“c”は入力バージョン“o
2 ”と一致しないので、比較o2 /c(肉太線)は0.88
の値しかない。図3の(A)における比較o2 /eは0.
84で僅かに小さい。入力バージョン“c2 ”の場合(図
4の(A)を参照)、C** は比較c2 /o(肉太線)で
値は0.88である。入力バージョン“e2 ”の場合(図5
の(A)を参照)、C** は比較e2 /o(肉太線)で値
は0.86である。
【0031】各繰り返しで決定される認識マージンMの
大きさは、C*の値とC** の値との差である。初期のo2
/cマージンは0.12であり(図3の(A)参照)、初期
のc 2 /oマージンもまた0.12である(図4の(A)参
照)。初期のe2 /cマージンは0.14である(図5の
(A)参照)。 <dM/dT*とdM/dT** の一般的な場合>ある特定の入力バ
ージョンSiに関するテンプレートの強調は、一般的に
は、比較C*とC** の選択された対を形成する第1比較C*
と最大の第2比較C** との間の最小の認識マージンを、
次式にしたがって最大化にする処理を含む。
【0032】M = min[C* - max(C**)] の最大化 ここで、M はC*とC** 間の認識マージンであり、C*はラ
イブラリの中で入力バージョンSiに最も近いテンプレー
トT*の第1比較であり、C** はライブラリの中で入力バ
ージョンSiに2番目に近いテンプレートT** の第2比較
である。
【0033】認識マージンMのような多値関数は、数多
くの数値計算最適化処理により最大化され得る。図3,
図4,図5の実施例で採用されている処理は、“山上り
法(gradient ascent) ”や“最急上昇法(steepest asce
nt) ”であり、最小化問題において用いられる最急降下
法(steepest descent)と関連する。認識マージンMを
増やすため、C** を重み付けによって減少させるか、C*
を増加させるか、またはその両方を行わなくてはならな
い。テンプレートT** 内の漸次的な重み付けの効果は、
ビットマップにおけるピクセルのずれを引き起こし、C
** を減少させる。すなわち、複数回の重み付けの繰り
返しの後に、T** は入力バージョンSiとの類似性が次第
に減少し、比較C** が低い値を持つようになる。
【0034】o2 /cマージンの増加の結果が、図3の
(B)の発展したテンプレートの棒グラフに示されてい
る(図3の(A)の初期未強調テンプレートの棒グラフ
の真下に示されている)。“o2 ”のテンプレートの棒
グラフは、テンプレート(小文字)に関して入力バージ
ョン“o2 ”(小文字)に対するL個の比較の発展した
組を示している。図3の(B)の発展したテンプレート
の棒グラフは、図3の(A)の初期イメージの棒グラフ
と同じフォーマットである。強調されたテンプレート
は、棒グラフのx軸に沿ってアルファベット順に並べら
れている。比較の値はy軸にプロットされている。o2
/cマージンは、図3の(A)の初期イメージの棒グラ
フに示されている0.12から、図3の(B)の発展したテ
ンプレートの棒グラフに示されている0.21に増加してい
る。V個の入力バージョンの各々は、図3の(B)の
“o2 ”の組と同様なL個の比較を含む個別のテンプレ
ートの棒グラフを有し、それは入力イメージの棒グラフ
から発展していく。入力バージョン“c2 ”に対する発
展した比較のテンプレート列の棒グラフが図4の(B)
に、入力バージョン“e2 ”に対する発展した比較のテ
ンプレート列の棒グラフが図5の(B)に示されてい
る。
【0035】漸次的な重み付けの効果は、テンプレート
T*のビットマップにおいてピクセルのずれをも蓄積し、
C*をわずかに減少させる。すなわち、複数回の重み付け
の繰り返しの後、T*は入力バージョンSiと次第に似たも
のでなくなってくる。しかしながら、Mは最大化される
ので、各繰り返しにおいてC*は1.00のレベルの近くに保
たれる。比較o2 /oの減少の結果が、図3の(B)の
発展したテンプレートの棒グラフに見られる。比較o2
/oは、図3の(A)における1.00から図3の(B)に
おいて0.96に減少している。比較c2 /cもまた0.96に
減少しており(図4の(B)参照)、比較e2 /eも0.
98に減少している(図5の(B)参照)。
【0036】バージョン/イメージの比較o2 /cの場
合(図3の(B)参照)、o2 /cマージンは増加し、
2 /eマージンの0.21に近づく。o2 /cマージンが
2/eマージンより大きくなった場合には、比較o2
/cのC** は比較o2 /eのC** に置き換えられる。繰
り返しが進むにつれ、テンプレートT** は、o2 /cマ
ージンとo2 /eマージンとが“n”や“s”といった
他の未強調テンプレートに対するマージンより小さくな
るまで、テンプレート“c”とテンプレート“e”との
間を行き来する。認識マージンが増加すると、アンチキ
ャラクタの集団“o”が図3の(B)に示すように
“c”,“e”,“n”,“s”,“u”を含むまでに
広がる。“o”テンプレートをさらに強調していくと、
“m”や“z”を含むまでわずかに増加するであろう。
図4の(B)にシンボルクラス“c”に対して0.75前後
の比較値を持つアンチキャラクタの集団を示す。また図
5の(B)に0.77前後の比較値を持つアンチキャラクタ
の集団“c”,“o”,“s”を示す。
【0037】最大マージンMは、比較−繰り返しサイク
ルにおいて、テンプレートT*とテンプレートT** に次第
に重み付けをしていくことによって達成される。漸次的
なテンプレートの重みW*とW** とは、テンプレートT*
T** との複数のベクトル要素に関する認識マージンの1
次微分(ベクトルの傾き)によって定められる。 dM/dT* = dC*/dT* - dC**/T* dM/dT** = dC*/dT** - dC**/T** 各繰り返しにおいて、T*とT** とに加えられる単位重み
は、 W* = u*(dM/dT*) W** = u**(dM/dT**) である。ここで、 u*は、各比較の繰り返しにおけるdM/dT*の重み付けファ
クタミュー(mu) u** は、各比較の繰り返しにおける dM/dT**の重み付け
ファクタミュー(mu)である。
【0038】重み付けファクタu*とu** は、強調のアプ
リケーションに対応して同じである場合もあれば異なる
場合もある。一般的には、ミューが大きくなればMにお
いて大きな変化が起き、各繰り返しにおいて発展する率
が高くなる。しかしながら大きな変化は、M関数の目的
とする最大値をすり抜けて、繰り返し処理において不安
定な発振を始めることがあり得る。ミューの値が小さい
と、より遅くより安定となる。最大値に近づくために中
くらいのミューを採用し、より正確に最大値に達するた
めミューの値を減少させていく。
【0039】強調処理の各繰り返し“n”では、以下に
示すように古いテンプレートTnからわずかに異なる新し
いテンプレートTn+1が生成される。 T* n+1 = T* n + W* = T* n + u*(dM/dT*) = T* n + u*(dC*/dT*- dC**/dT*) T** n+1 = T** n + W** = T** n + u**(dM/dT**) = T** n + u**(dC*/dT**- dC**/dT**) 各繰り返しにおいて、T** とC** はT*とC*から大きくは
なれ、認識マージンMは大きくなる。第1比較と第2比
較C*とC** (新しいテンプレートT*とT** と供に)の新
しい対により現在のものが置き換えられるまで、分離が
続けられる。
【0040】<“o”のアンチキャラクタ“cens
u”の発展>シンボルクラス“o”と拡張したアンチキ
ャラクタの集団“c”,“e”,“n”,“s”,
“u”とに応じたテンプレートのライブラリの発展を、
以下に示す。この繰り返し手順は、図3の(A)と
(B)の棒グラフのデータと、1つの重み付けファクタ
がu*= u** = 0.01で初期テンプレート“o”がシンボル
クラス“o”の“o2 ”バージョンに一致するという初
期条件とに基づいている。
【0041】n=0 において(繰り返し以前) テンプレートo0 = 入力バージョンo2 n=10において(10回の繰り返し後) テンプレートo10 =(テンプレートo0 ) - 0.10( テ
ンプレートc) テンプレートcの係数は、積 (n)(u) = (10)(0.01) =
0.10 。最初の1〜10回の繰り返しにおいて、C**
テンプレートはテンプレートcだけであり、繰り返しあ
たりのMの増加は早い。
【0042】n=16において テンプレートo16 =(テンプレートo0) - 0.13(テンプ
レートc) - 0.03(テンプレートe) 11〜16回の6回の繰り返しにおいて、C** のテンプ
レートはテンプレートcとテンプレートeの間を行き来
する。各係数は 3×0.01ずつ増え、繰り返しあたりのM
の増加はやや遅くなる。
【0043】n=28において テンプレートo28 =(テンプレートo0) - 0.17(テンプ
レートc) - 0.07(テンプレートe) - 0.04(テンプレ
ートn) 17〜28回の12回の繰り返しにおいて、C** のテン
プレートはテンプレートc,テンプレートe,テンプレ
ートnの間を行き来する。各係数は 4×0.01ずづ増え
る。
【0044】n=36において テンプレートo36 =(テンプレートo0) - 0.19(テンプ
レートc) - 0.09(テンプレートe) - 0.06 (テン
プレートn) - 0.02 (テンプレートs) 29〜36回の8回の繰り返しにおいて、C** のテンプ
レートは、テンプレートc,テンプレートe,テンプレ
ートn,テンプレートsの間を行き来する。各係数は2
×0.01ずつ増える。
【0045】n=51において テンプレートo51 =(テンプレートo0) - 0.22 (テン
プレートc) - 0.12(テンプレートe)- 0.09(テンプ
レートn) - 0.05 (テンプレートs) - 0.03 (テン
プレートu) 37〜51回の15回の繰り返しにおいて、C** のテン
プレートは、テンプレートc,テンプレートe,テンプ
レートn,テンプレートs,テンプレートuの間を行き
来する。各係数は 3×0.01ずづ増え、繰り返しあたりの
Mの増加は非常に遅い。
【0046】各入力バージョンとそれに関連する集団と
は、アンチキャラクタに対する比較が通常の比較値と認
識マージンへ発展するような同様のシーケンスを持って
いる。繰り返し処理が続くと、アンチキャラクタの数が
増えて発展の速度が鈍る。次の繰り返しでの強調による
最小の改善が、求められるコンピュータ能力に見合うだ
けの利益がなくなったときに、処理は終了される。
【0047】<比較関数:コーシー・シュワルツ>任意
の入力バージョンSiとテンプレートライブラリ(T1 T2
T3…Ti…TG)との比較関数は、テンプレートビットマッ
プの各々とSiのビットマップとのピクセル単位での処理
と和とを含んでいる。ピクセル単位での処理は、入力バ
ージョンSiに対する数値的な比較係数の組(Ci1 Ci2 C
i3 …Cij …CiL)を提供する。V×L個の比較は比較の
数値係数であり、その値は比較の下でのバージョンSi
テンプレートとのピクセル類似度を表している。高い値
を持つ係数はSiとテンプレートとが近い比較であること
を表し、低い値を持つ係数はSiとテンプレートとが離れ
た比較であることを表しているのが好ましい。テンプレ
ートビットマップのピクセルデータは、ビットマップの
中心に位置合わせされ、順番に整列させておくのが好ま
しい。ビットマップは、各ビットマップの対応するピク
セル位置を提供するピクセルの行及び列が同じ番号とな
るよう、x/y方向に拡大縮小処理をおこなっておくの
がよい。
【0048】任意の適当な比較関数には、バージョンの
ノルム ||Si|| とテンプレートのノルム ||Ti|| とで除
算されたバージョン・テンプレートの内積(対応するピ
クセルの積の和)である、コーシー・シュワルツ関数と
いったものが使用されている。 コーシー・シュワルツ関数 = (Si)・(Ti) / (||Si||)(||
Ti||) 入力バージョンのビットマップに含まれる各ピクセルの
ベクトルは、テンプレートビットマップに含まれる対応
するピクセルのベクトルと積算され、2つのノルムで除
算される。ノルムは、ビットマップ中の各ピクセル値の
2乗和のルートで定義される規格化ファクタである。各
バージョン/テンプレートのコーシー・シュワルツの比
較は、図3,図4,図5の縦軸に沿って示されるよう
に、0 と1.00の間の値を持つ比較係数を提供する。コー
シー・シュワルツ関数の上述の表現は、Siの項をあらか
じめ規格化することで次のように簡略化できる。
【0049】 コーシー・シュワルツ関数 = (Si)・(Ti) / (||Ti||) 新しく簡略化された表現のSiの項は、より複雑な始めの
項 (Si)/(||Si||) を表している。簡略化されたコーシ
ー・シュワルツ関数に置き換えると、強調処理は次のよ
うになる。 第1比較として、 C* = (Si)・(T*) /(||T* ||), 第2比較として、 C** = (Si)・(T**)/(||T**||), 数学的には、テンプレート強調処理とは、第1比較C*
最大の第2比較C** との最小の認識マージンを、(すべ
てのテンプレートにわたって)最大化するベクトルテン
プレートの組(T1 T2 T3…Ti…TG)を見つけだす処理で
ある。
【0050】M = MinC* - Max C** の最大化 M = Min[(Si)・(T*)/(||T*||) - Max{(Si)・(T**)/(||T
**||)}] の最大化 コーシー・シュワルツの比較関数の導関数は、次のよう
になる。 dM/dT* = dC*/dT* - dC**/dT* = Si/||T*|| - (Si・T*)T*/(||T*||)3 また、 dM/dT** = dC*/dT** - dC**/dT** = Si/||T**||- (Si・T**)T**/(||T**||)3 <サブクラス−サブテンプレート(図6の(A),
(B),(C)と図7)>シンボルクラスのフォントバ
ージョンは、必ずしも美的効果を狙ったデザインフォン
トである必要はない。フォントバージョンは、文字の1
つのバージョンの実装にともなう歪みによる故意でない
変形であってもよい。プリンタの製造及び型により、O
CR処理により別個のフォントバージョンとして認識さ
れる、より肉太で(または細く)より濃い(または薄
い)文字を印刷する場合がある。紙質やトナー成分もま
た、実装における変化に寄与する。
【0051】したがって、与えられたシンボルクラス内
のピクセルバージョンは、そのシンボルクラスに一致す
る英数字のシンボルのデザインフォントの変化や実装に
おける変化(またはその両方)であってもよい。図6の
(A)に示す斜体のピクセルバージョンF1は、シンボル
クラス“F”の Duplex Italic デザインフォントであ
る。図6の(B)に示す単純なピクセルバージョンF
3は、シンボルクラス“F”の Duplex Roman デザイン
フォントである。図6の(C)に示す複雑なピクセルバ
ージョン F5,F6は、シンボルクラス“F”の2つの Tri
plex Romanフォントである。図6の(B)に示す単純な
ピクセルバージョンF2(左側のバージョン)は、トナー
を置く量を抑制したプリンタ(またはトナーや紙質)の
変化により生成された、ピクセルバージョンF3の実装に
おける変形(細字)である。図6の(C)に示す単純な
ピクセルバージョンF4(左側バージョン)は、トナーを
置く量を増やした印刷環境で生成されたシンボルクラス
“F”の実装における変形(太字)である。
【0052】シンボルクラスFの6つのピクセルフォン
トF1〜F6は広がっており、図6の(A),(b),
(C)でグループ化された3つの関連したサブクラスを
必要とする。各サブクラスは、図7で水平軸に沿って
“SCa ”,“SCb ”,“SCc ”として示されている。図
7は、図6の(A)、(b)、(C)に示されたシンボ
ルクラスFの3つの関連したサブクラスを特に強調し
た、大文字のシンボルクラスA〜Zのデザインと実装の
バージョンの比較行列である。各サブクラスは、図7で
縦軸に沿ってサブイメージ“Fa”,“Fb”,“Fc”と示
されている分離したサブテンプレートを持っている。斜
体のピクセルフォントF1は、サブテンプレートFaとして
認識される1つのバージョンからなるサブクラスを構成
する。単純なフォントF3と細字としての実装のフォント
F2は、サブテンプレートFbとして認識される2つのバー
ジョンからなるサブクラスを構成する。複雑なフォント
F5,F6と、太字としての実装のF4とは、サブテンプレー
トFcとして認識される3つのバージョンからなるサブク
ラスを構成する。
【0053】広がったピクセルバージョンのサブクラス
の各々のサブイメージは、強調処理が進むとテンプレー
トライブラリ内で対応するサブテンプレートとなる。与
えられたサブクラスにおける広がったピクセルバージョ
ンの認識マージンは、サブクラスを持たないという図1
の一般的な実施例におけるものとは僅かに異なる方法で
決定される。関係するサブクラスにおけるピクセルバー
ジョンの認識マージンは、比較から除外される。これら
のピクセルバージョンはすべて同じクラス内にサブクラ
スとしてあるので、この除外はサブクラスの実施例では
可能である。OCRの処理の中では、3つのサブクラス
はすべてクラス“F”にあるので、サブクラスFa,Fb
Fcの6つのピクセルバージョンF1〜F6を見分けることは
重要ではない。入力バージョンF1がサブクラスFaとして
でなくFcとして定められる場合でも、OCRのエラーは
起こらない。
【0054】サブクラス相互間の認識マージンは、与え
られたサブクラスの入力バージョンを関係するサブクラ
スのサブテンプレートと比較しないことにより、除外さ
れる。この除外の様子は、図7において比較行列内の1
2個の大きなダッシュにより示されている。入力バージ
ョンF1〜F6の各々の上の列には、関係するサブクラスの
各々に対して、除外を表すダッシュが2つずつある。サ
ブクラス相互の除外は、比較行列において各サブクラス
相互の位置にデフォルト値“0”を埋め込むことにより
実現できる。結果として認識マージンは大きくなり、第
2比較C** との競争から外れる。あるいは、サブクラス
相互の認識マージンは、ピクセルバージョンと関係する
サブクラスのテンプレートとの認識マージンを定めない
ことにより、除外される。
【0055】<結論>本発明における目的が以上述べた
ように達せられることは、当業者には明らかであろう。
本発明の概念から逸脱しない範囲で、ここで示された構
成や実施例におけるさまざまな変形ができることは言う
までもない。しかも、さまざまな図によって示された実
施例の特徴は、別の図の実施例においても使用される。
したがって、本発明の範囲は特許請求の範囲の文言およ
び法的に等価なものにより決められるものである。例え
ば、本発明はOCRに限定されず、ピクセルマッチング
によるいかなるパターン認識にも適用し得る。
【0056】
【発明の効果】本発明により、光学的文字の認識を改良
するためのマルチフォント・テンプレートライブラリの
強調方法を提供できる。また、主要な比較と最大となる
次の比較との間の最小のマージンを極大化するマルチフ
ォント・テンプレートライブラリの強調方法を提供でき
る。
【0057】また、ピクセルの重み付けによりテンプレ
ートと入力シンボルとの相違を強調するようなマルチフ
ォント・テンプレートライブラリの強調方法を提供でき
る。また、ピクセルの重み付けによりテンプレートと入
力シンボルとの類似性を抑制するようなマルチフォント
・テンプレートライブラリの強調方法を提供できる。
【図面の簡単な説明】
【図1】本実施例で利用する比較行列を示す図であり、
(A)はG個の入力シンボルクラスのグループとL個の
イメージのライブラリ(未強調テンプレート)とのV×
Lの比較を表している比較行列(一般的な場合)を示
し、(B)は文字a〜zの小文字ピクセルバージョンと
小文字イメージのライブラリ(未強調テンプレート)と
の比較行列を、アンチキャラクタの“oce”クラスタ
を例として示す図である。
【図2】テンプレート強調法における処理ステップを表
すフローチャートである。
【図3】ひとつの小文字入力バージョン“o2 ”と図1
の(B)の小文字a〜zとの比較係数組の棒グラフを示
す図であり、(A)は初期イメージ比較係数組の棒グラ
フを示し、(B)は改善されたテンプレート比較係数組
の棒グラフを示す図である。
【図4】ひとつの小文字入力バージョン“c2 ”と図1
の(B)の小文字a〜zとの比較係数組の棒グラフを示
す図であり、(A)は初期イメージ比較係数組の棒グラ
フを示し、(B)は改善されたテンプレート比較係数組
の棒グラフを示す図である。
【図5】ひとつの小文字入力バージョン”e2 ”と図1
の(B)の小文字a〜zとの比較係数組の棒グラフを示
す図であり、(A)は初期イメージ比較係数組の棒グラ
フを示し、(B)は改善されたテンプレート比較係数組
の棒グラフを示す図である。
【図6】大文字シンボルクラス“F ”の3つのサブクラ
スを示し、(A),(B),(C)は、3つのサブクラ
スを構成する6つのピクセルバージョンを示す図であ
る。
【図7】図6のピクセルバージョンとサブクラスとを表
す比較行列を示す図である。

Claims (31)

    【特許請求の範囲】
  1. 【請求項1】 少なくともいくつかのシンボルクラスが
    同じシンボルの複数のピクセルバージョンを含む既存の
    G個のシンボルクラスのグループ(S1 S2 S3…Si…SG
    において、1つのピクセルテンプレートが各シンボルク
    ラスに対応するG個の認識強調されたピクセルテンプレ
    ートのライブラリ(T1 T2 T3…Ti…TG)を提供して、L
    個の未強調のピクセルイメージ(I1 I2 I3…Ij…IL)の
    ライブラリ(I1 I2 I3…Ij…IL)の強調を行なうテンプ
    レートライブラリの強調方法であって、 L個の未強調のピクセルイメージのライブラリ(I1 I2
    I3…Ij…IL)を与える行程と、 複数のピクセルバージョンを有して合計V個のピクセル
    バージョンをもつG個のシンボルクラスのグループ(S1
    S2 S3…Si…SG)を与える行程と、 V個のピクセルバージョンの各々をL個のピクセルイメ
    ージの各々と比較して、V個のピクセルバージョンの各
    々に対してL個の比較が1組があり、比較の各組が各ピ
    クセルイメージIjに対して比較Ciをもつように、各組が
    L個の比較(C1C2 C3…Cj…CL)からなるV個の組で構
    成されるV×L個の比較を得る行程と、 V組の比較の各々のL個の比較の中からピクセルバージ
    ョンと最も近い比較を第1比較をC*とし、V個の第1比
    較C*の集合(C1 * C2 * C3 * …Ci * …CvG *)を形成する行
    程と、 V組の比較の各々の残りのL−1個の比較の中からピク
    セルバージョンと2番目に近い比較を第2比較をC**
    し、V個の第2比較C** の集合(C1 ** C2 ** C3 **… Ci
    ** …CV **)を形成し、V組の比較の各々から1対の前
    記比較C*とC** とのV個の対を提供する行程と、 前記比較C*とC** との各々の対の間に1つのV個の認識
    マージン(M1 M2 M3…Mi…MV)を決定する行程と、 V組の比較からのV個の比較の対のすべての中で最も小
    さな認識マージンM*を持つ1対の比較C*とC** とを選択
    する行程と、 選択された比較C*とC** との対に対応する1対のピクセ
    ルイメージI*とI** とを定める行程と、 選択された比較C*とC** との対に対応する最も近いピク
    セルイメージI*、または2番目に近いピクセルイメージ
    I** 、またはそれらの両方のあるピクセルに対して重み
    付け処理を施して、認識マージンM*を漸次増加させ、ピ
    クセルイメージI*を最も近いピクセルテンプレートT*
    していくか、またはピクセルイメージI* * を2番目に近
    いピクセルテンプレートT** にしていくか、またはそれ
    らの両方を行う行程と、 ピクセルイメージのライブラリが、少なくともシンボル
    テンプレートのいくつかが既存のG個の対応するシンボ
    ルクラスのグループ(S1 S2 S3…Si…SG)の各々におい
    てピクセルバージョンに現れない重み付けされたピクセ
    ルずれをもつような強調されたシンボルテンプレートの
    ライブラリ(T1 T2 T3…Ti…TG)となるまで、前記比
    較,設定,決定,選択及び重み付けを繰り返す行程とを
    備えることを特徴とするテンプレートライブラリの強調
    方法。
  2. 【請求項2】 ピクセルテンプレートの認識強調は、最
    も小さい認識マージンが所定の最小値より大きくなった
    場合に終了されることを特徴とする請求項1記載のテン
    プレートライブラリの強調方法。
  3. 【請求項3】 ピクセルテンプレートの認識強調は、各
    繰り返しにおける最も小さい認識マージンの増加量が所
    定の最小値より小さくなった場合に終了されることを特
    徴とする請求項1記載のテンプレートライブラリの強調
    方法。
  4. 【請求項4】 ピクセルテンプレートの認識強調は、所
    定の回数の重み付けの繰り返しが実行された場合に終了
    されることを特徴とする請求項1記載のテンプレートラ
    イブラリの強調方法。
  5. 【請求項5】 ピクセルテンプレートの認識強調は、所
    定の繰り返し処理時間を越えた場合に終了されることを
    特徴とする請求項1記載のテンプレートライブラリの強
    調方法。
  6. 【請求項6】 ピクセルテンプレートの認識強調は、類
    似の形をしたテンプレートの集団の中の各テンプレート
    が同じ認識マージンになり、相互にアンチキャラクタと
    なった場合に終了されることを特徴とする請求項1記載
    のテンプレートライブラリの強調方法。
  7. 【請求項7】 シンボルクラス内のピクセルバージョン
    が、該シンボルクラスに対応する英数字シンボルのフォ
    ントの変形であることを特徴とする請求項6記載のテン
    プレートライブラリの強調方法。
  8. 【請求項8】 シンボルクラス内のピクセルバージョン
    が、該シンボルクラスに対応する英数字シンボルの実装
    における変形であることを特徴とする請求項6記載のテ
    ンプレートライブラリの強調方法。
  9. 【請求項9】 シンボルクラス内のピクセルバージョン
    が、該シンボルクラスに対応する英数字シンボルのフォ
    ントの変形かつ実装における変形であることを特徴とす
    る請求項6記載のテンプレートライブラリの強調方法。
  10. 【請求項10】 シンボルクラス内のピクセルバージョ
    ンが、該シンボルクラスに対応する英数字シンボルの変
    形であり、シンボルクラスの少なくともいくつかの広が
    ったピクセルバージョンが、該シンボルクラスのピクセ
    ルバージョンからなるサブクラスを形成することを特徴
    とする請求項6記載のテンプレートライブラリの強調方
    法。
  11. 【請求項11】 広がったピクセルバージョンのサブク
    ラスの各々が、テンプレートライブラリの対応するサブ
    テンプレートとなるサブイメージを持つことを特徴とす
    る請求項10記載のテンプレートライブラリの強調方
    法。
  12. 【請求項12】 サブクラス内に広がるピクセルバージ
    ョンの認識マージンの決定の間に、関連するサブクラス
    のサブテンプレートとの認識マージンは除外されること
    を特徴とする請求項11記載のテンプレートライブラリ
    の強調方法。
  13. 【請求項13】 関連するサブクラスのサブテンプレー
    トとの認識マージンを決定しないことにより、サブクラ
    ス相互の認識マージンを除外することを特徴とする請求
    項12記載のテンプレートライブラリの強調方法。
  14. 【請求項14】 関連するサブクラスのサブテンプレー
    トとサブクラスとの比較をしないことにより、サブクラ
    ス相互の認識マージンを除外することを特徴とする請求
    項12記載のテンプレートライブラリの強調方法。
  15. 【請求項15】 V×L個の比較が比較の数値係数であ
    り、その値は比較Cijのもとでのシンボルクラス内Siの
    ピクセルバージョンとピクセルイメージIjとの間の類似
    度を表すことを特徴とする請求項1記載のテンプレート
    ライブラリの強調方法。
  16. 【請求項16】 高い値を持つ係数が入力ピクセルバー
    ジョンSiとピクセルイメージIjの比較が近いことを表
    し、低い値を持つ係数がSiとIjの比較が遠いことを表す
    ことを特徴とする請求項12記載のテンプレートライブ
    ラリの強調方法。
  17. 【請求項17】 認識マージンが、選択された各々の比
    較の対C*とC** の間の差であることを特徴とする請求項
    12記載のテンプレートライブラリの強調方法。
  18. 【請求項18】 ピクセルイメージIjのピクセルバージ
    ョンSiに対する認識強調が、ピクセルバージョンSiに対
    して選択された比較の対C*とC** を形成する第1比較C*
    と最大第2比較C** との最小の認識マージンを最大化す
    る処理を含み、次の一般的な関係: M = min[C* - max(C**)] の最大化 ここで、 MはC*とC** との認識マージン、 C*はライブラリの中でピクセルバージョンSiに最も近い
    テンプレートT*の第1比較、 C** はライブラリの中でピクセルバージョンSiに2番目
    に近いテンプレートT* * の第2比較、を持つことを特徴
    とする請求項14記載のテンプレートライブラリの強調
    方法。
  19. 【請求項19】 最も近いピクセルイメージI*だけが重
    みづけされ、最も近いピクセルイメージI*を最も近いピ
    クセルテンプレートT*にすることを特徴とする請求項1
    5記載のテンプレートライブラリの強調方法。
  20. 【請求項20】 各繰り返しで最も近いピクセルテンプ
    レートT*に加えられる重みは、テンプレートT*に関する
    認識マージンM*の1次導関数: W* = u*(dM/dT*) = u*(dC*/dT* - dC**/dT*) ここで、 W* は各繰り返しで加えられる重み、 u*は dM/dT* の重み係数ミュー、であることを特徴とす
    る請求項16記載のテンプレートライブラリの強調方
    法。
  21. 【請求項21】 強調処理の各繰り返しは、古いテンプ
    レートT*とわずかに異なる新しいテンプレートT*を生成
    し、 T* n+1 = T* n + W* = T* n + u*(dM/dT*) = T* n + u*(dC*/dT* - dC**/dT*) ここで、n は繰り返しの数値、 T* n+1 は新しいテンプレートT*、 T* n は古いテンプレートT*、と表されることを特徴とす
    る請求項17記載のテンプレートライブラリの強調方
    法。
  22. 【請求項22】 2番目に近いピクセルイメージI**
    けが重みづけされ、2番目に近いピクセルイメージI**
    が2番目に近いピクセルテンプレートT** となることを
    特徴とする請求項15記載のテンプレートライブラリの
    強調方法。
  23. 【請求項23】 2番目に近いテンプレートT** に各繰
    り返しで加えられる重みは、テンプレートT** に関する
    認識マージンM** の1次導関数: W** = u**(dM/dT**) = u**(dC*/dT** - dC**/dT**) ここで、 W**は各繰り返しで加えられる重み、 u** は dM/dT* の重み係数ミュー、により定められるこ
    とを特徴とする請求項19記載のテンプレートライブラ
    リの強調方法。
  24. 【請求項24】 強調処理の各繰り返しは、古いテンプ
    レートT** とわずかに異なる新しいテンプレートT**
    生成し、 T** n+1 = T** n + W** = T** n + u**(dM/dT**) = T** n + u**(dC*/dT** - dC**/dT**) ここで、n は繰り返しの数値、 T* n+1 は新しいテンプレートT** 、 T* n は古いテンプレートT** 、と表されることを特徴と
    する請求項20記載のテンプレートライブラリの強調方
    法。
  25. 【請求項25】 最も近いピクセルイメージI*と2番目
    に最も近いピクセルイメージI** は共に重みづけされ、
    最も近いピクセルイメージI*を最も近いピクセルテンプ
    レートT*とし、2番目に最も近いピクセルイメージI**
    を2番目に近いテンプレートT** とすることを特徴とす
    る請求項15記載のテンプレートライブラリの強調方
    法。
  26. 【請求項26】 各繰り返しでT* とT** に加えられる重
    みは、テンプレートT*とT** に関する認識マージンM*
    M** の1次導関数: W* = u*(dM/dT*) = u*(dC*/dT* - dC**/dT*)) W** = u**(dM/dT**) = u**(dC*/dT** - dC**/dT**)) ここで、 W* は各繰り返しでT*に加えられる重み、 u*は dM/dT* の重み付けファクタ・ミュー、 W** は各繰り返しでT** に加えられる重み、 u** は dM/dT* の重み付けファクタ・ミュー、により定
    められることを特徴とする請求項22記載のテンプレー
    トライブラリの強調方法。
  27. 【請求項27】 重み付けファクター u* は重み付けフ
    ァクター u**と等しいことを特徴とする請求項23記載
    のテンプレートライブラリの強調方法。
  28. 【請求項28】 各繰り返しにおいて、古いテンプレー
    トTnからわずかに異なる新しいテンプレート Tn+1 を生
    成し、 T* n+1 = T* n + W* = T* n + u*(dC*/dT* - dC**/d
    T*) T** n+1 = T** n + W** = T** n + u**(dC*/dT** - dC**
    /dT**) ここで、 nは繰り返しの数値、 T* n+1 は新しいテンプレートT*、 T* n は古いテンプレートT*、 T** n+1は新しいテンプレート T**、 T** nは古いテンプレート T**、と表されることを特徴と
    する請求項23記載のテンプレートライブラリの強調方
    法。
  29. 【請求項29】 比較Cjの各数値係数の値は、ピクセル
    バージョンSiの各ピクセルとピクセルイメージIjの各ピ
    クセルとのピクセル単位での比較に基づくことを特徴と
    する請求項12記載のテンプレートライブラリの強調方
    法。
  30. 【請求項30】 ピクセル単位での比較は、ピクセルシ
    ンボルSiの各ピクセルとピクセルイメージIjの各ピクセ
    ルとの内積であることを特徴とする請求項26記載のテ
    ンプレートライブラリの強調方法。
  31. 【請求項31】 ピクセル単位での比較は、コーシー・
    シュワルツ関数: コーシー・シュワルツ関数 = (Si)・(Ti) / (||Si||)(||
    Ti||) ここで、(Si)は入力シンボル、 (Ti)は強調処理されたテンプレート、 (||Si||)はシンボルのノルム、 (||Ti||)はテンプレートのノルム、に基づくことを特徴
    とする請求項26記載のテンプレートライブラリの強調
    方法。
JP6005848A 1993-01-22 1994-01-24 ピクセル重み付けによるマルチフォント・テンプレートライブラリの強調方法 Withdrawn JPH06259607A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US855693A 1993-01-22 1993-01-22
US08/008556 1993-01-22

Publications (1)

Publication Number Publication Date
JPH06259607A true JPH06259607A (ja) 1994-09-16

Family

ID=21732277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6005848A Withdrawn JPH06259607A (ja) 1993-01-22 1994-01-24 ピクセル重み付けによるマルチフォント・テンプレートライブラリの強調方法

Country Status (4)

Country Link
US (1) US5530775A (ja)
EP (1) EP0608148B1 (ja)
JP (1) JPH06259607A (ja)
DE (1) DE69423921T2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6741743B2 (en) * 1998-07-31 2004-05-25 Prc. Inc. Imaged document optical correlation and conversion system
US6473524B1 (en) 1999-04-14 2002-10-29 Videk, Inc. Optical object recognition method and system
CN102402693B (zh) * 2010-09-09 2014-07-30 富士通株式会社 处理包含字符的图像的方法和设备
US10185701B2 (en) * 2016-10-17 2019-01-22 Microsoft Technology Licensing, Llc Unsupported character code detection mechanism

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3191150A (en) * 1962-10-30 1965-06-22 Ibm Specimen identification system with adaptive and non-adaptive storage comparators
US3267431A (en) * 1963-04-29 1966-08-16 Ibm Adaptive computing system capable of being trained to recognize patterns
US3548202A (en) * 1968-11-29 1970-12-15 Ibm Adaptive logic system for unsupervised learning
US5204914A (en) * 1991-08-30 1993-04-20 Eastman Kodak Company Character recognition method using optimally weighted correlation
US5379349A (en) * 1992-09-01 1995-01-03 Canon Research Center America, Inc. Method of OCR template enhancement by pixel weighting

Also Published As

Publication number Publication date
EP0608148A3 (en) 1995-02-22
DE69423921T2 (de) 2000-08-17
EP0608148B1 (en) 2000-04-12
US5530775A (en) 1996-06-25
EP0608148A2 (en) 1994-07-27
DE69423921D1 (de) 2000-05-18

Similar Documents

Publication Publication Date Title
EP3401842B1 (en) Text image processing method and apparatus
CA2171773C (en) Automatic training of character templates using a transcription and a two-dimensional image source model
US7009612B2 (en) Apparatus and method for font generation, and computer-readable storage medium recording program for the same
EP0649113A2 (en) Multifont optical character recognition using a box connectivity approach
US9311558B2 (en) Pattern recognition system
JPH0142028B2 (ja)
CN112836820B (zh) 用于图像分类任务的深度卷积网络训练方法、装置及系统
CN113096020B (zh) 基于平均模式生成对抗网络的书法字体创作方法
JP2730665B2 (ja) 文字認識装置および方法
JPH06168359A (ja) ピクセル重み付けによるテンプレートライブラリの強調方法
CN107274425B (zh) 一种基于脉冲耦合神经网络的彩色图像分割方法及装置
JPH06259607A (ja) ピクセル重み付けによるマルチフォント・テンプレートライブラリの強調方法
EP0686933A1 (en) Method and apparatus for pattern recognition, and method of compiling dictionary for pattern recognition
JPH0683792A (ja) ニューラルネットワークの学習装置およびニューラルネットワークの学習パターン呈示方法
CN113392772B (zh) 一种面向文字识别的文字图像收缩变形增强方法
KR101937859B1 (ko) 360도 이미지에서의 공통 객체 탐색 시스템 및 방법
US10909421B2 (en) Training method for phase image generator and training method of phase image classifier
Pornpanomchai et al. Printed Thai character recognition by genetic algorithm
KR102131273B1 (ko) 영상분할을 위한 신경망 학습장치 및 방법
JP2011039831A (ja) サポートベクトルマシンの再学習方法
EP0650136B1 (en) A comparison inequality function based method and apparatus for accelerated OCR correlation
KR102008914B1 (ko) 하이브리드 머신 캐릭터 기반의 기계학습 시스템 및 그 구현방법
JPH05314317A (ja) 文字認識装置
JP3452160B2 (ja) 認識辞書学習システム
Kondo et al. Font Style Interpolation with Diffusion Models

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20010403