JPH076209A - 文字認識システムにおける文字の特徴を導出する方法 - Google Patents

文字認識システムにおける文字の特徴を導出する方法

Info

Publication number
JPH076209A
JPH076209A JP5354961A JP35496193A JPH076209A JP H076209 A JPH076209 A JP H076209A JP 5354961 A JP5354961 A JP 5354961A JP 35496193 A JP35496193 A JP 35496193A JP H076209 A JPH076209 A JP H076209A
Authority
JP
Japan
Prior art keywords
character
contour
point
description
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5354961A
Other languages
English (en)
Inventor
Robert Wilcke
ウィルケ ロバート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke PTT Nederland NV
Original Assignee
Koninklijke PTT Nederland NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke PTT Nederland NV filed Critical Koninklijke PTT Nederland NV
Publication of JPH076209A publication Critical patent/JPH076209A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/182Extraction of features or characteristics of the image by coding the contour of the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 字および数字等文字を認識する文字認識シス
テムで文字特徴を導出する方法と、この方法が適用され
る文字認識システムとを提供する。 【構成】 被認識文字の記録イメージパターンから文字
記述を導出した後、前記文字記述の単点Pが、距離変
換によって、前記イメージパターン面の予め選択された
基準点のサブセットR={R=1、・・・、N}
の各点Rに付加される。次に、各付加単点に文字記述
が有する1つ以上の特徴の特徴値が決定される。文字記
述が輪郭記述であれば、各基準点Rに付加される単点
は、基準点Rが文字の輪郭への最短距離D
(R)を有する点であり、選択される文字特徴は最短
距離D(R)と付加点Pにおける輪郭の方向H(R
)とである。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、パターン認識の分野で
ある。本発明は、手書きと印刷の両形式の数字や字等文
字を認識するシステムに関し、特に、この形式の文字認
識システムにおいて認識される文字の特徴を導出する方
法に関する。
【0002】
【従来の技術】上記のような文字認識システムは通常、
図1に示すブロック線図を参照して以下説明する多数の
プロセス工程を備える。これらプロセス工程は次の通り
である: (1)キャリア表面上の文字を光学走査すること。たと
えば、ビデオカメラによるこのような走査により、5ビ
ットで符号化されるグレイ値が付加される、たとえば、
64×64画素の2次元画素パターンが得られる。 (2)すべての画素のグレイ値を閾値演算することによ
る画素パターンの2進量子化。黒/白パターンまたは
“0”と“1”のパターンとして見られる結果はメモリ
に記憶される。 (3)前記量子化画素パターンから、被認識文字の記述
を導出すること。 (4)記述から、被認識文字の1組の文字特徴を導出す
ること。 (5)既知文字の習得プロセスによりすでに得られた結
果に対して見出される1組の文字特徴を検査すること。 (6)検査に基づき、被認識文字のどの既知文字が認識
されるかを決定すること。
【0003】
【発明が解決しようとする課題】この形式の認識技術
は、たとえば、文献〔1〕(後記参照)において知られ
ている。この技術では、量子化画素パターンを使用して
輪郭記述を導出している。被認識特徴を有するディジタ
ル化パターンの輪郭に続き、ある点の座標が選択され
る。これらの点は、各点に相当する点ベクトルと予め定
めた多数の方向のうち1つの方向ベクトルとの内積が最
大値となるように選択される。その点の前記内積と次の
選択点の内積との差が前に設定した限界値を超えれば選
択点は“極限点”としての特徴を有する。前記極限点は
パターンの輪郭の多角近似を形成する。前記多角は凹凸
構成のパターンを示す。前記パターンは、既知文字の特
徴でありかつ前に編集された“辞書”に記憶される、同
様なパターンとの比較に使用される。被認識文字は、パ
ターンが最良の一致を示す既知文字として読み込まれ
る。
【0004】前記周知の認識技術で導出されるパターン
特徴の制限は被認識パターンの構造的記述に基づいてい
る。しかし、これが受入れ可能な認識結果を生ずるのは
被認識パターンが明確な構造を有する場合だけである。
これは、前記周知技術が明確な手書きまたはタイプによ
る文字の認識にのみ目立って適用できることを意味す
る。他の制限は、認識の根拠となる特徴の数、すなわ
ち、パターンにおける凹凸構造の数の可変性である。こ
れは認識に対する決定子の適用を難しくし、これは、た
とえば、標準“フィードフォーワード”中立網を利用す
る特徴等一定数の特徴と共に作用する。
【0005】文献〔2〕は上記形式の他の文字認識シス
テムを開示する。このシステムが根拠とする認識技術
は、被認識文字の2進量子化画素パターンの完全なイメ
ージまたはその一部である多数の所謂イメージ観から文
字特徴を導出する。この所謂観(ビュー)方法におい
て、画素パターンの多様な特徴が、上から、下からまた
側面から、各ビューについて、さらに各イメージまたは
部分イメージについて導出される。ジャンプ、スロー
プ、端点および島等これら特徴について、特徴値はビュ
ーで見出される特定パターンに対し定められる。検査
中、見出される特徴値は、各クラスの被認識文字に対し
調節可能な増量因子を使用して重みが加えられる。前記
増量因子は既知文字についての習得プロセスから前に得
られている。重み付特徴値を使用して各クラスのスコア
を定める。被認識文字は、最大スコアが定められている
クラスに属する文字として認識される。
【0006】文字特徴を導出するビュー方法を使用する
この周知技術は数字を認識するために最初に開発されて
いる。このプロセスで導出される文字特徴は受入れ可能
な文字認識にとって一般的すぎるとされている。さらに
また、被認識文字を検査しなければならない特徴は多様
なため、特徴導出方法は多少複雑である。実際に構造的
特徴である、特徴の形式のため、前記特徴に基づく認識
はさらに、被認識文字のイメージパターンの破れを感知
し、この認識方法は従って、たとえば、特にマトリック
ス・プリンタで印刷される文字等マトリックス書きには
不敵である。
【0007】デイジタル絵処理においても、距離機能を
利用することは知られている。それに基づく方法は“距
離変換”または“距離マッピング”と言うこともある。
この形式の周知“距離マッピング”方法は、たとえば、
文献〔3〕に開示されている。この方法は、原2進イメ
ージの目的物における(または背景における)、1サブ
セットの画素の一部を形成する各画素に、背景における
(または目的物における)最近画素への最短距離を付加
する。各点に相当する距離タグがある。さらに処理はこ
の2成分記述に基づいて行われ、この処理では、とりわ
け、被認識文字の骨組構造がトレースされる。この種の
距離タグは、特に、手書き文字の認識目的には文字特徴
としてそれ自身不適である。
【0008】
【課題を解決するための手段】本発明の目的は、文字認
識システムにおける文字特徴を導出する方法および、こ
の方法が適用される文字認識シテスムを提供することに
あり、前記方法とシステムは上記欠点と制限を有しな
い。本発明によれば、この目的に対し、字や数字等文字
を認識する文字認識システムにおける文字特徴を導出す
る方法は請求項1によることを特徴とする。その基本的
思想によれば、距離変換によってこのような基準点R
に距離タグD(R)が付加されれば、補助部を含み被
認識文字の文字記述の単一点はそれに相当する。基準点
に相当するこのような単一点の補助部を考慮するこ
とによって、距離タグD(R)に加え、このような基
準点近くの文字記述の外形に特徴を有する1つ以上の付
加的特徴を選択できる。この目的のためのきわめて強力
な特徴は、文字記述が輪郭記述を含む場合に基準点に相
当する単一輪郭点に輪郭を有する方向H(R)の推定
となる特徴である。事実、好ましい実施例において、本
発明による方法は請求項2によることを特徴とする。
【0009】上記のビュー方法と比較して、本発明によ
る方法による認識は、いわば、各基準点から見られるよ
うに、文字パターンの局部的ビューから得られる多数の
特徴に基づいている。
【0010】本発明によれば、請求項5の前置特徴部分
に示す形式の文字認識システムは、この目的に対し、請
求項5に記載の特徴を有する。
【0011】文献: 〔1〕“パターン読取システム”なる名称の米国特許第
4,566,124号; 〔2〕“なるべく数字である文字の認識方法および装
置”なる名称の米国特許第3,999,161号; 〔3〕P.E.ダニエルソンによる“ユークリッド距離
マッピング、コンピュータ・グラフィックおよびイメー
ジ処理14、227−248(1980)”; 〔4〕R.P.リップマンによる“中性ネットによる計
算入門”IEEE ASSP誌、1987年4月、pp
4−22。
【0012】
【実施例】本発明は、たとえば、印刷または手書きの数
字や字等文字を認識する認識システムのための文字特徴
を導出する方法に関する。被認識文字の記述から開始し
て、認識は、記述文字の適当に定められた境界点内で導
出される多数の特徴に基づいて進行する。従って、本発
明は、第1に、図1を参照して説明される文字認識シス
テムにおけるプロセス工程(4)に関する。本発明は、
画素記述と、被認識文字の輪郭記述との双方に適用でき
る。これはプロセス工程(3)に関する。輪郭近接が好
ましいので、これを以下詳細に説明し一方、画素近接は
暗に言及するだけとする。プロセス工程(1)と(2)
は記録手段によって周知技術に行われ、これはそれ自身
周知であるからここではさらに詳述しない。例示実施例
の説明において、これら工程を行い、さらに、被認識文
字の黒/白画素パターンは2次元イメージメモリに記憶
されさらに作動されるものとする。L×M画素からなる
像平面の黒/白画素パターンは、像平面における各画素
(i、j)の画素値の関数B(i、j)により、画素記
述と呼ばれる基本記述を有し、ここで、i=1、・・
・、L、で、j=1、・・・、Mであり、この関数は像
平面における各黒画素(i、j)にはB(i、j)=1
により、各白画素(i、j)にはB(i、j)=0によ
り定義される。
【0013】さらに、被認識文字が1列の同時記録文字
の一部であれば、文字を分離して別処理に適するように
するため、区分化操作が周知技術によりすでに行われて
いるものとする。プロセス工程(5)と(6)も周知技
術により行われる。しかし、そのために必要な検査決定
手段は前に習得されてなければならないので文字は本発
明による方法により導出される文字特徴に基づいて認識
されるので、このような手段を方法の完全な説明に続き
詳細に説明する。
【0014】イメージ処理パターン認識の分野では、所
謂距離変換が知られている。この変換では、数D(P)
を下記の方法でイメージ点の黒白パターンの像平面にお
ける各点Pに付加する:点Pが像平面の白区域に位置し
ていれば、D(P)は最近黒イメージ点への距離に等し
い;点Pが、たとえば、数字または字を表す黒区域に位
置していれば、D(P)はマイナスサインを備える最近
白イメージ点への距離に等しい。
【0015】この距離変換は骨組構造をトレースする所
謂骨組アルゴリズムによく使用され、それで文字認識は
見出される骨組構造に基づいて行われる。このように変
換されるイメージ信号も認識プロセス目的に直接使用さ
れることもある。距離タグが文字特徴として使用され
る。たとえば、演算を早くするため、限られた数のイメ
ージ点がプロセスに含まれていれば、距離タグは被認識
文字を記述するには不十分である。受入可能な認識確率
を達成するには、全部でないとしても、きわめて多数の
イメージ点が変換に含まれる。それにもかかわらず、特
に、手書きの認識は不十分である。本発明の目的は、像
平面で、適当な方法で予め選択され基準点と呼ばれる限
られた数Nの点R(ここでi=1、2、・・・N)に
ついて距離変換に基づいて得られる各距離タグに1つ以
上の付加的文字特徴を付加することによって、かなり高
い認識確率が得られる。これは、このような基準点R
に距離タグD(R)が付加されていれば、一般に、被
認識文字の単一境界点Pは、その補助部分を含みそれ
に相当する、という思想に基づく。境界点は、直接補助
部分に白黒両イメージ点を有するようなイメージ点と理
解される。輪郭記述の場合、境界点は輪郭上の点、輪郭
点である。以下、特記しないかぎり、輪郭記述、輪郭点
とする。この形式の単一輪郭点Pの補助部分を考えか
つ基準点Rに対応することにより、距離タグD
(R)に対し、このような基準点Rからみられる、
最近輪郭セグメントC(R)の外形を記述する1つ以
上の付加的特徴を付加できる。そのためのきわめて強力
な特徴は、輪郭点Pにおける輪郭の方向H(R)の
推定となる特徴である。他の補助特徴として、輪郭点P
における輪郭の第2、第3の誘導体の推定となる特徴
があげられる。しかし、前記補助特徴は、文字の認識確
率の向上にはあまり寄与しない。前記付加的特徴に基づ
く、すべてのN基準点Rに対する前記最近輪郭セグメ
ントC(R)のこれらすべての記述は、Nが十分に大
きければ、きわめて効果的認識が可能となる。各文字
に、70〜120の基準点を使用するのが好ましく、こ
れら点は像平面に規則的または任意に分配される。下記
の例において、被認識パターンの像平面における基準点
の特徴D(R)とH(R)を決定する方法をさ
らに詳細に説明する。
【0016】この目的のため、図2は、12×16フィ
ールドよりなる長方形内の別個文字の黒白パターンを示
す。各フィールドは画素に相当する。明確さのため、こ
の例での画素数は小さくしている。各フィールドは、そ
の中心座標(i、j)(ここでi=1、・・・、12、
j=1、・・・16)によって独特に同定可能である。
黒フィールドは陰影線で示されている。各フィールドは
黒か白である。従って、フィールド(2、3)は白で、
フィールド(4、3)は黒である。フィールド(i、
j)が黒であれば、画素値B(i、j)=1を有し、フ
ィールドが白であれば、画素値B(i、j)=0を有す
る。黒フィールドが白フィールドに隣接する場合、境界
線は太線で描かれる。前記2次元記述は、輪郭トレーサ
と呼ばれるプロセスによって、被認識文字のパターンの
1次元輪郭記述に変換される。前記輪郭トレーサは、輪
郭点を求めながら画素像のすべての12×16フィール
ドを連続的にトレースする。始点が見出されるごとに、
輪郭が生ずる。このプロセスで、輪郭に数が与えられ、
それらの相対位置は、見出される始点が前に定めた輪郭
内に位置しているかどうか記憶することにより設定され
る。以下、輪郭のトレース方法を図3を参照して詳細に
説明する。この方法では、各画素は黒または白の有限次
元小平方として考えられる。このような方形の隅部はグ
リッド点と呼ばれる。図3のaにおいて、中心座標
(i、j)を有する単黒画素は、グリッド点1〜4を付
した陰影線で示す小方形として示されている。それ自身
別個黒画素のすでに良好に定められた輪郭を有し、これ
は、1〜2、2〜3等太線で描かれた同セグメントによ
り形成され、さらに(矢印方向による)時計方向に黒区
域を包囲する。前記4つの輪郭グリッド点1〜4のx、
y座標は次のように選択される: (x(1)、y(1))=(i−0.5、j+0.5) (x(2)、y(2))=(i+0.5、j+0.5) (x(3)、y(3))=(i+0.5、j−0.5) (x(4)、y(4))=(i−0.5、j−0.5) 図3のbでは、第(K−2)および第(K−1)グリッ
ド点後輪郭Cをトレースするときで、到達方向からくる
とき、グリッド点(x(K)、y(K))が第K輪郭点
となる場合の状況を示す。到達方向V=(vx、vy)
は4つの可能値を有し、これは(1、0)、(−1、
0)、(0、1)および(0、−1)で表される。例示
では、(1、0)である。到達方向Vの連続部の左右
に、第K輪郭点を通って、2つの画素LとRが破線で示
されている。3つの方向が可能で、下記(K+1)輪郭
点がV、VおよびVとして図示される。下記輪郭
点が見出される方向は各画素L、Rの画素値Bで定ま
る。到達方向(vx、vy)が与えられる画素L、Rの
中心座標と第K輪郭グリッド点の座標は次のとおりであ
る: iL=x(K)+(vx−vy)/2および jL=y(K)+(vx+vy)/2 iR=x(K)+(vx+vy)/2および jR=y(K)+(vx−vy)/2 第(K+1)輪郭グリッド点と関連到達方向は、輪郭ト
レース・アルゴリズムにより定められ、次の態様を有す
る: B(iL、jL)=1それで始めvx:=−vy;v
y:=vxさもなくば終りであれば、 B(iR、jR)=0それで始めvx:=vy;vy:
=−vx終りであれば、 X(K+1):=x(K)+vx;y(K+1):=y
(K)+vy;K:K+1; 次の点に続く
【0017】図2に示すような画素イメージの輪郭を探
すには、像平面を左から右へ、上から下へ走査する。こ
の走査中、例示画素(6、14)における第1黒画素が
見つかれば、輪郭の第1始点が見出される。この場合選
択される最初の2つの輪郭点は、第2輪郭グリッド点の
到達方向としてV=(1、0)を有する図3のaの輪郭
グリッド点1と2に相当する点である。すると、第1輪
郭グリッド点に戻るまで、輪郭トレースアルゴリズムが
開始する。輪郭トレースアルゴリズムの各新たな開始に
あたり、輪郭数CNが1つ増える。輪郭トレースアルゴ
リズムの各実行中に、同じ輪郭に属する画素に同じ輪郭
数CNが付される。このマーキングは別個の第2イメー
ジメモリに記憶される。像平面の走査開始前に、第2イ
メージメモリ内のすべての画素は同じイニシャルマー
ク、たとえば、0を有する。輪郭の完了後、画素イメー
ジは次の輪郭の始点の探索においてさらに走査される。
次の始点が見出されるのは、走査中に、まだマークされ
ていない黒画素が見出された場合または未マーク白画素
が前に見出された輪郭内に見出された場合である。この
ような場合、トレース・アルゴリズムが再び行われる。
この実行中、見出されたすべての輪郭グリッド点は、見
出された順に、関連の輪郭事項を含み輪郭表に記録され
る。前記事項は各輪郭ごとに、輪郭の数CN、夫々問題
の輪郭の第1と最後の輪郭グリッド点に対するポインタ
nreptとnrlptおよび即時包囲輪郭の数を示す
コードcodcよりなる。ここで、画素イメージ全体の
周囲は数0を有する実際の輪郭として考えられる。図2
の画素イメージは第1輪郭C1を有し、その輪郭グリッ
ド点は連続的に1、2、3・・・61、62と番号が付
される。それは第2輪郭C2を有し、その輪郭グリッド
点は63、64、・・・、77、78と番号が付され、
すべて第1輪郭C1に位置する。関連の輪郭表は表1a
と1bに示され、輪郭事項は、輪郭グリッド点のリスト
を形成する表1a、1bに組込まれている。
【0018】例として、以下の多数の画素中心を有する
RP組の基準点RP(m、n)を想定する: RP={RP(m、n)=(4m−2.5n−2)|
m、n=1、2、3}
【0019】前記基準点の1つ、RP(3、2)は図2
に示されている。このような点から、もっとも近い輪郭
セグメント、この場合、輪郭C1の局部形状が調査され
れば、やや傾斜したビジイなパターンの特徴が得られ
る。従って、本質的特徴導出開始前に、上記輪郭トレー
スアルゴリズムにより得られた輪郭記述がまず、所謂輪
郭フィルタ工程に供給され、より落ち着いた外形を有す
る輪郭を生ずる。これは、例示として、輪郭に沿って行
い、常に対応輪郭グリッド点の重み平均を定める簡単な
直線フィルタで行われる。このプロセスで、フィルタ工
程は常に1グリッド間隔のオフセットで行われる。この
フィルタリングの結果、新たな均等に長い輪郭点列が生
じ、これらは最早、普通のグリッド点ではなく、落ち着
いた外形の多角形の隅部を形成する。このような直線フ
ィルタの長さが4つのグリッドユニットとなるように選
択されれば、各フィルタ工程は常に輪郭表から5つの連
続輪郭グリッド点を含む。新しい輪郭表は、新しい座標
を、下記により前の輪郭テーブルにおける各第K輪郭グ
リッド点の座標に付加することにより編集される。 X(K)=x(K−2)/8+x(K−1)/4+x
(K)/4+x(K+1)/4+x(K+2)/8 Y(K)=y(K−2)/8+y(K−1)/4+y
(K)/4+y(K+1)/4+y(K+2)/8
【0020】図2に示すイメージパターンに表1bによ
る輪郭表を適用すると、図4に描かれる新しい輪郭外形
を生じ、その関連輪郭表は輪郭点の新しい座標リストと
共に表2に示される。この場合の輪郭事項は変わらな
い。
【0021】これは、輪郭記述が組RPの各基準点につ
いての局部輪郭特徴DとHの固有導出により適する場合
である。このプロセスにおいて、各輪郭は弦より構成さ
れるとみなされる。番号Kを付した弦は、端点として輪
郭点Kを含み始点として輪郭点K−1を除外する、2つ
の連続番号を付した輪郭点K−1とK間の接続直線であ
る。従って、輪郭表における輪郭点リストは、輪郭事項
で特記される輪郭を構成する連続弦の端点リストとな
る。そこで、組RPからの各基準点について、輪郭表に
おけるすべての輪郭の弦のうち、どの基準点D
min(RQ)が最短距離であるかが定められる。これ
は、弦の端点リストを連続的にみて行われる。弦Kにつ
いての基準点RQの位置に依り、3つの異なる状態が生
ずる。これらは図5のa、b、cに略示される。図5の
aによる状態では、最も近接位置の点が事実上弦Kの始
点である。従って、見出される最小距離Dmin(R
Q)は今まで先行弦の場合にすでに定まっている。夫々
図5のb、cによる状態では、弦Kの点Pと弦Kの端点
が、基準点RQから距離dにある最近点である。2つの
場合において、この距離dは以前に記録された最小距離
min(RQ)より短いかどうかを探るためテストが
行われる。もし短ければ、距離dが関連の弦番号と共に
min(RQ)の新しい値として記録される。次の式
は距離の計算に使用される。図5のbによる状態では、 d=(axcy−aycx)/(cx+cy
) 図5のcによる状態では、 d=ax+ay ここで、 ax=x(RQ)−X(K)と ay=y(RQ)−
Y(K) cx=X(K)−X(K−1)と cy=Y(K)−Y
(K−1) 事実上、最小値dが最初に定められ、これが見出され
たときのみに、その根が算出される。同時に、プロセス
で、問題の基準点RQが、最小距離Dmin(RQ)の
弦が一部を形成する輪郭の左か右に位置しているかどう
かを検査する。この検査は、ベクトル(cx、cy)と
して解釈され、弦の端点と基準点RQとにより形成され
るベクトル(ax、ay)を有する弦に垂直なベクトル
(cy、−cx)の内積(axcy−aycx)を
決定して行われる。内積の値が正であれば、基準点RQ
は右側に位置し、負であれば、輪郭の左側に位置する。
輪郭は常に黒を中心に時計方向に選択されるので、それ
は問題の基準点RQがろ過イメージパターンの“黒”ま
たは“白”区域に位置しているかどうかで分る。
【0022】基準点RQにおける所望の特徴は下記のよ
うに定められる。 (i)D(RQ)=RQが“白”区域にあれば D
min(RQ); D(RQ)=RQが“黒”区域にあれば−Dmin(R
Q); (ii)H(RQ)=図5のbによる状態でベクトル
〔X(K)−X(K−1)、Y(K)=Y(K−1)〕
の方向として算出される最近弦の方向; H(RQ)=図5のcによる状態でベクトル±〔Y
(K)−Y(Ra)、−X(K)+X(RQ)〕の方向
として算出される最近弦の端点と基準点RQ間の接続線
に垂直なベクトルの方向、+ノーサインは基準点RQが
夫々“黒”または“白”に位置しているかどうかにより
与えられる。
【0023】方向特徴は、角度として表すのが好まし
く、たとえば、cos−1、sin−1またはtan
−1関数によって算出できる。図4に示すろ過輪郭記述
に適用すると、基準点RP(3、2)では、番号14を
有する弦が最短距離にあることが分かる。基準点は
“白”に位置しているから、最小距離は正とみなされ、
方向特徴H(RP(3、2))はベクトル〔X(14)
−X(13)、Y(14)−Y(13)〕の方向に等し
い。すでに述べたように、本発明による方法は、イメー
ジパターンの輪郭記述だけで行われるのではない。画素
に基づく記述、画素記述B(i、j)も同様に直接、特
徴D(RQ)とH(RQ)を定めるのに適している。こ
の記述の場合、さらにまた、距離変換を定めるのに多く
の周知アルゴリズムの1つを利用できる。画素中心が再
び基準点として選択されれば、簡単なアルゴリズムは次
のように行うことができる。基準点RQが“白”に位置
していれば、基準点RQを中心とする画素補助部分は、
最近“黒”画素が見つかるまで一様に増大する“サーク
ル”で走査される。ついで、特徴は次のように選択され
る。 D(RQ)={(i(Z)−i(RQ))+(j
(Z)−j(RQ))1/2 および H(RQ)=ベクトルの方向 〔−j(Z)+j(RQ)、i(Z)−i(RQ)〕 RQが“黒”区域に位置していれば、最近“白”画素W
はもちろん、探索され、特徴に対し類似式が適用され
る。方向特徴H(RQ)の上記選択はきわめて簡単であ
るがやや荒い。画素値がZまたはWと相関連するZまた
はWの包囲点を含むことにより改良できる。被認識文字
の画素記述または輪郭記述のいずれかに基づき、上記方
法により得られた特徴は、ベクトルの要素と、n=1、
・・・、2Nの特徴ベクトルV={V}とを形成し、
ベクトル係数列は {V}={D(R)、H(R)、D(R)、H
(R)、・・・・・、D(R)、H(R)}とし
て選択される。
【0024】図6は、文字特徴を導出する上記方法によ
る図1のプロセス工程(3)と(4)を行う特性であ
る、処理手段PMと記憶手段MMの総括をブロック線図
で示す。破線の下に、記憶手段M1、M2、M3、M4
を示し、破線の上に、3つの処理CD、CFおよびFD
を行う処理手段PMを示す。それら関係は次のとおりで
ある。処理CDは文字の輪郭を記述する。文字のイメー
ジパターンについて輪郭トレース・アルゴリズムを行
い、これは第1のプロセス工程(1)と(2)の終了
後、第1メモリM1(イメージ・メモリ)で得られ、得
られた輪郭記述を第2メモリM2に入力する。ついで、
処理CFは第2メモリM2に入力された輪郭記述につい
て輪郭フィルタ工程を行い、得られたろ過輪郭記述を第
3メモリM3に入力する。第4メモリに、RP組の基準
点Rの座標データのリストが記憶される。処理FD
は、第3メモリ内のろ過輪郭記述について第4メモリM
4内のリスト中のすべての基準点に対し特徴導出を行
い、得られた特徴ベクトルVを出力する。
【0025】特徴ベクトルVはその後、図7にその線図
を示す、決定子100として表す検査兼決定手段に送ら
れ、図1のプロセス工程(5)と(6)を行う。決定子
100は特徴チェッカ101と、最大セレクタ102と
よりなる。特徴チェッカは、本実施例において、すべて
の係数Vと導出特徴値を入力する、特徴ベクトルVと
同じ数の入力I、従って、2N、および被認識文字の
全数Mと同じ数の出力Vを有する。被認識文字の組が
数字0、1、・・・、9と大文字A、B、・・・、Zで
形成されれば、前記数Mは、たとえば、34である。特
徴チェッカ101の入力に現れる各特徴ベクトルVに対
し、特徴チェッカはスコアベクトルS={S|m=
1、・・・、M}を決定し、その各係数Sは計量を表
し、それにより特徴ベクトルVは被認識文字組からのm
番目の文字に合致する。スコアベクトルSの係数は出力
Umを経て、最大セレクタ102に送られる。前記最大
セレクタ102は、被認識文字組からの文字により、最
大の係数Sを決定し、出力103で信号CHを出力
し、これは決定最大係数に相当する。特徴チェッカは好
ましくは、たとえば、文献〔4〕に開示される、3層の
パーセプトロンより成る多大中立網である。しかし、図
7において、特徴チェッカ101はM数のパーセプトロ
ンを有する単層中立網としてのみ示されている。特徴チ
ェッカ101では次の3つの工程が識別される: Tで示す分配工程; Wで示す重量工程;および Σで示す加算工程。
【0026】特徴ベクトルVについて特徴チェッカ10
1で示された特徴値は、導出されたように、連続値であ
る。分配工程下において、各値Vは、いわば、同じ値
を多方法、すなわち、M方向、言い換えれば、パーセプ
トロンと同じ数で表すことにより、分配ユニットt
(n=1、・・・、2N)により分配される。重量工
程W中に、各方向mの各特徴値Vは1組の重量因子
{Wnm}からの重量因子Wnmによって重みが加えら
れる。この1組の重量因子は事実上、次元配列、重要因
子マトリックスを形成し、n=1、・・・、2Nは特徴
値Vの数で、m=1、・・・、Mは1組の被認識文字
における被認識文字の数である。重量因子の助けによ
り、スコアが加算工程ΣでM個の加算子δの各々によ
り定められ、このスコアはスコアベクトルSの前記係数
を形成する。各加算子δについて、このスコアは S=f(ΣWnm ) ここで加算はすべてのn=1、・・・、2Nについて行
われ、fはシグモイド等非直線関数である。これは図7
において、各分配ユニットtから各加算子δへ矢印
で示される。ここで矢印は重量因子マトリックスからの
関連重量因子を備える。
【0027】スコアベクトルSの係数Sは最大セレク
タ102に送られる。重量因子マトリックス{Wnm
は決定子に出入りできるメモリ内に位置している。この
マトリックスの係数は“バック伝ぱん含みアルゴリズ
ム”として知られる訓練アルゴリズムにより予め決定さ
れている(たとえば、文献〔4〕、特に6参照)。その
場合、文字特徴は、上記新しい方法により導出された1
訓練組の既知文字からの既知文字の決定子に送られた。
【0028】
【発明の効果】大テスト組の容易に分離可能な手書き数
字の実際の資料(約200,000)に適用すると、文
字特徴“距離”と“方向”を導出する新しい方法により
作用する文字認識システムは、99.3パーセントの文
字を良好に認識することが分かった。文字特徴“距離”
のみが使用された場合、最大得率は98.6パーセント
であった。
【0029】
【表1】
【0030】
【表2】
【0031】
【表3】
【図面の簡単な説明】
【図1】文字認識システムのプロセス工程のブロック線
図を示す。
【図2】内外輪郭を有する被認識文字の黒/白画素イメ
ージを示す。
【図3】輪郭をトレースするプロセスを示し、aは単一
黒画素の状態を示し、bは第K番目の輪郭点が見出され
た後の状態を示す。
【図4】図2による画素イメージの輪郭のろ過後の輪郭
外形を表す。
【図5】図5のa、bおよびcは夫々、輪郭弦について
基準点の位置の3つの異なる状態を示す。
【図6】本発明による図1のプロセス工程(3)と
(4)を行う特別目的のためプロセッサ・メモリ手段の
統括をブロック線図で示す。
【図7】本発明による方法と組合せて適用される、図1
によるプロセス工程(5)と(6)を行う決定子の線図
を示す。
【符号の説明】
100 決定子 101 特徴チェッカ 102 最大セレクタ 103 出 力 PM 処理手段 MM 記憶手段 L、R 画 素 RP 基準点 C 輪 郭 T 分配工程 W 重量工程 Σ 加算工程

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 字や数字等文字を認識する文字認識シス
    テムにおける文字の特徴を導出する方法であって、第1
    工程として、認識された文字の記録イメージパターンか
    ら文字の記述を導出する工程を備える方法において、距
    離変換によって、前記文字記述の単一点Pを、前記イ
    メージパターン面における予め選択された基準点のサブ
    セットR={R=1、・・・・・、N}の各点R
    に付加する工程と;各付加単一点Pの文字記述が有
    する1つ以上の特徴値を決定する工程を備えることを特
    徴とする文字認識システムにおける文字の特徴を導出す
    る方法。
  2. 【請求項2】 文字記述は、認識される文字の輪郭を定
    める輪郭記述であり、各基準点Rに付加される単一点
    は、基準点Rが文字の輪郭まで最短距離D
    (R)である点であり、各基準点Rに対し、文字特
    徴として、少なくとも概算として付加点Pにおける輪
    郭の少なくとも最短距離D(R)と方向H(R)が
    選択されることを特徴とする請求項1記載の方法。
  3. 【請求項3】 文字記述は、どの画素が白でどれが黒か
    を示す画素に基づく記述であり、各基準点Rに付加さ
    れる単一点Pは、基準点Rが夫々白または黒の画素
    区域に位置していれば、文字記述から最近の黒または白
    画素により形成され、各基準点Rに対し、文字特徴と
    して、少なくとも点RとP間の距離D(R)およ
    び点RとPの接続線に直交する方向H(R)が選
    択されることを特徴とする請求項1記載の方法。
  4. 【請求項4】 予め選択された基準点の数Nは70以
    上、120以下であることを特徴とする請求項1〜3の
    1つに記載の方法。
  5. 【請求項5】 字や数字等文字を認識する文字認識シス
    テムにおいて、キャリアの表面に認識される文字のイメ
    ージパターンを記録する手段と、記録イメージパターン
    から文字記述を導出する手段と、前記文字記述から多数
    の文字特徴の特徴値を導出する特徴導出手段と、1組の
    既知文字について以前に得られた結果に対する導出特徴
    値を検査し、検査結果を出力する検査手段と、検査結果
    に基づき、認識されるどの既知文字が認識されるかを決
    定する決定手段とを備え、特徴導出手段は、距離変換に
    よって、前記文字記述の単一点を、前記イメージパター
    ン面における予め選択された基準点のサブセットR=
    {R=1、・・・・・、N}の各点Rに付加す
    る第1手段と、少なくとも2つの文字特徴の特徴値を定
    める第2手段とを備え、文字記述は、各付加単一点に、
    前記第1手段に近いメモリ手段に記憶される前記基準点
    の座標を有することを特徴とする文字認識システム。
  6. 【請求項6】 文字記述を導出する手段は、認識される
    文字の輪郭を位置決めしかつ見出される輪郭の輪郭記述
    を定める輪郭トレーサであり、特徴導出手段は、各基準
    点Rで、単一点Pが位置する輪郭セグメントを定め
    る第3手段であり、各基準点Rで特徴導出手段の第2
    手段は、特徴値として、少なくとも概算として特定輪郭
    セグメントの方向H(R)と、Rからの最短距離D
    (R)を選択することを特徴とする請求項5記載の文
    字認識システム。
  7. 【請求項7】 文字記述を導出する手段は、どの画素が
    白でどれが黒かを示す、画素に基づき記述を導出し、特
    徴導出手段は、前記基準点Rが夫々白または黒画素の
    区域に位置していれば、単一点Pとして文字記述から
    最近の黒または白画素を各基準点Rに付加する第3手
    段を備え、各基準点で特徴導出手段の第2手段は特徴値
    として点RとP間の距離D(R)と、RとP
    の接続線に直交する方向H(R)とを選択することを
    特徴とする請求項5記載の文字認識システム。
JP5354961A 1992-12-30 1993-12-28 文字認識システムにおける文字の特徴を導出する方法 Pending JPH076209A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
NL92204106.6 1992-12-30
EP92204106A EP0604687B1 (en) 1992-12-30 1992-12-30 Method for deriving character features in a character recognition system

Publications (1)

Publication Number Publication Date
JPH076209A true JPH076209A (ja) 1995-01-10

Family

ID=8211184

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5354961A Pending JPH076209A (ja) 1992-12-30 1993-12-28 文字認識システムにおける文字の特徴を導出する方法

Country Status (9)

Country Link
US (1) US6240209B1 (ja)
EP (1) EP0604687B1 (ja)
JP (1) JPH076209A (ja)
AT (1) ATE191980T1 (ja)
DE (1) DE69230940T2 (ja)
DK (1) DK0604687T3 (ja)
ES (1) ES2146205T3 (ja)
GR (1) GR3033926T3 (ja)
PT (1) PT604687E (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7058221B1 (en) * 2000-07-07 2006-06-06 Tani Electronics Industry Co., Ltd. Method of recognizing object based on pattern matching and medium for recording computer program having same
US7032227B2 (en) * 2000-08-14 2006-04-18 Twin Communications Of America, Inc. Portable operating environment for information devices
WO2003023696A1 (en) 2001-09-12 2003-03-20 Auburn University System and method of handwritten character recognition
US10156501B2 (en) 2001-11-05 2018-12-18 Life Technologies Corporation Automated microdissection instrument for determining a location of a laser beam projection on a worksurface area
US8722357B2 (en) * 2001-11-05 2014-05-13 Life Technologies Corporation Automated microdissection instrument
CA2375355A1 (en) * 2002-03-11 2003-09-11 Neo Systems Inc. Character recognition system and method
AU2003270687B2 (en) * 2002-09-13 2008-05-08 Life Technologies Corporation Interactive and automated tissue image analysis with global training database and variable-abstraction processing in cytological specimen classification and laser capture microdissection applications
SG109996A1 (en) * 2002-10-28 2005-04-28 Nanyang Polytechnic Method and apparatus for optical character recognition
DE10337831A1 (de) * 2003-08-18 2005-03-24 Sick Ag Verfahren zur optischen Erkennung von alphanumerischen Zeichen
WO2006031574A2 (en) 2004-09-09 2006-03-23 Arcturus Bioscience, Inc. Laser microdissection apparatus and method
US8384803B2 (en) * 2007-12-13 2013-02-26 Keigo Iizuka Camera system and method for amalgamating images to create an omni-focused image
ATE546011T1 (de) * 2009-09-09 2012-03-15 European Central Bank Verfahren zur erzeugung eines sicherheitsbildes auf zwei ebenen für banknoten
RU2664411C2 (ru) * 2016-12-01 2018-08-17 Федеральное государственное бюджетное образовательное учреждение высшего образования "Рязанский государственный радиотехнический университет" Способ обработки последовательности изображений для распознавания воздушных объектов
US10438098B2 (en) * 2017-05-19 2019-10-08 Hand Held Products, Inc. High-speed OCR decode using depleted centerlines

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5927380A (ja) * 1982-08-02 1984-02-13 Nippon Telegr & Teleph Corp <Ntt> 特徴抽出処理方式
JPH04106683A (ja) * 1990-08-28 1992-04-08 Canon Inc 文字パターン処理方法及び装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CH591726A5 (ja) 1973-07-30 1977-09-30 Nederlanden Staat
JPS51118333A (en) 1975-04-11 1976-10-18 Hitachi Ltd Pattern recognition system
JPS5930179A (ja) * 1982-08-10 1984-02-17 Agency Of Ind Science & Technol パタ−ンの線分近似方式
US4628532A (en) * 1983-07-14 1986-12-09 Scan Optics, Inc. Alphanumeric handprint recognition
JPS6079485A (ja) 1983-10-06 1985-05-07 Sharp Corp 手書き文字認識処理装置
JPS6282486A (ja) 1985-10-08 1987-04-15 Hitachi Ltd オンライン手書き図形認識装置
JP3014097B2 (ja) 1987-02-20 2000-02-28 株式会社日立製作所 輪郭追跡方法及びシステム
DE3815869A1 (de) 1987-05-08 1988-11-17 Ricoh Kk Verfahren zum extrahieren von merkmalsmengen eines zeichens
EP0514688A2 (en) 1991-05-21 1992-11-25 International Business Machines Corporation Generalized shape autocorrelation for shape acquisition and recognition
JP3361124B2 (ja) * 1991-07-30 2003-01-07 ゼロックス・コーポレーション テキストを含む2次元画像上での画像処理方法と画像処理装置
US5245674A (en) 1991-07-30 1993-09-14 Xerox Corporation Image processing using distance as a function of direction
US5416851A (en) * 1991-07-30 1995-05-16 Xerox Corporation Image analysis based on location sampling
JPH07262360A (ja) 1994-02-07 1995-10-13 Canon Inc 画像処理装置及び方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5927380A (ja) * 1982-08-02 1984-02-13 Nippon Telegr & Teleph Corp <Ntt> 特徴抽出処理方式
JPH04106683A (ja) * 1990-08-28 1992-04-08 Canon Inc 文字パターン処理方法及び装置

Also Published As

Publication number Publication date
GR3033926T3 (en) 2000-11-30
DE69230940T2 (de) 2000-10-19
ES2146205T3 (es) 2000-08-01
EP0604687B1 (en) 2000-04-19
PT604687E (pt) 2000-09-29
DE69230940D1 (de) 2000-05-25
EP0604687A1 (en) 1994-07-06
US6240209B1 (en) 2001-05-29
ATE191980T1 (de) 2000-05-15
DK0604687T3 (da) 2000-10-23

Similar Documents

Publication Publication Date Title
US5625707A (en) Training a neural network using centroid dithering by randomly displacing a template
Boccignone et al. Recovering dynamic information from static handwriting
US8750619B2 (en) Character recognition
US8265350B2 (en) Method and apparatus for detecting and processing specific pattern from image
JPH076209A (ja) 文字認識システムにおける文字の特徴を導出する方法
US5511134A (en) Image recognition device and image recognition method
JP2001092919A (ja) 2次元バーコードのねじれ角決定法
JP2010134957A (ja) パターン認識方法
JPH06195513A (ja) 光学式文字認識システム用折曲点抽出方法
JP3438440B2 (ja) 画像処理装置
JPH0696278A (ja) パターン認識方法及び装置
US5787196A (en) Method and apparatus for splitting connected characters into component characters
Lin et al. A genetic algorithm approach to Chinese handwriting normalization
US5023920A (en) Method for finding the medial axis transform of an image
Bhattacharya et al. An MLP-based texture segmentation method without selecting a feature set
JP2004094644A (ja) 画像処理装置、画像処理方法、記憶媒体及びプログラム
JP3782239B2 (ja) 画像部品化方法及び画像部品化プログラムを記録した記録媒体
Wang et al. Improved Object Detection in Forward-Looking Sonar Images with Attention-YOLOv8 and Denoising Algorithms
Chacko et al. Comparison of Statistical and Structural Features for Handwritten Numeral Recognition
JP2000259836A (ja) 濃淡画像同定方法、濃淡画像同定装置および濃淡画像同定プログラムを格納する記録媒体、ならびに画像検索方法、画像検索装置および画像検索プログラムを格納する記録媒体
Donath et al. A hybrid distance map based and morphologic thinning algorithm
GB2329738A (en) Determining relationship between line segments in pattern recognition
CN111597375A (zh) 基于相似图片组代表特征向量的图片检索方法及相关设备
CN112801894A (zh) 一种使用迭代滤波处理的深度图像修复方法
JP2604050B2 (ja) 線図形認識装置