JP2619426B2 - 文字パターン認識方法 - Google Patents

文字パターン認識方法

Info

Publication number
JP2619426B2
JP2619426B2 JP62274796A JP27479687A JP2619426B2 JP 2619426 B2 JP2619426 B2 JP 2619426B2 JP 62274796 A JP62274796 A JP 62274796A JP 27479687 A JP27479687 A JP 27479687A JP 2619426 B2 JP2619426 B2 JP 2619426B2
Authority
JP
Japan
Prior art keywords
arc
point
straight line
feature
character pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62274796A
Other languages
English (en)
Other versions
JPH01116781A (ja
Inventor
和彦 大西
章司 三木
泰生 藤田
浩貴 坪田
勝司 魚崎
Original Assignee
グローリー工業株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by グローリー工業株式会社 filed Critical グローリー工業株式会社
Priority to JP62274796A priority Critical patent/JP2619426B2/ja
Publication of JPH01116781A publication Critical patent/JPH01116781A/ja
Application granted granted Critical
Publication of JP2619426B2 publication Critical patent/JP2619426B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (発明の技術分野) この発明は、文字パターン、特に数字の手書文字を認
識するための文字パターン認識方法に関する。
(技術的背景と解決すべき問題点) OCR(Optical Character Reader)技術において、所
定枠内に書かれた数字を読取るための手書数字認識アル
ゴリズムはほぼ完成の域に達している。しかし、OCRに
よる読取を意識せずに書かれたフリーの一般数字を認識
することは、現在の実用機レベルを見ても不充分であ
る。
従来の文字パターンの認識方式としては、たとえば特
公昭53−41943号公報で示すようなものがあるが、この
方式では詳細分類として文字パターンを特定の要素に分
解してその要素の縦方向あるいは横方向の長さ比から文
字パターンを識別するようになっているが、その特徴だ
けでは認識の確実性が低いといった欠点がある。又、特
公昭59−26975号公報で示すパターン認識方式は、文字
パターンをループの有無やカップ又はキャップの有無に
よって大分類した後、詳細分類の分類論理に工夫がこら
されているが、ここでの詳細分類は、特定の要素の縦方
向あるいは横方向の長さの比を用いているだけであり、
満足のいく能力が得られていない。
(発明の目的) この発明は上述のような事情よりなされたものであ
り、この発明の目的は、OCRによる読取を意識せずに書
かれた手書文字を確実にかつ効率的に認識できるように
した文字パターン認識方法を提供することにある。
(問題点を解決するための手段) この発明は、文字パターンを前処理してループ,直線
及びアークの3要素に対応づける特徴抽出を行ない、前
記特徴抽出されたそれぞれの要素について規格化を行な
い、特徴をコード化して予め登録されている分類コード
と前記規格化された各要素とを比較すると共に、前記分
類コードに、雑音を含んだコードを用意しておき、前記
比較において前記雑音を含んだコードが候補となった場
合は雑音部分を除去し、再度前記特徴抽出を行なって前
記比較を行ない、その比較結果に基づいてバランスチェ
ック及びストロークチェックを行ない、更に前記アーク
の回転方向や直線の方向に基づいて前記3要素のうちの
特定要素との長さの比等の詳細分類を行なって前記文字
パターンを認識する文字パターン認識方法において、Sw
iを前記各要素iの標準ウエイト、twiを前記文字パター
ンの各要素iのウエイトとして求められる の基準値Siに対する大小によって前記バランスチェック
を行ない、前記直線に関するその始点から終点への方向
と、前記アークに関するその始点から終点に対する回転
方向及び直線方向と、前記各要素のつながり構造とによ
ってストローク条件を作成し、前記ストロークチェック
を行なうようにすることによって達成される。
(発明の作用) この発明では文字パターンの特徴をループ,直線及び
アークの要素に分けてから特徴抽出を行なうと共に、予
め登録されている分類コードと比較して文字に特定でき
ないときバランスチェック,ストロークチェックを行な
いそれでも特定できないときには更に前記アークの回転
方向等の詳細分類を行なっているので、手書数字を確実
にかつ効率良く認識することが可能である。
(発明の実施例) この発明では、たとえば第2図(A)で示すような手
書数字に対して第3図(A)で示すような3要素、つま
りアーク(円弧)tw0,tw2と、直線tw1と、ループ(円図
形)tw3との3要素に分けて特徴抽出を行い、これら特
徴をコード化してから予め登録されている分類コードと
比較して文字パターンを識別するようにしている。各要
素はブランチとノードで構成されており、ノードはパタ
ーンの端点又は分岐点となっており、ブランチはノード
を結ぶ線分を示している。同様に、第2図(B)で示す
手書数字に対しては、第3図(B)で示すようなアーク
w0,w3、直線w1、ループw2の3要素に分解している。す
なわち、この発明では手書数字をCCD等のイメージセン
サで成る読取装置で読取ってスムージング,細線化等の
前処理を施した後に、所定ブロックに切出したパターン
をループ,直線及びアークの3つの要素に分解し、各要
素の有無のみならず各要素の相対的位置関係,直線の向
き,アークの開き方向,各要素のウエイト等を基にコー
ド化して、データベースとして予め登録されている分類
コードと比較することによって文字パターンの認識を行
なうようになっている。
第1図はこの発明方式の全体の動作を示すフローであ
り、手書文字を読取装置で読取ってから電気的にスムー
ジングや細線化等の前処理を行ない(ステップS1)、こ
の前処理の後にデータ構成を行ない(ステップS2)、上
述したような3要素に分解してからコード化して特徴抽
出を行ない(ステップS3)、予め登録されている“0"〜
“9"の分類コードと比較する。すなわち、読取られて形
成された特徴コードを予め登録されている数字“0"〜
“9"の各分類コードと比較してコードチェックを平行し
て行なう(ステップS01,S11,……,S91)。このコードチ
ェックは数字0〜9に対して同時に行ない、各コードチ
ェックの後に候補として上った数に対して後述するよう
な再帰チェックが必要か否かを判断し(ステップS02,S1
2,……,S92)、再帰チェックが必要な場合は当該候補数
字についてデータの再構成を行なって(ステップS4)、
その後に再度特徴抽出を行なって同様な処理を行なう。
また、再帰チェックが不要な場合は当該候補として上げ
られた各数字に対してバランスチェック(ステップS03,
S13,……,S93)、ストロークチェック(S04,S14,……,S
94)、更に他の詳細な評価(ステップS05,S15,……,S9
5)を行なってから最終的な判定を行なう(ステップS
5)。この最終判定は0〜9に対して1つのパターンの
みが認識された場合には、その認識された数字を認識パ
ターンと決定するが、2以上のパターンが存在すると判
定された場合には判定不能とする。
次に各動作について説明する。
先ず、ループの抽出は線図形追跡アルゴリズムによっ
て行なうが、ループは1本以上のブランチにより構成さ
れた閉ループを形成する図形を指し、特徴コードとして
lp1を与え、パラメータとしてウエイト0〜1及び重心c
g(x,y)を与える。ウエイトは対象とする文字パターン
の全ての大きさに対して当該ループが占める割合を示
し、長さ(大きさ)はチェーンコードの数を示してい
る。なお、チェーンコードは第5図に示すような8方向
に対して与えられる“1"〜“8"の数を示している。又、
重心cgはループのxy座標としての重心位置を示してい
る。
又、直線の抽出は第4図で示すように、2点A,B(ノ
ード)により構成されるブランチがあると、そのブラン
チの線分の長さをtl、AB間の最短距離をmdとして α・md≧tl ……(1) 但し、α:直線決定係数(例えば1.2) の時にブランチtlを直線と判定する。ここでmdは を求めるかわりに上記式で代用している。直線方向の算
出はベクトル▲▼より、第5図で示すように8種類
の方向1〜8に対してチェーンコード1,5は共に直線方
向1とし、チェーンコード2,6の場合は共に直線方向2
とし、チェーンコード3,7の場合は共に直線方向3と
し、チェーンコード4,8に対してはいずれも直線方向4
を与えるようにする。従って、直線の特徴コードをst
で表わすと、nを1〜4の数字でSt1〜St4のように与
え、パラメータとしてウエイト0〜1及び重心cg(x,
y)を与えている。直線のウエイトも上記ループの場合
と同様に、文字パターンの全割合に対する数値0〜1
(たとえば0.72)で与えられる。
次に、アークはループ及び直線以外の特徴要素として
与えられるものであり、アークの特徴コードとしてはac
nmを与える。ここに、nは開き方向であり、数1〜8が
第5図に従って与えられ、mは開き量であり、数1〜5
が与えられる。すなわち、アークの開き方向は、第6図
で示すようにアークのノードである両端点A,Bに対して
アークの中点CPを線分ABの中点Mと接続した方向を開き
方向とし、この開き方向の数字は第5図のチェーンコー
ド1〜8に対応させている。ここで、点Aの座標を(x
A,yA)とし、点Bの座標を(xB,yB)とすると、中点M
の座標は となり、点CPと点Mを結ぶ線分の方向は となる。ここに、d=yd/xdとすれば、開き方向nは のようになる。又、アークの開き量mは、第6図におい
て線分 の長さtl、線分▲▼の長さをolとした場合にol/(t
l+ol)で与えられ、開き量mの1〜5はol/(tl+ol)
が0.0〜0.1のときに“1"、0.1〜0.2のときに“2"、0.2
〜0.3のときに“3"、0.3〜0.4のときに“4"、0.4〜0.5
のときに“5"で与えられる。アークのパラメータも前述
のループ,直線と同様にウエイト0〜1及び重心cg(x,
y)で与えられる。
上述したような特徴抽出の動作をフローで示すと第8
図で示すようになり、データ構成(ステップS301)、出
力データの書込み(ステップS302)を行ない、データの
最大処理領域をx,yについて規定する。その後に上述し
たようなループ処理を全ループについて行ない(ステッ
プS303,S304)、上述したような重心及びウエイトを各
ループ毎に求め、全ループについての処理が終了してか
ら直線及びアークの処理を初期値(0)から行なう(ス
テップS305)。ループを構成する以外のブランチをシン
グルブランチと呼び、シングルブランチの処理が全て終
了した時に全データ領域,ループ数,直線数,アーク数
並びに各ループ,各直線,各アークに対するウエイト,
重心等の出力データをメモリに書込んで終了となる(ス
テップS310,S311)。
一方、シングルブランチ処理が全て終了していない場
合は最初に直線か否かの判定を行ない(ステップS32
0)、直線と判定された場合には上述したような直線処
理を行ない(ステップS321)、直線ではないと判定され
た場合にはシングルブランチ数が“2"以上か否かを判断
し(ステップS322)、シングルブランチ数が“2"以上の
場合はアーク処理となる(ステップS323)。又、シング
ルブランチ数が“1"の場合にはアークフラグ処理,ルー
プフラグ処理を行なう(ステップS324)。アークフラグ
処理とは、第17図に示すような数字の場合、端点と端点
との開き量が所定値より小さいとき“0"とみなして以下
に述べる分離処理を行なわないようにする為の処理で、
開き量を前述したように求めたとき、その値が例えば0.
2以下のときにアークフラグを立てる。
ループフラグ処理とは第18図に示すような数字の場
合、ループを除いたシングルブランチのウエイトが所定
以下のとき“6"とみなせるように以下に述べる分離処理
を行なわないようにする為の処理で、ウエイトが例えば
0.4未満のときにループフラグを立てる。次にアークフ
ラグ又はループフラグが立っているか否かを判断し(ス
テップS325)、各フラグが有る場合はアーク処理となり
(ステップS326)、いずれもフラグが立っていない場合
は当該ブランチの分離処理を行なう(ステップS330)。
この分離処理は第7図の左側の手書数字で示すような
数字、即ち1筆書のように1ブランチのみで構成され且
つ直線でない図形(クロス図形)を2つに分離する処理
のことで、もしクロス図形を分離しないでそのまま判断
すると直線及びループではないので全てアークとなって
しまい、認識できない。そこでこのようなクロス図形は
その線分長さの中心Bで2つの図形に分離して特徴抽出
を行なうようにしている。この分離処理の後、分離され
た一方の要素について先ず直線か否かの判定を行ない、
直線と判定された場合は直線処理を行ない(ステップS3
32)、直線でないと判定された場合にはアーク処理を行
ない(ステップS333)、その後に他の分離要素について
も同様な直線処理又はアーク処理を行なう(ステップS3
34〜S336)。即ち、第7図の“2"の場合には、中点のB
点で2つに分離し、上記処理により2つのアークB1とア
ークB2とになる。上述のような直線,アーク処理を全て
のシングルブランチについて繰り返して行なう。
上述のような処理による特徴抽出の後、筆記文字の大
きさ等によって重心位置などが異なるのはコードチェッ
クの上で望ましくないため、特徴データに対して規格化
を行ない常に正しく比較処理を行ない得るようにしてい
る。また、各特徴の要素の重心位置は正規化されても、
字体の変形による変動が大きい。そこで、位置情報を各
特徴の重心間における相対位置(上,下,左,右等)を
用いることにより、重心位置の変動を吸収するようにし
ている。すなわち、第9図(A)で示すような原データ
に対して特徴を抽出するとac73 ウエイト0.7 cg(x1,
y1)となり、st3 ウエイト0.3 cg(x2,y2)となり、
これを規格化すると同図(B)で示すような識別空間図
が作成される。すなわち、第9図(B)において としてマッピングすると となる。識別空間へのマッピングとは、各特徴要素の重
心位置cgのxy座標をXY座標へ1次変換することである。
特徴空間としては第10図で示すように、原データ(A)
に対して特徴データは(B)のようになり、特徴空間は
同図(C)のように上側に要素が1つあり、下側の左右
に分れて要素が2個となっている。従って、分類コード
の基本は同図(D)に示すように各要素の値(たとえば
上側のアークの方向は8で大きさは0.3、左下の直線の
方向は3、右下の直線の方向は3)及び重心間の規定
(たとえば重心cg0とcg1,cg0とcg2の間の各yの差はα
以上、重心cg1とcg2のyの差はβ以下でxの差はγ以
上)として与えられ、大分類のための分類コードが作成
される。このような分類コードとしてはnが要素数とし
て与えられ、iが要素の項目として与えられ、項目とし
ては直線st,アークac,ループlpが与えられる。また、d
が要素(直線,アーク)の方向として与えられ、wがウ
エイト、x及びyが位置のxy座標(規格化された値)と
して与えられるので、たとえば第11図の特徴CH及び特徴
空間CSに対しては、n=4が与えられると共に、i0=a
c,i1=st,i2=lp,i3=stが与えられるのである1つの分
類コードは、 となる。
上述のような特徴抽出及び規格化の後にコードの比較
を行なうが、このコードパターンの比較によって文字候
補を作成する。この場合、例えば“2"と“2′”などは
形状的には同じであっても、この発明の特徴抽出ではま
ったく別のコードとして判断されることになる。このよ
うな違いをもたらす原因となるヒゲと称するノイズは線
の曲り角などに出る頻度が高いことが分っており、この
ようなヒゲを取り除いて新たに認識ルーチンに入れるこ
とにより、“2′”を“2"のコードで認識できるように
なり認識テーブルの省力化を図ることができる。
このようなヒゲの出る頻度の高いものを予め、ヒゲの
部分を含めて分離コードとして備えておき、このような
コードに該当したときには、第1図のステップS02,S12,
…S92のいずれかで再帰チェックが必要と判断され、そ
のコードのヒゲの部分(ブランチ)を削除してデータを
再構成し(ステップS4)、再び特徴抽出(ステップS3)
をやり直して分離コードと比較するようにしている。
次に、第3図(A)及び(B)を参照してこの発明に
おけるバランスチェックを説明する。
第3図(A)で示すようなサンプルデータに対しては
two=0.10,tw1=0.25,tw2=0.10,tw3=0.55のウエイト
が与えられ、同図(B)で示す大分類の想定パターンに
対してはw0=0.3,w1=0.15,w2=0.30,w3=0.25で与えら
れ、サンプルデータの各要素ウエイトが該当コードの標
準ウエイトに対して、設定されたマージン以内かをチェ
ックする。
但し、count{ }は{ }内の論理を満足すれば
“1"を示し、他の場合は“0"を示し、Swiは要素iの標
準ウエイト、twiはサンプルデータの要素iのウエイ
ト、ulは上限マージン(たとえば2.0)、llは下限マー
ジン(たとえば0.5)であり、cn0≦Ciの場合はリジェク
トと判定し、cn0>Ciの場合はOKと判定するようになっ
ている。なお、Ciは要素数毎に設定した有効範囲マージ
ンであり、たとえば要素数i Ci 2 0 3 1 4 1 5 2 6 2 7 2 となっている。次に、サンプルデータの要素ウエイトと
標準ウエイトとの絶対値偏差量を算出し、要素数での規
格化を行なった類似度として下式に従って評価する。
そして、Swt<Siの場合はOKと判断し、(但し、Si
基準値である。)Swt≧Siの場合はリジェクトとして判
断する。このようなバランスチェックは、特に要素数の
多いパターンに有効である。
次にストロークチェックについて説明すると、このス
トロークチェックは候補文字のそれぞれの要素に対して
始点を決定し、この始点に基づいた直線方向,アークの
回転方向,各要素のつながりの構造などをチェックする
ものである。ストロークチェックは先ず各要素に対して
それぞれの始点を決定し、直線に関しては始点から終点
への方向(8方向),アークに関しては始点から終点に
対する回転方向(CW,CCW),アークの始点から終点まで
の直線方向(8方向),各要素のつながり構造を基にス
トローク条件を作成し、条件に適さない候補文字には次
の詳細分類へ進行する資格を与えないようにする。例え
ば、ある文字2が第12図のように要素分解(0,1,2,)さ
れたとする。すなわち要素0をi0と表わすと、i0=アー
ク,i1=直線,i2=アークと言う構成となり、このストロ
ーク解析ではアークi0に対して上部端点を始点として回
転方向を決定する。ここでは時計回り(CW)である。要
素i0と要素i1,i2はそれぞれ一点で交わっており、要素i
0,i1,i2に関する分岐的は一致する。また、要素i1に関
しては、端点から分岐点への直線方向は第5図で示す方
向3,4であり、要素i2に関しては分岐点を始点としてア
ークの方向を見ると半時計回り(CCW)となっており、
以上の条件が全て満たされた場合のみOKとしている。す
なわち、要素i0の回転方向がCWであること(条件1)、
要素i0と要素i1,i2一点で交わっていること(条件
2)、要素i1の端点→分岐点への直線方向が3,4である
こと(条件3)、要素i2の分岐点を始点としてアークの
方向がCCWであること(条件4)が必要である。
最後に詳細評価について説明すると、アークの回転方
向の決定は第13図(A)で示すようなアークが与えられ
たとした場合、アークの中点mから端点stとedの線分の
中点をnとしてm→nのベクトル▲▼とst→edのベ
クトル▲▼の方向に着目する。そして、ベクトル▲
▼の方向をベクトル“1",ベクトル▲▼の方向
を“8"であるとし、ベクトル▲▼の方向をベクトル
▲▼の方向に一致させるために、第13図(B)にお
ける(ア)と(イ)の2つの経路を考えて近い方に採用
する。この場合、(ア)の経路の方が(イ)の経路より
近いことが分り、この場合は、(ア)の経路の方が近い
ので(ア)の回転方向、すなわち時計回りであると決定
する。もしベクトルV1とV2の方向が180゜異なっている
ときにはどちらの経路の方が近いのか決まらないのでこ
の場合に、第14図に示すように始点stから終点edに至る
各点の方向変化の和を求める。時計回りの変化を負、反
時計回りの変化を正と定義する。この側の場合は、4つ
の負の方向に対して正の方向が1つであるため、変化の
和は終点では−3となり、負であるので回転方向は時計
回りと決める。
更に、直線及びアークにおける変化点の極大点を、線
分をより細かく比較するという観点から求めている。線
図形の変化点抽出においては曲率の変化度合によって求
め方を変えなければならなく、細線化されたデータの1
ビット毎について見れば変化の連続である。この発明で
は、変化点の極大点を長さに対応したサンプル幅及び2
次微分的手法によって求めるようにしている。たとえば
第15図で示すように1〜17ビットのビット列があると
し、始点stpに対して反時計回りの極大点を求めるとし
た場合、第15図のビット番号列1〜17に対して線分の方
向及び5ビットサンプルの方向差を表に示すと、次の表
1のようになる。ここでは、サンプル幅として5ビット
を用いているが、このビット数は変化点にみる長さに応
じて予めテーブルとして複数の値が用意されている。例
えば4ビットのビット列の中での変化点をみるときに
は、サンプル幅として2ビットを用いる。表1におい
て、ビット番号1番の方向差が「1」という意味は、第
15図において1→5の5ビットをみたとき、1→2の方
向と4→5の方向の差をみて反時計回りに1つの方向差
があるためである。なお、ビット番号14番以降について
は5ビットがとれないため、方向差は生じない。
方向差データの同一極性(正、又は負)をとるグルー
プの真中の中央点を代表点として(表1では正のグルー
プしかなく、ビット番号6が正のグループの中央点(偶
数個のときには若い番号の方を中央とする)となり、 次式のnに6を代入して、 Sx=n+(サンプルビット)/2+1 =6+5/2+1 =9.5 となるが端数は切捨てて9とし、第15図の9番目の点を
正(反時計回り)の極大点としている。
アークの回転及び極大点の他に第16図(A)〜(G)
で示すような詳細分類を行なっている。
第16図(A)〜(C)について、第16図(F),
(G)のような数字を削除するために、共通の条件とし
但しPy:Pのy座標 Qy:Qのy座標 ly:y方向の長さ を設定する。つまりP点が上の方に上がりすぎたり、Q
点が上の方に上がりすぎたりしたものは上の条件(5)
により排除する。第16図(A)はl2が反時計回りのアー
クで、▲▼方向が“3"又は“4"であれば「2」と認
識する。また同図(B)は同図(D)のような数字と区
別する為、l2が時計回りのアークでかつの▲▼方向
が“3"か“4"のとき、又はl2が時計回りのアークでかつ
▲▼の方向が“3"“4"以外の場合にはl2/l1<0.25
であるときに「2」と認識する。さらに同図(C)は同
図(E)のような数字と区別する為に、l2が直線でかつ
▲▼(l2)の方向が“2"か“3"か“4"であるとき、
又はl2が直線でかつ▲▼(l2)の方向が“1"か“8"
である場合にはl2/l1<0.3であるときに「2」と認識す
る。
また、第19図(A)〜(F)に、類似する3組の数字
を示し、以下これらを区別するための詳細分類について
述べる。同図(A),(B)は人間では直ちに「5」と
「9」と認識できるが、今まで述べてきた手法のみでは
区別できない。同図(A)(B)はブランチが1本のみ
なので、線分の中央で2つに分離され2つのアークとな
る。一方、時計回り(負)の極大点を前述の手法で見つ
けてrとする。この場合、2つに分離する前のデータを
使って極大点を捜す。そこで、端点Pと極大点rの2点
間の距離を求め、更に変化点の変化の大きさもみる。第
19図(A)の場合には極大点近傍の変化はゆるやかであ
るが同図(B)では極大点のみが極端に変化、つまりと
がっている。これらの要件から「5」と「9」とを認識
するようにしている。
同図(C),(D)は「3」と「7」であるが、同図
(C)の下の線が長ければアークと2本の直線になり、
同図(D)と同じになる。この場合には分岐点qは付近
の微視的な方向をみることにより区別できる。即ち、 のようになっておれば「3」と認識し、 のようになっておれば「7」と認識する。第19図
(E),(F)も「7」と「3」であるが、2本に分離
処理されると共にアークと直線になる(第7図参照)。
この場合には、反時計回り(正)の極大点があるか否か
を前述の手法により捜し、もしあれば「3」と認識し、
なければ「7」と認識する。
このような手法で“0"〜“9"で想定される類似文字す
べてに対して詳細評価を行なう。
(発明の効果) 以上のようにこの発明のパターン認識方法によれば、
手書きの数字をループ,直線及びアークの要素に分解し
て特徴抽出を行ない、予め登録されている分類コードと
比較し、その比較結果で1文字に特定できないときに
は、ストロークやバランスのチェックをも行ない、それ
でも特定できないときには詳細分類にて更に類似文字に
対して、 1.長さの比 2.曲率の変化する点(極大点) 3.曲率の変化の大きさ 4.2点間の距離 5.分岐点付近の微視的な方向 などを調べることにより、能力の高い、確実な認識が可
能となる。
【図面の簡単な説明】
第1図はこの発明方法の全体動作を示すフローチャー
ト、第2図(A)及び(B)は手書数字の一例を示す
図、第3図(A)及び(B)はその規格化された特徴要
素を示す図、第4図は直線を説明するための図、第5図
はこの発明のチェーンコードを説明するための図、第6
図はアークの開き方向及び開き量を説明するための図、
第7図は1筆書の分離を説明するための図、第8図はこ
の発明の特徴抽出の動作例を示すフローチャート、第9
図(A),(B)及び第10図はこの発明の規格化を説明
するための図、第11図はこの発明の特徴空間を説明する
ための図、第12図〜第19図(A)〜(F)は詳細分類を
説明するための図である。 w0,w3,tw0,tw2,……アーク、w1,tw1……直線、w2,tw2…
…ループ、st……始点、ed……終点。
フロントページの続き (72)発明者 坪田 浩貴 兵庫県姫路市下手野35番地 グローリー 工業株式会社内 (72)発明者 魚崎 勝司 兵庫県神戸市垂水区桃山台1―8―12

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】文字パターンを前処理してループ,直線及
    びアークの3要素に対応づける特徴抽出を行ない、前記
    特徴抽出されたそれぞれの要素について規格化を行な
    い、特徴をコード化して予め登録されている分類コード
    と前記規格化された各要素とを比較すると共に、前記分
    類コードに、雑音を含んだコードを用意しておき、前記
    比較において前記雑音を含んだコードが候補となった場
    合は雑音部分を除去し、再度前記特徴抽出を行なって前
    記比較を行ない、その比較結果に基づいてバランスチェ
    ック及びストロークチェックを行ない、更に前記アーク
    の回転方向や直線の方向に基づいて前記3要素のうちの
    特定要素との長さの比等の詳細分類を行なって前記文字
    パターンを認識する文字パターン認識方法において、Sw
    iを前記各要素iの標準ウエイト、twiを前記文字パター
    ンの各要素iのウエイトとして求められる の基準値Siに対する大小によって前記バランスチェック
    を行ない、前記直線に関するその始点から終点への方向
    と、前記アークに関するその始点から終点に対する回転
    方向及び直線方向と、前記各要素のつながり構造とによ
    ってストローク条件を作成し、前記ストロークチェック
    を行なうようにしたことを特徴とする文字パターン認識
    方法。
JP62274796A 1987-10-30 1987-10-30 文字パターン認識方法 Expired - Lifetime JP2619426B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62274796A JP2619426B2 (ja) 1987-10-30 1987-10-30 文字パターン認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62274796A JP2619426B2 (ja) 1987-10-30 1987-10-30 文字パターン認識方法

Publications (2)

Publication Number Publication Date
JPH01116781A JPH01116781A (ja) 1989-05-09
JP2619426B2 true JP2619426B2 (ja) 1997-06-11

Family

ID=17546685

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62274796A Expired - Lifetime JP2619426B2 (ja) 1987-10-30 1987-10-30 文字パターン認識方法

Country Status (1)

Country Link
JP (1) JP2619426B2 (ja)

Also Published As

Publication number Publication date
JPH01116781A (ja) 1989-05-09

Similar Documents

Publication Publication Date Title
US6850645B2 (en) Pattern recognizing apparatus
US20150339525A1 (en) Process of handwriting recognition and related apparatus
US20100189316A1 (en) Systems and methods for graph-based pattern recognition technology applied to the automated identification of fingerprints
Yamada et al. Cursive handwritten word recognition using multiple segmentation determined by contour analysis
Srihari et al. A system to locate and recognize ZIP codes in handwritten addresses
EP0079251B1 (en) Geometric character recognition using skeleton and stroke width representation
JP2007058882A (ja) パターン認識装置
Kerrick et al. Microprocessor-based recognition of handprinted characters from a tablet input
JP2619427B2 (ja) 文字パターン認識方法
JP2619426B2 (ja) 文字パターン認識方法
Pfister et al. Recognition of Handwritten ZIP Codes in a Real—World Non-Standard-Letter Sorting System
Tou et al. Automatic recognition of handwritten characters via feature extraction and multi-level decision
KR19980058349A (ko) 영상정보를 이용한 사람 식별 방법
Bushofa et al. Segmentation and Recognition of Printed Arabic Characters.
Rahman et al. A complete Bengali OCR: A novel hybrid approach to handwritten Bengali character recognition
KR19980025571A (ko) 규칙적인 잡음을 이용한 한글 인식 시스템
Casas et al. Handwritten character recognition using some (anti)-diagonal structural features
JP2007026470A (ja) パターン認識装置
JPH06111070A (ja) 文字認識装置
JP2930996B2 (ja) 画像認識方法および画像認識装置
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JP3391223B2 (ja) 文字認識装置
KR100206827B1 (ko) 문자 인식을 위한 한글/영문 판별방법
Amara et al. New mechanisms to enhance the performances of arabic text recognition system: feature selection
JPH0636174B2 (ja) 文字列対応線分抽出方式