JPS58200378A - 文字パタ−ンの分類装置 - Google Patents

文字パタ−ンの分類装置

Info

Publication number
JPS58200378A
JPS58200378A JP57083794A JP8379482A JPS58200378A JP S58200378 A JPS58200378 A JP S58200378A JP 57083794 A JP57083794 A JP 57083794A JP 8379482 A JP8379482 A JP 8379482A JP S58200378 A JPS58200378 A JP S58200378A
Authority
JP
Japan
Prior art keywords
character
character pattern
processing means
coordinate axes
contribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57083794A
Other languages
English (en)
Other versions
JPH026112B2 (ja
Inventor
Norihiro Hagita
紀博 萩田
Seiichiro Naito
内藤 誠一郎
Isao Masuda
功 増田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP57083794A priority Critical patent/JPS58200378A/ja
Publication of JPS58200378A publication Critical patent/JPS58200378A/ja
Publication of JPH026112B2 publication Critical patent/JPH026112B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/184Extraction of features or characteristics of the image by analysing segments intersecting the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (1)発明の属する分野の説明 本発明は1文字パターンの分類装置、特に光電変換によ
って得られた文字パターンを2値化した文字パターンに
対し1手書き漢字のような多くの字種、多くの手書き文
字変形をもつ文字対象を効率よく分類するために、2次
元的な文字゛線構造の分布から文字パターンの特徴を抽
出し、入力文字パターンを分類する文字パターンの分類
装置に関するものである。゛(匂 従来の技術の説明 従来、漢字を含む文字パターンの認識装置または分類装
置として1手書き漢字を対象として、2値化と位置及び
大きさの正規化と、平滑化゛とを行゛つた文字パターン
を、水平軸及び垂直軸の2門□標軸方向から観測し、該
座標軸上の各位置における該座標軸に直交する方向の文
字部を横切る文字線数を計数口、この情報から特徴ベク
トルパターンを作成し、すでに蓄えておいた各文字の特
徴辞書テーブルとのマツチングをとり1文字パターンの
分類を行う方式が知られている。しかしながら。
この方式では、水平軸ないしは垂直座標軸等の1次元座
標軸方向へ1文字の線密度を投影するため。
文字パターンの分類に必要な2次元的な文字線構造の分
布から得られる特徴を十分に抽出できないため、この特
徴だけでは十分な分類能力を実現しえないという欠点が
ある。
また1手書き漢字を対象とした文字認識では。
2値化9位置及び大きさの正規化、平滑化を行った文字
パターンを、粗いメツシュの矩形領域に分割して、各矩
形領域内に存在する文字部に対して水平軸と垂直軸の2
座標軸方向から観測し、該座標軸上の各位置における該
座−゛紬に直交する方向の文字部を横切る文字線数を計
数し、この情報から特徴ベクトルパターンを作成し、す
でに蓄えておいた各文字の特徴辞書テーブルとのマツチ
ングをとシ9文字パターンの分類を行う方式が知られて
いる。しかしながら、この方式についても、各粗いメツ
シュ領域内の文字線構造の大まかな複雑さのちがいを区
別できるものの9文字線の方向成分、接続関係等の、よ
り詳細な文字線構造のちがいを表わす情報がないため、
類似文字が多くかつ文字線の位置ずれ等の手書き変形も
多い文字対象を効率よく認識できないという欠点があっ
た。
従って、上記各方式では手書き漢字などの字種も多く変
形の大きい文字集合に対しては、必ずしも十分な認識を
行うことが期待し難い。
(3)発明の目的 本発明は、従来技術によシ、2値化9位置及び大きさの
正規化9文字枠取多処理、平滑化を行った文字パターン
の各文学線の方向成分、接続関係等の文字線構造につい
ての情報を黒点の方向寄与度をもとにして−yA”’J
、さらに文字パターンを粗いメツシュの矩形領域に分割
し、各矩形領域内の文字線構造情報を文字線の方向別に
計数する装置を提供し、多字種、多変形をもつ手書き漢
字を含む手書き文字パターンを、効率よく分類すること
を目的としている。
(4)発明の構成および作用の説明 以下に本発明を9図面を用いて詳細に説明する0第1図
は9本発明による文字パターンの分類装置の一実施例の
ブロック図である。同図において。
1は記憶回路であシ、はじめに2値化された手書き文字
パターンを記憶しておく。
2は、この2値化された文字パターンを入力し。
既知の重心及び2次モーメントを用いて位置及び大きさ
の正規化処理を行う文字パターンの位置及び大きさの正
規化処理装置である。
3は、正規化処理装置2によって得られ九NXNメツシ
ュの正規化文字パターンを入力し9手書き文字の外郭付
近で起きるストロークの極端な突き出しに対処するため
1重心を中心とするWメツシュの正方領域の文字枠取シ
枠で文字を枠取シし。
枠外にはみ出た文字部を除去する枠取)処理装置である
4は、枠取多処理装置3によって得られた文字枠取シ後
の文字パターンを入力し9文字線輪郭部分の黒点の1メ
ツシユの凹凸をそれぞれ埋めまたは取シ除く平滑化処理
装置である。
5は9本発明の主要部を力す特徴抽出装置である0該装
置5においては、平滑化処理を行った文字パターンを入
力し、該文字パターンの各黒点から水平方向を基準にし
てM方向(たとえば8方向の場合には、  0’: 4
5’: 90’: 135二180’:225’:27
o’:at5°の8方向)に触手を伸ばした時に。
各方向別に連続する黒点数を計数して、黒点の方向寄与
度を求める処理を行い、該方向寄与度パ抽出処理によっ
て、方向寄与度でラベル付けされた文字パターンについ
て、P個の、粗い例えば正方メツシュ領域に等分割し、
各粗いメツシュ領域内に存在する文字部に対して、少な
くとも2座標軸の複数座標軸方向から観測し、該座標軸
上の各位置における該座標軸に直交する方向に走査した
場合に、横切る文字線の方向寄与度を方向成分別に計数
して、この値を文字パターンの各文字線の方向と接続関
係についての2次元的なひろがり分布を表わす特徴とし
て抽出する特徴抽出装置である。
6は、装置5によって割り当てられた各粗いメツシュ領
域内の方向成分別の方向寄与度の計数値をもとに9文字
パターンを分類するための特徴テーブルを作成し、該手
段によって作成した特徴テーブルをもとにすでにたくわ
えておいた各文字の特徴辞書テーブルとマツチングをと
如9文字パターンの分類を行う分類処理装置である。
次に、特徴抽出装置5の具体例として、8方向(o;4
s−9o’: 135’: tso’: 225”: 
270’: 315゜の8方向で、それらの方向にそれ
ぞれ1.2.3゜4、5.6.7.8の番号を付与する
)に触手を伸ばし黒画素の方向寄与度を求め1文字パタ
ーンを分類する場合を例にとって、2つの方法を説明す
る。
その第1の方法は以下の通シである。平滑化処理装置4
によって得られたWシWメツシュの文字パターン内の文
字部の任意の一素の方向寄与度盛は。
@ ”’ ((!l 瞥G!+ ”’ + <18 )
なる8次元ベクトルで表わされる。ここで(J+82+
・・・、a8は8方向それぞれの方向寄与度成分で、該
画素から8方向に触手を伸ばして、各方向別に得られる
黒点連結長/7((=1.2.・・・8)を用いて。
−例として なる式で表わされる。なおこの式には、ユークリッド距
離以外の他の距離も適用可能である。該手段によって得
られる方向寄与度1がラベル付けされた文字パターンを
、P個の粗い例えば正方メツシュ領域に等分割し、第2
番目(1,2,・・・p、・・・、P)粗いメツシュ領
域内に存在する文字部に対して。
水平軸方向を基準にして、4方向座標□軸(水平軸。
+45°方向軸、垂直軸、−45°方向軸の4座標軸で
あシ、それぞれに1.2.3.4  の番号を付与する
ものとする)から観測し、4方向座標軸(A=l。
2、3.4 )上の位省’j (A=1.3では/=1
.2.・・・。
W、A=2.4では/=1.2.・・・、Wとなる。と
こでW’= 2 W )で、該座標軸に直交する方向に
走査して、得られる方向寄与度密度りj、は。
g41.= (ttl+ g21・・・Ifllffl
’llF!’I・・・ 、り8′)pなる16次元ベク
トルで表わされる。
ここで+  IF1+l!t・・・1g8 は該走査に
よシ文字部と悔回交叉した場合9%(%≦情)回目の交
叉時の白点から黒点に変化した該黒点(走査開始時は直
前の画素が白点と仮定する)の方向寄与度1.=(a1
%。
a2%、・・・+a8%)をそれぞれ、方向成分別に累
積した方向寄与度密度のベクトルの各要素で、(方向成
分の該密度g4は 一! f(−8(% %−1 で表わされる。
また+  g1’+1FII’+・、’ +(Il+’
は該走査−より0文字部と愼回交叉した場合、S回目の
交叉時の黒点から白点に変化した該黒点の方向寄与度ベ
クトル8%、、1**(i 11B + J s ”’
 + a8g’ )  をそれぞれ、方向成分別に累積
した方向寄与度密度のベクトルの各要素であシ。
1方向成分の核密度g1は 1 g1′=Σad %−1 で表わされる。
従って9文字パターンの特徴ベクトルGは@ = (’
17111劃IH,・・・Il]71W111zu劃2
Hツ・・・、譬2W″htan + tlszx + 
・−+4Fsvt +04tx +’D421 +・−
+ ?4w’t +ダ112.・・・  、ダ1帽ケ−
12,・・・ 、ダ2,1゜fats l ”’  T
′g3w2 pu412 + ””  p fiw’z
 j・・・、’QAjp +・・・ Lg4W’−P 
)で表わされる。このようにして表わされる文字パター
ンの特徴ベクトルΦを複数の要素ごとに平均化した値を
文字パターンの特徴として特徴テーブルを作成し、公知
の識別関数D(G)  を求め文字パターンを分類する
次に、第2の方法は以下の通シである。前記のWxWメ
ツシュの文字パターン内の文字部の任意の画素の方向寄
与度すは。
To=(bt、b鵞−bs、b4) なる4次元ベクトルで表わされる。ここで、bl。
bs + bs + b4は4方向それぞれの方向寄与
度成分で1前記手段によって求まる該画素の黒点連結長
!4((=1.2.・・・、8)を用いて、1例として
なる式で表わされる。なお、この弐にはユークリッド距
離以外の距離も適用可能である。該手段によって得られ
る方向寄与度すがラベル付けされた文字パターンをP個
の粗い例えば正方メツシュ領域に等分割し、第9番目の
粗いメツシュ領域内に存在する文字部に対して、水平軸
方向を基準にして、4方向座標軸(水平軸、+45@方
向軸、垂直軸。
−45°方向軸の4座標軸で、それぞれ1.2.3゜4
の番号を付与する)から観測し、4方向座標軸(A=1
.2.3.4)  上の位置j (A=1.3ではj=
1、2. ・、 W、  A=2.4−t’は/=1.
2. ・、 w’となる。ここでW’=2W)で、#座
標軸に直交する方向に走査して、得られる方向寄与度密
度/h41.はIh43p ” (’1 * ’M m
 G #’4 @ ’1′、’l’+’3’+ ’4’
) jなる8次元ベクトルで表わさ介る。
ここでe  ’1+’念、’s、’4は該走査にょシ9
文字部と悔回交叉した場合0%(s≦fn)回目の交叉
の白点から黒点に変化した該黒点(走査開始時は直前の
画素が白点と仮定する)の方向寄与度To%(bt%。
b*s+bss+bas)をそれぞれ方向成分別に累積
した方向寄与度密度のベクトルの各要素であり、を方向
成分(t=1.2.3.4)の該密度匂はで表わされる
また1  ’ 1’g ’ 2′、’ 3′s ’ 4
’は該走査によシ8文字部と餌口交叉した場合、s回目
の交叉時の黒点から白点に変化した該黒点の方向寄亨度
Tog’=(bs%’、bxs’+bes’ 、 bu
/ )をそれぞれ、方向成分別に累積した方向寄与度密
度のベクトルの各要素でありst方向成分の該密度J、
/は。
で表わされる。
従って9文字パターンの特徴ベクトル■はH=  (1
hxs*  、 Ih1!s  、  。+ 、 )h
swx  、h*11 、 /hu 1 、  ■−,
ノhtvr’l 。
/ASII  、/hs21 、  、−、Ih1lI
vx  、/hass  、 ノha1 、  −−−
、Aavt。
/hxsz  、lhu意  、  … 、jhsW2
 + ノhxx鵞 、A2o  、   ・・・、/h
zvt’z H7hs 1m  、/hsu  、  
… 、1hsW2 、 ノhax2  + ノh4u 
 、  o・、1h4y’s  。
°°°  夛 ノ1し旬p 、 ・・・ 、 IFI4
W’P )で表わされる。このようにして表わされる文
字パターンの特徴ベクトル■を複数の要素ごとに平均化
した値を文字パターンの特徴として特徴テーブルを作成
し、公知の識別関数D (IFI)を求め1文字パター
ンを分類する。
第2図に、記憶回路1.正規化処理装置29文字枠取り
処理装置3.平滑化処理装置4.の動作例を示す。第2
図囚は、記憶回路1にはじめにたくわえられている2値
化された文字パターンの例である。第2図■は、第2図
(2)の文字パターンに対し、正規化処理装置2によシ
9位置及び大きさの正規化を行った文字パターンの例で
ある。第2図(Oは、第2図(6)の文字パターンに対
し9文字枠取シ処理装置3によシ9文字枠取り処理を行
った文字パターンの例である。第2図(2)は、第2図
(Oの文字パターンに対し、平滑化処理装置4によ多。
平滑化を行った文字パターンの例である。
第3図は装置5内の方向寄与度を求める動作を説明する
説明図であ)、第3図(4)は9文字パターンの黒点の
黒点連結長を求めるための触手を伸ばす方向を矢印で示
したものである。第3図(恥は文字パターンの黒点8か
ら第3図(4)で示すように8方向に触手を伸ばし、各
方向の黒点連結長を矢印の長さで表わしたものである。
第4図は、方向寄与度の値を計数して特徴抽出する動作
の例を説明する説明図であ、b、wxwメツシュの文字
枠取シ領域内を、粗い正方メツシュ領域9−1.9−2
.・・・、 9−p、・・・、9−Pに分割した例であ
る。
第5図は、第4図で説明したWxWメツシュの文字枠取
シ領域^の粗い正方メツシュ領域9−jから方向寄与度
の値を計数する動作を説明する説明図であシ、第5図(
4)は方向寄与度密度を求めるために観測する4、方向
座標軸と各軸内の位置座標の動作範囲とを示した例であ
る。第5図囚の軸10−1は水平方向座標軸、軸10−
2は+45″方向座標軸、軸10−3は垂直方向座標軸
、軸10−4は一45°方向座標軸を示す。第5図の)
は水平方向座標軸上の位置j=joで座標軸に直交する
方向に走査して文字部と1回交叉した場合、黒点11−
1は白点から黒点に変化した該黒点の例を示し、黒点1
1−2は黒点から白点に変化した該黒点の例を示したも
のである。第5図(6)の水平方向座標軸上の位置i 
= ioにおける前記第1の方法で得られる方向寄与度
密度管  の1例を示すと。
 jop #1jO,= (0,3110,21+0.2110.
2710.8410.10.0.10.0.13.0,
0.24゜0.26.0.31,0.88,0,0.0
)。
となシ、また前記第2の方法で得られる方向寄与度密度
1に+7゜、の1例を示すと。
ノに1 jO,=  (0,8910,2410,24
10,3110,88゜0.24,0.26.0.31
)。
となる。この方向寄与度密度のベクトルの値は粗い正方
メツシュ領域9−p内で水平方向座標軸の該位置j=i
o”’C座標軸に直交1.、、!6方向に存在す6文字
線の方向と方向別の文字−密度とを表わしている。前記
第2の方法から求められたA s7゜、を例にとれば*
 IkljOpで41とJL1′の値が大きいことから
該粗メツシユ領域の該位置の走査方向には水平の文字線
成分が存在することが容易にわかるという利点をもつ。
また、前記第1の方法を用いれば、端点、交叉点、屈曲
点等の文字の詳細な幾何学的特徴も抽出できるという利
点をもつ。
これによシ、装置5に示した特徴抽出は、幾何学的特徴
に着目する手書き漢字等の文字認識に有効な手段となる
なお、特徴抽出装置5に示した特徴抽出手段と従来から
知られている手段、たとえば文字パターンを複数座標軸
方向から観測し、該座標軸上の各位置において該座標軸
に直交する方向に走査し。
横切る文字線の方向寄与度の値を方向成分別に計数する
特徴抽出手段とを併用して1個々の特徴を分類して得ら
れる複数個のカテゴリからその和集合を選び出し1手書
き文字パターンを分類するよ、:1・ 11 うにすると、様々な手書き変形に対し、さらに一層対処
できる分類能力の高い文字認識システムを実現できる。
(5)効果の説明 以上説明したように1本発明の文字パターンの分類装置
は9文字パターン内の各黒点から例えば0’: 45’
: 90’: xas’: 1oo’: 225’: 
2ro”、 315°の8方向のように複数方向に触手
を伸ばし、各方向別の黒点連結数を計数し、該黒点の方
向寄与度を求め1次に文字パターンを粗いメツシュの矩
形領域に分割し、各矩形領域内を複数座標軸方向から、
観測し、座標軸上の各位置で座標軸に直交する方向の文
字線の方向寄与度を計数するため9文字線の方向や接続
関係等の2次元的な幾何学的特徴を簡易な手法で抽出で
きるだけでなく9文字線のかすれ、つぶれ等による手書
き変形にも強く、多字種、多変形な手書き漢字等を含む
文字対象を効率よく分類できるという利点をもつ。
【図面の簡単な説明】
第1図は9本発明による文字パターンの分類装置の一実
施例ブロック図、第2図は第1図に示す回路1.および
装置2.乃至4による処理の態様を説明する説明図、第
3図乃至第5図は本発明の主要部である装置5の特徴抽
出手段の機能説明図。 図中1は記憶回路、2は文字パターン正規化処理装置、
3は文字パターン枠取)処理装置、4は平滑化処理装置
、5は文字パターンの特徴抽出装置、6は文字パターン
の分類処理装置、7は文字枠取シ枠、8は文字パターン
内の黒点、  9−1゜9−2.・・・、9−p、・・
・、9−Pは分割された正方メツシュ領域、10−1.
10−2.10−3.10−4は方向寄与度密度観測の
座標軸、11−1.11−2は文字走査時に黒点から白
点または白点から黒点に変化する該黒点を示す。 特許出願人 日本電信電話公社 代理人弁理士゛ 森 1)  寛 9Q″ (7) (A) オ ■ (B) 3 図

Claims (1)

    【特許請求の範囲】
  1. 2値化された文字パターンに対して2文字部の重心と2
    次モーメントを求めて、位置及び大きさの正規化処理を
    行う手段と、該正規化処理手段によって得られた文字パ
    ターンを文字枠取シ枠で枠取シする処理手段と、該枠取
    多処理手段によって得られた文字パターンに平滑化処理
    を行う平滑化処理手段と、該平滑化処理手段によって得
    られた文字パターンの全黒画素から予め定めた複数の方
    向に触手を伸ばして各方向別に得られる黒点列の長さか
    ら与えられる方向寄与度を求める方向寄与度抽出手段と
    、該平滑化処理手段によって得られた文字パターンを粗
    いメツシ二の矩形領域に分割して、当該各矩形領域内に
    存在する文字部に対して、少なくとも2座標軸の複数座
    標軸方向から観測し、該座標軸上の各位置における核座
    標軸に直交する方向に走査し、横切る文字線の方向寄与
    度の値を方向成分側に計数する特徴抽出手段とをそなえ
    、該特徴抽出手段からの出力情報を少なくとも利用し9
    文字パターンを分類するよ□うにしたことを特徴とする
    文字パターン分類装置。
JP57083794A 1982-05-18 1982-05-18 文字パタ−ンの分類装置 Granted JPS58200378A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57083794A JPS58200378A (ja) 1982-05-18 1982-05-18 文字パタ−ンの分類装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57083794A JPS58200378A (ja) 1982-05-18 1982-05-18 文字パタ−ンの分類装置

Publications (2)

Publication Number Publication Date
JPS58200378A true JPS58200378A (ja) 1983-11-21
JPH026112B2 JPH026112B2 (ja) 1990-02-07

Family

ID=13812550

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57083794A Granted JPS58200378A (ja) 1982-05-18 1982-05-18 文字パタ−ンの分類装置

Country Status (1)

Country Link
JP (1) JPS58200378A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6448180A (en) * 1987-08-19 1989-02-22 Fuji Electric Co Ltd Feature extracting circuit

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6448180A (en) * 1987-08-19 1989-02-22 Fuji Electric Co Ltd Feature extracting circuit

Also Published As

Publication number Publication date
JPH026112B2 (ja) 1990-02-07

Similar Documents

Publication Publication Date Title
Wenyin et al. From raster to vectors: extracting visual information from line drawings
US5058182A (en) Method and apparatus for handwritten character recognition
JPH05500874A (ja) ディジタル化書類における選択本文の自動抽出のための多角形準拠式方法
CN110766697B (zh) 一种界面草图的图形界面控件图像识别的方法和装置
JPH06162198A (ja) パターン認識装置
JPS58200378A (ja) 文字パタ−ンの分類装置
JP4390523B2 (ja) 最小領域による合成画像の分割
JP3104355B2 (ja) 特徴抽出装置
JP3365941B2 (ja) 文字パターン認識方法及びその装置
JPS634229B2 (ja)
JPS634231B2 (ja)
JPH0159627B2 (ja)
JPS6038755B2 (ja) 特徴抽出方式
JP2575402B2 (ja) 文字認識方法
JPH022189B2 (ja)
JPS622382A (ja) 画像処理方法
JPS6238752B2 (ja)
JP2655598B2 (ja) 線分抽出方式
JPS62125485A (ja) 文字認識方式
JPS5837780A (ja) 文字認識方式
KR940001225B1 (ko) 패턴 인식방법
JPS62154079A (ja) 文字認識方式
JPH0545991B2 (ja)
JPS6232587A (ja) 文字認識方式
JPH02166583A (ja) 文字認識装置