JPS634229B2 - - Google Patents

Info

Publication number
JPS634229B2
JPS634229B2 JP56046659A JP4665981A JPS634229B2 JP S634229 B2 JPS634229 B2 JP S634229B2 JP 56046659 A JP56046659 A JP 56046659A JP 4665981 A JP4665981 A JP 4665981A JP S634229 B2 JPS634229 B2 JP S634229B2
Authority
JP
Japan
Prior art keywords
character
character pattern
directional
contribution
coordinate axis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56046659A
Other languages
English (en)
Other versions
JPS57164376A (en
Inventor
Norihiro Hagita
Isao Masuda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP56046659A priority Critical patent/JPS57164376A/ja
Publication of JPS57164376A publication Critical patent/JPS57164376A/ja
Publication of JPS634229B2 publication Critical patent/JPS634229B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
本発明は、文字パターン分類装置、特に光電変
換によつて得られた文字パターンを2値化した文
字パターンに対し、手書き漢字のような、多くの
字種、多くの手書き変形をもつ文字対象を効率よ
く分類するため、文字パターンの各文字線の方向
成分と該方向成分別の複雑さの分布とから文字パ
ターンの特徴を抽出し、入力文字パターンを分類
する文字パターン分類処理装置に関するものであ
る。 従来、漢字を含む文字パターンの認識装置また
は分類装置として、手書き漢字を対象として2値
化、位置及び大きさの正規化、平滑化などを行つ
た文字パターンについて、水平軸及び垂直軸の2
座標軸方向から観測し、該座標軸上の各位置にお
ける該座標軸に直交する方向の文字部を横切る文
字線数を計数し、この情報から特徴ベクトルパタ
ーンを作成し、すでに蓄えておいた各文字の特徴
辞書テーブルとのマツチングをとり、文字パター
ンの分類を行う方式が知られる。しかしながら、
この方式で抽出される各座標軸上の各位置で計数
される文字線密度は字種のちがいによる文字線の
大まかな複雑さのちがいを区別できるものの、計
数時に横切る文字線の方向成分と成分別の文字線
密度となどの文字線構造のちがいを表わす情報が
ないため、類似文字が多く文字線の位置ずれなど
の手書き変形も多い文字対象については効率よく
分類できないという欠点があつた。このため、上
記の方法は手書き漢字などの字種も多くかつ変形
の大きい文字集合に対しては必らずしも十分な分
類を行なうことが期待し難い面をそなえている。 本発明は、いわば従来技術によつて2値化、位
置及び大きさの正規化、文字枠取り処理、平滑化
などを行つた文字パターンについて、当該パター
ンの各文字線の方向成分と成分別の文字線密度に
ついての情報を黒点の方向寄与度とをもとにして
求め、さらにこれらの情報を文字線の方向成分別
に計数する装置を提供し、多字種、多変形をもつ
手書き漢字を含む手書き文字パターンを効率よく
分類することを目的としている。以下、図面を用
いて詳細に説明する。 第1図は、本発明による文字パターンの分類装
置の一実施例のブロツク図である。第1図におい
て、1は記憶回路で、はじめに2値化された手書
き文字パターンを記憶しておく回路である。2は
この2値化された文字パターンを入力し、例えば
従来まで知られている重心と2次モーメントとを
用いて位置及び大きさの正規化処理を行う文字パ
ターンの位置及び大きさの文字パターン正規化処
理装置である。3は装置2によつて得られたN×
Nメツシユの正規化文字パターンを入力し、手書
き文字の外郭付近で起きる文字線の極端なつき出
しに対処するため、重心を中心とする文字枠取り
枠Wメツシユの正方領域で文字を枠取りし、枠外
にはみ出した文字部を除去する文字パターン枠取
り処理装置である。4は装置3によつて得られた
文字枠取り後の文字パターンを入力し、文字線輪
郭部分の黒点の1メツシユの凹,凸をそれぞれう
めあるいは取り除く平滑化処理装置である。5は
本発明の主要部をなす文字パターン特徴抽出装置
で、平滑化処理を行つた文字パターンを入力し、
該文字パターンの各黒点から水平軸方向を基準に
してM方向(たとえば、8方向の場合には、0゜,
45゜,90゜,135゜,180゜,225゜,270゜,315゜の8
方向)
に触手を伸ばした時に各方向別に連続する黒点数
を計数して、黒点の方向寄与度を求める操作を行
い、該操作によつて、方向寄与度でラベル付けさ
れた文字パターンに対して、少なくとも2座標軸
の複数座標軸方向から観測し、該座標軸上の各位
置における該座標軸に直交する方向に走査した場
合に、横切る文字線の方向寄与度を方向成分別に
計数して、この値を文字パターンの各文字線の長
さと方向との分布を表わす特徴として抽出する文
字パターン特徴抽出装置である。 6は、装置5によつて割り当てられた方向成分
別の方向寄与度の計数値をもとに、文字パターン
を分類するための特徴テーブルを作成し、該手段
によつて作成した特徴テーブルをもとに、すでに
たくわえておいた各文字の特徴辞書テーブルとマ
ツチングをとり、文字パターンの分類を行う文字
パターン分類装置である。 装置5の具体例として、8方向(0゜,45゜,90゜,
135゜,180゜,225゜,270゜,315゜の8方向でそれら

方向にそれぞれ、1,2,3,4,5,6,7,
8の番号を付与する)に触手を伸ばし、画素の方
向寄与度を求め、文字パターンを分類する場合を
例にとつて説明する。 その第1の方法は以下の通りである。装置4に
よつて得られたW×Wメツシユの文字パターン内
の文字部の任意の画素の方向寄与度aはa=(a1
a2,……,a8) なる8次元ベクトルで表わされる。ここで、a1
a2,……,a8は8方向それぞれの方向寄与度の成
分で、該画素から8方向に触手を伸ばして、各方
向別に得られる黒点連結長li(i=1,2,……,
8)を用いて、1例としてai=li/√1 22 2+…
…+l8 2 なる式で表わされる。このaiには、ここで示した
ユークリツド距離以外の距離を適用することが可
能である。該手段によつて得られる方向寄与度a
がラベル付けされた文字パターンに対し、水平軸
方向を基準にして、4方向座標軸(水平軸、+45゜
方向軸、垂直軸、−45゜方向軸の4座標軸で、それ
ぞれ1,2,3,4の番号を付与する)から観測
し、k方向座標軸(k=1,2,3,4)上の位
置j(k=1,3ではj=1,2……,W,k=
2,4ではj=1,2,……,W′となる。ここ
でW′=2W)で該座標軸に直交する方向に走査し
て、得られる方向寄与度密度gkjはgkj=(g1,g2
……,g8,g1′,g2′,……,g8′) なる16次元ベクトルで表わされる。ここで、g1
g2,……,g8は該走査により、文字部とm回交叉
した場合、n(n≦m)回目の交叉時の白点から
黒点に変化した該黒点(走査開始時は直前の画素
が白点と仮定する)の方向寄与度 ao=(a1o,a2o,……,a8o) をそれぞれ方向成分別に累積した方向寄与度密度
のベクトルの各要素であつて、i方向成分の該密
度giは gin Σn=1 aioで表わされる。また、g1′,
g2′,……,g8′は該走査により、文字部とm回交
叉した場合、n回目の交叉時の黒点から白点に変
化した該黒点の方向寄与度ベクトル ao′=(a1o′,a2o′,……,a8o) をそれぞれ、方向成分別に累積した方向寄与密度
のベクトルの各要素であつて、i方向成分の該密
度gi′は gi′=n Σn=1 aio′で表わされる。 従つて、文字パターンの特徴ベクトルGは G=(g11,g12,……,g1w,g21,g22,……,
g2w′,g31,g32,……,g3w,g41,g42,……,
g4w′) で表わされる。このようにして表わされる文字パ
ターンの特徴ベクトルGの複数の要素ごとに平均
化した値を文字パターンの特徴として特徴テーブ
ルを作成し、公知の識別関数D(G)を求め文字
パターンを分類する。 次に第2の方法は以下の通りである。前記のW
×Wメツシユの文字パターン内の文字部の任意の
画素の方向寄与度bは b=(b1,b2,b3,b4) なる4次元ベクトルで表わす。ここでb1,b2
b3,b4は4方向それぞれの方向寄与度の成分で、
前記手段によつて求まる該画素の黒点連結長li(i
=1,2,……,8)を用いて、1例としてbi
(li+li+4)/√(152+(262+(
372+(4
+l82なる式で表わされる。このbiには、ここで
示したユークリツド距離以外の距離を適用するこ
とが可能である。該手段によつて得られる方向寄
与度bがラベル付けされた文字パターンに対し、
水平軸方向を基準にして、前記の4方向座標軸か
ら観測し、k方向座標軸(k=1,2,3,4)
上の位置j(k=1,3ではj=1,2,……,
W,k=2,4ではj=1,2,……,W′とな
る)で、該座標軸に直交する方向に走査して得ら
れる方向寄与度密度hkjはhkj=(h1,h2,h3,h4
h1′,h2′,h3′,h4′) なる8次元ベクトルで表わされる。ここで、h1
h2,h3,h4,は該走査により、文字部とm回交叉
した場合、n(n≦m)回目の交叉時の白点から
黒点に変化した該黒点(走査開始時は直前の画素
が白点と仮定する)の方向寄与度 bo=(b1o,b2o,b3o,b4o) をそれぞれ方向成分別に累積した方向寄与度密度
のベクトルの各要素で、t方向成分(t=1,
2,3,4)の該密度hiは htn Σn=1 btoで表わ
される。また、h1′,h2′,h3′,h4′は該走査によ
り、文字部とm回交叉した場合、n回目の交叉時
の黒点から白点に変化した該黒点の方向寄与度 bo′=(b1o′,b2o′,b3o′,b4o′ をそれぞれ、方向成分別に累積した方向寄与度密
度のベクトルの各要素で、t方向成分の該密度
ht′は h′tn Σn=1 bto′で表わされる。 従つて、文字パターンの特徴ベクトルHは、H
=(h11,h12,……,h1w,h21,h22,……,h2w
h31,h32,……,h3w,h41,h42,……,h4w′) で表わされる。このようにして表わされる文字パ
ターンの特徴ベクトルHの複数の要素ごとに平均
化した値を文字パターンの特徴として、特徴テー
ブルを作成し、公知の識別関数D(H)を求め、
文字パターンを分類する。 第2図に、回路1、装置2、装置3、装置4の
の動作例を示す。第2図Aは回路1にはじめにた
くわえられている2値化された文字パターンの例
である。第2図Bは、第2図Aの文字パターンに
対し、装置2により位置及び大きさの正規化を行
つた文字パターンの例である。第2図Cは第2図
Bの文字パターンに対し、装置3により文字枠取
り処理を行つた文字パターンの例である。第2図
Dは第2図Cの文字パターンに対し、装置4によ
り平滑化を行つた文字パターンの例である。 第3図は装置5の動作を説明する説明図で、方
向寄与度密度を求めるために観測する4方向座標
軸と各軸内の位置jの動作範囲を示す。第3図の
軸8−1は水平方向座標軸、軸8−2は+45゜方
向座標軸、軸8−3は垂直方向座標軸、軸8−4
は−45゜方向座標軸を示す。第4図は第3図と同
様に装置5の動作を説明する説明図である。 第4図Aは水平方向座標軸上の位置j=j0で、
座標軸に直交する方向に走査して、文字部と2回
交叉した場合を示したものである。第4図Aの黒
【表】
【表】
【表】
【表】 点9−1及び黒点9−3の部分は、該走査によ
り、それぞれ文字部と1回目及び2回目に交叉し
た場合の白点から黒点に変化した該黒点を示し、
黒点9−2及び黒点9−4の部分は、該走査によ
り、それぞれ文字部と1回目及び2回目に交叉し
た場合の黒点から白点に変化した該黒点を示す。
第4図Bは文字パターンの黒点の黒点連結長を求
めるための触手を伸ばす方向を矢印で示したもの
である。第4図Aの黒点9−1、黒点9−2、黒
点9−3、黒点9−4の各部分における、前記第
1の方法で得られる方向寄与度a1,a1′,a2
a2′の1例を第1表と第2表に示し、前記第2の
方法で得られる方向寄与度b1,b1′,b2,b2′の1
例を第3表と第4表に示す。従つて第4図Aの水
平方向座標軸上の位置j=j0の方向寄与度密度は
前記第1の方法では、 g1j0=(1.555,0,0,0,0,0.755,0.62,
0.673,0,1.687,0.548,0.603,0.512,
0,0,0) また、前記第2の方法では h1j0=(1.555,0.755,0.62,0.673,0.512,
1.687,0.548,0.603) と表わされる。この方向寄与度密度のベクトルの
値は水平方向座標軸の該位置j=j0で座標軸に直
交する方向に存在する文字線の方向成分と方向成
分別の文字線密度の大きさとを表わしている。前
記第2の方法から求められたh1j0を例にとれば、
h1j0でh1とh2′の値が大きいことから該位置の走
査方向には、水平方向の文字線成分と+45゜方向
の文字線成分が存在することが容易にわかるとい
う利点をもつだけでなく、これらの文字成分の該
走査方向での文字変形による位置ずれに影響をう
けないという利点ももつ。また、前記第1の方法
を用いれば、端点、交叉点、屈曲点等の詳細な文
字の幾何学的特徴も抽出できるという利点をも
つ。これにより、装置5に示した特徴抽出は幾何
学的特徴に着目する手書き漢字等の文字認識に有
効な手段となる。 以上説明したように、本発明によれば、文字パ
ターン内の各黒点から例えば0゜,45゜,90゜,135゜,
180゜,225゜,270゜,315゜の8方向のように複数方
向に触手を伸ばし、各方向別の黒点連結数を計数
し、該黒点の方向寄与度を求め、次に方向寄与度
でラベル付けされた文字パターンを複数座標軸方
向から観測し、座標軸上の各位置で座標軸に直交
する方向の文字線の方向寄与度を計数するため文
字パターンの各文字線の方向成分と方向成分別の
文字線密度との分布を簡易な手法で抽出できるだ
けでなく、文字線の位置ずれ等による手書き変形
にも強く、多字種、多彩な手書き変形をもつ手書
き漢字等を含む文字対象を効率よく分類できると
いう利点をもつ。
【図面の簡単な説明】
第1図は本発明による文字パターンの分類処理
装置の一実施例ブロツク図、第2図は第1図の回
路1、装置2、装置3、及び装置4による処理の
態様を説明する説明図、第3図及び第4図は本発
明の主要部である装置5の特徴抽出手段を説明す
るための説明図を示す。 1は記憶回路、2は文字パターン正規化処理装
置、3は文字パターン枠取り処理装置、4は平滑
化処理装置、5は文字パターン特徴抽出装置、6
は文字パターン分類装置、7は文字枠取り枠、8
−1,8−2,8−3,8−4は方向寄与度密度
観測の座標軸、9−1,9−2,9−3,9−4
は文字走査時に黒点から白点または白点から黒点
に変化する該黒点を示す。

Claims (1)

    【特許請求の範囲】
  1. 1 2値化された文字パターンに対して位置及び
    大きさの正規化処理を行う手段と、該手段によつ
    て得られた文字パターンを文字枠取り枠で枠取り
    する手段と、該手段によつて得られた文字パター
    ンに平滑化処理を行う手段と、該手段によつて得
    られた文字パターンの各画素の方向寄与度を求め
    る手段とをそなえると共に、該方向寄与度を求め
    る手段によつて得られた文字パターンに対して少
    なくとも2座標軸の複数座標軸方向から観測し、
    該座標軸上の各位置において該座標軸に直交する
    方向に走査し、横切る文字線の方向寄与度の値を
    方向成分別に計数する特徴抽出手段をそなえ、該
    特徴抽出手段からの出力情報を少なくとも利用
    し、文字パターンを分類するようにしたことを特
    徴とする文字パターン分類処理装置。
JP56046659A 1981-03-30 1981-03-30 Character pattern classifying and processing device Granted JPS57164376A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56046659A JPS57164376A (en) 1981-03-30 1981-03-30 Character pattern classifying and processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56046659A JPS57164376A (en) 1981-03-30 1981-03-30 Character pattern classifying and processing device

Publications (2)

Publication Number Publication Date
JPS57164376A JPS57164376A (en) 1982-10-08
JPS634229B2 true JPS634229B2 (ja) 1988-01-28

Family

ID=12753451

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56046659A Granted JPS57164376A (en) 1981-03-30 1981-03-30 Character pattern classifying and processing device

Country Status (1)

Country Link
JP (1) JPS57164376A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2575402B2 (ja) * 1987-08-22 1997-01-22 アルプス電気株式会社 文字認識方法
JP5268563B2 (ja) * 2008-10-29 2013-08-21 日立コンピュータ機器株式会社 文字認識装置、及び、認識辞書生成装置

Also Published As

Publication number Publication date
JPS57164376A (en) 1982-10-08

Similar Documents

Publication Publication Date Title
EP0431496A2 (en) Number plate recognition system
DE69813416T2 (de) Vorrichtungen zur Linienrichtungsbestimmung, Bildschrägeerfassung und Bildschrägekorrektur.
Chi et al. Separation of single-and double-touching handwritten numeral strings
EP0456192B1 (en) Image processing method and apparatus therefor
JPS634229B2 (ja)
JPH0159627B2 (ja)
JPH026112B2 (ja)
Cheng et al. Recognition of broken and noisy handwritten characters using statistical methods based on a broken-character-mending algorithm
Liang et al. Document zone classification using sizes of connected components
JPS6238752B2 (ja)
JPS634231B2 (ja)
JP3104355B2 (ja) 特徴抽出装置
JPS62125485A (ja) 文字認識方式
JP2832035B2 (ja) 文字認識装置
JP3140079B2 (ja) 罫線認識方法及び表処理方法
JP3365941B2 (ja) 文字パターン認識方法及びその装置
JPS6038755B2 (ja) 特徴抽出方式
JPS5855553B2 (ja) 文字パタ−ンの分類装置
JPS62154079A (ja) 文字認識方式
EP0571979A2 (en) A recognizing method of characters
JPS63298494A (ja) パタ−ン認識装置
JPH11120291A (ja) パタン認識システム
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JP2575402B2 (ja) 文字認識方法
JPS5951034B2 (ja) パタ−ン認識装置