JPH026112B2 - - Google Patents

Info

Publication number
JPH026112B2
JPH026112B2 JP57083794A JP8379482A JPH026112B2 JP H026112 B2 JPH026112 B2 JP H026112B2 JP 57083794 A JP57083794 A JP 57083794A JP 8379482 A JP8379482 A JP 8379482A JP H026112 B2 JPH026112 B2 JP H026112B2
Authority
JP
Japan
Prior art keywords
character
character pattern
processing means
pattern
directional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57083794A
Other languages
English (en)
Other versions
JPS58200378A (ja
Inventor
Norihiro Hagita
Seiichiro Naito
Isao Masuda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP57083794A priority Critical patent/JPS58200378A/ja
Publication of JPS58200378A publication Critical patent/JPS58200378A/ja
Publication of JPH026112B2 publication Critical patent/JPH026112B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/184Extraction of features or characteristics of the image by analysing segments intersecting the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (1) 発明の属する分野の説明 本発明は、文字パターンの分類装置、特に光電
変換によつて得られた文字パターンを2値化した
文字パターンに対し、手書き漢字のような多くの
字種、多くの手書き文字変形をもつ文字対象を効
率よく分類するために、2次元的な文字線構造の
分布から文字パターンの特徴を抽出し、入力文字
パターンを分類する文字パターンの分類装置に関
するものである。
(2) 従来の技術の説明 従来、漢字を含む文字パターンの認識装置また
は分類装置として、手書き漢字を対象として、2
値化と位置及び大きさの正規化と、平滑化とを行
つた文字パターンを、水平軸及び垂直軸の2座標
軸方向から観測し、該座標軸上の各位置における
該座標軸に直交する方向の文字部を横切る文字線
数を計数し、この情報から特徴ベクトルパターン
を作成し、すでに蓄えておいた各文字の特徴辞書
テーブルとのマツチングをとり、文字パターンの
分類を行う方式が知られている。しかしながら、
この方式では、水平軸ないしは垂直座標軸等の1
次元座標軸方向へ、文字の線密度を投影するた
め、文字パターンの分類に必要な2次元的な文字
線構造の分布から得られる特徴を十分に抽出でき
ないため、この特徴だけでは十分な分類能力を実
現しえないという欠点がある。
また、手書き漢字を対象とした文字認識では、
2値化、位置及び大きさの正規化、平滑化を行つ
た文字パターンを、粗いメツシユの矩形領域に分
割して、各矩形領域内に存在する文字部に対して
水平軸と垂直軸の2座標軸方向から観測し、該座
標軸上の各位置における該座標軸に直交する方向
の文字部を横切る文字線数を計数し、この情報か
ら特徴ベクトルパターンを作成し、すでに蓄えて
おいた各文字の特徴辞書テーブルとのマツチング
をとり、文字パターンの分類を行う方式が知られ
ている。しかしながら、この方式についても、各
粗いメツシユ領域内の文字線構造の大まかな複雑
さのちがいを区別できるものの、文字線の方向成
分、接続関係等の、より詳細な文字線構造のちが
いを表わす情報がないため、類似文字が多くかつ
文字線の位置ずれ等の手書き変形も多い文字対象
を効率よく認識できないという欠点があつた。
従つて、上記各方式では手書き漢字などの字種
も多く変形の大きい文字集合に対しては、必ずし
も十分な認識を行うことが期待し難い。
(3) 発明の目的 本発明は、従来技術により、2値化、位置及び
大きさの正規化、文字枠取り処理、平滑化を行つ
た文字パターンの各文字線の方向成分、接続関係
等の文字線構造についての情報を黒点の方向寄与
度をもとにして求め、さらに文字パターンを粗い
メツシユの矩形領域に分割し、各矩形領域内の文
字線構造情報を文字線の方向別に計数する装置を
提供し、多字種、多変形をもつ手書き漢字を含む
手書き文字パターンを、効率よく分類することを
目的としている。
(4) 発明の構成および作用の説明 以下に本発明を、図面を用いて詳細に説明す
る。
第1図は、本発明による文字パターンの分類装
置の一実施例のブロツク図である。同図におい
て、1は記憶回路であり、はじめに2値化された
手書き文字パターンを記憶しておく。
2は、この2値化された文字パターンを入力
し、既知の重心及び2次モーメントを用いて位置
及び大きさの正規化処理を行う文字パターンの位
置及び大きさの正規化処理装置である。
3は、正規化処理装置2によつて得られたN×
Nメツシユの正規化文字パターンを入力し、手書
き文字の外郭付近で起きるストロークの極端な突
き出しに対処するため、重心を中心とするWメツ
シユの正方領域の文字枠取り枠で文字を枠取り
し、枠外にはみ出た文字部を除去する枠取り処理
装置である。
4は、枠取り処理装置3によつて得られた文字
枠取り後の文字パターンを入力し、文字線輪郭部
分の黒点の1メツシユの凹凸をそれぞれ埋めまた
は取り除く平滑化処理装置である。
5は、本発明の主要部をなす特徴抽出装置であ
る。該装置5においては、平滑化処理を行つた文
字パターンを入力し、該文字パターンの各黒点か
ら水平方向を基準にしてM方向(たとえば8方向
の場合には、0゜、45゜、90゜、135゜、180゜、225゜、
270゜、315゜の8方向)に触手を伸ばした時に、各
方向別に連続する黒点数を計数して、黒点の方向
寄与度を求める処理を行い、該方向寄与度抽出処
理によつて、方向寄与度でラベル付けされた文字
パターンについて、P個の、粗い例えば正方メツ
シユ領域に等分割し、各粗いメツシユ領域内に存
在する文字部に対して、少なくとも2座標軸の複
数座標軸方向から観測し、該座標軸上の各位置に
おける該座標軸に直交する方向に走査した場合
に、横切る文字線の方向寄与度を方向成分別に計
数して、この値を文字パターンの各文字線の方向
と接続関係についての2次元的なひろがり分布を
表わす特徴として抽出する特徴抽出装置である。
6は、装置5によつて割り当てられた各粗いメ
ツシユ領域内の方向成分別の方向寄与度の計数値
をもとに、文字パターンを分類するための特徴テ
ーブルを作成し、該手段によつて作成した特徴テ
ーブルをもとにすでにたくわえておいた各文字の
特徴辞書テーブルとマツチングをとり、文字パタ
ーンの分類を行う分類処理装置である。
次に、特徴抽出装置5の具体例として、8方向
(0゜、45゜、90゜、135゜、180゜、225゜、270゜、315
゜の8
方向で、それらの方向にそれぞれ1、2、3、
4、5、6、7、8の番号を付与する)に触手を
伸ばし黒画素の方向寄与度を求め、文字パターン
を分類する場合を例にとつて、2つの方法を説明
する。
その第1の方法は以下の通りである。平滑化処
理装置4によつて得られたW×Wメツシユの文字
パターン内の文字部の任意の画素の方向寄与度a
は、 a=(a1、a2…、a8) なる8次元ベクトルで表わされる。ここでa1
a2、…、a8は8方向それぞれの方向寄与度成分
で、該画素から8方向に触手を伸ばして、各方向
別に得られる黒点連結長li(i=1、2、…8)を
用いて、一例として なる式で表わされる。なおこの式には、ユークリ
ツド距離以外の他の距離も適用可能である。該手
段によつて得られる方向寄与度aがラベル付けさ
れた文字パターンを、P個の粗い例えば正方メツ
シユ領域に等分割し、第p番目(1、2、…p、
…、P)粗いメツシユ領域内に存在する文字部に
対して、水平軸方向を基準にして、4方向座標軸
(水平軸、+45゜方向軸、垂直軸、−45゜方向軸の4
座標軸であり、それぞれに1、2、3、4の番号
を付与するものとする)から観測し、k方向座標
軸(k=1、2、3、4)上の位置j(k=1、
3ではj=1、2、…、W、k=2、4ではj=
1、2、…、W′となる。ここでW′=2W)で、
該座標軸に直交する方向に走査して、得られる方
向寄与度密度gkjpは、 gkjp=(g1、g2、…、g8、g1′、g2′、…、g8′)p なる16次元ベクトルで表わされる。
ここで、g1、g2、…、g8は該走査により文字部
とm回交叉した場合、n(n≦m)回目の交叉時
の白点から黒点に変化した該黒点(走査開始時は
直前の画素が白点と仮定する)の方向寄与度ao
(a1o、a2o、…、a8o)をそれぞれ、方向成分別に
累積した方向寄与度密度のベクトルの各要素で、
i方向成分の該密度giは ginn=1 aio で表わされる。
また、g1′、g2′、…、g8′は該走査により、文字
部とm回交叉した場合、n回目の交叉時の黒点か
ら白点に変化した該黒点の方向寄与度ベクトル
ao′=(a1o′、a2o′、…、a8o′)をそれぞれ、方向
成分別に累積した方向寄与度密度のベクトルの各
要素であり、i方向成分の該密度gi′は gi′=nn=1 aio′ で表わされる。
従つて、文字パターンの特徴ベクトル〓は 〓=(〓111、〓121、…、〓1W1、〓211、〓221、 …、〓2w1、〓311、〓321、…、〓3w1、〓411、 〓421、…、〓4w1、〓112、…、〓1w2、〓212、 …、〓2w2、〓312、…、〓3w2、〓412、…、 〓4w2、…、〓kjp、…〓4w′P) で表わされる。このようにして表わされる文字パ
ターンの特徴ベクトル〓を複数の要素ごとに平均
化した値を文字パターンの特徴として特徴テーブ
ルを作成し、公知の識別関数D(〓)を求め文字
パターンを分類する。
次に、第2の方法は以下の通りである。前記の
W×Wメツシユの文字パターン内の文字部の任意
の画素の方向寄与度〓は、 〓=(b1、b2、b3、b4) なる4次元ベクトルで表わされる。ここで、b1
b2、b3、b4は4方向それぞれの方向寄与度成分
で、前記手段によつて求まる該画素の黒点連結長
li(i=1、2、…、8)を用いて、1例として なる式で表わされる。なお、この式にはユークリ
ツド距離以外の距離も適用可能である。該手段に
よつて得られる方向寄与度〓がラベル付けされた
文字パターンをP個の粗い例えば正方メツシユ領
域に等分割し、第p番目の粗いメツシユ領域内に
存在する文字部に対して、水平軸方向を基準にし
て、4方向座標軸(水平軸、+45゜方向軸、垂直
軸、−45゜方向軸の4座標軸で、それぞれ1、2、
3、4の番号を付与する)から観測し、k方向座
標軸(k=1、2、3、4)上の位置j(k=1、
3ではj=1、2、…、W、k=2、4ではj=
1、2、…、W′となる。ここでW′=2W)で、
該座標軸に直交する方向に走査して、得られる方
向寄与度密度〓kjpは 〓kjp=(k1、k2、k3、k4、k1′、 k2′、k3′、k4′)p なる8次元ベクトルで表わされる。
ここで、h1、h2、h3、h4は該走査により、文字
部とm回交叉した場合、n(n≦m)回目の交叉
の白点から黒点に変化した該黒点(走査開始時は
直前の画素が白点と仮定する)の方向寄与度〓o
(b1o、b2o、b3o、b4o)をそれぞれ方向成分別に累
積した方向寄与度密度のベクトルの各要素であ
り、t方向成分(t=1、2、3、4)の該密度
kiは kknn=1 bto で表わされる。
また、k1′、k2′、k3′、k4′は該走査により、文
字部とm回交叉した場合、n回目の交叉時の黒点
から白点に変化した該黒点の方向寄与度〓o′=
(b1o′、b2o′、b3o′、b4o′)をそれぞれ、方向成分
別に累積した方向寄与度密度のベクトルの各要素
であり、t方向成分の該密度kt′は、 ht′=nn=1 bto′ で表わされる。
従つて、文字パターンの特徴ベクトル〓は 〓=(〓111、〓121、…、〓1w1、〓211、〓221、 …、〓2w1、〓311、〓321、…、〓3w1、〓411、 〓421、…、〓4w1、〓112、〓122、…、〓1w2、 〓212、〓222、…、〓2w2、〓312、〓322、…、 〓3w2、〓412、〓422、…、〓4w2、…、〓kjp、 …、〓4w′P) で表わされる。このようにして表わされる文字パ
ターンの特徴ベクトル〓を複数の要素ごとに平均
化した値を文字パターンの特徴として特徴テーブ
ルを作成し、公知の識別関数D(〓)を求め、文
字パターンを分類する。
第2図に、記憶回路1、正規化処理装置2、文
字枠取り処理装置3、平滑化処理装置4、の動作
例を示す。第2図Aは、記憶回路1にはじめにた
くわえられている2値化された文字パターンの例
である。第2図Bは、第2図Aの文字パターンに
対し、正規化処理装置2により、位置及び大きさ
の正規化を行つた文字パターンの例である。第2
図Cは、第2図Bの文字パターンに対し、文字枠
取り処理装置3により、文字枠取り処理を行つた
文字パターンの例である。第2図Dは、第2図C
の文字パターンに対し、平滑化処理装置4によ
り、平滑化を行つた文字パターンの例である。
第3図は装置5内の方向寄与度を求める動作を
説明する説明図であり、第3図Aは、文字パター
ンの黒点の黒点連結長を求めるための触手を伸ば
す方向を矢印で示したものである。第3図Bは文
字パターンの黒点8から第3図Aで示すように8
方向に触手を伸ばし、各方向の黒点連結長を矢印
の長さで表わしたものである。
第4図は、方向寄与度の値を計数して特徴抽出
する動作の例を説明する説明図であり、W×Wメ
ツシユの文字枠取り領域内を、粗い正方メツシユ
領域9−1,9−2,…,9−p,…,9−Pに
分割した例である。
第5図は、第4図で説明したW×Wメツシユの
文字枠取り領域内の粗い正方メツシユ領域9−p
から方向寄与度の値を計数する動作を説明する説
明図であり、第5図Aは方向寄与度密度を求める
ために観測する4方向座標軸と各軸内の位置座標
の動作範囲とを示した例である。第5図Aの軸1
0−1は水平方向座標軸、軸10−2は+45゜方
向座標軸、軸10−3は垂直方向座標軸、軸10
−4は−45゜方向座標軸を示す。第5図Bは水平
方向座標軸上の位置j=j0で座標軸に直交する方
向に走査して文字部と1回交叉した場合、黒点1
1−1は白点から黒点に変化した該黒点の例を示
し、黒点11−2は黒点から白点に変化した該黒
点の例を示したものである。第5図Bの水平方向
座標軸上の位置j=joにおける前記第1の方法で
得られる方向寄与度密度〓1j0pの1例を示すと、 〓1j0p=(0.31、0.21、0.21、0.27、0.84、0.10、 0.10、0.13、0、0.24、0.26、0.31、0.88、 0、0、0)p となり、また前記第2の方法で得られる方向寄与
度密度〓1j0pの1例を示すと、 〓1j0p=(0.89、0.24、0.24、0.31、0.88、 0.24、0.26、0.31)p となる。この方向寄与度密度のベクトルの値は粗
い正方メツシユ領域9−p内で水平方向座標軸の
該位置j=j0で座標軸に直交する方向に存在する
文字線の方向と方向別の文字線密度とを表わして
いる。前記第2の方法から求められた〓1j0pを例
にとれば、〓1j0pでk1とk1′の値が大きいことか
ら、該粗メツシユ領域の該位置の走査方向には水
平の文字線成分が存在することが容易にわかると
いう利点をもつ。
また、前記第1の方法を用いれば、端点、交叉
点、屈曲点等の文字の詳細な幾何学的特徴も抽出
できるという利点をもつ。
これにより、装置5に示した特徴抽出は、幾何
学的特徴に着目する手書き漢字等の文字認識に有
効な手段となる。
なお、特徴抽出装置5に示した特徴抽出手段と
従来から知られている手段、たとえば文字パター
ンを複数座標軸方向から観測し、該座標軸上の各
位置において該座標軸に直交する方向に走査し、
横切る文字線の方向寄与度の値を方向成分別に計
数する特徴抽出手段とを併用して、個々の特徴を
分類して得られる複数個のカテゴリからその和集
合を選び出し、手書き文字パターンを分類するよ
うにすると、様々な手書き変形に対し、さらに一
層対処できる分類能力の高い文字認識システムを
実現できる。
(5) 効果の説明 以上説明したように、本発明の文字パターンの
分類装置は、文字パターン内の各黒点から例えば
0゜、45゜、90゜、135゜、180゜、225゜、270゜、315゜
の8
方向のように複数方向に触手を伸ばし、各方向別
の黒点連結数を計数し、該黒点の方向寄与度を求
め、次に文字パターンを粗いメツシユの矩形領域
に分割し、各矩形領域内を複数座標軸方向から観
測し、座標軸上の各位置で座標軸に直交する方向
の文字線の方向寄与度を計数するため、文字線の
方向や接続関係等の2次元的な幾何学的特徴を簡
易な手法で抽出できるだけでなく、文字線のかす
れ、つぶれ等による手書き変形にも強く、多字
種、多変形な手書き漢字等を含む文字対象を効率
よく分類できるという利点をもつ。
【図面の簡単な説明】
第1図は、本発明による文字パターンの分類装
置の一実施例ブロツク図、第2図は第1図に示す
回路1、および装置2、乃至4による処理の態様
を説明する説明図、第3図乃至第5図は本発明の
主要部である装置5の特徴抽出手段の機能説明
図。 図中1は記憶回路、2は文字パターン正規化処
理装置、3は文字パターン枠取り処理装置、4は
平滑化処理装置、5は文字パターンの特徴抽出装
置、6は文字パターンの分類処理装置、7は文字
枠取り枠、8は文字パターン内の黒点、9−1,
9−2,…,9−p,…,9−Pは分割された正
方メツシユ領域、10−1,10−2,10−
3,10−4は方向寄与度密度観測の座標軸、1
1−1,11−2は文字走査時に黒点から白点ま
たは白点から黒点に変化する該黒点を示す。

Claims (1)

    【特許請求の範囲】
  1. 1 2値化された文字パターンに対して、文字部
    の重心と2次モーメントを求めて、位置及び大き
    さの正規化処理を行う手段と、該正規化処理手段
    によつて得られた文字パターンを文字枠取り枠で
    枠取りする処理手段と、該枠取り処理手段によつ
    て得られた文字パターンに平滑化処理を行う平滑
    化処理手段と、該平滑化処理手段によつて得られ
    た文字パターンの全黒画素から予め定めた複数の
    方向に触手を伸ばして各方向別に得られる黒点列
    の長さから与えられる方向寄与度を求める方向寄
    与度抽出手段と、該平滑化処理手段によつて得ら
    れた文字パターンを粗いメツシユの矩形領域に分
    割して、当該各矩形領域内に存在する文字部に対
    して、少なくとも2座標軸の複数座標軸方向から
    観測し、該座標軸上の各位置における該座標軸に
    直交する方向に走査し、横切る文字線の方向寄与
    度の値を方向成分別に計数する特徴抽出手段とを
    そなえ、該特徴抽出手段からの出力情報を少なく
    とも利用し、文字パターンを分類するようにした
    ことを特徴とする文字パターン分類装置。
JP57083794A 1982-05-18 1982-05-18 文字パタ−ンの分類装置 Granted JPS58200378A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57083794A JPS58200378A (ja) 1982-05-18 1982-05-18 文字パタ−ンの分類装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57083794A JPS58200378A (ja) 1982-05-18 1982-05-18 文字パタ−ンの分類装置

Publications (2)

Publication Number Publication Date
JPS58200378A JPS58200378A (ja) 1983-11-21
JPH026112B2 true JPH026112B2 (ja) 1990-02-07

Family

ID=13812550

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57083794A Granted JPS58200378A (ja) 1982-05-18 1982-05-18 文字パタ−ンの分類装置

Country Status (1)

Country Link
JP (1) JPS58200378A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6448180A (en) * 1987-08-19 1989-02-22 Fuji Electric Co Ltd Feature extracting circuit

Also Published As

Publication number Publication date
JPS58200378A (ja) 1983-11-21

Similar Documents

Publication Publication Date Title
Al-Ghaili et al. Vertical-edge-based car-license-plate detection method
JP5950441B2 (ja) 画像認識装置、画像認識方法および画像認識プログラム
US5841905A (en) Business form image identification using projected profiles of graphical lines and text string lines
Keaton et al. Keyword spotting for cursive document retrieval
US5703963A (en) Character recognition apparatus that subdivides a character into subregions to obtain feature vectors
JPH026112B2 (ja)
JP3113769B2 (ja) 文字認識装置
JPS634229B2 (ja)
JPH0159627B2 (ja)
JPS6238752B2 (ja)
JP3104355B2 (ja) 特徴抽出装置
JPS634231B2 (ja)
JP3850488B2 (ja) 文字抽出装置
JP2575402B2 (ja) 文字認識方法
JPH022189B2 (ja)
JPS5855553B2 (ja) 文字パタ−ンの分類装置
JP2681599B2 (ja) 文字認識装置
KR940007935B1 (ko) 문자 인식을 위한 후보 분류 방법
JP3365941B2 (ja) 文字パターン認識方法及びその装置
JP3496897B2 (ja) カラー画像認識方法および装置
JP2975067B2 (ja) 文字の認識方法
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPH02166583A (ja) 文字認識装置
JPH0773275A (ja) 文字認識装置
JPH09297818A (ja) 文字認識方法および装置