JPH0159627B2 - - Google Patents
Info
- Publication number
- JPH0159627B2 JPH0159627B2 JP57107346A JP10734682A JPH0159627B2 JP H0159627 B2 JPH0159627 B2 JP H0159627B2 JP 57107346 A JP57107346 A JP 57107346A JP 10734682 A JP10734682 A JP 10734682A JP H0159627 B2 JPH0159627 B2 JP H0159627B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- character pattern
- directional
- pattern
- contribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
- 238000009432 framing Methods 0.000 claims description 6
- 238000009499 grossing Methods 0.000 claims description 4
- 238000000034 method Methods 0.000 description 18
- 206010064127 Solar lentigo Diseases 0.000 description 14
- 239000013598 vector Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 3
- 238000005452 bending Methods 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Description
(1) 発明の属する分野の説明
本発明は、文字パターンの分類処理装置、特に
光電変換によつて得られた文字パターンを2値化
した文字パターンに対し、手書き漢字のような多
字種、多様な手書き変形をもつ文字対象を効率よ
く分類するために、文字線構造に関する特徴を文
字パターンの外郭付近から抽出し、入力文字パタ
ーンを分類する文字パターンの分類装置に関する
ものである。 (2) 従来の技術の説明 従来、漢字を含む文字パターンの認識装置また
は分類装置として、手書き漢字を対象として芯線
化処理を行つた文字パターンから端交点、屈曲点
等の文字の幾何学的形状を抽出し、これを用いて
各文字線の位置関係、接続関係等を表わし、これ
らの情報とすでに蓄えておいた各文字の辞書テー
ブルとの照合を行い文字パターンを認識する方式
が知られる。しかしながら、この方式では芯線化
処理によつて起こるヒゲ、ボイド等による雑音成
分が発生するため文字の幾何学的形状抽出が困難
になるばかりでなく、手書き文字変形により各文
字線の位置関係、接続関係が著しく変動し、この
変動を吸収するために膨大なデータあるいは膨大
な認識論理を準備しなければならず、効率のよい
認識システムを実現できないという欠点がある。 また、手書き漢字を対象として、2値化、位置
及び大きさの正規化、平滑化を行つた文字パター
ンを水平軸及び垂直軸の2座標軸方向から観測
し、該座標軸上の各位置における該座標軸に直交
する方向の文字部を横切る文字線数を計数し、こ
の情報から特徴ベクトルパターンを作成し、すで
に蓄えておいた各文字の特徴辞書テーブルとのマ
ツチングをとり、文字パターンの分類を行う方
式、あるいは2値化、位置及び大きさの正規化、
平滑化を行つた文字パターンを粗いメツシユの矩
形領域に分割して、当該各矩形領域内に存在する
文字部に対して、水平軸及び垂直軸の2座標軸方
向から観測し、該座標軸上の各位置における該座
標軸に直交する方向の文字部を横切る文字線数を
計数し、この情報から特徴ベクトルパターンを作
成し、すでに蓄えておいた各文字の特徴辞書テー
ブルとのマツチングをとり、文字パターンの分類
を行う方式が知られる。しかしながら、これらの
文字パターン分類方式で計数時に横切る文字線数
は、字種のちがいによる文字線構造の大まかな複
雑さのちがいを区別できるものの、文字線の方向
成分と方向成分別の分布等の、より詳細な文字線
構造のちがいを表わす情報がないため、類似文字
が多く、かつ文字線の位置ずれ等の手書き変形も
多い文字対象を効率よく認識できないという欠点
があつた。 従つて、上記の各方法は手書き漢字などの字種
も多く、変形の大きい文字集合には十分な認識を
行うことが期待し難い。 (3) 発明の目的 本発明は、従来技術によつて2値化、位置及び
大きさの正規化、文字枠取り処理、平滑化を行つ
た文字パターンについて、文字線の方向、接続関
係、平行性等の文字線構造情報を黒点の方向寄与
度をもとにして求め、さらにこれらの情報を複数
方向から文字を走査することにより計数する装置
を提供し、多字種、多変形をもつ手書き漢字を含
む手書き文字パターンを効率よく分類することを
目的としている。 (4) 発明の構成および作用の説明 以下、図面を用いて詳細に説明する。 第1図は、本発明による文字パターンの分類装
置の一実施例のブロツク図である。第1図におい
て回路1は記憶回路で、はじめに2値化された手
書き文字パターンを記憶しておく回路である。装
置2は、この2値化された文字パターンを入力
し、例えば従来まで知られている重心と2次モー
メントを用いて位置及び大きさの正規化処理を行
う文字パターンの位置及び大きさの正規化処理装
置である。装置3は、装置2によつて得られたN
×Nメツシユの正規化文字パターンを入力し、手
書き文字の外郭付近で起きる文字線の極端なつき
出しに対処するため、重心を中心とする文字枠取
り枠Wメツシユの正方領域で文字を枠取りし、枠
外にはみ出した文字部を除去する装置である。装
置4は、装置3によつて得られた文字枠取り後の
文字パターンを入力し、文字線輪郭部分の黒点の
1メツシユの凹、凸をそれぞれうめるまたは取り
除く正規化処理装置である。 装置5は、本発明の主要部をなす特徴抽出装置
で、平滑化処理を行つた文字パターンを入力し、
あらかじめ定めたK方向座標軸(たとえば4方向
の場合には水平方向を基準にして水平軸、+45゜方
向軸、垂直軸、−45゜方向軸の4座標軸)から、(1)
該座標軸に直交する方向に文字を走査し、文字部
と交叉した場合、該交叉文字部の黒画素について
あらかじめ定めたM方向(たとえば、8方向の場
合には0゜、45゜、90゜、135゜、180゜、225゜、270、3
15゜
の8方向)に触手を伸ばし、各方向別に連結する
黒点数を計数し、該黒点の方向寄与度(特願昭56
−46659)を求める処理と、(2)該座標軸に直交す
る方向の走査で文字部とM(M≧2)回交叉した
場合、m(2≦m≦M)回目の交叉時の方向寄与
度と(m−1)回目の交叉時の方向寄与度との類
似度を求める処理とを具備する特徴抽出装置であ
る。 装置6は、装置5によつて割り当てられた方向
寄与度の値、及びその類似度をもとに、文字パタ
ーンを分類するための特徴テーブルを作成し、該
手段によつて作成した特徴テーブルをもとに、す
でにたくわえておいた各文字の特徴辞書テーブル
とマツチングをとり、文字パターンの分類を行う
分類装置である。 装置5の具体例として、4方向座標軸(水平
軸、+45゜方向軸、垂直軸、−45゜方向軸の4座標軸
でそれぞれ1、2、3、4の番号を付与する)か
ら、各座標軸に直交する方向に文字を走査した文
字部と交叉した場合に8方向(0°、45°、90°、
135°、180°、225°、270、315゜の8方向でそれらの
方向にそれぞれ1、2、3、4、5、6、7、8
の番号を付与する)に触手を伸ばし、方向寄与
度、及び2つの方向寄与度の類似度を求め、文字
パターンを分類する場合を例にとつて説明する。 その第1の方法は以下の通りである。装置4に
よつて得られたW×Wメツシユの文字パターンを
水平軸方向を基準にして、4方向座標軸から観測
し、k方向座標軸(k=1、2、3、4)上の位
置j(k=1、3ではj=1、2、…、W、k=
2、4ではj=1、2、…、W′となる。ここで
W′=2W)で該座標軸に直交する方向に走査し、
文字部とm回目に交叉した場合、該交叉時に白点
から黒点に変化した該黒点(走査開始時は直前の
画素が白点と仮定する)の方向寄与度〓nは 〓n=(a1、a2、…、a8)n −(1) なる8次元ベクトルで表わされる。ここで、a1、
a2、…、a8はそれぞれ、8方向の方向寄与度成分
で、該黒点から8方向に触手を伸ばして各方向別
に得られる黒点連結長li(i=1、2、…、8)を
用いて、1例として なる式で表わされる。このaiには、ここで示した
ユークリツド距離以外の距離を適用することが可
能である。 また、該走査時に文字部とm回目に交叉した場
合、該交叉時に黒点から白点に変化した該黒点の
方向寄与度〓n′は 〓n′=(a1′、a2′、…、a8′)n −(3) なる8次元ベクトルで表わされる。ここでai′
(i=1、2、…、8)は(2)式と同様に、該黒点
の8方向別の黒点連結長li(i=1、2、…、8)
を用いて、1例として なる式で表わされる。 さらに、該走査により文字部とM(M≧2)回
交叉した場合に、m(2≦m≦M)回目の交叉時
の方向寄与度〓nおよび〓n′と(m−1)回目の
交叉時の方向寄与度〓n-1およびa′n-1との間の類
似度sn-1,nおよびs′n-1,nは1例として sn-1,n=(〓n-1、〓n)/‖〓n-1‖・‖〓n‖ −(5) s′n-1,n=(〓′n-1、〓′n)/‖〓′n-1‖・‖〓
′n‖−(6) なる式で表わされる。 このようにして求められる〓n、〓′n、sn-1,n、
s′n-1,nのうち、たとえば、 〓n、sn-1,nについてはm=1からm=m0(1≦
m0≦M)の範囲の値を、 a′n、s′n-1,nについては、m=Mからm=M−
m0+1の範囲の値を選ぶことにより、 k方向座標軸上の位置jの走査によつて得られ
る特徴パターン〓kjは 〓kj=(〓1、〓2、…、〓n0、s12、s23、…、
sn0-1,n0、〓′M、〓′M-1、…、 〓′M-n0+1、s′M-1,M、…、s′M-n0,M-n0+1)kj
−(7) で表わされる。 従つて、文字パターンの特徴ベクトル〓は 〓=(g11、g12、…、g1W、g21、g22、…、g2W′、
g31、g32、…、g3W、g41、g42、…、g4W′)
−(8) で表わされる。 このようにして表わされる文字パターンの特徴
ベクトル〓の各要素を複数個まとめて、平均化し
た値を文字パターンの特徴として特徴テーブルを
作成し、公知の識別関数D(〓)を求め、文字パ
ターンを分類する。 次に第2の方法は以下の通りである。前記のW
×Wメツシユの文字パターンを、水平軸方向を基
準にして、4方向座標軸から観測し、k方向座標
軸(k=1、2、3、4)上の位置j(k=1、
3ではj=1、2、…、W、k=2、4ではj=
1、2、…、W′となる。ここでW′=2W)で該
座標軸に直交する方向に走査し、文字部とm回目
に交叉した場合、該交叉時に白点から黒点に変化
した該黒点(走査開始時は直前の画素が白点と仮
定する)の方向寄与度〓nは 〓n=(b1、b2、b3、b4)n −(9) なる4次元ベクトルで表わされる。ここで、b1、
b2、b3、b4はそれぞれ4方向の方向寄与度成分
で、該黒点から8方向に触手を伸ばして各方向別
に得られる黒点連結長li(i=1、2、…、8)を
用いて、1例として なる式で表わされる。このbiには、ここで示した
ユークリツド距離以外の距離を適用することが可
能である。 また、該走査時に文字部とm回目に交叉した場
合、該交叉時に黒点から白点に変化した該黒点の
方向寄与度〓′nは 〓′n(b1′、b2′、b3′、b4′)n −(11) なる4次元ベクトルで表わされる。ここでb1′、
b2′、b3′、b4′は、(10)式と同様に、該黒点の8方向
別の黒点連結長li(i=1、2、…、8)を用い
て、1例として なる式で表わされる。 さらに、該走査により文字部とM(M≧2)回
交叉した場合に、m(2≦m≦M)回目の交叉時
の方向寄与度〓nおよび〓′nと(m−1)回目の
交叉時の方向寄与度〓n-1および〓′n-1との間の
類似度rn-1,nおよびr′n-1,nは1例として rn-1,n=(〓n-1、〓n)/‖〓n-1‖‖〓n‖ −(13) r′n-1,n=(〓′n-1、〓′n)/‖〓′n-1‖‖〓′n
‖−(14) なる式で表わされる。 このようにして求められる〓n、〓′n、rn-1,n、
r′n-1,nのうち、たとえば 〓n、rn-1,nについてはm=1からm=m0(1≦
m0≦M)の範囲の値を、 b′n、r′n-1,nについてはm=Mからm=M−n0+
1の範囲の値を選ぶことにより、 k方向座標軸上の位置jの走査によつて得られ
る特徴パターン〓kjは 〓kj=(〓1、〓2、…〓n0、r12、r23、…、
rn0-1,n0、〓′M、〓′M-1、…、〓′M-n0+1、
r′M-1,M、…、r′M-n0,M-n0+1)kj −(15) で表わされる。 従つて、文字パターンの特徴ベクトル〓は 〓=(〓11、〓12、…、〓1W、〓21、〓22、…、〓
2W′、〓31、〓32、…、〓3W、〓41、〓42、…、
〓4W′) −(16) で表わされる。 このようにして表わされる文字パターンの特徴
ベクトル〓の各要素を複数個まとめて平均化した
値を文字パターンの特徴として特徴テーブルを作
成し、公知の識別関数D(〓)を求め文字パター
ンを分類する。 第2図に、回路1、装置2、装置3、装置4の
動作例を示す。第2図Aは回路1にはじめにたく
わえられている2値化された文字パターンの例で
ある。第2図Bは第2図Aの文字パターンに対し
装置2により位置および大きさの正規化を行つた
文字パターンの例である。第2図Cは第2図Bの
文字パターンに対し、装置3により、文字枠取り
処理を行つた文字パターンの例である。第2図D
は第2図Cの文字パターンに対し、装置4により
平滑化を行つた文字パターンの例である。 第3図は装置5の動作を説明する説明図で方向
寄与度及び2つの方向寄与度の類似度を求めるた
めに観測する4方向座標軸と各軸内の位置jの動
作範囲を示す。第3図の軸8−1は水平方向座標
軸、軸8−2は+45゜方向座標軸、軸8−3は垂
直方向座標軸、軸8−4は−45゜方向座標軸を示
す。第4図は、第3図と同様に装置5の動作を説
明する説明図である。 第4図Aは水平方向座標軸上の位置j=j0で、
座標軸に直交する方向に走査して、文字部と2回
交叉した場合を示したものである。第4図Aの黒
点9−1及び黒点9−3の部分は、該走査により
それぞれ文字部と1回目及び2回目に交叉した場
合の白点から黒点に変化した該黒点を示し、黒点
9−2及び黒点9−4の部分は、該走査により、
それぞれ文字部と1回目及び2回目に交叉した場
合の黒点から白点に変化した該黒点を示す。第4
図Bは文字パターンの黒点の黒点連結長を求める
ための触手を伸ばす方向を矢印で示したものであ
る。第4図Aの黒点9−1、黒点9−2、黒点9
−3、黒点9−4の各部分における、前記第1の
方法でm=1からm=2回の文字交叉の範囲で得
られる方向寄与度a1、a2、a1′、a2′および2つの
方向寄与度の類似度s12、s12′の1例を第1表と第
2表と第3表に示し、前記第2の方法でm=1か
らm=2回の文字交叉の範囲で得られる方向寄与
度〓1、〓2、〓1′、〓2′および2つの方向寄与度
の類似度r12、r12′を第4表と第5表と第6表に示
す。
光電変換によつて得られた文字パターンを2値化
した文字パターンに対し、手書き漢字のような多
字種、多様な手書き変形をもつ文字対象を効率よ
く分類するために、文字線構造に関する特徴を文
字パターンの外郭付近から抽出し、入力文字パタ
ーンを分類する文字パターンの分類装置に関する
ものである。 (2) 従来の技術の説明 従来、漢字を含む文字パターンの認識装置また
は分類装置として、手書き漢字を対象として芯線
化処理を行つた文字パターンから端交点、屈曲点
等の文字の幾何学的形状を抽出し、これを用いて
各文字線の位置関係、接続関係等を表わし、これ
らの情報とすでに蓄えておいた各文字の辞書テー
ブルとの照合を行い文字パターンを認識する方式
が知られる。しかしながら、この方式では芯線化
処理によつて起こるヒゲ、ボイド等による雑音成
分が発生するため文字の幾何学的形状抽出が困難
になるばかりでなく、手書き文字変形により各文
字線の位置関係、接続関係が著しく変動し、この
変動を吸収するために膨大なデータあるいは膨大
な認識論理を準備しなければならず、効率のよい
認識システムを実現できないという欠点がある。 また、手書き漢字を対象として、2値化、位置
及び大きさの正規化、平滑化を行つた文字パター
ンを水平軸及び垂直軸の2座標軸方向から観測
し、該座標軸上の各位置における該座標軸に直交
する方向の文字部を横切る文字線数を計数し、こ
の情報から特徴ベクトルパターンを作成し、すで
に蓄えておいた各文字の特徴辞書テーブルとのマ
ツチングをとり、文字パターンの分類を行う方
式、あるいは2値化、位置及び大きさの正規化、
平滑化を行つた文字パターンを粗いメツシユの矩
形領域に分割して、当該各矩形領域内に存在する
文字部に対して、水平軸及び垂直軸の2座標軸方
向から観測し、該座標軸上の各位置における該座
標軸に直交する方向の文字部を横切る文字線数を
計数し、この情報から特徴ベクトルパターンを作
成し、すでに蓄えておいた各文字の特徴辞書テー
ブルとのマツチングをとり、文字パターンの分類
を行う方式が知られる。しかしながら、これらの
文字パターン分類方式で計数時に横切る文字線数
は、字種のちがいによる文字線構造の大まかな複
雑さのちがいを区別できるものの、文字線の方向
成分と方向成分別の分布等の、より詳細な文字線
構造のちがいを表わす情報がないため、類似文字
が多く、かつ文字線の位置ずれ等の手書き変形も
多い文字対象を効率よく認識できないという欠点
があつた。 従つて、上記の各方法は手書き漢字などの字種
も多く、変形の大きい文字集合には十分な認識を
行うことが期待し難い。 (3) 発明の目的 本発明は、従来技術によつて2値化、位置及び
大きさの正規化、文字枠取り処理、平滑化を行つ
た文字パターンについて、文字線の方向、接続関
係、平行性等の文字線構造情報を黒点の方向寄与
度をもとにして求め、さらにこれらの情報を複数
方向から文字を走査することにより計数する装置
を提供し、多字種、多変形をもつ手書き漢字を含
む手書き文字パターンを効率よく分類することを
目的としている。 (4) 発明の構成および作用の説明 以下、図面を用いて詳細に説明する。 第1図は、本発明による文字パターンの分類装
置の一実施例のブロツク図である。第1図におい
て回路1は記憶回路で、はじめに2値化された手
書き文字パターンを記憶しておく回路である。装
置2は、この2値化された文字パターンを入力
し、例えば従来まで知られている重心と2次モー
メントを用いて位置及び大きさの正規化処理を行
う文字パターンの位置及び大きさの正規化処理装
置である。装置3は、装置2によつて得られたN
×Nメツシユの正規化文字パターンを入力し、手
書き文字の外郭付近で起きる文字線の極端なつき
出しに対処するため、重心を中心とする文字枠取
り枠Wメツシユの正方領域で文字を枠取りし、枠
外にはみ出した文字部を除去する装置である。装
置4は、装置3によつて得られた文字枠取り後の
文字パターンを入力し、文字線輪郭部分の黒点の
1メツシユの凹、凸をそれぞれうめるまたは取り
除く正規化処理装置である。 装置5は、本発明の主要部をなす特徴抽出装置
で、平滑化処理を行つた文字パターンを入力し、
あらかじめ定めたK方向座標軸(たとえば4方向
の場合には水平方向を基準にして水平軸、+45゜方
向軸、垂直軸、−45゜方向軸の4座標軸)から、(1)
該座標軸に直交する方向に文字を走査し、文字部
と交叉した場合、該交叉文字部の黒画素について
あらかじめ定めたM方向(たとえば、8方向の場
合には0゜、45゜、90゜、135゜、180゜、225゜、270、3
15゜
の8方向)に触手を伸ばし、各方向別に連結する
黒点数を計数し、該黒点の方向寄与度(特願昭56
−46659)を求める処理と、(2)該座標軸に直交す
る方向の走査で文字部とM(M≧2)回交叉した
場合、m(2≦m≦M)回目の交叉時の方向寄与
度と(m−1)回目の交叉時の方向寄与度との類
似度を求める処理とを具備する特徴抽出装置であ
る。 装置6は、装置5によつて割り当てられた方向
寄与度の値、及びその類似度をもとに、文字パタ
ーンを分類するための特徴テーブルを作成し、該
手段によつて作成した特徴テーブルをもとに、す
でにたくわえておいた各文字の特徴辞書テーブル
とマツチングをとり、文字パターンの分類を行う
分類装置である。 装置5の具体例として、4方向座標軸(水平
軸、+45゜方向軸、垂直軸、−45゜方向軸の4座標軸
でそれぞれ1、2、3、4の番号を付与する)か
ら、各座標軸に直交する方向に文字を走査した文
字部と交叉した場合に8方向(0°、45°、90°、
135°、180°、225°、270、315゜の8方向でそれらの
方向にそれぞれ1、2、3、4、5、6、7、8
の番号を付与する)に触手を伸ばし、方向寄与
度、及び2つの方向寄与度の類似度を求め、文字
パターンを分類する場合を例にとつて説明する。 その第1の方法は以下の通りである。装置4に
よつて得られたW×Wメツシユの文字パターンを
水平軸方向を基準にして、4方向座標軸から観測
し、k方向座標軸(k=1、2、3、4)上の位
置j(k=1、3ではj=1、2、…、W、k=
2、4ではj=1、2、…、W′となる。ここで
W′=2W)で該座標軸に直交する方向に走査し、
文字部とm回目に交叉した場合、該交叉時に白点
から黒点に変化した該黒点(走査開始時は直前の
画素が白点と仮定する)の方向寄与度〓nは 〓n=(a1、a2、…、a8)n −(1) なる8次元ベクトルで表わされる。ここで、a1、
a2、…、a8はそれぞれ、8方向の方向寄与度成分
で、該黒点から8方向に触手を伸ばして各方向別
に得られる黒点連結長li(i=1、2、…、8)を
用いて、1例として なる式で表わされる。このaiには、ここで示した
ユークリツド距離以外の距離を適用することが可
能である。 また、該走査時に文字部とm回目に交叉した場
合、該交叉時に黒点から白点に変化した該黒点の
方向寄与度〓n′は 〓n′=(a1′、a2′、…、a8′)n −(3) なる8次元ベクトルで表わされる。ここでai′
(i=1、2、…、8)は(2)式と同様に、該黒点
の8方向別の黒点連結長li(i=1、2、…、8)
を用いて、1例として なる式で表わされる。 さらに、該走査により文字部とM(M≧2)回
交叉した場合に、m(2≦m≦M)回目の交叉時
の方向寄与度〓nおよび〓n′と(m−1)回目の
交叉時の方向寄与度〓n-1およびa′n-1との間の類
似度sn-1,nおよびs′n-1,nは1例として sn-1,n=(〓n-1、〓n)/‖〓n-1‖・‖〓n‖ −(5) s′n-1,n=(〓′n-1、〓′n)/‖〓′n-1‖・‖〓
′n‖−(6) なる式で表わされる。 このようにして求められる〓n、〓′n、sn-1,n、
s′n-1,nのうち、たとえば、 〓n、sn-1,nについてはm=1からm=m0(1≦
m0≦M)の範囲の値を、 a′n、s′n-1,nについては、m=Mからm=M−
m0+1の範囲の値を選ぶことにより、 k方向座標軸上の位置jの走査によつて得られ
る特徴パターン〓kjは 〓kj=(〓1、〓2、…、〓n0、s12、s23、…、
sn0-1,n0、〓′M、〓′M-1、…、 〓′M-n0+1、s′M-1,M、…、s′M-n0,M-n0+1)kj
−(7) で表わされる。 従つて、文字パターンの特徴ベクトル〓は 〓=(g11、g12、…、g1W、g21、g22、…、g2W′、
g31、g32、…、g3W、g41、g42、…、g4W′)
−(8) で表わされる。 このようにして表わされる文字パターンの特徴
ベクトル〓の各要素を複数個まとめて、平均化し
た値を文字パターンの特徴として特徴テーブルを
作成し、公知の識別関数D(〓)を求め、文字パ
ターンを分類する。 次に第2の方法は以下の通りである。前記のW
×Wメツシユの文字パターンを、水平軸方向を基
準にして、4方向座標軸から観測し、k方向座標
軸(k=1、2、3、4)上の位置j(k=1、
3ではj=1、2、…、W、k=2、4ではj=
1、2、…、W′となる。ここでW′=2W)で該
座標軸に直交する方向に走査し、文字部とm回目
に交叉した場合、該交叉時に白点から黒点に変化
した該黒点(走査開始時は直前の画素が白点と仮
定する)の方向寄与度〓nは 〓n=(b1、b2、b3、b4)n −(9) なる4次元ベクトルで表わされる。ここで、b1、
b2、b3、b4はそれぞれ4方向の方向寄与度成分
で、該黒点から8方向に触手を伸ばして各方向別
に得られる黒点連結長li(i=1、2、…、8)を
用いて、1例として なる式で表わされる。このbiには、ここで示した
ユークリツド距離以外の距離を適用することが可
能である。 また、該走査時に文字部とm回目に交叉した場
合、該交叉時に黒点から白点に変化した該黒点の
方向寄与度〓′nは 〓′n(b1′、b2′、b3′、b4′)n −(11) なる4次元ベクトルで表わされる。ここでb1′、
b2′、b3′、b4′は、(10)式と同様に、該黒点の8方向
別の黒点連結長li(i=1、2、…、8)を用い
て、1例として なる式で表わされる。 さらに、該走査により文字部とM(M≧2)回
交叉した場合に、m(2≦m≦M)回目の交叉時
の方向寄与度〓nおよび〓′nと(m−1)回目の
交叉時の方向寄与度〓n-1および〓′n-1との間の
類似度rn-1,nおよびr′n-1,nは1例として rn-1,n=(〓n-1、〓n)/‖〓n-1‖‖〓n‖ −(13) r′n-1,n=(〓′n-1、〓′n)/‖〓′n-1‖‖〓′n
‖−(14) なる式で表わされる。 このようにして求められる〓n、〓′n、rn-1,n、
r′n-1,nのうち、たとえば 〓n、rn-1,nについてはm=1からm=m0(1≦
m0≦M)の範囲の値を、 b′n、r′n-1,nについてはm=Mからm=M−n0+
1の範囲の値を選ぶことにより、 k方向座標軸上の位置jの走査によつて得られ
る特徴パターン〓kjは 〓kj=(〓1、〓2、…〓n0、r12、r23、…、
rn0-1,n0、〓′M、〓′M-1、…、〓′M-n0+1、
r′M-1,M、…、r′M-n0,M-n0+1)kj −(15) で表わされる。 従つて、文字パターンの特徴ベクトル〓は 〓=(〓11、〓12、…、〓1W、〓21、〓22、…、〓
2W′、〓31、〓32、…、〓3W、〓41、〓42、…、
〓4W′) −(16) で表わされる。 このようにして表わされる文字パターンの特徴
ベクトル〓の各要素を複数個まとめて平均化した
値を文字パターンの特徴として特徴テーブルを作
成し、公知の識別関数D(〓)を求め文字パター
ンを分類する。 第2図に、回路1、装置2、装置3、装置4の
動作例を示す。第2図Aは回路1にはじめにたく
わえられている2値化された文字パターンの例で
ある。第2図Bは第2図Aの文字パターンに対し
装置2により位置および大きさの正規化を行つた
文字パターンの例である。第2図Cは第2図Bの
文字パターンに対し、装置3により、文字枠取り
処理を行つた文字パターンの例である。第2図D
は第2図Cの文字パターンに対し、装置4により
平滑化を行つた文字パターンの例である。 第3図は装置5の動作を説明する説明図で方向
寄与度及び2つの方向寄与度の類似度を求めるた
めに観測する4方向座標軸と各軸内の位置jの動
作範囲を示す。第3図の軸8−1は水平方向座標
軸、軸8−2は+45゜方向座標軸、軸8−3は垂
直方向座標軸、軸8−4は−45゜方向座標軸を示
す。第4図は、第3図と同様に装置5の動作を説
明する説明図である。 第4図Aは水平方向座標軸上の位置j=j0で、
座標軸に直交する方向に走査して、文字部と2回
交叉した場合を示したものである。第4図Aの黒
点9−1及び黒点9−3の部分は、該走査により
それぞれ文字部と1回目及び2回目に交叉した場
合の白点から黒点に変化した該黒点を示し、黒点
9−2及び黒点9−4の部分は、該走査により、
それぞれ文字部と1回目及び2回目に交叉した場
合の黒点から白点に変化した該黒点を示す。第4
図Bは文字パターンの黒点の黒点連結長を求める
ための触手を伸ばす方向を矢印で示したものであ
る。第4図Aの黒点9−1、黒点9−2、黒点9
−3、黒点9−4の各部分における、前記第1の
方法でm=1からm=2回の文字交叉の範囲で得
られる方向寄与度a1、a2、a1′、a2′および2つの
方向寄与度の類似度s12、s12′の1例を第1表と第
2表と第3表に示し、前記第2の方法でm=1か
らm=2回の文字交叉の範囲で得られる方向寄与
度〓1、〓2、〓1′、〓2′および2つの方向寄与度
の類似度r12、r12′を第4表と第5表と第6表に示
す。
【表】
【表】
【表】
【表】
【表】
【表】
従つて、第4図Aの水平方向座標軸上の位置j
=j0の走査によつて得られる特徴パターンは、前
記第1の方法では 〓1j0=(0.902、0、0、0、0、0.265、
0.212、0.265、0.653、0、0、0、0、
0.490、0.408、0.408、0.913、 0、0.960、0.185、0.148、0.148、0、
0、0、0、0.727、0.364、0.455、
0.364、0、0、0、0.886) また、前記第2の方法では 〓1j0=(0.902、0.265、0.212、0.265、0.653、
0.490、0.408、0.408、0.913、 0.148、0.960、0.184、0.148、0.364、
0.727、0.364、0.455、0.886) で表わされる。 この〓1j0および〓1j0のベクトルの値は水平方
向座標軸の該位置j=j0で座標軸に直交する方向
に存在する文字線の方向及び接続関係と相対位置
関係及び2つの文字線の平行性の度合を表わして
いる。 前記第2の方法から求めた〓1j0を例にとれば、
〓1j0で〓1ではb1の値が、〓2′ではb2′の値が大き
いことから第4図Aで該位置の上からの走査で
は、まずはじめに水平方向の文字線が存在し、下
からの走査では、はじめに+45゜方向の文字線が
存在することがわかる。前記第1及び第2の方法
はこれら文字線の該走査方向の位置ずれに影響を
うけないため、手書き漢字等に起きやすいこうし
た文字変形にも安定な特徴パターンを得ることが
できるという利点をもつ。 また、前記第1の方法を用いれば、端点、交叉
点、屈曲点等の詳細な幾何学的特徴も抽出できる
という利点をもつ。 さらに、前記第1及び第2の方法で走査に交叉
した2つの文字線の方向寄与度の類似度を得るこ
とにより第5図A,B,Cに示すような手書きに
よる文字線の傾き変動についても各傾き変動パタ
ーンの文字の平行性が保たれているため、これら
変形に影響を受けずに文字を分類できる。 これにより、装置5に示した特徴抽出は幾何学
的特徴は着目する手書き漢字等の文字認識に有効
な手段となる。 (5) 効果の説明 以上、説明したように、本発明によれば、文字
パターンを複数の座標軸方向から観測し、座標軸
上の各位置で座標軸に直交する方向の文字線の方
向寄与度及び2つの方向寄与度の類似度を計数す
るため、文字パターンの各文字線の方向、接続関
係、平行性等の文字線構造情報を簡易な手法で抽
出できるだけでなく、文字線の傾き変動、位置ず
れ等による手書き変形にも強く、多字種、多くの
手書き文字変形をもつ手書き漢字等を含む文字対
象を効率よく分類できるという利点をもつ。
=j0の走査によつて得られる特徴パターンは、前
記第1の方法では 〓1j0=(0.902、0、0、0、0、0.265、
0.212、0.265、0.653、0、0、0、0、
0.490、0.408、0.408、0.913、 0、0.960、0.185、0.148、0.148、0、
0、0、0、0.727、0.364、0.455、
0.364、0、0、0、0.886) また、前記第2の方法では 〓1j0=(0.902、0.265、0.212、0.265、0.653、
0.490、0.408、0.408、0.913、 0.148、0.960、0.184、0.148、0.364、
0.727、0.364、0.455、0.886) で表わされる。 この〓1j0および〓1j0のベクトルの値は水平方
向座標軸の該位置j=j0で座標軸に直交する方向
に存在する文字線の方向及び接続関係と相対位置
関係及び2つの文字線の平行性の度合を表わして
いる。 前記第2の方法から求めた〓1j0を例にとれば、
〓1j0で〓1ではb1の値が、〓2′ではb2′の値が大き
いことから第4図Aで該位置の上からの走査で
は、まずはじめに水平方向の文字線が存在し、下
からの走査では、はじめに+45゜方向の文字線が
存在することがわかる。前記第1及び第2の方法
はこれら文字線の該走査方向の位置ずれに影響を
うけないため、手書き漢字等に起きやすいこうし
た文字変形にも安定な特徴パターンを得ることが
できるという利点をもつ。 また、前記第1の方法を用いれば、端点、交叉
点、屈曲点等の詳細な幾何学的特徴も抽出できる
という利点をもつ。 さらに、前記第1及び第2の方法で走査に交叉
した2つの文字線の方向寄与度の類似度を得るこ
とにより第5図A,B,Cに示すような手書きに
よる文字線の傾き変動についても各傾き変動パタ
ーンの文字の平行性が保たれているため、これら
変形に影響を受けずに文字を分類できる。 これにより、装置5に示した特徴抽出は幾何学
的特徴は着目する手書き漢字等の文字認識に有効
な手段となる。 (5) 効果の説明 以上、説明したように、本発明によれば、文字
パターンを複数の座標軸方向から観測し、座標軸
上の各位置で座標軸に直交する方向の文字線の方
向寄与度及び2つの方向寄与度の類似度を計数す
るため、文字パターンの各文字線の方向、接続関
係、平行性等の文字線構造情報を簡易な手法で抽
出できるだけでなく、文字線の傾き変動、位置ず
れ等による手書き変形にも強く、多字種、多くの
手書き文字変形をもつ手書き漢字等を含む文字対
象を効率よく分類できるという利点をもつ。
第1図は本発明による文字パターンの分類処理
装置の一実施例ブロツク図、第2図は第1図の回
路1、装置2、装置3及び装置4による処理の態
様を説明する説明図、第3図及び第4図は本発明
の主要部である装置5の特徴抽出手段を説明する
ための説明図、第5図は手書き文字の手書き変形
を説明するための説明図を示す。 1は記憶回路、2は文字パターン正規化処理装
置、3は文字パターン枠取り処理装置、4は平滑
化処理装置、5は文字パターンの特徴抽出装置、
6は文字パターンの分類装置、7は文字枠取り
枠、8−1,8−2,8−3,8−4は方向寄与
度及び2つの方向寄与度の類似度を観測するため
の座標軸、9−1,9−2,9−3,9−4は文
字走査時に黒点から白点または白点から黒点に変
化する該黒点を示す。
装置の一実施例ブロツク図、第2図は第1図の回
路1、装置2、装置3及び装置4による処理の態
様を説明する説明図、第3図及び第4図は本発明
の主要部である装置5の特徴抽出手段を説明する
ための説明図、第5図は手書き文字の手書き変形
を説明するための説明図を示す。 1は記憶回路、2は文字パターン正規化処理装
置、3は文字パターン枠取り処理装置、4は平滑
化処理装置、5は文字パターンの特徴抽出装置、
6は文字パターンの分類装置、7は文字枠取り
枠、8−1,8−2,8−3,8−4は方向寄与
度及び2つの方向寄与度の類似度を観測するため
の座標軸、9−1,9−2,9−3,9−4は文
字走査時に黒点から白点または白点から黒点に変
化する該黒点を示す。
Claims (1)
- 1 2値化された文字パターンに対して文字部の
位置及び大きさについて正規化処理を行う手段
と;該手段によつて得られた文字パターンを文字
枠取り枠で枠取りする手段と;該枠取り手段によ
つて得られた文字パターンに平滑化処理を行う手
段とをそなえると共に;該平滑化処理手段によつ
て得られた文字パターンに対して、あらかじめ定
めた複数方向の座標軸について、該座標軸に直交
する方向に文字を走査し、文字部と交叉した場合
に該交叉した文字部の黒画素について、あらかじ
め定めた複数方向に触手を伸ばして各方向別に黒
画素連結長を求め、該黒画素連結長から該交叉黒
画素の方向寄与度を求める第1の手段と;該座標
軸に直交する方向への走査中に文字部と複数回交
叉した場合に該複数回の交叉のうち、ある交叉時
の文字部の方向寄与度とそれ以前に交叉した文字
部の方向寄与度との類似度を求める第2の手段
と;第1の手段と第2の手段とからの出力情報を
少なくとも利用して文字パターンを分類する手段
とを具備することを特徴とする文字パターンの分
類処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57107346A JPS58223884A (ja) | 1982-06-21 | 1982-06-21 | 文字パタ−ンの分類処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP57107346A JPS58223884A (ja) | 1982-06-21 | 1982-06-21 | 文字パタ−ンの分類処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS58223884A JPS58223884A (ja) | 1983-12-26 |
JPH0159627B2 true JPH0159627B2 (ja) | 1989-12-19 |
Family
ID=14456718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP57107346A Granted JPS58223884A (ja) | 1982-06-21 | 1982-06-21 | 文字パタ−ンの分類処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS58223884A (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6081621A (en) * | 1996-10-01 | 2000-06-27 | Canon Kabushiki Kaisha | Positioning templates in optical character recognition systems |
-
1982
- 1982-06-21 JP JP57107346A patent/JPS58223884A/ja active Granted
Also Published As
Publication number | Publication date |
---|---|
JPS58223884A (ja) | 1983-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5058182A (en) | Method and apparatus for handwritten character recognition | |
JP2002024836A (ja) | ディジタルイメージから表題を抽出する方法 | |
US5841905A (en) | Business form image identification using projected profiles of graphical lines and text string lines | |
JPH06501801A (ja) | 文書からの予め定められたデータを位置決定することおよび抽出することを含む文字認識方法および装置 | |
Goto et al. | Extracting curved text lines using local linearity of the text line | |
Chi et al. | Separation of single-and double-touching handwritten numeral strings | |
Maddouri et al. | Baseline extraction: comparison of six methods on IFN/ENIT database | |
JPH0159627B2 (ja) | ||
KR0186025B1 (ko) | 후보 문자 분류 방법 | |
JPS634229B2 (ja) | ||
JPS6238752B2 (ja) | ||
JPH026112B2 (ja) | ||
JP3104355B2 (ja) | 特徴抽出装置 | |
JPS634231B2 (ja) | ||
JP3140079B2 (ja) | 罫線認識方法及び表処理方法 | |
Elrajubi et al. | Angle features extraction of handwritten signatures | |
JP3009237B2 (ja) | 特徴抽出方法 | |
JP2797523B2 (ja) | 図面続取装置 | |
JP3365941B2 (ja) | 文字パターン認識方法及びその装置 | |
JP2832035B2 (ja) | 文字認識装置 | |
JP2918363B2 (ja) | 文字分類方法及び文字認識装置 | |
JPS5855553B2 (ja) | 文字パタ−ンの分類装置 | |
JPH0145669B2 (ja) | ||
JP2001060250A (ja) | 文字認識方法および装置 | |
JP2681599B2 (ja) | 文字認識装置 |