JPH11134436A - 文字パターン認識方法及びその装置 - Google Patents
文字パターン認識方法及びその装置Info
- Publication number
- JPH11134436A JPH11134436A JP9298029A JP29802997A JPH11134436A JP H11134436 A JPH11134436 A JP H11134436A JP 9298029 A JP9298029 A JP 9298029A JP 29802997 A JP29802997 A JP 29802997A JP H11134436 A JPH11134436 A JP H11134436A
- Authority
- JP
- Japan
- Prior art keywords
- character
- pattern
- character pattern
- contribution
- directional
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
字対象を、高精度で認識する文字パターン認識方法及び
その装置を提供する。 【解決手段】 前処理部1−2にて、2値化した文字入
力パターン1−1に対し位置及び大きさの正規化を施
す。特徴抽出部1−3は、この文字パターンの特徴とし
て、複数方向からの走査により、文字線の相対的な配置
関係、特に文字線間の平行度や文字線間の角度の情報
を、文字パターンの文字部から方向寄与度を求め、文字
線間で方向寄与度同士の差分を計算することで求める。
識別部1−4は、この特徴を用いて特徴辞書テーブルと
のマッチング法により文字パターンを識別する。該特徴
は、個々の文字線の傾きが変化していても、文字線同士
の平行性や角度が保たれている場合ほぼ同一の情報が得
られ、文字線の傾きの変化の影響を受けにくくし、手書
き変形の多い文字対象を高精度に認識可能とする。
Description
識方法及び装置、特に光電変換によって得られた文字パ
ターンを2値化した文字パターンに対して、手書き漢字
のような多字種、多様な手書き変形をもつ文字対象を高
精度に認識するために、文字線の構造に関する特徴を文
字パターンから抽出し、入力文字パターンを認識する方
法及びその装置に関するものである。
び装置として、2値化、位置及び大きさの正規化を行っ
た文字パターンを複数方向の座標軸から観測し、該座標
軸上の各位置における該座標軸に直交する方向の文字部
を横切る文字線数を計数し、この情報から特徴ベクトル
パターンを作成し、すでに蓄えておいた各文字の特徴辞
書テーブルとのマッチングをとり、文字パターンの認識
を行う方法及び装置があった。
法及び装置として、2値化、位置及び大きさの正規化を
行った文字パターンを複数方向の座標軸から観測し、該
座標軸から走査した際に交差した文字部の黒画素につい
て、文字線の方向寄与度(特願昭56−46659号)
を求めることにより、文字パターンを認識する方法及び
装置があった。
来の第一の文字パターン認識方法及び装置では、計数時
に横切る文字線数によって字種の違いによる文字線構造
の大まかな複雑さの違いを区別できるものの、より詳細
な文字線構造の違いを表す情報がない為、類似文字が多
くかつ手書き変形も多い文字対象を高精度に認識できな
いという問題点があった。
方法及び装置では、文字線の傾きの変化等の手書き変形
の多い文字対象を高精度に認識できないという問題点が
あった。
てなされたもので、その課題は、文字線の傾きの変化等
の手書き変形の多い文字対象を、高精度で認識する文字
パターン認識方法及びその装置を提供することにある。
め、本発明は、2値化された文字パターンに対して、あ
らかじめ定めた複数の走査方向に文字を走査し、文字部
と交差した場合、該交差した文字部の黒画素についてあ
らかじめ定めた複数方向に触手を伸ばして各方向別に黒
画素の連結長を求め、該黒画素連結長から求められる該
黒画素の文字部の方向成分別の分布状況を表す方向寄与
度の値を求め、該走査方向への走査中に文字部と複数回
交差した場合に該複数回の交差のうち、ある交差時の文
字部の方向寄与度とその直前に交差した文字部の方向寄
与度との差分を求め、該差分の値を用いて、文字パター
ンを認識する処理を行うことを特徴とする文字認識方法
を手段とする。
字の位置及び大きさについて正規化処理を行う前処理部
と、該前処理部によって得られた文字パターンに対し
て、あらかじめ定めた複数の走査方向に文字を走査し、
文字部と交差した場合、該交差した文字部の黒画素につ
いてあらかじめ定めた複数方向に触手を伸ばして各方向
別に黒画素の連結長を求め、該黒画素連結長から求めら
れる該黒画素の文字部の方向成分別の分布状況を表す方
向寄与度を求め、該走査方向への走査中に文字部と複数
回交差した場合に該複数回の交差のうち、ある交差時の
文字部の方向寄与度とその直前に交差した文字部の方向
寄与度との差分を特徴として求める特徴抽出部と、該特
徴を利用して文字パターンの識別処理を行う識別部と、
を備えることを特徴とする文字認識装置を手段とする。
規化を施された文字パターンについて、文字線の傾きの
変化等を受けにくい特徴を用いて文字パターンの識別処
理を行うことにより、上記の課題を解決する。すなわ
ち、文字線の相対的な配置関係、特に文字線間の平行度
や、文字線間のなす角度に関する情報を、文字パターン
における文字部から方向寄与度を求め、文字線間で方向
寄与度同士の差分を計算することで、特徴として求める
ことにより、個々の文字線が傾きの変化を起こしている
場合においても、文字線同士の平行性やなす角度が保た
れている場合にはほぼ同一の情報を得られるようにし
て、文字線の傾きの変化の影響を受けにくくし、手書き
変形の多い文字対象を高精度に認識可能とする。
の形態を説明する。
置の一実施形態例を説明する構成図である。図中、1−
1は入力文字パターン、1−2は前処理部、1−3は特
徴抽出部、1−4は識別処理部、1−5は識別結果であ
る。
って得られた文字パターンを2値化した文字パターンで
ある。
れている位置の正規化処理法を用いて、入力文字パター
ン1−1を構成する全黒点のx,y座標値の各々の平均
値を算出して文字の重心と定義し、ついで該重心が文字
枠の中心位置にくるように入力パターン全体の平行移動
処理を行う。また、例えば従来までに知られている大き
さの正規化処理法を用いて、重心から各筆点への距離の
平均値があらかじめ定めた正規化半径に等しくなるよう
に、重心回りに一様に文字パターンの拡大/縮小処理を
行う。
正規化処理により入力文字パターンが正規化される例を
示す。図2(a)は、入力文字パターンの例である。図
2(b)は、前処理部1−2において該入力文字パター
ン例に対して位置と大きさの正規化処理を行った後の文
字パターンである。また、以上説明した前処理部の例で
は、位置と大きさの正規化処理のみを行ったが、位置と
大きさの正規化処理後の文字パターンが文字枠をはみ出
した場合には、文字枠にはみ出した文字部を除去する枠
取り処理を行うことも可能である。また、位置と大きさ
の正規化処理後の文字パターンの文字線輪郭部分の黒点
の1メッシュの凹凸をそれぞれ埋めるまたは取り除く平
滑化処理を行うことも可能である。文字「圧」におい
て、位置と大きさの正規化処理後の文字パターンが文字
枠をはみ出した例を図2(c)に、枠取り処理を行った
例を図2(d)に、平滑化処理を行った例を図2(e)
にそれぞれ示す。
すもので、前処理部1−2において正規化処理をされた
文字パターンを入力し、あらかじめ定めた複数の走査方
向、例えば8方向の場合は、水平方向を基準にして水平
方向、+45°方向、+90°方向、+135°方向、
+180°方向、−135°方向、−90°方向、−4
5°方向の8方向に文字パターンを走査し、文字部と交
差した場合、該走査方向に該交差文字部の黒画素につい
てあらかじめ定めた複数方向、例えば8方向の場合には
0°、45°、90°、135°、180°、225
°、270°、315°の8方向に触手を伸ばし、各方
向に連結する黒点の点数を計数し、該黒点の方向寄与度
(特願昭56−46659号)を求める処理と、該走査
方向の走査で文字部とM(M≧2)回交差した場合、m
(2≦m≦M)回目の交差時の方向寄与度と(m−1)
回目の交差時の方向寄与度との差分を求める処理を行
う。
て得られた差分の値をもとに文字パターンを識別するた
めの特徴テーブルを作成し、該特徴テーブルをもとに、
すでに蓄えておいた各文字の特徴辞書テーブルと従来ま
でに知られているマッチング方法によりマッチングをと
り、文字パターンの識別を行う。
して、走査方向を8方向(水平方向を基準にして水平方
向、+45°方向、+90°方向、+135°方向、+
180°方向、−135方向、−90°方向、−45°
方向の8方向でそれぞれ1,2,3,4,5,6,7,
8の番号を付ける)に文字を走査し、文字部と交差した
場合に該走査方向に該交差文字部の黒画素について8方
向(0°、45°、90°、135°、180°、22
5°、270°、315°の8方向でそれぞれ1,2,
3,4,5,6,7,8の番号を付ける)に触手を伸ば
し、該黒点の方向寄与度を求め、文字パターンを識別す
る場合を説明する。
8方向に定めた場合の図を示す。図中、3−1,3−
2,…3−8は、それぞれ文字パターンを観測するため
の操作方向である。
ッシュの文字パターンを水平方向を基準にして8方向か
ら観測し、s走査方向(s=3−1,3−2,…,3−
8)と直交する座標軸上の位置t(s=3−1,3−
3,3−5,3−7ではt=1,2,…,N、s=3−
2,3−4,3−6,3−8ではt=1,2,…,
N′、N′=2N)で、文字部とm回交差した場合、該
交差時に白点から黒点に変化した該黒点(走査開始時は
直前の画素が白点と仮定する)の方向寄与度Amは、 Am=(α1,α2,α3,α4,α5,α6,α7,α8)m なる8次元ベクトルで表される。ここで、α1,α2,
…,α8はそれぞれ、8方向の方向寄与度成分で、該黒
点から8方向に触手を伸ばし各方向別に得られる黒点連
結長li(i=1,2,…,8)を用いて、例として
2)回交差した場合に、m(2≦m≦M)回目の交差時
の方向寄与度Amと(m−1)回目の交差時の方向寄与
度Am-1との間の差分Γm-1,mは、 Γm-1,m=(γ1,γ2,γ3,γ4,γ5,γ7,γ8)m-1,
m γi=αm-1,i−αm,i なる式で表される。
ち、m=2からm=m′(2≦m′≦M)までの範囲を
選ぶことにより、s走査方向と直交する座標軸上の位置
tからの走査によってえられる特徴パターンfstは、
徴ベクトルFは、
徴ベクトルFの各要素を複数個ずつまとめた値を文字パ
ターンの特徴として特徴テーブルを作成し、識別部1−
4において、例えば従来までに知られている識別関数と
してユークリッド距離などの識別関数D(F)を求め、
文字パターンを識別する。
徴ベクトルと、あらかじめ蓄えられている特徴辞書テー
ブルの各文字種ごとの特徴ベクトル間で距離値の演算を
行い、距離値の一番小さい(関数によっては一番大き
い)値をとった文字を候補文字として出力する。
(f1,f2,…,fk,…,fK)、特徴辞書テーブルの
各文字Ci(1≦i≦L、Lは総字種数)の特徴ベクト
ルをSi=(si1,si2,…,siK)とすると、例えば
ユークリッド距離の場合、Ci(i=1〜L)までの字
種の間で、
の字種を正解文字パターンとして出力する。
処理部1−2によって得られたN×Nメッシュの文字パ
ターンを水平方向を基準にして8方向から観測し、s走
査方向(s=3−1,3−2,…,3−8)と直交する
座標軸上の位置t(s=3−1,3−3,3−5,3−
7ではt=1,2,…,N、s=3−2,3−4,3−
6,3−8ではt=1,2,…,N′、N′=2N)
で、文字部とm回交差した場合、該交差時に白点から黒
点に変化した該黒点(走査開始時は直前の画素が白点と
仮定する)の方向寄与度Bmは、 Bm=(β1,β2,β3,β4)m なる4次元ベクトルで表される。ここで、β1,β2,
…,β4はそれぞれ、4方向の方向寄与度成分で、該黒
点から8方向に触手を伸ばし各方向別に得られる黒点連
結長li(i=1,2,…,8)を用いて、例として
2)回交差した場合に、m(2≦m≦M)回目の交差時
の方向寄与度Bmと(m−1)回目の交差時の方向寄与
度Bm-1との間の差分Δm-1,mは、 Δm-1,m=(δ1,δ2,δ3,δ4)m-1,m δi=βm-1,i−βm,i なる式で表される。
m=2からm=m′(2≦m′≦M)までの範囲を選ぶ
ことにより、s走査方向と直交する座標軸上の位置tか
らの走査によって得られる特徴パターンgstは、
徴ベクトルGは、
徴ベクトルGの各要素を複数個ずつまとめた値を文字パ
ターンの特徴として特徴テーブルを作成し、識別部1−
4において、例えば従来までに知られている識別関数と
してユークリッド距離などの識別関数D(G)を求め、
文字パターンを識別する。
場合における、文字部と3回交差した場合を示す。4−
1、4−2及び4−3は、それぞれ該走査によりそれぞ
れ文字部と1回目、2回目及び3回目に交差した場合の
白点から黒点に変化した該黒点を示す。
を求めるために触手を伸ばす方向として、8方向5−
1,5−2,…,5−8にした場合を示す。図5(b)
に、文字部の黒点から該黒点の方向寄与度を求めるため
に、触手を伸ばして黒点連結長を求める様子を示す。
文字線の傾き変動が生じた文字パターン例を示す。6−
1、6−2は、図6(a)の文字を下側からの走査によ
りそれぞれ文字部と1回目及び2回目に交差した場合の
白点から黒点に変化した該黒点を示し、6−3、6−4
は、図6(b)の文字を下側からの走査によりそれぞれ
文字部と1回目及び2回目に交差した場合の白点から黒
点に変化した該黒点を示したものである。6−1、6−
2、6−3、及び6−4の各黒点における、前記第2の
方法でm=1からm=2回の文字交差の範囲で得られる
方向寄与度Ba1,Ba2,Bb1,Bb2の値を第1表
(a),(b)、及び2つの方向寄与度の相関Δa12,
Δb12の値を第2表(a),(b)に示す。
ベクトルとして用いた場合では、傾き変動の影響を受け
て値が変化しているが、差分Δを特徴ベクトルとして用
いることにより、文字線間の平行性やなす角度が保たれ
たまま傾き変動が生じたパターンの場合には、これらの
変形に影響を受けにくくなっていることが分かる。以下
同様の処理により文字パターン全体から得られた差分Δ
を特徴ベクトルとして用いることにより、文字線間の平
行性やなす角度が保たれたまま傾き変動が生じたパター
ンの場合には、文字を正しく認識することができる。
文字線間の平行度や、文字線間のなす角度に関する情報
を求めることにより文字線の相対配置に関する情報が抽
出できるので、文字線の傾きの変動の影響を受けにくく
なり、手書き変形の多い文字対象を高精度に認識するこ
とが可能になる。
施形態例を説明する構成図である。
上記実施形態例の前処理部における前処理の様子を示す
図である。
方向寄与度を観測する為の走査方向とそれに直交する座
標軸を示す図である。
ターンを走査した場合における文字部と交差した例を示
す図である。
部において黒点連結長を求める様子を表した図である。
書き文字の手書き変形を説明するための図である。
−7,3−8…文字パターンを観測するための走査方向 4−1…1回目に交差した黒点 4−2…2回目に交差した黒点 4−3…3回目に交差した黒点 5−1,5−2,5−3,5−4,5−5,5−6,5
−7,5−8…黒点連結長を求めるための触手を伸ばす
方向 6−1,6−3…1回目に交差した黒点 6−2,6−4…2回目に交差した黒点
Claims (2)
- 【請求項1】 2値化された文字パターンに対して、あ
らかじめ定めた複数の走査方向に文字を走査し、文字部
と交差した場合、該交差した文字部の黒画素についてあ
らかじめ定めた複数方向に触手を伸ばして各方向別に黒
画素の連結長を求め、 該黒画素連結長から求められる該黒画素の文字部の方向
成分別の分布状況を表す方向寄与度の値を求め、該走査
方向への走査中に文字部と複数回交差した場合に該複数
回の交差のうち、ある交差時の文字部の方向寄与度とそ
の直前に交差した文字部の方向寄与度との差分を求め、 該差分の値を用いて、文字パターンを認識する処理を行
う、 ことを特徴とする文字認識方法。 - 【請求項2】 2値化された文字パターンに文字の位置
及び大きさについて正規化処理を行う前処理部と、 該前処理部によって得られた文字パターンに対して、あ
らかじめ定めた複数の走査方向に文字を走査し、文字部
と交差した場合、該交差した文字部の黒画素についてあ
らかじめ定めた複数方向に触手を伸ばして各方向別に黒
画素の連結長を求め、該黒画素連結長から求められる該
黒画素の文字部の方向成分別の分布状況を表す方向寄与
度を求め、該走査方向への走査中に文字部と複数回交差
した場合に該複数回の交差のうち、ある交差時の文字部
の方向寄与度とその直前に交差した文字部の方向寄与度
との差分を特徴として求める特徴抽出部と、 該特徴を利用して文字パターンの識別処理を行う識別部
と、 を備えることを特徴とする文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP29802997A JP3365941B2 (ja) | 1997-10-30 | 1997-10-30 | 文字パターン認識方法及びその装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP29802997A JP3365941B2 (ja) | 1997-10-30 | 1997-10-30 | 文字パターン認識方法及びその装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11134436A true JPH11134436A (ja) | 1999-05-21 |
JP3365941B2 JP3365941B2 (ja) | 2003-01-14 |
Family
ID=17854203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP29802997A Expired - Fee Related JP3365941B2 (ja) | 1997-10-30 | 1997-10-30 | 文字パターン認識方法及びその装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3365941B2 (ja) |
-
1997
- 1997-10-30 JP JP29802997A patent/JP3365941B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP3365941B2 (ja) | 2003-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5410611A (en) | Method for identifying word bounding boxes in text | |
RU2621601C1 (ru) | Устранение искривлений изображения документа | |
JPH06162198A (ja) | パターン認識装置 | |
KR100220213B1 (ko) | 문자화상의 히스토그램의0-1패턴표현에 기초한 문자인식방법 및 장치 | |
JP4543675B2 (ja) | 文字・図形の認識方法 | |
JP2985893B2 (ja) | パターン認識装置 | |
JPH11134436A (ja) | 文字パターン認識方法及びその装置 | |
JP2785747B2 (ja) | 文字読取装置 | |
JP2965165B2 (ja) | パターン認識方法及び認識用辞書作成方法 | |
JP3368807B2 (ja) | 文字認識方法及び装置、並びに、文字認識プログラムを格納した記憶媒体 | |
JP2623559B2 (ja) | 光学式文字読取装置 | |
JP2885476B2 (ja) | 画像処理方法および装置 | |
JP2002334301A (ja) | 2値イメージの特徴点抽出方法及び特徴点抽出プログラム | |
JPH09297818A (ja) | 文字認識方法および装置 | |
JP2941322B2 (ja) | 図面処理装置 | |
JP3104355B2 (ja) | 特徴抽出装置 | |
JPH0877293A (ja) | 文字認識装置および文字認識用辞書作成方法 | |
JP2001060250A (ja) | 文字認識方法および装置 | |
JPH09297819A (ja) | 文字認識方法および装置 | |
JPS634231B2 (ja) | ||
JP2000099631A (ja) | パターン認識装置及びパターン認識方法 | |
JPH1021332A (ja) | 非線形正規化方法 | |
JP2006323511A (ja) | 記号認識方法及び装置 | |
JP2002099876A (ja) | 文字認識装置,文字認識方法および文字認識プログラムを記録した記録媒体 | |
JPH09231314A (ja) | オンライン手書き文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071101 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081101 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091101 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101101 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101101 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111101 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111101 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121101 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121101 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131101 Year of fee payment: 11 |
|
LAPS | Cancellation because of no payment of annual fees |