JPH0547871B2 - - Google Patents

Info

Publication number
JPH0547871B2
JPH0547871B2 JP58152998A JP15299883A JPH0547871B2 JP H0547871 B2 JPH0547871 B2 JP H0547871B2 JP 58152998 A JP58152998 A JP 58152998A JP 15299883 A JP15299883 A JP 15299883A JP H0547871 B2 JPH0547871 B2 JP H0547871B2
Authority
JP
Japan
Prior art keywords
character
pattern
coordinate
barycenter
coordinates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP58152998A
Other languages
English (en)
Other versions
JPS6045885A (ja
Inventor
Shigeru Goto
Koichi Higuchi
Yoshuki Yamashita
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP58152998A priority Critical patent/JPS6045885A/ja
Publication of JPS6045885A publication Critical patent/JPS6045885A/ja
Publication of JPH0547871B2 publication Critical patent/JPH0547871B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
(技術分野) 本発明は高速で認識精度の良い文字認識方法に
関するものである。 (背景技術) 従来、文字図形パターンより所望の方向のスト
ローク成分をあらわすサブパターンを抽出し、前
記サブパターンについて前記文字図形パターンの
方形外接文字枠の4辺のうち2辺以上の各辺上の
各点から所定の方向に走査して走査線上における
文字線の位置を検出し、走査を開始した辺上の点
と前記検出したそれぞれの文字線との距離のN乗
和を特徴量(以下辺距離特徴という)として抽出
して、前記外接文字枠の各辺をM個の区間に分割
し、各区間内の前記特徴量の平均値を要素として
M×K次元(K:特徴を抽出した総辺数)の特徴
マトリクスを抽出し、あらかじめ用意した辞書を
参照して、文字図形の認識を行なう文字認識方式
が提案されている。この方式における文字ストロ
ークの位置情報は分割単位領域に保持され、分割
単位領域の設定は認識率を左右する一要素とな
る。文字枠のX軸、Y軸方向を夫々均等に分割し
て、分割単位領域を設定した場合は、印刷文字で
は字体の相違に基づくストロークの位置変動の影
響、あるいは手書文字では個人差に基づくストロ
ークの位置変動の影響が大きく現われる。 第1図は、漢字「図」のストロークの位置が異
つた2つの例を示しており、ORGAとORGBは
漢字「回」の入力文字図形パターン、HFTA、
HFTB、HFBA、HFBBはそれら水平サブパタ
ーンの文字枠上辺および下辺に対する辺距離特徴
である。第1図に示した例で、一点鎖線で示すよ
うに、文字枠のX軸方向を均等に4分割して分割
単位領域v1〜v4を設定した場合、水平サブパター
ンに対して、辺距離特徴HFTA、HFTB間と
HFBA、HFBB間で異なるものとなり、従つて
2つの入力文字図形パターンORGA、ORGBに
対する特徴マトリクスも異つたものとなり、結果
として認識率が低下するか又は文字変形を考慮し
た多くの辞書が必要となる。 (発明の課題) 本発明の目的は、以上のような欠点を除去する
ために分割座標をストロークの位置変動に追従し
て設定することによりストローク位置変動の影響
を軽減することにある。 (発明の構成および作用) 第3図は本発明による文字認識装置の実施例を
示したものである。 第2図は特徴抽出結果例である。 本実施例の動作は、読取機構にセツトされた帳
票上の文字は光電変換部2において2値の量子化
されたデジタル電気信号に変換され、パターンレ
ジスタ3に格納される。それと同時に、文字線幅
計算部4において入力パターンの線幅(W)が計算さ
れる。サブパターン抽出部5は、パターンレジス
タについて垂直スキヤンを全面行なつて、黒ビツ
トの連続長さと線幅計算部4において計算された
線幅との関係より垂直サブパターン(VSP)を
抽出する。同様に、水平スキヤンにより水平サブ
パターン(HSP)を、右斜め45゜スキヤンにより
右斜めサブパターン(RSP)を、左斜め45゜スキ
ヤンにより左斜めサブパターン(LSP)を抽出す
る。文字枠検出部6はパターンレジスタ内の文字
図形パターンに外接する方形の枠(以後文字枠と
称する)を検出し、パターンレジスタで定義され
る2次元平面における前記文字枠を規定する為の
位置座標を特徴抽出部10へ送出する。以後の説
明については文字枠の左下を原点とし、水平方向
をX軸、垂直方向をY軸とする座標系を使用す
る。特徴抽出部10はまず垂直サブパターンにつ
いて、文字枠を構成する4辺のうち垂直な辺であ
る左辺上の点P(0,y)から水平走査を開始し、
白点から黒点への変化点をすべて検出し、検出し
た変化点と前記走査を開始した垂直辺上の点Pと
の間の距離すなわちX座標の差を文字枠のX方向
の長さを正規化定数として正規化した値のN乗
(Nは定数、本実施例ではN=2)の値の計算を
前記検出したすべての変化点について行ないそれ
ぞれの変化点について垂直辺との距離のN乗の総
和を配列Vl(y)に格納する。但し前記白点(あるい
は白ビツト)とは文字背景部を表わしP(x,y)
=0である。黒点(あるいは黒ビツト)は文字線
部を表しP(x,y)=1である。また式(1)は前記
のVl(y)を式で表わしたものであり、式中の△xk
それぞれの変化点と文字枠辺との距離を表わす。
但しk=1,…,VK,VKは検出された変化点
個数を表わす。又式(1)中の△Xは文字枠の水平方
向の長さであり、Cは整数化定数であり本実施例
においてはC=50とした。 Vl(y)=Vkk=1 {△Xk/△X×C}2 ……(1) 上記の様な処理を文字枠の2つの垂直辺上のす
べての点を開始点として行ない、垂直サブパター
ンについて、文字枠の左左辺上の点から水平走査
を開始して作成する配列Vl(i)、文字枠の右辺上の
点から水平走査を開始して作成する配列Vr(i)を
抽出する。但しi=0,……,YT9,YTは文字
枠上辺のY座標である。同様な処理により、水平
サブパターン、右斜めサブパターン、左斜めサブ
パターンについては文字枠の2個の水平辺上のす
べての点から垂直走査を行なつて、水平サブパタ
ーンについて配列Hb(j),Ht(j),右斜めサブパタ
ーンについての配列Rb(j),Rt(j)、左斜めサブパ
ターンについての配列Lb(j),Lt(j)を抽出する。但
しj=0,……,XR,XRは文字枠右辺のX座
標である。又Hb(j),Ht(j),Rb(j),Rt(j),Lb(j),
Lt(j)を抽出する際における、走査開始点と前記変
化点との距離の正規化定数としては文字枠の垂直
方向の長さ△Yを使用した。 次に、文字投影作成部7はパターンレジスタの
入力文字パターンをX軸、Y軸(夫々パターンレ
ジスタの2次元座標における水平方向、垂直方
向)へ投影して黒ビツト数の分布を求め、黒ビツ
ト数分布SX(x),SY(y)を作成する。 SX(x)=y=YTy=0 P(x,y) SY(y)=x=XRx=0 P(x,y) 但し、x,yはパターンレジスタ3における2
次元座標である。 第1図に示した漢字「回」の2つの入力文字パ
ターンORGA、ORGBに対する黒ビツト分布SX
(x),SY(y)と水平サブパターンに対する辺距離特
徴HFTA、HFTBを第4図に示す。重心検出部
8は、文字枠のX、Y各軸方向の全範囲O〜
XR,O〜YT及び前の過程で検出した重心座標
でその範囲O〜XR,O〜YTを分割した各範囲
を対象として、入力文字パターンの夫々の黒ビツ
ト数分布SX(x),SY(y)の重心座標系列X(Mp),
Y(Mq)を求めるものであり、各範囲の1次モー
メントの和をその範囲の黒ビツト和で除算するこ
とによつて求めるものである。但し、Mp,Mq
座標値の大きさの順に付した重心座標番号であ
り、Mp=1〜MX(MXはX軸方向の重心の個数
であつて奇数)Mq=1〜MY(MYはY軸方向の
重心の個数であつて奇数)である。X軸方向の重
心座標の個数MXとしては、15個程度の比較的多
い数(分割数に比べて)を採用することが望まし
いが、説明の簡略化のために7個の重心座標X
(Mp)を検出する場合について述べると、まず、
文字枠のX軸方向の範囲O〜XRを対象として、
次式に示すように入力文字パターンの黒ビツト数
分布SX(x)の1次モーメント和をその範囲の黒ビ
ツト和で除算することによつて、中央の重心座標
番号M4の重心座標X(M4)を求める(第4図参
照)。 X(M4)=x=XRx=0 SX(x)・x/x=XRx=0 SX(x) 次いで、その重心座標X(M4)で分割された
夫々の範囲、O0〜X(M4),X(M4)〜XRを対象
として2つの重心座標X(M2),X(M6)を求め
る。 X(M2)=x=X(M4)x=0 SX(x)・x/x=X(M4)x=0 SX(x) X(M6)=x=XRx=(M4) SX(x)・x/x=XRx=(M4) SX(x) 次いで、これまで検出された重心座標X(M2),
X(M4),X(M6)で分割された範囲O〜X
(M2),X(M2)〜X(M4),X(M4)〜X(M6),
X(M6)〜XRrを対象として4個の重心座標X
(M1),X(M3),X(M5),X(M7)を求める。 X(M1)=x=X(M2)x=0 SX(x)・x/x=(M2)x=0 SX(x) X(M3)=x=X(M4)x=X(M2) SX(x)・x/x=X(M4)x=X(M2) SX(x) 〓 X(M7)=x=XRx=X(M6) SX(x)・x/x=XRx=X(M6) SX(x) Y軸方向の重心座標Y(Mq)の検出も検出する
重心座標個数MYを7個とした場合、まず、文字
枠の範囲O〜YTを対象として入力文字パターン
の黒ビツト分布SY(y)の重心座標Y(M4)を検出
し、次いで方形文字外接枠を重心座標で2分した
範囲O〜Y(M4),Y(M4)〜YTそれぞれを対象
として黒ビツト分布SY(y)の重心座標Y(M2),Y
(M6)を検出し、更にこれまでに検出された重心
座標Y(M2),Y(M4),Y(M6)でY軸方向の方
形文字外接枠を分割した夫々の範囲O〜Y(M2),
Y(M2)〜Y(M4),Y(M4)〜Y(M6),Y(M6
〜YTを対象として黒ビツト分布SY(y)の重心座
標を検出することによつて、計7個の重心座標Y
(M1)〜Y(M7)を検出する。 文字枠分割点決定部9は、各サブパターン対応
のX,Y軸方向の分割数をNX,NYとし、各サ
ブパターン対応のX,Y軸各方向の分割座標系列
をX(ki),Y(kj)として、X,Y軸各方向の重
心座標系列X(Mp)Y(Mq)を分割座標候補とし
て、重心座標番号Mp,Mqを分割座標番号koi,kj
にほぼ均等に対応づけて分割座標X(ki),Y(kj
を決定するものである。 この実施例における分割単位領域の分割形式
は、全てのサブパターンHSP,VSP,LSP,
RSPに対して同一であり、X軸Y軸ともに同一
数の分割領域に分割するものである。文字枠を
NXあるいはNYなる個数の分割単位領域に分割
し分割座標系列X(ki),Y(kj)を決定する。こ
の実施例においてはNX=NY=M=8である。
X,Y軸各方向の重心座標番号Mp,MqとX,Y
軸方向の分割座標番号ki,kjをほぼ均等に対応づ
けて分割座標系列X(ki),K(kj)を決定するた
めに、次記に示す如きテーブルが用意されてい
て、X,Y軸各方向の分割数NX,NYに対応し
てこのテーブルから重心座標番号Mp,Mqを読み
出し、その重心座標番号Mp,Mqに対応した重心
座標X(Mp),Y(Mq)を分割座標X(ki),Y(kj
として決定する。
【表】 このテーブルは、重心検出部8で検出する重心
座標の個数MX,MYが7個の場合であるが、一
般的な場合においても、X,Y軸各方向の分割単
位内の重心個数が均一に含まれるように対応さ
せ、且つその際余分の重心座標が残つた場合は両
端の領域から順に1個多い重心座標が含まれるよ
うに対応させることによつて作ることができる。 特徴マトリクス抽出部11は特徴抽出部10に
おいて抽出された8種(V1(i),Vk(i),Hb(j),Ht
(j),Rb(j),Rt(j),Lb(j),Lt(j))の配列を使用し、
前記分割座標からきまる複数の分割単位領域に分
割し各分割領域毎の値の平均値を計算することに
より(分割数)×8次元の特徴マトリクスF(m,
n)を抽出する。但しm=1,…,M,n=1,
…,8識別部12は特徴マトリクス抽出部7で抽出
された特徴マトリクスと、同形式で記述された標
準文字マスク(m,n)との間の式(2)で示され
る距離(D)を計算しその距離が最も小さい値を与え
る標準文字マスクのカテゴリ名を文字名出力13
へ出力する。 D=√〓{(,)−(,)}2 ……(2) (発明の効果) 以上説明した様に本実施例においては、方形文
字外接枠のX軸,Y軸各方向を分割領域に分割し
て分割単位領域を設定する場合、X,Y軸方向で
ストロークの位置変動が保存されている黒ビツト
数分布の重心座標系列に基づいているため、印刷
文字で字体の相違に基づくストロークの位置変動
の影響、あるいは手書文字では個人差に基づくス
トロークの位置変動の影響を吸収出来る利点があ
る。 本発明は方形文字外接枠の分割座標を文字図形
パターンのX軸,Y軸各方向の黒ビツト数分布の
重心座標を基準として決定しているので、字体あ
るいは個人差などによるストロークの変動に対し
てもストロークの含まれる分割単位領域の位置が
安定であり、精度の高い認識が出来るという利点
がある。
【図面の簡単な説明】
第1図a〜dは入力図形パターン例を示す図、
第2図は特徴例を示す図、第3図は本発明の文字
認識装置における実施例を示す図、第4図a〜h
は入力図形パターン例と重心座標系列との関係を
示す図である。 1……光入力、2……光電変換部、3……パタ
ンレジスタ、4……文字線幅計算部、5……サブ
パタン抽出部、6……文字枠検出部、7……文字
投影作成部、8……重心検出部、9……文字枠分
割点決定部、10……特徴抽出部、11……特徴
マトリクス抽出部、12……識別部、13……文
字名出力。

Claims (1)

  1. 【特許請求の範囲】 1 文字図形パターンを所望の方向に走査して、
    当該走査方向における文字線の断面を検出し、断
    面長が前記文字図形パターンの文字線幅より十分
    長い断面を抽出することによりサブパターンを抽
    出し、前記サブパターンについて前記文字図形パ
    ターンの方形文字外接枠の4辺のうち、少なくと
    も2辺以上の辺上の各点から所定の方向へ走査し
    て走査線上におけるすべての文字線の位置を検出
    し走査を開始した辺上の点と前記検出した文字線
    との距離を前記文字外接枠の前記所定の方向の大
    きさで正規化した値のN乗和(N:定数)を抽出
    したものを文字図形パターンに特徴量とし、方形
    文字外接枠の各辺をM個の区間に分割し、分割単
    位領域内の前記特徴量の平均値を要素としてM×
    K次元(K:走査した辺の総数)の特徴マトリク
    スを抽出し、あらかじめ用意した標準文字マスク
    を前記特徴マトリクス同形式で記述した辞書を参
    照して文字図形パターンの認識を行う文字認識方
    法であり、入力文字図形パターンをX軸とY軸と
    に夫々投影して夫々の黒ビツト数分布を求める段
    階と、 まず、文字枠の範囲を対象として夫々の黒ビツ
    ト数分布の夫々の重心座標を決定し次いでそれま
    でに検出した夫々の重心座標で文字枠を分割した
    夫々の範囲を対象として夫々の前記黒ビツト数分
    布の重心座標を決定する過程を複数回繰返して夫
    夫の重心座標系列を求める段階と、 座標値の大きさの順に付した夫々の重心座標系
    列における重心座標番号と座標値の大きさの順に
    付したX軸、Y軸の分割座標系列における夫々の
    分割座標番号とをほぼ均等に対応させて重心座標
    系列における1つの重心座標を1つの分割座標に
    対応づけて夫々の分割座標系列を決定する段階と
    を備え、2系統の前記分割座標で方形文字外接枠
    の各辺を分割した領域を前記分割単位領域として
    設定することを特徴とする文字認識方法。
JP58152998A 1983-08-24 1983-08-24 文字認識方法 Granted JPS6045885A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58152998A JPS6045885A (ja) 1983-08-24 1983-08-24 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58152998A JPS6045885A (ja) 1983-08-24 1983-08-24 文字認識方法

Publications (2)

Publication Number Publication Date
JPS6045885A JPS6045885A (ja) 1985-03-12
JPH0547871B2 true JPH0547871B2 (ja) 1993-07-19

Family

ID=15552714

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58152998A Granted JPS6045885A (ja) 1983-08-24 1983-08-24 文字認識方法

Country Status (1)

Country Link
JP (1) JPS6045885A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02287894A (ja) * 1989-04-28 1990-11-27 Oki Electric Ind Co Ltd 文字認識装置

Also Published As

Publication number Publication date
JPS6045885A (ja) 1985-03-12

Similar Documents

Publication Publication Date Title
JPH0547871B2 (ja)
JPH0147829B2 (ja)
JPH0475553B2 (ja)
JP2616994B2 (ja) 特徴抽出装置
JPH0147835B2 (ja)
JPS6019287A (ja) 文字認識方法
JPH0656625B2 (ja) 特徴抽出方式
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JP2749947B2 (ja) 文字認識方法
JP2827288B2 (ja) 文字認識装置
JPH0545992B2 (ja)
JP2749946B2 (ja) 文字認識方法
JPS60181884A (ja) 文字認識方式
JPH0632080B2 (ja) 文字認識方式
JPH02287894A (ja) 文字認識装置
JPS5837780A (ja) 文字認識方式
JPH0664629B2 (ja) 文字認識方式
JPH0545991B2 (ja)
JPS58123178A (ja) 文字認識方式
JPS6363952B2 (ja)
JPH01152586A (ja) 文字図形認識方法
JPH0656624B2 (ja) 特徴抽出方式
JPH03670B2 (ja)
JPH0632081B2 (ja) 文字認識方式
JPH0799536B2 (ja) 文字図形認識方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees