JPH0545991B2 - - Google Patents

Info

Publication number
JPH0545991B2
JPH0545991B2 JP58109189A JP10918983A JPH0545991B2 JP H0545991 B2 JPH0545991 B2 JP H0545991B2 JP 58109189 A JP58109189 A JP 58109189A JP 10918983 A JP10918983 A JP 10918983A JP H0545991 B2 JPH0545991 B2 JP H0545991B2
Authority
JP
Japan
Prior art keywords
character
pattern
sub
feature
feature matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58109189A
Other languages
English (en)
Other versions
JPS603076A (ja
Inventor
Shinji Narita
Yoshuki Yamashita
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP58109189A priority Critical patent/JPS603076A/ja
Publication of JPS603076A publication Critical patent/JPS603076A/ja
Publication of JPH0545991B2 publication Critical patent/JPH0545991B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (技術分野) 本発明は高速で精度の良い文字の特徴抽出方法
に関するものである。
(背景技術) 従来文字図形認識装置においては、文字図形パ
ターンよりストロークを抽出し、それら抽出され
たストロークの位置、長さ、ストローク間の相互
関係等を用いて認識する方式が多く採用されてい
る。この種の装置においては、(1)文字図形の輪郭
を追跡することにより検出された輪郭点系列につ
いて曲率を計算し、その曲率の大きな値の点を分
割点として輪郭系列を分割し、分割された系列を
組合せることによりストロークを抽出するか、又
は(2)文字図形パターンに細線化処理を行なつて骨
格化し、その骨格パターンの連結性及び骨格パタ
ーンを追跡し急激な角度の変化点等を検出してス
トロークを抽出し、該抽出されたストロークにつ
いて幾何学的な特徴等を抽出し文字図形の識別を
行なつていた。しかしながら、(1)の方法は、文字
図形パターンが大きくなりまた文字図形パターン
が複雑化すると、その処理量が増大しそのため処
理速度の低下を招き、(2)の方法は、文字図形パタ
ーンを細線化する必要があり、また、その細線化
によるパターンのひずみ、ヒゲ等の問題があり、
その後の処理が複雑なものとなる欠点がある。
(発明の課題) 本発明の目的はこれらの欠点を改善するもの
で、文字図形パターンの所望の方向のストローク
成分を表わすサブパターンを抽出し、サブパター
ンについて文字外接枠の辺上の点から走査して走
査線上のすべの文字線の位置の距離を検出し、文
字外接枠の大きさで正規化して抽出するN乗和の
辺単位の配列を分割して平均した値を向いあつた
2辺どうし加算させ特徴要素を抽出することを特
徴とし、その目的は高速で安定な文字認識方法を
提供することにある。
(発明の構成および作用) 第1図は本発明の文字認識装置における実施例
を示す図、第2図はサブパターン例を示す図、第
3図は特徴抽出結果例を示す図である。
第1図中1は光電変換部、2はパターンレジス
タ、3は線幅計算部、4はサブパターン抽出部、
5は文字枠検出部、6は特徴抽出部、7は特徴マ
トリクス抽出部、8は加算特徴マトリクス抽出
部、9は大分類部、10は識別部、11は文字名
出力である。
本実施例の動作は、読取機構にセツトされた帳
票上の文字は光電変換部1において2値の量子化
されたデイジタル電気信号に変換され、パターン
レジスタ2に格納される。それと同時に、線幅計
算部3において入力パターンの線幅(W)が計算
される。サブパターン抽出部4は、パターンレジ
スタについて垂直スキヤンを全面行なつて、黒ビ
ツトの連続長さと線幅計算部3において計算され
た線幅との関係より垂直サブパターン(VSP)
を抽出する。同様に、水平スキヤンにより水平サ
ブパターン(HSP)を、右斜め45°スキヤンによ
り右斜めサブパターン(RSP)を、左斜め45°ス
キヤンにより左斜めサブパターン(LSP)を抽出
する。
第2図は原パターンと各サブパターンの例でa
は原パターン、bは垂直サブパターン(VSP)、
cは水平サブパターン(HSP)、dは右斜めサブ
パターン(RSP)、eは左斜めサブパターン
(LSP)である。文字枠検出部5はパターンレジ
スタ内の文字図形パターンに外接する方形の枠
(以後文字枠と称する)を検出し、パターンレジ
スタで定義される2次元平面における前記文字枠
を規定する為の位置座標を特徴抽出部6へ送出す
る。以後の説明においては文字枠の左下を原点と
し、水平方向をX軸、垂直方向をY軸とする座標
系を使用する。特徴抽出部6はまず垂直サブパタ
ーンについて、文字枠を構成する4辺のうち垂直
な辺である左辺上の点P(0,y)から水平走査
を開始し、白点から黒点への変化点をすべて検出
し、検出した変化点と前記走査を開始した垂直辺
上の点Pとの間の距離すなわちX座標の差を文字
枠のX方向の長さを正規化定数として正規化した
値のN乗(Nは定数、本実施例ではN=2)の値
の計算を前記検出したすべての変化点について行
ない、その総和を配列Vl(y)に格納する。但し
前記白点とは文字背景部を表わし、黒点とは文字
線部を表わす。また式(1)は前記のVl(y)を式で
表わしたものでありΔxkはそれぞれの変化点と文
字枠辺上の走査開始点との距離を示し、k=1,
……,K,Kは検出された変化点個数を表わす。
又、式(1)中のΔXは文字枠の水平方向の長さであ
り、Cは整数化定数であり本実施例においてはC
=50とした。
Vl(y)=Kk=1 {Δxk/ΔX×C}2 (1) 上記の様な処理を文字枠の2つの垂直辺上のす
べての点を開始点として行ない、垂直サブパター
ンについて、文字枠の左辺上の点から水平走査を
開始して作成する配列Vl(i)、文字枠の右辺上の
点から水平走査を開始して作成する配列Vr(i)
を抽出する。但しi=0,……,YT,YTは文
字枠上辺のY座標である。同様な処理により、水
平サブパターン、右斜めサブパターン、左斜めサ
ブパターンについては文字枠の2個の水平辺上の
すべての点から垂直走査を行なつて、水平サブパ
ターンについて配列Hb(j),Ht(j)、右斜めサ
ブパターンについての配列Rb(j),Rt(j)、左
斜めサブパターンについての配列Lb(j),Lt(j)
を抽出する。但しj=0,……,XR,XRは文
字枠右辺のX座標である。前記水平サブパター
ン、右斜めサブパターン、左斜めサブパターンに
ついて抽出する配列の添字bは文字枠の水平な下
辺上の点を開始点としたものを表わしtは水平な
上辺上の点を開始点としたものを表わす。又、
Hb(j),Ht(j),Rb(j),Rt(j),Lb(j),
Lt
(j)を抽出する際における走査開始点と白点か
ら黒点への変化点との距離の正規化定数としては
文字枠の垂直方向の長さΔYを使用した。
特徴マトリクス抽出部7は特徴抽出部6におい
て抽出された8種の配列を使用し、各配列をM個
(Mは定数、本実施例ではM=7)に分割し、分
割された配列の同一分割単位内の配列の値に平均
値を計算することにより、M×8次元のサブパタ
ーン特徴マトリクスF(m,p,q)を抽出する。
ただし、m=1,……,M〔分割領域〕、p=V,
H,L,R〔走査方向〕、q=l,r(p=Vのと
き)またはq=b,t(p=H,L,Rのとき)
〔走査開始位置〕。加算特徴マトリクス抽出部8
は、特徴マトリクス抽出部7によつて抽出された
M×8次元のサブパターン特徴マトリクスF(m,
p,q)を読み込み、次式(2)の演算を実行するこ
とによつてサブパターン特徴マトリクスF(m,
p,q)の対応する向いあつた2辺の領域(m,
p)の特徴要素を加算した値をその領域(m,
p)の特徴要素FA(m,p)とするM×4次元の
加算特徴マトリクスを作成する。
FA(m,p)=F(m,V,l)+F(m
,V,r) または または FA(m,p)=F(m,p,b)+F(m,p,t)
(2) 大分類部9では、加算特徴マトリクス抽出部8
で抽出された加算特徴マトリクスFA(m,p)と
同形式で記述された標準文字マスクfa(m,p)
の辞書が用意されており、次式(3)の演算を実行す
ることにより文字図形パターンの加算特徴マトリ
クスと各標準文字マスクとの類似度DAが測定さ
れ、類似度の順位の大きい(DAの値が小さい)
特定個数(代表的には30個)のカテゴリ名を候補
カテゴリとして検出する。
DA=√{a(,)−(,)}2 (3) 識別部10には、特徴マトリクス抽出部7で抽
出された特徴マトリクスF(m,p,q)と同形
式で記述された標準文字マスクf(m,p,q)
の辞書が用意されていて、次式(4)の演算を実行す
ることにより大分類部9で検出された候補カテゴ
リの標準文字マスクf(m,p,q)と文字図形
パターンのサブパターン特徴マトリクスF(m,
p,q)との類似度が測定され、最も類似する標
準文字マスクのカテゴリ名を文字名出力11に出
力する。
D=√{(,,)−(,,)}2(4) (発明の効果) 以上説明したように、本実施例の特徴マトリク
ス抽出部において抽出された特徴マトリクスは、
文字図形パターンのストロークの位置、長さ、方
向等を表わすもので、文字特有の性質を表現して
いる。また、図3に2種の形が類似した文字パタ
ーンと特徴抽出部で抽出する配列を図形的に表現
した例において観察されるように、文字の局所的
な違いが前記配列に充分に反映されるので認識精
度の向上を図ることができる。また、特徴抽出部
において各配列を作成する際に走査を開始した文
字枠辺上の点と文字線との距離を文字枠の当該走
査方向の大きさで正規化しているので、手書文字
において特有な筆者の違いによる文字の大きさの
変動を吸収することができるので精度の良い認識
が可能である。また、文字図形パターンからの特
徴抽出を単純な走査という処理と、特別な処理、
演算を必要としない(マトリクスの単純加算)大
分類部により候補カテゴリを絞り、その後に識別
を行なつているので抽出した特徴を失うことなく
高速で安定な文字認識ができる利点がある。
本発明は、文字図形パターンから各方向のスト
ローク成分を抽出したサブパターンを垂直または
水平走査し、文字枠辺と文字線との距離を当該走
査方向の文字枠の大きさで正規化した値のN乗和
を特徴としているので複雑な処理を必要とせず、
また、手書文字の変形に追従して安定に特徴を抽
出できる。また、サブパターンより抽出した特徴
マトリクスを加算した加算特徴マトリクスにより
大分類を行ない、その後に識別を行なつているの
で高速で精度の良い文字認識装置が実現できる。
【図面の簡単な説明】
第1図は本発明の文字認識装置における実施例
を示す図、第2図はサブパターンの例を示す図、
第3図は特徴抽出例を示す図である。 1……光電変換部、2……パターンレジスタ、
3……線幅計算部、4……サブパターン抽出部、
5……文字枠検出部、6……特徴抽出部、7……
特徴マトリクス抽出部、8……加算特徴マトリク
ス抽出部、9……大分類部、10……識別部、1
1……文字名出力。

Claims (1)

    【特許請求の範囲】
  1. 1 文字図形パターンを所望の方向に走査して、
    当該走査方向における文字線の断面を検出し、断
    面長が前記文字図形パターンの文字線幅より十分
    長い断面を抽出することによりサブパターンを抽
    出し、前記サブパターンについて前記文字図形パ
    ターンの方形文字外接枠の4辺のうち、少なくと
    も2辺以上の辺上の各点から所定の方向へ走査し
    て走査線上におけるすべての文字線の位置を検出
    し、走査を開始した辺上の点と前記検出した文字
    線との距離を文字外接枠の大きさで正規化した値
    のN乗和(Nは定数)を測定し、サブパターンご
    とに辺を単位としてそれぞれM個(Mは定数)に
    分割し、各分割単位内のN乗和の平均値を計算し
    その平均値を特徴要素としたサブパターン特徴マ
    トリクスを作成し、標準文字マスクが当該サブパ
    ターン特徴マトリクスと同形式で記述されている
    辞書を参照して文字図形パターンの認識を行なう
    文字認識方法において、サブパターン単位に向い
    あつた2辺の特徴要素を加算した値をそのサブパ
    ターンの特徴要素とした加算特徴マトリクスで標
    準文字マスクが記述された辞書を別に用意してお
    き、サブパターン単位に向いあつた2辺の特徴要
    素を加算した値をそのサブパターンの特徴要素と
    した文字図形パターンの加算特徴マトリクスを作
    成し、文字図形パターンの当該加算特徴マトリク
    スと前記加算特徴マトリクスの辞書の各標準文字
    マスクとの類似度を測定して類似度が一定値以上
    もしくは一定順位以上の一群の標準文字名を検出
    し、サブパターン特徴マトリクスの前記辞書にお
    ける当該一群の標準文字名に対応した標準文字マ
    スクと文字図形パターンの前記サブパターン特徴
    マトリクスとの類似度を測定することによつて入
    力文字パターンを認識することを特徴とする文字
    認識方法。
JP58109189A 1983-06-20 1983-06-20 文字認識方法 Granted JPS603076A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58109189A JPS603076A (ja) 1983-06-20 1983-06-20 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58109189A JPS603076A (ja) 1983-06-20 1983-06-20 文字認識方法

Publications (2)

Publication Number Publication Date
JPS603076A JPS603076A (ja) 1985-01-09
JPH0545991B2 true JPH0545991B2 (ja) 1993-07-12

Family

ID=14503890

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58109189A Granted JPS603076A (ja) 1983-06-20 1983-06-20 文字認識方法

Country Status (1)

Country Link
JP (1) JPS603076A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0642267B2 (ja) * 1985-12-27 1994-06-01 沖電気工業株式会社 文字認識方式
JPS62157983A (ja) * 1986-01-06 1987-07-13 Oki Electric Ind Co Ltd 文字認識方式

Also Published As

Publication number Publication date
JPS603076A (ja) 1985-01-09

Similar Documents

Publication Publication Date Title
JPH0545991B2 (ja)
JPH0545990B2 (ja)
JPH0545993B2 (ja)
JPS6019287A (ja) 文字認識方法
JPS6318787B2 (ja)
JPS5837780A (ja) 文字認識方式
JPH0420228B2 (ja)
JPS62125485A (ja) 文字認識方式
JPS603078A (ja) 文字認識方法
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JPS62154079A (ja) 文字認識方式
JPS6262393B2 (ja)
JPS6363952B2 (ja)
JPS6262392B2 (ja)
JPH0475553B2 (ja)
JPH01152586A (ja) 文字図形認識方法
JPS622382A (ja) 画像処理方法
JPH0632080B2 (ja) 文字認識方式
JPH0145669B2 (ja)
JPS62157983A (ja) 文字認識方式
JPS6038755B2 (ja) 特徴抽出方式
JP2576491B2 (ja) 特徴抽出方式
JPH0632081B2 (ja) 文字認識方式
JPH0266681A (ja) 図面処理装置
JPH01152585A (ja) 特徴抽出方法