JPS62154079A - 文字認識方式 - Google Patents

文字認識方式

Info

Publication number
JPS62154079A
JPS62154079A JP60263674A JP26367485A JPS62154079A JP S62154079 A JPS62154079 A JP S62154079A JP 60263674 A JP60263674 A JP 60263674A JP 26367485 A JP26367485 A JP 26367485A JP S62154079 A JPS62154079 A JP S62154079A
Authority
JP
Japan
Prior art keywords
character
pattern
sub
line width
black
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60263674A
Other languages
English (en)
Other versions
JPH0642267B2 (ja
Inventor
Koji Ito
伊東 晃治
Yoshiyuki Yamashita
山下 義征
Koichi Higuchi
浩一 樋口
Toshiyuki Ariga
有賀 寿之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP60263674A priority Critical patent/JPH0642267B2/ja
Publication of JPS62154079A publication Critical patent/JPS62154079A/ja
Publication of JPH0642267B2 publication Critical patent/JPH0642267B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は文字図形を認識する文字認識方式に関し、更に
詳細には、文字図形パターンを複数のサブパターンに分
割して各サブパターン毎の特徴マトリクスを得、この特
徴マトリクスを辞書内の標準文字マスクと照合して識別
する方式に関する。
(従来の技術) 従来、文字図形認識装置に於ては文字図形パターンよシ
ストローフを抽出し、それら抽出てれたストロークの位
置、長さ、ストローク間の相互関係等を用いて認識する
方式が多く採用されている。
その手法は(1)文字図形の輪郭を追跡することにより
検出された輪郭点系列について曲率を計算し、その曲率
の大きな値の点を分割点として輪郭系列を分割し、分割
された系列を組合わせることによりストロークを抽出す
るか、(2)文字図形パターンに細線化処理を行なって
骨格化し、その骨格パターンの連結性及び骨格・ぐター
ンを追跡し急激な角度の変化点等を検出してストローク
を抽出し、前記(1) (2)より抽出されたストロー
クについて幾何学的な特徴等を抽出して識別を行なって
いた。しかしながら(1)の方法は文字図形・ぐターン
が大きくなり、又文字図形・ぐターンが複雑化すると、
その処理量が増大し処理速度の低下を招いていた。又(
2)の方法は文字図形・ぐターンを細線化する必要があ
り、又その細線化による・ぐターンのひずみヒゲの発生
等の問題があり、その後の処理を複雑なものとしていた
これらの問題点を解決するだめに、本出願人は特開昭5
7−23185号公報に開示の文字認識方式を提案して
いる。この方式は、(a)文字図形を光電変換して量子
化することにより黒ビット及び白ビットで表わされるデ
ィジタル信号の原パターンを作成し、(b)この原パタ
ーンの文字図形全体の線幅(例えば平均値)を算出し、
(c)この原・Pターンを複数の方向に走査を行って各
定食列毎の黒ビットの連続個数を検出し、この黒ビット
連続個数と前記線幅とに基づいて先の複数の方向毎に対
応した複数のサブ・!ターンを抽出し、(d)先の原・
ぐターンの文字枠内領域をサブ・ンターンについて(N
xM)個の領域(N、Mは定数)に分割し、更に各領域
内の文字線長を表わす特徴量をセルを単位として計算し
、(a)この特徴量を文字の大きさで正規化して特徴マ
トリクスを作成し、(f)この特徴マトリクスを予め用
意した文字図形・ぐターンの標準文字マスクと照合して
文字図形を認識する構成でおる。
(発明が解決しようとする問題点) しかしながら、上記従来の文字認識方式は以下の問題点
を有する。
例えば、印刷文字のゴシック体と、明朝体について認識
する場合、ゴシック体は縦線幅、横線幅がほぼ一定であ
るため、文字全体の線幅が縦線幅又は横線幅と等しく、
セルを単位として文字全体の線幅で正規化しても特徴は
、安定している。一方明朝体は縦線幅、横線幅が大きく
異なるため、セルを単位として文字全体の線幅で正規化
すると、ゴシック体と同じ線長を持つ文字線でもゴシッ
ク体と比較して水平特徴マトリクスの量は小さく、垂直
特徴マ) IJクスの量は大きくなり付徴として不安定
である。
第2図にゴシック体と明朝体のサブ・ぐターンの例を示
す。同様の現象が手書文字にも当てはま久筆記用具の状
態、書き手が筆記用具に入れる力の具合で同一の線長を
持つ文字線でも各特徴量は異なり、特徴が不安定である
。この問題点を解決しようとすれば、その識別のだめの
辞書を増加させる必要があり、ひいては処理時間の低下
を招くことになる。
従って、本発明はこれらの問題点を解決し、高速で安定
な文字認識方式を提供することにある。
(問題点を解決するだめの手段) 本発明は、以下の構成要素(a)〜(f)を具備して構
成される。
(a)  文字図形を光電変換して量子化することによ
り黒ビット及び白ビットで表わされるディジタル信号の
原パターンを作成する。
(b)  次に、該層・ぐターンの線幅を算出する。
(c)  次に、前記原パターンを複数の方向に第1の
走査を行って各走査列毎の黒ビットの連続個数を検出し
、当該黒ビット連続個数と前記線幅とに基づいて第1の
走査の複数の方向毎に対応した複数のサブパターンを抽
出する。
(d)  次に、前記原パターンの文字枠内領域をサブ
パターンについて(NxM)個の領域(N、Mは定数)
に分割し、更に各サブパターンの抽出の際に走査した第
1の走査の方向と所定の角度を成す方向にそれぞれ第2
の走査を行い、白ビットから黒ビット、黒ビットから白
ビットへ変化したときの黒ビットの座標位置を基に線長
マ) IJクスを作成する。
(a)  次に、該線長マトリクスを文字の大きさで正
規化して特徴マトリクスを作成する。
(f)  そして、該特徴マトリクスを予め用意した文
字図形がターンの標準文字マスクと照合して文字図形を
認識する。
(作用) 上記構成要素(a)は識別すべき文字図形を2値化した
ディノタル信号に変換して原・ぐターンを作成する作用
を呈する。
構成要素(b)は原・ぐターンの線幅(平均値)を算出
する作用を呈する。
構成要素(c)は原・ぐターンから複数のサブノやター
ンを抽出する作用を呈する。
構成要素(d)はサブパターン毎の特徴マ) IJクス
を作成する作用を呈する。特に、白→黒、黒→白の変化
時の黒ビットの座標を基に線長マトリクスを抽出するこ
とは文字幅変動等を吸収する作用を呈する。
構成要素(a)は特徴マトリクスを正規化する作用を呈
する。
構成要素(f)は得られた特徴マトリクスを予め用意し
た文字図形パターンの標準文字マスクと照別して、入力
文字図形を識別する作用を呈する。
(実施例) 以下、本発明を一実施例に基づき図面を参照して詳細に
説明する。
第1図は、本発明の一実施例を示すブロック図である。
同図において、1は光信号入力、2:は光電変換部、3
はパターンレノスタ、4は線幅計算部、5は文字枠検出
部、6は垂直・ぐターン抽出部、7は水平・ぐターン抽
出部、8は右斜めサブパターン抽出部、9は左斜めサブ
・ぐターン抽出部、10は特徴マ) IJクス抽出部、
11は識別部、12は文字名出力である。
次に、各部の構成について説明する。光電変換部2は原
パターンの光信号入力を2値の量子化された電気信号に
変換する。・やターンレノスタ3はこの電気信号を格納
する。この格納の際、文字は例えば100X100個の
セルに分割されて1.各部の2値:ff−ドがノやター
ンレソスタ3に記憶嘔しる。線幅計算部4は入カバター
ン(原パターン)の線幅を計算する。垂直サブパターン
抽出部6はiPターンレジスタ3について垂直スキャン
を全面性なって、黒ビットの連続の長さと線幅計算部4
に於て計算された線幅との関係より垂直サブパターン(
vsp)を抽出する。同様に水平サブパターン抽出部7
は水平スキャンによシ水平サブパターン(H8P)を、
右斜めサブパターン抽出部8は右斜め(45’)スキャ
ンにより、右斜めサブ・ぐターン(RSP)を、左斜め
サブパターン抽出部9は左斜め(45’)スキャンによ
り、左斜めサブパターン(LSP)を抽出する。第3図
に原パターンとサブ・ぐターンの例を示す。第3図の(
a)が原・ぐターン、(b)がVSP、(c)がH8P
 、 (d)がH8P、(e)がLSPである。文字枠
検出部5は・ぐターンレノスタ内の文字ノやターンに外
接する文字枠を検出しその結果を特徴マトリクス抽出部
10へ送る。特徴マトリクス抽出部10はサブパターン
抽出部タについて原・ぐターンの文字枠に対応する領域
を(NxM)の領域(本発明の実施例ではN=M=5)
に分割する。文字が100X100のセルに分割され、
N=M=5の場合には各領域は20x20のセルを有す
る。
出する方法を説明する。特徴マトリクス抽出部10は、
各分割領域毎に設けた図示しない内部の(N×M)個の
カウンタを°′0″にし、文字枠内を主走査方向は水平
に左から右へ走査し、走査列単位に、白ビット(文字背
影部)から黒ビット(文字線部)へ変化した時の黒ビッ
トの座標位置(XWB 、 Yn)と、黒ビットから白
ビットへ変化した時の黒ビットの座標位置(XBW I
 Yn)を検出し、その中点座標位置(Xs、Yn)を
式(1)により計算する。
Xs = (XWB + XBW ) / 2   −
 (1)前記中点座標位置が前記分割した領域のどこに
存在するかを決定し、決定した分割領域のカウンタの内
容を+1する。
この処理を文字枠内全面について行い、各分割領域に設
けた(N×M)のカウンタ値がVSPの(NxM)次元
の線長マ) IJクスである。同様の処理をH3P 、
 H8P 、 LSPについて行う。ただしH8Pは主
走査方向を垂直に上から下・\副走査方向を水平に左か
ら右へ走iする。RSP 、 LSP U主走審す而か
訴方fμ砧、乙玉へ周1キ本文而か十二、ブtから右へ
、又は、主走査方向を水平に左から右へ、副走査方向を
垂直に上から下・\走査する。
次に、特徴マトリクス抽出部10は、抽出した線長マト
リクスを文字の太き畑で正規化し、特徴マトリクスを作
成する。その方法は正規化前の線長マトリクスの1要素
をti j、正規化後の要素をLij、文字枠の水平方
向の長烙をΔX、垂直方向の長さをΔYとすると下記の
様な処理を行なう。
(1)垂直サブパターン(vsp)マトリクスの場合L
ij=tij/ΔY       ・・・(2)(2)
水平サブ・にターン(H4F)マトリクスの場合Lij
=tij/ΔX     ・・・(3)(3)斜メサブ
ックターン(H8F、LSP)マトリクスの場合 Li j = ti j / /(ΔX)+(ΔY) 
   ・・・(4)前記処理により、特徴マトリクス抽
出部10は最終的に原パターンを表現する((N×M)
X4)次元の正規化した特徴マ) IJクスを作成する
識別部11は標準文字マスク(fm)と特徴マトリクス
抽出部10に於て抽出された特徴マトリクス(f、i)
との間に従来から使用されている下式の距離(D)、す
なわち(N×M)X4次元特特徴間に於ける2つのベク
トルの差分ベクトルの長さが最小の値を与える標準文字
マスクのカテゴリ名を文字名出力12として出力する。
D=X(fm−tiア   ・・・(5)次に、動作を
説明する。光信号人力1は光電変換部2より光電変換さ
れ、パターンレノスタ3及び線幅計算部4に供給される
。線幅計算部4は原パターンの線幅を計算し、これを各
サブ・ンターン抽出部6〜9に出力する。垂直サブ・ン
ターン抽出部はパターンレジスタ3の出力及び線幅計算
部4の出力に基づき、前述した方法によりvspを抽出
する。同様にして、水平サブ・やターン抽出都7、右斜
めサブ・ゼターン抽出部8及び左斜めサブパターン抽出
部9はそれぞれH4F 、 H8F及びLSPを抽出す
る。特徴マトリクス抽出部10はVSP、H4F。
H8F及びLSP K基づき線長マトリクスを抽出し、
これを文字枠検出部5から出力された文字の大きさで正
規化し、特徴マトリクスを作成する。このようにして作
成された特徴マトリクスは識別部11で標準文字マスク
と比較され、最小の距離を与える標準文字マスクのカテ
がす名が文字名出力12として出力される。
(発明の効果) 以上説明したように、原・ぐターンから抽出したサブパ
ターンについて文字枠領域を(NxM)の領域に分割し
、更に垂直又は水平に走査して白ビットから黒ビット、
黒ビットから白ビットへ変化する座標を基に線長マトリ
クスを抽出し、更に線長マ) IJクスを文字の大きさ
で正規化した特徴マトリクスを使用して識別を行うこと
としたため、文字の変形、文字線幅の変動に対して安定
な文字認識が可能となる。また、原パターンから抽出し
たサブパターンについて単純な走査により特徴マトリク
スを抽出しているので、高速な文字認識が可能となる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
ゴシツク体と明朝体のサブパターン例を示す図、第3図
は原ノやターンとサブ・ンターンの抽出例を示す図であ
る。 1・・・光信号入力、2・・・光電変換部、3・・・パ
ターンレジスタ、4・・・線幅計算部、5・・・文字枠
検出部、6・・・垂直サブパターン抽出部、7・・・水
平サブパターン抽出部、8・・・右斜めサブパターン抽
出部、9・・・左斜めサブパターン抽出部、10・・・
特徴マ) IJクス抽出部、11・・・識別部、12・
・・文字名出力。

Claims (1)

  1. 【特許請求の範囲】 (a)文字図形を光電変換して量子化することにより黒
    ビット及び白ビットで表わされるディジタル信号の原パ
    ターンを作成し、 (b)該原パターンの線幅を算出し、 (c)前記原パターンを複数の方向に第1の走査を行っ
    て各走査列毎の黒ビットの連続個数を検出し、当該黒ビ
    ット連続個数と前記線幅とに基づいて第1の走査の複数
    の方向毎に対応した複数のサブパターンを抽出し、 (d)前記原パターンの文字枠内領域をサブパターンに
    ついて(N×M)個の領域(N、Mは定数)に分割し、
    更に各サブパターンの抽出の際に走査した第1の走査の
    方向と所定の角度を成す方向にそれぞれ第2の走査を行
    い、白ビットから黒ビット、黒ビットから白ビットへ変
    化したときの黒ビットの座標位置を基に線長マトリクス
    を作成し、(e)該線長マトリクスを文字の大きさで正
    規化して特徴マトリクスを作成し、 (f)該特徴マトリクスを予め用意した文字図形パター
    ンの標準文字マスクと照合して文字図形を認識すること
    を特徴とする文字認識方式。
JP60263674A 1985-12-27 1985-11-26 文字認識方式 Expired - Lifetime JPH0642267B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60263674A JPH0642267B2 (ja) 1985-12-27 1985-11-26 文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60263674A JPH0642267B2 (ja) 1985-12-27 1985-11-26 文字認識方式

Publications (2)

Publication Number Publication Date
JPS62154079A true JPS62154079A (ja) 1987-07-09
JPH0642267B2 JPH0642267B2 (ja) 1994-06-01

Family

ID=17392765

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60263674A Expired - Lifetime JPH0642267B2 (ja) 1985-12-27 1985-11-26 文字認識方式

Country Status (1)

Country Link
JP (1) JPH0642267B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01152585A (ja) * 1987-12-10 1989-06-15 Oki Electric Ind Co Ltd 特徴抽出方法
JPH01164568U (ja) * 1988-04-28 1989-11-16

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS603076A (ja) * 1983-06-20 1985-01-09 Oki Electric Ind Co Ltd 文字認識方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS603076A (ja) * 1983-06-20 1985-01-09 Oki Electric Ind Co Ltd 文字認識方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01152585A (ja) * 1987-12-10 1989-06-15 Oki Electric Ind Co Ltd 特徴抽出方法
JPH01164568U (ja) * 1988-04-28 1989-11-16

Also Published As

Publication number Publication date
JPH0642267B2 (ja) 1994-06-01

Similar Documents

Publication Publication Date Title
Yu et al. A generic system for form dropout
JPS62154079A (ja) 文字認識方式
JPS62125485A (ja) 文字認識方式
JPH02116987A (ja) 文字認識装置
JPH0545992B2 (ja)
JP2795860B2 (ja) 文字認識装置
JP3936039B2 (ja) 網がけ領域抽出装置
Giri et al. Design & implementation of a novel cognitive character recognition technique
JPS5837780A (ja) 文字認識方式
JPH0545991B2 (ja)
JPS5894067A (ja) 文字認識方法
JPS6318787B2 (ja)
JPH0632080B2 (ja) 文字認識方式
JPS62164182A (ja) 文字図形パタ−ン認識方式
JPS6038756B2 (ja) 文字認識方式
JPS6238752B2 (ja)
JPS6262392B2 (ja)
JPS6019287A (ja) 文字認識方法
JP2732753B2 (ja) ファジィパターン認識装置
JPS6262393B2 (ja)
JPH0545990B2 (ja)
JPH0580711B2 (ja)
JPS60201485A (ja) 手書文字認識装置
JPS6031683A (ja) 手書文字認識装置
JPH0833908B2 (ja) 特徴抽出方法

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term