JPS62114080A - 文字認識方式 - Google Patents

文字認識方式

Info

Publication number
JPS62114080A
JPS62114080A JP60253810A JP25381085A JPS62114080A JP S62114080 A JPS62114080 A JP S62114080A JP 60253810 A JP60253810 A JP 60253810A JP 25381085 A JP25381085 A JP 25381085A JP S62114080 A JPS62114080 A JP S62114080A
Authority
JP
Japan
Prior art keywords
character
feature
pattern
integrated
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60253810A
Other languages
English (en)
Other versions
JPH0632080B2 (ja
Inventor
Koichi Higuchi
浩一 樋口
Hirohisa Goto
後藤 裕久
Junko Hirayama
純子 平山
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP60253810A priority Critical patent/JPH0632080B2/ja
Publication of JPS62114080A publication Critical patent/JPS62114080A/ja
Publication of JPH0632080B2 publication Critical patent/JPH0632080B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野〕 本発明は文字図形の認識方式に関し、更に詳細には、文
字図形A’ターンから所定方向の文字線の成分を表わす
サブパターンを抽出し、このサブパターンを複数領域に
分割して各領域内の特徴量(特徴要素)を計算して特徴
マ) IJクスを作成する方式に関する。
(従来の技術) 従来の文字図形の認識においては、文字図形パターンよ
りストロークを抽出し、それら抽出されたストロークの
位置、長さ、ストローク間の相互関係等を用いて認識す
る方式が多く採用されている。その手法は(1)文字図
形の輪郭を追跡すること(2□) により検出された輪郭点系列について曲率を計算し、そ
の曲率の大きな値の点を分割点として輪郭系列を分割し
、分割された系列を組合わせることによシストローフを
抽出するが、(2)文字図形パターンに細線化処理を行
なって骨格化し、その骨格パターンの連結性及び骨格パ
ターンを追跡し急激な角度の変化点等を検出してストロ
ークを抽出し、前記(1) (2)より抽出されたスト
ロークについて幾何学的な特徴等を抽出して識別を行な
っていた。しかしながら(1)の方法は文字図形パター
ンが大きくなり、又文字図形パターンが複雑化すると、
その処理量が増大し処理速度の低下を招いていた。(2
)の方法は文字図形・母ターンを細線化する必要があシ
、又その細線化によるパターンのひずみ、ヒr等の問題
がありその後の処理を複雑なものとしていた。
これらの問題点を解決するために、本出願人は例えば特
開昭57−231.85号公報や特公昭60−24.5
13号公報に開示されている文字認識方式を提案してい
る。この方式を簡単に説明すると、(a)文字図形・や
ターンを所定のある方向に走査して、当該走査方向にお
ける文字線の断面を検出し、(b)断面長が前記文字図
形パターンの文字線幅より十分に長い断面を抽出するこ
とにより行なうサブパターンの抽出を複数の方法につい
て行い、(c)抽出したサブパターンのそれぞれについ
て任意の分割領域の黒ピット数を、文字線幅とストロー
ク方向に対応した文字枠の大きさとで正規化して得られ
る量を特徴要素とし、(d)前記ストローク方向の異な
る複数のサブ・やターンごとに文字枠を分割することに
よって得られる分割単位領域ごとに前記特徴要素を抽出
して特徴マトリクスを作成する。
例えば、第5図において同図(a)の原ツヤターンから
同図(b)〜(e)に示すような垂直サブ・母ターン(
vsp )、水平サブパターン(I(SP )、右斜め
す7’ ノ9ターン(LSP)、左斜メサブi’?ター
ン(LSP )が抽出される。そして上記(c)及び(
d)の処理を経て、■SP特徴マトリクス、H8P特徴
マトリクス、R8P特徴マトリクス、LSP特徴マトリ
クスがら成る特徴マトリクスが作成される。次に、この
特徴マトリクスと予め用意した標準特徴マトリクス(4
方向の標準特徴マトリクスからなる)との間に(1)式
を適用して距離Uを計算し、距離の小さな標準特徴マト
リクスの文字名を認識結果とする。
Fmi:入力文字図形の特徴マトリクス要素Fd、:標
準特徴マ) IJクス要素 (発明が解決しようとする問題点) しかしながら、」二記従来の文字認識方式は以下の問題
点を有する。
第3図は漢字の°′止”を認識するための図である。“
止”の左側の垂直文字線が本来は同図(a)の位置にあ
るべきところを、同図(b)のように位置が移動した文
字が記入されたとする。このとき、同図(a)のパター
ンから抽出される垂直サブパターン(vsp )は同図
(c)のようになり、同図(b)のパターンから抽出さ
れるVSPは同図(d)のようになる。そして、vSP
特徴マトリクスは同図(c)のVSPから同図(e)と
なり、同図(d)は同図(f)となる。すなわち、“止
”の左側の垂直文字線の移動に従って、vsp特徴マト
リクスが変化していることがわかる。
ここで、同図(f)の■SP特徴マトリクスを、第4図
(a)に示す漢字°°上”の標準特徴マ) IJクスの
うちの標準vSP特徴マトリクス、及び同図(b)に示
すパ止”の標準vsp特徴マトリクスと比較する場合を
考える。この比較には、前述した(1)式が用いられる
。まず、第3図(f)と第4図(a)を比較すると、対
応する要素のうち4ケ所だけ異なるので、となる。同様
に、第3図(f)と第4図(a)を比較すると、対応す
る要素のうち8ケ所が異なるので、距離Uはf[下とな
る。尚、この例ではvsp以外の特徴マトリクスは同一
であるので、■SP特徴マトリクスの距離を計算するだ
けでよい。この結果、第3図(b)の″止″の標準特徴
マ) IJクス″上″に(6〕 対する距離はV−丁π1−であり、標準特徴マ) IJ
クス“止″に対する距離は〆1了工であるので、距離の
小さい°゛上″認識結果として出力されてしまう。
つまり、第3図(b)のようなパターンの°°止”が入
力されると、°′上”に誤認識する。
このように、従来の文字認識方式では、手書文字では筆
者の違いによる局所的な文字線の位置移動や傾き、また
印刷文字では活字の傾き等により入力文字図形が変形す
ると抽出される特徴が不安定となり、その認識が困難と
なる。このような文字図形の変形に対処するには、従来
方式では多数の標準特徴マトリクス(辞書マトリクス〕
を用意しなければならず、標準特徴マトリクスを格納す
るための辞書メモリの増大や処理速度の低下を招いてい
た。
従って、本発明は以上説明した文字図形の変形によって
抽出特徴が不安定になるという問題点を解決し、安定で
かつ高速で認識精度の高い文字認識方式を提供すること
を目的とする。
(問題点を解決するための手段) 本発明は以下の(a)〜(f)の構成要素を具備して構
成される。
(a)  文字図形パターンを所定のある方向に走査し
て、当該走査方向における文字線の断面を検出する。
(b)  次に、断面長が前記文字図形・母ターンの文
字線幅より十分に長い断面を抽出することにより行なう
サブパターンの抽出を複数の方向について行なう。
(c)  次に、抽出したサブパターンのそれぞれにつ
いて任意の分割領域の黒ビット数を、文字線幅とストロ
ーク方向に対応した文字枠の大きさとで正規化して得ら
れる量を特徴要素とする。
(d)  次に、前記ストローク方向の異なる複数のサ
ブ・ぞターンごとに文字枠を分割することによって得ら
れる分割単位領域ごとに前記特徴要素を抽出して特徴マ
トリクスを作成する。
(a)  次に、前記サブ・母ターンごとの特徴マトリ
クスの複数の特徴要素を、予め用意された統合すべき特
徴要素の領域を規定する複数の統合テーブルに従って統
合して複数の統合特徴を抽出する。
(f)  そして、該統合特徴を予め用意された文字図
形パターンの標準統合特徴と照合して入力された文字図
形・母ターンを認識する。
(作 用) 上記構成要素(a)及びΦ)は、複数方向のサブ・母タ
ーンを抽出する作用を呈する。このサブパターンとは、
例えば水平方向サブパターン(H4F )、垂直方向サ
ブパターン(USP )、右斜め方向サブパターン(H
8F )及び左斜め方向サブパターン(LSP)である
上記構成要素(c)及び(d)は特徴マトリクスを抽出
する作用を呈する。特徴マトリクスは例えばH8P市’
lマトリクス、vSP特徴マトリクス、H8F %徴マ
トリクス及びLSP特徴マトリクスで構成される。
上記構成要素(e)は文字図形の変形を補償する作用を
呈する。すなわち、予め特徴マトリクスの複数の特徴要
素のうちどの領域内の特徴要素を統合すべきかを規定す
る統合テーブルに従って、この領域内の特徴マトリクス
の特徴要素を統合(統合とは簡単に言えば各特徴要素の
和を算出する作業)して、複数の統合特徴を得ることに
ょシ、文字図形の位置ずれは吸収できる。例えば、ある
同一の統合テーブルを用いて正しい文字と変形している
同一の文字のそれぞれの統合特徴(特徴要素の和)が等
しければ、両者は同じ文字であることがわかる。すなわ
ち、文字図形の変形は補償されたことに々る。
上記構成要素(f)は(e)で得られた統合特徴と、予
め用意されている文字図形パターンの標準統合特徴とを
比較し、両者の距離が最も小さいときの標準統合特徴に
対応する文字図形を認識結果として出力する。
(実施例) 以下、本発明の一実施例を図面を参照して詳細に説明す
る。
第1図は、本発明の一実施例を示すブロック図である。
同図において、1は光信号入力、2は光電変換部、3は
・ぐター/レジスタ、4は線幅計算部、5はサブ・ぐタ
ー抽出部、6は文字枠検出部、7は文字枠分割決定部、
8は特徴マ) IJクス抽出部、9は統合特徴計算部、
10は統合マスク、11は判定部、12は判定辞書、及
び13は文字名出力である。
以下、各部の構成を説明する。光電変換部2は文字図形
パターンの光信号を光信号人力1として入力し、2値の
量子化された電気信号に変換する。
・母ターンレノスタ3は、この電気信号を格納する。
線幅計算部4は・ぞターンレノスタ3の出力に基づき入
力文字図形・ぞターンの線幅(W)を計算する。
サプノeターン抽出部5はz9ターンレジスタ3につい
て垂直走査を全面に行って、黒点(文字パターンの文字
線部に相当する量子化点を黒点、背景に相当する量子化
点を白点とする。)の連続個数と線幅計算部4において
計算された線幅との関係より、垂直サブパターン(vs
p )を抽出し、内部の垂直サブパターンレ・ゾスタに
格納する。同様に水平ス゛キャンにより水平ザブ/?タ
ーン(H4F ) ヲ、右斜め45°スキヤンにより右
斜めサブパターン(H8F )を、左斜め45°スキヤ
ンにより左斜めサブ・やターン(LSP )を抽出し、
各サブパターンレジスタに格納する。この結果、前述し
た第5図(a)の原a!ターンに対し、同図(b) −
(a)に示すvsp 、 )(SP 。
H8F 、 LSPが得られる。
文字枠検出部6は・やターンレ・ゾスタ3内の入力パタ
ーンに外接する方形枠を検出し、その結果を文字枠分割
決定部7へ送る。この方形枠を文字枠と呼、3;’。
文字枠分割決定部7は文字枠検出部6で検出した文字枠
内をMXN個(M、Nは整数、本実施例ではM=N=8
 )の領域に分割するためのX軸。
Y軸上の分割座標を決定する。本実施例では文字枠を等
間隔に分割するための分割座標を決定する。
なお、ここでX軸、Y軸はそれぞれ水平方向及び垂直方
向の座標軸を示す。
特徴マ) IJクス抽抽出部上文字枠分割決定部により
決定された分割点座標をうけてVSP 、 H4F 。
H8F 、 LSPの各サブ/’Pターンレジスタ上の
文字枠内領域をMXN個の部分領域に分割し、各領域内
の特徴量を計算して、MXNX4次元の特徴マトリクス
を抽出する。以下、特徴量の計算方法を説明する。
まず、それぞれのサブパターンについて各部分領域内の
黒点数B、を割数し、線幅計算部4で計算した線幅Wを
用いて式(1)により文字線長をあられす特徴量を計算
し、MXN次元のマトリクスをそれぞれのサブ・ぞター
ンごとに作成する。
さらにvsp特徴マ) IJJクス文字枠のY軸方向の
長さΔYで、H8P特徴マトリクスは文字枠のX軸方向
の長さΔXで、H8F及びr、sp特徴マトリクスは(
Δχ+ΔY)/2でそれぞれ正規化を行ない最終的にM
XNX4次元の特徴マ) IJJクス抽出する。
統合特徴計算部9は、特徴マトリクス抽出部8で抽出し
た特徴マトリクスについて、予め用意した統合マスク1
0に従の、この特徴マトリクスの複数の要素を統合した
統合特徴を計算する。以下、統合特徴の計算方法を詳細
に説明する。まず、本実施例における統合マスクの例を
第2図(a)〜(d)に示す。統合マスクは特徴マトリ
クスの各要素に対応しており、各方向の特徴マトリクス
と同じ次元数をもつ。第2図では、○印の位置(要素値
1)に対応する要素を統合することを示す。統合マスク
は次のとおシ定義される。
ここで、1≦j≦M、l≦j≦M、には統合マスクの番
号で1≦にSP(Pは整数で例えばP−1000、すな
わち1000種類の統合マスク)、Fijdは特徴マ)
 IJJクス要素を表わし、d=lはvSP特徴マトリ
クス、d−2はH8P特徴マトリクス、d=3はR8P
特徴マトリクス、d=4はLSP特徴、マトリクスを示
す。このように定義される統合マスクを用い、特徴マト
リクスFijdに対し統合を行ない、下記(4)式で定
義される統合特徴skdを計算する。
すなわち、各方向特徴マトリクスごと(d二1゜2,3
.4)にかつP個(本例の場合、P=1.000)の統
合マスクにつψて統合特徴Skdを計算する。
そして、(5)式を適用して統合マスクごとの統合特徴
の和Sk5を計算する。
S −ΣSkd        ・・・・・・・・・ 
(5)k5d=1 そして、SkdとSk5を合わせてSkd’として(d
′=1.2,3,4.5)、PX5個の統合特徴を判定
部11に出力する。例えば、前述した第3図(e)のv
SP特徴マトリクスを第2図(a)の統合マスクを用い
て統合した場合の1個の統合特徴は、統合マスクの○印
の部分に対応するvsp特徴マ) IJJクス要素の和
を計算することで得られ、その値は60となる。このよ
うな統合が繰り返えされ、最終的にPX5個の統合特徴
が得られる。
判定部11は、統合特徴計算部9で計算した統合特徴と
判定辞書12に格納されている標準統合特徴及び重み係
数との間に、(6)式で定義される距離りを計算し、最
も距離の小さな標準統合特徴に対応する文字名を文字名
出力13とする。
ただし、Jkd/は予め標準パターンから抽出した標準
統合特徴で、% a/は各文字図形単位に定められた重
み係数であり、当該特徴が有効な場合は1、−無効な場
合はOとする。例えば、第4図(a)及び(b)の標準
vSP特徴マトリクス(標準・母ターン)に対し、第2
図(a)の統合マスクを用いて得られる標準統合特徴は
第4図(a)の場合は30、同図(b)の場合は60で
ある。
次に、動作を説明する。
文字図形゛・クターン(入力・母ターン)の光信号人力
1は、光電変換部2で2値化された電気信号に変換され
、パターンレジスタ3に格納される。線幅計算部4は入
カバターンの線幅(W)を計算し、サブパターン抽出部
5及び特徴マトリクス抽出部8に出力する。文字枠検出
部6は入力・ゼターンに外接する方形枠を検出し、とれ
を文字枠として文字枠分割決定部7に出力する。文字枠
分割決定部7は文字枠をMXN個の領域に分割するため
のX軸、Y軸上の分割座標を決定する。このようにして
得られた文字枠と入カバターンと線幅とに基づき、サブ
パターン抽出部5は前述したように、VSP 、 )I
SP 、 R8P 、 LSPの各サブノやターンを抽
出して内部の各サブパターンレジスタに格納−する。
特徴マ) IJクス抽抽出部上文字枠と分割座標と入カ
バターンと線幅とに基づき、前述したようにMXNX4
次元の特徴マトリクスを抽出する。こマスク10を用い
、前述したようにPX5個の統合特徴を計算し、判定部
11に出力する。判定部11は判定辞書12内の標準統
3合特徴とPX5個の統合特徴との距離りを求め、最小
の距離となる標準統合特徴に対応する文字名を文字名出
力13として出力する。
ここで、前述した第3図(a)と(b)に対し、本実施
例を適用した場合について説明する。この場合も、前述
したように、vSP以外の特徴マ) IJJクス、同一
であるので、 vsp特徴マトリクスのみを考える。
統合マスクとして第2図(a)を用いた場合、第3図(
e)のvsp特徴マトリクスの統合特徴(すなわち、○
印の部分に対応するvsp特徴マ) IJJクス和)を
計算すると、その値は60である。同様に、第3図(f
)のvSP特徴マトリクスの統合特徴も60である。ま
た、第4図(a)の標準vSP特徴マトリクスの標準統
合特徴を計算すると、その値は30である。同様に第4
図(b)の標準統合特徴は60である゛。
よって、第2図(a)の統合マスクを用いて計算した第
3図(a)及び(b)の入カバターンの統合特徴(いず
れも60である)と第4図(a)の標準統合特徴との距
離D1はDI=1/iπτ了石0)”=30で、第4図
(b)の標準統合特徴との距離D2はD2=  1(6
0−60)”=Oである。ただし、第2図(a)の統合
マスクから得られる統合特徴は“止”及び°′上”を認
識するために有効な特徴なので、(6)式における重み
係数は1である。従って、DIに比べD2が小さく、第
3図(a)及び(b)のいずれの入力・母ターンに対し
てもパ止”と正しく認識するととができる。
以上、本発明の詳細な説明した。統合マスクは第2図(
a)〜(d)のみを例示したが、その他種々のものが用
いられる。特に第2図(a)〜(c)は方形の統合マス
クの例であるが、同図(d)のような複数の方形マスク
を組み合わせた形の統合マスクを用いることにより、有
効な統合特徴を少数の統合マスクで抽出できる。
(発明の効果) 以上説明したように、本発明によれば、文字図形の位置
変動を吸収して文字図形・やターンの特徴を忠実に抽出
することができるので、辞書メモリを増加させることな
く、高速で高精度の文字認識が行なえる。
【図面の簡単な説明】
第1図は本発明の一実施例のブロック図、第2図は本実
施例で用いられる統合マスクの例を示す図、第3図は原
ノやターンからvSP特徴マトリクスを得る過程を説明
するための図、第4図は標準vSP特徴マトリクスを示
す図、及び第5図は原・やターンと各サブパターンの例
を示す図である。 1・・・光信号入力、2・・・光電変換部、3・・りや
ターンレジスタ、4・・・線幅計算部、5・・・サブ・
やターン抽出部、6・・・文字枠検出部、7・・・文字
枠分割決定部、8・・・特徴マ) IJクス抽出部、9
・・・統合特徴計算部、10・・・統合マスク、11・
・・判定部、12・・・判定辞書、13・・・文字名出
力。 特許出願人 沖電気工業株式会社 特許出願代理人 弁理士 山 本 恵 −片、ノーター
ン                     神、ノ
作−ン(a)(b) vsp                      
    vsp(c)               
           (d)vSPズ門11丁区マト
フクス            vSPcrt曳マトリ
ゲス(e)(f) 第3図 ′上′の            ′上′の、dlvs
p 特谷又マトリクス              記
宅TVSpx今ン殻疋マトリゲス(a )      
                        (
b )第4図 りL Jぐターン (Q) 1.1=ワ□4)+″y−ン (b) 石科−hη’%クーシ (d) 第5 水手→ゲノでターン (c) ル奪斗めグヂlぐターン (e) 図

Claims (1)

  1. 【特許請求の範囲】 (a)文字図形パターンを所定のある方向に走査して、
    当該走査方向における文字線の断面を検出し、 (b)断面長が前記文字図形パターンの文字線幅より十
    分に長い断面を抽出することにより行なうサブパターン
    の抽出を複数の方向について行い、(c)抽出したサブ
    パターンのそれぞれについて任意の分割領域の黒ビット
    数を、文字線幅とストローク方向に対応した文字枠の大
    きさとで正規化して得られる量を特徴要素とし、 (d)前記ストローク方向の異なる複数のサブパターン
    ごとに文字枠を分割することによって得られる分割単位
    領域ごとに前記特徴要素を抽出して特徴マトリクスを作
    成し、 (e)前記サブパターンごとの特徴マトリクスの複数の
    特徴要素を、予め用意された統合すべき特徴要素の領域
    を規定する複数の統合テーブルに従って統合して複数の
    統合特徴を抽出し、 (f)該統合特徴を予め用意された文字図形パターンの
    標準統合特徴と照合して入力された文字図形パターンを
    認識することを特徴とする文字認識方式。
JP60253810A 1985-11-14 1985-11-14 文字認識方式 Expired - Lifetime JPH0632080B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60253810A JPH0632080B2 (ja) 1985-11-14 1985-11-14 文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60253810A JPH0632080B2 (ja) 1985-11-14 1985-11-14 文字認識方式

Publications (2)

Publication Number Publication Date
JPS62114080A true JPS62114080A (ja) 1987-05-25
JPH0632080B2 JPH0632080B2 (ja) 1994-04-27

Family

ID=17256459

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60253810A Expired - Lifetime JPH0632080B2 (ja) 1985-11-14 1985-11-14 文字認識方式

Country Status (1)

Country Link
JP (1) JPH0632080B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01239141A (ja) * 1988-03-11 1989-09-25 Toyota Autom Loom Works Ltd 織機におけるストロボスコープ制御装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01239141A (ja) * 1988-03-11 1989-09-25 Toyota Autom Loom Works Ltd 織機におけるストロボスコープ制御装置

Also Published As

Publication number Publication date
JPH0632080B2 (ja) 1994-04-27

Similar Documents

Publication Publication Date Title
JPS62114080A (ja) 文字認識方式
JP3095470B2 (ja) 文字認識装置
JPS62125484A (ja) 文字認識方式
JPS5837780A (ja) 文字認識方式
JPS603078A (ja) 文字認識方法
JPS62154079A (ja) 文字認識方式
JP3104355B2 (ja) 特徴抽出装置
JPH0545991B2 (ja)
JPS62125485A (ja) 文字認識方式
JPS6019287A (ja) 文字認識方法
JPS622382A (ja) 画像処理方法
JP3365941B2 (ja) 文字パターン認識方法及びその装置
JPH0475553B2 (ja)
JP2651008B2 (ja) パターン認識方法
JPH05274472A (ja) 画像認識装置
JPH0656625B2 (ja) 特徴抽出方式
JPH04112284A (ja) 文字認識装置
JPH0434668A (ja) 画像処理方法および装置
JPS5894067A (ja) 文字認識方法
JPH0276084A (ja) 高速文字図形分離装置
JPH0545993B2 (ja)
JPS6318787B2 (ja)
JPH0580711B2 (ja)
JPH035630B2 (ja)
JPS6038755B2 (ja) 特徴抽出方式

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term