JP2902905B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2902905B2
JP2902905B2 JP5158769A JP15876993A JP2902905B2 JP 2902905 B2 JP2902905 B2 JP 2902905B2 JP 5158769 A JP5158769 A JP 5158769A JP 15876993 A JP15876993 A JP 15876993A JP 2902905 B2 JP2902905 B2 JP 2902905B2
Authority
JP
Japan
Prior art keywords
pattern
sub
unit
line width
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP5158769A
Other languages
English (en)
Other versions
JPH0714005A (ja
Inventor
徹 宮前
浩一 樋口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP5158769A priority Critical patent/JP2902905B2/ja
Publication of JPH0714005A publication Critical patent/JPH0714005A/ja
Application granted granted Critical
Publication of JP2902905B2 publication Critical patent/JP2902905B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、一部がかすれたよう
な局所的に線幅の異なる文字パタンに対処した高精度な
文字認識装置に関するものである。
【0002】
【従来の技術】従来、入力文字パタンの特徴を抽出し、
予め用意した辞書との照合によって、認識結果を出力す
る文字認識装置としては、例えば特公昭60−3875
6に開示されるものがあった。この文字認識装置による
処理の概要について以下に説明する。
【0003】先ず、入力文字パタンの各セルの明るさを
光電変換によって、量子化された電気信号である2値画
像に変換し、この2値画像をパタンレジスタに格納して
おく。そして前記パタンレジスタ内の文字パタンの外接
枠を検出し、外接枠内の文字パタンの線幅を計算する。
次に外接枠内の文字パタンに対して、水平、垂直、右斜
め、左斜め方向に走査し、前記線幅を閾値とする連続黒
画素成分を検出することによって、4種のサブパタンを
抽出する。また、前記パタンレジスタの外接枠内の文字
パタンに対して、各分割領域内の黒画素数が同数になる
ように垂直方向、水平方向に格子状となるN×M個の部
分領域に非線形分割する。次に4種のサブパタンのそれ
ぞれについて、分割された部分領域内における該サブパ
タンの黒画素数を計数し、これを文字パタンの大きさで
正規化することによって、各方向における文字線の分布
状態を反映するN×M×4次元の特徴マトリクスを抽出
する。そして前記特徴マトリクスと予め用意された複数
の標準文字の特徴マトリクスである辞書とを照合し、該
照合結果より該入力文字パタンの認識結果を出力すると
いうものであった。
【0004】
【発明が解決しようとする課題】しかし、前記文字認識
装置においては、以下のような問題点があった。すなわ
ち、従来技術では、入力された文字パタンの外接枠内の
2値画像に対して、水平、垂直、右斜め、左斜めの4方
向にそれぞれ走査し、当該文字パタンの平均線幅の2倍
を閾値として、連続した黒画素よりなるストロ−クを抽
出し、それらの分布を表わす4種のサブパタンを抽出し
ていた。しかし、従来のサブパタンの抽出方法では、当
然ながら線幅の2倍より小さい連続黒画素数を持つスト
ロ−ク成分は抽出されない。従って、一部がかすれたよ
うな文字パタン、即ち、局所的な線幅が他の部分と比較
して極めて小さくなっている文字パタン等は、そのかす
れた部分がサブパタン及びサブパタンに基づいて抽出さ
れる特徴マトリクスに反映されず、その結果、認識性能
が低下するという問題点があった。
【0005】このような場合の例を図4及び図6(a)
に示す。図4は、アルファベットの「Q」の字のひげの
部分、即ち波線401で囲まれた領域内のセグメントが
かすれて3つに分裂してしまった場合を表している。こ
のかすれたひげの部分は、本来ならば、左斜め方向の走
査によって、ストロ−クの一部として検出されるわけで
あるが、この例では、いかなる方向の走査においてもサ
ブパタンの一部としては検出されない。従って、ひげの
部分は特徴に反映されず、ひげのない類似文字、例え
ば、「O」等に誤読する確率が増大することになる。ま
た図6(a)には漢字の「因」の字を示している。この
場合、「因」を構成する要素の内、外側の部分である
「口」に対し、内側の部分である「大」が通常より小さ
く書かれ、文字全体の平均線幅の2倍以下の大きさしか
持たないため、平均線幅を用いた走査では、図6
(b)、(c)、(d)、(e)に示したように「大」
の字がどのサブパタンにも反映されないといった事態が
生じ、大きな問題点となる。
【0006】また、上述のように一部がかすれたり、小
さく書かれたりした文字パタンではないときでも、一部
がつぶれたことにより平均線幅の値が非常に大きくな
り、その結果、通常のストロ−クがサブパタンとして検
出されず、故に特徴マトリクスに反映されず、認識性能
の低下をもたらすという問題点があった。このような場
合の例を図5に示す。図5は、数字の「5」において、
下部がル−プを作りつぶれてしまった例であるが、この
とき、文字全体の平均線幅は大きな値となり、その結
果、例えば、波線501で示されたような通常に書かれ
たストロ−クの部分等は線幅の2倍以下の大きさとなっ
てしまい、結局、サブパタンとして抽出されなくなる。
従って、波線501が示すストロ−クがないパタンとし
て、特徴抽出されるので、例えば「6」等に極めて類似
してくることになり、「6」に誤読する確率が増大す
る。
【0007】本発明は、前記従来のサブパタン抽出方法
において、文字を構成する各ストロ−ク成分の線幅が平
均線幅に近いところで分布する場合には、有効な特徴抽
出となり得る一方、局所的なストロ−クの線幅値が他の
部分の線幅値と大きな差がある場合、即ち、一部がつぶ
れていたり、かすれていたりする等のような文字パタン
に対しては、適切な特徴抽出ができず認識性能の低下を
もたらすといった問題点を除去し、局所線幅の異なる各
ストロ−ク成分のそれぞれに対して、最適な閾値で各方
向から走査してサブパタンを抽出し、該サブパタンに基
づいた特徴抽出、認識処理を行うことによって、局所的
な線幅に大きなばらつきのある低品質の文字パタンに対
しても、高精度で、安定な認識性能の得られる文字認識
装置を提供することを目的とする。
【0008】
【課題を解決するための手段】本発明は、前記課題を解
決するために、帳票等に記入された文字パタンを光学的
に走査して、量子化された電気信号である2値画像に変
換する光電変換部と、前記2値画像に変換された文字パ
タンを格納するパタンレジスタと、前記パタンレジスタ
内の文字パタンの外接枠を検出する外接枠検出部と、前
記パタンレジスタの外接枠内の文字パタンの線幅を算出
する線幅計算部と、前記パタンレジスタの外接枠内の文
字パタンに対して水平、垂直、右斜め、左斜めの各方向
に走査し、走査線上の黒画素の連続数が前記線幅に基づ
いて定められた閾値を超えた場合にストロークとして検
出し、これらのストロークの分布を表わすサブパタンを
各方向毎に4種類抽出するサブパタン抽出部と、前記パ
タンレジスタの外接枠内の2値画像及び前記4種類のサ
ブパタンより、文字パタンを構成する黒画素の中で、4
種類のサブパタンのいずれにも属さない黒画素の集合を
かすれパタンとして抽出するかすれパタン抽出部と、前
記かすれパタンを構成するセグメントのうち、微小なセ
グメントを除去する微小セグメント除去部と、前記かす
れパタンの線幅を算出するかすれパタン線幅計算部と、
前記かすれパタンについてサブパタン抽出の必要有りと
判定された場合に微小セグメントを除去したかすれパタ
ンに対して水平、垂直、右斜め、左斜めの各方向に走査
し、走査線上の黒画素の連続数が前記かすれパタンの線
幅に基づいて定められた閾値を超えた場合にストローク
として検出し、これらのストロークの分布を表わすかす
れサブパタンを各方向毎に4種類抽出するかすれサブパ
タン抽出部と、前記サブパタン及び前記かすれサブパタ
ンの特徴を抽出する特徴抽出部と、前記サブパタンの特
徴と前記かすれサブパタンの特徴とを合成し、合成特徴
を得る合成部と、前記合成特徴と予め用意された辞書の
特徴とを照合して最終的な認識結果を出力する識別部と
を有することを特徴とする。
【0009】
【作用】本発明によれば、原文字パタンの平均線幅に基
づいた文字のストロークの分布状態を表わすサブパタン
が各走査方向毎に4種類抽出され、更に抽出されたサブ
パタンの何れにも属さないパタンから成るかすれパタン
が抽出される。このかすれパタンについてサブパタン抽
出の必要性の有無が判定され、抽出の必要有りと判定さ
れた場合にはかすれパタンから微小セグメントを除去し
た残りのパタンからかすれサブパタンが前記同様に4種
類抽出される。その後前記サブパタンから抽出した特徴
或は前記サブパタンの特徴とかすれサブパタンの特徴を
合成した特徴を辞書の特徴と照合することにより文字認
識が行われる。従って、文字パタンを構成するストロー
ク成分のうち、文字認識に本質的な役割を果たすものの
一部がかすれたり小さくなったような場合でもかすれサ
ブパタンとして救済し抽出することが可能となるため、
局所的な線幅にばらつきの有るような低品質の文字パタ
ンに対しても高精度で安定した認識性能を得ることが可
能となる。
【0010】
【実施例】以下に本発明による文字認識装置の実施例1
及び実施例2を説明するが、ここでは例えば図4の40
1,図5の501及び図6(a)の「因」を構成する要
素「大」等は、便宜上、かすれパタンという名称で一括
して呼称する。また実施例1では、図6(a)の漢字
「因」という字の2値画像に対して、本実施例を適用し
た例について併せて説明していく。
【0011】図1は、本発明による文字認識装置の実施
例1を示すブロック図である。ここで、101は、文字
パタンをスキャナで走査して得られた光信号入力、10
2は光電変換部、103はパタンレジスタ、104は外
接枠検出部、105は文字パタン線幅計算部、106は
水平方向走査部、107は水平サブパタンメモリ、10
8は垂直方向走査部、 109は垂直サブパタンメモ
リ、110は右斜め方向走査部、111は右斜めサブパ
タンメモリ、112は左斜め方向走査部、113は左斜
めサブパタンメモリ、114はかすれパタン抽出部、1
15はかすれパタンメモリ、116はかすれパタン線幅
計算部、 117は水平方向走査部、118は水平かす
れサブパタンメモリ、119は垂直方向走査部、120
は垂直かすれサブパタンメモリ、121は右斜め方向走
査部、122は右斜めかすれサブパタンメモリ、123
は左斜め方向走査部、124は左斜めかすれサブパタン
メモリ、125は外接枠分割部、126は微小セグメン
ト除去部、127は特徴抽出部、128は特徴マトリク
スメモリ、129はかすれパタン特徴抽出部、130は
かすれパタン特徴マトリクスメモリ、131は線幅判定
部、132は合成部、133は識別部、134は辞書メ
モリ、135は認識結果である。
【0012】先ず、帳票等に手書きまたは印刷された文
字パタンをスキャナで走査して得られた光信号101
は、光電変換部102において、電気信号に変換され、
さらに量子化されて2値の信号からなる2値画像に変換
され、パタンレジスタ103に格納される。
【0013】外接枠検出部104は、パタンレジスタ1
03に蓄えられた2値画像に対し、水平走査により前記
2値画像の上端及び下端を検出し、垂直走査により前記
2値画像の左端及び右端を検出し、その結果、当該入力
文字パタンに外接する句形である外接枠を得る。そし
て、外接枠に関する座標値を線幅計算部105、水平方
向走査部106、垂直方向走査部108、右斜め方向走
査部110、左斜め方向走査部112及びかすれパタン
抽出部114に出力し、文字パタンの切り出し領域を指
定する。以下の処理において、パタンレジスタ103の
2値画像を用いる場合は、全て外接枠内にある2値画像
を対象とする。
【0014】文字パタン線幅計算部105では、当該入
力文字パタンにおける平均線幅が計算される。ここで、
平均線幅の求め方の一例として、パタンレジスタ103
の外接枠内の文字パタンの2値画像の黒画素数をA、4
黒画素数をQとした時、当該入力文字パタンの平均線幅
Wrを次式で計算する方法を用いている。 Wr = A / (A − Q) (1) 但し、4黒画素とは、2値画像を2×2の窓で走査した
時に2×2の窓の全てが黒画素となる点であり、4黒画
素数Qとは、そのような4黒画素を計数したものであ
る。
【0015】次にパタンレジスタ103の外接枠内の文
字パタンに対して、水平方向走査部106において水平
方向に、垂直方向走査部108において垂直方向に、右
斜め方向走査部110において右斜め方向に、左斜め方
向走査部112において左斜め方向に、それぞれ走査
し、前記線幅に基づいた値を閾値として、連続した黒画
素であるストロ−クを検出していき、それらの分布状態
を反映するサブパタンを生成する。この時、その連続し
た黒画素がサブパタンを構成するストロ−ク成分である
ことの条件は、連続黒画素数をLとしたとき、次式で与
えられる。 L > 2 × Wr (2) ここで、Wrとは文字パタン線幅計算部105において
算出された当該文字入力パタンの平均線幅である。即
ち、それぞれの方向の走査において線幅の2倍を超える
長さを持つストロ−クが当該方向のサブパタンを構成す
るストロ−クとして抽出されるのである。以上のように
検出された外接枠内における連続黒画素としてのストロ
−クの分布状態は、各々の走査方向毎に、水平サブパタ
ン、垂直サブパタン、右斜めサブパタン、左斜めサブパ
タンとして、それぞれ水平サブパタンメモリ107、垂
直サブパタンメモリ109、右斜めサブパタンメモリ1
11、左斜めサブパタンメモリ113に格納される。
【0016】図6の例では原2値画像が図6(a)に、
水平サブパタンが図6(b)に、垂直サブパタンが図6
(c)に、右斜めサブパタンが図6(d)に、左斜めサ
ブパタンが図6(e)に各々示されている。前述したよ
うに「因」を構成する要素「大」は、平均線幅が2倍以
下であるため各サブパタンには全く反映されていないこ
とがわかる。
【0017】かすれパタン抽出部114は、パタンレジ
スタ103の外接枠内の2値画像及び水平サブパタン、
垂直サブパタン、右斜めサブパタン、左斜めサブパタン
とを用いて、サブパタンとして抽出されなかったストロ
−ク成分の分布状態をかすれパタンとして抽出する。図
3において、点線で示された枠内がかすれパタン抽出部
114の内部を表しており、301はOR回路部、30
2はメモリ、303はNOT回路部、304は文字パタ
ンメモリ、305はAND回路部である。
【0018】図3に示されたかすれパタン抽出部114
における各ブロックの機能及び処理の流れについて以下
で説明する。先ず、各方向のサブパタンメモリ107,
109,111,113に格納された水平サブパタン、
垂直サブパタン、右斜めサブパタン及び左斜めサブパタ
ンは、OR回路部301に入力される。OR回路部30
1では、各サブパタンの黒画素を1、白画素を0とした
とき、外接枠で囲まれたサブパタン領域の画素1つ1つ
について、4つのサブパタン1の画素値のOR論理演算
が実行され、当該演算結果が、予めメモリ302に用意
されたサブパタン領域と同じ句形領域の対応する画素に
ついてそれぞれ出力されていき、最終的には、4つのサ
ブパタンの和集合であるパタンがメモリ302上に生成
される。このパタンは、当該領域の各画素において、4
つのサブパタンの内、少なくとも1つのサブパタンの画
素値が1、即ち、黒画素である時に、黒画素であり、4
つのサブパタンのいずれも画素値が0、即ち、白画素で
ある時に白画素となっている。従って、このサブパタン
の和集合のパタンの白画素部分は、もともと文字パタン
の2値画像でも白画素であったか或いは、2値画像では
黒画素であるがサブパタンとしては抽出されなかったか
のどちらかである。
【0019】次にメモリ302上に生成された前記パタ
ンについて、NOT回路部303によるNOT演算が実
行される。NOT回路部303では、メモリ302上の
パタンを構成する画素の一つ一つについて、順次、画素
値0の画素を画素値1に、画素値1の画素を画素値0に
変換し、即ち、白画素を黒画素に、黒画素を白画素に変
換するNOT演算を実行し、当該演算結果をメモリ30
2における当該画素上に出力する。以上のようにして、
メモリ302上には、OR回路部301によって生成さ
れたサブパタンの和集合であるパタンを白黒反転させた
パタンが生成される。
【0020】一方、上述の処理とは独立に、パタンレジ
スタ103の2値画像の内、外接枠検出部104によっ
て検出された外接枠内の2値画像のみが文字パタンメモ
リ304に転送される。次にメモリ302上のパタンと
文字パタンメモリ304上の文字パタンに対して、AN
D回路部305によって、AND演算が実行される。A
ND回路部305では、パタン領域内の個々の画素につ
いて、メモリ302上のパタンの画素値と該画素に対応
する文字パタンメモリ304上の文字パタンの画素値と
のAND演算、即ち、両者の画素値が1であったときの
みに、画素値1を出力し、少なくともどちらかが0であ
ったときは、画素値0を出力する演算を実行していき、
当該演算結果をかすれパタンとして、かすれパタンメモ
リ115に出力する。
【0021】このかすれパタンは、上述の処理で理解で
きるように、文字パタンを構成する黒画素の中で、4つ
のサブパタン1の黒画素のいずれにも所属しないものを
抽出してできたものである。即ち、かすれパタンは、例
えば、図4の401が示すようにストロ−クの一部がか
すれ、いくつかのセグメントに分裂してできたストロ−
クやまた図5の501が示すように元々孤立したストロ
−クであって、(2)式で示された平均線幅の2倍とい
う閾値に達しないもの等から構成されている。尚、この
かすれパタン抽出手段を図6(a)の原2値画像に適用
すると、図6(a)から図6(b),(c),(d),
(e)の各サブパタンの黒画素を全て除去することにな
り、従って、図6(f)のように、サブパタンとして抽
出されなかった要素「大」だけからなるかすれパタンが
得られる。
【0022】図1のかすれパタン抽出部114で抽出さ
れたかすれパタンは、かすれパタンメモリ115に格納
されているが、必要に応じて、このかすれパタンにおけ
る微小セグメントを除去するための微小セグメント除去
部126を設けることも可能である。例えば、この微小
セグメント除去部126による微小セグメントの除去ル
−ルとして、次のものが考えられる。即ち、かすれパタ
ンを構成する各セグメントの輪郭を構成する輪郭黒画素
数または、各セグメントの全黒画素数が、所定の閾値、
例えば、当該入力文字パタンの線幅Wrのβ倍(β>
0)以下であったとき、微小セグメントとみなすという
ル−ルである。ここで微小と判定されたセグメントは、
かすれパタンメモリ上で消去されるか、あるいは後続す
る処理の対象外とされる。以上のように微小セグメント
が消去されることによって、それに起因する認識性能の
低下を未然に防止することができる。
【0023】次にかすれパタン線幅計算部116におい
て、かすれパタンの線幅が計算される。この線幅の計算
方法として、例えば、文字パタン線幅計算部105で使
用した式(1)が用いられる。
【0024】次にかすれパタンメモリ115内のかすれ
パタンに対して、水平方向走査部117、垂直方向走査
部119、右斜め方向走査部121及び左斜め方向走査
部123によって、それぞれ水平、垂直、右斜め、左斜
め方向に走査され、所定の閾値を超えて連続した黒画素
がストロ−クとして検出されていく。その結果、今度は
かすれパタンのサブパタン、即ち、かすれサブパタンが
抽出され、それぞれ水平かすれサブパタンメモリ11
8、垂直かすれサブパタンメモリ120、右斜めかすれ
サブパタンメモリ122及び左斜めかすれサブパタンメ
モリ124に出力され、格納される。尚、ここで、サブ
パタンを構成するストロ−ク成分であるための条件は、
式(2)で与えられるのではなく、連続した黒画素数を
Lとしたとき、次式で与えられる。
【数1】 但し、Wsは、かすれパタン線幅計算部116によって
計算されたかすれパタンの線幅値である。また(4)式
で、γ = 2 としなかったのは、通常より小さな領
域で線幅を計算すること等に由来する誤差を考慮したか
らであり、γに補正因子が乗じられているとみなす。こ
の補正因子は、経験的に求められるが、勿論、通常はγ
= 2として閾値を設定してもよい。
【0025】ここでの処理を図6を例にとって説明する
と、先ず、「因」の字からかすれパタンとして抽出され
た部分パタン「大」は図6(f)に示されており、この
かすれパタンに対して、水平、垂直、右斜め、左斜め方
向に走査して得られたかすれサブパタンが、それぞれ、
図6(g)、(h)、(i)、(j)に各々示されてい
る。前述したように、当該走査における閾値は、図6
(a)の原2値画像「因」の線幅ではなく、図6(f)
のかすれパタン「大」の線幅に基づいて決定される。従
って、図6(a)の原2値画像の走査時では、線幅値が
大きかったため抽出されなかった「大」の字のサブパタ
ンが、好適な線幅値による走査によって適切に抽出され
ていることがわかる。
【0026】サブパタンからの特徴マトリクス抽出を行
う前に先ず、外接枠分割部125において、前記パタン
レジスタ103の外接枠内の文字パタンに対し、例えば
各分割領域内の黒画素数が同数になるように垂直方向、
水平方向に格子状となるN×M個の部分領域に非線形分
割しておく。この一つ一つの部分領域が特徴マトリクス
の個々の要素に相当するものである。
【0027】次に特徴抽出部127において前記第1の
走査によって得られた4種のサブパタンのそれぞれにつ
いて、前記分割された部分領域内における該サブパタン
の黒画素数を計数し、これをそのサブパタンの線幅で正
規化し、さらに文字パタンの大きさで正規化することに
よって、各方向における文字線の分布状態を反映するN
×M×4次元の特徴マトリクスを抽出し、特徴マトリク
スメモリ128に出力する。ここで、部分領域毎に計数
された黒画素数をそのサブパタンの線幅で正規化すると
いう処理は、例えば、次のようにしてもよい。即ち、サ
ブパタンを構成するストロ−クの中心を通る黒画素列を
抽出し、その黒画素数のみを計数するという手法であ
る。以上のような正規化によって、文字パタンの線幅や
大きさの違いによる特徴マトリクス要素の違いがなくな
り、本質的な特徴表現が可能となる。
【0028】またかすれパタン特徴抽出部129では、
前述の処理によって得られた4種のかすれサブパタンに
基づいて、前記特徴抽出部127と全く同様の方法によ
り、かすれパタンの特徴マトリクスを求める。しかし、
算出された特徴マトリクスをそのままかすれパタン特徴
マトリクスメモリ130に出力するのではなく、その前
に次に述べる処理を行う。この処理は、かすれパタン
が、そもそもかすれ等に起因して、スケ−ルが小さくな
り、従って、特徴マトリクスに対する寄与が小さくなっ
てしまったのを元のスケ−ルの寄与までに復原すること
を目的とするものである。
【0029】図7にこのかすれパタン特徴抽出部129
についての一実施例を表わすブロック図を示す。図7に
おいて点線で囲まれた部分が図1におけるかすれパタン
特徴抽出部129の内部を表しており、701は中心黒
画素列抽出部、702はマトリクス計数部、703は線
幅比乗算部、704が正規化部である。
【0030】次にかすれパタン特徴抽出部129の内部
の動作について説明するが、ここでは、文字パタンの線
幅の相違を正規化するためにサブパタンのストロ−クの
中心を通る線を求め、その中心線を構成する黒画素のみ
をマトリクス要素の計数対象とするという方法を採って
いる。先ず、メモリ118、120、122、124に
格納されていたかすれサブパタンは、中心黒画素列抽出
部701に入力され、そこで、かすれサブパタンを構成
するストロ−クの中心を通る中心線が抽出される。次に
マトリクス計数部702において、外接枠分割部125
でN×M個に分割された小領域の各々に属する前記中心
線を構成する黒画素の数が計数され、その計数された数
を個々の要素の大きさとして持つN×M次元のマトリク
スが作成される。次に線幅比乗算部703において、前
記マトリクス計数部702で作成されたマトリクスの要
素の各々に次式で表される係数Cを乗ずる。 C = Wr / Ws (3) ここで、Wrは、文字パタン線幅計算部706において
算出された入力文字パタンの平均線幅であり、Wsは、
かすれパタン線幅計算部707において算出されたかす
れパタンの線幅である。
【0031】この線幅比Cをマトリクス要素に乗じた趣
旨は、次の通りである。即ち、かすれパタンは、そもそ
も入力文字パタンの中で、かすれ等に起因してスケ−ル
が小さくなった部分であるので、そのスケ−ルのままで
マトリクスの一部としてカウントするよりも、それが平
均線幅を持つまでスケ−ルを復元してカウントした方
が、より正確にその文字パタンの特徴をマトリクスに反
映できる。そこで、本実施例では、かすれた部分が、も
しかすれなかった場合には、平均線幅で書かれたものと
して扱い、それが復元されたときは、線幅比Cだけスケ
−ルは増大するとみなすようにしたのである。ここで、
本実施例では、処理時間を可能な限り少なくするため
に、かすれパタンやかすれサブパタンそのものを対象と
して復元処理を行うのでなく、すでに算出されたかすれ
パタンの特徴マトリクス要素に対して、線幅比Cを乗ず
ることによって、かすれた部分の重みづけを行い、これ
をもってかすれ部分の復元処理としたのである。
【0032】さて次に、線幅比乗算部703で重みづけ
られたかすれパタンのマトリクスは、正規化部704に
おいて、例えば文字パタンの大きさを表わすファクタ−
で除算される等の方法により、文字パタンの大きさの相
違によるマトリクス要素の変動が吸収され、正規化され
る。
【0033】正規化されたマトリクスは、かすれパタン
に対する特徴マトリクスとして、かすれパタン特徴マト
リクスメモリ130に出力される。
【0034】次に図1の合成部132においては、メモ
リ128に格納されている特徴マトリクス及びメモリ1
30に格納されているかすれパタンの特徴マトリクスと
の合成が行われ、合成特徴マトリクスが識別部133に
出力される。ここで、2つの特徴マトリクスの合成は、
例えば2つのマトリクスのそれぞれ対応する要素を足し
合わせるという方法が用いられる。
【0035】識別部133では、入力された前記合成特
徴マトリクスと辞書メモリ134に予め格納しておいた
複数の標準文字の特徴マトリクスとを照合し、該照合結
果から判断して、最終的に一つに絞られた候補カテゴリ
を該入力文字パタンの認識結果135として出力する。
【0036】本実施例1では、上述したかすれパタンに
対するサブパタンの抽出や特徴マトリクスの重み付けを
常に実行するわけではない。例えば、前記かすれパタン
線幅計算部116で計算されたかすれパタンの線幅が、
所定の閾値以下であると線幅判定部131で判定された
場合、または微小セグメント除去部126において、か
すれパタンの全てのセグメントが微小であると判定され
た場合には、合成部132は、特徴マトリクスメモリ1
28の内容のみを識別部133に出力する。この時、前
記線幅に対する閾値としては、例えば、次式が与えられ
る。 Ws < δ × Wr (5) 0 < δ 《 1 (6) 但し、Wsはかすれパタンの線幅、Wrは原2値画像の
線幅であって、式(5)及び式(6)の条件が満たされ
る時は、WsがWrに比べて極端に小さいことを意味し
ている。
【0037】以上の処置は、以下に述べる問題点に鑑み
てなされたものである。すなわち、かすれサブパタンに
基づく特徴マトリクスを原2値画像の走査によって得ら
れたサブパタンに基づく特徴マトリクスに合成すること
は、除去された重要な情報を回復させる一方で、その文
字パタンにとって非本質的なストロ−ク成分をもつけ加
えてしまうおそれがある。従って本実施例では、非本質
的なストロ−ク成分の除去を目指すために、前述したよ
うに先ず、微小セグメント除去部126においてかすれ
パタンの微小セグメントを除去し、また当然のことなが
ら全てのセグメントが微小と判定された場合には、原2
値画像に対する走査によって得られたサブパタンに基づ
く特徴マトリクスだけを識別部133に出力するように
したのである。さらに線幅判定部131を設け、かすれ
パタンの線幅が所定の閾値に達しない場合にも当該かす
れパタンは、認識上、非本質的であると判定することに
して、かかる場合にかすれパタンの走査を実行せず、同
様の処置を施すようにしたのである。このようにするこ
とで、非本質的なストロ−ク成分は特徴マトリクスから
除去され、それによる誤読等を未然に防止することが可
能となる。
【0038】以上が本発明による文字認識装置の実施例
1であるが、実施例1は、文字や図形を構成するストロ
−クの局所線幅が2つに分類できるときに極めて有効な
方法であった。しかし、通常の簡単な文字は、2種類の
線幅による走査でもサブパタンにほぼ反映できるとみな
せる一方、3種類以上のスケ−ルのストロ−クからなる
複雑な図形や漢字等では、2段階の処理でもとらえきれ
ないストロ−ク成分が存在する可能性が有る。実施例2
は、このような問題点に鑑みて発明されたものであり、
実施例1が2段階の線幅に基づく処理であったのに対
し、実施例2は、これをさらに一般化し、N段階(N≧
2)の走査が可能となっている。この実施例2について
以下に説明する。
【0039】図2は本発明による実施例2を示すブロッ
ク図である。ここで、201は光信号入力、202は光
電変換部、203はパタンレジスタ、204は外接枠検
出部、205はレジスタ、206は線幅計算部、207
は水平方向走査部、208は水平パタンメモリ、209
は垂直方向走査部、210は垂直パタン走査部、211
は右斜め方向走査部、212は右斜めパタンメモリ、2
13は左斜め方向走査部、214は左斜めパタンメモ
リ、215はかすれパタン抽出部、216は微小セグメ
ント除去部、217は線幅判定部、218は特徴マトリ
クス抽出部、219は合成部、220は特徴マトリクス
メモリ、221はル−プカウンタ、222は識別部、2
23は辞書メモリ、224は認識結果、225は外接枠
分割部である。
【0040】ここでは、主として実施例1との相違点に
ついて説明する。先ず、201、202、203、20
4は実施例1に準じ、パタンレジスタ203の2値画像
のうち、外接枠内のデ−タだけが、レジスタ205に転
送される。後述するようにこのレジスタ205には、文
字パタンの2値デ−タだけでなく、かすれパタンも順
次、上書きされる。線幅計算部206はこのレジスタ2
05内のデ−タに対し、線幅の計算を行う。今は、文字
パタンの2値デ−タが格納されているので、文字パタン
の平均線幅が計算される。この線幅の算出も実施例1の
方法を準用する。
【0041】次に、実施例1と同様に、このレジスタ2
05内の2値デ−タは、水平方向走査部207、垂直方
向走査部209、右斜め方向走査部211、左斜め方向
走査部213により、それぞれ水平、垂直、右斜め、左
斜め方向に走査され、前記線幅を閾値として、サブパタ
ンが抽出され、各々、水平パタンメモリ208、垂直パ
タンメモリ210、右斜めパタンメモリ212、左斜め
パタンメモリ214に格納される。
【0042】特徴マトリクス抽出部218では、前記メ
モリ208、210、212、214に格納されている
サブパタンまたはかすれサブパタンに基づいて、特徴マ
トリクスを算出することが可能となっている。この特徴
マトリクスは、実施例1でも述べたように外接枠分割部
225によって分割された部分領域毎にサブパタンの黒
画素数等を計数し、該サブパタンの分布状態を反映する
マトリクス形式で表現される。算出された特徴マトリク
スは、先ず、特徴マトリクスメモリ220に出力され
る。従って、今は、原2値画像のサブパタンに基づいた
特徴マトリクス(以下、原特徴マトリクスと略記)が格
納されていることになる。
【0043】次に、かすれパタン抽出部215におい
て、レジスタ205の文字パタンの2値デ−タとメモリ
208、210、212、214に格納されたサブパタ
ンより、かすれパタンを抽出し、レジスタ205に転送
する。この時、かすれパタンの抽出は、実施例1の図3
に示した方法によって行い、このかすれパタンを便宜
上、かすれパタン1としておく。そして、微小セグメン
ト除去部216でかすれパタン1の微小セグメントの除
去を行い、残ったセグメント数等をチェックした後、線
幅計算部206においてかすれパタン1の線幅の計算を
行い、さらに線幅判定部217で、前記線幅値に基づい
てかすれパタン1のサブパタン抽出を行うか否かを判定
する。但し、微小セグメント除去部216または線幅判
定部217の判定方法は、実施例1に準用する。
【0044】ここでかすれパタン1について、サブパタ
ン抽出の必要はないと判定されると、特徴マトリクスメ
モリ220に格納されている原特徴マトリクスは、識別
部222に出力され認識処理が行われる。逆にサブパタ
ン抽出の必要ありと判定された場合には、レジスタ20
5のかすれパタン1は、各方向に走査されることによ
り、かすれパタン1のサブパタン、即ち、かすれサブパ
タン1として抽出され、それぞれメモリ208、21
0、212、214に格納されて、特徴マトリクス抽出
部218においてかすれサブパタン1の特徴抽出が行わ
れ、さらに合成部219において当該特徴マトリクス及
び特徴マトリクスメモリ220に格納されている原特徴
マトリクスとの合成が行われ、再び特徴マトリクスメモ
リ220に出力される。
【0045】ここで、合成部219では、マトリクスの
要素毎に、原特徴マトリクスとかすれパタン1の特徴マ
トリクスとの足し算が行われるが、この時、かすれパタ
ン1の特徴マトリクスの要素に実施例1の式(3)で示
された係数Cによる重み付けがなされる。ここで、合成
された特徴マトリクスを合成特徴マトリクス1とする。
前記特徴マトリクス1は、実施例1において、2度の特
徴抽出の結果合成されたものと同一のものであるが、実
施例2では、さらにかすれパタン抽出部215におい
て、現時点でレジスタ205に格納されたかすれパタン
1とメモリ208、210、212、214に格納され
たかすれサブパタン1とを用いて、2度目の処理によっ
ても検出されなかったストロ−ク成分を抽出し、これを
かすれパタン2としてレジスタ205に格納する。ここ
で、図3において、メモリ107、109、111、1
13は、図2におけるメモリ208、210、212、
214に相当し、文字パタンメモリ304は、レジスタ
205に置き換えるものとする。
【0046】次にかすれパタン2に対しても、かすれパ
タン2の線幅を閾値とした走査によってかすれサブパタ
ン2が求められ、特徴マトリクス抽出部218におい
て、かすれパタン2の特徴マトリクスが抽出され、合成
部219で式(3)に基づいた合成特徴マトリクス1と
の重み付け合成が行われ、合成特徴マトリクス2として
格納される。この時、式(3)の適用は、Wrとして、
かすれパタン1の線幅、Wsとして、かすれパタン2の
線幅が用いられる。全く同様にして、かすれパタンKに
対して、かすれパタンKの線幅を閾値とした走査によっ
てかすれサブパタンKを求め、これに基づいて特徴マト
リクスを抽出し、合成特徴マトリクスK−1との重み付
け合成を行い、再びメモリ220に合成特徴マトリクス
Kとして出力する。この時、(3)式の適用は、Wrと
して、かすれパタンK−1の線幅、Wsとして、かすれ
パタンKの線幅が用いられる。
【0047】特徴マトリクスの合成回数Kは、ル−プカ
ウンタ221によってカウントされており、Kが所定の
閾値Mに達した場合、メモリ220の特徴マトリクスM
は識別部222に出力される。尚、合成回数KがMに達
しない場合でも、微小セグメント除去部216または線
幅判定部217において、かすれパタンKを走査する必
要がないと判定された場合は、その時点の合成特徴マト
リクスKが識別部222に出力される。
【0048】識別部222、辞書メモリ223、認識結
果224は、全て実施例1と同様であるので、説明を省
略する。
【0049】以上、実施例2によれば、M回の走査及び
特徴マトリクスの合成によって、それぞれ線幅の異なる
M種のストロ−ク成分を全て反映した特徴マトリクスが
作成され、しかも、線幅比による重み付けがなされるの
で、M種の線幅のストロ−クからなる複雑な漢字や図形
等に対しても高精度な認識性能を安定に維持できる。ま
た、実施例1は、実施例2においてM=1としたものと
同等であり、実施例2の特殊な場合に相当している。
【0050】尚、実施例1及び実施例2は、上述した例
のみに限定されるものではない。例えば、かすれパタン
抽出部114または215におけるかすれパタン抽出手
段は図3に示された方法だけでなく、OR、NOR、A
ND,NAND、NOT回路等を組み合わせることによ
って、また原2値画像と4種のサブパタンの黒画素を画
素毎にカウントし、そのカウント数が1のものを抽出し
ていくことによって同一の結果を出力する方法がいくつ
か考えられるが、如何なる方法であっても本実施例で定
義されたかすれパタンを抽出できれば、それらは全て本
発明に属する。
【0051】また非本質的なストロ−ク成分を除去する
方法として、微小セグメントの除去や線幅による判定に
よる方法を用いたが、これらの条件式及び閾値の設定等
は、本発明の範囲内で任意に変更できる。
【0052】また式(3)による重み付けの方法は、特
にこの式に依らずとも、かすれ部分やスケ−ルの小さい
部分の特徴マトリクス上における強調が可能であるなら
ば、線幅以外の特徴を用いた他の表式に変更可能であ
る。
【0053】またかすれパタンの特徴マトリクスに対す
る線幅比による復元は、特徴マトリクス抽出部内部で行
ってもよいし、或いは合成する段階で行ってもよい。
【0054】またパタンレジスタや各メモリの構成、線
幅の計算方法、特徴マトリクスの抽出方法、外接枠分割
方法等も本発明の範囲内で適宜変更可能である。さらに
図1、図2、図3、図7のブロック図において、各構成
部分に分担された処理や動作、入出力信号の流れ、設置
個数、位置その他の条件も任意好適に変更可能である。
【0055】
【発明の効果】以上、詳細に説明したように、本発明に
よれば、入力文字パタンを量子化された2値画像に変換
し、2値画像の外接枠を検出し、外接枠内の2値画像の
線幅を計算し、外接枠内の2値画像に対して、水平、垂
直、右斜め、左斜め方向に走査して、線幅に基づいてス
トロ−クの分布状態を反映する4種類のサブパタンを抽
出し、このサブパタンから特徴マトリクスを算出し、前
記外接枠内の2値画像及びサブパタン4種とを用いて、
サブパタンとして抽出されなかったかすれパタンを検出
し、かすれパタンの線幅を計算し、さらにかすれパタン
に対して、かすれパタンの線幅に基づいて設定された閾
値を用いて、水平、垂直、右斜め、左斜め方向に走査
し、4種類のかすれサブパタンを抽出し、かすれサブパ
タンの特徴マトリクスを抽出し、前記特徴マトリクス
に、それぞれの線幅比で重み付けしたかすれ特徴マトリ
クスを足し合わせることによって、合成特徴マトリクス
を作成し、合成特徴マトリクスと辞書とを照合した結果
より、認識結果を出力するようにしたので、文字パタン
を構成するストロ−クであって、認識に本質的な役割を
果たすものの一部が、他の部分との局所線幅と比較して
小さくなった場合でも、サブパタンの一部として抽出す
ることが可能となり、しかも線幅比で強調されて特徴マ
トリクスに反映されるので、局所線幅に大きな相違のあ
る品質の悪い文字パタンや様々なスケ−ルのストロ−ク
から構成される複雑な漢字文字や図形等に対しても高精
度な認識性能を安定に維持できる文字認識装置が実現可
能となる。
【図面の簡単な説明】
【図1】本発明による文字認識装置の実施例1を示すブ
ロック図である。
【図2】本発明による文字認識装置の実施例2を示すブ
ロック図である。
【図3】かすれパタン抽出部の構成の一例を示すブロッ
ク図である。
【図4】かすれ部分の存在するパタンの一例である。
【図5】つぶれによりサブパタンとして抽出されない部
分があるパタンの一例である。
【図6】本発明の適用例を示す図である。
【図7】かすれパタン特徴抽出部の一実施例を示すブロ
ック図である。
【符号の説明】
101 光信号 102 光電変換部 103 パタンレジスタ 104 外接枠検出部 105 文字パタン線幅計算部 106 水平方向走査部 107 水平サブパタンメモリ 108 垂直方向走査部 109 垂直サブパタンメモリ 110 右斜め方向走査部 111 右斜めサブパタンメモリ 112 左斜め方向走査部 113 左斜めサブパタンメモリ 114 かすれパタン抽出部 115 かすれパタンメモリ 116 かすれパタン線幅計算部 117 水平方向走査部 118 水平かすれサブパタンメモリ 119 垂直方向走査部 120 垂直かすれサブパタンメモリ 121 右斜め方向走査部 122 右斜めかすれサブパタンメモリ 123 左斜め方向走査部 124 左斜めかすれサブパタンメモリ 125 外接枠分割部 126 微小セグメント除去部 127 特徴抽出部 128 特徴マトリクスメモリ 129 かすれパタン特徴抽出部 130 かすれ特徴マトリクスメモリ 131 線幅判定部 132 合成部 133 識別部 134 辞書メモリ 135 認識結果

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 帳票等に記入された文字パタンを光学的
    に走査して、量子化された電気信号である2値画像に変
    換する光電変換部と、 前記2値画像に変換された文字パタンを格納するパタン
    レジスタと、 前記パタンレジスタ内の文字パタンの外接枠を検出する
    外接枠検出部と、 前記パタンレジスタの外接枠内の文字パタンの線幅を算
    出する線幅計算部と、 前記パタンレジスタの外接枠内の文字パタンに対して水
    平、垂直、右斜め、左斜めの各方向に走査し、走査線上
    の黒画素の連続数が前記線幅に基づいて定められた閾値
    を超えた場合にストロークとして検出し、これらのスト
    ロークの分布を表わすサブパタンを各方向毎に4種類抽
    出するサブパタン抽出部と、 前記パタンレジスタの外接枠内の2値画像及び前記4種
    類のサブパタンより、文字パタンを構成する黒画素の中
    で、4種類のサブパタンのいずれにも属さない黒画素の
    集合をかすれパタンとして抽出するかすれパタン抽出部
    と、 前記かすれパタンを構成するセグメントのうち、微小な
    セグメントを除去する微小セグメント除去部と、 前記かすれパタンの線幅を算出するかすれパタン線幅計
    算部と、 前記かすれパタンについてサブパタン抽出の必要有りと
    判定された場合に微小セグメントを除去したかすれパタ
    ンに対して水平、垂直、右斜め、左斜めの各方向に走査
    し、走査線上の黒画素の連続数が前記かすれパタンの線
    幅に基づいて定められた閾値を超えた場合にストローク
    として検出し、これらのストロークの分布を表わすかす
    れサブパタンを各方向毎に4種類抽出するかすれサブパ
    タン抽出部と、 前記サブパタン及び前記かすれサブパタンの特徴を抽出
    する特徴抽出部と、 前記サブパタンの特徴と前記かすれサブパタンの特徴と
    を合成し、合成特徴を得る合成部と、 前記合成特徴と予め用意された辞書の特徴とを照合して
    最終的な認識結果を出力する識別部とを有することを特
    徴とする文字認識装置。
JP5158769A 1993-06-29 1993-06-29 文字認識装置 Expired - Lifetime JP2902905B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5158769A JP2902905B2 (ja) 1993-06-29 1993-06-29 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5158769A JP2902905B2 (ja) 1993-06-29 1993-06-29 文字認識装置

Publications (2)

Publication Number Publication Date
JPH0714005A JPH0714005A (ja) 1995-01-17
JP2902905B2 true JP2902905B2 (ja) 1999-06-07

Family

ID=15678944

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5158769A Expired - Lifetime JP2902905B2 (ja) 1993-06-29 1993-06-29 文字認識装置

Country Status (1)

Country Link
JP (1) JP2902905B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8306327B2 (en) 2008-12-30 2012-11-06 International Business Machines Corporation Adaptive partial character recognition

Also Published As

Publication number Publication date
JPH0714005A (ja) 1995-01-17

Similar Documents

Publication Publication Date Title
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP4232800B2 (ja) ラインノイズ除去装置、ラインノイズ除去方法、ラインノイズ除去プログラム
US20030063802A1 (en) Image processing method, apparatus and system
US5835638A (en) Method and apparatus for comparing symbols extracted from binary images of text using topology preserved dilated representations of the symbols
CN102722729A (zh) 通过用字符的形状特征来比较字符而检测文档变化的方法
CN112861865A (zh) 一种基于ocr技术的辅助审计方法
JPH0792820B2 (ja) 文字認識方法
JP2902905B2 (ja) 文字認識装置
KR20030017304A (ko) 망점 제거 방법 및 시스템
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
JP2644041B2 (ja) 文字認識装置
JP2902904B2 (ja) 文字認識装置
JPH0728948A (ja) 文字認識装置
JP2000076378A (ja) 文字認識方法
JPH076205A (ja) 文字認識装置
JP3237906B2 (ja) 印刷物の検査装置
JP3687999B2 (ja) 文字認識装置
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JP2973892B2 (ja) 文字認識方式
JP3210224B2 (ja) 文字認識装置
JP2708604B2 (ja) 文字認識方法
JP3277977B2 (ja) 文字認識方法
JP3197464B2 (ja) 文字認識方法および文字認識装置
JP2747136B2 (ja) 文字認識装置
JP2827288B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990309