JPH06223226A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH06223226A JPH06223226A JP5009185A JP918593A JPH06223226A JP H06223226 A JPH06223226 A JP H06223226A JP 5009185 A JP5009185 A JP 5009185A JP 918593 A JP918593 A JP 918593A JP H06223226 A JPH06223226 A JP H06223226A
- Authority
- JP
- Japan
- Prior art keywords
- character
- character pattern
- distribution
- pattern
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】 (修正有)
【目的】 つぶれた文字においても正確に認識が可能
で、従って誰でも高速に簡単に入力作業が可能であるよ
うな高性能な文字認識装置を提供する。 【構成】 文字、記号、図形等の入力文字パタンをX軸
とY軸に各々投影して得られた各々の黒画素の分布から
周辺分布を作成し、黒画素の分布に基づきX軸及びY軸
を小区間に各々分割し、分割結果に基づき前記入力文字
パタンの文字枠内を小領域に分割し、分割された各小領
域において入力文字パタンの特徴を表わす特徴マトリク
スを抽出し、前記入力文字パタンの特徴マトリクスと予
め用意された標準文字の特徴マトリクスとを照合して識
別を行う文字認識装置において、前記入力文字パタンの
つぶれを検出するつぶれ検出部、及び検出した文字パタ
ンのつぶれ情報に基づいて周辺分布を修正する周辺分布
修正部とを具備し、修正された周辺分布を用いて前記文
字枠内の分割を行う。
で、従って誰でも高速に簡単に入力作業が可能であるよ
うな高性能な文字認識装置を提供する。 【構成】 文字、記号、図形等の入力文字パタンをX軸
とY軸に各々投影して得られた各々の黒画素の分布から
周辺分布を作成し、黒画素の分布に基づきX軸及びY軸
を小区間に各々分割し、分割結果に基づき前記入力文字
パタンの文字枠内を小領域に分割し、分割された各小領
域において入力文字パタンの特徴を表わす特徴マトリク
スを抽出し、前記入力文字パタンの特徴マトリクスと予
め用意された標準文字の特徴マトリクスとを照合して識
別を行う文字認識装置において、前記入力文字パタンの
つぶれを検出するつぶれ検出部、及び検出した文字パタ
ンのつぶれ情報に基づいて周辺分布を修正する周辺分布
修正部とを具備し、修正された周辺分布を用いて前記文
字枠内の分割を行う。
Description
【0001】
【産業上の利用分野】この発明は、一部がつぶれた文字
も正確に認識のできる文字認識装置に関するものであ
る。
も正確に認識のできる文字認識装置に関するものであ
る。
【0002】
【従来の技術】従来、文字を高精度に認識できる文字認
識方式としては、文献:特公平1−47829に開示さ
れる文字認識方式があった。この文字認識方式によれ
ば、入力文字パタンをX軸、Y軸方向に投影し、黒画素
の分布を作成し、夫々の方向の黒画素の分布より重心点
を検出し、さらに前記重心点で分割された各々の領域に
ついてさらに重心を検出し、前記処理を繰り返し前記入
力文字パタンの外接枠を複数の区間に分割し、前記分割
点に従って入力文字パタンを複数の部分領域に分割す
る。また、入力文字パタンの線幅を算出し、入力文字パ
タン及び前記線幅より2以上の複数方向の線素を表す複
数のサブパタンを抽出する。そして、サブパタンの文字
枠内領域を前記複数の部分領域に分割し、各方向に関す
る各部分領域毎の文字線の分布状態を表す特徴マトリク
スを抽出し、抽出した特徴マトリクスを予め用意した辞
書マトリクスと照合して識別を行い候補文字名を得ると
いうものであった。
識方式としては、文献:特公平1−47829に開示さ
れる文字認識方式があった。この文字認識方式によれ
ば、入力文字パタンをX軸、Y軸方向に投影し、黒画素
の分布を作成し、夫々の方向の黒画素の分布より重心点
を検出し、さらに前記重心点で分割された各々の領域に
ついてさらに重心を検出し、前記処理を繰り返し前記入
力文字パタンの外接枠を複数の区間に分割し、前記分割
点に従って入力文字パタンを複数の部分領域に分割す
る。また、入力文字パタンの線幅を算出し、入力文字パ
タン及び前記線幅より2以上の複数方向の線素を表す複
数のサブパタンを抽出する。そして、サブパタンの文字
枠内領域を前記複数の部分領域に分割し、各方向に関す
る各部分領域毎の文字線の分布状態を表す特徴マトリク
スを抽出し、抽出した特徴マトリクスを予め用意した辞
書マトリクスと照合して識別を行い候補文字名を得ると
いうものであった。
【0003】
【発明が解決しようとする課題】しかし、前記従来の認
識方法では、黒画素の分布を抽出して、該黒画素の重心
を検出し、該重心点に基づいて文字枠内を複数の部分領
域に分割して、当該部分領域夫々について特徴量を算出
している。そのため、入力文字パタンにつぶれ部分があ
った場合には、前記黒画素の分布が前記つぶれの影響を
受けて、大きく変化し、その結果前記重心の位置が変化
し、前記部分領域の分割の仕方が大きく変わってくるた
め、適正な特徴マトリクスが抽出できず、従って入力文
字パタンを正確に認識できないという問題点があった。
識方法では、黒画素の分布を抽出して、該黒画素の重心
を検出し、該重心点に基づいて文字枠内を複数の部分領
域に分割して、当該部分領域夫々について特徴量を算出
している。そのため、入力文字パタンにつぶれ部分があ
った場合には、前記黒画素の分布が前記つぶれの影響を
受けて、大きく変化し、その結果前記重心の位置が変化
し、前記部分領域の分割の仕方が大きく変わってくるた
め、適正な特徴マトリクスが抽出できず、従って入力文
字パタンを正確に認識できないという問題点があった。
【0004】また、そのためつぶれ文字の誤読が増え、
認識結果の確認、修正作業が増えるため、結果的に入力
作業に時間がかかり、また修正作業に習熟したオペレー
タが必要となり、誰にでもオペレーション作業が可能で
あるような高性能な文字認識装置が実現できないという
問題点があった。
認識結果の確認、修正作業が増えるため、結果的に入力
作業に時間がかかり、また修正作業に習熟したオペレー
タが必要となり、誰にでもオペレーション作業が可能で
あるような高性能な文字認識装置が実現できないという
問題点があった。
【0005】この発明は、以上述べたような、つぶれた
文字が正確に認識ができないという問題点と、そのため
誰にでも高速に入力作業ができるような高性能な文字認
識装置が実現できないという問題点を除去し、つぶれた
文字においても正確に認識が可能で、従って誰でも高速
に簡単に入力作業が可能であるような高性能な文字認識
装置を提供することを目的とする。
文字が正確に認識ができないという問題点と、そのため
誰にでも高速に入力作業ができるような高性能な文字認
識装置が実現できないという問題点を除去し、つぶれた
文字においても正確に認識が可能で、従って誰でも高速
に簡単に入力作業が可能であるような高性能な文字認識
装置を提供することを目的とする。
【0006】
【課題を解決するための手段】この発明は文字、記号、
図形等の入力文字パタンをX軸とY軸に各々投影して得
られた各々の黒画素の分布から周辺分布を作成し、前記
黒画素の分布に基づきX軸及びY軸を小区間に各々分割
し、前記分割結果に基づき前記入力文字パタンの文字枠
内を小領域に分割し、前記分割された各小領域において
入力文字パタンの特徴を表わす特徴マトリクスを抽出
し、前記入力文字パタンの特徴マトリクスと予め用意さ
れた標準文字の特徴マトリクスとを照合して識別を行う
文字認識装置において、前記入力文字パタンのつぶれを
検出するつぶれ検出部と、前記検出した文字パタンのつ
ぶれ情報に基づいて前記周辺分布を修正する周辺分布修
正部とを具備し、前記修正された周辺分布を用いて前記
文字枠内の分割を行うことを特徴とする。
図形等の入力文字パタンをX軸とY軸に各々投影して得
られた各々の黒画素の分布から周辺分布を作成し、前記
黒画素の分布に基づきX軸及びY軸を小区間に各々分割
し、前記分割結果に基づき前記入力文字パタンの文字枠
内を小領域に分割し、前記分割された各小領域において
入力文字パタンの特徴を表わす特徴マトリクスを抽出
し、前記入力文字パタンの特徴マトリクスと予め用意さ
れた標準文字の特徴マトリクスとを照合して識別を行う
文字認識装置において、前記入力文字パタンのつぶれを
検出するつぶれ検出部と、前記検出した文字パタンのつ
ぶれ情報に基づいて前記周辺分布を修正する周辺分布修
正部とを具備し、前記修正された周辺分布を用いて前記
文字枠内の分割を行うことを特徴とする。
【0007】
【作用】この発明によれば、入力文字パタンのつぶれを
検出するつぶれ検出部と、つぶれ検出部により検出され
たつぶれ情報に基づいて入力文字パタンの周辺分布を修
正する周辺分布修正部とを具備し、入力文字パタンのつ
ぶれの影響を除去した新たな周辺分布を作成し、新たな
周辺分布に基づいて文字枠分割点を検出できるようにし
たものであり、入力文字パタンにつぶれ部分があった場
合でも周辺分布におけるつぶれの影響を削除でき、つぶ
れが無い場合と同様の適切な文字枠の分割を行える。従
って適正な特徴マトリクスが抽出でき入力文字パタンを
正確に認識できるようになり、前記課題が解決されるの
である。
検出するつぶれ検出部と、つぶれ検出部により検出され
たつぶれ情報に基づいて入力文字パタンの周辺分布を修
正する周辺分布修正部とを具備し、入力文字パタンのつ
ぶれの影響を除去した新たな周辺分布を作成し、新たな
周辺分布に基づいて文字枠分割点を検出できるようにし
たものであり、入力文字パタンにつぶれ部分があった場
合でも周辺分布におけるつぶれの影響を削除でき、つぶ
れが無い場合と同様の適切な文字枠の分割を行える。従
って適正な特徴マトリクスが抽出でき入力文字パタンを
正確に認識できるようになり、前記課題が解決されるの
である。
【0008】
【実施例】以下図1〜図9を参照してこの発明の文字認
識装置の実施例につき説明する。図1は本発明の文字認
識装置の一実施例を示すブロック図である。文字認識装
置100は、画像入力部101、パタンレジスタ10
2、周辺分布作成部103、つぶれ検出部104、文字
枠抽出部105、文字線幅計算部106、周辺分布修正
部107、重心検出部108、文字枠分割点決定部10
9、サブパタン抽出部110、特徴マトリクス抽出部1
11、識別部112及び出力端子113を具えてなる。
識装置の実施例につき説明する。図1は本発明の文字認
識装置の一実施例を示すブロック図である。文字認識装
置100は、画像入力部101、パタンレジスタ10
2、周辺分布作成部103、つぶれ検出部104、文字
枠抽出部105、文字線幅計算部106、周辺分布修正
部107、重心検出部108、文字枠分割点決定部10
9、サブパタン抽出部110、特徴マトリクス抽出部1
11、識別部112及び出力端子113を具えてなる。
【0009】図2はつぶれ検出部104の一実施例を示
すブロック図でありは、線幅算出部201、輪郭追跡部
202、局所線幅抽出部203、判定部204及びつぶ
れ検出部205を具えてなる。
すブロック図でありは、線幅算出部201、輪郭追跡部
202、局所線幅抽出部203、判定部204及びつぶ
れ検出部205を具えてなる。
【0010】図3は通常の入力文字パタンの例を示した
図である。図4はつぶれた入力文字パタンの例を示した
図である。図5は通常の文字の周辺分布を説明する図で
ある。図6はつぶれた文字の周辺分布を説明する図であ
る。図7はつぶれ検出部104の動作を説明する図。図
8は周辺分布修正部の動作を説明する図である。図9は
輪郭追跡の説明をする図である。
図である。図4はつぶれた入力文字パタンの例を示した
図である。図5は通常の文字の周辺分布を説明する図で
ある。図6はつぶれた文字の周辺分布を説明する図であ
る。図7はつぶれ検出部104の動作を説明する図。図
8は周辺分布修正部の動作を説明する図である。図9は
輪郭追跡の説明をする図である。
【0011】以下、この実施例の文字認識装置の動作を
図1〜図9を用いて詳細に説明する。画像入力部101
は、文字、図形、記号等(以下、文字という)が記載さ
れた帳票からの光信号Sを光電変換し、例えば文字線部
を黒画素、背景部を白画素で表現した白黒2値に量子化
された電気信号(以下、帳票画像データという)を生成
し、1文字づつの文字パタン(以下、入力文字パタンと
いう)を切り出し、該切り出された入力文字パタンをパ
タンレジスタ102に出力する。尚前記文字パタンの切
り出しは以下に述べるような方法により行う。
図1〜図9を用いて詳細に説明する。画像入力部101
は、文字、図形、記号等(以下、文字という)が記載さ
れた帳票からの光信号Sを光電変換し、例えば文字線部
を黒画素、背景部を白画素で表現した白黒2値に量子化
された電気信号(以下、帳票画像データという)を生成
し、1文字づつの文字パタン(以下、入力文字パタンと
いう)を切り出し、該切り出された入力文字パタンをパ
タンレジスタ102に出力する。尚前記文字パタンの切
り出しは以下に述べるような方法により行う。
【0012】まず帳票画像データを行方向に平行な方向
に走査して黒画素の分布を作成し、該黒画素の分布より
1行ずつの行データを抽出する。次に前記抽出した行デ
ータを行方向に垂直な方向に走査して、各行について黒
画素の分布を作成し、該黒画素の分布より1文字づつの
文字間隔を検出する。そして、前記作成された各行の黒
画素の分布、及び前記検出された文字間隔を用いて1文
字づつの文字領域を検出し、該領域に基づいて1文字づ
つの文字パタンを切り出す。尚、本実施例においては図
3に示すような通常の入力文字パタンを得た場合、及び
図4に示すようなつぶれた入力文字パタンを得た場合を
例にし、以降具体的に説明する。
に走査して黒画素の分布を作成し、該黒画素の分布より
1行ずつの行データを抽出する。次に前記抽出した行デ
ータを行方向に垂直な方向に走査して、各行について黒
画素の分布を作成し、該黒画素の分布より1文字づつの
文字間隔を検出する。そして、前記作成された各行の黒
画素の分布、及び前記検出された文字間隔を用いて1文
字づつの文字領域を検出し、該領域に基づいて1文字づ
つの文字パタンを切り出す。尚、本実施例においては図
3に示すような通常の入力文字パタンを得た場合、及び
図4に示すようなつぶれた入力文字パタンを得た場合を
例にし、以降具体的に説明する。
【0013】パタンレジスタ102は、画像入力部10
1より入力された1文字づつの入力文字パタンを順次記
憶しておく記憶部であり、本実施例では128×128
画素の記憶容量を持つものである。本パタンレジスタ1
02内に記憶された1文字づつの入力文字パタンは、周
辺分布作成部103、つぶれ検出部104、文字枠抽出
部105、文字線幅算出部106、及びサブパタン抽出
部110より自由に参照することができるものである。
1より入力された1文字づつの入力文字パタンを順次記
憶しておく記憶部であり、本実施例では128×128
画素の記憶容量を持つものである。本パタンレジスタ1
02内に記憶された1文字づつの入力文字パタンは、周
辺分布作成部103、つぶれ検出部104、文字枠抽出
部105、文字線幅算出部106、及びサブパタン抽出
部110より自由に参照することができるものである。
【0014】周辺分布作成部103は、パタンレジスタ
102内の入力文字パタンを水平(X方向)及び垂直
(Y方向)に走査して各走査線上の黒画素数を計数し、
黒画素の分布(以降周辺分布と言う)を作成する。例え
ば図3及び図4に示すような通常の文字、つぶれ文字に
おいては、各々図5及び図6に示すような各々X方向及
びY方向の周辺分布が作成される。
102内の入力文字パタンを水平(X方向)及び垂直
(Y方向)に走査して各走査線上の黒画素数を計数し、
黒画素の分布(以降周辺分布と言う)を作成する。例え
ば図3及び図4に示すような通常の文字、つぶれ文字に
おいては、各々図5及び図6に示すような各々X方向及
びY方向の周辺分布が作成される。
【0015】つぶれ検出部104においては、入力文字
パタンよりつぶれ部分を検出し、該つぶれ部分の検出結
果を周辺分布修正部107に出力する。尚、本実施例に
おいては、前記つぶれ部分の検出は以下のように行う。
まず、つぶれ検出部103内の、線幅算出部201にお
いては、パタンレジスタ102内の入力文字パタンより
当該入力文字パタンを構成している線素の線幅を算出
し、該算出結果の線幅値を判定部204に出力するもの
である。本実施例においては、前記線幅の算出は、入力
文字パタンを2×2の窓で走査したときに2×2の窓の
全ての点が黒画素となる点の個数Qと、入力文字パタン
の全ての黒画素数Aとを計数し、(3)に示す近似式に
基づいて入力文字パタンの平均の線幅 W = A / (A−Q) (3) Wを算出することにより行う。図3に示した入力文字パ
タンにおいては、A=165、Q=57となり、線幅W
=165/(165ー57)=1.53となる。また、
図4に示した入力文字パタンにおいては、A=192、
Q=90となり、線幅W=192/(192ー90)=
1.88となる。
パタンよりつぶれ部分を検出し、該つぶれ部分の検出結
果を周辺分布修正部107に出力する。尚、本実施例に
おいては、前記つぶれ部分の検出は以下のように行う。
まず、つぶれ検出部103内の、線幅算出部201にお
いては、パタンレジスタ102内の入力文字パタンより
当該入力文字パタンを構成している線素の線幅を算出
し、該算出結果の線幅値を判定部204に出力するもの
である。本実施例においては、前記線幅の算出は、入力
文字パタンを2×2の窓で走査したときに2×2の窓の
全ての点が黒画素となる点の個数Qと、入力文字パタン
の全ての黒画素数Aとを計数し、(3)に示す近似式に
基づいて入力文字パタンの平均の線幅 W = A / (A−Q) (3) Wを算出することにより行う。図3に示した入力文字パ
タンにおいては、A=165、Q=57となり、線幅W
=165/(165ー57)=1.53となる。また、
図4に示した入力文字パタンにおいては、A=192、
Q=90となり、線幅W=192/(192ー90)=
1.88となる。
【0016】次に、つぶれ検出部104内の輪郭追跡部
202においては、入力文字パタンの輪郭を追跡し、輪
郭画素の座標値、図9に示すような次輪郭画素の方向を
表わす番号を抽出し、該座標値及び方向番号を輪郭系列
として局所線幅抽出部203に出力する。尚、前記入力
文字パタンの輪郭の追跡は以下のような方法により行
う。 (1) パタンレジスタを左上画素よりY方向(以後列
方向という場合もある)に走査を行いつつ、X方向に順
次走査し黒画素を検出し、検出した黒画素をスタートの
黒画素かつ第1の輪郭画素とする。 (2) 第1の黒画素を中心として、図9に示すような
8方向の隣接画素に、1から8の順に順次着目し黒であ
る隣接画素を検出し、当該画素を第2の輪郭画素とす
る。 (3) 今度は第2の輪郭画素を中心とし前記(2)と
同様に8方向の隣接画素より黒画素を検出する処理を行
い第3の輪郭画素とする。 (4) 以降同様に輪郭画素の検出処理を、検出した輪
郭画素がスタートの輪郭画素と同一の画素となるまで繰
り返し行う。 (5) 検出した画素がスタートの輪郭画素と同一とな
り、前記処理が終了したら、抽出された輪郭の外部の画
素に対して再び走査を行い、スタートの黒画素を検出
し、前記(2)以下の処理を同様に行う。 (6) パタンレジスタ全領域について上記処理を行っ
たら終了する。 上述のような方法によれば、図4に示したような入力文
字パタンの右の黒画素部分に対しては、最終的に図7の
701をスタートの画素とした輪郭702が抽出され
る。
202においては、入力文字パタンの輪郭を追跡し、輪
郭画素の座標値、図9に示すような次輪郭画素の方向を
表わす番号を抽出し、該座標値及び方向番号を輪郭系列
として局所線幅抽出部203に出力する。尚、前記入力
文字パタンの輪郭の追跡は以下のような方法により行
う。 (1) パタンレジスタを左上画素よりY方向(以後列
方向という場合もある)に走査を行いつつ、X方向に順
次走査し黒画素を検出し、検出した黒画素をスタートの
黒画素かつ第1の輪郭画素とする。 (2) 第1の黒画素を中心として、図9に示すような
8方向の隣接画素に、1から8の順に順次着目し黒であ
る隣接画素を検出し、当該画素を第2の輪郭画素とす
る。 (3) 今度は第2の輪郭画素を中心とし前記(2)と
同様に8方向の隣接画素より黒画素を検出する処理を行
い第3の輪郭画素とする。 (4) 以降同様に輪郭画素の検出処理を、検出した輪
郭画素がスタートの輪郭画素と同一の画素となるまで繰
り返し行う。 (5) 検出した画素がスタートの輪郭画素と同一とな
り、前記処理が終了したら、抽出された輪郭の外部の画
素に対して再び走査を行い、スタートの黒画素を検出
し、前記(2)以下の処理を同様に行う。 (6) パタンレジスタ全領域について上記処理を行っ
たら終了する。 上述のような方法によれば、図4に示したような入力文
字パタンの右の黒画素部分に対しては、最終的に図7の
701をスタートの画素とした輪郭702が抽出され
る。
【0017】次につぶれ検出部104内の局所線幅検出
部203においては、輪郭追跡部202より入力された
輪郭系列の各画素を基準として、当該輪郭系列の方向よ
り垂直な方向に入力文字パタンを走査し、黒画素の連続
を計数し、該連続個数を当該画素部分における前記輪郭
系列方向の線素の局所的な線幅とし、該局所線幅及び前
記輪郭系列を判定部204に出力する。
部203においては、輪郭追跡部202より入力された
輪郭系列の各画素を基準として、当該輪郭系列の方向よ
り垂直な方向に入力文字パタンを走査し、黒画素の連続
を計数し、該連続個数を当該画素部分における前記輪郭
系列方向の線素の局所的な線幅とし、該局所線幅及び前
記輪郭系列を判定部204に出力する。
【0018】次に、つぶれ検出部104内の判定部20
4においては、線幅算出部201より入力された入力文
字パタンの平均線幅W、及び局所線幅抽出部203より
入力された入力文字パタンの輪郭各画素の輪郭系列、及
び局所線幅より、当該入力文字パタンにつぶれた可能性
のある部分(以降つぶれ候補領域という)が存在するか
否かを判定し、つぶれ候補領域が存在した場合には当該
つぶれ候補領域の座標値をつぶれ検出部205に出力す
る。尚、前記つぶれ候補領域の判定は、輪郭系列の任意
の部分が式(4)を満たすか否かにより判定をし、該輪
郭系列が式(4)を満たした場合には当該輪郭系列及び
当該輪郭系列の各画素を基準とした局所線幅の領域を前
記つぶれ候補領域とし、該輪郭系列が式(4)を満足し
なかった場合には当該輪郭系列の部分にはつぶれ候補領
域はないと判定するものである。 L ≧ TL (4) 但し、Lは、前記輪郭系列の中で輪郭方向が同一であり
かつ当該輪郭画素を基準とした局所線幅Wiが式(5)
を満たしている輪郭画素の連続個数であり、TLは、予
め定めた固定値、或いは算出した閾値であり本実施例に
おいては式(7)にて予め算出する。 Wi ≧ TW (5) TW = kW × W (6) TL = kL × W (7) 但し、式(5)のTWは平均線幅Wを用いて予め算出し
た閾値であり本実施例では式(6)にて算出する。ま
た、式(6)のkWは予め定めた固定値であり本実施例
では2である。式(7)におけるkLも予め定めた固定
値であり本実施例では2である。
4においては、線幅算出部201より入力された入力文
字パタンの平均線幅W、及び局所線幅抽出部203より
入力された入力文字パタンの輪郭各画素の輪郭系列、及
び局所線幅より、当該入力文字パタンにつぶれた可能性
のある部分(以降つぶれ候補領域という)が存在するか
否かを判定し、つぶれ候補領域が存在した場合には当該
つぶれ候補領域の座標値をつぶれ検出部205に出力す
る。尚、前記つぶれ候補領域の判定は、輪郭系列の任意
の部分が式(4)を満たすか否かにより判定をし、該輪
郭系列が式(4)を満たした場合には当該輪郭系列及び
当該輪郭系列の各画素を基準とした局所線幅の領域を前
記つぶれ候補領域とし、該輪郭系列が式(4)を満足し
なかった場合には当該輪郭系列の部分にはつぶれ候補領
域はないと判定するものである。 L ≧ TL (4) 但し、Lは、前記輪郭系列の中で輪郭方向が同一であり
かつ当該輪郭画素を基準とした局所線幅Wiが式(5)
を満たしている輪郭画素の連続個数であり、TLは、予
め定めた固定値、或いは算出した閾値であり本実施例に
おいては式(7)にて予め算出する。 Wi ≧ TW (5) TW = kW × W (6) TL = kL × W (7) 但し、式(5)のTWは平均線幅Wを用いて予め算出し
た閾値であり本実施例では式(6)にて算出する。ま
た、式(6)のkWは予め定めた固定値であり本実施例
では2である。式(7)におけるkLも予め定めた固定
値であり本実施例では2である。
【0019】図4に示す入力文字パタンにおいては、前
述のように線幅算出部201において平均線幅W=1.
88と算出されているので、前記式(6)、及び式
(7)より閾値TW、TLはともに3.76となる。従っ
て、本判定部204においては、局所線幅が4画素以上
でありかつ同方向への輪郭である輪郭画素が4画素以上
連続している輪郭部分を検出し、当該部分をつぶれ候補
領域としてつぶれ検出部203に出力するものである。
図7に示すように図4の入力文字パタンにおいては、7
03から704に至る輪郭系列及び当該輪郭系列を基準
とした局所線幅の部分、及び705から706に至る輪
郭系列及び当該輪郭系列を基準とした局所線幅の部分が
つぶれ候補領域としてつぶれ検出部205に出力され
る。
述のように線幅算出部201において平均線幅W=1.
88と算出されているので、前記式(6)、及び式
(7)より閾値TW、TLはともに3.76となる。従っ
て、本判定部204においては、局所線幅が4画素以上
でありかつ同方向への輪郭である輪郭画素が4画素以上
連続している輪郭部分を検出し、当該部分をつぶれ候補
領域としてつぶれ検出部203に出力するものである。
図7に示すように図4の入力文字パタンにおいては、7
03から704に至る輪郭系列及び当該輪郭系列を基準
とした局所線幅の部分、及び705から706に至る輪
郭系列及び当該輪郭系列を基準とした局所線幅の部分が
つぶれ候補領域としてつぶれ検出部205に出力され
る。
【0020】つぶれ検出部205においては、判定部2
04より入力されたつぶれ候補領域より、つぶれ部分を
検出し、当該つぶれ部分の座標を周辺分布修正部107
に出力する。尚、前記つぶれ部分の検出は、2以上のつ
ぶれ候補領域に共通に含まれる画素を検出し、当該画素
を前記つぶれ部分とすることにより行う。図7に示した
前記判定部204から入力された2箇所のつぶれ候補領
域においては、707、704、708、及び709の
画素に囲まれる矩形領域の画素(図7中「△」で示した
画素)が前記2カ所のつぶれ候補領域に共通に含まれる
ため、前記領域がつぶれ領域として周辺分布修正部10
7に出力される。
04より入力されたつぶれ候補領域より、つぶれ部分を
検出し、当該つぶれ部分の座標を周辺分布修正部107
に出力する。尚、前記つぶれ部分の検出は、2以上のつ
ぶれ候補領域に共通に含まれる画素を検出し、当該画素
を前記つぶれ部分とすることにより行う。図7に示した
前記判定部204から入力された2箇所のつぶれ候補領
域においては、707、704、708、及び709の
画素に囲まれる矩形領域の画素(図7中「△」で示した
画素)が前記2カ所のつぶれ候補領域に共通に含まれる
ため、前記領域がつぶれ領域として周辺分布修正部10
7に出力される。
【0021】文字枠抽出部105においては、入力文字
パタンの外接枠を抽出し、該外接枠の座標を重心検出部
108及び特徴マトリクス抽出部111に出力する。
パタンの外接枠を抽出し、該外接枠の座標を重心検出部
108及び特徴マトリクス抽出部111に出力する。
【0022】文字線幅計算部106においては、入力文
字パタンより、当該文字の平均線幅を算出し、該算出結
果をサブパタン抽出部110に出力するものである。尚
本実施例においては、前記平均線幅の算出方法は、前述
したつぶれ検出部104内の線幅算出部201と同一の
方法により行うものとする。
字パタンより、当該文字の平均線幅を算出し、該算出結
果をサブパタン抽出部110に出力するものである。尚
本実施例においては、前記平均線幅の算出方法は、前述
したつぶれ検出部104内の線幅算出部201と同一の
方法により行うものとする。
【0023】周辺分布修正部107においては、周辺分
布作成部103により作成、入力された周辺分布を、つ
ぶれ検出部104より入力されたつぶれ情報に基づいて
修正し、該修正結果の新たな周辺分布を重心検出部10
8に出力する。尚、前記つぶれ情報に基づいた修正は、
前記入力された周辺分布より、つぶれた部分の画素の分
布を削除することにより行う。即ち図8に示すよに、図
8の801に示すようなつぶれ検出部104においてつ
ぶれ部分と判定された部分については、802、および
803に示すように水平及び垂直方向の周辺分布より当
該画素の分布を削除する。
布作成部103により作成、入力された周辺分布を、つ
ぶれ検出部104より入力されたつぶれ情報に基づいて
修正し、該修正結果の新たな周辺分布を重心検出部10
8に出力する。尚、前記つぶれ情報に基づいた修正は、
前記入力された周辺分布より、つぶれた部分の画素の分
布を削除することにより行う。即ち図8に示すよに、図
8の801に示すようなつぶれ検出部104においてつ
ぶれ部分と判定された部分については、802、および
803に示すように水平及び垂直方向の周辺分布より当
該画素の分布を削除する。
【0024】重心検出部108においては、周辺分布修
正部107より入力された修正された入力文字パタンの
周辺分布より、文字枠検出部105より入力された文字
枠の範囲内において、X、Y方向夫々について当該黒画
素の分布の重心を検出し、該重心を境界点とした2の区
間について各々重心を検出し、更に前記処理を各区間に
ついて順次繰り返して複数の重心を検出し、該重心の座
標を文字枠分割点決定部109に出力する。本実施例に
おいては、X,Y方向夫々について前記処理を2回繰り
返し、計3カ所の重心点を検出し、文字枠分割点決定部
109に出力するものとする。したがって、例えば図5
に示すような入力文字パタンについては、水平方向にお
いては、501、502、503の3の重心点が検出さ
れ、垂直方向においては、507、508、509の3
の重心点が検出され各々出力される。また図8に示すよ
うな入力文字パタンについては「△」の部分が削除され
た形の周辺分布に従って804、805、806、及び
810、811、812に示すような重心点が検出され
る。
正部107より入力された修正された入力文字パタンの
周辺分布より、文字枠検出部105より入力された文字
枠の範囲内において、X、Y方向夫々について当該黒画
素の分布の重心を検出し、該重心を境界点とした2の区
間について各々重心を検出し、更に前記処理を各区間に
ついて順次繰り返して複数の重心を検出し、該重心の座
標を文字枠分割点決定部109に出力する。本実施例に
おいては、X,Y方向夫々について前記処理を2回繰り
返し、計3カ所の重心点を検出し、文字枠分割点決定部
109に出力するものとする。したがって、例えば図5
に示すような入力文字パタンについては、水平方向にお
いては、501、502、503の3の重心点が検出さ
れ、垂直方向においては、507、508、509の3
の重心点が検出され各々出力される。また図8に示すよ
うな入力文字パタンについては「△」の部分が削除され
た形の周辺分布に従って804、805、806、及び
810、811、812に示すような重心点が検出され
る。
【0025】文字枠分割点決定部109においては、重
心検出部108より入力された重心座標より文字枠分割
点を決定し、該分割座標を特徴マトリクス抽出部111
に出力するものである、尚、本実施例においては、前記
重心検出部108より入力された重心座標をそのまま分
割点座標として出力するものとする。従って、図5に示
すような入力文字パタンについては、501、502、
503及び507、508、509の重心座標に従っ
て、504、505、506及び510、511、51
2に示すような分割点が検出され、また図8に示すよう
な入力文字パタンについては、804、805、80
6、及び810、811、812二示すような重心点に
従って、807、808、809、及び813、81
4、815に示すような分割点が検出される。
心検出部108より入力された重心座標より文字枠分割
点を決定し、該分割座標を特徴マトリクス抽出部111
に出力するものである、尚、本実施例においては、前記
重心検出部108より入力された重心座標をそのまま分
割点座標として出力するものとする。従って、図5に示
すような入力文字パタンについては、501、502、
503及び507、508、509の重心座標に従っ
て、504、505、506及び510、511、51
2に示すような分割点が検出され、また図8に示すよう
な入力文字パタンについては、804、805、80
6、及び810、811、812二示すような重心点に
従って、807、808、809、及び813、81
4、815に示すような分割点が検出される。
【0026】サブパタン抽出部110においては、パタ
ンレジスタ102に記憶されている入力文字パタン及び
線幅算出部106より入力された入力文字パタンの文字
線幅より水平、垂直、左斜め、右斜めの4方向の線素を
抽出した4個のサブパタンを抽出し、特徴マトリクス抽
出部110に出力する。前記、サブパタン抽出の処理は
本実施例においては下記のように行う。例えば水平サブ
パタンの場合は、入力文字パタンを水平方向に走査し黒
画素の連続を検出し、黒画素の連続数Lが(8)式を満
足するときに当該黒画素の連続を水平方向のサブパタン
として抽出するものである。 L > k × Wr (8) 但し、Wrは線幅算出部140より入力された文字線
幅、kは予め定めた固定値であり、水平、垂直サブパタ
ンの場合にはk=2,左斜め、右斜めサブパタンの場合
にはk=21/2である。
ンレジスタ102に記憶されている入力文字パタン及び
線幅算出部106より入力された入力文字パタンの文字
線幅より水平、垂直、左斜め、右斜めの4方向の線素を
抽出した4個のサブパタンを抽出し、特徴マトリクス抽
出部110に出力する。前記、サブパタン抽出の処理は
本実施例においては下記のように行う。例えば水平サブ
パタンの場合は、入力文字パタンを水平方向に走査し黒
画素の連続を検出し、黒画素の連続数Lが(8)式を満
足するときに当該黒画素の連続を水平方向のサブパタン
として抽出するものである。 L > k × Wr (8) 但し、Wrは線幅算出部140より入力された文字線
幅、kは予め定めた固定値であり、水平、垂直サブパタ
ンの場合にはk=2,左斜め、右斜めサブパタンの場合
にはk=21/2である。
【0027】特徴マトリクス抽出部111においては、
サブパタン抽出部110より入力された水平、垂直、左
斜め、右斜めのサブパタン、文字枠分割点決定部109
より入力された分割座標、及び文字枠抽出部105より
入力された文字外接枠座標より、サブパタンの各分割さ
れた小領域の黒画素数を計数し、前記黒画素計数結果及
び前記平均線幅よ、(9)式に基づいて水平、垂直、左
斜め及び右斜めの特徴マトリクスを抽出する。 KH(m,n)=BH(m,n)/W KV(m,n)=BV(m,n)/W KL(m,n)=BL(m,n)/W (9) KR(m,n)=BR(m,n)/W 但し、KH、KV,KL、KRは各々水平、垂直、左斜め、
右斜めの特徴マトリクス、BH、BV,BL、BRは各々水
平、垂直、左斜め、右斜めの黒画素マトリクス、(m,
n)は各マトリクスの要素番号Wは平均線幅である
サブパタン抽出部110より入力された水平、垂直、左
斜め、右斜めのサブパタン、文字枠分割点決定部109
より入力された分割座標、及び文字枠抽出部105より
入力された文字外接枠座標より、サブパタンの各分割さ
れた小領域の黒画素数を計数し、前記黒画素計数結果及
び前記平均線幅よ、(9)式に基づいて水平、垂直、左
斜め及び右斜めの特徴マトリクスを抽出する。 KH(m,n)=BH(m,n)/W KV(m,n)=BV(m,n)/W KL(m,n)=BL(m,n)/W (9) KR(m,n)=BR(m,n)/W 但し、KH、KV,KL、KRは各々水平、垂直、左斜め、
右斜めの特徴マトリクス、BH、BV,BL、BRは各々水
平、垂直、左斜め、右斜めの黒画素マトリクス、(m,
n)は各マトリクスの要素番号Wは平均線幅である
【0028】そして識別部112においては、前記特徴
マトリクスと、予め識別部112内に具える辞書内の標
準文字の特徴マトリクスとの各要素を(10)式に基づ
いて照合し、(10)式の距離値Dが最も小さくなる標
準文字の文字コードを、当該入力文字パタンの認識結果
として出力端子113より出力するものである。 D = (Σ(gi − ki)2)1/2 (10) 但し、giは標準文字の特徴マトリクスの要素、kiは入
力文字パタンの特徴マトリクスの要素である。
マトリクスと、予め識別部112内に具える辞書内の標
準文字の特徴マトリクスとの各要素を(10)式に基づ
いて照合し、(10)式の距離値Dが最も小さくなる標
準文字の文字コードを、当該入力文字パタンの認識結果
として出力端子113より出力するものである。 D = (Σ(gi − ki)2)1/2 (10) 但し、giは標準文字の特徴マトリクスの要素、kiは入
力文字パタンの特徴マトリクスの要素である。
【0029】出力端子113は、認識結果を外部に出力
するためのデータ出力端子であり、そのほかのシステム
や、認識結果を記録する媒体、通信網、そのほかの情報
処理システム等を接続するものである。
するためのデータ出力端子であり、そのほかのシステム
や、認識結果を記録する媒体、通信網、そのほかの情報
処理システム等を接続するものである。
【0030】尚、本発明は上述した実施例にのみ限定さ
れるものではない。例えば、式(6)、及び式(7)に
おいて用いた固定値kW、kLは本実施例の値のみに限ら
れるものではなく、本発明の範囲内で任意好適な値を用
いて良い。また、画像入力方法、パタンレジスタの構
成、平均線幅の算出方法、輪郭追跡の方法、特徴マトリ
クスの抽出方法、等も本発明の範囲内で適宜変更しても
よく、さらに各構成部分の動作、処理の仕方、入出力信
号の流れ、配設個数、位置、形状及び個数そのほかの条
件を任意好適に変更できる。
れるものではない。例えば、式(6)、及び式(7)に
おいて用いた固定値kW、kLは本実施例の値のみに限ら
れるものではなく、本発明の範囲内で任意好適な値を用
いて良い。また、画像入力方法、パタンレジスタの構
成、平均線幅の算出方法、輪郭追跡の方法、特徴マトリ
クスの抽出方法、等も本発明の範囲内で適宜変更しても
よく、さらに各構成部分の動作、処理の仕方、入出力信
号の流れ、配設個数、位置、形状及び個数そのほかの条
件を任意好適に変更できる。
【0031】
【発明の効果】以上詳細に説明したように、この発明に
よれば入力文字パタンのつぶれを検出するつぶれ検出部
と、つぶれ検出部により検出されたつぶれ情報に基づい
て、入力文字パタンから得られた周辺分布を修正する周
辺分布修正部とを具備し、入力文字パタンのつぶれの影
響を削除した新たな周辺分布を作成し、新たな周辺分布
に基づいて文字枠分割点を検出できるようにしたので、
入力文字パタンにつぶれ部分があった場合でも、黒画素
の分布における文字パタンのつぶれの影響を除去でき、
従ってつぶれが無い場合と同様の重心の位置が検出でき
る。例えば、図6に示したようなつぶれ部分を含む文字
パタンにおいても図8に示すように、周辺分布の修正が
なされ、結局図5に示すようなつぶれの無い入力文字パ
タンと同一の分割点が抽出できるのである。故に部分領
域の分割の仕方が変化を受けず、適正な特徴マトリクス
が抽出でき、従って入力文字パタンを正確に認識でき
る。また、そのためつぶれ文字の誤読が減り、認識結果
の確認、修正作業が減少し、結果的に入力作業が高速に
なり、また習熟した修正作業が不必要となり、効率の良
い、誰にでもオペレーション作業が可能であるような、
高性能な文字認識装置の実現が可能となる。
よれば入力文字パタンのつぶれを検出するつぶれ検出部
と、つぶれ検出部により検出されたつぶれ情報に基づい
て、入力文字パタンから得られた周辺分布を修正する周
辺分布修正部とを具備し、入力文字パタンのつぶれの影
響を削除した新たな周辺分布を作成し、新たな周辺分布
に基づいて文字枠分割点を検出できるようにしたので、
入力文字パタンにつぶれ部分があった場合でも、黒画素
の分布における文字パタンのつぶれの影響を除去でき、
従ってつぶれが無い場合と同様の重心の位置が検出でき
る。例えば、図6に示したようなつぶれ部分を含む文字
パタンにおいても図8に示すように、周辺分布の修正が
なされ、結局図5に示すようなつぶれの無い入力文字パ
タンと同一の分割点が抽出できるのである。故に部分領
域の分割の仕方が変化を受けず、適正な特徴マトリクス
が抽出でき、従って入力文字パタンを正確に認識でき
る。また、そのためつぶれ文字の誤読が減り、認識結果
の確認、修正作業が減少し、結果的に入力作業が高速に
なり、また習熟した修正作業が不必要となり、効率の良
い、誰にでもオペレーション作業が可能であるような、
高性能な文字認識装置の実現が可能となる。
【図1】本発明の文字認識装置の一実施例を示すブロッ
ク図である。
ク図である。
【図2】つぶれ検出部の一実施例を示すブロック図であ
る。
る。
【図3】通常の入力文字パタンの例を示す図である。
【図4】つぶれた入力文字パタンの例を示す図である。
【図5】通常の文字の周辺分布を説明する図である。
【図6】つぶれた文字の周辺分布を説明する図である。
【図7】つぶれ検出部の動作説明図である。
【図8】周辺分布修正部の説明図である。
【図9】輪郭追跡部の説明図である。
100 文字認識装置 101 画像入力部 102 パタンレジスタ 103 周辺分布作成部 104 つぶれ検出部 105 文字枠抽出部 106 文字線幅計算部 107 周辺分布修正部 108 重心検出部 109 文字枠分割点決定部 110 サブパタン抽出部 111 特徴マトリクス抽出部 112 識別部 113 出力端子
Claims (3)
- 【請求項1】 文字、記号、図形等の入力文字パタンを
X軸とY軸に各々投影して得られた各々の黒画素の分布
から周辺分布を作成し、前記黒画素の分布に基づきX軸
及びY軸を小区間に各々分割し、前記分割結果に基づき
前記入力文字パタンの文字枠内を小領域に分割し、前記
分割された各小領域において入力文字パタンの特徴を表
わす特徴マトリクスを抽出し、前記入力文字パタンの特
徴マトリクスと予め用意された標準文字の特徴マトリク
スとを照合して識別を行う文字認識装置において、 前記入力文字パタンのつぶれを検出するつぶれ検出部
と、 前記検出した文字パタンのつぶれ情報に基づいて前記周
辺分布を修正する周辺分布修正部とを具備し、 前記修正された周辺分布を用いて前記文字枠内の分割を
行うことを特徴とする文字認識装置。 - 【請求項2】 請求項1記載の文字認識装置において、
前記周辺分布修正部における周辺分布の修正は、文字パ
タンのつぶれ部分の画素を前記黒画素の分布より削除す
ることにより行うことを特徴とする文字認識装置。 - 【請求項3】 請求項1〜2項記載の文字認識装置にお
いて、前記つぶれ検出部は、 入力文字パタンの輪郭を抽出する輪郭抽出部と、 前記抽出された輪郭の各画素を基準として、前記輪郭の
方向とは垂直な所定の方向に入力文字パタンを走査し黒
画素の連続数を計数し、当該画素部分における線幅を得
る局所線幅抽出部と、 入力文字パタンから平均の文字線幅を算出する線幅算出
部と、 前記各輪郭画素における局所線幅と前記平均の文字線幅
を比較し当該入力文字パタンにつぶれ候補領域があるか
否かを判定する判定部と、 前記つぶれ候補領域よりつぶれ部分を検出するつぶれ検
出部とよりなることを特徴とする文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5009185A JPH06223226A (ja) | 1993-01-22 | 1993-01-22 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5009185A JPH06223226A (ja) | 1993-01-22 | 1993-01-22 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH06223226A true JPH06223226A (ja) | 1994-08-12 |
Family
ID=11713485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5009185A Pending JPH06223226A (ja) | 1993-01-22 | 1993-01-22 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH06223226A (ja) |
-
1993
- 1993-01-22 JP JP5009185A patent/JPH06223226A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4556985A (en) | Pattern recognition apparatus | |
EP0138445A2 (en) | Method and apparatus for segmenting character images | |
JPH04270485A (ja) | 印刷文字認識装置 | |
JPH06223226A (ja) | 文字認識装置 | |
JP2868134B2 (ja) | 画像処理方法及び装置 | |
JP3272776B2 (ja) | 文字パターン認識方法 | |
JP2957729B2 (ja) | 行方向判定装置 | |
JP3936039B2 (ja) | 網がけ領域抽出装置 | |
JPH06223225A (ja) | 文字認識方法 | |
JPH06236455A (ja) | 文字認識装置 | |
JPH06236456A (ja) | 文字認識装置 | |
JP2708604B2 (ja) | 文字認識方法 | |
JPS603078A (ja) | 文字認識方法 | |
JP3197464B2 (ja) | 文字認識方法および文字認識装置 | |
JPH0991379A (ja) | 文字認識方法および文字認識装置 | |
JP2888885B2 (ja) | 文字切出し装置 | |
JP3127413B2 (ja) | 文字認識装置 | |
JP2827288B2 (ja) | 文字認識装置 | |
JP2980636B2 (ja) | 文字認識装置 | |
JPH01152586A (ja) | 文字図形認識方法 | |
JP3009237B2 (ja) | 特徴抽出方法 | |
JP2957774B2 (ja) | 行方向判定装置 | |
JP2626084B2 (ja) | 文字認識装置 | |
JP3210224B2 (ja) | 文字認識装置 | |
JPH11238135A (ja) | イメージ認識方法およびイメージ認識装置 |