JPH0392989A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0392989A
JPH0392989A JP1229313A JP22931389A JPH0392989A JP H0392989 A JPH0392989 A JP H0392989A JP 1229313 A JP1229313 A JP 1229313A JP 22931389 A JP22931389 A JP 22931389A JP H0392989 A JPH0392989 A JP H0392989A
Authority
JP
Japan
Prior art keywords
character
word
value
feature
font
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1229313A
Other languages
English (en)
Other versions
JP2626084B2 (ja
Inventor
Toru Ishikawa
石河 融
Hiroshi Yoshida
浩史 吉田
Koichi Higuchi
浩一 樋口
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP1229313A priority Critical patent/JP2626084B2/ja
Publication of JPH0392989A publication Critical patent/JPH0392989A/ja
Application granted granted Critical
Publication of JP2626084B2 publication Critical patent/JP2626084B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は、複数の字体の文字を含む帳票を高速にかつ
精度よく読み取ることのできる文字認識装置に関するも
のである。
(従来の技術) 従来文字認識装置には、例えば特公昭60−38756
号公報に開示ざれるものがあり、以下の構成要素(a)
〜(f)を具備している。
(a)文字図形を光電変換して量子化することにより黒
ビット及び自ビットで表されるデイジタル信号の原パタ
ーンを作成する。
(b)次に、該原パターンの線幅を算出する。
(C)次に、前記原パターンを複数の方向に走査を行な
って各走査列毎の黒ビットの連続個数を検出し、当該黒
ビット連続個数と前記線幅とに基づいて前記複数の走査
方向毎に対応した複数のサブパターンを抽出する。
(d)次に、前記原パターンの文字枠内領域をサブパタ
ーンについて(NXM)個の領域(N,Mは定数)に分
割し、該分割された領域内についてセルを単位として黒
点を計数した結果と前記線幅とを基に特徴量を計算する
(e)次に、該特m量を文字の大きざで正規化して特徴
マトリクスを作成する。
(f>そして、該特徴マトリクスを予め用意した文字図
形パターンの標準文字マスクと照合して文字図形を認識
する。
この様な文字認識装置において、認識する文字には、複
数の字体を含む帳票、例えば第8図に示すような特定の
単語だけイタリック体で印字されているような英文から
なるものがある。このイタリック体は、氏名や地名など
を強調するために使われるものである。この様な場合、
予め認識対象となるすべての字体の標準文字マスクを辞
書マスクとして用意しておき、前記すべての辞書マスク
と入力文字図形とを照合し、認識を行うという方法が広
く用いられている。
(発明が解決しようとする課題) しかし、上記の方法では、辞書マスクの種類が字体の数
に比例して大きくなり、それが照合回数の増大となり、
そのため認識速度が大幅に低下し、さらには認識精度の
低下を招くという問題点かあった。
この発明が解決しようとする課題は、複数の字体の文字
を含む帳票を高速度で読み取ることができ、さらには高
精度の読取りを可能とする文字認識装置を提供すること
にある。
(課題を解決するための手段) この発明に係る文字認識装置は、2値の画像データより
入力文字パターンの1文字毎の特徴量を算出し、字体の
判定を行ない、判定した字体に基づき辞書マスクを選択
し、前記選択した辞書マスクにより入力文字パターンの
照合を行なう文字認識装置において、画像データの中の
単語を検出すとともに単語を構戊する文字数を検出する
単語検出部と、各文字について文字線を構成する各画素
の座標X,Y及び、定数α,βに与えられる少なくとも
2組の数値により、αX+βY及びαX一βYの最大値
及び最小値を検出しその座標を特徴点とし、前記各文字
の特徴点座標より各文字の幾何学的特徴量を算出する特
徴抽出部と、単語を構成する文字毎の前記幾何学的特徴
量により単語内文字の特徴量を算出し、単語を構成して
いる字体を判定する字体判定部と、各文字の字体を判定
した結果に基づき照合するための辞書マスクを単語単位
に選択する辞書部とを有することを特徴とするものであ
る。
単語検出部における単語検出は、画像データより文字間
隔を検出し、当該検出された文字間隔の大小に基づき単
語を抽出することによって行うこともできる。
特徴抽出部にあける幾何学的特m量の算出は、(α=β
=1)及び(α=1,β=−1〉の2組のα値及びβ値
を用い、所定の画素値を有する画素の座標に対するX+
Y及びX−Yの最大値及び最小値を検出し、前記検出さ
れた最大値及び最小値を与える特徴点座標に基づき行な
ってもよい。
特徴抽出部における幾何学的特徴量の算出は、X+Yの
最大値のX座標をBRX,R小値のX座標をTLX,X
−Yの最大値のX座標をTRX、最小値のX座標をBL
Xとし、k, p, qを任意の定数として、 t=k {p (TLX−BLX) +q (TRX−BRX)) により幾何学的特徴量を算出することを含む。
字体判定部における単語内文字の特徴量の算出は、単語
を構成する文字毎の幾何学的Vf徴量をfi、単語の文
字数を「とし、 Ef i=( F一 「 の演算を行ない特徴量Fを得ることであってもよい。
また、字体判定部で判定する字体が、明朝体等の標準体
型文字とイタリック体等の斜体型文字とすることができ
る。
(作用) 単語検出部では、2値の画像データの中の単語を検出す
るとともに、単語の中に含まれる文字数も検出してあく
。このとき、画像データの文字間隔を検出し、この検出
された文字間隔の大小に基づき、単語の区切りを判断し
、単語を検出することができ、1つの単語内での文字間
隔の数により文字数を抽出する。一方、特徴抽出部は、
1文字ごとの画像データを走査し、その座標X,Yに定
数α、βをかけ、αX+βY及びαX−βYを計算する
。各画素についてこの計算を行ない、1文字内の最小値
及び最大値を検出し、その最大値及び最小値を示す座標
を特徴点とする。この特徴点はαX+βYの最大値、最
小値とαX一βYの最大値、最小値との4個が得られ、
これらから幾何学的特徴量を算出する。定数α、βの第
1組が、α一β=1で、第2組がα=1,β=−1にす
ると、αX+βYはX+Yと、X−Yとの2組が得られ
る。X+Yの最大値は、1文字内において文字線の右下
の座標点で現れ、最小値は左上の座標点で現れる。また
、X−Yの最大値は、1文宇内において右上の文字線の
座標点で現れ、最小値は左下の座標点で現れる。これら
のX座標を示すと、それぞれBRX,TLX,TRX及
びBLXであり、次に示す式で幾何学的特徴量を算出す
るものである。
f=k {p (TLX−BLX) +q (TRX−BRX)) この幾何学的特徴量fは、1文字の傾き程度の特徴を表
している。
字体判定部では特徴抽出部からの幾何学的特徴量を、単
語検出部からの単語構成文字数分だけ受け入れ、単語内
文字の特徴量を算出し、その単語の字体を判定する。こ
のとき単語内文字の特lmの算出は次の式で行なうもの
である。
Σf1 「 ここで、「は単語を構成する文字数、fiはi番目文字
の幾何学的特lmである。
この特徴量「は単語内の幾何学的特徴量fの平均値によ
って与えられ、単語全体の文字の字体の特徴を表すもの
である。字体判定部において、この特徴mFに対応した
字体を判定する。例えば、判定対象の字体としては、明
朝体等の標準体型文字とイタリック体等の斜体型文字が
ある。
辞書部では字体判定部の判定結果により、照合するため
の辞書マスクを選択する。この辞書選択は、単語単位で
行ない、そのため高速で処理することができ、高精度で
文字認識処理をすることができる。
(実施例) 以下、本発明に係る文字認識装置の実施例を、図面を参
照して説明する。
[各部の機能説明] 第1図は文字認識装置の1実施例の機能ブロック図であ
る。第1図において、101は光信号Sを電気信号に変
換する光電変換部、102は前記光電変換部101から
の行画像データを格納するラインバツフ7、103は行
画像データの入力文字パターンおよび文字間隔を計数す
る文字切り出し部、104は前記文字切り出し部103
からの入力文字パターンを格納するパターンメモリ、1
05は前記文字切り出し部103からの文字入力パター
ンより各文字の幾何学的特徴量を算出する特徴抽出部、
106は行画像データの中の単語を検出する単語検出部
、107は単語を構成している字体を判定する字体判定
部、108は判定した字体の辞書マスクを単語単位に選
択する辞書部、109は選択した辞書マスクにより入力
パターンの照合認識をする認識部、110は出力端子で
あり、例えばコンピュータ等の外部機器のデータ入力端
子等に接続ざれるものであり、文字認識の結果得られた
文字名(例えばJISの文字コード)を出力するもので
ある。
まず認識対象文字の入力文字パターンを切り出すことに
つき説明する。
光電変換部101は、文字、図形等(以下、文字と称す
る。)が記載された帳票等の媒体の文字行領域の光信号
(第1図のS)を入力する。ここで、文字行領域とは、
帳票上における文字が記載ざれる1行分の領域をいう。
入力した光信号は光電変換ざれ、文字線部を画素値「1
」の黒ビット及び背景部を画素値rOJの白ビットとし
て各画素ごとに2値のディジタル信号で表現した行画像
データを得て、ラインバッフ7102に格納される。
ラインバッファ102は入力文字パターンの行画像デー
タにおける各画素の2値信号をこの文字行領域の2次元
座標通りに再現できる形式で記憶し、例えば128x4
,096画素の大きざを持っているものである。
文字切り出し部103はラインバッファ102から行画
像データを読み込み、縦方向に走査を行ない、黒ビット
の分布を作戒する。黒ビットの分布のOから1以上に変
化するビットより、1以上からOに変化する直前のビッ
トまでを1つの文字予定領域とし、入力文字パターンを
得る。得られた入力文字パターンは、パターンメモリ1
04に格納されるとともに、特徴抽出部105に出力さ
れる。
また、黒ビットの分布の1以上からOに変化するピット
より、Oから1以上に変化する直前のビットまでの画像
数を文字間隔として計数し、その画素数を単語検出部1
06に出力する。
次に単語検出部106にあける行画像データから単語を
検出することにつき説明する。
単語検出部106は、文字切り出し部103から出力さ
れる文字間隔により単語を検出し、1単語中の文字数「
を字体判定部107及び認識部109へ出力する。
第2図は単語検出部106の構成を示す機能ブロック図
である。21は比較回路、22はカウンタ、23は閾値
レジスタである。文字切り出し部103から出力される
文字間隔は、出力ざれる毎に予め入力されている閾値レ
ジスタ23内の閾値と、比較回路21において比較が行
なわれる。1文字の比較が終了し、文字間隔よりも閾値
が太き合は、カウンタ22の数を1増す。文字間隔が閾
値よりも大きい場合は又は等しい場合は、比較を行なっ
た文字間隔の直前の文字までを1単語とし、その時点で
のカウンタ22の数「を単語を構成する文字数として字
体判定部107及び識別部109へ出力し、カウンタ2
2を1に再設定する。なお、カウンタ22の初期設定は
1である。
次に入力文字パターンがパターンメモリ104に格納ざ
れることにつき説明する。
パターンメモリ104は、入力文字パターンの文字予定
領域における各画素の信号をこの領域の2次元座標通り
に再現できる形式で記憶し、入力文字パターン1文字あ
たり128X.128画素の大きさで構成される単語を
記憶できるものである。
パターンメモリ104に格納されている入力文字パター
ンは、識別部109に読み込まれる。
次に、入力文字パターンの特徴より算出ざれる特徴値を
出力することについて説明する。
特徴抽出部105は文字切り出し部103から出力され
る入力文字パターンの特徴値を痺出し、字体判定部10
7に幾何学的特徴量として特徴値を出力する。
第3図は特徴抽出部105の構成を示す機能ブロック図
である。
同図において、39は文字切り出し部103から出力ざ
れる認識対象となる入力文字パターンの画像データであ
る。この実施例の特徴抽出部105は、前記画像データ
39の画素にX座標を付与するためのX座標発生手段3
0と、前記画像データ39の画素にY座標を付与するた
めのY座標発生手段32と、前記X,Y座標とα及びβ
に与えられる少なくとも2組の特定の数値とを用いて、
入力文字パターンの画素に関する最大及び最小計算値を
与える入力文字パターンの画素のX,Y座標を夫々特徴
点座標として出力するための座標検出手段34.36と
、入力文字パターンの特徴抽出を行うための幾何学的特
徴量を特徴点座標に基づき算出する特徴量算出手段38
とを備えている。
また、座標検出手段34は、計算値αX+βYを算出す
る計算手段341と、最大計算値を検出するための最大
値検出手段342と、最大計算値を与える画素のX,Y
座標を保存するための最大値座標保存手段343と、最
小計譚値を検出するための最小値検出手段344と、最
小計算値を与える画素のX,Y座標を保存するための最
小値座標保存手段345とを備えている。座標検出手段
36もまた前記座標検出手段34と同様、計算手段36
1と最大値検出手段362と最大値座標保存手段363
と最小値検出手段364と最小値座標保存手段365と
を備えている。
この実施例では、(α=β−1)及び(α=1、β一−
])の2組のα及びβ値を用い、X+Y及びX−Yに関
する最大及び最小計算値を与える画素の座標より、入力
文字パターンの特徴値を算出し、字体判定部107に計
痺値を出力するので、2個の座標検出手段34.36を
備える構成となっている。座標検出手段34にあっては
計算値X+Yに関する、及び座標検出手段36にあって
は計算値X−Yに関する、最大及び最小計算値を与える
画素の座標を検出する。
以下に特徴抽出部105について最大及び最小座標検出
を、第3図と、第4図及び第5図を用いて説明する。第
4図は本実施例における最大値座標検出の説明に供する
動作流れ図、第5図は本実施例における最小値座標検出
の説明に供する動作流れ図である。
■:座標検出手段34に着目した説明(X+Yの最大値
及び最小値検出動作の説明)*ステップ(1)〜(3) 文字切り出し部103より出力される(ステップ(1)
)入力文字パターンは、画素毎に最大値検出手段342
及び最小値検出手段344に入力ざれる。
これとともに、X座標発生手段30及びY座標発生手段
32は、前記画像データ39の出力と同期させてこの両
像データ39のそれぞれの画素毎に対応付けたX,Y座
標を発生する。その結果これら発生手段30.32によ
って前記画像データ39にX,Y座標の付与が行われる
。出力されたX,Y座標はX+Y計算手段341、最大
値座標保存手段343及び最小値座標保存手段345に
入力される。(ステップ(2)) X+Y計算手段341はX.Y座標を入力するとこれら
X,Y座標から計算値X+Yを算出し、算出した計算値
を最大値検出千段342及び最小値検出手段344に対
し出力する。(ステップ(3〉〉 ステップ(2)〜(3〉によって、最大値検出手段34
2は前記画像データ39及び計算値を、最小値検出手段
344は前記画像データ39及び計輝値を、最大値座標
保存手段343はX,Y座標を、最小値座標保存手段3
45はX,Y座標を、それぞれ1画素毎に入力する。そ
して、座標検出手段34は後述のステップ(4〉、(5
a〉〜(6)、(5b)〜(6)或いは(7)の判断を
1画素毎に繰返し行ない、その判断結果に応じた動作を
行なう。
*ステップ(4) 最大値検出手段342及び最小値検出手段344は、入
力された前記画像データ39の画素が入力文字パターン
の画素であるか否かを判断する。この判断は、入力され
た画素の画素値が入力文字パターンを意味する所定の画
素値(この実施例では画素値「1」〉であるか否かを判
断することによって、行なわれる。
*ステップ(5〉 所定の画素値を有するとき、最大値検出手段342は所
定の比較値と前記計算値との比較を行ないくステップ(
5a))、最小値検出手段344は別の所定の比較値と
前記計算値との比較を行なう(ステップ(5b))。
*ステップ(5a)〜(6〉 ■計算値が比較値よりも大きいとき 最大値検出手段342は先に格納されている比較値に代
えて、比較値よりも大きい計算値を新たな比較値として
格納し(比較値の書換え)、これとともにセットパルス
を最大値座標保存手段343に対し出力する。セットパ
ルスを入力した最大値座標保存手段343は格納ざれて
いるX,Y座標に代えて、比較値よりも大きな計算値を
与える画素のX.Y座標を新たに格納する(×,Y座標
のM換え〉。
■計算値が比較値よりも小さいか或いは比較値と等しい
とき 最大値検出手段342は先に格納されている比較値を濯
換えずにそのまま格納するとともに、最大値座標保存手
段322は格納ざれているX.Y座標を書換えない。
最大値検出手段342は■及び■のいずれの堀合もステ
ップ〈5a〉の次にステップ(7)の判断を行なう。
なお、最大検出手段342に格納される比較値の初期値
としては、例えば計弾値αとして取り得る値よりも小さ
な値を用いれば良い。例えばα一β=1であり、前記画
像データを1行m列の画素に分割し、O≦X≦m−1、
及びO≦11とした堀合には、例えば−1を比較値の初
期値とすることができる。或いは比較値の初期値として
最大値検出手段342に一番最初に入力された計算値α
X+βYを用いるようにしても良い。
また、最大値検出手段342において、比較値及びX.
Y座標の書換えを計算値αχ+βYが比較値よりも大き
いとき及び計算値が比較値と等しいときに行なうように
し、これとともに計算値が比較値よりも小さいとき比較
値及びX, Y座標の書換えを行なわないようにしても
良い。
また、最大値座標保存手段343のX,Y座標としては
任意好適な数値を用いて良い。
*ステップ(5b)〜6 ■計締値が比較値よりも小さいとき 最小値検出手段344は先に格納されている比較値に代
えて比較値よりも小さい割算値を比較値として新たに格
納する(比較値の@換え)とともに、最小値座標保存手
段345に対しセットパルスを出力する。最小値座標保
存手段345はセットパルスを入力すると、格納ざれて
いるX,Y座標を比較値よりも小さな計算値を与える画
素のX,Y座標に書換える(X.Y座標の書換え〉。
■計算値が比較値よりも大きいか或いは比較値と等しい
とき 最小値検出手段344は先に格納されている比較値を書
換えずにそのまま格納するとともに、最小値座標保存手
段322に格納ざれているX.Y座標を実換えない。
最小値検出手段344は■及び■のいずれの場合にもス
テップ〈5b〉の次にステップ(7)の判断を行なう。
なお、最小値検出手段344に格納される比較値の初期
値としては、例えば計算値αX+βYとし取り得る値よ
りも大きな値を用いれば良い。例えばα=β=1であり
、画像データを1行m列の画素に分割し、O≦X≦m−
1、及びO≦Y≦1−1となる場合には、例えばm+n
−1!−比較値の初期値とすることができる。或いは比
較値の初期値として最小値検出手段344に一番最初に
入力された計緯値αX+βYを用いるようにしても良い
また、最小値検出手段344は計算値が比較値よりも小
さいとき及び計算値が比較値と等しいとき比較値及びX
,Y座標の書換えを行ない、これとともに計算値が比較
値よりも大きいとき比較値及びX,Y座標の書換えを行
なわないようにしても良い。
また最小値座標保存手段345のX, Y座標としては
任意好適な数値を用いて良い。
*ステップ(7) 画像データ39の走査が終了か、否かを判断する。
■画像データ39の走査が終了しないとき座標検出手段
334は、前記画像データ39の走査が終了せず従って
画像データ39のすべての画素につき処理が終了してい
なければ、画素データ39の残りの画素につきステップ
(4)、(5a)〜(6)、(5b)〜(6)或いは{
7}の判断を行ない。その判断結果に応じて動作する。
■画像データ39の走査を終了したときステップ(8〉
に移る。
*ステップ(8) 最大値検出手段342及び最小値検出手段344は画像
データ39の走査が終了し画像データ39の全ての画素
につき処理が終了すると、X,Y座標の出力信号を最大
値座標保存手段343及び最小値座標保存手段345に
対して出力する。
この出力信号を入力した座標保存手段343,345は
、格納しているX,Y座標を特徴点座標として出力する
。これとともに最大値検出手段342、及び最小値検出
手段344は比較値の初期化を行なう。
全ての画素につき処理を終了した時点で、最大値座標保
存手段343及び最小値座標保存手段345に格納され
ているX,Y座標が最大及び最小計算値を与える画素の
X,Y座標すなわち特徴点座標となる。
座標検出手段34にあっては、α=β=1としたので、
全処理終了時点で例えば第6図に示す入力文字パターン
72の特徴点SRの座標が最大値座標保存手段343に
格納ざれており、また特徴点丁Lの座標が最小値座標保
存手段345に格納されている。
■;座標検出手段36に着目した説明(X−Yの最大値
、最小値検出動作の説明) 座標検出手段36は、上述した座標検出手段34の動作
と並行して座標検出手段34と同様の動作を行なうので
、この検出手段36の動作説明を省略する。
座標検出手段36にあっては、α=1及びβ=−1とし
たので、全ての画素につき処理を終了した時点で、例え
ば第6図に示す入力文字パターン72の特徴点TRの座
標が最大値座標保存手段363に格納ざれており、また
特徴点BLの座標が最小値座標保存手段365に格納さ
れている。
特徴最算出手段38では、入力文字パターンの特徴点T
L,BL,TR及びSRの座標を用い、幾何学的特徴量
として特徴値fiを式(1〉により痺出する。
なお、式(1)にあいて特徴点TL,BL,TR.BR
のX座標をTLX,BLX,TRX.BRXとして表す
fi =k {p(TLX−BLX} +q(TRX−BRX))     (1 )式(1〉
中k, p, qは任意の定数であり、iは単語内の文
字の番号であり、1からrまでである。
式〈1〉により算出ざれる特徴値f1は、字体判定部1
07に順次出力ざれる。
次に字体判定部107により字体を判定し、辞書を選択
することにつき説明する。
字体判定部107は特徴抽出部105で痺出ざれる特徴
値fiを順次累積しておき、単語内の文字の特徴値fi よる平均特徴値Fを算出し、 単語 内の字体を判定する。
r 「 式(2)中「は単語検出部106より出力されるカウン
タ22の数である。
式(2〉により算出ざれる単語内の平均特徴値「の下記
の式〈3〉による条件により、単語内の字体を判定し、
辞書部108に字体判定信@下を出力する。
式(3)中Cは固定閾値であり、任意に変えることがで
きる。
なお、本実施例では、出力する字体判定信号下は、「1
」、「2」の2種であるが、字体判定信号下は2種以外
のものとなっても何らさしつかえない。
字体判定部106により出力された字体判定信号下は、
辞書部108へ出力ざれ、字体判定信号Tに対応する辞
書を選択する。
第7図は辞書部108の構成例を示す機能ブロック図で
ある。辞書部108は、辞書選択部60、第1の辞書マ
トリクス61、第2の辞書マトリクス62とを備える。
本実施例では辞書マトリクスは2つであるが、これは3
つ以上であっても何等さしつかえない。辞書選択部60
は字体判定部107から出力される字体判定信号T=1
.T=2に対応してそれぞれ、第1の辞書マトリクス6
1又は第2の辞書マトリクス62を選択し、当該辞書マ
トリクスを識別部109に対して出力する。
次に識別部109により入力文字パターンを識別し、結
果を出力することにつき説明する。
識別部109はパターンメモリ104より、単語検出部
106より出力されるカウンタ22の数rに相当する入
力文字パターンを順次読み込み、この入力文字パターン
について特徴処理及び入力文字パターンの認識を行なう
この特徴抽出の方法は、従来公知の種々の方法を用いる
ことができるが、この実施例の場合、以下に説明するよ
うな方法で行なう。
先ず、入力パターンについて外接する方形枠を検出し、
これを文字枠とする。ざらに当該人力文字パターンにつ
いて線幅Wを算出する。この線幅算出は、例えば下記に
示すような周知の近似式(4)を用いて行なうことがで
きる。
W=1/ {1− (Q/A>}      (4)但
し、式(4)において、Qは、入力文字パターンを構成
する各点をこれらの点が(2X2>個づつの範囲で見ら
れる窓で分けたとき、この窓内の全ての点が黒ビットと
なる窓の個数であり、また、Aは文字枠内の黒ビットの
個数である。
ざらに、この入力文字パターンを複数の方向に走査を行
なって各走査列毎の黒ビットの連続個数を検出し、この
黒ビット連続個数と上)ボの線幅とに基づいて上jボの
複数の方向毎に対応したサブパターンの文字枠内領域を
サブパターンについて(NXM)個の領域(N.Mは定
数)に分割し、さらに、各領域内の文字線長を表す特徴
量を、文字を分割した領域毎に計算し、この特徴量を文
字枠の大きさで正規化して特徴マトリクスを得る。
この実施例では、特徴量を、(ΔX十ΔY〉/2なる値
で除することによって正規化する。ここで、ΔXは文字
枠の水平方向長さ、ΔYは垂直方向長さである。
識別部109は、このようにして抽出した特徴マトリク
スと辞書部108より出力される単語単位に選択される
辞書マトリクスとの照合を行ない、最も類似度が大きな
値を示した辞書マトリクスに対応する文字名(JISコ
ード等)を出力端子110を介して外部装置に出力する
なお、この実施例の場合上述した類似度は、以但し、式
(5〉において、Rは類似度、hiは入力文字パターン
、qiは辞書内に格納させてある辞書マトリクスをそれ
ぞれ示し、また、1=1,2,3,・・・,NXMであ
る。
[具体的帳票を用いた動作例] 次に具体的帳票を用いた場合の動作を説明する。
先ず、文字が記された例えば第8図に示すような帳票は
、画像データSとして光電変換部101に入力される。
光電変換部101では、帳票の各文字行鎖域を検出し、
行単位で2値のディジタル画像データに光電変換し、ラ
インバッファ102に格納する。前記行領域の検出は、
本実施例では、予め光電変換部101に設定ざれている
第9図(a)に示す入力書式テーブルを参照して順次行
なうものとする。前記入力書式テーブルには第9図(b
)に示すように第1行目の行領域の帳票の上端及び左端
からの距離行領域の大きさ、行ピッチ及び行数が記録ざ
れている。
第10図(a)にラインバツファ102に格納ざれてい
る2値のディジタル信号である行画像データ、第10図
(b)にその行画像データの黒ビットの分布を示す。ラ
インバツフ7102から読み込まれた2値のディジタル
信号である行画像デ一夕は、文字切り出し部103で黒
ビットの分布のOから1以上に変化するビットより1以
上からOへ変化するまでを文字予定@域として行画像デ
ータから検出し、1 28X1 28画素の入力文字パ
ターンを抽出する。この入力文字パターンは、1文字ご
とに、パターンメモリ104に格納されるとともに、特
徴抽出部105へ出力される。
さらに、文字切り出し部103で黒ビットの分布の1以
上からOに変化するビットより0がら1以上へ変化する
ビットまでを文字間隔とし、白ビットの数を計数して単
語検出部106へ出力する。
第10図(C)に本実施例における行画像データからの
各文字間隔のビット数を示す。計数された文字間隔は、
単語検出部106の比較回路21により、閾値レジスタ
23に入力ざれている閾値と比較を行なう。本実施例で
は閾値レジスタ23に設定ざれている閾値は「20」で
ある。文字間隔と閾値との比較を行ない、文字間隔が閾
値より小さい場合はカウンタ22の数rを1増やす。
また、文字間隔が閾値より大きい場合又は等しい場合は
、その場所を単語の区切りとし、前回の比較を行なった
までのカウンタ22の数rを字体判定部107及び識別
部109へ出力し、カウンタ22を初期値の1に再設定
する。本実施例における第10図の例では、2文宇目と
3文宇目の問隔が25.2であり、閾値20を越えるの
で、11 M Y uが単語として検出され、カウンタ
22の数「が2となり、これを単語を構成する文字数と
する。
また、文字切り出し部’103により出力される入力文
字パターンは、特徴抽出部105において入力文字パタ
ーンの128X128画素にX座標及びY座標をそれぞ
れ付与し、入力文字パターンの画素に関する最大及び最
小の計算値αX+βYを検出し、これら最大及び最小計
算値を与える特徴点座標を抽出する。第6図(a>に第
8図に示す帳票上の標準タイプ文字の先頭である((M
19及び第6図(b)に第8図に示す帳票上のイタリッ
クタイプ文字の先頭であるtt K ttの入力文字パ
ターン及び特徴点座標を示してある。
本実施例では、特徴点を検出するためのα及びβは(α
=1、β−1)と(α=1、β=−1〉の2組とし、前
記計算値による特徴点座標は第6図(a)では、TL=
 (0,O).BL= (0.47>.TR= (42
,O),BR= (42,47〉、第6図(b)では、
TL= (8.0),BL= (0.47>,TR= 
(42,O),BR=(35.47>である。前記特徴
点座標により、式〈1〉を用いて特徴値fを算出する。
このとき、本実施例では、定数k,D, qはそれぞれ
(k=1/2. p=1, q=1>であり、また固定
閾値はC=4である。前記条件により算出ざれる特徴値
fは、第6図(a>の4( M 99の例(標準体)で
はf=Qであり、第6図(b)の゛K″の例(イタリッ
ク体)ではf=7.5である。この例に示すように標準
体においては、fは小さな値を、イタリック体において
はfは大きな値となる。第10図(d>に第8図に示す
帳票上における各文字の特徴値fを示す。
算出された特徴値fは単語検出部106よりヵウンタ2
2の数「が出力されるまで、順次字体判定部107に出
力ざれ、加算ざれる。本実施例では、初めに検出ざれる
単語は゛’MY”であり、単語検出部106より出力さ
れる。カウンタ22の数はr=2であり、前記算出され
た単語“MY 99の1文字目の入力文字パターン゛M
”の特徴値f1=O及び単= d( M Y 99の2
文宇目の入力パターン“Y 71の特徴値f2 =0.
5について、式(2)を適用することにより、平均特徴
値F=0.25が算出される。この平均特徴値「は、辞
書部108へ出力ざれる。従って式(3)により、単語
内の字体判定信号T=2が辞書部10Bへ出力ざれる。
本実施例では、第8図に示す帳票が入力されたとき、第
10図(e)に示すような平均特徴値が単語毎にそれぞ
れ算出ざれ、F<Cの単語である゛MY″′,“NAM
E”,’“Is”は、字体判定信号T=2が辞書部10
8へ出力ざれ、第2の辞書マトリクス62を選択する。
単語” K E N ”の平均特徴値Fは、F=7.1
7が算出ざれ、F>Cとなり、字体判定信号T=1が辞
書部108へ出力され、これにより第1の辞書マトリク
ス61を選択する。
認識部109は文字切り出し部103から出力された入
力文字パターンを格納しているパターンメモリ104よ
り1つの単語を構成している文字数に相当するカウンタ
22の数r文字文づつ順次読み込む。パターンメモリ1
04から読み込まれる入力文字パターンの水平、垂直、
右斜め、左斜めの4方向について、サブパターンを線幅
に基づき抽出し、それぞれのサブパターンを文字枠内領
域についてNXMに分割する。本実施例では5X5であ
る。各鎖域において、文字線長を表す特徴量を計痺し、
特徴マトリクスを得る。この特徴マトリクスと、第11
図(a)及び第11図(b)に示すような辞書マトリク
スとの照合を行なう。
ここで、第11図(a)の辞書マトリクスは第6図の第
2の辞書マトリクス62に対応する標準タイプであり、
第11図(b)の#書マトリクスは第6図の第1の辞書
マトリックス61に対応するイタリックタイプ文字のも
のである。この照合で、最も類似度が大きい値を示した
辞書マトリクスに対応する文字名(JISコード等)を
出力端子110を介して外部装置に出力し、例えば、図
示しないディスプレイ上に、JISコード及びJISコ
ードに対応するキャラクターが第10図(f)のように
表示ざれる。
(発明の効果) 以上、詳細に説明したようにこの発明に係る文字認識装
置によれば、帳票上の各文字間隔を検出し、単語を抽出
するとともに各文字の文字線を有する各画素に対して、
2組の最大及び最小値を計算し、特徴点座標を抽出し、
単語を構成する各文字の幾何学的特1!!!量を算出し
、その各文字の幾何学的特徴量を用いて演算を行なって
、単語における特徴置を算出することにより、単語毎の
標準体やイタリック体等の字体の判定を行ない、当該判
定結果に基づき、照合するための辞書マスクを単語毎に
選択している。従って、照合は選択された辞書マスクと
のみ行なうため、照合に要する時間が短くなり、複数の
字体を含む帳票も高速に精度良く読み取ることが可能な
文字認識装置を提供することができる。
【図面の簡単な説明】
第1図から第11図は本発明に係る文字認識装置を説明
するための図面であり、第1図は文字認識装置の実施例
の機能ブロック図、第2図は単語検出部106の構成を
示す機能ブロック図、第3図は特徴抽出部105の構成
を示す機能ブロック図、第4図は本実施例における最大
値座標検出の説明に供する動作流れ図、第5図は本実施
例における最小値座標検出の説明に供する動作流れ図、
第6図(a),(b)は特徴点座標検出の原理図、第7
図は辞書部108の構成例を示す機能ブロック図、第8
図は実施例に用いる帳票の説明図、第9図(a)は入力
書式テーブルの例を示す図、第9図(b)は入力書式テ
ーブルの説明図、第10図(a)は本実施例に用いる2
値の行画像データの説明図、第10図(b)は行画像デ
ータの黒ビットの分イ6の説明図、第10図(C)は文
字間隔のビット数の説明図、第10図(d>は入力文字
パターンの特徴値fの説明図、第10図(e)は入力文
字パターンの単語内の平均特徴値「の説明図、第10図
(f)は認識結果を示す図、第11図(a)、(b)は
それぞれローマン字体の標準タイプとローマン字体のイ
タリックタイプの標準文字パターンとその文字の辞書マ
トリクスの説明図である。 101・・・光電変換部、102・・・ラインバッファ
、103・・・文字切り出し部、104・・・パターン
メモリ、105・・・特徴抽出部、106・・・単語検
出部、107・・・字体判定部、108・・・辞書部、
109・・・認識部。

Claims (6)

    【特許請求の範囲】
  1. (1)2値の画像データより画素値の連続を認識して得
    る入力文字パターンの1文字毎の特徴量を算出し、字体
    の判定を行ない、判定した字体に基づき辞書マスクを選
    択し、前記選択した辞書マスクにより入力文字パターン
    の照合を行なう文字認識装置において、 画像データの中の単語を検出するとともに単語を構成す
    る文字数を検出する単語検出部と、各文字について文字
    線を構成する各画素の座標X、Y及び、定数α、βに与
    えられる少なくとも2組の数値により、αX+βY及び
    αX−βYの最大値及び最小値を検出しその座標を特徴
    点とし、前記各文字の特徴点座標より各文字の幾何学的
    特徴量を算出する特徴抽出部と、 単語を構成する文字毎の前記幾何学的特徴量により単語
    内文字の特徴量を算出し、単語を構成している字体を判
    定する字体判定部と、 各文字の字体を判定した結果に基づき照合するための辞
    書マスクを単語単位に選択する辞書部とを有することを
    特徴とする文字認識装置。
  2. (2)単語検出部における単語検出は、画像データより
    文字間隔を検出し、当該検出された文字間隔の大小に基
    づき、単語を抽出することを特徴とする請求項第1項記
    載の文字認識装置。
  3. (3)特徴抽出部における幾何学的特徴量の算出は、(
    α=β=1)及び(α=1、β=−1)の2組のα値及
    びβ値を用い、所定の画素値を有する画素の座標に対す
    るX+Y及びX−Yの最大値及び最小値を検出し、前記
    検出された最大値及び最小値を与える特徴点座標に基づ
    き行なうことを特徴とする請求項第1項記載の文字認識
    装置。
  4. (4)特徴抽出部における幾何学的特徴量の算出は、X
    +Yの最大値のX座標をBRX、最小値のX座標をTL
    X、X−Yの最大値のX座標をTRX、最小値のX座標
    をBLXとし、k、p、qを任意の定数として、 f=k{p(TLX−BLX) +q(TRX−BRX)} により幾何学的特徴量を算出することを特徴とする請求
    項第3項記載の文字認識装置。
  5. (5)字体判定部における単語内文字の特徴量の算出は
    、単語を構成する文字毎の幾何学的特徴量をfi、単語
    の文字数をrとし、 ▲数式、化学式、表等があります▼ の演算を行ない特徴量Fを得ることを特徴とする請求項
    第1項、第2項、第3項又は第4項記載の文字認識装置
  6. (6)字体判定部で判定する字体が、明朝体等の標準体
    型文字とイタリック体等の斜体型文字とであることを特
    徴とする請求項第1項、第2項、第3項、第4項又は第
    5項記載の文字認識装置。
JP1229313A 1989-09-06 1989-09-06 文字認識装置 Expired - Lifetime JP2626084B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1229313A JP2626084B2 (ja) 1989-09-06 1989-09-06 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1229313A JP2626084B2 (ja) 1989-09-06 1989-09-06 文字認識装置

Publications (2)

Publication Number Publication Date
JPH0392989A true JPH0392989A (ja) 1991-04-18
JP2626084B2 JP2626084B2 (ja) 1997-07-02

Family

ID=16890186

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1229313A Expired - Lifetime JP2626084B2 (ja) 1989-09-06 1989-09-06 文字認識装置

Country Status (1)

Country Link
JP (1) JP2626084B2 (ja)

Also Published As

Publication number Publication date
JP2626084B2 (ja) 1997-07-02

Similar Documents

Publication Publication Date Title
JP3139521B2 (ja) 自動言語決定装置
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
JPH04298162A (ja) 近隣ブロック予測ビット圧縮法
JPS60153574A (ja) 文字読取方法
JPS6311832B2 (ja)
JPH0392989A (ja) 文字認識装置
JPH0333990A (ja) マスク処理を用いる光学式文字認識装置及び方法
JP2827288B2 (ja) 文字認識装置
JP2788506B2 (ja) 文字認識装置
Kar et al. An Approach for Word Segmentation from a Line Segment in Odia Text Using Quartiles
JP2582611B2 (ja) マルチフオント辞書の作成法
JP2902097B2 (ja) 情報処理装置及び文字認識装置
KR100243220B1 (ko) 매칭 속도를 개선한 문자 인식방법
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JP2708604B2 (ja) 文字認識方法
JP3100825B2 (ja) 線認識方法
JPH11120291A (ja) パタン認識システム
JPS59205681A (ja) 文字読取装置
CN116343229A (zh) 挖掘边缘特征的自然场景盲文字符识别方法
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPS63269267A (ja) 文字認識方法
CN117710985A (zh) 光学字符识别方法、装置及智能终端
JP2616995B2 (ja) 文字認識装置
JPH03136182A (ja) 文字切り出し方法
JP2972443B2 (ja) 文字認識装置