JP2626084B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2626084B2
JP2626084B2 JP1229313A JP22931389A JP2626084B2 JP 2626084 B2 JP2626084 B2 JP 2626084B2 JP 1229313 A JP1229313 A JP 1229313A JP 22931389 A JP22931389 A JP 22931389A JP 2626084 B2 JP2626084 B2 JP 2626084B2
Authority
JP
Japan
Prior art keywords
character
value
word
feature
coordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1229313A
Other languages
English (en)
Other versions
JPH0392989A (ja
Inventor
融 石河
浩史 吉田
浩一 樋口
義征 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP1229313A priority Critical patent/JP2626084B2/ja
Publication of JPH0392989A publication Critical patent/JPH0392989A/ja
Application granted granted Critical
Publication of JP2626084B2 publication Critical patent/JP2626084B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は、複数の字体の文字を含む帳票を高速にか
つ精度よく読み取ることのできる文字認識装置に関する
ものである。
(従来の技術) 従来文字認識装置には、例えば特公昭60−38756号公
報に開示されるものがあり、以下の構成要素(a)〜
(f)を具備している。
(a)文字図形を光電変換して量子化することにより黒
ビット及び白ビットで表されるディジタル信号の原パタ
ーンを作成する。
(b)次に、該原パターン線幅を算出する。
(c)次に、前記原パターンを複数の方向に走査を行な
って各走査列毎の黒ビットの連続個数を検出し、当該黒
ビット連続個数と前記線幅とに基づいて前記複数の走査
方向毎に対応した複数のサブパターンを抽出する。
(d)次に、前記原パターンの文字枠内領域をサブパタ
ーンについて(N×M)個の領域(N,Mは定数)に分割
し、該分割された領域内についてセルを単位として黒点
を計数した結果と前記線幅とを基に特徴量を計算する。
(e)次に、該特徴量を文字の大きさで正規化して特徴
マトリクスを作成する。
(f)そして、該特徴マトリクスを予め用意した文字図
形パターンの標準文字マスクと照合して文字図形を認識
する。
この様な文字認識装置において、認識する文字には、
複数の字体を含む帳票、例えば第8図に示すような特定
の単語だけイタリック体で印字されているような英文か
らなるものがある。このイタリック体は、氏名や地名な
どを強調するために使われるものである。この様な場
合、予め認識対象となるすべての字体の標準文字マスク
を辞書マスクとして用意しておき、前記すべての辞書マ
スクと入力文字図形とを照合し、認識を行うという方法
が広く用いられている。
(発明が解決しようとする課題) しかし、上記の方法では、辞書マスクの種類が字体の
数に比例して大きくなり、それが照合回数の増大とな
り、そのため認識速度が大幅に低下し、さらには認識精
度の低下を招くという問題点があった。
この発明が解決しようとする課題は、複数の字体の文
字を含む帳票を高速度で読み取ることができ、さらには
高精度の読取りを可能とする文字認識装置を提供するこ
とにある。
(課題を解決するための手段) この発明に係る文字認識装置は、2値の画像データよ
り入力文字パターンの1文字毎の特徴量を算出し、字体
の判定を行ない、判定した字体に基づき辞書マスクを選
択し、前記選択した辞書マスクにより入力文字パターン
の照合を行なう文字認識装置において、画像データの中
の単語を検出するとともに単語を構成する文字数を検出
する単語検出部と、各文字について文字線を構成する各
画素の座標X,Y及び、定数α,βに与えられる少なくと
も2組の数値により、αX+βYの最大値及び最小値を
検出しその座標を特徴点とし、前記各文字の特徴点座標
より各文字の幾何学的特徴量を算出する特徴抽出部と、
単語を構成する文字毎の前記幾何学的特徴量により単語
内文字の特徴量を算出し、単語を構成している字体を判
定する字体判定部と、各文字の字体を判定した結果に基
づき照合するための辞書マスクを単語単位に選択する辞
書部とを有することを特徴とするものである。
単語検出部における単語検出は、画像データより文字
間隔を検出し、当該検出された文字間隔の大小に基づき
単語を抽出することによって行うこともできる。
特徴抽出部における幾何学的特徴量の算出は、(α=
β=1)及び(α=1,β=−1)の2組のα値及びβ値
を用い、所定の画素値を有する画素の座標に対するX+
Y及びX−Yの最大値及び最小値を検出し、前記検出さ
れた最大値及び最小値を与える特徴点座標に基づき行な
ってもよい。
特徴抽出部における幾何学的特徴量の算出は、X+Y
の最大値のX座標をBRX、最小値のX座標をTLX、X−Y
の最大値のX座標をTRX、最小値のX座標をBLXとし、k,
p,qを任意の定数として、 f=k{p(TLX−BLX)+q(TRX−BRX)} により幾何学的特徴量を算出することを含む。
字体判定部における単語内文字の特徴量の算出は、単
語を構成する文字毎の幾何学的特徴量をfi、単語の文字
数をrとし、 の演算を行ない特徴量Fを得ることであってもよい。
また、字体判定部で判定する字体が、明朝体等の標準
体型文字とイタリック体等の斜体型文字とすることがで
きる。
(作用) 単語検出部では、2値の画像データの中の単語を検出
するとともに、単語の中に含まれる文字数も検出してお
く。このとき、画像データの文字間隔を検出し、この検
出された文字間隔の大小に基づき、単語の区切りを判断
し、単語を検出することができ、1つの単語内での文字
間隔の数により文字数を抽出する。一方、特徴抽出部
は、1文字ごとの画像データを走査し、その座標X,Yに
少なくとも2組の定数α,βをかけ、αX+βYを計算
する。各画素についてこの計算を行ない、1文字内の最
小値及び最大値を検出し、その最大値及び最小値を示す
座標を特徴点とする。この特徴点としては前記αX+β
Yの最大値、最小値の少なくとも4個が得られ、これら
から幾何学的特徴量を算出する。定数α、βの第1組
が、α=β=1で、第2組がα=1,β=−1にすると、
αX+βYはX+Yと、X−Yとの2組が得られる。X
+Yの最大値は、1文字内において文字線の右下の座標
点で現れ、最小値は左上の座標点で現れる。また、X−
Yの最大値は、1文字内において右上の文字線の座標点
で現れ、最小値は左下の座標点で現れる。これらのX座
標を示すと、それぞれBRX,TLX,TRX及びBLXであり、次に
示す式で幾何学的特徴量を算出するものである。
f=k{p(TLX−BLX)+q(TRX−BRX)} この幾何学的特徴量fは、1文字の傾き程度の特徴を
表している。
字体判定部では特徴抽出部からの幾何学的特徴量を、
単語検出部からの単語構成文字数分だけ受け入れ、単語
内文字の特徴量を算出し、その単語の字体を判定する。
このとき単語内文字の特徴量の算出は次の式で行なうも
のである。
ここで、rは単語を構成する文字数、fiはi番目文字
の幾何学的特徴量である。
この特徴量Fは単語内の幾何学的特徴量fの平均値に
よって与えられ、単語全体の文字の字体の特徴を表すも
のである。字体判定部において、この特徴量Fに対応し
た字体を判定する。例えば、判定対象の字体としては、
明朝体等の標準体型文字とイタリック体等の斜体型文字
がある。
辞書部では字体判定部の判定結果により、照合するた
めの辞書マスクを選択する。この辞書選択は、単語単位
で行ない、そのため高速で処理することができ、高精度
で文字認識処理をすることができる。
(実施例) 以下、本発明に係る文字認識装置の実施例を、図面を
参照して説明する。
[各部の機能説明] 第1図は文字認識装置の1実施例の機能ブロック図で
ある。第1図において、101は光信号Sを電気信号に変
換する光電変換部、102は前記光電変換部101からの行画
像データを格納するラインバッファ、103は行画像デー
タの入力文字パターンおよび文字間隔を計数する文字切
り出し部、104は前記文字切り出し部103からの入力文字
パターンを格納するパターンメモリ、105は前記文字切
り出し部103からの文字入力パターンより各文字の幾何
学的特徴量を算出する特徴抽出部、106は行画像データ
の中の単語を検出する単語検出部、107は単語を構成し
ている字体を判定する字体判定部、108は判定した字体
の辞書マスクを単語単位に選択する辞書部、109は選択
した辞書マスクにより入力パターンの照合認識をする認
識部、110は出力端子であり、例えばコンピュータ等の
外部機器のデータ入力端子等に接続されるものであり、
文字認識の結果得られた文字名(例えばJISの文字コー
ド)を出力するものである。
まず認識対象文字の入力文字パターンを切り出すこと
につき説明する。
光電変換部101は、文字、図形等(以下、文字と称す
る。)が記載された帳票等の媒体の文字行領域の光信号
(第1図のS)を入力する。ここで、文字行領域とは、
帳票上における文字が記載される1行分の領域をいう。
入力した光信号は光電変換され、文字線部を画素値
「1」の黒ビット及び背景部を画素値「0」の白ビット
として各画素ごとに2値のディジタル信号で表現した行
画像データを得て、ラインバッファ102に格納される。
ラインバッファ102は入力文字パターンの行画像デー
タにおける各画素の2値信号をこの文字行領域の2次元
座標通りに再現できる形式で記憶し、例えば128×4,096
画素の大きさを持っているものである。
文字切り出し部103はラインバッファ102から行画像デ
ータを読み込み、縦方向に走査を行ない、黒ビットの分
布を作成する。黒ビットの分布の0から1以上に変化す
るビットより、1以上から0に変化する直前のビットま
でを1つの文字予定領域とし、入力文字パターンを得
る。得られた入力文字パターンは、パターンメモリ104
に格納されるとともに、特徴抽出部105に出力される。
また、黒ビットの分布の1以上から0に変化するビッ
トより、0から1以上に変化する直前のビットまでの画
素数を文字間隔として計数し、その画素数を単語検出部
106に出力する。
次に単語検出部106における行画像データから単語を
検出することにつき説明する。
単語検出部106は、文字切り出し部103から出力される
文字間隔により単語を検出し、1単語中の文字数rを字
体判定部107及び認識部109へ出力する。
第2図は単語検出部106の構成を示す機能ブロック図
である。21は比較回路、22はカウンタ、23は閾値レジス
タである。文字切り出し部103から出力される文字間隔
は、出力される毎に予め入力されている閾値レジスタ23
内の閾値と、比較回路21において比較が行なわれる。1
文字の比較が終了し、文字間隔よりも閾値が大きい場合
は、カウンタ22の数を1増す。文字間隔が閾値よりも大
きい場合は又は等しい場合は、比較を行なった文字間隔
の直前の文字までを1単語とし、その時点でのカウンタ
22の数rを単語を構成する文字数として字体判定部107
及び認識部109へ出力し、カウンタ22を1に再設定す
る。なお、カウンタ22の初期設定は1である 次に入力文字パターンがパターンメモリ104に格納さ
れることにつき説明する。
パターンメモリ104は、入力文字パターンの文字予定
領域における各画素の信号をこの領域の2次元座標通り
に再現できる形式で記憶し、入力文字パターン1文字あ
たり128×128画素の大きさで構成される単語を記憶でき
るものである。パターンメモリ104に格納されている入
力文字パターンは、識別部109に読み込まれる。
次に、入力文字パターンの特徴より算出される特徴値
を出力することについて説明する。
特徴抽出部105は文字切り出し部103から出力される入
力文字パターンの特徴値を算出し、字体判定部107に幾
何学的特徴量として特徴値を出力する。
第3図は特徴抽出部105の構成を示す機能ブロック図
である。
同図において、39は文字切り出し部103から出力され
る認識対象となる入力文字パターンの画像データであ
る。この実施例の特徴抽出部105は、前記画像データ39
の画素にX座標を付与するためのX座標発生手段30と、
前記画像データ39の画素にY座標を付与するためのY座
標発生手段32と、前記X,Y座標とα及びβに与えられる
少なくとも2組の特定の数値とを用いて、入力文字パタ
ーンの画素に関する最大及び最小計算値を与える入力文
字パターンの画素のX,Y座標を夫々特徴点座標として出
力するための座標検出手段34,36と、入力文字パターン
の特徴抽出を行うための幾何学的特徴量を特徴点座標に
基づき算出する特徴量算出手段38とを備えている。
また、座標検出手段34は、計算値αX+βYを算出す
る計算手段341と、最大計算値を検出するための最大値
検出手段342と、最大計算値を与える画素のX,Y座標を保
存するための最大値座標保存手段343と、最小計算値を
検出するための最小値検出手段344と、最小計算値を与
える画素のX,Y座標を保存するための最小値座標保存手
段345とを備えている。座標検出手段36もまた前記座標
検出手段34と同様、計算手段361と最大値検出手段362と
最大値座標保存手段363と最小値検出手段364と最小値座
標保存手段365とを備えている。
この実施例では、(α=β=1)及び(α=1、β=
−1)の2組のα及びβ値を用い、X+Y及びX−Yに
関する最大及び最小計算値を与える画素の座標より、入
力文字パターンの特徴値を算出し、字体判定部107に計
算値を出力するので、2個の座標検出手段34,36を備え
る構成となっている。座標検出手段34にあっては計算値
X+Yに関する、及び座標検出手段36にあっては計算値
X−Yに関する、最大及び最小計算値を与える画素の座
標を検出する。
以下に特徴抽出部105について最大及び最小座標検出
を、第3図と、第4図及び第5図を用いて説明する。第
4図は本実施例における最大値座標検出の説明に供する
動作流れ図、第5図は本実施例における最小値座標検出
の説明に供する動作流れ図である。
I;座標検出手段34に着目した説明(X+Yの最大値及び
最小値検出動作の説明) *ステップ(1)〜(3) 文字切り出し部103より出力される(ステップ
(1))入力文字パターンは、画素毎に最大値検出手段
342及び最小値検出手段344に入力される。
これとともに、X座標発生手段30及びY座標発生手段
32は、前記画像データ39の出力と同期させてこの画像デ
ータ39のそれぞれの画素毎に対応付けたX,Y座標を発生
する。その結果これら発生手段30,32によって前記画像
データ39にX,Y座標の付与が行われる。出力されたX,Y座
標はX+Y計算手段341、最大値座標保存手段343及び最
小値座標保存手段345に入力される。(ステップ
(2)) X+Y計算手段341はX,Y座標を入力するとこれらX,Y
座標から計算値X+Yを算出し、算出した計算値を最大
値検出手段342及び最小値検出手段344に対し出力する。
(ステップ(3)) ステップ(2)〜(3)によって、最大値検出手段34
2は前記画像データ39及び計算値を、最小値検出手段344
は前記画像データ39及び計算値を、最大値座標保存手段
343はX,Y座標を、最小値座標保存手段345はX,Y座標を、
それぞれ1画素毎に入力する。そして、座標検出手段34
は後述のステップ(4)、(5a)〜(6)、(5b)〜
(6)或いは(7)の判断を1画素毎に繰返し行ない、
その判断結果に応じた動作を行なう。
*ステップ(4) 最大値検出手段342及び最小値検出手段344は、入力さ
れた前記画像データ39の画素が入力文字パターンの画素
であるか否かを判断する。この判断は、入力された画素
の画素値が入力文字パターンを意味する所定の画素値
(この実施例では画素値「1」)であるか否かを判断す
ることによって、行なわれる。
*ステップ(5) 所定の画素値を有するとき、最大値検出手段342は所
定の比較値と前記計算値との比較を行ない(ステップ
(5a))、最小値検出手段344は別の所定の比較値と前
記計算値との比較を行なう(ステップ(5b))。
*ステップ(5a)〜(6) 計算値が比較値よりも大きいとき 最大値検出手段342は先に格納されている比較値に代
えて、比較値よりも大きい計算値を新たな比較値とし格
納し(比較値の書換え)、これとともにセットパルスを
最大値座標保存手段343に対し出力する。セットパルス
を入力した最大値座標保存手段343は格納されているX,Y
座標に代えて、比較値よりも大きな計算値を与える画素
のX,Y座標を新たに格納する(X,Y座標の書換え)。
計算値が比較値よりも小さいか或いは比較値と等しい
とき 最大値検出手段342は先に格納されている比較値を書
換えずにそのまま格納するとともに、最大値座標保存手
段322は格納されているX,Y座標を書換えない。
最大値検出手段342は及びのいずれの場合もステ
ップ(5a)の次にステップ(7)の判断を行なう。
なお、最大検出手段342に格納される比較値の初期値
としては、例えば計算値αとして取り得る値よりも小さ
な値を用いれば良い。例えばα=β=1であり、前記画
像データをl行m列の画素に分割し、0≦X≦m−1、
及び0≦l−1とした場合には、例えば−1を比較値の
初期値とすることができる。或いは比較値の初期値とし
て最大値検出手段342に一番最初に入力された計算値α
X+βYを用いるようにしても良い。
また、最大値検出手段342において、比較値及びX,Y座
標の書換えを計算値αX+βYが比較値よりも大きいと
き及び計算値が比較値と等しいときに行なうようにし、
これとともに計算値が比較値よりも小さいとき比較値及
びX,Y座標の書換えを行なわないようにしても良い。
また、最大値座標保存手段343のX,Y座標としては任意
好適な数値を用いて良い。
*ステップ(5b)〜6 計算値が比較値よりも小さいとき 最小値検出手段344は先に格納されている比較値に代
えて比較値よりも小さい計算値を比較値として新たに格
納する(比較値の書換え)とともに、最小値座標保存手
段345に対しセットパルスを出力する。最小値座標保存
手段345はセットパルスを入力すると、格納されている
X,Y座標を比較値よりも小さな計算値を与える画素のX,Y
座標に書換える(X,Y座標の書換え)。
計算値が比較値よりも大きいか或いは比較値と等しい
とき 最小値検出手段344は先に格納されている比較値を書
換えずにそのまま格納するとともに、最小値座標保存手
段322に格納されているX,Y座標を書換えない。
最小値検出手段344は及びのいずれの場合にもス
テップ(5b)の次にステップ(7)の判断を行なう。
なお、最小値検出手段344に格納される比較値の初期
値としては、例えば計算値αX+βYとし取り得る値よ
りも大きな値を用いれば良い。例えばα=β=1であ
り、画像データをl行m列の画素に分割し、0≦X≦m
−1、及び0≦Y≦l−1となる場合には、例えばm+
n−1を比較値の初期値とすることができる。或いは比
較値の初期値として最小値検出手段344に一番最初に入
力された計算値αX+βYを用いるようにしても良い。
また、最小値検出手段344は計算値が比較値よりも小
さいとき及び計算値が比較値と等しいとき比較値及びX,
Y座標の書換えを行ない、これとともに計算値が比較値
よりも大きいとき比較値及びX,Y座標の書換えを行なわ
ないようにしても良い。
また最小値座標保存手段345のX,Y座標としては任意好
適な数値を用いて良い。
*ステップ(7) 画像データ39の走査が終了か、否かを判断する。
画像データ39の走査が終了しないとき 座標検出手段334は、前記画像データ39の走査が終了
せず従って画像データ39のすべての画素につき処理が終
了していなければ、画素データ39の残りの画素につきス
テップ(4)、(5a)〜(6)、(5b)〜(6)或いは
(7)の判断を行ない。その判断結果に応じて動作す
る。
画像データ39の走査を終了したとき ステップ(8)に移る。
*ステップ(8) 最大値検出手段342及び最小値検出手段344は画像デー
タ39の走査が終了し画像データ39の全ての画素につき処
理が終了すると、X,Y座標の出力信号を最大値座標保存
手段343及び最小値座標保存手段345に対して出力する。
この出力信号を入力した座標保存手段343,345は、格納
しているX,Y座標を特徴点座標として出力する。これと
ともに最大値検出手段342、及び最小値検出手段344は比
較値の初期化を行なう。
全ての画素につき処理を終了した時点で、最大値座標
保存手段343及び最小値座標保存手段345に格納されてい
るX,Y座標が最大及び最小計算値を与える画素のX,Y座標
すなわち特徴点座標となる。
座標検出手段34にあっては、α=β=1としたので、
全処理終了時点で例えば第6図に示す入力文字パターン
72の特徴点BRの座標が最大値座標保存手段343に格納さ
れており、また特徴点TLの座標が最小値座標保存手段34
5に格納されている。
II;座標検出手段36に着目した説明(X−Yの最大値、
最小値検出動作の説明) 座標検出手段36は、上述した座標検出手段34の動作と
並行して座標検出手段34と同様の動作を行なうので、こ
の検出手段36の動作説明を省略する。
座標検出手段36にあっては、α=1及びβ=−1とし
たので、全ての画素につき処理を終了した時点で、例え
ば第6図に示す入力文字パターン72の特徴点TRの座標が
最大値座標保存手段363に格納されており、また特徴点B
Lの座標が最小値座標保存手段365に格納されている。
特徴量算出手段38では、入力文字パターンの特徴点T
L,BL,TR及びBRの座標を用い、幾何学的特徴量として特
徴値fiを式(1)により算出する。
なお、式(1)において特徴点TL,BL,TR,BRのX座標
をTLX,BLX,TRX,BRXとして表す。
fi=k{p(TLX−BLX)+q(TRX−BRX)} (1) 式(1)中k,p,qは任意の定数であり、iは単語内の
文字の番号であり、1からrまでである。
式(1)により算出される特徴値fiは、字体判定部10
7に順次出力される。
次に字体判定部107により字体を判定し、辞書を選択
することにつき説明する。
字体判定部107は特徴抽出部105で算出される特徴値fi
を順次累積しておき、単語内の文字の特徴値fiよる平均
特徴値Fを算出し、単語内の字体を判定する。
式(2)中rは単語検出部106より出力されるカウン
タ22の数である。
式(2)により算出される単語内の平均特徴値Fの下
記の式(3)による条件により、単語内の字体を判定
し、辞書部108に字体判定信号Tを出力する。
式(3)中Cは固定閾値であり、任意に変えることが
できる。
なお、本実施例では、出力する字体判定信号Tは、
「1」、「2」の2種であるが、字体判定信号Tは2種
以外のものとなっても何らさしつかえない。
字体判定部106により出力された字体判定信号Tは、
辞書部108へ出力され、字体判定信号Tに対応する辞書
を選択する。
第7図は辞書部108の構成例を示す機能ブロック図で
ある。辞書部108は、辞書選択部60、第1の辞書マトリ
クス61、第2の辞書マトリクス62とを備える。本実施例
では辞書マトリクスは2つであるが、これは3つ以上で
あっても何等さしつかえない。辞書選択部60は字体判定
部107から出力される字体判定信号T=1,T=2に対応し
てそれぞれ、第1の辞書マトリクス61又は第2の辞書マ
トリクス62を選択し、当該辞書マトリクスを識別部109
に対して出力する。
次に識別部109により入力文字パターンを識別し、結
果を出力することにつき説明する。
識別部109はパターンメモリ104より、単語検出部106
より出力されるカウンタ22の数rに相当する入力文字パ
ターンを順次読み込み、この入力文字パターンについて
特徴処理及び入力文字パターンの認識を行なう。
この特徴抽出の方法は、従来公知の種々の方法を用い
ることができるが、この実施例の場合、以下に説明する
ような方法で行なう。
先ず、入力パターンについて外接する方形枠を検出
し、これを文字枠とする。さらに当該入力文字パターン
について線幅Wを算出する。この線幅算出は、例えば下
記に示すような周知の近似式(4)を用いて行なうこと
ができる。
W=1/{1−(Q/A)} (4) 但し、式(4)において、Qは、入力文字パターンを
構成する各点をこれらの点が(2×2)個づつの範囲で
見られる窓で分けたとき、この窓内の全ての点が黒ビッ
トとなる窓の個数であり、また、Aは文字枠内の黒ビッ
トの個数である。
さらに、この入力文字パターンを複数の方向に走査を
行なって各走査列毎の黒ビットの連続個数を検出し、こ
の黒ビット連続個数と上述の線幅とに基づいて上述の複
数の方向毎に対応したサブパターンの文字枠内領域をサ
ブパターンについて(N×M)個の領域(N,Mは定数)
に分割し、さらに、各領域内の文字線長を表す特徴量
を、文字を分割した領域毎に計算し、この特徴量を文字
枠の大きさで正規化して特徴マトリクスを得る。この実
施例では、特徴量を、(ΔX+ΔY)/2なる値で除する
ことによって正規化する。ここで、ΔXは文字枠の水平
方向長さ、ΔYは垂直方向長さである。
識別部109は、このようにして抽出した特徴マトリク
スと辞書部108より出力される単語単位に選択される辞
書マトリクスとの照合を行ない、最も類似度が大きな値
を示した辞書マトリクスに対応する文字名(JISコード
等)を出力端子110を介して外部装置に出力する。
なお、この実施例の場合上述した類似度は、以下に示
す式(5)に基づいて求めている。
但し、式(5)において、Rは類似度、hiは入力文字
パターンより抽出した特徴マトリクス、giは辞書内に格
納させてある辞書マトリクスをそれぞれ示し、また、i
=1,2,3,…,N×Mである。
[具体的帳票を用いた動作例] 次に具体的帳票を用いた場合の動作を説明する。
先ず、文字が記された例えば第8図に示すような帳票
は、画像データSとして光電変換部101に入力される。
光電変換部101では、帳票の各文字行領域を検出し、行
単位で2値のディジタル画像データに光電変換し、ライ
ンバッファ102に格納する。前記行領域の検出は、本実
施例では、予め光電変換部101に設定されている第9図
(a)に示す入力書式テーブルを参照して順次行なうも
のとする。前記入力書式テーブルには第9図(b)に示
すように第1行目の行領域の帳票の上端及び左端からの
距離、行領域の大きさ、行ピッチ及び行数が記録されて
いる。
第10図(a)にラインバッファ102に格納されている
2値のディジタル信号である行画像データ、第10図
(b)にその行画像データの黒ビットの分布を示す。ラ
インバッファ102から読み込まれた2値のディジタル信
号である行画像データは、文字切り出し部103で黒ビッ
トの分布の0から1以上に変化するビットより1以上か
ら0へ変化するまでを文字予定領域として行画像データ
から検出し、128×128画素の入力文字パターンを抽出す
る。この入力文字パターンは、1文字ごとに、パターン
メモリ104に格納されるとともに、特徴抽出部105へ出力
される。
さらに、文字切り出し部103で黒ビットの分布の1以
上から0に変化するビットより0から1以上へ変化する
ビットまでを文字間隔とし、白ビットの数を計数して単
語検出部106へ出力する。第10図(c)に本実施例にお
ける行画像データからの各文字間隔のビット数を示す。
計数された文字間隔は、単語検出部106の比較回路21に
より、閾値レジスタ23に入力されている閾値と比較を行
なう。本実施例では閾値レジスタ23に設定されている閾
値は「20」である。文字間隔と閾値との比較を行ない、
文字間隔が閾値より小さい場合はカウンタ22の数rを1
増やす。
また、文字間隔が閾値より大きい場合又は等しい場合
は、その場所を単語の区切りとし、前回の比較を行なっ
たまでのカウンタ22の数rを字体判定部107及び識別部1
09へ出力し、カウンタ22を初期値の1に再設定する。本
実施例における第10図の例では、2文字目と3文字目の
間隔が25であり、閾値20を越えるので、“MY"が単語と
して検出され、カウンタ22の数rが2となり、これを単
語を構成する文字数とする。
また、文字切り出し部103により出力される入力文字
パターンは、特徴抽出部105において入力文字パターン
の128×128画素にX座標及びY座標をそれぞれ付与し、
入力文字パターンの画素に関する最大及び最小の計算値
αX+βYを検出し、これら最大及び最小計算値を与え
る特徴点座標を抽出する。第6図(a)に第8図に示す
帳票上の標準タイプ文字の先頭である“M"及び第6図
(b)に第8図に示す帳票上のイタリックタイプ文字の
先頭である“K"の入力文字パターン及び特徴点座標を示
してある。
本実施例では、特徴点を検出するためのα及びβは
(α=1、β=1)と(α=1、β=−1)の2組と
し、前記計算値による特徴点座標は第6図(a)では、
TL=(0,0),BL=(0,47),TR=(42,0),BR=(42,4
7)、第6図(b)では、TL=(8,0),BL=(0,47),TR
=(42,0),BR=(35,47)である。前記特徴点座標によ
り、式(1)を用いて特徴値fを算出する。このとき、
本実施例では、定数k,p,qはそれぞれ(k=1/2,p=1,q
=1)であり、また固定閾値はC=4である。前記条件
により算出される特徴値fは、第6図(a)の“M"の例
(標準体)ではf=0であり、第6図(b)の“K"の例
(イタリック体)ではf=7.5である。この例に示すよ
うに標準体においては、fは小さな値を、イタリック体
においてはfは大きな値となる。第10図(d)に第8図
に示す帳票上における各文字の特徴値fを示す。
算出された特徴値fは単語検出部106よりカウンタ22
の数rが出力されるまで、順次字体判定部107に出力さ
れ、加算される。本実施例では、初めに検出される単語
は“MY"であり、単語検出部106より出力される。カウン
タ22の数はr=2であり、前記算出された単語“MY"の
1文字目の入力文字パターン“M"の特徴値f1=0及び単
語“MY"の2文字目の入力パターン“Y"の特徴値f2=0.5
について、式(2)を適用することにより平均特徴値F
=0.25が算出される。この平均特徴値Fは、辞書部108
へ出力される。従って式(3)により、単語内の字体判
定信号T=2が辞書部108へ出力される。本実施例で
は、第8図に示す帳票が入力されたとき、第10図(e)
に示すような平均特徴値が単語毎にそれぞれ算出され、
F<Cの単語である“MY",“NAME",“IS"は、字体判定
信号T=2が辞書部108へ出力され、第2の辞書マトリ
クス62を選択する。単語“KEN"の平均特徴値Fは、F=
7.17が算出され、F≧Cとなり、字体判定信号T=1が
辞書部108へ出力され、これにより第1の辞書マトリク
ス61を選択する。
認識部109は文字切り出し部103から出力された入力文
字パターンを格納しているパターンメモリ104より1つ
の単語を構成している文字数に相当するカウンタ22の数
r文字分づつ順次読み込む。パターンメモリ104から読
み込まれる入力文字パターンの水平、垂直、右斜め、左
斜めの4方向について、サブパターンを線幅に基づき抽
出し、それぞれのサブパターンを文字枠内領域について
N×Mに分割する。本実施例では5×5である。各領域
において、文字線長を表す特徴量を計算し、特徴マトリ
クスを得る。この特徴マトリクスと、第11図(a)及び
第11図(b)に示すような辞書マトリクスとの照合を行
なう。ここで、第11図(a)の辞書マトリクスは第6図
の第2の辞書マトリクス62に対応する標準タイプであ
り、第11図(b)の辞書マトリクスは第6図の第1の辞
書マトリックス61に対応するイタリックタイプ文字のも
のである。この照合で最も類似度が大きい値を示した辞
書マトリクスに対応する文字名(JISコード等)を出力
端子110を介して外部装置に出力し、例えば、図示しな
いディスプレイ上に、JISコード及びJISコードに対応す
るキャラクターが第10図(f)のように表示される。
(発明の効果) 以上、詳細に説明したようにこの発明に係る文字認識
装置によれば、帳票上の各文字間隔を検出し、単語を抽
出するとともに各文字の文字線を有する各画素に対し
て、2組の最大及び最小値を計算し、特徴点座標を抽出
し、単語を構成する各文字の幾何学的特徴量を算出し、
その各文字の幾何学的特徴量を用いて演算を行なって、
単語における特徴量を算出することにより、単語毎の標
準体やイタリック体等の字体の判定を行ない、当該判定
結果に基づき、照合するための辞書マスクを単語毎に選
択している。従って、照合は選択された辞書マスクとの
み行なうため、照合に要する時間が短くなり、複数の字
体を含む帳票も高速に精度良く読み取ることが可能な文
字認識装置を提供することができる。
【図面の簡単な説明】
第1図から第11図は本発明に係る文字認識装置を説明す
るための図面であり、第1図は文字認識装置の実施例の
機能ブロック図、第2図は単語検出部106の構成を示す
機能ブロック図、第3図は特徴抽出部105の構成を示す
機能ブロック図、第4図は本実施例における最大値座標
検出の説明に供する動作流れ図、第5図は本実施例にお
ける最小値座標検出の説明に供する動作流れ図、第6図
(a),(b)は特徴点座標検出の原理図、第7図は辞
書部108の構成例を示す機能ブロック図、第8図は実施
例に用いる帳票の説明図、第9図(a)は入力書式テー
ブルの例を示す図、第9図(b)は入力書式テーブルの
説明図、第10図(a)は本実施例に用いる2値の行画像
データの説明図、第10図(b)は行画像データの黒ビッ
トの分布の説明図、第10図(c)は文字間隔のビット数
の説明図、第10図(d)は入力文字パターンの特徴値f
の説明図、第10図(e)は入力文字パターンの単語内の
平均特徴値Fの説明図、第10図(f)は認識結果を示す
図、第11図(a)、(b)はそれぞれローマン字体の標
準タイプとローマン字体のイタリックタイプの標準文字
パターンとその文字の辞書マトリクスの説明図である。 101……光電変換部、102……ラインバッファ、103……
文字切り出し部、104……パターンメモリ、105……特徴
抽出部、106……単語検出部、107……字体判定部、108
……辞書部、109……認識部。

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】画像データより得る入力文字パターンの1
    文字毎の特徴量を算出し、字体の判定を行ない、判定し
    た字体に基づき辞書マスクを選択し、前記選択した辞書
    マスクにより入力文字パターンの照合を行なう文字認識
    装置において、 画像データの中の単語を検出するとともに単語を構成す
    る文字数を検出する単語検出部と、 各文字について文字線を構成する各画素の座標X,Y及
    び、定数α,βに与えられる少なくとも2組の数値によ
    り、αX+βYの最大値及び最小値を検出しその座標を
    特徴点とし、前記各文字の特徴点座標より各文字の幾何
    学的特徴量を算出する特徴抽出部と、 単語を構成する文字毎の前記幾何学的特徴量により単語
    内文字の特徴量を算出し、単語を構成している字体を判
    定する字体判定部と、 各文字の字体を判定した結果に基づき照合するための辞
    書マスクを単語単位に選択する辞書部とを有することを
    特徴とする文字認識装置。
  2. 【請求項2】単語検出部における単語検出は、画像デー
    タより文字間隔を検出し、当該検出された文字間隔の大
    小に基づき、単語を抽出することを特徴とする請求項第
    1項記載の文字認識装置。
  3. 【請求項3】特徴抽出部における幾何学的特徴量の算出
    は、(α=β=1)及び(α=1,β=−1)の2組のα
    値及びβ値を用い、所定の画素値を有する画素の座標に
    対するX+Y及びX−Yの最大値及び最小値を検出し、
    前記検出された最大値及び最小値を与える特徴点座標に
    基づき行なうことを特徴とする請求項第1項記載の文字
    認識装置。
  4. 【請求項4】特徴抽出部における幾何学的特徴量の算出
    は、X+Yの最大値のX座標をBRX、最小値のX座標をT
    LX、X−Yの最大値のX座標をTRX、最小値のX座標をB
    LXとし、k,p,qを任意の定数として、 f=k{p(TLX−BLX)+q(TRX−BRX)} により幾何学的特徴量を算出することを特徴とする請求
    項第3項記載の文字認識装置。
  5. 【請求項5】字体判定部における単語内文字の特徴量の
    算出は、単語を構成する文字毎の幾何学的特徴量をfi、
    単語の文字数をrとし、 の演算を行ない特徴量Fを得ることを特徴とする請求項
    第1項、第2項、第3項又は第4項記載の文字認識装
    置。
  6. 【請求項6】字体判定部で判定する字体が、明朝体等の
    標準体型文字とイタリック体等の斜体型文字とであるこ
    とを特徴とする請求項第1項、第2項、第3項、第4項
    又は第5項記載の文字認識装置。
JP1229313A 1989-09-06 1989-09-06 文字認識装置 Expired - Lifetime JP2626084B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1229313A JP2626084B2 (ja) 1989-09-06 1989-09-06 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1229313A JP2626084B2 (ja) 1989-09-06 1989-09-06 文字認識装置

Publications (2)

Publication Number Publication Date
JPH0392989A JPH0392989A (ja) 1991-04-18
JP2626084B2 true JP2626084B2 (ja) 1997-07-02

Family

ID=16890186

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1229313A Expired - Lifetime JP2626084B2 (ja) 1989-09-06 1989-09-06 文字認識装置

Country Status (1)

Country Link
JP (1) JP2626084B2 (ja)

Also Published As

Publication number Publication date
JPH0392989A (ja) 1991-04-18

Similar Documents

Publication Publication Date Title
JP2940496B2 (ja) パタンマッチング符号化装置及び方法
EP0843275B1 (en) Pattern extraction apparatus and method for extracting patterns
JPS6159568A (ja) 文書処理装置
GB2190778A (en) Character recognition with variable subdivision of a character region
US4288779A (en) Method and apparatus for character reading
US4628533A (en) Pattern recognition apparatus
JP2626084B2 (ja) 文字認識装置
JP2827288B2 (ja) 文字認識装置
EP0923045A2 (en) Image recognition through localized interpretation
CN109409370B (zh) 一种远程桌面字符识别方法和装置
JP2582611B2 (ja) マルチフオント辞書の作成法
JP2788506B2 (ja) 文字認識装置
JP2708604B2 (ja) 文字認識方法
JP2938276B2 (ja) 文字認識装置
JP2975720B2 (ja) 光学的文字読取装置
JP2908495B2 (ja) 文字画像抽出装置
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JP2749946B2 (ja) 文字認識方法
JPH11120291A (ja) パタン認識システム
JPH03136182A (ja) 文字切り出し方法
JPS6343788B2 (ja)
JPH0821060B2 (ja) 特徴抽出方法及び特徴抽出装置
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JPH03222082A (ja) 文字認識装置