JP2626084B2

JP2626084B2 - 文字認識装置

Info

Publication number: JP2626084B2
Application number: JP1229313A
Authority: JP
Inventors: 融石河; 浩史吉田; 浩一樋口; 義征山下
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1989-09-06
Filing date: 1989-09-06
Publication date: 1997-07-02
Anticipated expiration: 2012-07-02
Also published as: JPH0392989A

Description

【発明の詳細な説明】（産業上の利用分野）この発明は、複数の字体の文字を含む帳票を高速にか
つ精度よく読み取ることのできる文字認識装置に関する
ものである。

（従来の技術）従来文字認識装置には、例えば特公昭60−38756号公
報に開示されるものがあり、以下の構成要素（ａ）〜
（ｆ）を具備している。

（ａ）文字図形を光電変換して量子化することにより黒
ビット及び白ビットで表されるディジタル信号の原パタ
ーンを作成する。

（ｂ）次に、該原パターン線幅を算出する。

（ｃ）次に、前記原パターンを複数の方向に走査を行な
って各走査列毎の黒ビットの連続個数を検出し、当該黒
ビット連続個数と前記線幅とに基づいて前記複数の走査
方向毎に対応した複数のサブパターンを抽出する。

（ｄ）次に、前記原パターンの文字枠内領域をサブパタ
ーンについて（Ｎ×Ｍ）個の領域（N,Mは定数）に分割
し、該分割された領域内についてセルを単位として黒点
を計数した結果と前記線幅とを基に特徴量を計算する。

（ｅ）次に、該特徴量を文字の大きさで正規化して特徴
マトリクスを作成する。

（ｆ）そして、該特徴マトリクスを予め用意した文字図
形パターンの標準文字マスクと照合して文字図形を認識
する。

この様な文字認識装置において、認識する文字には、
複数の字体を含む帳票、例えば第８図に示すような特定
の単語だけイタリック体で印字されているような英文か
らなるものがある。このイタリック体は、氏名や地名な
どを強調するために使われるものである。この様な場
合、予め認識対象となるすべての字体の標準文字マスク
を辞書マスクとして用意しておき、前記すべての辞書マ
スクと入力文字図形とを照合し、認識を行うという方法
が広く用いられている。

（発明が解決しようとする課題）しかし、上記の方法では、辞書マスクの種類が字体の
数に比例して大きくなり、それが照合回数の増大とな
り、そのため認識速度が大幅に低下し、さらには認識精
度の低下を招くという問題点があった。

この発明が解決しようとする課題は、複数の字体の文
字を含む帳票を高速度で読み取ることができ、さらには
高精度の読取りを可能とする文字認識装置を提供するこ
とにある。

（課題を解決するための手段）この発明に係る文字認識装置は、２値の画像データよ
り入力文字パターンの１文字毎の特徴量を算出し、字体
の判定を行ない、判定した字体に基づき辞書マスクを選
択し、前記選択した辞書マスクにより入力文字パターン
の照合を行なう文字認識装置において、画像データの中
の単語を検出するとともに単語を構成する文字数を検出
する単語検出部と、各文字について文字線を構成する各
画素の座標X,Y及び、定数α，βに与えられる少なくと
も２組の数値により、αＸ＋βＹの最大値及び最小値を
検出しその座標を特徴点とし、前記各文字の特徴点座標
より各文字の幾何学的特徴量を算出する特徴抽出部と、
単語を構成する文字毎の前記幾何学的特徴量により単語
内文字の特徴量を算出し、単語を構成している字体を判
定する字体判定部と、各文字の字体を判定した結果に基
づき照合するための辞書マスクを単語単位に選択する辞
書部とを有することを特徴とするものである。

単語検出部における単語検出は、画像データより文字
間隔を検出し、当該検出された文字間隔の大小に基づき
単語を抽出することによって行うこともできる。

特徴抽出部における幾何学的特徴量の算出は、（α＝
β＝１）及び（α＝1,β＝−１）の２組のα値及びβ値
を用い、所定の画素値を有する画素の座標に対するＸ＋
Ｙ及びＸ−Ｙの最大値及び最小値を検出し、前記検出さ
れた最大値及び最小値を与える特徴点座標に基づき行な
ってもよい。

特徴抽出部における幾何学的特徴量の算出は、Ｘ＋Ｙ
の最大値のＸ座標をBRX、最小値のＸ座標をTLX、Ｘ−Ｙ
の最大値のＸ座標をTRX、最小値のＸ座標をBLXとし、k,
p,qを任意の定数として、ｆ＝ｋ｛ｐ（TLX−BLX）＋ｑ（TRX−BRX）｝により幾何学的特徴量を算出することを含む。

字体判定部における単語内文字の特徴量の算出は、単
語を構成する文字毎の幾何学的特徴量をfi、単語の文字
数をｒとし、の演算を行ない特徴量Ｆを得ることであってもよい。

また、字体判定部で判定する字体が、明朝体等の標準
体型文字とイタリック体等の斜体型文字とすることがで
きる。

（作用）単語検出部では、２値の画像データの中の単語を検出
するとともに、単語の中に含まれる文字数も検出してお
く。このとき、画像データの文字間隔を検出し、この検
出された文字間隔の大小に基づき、単語の区切りを判断
し、単語を検出することができ、１つの単語内での文字
間隔の数により文字数を抽出する。一方、特徴抽出部
は、１文字ごとの画像データを走査し、その座標X,Yに
少なくとも２組の定数α，βをかけ、αＸ＋βＹを計算
する。各画素についてこの計算を行ない、１文字内の最
小値及び最大値を検出し、その最大値及び最小値を示す
座標を特徴点とする。この特徴点としては前記αＸ＋β
Ｙの最大値、最小値の少なくとも４個が得られ、これら
から幾何学的特徴量を算出する。定数α、βの第１組
が、α＝β＝１で、第２組がα＝1,β＝−１にすると、
αＸ＋βＹはＸ＋Ｙと、Ｘ−Ｙとの２組が得られる。Ｘ
＋Ｙの最大値は、１文字内において文字線の右下の座標
点で現れ、最小値は左上の座標点で現れる。また、Ｘ−
Ｙの最大値は、１文字内において右上の文字線の座標点
で現れ、最小値は左下の座標点で現れる。これらのＸ座
標を示すと、それぞれBRX,TLX,TRX及びBLXであり、次に
示す式で幾何学的特徴量を算出するものである。

ｆ＝ｋ｛ｐ（TLX−BLX）＋ｑ（TRX−BRX）｝この幾何学的特徴量ｆは、１文字の傾き程度の特徴を
表している。

字体判定部では特徴抽出部からの幾何学的特徴量を、
単語検出部からの単語構成文字数分だけ受け入れ、単語
内文字の特徴量を算出し、その単語の字体を判定する。
このとき単語内文字の特徴量の算出は次の式で行なうも
のである。

ここで、ｒは単語を構成する文字数、fiはｉ番目文字
の幾何学的特徴量である。

この特徴量Ｆは単語内の幾何学的特徴量ｆの平均値に
よって与えられ、単語全体の文字の字体の特徴を表すも
のである。字体判定部において、この特徴量Ｆに対応し
た字体を判定する。例えば、判定対象の字体としては、
明朝体等の標準体型文字とイタリック体等の斜体型文字
がある。

辞書部では字体判定部の判定結果により、照合するた
めの辞書マスクを選択する。この辞書選択は、単語単位
で行ない、そのため高速で処理することができ、高精度
で文字認識処理をすることができる。

（実施例）以下、本発明に係る文字認識装置の実施例を、図面を
参照して説明する。

［各部の機能説明］第１図は文字認識装置の１実施例の機能ブロック図で
ある。第１図において、101は光信号Ｓを電気信号に変
換する光電変換部、102は前記光電変換部101からの行画
像データを格納するラインバッファ、103は行画像デー
タの入力文字パターンおよび文字間隔を計数する文字切
り出し部、104は前記文字切り出し部103からの入力文字
パターンを格納するパターンメモリ、105は前記文字切
り出し部103からの文字入力パターンより各文字の幾何
学的特徴量を算出する特徴抽出部、106は行画像データ
の中の単語を検出する単語検出部、107は単語を構成し
ている字体を判定する字体判定部、108は判定した字体
の辞書マスクを単語単位に選択する辞書部、109は選択
した辞書マスクにより入力パターンの照合認識をする認
識部、110は出力端子であり、例えばコンピュータ等の
外部機器のデータ入力端子等に接続されるものであり、
文字認識の結果得られた文字名（例えばJISの文字コー
ド）を出力するものである。

まず認識対象文字の入力文字パターンを切り出すこと
につき説明する。

光電変換部101は、文字、図形等（以下、文字と称す
る。）が記載された帳票等の媒体の文字行領域の光信号
（第１図のＳ）を入力する。ここで、文字行領域とは、
帳票上における文字が記載される１行分の領域をいう。
入力した光信号は光電変換され、文字線部を画素値
「１」の黒ビット及び背景部を画素値「０」の白ビット
として各画素ごとに２値のディジタル信号で表現した行
画像データを得て、ラインバッファ102に格納される。

ラインバッファ102は入力文字パターンの行画像デー
タにおける各画素の２値信号をこの文字行領域の２次元
座標通りに再現できる形式で記憶し、例えば128×4,096
画素の大きさを持っているものである。

文字切り出し部103はラインバッファ102から行画像デ
ータを読み込み、縦方向に走査を行ない、黒ビットの分
布を作成する。黒ビットの分布の０から１以上に変化す
るビットより、１以上から０に変化する直前のビットま
でを１つの文字予定領域とし、入力文字パターンを得
る。得られた入力文字パターンは、パターンメモリ104
に格納されるとともに、特徴抽出部105に出力される。

また、黒ビットの分布の１以上から０に変化するビッ
トより、０から１以上に変化する直前のビットまでの画
素数を文字間隔として計数し、その画素数を単語検出部
106に出力する。

次に単語検出部106における行画像データから単語を
検出することにつき説明する。

単語検出部106は、文字切り出し部103から出力される
文字間隔により単語を検出し、１単語中の文字数ｒを字
体判定部107及び認識部109へ出力する。

第２図は単語検出部106の構成を示す機能ブロック図
である。21は比較回路、22はカウンタ、23は閾値レジス
タである。文字切り出し部103から出力される文字間隔
は、出力される毎に予め入力されている閾値レジスタ23
内の閾値と、比較回路21において比較が行なわれる。１
文字の比較が終了し、文字間隔よりも閾値が大きい場合
は、カウンタ22の数を１増す。文字間隔が閾値よりも大
きい場合は又は等しい場合は、比較を行なった文字間隔
の直前の文字までを１単語とし、その時点でのカウンタ
22の数ｒを単語を構成する文字数として字体判定部107
及び認識部109へ出力し、カウンタ22を１に再設定す
る。なお、カウンタ22の初期設定は１である次に入力文字パターンがパターンメモリ104に格納さ
れることにつき説明する。

パターンメモリ104は、入力文字パターンの文字予定
領域における各画素の信号をこの領域の２次元座標通り
に再現できる形式で記憶し、入力文字パターン１文字あ
たり128×128画素の大きさで構成される単語を記憶でき
るものである。パターンメモリ104に格納されている入
力文字パターンは、識別部109に読み込まれる。

次に、入力文字パターンの特徴より算出される特徴値
を出力することについて説明する。

特徴抽出部105は文字切り出し部103から出力される入
力文字パターンの特徴値を算出し、字体判定部107に幾
何学的特徴量として特徴値を出力する。

第３図は特徴抽出部105の構成を示す機能ブロック図
である。

同図において、39は文字切り出し部103から出力され
る認識対象となる入力文字パターンの画像データであ
る。この実施例の特徴抽出部105は、前記画像データ39
の画素にＸ座標を付与するためのＸ座標発生手段30と、
前記画像データ39の画素にＹ座標を付与するためのＹ座
標発生手段32と、前記X,Y座標とα及びβに与えられる
少なくとも２組の特定の数値とを用いて、入力文字パタ
ーンの画素に関する最大及び最小計算値を与える入力文
字パターンの画素のX,Y座標を夫々特徴点座標として出
力するための座標検出手段34,36と、入力文字パターン
の特徴抽出を行うための幾何学的特徴量を特徴点座標に
基づき算出する特徴量算出手段38とを備えている。

また、座標検出手段34は、計算値αＸ＋βＹを算出す
る計算手段341と、最大計算値を検出するための最大値
検出手段342と、最大計算値を与える画素のX,Y座標を保
存するための最大値座標保存手段343と、最小計算値を
検出するための最小値検出手段344と、最小計算値を与
える画素のX,Y座標を保存するための最小値座標保存手
段345とを備えている。座標検出手段36もまた前記座標
検出手段34と同様、計算手段361と最大値検出手段362と
最大値座標保存手段363と最小値検出手段364と最小値座
標保存手段365とを備えている。

この実施例では、（α＝β＝１）及び（α＝１、β＝
−１）の２組のα及びβ値を用い、Ｘ＋Ｙ及びＸ−Ｙに
関する最大及び最小計算値を与える画素の座標より、入
力文字パターンの特徴値を算出し、字体判定部107に計
算値を出力するので、２個の座標検出手段34,36を備え
る構成となっている。座標検出手段34にあっては計算値
Ｘ＋Ｙに関する、及び座標検出手段36にあっては計算値
Ｘ−Ｙに関する、最大及び最小計算値を与える画素の座
標を検出する。

以下に特徴抽出部105について最大及び最小座標検出
を、第３図と、第４図及び第５図を用いて説明する。第
４図は本実施例における最大値座標検出の説明に供する
動作流れ図、第５図は本実施例における最小値座標検出
の説明に供する動作流れ図である。

I;座標検出手段34に着目した説明（Ｘ＋Ｙの最大値及び
最小値検出動作の説明）＊ステップ（１）〜（３）文字切り出し部103より出力される（ステップ
（１））入力文字パターンは、画素毎に最大値検出手段
342及び最小値検出手段344に入力される。

これとともに、Ｘ座標発生手段30及びＹ座標発生手段
32は、前記画像データ39の出力と同期させてこの画像デ
ータ39のそれぞれの画素毎に対応付けたX,Y座標を発生
する。その結果これら発生手段30,32によって前記画像
データ39にX,Y座標の付与が行われる。出力されたX,Y座
標はＸ＋Ｙ計算手段341、最大値座標保存手段343及び最
小値座標保存手段345に入力される。（ステップ
（２））Ｘ＋Ｙ計算手段341はX,Y座標を入力するとこれらX,Y
座標から計算値Ｘ＋Ｙを算出し、算出した計算値を最大
値検出手段342及び最小値検出手段344に対し出力する。
（ステップ（３））ステップ（２）〜（３）によって、最大値検出手段34
2は前記画像データ39及び計算値を、最小値検出手段344
は前記画像データ39及び計算値を、最大値座標保存手段
343はX,Y座標を、最小値座標保存手段345はX,Y座標を、
それぞれ１画素毎に入力する。そして、座標検出手段34
は後述のステップ（４）、（5a）〜（６）、（5b）〜
（６）或いは（７）の判断を１画素毎に繰返し行ない、
その判断結果に応じた動作を行なう。

＊ステップ（４）最大値検出手段342及び最小値検出手段344は、入力さ
れた前記画像データ39の画素が入力文字パターンの画素
であるか否かを判断する。この判断は、入力された画素
の画素値が入力文字パターンを意味する所定の画素値
（この実施例では画素値「１」）であるか否かを判断す
ることによって、行なわれる。

＊ステップ（５）所定の画素値を有するとき、最大値検出手段342は所
定の比較値と前記計算値との比較を行ない（ステップ
（5a））、最小値検出手段344は別の所定の比較値と前
記計算値との比較を行なう（ステップ（5b））。

＊ステップ（5a）〜（６）計算値が比較値よりも大きいとき最大値検出手段342は先に格納されている比較値に代
えて、比較値よりも大きい計算値を新たな比較値とし格
納し（比較値の書換え）、これとともにセットパルスを
最大値座標保存手段343に対し出力する。セットパルス
を入力した最大値座標保存手段343は格納されているX,Y
座標に代えて、比較値よりも大きな計算値を与える画素
のX,Y座標を新たに格納する（X,Y座標の書換え）。

計算値が比較値よりも小さいか或いは比較値と等しい
とき最大値検出手段342は先に格納されている比較値を書
換えずにそのまま格納するとともに、最大値座標保存手
段322は格納されているX,Y座標を書換えない。

最大値検出手段342は及びのいずれの場合もステ
ップ（5a）の次にステップ（７）の判断を行なう。

なお、最大検出手段342に格納される比較値の初期値
としては、例えば計算値αとして取り得る値よりも小さ
な値を用いれば良い。例えばα＝β＝１であり、前記画
像データをｌ行ｍ列の画素に分割し、０≦Ｘ≦ｍ−１、
及び０≦ｌ−１とした場合には、例えば−１を比較値の
初期値とすることができる。或いは比較値の初期値とし
て最大値検出手段342に一番最初に入力された計算値α
Ｘ＋βＹを用いるようにしても良い。

また、最大値検出手段342において、比較値及びX,Y座
標の書換えを計算値αＸ＋βＹが比較値よりも大きいと
き及び計算値が比較値と等しいときに行なうようにし、
これとともに計算値が比較値よりも小さいとき比較値及
びX,Y座標の書換えを行なわないようにしても良い。

また、最大値座標保存手段343のX,Y座標としては任意
好適な数値を用いて良い。

＊ステップ（5b）〜６計算値が比較値よりも小さいとき最小値検出手段344は先に格納されている比較値に代
えて比較値よりも小さい計算値を比較値として新たに格
納する（比較値の書換え）とともに、最小値座標保存手
段345に対しセットパルスを出力する。最小値座標保存
手段345はセットパルスを入力すると、格納されている
X,Y座標を比較値よりも小さな計算値を与える画素のX,Y
座標に書換える（X,Y座標の書換え）。

計算値が比較値よりも大きいか或いは比較値と等しい
とき最小値検出手段344は先に格納されている比較値を書
換えずにそのまま格納するとともに、最小値座標保存手
段322に格納されているX,Y座標を書換えない。

最小値検出手段344は及びのいずれの場合にもス
テップ（5b）の次にステップ（７）の判断を行なう。

なお、最小値検出手段344に格納される比較値の初期
値としては、例えば計算値αＸ＋βＹとし取り得る値よ
りも大きな値を用いれば良い。例えばα＝β＝１であ
り、画像データをｌ行ｍ列の画素に分割し、０≦Ｘ≦ｍ
−１、及び０≦Ｙ≦ｌ−１となる場合には、例えばｍ＋
ｎ−１を比較値の初期値とすることができる。或いは比
較値の初期値として最小値検出手段344に一番最初に入
力された計算値αＸ＋βＹを用いるようにしても良い。

また、最小値検出手段344は計算値が比較値よりも小
さいとき及び計算値が比較値と等しいとき比較値及びX,
Y座標の書換えを行ない、これとともに計算値が比較値
よりも大きいとき比較値及びX,Y座標の書換えを行なわ
ないようにしても良い。

また最小値座標保存手段345のX,Y座標としては任意好
適な数値を用いて良い。

＊ステップ（７）画像データ39の走査が終了か、否かを判断する。

画像データ39の走査が終了しないとき座標検出手段334は、前記画像データ39の走査が終了
せず従って画像データ39のすべての画素につき処理が終
了していなければ、画素データ39の残りの画素につきス
テップ（４）、（5a）〜（６）、（5b）〜（６）或いは
（７）の判断を行ない。その判断結果に応じて動作す
る。

画像データ39の走査を終了したときステップ（８）に移る。

＊ステップ（８）最大値検出手段342及び最小値検出手段344は画像デー
タ39の走査が終了し画像データ39の全ての画素につき処
理が終了すると、X,Y座標の出力信号を最大値座標保存
手段343及び最小値座標保存手段345に対して出力する。
この出力信号を入力した座標保存手段343,345は、格納
しているX,Y座標を特徴点座標として出力する。これと
ともに最大値検出手段342、及び最小値検出手段344は比
較値の初期化を行なう。

全ての画素につき処理を終了した時点で、最大値座標
保存手段343及び最小値座標保存手段345に格納されてい
るX,Y座標が最大及び最小計算値を与える画素のX,Y座標
すなわち特徴点座標となる。

座標検出手段34にあっては、α＝β＝１としたので、
全処理終了時点で例えば第６図に示す入力文字パターン
72の特徴点BRの座標が最大値座標保存手段343に格納さ
れており、また特徴点TLの座標が最小値座標保存手段34
5に格納されている。

II;座標検出手段36に着目した説明（Ｘ−Ｙの最大値、
最小値検出動作の説明）座標検出手段36は、上述した座標検出手段34の動作と
並行して座標検出手段34と同様の動作を行なうので、こ
の検出手段36の動作説明を省略する。

座標検出手段36にあっては、α＝１及びβ＝−１とし
たので、全ての画素につき処理を終了した時点で、例え
ば第６図に示す入力文字パターン72の特徴点TRの座標が
最大値座標保存手段363に格納されており、また特徴点B
Lの座標が最小値座標保存手段365に格納されている。

特徴量算出手段38では、入力文字パターンの特徴点T
L,BL,TR及びBRの座標を用い、幾何学的特徴量として特
徴値fiを式（１）により算出する。

なお、式（１）において特徴点TL,BL,TR,BRのＸ座標
をTLX,BLX,TRX,BRXとして表す。

fi＝ｋ｛ｐ（TLX−BLX）＋ｑ（TRX−BRX）｝（１）式（１）中k,p,qは任意の定数であり、ｉは単語内の
文字の番号であり、１からｒまでである。

式（１）により算出される特徴値fiは、字体判定部10
7に順次出力される。

次に字体判定部107により字体を判定し、辞書を選択
することにつき説明する。

字体判定部107は特徴抽出部105で算出される特徴値fi
を順次累積しておき、単語内の文字の特徴値fiよる平均
特徴値Ｆを算出し、単語内の字体を判定する。

式（２）中ｒは単語検出部106より出力されるカウン
タ22の数である。

式（２）により算出される単語内の平均特徴値Ｆの下
記の式（３）による条件により、単語内の字体を判定
し、辞書部108に字体判定信号Ｔを出力する。

式（３）中Ｃは固定閾値であり、任意に変えることが
できる。

なお、本実施例では、出力する字体判定信号Ｔは、
「１」、「２」の２種であるが、字体判定信号Ｔは２種
以外のものとなっても何らさしつかえない。

字体判定部106により出力された字体判定信号Ｔは、
辞書部108へ出力され、字体判定信号Ｔに対応する辞書
を選択する。

第７図は辞書部108の構成例を示す機能ブロック図で
ある。辞書部108は、辞書選択部60、第１の辞書マトリ
クス61、第２の辞書マトリクス62とを備える。本実施例
では辞書マトリクスは２つであるが、これは３つ以上で
あっても何等さしつかえない。辞書選択部60は字体判定
部107から出力される字体判定信号Ｔ＝1,T＝２に対応し
てそれぞれ、第１の辞書マトリクス61又は第２の辞書マ
トリクス62を選択し、当該辞書マトリクスを識別部109
に対して出力する。

次に識別部109により入力文字パターンを識別し、結
果を出力することにつき説明する。

識別部109はパターンメモリ104より、単語検出部106
より出力されるカウンタ22の数ｒに相当する入力文字パ
ターンを順次読み込み、この入力文字パターンについて
特徴処理及び入力文字パターンの認識を行なう。

この特徴抽出の方法は、従来公知の種々の方法を用い
ることができるが、この実施例の場合、以下に説明する
ような方法で行なう。

先ず、入力パターンについて外接する方形枠を検出
し、これを文字枠とする。さらに当該入力文字パターン
について線幅Ｗを算出する。この線幅算出は、例えば下
記に示すような周知の近似式（４）を用いて行なうこと
ができる。

Ｗ＝1/｛１−（Q/A）｝（４）但し、式（４）において、Ｑは、入力文字パターンを
構成する各点をこれらの点が（２×２）個づつの範囲で
見られる窓で分けたとき、この窓内の全ての点が黒ビッ
トとなる窓の個数であり、また、Ａは文字枠内の黒ビッ
トの個数である。

さらに、この入力文字パターンを複数の方向に走査を
行なって各走査列毎の黒ビットの連続個数を検出し、こ
の黒ビット連続個数と上述の線幅とに基づいて上述の複
数の方向毎に対応したサブパターンの文字枠内領域をサ
ブパターンについて（Ｎ×Ｍ）個の領域（N,Mは定数）
に分割し、さらに、各領域内の文字線長を表す特徴量
を、文字を分割した領域毎に計算し、この特徴量を文字
枠の大きさで正規化して特徴マトリクスを得る。この実
施例では、特徴量を、（ΔＸ＋ΔＹ）/2なる値で除する
ことによって正規化する。ここで、ΔＸは文字枠の水平
方向長さ、ΔＹは垂直方向長さである。

識別部109は、このようにして抽出した特徴マトリク
スと辞書部108より出力される単語単位に選択される辞
書マトリクスとの照合を行ない、最も類似度が大きな値
を示した辞書マトリクスに対応する文字名（JISコード
等）を出力端子110を介して外部装置に出力する。

なお、この実施例の場合上述した類似度は、以下に示
す式（５）に基づいて求めている。

但し、式（５）において、Ｒは類似度、hiは入力文字
パターンより抽出した特徴マトリクス、giは辞書内に格
納させてある辞書マトリクスをそれぞれ示し、また、ｉ
＝1,2,3,…,N×Ｍである。

［具体的帳票を用いた動作例］次に具体的帳票を用いた場合の動作を説明する。

先ず、文字が記された例えば第８図に示すような帳票
は、画像データＳとして光電変換部101に入力される。
光電変換部101では、帳票の各文字行領域を検出し、行
単位で２値のディジタル画像データに光電変換し、ライ
ンバッファ102に格納する。前記行領域の検出は、本実
施例では、予め光電変換部101に設定されている第９図
（ａ）に示す入力書式テーブルを参照して順次行なうも
のとする。前記入力書式テーブルには第９図（ｂ）に示
すように第１行目の行領域の帳票の上端及び左端からの
距離、行領域の大きさ、行ピッチ及び行数が記録されて
いる。

第10図（ａ）にラインバッファ102に格納されている
２値のディジタル信号である行画像データ、第10図
（ｂ）にその行画像データの黒ビットの分布を示す。ラ
インバッファ102から読み込まれた２値のディジタル信
号である行画像データは、文字切り出し部103で黒ビッ
トの分布の０から１以上に変化するビットより１以上か
ら０へ変化するまでを文字予定領域として行画像データ
から検出し、128×128画素の入力文字パターンを抽出す
る。この入力文字パターンは、１文字ごとに、パターン
メモリ104に格納されるとともに、特徴抽出部105へ出力
される。

さらに、文字切り出し部103で黒ビットの分布の１以
上から０に変化するビットより０から１以上へ変化する
ビットまでを文字間隔とし、白ビットの数を計数して単
語検出部106へ出力する。第10図（ｃ）に本実施例にお
ける行画像データからの各文字間隔のビット数を示す。
計数された文字間隔は、単語検出部106の比較回路21に
より、閾値レジスタ23に入力されている閾値と比較を行
なう。本実施例では閾値レジスタ23に設定されている閾
値は「20」である。文字間隔と閾値との比較を行ない、
文字間隔が閾値より小さい場合はカウンタ22の数ｒを１
増やす。

また、文字間隔が閾値より大きい場合又は等しい場合
は、その場所を単語の区切りとし、前回の比較を行なっ
たまでのカウンタ22の数ｒを字体判定部107及び識別部1
09へ出力し、カウンタ22を初期値の１に再設定する。本
実施例における第10図の例では、２文字目と３文字目の
間隔が25であり、閾値20を越えるので、“MY"が単語と
して検出され、カウンタ22の数ｒが２となり、これを単
語を構成する文字数とする。

また、文字切り出し部103により出力される入力文字
パターンは、特徴抽出部105において入力文字パターン
の128×128画素にＸ座標及びＹ座標をそれぞれ付与し、
入力文字パターンの画素に関する最大及び最小の計算値
αＸ＋βＹを検出し、これら最大及び最小計算値を与え
る特徴点座標を抽出する。第６図（ａ）に第８図に示す
帳票上の標準タイプ文字の先頭である“M"及び第６図
（ｂ）に第８図に示す帳票上のイタリックタイプ文字の
先頭である“K"の入力文字パターン及び特徴点座標を示
してある。

本実施例では、特徴点を検出するためのα及びβは
（α＝１、β＝１）と（α＝１、β＝−１）の２組と
し、前記計算値による特徴点座標は第６図（ａ）では、
TL＝（0,0）,BL＝（0,47）,TR＝（42,0）,BR＝（42,4
7）、第６図（ｂ）では、TL＝（8,0）,BL＝（0,47）,TR
＝（42,0）,BR＝（35,47）である。前記特徴点座標によ
り、式（１）を用いて特徴値ｆを算出する。このとき、
本実施例では、定数k,p,qはそれぞれ（ｋ＝1/2,p＝1,q
＝１）であり、また固定閾値はＣ＝４である。前記条件
により算出される特徴値ｆは、第６図（ａ）の“M"の例
（標準体）ではｆ＝０であり、第６図（ｂ）の“K"の例
（イタリック体）ではｆ＝7.5である。この例に示すよ
うに標準体においては、ｆは小さな値を、イタリック体
においてはｆは大きな値となる。第10図（ｄ）に第８図
に示す帳票上における各文字の特徴値ｆを示す。

算出された特徴値ｆは単語検出部106よりカウンタ22
の数ｒが出力されるまで、順次字体判定部107に出力さ
れ、加算される。本実施例では、初めに検出される単語
は“MY"であり、単語検出部106より出力される。カウン
タ22の数はｒ＝２であり、前記算出された単語“MY"の
１文字目の入力文字パターン“M"の特徴値f1＝０及び単
語“MY"の２文字目の入力パターン“Y"の特徴値f2＝0.5
について、式（２）を適用することにより平均特徴値Ｆ
＝0.25が算出される。この平均特徴値Ｆは、辞書部108
へ出力される。従って式（３）により、単語内の字体判
定信号Ｔ＝２が辞書部108へ出力される。本実施例で
は、第８図に示す帳票が入力されたとき、第10図（ｅ）
に示すような平均特徴値が単語毎にそれぞれ算出され、
Ｆ＜Ｃの単語である“MY",“NAME",“IS"は、字体判定
信号Ｔ＝２が辞書部108へ出力され、第２の辞書マトリ
クス62を選択する。単語“KEN"の平均特徴値Ｆは、Ｆ＝
7.17が算出され、Ｆ≧Ｃとなり、字体判定信号Ｔ＝１が
辞書部108へ出力され、これにより第１の辞書マトリク
ス61を選択する。

認識部109は文字切り出し部103から出力された入力文
字パターンを格納しているパターンメモリ104より１つ
の単語を構成している文字数に相当するカウンタ22の数
ｒ文字分づつ順次読み込む。パターンメモリ104から読
み込まれる入力文字パターンの水平、垂直、右斜め、左
斜めの４方向について、サブパターンを線幅に基づき抽
出し、それぞれのサブパターンを文字枠内領域について
Ｎ×Ｍに分割する。本実施例では５×５である。各領域
において、文字線長を表す特徴量を計算し、特徴マトリ
クスを得る。この特徴マトリクスと、第11図（ａ）及び
第11図（ｂ）に示すような辞書マトリクスとの照合を行
なう。ここで、第11図（ａ）の辞書マトリクスは第６図
の第２の辞書マトリクス62に対応する標準タイプであ
り、第11図（ｂ）の辞書マトリクスは第６図の第１の辞
書マトリックス61に対応するイタリックタイプ文字のも
のである。この照合で最も類似度が大きい値を示した辞
書マトリクスに対応する文字名（JISコード等）を出力
端子110を介して外部装置に出力し、例えば、図示しな
いディスプレイ上に、JISコード及びJISコードに対応す
るキャラクターが第10図（ｆ）のように表示される。

（発明の効果）以上、詳細に説明したようにこの発明に係る文字認識
装置によれば、帳票上の各文字間隔を検出し、単語を抽
出するとともに各文字の文字線を有する各画素に対し
て、２組の最大及び最小値を計算し、特徴点座標を抽出
し、単語を構成する各文字の幾何学的特徴量を算出し、
その各文字の幾何学的特徴量を用いて演算を行なって、
単語における特徴量を算出することにより、単語毎の標
準体やイタリック体等の字体の判定を行ない、当該判定
結果に基づき、照合するための辞書マスクを単語毎に選
択している。従って、照合は選択された辞書マスクとの
み行なうため、照合に要する時間が短くなり、複数の字
体を含む帳票も高速に精度良く読み取ることが可能な文
字認識装置を提供することができる。

【図面の簡単な説明】

第１図から第11図は本発明に係る文字認識装置を説明す
るための図面であり、第１図は文字認識装置の実施例の
機能ブロック図、第２図は単語検出部106の構成を示す
機能ブロック図、第３図は特徴抽出部105の構成を示す
機能ブロック図、第４図は本実施例における最大値座標
検出の説明に供する動作流れ図、第５図は本実施例にお
ける最小値座標検出の説明に供する動作流れ図、第６図
（ａ），（ｂ）は特徴点座標検出の原理図、第７図は辞
書部108の構成例を示す機能ブロック図、第８図は実施
例に用いる帳票の説明図、第９図（ａ）は入力書式テー
ブルの例を示す図、第９図（ｂ）は入力書式テーブルの
説明図、第10図（ａ）は本実施例に用いる２値の行画像
データの説明図、第10図（ｂ）は行画像データの黒ビッ
トの分布の説明図、第10図（ｃ）は文字間隔のビット数
の説明図、第10図（ｄ）は入力文字パターンの特徴値ｆ
の説明図、第10図（ｅ）は入力文字パターンの単語内の
平均特徴値Ｆの説明図、第10図（ｆ）は認識結果を示す
図、第11図（ａ）、（ｂ）はそれぞれローマン字体の標
準タイプとローマン字体のイタリックタイプの標準文字
パターンとその文字の辞書マトリクスの説明図である。 101……光電変換部、102……ラインバッファ、103……
文字切り出し部、104……パターンメモリ、105……特徴
抽出部、106……単語検出部、107……字体判定部、108
……辞書部、109……認識部。

Claims

(57)【特許請求の範囲】

【請求項１】画像データより得る入力文字パターンの１
文字毎の特徴量を算出し、字体の判定を行ない、判定し
た字体に基づき辞書マスクを選択し、前記選択した辞書
マスクにより入力文字パターンの照合を行なう文字認識
装置において、画像データの中の単語を検出するとともに単語を構成す
る文字数を検出する単語検出部と、各文字について文字線を構成する各画素の座標X,Y及
び、定数α，βに与えられる少なくとも２組の数値によ
り、αＸ＋βＹの最大値及び最小値を検出しその座標を
特徴点とし、前記各文字の特徴点座標より各文字の幾何
学的特徴量を算出する特徴抽出部と、単語を構成する文字毎の前記幾何学的特徴量により単語
内文字の特徴量を算出し、単語を構成している字体を判
定する字体判定部と、各文字の字体を判定した結果に基づき照合するための辞
書マスクを単語単位に選択する辞書部とを有することを
特徴とする文字認識装置。
【請求項２】単語検出部における単語検出は、画像デー
タより文字間隔を検出し、当該検出された文字間隔の大
小に基づき、単語を抽出することを特徴とする請求項第
１項記載の文字認識装置。
【請求項３】特徴抽出部における幾何学的特徴量の算出
は、（α＝β＝１）及び（α＝1,β＝−１）の２組のα
値及びβ値を用い、所定の画素値を有する画素の座標に
対するＸ＋Ｙ及びＸ−Ｙの最大値及び最小値を検出し、
前記検出された最大値及び最小値を与える特徴点座標に
基づき行なうことを特徴とする請求項第１項記載の文字
認識装置。
【請求項４】特徴抽出部における幾何学的特徴量の算出
は、Ｘ＋Ｙの最大値のＸ座標をBRX、最小値のＸ座標をT
LX、Ｘ−Ｙの最大値のＸ座標をTRX、最小値のＸ座標をB
LXとし、k,p,qを任意の定数として、ｆ＝ｋ｛ｐ（TLX−BLX）＋ｑ（TRX−BRX）｝により幾何学的特徴量を算出することを特徴とする請求
項第３項記載の文字認識装置。
【請求項５】字体判定部における単語内文字の特徴量の
算出は、単語を構成する文字毎の幾何学的特徴量をfi、
単語の文字数をｒとし、の演算を行ない特徴量Ｆを得ることを特徴とする請求項
第１項、第２項、第３項又は第４項記載の文字認識装
置。
【請求項６】字体判定部で判定する字体が、明朝体等の
標準体型文字とイタリック体等の斜体型文字とであるこ
とを特徴とする請求項第１項、第２項、第３項、第４項
又は第５項記載の文字認識装置。