JP2827288B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2827288B2
JP2827288B2 JP1160937A JP16093789A JP2827288B2 JP 2827288 B2 JP2827288 B2 JP 2827288B2 JP 1160937 A JP1160937 A JP 1160937A JP 16093789 A JP16093789 A JP 16093789A JP 2827288 B2 JP2827288 B2 JP 2827288B2
Authority
JP
Japan
Prior art keywords
value
character
coordinates
coordinate
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1160937A
Other languages
English (en)
Other versions
JPH0327488A (ja
Inventor
融 石河
浩史 吉田
浩一 樋口
義征 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP1160937A priority Critical patent/JP2827288B2/ja
Publication of JPH0327488A publication Critical patent/JPH0327488A/ja
Application granted granted Critical
Publication of JP2827288B2 publication Critical patent/JP2827288B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、複数の字体の文字を含む帳票でも高速にか
つ精度よく読取ることのできる文字認識装置に関するも
のである。
(従来の技術) 従来、文字認識装置においては、例えば、特公昭60-3
8756号公報に開示されるものがあり、以下の構成要素
(a)〜(f)を具備して構成される。
(a) 文字図形を光電変換して量子化することにより
黒ビット及び白ビットで表わされるディジタル信号の原
パターンを作成する。
(b) 次に、該原パターンの線幅を算出する。
(c) 次に、前記原パターンを複数の方向に走査を行
って各走査列毎の黒ビットの連続個数を検出し、当該黒
ビットと連続個数を検出し、当該黒ビット連続個数と前
記線幅とに基づいて前記複数の走査方向毎に対応した複
数のサブパターンを抽出する。
(d) 次に、前記原パターンの文字枠内領域をサブパ
ターンについて(XN×YM)個の領域(XN,YMは定数)に
分割し、該分割された領域内についてセルを単位として
黒点を計数した結果と各サブパターンの線幅とを基に特
徴量を計算する。
(e) 次に、該特徴量を文字の大きさで正視化して特
徴マトリクスを作成する。
(f) そして、該特徴マトリクスを予め用意した文字
図形パターンの標準文字マスクと照合して文字図形を認
識する。
このような文字認識装置において、複数の字体を含む
帳票、例えば第9図に示すような氏名や地名などを強調
するため特定の単語だけイタリック体で印字されている
ような英文を認識する場合、予め認識対象となる全ての
字体の標準文字マスクを辞書マスクとして用意してお
き、前記全ての辞書マスクと入力文字図形を照合し、認
識を行う、という方法が広く用いられている。
(発明が解決しようとする課題) しかしながら、上記従来の方法では、辞書マトリクス
の数が字体の数に比例して大きくなり従って照合回数が
増大し、認識速度が大幅に低下し、更には認識精度の低
下を招くという問題点があった。
本発明はこれらの問題点を解決するためのもので、高
速に複数の字体を含む帳票を読取ることができ、更には
高精度の読取り可能とする文字認識装置を提供すること
を目的とする。
(課題を解決するための手段) 本発明は前記問題点を解決するために、媒体上の特徴
抽出対象を光電変換し量子化された画像データを得、該
画像データより1文字づつの文字パターンを切り出し、
当該切り出された入力文字パターンの字体の判定を行な
い、判定結果に基づいて認識辞書マスクの選択を行な
い、選択された辞書マスクを用いて入力文字パターンの
照合を行ない、文字を認識する文字認識装置において、
1文字づつ切り出された入力文字パターンの画像データ
の画素にX座標を付与するX座標発生手段と、1文字づ
つ切り出された入力文字パターンの画像データの画素に
Y座標を付与するY座標発生手段と、X,Y座標と少なく
とも2組の特定のα値及びβ値とを用いて所定の画素値
を有する入力文字パターンの画素に関する最大及び最小
の計算値αX+βYを検出し、これら最大及び最小計算
値を与える入力文字パターンの画素のX,Y座標を検出す
る座標検出手段と、検出されたX,Y座標を用いて、座標
間の距離、傾き等に基づく幾何学的な特徴量を算出する
特徴量算出手段とを有し、該特徴量算出手段により算出
された特徴量の大きさにより、字体の判定を行なう字体
判定部と、 判定された字体に対応する認識辞書マスクを選択する
辞書部と、 選択された辞書マスクを用いて入力文字パターンの照
合を行ない、文字を識別する識別部とを具備することに
特徴がある。
(作用) 以上のような構成を有する本発明によれば、1文字づ
つ切り出された入力文字パターンの画像データの画素に
X座標及びY座標を付与して入力文字パターンをX−Y
座標系で表現する。そしてX,Y座標と少なくとも2組の
特定のα値及びβ値とを用いて所定の画素値を有する入
力文字パターンの画素に関する最大及び最小の計算値α
X+βYを検出し、これら最大及び最小計算値を与える
入力文字パターンの画素のX,Y座標を検出する。検出さ
れたX,Y座標を用いて、座標間の距離、傾き等に基づく
幾何学的な特徴量を算出する。算出された特徴量の大き
さにより、字体の判定を行なう。判定された字体に対応
する認識辞書マスクが選択される。選択された辞書マス
クを用いて入力文字パターンの照合を行ない、入力文字
は識別される。 したがって、本発明は前記問題点を解
決でき、高速に複数の字体を含む帳票を読取ることがで
き、更には高精度の読取り可能とする文字認識装置を提
供できる。
(実施例) 以下、本発明の一実施例を図面に基づいて説明する。
第1図は本発明の一実施例を示すブロック図である。
同図において、10は文字認識装置、11は光電変換部、12
はラインバッファ、13は文字切り出し部、14はパターン
レジスタ、15は字体判定部、16は辞書部、17は識別部、
18は出力端子である。なお、出力端子18は、例えばコン
ピュータ等の外部機器のデータ入力端子等に接続される
ものであり、文字認識の終了した文字名(例えばJISの
文字コード)を出力するものである。
第2図(a)は文字行領域における2値画像データを
示す図、第2図(b)は2値画像データによる周辺分布
を示す図、第2図(c)は入力文字パターンの特徴値F
を示す図、第2図(d)は入力文字パターンに対する認
識結果を示す図である。
第3図は第1図の字体判定部15を示すブロック図であ
る。同図において、30はX座標発生手段、32はY座標発
生手段、34,36は座標検出手段であり、座標検出手段34
はX+Y計算手段341、最大値検出手段342、最大値座標
保存手段343、最小値検出手段344及び最小値座標保存手
段345を備え、また最小値検出手段36はX−Y計算手段3
61、最大値検出手段362、最大値座標保存手段363、最小
値検出手段364、最小値座標保存手段365を備える。38は
特徴量算出手段である。
第4図は本実施例における最大値座標検出手段の動作
を示すフローチャートである。
第5図は本実施例における最小値座標検出手段の動作
を示すフローチャートである。
第6図は第1図の辞書16の構成を示すブロック図であ
る。同図において、60は辞書選択部、61は第1の辞書マ
トリクス、62は第2の辞書マトリクスである。
第7図は本実施例の特徴点座標検出の原理的説明図で
ある。第7図(a)はサンセリフ系の標準タイプ、第7
図(b)はサンセリフ系のイタリックタイプである。
第8図はサンセリフ系の標準タイプとサンセリフ系の
イタリックタイプの標準文字パターンとその文字の辞書
マトリクスの説明図である。
第9図は本実施例に用いる文字が記載された帳票を示
す図である。
第10図(a)は入力書式テーブルの例を示す図、第10
図(b)は入力書式テーブルを説明する図である。
以下、第1図から第10図を用いて本実施例を詳細に説
明する。
先ず、認識対象文字の入力文字パターンを得ることに
つき説明する。第1図の光電変換部11は、文字、図形等
(以下、文字と称する)が記載された帳票等の媒体から
の元信号(第1図中Sで示す)より文字行領域を検出
し、該文字行領域を光電変換し、文字線部を画素値
「1」の黒ビット及び背景部を画素値「0」の白ビット
として各画素毎に2値のディジタル信号で表現した行画
像データを得、ラインバッファ12に格納する。ここで、
文字行領域とは帳票上における文字が記載される1行分
の領域のことである。
そして、ラインバッファ12は入力文字パターンの行画
像データにおける各画素の信号をこの領域の2次元座標
通りに再現できる形式で記憶し、128×4096画素の大き
さを持っているものである。
次に、文字切り出し部13はラインバッファ12から行画
像データを読み込み、縦方向に走査を行ない黒点の分布
を作成する。黒点の分布の0から1以上に変化する点よ
り1以上から0に変化する直前の点までを1つの文字予
定領域とし、パターンレジスタ14に入力文字パターンと
して格納する。
パターンレジスタ14は入力文字パターンの文字予定領
域における各画素の信号をこの領域の2次元座標とおり
に再現できる形式で記憶し、128×128画素の大きさを持
っているものである。
パターンレジスタ14に格納されている入力パターンは
識別部17及び字体判定部15に出力される。次に、第1図
の字体判定部15における字体制御信号を出力することに
つき説明する。
字体判定部15はパターンレジスタ14から読み込む入力
文字パターンの字体を判定し、辞書部16に字体判定信号
を出力する。なお、第3図におけるMはパターンレジス
タ14から読み込む、認識対象となる入力文字パターンを
含む量子化画像データを示す。字体判定部15は画像デー
タMの画素にX座標を付与するためのX座標発生手段30
と、画像データMの画素にY座標を付与するためのY座
標発生手段32と、前記X,Y座標と少なくとも2組の特定
のα値及びβ値とを用いて入力文字パターンの画素に関
する最大及び最小の計算値αX+βYを検出し、これら
最大及び最小計算値を与えるパターンの画素のX,Y座標
をそれぞれ特徴点座標として出力するための座標検出手
段34,36と、入力文字パターンの字体判定を行なうため
の幾何学的特徴量を特徴点座標に基づき算出する特徴量
算出手段38を備えている。
また、座標検出手段34は、計算値αX+βYを算出す
る計算手段341と、最大計算値を検出するための最大値
検出手段342と、最大計算値を与える画素のX,Y座標を保
存するための最大値座標保存手段343と、最小計算値を
検出するための最小値検出手段344と、最小計算値を与
える画素のX,Y座標を保存するための最小値座標保存手
段345とを備えている。座標検出手段36もまたこの座標
検出手段34と同様、計算手段361と最大値検出手段362と
最大値座標保存手段363と最小値検出手段364と最小値座
標保存手段365とを備えている。
本実施例では、(α=β=1)及び(α=1,β=−
1)の2組のα及びβ値を用いX+Y及びX−Yに関す
る最大及び最小計算値を与える画素の座標により、文字
の傾きを検出し、該傾きに基づいて字体を判定し、該字
体に対応した辞書を選択するための信号を辞書部16へ出
力するので2個の座標検出手段34,36を備える構成とな
っている。座標検出手段34にあっては計算値X+Yに関
する、及び座標検出手段36にあっては計算値X−Yに関
する、最大及び最小計算値を与える画素の座標を検出す
る。
以下に第1図の字体判定部15について第4図及び第5
図を用いて詳細に説明する。
[座標検出手段34に着目した説明](X+Yの最大値及
び最小値検出方法の説明) 第1図のパターンレジスタ14より読み込まれる(ステ
ップ401)入力文字パターンは、画素毎に最大値検出手
段342及び最小値検出手段344に入力される。これと共
に、X座標発生手段30及びY座標発生手段32は、画像デ
ータMの出力と同期させてこのデータMのそれぞれの画
素毎に対応付けたX,Y座標を発生する。その結果、これ
ら発生手段30,32によって画像データMにX,Y座標の付与
が行なわれる。そして出力されたX,Y座標は計算手段34
1、最大値座標保存手段343及び最小値座標保存手段345
に入力される(ステップ402)。計算手段341はX,Y座標
を入力すると、これらX,Y座標から計算値X+Yを算出
し、算出した計算値を最大値検出手段342及び最小値検
出手段344に対し出力する(ステップ403)。
このステップ402〜403によって、最大値検出手段342
は画像データM及び計算値を、最小値検出手段344は画
像データM及び計算値を、最大値座標保存手段343はX,Y
座標を、最小値座標保存手段345はX,Y座標を、それぞれ
1画素毎に入力する。そして、座標検出手段が後述のス
テップ404,405あるいは501,407の判断を1画素毎に繰り
返し行ない、その判断結果に応じた動作を行なう。
特にステップ404では、最大値検出手段342及び最小値
検出手段344は入力された画像データMの画素が入力文
字パターンの文字線部の画素であるか否かを判断する。
この判断は、入力された画素の画素値が入力文字パター
ンの文字線部を意味する所定の画素値(この実施例では
画素値「1」)であるか否かを判断することによって行
なう。所定の画素値を有するときには、最大値検出手段
342はステップ404の次に比較値及び計算値の比較をステ
ップ405で、及び最小値検出手段344はステップ404の次
に比較値及び計算値の比較をステップ501で行なう。
ここでステップ405において 計算値が比較値よりも大きいとき 最大値検出手段342は先に格納されている比較値に換
えて、比較値よりも大きい計算値を新たな比較値として
格納し(比較値の書き換え)、これと共にセットパルス
を最大値座標保存手段343に対し出力する。セットパル
スを入力した最大値座標保存手段343は格納されている
X,Y座標に換えて、比較値よりも大きな計算値を与える
画素のX,Y座標を新たに格納する(X,Y座標の書換え)
(ステップ406)。
計算値が比較値よりも小さいかあるいは比較値と等
しいとき 最大値検出手段342は先に格納されている比較値を書
換えずにそのまま格納するとともに、最大値座標保存手
段343は格納されているX,Y座標を書換えない。
最大値検出手段342は上記及びのいずれの場合も
ステップ405の次にステップ407の判断を行なう。
なお、最大値検出手段342に格納される比較値の初期
値としては、例えば計算値αX+βYとして取り得る値
よりも小さな値を用いれば良い。例えばα=β=1であ
り画像データMをl行m列の画素の分割した(従って0
≦X≦m−1,及び0≦Y≦l−1となる)場合には、例
えば−1を比較値の初期値とすることができる。あるい
は一番最初に入力された計算値αX+βYを用いるよう
にしても良い。
また最大値検出手段342が比較値及びX,Y座標の書換え
を計算値αX+βYが比較値よりも大きいとき及び計算
値が比較値と等しいときに行なうようにし、これととも
に計算値が比較値よりも小さいとき比較値及びX,Y座標
の書換えを行なわないようにしても良い。
また最大値座標保存手段343のX,Y座標としては任意好
適な数値を用いて良い。
ここでステップ501において 計算値が比較値よりも小さいとき 最小値検出手段344は先に格納されている比較値に換
えて比較値よりも小さい計算値を比較値として新たに格
納する(比較値の書き換え)と共に、最小値座標保存手
段345に対しセットパルスを出力する。最小値座標保存
手段345はセットパルスを入力すると、格納されている
X,Y座標を比較値よりも小さな計算値を与える画素のX,Y
座標に書換える(X,Y座標の書換え)(ステップ406)。
計算値が比較値よりも大きいかあるいは比較値と等
しいとき 最小値検出手段344は先に格納されている比較値を書
換えずにそのまま格納するとともに、最小値座標保存手
段345は格納されているX,Y座標を書換えない。
最小値検出手段344は上記及びのいずれかの場合
にはステップ501の次にステップ407の判断を行なう。
尚、最小値検出手段344に格納される比較値の初期値
としては、例えば計算値αX+βYとして取り得る値よ
りも大きな値を用いれば良い。例えばα=β=1であ
り、画像データMをl行m列の画素に分割した(従って
0≦X≦m−1、及び0≦Y≦l−1となる)場合に
は、例えばm+n−1を比較値の初期値とすることがで
きる。あるいは比較値の初期値として最小値検出手段34
4に一番最初に入力された計算値αX+βYを用いるよ
うにしても良い。
また最小値検出手段344は計算値が比較値よりも小さ
いとき及び計算値が比較値と等しいとき比較値及びX,Y
座標の書換えを行ない、これと共に計算値が比較値より
も大きいとき比較値及びX,Y座標の書換えを行なわない
ようにしても良い。
また最小値座標保存手段345のX,Y座標として任意好適
な数値を用いて良い。
さらにステップ407において 画像データMの走査が終了しないとき 座標検出手段34は、画像データMの走査が終了せず、
従ってデータMの全ての画素につき処理が終了していな
ければ、画像データMの残りの画素につきステップ404,
405あるいは501,407の判断を行ない、その判断結果に応
じて動作する。
画像データMの走査が終了したとき 最大値検出手段342及び最小値検出手段344は画像デー
タMの走査が終了しデータMのすべての画素につき処理
が終了すると、X,Y座標の出力信号を最大値座標保存手
段343及び最小値座標保存手段345に対して出力する。こ
の出力信号を入力した座標保存手段343,345は、格納し
ているX,Y座標を特徴点座標として出力する。これとと
もに検出手段342,344は比較値の初期化を行なう(ステ
ップ408)。
全ての画素につき処理を終了した時点で、最大値座標
保存手段343及び最小値座標保存手段345に格納されてい
るX,Y座標が最大及び最小計算値を与える画素のX,Y座標
すなわち特徴点座標となる。
座標検出手段34にあってはα=β=1としたので、全
処理終了時点で例えば第7図に示す入力文字パターンM2
の特徴点BRの座標が最大値座標保存手段343に格納され
ており、また特徴点TLの座標が最小座標保存手段345に
格納されている。
[座標検出手段36に着目した説明](X−Yの最大値・
最小値検出方法の説明) 座標検出手段36は、上述した座標検出手段34の動作と
並行して座標検出手段34と同様の動作を行なうので、こ
の検出手段36の動作説明を省略する。
座標検出手段36にあっては、α=1及びβ=−1とし
たので、全ての画素につき処理を終了した時点で、例え
ば第7図に示す入力文字パターンM2の特徴点TRの座標が
最大値座標保存手段363に格納されており、また特徴点B
Lの座標が最小値座標保存手段365に格納されている。
入力文字パターンの特徴点をTL,BL,TR及びBRの座標を
用い、特徴値Fを下記の式(1)により算出する。
なお、式(1)において特徴点TL,BL,TR,BRのX座標
をTLX,BLX,TRX,BRXとして表わす。
F=k{l(TLX−BLX)+m(TRX−BRX)} ……式(1) 式(1)中、k,l,mは任意の定数である。
式(1)により算出されるFの下記の式(2)による
条件により、字体を判定し、辞書部16に字体判定信号N
を出力する。
式(2)中、C1,C2は、固定閾値であり、任意に変え
ることができる。
なお、本実施例では、出力する字体判定信号Nは、
「1」,「2」,「3」の3種であるが、字体判定信号
Nは3種以外のものとなっても何ら差し支えない。
次に、入力文字パターンを識別し、結果を出力するこ
とについて説明する。
第1図の字体判定部15により出力された字体判定信号
Nは、辞書部16へ出力され、字体判定信号Nに対応する
辞書を選択する。
第6図の辞書部16は、辞書選択部60、第1の辞書マト
リクス61及び第2の辞書マトリクス62を備える。本実施
例では、辞書マトリクスは2つであるが、これは3つ以
上でも何ら差し支えない。
辞書選択部60は、字体判定部15から出力される字体判
定信号N=1,N=2、又はN=3に対応してそれぞれ第
1の辞書マトリクス61、第2の辞書マトリクス62、又は
第1,第2の辞書マトリクス61,62を選択し、選択した辞
書マトリクスを識別部17に対して出力する。
次に、識別部17について説明する。
識別部17は、この入力文字パターンについて特徴抽出
処理及び入力文字パターンの認識を行なう。この特徴抽
出の方法は、従来公知の種々の方法を用いることができ
るが、本実施例の場合、以下に説明するような方法で行
なう。
先ず、入力文字パターンについて外接する方形枠を検
出し、これを文字枠とする。更に当該入力文字パターン
について線幅Wを算出する。この線幅算出は、例えば下
記に示すような周知の近似式(3)を用いて行なうこと
ができる。
W=1/{1−(Q/A)} ……式(3) ただし、式(3)において、Qは入力文字パターンを
構成する各点をこれらの点が(2×2)個づつの範囲で
見られる窓で分けたとき、この窓内の全ての点が黒ビッ
トとなる窓の個数であり、またAは文字枠内の黒ビット
の個数である。
更に、この入力文字パターンを複数の方向に走査を行
なって各走査列毎の黒ビットの連続個数を検出し、この
黒ビット連続個数と上述の線幅とに基づいて上述の複数
の方向毎に対応したサブパターンをそれぞれ抽出する。
そして、この入力文字パターンの文字枠内領域をサブパ
ターンについて(XN×YM)個の領域(XN,YMは定数)に
分割し、更に、各領域内の文字線長を表わす特徴量を、
文字を分割した領域毎に計算し、この特徴量を文字枠の
大きさで正視化して特徴マトリクスを得る。本実施例で
は、特徴量を、(ΔX+ΔY)/2なる値で除することに
よって正視化する。ここで、ΔXは文字枠の水平方向長
さ、ΔYは垂直方向長さである。
識別部17は、このようにして抽出した特徴マトリクス
と、辞書部16より出力される、辞書選択後の辞書マトリ
クスとの照合を行ない、最も類似度が大きな値を示した
辞書マトリクスに対応する文字名(JISコード等)を出
力端子18を介して外部装置に出力する。
なお、本実施例の場合上述した類似度は、以下に示す
式(4)に基づいて求めている。
但し、式(4)において、Rは類似度、f1は入力文
字パターン、g1は辞書内に格納させてある辞書マトリ
クスをそれぞれ示し、また、i=1,2,3,……,XN×YMで
ある。
次に、本実施例において第1図に沿って具体的に説明
する。
先ず、文字が記された、例えば第9図に示すような帳
票は画像データSとして光電変換部11に入力される。光
電変換部11では帳票の各文字領域を検出し、行単位で光
電変換し、2値のディジタル画像データに変換し、ライ
ンバッファ12に格納する。前記行領域の検出は、本実施
例では予め光電変換部11に設定されている第10図(a)
に示す入力書式テーブルを参照して順次行なうものとす
る。前記入力書式テーブルには第10図(b)に示すよう
に第1行目の行領域の帳票の上端及び左端からの距離行
領域の大きさ、行ピッチ及び行数が記録されている。
第2図(a)及び第2図(b)に示すように、ライン
バッファ12から読み込まれた2値のディジタル信号であ
る行画像データは、文字切り出し部13黒点の分布の0か
ら1以上に変化する点より1以上から0へ変化する直前
の点までを、文字予定領域として行画像データから検出
し、128×128画素の入力文字パターンを抽出する。この
入力文字パターンは、一文字毎にパターンレジスタ14に
格納される。
パターンレジスタ14から入力文字パターンを読み込ん
だ字体判定部15は、入力文字パターンの128×128画素
に、X座標及びY座標をそれぞれ付与し、入力文字パタ
ーンの画素に関する最大及び最小の計算値αX+βYを
検出し、これら最大及び最小計算値を与える特徴点座標
を抽出する。
本実施例では、特徴点を検出するためのα及びβは
(α=1,β=1)と(α=1,β=−1)の2組とし、前
記計算値による特徴点座標は第7図(a)では、TL=
(0,0),BL=(0,47),TR=(42,0),BR=(42,47),
第7図(b)では、TL=(8,0),BL=(0,47),TR=(4
2,0),BR=(35,47)である。前記特徴点座標により式
(1)を用いて特徴値Fを算出する。このとき、本実施
例では定数k,l,mはそれぞれ(k=1/2,l=1,m=1)で
あり、また固定しきい値C1=5.0,C2=3.0である。前記
条件により算出される特徴値は、第7図(a)ではF=
0であり、第7図(b)ではF=7.5である。
従って、式(2)により、第9図の帳票が入力された
場合、第2図(c)に示す値Fが算出され、F>C1
入力文字パターンについては字体判定信号N=1がF<
2の入力文字パターンは字体判定信号N=2が、辞書
部16の辞書選択部60に出力される。本実施例では、M,Y,
N,A,M,E,I,Sに対してはN=2を出力し、第1の辞書マ
トリクス61を選択する。
識別部17は、パターンレジスタ14から読み込まれる入
力文字パターンの水平、垂直、右斜め、左斜めの4方向
についてサブパターンを線幅に抽出し、それぞれのサブ
パターンを、文字枠内領域についてXN×YMに分割する。
本実施例では5×5である。各領域において、文字線長
を表わす特徴量を計算し、特徴マトリクスを得る。この
特徴マトリクスと、字体判定され選択された辞書マトリ
クスとの照合を行ない、最も類似度が大きい値を示した
辞書マトリクスに対応する文字名(JISコード等)を出
力端子18を介して図示していない外部装置に出力する。
第8図に標準タイプ文字とイタリックタイプ文字の標準
文字パターンと辞書マトリクスの例を示す。
(発明の効果) 以上説明したように、本発明によれば、帳票上の各文
字の文字線を有する各画素に対してαX+βY及びαX
−βYの最大及び最小の計算値を算出し、特徴点座標を
抽出することにより、イタリック体等の斜体文字を検出
し、入力文字パターンの字体の判定を行なって判定結果
に基づき照合するための辞書マスクを選択している。し
たがって、辞書マスクは選択された辞書マスクとのみ照
合を行なうため、照合に要する時間が短くなり、字体の
異なる文字が混在する帳票も高速に精度よく読み取るこ
との可能な文字認識装置を実現できる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図
(a)は文字行領域における2値画像データを示す図、
第2図(b)は2値画像データによる周辺分布を示す
図、第2図(c)は入力文字パターンの特徴値Fを示す
図、第2図(d)は入力文字パターンに対する認識結果
を示す図、第3図は第1図の字体判定部15を示すブロッ
ク図、第4図は本実施例における最大値座標検出手段の
動作を示すフローチャート、第5図は本実施例における
最小値座標検出手段の動作を示すフローチャート、第6
図は第1図の辞書16の構成を示すブロック図、第7図
(a)はサンセリフ系の標準タイプの入力文字パターン
と特徴点座標を示す図、第7図(b)はサンセリフ系の
イタリックタイプの入力文字パターンと特徴点座標を示
す図、第8図はサンセリフ系の標準タイプとサンセリフ
系のイタリックタイプの標準文字パターンとその文字の
辞書マトリクスの説明図、第9図は本実施例に用いる文
字が記載された帳票を示す図、第10図(a)は入力書式
テーブルの例を示す図、第10図(b)は入力書式テーブ
ルを説明する図である。 10……文字認識装置、11…光電変換部、12……ラインバ
ッファ、13……文字切り出し部、14……パターンレジス
タ、15……字体判定部、16……辞書部、17……識別部、
18……出力端子。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 山下 義征 東京都港区虎ノ門1丁目7番12号 沖電 気工業株式会社内 (56)参考文献 特開 昭58−222384(JP,A) 特開 昭59−206991(JP,A) 特開 昭59−161779(JP,A)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】媒体上の特徴抽出対象を光電変換し量子化
    された画像データを得、該画像データより1文字づつの
    文字パターンを切り出し、当該切り出された入力文字パ
    ターンの字体の判定を行ない、判定結果に基づいて認識
    辞書マスクの選択を行ない、選択された辞書マスクを用
    いて入力文字パターンの照合を行ない、文字を認識する
    文字認識装置において、 1文字づつ切り出された前記入力文字パターンの画像デ
    ータの画素にX座標を付与するX座標発生手段と、 1文字づつ切り出された前記入力文字パターンの画像デ
    ータの画素にY座標を付与するY座標発生手段と、 前記X,Y座標と少なくとも2組の特定のα値及びβ値と
    を用いて所定の画素値を有する前記入力文字パターンの
    画素に関する最大及び最小の計算値αX+βYを検出
    し、これら最大及び最小計算値を与える前記入力文字パ
    ターンの画素のX,Y座標を検出する座標検出手段と、 検出されたX,Y座標を用いて、座標間の距離、傾き等に
    基づく幾何学的な特微量を算出する特徴量算出手段とを
    有し、該特徴量算出手段により算出された特微量の大き
    さにより、字体の判定を行なう字体判定部と、 判定された字体に対応する認識辞書マスクを選択する辞
    書部と、 選択された辞書マスクを用いて入力文字パターンの照合
    を行ない、文字を識別する識別部とを具備することを特
    徴とする文字認識装置。
  2. 【請求項2】前記座標検出手段において、α=β=1及
    びα=1,β=−1の2組の前記α値及びβ値とを用いて
    所定の画素値を有する前記入力文字パターンの画素に関
    する最大及び最小の計算値X+Y及びX−Yを検出し、
    これら最大及び最小計算値を与える前記入力文字パター
    ンの画素のX,Y座標を検出する請求項1記載の文字認識
    装置。
  3. 【請求項3】前記特徴量算出手段において、前記検出さ
    れた座標におけるX+Yの最大値のX座標をBRX、最小
    値のX座標をTLX、X−Yの最大値のX座標をTRX、最小
    値のX座標をBLXとし、特徴量Fは F=k{l(TLX−BLX)+m(TRX−BRX)} (但し、K,l,mは任意の定数である) により算出される請求項2記載の文字認識装置。
JP1160937A 1989-06-26 1989-06-26 文字認識装置 Expired - Lifetime JP2827288B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1160937A JP2827288B2 (ja) 1989-06-26 1989-06-26 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1160937A JP2827288B2 (ja) 1989-06-26 1989-06-26 文字認識装置

Publications (2)

Publication Number Publication Date
JPH0327488A JPH0327488A (ja) 1991-02-05
JP2827288B2 true JP2827288B2 (ja) 1998-11-25

Family

ID=15725461

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1160937A Expired - Lifetime JP2827288B2 (ja) 1989-06-26 1989-06-26 文字認識装置

Country Status (1)

Country Link
JP (1) JP2827288B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111598102B (zh) * 2020-05-28 2023-08-22 北京轨道交通路网管理有限公司 叠加字符的检测方法及装置

Also Published As

Publication number Publication date
JPH0327488A (ja) 1991-02-05

Similar Documents

Publication Publication Date Title
JP3139521B2 (ja) 自動言語決定装置
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JPS6159568A (ja) 文書処理装置
JP2827288B2 (ja) 文字認識装置
CA2250557C (en) Image recognition through localized interpretation
JPH0516632B2 (ja)
JP2626084B2 (ja) 文字認識装置
JP2788506B2 (ja) 文字認識装置
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JP2708604B2 (ja) 文字認識方法
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JP2582611B2 (ja) マルチフオント辞書の作成法
JPH03136182A (ja) 文字切り出し方法
JP3084833B2 (ja) 特徴抽出装置
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JP3127413B2 (ja) 文字認識装置
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JP2749946B2 (ja) 文字認識方法
JPH11120291A (ja) パタン認識システム
CN118211562A (zh) 一种Canvas转换PDF文件动态分页的方法
JP2962525B2 (ja) テキストブロック認識方法
JP2616995B2 (ja) 文字認識装置
JP3071479B2 (ja) 行間スペース検出方法
JPH03136181A (ja) 文字切り出し方法