JP3391223B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3391223B2
JP3391223B2 JP19106997A JP19106997A JP3391223B2 JP 3391223 B2 JP3391223 B2 JP 3391223B2 JP 19106997 A JP19106997 A JP 19106997A JP 19106997 A JP19106997 A JP 19106997A JP 3391223 B2 JP3391223 B2 JP 3391223B2
Authority
JP
Japan
Prior art keywords
character
line segment
pattern
recognition device
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP19106997A
Other languages
English (en)
Other versions
JPH1139429A (ja
Inventor
美佐子 諏訪
聡 直井
悦伸 堀田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP19106997A priority Critical patent/JP3391223B2/ja
Publication of JPH1139429A publication Critical patent/JPH1139429A/ja
Application granted granted Critical
Publication of JP3391223B2 publication Critical patent/JP3391223B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、光学的文字認識装
置(OCR)に関する。手書き文字を認識する文字認識
装置においては、誤読文字を減じると共に帳票記入の制
限を減らすことが要求される。
【0002】
【従来の技術】図9は従来の文字認識装置(OCR)の
構成概念図である。文字認識装置1の各部は以下のよう
に動作する。まず観測部2は、帳票A上に記入された文
字(および文字枠)をスキャナ等で読み取り、光電変換
後に2値の画像データに変換する。文字切りだし部3
は、帳票画像から各文字を1文字づつに分離する。前処
理部4は、切り出した文字に対して雑音除去、大きさの
正規化等を行う。特徴抽出部5は、文字認識用の特徴値
を抽出する。辞書部6には、各文字種に対する特徴値の
辞書が格納されている。辞書照合部7は、抽出した文字
の特徴値と辞書との照合を行ない、最も特徴値が近い文
字種を候補とし、結果出力部8はそれに従って認識結果
Bを出力する。
【0003】特徴抽出方式には、各種のものがあるが、
図10に一例を示す。この例は、図10(1)に示すよ
うに、文字の画素パターンの輪郭部の画素を抽出し、そ
れぞれ輪郭の方向を示す方向コードを付ける方式であ
る。この例では横、右上がり斜め、縦、左上がり斜めの
4つの方向に分けている。そして、各方向ごとに画素を
計数し、その並びを特徴ベクトルとして扱う(図10
(2 )参照)。辞書部6にも同じようにして文字種ごと
のベクトル値が記録してある。入力された文字のベクト
ルと、辞書のベクトルとの距離(特徴距離)を計算し近
い順に候補とする。このとき、候補文字との距離が遠い
場合や、1位候補と2位候補との差が少ない場合には認
識不能とする場合もある。
【0004】従来、OCRの帳票では、記入を間違えた
文字列に対しては文字列を貫通する線分(消し線)を記
入することにより、それらを読み取らないというリジェ
クト機能が搭載されたものがある(特開昭61−368
74)。しかしこれは、1文字の幅と比較して「充分に
長い線分」という条件のもとで有効な手法であり、消し
線長が文字幅程度の1文字のみを訂正した消し線には有
効ではない。
【0005】1文字に対して消し線を記入する場合は、
例えば、文字枠内を塗りつぶす、または文字枠を横断す
る長い水平線分を引くというルールが使われる。このル
ールが守られれば、本来の文字との特徴距離の差が明確
であるため区別できるが、このルールは記入者にとって
負担になるので、守られないことが多い。図11に手書
き文字を入力した帳票の例を示す。従って、記入者が消
し線を付けたつもりの文字がリジェクトされずに誤読さ
れてしまうケースがかなりの割合で発生する可能性があ
る。例えば、「0」に短い横棒による消し線をつけたも
のを「8」と誤る。これは「消し線付きの0」と「8」
との特徴距離が近いため区別することが容易でないため
である。
【0006】従来方式でこの問題を避けるには、本来の
文字のどれに相当するかを判定する他に、消し線付文字
との区別を判定する必要があり、特徴距離を大きくする
ために数多くの特徴を抽出する必要がある。特徴辞書も
大掛かりなものになる。
【0007】
【発明が解決しようとする課題】本発明は、消し線の形
態は、横方向、縦方向、斜め方向の線分によることが最
も頻度が高いことに着目して、文字が記入された帳票の
画像から1文字毎に切りだされた文字パターンを対象と
して、消し線がついているか否かを判定し、ついている
と判定したときはリジェクトすることにより、文字認識
の精度を高めることを目的とする。
【0008】
【課題を解決するための手段】図1に本発明の文字認識
装置の原理構成図を示す。観測部2、文字切り出し部
3、前処理部4、特徴抽出部5、辞書部6、辞書照合部
7、結果出力部8は従来と同じでよい。なお、これらの
部分はこの図と異なる構成であってもよい。
【0009】請求項1の発明: 文字パターンから、所
定方向の線分のパターンを抽出する線分パターン生成部
91と、生成された線分パターンから特徴データを抽出す
る線分抽出部92と、線分パターンの特徴データを解析し
て消し線であるか否かを判定する消し線判定部93とを有
するように構成する。線分パターン生成部91は、文字パ
ターンから、所定方向の、例えば横方向の線分に対応す
るパターンを抜き出して、線分パターンを生成する。こ
の生成は、例えば次の請求項2、3のように行う。
【0010】線分抽出部92は、生成された線分パターン
から特徴データを抽出する。特徴データを抽出するには
請求項3のようにヒストグラム方式でもよいし、文字パ
ターンから特徴データを抽出する方式、その他でもよ
い。消し線判定部93は、特徴データを解析し、入力され
た文字パターンの特徴データから認識された文字種に対
応して設定された判定基準を用いて、文字パターンの一
部ではない線分が存在するか否かを判断する。例えば、
「0」や「8」のパターンは横方向の走査によるヒスト
グラムには閾値を越えるピークをもたないが、図3
(2)に示すように、「4」の標準的パターンは閾値を
越えるピークを中央付近に1つもつ。従って、「0」や
「8」と認識されたパターンの中央付近にヒストグラム
のピークが存在する場合は消し線が付けられている可能
性が高いが、「4」と認識されたパターンの中央付近に
ヒストグラムのピークがあっても、消し線が付けられて
いる可能性は低い。よって、消し線の存在の判定は、文
字種ごとに変えるほうが精度が高くなる。そのような線
分があれば、それは消し線とみなしてその文字を結果出
力部により削除処理を行うことになる。
【0011】請求項2の発明: 線分パターン生成部91
は、抽出対象方向に長い長方形の抽出窓を用い、文字パ
ターン上で移動させ、抽出窓の中の黒画素数が所定値以
下の場合は抽出窓の全画素を白画素とし、所定値より多
ければ全画素を黒画素として変換することにより線分パ
ターンを生成するように構成する。
【0012】図2に線分抽出の説明図を示す。細長い抽
出窓の中で黒画素が多ければ、その部分はその方向の線
分である可能性が高い。また、黒画素が少ないならその
部分はその方向の線分ではない可能性が高い。従って、
図2(a)に示すように、それぞれ黒画素、白画素に置
き換えたパターンを生成することにより、図2(b)の
ように抽出窓方向の線分を構成する画素が抽出されるこ
とになる。
【0013】請求項3の発明: 線分抽出部92は、線分
パターンを抽出対象方向に走査して画素数ヒストグラム
特徴データとして生成し、消し線判定部93は、生成さ
れたヒストグラムの所定の領域にあるピークの幅と高さ
とから入力された文字パターンの特徴データから認識さ
れた文字種に対応して設定された判定基準を用いて、
し線であるか否かを判定するように構成する。
【0014】図3に文字と線分抽出との関係の説明図を
示す。線分パターンに存在する画素はすべて消し線由来
のものとは限らないので、消し線である可能性が高いも
のを取り出す。例えば、上下の境界に近い水平線分をも
つ文字(図3(2)参照)が多いので、また、消し線が
上下の境界付近に存在することは少ないので、横方向の
ヒストグラムを判断する場合に上下境界に近いピークを
除いたほうが精度が高くなる。
【0015】
【0016】
【0017】
【0018】請求項の発明: 線分パターン生成部91
抽出対象方向毎に線分パターンを生成し、線分抽出部
92は、線分パターンごとに線分の特徴データを抽出し、
消し線判定部93は、いずれかの方向の消し線の有無を検
出するように構成する。
【0019】横方向の他、縦方向、右上がり斜め方向、
左上がり斜め方向の場合も同様にすればよい。なお、消
し線は横線にするというようなルールを決めることがで
きれば横方向のみを検出することで高速にすることもで
きる。
【0020】請求項の発明: 線分パターン生成部91
は、必要があれば、文字パターンを所定の角度だけ回転
させてから、線分パターンを生成するように構成する。
例えば、45度ずつ回転させて4回行えば、斜め、縦、
の処理もその後の処理は同じことをくりかえすだけでよ
い。
【0021】請求項の発明: 文字認識装置におい
て、文字パターンから所定方向の線分のパターンを抽出
、抽出された線分パターンの特徴データを抽出、線
分パターンの特徴データを解析し、入力された文字パタ
ーンの特徴データから認識された文字種に対応して設定
された判定基準を用いて、消し線であるか否かを判定
処理をコンピュータに行わせることを特徴とする文字
認識プログラムをコンピュータ読み取り可能な記録媒体
に記録しておく。
【0022】以上のように構成することにより、記入者
が記入を誤ったことを示すために記入した消し線を適切
に判断してその文字を除去することができる。従って消
したはずの文字が別の文字に誤認識されることが少なく
なり、精度を高くすることができる。
【0023】
【発明の実施の形態】本発明を適用した光学的文字認識
装置(OCR)の例を説明する。図4は、主に手書き数
字を対象とし文字幅程度の線分による消し線をつけるこ
とを許容する文字認識装置の構成ブロック図である。
【0024】この実施例の全体の処理の流れ図を図5に
示す。 s1〜s6: 文字認識装置1は、帳票上に記入された文字
(および文字枠)をスキャナ等で読み取って、光電変換
後に二値の画像データに変換する観測部2、帳票画像か
ら各文字を従来方式により1文字づつに分離する文字切
りだし部3、切り出した文字に対して雑音除去、大きさ
の正規化等を行う前処理部4、文字認用特徴値を抽出す
る特徴抽出部5、各文字種に対する特徴値の辞書が格納
されている辞書部6、抽出した文字認識用特徴値と辞書
との照合を行い中間認識結果を出力する辞書照合部7を
備える。ここまでは従来方式と同じである。
【0025】s7〜s10 : 中間認識結果と前処理部が生成
した正規化された文字パターンとは、消し線処理を行う
ため、線分パターン生成部91と消し線判定部93とに送ら
れる。消し線判定は、正規化文字パターンに対して、横
方向、縦方向、右上がり斜め方向、左上がり斜め方向の
線分を検出することにより行う。また、文字種ごとにま
た、方向ごとに判定のための閾値を設定してある閾値フ
ァイル94を用意してあり、中間認識結果で第一候補とさ
れた文字種に対応した閾値セットをとりだし、それに基
づいて、消し線があるか否かを判定する。
【0026】消し線付文字と判定した場合は、認識結果
文字種コードをリジェクトコードに付け替え、最終認識
結果として出力する。消し線の無い通常文字として判定
した場合は、中間認識結果をそのまま最終認識結果とし
て出力する。
【0027】以下に、消し線判定の処理を中心に説明す
る。消し線処理は、図4に示す、線分パターン生成部9
1、線分抽出部92、消し線判定部93、閾値ファイル94、
および、 線分パターン回転部(図示していない)より行
われる。
【0028】線分パターン生成部91は、正規化文字パタ
ーンに対し、以下のようにして、線分パターンを抽出す
る。消し線処理の流れ図を図6に示す。
【0029】(1) 縦、横、右上がり斜め、左上がり斜め
方向線分の抽出 判定対象とする消し線は縦、横、斜め方向の線分による
消し線とする。ここで、斜め方向とは、文字外接長方形
の対角線方向とする。図7に、文字外接長方形と抽出線
分の方向を示す。図7(1)(2)の細枠が文字の外接長方
形、図7(1) の1の線が横方向、2が左上がり斜め方
向、3が縦方向、4が右上がり斜め方向である。
【0030】横方向を例にあげて、線分抽出を以下に説
明する。他の方向を抽出するには、外接長方形の対角線
方向の角度を算出し、その角度だけ文字パターンの座標
変換を行ってから、その角度だけ回転させて(図7(2)
参照)、同じことを行えばよい。または、順次固定角度
で45度、90度、135度回転させるようにしてもよ
い。
【0031】文字パターン領域内で、縦横サイズn×
mの横長の長方形(n<m)の窓を考える。この領域内
の黒画素数をカウントし、長方形内全画素数(n×m
個)に対する黒画素数の比Bを求める。
【0032】この閾値をTH1としたとき、B>TH
1の場合、長方形領域内部の画素を、全て黒画素で置き
換える。B≦TH1の場合、長方形領域内部の画素を、
全て白画素で置き換える。窓を、文字外接長方形内でく
まなく移動させ、水平線分パターンを抽出する。図2
(a)に、n×m=3×8、TH1=0.7とした例を
示す。
【0033】(2) 各方向の線分数のカウント 上記で求めた線分パターンから、画素数ヒストグラムを
生成し、所定領域内の線分数を数える。同様に、横方向
の線分を例にあげて説明する。
【0034】横方向の線分パターンを横方向に走査し
て黒画素を数えた、黒画素数ヒストグラムを作成する。
ただし、図3(3) に示すように『5』や『2』のよう
に、最上部または最下部の文字線が横線分として検出さ
れる場合が数字では多いので、文字の最上部および最下
部から、幅LE=LH×TH2の領域を除外してヒスト
グラムを作成する。TH2は外接長方形の高さに対す
る、除外領域の幅である。なお、ヒストグラムは全体に
わたって作成して、判定のときに除外するようにしても
よい。または、 線分パターンを生成するときに除外する
ようにしてもよい。図6ではその例を示している。
【0035】文字パターンの外接長方形の幅をLWと
したとき、LC=LW×TH3を満たす位置LCでヒス
トグラムを切断する。TH3は外接長方形幅LWに対す
る切断部分幅の比である。
【0036】切断した残りのピーク部分(図3(1) の
市松模様部分)の切断個所からの高さをH、切断個所の
幅をWとしたとき、H/W>TH4を満たすものを水平
方向の線分と判断する。
【0037】求めた横方向の線分の数が閾値TH5以
上のものを、水平方向の線分による消し線付き文字と判
定する。すなわち、LHをパターンの外接長方形の高さ
としたとき、 (H/W>TH4) & (LH−LE≧y≧LEに存
在) であれば、横方向の線分の消し線候補である。
【0038】横方向の線分の消し線候補の本数≧TH5
であれば、横方向の線分による消し線付文字であると判
定する。 (3) ここで、TH1〜TH5の各閾値は、抽出対象線分
方向毎及び文字種毎に最適な値に設定しておき、閾値フ
ァイルとして用意しておく。判定対象文字の一次認識結
果文字種に対応して、使用する閾値のセットを決定す
る。縦、右上がり斜め、左上がり斜め線分も同様に行
う。消し線候補の探索領域は、横、縦方向は外接長方形
内であるが、斜め方向の場合は外接長方形の対角線を含
む長方形内とすればよい。
【0039】本発明により判定された消し線付文字例を
図8にあげる。
【0040】
【発明の効果】以上説明したように、本発明によれば消
し線をつけた文字を適切に判定することができ、一定方
向の線分による消し線の記入された文字の誤読を減ず
る。
【図面の簡単な説明】
【図1】 原理構成図
【図2】 線分抽出の説明図
【図3】 文字と線分図抽出例
【図4】 実施例の構成ブロック図
【図5】 全体処理の流れ図
【図6】 消し線処理の流れ図
【図7】 線分抽出の説明図
【図8】 消し線判定例
【図9】 文字認識装置の構成概念図
【図10】 文字の特徴抽出の説明図
【図11】 手書き入力帳票の例
【符号の説明】
1 文字認識装置 2 観測部 3 文字切り出し部 4 前処理部 5 特徴抽出部 6 辞書部 7 辞書照合部 8 結果出力部 91 線分パターン生成部 92 線分抽出部 93 消し線判定部 94 閾値ファイル
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平8−202822(JP,A) 特開 平5−12491(JP,A) 特開 平7−73270(JP,A) 特開 昭61−190679(JP,A) 特開 昭61−36874(JP,A) 特開 昭62−224871(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/76

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力された文字パターンの特徴データを
    抽出し辞書データと比較して、文字を認識する文字認識
    装置であって、 文字パターンから、所定方向の線分のパターンを抽出す
    る線分パターン生成部と、 生成された線分パターンから特徴データを抽出する線分
    抽出部と、抽出された 線分パターンの特徴データを解析し、入力さ
    れた文字パターンの特徴データから認識された文字種に
    対応して設定された判定基準を用いて、消し線であるか
    否かを判定する消し線判定部とを有することを特徴とす
    る文字認識装置。
  2. 【請求項2】 請求項1に記載の文字認識装置であっ
    て、 線分パターン生成部は、抽出対象方向に長い長方形の抽
    出窓を用い、文字パターン上で移動させ、抽出窓の中の
    黒画素数が所定値以下の場合は抽出窓の全画素を白画素
    とし、所定値より多ければ全画素を黒画素として変換す
    ることにより線分パターンを生成することを特徴とする
    文字認識装置。
  3. 【請求項3】 請求項1または請求項2に記載の文字認
    識装置であって、 線分抽出部は、線分パターンを抽出対象方向に走査して
    画素数ヒストグラムを特徴データとして生成し、 消し線判定部は、生成されたヒストグラムの所定の領域
    にあるピークの幅と高さとから入力された文字パターン
    の特徴データから認識された文字種に対応して設定され
    た判定基準を用いて、消し線であるか否かを判定するこ
    とを特徴とする文字認識装置。
  4. 【請求項4】 請求項1ないし請求項3に記載の文字認
    識装置であって、 線分パターン生成部は抽出対象方向毎に線分パターンを
    生成し、 線分抽出部は、線分パターンごとに線分の特徴データを
    抽出し、 消し線判定部は、いずれかの方向の消し線の有無を検出
    する ことを特徴とする文字認識装置。
  5. 【請求項5】 請求項1ないし請求項4に記載の文字認
    識装置であって、線分パターン生成部は、文字パターンを所定の角度だけ
    回転させてから、線分パターンを抽出することを特徴と
    する文字認識装置。
  6. 【請求項6】 入力された文字パターンの特徴データを
    抽出し、辞書データと比較して、文字を認識する文字認
    識装置であって、 文字パターンから、所定方向の線分のパターンを抽出す
    る線分パターン生成部と、 抽出された線分パターンの特徴データを抽出する線分抽
    出部と、 抽出された線分パターンの特徴データを解析し、入力さ
    れた文字パターンの特徴データから認識された文字種に
    対応して設定された判定基準を用いて、消し線であるか
    否かを判定する消し線判定部とを有することを特徴とす
    る文字認識プログラムを記録したコンピュータ読み取り
    可能な記録媒体。
JP19106997A 1997-07-16 1997-07-16 文字認識装置 Expired - Fee Related JP3391223B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP19106997A JP3391223B2 (ja) 1997-07-16 1997-07-16 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19106997A JP3391223B2 (ja) 1997-07-16 1997-07-16 文字認識装置

Publications (2)

Publication Number Publication Date
JPH1139429A JPH1139429A (ja) 1999-02-12
JP3391223B2 true JP3391223B2 (ja) 2003-03-31

Family

ID=16268363

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19106997A Expired - Fee Related JP3391223B2 (ja) 1997-07-16 1997-07-16 文字認識装置

Country Status (1)

Country Link
JP (1) JP3391223B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104346631A (zh) * 2013-07-30 2015-02-11 夏普株式会社 图像判别方法、图像处理装置以及图像输出装置

Also Published As

Publication number Publication date
JPH1139429A (ja) 1999-02-12

Similar Documents

Publication Publication Date Title
Cao et al. Text/graphics separation in maps
Kim et al. An architecture for handwritten text recognition systems
JP5907593B2 (ja) 画像認識装置、画像認識方法及びプログラム
CN107563380A (zh) 一种基于mser和swt相结合的车辆车牌检测识别方法
Ali et al. An efficient character segmentation algorithm for recognition of Arabic handwritten script
Zhan et al. A robust split-and-merge text segmentation approach for images
Roy et al. A novel approach to skew detection and character segmentation for handwritten Bangla words
Shaikh et al. Character segmentation of Sindhi, an Arabic style scripting language, using height profile vector
Sas et al. Three-stage method of text region extraction from diagram raster images
Bag et al. Character segmentation of handwritten Bangla text by vertex characterization of isothetic covers
JP3391223B2 (ja) 文字認識装置
Nguyen et al. Robust car license plate localization using a novel texture descriptor
Liu et al. A prototype system of courtesy amount recognition for Chinese Bank checks
KR20090111202A (ko) 한글의 기본 구성요소인 수평선, 수직선, 사선, 원의개수와 특성치를 이용한 한글인식 방법 및 장치
Patel An introduction to the process of optical character recognition
Basil et al. Comparative analysis of MSER and DTW for offline signature recognition
JP3344062B2 (ja) カタカナ手書き文字切り出し回路
Humied Segmentation accuracy for offline Arabic handwritten recognition based on bounding box algorithm
Gajjar et al. Top down hierarchical histogram based approach for printed devnagri script charecter isolation
Yadav et al. Offline Handwritten Character Recognition using Neural Networks
JP2832035B2 (ja) 文字認識装置
Leedham et al. Isolating individual handwritten characters
JP3710164B2 (ja) 画像処理装置及び方法
JP3209197B2 (ja) 文字認識装置及び文字認識プログラムを記録した記録媒体
JP2564276B2 (ja) パタ−ン認識方法および装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20021224

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080124

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090124

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100124

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110124

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110124

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120124

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130124

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130124

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140124

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees