JP2002366900A - 光学式文字読取装置 - Google Patents

光学式文字読取装置

Info

Publication number
JP2002366900A
JP2002366900A JP2001176989A JP2001176989A JP2002366900A JP 2002366900 A JP2002366900 A JP 2002366900A JP 2001176989 A JP2001176989 A JP 2001176989A JP 2001176989 A JP2001176989 A JP 2001176989A JP 2002366900 A JP2002366900 A JP 2002366900A
Authority
JP
Japan
Prior art keywords
character
interference
recognition
dictionary
ruled line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001176989A
Other languages
English (en)
Other versions
JP3794285B2 (ja
Inventor
Masanami Oki
昌並 沖
Takayuki Nishida
孝之 西田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2001176989A priority Critical patent/JP3794285B2/ja
Publication of JP2002366900A publication Critical patent/JP2002366900A/ja
Application granted granted Critical
Publication of JP3794285B2 publication Critical patent/JP3794285B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 罫線を有する帳票に記入された文字の読み取
りにおいて、罫線と文字ストロークが接触・交差してい
る場合においても誤認識を低減した光学式文字読取装置
を提供する。 【解決手段】 領域抽出部102で認識対象領域を抽出
し、罫線抽出部103で罫線を抽出し、罫線消去部10
4で罫線を消去し、文字位置抽出部105で罫線消去画
像に対して各文字の位置を抽出する。干渉判定部106
で干渉無しと判定された認識対象領域は通常辞書113
を用いて文字認識部109で文字認識を行う。干渉有り
と判定された認識対象領域は、干渉位置抽出部107に
より干渉位置を抽出する。干渉辞書生成部108におい
て、干渉辞書115を生成し、その辞書を用いて文字認
識部109で文字認識を行う。最後に、正読判定部11
0は前記文字認識部109で得られた認識結果が正読で
ある可能性を判定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、紙面に記入された
文字イメージを光学的に取りこんで、文字認識処理を行
う光学式文字読取装置に関し、特に罫線を有する帳票に
記入された活字文字の読み取りにおいて、罫線と文字ス
トロークが接触・交差している場合において誤認識を低
減するリジェクト機能を有した光学式文字読取装置に関
する。
【0002】
【従来の技術】光学式文字読取装置では、一般に、帳票
に印刷された罫線をドロップアウトカラーで印刷する場
合と非ドロップアウトカラーで印刷する場合がある。前
者は容易に実現可能であるが、後者は文字のストローク
と罫線が一部重なっている(以下、干渉と呼ぶ)場合に十
分な精度で認識できないという問題がある。
【0003】この問題を解決しようとする第一の従来技
術が特開2000−322510号公報に記載されてい
る。この公報の記載によると、まず、罫線を消去した
後、画像から残存ノイズを消去する。次に残存ノイズ消
去後の画像に、文字部分の垂直分離成分を結合する。罫
線消去処理で消去した文字部分の抽出を行う。最後に、
抽出した文字部分を、残存ノイズ消去後の画像に対して
補完し、罫線消去処理により消去された文字部分を復元
する。これにより、罫線に干渉した文字の誤認識を防止
できるとされている。
【0004】一方、消去された文字ストロークを復元せ
ずに認識を行う第二の従来技術が特開2001−228
89号公報に記載されている。この手法は罫線と接触し
ていない文字用の辞書(通常辞書)と罫線と接触してい
る文字用の辞書(罫線接触文字用辞書)をあらかじめ生
成しておき、認識用辞書選択部で、罫線と文字の接触の
有無を判定し、罫線と文字の接触がないと判定された場
合は通常辞書だけを、接触があると判定された場合は通
常辞書と罫線接触文字用辞書を選択して文字認識を行う
ことにより、罫線に干渉した文字の誤認識を防止できる
とされている。
【0005】
【発明が解決しようとする課題】上記第一の従来技術を
用いて復元を行うと誤った復元を行う場合がある。例え
ば、図16に示す16Aが16Bのように罫線と干渉
(交差)している場合、罫線消去処理を行うと16Cの
ようになる。このとき、上記の手法を用いて復元処理を
行うと16Dのようになる。このように、本来は「6」
であるのに、誤った復元を行ったため字形が「0」に類
似してしまい、誤認識を引き起こす問題がある。また、
図16に示す16Eが16Fのように罫線と干渉(接
触)している場合、罫線消去処理を行うと16Gのよう
になる。この場合、「7」を「1」に誤認識する可能性
があるが、上記の手法はこの問題に対応していない。特
に、認識対象が活字文字の場合は、活字を構成する水平
方向と垂直方向の文字のストロークが完全に罫線と接触
してしまうことが多く、そのような文字への対応が十分
でないため、誤認識を引き起こす問題がある。
【0006】上記第二の従来技術ではあらかじめ文字ス
トロークの一部が欠けた文字画像を用いて罫線接触文字
用辞書を生成している。しかし、罫線と文字の干渉パタ
ーンには接触の他に交差の場合があるが、第二の従来技
術の手法はこれに対応していない。交差を考慮に入れる
と、あらかじめ生成しておかなければならない罫線接触
文字用辞書数は増大するため、容易に実現することは難
しい。仮に、辞書数を限定して生成しても、この手法の
辞書選択方法では、交差している位置を特定することが
できないため、処理量、処理時間の増大が避けられな
い。また、前述と同様に図16に示す16Cを認識対象
とした場合、「0」と「6」のどちらの文字ストローク
の一部が欠けているのか判断できないため、誤認識が生
じる可能性がある。図16に示す16Eのような接触の
場合においても罫線接触文字用辞書の「1」と「7」、
および通常辞書の「1」が類似してしまい、必ずしも
「1」と「7」の誤認識を回避できるとは限らない。
【0007】以上に述べた課題を解決するために、本発
明は、罫線を有する帳票に記入された活字文字の読み取
りにおいて、罫線と文字ストロークが交差・接触してい
る場合でも正読率を低下することなく誤認識を引き起こ
す可能性がある場合には適切にリジェクトする機能を有
した光学式文字読取装置を提供する。
【0008】本発明の目的は、罫線を有する帳票に記入
された文字の読み取りにおいて、罫線と文字ストローク
が交差・接触している場合においても誤認識を低減した
光学式文字読取装置を提供することにある。
【0009】
【課題を解決するための手段】本発明による光学式文字
読取装置は、帳票画像入力部にて帳票イメージの取り込
みを行う。領域抽出部は領域位置情報保存メモリに予め
格納されている領域位置情報を参照して帳票イメージか
ら認識対象領域を抽出する。罫線抽出部は前記認識対象
領域の中から罫線を抽出し、罫線消去部は抽出された罫
線を消去した画像(以降、罫線消去画像と呼ぶ)を作成
する。文字位置抽出部は前記罫線消去画像から各文字の
位置を抽出する。
【0010】干渉判定部は罫線と認識対象文字との位置
関係について「交差」、「接触」、「干渉無し」の3種
類の状態のうちのいずれかを判定する。上記干渉判定部
で干渉無しと判定された認識対象領域は、文字認識部に
おいて通常辞書保存メモリに予め格納されている通常辞
書を用いて文字認識が行われる。
【0011】一方、前記干渉判定部で干渉 (交差、接
触) 有りと判定された認識対象領域については、干渉位
置抽出部において干渉位置を抽出する。次に干渉辞書生
成部において干渉文字用の辞書(干渉辞書)を生成す
る。そして、文字認識部は上記干渉辞書を用いて文字認
識を行う。
【0012】最後に、正読判定部は上記文字認識部で得
られた認識結果が正読である可能性を判定する。そし
て、その判定の結果、正読していると判定された場合
は、上記認識結果を出力する。一方、誤読している可能
性があると判定された場合は、強制リジェクトする。こ
れにより誤認識を低減できる。
【0013】
【発明の実施の形態】(本発明の第一の実施の形態)次
に、本発明の第一の実施の形態について図1を参照して
説明する。本発明の第一の実施の形態は、イメージスキ
ャナ等の帳票画像入力部101と、領域位置情報保存メ
モリ111に格納されている領域位置情報を用いて認識
対象領域を抽出する領域抽出部102と、罫線位置情報
保存メモリ111に格納されている罫線位置情報を用い
て罫線を抽出する罫線抽出部103と、抽出された罫線
を消去する罫線消去部104と、罫線消去部104で得
られる罫線消去画像から文字が存在する位置を抽出する
文字位置抽出部105と、罫線と文字ストロークとの干
渉の状態 (交差、接触、干渉なし)を判定する干渉判定
部106と、前記干渉判定部106で干渉 (交差、接
触) 有りと判定された場合に干渉位置を抽出する干渉位
置抽出部107と、前記干渉判定部106で干渉有りと
判定された場合に文字パターン辞書保存メモリ114に
格納されている文字パターン画像に対して前記干渉位置
抽出部107で抽出された干渉位置を含む部分を消去し
た干渉辞書を生成する干渉辞書生成部108と、前記干
渉辞書または通常辞書を用いて認識を行う文字認識部1
09と、正読判定辞書保存メモリ115に格納されてい
る正読判定辞書を用いて正読の可能性を判定する正読判
定部110から構成される。
【0014】以下に図1における各構成要素の機能につ
いて詳細に説明する。
【0015】領域位置情報保存メモリ111には、認識
対象の文字が記入された領域の領域位置情報が格納され
ている。前記領域位置情報には、図17に示すように認
識対象とする領域の領域番号と左上座標と右下座標が含
まれる。罫線位置情報保存メモリ112は、罫線消去部
104で消去を行う罫線の始点座標と終点座標が格納さ
れている。
【0016】文字パターン辞書保存メモリ114には、
干渉辞書生成部108で干渉辞書を生成するときに使用
する活字フォントの文字パターン画像がフォント別に格
納されている。また、格納されている文字パターン画像
ごとに幅と高さの情報も保存している。
【0017】通常辞書保存メモリ113には、ストロー
クに欠損部分がない文字パターンから生成された辞書
(通常辞書)が格納されている。この通常辞書は文字認
識部109で使用される。
【0018】干渉辞書保存メモリ115には、干渉辞書
生成部108で生成される干渉辞書が格納される。この
干渉辞書は、干渉判定部106で干渉有りと判定された
場合に文字認識部109で使用される。
【0019】次に、図2のフローチャートも参照し、本
発明の光学式文字読取装置の動作を順を追って説明す
る。
【0020】まず、帳票画像入力部101は処理対象と
なる帳票の画像をイメージスキャナを用いて入力する
(ステップ201)。なお入力される画像は2値画像、
多値画像のどちらでもよい。
【0021】次に、領域抽出部102は領域位置情報保
存メモリ111に格納されている予め作成しておいた領
域位置情報を用いて認識対象領域の抽出を行う(ステッ
プ202)。入力された画像に傾きが生じている場合
は、後処理を簡単化するために図3のように認識対象領
域を回転に対して補正した領域画像(以降、補正認識領
域画像)を生成する。また、罫線と文字ストロークが干
渉している場合、認識対象領域から文字パターン(スト
ローク)がはみ出すため、文字パターン辞書保存メモリ
114に格納している文字高さ分のマージンを上下左右
に持たせた補正認識領域画像を生成する。
【0022】次に、罫線抽出部103は前記補正認識領
域画像33に対して罫線の抽出を行う(ステップ20
3)。この罫線抽出部103の動作については後述す
る。
【0023】次に、罫線消去部104は抽出された罫線
を前記補正認識領域画像33から消去する(ステップ2
04)。罫線の消去は前記罫線抽出部103において検
出された罫線範囲内の黒画素を白画素に置き換えること
で実現可能である。
【0024】次に、文字位置抽出部105は前記罫線消
去画像に対して文字位置の抽出を行う(ステップ20
5)。文字位置は文字パターンの外接矩形枠の左上座標
と右下座標とで表すものとする。以下に文字位置抽出部
105の動作の一例を述べる。抽出には、例えば、罫線
消去画像に対して輪郭線ラベリング手法を利用すること
ができる。この手法を利用すると、図13に示すように
横罫線が文字と干渉している場合は、本来1つのパター
ンに対して縦方向に131A、131Bの2つのラベル
が生成される。また、縦罫線が文字と干渉している場合
は、本来1つのパターンに対して横方向に133A、1
33Bの2つのラベルが生成される。そこで、次に罫線
抽出部103で求めた標準罫線幅を利用して、標準罫線
幅だけ離れているラベル同士を結合する処理を行う。こ
れにより、131A、131Bは132のような1つの
ラベル、すなわち1つの文字パターンになる。同様に1
33A、133Bは134のようになる。
【0025】ステップ205までの処理が終了すると、
次に干渉判定部106は罫線と文字ストロークが干渉し
ているか否かの判定を行う(ステップ206)。干渉判
定部106の動作については後述する。ここで干渉無し
と判定された場合は、文字認識部109は通常辞書を用
いた文字認識を実行し、その認識結果を出力する(ステ
ップ207)。
【0026】一方、前記干渉判定部106で干渉有りと
判定された場合は、まず、干渉位置抽出部107で罫線
と文字ストロークの干渉位置を抽出する(ステップ20
8)。干渉位置抽出部107の動作については後述す
る。
【0027】次に干渉辞書生成部108は文字パターン
辞書保存メモリ114に格納している文字パターン画像
を用いて干渉辞書を生成する(ステップ209)。干渉
辞書生成部108の動作については後述する。
【0028】次に、前記文字認識部109は干渉辞書を
用いた文字認識を実行する(ステップ210)。次に正
読判定部110は、前記文字認識部109で得られた認
識結果が正読である可能性を正読判定辞書保存メモリ1
16に格納されている正読判定辞書を参照して判定する
(ステップ211)。なお、正読判定辞書の詳細につい
ては後述する。また、干渉判定部106で干渉有りと判
定されたときのみ前記正読判定部110を実行する。正
読判定辞書を参照した結果、正読の可能性が100%の
場合は、そのときの認識結果を出力する(ステップ21
2)。一方、正読の可能性が100%でない場合は、強
制リジェクトする(ステップ213)。このようにすれ
ば、欠損によって区別がつかなくなってしまった文字パ
ターンを無理に認識して誤った結果を出力することが避
けられる。
【0029】1つの認識対象領域に対する処理が終了す
ると、ステップ202に戻り、次の認識対象領域に対す
る処理を行う。すべての認識対象領域に対して処理が終
わると、入力画像に対する処理が完了する。
【0030】以上が本発明の第一の実施の形態の全体の
動作である。次に、各部の動作について詳細に説明す
る。
【0031】まず、罫線抽出部103の動作の一例を図
4を用いて説明する。罫線抽出部103は前記補正認識
領域画像に対して罫線位置抽出を行う。まず、罫線位置
情報保存メモリ112に格納されている罫線位置情報を
用いて罫線が存在する矩形領域(罫線存在領域)を求める
(ステップ41)。次に、前記罫線存在領域に対して垂
直方向に探索し、黒ランの長さに関するヒストグラムを
生成する。このヒストグラムの最頻値を標準罫線幅とす
る(ステップ42)。次に、罫線存在領域内の黒画素部
分のうち標準罫線幅に等しい黒ラン長の黒画素部分を横
罫線の場合は水平方向、縦罫線の場合は垂直方向に投影
する(ステップ43)。そして、投影数のピークを算出
し、正確な罫線存在領域を抽出する(ステップ44)。
すなわち、図6に示すような罫線と文字の境界線61、
境界線62を求める。
【0032】次に干渉判定部106の動作について詳細
に説明する。干渉判定部106は、注目している認識対
象領域内で罫線と文字ストロークの関係が「交差」、
「接触」、「干渉なし」のどれにあてはまるか判定す
る。図5に示すように罫線と文字ストロークの関係に
は、a)罫線と文字が交差する場合は、罫線抽出部10
3で求めた2本の境界線に隣接した黒画素が存在する、
b)罫線と文字が接触している場合は、どちらか一方の
境界線に隣接した黒画素が存在する、c)罫線と文字が
干渉しない場合は、どちらの境界線にも隣接する黒画素
が存在しないという条件が存在する。これら3つの条件
を用いて「交差」、「接触」、「干渉なし」を判定す
る。ここで、文字と罫線の重なった状態を交差と接触と
にわけて判定する意図について説明する。罫線消去画像
から「接触」文字を切出すと、接触部分が消去されてい
るために切出された画像は実際の文字の高さよりも低く
なる。「接触」においては、この欠落した高さ情報を干
渉位置抽出部107で補正する必要があるために接触と
交差にわけて判定する。図8に干渉判定部106の詳細
なフローチャートを示す。まず、文字パターン上端から
下方へ探索して1つ目の境界線51の上側に隣接する黒
画素を検出する(ステップ81)。次に、2つ目の境界
線52の下側に隣接する黒画素を検出する(ステップ8
2)。その結果、2つの境界線に対して黒画素が検出さ
れない場合は「干渉無し」と判断して終了する。黒画素
が存在した場合は、交差と接触の判定を行う(ステップ
83)。2つの境界線で黒画素が検出された場合は「交
差」と判定し、いずれか1つの境界線でしか検出されな
かった場合は「接触」と判定する(ステップ86)。
【0033】次に干渉位置抽出部107の動作について
詳細に説明する。干渉位置抽出部107は、罫線と文字
ストロークが干渉している位置の抽出を行う。この干渉
位置抽出には、前記罫線抽出部103で得られる罫線の
位置情報と前記文字位置抽出部105で得られる文字の
位置情報を利用する。図7に示す罫線と文字の境界線6
1、境界線62が前記罫線抽出部103で得られる罫線
の上端、下端であり、点線で囲まれた領域が前記文字位
置抽出部105で得られる文字の外接矩形枠である。図
7を例に交差している場合の干渉位置抽出部107の動
作を説明する。補正認識領域画像の左上を原点A(0、
0)としたとき、罫線と文字の境界線61のY座標をL
1、境界線62のY座標をL2とする。また文字位置7
1の上側のY座標をC1、下側のY座標をC2とする。
このとき、図7の B(文字の外接矩形の左上角)を原
点としたときの罫線と文字ストロークが干渉している部
分の最小座標値K1、最大座標値K2は以下のように表
される。 K1= L1−C1 K2= L2−C1 接触している場合は、前記罫線抽出部103で得られる
罫線の位置情報と前記文字位置抽出部105で得られる
文字の位置情報から接触している部分が上端、下端(縦
罫線の場合は、左端、右端)のどちらであるかを求めて
干渉位置を抽出する。
【0034】次に干渉辞書生成部108の動作について
説明する。干渉辞書生成部108は、文字パターン辞書
保存メモリ114に格納されている文字パターン画像か
ら前記干渉位置抽出部107で求めた干渉位置を含む領
域を消去した画像を生成する。図9に示すように91が
罫線除去画像から抽出された文字パターンであり、92
は文字パターン辞書保存メモリ114に格納されている
文字パターン画像すべてに対して前記干渉位置抽出部1
07で求めた干渉位置を消去した画像である。これらを
干渉辞書として使用する。
【0035】次に正読判定部110で使用する正読判定
辞書の詳細について説明する。正読判定辞書は罫線消去
によって文字ストロークの一部が欠損することにより字
形が類似してしまい、区別がつきにくくなる文字カテゴ
リの組合せの情報を保持している。この情報は予め実験
により定めておく。例えば、図11に示すように文字パ
ターン「6」がL1、L2の位置で消去された場合、
「0」、「3」、「6」、「8」、「9」の5種類の文
字と混同する可能性があるという情報である。このとき
の5種類の文字を混同対象文字と呼ぶことにする。この
情報をあらかじめ図12に示すような形式で保持してい
るものとする。図12は文字パターン「6」の正読判定
辞書を表している。図12の横方向はL1のY座標を示
しており、縦方向はL2のY座標を示している(但し、
L1≦L2とする)。図11の例を基に図12を参照す
ると、L1とL2の交わる部分1202に20という値
が格納されている。これは、(1/(混同対象文字
数))×100という計算式から求めた値である(この
場合、(1/5)×100=20となる)。これは、
「6」である可能性が20%であることを示している。
なお、図示しないがこのときの混同対象文字(「0」、
「3」、「6」、「8」、「9」)も1202に格納さ
れているものとする。この正読判定辞書は、各文字パタ
ーンに対してある位置(L1〜L2)を擬似的に消去した
画像を作成し、パターンマッチング等により確信度を測
定し、上位候補の確信度にあまり差異が現れない組合せ
を混同する組合せとして登録することにより、あらかじ
め定めておく。なお、この正読判定辞書は認識対象とし
ているすべての文字に対して作成されて保持している。
【0036】これにより、誤認識を低減するという効果
が得られ、認識精度を向上することができる。
【0037】(本発明の第二の実施の形態)図14は本
発明の第二の実施の形態における光学式文字読取装置の
構成を示すブロック図である。図15はこの光学式文字
読取装置における動作を示すフローチャートである。前
記第一の実施の形態との装置構成における相違点は、図
14において、欠損文字復元部117が追加されている
点である。欠損文字復元部117は罫線消去画像から切
出された、ストロークが欠損している文字(欠損文字)
に対して復元処理を行う。
【0038】次に、本発明の第二の実施の形態の動作を
説明する。動作はステップ201〜211まで第一の実
施の形態と同じである。以下では動作の相違点について
のみ説明する。図15において、ステップ214とステ
ップ215とステップ216が追加されたステップであ
る。
【0039】まず、干渉パターンが交差か接触かを判定
する(ステップ214)。接触の場合は文字ストローク
に欠損が残ってしまう場合や復元が不完全な場合などが
あるため、強制リジェクトする。交差の場合は欠損文字
復元部117で欠損文字に対して文字ストロークの復元
を行い、復元文字画像を生成する。復元方法は、例えば
図10に示すように罫線抽出部103で得られた罫線と
文字の境界線51の上端と境界線52の下端に罫線方向
に対して垂直な方向にそれぞれ黒画素が存在する場合、
結合する処理を利用することができる。次に、文字認識
部109は復元文字画像に対して通常辞書を用いて文字
認識を行う(ステップ215)。通常辞書を用いて文字
認識を行った時の認識結果を干渉辞書を用いて文字認識
を行った時の結果と比較し(ステップ216)、それら
が同じであれば認識結果を出力する(ステップ21
2)。それぞれの認識結果が異なっていれば強制リジェ
クトとする(ステップ213)。
【0040】以上に述べたように、第一の実施の形態で
は正読可能性が100%でないため強制リジェクトされ
ていた文字パターンでも、第二の実施の形態では簡単な
復元処理を行うことにより、誤認識を回避しつつ、認識
を行うことが可能となる。
【0041】
【発明の効果】以上説明したように、本発明には以下の
効果がある。
【0042】従来の光学式文字読取装置では、罫線と文
字ストロークが交差、または接触する場合に十分な精度
で読み取ることができなかったが、本発明によれば、罫
線と文字ストロークが干渉している文字(入力)パター
ンに対して、干渉文字用の辞書を内部で生成し、その辞
書を用いて文字認識を行うことにより、通常辞書を用い
た場合に比べて認識精度を向上させることができるとい
う効果がある。その理由は、干渉文字用の辞書は、文字
認識を行う際に文字ストロークの欠損部分が影響しない
ように、予め入力パターンと同じ干渉位置を消去した画
像を用いているためである。
【0043】更に、請求項6により、図16のように欠
損によって区別がつかなくなってしまった文字パターン
に対して無理に認識して誤った結果を出力することが避
けられることができるという効果がある。その理由は、
あらかじめ罫線と文字ストロークの干渉によって生じる
文字の混同パターンの情報を正読判定辞書として生成
し、その情報を内部で参照することにより、認識結果に
対する正読判定を行うためである。
【0044】更に、請求項2、請求項5により、罫線と
文字ストロークが干渉していない文字については従来の
認識精度を維持できるという効果がある。その理由は、
干渉の有無を判定し、通常辞書と干渉辞書を使い分ける
機能を備えているためである。
【図面の簡単な説明】
【図1】本発明の第一の実施の形態による光学式文字読
取装置のブロック図である。
【図2】第一の実施の形態の処理手順を示すフローチャ
ートである。
【図3】領域抽出部で生成される補正認識領域画像を例
示する図である。
【図4】罫線抽出部の処理手順を示すフローチャートで
ある。
【図5】罫線と文字ストロークの干渉判定の説明図であ
る。
【図6】罫線抽出部で抽出される罫線と文字ストローク
の境界線を例示する図である。
【図7】干渉位置抽出部で交差の場合の干渉位置の抽出
方法を例示した図である。
【図8】干渉位置抽出部の処理手順を示すフローチャー
トである。。
【図9】干渉辞書生成部で生成される干渉辞書を例示し
た図である。
【図10】欠損文字復元部での復元処理の方法を例示し
た図である。
【図11】正読判定辞書に格納されている混同する文字
を例示した図である。
【図12】正読判定辞書の書式を例示した図である。
【図13】文字位置抽出部で抽出される文字パターンの
外接矩形枠を例示した図である。
【図14】本発明の第二の実施の形態による光学式文字
読取装置のブロック図である。
【図15】第二の実施の形態の処理手順を示すフローチ
ャートである。
【図16】誤った復元を例示した図である。
【図17】領域位置情報の書式を例示した図である。
【符号の説明】
101 帳票画像入力部 102 領域抽出部 103 罫線抽出部 104 罫線消去部 105 文字位置抽出部 106 干渉判定部 107 干渉位置抽出部 108 干渉辞書生成部 109 文字認識部 110 正読判定部 111 領域位置情報保存メモリ 112 罫線位置情報保存メモリ 113 通常辞書保存メモリ 114 文字パターン辞書保存メモリ 115 干渉辞書保存メモリ 116 正読判定辞書保存メモリ 117 欠損文字復元部

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】罫線を有する帳票に記入された文字を読み
    取る光学式文字読取装置であって、 処理対象の画像を入力するための帳票画像入力部と、 前記帳票画像入力部より得られる入力画像上の認識対象
    領域を抽出する領域抽出部と、 前記認識対象領域から罫線を抽出する罫線抽出部と、 該抽出された罫線を前記認識対象領域から消去する罫線
    消去部と、 前記罫線消去部から得られる画像から文字が存在する位
    置を抽出する文字位置抽出部と、 前記認識対象領域における罫線と文字との干渉の有無を
    判定する干渉判定部と、 前記干渉判定部で干渉有りと判定された場合、干渉位置
    を抽出する干渉位置抽出部と、 前記干渉位置抽出部で抽出された干渉位置をもとに干渉
    した文字用の辞書を生成する干渉辞書生成部と、 前記干渉した文字用の辞書と干渉しない文字用の辞書を
    用いて認識を行う文字認識部と、 前記干渉した文字用の辞書を用いた文字認識の認識結果
    に対して正読の可能性を判定し、正読していると判定さ
    れた場合は、前記認識結果を出力すし、誤読している可
    能性があると判定された場合は、強制リジェクトする正
    読判定部とを備えている光学式文字読取装置。
  2. 【請求項2】 前記干渉判定部は、前記認識対象領域に
    おける罫線と文字ストロークとの干渉の有無を判定する
    ことを特徴とする、請求項1記載の光学式文字読取装
    置。
  3. 【請求項3】 前記認識対象領域における罫線と文字ス
    トロークの境界線に隣接する黒画素の組合せから罫線と
    文字ストロークとの干渉の状態を「交差」「接触」「干
    渉無し」に分類することを特徴とする、請求項2記載の
    光学式文字読取装置。
  4. 【請求項4】 前記干渉辞書生成部は、前記干渉の有無
    の判定で干渉有りと判定された場合において、罫線と文
    字との干渉位置を検出し、予め蓄積している文字画像か
    ら、前記干渉位置に相当する部分を消去して干渉した文
    字用の辞書を生成することを特徴とする、請求項1記載
    の光学式文字読取装置
  5. 【請求項5】 前記文字認識部は、前記干渉の有無の判
    定で干渉無しと判定された場合は、罫線と干渉しない文
    字用の辞書を用いて文字認識を行い、前記干渉の有無の
    判定で干渉有りと判定された場合は、干渉した文字用の
    辞書を用いて文字認識を行うことを特徴とする、請求項
    1記載の光学式文字読取装置。
  6. 【請求項6】 前記正読判定部は、予め罫線消去によっ
    て文字ストロークの一部が欠損することにより字形が類
    似してしまい、区別がつきにくくなる文字カテゴリの情
    報を求め、この情報を内部で参照することにより、認識
    結果の正読の可能性を判定することを特徴とする、請求
    項1記載の光学式文字読取装置。
  7. 【請求項7】 罫線消去画像から切出された、ストロー
    クが欠損している文字に対して復元処理を行う欠損文字
    復元部を更に備えている、請求項1記載の光学式文字読
    取装置。
  8. 【請求項8】 前記欠損文字復元部は、干渉パターンが
    交差の場合は、欠損文字に対して文字ストロークの復元
    を行い、復元文字画像を生成することを特徴とする、請
    求項7記載の光学式文字読取装置。
  9. 【請求項9】 前記文字認識部は、復元文字画像に対し
    て通常辞書を用いて文字認識を行い、通常辞書を用いて
    文字認識を行った時の認識結果を干渉辞書を用いて文字
    認識を行った時の結果と比較し、それらが同じであれば
    認識結果を出力し、それぞれの認識結果が異なっていれ
    ば強制リジェクトとすることを特徴とする、請求項8記
    載の光学式文字読取装置。
JP2001176989A 2001-06-12 2001-06-12 光学式文字読取装置 Expired - Fee Related JP3794285B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001176989A JP3794285B2 (ja) 2001-06-12 2001-06-12 光学式文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001176989A JP3794285B2 (ja) 2001-06-12 2001-06-12 光学式文字読取装置

Publications (2)

Publication Number Publication Date
JP2002366900A true JP2002366900A (ja) 2002-12-20
JP3794285B2 JP3794285B2 (ja) 2006-07-05

Family

ID=19017903

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001176989A Expired - Fee Related JP3794285B2 (ja) 2001-06-12 2001-06-12 光学式文字読取装置

Country Status (1)

Country Link
JP (1) JP3794285B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008071173A (ja) * 2006-09-14 2008-03-27 Fujitsu Ltd 文字認識プログラム、文字認識方法および文字認識装置
JP2009134427A (ja) * 2007-11-29 2009-06-18 Kyocera Mita Corp 画像処理装置及び画像処理プログラム
JP2015097067A (ja) * 2013-11-15 2015-05-21 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理装置の制御方法、およびプログラム
JP2018037117A (ja) * 2017-12-07 2018-03-08 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理装置の制御方法、およびプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008071173A (ja) * 2006-09-14 2008-03-27 Fujitsu Ltd 文字認識プログラム、文字認識方法および文字認識装置
JP2009134427A (ja) * 2007-11-29 2009-06-18 Kyocera Mita Corp 画像処理装置及び画像処理プログラム
JP2015097067A (ja) * 2013-11-15 2015-05-21 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理装置の制御方法、およびプログラム
JP2018037117A (ja) * 2017-12-07 2018-03-08 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理装置の制御方法、およびプログラム

Also Published As

Publication number Publication date
JP3794285B2 (ja) 2006-07-05

Similar Documents

Publication Publication Date Title
JP4977368B2 (ja) 媒体処理装置,媒体処理方法,媒体処理システム,及び媒体処理プログラムを記録したコンピュータ読取可能な記録媒体
US6947596B2 (en) Character recognition method, program and recording medium
JP3936436B2 (ja) 表認識方法
JPH07105312A (ja) 光学式文字読取装置における文字イメージのごみ除去方法及び装置
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP3794285B2 (ja) 光学式文字読取装置
US7103220B2 (en) Image processing apparatus, method and program, and storage medium
JP4117648B2 (ja) 帳票、帳票処理方法、帳票処理プログラム、帳票処理プログラムを記録した記録媒体及び帳票処理装置
JP2020119291A (ja) 情報処理装置及びプログラム
JP2877380B2 (ja) 光学的文字読取装置
JP2002170077A (ja) 文字認識装置及び文字認識方法
JP4580520B2 (ja) 文字認識方法および文字認識装置
JP2000207491A (ja) 文字列読取方法及び装置
JP3239965B2 (ja) 文字認識装置
JP2925270B2 (ja) 文字読取装置
KR100286709B1 (ko) 영문자열에서의 개별문자 분리 방법
JP2000020641A (ja) 文字認識システム
JP4571447B2 (ja) 文字画像抽出プログラム、文字画像抽出方法および文字画像抽出装置
JP2001147988A (ja) 文字認識方法及び文字認識装置
JP2004013188A (ja) 帳票読取り装置および帳票読取り方法ならびプログラム
JP4270767B2 (ja) 罫線情報処理方法と罫線情報処理プログラムと画像処理装置及び記憶媒体
JPH08221518A (ja) 光学文字読取装置
JP4878057B2 (ja) 文字認識方法,プログラム及び記録媒体
JPH10134145A (ja) 文字切り出し方法およびそれを用いた文字認識装置と、その文字切り出し方法を実行するプログラムを格納した、コンピュータが読取可能な記憶媒体
JPH11184962A (ja) 光学的文字読取装置、照合修正方法、及び記録媒体

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20041130

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20041130

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050727

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050926

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051227

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20051227

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20051227

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060404

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100421

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110421

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees