JP3345246B2 - 文字認識装置及び文字認識方法 - Google Patents

文字認識装置及び文字認識方法

Info

Publication number
JP3345246B2
JP3345246B2 JP00173096A JP173096A JP3345246B2 JP 3345246 B2 JP3345246 B2 JP 3345246B2 JP 00173096 A JP00173096 A JP 00173096A JP 173096 A JP173096 A JP 173096A JP 3345246 B2 JP3345246 B2 JP 3345246B2
Authority
JP
Japan
Prior art keywords
character
line
erased
characters
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP00173096A
Other languages
English (en)
Other versions
JPH09190498A (ja
Inventor
美佐子 諏訪
悦伸 堀田
聡 直井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP00173096A priority Critical patent/JP3345246B2/ja
Priority to US08/778,621 priority patent/US6104833A/en
Priority to CNB971020116A priority patent/CN1156791C/zh
Priority to KR1019970000322A priority patent/KR100248917B1/ko
Publication of JPH09190498A publication Critical patent/JPH09190498A/ja
Priority to US09/363,020 priority patent/US6335986B1/en
Priority to US10/000,525 priority patent/US6850645B2/en
Priority to US10/000,506 priority patent/US6687401B2/en
Application granted granted Critical
Publication of JP3345246B2 publication Critical patent/JP3345246B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、光学的文字認識装
置(OCR)等の文字認識装置及び文字認識方法に係
り、特に、文字が表された原画の画像を入力し、入力さ
れた画像から文字の切出及び前処理を行う文字認識装置
及び文字認識方法に関する。
【0002】
【従来の技術】従来、図15(a)に示すように、光学
的文字認識装置(OCR)によって帳票に記載された文
字を認識するものがあった。従来例に係る装置は、文字
が表された原画の画像を入力し、入力された画像から文
字の切出し又は前処理を行う画像入力処理手段91と、
文字を消去するために6本以上の横線が引かれた文字を
判別する6本横線付文字判別手段92と、判別された6
本以上の横線付文字以外の文字について特徴を抽出し、
標準パターンと比較することによって文字の識別を行う
識別手段93とを有するものである。これによって、6
本以上の横線が付された文字は認識不能と判定される
(以下、「リジェクト」という)。
【0003】
【発明が解決しようとする課題】さて、従来例に係るO
CRでは、前述したように、帳票に間違って記入された
文字を消去しようとするには、6本以上の横線を記入す
る必要があるというルールがあった(JIS)。したが
って、一旦記入した文字を消去するには、6本以上の横
線を記入しなければならない。これは、記入者にとって
は大きな負担となるので、たとえこのルールを知ってい
ても、ほとんど守られていなかった。そのため、文字を
消すつもりで、誰が見ても明らかと思われる消線を付け
た文字であっても、前記ルールに合致しないためリジェ
クトされずに、誤読されてしまうという問題点を有して
いた。
【0004】例えば、同図(b)では、「0」を消去し
たつもりがリジェクトされずに、「8」と認識され、同
図(c)では、「1」を消去したつもりがリジェクトさ
れずに、「8」と認識され、同図(d)では、「7」を
消去したつもりがリジェクトされずに「4」と認識さ
れ、同図(e)では、「6」を消去したつもりが、リジ
ェクトされずに「6」と認識された例を示す。そこで、
本発明は、誰が見ても文字の消去を表す消線と認められ
るものについては、確実に消去して誤読を防止するが、
消線付文字以外の文字を消去することのない、使用者に
負担をかけずに信頼性良く文字を認識することができる
文字認識装置及び文字認識方法を提供することを目的と
してなされたものである。
【0005】
【課題を解決するための手段】以上の技術的課題を解決
するため、第一の発明は、図1に示すように、画像を入
力し、入力された画像からの文字パターンの切出し及び
前処理を行う画像入力処理手段11と、文字の消去を表
すものとして想定される横線若しくは縦線等の一定方向
の線分のみからなる単純消線又は複雑な線状をもつ複雑
消線のいずれかが付された消線文字であるか、消線の付
されていない通常文字であるかの判別処理を行う消線付
文字判別処理手段12と、文字の識別を行う識別手段1
3とを有するものである。
【0006】ここで、「画像の入力」は、文字が表され
た原画の画像を入力することをいい、例えば、帳票上の
文字の認識を行う場合には、帳票上の文字パターンを光
電変換部の読取り視野に搬送して、文字パターンを読み
取らせ、電気信号に変換し、二値化等によってディジタ
ル信号を出力することによって行う。「文字の切出し」
は、入力した雑音を含むディジタル画像のイメージデー
タから文字信号のみを切り出すことをいう。「前処理」
は、ノイズを除去し、文字の位置、大きさ、傾き、線幅
等の正規化等を行うことをいう。尚、消線付文字の判別
をも、前処理に入れても良い。「消線付文字」とは、そ
の文字を消去すべきことを表す消線が付された文字をい
い、本願発明では消線には、単純消線及び複雑消線があ
る。「単純消線」とは、文字の消去を表すものとして想
定された横線若しくは縦線等の一定方向の線分のみから
なる消線であって、例えば、横線、縦線、斜線等の線
が、1本又は2本等の本数が引かれた場合がある。ま
た、「一定方向」とは、必ずしも水平、垂直又は45°
の方向というような1方向に限られず、そのような方向
からのずれが所定範囲内にある消線であっても良く、例
えば、想定される消線が横線の場合には、当該横線(角
度θ=0 )から例えば±10°の範囲にある横線等も含
む。さらに、単純消線の判別処理は、必ずしも、横線等
の1種類の消線を想定する場合に限られず、複数の種類
の消線を想定して単純消線として判別するようにしも良
い。これによって、明らかに消線と認められるものを見
逃すことなく消去し、誤読取りを防止することができ
る。尚、後述する実施の形態では、隣接投影を行うこと
によって判別される。
【0007】「複雑消線」とは、文字上に複雑な線状を
描いて、文字を消去したものであって、複雑消線である
か否かを判別するには、例えば、第三の発明に示すよう
に、複雑量を抽出して判別する。「文字の識別」とは、
例えば、特徴抽出等を行って情報を圧縮し、得られたパ
ターンを入力として、予め用意された標準パターンとの
一致の程度を計算し、最も類似性が高い標準パターンの
カテゴリを認識結果として出力するものである。本発明
によれば、単純消線付文字及び複雑消線付文字について
判別処理を行い、通常文字について文字の識別を行うよ
うにしている。従って、予め想定した横線若しくは縦線
等が付された消線のみならず、当該消線よりややずれた
消線ではあるが、明らかに消線と認められる単純消線の
みならず、単純消線とは全く異なる複雑な線状をもって
いるが明らかに消線と認められるものについても漏れな
く消線として判別することができる。
【0008】第二の発明は、図2に示すように、第一の
発明において、前記消線付文字判別処理手段12は、前
記複雑消線付文字について判別処理を行う複雑消線付文
字判別処理手段14と、当該複雑消線付文字判別処理手
段14によって複雑消線付文字でないと判別された場合
には、単純消線を有すると判断された単純消線付文字候
補について、その消線を除去したものが文字として識別
可能か否かに基づいて、単純消線付文字の判別処理を行
う単純消線付文字判別処理手段15とを有するものであ
る。本発明によれば、最初に複雑消線付文字候補か否か
を判断した後に、複雑消線付文字候補でないと判別した
場合にのみ、単純消線付文字候補を判別するので、単純
消線を消去した場合に文字として識別できないものを消
線付文字でないとする誤認を防止し、確実で信頼性良く
消線付文字候補の判別を行うことができる。
【0009】第三の発明は、図3に示すように、第一の
発明において、前記消線付文字判別処理手段12は、切
り出され及び前処理の行われた文字パターンについて、
所定方向に関し隣接する所定範囲内にある画素毎に当該
所定方向に投影を行う隣接投影により計数した画素数、
又は、図形の複雑さを表す複雑量の少なくとも一方から
なる字形情報を抽出する字形情報抽出手段16と、当該
字形情報抽出手段16によって抽出された字形情報に基
づいて、単純消線付文字候補又は複雑消線付文字候補の
判別を行う判別手段17と、少なくとも前記単純消線付
文字候補から消線を除去した場合に前記識別手段13に
よって文字として識別できる場合には、単純消線付文字
として確定する消線付文字確定手段18とを有するもの
である。
【0010】ここで、「字形情報」は、「隣接投影によ
り計数した画素数」と「複雑量」の少なくとも一方から
なる情報である。「所定方向に関し隣接する」とは、横
線若しくは縦線等の前記一定方向に依存して定まる方向
に関し隣接することであり、通常は、当該一定方向に垂
直な方向であるが、必ずしも垂直に限られず、それに近
い方向であっても良い。後述する実施の形態では、消線
が横線の場合に文字パターンの垂直軸方向の例が示され
ている。また、「所定範囲内」とは、後述するように、
注目する画素を挟んで前記所定方向に隣接する画素の範
囲をいい、例えば、注目する画素を挟んだ3ドットのラ
インである。当該「所定範囲」は、狭くすれば、横線と
か縦線とかに近い線のみを単純消線として認識すること
ができるにすぎないが、広くすれば横線とか縦線からの
ずれが大きい線についても単純消線として認識すること
ができる。しかし、あまり広くすると、消線でない線も
消線として判断される可能性があり、経験や実験によっ
て適当に判断される。「隣接投影」とは、前記所定方向
に関し隣接する所定範囲内にある画素毎に、当該所定方
向に投影を行うことをいう。「複雑量」は、後述するよ
うに、例えば、所定方向の最大線密度、オイラー数、又
は黒画素密度等がある。
【0011】本発明では、前記単純消線付文字について
は、隣接投影によって得られた画素数、又、複雑消線付
文字については複雑量に基づいて判別するようにしてい
る。これらの複雑量または隣接投影によって得られる画
素数は、客観的、容易に、且つ高速に、信頼性良く得る
ことができるので、消線付文字の判別が容易で、高速
で、信頼性良く行うことができる。
【0012】第四の発明は、図4に示すように、第二の
発明において、前記複雑消線付文字判別処理手段14
は、図形の複雑さを表す複雑量を抽出する複雑量抽出手
段19と、抽出された複雑量に基づいて、複雑消線付文
字か否かを判別する複雑消線付文字判別手段20とを有
し、前記単純消線付文字判別処理手段15は、所定方向
に関し隣接する所定範囲内にある画素毎に当該所定方向
に投影を行う隣接投影により計数した画素数を算出する
画素ヒストグラム算出手段21と、算出された画素数に
基づいて、単純消線付文字候補の判別を行う単純消線付
文字候補判別手段22と、判別された単純消線付文字候
補について、消線を除去した場合に、前記識別手段13
によって、文字として識別できる場合には、単純消線付
文字として確定する単純消線付文字確定手段23とを有
するものである。第四の発明によれば、隣接投影で得ら
れた画素数、及び、複雑量の両者に基づいて、消線付文
字の判別を行うようにしている。したがって、第二の発
明で奏する効果の他に、消線付文字の判別は、より信頼
性良く行うことができる。
【0013】第五の発明は、図5に示すように、第四の
発明において、前記単純消線付文字確定手段23は、判
別された単純消線付文字候補から消線を除去して識別手
段13に送付する消線除去手段24と、消線が除去され
る前の単純消線付文字候補を格納する文字候補格納手段
26と、消線が除去された単純消線付文字候補が文字と
して識別できる場合には、単純消線付文字候補を各々単
純消線付文字として決定し、文字として識別できない場
合には、前記文字候補格納手段26に格納された単純消
線付文字候補を通常文字と決定して識別手段13に送付
する消線付文字決定手段25とを有するものである。第
五の発明によれば、消線除去手段24によって消線を除
去した消線付文字候補の除去前のものを一旦文字候補格
納手段26に格納するようにしている。したがって、消
線が除去された消線付文字候補が文字として識別できな
かった場合には、直ちに、当該消線付文字候補を当該格
納手段26から読み出して識別手段13に送出して、文
字の識別を行うので、簡単な構成で、高速に文字の識別
を行うことができる。
【0014】第六の発明は、図6に示すように、画像を
入力し、入力された画像からの文字パターンの切出し及
び前処理を行い(S1)、切り出され又は前処理が行わ
れた文字パターンについて、文字の消去を表すものとし
て想定される横線若しくは縦線等の一定方向の線分のみ
からなる単純消線又は複雑な線状をもつ複雑消線のいず
れかが付された消線付文字であるか、消線の付されてい
ない通常文字であるかの判別処理を行い(S2)、消線
が付されていない通常文字について文字の識別を行う
(S3)ことである。
【0015】第七の発明は、図7に示すように、画像を
入力し、入力された画像からの文字パターンの切出し及
び前処理を行い(S4)、切り出され又は前処理が行わ
れた文字パターンについて、複雑な線状をもつ複雑消線
が付された複雑消線付文字の判別処理を行い(S5)、
複雑消線付文字でないと判別された場合には、文字の消
去を表すものとして想定された横線若しくは縦線等の一
定方向の線分のみからなる単純消線が付された単純消線
付文字、又は、消線の付されていない通常文字か否かの
判別処理を行い(S6)、消線が付されていない通常文
字について文字の識別を行う(S7)ことである。
【0016】第八の発明は、図8に示すように、画像を
入力し、入力された画像からの文字パターンの切出し及
び前処理を行い(S11)、切り出され又は前処理が行
われた文字について、複雑な線状をもつ複雑消線が付さ
れた複雑消線付文字の判別処理を行い(S12)、複雑
消線付文字でないと判別された場合には、切り出され及
び前処理の行われた文字について、所定方向に関し隣接
する所定範囲内にある画素毎に当該所定方向に投影を行
う隣接投影により画素ヒストグラムを算出し(S1
3)、当該画素ヒストグラムに基づいて、単純消線付文
字候補の判別を行い(S14)、前記単純消線付文字候
補から消線を除去したものについて、文字として識別で
きる場合には、単純消線付文字として確定し、文字とし
て識別できない場合には、通常文字と確定し(S1
5)、確定された通常文字について、文字の識別を行う
(S16)ことである。
【0017】第九の発明は、図9に示すように、第八の
発明において、前記単純消線付文字候補から消線を除去
したものについて、文字として識別できる場合には、単
純消線付文字として確定し、文字として識別できない場
合には、通常文字と確定する場合に(S15)、単純消
線付文字候補か否かを判断し(S151)、消線付文字
候補である場合には、消線を除去し(S152)、消線
が除去された消線付文字候補について文字の識別を行
い、文字として識別できる場合には、単純消線付文字と
確定し、文字の識別ができなかった場合には、通常文字
と確定し(S153,S154)、前記通常文字の識別
の過程(S16)では、確定された通常文字について、
文字の識別を行い(S161、S162)、識別されな
かった場合には、エラー信号を出力し(S163)、識
別された場合には、その認識結果を出力し(S16
4)、消線付文字の場合には、消去する(S165)こ
とである。
【0018】
【発明の実施の形態】本発明の実施の形態に係る文字認
識装置及びその方法について、以下、図10〜図12に
基づいて説明する。本実施の形態に係る文字読取装置
は、図10に示すように、搬送され、帳票に記入された
文字パターンを光学的に読み取り、当該文字パターンを
電気信号に変換し、二値化等によってディジタル信号を
出力する光学的読取部30と、帳票を光学的読取部30
の光学的読取視野にまで搬送する搬送部31と、文字の
標準パターンを格納する辞書32と、画面上に表示を行
う表示部又は記録紙に印刷出力する出力部33と、使用
者が種々の操作を行う操作部34と、文字認識のための
種々の機能を有するCPU及びメモリ35とを有する。
【0019】さらに、前記CPU及びメモリ35は、同
図に示すように、入力された画像から文字の切出し及び
前処理を行う文字切出・前処理部36と、複雑な線状を
もつ複雑消線が付された複雑消線付文字について判別処
理を行う複雑消線付文字判別処理部37と、当該複雑消
線付文字判別処理部37によって複雑消線付文字でない
と判別された場合には、文字の消去を表すものとして想
定された横線若しくは縦線等の一定方向の線分のみから
なる単純消線が付された単純消線付文字候補について判
別処理を行う単純消線付文字判別処理部38と、消線付
文字又は通常文字について文字の識別を行う識別部39
と、消線付文字と判別された場合には当該文字を消去
し、通常文字と判別された場合には、その文字の識別結
果を、通常文字と判別された場合にも拘わらずその文字
が識別されなかった場合には、エラーの旨の出力を指示
する結果出力指示部40とを有する。
【0020】また、前記文字切出・前処理部36は、図
10に示すように、雑音を含む入力したディジタル画像
のイメージデータから文字信号(文字パターン)のみを
切り出す文字切出部41と、切り出された文字信号から
ノイズを除去し、文字の位置、大きさ等の正規かを行う
前処理部42とを有する。ここで、光学的読取部30、
搬送部31及び文字切出・前処理部36は、前記画像入
力処理部に相当する。
【0021】さらに、前記複雑消線付文字判別処理部3
7は、文字パターンから複雑量を抽出する複雑量抽出部
43と、抽出された複雑量に基づいて、複雑消線付文字
か否かを判別する複雑消線付文字判別部44とを有す
る。ここで、「複雑量」とは、例えば、所定方向の最大
線密度若しくは平均線密度等の線密度、オイラー数又は
黒画素密度等がある。「所定方向の線密度」とは、矩形
内の画像を所定の一定方向に沿って走査して、白画素か
ら黒画素(又は黒画素から白画素)に変化する部分を計
数したときの値をいう。当該例として、図11(b)に
は、縦方向の最大密度が“3”の例を示す。ここで、
「所定方向」とは、通常、単純消線として想定された線
分の一定方向に垂直な方向である。
【0022】「オイラー数」Eとは、画像中で、互いに
連結している連結成分の個数をC、当該画像が有する穴
の個数をHとしたとき、連結成分個数Cから、穴の個数
Hを引いた、E=C−Hをいう。当該例として、図11
(c)には、オイラー数E=1の例を示す。「黒(白)
画素密度」Dとは、注目する画像自体の面積B(黒(白)
画素数)に対する注目する画像の外接矩形の面積S
(総黒(白) 画素数)との比、D=S/Bをいう。
【0023】当該例として、図11(d)に、その内容
例を示す。尚、図11(a)は、複雑消線付文字の例を
示す。複雑消線付文字判別部44は、複雑消線付文字か
否かの判別は、特徴抽出された前記最大線密度、オイラ
ー数又は黒画素密度等の個々の複雑量又はこれらを適当
に組み合わせたものに基づいて行われる。抽出された複
雑量と、通常文字又は消線付文字との一般的な傾向は次
の通りである。
【0024】
【表1】
【0025】これらの複雑量に対して、既存の手法で予
め辞書または判別関数を求めておき、消線付文字か否か
を判別する。単純消線付文字等判別処理部38は、図1
0に示すように、前記所定方向に関し隣接する所定範囲
内にある画素毎に当該所定方向に投影を行う隣接投影に
より計数した画素数を算出する画素ヒストグラム算出部
45と、算出された画素数に基づいて、単純消線付文字
候補の判別を行う単純消線付文字候補判別部46と、判
別された単純消線付文字候補について、消線を除去した
場合に、前記識別部39によって、文字として識別でき
る場合には、単純消線付文字として確定する単純消線付
文字確定部47とを有する。ここで、「隣接投影」と
は、所定方向に関し隣接する所定範囲内(nライン)に
ある画素毎に当該所定方向に投影を行う(画素数を加算
する)ことをいう。本実施の形態では、単純消線を横線
とすると、所定方向は垂直方向であって、所定範囲は3
ラインである。
【0026】図12(a)(b)には隣接投影の説明を
示す。同図では、横線の単純消線に関し、隣接するnラ
イン(図12では3ライン)にある画素数を計数するn
ライン黒画素投影ヒストグラムを作成する。即ち図12
(a)の3ライン分毎の単純消線である横線に沿った方
向の画素数の和が同図(b)に示されている。前記単純
消線付文字候補判別部46は、前記ヒストグラム値が所
定の閾値を越えた場合に、対応する部分を横線の単純消
線をもつ単純消線付文字候補と判別する。図12(c)
に示すように、当該単純消線付文字候補判別部46によ
って、消線付文字候補として判別され、消線除去部50
によって消線が除去されたものについて、文字として識
別できれば、単純消線付文字決定部48によって、消線
付文字として決定され(上段の例)、文字として識別で
きない場合には、通常文字(非消線付文字)として決定
される(下段の例)。
【0027】さらに、単純消線付文字確定部47は、図
10に示すように、判別された単純消線付文字候補から
消線を除去して識別部39に送付する消線除去部50
と、判別された単純消線付文字候補が文字として認識さ
れた場合には、単純消線付文字候補を各々単純消線付文
字として決定し、文字として認識されなかった場合に
は、通常文字として決定して識別部39に送付する消線
付文字決定部48と、前記消線除去部50によって除去
された消線付文字候補を格納する文字候補格納部49と
を有する。さらに、前記識別部39は、各文字パターン
の特徴値を抽出して、情報を圧縮する特徴抽出部51
と、各文字の標準パターン、即ち、各文字種に対する特
徴値の辞書との照合を行う辞書照合部52とを有する。
【0028】続いて、本発明の実施の形態に係る文字認
識装置(OCR)及び文字認識方法の動作について図1
3及び図14に基づいて説明する。図13に示すよう
に、ステップSJ1で、前記搬送部31が、例えば、文
字が記入された帳票を光学的読取部30の読取視野に搬
送して、OCRに帳票を入力させる。
【0029】ステップSJ2で、当該光学定読取部30
は、光電変換によって、帳票上の文字パターンを電気信
号に変換し、二値化等によってディジタル信号として出
力する。ここで、帳票上には、例えば、記入された文字
及び文字と同色の文字枠があっても良い。ステップSJ
3で、前記文字切出部41は、雑音を含む当該ディジタ
ル信号から文字信号のみを一文字ずつに分離して切り出
し、前処理部42によって、文字の位置、大きさ、傾き
線幅の正規化等の処理が行われる。ステップSJ4で、
前記複雑消線付文字判別処理部37は、複雑消線付文字
の判別処理を行い、ステップSJ5で、複雑消線付文字
についてリジェクトを行う。
【0030】図14Aには、前記複雑消線付文字判別部
37の処理内容であるステップSJ4及びステップSJ
5について示す。ステップSJ41では、前記複雑量抽
出部43は、複雑消線付文字か否かを判別するために、
オイラー数、線密度、黒画素密度等の複雑量の抽出を行
う。すると、ステップSJ42では、前記複雑消線付文
字判別部44は、複雑量の全部又は一部と、前述した表
1を用いて、注目する文字パターンが、通常文字か、複
雑消線付文字かを判別する。
【0031】例えば、最大線密度が小さく、オイラー数
の絶対値が小さく、黒画素密度が小さければ複雑消線付
文字でないと判別され、最大線密度が大きく、オイラー
数の絶対値が負で大きく、黒画素密度が大きい場合に
は、複雑消線付文字と判別される。また、これらの複雑
量のうちの2つ以上が複雑消線付文字の傾向を示してい
る場合には、複雑消線付文字と判別するようにしても良
く、各複雑量のうちの1つのみを判別の基準に選んでも
良いし、2つを基準に選んでも良く、さらには各複雑量
に優先度を設定して、優先度に応じて判別しても良い。
【0032】ステップSJ43で、複雑消線付文字と判
別された場合には、前述したようにステップSJ5でリ
ジェクトと出力する。複雑消線付文字でないと判別され
た場合には、図13で示すように、ステップSJ6に進
み、横線、即ち単純消線の有無の判別処理が前記単純消
線付文字判別処理部38によってなされ、消線付文字と
判別された場合には、ステップSJ7でリジェクト(拒
否)される。
【0033】当該判別処理を図14Bで詳細に示す。同
図に示すように、ステップSJ61で、前記画素ヒスト
グラム算出部45によって隣接投影ヒストグラムが作成
される。隣接ヒストグラムは、図12(a)(b)に示
すように、例えば、単純消線である横線に垂直な縦方向
に、n=3ライン毎の黒画素の横線に沿った加算を1ラ
インずつずらせて行うことによって得られるものであ
る。これによって、消線の傾きを吸収し、単純消線であ
る横線がある程度ずれても、単純消線として判別するこ
とができる。
【0034】ステップSJ62で、前記単純消線付文字
候補判別部46は、当該ヒストグラム値が閾値Nを越え
た場合、ステップSJ63で消線ありと判定して単純消
線付文字候補と判別され、閾値Nを越えない場合には、
消線なしと判定され、通常文字候補と判別される。ステ
ップSJ63で、前記単純消線付文字候補判別部46に
よって、消線付文字候補と判別された場合には、ステッ
プSJ64に進み、消線付文字候補(消線除去前)を前
記文字候補格納部49に格納するとともに、前記消線除
去部50は、消線付文字候補の単純消線である横線を検
出し削除する。消線の除去は、例えば、nラインランレ
ングス等による線分の抽出法のような既存の方法を用い
る。
【0035】消線が除去された文字パターンは、ステッ
プSJ8に進み、前記識別部39で、特徴抽出を行うと
ともに、ステップSJ9で、抽出された特徴を基に辞書
照合が行われる。辞書照合は、予め用意された標準パタ
ーンとの一致の程度を計算し、最も類似性が高い標準パ
ターンのカテゴリを認識結果として出力する。ステップ
SJ65で、照合の結果がリジェクトであると判断され
た場合には、ステップSJ66で、前記単純消線付文字
決定部48は、消線付文字候補は、非消線対文字と決定
し、ステップSJ67で、前記文字候補格納部49へ一
旦格納した消線付文字候補を前記識別部39に送出し、
文字の識別を行わせ、前記結果出力指示部40は、その
識別結果を前記出力部33から出力させるように、指示
する。
【0036】ステップSJ65で、照合の結果、文字が
識別されたと判断された場合には、ステップSJ68に
進み、前記単純消線付文字決定部48は、当該消線付文
字候補を消線付文字と決定し、ステップSJ69で、識
別結果を「リジェクト」として、前記結果出力指示部4
0は前記出力部33に指示する。図12(c)の上段に
は、単純消線付文字候補について、消線が認識され、そ
の消線を除去したものが“5”と識別され、消線付文字
と決定された例を示し、その下段には、単純消線付文字
候補から、消線が認識され、その消線を除去したものが
リジェクトされたために、元の単純消線付文字候補が通
常文字と判別された例を示す。
【0037】以上説明したように、本実施の形態によれ
ば、複雑量として、所定方向の最大線密度、オイラー
数、及び黒画素線密度のすべてに基づいて、複雑消線付
文字の判定を行うようにしている。したがって、複雑消
線付文字の判別を、信頼性良く、かつ、高速に行うこと
ができる。また、本実施の形態によれば、単純消線付文
字候補の判別を、隣接投影による画素数の計数によって
行うようにしている。したがって、想定された横線の単
純消線のみならず、横線よりずれた線分を含む文字候補
の判別を、簡単な構成で、容易に、信頼性良く、且つ、
迅速に行うことができる。以上示したように、本実施の
形態によれば、消線付文字の誤読を、消線有無の判定処
理を行うことで、減少させる。また、消線によって消さ
れた文字を、より確実にリジェクトされる。また、以上
の実施の形態の例では、単純消線として横線又はそれか
らややずれた線の場合に付いて説明したが、当該場合に
限られることなく、縦線、斜め線又は×線であっても良
い。さらに、想定され得るこれらの線を全て単純消線と
して各々判別して、漏れのより少ない、信頼性のある文
字認識を行うことができる。
【0038】
【発明の効果】第一の発明又は第六の発明によれば、単
純消線又は複雑消線が付された消線付文字又は消線が付
されていない通常文字か否かを判別し、通常文字につい
て文字の識別を行うようにしている。したがって、ユー
ザは規定された消線の知識がなくても、またユーザに予
め消線についての指示を与えなくても、ユーザによって
明らかに消線と認められる線が付されている文字を漏れ
なく除去するので、ユーザに負担をかけることなく、簡
単な構成で、確実で、信頼性のある文字認識を行うこと
ができる。これによって、帳票等の記入の制限を減ら
し、ユーザの負担を軽減することができる。
【0039】第二の発明又は第七の発明は、消線付文字
の判別処理を行う際に、まず、複雑消線付文字の判別処
理を行い、複雑消線付文字でないと判別された場合にの
み、単純消線付文字候補の判別を行うようにしている。
したがって、効率的に、迅速に判別を行うことができ
る。さらに、単純消線付文字候補については、その消線
を除去したものが文字として識別可能な場合には、単純
消線付文字として確定し、文字として識別できないもの
を通常文字として確定している。したがって、複雑消線
については、既に排除されているので、通常文字の中に
複雑消線付文字が紛れ、誤読されることを防止する。ま
た、単純消線付文字候補と判別されたものでも、さら
に、文字として識別可能か否かを判断するようにしてい
るので、消線付文字か否かの判別がより確実で信頼性良
く行うことができる。
【0040】第三の発明、第四の発明、第八の発明、又
は第九の発明では、単純消線付文字又は複雑消線付文字
について、複雑量を抽出し、又は、隣接投影を行うこと
によって、判別するようにしている。したがって、簡単
な構成で、判別が容易で、迅速且つ確実に行うことがで
きる。第五の発明では、消線付文字又は通常文字を確定
する際に、消線を除去する前の消線付文字候補を一旦格
納し、消線が除去された文字候補が文字として識別でき
たなかった場合には、格納された消線付文字を通常文字
として文字の識別を行わせるようにしている。したがっ
て、第四の発明で奏する効果の他、簡単な構成で、かつ
高速に文字の認識を行うことができる。
【図面の簡単な説明】
【図1】第一の発明の原理ブロック図
【図2】第二の発明の原理ブロック図
【図3】第三の発明の原理ブロック図
【図4】第四の発明の原理ブロック図
【図5】第五の発明の原理ブロック図
【図6】第六の発明の原理流れ図
【図7】第七の発明の原理流れ図
【図8】第八の発明の原理流れ図
【図9】第九の発明の原理流れ図
【図10】実施の形態に係るブロック図
【図11】実施の形態に係る複雑量の説明図
【図12】実施の形態に係る隣接投影の説明図
【図13】実施の形態に係る流れ図(1)
【図14】実施の形態に係る流れ図(2)
【図15】従来例に係るブロック図及び誤認識例を示す
【符号の説明】
11…画像入力処理手段 12…消線付文字判別処理手段 13…識別手段 14…複雑消線付文字判別処理手段 15…単純消線付文字判別処理手段 16…字形情報抽出手段 17…消線付文字候補判別手段 18…消線付文字確定手段 19…複雑量抽出手段 20(37)…複雑消線付文字判別手段(複雑消線付文
字判別処理部) 21(45)…画素ヒストグラム算出手段(画素ヒスト
グラム算出部) 22(46)…単純消線付文字候補判別手段(単純消線
付文字候補判別部) 23(47)…単純消線付文字確定手段(単純消線付文
字確定部) 24(50)…消線除去手段(消線除去部) 25(48)…消線付文字決定手段(単純消線付文字決
定部)
フロントページの続き (56)参考文献 特開 平7−73270(JP,A) 特開 平9−81666(JP,A) 特開 平8−221520(JP,A) 特開 平8−202822(JP,A) 特開 平9−34985(JP,A) 特開 昭61−196377(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】 画像を入力し、入力された画像からの文
    字パターンの切出し及び前処理を行う画像入力処理手段
    と、 文字の消去を表すものとして想定される横線若しくは縦
    線等の一定方向の線分のみからなる単純消線又は複雑な
    線状をもつ複雑消線のいずれかが付された消線付文字で
    あるか、消線の付されていない通常文字であるかの判別
    処理を行う消線付文字判別処理手段と、 文字の識別を行う識別手段とを有し、 前記消線付文字判別処理手段は、 前記複雑消線付文字について判別処理を行う複雑消線付
    文字判別処理手段と、 当該複雑消線付文字判別処理手段によって複雑消線付文
    字でないと判別された場合には、単純消線を有すると判
    断された単純消線付文字候補について、その消線を除去
    したものが文字として識別可能か否かに基づいて、単純
    消線付文字の判別処理を行う単純消線付文字判別処理手
    段とを有 することを特徴とする文字認識装置。
  2. 【請求項2】 画像を入力し、入力された画像からの文
    字パターンの切出し及び前処理を行う画像入力処理手段
    と、 文字の消去を表すものとして想定される横線若しくは縦
    線等の一定方向の線分のみからなる単純消線又は複雑な
    線状をもつ複雑消線のいずれかが付された消線付文字で
    あるか、消線の付されていない通常文字であるかの判別
    処理を行う消線付文字判別処理手段と、 文字の識別を行う識別手段とを有し、 前記消線付文字判別処理手段は、 切り出され及び前処理の行われた文字パターンについ
    て、所定方向に関し隣接する所定範囲内にある画素毎に
    当該方向に投影を行う隣接投影により計数した画素数、
    又は、図形の複雑さを表す複雑量の少なくとも一方から
    なる字形情報を抽出する字形情報抽出手段と、 当該字形情報抽出手段によって抽出された字形情報に基
    づいて、単純消線付文字候補又は複雑消線付文字候補の
    判別を行う判別手段と、 少なくとも前記単純消線付文字候補から消線を除去した
    場合に前記識別手段によって文字として識別できる場合
    には、単純消線付文字として確定する消線付文字確定手
    段とを有することを特徴とする 文字認識装置。
  3. 【請求項3】 前記複雑消線付文字判別処理手段は、 図形の複雑さを表す複雑量を抽出する複雑量抽出手段
    と、 抽出された複雑量に基づいて、複雑消線付文字か否かを
    判別する複雑消線付文字判別手段とを有し、 前記単純消線付文字判別処理手段は、 所定方向に関し隣接する所定範囲内にある画素毎に当該
    方向に投影を行う隣接投影により計数した画素数を算出
    する画素ヒストグラム算出手段と、 算出された画素数に基づいて、単純消線付文字候補の判
    別を行う単純消線付文字候補判別手段と、 判別された単純消線付文字候補について、消線を除去し
    た場合に、前記識別手段によって、文字として識別でき
    る場合には、単純消線付文字として確定する単純消線付
    文字確定手段とを有することを特徴とする 請求項1記載
    の文字認識装置。
  4. 【請求項4】 前記単純消線付文字確定手段は、 判別された単純消線付文字候補から消線を除去して識別
    手段に送付する消線除去手段と、 消線が除去される前の単純消線付文字候補を格納する文
    字候補格納手段と、 消線が除去された単純消線付文字候補が文字として識別
    できる場合には、単純消線付文字候補を各々単純消線付
    文字として決定し、文字として識別できない場合には、
    前記文字候補格納手段に格納された単純消線付文字候補
    を通常文字と決定して識別手段に送付する消線付文字決
    定手段とを有することを特徴とする 請求項記載の文字
    認識装置。
  5. 【請求項5】 画像を入力し、入力された画像からの文
    字パターンの切出し及び前処理を行い、 切り出され又は前処理が行われた文字パターンについ
    て、複雑な線状をもつ複雑消線が付された複雑消線付文
    字の判別処理を行い、 複雑消線付文字でないと判別された場合には、文字の消
    去を表すものとして想定される横線若しくは縦線等の一
    定方向の線分のみからなる単純消線が付された単純消線
    付文字、又は、消線の付されていない通常文字か否かの
    判別処理を行い、 消線が付されていない通常文字について文字の識別を行
    うことを特徴とする文字認識方法。
  6. 【請求項6】 画像を入力し、入力された画像からの文
    字パターンの切出し及び前処理を行い、 切り出され又は前処理が行われた文字パターンについ
    て、複雑な線状をもつ複雑消線が付された複雑消線付文
    の判別処理を行い、複雑消線付文字でないと判別された場合には、切り出さ
    れ及び前処理の行われた文字について、所定方向に関し
    隣接する所定範囲内にある画素毎に当該方向に投影を行
    う隣接投影により画素ヒストグラムを算出し、 当該画素ヒストグラムに基づいて、単純消線付文字候補
    の判別を行い、 前記単純消線付文字候補から消線を除去したものについ
    て、文字として識別できる場合には、単純消線付文字と
    して確定し、文字として識別できない場合には、通常文
    字と確定し、 確定された通常文字について、文字の識別を行うことを
    特徴とする 文字認識方法。
  7. 【請求項7】 前記単純消線付文字候補から消線を除去
    したものについて、文字として識別できる場合には、単
    純消線付文字として確定し、文字として識別できない場
    合には、通常文字と確定する場合に、 単純消線付文字候補か否かを判断し、 消線付文字候補である場合には、消線を除去し、 消線が除去された消線付文字候補について文字の識別を
    行い、文字として識別できる場合には、単純消線付文字
    と確定し、文字の識別ができなかった場合には、通常文
    字と確定し、 前記通常文字の識別の過程では、 確定された通常文字について、文字の識別を行い、 識別されなかった場合には、エラー信号を出力し、 識別された場合には、その認識結果を出力し、 消線付文字の場合には、消去することを特徴とする 請求
    記載の文字認識方法。
JP00173096A 1996-01-09 1996-01-09 文字認識装置及び文字認識方法 Expired - Fee Related JP3345246B2 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP00173096A JP3345246B2 (ja) 1996-01-09 1996-01-09 文字認識装置及び文字認識方法
US08/778,621 US6104833A (en) 1996-01-09 1997-01-03 Pattern recognizing apparatus and method
CNB971020116A CN1156791C (zh) 1996-01-09 1997-01-08 模式识别设备与方法
KR1019970000322A KR100248917B1 (ko) 1996-01-09 1997-01-09 패턴인식장치및방법
US09/363,020 US6335986B1 (en) 1996-01-09 1999-07-29 Pattern recognizing apparatus and method
US10/000,525 US6850645B2 (en) 1996-01-09 2001-12-04 Pattern recognizing apparatus
US10/000,506 US6687401B2 (en) 1996-01-09 2001-12-04 Pattern recognizing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00173096A JP3345246B2 (ja) 1996-01-09 1996-01-09 文字認識装置及び文字認識方法

Publications (2)

Publication Number Publication Date
JPH09190498A JPH09190498A (ja) 1997-07-22
JP3345246B2 true JP3345246B2 (ja) 2002-11-18

Family

ID=11509686

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00173096A Expired - Fee Related JP3345246B2 (ja) 1996-01-09 1996-01-09 文字認識装置及び文字認識方法

Country Status (1)

Country Link
JP (1) JP3345246B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011237993A (ja) * 2010-05-10 2011-11-24 Fuji Xerox Co Ltd 情報入力装置及び情報入力プログラム
JP7326753B2 (ja) * 2019-01-24 2023-08-16 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Also Published As

Publication number Publication date
JPH09190498A (ja) 1997-07-22

Similar Documents

Publication Publication Date Title
Kanai et al. Automated evaluation of OCR zoning
US5410611A (en) Method for identifying word bounding boxes in text
JP3294995B2 (ja) 帳票読取装置
JP3943638B2 (ja) Ocrを利用しない文書画像中のドロップワードの自動認識方法
US7136526B2 (en) Character string recognition apparatus, character string recognizing method, and storage medium therefor
JPH07105312A (ja) 光学式文字読取装置における文字イメージのごみ除去方法及び装置
JP3345246B2 (ja) 文字認識装置及び文字認識方法
JP3186246B2 (ja) 文書読取装置
JPH0291789A (ja) 文字認識方法
JP3086653B2 (ja) 文字認識方法及び文字認識装置
JP2581353B2 (ja) グラフ画像登録システム
JPH11191135A (ja) 文書画像の日本語英語判定方法、文書認識方法および記録媒体
JP3135290B2 (ja) 画像処理方法及び装置
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JP3186712B2 (ja) 文書読取装置
JPH0490083A (ja) 文字認識装置
JPS5949671A (ja) 光学的文字読取装置
JP3220226B2 (ja) 文字列方向判別方法
JP3090928B2 (ja) 文字認識装置
JP2887823B2 (ja) 文書認識装置
JP2972443B2 (ja) 文字認識装置
JPH03217993A (ja) 文字サイズ認識装置
JP2000207491A (ja) 文字列読取方法及び装置
JPH0792819B2 (ja) パターン切出しおよび認識方法とそのシステム
JP2000113101A (ja) 文字切り出し方法および装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020820

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080830

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100830

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110830

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120830

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120830

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130830

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees