JP3092576B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP3092576B2
JP3092576B2 JP10025126A JP2512698A JP3092576B2 JP 3092576 B2 JP3092576 B2 JP 3092576B2 JP 10025126 A JP10025126 A JP 10025126A JP 2512698 A JP2512698 A JP 2512698A JP 3092576 B2 JP3092576 B2 JP 3092576B2
Authority
JP
Japan
Prior art keywords
character
candidate
cutting
line width
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP10025126A
Other languages
English (en)
Other versions
JPH11213091A (ja
Inventor
大輔 西脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP10025126A priority Critical patent/JP3092576B2/ja
Priority to US09/234,840 priority patent/US6198846B1/en
Publication of JPH11213091A publication Critical patent/JPH11213091A/ja
Application granted granted Critical
Publication of JP3092576B2 publication Critical patent/JP3092576B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識装置に関
し、特に紙面に書かれた文字を自動的に認識する文字認
識装置に関する。
【0002】
【従来の技術】文字同士の接触を含む文字の認識は、例
えば、図18に示すように、接触しているパタンから接
触部分を検出し、接触部分でパタンを切り離し、文字候
補に分離した後、文字認識部で文字候補の字種を決定す
る。
【0003】この種の文字認識装置は、1行分の領域を
抽出する文字列切出し手段101と、文字列切り出し手
段101から1文字分に相当する領域を切り出す文字候
補切り出し手段201と、文字候補切出し手段201に
よって切り出された文字候補を認識する文字認識手段3
01と、文字認識を行う際に、予め認識用の参照パタン
を格納しておく文字認識辞書302と、及び文字認識手
段301によって得られた結果を検証する手段401と
を備えて成る。
【0004】かかる構成を有する文字認識装置の第1の
例が、特開昭59−098283号公報にパターン切出
しおよび認識方式として開示されている。この方式で
は、図19で示すような接触文字に対し、文字認識辞書
に文字切出し部の出力として得られる正しくない文字切
り出し結果も含めて、文字認識辞書302に登録してお
く。この正しくない文字切り出し結果から作られた辞書
に候補文字パタンがヒットした場合には、文字認識部3
01は、ヒットした字種と同時に、それが正しくない位
置で切断された文字、すなわち部分パタンであることを
出力する。さにら切断した左右の文字候補の認識結果が
共に部分パタンでないことを認識結果検証手段401で
検証し、その場合にのみ認識結果を出力することを特徴
としている。
【0005】図19において3箇所の矢印は、切断候補
位置の例を示すが、ここで正しい文字切り出しを最右の
矢印とすると、この位置で切断した際に、左右のパタン
が共に部分パタンでない「0」と認識された場合に、
「00」と出力する。
【0006】従来の文字認識装置の第2の例が、特開平
6−170065号公報に文字認識装置として開示され
ている。この装置においては、文字候補切出し手段20
1で文字列パタンの水平方向への投影プロファイルか
ら、その極小地点を検出しそこで切断することにより、
接触文字パタンを分離すると同時に、プロファイルで極
小点が見つからなかった場合には、その部分を分離せず
にまとめて認識する。このため、投影プロファイルを用
いて切り離せないパタンを切り離すことなく、まとめて
認識可能な特別な文字認識手段301および接触文字に
対する参照パタンを蓄える文字認識辞書302を有す
る。
【0007】従来の文字認識装置の第3の例が、特開平
01−181176号公報に文字認識装置として開示さ
れている。この文字認識装置は、文字候補切り出し手段
201が、他の文字と接触していない文字を検出する手
段と、他の文字と接触している文字同士を検出する手段
で構成されている。後者において、前述の第2の例のよ
うに切出し位置を文字パタンの水平方向への単純な投影
プロファイルを用いて一意に決定する代わりに、水平方
向に画素毎に接触文字パタンを2分割していき、その分
割点で得られるそれぞれの認識結果の評価値の平均が最
も良くなる位置を検出し、その位置で切断する。
【0008】以上の3例に示すように、従来の文字認識
装置においては、いずれも接触文字パタンに対する切断
候補を複数用意しておき、それらの候補から文字認識結
果として最良の組み合わせを選んでいる。
【0009】しかしながら、図20に示すように切断候
補の選択の仕方によっては、誤った切断位置で文字認識
が別の文字に誤って認識してしまう場合がある。この例
では、右の文字候補を文字認識部が「2」と誤認識して
いる。
【0010】
【発明が解決しようとする課題】前述のような従来の文
字認識装置では、いずれも接触文字パタンに対して誤っ
た切り出しから得られた文字候補パタンが文字認識部で
誤って別の字種に認識されてしまう可能性が大である。
【0011】そこで、本発明の目的は、接触文字パタン
に対して誤った切り出しから得られた文字候補パタンが
文字認識部で誤って別の字種に認識されてしまうという
誤読を低減させ、読み取り性能を向上させた文字認識装
置を提供することにある。
【0012】
【課題を解決するための手段】前述の課題を解決するた
め本発明による文字認識装置は、次のような特徴的構成
を有する。
【0013】(1)接触文字を含む文字列を帳票中から
切り出し、文字の切断位置を切断候補として抽出し、前
記切断候補に基づいて1文字に相当する領域を文字候補
パタンとして抽出する第1の手段と、前記文字候補パタ
ンの抽出により抽出された文字候補パタンの切断面に対
する切断形状を抽出する第2の手段と、前記文字候補パ
タンと前記文字候補パタンの切断面に対する切断形状か
ら文字種を判定する際、前記文字候補パタンに対する文
字種と前記文字候補パタンの切断形状の組み合わせが正
しいかを検証して正しい組み合わせに対応する文字種を
文字認識結果として出力する第3の手段と、を備えて成
ることにより文字列中の文字を認識することを特徴とす
る文字認識装置。
【0014】(2)文字同士の接触を含む文字列から切
断候補を抽出し、前記切断候補に基づいて文字候補パタ
ンを抽出した後、文字認識部で前記文字候補パタンの文
字種を判定することにより文字列中の文字を認識する文
字認識装置において、前記接触文字を含む文字列から文
字候補パタンを抽出して文字認識部で文字種を判定する
際、切断形状毎に文字認識部の参照パタンを格納した文
字認識辞書を用いて、前記文字候補パタンに対する文字
種と切断形状を出力し、その文字種と切断形状の組み合
わせに対し、認識結果として出力してよいものの文字種
を認識結果して出力することを特徴とする文字認識装
置。
【0015】(3)文字同士の接触を含む文字列1列分
を帳票中から切り出す文字列切出し手段と、前記文字列
切出し手段において切り出された文字同士の接触を含む
文字列から文字の切断位置の候補を抽出する切断候補検
出手段と、前記切断候補検出手段で抽出された切断位置
に基づき、1文字に相当する領域を文字候補パタンとし
て抽出する文字候補切出し手段と、前記文字候補切出し
手段で抽出された文字候補パタンの切断位置に対する切
断形状を判定する切断形状検出手段と、前記文字候補切
出し手段で得られた文字候補パタンと前記切断形状検出
手段で得られた文字候補パタンの切断形状から文字種を
判定する文字認識手段と、前記文字認識手段が認識時に
参照する文字種ならびに切断形状毎に登録された参照パ
タンを格納する文字認識辞書と、前記文字認識手段で得
られた文字候補パタンに対する文字種と切断形状を用い
て、文字種と切断形状の組み合わせが正しいかを検証す
る認識結果検証手段と、前記認識結果検証手段の文字候
補パタンに対する文字種と切断形状の正しい組み合わせ
を格納する検証ルール格納手段とを備え、前記文字認識
手段は、切断形状毎に参照パタンを格納した前記文字認
識辞書を用いて、最も近い参照パタンに対する字種と切
断形状を出力し、前記認識結果検証手段は、前記文字認
識手段から出力された文字候補パタンに対する文字種と
切断形状の組み合わせに対し、認識結果として出力して
よい組み合わせを格納してある前記検証ルール格納手段
を参照し、該当するものがあれば前記文字認識手段から
出力された文字候補パタンに対する文字種を認識結果と
して出力することを特徴とする文字認識装置。
【0016】(4)前記検証ルール格納手段には、正し
い切断位置と該切断位置における切断形状と文字種の組
み合わせのみならず、誤った切断位置とその時の切断形
状と文字種の組み合わせを格納し、前記認識結果検証手
段においては、正しい切断位置のみならず、それを含む
複数の切断位置を用いて、接触文字を読取る(3)の文
字認識装置。
【0017】(5)前記文字認識辞書は、前記切断形状
検出手段で得られる切断形状毎に参照パタン格納位置を
記憶するインデックスを有する(3)の文字認識装置。
【0018】(6)前記切断候補検出手段は、文字列方
向と垂直な方向の文字線画素に対するラン長の変化する
点を切断候補として検出し、その切断形状として、1)
線幅相当のランが線幅以上になる部分、2)線幅相当ラ
ンの両端が線幅以上になる部分、3)線幅相当のランが
一定以上続く際の中点部分、4)線幅相当のランが、文
字列方向に一定の間移動する間に定数倍以上になる部
分、これら4種が検出不能な際に、5)接触文字パタン
に対するループを検出し、該ループの最上点、最下点に
接触するランをそれぞれ始点として前記線幅相当のラン
が線幅以上になる部分、線幅相当ランの両端が線幅以上
になる部分、線幅相当のランが一定以上続く際の中点部
分を求め、これらを切断形状として用いる(3)の文字
認識装置。
【0019】(7)前記切断候補検出手段は、文字列方
向と垂直な方向の文字線画素に対するラン長の変化する
点を切断候補として検出し、その切断形状として、1)
線幅相当のランが線幅以上になる部分、2)線幅相当ラ
ンの両端が線幅以上になる部分、3)線幅相当のランが
一定以上続く際の中点部分、4)線幅相当のランが、文
字列方向に一定の間移動する間に定数倍以上になる部
分、これら4種が検出不能な際に、5)接触文字パタン
に対するループを検出し、該ループの最上点、最下点に
接触するランをそれぞれ始点として前記線幅相当のラン
が線幅以上になる部分、線幅相当ランの両端が線幅以上
になる部分、線幅相当のランが一定以上続く際の中点部
分を求め、これらを切断形状として用いる際、該切断形
状を前出ラン長の変化検出時に、文字列の右端から左端
方向に向かって検出するものと、文字列パタンの左端か
ら右端方向に向かって検出するものとを別の切断形状と
する(3)の文字認識装置。
【0020】(8)前記切断候補検出手段は、前記文字
列中に互いに文字接触のない場合には、文字列方向に対
して垂直に文字の投影を取り、射影値が0となるところ
を選んで1文字に相当する領域を切り出す(3)の文字
認識装置。
【0021】(9)前記切断候補検出手段は、文字パタ
ン同士が互いに入り組み、文字の投影では分離できない
場合には、文字画像に対して文字を構成する画素の連結
領域を検出し、同一の領域を1文字として1文字に相当
する領域を切り出す(3)の文字認識装置。
【0022】(10)前記切断候補は、文字線幅に相当
する垂直ランの長さが急激に長くなる部分、文字線幅相
当の垂直ランの長さが、その両端で急激に長くなる部
分、文字線幅相当の垂直ランの長さが、ある水平位置か
ら垂直ランのトレース方向に一定幅以内で長くなる部
分、または文字線幅相当の垂直ランが一定幅以上連続す
る場合の連続区間の中点部分とする(3)の文字認識装
置。前記文字候補切出し手段は、文字候補の切出しを終
わった時点で、切出された各孤立ブロックの横幅が文字
列の高さを基準に一定の定数をかけたものを越える場合
に、そのブロックは接触文字を含むブロックと判断す
る。また、前記文字候補切出し手段は、接触文字を含む
ブロックの幅から何文字の接触であるかを推定し、切断
数を決定する。ここで、前記文字候補切出し手段による
切断数の決定は、前記接触ブロック幅または文字枠幅を
文字列高さで割って求める。更に、文字認識辞書は、認
識対象字種に対する参照パタンを、予め学習パタンから
作られた、文字の切断情報別に格納している。更にま
た、接触文字パタンを学習パタンに使い、前述の接触文
字の切断方法を使い、分離した文字パタンとその際同時
に得られた切断形状情報を格納する。
【0023】すなわち、従来の文字認識装置に生ずる問
題は、文字候補切出し時に、接触パタンの切断に関する
情報を文字認識部が利用していないために発生するもの
で、これを解決するために本発明では、図18のような
従来の文字認識装置に対して、新たに接触文字パタンか
ら文字候補を切出す際、切出し位置における形状特徴を
同時に検出する手段と、認識結果の検証時に認識結果と
して、出力してよい、接触文字パタンに対する文字認識
結果と切出し位置における接触形状を格納する検証ルー
ル格納手段を有する。
【0024】すなわち、従来の文字認識装置に生ずる問
題は、文字候補切出し時に、接触パタンの切断に関する
情報を文字認識部が利用していないために発生するもの
で、これを解決するために本発明では、図18のような
従来の文字認識装置に対して、新たに接触文字パタンか
ら文字候補を切出す際、切出し位置における形状特徴を
同時に検出する手段と、認識結果の検証時に認識結果と
して、出力してよい、接触文字パタンに対する文字認識
結果と切出し位置における切断形状を格納する検証ルー
ル格納手段を有する。
【0025】
【発明の実施の形態】以下、本発明の実施の形態につい
て添付図面を参照しながら説明する。図1は、本発明に
よる文字認識装置の一実施形態の基本構成図である。本
実施形態における文字認識装置は、接触文字を含む文字
列を帳票中から切り出す文字列切出し手段11と、文字
列切出し手段11から文字の切断位置の候補を抽出する
切断候補検出手段21と、切断候補検出手段21で検出
された切断位置を選択することで、1文字に相当すると
考えられる領域を抽出する文字候補切出し手段31と、
切断候補切出し手段31で切断されたパタンの切断形状
を抽出する切断形状検出手段32と、文字候補切出し手
段31で得られた文字候補パタンと切断形状検出手段3
2で得られた文字候補パタンの切断形状から文字種を判
定する文字認識手段41と、文字認識手段41が認識時
に参照する文字種、接触形状毎に登録された参照パタン
を格納する文字認識辞書42と、文字認識手段41で得
られた文字候補パタンに対する文字種と切断形状を用い
て、文字種と切断形状の組み合わせが正しいか否かを検
証する認識結果検証手段51と、認識結果検証手段51
の文字候補パタンに対する文字種と切断形状の正しい組
み合わせを格納する検証ルール格納手段52を備えて成
る。
【0026】次に、図1に示す実施形態の動作を説明す
る。文字列切出し手段11によって抽出した文字列は、
切断候補検出手段21で切断候補位置を検出する。文字
候補切出し手段31においては、切断候補検出手段21
で得られた切断候補を用いて接触文字候補を切り出す。
このとき、新たに設ける切断形状検出手段32におい
て、切出し位置がどのような形状であるかを同時に検出
する。文字認識手段41では、この切断形状毎に参照パ
タンを格納した文字認識辞書42を用いて、最も近い参
照パタンに対する文字種と切断形状を出力する。認識結
果検証手段51では、文字認識手段から出力された接触
文字パタンに対する文字種とそれらを切断した際の切断
形状の組み合わせに対し、認識結果として出力してよい
組み合わせを格納してある検証ルール格納手段を参照
し、該当するものがあれば認識結果として出力し、そう
でない場合には、別の切断位置から文字候補パタンと切
断形状を抽出し、上記を繰り返す。
【0027】より具体的に本実施形態の動作を説明す
る。文字列切出し手段11は、帳票等、読み取り対象と
なる誌面の画像から、1列分の文字列領域を切出す手段
であり、画像の入力、すなわち光電変換は、通常のスキ
ャナを用いればよく、更に、前記の文字列を切り出すた
めには、入力した帳票画像に対し、水平方向及び垂直方
向に文字画像成分の投影プロファイルを取り、投影値の
高い部分を水平方向、垂直方向それぞれに検出すること
で取り出せる。また、認識対象の領域の座標を予め格納
しておけば、前記スキャナで画像を入力した直後に直ち
に取り出すことが可能である。
【0028】次に、切断候補検出手段21は、1文字に
相当する領域を切り出す。前記文字列画像中に互いに文
字接触のない場合には、文字列方向に対して垂直に文字
の投影を取り、射影値が0となるところを選べばよい。
また、文字パタン同士が互いに入り組み、文字の投影で
は分離できない場合には、文字画像に対して文字を構成
する画素の連結領域を検出し、同一の領域を1文字とす
ればよい。連結領域を検出する方法は、例えば、ランラ
ベリングを用いればよい。さらに、この方法でも分離が
不能な場合には文字パタン同士が互いに接触しているの
で、接触文字パタンをどこかで切断する。この際に切断
候補検出手段は、例えば、「西脇他:ラン特徴を用いた
接触手書き文字の切り出し認識、95信学全大、D−1
85」を用いればよい。
【0029】この方法を用いた場合に検出される切断候
補の例を図10から図15に示す。図10は文字線幅に
相当する垂直ランの長さが急激に長くなる部分で、T型
接触点と呼ぶ。図11は、文字線幅相当の垂直ランの長
さが、その両端で急激に長くなる部分でくびれ点と呼
ぶ。図12は、文字相当の垂直ランの長さが、ある水平
位置から垂直ランのトレース方向に一定幅以内で長くな
る部分で、Y型接触点と呼ぶ。図13は、文字線幅相当
の垂直ランが一定幅以上連続する場合の連続区間の中点
部分であり、直線接触点と呼ぶ。
【0030】上記図10から図13の切断候補が検出で
きなかった場合には、接触文字パタンに存在するループ
を検出する。ループの検出は、例えば、「長尾 真編:
岩波講座情報科学21 パターン認識と図形処理,p.
163,岩波書店(1983)」に一般的手法として紹
介されているように、1走査線毎の重なりを調べる方法
を背景部分に適用することで実現できることは勿論であ
る。図14,図15は、このようにして検出されたルー
プの最上点、最下点に接触する文字線要素に対する垂直
ランと、その垂直ランを基準に図10から図13で示し
た、T型接触点、くびれ点、Y型接触点、直線接触点を
検出したもので、前記最上点に対し1箇所、最下点に対
し1箇所求めることにより、2点で接触するパタンを切
り離す。これを2点接触と呼ぶ。尚、図14、図15の
ように、ループが複数検出できる場合には、ループの中
心が接触文字パタンの中心に一番近いものを選択すれば
よいことは明らかである。
【0031】次に、文字候補切出し手段31について説
明する。ここでは、前記文字列領域から1文字に相当す
る領域を文字候補パタンとして切り出す。前記ラベリン
グによる文字候補の切出しを終わった時点で、切出され
た各孤立ブロックの横幅Wが文字列の高さHを基準に一
定の定数kをかけたものを越える場合に、そのブロック
は接触文字を含むブロックと判断する。
【0032】接触文字を含むブロックは、その幅Wから
何文字の接触であるかを推定し、切断数を決定する。例
えば、接触ブロック幅Wを文字列高さHで割ってもよ
し、予め文字列の桁数及び記入枠の位置がわかる場合に
は、接触ブロック幅Wの代わりに、文字枠幅Wfを用い
てもよい。切断数が決定されたら、切断数が1の場合に
は、2分割であるから、切断候補検出手段21で検出さ
れている切断候補から1個を選択し、そこで接触文字パ
タンを分割する。以下、切断数がnの場合には、n個の
切断候補を選択すれば、n+1個の文字候補パタンが得ら
れる。これを次の文字認識手段41に送る。
【0033】次に、切断形状検出手段32について説明
する。切断形状検出手段32では、文字候補切出し手段
31で文字候補パタンを切り出す際に使った接触形状を
抽出する。文字候補切出し手段31から、どの切断候補
を選択したかを受け、その切断候補に該当する図10か
ら図15で説明した切断点の名称を切断情報として次の
文字認識手段41に送る。具体的には、分割された文字
候補パタンに対して、それらの右と左がどの切断点であ
るかを送る。例えば、2文字の接触の場合、左の文字候
補パタンに対しては、左の切断情報は接触でないので、
切断情報は何もないという意味でヌルを、右の切断情報
は、右の文字候補パタンと分離した際の切断点の名称を
出力する。
【0034】次に、文字認識手段41について説明す
る。文字認識手段では、文字候補切出し手段31から受
け取った文字候補パタンがどの文字種であるかを識別す
る。識別に用いる特徴は、文字候補画像を構成する画素
の白黒情報を用いればよく、その他にも例えば、「津雲
他:方向パタンマッチングの改良と手書き漢字認識への
応用、信学研資、PRU90−20(1990)」を用
いてもよい。また識別法としては、単純類似度法を使え
ばよい。単純類似度Sは、参照用の特徴パタンをベクト
ルTで表した場合、入力パタンから得た特徴パタンXに
対し、次式で表現できる。 S=(X,T)/|X|・|T| (1) 但し、(X,T)はXとTの内積、||はノルムを表
す。
【0035】その他、識別法としては、参照パタンの特
徴ベクトルTと入力パタンの特徴ベクトルXのユークリ
ッド距離の最短を検出する方式等、従来から知られてい
る文字認識方式を用いればよい。前述の参照用の特徴パ
タンは、学習用のパタンを用いて、予め文字認識辞書4
2に格納しておく。次に認識結果検証手段51について
説明する。認識結果検証手段は、文字認識手段41から
切断した文字候補パタンに対する文字種と、それらを切
断した際の切断形状の名称を受取り、それを最終的な認
識結果として出力するかを判定する。この判定には、予
め学習用のパタンを使って作った最終結果として出力し
てよい文字種とそれらを切断した際の切断形状が格納さ
れている。
【0036】検証ルール格納手段52を参照し、登録さ
れているもののみを最終結果として出力し、該当するも
のがない場合には、別の切断候補に対して、同じ処理を
繰り返す。検証ルール格納手段52に格納する情報とし
ては、2文字の接触の場合を例にとると、図16に示す
ようになる。このように構成することで、例えば、図5
のような「54」という接触文字パタンがある場合、切
断候補は同図矢印のようになるが、これら3個の切断候
補に対して、認識を行うと、それぞれ図6から図8のよ
うになる。
【0037】図16に示すように、このうち最終認識結
果として出力できるものは、図8の結果となり、正しく
接触文字の切出しと認識ができる。また、検証ルール格
納手段52における検証ルールとしては、図16のよう
に図10から図15に示したものを使用するが、特に図
10のT型接触図12のY型接触点などは、文字ストロ
ークの右から左への接触、または左から右への接触を表
すので、図17に示すようにこの2種類の切断形状に対
して、左から右、右から左といった接触の方向を追加し
てもかまわない。出力可能な最終結果が複数存在する場
合には、文字候補パタンに対する認識結果から信頼度を
計算し、その積が高いものを第1候補として出力する。
信頼度の計算方法としては、例えば、文字認識辞書42
に格納されている読み取り対象となる文字種毎に、特徴
ベクトルの分布を1次元もしくは多次元正規分布関数p
(x)で近似しておき、候補文字パタンに対する特徴ベ
クトルXに対しp(x)もって信頼度とすればよい。ま
た、識別法としてk近隣法(k−NN法)を用いるとす
れば、k近隣法が参照ベクトルに似ている順にk個の認
識結果の多数決をとることから、第1位の候補をkで割
ったものを信頼度としてもよい。
【0038】次に第2の実施形態について説明する。第
1の実施形態では、文字認識辞書42は、認識対象文字
種に対する参照パタンを格納するものである。これに対
し、第2の実施形態では、予め学習パタンから作られ
た、文字の切断情報別に格納されているものとする。す
なわち、接触文字パタンを学習パタンに使い、前述の接
触文字の切断方法を使い、分離した文字パタンとその際
同時に得られた切断形状情報を格納するものである。こ
の際、登録する文字パタンの特徴と切断形状情報は、正
しい切り出し位置を一意に決定せず、図2から図4に示
すような可能性のある切断位置とその際の切断形状情報
を全て格納する。
【0039】これにより、図19で示すような接触文字
「00」が入力された場合にも、図2から図4に示すよ
うな、T接触(右から左)、T接触(左から右)、中点
(直線接触)に対して、3組の最終認識結果が得られる
ので、切断位置が必ずしも正しくない場合にも、接触文
字パタンを正しく認識できる。この場合、最終結果の文
字認識結果がいずれも 「00」で、例えば全て検証ル
ール格納手段52に登録されている場合に、最終認識結
果として出力すればよい。さらに、文字認識辞書42
は、図9のように、切断形状毎の参照ベクトルの格納位
置を記録しておく、インデックス格納部421と切断形
状毎の参照べクトルを格納する参照ベクトル格納部42
2〜424に予め分割し、文字認識手段41が文字認識
を行う際、文字候補切出し手段31から文字候補パタン
を受け取ると同時に、切断形状検出手段から切断形状を
受け取ることで、文字認識辞書を全参照することなく、
該当する切断形状の参照パタンのみを用いて識別しても
よい。
【0040】
【発明の効果】以上説明したように、本発明の文字認識
装置によれば、接触文字から切断候補を抽出して、文字
認識で認識する際に、切断候補の形状を使い、登録した
認識結果と切断向上のペアに該当するものだけを出力す
るため、誤った切り出しに対する文字認識の偶然的な誤
認識を著しく低減することが可能となる。
【図面の簡単な説明】
【図1】本発明による文字認識装置の一実施形態を示す
基本構成図である。
【図2】本実施形態において可能性のある切断位置とそ
の際の切断形状情報を示す図である。
【図3】本実施形態において可能性のある切断位置とそ
の際の切断形状情報を示す図である。
【図4】本実施形態において可能性のある切断位置とそ
の際の切断形状情報を示す図である。
【図5】本実施形態を説明するための接触文字パタンで
ある。
【図6】本実施形態における切断候補に対する認識結果
を示す図である。
【図7】本実施形態における切断候補に対する認識結果
を示す図である。
【図8】本実施形態における切断候補に対する認識結果
を示す図である。
【図9】本実施形態における文字認識辞書42の構成図
である。
【図10】本実施形態における切断候補の例を示す図で
ある。
【図11】本実施形態における切断候補の例を示す図で
ある。
【図12】本実施形態における切断候補の例を示す図で
ある。
【図13】本実施形態における切断候補の例を示す図で
ある。
【図14】本実施形態における切断候補の例を示す図で
ある。
【図15】本実施形態における切断候補の例を示す図で
ある。
【図16】本実施形態における検証ルール格納手段52
に格納する情報を示す図である。
【図17】本実施形態における検証ルール格納手段52
に格納する情報を示す図である。
【図18】従来の文字認識装置の基本構成図である。
【図19】従来の文字認識装置の動作を説明するための
接触文字である。
【図20】従来の文字認識装置の課題を説明するための
切断候補の選択の仕方を示す図である。
【符号の説明】
11 文字列切出し手段 21 切断候補検出手段 31 文字候補切出し手段 32 切断形状検出手段 41 文字認識手段 42 文字認識辞書 51 認識結果検証手段 52 検証ルール格納手段 101 文字列切出し手段 201 文字候補切出し手段 301 文字認識手段 302 文字認識辞書 401 認識結果検証手段 421 インデックス格納部 422〜424 参照ベクトル格納部

Claims (10)

    (57)【特許請求の範囲】
  1. 【請求項1】接触文字を含む文字列を帳票中から切り出
    し、文字の切断位置を切断候補として抽出し、前記切断
    候補に基づいて1文字に相当する領域を文字候補パタン
    として抽出する第1の手段と、前記文字候補パタンの抽出により 抽出された文字候補パ
    タンの切断面に対する切断形状を抽出する第2の手段
    と、 前記文字候補パタンと前記文字候補パタンの切断面に対
    する切断形状から文字種を判定する際、前記文字候補パ
    タンに対する文字種と前記文字候補パタンの切断形状の
    組み合わせが正しいかを検証して正しい組み合わせに対
    応する文字種を文字認識結果として出力する第3の手段
    と、 を備えて成ることにより文字列中の文字を認識すること
    を特徴とする文字認識装置。
  2. 【請求項2】文字同士の接触を含む文字列から切断候補
    を抽出し、前記切断候補に基づいて文字候補パタンを抽
    出した後、文字認識部で前記文字候補パタンの文字種を
    判定することにより文字列中の文字を認識する文字認識
    装置において、前記接触文字を含む文字列から文字候補パタンを抽出し
    て文字認識部で文字種を判定する際、切断形状毎に文字
    認識部の参照パタンを格納した文字認識辞書を用いて、
    前記文字候補パタンに対する文字種と切断形状を出力
    し、その文字種と切断形状の組み合わせに対し、認識結
    果として出力してよい組み合わせに対する文字種を認識
    結果して出力 することを特徴とする文字認識装置。
  3. 【請求項3】文字同士の接触を含む文字列1列分を帳票
    中から切り出す文字列切出し手段と、 前記文字列切出し手段において切り出された文字同士の
    接触を含む文字列から文字の切断位置の候補を抽出する
    切断候補検出手段と、 前記切断候補検出手段で抽出された切断位置に基づき
    1文字に相当する領域を文字候補パタンとして抽出する
    文字候補切出し手段と、 前記文字候補切出し手段で抽出された文字候補パタンの
    切断位置に対する切断形状を判定する切断形状検出手段
    と、 前記文字候補切出し手段で得られた文字候補パタンと前
    記切断形状検出手段で得られた文字候補パタンの切断形
    状から文字種を判定する文字認識手段と、 前記文字認識手段が認識時に参照する文字種ならびに
    断形状毎に登録された参照パタンを格納する文字認識辞
    と、 前記文字認識手段で得られた文字候補パタンに対する
    字種と切断形状を用いて、文字種と切断形状の組み合わ
    せが正しいかを検証する認識結果検証手段と、 前記認識結果検証手段の文字候補パタンに対する文字種
    切断形状の正しい組み合わせを格納する検証ルール格
    納手段とを備え、 前記文字認識手段は、切断形状毎に参照パタンを格納し
    た前記文字認識辞書を用いて、最も近い参照パタンに対
    する字種と切断形状を出力し、 前記認識結果検証手段は、前記文字認識手段から出力さ
    れた文字候補パタンに対する文字種と切断形状の組み合
    わせに対し、認識結果として出力してよい組み合わせを
    格納してある前記検証ルール格納手段を参照し、該当す
    るものがあれば前記文字認識手段から出力された文字候
    補パタンに対する文字種を認識結果として出力すること
    を特徴とする文字認識装置。
  4. 【請求項4】前記検証ルール格納手段には、正しい切断
    位置と該切断位置における切断形状と文字種の組み合わ
    のみならず、誤った切断位置とその時の切断形状と文
    字種の組み合わせを格納し、前記認識結果検証手段にお
    いては、正しい切断位置のみならず、それを含む複数の
    切断位置を用いて、接触文字を読取ることを特徴とする
    請求項3に記載の文字認識装置。
  5. 【請求項5】前記文字認識辞書は、前記切断形状検出手
    で得られる切断形状毎に参照パタン格納位置を記憶す
    るインデックスを有することを特徴とする請求項3に記
    載の文字認識装置。
  6. 【請求項6】前記切断候補検出手段は、文字列方向と垂
    直な方向の文字線画素に対するラン長の変化する点を切
    断候補として検出し、その切断形状として、1)線幅相
    当のランが線幅以上になる部分、2)線幅相当ランの両
    端が線幅以上になる部分、3)線幅相当のランが一定以
    上続く際の中点部分、4)線幅相当のランが、文字列方
    向に一定の間移動する間に定数倍以上になる部分、これ
    ら4種が検出不能な際に、5)接触文字パタンに対する
    ループを検出し、該ループの最上点、最下点に接触する
    ランをそれぞれ始点として前記線幅相当のランが線幅以
    上になる部分、線幅相当ランの両端が線幅以上になる部
    分、線幅相当のランが一定以上続く際の中点部分を求
    め、これらを切断形状として用いる請求項3に記載の文
    字認識装置。
  7. 【請求項7】前記切断候補検出手段は、文字列方向と垂
    直な方向の文字線画素に対するラン長の変化する点を切
    断候補として検出し、その切断形状として、1)線幅相
    当のランが線幅以上になる部分、2)線幅相当ランの両
    端が線幅以上になる部分、3)線幅相当のランが一定以
    上続く際の中点部分、4)線幅相当のランが、文字列方
    向に一定の間移動する間に定数倍以上になる部分、これ
    ら4種が検出不能な際に、5)接触文字パタンに対する
    ループを検出し、該ループの最上点、最下点に接触する
    ランをそれぞれ始点として前記線幅相当のランが線幅以
    上になる部分、線幅相当ランの両端が線幅以上になる部
    分、線幅相当のランが一定以上続く際の中点部分を求
    め、これらを切断形状として用いる際、該切断形状を前
    出ラン長の変化検出時に、文字列の右端から左端方向
    向かって検出するものと、文字列パタンの左端から右端
    方向に向かって検出するものとを別の切断形状とする請
    求項3に記載の文字認識装置。
  8. 【請求項8】前記切断候補検出手段は、前記文字列中
    互いに文字接触のない場合には、文字列方向に対して垂
    直に文字の投影を取り、射影値が0となるところを選ん
    で1文字に相当する領域を切り出す請求項3に記載の文
    字認識装置。
  9. 【請求項9】前記切断候補検出手段は、文字パタン同士
    が互いに入り組み、文字の投影では分離できない場合に
    は、文字画像に対して文字を構成する画素の連結領域を
    検出し、同一の領域を1文字として1文字に相当する領
    域を切り出す請求項3に記載の文字認識装置。
  10. 【請求項10】前記切断候補は、文字線幅に相当する垂
    直ランの長さが急激に長くなる部分、文字線幅相当の垂
    直ランの長さが、その両端で急激に長くなる部分、文字
    線幅相当の垂直ランの長さが、ある水平位置から垂直ラ
    ンのトレース方向に一定幅以内で長くなる部分、または
    文字線幅相当の垂直ランが一定幅以上連続する場合の連
    続区間の中点部分とする請求項3に記載の文字認識装
    置。
JP10025126A 1998-01-22 1998-01-22 文字認識装置 Expired - Fee Related JP3092576B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP10025126A JP3092576B2 (ja) 1998-01-22 1998-01-22 文字認識装置
US09/234,840 US6198846B1 (en) 1998-01-22 1999-01-22 Character recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10025126A JP3092576B2 (ja) 1998-01-22 1998-01-22 文字認識装置

Publications (2)

Publication Number Publication Date
JPH11213091A JPH11213091A (ja) 1999-08-06
JP3092576B2 true JP3092576B2 (ja) 2000-09-25

Family

ID=12157264

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10025126A Expired - Fee Related JP3092576B2 (ja) 1998-01-22 1998-01-22 文字認識装置

Country Status (2)

Country Link
US (1) US6198846B1 (ja)
JP (1) JP3092576B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6876765B2 (en) * 2000-03-30 2005-04-05 Ricoh Company, Ltd. Character recognition method and computer-readable storage medium
JP2002163637A (ja) * 2000-11-27 2002-06-07 Omron Corp 画像検査装置及び画像検査方法
US7095875B2 (en) * 2001-05-15 2006-08-22 Lockheed Martin Corporation Method and system for address result arbitration
US7916948B2 (en) * 2004-01-08 2011-03-29 Nec Corporation Character recognition device, mobile communication system, mobile terminal device, fixed station device, character recognition method and character recognition program
JPWO2011118428A1 (ja) * 2010-03-26 2013-07-04 日本電気株式会社 要求獲得システム、要求獲得方法、及び要求獲得用プログラム
US9384403B2 (en) 2014-04-04 2016-07-05 Myscript System and method for superimposed handwriting recognition technology
US9524440B2 (en) 2014-04-04 2016-12-20 Myscript System and method for superimposed handwriting recognition technology
JP6046088B2 (ja) * 2014-07-30 2016-12-14 京セラドキュメントソリューションズ株式会社 画像処理装置及び画像処理方法
JP7338158B2 (ja) * 2019-01-24 2023-09-05 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5998283A (ja) 1982-11-27 1984-06-06 Hitachi Ltd パターン切出しおよび認識方法、ならびにそのシステム
JPS6246390A (ja) 1985-08-26 1987-02-28 Nippon Telegr & Teleph Corp <Ntt> オンライン手書き文字認識方法
JPH01181176A (ja) 1988-01-14 1989-07-19 Matsushita Electric Ind Co Ltd 文字認識装置
JPH02105982A (ja) 1988-10-14 1990-04-18 Canon Inc 文字認識装置
JPH02271088A (ja) 1989-04-12 1990-11-06 Toshiba Corp クライオポンプ
JPH03225578A (ja) 1990-01-31 1991-10-04 Toshiba Corp 文字の検切り方法
JPH0465784A (ja) 1990-07-05 1992-03-02 Nec Corp 文字切出し回路
WO1992006448A1 (de) * 1990-09-27 1992-04-16 Cgk Computer Gesellschaft Konstanz Mbh Verfahren zur extrahierung von einzelzeichen aus rasterbildvorlagen einer gelesenen hand- oder maschinenschriftlichen zeichenfolge freier teilung
JP2592756B2 (ja) 1993-01-14 1997-03-19 株式会社エイ・ティ・アール視聴覚機構研究所 文字切り出し装置およびこれを用いた文字認識装置
JPH06236454A (ja) 1993-02-10 1994-08-23 Fujitsu Ltd 文字認識装置
JP3258122B2 (ja) * 1993-03-31 2002-02-18 株式会社東芝 画像処理装置
JPH06333089A (ja) 1993-05-20 1994-12-02 Nec Eng Ltd 光学文字読取装置
JP2580976B2 (ja) 1993-09-29 1997-02-12 日本電気株式会社 文字切出し装置
JP2630261B2 (ja) 1994-06-29 1997-07-16 日本電気株式会社 文字認識装置
JPH08137994A (ja) 1994-11-11 1996-05-31 Oki Electric Ind Co Ltd 文字認識装置
JP3400151B2 (ja) * 1994-12-08 2003-04-28 株式会社東芝 文字列領域抽出装置および方法

Also Published As

Publication number Publication date
JPH11213091A (ja) 1999-08-06
US6198846B1 (en) 2001-03-06

Similar Documents

Publication Publication Date Title
Arivazhagan et al. A statistical approach to line segmentation in handwritten documents
JP2000353215A (ja) 文字認識装置および文字認識プログラムを記録した記録媒体
JP4787275B2 (ja) セグメント化ベースの認識
JP3842006B2 (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP3345224B2 (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
JP3092576B2 (ja) 文字認識装置
JP4280355B2 (ja) 文字認識装置
JPH0564834B2 (ja)
US6671417B1 (en) Character recognition system
WO2006080568A1 (ja) 文字読取り装置、文字読取り方法及び該文字読取り装置に用いられる文字読取り制御プログラム
JPH11328309A (ja) 光学的文字読み取り方法とその装置
JP3466899B2 (ja) 文字認識装置及び方法並びにプログラム記憶媒体
JP2630261B2 (ja) 文字認識装置
JP2004046723A (ja) 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置
JP3812719B2 (ja) 文書検索装置
JP4136257B2 (ja) 文字認識装置、文字認識方法および記憶媒体
JP2903779B2 (ja) 文字列認識方法及びその装置
JP2001147988A (ja) 文字認識方法及び文字認識装置
JP3662967B2 (ja) 文字ループ候補抽出装置及び文字補完装置
JP2856409B2 (ja) 文字認識装置および方法
JP3897999B2 (ja) 手書き文字認識方法
JP3805831B2 (ja) 文字認識装置
JP2813601B2 (ja) 表形式文書認識装置
Green et al. Layout analysis of book pages
JPH01234985A (ja) 文字読取装置の文字切出し装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070728

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080728

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090728

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100728

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110728

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110728

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120728

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120728

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130728

Year of fee payment: 13

LAPS Cancellation because of no payment of annual fees