JP3345224B2 - パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置 - Google Patents

パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置

Info

Publication number
JP3345224B2
JP3345224B2 JP20556495A JP20556495A JP3345224B2 JP 3345224 B2 JP3345224 B2 JP 3345224B2 JP 20556495 A JP20556495 A JP 20556495A JP 20556495 A JP20556495 A JP 20556495A JP 3345224 B2 JP3345224 B2 JP 3345224B2
Authority
JP
Japan
Prior art keywords
character
pattern
recognition
image
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP20556495A
Other languages
English (en)
Other versions
JPH08305796A (ja
Inventor
聡 直井
眞紀 矢吹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP20556495A priority Critical patent/JP3345224B2/ja
Priority to US08/609,280 priority patent/US5889887A/en
Priority to KR1019960005703A priority patent/KR100211856B1/ko
Publication of JPH08305796A publication Critical patent/JPH08305796A/ja
Priority to US09/228,139 priority patent/US6052480A/en
Application granted granted Critical
Publication of JP3345224B2 publication Critical patent/JP3345224B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はパターン抽出装置に
係わり、特に手書き用文字認識装置のみならず、印刷文
字認識装置や図面認識装置における文字及び記号の切り
出し、画像中の罫線と物体、図形や文字との接触部分の
分離等のように、直線と文字や図形等の各種パターンと
が重なった画像から、該パターンを抽出するパターン抽
出装置に関する。
【0002】すなわち、例えば、OCR(Optical Char
acter Reader) 等の手書き文字認識装置において文字
枠、罫線等に接触した文字、図形等のパターンを抽出す
るためのパターン抽出装置に関する。
【0003】手書き用の入出力装置として、手書き文字
認識装置の需要が増加している。この様な手書き文字認
識装置において個々の文字の高い認識率を実現するため
には、該文字認識の前処理である文字の切り出し処理が
正確に行われることが重要である。
【0004】認識の対象となる文書としては、帳票等の
文字を書く位置や領域等が予め指定された文書がある。
この様な文書では、文字を書く位置を指定する枠等がド
ロップ・アウト・カラーでなく、黒枠等の罫線により記
入される文字と同じ色や濃度で予め印刷されている。従
って、文字が上記黒枠等のように予め指定された範囲内
にきれいに書かれていれば比較的高い認識率で自動認識
が可能であるが、文字が、少しでも指定範囲を越えて、
該指定範囲を示す枠又は罫線に接触したり、はみ出して
手書きされたりすると、文字の認識率が著しく低下する
という問題が生じていた。
【0005】該認識率を向上させるためには、非ドロッ
プ・アウト・カラーで文字を書く位置が指定された帳票
等において、罫線、枠等に触れている文字、図形、記号
等から、該文字、図形、記号等だけを正確に切りだす処
理の正確度を高める必要がある。
【0006】
【従来の技術】本出願人は、先に特願平5−10325
7号にて図84に示す如き第一の画像抽出方式を提案し
た。この方式において処理の対象となる入力パターン
は、予め極端な傾きや回転等に対して補正が施され、さ
らに雑音の除去及びかすれの穴埋め等の前処理が施され
た2値画像であり、該入力パターンを基に例えば黒枠の
帳票から枠を除去するものである。すなわち、例えば、
文字枠に関しては、横に細長い一行のブロック枠(文字
枠)が複数個あり、これらのブロック枠の中には、その
サイズ、位置及び傾きが分からないブロック枠も含まれ
ている。そして、このようなブロック枠に対して文字が
手書きされた場合に、該文字が該ブロック枠と接触した
り、または該ブロック枠からはみ出していても、該ブロ
ック枠だけを除去するものである。
【0007】この第一の画像抽出方式は、図84に示す
如く、連結パターン抽出部1、線分検出部2、直線検出
部3、枠検出部4、及び枠分離部5からなる。連結パタ
ーン抽出部1は、枠もしくは罫線等の直線部分と文字、
図形もしくは記号とから構成される入力パターンから画
素と画素が繋がっている連結パターンを抽出する。線分
検出部2は、細線化処理部を含み、隣接投影により該連
結パターン毎に一定の長さで線分又は直線の一部を検出
する。直線検出部3は、得られた複数の線分又は直線の
一部を統合して長い直線を検出する。枠検出部4は、得
られた複数の直線の間隔等により、ブロック枠を構成す
る直線を抽出する。枠分離部5は、該抽出した直線同士
の交点を求め、その交点情報を基に前記ブロック枠を一
文字毎の枠に分割して、該分割により得られたそれぞれ
の枠の幅を算出する。そして、それらの幅に従って連結
パターンから文字枠を分離する。
【0008】他方、対象となる入力パターンから除去す
べき枠が上記以外の枠の場合には、例えば特開昭62−
212888号公報や特開平3−126186号公報に
て提案されているような枠抽出方法も提案されている。
これらの枠抽出方法によれば、位置やサイズ等のフォー
マット情報及び傾きに関する情報を予め帳票データとし
て入力し、格納しておく。枠の除去は、これらの格納さ
れた情報に基づいて行われる。
【0009】また、本出願人は、上記第一の画像抽出方
式以外にも、特開公報平6−309498において、枠
に接触した文字から文字のみを抽出する第二の画像抽出
方式を提案した。
【0010】図85は、この方式の全体構成を示すブロ
ック図である。同図において、枠抽出部11は、枠に接
触している文字(枠接触文字)の2値画像から該枠(文
字枠)だけを抽出し、この文字枠を除去する。
【0011】この処理により、上記枠接触文字の枠に接
触している文字線分の枠接触部分がかすれてしまい、該
文字線分が複数の部分に途切れてしまう。例えば、図8
6(a)に示すラベル”1”により連結されていた
「3」の2値画像の場合には、図86(b)に示すよう
に、文字枠21が抽出・除去された結果、ラベル”
1”、”2”及び”3”が付与された3個の文字線分に
分割されてしまう。また、図87(a)に示すラベル”
1”により連結されていた「7」の2値画像の場合に
は、図87(b)に示すように、文字枠23が抽出・除
去された結果、ラベル”1”、”2”及び”3”が付与
された3個の文字線分に分割されてしまう。
【0012】補完部12は、上記途切れた文字線分につ
いて、各ラベルが付与された文字線分間の距離や方向性
等の幾何学的構造を評価して、それを補完する。これに
より、図86(b)に示す枠接触部分が途切れていた
「3」の2値画像が、図86(c)に示すように補完さ
れる。また、図87(b)に示す枠接触部分が途切れて
いた「7」の2値画像の場合には、図87(c)に示す
ようにラベル”1”が付与されていた部分とラベル”
2”が付与されていた部分との間が補完されるが、ラベ
ル”1”が付与されていた部分とラベル”3”が付与さ
れていた部分は、補完されない。
【0013】再補完部13は、枠に平行な文字線分が枠
に接触する場合に、該文字線分を補完する。この処理
は、予め、枠接触文字をラベリングによる連結性を用い
て抽出しておき、上記補完部12により補完されたパタ
ーンと上記枠接触文字の連結性が一致することを検出す
ることにより、上記枠に平行な文字線分を補完する。
【0014】これにより、図87(c)に示すようにラ
ベル”1”とラベル”2”の2つの文字線分に分かれて
いた「7」の2値画像が、図87(d)に示すように補
完される。
【0015】このように、文字枠に接触した文字は、補
完部12または再補完部13によって復元される。上記
補完部12及び上記再補完部13から出力される補完パ
ターンと再補完パターンの両パターンは、認識文字の候
補として認識部14に入力される。
【0016】該認識部14は、複数の文字カテゴリ辞書
を備えており、上記補完パターンまたは再補完パターン
を該各文字カテゴリ辞書と照合して、補完パターンと再
補完パターンの認識結果から相違度が最も小さい文字カ
テゴリのコードを出力する。すなわち、図87に示す例
では、同図(c)に示すパターンが「リ」の文字カテゴ
リに属すものと認識される。また、同図(d)に示すパ
ターンが「7」の文字カテゴリに属すものと認識され
る。そして、「7」のほうが相違度が小さいと判断され
て、最終的に「7」と認識され、その文字コードが出力
される。
【0017】
【発明が解決しようとする課題】ところで、本出願が先
に提案した第一の画像抽出方式では、以下のような問題
点があり、まだ改善の余地がある。第1に、対象とする
枠が一文字枠及び横一行のブロック枠以外の場合、即
ち、表形式のブロック枠やフリーフォーマット枠の場合
には、枠抽出処理を行うことができなかった。第2に、
線分検出部2は細線化処理部を内蔵し、該細線化処理部
により細線化処理を行うので、全体の処理時間が非常に
長かった。又、細線化処理を行うと、原画像の直線性が
失われてしまう。このため、例えば図88(a)に示す
ような枠にまたがって「6」を書いた場合の原画像が細
線化により図88(b) に示す曲線状のパターンとなり、
枠を直線として検出できないため、該枠の抽出が難しく
なるという問題があった。第3に、一つの文字が互いに
隣合う複数の一文字枠と接続してしまっている場合、探
索によって直線の途中が途切れていることが分かった時
点で、ブロック枠でも一文字枠でもないとみなして以降
の処理を行わなかったため、枠を抽出できなかった。第
4に、一文字枠を除去する場合、探索を行って枠抽出を
するため、探索に失敗して枠を抽出できないこともあっ
た。
【0018】上記第4の問題点を、図89に示す具体的
な例で説明する。Aの場合、部分パターンの探索は、上
から下の方向へ、且つ、下の方向へ進めない場合は左ま
たは右に、例えば枠の幅に対応する所定の画素数分だけ
進むように行われるものとする。したがって、探索の開
始点がAの場合には、その探索は図89中で矢印6で示
すように良好に行われる。しかし、探索の開始点がBの
場合は、部分パターンの探索を下の方向へ進めることは
できず、又、左右に所定の画素数分進んでも下の方向に
は部分パターンが存在しないので、図89中で矢印7で
示す如く探索は失敗してしまう。従って、後者のような
場合には、枠を抽出することができない。
【0019】他方、特開昭62−212888号公報や
特開平3−126186号公報にて提案されているよう
な枠抽出方法では、対象とする枠が表形式のブロック枠
等であっても、枠の抽出が可能である。しかし、その反
面、位置やサイズ等のフォーマット情報及び傾きに関す
る情報を予め帳票データとして入力し、格納しておくこ
とが前提となっているので、処理が文字枠自体の凹凸や
僅かな傾きの影響を受け易いという問題点があった。す
なわち、例えば所定の位置からはみ出した文字枠は文字
とみなされて文字枠の抽出時に当該文字枠が抽出されな
かったり、逆に文字部分が文字枠の一部として抽出され
てしまったりするなどの問題があった。更に、ユーザが
帳票の全ての枠について、その情報を入力する必要があ
るため、該入力作業に非常に時間がかかり、ユーザの負
担が大きいという問題もあった。
【0020】また、上記第二の画像抽出方式は、以下の
ような問題点があった。上述したように、この方式で
は、認識部14により補完パターンまたは再補完パター
ンを、複数種の文字カテゴリの辞書に登録されている標
準パターンと照合して、相違度が最小のパターンの文字
コードを、認識結果として出力する。この場合、補完部
12または再補完部13により、枠接触文字の補完また
は再補完が確実に処理され、該枠接触文字の枠と接触し
た部分から文字線分のみを補完できればよいが、該文字
線分が部分的に補完できない場合があった。このような
例を、図90に示す。
【0021】この例の場合、同図(a)に示すように、
「2」の下線部分が枠25に接触し、その接触部分がほ
ぼ完全に枠25に重なっている。このような場合、枠抽
出部11により、同図(b)に示すように枠25が除去
され、「2」の文字パターンがラベル”1”とラベル”
2”の2つの部分パターンタに分離される。そして、同
図(c)に示すように、補完部12により上記2つの部
分パターンが連結される。このような場合、「2」の下
線部分が再補完されないために、認識部14が、「2」
の文字を、誤って「7」と認識してしまう可能性が高く
なる。
【0022】また、枠接触文字において、その一部が枠
からはみ出すことなく、該枠に完全に重なってしまった
場合には、枠接触部分を補完部12及び再補完部13に
おいても補完することはできず、認識部14において上
記枠接触文字を正しく認識することは、ほとんど不可能
であった。
【0023】このため、例えば、特開公報平3−122
786号の「光学式文字読取装置」のように、枠に接触
または枠からはみ出した複数の枠接触文字のパターンに
ついて、枠除去後の部分パターンを辞書に記憶してお
き、この辞書を利用して枠接触文字の文字認識を行う方
式が提案されている。しかし、枠と文字の接触形態はほ
とんど無数に考えられることから、それらの部分パター
ンを全ての文字について記憶しておくためには、辞書の
記憶容量が膨大なものとなるという欠点がある。また、
辞書に記憶する部分パターンの数が増加するにつれ、該
辞書のアクセス回数が増加し、文字の認識速度が遅くな
るという欠点もある。
【0024】また、さらに、特開公報平6−62044
号の「光学式文字読取装置」のように、アンダーライン
領域や枠領域を除去し、これらの領域を除いた文字パタ
ーンを辞書に格納されている各文字カテゴリの標準文字
図形の2値パターン情報と比較・照合して文字を認識す
る方式が提案されている。しかし、この方式の場合、図
90の例のように、枠に重なった部分を除去した残りの
文字パターンが他の文字カテゴリに類似してしまう場合
には、誤読してしまう。また、この方式では、アンダー
ライン領域または枠領域を除去して文字認識を行うのみ
で、文字が枠からはみ出した場合に文字の補完を行って
いない。したがって、文字が枠からはみ出した場合、誤
読率が高くなるという欠点がある。
【0025】本発明は、上記問題点を改善するためにな
されたものであって、枠、罫線等の直線部分に触れてい
る文字、図形、記号等について、該枠、罫線等の直線部
分から文字、図形、記号等を構成する部分を正確に抽出
することにより、枠、罫線等の直線部分に接触した文
字、図形、記号等を正確に切り出すことができる画像抽
出装置を提供することを目的とする。また、枠、罫線等
の直線部分に接触したり、はみ出している文字の認識率
を高め、誤読率を減少させることを目的とする。
【0026】
【課題を解決するための手段】図1〜図8に示す発明
は、直線とある形状のパターンとが重なっている画像か
ら該パターンのみを抽出するパターン抽出装置を前提と
する。
【0027】図1は該発明の原理を説明する図である。
直線抽出手段31は、直線とある形状のパターンとが重
なっている画像から該直線を抽出する。
【0028】交点算出手段32は、該直線抽出手段31
によって抽出された直線と上記パターンとの交点を算出
する。仮画像抽出手段33は、該交点算出手段32によ
り得られた交点情報を基に、上記直線内の上記パターン
に該当する部分を想定して、該部分を仮画像として抽出
する。
【0029】真画像抽出手段34は、該仮画像抽出手段
33によって抽出された仮画像から、上記パターンの画
像のみを真の画像として抽出する。図2は、前記真画像
抽出手段34の一構成例を示す図である。
【0030】真画像判断手段35は、前記仮画像中の前
記パターンの画像に該当する部分である真の画像を判断
する。領域除去手段36は、前記仮画像から、該真画像
判断手段35によって真の画像と判断された以外の領域
を除去する。
【0031】図3は、前記真画像判断手段35の一構成
例を示す図である。テーブル38は、仮画像の構造か
ら、該仮画像内の前記パターンの画像に対応する真の画
像のみを抽出するための情報を格納している。
【0032】選択手段39は、仮画像の構造を判定し、
上記テーブル45を参照して該仮画像中のる前記パター
ンの画像に対応する真の画像を選択する。上記構成にお
いて、前記パターンが、文字パターンである場合、前記
テーブル45は、例えば、文字の種類(例えば、「数
字」、「アルファベット」、「カナ」、「漢字」など)
別に個別に設けられる。
【0033】次に、述べる図4〜図8の発明は、上記パ
ターンとして、文字パターンを対象とする発明である。
図4は、前記真画像判断手段35の他の構成例を示す図
である。
【0034】平均文字サイズ算出手段41は、仮画像を
含む文字パターンの文字列から1文字のパターンの平均
サイズである平均文字サイズを算出する。選択手段42
は、該平均文字サイズ算出手段41によって算出された
平均文字サイズを基に、上記仮画像から、上記文字パタ
ーンの文字線分に該当する真の画像を選択する。
【0035】図5は、前記選択手段42の一構成例を示
す図である。しきい値設定手段45は、前記平均文字サ
イズ算出手段41によって算出された平均文字サイズを
基に、最大文字サイズと最小文字サイズを設定する。
【0036】判定手段46は、仮画像によって局所的に
対応付けられた文字パターンが、該しきい値設定手段4
1によって求められた最大文字サイズより大きい場合、
その文字パターンから上記局所的対応付け仮画像を除去
した場合に得られる複数のパターンの中に、上記最小文
字サイズより小さいパターンがあれば、該パターンと局
所的に対応付けられた仮画像を、真の画像と判定する。
【0037】また、しきい値設定手段45と判定手段4
6は、以下のような構成であってもよい。すなわち、し
きい値設定手段45は、前記平均文字サイズ算出手段4
1によって算出された上記平均文字サイズを基に、最大
文字サイズを設定する。
【0038】判定手段46は、上記文字列中の文字パタ
ーンが、該しきい値設定手段45によって設定された最
大文字サイズより大きい場合、その文字パターンを一文
字の真の画像と判定する。
【0039】図6は、前記真画像判断手段35の、さら
に他の構成例を示す図である。平均文字サイズ算出手段
47は、前記パターンが文字パターンである場合、仮画
像を含む文字パターンの文字列から1文字のパターンの
平均サイズである平均文字サイズを算出する。
【0040】第一の判定手段48は、該平均文字サイズ
算出手段47によって求められた平均文字サイズを基
に、前記文字列中の仮画像を含む文字パターンから、そ
の真の文字線分の画像を判定する。
【0041】テーブル49は、仮文字線分の画像から成
る仮画像の構造から、該仮画像内の真の文字線分の画像
のみを抽出するための情報を格納している。第二の判定
手段50は、仮画像の構造を判定し、上記テーブル49
を参照して該仮画像から真の文字線分の画像である真の
画像を判定する。
【0042】図7は、前記真画像抽出手段34の一構成
例を説明する図である。平均文字サイズ算出手段51
は、前記パターンが文字パターンである場合、仮画像を
含む文字パターンの文字列から1文字のパターンの平均
サイズである平均文字サイズを算出する。
【0043】領域除去手段52は、該平均文字サイズ算
出手段51によって求められた平均文字サイズを基に、
前記文字列中の前記仮画像を含む文字パターンから、該
文字パターンの画像である真の画像以外の領域を除去す
る。
【0044】図8は、前記領域除去手段52の一構成例
を示す図である。しきい値設定手段53は、上記平均文
字サイズから最大文字サイズと最小文字サイズを設定す
る。
【0045】仮画像除去手段54は、仮画像によって局
所的に対応付けられた文字パターンが、該しきい値設定
手段53によって求められた最大文字サイズより大きい
場合、その文字パターンから上記局所的対応付け仮画像
を除去した場合に得られる複数の文字パターンが全て上
記最小文字サイズ以上であれば、上記局所的対応付け仮
画像を除去する。
【0046】図1に示す発明では、まず、直線抽出手段
11が、直線とパターンが重なっている画像から該直線
のみを、抽出する。これによって、例えば、文字と枠や
罫線等の直線が重なっている画像から該枠や罫線等の直
線のみが抽出される。
【0047】次に、交点算出手段12が、上記抽出され
た直線と上記パターンとの交点を算出する。これによ
り、例えば、枠や罫線等に接触したり、はみ出したりし
ている文字において、該枠や罫線等と該文字の線分との
交点の座標が算出される。
【0048】次に、仮画像抽出手段13が、上記交点情
報を基に、上記直線中の上記パターンの画像を想定し、
これを仮画像として抽出する。この仮画像は、例えば、
上記交点間を接続する仮の文字線分(仮文字線分)から
構成される。
【0049】真画像抽出手段14は、該仮画像から上記
パターンの画像のみからなる真の画像を抽出する。従っ
て、直線と、文字、記号、または図形などのような各種
パターンが重なっている画像から、目的とするパターン
のみを正しく抽出(切りだす)ことが可能になる。
【0050】すなわち、例えば、枠や罫線等に接触した
り、はみ出したりしている枠接触文字、さらには、表形
式の枠上でオーバーハングしている手書き文字などにつ
いて、該文字の上記枠や罫線内の画像を正しく抽出でき
る。。
【0051】図9は、他の発明の原理を説明するブロッ
ク図(その9)である。パターン分離手段55は、直線
とパターンとが接触している画像から該パターンのみを
分離・抽出する。尚、該接触は、パターンが直線からは
み出している状態も含む。以下の表現についても、同様
である。
【0052】パターン認識手段56は、該パターン分離
手段55によって抽出されたパターンを認識する。信頼
度算出手段57は、該パターン認識手段56によって認
識されるパターンの信頼度を、前記直線と前記パターン
との接触状態毎に算出する。
【0053】テーブル作成手段58は、該信頼度算出手
段57によって算出される信頼度が予め定められたしき
い値よりも小さい直線とパターンとの接触状態につい
て、該信頼度を前記パターン認識手段が誤って認識する
パターンと正しいパターンとの組み合わせから成るパタ
ーン対と共に記憶するテーブル59を作成する。
【0054】この図9に示す発明では、パターン分離手
段55は、直線とパターンとが接触している画像から該
パターンのみを分離・抽出し、次に、パターン認識手段
56が、該パターン分離手段55によって抽出されたパ
ターンを認識する。
【0055】続いて、信頼度算出手段57が、該パター
ン認識手段56によって認識されるパターンの信頼度
を、前記直線と前記パターンとの接触状態毎に算出した
後、テーブル作成手段58が、該信頼度算出手段57に
よって算出される信頼度が予め定められたしきい値より
も小さい直線とパターンとの接触状態について、該信頼
度を前記パターン認識手段が誤って認識するパターンと
正しいパターンとの組み合わせから成るパターン対と共
に記憶するテーブル59を作成する。
【0056】したがって、パターン認識手段56による
パターン認識の信頼度を参照可能なテーブル59を作成
できる。図10は、さらに他の発明の原理を説明するブ
ロック図(その10)である。
【0057】パターン分離手段61は、直線とパターン
とが接触している画像から該パターンのみを分離・抽出
する。パターン認識手段62は、該パターン分離手段6
1によって抽出されたパターンを認識する。
【0058】信頼度算出手段63は、該パターン認識手
段62によって認識されるパターンの信頼度を、前記直
線と前記パターンとの接触状態毎に算出する。再文字認
識手段64は、該信頼度算出手段63によって算出され
る信頼度が予め定められたしきい値よりも小さい直線と
パターンとの接触状態について、前記パターンの認識の
信頼度が向上する再認識の方法を学習する。
【0059】テーブル作成手段65は、該再文字認識手
段64によって学習された再認識の方法を、前記パター
ン認識手段62が誤って認識するパターンと正しいパタ
ーンとの組み合わせから成るパターン対と共に記憶する
テーブル66を作成する。
【0060】この図10に示す発明では、まず、パター
ン分離手段61が、直線とパターンとが接触している画
像から該パターンのみを分離・抽出し、次に、パターン
認識手段62が、該パターン分離手段61によって抽出
されたパターンを認識する。さらに、続いて、信頼度算
出手段63が、該パターン認識手段62によって認識さ
れるパターンの信頼度を、前記直線と前記パターンとの
接触状態毎に算出する。そして、学習手段64が、該信
頼度算出手段63によって算出される信頼度が予め定め
られたしきい値よりも小さい直線とパターンとの接触状
態について、前記パターンの認識の信頼度が向上する再
認識の方法を学習し、続いて、テーブル作成手段65
が、該学習手段64によって学習された再認識の方法
を、前記パターン認識手段62が誤って認識するパター
ンと正しいパターンとの組み合わせから成るパターン対
と共に記憶するテーブル66を作成する。
【0061】したがって、パターン認識手段62によっ
て認識されたパターンの信頼度を、参照可能なテーブル
66を作成できる。図11は、さらに、他の発明の原理
を説明するブロック図(その11)である。
【0062】文字分離手段70は、枠または罫線等の直
線と文字とが接触している画像から該文字のみを分離・
抽出する。尚、上記直線と文字との接触は、該文字の一
部が該直線からはみ出している状態も含むものとする。
以下の表現についても、同様である。
【0063】文字認識手段71は、該文字分離手段70
によって抽出された文字を認識する。信頼度算出手段7
2は、該文字認識手段71によって認識される文字の信
頼度を、前記直線と文字との接触状態毎に算出する。
【0064】テーブル作成手段73は、該信頼度算出手
段72によって算出される信頼度が予め定められたしき
い値よりも小さい直線と文字との接触状態について、該
信頼度を前記文字認識手段71が誤って認識する文字と
正しい文字との組み合わせから成る文字対と共に記憶す
るテーブル74を作成するこの図11に示す発明では、
文字分離手段70が、枠または罫線等の直線と文字とが
接触している画像から該文字のみを分離・抽出し、続い
て、文字認識手段71が、該文字分離手段70によって
抽出された文字を認識する。次に、信頼度算出手段72
が、該文字認識手段71によって認識される文字の信頼
度を、前記直線と文字との接触状態毎に算出する。そし
て、テーブル作成手段73が、該信頼度算出手段72に
よって算出される信頼度が予め定められたしきい値より
も小さい直線と文字との接触状態について、該信頼度
を、前記文字認識手段71が誤って認識する文字と正し
い文字との組み合わせから成る文字対と共に記憶するテ
ーブル74を作成するしたがって、文字分離手段70に
よって認識された文字の信頼度を、参照可能なテーブル
74を作成できる。
【0065】図12は、さらに、他の発明の原理を説明
するブロック図(その12)である。文字分離手段75
は、枠または罫線等の直線と文字とが接触している画像
から該文字のみを分離・抽出する。
【0066】文字認識手段76は、該文字分離手段75
によって抽出された文字を認識する。信頼度算出手段7
7は、該文字認識手段76によって認識される文字の信
頼度を、前記直線と文字との接触状態毎に算出する。
【0067】再文字認識手段78は、該信頼度算出手段
77によって算出される信頼度が予め定められたしきい
値よりも小さい直線と文字との接触状態について、該文
字の認識の信頼度が向上する再認識の方法を学習する。
【0068】テーブル作成手段79は、該再文字認識手
段78によって学習された再認識方法を、前記文字認識
手段が誤って認識する文字と正しい文字との組み合わせ
から成る文字対と共に記憶するテーブル80を作成す
る。
【0069】前記信頼度算出手段77は、例えば、各文
字について、該各文字が枠もしくは罫線等の直線に接触
している様々の形態の画像パターンを生成する接触文字
生成手段と、該接触文字生成手段によって生成された画
像パターンに対する前記文字認識手段の文字の認識率を
調べ、該認識率を各文字の信頼度として設定する信頼度
設定手段とを備える。
【0070】前記接触文字生成手段は、例えば、予め定
められた枠または罫線等の直線に、様々な形態に変化さ
せた各文字を重畳させて前記画像パターンを生成する。
また、前記接触文字生成手段は、例えば、各文字のサイ
ズを変化させて前記画像パターンを生成する。
【0071】また、さらに、前記接触文字生成手段は、
各文字を、その重心を中心とする回転角度を変化させて
前記画像パターンを生成する。また、さらに、前記接触
文字生成手段は、予め定められた形態の各文字に、様々
な形態に変化させた枠または罫線等の直線を重畳させて
前記画像パターンを生成する。
【0072】また、さらに、前記接触文字生成手段は、
枠または罫線等の直線を、その重心を中心とする回転角
度を変化させて前記画像パターンを生成する。また、さ
らに、前記接触文字生成手段は、枠または罫線等の直線
を、その幅のサイズを変化させて前記画像パターンを生
成する。
【0073】また、さらに、前記接触文字生成手段は、
枠または罫線等の直線を、その幅のサイズを各位置によ
って変動させながら前記接触文字を生成する。また、さ
らに、前記接触文字生成手段は、様々な形態に変化させ
た各文字に、様々な形態に変化させた枠または罫線等の
直線を重畳させて、前記画像パターンを生成する。
【0074】また、さらに、前記接触文字生成手段は、
文字の重心と、枠または罫線等の直線との重心の相対的
な位置関係を変化させて前記接触文字を生成する。この
図12に示す発明では、文字分離手段75が、枠または
罫線等の直線と文字とが接触している画像から該文字の
みを分離・抽出し、続いて、文字認識手段76が、該文
字分離手段75によって抽出された文字を認識する。次
に、信頼度算出手段77が、該文字認識手段76によっ
て認識される文字の信頼度を、前記直線と文字との接触
状態毎に算出する。続いて、再文字認識手段78が、該
信頼度算出手段77によって算出される信頼度が予め定
められたしきい値よりも小さい直線と文字との接触状態
について、該文字の認識の信頼度が向上する再認識の方
法を学習する。そして、テーブル作成手段79が、該再
文字認識手段78によって学習された再認識方法を、前
記文字認識手段が誤って認識する文字と正しい文字との
組み合わせから成る文字対と共に記憶するテーブル80
を作成する。
【0075】したがって、文字分離手段75によって認
識された文字の信頼度を、参照可能なテーブル80を作
成できる。図13は、さらに、他の発明の原理を説明す
るブロック図(その13)である。
【0076】パターン分離手段81は、直線とパターン
とが重なっている画像から上記パターンのみを分離・抽
出する。パターン認識手段82は、該パターン分離手段
81によって抽出されたパターンを認識する。
【0077】信頼度算出手段83は、該パターン認識手
段82によって認識されるパターンの信頼度を、前記直
線と前記パターンとの重なり状態毎に算出する。再認識
手段84は、該信頼度算出手段83によって算出される
信頼度が予め定められたしきい値よりも小さい直線とパ
ターンとの重なり状態について、前記パターン認識手段
82とは異なる手法により前記パターンを再認識する。
【0078】また、図13に示す他の発明は、前記パタ
ーン認識手段82によって認識される信頼度が予め定め
られたしきい値よりも小さい直線とパターンとの重なり
状態について、前記パターンの認識の信頼度が向上する
パターンの再認識方法が登録されているテーブル85
を、さらに備え、前記再認識手段84は、上記テーブル
に登録されている再認識方法により前記再認識を行うよ
うに構成される。
【0079】前記テーブル85に登録されている再認識
方法は、前記パターン分離手段によって分離されたパタ
ーンの特定領域を用いて認識する方法である。前記パタ
ーンの特定領域は、例えば、前記パターンに外接する矩
形の分割領域である。
【0080】図13に示す発明では、パターン分離手段
81が、直線とパターンとが重なっている画像から上記
パターンのみを分離・抽出し、続いて、パターン認識手
段8・が、該パターン分離手段81によって抽出された
パターンを認識する。次に、信頼度算出手段83が、該
パターン認識手段82によって認識されるパターンの信
頼度を、前記直線と前記パターンとの重なり状態毎に算
出する。そして、再認識手段84が、該信頼度算出手段
83によって算出される信頼度が予め定められたしきい
値よりも小さい直線とパターンとの重なり状態につい
て、前記パターン認識手段82とは異なる手法により前
記パターンを再認識する。
【0081】したがって、パターン分離手段81によっ
て認識されたパターンの信頼度が予め定められたしきい
値よりも小さい場合、別のパターン認識手法により該パ
ターンを再認識して、該パターンの認識率を高めること
ができる。
【0082】また、図13に示す他の発明では、再認識
手段84が、前記パターン認識手段82によって認識さ
れる信頼度が予め定められたしきい値よりも小さい直線
とパターンとの重なり状態について、前記パターンの認
識の信頼度が向上するパターンの再認識方法が登録され
ているテーブル85を参照して、前記パターン認識手段
82によって認識される信頼度が予め定められたしきい
値よりも小さいパターンについて、前記テーブルに登録
されている再認識方法により再認識を行う。
【0083】したがって、前記パターン認識手段82に
よって認識される信頼度が予め定められたしきい値より
も小さいパターンの認識率を向上できる。図14は、さ
らに、他の発明の原理を説明するブロック図(その1
4)である。
【0084】文字分離手段86は、枠または罫線等の直
線と文字とが接触している画像から上記文字のみを分離
・抽出する。文字認識手段87は、該文字分離手段86
によって抽出された文字を認識する。
【0085】信頼度算出手段88は、該文字認識手段8
7によって認識される文字の信頼度を、前記直線と前記
文字との接触状態毎に算出する。再認識手段89は、該
信頼度算出手段88によって算出される信頼度が予め定
められたしきい値よりも小さい直線と文字との接触状態
について、前記文字認識手段87とは異なる手法により
前記文字を再認識する。
【0086】図14に示す他の発明は、前記文字認識手
段87によって認識される信頼度が予め定められたしき
い値よりも小さい直線と文字との接触状態について、前
記文字の認識の信頼度が向上する文字の再認識方法が登
録されているテーブル90を、さらに備え、前記再認識
手段89は、上記テーブル90に登録されている再認識
方法により前記再認識を行う。
【0087】前記テーブル90に登録されている再認識
方法は、例えば、前記文字分離手段86によって分離さ
れた文字の特定領域を用いて認識する方法である。前記
文字の特定領域は、前記文字に外接する矩形の分割領域
に含まれる領域である。
【0088】また、さらに、他の発明は、例えば、前記
文字認識手段87によって認識される信頼度が予め定め
られたしきい値よりも小さい直線と文字との接触状態に
ついて、前記文字認識手段が誤って認識しやすい文字と
正しい文字とが組み合わせられた文字対と、前記接触文
字の認識の信頼度が向上する文字の再認識方法が登録さ
れているテーブルを、さらに備え、前記再認識手段89
は、前記文字認識手段87によって認識された文字が上
記テーブル90に登録されている文字対に含まれる場
合、前記テーブル90に登録されている再認識方法によ
り前記再認識を行うように構成される。
【0089】前記テーブル90に登録されている認識方
法は、例えば、前記文字分離手段87によって分離され
た文字の特定領域を用いて認識する方法である。前記文
字の特定領域は、例えば、前記文字に外接する矩形の分
割領域に含まれる領域である。
【0090】また、さらに、他の発明は、前記文字認識
手段87によって認識される信頼度が予め定められたし
きい値よりも小さい直線と文字との接触状態について、
該信頼度と、前記文字認識手段が誤認識しさすい文字と
正しい文字との組み合わせである文字対と、前記接触文
字の認識の信頼度が向上する文字の再認識方法が登録さ
れているテーブル90を、さらに備え、前記再認識手段
89は、前記文字認識手段87によって認識された文字
が上記テーブル90に登録されている文字対に含まれ、
かつ上記テーブル90に登録されている前記文字認識手
段87によるその文字の認識の信頼度が予め定められた
しきい値よりも小さい場合、前記テーブル90に登録さ
れている認識方法により前記再認識を行う。
【0091】前記テーブル90に登録されている再認識
方法は、前記文字分離手段86によって分離された文字
の特定領域を用いて認識する方法である。前記文字の特
定領域は、例えば、前記文字に外接する矩形の分割領域
に含まれる領域である。
【0092】また、さらに、他の発明は、前記文字認識
手段87によって認識される信頼度が予め定められたし
きい値よりも小さい直線と文字との接触状態について、
その接触状態の特徴を表すパラメータと、該信頼度と、
前記文字認識手段87が誤認識し易い文字と正しい文字
の組み合わせから成る文字対と、前記接触文字の認識の
信頼度が向上する文字の認識方法が登録されているテー
ブル90を、さらに備え、前記再認識手段89は、上記
直線と文字との接触状態の特徴を表す各パラメータの値
を算出し、該パラメータと、前記文字認識手段87によ
って認識された文字が上記テーブル90に登録されてお
り、かつ上記テーブル90に登録されている前記文字認
識手段87によるその文字の認識の信頼度が予め定めら
れたしきい値よりも小さい場合、前記テーブル90に登
録されている再認識方法により前記再認識を行う。
【0093】前記テーブルに登録されている再認識方法
は、例えば、前記文字分離手段によって分離された文字
の特定領域を用いて認識する方法である。前記文字の特
定領域は、例えば、前記文字に外接する矩形の分割領域
に含まれる領域である。
【0094】この図14に示す発明では、文字分離手段
86が、枠または罫線等の直線と文字とが接触している
画像から上記文字のみを分離・抽出し、続いて、文字認
識手段87が、該文字分離手段86によって抽出された
文字を認識する。次に、信頼度算出手段88が、該文字
認識手段87によって認識される文字の信頼度を、前記
直線と前記文字との接触状態毎に算出し、続いて、再認
識手段89が、該信頼度算出手段88によって算出され
る信頼度が予め定められたしきい値よりも小さい直線と
文字との接触状態について、前記文字認識手段87とは
異なる手法により前記文字を再認識する。
【0095】したがって、前記文字認識手段87によっ
て認識される信頼度が予め定められたしきい値よりも小
さい文字の認識率を向上できる。また、図14に示す他
の発明では、前記再認識手段89が、前記文字認識手段
87によって認識される信頼度が予め定められたしきい
値よりも小さい直線と文字との接触状態について、前記
文字の認識の信頼度が向上する文字の再認識方法が登録
されているテーブル90を参照して、前記文字認識手段
87によって認識される信頼度が予め定められたしきい
値よりも小さい文字について、上記テーブル90に登録
されている再認識方法により再認識を行う。
【0096】したがって、前記文字認識手段87によっ
て認識される信頼度が予め定められたしきい値よりも小
さい文字の認識率を向上できる。また、さらに、図14
に示す他の発明では、前記再認識手段89が、前記文字
認識手段87によって認識される信頼度が予め定められ
たしきい値よりも小さい文字について、前記文字認識手
段87が誤って認識しやすい文字と正しい文字とが組み
合わせられた文字対と、前記接触文字の認識の信頼度が
向上する文字の再認識方法が登録されているテーブル9
0を参照して、前記文字認識手段87によって認識され
た文字が上記テーブル90に登録されている文字対に含
まれる場合、前記テーブル90に登録されている再認識
方法により再認識する。
【0097】したがって、前記文字認識手段87によっ
て認識される信頼度が予め定められたしきい値よりも小
さい文字の認識率を向上できる。また、さらに、図14
に示す他の発明では、前記再認識手段89が、前記文字
認識手段87によって認識される信頼度が予め定められ
たしきい値よりも小さい直線と文字との接触状態につい
て、該信頼度と、前記文字認識手段が誤認識しさすい文
字と正しい文字との組み合わせである文字対と、前記接
触文字の認識の信頼度が向上する文字の再認識方法が登
録されているテーブル90を参照して、前記文字認識手
段87によって認識された文字が上記テーブル90に登
録されている文字対に含まれ、かつ上記テーブル90に
登録されている前記文字認識手段87によるその文字の
認識の信頼度が予め定められたしきい値よりも小さい場
合、上記文字を前記テーブル90に登録されている認識
方法により再認識する。
【0098】したがって、前記文字認識手段87によっ
て認識される信頼度が予め定められたしきい値よりも小
さい文字の認識率を向上できる。また、さらに、図14
に示す他の発明では、前記再認識手段89が、前記文字
認識手段87によって認識される信頼度が予め定められ
たしきい値よりも小さい直線と文字との接触状態につい
て、その接触状態の特徴を表すパラメータと、該信頼度
と、前記文字認識手段87が誤認識し易い文字と正しい
文字の組み合わせから成る文字対と、前記接触文字の認
識の信頼度が向上する文字の認識方法が登録されている
テーブル90を参照して、予め算出した上記直線と文字
との接触状態の特徴を表す各パラメータの値と、前記文
字認識手段87によって認識された文字が上記テーブル
90に登録されており、かつ上記テーブル90に登録さ
れている前記文字認識手段87によるその文字の認識の
信頼度が予め定められたしきい値よりも小さい場合に、
前記テーブル90に登録されている再認識方法により前
記文字を再認識する。
【0099】したがって、前記文字認識手段87によっ
て認識される信頼度が予め定められたしきい値よりも小
さい文字の認識率を向上できる。
【0100】
【発明の実施の形態】以下、図面を参照しながら本発明
の実施例を説明する。図15は、本発明の一実施例であ
る画像抽出装置のシステム構成を示すブロック図であ
る。本装置において、処理の対象となる入力パターン
は、予め極端な傾きや回転等に対して補正が施され、さ
らに雑音の除去、及びかすれの穴埋め等の前処理を施さ
れた2値画像であるものとする。又、本実施例では便宜
上黒枠の帳票から枠を除去するものとする。つまり、サ
イズ、位置及び傾きが分からない文字枠に対して手書き
文字が書かれており、文字が該文字枠と接触したり該文
字枠からはみ出していても該文字枠だけを除去する。処
理の対象となる文字枠は、図16(a) に示す規則的な表
形式のブロック枠、同図(b) に示す不規則な表形式のブ
ロック枠、同図(c) に示すフリーフォーマット枠などで
ある。
【0101】連結パターン抽出部101には、上述した
極端な傾きや回転に対する補正、雑音の除去、及び「か
すれ」の穴埋め等の前処理が施された入力パターンが入
力される。連結パターン抽出部101内のラベリング部
は、この入力パターンについて、枠の位置に関係なく接
触文字の候補を選択するため、縦、横、斜め方向の8方
向のいずれかで繋がっている連結パターンをラベリング
により抽出する。この様な8連結によるラベリングで得
られる連結パターンは、(イ)文字が接触していない場
合の枠、(ロ)枠に接触していない文字或いは文字の一
部、又は(ハ)枠に接触している文字のいずれかであ
る。
【0102】尚、ラベリングで得られた連結パターンの
サイズは後の処理で必要となるので、ラベリングの処理
中にその連結パターンを矩形に近似する。そして、該矩
形の角の座標を求め、これをメモリに記憶しておく。
【0103】枠抽出部102は、該連結パターン抽出部
101によって抽出された連結パターンの中から、文字
枠に相当する直線を抽出する。この直線(枠)を抽出す
る際には、例えば、処理の高速化のために、先ず線幅の
太い直線(枠)を抽出し、これによって抽出できなかっ
た場合には次に線幅の細い直線(枠)を抽出する。
【0104】図17は、枠抽出部102の一実施例のブ
ロック図である。投影部102aは、連結パターン抽出
部101により抽出された部分パターンを水平方向及び
垂直方向に投影する。直線検出部102bは、該投影部
102aにより得られた水平方向の投影情報及び垂直方
向の投影情報から水平線及び垂直線を検出する。第1の
4辺検出部102cは、該直線検出部102bにより検
出された直線から構成される矩形について、その4辺を
検出する。追跡部102dは、上記直線検出部102b
及び第1の4辺検出部102cで検出できなかった線幅
の細い直線を求めるため、後述するnランレングス手法
により線を追跡する。第2の4辺検出部102eは、該
追跡部102dにより求められた線幅の細い直線から構
成される矩形について、その4辺を検出する。枠抽出部
22fは、4辺検出部22c,22eで求められた矩形
情報から枠を抽出する。
【0105】続いて、上記構成の枠抽出部102の動作
を、より詳細に説明する。 (A)線幅の太い直線/枠の抽出 枠のサイズが未知で、かつ、枠に文字が接触している場
合でも、安定に枠を抽出する必要がある。そこで、投影
部102aは、ラベリングで得られた部分パターン毎に
投影をとる。そして、直線検出部102bにおいて、投
影値と部分パターンを矩形に近似して得られる縦横サイ
ズとの比を計算して、その比が所定の閾値以上であれば
長い直線であると判断する。
【0106】尚、この直線は、枠だけでなく文字のスト
ロークの場合もあるので、できるだけ最外郭の直線で矩
形らしさを満足する4辺に相当する直線を求める。図1
8は、連結パターン抽出部101でのラベリング処理に
より得られた部分パターンの水平方向及び垂直方向の投
影を示す図である。同図中、ラベリングにより得られた
部分パターン141は、横方向に長さLx、縦方向に長
さLyを有する。また、部分パターンは、垂直方向iの
投影VP及び水平方向jの投影HPを有する。
【0107】ここで、説明の便宜上、画像のサイズをm
列×n行、同図に示す平面座標系での座標(i,j)の
濃度値をf(i,j)、i行目の水平方向の投影をPh
(i)、j列目の垂直方向の投影をPv (j)とする
と、Ph (i)及びPv (j)は夫々次の(2)式及び
(3)式で表される。
【0108】
【数1】
【0109】直線検出部102bは、投影部102aで
求められた水平方向の投影及び垂直方向の投影につい
て、連結パターン抽出部101で求められた部分パター
ンの矩形座標の矩形の縦横の長さLx及びLyを用い
て、次の(4)式により縦の長さLxと水平方向の投影
h (i)との比、又、次の(5)式により横の長さL
yと垂直方向の投影Pv (j)との比を求め、これらの
比を閾値THL と比較する。
【0110】
【数2】
【0111】そして、(4)式と(5)式における比が
閾値THL 以上であれば、部分パターンが枠を構成する
直線の候補であるものとする。即ち、図24に示すよう
に、抽出された部分パターンが矩形である場合には、そ
の直線部分の水平投影値Ph(i)と垂直投影値P
v (j)が最も大きくなり、その縦横の長さLxとLy
との比も大きくなるので、(4)式と(5)式により直
線部分を判別することができる。
【0112】図19は、枠の構成要素を示し、枠は上
枠、下枠、左枠、及び右枠により構成されている。上枠
は、線分(直線)i1及びi11からなる。下枠は、線
分(直線)i2及びI22からなる。左枠は、線分(直
線)j1及びj11からなる。右枠は、線分(直線)j
2及びj22からなる。図24に示すようにラベリング
により得られた部分パターンの矩形の縦横の長さを夫々
Lx,Lyとしたとき、投影と長さの比が所定の閾値T
L 以上であれば、該部分パターンを枠を構成する線分
(直線)の候補とする。
【0113】枠抽出部102fは、4辺検出部102c
の検出結果に基づいて枠を抽出する。すなわち、4辺検
出部102cで直線部分が検出されると、該直線情報に
基づいて枠を抽出し、直線部分が検出されないと他の候
補に着目して枠を抽出する。
【0114】上記のように枠の骨格を構成する直線を求
めた後、その骨格線の前後に注目し、骨格線から連続し
て何本水平線の候補或いは垂直線の候補が存在するかを
計算し、その値を各辺の線幅の基準とする。
【0115】図20(a) は、上記のようにして抽出され
た線幅の太い枠の一例を示す図である。同図(a) の例で
は、抽出された枠151に対して図中、破線で示す骨格
線152が得られている。また、各辺の線幅はこの例で
は2画素分である。 (B)線幅の細い直線/枠の抽出 上記した図20(a) に示された線幅の太い直線/枠の抽
出処理では抽出できなかった部分パターンに注目して、
線幅の細い直線/枠の抽出を行う。
【0116】同図(b) は線幅の細い枠の一例を示す図で
あり、枠153及びその骨格線154が示されている。
線幅の細い枠には、同図に示す如く、線幅が1画素分程
度で、かつ、傾き等による凹凸が生じているパターンが
含まれる。同図に示す線幅の細い枠を安定に抽出するた
めに、本実施例では次のようにして枠を探索する。
【0117】即ち、枠の抽出には、図21に示すよう
に、傾きによる凹凸が生じていても直線を検出できる
「nラインランレングス」と名付ける直線長を定義す
る。通常のランレングスでは、水平或いは垂直に連続し
ている画素数を計算するので、図20(b) に示すような
凹凸が生じている長い直線では短い直線に分割されてし
まうが、図21に示すnラインランレングスでは、ある
nラインの間で8連結で接続するランレングスをnライ
ンランレングスとして計算する。nの値は傾きの大きさ
で決定し、傾きが大きければ大きい程nを大きくする。
n=1の場合は、通常のランレングスに相当する。
【0118】図21に示す例はn=3の場合を示し、こ
の場合は凹凸が生じているにもかかわらず、7画素分の
水平線として直線を抽出することができる。枠抽出部1
02fの追跡部102dは、連結パターン抽出部101
のラベリング部で得られた部分パターンの矩形座標より
矩形を構成する直線の両端及び中点等の複数の点から枠
の内部に垂線を下ろして部分パターンと接触した位置を
開始点として、上記nラインランレングスにより、開始
点より左右或いは上下方向へ部分パターンに沿って探索
する。
【0119】この様な手法を用いることにより、枠から
文字がはみ出していても、安定に線幅の細い直線を求め
ることができる。4辺検出部102cは、上記のように
して得られた直線の長さを、水平線の候補はNhi、垂
直線の候補はNvjとする。又、連結パターン抽出部1
01のラベリング部で求めた部分パターンの矩形座標の
矩形の縦横の長さLx及びLyを用いて、次の(8)式
により縦の長さLxと水平線の候補の直線長Nhiとの
比、又は、次の(9)式により横の長さLyと垂直線の
候補の直線長Nvjとの比を求め、これらの比を閾値T
L と比較する。
【0120】
【数3】
【0121】そして、(8)式と(9)式における比が
閾値THL 以上であれば、各候補を、枠を構成する直線
の候補であるものとする。第1の4辺検出部102c
は、直線検出部102bにより検出された水平線の候補
と垂直線の候補の中から、夫々最外郭の水平線候補i
1,i2及び垂直線の候補j1,j2に着目して、次の
(10)式及び(11)式を計算して閾値TH L ′と比
較する。
【0122】
【数4】
【0123】枠抽出部102fは、前記した場合と同様
に、第1の4辺検出部102cの検出結果に基づいて枠
を抽出する。つまり、第1の4辺検出部102cで直線
部分が検出されるとこれに基づいて枠を抽出し、直線部
分が検出されないと他の候補に着目して上記処理を繰り
返すことにより、枠を抽出する。具体的には、候補が上
記(10)式、(11)式を満足すれば枠を構成する直
線と見なし、満足しなければ他の候補に着目して上記処
理を繰り返す。尚、線幅の基準値は、枠抽出中に得られ
た最大と最小の位置座標の差として求める。
【0124】この様にして1つの文字枠を求めた後、抽
出された文字枠を全画像にわたってスキャンして、連結
パターン抽出部101により抽出された部分パターンと
のマッチングをとってから新たに文字枠を抽出すること
も可能である。
【0125】又、連結パターン抽出部101において求
めた部分パターンを近似した矩形と抽出された文字枠と
のサイズ比を算出し、算出したサイズ比が所定の閾値内
である部分パターンだけに絞り込んで、抽出済の文字枠
とのマッチングをとってから新たに文字枠を抽出するこ
とも可能である。
【0126】更に、抽出された文字枠のサイズ分だけ左
右或いは上下の範囲内に存在する部分パターンを抽出
し、抽出した全ての部分パターンが次に説明する属性付
加手段において文字だけからなるパターンであると判定
されている場合に、上記抽出された文字枠を文字パター
ンと判定し直す手段を設けても良い。この様な手段を設
けた場合、例えば「国」という漢字のように枠に相当す
る矩形部分を持つ文字であっても、文字の一部を誤って
枠として判定してしまうことを防ぐことができる。
【0127】枠交点算出部103は、該枠抽出部102
によって抽出された枠の内、文字が接触している枠につ
いて、該枠と該文字の線分との交点を算出する。該枠交
点算出部103は、例えば、図22に示すように連結パ
ターン属性付加部123、接触度検出部131、枠分離
部124、2交点算出部125−2、及び3交点算出部
125−1等から構成される。
【0128】連結パターン属性付加部123は、連結パ
ターン抽出部101により抽出された連結パターンに対
して、枠抽出部102の抽出結果に基づいて、「枠」、
「文字パターン又はその一部」、または「枠と文字パタ
ーンあるいはその一部との接触パターン」(文字と枠と
の接触パターン)のいずれかの属性を付加する。
【0129】接触度検出部131は、上記「文字と枠と
の接触パターン」の属性が付加された連結パターンに対
して、「枠と文字の幅」及び「文字と枠の接触の度合
い」から“接触度”を検出する。すなわち、例えば、文
字幅が枠幅より大きく、文字と枠との接触が比較的少な
い場合には、接触度が小さいと判断する。他方、文字幅
と枠幅が略同じであるか、或いは文字と枠との接触が比
較的多い場合には、接触度が大きいと判断する。接触度
が小さい場合は、枠分離部124で枠を分離してから、
2交点算出部125−2で文字と枠との交点を算出す
る。又、接触度が大きい場合は、3交点算出部125−
1で文字と枠との交点を算出する。
【0130】3交点算出部125−1で3交点を算出し
て枠から文字線分を抽出した方がより正確に文字線分を
枠から抽出できるが、処理時間が長くなる。このため、
上記“接触度”を算出して、文字と枠との接触が複雑で
ある場合のみ、3交点算出部125−1で3交点を算出
し、それ以外は文字線分抽出処理を高速化するために2
交点算出部125−2で2交点を算出する。尚、このよ
うに2交点算出部125−2と3交点算出部125−1
の双方を設ける代わりに、いずれか一方のみを設けるよ
うにしてもよい。
【0131】枠分離部124は、上記連結パターン属性
付加部123で「枠」または「文字と枠との接触パター
ン」(接触文字パターン)という属性が付与された連結
パターンから枠を分離する。枠分離部124は、例えば
図23に示すように、枠部分の辺の幅を算出する辺幅算
出部124a、枠を除去する枠除去部124b、枠を除
去したパターンについて再びラベリングを施し、面積の
小さいパターンを雑音として除去する枠雑音除去部12
4c、および属性付加部124dからなる。上記属性付
加部124dは、連結パターン属性付加部123におい
て属性が付与されなかったパターンの内、枠を除去して
も残るパターンには「接触文字パターン」の属性を付加
し、枠を除去したら何も残らないパターンには「枠」だ
けの属性を付加する。(4)枠の分離辺幅算出部124
aは、枠の外輪郭の凹凸と内輪郭の凹凸を考慮して、枠
抽出時に得られた線幅基準値+2(外輪郭に+1、内輪
郭に+1)を線幅として求め、枠抽出において算出した
骨格線或いは抽出中の最大/最小の位置を基に枠の外輪
郭と内輪郭の座標値を決定する。
【0132】図24は、線幅の太い枠と線幅の細い枠に
ついて、その骨格線、外輪郭、内輪郭、及び線幅を示す
図であり、「太い線」は外輪郭、「点線」は内輪郭、
「細い線」は骨格線を示す。同図(a) は線幅の太い枠を
示し、同図(b) は線幅の細い枠を示す。辺幅算出部12
4aは、同図に示すように、線幅の太い枠と線幅の細い
枠について枠の外輪郭と内輪郭の座標値を決定する。
尚、同図において、座標系は図25に示すように設定さ
れている。
【0133】辺幅算出部124aは、上枠の外輪郭及び
内輪郭のi座標がそれぞれi1,i11でその幅がw1
であると、上枠の枠座標を(i1−1,i11+1)、
その辺幅をw1+2とする。又、下枠の外輪郭及び内輪
郭のi座標がそれぞれi2,i22でその幅がw2であ
ると、下枠の枠座標を(i2+1,i22−1)、その
辺幅をw2+2とする。同様にして、左枠の外輪郭及び
内輪郭のj座標がそれぞれj1,j11で幅がw3であ
ると、左枠の枠座標を(j1−1,j11+1)、その
辺幅をw3+2とする。更に、右枠の外輪郭及び内輪郭
のj座標がそれぞれj2,j22でその幅がw4である
と、右枠の枠座標を(j2+1,j22−1)、その辺
幅をw4+2とする。
【0134】枠除去部124bは、辺幅算出部124a
によって求められた枠の外輪郭と内輪郭の座標値とを基
に、外輪郭と内輪郭の間に存在する枠のパターンを除去
する。
【0135】枠雑音除去部124cは、上述のようにし
て枠除去部124bによって枠が除去されたパターンに
対して再びラベリングを行い、各ラベル毎に面積が小さ
い等の特徴を抽出して、該抽出情報を基に枠の一部とし
て残存しているパターンを除去する。属性付加部124
dは、連結パターン属性付加部123で属性が付加され
なかったパターンに着目して、該パターンの内枠を除去
してもパターンが存在しているものは接触文字パターン
或いは文字の一部であることを示すパターンの属性を付
加し、枠を除去したらパターンがなくなるものは枠だけ
であることを示すパターンの属性を付加する。
【0136】尚、接触文字パターン或いは文字の一部
は、後述するように、枠内の文字部分を補間した後、他
の接触文字パターン或いは文字の一部と統合されるか、
それとも単独のパターンとするか判断される。
【0137】図26は、3交点算出部125−1の一実
施例を示すブロック図である。前記接触度が大きく、文
字と枠との接触が複雑である場合、枠を分離しない状態
のままで、3交点算出部内125−1において枠と文字
との交点を算出する。
【0138】文字/枠交点算出部(文字と枠交点算出
部)2511は、接触文字パターン或いは文字の一部を
対象として、それらのパターンと枠との交点を算出す
る。即ち、枠分離部124において求められた枠の外輪
郭と内輪郭の線分に関する情報を用いて、外輪郭に対し
て1画素分、枠の外側方向にある第1の直線、内輪郭に
対して1画素分、枠の内側にある第2の直線を求め、こ
れらの第1及び第2直線と接触文字パターン或いは文字
の一部が交わる点で黒から白、或いは、白から黒に変化
する点を求め、これを“交点”(文字と枠との交点)と
して抽出する。そして、本実施例では、“文字と枠との
交点”を所定の線幅を有する文字と上記第1または第2
の直線とが交わる2点x,yを用いて、(x,y)と表
現する。該x,yは、上記直交i−j座標系において
は、(i,j)で表される。すなわち、上枠の外輪郭と
文字との交点、上枠の内輪郭と文字の交点、さらには下
枠、左枠及び右枠についても、それらの外輪郭と内輪郭
と文字との交点を算出する。
【0139】枠内文字の交点算出部2512は、全ての
文字と枠の交点に関してその位置から枠内方向へ文字線
分を探索して枠内の交点を算出すると共に、その文字線
分の面積を求める。ただし、文字線分の探索中に文字線
分が途切れてしまう場合には、算出された交点が文字と
枠との交点ではないと判定する。
【0140】次に、枠外文字の交点算出部2513は、
全ての文字と枠の交点に関してその位置から枠外方向へ
枠幅分程度まで文字線分を探索して、該文字線分の枠外
の交点を算出すると同時に、その探索した文字線分の面
積を求める。枠外方向とは、枠内方向とは反対の方向で
あり、枠から外側へ向かう方向を指し、枠外の交点と
は、枠から遠い交点を指す。文字/枠交点判定部(文字
と枠の交点判定部)2514は、文字/枠交点算出部2
511及び枠外文字の交点算出部2512でそれぞれ求
めた上記2つの文字線分の面積の和が所定の閾値以下で
あれば、文字線分を雑音とみなして除去すると共に、そ
の交点が文字と枠との交点ではないと判定する。
【0141】図27は、上記2交点算出部125−2の
一実施例を示すブロック図である。接触度が小さい場
合、前記枠分離部124で枠を分離した後、2交点算出
部125−2で交点を算出する。文字/枠交点算出部2
511は、前記接触文字パターンについて枠と文字との
交点を算出する。枠外文字の交点算出部2512は、全
ての文字と枠の交点に関してその位置から枠外方向へ枠
幅分程度まで文字線分を探索して枠外の交点を算出する
と同時に、その探索した文字線分の面積を求める。
【0142】文字/枠交点判定部2513は、枠外文字
の交点算出部2512で求めた上記文字線分の面積が所
定の閾値以下であれば、文字線分を雑音とみなして除去
すると共に、その交点が文字と枠との交点ではないと判
定する。
【0143】交点対応付け部104は、交点枠算出部1
03で得られた交点情報に基づいて、枠と接触している
文字線分の方向性を求める。また、枠の両側に接触して
いる2つの文字線分間の距離d1 を求める。さらに、上
記方向性と、上記2つの文字線分間の距離d1 、及び方
向に基づく文字線分の連続性の条件とにより、文字と枠
との各交点を対応付ける。この交点対応付け部104
は、例えば、3交点対応付け部と2交点対応付け部から
構成される。
【0144】3交点対応付け部は、前記3交点算出部1
25−1で得られた「枠から遠い交点」、「文字と枠の
交点」及び「枠内交点」の3種類の交点情報に基づい
て、文字線分の方向性を求める。また、この方向性と、
文字線分と枠との交点から求められる前記2つの文字線
分間の距離d1 、及び方向に基づく文字線分の連続性の
条件により、文字と枠との各交点を対応付ける。
【0145】2交点対応付け部は、2交点算出部125
−2で得られた「文字と枠の交点」及び「枠外交点」の
2種類の交点に基づいて、文字線分の方向性を求める。
又、この方向性と、枠外の交点とから求められる文字線
分間の距離、及び方向に基づく文字線分の連続性の条件
により、文字と枠との各交点を対応付ける。そして対応
付けられた交点同士を接続して前記枠分離部124によ
って文字枠が除去されたことによって分離された文字パ
ターンを修復する補間処理を行う。本実施例では、該文
字パターンを仮文字線分として取り扱う。
【0146】ここで、上記3交点対応付け部の処理をよ
り詳細に説明する。3交点対応付け部は、「枠から遠い
交点」、「枠内の交点」及び「文字と枠との交点」の3
種類の交点の位置情報から枠外の2つの文字線分の方向
性を算出し、それらの文字線分の方向が略同じであるこ
とが判明されれば文字と枠との交点間を対応付ける。方
向性が一致しない場合であっても、枠内の交点間の距離
に関する条件または連続性対応に関する条件が満足され
る場合には、文字と枠との交点間を対応付ける。この場
合、枠内の交点に対して対応付けの条件判定を行うの
で、文字と枠との交点間を正しく対応付けすることがで
きる。
【0147】図28は、方向性が一致する場合の文字と
枠の交点間の対応付けを示す図であり、同図において、
ハッチング部分は帳票等から光学的に読み取られた黒画
素の画像、「黒丸」は枠と文字との交点、「黒三角形」
は枠から遠い交点、矢印H1,H2は方向性を表す。他
方、図29は方向性が一致しない場合の文字と枠の交点
間の対応付けを示す図であり、同図中、ハッチング部分
は帳票等から光学的に読み取られた黒画素の画像、「黒
丸」は枠と文字との交点、「黒三角形」は枠から遠い交
点、矢印H1′,H2′は方向性を表す。
【0148】図28の場合には、枠内の仮文字線分が対
角線方向に方向性があると判断される、図29の場合に
は方向性無しと判断される。図30は、前記3交点対応
付け部の処理の一実施例をより詳細に説明する図であ
り、該処理をソフトウェアで実現する場合のフローチャ
ートを示す。まず、3交点算出部125−1からの交点
等に関する情報を受け(ステップS61)、次に、枠幅
をwに設定する(ステップS62)。続いて、文字と枠
との交点P11(A,B)、その枠内の交点P1n(An
n )、及び枠から遠い交点P1t(At,Bt)から、
枠外の文字線分の一方のパターン(第1のパターン)の
方向性H1を求める(ステップS63)。尚、交点P11
(A,B)は、交点P11の左端の座標がA、右端の座標
がBであることを示す。その他の交点P1n,P1tについ
ても同様であり、後記P21,P2n及びP2tについても同
様である。さらに、文字と枠との交点P21(C,D)、
その枠内の交点P2n(Cn ,Dn )、及び枠から遠い交
点P2t(Ct ,Dt )から、枠外の文字線分の他方のパ
ターン(第2のパターン)の方向性H2を求める。そし
て、上記2つの方向性H1とH2がほぼ同一とみなせる
か否かを判断する(ステップS65)。このように、ス
テップS63〜S65で、枠外の2つの文字線分パター
ンの方向性が一致するか否かを確認する。
【0149】ステップS65の判断結果がNOである
と、枠内の交点P1nの中点T1を(A n +Bn )/2を
演算することにより求める(ステップS66)。さら
に、枠内の交点P2nの中点T2を(Cn +Dn )/2を
演算することにより求める(ステップS67)。続い
て、枠内の交点P1nとP2nとの間の距離KNをABS
(T1−T2)より求める(ステップS68)。尚、
“ABS”は、(T1−T2)の値の絶対値を表す記号
である。次に、KN<wであるか否か、すなわち、該枠
内の交点間の距離KNが枠幅wより小さいか否かを判断
する(ステップS69)。該ステップS69の判断結果
がNOであると、上記2の交点P11,P21の左端と右端
間の距離L1,L2を、それぞれ(C−B),(A−
D)を演算することにより求める(ステップS70)。
そして、L1>0であるか否か、すなわち、該距離L1
が“0”より大きいか否かを判断し(ステップS7
1)、該ステップS71の判断結果がYESであると、
次にL1<w/2であるか否か、すなわち、該距離L1
が枠幅wの半分よりも短いか否かを判断する(ステップ
S72)。ステップS71またはステップS72の判断
結果がNOの場合は、L2>0であるか否か、すなわ
ち、上記距離L2が“0”より大きいか否かを判断する
(ステップS73)。そして、該ステップS73の判断
結果がYESであると、L2<w/2であるか否か、す
なわち、該距離L2が枠幅wの半分よりも短いか否かを
判断する(ステップS74)。このようにステップS6
6〜S74で、枠内の2つの交点P1nとP2n間の距離K
N並びに枠と文字線分との交点P11とP21間の距離L
1,L2と枠幅wとの距離関係を確認する。
【0150】ステップS73或いはステップS74の判
断結果がNOの場合は、An <Cn<Bn であるか否か
を判断する(ステップS75)。そして、該ステップS
75の判断結果がNOの場合は、次に、An <Dn <B
n であるか否かを判断する(ステップS76)。そし
て、該ステップS76の判断結果がNOであると、処理
はステップS63に戻る。このように、ステップS75
及びステップS76で、枠と文字との交点P11,P21
位置情報A,B,C,Dに基づいて、枠外の相対する2
つの文字線分について連続性対応の条件を満足するか否
かを確認する。
【0151】そして、上記ステップS65,S69,S
72,S74又はS76の判断結果がYESの場合は、
後述する枠内文字抽出部105の処理へ移行する(ステ
ップS77)。
【0152】3交点対応付け部が、上記図30に示すフ
ローチャートの処理により、枠内の交点に対して対応付
けの条件判定を行うので、例えば、図31及び図32に
示すように文字と枠との交点を正しく対応付けすること
ができる。図31は、枠内の交点により該対応付けが行
われる場合を示し、ハッチング部分は帳票等から光学的
に読み取られた黒画素の画像、「黒丸」は枠と文字との
交点、「黒四角形」は枠内の交点を示す。図31(a)
は、帳票等から読み取られた実際の画像パターンを示
し、同図(b) は文字と枠との交点では対応付けられない
が、同図(c) に示すように、前記図30のフローチャー
トのステップS75で、An <Cn <Bn の条件を満足
するので、枠内の交点により枠を介して対向している文
字と枠との2つの交点P11(A,B)とP21(C,D)
が対応付けられることを示す。又、図32は枠内の交点
により交点の対応付けが行われない場合を示し、ハッチ
ング部分は帳票等から光学的に読み取られた黒画素の画
像、「黒丸」は枠と文字との交点、「黒四角形」は枠内
の交点を示す。図32(a) は実際のパターンを示し、同
図(b) は枠内の2つの交点P1n(An ,Bn ),P
2n(Cn ,Dn )の位置関係により枠を介して対向して
いる文字と枠との2つの交点P11(A,B)とP
21(C,D)とが対応付けされないことを示す。尚、図
31(c) 及び図32(b) では、枠内交点An ,Bn ,C
n ,Dn の位置を、説明が理解し易くなるように、これ
らの交点の位置を枠wの外周上にマッピングしている。
【0153】次に、前記2交点対応付け部の動作を詳細
に説明する。該2交点対応付け部は、枠から遠い交点と
文字と枠との交点の座標から枠を介して対向している2
つの文字線分のパターンの方向性を算出し、略同じ方向
が算出されれば上記2つの枠と文字との交点間を対応付
ける。また、方向性が一致しない場合であっても、文字
と枠との交点間の距離または連続性対応の条件を満足す
る場合には、上記2つの文字と枠との交点間を対応付け
る。
【0154】図33は、該2交点対応付け部の処理の一
実施例をより詳細に説明する図であり、処理をソフトウ
ェアで実現する場合のフローチャートを示す。尚、P11
(A,B)、P1t(At ,Bt )、P21(C,D)、P
2t(Ct ,Dt )は、前述した図30のフローチャート
に示すものと同一である。まず、2交点算出部125−
2から交点等に関する情報を入力し(ステップS8
1)、次に、枠幅をwに設定する(ステップS82)。
そして、枠の一端での文字と枠との交点P11(A,B)
と該交点P11に対応する枠から遠い交点P1t(At ,B
t )とから、枠外の一方の文字線分のパターン(第1の
パターン)の方向性H1を求める(ステップS83)。
続いて、枠の他端での文字と枠との交点P21(C,D)
と該交点P21に対応する枠から遠い交点P2t(Ct ,D
t )とから、枠外の他方の文字線分のパターン(第2の
パターン)の方向性H2を求める(ステップS84)。
そして、上記2つの方向性H1とH2がほぼ等しいとみ
なせるか否かを判断する(ステップS85)。このよう
にして、ステップS83〜S85で、枠外の2つの文字
線分パターンの方向性の対応関係を確認する。
【0155】上記ステップS85の判断結果がNOであ
ると、次に、文字と枠との交点P11の中点T1の座標値
(A+B)/2を算出する(ステップS86)。さら
に、文字と枠との交点P22の中点T2の座標値(C+
D)/2を算出する(ステップS87)。さらに、上記
2つの交点P11,P22間の距離KであるABS(T1−
T2)を算出する(ステップS88)。“ABS”は
(T1−T2)の絶対値を示す記号である。そして、次
にK<wであるか否かを判断する(ステップS89)。
該ステップS89の判断結果がNOであると、上記2つ
の交点P11,P21の右端と左端間の距離L1,L2を、
それぞれ(C−B),(A−D)を算出して求める。続
いて、L1>0であるか否かを判断し(ステップS9
1)、該ステップS91の判断結果がYESであると、
続いてL1<w/2であるか否かを判断する(ステップ
S92)。ステップS91またはステップS92の判断
結果がNOの場合は、さらにL2>0であるか否かを判
断する(ステップS93)。ステップS93の判断結果
がYESであると、次にL2<w/2であるか否かを判
断する(ステップS94)。このように、ステップS8
6〜S94で、上記枠と文字線分との交点P11とP21
の距離K並びに上記2つの交点P11,P21の右端と左端
間の距離L1,L2と枠幅wとの距離関係を確認をす
る。
【0156】そして、上記ステップS93またはステッ
プS94の判断結果がNOの場合は、A<C<Bである
か否かを判断する(ステップS95)。そして、該ステ
ップS95の判断結果がNOの場合は、さらにA<D<
Bであるか否かを判断する(ステップS96)。該ステ
ップS96の判断結果がNOであると、前記ステップS
83に戻る。このようにステップS95及びステップS
96で、枠と文字との交点P11,P21の位置情報A,
B,C,Dに基づいて、枠外の相対する2つの文字線分
について連続性対応の条件を満足するか否かを確認す
る。
【0157】そして、上記ステップS85,S89,S
92,S94又はS96の判断結果がYESの場合は、
後述する枠内文字抽出部105内の枠内文字補間部10
51の処理へ移行する(ステップS97)。
【0158】図9に示す枠内文字抽出部105は、前記
交点対応付け部104によって対応付けられた交点とに
よって規定される枠内中の画像を文字成分であると判断
する。そして、文字成分と判断されたものは抽出され、
それ以外は枠の画像であるとみなして除去する。これに
より、例えば、図34(a) に示すパターンの場合、同図
(b) に示すように、枠内の画像から梨地で示す文字成分
161が暫定的に仮文字成分として抽出される。尚、図
34において、ハッチング部分は帳票等から光学的に読
み取られた黒画素の画像、黒丸は文字と枠との交点を示
す。
【0159】図35は、枠内文字抽出部105の処理の
一実施例をより詳細に説明する図であり、処理をソフト
ウェアで実現する場合のフローチャートを示す。枠内文
字抽出部105は、前記3交点対応付け部から上述のよ
うにして対応付けられた交点等に関する情報を入力し
(ステップS101)、該情報を基に、対応付けられた
交点P11(A,B)と交点P21(C,D)間を通る直線
L1,L2を算出する(ステップS102)。続いて、
交点P11を有する枠の一方の外周を形成する直線L3を
算出し(ステップS103)、さらに、交点P21を有す
る枠の他方の外周を形成する直線L4を算出する(ステ
ップS104)。そして、枠内の黒画素で上記4本の直
線L1,L2,L3,L4によって囲まれているものが
あるか否かを判断する(ステップS105)。該ステッ
プS105の判断結果がYES、すなわち該当する黒画
素が存在する場合は、該黒画素の集合を仮文字線分とし
て抽出し(ステップS106)、次に文字列抽出処理へ
移る(ステップS108)。他方、ステップS105の
判断結果がNOの場合は、枠を除去した後(ステップS
107)、上記ステップS108へ進む。
【0160】次に、上記枠内文字抽出部105内に設け
られた前記枠内文字補間部1051について説明する。
この枠内文字補間部1051は、主に前記2交点対応付
け部に対応して設けられ、交点が一対一に対応している
場合と、一対多に対応している場合とに分け、接触文字
パターン或いはその一部の交点間を滑らかに接続して、
枠を分離したことにより欠けた文字部分を仮文字線分と
して補間する。
【0161】図36は、上記枠内文字補間部1051の
一実施例を示すブロック図である。同図に示す単純補間
部1051aは、一対一に対応付けられた接触文字パタ
ーン或いはその一部の交点間を滑らかに接続して、仮文
字線分を生成する。一対一の補間の場合には、基本的に
は各交点間での文字線分の輪郭の方向ベクトルを算出し
て、方向ベクトルに従って各交点から直線を引き、その
直線と直線が交わる点で文字線分を結合する。又、方向
ベクトルを算出する手間を省くため、各対応付けた交点
間を接続し補間することもできる。
【0162】図37は一対一の単純補間の例を示す図で
あり、同図の右側には補間すべき文字線分171a、1
71b、枠172が示され、同図の左側には補間された
文字線分173が示されている。ここでは、各対応付け
た交点間を接続し補間する場合を示している。同図に示
すように、文字線分171aの枠172との接点の左端
の画素akと文字線分171bの枠172との接点の左
端の画素a′k及び文字線分171aの枠172との交
点の右端の画素bkと文字線分171bの枠172との
交点の右端の画素b′kを、それぞれ2つの直線La
b で接続し、枠172内の2つの直線La ,Lb 間で
囲まれる領域を黒画素174で埋めることにより、2つ
の文字線分171aと171bを補間して、1つの文字
線分173を得ることができる。本実施例では、この枠
172内の文字線分173は、暫定的に仮文字線分とみ
なされる。
【0163】図38は、単純補間部1051aの処理の
一実施例をより詳細に説明する図であり、処理をソフト
ウェアで実現する場合のフローチャートを示す。以下、
説明を分かり易いものとするために、上述した図37に
示す例を取り上げて説明する。同図において、f(c
c,p)は、補間により生成する黒画素を表し、(c
c,p)は該黒画素の座標位置を示す。尚、ccは前記
i座標の値であり、pは前記j座標の値である(図19
参照)。
【0164】同図において、まず図37に示す2つの画
素akとa′kを結ぶ直線La 及び2つの画素bkと
b′kを結ぶ直線Lb を求める(ステップS131)。
次に、図37において、各文字線分171a,171b
について、枠172から該枠172の線分に対して垂直
方向に一画素分、文字線分171a,171b側に離れ
た位置のi座標値を、それぞれc,c′として求め、c
≦cc≦c′という範囲内にある全てのi座標値ccに
対して、以下に述べるステップS132〜133の処理
を実行する。すなわち、まず、直線La ,Lb それぞれ
について、枠172内の直線i=ccとの交点のj座標
a ,pb を求める(ステップS132)。続いてj方
向の座標値を示す変数pをpa ≦p≦pb の範囲内で変
化させながら、上記条件式を満足する全ての座標値pに
ついて、(cc,p)という画素位置にあるf(cc,
p)画素を仮文字線分を構成する画素と設定する(ステ
ップS133)。このように、上記ステップS132及
びS133の処理は、c≦cc≦c′の範囲内でccの
値を変化させながら繰り返され、最終的にi座標値がc
≦cc≦c′かつj座標値がpa ≦p≦pb という条件
を満足する全ての画素f(cc,p)が仮文字線分を構
成する画素として抽出される。
【0165】一対多の交点の補間の場合には、先ず、対
応直線の交差点算出部1051bにおいて、各文字線分
について、その輪郭の方向ベクトルを算出し、該方向ベ
クトルに従って各文字線分の枠との接点から直線を引
き、それの直線が互いに交わる交差点を算出する。尚、
方向ベクトルを算出する手間を省くため、各対応付けた
交点間を結ぶ直線で方向ベクトルを代用することもでき
る。
【0166】上述のように上記交差点算出部1051b
において交差点を算出した後、その交差点が枠内にある
場合には、交差点枠内補間部1051cにより補間を行
う。図39は、交差点枠内補間の例を示す図であり、同
図(a) には補間前の3つの文字線分181a,181
b,181cと枠182が、また同図(b) には上記3つ
の文字線分181a,181b,181cを補間するこ
とにより得られた文字線分183が示されている。ここ
では、前記交点対応付け部104によって対応付けられ
た各交点間(Ak とA′k ,Bk とB′k ,Ck とA′
k 、及びDk とB′k 間)を結ぶ4本の直線L1
2 ,L3 、及びL4 で方向ベクトルを代用した例を示
している。上記対応付けられた交点間を直線で結び、同
図(b) に示すように、それらの直線の交差点が枠182
内にある場合には、上記各交点間を結ぶ直線L1
2 ,L3 、及びL4 で囲まれる領域を黒画素184で
埋めて、文字線分183を生成する。
【0167】図40は、上記対応直線の交差点算出部1
051bの処理の一実施例をより詳細に説明する図であ
り、処理をソフトウェアで実現する場合のフローチャー
トを示す。以下、説明を分かり易いものとするために、
上述した図39に示す例を取り上げて説明する。
【0168】同図において、まず、前記交点対応付け部
104から入力される交点対応付け情報を基に一対多の
交点の補間であるか否かを判定する(ステップS14
1)。そして、該ステップS141の判定結果がYES
の場合は、図39に示すような各対応付けられた交点間
を結ぶ直線L1 〜Ln (n=2,3,…)を算出する。
他方、上記ステップS141の判定結果がNOの場合
は、各交点での文字線分の輪郭の方向ベクトルLV1
LVn を算出する。上記ステップS142又はS143
の後、交差点が枠182内にあるか否かを判定する(ス
テップS144)。該ステップS144の判定結果がY
ESの場合、後述する交差点枠内補間部1051cの処
理へ進む(ステップS145)。他方、ステップS14
4の判定結果がNOの場合、交差点が枠外にあるか否か
を判定する(ステップS146)。そして、該ステップ
S146の判定結果がYESであれば、後述する交差点
枠外補間部1051dの処理へ進む(ステップS14
7)。一方、上記ステップS146の判定結果がNOで
あれば、後述する直線補間部1051eの処理へ進む
(ステップS148)。
【0169】図41は、交差点枠内補間部1051cの
処理の一実施例をより詳細に説明する図であり、処理を
ソフトウェアで実現する場合のフローチャートを示す。
尚、図41においては、前記図39に示す枠182内の
交差点CRP、すなわち2つの直線L2 とL3 の交点C
RPの座標を(ik,jk)、枠182の内輪郭のi座
標(直線L1 と枠182との交点のi座標)の値をi
n、枠182の外輪郭のi座標(直線L4 と枠182と
の交点のi座標)の値をig、文字線幅をw、及び枠1
82の外輪郭のi座標より文字線幅wだけ内側(負の方
向)のi座標の値を(ig−w)とする。さらに、変数
i,pはそれぞれi座標、j座標の値が設定される変数
であり、f(i,p)は、座標(i,p)に位置する画
素の濃度値を表す。
【0170】図41において、まず、後述するステップ
S162〜S165の処理を、i座標の値が設定される
変数qの値をin≦q<ikの範囲内で変化させながら
繰り返す。すなわち直線L1 ,L2 と直線i=qとの交
点のj座標の値Pa,Pbを求め(ステップS16
2)、j座標の値が設定される変数Pの値をPa≦P≦
Pbの範囲内で変化させながら、画素f(i,p)を仮
文字線分を構成する黒画素と決定する(ステップS16
3)。又、上記ステップS162及びS163と並行し
て次に述べるステップS164及びS165の処理を実
行する。
【0171】すなわち、直線L3 ,L4 と直線i=qと
の交点のj座標Pa,Pbを求め(ステップS16
4)、変数Pの値をPa≦P≦Pbの範囲内で変化させ
て、画素f(i,p)を仮文字線分を構成する黒画素に
設定する。そして、該ステップS162〜S165の処
理が全て終了すると今度は、変数qの値をik≦q<i
gの範囲内で変化させながら、後述するステップS16
6〜S167の処理を繰り返す。すなわち、直線L1
4 と直線i=qとの交点のj座標Pa,Pbを求め
(ステップS167)、変数pの値をPa≦p≦Pbの
範囲内で変化させながら画素f(q,p)を、仮文字線
分を構成する黒画素に設定する。
【0172】以上の処理により、図39に示すように、
枠182内の仮文字線分183が補間処理により生成さ
れる。図42は、交差点枠外補間部1051dの処理の
一実施例をより詳細に説明する図であり、処理をソフト
ウェアで実現する場合のフローチャートを示す。同図
中、上述した図41中のステップと同一の処理を行うス
テップに対しては同一のステップ番号を付し、その説明
は省略する。
【0173】図42のフローチャートはステップS16
2〜S165の処理を、変数qの値をin≦q<ig−
wの範囲内で変化させながら繰り返し、また、ステップ
S166〜S167の処理を変数qの値をig−w≦q
<igの範囲内で変化させながら繰り返す点を除けば、
処理は図41のフローチャートの処理とほぼ同様であ
る。
【0174】図43は、直線補間部1051eの処理の
一実施例をより詳細に説明する図であり、処理をソフト
ウェアで実現する場合のフローチャートを示す。同図
中、図41と同一の処理を行うステップには同一のステ
ップ番号を付し、その説明は省略する。
【0175】図43において、変数iの値を、ある特定
の値に固定して、ステップS162〜S163及びステ
ップS164〜165の処理を、変数pの値をpa ≦p
≦p b の範囲内で変化させながら繰り返し、また、ステ
ップS166〜S167の処理を、変数qの値をis≦
q<is+wの範囲内で変化させながら実行する点を除
けば、処理は図41の場合とほぼ同様である。
【0176】尚、対応付けが不可能な交点に対しては、
図44に示すソフトウェア処理を行えば良い。同図中、
図41に示されたステップと同一ステップには同一符号
を付し、その説明は省略する。
【0177】図44において、ステップS161がな
く、ステップS166Cが変数qをis≦q<igの範
囲に設定する点を除けば、処理は図41の場合とほぼ同
様である。
【0178】本実施例では、上述した処理により、枠に
接触して書かれた文字について該枠内の文字線分を暫定
的に“仮文字線分”として抽出する。続いて、このよう
な仮文字線分が抽出された文字を含む文字列から、平均
文字サイズ算出部106によって平均文字サイズを求め
る。この文字列としては、例えば帳票の横または縦一行
に書かれた文字列を採用する。また、フリーフォーマッ
ト枠内に書かれた文字列を採用してもよい。
【0179】図45は、該平均文字サイズ算出部106
の一実施例を説明する図であり、処理をソフトウェアで
実現する場合のフローチャートである。平均文字サイズ
算出部106は、まず、前記枠内文字抽出部105によ
って抽出された各文字のサイズを求める。該文字には、
枠に接触していない文字以外に枠に接触しており、前記
仮文字線分を含む文字も含まれる。また、この文字サイ
ズ算出に際しては、例えば、連結パターン抽出部101
によって得られた各文字の連結情報を用いる。すなわ
ち、例えば、上記各文字の連結情報から得られる連結画
像を矩形近似して得られる該矩形の角の座標を用いて、
上記文字サイズを算出する(ステップS171)。
【0180】次に、前記枠内文字抽出部105によって
抽出された文字のラベル位置情報に基づいて文字列を抽
出する(ステップS172)。次に、上記抽出された各
文字列毎に、一文字の平均文字サイズTHを算出する
(ステップS173)。尚、帳票によっては、文字枠が
縦枠と横枠と混在している場合があるので、上記ステッ
プS173の前処理として該文字枠が縦枠または横枠の
いずれであるかを判定する処理を付け加えてもよい。ま
た、上記平均文字サイズTHは、例えば文字に外接する
矩形の水平方向及び垂直方向の2つのサイズ情報から成
る。
【0181】また、上記一文字の平均文字サイズTHの
算出は、例えば、以下のような方法により行う。まず、
対象となる文字列の文字数をn、該文字列中の各文字の
水平・垂直方向のサイズをそれぞれj〔m〕,i〔n)
とする。また、上記平均文字サイズTHの水平・垂直方
向のサイズを、それぞれavecj,aveciとする。
【0182】
【数5】
【0183】文字サイズ評価部107は、各文字列につ
いて、個々の抽出文字のサイズを該平均文字サイズ算出
部106によって求められた当該文字列の平均文字サイ
ズTHと比較する。そして、適当な文字サイズでないと
判断した文字パターンについて冗長な仮文字線分を含ん
でいるか否か判断し、該冗長な仮文字線については、こ
れを当該文字パターンから分離する。
【0184】図46は、文字サイズ評価部107の一実
施例を説明する図であり、処理をソフトウェアで実現す
る場合のフローチャートである。文字サイズ評価部10
7は、まず、前記平均文字サイズ算出部106よって求
められた平均文字サイズTHを基準として、最大文字サ
イズTHmax と最小文字サイズTHmin を算出する(ス
テップS181)。該最大文字サイズTHmax と該最小
文字サイズTHmin は共に抽出された文字パターンから
正しく文字を切り出すための閾値として用いられる。
【0185】上記最大文字サイズTHmax の算出は、例
えば、以下のようにして行う。 THmaxj=avej+5 もしくは THmaxi=avei+5 (尚、“5”は1画素の5倍の大きさを示す) または、 THmaxj=avecj×1.1 もしくは THmaxi=avei×1.
1 一方、上記最小文字サイズTHmin の算出は、例えば、
以下のようにして行う。
【0186】 THminj=avej−5 もしくは THmini=avei−5 (尚、“5”は1画素の5倍の大きさを示す) または、 THminj=avej×0.9 もしくは THmini=avei×0.9 このようにして求められた最大文字サイズ及び最小文字
サイズの一例を図47に示す。同図において、二重枠で
示された矩形191が平均文字サイズTHを表す。ま
た、1本の実線で示された矩形192が平均文字サイズ
THmax を、破線で示された矩形193が最小文字サイ
ズTHmin を表す。
【0187】次に、文字列中の全ての文字について、以
下に述べるステップS183〜S187の処理を行う。
すなわち、まず、文字列から先頭の文字(文字パター
ン)を取り出し(ステップS182)、この文字パター
ンが最大文字サイズTHmax より大きいか否か判断する
(ステップS183)。そして、該文字パターンが該最
大文字サイズTHmax より大きければ(ステップS18
3,yes)、該文字パターンに局所的対応付け箇所が
あるか否か評価する(ステップS184)。該局所的対
応付け箇所とは、前記枠内文字抽出部105によって枠
から抽出された仮文字線分の画像(局所的対応付け画
像)によりある枠を挟んで2つのパターンが連結された
部分のことである。
【0188】また、上記局所的対応付け箇所があるか否
かの判断は、前記交点対応付け部104によって得られ
る各交点(文字と枠との交点)についての他の交点との
対応付け情報を用いて行う。すなわち、上記文字パター
ンの枠との交点について、ある交点が他の交点と対応付
けられているならば、局所的対応付け箇所があると判断
する。
【0189】上記文字パターンにこのような局所的対応
付け箇所が無いと判断すると(ステップS184,n
o)、上記文字パターンを一文字であると判定し、ステ
ップS188へ進む。
【0190】このような文字パターンの判定例を図48
(a) に示す。尚、図48において斜線で示したパターン
がイメージ・スキャナ等によって読み取られた文字画像
221であり、ドットで示したパターンが前記枠内文字
抽出部105によって交点情報を用いて対応付けられた
局所的対応付け画像223である。この局所的対応付け
画像223は、前記仮文字線分に該当する。同図(a) に
示すように文字画像221が最大文字サイズTHmax よ
り大きく、かつ局所的対応付け画像223が無ければ、
該文字画像221を一文字とみなす。すなわち、この場
合には、平均よりも大きなサイズで“8”の文字が記入
されたものとみなされ、図49(a) に示すように、
“8”の一文字が切り出される。
【0191】一方、前記ステップS184で上記文字パ
ターンにこのような局所的対応付け箇所が有ると判断す
ると(ステップS184,yes)、上記文字パターン
から上記局所的対応付け画像(仮文字線分の画像)22
3を削除した場合に得られる各々のパターンの文字サイ
ズを算出する(ステップS185)。そして、該削除に
よって分離された各々のパターンのサイズが共に最小文
字サイズTHmin より大きいか否か判断し(ステップS
186)、いずれかのパターンのサイズが最小文字サイ
ズTHmin 以下であるならば、上記文字パターンから前
記局所的対応付け画像、すなわち冗長な仮文字線分を削
除して、上記文字パターンを複数のパターンに分離する
(ステップS187)。
【0192】該冗長な仮文字線分の解除は、具体的には
次のようにして行う。すなわち、該冗長な仮文字線分の
存在を決定していた交点対応付け部104により得られ
た該冗長仮文字線分を構成する交点間の対応関係を解除
する。
【0193】これにより、例えば、図48(b) に示すよ
うに、枠を介して接触して手書きされた“5”と“3”
の2つの文字が、前記局所的対応付けが解除されること
によって図49(b) に示すように正しく切り出される。
【0194】また、前記ステップS186で局所的対応
付け画像(仮文字線分の画像)223を分離することに
よって得られた複数の文字画像221の中に前記最小文
字サイズTHmin よりも小さいものがあれば(ステップ
S186,no)、上記局所的対応付け画像223を文
字パターンの一部とみなすことによって、該文字パター
ンを一文字とみなす。
【0195】このような例を、図48(c) に示す。同図
(c) において、局所的対応付け画像223を削除(解
除)して得られる文字画像221(破線の矩形枠で囲ま
れた部分)は最小文字サイズTHmin 以下である。した
がって、この場合、上記局所的対応付け画像223は真
の文字線分であるとみなす。これにより、最大文字サイ
ズTHmax よりも大きなサイズで枠の一部を飛び出して
手書きされた“d”の一文字が、図49(c) に示すよう
に正しく切り出される。
【0196】また、さらに、前記ステップS183で文
字パターン(局所的対応付け画像123が有る文字パタ
ーンも含む)が、最大文字サイズTHmax 以下であれ
ば、該文字パターンを一文字とみなす。
【0197】以上の上記ステップS183〜S187の
処理を、前記文字列中の全ての文字パターンに対して行
い、該全ての文字パターンに対して上記処理が終了した
と判断すると(ステップS188,no)、図46のフ
ローチャートに示す処理を終了する。
【0198】以上の処理によって、例えば、図50
(a)に示すように「2」と「1」の文字がオ−バ−ハ
ング状態に手書きされることによって、枠内文字抽出部
105が上記二つの文字を同図(c)に示すように誤っ
て一文字として抽出してしまう事態を防止できる。即
ち、この場合、まず、同図(a)に示す局所的対応付け
画像223によって対応付けられた文字パタ−ンは、最
大文字サイズTHmax よりも大きくかつ局所的対応付け
画像223が有ると判断される。次に、局所的対応付け
画像223を削除した場合、文字パタ−ン225が最小
文字サイズTHmin よりも小さいと判定され、この文字
パタ−ン225は交点と及び交点とによって対
応付けられる局所的対応付け画像223により上記
「2」の一部を構成する二つの文字パタ−ン226と2
27と結合される。これにより、「2」の文字が正しく
切り出される。一方、局所的対応付け画像223が解除
された結果得られる「A」の文字パタ−ン228は、最
小文字サイズTHmin よりも大きいので、一文字と判定
される。したがって、交点と及び交点とを接続
する局所的対応付け画像223は冗長な仮文字線分とし
て除去される。この結果、同図(b)に示すように、
「2」と「A」の二文字が正しく切りだされる。
【0199】図51は、前記文字構造解析評価部108
の一実施例を説明する図であり、処理をソフトウェアで
実現する場合のフローチャートである。文字構造解析評
価部108は、予め外部記憶装置等に記憶されている文
字構造定義テーブルをメモリ上にロードする(ステップ
S201)。
【0200】該文字構造定義テーブルは、例えば、「数
字」、「アルファベット」、「仮名」、「漢字」など
の、文字の種類に応じて作成されている。該文字構造定
義テーブルの一例を図52に示す。
【0201】この例においては、仮画像の構造の型式を
表す型名として、「N型」,「逆N型」、及び「8の字
型」が登録されている。そして、これら各型名を有する
複数の仮文字線分から構成される仮画像の構造と、それ
に対応する真の文字線分から構成される真の画像の構造
に関する情報が登録されている。上記N型及び逆N型の
仮画像に対応する真の画像の構造は、図52に示すよう
に1種類のみである。したがって、N型または逆N型の
仮画像に対してはこのテーブルを参照することによっ
て、該仮画像から真の文字線分のみを抽出して、真の画
像を得ることができる。これに対し、上記「8の字型」
の仮画像については、図52に示すように真の画像の構
造は、2種類存在する。そして、実際の「8の字型」の
仮画像が、いずれの真の画像の方に対応するかは、前記
交点対応付け部104によって得られた仮文字線分の方
向性に関する情報によって決定される。
【0202】ここで、図53を参照しながら、上記「8
の字型」の仮画像が有する2種類の方向性について説明
する。同図において、ドットパターンはイメージスキャ
ナ等によって読み取られた枠内抽出画像を示す。該「8
の字型」の仮画像は、AB,AC,BD、及びCDの4
個の仮文字線分によって構成される。この場合、仮文字
線分ABは交点A,Bによって対応付けられる線分であ
る。また、仮文字線分AC,BD、およびCDは、それ
ぞれ交点A,C、交点B,D、及び交点C,Dによって
対応付けられる線分である。この場合、交点対応付け部
104によって得られる方向性情報によって交点AとC
及び交点BとDの両方が対応付けられていれば、上記
「8の字型」の仮画像は、対角線方向に方向性対応付け
があると定義される。一方、上記のような対応付けがな
されていなければ、すなわち、例えば、交点AとB及び
交点AとCが方向性条件を満足することによって対応付
けられていれば、上記「8の字型」の仮画像は、垂直・
平行方向に方向性対応付けがあると定義される。
【0203】上記ステップS201に続いて、交点対応
付け部104によって対応関係にあると判断された仮文
字線分と枠との交点とそのときの対応条件情報(方向性
に関する情報も含む)等を基に仮画像の構造を解析する
(ステップS202)。この仮画像の構造解析処理の詳
細は、後述する。
【0204】そして、この解析情報を、上記ステップS
201で設定したテーブルに登録されている該仮画像の
構造情報と比較・照合することにより、該仮画像の構造
の型名を評価する(ステップS203)。
【0205】そして、該評価により得られた該仮画像の
構造がその真の画像が一意的に決定されるものであるか
否か判別する(ステップS204)。すなわち、例え
ば、該仮画像の構造が図52に示す「N型」または「逆
N型」と評価された場合には、その真の画像構造は一意
である(ステップS204,no)。これに対し、図5
3に示す「8の字型」と評価された仮画像の場合には、
上述したようにその真の画像構造は、2種類想定される
ため、該真の画像構造は一意に決定されない(ステップ
S204,yes)。
【0206】上記ステップS204で前記テーブルから
当該仮画像に対応する真の画像が一意的に求まると(ス
テップS204,no)、上記仮画像から該真の画像に
とっては不要となる仮文字線分を除去(解除)して、該
真の画像を得る(ステップS206)。
【0207】これにより、例えば、図52に示す「N
型」または「逆N型」と評価された仮画像については、
対角線をなす仮文字線分が解除され、最終的に図52に
示す真の画像が得られる。
【0208】図54及び図55は、それぞれ枠内文字抽
出部105によって抽出された枠内抽出画像すなわち仮
画像がN型、逆N型である場合に、上記ステップS20
1〜S204、及びS206の処理により該仮画像から
真の画像を抽出することにより、正しい文字が切り出さ
れる具体例を示す図である。
【0209】図54は、枠231に接触して書かれた
“3”が正しく切り出される例、図55は、枠231に
接触して書かれた“9”が正しく切り出される例を示す
図である。尚、両図においてハッチング・パターン23
2は真の文字線分の画像、ドット・パターン233は仮
文字線分、黒丸A,B,C,D及びA′,B′,C′,
D′は真の文字線分232と枠231との交点である。
【0210】図54に示す例の場合、仮画像233Nは
前記ステップS202〜S203の処理によりN型の仮
画像である判断される。すなわち、交点対応付け部10
4によって得られた上記交点AとB、交点AとC、及び
交点CとDとが対応付けられるという情報により、該判
断がなされる。そして、前記ステップS201で設定さ
れたテーブルを参照することによって図54(a) に示す
仮画像233Nから対角線をなす仮文字線ACのみを除
去し、同図(b) に示す“3”の文字画像を正しく切り出
す。
【0211】一方、図55に示す例の場合、仮画像23
3RNは前記ステップS202〜S203の処理により
逆N型の仮画像であると判断される。すなわち、交点対
応付け部104によって得られた交点A′とB′、交点
B′とC′、及び交点C′とD′とが対応付けられると
いう情報により、該判断がなされる。そして、前記ステ
ップS201で設定されたテーブルを参照することによ
って、図55(a) に示す仮画像233RNから対角線を
なす仮文字線分B′C′のみを除去し、同図(b) に示す
“9”の文字画像を正しく切り出す。
【0212】一方、上記ステップS204で前記テーブ
ルに当該仮画像に対応する真の画像が複数登録されてお
り、対応する真の画像が一意的に定まらない場合には
(ステップS204,yes)、前記仮画像における対
応付けられた仮文字線分と枠との交点の間の対応付け条
件を求める。この対応付け条件は、例えば、交点対応付
け部104によって得られる。そして、該対応付け条件
を前記テーブルに登録されている真の画像を一意に決定
するための条件と比較・照合して真の文字線分を一意に
決定し(ステップS205)、該決定に従って前記仮画
像から冗長な文字線分を解除(除去)して上記テーブル
に登録されている真の画像情報を求める(ステップS2
06)。
【0213】これにより、例えば、当該仮画像の構造が
図56に示すような「8の字型」であった場合には、前
記ステップS205で上記仮文字線分の方向性が垂直方
向または対角線方向のいずれにあるのか求められ、図5
2に示すテーブルに登録されている真の画像情報を一意
に決定する条件に従って、真の画像情報の構造が一意に
決定される。
【0214】ここで、図56及び図57を参照しなが
ら、本実施例により枠に接触して手書きされた文字から
真の文字線分のみが抽出される例を説明する。上記両図
において、ハッチングされた線分241が真の文字線分
を示す。また、図56において、ドットパターンにより
構成される線分243a,243bが仮画像を示す。
【0215】図56(a) は、“8”を手書きした際、該
“8”の交差箇所と枠が接触した場合の例であり、前記
枠内文字抽出部105により該枠から冗長な線分を含む
「8の字型」の仮画像243aが抽出される。一方、図
56(b) は、同様に“8”を手書きした際、該“8”の
下方部中央が枠と接触した場合の例であり、前記枠内文
字抽出部105により該枠から冗長な線分を含む「8の
字型」の仮画像243bが抽出される。
【0216】図56(a) の場合、前記図45のフローチ
ャートのステップS205で交点対応付け部104によ
り得られた交点間を対応付ける方向性情報を基に、前記
仮画像243aは対角線方向に方向性があると判断さ
れ、次のステップS205で図57(a) に示すような真
の文字線分241のみから成る“8”の文字画像が切り
出される。一方、図56(b) の場合、上記ステップS2
05で交点対応付け部104により得られた交点間を対
応付ける方向性情報を基に、前記仮画像243bは垂直
方向に方向性があると判断され、次のステップS205
で図57(b) に示すような真の文字線分241のみから
成る“8”の文字画像が切り出される。
【0217】次に、上述した図45のフローチャートの
ステップ202の処理を詳細に説明する。図58は、あ
る文字が枠246に接触して書かれた場合における該接
触部分の拡大図である。この場合、4個の文字線分24
7が枠246と交わっている。それぞれの文字線分24
7と枠246との交点を〜とする。この場合、図5
9に示すフローチャートに示すアルゴリズムによって、
上記4個の各交点〜の他交点との対応関係情報か
ら、仮画像の構造型式を判断する。
【0218】すなわち、まず、交点対応付け部104に
よって得られた上記各交点〜についての他の交点と
の対応関係情報を基に、上記各交点〜について対応
付けられている他の交点数を数える(ステップS30
1)。
【0219】次に、交点,,、及びと対応関係
にある交点数が、それぞれ“1”,“2”,“2”、及
び“1”となっているか否か判別する(ステップS30
2)。そして、このような条件が満足されていれば(ス
テップS302,YES)、仮画像は“逆N型”である
と判断する(ステップS303)。
【0220】一方、上記ステップS302の条件が満足
されていなければ(ステップS302,NO)、続い
て、交点,,、及びと対応関係にある交点数
が、それぞれ、“2”,“1”,“1”、及び“2”と
なっているか判別する(ステップS304)。そして、
このような条件が満足されていれば(ステップS30
4,YES)、仮画像が“N型”であると判断する(ス
テップS305)。
【0221】また、さらに、上記ステップS304の条
件が満足されていなければ(ステップS304,N
O)、さらに続いて、交点,,、及びと対応関
係にある交点数が、それぞれ、“2”,“2”,
“2”、及び“2”となっいるか判断する(ステップS
306)。そして、この条件が満足されていれば(ステ
ップS306,YES)、仮画像が“8の字型”である
と判断する(ステップS307)。
【0222】このように、文字と枠との交点数が4個で
ある場合には、図58に示す位置付けにある各交点〜
について、それと対応関係にある他の交点の数を調べ
ることによって、仮画像の型が予め定義したN型、逆N
型、または8の字型のいずれかであるかを識別できる。
【0223】次に、前述した図45のフローチャートの
ステップS205の処理の詳細を、図60と図61を参
照しながら説明する。図60は交点対応付け部104に
よって対応付けられる図58に示す4個の交点〜間
の対応関係を示す図である。
【0224】同図において、交点と、交点と、
交点と、及び交点とがそれぞれ対応付けられて
いる。この場合の対応条件としては、方向性または距離
がある。
【0225】図61は、図60に示す上記のような交点
対応付けがなされた8の字型の仮画像から真の文字線分
を抽出する処理を説明するフローチャートである。ま
ず、交点対応付け部104によって交点と及び交点
とが方向性の条件によって対応付けられているか否
か判別する(ステップS401)。そして、上記2つの
交点間が共に方向性の条件によって対応付けられていれ
ば(ステップS401,YES)、交点と、及び交
点との間の対応関係を解除する(ステップS40
2)。これにより交点と、及び交点と間を接続
する仮文字線分が削除される。
【0226】一方、上記ステップS401で上記2つの
交点間の対応条件が方向性の条件でなければ(ステップ
S401,NO)、交点と、及び交点とが垂直
方向での方向性によって対応付けられていると判断し
て、交点と、交点と間の対応関係を解除する
(ステップS403)。これにより、交点と間及び
交点と間を接続する仮文字線分が削除される。
【0227】次に、上述した本実施例をオーバーハング
した手書き文字に適用した場合の具体例を説明する。ま
ず、図62は、同図(a) に示すように枠250を介して
オーバーハングの状態に手書きされた「5」と「1」の
各文字が本実施例によって正しく切り出される例を示す
図である。同図(a) に示すように、オーバーハング状態
にある手書きされた「5」と「1」の文字は、枠250
との間に4個の交点を形成し、枠内文字抽出部105に
よって逆N字型の仮画像が抽出される。従って、この場
合、交点と及び交点と間の仮文字線分が真の文
字線分として抽出され、交点と間の仮文字線分は偽
の文字線分として解除される。この結果、同図(b) に示
すように「5」と「1」の文字が正しく切り出される。
【0228】一方、従来の場合には、全ての仮文字線分
がそのまま真の文字線分として抽出されるため、同図
(b) に示すように、誤って「3」と「9」の文字が切り
出される。
【0229】次に、図63はオーバーハングによりN型
の仮画像が形成される2つの手書き文字の切り出しに本
実施例を適用した場合の一例を示す図である。同図(a)
においては、「4」と「j」の2文字がオーバーハング
状態で手書きされており、枠内文字抽出部105はそれ
らの文字と枠250との4交点〜の対応関係情報か
らN型の仮画像を抽出する。したがって、この場合、交
点と間の仮文字線分が解除され、真の文字線分とし
て交点と間及び交点と間の文字線分が真の文字
線分として抽出される。この結果、同図(b) に示すよう
に、「4」と「j」の2文字が正しく切り出される。一
方、従来であれば、同図(c) に示すように全ての仮文字
線分がそのまま真の文字線分として抽出され、「4」と
「j」の2文字が1文字として切り出されてしまう。ま
たは、同図(d) に示すように枠250に接触して書かれ
た文字線分が削除されて「4」と「j」を正しく切り出
すことができなかった。
【0230】次に、図64は、オーバーハングにより8
の字型の仮画像が形成される2つの手書き文字の切り出
した本実施例を適用した場合の一例を示す図である。同
図(a) においては、「5」と「T」の2文字がオーバー
ハング状態で手書きされており、枠内文字抽出部105
はそれらの文字と枠250との4交点〜の対応関係
情報から8の字型の仮画像を抽出する。したがって、こ
の場合、交点と及び交点とが、例えば水平方向
の方向性によって対応付けられていれば、同図(b) に示
すように「5」と「T」の2文字が正しく切り出され
る。従来であれば、同図(c) に示すように偽の文字線分
(交点とを接続する文字線分及び交点とを接続
する文字線分)もそのまま真の文字線分として抽出され
てしまうので、「5」と「T」が連結されて1文字とし
て抽出されてしまう。または、文字枠150が単に削除
されてしまう結果、同図(d) に示すように、「5」と
「T」の2文字を正しく切り出せなかった。
【0231】上述した実施例は、本発明を文字と枠との
交点が枠の両端でいずれも2つづつある接触文字の切り
出しに適用した例であるが、本発明は、これ以外にも、
図65(a) ,(b) に示すように文字と枠との交点が枠の
両端でそれぞれ2個、3個有る接触文字にも適用可能で
ある。この場合には、文字構造解析評価部108は、予
め図66に示す形式のテーブルを用意する。図66に示
すテーブルは、図65(a) に示す仮画像から真の文字線
分を抽出するためのものである。図66には「1型」〜
「6型」までの6種類の仮画像の構造が登録されてい
る。これらのうち、「2型」、「3型」、「5型」、及
び「6型」については、本テーブルを検索することによ
り一意的に真の文字線分から成る構造を決定することが
できる。一方、「1型」と「4型」については、交点
との枠水平方向サイズどちらが太いかによって、真の
文字線分の構造は2種類に分かれる。「1型」及び「4
型」とも、図67(a) に示すように、交点の方が太い
ときには図66中において左側に示された真の文字線分
の構造を選択し、一方、図67(b) に示すように、交点
の方が太いときには図66中において右側に示された
真の文字線分の構造を選択する。尚、図65(b) に示す
仮画像の場合についても、同様にしてテーブルを作成す
ることができる。この場合には、仮画像の構造及びそれ
に対応する真の文字線分の構造として鏡面対称のものを
登録する。
【0232】また、次に示す実施例は、図68に示すよ
うに、枠に接触して手書きされた文字が、該枠の両端で
共に3個の交点(〜と〜)を形成する場合に、
本発明を適用したものである。この場合、文字構造解析
評価部108には、図69乃至図71に示す内容のテー
ブルが予め登録される。
【0233】上記テーブルに登録される仮画像の形式は
全部で38種類(1型〜38型)あり、その真の文字線
分の構造が一意的に定まるものもあれば、2または3個
の真の文字線分の構造の中から1個を選択するものもあ
る。図69乃至図71中に示された3種類の文字線分の
構造を、左側から順に(a) ,(b) ,(c) と名付ける。
【0234】そして、下記の(1) 〜(3) の条件を基に、
上記テーブルから真の文字線分の構造を選択する。 (1) 交点と、交点とが方向性の対応条件で対応
関係にある場合は、(b) 、交点と、交点とが方
向性の対応条件で対応関係にある場合は、(c)、それ以
外では、(a) の構造 (2) 交点と、交点とが方向性の対応条件で対応
関係にある場合は、(b) 、それ以外では、(a) の構造 (3) 交点と、交点とが方向性の対応条件で対応
関係にある場合は、(c) 、それ以外では、(a) の構造 尚、上記実施例では、テーブルを利用して、仮画像から
真の文字線分を抽出するようにしているが、本発明は、
これに限定されることなく、アルゴリズムのみより、上
記抽出処理を行うようにすることも可能であり、実装の
方法には、各種形態が適用できる。また、上記実施例で
は、主に、帳票等の文字枠から手書き文字を抽出する例
を取り扱っているが、本発明は、これに、限定されるも
のではなく、図面認識装置などの画像認識装置におい
て、直線と、文字、図形または記号などの各種パターン
とが接触した画像から,目的とするパターンを切り出す
(抽出する)技術にも適用可能なものである。
【0235】次に、説明する実施例は、枠や罫線などの
直線に接触したり、はみ出している枠接触文字を、部分
的に補完できない場合であっても、文字の認識率を向上
できる発明に係わるものである。
【0236】図72は、このような実施例の一つである
信頼度テーブル作成装置(文字再認識用テーブル作成装
置)270のシステム構成を示すブロック図である。枠
抽出部271は、各文字カテゴリについて、複数のサン
プルの学習データを入力する。この学習データは、枠と
該枠に接触している文字(枠接触文字)とから構成され
る2値の画像データであり、該文字は予め知られている
ものである。また、各サンプルは、互いに枠と文字との
接触状態が異なるものである。枠抽出部271は、これ
らの学習データから枠の画像データのみを抽出し、それ
以外の文字を構成する画像データを補完部272に出力
する。
【0237】補完部272は、上記枠抽出部271によ
って除去された文字の画像データ(除去領域)を、例え
ば、前記補完部12と同様な手法により補完する。再補
完部273は、該補完部272によって補完しきれなか
った除去領域を、例えば、前記再補完部13と同様な手
法により補完する。
【0238】補完部272によって生成された補完パタ
ーンと再補完部273によって生成された再補完パター
ンは、文字認識部274に入力される。該文字認識部2
74は、各文字カテゴリの複数サンプルの学習データに
ついて、上記補完パターンと再補完パターンを入力する
と、これらのパターンについて文字認識を実行する。そ
して、各学習データ毎の認識結果を信頼度テーブル作成
部275に出力する。
【0239】該信頼度テーブル作成部275は、上記文
字認識部274から出力される上記認識結果を予め与え
られている正解データと比較して、全サンプルデータに
対する認識率を得る。そして、この認識率を信頼度とし
て、また、誤読文字(誤って認識した文字)と正解の文
字の組み合わせを誤読文字対として信頼度テーブル27
6に登録する。尚、上記誤読文字対は、例えば、文字コ
ードにより登録される。また、信頼度テーブル作成部2
75は、上記学習データから枠と文字の接触状態の特徴
を示すパラメータを抽出して、これも上記信頼度テーブ
ル276に登録する。
【0240】このようにして、上記信頼度テーブル27
6には各文字カテゴリについて、枠と文字の様々な接触
状態における該文字に対する上記文字認識部274の認
識率が、上記誤読文字対とともに登録される。
【0241】次に、図73は、上記信頼度テーブル作成
装置270によって作成された信頼度テーブル276を
用いて枠接触文字の文字認識部を行う文字認識装置28
0のシステム構成を示すブロック図である。
【0242】同図において、枠抽出部281は、枠と該
枠に接触している文字(枠接触文字)とから構成される
未知の2値画像データを入力し、この画像データから枠
の画像データを抽出する。そして、該枠の画像データが
抽出された文字パターンの画像データを補完部282に
出力する。
【0243】補完部282は、入力される文字パターン
の画像データについて、上記枠の画像データの抽出によ
って除去された画像データを復元する補完処理を行い、
この補完処理によって得られた画像データ(補完パター
ン)を再補完部283に出力する。
【0244】該再補完部283は、ラベリングによる連
結性等を用いて、上記補完部282が補完しきれなかっ
た部分を補完し、再補完パターンを生成する。文字認識
部284は、上記補完部282によって生成された補完
パターンと再補完部283によって生成された再補完パ
ターンのそれぞれに対して文字認識を実行する。そし
て、その認識結果を、文字コードにより再認識部285
に出力する。
【0245】該再認識部285は、上記文字コード以外
に前記未知の2値画像データを入力する。そして、この
画像データから枠と文字の接触状態の特徴を示すパラメ
ータを抽出し、この特徴パラメータと上記文字コードを
キー項目として、前記信頼度テーブル自動作成装置27
0によって作成された信頼度テーブル276を参照し
て、上記文字認識部284によって認識された文字コー
ドの信頼度を調べる。そして、該信頼度が高い場合に
は、その文字コードを最終認識結果として出力する。一
方、上記信頼度が低い場合には、上記補完パターン、上
記再補完パターンまたは上記2値の未知画像データを用
いて、上記文字認識部284とは別の手法で該未知画像
データに含まれる枠接触文字の再認識を実行する。そし
て、該再認識により得られた文字コードを出力する。
【0246】図74は、本発明の別の実施例である信頼
度テーブル作成装置(再文字認識用テーブル作成装置)
300のシステム構成を示すブロック図である。変動種
類決定部301は、学習データである2値画像の文字パ
ターンを入力する。この学習データは、枠に接触してい
ない文字パターンとその文字コードからなる。該変動種
類決定部301は、この入力される学習データの文字パ
ターンに対して施すべき変動の種類を決定し、この決定
した変動の種類情報を、変動量決定部302及び信頼度
テーブル作成部306に出力する。この変動の種類は、
例えば、図76に示すように「文字枠に対する文字の変
動」と「文字枠の変動」の2種類に大別される。該「文
字枠に対する文字の変動」には、例えば、「位置ず
れ」、「サイズ変動」及び「傾き変動」などがある。ま
た、「文字枠の変動」には、「傾き変動」、「枠幅変
動」、「サイズ変動」及び「枠の凹凸」などがある。
【0247】変動量決定部302は、上記変動種類決定
部301によって決定された変動の種類の操作量(変動
量)を決定し、この変動量情報を枠接触文字生成部30
3と信頼度テーブル作成部306に出力する。本実施例
では、この変動量を表すパラメータとして以下のパラメ
ータを用いる。尚、垂直方向にx軸を,水平方向にy軸
を設定するものとする。 1.文字枠に対する文字の変動 位置ずれ:dx,dy。dx(図75で黒丸で示した位
置)、dy(図75で×で示した位置)は、それぞれ、
文字の重心と文字枠の重心の位置の差のx方向、y方向
の大きさを表す。
【0248】サイズ変動:dsx,dsy。dsx,d
syは、それぞれ、文字のx方向、y方向の大きさを表
す。 傾き変動:dα。垂線に対する文字の傾き角度を表す。 2.文字枠の変動 傾き変動:fα。垂線に対する文字枠の傾き角度を表
す。
【0249】枠幅変動:w。文字枠の幅を表す。 サイズ変動:fsx,fsy。fsx,fsyは、それ
ぞれ、文字のx方向、y方向の大きさを表す。
【0250】枠の凹凸:fδ。fδは、例えば、ファク
シミリなどに印刷された文字枠の品質劣化等を考慮した
文字枠の凹凸を制御するパラメータである。例えば、文
字枠の周囲長をLとすると、fδは、このサイズLの配
列fδ〔L]として表現され、この配列の各要素fδ
〔i](i=1,2,3,…)は、乱数発生により決定
される−β〜+βの範囲内の整数値をとる。
【0251】枠接触文字生成部303は、学習データに
対して、上記変動量決定部302によって決定された上
記変動種類決定部301によって決定された変動種類の
変動量を基に、上記学習データに対して操作F(dx,
dy,dsx,dsy,dα,w,fsx,fsy,f
α、fδ)を施し、上記学習データの枠接触文字を生成
する。図75は、該枠接触文字生成部303が生成する
数字「7」の枠接触文字の例を示す図である。
【0252】枠接触文字生成部303は、同図(a)に
示すように「7」の学習データ320に対して変換操作
F(dx,dy,dsx,dsy,dα,w,fsx,
fsy,fα、fδ)を施すことにより、同図(a)に
示すように,枠330に接触する「7]の枠接触文字を
生成する。すなわち、学習データ及びに文字枠に対して
変換操作F(dx,dy,dsx,dsy,dα,w,
fsx,fsy,fα、fδ)を施し、該変換後の学習
データと枠を重ね合わせることにより、枠接触文字を生
成する。この場合、例えば、枠の方の重心の位置を固定
しながら該変換操作F(dx,dy,dsx,dsy,
dα,w,fsx,fsy,fα、fδ)を実行する。
【0253】さらに、図76は、上記枠接触文字生成部
303が、fsx及びfsyを固定して(枠の大きさを
固定して)、「3」の文字の学習データ(文字パター
ン)に対して生成する各種枠接触文字の例を示す図であ
る。
【0254】同図(a)は、変動の種類が”位置ずれ”
の場合の例であり、変動量がdx=0,dy>0の場合
である。この場合、「3」の文字が枠の下にはみ出すこ
とになる(下位置変動)。また、同図(b)は、変動の
種類がサイズ変動の場合の例であり、変動量がdsx=
fsx,dsy=fsyの場合である。この場合、
「3」の文字が枠の上下、左右に接触することになり、
「3」の外接矩形が枠に等しくなる。
【0255】さらに、同図(c)は、変動の種類が”傾
き変動”の例であり、変動量がdα=10度の場合であ
る。また、同図(d)は、変動の種類が枠幅変化の例で
あり、変動量がw=5の場合である。また、さらに、同
図(e)は、変動の種類が、”枠の凹凸”の例であり、
変動量fδ〔L]の各要素fδ〔i]を制御した場合で
ある。
【0256】上記図76(a)に示すような”位置ず
れ”変動に対して有効となる変動量は、dx,dyであ
る。同様に、同図(b),(c),(d),(e),
(f)に示されている各変動に対して有効となる変動量
は、それぞれ、同図(b),(c),(d),(e),
(f)に示されている変動量である。
【0257】枠接触文字分離部304は、上記枠接触文
字生成部303によって生成された枠接触文字から枠を
抽出・除去した後、該枠除去によって途切れた文字線分
間を補完または再補完することにより、上記枠接触文字
の2値画像から文字の2値画像のみをできる限り復元す
る。この処理は、例えば、本出願人が、以前出願した特
開平6−309498号の「画像抽出方式」に示された
方法により行う。尚、以後、補完により復元されたパタ
ーンを補完パターン、再補完により復元された文字パタ
ーンを再補完パターンと呼ぶことにする。そして、この
補完パターン及び再補完パターンを文字認識部305及
び再文字認識部505に出力する。
【0258】文字認識部305は、該枠接触文字分離部
304によって得られた文字パターンについて文字認識
を行い、認識した文字に対応するコード(文字コード)
を信頼度作成部306に出力する。この文字認識は、例
えば、「統計的手法による手書き数字認識」(「手書き
文字認識技術の過去、現在、未来」信学シンポジウム講
演論文集、pp38−45、1993年、4月)に記載
されている手法により行う。
【0259】信頼度テーブル作成部306は、該文字認
識部305から入力される文字コードと学習データの文
字コード(正解の文字コード)とを比較して、該文字認
識部305が、枠接触文字分離部304から出力される
補完パターンまたは再補完パターンから正しい文字を認
することができたか否か判断する。そして、図77に示
す信頼度テーブル400を作成する。
【0260】すなわち、上述のようにして、上記変動種
類決定部301、変動量決定部302及び枠接触文字生
成部303により、あるカテゴリの文字パターンの学習
データに対して複数の形態の枠接触文字を自動生成し、
枠接触文字分離部304がこの枠接触文字から枠を抽出
・除去して、補完パターンまたは再補完パターンを生成
し、該パターンについて文字認識部305が文字認識を
実行する。信頼度テーブル作成部306は、該文字認識
結果を学習データの正解の文字コードと比較することに
より、文字認識部305の文字認識結果の正解率を、信
頼度として算出する。また、さらに、その他の各カテゴ
リについても、文字パターンとその文字コードを学習デ
ータとして、この信頼度テーブル作成装置300に入力
させ、上記のような処理を行って、上記信頼度を算出す
る。
【0261】以上のような処理を行うことにより、信頼
度テーブル作成部306は、変動量が、dy=5,W=
5等の”下位置ずれ”の「2」の枠接触文字の場合、枠
接触文字分離部304と文字認識部305とで構成され
る文字認識装置が、23%の確率で、「2」を誤って
「7」と認識してしまうことを学習する。そして、誤読
文字対(2、7)及び信頼度77%を、上記変動量dy
=5,W=5等と共に、信頼度テーブル400に登録す
る。すなわち、この場合、文字認識部305が「7」と
認識したとしても、その信頼度は77%であり、実際の
文字が「2」である可能性が22%ある旨が信頼度テー
ブル400に登録される。同様にして、他の誤読され易
い文字対についても、”変動量”、”枠の線幅”、”誤
読文字対”及び信頼度が、信頼度テーブル作成部306
によって信頼度テーブル400に登録される。尚、誤読
文字対(L1,L2)は、実際は「L1」である文字が
「L2」に誤って認識されてしまう場合を示すものであ
る。また、上記L1,L2には、例えば、該当する文字
の文字コードが登録される。
【0262】信頼度テーブル400には、図77に示
す”下位置ずれ”変動以外にも、図78に示すように”
文字枠に対する文字の傾き変動”(この場合、左枠接
触)などの図76に示す各種変動について、各文字カテ
ゴリ毎に登録される。
【0263】すなわち、例えば、図78に示すよう
に、”下位置ずれ”変動については、例えば、dx=
「−3」〜「+3」、dy=5,w=5,dsy=1,
dα=「−10」〜「+10」、fα=「−10」〜
「+10」が登録される。このように、同じ”下位置ず
れ”変動であっても、信頼度テーブル400に登録され
る変動量は、dx,dyのみでなく、その他の変動量が
登録される場合がある。また、”左枠接触の文字枠に対
する文字の傾き変動”については、例えば、dx=「−
3」〜「+3」、dy=「−3」〜「+3」、w=5,
dsy=1,dα=「−20」〜「+20」、fα=
「−10」〜「+10」が登録される。この図78に示
されているdx,dy,dα、fαように、変動量の値
は特定値のみが設定される場合のみでなく、取りうる値
の範囲が設定される場合もあり得る。
【0264】再文字認識部307は、上記のようにして
作成された信頼度テーブル400の各行の中で、信頼度
が予め定められたしきい値(例えば、90%)以下の行
の誤読文字対(L1,L2)について、信頼度が該しき
い値以上となるような文字認識方法を、学習データの文
字パターンと枠接触文字生成部303によって生成され
た補完パターンもしくは再補完パターンとを用いて学習
する。
【0265】例えば、図77に示すように、dy=5,
w=5の”下位置ずれ”の状態の「2」の枠接触文字の
文字認識の信頼度は77%であり、「7」と誤って認識
される確率が高いので、再文字認識部307は、枠接触
文字分離部304によって得られた補完パターンまたは
再補完パターンを、例えば、領域強調の手法により再認
識すれば認識率が向上することを学習する。
【0266】この(2、7)の誤読文字対の場合におけ
る領域強調の手法を図79を参照しながら説明する。ま
ず、図79(a)に示すように、補完パターンまたは再
補完パターンの外接矩形410を、縦の行がm個、横の
列がn個のm×n個の分割領域に分割する。そして、同
図(b)にハッチングで示すように、該外接矩形の上半
分のm/2×n個の領域を特に強調して再度、文字認識
を行う。すなわち、該m/2×n個の領域の特徴パラメ
ータを抽出して、上記補完パターンまたは再補完パター
ンが「2」または「7」のいずれであるのか調べる。こ
れにより、認識度が95%まで向上する。再文字認識部
307は、図77に示すように、誤読文字対が(2、
7)の行に、再認識方法として「領域強調」を、再認識
領域として「m/2×n」を、さらに再認識信頼度とし
て「95%」を登録する。
【0267】この領域強調の手法は、図80(a)に示
すような枠接触文字の場合にも有効である。同図(a)
は、文字「2」の下部が文字枠420に接触している例
であるが、この場合、枠接触文字生成部303により、
同図(b)に示すような「7」に類似する補完パターン
421が得られる。この補完パターン421に対して同
図(c)に示す外接矩形422を算出する。この外接矩
形422は、上記図79(a)に示す外接矩形410に
対応する。そして、再文字認識部305は、この外接矩
形422を、例えば、上記図79(b)と同様に、m×
n個の領域に分割した後、上半分のm/2×n個の領域
を特に強調して文字認識すれば、上記補完パターン42
1が「2」と認識される確率が高い、すなわち、正解率
(信頼度)が高くなることを学習し、枠接触による誤読
文字対(2、7)にたいする再認識方法として、上記領
域強調の手法を、信頼度テーブル作成部306を介して
信頼度テーブル400に登録する。
【0268】また、再文字認識部307は、信頼度が上
記しきい値未満のその他の誤読文字対に対しても、信頼
度が向上する認識方法を学習し、その学習により得られ
た再認識方法及び再認識信頼度等を、信頼度テーブル作
成部306を介して信頼度テーブル400に登録する。
【0269】尚、枠接触文字分離部304によって補完
パターンと再補完パターンの両パターンが得られる枠接
触文字については、補完パターンまたは再補完パターン
のいずれを再認識に用いるかを指定する情報を、再文字
認識部307の学習結果に基づいて、信頼度テーブル4
00に予め登録しておくようにしてもよい。このような
情報を登録しておくことにより、再認識処理を効率良
く、高速に行うことが可能になる。
【0270】また、再文字認識部307が、ある誤読文
字対に対して学習した結果得られた再認識信頼度がある
しきい値よりも小さい場合には、その誤読文字対を信頼
度テーブル400に登録する対象から除外するようにし
てもよい。このことにより、信頼度テーブル400の容
量を削減できると共に、後述する文字認識装置500に
おいて、文字認識の信頼度が低い文字について再認識す
る際の信頼度テーブル400の探索時間を短縮できる。
【0271】次に、図81は、上記信頼度テーブル自動
作成装置300によって作成された信頼度テーブル40
0を用いて、未知の枠接触文字から正しい文字を認識す
る文字認識装置500のシステム構成を示すブロック図
である。
【0272】枠接触文字分離部501は、文字枠と該文
字枠に接触して手書きされた文字(枠接触文字)の2値
画像データを入力する。そして、この枠接触文字から枠
を抽出し、この抽出によって除去された文字線分を補完
または再補完することにより上記手書き文字を復元す
る。この処理は、例えば、本出願人が以前出願した特開
平6−309498号の画像抽出方式に記載されている
方法により行う。そして、上記補完または再補完により
得られた補完パターンまたは再補完パターンを、変動種
類算出部502、文字認識部504及び再認識部505
に出力する。
【0273】変動種類算出部502は、該枠接触文字分
離部501により復元された補完パターンまたは再補完
パターンの外接矩形の位置情報と文字枠の位置情報や幅
情報などを基に、変動の種類を求める。すなわち、図7
4に示されているような”位置ずれ”、”サイズ変
動”、”傾き変動”などの文字枠に対する文字の変動、
または、”傾き変動”、枠幅変化”、”枠の凹凸”など
の文字枠の変動を求める。
【0274】変動量算出部503は、前記枠接触文字分
離部501によって得られた補完パターンもしくは再補
完パターンと、文字枠とから、該変動種類算出部502
によって求められた各変動の種類について、前記変動量
dx,dy,dsx,dsy,dα、w,fsx,fs
y,fα、fδを算出する。例えば、dx,dyは、補
完パターンもしくは再補完パターンの重心位置情報と文
字枠の重心位置情報とから算出する。また、dsx,d
syは、補完パターンもしくは再補完パターンの外接矩
形情報から算出する。また、fαは、例えば、本出願人
が平成6年2月28日に出願した「文字切り出し回路、
及び文字切り出し方法」に記載されている方法により算
出する。また、さらに、wは上記枠接触文字分離部50
1が文字枠を抽出した際に算出し、これを変動量算出部
503が入力する。また、fαは、例えば、文字枠の四
隅の位置座標を基に算出する。さらに、fδは、文字枠
の2値画像情報から算出する。
【0275】文字認識部504は、前記枠接触文字分離
部501によって復元された補完パターンまたは再補完
パターンについて文字認識を行い、その認識結果(文字
コード)を再認識部505に出力する。この文字認識
は、例えば、前述した木村、若林、大橋らによる「統計
的手法による手書き数字認識」の手法により行う。
【0276】再認識部505は、該文字認識部504か
ら入力される文字コード、変動種類算出部502から入
力される変動種類情報及び変動量算出部503から入力
される変動量情報を、キーとして信頼度テーブル400
を検索する。そして、該キーに一致する変動種類情報、
変動量情報及び誤読文字対を有する行が信頼度テーブル
400に登録されているか否か調べる。尚、この場合、
上記文字コードについては誤読文字対に登録されている
か否かを調べる。そして、上記キーに一致する行が存在
した場合には、該行に登録されている信頼度が前記しき
い値以上であるか否かを判別し、該しきい値未満であれ
ばその行に登録されている再認識方法に従って、枠接触
文字分離部501によって復元された補完パターンまた
は再補完パターンを再度、文字認識する。
【0277】すなわち、例えば、文字認識部504によ
って2値画像の未知データが「7」と認識され、さら
に、変動種類算出部502によって変動の種類として
「下位置ずれ」が、変動量算出部503によって該「下
位置ずれ」の変動量として「dy=5」が算出されたと
する。再認識部505は、これらの情報をキーとして信
頼度テーブル400を検索して、この場合の「7」の認
識の信頼度が77%としきい値よりも低いことを知り、
該信頼度テーブル400に登録されている再認識の方法
に従って、枠接触文字分離部501によって復元された
補完パターンまたは再補完パターンの上半分の領域(m
/2×n)だけを強調して再認識する。そして、例え
ば、上記2値画像の未知データ(未知の枠接触文字)の
枠に接触した文字が「2」であると再認識する。
【0278】一方、再認識部505は、信頼度テーブル
400を検索して、文字認識部504によって認識され
た文字の信頼度がしきい値以上であった場合には、再認
識は行わず、該文字認識部504から入力される文字コ
ードをそのまま出力する。
【0279】次に、上記図74の信頼度テーブル作成装
置300の再文字認識部307の動作を、図82のフロ
ーチャートを参照しながら説明する。このフローチャー
トは、再文字認識部307が領域強調の再認識方法を信
頼度テーブル400に登録する場合の動作を説明するも
のである。
【0280】再文字認識部307は、信頼度テーブル作
成部306を介して、信頼度テーブル400から信頼度
の低い誤読文字対のデータを取り出す。そして、この誤
読文字対の左側に登録されている文字について、2値の
学習データ(文字パターン)と枠接触文字分離部304
によって生成されたパターン(補完パターンまたは再補
完パターン)を入力する(S501)。
【0281】この補完パターンまたは再補完パターン
は、信頼度テーブル400に登録されている変動量パラ
メータによって規定されるパターンであり、同一カテゴ
リであっても複数の形状のパターンを取りうる。
【0282】次に、上記学習データの文字パターン(以
後、第一のパターンと呼ぶ)と上記枠接触文字分離部3
04によって生成されたパターン(以後、第二のパター
ンと呼ぶ)を、m×nの領域に分割する(S502)。
【0283】そして、該m×nの領域内のX×Yの部分
パターンについて文字認識を実行する。そして、この場
合の認識率zを求める(S503)。上記X×Yの部分
パターンは、再認識領域である。このとき、X,Yは、
それぞれ、m×nの領域のX方向、Y方向の長さを表す
変数であり、X≦m,Y≦nである。また、上記認識率
zは、上記X×Yの部分パターンを用いて文字認識を行
った際の、正解となる確率である。すなわち、上記第一
のパターンの部分パターンの文字認識結果を正解とみな
し、複数の上記第二のパターンの部分パターンに対する
文字認識結果を、上記第一のパターンの部分パターンの
文字認識結果と比較していくことにより、上記第二のパ
ターンの部分パターンの認識率zを求める。
【0284】続いて、認識率zが最大認識率maxより
も大きいか否かを判別する(S504)。該最大認識率
maxは、X×Yの部分パターンを変化させていった場
合における認識率zの最大値を記憶する変数であり、最
初はある初期値(例えば、「0」)が設定される。
【0285】そして、認識率zが最大認識率maxより
も大きければ(S504,yes)、該認識率zを最大
認識率maxに代入し(S505)、続いて、X,Yを
変更可能か否か調べる(S506)。上記ステップS5
04で、認識率zが最大認識率max以下であれば、直
ちに、このステップS506に移行する。
【0286】このX,Yの変更操作は、例えば、X,Y
の大きさの変更である。また、X×Yの部分パターンの
m×nの領域内での位置変更操作を含んでいてもよい。
ステップS506で、X,Yを変更可能であると判別す
ると(S506,yes)、上記ステップS503に戻
り、上記X,Yの変更操作を行い、新たなX×Yの部分
パターンを決定し、この部分パターンに対して文字認識
を行う。
【0287】以上、述べたステップS503〜S506
の処理を、上記ステップS506でX,Yを変更できな
いと判別するまで(S506,no)、繰り返す。そし
て、上記ステップS506でX,Yを変更できないと判
別すると(S506,no)、最大識別率maxとその
最大識別率maxが得られたX×Yの部分パターンを、
それぞれ、再認識信頼度、再認識領域として信頼度テー
ブル400に登録する。また、再認識方法として「領域
強調」を信頼度テーブル400に登録する。
【0288】尚、上記ステップS507において、上記
最大識別率maxが、あるしきい値よりも小さい、また
は文字認識部305の認識率(信頼度テーブル400に
登録さてている信頼度)よりも低くて、再認識の効果が
あまり得られない場合には、信頼度テーブル400に対
する登録を中止するようにしてもよい。
【0289】上記図82のフローチャートは、再文字認
識部307が「領域強調」の手法を用いて再文字認識の
方法を学習する例であるが、再文字認識部307は、
「領域強調」の手法以外についても、再文字認識の方法
を学習する。
【0290】次に、図83は、文字認識装置500の再
認識部505の動作を説明するフローチャートである。
再認識部505は、変動量算出部503から変動量を入
力すると、信頼度テーブル400を探索し、該信頼度テ
ーブル400内に該変動量に一致する変動量が登録され
ている行が存在するか否かを調べる(S601)。
【0291】これにより、例えば、下位置ずれ変動とな
っている「2」の文字について、その変動量としてdx
=5,w=5が入力されると、図77に示す信頼度テー
ブル400の最上位の行が検出される。
【0292】そして、上記変動量が一致する行が存在す
れば、それらの行の中に文字認識部504から入力され
る文字コード(文字認識コード)が誤読文字対に含まれ
ている行が存在するか否かを調べる(S602)。
【0293】これにより、上記下位置ずれ変動となって
いる「2」の文字の場合、上記最上位の行が検出され
る。そして、上記行が存在すれば、次に、その行に登録
されている再認識信頼度と信頼度とを比較し、該再認識
信頼度が該信頼度よりも大きいか否か判別する(S60
3)。
【0294】これにより、上記下位置ずれ変動となって
いる「2」の文字の場合、上記最上位の行に登録されて
いる再認識信頼度、信頼度が、それぞれ、「95%」、
「77%」であり、該再認識信頼度が該信頼度よりも大
きいと判別される。
【0295】そして、該再認識信頼度が該信頼度よりも
大きければ(S603、YES),次に、該再認識信頼
度が予め定められたしきい値th1よりも大きいか否か
を判別し(S604)、しきい値th1よりも大きけば
(S604、YES)、信頼度テーブル400の上記ス
テップS602で検出した行に登録されている「再認識
方法」及び「再認識領域」を参照する(S605)。
【0296】そして、枠接触文字分離部501から入力
される分離パターン(補完パターンまたは再補完パター
ンから、上記「再認識領域」を切り出し、この切り出し
た領域について上記「再認識方法」により文字認識を実
行する。そして、その文字認識により得られた文字コー
ドを出力する(S606)。
【0297】これにより、上記しきい値th1が「95
%」よりも小さければ、枠接触文字分離部501から入
力される上記下位置ずれ変動となっている「2」の文字
の補完パターンについて、上半分の「m/2×n」の領
域を用いた「領域強調」手法により、文字認識が再度実
行され、最終的に「2」の文字コードが出力される。
【0298】以上、説明したように本実施例によれば、
予め、各カテゴリの文字について、様々な形態での枠接
触文字の認識率を信頼度として、その枠接触の状態を示
すパターンと共に信頼度テーブル400に登録しておく
と共に、さらに、認識率が向上する認識方法についても
該信頼度テーブル400に登録しておくので、未知の枠
接触文字が入力された場合であっても、該信頼度テーブ
ル400を参照することにより、その未知の枠接触文字
に対する認識結果の信頼度を把握でき、信頼度の低い場
合には、信頼度テーブル400に登録されている再認識
の方法により、上記未知の枠接触文字を再認識すること
により、確実に認識の精度を向上させることが可能にな
る。また、上記パラメータを特定値ではなく、ある範囲
によって信頼度テーブル400の容量を削減できると共
に、その検索速度を高速化できる。また、登録するパラ
メータの種類は、自由に選択できるので、ほとんど全て
の未知の枠接触文字に対応することができる。この場合
にも、信頼度テーブル400の容量を、それほど、大き
くする必要はない。
【0299】上記実施例は、本発明の文字認識装置への
適用例であるが、本発明は、これに限定されることな
く、直線と図形や記号などの各種パターンとが接触して
いる画像から、目的とする画像を正確に抽出するパター
ン抽出装置や該パターン抽出装置によって抽出されたパ
ターンを認識するパターン認識装置など、その他の画像
認識に係わる様々な技術に適用可能なものである。
【0300】
【発明の効果】以上詳細に説明したように、本発明によ
れば、直線とパターンが重なっている画像から該直線を
抽出した後、その直線と上記パターンとの交点を算出す
る。そして、該交点情報を基に上記直線内の上記パター
ンの画像を推定して、該画像をいったん、仮画像として
抽出する。そして、該仮画像から、例えば、予め経験的
に求められている情報等を基に、上記パターンの画像の
みを抽出する。
【0301】したがって、例えば、文字認識装置などに
おいて、表形式の枠上でオーバーハングした手書き文字
などを正しく切り出すことが可能になるので、文字の切
りだし処理の精度を向上させることがきる。また、文字
認識装置のみならず、図形認識装置などにおいても、目
的とする図形を正確に抽出することが可能になる。
【0302】また、本発明によれば、様々な形態で枠や
罫線等の直線に接触する枠接触文字の認識の信頼度を、
予め学習して、その認識の信頼度が登録されたテーブル
を作成するので、上記テーブルを参照することにより、
未知の枠接触文字を認識する際の信頼度を知ることがで
きる。
【0303】また、上記テーブルを参照することによ
り、認識の信頼度が低いことが分かった未知の枠接触文
字については、別の手法で再認識することにより、確実
に誤った認識を削減することができる。また、予め、信
頼度が向上する再認識の方法を学習しておき、この再認
識の方法を上記信頼度と共にテーブルに登録することに
より、信頼度の低い枠接触文字については上記テーブル
に登録されている再認識の方法により再認識を実行する
ことにより確実に認識の信頼度を向上させることができ
る。
【0304】また、上記の効果を、少ない容量のテーブ
ルにより、実現することができる。また、文字パターン
以外にも、図形や記号などの各種パターンの認識率の向
上にも応用できる。
【図面の簡単な説明】
【図1】本発明の原理を説明する図(その1)である。
【図2】本発明の原理を説明する図(その2)である。
【図3】本発明の原理を説明する図(その3)である。
【図4】本発明の原理を説明する図(その4)である。
【図5】本発明の原理を説明する図(その5)である。
【図6】本発明の原理を説明する図(その6)である。
【図7】本発明の原理を説明する図(その7)である。
【図8】本発明の原理を説明する図(その8)である。
【図9】本発明の原理を説明する図(その9)である。
【図10】本発明の原理を説明する図(その10)であ
る。
【図11】本発明の原理を説明する図(その11)であ
る。
【図12】本発明の原理を説明する図(その12)であ
る。
【図13】本発明の原理を説明する図(その13)であ
る。
【図14】本発明の原理を説明する図(その14)であ
る。
【図15】本発明の一実施例である画像抽出装置のシス
テム構成を示すブロック図である。
【図16】本実施例の処理対象となる文字枠の形式を示
す図である。
【図17】枠抽出部の一実施例のブロック図である。
【図18】連結パターン抽出部でのラベリング処理によ
り得られた部分パターンの水平方向及び垂直方向の投影
を示す図である。
【図19】枠の構成要素を説明する図である。
【図20】線幅の太い枠及び線幅の細い枠の例を示す図
である。
【図21】nラインレングスを説明する図である。
【図22】交点算出部の一構成例を示す図である。
【図23】枠分離部の一構成例を示す図である。
【図24】枠の骨格線、外輪郭、内輪郭、及び線幅を説
明する図である。
【図25】本実施例における座標系を説明する図であ
る。
【図26】3交点算出部の一構成例を説明する図であ
る。
【図27】2交点算出部の一構成例を説明する図であ
る。
【図28】方向性が一致する場合の文字と枠の交点間の
対応付けを示す図である。
【図29】方向性が一致しない場合の文字と枠の交点間
の対応付けを示す図である。
【図30】3交点対応付け部の処理の一例をより詳細に
説明するフローチャートである。
【図31】上記図24のフローチャートの処理により枠
内の交点により文字と枠との交点が対応付けられる例を
示す図である。
【図32】上記図24のフローチャートの処理により枠
内の交点により文字と枠との交点が対応付けられない例
を示す図である。
【図33】2交点対応付け部の処理の一例をより詳細に
説明するフローチャートである。
【図34】枠内文字抽出部によって仮文字線分として抽
出されるパターンの例を示す図である。
【図35】枠内文字抽出部の処理の一例をより詳細に説
明するフローチャートである。
【図36】枠内文字補間部の一構成例を示すブッロク図
である。
【図37】一対一の単純補間の例を示す図である。
【図38】単純補間部の処理の一例をより詳細に説明す
るフローチャートである。
【図39】交差点内補間の例を示す図である。
【図40】交差点算出部の処理の一例をより詳細に説明
するフローチャートである。
【図41】交差点枠内補間部の処理の一例をより詳細に
説明するフローチャートである。
【図42】交差点枠外補間部の処理の一例をより詳細に
説明するフローチャートである。
【図43】直線補間部の処理の一例をより詳細に説明す
るフローチャートである。
【図44】対応付けが不可能な交点に対する直線補間部
の処理の一例をより詳細に説明するフローチャートであ
る。
【図45】平均サイズ算出部の一例をより詳細に説明す
るフローチャートである。
【図46】文字サイズ評価部の処理を説明するフローチ
ャートである。
【図47】最大文字サイズ及び最小文字サイズの一例を
示す図である。
【図48】局所的対応付け箇所がある場合と無い場合の
文字パターンの例を示す図である。
【図49】文字サイズ評価部によって、図42に示す文
字パターンを正しく切りだす例を示す図である。
【図50】オーバーハングにより、複数の文字が一文字
として切り出されることを、簡単に防止できる一例を示
す図である。
【図51】文字構造解析評価部の処理を説明するフロー
チャートである。
【図52】文字構造定義テーブルの一例を示す図であ
る。
【図53】8の字型の仮画像の仮文字線分の構成を示す
図である。
【図54】仮画像がN型であるときに正しく文字を切り
だせる例を示す図である。
【図55】仮画像が逆N型であるときに正しく文字を切
りだせる例を示す図である。
【図56】8の字型の仮画像が現れる枠と接触した文字
の例を示す図である。
【図57】図56に示す接触文字を正しく切りだす例を
示す例である。
【図58】ある文字が枠に接触して書かれた場合の枠接
触部分の拡大図である。
【図59】文字構造解析評価部が仮画像の形式を判断す
る処理を説明するフローチャートである。
【図60】交点対応付け部によって対応付けられる図5
8に示す4個の交点間の対応関係を示す図である。
【図61】図60に示すように対応付けられた8の字型
の仮画像から真の文字線分を抽出する処理を説明するフ
ローチャートである。
【図62】枠を介してオーバーハングの状態に手書きさ
れた「5」と「1」の文字が正しく切りだされる例を示
す図である。
【図63】オーバーハングによりN型の仮画像が形成さ
れる2つの手書き文字を切りだす例を示す図である。
【図64】オーバーハングにより8の字型の仮画像が形
成される2つの手書き文字を切りだす例を示す図であ
る。
【図65】文字と枠の交点が枠の両端でそれぞれ2個、
3個有る接触文字の枠部分の拡大図である。
【図66】図65に示す構造の仮画像用のテーブルの構
成を示す図である。
【図67】図60に示すテーブルにおける複数構造時の
一意決定条件を説明する図である。
【図68】文字と枠の交点が枠の両端で共に3個有る接
触文字の枠部分の拡大図である。
【図69】図68に示す構造の仮画像用のテーブルの構
成を示す図(その1)である。
【図70】図68に示す構造の仮画像用のテーブルの構
成を示す図(その2)である。
【図71】図68に示す構造の仮画像用のテーブルの構
成を示す図(その3)である。
【図72】本発明の実施例である第一の信頼度テーブル
作成装置のシステム構成を示すブロック図である。
【図73】本発明の実施例である第一の文字認識装置の
システム構成を示すブロック図である。
【図74】本発明の実施例である第二の信頼度テーブル
作成装置のシステム構成を示すブロック図である。
【図75】枠接触文字の生成方法を説明する図である。
【図76】枠接触文字の生成例を示す図である。
【図77】図74の信頼度テーブル作成装置によって生
成される信頼度テーブルの概略構成を示す図である。
【図78】上記信頼度テーブルに登録される変動種類の
他の例と変動量の他の例を示す図である。
【図79】再認識方法の一方法である領域強調の一例を
説明するである。
【図80】「2」の枠接触文字の場合に、その補完パタ
ーンの外接矩形を求める方法を説明する図である。
【図81】本発明の実施例である第二の文字認識装置の
システム構成を示すブロック図である。
【図82】図74の再文字認識部の動作の一例を説明す
るフローチャートである。
【図83】図81の再認識部の動作の一例を説明するフ
ローチャートである。
【図84】従来の画像抽出装置の構成を示すブロック図
である。
【図85】従来の文字認識装置のシステム構成を示すブ
ロック図である。
【図86】図85の従来の文字認識装置における文字補
完の方法を説明する図である。
【図87】図85の従来の文字認識装置における文字再
補完の方法を説明する図である。
【図88】細線化処理の問題点を説明する図である。
【図89】従来技術における枠を抽出できない問題点を
説明する図である。
【図90】図85の従来の文字認識装置において正しく
文字補完を行えない例を説明する図である。
【符号の説明】
31 直線抽出手段 32 交点算出手段 33 仮画像抽出手段 34 真画像抽出手段 35 真画像判断手段 36 領域除去手段 38、49、59、66、74、80、85、90 テ
ーブル 39、42 選択手段 41、47、51 平均文字サイズ算出手段 45、53 しきい値設定手段 46 判定手段 48 第一の選択手段 50 第二の選択手段 52 領域除去手段 54 仮画像除去手段 55、61、81 パターン分離手段 56、62、82 パターン認識手段 57、63、72、77、83 信頼度算出手段 58、65 テーブル作成手段 64、78 再文字認識手段 70、75、86 文字分離手段 71、76、87 文字認識手段 84、89 再認識手段
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平6−309498(JP,A) 特開 平7−28937(JP,A) 特開 昭63−251874(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06K 9/00 - 9/82 G06T 7/40

Claims (33)

    (57)【特許請求の範囲】
  1. 【請求項1】 直線とある形状のパターンとが重なって
    いる画像から該パターンのみを抽出するパターン抽出装
    置において、 直線とある形状のパターンとが重なっている画像から該
    直線を抽出する直線抽出手段と、 該直線抽出手段によって抽出された直線と上記パターン
    との交点を算出する交点算出手段と、 該交点算出手段により得られた交点情報を基に、上記直
    線内の上記パターンに該当する部分を想定して、該部分
    を仮画像として抽出する仮画像抽出手段と、 該仮画像抽出手段によって抽出された仮画像から、上記
    パターンの画像のみを真の画像として抽出する真画像抽
    出手段と、を備え、 前記真画像抽出手段は、 前記仮画像中の前記パターンの画像に該当する部分であ
    る真の画像を判断する真画像判断手段と、 前記仮画像から、該真画像判断手段によって真の画像と
    判断された以外の領域を除去する領域除去手段と、を備
    え、 前記真画像判断手段は、 仮画像の構造から、該仮画像内の前記パターンの画像に
    対応する真の画像のみを抽出するための情報が格納され
    ているテーブルと、 仮画像の構造を判定し、上記テーブルを参照して該仮画
    像中の前記パターンの画像に対応する真の画像を選択す
    る選択手段と、 を備えたことを特徴とするパターン抽出装置。
  2. 【請求項2】 前記パターンは、文字パターンであり、 前記テーブルは、文字の種類別に個別に設けられている
    こと、 を特徴とする請求項記載のパターン抽出装置。
  3. 【請求項3】 直線とある形状のパターンとが重なって
    いる画像から該パターンのみを抽出するパターン抽出装
    置において、 直線とある形状のパターンとが重なっている画像から該
    直線を抽出する直線抽 出手段と、 該直線抽出手段によって抽出された直線と上記パターン
    との交点を算出する交点算出手段と、 該交点算出手段により得られた交点情報を基に、上記直
    線内の上記パターンに該当する部分を想定して、該部分
    を仮画像として抽出する仮画像抽出手段と、 該仮画像抽出手段によって抽出された仮画像から、上記
    パターンの画像のみを真の画像として抽出する真画像抽
    出手段と、を備え、 前記パターンは、文字パターンであり、 前記真画像判断手段は、 仮画像を含む文字パターンの文字列から1文字のパター
    ンの平均サイズである平均文字サイズを算出する平均文
    字サイズ算出手段と、 該平均文字サイズ算出手段によって求められた平均文字
    サイズを基に、前記文字列中の前記仮画像を含む文字パ
    ターンから、その真の文字線分の画像を判定する第一の
    判定手段と、 仮文字線分の画像から成る仮画像の構造から、該仮画像
    内の真の文字線分の画像のみを抽出するための情報が格
    納されているテーブルと、 仮画像の構造を判定し、上記テーブルを参照して該仮画
    像から真の文字線分の画像である真の画像を判定する第
    二の判定手段と、 を備えたことを特徴とするパターン抽出装置。
  4. 【請求項4】 直線とある形状のパターンとが重なって
    いる画像から該パターンのみを抽出するパターン抽出装
    置において、 直線とある形状のパターンとが重なっている画像から該
    直線を抽出する直線抽出手段と、 該直線抽出手段によって抽出された直線と上記パターン
    との交点を算出する交点算出手段と、 該交点算出手段により得られた交点情報を基に、上記直
    線内の上記パターンに該当する部分を想定して、該部分
    を仮画像として抽出する仮画像抽出手段と、 該仮画像抽出手段によって抽出された仮画像から、上記
    パターンの画像のみを真の画像として抽出する真画像抽
    出手段と、を備え、 前記真画像抽出手段は、 前記仮画像中の前記パターンの画像に該当する部分であ
    る真の画像を判断する真画像判断手段と、 前記仮画像から、該真画像判断手段によって真の画像と
    判断された以外の領域を除去する領域除去手段と、を備
    え、 前記パターンは、文字パターンであり、 前記真画像判断手段は、 仮画像を含む文字パターンの文字列から1文字のパター
    ンの平均サイズである平均文字サイズを算出する平均文
    字サイズ算出手段と、 該平均文字サイズ算出手段によって求められた平均文字
    サイズを基に、前記文字列中の前記仮画像を含む文字パ
    ターンから、その真の文字線分の画像を判定する第一の
    判定手段と、 仮文字線分の画像から成る仮画像の構造から、該仮画像
    内の真の文字線分の画像のみを抽出するための情報が格
    納されているテーブルと、 仮画像の構造を判定し、上記テーブルを参照して該仮画
    像から真の文字線分の画像である真の画像を判定する第
    二の判定手段と、 を備えたことを特徴とするパターン抽出装置。
  5. 【請求項5】 直線とパターンとが接触している画像か
    ら該パターンのみを分離・抽出するパターン分離手段
    と、 該パターン分離手段によって抽出されたパターンを認識
    するパターン認識手段と、 該パターン認識手段によって認識されるパターンの信頼
    度を、前記直線と前記パターンとの接触状態毎に算出す
    る信頼度算出手段と、 該信頼度算出手段によって算出される信頼度が予め定め
    られたしきい値よりも小さい直線とパターンとの接触状
    態について、該信頼度を前記パターン認識手段が誤って
    認識するパターンと正しいパターンとの組み合わせから
    成るパターン対と共に記憶するテーブルを作成するテー
    ブル作成手段と、 を備えたことを特徴とするパターン再認識用テーブル作
    成装置。
  6. 【請求項6】 直線とパターンとが接触している画像か
    ら該パターンのみを分離・抽出するパターン分離手段
    と、 該パターン分離手段によって抽出されたパターンを認識
    するパターン認識手段と、 該パターン認識手段によって認識されるパターンの信頼
    度を、前記直線と前記パターンとの接触状態毎に算出す
    る信頼度算出手段と、 該信頼度算出手段によって算出される信頼度が予め定め
    られたしきい値よりも小さい直線とパターンとの接触状
    態について、前記パターンの認識の信頼度が向上する再
    認識の方法を学習する再文字認識手段と、 該再文字認識手段によって学習された再認識の方法を、
    前記パターン認識手段が誤って認識するパターンと正し
    いパターンとの組み合わせから成るパターン対と共に記
    憶するテーブルを作成するテーブル作成手段と、 を備えたことを特徴とするパターン再認識用テーブル作
    成装置。
  7. 【請求項7】 枠または罫線等の直線と文字とが接触し
    ている画像から該文字のみを分離・抽出する文字分離手
    段と、 該文字分離手段によって抽出された文字を認識する文字
    認識手段と、 該文字認識手段によって認識される文字の信頼度を、前
    記直線と文字との接触状態毎に算出する信頼度算出手段
    と、 該信頼度算出手段によって算出される信頼度が予め定め
    られたしきい値よりも小さい直線と文字との接触状態に
    ついて、該信頼度を前記文字認識手段が誤って認識する
    文字と正しい文字との組み合わせから成る文字対と共に
    記憶するテーブルを作成するテーブル作成手段と、 を備えたことを特徴とするパターン再認識用テーブル作
    成装置。
  8. 【請求項8】 枠または罫線等の直線と文字とが接触し
    ている画像から該文字のみを分離・抽出する文字分離手
    段と、 該文字分離手段によって抽出された文字を認識する文字
    認識手段と、 該文字認識手段によって認識される文字の信頼度を、前
    記直線と文字との接触状態毎に算出する信頼度算出手段
    と、 該信頼度算出手段によって算出される信頼度が予め定め
    られたしきい値よりも小さい直線と文字との接触状態に
    ついて、該文字の認識の信頼度が向上する再認識の方法
    を学習する再文字認識手段と、 該再文字認識手段によって学習された再認識方法を、前
    記文字認識手段が誤って認識する文字と正しい文字との
    組み合わせから成る文字対と共に記憶するテーブルを作
    成するテーブル作成手段と、 を備えたことを特徴とするパターン再認識用テーブル作
    成装置。
  9. 【請求項9】 前記信頼度算出手段は、 各文字について、該各文字が枠もしくは罫線等の直線に
    接触している様々の形態の画像パターンを生成する接触
    文字生成手段と、 該接触文字生成手段によって生成された画像パターンに
    対する前記文字認識手段の文字の認識率を調べ、該認識
    率を各文字の信頼度として設定する信頼度設定手段と、 を備えたことを特徴とする請求項記載のパターン再認
    識用テーブル作成装置。
  10. 【請求項10】 前記接触文字生成手段は、 予め定められた枠または罫線等の直線に、様々な形態に
    変化させた各文字を重畳させて前記画像パターンを生成
    することを特徴とする請求項記載のパターン再認識用
    テーブル作成装置。
  11. 【請求項11】 前記接触文字生成手段は、 各文字のサイズを変化させて前記画像パターンを生成す
    ることを特徴とする請求項記載のパターン再認識用テ
    ーブル作成装置。
  12. 【請求項12】 前記接触文字生成手段は、 各文字を、その重心を中心とする回転角度を変化させて
    前記画像パターンを生成することを特徴とする請求項
    記載のパターン再認識用テーブル作成装置。
  13. 【請求項13】 前記接触文字生成手段は、 予め定められた形態の各文字に、様々な形態に変化させ
    た枠または罫線等の直線を重畳させて前記画像パターン
    を生成することを特徴とする請求項記載のパターン再
    認識用テーブル作成装置。
  14. 【請求項14】 前記接触文字生成手段は、 枠または罫線等の直線を、その重心を中心とする回転角
    度を変化させて前記画像パターンを生成することを特徴
    とする請求項13記載のパターン再認識用テーブル作成
    装置。
  15. 【請求項15】 前記接触文字生成手段は、枠または罫
    線等の直線を、その幅のサイズを変化させて前記画像パ
    ターンを生成することを特徴とする請求項13記載のパ
    ターン再認識用テーブル作成装置。
  16. 【請求項16】 前記接触文字生成手段は、 枠または罫線等の直線を、その幅のサイズを各位置によ
    って変動させながら前記接触文字を生成することを特徴
    とする請求項13記載のパターン再認識用テーブル作成
    装置。
  17. 【請求項17】 前記接触文字生成手段は、 様々な形態に変化させた各文字に、様々な形態に変化さ
    せた枠または罫線等の直線を重畳させて、前記画像パタ
    ーンを生成することを特徴とする請求項記載のパター
    ン再認識用テーブル作成装置。
  18. 【請求項18】 前記接触文字生成手段は、 文字の重心と、枠または罫線等の直線との重心の相対的
    な位置関係を変化させて前記接触文字を生成することを
    特徴とする請求項13または17記載のパターン再
    認識用テーブル作成装置。
  19. 【請求項19】 直線とパターンとが重なっている画像
    から上記パターンのみを分離・抽出するパターン分離手
    段と、 該パターン分離手段によって抽出されたパターンを認識
    するパターン認識手段と、 該パターン認識手段によって認識されるパターンの信頼
    度を、前記直線と前記パターンとの重なり状態毎に算出
    する信頼度算出手段と、 該信頼度算出手段によって算出される信頼度が予め定め
    られたしきい値よりも小さい直線とパターンとの重なり
    状態について、前記パターン認識手段とは異なる手法に
    より前記パターンを再認識する再認識手段と、 前記パターン認識手段によって認識される信頼度が予め
    定められたしきい値よりも小さい直線とパターンとの重
    なり状態について、前記パターンの認識の信頼度が向上
    するパターンの再認識方法が登録されているテーブル
    と、を備え、 前記再認識手段は、上記テーブルに登録されている再認
    識方法により前記再認識を行うこと、 を特徴とするパターン認識装置。
  20. 【請求項20】 前記テーブルに登録されている再認識
    方法は、前記パターン分離手段によって分離されたパタ
    ーンの特定領域を用いて認識する方法であること、 を特徴とする請求項19記載のパターン認識装置。
  21. 【請求項21】 前記パターンの特定領域は、前記パタ
    ーンに外接する矩形の分割領域であること、 を特徴とする請求項20記載のパターン認識装置。
  22. 【請求項22】 枠または罫線等の直線と文字とが接触
    している画像から上記文字のみを分離・抽出する文字分
    離手段と、 該文字分離手段によって抽出された文字を認識する文字
    認識手段と、 該文字認識手段によって認識される文字の信頼度を、前
    記直線と前記文字との接触状態毎に算出する信頼度算出
    手段と、 該信頼度算出手段によって算出される信頼度が予め定め
    られたしきい値よりも小さい直線と文字との接触状態に
    ついて、前記文字認識手段とは異なる手法により前記文
    字を再認識する再認識手段と、 前記文字認識手段によって認識される信頼度が予め定め
    られたしきい値よりも小さい直線と文字との接触状態に
    ついて、前記文字の認識の信頼度が向上する文字の再認
    識方法が登録されているテーブルと、を備え、 前記再認識手段は、上記テーブルに登録されている再認
    識方法により前記再認識を行うこと、 を特徴とするパターン認識装置。
  23. 【請求項23】 前記テーブルに登録されている再認識
    方法は、前記文字分離手段によって分離された文字の特
    定領域を用いて認識する方法であること、 を特徴とする請求項22記載のパターン認識装置。
  24. 【請求項24】 前記文字の特定領域は、前記文字に外
    接する矩形の分割領域に含まれる領域であること、 を特徴とする請求項23記載のパターン認識装置。
  25. 【請求項25】 枠または罫線等の直線と文字とが接触
    している画像から上記文字のみを分離・抽出する文字分
    離手段と、 該文字分離手段によって抽出された文字を認識する文字
    認識手段と、 該文字認識手段によって認識される文字の信頼度を、前
    記直線と前記文字との接触状態毎に算出する信頼度算出
    手段と、 該信頼度算出手段によって算出される信頼度が予め定め
    られたしきい値よりも小さい直線と文字との接触状態に
    ついて、前記文字認識手段とは異なる手法により前記文
    字を再認識する再認識手段と、 前記文字認識手段によって認識される信頼度が予め定め
    られたしきい値よりも小さい直線と文字との接触状態に
    ついて、前記文字認識手段が誤って認識しやすい文字と
    正しい文字とが組み合わせられた文字対と、前記接触文
    字の認識の信頼度が向上する文字の再認識方法が登録さ
    れているテーブルと、を備え、 前記再認識手段は、前記文字認識手段によって認識され
    た文字が上記テーブルに登録されている文字対に含まれ
    る場合、前記テーブルに登録されている再認識方法によ
    り前記再認識を行うこと、 を特徴とするパターン認識装置。
  26. 【請求項26】 前記テーブルに登録されている認識
    方法は、前記文字分離手段によって分離された文字の特
    定領域を用いて認識する方法であること、 を特徴とする請求項25記載のパターン認識装置。
  27. 【請求項27】 前記文字の特定領域は、前記文字に外
    接する矩形の分割領域に含まれる領域であること、 を特徴とする請求項26記載のパターン認識装置。
  28. 【請求項28】 枠または罫線等の直線と文字とが接触
    している画像から上記文字のみを分離・抽出する文字分
    離手段と、 該文字分離手段によって抽出された文字を認識する文字
    認識手段と、 該文字認識手段によって認識される文字の信頼度を、前
    記直線と前記文字との接触状態毎に算出する信頼度算出
    手段と、 該信頼度算出手段によって算出される信頼度が予め定め
    られたしきい値よりも小さい直線と文字との接触状態に
    ついて、前記文字認識手段とは異なる手法により前記文
    字を再認識する再認識手段と、 前記文字認識手段によって認識される信頼度が予め定め
    られたしきい値よりも小さい直線と文字との接触状態に
    ついて、該信頼度と、前記文字認識手段が誤認識し
    い文字と正しい文字との組み合わせである文字対と、前
    記接触文字の認識の信頼度が向上する文字の再認識方法
    が登録されているテーブルと、を備え、 前記再認識手段は、前記文字認識手段によって認識され
    た文字が上記テーブルに登録されている文字対に含ま
    れ、かつ上記テーブルに登録されている前記文字認識手
    段によるその文字の認識の信頼度が予め定められたしき
    い値よりも小さい場合、前記テーブルに登録されている
    認識方法により前記再認識を行うこと、 を特徴とするパターン認識装置。
  29. 【請求項29】 前記テーブルに登録されている再認識
    方法は、前記文字分離手段によって分離された文字の特
    定領域を用いて認識する方法であること、 を特徴とする請求項28記載のパターン認識装置。
  30. 【請求項30】 前記文字の特定領域は、前記文字に外
    接する矩形の分割領域に含まれる領域であること、 を特徴とする請求項29記載のパターン認識装置。
  31. 【請求項31】 枠または罫線等の直線と文字とが接触
    している画像から上記文字のみを分離・抽出する文字分
    離手段と、 該文字分離手段によって抽出された文字を認識する文字
    認識手段と、 該文字認識手段によって認識される文字の信頼度を、前
    記直線と前記文字との接触状態毎に算出する信頼度算出
    手段と、 該信頼度算出手段によって算出される信頼度が予め定め
    られたしきい値よりも小さい直線と文字との接触状態に
    ついて、前記文字認識手段とは異なる手法により前記文
    字を再認識する再認識手段と、 前記文字認識手段によって認識される信頼度が予め定め
    られたしきい値よりも小さい直線と文字との接触状態に
    ついて、その接触状態の特徴を表すパラメータと、該信
    頼度と、前記文字認識手段が誤認識し易い文字と正しい
    文字の組み合わせから成る文字対と、前記接触文字の認
    識の信頼度が向上する文字の認識方法が登録されている
    テーブルと、を備え、 前記再認識手段は、上記直線と文字との接触状態の特徴
    を表す各パラメータの値を算出し、該パラメータと、前
    記文字認識手段によって認識された文字が上記テーブル
    に登録されており、かつ上記テーブルに登録されている
    前記文字認識手段によるその文字の認識の信頼度が予め
    定められたしきい値よりも小さい場合、前記テーブルに
    登録されている再認識方法により前記再認識を行うこ
    と、 を特徴とするパターン認識装置。
  32. 【請求項32】 前記テーブルに登録されている再認識
    方法は、前記文字分離手段によって分離された文字の特
    定領域を用いて認識する方法であること、を特徴とする
    請求項31記載のパターン認識装置。
  33. 【請求項33】 前記文字の特定領域は、前記文字に外
    接する矩形の分割領域に含まれる領域であること、 を特徴とする請求項31記載のパターン認識装置。
JP20556495A 1995-03-06 1995-08-11 パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置 Expired - Fee Related JP3345224B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP20556495A JP3345224B2 (ja) 1995-03-06 1995-08-11 パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
US08/609,280 US5889887A (en) 1995-03-06 1996-03-01 Pattern extracting device and method to extract a pattern from a combination and variety of patterns
KR1019960005703A KR100211856B1 (ko) 1995-03-06 1996-03-05 패턴 추출장치, 패턴 재인식 테이블작성장치, 및 패턴 인식장치
US09/228,139 US6052480A (en) 1995-03-06 1999-01-11 Pattern re-recognizing table generating device and pattern recognizing device to improve a reliability for a recognition of a pattern overlapping or intersecting a line in an image

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP7-45597 1995-03-06
JP4559795 1995-03-06
JP20556495A JP3345224B2 (ja) 1995-03-06 1995-08-11 パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置

Publications (2)

Publication Number Publication Date
JPH08305796A JPH08305796A (ja) 1996-11-22
JP3345224B2 true JP3345224B2 (ja) 2002-11-18

Family

ID=26385617

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20556495A Expired - Fee Related JP3345224B2 (ja) 1995-03-06 1995-08-11 パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置

Country Status (3)

Country Link
US (2) US5889887A (ja)
JP (1) JP3345224B2 (ja)
KR (1) KR100211856B1 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3345224B2 (ja) * 1995-03-06 2002-11-18 富士通株式会社 パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
JP3411472B2 (ja) * 1997-05-30 2003-06-03 富士通株式会社 パターン抽出装置
AU3712600A (en) 1999-02-26 2000-09-14 Raf Technology, Inc. Method and system for identifying a reference region on an image of a dropped-out form
WO2000060531A2 (en) 1999-04-07 2000-10-12 Raf Technology, Inc. Extracting user data from a scanned image of a pre-printed form
JP4416890B2 (ja) 1999-12-20 2010-02-17 富士通株式会社 帳票識別装置
US6570562B1 (en) * 2000-05-03 2003-05-27 Hewlett-Packard Development Company, L.P. Method for drawing patterned lines in a system supporting off-screen graphics
JP4613397B2 (ja) * 2000-06-28 2011-01-19 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
US20020198866A1 (en) * 2001-03-13 2002-12-26 Reiner Kraft Credibility rating platform
KR100449805B1 (ko) * 2001-12-26 2004-09-22 한국전자통신연구원 붙은 필기체 숫자열의 분할인식방법
US20030198386A1 (en) * 2002-04-19 2003-10-23 Huitao Luo System and method for identifying and extracting character strings from captured image data
JP4834351B2 (ja) * 2005-08-22 2011-12-14 株式会社東芝 文字認識装置及び文字認識方法
JP5034398B2 (ja) * 2006-09-14 2012-09-26 富士通株式会社 文字認識プログラム、文字認識方法および文字認識装置
US8244036B2 (en) * 2007-01-24 2012-08-14 Bluebeam Software, Inc. Method for emphasizing differences in graphical appearance between an original document and a modified document with annotations
US8000535B2 (en) 2007-06-18 2011-08-16 Sharp Laboratories Of America, Inc. Methods and systems for refining text segmentation results
AU2009217445A1 (en) * 2009-09-22 2011-04-07 Canon Kabushiki Kaisha Fast line linking
JP5677139B2 (ja) * 2011-03-07 2015-02-25 三菱電機株式会社 帳票文字認識装置
DE202012013465U1 (de) * 2011-06-30 2017-01-30 Google Inc. Wiedergabe eines textbildes entlang einer linie
US8760451B2 (en) 2011-06-30 2014-06-24 Google Inc. Rendering a text image using texture map character center encoding with character reference encoding
US8400453B2 (en) 2011-06-30 2013-03-19 Google Inc. Rendering a text image following a line
US8687890B2 (en) * 2011-09-23 2014-04-01 Ancestry.Com Operations Inc. System and method for capturing relevant information from a printed document
US8949110B2 (en) 2011-09-23 2015-02-03 Ancestry.Com Operations Inc. System and method for extracting categories of data
KR102161053B1 (ko) * 2013-09-06 2020-09-29 삼성전자주식회사 영상에 포함된 표의 구조를 생성하는 방법 및 이를 위한 장치
JP6255929B2 (ja) * 2013-11-15 2018-01-10 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理装置の制御方法、およびプログラム
KR101642959B1 (ko) * 2014-03-11 2016-07-26 주식회사 유니온커뮤니티 패턴 이미지 획득장치 및 그 방법
KR101746528B1 (ko) 2014-06-13 2017-06-14 주식회사 신현대 조립식 등신대 장치
JP6903966B2 (ja) * 2017-03-16 2021-07-14 富士フイルムビジネスイノベーション株式会社 情報処理装置、情報処理システム及びプログラム
JP6471796B2 (ja) * 2017-12-07 2019-02-20 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理装置の制御方法、およびプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3201752A (en) * 1962-06-11 1965-08-17 Control Data Corp Reading machine with mark separation
US4292622A (en) * 1980-02-21 1981-09-29 Hendrix Electronics, Inc. System and method for processing horizontal line characteristics in an image
US4741045A (en) * 1983-09-23 1988-04-26 Dest Corporation Optical character isolation system, apparatus and method
JPS6115284A (ja) * 1984-06-29 1986-01-23 Toshiba Corp 光学的文字読取装置
JPH03160582A (ja) * 1989-11-20 1991-07-10 Sanyo Electric Co Ltd 文書画像データに於ける罫線と文字の分離方法
JPH03212779A (ja) * 1990-01-18 1991-09-18 Yokogawa Electric Corp 文字認識装置
US5444840A (en) * 1990-06-12 1995-08-22 Froessl; Horst Multiple image font processing
US5875263A (en) * 1991-10-28 1999-02-23 Froessl; Horst Non-edit multiple image font processing of records
JP3345224B2 (ja) * 1995-03-06 2002-11-18 富士通株式会社 パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置

Also Published As

Publication number Publication date
JPH08305796A (ja) 1996-11-22
US5889887A (en) 1999-03-30
KR960035329A (ko) 1996-10-24
US6052480A (en) 2000-04-18
KR100211856B1 (ko) 1999-08-02

Similar Documents

Publication Publication Date Title
JP3345224B2 (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
US5774580A (en) Document image processing method and system having function of determining body text region reading order
Jain et al. Document representation and its application to page decomposition
KR100248917B1 (ko) 패턴인식장치및방법
EP0854434B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
Fujisawa et al. Segmentation methods for character recognition: from segmentation to document structure analysis
JP2973944B2 (ja) 文書処理装置および文書処理方法
JPH07200745A (ja) 少なくとも二つのイメージセクションの比較方法
JPH07200732A (ja) ワードオブジェクト抽出方法及びラスタ化イメージ内のノイズ除去方法
JP3525997B2 (ja) 文字認識方法
CN115311666A (zh) 图文识别方法、装置、计算机设备及存储介质
JP4450888B2 (ja) 帳票認識方法
JP4856235B2 (ja) 帳票認識方法及び帳票認識装置
KR100199296B1 (ko) 규칙적인 잡음을 이용한 한글 인식 시스템
Ting et al. A syntactic business form classifier
JP3812719B2 (ja) 文書検索装置
KR102673900B1 (ko) 표 데이터 추출 시스템 및 그 방법
JP2000207491A (ja) 文字列読取方法及び装置
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
Raza Algorithms for the recognition of poor quality documents
JPH04130979A (ja) 文字画像切出し方法
Jung Font classification and character segmentation for postal address reading
Said Automatic processing of documents and bank cheques
JP2972443B2 (ja) 文字認識装置
JP2004013188A (ja) 帳票読取り装置および帳票読取り方法ならびプログラム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020820

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080830

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100830

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110830

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120830

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120830

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130830

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees