JP4909311B2 - 文字認識装置 - Google Patents

文字認識装置 Download PDF

Info

Publication number
JP4909311B2
JP4909311B2 JP2008089118A JP2008089118A JP4909311B2 JP 4909311 B2 JP4909311 B2 JP 4909311B2 JP 2008089118 A JP2008089118 A JP 2008089118A JP 2008089118 A JP2008089118 A JP 2008089118A JP 4909311 B2 JP4909311 B2 JP 4909311B2
Authority
JP
Japan
Prior art keywords
character
character frame
interval
image data
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008089118A
Other languages
English (en)
Other versions
JP2009245036A (ja
Inventor
真一 江口
哉 川島
浩一 金元
将平 長谷川
勝利 小原
眞紀 矢吹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Frontech Ltd filed Critical Fujitsu Frontech Ltd
Priority to JP2008089118A priority Critical patent/JP4909311B2/ja
Priority to EP10160939A priority patent/EP2214124A3/en
Priority to CN200910131440XA priority patent/CN101551861B/zh
Priority to EP09156763A priority patent/EP2107505B1/en
Priority to US12/414,229 priority patent/US8189921B2/en
Publication of JP2009245036A publication Critical patent/JP2009245036A/ja
Application granted granted Critical
Publication of JP4909311B2 publication Critical patent/JP4909311B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/01Solutions for problems related to non-uniform document background
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)

Description

本発明は、帳票における文字枠内の文字を認識する文字認識装置に関する。
一般に、文字認識装置は、手書き文字や活字をカラーイメージデータとして読み取り、そのカラーイメージデータと予め登録されている文字パターンとの照合結果により文字を認識する。
このような文字認識装置において、帳票における文字枠内の文字を認識する場合は、文字枠を特定した後、その特定した文字枠を帳票のカラーイメージデータから除去して残った文字を認識する。
また、文字枠を特定する際は、予めオペレータにより文字枠情報(例えば、文字枠の形状や文字枠の色など)を登録してもらう必要がある(例えば、特許文献1参照)。
また、帳票の文字枠にドロップアウト色を使用し、そのドロップアウト色を文字認識時に除去して残った文字を認識する文字認識装置もある。この場合は、ドロップアウト色の情報が文字認識装置に既に登録されているため、オペレータにより文字枠情報を登録してもらう必要がなくなる。
特開昭61−253587号公報
しかしながら、上述のように、予めオペレータにより文字枠情報を登録してもらう場合は、通常、オペレータがディスプレイ上の帳票のカラーイメージデータを見ながらマウスやキーボードなどを操作することにより文字枠の形状や文字枠の色などを指定する必要があり、オペレータの作業工数が多くなるという問題がある。
また、文字枠にドロップアウト色を使用する場合は、そのドロップアウト色以外の色が使用された文字枠内の文字を認識することができないという問題がある。
そこで、本発明では、文字認識時のオペレータの作業工数を低減し、かつ、文字枠に使用される色に制限がかからないようにすることが可能な文字認識装置を提供することを目的とする。
上記の課題を解決するために本発明では、以下のような構成を採用した。
すなわち、本発明の文字認識装置は、帳票を第1のカラーイメージデータとして読み取るイメージ読取手段と、前記第1のカラーイメージデータを表示する表示手段と、前記表示手段に表示される第1のカラーイメージデータのうち、オペレータにより指定される解析範囲に対応する第2のカラーイメージデータを抽出する解析範囲指定手段と、前記第2のカラーイメージデータにおける直線性を有するデータに基づいて前記第2のカラーイメージデータから線分を抽出する第1の線分抽出手段と、前記第2のカラーイメージデータから背景を除去して第3のカラーイメージデータとする背景除去手段と、前記第1の線分抽出手段により抽出された線分の代表色を前記第3のカラーイメージデータから抽出し、その代表色と同じ色の線分を統合して罫線を抽出する第1の罫線抽出手段と、前記第1の罫線抽出手段により抽出された罫線を前記第3のカラーイメージデータから除去して文字と文字枠とに分離する分離手段と、前記第3のカラーイメージデータにおける直線性を有するデータと前記分離手段により分離された文字枠の色とに基づいて前記第3のカラーイメージデータから線分を抽出する第2の線分抽出手段と、前記第2の線分抽出手段により抽出された線分に基づいて前記第3のカラーイメージデータから罫線を抽出する第2の罫線抽出手段と、前記第2の罫線抽出手段により抽出された罫線と予め登録されている文字枠の形状パターンとに基づいて文字枠を特定する文字枠特定手段と、前記分離手段により分離された文字の色と前記文字枠特定手段により特定された文字枠の色とに基づいて文字と文字枠との重なり部分を残しつつ前記第3のカラーイメージデータから文字枠を除去して文字を抽出する第1の文字枠除去手段と、前記第1の文字枠除去手段により抽出された文字を認識する文字認識手段とを備える。
また、前記第2の罫線抽出手段は、前記第2の線分抽出手段により抽出された線分の代表色と同じ色の線分を前記第3のカラーイメージデータから抽出し、それら抽出した線分を統合して罫線を抽出する第3の罫線抽出手段と、前記第3の罫線抽出手段で抽出された罫線のうち、まだ接続関係にありそうな箇所を特定する特定手段と、前記特定手段で特定された箇所のエッジ成分に基づいて、前記箇所が接続可能か否かを判断し、その判断結果が接続可能である場合、前記箇所を接続して罫線を抽出する接続手段とを備えるように構成してもよい。
また、前記文字枠特定手段は、前記第2の罫線抽出手段により抽出された罫線の各縦線から任意の2つの縦線を選択する場合の全ての組み合わせそれぞれにおいて前記任意の2つの縦線の間隔を算出し、その算出した間隔を示す間隔表を生成する間隔表生成手段と、前記間隔表に示される間隔の延べ数を示す投票表を生成する投票表生成手段と、前記投票表に示される延べ数が大きい間隔を前記文字枠の間隔として仮定する間隔仮定手段と、前記文字枠の形状パターンの間隔を、前記間隔仮定手段で仮定された間隔に変更する間隔変更手段と、前記間隔変更手段により間隔が変更された文字枠の形状パターンと、前記第2の罫線抽出手段により抽出された罫線とのパターンマッチングを行い、そのパターンマッチングの結果により文字枠を特定する特定手段とを備えるように構成してもよい。
また、本発明の文字認識装置は、予めオペレータにより登録される文字枠情報に基づいて特定される文字枠を前記第3のカラーイメージデータから除去し文字を抽出する第2の文字枠除去手段を備え、前記文字枠特定手段により特定された文字枠に対応する文字枠情報を、前記予めオペレータにより登録される文字枠情報に反映させるように構成してもよい。
また、本発明の文字枠特定装置は、帳票内の文字枠を特定する文字枠特定装置であって、前記帳票のイメージデータから文字枠に対応する線分を抽出する線分抽出手段と、前記線分抽出手段により抽出された線分の各縦線から任意の2つの縦線を選択する場合の全ての組み合わせそれぞれにおいて前記任意の2つの縦線の間隔を算出し、その算出した間隔を示す間隔表を生成する間隔表生成手段と、前記間隔表に示される間隔の延べ数を示す投票表を生成する投票表生成手段と、前記投票表に示される延べ数が大きい間隔を前記文字枠の間隔として仮定する間隔仮定手段と、予め登録されている文字枠の形状パターンの間隔を、前記間隔仮定手段で仮定された間隔に変更する間隔変更手段と、前記間隔変更手段により間隔が変更された文字枠の形状パターンと、前記線分抽出手段により抽出された線分とのパターンマッチングを行い、そのパターンマッチングの結果により文字枠を特定する特定手段とを備える。
本発明によれば、文字認識装置により帳票における文字枠内の文字を認識させる際、オペレータの作業工数を低減するとともに、帳票の文字枠に使用される色に制限がかからないようにすることができる。
以下、図面を用いて本発明の実施形態を説明する。
図1は、本発明の実施形態の文字認識装置を示す図である。
図1に示す文字認識装置1は、イメージ入力部2と、イメージ読取部3と、イメージ表示部4と、解析範囲指定部5と、分類部6と、文字枠特定部7と、文字枠除去部8と、文字認識部9と、解析結果表示部10とを備える。
図2は、文字認識装置1の動作を説明するためのフローチャートを示す図である。
まず、イメージ読取部3は、スキャナなどのイメージ入力部2から入力された帳票をカラーイメージデータ(第1のカラーイメージデータ)(以下、単に帳票という)として読み取る(S1)。
次に、イメージ表示部4は、イメージ読取部3で読み取られた帳票をディスプレイに表示する(S2)。図3(a)に示す例では、4桁の金額を記入することが可能な文字枠11が示される帳票12がディスプレイ13の上半分に表示され、文字認識の結果及び文字枠の解析結果が示される結果表示欄14がディスプレイ13の下半分に表示されている。また、図3(a)に示す例では、ディスプレイ13に「文字認識実行」ボタン15が表示されており、オペレータのマウスやキーボードなどの操作により「文字認識実行」ボタン15が押下されると、文字枠解析及び文字認識が開始される。
次に、解析範囲指定部5は、ディスプレイに表示される帳票のうち、オペレータにより指定される解析範囲のカラーイメージデータ(第2のカラーイメージデータ)(以下、単に解析範囲という)を読み込む(S3)。例えば、図3(b)に示すように、オペレータは、ディスプレイ13に表示される帳票12を見ながらマウスやキーボードなどを操作することにより、少なくとも文字枠11が解析範囲16内に入るように解析範囲16の位置や大きさを大まかに調整する。
次に、分類部6は、S3で読み込んだ解析範囲内の直線性を有するデータに基づいて、解析範囲から線分(文字枠を構成する線分、文字を構成する線分、及び文字枠や文字を構成する線分以外の線分(ノイズ)など)を抽出する(S4:線分1次抽出)。
次に、分類部6は、S4で抽出した線分以外の解析範囲から背景色(例えば、S4で抽出した線分以外の解析範囲の色において最も多い色)に対応するカラーイメージデータ(以下、単に背景という)を除去する(S5)。
次に、分類部6は、S5で背景が除去されたカラーイメージデータ(第3のカラーイメージデータ)において、S4で抽出した線分のうち、代表色(例えば、背景が除去されたカラーイメージデータ内の線分の色において最も多い色)の線分を抽出し、その抽出した線分を統合し罫線を抽出する(S6:罫線1次抽出)。このように、代表色の線分を統合して罫線を抽出することにより、スキャナ毎の色のばらつきやスキャナの光源の変化により発生する色ズレの影響を抑えることができる。なお、この罫線には文字の一部が含まれている。
次に、分類部6は、S6で抽出された罫線からセル(矩形)を抽出する(S7)。なお、このセルにも文字の一部が含まれている。
次に、分類部6は、S6で抽出された罫線又はS7で抽出されたセルを使用して文字枠を仮決めし、その仮決めした文字枠をS5で背景が除去されたカラーイメージデータから除去し(S8)、解析範囲を、背景と、文字枠と、文字とに大まかに分類する(S9)。このとき分類される文字の一部は除去されている。
次に、文字枠特定部7は、S5で背景が除去されたカラーイメージデータ内の直線性を有するデータと、S9で分類された文字枠の色を利用して、S5で背景が除去されたカラーイメージデータから文字枠を構成する線分を抽出する(S10:線分2次抽出)。
次に、文字枠特定部7は、S10で抽出された線分に基づいて罫線を抽出する(S11:罫線2次抽出)。
次に、文字枠特定部7は、S11で抽出された罫線やその罫線に基づくセルにより、解析範囲内の文字枠を単純枠、梯子枠、又は1文字枠のいずれかに特定する(S12)。
次に、文字枠除去部8は、S9で分類された文字の色及びS12で特定された文字枠の色に基づいて、文字と文字枠との重なり部分を残しつつ、S5で背景が除去されたカラーイメージデータから文字枠を除去して文字を抽出する(S13)。例えば、図4に示すように、S9で分類された文字とS12で特定された文字枠とが重なった部分の色は、文字の色や文字枠の色と異なるため、その重なった部分の色を残しつつ、S12で特定された文字枠の色のカラーイメージデータをS5で背景色が除去されたカラーイメージデータから除去することにより、文字だけを抽出することができる。
次に、文字認識部9は、S13で抽出された文字の認識を行う(S14)。例えば、手書き文字や活字の認識を行うことが可能な既存の文字認識技術により文字認識を行ってもよい。また、予め文字の属性を登録しておき、その文字の属性に基づいて文字認識を行ってもよい。
そして、解析結果表示部10は、S14で認識された文字(文字認識結果)及びS12で特定された文字枠の文字枠情報(文字枠の形状パターン、文字枠の色、文字枠の線種、文字枠の太さ、文字枠の枠数、文字枠のサイズ、文字枠の座標)をディスプレイに表示する(S15)。図5に示す例では、ディスプレイ13に表示される結果表示欄14に、「文字認識結果:7650、文字枠の形状パターン:1文字枠、文字枠の色:黒、文字枠の線種:実線、文字枠の太さ:1mm、文字枠の枠数:4、文字枠のサイズ:表示している枠の通り、文字枠の座標:表示している枠の通り」と示されている。
このように、本実施形態の文字認識装置1では、始めに帳票のカラーイメージデータのうちオペレータに指定される解析範囲を大まかに背景、文字枠、及び文字に分類し、その分類結果に基づいて精度良く文字枠を特定し、その特定した文字枠を、背景を除去したカラーイメージデータから除去し、残った文字に対して文字認識を行うので、文字枠内の文字の認識の精度を向上させることができる。これにより、予め文字枠情報をオペレータにより登録させる必要がないため、文字認識時のオペレータの作業工数を低減することができる。
また、本実施形態の文字認識装置1では、帳票のカラーイメージデータに基づいて、文字枠を特定する構成であるため、文字枠に使用される色が制限されることがない。
ところで、帳票のカラーイメージデータを読み取るためのスキャナの解像度が240dpiで、かつ、その帳票における文字枠の太さが0.1mmの場合では、文字枠のカラーイメージデータは1dot単位になるため、スキャナのCCDカメラの間にある文字枠のカラーイメージデータは読み取れず、S6のように代表色だけで全ての罫線を抽出することは難しい。
そこで、このように解像度240dpiにおける0.1mmの文字枠のカラーイメージデータに対しては、図6に示すように、RGBのいずれかの情報に反応しているため、エッジ成分を利用して罫線を抽出することが考えられる。
図7は、エッジ成分を利用した罫線抽出方法を説明するためのフローチャートを示す図である。
まず、図8(a)に示すように、スキャナなどで読み込んだ帳票のカラーイメージデータのうち、オペレータにより指定された解析範囲において線分を抽出する(ST1)。例えば、図2のS4のように、解析範囲内の直線性を有するデータに基づいて、解析範囲から線分(文字枠を構成する線分、文字を構成する線分、及び文字枠や文字を構成する線分以外の線分(ノイズ)など)を抽出する。
次に、図8(b)に示すように、ST1で抽出した線分のうち、代表色の線分を抽出し、その抽出した線分を統合し罫線を抽出する(ST2)。
次に、図8(c)に示すように、ST2で抽出した罫線のうち、まだ接続関係にありそうな箇所(破線円部分)を特定する(ST3)。例えば、ST2で抽出された罫線の位置、罫線の色、罫線の太さ、罫線の方向などにより、まだ接続関係にありそうな箇所を特定する。
次に、図8(d)に示す破線円部分の拡大図のように、ST3で特定した箇所に対してエッジフィルタをかける(ST4)。
そして、図8(e)に示すように、ST3で特定した箇所において、エッジフィルタをかけた後のカラーイメージデータの濃淡差が所定の閾値以上である場合、そのカラーイメージデータを統合して最終的な罫線を抽出する(ST5)。
図7に示す罫線抽出方法によれば、スキャナの解像度が240dpiで、かつ、太さが0.1mmの文字枠に対してもその文字枠に対応する罫線を精度良く抽出することができる。
なお、図7に示す罫線抽出方法は、図2のS11において罫線を抽出する際に利用してもよい。すなわち、まず、図7のST2において、図2のS10で抽出された線分を統合して罫線を抽出し、次に、図7のST3において、その抽出した罫線のうち、まだ接続関係にありそうな箇所を特定し、次に、図7のST4において、ST3で特定した箇所に対してエッジフィルタをかけ、そして、図7のSTE5において、エッジフィルタをかけた後のカラーイメージデータの濃淡差が所定の閾値以上である場合、そのカラーイメージデータを統合して罫線を抽出し、図2のS11において、その抽出した罫線に基づいて文字枠を特定してもよい。
また、例えば、文字枠が細いため罫線がうまく抽出されない場合、文字枠が点線であるため罫線がうまく抽出されない場合、文字枠に記入された文字の色が文字枠の色と同じため罫線がうまく抽出されない場合、装飾された文字枠に対応する罫線がうまく抽出されない場合、文字枠の縦線の間隔が等間隔でないため罫線がうまく抽出されない場合などでは、文字枠を単純枠、梯子枠、1文字枠のいずれかにうまく特定することができない。
そこで、このようにうまく文字枠を特定できない場合に対しては、例えば、まず、図9(a)に示すような帳票のカラーイメージから罫線を抽出し(図9(b))、次に、その抽出した罫線の各縦線の間隔の延べ数が多い間隔を、罫線の各縦線のそれぞれの間隔と仮定し(図9(c):一点鎖線は補完後の縦線、破線は削除後の縦線)、そして、予め登録される文字枠の各縦線のそれぞれの間隔を、仮定した間隔に変換し、その文字枠と罫線とのパターンマッチングの結果に基づいて文字枠を特定する(図9(d))ことが考えられる。
図10は、このように文字枠を特定する際の文字枠特定方法を説明するためのフローチャートを示す図である。
まず、スキャナなどで読み込んだ帳票のカラーイメージデータのうち、オペレータにより指定された解析範囲において線分を抽出する(STE1)。
次に、STE1で抽出した線分のうち、各縦線にそれぞれ通し番号を付与するとともに、それら各縦線のそれぞれの間隔(dot)を算出する(STE2)。例えば、図11に示すように、STE1で抽出した線分のうち、10本の各縦線にそれぞれ通し番号((1)〜(10))を付与する。また、図11に示す例では、(1)と(2)との間隔は30、(2)と(3)との間隔は60、(3)と(4)との間隔は30、(4)と(5)との間隔は15、(5)と(6)との間隔は15、(6)と(7)との間隔は20、(7)と(8)との間隔は10、(8)と(9)との間隔は30、(9)と(10)との間隔は60と算出されている。
次に、STE2で算出した各間隔に基づいて、各縦線から任意の2つの縦線を選択する場合の全ての組み合わせそれぞれにおいてその任意の2つの縦線の間隔を算出し、その算出した間隔を示す間隔表を生成する(STE3)。図11に示す各縦線(1)〜(10)に対応する間隔表は、例えば、図12に示すような間隔表になる。図12に示す間隔表において、例えば、一番上の列の「(1)」と一番左の列の「(2)」とが交わるところの数字は(1)の縦線を基準としたときの(2)の縦線までの間隔を示し、一番上の列の(3)と一番左の列の(8)とが交わるところの数字は(3)の縦線を基準としたときの(8)の縦線までの間隔を示している。
次に、STE3で生成した間隔表の各間隔をそれぞれ1/1にした値に対して1票ずつ投票して投票表を生成する(STE4)。図11に示す各縦線(1)〜(10)に対応する投票表は、例えば、図13(a)に示すような投票表になる。図13(a)に示す投票表の一番上の列に図12に示す間隔表の各間隔が示されており、一番左の列に「1/1」及び投票数の合計(延べ数)が示されている。すなわち、図13(a)に示す投票表では、例えば、間隔「30」に対して5票が投票されていることを示している。
次に、STE3で生成した間隔表の各間隔をそれぞれ1/2にした値に対して2票ずつ投票し、その投票数をSTE4で生成した投票表における投票数の合計に加える(STE5)。なお、STE3で生成した間隔表の各間隔をそれぞれ1/2にした値が文字枠の間隔としてあり得ない場合は投票しないものとする。STE5で生成される投票表は、例えば、図13(b)に示すような投票表になる。図13(b)に示す投票表では、一番上の列に図12に示す間隔表の各間隔及びそれら間隔を1/2にしたものが示されており、一番左の列に「1/1」、「1/2」、及び投票数の合計(延べ数)が示されている。すなわち、図13(b)に示す投票表では、例えば、間隔「30」に対して17票が投票されていることを示している。
次に、STE3で生成した間隔表の各間隔をそれぞれ1/3にした値に対して3票ずつ投票し、その投票数をSTE5で生成した投票表における投票数の合計に加える(STE6)。なお、STE3で生成した間隔表の各間隔をそれぞれ1/3にした値が文字枠の間隔としてあり得ない場合は投票しないものとする。STE6で生成される投票表は、例えば、図13(c)に示すような投票表になる。図13(c)に示す投票表では、一番上の列に図12に示す間隔表の各間隔、それら各間隔を1/2にしたもの、さらに1/3にしたものが示されており、一番左の列に「1/1」、「1/2」、「1/3」、及び投票数の合計(延べ数)が示されている。すなわち、図13(c)に示す投票表では、例えば、間隔「30」に対して32票が投票されていることを示している。なお、本実施形態では、STE3で生成した間隔表の各間隔を3回分割しているが、STE3で生成した間隔表の各間隔の分割回数は特に限定されない。
次に、STE6で生成した投票表において投票数の合計が多いものを文字枠の間隔と仮定する(STE7)。例えば、図9(a)に示すように、文字枠の各縦線が等間隔である梯子枠の場合、STE6で生成した投票表において投票数の合計が最も多い「30」を文字枠の間隔とする。また、1文字枠や間隔の異なる文字枠の組み合わせの場合、STE6で生成した投票表において投票数の合計が1番目に多いものや2番目に多いものを文字枠の間隔と仮定する。
次に、予め登録される単純枠、梯子枠、及び1文字枠の3つの文字枠の形状パターンの縦線の間隔を、それぞれ、STE7で仮定した間隔に変更して、3種類の文字枠を生成する(STE8)。例えば、文字枠の形状パターンとしては、図14(a)に示す単純枠の基本形、図14(b)に示す単純枠のバリエーション1(上罫線が無いもの)、図14(c)に示す単純枠のバリエーション2(半罫線を利用したもの)、図14(d)に示す梯子枠の基本形、図14(e)に示す梯子枠のバリエーション1(太い線を利用したもの)、図14(f)に示す梯子枠のバリエーション2(点線を利用したもの)、図14(g)に示す1文字枠の基本形、図14(h)に示す1文字枠のバリエーション1(1つ目の文字枠と2つ目の文字枠を結合したもの)、図14(i)に示す1文字枠のバリエーション2(カンマにより1つ目の文字枠と2つ目の文字枠とが変形したもの)などが考えられる。
次に、STE1で抽出した線分とSTE8で生成した3種類の文字枠とでパターンマッチングを行い、そのパターンマッチングの結果に基づいて文字枠を特定する(STE9)。例えば、文字枠の形状パターンとして単純枠の各縦線の間隔を「30」に変更した場合は、その文字枠の形状パターンには区切り線がないのに対して、STE1で抽出した線分には区切り線が複数あるため、単純枠でないと判断される。また、文字枠の形状パターンとして梯子枠の各縦線のそれぞれの間隔を「30」に仮定した場合は、その文字枠の形状パターンとSTE1で抽出した線分とがほぼ一致するため、梯子枠であると判断され、図9(c)に示すように、STE1で抽出した線分において足りない縦線が補完されるとともに、余分な縦線が削除され文字枠が特定される。このように文字枠が特定されると、残りの文字枠の形状パターンである1文字枠と、STE1で抽出した線分とのパターンマッチングは行われない。なお、文字枠の形状パターンとしての1文字枠とSTE1で抽出した線分とのパターンマッチングでは、各縦線のそれぞれの間隔の規則性に基づいて一致するか否かを判断してもよい。
そして、STE9で特定した文字枠の文字枠情報(文字枠の形状パターン、文字枠の色、文字枠の線種、文字枠の太さ、文字枠の枠数、文字枠のサイズ、文字枠の座標)を登録し、次回文字枠を特定する際に利用する(STE10)。
図10に示す文字枠特定方法によれば、文字枠が細いため罫線がうまく抽出されない場合、文字枠が点線であるため罫線がうまく抽出されない場合、文字枠に記入された文字の色が文字枠の色と同じため罫線がうまく抽出されない場合、装飾された文字枠に対応する罫線がうまく抽出されない場合、文字枠の縦線の間隔が等間隔でないため罫線がうまく抽出されない場合などでも、文字枠をうまく特定することができる。
なお、図10に示す文字枠特定方法は、図2のS12における文字枠を特定する際に利用してもよい。すなわち、図10のSTE2において、S11で抽出された罫線の各縦線にそれぞれ通し番号を付与するとともにそれら各縦線のそれぞれの間隔を算出し、以降、STE3〜STE8を行った後、STE9において、S11で抽出された罫線とSTE8で生成した3種類の文字枠とでパターンマッチングを行い、そのパターンマッチングの結果に基づいて文字枠を特定するように構成してもよい。
また、図2のS12で得られる文字枠の解析結果を、予めオペレータにより登録される文字枠情報に反映させてもよい。
図15は、図2のS12で得られた文字枠の解析結果を、予めオペレータにより登録される文字枠情報に反映する場合の文字認識装置1の動作を説明するためのフローチャートを示す図である。なお、図15のフローチャートの動作を行う文字認識装置1では、背景が除去された帳票のカラーイメージデータから予め登録される文字枠情報に基づく文字枠を除去した後、残りの文字に対して文字認識を行う機能が追加されているものとする。
まず、文字認識装置1は、スキャナなどで読み取られた帳票のカラーイメージデータをディスプレイに表示させる(STEP1)。例えば、文字枠情報を登録するための帳票定義ツール上において帳票のカラーイメージデータをディスプレイに表示される。
次に、文字認識装置1は、ディスプレイに表示される帳票のカラーイメージデータにおいて解析範囲がオペレータのマウスやキーボード操作などにより指定されたことを確認する(STEP2)。このとき、オペレータは、少なくとも解析したい文字枠が含まれるように大まかに解析範囲を指定する。
次に、文字認識装置1は、ディスプレイに表示される文字枠解析実行ボタンなどがオペレータのマウスやキーボード操作により押下されたことを確認すると、STEP2で指定された解析範囲について文字枠の解析を行う(STEP3)。このとき、図2のS3〜S12を実行することにより文字枠の解析が行われるものとする。
次に、文字認識装置1は、文字枠の解析結果である文字枠情報をディスプレイに表示させる(STEP4)。例えば、図5に示すように、ディスプレイ13の結果表示欄14に文字枠情報が表示される。
次に、文字認識装置1は、オペレータにより文字枠情報の修正があった場合、オペレータの修正指示に基づいて文字枠情報を修正する(STEP5)。オペレータは、解析結果が正しいか否かを確認し、誤っている箇所があった場合、マウスやキーボード操作によりその箇所を修正する。また、認識カテゴリ等の文字枠情報以外の情報をオペレータが追加するように構成してもよい。
そして、文字認識装置1は、ディスプレイに表示される定義格納ボタンなどがオペレータのマウスやキーボード操作により押下されたことを確認すると、STEP3で得られた文字枠情報又はSTEP5で修正された文字枠情報を、予め登録されている文字枠情報に反映する(STEP6)。
従来では、文字枠情報をオペレータが手動で登録する場合、文字枠情報を登録するための帳票定義ツール上において、ディスプレイに表示される帳票のカラーイメージデータの文字枠をオペレータが1枠毎になぞるように指定していた。このように、1枠毎に文字枠をオペレータが指定していたので、文字枠情報の登録に時間がかかってしまっていた。また、細かい文字枠はディスプレイ上でその文字枠を一旦拡大することが行われていたため、その分手間がかかっていた。また、オペレータによる手動で文字枠が指定される構成であるため、指定した解析範囲と実際の文字枠とがズレて文字枠情報を正しく登録することができない場合があった。
図15に示すフローチャートにより動作する文字認識装置1では、オペレータが大まかに解析範囲を指定するだけで、自動的に文字枠情報を得ることができ、上述のような不具合が発生することをなくすことができる。
本発明の実施形態の文字認識装置を示す図である。 文字認識装置の動作を説明するためのフローチャートを示す図である。 帳票のカラーイメージデータの表示画面例を示す図である。 文字と文字枠との重なり部分の色を示す図である。 文字認識結果及び文字枠解析結果の表示画面例を示す図である。 解像度240dpiにおける0.1mmの文字枠のカラーイメージデータとRGB情報との関係を示す図である。 エッジ成分を利用した罫線抽出方法を説明するためのフローチャートを示す図である。 エッジ成分を利用した罫線抽出方法を説明するための図である。 文字枠特定方法の概念を説明するための図である。 文字枠特定方法を説明するためのフローチャートを示す図である。 線分抽出後の各縦線の間隔の一例を示す図である。 間隔表の一例を示す図である。 投票表の一例を示す図である。 文字枠の形状パターンの一例を示す図である。 文字枠の解析結果を予め登録されている文字枠情報に反映させる際の動作を説明するためのフローチャートを示す図である。
符号の説明
1 文字認識装置
2 イメージ入力部
3 イメージ読取部
4 イメージ表示部
5 解析範囲指定部
6 分類部
7 文字枠特定部
8 文字枠除去部
9 文字認識部
10 解析結果表示部
11 文字枠
12 帳票
13 ディスプレイ
14 結果表示欄
15 文字認識実行ボタン

Claims (6)

  1. 帳票を第1のカラーイメージデータとして読み取るイメージ読取手段と、
    前記第1のカラーイメージデータを表示する表示手段と、
    前記表示手段に表示される第1のカラーイメージデータのうち、オペレータにより指定される解析範囲に対応する第2のカラーイメージデータを抽出する解析範囲指定手段と、
    前記第2のカラーイメージデータにおける直線性を有するデータに基づいて前記第2のカラーイメージデータから線分を抽出する第1の線分抽出手段と、
    前記第2のカラーイメージデータから背景を除去して第3のカラーイメージデータとする背景除去手段と、
    前記第1の線分抽出手段により抽出された線分の代表色を前記第3のカラーイメージデータから抽出し、その代表色と同じ色の線分を統合して罫線を抽出する第1の罫線抽出手段と、
    前記第1の罫線抽出手段により抽出された罫線を前記第3のカラーイメージデータから除去して文字と文字枠とに分離する分離手段と、
    前記第3のカラーイメージデータにおける直線性を有するデータと前記分離手段により分離された文字枠の色とに基づいて前記第3のカラーイメージデータから線分を抽出する第2の線分抽出手段と、
    前記第2の線分抽出手段により抽出された線分に基づいて前記第3のカラーイメージデータから罫線を抽出する第2の罫線抽出手段と、
    前記第2の罫線抽出手段により抽出された罫線と予め登録されている文字枠の形状パターンとに基づいて文字枠を特定する文字枠特定手段と、
    前記分離手段により分離された文字の色と前記文字枠特定手段により特定された文字枠の色とに基づいて文字と文字枠との重なり部分を残しつつ前記第3のカラーイメージデータから文字枠を除去して文字を抽出する第1の文字枠除去手段と、
    前記第1の文字枠除去手段により抽出された文字を認識する文字認識手段と、
    を備えることを特徴とする文字認識装置。
  2. 請求項1に記載の文字認識装置であって、
    前記第2の罫線抽出手段は、
    前記第2の線分抽出手段により抽出された線分の代表色と同じ色の線分を前記第3のカラーイメージデータから抽出し、それら抽出した線分を統合して罫線を抽出する第3の罫線抽出手段と、
    前記第3の罫線抽出手段で抽出された罫線のうち、まだ接続関係にありそうな箇所を特定する特定手段と、
    前記特定手段で特定された箇所のエッジ成分に基づいて、前記箇所が接続可能か否かを判断し、その判断結果が接続可能である場合、前記箇所を接続して罫線を抽出する接続手段と、
    を備えることを特徴とする文字認識装置。
  3. 請求項1又は請求項2に記載の文字認識装置であって、
    前記文字枠特定手段は、
    前記第2の罫線抽出手段により抽出された罫線の各縦線から任意の2つの縦線を選択する場合の全ての組み合わせそれぞれにおいて前記任意の2つの縦線の間隔を算出し、その算出した間隔を示す間隔表を生成する間隔表生成手段と、
    前記間隔表に示される間隔の延べ数を示す投票表を生成する投票表生成手段と、
    前記投票表に示される延べ数が大きい間隔を前記文字枠の間隔として仮定する間隔仮定手段と、
    前記文字枠の形状パターンの間隔を、前記間隔仮定手段で仮定された間隔に変更する間隔変更手段と、
    前記間隔変更手段により間隔が変更された文字枠の形状パターンと、前記第2の罫線抽出手段により抽出された罫線とのパターンマッチングを行い、そのパターンマッチングの結果により文字枠を特定する特定手段と、
    を備えることを特徴とする文字認識装置。
  4. 請求項1〜3の何れか1項に記載の文字認識装置であって、
    予めオペレータにより登録される文字枠情報に基づいて特定される文字枠を前記第3のカラーイメージデータから除去し文字を抽出する第2の文字枠除去手段を備え、
    前記文字認識手段は、前記第2の文字枠除去手段により抽出された文字を認識する
    ことを特徴とする文字認識装置。
  5. 帳票内の文字枠を特定する文字枠特定装置であって、
    前記帳票のイメージデータから文字枠に対応する線分を抽出する線分抽出手段と、
    前記線分抽出手段により抽出された線分の各縦線から任意の2つの縦線を選択する場合の全ての組み合わせそれぞれにおいて前記任意の2つの縦線の間隔を算出し、その算出した間隔を示す間隔表を生成する間隔表生成手段と、
    前記間隔表に示される間隔の延べ数を示す投票表を生成する投票表生成手段と、
    前記投票表に示される延べ数が大きい間隔を前記文字枠の間隔として仮定する間隔仮定手段と、
    予め登録されている文字枠の形状パターンの間隔を、前記間隔仮定手段で仮定された間隔に変更する間隔変更手段と、
    前記間隔変更手段により間隔が変更された文字枠の形状パターンと、前記線分抽出手段により抽出された線分とのパターンマッチングを行い、そのパターンマッチングの結果により文字枠を特定する特定手段と、
    を備えることを特徴とする文字枠特定装置。
  6. 請求項4に記載の文字認識装置であって、
    前記文字枠特定手段により特定された文字枠に対応する文字枠情報を、前記予めオペレータにより登録される文字枠情報に反映させる、
    ことを特徴とする文字認識装置。
JP2008089118A 2008-03-31 2008-03-31 文字認識装置 Active JP4909311B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2008089118A JP4909311B2 (ja) 2008-03-31 2008-03-31 文字認識装置
EP10160939A EP2214124A3 (en) 2008-03-31 2009-03-30 Character recognition device
CN200910131440XA CN101551861B (zh) 2008-03-31 2009-03-30 字符识别装置
EP09156763A EP2107505B1 (en) 2008-03-31 2009-03-30 Character recognition device
US12/414,229 US8189921B2 (en) 2008-03-31 2009-03-30 Character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008089118A JP4909311B2 (ja) 2008-03-31 2008-03-31 文字認識装置

Publications (2)

Publication Number Publication Date
JP2009245036A JP2009245036A (ja) 2009-10-22
JP4909311B2 true JP4909311B2 (ja) 2012-04-04

Family

ID=40679678

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008089118A Active JP4909311B2 (ja) 2008-03-31 2008-03-31 文字認識装置

Country Status (4)

Country Link
US (1) US8189921B2 (ja)
EP (2) EP2107505B1 (ja)
JP (1) JP4909311B2 (ja)
CN (1) CN101551861B (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011079446A1 (en) * 2009-12-30 2011-07-07 Nokia Corporation Method and apparatus for passcode entry
JP5561856B2 (ja) * 2010-05-24 2014-07-30 株式会社Pfu 帳票作成装置、帳票作成プログラム、および帳票作成方法
CN102375978A (zh) * 2010-08-17 2012-03-14 富士通株式会社 处理图像的方法和设备
US9471560B2 (en) * 2011-06-03 2016-10-18 Apple Inc. Autocorrecting language input for virtual keyboards
JP6225423B2 (ja) * 2013-01-07 2017-11-08 セイコーエプソン株式会社 分光測定装置、カラーマネージメントシステム、及びプロファイル作成方法
JP5822865B2 (ja) * 2013-04-25 2015-11-25 京セラドキュメントソリューションズ株式会社 画像処理装置、罫線判定方法、及び罫線判定プログラム
WO2015189941A1 (ja) * 2014-06-11 2015-12-17 株式会社Pfu 情報処理装置、情報処理方法、および、プログラム
US10068132B2 (en) * 2016-05-25 2018-09-04 Ebay Inc. Document optical character recognition
CN109389050B (zh) * 2018-09-19 2021-11-09 陕西科技大学 一种流程图连接关系识别方法
CN110399851B (zh) * 2019-07-30 2022-02-15 广东工业大学 一种图像处理装置、方法、设备及可读存储介质
CN110895696A (zh) * 2019-11-05 2020-03-20 泰康保险集团股份有限公司 一种图像信息提取方法和装置

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57111679A (en) 1980-12-26 1982-07-12 Ricoh Co Ltd Discrimination system for discrimination between type character and handwritten character
JPS61253587A (ja) 1985-05-02 1986-11-11 Mitsubishi Electric Corp 光学文字読取装置
JPS6278690A (ja) 1985-10-02 1987-04-10 Fujitsu Ltd 文字認識装置
JP2637541B2 (ja) 1989-02-02 1997-08-06 富士通株式会社 色識別方法及び装置
JPH064705A (ja) 1992-06-16 1994-01-14 Mitsubishi Electric Corp 画像処理装置
JPH06111057A (ja) 1992-09-25 1994-04-22 Toshiba Corp 光学的文字読取装置
JPH06266887A (ja) 1993-03-15 1994-09-22 Hitachi Ltd フォーマット作成方法およびそれを用いた光学文字読取装置
JP3258122B2 (ja) * 1993-03-31 2002-02-18 株式会社東芝 画像処理装置
JP3720078B2 (ja) * 1995-06-26 2005-11-24 三菱電機株式会社 多色文字画像読取装置
JPH10162102A (ja) 1996-12-03 1998-06-19 Ricoh Co Ltd 文字認識装置
JP3524339B2 (ja) * 1997-08-25 2004-05-10 沖電気工業株式会社 光学式文字読取装置用帳票のフォーマット情報生成方法
US6366699B1 (en) * 1997-12-04 2002-04-02 Nippon Telegraph And Telephone Corporation Scheme for extractions and recognitions of telop characters from video data
JP2000172782A (ja) * 1999-01-01 2000-06-23 Fujitsu Ltd 画像抽出装置
JP4242962B2 (ja) 1999-01-08 2009-03-25 パナソニック コミュニケーションズ株式会社 文字切出装置
JP2001236464A (ja) 2000-02-25 2001-08-31 Ricoh Co Ltd 文字抽出方法、文字抽出装置及び記憶媒体
JP3995185B2 (ja) * 2000-07-28 2007-10-24 株式会社リコー 枠認識装置及び記録媒体
JP3705216B2 (ja) * 2001-02-28 2005-10-12 日本電気株式会社 文字記入枠検出方法、文字記入枠検出装置及びプログラム
JP2002342710A (ja) * 2001-05-16 2002-11-29 Nec Corp 文字切出し装置及びそれに用いる文字切出し方法並びにそのプログラム
JP4078045B2 (ja) * 2001-07-02 2008-04-23 キヤノン株式会社 画像処理装置、方法、プログラム、及び記憶媒体
JP4731748B2 (ja) * 2001-07-12 2011-07-27 キヤノン株式会社 画像処理装置、方法、プログラム及び記憶媒体
JP2004318588A (ja) * 2003-04-17 2004-11-11 Canon Inc 帳票読み取り装置、方法、およびプログラム記憶媒体
CN100382096C (zh) 2003-08-20 2008-04-16 奥西-技术有限公司 文档扫描设备及方法
JP4385709B2 (ja) 2003-10-01 2009-12-16 沖電気工業株式会社 フォーマット情報登録方法、ocrシステム及びフォーマット情報登録プログラム
JP4071701B2 (ja) * 2003-11-11 2008-04-02 富士通株式会社 カラー画像の圧縮方法及びカラー画像圧縮装置
JP4603807B2 (ja) * 2004-03-10 2010-12-22 富士通株式会社 文字認識装置,文字認識方法,媒体処理方法,文字認識プログラムおよび文字認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2006092345A (ja) 2004-09-24 2006-04-06 Fuji Xerox Co Ltd 文字認識装置、文字認識方法および文字認識プログラム
US7756340B2 (en) * 2006-07-11 2010-07-13 Pegasus Imaging Corporation Method and apparatus for identifying and/or removing combs from scanned images

Also Published As

Publication number Publication date
JP2009245036A (ja) 2009-10-22
EP2107505A1 (en) 2009-10-07
US20090245627A1 (en) 2009-10-01
US8189921B2 (en) 2012-05-29
CN101551861A (zh) 2009-10-07
EP2107505B1 (en) 2013-02-20
EP2214124A3 (en) 2012-09-05
EP2214124A2 (en) 2010-08-04
CN101551861B (zh) 2012-07-25

Similar Documents

Publication Publication Date Title
JP4909311B2 (ja) 文字認識装置
JP6286866B2 (ja) 画像処理装置および画像処理方法
US8619278B2 (en) Printed matter examination apparatus, printed matter examination method, and printed matter examination system
TW200842734A (en) Image processing program and image processing device
JP5906788B2 (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
JP2000285190A (ja) 帳票識別方法および帳票識別装置および記憶媒体
CN111368841A (zh) 文本识别方法、装置、设备及存储介质
JP4777024B2 (ja) 画像処理装置および画像処理装置の制御方法
JP2020042466A (ja) 認識処理装置及びプログラム
KR101023309B1 (ko) 문자 인식 장치
JP7075770B2 (ja) 文字認識システム、文字鮮明化システム、文字鮮明化プログラム、文字鮮明化方法、及び文字鮮明化画像の表示装置
JP6118646B2 (ja) 帳票処理装置、帳票処理方法、帳票処理プログラム
JP6250526B2 (ja) 計量メータ読取装置及びプログラム
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JP3730073B2 (ja) テンプレート作成方法、装置、およびテンプレート作成プログラムを記録した記録媒体
CN109409370B (zh) 一种远程桌面字符识别方法和装置
JP2010066997A (ja) フォント識別装置、フォント識別プログラム、フォント確認システムおよびスキャナ
JPH09185675A (ja) 様式解析方法
JP2001052111A (ja) 文書入力方法、文書入力プログラムを記録した記録媒体及び文書入力装置
JP6743401B2 (ja) 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム
JP4081074B2 (ja) 帳票処理装置、帳票処理方法、及び帳票処理プログラム
JPH0554178A (ja) 文字認識装置及び修正用帳票
JPH06309503A (ja) 英文字認識装置
JP2001126025A (ja) Ocr用フォーマットパラメータ作成方法
JPH11265424A (ja) 文字認識方法、装置および記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100406

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110825

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110913

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120110

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150120

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4909311

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150