JP6903966B2 - 情報処理装置、情報処理システム及びプログラム - Google Patents

情報処理装置、情報処理システム及びプログラム Download PDF

Info

Publication number
JP6903966B2
JP6903966B2 JP2017051773A JP2017051773A JP6903966B2 JP 6903966 B2 JP6903966 B2 JP 6903966B2 JP 2017051773 A JP2017051773 A JP 2017051773A JP 2017051773 A JP2017051773 A JP 2017051773A JP 6903966 B2 JP6903966 B2 JP 6903966B2
Authority
JP
Japan
Prior art keywords
character
character string
recognition
entry frame
recognition accuracy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017051773A
Other languages
English (en)
Other versions
JP2018156308A (ja
Inventor
久保田 聡
聡 久保田
木村 俊一
俊一 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2017051773A priority Critical patent/JP6903966B2/ja
Priority to US15/903,273 priority patent/US10796143B2/en
Publication of JP2018156308A publication Critical patent/JP2018156308A/ja
Application granted granted Critical
Publication of JP6903966B2 publication Critical patent/JP6903966B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

本発明は、情報処理装置、情報処理システム及びプログラムに関する。
従来、帳票に記入された氏名、住所等のデータを入力する業務においては、人が帳票画像を見ながらキー入力したり、帳票画像に対してOCR(Optical Character Recognition光学文字認識)を用いた結果を人手により確認・修正して入力することが行われている。このとき、データを正しく入力するために、OCRによる認識結果を判定・修正する様々な工夫がなされている。
例えば、記入文字が記入枠に重なることによるOCRの誤認識をより正確に補正する情報処理装置が提案されている(例えば、特許文献1参照)。
特許文献1に開示された情報処理装置は、認識文字が矩形枠と所定の位置で重なっている場合に、記入枠との重なり状態に基づいて、読み取った文字を置き換えるか否かを判定し、置き換えると判定された文字を予め記憶している他の文字に置き換えるようにしている。
また例えば、処理コストが小さく、かつ誤認識を抑制することのできる帳票文字認識装置が提案されている(例えば、特許文献2参照)。
特許文献2に記載された帳票文字認識装置は、認識結果の信頼度の値を元に認識結果の棄却判定を行う信頼度による棄却判定部と、非文字枠画像に接触している文字枠線が所定の閾値を越える場合に、文字枠線に対応した文字の認識結果を棄却する罫線接触棄却判定部とを有し、どちらかの結果が棄却であった場合は、最終的に出力する文字認識結果を棄却するようにしている。
特開2015−97067号公報 特許第5677139号公報
本発明の目的は、データ入力作業における文字の認識確度を用いる方法のみ、又は文字記入枠との接触判定を用いる方法のみを用いる方法に比べて、人手によるチェックにかかる工数を削減する情報処理装置、情報処理システム及びプログラムを提供することにある。
[1]入力画像中の文字記入枠の位置を抽出する第1の抽出手段と、
前記文字記入枠内に記入された文字列を認識する認識手段と、
前記認識手段の前記文字列の各文字に対する認識確度を算出する算出手段と、
前記認識確度に基づく値が予め設定された閾値以上であることを検出する第1の検出手段と、
前記文字列の各文字の外接矩形の前記入力画像中における位置を抽出する第2の抽出手段と、
前記外接矩形が前記文字記入枠と接触することを検出する第2の検出手段と、
前記第1の検出手段及び前記第2の検出手段の検出結果に基づいて、修正対象の前記文字列を表示する表示手段と、を備え
前記第1の検出手段により前記認識確度に基づく値が前記閾値以上であることが検出されている場合において、前記第2の検出手段により前記文字列中のいずれかの文字について前記外接矩形が前記文字記入枠と接触することが検出されていないときは、前記表示手段は、修正対象の前記文字列を表示せずに、前記第2の検出手段により前記文字列中のいずれかの文字について前記外接矩形が前記文字記入枠と接触することが検出されたときは、前記表示手段は、修正対象の前記文字列を表示する情報処理装置。
]前記第1の検出手段及び前記第2の検出手段は、前記各検出を前記文字列中の各一文字毎に順番に行い、前記文字についての認識確度が前記閾値以上であることが検出されなかった場合には、前記表示手段は、修正対象の前記文字列を表示する前記[]に記載の情報処理装置。
]前記第2の検出手段により、前記文字列中のいずれかの文字について前記外接矩形が前記文字記入枠と接触することが検出されたか否かに拘わらず、前記第1の検出手段により前記認識確度に基づく値が前記閾値以上であることが検出されなかった場合には、
前記表示手段は、修正対象の前記文字列を表示する前記[1]に記載の情報処理装置。
]前記[1]〜[]のいずれかに記載の情報処理装置と、前記入力画像中の文字列から前記情報処理装置で生成されたデータを登録するデータベースと、を備えた情報処理システム。
]コンピュータを、入力画像中の文字記入枠の位置を抽出する第1の抽出手段と、
前記文字記入枠内に記入された文字列を認識する認識手段と、
前記認識手段の前記文字列の各文字に対する認識確度を算出する算出手段と、
前記認識確度に基づく値が予め設定された閾値以上であることを検出する第1の検出手段と、
前記文字列の各文字の外接矩形の前記入力画像中における位置を抽出する第2の抽出手段と、
前記外接矩形が前記文字記入枠と接触することを検出する第2の検出手段と、
前記第1の検出手段及び前記第2の検出手段の検出結果に基づいて、修正対象の前記文字列を表示する表示手段として、機能させるプログラムであって、
前記第1の検出手段により前記認識確度に基づく値が前記閾値以上であることが検出されている場合において、前記第2の検出手段により前記文字列中のいずれかの文字について前記外接矩形が前記文字記入枠と接触することが検出されていないときは、前記表示手段は、修正対象の前記文字列を表示せずに、前記第2の検出手段により前記文字列中のいずれかの文字について前記外接矩形が前記文字記入枠と接触することが検出されたときは、前記表示手段は、修正対象の前記文字列を表示するプログラム。
請求項1、及びに係る発明によれば、データ入力作業における文字の認識確度を用いる方法のみ又は文字記入枠との接触判定を用いる方法のみを用いる方法に比べて人手によるチェックにかかる工数を削減することができ、また、認識確度が高い場合でも、文字列と記入枠との接触が検出された場合には修正対象の文字列の表示を行うことができる。
請求項に係る発明によれば、一文字毎に認識確度及び記入枠との接触を判定することにより、確認修正が必要な文字列を速やかに検出する。
請求項に係る発明によれば、文字列が記入枠と接触していない場合でも、認識確度が低い場合には修正対象の文字列を表示することで、確認修正が必要なデータを高精度に判定することができる。
図1は、本発明の第1の実施の形態に係る情報処理システムの概略を示す構成図である。 図2は、第1の実施の形態に係る情報処理装置の概略構成を示す構成図である。 図3は、第1の実施の形態の情報処理装置の動作の一例を示すフローチャートである。 図4は、帳票画像中の文字が記入された文字記入枠の一例を示す説明図である。 図5は、帳票定義情報の一例を示す説明図である。 図6は、枠の位置情報の座標系の一例を示す説明図である。 図7は、本発明の第2の実施の形態に係る情報処理装置の動作の一例を示すフローチャートである。 図8は、本発明の第3の実施の形態に係る情報処理装置の動作の一例を示すフローチャートである。
[実施の形態の要約]
本発明の実施の形態は、入力画像中の文字記入枠の位置を抽出する第1の抽出手段と、前記文字記入枠内に記入された文字列を認識する認識手段と、前記認識手段の前記文字列の各文字に対する認識確度を算出する算出手段と、前記認識確度に基づく値が予め設定された閾値以上であることを検出する第1の検出手段と、前記文字列の各文字の外接矩形の前記入力画像中における位置を抽出する第2の抽出手段と、前記外接矩形が前記文字記入枠と接触することを検出する第2の検出手段と、前記第1の検出手段及び前記第2の検出手段の検出結果に基づいて、修正対象の前記文字列を表示する表示手段とを備え、文字列の認識確度が所定の閾値以上の場合に、文字列の各文字の外接矩形と文字記入枠との接触が検出された場合には、人手による確認・修正を行うために認識結果を表示するものである。
なお、本明細書において、「認識確度」とは、認識手段が入力画像から文字を認識する確信度をいう。また、「外接矩形」とは、入力画像における座標軸に平行な辺を持ち、その文字を内部に含む最小の矩形のことをいうものとする。これらの算出方法については、明細書の中で詳細に説明する。
[第1の実施の形態]
以下、本発明の実施の形態について図面を参照して詳細に説明する。
(情報処理システムの構成)
図1は、本発明の第1の実施の形態に係る情報処理システムの概略を示す構成図である。
図1に示すように、本実施の形態に係る情報処理システム1は、情報処理装置2と、情報処理装置2によって処理されたデータが登録されるデータベース3とが回線4によって接続されて構成されている。ここで回線4は、有線あるいは無線を問わず、また情報処理装置2とデータベース3とを直接接続するものには限定されず、LAN(Local Area Network)等のネットワークであってもよい。
情報処理装置2は、詳細は後述するが、データ入力作業者(操作者)が操作するパーソナルコンピューター(PC)でもよいし、いろいろな部署からデータ入力を受け付けてまとめて処理を行うサーバのようなものであってもよい。
データベース3は、大容量記憶装置で構成され、情報処理装置2で処理されて出力されたデータを登録するものである。
(情報処理装置の構成)
図2は、本実施の形態に係る情報処理装置2の概略構成を示す構成図である。
図2に示すように、情報処理装置2は、制御部20、記憶部22、入力部24、表示部26及び外部I/F28を含んで構成される。
制御部20は、CPU等から構成され、各部を制御するとともに各種のプログラムを実行する。
制御部20は、記入枠位置抽出手段200、文字認識手段201、認識確度算出手段202、認識確度判定手段203、外接矩形抽出手段204、文字接触判定手段205、認識結果修正手段206及び結果統合手段207を含んで構成される。
記憶部22は、ハードディスクやフラッシュメモリ等の記録媒体から構成され、情報を記憶する。
記憶部22は、情報処理プログラム220、帳票定義情報記憶部221、住所データベース222及び結果格納部223を含んで構成される。
記入枠位置抽出手段200は、入力された帳票画像中における文字記入枠の位置を抽出するものである。記入枠位置抽出手段200は、第1の抽出手段に相当する。ここで入力される帳票画像とは、例えば、氏名や住所等が手書きで記載された帳票をスキャナ等で読み取った画像データを指すが、スキャナで読み取られた画像に限定されるものではなく、デジタルカメラで撮影したものやファックスで受信したものであってもよい。また、帳票画像の入力にあたっては、入力される帳票中のどの位置に何が記載されているかの情報を予め記した情報である帳票定義情報が入力される。
記入枠位置抽出手段200は、入力された帳票画像と帳票定義情報とから、入力帳票中の認識対象文字列が記入されている実際の記入枠位置を抽出する。例えば、帳票定義情報により予め設定された枠位置情報から実際に入力される帳票画像の相対的なずれ量を算出し、これを記入枠位置として抽出する。なお、帳票定義情報や文字記入枠位置の抽出については後で詳しく述べる。
文字認識手段201は、帳票画像の文字記入枠内の文字列を認識するものである。文字認識手段201としては、例えば光学文字認識(OCR;Optical Character Recognition)が好適に用いられる。
文字記入枠は1文字枠でも複数文字枠(文字列枠)でもよい。文字認識手段201は、文字記入枠が複数文字枠の場合には文字列を1文字候補に切り出し、各1文字候補それぞれを認識する。なお、複数文字枠の場合でも、枠が一文字毎に区切られておらず、大きな一つの枠の中に複数文字を記入するようになっていてもよい。また文字列は、普通は複数文字から成るが、特別な場合として一文字からなる場合も含むものとする。
認識確度算出手段202は、文字認識手段201で認識された1文字あるいは複数の文字からなる文字列の認識確度を算出する。1文字の場合には、文字認識手段201の認識結果に対する確信度をそのまま認識確度とする。
認識確度算出手段202としては、特に限定されるものではないが、例えば、特開2011−113125号公報あるいは特開2013−069132号公報に記載された認識装置の出力値を認識確度として用いるようにしてもよい。
例えば、特開2011−113125号公報に記載された認識装置の出力値の算出方法について以下簡単に説明する。入力された対象データ(画像データ)に対してまずフィルタリング処理を行い、フィルタリング処理の結果の各画素に対して非線形関数処理を行う。この非線形関数としては、例えばロジスティック関数や双曲線正接関数等のシグモイド関数が利用されるが、所定の条件を満たすものであればこれ以外のものでもよい。
次に、各画素に対して縮小処理を行い、これに対して再度非線形関数処理を行う。各画素に対して重み付けをして、すべての画素について総和をとり、これにバイアスを加える。その結果に対して非線形関数による演算を行う。これらの非線形関数も上記のものと同等のものでよい。こうして得られた画像に対して、所定の強調関数による演算を行い、さらに正規化したものを最終出力とする。
本実施の形態では、この最終出力値を認識確度の一例として用いるが、認識確度の算出方法はこれに限定されるものではなく、他の算出方法を用いてもよいのはもちろんである。
認識確度判定手段203は、算出された認識確度を予め設定された閾値と比較して、認識確度が閾値以上であることを検出するものである。すなわち、認識確度判定手段203は、第1の検出手段に相当する。なお、認識確度が閾値未満の場合には、誤認識の可能性が考えられるので、操作者の確認・修正に供するために、認識結果を表示部26に表示する。
外接矩形抽出手段204は、帳票画像中における文字記入枠内に記入された各文字の外接矩形の位置を抽出するものである。外接矩形抽出手段204は、第2の抽出手段に相当する。
文字接触判定手段205は、上で抽出された記入枠位置と外接矩形の位置とに基づいて、各文字が文字記入枠と接触していることを検出するものである。すなわち、文字接触判定手段205は、第2の検出手段に相当する。なお、文字列と文字記入枠との接触の検出については、例えば、文字列に含まれる文字が1文字でも文字記入枠と接触した場合に接触を検出してもよいし、所定文字数より多く接触した場合に接触を検出するようにしてもよい。
認識結果修正手段206は、表示部26に表示された認識結果を見て操作者が入力部24から正しいデータを入力したとき、そのデータに基づいて認識結果のデータを正しいデータに修正するものである。
結果統合手段207は、認識結果修正手段206の修正結果と、文字認識手段201の認識結果とを統合するものである。結果統合手段207の出力が情報処理装置2の出力データの内容となる。
記憶部22に記憶された情報処理プログラム220は、制御部20を上述した各手段として機能させるものである。帳票定義情報記憶部221は、帳票画像とともに入力部24から入力された帳票定義情報を記憶しておくものである。住所データベース222は、住所のデータを格納したものであり、認識結果を確認する際の参考として用いられる。また、結果格納部223は、結果統合手段207で統合された出力用のデータを格納しておくためのものである。
なお、入力部24としては、キーボード、マウス又はタッチパネル等を適宜選択して用いることができる。また、表示部26は、文字や画像等を表示するものでディスプレイ装置等で構成される。また、外部I/F28は、情報処理装置2を、回線4等を通じて外部のデータベース3やその他のシステム機器と接続させるものである。
(第1の実施の形態の動作)
次に、本発明の第1の実施の形態の情報処理装置2の動作を図3を参照して説明する。図3は、第1の実施の形態の情報処理装置2の動作の一例を示すフローチャートである。
まず、入力部24から帳票画像が入力される(S100)。このとき、帳票定義情報も一緒に入力される。図4に帳票画像中の文字が記入された文字記入枠の一例を示し、図5に帳票定義情報の一例を示す。
図4に示すように、文字記入枠30の中には、文字列31(31a〜31f)が手書きで記入されている。図4に示す例では、文字記入枠30は大きな一つの枠からなり、その中に「横」31a、「浜」31b、「市」31c、「百」31d、「合」31e、「丘」31fの6文字が手書きで記入され、この6文字で一つの文字列31(この場合には住所(ここでは例として架空の住所)を示す)が構成されている。
帳票定義情報は、入力される帳票中のどの位置に何が記載されているかを示す情報を予め記した情報であり、例えば図5に示すように、枠の名称、枠の種類、枠の上端、下端、左端、右端を示す枠の位置情報などで構成されている。
また、枠の位置情報の座標系の一例を図6に示す。図6に示すように、枠の位置情報の座標系は、例えば帳票画像中において、左上に座標原点(0,0)をとり、横軸をx軸、縦軸をy軸とし、枠40の上端のy座標、下端のy座標、左端のx座標、右端のx座標を与えることで枠の位置を定義している。
なお、帳票定義情報は、入力される帳票に変更がなければ、帳票画像と一緒に毎回入力する必要はなく、例えばCSV(Comma Separated Value)ファイル等のテキスト情報として予め保存されていてもよい。この帳票定義情報は記憶部22の帳票定義情報記憶部221に記憶される。
次に、記入枠位置抽出手段200は、入力された帳票画像と帳票定義情報の枠位置情報から、実際に入力された帳票画像の相対的なずれ量を算出して、帳票画像中の認識対象である入力文字列が記入されている実際の記入枠位置を抽出する(S101)。図4に示す例では、帳票画像中に設定された座標系に関する、矩形状の文字記入枠30の4つの頂点の座標を抽出する。
次に、文字認識手段201は、文字記入枠30内の文字列を認識する(S102)。これは例えば、入力された帳票画像の文字記入枠30からOCRにより一文字ずつ文字を認識して文字列を切り出す。このとき文字記入枠30の内側で枠にぎりぎりのところで切り出すため、例えば図4の文字「百」31dのように上の横線が文字記入枠30と重なっているとすると、この上の横線も切り取られてしまい、入力された「百」という文字が、「白」と認識されたてしまう可能性がある。また、文字「丘」31fのように下の横線が文字記入枠30と重なっていると、この下の横線が切り取られてしまい、入力された「丘」という文字が「斤」と認識されてしまう可能性がある。このため、後述するように文字と文字記入枠30との接触を検出することが必要となる。
そこで、外接矩形抽出手段204により、文字記入枠30内の認識対象である各文字の外接矩形が抽出される(S103)。例えば、図4に示す例では、文字「横」31aに対しては外接矩形32aが抽出される。以下、各文字「浜」31b、「市」31c、「百」31d、「合」31e、「丘」31fに対してそれぞれの外接矩形32b、32c、32d、32e、32fが抽出される。
次に、認識確度算出手段202は、文字認識手段201で認識された一文字あるいは文字列の認識確度Sを算出する(S104)。一文字の場合には、文字認識手段201の認識結果に対する確信度をそのまま認識確度Sとする。この確信度は、上述したように、例えば特開2011−113125号公報に記載された認識装置の出力値として算出される。
また文字列の場合には、例えば、文字列に含まれる各文字の認識確度の最小値をその文字列の認識確度として算出する。あるいは、文字列に含まれる各文字の認識確度の最大値をその文字列の認識確度としてもよいし、文字列に含まれる各文字の認識確度の平均値をその文字列の認識確度としてもよい。
例えば、図4に示す例で、各文字「横」31a、「浜」31b、「市」31c、「百」31d、「合」31e、「丘」31fの認識確度がそれぞれ0.6、0.8、1.0、0.6、0.9、0.8であったとする。今例えば、各文字の認識確度の最小値をその文字列の認識確度とすると、「横」31aの認識確度が0.6で最小であり、これが文字列「横浜市百合丘」の認識確度となる。
次に認識確度判定手段203は、算出された文字列の認識確度Sを予め設定された閾値Tと比較して、認識確度Sが閾値T以上であることを検出する(S105)。
今例えば、閾値Tが0.8であるとすると、図4の例で文字列の認識確度を各文字の認識確度の最小値とした場合には、文字列「横浜市百合丘」の認識確度Sは0.6であるから、認識確度Sは閾値T未満となり、閾値以上であることは検出されない。また、例えば文字列の認識確度として各文字の認識確度の平均値をとった場合には、図4の例の文字列「横浜市百合丘」の認識確度Sは、(0.6+0.8+1.0+0.6+0.9+0.8)÷6において小数第2位で四捨五入すると0.8となる。よってこの場合には認識確度Sは閾値T以上となり、認識確度Sが閾値T以上であることが検出される。
認識確度判定手段203によって認識確度Sが閾値T以上であることが検出された場合には(S105;Yes)、認識結果が誤認識である可能性が低いと考えられるが、次に文字接触判定手段205によって文字と文字記入枠30との接触を検出する(S106)。
文字接触判定手段205によって、文字と文字記入枠30との接触が検出された場合には(S106;Yes)、誤認識している可能性があるので、確認・修正のために認識結果が表示部26に表示される(S107)。このとき、誤認識している可能性があることを示すために、例えば、認識文字列にハッチングを掛けて表示したり、あるいは色を変えて表示したりする等の工夫をするようにしてもよい。
操作者は、表示された認識結果を確認し、必要であれば認識文字列を修正し、正しい文字列を入力部24から入力する。認識結果修正手段206は、操作者の修正入力を受けて認識文字列のデータを修正する(S108)。なお、認識文字列が住所を表している場合には、認識文字列の確認・修正を行う際、例えば、記憶部22の住所データベース222を用いて正しいデータを確認するようにしてもよい。
また、認識確度Sが閾値T未満で、認識確度判定手段203によって認識確度Sが閾値T以上であることが検出されなかった場合には(S105;No)、認識結果が誤認識である可能性が高いので、この場合にも認識結果の確認・修正のために認識結果を表示部26に表示する(S107)。
また、文字接触判定手段205によって文字と文字記入枠30との接触が検出されなかった場合(S106;No)、及び上で認識結果の確認・修正が行われた場合には、認識結果修正手段206による修正結果及び文字認識手段201の認識結果が結果統合手段207で統合される(S109)。統合されたデータは、記憶部22の結果格納部223に格納される。
最後に統合されたデータは外部I/F28から回線4を介してデータベース3に出力される(S110)。このデータ出力は、その都度出力してもよいし、結果格納部223に格納されたデータをまとめて出力するようにしてもよい。
このように本実施形態では、文字列の認識確度が所定の閾値以上であることの検出と、文字が文字記入枠30と接触することの検出とを組み合わせることにより、認識文字列を、人手による確認修正作業が必要なデータと、人手による確認修正作業が不要なデータとに分割することで、データ入力作業における人手入力工数の削減を図っている。
[第2の実施の形態]
本発明の第2の実施の形態は、まず入力された帳票画像の文字記入枠30内の文字の外接矩形と文字記入枠30との接触を検出し、接触することが検出された場合には認識結果を表示して人手による確認・修正を行い、また、接触することが検出されなかった場合には、認識確度を算出して所定の閾値と比較し、認識確度が閾値以上であることが検出された場合には、そのままデータをシステムに入力するものである。
第2の実施形態の情報処理装置の構成は、図2に示す第1の実施の形態の情報処理装置2と同様である。すなわち、第2の実施の形態は、第1の実施の形態と同じ装置構成を用いているが、その動作において異なっているものである。
(第2の実施の形態の動作)
本発明の第2の実施の形態の情報処理装置2の動作を図7を参照して説明する。図7は、第2の実施の形態の情報処理装置2の動作の一例を示すフローチャートである。
まず、入力部24から帳票画像及び帳票定義情報が入力される(S200)。次に、記入枠位置抽出手段200は、帳票画像中の認識対象である入力文字列が記入されている実際の記入枠位置を抽出する(S201)。そして、文字認識手段201は、文字記入枠30内の文字列を認識する(S202)。次に外接矩形抽出手段204は、文字記入枠30内の認識対象である各文字の外接矩形を抽出する(S203)。ここまでは前述した第1の実施の形態と同様である。
本実施の形態では、次に、文字接触判定手段205により、文字と文字記入枠30との接触を検出する(S204)。
文字接触判定手段205によって文字と文字記入枠30との接触が検出された場合には(S204;Yes)、誤認識している可能性があるので、確認・修正のために認識結果が表示部26に表示される(S205)。操作者は、表示された認識結果を確認し、必要であれば認識文字列を修正するために、正しい文字列を入力部24から入力する。認識結果修正手段206は、操作者の修正入力を受けて認識文字列のデータを修正する(S206)。
また、文字接触判定手段205によって文字と文字記入枠30との接触が検出されなかった場合には(S204;No)、認識確度算出手段202は、文字認識手段201で認識された一文字あるいは文字列の認識確度Sを算出する(S207)。この認識確度の算出も前述した第1の実施の形態と同様である。
次に、算出された認識確度を所定の閾値と比較して、認識確度が所定の閾値以上であることを検出する(S208)。認識確度が閾値未満であり、閾値以上であることが検出されなかった場合には(S208;No)、誤認識である可能性が高いので、確認・修正のために認識結果が表示部26に表示される(S205)。そして認識結果の確認・修正が行われる(S206)。修正結果は、結果統合手段207において認識結果と統合される(S209)。
一方、認識確度が閾値以上であることが検出された場合には(S208;Yes)、結果統合手段207で結果を統合する(S209)。統合された結果は結果格納部223に格納される。そして最後に統合されたデータは外部I/F28を介して出力され、データベース3に登録される(S210)。
このように第2の実施の形態によれば、先に各文字の外接矩形を抽出して文字記入枠30との接触を検出し、接触していない場合にのみ認識確度を算出するようにすることで、認識文字列を、人手による確認修正作業が必要なデータと、人手による確認修正作業が不要なデータとに分割する作業をより効率的に行うことができる。
[第3の実施の形態]
本発明の第3の実施の形態は、前述した第1の実施の形態における認識確度と閾値との大小検出と、文字と文字記入枠30との接触の検出の処理を入力文字列の各一文字毎に行うようにするものである。
第3の実施の形態の情報処理装置の構成も前述した第1の実施の形態の情報処理装置2と同様である。ただ、本実施の形態では、情報処理装置2の各手段の動作の順序が第1の実施の形態と異なる。
(第3の実施の形態の動作)
本発明の第3の実施の形態の情報処理装置2の動作を図8を参照して説明する。図8は、第3の実施の形態の情報処理装置2の動作の一例を示すフローチャートである。
まず、入力部24から帳票画像及び帳票定義情報が入力される(S300)。次に、記入枠位置抽出手段200は、帳票画像中の認識対象である入力文字列が記入されている実際の記入枠位置を抽出する(S301)。そして、文字認識手段201は、文字記入枠30内の文字列を認識する(S302)。次に外接矩形抽出手段204は、文字記入枠30内の認識対象である各文字の外接矩形を抽出する(S303)。ここまでは前述した第1の実施の形態と同様である。
この後、認識確度算出及び認識確度と閾値との大小検出と、文字と文字記入枠30との接触の検出の処理を入力文字列の各一文字毎に行う。
まず、文字列の最初の文字について認識確度を算出する(S304)。文字列の最初の文字とは、文字記入枠30内に最初に記入された文字であり、例えば図4に示す例では、文字記入枠30の一番左に記入された文字「横」31aがこれにあたる。
この文字について認識確度を算出したら、認識確度判定手段203は、この算出された認識確度が所定の閾値以上であるかどうかを検出する(S305)。
ここで認識確度が閾値未満であり、閾値以上であることが検出されなかった場合には(S305;No)、この文字について誤認識である可能性が高いので、表示部26に認識結果を表示する(S307)。
一方、認識確度が閾値以上であることが検出された場合には(S305;Yes)、次に文字接触判定手段205は、この文字と文字記入枠30との接触を検出する(S306)。
この文字が文字記入枠30と接触していることが検出された場合には(S306;Yes)、この文字を含む文字列について誤認識の可能性が高いので、表示部26に認識結果を表示する(S307)。
また、この文字が文字記入枠30と接触していることが検出されなかった場合には(S306;No)、文字列内の次の文字の処理に進む。すなわち、認識された文字列内のすべての文字についての処理が終了したか否か判断する(S309)。
認識された文字列のすべての文字についての上記処理がまだ終了していない場合には(S309;No)、文字列の次の文字(例えば図4に示す例では、文字「横」31aの次の文字は「浜」31bとなる。)について認識確度を算出し(S304)、以下上記の処理を繰り返す。
一方、認識確度が閾値以上であることが検出されなかった場合、あるいは認識確度が閾値以上であることが検出されても外接矩形が文字記入枠30と接触していることが検出された場合に、表示部26に認識結果が表示されている場合には、認識結果の確認・修正が行われる(S308)。
このように、認識結果の確認・修正を行う際、ある文字について誤認識の可能性があることが検出された場合には、その文字以降の文字列内の文字について認識確度の判定あるいは文字記入枠30との接触判定は行われない。結局、少なくとも文字列中のある文字について誤認識が検出された認識文字列が表示部26に表示されるので、操作者はこれを見て確認及び修正を行う。
そして、認識文字列について確認・修正を行った場合、及び文字列内のすべての文字について処理が終了した場合、いずれの場合においても、次に結果統合手段207で結果を統合する(S310)。
統合された結果は結果格納部223に格納される。そして、統合結果は、外部I/F28を介してデータべース3に出力され登録される(S311)。
このように第3の実施の形態では、文字列の各文字について一文字毎に認識確度と閾値との大小検出及び文字と文字記入枠との接触の検出の処理を行うようにしている。これにより、文字列内のある文字について、認識確度が閾値未満であったり、文字が文字記入枠に接触している場合には、その文字以降については上記認識確度及び文字記入枠についての検出処理を行う必要がないので、データ入力作業をより効率的に行うことができる。
以上、本発明の実施の形態を説明して来たが、本発明は上記実施の形態には限定されず、本発明の趣旨を逸脱しない範囲で種々な変形が可能である。例えば、上記実施の形態では、情報処理プログラム220をCD−ROM等の記録媒体に記憶して提供するようにしてもよい。
また、制御部20を構成する各部は、それぞれ一部又は全部を再構成可能回路(FPGA:Field Programmable Gate Array)、特定用途向け集積回路(ASIC:Application Specific Integrated Circuit)等のハードウェア回路によって構成してもよい。
1…情報処理システム、2…情報処理装置、3…データベース、4…回線、20…制御部、
22…記憶部、24…入力部、26…表示部、28…外部I/F、30…文字記入枠、
31、31a〜31f…文字列、
32b、32c、32d、32e、32f…外接矩形、40…枠、
200…記入枠位置抽出手段、201…文字認識手段、202…認識確度算出手段、
203…認識確度判定手段、204…外接矩形抽出手段、205…文字接触判定手段、
206…認識結果修正手段、207…結果統合手段、220…情報処理プログラム、
221…帳票定義情報記憶部、222…住所データベース、223…結果格納部、

Claims (5)

  1. 入力画像中の文字記入枠の位置を抽出する第1の抽出手段と、
    前記文字記入枠内に記入された文字列を認識する認識手段と、
    前記認識手段の前記文字列の各文字に対する認識確度を算出する算出手段と、
    前記認識確度に基づく値が予め設定された閾値以上であることを検出する第1の検出手段と、
    前記文字列の各文字の外接矩形の前記入力画像中における位置を抽出する第2の抽出手段と、
    前記外接矩形が前記文字記入枠と接触することを検出する第2の検出手段と、
    前記第1の検出手段及び前記第2の検出手段の検出結果に基づいて、修正対象の前記文字列を表示する表示手段と、を備え
    前記第1の検出手段により前記認識確度に基づく値が前記閾値以上であることが検出されている場合において、前記第2の検出手段により前記文字列中のいずれかの文字について前記外接矩形が前記文字記入枠と接触することが検出されていないときは、前記表示手段は、修正対象の前記文字列を表示せずに、前記第2の検出手段により前記文字列中のいずれかの文字について前記外接矩形が前記文字記入枠と接触することが検出されたときは、前記表示手段は、修正対象の前記文字列を表示する情報処理装置。
  2. 前記第1の検出手段及び前記第2の検出手段は、前記各検出を前記文字列中の各一文字毎に順番に行い、前記文字についての認識確度が前記閾値以上であることが検出されなかった場合には、前記表示手段は、修正対象の前記文字列を表示する請求項に記載の情報処理装置。
  3. 前記第2の検出手段により、前記文字列中のいずれかの文字について前記外接矩形が前記文字記入枠と接触することが検出されたか否かに拘わらず、前記第1の検出手段により前記認識確度に基づく値が前記閾値以上であることが検出されなかった場合には、
    前記表示手段は、修正対象の前記文字列を表示する請求項1に記載の情報処理装置。
  4. 請求項1〜のいずれか1項に記載の情報処理装置と、
    前記入力画像中の文字列から前記情報処理装置で生成されたデータを登録するデータベースと、
    を備えた情報処理システム。
  5. コンピュータを、
    入力画像中の文字記入枠の位置を抽出する第1の抽出手段と、
    前記文字記入枠内に記入された文字列を認識する認識手段と、
    前記認識手段の前記文字列の各文字に対する認識確度を算出する算出手段と、
    前記認識確度に基づく値が予め設定された閾値以上であることを検出する第1の検出手段と、
    前記文字列の各文字の外接矩形の前記入力画像中における位置を抽出する第2の抽出手段と、
    前記外接矩形が前記文字記入枠と接触することを検出する第2の検出手段と、
    前記第1の検出手段及び前記第2の検出手段の検出結果に基づいて、修正対象の前記文字列を表示する表示手段として、機能させるプログラムであって、
    前記第1の検出手段により前記認識確度に基づく値が前記閾値以上であることが検出されている場合において、前記第2の検出手段により前記文字列中のいずれかの文字について前記外接矩形が前記文字記入枠と接触することが検出されていないときは、前記表示手段は、修正対象の前記文字列を表示せずに、前記第2の検出手段により前記文字列中のいずれかの文字について前記外接矩形が前記文字記入枠と接触することが検出されたときは、前記表示手段は、修正対象の前記文字列を表示するプログラム。
JP2017051773A 2017-03-16 2017-03-16 情報処理装置、情報処理システム及びプログラム Active JP6903966B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017051773A JP6903966B2 (ja) 2017-03-16 2017-03-16 情報処理装置、情報処理システム及びプログラム
US15/903,273 US10796143B2 (en) 2017-03-16 2018-02-23 Information processing apparatus, information processing system, and non-transitory computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017051773A JP6903966B2 (ja) 2017-03-16 2017-03-16 情報処理装置、情報処理システム及びプログラム

Publications (2)

Publication Number Publication Date
JP2018156308A JP2018156308A (ja) 2018-10-04
JP6903966B2 true JP6903966B2 (ja) 2021-07-14

Family

ID=63519418

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017051773A Active JP6903966B2 (ja) 2017-03-16 2017-03-16 情報処理装置、情報処理システム及びプログラム

Country Status (2)

Country Link
US (1) US10796143B2 (ja)
JP (1) JP6903966B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7263721B2 (ja) * 2018-09-25 2023-04-25 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
US11087187B2 (en) * 2019-02-26 2021-08-10 Logistimo India Private Limited System and method for improving recognition of characters
JP7243409B2 (ja) * 2019-04-17 2023-03-22 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP7520605B2 (ja) * 2020-07-06 2024-07-23 キヤノン株式会社 画像処理装置、画像処理方法、およびプログラム

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63268081A (ja) * 1987-04-17 1988-11-04 インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション 文書の文字を認識する方法及び装置
JP3258122B2 (ja) * 1993-03-31 2002-02-18 株式会社東芝 画像処理装置
JPH08137987A (ja) * 1994-11-14 1996-05-31 Oki Electric Ind Co Ltd 光学式文字読取装置
JP3345224B2 (ja) * 1995-03-06 2002-11-18 富士通株式会社 パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
JP3830998B2 (ja) * 1995-12-28 2006-10-11 株式会社東芝 罫線除去方法及びこれを用いた文字認識装置
US5915039A (en) * 1996-11-12 1999-06-22 International Business Machines Corporation Method and means for extracting fixed-pitch characters on noisy images with complex background prior to character recognition
US6226402B1 (en) * 1996-12-20 2001-05-01 Fujitsu Limited Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JP3411472B2 (ja) * 1997-05-30 2003-06-03 富士通株式会社 パターン抽出装置
JPH11338969A (ja) 1998-05-28 1999-12-10 Oki Electric Ind Co Ltd 光学式文字読取装置
JP2000163044A (ja) * 1998-11-30 2000-06-16 Sharp Corp 画像表示装置
WO2001093188A1 (fr) * 2000-06-02 2001-12-06 Japan Science And Technology Corporation Procede de traitement de document, support sur lequel est enregistre un programme de traitement de document et processeur de document
JP3904840B2 (ja) * 2000-08-15 2007-04-11 富士通株式会社 多値画像から罫線を抽出する罫線抽出装置
JP4834351B2 (ja) * 2005-08-22 2011-12-14 株式会社東芝 文字認識装置及び文字認識方法
JP4873138B2 (ja) * 2006-06-21 2012-02-08 富士ゼロックス株式会社 情報処理装置及びプログラム
JP4774390B2 (ja) * 2006-09-13 2011-09-14 株式会社キーエンス 文字切り出し装置、方法およびプログラム
JP5322517B2 (ja) * 2008-07-08 2013-10-23 キヤノン株式会社 画像処理装置および方法
WO2010055558A1 (ja) * 2008-11-12 2010-05-20 富士通株式会社 文字領域抽出装置,文字領域抽出機能を備えた撮像装置,および文字領域抽出プログラム
JP5357612B2 (ja) * 2009-04-13 2013-12-04 株式会社日立ソリューションズ 下線除去装置
JP5445062B2 (ja) 2009-11-24 2014-03-19 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
EP2682901A4 (en) * 2011-03-04 2014-09-03 Glory Kogyo Kk CUTTING PROCEDURE FOR TEXT ELEMENTS CUTTING DEVICE FOR TEXT ELEMENTS
JP5677139B2 (ja) * 2011-03-07 2015-02-25 三菱電機株式会社 帳票文字認識装置
JP2012194879A (ja) * 2011-03-17 2012-10-11 Pfu Ltd 情報処理装置、情報処理方法及びプログラム
JP5337194B2 (ja) * 2011-04-25 2013-11-06 シャープ株式会社 画像処理装置
JP5772442B2 (ja) 2011-09-22 2015-09-02 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP5547226B2 (ja) * 2012-03-16 2014-07-09 株式会社東芝 画像処理装置、及び画像処理方法
ITTO20121174A1 (it) * 2012-12-31 2014-07-01 Cts Electronics S P A Dispositivo e metodo di binarizzazione per documenti di pagamento o contabili
JP6255929B2 (ja) * 2013-11-15 2018-01-10 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理装置の制御方法、およびプログラム
JP2015148946A (ja) * 2014-02-06 2015-08-20 ソニー株式会社 情報処理装置、情報処理方法及びプログラム
US9639767B2 (en) * 2014-07-10 2017-05-02 Lenovo (Singapore) Pte. Ltd. Context-aware handwriting recognition for application input fields

Also Published As

Publication number Publication date
US20180268212A1 (en) 2018-09-20
JP2018156308A (ja) 2018-10-04
US10796143B2 (en) 2020-10-06

Similar Documents

Publication Publication Date Title
JP6903966B2 (ja) 情報処理装置、情報処理システム及びプログラム
US10740899B2 (en) Image processing apparatus for identifying region within image, information processing method, and storage medium
JP2014059875A (ja) 画像内のロゴの存在を検出する装置、及び方法
EP3416099A1 (en) Image processing apparatus, image processing method, and a program
JP2007081458A (ja) 画像処理装置および画像処理装置の制御方法
JP2013171310A (ja) 文字認識方法、およびこの方法を用いた文字認識装置およびプログラム
CN112036232A (zh) 一种图像表格结构识别方法、系统、终端以及存储介质
US10134138B2 (en) Information processing apparatus, computer-readable storage medium, information processing method
EP3291179B1 (en) Image processing device, image processing method, and image processing program
JP3487494B2 (ja) メニュー選択方法及び装置
CN108491843B (zh) 一种图像处理方法、装置及存储介质
JP2018005801A (ja) 画像処理装置
JP2008282327A (ja) 文字対称性判定方法及び文字対称性判定装置
JP7317886B2 (ja) 情報処理装置及び情報処理方法
JP2020052554A (ja) 情報処理装置、情報処理方法
CN110942068A (zh) 信息处理装置、存储介质及信息处理方法
JP6946676B2 (ja) 情報処理装置及びプログラム
JP7178445B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP4881722B2 (ja) 帳票識別装置、及び帳票識別プログラム
JP4810995B2 (ja) 画像処理装置、方法及びプログラム
KR20220168787A (ko) 만주어의 글자 추출 방법 및 이를 수행하는 시스템
JP4719491B2 (ja) オブジェクト抽出方法、オブジェクト抽出装置及びオブジェクト抽出プログラム
JP2021174370A (ja) 電子装置およびプログラム
CN114663641A (zh) 时间相依文字感兴趣区域的侦测方法
CN116109573A (zh) 光学字符验证方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210415

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20210415

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210525

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210607

R150 Certificate of patent or registration of utility model

Ref document number: 6903966

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150