JP7247496B2 - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP7247496B2
JP7247496B2 JP2018172599A JP2018172599A JP7247496B2 JP 7247496 B2 JP7247496 B2 JP 7247496B2 JP 2018172599 A JP2018172599 A JP 2018172599A JP 2018172599 A JP2018172599 A JP 2018172599A JP 7247496 B2 JP7247496 B2 JP 7247496B2
Authority
JP
Japan
Prior art keywords
image
entry
extraction area
area
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018172599A
Other languages
English (en)
Other versions
JP2020046734A (ja
Inventor
重和 笹川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2018172599A priority Critical patent/JP7247496B2/ja
Priority to US16/282,307 priority patent/US11200410B2/en
Priority to CN201910173102.6A priority patent/CN110909723B/zh
Publication of JP2020046734A publication Critical patent/JP2020046734A/ja
Application granted granted Critical
Publication of JP7247496B2 publication Critical patent/JP7247496B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

本発明は、情報処理装置及びプログラムに関する。
手書きで記入された文字や記号や図形等の情報に対して認識処理が行われ、作業者がその認識結果を訂正する場合がある。例えば、文字の認識結果やチェックボックスに記入された記号の認識結果等が、作業者によって訂正されることが考えられる。
特許文献1には、文字認識の結果に含まれる文字を、同一の文字カテゴリ毎にまとめて修正する装置が記載されている。
特許文献2には、文字認識処理による文字認識の確からしさを示す値に基づいて、手書き欄に加えて当該手書き欄の周辺領域を含む領域を表示対象に含めるか否かを制御する方法が記載されている。
特開6-36066号公報 特開2015-49653号公報
ところで、作業者が文字や記号や図形等の認識結果を訂正するために、作業者がすべての訂正箇所を探すとなると作業者の手間が増える。
本発明の目的は、記入領域に記入された情報に対する認識結果のすべての訂正箇所を作業者が探す場合と比較して、作業者の手間を減らすことにある。
請求項1に記載の発明は、記入者によって手書きで情報が記入される記入領域を含む抽出領域を表す抽出領域画像を受け付ける受付手段と、前記抽出領域画像に表された前記記入領域に記入されている情報に対する認識結果に対して訂正の指示が与えられた場合、前記抽出領域画像に類似する他の抽出領域画像を表示手段に表示させる制御手段と、を有し、前記制御手段は、前記記入領域が形成された文書を表す画像、及び、前記文書の画像の生成時間を基準として予め定められた時間内に生成された他の文書を表す画像から、前記他の抽出領域画像を検索して前記表示手段に表示させる、ことを特徴とする情報処理装置である。
請求項2に記載の発明は、前記記入領域は文書に形成された領域であり、前記制御手段は、前記記入者によって情報が記入された複数の文書を表す画像から前記他の抽出領域画像を検索して前記表示手段に表示させる、ことを特徴とする請求項1に記載の情報処理装置である。
請求項に記載の発明は、前記制御手段は、前記訂正の指示が与えられた場合、更に、前記他の抽出領域画像が表す他の記入領域に前記訂正を反映させる、ことを特徴とする請求項1又は請求項2に記載の情報処理装置である。
請求項に記載の発明は、前記制御手段は、前記他の記入領域に記入されている情報に対する認識結果の確信度に応じて、前記訂正を反映させる、ことを特徴とする請求項に記載の情報処理装置である。
請求項に記載の発明は、前記制御手段は、前記訂正の指示が与えられた場合、前記記入領域の属性に応じて、前記訂正を反映させる、ことを特徴とする請求項に記載の情報処理装置である。
請求項に記載の発明は、コンピュータを、記入者によって手書きで情報が記入される記入領域を含む抽出領域を表す抽出領域画像を受け付ける受付手段、前記抽出領域画像に表された前記記入領域に記入されている情報に対する認識結果に対して訂正の指示が与えられた場合、前記抽出領域画像に類似する他の抽出領域画像を表示手段に表示させる制御手段、として機能させ、前記制御手段は、前記記入領域が形成された文書を表す画像、及び、前記文書の画像の生成時間を基準として予め定められた時間内に生成された他の文書を表す画像から、前記他の抽出領域画像を検索して前記表示手段に表示させる、ことを特徴とするプログラムである。
請求項1,8に記載の発明によれば、記入領域に記入された情報に対する認識結果のすべての訂正箇所を作業者が探す場合と比較して、作業者の手間を減らすことができる。
請求項2に記載の発明によれば、同一の記入者によって情報が記入された複数の文書から検索された抽出領域画像が作業者に提示される。
請求項1,6に記載の発明によれば、文書の画像の生成時間を基準として検索された抽出領域画像が作業者に提示される。
請求項に記載の発明によれば、他の記入領域に記入された情報に対する認識結果を作業者が訂正する場合と比較して、作業者の手間を減らすことができる。
請求項に記載の発明によれば、認識結果の確信度を利用して認識結果を訂正することができる。
請求項に記載の発明によれば、記入領域の属性を利用して認識結果を訂正することができる。
本実施形態に係る情報処理システムを示す図である。 本実施形態に係る画像処理装置を示す図である。 端末装置を示す図である。 画像処理装置の動作に関するフローチャートを示す図である。 帳票を示す図である。 抽出領域を示す図である。 認識結果の表示例を示す図である。 認識結果の表示例を示す図である。 類似画像を示す図である。 類似画像を示す図である。 類似画像を示す図である。 認識結果の表示例を示す図である。 抽出領域設定画面を示す図である。
図1を参照して、本発明の実施形態に係る情報処理システムについて説明する。図1は、本実施形態に係る情報処理システムの一例としての画像処理システムを示す。
画像処理システムは、一例として、情報処理装置の一例としての画像処理装置10と、1又は複数の端末装置12を含む。画像処理装置10と端末装置12は、例えば、インターネット又は他のネットワーク等の通信経路Nを介して互いに通信する機能を有する。なお、サーバ等の装置が画像処理システムに含まれてもよい。
画像処理装置10は、画像データに認識処理(文字認識処理や図形認識処理)を適用することで、当該画像データから文字や記号や図形等を認識する装置である。認識処理として、例えば、OCR(Optical Character Recognition)処理やOMR(Optical Mark Recognition)処理が実行される。
認識対象となる画像データは特に限定されるものではない。例えば、画像読取装置(例えばスキャナ)によって文書に対して画像読取処理が行われ、その画像読取処理によって生成された画像データが、認識対象の画像データとして用いられてもよいし、撮像装置(例えばカメラ)によって文書が撮像されることで生成された画像データが、認識対象の画像データとして用いられてもよい。もちろん、これら以外の方法によって生成された画像データが、認識対象の画像データとして用いられてもよい。
端末装置12は、例えば、PC(パーソナルコンピュータ)、タブレットPC、スマートフォン、携帯電話等である。例えば、画像データの認識結果を示す情報が画像処理装置10から端末装置12に送られて、その認識結果が端末装置12に表示される。
以下、図2を参照して画像処理装置10について詳しく説明する。図2は、画像処理装置10の構成を示す。
画像受付部14は、画像データを受け付けて当該画像データを認識処理部16に出力するように構成されている。画像受付部14は、例えば、通信経路Nを介して外部装置から送られてきた画像データを受け付けてもよいし、画像読取装置や撮像装置から出力された画像データを受け付けてもよい。なお、画像読取装置や撮像装置は画像処理装置10に含まれてもよい。
認識処理部16は、画像受付部14が受け付けた画像データに対して認識処理(文字認識処理や図形認識処理)を適用することで、当該画像データから文字や記号や図形等の情報を認識するように構成されている。例えば、認識処理部16は、画像データにおいて、情報(文字や記号や図形等)が記入されると想定される記入領域(例えば、文字が記入される記入欄やチェックボックス等)を特定し、その記入領域に記入されている情報(文字や記号や図形等)を認識する。認識処理部16は、予め定められた領域を記入領域として認識してもよいし、予め定められた形状及び大きさを有する領域を記入領域として認識してもよい。例えば、記入領域内には記入者によって手書きで文字や記号や図形等が記入され、認識処理部16は、その記入領域内に手書きで記入された文字や記号や図形等を認識する。
また、認識処理部16は、記入領域を含む抽出領域を表す画像データ(以下、「抽出領域画像データ」と称する)を認識対象の画像データから抽出する。認識処理部16は、記入領域と、当該記入領域を含む抽出領域を表す抽出領域画像データとを互いに紐付ける。抽出領域は、例えば予め定められた領域である。ユーザ(例えば、画像データを画像処理装置10に入力した画像入力者や認識結果を確認及び訂正する訂正者等の作業者)によって抽出領域が定められてもよい。認識処理部16は、各記入領域に記入されている情報を認識し、また、記入領域毎の抽出領域画像データを抽出する。認識処理部16は、各認識結果を示す情報を確認訂正処理部20に出力し、各抽出領域画像データを類似度判定部18に出力する。
類似度判定部18は、認識処理部16が抽出した各抽出領域画像データ同士の類似度を計算する。類似度の計算として、例えば公知の技術が用いられる。例えば、画像同士の特徴点のマッチング、テンプレートを用いたマッチング、各画像のヒストグラムの比較等によって、類似度が計算される。もちろん、これら以外の手法によって類似度が計算されてもよい。
確認訂正処理部20は、認識処理部16による認識結果の訂正を行うように構成されている。例えば、確認訂正処理部20は、訂正者から訂正指示を受けると、その訂正指示に従って認識結果を訂正する。その訂正指示は、例えば端末装置12を用いて与えられる。また、確認訂正処理部20は、認識対象の画像データの表示や認識結果の表示等を行うように構成されている。例えば、認識対象の画像データや認識結果は、端末装置12に表示される。
また、確認訂正処理部20は、訂正対象の認識結果が得られた記入領域に紐付く抽出領域画像データを特定し、その抽出領域画像データに類似する抽出領域画像データの表示や訂正を行うように構成されている。例えば、確認訂正処理部20は、抽出領域画像データとの間の類似度が閾値以上となる抽出領域画像データを類似画像データとして特定し、その類似画像データの表示を行う。類似度の閾値は、例えば予め定められた値であり、訂正者等によって変更されてもよい。類似画像データは、例えば端末装置12に表示される。なお、確認訂正処理部20は、受付手段及び制御手段の一例に相当する。
また、確認訂正処理部20は、訂正対象の認識結果に対する訂正を、類似画像データが表す抽出領域に含まれる記入領域に対する認識結果に反映させてもよい。つまり、確認訂正処理部20は、類似画像データが表す抽出領域に含まれる記入領域に対する認識結果を、訂正対象の認識結果に対する訂正と同様に訂正してもよい。確認訂正処理部20は、訂正対象の認識結果に対する訂正の指示が訂正者によって与えられた場合に、類似画像データが表す抽出領域に含まれる記入領域に対する認識結果を同様に訂正してもよい(一括訂正)。また、確認訂正処理部20は、その訂正の指示が訂正者によって与えられた場合に、類似画像データの表示を行い、その後、訂正対象の類似画像データが訂正者によって選択されて、訂正を反映させる指示が訂正者によって与えられた場合に、訂正者によって選択された類似画像データが表す抽出領域に含まれる記入領域に対する認識結果を同様に訂正してもよい(個別訂正)。
出力部22は、確認訂正処理部20による処理が施された認識結果を示す情報を出力するように構成されている。出力部22は、例えば、訂正された認識結果を示す情報や、訂正されずに確認済みの認識結果を示す情報を出力する。例えば、これらの情報は端末装置12に表示されてもよいし、端末装置12やサーバ等に格納されてもよい。
領域設定部24は、抽出領域を設定するように構成されている。認識処理部16は、領域設定部24による設定に従って抽出領域画像データを抽出する。領域設定部24は、記入領域の種類(例えば文字の記入枠やチェックボックス等)に応じて抽出領域のサイズ(大きさ)を変えてもよい。例えば、領域設定部24は、記入領域を含み記入領域よりも大きい領域を抽出領域として設定する。記入領域のサイズに対する抽出領域のサイズの割合(比率)は、予め定められてもよいし、訂正者等によって設定されてもよい。また、その割合は訂正者等によって変更されてもよい。なお、領域設定部24は、記入領域よりも狭い領域を抽出領域として設定してもよい。もちろん、訂正者等によって、抽出領域のサイズが任意のサイズに設定されてもよい。例えば、文字の記入枠については、その記入枠よりも狭い領域が抽出領域として設定されてもよい。
以下、図3を参照して端末装置12について詳しく説明する。図3は、端末装置12の構成を示す。
通信部26は通信インターフェースであり、情報を他の装置に送信する機能、及び、他の装置から送信されてきた情報を受信する機能を有する。通信部26は、無線通信機能を有していてもよいし、有線通信機能を有していてもよい。
UI部28はユーザインターフェースであり、表示部と操作部とを含む。表示部は、液晶ディスプレイやELディスプレイ等の表示装置である。操作部は、キーボード等の入力装置である。また、表示部と操作部とを兼ね備えたユーザインターフェース(例えばタッチパネル等)が、UI部28として用いられてもよい。また、UI部28は、音を発生させるスピーカ等の音声発生部や、音声の入力を受けるマイク等の音声入力部等を含んでもよい。
例えば、認識対象の画像データ、認識結果を示す情報、抽出領域画像データ、類似画像データ等が、UI部28の表示部に表示される。また、訂正者は、UI部28を操作することで、認識結果の訂正指示を与えてもよい。
記憶部30は、各種の情報(データやプログラム等)を格納する1又は複数の格納領域であり、1又は複数の記憶装置(例えばハードディスクドライブやメモリ等)によって構成される。
制御部32は、端末装置12の各部の動作を制御するように構成されている。例えば、制御部32は、通信部26による通信の制御、UI部28(表示部)への各種情報の表示制御、UI部28(操作部)を介して入力された情報の受付制御、等を行う。具体的には、制御部32は、認識対象の画像データ、認識結果を示す情報、抽出領域画像データ、類似画像データ等をUI部28の表示部に表示させる。
なお、図1に示す例では、画像処理装置10と端末装置12とが別々のハードウェアとして構成されているが、画像処理装置10に端末装置12が組み込まれてもよい。つまり、画像処理装置10は、端末装置12が有する構成(例えばUI部28等)を有していてもよい。この場合、認識対象の画像データや認識結果を示す情報等は、画像処理装置10に設けられた表示部に表示されてもよい。また、訂正者は画像処理装置10に設けられたUI部を操作することで認識結果を訂正してもよい。
以下、図4を参照して画像処理装置10の動作について説明する。図4は、当該動作に関するフローチャートを示す。
まず、認識対象の画像データが画像処理装置10に入力され、画像受付部14は、画像データを受け付ける(ステップS01)。
次に、認識処理部16は、画像データにおいて記入領域を特定し、その記入領域内に記入されている文字や記号や図形等を認識し、更に、記入領域毎に抽出領域を表す抽出領域画像データを抽出する(ステップS02)。
次に、類似度判定部18は、認識処理部16が抽出した各抽出領域画像データ同士の類似度を計算する(ステップS03)。
次に、確認訂正処理部20は、認識対象の画像データの表示や認識結果の表示等を行う(ステップS04)。例えば、認識対象の画像データや認識結果を示す情報が、画像処理装置10から端末装置12に送信され、端末装置12の制御部32は、これらの情報をUI部28の表示部に表示させる。
訂正者は、端末装置12に表示された認識結果を確認し、その認識結果を訂正する必要がある場合には端末装置12を操作して訂正指示を与える。その訂正指示を示す情報は、端末装置12から画像処理装置10に送信され、確認訂正処理部20は、その訂正指示を受け付けて、訂正対象の認識結果をその訂正指示に従って訂正する(ステップS05)。
次に、確認訂正処理部20は、訂正対象の認識結果が得られた記入領域に紐付く抽出領域画像データを特定し、その抽出領域画像データに類似する類似画像データ(その抽出領域画像データとの間の類似度が閾値以上となる類似画像データ)を検索する(ステップS06)。
類似画像データが検索された場合(ステップS07,Yes)、確認訂正処理部20は、類似画像データの表示を行う(ステップS08)。例えば、類似画像データが画像処理装置10から端末装置12に送信され、端末装置12の制御部32は、類似画像データをUI部28の表示部に表示させる。
次に、確認訂正処理部20は、ステップS05にて訂正者によって指示された訂正を、類似画像データが表す抽出領域に含まれる記入領域に対する認識結果に反映させる(ステップS09)。つまり、確認訂正処理部20は、類似画像データが表す抽出領域に含まれる記入領域に対する認識結果を、訂正対象の認識結果に対する訂正と同様に訂正する。確認訂正処理部20は、訂正者が訂正指示を与えた場合に訂正してもよいし、自動的に訂正してもよい。
類似画像データが検索されない場合(ステップS07,No)、処理はステップS10に移行する。
認識結果に対する確認訂正が終了しない場合(ステップS10,No)、処理はステップS04に戻り、それ以降の処理が実行される。
認識結果に対する確認訂正が終了した場合(ステップS10,Yes)、出力部22は、確認済みの認識結果を示す情報(訂正された場合には訂正後の認識結果を示す情報)を出力する(ステップS11)。例えば、これらの情報は端末装置12に格納や表示されてもよいし、サーバ等の外部装置に格納されてもよい。
以下、具体例を挙げて画像処理装置10の動作について更に詳しく説明する。以下では、「画像データ」を「画像」と称し、「抽出領域画像データ」を「抽出領域画像」と称し、「類似画像データ」を「類似画像」と称することとする。
図5を参照して、認識対象の画像について説明する。ここでは、一例として、文書を表す画像(文書画像)が認識対象の画像として用いられるものとする。具体的には、帳票を表す文書画像が認識対象の画像として用いられる。図5は、その帳票の一例を示す。帳票33は、ある手続きを行うための文書である。
帳票33には、記入者によって手書きで情報(文字や記号や図形等)が記入される記入欄が形成(例えば印刷)されている。例えば、児童1の氏名が記入される氏名記入欄34、児童1の続柄が記入される続柄記入欄36、児童1の生年月日が記入される生年月日記入欄38、及び、住所に関して図形(例えばチェックマーク)が記入されるチェックボックス40が、帳票33に予め形成されている。児童2に関しても同様に、氏名記入欄42、続柄記入欄44、生年月日記入欄46及びチェックボックス48が、帳票33に予め形成されている。児童3,4等についても同様である。これらの記入欄及びチェックボックスが、記入領域の一例に相当する。
図5に示す例では、児童1~4について、記入者による手書きによって、氏名記入欄、続柄記入欄及び生年月日記入欄のそれぞれに、児童の氏名を表す文字列、続柄を表す文字列及び生年月日を表す文字列が記入されている。
また、児童1についてのチェックボックス40からはみ出るようにチェックマーク54が記入されている。つまり、チェックマーク54の一部がチェックボックス40内に記入されているが、その他の部分がチェックボックス40の外側に記入されている。児童2についてのチェックボックス48に記入されたチェックマーク56、及び、児童4についてのチェックボックス52に記入されたチェックマーク58についても同様である。児童3についてのチェックボックス50はチェックされていない。
例えば、帳票が画像読取装置(例えばスキャナ)によって読み取られることで、帳票33を表す画像(以下、「帳票画像」と称する)が生成される。帳票が撮像装置(例えばカメラ)によって撮像されることで帳票画像が生成されてもよい。
帳票画像が画像処理装置10に入力されて画像受付部14によって受け付けられて、認識処理が行われる。
認識処理部16は、例えば、帳票画像に表されている各記入欄に文字認識処理を適用することで、各記入欄内に記入されている文字を認識し、各チェックボックスに図形認識処理を適用することで、各チェックボックス内に記入されている図形(チェックマーク)を認識する。例えば、例えば、氏名記入欄等の記入欄やチェックボックス等が、認識対象の記入領域として画像入力者や訂正者等によって予め指定されており、認識処理部16は、このようにして指定された各入力欄や各チェックボックスを対象として認識処理を実行する。
もちろん、認識処理部16は、上記以外の認識技術として公知の認識技術を用いることで、文字や図形等を認識してもよい。認識処理部16は、例えば、帳票画像において矩形状の領域(直線状の枠線で囲まれた長方形や正方形の領域等)を記入欄又はチェックボックスとして認識し、その記入欄又はチェックボックスに記入されている文字や図形を認識する。例えば、氏名記入欄34やチェックボックス40等は矩形状の領域を有し、認識処理部16は、氏名記入欄34内に記入されている文字を認識し、チェックボックス40内に記入されているチェックマークを認識する。その他の氏名記入欄やチェックボックス等についても同様である。もちろん、認識処理部16は、矩形状以外の形状を有する領域(例えば円形状や楕円形状等の形状を有する領域や括弧で囲まれた領域等)を記入領域として認識し、その領域内に記入されている文字や図形等を認識してもよい。また、帳票画像上における各記入欄や各チェックボックスの位置(座標)が予め定められていてもよい。この場合、認識処理部16は、各記入欄や各チェックボックスの座標に基づいて帳票画像上の各記入欄や各チェックボックスの位置を特定し、各記入欄内や各チェックボックス内に記入された文字や図形等を認識する。
また、認識処理部16は、帳票画像から、記入欄毎に記入欄を含む抽出領域を表す抽出領域画像を抽出し、チェックボックス毎にチェックボックスを含む抽出領域を表す抽出領域画像を抽出する。
ここで、図6を参照して、チェックボックス40に対する抽出領域について説明する。図6は、その抽出領域の一例を示す。抽出領域60は、チェックボックス40に対して設定された領域であって、チェックボックス40とその周辺の領域を含む領域である。例えば、チェックボックス40よりも数%~数十%程度大きい領域が抽出領域60として設定される。抽出領域60は、チェックボックス40と相似形の形状を有する領域であってもよいし、チェックボックス40とは異なる形状を有する領域であってもよい。抽出領域60の大きさや形状は、予め定められてもよいし、訂正者等によって定められてもよい。例えば、記入領域からはみ出して文字や図形等が記入されることが想定される場合、そのはみ出しが想定される領域を含むように抽出領域が設定される。
チェックボックス40に対する抽出領域として抽出領域60が設定されると、認識処理部16は、その抽出領域60を表す画像を抽出領域画像として帳票画像から抽出する。図6に示す例では、抽出領域60内にチェックボックス40とチェックマーク54が表されているため、認識処理部16は、チェックボックス40とチェックマーク54とを表す抽出領域画像を帳票画像から抽出する。
認識処理部16は、氏名記入欄34や続柄記入欄36等についても抽出領域60と同様に抽出領域画像を帳票画像から抽出する。
類似度判定部18は、認識処理部16によって抽出された各抽出領域画像同士の類似度を計算する。例えば、類似度判定部18は、チェックボックス40とチェックマーク54とを表す抽出領域画像と、他の抽出領域画像(例えば、チェックボックス48とチェックマーク56とを表す抽出領域画像や、氏名記入欄についての抽出領域画像等)との間の類似度を計算する。他のチェックボックスや氏名記入欄や続柄記入欄や生年月日記入欄についての抽出領域画像についても同様である。
上記のようにして認識処理が行われると、その認識結果が端末装置12に表示される。以下、図7を参照して認識結果の表示例について説明する。図7は、認識結果が表示される画面の一例を示す。
画面62には認識結果が表示される。例えば、画面62の情報が画像処理装置10から端末装置12に送信され、端末装置12のUI部28に画面62が表示される。
図7に示す例では、画面62には、帳票33を表す帳票画像64と、認識結果の表示欄66とが表示される。表示欄66には、帳票画像64において認識処理の対象となった画像(例えばスキャンによって生成されたスキャン画像)と、その画像に対する認識処理の結果を示す情報とが表示される。
画像68は、氏名記入欄34を表す画像であって、氏名記入欄34に手書きで記入された文字列そのものを表す画像である。画像68として、氏名記入欄34とその周辺とを表す抽出領域画像が表示されてもよい。認識結果70は、氏名記入欄34に対して文字認識処理を適用することで認識された結果である。ここでは、認識結果70として文字列(例えば文字列「富士みなと」)が表示されている。
また、画像72は、チェックボックス40とその周辺とを表す画像であって、チェックボックス40及びその周辺に対して手書きで記入されたチェックマークそのものを表す画像である。ここでは、チェックボックス40からはみ出して手書きで記入されたチェックマークそのものが表示されている。画像72として、チェックボックス40とその周辺とを表す抽出領域画像(図6中の抽出領域60を表す画像)が表示されてもよい。認識結果74は、チェックボックス40に対して図形認識処理を適用することで認識された結果である。ここでは、チェックマークがチェックボックス40からはみ出して記入されており、チェックボックス40内に記入されたチェックマークの面積の割合が、チェックボックス40内に記入された図形をチェックマークとして認識する程度の面積の割合に至っていない。そのため、チェックボックス40に対してチェックマークは記入されていないと認識されており(チェックがオフであると認識されており)、認識結果74として空欄のチェックボックスが表示されている。
その他の記入欄やチェックボックス等についても同様に、画像と認識結果が表示される。
上記のように、実際はチェックボックス40に対してチェックマークが記入されているにも関わらず、そのチェックマークの記入位置によっては、チェックマークが記入されていないと認識される場合がある。例えば、記入者の記入の癖等に起因して、チェックマークが記入されていないと認識される場合がある。
また、帳票33に折り目が形成されている場合、その折り目が線として誤認識されることがある。例えば、折り目がチェックボックスを跨いで形成されている場合、そのチェックボックスにチェックマークが記入されていないにも関わらず、その折り目がチェックマークとして認識され、そのチェックボックスにチェックマークが記入されていると誤認識される場合がある。文字の記入欄等についても同様である。このように、記入者の癖や、帳票33の状態(例えば折り目やゴミの付着等)に起因して、文字や記号や図形等の誤認識が発生する場合がある。
訂正者は、端末装置12のUI部28を操作することで、画面62上で認識結果を訂正することができる。例えば、訂正者は、認識結果としての文字列を訂正してもよいし、認識結果としての空欄のチェックボックスにチェックマークを追加してもよいし、チェックマークが認識されたチェックボックスからチェックマークを削除してもよい。訂正者によって訂正指示が与えられると、その訂正指示を示す情報が、端末装置12から画像処理装置10に送信され、確認訂正処理部20は、その訂正指示に従って認識結果を訂正する。
例えば、訂正者が画面62上で認識結果74として表示されている空欄のチェックボックスにチェックマークを追加した場合、確認訂正処理部20は、チェックボックス40に対するチェックマークの有無に関する認識結果を、チェックマーク無し(チェックがオフ)からチェックマーク有り(チェックがオン)に訂正する。図8は、その訂正の結果を示す。訂正者によって、認識結果74として表示されているチェックボックスにチェックマークが追加されており、これにより、確認訂正処理部20は、チェックボックス40に対するチェックマークの有無に関する認識結果を、チェックマーク無しからチェックマーク有りに訂正する。
また、確認訂正処理部20は、訂正対象となった認識結果74が得られたチェックボックス40に紐付く抽出領域画像(図6中の抽出領域60を表す画像)に類似する類似画像を検索する。そして、確認訂正処理部20は、その類似画像が表す抽出領域に含まれる記入領域(例えばチェックボックス)に対する認識結果を、訂正対象の認識結果74に対する訂正と同様に訂正する(一括訂正)。つまり、訂正対象の認識結果74に対する訂正の指示が与えられた場合、類似画像に紐付く記入領域に対する認識結果も一括して訂正される。
例えば、チェックボックス48に紐付く抽出領域画像(チェックボックス48とその周辺とを表す画像)と、チェックボックス52に紐付く抽出領域画像(チェックボックス52とその周辺とを表す画像)が、チェックボックス40に紐付く抽出領域画像と類似するものとする。つまり、チェックボックス48に紐付く抽出領域画像及びチェックボックス52に紐付く抽出領域画像のそれぞれについて、チェックボックス40に紐付く抽出領域画像との間の類似度が閾値以上である。チェックボックス48に紐付く抽出領域画像には、チェックボックス48と、そのチェックボックス48からはみ出して記入されたチェックマーク56とが表されている。チェックボックス52に紐付く抽出領域画像には、チェックボックス52と、そのチェックボックス52からはみ出してチェックマーク58とが表されている。
この場合、確認訂正処理部20は、チェックボックス48,52のそれぞれに対するチェックマークの有無に関する認識結果を、訂正対象のチェックボックス40に対する訂正と同様に訂正する(一括訂正)。例えば、チェックボックス48,52のそれぞれにおいてチェックマークが認識されていない場合(チェックがオフの場合)、確認訂正処理部20は、チェックボックス48,52のそれぞれに対するチェックマークの有無に関する認識結果を、チェックマーク無しからチェックマーク有りに訂正する(一括訂正)。
確認訂正処理部20は、例えば、訂正者がチェックボックス40に対する認識結果を訂正した場合に、その訂正の指示に応じて、チェックボックス48,52のそれぞれに対する認識結果を訂正してもよいし、チェックボックス40に対する認識結果の訂正指示に加えて、チェックボックス48,52のそれぞれへの訂正の反映を訂正者が指示した場合に、チェックボックス48,52のそれぞれに対する認識結果を訂正してもよい。
確認訂正処理部20は、訂正結果を帳票画像64の表示に反映させてもよい。例えば、確認訂正処理部20は、帳票画像64において、訂正が行われた記入領域に記入された文字や図形等を表す記入画像を強調表示(例えばハイライト表示、他の部分とは異なる色(例えば赤色等)で表示等)する。この場合において、確認訂正処理部20は、類似画像に紐付く記入領域であって訂正が反映された記入領域に記入された文字や図形等を表す記入画像を強調表示してもよい。例えば、チェックボックス48,52のそれぞれに対してチェックボックス40と同じ訂正が反映されているため、図8に示す例では、確認訂正処理部20は、チェックマーク56を表すチェックマーク画像76と、チェックマーク58を表すチェックマーク画像78とを強調表示している。チェックマーク画像76,78は記入画像の一例である。例えば、確認訂正処理部20は、文字や記号や図形等が記入される前の帳票画像と、記入後の帳票画像との間の差分を算出することで、記入された文字や記号や図形等を抽出する。そして、確認訂正処理部20は、訂正が行われた文字等を表す記入画像を強調表示する。なお、確認訂正処理部20は、訂正の対象となったチェックマーク54を表すチェックマーク画像を強調表示してもよい。
以上のように、訂正対象の認識結果が訂正者によって訂正された場合、類似画像に紐付く記入領域に対する認識結果も同様に訂正される。それ故、訂正者がマニュアル操作で類似画像を探して訂正する場合と比較して、訂正者の手間が軽減される。
また、確認訂正処理部20は、類似画像を表示してもよい。例えば、訂正者が画面62上で認識結果に対する訂正を指示した場合に、確認訂正処理部20は、その訂正の対象となった認識結果が得られた記入領域に紐付く抽出領域画像に類似する類似画像を検索し、その類似画像を表示する。
具体例を挙げて説明すると、訂正者が画面62上で認識結果74として表示されている空欄のチェックボックスにチェックマークを追加した場合、確認訂正処理部20は、チェックボックス40に紐付く抽出領域画像(図6中の抽出領域60を表す画像)に類似する類似画像を表示する。
図9を参照して類似画像の表示例について説明する。図9は、類似画像の表示領域(表示ウィンドウ)の一例を示す。表示ウィンドウ80内には、チェックボックス40に紐付く抽出領域画像に類似する類似画像が表示されている。表示ウィンドウ80の情報は画像処理装置10から端末装置12に送信されて、表示ウィンドウ80が端末装置12のUI部28に表示される。画面62がUI部28に表示されている状態で、表示ウィンドウ80がポップアップ形式で表示されてもよい。例えば、訂正者が画面62上で認識結果74として表示されている空欄のチェックボックスにチェックマークを追加した場合(つまり、認識結果74に対する訂正を指示した場合)、確認訂正処理部20は、表示ウィンドウ80をUI部28に表示させる。チェックボックス40に紐付く抽出領域画像との間の類似度を示す情報が、各類似画像に紐付けて表示されている。
例えば、表示ウィンドウ80内には、抽出領域画像82,84,86が類似画像として表示されている。チェックボックス40に紐付く抽出領域画像と抽出領域画像82,84,86との間の類似度はそれぞれ、90%、85%、50%である。類似度が高い画像ほど、チェックボックス40に紐付く抽出領域画像に似ている画像であるといえる。確認訂正処理部20は、類似度順に抽出領域画像を並べて表示してもよい。図9に示す例では、類似度が高い抽出領域画像ほど上方に表示されている。
例えば、抽出領域画像82は、チェックボックス48とその周辺(チェックマーク56)とを表す画像であり、抽出領域画像84は、チェックボックス52とその周辺(チェックマーク58)とを表す画像であり、抽出領域画像86は、チェックボックス50とその周辺とを表す画像であるものとする。また、チェックボックス48,50,52からチェックマークが認識されていないものとする。
訂正者が、端末装置12を操作することで、抽出領域画像82,84,86の中から訂正を反映させる抽出領域画像を選択して訂正を指示した場合(例えばOKボタンを押した場合)、確認訂正処理部20は、チェックボックス40についての認識結果74に対する訂正を、選択された抽出領域画像に紐付くチェックボックスに対する認識結果に反映させる。つまり、確認訂正処理部20は、選択された抽出領域画像に紐付くチェックボックスに対するチェックマークの有無に関する認識結果を、チェックマーク無しからチェックマーク有りに訂正する。例えば、抽出領域画像82,84が訂正対象として訂正者によって選択されて訂正の指示が与えられた場合、確認訂正処理部20は、抽出領域画像82に紐付くチェックボックス48に対するチェックマークの有無に関する認識結果を、チェックマーク無しからチェックマーク有りに訂正する。抽出領域画像84に紐付くチェックボックス52に対する認識結果についても同様である。
上記の例では、チェックボックスに対する認識結果を訂正しているが、文字列が記入される記入欄(例えば氏名記入欄や生年月日記入欄等)についても同様に、ある記入欄に対する認識結果が訂正された場合、類似画像が表示される。また、類似画像に紐付く記入欄に対する認識結果が一括訂正されてもよい。
上記のように、訂正対象の認識結果に対する訂正の指示が訂正者によって与えられた場合に、類似画像が表示される。それ故、訂正者がマニュアル操作で類似画像を探す場合と比べて、訂正者の手間が軽減される。
上記の例では、確認訂正処理部20は、同一の文書画像(帳票画像)内を対象として類似画像を検索しているが、別の文書画像を対象として類似画像を検索してもよい。例えば、確認訂正処理部20は、同一の記入者によって文字等が記入された他の文書を表す他の文書画像から類似画像を検索してもよいし、同一の種類の文書を表す文書画像から類似画像を検索してもよい。
例えば、画像受付部14は、文書画像と、当該文書画像が表す文書の種類を示す種類情報と、当該文書に文字等を記入した記入者を識別するための記入者識別情報とを受け付け、文書画像と種類情報と記入者識別情報とを互いに対応付けて記憶装置(図示しない)に記憶させる。記憶装置は、画像処理装置10に設けられていてもよいし、サーバ等の外部装置に設けられていてもよい。画像受付部14は、文書画像と種類情報と記入者識別情報とを受け付ける度に、文書画像と種類情報と記入者識別情報とを互いに対応付けて記憶装置に記憶させる。文書の種類としては、例えば、ある手続きを行うための帳票、報告書、稟議書、上申書、議事録、案内書等が挙げられる。記入者識別情報は、例えば、記入者の氏名やID等を示す情報である。例えば、記入者や他の作業者が、図示しない端末装置を用いて種類情報と記入者識別情報を入力し、画像受付部14は、その種類情報と記入者識別情報を受け付ける。もちろん、文書画像に予め種類情報と記入者識別情報とが紐付けられていてもよい。文書画像に記入者識別情報を対応付けておくことで、同一の記入者によって記入された文書を表す文書画像が特定される。また、文書画像に種類情報を対応付けておくことで、同一の種類の文書を表す文書画像が特定される。文書画像には、種類情報と記入者識別情報の両方が対応付けられていてもよいし、種類情報又は記入者識別情報のいずれか一方の情報が対応付けられていてもよい。
以下、図10を参照して、同一種類の文書を表す文書画像から類似画像を検索する処理について説明する。図10は、類似画像の表示ウィンドウの一例を示す。例えば、訂正者が、図7に示されている画面62上で、認識結果74として表示されている空欄のチェックボックスにチェックマークを追加した場合(つまり、認識結果74を訂正した場合)、確認訂正処理部20は、表示ウィンドウ88をUI部28に表示させる。表示ウィンドウ88内には、チェックボックス40に紐付く抽出領域画像に類似する類似画像が表示されている。表示ウィンドウ88の情報は画像処理装置10から端末装置12に送信されて、表示ウィンドウ88が端末装置12のUI部28に表示される。画面62がUI部28に表示されている状態で、表示ウィンドウ88がポップアップ形式で表示されてもよい。チェックボックス40に紐付く抽出領域画像との間の類似度を示す情報が、各類似画像に紐付けて表示されている。
例えば、表示ウィンドウ88内には、抽出領域画像90,92,94が類似画像として表示されている。チェックボックス40に紐付く抽出領域画像と抽出領域画像90,92,94との間の類似度はそれぞれ、90%、85%、50%である。類似度が高い画像ほど、チェックボックス40に紐付く抽出領域画像に似ている画像であるといえる。確認訂正処理部20は、類似度順に抽出領域画像を並べて表示してもよい。図10に示す例では、類似度が高い抽出領域画像ほど上方に表示されている。
ここでは、確認訂正処理部20は、帳票33(確認対象の文書画像が表す文書)と同一種類の帳票を表す帳票画像から類似画像を検索している。例えば、文書「帳票1」は、記入者「富士太郎」によって文字等が記入された文書であって、帳票33と同一種類の文書である。ここでは、文書「帳票1」は帳票33のことである。抽出領域画像90は、「帳票1」を表す帳票画像から検索された類似画像である。文書「帳票2」は、記入者「富士太郎」によって文字等が記入された文書であって、帳票33と同一種類の文書である。文書「帳票2」は帳票33とは異なる文書である。抽出領域画像92は、「帳票2」を表す帳票画像から検索された類似画像である。文書「帳票3」は、記入者「富士花子」によって文字等が記入された文書であって、帳票33と同一種類の文書である。文書「帳票3」は帳票33とは異なる文書である。抽出領域画像94は、「帳票3」を表す帳票画像から検索された類似画像である。表示ウィンドウ88内には、記入者名を示す情報と、帳票名を示す情報と、類似画像とが互いに対応付けられて表示されている。抽出領域画像90,92,94はそれぞれ、チェックボックスとその周辺とを表す画像である。また、抽出領域画像90,92,94のそれぞれに紐付くチェックボックスからチェックマークが認識されていないものとする。
訂正者が、端末装置12を操作することで、抽出領域画像90,92,94の中から訂正を反映させる抽出領域画像を選択して訂正を指示した場合(例えばOKボタンを押した場合)、確認訂正処理部20は、チェックボックス40についての認識結果74に対する訂正を、選択された抽出領域画像に紐付くチェックボックスに対する認識結果に反映させる。つまり、確認訂正処理部20は、選択された抽出領域画像に紐付くチェックボックスに対するチェックマークの有無に関する認識結果を、チェックマーク無しからチェックマーク有りに訂正する。例えば、抽出領域画像90,92が訂正対象として訂正者によって選択されて訂正の指示が与えられた場合、確認訂正処理部20は、抽出領域画像90に紐付くチェックボックスに対するチェックマークの有無に関する認識結果を、チェックマーク無しからチェックマーク有りに訂正する。抽出領域画像92に紐付くチェックボックスに対する認識結果についても同様である。
以上のように、訂正対象の文書と同一種類の文書を表す文書画像から類似画像を検索して表示することで、訂正者がマニュアル操作でその類似画像を探す場合と比較して、訂正者の手間が軽減される。例えば、同一種類の文書であれば誤認識の傾向が似ている場合があるので、同一種類の文書を表す文書画像から検索された類似画像を表示することで、そのような傾向を有する類似画像が訂正者に提示される。
以下、図11を参照して、同一の記入者によって文字等が記入された文書を表す文書画像から類似画像を検索する処理について説明する。図11は、類似画像の表示ウィンドウの一例を示す。例えば、訂正者が、図7に示されている画面62上で、認識結果74として表示されている空欄のチェックボックスにチェックマークを追加した場合(つまり、認識結果74を訂正した場合)、確認訂正処理部20は、表示ウィンドウ96をUI部28に表示させる。表示ウィンドウ96内には、チェックボックス40に紐付く抽出領域画像に類似する類似画像が表示されている。表示ウィンドウ96の情報は画像処理装置10から端末装置12に送信されて、表示ウィンドウ96が端末装置12のUI部28に表示される。画面62がUI部28に表示されている状態で、表示ウィンドウ96がポップアップ形式で表示されてもよい。チェックボックス40に紐付く抽出領域画像との間の類似度を示す情報が、各類似画像に紐付けて表示されている。
例えば、表示ウィンドウ96内には、抽出領域画像90,92,98が類似画像として表示されている。チェックボックス40に紐付く抽出領域画像と抽出領域画像90,92,98との間の類似度はそれぞれ、90%、85%、50%である。類似度が高い画像ほど、チェックボックス40に紐付く抽出領域画像に似ている画像であるといえる。確認訂正処理部20は、類似度順に抽出領域画像を並べて表示してもよい。図11に示す例では、類似度が高い抽出領域画像ほど上方に表示されている。
ここでは、確認訂正処理部20は、帳票33(確認対象の文書画像が表す文書)に文字等を記入した記入者「富士太郎」によって文字等が記入された帳票を表す帳票画像から類似画像を検索している。例えば、図10に示す例と同様に、文書「帳票1」と「帳票2」は、記入者「富士太郎」によって文字等が記入された文書である。文書「契約書1」は、記入者「富士太郎」によって文字等が記入された文書である。文書「契約書1」は、帳票33とは異なる種類の文書であるが、帳票33に文字等を記入した「富士太郎」によって文字等が記入された文書である。抽出領域画像98は、「契約書1」を表す文書画像(契約書画像)から検索された類似画像である。表示ウィンドウ96内には、記入者名を示す情報と、帳票名を示す情報と、類似画像とが互いに対応付けられて表示されている。記入者名や書類名によって類似画像のフィルタリングを行ってもよい。抽出領域画像90,92,98はそれぞれ、チェックボックスとその周辺とを表す画像である。また、抽出領域画像90,92,98のそれぞれに紐付くチェックボックスからチェックマークが認識されていないものとする。
図9及び図10に示す例と同様に、抽出領域画像90,92,98から訂正者によって抽出領域画像が選択されて訂正が指示された場合、チェックボックス40についての認識結果74に対する訂正が、選択された抽出領域画像に紐付くチェックボックスに対する認識結果に反映される。
以上のように、同一の記入者によって文字等が記入された文書を表す文書画像から類似画像を検索して表示することで、訂正者がマニュアル操作でその類似画像を探す場合と比較して、訂正者の手間が軽減される。例えば、同一の記入者であれば、他の文書画像においてもその記入者の癖によって同じような誤認識が発生する場合があるので、同一記入者によって文字等が記入された文書を表す文書画像から検索された類似画像を表示することで、そのような誤認識が発生し得る類似画像が訂正者に提示される。
確認訂正処理部20は、同一種類の文書であって同一の記入者によって文字等が記入された文書を表す文書画像から類似画像を検索してもよい。この場合、図10及び図11に示す例では、確認訂正処理部20は、記入者「富士太郎」によって文字等が記入された文書「帳票1」と「帳票2」のそれぞれを表す帳票画像から類似画像を検索する。その結果、抽出領域画像90,92が検索されて表示ウィンドウ内に表示され、抽出領域画像94,98は表示されない。
なお、記憶装置に記憶されている文書画像の一覧が端末装置12のUI部28に表示され、訂正者によって確認対象の文書画像が指定されると、当該文書画像がUI部28に表示されて、当該文書画像に対する認識結果の確認や訂正が行われてもよい。
また、確認訂正処理部20は、類似画像の数を画面62に表示させてもよい。図12は、その表示例を示す。例えば、認識結果74が得られたチェックボックス40に紐付く抽出領域画像(図6中の抽出領域60を表す画像)に類似する3つの類似画像が検索された場合、その数を示すマーク100が、その抽出領域画像に紐付けて画面62に表示される。こうすることで、3つの類似画像が検索されたことが訂正者に提示される。
訂正者が画面62上でマーク100を指定した場合(例えばクリックした場合)、確認訂正処理部20は、図9に示されている表示ウィンドウ80や、図10に示されている表示ウィンドウ88や、図11に示されている表示ウィンドウ96をUI部28に表示させる。
また、確認訂正処理部20は、文書画像が生成された時間に基づいて類似画像を検索してもよい。例えば、確認訂正処理部20は、確認対象の文書画像が生成された時間を基準として、予め定められた時間内に生成された文書画像から類似画像を検索する。文書画像が生成された時間は、例えば、当該文書画像を生成するために文書がスキャンされた時間や、当該文書が撮像された時間である。例えば、帳票画像64が確認対象の文書画像として指定されて画面62に表示されている場合、確認訂正処理部20は、その帳票画像64が生成された時間を基準として、予め定められた時間内に生成された文書画像から類似画像を検索する。確認訂正処理部20は、帳票画像64が生成される前において予め定められた時間内に生成された文書画像から類似画像を検索してもよいし、帳票画像64が生成された後において予め定められた時間内に生成された文書画像から類似画像を検索してもよいし、前後両方において予め定められた時間内に生成された文書画像から類似画像を検索してもよい。確認訂正処理部20は、帳票画像64からも類似画像を検索する。
また、確認訂正処理部20は、帳票画像64が生成された時間を基準として予め定められた時間内に生成された文書画像であって、帳票33に文字等を記入した記入者と同一人物によって文字等が記入された文書を表す文書画像から類似画像を検索してもよい。
また、確認訂正処理部20は、訂正対象の認識結果に対する訂正の指示が訂正者から与えられた場合、記入領域の属性に応じて、類似画像に紐付く記入領域に当該訂正を反映させてもよい。例えば、類似画像に紐付く記入領域が、一文字枠(例えば、1つの文字や1つの数字や1つの記号や1つの図形等)が記入されることが想定されている記入領域に該当する場合、確認訂正処理部20は、訂正対象の認識結果に対する訂正指示が訂正者によって与えられると、類似画像に紐付く記入領域に対する認識結果も同様に訂正する。つまり、一文字枠に対しては一括訂正が行われる。一方、類似画像に紐付く記入領域が、氏名記入欄等のように人文字枠ではない場合、確認訂正処理部20は、訂正対象の認識結果に対する訂正指示が訂正者によって与えられた場合、図9等に示すように、類似画像が表された表示ウィンドウをUI部28に表示させる。そして、類似画像への訂正の反映の指示が訂正者によって与えられた場合、確認訂正処理部20は、類似画像に紐付く記入領域に対する認識結果も同様に訂正する。なお、記入領域の属性を示す属性情報は、文書画像中の記入領域の表示位置に予め紐付けられていてもよい。また、確認訂正処理部20は、文書画像に表されている特定の文字列に基づいて、その文字列に紐付く記入領域の属性を推測してもよい。例えば、「氏名」、「名前」、「おなまえ」、「Name」等の文字列は、属性「氏名」を表現する文字列であるため、そのような文字列に紐付く記入領域(例えばその文字列の近くに配置されている記入領域)は、「氏名」という属性を有する。その他の属性として、属性「住所」、属性「電話番号」、属性「ID」等が用いられてもよい。また、確認訂正処理部20は、記入領域の大きさや形状に基づいて、当該記入領域の属性を推測してもよい。例えば、記入領域の大きさが、1つの文字や1つの記号や1つの図形等に適合した大きさである場合、その記入領域は一文字枠として認識される。
また、確認訂正処理部20は、認識の確信度に基づいて類似画像に紐付く記入領域に対する認識結果を一括訂正してもよい。確信度は、認識処理によって認識された文字や記号や図形等が正しいものであると確信される度合(認識結果の確からしさを示す度合)である。例えば、文書画像から抽出された文字の特徴と、その文字の認識候補の標準特徴との距離の逆数が確信度として用いられる。確信度が大きいほど、抽出された文字の特徴と認識候補の標準特徴とが近いことを意味しており、認識結果が誤りである確率が低くなる。別の定義として、特徴間の類似度を確信度として用いてもよい。もちろん、これら以外の別の定義が用いられてもよい。
例えば、確認訂正処理部20は、確信度が閾値未満となる類似画像に紐付く記入領域に対する認識結果を一括訂正する。こうすることで、誤りである確率が高い認識結果が一括して訂正される。もちろん、確認訂正処理部20は、確信度が閾値以上となる類似画像に紐付く記入領域に対する認識結果を一括訂正してもよい。確信度の閾値は、例えば予め定められた値であり、訂正者等によって変更されてもよい。
以下、図13を参照して、抽出領域の設定画面について説明する。図13は、抽出領域設定画面の一例を示す。抽出領域設定画面においては、抽出領域の幅と高さをピクセル量で設定することができる。別の例として、記入領域に対する比率(%)によって抽出領域の幅と高さが設定されてもよい。また、認識対象(文字や記号や図形等)毎に抽出領域の幅と高さが設定されてもよい。この場合、認識対象毎に抽出領域の幅と高さを変えてもよい。例えば、抽出領域設定画面は端末装置12のUI部28に表示され、訂正者によって抽出領域の幅と高さが設定される。認識処理部16は、ここでの設定内容に従って抽出領域画像を抽出する。
上記の画像処理装置10及び端末装置12のそれぞれは、一例としてハードウェアとソフトウェアとの協働により実現される。具体的には、画像処理装置10及び端末装置12のそれぞれは、図示しないCPU等の1又は複数のプロセッサを備えている。当該1又は複数のプロセッサが、図示しない記憶装置に記憶されたプログラムを読み出して実行することにより、画像処理装置10及び端末装置12のそれぞれの各部の機能が実現される。上記プログラムは、CD又はDVD等の記録媒体を経由して、又は、ネットワーク等の通信経路を経由して、記憶装置に記憶される。別の例として、画像処理装置10及び端末装置12のそれぞれの各部は、例えばプロセッサ、電子回路又はASIC(Application Specific Integrated Circuit)等のハードウェア資源により実現されてもよい。その実現においてメモリ等のデバイスが利用されてもよい。更に別の例として、画像処理装置10及び端末装置12のそれぞれの各部は、DSP(Digital Signal Processor)又はFPGA(Field Programmable Gate Array)等によって実現されてもよい。
10 画像処理装置、12 端末装置、14 画像受付部、16 認識処理部、18 類似度判定部、20 確認訂正処理部、22 出力部、24 領域設定部。

Claims (6)

  1. 記入者によって手書きで情報が記入される記入領域を含む抽出領域を表す抽出領域画像を受け付ける受付手段と、
    前記抽出領域画像に表された前記記入領域に記入されている情報に対する認識結果に対して訂正の指示が与えられた場合、前記抽出領域画像に類似する他の抽出領域画像を表示手段に表示させる制御手段と、
    を有し、
    前記制御手段は、前記記入領域が形成された文書を表す画像、及び、前記文書の画像の生成時間を基準として予め定められた時間内に生成された他の文書を表す画像から、前記他の抽出領域画像を検索して前記表示手段に表示させる、
    ことを特徴とする情報処理装置。
  2. 前記記入領域は文書に形成された領域であり、
    前記制御手段は、前記記入者によって情報が記入された複数の文書を表す画像から前記他の抽出領域画像を検索して前記表示手段に表示させる、
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記制御手段は、前記訂正の指示が与えられた場合、更に、前記他の抽出領域画像が表す他の記入領域に前記訂正を反映させる、
    ことを特徴とする請求項1又は請求項2に記載の情報処理装置。
  4. 前記制御手段は、前記他の記入領域に記入されている情報に対する認識結果の確信度に応じて、前記訂正を反映させる、
    ことを特徴とする請求項に記載の情報処理装置。
  5. 前記制御手段は、前記訂正の指示が与えられた場合、前記記入領域の属性に応じて、前記訂正を反映させる、
    ことを特徴とする請求項に記載の情報処理装置。
  6. コンピュータを、
    記入者によって手書きで情報が記入される記入領域を含む抽出領域を表す抽出領域画像を受け付ける受付手段、
    前記抽出領域画像に表された前記記入領域に記入されている情報に対する認識結果に対して訂正の指示が与えられた場合、前記抽出領域画像に類似する他の抽出領域画像を表示手段に表示させる制御手段、
    として機能させ
    前記制御手段は、前記記入領域が形成された文書を表す画像、及び、前記文書の画像の生成時間を基準として予め定められた時間内に生成された他の文書を表す画像から、前記他の抽出領域画像を検索して前記表示手段に表示させる、
    ことを特徴とするプログラム。
JP2018172599A 2018-09-14 2018-09-14 情報処理装置及びプログラム Active JP7247496B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018172599A JP7247496B2 (ja) 2018-09-14 2018-09-14 情報処理装置及びプログラム
US16/282,307 US11200410B2 (en) 2018-09-14 2019-02-22 Information processing apparatus and non-transitory computer readable medium
CN201910173102.6A CN110909723B (zh) 2018-09-14 2019-03-07 信息处理装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018172599A JP7247496B2 (ja) 2018-09-14 2018-09-14 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2020046734A JP2020046734A (ja) 2020-03-26
JP7247496B2 true JP7247496B2 (ja) 2023-03-29

Family

ID=69773681

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018172599A Active JP7247496B2 (ja) 2018-09-14 2018-09-14 情報処理装置及びプログラム

Country Status (3)

Country Link
US (1) US11200410B2 (ja)
JP (1) JP7247496B2 (ja)
CN (1) CN110909723B (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000090203A (ja) 1998-09-14 2000-03-31 Matsushita Electric Ind Co Ltd 文字認識方法及びその装置
JP2001325561A (ja) 2000-05-18 2001-11-22 Hitachi Eng Co Ltd 文字認識装置及び認識方法
JP2002074262A (ja) 2000-08-28 2002-03-15 Nippon Digital Kenkyusho:Kk 認識文字修正方法
JP2017111500A (ja) 2015-12-14 2017-06-22 株式会社リコー 文字認識装置及びプログラム

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5550930A (en) * 1991-06-17 1996-08-27 Microsoft Corporation Method and system for training a handwriting recognizer at the time of misrecognition
JPH0636066A (ja) 1992-07-20 1994-02-10 Nippon Telegr & Teleph Corp <Ntt> 文字認識装置の確認修正処理方式
GB9226137D0 (en) * 1992-12-15 1993-02-10 Ibm Data entry system
US5511135A (en) * 1993-11-29 1996-04-23 International Business Machines Corporation Stylus-input recognition correction manager
JP2845149B2 (ja) * 1994-12-28 1999-01-13 日本電気株式会社 手書文字入力装置および手書文字入力方法
US5850480A (en) * 1996-05-30 1998-12-15 Scan-Optics, Inc. OCR error correction methods and apparatus utilizing contextual comparison
JPH1011527A (ja) * 1996-06-19 1998-01-16 Toshiba Corp コード/イメージ表示制御装置
JPH1063869A (ja) * 1996-08-15 1998-03-06 Toshiba Corp ドキュメント処理装置
US5933531A (en) * 1996-08-23 1999-08-03 International Business Machines Corporation Verification and correction method and system for optical character recognition
JP3817378B2 (ja) * 1998-12-15 2006-09-06 富士通株式会社 情報入力装置
US6618697B1 (en) * 1999-05-14 2003-09-09 Justsystem Corporation Method for rule-based correction of spelling and grammar errors
US7627596B2 (en) * 2001-02-22 2009-12-01 International Business Machines Corporation Retrieving handwritten documents using multiple document recognizers and techniques allowing both typed and handwritten queries
US7137076B2 (en) * 2002-07-30 2006-11-14 Microsoft Corporation Correcting recognition results associated with user input
EP1398726B1 (en) * 2002-09-11 2008-07-30 Samsung Electronics Co., Ltd. Apparatus and method for recognizing character image from image screen
JP2006092027A (ja) * 2004-09-21 2006-04-06 Fuji Xerox Co Ltd 文字認識装置、文字認識方法および文字認識プログラム
JP2007233671A (ja) * 2006-03-01 2007-09-13 Fuji Xerox Co Ltd 画像処理装置、画像処理方法および画像処理プログラム
JP2007272473A (ja) * 2006-03-30 2007-10-18 Toshiba Corp 文字認識装置、方法およびプログラム
US7869657B2 (en) * 2006-06-12 2011-01-11 D & S Consultants, Inc. System and method for comparing images using an edit distance
JP2008003739A (ja) * 2006-06-21 2008-01-10 Fuji Xerox Co Ltd 入力修正方法、追記情報処理方法、追記情報処理装置、およびプログラム
KR101291195B1 (ko) * 2007-11-22 2013-07-31 삼성전자주식회사 문자인식장치 및 방법
JP4970301B2 (ja) * 2008-02-08 2012-07-04 シャープ株式会社 画像処理方法、画像処理装置、画像読取装置、画像形成装置、画像処理システム、プログラムおよび記録媒体
US8229225B2 (en) * 2008-05-06 2012-07-24 Wu Yingchao Candidate selection method for handwriting input
US8285049B2 (en) * 2008-06-06 2012-10-09 Microsoft Corporation Corrections for recognizers
US9424242B2 (en) * 2010-04-14 2016-08-23 International Business Machines Corporation Data capture and analysis
US20120030234A1 (en) * 2010-07-31 2012-02-02 Sitaram Ramachandrula Method and system for generating a search query
JP6071287B2 (ja) * 2012-07-09 2017-02-01 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
CA2891930C (en) * 2012-11-19 2016-08-02 Imds America Inc. Method and system for the spotting of arbitrary words in handwritten documents
JP5763700B2 (ja) * 2013-03-27 2015-08-12 富士フイルム株式会社 画像処理装置、画像処理方法およびプログラム
US9495620B2 (en) * 2013-06-09 2016-11-15 Apple Inc. Multi-script handwriting recognition using a universal recognizer
JP6264785B2 (ja) 2013-08-30 2018-01-24 富士通株式会社 表示方法、表示プログラム及び表示装置
JP2015191382A (ja) * 2014-03-28 2015-11-02 日本電気株式会社 画像データ処理装置、方法、及びプログラム
JPWO2016170691A1 (ja) * 2015-04-24 2018-02-01 富士通株式会社 入力処理プログラム、入力処理装置、入力処理方法、文字特定プログラム、文字特定装置、及び文字特定方法
WO2016181565A1 (ja) * 2015-05-14 2016-11-17 富士通株式会社 文字入力受付方法、文字入力受付装置及び文字入力受付プログラム
DE102015221304A1 (de) * 2015-10-30 2017-05-04 Continental Automotive Gmbh Verfahren und Vorrichtung zur Verbesserung der Erkennungsgenauigkeit bei der handschriftlichen Eingabe von alphanumerischen Zeichen und Gesten
US10270934B2 (en) * 2016-12-01 2019-04-23 Kyocera Document Solutions Inc. Image processing apparatus and image forming apparatus
US11087187B2 (en) * 2019-02-26 2021-08-10 Logistimo India Private Limited System and method for improving recognition of characters

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000090203A (ja) 1998-09-14 2000-03-31 Matsushita Electric Ind Co Ltd 文字認識方法及びその装置
JP2001325561A (ja) 2000-05-18 2001-11-22 Hitachi Eng Co Ltd 文字認識装置及び認識方法
JP2002074262A (ja) 2000-08-28 2002-03-15 Nippon Digital Kenkyusho:Kk 認識文字修正方法
JP2017111500A (ja) 2015-12-14 2017-06-22 株式会社リコー 文字認識装置及びプログラム

Also Published As

Publication number Publication date
CN110909723B (zh) 2024-01-12
US11200410B2 (en) 2021-12-14
CN110909723A (zh) 2020-03-24
JP2020046734A (ja) 2020-03-26
US20200089944A1 (en) 2020-03-19

Similar Documents

Publication Publication Date Title
JP7206729B2 (ja) 情報処理装置及びプログラム
US10984233B2 (en) Image processing apparatus, control method, and non-transitory storage medium that obtain text data for an image
US9785627B2 (en) Automated form fill-in via form retrieval
US10437466B2 (en) Formula inputting method and apparatus
KR101291195B1 (ko) 문자인식장치 및 방법
KR20140030361A (ko) 휴대단말기의 문자 인식장치 및 방법
US10395131B2 (en) Apparatus, method and non-transitory storage medium for changing position coordinates of a character area stored in association with a character recognition result
US11836442B2 (en) Information processing apparatus, method, and storage medium for associating metadata with image data
US11418658B2 (en) Image processing apparatus, image processing system, image processing method, and storage medium
JP6253354B2 (ja) 帳票読取装置、プログラムおよび帳票読取システム
US9582230B1 (en) Method and system for automated form document fill-in via image processing
US20150261735A1 (en) Document processing system, document processing apparatus, and document processing method
JP7247496B2 (ja) 情報処理装置及びプログラム
US20220207900A1 (en) Information processing apparatus, information processing method, and storage medium
US20210182477A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
US10867168B2 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP5223739B2 (ja) 携帯式文字認識装置、文字認識プログラム及び文字認識方法
US11763582B2 (en) Information processing apparatus, control method of information processing apparatus, and non-transitory storage medium
US20220311894A1 (en) Information processing apparatus, non-transitory computer readable medium storing program, and information processing method
JP2019133559A (ja) データ入力装置、データ入力プログラム及びデータ入力システム
US20230063374A1 (en) Image processing apparatus, non-transitory storage medium, and image processing method
JP2020046857A (ja) 情報処理装置及びプログラム
US20230106967A1 (en) System, method and user experience for skew detection and correction and generating a digitized menu
JP2023031036A (ja) 情報処理装置、情報処理システム、情報処理装置の制御方法及びプログラム
JP4431335B2 (ja) 文字列読み取りプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210831

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220823

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221013

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230227

R150 Certificate of patent or registration of utility model

Ref document number: 7247496

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150