JP2016167159A - 情報処理装置 - Google Patents

情報処理装置 Download PDF

Info

Publication number
JP2016167159A
JP2016167159A JP2015046436A JP2015046436A JP2016167159A JP 2016167159 A JP2016167159 A JP 2016167159A JP 2015046436 A JP2015046436 A JP 2015046436A JP 2015046436 A JP2015046436 A JP 2015046436A JP 2016167159 A JP2016167159 A JP 2016167159A
Authority
JP
Japan
Prior art keywords
information acquisition
image
character
recognition result
acquisition area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015046436A
Other languages
English (en)
Inventor
忠則 中塚
Tadanori Nakatsuka
忠則 中塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2015046436A priority Critical patent/JP2016167159A/ja
Publication of JP2016167159A publication Critical patent/JP2016167159A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】 帳票画像における認識対象領域とその認識結果とを、ユーザが確認しやすいように帳票画像に重ねて表示する。【解決手段】 帳票画像の帳票タイプを分類し、当該分類された帳票タイプに対して予め定義されている情報取得領域を用いて、前記帳票画像における前記情報取得領域内の画像を文字認識処理して認識結果を取得する。情報取得領域と認識結果とを帳票画像上に表示する際に、認識結果の信頼度が閾値より低い場合は、前記情報取得領域と前記認識結果との間隔を大きくして表示する。【選択図】 図13

Description

本発明は、帳票画像の認識結果を表示する情報処理装置に関する。
図3は、モバイル端末のカメラで撮影した帳票画像の一例である。この帳票画像から文字認識を用いて特定情報を抜き出して新規帳票を作成したい場合がある。
特許文献1では、認識対象画像の帳票IDを読み取り、予め記憶されている指定帳票の定義体に基づいて、文字の切り出し位置を設定して文字画像を切り出し、当該切り出した文字画像を認識して、その認識結果を認識対象画像に重ねて表示する技術が開示されている。
特開平7−46359号公報
携帯端末のカメラ機能やデジタルカメラ等で認識対象の帳票画像を撮影した場合は、歪みや位置ズレが生じたりする。このような歪みや位置ズレを有するような帳票画像に対して、特許文献1のように、指定帳票の定義体に基づいて文字切り出し位置を特定すると、文字切り出し位置と文字画像の位置がずれてしまうという問題点がある。そして、特許文献1のように、文字認識結果を元の文字画像の近傍に並べて表示すれば確認修正を行いやすくなるが、文字切り出し位置がずれている場合は、認識結果がその認識対象文字の一部に重なって表示されてしまい、認識対象文字自体も確認できない場合もありうる(図9の901)。
上記課題を解決するために、本発明の情報処理装置は、帳票画像をあらかじめ登録した複数の帳票タイプのいずれかに分類する分類手段と、前記分類手段で分類された帳票タイプに対して予め定義されている情報取得領域を用いて、前記帳票画像における前記情報取得領域内の画像を文字認識処理して認識結果を取得する文字認識手段と、前記情報取得領域と前記認識結果とを前記帳票画像上に表示する表示手段と、を有し、前記表示手段は、前記認識結果の信頼度が閾値より低い場合は、前記情報取得領域と前記認識結果との間隔を大きくして表示することを特徴とする。
帳票画像における認識対象領域とその認識結果とを、ユーザが確認しやすいように帳票画像に重ねて表示することができる。
複写機100の構成を示すブロック図 情報処理装置200の構成を示すブロック図 モバイルカメラで撮った帳票画像の例 情報取得領域の例 情報取得領域の例 帳票画像と情報取得領域の例 情報取得領域と文字認識結果を単純に表示した例 文字認識結果の背景を白くして表示した例 情報取得枠と帳票画像がずれた例 情報取得枠と帳票画像がずれた例 新規作成する帳票画像 メインフロー 情報取得領域と文字認識結果の間隔調整についてのフロー 情報取得領域と文字認識結果の間隔調整についてのフロー 情報取得領域の補正についてのフロー 情報取得領域の補正についてのフロー 情報取得領域選択についてのフロー
まず、本実施形態での説明に用いる言葉の定義について述べる。
オリジナル文字とは、帳票画像中の認識対象となる文字画像のことを指す。
認識文字とは、オリジナル文字を文字認識することで得られた文字コード(文字認識結果)、又は、編集ウィンドウに表示される、その文字コードに対応する文字のことを指す。この認識文字は、編集ウィンドウ用文字サイズ(編集ウィンドウ用文字サイズとは、編集ウィンドウ用に設定された文字サイズという意味である)で編集ウィンドウ上に表示される。
文字の編集は、ユーザが、編集ウィンドウから認識文字を削除して、代わりの文字を編集ウィンドウに入力する行為を指す。編集後の文字とは、入力された代わりの文字、又は、その文字に対応する文字コードのことである。この編集後の文字は、編集ウィンドウ上に表示される場合には、編集ウィンドウ用文字サイズで表示される。なお、編集ウィンドウ用文字サイズのデフォルト値は、予め保存部202に保存されているものとする。
以下、本発明を実施するための最良の形態について図面を用いて説明する。
<第1の実施形態>
<タブレットの構成と情報処理装置の構成>
図1に本実施形態におけるタブレット100の構成を示す。タブレット100は、カメラ101、送受信部102より構成される。タブレット100は、無線ネットワーク、有線ネットワーク、またはケーブルを介して、情報処理装置200と接続されるものとする。
図2に本実施形態における情報処理装置200の構成を示す。情報処理装置200は、CPUとROM及びRAMを内部に有する。CPUはROMから情報処理装置200のプログラムをロードし、一次保存領域としてRAMを利用して情報処理装置200のプログラムを実行する。以上の動作により、CPUは、各処理部(201−205)として機能する。なお、受付部205は、キーボードとマウスを含む形態が一般的であるが、この形態に限るものではなく、受付部205と表示部204は一体であっても良い。その場合、受付部205と表示部204をまとめてタッチパネルと呼ぶことになり、以下の実施例中のクリックなる記載は、タッチと読み替えて頂くことになる。
<帳票画像入力から帳票分類、文字認識まで>
タブレット100のカメラが帳票を撮影すると、帳票画像が生成される。生成された帳票画像を送受信部102が情報処理装置200に送信する。すると、情報処理装置200の送受信部201がこれを受信し、保存部202にその帳票画像を保存する。
ユーザが受付部205を介して、保存部202に保存されている複数の帳票画像の中から、一つの帳票画像を選択する。すると、制御部203は、その帳票画像を表示部204に表示する。そして、ユーザが受付部205を介して、表示部204に表示された帳票画像の解析を指示する。すると、制御部203は、帳票分類と、文字認識と、結果表示の三つの処理を実行し、実行結果を表示部204に表示する。
図3は、帳票画像の例であり、図4は、あらかじめ登録した帳票タイプ(ここではINVOICE)と3つの情報取得領域である。情報取得領域は認識対象領域であり、各帳票タイプの定義データとして予め定義されているものとする。情報取得領域401は、Date情報、情報取得領域402は送付先情報、情報取得領域403は送付元情報を示している。図5は、あらかじめ登録した別の帳票タイプ(ここではRECEIPT)と3つの情報取得領域である。情報取得領域501はDate情報、情報取得領域502はNAME情報、情報取得領域503はADDRESS情報を示している。図6は、帳票画像を帳票分類処理することによりINVOICEと分類した場合に、INVOICE帳票に登録された3つの情報取得領域601,602,603を帳票画像上に重ねて示したものである。
<帳票分類(1)−(2)、文字認識(3)、情報取得領域および認識文字表示(4)−(6)の説明>
(1)制御部203は、あらかじめ帳票タイプごとに帳票分類を行うための特徴的な領域をユーザに受付部205を介して指示させ、保存部202に記憶している。図4のINVOICE帳票タイプであれば、左上のInvoiceと記載された文字列領域が帳票分類に用いる領域であり、図5のReceipt帳票タイプであれば、左上のReceiptと記載された文字列領域が帳票分類に用いる領域である。
(2)制御部203は、送受信部201で受信した図3の帳票画像に対してINVOICE帳票タイプ、Receipt帳票タイプそれぞれの特徴的な領域内を文字認識する。文字認識の結果がINVOICEであれば、INVOICE帳票と判定する。なお、帳票分類の方法は、左上の文字列領域に基づいて分類する方法に限るものではなく、帳票内の表領域の解析を行い分類するなど他の方法でもかまわない。
(3)制御部203は、帳票タイプそれぞれに関連付けられている情報取得領域に対して文字認識処理を行うことによって、各情報取得領域に対応する認識文字を得る。認識文字は、対応する情報取得領域に関連付けて保存部202に保存する。
(4)制御部203は、各情報取得領域に太線枠を付けて帳票画像を表示部204に表示する。表示された画面は図6となっている。一つの情報取得領域を構成する罫線は四本あり、従って、太線枠は四本の罫線で構成される。なお、枠の形態は、太線でなくても実線でなくても良く、黒でなくても良いのは言うまでも無いが、これ以降は、太線であるものとして説明を続ける。
(5)制御部203は、(3)の各情報取得領域に対して文字認識処理した結果の認識文字を、各情報取得領域を示す枠のすぐ上に表示する。表示された画面は図7となっている。情報取得領域601に関連付けられた認識文字701が表示されている。同様に情報取得領域602のすぐ上に認識文字702が表示され、情報取得領域603のすぐ上に認識文字703が表示されている。認識文字の表示は黒でなくても赤でも構わない。図7でわかるように認識文字と帳票画像が重なって確認しづらい。
(6)(5)で示す問題を解決するために制御部203は、(3)の各情報取得領域に対する認識文字を表示する際に、認識文字の背景部分を白くして表示する。図8の認識文字801〜803がそれであり、図7よりも認識文字を確認しやすくなっている。
図9、図10は、情報取得領域を示す枠と、認識文字と、帳票画像との間の位置関係によって生じる課題を説明するための図であり、図12の本実施形態の処理とともに以下で説明する。図11は、制御部203が情報取得領域の認識文字から得た結果から別の帳票を作成する例を示している。
ステップS1201で、制御部203は、タブレット100のカメラ101で撮影された帳票画像を送受信部102と情報処理装置200の送受信部201を介して取得し、保存部202に保存する。
ステップS1202で、制御部203は、帳票の分類を行う。帳票の分類については前述(1)〜(2)のとおりである。
ステップS1203で、制御部203は、S1202の分類結果と予め定義された帳票の定義データとに基づいて情報取得領域の取得を行い、ステップS1204で、情報取得領域内の画像に対して文字認識処理を実行する。前述の(3)で述べたとおりである。
ステップS1205で、制御部203は、文字認識結果の表示を行う。概要については、前述の(4)〜(6)で述べたとおりである。
このとき生じる表示上の課題と、本実施形態による解決手段について図9、図13を用いて説明する。
タブレット100のカメラ101で撮影した帳票画像は、あらかじめ情報処理装置200の保存部202に保存されている帳票タイプの情報取得領域と少し位置がずれていることがある。図9の901は、帳票画像の位置がずれているために、帳票画像内の文字イメージに対して、情報取得領域と認識文字との表示場所がずれてしまっているケースを示す図である。この場合、認識対象の文字イメージそのものに対して認識文字が重なって表示されており、認識結果が正しいのか正しくないのかユーザは確認できないという課題がある。この課題に対する本実施形態の対応方法を図13のフローチャートで説明する。
ステップS1301で、制御部203は、「(文字認識の信頼度の平均)<80%」であるかどうか判定する。ステップS1301で信頼度の平均が80%(第1の閾値)以上であると判定した場合は、ステップS1302に進む。
ステップS1302では、情報取得領域と認識文字の間隔が領域内の文字高さの1.5倍になるように、認識文字の表示位置を設定する。文字高さは、情報取得領域内の部分画像に対して文字認識処理する際に取得可能である。
ステップS1301で信頼度の平均が80%未満であると判定した場合は、ステップS1303に進み、「(文字認識の信頼度の平均)<50%」であるかどうか判定する。信頼度の平均が50%(第2の閾値)以上であると判定した場合は、ステップS1304に進む。
ステップS1304では、情報取得領域と認識文字の間隔が領域内の文字高さの2倍になるように、認識文字の表示位置を設定する。信頼度が低いということは、情報取得領域と帳票画像のずれが大きい可能性があるためである。
ステップS1303で信頼度が50%未満であると判定した場合は、ステップS1305に進む。ステップS1305では、情報取得領域と認識文字の間隔が領域内の文字高さの3倍になるように、認識文字の表示位置を設定する。
ステップS1306では、図9の902のように認識文字の背景を白くして、認識文字をS1302,S1304,S1305のいずれかにより求めた位置に表示して、図12のステップS1206に進む。
ステップS1206では、制御部203は、ユーザの指示に基づいて認識文字の修正を行う。修正はキーボードなどの受付部205からの入力により修正を行う。
ステップS1207では、当該修正処理後の認識文字を用いて新帳票を作成し、表示部204に表示して一連の処理を終了する。ステップS1206までの処理で帳票画像から必要な情報を抽出することができるので、例えば、図11のレポート1101の形式で複数枚の帳票画像の情報を表形式でまとめて帳票を作成し、表示部204に表示する。
<第2の実施形態>
第1の実施形態のステップS1205の別の実施形態を図14のフローチャートを用いて説明する。
ステップS1401で、制御部203は、認識文字がすべて単語リストにあるかどうか判定する。単語リストとは、あらかじめユーザが登録している単語のリストである。具体的には、顧客の会社名、住所などといったような情報のリストである。すべて単語リストに存在すると判定した場合は、ステップS1402に進む。
ステップS1402では、情報取得領域と認識文字の間隔が領域内の文字高さの1.5倍になるように、認識文字の表示位置を設定する。文字高さは、文字認識の際に取得可能である。
S1401で認識文字が単語リストにすべてあるわけではない場合は、ステップS1403に進み、認識文字が一つでも単語リストにあるかどうか判定する。認識文字が単語リストに少なくともひとつ存在すると判定した場合は、ステップS1404に進む。
ステップS1404では、情報取得領域と認識文字の間隔が領域内の文字高さの2倍になるように、認識文字の表示位置を設定する。単語リストに存在しない認識文字があるということは、情報取得領域と帳票画像のずれが大きい可能性があるためである。
ステップS1403で、認識文字がひとつも単語リストにないと判定した場合は、ステップS1405に進む。ステップS1405では、情報取得領域と認識文字の間隔が領域内の文字高さの3倍になるように、認識文字の表示位置を設定する。
ステップS1406では、認識文字の背景を白くして、認識文字をS1402,S1404,S1405のいずれかにより求めた位置に表示して、図12のステップS1206に進む。
<第3の実施形態>
第1の実施形態のステップS1204〜S1205の別の実施形態を図15のフローチャートを用いて説明する。
ステップS1501で制御部203は、情報取得領域の縦横それぞれ2倍の領域の位置を求め、外接矩形抽出領域とする。ここでは例として2倍をあげるが、何倍でも構わない。
例えば、情報取得領域が、左上座標が(200、200)、右上座標が(400,200)、左下座標が(200,300)、右下座標が(400,300)で、高さ100幅200の長方形である場合を例にとる。この場合、中心座標が共通で縦横それぞれ2倍の領域は、左上座標が(100、150)、右上座標が(500,150)、左下座標が(100,350)、右下座標が(500,350)の高さ200幅400の長方形領域となる。
次にステップS1502とステップS1503では、ステップS1501で求めた外接矩形抽出領域の上側から1ラインずつ画素があるかどうかを確認する。
最初は、帳票画像の(100、150)から(500,150)の間に有意な画素(例えば黒画素)があるか確認する。なければひとつ下の画素行に下がって、(100、151)から(500,151)の間に有意な画素があるか確認する。このようにして有意な画素が見つかるまで順に探索していく。たとえば、(100、160)から(500,160)の間に黒画素があったとすると、ステップS1504に進む。
ステップS1504では、(100、160)から(500,160)の直線を外接矩形の上辺とする。
ステップS1505とステップS1506では、ステップS1501で求めた外接矩形抽出領域の下側から1ラインずつ有意な画素があるかどうかを確認する。最初は、帳票画像の(100、350)から(500,350)の間に有意な画素があるか確認する。なければひとつ上の画素行に上がって、(100、349)から(500,349)の間に有意な画素があるか確認する。このようにして有意な画素が見つかるまで順に探索していく。たとえば、(100、250)から(500,250)の間に画素があったとするとステップS1507に進む。
ステップS1507では、(100、250)から(500,250)の直線を外接矩形の下辺とする。
ステップS1508とステップS1509では、ステップS1501で求めた外接矩形抽出領域の左側から1ラインずつ有意な画素があるかどうかを確認する。最初は、帳票画像の(100、150)から(100,350)の間に有意な画素があるか確認する。なければひとつ右の画素列に移動して、(101、150)から(101,350)の間に有意な画素があるか確認する。このようにして有意な画素が見つかるまで順に右に移動していく。たとえば、(230、150)から(230,350)の間に画素があったとするとステップS1510に進む。
ステップS1510では、(230、150)から(230,350)の直線を外接矩形の左辺とする。
ステップS1511とステップS1512では、ステップS1501で求めた外接矩形抽出領域の右側から1ラインずつ有意な画素があるかどうかを確認する。最初は、帳票画像の(500、150)から(500,350)の間に有意な画素があるか確認する。なければひとつ左の画素列に移動して、(499、150)から(499,350)の間に有意な画素があるか確認する。このようにして有意な画素が見つかるまで順に左に移動していく。たとえば、(350、150)から(350,350)の間に画素があったとするとステップS1513に進む。
ステップS1513では、(350、150)から(350,350)の直線を外接矩形の右辺とする。
外接矩形は、左上(230,160)、右上(350,160)、左下(230,250)、右下(350,250)となる。
ステップS1514では、当該求めた外接矩形内の帳票画像に対して文字認識処理を実行し、前記外接矩形と認識文字を表示してステップS1206に進む。
図9の903は、第3の実施形態のS1502〜S1513の説明を概念的に示したものであり、矢印の方向に有意な画素の探索を行うことを示している。また、図9の904は、求めた外接矩形と認識文字をS1514で表示しているところを示す図である。
<第4の実施形態>
情報取得領域の左上座標が(200、200)、右上座標が(400,200)、左下座標が(200,300)、右下座標が(400,300)の高さ100幅200の長方形を例にとる。
情報取得領域の境界上(上辺、下辺、左辺、右辺)に、有意な画素があるかどうかを確認する。たとえば、上辺に画素があったとすると、文字の一部が情報取得領域に重なっていることを意味している。したがって、本実施例では、この場合、文字に重ならない位置を求める。
上辺は、帳票画像の(200,200)から(400,200)で、その間に有意な画素があるか確認する。ここでは黒画素があったとする。この場合、ひとつ上の画素行の(200,199)から(400,199)の間に有意な画素があるか判定する。有意な画素があればまたひとつ上に上がって画素の確認をする。そのようにして画素がなくなるまで繰り返すと、文字と重ならない位置が分かる。
同様に、下辺、左辺、右辺でも同じように領域の外側方向に画素を確認していき、最終的に求まった4辺を情報取得領域とする。
例えば、図9の901が最初の情報取得領域の状態であったとすると、文字画像と情報取得領域が重なっている。上辺のみ文字と重なっているので前述の方法により文字と重ならない位置に上辺を移動させると、図9の905のように情報取得領域を広げるように変更される。上辺の位置を移動したので認識文字もその上に移動して表示されることになり、文字画像と認識文字が重ならないようになり、確認ができるようになる。
<第5の実施形態>
また一方、情報取得領域と認識文字を離しすぎると、その認識文字が隣の文字行の文字画像に重なってしまい、確認しづらくなる場合がある。
図10の1001は、その問題を模式的に表したものである。下側の文字画像(07/28/2014)に対する認識文字(U1/zo/zU1+)が、その上にある文字行の文字画像(山田太郎)と重なって、確認しづらくなっている。
第5の実施形態では、情報取得領域の表示ウィンドウ内の表示位置を固定したままで、ユーザの指示に基づき帳票イメージ自体を上下左右に移動したり拡大縮小したりすることで解決する。それが図10の1002である。帳票イメージの上下左右の移動や拡大縮小は、Windows(登録商標)などで通常用いられるスクロールバーなどの手段で構わない。情報取得領域を固定位置で表示したままにすることで、ユーザが簡単に帳票イメージの移動や拡大縮小を行うことができる。その後、変更した帳票イメージをもとに情報取得領域内を、再度文字認識をかけて認識文字を表示する。
その状態が、図10の1002である。
<第6の実施形態>
第1の実施形態では、タブレット100のカメラで位置ずれしたことを想定しているが、帳票分類で失敗して別の帳票タイプに分類され、情報取得領域が全く異なる位置に設定される場合もありうる。図10の1003は、文字画像と情報取得領域の位置が完全にずれている例を示している。
第6の実施形態では、認識文字の信頼度が10%(第3の閾値)よりも低い情報取得領域がある場合は、他の帳票タイプに関連づいている情報取得領域を用いて文字認識処理を行う。
そして、帳票タイプごとに文字認識の平均信頼度を算出して、もっとも信頼度が高い帳票タイプに置き換えることで帳票分類の誤認識に対応することが可能となる。もっとも信頼度が高い帳票タイプに分類し直した結果、文字画像と情報取得領域の位置が一致し、その情報取得領域の認識文字を表示した状態が、図10の1004である。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。

Claims (7)

  1. 帳票画像をあらかじめ登録した複数の帳票タイプのいずれかに分類する分類手段と、
    前記分類手段で分類された帳票タイプに対して予め定義されている情報取得領域を用いて、前記帳票画像における前記情報取得領域内の画像を文字認識処理して認識結果を取得する文字認識手段と、
    前記情報取得領域と前記認識結果とを前記帳票画像上に表示する表示手段と、を有し、
    前記表示手段は、前記認識結果の信頼度が閾値より低い場合は、前記情報取得領域と前記認識結果との間隔を大きくして表示することを特徴とする情報処理装置。
  2. 帳票画像をあらかじめ登録した複数の帳票タイプのいずれかに分類する分類手段と、
    前記分類手段で分類された帳票タイプに対して予め定義されている情報取得領域を用いて、前記帳票画像における前記情報取得領域内の画像を文字認識処理して認識結果を取得する文字認識手段と、
    前記情報取得領域と前記認識結果とを前記帳票画像上に表示する表示手段と、を有し、
    前記表示手段は、前記認識結果が予め登録されている単語リストに無い場合、前記情報取得領域と前記認識結果との間隔を大きくして表示することを特徴とする情報処理装置。
  3. 帳票画像をあらかじめ登録した複数の帳票タイプのいずれかに分類する分類手段と、
    前記分類手段で分類された帳票タイプに対して予め定義されている情報取得領域より上下左右に広い領域を定義してその中に存在する文字画像の外接矩形を求め、前記帳票画像における前記外接矩形内の画像を文字認識処理して認識結果を取得する文字認識手段と、
    前記外接矩形と前記認識結果とを前記帳票画像上に表示する表示手段と、を有することを特徴とする情報処理装置。
  4. 帳票画像をあらかじめ登録した複数の帳票タイプのいずれかに分類する分類手段と、
    前記分類手段で分類された帳票タイプに対して予め定義されている情報取得領域の境界上に有意な画素が重なっているか判定し、有意な画素が重なっている場合は重ならなくなるまで前記情報取得領域を広げるように変更し、前記帳票画像における前記広げた後の情報取得領域内の画像を文字認識処理して認識結果を取得する文字認識手段と、
    前記広げた後の情報取得領域と前記認識結果とを前記帳票画像上に表示する表示手段と、を有する情報処理装置。
  5. 前記表示手段は、さらに、前記情報取得領域を帳票画像と共に表示し、前記情報取得領域の表示ウィンドウ内の表示位置を固定したままで、ユーザの指示に基づき前記帳票画像を移動および拡大縮小することを特徴とする請求項1に記載の情報処理装置。
  6. 前記表示手段は、前記認識結果の信頼度が閾値より低い場合は、前記分類手段で分類された帳票タイプとは別の帳票タイプに関連付けられている情報取得領域を用いて文字認識処理し、すべての帳票タイプの中でもっとも信頼度の平均が高い帳票タイプの情報取得領域と認識結果とを表示することを特徴とする請求項1に記載の情報処理装置。
  7. コンピュータを、請求項1乃至6のいずれか1項に記載の情報処理装置の各手段として機能させるためのプログラム。
JP2015046436A 2015-03-09 2015-03-09 情報処理装置 Pending JP2016167159A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015046436A JP2016167159A (ja) 2015-03-09 2015-03-09 情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015046436A JP2016167159A (ja) 2015-03-09 2015-03-09 情報処理装置

Publications (1)

Publication Number Publication Date
JP2016167159A true JP2016167159A (ja) 2016-09-15

Family

ID=56898533

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015046436A Pending JP2016167159A (ja) 2015-03-09 2015-03-09 情報処理装置

Country Status (1)

Country Link
JP (1) JP2016167159A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018173742A (ja) * 2017-03-31 2018-11-08 株式会社 みずほ銀行 支払支援システム、支払支援方法及び支払支援プログラム
CN109255300A (zh) * 2018-08-14 2019-01-22 中国平安财产保险股份有限公司 票据信息提取方法、装置、计算机设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018173742A (ja) * 2017-03-31 2018-11-08 株式会社 みずほ銀行 支払支援システム、支払支援方法及び支払支援プログラム
CN109255300A (zh) * 2018-08-14 2019-01-22 中国平安财产保险股份有限公司 票据信息提取方法、装置、计算机设备及存储介质
CN109255300B (zh) * 2018-08-14 2023-12-01 中国平安财产保险股份有限公司 票据信息提取方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
US9641715B2 (en) Information processing device, method, and medium
US10545656B2 (en) Information processing apparatus and display controlling method for displaying an item in a display area in response to movement
JP6127188B1 (ja) 計数方法および計数装置
US20160004682A1 (en) Information processing apparatus, information processing method, and storage medium
US10115216B2 (en) Display control apparatus, display control method, and program
US9843694B2 (en) Image reading device and method, reading area display device and method, and program
US20110050956A1 (en) Imaging apparatus, method therefor, and storage medium
JP2013191036A (ja) 領域指定方法及び領域指定装置
CN107085699B (zh) 信息处理设备、信息处理设备的控制方法和存储介质
US10607381B2 (en) Information processing apparatus
US20140355828A1 (en) Setting apparatus, setting method, and storage medium
JP5171421B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP6171651B2 (ja) 画像処理プログラム及び画像処理装置
CN113378839A (zh) 信息处理装置、信息处理方法及计算机可读介质
JP2016167159A (ja) 情報処理装置
US20190354792A1 (en) Image box filtering for optical character recognition
US20160300321A1 (en) Information processing apparatus, method for controlling information processing apparatus, and storage medium
WO2021186672A1 (ja) 画像処理方法
US11588945B2 (en) Data input support apparatus that displays a window with an item value display area, an overview image display area, and an enlarged image display area
US20220292251A1 (en) Information processing apparatus, information processing method, and storage medium
KR20120035360A (ko) 문자 인식 장치 및 방법
JP2009136505A (ja) 画像表示装置、画像診断装置、及びプログラム
JP2016025625A (ja) 情報処理装置、情報処理方法及びプログラム
KR102045753B1 (ko) 이미지의 배경 영역에 대한 투명화 처리를 지원하는 이미지 편집 처리 장치 및 그 동작 방법
US20210027450A1 (en) Information processing apparatus, information processing method, and storage medium