JP2017033205A - 記載内容認識システム、記載内容認識方法、及び記載内容認識プログラム - Google Patents

記載内容認識システム、記載内容認識方法、及び記載内容認識プログラム Download PDF

Info

Publication number
JP2017033205A
JP2017033205A JP2015151408A JP2015151408A JP2017033205A JP 2017033205 A JP2017033205 A JP 2017033205A JP 2015151408 A JP2015151408 A JP 2015151408A JP 2015151408 A JP2015151408 A JP 2015151408A JP 2017033205 A JP2017033205 A JP 2017033205A
Authority
JP
Japan
Prior art keywords
information
recognition
description content
extracted
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015151408A
Other languages
English (en)
Inventor
武志 馬路
Takeshi Baji
武志 馬路
勝利 小原
Katsutoshi Obara
勝利 小原
将平 長谷川
Shohei Hasegawa
将平 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Frontech Ltd
Original Assignee
Fujitsu Frontech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Frontech Ltd filed Critical Fujitsu Frontech Ltd
Priority to JP2015151408A priority Critical patent/JP2017033205A/ja
Publication of JP2017033205A publication Critical patent/JP2017033205A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】通信の負荷を低減できる。【解決手段】クライアント装置10は、画像情報30の認識処理の対象範囲31から対象範囲31に記載された記載内容を識別可能な抽出情報を抽出する。サーバ装置20は、精度の良い認識処理を実現するため(抽出情報から精度よく記載内容を認識するため)に、各種情報(例えば、文字を認識するための文字認識辞書などの抽出情報から記載内容を認識(識別)するための情報)を含んだ認識情報を記憶しており、クライアント装置10が抽出した抽出情報と、記憶している認識情報とに基づいて、記載内容を認識する。【選択図】図1

Description

記載内容認識システム、記載内容認識方法、及び記載内容認識プログラムに関する。
従来から、帳票を撮像して取得した帳票の画像情報から文字の特徴を抽出し、文字認識辞書と照合して文字の認識を行う文字認識(OCR:Optical Character Recognition)が行われている。このような文字認識は、文字認識辞書などの文字認識に必要な資産ファイルを予め文字認識を行う端末に配布することで、様々な端末上で実現できる。しかしながら、資産ファイルは、適宜更新されることがあるため、複数の端末に資産ファイルを配布すると、資産ファイルの管理に手間がかかるという問題があった。
これに対して、帳票を撮像して取得した帳票の画像情報を、取得した端末からサーバ装置に転送し、サーバ装置側で認識処理を行う技術が知られている。上記技術は、端末側に資産ファイルを配布する必要がなくサーバ装置側の資産ファイルだけを管理すればよいため、資産ファイルの管理の手間を低減できる。
特開2004−179851号公報
しかしながら、上記技術では、画像情報を、サーバ装置に転送するため、通信に負荷がかかるという問題があった。
本発明は、このような問題に鑑みてなされたものであり、通信の負荷を抑止可能な記載内容認識システム、記載内容認識方法、及び記載内容認識プログラムの提供を目的とする。
上記課題を解決するために、本発明の記載内容認識システムは、クライアント装置と、サーバ装置とを有する。
クライアント装置は、抽出部を備える。抽出部は、画像情報の認識処理の対象範囲から対象範囲に記載された記載内容を識別可能な抽出情報を抽出する。サーバ装置は、認識情報記憶部と、認識処理部とを備える。認識情報記憶部は、認識処理に用いる認識情報を記憶する。認識処理部は、抽出部が抽出した抽出情報と認識情報記憶部が記憶する認識情報とに基づいて、記載内容を認識する。
また、上記課題を解決するために、本発明の記載内容認識方法は、クライアント装置と、サーバ装置とで実行する。
クライアント装置は、画像情報の認識処理の対象範囲から対象範囲に記載された記載内容を識別可能な抽出情報を抽出し、サーバ装置は、クライアント装置が抽出した抽出情報と記憶している認識処理に用いる認識情報とに基づいて、記載内容を認識する。
また、上記課題を解決するために、本発明は、以下に示すような処理を、認識処理に用いる認識情報を記憶し、認識情報に基づいて認識処理を実行するサーバ装置と通信可能に接続するクライアント装置に処理を実行させる記載内容認識プログラムを提供する。
クライアント装置に、画像情報の認識処理の対象範囲から対象範囲に記載された記載内容を識別可能な抽出情報を抽出し、抽出情報に基づいて、サーバ装置に記載内容の認識を実行させる。
記載内容認識システム、記載内容認識方法、及び記載内容認識プログラムによれば、通信の負荷を抑止できる。
第一実施形態における記載内容認識システムの概要を示す図である。 第二実施形態における帳票認識システムの概要を示す図である。 第二実施形態におけるクライアント装置のハードウェア構成の一例を示す図である。 第二実施形態における帳票の一例を示す図である。 第二実施形態における文字の特徴量情報の抽出の一例を示す図(その1)である。 第二実施形態における文字の特徴量情報の抽出の一例を示す図(その2)である。 第二実施形態における文字の特徴量情報の一例を示す図である。 第二実施形態におけるクライアント装置の機能ブロックを示す図である。 第二実施形態における抽出情報の一例を示す図である。 第二実施形態におけるサーバ装置の機能ブロックを示す図である。 第二実施形態における認識項目情報の一例を示す図である。 第二実施形態におけるマーク内容情報の一例を示す図である。 第二実施形態における帳票画像の記載内容認識処理を示すシーケンス図(その1)である。 第二実施形態における帳票画像の記載内容認識処理を示すシーケンス図(その2)である。 第二実施形態における認識結果表示画面の一例を示す図である。
以下、実施形態を図面を参照して説明を行う。
[第一実施形態]
図1は、第一実施形態における記載内容認識システムの概要を示す図である。記載内容認識システム1は、画像情報30に記載された記載内容のうち、認識処理の対象範囲31に記載された(位置する)記載内容を認識するシステムである。
記載内容認識システム1は、クライアント装置10と、クライアント装置10と通信可能なサーバ装置20とを含んで構成される。クライアント装置10は、抽出部11を備える。抽出部11は、画像情報30の認識処理の対象範囲31から対象範囲31に記載された記載内容を識別可能な抽出情報を抽出する。
画像情報30は、氏名、住所、及び電話番号の情報を含んでおり、そのうちの氏名の情報だけが対象範囲31に位置する。この場合、抽出部11は、例えば、対象範囲31の部分の画像情報(氏名の情報を含む画像情報)を抽出情報として抽出する。
サーバ装置20は、認識情報記憶部21と認識処理部22とを備える。認識情報記憶部21は、認識処理に用いる認識情報を記憶する。認識情報は、精度の良い認識処理を実現するため(抽出情報から精度よく記載内容を認識するため)に、各種情報(例えば、文字を認識するための文字認識辞書などの抽出情報から記載内容を認識(識別)するための情報)を含んでおり、容量が大きい場合がある。また、認識情報は、適宜更新される場合がある。
認識処理部22は、抽出部11が抽出した抽出情報と認識情報記憶部21が記憶する認識情報とに基づいて、記載内容を認識する。認識処理部22は、クライアント装置10から抽出情報を取得して、認識情報を用いて抽出情報に対して認識処理を行うことで、対象範囲31に位置する「氏名 〇×太郎」を認識する。
次に、記載内容認識システム1における記載内容認識方法について説明する。クライアント装置10は、画像情報30の認識処理の対象範囲31から対象範囲31に記載された記載内容を識別可能な抽出情報を抽出する。サーバ装置20は、クライアント装置10が抽出した抽出情報と、記憶している認識処理に用いる認識情報とに基づいて、対象範囲31に記載された記載内容を認識する。
このように、記載内容認識システム1では、サーバ装置20は、全体(画像情報30)に含まれる認識処理の対象範囲31から抽出された抽出情報に基づいて、対象範囲31に記載された記載内容を認識する。
したがって、記載内容認識システム1は、画像情報30に基づいて認識処理の対象範囲31に記載された記載内容を認識する場合よりも、クライアント装置10からサーバ装置20に送信するデータサイズを抑えることができる。すなわち、記載内容認識システム1は、クライアント装置10とサーバ装置20との通信の負荷を抑止できる。
なお、記載内容認識システム1では、サーバ装置20が認識情報を記憶し、サーバ装置20が認識処理を行うため、クライアント装置10が複数台である場合であっても、記載内容認識システム1は、管理コストの増加を抑止できる。また、記載内容認識システム1では、サーバ装置20が認識情報を記憶し、サーバ装置20が認識処理を行うため、クライアント装置10は、記憶領域が小さい(性能が低い)端末であってもよい。
[第二実施形態]
次に第二実施形態についてより具体的に説明する。図2は、第二実施形態における帳票認識システムの概要を示す図である。
帳票認識システム40は、帳票の記載内容を認識するシステムである。帳票認識システム40は、金融機関などで用いられる。帳票認識システム40は、サーバ装置50と、サーバ装置50とネットワーク80を介して接続する複数のクライアント装置60(図2では複数のうちの一台を図示)と、各クライアント装置60と接続するスキャナ70を含んで構成される。
スキャナ70は、帳票を撮像して帳票の画像情報(以下、帳票画像と呼ぶことがある)を取得して、帳票画像をクライアント装置60に送信する。
クライアント装置60は、金融機関などの窓口に配置され、オペレータによって操作される端末である。クライアント装置60は、サーバ装置50に対して帳票の記載内容(帳票画像に含まれる記載内容)のうち、クライアント装置60が所定の処理に利用する記載内容の認識を依頼する。
より具体的には、クライアント装置60は、帳票の種別に基づいて帳票画像から、クライアント装置60が処理に利用する記載内容を含む範囲の画像情報を取得する。そして、クライアント装置60は、当該画像情報から抽出情報(画像情報よりデータサイズが小さい情報)を抽出し、抽出情報を送信して画像情報に含まれる記載内容の認識をサーバ装置50に依頼する。抽出情報は、記載内容の認識に用いる情報(記載内容を識別可能な情報)である。なお、クライアント装置60が処理に利用する記載内容は、帳票の種別に応じて予め決められている。
サーバ装置50は、クライアント装置60の依頼に基づいて帳票の記載内容の認識を行う装置である。サーバ装置50は、帳票の記載内容の認識を行うために必要な各種情報を記憶する。例えば、サーバ装置50は、処理に利用する記載内容が記載される位置に関する位置情報(座標)を、帳票の種別毎に記憶する。
次にクライアント装置60のハードウェア構成について図3を用いて説明する。図3は、第二実施形態におけるクライアント装置のハードウェア構成の一例を示す図である。クライアント装置60は、プロセッサ61によって装置全体が制御されている。プロセッサ61には、バス69を介してRAM(Random Access Memory)62と複数の周辺機器が接続されている。プロセッサ61は、マルチプロセッサであってもよい。プロセッサ61は、例えばCPU(Central Processing Unit)、MPU(Micro Processing Unit)、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、またはPLD(Programmable Logic Device)である。またプロセッサ61は、CPU、MPU、DSP、ASIC、PLDのうちの2以上の要素の組み合わせであってもよい。
RAM62は、クライアント装置60の主記憶装置として使用される。RAM62には、プロセッサ61に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、RAM62には、プロセッサ61による処理に必要な各種データが格納される。
バス69に接続されている周辺機器としては、HDD(Hard Disk Drive)63、グラフィック処理装置64、入力インタフェース65、光学ドライブ装置66、機器接続インタフェース67及びネットワークインタフェース68がある。
HDD63は、内蔵したディスクに対して、磁気的にデータの書き込み及び読み出しを行う。HDD63は、クライアント装置60の補助記憶装置として使用される。HDD63には、OSのプログラム、アプリケーションプログラム、及び各種データが格納される。なお、補助記憶装置としては、フラッシュメモリなどの半導体記憶装置を使用することもできる。
グラフィック処理装置64には、モニタ64aが接続されている。グラフィック処理装置64は、プロセッサ61からの命令にしたがって、画像をモニタ64aの画面に表示させる。モニタ64aとしては、CRT(Cathode Ray Tube)を用いた表示装置や液晶表示装置などがある。
入力インタフェース65には、キーボード65aとマウス65bとが接続されている。入力インタフェース65は、キーボード65aやマウス65bから送られてくる信号をプロセッサ61に送信する。なお、マウス65bは、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル、タブレット、タッチパッド、トラックボールなどがある。
光学ドライブ装置66は、レーザ光などを利用して、光ディスク66aに記録されたデータの読み取りを行う。光ディスク66aは、光の反射によって読み取り可能なようにデータが記録された可搬型の記録媒体である。光ディスク66aには、DVD(Digital Versatile Disc)、DVD−RAM、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)などがある。
機器接続インタフェース67は、クライアント装置60に周辺機器を接続するための通信インタフェースである。例えば、機器接続インタフェース67には、メモリ装置67aやメモリリーダライタ67bやスキャナ70を接続することができる。メモリ装置67aは、機器接続インタフェース67との通信機能を搭載した記録媒体である。メモリリーダライタ67bは、メモリカード67cへのデータの書き込み、またはメモリカード67cからのデータの読み出しを行う装置である。メモリカード67cは、カード型の記録媒体である。
ネットワークインタフェース68は、ネットワーク80に接続されている。ネットワークインタフェース68は、ネットワーク80を介して、他のコンピュータまたは通信機器との間でデータの送受信を行う。
以上のようなハードウェア構成によって、第二実施形態のクライアント装置60の処理機能を実現することができる。なお、第一実施形態のクライアント装置10、サーバ装置20、及び第二実施形態のサーバ装置50もクライアント装置60と同様のハードウェアにより処理機能を実現することができる。
クライアント装置60は、例えば、コンピュータ読み取り可能な記録媒体に記録されたプログラムを実行することにより、第二実施形態の処理機能を実現する。クライアント装置60に実行させる処理を記述したプログラムは、様々な記録媒体に記録しておくことができる。例えば、クライアント装置60に実行させるプログラムをHDD63に格納しておくことができる。プロセッサ61は、HDD63内のプログラムの少なくとも一部をRAM62にロードし、プログラムを実行する。またクライアント装置60に実行させるプログラムを、光ディスク66a、メモリ装置67a、メモリカード67cなどの可搬型記録媒体に記録しておくこともできる。可搬型記録媒体に格納されたプログラムは、例えばプロセッサ61からの制御により、HDD63にインストールされた後、実行可能となる。またプロセッサ61が、可搬型記録媒体から直接プログラムを読み出して実行することもできる。
次に帳票について図4を用いて具体的に説明する。図4は、第二実施形態における帳票の一例を示す図である。図4に示した帳票100は、振込依頼に関する帳票である。帳票100は、帳票IDを有する。帳票IDは、帳票の種別を識別可能な情報であり、予め決められた位置(例えば、四隅)に記載される。図4に示した帳票100では、帳票IDは、左上に「9999」と記載されている。
また、帳票100は、振替日、振込指定、手数料、勘定科目、先方銀行(銀行,支店)、受取人の預金種目、受取人の口座番号、受取人の略称、受取人の口座名の項目を有する。また、帳票100は、依頼人のカナ氏名、依頼人の漢字氏名、依頼人の住所、金額、受取人の現金、当手、他手、押印(収納印又は振替印)の項目を有する。なお、帳票が有する項目の種類、及び各項目の配置(座標)は、帳票ID(帳票の種別)に応じて決まる。
ところで、クライアント装置60は、所定の処理を行う際、帳票100の上記項目に記載された記載内容のうち、一部の項目に記載された記載内容を処理に利用する。例えば、クライアント装置60は、銀行、支店、金額、預金種目、口座番号、口座名の項目の記載内容を処理に利用する。すなわち、銀行、支店、金額、預金種目、口座番号、口座名の項目が、帳票100における認識対象となる項目(以下、認識項目と呼ぶことがある)となる。この場合、クライアント装置60は、帳票100の帳票画像から、認識項目を含む範囲の画像情報(以下、認識項目画像と呼ぶことがある)を取得し、各認識項目画像から抽出情報(認識項目画像よりデータサイズが小さい情報)を抽出する。
より具体的には、クライアント装置60は、マークが記載された認識項目(例えば、預金種目)の認識項目画像から、マーク位置(マークされたチェックボックス)を示す情報を、抽出情報として抽出する。また、クライアント装置60は、文字が記載された認識項目(例えば、銀行)の認識項目画像から、認識項目に記載された各文字(Aの特徴量情報、Bの特徴量情報、Cの特徴量情報、銀の特徴量情報、行の特徴量情報)の特徴量情報を、抽出情報として抽出する。文字の特徴量情報は、文字を識別可能な情報である。特徴量情報については後で図5〜7を用いて詳細に説明する。
なお、認識項目は、帳票ID(帳票の種別)に応じて予め決められている。そして、帳票ID(帳票の種別)に応じた認識項目に関する認識項目情報(処理に利用する記載内容が記載される位置に関する位置情報)は、サーバ装置50に記憶されている。
次に特徴量情報について図5〜7を用いて説明する。図5、6は、第二実施形態における文字の特徴量情報の抽出の一例を示す図である。図7は、第二実施形態における文字の特徴量情報の一例を示す図である。ここでは、文字の一例として「2」を用いて説明する。
まずはじめに、図5に示すように「2」に対して複数(例えば、16)の領域を重複なく設定する。そして、各領域における「2」を構成する要素(画素)の特徴量を算出する。ここでは、領域110(16の領域の内の1つ)における「2」を構成する要素の特徴量の抽出を図6で具体的に説明する。
図6(a)は、領域110における左右方向の特徴量の抽出の概要を示している。左右方向の特徴量は、領域110において文字を構成する要素の左右方向の連続数(2,3,4,3)のうち、所定の連続数に満たないもの(2以下のもの)を除外した和により算出される。すなわち、領域110からは、左右方向の特徴量が、「10」と抽出される。
図6(b)は、領域110における上下方向の特徴量の抽出の概要を示している。上下方向の特徴量は、領域110において文字を構成する要素の上下方向の連続数(2,3,2,2,2,1)のうち、所定の連続数に満たないもの(2以下のもの)を除外した和により算出される。すなわち、領域110からは、上下方向の特徴量が、「3」と抽出される。
図6(c)は、領域110における右上左下方向の特徴量の抽出の概要を示している。右上左下方向の特徴量は、領域110において文字を構成する要素の右上左下方向の連続数(2,4,4,2)のうち、所定の連続数に満たないもの(2以下のもの)を除外した和により算出される。すなわち、領域110からは、右上左下方向の特徴量が、「8」と抽出される。
図6(d)は、領域110における右下左上方向の特徴量の抽出の概要を示している。右下左上方向の特徴量は、領域110において文字を構成する要素の右下左上方向の連続数(1,2,1,2,1,1,2,1,1)のうち、所定の連続数に満たないもの(2以下のもの)を除外した和により算出される。すなわち、領域110からは、右下左上方向の特徴量が、「0」と抽出される。
上述した4方向(左右方向、上下方向、右上左下方向、右下左上方向)の特徴量を、「2」に対して設定した16の領域全てにおいて抽出することで、図7に示す「2」の特徴量情報120が抽出される。
このようにして文字から抽出した特徴量情報は、文字毎に異なる情報になるため、文字の特定(識別)に用いる事ができる。なお、上述した特徴量情報は、一例であってこれに限らない。特徴量情報は、文字から抽出できる、文字を識別可能な情報であればよい。
次にクライアント装置60の機能について図8を用いて説明する。図8は、第二実施形態におけるクライアント装置の機能ブロックを示す図である。
クライアント装置60は、帳票画像取得部601と、帳票ID画像取得部602と、抽出情報抽出部603と、認識項目情報取得部604とを備える。また、クライアント装置60は、認識項目画像取得部605と、記入枠除去部606と、認識結果取得部607と、認識結果表示部608と、通信部609とを備える。
帳票画像取得部601は、スキャナ70が読取った帳票画像を取得する。帳票ID画像取得部602は、帳票画像から帳票IDを含む範囲の画像情報(以下、帳票ID画像と呼ぶことがある)を取得する。帳票ID画像取得部602は、帳票画像の予め決められた範囲(帳票IDが記載される、予め決められた位置を含む範囲)を帳票ID画像として取得する。
抽出情報抽出部603は、画像情報から抽出情報(画像情報よりもデータサイズが小さい情報)を取得する。抽出情報抽出部603は、マークが記載された認識項目の認識項目画像から、マーク位置(マークされたチェックボックス)を示す情報を、抽出情報として抽出する。また、抽出情報抽出部603は、文字が記載された認識項目の認識項目画像から、認識項目に記載された各文字の特徴量情報を、抽出情報として抽出する。抽出情報抽出部603は、帳票ID画像から帳票IDを構成する各文字の特徴量情報を、抽出情報として抽出する。
ここで抽出される抽出情報について図9を用いて説明する。図9は、第二実施形態における抽出情報の一例を示す図である。
抽出情報603a1は、画像情報が、帳票ID画像または文字が記載される認識項目の認識項目画像である場合に抽出される抽出情報である。抽出情報603a1は、画像情報に含まれる各文字(図9ではN個の文字)の特徴量情報を含んで構成される。
抽出情報603a2は、画像情報が、マークが記入される認識項目の認識項目画像である場合に抽出される抽出情報である。抽出情報603a2は、マーク位置(マークされているチェックボックス)を示す情報を含んで構成される。例えば、マーク位置「1」は、マーク項目の一番左側に位置するチェックボックスにマークがされていることを示している。
なお、抽出情報は一例であってこれに限らない。画像情報に含まれる文字やマークから抽出可能な記載内容の認識に用いる情報(記載内容を識別可能な情報)であればよく、例えば、文字を構成する要素(画素)の色などの情報も抽出情報として抽出してもよい。図8に戻って説明を続ける。
認識項目情報取得部604は、帳票の帳票IDに応じた認識項目情報を取得する。認識項目情報取得部604は、帳票ID画像から抽出した帳票IDの認識に用いる抽出情報を、サーバ装置50に送信して帳票IDに応じた認識項目情報の特定を依頼する。認識項目情報取得部604は、サーバ装置50から特定結果(帳票IDに応じた認識項目情報)を取得する。
認識項目画像取得部605は、認識項目情報取得部604が取得した認識項目情報に基づいて、帳票画像から各認識項目の認識項目画像を取得する。
記入枠除去部606は、認識項目画像から記入枠(外枠、及び点線)を除去する。クライアント装置60は、このように認識項目画像から記入枠を除去することにより、抽出情報抽出部603による抽出情報の抽出の精度を向上させることができる。
認識結果取得部607は、各認識項目画像から抽出した、認識項目に記載された記載内容の認識に用いる抽出情報を、サーバ装置50に送信して認識項目に記載された記載内容の認識をサーバ装置50に依頼する。認識結果取得部607は、サーバ装置50から認識結果(各認識項目の記載内容)を取得する。
認識結果表示部608は、認識結果画像を表示する。通信部609は、サーバ装置50との各種通信を制御する。
次にサーバ装置50が備える機能について図10を用いて説明する。図10は、第二実施形態におけるサーバ装置の機能ブロックを示す図である。
サーバ装置50は、認識項目情報記憶部501と、文字認識辞書502と、マーク内容認識辞書503と、認識処理部504と、認識項目情報特定部505と、通信部506とを含んで構成される。
認識項目情報記憶部501は、帳票ID(帳票の種別)毎に認識項目に関する認識項目情報を記憶する。ここで、認識項目情報について、図11を用いて詳細に説明する。
図11は、第二実施形態における認識項目情報の一例を示す図である。認識項目情報501aは、帳票ID「9999」(帳票100)の認識項目情報である。認識項目情報501aは、項目名と、座標と、属性との項目を含んで構成される。
項目名は、認識項目を識別可能な識別情報であり、項目名には、認識項目の名称が設定される。座標は、帳票における認識項目の位置を示す位置情報である。座標には、帳票の左上を(0,0)とした場合における認識項目の左上、及び右下の相対座標が設定される。属性は、認識項目の記載形式を示す情報である。属性には、認識項目が文字を記載する項目である場合には文字と設定され、マークを記載する項目である場合にはマークと設定される。
例えば、認識項目情報501aには、項目名「銀行」、座標「(50,40)(130,60)」、属性「文字」が設定されている。これは、帳票画像の「(50,40)(130,60)」に位置する「銀行」の項目が認識対象であり、当該認識項目には、文字で情報が記載されていることを示している。
なお、認識項目情報は一例であってこれに限らない。例えば、認識項目情報は、認識項目から抽出情報を抽出する際に利用する他の情報を含んでいてもよい。例えば、認識項目情報は、記載される文字の上限数、記載される文字が手書または活字のどちらであるかを示す情報、記載される文字の形態(漢字、数字、カタカナ)、枠の形状(枠内の入力を支援する点線の有無)などの情報を含んでいてもよい。図10に戻って説明を続ける。
文字認識辞書502は、予め抽出した様々な文字の特徴量情報を記憶する。マーク内容認識辞書503は、マーク項目(マークで内容を記載する項目)の記載内容の認識に用いるマーク内容情報を記憶する。マーク内容情報は、マークの内容を識別可能な情報であり、各チェックボックスを示す情報と、各チェックボックスの内容とを対応付けた情報である。マーク内容認識辞書は、各帳票ID(帳票の種別)のマーク項目毎にマーク内容情報を記憶する。
ここでマーク内容情報について図12を用いて説明する。図12は、第二実施形態におけるマーク内容情報の一例を示す図である。マーク内容情報503aは、帳票100の預金種別の項目のマークの内容を示す情報である。マーク内容情報503aは、チェックボックス番号と、内容との項目を含む。
チェックボックス情報は、チェックボックスを識別可能な情報である。チェックボックス情報「1」は、帳票100の預金種目の項目における左のチェックボックスを示している。チェックボックス情報「2」は、帳票100の預金種目の項目における中央のチェックボックスを示している。チェックボックス情報「3」は、帳票100の預金種目の項目における右のチェックボックスを示している。内容の項目には、対応するチェックボックスにマークが記載された場合に記載内容として認識される内容が設定されている。
例えば、マーク内容情報503aは、チェックボックス情報「1」、内容「普通」が設定されている。これは、チェックボックス情報「1」にマークがされた場合、預金種目の記載内容が「普通」であることを意味する。図10に戻って説明を続ける。
認識処理部504は、抽出情報に基づいて記載内容を認識する。認識処理部504は、抽出情報が、帳票IDの認識に用いる抽出情報である場合には、文字認識辞書502を参照し、抽出情報を構成する各文字の特徴量情報から各文字を特定し、帳票IDを認識する。
認識処理部504は、抽出情報が、マークが記載される認識項目の認識項目画像から抽出された抽出情報である場合には、マーク内容認識辞書503を参照し、認識項目に記載された記載内容を認識する。認識処理部504は、抽出情報が、文字が記載される認識項目の認識項目画像から抽出された抽出情報である場合には、文字認識辞書502を参照し、抽出情報を構成する各文字の特徴量情報から各文字を特定し、認識項目に記載された記載内容を認識する。
認識項目情報特定部505は、認識処理部504が帳票IDを認識した場合に、当該認識した帳票IDに基づいて認識項目情報記憶部501から帳票IDに応じた認識項目情報を特定する。通信部506は、クライアント装置60との各種通信を制御する。
次に帳票画像の記載内容認識処理について図13、14を用いて説明する。図13、14は、第二実施形態における帳票画像の記載内容認識処理を示すシーケンス図である。
[ステップS1]帳票画像取得部601は、スキャナ70から帳票画像を取得する。
[ステップS2]帳票ID画像取得部602は、帳票画像から帳票ID画像を取得する。
[ステップS3]抽出情報抽出部603は、帳票ID画像から帳票IDの認識に用いる抽出情報を抽出する。抽出情報抽出部603は、帳票ID画像から帳票IDを構成する各文字の特徴量情報を抽出情報として抽出する。
[ステップS4]認識項目情報取得部604は、サーバ装置50に対して抽出した抽出情報を送信して、帳票IDに応じた認識項目情報の特定を依頼する。
[ステップS5]認識処理部504は、抽出情報と文字認識辞書502とに基づいて、帳票IDを構成する各文字を特定し、帳票IDを認識する。
[ステップS6]認識項目情報特定部505は、認識処理部504が認識した帳票IDと認識項目情報記憶部501とに基づいて、帳票IDに応じた認識項目情報を特定する。認識項目情報特定部505は、特定結果(認識項目情報)をクライアント装置60に送信する。
[ステップS7]認識項目情報取得部604は、サーバ装置50から特定結果(認識項目情報)を取得する。
[ステップS8]認識項目画像取得部605は、認識項目情報取得部604が取得した認識項目情報に基づいて、帳票画像から認識項目画像を取得する。
[ステップS9]記入枠除去部606は、取得した認識項目画像から記入枠を除去する。
[ステップS10]抽出情報抽出部603は、各認識項目画像から認識項目に記載された記載内容の認識に用いる抽出情報を抽出する。抽出情報抽出部603は、マークが記載された認識項目の認識項目画像から、マーク位置を示す情報を抽出情報として抽出する。また、抽出情報抽出部603は、文字が記載された認識項目の認識項目画像から、認識項目に記載された各文字の特徴量情報を、抽出情報として抽出する。
[ステップS11]認識結果取得部607は、サーバ装置50に対して各認識項目画像から抽出した抽出情報を送信して、各認識項目の記載内容の認識を依頼する。
[ステップS12]認識処理部504は、抽出情報に基づいて認識項目画像に含まれる記載内容(各認識項目の記載内容)を認識する。
認識処理部504は、抽出情報が、マークが記載された認識項目の認識項目画像から抽出された抽出情報である場合には、抽出情報とマーク内容認識辞書503とに基づいて、認識項目に記載された記載内容を認識する。認識処理部504は、抽出情報が、文字が記載される認識項目の認識項目画像から抽出された抽出情報である場合には、抽出情報と文字認識辞書502とに基づいて、抽出情報を構成する各文字を特定し、認識項目に記載された記載内容を認識する。認識処理部504は、各認識項目の記載内容の認識結果をクライアント装置60に送信する。
[ステップS13]認識結果取得部607は、各認識項目の記載内容の認識結果を取得する。
[ステップS14]認識結果表示部608は、各認識項目の記載内容の認識結果を表示画面に表示する。
ここで認識結果表示部608が表示する画面について図15を用いて説明する。図15は、第二実施形態における認識結果表示画面の一例を示す図である。
認識結果表示画面608aは、帳票100の認識項目の認識結果を表示した画面である。認識結果表示画面608aは、帳票100の帳票画像100aと、帳票100の認識項目の認識結果とを併せて表示する。このように、認識結果表示部608が帳票画像100aと、帳票100の認識項目の認識結果とを併せて表示した認識結果表示画面608aを表示することで、オペレータは、帳票画像100aと、認識結果とを見比べて認識結果の誤りを画面上で確認できる。
このような、帳票認識システム40によれば、クライアント装置60は、帳票画像(全体)から、認識項目画像(部分画像)を取得して、当該認識項目画像から認識項目画像よりもデータサイズの小さい抽出情報を抽出し、サーバ装置50に送信する。そして、サーバ装置50は、抽出情報を用いて、認識項目画像に含まれる記載内容を認識する。
したがって、帳票認識システム40は、認識項目画像をサーバ装置50に送信する場合よりも、クライアント装置60からサーバ装置50に送信するデータサイズを抑えることができる。すなわち、帳票認識システム40は、クライアント装置60とサーバ装置50との通信の負荷を抑制できる。
なお、クライアント装置60は、帳票ID画像から抽出した帳票IDの認識に用いる抽出情報を、サーバ装置50に送信して帳票IDに応じた認識項目情報の特定を依頼するとして説明したがこれに限らない。
帳票ID画像のデータサイズが、認識項目画像のデータサイズと比べて小さい場合、例えば、クライアント装置60は、帳票ID画像を画像のままサーバ装置50に送信して帳票IDに応じた認識項目情報の特定を依頼してもよい。この場合、サーバ装置50は、帳票ID画像から抽出情報を抽出して、抽出した抽出情報と文字認識辞書502を用いて帳票IDを認識すればよい。
なお、上記の処理機能は、コンピュータによって実現することができる。その場合、クライアント装置60、サーバ装置50が有すべき機能の処理内容を記述したプログラムが提供される。そのプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体(可搬型記録媒体を含む)に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリなどがある。磁気記録装置には、ハードディスク装置(HDD)、フレキシブルディスク(FD:Flexible Disk)、磁気テープなどがある。光ディスクには、DVD、DVD−RAM、CD−ROM、CD−R/RWなどがある。光磁気記録媒体には、MO(Magneto Optical disk)などがある。
プログラムを流通させる場合には、例えば、そのプログラムが記録されたDVD、CD−ROMなどの可搬型記録媒体が販売される。また、プログラムをサーバコンピュータの記憶装置に格納しておき、ネットワーク80を介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することもできる。
プログラムを実行するコンピュータは、例えば、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、自己の記憶装置に格納する。そして、コンピュータは、自己の記憶装置からプログラムを読み取り、プログラムにしたがった処理を実行する。なお、コンピュータは、可搬型記録媒体から直接プログラムを読み取り、そのプログラムにしたがった処理を実行することもできる。また、コンピュータは、サーバコンピュータからプログラムが転送されるごとに、逐次、受取ったプログラムにしたがった処理を実行することもできる。
なお、上述の実施の形態は、実施の形態の要旨を逸脱しない範囲内において種々の変更を加えることができる。
さらに、上述の実施の形態は、多数の変形、変更が当業者にとって可能であり、説明した正確な構成及び応用例に限定されるものではない。
1 記載内容認識システム
10 クライアント装置
11 抽出部
20 サーバ装置
21 認識情報記憶部
22 認識処理部
30 画像情報
31 対象範囲

Claims (7)

  1. クライアント装置は、
    画像情報の認識処理の対象範囲から前記対象範囲に記載された記載内容を識別可能な抽出情報を抽出する抽出部を備え、
    サーバ装置は、
    前記認識処理に用いる認識情報を記憶する認識情報記憶部と、
    前記抽出部が抽出した前記抽出情報と前記認識情報記憶部が記憶する前記認識情報とに基づいて、前記記載内容を認識する認識処理部と、を備える、
    記載内容認識システム。
  2. 前記抽出情報は、前記対象範囲の部分の前記画像情報よりもデータサイズが小さい情報である、
    請求項1に記載の記載内容認識システム。
  3. 前記対象範囲には、文字で前記記載内容が記載されており、
    前記抽出情報は、文字を識別可能な特徴量情報である、
    請求項2に記載の記載内容認識システム。
  4. 前記対象範囲には、マークで前記記載内容が記載されており、
    前記抽出情報は、マーク位置を示す情報である、
    請求項2に記載の記載内容認識システム。
  5. 前記特徴量情報は、
    文字に対して重複なく設定された複数の領域それぞれから抽出される、前記領域に含まれる文字を構成する要素の特徴量からなる、
    請求項3に記載の記載内容認識システム。
  6. 記載内容認識システムが実行する記載内容認識方法であって、
    クライアント装置は、
    画像情報の認識処理の対象範囲から前記対象範囲に記載された記載内容を識別可能な抽出情報を抽出し、
    前記サーバ装置は、
    前記クライアント装置が抽出した前記抽出情報と記憶している前記認識処理に用いる認識情報とに基づいて、前記記載内容を認識する、
    記載内容認識方法。
  7. 認識処理に用いる認識情報を記憶し、前記認識情報に基づいて認識処理を実行するサーバ装置と通信可能に接続するクライアント装置に、
    画像情報の認識処理の対象範囲から前記対象範囲に記載された記載内容を識別可能な抽出情報を抽出し、
    前記抽出情報に基づいて、前記サーバ装置に前記記載内容の認識を実行させる、
    処理を実行させる記載内容認識プログラム。
JP2015151408A 2015-07-31 2015-07-31 記載内容認識システム、記載内容認識方法、及び記載内容認識プログラム Pending JP2017033205A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015151408A JP2017033205A (ja) 2015-07-31 2015-07-31 記載内容認識システム、記載内容認識方法、及び記載内容認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015151408A JP2017033205A (ja) 2015-07-31 2015-07-31 記載内容認識システム、記載内容認識方法、及び記載内容認識プログラム

Publications (1)

Publication Number Publication Date
JP2017033205A true JP2017033205A (ja) 2017-02-09

Family

ID=57989427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015151408A Pending JP2017033205A (ja) 2015-07-31 2015-07-31 記載内容認識システム、記載内容認識方法、及び記載内容認識プログラム

Country Status (1)

Country Link
JP (1) JP2017033205A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009110204A (ja) * 2007-10-29 2009-05-21 Ricoh Co Ltd 文書処理装置、文書処理システム、文書処理方法及び文書処理プログラム
JP2009212613A (ja) * 2008-02-29 2009-09-17 Oki Data Corp 画像処理装置および画像処理方法
JP2011076390A (ja) * 2009-09-30 2011-04-14 Fujitsu Frontech Ltd マーク項目認識装置、マーク項目認識方法及びマーク項目認識プログラム
JP2011257896A (ja) * 2010-06-08 2011-12-22 Nidec Sankyo Corp 文字認識方法及び文字認識装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009110204A (ja) * 2007-10-29 2009-05-21 Ricoh Co Ltd 文書処理装置、文書処理システム、文書処理方法及び文書処理プログラム
JP2009212613A (ja) * 2008-02-29 2009-09-17 Oki Data Corp 画像処理装置および画像処理方法
JP2011076390A (ja) * 2009-09-30 2011-04-14 Fujitsu Frontech Ltd マーク項目認識装置、マーク項目認識方法及びマーク項目認識プログラム
JP2011257896A (ja) * 2010-06-08 2011-12-22 Nidec Sankyo Corp 文字認識方法及び文字認識装置

Similar Documents

Publication Publication Date Title
AU2017302250B2 (en) Optical character recognition in structured documents
US9098765B2 (en) Systems and methods for capturing and storing image data from a negotiable instrument
US9031308B2 (en) Systems and methods for recreating an image using white space and check element capture
US10440197B2 (en) Devices and methods for enhanced image capture of documents
JP5566971B2 (ja) 情報処理プログラム、情報処理装置および文字認識方法
US9952814B2 (en) Information processing apparatus, information processing method, and recording medium
US11588945B2 (en) Data input support apparatus that displays a window with an item value display area, an overview image display area, and an enlarged image display area
JP2017033205A (ja) 記載内容認識システム、記載内容認識方法、及び記載内容認識プログラム
JP4430490B2 (ja) データエントリ装置及びその制御方法、プログラム
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
JP5243228B2 (ja) 文字認識装置、文字認識装置の確認画面生成方法
WO2018159224A1 (ja) 操作支援装置、操作支援方法、及びコンピュータ読み取り可能な記録媒体
JP2020140340A (ja) 情報処理装置及びプログラム
JP7504674B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP6255929B2 (ja) 情報処理装置、情報処理装置の制御方法、およびプログラム
US12032736B2 (en) Gaze based text manipulation
JP6116508B2 (ja) 帳票読取プログラム、帳票読取方法、および帳票読取システム
US20220230235A1 (en) Financial management using augmented reality systems
JP6692131B2 (ja) 収納先特定プログラム、収納先特定方法、及び情報処理装置
US20230260309A1 (en) Table extraction from image-based documents
JP2018136709A (ja) データ入力装置、データ入力プログラム及びデータ入力システム
JP6471796B2 (ja) 情報処理装置、情報処理装置の制御方法、およびプログラム
JP6438369B2 (ja) 帳票画像判定プログラム、帳票画像判定方法および帳票画像判定システム
JP6586857B2 (ja) 情報処理装置及び情報処理プログラム
JP2021105911A (ja) 情報処理装置、制御方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170911

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180824

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180904

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190312