JP2021179896A - 情報処理装置、情報処理方法及び情報処理プログラム - Google Patents

情報処理装置、情報処理方法及び情報処理プログラム Download PDF

Info

Publication number
JP2021179896A
JP2021179896A JP2020085865A JP2020085865A JP2021179896A JP 2021179896 A JP2021179896 A JP 2021179896A JP 2020085865 A JP2020085865 A JP 2020085865A JP 2020085865 A JP2020085865 A JP 2020085865A JP 2021179896 A JP2021179896 A JP 2021179896A
Authority
JP
Japan
Prior art keywords
item
unit
character
characters
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020085865A
Other languages
English (en)
Other versions
JP6899603B1 (ja
Inventor
正三 中島
Shozo Nakajima
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Double Standard Inc
Original Assignee
Double Standard Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Double Standard Inc filed Critical Double Standard Inc
Priority to JP2020085865A priority Critical patent/JP6899603B1/ja
Priority to JP2021094043A priority patent/JP2021179999A/ja
Application granted granted Critical
Publication of JP6899603B1 publication Critical patent/JP6899603B1/ja
Publication of JP2021179896A publication Critical patent/JP2021179896A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】文書を効果的に読み取ることのできる情報処理装置、情報処理方法及び情報処理プログラムを提供すること。【解決手段】本発明に係る情報処理装置は、書類の画像から文字を認識する認識部と、書類から取得する項目の情報を参照し、認識部が認識した文字に項目が存在するか否かを判定する判定部と、判定部が存在すると判定しない項目がある場合、該項目を構成する各文字を認識部が認識した文字から探索する探索部と、探索部により探索された各文字を項目として認識可能に処理する結合部と、項目に対応する文字を取得する取得部と、を備える。【選択図】図1

Description

本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。
業務効率化や手続きの利便性向上のためなど、文書を電子化する機会が増大している。例えば、金融業界では、諸契約をオンラインで行うことができるように、本人確認書類を読み取った画像に基づき本人確認を行う契約関連書類確認システムが提案されている(特許文献1参照)。この契約関連書類確認システムは、顧客と会社との間の契約に伴う処理を行なう自動契約機と、この自動契約機に通信回線を介して接続され、受信した顧客情報を利用して顧客の本人確認を行なう契約管理サーバとを有している。
自動契約機は、顧客の契約に関する契約関連書類の画像を読み取る画像読取手段と、画像読取手段によって読み取られた画像に基づき、画像上の文字列を認識する文字列認識手段と、認識された文字列の中から第1の定型単語と第2の定型単語との間に存在する文字情報を抽出する文字情報抽出手段と、抽出された文字情報を第1の定型単語及び第2の定型単語の種類から顧客属性に割り当てて顧客属性情報とする属性割当手段と、属性割当手段によって得られた顧客属性情報を含む顧客情報を契約管理サーバへ送信する顧客情報送信手段とを有している。
また、契約管理サーバは、受信した顧客情報の中の顧客属性情報が正当なものであるか否かを確認する顧客属性情報確認手段と、顧客属性情報確認手段により顧客属性情報が正当なものであると確認された場合に顧客情報に基づき本人確認を行う本人確認手段とを有している。
契約関連書類確認システムによれば、文字列認識手段により画像読取手段によって読み取られた画像から文字列が認識され、文字情報抽出手段により文字列認識手段によって認識された文字列の中から第1の定型単語と第2の定型単語との間に存在する文字情報が抽出され、属性割当手段により抽出された文字情報を第1及び第2の定型単語の種類から顧客属性に割り当てて顧客属性情報とし、その上で、顧客情報送信手段によりこの顧客属性情報を含む顧客情報を契約管理サーバへ送信するようにし、契約管理サーバにおいて、顧客属性情報確認手段により顧客情報の中の顧客属性情報が正当なものであるか否かを確認し、正当なものであると確認された場合に、顧客属性情報に基づき本人確認を行うことが可能となる、としている。
特開2008−129892号公報
しかしながら、書類によって項目の位置が異なる、項目の記載方法が異なるなど、従来の手法では文書をうまく読み取ることができない場合があり、未だ向上の余地がある。
本発明は、上記課題に鑑みてなされたものであり、文書を効果的に読み取ることのできる情報処理装置、情報処理方法及び情報処理プログラムを提供することを目的とする。
上記課題を解決するため、本発明の情報処理装置は、書類の画像から文字を認識する認識部と、書類から取得する項目の情報を参照し、認識部が認識した文字に項目が存在するか否かを判定する判定部と、判定部が存在すると判定しない項目がある場合、該項目を構成する各文字を認識部が認識した文字から探索する探索部と、探索部により探索された各文字を項目として認識可能に処理する結合部と、項目に対応する文字を取得する取得部と、を備える。
本発明によれば、文書を効果的に読み取ることのできる情報処理装置、情報処理方法及び情報処理プログラムを提供することができる。
実施形態に係る情報処理サーバのハード構成の一例を示す図である。 実施形態に係る情報処理サーバの記憶装置に記憶されているデータベースの一例を示す図である。 各データベースに記憶されている情報の一例を示す図である。 実施形態に係る情報処理サーバの機能ブロックの一例を示す図である。 実施形態に係る情報処理サーバの文字認識処理の一例を示すフローチャートである。 実施形態に係る情報処理サーバの認識部による文字認識の一例を示す図である。 実施形態に係る情報処理サーバの認識部による位置情報付与の一例を示す図である。 実施形態に係る情報処理サーバの探索部による探索の一例を示す図である。 実施形態に係る情報処理サーバの結合部による横方向の結合の一例を示す図である。 実施形態に係る情報処理サーバの結合部による縦方向の結合の一例を示す図である。
以下、本発明の実施形態を図面に基づいて説明する。また、読み取る書類として本人確認書類(例えば、運転免許証の他、パスポート(旅券)、住民基本台帳カード、在留カードなど)を例に説明するが、書類は本人確認書類に限られない。
[実施形態]
図1は、本実施形態に係る情報処理サーバ1(情報処理装置)のハード構成の一例を示す図である。図1に示すように、情報処理サーバ1は、通信IF100A、記憶装置100B及びCPU100Cがバス100Dを介して接続された構成を備える。
通信IF100Aは、外部端末と通信するためのインターフェースである。
記憶装置100Bは、例えば、HDDや半導体記憶装置である。記憶装置100Bには、情報処理サーバ1で利用する情報処理プログラムや各種データベースが記憶されている。なお、本実施形態では、情報処理プログラムや各種データベースは、情報処理サーバ1の記憶装置100Bに記憶されているが、USBメモリなどの外部記憶装置やネットワークを介して接続された外部サーバに記憶し、必要に応じて参照やダウンロード可能に構成されていてもよい。
図2は、情報処理サーバ1の記憶装置100Bに記憶されているデータベースの一例を示す図である。図2に示すように、記憶装置100Bには、補正パタンデータベース1(以下、補正パタンDB1)、分類用データベース2(以下、分類用DB2)、項目マスタデータベース3(以下、項目マスタDB3)が記憶されている。
(補正パタンDB1)
補正パタンDB1は、書類の画像データを補正するための補正パタンが複数記憶されている。図3(a)は、補正パタンDB1に記憶されている情報の一例を示す図である。図3(a)に示すように、複数の補正パタンは、それぞれ1以上の補正を組み合わせて構成されている。例えば、補正パタン1は、補正1及び3を組み合わせて構成される。また、補正パタン2は、補正1、2及び4を組み合わせて構成される。また、補正パタン3は、補正1、2及び3を組み合わせて構成される。また、補正パタン4は、補正1、3及び5を組み合わせて構成される。また、補正パタン5は、補正1及び4を組み合わせて構成される。なお、補正パタンの数は5に限られず3以上であればよい。
また、補正1〜補正5は、例えば、それぞれ遠近法ワープ(台形補正)、明るさ補正、コントラスト補正、ガウス補正、ぼかし補正などである。なお、図3(a)に示す各補正パタンの補正の組み合わせはあくまで一例であり、各補正パタンをどのような補正で構成するかは任意である。また、補正は、補正1〜補正5の5つに限られない。
(分類用DB2)
分類用DB2には、書類を分類するための情報が記憶されている。図3(b)は、分類用DB2に記憶されている情報の一例を示す図である。図3(b)に示すように、分類用DB2には、書類の種別ごとに特有のパタンマッチ用データ(画像データや特徴点データ(例えば、印章の画像データや特徴点データなど))やキーワード(KW)が関連付けて記憶されている。なお、図3(b)に示すパタンマッチ用データやキーワードはあくまで一例であり、書類を分類するための情報として、どのようなパタンマッチ用データやキーワードとするかは任意である。後述の分類部106は、分類用DB2を参照し、文書の画像データにパタンマッチ用データやキーワードが含まれているが否かに基づいて、書類の画像データを分類する。
(項目マスタDB3)
取得する項目の情報が書類の種別ごとに記憶されている。図3(c)は、項目マスタDB3に記憶されている情報の一例を示す図である。図3(c)に示すように、項目マスタDB3には、書類の種別ごとに取得する情報の項目が関連付けて記憶されている。なお、書類からどのような項目の情報を取得するかは任意である。
CPU100Cは、情報処理サーバ1を制御し、図示しないROM(Read Only Memory)及びRAM(Random Access Memory)を備えている。
図4に示すように、情報処理サーバ1は、受信部101、送信部102、記憶装置制御部103、補正部104、認識部105、分類部106、判定部107、探索部108、結合部109、取得部110などの機能を有する。なお、図4に示す機能は、情報処理サーバ1のROM(不図示)に記憶された情報処理プログラムをCPU100Cが実行することにより実現される。
受信部101は、外部から送信される情報、例えば、書類の画像データなどを受信する。
送信部102は、認識したデータなどを外部へ送信する。
記憶装置制御部103は、記憶装置100Bを制御する。具体的には、記憶装置制御部103は、記憶装置100Bを制御して情報の書き込みや読み出しを行う。
補正部104は、書類の画像データを、補正パタンDB1に記憶されている複数の補正パタン(各補正パタンには、各々1以上の異なる補正が含まれている)により補正し、各補正パタンに対応する複数の補正後の画像を生成する。具体的には、補正部104は、画像データを補正パタン1で補正した補正後画像データ1を生成する。また、補正部104は、画像データを補正パタン2で補正した補正後画像データ2を生成する。また、補正部104は、画像データを補正パタン3で補正した補正後画像データ3を生成する。また、補正部104は、画像データを補正パタン4で補正した補正後画像データ4を生成する。また、補正部104は、画像データを補正パタン5で補正した補正後画像データ5を生成する。
認識部105は、書類の画像データから文字を認識する。ここで、認識部105は、補正部104で生成された各補正パタンに対応する複数の補正後の画像から文字を認識する。次いで、認識部105は、複数の補正後の画像データから認識した文字のうち最も多いものを選択し、認識した文字とする。また、認識部105は、認識した文字に位置情報を付与する。なお、位置情報は、書類の左上をゼロ点としたXY座標により表され、書類に向かって横方向がX軸(右方向が正)、縦方向がY軸(下方向が正)となっている。なお、座標を表す数値に画素数を利用してもよい。また、書類のどの位置をゼロ点とするかは任意である。また、座標を表す数値に画素数以外の数値を利用してもよい。
なお、認識部105は、書類の画像データから文字を認識する際、認識した文字の位置情報(座標)が横方向(X軸)又は縦方向(Y軸)において所定距離内である場合(例えば、文字の位置を示す座標が重なっている場合)、一続きの言葉を構成する文字であると認識し、認識した文字の位置情報(座標)が横方向(X軸)又は縦方向(Y軸)において所定距離より離れている場合(例えば、文字の位置を示す座標が重なっている場合)、一続きの言葉を構成する文字でなく別の文字又は言葉を構成する文字であると認識する。なお、文字の位置を示す座標が重なっているとは、例えば、「言葉」の文字が書類上に横方向(X軸)に記載されている場合、「言」の文字の右端の位置座標が、「葉」の文字の左端の位置座標よりも横方向(X軸)において右側に存在する場合、換言すると、「葉」の文字の左端の位置座標が、「言」の文字の右端の位置座標よりも横方向(X軸)において左側に存在する場合をいう。また、例えば、「言葉」の文字が書類上に縦方向(Y軸)に記載されている場合、「言」の文字の下端の位置座標が、「葉」の文字の上端の位置座標よりも縦方向(Y軸)において下側に存在する場合、換言すると、「葉」の文字の上端の位置座標が、「言」の文字の下端の位置座標よりも縦方向(X軸)において上側に存在する場合をいう。
分類部106は、分類用DB2を参照し、書類の画像データを分類する。具体的には、分類部106は、分類用DB2を参照し、書類の種別ごとに用意されたパタンマッチ用データやキーワードが存在するか否かに応じて、画像データのもととなった書類を分類する。分類部106は、分類した情報(書類の種別情報)を書類の画像データに付与する。
判定部107は、取得する項目の情報が書類の種別ごとに記憶された項目マスタDB3を参照し、認識部105が認識した文字に項目が存在するか否かを、項目ごとに判定する。
探索部108は、判定部107が存在すると判定しない項目がある場合、該項目を構成する各文字を認識部105が認識した文字から探索する。ここで、探索部108は、各文字のうちの1文字を起点とした所定範囲内に項目を構成する他の文字が存在するか探索する。
結合部109は、探索部108により探索された書類の画像データ上の文字を項目として認識可能なようにデータ的に結合する。
取得部110は、項目に対応する文字を、項目ごとに取得する。具体的には、取得部110は、項目の第1側(本実施形態では右側)に存在する次の項目(次項目)までの文字又は改行までの文字を項目に対応する文字として取得する。また、取得部110は、項目の第1側(本実施形態では右側)の所定範囲内に文字(項目を構成する文字を除く)が存在しない場合、項目の第1側とは異なる第2側(本実施形態では下側)に存在する次の項目(次項目)までの文字又は改行までの文字を、項目に対応する文字として取得する。
(情報処理方法)
図5は、実施形態に係る情報処理サーバの書類分別処理の一例を示すフローチャートである。
(ステップS101)
情報処理サーバ1の補正部104は、補正パタンDB1を参照し、文書の画像データを補正する。具体的には、補正部104は、書類の画像データを、補正パタンDB1に記憶されている複数の補正パタン(各補正パタンには、各々1以上の異なる補正が含まれている)により補正し、各補正パタンに対応する複数の補正後の画像を生成する。
(ステップS102)
情報処理サーバ1の認識部105は、書類の画像データから文字を認識する。具体的には、認識部105は、補正部104で生成された各補正パタンに対応する複数の補正後の画像から文字を認識する。次いで、認識部105は、複数の補正後の画像データから認識した文字のうち最も多いものを選択し、認識した文字とする。
図6は、認識部105による文字認識の一例を示す図である。図6に示すように、認識部105は、補正部104で生成された各補正パタンに対応する複数の補正後の画像から文字を認識する。図6に示す例では、補正パタン1、3及び5では、認識結果が「山田太郎」となっている。また、補正パタン2では、認識結果が「山田大郎」となっている。また、補正パタン3では、認識結果が「認識不可」、すなわち文字を認識することができなかったとなっている。認識部105は、複数の補正後の画像データから認識した文字のうち最も多いもの、図6に示す例では「山田太郎」を選択し、認識した文字として決定する。なお、認識した文字のうち最も多いものがない場合(例えば、補正パタン1〜5の判定結果がそれぞれ2、2、2、2、1の場合)は、再度、ステップS102の処理を行ってもよいし、補正パタンを変更してステップS102の処理を行ってもよい、また、読み取れなったとして報知(エラーを出力)するようにしてもよい。
(ステップS103)
情報処理サーバ1の認識部105は、認識した文字に位置情報を付与する。図7は、認識部105による位置情報付与の一例を示す図である(図中の破線、矢印、Top、Left、Bottom、Rightの文字は、説明のために図示したものであり、実際の画像データとして存在するものではない)。図7(a)は、認識対象である書類の画像データの一例、図7(b)は、図7(a)を認識した文字に付与された位置情報の一例である。図7に示すように、認識部105は、書類の左上をゼロ点としたXY座標により表される位置情報を認識した文字に付与する。図7(b)に示す例では、Topは文字の上端、Leftは文字の左端、Bottomは、文字の下端、Rightは文字の右端、Wordは認識した文字である。なお、上述したように、本実施形態では、位置情報は書類の左上をゼロ点としたXY座標により表され、座標の数値には画素数が利用されている。
上記のようにして、認識部105は、画像データに含まれる全ての文字を認識し、認識した文字に、書類の左上をゼロ点としたXY座標により表される位置情報を付与する。なお、図7に示す例では、文字の上端(Top)、左端(Left)、下端(Bottom)、右端(Right)は、実際の文字から離れた位置となっているが、これは認識した文字のフォントサイズに応じて文字の上端(Top)、左端(Left)、下端(Bottom)、右端(Right)が決定されるためである。また、本実施形態では、文字の位置情報を上端(Top)、左端(Left)、下端(Bottom)、右端(Right)で示しているが、文字の左上及び右下のそれぞれのX軸及びY軸の位置座標、又は文字の右上及び左下のそれぞれのX軸及びY軸の位置座標で文字の位置を示すようにしてもよい。
(ステップS104)
分類部106は、分類用DB2を参照し、書類の画像データを分類する。具体的には、分類部106は、分類用DB2を参照し、認識部105で認識された文字に、用意されたパタンマッチ用データやキーワードが存在するか否か書類の種別ごとに判定する。認識部105で認識された文字に、用意されたパタンマッチ用データ又はキーワードのいずれか一つが含まれている場合、分類部106は、書類の画像データを、該パタンマッチ用データ又はキーワードに対応する種別に分類する。また、分類部106は、分類した情報(書類の種別情報)を書類の画像データに付与する。
(ステップS105)
判定部107は、項目マスタDB3を参照し、分類部106で分類された書類の種別に対応する項目が存在するか否かを項目ごとに判定する。判定部107が存在すると判定しない項目がある場合(YES)、情報処理サーバ1は、ステップS106の処理へ移行する。また、判定部107が存在すると判定しない項目がない場合(NO)、情報処理サーバ1は、ステップS108の処理へ移行する。
(ステップS106)
探索部108は、判定部107により存在しないとされた項目を構成する各文字を認識部105が認識した文字から探索する。ここで、探索部108は、各文字のうちの1文字を起点とした所定範囲内に項目を構成する他の文字が存在するか探索する。
図8は、探索部108による探索の一例を示す図である(図中の破線、矢印、Top、Left、Bottom、Rightの文字は、説明のために図示したものであり、実際の画像データとして存在するものではない)。図8(a)は、探索部108による横方向(X座標)探索の一例を示す図である。図8(a)に示すように「氏名」の項目が、横方向(X軸方向)に所定間隔以上離れて配置されている場合、「氏」の文字と「名」の文字とがそれぞれ単独で読み取られるため、「氏名」の項目が書類上に存在するにも関わらず「氏名」の項目として認識することができない。そこで、探索部108は、「氏名」の項目を構成する各文字のうちの1文字である「氏」を起点とした所定範囲内に「氏名」の項目を構成する他の文字である「名」が存在するか探索する。より具体的には、探索部108は、「氏」の文字のY座標内のX軸線上に連続して「名」の文字が存在するかを探索する。
なお、文字が横方向(X軸方向)に並んで配置されているか否かの判断は、認識部105が認識した文字の上端(図8(a)の「Top」の位置)又は下端(図8(a)の「Bottom」の位置)を基準としてもよい。具体的には、横方向(X軸方向)に所定間隔離れた各文字(図8(a)に示す例では「氏」及び「名」)の上端Top又は下端BottomのY座標の値(ゼロ点からの画素数)の差が所定範囲内(例えば、±20画素)であれば文字が横方向(X軸方向)に並んで配置されていると判定するようにしてもよい。項目を構成する文字同士であれば、通常、同じフォント及びサイズであると考えられることから横方向(X軸方向)に所定間隔離れた各文字(図8(a)に示す例では「氏」及び「名」)の上端Top又は下端BottomのY座標の値(ゼロ点からの画素数)の差が所定範囲内であれば文字が横方向(X軸方向)に並んで配置されていると判定することができる。
図8(b)は、探索部108による縦方向(Y座標)探索の一例を示す図である。図8(b)に示すように「記号」の項目が、縦方向(Y軸方向)に配置されている場合、「記」の文字と「号」の文字とがそれぞれ単独で読み取られるため、「記号」の項目が書類上に存在するにも関わらず「記号」の項目として認識することができない。そこで、探索部108は、「記号」の項目を構成する各文字のうちの1文字である「記」を起点とした所定範囲内に「記号」の項目を構成する他の文字である「号」が存在するか探索する。より具体的には、探索部108は、「記」の文字のX座標内のY軸線上に連続して「号」の文字が存在するかを探索する。
なお、文字が縦方向(Y軸方向)に並んで配置されているか否かの判断は、認識部105が認識した文字の左端(図8(b)の「Left」の位置)又は右端(図8(b)の「Right」の位置)を基準としてもよい。具体的には、縦方向(Y軸方向)に所定間隔離れた各文字(図8(b)に示す例では「記」及び「号」)の左端L又は右端RのZ座標の値(ゼロ点からの画素数)の差が所定範囲内(例えば、±20画素)であれば文字が縦方向(Y軸方向)に並んで配置されていると判定するようにしてもよい。項目を構成する文字同士であれば、通常、同じフォント及びサイズであると考えられることから縦方向(Y軸方向)に所定間隔離れた各文字(図8(b)に示す例では「記」及び「号」)の左端L又は右端RのX座標の値(ゼロ点からの画素数)の差が所定範囲内であれば文字が縦方向(Y軸方向)に並んで配置されていると判定することができる。
以上のように、探索部108は、各文字のうちの1文字を起点として横方向(Z軸方向)及び縦方向(Y軸方向)に項目を構成する他の文字が存在するか探索する。具体的には、項目を構成する各文字のうちの最初の1文字のY座標内のX軸線上に連続して、項目を構成する他の文字が存在するかを探索する。探索部108は、項目を構成する各文字のうちの最初の1文字のY座標内のX軸線上に連続して、項目を構成する他の文字が存在しない場合、項目を構成する各文字のうちの最初の1文字のX座標内のY軸線上に連続して、項目を構成する他の文字が存在するかを探索する。
(ステップS107)
結合部109は、探索部108により探索された書類の画像データ上の文字を、項目として認識可能なようにデータ的に結合する。より具体的には、結合部109は、探索部108により探索された文字を結合して、項目として認識できるようにデータ的に結合する処理を行う。図9は、結合部109による横方向の文字の結合の一例を示す図である(図中の破線は説明のために図示したものであり、実際の画像データとして存在するものではない)。図9(a)は、結合前の文字の画像データの一例を示す図である。図9(b)は、認識部105で認識された「氏」及び「名」の文字に各々付与された位置情報の一例である。図9(c)は、結合部109による結合後の文字の画像データの一例を示す図である。図9(d)は、結合後の「氏名」の文字に付与された位置情報の一例である。図9(c)及び図9(d)に示すように結合部109は、「氏」の左端(Left)の位置情報を「氏名」の左端(Left)の位置情報とし、「名」の右端(Right)の位置情報を「氏名」の右端(Right)の位置情報とすることで、「氏」「名」の文字を一つの項目「氏名」として認識可能なようにデータ的に結合する。
図10は、結合部109による縦方向の文字の結合の一例を示す図である(図中の破線は説明のために図示したものであり、実際の画像データとして存在するものではない)。図10(a)は、結合前の文字の画像データの一例を示す図である。図10(b)は、認識部105で認識された「記」及び「号」の文字に各々付与された位置情報の一例である。図10(c)は、結合部109による結合後の文字の画像データの一例を示す図である。図10(d)は、結合後の「記号」の文字に付与された位置情報の一例である。図10(c)及び図10(d)に示すように結合部109は、「記」の上端(Top)の位置情報を「記号」の上端(Top)の位置情報とし、「号」の下端(Bottom)の位置情報を「記号」の下端(Bottom)の位置情報とすることで、「記」「号」の文字を一つの項目「記号」として認識可能なようにデータ的に結合する。
このように、結合部109は、探索部108により探索された文字を結合し、一つの情報として取り扱うことができるように結合処理を行う。
(ステップS108)
取得部110は、各項目に対応する文字を取得する。具体的には、取得部110は、項目の第1側(本実施形態では右側)に存在する次の項目(次項目)又は改行までの文字を項目に対応する文字として取得する(図9に示す例では「山田太郎」の文字、図10に示す例では「201375」の文字)。また、取得部110は、項目の第1側(本実施形態では右側:横書きに対応)の所定範囲内に文字(項目を構成する文字を除く)が存在しない場合、項目の第1側とは異なる第2側(本実施形態では下側:縦書きに対応)に存在する次の項目(次項目)又は改行までの文字を、項目に対応する文字として取得する。
なお、取得部110は、分類部106で分類された処理の種別に応じて、項目の第1側(本実施形態では右側)に存在する文字を項目に対応する文字として取得するか、項目の第2側(本実施形態では下側:縦書きに対応)に存在する文字を項目に対応する文字として取得するかを決定するようにしてもよい。この場合、縦書きの書類であるか横書きの書類であるかを書類の種別に対応して分類用DB2に記憶しておき、取得部110は、分類用DB2を参照し、分類部106で分類された処理の種別に応じて、項目の第1側(本実施形態では右側)に存在する文字を項目に対応する文字として取得するか、項目の第2側(本実施形態では下側:縦書きに対応)に存在する文字を、項目に対応する文字として取得するかを決定するようにしてもよい。
(効果)
以上のように、実施形態に係る情報処理サーバ1は、書類の画像から文字を認識する認識部105と、書類から取得する項目の情報を参照し、認識部105が認識した文字に項目が存在するか否かを判定する判定部107と、判定部107が存在すると判定しない項目がある場合、該項目を構成する各文字を認識部105が認識した文字から探索する探索部108と、探索部108により探索された各文字を項目として認識可能に処理する結合部109と、各項目に対応する文字を取得する取得部110とを備える。このため、文書を効果的に読み取ることができ、文書の文字認識率が向上する。
また、本実施形態に係る情報処理サーバ1の探索部108は、各文字のうちの1文字を起点とした所定範囲内に項目を構成する他の文字が存在するか探索する。このように所定範囲内を探索するため、離れた箇所に存在する文字を間違って項目を構成する文字として認識することがない。このため、項目に対応する情報を間違って取得する虞を低減することができる。
また、本実施形態に係る情報処理サーバ1の取得部110は、項目の第1側に存在する文字を、項目に対応する文字として取得する。このため、項目に対応する情報を間違って取得する虞を低減することができる。
また、本実施形態に係る情報処理サーバ1の取得部110は、項目の第1側の所定範囲内に文字が存在しない場合、項目の第1側とは異なる第2側に存在する文字を、項目に対応する文字として取得する。このため、項目に対応する情報をより効果的に取得することができる。
また、本実施形態に係る情報処理サーバ1は、書類の画像を複数の補正パタンにより補正し、各補正パタンに対応する複数の補正後の画像を生成する補正部104を備えている。そして、認識部105は、補正部104で生成された各補正パタンに対応する複数の補正後の画像から文字を認識し、複数の補正後の画像から認識した文字のうち最も多いものを選択する。このため、文字を誤って読み取る確率及び文字を読み取れない確率の少なくとも一方を低減することができ、文字認識の正答率が向上する。
また、本実施形態では、補正パタンは、各々1以上の異なる補正を含んでいる。このように1以上の異なる補正を組み合わせているので、文字を誤って読み取る確率や文字を読み取れない確率の少なくとも一方をより低減することができ、文字認識の正答率が更に向上する。
[実施形態の変形例1]
上記実施形態では、分類部106は、分類用DB2を参照し、認識部105で認識された文字に、用意されたパタンマッチ用データやキーワードが存在するか否か書類の種別ごとに判定し、認識部105で認識された文字に、用意されたパタンマッチ用データ又はキーワードのいずれか一つが含まれている場合、書類の画像データを、該パタンマッチ用データ又はキーワードに対応する種別に分類している。
しかしながら、分類部106は、分類用DB2を参照し、認識部105で認識された文字に、用意されたパタンマッチ用データやキーワードが存在するか否か書類の種別ごとに判定し、認識部105で認識された文字に、用意されたパタンマッチ用データやキーワードが最も多く含まれている種別に書類の画像データを分類するようにしてもよい。
また、分類用DB2に、書類の種別ごとに含まれていてはいけないパタンマッチ用データ(画像データや特徴点データ(例えば、印章の画像データや特徴点データなど))やキーワード(KW)を記憶し、認識部105で認識された文字に、該含まれていてはいけないパタンマッチ用データやキーワードが含まれている場合、書類の画像データを、該パタンマッチ用データ又はキーワードに対応する種別に分類しないようにしてもよい。
[実施形態の変形例2]
また、上記実施形態では、項目マスタDB3には、書類の種別ごとに取得する情報の項目が関連付けて記憶されているが、書類の種別ごとに取得する情報の項目の名称に、統一された項目の名称を関連付けて記憶するようにしてもよい。書類の種別によって同じ内容であるにも関わらず項目の名称が異なる場合がある。例えば、ある種別の書類では項目が「氏名」となっているが、他の種別の書類では項目が「名前」となっていることが考えられる。また、ある種別の書類では項目が「住所」となっているが、他の種別の書類では項目が「住まい」となっていることが考えられる。
このような場合に、項目マスタDB3に、書類の種別ごとに取得する情報の項目の名称(例えば「住所」や「住まい」)に、統一された項目の名称(例えば「住所」)を関連付けて記憶し、項目に対応する文字に統一された項目の情報を付与するようにしてもよい。このように構成することで、書類の種別により異なる項目の名称を統一して管理することができ、例えば、検索や名寄せ等、データ利用の利便性が向上する。
以上のように、本発明は、種々の書類の読み取りに利用することができる。
1 情報処理装置
100A 通信IF
100B 記憶装置
100C CPU
100D バス(BUS)
101 受信部
102 送信部
103 記憶装置制御部
104 補正部
105 認識部
106 分類部
107 判定部
108 探索部
109 結合部
110 取得部
DB1 補正パタンデータベース
DB2 帳票データベース
DB3 項目マスタデータベース

Claims (8)

  1. 書類の画像から文字を認識する認識部と、
    前記書類から取得する項目の情報を参照し、前記認識部が認識した文字に前記項目が存在するか否かを判定する判定部と、
    前記判定部が存在すると判定しない項目がある場合、該項目を構成する各文字を前記認識部が認識した文字から探索する探索部と、
    前記探索部により探索された各文字を項目として認識可能に処理する結合部と、
    前記項目に対応する文字を取得する取得部と、
    を備えることを特徴とする情報処理装置。
  2. 前記探索部は、
    前記各文字のうちの1文字を起点とした所定範囲内に前記項目を構成する他の文字が存在するか探索することを特徴とする請求項1に記載の情報処理装置。
  3. 前記取得部は、
    前記項目の第1側に存在する文字を、前記項目に対応する文字として取得することを特徴とする請求項1又は請求項2に記載の情報処理装置。
  4. 前記取得部は、
    前記項目の第1側の所定範囲内に文字が存在しない場合、前記項目の第1側とは異なる第2側に存在する文字を、前記項目に対応する文字として取得することを特徴とする請求項3に記載の情報処理装置。
  5. 前記書類の画像を複数の補正パタンにより補正し、各補正パタンに対応する複数の補正後の画像を生成する補正部を備え、
    前記認識部は、
    前記補正部で生成された各補正パタンに対応する複数の補正後の画像から文字を認識し、
    前記複数の補正後の画像から認識した文字のうち最も多いものを選択する
    ことを特徴とする請求項1乃至請求項4のいずれかに記載の情報処理装置。
  6. 前記補正パタンは、
    各々1以上の異なる補正を含むことを特徴とする
    請求項5に記載の情報処理装置。
  7. 認識部が、書類の画像から文字を認識する工程と、
    判定部が、前記書類から取得する項目の情報を参照し、前記認識部が認識した文字に前記項目が存在するか否かを判定する工程と、
    探索部が、前記判定部が存在すると判定しない項目がある場合、該項目を構成する各文字を前記認識部が認識した文字から探索する工程と、
    結合部が、前記探索部により探索された各文字を項目として認識可能に処理する工程と、
    取得部が、前記項目に対応する文字を取得する工程と、
    を有することを特徴とする情報処理方法。
  8. コンピュータを、
    書類の画像から文字を認識する認識部、
    前記書類から取得する項目の情報を参照し、前記認識部が認識した文字に前記項目が存在するか否かを判定する判定部、
    前記判定部が存在すると判定しない項目がある場合、該項目を構成する各文字を前記認識部が認識した文字から探索する探索部、
    前記探索部により探索された各文字を項目として認識可能に処理する結合部、
    前記項目に対応する文字を取得する取得部、
    として機能させることを特徴とする情報処理プログラム。

JP2020085865A 2020-05-15 2020-05-15 情報処理装置、情報処理方法及び情報処理プログラム Active JP6899603B1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020085865A JP6899603B1 (ja) 2020-05-15 2020-05-15 情報処理装置、情報処理方法及び情報処理プログラム
JP2021094043A JP2021179999A (ja) 2020-05-15 2021-06-04 情報処理装置、情報処理方法及び情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020085865A JP6899603B1 (ja) 2020-05-15 2020-05-15 情報処理装置、情報処理方法及び情報処理プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021094043A Division JP2021179999A (ja) 2020-05-15 2021-06-04 情報処理装置、情報処理方法及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP6899603B1 JP6899603B1 (ja) 2021-07-07
JP2021179896A true JP2021179896A (ja) 2021-11-18

Family

ID=76650069

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020085865A Active JP6899603B1 (ja) 2020-05-15 2020-05-15 情報処理装置、情報処理方法及び情報処理プログラム
JP2021094043A Pending JP2021179999A (ja) 2020-05-15 2021-06-04 情報処理装置、情報処理方法及び情報処理プログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2021094043A Pending JP2021179999A (ja) 2020-05-15 2021-06-04 情報処理装置、情報処理方法及び情報処理プログラム

Country Status (1)

Country Link
JP (2) JP6899603B1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007233913A (ja) * 2006-03-03 2007-09-13 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2017151639A (ja) * 2016-02-23 2017-08-31 大日本印刷株式会社 書類撮像装置、書類撮像方法、および、書類撮像装置用のプログラム
JP2018037036A (ja) * 2016-09-02 2018-03-08 株式会社東芝 帳票読取装置、帳票読取方法、プログラム、および帳票読取システム
JP2019079147A (ja) * 2017-10-20 2019-05-23 株式会社エスピック 表認識処理装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007233913A (ja) * 2006-03-03 2007-09-13 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2017151639A (ja) * 2016-02-23 2017-08-31 大日本印刷株式会社 書類撮像装置、書類撮像方法、および、書類撮像装置用のプログラム
JP2018037036A (ja) * 2016-09-02 2018-03-08 株式会社東芝 帳票読取装置、帳票読取方法、プログラム、および帳票読取システム
JP2019079147A (ja) * 2017-10-20 2019-05-23 株式会社エスピック 表認識処理装置

Also Published As

Publication number Publication date
JP2021179999A (ja) 2021-11-18
JP6899603B1 (ja) 2021-07-07

Similar Documents

Publication Publication Date Title
CN108960223B (zh) 基于票据智能识别自动生成凭证的方法
US11348330B2 (en) Key value extraction from documents
US10546206B2 (en) Methods for mobile image capture of vehicle identification numbers in a non-document
CN108984578B (zh) 计算机、文档识别方法以及系统
US8064703B2 (en) Property record document data validation systems and methods
US9384389B1 (en) Detecting errors in recognized text
CN103995904B (zh) 一种影像档案电子资料的识别系统
CN109685052A (zh) 文本图像处理方法、装置、电子设备及计算机可读介质
WO2019225157A1 (ja) 帳票認識システム
CN106485243A (zh) 一种票据识别纠错方法及装置
CN103996055B (zh) 基于影像档案电子资料识别系统中分类器的识别方法
JP4661921B2 (ja) 文書処理装置およびプログラム
CN101641721A (zh) 生物特征匹配方法和设备
US20210019511A1 (en) Systems and methods for extracting data from an image
US8577826B2 (en) Automated document separation
CN114529933A (zh) 一种合同数据差异性的比对方法、装置、设备和介质
JP2020181369A (ja) 書類読取システム
JP6899603B1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
CN109214362A (zh) 单据处理方法及相关设备
CN101520788B (zh) 图像文件分类方法、图像文件分类设备和计算机程序产品
WO2014068770A1 (ja) データ抽出方法、データ抽出装置及びそのプログラム
JP5134383B2 (ja) Ocr装置、証跡管理装置及び証跡管理システム
CN115294593A (zh) 一种图像信息抽取方法、装置、计算机设备及存储介质
JP4347675B2 (ja) 帳票ocrプログラム、方法及び装置
JP6928401B1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210218

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210218

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20210408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210601

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210608

R150 Certificate of patent or registration of utility model

Ref document number: 6899603

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350