JP6445645B1 - 帳票情報認識装置および帳票情報認識方法 - Google Patents

帳票情報認識装置および帳票情報認識方法 Download PDF

Info

Publication number
JP6445645B1
JP6445645B1 JP2017180861A JP2017180861A JP6445645B1 JP 6445645 B1 JP6445645 B1 JP 6445645B1 JP 2017180861 A JP2017180861 A JP 2017180861A JP 2017180861 A JP2017180861 A JP 2017180861A JP 6445645 B1 JP6445645 B1 JP 6445645B1
Authority
JP
Japan
Prior art keywords
character recognition
information
unit
model
position information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017180861A
Other languages
English (en)
Other versions
JP2019057115A (ja
Inventor
正暁 杉山
正暁 杉山
裕規 小笠原
裕規 小笠原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Infrastructure Systems and Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Infrastructure Systems and Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Infrastructure Systems and Solutions Corp filed Critical Toshiba Corp
Priority to JP2017180861A priority Critical patent/JP6445645B1/ja
Application granted granted Critical
Publication of JP6445645B1 publication Critical patent/JP6445645B1/ja
Publication of JP2019057115A publication Critical patent/JP2019057115A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】 帳票のから必要な情報を自動的に文字認識する効率を高めるように自己学習する。
【解決手段】 実施形態によれば、帳票から帳票イメージを取得する取得部と、帳票イメージにおいて文字認識対象部分の位置情報を抽出する抽出部と、位置情報を、帳票種類毎に定義したモデル情報を保存する保存部と、抽出部によって抽出された位置情報に一致する位置情報が定義されたモデル情報が保存部に保存されている場合、このモデル情報に定義されている位置情報に対応する文字認識対象部分の文字認識処理を行い、保存されていない場合、帳票イメージにおいて、操作入力によって指定された文字認識対象部分の文字認識処理を行う文字認識部と、指定された文字認識対象部分の文字認識処理がなされた場合、指定された文字認識対象部分の帳票イメージにおける位置情報を用いて、帳票イメージに対応する帳票のためのモデル情報を作成し、作成したモデル情報を、保存部に保存させるモデル作成部とを備える。
【選択図】図1

Description

本発明の実施形態は、帳票に記載された情報のうち、必要な情報を文字認識する帳票情報認識装置および帳票情報認識方法に関する。
従来、帳票に記載されている文字や数字を文字認識する帳票情報認識装置および帳票情報認識方法が知られている。
この種の帳票情報認識装置および帳票情報認識方法によって、帳票に記載されている文字や数字のうち、その後のデータエントリ処理のために必要な文字や数字が文字認識され、例えばテキストデータのような電子データへ変換されている。
例えば帳票が振込用紙である場合、振込用紙に記載されている文字や数字のうち、日付(数字)、振込人の名称(文字)、振込金額(数字)が文字認識され、テキストデータへ変換されるものの、項目や、注意書きといった定型的な文字やそれに含まれる数字は、その後のデータエントリ処理のために使用されないので、文字認識されないという具合である。
このように、帳票情報認識装置および帳票情報認識方法では、必要な情報が選択的に文字認識されている。これを実現するため、文字認識すべき情報が帳票におけるどの位置に記載されているのかが、帳票種類毎に定義されたモデル情報が予め定義され、保存されている。
そして、帳票に記載された文字や数字の文字認識処理を行う場合には、先ず、当該帳票の帳票種類が把握され、次に、把握された帳票種類のために定義されたモデル情報が参照されることによって、どの位置の情報を文字認識すべきであるかが把握され、把握された位置に記載されている情報が文字認識される。これによって、その後のデータエントリ処理のために必要な文字や数字のみが文字認識され、テキストデータのような電子データへ変換されている。
このように帳票種類毎に定義されたモデル情報を使用することによって、帳票内において文字認識すべき位置を決定するためには、先ず、帳票種類毎のモデル情報を事前に準備しておく必要がある。次に、当該帳票が、どのモデル情報に対応するのかを決定するために、文字認識処理を行う前に帳票種類を把握する必要がある。
帳票種類を把握するための一例では、帳票内に印字された帳票固有の文字列が、帳票種類を識別するための識別キーとして使用されている。このためには、帳票用紙において、識別キーが記載されている位置が、モデル情報に定義されている必要がある。
そして、帳票に対する文字認識処理を行う場合には、当該帳票の識別キーが認識され、次に、識別キーの位置に基づいて、対応するモデル情報が把握され、このモデル情報が参照されることによって、当該帳票におけるどの位置の情報を、文字認識すべきであるかが決定される。
なお、識別キーとなり得る文字列は、帳票内の一般的な文字認識対象(たとえば、帳票が請求書である場合、請求先、日付、金額等)と一致するとは必ずしも限らない。
特開2013−229011号公報
しかしながら、上述したような従来の技術では、モデル情報を帳票種類毎に事前に準備しておく必要があるため、対象とする帳票が少量多種の場合や、頻繁にフォーマットが変更され得る帳票については、モデルの作成や変更に要するコストが大きい。
これに対処すべく、特許文献1には、画像処理技術によって、帳票内から識別キーとなり得る箇所が部分画像として自動的に抽出され、更に、抽出された部分画像の一覧から、識別キーとして適切な箇所が、ユーザによって選択されることによって、帳票種類が識別される技術が開示されている。
この技術によれば、識別キーが無く、モデル情報の定義が困難な帳票であっても、必要な情報の識別を可能にし、またモデル情報の定義に要するコストを削減することも可能となる。
しかしながら、ユーザが識別キーとする箇所を選択する必要があるために、ユーザは、ある程度の専門知識を要求される。また、モデル情報の定義に要するコストが削減されるとはいえ、その代わりに、ユーザが帳票毎にモデル情報を定義することが必要となり、ユーザの負担が増加してしまう。
本発明が解決しようとする課題は、帳票において文字認識されるべき情報の位置を定義したモデル情報を、ユーザの負担を増やすことなく作成し、作成したモデル情報に基づいて、必要な情報を文字認識することを繰り返すことによって、自動文字認識効率を高めるように自己学習する帳票情報認識装置および帳票情報認識方法を提供することである。
実施形態の帳票情報認識装置によれば、帳票に記載された情報を文字認識するための帳票情報認識装置は、取得部、抽出部、保存部、認識部、およびモデル作成部を備える。取得部は、帳票から帳票イメージを取得する。抽出部は、帳票イメージにおいて文字認識対象部分の位置情報を抽出する。保存部は、位置情報を帳票種類毎に定義したモデル情報を保存する。認識部は、抽出部によって抽出された位置情報に一致する位置情報が定義されたモデル情報が保存部に保存されている場合、このモデル情報に定義されている位置情報に対応する文字認識対象部分の文字認識処理を行い、保存されていない場合、帳票イメージにおいて、操作入力によって指定された文字認識対象部分の文字認識処理を行う。モデル作成部は、指定された文字認識対象部分の文字認識処理がなされた場合、指定された文字認識対象部分の帳票イメージにおける位置情報を用いて、帳票イメージに対応する帳票のためのモデル情報を作成し、このモデル情報を、保存部に保存させる。
実施形態の帳票情報認識方法が適用された帳票情報認識装置の構成例を示すブロック図である。 実施形態の帳票情報認識方法が適用された帳票情報認識装置の動作例を示すフローチャートである(1/2)。 実施形態の帳票情報認識方法が適用された帳票情報認識装置の動作例を示すフローチャートである(2/E)。 モデル情報の一例を示すデータ構造図である。 帳票イメージにおける文字認識対象文字列およびその位置情報と、モデル情報における文字認識対象文字列およびその位置情報との対応関係を示す図である。 帳票イメージと文字認識処理用テーブルとが並列表示された表示画面例を示す図である。 帳票イメージの部分拡大図の一例である。 文字認識処理用テーブルの部分拡大図の一例である。 修正処理の一例を示す図である。
以下に、本発明の実施形態を、図面を参照して説明する。
図1は、本発明の実施形態の帳票情報認識方法が適用された帳票情報認識装置10の構成例を示すブロック図である。
帳票情報認識装置10は、帳票イメージ取得部11、ユーザ入力受付部12、対象抽出部14、帳票イメージ表示部16、文字認識結果表示部18、文字認識結果出力部20、モデル保存部22、文字認識部24、およびモデル作成部26を備え、図2Aおよび図2Bのフローチャートに示すように動作する。
帳票イメージ取得部11は、例えばOCRスキャナや、複合機を用いることができ、帳票Aを読み込んで帳票イメージaを生成する。
ユーザ入力受付部12、対象抽出部14、帳票イメージ表示部16、文字認識結果表示部18、文字認識結果出力部20、文字認識部24、およびモデル作成部26は、例えばFPGA(field-programmable gate array)もしくはCPU(Central Processing Unit)もしくはこれらの組合せおよびプログラムメモリ(例えばSSD(Solid State Drive)やHDD(Hard Disk Drive)等の随時書き込みおよび読み出しが可能な不揮発性メモリ)を有するコンピュータによって実現され、本実施形態を実施するために必要な制御機能を実現する。これら制御機能はいずれも上記プログラムメモリに格納されたプログラムを上記FPGAやCPUに実行させることにより実現される。モデル保存部22は、プログラムメモリ(例えばSSD(Solid State Drive)やHDD(Hard Disk Drive)等の随時書き込みおよび読み出しが可能な不揮発性メモリ)により実現される。
以下、帳票情報認識装置10の各部の構成を、図2Aおよび図2Bにおけるステップ番号に従って説明する。
前述したように、帳票イメージ取得部11は、帳票Aを読み込んで帳票イメージaを生成する(S1)。
対象抽出部14は、帳票イメージ取得部11から帳票イメージaを受け取り、帳票イメージaから、文字認識対象部分を抽出する。文字認識対象部分とは、例えば、日付や金額等の文字認識対象文字列cである。文字認識対象文字列cは、帳票イメージaの全面にOCR処理が実施されることによって、事前定義されたフォーマットで文字列が並んでいる箇所の位置情報(X、Y座標値)dとともに抽出される(S2)。
対象抽出部14はさらに、モデル保存部22からモデル情報Bを取得する(S3)。
図3は、モデル情報Bの一例を示すデータ構造図である。モデル情報Bは、文字認識対象文字列Cの項目名(氏名、住所、生年月日、金額)と、その位置情報(X、Y座標値)Dとを含む。
モデル保存部22は、このようなモデル情報Bを、帳票Aの種類毎に予め保存している。また、後述するように、新たな種類の帳票Aが帳票情報認識装置10によって処理される毎に、新たな種類の帳票Aに対応する新たなモデル情報Bが生成されると、新たなモデル情報Bが、モデル作成部26から出力されて来る。このようにしてモデル保存部22には、帳票Aの種類毎に、モデル情報Bを蓄積して行く。
図4は、帳票イメージaにおける文字認識対象文字列cおよびその位置情報dと、モデル情報Bにおける文字認識対象文字列Cおよびその位置情報Dとの対応関係を示す図である。
対象抽出部14は、図4に示すように、ステップS2で抽出された位置情報dと、モデル情報Bに定義された文字認識対象文字列Cの位置情報Dとを照合する。対象抽出部14は、この照合処理を、モデル保存部22に保存されたすべてのモデル情報Bを対象に実行する(S3)。
対象抽出部14は、ステップS3の位置情報dと位置情報Dとの照合処理の結果、帳票イメージaに対応するモデル情報Bが、モデル保存部22に保存されているか否かを判定する(S4)。
判定の結果、保存されていない場合、すなわち、位置情報dに一致する位置情報Dを有するモデル情報Bがモデル保存部22に保存されていない(存在しない)場合には、後述するステップS5に進む。一方、位置情報dに一致する位置情報Dを有するモデル情報Bが保存されている(存在する)場合には、後述するステップS7に進む。
ステップS5では、帳票イメージ表示部16が、帳票イメージ取得部11から帳票イメージaを受け取り、ユーザが確認できるように、図5に示すように、帳票イメージaを、ブランクの文字認識処理用テーブルEとともに表示する(S5)。この表示を参照しながら、ユーザは、ユーザ入力受付部12を操作することによって、帳票イメージaにおける各文字認識対象文字列cを文字認識処理するために、文字認識処理用テーブルEにおける対応する欄を指定する。例えば、図5に示す帳票イメージaの部分拡大図である図6に示すように、帳票イメージa内の「山田太郎」という文字認識対象文字列cは、「氏名」に該当するので、ユーザは、ユーザ入力受付部12のマウス等を操作することによって、「山田太郎」と記載されている文字認識対象文字列cを、ドラッグ等によって文字認識処理用テーブルEの「氏名」欄に指定する。
このようにステップS5のようなユーザ操作による文字認識対象文字列cの指定は、どのようなフォーマットの帳票に対しても対応可能であるので、高い柔軟性を備えている。
次に、文字認識部24は、図5に示す文字認識処理用テーブルEの部分拡大図である図7に示すように、文字認識処理用テーブルEの各欄にドラッグされた文字認識対象文字列cに対する文字認識を行い、例えばテキストデータである文字認識結果f(例えば、「山田太郎」)を、文字認識処理用テーブルEの所定の欄に書き込む(S6)。
ユーザはさらに、ユーザ入力受付部12のマウス等を操作することによって、図6に示すように、「東京都〜」と記載されている文字認識対象文字列cをドラッグ等によって文字認識処理用テーブルEの「住所」欄に指定し、「昭和56年1月12日」と記載されている文字認識対象文字列cをドラッグ等によって文字認識処理用テーブルEの「生年月日」欄に指定し、「300,000」と記載されている文字認識対象文字列cをドラッグ等によって文字認識処理用テーブルEの「金額」欄に指定する。これによって、文字認識部24は、これら文字認識対象文字列cに対する文字認識を行う。
同様に、ユーザはさらに、次のレコード(図5に示す例では「田中花子」)についても、ユーザ入力受付部12のマウス等を操作することによって、文字認識対象文字列cをドラッグ等によって文字認識処理用テーブルEの所定の欄に指定し、これに応じて、文字認識部24は、文字認識対象文字列cに対する文字認識を行う。
このような処理によって、文字認識部24は、ユーザによって指定された文字認識対象文字列cに対する文字認識を行うとともに、対応する帳票Aの帳票イメージaにおける文字認識対象文字列cの項目名(例えば、氏名、住所、生年月日、金額)と、各項目に対応する、帳票Aの帳票イメージa内における位置情報(X、Y座標値)dを把握する。
なお、図5の示すような文字認識処理用テーブルEのフォーマットは一例であって、他のフォーマットであっても良く、モデル保存部22に、代表的ないくつかのフォーマットの文字認識処理用テーブルEを予め保存しておき、それらの中から適切な文字認識処理用テーブルEをユーザが選択できるように、帳票イメージ表示部16が表示するようにしても良い。一般に、データエントリ処理で使用されるデータの項目は類似している場合が多いので、仮に多くの帳票が存在していたとしても、文字認識処理用テーブルEのフォーマットは、何種類かのパターンに集約される。
また、文字認識処理用テーブルEは、文字認識対象文字列Cの項目毎に属性を定義していても良い。たとえば、「氏名」や「住所」の属性は文字であり、「生年月日」や「金額」の属性は数字であると定義していても良い。
ステップS7では、文字認識部24が、モデル情報Bにおいて定義されたすべての位置情報Dに一致する位置情報dにおける文字認識対象文字列cに対して、文字認識処理を実行し、文字認識結果fを、文字認識結果表示部18へ出力する(S7)。
ステップS6およびステップS7の後、文字認識結果表示部18は、文字認識結果fが書き込まれた文字認識処理用テーブルEを表示する(S8)。
これによって、ユーザは、文字認識結果fを確認できるようになる。そして、ユーザは、文字認識結果fに誤りがあることを発見すると、ユーザ入力受付部12の例えばキーボードから修正情報gを入力することによって、文字認識結果fの誤りを修正する(S9)。
図8は、このような修正処理の一例を示す図であり、帳票イメージaに「田中花子」と記載されているものの、文字認識部24によって、「田中花了」と誤認識された文字認識結果fの例を示している。このような場合、ユーザは、ユーザ入力受付部12のキーボードから修正情報gを入力することによって、「田中花了」の「了」を「子」に修正する。
あるいは、文字認識結果表示部18は、文字認識対象文字列Cの項目毎に定義されている属性と一致していない文字認識結果fがある場合、その文字認識結果fを強調表示しても良い。例えば、「氏名」の属性が文字として定義されているにも関わらず、「氏名」欄において変換された文字認識結果fがすべて数字であったり、「金額」の属性が数字として定義されているにも関わらず、「金額」欄において変換された文字認識結果fに文字が含まれているように、定義されている属性と一致していない文字認識結果fについては、強調表示する。これによって、ユーザが、文字認識結果fの誤りを容易に発見できるようにしている。
ユーザは、必要な修正を行い、すべての文字認識結果fが正しく表示されたことを確認すると、ユーザ入力受付部12から修正終了指示hを入力する。ユーザ入力受付部12は、修正終了指示hを、文字認識結果表示部18へ出力する。これによって、文字認識結果fが確定され、文字認識結果表示部18は、確定済文字認識結果Fを生成し、文字認識結果出力部20へ出力する(S10)。
ステップS10の後の処理は、ステップS4の処理結果に応じて、ステップS11またはステップS12に進む。
すなわち、ステップS4において、位置情報dに一致する位置情報Dを有するモデル情報Bがモデル保存部22に保存されていない(存在しない)場合には、後述するステップS11へ進み、その後、ステップS12へ進む。一方、ステップS4において、位置情報dに一致する位置情報Dを有するモデル情報Bがモデル保存部22に保存されている(存在する)場合には、ステップS12へ進む。
ステップS11では、文字認識結果出力部20が、確定済文字認識結果Fが属する文字認識対象文字列cの項目名(例えば、氏名、住所、生年月日、金額)を、帳票Aの帳票イメージa内における位置情報(X、Y座標値)dとともにモデル作成部26へ出力する。モデル作成部26は、文字認識結果出力部20から出力された文字認識対象文字列cの項目名(例えば、氏名、住所、生年月日、金額)および位置情報(X、Y座標値)dに基づいて、新たなモデル情報Bを作成し、モデル保存部22に保存する(S11)。このようにして、モデル作成部26は、モデル保存部22にモデル情報Bが保存されていなかった帳票Aのためのモデル情報Bを生成し、モデル保存部22に蓄積させて行く。その後、ステップS12に進む。
ステップS12では、文字認識結果出力部20が、確定済文字認識結果Fを出力する(S12)。これは、文字認識結果出力ファイルGとして電子データまたは紙媒体として出力されることも可能である。
次に、以上のように構成した本実施形態の帳票情報認識装置10の動作について図2Aおよび図2Bのフローチャートを用いて説明する。
本実施形態の帳票情報認識装置10によって帳票Aの文字認識処理を行うためには、先ず、帳票イメージ取得部11によって帳票Aが読み込まれ、帳票イメージaが生成される(S1)。
帳票イメージaは、帳票イメージ取得部11から対象抽出部14へ送られ、対象抽出部14では、帳票イメージaから、文字認識対象部分が抽出される。文字認識対象部分とは、例えば、日付や金額等の文字認識対象文字列cである。文字認識対象文字列cは、帳票イメージaの全面にOCR処理が実施されることによって、事前定義されたフォーマットで文字列が並んでいる箇所の位置情報(X、Y座標値)dとともに抽出される(S2)。
対象抽出部14ではさらに、モデル保存部22からモデル情報Bが取得される(S3)。
対象抽出部14では、図4に示すように、ステップS2で抽出された位置情報dと、モデル情報Bに定義された文字認識対象文字列Cの位置情報Dとが照合される。対象抽出部14では、この照合処理が、モデル保存部22に保存されたすべてのモデル情報Bを対象に実行される(S3)。
対象抽出部14では、ステップS3の位置情報dと位置情報Dとの照合処理の結果、帳票イメージaに対応するモデル情報Bが、モデル保存部22に保存されているか否かが判定される(S4)。
判定の結果、保存されていない場合には、ステップS5に進み、保存されている場合には、ステップS7に進む。
ステップS5では、帳票イメージ表示部16において、帳票イメージ取得部11から帳票イメージaが受け取られ、ユーザが確認できるように、図5に示すように、帳票イメージaが、ブランクの文字認識処理用テーブルEとともに表示される(S5)。この表示を参照しながら、ユーザが、ユーザ入力受付部12を操作することによって、帳票イメージaにおける各文字認識対象文字列cを文字認識処理するために、文字認識処理用テーブルEにおける対応する欄が指定される。
このようなステップS5のようなユーザ操作による文字認識対象文字列cの指定は、どのようなフォーマットの帳票に対しても対応可能であるので、高い柔軟性を備えている。
次に、文字認識部24では、図7に示すように、文字認識処理用テーブルEの各欄にドラッグされた文字認識対象文字列cに対する文字認識が行われ、例えばテキストデータである文字認識結果f(例えば、「山田太郎」)が、文字認識処理用テーブルEの所定の欄に書き込まれる(S6)。
このような処理によって、文字認識部24では、ユーザによって指定された文字認識対象文字列cに対する文字認識が行われるとともに、対応する帳票Aの帳票イメージaにおける文字認識対象文字列cの項目名(例えば、氏名、住所、生年月日、金額)と、各項目に対応する、帳票Aのイメージa内における位置情報(X、Y座標値)dとが把握される。
ステップS7では、文字認識部24において、モデル情報Bにおいて定義されたすべての位置情報Dに一致する位置情報dに対応する文字認識対象文字列cに対して、文字認識処理が実行され、文字認識結果fが、文字認識結果表示部18へ出力される(S7)。
ステップS6およびステップS7の後、文字認識結果表示部18では、文字認識結果fが書き込まれた文字認識処理用テーブルEが表示される(S8)。
これによって、ユーザは、文字認識結果fを確認できるようになる。そして、ユーザは、文字認識結果fに誤りがあることを発見すると、ユーザ入力受付部12の例えばキーボードから修正情報gを入力する。これによって、文字認識結果fの誤りが修正される(S9)。
必要な修正がなされ、すべての文字認識結果fが正しく表示されたことがユーザによって確認されると、ユーザによって、ユーザ入力受付部12へ修正終了指示hが入力される。修正終了指示hは、ユーザ入力受付部12から、文字認識結果表示部18へ出力される。これによって、文字認識結果fが確定され、文字認識結果表示部18では、確定済文字認識結果Fが生成され、文字認識結果出力部20へ出力される(S10)。
ステップS10の後の処理は、ステップS4の処理結果に応じて、ステップS11またはステップS12に進む。
すなわち、ステップS4において、保存されていないと判定された場合には、ステップS11へ進み、その後、ステップS12へ進む一方、保存されていると判定された場合には、ステップS12へ進む。
ステップS11では、文字認識結果出力部20によって、確定済文字認識結果Fが属する文字認識対象文字列cの項目名(例えば、氏名、住所、生年月日、金額)が、帳票Aの帳票イメージa内における位置情報(X、Y座標値)dとともにモデル作成部26へ出力される。さらに、モデル作成部26では、文字認識結果出力部20から出力された文字認識対象文字列cの項目名(例えば、氏名、住所、生年月日、金額)および位置情報(X、Y座標値)dに基づいて、新たなモデル情報Bが作成され、モデル保存部22に保存される(S11)。このようにして、モデル作成部26では、モデル保存部22にモデル情報Bが保存されていなかった帳票Aのためのモデル情報Bが生成され、モデル保存部22に蓄積されて行く。その後、ステップS12に進む。
ステップS12では、文字認識結果出力部20によって、電子データまたは紙媒体等として文字認識結果出力ファイルGが出力される(S12)。
上述したように、本実施形態の帳票情報認識装置10によれば、上記のような作用により、モデル保存部22にモデル情報Bが保存されている帳票Aについては、モデル保存部22からの対応するモデル情報Bの抽出、モデル情報Bに基づく文字認識対象文字列の文字認識といった一連の処理を自動的に行うことが可能となる。
また、モデル保存部22にモデル情報Bが保存されていない帳票Aについては、ユーザ操作によって指定された文字認識対象文字列cと、その位置情報dに基づいて、モデル情報Bを生成することが可能となる。このようなユーザ操作に基づく文字認識対象文字列cおよび位置情報dの指定は、どのようなフォーマットの帳票Aに対しても実施可能であるので、モデル情報Bの生成に関する柔軟性および容易性を高めることが可能となる。
これによって、新たなモデル情報を自動的に作成し、蓄積することができるので、モデル情報の作成に関するユーザの負担およびコストの削減が可能となる。さらには、モデル情報の作成が容易になることから、少量多種の帳票や、頻繁にフォーマットが変更される帳票であっても、モデル定義に要するコストを削減することが可能となる。
そして、このようにモデル情報Bがモデル保存部22に保存されると、以降は、モデル保存部22からの対応するモデル情報Bの抽出、モデル情報Bに基づく文字認識対象文字列の文字認識といった一連の処理が自動的に行われるようになる。
このように、本実施形態の帳票情報文字認識装置10によれば、モデル情報Bを、ユーザの負担を増やすことなく作成し、作成したモデル情報Bに基づいて、文字認識対象文字列の文字認識を繰り返すことによって、自動文字認識効率を高めるように自己学習することが可能となる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
以下、本願の出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
帳票に記載された情報を文字認識するための帳票情報認識装置であって、
前記帳票から帳票イメージを取得する取得部と、
前記帳票イメージにおいて文字認識対象部分の位置情報を抽出する抽出部と、
前記位置情報を帳票種類毎に定義したモデル情報を保存する保存部と、
前記抽出部によって抽出された位置情報に一致する位置情報が定義されたモデル情報が前記保存部に保存されている場合、このモデル情報に定義されている位置情報に対応する前記文字認識対象部分の文字認識処理を行い、保存されていない場合、前記帳票イメージにおいて、操作入力によって指定された文字認識対象部分の文字認識処理を行う文字認識部と、
前記指定された文字認識対象部分の文字認識処理がなされた場合、前記指定された文字認識対象部分の前記帳票イメージにおける位置情報を用いて、前記帳票イメージに対応する帳票のためのモデル情報を作成し、このモデル情報を、前記保存部に保存させるモデル作成部と、
を備えた帳票情報認識装置。
[C2]
前記モデル情報が前記保存部に既に保存されている帳票については、前記文字認識部によって、前記操作入力なしで自動的に前記文字認識処理がなされるような、自己学習機能を実現する、[C1]に記載の帳票情報認識装置。
[C3]
前記文字認識部によってなされた文字認識処理の結果を表示する表示部と、
前記表示部に表示された文字認識処理の結果を修正するための操作入力を受け付ける入力受付部と、をさらに備える[C1]または[C2]に記載の帳票情報認識装置。
[C4]
前記モデル情報は、前記文字認識対象部分の各々の属性を定義しており、
前記表示部は、前記文字認識処理された文字認識対象部分の属性が、前記モデル情報で定義された属性とは異なる場合、当該文字認識対象部分の文字認識処理の結果を強調表示する、[C3]に記載の帳票情報認識装置。
[C5]
帳票に記載された情報を文字認識するための帳票情報認識方法であって、
帳票読取装置によって前記帳票から帳票イメージを取得し、
前記帳票イメージにおいて文字認識対象部分の位置情報を抽出し、
前記抽出された位置情報に一致する位置情報が定義されたモデル情報が記憶装置に保存されている場合、このモデル情報に定義されている位置情報に対応する前記文字認識対象部分の文字認識処理を行い、
前記抽出された位置情報に一致する位置情報が定義されたモデル情報が前記記憶装置に保存されていない場合、前記帳票イメージにおいて、操作入力によって指定された文字認識対象部分の文字認識処理を行い、
前記操作入力によって指定された文字認識対象部分の文字認識処理がなされた場合、前記指定された文字認識対象部分の前記帳票イメージにおける位置情報を用いて、前記帳票イメージに対応する帳票のためのモデル情報を作成し、このモデル情報を、前記記憶装置に保存することによって、前記モデル情報が前記記憶装置に既に保存されている帳票については、前記操作入力なしで自動的に前記文字認識処理がなされるような、自己学習機能を実現する、帳票情報認識方法。
10 帳票情報認識装置、11 帳票イメージ取得部、12 ユーザ入力受付部、14 対象抽出部、16 帳票イメージ表示部、18 文字認識結果表示部、20 文字認識結果出力部、22 モデル保存部、24 文字認識部、26 モデル作成部。

Claims (7)

  1. 帳票に記載された情報を文字認識するための帳票情報認識装置であって、
    前記帳票から帳票イメージを取得する取得部と、
    前記帳票イメージにおいて文字認識対象部分の位置情報を抽出する抽出部と、
    前記位置情報を帳票種類毎に定義したモデル情報を保存する保存部と、
    前記抽出部によって抽出された位置情報に一致する位置情報が定義されたモデル情報が前記保存部に保存されている場合、このモデル情報に定義されている位置情報に対応する前記文字認識対象部分の文字認識処理を行い、保存されていない場合、前記帳票イメージにおいて、操作入力によって指定された文字認識対象部分の文字認識処理を行う文字認識部と、
    前記指定された文字認識対象部分の文字認識処理がなされた場合、前記指定された文字認識対象部分の前記帳票イメージにおける位置情報を用いて、前記帳票イメージに対応する帳票のためのモデル情報を作成し、このモデル情報を、前記保存部に保存することによって、前記操作入力なしで前記文字認識処理がなされるような、自己学習機能を実現するモデル作成部と、
    を備えた帳票情報認識装置。
  2. 前記文字認識部は、前記保存されていない場合、前記帳票イメージからドラッグによって指定された文字認識対象部分の文字認識処理を行う請求項1に記載の帳票情報認識装置。
  3. 前記保存されていない場合、ドラッグによって指定された文字認識対象部分を指定する入力受付部をさらに備える請求項2に記載の帳票情報認識装置。
  4. 前記入力受付部は、前記保存されていない場合、前記帳票イメージからドラッグによって指定された文字認識対象部分を前記保存部のテーブルに含まれる複数項目のうちの所定項目へ指定し、
    前記テーブルは、属性が定義される前記複数項目を含む請求項3に記載の帳票情報認識装置。
  5. 前記文字認識部によってなされた文字認識処理の結果を表示する表示部と、
    前記表示部に表示された文字認識処理の結果を修正するための操作入力を受け付ける入力受付部と、をさらに備える請求項に記載の帳票情報認識装置。
  6. 前記モデル情報は、前記文字認識対象部分の各々の属性を定義しており、
    前記表示部は、前記文字認識処理された文字認識対象部分の属性が、前記モデル情報で定義された属性とは異なる場合、当該文字認識対象部分の文字認識処理の結果を強調表示する、請求項に記載の帳票情報認識装置。
  7. 帳票に記載された情報を文字認識するための帳票情報認識方法であって、
    帳票読取装置によって前記帳票から帳票イメージを取得し、
    前記帳票イメージにおいて文字認識対象部分の位置情報を抽出し、
    前記抽出された位置情報に一致する位置情報が定義されたモデル情報が記憶装置に保存されている場合、このモデル情報に定義されている位置情報に対応する前記文字認識対象部分の文字認識処理を行い、
    前記抽出された位置情報に一致する位置情報が定義されたモデル情報が前記記憶装置に保存されていない場合、前記帳票イメージにおいて、操作入力によって指定された文字認識対象部分の文字認識処理を行い、
    前記操作入力によって指定された文字認識対象部分の文字認識処理がなされた場合、前記指定された文字認識対象部分の前記帳票イメージにおける位置情報を用いて、前記帳票イメージに対応する帳票のためのモデル情報を作成し、このモデル情報を、前記記憶装置に保存することによって、記操作入力なしで記文字認識処理がなされるような、自己学習機能を実現する、帳票情報認識方法。
JP2017180861A 2017-09-21 2017-09-21 帳票情報認識装置および帳票情報認識方法 Active JP6445645B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017180861A JP6445645B1 (ja) 2017-09-21 2017-09-21 帳票情報認識装置および帳票情報認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017180861A JP6445645B1 (ja) 2017-09-21 2017-09-21 帳票情報認識装置および帳票情報認識方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2018222605A Division JP6755926B2 (ja) 2018-11-28 2018-11-28 帳票情報認識装置および帳票情報認識方法

Publications (2)

Publication Number Publication Date
JP6445645B1 true JP6445645B1 (ja) 2018-12-26
JP2019057115A JP2019057115A (ja) 2019-04-11

Family

ID=64899595

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017180861A Active JP6445645B1 (ja) 2017-09-21 2017-09-21 帳票情報認識装置および帳票情報認識方法

Country Status (1)

Country Link
JP (1) JP6445645B1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102379674B1 (ko) * 2019-07-23 2022-03-29 한국과학기술원 문서 내 테이블 분석방법 및 장치
KR102347386B1 (ko) * 2021-09-10 2022-01-05 주식회사 애자일소다 단어 정의 기반 헤더 추출 장치 및 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH096903A (ja) * 1995-06-14 1997-01-10 Oki Electric Ind Co Ltd フォーマット情報生成方法
JP2004258706A (ja) * 2003-02-24 2004-09-16 Hitachi Ltd 帳票定義データ作成方法および帳票処理装置
JP2011118513A (ja) * 2009-12-01 2011-06-16 Toshiba Corp 文字認識装置および帳票識別方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH096903A (ja) * 1995-06-14 1997-01-10 Oki Electric Ind Co Ltd フォーマット情報生成方法
JP2004258706A (ja) * 2003-02-24 2004-09-16 Hitachi Ltd 帳票定義データ作成方法および帳票処理装置
JP2011118513A (ja) * 2009-12-01 2011-06-16 Toshiba Corp 文字認識装置および帳票識別方法

Also Published As

Publication number Publication date
JP2019057115A (ja) 2019-04-11

Similar Documents

Publication Publication Date Title
JP6881990B2 (ja) 画像処理装置とその制御方法、及びプログラム
JP6282116B2 (ja) キャプチャーされた画像データのスプレッドシートとの関連付け
JP6303594B2 (ja) 単一セル中の画像データ及びシンボルデータによるテーブルのソート及びフィルタリング
US9430456B2 (en) System for entering data into a data processing system
JP4998219B2 (ja) 帳票認識プログラム、帳票認識装置および帳票認識方法
US10963717B1 (en) Auto-correction of pattern defined strings
JP2008276766A (ja) フォーム自動埋込方法及び装置
JP6755926B2 (ja) 帳票情報認識装置および帳票情報認識方法
JP2008145611A (ja) 情報処理装置、プログラム
TW200416583A (en) Definition data generation method of account book voucher and processing device of account book voucher
JP6445645B1 (ja) 帳票情報認識装置および帳票情報認識方法
US8200009B2 (en) Control of optical character recognition (OCR) processes to generate user controllable final output documents
JP7439435B2 (ja) 情報処理装置及びプログラム
JP4518212B2 (ja) 画像処理装置及びプログラム
JP6080586B2 (ja) 文字認識システム、文字認識プログラム及び文字認識方法
TWM491194U (zh) 資料校對平台伺服器
JP4517822B2 (ja) 画像処理装置及びプログラム
TWM626292U (zh) 業務導向要項鍵值辨識系統
US20200304670A1 (en) Information processing apparatus and non-transitory computer readable medium
JP2021039429A (ja) 情報処理装置及び情報処理プログラム
TWI807467B (zh) 要項偵測模型建立方法、業務導向要項鍵值辨識系統及方法
JP7421384B2 (ja) 情報処理装置、修正候補表示方法、及びプログラム
JP6003677B2 (ja) 画像処理装置及び画像処理プログラム
US20240193370A1 (en) Information processing apparatus, information processing system, information processing method, and storage medium
US11574490B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program

Legal Events

Date Code Title Description
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20181015

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181023

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181030

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181129

R150 Certificate of patent or registration of utility model

Ref document number: 6445645

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150