JP2020030722A - 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム - Google Patents

帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム Download PDF

Info

Publication number
JP2020030722A
JP2020030722A JP2018157003A JP2018157003A JP2020030722A JP 2020030722 A JP2020030722 A JP 2020030722A JP 2018157003 A JP2018157003 A JP 2018157003A JP 2018157003 A JP2018157003 A JP 2018157003A JP 2020030722 A JP2020030722 A JP 2020030722A
Authority
JP
Japan
Prior art keywords
image
form image
character recognition
query
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018157003A
Other languages
English (en)
Other versions
JP7026386B2 (ja
Inventor
福光 齊藤
Fukumitsu Saito
福光 齊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Net Smile Inc
Original Assignee
Net Smile Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Net Smile Inc filed Critical Net Smile Inc
Priority to JP2018157003A priority Critical patent/JP7026386B2/ja
Publication of JP2020030722A publication Critical patent/JP2020030722A/ja
Priority to JP2021100886A priority patent/JP2021140831A/ja
Application granted granted Critical
Publication of JP7026386B2 publication Critical patent/JP7026386B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

【課題】 より多様な帳票から表データを適切に生成することを可能とする。【解決手段】 対象帳票画像取得部42は、処理対象となる帳票画像を取得する。部分画像検索部43は、1または複数のクエリ条件を含むテンプレートデータに基づいて、そのクエリ条件により指定された検索用部分画像を帳票画像内で検索し、その検索用部分画像に対応する1または複数の部分画像を帳票画像において検出する。文字認識処理部44は、そのテンプレートデータに基づいて、帳票画像内で検出された各部分画像における、そのクエリ条件により指定された文字認識領域に対して文字認識処理を実行する。【選択図】 図1

Description

本発明は、帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラムに関するものである。
ある帳票画像処理方法では、帳票のラスター画像に対して文字認識処理が実行され、文字認識処理で得られたテキストデータ(文字コードの配列)で表データが生成される。
その際、一般的に、ラスター画像において文字認識処理の対象となる領域、その領域に含まれる文字列や数値などのテキストの属性(名称など)などといった帳票レイアウトを定義したテンプレートデータ(あるいはフォーマットデータとも呼ばれる)が使用され、テンプレートデータにより指定された領域に対して文字認識処理が実行される。
したがって、一般的に、レイアウトが異なる複数の帳票に対して、それぞれの帳票に対応したテンプレートデータが必要になる。
そのようなテンプレートデータ(フォーマットデータ)を帳票画像から自動的に生成する技術が提案されている。
あるシステムでは、帳票画像内において罫線で囲まれたカラム領域が検出され、表組み領域内で認識された文字がそのカラム領域の項目名とされ、そのカラム領域の座標値がフォーマットデータとして特定されている(例えば特許文献1参照)。
特開平11−73472号公報
しかしながら、上述の技術では、特殊なレイアウトの帳票や、実際の帳票の内容によって位置が変わる項目を有する帳票などから表データを適切に生成することは困難である。
例えば後述の図2に示すような、1つのカラムにおける各セル内で上下に異なる複数の項目(例えば図2における「受注番号」と「注文番号」)の値が配置されるような複雑なレイアウトの帳票については、1カラムのデータとして複数の項目の値が検出されて混在してしまい、表データが適切に生成されない。
つまり、受注番号と注文番号とが1つのセルの上下に配列されているため、上述の技術では、受注番号および注文番号が1つのカラムとして認識され、その1つのカラムのデータとして、受注番号の値000111,000120および注文番号の値5162−01,0189−11が分類されるため、表データにおいて、2つの項目の値が1つのカラムにおいて不適切に混在してしまう。
また、例えば後述の図8に示すような、実際の帳票内の発注件数や受注件数によって位置(表の上下方向での位置)が変わる項目「合計」の値を文字認識し表データに含める場合、上述の技術では、そのような項目のすべての位置に応じた多数のテンプレートデータを使用する必要があり、現実的ではない。つまり、上述の技術では、そのような帳票からそのような項目(例えば、上述の「合計」)の値を文字認識し表データに含めることは困難である。
本発明は、上記の問題に鑑みてなされたものであり、より多様な帳票から表データを適切に生成することが可能な帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラムを得ることを目的とする。
本発明に係る帳票画像処理システムは、処理対象となる帳票画像を取得する対象帳票画像取得部と、1または複数のクエリ条件を含むテンプレートデータに基づいて、クエリ条件により指定された検索用部分画像を帳票画像内で検索し、その検索用部分画像に対応する部分画像を帳票画像において検出する部分画像検索部と、テンプレートデータに基づいて、帳票画像内で検出された部分画像における、クエリ条件により指定された文字認識領域に対して文字認識処理を実行する文字認識処理部とを備える。
本発明に係る帳票画像処理方法は、処理対象となる帳票画像を取得するステップと、1または複数のクエリ条件を含むテンプレートデータに基づいて、クエリ条件により指定された検索用部分画像を帳票画像内で検索し、その検索用部分画像に対応する部分画像を帳票画像において検出するステップと、テンプレートデータに基づいて、帳票画像内で検出された部分画像における、クエリ条件により指定された文字認識領域に対して文字認識処理を実行するステップとを備える。
本発明に係る帳票画像処理プログラムは、コンピューターを、上述の対象帳票画像取得部、上述の部分画像検索部、および上述の文字認識処理部として機能させる。
本発明によれば、より多様な帳票から表データを適切に生成することが可能な帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラムが得られる。
本発明の上記又は他の目的、特徴および優位性は、添付の図面とともに以下の詳細な説明から更に明らかになる。
図1は、本発明の実施の形態に係る帳票画像処理システムの構成を示すブロック図である。 図2は、サンプル帳票画像の一例(一部)を示す図である。 図3は、図2に示すサンプル帳票画像上で、ユーザーにより指定されたクエリ領域およびそのクエリ領域内の文字認識領域の一例を示す図である。 図4は、クエリ条件の構成要素について説明する図である。 図5は、クエリ条件を含むテンプレートデータの一例について説明する図である。 図6は、処理対象となる帳票画像の一例(一部)を示す図である。 図7は、クエリ条件に従って図6に示す帳票画像で検出された部分画像内の文字認識領域の一例を示す図である。 図8は、サンプル帳票画像の別の例(一部)、およびそのサンプル帳票画像上で、ユーザーにより指定されたクエリ領域およびそのクエリ領域内の文字認識領域の一例を示す図である。 図9は、図7に示す文字認識領域に対する文字認識処理で得られたテキストデータに基づき生成された表データの一例を示す図である。 図10は、実施の形態1に係るシステムにおけるテンプレートデータ生成処理について説明するフローチャートである。 図11は、実施の形態1に係るシステムにおける帳票画像処理について説明するフローチャートである。
以下、図に基づいて本発明の実施の形態を説明する。
実施の形態1.
図1は、本発明の実施の形態に係る帳票画像処理システムの構成を示すブロック図である。図1に示す帳票画像処理システムは、1台の情報処理装置(コンピューターなど)に実装されているが、そのシステムにおける後述の処理部を、互いにデータ通信可能な複数の情報処理装置に分散させて実装されるようにしてもよい。また、そのような複数の情報処理装置には、特定の演算を並列処理するGPU(Graphics Processing Unit)が含まれていてもよい。
図1に示すシステムは、記憶装置1、入力装置2、表示装置3、通信装置4、画像読取装置5、および演算処理装置6を備える。
記憶装置1は、フラッシュメモリー、ハードディスクなどの不揮発性の記憶装置であって、各種データやプログラムを格納する。入力装置2および表示装置3は、ユーザーインターフェイスであって、入力装置2は、ユーザー操作を検出し電気信号として出力するキーボード、マウス、タッチパネルなどであり、表示装置3は、ユーザーに対して操作画面などを表示する液晶ディスプレイなどである。
この実施の形態では、記憶装置1に、帳票画像処理プログラム11が格納されている。記憶装置1には、必要に応じて、1または複数の後述のテンプレートデータが格納される。なお、帳票画像処理プログラム11は、CD(Compact Disk)などの可搬性のあるコンピュータ読み取り可能な記録媒体に格納されていてもよい。その場合、例えば、その記録媒体から記憶装置1へプログラム11がインストールされる。また、プログラム11は、1つのプログラムでも、複数のプログラムの集合体でもよい。
通信装置4は、ネットワークインターフェイス、周辺機器インターフェイス、モデムなどのデータ通信可能な装置であって、必要に応じて、他の装置とデータ通信を行う。
画像読取装置5は、帳票から帳票画像を光学的に読み取り、帳票画像の画像データ(ラスタイメージデータなど)を生成する。例えば、画像読取装置5は、USB(Universal Serial Bus)などの周辺機器インターフェイスで接続されたスキャナー、ネットワークスキャナーなどである。
ここで、帳票とは、例えば、各種取引に関する物品、サービス、対価としての金銭などの明細が所定のレイアウトで記載された書類(例えば、発注書、納品書、請求書、領収書など)である。帳票のレイアウトは、取引企業ごとに異なることが多いが、各取引企業は、一定のレイアウトの帳票を使うことが多い。また、帳票のレイアウトが上述のような複雑なレイアウトである場合や、帳票のレイアウトが上述のように帳票の内容によって変わる場合がある。帳票のレイアウト内の各項目の値の位置は、変わらないものが多いが、上述のように、特定の項目は、内容によって変わる。
演算処理装置6は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)などを備えるコンピューターであって、プログラムを、ROM、記憶装置1などからRAMにロードしCPUで実行することで、各種処理部として動作する。ここでは、プログラム11を実行することで、演算処理装置6は、テンプレートデータ生成部21、および帳票画像処理部22として動作する。
テンプレートデータ生成部21は、帳票画像処理の対象となる帳票画像と同一様式のレイアウトを有するサンプル帳票画像から、その様式のレイアウトに対応するテンプレートデータを生成する。例えば、ある様式のレイアウトを有する複数の帳票のうちの1つの帳票画像がサンプル帳票画像とされる。テンプレートデータ生成部21は、サンプル帳票画像取得部31、クエリ条件設定部32、カラム定義部33、およびテンプレートデータ生成部34を備える。
サンプル帳票画像取得部31は、上述のサンプル帳票画像を取得する。例えば、サンプル帳票画像取得部31は、記憶装置1に格納されている画像データとしてのサンプル帳票画像を読み出したり、図示せぬサーバーやホスト装置から通信装置4により受信された画像データとしてのサンプル帳票画像を取得したり、画像読取装置5によりある帳票から生成された画像データとしてのサンプル帳票画像を取得したりする。
クエリ条件設定部32は、(a)サンプル帳票画像において、ユーザー操作で指定されたクエリ領域およびそのクエリ領域内の文字認識領域を特定し、(b)サンプル帳票画像におけるクエリ領域の画像を検索用部分画像として抽出し、(c)検索用部分画像および文字認識領域(つまり、検索用部分画像内での文字認識領域の位置とサイズ)を示すクエリ条件を生成する。
図2は、サンプル帳票画像の一例(一部)を示す図である。図3は、図2に示すサンプル帳票画像上で、ユーザーにより指定されたクエリ領域およびそのクエリ領域内の文字認識領域の一例を示す図である。図4は、クエリ条件の構成要素について説明する図である。
具体的には、クエリ条件設定部32は、例えば図2に示すようなサンプル帳票画像を表示装置3に表示する。ユーザーは、入力装置2を操作して、サンプル帳票画像上で、所望の領域をクエリ領域として指定する。クエリ条件設定部32は、例えば図3に示すように、そのユーザー操作を入力装置2で検出してクエリ領域(つまり、クエリ領域の位置およびサイズ)を特定する。例えば、クエリ領域は、矩形領域であり、その矩形領域の対角線上の2頂点の座標値が特定される。あるいは、矩形領域としてのクエリ領域の1頂点の座標値、並びに横方向および縦方向のサイズが特定される。
さらに、ユーザーは、入力装置2を操作して、そのクエリ領域に対応して、そのクエリ領域内の1または複数の所望の領域を、文字認識領域として指定する。クエリ条件設定部32は、例えば図3に示すように、そのユーザー操作を入力装置2で検出して文字認識領域(つまり、文字認識領域の位置およびサイズ)を特定する。例えば、各文字認識領域は、矩形領域であり、その矩形領域の対角線上の2頂点の座標値が特定される。あるいは、矩形領域としての各文字認識領域の1頂点の座標値、並びに横方向および縦方向のサイズが特定される。
このようにして、例えば図4に示すように、検索用部分画像および文字認識領域(つまり、検索用部分画像内での文字認識領域の位置とサイズ)を示すクエリ条件が得られる。
さらに、この実施の形態では、クエリ条件設定部32は、各クエリ条件に、クエリタイプを含める。そのクエリタイプは、第1クエリタイプまたは第2クエリタイプである。
第1クエリタイプは、帳票画像処理での画像検索において、検索用部分画像に対応する所定個数N(例えばN=1)の部分画像を帳票画像において検出させる。なお、第1クエリタイプにおいて、複数の異なる個数Nに対応させる場合には、上述の個数Nもクエリ条件に含められる。
第2クエリタイプは、帳票画像処理での画像検索において、検索用部分画像に対応するすべての部分画像を帳票画像において検出させる。
カラム定義部33は、クエリ領域内に設定された各文字認識領域にカラム属性を関連付ける。ユーザーは、入力装置2を操作して、各文字認識領域に対応して、帳票画像処理でその文字認識領域から得られたテキストデータが配列されるカラムのカラム属性(カラムの見出し、そのカラムのデータ種別(数値、文字列、金額など)など)を入力する。カラム定義部33は、そのように、ユーザー操作で指定されたカラム属性を特定し、各文字認識領域に関連付ける。
テンプレートデータ生成部34は、上述のようにして生成された1または複数のクエリ条件(およびカラム属性)を含むテンプレートデータを生成し、所定の記憶装置(記憶装置1、図示せぬサーバーなど)に記憶する。
図5は、クエリ条件を含むテンプレートデータの一例について説明する図である。
例えば図5に示すように、テンプレートデータは、1または複数のクエリ条件レコードを含む。1つのクエリ条件レコードは、1つのクエリ条件に対応する。クエリ条件レコードは、クエリ領域ID、クエリタイプ、検索用部分画像ファイルへのファイルパス、および文字認識領域リストを含む。文字認識領域リストは、文字認識領域データへのリンク(参照)を含む。1つの文字認識領域データは、1つの文字認識領域の位置情報(検索用部分画像の基準位置(所定の頂点)からの相対的な文字認識領域の位置(画素数))を示す。
なお、検索用部分画像は検索用部分画像ファイルとしてテンプレートデータとともに記憶される。
図1に戻り、帳票画像処理部22は、処理対象の帳票画像と同一様式のレイアウトを有するサンプル帳票から生成されたテンプレートデータを使用して、その処理対象の帳票画像に対して帳票画像処理を実行する。帳票画像処理部22は、テンプレートデータ選択部41、対象帳票画像取得部42、部分画像検索部43、文字認識処理部44、および表データ生成部45を備える。
テンプレートデータ選択部41は、例えば入力装置2に対するユーザー操作に従って、記憶装置1または図示せぬサーバーに記憶されている1または複数のテンプレートデータから、処理対象の帳票画像に応じた1つのテンプレートデータを選択し読み出す。
このテンプレートデータは、1または複数のクエリ条件を含む。
対象帳票画像取得部42は、処理対象となる帳票画像を取得する。例えば、対象帳票画像取得部42は、記憶装置1に格納されている画像データとしての帳票画像を読み出したり、図示せぬサーバーやホスト装置から通信装置4により受信された画像データとしての帳票画像を取得したり、画像読取装置5により帳票から生成された画像データとしての帳票画像を取得したりする。
部分画像検索部43は、選択されたテンプレートデータに基づいて、そのテンプレートデータに含まれているクエリ条件により指定された検索用部分画像を、取得された帳票画像内で検索し、その検索用部分画像に対応する部分画像をその帳票画像において検出する。
具体的には、部分画像検索部43は、帳票画像において、部分画像と同一サイズの注目領域を1画素ずつ移動させていき、各位置での帳票画像の注目領域と検索用部分画像との類似度を計算し、その類似度に基づいて、検索用部分画像に対応する部分画像を検出する。例えば、この類似度は、画像の特徴量に基づき計算される。例えば、この類似度は、既存の計算方法(SSD(Sum of Squared Difference)法、SAD(Sum of Absolute Difference)法、NCC(Normalized Cross Correlation)法、ZNCC(Zero means Normalized Cross Correlation)法など)で計算される。
また、この実施の形態では、部分画像検索部43は、(a)クエリ条件のクエリタイプが第1クエリタイプである場合には、上述の類似度が最も大きいほうから所定個数Nの部分画像を検出し、(b)クエリ条件のクエリタイプが第2クエリタイプである場合には、上述の類似度が所定閾値を超えている部分画像をすべて検出する。なお、この閾値は、例えば、テンプレートデータ生成時に、ユーザー操作に従って指定され、クエリ条件に含められる。あるいは、この閾値は、帳票画像処理時にユーザー操作に従って設定される。
図6は、処理対象となる帳票画像の一例(一部)を示す図である。図7は、図4に示すクエリ条件に従って図6に示す帳票画像で検出された部分画像内の文字認識領域の一例を示す図である。図8は、サンプル帳票画像の別の例(一部)、およびそのサンプル帳票画像上で、ユーザーにより指定されたクエリ領域およびそのクエリ領域内の文字認識領域の一例を示す図である。
なお、通常、図6に示すように、同一様式のレイアウトの帳票は、図6に示すように、あるカラムにおけるセル内でのテキスト(数値)画像の位置が略同一になるように作成される。
例えば図4に示すクエリ条件(検索用部分画像および文字認識領域)で図6に示す帳票画像内の部分画像が検索されると、第2クエリタイプの場合、例えば図7に示すように、6つの部分画像が検出される。
例えば図6に示すような不定数の行におけるテキストを表データに含めたい場合には、帳票によって行の数が異なるため、第2クエリタイプが指定され、そのような不定数の行の部分画像がすべて検出される。
一方、一定数(上述のN個)の行におけるテキストを表データに含めたい場合には、第1クエリタイプが指定され、特定の数の行の部分画像が検出される。例えば図8に示す「合計」のような位置が不定である行におけるテキストを表データに含めたい場合でも、画像検索によって自動的に位置が特定され、そのような行の部分画像が検出される。したがって、1つのテンプレートデータで、そのような位置不定な行がどの位置になっても、その行の部分画像が検出される。
文字認識処理部44は、テンプレートデータに基づいて、帳票画像内で検出された部分画像において、クエリ条件により指定された文字認識領域を特定し、その文字認識領域に対して文字認識処理を実行する。
表データ生成部45は、帳票画像処理において、文字認識処理で得られたテキストデータを有する表データを所定のデータ形式(例えばCSV(Character-Separated Values)など)で生成する。
図9は、図7に示す文字認識領域に対する文字認識処理で得られたテキストデータに基づき生成された表データの一例を示す図である。例えば図7に示すように文字認識領域が特定された場合、図6に示す帳票から図9に示すような表データが生成される。
例えば図7に示すような1つのセルの上下に複数項目(受注番号と注文番号)の値が配列されていても、図9に示すように、それらの項目に対して、1つずつ別々のカラムのデータが生成される。
ここで、1つのテンプレートデータに複数のクエリ条件が含まれている場合、表データ生成部45は、それぞれのクエリ条件に対応して複数の表データを生成するようにしてもよいし、それぞれのクエリ条件に対応する複数の表データを1つの表データに統合するようにしてもよい。その場合、複数の表データを縦方向に連結して1つの表データに統合するようにしてもよいし、複数の表データを横方向に連結して1つの表データに統合するようにしてもよい。
なお、上述のテンプレートデータ生成部21と帳票画像処理部22とを別々の情報処理装置(サーバー、パーソナルコンピューターなど)に実装してもよく、1台の情報処理装置(サーバー、パーソナルコンピューターなど)に、テンプレートデータ生成部21および帳票画像処理部22の一方のみを実装してもよい。
また、ここで、サンプル帳票および帳票はデジタルデータでもよく、サンプル帳票画像および帳票画像は、そのデジタルデータとしてのサンプル帳票および帳票からそれぞれ得られたもの(ラスター画像など)でもよい。
次に、実施の形態1に係るシステムの動作について説明する。
一連の帳票に対して帳票画像処理を実行して表データを生成したい場合、まず、その一連の帳票からサンプル帳票が選択され、そのサンプル帳票から得られるサンプル帳票画像に対してテンプレートデータ生成処理が実行され、その後、テンプレートデータ生成処理で生成されたテンプレートデータを使用して、一連の帳票の帳票画像に対して帳票画像処理が順番に行われ、自動的に表データが生成される。
ここで、テンプレートデータ生成処理および帳票画像処理について説明する。
(a)テンプレートデータ生成処理
図10は、実施の形態1に係るシステムにおけるテンプレートデータ生成処理について説明するフローチャートである。
ユーザーは、サンプル帳票画像を選択し、入力装置2を使用して指定する。例えば、ユーザーは、サンプル帳票を選択し、画像読取装置5にセットし、画像読取装置5に、サンプル帳票からサンプル帳票画像を読み取らせる。あるいは、例えば、ユーザーは、入力装置2を使用して、保存されている帳票画像のリストからサンプル帳票画像を選択する。サンプル帳票画像取得部31は、ユーザーにより指定されたサンプル帳票画像の画像データを取得する(ステップS1)。
クエリ条件設定部32は、その画像データに基づき、サンプル帳票画像を表示装置3に表示する。サンプル帳票画像が表示されると、ユーザーは、入力装置2を操作して、サンプル帳票画像上で、所望の矩形領域をクエリ領域として指定する。例えば、ユーザーは、このとき、文字認識すべきテキスト画像部分の他、そのテキスト画像部分を囲む罫線などといった不変部分(つまり、複数帳票の間で内容が変わらない部分)が含まれるように、クエリ領域を指定する。クエリ条件設定部32は、そのユーザー操作に基づいて、指定されたクエリ領域(クエリ領域の位置およびサイズ)を特定し(ステップS2)、サンプル帳票画像から、特定したクエリ領域の部分画像を、検索用部分画像として抽出する(ステップS3)。
例えば、クエリ条件設定部32は、クエリ領域を示す枠線を、サンプル帳票画像に重畳して表示する。これにより、ユーザーは、サンプル帳票画像上で、クエリ領域を視認できる。
次に、ユーザーは、表示されているサンプル帳票画像上で、指定したクエリ領域内部の所望の矩形領域を、文字認識領域として指定する。例えば、ユーザーは、このとき、文字認識すべきテキスト画像部分が含まれ、罫線などの他のオブジェクトが含まれないように、文字認識領域を指定する。クエリ条件設定部32は、そのユーザー操作に基づいて、指定された文字認識領域を特定する(ステップS4)。この文字認識領域は、クエリ領域(つまり、検索用部分画像)内での、クエリ領域(つまり、検索用部分画像)内の所定の基準点からの相対位置およびサイズを特定可能なデータ(例えば、文字認識領域の2頂点の相対位置の座標値、文字認識領域の1頂点の相対位置の座標値と縦および横のサイズとの対など)で表される。例えば、この相対位置は、基準点からの距離で表され、この距離およびサイズは、画素数で表される。1つの文字認識領域は、後述の表データにおける1つのカラムに対応する。
このようにして、文字認識領域が特定されると、クエリ条件設定部32は、指定された文字認識領域に対応するカラムのカラム属性(カラムの見出し、データ種別など)を入力するためのダイアログなどを表示装置3に表示する。ユーザーは、入力装置2を操作して、そのダイアログなどに対して、カラム属性(自由テキストとしてのカラム見出し、リストから選択されたデータ種別など)を入力する。クエリ条件設定部32は、入力されたカラム属性を特定し、その文字認識領域に関連付ける(ステップS5)。
さらに、クエリ条件設定部32は、現在設定中のクエリ条件のクエリタイプを入力するためのダイアログなどを表示装置3に表示する。ユーザーは、入力装置2を操作して、そのダイアログなどに対して、クエリタイプを入力する。クエリ条件設定部32は、入力されたクエリタイプを特定し、当該クエリ条件に関連付ける(ステップS6)。
クエリ条件設定部32は、指定されたクエリ領域について、上述のように特定された(a)検索用部分画像、(b)文字認識領域データ(相対位置情報、サイズ情報、カラム属性など)、および(c)クエリタイプで、クエリ条件レコードを生成し、当該サンプル帳票画像に対するテンプレートデータに追加する(ステップS7)。
このようにして、1つのクエリ条件が設定されると、クエリ条件設定部32は、例えば、別のクエリ条件を設定するか否かを入力するためのダイアログを表示装置3に表示する。ユーザーは、別のクエリ条件を設定するか否かを選択して、入力装置2でダイアログに入力する。
クエリ条件設定部32は、別のクエリ条件を設定するか否かを、このようなユーザー操作などに従って判定する(ステップS8)。
クエリ条件設定部32は、別のクエリ条件を設定すると判定した場合、ステップS2に戻り、当該サンプル帳票画像についての別のクエリ条件の設定を行う(ステップS2〜S7)。
一方、クエリ条件設定部32は、別のクエリ条件を設定しないと判定した場合、これまでに設定されたクエリ条件を示すクエリ条件レコードおよび検索用部分画像ファイルで、当該サンプル帳票画像に対するテンプレートデータを生成し(ステップS9)、1つのファイルとして記憶装置1などに格納したり、図示せぬデータベースに登録したりする。
このようにして、ユーザー所望のテンプレートデータが生成され保存される。
(b)帳票画像処理
図11は、実施の形態1に係るシステムにおける帳票画像処理(処理対象の帳票画像から表データを生成する処理)について説明するフローチャートである。
1または複数のテンプレートデータが準備された後、ユーザーは、帳票画像処理の対象となる帳票(帳票画像)と同一のレイアウトを有するサンプル帳票(サンプル帳票画像)から得られたテンプレートデータを選択し、そのテンプレートデータで帳票画像処理を実行させる。
テンプレートデータ選択部41は、保存されているテンプレートデータのリストを表示装置3に表示し、そのリストにおいてユーザー操作により選択されたテンプレートデータを読み出す(ステップS11)。
次に、ユーザーは、処理対象の帳票画像を選択し、入力装置2を使用して指定する。例えば、ユーザーは、処理対象の帳票を選択し、画像読取装置5にセットし、画像読取装置5に、その帳票から帳票画像を読み取らせる。あるいは、例えば、ユーザーは、入力装置2を使用して、保存されている帳票画像のリストから処理対象の帳票画像を選択する。対象帳票画像取得部42は、ユーザーにより指定された帳票画像の画像データを取得する(ステップS12)。
なお、適用されるテンプレートデータのサンプル帳票画像の解像度と同じ解像度の帳票画像が取得される。
そして、部分画像検索部43は、選択されたテンプレートデータ内の未処理(未選択)のクエリ条件を1つ選択し(ステップS13)、選択したクエリ条件により指定されている検索用部分画像を検索キーとして、取得された帳票画像において画像検索を上述のように実行する(ステップS14)。
文字認識処理部44は、取得された帳票画像において、その画像検索で発見された部分画像における文字認識領域を、クエリ条件内の文字認識領域の位置情報およびサイズ情報に基づいて特定し(ステップS15)、その文字認識領域の画像に対して文字認識処理を実行し、その文字認識領域に含まれるテキスト画像に対応するテキストデータ(文字コード)を特定する(ステップS16)。なお、このとき、文字認識領域のカラム属性で指定されているデータ種別を考慮して文字認識処理を実行するようにしてもよい。
文字認識処理部44は、各文字認識領域に対応して得られた1または複数のテキストデータを、1つのカラムで配列されるテキストデータとして互いに関連付ける。
そして、表データ生成部45は、1または複数の文字認識領域に対応して得られた1または複数のカラムのデータから、所定のデータ形式で表データを生成する(ステップS17)。
部分画像検索部43は、選択されたテンプレートデータ内のすべてのクエリ条件が処理されたか否かを判定し(ステップS18)、少なくとも1つのクエリ条件が処理されていない場合には、ステップS13に戻り、同様の処理(ステップS13〜S16)を、文字認識処理部44とともに実行し、表データ生成部45は、新たに生成されたカラムのデータを表データに追加する(ステップS17)。あるいは、すべてのクエリ条件の処理が完了した後に、その処理で得られたカラムのデータから表データを一括して生成するようにしてもよい。
一方、部分画像検索部43は、選択されたテンプレートデータ内のすべてのクエリ条件が処理されたと判定した場合、当該帳票画像に対する帳票画像処理は終了する。
このようにして、ユーザーにより指定された帳票画像に対して、対応するテンプレートデータを使用した帳票画像処理が実行され、その帳票画像に対応する表データが得られる。
なお、テンプレートデータが生成されているレイアウトの帳票については、テンプレートデータ生成処理を再度実行する必要はなく、保存されているテンプレートデータを使用して帳票画像処理が実行される。
以上のように、上記実施の形態1によれば、対象帳票画像取得部42は、処理対象となる帳票画像を取得する。部分画像検索部43は、1または複数のクエリ条件を含むテンプレートデータに基づいて、そのクエリ条件により指定された検索用部分画像を帳票画像内で検索し、その検索用部分画像に対応する1または複数の部分画像を帳票画像において検出する。文字認識処理部44は、そのテンプレートデータに基づいて、帳票画像内で検出された各部分画像における、そのクエリ条件により指定された文字認識領域に対して文字認識処理を実行する。
これにより、テンプレートデータにおけるクエリ条件で指定された検索用部分画像に対応して検出された、帳票画像内の部分画像内で、クエリ条件に基づき文字認識領域が特定されるため、複雑なレイアウトの帳票画像でも、所望のカラム配列で表データを生成することができる。したがって、より多様な帳票から表データが適切に生成される。
実施の形態2.
実施の形態2に係る帳票画像処理システムでは、表データ生成部45は、上述のように、1つの文字認識領域に対応して文字認識処理で得られたテキストデータを1つのカラムとし、その1つの文字認識領域に関連付けられているカラム属性に基づいて1つのカラムの見出しを設定しており、さらに、複数のクエリ条件の文字認識領域に対応して同一の見出しの複数のカラムがある場合には、その複数のカラムを1つのカラムに統合する。
なお、実施の形態2に係る帳票画像処理システムのその他の構成および動作については実施の形態1と同様であるので、その説明を省略する。
実施の形態3.
実施の形態3に係る帳票画像処理システムでは、テンプレートデータ生成部21は、(a)サンプル帳票画像の解像度を所定の解像度に低下させ、(b)その所定の解像度に低下させたサンプル帳票画像におけるクエリ領域の画像を検索用部分画像として抽出する。
また、実施の形態3に係る帳票画像処理システムでは、部分画像検索部43は、(c)帳票画像をデフォルト解像度からその所定の解像度に低下させ、(d)その所定の解像度に低下させた帳票画像内で検索用部分画像を検索し、検索用部分画像に対応する部分画像を、その所定の解像度に低下させた帳票画像において検出し、文字認識処理部44は、テンプレートデータに基づいて、検出された部分画像における文字認識領域を特定し、デフォルト解像度での文字認識領域に対して文字認識処理を実行する。
なお、実施の形態3に係る帳票画像処理システムのその他の構成および動作については実施の形態1または実施の形態2と同様であるので、その説明を省略する。
以上のように、上記実施の形態3によれば、部分画像検索部43における画像検索が縮小画像で行われるため、検索用画像検索に対応する、帳票画像内の部分画像が、短時間で検出される。
なお、上述の実施の形態に対する様々な変更および修正については、当業者には明らかである。そのような変更および修正は、その主題の趣旨および範囲から離れることなく、かつ、意図された利点を弱めることなく行われてもよい。つまり、そのような変更および修正が請求の範囲に含まれることを意図している。
例えば、上記実施の形態1,2,3において、表データ生成部45は、文字認識処理の結果として文字コード(テキストデータ)が得られなかった場合には、対応するセルに、値なしを示すダミーデータ(第1ダミーデータ)を挿入してもよく、また、表データ生成部45は、複数のクエリ条件による表データを合成した際に、あるクエリ条件で得られたカラムが、別のクエリ条件で得られない場合には、当該カラムにおいて、当該別のクエリ条件の表データに対応するセルには、ダミーデータ(第2ダミーデータ)を挿入してもよい。さらに、上述の第1ダミーデータおよび第2ダミーデータは、互いに異なる定型のテキストとされてもよい。そのようにすることで、表データにおいて、本来的にデータがないセルか、文字認識結果で値が得られなかったセルかが明確区別されて、ユーザーに認識される。
また、上記実施の形態1,2,3において、帳票画像の文字認識領域に対して文字認識処理を実行する前に、文字認識領域の境界(枠)と帳票画像内のオブジェクト(文字認識対象のテキスト画像)とが交差している場合には、当該オブジェクトが文字認識領域内の収まるように文字認識領域を調整するようにしてもよい。
さらに、上記実施の形態1,2,3において、サンプル帳票画像の形状と、帳票画像処理の対象となる帳票画像の形状とが一致しない場合、帳票画像処理において、両者が一致するように、処理対象となる帳票画像の拡大、縮小、回転などを適宜行うようにしてもよい。
さらに、上記実施の形態1,2,3では、帳票画像処理の対象となる帳票(帳票画像)に対応してユーザー操作に従って手動でテンプレートデータが選択されるが、その代わりに、テンプレートデータ選択部41が、帳票画像処理の対象となる帳票画像とサンプル帳票画像との類似度に基づいて、類似度が最大であるサンプル帳票画像に対応するテンプレートデータを自動的に選択するようにしてもよい。その場合、例えば、(a)テンプレートデータ生成部34が、テンプレートデータ生成時に、対応するサンプル帳票画像を画像ファイルとしてそのテンプレートデータに関連付けて所定の記憶装置に保存しておき、(b)テンプレートデータ選択部41が、帳票画像処理の対象となる帳票画像の帳票画像処理の前に、帳票画像処理の対象となる帳票画像と、保存されている1または複数のテンプレートデータに対応するサンプル帳票画像との類似度を計算し、類似度が最大であるサンプル帳票画像に対応する1つのテンプレートデータを選択し、(c)選択されたテンプレートデータを使用して帳票画像処理が実行される。その際、処理対象の帳票画像とサンプル帳票画像とをそれぞれ所定の倍率で縮小し、縮小後の処理対象の帳票画像と縮小後のサンプル帳票画像との類似度を、処理対象の帳票画像とサンプル帳票画像との類似度として計算するようにしてもよい。さらに、その際、縮小後の処理対象の帳票画像と縮小後のサンプル帳票画像とをそれぞれ2値画像に変換し、2値画像としての縮小後の処理対象の帳票画像と2値画像としての縮小後のサンプル帳票画像との類似度を、処理対象の帳票画像とサンプル帳票画像との類似度として計算するようにしてもよい。なお、ここでは、例えば、処理対象の帳票画像(縮小前、縮小後、または縮小かつ2値化後のもの)とサンプル帳票画像(縮小前、縮小後、または縮小かつ2値化後のもの)とを画素ごとに比較し、画素値が一致する画素の数(あるいはその画素数に対応する数)を類似度として計算する。また、テンプレートデータと関連付けて保存するサンプル帳票画像として、縮小前、縮小後、または縮小かつ2値化後のものを予め生成して使用するようにしてもよい。
本発明は、例えば、帳票画像に対応する表データの生成に適用可能である。
6 演算処理装置(コンピューターの一例)
11 帳票画像処理プログラム
21 テンプレートデータ生成部
42 対象帳票画像取得部
43 部分画像検索部
44 文字認識処理部
45 表データ生成部

Claims (7)

  1. 処理対象となる帳票画像を取得する対象帳票画像取得部と、
    1または複数のクエリ条件を含むテンプレートデータに基づいて、前記クエリ条件により指定された検索用部分画像を前記帳票画像内で検索し、前記検索用部分画像に対応する部分画像を前記帳票画像において検出する部分画像検索部と、
    前記テンプレートデータに基づいて、前記帳票画像内で検出された前記部分画像における、前記クエリ条件により指定された文字認識領域に対して文字認識処理を実行する文字認識処理部と、
    を備えることを特徴とする帳票画像処理システム。
  2. 前記テンプレートデータを生成するテンプレートデータ生成部をさらに備え、
    前記テンプレートデータ生成部は、(a)サンプル帳票画像において、ユーザー操作で指定されたクエリ領域および前記クエリ領域内の前記文字認識領域を特定し、(b)前記サンプル帳票画像における前記クエリ領域の画像を前記検索用部分画像として抽出し、(c)前記検索用部分画像および前記文字認識領域を示す前記クエリ条件を生成すること、
    を特徴とする請求項1記載の帳票画像処理システム。
  3. 前記クエリ条件は、クエリタイプとして、前記検索用部分画像に対応する所定個数の部分画像を前記帳票画像において検出させる第1クエリタイプおよび前記検索用部分画像に対応するすべての部分画像を前記帳票画像において検出させる第2クエリタイプのいずれかを有し、
    前記部分画像検索部は、(a)前記帳票画像において、前記部分画像と同一サイズの注目領域を1画素ずつ移動させていき、各位置での前記帳票画像の前記注目領域と前記検索用部分画像との類似度を計算し、(b1)前記クエリ条件のクエリタイプが前記第1クエリタイプである場合には、前記類似度が最も大きいほうから前記所定個数の前記部分画像を検出し、(b2)前記クエリ条件のクエリタイプが前記第2クエリタイプである場合には、前記類似度が所定閾値を超えている前記部分画像をすべて検出すること、
    を特徴とする請求項1記載の帳票画像処理システム。
  4. 前記文字認識処理で得られたテキストデータを有する表データを生成する表データ生成部をさらに備え、
    前記テンプレートデータは、前記文字認識領域に関連付けてカラム属性を有し、
    前記表データ生成部は、(a)1つの文字認識領域に対応して前記文字認識処理で得られたテキストデータを1つのカラムとし、(b)前記1つの文字認識領域に関連付けられている前記カラム属性に基づいて前記1つのカラムの見出しを設定し、(c)複数の前記クエリ条件の前記文字認識領域に対応して同一の見出しの複数のカラムがある場合には、前記複数のカラムを1つのカラムに統合すること、
    を特徴とする請求項1記載の帳票画像処理システム。
  5. 前記テンプレートデータ生成部は、(a)前記サンプル帳票画像の解像度を所定の解像度に低下させ、(b)前記所定の解像度に低下させた前記サンプル帳票画像における前記クエリ領域の画像を前記検索用部分画像として抽出し、
    前記部分画像検索部は、(c)前記帳票画像をデフォルト解像度から前記所定の解像度に低下させ、(d)前記所定の解像度に低下させた前記帳票画像内で前記検索用部分画像を検索し、前記検索用部分画像に対応する部分画像を、前記所定の解像度に低下させた前記帳票画像において検出し、
    前記文字認識処理部は、前記テンプレートデータに基づいて、前記部分画像における前記文字認識領域を特定し、前記デフォルト解像度での前記文字認識領域に対して文字認識処理を実行すること、
    を特徴とする請求項1記載の帳票画像処理システム。
  6. 処理対象となる帳票画像を取得するステップと、
    1または複数のクエリ条件を含むテンプレートデータに基づいて、前記クエリ条件により指定された検索用部分画像を前記帳票画像内で検索し、前記検索用部分画像に対応する部分画像を前記帳票画像において検出するステップと、
    前記テンプレートデータに基づいて、前記帳票画像内で検出された前記部分画像における、前記クエリ条件により指定された文字認識領域に対して文字認識処理を実行するステップと、
    を備えることを特徴とする帳票画像処理方法。
  7. コンピューターを、
    処理対象となる帳票画像を取得する対象帳票画像取得部、
    1または複数のクエリ条件を含むテンプレートデータに基づいて、前記クエリ条件により指定された検索用部分画像を前記帳票画像内で検索し、前記検索用部分画像に対応する部分画像を前記帳票画像において検出する部分画像検索部、および
    前記テンプレートデータに基づいて、前記帳票画像内で検出された前記部分画像における、前記クエリ条件により指定された文字認識領域に対して文字認識処理を実行する文字認識処理部
    として機能させる帳票画像処理プログラム。
JP2018157003A 2018-08-24 2018-08-24 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム Active JP7026386B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018157003A JP7026386B2 (ja) 2018-08-24 2018-08-24 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム
JP2021100886A JP2021140831A (ja) 2018-08-24 2021-06-17 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018157003A JP7026386B2 (ja) 2018-08-24 2018-08-24 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021100886A Division JP2021140831A (ja) 2018-08-24 2021-06-17 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2020030722A true JP2020030722A (ja) 2020-02-27
JP7026386B2 JP7026386B2 (ja) 2022-02-28

Family

ID=69622614

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2018157003A Active JP7026386B2 (ja) 2018-08-24 2018-08-24 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム
JP2021100886A Pending JP2021140831A (ja) 2018-08-24 2021-06-17 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2021100886A Pending JP2021140831A (ja) 2018-08-24 2021-06-17 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム

Country Status (1)

Country Link
JP (2) JP7026386B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112733518A (zh) * 2021-01-14 2021-04-30 卫宁健康科技集团股份有限公司 表格模板生成方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000172779A (ja) * 1998-12-03 2000-06-23 Toshiba Corp Ocrシステム及び同システムに適用する読取制御情報の作成方法
JP2004178107A (ja) * 2002-11-25 2004-06-24 Canon Inc 帳票処理装置
JP2008117126A (ja) * 2006-11-02 2008-05-22 Denso Corp 文字認識装置及び文字認識方法
JP2009087378A (ja) * 2009-01-16 2009-04-23 Hitachi Omron Terminal Solutions Corp 帳票処理装置
JP2011123825A (ja) * 2009-12-14 2011-06-23 Fujitsu Frontech Ltd 文字認識方法、文字認識装置および文字認識プログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008108114A (ja) * 2006-10-26 2008-05-08 Just Syst Corp 文書処理装置および文書処理方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000172779A (ja) * 1998-12-03 2000-06-23 Toshiba Corp Ocrシステム及び同システムに適用する読取制御情報の作成方法
JP2004178107A (ja) * 2002-11-25 2004-06-24 Canon Inc 帳票処理装置
JP2008117126A (ja) * 2006-11-02 2008-05-22 Denso Corp 文字認識装置及び文字認識方法
JP2009087378A (ja) * 2009-01-16 2009-04-23 Hitachi Omron Terminal Solutions Corp 帳票処理装置
JP2011123825A (ja) * 2009-12-14 2011-06-23 Fujitsu Frontech Ltd 文字認識方法、文字認識装置および文字認識プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
新庄 広,外2名: "DPマッチングを用いた帳票枠構造照合方式", 電子情報通信学会技術研究報告 VOL.102 NO.707, vol. 第102巻, JPN6021015439, 2003, JP, ISSN: 0004595842 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112733518A (zh) * 2021-01-14 2021-04-30 卫宁健康科技集团股份有限公司 表格模板生成方法、装置、设备及存储介质

Also Published As

Publication number Publication date
JP7026386B2 (ja) 2022-02-28
JP2021140831A (ja) 2021-09-16

Similar Documents

Publication Publication Date Title
US9613267B2 (en) Method and system of extracting label:value data from a document
US20160171627A1 (en) Processing electronic documents for invoice recognition
JP4347677B2 (ja) 帳票ocrプログラム、方法及び装置
JP5665125B2 (ja) 画像処理方法、及び、画像処理システム
US11321558B2 (en) Information processing apparatus and non-transitory computer readable medium
JP6795195B2 (ja) 文字種推定システム、文字種推定方法、および文字種推定プログラム
US11475688B2 (en) Information processing apparatus and information processing method for extracting information from document image
RU2605078C2 (ru) Сегментация изображения для верификации данных
US9047533B2 (en) Parsing tables by probabilistic modeling of perceptual cues
JP2021140831A (ja) 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム
US9672438B2 (en) Text parsing in complex graphical images
JP4518212B2 (ja) 画像処理装置及びプログラム
WO2021117128A1 (ja) 帳票画像処理システム
CN113806472B (zh) 一种对文字图片和图像型扫描件实现全文检索的方法及设备
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
JP2017188063A (ja) 画像検索システム、画像検索方法、及び画像検索用プログラム
CN113111881A (zh) 信息处理装置及记录媒体
JP5657401B2 (ja) 文書処理装置、及び文書処理プログラム
JP5051174B2 (ja) 帳票辞書生成装置、帳票識別装置、帳票辞書生成方法、及びプログラム
JP2006134079A (ja) 画像処理装置及びプログラム
JP4823049B2 (ja) 文書画像検索装置及びプログラム
JP7358838B2 (ja) 情報処理装置、及び情報処理プログラム
JP6973433B2 (ja) 帳票処理装置、帳票処理方法、及びプログラム
JP2009223391A (ja) 画像処理装置及び画像処理プログラム
US20230099764A1 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210119

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210415

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20210419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210426

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210617

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210916

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211011

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220120

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220207

R150 Certificate of patent or registration of utility model

Ref document number: 7026386

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150