JP2012083951A - 情報処理装置、情報処理方法及びプログラム - Google Patents
情報処理装置、情報処理方法及びプログラム Download PDFInfo
- Publication number
- JP2012083951A JP2012083951A JP2010229714A JP2010229714A JP2012083951A JP 2012083951 A JP2012083951 A JP 2012083951A JP 2010229714 A JP2010229714 A JP 2010229714A JP 2010229714 A JP2010229714 A JP 2010229714A JP 2012083951 A JP2012083951 A JP 2012083951A
- Authority
- JP
- Japan
- Prior art keywords
- definition
- data
- format
- information
- sorting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/174—Form filling; Merging
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Character Input (AREA)
- Processing Or Creating Images (AREA)
Abstract
【課題】周辺環境の変動に対応可能な、帳票の識別情報を作成することができる情報処理装置、情報処理方法及びプログラムを提供する。
【解決手段】本発明の情報処理装置は、帳票の書式定義を含む帳票定義データを格納する記憶部(11)と、帳票のイメージデータを取り込む入力部(14)と、入力部(14)により取り込まれたイメージデータと当該イメージデータに対応する帳票定義データを比較し、その比較結果を帳票定義データに適用することにより、帳票をその構成要素により識別可能とする識別用の情報を作成する制御部(12)と、を備える。
【選択図】図2
【解決手段】本発明の情報処理装置は、帳票の書式定義を含む帳票定義データを格納する記憶部(11)と、帳票のイメージデータを取り込む入力部(14)と、入力部(14)により取り込まれたイメージデータと当該イメージデータに対応する帳票定義データを比較し、その比較結果を帳票定義データに適用することにより、帳票をその構成要素により識別可能とする識別用の情報を作成する制御部(12)と、を備える。
【選択図】図2
Description
本発明は、帳票の定義及び帳票の識別用情報の作成を行う情報処理装置、情報処理方法及びプログラムの技術に関する。
近年、業務改善及びコスト削減の観点から、様々な業務においてペーパーレス化が進められているものの、例えば、取引書類等、未だ紙(帳票)を利用する場面が数多く存在する。従来、このような紙(帳票)が用いられる業務の効率を改善するためにOCR(Optical Character Recognition)ソフトが用いられてきた。例えば、ユーザは、OCRソフ
トを用いることにより、紙(帳票)を識別する。そして、ユーザは、その識別した結果を用いて、同種の紙(帳票)毎にグルーピングする等、紙(帳票)の仕分けを自動的に行うことにより業務効率の改善を行ってきた。
トを用いることにより、紙(帳票)を識別する。そして、ユーザは、その識別した結果を用いて、同種の紙(帳票)毎にグルーピングする等、紙(帳票)の仕分けを自動的に行うことにより業務効率の改善を行ってきた。
しかしながら、紙(帳票)のレイアウトや書式が適切ではない場合、適切にOCR処理が行われず、紙(帳票)の仕分けが行うことができなかった。このため、OCR処理に適した紙(帳票)のレイアウトや書式を作成する必要があった。以下で挙げられる特許文献1及び特許文献2は、そのための技術が開示されている。
特許文献1には、使用するOCR機種、行フィールド数、文字数を定めることにより、使用するOCRで認識する固定の帳票を作成する技術が開示されている。また、特許文献2には、連記式帳票のような同一フォーマットが繰り返される部分を計算しながら、OCR定義体を作成する技術が開示されている。
しかしながら、上記特許文献1及び特許文献2において開示される技術では、例えば、機種の異なるプリンタを用いることにより印字位置がずれてしまったり、スキャナにより帳票のデータを取り込む際に帳票がずれてしまったり等の周辺環境の変動が考慮されていない。そのため、上記特許文献1及び特許文献2において開示される技術では、各ユーザに対して、帳票を、その構成要素により識別するための識別用の情報を適切に作成することはできなかった。
本発明は、このような点を考慮してなされたものであり、周辺環境の変動に対応可能な、帳票の識別情報を作成することができる情報処理装置、情報処理方法及びプログラムを提供することを目的とする。
本発明は、上述した課題を解決するために、以下の構成を採用する。
すなわち、本発明の情報処理装置は、帳票の書式定義を含む帳票定義データを格納する記憶部と、帳票のイメージデータを取り込む入力部と、入力部により取り込まれたイメージデータと当該イメージデータに対応する帳票定義データを比較し、その比較結果を帳票
定義データに適用することにより、帳票をその構成要素により識別可能とする識別用の情報を作成する制御部と、を備える。
定義データに適用することにより、帳票をその構成要素により識別可能とする識別用の情報を作成する制御部と、を備える。
上記構成によれば、帳票の書式定義を含む帳票定義データと入力部により取り込まれたイメージデータとの比較が行われる。そして、当該比較の結果が帳票定義データに適用されることにより帳票を識別するために用いる識別用の情報が作成される。したがって、周辺環境により取り込まれるイメージデータが変動した場合であっても、当該変動に適応した、帳票の識別用情報が作成される。これにより、上記構成によれば、周辺環境の変動に対応可能な、帳票の識別情報を作成することができる。
また、上記構成によれば、帳票定義データにより帳票の識別用情報が作成される。したがって、各ユーザは、帳票用と識別用の定義作成という二重の作業をする必要がなくなる。
また、上記記憶部は複数の帳票定義データを格納してもよい。そして、上記制御部は、イメージデータの構成要素を認識し、認識したイメージデータの構成要素に適合する書式定義を含む帳票定義データを記憶部の中から照合することにより、イメージデータに対応する帳票定義データを取得してもよい。
上記構成によれば、認識されたイメージデータの構成要素に適合する書式定義を含む帳票定義データが記憶部の中から照合されることにより、イメージデータに対応する帳票定義データが取得される。これにより、上記構成によれば、帳票をその構成要素により識別可能とする識別用の情報の作成に用いる帳票定義データをユーザが指定しなくても、当該識別用の情報を作成することができる。
また、上記帳票定義データに含まれる帳票の書式定義は複数の書式定義を含んでもよい。また、上記制御部は、帳票の書式定義に含まれる複数の書式定義に従って作成された帳票をその構成要素により識別可能とする識別用の情報、書式定義毎に作成してもよい。
上記構成によれば、複数の書式定義による帳票の識別を可能とする識別用の情報を作成することができる。
また、上記入力部は、更に、複数のテストデータを取り込んでもよい。また、上記制御部は、前記複数の書式定義に従って作成した識別用の情報を用いて前記複数のテストデータの識別を行い、識別の可否の結果に基づいて、各書式定義によるテストデータの識別率を求め、求めた識別率に基づく帳票を識別する際に用いる優先度を各書式定義に定めた識別用の情報を作成してもよい。
上記構成によれば、入力部により取り込まれた複数のテストデータから、帳票を識別する際に用いる書式定義の優先度が定められる。また、周辺環境により取り込まれるデータが変動した場合であっても、当該変動に適応した優先度が各書式定義に対して定められる。これにより、上記構成によれば、周辺環境の変動に対応可能な、帳票の識別に用いる書式定義の順番を保持した帳票の識別用情報を作成することができる。
また、上記複数の書式定義は、帳票の外観に関する書式を定めた書式定義、帳票が有する光学式マーク認識用のマークの属性値を定めた書式定義、及び特定の領域に実行される文字認識に関する属性値を定めた書式定義のうちの少なくとも1つを含んでもよい。
なお、光学式マーク認識用のマークとは、具体的には、マークシートやバーコードのことであり、所定の情報を格納可能で、かつ、あらかじめ決められた規則に従って紙などに
記入または印刷されるものである。そして、光学式マーク認識用のマークの属性値とは、当該マークが付される帳票上の位置情報、当該マークの大きさ、及び当該マークが格納する所定の情報等を指す。
記入または印刷されるものである。そして、光学式マーク認識用のマークの属性値とは、当該マークが付される帳票上の位置情報、当該マークの大きさ、及び当該マークが格納する所定の情報等を指す。
また、特定の領域に実行される文字認識に関する属性値とは、当該文字認識が実行される特定の領域についての帳票上における位置情報、領域情報及び当該特定の領域に記載される文字情報等を指す。
上記構成によれば、帳票の外観に関する書式を定めた書式定義、帳票が有する光学式マーク認識用のマークの属性値を定めた書式定義、及び特定の領域に実行される文字認識に関する属性値を定めた書式定義のうちの少なくとも1つを含んだ帳票の識別用情報を作成することができる。
また、上記帳票定義データに含まれる帳票の書式定義は、帳票の外観に関する書式を定めた書式定義、帳票が有する光学式マーク認識用のマークの属性値を定めた書式定義、及び特定の領域に実行される文字認識に関する属性値を定めた書式定義の少なくとも一つの書式定義を含んでもよい。また、上記制御部は、帳票の書式定義に含まれる書式定義に従って作成された帳票をその構成要素により識別可能とする識別用の情報を作成してもよい。
上記構成によれば、帳票の外観に関する書式を定めた書式定義、帳票が有する光学式マーク認識用のマークの属性値を定めた書式定義、及び特定の領域に実行される文字認識に関する属性値を定めた書式定義のうち少なくとも一つの書式定義による仕分け定義を含んだ帳票仕分け定義データを作成することができる。
なお、本発明の別態様としては、以上の各構成を実現する情報処理方法であってもよいし、プログラムであってもよいし、このようなプログラムを記録したコンピュータが読み取り可能な記憶媒体であってもよい。また、本発明の別態様として、以上の各構成を実現する複数の装置が通信可能に構成されたシステムであってもよい。
本発明によれば、周辺環境の変動に対応可能な、帳票の識別用情報を作成することができる情報処理装置、情報処理方法及びプログラムを提供することができる。
以下、本発明の一側面に係る情報処理装置、情報処理方法及びプログラムを、実施の形態(以下、「本実施形態」とも表記する)として説明する。ただし、以下に挙げる実施形態は例示であり、本発明は以下の実施形態の構成に限定されない。
なお、以下に挙げる実施形態において、例えば、図4及び図5においてデータベースのレコード例のフィールド名等を自然言語(日本語等)により例示しているが、より具体的には、コンピュータが認識可能な疑似言語、コマンド、パラメタ、マシン語等で指定される。
§1 各装置の接続例
まず、本実施形態に係る情報処理装置に接続される装置例について説明する。図1は、本実施形態に係る情報処理装置に接続される装置を例示する。図1に示されるとおり、本実施形態に係る情報処理装置1は、スキャナ2とプリンタ3と接続している。スキャナ2及びプリンタ3は、情報処理装置1により制御可能な状態で、情報処理装置1と接続している。
まず、本実施形態に係る情報処理装置に接続される装置例について説明する。図1は、本実施形態に係る情報処理装置に接続される装置を例示する。図1に示されるとおり、本実施形態に係る情報処理装置1は、スキャナ2とプリンタ3と接続している。スキャナ2及びプリンタ3は、情報処理装置1により制御可能な状態で、情報処理装置1と接続している。
本実施形態において、情報処理装置1は、帳票の書式定義を含む帳票定義データと、帳票をその構成要素により仕分け可能とする仕分け定義を含む帳票仕分け定義データを作成する。なお、帳票の仕分けとは、例えば、同種の帳票毎にグルーピングすること等である。情報処理装置1は、帳票仕分け定義データに基づいて帳票を識別する。そして、情報処理装置1は、その識別した結果に基づいて帳票の仕分けを行う。帳票仕分け定義データは、本発明に係る帳票をその構成要素により識別可能とする識別用の情報の一例である。
なお、各装置(情報処理装置1、スキャナ2、プリンタ3)の動作は、本実施形態における処理に限定されないことは言うまでもない。
§2 情報処理装置1の構成例
次に、本実施形態に係る情報処理装置1の構成例について説明する。図2は、本実施形態における情報処理装置1の構成例を示す。
次に、本実施形態に係る情報処理装置1の構成例について説明する。図2は、本実施形態における情報処理装置1の構成例を示す。
情報処理装置1は、図2に示されるとおり、そのハードウェア構成として、バス13で接続される、記憶部11、制御部12、入力部14、出力部15等の既存のハードウェアを有している。記憶部11は、例えばハードディスクであり、制御部12で実行される処理で利用される各種データ及びプログラムを記憶する。制御部12は、CPU(Central Processing Unit)等の1又は複数のプロセッサであり、このプロセッサの処理に利用さ
れる周辺回路(ROM(Read Only Memory)、RAM(Random Access Memory)、インタフェース回路等)を有する。入力部14は、スキャナ2によって取り込まれるイメージデータ及びテストデータを受信するためのインタフェースである。また、出力部15は、プリンタ3に対して認識テスト用の帳票データの出力するためのインタフェースである。更に、本実施形態における情報処理装置1は、不図示のユーザインタフェース(モニタ、キーボード、マウス等の入出力装置)が接続されている。
れる周辺回路(ROM(Read Only Memory)、RAM(Random Access Memory)、インタフェース回路等)を有する。入力部14は、スキャナ2によって取り込まれるイメージデータ及びテストデータを受信するためのインタフェースである。また、出力部15は、プリンタ3に対して認識テスト用の帳票データの出力するためのインタフェースである。更に、本実施形態における情報処理装置1は、不図示のユーザインタフェース(モニタ、キーボード、マウス等の入出力装置)が接続されている。
なお、情報処理装置1は、PC等のような汎用コンピュータで構成されてもよいし、ネットワーク接続ストレージのような専用コンピュータで構成されてもよい。
また、本実施形態の別形態として、情報処理装置1がスキャナ2及びプリンタ3とネットワークを介して接続している場合、入力部14及び出力部15は、例えば、IP(Internet Protocol)パケット等の送受信を行う通信部として構成される。
本実施形態では、情報処理装置1は、記憶部11に格納されたデータが制御部12によって処理されることにより、帳票の書式定義を含む帳票定義データと、帳票をその構成要素により仕分け可能とする仕分け定義を定めた帳票仕分け定義データとを作成する。また、本実施形態では、情報処理装置1は、記憶部11に格納されたデータが制御部12によって処理されることにより、帳票の仕分けを実行する。
まず、以上の処理を実現する記憶部11及び制御部12について具体的に説明する前に、帳票について簡単に説明する。
図3は、帳票の例を示す。図3に示される帳票100は、欄101、バーコード102、OCR指定領域103を含む。欄101は、例えば、業務上の情報を手書き、押印または打刻等によって記載するために用いられる。また、バーコード102は、例えば、帳票の種別情報を格納していたり、帳票の個体識別番号を格納していたりする。なお、バーコード102は、例えば、帳票の種別情報及び個体識別番号等を保持するというように複数の情報を格納していてもよい。更に、OCR指定領域103は、指定領域OCRが行われる領域である。指定領域OCRとは、特定の領域だけOCRをかけて文字情報を抽出することである。この領域には、例えば、帳票の種別情報が記載されたり、業務上の特定の情報が記載されたりする。このように、帳票は、その構成要素として、例えば、欄、バーコード、OCR指定領域を含む。
本実施形態において、情報処理装置1は、このような帳票の書式定義を含む帳票定義データを作成する。また、情報処理装置1は、このような帳票を仕分ける(識別する)ための仕分け定義を定めた帳票仕分け定義データを作成する。更に、情報処理装置1は、このような帳票の仕分けを実行する。なお、情報処理装置1は、帳票の構成要素に対して、レイアウト等の外観のパターンマッチング、OCR、またはOMR(Optical Mark Recognition)等の処理を行うことにより、帳票の仕分け(識別)を実行する。以下、情報処理装置1の記憶部11及び制御部12について具体的に説明する。
§2−1 記憶部11
図2により示されるとおり、記憶部11は、帳票定義データベース21及び帳票仕分け定義データベース22を含む。帳票定義データベース21及び帳票仕分け定義データベース22は、例えば、ハードディスクに格納されたデータとして実現される。
図2により示されるとおり、記憶部11は、帳票定義データベース21及び帳票仕分け定義データベース22を含む。帳票定義データベース21及び帳票仕分け定義データベース22は、例えば、ハードディスクに格納されたデータとして実現される。
<帳票定義データベース21>
帳票定義データベース21は帳票定義データを格納する。帳票定義データは、帳票の書式定義を含むデータであり、例えば、帳票の種別毎に用意される。そして、帳票定義データは、例えば、当該帳票定義データに基づいた帳票がプリンタ等によって印刷され、業務において用いられる。
帳票定義データベース21は帳票定義データを格納する。帳票定義データは、帳票の書式定義を含むデータであり、例えば、帳票の種別毎に用意される。そして、帳票定義データは、例えば、当該帳票定義データに基づいた帳票がプリンタ等によって印刷され、業務において用いられる。
図4は、本実施形態における帳票定義データベース21のレコード例(帳票定義データ)を示す。図4に示されるとおり、本実施形態における帳票定義データは、OCR書式定義フィールド、バーコード書式定義フィールド、指定領域OCR書式定義フィールドを含む。
OCR書式定義フィールドは、帳票の構成要素(欄など)の様式及び配置等の情報を格納する。例えば、図4に示されるとおり、OCR書式定義フィールドには、帳票に用いられる色情報、マッチング情報、読み取り後の処理情報等が格納される。
色情報とは、帳票に用いられる色の情報のことである。例えば、図4に示されるとおり、カラー又はモノクロが指定される。
マッチング情報とは、帳票の構成要素の配置等の情報のことであり、罫線情報、用いられる文字やマーク等の情報を含む。なお、罫線情報とは、帳票に用いられる罫線の情報であり、例えば、当該罫線の帳票上の位置情報等である。罫線の帳票上の位置情報は、例えば、当該罫線が満たす条件式や座標等の周知の方法によって規定される。座標は、例えば
、帳票の左上角を(0、0)とした全体座標である。
、帳票の左上角を(0、0)とした全体座標である。
読み取り後の処理情報とは、帳票がスキャナ等により電子データ化される際に行われる処理の情報のことである。なお、図4に示される「傾き補正ON」とは、周知の方法によって行われる読み取り画像の傾きを補正する機能が実行されることを指す。
このようにOCR書式定義フィールドに格納される情報は、帳票のレイアウト等の外観に関する情報であり、OCR書式定義は、本発明に係る帳票の外観に関する書式を定めた書式定義の一例である。なお、本実施形態において、OCR書式定義フィールドに格納されるマッチング情報は、帳票の仕分けの際、パターンマッチングの処理に用いられる。なお、例えば、情報処理装置1は、仕分け対象の帳票の構成要素のレイアウト等の外観を認識し、その外観のパターンがマッチング情報と適合する(マッチ)するか否かにより適合率を求める。そして、情報処理装置1は、仕分け対象の帳票を、求めた適合率が所定の値を超えるマッチング情報を有する帳票として仕分ける。
バーコード書式定義フィールドは、帳票に用いられるバーコードの情報を格納する。例えば、図4に示されるとおり、バーコード書式定義フィールドには、バーコードの種類を示す情報、バーコードが印字される印字位置の座標を示す情報、バーコードのデータ形式等を示すバーコード情報等が格納される。なお、バーコード書式定義は、本発明に係る帳票が有する光学式マーク認識用のマークの属性値を定めた書式定義の一例である。本実施形態に係る情報処理装置1は、仕分け対象の帳票の構成要素(バーコード)をOMR処理することにより、帳票の仕分けを実行する。
バーコードの種類を示す情報は、帳票に用いられるバーコードの種類を指す。帳票に用いられるバーコードの種類は任意であり、例えば図4に示される、QRコード、NW−7、CODE39等である。
バーコードが印字される印字位置の座標を示す情報は、バーコードが帳票上に印字される位置座標を指す。当該位置座標は任意の形式でよい。例えば、バーコードの位置座標は、帳票の左上角を(0、0)とした全体座標における当該バーコードの中心の位置座標である。また、例えば、バーコードの位置座標は、帳票の左上角を(0、0)とした全体座標における当該バーコードの印字領域の左上角の座標である。なお、バーコードが印字される印字位置の座標を示す情報には、バーコードの印字領域の範囲に関する情報が含まれてもよい。本実施形態において、この情報は、帳票の仕分け処理において、バーコードを取得する位置を決定するために用いられる。
バーコード情報は、バーコードに格納されるデータ形式及びデータ情報を指す。例えば、バーコード情報には、「key-value型」、「区切り文字」、又は「区切り桁」等のバー
コードに格納されるデータ形式の情報が格納され、合わせて、バーコードが保持するデータの情報が格納される。なお、ここでいう「key-value型」、「区切り文字」、又は「区
切り桁」とは、バーコードに格納されるデータの読み取り方法を示す情報である。読み取り位置を示す情報は、例えば、ある区切り文字以降が読み取り対象のデータである、という形式によって指定される。
コードに格納されるデータ形式の情報が格納され、合わせて、バーコードが保持するデータの情報が格納される。なお、ここでいう「key-value型」、「区切り文字」、又は「区
切り桁」とは、バーコードに格納されるデータの読み取り方法を示す情報である。読み取り位置を示す情報は、例えば、ある区切り文字以降が読み取り対象のデータである、という形式によって指定される。
ここで、バーコードが保持するデータには、帳票の仕分けを行うための情報が含まれる。この帳票の仕分けを行うための情報は、例えば、帳票の種別を識別するための種別情報であり、本実施形態では、帳票の仕分け処理に用いられる。なお、バーコードは、このほかに、帳票の個体識別番号を格納していてもよい。また、バーコードは、例えば、帳票の種別情報と個体識別番号等を格納するというように複数の情報を格納してもよい。
指定領域OCR書式定義フィールドは、帳票に対して行われる指定領域OCRに関する情報を格納する。例えば、図4に示されるとおり、指定領域OCR書式定義フィールドには、指定領域OCRが行われる当該指定領域の座標を示す情報、指定領域OCRによって読み取られるべき読み取り情報等が格納される。なお、指定領域OCR書式定義は、本発明に係る特定の領域に実行される文字認識に関する属性値を定めた書式定義の一例である。本実施形態に係る情報処理装置1は、仕分け対象の帳票の構成要素をOCR処理することにより、帳票の仕分けを実行する。
指定領域の座標を示す情報は、指定領域OCRが行われる帳票上の位置座標を指す。例えば、指定領域の位置座標は、帳票の左上角を(0、0)とした全体座標における当該指定領域の中心の位置座標である。また、例えば、指定領域の位置座標は、帳票の左上角を(0、0)とした全体座標における当該指定領域の左上角の座標である。なお、指定領域の座標を示す情報には、指定領域の範囲に関する情報が含まれてもよい。本実施形態において、この情報は、帳票の仕分け処理において、指定領域OCRを行う位置を決定するために用いられる。
読み取り情報には、指定領域に格納されるデータ形式及びデータの情報が格納される。例えば、読み取り情報には、「区切り文字」、「区切り桁」、又は「文字種別」等の指定領域に格納されるデータ形式の情報が格納され、合わせて、指定領域に格納されるデータの情報が格納される。この点については、上記「バーコード情報」と同様である。
また、バーコード情報と同様に、読み取り情報には、帳票の仕分けを行うための情報が格納される。この帳票の仕分けを行うための情報は、例えば、帳票の種別を識別するための種別情報であり、本実施形態では、帳票の仕分け処理に用いられる。なお、読み取り情報には、このほかに、帳票の個体識別番号を格納されてもよい。また、読み取り情報には、例えば、帳票の種別情報と個体識別番号等が格納されるというように、複数の情報が格納されてもよい。
なお、本実施形態の別形態として、帳票定義データは、OCR書式定義、バーコード書式定義、及び指摘領域OCR書式定義を全て含まなくてもよい。例えば、帳票定義データは、OCR書式定義、バーコード書式定義、及び指摘領域OCR書式定義のうちの少なくとも1つの書式定義又は複数の書式定義を含んでもよい。
また、帳票定義データは、OCR書式定義、バーコード書式定義、及び指摘領域OCR書式定義に限定されるものではない。帳票定義データは、帳票の書式に関するデータであれば、OCR書式定義、バーコード書式定義、及び指摘領域OCR書式定義以外のデータであってもよい。
<帳票仕分け定義データベース22>
帳票仕分け定義データベース22は帳票仕分け定義データを格納する。帳票仕分け定義データは、その構成要素により帳票の仕分けを規則づけるデータであり、例えば、業務部門毎に用意される。そして、帳票仕分け定義データは、例えば、当該業務部門において、スキャナ等により電子データ化した帳票を仕分ける(例えば、同種の帳票毎にグルーピングする)ために用いられる。
帳票仕分け定義データベース22は帳票仕分け定義データを格納する。帳票仕分け定義データは、その構成要素により帳票の仕分けを規則づけるデータであり、例えば、業務部門毎に用意される。そして、帳票仕分け定義データは、例えば、当該業務部門において、スキャナ等により電子データ化した帳票を仕分ける(例えば、同種の帳票毎にグルーピングする)ために用いられる。
図5は、本実施形態における帳票仕分け定義データベース22のレコード例(帳票仕分け定義データ)を示す。図5に示されるとおり、本実施形態における帳票仕分け定義データは、OCR書式定義フィールド、バーコード書式定義フィールド、指定領域OCR書式定義フィールドを含む。そして、本実施形態における帳票仕分け定義データは、帳票の仕分け対象毎(例えば、帳票の種別)に、OCR書式定義、バーコード書式定義、及び指摘
領域OCR書式定義を格納する。ここで、OCR書式定義、バーコード書式定義、及び指摘領域OCR書式定義については、上記帳票定義データと同様であるため、説明は省略する。
領域OCR書式定義を格納する。ここで、OCR書式定義、バーコード書式定義、及び指摘領域OCR書式定義については、上記帳票定義データと同様であるため、説明は省略する。
なお、本実施形態の別形態として、帳票仕分け定義データは、OCR書式定義、バーコード書式定義、及び指摘領域OCR書式定義を全て含まなくてもよい。例えば、帳票仕分け定義データは、OCR書式定義、バーコード書式定義、及び指摘領域OCR書式定義のうちの少なくとも1つの書式定義又は複数の書式定義を含んでもよい。
また、帳票仕分け定義データは、OCR書式定義、バーコード書式定義、及び指摘領域OCR書式定義に限定されるものではない。帳票仕分け定義データは、帳票の仕分けに用いられるデータであれば、OCR書式定義、バーコード書式定義、及び指摘領域OCR書式定義以外のデータであってもよい。
§2−2 制御部12
図2に示されるとおり、制御部12は、帳票定義作成部30、帳票仕分け定義作成部33、及び帳票仕分け処理部34を含む。帳票定義作成部30、帳票仕分け定義作成部33、及び帳票仕分け処理部34は、記憶部11に格納されたプログラム等が制御部12の周辺回路であるRAM等に展開され、制御部12のプロセッサにより実行されることによって実現される。
図2に示されるとおり、制御部12は、帳票定義作成部30、帳票仕分け定義作成部33、及び帳票仕分け処理部34を含む。帳票定義作成部30、帳票仕分け定義作成部33、及び帳票仕分け処理部34は、記憶部11に格納されたプログラム等が制御部12の周辺回路であるRAM等に展開され、制御部12のプロセッサにより実行されることによって実現される。
上述のとおり、制御部12は、記憶部11に格納された情報を用いて、帳票定義データの作成、帳票仕分け定義データの作成、帳票の仕分け処理を行う。以下、各構成について説明する。
<帳票定義作成部30>
帳票定義作成部30は、帳票定義データの作成を行う。図2に示されるとおり、帳票定義作成部30は、帳票定義設計部31及び帳票定義生成部32を含む。帳票定義設計部31及び帳票定義生成部32は、記憶部11に格納されたプログラム等が制御部12の周辺回路であるRAM等に展開され、制御部12のプロセッサにより実行されることによって実現される。
帳票定義作成部30は、帳票定義データの作成を行う。図2に示されるとおり、帳票定義作成部30は、帳票定義設計部31及び帳票定義生成部32を含む。帳票定義設計部31及び帳票定義生成部32は、記憶部11に格納されたプログラム等が制御部12の周辺回路であるRAM等に展開され、制御部12のプロセッサにより実行されることによって実現される。
本実施形態では、帳票定義設計部31は、ユーザインタフェースを介したユーザからの入力情報に応じて、帳票を作成するためのデータを取得する。帳票定義設計部31は、帳票を生成するためのデータを取得するために、例えば、ユーザインタフェースを介して当該情報を入力するための任意のインタフェースをユーザに提供する。任意のインタフェースとして、例えば、帳票定義設計部31は、周知の描画ツールや選択情報の提示等を行うインタフェースをユーザに提供する。ユーザは、マウスやキーボード等のユーザインタフェースを介して、当該描画ツールを操作し、選択情報の決定操作をし、図3に示されるような帳票の欄を設計したり、バーコード情報を入力したり、指定領域OCRを行う領域の決定を行ったりする。また、当該インタフェースを介して、ユーザは、バーコードや指定領域OCRを行う領域に格納される帳票を識別するための情報を入力する。当該入力は、上述した帳票定義データの各書式定義フィールドの項目に情報を格納するために行われる。帳票定義設計部31は、帳票定義データを作成するためにこれらの入力情報を帳票定義生成部32に出力する。
帳票定義生成部32は、帳票定義設計部31から受け取った帳票を生成するためのデータに基づいて、帳票定義データの作成を行う。具体的には、帳票定義生成部32は、データが空の状態の帳票定義データ(図4に示されるレコード)を用意し、帳票定義設計部31から受け取ったユーザによる入力情報を所定の形式で各項目に格納することで、帳票定
義データを作成する。この時、帳票定義設計部31から受け取った帳票を生成するためのデータが、帳票定義データのデータ形式と異なる場合、帳票定義生成部32は、所定のデータ形式の変換を実行する。そして、データ形式の変換を実行した帳票を生成するためのデータを、帳票定義データの各項目に格納する。
義データを作成する。この時、帳票定義設計部31から受け取った帳票を生成するためのデータが、帳票定義データのデータ形式と異なる場合、帳票定義生成部32は、所定のデータ形式の変換を実行する。そして、データ形式の変換を実行した帳票を生成するためのデータを、帳票定義データの各項目に格納する。
以上により、帳票定義設計部31から受け取った帳票を生成するためのデータが全て帳票定義データの各項目に格納されると、帳票定義生成部32は、帳票定義データの作成を完了する。そして、帳票定義生成部32は、作成の完了した帳票定義データを帳票定義データベース21に格納する。
なお、この時、帳票定義データの全てのフィールドに情報が格納される必要はない。例えば、OCR書式定義フィールドのみ情報が格納されてもよい。ただし、本実施形態では、ユーザからの入力情報が不足していることにより帳票データが作成できない場合、帳票定義設計部31又は帳票定義生成部32は、例えば、ユーザインタフェース(モニタ等)に入力情報が不足していることを表示し、処理を停止させる等のエラー処理を行う。なお、ユーザからの入力情報が不足していることにより帳票データが作成できない場合とは、例えば、一切帳票の情報が指定されていない場合等である。
<帳票仕分け定義作成部33>
帳票仕分け定義作成部33は、帳票仕分け定義データを作成する。帳票仕分け定義作成部33は、帳票定義データと入力部14に入力されるイメージデータに基づいて、帳票仕分け定義データを作成する。なお、この帳票仕分け定義データを作成することには、既に作成された帳票仕分け定義データを更新することも含まれる。
帳票仕分け定義作成部33は、帳票仕分け定義データを作成する。帳票仕分け定義作成部33は、帳票定義データと入力部14に入力されるイメージデータに基づいて、帳票仕分け定義データを作成する。なお、この帳票仕分け定義データを作成することには、既に作成された帳票仕分け定義データを更新することも含まれる。
本実施形態では、帳票仕分け定義作成部33は、帳票定義データベース21から帳票定義データを取得する。なお、当該帳票定義データを取得する際、帳票仕分け定義作成部33は、取得したデータが帳票定義データであるか否かの確認処理(データ形式のチェック)を行う。帳票仕分け定義作成部33は、例えば、予め用意されたチェックリストを照合する等により、当該確認処理を行う。
また、本実施形態では、帳票仕分け定義作成部33は、帳票仕分け定義データを作成するために、イメージデータの入力を受け付ける。例えば、帳票仕分け定義作成部33は、イメージデータを入力部14から取得する。イメージデータは、例えば、帳票定義データに基づいて作成される帳票データがプリンタ3によって印刷された帳票をスキャナ2によって電子データ化したデータである。なお、イメージデータは、例えば、帳票定義データに沿って、ユーザが手書き、押印、又はシール等の貼付等によって作成した帳票をスキャナ2によって電子データ化したデータであってもよい。本実施形態におけるスキャナ2によって電子データ化される帳票は任意のものでよい。そして、スキャナ2によって電子データ化された帳票がイメージデータとして入力部14に入力されることにより、帳票仕分け定義作成部33はイメージデータを入力部14から取得する。なお、帳票仕分け定義作成部33は、複数のイメージデータを取得してもよいし、1つのイメージデータを取得してもよい。また、イメージデータは、例えば、ネットワークを介して情報処理装置1に入力される等、任意に入力されてもよい。
帳票仕分け定義作成部33は、入力部14よりイメージデータを取得すると、取得したイメージデータ(帳票)に対応する帳票定義データを取得した帳票定義データのなかから特定する。本処理は任意に行われる。帳票仕分け定義作成部33は、例えば、ユーザインタフェースを介してユーザにより入力される情報(帳票定義データの選択情報)に基づいて、帳票定義データを特定してもよい。
また、帳票仕分け定義作成部33は、取得した帳票定義データに含まれる各書式定義を無作為に選択して、取得したイメージデータと照合することにより、取得したイメージデータに対応する帳票定義データを特定してもよい。
例えば、当該照合にOCR書式定義が用いられる場合、帳票仕分け定義作成部33は、帳票定義データに格納されたOCR書式定義を用いてイメージデータの照合を行う。具体的には、帳票仕分け定義作成部33は、帳票定義データのOCR書式定義フィールドに格納されたマッチング情報を用いて、イメージデータをパターンマッチングすることにより、上記照合を行う。そして、帳票仕分け定義作成部33は、所定の適合率を超えるマッチング情報を持つ帳票定義データを、当該イメージデータに対応する帳票定義データである特定する。なお、所定の適合率とは、プリンタ3やスキャナ2等の周辺環境による誤差や、ユーザの手書きや押印等に起因する誤差等に対応するために、任意に設定されるものである。
また、例えば、上記照合にバーコード書式定義が用いられる場合、帳票仕分け定義作成部33は、帳票定義データに格納されるバーコード書式定義を用いてイメージデータの照合を行う。具体的には、帳票定義データのバーコード書式定義フィールドに格納されたバーコードの印字位置の座標情報に基づいて、バーコードを取得する位置を特定する。帳票仕分け定義作成部33は、上述の、プリンタ3やスキャナ2等の周辺環境による誤差や、ユーザの手書きや押印等に起因する誤差等に対応するため、バーコードの取得を、バーコードの印字位置を基準とした任意の所定領域に対して行う。この処理によりバーコードが取得できた帳票定義データに対して、帳票仕分け定義作成部33は、バーコードの情報に基づく、イメージデータに対応する帳票定義データの特定を行う。帳票仕分け定義作成部33は、バーコード書式定義フィールドに格納されるバーコードの種類を示す情報に基づいて、取得したバーコードの種類を認識し、デコードする。そして、帳票仕分け定義作成部33は、当該デコードしたバーコードのデータと、バーコード書式定義フィールドに格納されるバーコード情報に含まれる帳票の仕分けを行うための情報により、イメージデータに対応する帳票定義データを特定する。なお、上記処理において、例えば、バーコードが取得できなかった場合やバーコードのデコードが出来なかった場合、当該情報を格納する帳票定義データはイメージデータに対応した帳票定義データではない。したがって、帳票仕分け定義作成部33は、これらの帳票定義データについては、イメージデータに対応する帳票定義データではないと取り扱う。ただし、例えば、上記誤差が設定されている任意の所定領域を超えてしまったために、全ての帳票定義データに対してバーコードが取得できなかった場合がある。このような場合、帳票仕分け定義作成部33は、イメージデータ全体からバーコードの捜索を行うことで、バーコードの取得を行ってもよい。また、この処理により、複数のバーコードが検出された場合、帳票仕分け定義作成部33は、任意の方法で、上記照合に用いるバーコードを特定してよい。例えば、帳票仕分け定義作成部33は、ユーザインタフェースを介してユーザにより入力される情報(バーコードの選択情報)に基づいて、上記照合に用いるバーコードを特定してもよい。
また、例えば、上記照合に指定領域OCR書式定義が用いられる場合、帳票仕分け定義作成部33は、帳票定義データに格納される指定領域OCR書式定義を用いてイメージデータの照合を行う。具体的には、帳票定義データの指定領域OCR書式定義フィールドに格納された指定領域の座標情報に基づいて、指定領域OCRを実施する位置及び領域を特定する。帳票仕分け定義作成部33は、上述の、プリンタ3やスキャナ2等の周辺環境による誤差や、ユーザの手書きや押印等に起因する誤差等に対応するため、当該指定領域OCRの実施を、当該指定領域の座標情報を基準とした任意の所定領域に対して行う。この処理により、情報が取得できた帳票定義データに対して、帳票仕分け定義作成部33は、読み取り情報に基づく、イメージデータに対応する帳票定義データの特定を行う。帳票仕分け定義作成部33は、上記取得した情報と、指定領域OCR書式定義フィールドに格納
される読み取り情報に含まれる帳票の仕分けを行うための情報により、イメージデータに対応する帳票定義データを特定する。なお、上記処理において、例えば、指定領域OCRにより情報が取得できなかった場合、当該情報を格納する帳票定義データはイメージデータに対応した帳票定義データではない。したがって、帳票仕分け定義作成部33は、これらの帳票定義データについては、イメージデータに対応する帳票定義データではないと取り扱う。
される読み取り情報に含まれる帳票の仕分けを行うための情報により、イメージデータに対応する帳票定義データを特定する。なお、上記処理において、例えば、指定領域OCRにより情報が取得できなかった場合、当該情報を格納する帳票定義データはイメージデータに対応した帳票定義データではない。したがって、帳票仕分け定義作成部33は、これらの帳票定義データについては、イメージデータに対応する帳票定義データではないと取り扱う。
なお、取得したイメージデータに対応する帳票定義データが複数存在する場合、帳票仕分け定義作成部33は、任意の方法で、取得したイメージデータに対応する帳票定義データを特定する。帳票仕分け定義作成部33は、例えば、複数の書式定義を用いて上記照合を行い、適合する書式定義が多い帳票定義データを、取得したイメージデータに対応する帳票定義データと特定する。また、例えば、帳票仕分け定義作成部33は、当該複数の帳票定義データをユーザインタフェースに表示し、ユーザからの入力情報を受け付けてもよい。この場合、帳票仕分け定義作成部33は、当該ユーザからの入力情報(帳票定義データの選択)に対応する帳票定義データを、取得したイメージデータに対応する帳票定義データと特定する。これにより、帳票仕分け定義作成部33は、仕分け定義を作成する対象の帳票を特定する。本実施形態では、帳票仕分け定義作成部33は、図5に示される帳票名(「帳票A」、「帳票B」等)を取得する。
以上により入力部14から取得したイメージデータと、当該イメージデータに対応する帳票定義データとを用いて、帳票仕分け定義作成部33は、帳票仕分け定義データを作成する。なお、本実施形態では、この時点において、帳票仕分け定義作成部33は、帳票名のラベルが特定された仕分け定義データ(図5に示される帳票仕分け定義データの行データに相当)を保持している。ただし、この時点において、仕分け定義データの各書式定義フィールドには、何らデータが格納されていない。また、本実施形態では、この時点において、帳票仕分け定義作成部33は、何ら情報の格納されていない帳票仕分け定義データを保持している。
OCR書式定義が帳票の仕分けに用いられる場合、帳票仕分け定義作成部33は、仕分け定義データのOCR書式定義フィールドに格納する情報を、帳票定義データのOCR書式定義フィールドから取得する。そして、帳票仕分け定義作成部33は、帳票定義データのOCR書式定義フィールドから取得した情報に含まれるマッチング情報によりイメージデータのパターンマッチングを行う。これにより、帳票仕分け定義作成部33は、マッチング情報により指定された罫線情報等とイメージデータとの誤差を求め、当該誤差を修正(補正)したマッチング情報を作成する。そして、帳票仕分け定義作成部33は、作成したマッチング情報と、帳票定義データのOCR書式定義フィールドに格納されたマッチング情報以外の情報とを、仕分け定義データのOCR書式定義フィールドに格納する。
なお、同一の帳票に対して複数のイメージデータが取得されている場合、帳票仕分け定義作成部33は、これら複数のイメージデータ間の誤差(例えば、誤差の平均値)を、例えば、周知の数学的手法により求めてもよい。そして、帳票仕分け定義作成部33は、求めた誤差によりマッチング情報の座標情報等を修正(補正)してもよい。
また、当該修正(補正)は、OCR書式定義フィールドに格納された読み取り後の処理情報に基づいて変更してもよい。例えば、読み取り後の処理情報により、上記読み取り画像の傾き補正が行われることが示されていた場合、帳票仕分け定義作成部33は、求めた誤差よりも小さな誤差によりマッチング情報の座標情報等を修正(補正)してもよい。
また、帳票仕分け定義作成部33は、OCR書式定義を帳票の仕分けに用いるか否かの判断を任意に行う。当該判断は、記憶部11に格納されるプログラム等のパラメタ設定に
よって行われてもよいし、イメージデータに対応する帳票定義データにOCR書式定義が格納されているか否かによって行われてもよい。また、当該判断は、ユーザインタフェースを介したユーザによる入力情報に基づいて行われてもよい。この点については、以下のバーコード書式定義を帳票の仕分けに用いるか否かの判断、及び、指定領域OCR書式定義を帳票の仕分けに用いるか否かの判断と同様である。
よって行われてもよいし、イメージデータに対応する帳票定義データにOCR書式定義が格納されているか否かによって行われてもよい。また、当該判断は、ユーザインタフェースを介したユーザによる入力情報に基づいて行われてもよい。この点については、以下のバーコード書式定義を帳票の仕分けに用いるか否かの判断、及び、指定領域OCR書式定義を帳票の仕分けに用いるか否かの判断と同様である。
次に、バーコード書式定義が帳票の仕分けに用いられる場合、帳票仕分け定義作成部33は、仕分け定義データのバーコード書式定義フィールドに格納する情報を、帳票定義データのバーコード書式定義フィールドから取得する。そして、帳票仕分け定義作成部33は、帳票定義データのバーコード書式定義フィールドから取得した情報に含まれるバーコードの印字される印字位置の座標を示す情報(バーコードの位置座標)に基づいて、イメージデータからバーコードの検出を行う。なお、当該検出には、上述した帳票定義データの特定と同様に、プリンタ3やスキャナ2等の周辺環境による誤差や、ユーザの手書きや押印等に起因する誤差等が考慮される。
バーコードが検出できた場合、帳票仕分け定義作成部33は、イメージデータ上におけるバーコードの位置座標を取得し、当該位置座標と、帳票定義データのバーコード書式定義フィールドから取得したバーコードの位置座標との誤差(相違)を計算する。
他方、バーコードの検出ができなかった場合、帳票仕分け定義作成部33は、イメージデータ全体からバーコードの捜索を行うことで、バーコードの取得を行ってもよい。また、この処理により、複数のバーコードが検出された場合、帳票仕分け定義作成部33は、任意の方法で、仕分けに用いるバーコードを特定してもよい。例えば、帳票仕分け定義作成部33は、ユーザインタフェースを介してユーザにより入力される情報(バーコードの選択情報)に基づいて、仕分けに用いるバーコードを特定してもよい。帳票仕分け定義作成部33は、当該処理により検出したバーコードの位置座標を取得し、当該位置座標と、帳票定義データのバーコード書式定義フィールドから取得したバーコードの位置座標との誤差を計算する。
なお、上記誤差の修正(補正)については、上記マッチング情報の座標情報等の修正(補正)と同様であるため、説明を省略する。帳票仕分け定義作成部33は、当該修正(補正)したバーコードの位置座標の情報と、帳票定義データのバーコード書式定義フィールドの印字位置の座標情報以外の情報とを、仕分け定義データのバーコード書式定義フィールドに格納する。
また、イメージデータ全体からバーコードの検出ができなかった場合、帳票仕分け定義作成部33は、バーコード書式定義を当該帳票の仕分けに用いないと判断してもよいし、帳票定義データのバーコード書式定義フィールドに格納されている情報をそのまま仕分け定義データのバーコード書式定義フィールドに格納してもよい。つまり、帳票仕分け定義作成部33は、上記修正(補正)を行わず、帳票定義データのバーコード書式定義フィールドに格納されている情報を仕分け定義データのバーコード書式定義フィールドに格納してもよい。
次に、指定領域OCR書式定義が帳票の仕分けに用いられる場合、帳票仕分け定義作成部33は、仕分け定義データの指定領域OCR書式定義フィールドに格納する情報を、帳票定義データの指定領域OCR書式定義フィールドから取得する。そして、帳票仕分け定義作成部33は、帳票定義データの指定領域OCR書式定義フィールドから取得した情報に含まれる指定領域OCRを実行する指定領域の座標を示す情報(指定領域の位置座標)に基づいて、イメージデータに対して指定領域OCRを実行する。なお、当該指定領域OCRの実行には、上述した帳票定義データの特定と同様に、プリンタ3やスキャナ2等の
周辺環境による誤差や、ユーザの手書きや押印等に起因する誤差等が考慮される。
周辺環境による誤差や、ユーザの手書きや押印等に起因する誤差等が考慮される。
指定領域から情報が取得できた場合、帳票仕分け定義作成部33は、イメージデータ上における当該情報が取得できた位置座標を取得し、当該位置座標と、帳票定義データの指定領域OCR書式定義フィールドから取得した指定領域の位置座標との誤差を計算する。
当該誤差の修正(補正)については、上記マッチング情報の座標情報等の修正(補正)と同様であるため、説明を省略する。帳票仕分け定義作成部33は、当該修正(補正)した指定領域の位置座標の情報と、帳票定義データの指定領域OCR書式定義フィールドの指定領域の位置座標情報以外の情報とを、仕分け定義データの指定領域OCR書式定義フィールドに格納する。
他方、指定領域から情報が取得できなかった場合、帳票仕分け定義作成部33は、指定領域OCR書式定義を当該帳票の仕分けに用いないと判断してもよいし、帳票定義データの指定領域OCR書式定義フィールドに格納されている情報をそのまま仕分け定義データの指定領域OCR書式定義フィールドに格納してもよい。
以上により、帳票仕分け定義作成部33は、OCR書式定義フィールド、バーコード書式定義フィールド、指定領域OCR書式定義フィールドのそれぞれに情報が格納された(各フィールドに対して情報が格納されなかった場合も含め)仕分け定義データを作成する。そして、帳票仕分け定義作成部33は、作成した仕分け定義データを、帳票仕分け定義データの行データとして格納する。
本実施形態において、帳票仕分け定義作成部33は、以上までの処理を繰り返し、ユーザにより設定された、又は、イメージデータとして入力された帳票の仕分け定義データを作成し、作成した仕分け定義データを帳票仕分け定義データに行データとして追加する。そして、帳票仕分け定義作成部33は、仕分け定義データを作成すべき対象の帳票が尽きた時、帳票仕分け定義作成部33は、仕分け定義データの作成を終了すると判定し、上記仕分け定義データの追加処理を完了する。すなわち、帳票仕分け定義作成部33は、帳票仕分け定義データの作成を完了する。なお、仕分け定義データを作成すべき対象の帳票が尽きた時とは、本実施形態では、ユーザにより設定された、又は、イメージデータとして入力された帳票の仕分け定義データを全て作成し、帳票仕分け定義データの行データを追加した時のことである。帳票仕分け定義作成部33は、更に仕分け定義データを作成するため、イメージデータの入力を再度受け付けてもよい。
本実施形態では、情報処理装置1において、当該帳票仕分け定義データの作成と共に、各書式定義を用いた帳票の仕分けの認識率(本発明に係る識別率に相当)を測る認識テストが実行される。帳票の仕分けの実行については、後述する帳票仕分け処理部34によって処理されるため、当該認識テストについては、以下に後述する。
認識テストが実行される場合、後述する帳票仕分け処理部34は、帳票仕分け定義作成部33が作成を完了した帳票仕分け定義データを用いて帳票の仕分け処理を実行した結果、各書式定義による帳票の仕分け率(認識率)を測定する。そして、帳票仕分け定義作成部33は、各書式定義に対する帳票の認識率を帳票仕分け処理部34から受け取り、当該認識率に基づいて、帳票の仕分けに用いる優先度を各書式定義に対して設定する。例えば、帳票仕分け定義作成部33は、認識率の高い書式定義について、高い優先度を付与する。当該優先度の付与は、仕分け定義データ毎に行われてもよいし、仕分け定義データを区別せず帳票仕分け定義データ全体に行われてもよい。そして、帳票仕分け定義作成部33は、優先度を付与した帳票仕分け定義データを帳票仕分け定義データベース22に格納する。
他方、認識テストが実行されない場合、帳票仕分け定義作成部33は、作成を完了した帳票仕分け定義データを帳票仕分け定義データベース22に格納する。
なお、当該認識テストは、帳票仕分け定義データの作成とは別に実施されてもよい。また、当該認識テストが実行されるか否かについては、ユーザインタフェースを介したユーザによる入力情報(または、ユーザによる設定)、または、記憶部11に格納されたプログラム等のパラメタ等により任意に設定される。帳票仕分け定義作成部33は、これらの設定により、認識テストが実行されるか否かを判定する。
なお、帳票仕分け定義作成部33は、例えば、帳票仕分け定義データに、新しい帳票の仕分け定義データ(図5に示される帳票仕分け定義データの行データに相当)を追加する場合についても、上記処理と同様の処理によって実行することが可能である。この場合、帳票仕分け定義作成部33は、上記処理により、仕分け対象の帳票、当該帳票の仕分けに用いる各書式定義情報を取得する。そして、帳票仕分け定義作成部33は、これらにより取得した各情報を、帳票仕分け定義データベース22に格納された帳票仕分け定義データに追加する。
<帳票仕分け処理部34>
帳票仕分け処理部34は、任意の時点において、スキャナ2等によって電子データ化され、入力部14から取得された帳票データに対して、帳票の仕分け処理を行う。帳票仕分け処理部34は、帳票仕分け定義データベース22に格納されている帳票仕分け定義データを用いて、帳票の仕分け処理を行う。なお、帳票の仕分け処理の対象となる帳票データは、任意に入力され、例えば、ネットワークを介して情報処理装置1に入力されてもよい。
帳票仕分け処理部34は、任意の時点において、スキャナ2等によって電子データ化され、入力部14から取得された帳票データに対して、帳票の仕分け処理を行う。帳票仕分け処理部34は、帳票仕分け定義データベース22に格納されている帳票仕分け定義データを用いて、帳票の仕分け処理を行う。なお、帳票の仕分け処理の対象となる帳票データは、任意に入力され、例えば、ネットワークを介して情報処理装置1に入力されてもよい。
帳票仕分け処理部34は、帳票仕分け定義データの各書式定義フィールドに格納された情報に基づいて、帳票の仕分け処理を行う。
例えば、OCR書式定義フィールドに格納された情報に基づいて帳票の仕分け処理を行う場合、帳票仕分け処理部34は、OCR書式定義フィールドのマッチング情報を用いて帳票データのパターンマッチングを行う。そして、帳票仕分け処理部34は、パターンマッチングの適合率が所定の値を超える仕分け定義データを特定し、仕分け処理の対象の帳票データを特定した仕分け定義データに付与された帳票名の帳票と識別する。更に、当該識別結果を用いて、帳票仕分け処理部34は、例えば、仕分け処理の対象の帳票データを当該帳票名のグループにグルーピングする。
また、例えば、バーコード書式定義フィールドに格納された情報に基づいて帳票の仕分け処理を行う場合、帳票仕分け処理部34は、バーコード書式定義フィールドに格納されたバーコードの印字位置を基準とした任意の所定領域からバーコードを取得する。なお、ここでいう所定領域は、上述した内容と同様、周辺環境等による誤差を考慮したものである。
そして、取得したバーコードを、バーコード書式定義フィールドに格納されたバーコードの種類を示す情報及びバーコード情報を用いてデコード等を行い、適合する仕分け定義データを特定する。適合する仕分け定義データを特定するためのデータ、つまり、帳票の仕分けを行うためのデータは、上述したとおり、バーコード情報に含まれている。帳票仕分け処理部34は、取得したバーコードをデコードし、デコードした情報(データ)をバーコード情報に含まれる帳票の仕分けを行うためのデータと照合することにより、帳票データに適合する仕分け定義データを特定する。そして、帳票仕分け処理部34は、仕分け
処理の対象の帳票データを特定した仕分け定義データに付与された帳票名の帳票と識別する。更に、当該識別結果を用いて、帳票仕分け処理部34は、例えば、仕分け処理の対象の帳票データを当該帳票名のグループにグルーピングする。なお、バーコードが取得できない場合やバーコードがデコードできない場合、帳票仕分け処理部34は当該仕分け定義データにより帳票データは仕分けることはできないと判断する。つまり、帳票仕分け処理部34は、帳票データに当該仕分け定義データは適合しないと判断する。
処理の対象の帳票データを特定した仕分け定義データに付与された帳票名の帳票と識別する。更に、当該識別結果を用いて、帳票仕分け処理部34は、例えば、仕分け処理の対象の帳票データを当該帳票名のグループにグルーピングする。なお、バーコードが取得できない場合やバーコードがデコードできない場合、帳票仕分け処理部34は当該仕分け定義データにより帳票データは仕分けることはできないと判断する。つまり、帳票仕分け処理部34は、帳票データに当該仕分け定義データは適合しないと判断する。
また、例えば、指定領域OCR書式定義フィールドに格納された情報に基づいて帳票の仕分け処理を行う場合、帳票仕分け処理部34は、指定領域OCR書式定義フィールドに格納された指定領域の座標情報を基準とした任意の所定領域に対して指定領域OCRを実行する。なお、ここでいう所定領域は、上述した内容と同様、周辺環境等による誤差を考慮したものである。
そして、指定領域OCRにより取得した情報を、指定領域OCR書式定義フィールドに格納された読み取り情報を用いて、適合する仕分け定義データを特定する。適合する仕分け定義データを特定するためのデータ、つまり、帳票の仕分けを行うためのデータは、上述したとおり、読み取り情報に含まれている。帳票仕分け処理部34は、指定領域OCRにより取得した情報(データ)を、読み取り情報に含まれる帳票の仕分けを行うためのデータと照合することにより、帳票データに適合する仕分け定義データを特定する。そして、帳票仕分け処理部34は、仕分け処理の対象の帳票データを特定した仕分け定義データに付与される帳票名の帳票と識別する。更に、当該識別結果を用いて、帳票仕分け処理部34は、例えば、仕分け処理の対象の帳票データを当該帳票名のグループにグルーピングする。なお、指定領域OCRにより情報が取得できない場合、帳票仕分け処理部34は当該仕分け定義データにより帳票データは仕分けることはできないと判断する。つまり、帳票仕分け処理部34は、帳票データに当該仕分け定義データは適合しないと判断する。
なお、当該仕分け処理を行う書式定義の順番は任意でよい。ただし、上記優先度が付与されている場合、帳票仕分け処理部34は、優先度の高い順番に書式定義を用いて仕分け処理を行う。
本実施形態では、上記の仕分け処理により、帳票仕分け処理部34は認識テストを実行する。本実施形態では、認識テストは、上記帳票仕分け定義作成部33が帳票仕分け定義データを作成する際、各書式定義に対して、帳票の仕分けに用いる優先度を付与するために行われるものである。
本実施形態では、上述のとおり、任意の設定により認識テストが実施される。認識テストが実施されると、帳票仕分け処理部34は、認識テストを行うための仕分け対象の帳票データ(テストデータ)を、例えば、入力部14から複数取得する。ここで、上述のイメージデータや帳票データと区別するために、当該認識テストによって仕分け対象となる帳票データをテストデータと呼ぶ。テストデータは、例えば、帳票定義データに基づいて作成される帳票データがプリンタ3によって印刷された帳票をスキャナ2によって電子データ化したデータである。また、テストデータは、例えば、帳票定義データに沿って、ユーザが手書き、押印、又はシール等の貼付等によって作成した帳票をスキャナ2によって電子データ化したデータである。また、テストデータは、例えば、ネットワークを介して情報処理装置1に入力される等、任意に入力されてもよい。
なお、テストデータとして入力されるデータ数は、例えば、ユーザインタフェースを介したユーザによる入力情報(または、ユーザによる設定)、または、記憶部11に格納されたプログラム等のパラメタ等により任意に設定されてよい。このように設定されたデータ数に達するまで、帳票仕分け処理部34は、テストデータを受け付ける。
そして、テストデータが設定されたデータ数に達すると、帳票仕分け処理部34は、入力されたテストデータに対して上記帳票の仕分け処理を実行する。そして、帳票仕分け処理部34は、書式定義毎に、帳票の仕分け率(認識率)を測定する。本実施形態では、帳票仕分け処理部34は、任意の数学的手法、例えば、各書式定義を用いた際に適合する仕分け定義データが特定できた回数をテストデータのデータ数で割り算することにより、帳票の認識率を測定(算出)する。なお、当該認識率は、仕分け定義データ毎に測定されてもよいし、仕分け定義データを区別せず帳票仕分け定義データ全体で測定されてもよい。
帳票仕分け処理部34は、各書式定義について上記認識率の測定を完了すると、測定した認識率を帳票仕分け定義作成部33に出力する。
§3 動作例
次に、本実施形態における帳票定義データの作成及び帳票仕分け定義データの作成について、図6及び図7を用いてその処理手順を説明する。図6は、本実施形態における帳票定義データの作成時の処理手順の一例を示す。また、図7は、本実施形態における帳票仕分け定義データの作成時の処理手順の一例を示す。なお、各ステップの具体的な処理については、「§2 情報処理装置1の構成例」に記載されているため、記載を省略した。
次に、本実施形態における帳票定義データの作成及び帳票仕分け定義データの作成について、図6及び図7を用いてその処理手順を説明する。図6は、本実施形態における帳票定義データの作成時の処理手順の一例を示す。また、図7は、本実施形態における帳票仕分け定義データの作成時の処理手順の一例を示す。なお、各ステップの具体的な処理については、「§2 情報処理装置1の構成例」に記載されているため、記載を省略した。
<帳票定義データの作成>
まず、帳票定義データの作成について、図6を用いて説明する。帳票定義データの作成は、例えば、ユーザインタフェースを介したユーザの操作情報に基づいて、記憶部11に格納されたプログラムが制御部12により実行されることによって開始される。
まず、帳票定義データの作成について、図6を用いて説明する。帳票定義データの作成は、例えば、ユーザインタフェースを介したユーザの操作情報に基づいて、記憶部11に格納されたプログラムが制御部12により実行されることによって開始される。
帳票定義データの作成が開始されると、帳票定義設計部31は、ユーザインタフェースを介して、帳票を作成するためのデータを入力するインタフェースをユーザに対して提供する。そして、帳票定義設計部31は、ユーザインタフェースを介したユーザからの入力情報に応じて、帳票を作成するためのデータを取得する(S201)。また、帳票定義設計部31は、取得した帳票を設計するためのデータを帳票定義生成部32に出力する。
帳票定義生成部32は、データが空の状態の帳票定義データを用意し、帳票定義設計部31から受け取った帳票を生成するためのデータを各項目に格納することで、帳票定義データを作成する。
次に、図6に示されるとおり、帳票定義生成部32は、帳票定義設計部31から受け取った帳票を生成するためのデータにOCR書式定義フィールドに格納するデータが含まれているか否かを判定する(S202)。そして、帳票定義設計部31から受け取った帳票を生成するためのデータにOCR書式定義フィールドに格納するデータが含まれている場合、帳票定義生成部32は、用意した帳票定義データのOCR書式定義フィールドの各項目に当該データを格納する(S203)。
次に、帳票定義生成部32は、帳票定義設計部31から受け取った帳票を生成するためのデータにバーコード書式定義フィールドに格納するデータが含まれているか否かを判定する(S204)。そして、帳票定義設計部31から受け取った帳票を生成するためのデータにバーコード書式定義フィールドに格納するデータが含まれている場合、帳票定義生成部32は、用意した帳票定義データのバーコード書式定義フィールドの各項目に当該データを格納する(S205)。
次に、帳票定義生成部32は、帳票定義設計部31から受け取った帳票を生成するためのデータに指定領域OCR書式定義フィールドに格納するデータが含まれているか否かを
判定する(S206)。そして、帳票定義設計部31から受け取った帳票を生成するためのデータに指定領域OCR書式定義フィールドに格納するデータが含まれている場合、帳票定義生成部32は、用意した帳票定義データのOCR書式定義フィールドの各項目に当該データを格納する(S207)。
判定する(S206)。そして、帳票定義設計部31から受け取った帳票を生成するためのデータに指定領域OCR書式定義フィールドに格納するデータが含まれている場合、帳票定義生成部32は、用意した帳票定義データのOCR書式定義フィールドの各項目に当該データを格納する(S207)。
以上により用意した帳票定義データへのデータ格納が完了すると、帳票定義生成部32は帳票定義データの作成を完了する。そして、帳票定義生成部32は、作成の完了した帳票定義データを帳票定義データベース21に格納し(S208)、帳票定義データの作成に関する処理が完了する。
<帳票仕分け定義データの作成>
次に、帳票仕分け定義データの作成について、図7を用いて説明する。帳票仕分け定義データの作成は、例えば、帳票定義データの作成と同様に、ユーザインタフェースを介したユーザの操作情報に基づいて、記憶部11に格納されたプログラムが制御部12により実行されることによって開始される。
次に、帳票仕分け定義データの作成について、図7を用いて説明する。帳票仕分け定義データの作成は、例えば、帳票定義データの作成と同様に、ユーザインタフェースを介したユーザの操作情報に基づいて、記憶部11に格納されたプログラムが制御部12により実行されることによって開始される。
帳票仕分け定義データの作成が開始されると、帳票仕分け定義作成部33は、帳票定義データベース21から帳票定義データを取得する(S301)。そして、帳票仕分け定義作成部33は、取得した帳票定義データのデータ形式のチェックを行う(S302)。
続いて、帳票仕分け定義作成部33は、イメージデータの入力を受け付ける(S303)。例えば、帳票仕分け定義作成部33は、スキャナ2によって電子データ化された帳票がイメージデータとして入力部14に入力されることにより、帳票仕分け定義作成部33は、イメージデータを入力部14から取得する。
帳票仕分け定義作成部33は、イメージデータを取得すると、イメージデータに対応する帳票定義データの特定を行う(S304)。詳細は上述のとおりである。
帳票定義データを特定すると、帳票仕分け定義作成部33は、空の帳票仕分け定義データと、空の帳票仕分け定義データに行データとして追加していくための空の仕分け定義データを用意する。
続いて、帳票仕分け定義作成部33は、OCR書式定義が仕分け定義データを作成する対象の帳票の仕分けに用いられるか否かを判断する(S305)。そして、OCR書式定義が帳票の仕分けに用いられると判断した場合、帳票仕分け定義作成部33は、イメージデータに対応する帳票定義データとイメージデータから生成又は取得した情報を、仕分け定義データのOCR書式定義フィールドの各項目に格納する(S306)。他方、OCR書式定義が帳票の仕分けに用いられないと判断した場合、帳票仕分け定義作成部33は、S306の処理を省略する。
続いて、帳票仕分け定義作成部33は、バーコード書式定義が仕分け定義データを作成する対象の帳票の仕分けに用いられるか否かを判断する(S307)。そして、バーコード書式定義が帳票の仕分けに用いられると判断した場合、帳票仕分け定義作成部33は、イメージデータに対応する帳票定義データとイメージデータから生成又は取得した情報を、仕分け定義データのバーコード書式定義フィールドの各項目に格納する(S308)。他方、バーコード書式定義が帳票の仕分けに用いられないと判断した場合、帳票仕分け定義作成部33は、S308の処理を省略する。
続いて、帳票仕分け定義作成部33は、指定領域OCR書式定義が仕分け定義データを作成する対象の帳票の仕分けに用いられるか否かを判断する(S309)。そして、指定
領域OCR書式定義が帳票の仕分けに用いられると判断した場合、帳票仕分け定義作成部33は、イメージデータに対応する帳票定義データとイメージデータから生成又は取得した情報を、仕分け定義データの指定領域OCR書式定義フィールドの各項目に格納する(S310)。他方、指定領域OCR書式定義が帳票の仕分けに用いられないと判断した場合、帳票仕分け定義作成部33は、S310の処理を省略する。
領域OCR書式定義が帳票の仕分けに用いられると判断した場合、帳票仕分け定義作成部33は、イメージデータに対応する帳票定義データとイメージデータから生成又は取得した情報を、仕分け定義データの指定領域OCR書式定義フィールドの各項目に格納する(S310)。他方、指定領域OCR書式定義が帳票の仕分けに用いられないと判断した場合、帳票仕分け定義作成部33は、S310の処理を省略する。
以上のS303〜S310までの処理により、帳票仕分け定義作成部33は、仕分け定義データの作成を完了する。そして、帳票仕分け定義作成部33は、作成を完了した仕分け定義データを帳票仕分け定義データの行データとして追加する。仕分け定義データを帳票仕分け定義データに追加すると、帳票仕分け定義作成部33は、仕分け定義データの作成を終了するか否かを判定する(S311)。仕分け定義データの作成を終了しないと判定した場合、帳票仕分け定義作成部33は、例えば、再度S303から処理を繰り返す。
他方、仕分け定義データの作成を終了すると判定した場合、帳票仕分け定義作成部33は、帳票仕分け定義データの作成を完了する。そして、帳票仕分け定義作成部33は、作成を完了した帳票仕分け定義データに対する認識テストが実施されるか否かを判定する(S312)。
作成を完了した帳票仕分け定義データに対する認識テストが実施されないと判定した場合、帳票仕分け定義作成部33は、作成を完了した帳票仕分け定義データを帳票仕分け定義データベース22に格納し(S314)、帳票仕分け定義データの作成に関する処理を完了する。
他方、作成を完了した帳票仕分け定義データに対する認識テストが実施されると判定した場合、帳票仕分け処理部34は、帳票仕分け定義作成部33が作成を完了した帳票仕分け定義データを用いて、帳票の仕分け処理の認識テストを実施する(S313)。そして、帳票仕分け処理部34は、認識テストの結果から各書式定義の帳票の仕分け処理における認識率を測定する。測定が完了すると、帳票仕分け処理部34は、測定した認識率を帳票仕分け定義作成部33に出力する。帳票仕分け定義作成部33は、帳票仕分け処理部34が測定した認識率を受け取ると、各書式定義に対して、帳票の仕分けに用いる優先度を決定する。そして、帳票仕分け定義作成部33は、決定した優先度を各書式定義に対して設定する。優先度の設定が完了すると、帳票仕分け定義作成部33は、優先度の設定が完了した帳票仕分け定義データを帳票仕分け定義データベース22に格納し(S314)、帳票仕分け定義データの作成に関する処理を完了する。
§4 実施の形態に係る作用及び効果
以上によれば、本実施形態に係る情報処理装置では、ユーザの入力情報に基づいて作成された帳票定義データと、スキャナ等によって取り込まれたイメージデータとがすり合わせられることによって、帳票を仕分けるための帳票仕分け定義データが作成される。したがって、周辺環境により取り込まれるイメージデータが変動した場合であっても、当該変動に適応した帳票仕分け定義データが作成可能である。これにより、本実施形態に係る情報処理装置によれば、各ユーザに対して適切な仕分け定義を作成することができる。
以上によれば、本実施形態に係る情報処理装置では、ユーザの入力情報に基づいて作成された帳票定義データと、スキャナ等によって取り込まれたイメージデータとがすり合わせられることによって、帳票を仕分けるための帳票仕分け定義データが作成される。したがって、周辺環境により取り込まれるイメージデータが変動した場合であっても、当該変動に適応した帳票仕分け定義データが作成可能である。これにより、本実施形態に係る情報処理装置によれば、各ユーザに対して適切な仕分け定義を作成することができる。
また、本実施形態に係る情報処理装置では、作成した帳票仕分け定義データに対して、帳票の仕分け処理の認識テストが実施される。そして、認識テストの結果、帳票仕分け定義データに格納された、帳票の仕分けに用いられる各書式定義に対して、帳票の認識率が測定される。更に、測定された帳票の認識率に基づいて、帳票の仕分けに用いられる各書式定義に対して、帳票の仕分けに用いる優先度が決定される。したがって、本実施形態に係る情報処理装置では、周辺環境により取り込まれるデータが変動した場合であっても、当該変動に適応した優先度が各書式定義に対して定められる。これにより、本実施形態に
係る情報処理装置では、各ユーザに対して、周辺環境の変動等に適応した、帳票の仕分けに用いる書式定義の順番を提供することができる、適切な帳票仕分け定義データを作成することができる。
係る情報処理装置では、各ユーザに対して、周辺環境の変動等に適応した、帳票の仕分けに用いる書式定義の順番を提供することができる、適切な帳票仕分け定義データを作成することができる。
また、本実施形態では、データを作成する際にユーザの入力が必要である場面は、帳票定義データを作成する場面のみである。本実施形態に係る情報処理装置では、帳票定義データを作成すれば、作成した帳票定義データに基づいて帳票仕分け定義データが作成される。これにより、本実施形態に係る情報処理装置によれば、各ユーザは、帳票用と仕分け定義用の定義作成という二重の作業をする必要がなくなる。
§5 変形例
帳票定義データの生成、帳票仕分け定義データの生成、及び帳票の仕分け処理が別々の装置によって行われてもよい。この場合、例えば、帳票定義データの作成を行う帳票定義作成部30、帳票仕分け定義データの作成を行う帳票仕分け定義作成部33、及び帳票の仕分け処理を行う帳票仕分け部34は、別々の装置における制御部において実現される。また、例えば、帳票定義データベース21及び帳票仕分け定義データベース22は、ネットワークを介して当該別々の装置において共有される。そして、例えば、各処理におけるデータの送受信はネットワークを介して送受信されることにより本実施形態における情報処理装置1の各処理が実現される。
帳票定義データの生成、帳票仕分け定義データの生成、及び帳票の仕分け処理が別々の装置によって行われてもよい。この場合、例えば、帳票定義データの作成を行う帳票定義作成部30、帳票仕分け定義データの作成を行う帳票仕分け定義作成部33、及び帳票の仕分け処理を行う帳票仕分け部34は、別々の装置における制御部において実現される。また、例えば、帳票定義データベース21及び帳票仕分け定義データベース22は、ネットワークを介して当該別々の装置において共有される。そして、例えば、各処理におけるデータの送受信はネットワークを介して送受信されることにより本実施形態における情報処理装置1の各処理が実現される。
§6 補足
以上、本発明の実施の形態を詳細に説明してきたが、前述までの説明はあらゆる点において本発明の例示に過ぎず、その範囲を限定しようとするものではない。本発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。本発明は、特許請求の範囲によってのみその範囲が解釈される。また、当業者は、上記本実施形態の記載から、特許請求の範囲の記載および技術常識に基づいて等価な範囲を実施することができる。また、本明細書において使用される用語は、特に言及しない限り、当該分野で通常用いられる意味で用いられる。したがって、他に定義されない限り、本明細書中で使用される全ての専門用語および技術用語は、本発明の属する分野の当業者によって一般的に理解される意味と同じ意味を有する。両者が矛盾する場合、本明細書において使用される用語は、本明細書(定義を含めて)に記載された意味において理解される。
以上、本発明の実施の形態を詳細に説明してきたが、前述までの説明はあらゆる点において本発明の例示に過ぎず、その範囲を限定しようとするものではない。本発明の範囲を逸脱することなく種々の改良や変形を行うことができることは言うまでもない。本発明は、特許請求の範囲によってのみその範囲が解釈される。また、当業者は、上記本実施形態の記載から、特許請求の範囲の記載および技術常識に基づいて等価な範囲を実施することができる。また、本明細書において使用される用語は、特に言及しない限り、当該分野で通常用いられる意味で用いられる。したがって、他に定義されない限り、本明細書中で使用される全ての専門用語および技術用語は、本発明の属する分野の当業者によって一般的に理解される意味と同じ意味を有する。両者が矛盾する場合、本明細書において使用される用語は、本明細書(定義を含めて)に記載された意味において理解される。
1 情報処理装置
2 スキャナ
3 プリンタ
11 記憶部
12 制御部
13 バス
14 入力部
15 出力部
21 帳票定義データベース
22 帳票仕分け定義データベース
30 帳票定義作成部
31 帳票定義設計部
32 帳票定義生成部
33 帳票仕分け定義作成部
34 帳票仕分け処理部
2 スキャナ
3 プリンタ
11 記憶部
12 制御部
13 バス
14 入力部
15 出力部
21 帳票定義データベース
22 帳票仕分け定義データベース
30 帳票定義作成部
31 帳票定義設計部
32 帳票定義生成部
33 帳票仕分け定義作成部
34 帳票仕分け処理部
Claims (8)
- 帳票の書式定義を含む帳票定義データを格納する記憶部と、
帳票のイメージデータを取り込む入力部と、
前記入力部により取り込まれたイメージデータと、当該イメージデータに対応する帳票定義データを比較し、その比較結果を帳票定義データに適用することにより、帳票をその構成要素により識別可能とする識別用の情報を作成する制御部と、
を備えることを特徴とする情報処理装置。 - 前記記憶部は、複数の帳票定義データを格納し、
前記制御部は、前記イメージデータの構成要素を認識し、認識した前記イメージデータの構成要素に適合する書式定義を含む帳票定義データを前記記憶部の中から照合することにより、前記イメージデータに対応する帳票定義データを取得することを特徴とする請求項1に記載の情報処理装置。 - 前記帳票定義データに含まれる帳票の書式定義は複数の書式定義を含み、
前記制御部は、帳票の書式定義に含まれる複数の書式定義に従って作成された帳票をその構成要素により識別可能とする識別用の情報を、書式定義毎に作成することを特徴とする請求項1または2に記載の情報処理装置。 - 前記入力部は、更に、複数のテストデータを取り込み、
前記制御部は、前記複数の書式定義に従って作成した識別用の情報を用いて前記複数のテストデータの識別を行い、識別の可否の結果に基づいて各書式定義によるテストデータの識別率を求め、求めた識別率に基づく帳票を識別する際に用いる優先度を各書式定義に定めた識別用の情報を作成することを特徴とする請求項3に記載の情報処理装置。 - 前記複数の書式定義は、帳票の外観に関する書式を定めた書式定義、帳票が有する光学式マーク認識用のマークの属性値を定めた書式定義、及び特定の領域に実行される文字認識に関する属性値を定めた書式定義のうちの少なくとも1つを含むことを特徴とする請求項3または4に記載の情報処理装置。
- 前記帳票定義データに含まれる帳票の書式定義は、帳票の外観に関する書式を定めた書式定義、帳票が有する光学式マーク認識用のマークの属性値を定めた書式定義、及び特定の領域に実行される文字認識に関する属性値を定めた書式定義の少なくとも一つの書式定義を含み、
前記制御部は、帳票の書式定義に含まれる書式定義に従って作成された帳票をその構成要素により識別可能とする識別用の情報を作成することを特徴とする請求項1または2に記載の情報処理装置。 - コンピュータが、
帳票のイメージデータを取り込むステップと、
取り込んだイメージデータと、当該イメージデータに対応する帳票定義データを比較し、その比較結果を帳票定義データに適用することにより、帳票をその構成要素により識別可能とする識別用の情報を作成するステップと、
を実行することを特徴とする情報処理方法。 - コンピュータに、
帳票のイメージデータを取り込むステップと、
取り込んだイメージデータと、当該イメージデータに対応する帳票定義データを比較し、その比較結果を帳票定義データに適用することにより、帳票をその構成要素により識別
可能とする識別用の情報を作成するステップと、
を実行させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010229714A JP2012083951A (ja) | 2010-10-12 | 2010-10-12 | 情報処理装置、情報処理方法及びプログラム |
US13/223,732 US20120086963A1 (en) | 2010-10-12 | 2011-09-01 | Information processing device to generate information for distinguishing forms |
CN2011103092834A CN102591596A (zh) | 2010-10-12 | 2011-10-10 | 信息处理装置以及信息处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010229714A JP2012083951A (ja) | 2010-10-12 | 2010-10-12 | 情報処理装置、情報処理方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012083951A true JP2012083951A (ja) | 2012-04-26 |
Family
ID=45924907
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010229714A Pending JP2012083951A (ja) | 2010-10-12 | 2010-10-12 | 情報処理装置、情報処理方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20120086963A1 (ja) |
JP (1) | JP2012083951A (ja) |
CN (1) | CN102591596A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015211428A (ja) * | 2014-04-30 | 2015-11-24 | キヤノン株式会社 | 管理装置、コンピュータプログラム、管理方法 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10431336B1 (en) | 2010-10-01 | 2019-10-01 | Cerner Innovation, Inc. | Computerized systems and methods for facilitating clinical decision making |
US11398310B1 (en) | 2010-10-01 | 2022-07-26 | Cerner Innovation, Inc. | Clinical decision support for sepsis |
US10734115B1 (en) | 2012-08-09 | 2020-08-04 | Cerner Innovation, Inc | Clinical decision support for sepsis |
US11348667B2 (en) | 2010-10-08 | 2022-05-31 | Cerner Innovation, Inc. | Multi-site clinical decision support |
US10628553B1 (en) | 2010-12-30 | 2020-04-21 | Cerner Innovation, Inc. | Health information transformation system |
US8856156B1 (en) | 2011-10-07 | 2014-10-07 | Cerner Innovation, Inc. | Ontology mapper |
US10249385B1 (en) | 2012-05-01 | 2019-04-02 | Cerner Innovation, Inc. | System and method for record linkage |
US9454588B2 (en) * | 2012-08-14 | 2016-09-27 | International Business Machines Corporation | Custom object-in-memory format in data grid network appliance |
US11894117B1 (en) | 2013-02-07 | 2024-02-06 | Cerner Innovation, Inc. | Discovering context-specific complexity and utilization sequences |
US10946311B1 (en) | 2013-02-07 | 2021-03-16 | Cerner Innovation, Inc. | Discovering context-specific serial health trajectories |
US10769241B1 (en) | 2013-02-07 | 2020-09-08 | Cerner Innovation, Inc. | Discovering context-specific complexity and utilization sequences |
US10483003B1 (en) | 2013-08-12 | 2019-11-19 | Cerner Innovation, Inc. | Dynamically determining risk of clinical condition |
US10446273B1 (en) | 2013-08-12 | 2019-10-15 | Cerner Innovation, Inc. | Decision support with clinical nomenclatures |
US20150193583A1 (en) * | 2014-01-06 | 2015-07-09 | Cerner Innovation, Inc. | Decision Support From Disparate Clinical Sources |
CN108121982B (zh) * | 2016-11-30 | 2020-02-07 | 杭州海康机器人技术有限公司 | 面单图像的获取方法及装置 |
US11730420B2 (en) | 2019-12-17 | 2023-08-22 | Cerner Innovation, Inc. | Maternal-fetal sepsis indicator |
US11557136B1 (en) * | 2022-02-23 | 2023-01-17 | Scandit Ag | Identity document verification based on barcode structure |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5434933A (en) * | 1993-10-09 | 1995-07-18 | International Business Machines Corporation | Image processing |
JP3860389B2 (ja) * | 2000-04-21 | 2006-12-20 | 日立オムロンターミナルソリューションズ株式会社 | 帳票イメージ処理装置 |
JP4183527B2 (ja) * | 2003-02-24 | 2008-11-19 | 日立オムロンターミナルソリューションズ株式会社 | 帳票定義データ作成方法および帳票処理装置 |
-
2010
- 2010-10-12 JP JP2010229714A patent/JP2012083951A/ja active Pending
-
2011
- 2011-09-01 US US13/223,732 patent/US20120086963A1/en not_active Abandoned
- 2011-10-10 CN CN2011103092834A patent/CN102591596A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015211428A (ja) * | 2014-04-30 | 2015-11-24 | キヤノン株式会社 | 管理装置、コンピュータプログラム、管理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102591596A (zh) | 2012-07-18 |
US20120086963A1 (en) | 2012-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2012083951A (ja) | 情報処理装置、情報処理方法及びプログラム | |
US10049096B2 (en) | System and method of template creation for a data extraction tool | |
JP6874729B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
US20190294912A1 (en) | Image processing device, image processing method, and image processing program | |
US9329704B2 (en) | Information input apparatus, information input system, and information input method | |
US9286526B1 (en) | Cohort-based learning from user edits | |
JP2005242579A (ja) | 文書処理装置、文書処理方法、および文書処理プログラム | |
JP6795195B2 (ja) | 文字種推定システム、文字種推定方法、および文字種推定プログラム | |
JP2021043775A (ja) | 情報処理装置及びプログラム | |
JP2008021068A (ja) | 帳票認識装置及び帳票認識プログラム | |
CN114005126A (zh) | 表格重构方法、装置、计算机设备及可读存储介质 | |
KR102282025B1 (ko) | 컴퓨터를 이용한 문서 분류 및 문자 추출 방법 | |
CN112613367A (zh) | 票据信息文本框获取方法、系统、设备及存储介质 | |
US20210065212A1 (en) | Date generation apparatus, control method, and program | |
JP5712415B2 (ja) | 帳票処理システム及び帳票処理方法 | |
JP3732254B2 (ja) | フォーマット情報生成方法及びフォーマット情報生成装置 | |
JP5724286B2 (ja) | 帳票作成装置、帳票作成方法、プログラム | |
CN111090989A (zh) | 一种基于文字识别的提示方法及电子设备 | |
JP2014044555A (ja) | 画像処理装置、画像処理システム及びプログラム | |
JP2019204363A (ja) | 帳票処理装置及び帳票処理方法 | |
JP2010061449A (ja) | 原画像探索装置及び原画像探索プログラム | |
JP5906608B2 (ja) | 情報処理装置及びプログラム | |
JP2013182459A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP4280939B2 (ja) | 位置面システム画像認識コンピューターソフトウェア | |
JP5669044B2 (ja) | 文書検定システム及び文書検定方法 |