JP2009238217A - 情報処理システム、情報処理装置、情報処理方法およびプログラム - Google Patents
情報処理システム、情報処理装置、情報処理方法およびプログラム Download PDFInfo
- Publication number
- JP2009238217A JP2009238217A JP2009053865A JP2009053865A JP2009238217A JP 2009238217 A JP2009238217 A JP 2009238217A JP 2009053865 A JP2009053865 A JP 2009053865A JP 2009053865 A JP2009053865 A JP 2009053865A JP 2009238217 A JP2009238217 A JP 2009238217A
- Authority
- JP
- Japan
- Prior art keywords
- information
- label name
- entry area
- area
- format
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/12—Detection or correction of errors, e.g. by rescanning the pattern
- G06V30/127—Detection or correction of errors, e.g. by rescanning the pattern with the intervention of an operator
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Document Processing Apparatus (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
【解決手段】帳票からファイル情報または画像情報を入力し、入力された帳票の記入領域を抽出して取得し、取得した記入領域内の文字または記号情報から帳票に記入する情報の内容を暗示するラベル名を取得し、ラベル名とそれに対応する記入領域の書式設定の情報を有する書式情報テーブルを保持し、ラベル名から書式情報テーブルを探索して、ラベル名に対応する帳票の記入領域の書式設定を取得し、取得した記入領域とラベル名と書式設定とを出力する。
【選択図】図1
Description
この書式情報は、その記入領域にどのような種類(入力される情報として日本語による情報である場合には、「数字、ひらがな、漢字等」となる)の値が入力されるべきかなどの情報や、その値の制限の情報、たとえば数字が入力されるなら30を超えてはいけない等の制限の情報等で構成される。このように書式情報は記載する文字種と、その種類が規定されるとその範囲も定まるような一体となった情報であり、たとえば「歳」という文字が、ある記入領域に関連して存在するならば、記入されるべき情報の種類としては「数字」が選択され、また数字ではあってもマイナスは選択されず、またこの数字はヒトの年齢であることを意味しているので、150を越えない範囲であろうと推測できるものである。
より具体的には、予め作成しておいた原帳票を光学的に走査し、フィールドイメージと文字イメージからなる帳票イメージを入力する入力手段と、前記イメージ入力手段によって入力された帳票イメージからフィールドと文字を認識してフィールド領域と文字データを出力する認識手段と、前記文字認識手段によって出力されたフィールド領域と文字データを対比させた帳票イメージを表示する表示手段と、前記表示手段により表示された帳票イメージからフィールド領域を指定する指定手段と、前記フィールド指定手段により指定されたフィールドに対応する項目定義データに基づいて、該フィールドの属性情報を作成する作成手段と、を具備したことを特徴とする帳票フィールド属性作成システムなどの発明が開示されている(特許請求の範囲)。
(1)帳票を入力し、前記帳票内の記入領域を抽出し、出力する情報処理システムであって、前記帳票からファイル情報または画像情報により前記入力を行う入力手段と、入力された前記帳票の記入領域を抽出して取得する記入領域ラベル取得手段と、記入領域のラベル名を取得する領域として前記記入領域を相対座標で示したラベル名取得領域テーブルを有し、前記記入領域ラベル取得手段が帳票内の文字情報から前記ラベル名を取得する際に、前記ラベル名取得領域テーブルから、前記ラベル名を取得する領域の情報を取得して記入領域のラベル名を取得するラベル名取得手段と、前記取得したラベル名とそれに対応する記入領域の書式設定の情報を有する書式情報テーブルを保持する書式情報テーブル保持手段と、前記取得したラベル名から前記書式情報テーブルを探索して、前記ラベル名に対応する帳票の記入領域の書式設定を取得する記入領域書式取得手段と、取得した前記記入領域と前記ラベル名と前記書式設定とを前記出力することを行う記入領域設定出力手段とを有することを特徴とする。
(2)帳票を入力し、前記帳票内の記入領域を抽出し、出力する情報処理システムであって、前記帳票からファイル情報または画像情報により前記入力を行う入力手段と、前記入力部から受け取った前記帳票内の記入領域を抽出して取得する記入領域ラベル取得手段と、抽出した前記記入領域内の文字または記号情報から前記帳票に記入する情報の内容を暗示するラベル名を取得するラベル名取得手段と、前記ラベル名に対応する記入領域の書式設定の情報を有する書式情報テーブルを保持する書式情報テーブル保持手段と、取得した前記ラベル名から前記書式情報テーブルを探索し、前記ラベル名に対応した記入領域の書式設定を取得する記入領域書式取得手段と、取得した前記記入領域と前記ラベル名と前記書式設定とを確認訂正入力を可能に表示する記入領域設定表示手段と、前記記入領域設定表示部からの前記確認訂正の入力情報に基づき前記書式情報テーブルの更新を行う書式情報テーブル更新手段と、確認訂正された前記記入領域と前記ラベル名と前記書式設定とを前記出力することを行う記入領域設定出力手段とを有することを特徴とする。
(3)前記(1)または(2)に記載の情報処理システムにおいて、前記ラベル名取得領域テーブルは前記ラベル名の記入領域に対する位置関係毎にラベル名取得領域を有し、前記記入領域ラベル取得手段が前記位置関係毎のラベル名取得領域のそれぞれに対して記入領域のラベル名を取得し、記入領域書式取得手段が取得したこのラベル名と位置情報から書式情報テーブルを探索し、対応する記入領域の設定を取得することを特徴とする。
(4)前記(3)に記載の情報処理システムにおいて、前記ラベル名取得領域テーブルはラベル名の言語毎にラベル名取得領域を有し、前記記入領域ラベル取得手段が前記ラベル名取得領域の各々に対し前記記入領域のラベル名を取得することを特徴とする。
(5)前記(4)に記載の情報処理システムにおいて、前記記入領域ラベル取得手段が記入領域の周囲の文字列に対応するラベル名取得領域を取得して前記記入領域のラベル名を取得することを特徴とする。
(6)前記(3)から(5)のいずれかに記載の情報処理システムにおいて、前記ラベル名取得領域テーブルは縦書き、横書きの両方のラベル名取得領域を有し、前記記入領域ラベル取得部が記入領域の記載が縦書きか横書きかを判断して対応するラベル名取得領域から前記記入領域のラベル名を取得することを特徴とする。
(7)前記(2)から(6)のいずれかに記載の情報処理システムにおいて、前記書式情報テーブル更新手段がユーザから入力された訂正情報が前記書式情報テーブル内に存在しない場合に前記書式情報テーブルに前記訂正情報を追加して更新することを特徴とする。
(8)前記(2)から(7)のいずれかに記載の情報処理システムにおいて、前記ラベル名取得手段が複数のラベル名候補を発見した場合、ラベル名が書式情報テーブルに掲載されているかを探索し,書式情報テーブルに掲載されているラベル名候補を選択することを特徴とする。
(9)前記(2)から(7)のいずれかに記載の情報処理システムにおいて、前記書式情報テーブル更新手段がユーザからの訂正情報に教師あり学習を用いて前記書式情報テーブルの更新を行うことを特徴とする。
(10)前記(1)から(9)のいずれか1項の情報処理システムを一体の装置として構成した情報処理装置。
(11)帳票に記載する記入領域の周囲を分割し各分割した領域に含まれる文字情報の記載に基づいて縦書きか横書きかの記入方向を判別し、前記記入領域の記載内容を暗示する情報の検索のための優先順位を前記記入領域の周囲の分割した領域毎に決めて前記記入領域に記載する情報を暗示する関連情報を検索することを特徴とする情報処理方法。
(12)帳票を入力し、前記帳票内の記入領域を抽出し、出力する情報処理方法であって、前記帳票から画像情報を入力し、読み取った前記帳票の記入領域を抽出し、抽出した前記記入領域内の文字または記号情報から前記帳票に記入する情報の内容を暗示するラベル名を取得し、取得した前記ラベル名から書式情報テーブルを探索して前記ラベル名に対応する帳票の記入領域の書式設定の情報を取得し、取得した前記記入領域と前記ラベル名と前記書式設定とを前記出力することを行うことを特徴とする。
(13)帳票からの情報を入力し、前記帳票内の記入領域を抽出し、出力する情報処理方法であって、帳票からの情報を入力し、前記入力部から受け取った前記帳票内の記入領域を抽出し、抽出した前記記入領域内の文字または記号情報から前記帳票に記入する情報の内容を暗示するラベル名を取得し、取得した前記ラベル名から書式情報テーブルを探索して前記ラベル名に対応した記入領域の書式設定の情報を取得し、取得した前記記入領域と前記ラベル名と前記書式設定とを確認または訂正の入力を表示し、前記確認または訂正の入力情報に基づき前記書式情報テーブルの更新を行い、前記確認または訂正された前記記入領域と前記ラベル名と前記書式設定とを前記出力することを行うことを特徴とする。
(14)前記(13)に記載の情報処理方法において、前記帳票内の文字情報からラベル名を取得する際に、記入領域のラベル名を取得する領域として前記記入領域を相対座標で示したラベル名取得領域テーブルから前記ラベル名を取得可能な領域の情報を取得して前記記入領域のラベルを取得することを特徴とする。
(15)前記(14)に記載の情報処理方法において、前記ラベル名取得領域テーブルはラベル名の記入領域に対する位置関係毎にラベル名取得領域を有する前記ラベル名取得領域のそれぞれに対して記入領域のラベル名を取得し、取得した各ラベル名と位置情報から書式情報テーブルを探索して対応する記入領域の設定を取得することを特徴とする。
(16)前記(14)または(15)に記載の情報処理方法において、前記ラベル名取得領域テーブルはラベル名の言語ごとにラベル名取得領域を有する前記ラベル名取得領域それぞれに対して記入領域のラベル名を取得することを特徴とする。
(17)前記(16)に記載の情報処理方法において、前記記入領域周囲の文字列の言語に対応するラベル名取得領域から記入領域のラベル名を取得することを特徴とする。
(18)前記(14)から(17)のいずれかに記載の情報処理方法において、前記ラベル名取得領域テーブルが縦書きまたは横書き毎にラベル名取得領域を有する前記記入領域周囲の縦書きか横書きかを判断して対応するラベル名取得領域により前記記入領域のラベル名を取得することを特徴とする。
(19)前記(12)から(18)のいずれかに記載の情報処理方法において、前記確認または訂正の入力情報に該当する訂正情報が書式情報テーブルから欠落している前記書式情報テーブルに前記訂正情報を追加することを特徴とする。
(20)前記(12)から(19)のいずれかに記載の情報処理方法において、入力された前記訂正情報を教師あり学習を用いて前記書式情報テーブルの更新を行うことを特徴とする。
(21)前記(11)から(20)のいずれかの情報処理方法を情報処理装置または情報処理システムに実行させるための読取可能なプログラム。
まず本発明の概略的な全体概念を以下に記載する。
以下のようなベクタの帳票ファイルやラスタの帳票画像を入力し、この画像をスキャナなどで読取ったり、羅線抽出処理などの処理を行ったり、あるいはファイル(電子ファイル)の中に含まれているデータを入力手段によりあるいは入力手段を介して入力し、帳票内の記入領域の位置情報とその記入領域に関するメタデータである書式情報を出力するシステムの発明を完成した。ここで、書式情報は、その帳票の記入領域のラベル名、入力文字種および記入領域への入力値の制限などの情報を含んで構成される。なお本明細書中、文字と言う文言には、日本語の場合には、漢字(漢数字を含む)、ひらがな、かたかな、数字、記号等の集合体を含むものとして説明する。またその他の言語の場合にはアルファベット体などで表示する言語以外の数字、記号などでもコンピュータで処理あるいは読取可能であれば、その記号等も含むものとして説明する。
文字情報を抽出する。この抽出した記入領域の位置情報と文字情報の対応付けを行って、
記入領域のラベル名を取得する。このラベル名は、帳票作成を行うユーザがこの帳票に記
入する際のヒントとなる文字情報のことである。例えば、
「氏名○○○○○○○○○」
のような情報が帳票内(帳票の記入領域内)に含まれている場合、上記例で示す下線部分が氏名を書き入れることとユーザは理解し、認識する。これは上記例において、ユーザは「氏名」という文字列が存在し、その同じ領域内に下線で示される記入領域を含んでいるという相関関係を経験的に容易に見出せるからである。そして「氏名」という文字列の存在の後に、このように下線部が存在しているので、この下線部分に何を書き込むかが意図(指示)されているとユーザが理解(あるいは把握)する。これによって、この「氏名」が記入領域のラベル名である(あるいはラベル名として定義される)ことになる。
たとえば、「歳」というようなラベル名に対応付けされている記入領域がある場合に、ラベル名「歳」でシステムが持つテーブルを検索し、その記入領域に入力すべき文字種が「歳」から、入力されるべき情報が「数字」であることや、その値が「20以上」(二十歳以上)であるなどの情報であるのでこれらの情報を取得し、これを記入領域に対応付けることになる。
以下にベクタの帳票ファイルを入力して取得することを例に挙げて説明する(図5のa1参照)。ベクタの帳票ファイルは矩形や罫線の情報および文字情報をベクタとして持っている。ベクタの帳票ファイルの代表的なフォーマットとして、PDF(Portable Document Format)が挙げられる。また、今回の例では利用しないがラスタで表される帳票画像からも罫線や矩形の抽出とOCRによる文字の取得をして、ベクタの帳票ファイルと類似の情報が取得でき、略同様に処理することもできる。
図2は本実施形態1におけるシステム構成を示す図である。
本発明の情報処理システムは、図2に示すように、以下のブロックから構成されている。
帳票入力部4は、ユーザにより帳票ファイルや帳票画像を入力するためのインターフェイスである。たとえば画像読取装置(スキャナ)等および入力された画像からデジタルデータに変換するアプリケーションソフトにより構成される。本実施形態1では、前記したように帳票データとしてインターネット等を介して帳票ファイルをダウンロード等により帳票入力部4が入手する(図5のa1)。
記入領域出力部5は、ユーザにより入力されたベクタ帳票ファイルを処理した結果である記入領域定義一覧を出力するためのインターフェイス(GUIを含む)である。
書式情報テーブル部2は、制御部21と書式情報テーブルを保存している書式情報テーブル保持部22とからなる。
書式情報テーブル部2内の制御部21は、書式情報テーブル保持部に書式情報テーブルの少なくとも1部に情報を書き込んだり、その書式情報テーブルに訂正情報を加えたり、書式情報テーブルを読み出したり、その一部を抽出したりする部である。
書式情報テーブル部2内の書式情報テーブル保持部22は、入力される書式情報を書式情報テーブルとして保存しておく部である。
記入領域抽出部(記入領域抽出アプリケーション部)1内の通信部11は、書式情報テーブル部2内の書式情報テーブル保持部22から、書式情報テーブルを取得したり、他の部に対して情報を送ったり受け取る部である。
記入領域抽出部(記入領域抽出アプリケーション部)1内の文字情報・矩形情報・罫線情報取得部12は、通信部11からベクタ帳票ファイルと書式情報テーブルを受け取り、受け取ったベクタ帳票ファイルからベクタで表現されている文字情報、矩形情報、罫線情報を取得する(図5のa5)。この取得した文字情報、矩形情報、罫線情報と受け取った書式情報テーブルを記入領域取得部に送る部である(図5のa6)。
記入領域抽出部1内の記入領域取得部13は、文字情報・矩形情報・罫線情報部12から、ベクタで表現されている文字情報、矩形情報、罫線情報と、書式情報テーブルを受け取り(図5のa6)、記入領域の座標を抽出する部である。また抽出した記入領域の座標と、受け取った書式情報テーブルと、文字情報とを、ラベル名取得部15に送る部である(図5のa7)。
記入領域抽出部1内のラベル名取得部15は、記入領域取得部13から記入領域の座標とベクタで表現されている文字情報と書式情報テーブルを受け取る部である(図5のa7)。また、ラベル取得可能領域保持部16から、ラベル取得領域テーブルを受け取る部である。
また、例えば前方の領域に対して記入領域からの距離が異なる複数のラベルが取得可能領域が定義されているような場合、記入領域からの距離が近い順にラベルの探索を行なうことによって、精度が高くまたパフォーマンスのよいラベル探索が行うことができる。
記入領域抽出部1内のラベル取得可能領域保持部16は、ラベル取得可能領域テーブル
を保持(保存)している部である。
記入領域抽出部1内の書式情報設定部14は、ラベル名取得部15から、記入領域の座標と、取得した記入領域のラベル名と、記入領域と、ラベル名の相対位置関係と、書式情報テーブルとを、受け取る部である(図5のa8)。また受け取った書式情報テーブルを記入領域のラベル名と相対位置関係とによって検索を行い、記入領域の入力文字種や入力される値の制限を取得する部である。また書式情報設定部14は、記入領域の座標と、記入領域のラベル名と、取得した入力文字種と、入力値制限とを、記入領域定義一覧として通信部に送る部である(図5のa9)。
ラベルが書式情報テーブル内に存在しない場合、ラベルが取得可能な領域が定義されていてまだラベルの探索が行なわれていない領域を再探索することによってラベルの再取得を行なうという方法を採用することもできる。また、予め一つの記入領域に対し複数のラベルを抽出しておき、書式情報テーブル内にラベルが存在するものだけをラベルとして採用することもできる。
また、出力される記入領域定義一覧はたとえば以下のようなデータ構造になっている。
システムの全体像
本実施形態2は、前記した実施形態1と異なる部分を中心にして、説明する。本実施形態2においても前記した実施形態1と同様に、ベクタの帳票ファイルを入力して取得する。
すなわち、S5では、S4において取得された記入領域の書式情報をユーザによって確認され、好ましくはユーザにより訂正情報が入力される動作を含む。このとき、ユーザによって入力された訂正内容によって、書式情報テーブルを学習(好ましくは強化学習)により更新する構成を含ませることができる。このようにして本実施形態2では、各記入領域に対してそのラベル名と入力文字種、入力値の制限などを含む書式情報を取得することができ、本発明の情報処理システムはこの情報を出力(好ましくはGUIを介してユーザに画像情報)として返すようにしている。
[記入領域確認設定部(記入領域確認設定アプリケーション部)3]
本発明の情報処理システムなどにおける第2の実施形態では、実施形態1に比較して、さらに、記入領域確認設定部3を有している。この記入領域確認設定部3は、以下に説明する通信部31と記入領域設定表示部32とを有して構成される。
記入領域確認設定部3内の通信部32は、記入領域抽出部1から記入領域定義一覧を受け取り(図8のa11)、記入設定表示部31に送る(図8のa12)。
記入領域確認設定部3内の領域設定表示部31は、通信部32を介して記入領域抽出部1からの領域設定定義一覧を受け取り、ユーザに一覧を表示する(図8のa11〜a12)。
表示された一覧を見たユーザは、領域設定定義一覧の確認訂正を行う。
ベクタの帳票ファイルが入力されてから記入領域設定確認アプリケーションに記入領域定義一覧を出力するまでのブロック間の情報のやり取りは実施形態1のブロック間のフローを示す図5のシーケンス図と同様であるので省略する。
そしてこの領域設定を訂正した情報は領域設定表示部32を介して入力されると、通信部31に訂正情報が送られる(図8のa13)。この訂正情報が記入領域接待確認情報部3から書式情報テーブル部2内に制御部22を介して入力されると(図8のa14)、制御部22は書式情報テーブル保持部21に送り(図8のa15)、書式情報テーブル保持部21に保持されている、ある書式情報テーブルを選択し、書式情報テーブルの更新を行う(図8のa15)。
2 書式情報テーブル部
3 記入領域設定確認訂正部
4 帳票入力部
5 記入領域出力部
6 バスまたは通信網
11 通信部
12 情報取得部
13 記入領域取得部
14 書式情報設定部
15 ラベル名取得部
16 ラベル取得可能領域保持部
21 制御部
22 書式情報テーブル保持部
31 通信部
32 領域設定表示部
Claims (21)
- 帳票を入力し、前記帳票内の記入領域を抽出し、出力する情報処理システムであって、
前記帳票からファイル情報または画像情報により前記入力を行う入力手段と、
入力された前記帳票の記入領域を抽出して取得する記入領域ラベル取得手段と、
記入領域のラベル名を取得する領域として前記記入領域を相対座標で示したラベル名取得領域テーブルを有し、
前記記入領域ラベル取得手段が帳票内の文字情報から前記ラベル名を取得する際に、前記ラベル名取得領域テーブルから、前記ラベル名を取得する領域の情報を取得して記入領域のラベル名を取得するラベル名取得手段と、
前記取得したラベル名とそれに対応する記入領域の書式設定の情報を有する書式情報テーブルを保持する書式情報テーブル保持手段と、
前記取得したラベル名から前記書式情報テーブルを探索して、前記ラベル名に対応する帳票の記入領域の書式設定を取得する記入領域書式取得手段と、
取得した前記記入領域と前記ラベル名と前記書式設定とを前記出力することを行う記入領域設定出力手段と、
を有することを特徴とする情報処理システム。 - 帳票を入力し、前記帳票内の記入領域を抽出し、出力する情報処理システムであって、
前記帳票からファイル情報または画像情報により前記入力を行う入力手段と、
前記入力部から受け取った前記帳票内の記入領域を抽出して取得する記入領域ラベル取得手段と、
抽出した前記記入領域内の文字または記号情報から前記帳票に記入する情報の内容を暗示するラベル名を取得するラベル名取得手段と、
前記ラベル名に対応する記入領域の書式設定の情報を有する書式情報テーブルを保持する書式情報テーブル保持手段と、
取得した前記ラベル名から前記書式情報テーブルを探索し、前記ラベル名に対応した記入領域の書式設定を取得する記入領域書式取得手段と、
取得した前記記入領域と前記ラベル名と前記書式設定とを確認訂正入力を可能に表示する記入領域設定表示手段と、
前記記入領域設定表示部からの前記確認訂正の入力情報に基づき前記書式情報テーブルの更新を行う書式情報テーブル更新手段と、
確認訂正された前記記入領域と前記ラベル名と前記書式設定とを前記出力することを行う記入領域設定出力手段と、
を有することを特徴とする情報処理システム。 - 前記ラベル名取得領域テーブルは前記ラベル名の記入領域に対する位置関係毎にラベル名取得領域を有し、
前記記入領域ラベル取得手段が前記位置関係毎のラベル名取得領域のそれぞれに対して記入領域のラベル名を取得し、
記入領域書式取得手段が取得したこのラベル名と位置情報から書式情報テーブルを探索し、対応する記入領域の設定を取得することを特徴とする請求項1または2に記載の情報処理システム。 - 前記ラベル名取得領域テーブルはラベル名の言語毎にラベル名取得領域を有し、
前記記入領域ラベル取得手段が前記ラベル名取得領域の各々に対し前記記入領域のラベル名を取得することを特徴とする請求項3に記載の情報処理システム。 - 前記記入領域ラベル取得手段が記入領域の周囲の文字列に対応するラベル名取得領域を取得して前記記入領域のラベル名を取得することを特徴とする請求項4に記載の情報処理システム。
- 前記ラベル名取得領域テーブルは縦書き、横書きの両方のラベル名取得領域を有し、
前記記入領域ラベル取得部が記入領域の記載が縦書きか横書きかを判断して対応するラベル名取得領域から前記記入領域のラベル名を取得することを特徴とする請求項3から請求項5のいずれかに記載の情報処理システム。 - 前記書式情報テーブル更新手段がユーザから入力された訂正情報が前記書式情報テーブル内に存在しない場合に前記書式情報テーブルに前記訂正情報を追加して更新することを特徴とする請求項2から請求項6のいずれかに記載の情報処理システム。
- 前記ラベル名取得手段が複数のラベル名候補を発見した場合,ラベル名が書式情報テーブルに掲載されているかを探索し,書式情報テーブルに掲載されているラベル名候補を選択することを特徴とする請求項3から請求項7のいずれかに記載の情報処理システム。
- 前記書式情報テーブル更新手段がユーザからの訂正情報に教師あり学習を用いて前記書式情報テーブルの更新を行うことを特徴とする請求項2から請求項8のいずれかに記載の情報処理システム。
- 請求項1から請求項9のいずれか1項の情報処理システムを一体の装置として構成した情報処理装置。
- 帳票に記載する記入領域の周囲を分割し各分割した領域に含まれる文字情報の記載に基づいて縦書きか横書きかの記入方向を判別し、前記記入領域の記載内容を暗示する情報の検索のための優先順位を前記記入領域の周囲の分割した領域毎に決めて前記記入領域に記載する情報を暗示する関連情報を検索することを特徴とする情報処理方法。
- 帳票を入力し、前記帳票内の記入領域を抽出し、出力する情報処理方法であって、
前記帳票から画像情報を入力し、
読み取った前記帳票の記入領域を抽出し、
抽出した前記記入領域内の文字または記号情報から前記帳票に記入する情報の内容を暗示するラベル名を取得し、
取得した前記ラベル名から書式情報テーブルを探索して前記ラベル名に対応する帳票の記入領域の書式設定の情報を取得し、
取得した前記記入領域と前記ラベル名と前記書式設定とを前記出力することを行うことを特徴とする情報処理方法。 - 帳票からの情報を入力し、前記帳票内の記入領域を抽出し、出力する情報処理方法であって、
帳票からの情報を入力し、
前記入力部から受け取った前記帳票内の記入領域を抽出し、
抽出した前記記入領域内の文字または記号情報から前記帳票に記入する情報の内容を暗示するラベル名を取得し、
取得した前記ラベル名から書式情報テーブルを探索して前記ラベル名に対応した記入領域の書式設定の情報を取得し、
取得した前記記入領域と前記ラベル名と前記書式設定とを確認または訂正の入力を表示し、
前記確認または訂正の入力情報に基づき前記書式情報テーブルの更新を行い、
前記確認または訂正された前記記入領域と前記ラベル名と前記書式設定とを前記出力することを行うことを特徴とする情報処理方法。 - 前記帳票内の文字情報からラベル名を取得する際に、記入領域のラベル名を取得する領域として前記記入領域を相対座標で示したラベル名取得領域テーブルから前記ラベル名を取得可能な領域の情報を取得して前記記入領域のラベルを取得することを特徴とする請求項12または請求項13に記載の情報処理方法。
- 前記ラベル名取得領域テーブルはラベル名の記入領域に対する位置関係毎にラベル名取得領域を有する前記ラベル名取得領域のそれぞれに対して記入領域のラベル名を取得し、
取得した各ラベル名と位置情報から書式情報テーブルを探索して対応する記入領域の設定を取得することを特徴とする請求項14に記載の情報処理方法。 - 前記ラベル名取得領域テーブルはラベル名の言語ごとにラベル名取得領域を有する前記ラベル名取得領域それぞれに対して記入領域のラベル名を取得することを特徴とする請求項14または15に記載の情報処理方法。
- 前記記入領域周囲の文字列の言語に対応するラベル名取得領域から記入領域のラベル名を取得することを特徴とする請求項16に記載の情報処理方法。
- 前記ラベル名取得領域テーブルが縦書きまたは横書き毎にラベル名取得領域を有する前記記入領域周囲の縦書きか横書きかを判断して対応するラベル名取得領域により前記記入領域のラベル名を取得することを特徴とする請求項14から請求項17のいずれかに記載の情報処理方法。
- 前記確認または訂正の入力情報に該当する訂正情報が書式情報テーブルから欠落している前記書式情報テーブルに前記訂正情報を追加することを特徴とする請求項12から請求項18のいずれかに記載の情報処理方法。
- 入力された前記訂正情報を教師あり学習を用いて前記書式情報テーブルの更新を行うことを特徴とする請求項12から請求項19のいずれかに記載の情報処理方法。
- 請求項11から請求項20のいずれかの情報処理方法を情報処理装置または情報処理システムに実行させるための読取可能なプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009053865A JP5402099B2 (ja) | 2008-03-06 | 2009-03-06 | 情報処理システム、情報処理装置、情報処理方法およびプログラム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008057033 | 2008-03-06 | ||
JP2008057033 | 2008-03-06 | ||
JP2009053865A JP5402099B2 (ja) | 2008-03-06 | 2009-03-06 | 情報処理システム、情報処理装置、情報処理方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009238217A true JP2009238217A (ja) | 2009-10-15 |
JP5402099B2 JP5402099B2 (ja) | 2014-01-29 |
Family
ID=41053659
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009053865A Expired - Fee Related JP5402099B2 (ja) | 2008-03-06 | 2009-03-06 | 情報処理システム、情報処理装置、情報処理方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US20090226090A1 (ja) |
JP (1) | JP5402099B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013509662A (ja) * | 2009-11-02 | 2013-03-14 | ビーデージービー・エンタープライズ・ソフトウェア・エスエーアールエル | 動的変動ネットワークを使用するシステムおよび方法 |
US9141691B2 (en) | 2001-08-27 | 2015-09-22 | Alexander GOERKE | Method for automatically indexing documents |
US9152883B2 (en) | 2009-11-02 | 2015-10-06 | Harry Urbschat | System and method for increasing the accuracy of optical character recognition (OCR) |
US9159584B2 (en) | 2000-08-18 | 2015-10-13 | Gannady Lapir | Methods and systems of retrieving documents |
US9158833B2 (en) | 2009-11-02 | 2015-10-13 | Harry Urbschat | System and method for obtaining document information |
JP2020113054A (ja) * | 2019-01-11 | 2020-07-27 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置 |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7930447B2 (en) | 2008-10-17 | 2011-04-19 | International Business Machines Corporation | Listing windows of active applications of computing devices sharing a keyboard based upon requests for attention |
US10311114B2 (en) | 2010-06-17 | 2019-06-04 | Google Llc | Displaying stylized text snippets with search engine results |
US8724931B2 (en) * | 2011-05-27 | 2014-05-13 | Ebay Inc. | Automated user information provision using images |
US9858548B2 (en) | 2011-10-18 | 2018-01-02 | Dotloop, Llc | Systems, methods and apparatus for form building |
US8788930B2 (en) * | 2012-03-07 | 2014-07-22 | Ricoh Co., Ltd. | Automatic identification of fields and labels in forms |
US8792730B2 (en) * | 2012-03-07 | 2014-07-29 | Ricoh Co., Ltd. | Classification and standardization of field images associated with a field in a form |
US10826951B2 (en) | 2013-02-11 | 2020-11-03 | Dotloop, Llc | Electronic content sharing |
US9575622B1 (en) | 2013-04-02 | 2017-02-21 | Dotloop, Llc | Systems and methods for electronic signature |
US10552525B1 (en) * | 2014-02-12 | 2020-02-04 | Dotloop, Llc | Systems, methods and apparatuses for automated form templating |
US10176159B2 (en) * | 2014-05-05 | 2019-01-08 | Adobe Systems Incorporated | Identify data types and locations of form fields entered by different previous users on different copies of a scanned document to generate an interactive form field |
US10733364B1 (en) | 2014-09-02 | 2020-08-04 | Dotloop, Llc | Simplified form interface system and method |
US10270934B2 (en) * | 2016-12-01 | 2019-04-23 | Kyocera Document Solutions Inc. | Image processing apparatus and image forming apparatus |
CN110362802A (zh) * | 2019-07-18 | 2019-10-22 | 中国工商银行股份有限公司 | 用于将单据信息录入系统的方法、装置、计算设备、介质 |
CN117436419B (zh) * | 2023-12-12 | 2024-02-23 | 佳瑛科技有限公司 | 一种货物登记报表数据自动化更新的控制方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03179570A (ja) * | 1989-07-10 | 1991-08-05 | Hitachi Ltd | 文書処理方式およびプログラム自動生成方法 |
JP2004220340A (ja) * | 2003-01-15 | 2004-08-05 | Fujitsu Ltd | 帳票書式編集装置および帳票書式編集プログラム |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3997026B2 (ja) * | 1999-01-29 | 2007-10-24 | キヤノン株式会社 | フォーム編集方法及び装置及びコンピュータ読取り可能なプログラムが格納された記憶媒体 |
US6651217B1 (en) * | 1999-09-01 | 2003-11-18 | Microsoft Corporation | System and method for populating forms with previously used data values |
US6981028B1 (en) * | 2000-04-28 | 2005-12-27 | Obongo, Inc. | Method and system of implementing recorded data for automating internet interactions |
US7054509B2 (en) * | 2000-10-21 | 2006-05-30 | Cardiff Software, Inc. | Determining form identification through the spatial relationship of input data |
US6782144B2 (en) * | 2001-03-12 | 2004-08-24 | Multiscan Corp. | Document scanner, system and method |
JP2002324236A (ja) * | 2001-04-25 | 2002-11-08 | Hitachi Ltd | 帳票識別方法及び帳票登録方法 |
US20030028792A1 (en) * | 2001-08-02 | 2003-02-06 | International Business Machines Corportion | System, method, and computer program product for automatically inputting user data into internet based electronic forms |
US7469270B1 (en) * | 2001-11-14 | 2008-12-23 | At&T Intellectual Property I, L.P. | Method, system, and apparatus for presenting forms and publishing form data |
US7305612B2 (en) * | 2003-03-31 | 2007-12-04 | Siemens Corporate Research, Inc. | Systems and methods for automatic form segmentation for raster-based passive electronic documents |
US7660779B2 (en) * | 2004-05-12 | 2010-02-09 | Microsoft Corporation | Intelligent autofill |
KR100747879B1 (ko) * | 2004-06-10 | 2007-08-08 | 캐논 가부시끼가이샤 | 화상 처리 장치, 제어 방법 및 기록 매체 |
US7333658B2 (en) * | 2004-11-01 | 2008-02-19 | International Business Machines Corporation | Data verification using text messaging |
JP4856925B2 (ja) * | 2005-10-07 | 2012-01-18 | 株式会社リコー | 画像処理装置、画像処理方法及び画像処理プログラム |
WO2007050646A2 (en) * | 2005-10-24 | 2007-05-03 | Capsilon Fsg, Inc. | A business method using the automated processing of paper and unstructured electronic documents |
US20070130134A1 (en) * | 2005-12-05 | 2007-06-07 | Microsoft Corporation | Natural-language enabling arbitrary web forms |
US20070168382A1 (en) * | 2006-01-03 | 2007-07-19 | Michael Tillberg | Document analysis system for integration of paper records into a searchable electronic database |
JP5126541B2 (ja) * | 2006-05-26 | 2013-01-23 | 日本電気株式会社 | 情報分類装置、情報分類方法、及び情報分類プログラム |
GB0622863D0 (en) * | 2006-11-16 | 2006-12-27 | Ibm | Automated generation of form definitions from hard-copy forms |
JP4739309B2 (ja) * | 2007-11-09 | 2011-08-03 | 株式会社リコー | 情報処理装置、及び情報処理方法 |
US7992087B1 (en) * | 2008-02-27 | 2011-08-02 | Adobe Systems Incorporated | Document mapped-object placement upon background change |
-
2009
- 2009-03-06 JP JP2009053865A patent/JP5402099B2/ja not_active Expired - Fee Related
- 2009-03-06 US US12/382,025 patent/US20090226090A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03179570A (ja) * | 1989-07-10 | 1991-08-05 | Hitachi Ltd | 文書処理方式およびプログラム自動生成方法 |
JP2004220340A (ja) * | 2003-01-15 | 2004-08-05 | Fujitsu Ltd | 帳票書式編集装置および帳票書式編集プログラム |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9159584B2 (en) | 2000-08-18 | 2015-10-13 | Gannady Lapir | Methods and systems of retrieving documents |
US9141691B2 (en) | 2001-08-27 | 2015-09-22 | Alexander GOERKE | Method for automatically indexing documents |
JP2013509662A (ja) * | 2009-11-02 | 2013-03-14 | ビーデージービー・エンタープライズ・ソフトウェア・エスエーアールエル | 動的変動ネットワークを使用するシステムおよび方法 |
US9152883B2 (en) | 2009-11-02 | 2015-10-06 | Harry Urbschat | System and method for increasing the accuracy of optical character recognition (OCR) |
US9158833B2 (en) | 2009-11-02 | 2015-10-13 | Harry Urbschat | System and method for obtaining document information |
US9213756B2 (en) | 2009-11-02 | 2015-12-15 | Harry Urbschat | System and method of using dynamic variance networks |
JP2020113054A (ja) * | 2019-01-11 | 2020-07-27 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置 |
JP7322407B2 (ja) | 2019-01-11 | 2023-08-08 | 京セラドキュメントソリューションズ株式会社 | 情報処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5402099B2 (ja) | 2014-01-29 |
US20090226090A1 (en) | 2009-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5402099B2 (ja) | 情報処理システム、情報処理装置、情報処理方法およびプログラム | |
US20210073531A1 (en) | Multi-page document recognition in document capture | |
JP3425408B2 (ja) | 文書読取装置 | |
EP0539106B1 (en) | Electronic information delivery system | |
US6697056B1 (en) | Method and system for form recognition | |
US20080040655A1 (en) | Table data processing method and apparatus | |
JP4785655B2 (ja) | 文書処理装置及び文書処理方法 | |
JP2003308480A (ja) | オンライン手書き文字パターン認識編集装置及び方法並びに当該方法を実現するコンピュータ実行可能なプログラム | |
US20220222292A1 (en) | Method and system for ideogram character analysis | |
JP2021152924A (ja) | 帳票入力フォーム生成装置、帳票入力フォーム生成方法及びプログラム | |
JP2021043478A (ja) | 情報処理装置、その制御方法及びプログラム | |
US20170132484A1 (en) | Two Step Mathematical Expression Search | |
US10803233B2 (en) | Method and system of extracting structured data from a document | |
US7716639B2 (en) | Specification wizard | |
CN109726369A (zh) | 一种基于标准文献的智能模板化题录技术实现方法 | |
JP2008129793A (ja) | 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体 | |
US20150261735A1 (en) | Document processing system, document processing apparatus, and document processing method | |
JP2000322417A (ja) | 画像ファイリング装置及び方法及び記憶媒体 | |
JP2021028770A (ja) | 情報処理装置及び表認識方法 | |
US20160203133A1 (en) | Systems and methods for indexing and linking electronic documents | |
JP2021012741A (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP2013182459A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP4280939B2 (ja) | 位置面システム画像認識コンピューターソフトウェア | |
JPH0689330A (ja) | 画像ファイリングシステム | |
JP2016189146A (ja) | 文字認識装置、分類装置及び文字認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120228 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20120301 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120706 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130423 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130619 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130709 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130906 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131001 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131014 |
|
LAPS | Cancellation because of no payment of annual fees |