JP6871840B2 - 計算機及び文書識別方法 - Google Patents

計算機及び文書識別方法 Download PDF

Info

Publication number
JP6871840B2
JP6871840B2 JP2017214170A JP2017214170A JP6871840B2 JP 6871840 B2 JP6871840 B2 JP 6871840B2 JP 2017214170 A JP2017214170 A JP 2017214170A JP 2017214170 A JP2017214170 A JP 2017214170A JP 6871840 B2 JP6871840 B2 JP 6871840B2
Authority
JP
Japan
Prior art keywords
document
information
type
risk
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017214170A
Other languages
English (en)
Other versions
JP2019086984A (ja
Inventor
鈴木 康文
康文 鈴木
新庄 広
広 新庄
良介 大館
良介 大館
正裕 本林
正裕 本林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2017214170A priority Critical patent/JP6871840B2/ja
Priority to CN201810962608.0A priority patent/CN109753964B/zh
Priority to US16/117,198 priority patent/US10783366B2/en
Publication of JP2019086984A publication Critical patent/JP2019086984A/ja
Application granted granted Critical
Publication of JP6871840B2 publication Critical patent/JP6871840B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/96Management of image or video recognition tasks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Input (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Character Discrimination (AREA)

Description

本発明は、文書を識別する計算機及び方法に関する。
デジタル化の進展に伴い電子申請を利用する機会が増加している。電子申請では、対象の書類等が全てデジタル化されているわけではなく、紙ベースの文書又は紙をスキャンすることによって作成された画像が使用されている場合が多い。
本明細書では、電子化された文書を電子ベース文書と記載し、紙ベースの文書及び紙をスキャンすることによって作成された画像を紙ベース文書とも記載する。また、電子ベース文書及び紙ベース文書を区別しない場合、単に、文書とも記載する。
例えば、企業における出納業務では、(1)申請者が請求者から請求書を受け取り、(2)申請者が請求者への請求金額の支払いを記載した請求書を電子申請により財務部門に提出し、(3)財務部門に所属する人間が、請求書に記載された属性を確認し、電子申請が適正であると判断した場合、企業から請求者に請求金額を支払う、というような手続きが実行されている。
ここで、属性とは、審査対象であり、かつ、文書の特徴を示す文字列である。例えば、出納業務の場合、請求者の氏名及び名称、請求内容、請求金額、請求日、支払期限日、並びに請求金額の振込先の銀行口座番号等が属性に該当する。
紙ベース文書を扱う電子申請の場合、人が紙ベース文書を確認する必要があるため、業務の効率が低く、また、業務に要するコストが大きいという問題がある。
前述の問題に対し、光学文字認識(OCR:Optical Character Recognition)の技術を用いて、紙ベース文書から属性を読み出す方法が知られている。例えば、特許文献1に記載の技術が知られている。
特許文献1には、「顧客の請求書を電子的に提示する方法であって、顧客から電子的な請求書及び紙の請求書を受け取り、紙の請求書から電子イメージ情報を生成し、スキャンすることによって電子イメージ情報から第1OCRデータを抽出し、スキャンされた紙幣の種類の少なくとも1つの数値識別子を第1OCRデータから検索し、数値識別子の比較結果からスキャンされた紙の請求書のタイプを特定し、特定されたタイプに対応するテンプレートを用いて電子イメージ情報から第2OCRデータを抽出し、第2OCRデータから請求書情報を抽出し、請求書情報と知られた情報とを比較し、電子的な請求書及び請求書情報とを組み合わせた顧客請求提示を提示すること」が記載されている。
特許文献1に記載の技術を用いることによって、電子申請の業務において人が行う処理の工数を削減できるため、業務の効率を改善し、また、業務に要するコストを削減することができる。
米国特許第8630949号明細書
特許文献1に記載の技術では、数値識別子と請求書の種別を予め設定する必要がある。しかし、類似する属性を含む文書を用いるが審査内容が異なる電子申請が存在する場合、ユーザが数値識別子と請求書の種別とを適切に関連付けることができない可能性がある。また、数値識別子が含まれていない可能性も考えられる。また、請求書の種別ごとにテンプレートを作成する必要がある。請求書の書式の変更等によって数値識別子及び請求書の種別に対応するテンプレートが変更される可能性もある。
したがって、従来技術では、最適なテンプレートを選択できないことによって属性の抽出精度が低くなり、業務効率の改善及び業務に要するコストの削減の効果が低い。
装置を用いた自動識別により、業務効率の改善及び業務に要するコストを削減できる。一方、誤った自動識別等に基づく審査によって業務上の損失が発生する可能性がある。したがって、装置を用いた自動識別において、前述のような業務上の損失を抑える仕組みが必要となる。
本発明は、業務上の損失の発生を抑止し、かつ、高い精度で審査で用いる属性を抽出する装置及び文書識別方法を提供する。
本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、任意の審査の対象の文書に含まれる文字列である属性を抽出する計算機であって、前記計算機は、プロセッサ及び前記プロセッサに接続される記憶装置を備え、前記記憶装置は、少なくとも一つ以上の属性の種別が定義された複数のテンプレートを管理するためのテンプレート情報と、前記審査において発生する可能性があるリスクの種別を特定するための文字列又は文字列の条件を定義するリスク特定ルールを管理するための第1管理情報と、前記審査に用いられる出力情報の確認操作の種別の修正方法を定義する修正ルールを管理するための第2管理情報と、を格納し、前記テンプレート情報は、前記テンプレートの識別情報及び前記属性の種別を示す識別情報から構成されるエントリを複数含み、前記第1管理情報は、種別が異なる前記リスクに対応する前記リスク特定ルールの情報を格納し、前記修正ルールは、修正前の確認操作の種別、特定されたリスクの種別の組合せによって定義される条件式、及び修正後の確認操作の種別から構成され、前記プロセッサは、前記文書の画像データに対して文字認識処理を実行し、前記文字認識処理の結果及び前記複数のテンプレートを用いて、前記複数のテンプレートの各々に定義された前記属性の種別に対応する属性を抽出し、前記抽出された属性に基づいてテンプレートを選択し、前記選択されたテンプレートを用いて抽出された属性を含む、前記出力情報を生成し、前記生成された出力情報の信頼性を示す評価値を算出し、前記評価値及び閾値の比較結果に基づいて、前記審査が行われる前に前記生成された出力情報に対して行われる確認操作の種別を決定し、前記文書に含まれる文字列に基づいて、前記決定された確認操作の種別の修正が必要であるか否かを判定し、前記決定された確認操作の種別の修正が必要であると判定された場合、前記決定された確認操作の種別を修正し、前記決定された確認操作の種別の修正が必要であるか否かを判定する処理では、前記プロセッサが、前記第1管理情報及び前記生成された出力情報に基づいて、前記文書に存在するリスクの種別を特定し、前記確認操作の種別及び前記特定されたリスクの種別の組合せに基づいて前記第2管理情報を参照して、該当する修正ルールが存在するか否かを判定し、前記決定された確認操作の種別を修正する処理では、前記プロセッサが、前記該当する修正ルールが存在すると判定された場合、前記該当する修正ルールに基づいて、前記確認操作の種別を修正することを特徴とする。
本発明によれば、業務上の損失の発生を抑止し、かつ、高い精度で審査で用いる属性を文書から抽出できる。上記した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。
実施例1のシステムの構成例を示す図である。 実施例1の計算機のハードウェア構成及びソフトウェア構成を説明する図である。 実施例1のテンプレート情報のデータ構造の一例を示す図である。 実施例1の単語辞書のデータ構造の一例を示す図である。 実施例1の表記辞書のデータ構造の一例を示す図である。 実施例1のリスク特定ルール管理情報のデータ構造の一例を示す図である。 実施例1の修正ルール管理情報のデータ構造の一例を示す図である。 実施例1の計算機が実行する処理の概要を説明するフローチャートである。 実施例1の文書審査モジュールが実行する文書サマリ情報生成処理の概要を示す図である。 実施例1の文書審査モジュールが生成するOCR要素のデータ構造の一例を示す図である。 実施例1の文書審査モジュールが実行する文書サマリ情報生成処理を説明するフローチャートである。 実施例1のリスク回避判定モジュールが実行するリスク回避判定処理を説明するフローチャートである。 実施例1の学習処理モジュールが実行する学習用データ蓄積処理の一例を説明するフローチャートである。 実施例1のルール生成モジュールが実行する推奨金額提示処理の一例を説明するフローチャートである。 実施例1の計算機が表示する設定画面の一例を示す図である。 実施例1のルール生成モジュールが実行する推奨リスク単語提示処理の一例を説明するフローチャートである。 実施例1の計算機が表示する設定画面の一例を示す図である。 実施例1の計算機が表示するテンプレート入力画面の一例を示す図である。
以下、本発明の実施例について、図面を参照して説明する。
なお、実施例を説明する図において、同一の機能を有する箇所には同一の符号を付し、その繰り返しの説明は省略する。なお、以下に説明する実施例は特許請求の範囲にかかる発明を限定するものではない。また実施例において説明されている各要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。
また、以下の説明では、情報の一例として「xxxテーブル」といった表現を用いる場合があるが、情報のデータ構造はどのようなものでもよい。すなわち、情報がデータ構造に依存しないことを示すために、「xxxテーブル」を「xxx情報」と言うことができる。また、以下の説明において、各テーブルの構成は一例であり、一つのテーブルは、二つ以上のテーブルに分割されてもよいし、二つ以上のテーブルの全部又は一部が一つのテーブルであってもよい。
図1は、実施例1のシステムの構成例を示す図である。
システムは、計算機100、入力端末110、クライアント端末120、及びスキャナ130から構成される。計算機100、入力端末110、及びクライアント端末120は、ネットワーク150を介して互いに接続される。また、スキャナ130は、直接又はネットワークを介して計算機100に接続される。
なお、本発明はネットワーク150の種類に限定されない。ネットワーク150は、LAN(Local Area Network)及びWAN(Wide Area Network)等が考えられる。また、本発明はネットワーク150の接続方式に限定されず、無線及び有線のいずれでもよい。また、スキャナ130は、計算機100に直接又はネットワークを介して、クライアント端末120に接続されてもよい。
なお、本発明のシステムに含まれる計算機100、入力端末110、クライアント端末120、及びスキャナ130の数は任意の数に設定できる。
計算機100は、電子申請に関する処理を実行する。計算機100が実行する処理の詳細は後述する。
クライアント端末120は、電子申請を行うユーザ(申請者)が操作する端末である。ユーザは、クライアント端末120を操作して、電子申請に必要な情報を入力し、電子申請に関連する紙の文書を提出する。提出する紙の文書は、例えば、電子申請が正当であることを示す証明書等が考えられる。
ユーザは、紙の文書の提出にあたり、電子申請を行う会社又は行政施設に直接文書を提出してもよい。クライアント端末120にスキャナ130が接続されている場合には、スキャナ130を用いて、紙の文書から文書画像データ901(図9参照)を生成し、それを提出してもよい。なお、本発明は、扱う電子申請の種類及び文書に限定されない。文書は、例えば、請求書、納品書、領収書、源泉徴収票、及び納税通知書等の各種書類、並びに、運転免許証及びマイナンバーカード等の各種証明書が考えられる。
電子申請時に入力される文書には、電子申請の審査に用いる文字列である属性が複数含まれる。例えば、文書が請求書の場合、請求金額、請求者名、請求宛先名、発行日、並びに、振込先を指定する銀行名、支店名、口座種別及び口座番号等の文字列、さらに、請求者が押印した印影が属性として含まれる。
本実施例では、属性は、属性の種別(属性の名称)及び属性として抽出される文字列を対応づけて管理される。また、本実施例では、文字列は、一般的な文字だけではなく、矢印、四角、及び円等の記号も含む概念である。
入力端末110は、計算機100を管理する審査者又は電子申請を審査する審査者が操作する端末である。スキャナ130は、紙の文書から文書画像データ901を生成する。スキャナ130は、フラットベッドスキャナ及びオートシートフィーダ付きのスキャナ等が考えられる。
なお、スキャナ130の代わりに、CCD(Charge Coupled Device)等の素子を用いて画像を撮影するデジタルカメラを備えてもよい。
図2は、実施例1の計算機100のハードウェア構成及びソフトウェア構成を説明する図である。
計算機100は、プロセッサ201、主記憶装置202、副記憶装置203、ネットワークインタフェース204、入力装置205、及び出力装置206を有する。各ハードウェアは内部バス等を介して互いに接続される。図2では、各ハードウェアの数は一つであるが、二つ以上でもよい。
なお、入力端末110及びクライアント端末120のハードウェア構成は、計算機100と同一である。
プロセッサ201は、主記憶装置202に格納されるプログラムを実行する。プロセッサ201がプログラムにしたがって処理を実行することによって、特定の機能を実現するモジュールとして動作する。以下の説明では、モジュールを主語に処理を説明する場合、プロセッサ201が当該モジュールを実現するプログラムを実行していることを示す。
主記憶装置202は、プロセッサ201が実行するプログラム及びプログラムが使用する情報を格納する。また、主記憶装置202は、プログラムが一時的に使用するワークエリアを含む。主記憶装置202は、例えば、メモリ等が考えられる。
本実施例の主記憶装置202は、文書審査モジュール211、学習処理モジュール212、リスク回避判定モジュール213、ルール生成モジュール214、テンプレート設定モジュール215を実現するプログラムを格納する。また、主記憶装置202は、テンプレート情報221、単語辞書222、表記辞書223、リスク特定ルール管理情報224、及び修正ルール管理情報225を格納する。
主記憶装置202は、すべてのモジュールを実現するプログラムを格納していなくてもよい。
文書審査モジュール211は、電子申請の審査処理を実行する。具体的には、文書審査モジュール211は、電子申請を受け付け、テンプレートを用いて抽出された属性を含む文書サマリ情報905(図9を参照)を生成する。また、文書審査モジュール211は、文書サマリ情報905に対して行われる確認操作の種別を決定する。以下の説明では、確認操作の種別をクラスと記載する。本実施例では、ケース0、ケース1、ケース2の三つのクラスのいずれかに決定される。文書審査モジュール211は、決定された確認操作の種別にしたがった文書サマリ情報905の確認操作が行われた後、文書サマリ情報905を用いて電子申請を審査する。文書審査モジュール211が実行する処理の詳細については後述する。
ここで、確認操作の内容について説明する。ケース0では、文書サマリ情報905の信頼性が高いため、審査者による文書サマリ情報905の修正は行われない。ケース1では、計算機100は、一人の審査者に対して、文書サマリ情報の入力を促す。審査者は文書サマリ情報を生成し、入力端末110を操作して計算機100に文書サマリ情報を入力する。ケース2では、計算機100は、二人の審査者に対して、文書サマリ情報の入力を促す。二人の審査者は、それぞれ、文書サマリ情報を生成し、入力端末110を操作して計算機100に文書サマリ情報を入力する。以下の説明では、管理者によって生成される文書サマリ情報を入力文書サマリ情報と記載する。
なお、前述した三種類のクラスは一例であってこれに限定されない。例えば、一人の審査者が確認を行う操作と、審査者が確認を行わない操作の二種類のクラスでもよい。また、結果の目視による簡易な確認操作と、審査者に必要項目を入力させ、データの一致を判定するような詳細な確認操作との二種類のクラスでもよい。
学習処理モジュール212は、データの選択方法、抽出方法、推奨方法、及び分類方法に関する学習処理を実行する。なお、機械学習のアルゴリズムには、ロジスティック回帰、デシジョン フォレスト、デシジョン ジャングル、ブースト デシジョン ツリー、ニューラルネットワーク、平均化パーセプトロン、サポート ベクタマシン、ローカル詳細サポート ベクタマシン、及びベイズ ポイント マシン等が知られている。
リスク回避判定モジュール213は、文書審査モジュール211によって決定されたクラスを修正する。リスク回避判定モジュール213が実行する処理については後述する。
ルール生成モジュール214は、後述するリスク特定ルール管理情報224及び修正ルール管理情報225を生成する。
テンプレート設定モジュール215は、後述するテンプレート情報221の生成及び変更を行う。
テンプレート情報221は、審査に使用する文字列を文書から読み出すためのテンプレートを管理するための情報である。テンプレート情報221の詳細は図3を用いて説明する。
単語辞書222及び表記辞書223は、属性として抽出する文字列を定義した情報である。単語辞書222の詳細は図4を用いて説明し、また、表記辞書223の詳細は図5を用いて説明する。
リスク特定ルール管理情報224は、業務上の損失(リスク)を考慮して設定されるリスク特定ルールを管理するための情報である。リスク特定ルール管理情報224の詳細は図6を用いて説明する。ここで、業務上の損失とは、金銭的な損失、業務の信用の損失、及び審査の誤り等を含む概念である。また、リスク特定ルールは、文書の審査において発生する可能性があるリスクの種別を特定するための文字列又は文字列の条件を定義する情報である。
修正ルール管理情報225は、クラスの修正方法を定義する修正ルールを管理するための情報である。修正ルール管理情報225の詳細は図7を用いて説明する。
副記憶装置203は、データを永続的に格納する。副記憶装置203は、例えば、HDD(Hard Disk Drive)及びSSD(Solid State Drive)等が考えられる。なお、主記憶装置202に格納されるプログラム及び情報は、副記憶装置203に格納されてもよい。この場合、プロセッサ201が、副記憶装置203からプログラム及び情報を読み出し、主記憶装置202にロードする。
ネットワークインタフェース204は、ネットワークを介して他の装置と接続するためのインタフェースである。
入力装置205は、計算機100に対してデータを入力するための装置である。例えば、入力装置205は、キーボード、マウス、及びタッチパネル等を含む。
出力装置206は、データの入力画面及び処理結果等を出力する装置である。出力装置206は、タッチパネル及びディスプレイ等を含む。
図3は、実施例1のテンプレート情報221のデータ構造の一例を示す図である。
テンプレート情報221は、テンプレート番号301、属性302、位置情報303、及び請求者名304から構成されるエントリを含む。一つのエントリが一つのテンプレートに対応する。また、一つのエントリには、テンプレートにおいて定義された属性の行が一つ以上含まれる。
テンプレート番号301は、テンプレートを一意に識別するための識別情報を格納するフィールドである。本実施例では、テンプレートの識別情報は、エントリの識別情報としても用いられる。
属性302は、テンプレートに含まれる属性の種別を表す識別名称を格納するフィールドである。
位置情報303は、文書を構成する一領域における属性の種別に対応する属性の位置に関する情報を格納するフィールドである。より具体的には、位置情報303には、一頁に対応する紙面上の属性の種別に対応する属性の位置に関する情報が格納される。例えば、矩形領域の左上及び右下の座標が位置情報303に格納される。なお、座標は、属性間の相対的な位置関係を表す相対座標でもよいし、紙面上の絶対的な位置を示す絶対座標でもよい。また、位置情報303には、複数の位置を指定する情報が格納されてもよい。
なお、本発明は、位置情報303に格納される情報に限定されない。例えば、エントリは、属性の長さ及び属性が記載されている範囲等を格納するフィールドを含んでもよい。
請求者名304は、テンプレートを適用するユーザ及び会社等を示す情報を格納するフィールドである。特定の請求者の名称(文字列)を含む文書に対してのみテンプレートが適用される。
なお、エントリは、適用するテンプレートを選択するための情報として、請求者名304の他に、申請者名を格納するフィールドを含んでもよいし、また、請求者及び申請者の組合せを格納するフィールドを含んでもよい。
図3に示すテンプレート情報221は、テンプレート番号301をエントリの識別情報とするテーブル形式の情報であるが、請求者名304をエントリの識別情報とするテーブル形式の情報でもよい。
図4は、実施例1の単語辞書222のデータ構造の一例を示す図である。
単語辞書222は、属性として抽出する単語に対応する文字列を定義する情報であり、属性401及び文字列402から構成されるエントリを含む。一つのエントリが一つの属性に対応する。
属性401は、属性の識別名称を格納する。文字列402は、属性401に分類される単語(文字列)を格納する。
図5は、実施例1の表記辞書223のデータ構造の一例を示す図である。
表記辞書223は、属性として抽出する数値に対応する文字列を定義する情報であり、属性501及び表記502から構成されるエントリを含む。一つのエントリが一つの属性に対応する。
属性501は、属性の識別名称を格納する。表記502は、属性501に分類される数値(文字列)の表記ルールを格納する。
図6は、実施例1のリスク特定ルール管理情報224のデータ構造の一例を示す図である。
リスク特定ルール管理情報224は、種類が異なるリスク毎のリスク特定ルールを管理する管理テーブル600を含む。各管理テーブル600には識別情報が付与される。
図6に示すリスク特定ルール管理情報224には、二つの管理テーブル600−1、600−2が含まれる。管理テーブル600−1には識別情報「A」が付与され、管理テーブル600−2には識別情報「B」が付与される。
管理テーブル600−1は、金額に関連するリスクを特定するための文字列の条件をリスク特定ルールとして管理するテーブルであり、請求者名611及び基準金額612から構成されるエントリを含む。請求者名611は、請求者名304と同一のフィールドである。基準金額612は、リスクとして特定する文字列の条件となる金額(文字列)の基準値を格納するフィールドである。本実施例では、基準金額612以上の金額が文書に含まれる場合、リスクが存在すると判定される。
例えば、計算機100は、請求者名611に対応する文書であり、かつ、文書に含まれる金額が基準金額612以上である場合、審査者が文書サマリ情報905(図9参照)を確認するようにクラスを修正する。これによって、大きな金額を扱う業務において発生する金銭的な損失を回避できる。
管理テーブル600−2は、業務の誤りに関連するリスクを特定するための文字列をリスク特定ルールとして管理するテーブルであり、リスク単語621から構成されるエントリを含む。リスク単語621は、電子申請の審査の誤りが発生する審査の種別等を特定するための単語(文字列)を格納するフィールドである。
例えば、計算機100は、電子申請の審査の誤りが高いことが判明している文字列が文書に含まれる場合、審査者が文書サマリ情報905(図9参照)を確認するようにクラスを修正する。これによって、審査の誤りを回避できる。
図6では、請求金額の条件及び単語に基づいて定義されたリスク特定ルールを示したが、リスク特定ルール管理情報224は、前述以外のリスク特定ルールを定義した管理テーブル600を含んでもよい。
例えば、支払日までの残り日数、並びに、発行日及び支払日等の暦の誤りに関する条件をルールとすることが考えられる。また、特定日付及び曜日に審査の誤りが多い場合に、当該日付及び曜日をルールとすることが考えられる。また、文書から基準値以上の多数の数字が抽出された場合に、所望の数字とは異なる数字を抽出している可能性が高いとしてクラスを修正するためのルールを設定することも考えられる。
図7は、実施例1の修正ルール管理情報225のデータ構造の一例を示す図である。
修正ルール管理情報225は、クラス条件701、条件式702、及び修正クラス703から構成されるエントリを含む。一つのエントリは修正ルールに対応する。
クラス条件701は、クラスの条件を格納するフィールドである。具体的には、クラス条件701には、修正前のクラスの識別情報が格納される。条件式702は、リスクの種別に関する条件式を格納するフィールドである。具体的には、条件式702には、管理テーブル600の識別情報を用いた論理式等が格納される。
修正クラス703は、修正方法を規定するフィールドである。具体的には、修正クラス703には、修正後のクラスの識別情報が格納される。
後述するように、計算機100は、リスク特定ルール管理情報224に基づいて各種別のリスクの有無を特定する。また、計算機100は、文書のクラスがクラス条件701に一致し、かつ、特定されたリスクの種別の組合せが条件式702を満たすか否かを判定する。すなわち、該当する修正ルールが存在するか否かが判定される。計算機100は、判定結果に基づいてクラスを修正する。
図7に示す修正ルール管理情報225には、以下のような二つのエントリが格納されている。一番目のエントリには、変更前のクラスがケース1であり、かつ、管理テーブル600−2に対応する種別のリスクが存在する場合、クラスをケース1からケース2に修正する修正ルールが設定される。二番目のエントリには、変更前のクラスがケース0であり、かつ、管理テーブル600−1及び管理テーブル600−2の少なくともいずれかに対応する種別のリスクが存在する場合、ケース0からケース1に修正する修正ルールが設定される。
図8は、実施例1の計算機100が実行する処理の概要を説明するフローチャートである。
計算機100の文書審査モジュール211は、ユーザが操作するクライアント端末120から、電子申請の要求を受け付ける(ステップS101)。電子申請の要求には、審査対象の文書画像データ901(図9参照)が含まれる。
なお、文書画像データ901が外部の記憶装置に格納されている場合、ユーザは、文書画像データ901の識別情報を電子申請の要求に含めてもよい。また、ユーザは、紙の文書を提出してもよい。紙の文書が提出された場合、計算機100は、スキャナ130を用いて紙の文書をスキャンし、文書画像データ901を生成する。
次に、計算機100の文書審査モジュール211は、文書サマリ情報生成処理を実行する(ステップS102)。
文書サマリ情報生成処理では、文書サマリ情報905(図9参照)が生成される。文書サマリ情報905は、文書画像データ901に対応する文書から抽出された属性をまとめた情報である。請求書に対応する文書画像データ901の場合、請求金額、並びに、振込先を特定する銀行名、支店名、口座種別、口座番号、請求者名、及び被請求者名等に対応する属性(文字列)が文書サマリ情報905に含まれる。領収書に対応する文書画像データ901の場合、金額、物を購入又はサービスの提供を受けた人又は組織の名称、及び物の販売又はサービスの提供を行った人又は組織の名称等に対応する属性(文字列)が文書サマリ情報905に含まれる。また、源泉徴収票に対応する文書画像データ901の場合、人の氏名、人が所属する組織の名称、人の収入額、及び人の減収徴収額等に対応する属性(文字列)が文書サマリ情報905に含まれる。
また、文書サマリ情報生成処理では、文書審査モジュール211が、文書サマリ情報905の信頼性を示す指標を算出し、当該指標に基づいて、文書サマリ情報905のクラスを決定する。さらに、リスク回避判定モジュール213が、リスク特定ルール管理情報224及び修正ルール管理情報225に基づいて、クラスを修正する。
計算機100は、クラスに応じた確認操作にしたがって文書サマリ情報905の修正等の確認操作を行い、最終的な文書サマリ情報を出力する。
なお、文書サマリ情報生成処理の詳細は図9から図10を用いて説明する。
計算機100は、文書サマリ情報905を用いて電子申請の審査を行う(ステップS103)。計算機100は、審査の結果として「許可」及び「拒絶」のいずれかの応答をユーザに出力する。
図9は、実施例1の文書審査モジュール211が実行する文書サマリ情報生成処理の概要を示す図である。図10は、実施例1の文書審査モジュール211が生成するOCR要素のデータ構造の一例を示す図である。
ステップS1では、文書審査モジュール211は、文書画像データ901が入力された場合、文書画像データ901に対してOCR処理を実行する。
ステップS2では、文書審査モジュール211は、OCR処理の結果及びテンプレート情報221を用いて、各テンプレートに含まれる属性に関するスコアを算出する。後述するように、本実施例では、一つの属性に対して複数のスコアが算出される。文書審査モジュール211は、属性及びスコアを対応付けたOCR要素902を生成する。図9に示す一つの矩形が一つのOCR要素902に対応する。
図10に示すように、OCR要素902は、属性1001、項目値1002、位置1003、及びスコア1004から構成される。
属性1001は、属性の識別名称を格納するフィールドである。項目値1002は、文書から抽出された属性(文字列)を格納するフィールドである。位置1003は、紙面上の属性の位置を格納する。スコア1004は、OCR処理に関連するスコア又はテンプレートを用いて抽出された属性(文字列)に関連するスコア等を格納するフィールド群である。
本実施例では、OCRスコア及び位置スコアが算出される。OCRスコアは、OCR処理の結果を評価するスコアである。例えば、抽出された文字列と登録されている字形との一致の度合いを表す値等である。OCRスコアの値が大きいほど誤読の可能性が低いことを示す。位置スコアは、文書画像データ901における属性の位置と、テンプレートにおける属性の位置とのズレの度合いを表す値である。位置スコアの値が小さいほど、ズレが小さいことを示す。
なお、OCR要素902には、OCRスコア及び位置スコアのいずれか一方のみが含まれてもよい。また、OCR要素902には、属性を含む矩形領域の面積に関する面積スコア、属性の種別が同一である属性間の距離に関連する項目スコア、及び属性の出現回数に関する出現回数スコア等が含まれてもよい。
ステップS3では、文書審査モジュール211は、各テンプレートのOCR要素902に基づいて、文書サマリ情報905の生成に適したテンプレートを選択する。テンプレートの選択は、例えば位置スコアの合計値が最大となるテンプレートを選択する方法等が考えられる。
さらに、文書審査モジュール211は、選択されたテンプレートに含まれる各属性の種別のOCR要素902の中から代表OCR要素903を選択する。図9に示す一つの矩形が一つの代表OCR要素903に対応する。選択されたテンプレートに三種類の属性が含まれる場合、三つの代表OCR要素903が選択される。代表OCR要素903の選択方法としては、例えば、ステップS3で選択されたテンプレートに対して位置スコアが最大のOCR要素を選択する方法、又は位置スコア及びOCRスコアの合計値が最大となるOCR要素を選択する方法等が考えられる。
ステップS4では、文書審査モジュール211は、代表OCR要素903を用いて、特徴ベクトル904を算出し、また、文書サマリ情報905を生成する。
本実施例では、各代表OCR要素903に含まれる複数のスコアを要素とするベクトルが特徴ベクトル904として生成される。また、文書サマリ情報905は、代表OCR要素903の属性1001及び項目値1002等をまとめることによって生成される。
ステップS5では、文書審査モジュール211は、特徴ベクトル904を評価式に代入することによって文書サマリ情報905の信頼性を示す評価値を算出し、算出された評価値に基づいてクラスを決定する。なお、評価式のパラメータは、予め設定されているものとする。また、別の方法として、文書審査モジュール211は、予め機械学習を行った分類器に特徴ベクトル904を入力することによってクラスを決定してもよい。
本実施例では、評価値が第1の閾値以上である場合、クラスはケース0に決定される。評価値が第1の閾値より小さく、かつ、第2の閾値以上である場合、クラスはケース1に決定される。評価値が第2の閾値より小さい場合、クラスはケース2に決定される。
ステップS6では、文書審査モジュール211は、リスク回避判定モジュール213に処理の実行を指示することによって、クラスを修正する。文書審査モジュール211は、修正後のクラスに基づいて文書サマリ情報905に対する確認操作を行う。
ケース0に決定された場合、審査者による文書サマリ情報905の確認は行われない。ケース1に決定された場合、一人の審査者が入力文書サマリ情報を生成する。ケース2に決定された場合、二人の審査者がそれぞれ入力文書サマリ情報を生成する。
ステップS8では、文書審査モジュール211は、申請の審査に用いる文書サマリ情報を選択する。
ケース0の場合、文書審査モジュール211が生成した文書サマリ情報905が選択される。
ケース1の場合、文書審査モジュール211は、文書サマリ情報905と、審査者が生成した入力文書サマリ情報とが一致するか否かを判定する。判定結果がYESの場合、文書審査モジュール211は、文書サマリ情報905を選択する。判定結果がNOの場合、文書審査モジュール211は、入力文書サマリ情報を入力した審査者又は他の審査者に、入力文書サマリ情報の修正又は新たな入力文書サマリ情報の生成を促す。この場合、文書審査モジュール211は、修正された入力文書サマリ情報又は新たな入力文書サマリ情報を選択する。
ケース2の場合、文書審査モジュール211は、文書サマリ情報905と、二人の審査者が生成した入力文書サマリ情報とが一致するか否かを判定する。判定結果がYESの場合、文書審査モジュール211は、文書サマリ情報905を選択する。判定結果がNOの場合、文書審査モジュール211は、入力文書サマリ情報を入力したいずれかの審査者又は他の審査者に、入力文書サマリ情報の修正又は新たな入力文書サマリ情報の生成を促す。この場合、文書審査モジュール211は、修正された入力文書サマリ情報又は新たな入力文書サマリ情報を選択する。
図11は、実施例1の文書審査モジュール211が実行する文書サマリ情報生成処理を説明するフローチャートである。
文書審査モジュール211は、文書画像データ901が入力された場合、以下で説明する文書サマリ情報生成処理を開始する。
まず、文書審査モジュール211は、文書画像データ901に対してOCR処理を実行する(ステップS201)。OCR処理は公知の方法を用いればよいため詳細な説明は省略する。OCR処理によって、文書画像データ901は、計算機が扱うことができる文字列群のデータに変換される。
次に、文書審査モジュール211は、テンプレート情報221から一つのテンプレートを選択する(ステップS202)。例えば、文書審査モジュール211は、テンプレート情報221の上のエントリから順に選択する。
次に、文書審査モジュール211は、スコア算出処理を実行する(ステップS203)。スコア算出処理では、文書審査モジュール211は、選択されたテンプレートに含まれる属性の種別毎に、OCR要素902を生成する。また、文書審査モジュール211は、OCR要素902のスコアを算出する。ここで、OCR要素902の生成方法及びスコアの算出方法の一例について説明する。
文書審査モジュール211は、選択されたテンプレートに含まれる属性の種別の中からターゲット属性種別を選択する。すなわち、選択されたテンプレートに対応するエントリに含まれる属性302が一つ選択される。
文書審査モジュール211は、単語辞書222を参照し、OCR処理が実行された文書画像データ901からターゲット属性種別に対応するエントリの文字列402に一致又は類似する属性(文字列)を検索する。このとき、文書審査モジュール211は、図示しない類義語辞書を用いて、文字列402と同一の文字列だけではなく、意味等が一致又は類似する属性(文字列)を検索する。また、文書審査モジュール211は、表記辞書223を参照し、OCR処理が実行された文書画像データ901からターゲット属性種別に対応するエントリの表記502に一致又は類似する属性(文字列)を検索する。
文書審査モジュール211は、空のOCR要素902を生成し、ターゲット属性種別を属性1001に設定する。文書審査モジュール211は、検索された属性を項目値1002に設定し、検索された属性の位置を位置1003に設定する。この時点では、検索された一つの属性に対して、一つのOCR要素902が生成される。
文書審査モジュール211は、OCR要素902の位置1003に基づいて、検索された文字列間の距離を算出し、距離が閾値以下である文字列のOCR要素902を一つのOCR要素902に統合する。この場合、統合されたOCR要素902の項目値802及び位置803には、複数の値が設定される。
単語辞書222及び表記辞書223のいずれを用いても属性が抽出されなかった場合、文書審査モジュール211は、属性801にターゲット属性種別を設定し、項目値802及び位置803を空欄に設定し、スコア804の全ての値を「0」に設定する。
文書審査モジュール211は、単語辞書222及び項目値1002を参照し、ターゲット属性種別に対応するエントリの文字列402と、単語辞書222を用いて抽出された属性とを比較し、比較結果に基づいてスコアを算出する。また、文書審査モジュール211は、表記辞書223及び項目値1002を参照し、ターゲット属性種別に対応するエントリの表記502と、表記辞書223を用いて抽出された属性とを比較し、比較結果に基づいてスコアを算出する。例えば、表記502の少なくとも一つの表記と属性との一致度がスコアとして算出される。文書審査モジュール211は、二つのスコアの合計値をOCRスコアに設定する。
文書審査モジュール211は、位置1003及びターゲット属性種別に対応する行の位置情報303を用いて属性の位置の誤差を算出し、当該誤差に基づいて位置スコアを算出する。例えば、誤差をパラメータとする数式を用いて位置スコアが算出される。
文書審査モジュール211は、選択されたテンプレートに含まれる全ての属性種別について同様の処理を実行する。文書サマリ情報生成処理の説明に戻る。
次に、文書審査モジュール211は、全てのテンプレートについて処理が完了したか否かを判定する(ステップS204)。
全てのテンプレートについて処理が完了していないと判定された場合、文書審査モジュール211は、ステップS202に戻り、同様の処理を実行する。
全てのテンプレートについて処理が完了したと判定された場合、文書審査モジュール211は、代表OCR要素選択処理を実行する(ステップS205)。
代表OCR要素選択処理では、文書審査モジュール211は、テンプレートに含まれる各属性種別の候補OCR要素を選択する。文書審査モジュール211は、テンプレートを用いて抽出された属性の抽出精度を評価するための値である比較値を算出する。文書審査モジュール211は、各テンプレートの比較値を用いて代表テンプレートを選択し、また、代表テンプレートに対応する候補OCR要素を代表OCR要素903として選択する。
次に、文書審査モジュール211は、代表OCR要素903を用いて、特徴ベクトル904を生成し(ステップS206)、また、文書サマリ情報905を生成する(ステップS207)。
次に、文書審査モジュール211は、評価値を算出するための特徴ベクトル評価処理を実行し(ステップS208)、評価値に基づいてクラスを決定する。
次に、文書審査モジュール211は、クラス修正処理を実行する(ステップS209)。
具体的には、文書審査モジュール211は、リスク回避判定モジュール213にクラス修正処理の開始を指示する。クラス修正処理の詳細は、図12を用いて説明する。文書審査モジュール211は、リスク回避判定モジュール213から処理の完了通知を受け付けるまで待ち状態に移行する。
次に、文書審査モジュール211は、修正後のクラスがケース0、ケース1、及びケース2のいずれであるかを判定する(ステップS210)。
クラスがケース0の場合、文書審査モジュール211は、ステップS207において生成された文書サマリ情報905を出力する(ステップS215)。その後、文書審査モジュール211は処理を終了する。
クラスがケース1の場合、文書審査モジュール211は、一人の審査者が生成したテンプレート及び入力文書サマリ情報の入力を受け付ける(ステップS211、ステップS212)。その後、文書審査モジュール211は、文書サマリ情報905及び入力文書サマリ情報が一致する場合、文書サマリ情報905を出力する(ステップS215)。なお、文書サマリ情報905及び入力文書サマリ情報が一致しない場合、文書審査モジュール211は、入力文書サマリ情報を出力する(ステップS215)。
クラスがケース2の場合、文書審査モジュール211は、二人の審査者が生成したテンプレート及び入力文書サマリ情報の入力を受け付ける(ステップS213、ステップS214)。その後、文書審査モジュール211は、文書サマリ情報905及び入力文書サマリ情報が一致する場合、文書サマリ情報905を出力する(ステップS215)。なお、文書サマリ情報905及び入力文書サマリ情報が一致しない場合、文書審査モジュール211は、入力文書サマリ情報を出力する(ステップS215)。
図12は、実施例1のリスク回避判定モジュール213が実行するリスク回避判定処理を説明するフローチャートである。
リスク回避判定モジュール213は、リスク特定ルール管理情報224に登録されたリスク特定ルールの中から使用するリスク特定ルールを一つ選択する(ステップS301)。
リスク回避判定モジュール213は、選択されたリスク特定ルールに対応する種別のリスクが文書に存在するか否かを判定する(ステップS302)。
具体的には、リスク回避判定モジュール213は、文書サマリ情報905及びOCR要素902のいずれかを参照し、リスク特定ルールによって定義された文字列又は文字列の条件を満たす文字列が存在するか否かを判定する。リスク特定ルールによって定義された文字列又は文字列の条件を満たす文字列が存在する場合、リスク回避判定モジュール213は、選択されたリスク特定ルールに対応する種別のリスクが文書に存在すると判定する。
選択されたリスク特定ルールに対応する種別のリスクが文書に存在しないと判定された場合、リスク回避判定モジュール213は、ステップS304に進む。
選択されたリスク特定ルールに対応する種別のリスクが文書に存在すると判定された場合、リスク回避判定モジュール213は、リスクの種別に対応するフラグを設定する(ステップS303)。その後、リスク回避判定モジュール213は、ステップS304に進む。
本実施例では、リスク特定ルール毎にフラグが存在する。なお、リスク回避判定モジュール213は、フラグの代わりに、リスク特定ルールの識別情報を主記憶装置202に格納してもよい。
ステップS304では、リスク回避判定モジュール213は、リスク特定ルール管理情報224に登録されている全てのリスク特定ルールについて処理が完了したか否かを判定する(ステップS304)。
全てのリスク特定ルールについて処理が完了していないと判定された場合、リスク回避判定モジュール213は、ステップS301に戻り、同様の処理を実行する。
全てのリスク特定ルールについて処理が完了したと判定された場合、リスク回避判定モジュール213は、修正ルール管理情報225を参照して、該当する修正ルールが存在するか否かを判定する(ステップS305)。具体的には以下のような処理が実行される。
リスク回避判定モジュール213は、現在のクラスがクラス条件701に一致するエントリを検索する。リスク回避判定モジュール213は、フラグの値に基づいて、検索されたエントリの条件式702を満たすか否かを判定する。検索されたエントリの条件式702を満たす場合、リスク回避判定モジュール213は、該当する修正ルールが存在すると判定する。
該当する修正ルールが存在しないと判定された場合、リスク回避判定モジュール213は、リスク回避判定処理を終了する。
該当する修正ルールが存在すると判定された場合、リスク回避判定モジュール213は、該当する修正ルールにしたがって、クラスを修正する(ステップS306)。その後、リスク回避判定モジュール213はリスク回避判定処理を終了する。
具体的には、リスク回避判定モジュール213は、現在のクラスを、修正クラス703に設定されたクラスに変更する。
ここで、具体例を用いてクラス修正処理を説明する。なお、計算機100には図6に示すリスク特定ルール管理情報224及び図7に示す修正ルール管理情報225が設定されているものとする。
請求人名として「A株式会社」が含まれ、かつ、請求金額として「6万円」が含まれる文書を考える。
この場合、管理テーブル600−1の一番目のエントリの条件を満たす。したがって、リスク回避判定モジュール213は、管理テーブル600−1に対応する種別のリスクが存在すると判定し、管理テーブル600−2に対応する種別のリスクは存在しないと判定する。また、リスク回避判定モジュール213は、管理テーブル600−1に対応するフラグを設定する。
修正前のクラスが「ケース0」である場合、修正ルール管理情報225の二番目のエントリに対応する修正ルールに該当するため、リスク回避判定モジュール213は、クラスを「ケース0」から「ケース1」に修正する。
次に、図13から図17を用いてリスク特定ルールの生成方法について説明する。
図13は、実施例1の学習処理モジュール212が実行する学習用データ蓄積処理の一例を説明するフローチャートである。
審査が終了し、審査者が審査結果を確認し、審査結果が正しいか否かを判定した後、学習処理モジュール212は以下で説明する処理を実行する。
学習処理モジュール212は、OCR処理の結果及び審査に使用された文書サマリ情報を取得する(ステップS401)。
次に、学習処理モジュール212は、OCR処理によって抽出された文字列に対して形態素解析を実行し、単語の集合を取得する(ステップS402)。なお、学習処理モジュール212は、形態素解析を実行せずに、属性の集合をそのまま単語の集合として取得してもよい。
次に、学習処理モジュール212は、審査結果に対する正誤判定の結果が「正解」であるか否かを判定する(ステップS403)。
審査結果に対する正誤判定の結果が「正解」であると判定された場合、学習処理モジュール212は、正解の文書のグループに、請求者名、並びに、請求金額及び単語等の文字列の集合を対応づけた学習用データを追加し(ステップS404)、処理を終了する。
審査結果に対する正誤判定の結果が「誤判定」であると判定された場合、学習処理モジュール212は、誤判定の文書のグループに、請求者名、並びに、請求金額及び単語等の文字列の集合を対応づけた学習用データを追加し(ステップS405)、処理を終了する。
なお、前述した処理は、クラスがケース1又はケース2である文書のみを対象としてもよい。
図14は、実施例1のルール生成モジュール214が実行する推奨金額提示処理の一例を説明するフローチャートである。
ルール生成モジュール214は、請求者名及び基準金額を取得する(ステップS501)。請求者名及び基準金額は、後述する設定画面1500(図15を参照)を介して入力される。
次に、ルール生成モジュール214は、学習用データを用いて、判定指標を算出する(ステップS502)。ルール生成モジュール214は、算出された判定指標を設定画面1500に表示する。
本発明は判定指標の種類に限定されない。判定指標は例えば以下のようなものが考えられる。ルール生成モジュール214は、正解の文書のグループ及び誤判定の文書のグループに含まれる文書のうち、基準金額以下の金額を含む文書の割合を第1判定指標(自動化率)として算出する。また、ルール生成モジュール214は、誤判定の文書のグループに含まれる文書のうち、基準金額以下の金額を含む文書の割合を第2判定指標(誤判定率)として算出する。
次に、ルール生成モジュール214は、判定指標と目標値とを比較することによって、ユーザ基準を満たすか否かを判定する(ステップS503)。
例えば、判定指標が目標値に一致する場合、判定指標が目標値より大きい場合、又は判定指標が目標値より小さい場合等に、ユーザ基準を満たすと判定される。なお、目標値及びユーザ基準は任意に設定できる。前述の第1判定指標及び第2判定指標を用いた判定の場合、第1判定指標及び第2判定指標のいずれかが条件を満たさない場合、ユーザ基準を満たさないと判定される。
ユーザ基準を満たさないと判定された場合、ルール生成モジュール214は、基準金額を変更し(ステップS504)、その後、ステップS502に戻り、同様の処理を実行する。本発明は、基準金額の変更方法に限定されない。例えば、ルール生成モジュール214は、現在の基準金額に一定金額を加算又は減算する。また、ルール生成モジュール214は、設定画面1500に新たな基準金額の入力を促す表示を行ってもよい。
ユーザ基準を満たすと判定された場合、ルール生成モジュール214は、現在の基準金額を推奨金額として設定画面1500に表示する(ステップS505)。その後、ルール生成モジュール214は処理を終了する。
図15は、実施例1の計算機100が表示する設定画面1500の一例を示す図である。
設定画面1500は、管理テーブル600−1に対応するリスク特定ルールを設定するための画面である。設定画面1500は、基準金額設定欄1510、実行ボタン1520、登録ボタン1530、グラフ表示欄1540、指標値表示欄1550、及び推奨金額表示欄1560を含む。
基準金額設定欄1510は、請求者名及び基準金額を設定するための欄である。実行ボタン1520は、ルール生成モジュール214に推奨金額提示処理の実行を指示するためのボタンである。登録ボタン1530は、請求者名及び基準金額の組合せを管理テーブル600−1に登録するためのボタンである。
グラフ表示欄1540は、推奨金額を視覚的に表示するための欄である。グラフ表示欄1540には、請求金額ごとの、正解のグループに含まれる文書及び誤判定のグループに含まれる文書の分布が表示される。
指標値表示欄1550は、ルール生成モジュール214によって算出された判定指標の値を表示するための欄である。本実施例では、自動化率及び誤判定率が指標値表示欄1550に表示される。
推奨金額表示欄1560は、目標値及び推奨金額を表示するための欄である。本実施例では、自動化率の目標値である目標自動化率、推奨金額、及び推定誤判定率が推奨金額表示欄1560に表示される。推定誤判定率は、目標自動化率を満たす場合の誤判定率を示す。なお、推奨金額表示欄1560は、目標自動化率の代わりに目標誤判定率を含んでもよい。
審査者は、設定画面1500に表示された審査結果の正誤判定の結果の分布及び推奨金額を参照して、基準金額設定欄1510に基準金額を設定し、登録ボタン1530を操作する。この場合、ルール生成モジュール214が、管理テーブル600−1に請求者名及び基準金額を対応づけたエントリを登録する。
図16は、実施例1のルール生成モジュール214が実行する推奨リスク単語提示処理の一例を説明するフローチャートである。
ルール生成モジュール214は、単語のグループの中からターゲット単語を選択する(ステップS601)。
次に、ルール生成モジュール214は、ターゲット単語の判定指標を算出する(ステップS602)。ルール生成モジュール214は、算出された判定指標を設定画面1700(図17を参照)に表示する。
本発明は判定指標の種類に限定されない。例えば、ルール生成モジュール214は、正解の文書であってターゲット単語を含む文書の数及び誤判定の文書であってターゲット単語を含む文書の数に基づいて誤判定率を判定指標として算出する。
次に、ルール生成モジュール214は、単語のグループに含まれる全ての単語について処理が完了したか否かを判定する(ステップS603)。
単語のグループに含まれる全ての単語について処理が完了していないと判定された場合、ルール生成モジュール214は、ステップS601に戻り、同様の処理を実行する。
単語のグループに含まれる全ての単語について処理が完了したと判定された場合、ルール生成モジュール214は、判定指標に基づいて、推奨リスク単語を選択し(ステップS604)、選択された推奨リスク単語を設定画面1700に表示する(ステップS605)。その後、ルール生成モジュール214は処理を終了する。
例えば、ルール生成モジュール214は、誤判定率が大きい順に所定の数の単語を推奨リスク単語として選択する。また、ルール生成モジュール214は、誤判定率が閾値より大きい単語を推奨リスク単語として選択してもよい。
本実施例では、判定指標として誤判定率を使用したがこれに限定されない。例えば、相関係数及びリフト値等を判定指標として用いてもよい。
図17は、実施例1の計算機100が表示する設定画面1700の一例を示す図である。
設定画面1700は、管理テーブル600−2に対応するリスク特定ルールを設定するための画面である。設定画面1700は、リスク単語表示欄1710、推奨リスク単語表示欄1720、実行ボタン1730、及び登録ボタン1740を含む。
リスク単語表示欄1710は、管理テーブル600−2に登録されているリスク単語を表示するための欄である。推奨リスク単語表示欄1720は、推奨リスク単語を表示するための欄である。
実行ボタン1730は、ルール生成モジュール214に推奨リスク単語提示処理の実行を指示するためのボタンである。登録ボタン1740は、リスク単語を管理テーブル600−2に登録するためのボタンである。
審査者は、リスク単語を設定する場合、推奨リスク単語表示欄1720の中から一つ以上の単語を選択し、登録ボタン1740を操作する。この場合、ルール生成モジュール214は、選択された単語を管理テーブル600−2に登録する。
次に、図18を用いてテンプレートの設定方法について説明する。
本実施例では、テンプレート情報221に設定されたテンプレートを用いることによって、文書画像データ901から高い精度で属性を抽出することができる。しかし、様々な形式の文書のテンプレートを予め準備するためには工数がかかるという課題がある。そこで、本実施例の計算機100は、工数の削減のためにテンプレートの作成を支援する。
図18は、実施例1の計算機100が表示するテンプレート入力画面1800の一例を示す図である。
テンプレート入力画面1800は、テンプレートを設定するための画面であり、審査者の要求に応じて任意のタイミングで表示できる。
テンプレート入力画面1800は、文書選択欄1810、選択ボタン1820、属性設定欄1830、追加ボタン1840、位置設定欄1850、及び登録ボタン1860を含む。
文書選択欄1810は、テンプレートの設定対象となる文書を選択するための欄である。文書選択欄1810には、テンプレート設定モジュール215によって決定された文書の一覧が表示される。
選択ボタン1820は、テンプレートの設定対象となる文書を選択するためのボタンである。
属性設定欄1830は、テンプレートに含める属性の種別を設定するための欄である。
追加ボタン1840は、属性設定欄1830に行を追加するためのボタンである。
位置設定欄1850は、属性設定欄1830に設定された属性の種別に対応する属性の紙面上の位置を設定する欄である。
登録ボタン1860は、画面に入力したテンプレートをテンプレート情報221に設定するためのボタンである。
審査者が文書選択欄1810に表示された文書を選択し、選択ボタン1820を操作した場合、位置設定欄1850に選択された文書の文書画像データ901が表示される。また、審査者は、位置設定欄1850に表示される文字列を囲むように矩形領域を選択することによって、属性の位置情報303を設定できる。
なお、文書選択欄1810にて選択された文書に対応する文書サマリ情報905に含まれる代表OCR要素903の位置情報を、位置設定欄1850における各属性の位置情報の初期値として設定し、表示することができる。この場合、審査者は、位置設定欄1850に表示された各属性の位置を確認し、修正する必要がない場合には位置設定欄1850に対応する操作を行わない。これによって、テンプレートの設定に要する工数を削減できる。
審査者が登録ボタン1860を操作した場合、テンプレート設定モジュール215は、テンプレート情報221にエントリを追加し、追加されたエントリのテンプレート番号301に識別番号を設定する。また、テンプレート設定モジュール215は、追加されたエントリに、属性設定欄1830に設定された属性の種別の数と同一数の行を生成し、各行除く属性302に属性設定欄1830の値を設定する。また、テンプレート設定モジュール215は、位置設定欄1850に基づいて、各行の位置情報303に値を設定する。
ここで、文書選択欄1810に表示される文書の決定方法について説明する。
テンプレート設定モジュール215は、文書審査モジュール211が処理した文書の中から、選択可能なテンプレートが存在しない文書又は選択されたテンプレートを用いて算出された位置スコアが予め設定された閾値より小さい文書をテンプレート作成対象の文書として選択し、選択された文書のリストを生成する。テンプレート設定モジュール215は、生成されたリストを文書選択欄1810に表示する。
前述の処理によって、既に存在するテンプレートと属性の位置が類似する文書のテンプレートが生成されないように制御できる。
また、別の決定方法としては、テンプレート設定モジュール215は、前述した方法によって選択されたテンプレート作成対象の文書をグループ化し、各グループの中から一つ以上の文書を選択し、選択された文書のリストを生成する。テンプレート設定モジュール215は、生成されたリストを文書選択欄1810に表示する。グループ化の方法としては、請求者名等の属性の値に基づいてグループ化する方法、文書サマリ情報905に含まれる代表OCR要素903に含まれる位置情報を用いてクラスタリングを行う方法が考えられる。なお、前述した各方法を組み合わせてもよい。
本実施例によれば、計算機100は、スコアに基づいて、最適なテンプレートを選択できる。また、計算機100は、文書サマリ情報905の信頼性を示す評価値に基づいて、文書サマリ情報905の確認操作の種別(クラス)を決定する。さらに、計算機100は、各種別のリスクの有無に基づいて、確認操作の種別を修正する。
これによって、高い精度で自動的に属性を識別でき、業務上の損失を考慮した属性の識別結果の確認を行うことができる。したがって、電子申請の審査におけるリスクの発生を回避しつつ、審査の効率化を実現できる。
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、例えば、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、各実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるプロセッサが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD−ROM、DVD−ROM、ハードディスク、SSD(Solid State Drive)、光ディスク、光磁気ディスク、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。
また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、C/C++、perl、Shell、PHP、Java(登録商標)等の広範囲のプログラム又はスクリプト言語で実装できる。
さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はCD−RW、CD−R等の記憶媒体に格納し、コンピュータが備えるプロセッサが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。
上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。
100 計算機
110 入力端末
120 クライアント端末
130 スキャナ
150 ネットワーク
201 プロセッサ
202 主記憶装置
203 副記憶装置
204 ネットワークインタフェース
205 入力装置
206 出力装置
211 文書審査モジュール
212 学習処理モジュール
213 リスク回避判定モジュール
214 ルール生成モジュール
215 テンプレート設定モジュール
221 テンプレート情報
222 単語辞書
223 表記辞書
224 リスク特定ルール管理情報
225 修正ルール管理情報
901 文書画像データ
902 OCR要素
903 代表OCR要素
904 特徴ベクトル
905 文書サマリ情報

Claims (6)

  1. 任意の審査の対象の文書に含まれる文字列である属性を抽出する計算機であって、
    前記計算機は、プロセッサ及び前記プロセッサに接続される記憶装置を備え、
    前記記憶装置は、少なくとも一つ以上の属性の種別が定義された複数のテンプレートを管理するためのテンプレート情報と、前記審査において発生する可能性があるリスクの種別を特定するための文字列又は文字列の条件を定義するリスク特定ルールを管理するための第1管理情報と、前記審査に用いられる出力情報の確認操作の種別の修正方法を定義する修正ルールを管理するための第2管理情報と、を格納し、
    前記テンプレート情報は、前記テンプレートの識別情報及び前記属性の種別を示す識別情報から構成されるエントリを複数含み、
    前記第1管理情報は、種別が異なる前記リスクに対応する前記リスク特定ルールの情報を格納し、
    前記修正ルールは、修正前の確認操作の種別、特定されたリスクの種別の組合せによって定義される条件式、及び修正後の確認操作の種別から構成され、
    前記プロセッサは、
    前記文書の画像データに対して文字認識処理を実行し、
    前記文字認識処理の結果及び前記複数のテンプレートを用いて、前記複数のテンプレートの各々に定義された前記属性の種別に対応する属性を抽出し、
    前記抽出された属性に基づいてテンプレートを選択し、
    前記選択されたテンプレートを用いて抽出された属性を含む、前記出力情報を生成し、
    前記生成された出力情報の信頼性を示す評価値を算出し、
    前記評価値及び閾値の比較結果に基づいて、前記審査が行われる前に前記生成された出力情報に対して行われる確認操作の種別を決定し、
    前記文書に含まれる文字列に基づいて、前記決定された確認操作の種別の修正が必要であるか否かを判定し、
    前記決定された確認操作の種別の修正が必要であると判定された場合、前記決定された確認操作の種別を修正し、
    前記決定された確認操作の種別の修正が必要であるか否かを判定する処理では、前記プロセッサが、
    前記第1管理情報及び前記生成された出力情報に基づいて、前記文書に存在するリスクの種別を特定し、
    前記確認操作の種別及び前記特定されたリスクの種別の組合せに基づいて前記第2管理情報を参照して、該当する修正ルールが存在するか否かを判定し、
    前記決定された確認操作の種別を修正する処理では、前記プロセッサが、前記該当する修正ルールが存在すると判定された場合、前記該当する修正ルールに基づいて、前記確認操作の種別を修正することを特徴とする計算機。
  2. 請求項1に記載の計算機であって、
    前記プロセッサは、
    前記文書から抽出された属性、及び前記確認操作の種別にしたがって操作された出力情報を用いた審査の結果を対応づけた学習用データを、前記記憶装置に格納し、
    前記学習用データを用いて学習処理を実行することによって、任意の種別のリスクが発生する可能性がある文字列又は文字列の条件を表示する表示情報を生成し、
    前記生成された表示情報を出力することを特徴とする計算機。
  3. 請求項1に記載の計算機であって、
    前記第1管理情報は、数値に対応する文字列の大小関係の条件を定義するリスク特定ルールを含むことを特徴とする計算機。
  4. 任意の審査の対象の文書に含まれる文字列である属性を抽出する計算機が実行する文書識別方法であって、
    前記計算機は、プロセッサ及び前記プロセッサに接続される記憶装置を備え、
    前記記憶装置は、少なくとも一つ以上の属性の種別が定義された複数のテンプレートを管理するためのテンプレート情報と、前記審査において発生する可能性があるリスクの種別を特定するための文字列又は文字列の条件を定義するリスク特定ルールを管理するための第1管理情報と、前記審査に用いられる出力情報の確認操作の種別の修正方法を定義する修正ルールを管理するための第2管理情報と、を格納し、
    前記テンプレート情報は、前記テンプレートの識別情報及び前記属性の種別を示す識別情報から構成されるエントリを複数含み、
    前記第1管理情報は、種別が異なる前記リスクに対応する前記リスク特定ルールの情報を格納し、
    前記修正ルールは、修正前の確認操作の種別、特定されたリスクの種別の組合せによって定義される条件式、及び修正後の確認操作の種別から構成され、
    前記文書識別方法は、
    前記プロセッサが、前記文書の画像データに対して文字認識処理を実行する第1のステップと、
    前記プロセッサが、前記文字認識処理の結果及び前記複数のテンプレートを用いて、前記複数のテンプレートの各々に定義された前記属性の種別に対応する属性を抽出する第2のステップと、
    前記プロセッサが、前記抽出された属性に基づいてテンプレートを選択する第3のステップと、
    前記プロセッサが、前記選択されたテンプレートを用いて抽出された属性を含む、前記出力情報を生成する第4のステップと、
    前記プロセッサが、前記生成された出力情報の信頼性を示す評価値を算出する第5のステップと、
    前記プロセッサが、前記評価値及び閾値の比較結果に基づいて、前記審査が行われる前に前記生成された出力情報に対して行われる確認操作の種別を決定する第6のステップと、
    前記プロセッサが、前記文書に含まれる文字列に基づいて、前記決定された確認操作の種別の修正が必要であるか否かを判定する第7のステップと、
    前記プロセッサが、前記決定された確認操作の種別の修正が必要であると判定された場合、前記決定された確認操作の種別を修正する第8のステップと、を含み、
    前記第7のステップは、
    前記プロセッサが、前記第1管理情報及び前記生成された出力情報に基づいて、前記文書に存在するリスクの種別を特定するステップと、
    前記プロセッサが、前記確認操作の種別及び前記特定されたリスクの種別の組合せに基づいて前記第2管理情報を参照して、該当する修正ルールが存在するか否かを判定するステップと、を含み、
    前記第8のステップは、前記プロセッサが、前記該当する修正ルールに基づいて、前記確認操作の種別を修正するステップを含むことを特徴とする文書識別方法。
  5. 請求項4に記載の文書識別方法であって、
    前記プロセッサが、前記文書から抽出された属性、及び前記確認操作の種別にしたがって操作された出力情報を用いた審査の結果を対応づけた学習用データを、前記記憶装置に格納するステップと、
    前記プロセッサが、前記学習用データを用いて学習処理を実行することによって、任意の種別のリスクが発生する可能性がある文字列又は文字列の条件を表示する表示情報を生成するステップと、
    前記プロセッサが、前記生成された表示情報を出力するステップと、を含むことを特徴とする文書識別方法。
  6. 請求項4に記載の文書識別方法であって、
    前記第1管理情報は、数値に対応する文字列の大小関係の条件を定義するリスク特定ルールを含むことを特徴とする文書識別方法。
JP2017214170A 2017-11-06 2017-11-06 計算機及び文書識別方法 Active JP6871840B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2017214170A JP6871840B2 (ja) 2017-11-06 2017-11-06 計算機及び文書識別方法
CN201810962608.0A CN109753964B (zh) 2017-11-06 2018-08-22 计算机以及文件识别方法
US16/117,198 US10783366B2 (en) 2017-11-06 2018-08-30 Computer and document identification method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017214170A JP6871840B2 (ja) 2017-11-06 2017-11-06 計算機及び文書識別方法

Publications (2)

Publication Number Publication Date
JP2019086984A JP2019086984A (ja) 2019-06-06
JP6871840B2 true JP6871840B2 (ja) 2021-05-19

Family

ID=66327320

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017214170A Active JP6871840B2 (ja) 2017-11-06 2017-11-06 計算機及び文書識別方法

Country Status (3)

Country Link
US (1) US10783366B2 (ja)
JP (1) JP6871840B2 (ja)
CN (1) CN109753964B (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6938228B2 (ja) * 2017-05-31 2021-09-22 株式会社日立製作所 計算機、文書識別方法、及びシステム
CN110321423B (zh) * 2019-05-31 2023-03-31 创新先进技术有限公司 一种文本数据的风险识别方法及服务器
JP7364998B2 (ja) * 2019-06-26 2023-10-19 京セラドキュメントソリューションズ株式会社 文書分類システムおよび文書分類プログラム
WO2021007088A1 (en) * 2019-07-05 2021-01-14 Elsevier, Inc. Systems and methods to extract the context of scientific measurements using targeted question answering
JP2021039494A (ja) * 2019-09-02 2021-03-11 富士ゼロックス株式会社 情報処理装置及びプログラム
JP7463675B2 (ja) * 2019-09-03 2024-04-09 富士フイルムビジネスイノベーション株式会社 情報処理装置、及び情報処理プログラム
JP6722929B1 (ja) * 2019-09-27 2020-07-15 AI inside株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP7443012B2 (ja) * 2019-10-03 2024-03-05 キヤノン株式会社 メタデータを設定するための設定方法、プログラム、装置
JP6712738B1 (ja) * 2019-10-31 2020-06-24 株式会社日本デジタル研究所 証憑判定装置、会計処理装置、証憑判定プログラム、証憑判定システム及び証憑判定方法
CN111144334B (zh) * 2019-12-27 2023-09-26 北京天融信网络安全技术有限公司 一种文件匹配方法、装置、电子设备及存储介质
CN111126029B (zh) * 2019-12-31 2020-12-04 广州市昊链信息科技股份有限公司 一种电子单据的生成方法、装置、计算机设备和存储介质
JP6842219B1 (ja) * 2020-04-30 2021-03-17 株式会社日本デジタル研究所 会計処理装置、会計処理プログラム、会計処理システム及び会計処理方法
JP6912841B2 (ja) * 2020-04-30 2021-08-04 株式会社日本デジタル研究所 証憑判定装置、会計処理装置、証憑判定プログラム、証憑判定システム及び証憑判定方法
US11755973B2 (en) * 2021-02-12 2023-09-12 Accenture Global Solutions Limited System and method for intelligent contract guidance
CN113434672B (zh) * 2021-06-24 2023-12-19 中核深圳凯利集团有限公司 文本类型智能识别方法、装置、设备及介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0601107A4 (en) * 1991-08-30 1995-03-15 Trw Financial Systems Inc METHOD AND APPARATUS FOR CONVERTING DOCUMENT BETWEEN PAPER MEDIUM AND ELECTRONIC MEDIA.
US5251273A (en) * 1992-04-15 1993-10-05 International Business Machines Corporation Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms
JPH07296102A (ja) * 1994-04-27 1995-11-10 Hitachi Ltd データ入力方式
US5644656A (en) * 1994-06-07 1997-07-01 Massachusetts Institute Of Technology Method and apparatus for automated text recognition
US8165958B1 (en) 1999-03-26 2012-04-24 Metavante Corporation Electronic bill presentation and payment method and system
JP2002230479A (ja) * 2001-01-30 2002-08-16 Tokio Marine & Fire Insurance Co Ltd コンピュータ・システム並びに帳票処理方法及びプログラム
US7668718B2 (en) * 2001-07-17 2010-02-23 Custom Speech Usa, Inc. Synchronized pattern recognition source data processed by manual or automatic means for creation of shared speaker-dependent speech user profile
JP2007109051A (ja) * 2005-10-14 2007-04-26 Seiko Epson Corp 帳票識別装置
JP2011215728A (ja) * 2010-03-31 2011-10-27 Toshiba Corp 書類管理システム、判定装置、データ出力制御装置、書類管理方法、書類管理プログラム
JP2016048444A (ja) * 2014-08-27 2016-04-07 沖電気工業株式会社 帳票識別プログラム、帳票識別装置、帳票識別システム、および帳票識別方法
JP6050843B2 (ja) * 2015-01-30 2016-12-21 株式会社Pfu 情報処理装置、方法およびプログラム
US10534968B1 (en) * 2015-04-16 2020-01-14 State Farm Mutual Automobile Insurance Company Verifying odometer mileage using captured images and optical character recognition (OCR)
JP6938228B2 (ja) * 2017-05-31 2021-09-22 株式会社日立製作所 計算機、文書識別方法、及びシステム

Also Published As

Publication number Publication date
US10783366B2 (en) 2020-09-22
US20190138804A1 (en) 2019-05-09
CN109753964B (zh) 2023-02-21
CN109753964A (zh) 2019-05-14
JP2019086984A (ja) 2019-06-06

Similar Documents

Publication Publication Date Title
JP6871840B2 (ja) 計算機及び文書識別方法
JP6938228B2 (ja) 計算機、文書識別方法、及びシステム
US10366123B1 (en) Template-free extraction of data from documents
JP6268352B2 (ja) 会計データ入力システム、方法、およびプログラム
JP6938408B2 (ja) 計算機及びテンプレート管理方法
JP5385349B2 (ja) レシート定義データ作成装置およびそのプログラム
US20140169665A1 (en) Automated Processing of Documents
JP5702342B2 (ja) レシート定義データ作成装置およびプログラム
JP2017054469A (ja) データ管理システム、方法およびプログラム
US20120179702A1 (en) Method for setting metadata, system for setting metadata, and program
CN112487859A (zh) 信息处理装置、信息处理方法和计算机可读介质
JP2019191665A (ja) 財務諸表読取装置、財務諸表読取方法及びプログラム
JP5895876B2 (ja) プログラム及び帳票処理装置
JP5550959B2 (ja) 文書処理システム、及びプログラム
JP6993032B2 (ja) 会計処理装置、会計処理システム、会計処理方法及びプログラム
JP5304397B2 (ja) 帳票処理装置及び帳票処理プログラム
JP7312646B2 (ja) 情報処理装置、文書識別方法、及び情報処理システム
JP2022029398A (ja) データ処理装置、データ処理方法及びデータ処理プログラム
JP2001005886A (ja) データ処理装置及び記憶媒体
TW202115603A (zh) 文字候補提案裝置、手寫文字識別系統、手寫文字識別方法及程式
JP2006252575A (ja) 財務諸表自動入力装置及び財務諸表自動入力方法
WO2023062798A1 (ja) 情報処理システム、項目値抽出方法、モデル生成方法及びプログラム
JP6858420B1 (ja) 会計処理装置、会計処理システム、会計処理方法及びプログラム
JP7273911B2 (ja) 原稿審査支援方法、装置、プログラム、および辞書システム
TWM655760U (zh) 用於處理發票資料的系統

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200312

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210310

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210413

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210416

R150 Certificate of patent or registration of utility model

Ref document number: 6871840

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150