JP7380653B2 - 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム - Google Patents

情報処理装置、情報処理方法、情報処理プログラム、情報処理システム Download PDF

Info

Publication number
JP7380653B2
JP7380653B2 JP2021091517A JP2021091517A JP7380653B2 JP 7380653 B2 JP7380653 B2 JP 7380653B2 JP 2021091517 A JP2021091517 A JP 2021091517A JP 2021091517 A JP2021091517 A JP 2021091517A JP 7380653 B2 JP7380653 B2 JP 7380653B2
Authority
JP
Japan
Prior art keywords
item
information
search
unit
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021091517A
Other languages
English (en)
Other versions
JP2022183952A (ja
Inventor
遼 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2021091517A priority Critical patent/JP7380653B2/ja
Priority to US17/747,386 priority patent/US20220382804A1/en
Priority to EP22175036.7A priority patent/EP4099189A1/en
Publication of JP2022183952A publication Critical patent/JP2022183952A/ja
Application granted granted Critical
Publication of JP7380653B2 publication Critical patent/JP7380653B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/54Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/908Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Character Discrimination (AREA)

Description

本発明は、帳票の認識を行う情報処理装置、情報処理方法、情報処理プログラム、情報処理システムに関する。
従来では、文字認識処理において、判読困難な文字を類似した文字のセットにグループ化し、候補文字のセットに基づいて、判読困難な文字に適合する正しい文字を推定して置換する技術が知られている。
上述した従来の文字認識処理を、例えば、帳票認識に適用した場合、帳票から抽出される文字列の精度が担保されず、帳票認識の精度が低下する可能性がある。
本発明は、上記事情に鑑みて成されたものであり、帳票認識の精度をより向上させることを目的としている。
開示の技術は、帳票画像データから抽出した文字列群に含まれる第一の項目名と対応する、第一の項目情報を検索キーとした検索要求を検索エンジンに出力する検索要求部と、前記検索エンジンから取得した検索結果に基づき、前記文字列群に含まれる第二の項目名と対応する、第二の項目情報を特定する特定部と、前記帳票画像データと対応する帳票の一覧を端末装置に表示させる際に、前記検索エンジンから取得した検索結果を用いて特定された前記第二の項目情報を含む認識結果データと、前記第二の項目情報が文字認識によって取得された認識結果データと、で表示態様を異ならせる表示制御部と、を有する情報処理装置である。
帳票認識の精度をより向上させることができる。
帳票認識システムのシステム構成の一例を示す図である。 サーバ装置のハードウェア構成の一例を示す図である。 サーバ装置のハードウェア構成の一例を示す図である。 抽出定義データベースの一例を示す図である。 辞書データベースの一例を示す図である。 抽出結果管理データベースの一例を示す図である。 検索履歴管理データベースの一例を示す図である。 テナントデータベースの一例を示す図である。 サーバ装置の機能を説明する図である。 端末装置の機能を説明する図である。 帳票認識システムの動作を説明する第一のシーケンス図である。 ジョブリストの一例を示す図である。 帳票認識システムの動作を説明する第二のシーケンス図である。 帳票認識処理部の処理を説明する第一のフローチャートである。 読取結果情報の一例を示す図である。 帳票認識処理部の処理を説明する第二のフローチャートである。 法人情報管理テーブルの一例を示す図である。 抽出結果管理データベースの項目値の更新について説明する図である。 表示例を示す第一の図である。 表示例を示す第二の図である。 表示例を示す第三の図である。
以下に図面を参照して、実施形態について説明する。図1は、帳票認識システムのシステム構成の一例を示す図である。
本実施形態の帳票認識システム100は、サーバ装置200、画像形成装置300、端末装置400を有する。本実施形態の帳票認識システム100において、サーバ装置200と、画像形成装置300と、端末装置400とは、ネットワークを介して接続される。
また、本実施形態のサーバ装置200は、ネットワークを介して外部サーバ600と通信を行う、外部サーバ600は、例えば、一般に公開された情報を保持するサーバ装置である。
また、本実施形態の端末装置400は、例えば、ネットワークを介して基幹システム500と接続される。基幹システム500とは、例えば、本実施形態の帳票認識システム100において帳票を認識した結果を用いて、特定の処理を行うシステムである。
本実施形態では、請求書を帳票の一例として説明する。また、以下の説明では、帳票認識システム100は、請求書を読み取った帳票画像から、請求書を発行した請求元と、請求金額を示す情報(請求書情報)を含む情報を抽出するものとして説明する。また、帳票認識システム100は、帳票画像から、請求書の明細を示す明細情報を抽出してもよい。
また、帳票が請求書である場合、基幹システム500は、金融機関に対する請求額の振込等を行う会計システムであってもよい。
本実施形態の帳票認識システム100において、サーバ装置200は、画像形成装置300のスキャナ機能によって読み取られた帳票の画像を示す画像データを取得する。また、サーバ装置200は、端末装置400から、帳票の画像を示す画像データを受信してもよい。
サーバ装置200は、帳票の画像を示す帳票画像データを取得すると、帳票に含まれる項目と項目の値とを抽出し、項目と項目の値とを対応付けたテキストデータとする。
以下の説明では、帳票の画像を帳票画像と呼び、帳票画像を示す画像データを帳票画像データと呼ぶ。
また、以下の説明では、帳票画像に含まれる項目の名称(項目名)と、この項目の項目情報としての値(項目値)とを抽出し、項目名と項目値とをテキストデータに変換して対応付けることを、帳票認識と呼ぶ。
本実施形態のサーバ装置200は、記憶部220と、帳票認識処理部230とを有する。記憶部220には、画像データベース240、抽出定義データベース250、辞書データベース260、抽出結果管理データベース270、検索履歴管理データベース280、認識結果データベース294、テナントデータベース295が設けられている。
画像データベース240は、帳票画像データが格納される。抽出定義データベース250は、抽出定義情報が格納される。抽出定義情報は、帳票画像から請求書情報に含まれる文字列を抽出する際に、帳票認識処理部230に参照される。
辞書データベース260は、請求書の発行元を特定するための辞書情報が格納される。言い換えれば、辞書データベース260は、帳票に含まれる所定の項目名と対応する項目値を特定するための辞書情報が格納されるものであり、所定の項目名と対応する項目値とは、帳票の発行元である。辞書情報は、帳票認識システム100の利用者に入力される情報である。したがって、辞書データベース260は、帳票認識システム100の利用者によって作成されるものと言える。
抽出結果管理データベース270は、帳票認識処理部230による帳票認識処理により、帳票から抽出された結果が格納される。具体的には、抽出結果管理データベース270には、帳票から抽出された項目名と項目値とが対応付けられて格納される。また、抽出結果管理データベース270は、テナント毎に設けられてよい。
検索履歴管理データベース280は、帳票認識処理部230による帳票認識処理において行われた検索の履歴を示す検索履歴情報が格納される。
認識結果データベース294は、帳票認識処理部230による帳票認識の結果を示す認識結果データが格納される。尚、認識結果データベース294は、テナント毎に設けられてよい。テナントデータベース295は、テナントに関するテナント情報が格納される。
尚、本実施形態におけるテナントとは、例えば、企業等である。より具体的には、例えば、テナントとは、帳票認識システム100が提供するサービスを利用するための契約を締結している事業者や企業、団体等である。
本実施形態の帳票認識処理部230は、画像データベース240に格納された帳票画像データを取得し、文字認識を行って、帳票画像に含まれる文字列群を抽出する。そして、帳票認識処理部230は、抽出定義データベース250に格納された抽出定義情報を参照して、文字列群から、請求書情報に含まれる文字列を抽出し、抽出結果を抽出結果管理データベース270に格納する。
さらに、本実施形態の帳票認識処理部230は、抽出定義情報を参照して請求書情報を抽出した後に、特定の項目名の項目値の信憑性を、特定の項目値と関連する他の項目名の項目値を検索キーとした検索結果を用いて検証する。具体的には、帳票認識処理部230は、他の項目値で辞書データベース260を検索し、検索結果を用いて特定の項目名の項目値の信憑性を検証する。
また、帳票認識処理部230は、特定の項目名の項目値の信憑性が低いか、又は、特定の項目値が抽出されていない場合に、他の項目値で検索エンジンを検索し、検索結果の信憑性を検証し、検証結果に応じて特定の項目名の項目値を特定する。
つまり、本実施形態の帳票認識処理部230は、帳票画像データから取得した文字列群に含まれる第一の項目名(他の項目名)と対応する第一の項目値を検索キーとする検索要求を検索エンジンに出力する。そして、帳票認識処理部230は、検索結果を用いて、文字列群に含まれる第二の項目名(特定の項目名)と対応する第二の項目値を特定する。
次に、帳票認識処理部230は、特定された項目値(第二の項目値)を、抽出結果管理データベース270に格納された特定の項目名(第二の項目名)の項目値に特定する。
また、本実施形態の帳票認識処理部230は、抽出結果管理データベース270に格納された抽出結果情報を、帳票認識処理部230による帳票認識の結果を示す認識結果データの一部として認識結果データベース294に格納する。
本実施形態では、このように、帳票認識において、辞書データベース260や検索エンジンを項目名で検索した結果を用いて項目値が正しい値あるか否かを検証し、検証結果に応じて、項目値を項目名と対応付けて抽出結果管理データベース270に格納する。そして、本実施形態では、抽出結果管理データベース270に格納された抽出結果情報を、認識結果情報に含める。
したがって、本実施形態では、抽出定義情報を参照した請求書情報の抽出において、正しい項目値が取得される可能性を向上させることができる。つまり、本実施形態によれば、帳票認識の精度を向上させることができる。
以下の本実施形態の説明では、第一の項目名を項目名「電話番号」とし、第一の項目名と対応する第一の項目値を、項目名「電話番号」の項目値とする。また、本実施形態の以下の説明では、第二の項目名を項目名「請求元」とし、第二の項目名とし対応する第二の項目値を、項目名「請求元」の項目値とする。
項目名「請求元」の項目値が正しく抽出されない場合とは、例えば、請求書の発行元(請求元)である会社名が記載された部分に社判が押印されており、会社名を示す文字列と印影が重なっている場合がある。この場合、抽出定義情報を用いて文字認識を行っても、項目名「請求元」の項目値である会社名は正しく抽出されない可能性がある。
また、例えば、会社名が、文字列でなく、ロゴ等で標記されている場合も、文字認識では会社名は正しく抽出されない可能性が高い。
本実施形態では、このように、項目名と対応する項目値が文字認識によって正しく抽出されなかった場合であっても、他の項目名と対応する項目値に基づいて、正しく抽出されなかった項目値を特定する。したがって、本実施形態によれば、帳票認識の精度をより向上させることができる。
本実施形態の帳票認識システム100において、画像形成装置300は、スキャナ機能を有する複合機である。画像形成装置300は、コピー機能、FAX機能、スキャナ機能等を実現するためのアプリケーションが搭載されており、各機能と対応するアプリケーションを選択することで、これらの機能が実現される。
本実施形態の端末装置400は、帳票認識システム100を利用する利用者(テナント)によって使用される。また、端末装置400は、サーバ装置200による帳票認識の結果が表示される。本実施形態の端末装置400は、例えば、タブレット型の端末であってもよいし、スマートフォン等であってもよい。
また、図1の例では、サーバ装置200は、記憶部220内に6つのデータベースを有する構成としたが、これに限定されない。各データベースは、一部がサーバ装置200の外部装置に設けられていてもよいし、各データベース全てが外部装置に設けられていてもよい。
また、図1の例では、サーバ装置200が帳票認識処理部230を実現するものとしたが、これに限定されない。帳票認識処理部230は、複数の情報処理装置によって実現されてもよい。
また、図1の例では、帳票認識システム100に含まれる画像形成装置300と端末装置400とは、それぞれ1台としているが、帳票認識システム100に含まれる画像形成装置300と端末装置400の台数は、任意の数であって良い。
次に、図2Aを参照して、本実施形態のサーバ装置200のハードウェア構成について説明する。図2Aは、サーバ装置のハードウェア構成の一例を示す図である。
図2Aに示されているように、サーバ装置200は、コンピュータによって構築されており、図2Aに示されているように、CPU201、ROM202、RAM203、HD204、HDD(Hard Disk Drive)コントローラ205、ディスプレイ206、外部機器接続I/F(Interface)208、ネットワークI/F209、バスライン210、キーボード211、ポインティングデバイス212、DVD-RW(Digital Versatile Disk Rewritable)ドライブ214、メディアI/F216を備えている。
これらのうち、CPU201は、サーバ装置200全体の動作を制御する。ROM202は、IPL等のCPU201の駆動に用いられるプログラムを記憶する。RAM203は、CPU201のワークエリアとして使用される。HD204は、プログラム等の各種データを記憶する。HDDコントローラ205は、CPU201の制御にしたがってHD204に対する各種データの読み出し又は書き込みを制御する。
ディスプレイ206は、カーソル、メニュー、ウィンドウ、文字、又は画像などの各種情報を表示する。外部機器接続I/F208は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリやプリンタ等である。ネットワークI/F209は、通信ネットワークを利用してデータ通信をするためのインターフェースである。バスライン210は、図2Aに示されているCPU201等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
また、キーボード211は、文字、数値、各種指示などの入力のための複数のキーを備えた入力手段の一種である。ポインティングデバイス212は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行う入力手段の一種である。DVD-RWドライブ214は、着脱可能な記録媒体の一例としてのDVD-RW213に対する各種データの読み出し又は書き込みを制御する。尚、DVD-RWに限らず、DVD-R等であってもよい。メディアI/F216は、フラッシュメモリ等の記録メディア215に対するデータの読み出し又は書き込み(記憶)を制御する。
次に、図2Bを参照して、本実施形態の端末装置400のハードウェア構成について説明する。図2Bは、端末装置のハードウェア構成の一例を示す図である。本実施形態の端末装置400は、CPU401、ROM402、RAM403、EEPROM404、CMOSセンサ405、撮像素子I/F406、加速度・方位センサ407、メディアI/F409、GPS受信部411を備える。
これらのうち、CPU401は、端末装置400全体の動作を制御する演算処理装置である。ROM402は、CPU401やIPL等のCPU401の駆動に用いられるプログラムを記憶する。RAM403は、CPU401のワークエリアとして使用される。EEPROM404は、CPU401の制御にしたがって、スマートフォン用プログラム等の各種データの読み出し又は書き込みを行う。ROM402、RAM403、EEPROM404は、端末装置400の記憶装置の一例である。
CMOS(Complementary Metal Oxide Semiconductor)センサ405は、CPU401の制御に従って被写体(主に自画像)を撮像して画像データを得る内蔵型の撮像手段の一種である。なお、CMOSセンサではなく、CCD(Charge Coupled Device)センサ等の撮像手段であってもよい。
撮像素子I/F406は、CMOSセンサ405の駆動を制御する回路である。加速度・方位センサ407は、地磁気を検知する電子磁気コンパスやジャイロコンパス、加速度センサ等の各種センサである。メディアI/F409は、フラッシュメモリ等の記録メディア408に対するデータの読み出し又は書き込み(記憶)を制御する。GPS受信部411は、GPS衛星からGPS信号を受信する。
また、端末装置400は、遠距離通信回路412、遠距離通信回路412のアンテナ412a、CMOSセンサ413、撮像素子I/F414、マイク415、スピーカ416、音入出力I/F417、ディスプレイ418、外部機器接続I/F(Interface)419、近距離通信回路420、近距離通信回路420のアンテナ420a、及びタッチパネル421を備えている。
これらのうち、遠距離通信回路412は、通信ネットワークを介して、他の機器と通信する回路である。CMOSセンサ413は、CPU401の制御に従って被写体を撮像して画像データを得る内蔵型の撮像手段の一種である。撮像素子I/F414は、CMOSセンサ413の駆動を制御する回路である。マイク415は、音を電気信号に変える内蔵型の回路である。スピーカ316は、電気信号を物理振動に変えて音楽や音声などの音を生み出す内蔵型の回路である。音入出力I/F417は、CPU401の制御に従ってマイク415及びスピーカ416との間で音信号の入出力を処理する回路である。
ディスプレイ418は、被写体の画像や各種アイコン等を表示する液晶や有機EL(Electro Luminescence)などの表示手段の一種である。外部機器接続I/F419は、各種の外部機器を接続するためのインターフェースである。近距離通信回路430は、NFC(Near Field Communication)やBluetooth(登録商標)等の通信回路である。タッチパネル421は、利用者がディスプレイ418を押下することで、端末装置400を操作する入力手段の一種である。ディスプレイ418は、端末装置400の有する表示部の一例である。
尚、端末装置400は、図2Aに示すようなハードウェア構成を有する一般的なコンピュータであってもよい。
次に、図3を参照して、本実施形態のサーバ装置200の有する抽出定義データベース250について説明する。
図3は、抽出定義データベースの一例を示す図である。図3では、抽出定義データベース250に格納された抽出定義情報の一例を示す。図3は、例えば、テナント毎に予め設けられていてもよい。
抽出定義情報は、情報の項目として、項目名、抽出基点キーワード、抽出方向、抽出範囲・抽出条件を有する。抽出定義データベース250において、項目「項目名」とその他の項目とは対応付けられており、項目「項目名」の値と、その他の項目の値とを含む情報が抽出定義情報となる。
項目「項目名」の値は、項目値と対応付けられる項目名を示す。項目「項目名」の値は、項目名と対応する項目「抽出基点キーワード」の値が示す文字列との位置関係に基づき抽出される。
また、項目「項目名」の値は、請求書情報に含まれる情報の項目でもある。図3の例では、項目「項目名」の値として、請求金額、請求日、請求元、電話番号、支払い期日等が含まれる。これらの値は、請求書情報の項目となる。
項目「抽出基点キーワード」の値は、項目「項目名」の値が示す項目名の項目値となる文字列を抽出する際に、基点となる文字列を示す。
項目「抽出方向」の値は、基点になる文字列と、項目「項目名」の値が示す項目名の項目値となる文字列との位置関係を示す。項目「抽出範囲・抽出条件」の値は、抽出する文字列の範囲と条件を示す。
図3では、例えば、項目名「請求金額」の項目値となる文字列は、帳票画像から抽出された文字列群のうち、「請求金額」、「請求金額合計」等の特定の文字列の右方向の隣にある文字列である。尚、項目名「請求金額」の抽出基点となる文字列は、「請求金額」、「請求金額合計」等の特定の文字列と部分一致する文字列であってもよい。
また、例えば、項目名「請求日」の項目値となる文字列は、帳票画像から抽出された文字列群のうち、「請求日」等の特定の文字列の右方向の隣にある文字列である。
また、例えば、項目名「請求元」の項目値となる文字列は、帳票画像から抽出された文字列群のうち、「請求元」、「弊社名」等の特定の文字列の右方向の隣にある文字列である。
次に、図4を参照して、辞書データベース260について説明する。図4は、辞書データベースの一例を示す図である。
本実施形態の辞書データベース260に格納される辞書情報は、情報の項目として、電話番号、会社名、テナントIDとを有し、各項目は対応付けられている。本実施形態において、項目「電話番号」の値と、項目「会社名」の値と、「テナントID」の値と、を対応付けた情報が辞書情報である。本実施形態の辞書情報は、端末装置400に表示させた帳票の認識結果に対し、テナントが再入力した情報である。
項目「電話番号」の値は、請求書の発行元の電話番号を示す。項目「会社名」の値は、請求書の発行元の会社名を示す。項目「テナントID」の値は、帳票認識システム100の利用者(テナント)を特定する識別情報である。
図4の例では、電話番号「03-1234-5678」には、会社名「株式会社△△」と、テナントID「Company01」とが対応付けられており、この辞書情報が、テナントID「Company01」によって入力されたことがわかる。
次に、図5を参照して、抽出結果管理データベース270について説明する。図5は、抽出結果管理データベースの一例を示す図である。抽出結果管理データベース270は、テナント毎に設けられていてよい。
抽出定義情報は、帳票認識処理部230による帳票認識処理が行われる度に生成される。また、抽出定義情報は、帳票認識処理部230の帳票認識処理によって、帳票画像データから抽出された項目名と項目値である。
抽出結果管理データベース270に格納された抽出定義情報は、情報の項目として、請求書ID、請求元、請求日、請求金額、電話番号、住所等を含む。抽出定義情報において、項目「請求書ID」と、その他の項目とが対応付けられている。
項目「請求書ID」の値は、請求書を特定するための識別情報である。項目「請求元」の値は、帳票認識処理により帳票画像データから抽出された請求元の名称を示し、項目「請求日」の値は、帳票認識処理により帳票画像データから抽出された請求日を示す。
項目「請求金額」の値は、帳票認識処理により帳票画像データから抽出された請求金額を示し、項目「電話番号」の値は、帳票認識により帳票画像データから抽出された請求元の電話番号を示す。項目「住所」の値は、帳票認識処理により帳票画像データから抽出された請求元の住所を示す。
また、本実施形態の抽出定義情報では、帳票認識処理において、項目値が抽出されなかった場合には、項目名と対応する項目値は空欄となる。
図5の例では、請求書ID「002」で特定される抽出定義情報では、全ての項目名に対して項目値が格納されている。これに対し、請求書ID「001」で特定される抽出定義情報は、項目「請求元」の項目値が格納されていない。このため、請求書ID「001」で特定される請求書の帳票画像データに対する帳票認識処理では、請求元の名称が抽出されなかったことがわかる。
次に、図6を参照して、本実施形態の検索履歴管理データベース280について説明する。図6は、検索履歴管理データベースの一例を示す図である。
本実施形態の検索履歴管理データベース280に格納された検索履歴情報は、帳票認識処理部230が、検索エンジンを用いた検索結果に基づき項目名の項目値を特定した場合に検索履歴管理データベース280に格納される。
検索履歴情報は、情報の項目として、電話番号、会社名、検索日時等を含み、それぞれが対応付けられている。
項目「電話番号」の値は、抽出結果管理データベース270に格納された電話番号を示し、検索エンジンに対する検索キーとなる。項目「会社名」の値は、検索エンジンに対する検索結果として取得された請求元の名称を示す。項目「検索日時」の値は、帳票認識処理部230が検索エンジンに対して検索要求を行った日時を示す。
次に、図7を参照して、本実施形態のテナントデータベース295について説明する。図7は、テナントデータベースの一例を示す図である。本実施形態のテナントデータベース295は、予めサーバ装置200に格納されていてよい。
テナントデータベース295に格納されたテナント情報は、情報の項目として、テナントID、会社名、電話番号、住所等を含み、項目「テナントID」と、その他の項目とが対応付けられている。
項目「テナントID」の値は、テナントを特定するための識別情報である。言い換えれば、テナントIDは、帳票認識システム100の利用者を特定するための識別情報である。項目「会社名」の値は、テナントの名称を示す。言い換えれば、項目「会社名」は、利用者の名称を示す。
項目「電話番号」の値と、項目「住所」の値は、テナントIDで特定されるテナントの電話番号と住所を示す。
尚、テナント情報には、図7に示す項目以外の項目が含まれてもよい。具体的には、例えば、テナント情報には、テナントが利用している金融機関に関する情報等が含まれてもよい。
次に、図8Aを参照して、サーバ装置200の機能について説明する。図8Aは、サーバ装置の機能を説明する図である。
本実施形態のサーバ装置200では、例えば、HD504等に格納された情報処理プログラムをCPU201が読み出して実行することで、後述する各部の機能が実現される。
本実施形態のサーバ装置200は、帳票認識処理部230を有する。帳票認識処理部230は、入力受付部221、認証処理部222、帳票認識部290を有する。
入力受付部221は、サーバ装置200に対する各種の入力を受け付ける。具体的には、入力受付部221は、帳票認識システム100にログインするためのログイン情報の入力を受け付ける。ログイン情報とは、例えば、テナントIDとパスワード等である。また、入力受付部221は、例えば、画像形成装置300から送信された帳票画像データの入力を受け付ける。
認証処理部222は、入力受付部221が入力を受け付けたログイン情報に基づき、認証を行う。尚、認証処理部222は、例えば、サーバ装置200の外部に設けられた認証サーバに対して、入力されたログイン情報を送信し、認証サーバによる認証の結果を取得してもよい。認証処理部222は、利用者が認証されると、入力受付部221が受け付けた帳票画像データを帳票認識部290に渡してもよい。
本実施形態の帳票認識部290は、画像データ格納部281、ジョブリスト生成部282、画像データ取得部283、文字認識部284、抽出結果管理部285、辞書検索部286、検索要求部287、検索結果検証部288、特定部289、認識結果生成部291、表示制御部292、出力部293を有する。
画像データ格納部281は、画像形成装置300から帳票画像データを受信すると、画像データベース240に格納する。また、画像データ格納部281は、端末装置400から帳票画像データを受信すると、画像データベース240に格納する。
ジョブリスト生成部282は、入力受付部221が画像形成装置300から帳票画像データの入力を受け付けて、ジョブリストにジョブを登録し、ジョブリストを管理する。ジョブリストの詳細は後述する。
画像データ取得部283は、画像データベース240に格納された帳票画像データを取得する。
文字認識部284は、帳票画像データから、文字列と、文字列が配置された位置を示す情報とを抽出し、読取結果情報として保持する。したがって、読取結果情報には、帳票画像データから抽出された複数の文字列が含まれる。以下の説明では、読取結果情報に含まれる、帳票画像データから抽出された複数の文字列を、文字列群と表現する場合がある。読取結果情報の詳細は後述する。
抽出結果管理部285は、抽出結果管理データベース270に格納される抽出結果情報を管理する。具体的には、抽出結果管理部285は、帳票画像データから抽出された複数の文字列を、項目名と項目値として対応付けた抽出結果情報として、抽出結果管理データベース270に格納する。また、抽出結果管理部285は、辞書データベース260や検索エンジンの検索により項目値が特定された場合に、抽出結果管理データベース270に格納された抽出結果情報を更新する。
辞書検索部286は、抽出結果情報に含まれる項目値を検索キーとして、辞書データベース260を検索する。具体的には、辞書検索部286は、抽出結果情報に組まれる電話番号を検索キーとして、辞書データベース260を検索する。
検索要求部287は、抽出結果情報に含まれる項目値を検索キーとして、インターネット上の検索エンジンに対し、検索要求を出力する。
検索結果検証部288は、辞書検索部286による検索結果の正誤を検証する。また、検索結果検証部288は、検索エンジンによる検索結果の正誤を検証する。言い換えれば、検索結果検証部288は、検索結果の信憑性を検証する。
特定部289は、検索結果検証部288による検証結果に応じて、抽出結果情報として格納する項目値を特定する。
認識結果生成部291は、抽出結果情報に含まれる請求書情報を含む認識結果データを生成する。
表示制御部292は、端末装置400等における画面の表示を制御する。具体的には、表示制御部292は、端末装置400に表示される認識結果確認画面を示す画面データを生成してもよい。
出力部293は、表示制御部292が生成した認識結果確認画面を示す画面データを端末装置400へ出力する。言い換えれば、出力部293は、表示制御部292が生成した認識結果確認画面を端末装置400のウェブブラウザ(表示部)上で表示させる。また、出力部293は、認識結果データを、基幹システム500と対応する形式のデータに変換し、出力する。
次に、図8Bを参照して、端末装置400の機能について説明する。図8Bは、端末装置の機能構成を説明する図である。
本実施形態の端末装置400は、入力受付部430と、表示部440と、通信部450とを有する。入力受付部430は、端末装置400に対する各種の入力を受け付ける。表示部440は、端末装置400のディスプレイ418の表示を制御する。表示制御部440は、例えば、ブラウザ等により実現されてもよいし、帳票認識システム100を利用するためのアプリケーション等により実現されてもよい。通信部450は、端末装置400と他の各装置との間で情報の送受信を行う。
次に、図9を参照して、本実施形態の帳票認識システム100における帳票認識の動作について説明する。図9は、帳票認識システムの動作を説明する第一のシーケンス図である。
帳票認識システム100において、画像形成装置300は、利用者から帳票認識を行うためのアプリケーションの起動要求を受け付けると(ステップS901)、このアプリケーションを起動させる(ステップS902)。利用者とは、例えば、テナントの管理者等である。
続いて、画像形成装置300は、利用者から、テナントIDを含むログイン情報の入力を受け付けると(ステップS903)、このログイン情報をサーバ装置200へ送信し、認証要求を行う(ステップS904)。
サーバ装置200は、認証要求を受けて、認証処理部222により認証を行い、その結果を画像形成装置300へ通知する(ステップS905)。尚、ここでは、利用者が認証された場合の動作を示している。
続いて、画像形成装置300は、帳票のスキャン指示を受け付け(ステップS906)、帳票のスキャンを行い、帳票画像データを取得する(ステップS907)。続いて、画像形成装置300は、帳票画像データをサーバ装置200へ送信する(ステップS908)。
サーバ装置200は、入力受付部221が帳票画像データの入力を受け付けると、認証処理部222がこの帳票画像データを帳票認識部290へ渡す(ステップS909)。尚、図8の例では、認証処理部222を介して帳票画像データが帳票認識部290へ渡されるものとしたが、これに限定されない。帳票画像データは、認証処理部222を介さずに帳票認識部290に渡されてもよい。
サーバ装置200の帳票認識部290は、帳票画像データを受け取ると、ジョブリスト生成部282により、ジョブリストにジョブを登録する(ステップS910)。続いて、帳票認識部290は、画像データ格納部281により、帳票画像データを画像データベース240へ格納する(ステップS911)。
続いて、帳票認識部290は、画像データ取得部283により、画像データベース240から認識する対象となる帳票画像データを取得し(ステップS912)、帳票画像を認識する処理を実行する(ステップS913)。
具体的には、本実施形態の帳票認識部290は、文字認識部284により取得された読取結果情報に含まれる文字列群から請求書情報を抽出し、認識結果生成部291により、請求書情報を含む認識結果データを生成する。ステップS913の処理の詳細は後述する。
続いて、帳票認識部290は、認識結果生成部291が生成した認識結果データを認識結果データベース294に格納し(ステップS914)、帳票認識の処理を終了する。
ここで、図10を参照して、本実施形態のジョブリスト生成部282により生成されるジョブリストについて説明する。図10は、ジョブリストの一例を示す図である。
本実施形態のサーバ装置200は、画像形成装置300から帳票画像データが入力されると、ジョブリスト生成部282により、帳票画像データとジョブIDとを対応付けたジョブリストとして保持する。
本実施形態のジョブリスト101は、情報の項目として、ジョブID、テナントID、帳票画像ファイルパス、認識結果ファイルパス、ステータスを有する。
項目「ジョブID」の値は、ジョブを特定する識別情報である。言い換えれば、項目「ジョブID」の値は、画像形成装置300から受信した帳票画像データを特定するための識別情報である。項目「画像ファイルパス」の値は、帳票画像データが格納されている場所を示す情報である。項目「認識結果ファイルパス」の値は、帳票画像を認識した結果の認識結果データが格納されている場所を示す情報である。
項目「ステータス」の値は、利用者(テナント)による帳票画像の認識の進捗を示す。言い換えれば、項目「ステータス」の値は、ジョブの状態を示す。
本実施形態では、項目「ステータス」の値として、未処理状態、下書き保存状態、確定済み状態、外部出力済み状態の4つがある。各状態は、以下の通りである。尚、項目「ステータス」の値は、認識結果データに含まれてもよい。
・未処理状態(状態1) 帳票認識によって認識結果データが取得された直後であり、認識結果の確認等が行われていない状態。
・下書き保存状態(状態2) 認識結果データの確認等の作業の途中等であり、認識結果データが確定される前の状態。
・確定済み状態(状態3) 認識結果データの確認等の作業が完了し、確定された情報として認識結果データベース294へ格納された状態。
・外部出力済み状態(状態4) 帳票認識システム100と連携する会計システム等への認識結果データの出力が完了した状態。
本実施形態のサーバ装置200は、画像形成装置300から帳票画像データを受信すると、ジョブリスト生成部282により、ジョブIDを付与し、ログイン情報として取得しテナントIDを対応付けて、ジョブリスト101にレコードを追加する。そして、ジョブリスト生成部282は、帳票画像データが画像データベース240に格納されると、この格納先を示す情報を項目「画像ファイルパス」の値として、追加する。
さらに、ジョブリスト生成部282は、帳票画像の認識において、参照する帳票定義情報が特定されると、その定義IDを項目「定義ID」の値として追加する。そして、ジョブリスト生成部282は、ジョブリスト101が完了して、認識結果データが認識結果データベース294に格納されると、この格納先を示す情報を項目「認識結果ファイルパス」の値として追加し、項目「ステータス」の値を完了とする。
本実施形態では、例えば、ジョブリスト生成部282によって生成されたジョブリストを表示してもよい。この場合、利用者は、ジョブリストに基づいて表示されたジョブリスト画面を介して、帳票画像の認識の進捗を確認することができる。
次に、図11を参照して、帳票認識システム100における認識結果データの表示する際の動作について説明する。図11は、帳票認識システムの動作を説明する第二のシーケンス図である。
帳票認識システム100において、端末装置400は、利用者から帳票の一覧の表示指示を受け付けると(ステップS1101)、サーバ装置200に対し、帳票の一覧画面の取得要求を送信する(ステップS1102)。
サーバ装置200は、一覧画面の取得要求を受け付けると、表示制御部292により、端末装置400に対して、ログイン画面の表示指示を送信する(ステップS1103)。端末装置400は、この表示指示を受け付けて、ログイン画面を表示させる(ステップS1104)。
端末装置400は、利用者から、テナントIDを含むログイン情報の入力を受け付けると(ステップS1105)、ログイン情報と共にログイン要求をサーバ装置200へ送信する(ステップS1106)。尚、以下では、ログイン情報からテナントが認証された場合について説明する。
サーバ装置200は、ログイン要求を受け付けると、認証処理部222によって認証処理を実行させ(ステップS1107)、ログイン結果として、認証されたテナントIDを表示制御部292に返す(ステップS1108)。
表示制御部292は、このテナントIDを保持し(ステップS1109)、記憶部220から、このテナントIDと対応する請求書(帳票)の一覧を示す情報を取得する(ステップS1110)。具体的には、表示制御部292は、テナントIDと対応する認識結果データベース294を参照し、請求書の一覧を示す情報を取得する。
続いて、サーバ装置200は、表示制御部292により、請求書の一覧を示す情報の表示指示を端末装置400に送信する(ステップS1111)。
端末装置400は、この表示指示を受け付けて、請求書の一覧を示す一覧画面を表示させる(ステップS1112)。
また、端末装置400は、一覧画面において、請求書の選択を受け付けると(ステップS1113)、サーバ装置200に対し、認識結果データの確認画面の表示要求を送信する(ステップS1114)。尚、この表示要求には、一覧画面において選択された請求書を特定するための請求書IDが含まれる。
サーバ装置200は、確認画面の表示要求を受け付けると、表示制御部292は、記憶部220から、表示要求と共に受け付けた請求書IDと対応する認識結果データを取得する(ステップS1115)。
続いて、表示制御部292は、端末装置400に対し、認識結果データの確認画面の表示指示を送信する(ステップS1116)。
端末装置400は、この表示指示を受け付けると、認識結果データの確認画面を表示させる(ステップS1117)。
ここで、図11では、例えば、確認画面において、項目名「請求元」の項目値に対する修正が行われた場合について説明する。
端末装置400は、利用者による項目値の修正又は、項目値の抽出位置の指定を受け付け(ステップS1118)、確定の操作を受け付けると(ステップS1119)、ダイアログボックスを表示させる(ステップS1120)。尚、ここで修正を受け付けた項目値は、項目名「請求元」の項目値とする。また、ここで表示されるダイアログボックスは、辞書データベース260に格納する辞書情報を入力させるためのダイアログボックスである。
続いて、端末装置400は、ダイアログボックスに対して電話番号が入力されると(ステップS1121)、サーバ装置200に、帳票画像の認識の進捗を確定とすることを指示する確定指示を送信する(ステップS1122)。
サーバ装置200は、確定指示を受け付けると、抽出結果管理データベース270に格納された抽出結果情報のうち、選択された請求書の請求書IDと対応する抽出結果情報において、修正前の項目値を修正後の項目値に更新する(ステップS1123)。
また、サーバ装置200は、ステップS1118において、項目値の修正を受け付けた場合には、修正された項目値と、電話番号と、テナントIDとを対応付けた情報を、辞書情報として辞書データベース260に格納する(ステップS1124)。
なお、サーバ装置200は、ステップS1118において、項目値の抽出位置の指定を受け付けた場合には、項目名と、項目値の抽出位置を示す情報を新たな抽出定義情報として、抽出定義データベース250に格納してもよい。
以上が、帳票認識システム100の動作である。次に、図12ないし図16を参照して、帳票認識処理部230の処理について説明する。
図12は、帳票認識処理部の処理を説明する第一のフローチャートである。図12は、図9のステップS913における帳票認識処理部230の処理の詳細を示す。
本実施形態の帳票認識部290は、画像データ取得部283により、画像データベース240から帳票画像データを取得する(ステップS1201)。
続いて、帳票認識部290は、文字認識部284により、帳票画像から、文字が形成されている領域(以下、文字フィールド)を切り取り、切り取られた文字フィールドの中の文字を切り出して認識し、切り出した文字の位置を示す座標を取得する(ステップS1202)。
続いて、帳票認識部290は、文字認識部284により認識された各文字の位置関係に基づいて読取結果情報を生成し、文字列と文字列の座標を特定する(ステップS1203)。読取結果情報の詳細は後述する。
続いて、帳票認識部290は、抽出結果管理部285により、抽出定義データベース250を参照し、抽出定義情報に基づき、項目名と対応する項目値を抽出する(ステップS1204)。
続いて、帳票認識処理部230は、抽出結果管理部285により、抽出結果を抽出結果管理データベース270に格納する(ステップS1205)。
続いて、帳票認識処理部230は、項目名「請求元」の項目値を再度抽出し(ステップS1206)、帳票認識の処理を終了する。ステップS1206の処理の詳細は後述する。
次に、図13を参照して文字認識についてさらに説明する。図13は、読取結果情報の一例を示す図である。
図13に示す情報131は、帳票画像データに対し、文字認識部284による文字認識を行った結果である。
情報131は、文字フィールドを切り取り、文字フィールドの中の文字を認識した結果と、文字の位置を示す座標とから抽出した例を示す。
本実施形態の文字認識部284は、この情報131から、隣り合う位置にある文字同士をつなげて文字列(文字列)を認識する。具体的には、文字認識部284は、文字と文字との間の距離が、所定ピクセル以内である文字の組み合わせを、1つ単語として認識しても良い。
図13に示す情報132は、文字認識部284により認識された文字列と、文字列の領域とを示す情報であり、文字認識部284による帳票画像の読取結果情報である。
また、文字認識部284は、帳票画像データから、縦線と横線で区切られた領域を1つのセルとして認識し、セル毎にセルを識別する識別情報(セルID)を付与する。
図13に示す情報132は、帳票画像から認識されたセル毎の領域とセルIDとの対応付けを示す情報である。
図13では、例えば、文字列「電話番号」が認識された領域は、情報131において、X座標とY座標によって示される位置を基準として、高さと幅とから特定される。
また、情報131において、文字列「電話番号」が認識された領域は、セルID「17」に含まれることがわかる。したがって、文字列「電話番号」は、読取結果情報に含まれる文字列として、セルID「17」と対応付けられる。
本実施形態の帳票認識部290は、このようにして、帳票画像データから、文字列とセルとを対応付ける。
次に、図14を参照して、図12のステップS1206における帳票認識処理部230の処理について説明する。図14は、帳票認識処理部の処理を説明する第二のフローチャートである。図14は、文字認識部284による文字認識を行った後の、項目名「請求元」の値を再抽出する処理示している。
ステップS1401からステップS1406までの処理は、辞書データベース260の検索結果を用いる処理である。
本実施形態の帳票認識処理部230は、抽出結果管理部285により、項目名「電話番号」の項目値が抽出されたか否かを判定する(ステップS1401)。ステップS1401において、該当する項目値が抽出されていない場合、帳票認識処理部230は、処理を終了する。
ステップS1401において、該当する項目値が抽出されている場合、帳票認識処理部230は、辞書検索部286により、抽出された電話番号を検索キーとして、辞書データベース260を検索し、検索キーを含む辞書情報を特定する(ステップS1402)。
続いて、帳票認識処理部230は、検索結果検証部288により、ステップS1402で複数の辞書情報が特定されたか否かを判定する(ステップS1403)。ステップS1403において、複数の辞書情報が特定されなかった場合、つまり、特定された辞書情報が1つのレコードであった場合、帳票認識処理部230は、後述するステップS1407へ進む。
ステップS1403において、複数の辞書情報が特定された場合、検索結果検証部288は、特定された複数の辞書情報な含まれるテナントIDが一致するか否かを判定する(ステップS1404)。ステップS1404において、テナントIDが一致する場合、帳票認識処理部230は、後述するステップS1407へ進む。
ステップS1404において、テナントIDが一致しない場合、帳票認識処理部230は、特定部289により、検索結果として取得された辞書情報に含まれる会社名を、項目名「請求元」の項目値として特定する(ステップS1405)。
続いて、帳票認識処理部230は、抽出結果管理部285により、抽出定義データベース250に格納された抽出結果において、対応する項目値を、ステップS1405で特定された項目値に更新し(ステップS1406)、処理を終了する。
つまり、本実施形態の例として、検索結果検証部288は、複数の異なるテナントにより、同一の電話番号と同一の会社名とを対応付けた辞書情報が辞書データベース260に登録されている場合にのみ、電話番号と対応する会社名が、信用に足る情報であるものとする。信用に足る情報とは、言い換えれば、誤っている可能性が低く、信憑性が高い情報である。
具体的には、例えば、テナントID「101」で特定されるテナントと、テナントID「003」で特定されるテナントとが、電話番号「03-1234-5678」と会社名「株式会社△△」とを対応付けた辞書情報を辞書データベース260に格納したとする(図4参照)。
この場合に、電話番号「03-1234-5678」を検索キーとして辞書データベース260を検索した場合、テナントID「101」を含む辞書情報と、テナントID「103」を含む辞書情報とが、検索結果として抽出される。そして、これらの辞書情報において、テナントIDは一致していない。このため、電話番号「03-1234-5678」と会社名「株式会社△△」との対応づけを、2つのテナントが、それぞれ別々に行ったことになる。
このことから、検索結果検証部288は、検索キーとなる項目名「電話番号」の項目値が正しく抽出されており、この電話番号と対応付けられた会社名も、信用に足る情報であるものとする。
以上が、辞書データベース260の検索結果を用いた処理である。次に説明するステップS1407からステップS1416までの処理は、検索エンジンの検索結果を用いた処理である。
ステップS1403において、複数の辞書情報が特定されなかった場合、帳票認識処理部230は、検索要求部287により、検索履歴管理データベース280に、検索キーとされた電話番号を含む検索履歴情報が格納されているか否かを判定する(ステップS1407)。つまり、ここでは、帳票認識処理部230は、過去に、検索キーとされた電話番号で検索エンジンの検索が行われたか否かを判定している。
ステップS1407において、検索履歴管理データベース280に該当する電話番号を含む検索履歴情報が格納されている場合、帳票認識処理部230は、特定部289により、検索キーとなる電話番号と対応付けられた会社名を、項目名「請求元」の項目値として特定し(ステップS1408)、ステップS1406へ進む。
ステップS1407において、検索履歴管理データベース280に該当する電話番号を含む検索履歴情報が格納されていない場合、帳票認識処理部230は、検索要求部287により、電話番号を検索キーとする検索要求を、インターネット上の検索エンジンに対して出力し、検索結果を取得する(ステップS1409)。
続いて、帳票認識処理部230は、特定部289により、検索結果から会社名を特定する(ステップS1410)。
具体的には、特定部289は、検索エンジンから取得された検索結果の上位10件のそれぞれを、カンマや空白などの区切り記号で、複数のキーワードに分ける。そして、複数のキーワードの中から、会社名と見なせる形式のキーワードを会社名として特定してもよい。会社名と見なせる形式のキーワードとは、例えば、株式会社、(株)等が含まれるキーワードである。
また、検索結果に会社名が複数存在する場合には、出現回数が最も多い会社名を、検索エンジンによる検索結果としてもよい。
続いて、帳票認識処理部230は、ステップS1410において、会社名が特定されたか否かを判定する(ステップS1411)。ステップS1411において、会社名が特定されなかった場合、帳票認識処理部230は、処理を終了する。
本実施形態では、検索結果に含まれる複数のキーワードから、会社名と見なせる形式のキーワードが存在しない場合、会社名が特定されなかったものとしてもよい。
ステップS1411において、会社名が特定された場合、帳票認識処理部230は、検索結果検証部288により、外部サーバ600等に格納された法人情報管理テーブルと、特定された会社名とを照合する(ステップS1412)。
以下に、法人情報管理テーブルについて説明する。本実施形態の法人情報管理テーブルは、一般に開示された情報であり、例えば、国税庁等によって管理されている。本実施形態では、例えば、外部サーバ600は、国税庁等によって管理されていてもよく、外部サーバ600に法人情報管理テーブルが格納されていてもよい。
法人情報管理テーブルに格納されている法人情報には、法人を特定するための識別情報や、法人名(会社名)等が含まれる。法人情報管理テーブルの詳細は後述する。
帳票認識処理部230において、検索結果検証部288は、法人情報管理テーブルに、ステップS1410で特定した会社名と一致する会社名があるか否かを判定する(ステップS1413)。つまり、ここでは、検索エンジンに対する検索により特定された会社名が、実在する会社の名称であるか否かを判定している。
ステップS1413において、一致する会社名が存在しない場合、帳票認識処理部230は、処理を終了する。
ステップS1413において、一致する会社名が存在する場合、帳票認識処理部230は、検索結果検証部288により、読取結果情報にステップS1410で特定された会社名と類似する文字列が存在するか否かを判定する(ステップS1414)。
読取結果情報に、ステップS1413までの処理で特定された会社名と類似する文字列が含まれる場合には、この請求書の発行元(請求元)が、特定された会社名が示すテナントであると言える。
つまり、ここでは、ステップS1413までの処理で特定された会社名が、図12のステップS1201で取得した画像データが示す請求書の発行元であるか否かを判定している。
具体的には、検索結果検証部288は、例えば、読取結果情報に含まれる文字列のうち、文字列「株式会社」を除く文字列の中に、特定された会社名から「株式会社」を除いた文字列と類似する文字列が存在するか否かを判定している。そして、検索結果検証部288は、例えば、特定された会社名から「株式会社」を除いた文字列と50%以上が一致する文字列を、類似する文字列としてもよい。
ステップS1414において、類似する文字列が存在しない場合、帳票認識処理部230は、処理を終了する。
ステップS1414において、類似する文字列が存在する場合、特定部289は、検索要求部287による検索結果として取得された会社名を、項目名「請求元」の項目値に特定する(ステップS1415)。
続いて、帳票認識処理部230は、ステップS1415で特定された会社名と、検索キーとされた電話番号と、検索要求を行った日時とを対応付けた検索履歴情報を生成し、検索履歴管理データベース280に格納し(ステップS1416)、ステップS1406へ進む。
以上が、検索エンジンから取得した検索結果を用いた処理である。
本実施形態では、このように、検索エンジンの検索結果を用いる場合には、複数の方法によって、検索結果が信憑性の高い項目値であることを検証する。そして、検証した結果に応じて、項目値を特定する。
しだかって、本実施形態によれば、帳票画像データからの項目名に対する項目値の抽出精度を向上させることができ、帳票認識の精度を向上させることができる。
次に、図15を参照して、法人情報管理テーブルについて説明する。図15は、法人情報管理テーブルの一例を示す図である。
図15に示す法人情報管理テーブル150は、情報の項目として、会社名、住所、適格請求書発行事業者番号等が含まれる。
項目「適格請求書発行事業者番号」の値は、適格請求書を発行することができる事業者(テナント)に対して付与された識別番号である。本実施形態では、テナントが発行する請求書には、適格請求書発行事業者番号が記載されているものとしてもよい。また、適格請求書とは、売手が、買手に対し正確な適用税率や消費税額等を伝えるための手段である。
本実施形態では、検索エンジンの検索結果から特定された会社名と、法人情報管理テーブル150とを照合させることで、検索エンジンの検索結果から特定された会社名が実在する会社の名称であるかがわかる。
次に、図16を参照して、図14のステップS1406における項目値の更新の処理について具体的に説明する。図16は、抽出結果管理データベースの項目値の更新について説明する図である。
図16に示す抽出結果管理データベース270は、図5に示す抽出結果管理データベース270と同様である。
このとき、抽出結果管理データベース270では、請求書ID「001」で特定される請求書から、項目名「請求元」の項目値が空欄となっており、文字認識によって項目名「請求元」の項目値が抽出されなかったことがわかる。
この場合、本実施形態の帳票認識処理部230は、項目名「電話番号」の項目値「03-1234-5689」で辞書データベース260を検索する。本実施形態の辞書データベース260には、項目値「03-1234-5689」を含み、且つ、テナントIDが異なる辞書情報が検索結果として抽出される。したがって、抽出結果管理データベース270において、請求書ID「001」を含む抽出結果情報の項目名「請求元」の項目値は、検索結果の辞書情報において、項目値「03-1234-5689」と対応付けられた会社名「株式会社△△」となる。
図16に示す抽出結果管理データベース270Aでは、請求書ID「001」を含む抽出結果情報の項目名「請求元」の項目値は、「株式会社△△」に更新されている。
本実施形態では、このように、項目名「請求元」の項目値の再抽出を行った結果を認識結果データに含める。したがって、本実施形態によれば、帳票認識の結果として、項目名「請求元」の項目値が抽出される確率を高めることができる。
次に、図17乃至図19を参照して、本実施形態の表示例について説明する。図17は、端末装置の表示例を示す第一の図である。
図17に示す画面171は、図11のステップS1117において、端末装置400に表示される確認画面の一例である。
画面171は、表示欄172、173、174、175、操作ボタン176、177を含む。
表示欄172には、帳票画像データが示す帳票画像が表示される。図17の例では、帳票が請求書であり、帳票画像に請求元の会社名を示す領域172aと、請求元の住所、電話番号、適格請求書発行事業者番号を示す領域172bと、が含まれる。
表示欄173は、表示欄172に表示された帳票画像を示す帳票画像データに対して帳票認識部290による帳票認識を行った結果の認識結果データが表示される。具体的には、表示欄173には、表示欄172に表示された帳票画像を示す帳票画像データから抽出された請求書情報が表示される。尚、表示欄173には、請求書情報以外の情報が表示されてもよい。具体的には、例えば、請求の内容を示す明細情報等が表示されてもよい。
表示欄174は、表示欄172に表示された帳票画像(請求書画像)に対する仕訳を入力するための入力欄が表示される。
表示欄175は、ジョブリスト101の項目「ステータス」の値が表示される。
操作ボタン176は、ジョブリスト101のステータスの値を、未処理状態から下書き保存状態とするための操作ボタンである。表示欄175に「未処理」と表示された状態において、操作ボタン176が操作されると、表示欄175の表示は、「未処理」から「下書き保存」に変化する。
操作ボタン177は、ジョブリスト101のステータスの値を、確定済み状態とするための操作ボタンである。本実施形態では、操作ボタン177が操作されると、ジョブリスト101のステータスの値を、確定済み状態とする。尚、本実施形態において、ステータスが確定済み状態とされた認識結果データは、出力部293により、基幹システム500と対応する形式のデータに変換することができる。
図18は、端末装置に表示例を示す第二の図である。図11のステップS1120において端末装置400に表示されるダイアログボックスの一例である。
ダイアログボックス181は、例えば、図17に示す画面171の表示欄173において、項目名「請求元」の項目値の表示欄が選択されると、画面171上に表示される。
ダイアログボックス181は、入力欄182と、操作ボタン183、184、185を含む。入力欄182は、請求元の電話番号と、請求元の口座番号とが入力される。
操作ボタン183は、入力をキャンセルするための操作ボタンである。操作ボタン184は、入力欄182に入力された電話番号を請求元と対応付けた辞書情報の格納と、認識結果データの状態の確定を行うための操作ボタンである。操作ボタン185は、辞書情報への登録は行わずに、認識結果データの状態の確定のみを行うための操作ボタンである。
本実施形態では、ダイアログボックス181において、操作ボタン184が操作されると、辞書データベース260が更新されて、画面171の表示欄175の表示が「確定済み」に変更されてもよい。
このように、本実施形態によれば、帳票認識において、文字認識により抽出された文字列群に含まれる第一の項目名と対応する第一の項目値を検索キーとした検索結果を用いて、文字列群に含まれる第二の項目名と対応する第二の項目値の信憑性を検証する。そして、本実施形態では、第二の項目値の信憑性が低い場合や、第二の項目値が取得されていない場合に、第一の項目名の項目値を検索キーとした検索結果を用いて、第二の項目値を特定する。
このとき、第一の項目名と第二の項目名とは、一意に対応付けられる関係であることが好ましい。具体的には、例えば、第一の項目名は、帳票の発行元の電話番号であり、第二の項目名は、帳票の発行元である。また、第一の項目名は、住所であり、第二の項目名が請求元であってもよい。また、第一の項目名は、適格請求書発行事業者番号であり、第二の項目名は、請求元であってもよい。
また、本実施形態では、第一の項目値を検索キーとして、インターネット上の検索エンジンに検索要求を行ってもよいし、辞書データベース260を検索してもよい。
さらに、本実施形態では、検索結果に対し、検索結果の信憑性を検証する。そして、検証した結果に応じて、第二の項目値を特定するため、誤った値が第二の項目値として特定されることを抑制でき、帳票認識の精度を向上させることができる。
尚、本実施形態では、帳票の一覧画面を表示させる際に、検索エンジンによる検索結果を用いて特定された項目値を含む認識結果データを視認できるように表示させてもよい。
図19は、端末装置の表示例を示す第三の図である。図19に示す画面191は、図11のステップS1112において、端末装置400に表示される帳票の一覧画面の一例である。
画面191の表示欄192には、帳票の一覧として、請求書情報の一部を示すレコードの一覧が表示されている。具体的には、表示欄192には、請求元、請求金額、請求日、ステータス等が表示される。
図19の例では、レコード193の請求元の項目値は、文字認識で取得された文字列の信憑性が高いとされた項目値である。これに対し、レコード194の請求元の項目値は、検索エンジンの検索結果から特定された項目値である。
図19では、レコード193とレコード194とで、表示態様を異ならせている。本実施形態では、このように、帳票の一覧画面において、項目値を帳票画像データ以外の情報源から取得したレコードを視認できるように表示させてもよい。このように表示させることで、利用者が確認画面を閲覧する際の注意を促すことができる。
上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(digital signal processor)、FPGA(field programmable gate array)や従来の回路モジュール等のデバイスを含むものとする。
また、実施形態に記載された装置群は、本明細書に開示された実施形態を実施するための複数のコンピューティング環境のうちの1つを示すものにすぎない。
ある実施形態では、サーバ装置200は、サーバクラスタといった複数のコンピューティングデバイスを含む。複数のコンピューティングデバイスは、ネットワークや共有メモリなどを含む任意のタイプの通信リンクを介して互いに通信するように構成されており、本明細書に開示された処理を実施する。同様に、サーバ装置200は、互いに通信するように構成された複数のコンピューティングデバイスを含むことができる。
さらに、サーバ装置200は、開示された処理ステップを様々な組み合わせで共有するように構成できる。例えば、サーバ装置200によって実行されるプロセスは、他のサーバ装置によって実行され得る。同様に、サーバ装置200の機能は、他のサーバ装置によって実行することができる。また、サーバ装置と他のサーバ装置の各要素は、1つのサーバ装置にまとめられていても良いし、複数の装置に分けられていても良い。
また、明細書中の対応テーブルは、機械学習の学習効果によって生成されたものでもよい。また、取引内容の記載に含まれうるキーワードと勘定項目とを機械学習にて分類付けすることで、対応テーブルを使用しなくてもよい。
ここで、機械学習とは、コンピュータに人のような学習能力を獲得させるための技術であり、コンピュータが、データ識別等の判断に必要なアルゴリズムを、事前に取り込まれる学習データから自律的に生成し,新たなデータについてこれを適用して予測を行う技術のことをいう。機械学習のための学習方法は、教師あり学習、教師なし学習、半教師学習、強化学習、深層学習のいずれかの方法でもよく、さらに、これらの学習方法を組み合わせた学習方法でもよく、機械学習のための学習方法は問わない。
以上、各実施形態に基づき本発明の説明を行ってきたが、上記実施形態に示した要件に本発明が限定されるものではない。これらの点に関しては、本発明の主旨をそこなわない範囲で変更することができ、その応用形態に応じて適切に定めることができる。
100 帳票認識システム
200 サーバ装置
220 記憶部
230 帳票認識処理部
240 画像データベース
250 抽出定義データベース
260 辞書データベース
270 抽出結果管理データベース
280 検索履歴管理データベース
290 認識結果データベース
295 テナントデータベース
281 画像データ格納部
282 ジョブリスト生成部
283 画像データ取得部
284 文字認識部
285 抽出結果管理部
286 辞書検索部
287 検索要求部
288 検索結果検証部
289 特定部
291 認識結果生成部
292 表示制御部
293 出力部
300 画像形成装置
400 端末装置
特開平7-200744号公報

Claims (10)

  1. 帳票画像データから抽出した文字列群に含まれる第一の項目名と対応する、第一の項目情報を検索キーとした検索要求を検索エンジンに出力する検索要求部と、
    前記検索エンジンから取得した検索結果に基づき、前記文字列群に含まれる第二の項目名と対応する、第二の項目情報を特定する特定部と、
    前記帳票画像データと対応する帳票の一覧を端末装置に表示させる際に、前記検索エンジンから取得した検索結果を用いて特定された前記第二の項目情報を含む認識結果データと、前記第二の項目情報が文字認識によって取得された認識結果データと、で表示態様を異ならせる表示制御部と、を有する情報処理装置。
  2. 前記特定部は、
    前記文字列群に、前記検索結果として取得された文字列と類似する文字列が存在する場合に、前記検索結果として取得した文字列を、前記第二の項目情報とする、請求項1記載の情報処理装置。
  3. 前記検索要求部は、
    前記帳票画像データから前記第二の項目情報が抽出されなかった場合に、前記検索要求を出力する、請求項1または2記載の情報処理装置。
  4. 項目名と、項目情報と、前記項目名と前記項目情報とを対応付けた利用者を識別する識別情報と、が対応付けられた辞書情報が格納された記憶部と、
    前記記憶部を前記第一の項目情報を検索キーとして検索する辞書検索部と、を有し、
    前記検索要求部は、
    前記辞書検索部による検索結果において、複数の辞書情報が取得され、且つ、前記複数の辞書情報のそれぞれに含まれる前記識別情報が一致する場合に、前記検索要求を出力する、請求項1乃至3の何れか一項に記載の情報処理装置。
  5. 前記第一の項目名と前記第二の項目名とは、互いが一意に関連付けられている、請求項1乃至4の何れか一項に記載の情報処理装置。
  6. 前記帳票画像データは、請求書の画像を示す画像データであり、
    前記第一の項目名は、前記請求書に含まれる請求元の電話番号であり、前記第二の項目名は、前記請求書の請求元である、請求項1乃至5の何れか一項に記載の情報処理装置。
  7. 帳票画像データから抽出した文字列群に含まれる第一の項目名と対応する、第一の項目情報を検索キーとした検索要求を検索エンジンに出力する検索要求部と、
    前記検索エンジンから取得した検索結果に基づき、前記文字列群に含まれる第二の項目名と対応する、第二の項目情報を特定する特定部と、
    項目名と、項目情報と、前記項目名と前記項目情報とを対応付けた利用者を識別する識別情報と、が対応付けられた辞書情報が格納された記憶部と、
    前記記憶部を前記第一の項目情報を検索キーとして検索する辞書検索部と、を有し、
    前記検索要求部は、
    前記辞書検索部による検索結果において、複数の辞書情報が取得され、且つ、前記複数の辞書情報のそれぞれに含まれる前記識別情報が一致する場合に、前記検索要求を出力する、情報処理装置。
  8. 帳票画像データから抽出した文字列群に含まれる第一の項目名と対応する、第一の項目情報を検索キーとした検索要求を検索エンジンに出力し、
    前記検索エンジンから取得した検索結果に基づき、前記文字列群に含まれる第二の項目名と対応する、第二の項目情報を特定し、
    前記帳票画像データと対応する帳票の一覧を端末装置に表示させる際に、前記検索エンジンから取得した検索結果を用いて特定された前記第二の項目情報を含む認識結果データと、前記第二の項目情報が文字認識によって取得された認識結果データと、で表示態様を異ならせる、
    処理をコンピュータに実行させる、情報処理プログラム。
  9. コンピュータによる情報処理方法であって、前記コンピュータが、
    帳票画像データから抽出した文字列群に含まれる第一の項目名と対応する、第一の項目情報を検索キーとした検索要求を検索エンジンに出力し、
    前記検索エンジンから取得した検索結果に基づき、前記文字列群に含まれる第二の項目名と対応する、第二の項目情報を特定し、
    前記帳票画像データと対応する帳票の一覧を端末装置に表示させる際に、前記検索エンジンから取得した検索結果を用いて特定された前記第二の項目情報を含む認識結果データと、前記第二の項目情報が文字認識によって取得された認識結果データと、で表示態様を異ならせる、情報処理方法。
  10. 情報処理装置と、端末装置とを有する情報処理システムであって、
    前記情報処理装置は、
    帳票画像データから抽出した文字列群に含まれる第一の項目名と対応する、第一の項目情報を検索キーとした検索要求を検索エンジンに出力する検索要求部と、
    前記検索エンジンから取得した検索結果に基づき、前記文字列群に含まれる第二の項目名と対応する、第二の項目情報を特定する特定部と、
    前記第一の項目名と前記第一の項目情報及び前記第二の項目名と前記第二の項目情報を含む認識結果データを前記端末装置に表示させる表示制御部と、を有し、
    前記端末装置は、前記認識結果データを表示させる表示部を有し、
    前記表示制御部は、前記帳票画像データと対応する帳票の一覧を前記端末装置に表示させる際に、前記検索エンジンから取得した検索結果を用いて特定された前記第二の項目情報を含む認識結果データと、前記第二の項目情報が文字認識によって取得された認識結果データと、で表示態様を異ならせる、情報処理システム。
JP2021091517A 2021-05-31 2021-05-31 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム Active JP7380653B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2021091517A JP7380653B2 (ja) 2021-05-31 2021-05-31 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム
US17/747,386 US20220382804A1 (en) 2021-05-31 2022-05-18 Information processing apparatus, information processing system, and method of information processing
EP22175036.7A EP4099189A1 (en) 2021-05-31 2022-05-24 Information processing apparatus, information processing system, and computer-implemented method for information processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021091517A JP7380653B2 (ja) 2021-05-31 2021-05-31 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム

Publications (2)

Publication Number Publication Date
JP2022183952A JP2022183952A (ja) 2022-12-13
JP7380653B2 true JP7380653B2 (ja) 2023-11-15

Family

ID=81846188

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021091517A Active JP7380653B2 (ja) 2021-05-31 2021-05-31 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム

Country Status (3)

Country Link
US (1) US20220382804A1 (ja)
EP (1) EP4099189A1 (ja)
JP (1) JP7380653B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016115229A (ja) 2014-12-17 2016-06-23 株式会社富士通コンピュータテクノロジーズ 文字認識支援プログラム、文字認識支援方法及び文字認識支援装置
JP2016189174A (ja) 2015-03-30 2016-11-04 ブラザー工業株式会社 情報特定プログラム、及び情報特定方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5465309A (en) 1993-12-10 1995-11-07 International Business Machines Corporation Method of and apparatus for character recognition through related spelling heuristics
JP3694149B2 (ja) * 1997-07-07 2005-09-14 株式会社リコー 画像検索装置、画像検索用キーテキストの生成方法、並びにその装置としてコンピュータを機能させるためのプログラムおよびその方法をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
US9672510B2 (en) * 2008-01-18 2017-06-06 Mitek Systems, Inc. Systems and methods for automatic image capture and processing of documents on a mobile device
JP5906843B2 (ja) * 2012-03-14 2016-04-20 オムロン株式会社 キーワード検出装置、その制御方法および制御プログラム、並びに表示機器
US9436744B2 (en) * 2014-05-08 2016-09-06 Accenture Global Services Limited Combining internal and external search results
US10824681B2 (en) * 2016-11-21 2020-11-03 Sap Se Enterprise resource textual analysis
US11276321B2 (en) * 2017-11-07 2022-03-15 International Business Machines Corporation Method and system to train users interacting with a search engine
JP7032692B2 (ja) * 2018-01-31 2022-03-09 セイコーエプソン株式会社 画像処理装置および画像処理プログラム
JP7516024B2 (ja) * 2019-09-06 2024-07-16 キヤノン株式会社 情報処理装置、その制御方法及びプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016115229A (ja) 2014-12-17 2016-06-23 株式会社富士通コンピュータテクノロジーズ 文字認識支援プログラム、文字認識支援方法及び文字認識支援装置
JP2016189174A (ja) 2015-03-30 2016-11-04 ブラザー工業株式会社 情報特定プログラム、及び情報特定方法

Also Published As

Publication number Publication date
US20220382804A1 (en) 2022-12-01
JP2022183952A (ja) 2022-12-13
EP4099189A1 (en) 2022-12-07

Similar Documents

Publication Publication Date Title
US9098765B2 (en) Systems and methods for capturing and storing image data from a negotiable instrument
US9031308B2 (en) Systems and methods for recreating an image using white space and check element capture
JP7451968B2 (ja) 情報処理システム、プログラム及び情報処理方法
US20220222760A1 (en) Asset Verification Systems and/or Methods
JP2021071758A (ja) プログラム、方法、及び情報処理システム
US11804055B2 (en) Information processing apparatus, information processing method, and information processing system
US20220197500A1 (en) Parsing Handwriting Into Online Events
US11875587B2 (en) Information processing system, information processing method, and non-transitory recording medium
US12020462B2 (en) Information processing apparatus, information processing method, and computer program product
CN111209909A (zh) 资质识别模板构建方法、装置、设备和存储介质
JP2021060801A (ja) 情報処理システム、情報処理装置、方法及びプログラム
JP7380653B2 (ja) 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム
JP2022017751A (ja) 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム
US11960949B2 (en) Information processing apparatus, information processing system, and information processing method
JP7211276B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP2023081132A (ja) 情報処理システム、帳票認識方法、プログラム、帳票認識システム
JP7447928B2 (ja) 情報処理装置、プログラム、情報処理システム、情報処理方法
JP7456131B2 (ja) 情報処理システム、情報処理方法及びプログラム
JP2023006434A (ja) 情報処理システム、情報処理装置、情報処理方法、情報処理プログラム
US20230244860A1 (en) Information processing apparatus, information processing method, and information processing system
JP2018206423A (ja) ユーザ情報入力支援システム
JP2019133559A (ja) データ入力装置、データ入力プログラム及びデータ入力システム
JP2023081199A (ja) 情報処理装置、情報処理方法、プログラム、情報処理システム
JP2023125761A (ja) 情報処理装置、情報処理方法、プログラム、情報処理システム
JP2023127405A (ja) 情報処理装置、情報処理方法、プログラム、情報処理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220519

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230731

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231003

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231016

R151 Written notification of patent or utility model registration

Ref document number: 7380653

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151