JP2023111566A - 情報処理装置、情報処理方法、プログラム、情報処理システム - Google Patents

情報処理装置、情報処理方法、プログラム、情報処理システム Download PDF

Info

Publication number
JP2023111566A
JP2023111566A JP2022013474A JP2022013474A JP2023111566A JP 2023111566 A JP2023111566 A JP 2023111566A JP 2022013474 A JP2022013474 A JP 2022013474A JP 2022013474 A JP2022013474 A JP 2022013474A JP 2023111566 A JP2023111566 A JP 2023111566A
Authority
JP
Japan
Prior art keywords
information
unit
definition
display
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022013474A
Other languages
English (en)
Inventor
遼 岩崎
Ryo Iwasaki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2022013474A priority Critical patent/JP2023111566A/ja
Priority to US18/053,502 priority patent/US20230244860A1/en
Publication of JP2023111566A publication Critical patent/JP2023111566A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】より効率的に帳票情報の管理を行うことを目的としている。【解決手段】帳票情報に含まれる所定の情報に対する編集が行われた場合に、編集後の前記所定の情報と関連する情報の入力画面を端末装置に表示させる表示制御部と、前記入力画面において入力された情報と、編集後の前記所定の情報とを対応付けた管理情報を格納する記憶部と、を有する情報処理装置である。【選択図】図20

Description

本発明は、情報処理装置、情報処理方法、プログラム、情報処理システムに関する。
従来から、帳票画像に含まれる項目と項目値とを抽出して対応付けた帳票情報を管理するシステムが知られている。
帳票情報は、帳票情報に含まれる所定の情報をキーとして管理されている。しかしながら、従来のシステムでは、帳票情報の出力先となる後段のシステムでの利用を想定して、所定の情報が編集される場合がある。具体的には、例えば、所定の情報に、帳票上で所定の情報と対応付けられていない文字列を追加する編集等が行われる場合がある。このような編集は、従来のシステムの利用者のそれぞれが、利用者の都合に応じて行う可能性があり、所定の情報に対し、このような編集がなされた場合には、帳票情報の管理が煩雑になる。
開示の技術は、上記事情に鑑みて成されたものであり、より効率的に帳票情報の管理を行うことを目的としている。
開示の技術は、帳票情報に含まれる所定の情報に対する編集が行われた場合に、編集後の前記所定の情報と関連する情報の入力画面を端末装置に表示させる表示制御部と、前記入力画面において入力された情報と、編集後の前記所定の情報とを対応付けた管理情報を格納する記憶部と、を有する情報処理装置である。
開示の技術によれば、より効率的に帳票情報の管理できる。
帳票認識システムのシステム構成の一例を示す図である。 サーバ装置のハードウェア構成の一例を示す図である。 端末装置のハードウェア構成の一例を示す図である。 種別判定データベースの一例を示す図である。 帳票定義データベースに格納される帳票定義情報の種類を示す図である。 汎用定義情報の一例を示す図である。 個社定義情報の一例を示す図である。 特定定義情報の一例を示す図である。 管理情報データベースの一例を示す図である。 サーバ装置の機能を説明する図である。 端末装置の機能を説明する図である。 帳票認識システムの動作を説明するシーケンス図である。 ジョブリストの一例を示す図である。 帳票認識部の処理を説明する第一のフローチャートである。 帳票認識部の処理を説明する第二のフローチャートである。 帳票認識部の処理を説明する第三のフローチャートである。 帳票管理部の処理を説明するフローチャートである。 端末装置の表示例を示す第一の図である。 端末装置の表示例を示す第二の図である。 端末装置の表示例を示す第三の図である。
以下に図面を参照して、実施形態について説明する。図1は、帳票認識システムのシステム構成の一例を示す図である。
本実施形態の帳票認識システム100は、サーバ装置200、画像形成装置300、端末装置400を有する。本実施形態の帳票認識システム100において、サーバ装置200と、画像形成装置300と、端末装置400とは、ネットワークを介して接続される。本実施形態の帳票認識システム100は、情報処理システムの一例である。
また、本実施形態の端末装置400は、例えば、ネットワークを介して基幹システム500と接続される。基幹システム500とは、例えば、本実施形態の帳票認識システム100において帳票を認識した結果を用いて、特定の処理を行うシステムである。具体的には、例えば、基幹システム500は、会計システムや、見積もり作成システム等であっても良い。
本実施形態の帳票認識システム100において、サーバ装置200は、画像形成装置300のスキャナ機能によって読み取られた帳票の画像を示す画像データから、帳票に含まれる項目と項目の値とを抽出し、項目と項目の値とを対応付けたテキストデータとする。
以下の説明では、画像形成装置300のスキャナ機能によって読み取られた帳票の画像を帳票画像と呼び、帳票画像を示す画像データを帳票画像データと呼ぶ。なお、画像形成装置300は、帳票認識システム100に含まれなくてもよい。
また、以下の説明では、帳票画像に含まれる項目と、この項の値である項目値とを抽出し、項目と項目値とを対応付けることを、帳票認識と呼ぶ。
本実施形態のサーバ装置200は、記憶部210と、帳票認識部220と、帳票管理部290とを有する。記憶部210には、帳票画像データベース230、種別判定データベース240、帳票定義データベース250、認識結果データベース260、管理情報データベース265が設けられている。
帳票画像データベース230は、帳票画像データが格納される。種別判定データベース240は、帳票の種類を判別する際に参照される情報が格納される。帳票定義データベース250は、帳票認識部220による帳票認識を行う際に参照される明細定義情報が格納される。認識結果データベース260は、帳票認識部220による帳票認識の結果を示す情報である帳票情報(認識結果データ)が格納される。管理情報データベース265は、帳票情報を管理するための管理情報が格納される。
本実施形態の帳票認識部220は、帳票画像データベース230に格納された帳票画像データを取得し、種別判定データベース240を参照して帳票の種類の判定と、参照すべき明細定義情報の特定を行う。そして、帳票認識部220は、帳票定義データベース250において、特定された明細定義情報を用いて帳票認識を行い、その結果として取得された帳票情報を認識結果データベース260へ格納する。明細定義情報とは、帳票に含まれる明細項目の項目名(明細項目名)と項目名の記載位置を示す情報と、を含む。
ここで、本実施形態の帳票認識部220は、帳票認識を行う際に、帳票定義データベース250に格納された、汎用定義情報と、個社定義情報と、特定定義情報と、を参照する。
本実施形態の汎用定義情報とは、一般的な帳票における明細項目名に対応する単語を定義した情報である。個社定義情報とは、帳票認識システム100を利用する利用者固有の帳票における明細項目名に対応する単語と帳票画像から抽出する情報を定義した情報である。特定定義情報は、特定の事業者等によって発行される特定の帳票を定義する帳票定義情報である。特定の帳票とは、具体的には、例えば、一般的に使用されている宅配業者の伝票等である。種別判定データベース240と、帳票定義データベース250の詳細は後述する。
本実施形態では、このように、帳票認識の際に、3種類の明細定義情報を用いることで、汎用的な帳票に加えて、帳票の明細部を認識することができ、帳票の認識の精度を向上させることができる。
本実施形態の帳票管理部290は、帳票認識部220により認識された結果の帳票情報に含まれる所定の情報が編集された場合に、所定の情報と関連する情報を入力させる入力画面を表示させる。
そして、帳票管理部290は、所定の情報に関する情報と、編集後の所定の情報とを対応付けた管理情報を、管理情報データベース265に格納する。
なお、本実施形態における所定の情報とは、認識結果データベース260に格納された帳票情報の管理に用いられる主キーとなる情報である。具体的には、所定の情報は、帳票の発行元を示す情報である。
ここで、本実施形態における帳票の発行元とは、帳票を発行した法人名・個人名のみを示し、支店名や部門名等は含まないものとする。
また、所定の情報と関連する情報とは、所定の情報と、編集後の所定の情報を特定する情報(識別情報)とを含む。言い換えれば、所定の情報と関連する情報とは、帳票の発行元に関連する情報であり、帳票の発行元を示す情報と、編集後の発行元を特定する情報とを含む。
したがって、本実施形態の管理情報は、所定の情報と、編集後の所定の情報を特定する情報と、編集後の所定の情報とを含む。言い換えれば、管理情報は、帳票の発行元と、編集後の発行元を特定する情報と、編集後の発行元とを含む。
このように、本実施形態では、管理情報データベース265において、所定の情報と、編集後の所定の情報とが、別々の項目として、対応付けて管理される。
このため、本実施形態では、帳票情報に含まれる所定の情報が編集された場合であっても、管理情報を参照することで、所定の情報が編集されていない状態と同様に帳票情報を管理することができ、帳票情報の管理を効率的に行うことができる。
本実施形態の帳票認識システム100において、画像形成装置300は、スキャナ機能を有する複合機である。画像形成装置300は、コピー機能、FAX機能、スキャナ機能等を実現するためのアプリケーションが搭載されており、各機能と対応するアプリケーションを選択することで、これらの機能が実現される。
本実施形態の端末装置400は、帳票認識システム100を利用する利用者によって使用される。また、端末装置400には、サーバ装置200による帳票認識の結果を確認させるための画面等が表示されても良い。
なお、本実施形態における利用者とは、例えば、帳票認識システム100が提供するサービスを利用するための契約を締結している事業所や企業、団体等であってよい。
なお、図1の例では、サーバ装置200は、記憶部210内に5つのデータベースを有する構成としたが、これに限定されない。各データベースは、一部がサーバ装置200の外部装置に設けられていても良いし、各データベース全てが外部装置に設けられていても良い。
また、図1の例では、サーバ装置200が帳票認識部220と帳票管理部290とを実現するものとしたが、これに限定されない。帳票認識部220と帳票管理部290とは、複数の情報処理装置によって実現されても良い。
また、図1の例では、帳票認識システム100に含まれる画像形成装置300と端末装置400とは、それぞれ1台としているが、帳票認識システム100に含まれる画像形成装置300と端末装置400の台数は、任意の数であって良い。
次に、図2を参照して、本実施形態のサーバ装置200のハードウェア構成について説明する。図2は、サーバ装置のハードウェア構成の一例を示す図である。
本実施形態のサーバ装置200は、コンピュータによって構築されており、図2に示されているように、CPU201、ROM202、RAM203、HD204、HDD(Hard Disk Drive)コントローラ205、ディスプレイ206、外部機器接続I/F(Interface)208、ネットワークI/F209、データバスB、キーボード211、ポインティングデバイス212、DVD-RW(Digital Versatile Disk Rewritable)ドライブ214、メディアI/F216を備えている。
これらのうち、CPU201は、サーバ装置200全体の動作を制御する。ROM202は、IPL等のCPU201の駆動に用いられるプログラムを記憶する。RAM203は、CPU201のワークエリアとして使用される。HD204は、プログラム等の各種データを記憶する。HDDコントローラ205は、CPU201の制御にしたがってHD204に対する各種データの読み出し又は書き込みを制御する。ディスプレイ206は、カーソル、メニュー、ウィンドウ、文字、又は画像などの各種情報を表示する表示部である。
外部機器接続I/F208は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリやプリンタ等である。ネットワークI/F209は、通信ネットワークNを利用してデータ通信をするためのインターフェースである。データバスBは、図2に示されているCPU201等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
また、キーボード211は、文字、数値、各種指示などの入力のための複数のキーを備えた入力手段の一種である。ポインティングデバイス212は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行う入力手段の一種である。DVD-RWドライブ214は、着脱可能な記録媒体の一例としてのDVD-RW213に対する各種データの読み出し又は書き込みを制御する。なお、DVD-RWに限らず、DVD-R等であってもよい。メディアI/F216は、フラッシュメモリ等の記録メディア215に対するデータの読み出し又は書き込み(記憶)を制御する。
本実施形態のサーバ装置200は、例えば、スマートフォン、タブレット端末、PDA(Personal Digital Assistant)、ウェアラブルPC等であっても良い。
本実施形態の端末装置400は、演算処理装置と記憶装置とを有するコンピュータであり、例えば、タブレット型の端末装置や、スマートフォン等であっても良い。図3は、端末装置のハードウェア構成の一例を示す図である。
本実施形態の端末装置400は、CPU401、ROM402、RAM403、EEPROM404、CMOSセンサ405、撮像素子I/F406、加速度・方位センサ407、メディアI/F409、データバス410、GPS受信部411を備えている。
これらのうち、CPU401は、端末装置400全体の動作を制御する演算処理装置である。ROM402は、CPU401やIPL等のCPU401の駆動に用いられるプログラムを記憶する。RAM303は、CPU301のワークエリアとして使用される。EEPROM404は、CPU401の制御にしたがって、スマートフォン(端末装置)用プログラム等の各種データの読み出し又は書き込みを行う。ROM402、RAM403、EEPROM404は、端末装置400の記憶装置の一例である。
CMOS(Complementary Metal Oxide Semiconductor)センサ405は、CPU401の制御に従って被写体(主に自画像)を撮像して画像データを得る内蔵型の撮像手段の一種である。なお、CMOSセンサではなく、CCD(Charge Coupled Device)センサ等の撮像手段であってもよい。
撮像素子I/F406は、CMOSセンサ305の駆動を制御する回路である。加速度・方位センサ407は、地磁気を検知する電子磁気コンパスやジャイロコンパス、加速度センサ等の各種センサである。メディアI/F409は、フラッシュメモリ等の記録メディア408に対するデータの読み出し又は書き込み(記憶)を制御する。データバス410は、図3に示されているCPU401等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。GPS受信部411は、GPS衛星からGPS信号を受信する。
また、端末装置400は、遠距離通信回路412、遠距離通信回路412のアンテナ412a、マイク415、スピーカ416、音入出力I/F417、ディスプレイ(表示部)418、外部機器接続I/F(Interface)419、近距離通信回路420、近距離通信回路420のアンテナ420a、及びタッチパネル421を備えている。
これらのうち、遠距離通信回路412は、通信ネットワークを介して、他の機器と通信する回路である。マイク415は、音を電気信号に変える内蔵型の回路である。スピーカ416は、電気信号を物理振動に変えて音楽や音声などの音を生み出す内蔵型の回路である。音入出力I/F417は、CPU401の制御に従ってマイク415及びスピーカ416との間で音信号の入出力を処理する回路である。
ディスプレイ418は、被写体の画像や各種アイコン等を表示する液晶や有機EL(Electro Luminescence)などの表示手段の一種である。外部機器接続I/F419は、各種の外部機器を接続するためのインターフェースである。近距離通信回路420は、NFC(Near Field Communication)やBluetooth(登録商標)等の通信回路である。タッチパネル421は、利用者がディスプレイ418を押下することで、端末装置400を操作する入力手段の一種である。ディスプレイ418は、端末装置400の有する表示部の一例である。
次に、本実施形態のサーバ装置200の有する種別判定データベース240と帳票定義データベース250について説明する。
図4は、種別判定データベースの一例を示す図である。本実施形態の種別判定データベース240は、情報の項目として、定義ID、定義種別、文書種別、識別文字列を有する。種別判定データベース240において、項目「定義ID」は、その他の項目と対応付けられており、項目「定義ID」の値と、その他の項目の値とを含む情報を、種別判定情報と呼ぶ。
項目「定義ID」の値は、帳票定義情報を特定するための識別情報を示す。
項目「定義種別」の値は、帳票定義情報の種類を示す。本実施形態では、帳票定義情報の種類として、汎用定義情報と個社定義情報の他に、特定定義情報を含む。特定定義情報とは、特定の事業者等によって発行される特定の帳票を定義する帳票定義情報である。特定の帳票とは、具体的には、例えば、一般的に使用されている宅配業者の伝票等である。
項目「文書種別」の値は、帳票の種類を示す。帳票の種類とは、具体的には、例えば、請求書、見積書、注文書等である。
項目「識別文字列」の値は、帳票の種類を特定するための文字列を示す。具体的には、例えば、「請求書」又は「請求」という文字列を含む帳票画像は、項目「文書種別」が示す帳票の種類が「請求書」となる。
図4の例では、例えば、定義ID「H01」の帳票定義情報の種類は汎用定義情報であり、定義ID「H01」の汎用定義情報は、「請求書」のレイアウトを定義した情報であり、帳票画像データから「請求」又は「請求書」という文字列が抽出された場合に、参照される。
次に、図5乃至図8を参照して、本実施形態の帳票定義データベース250について説明する。図5は、帳票定義データベースに格納される帳票定義情報の種類を示す図である。
本実施形態の帳票定義データベース250には、汎用定義情報251と、個社定義情報252と、特定定義情報253と、が格納されている。
本実施形態の汎用定義情報251とは、帳票の中でも、複数の利用者により利用される汎用性の高いレイアウトの帳票の帳票定義情報である。汎用定義情報251は、3つの帳票定義情報のうち、最も優先度の低い帳票定義情報である。
本実施形態の個社定義情報252とは、帳票の中でも、利用者が独自に設計したレイアウトの帳票の帳票定義情報であり、利用者専用の帳票定義情報である。個社定義情報252は、3つの帳票定義情報のうち、最も尊重されるべき定義であり、最も優先度が高い帳票定義情報である。
本実施形態の特定定義情報253は、帳票の中でも、一般的に利用される帳票のレイアウトを示す帳票定義情報である。特定定義情報253の優先度は、3つの帳票定義情報のうちの中間となる。
本実施形態の帳票認識部220は、この3つの帳票定義情報を参照して、帳票画像データの認識を行う。したがって、本実施形態では、例えば、帳票画像データが、汎用定義情報251においてレイアウトが定義されていない帳票のものであった場合でも、個社定義情報252や特定定義情報253で定義されていれば、この帳票画像データを認識できる。
図6は、汎用定義情報の一例を示す図である。汎用定義情報251は、定義ID毎に生成されるものであり、情報の項目として、項目ID、項目名、方向、距離等を含む。つまり、本実施形態の汎用定義情報251は、項目「定義ID」と、その他の項目とが対応付けられており、項目「定義ID」の値と、その他の項目の値とを含む。
項目「項目ID」の値は、帳票に含まれる項目を特定するための識別情報である。項目「項目名」の値は、項目の名称を示す。
項目「方向」、「距離」等は、文字列を抽出する範囲を示す。例えば、項目「方向」の値が「RD」であり、項目「距離」の値が「20mm」であった場合、項目名となる文字列と外接する矩形の右下の座標から下に向かって20mm以内の範囲から、文字列を抽出することを示す。
つまり、本実施形態の項目「方向」、「距離」等は、文字列を抽出する範囲を示す条件であり、この条件は、項目名と対応付けられている。なお、図5の例では、文字列を抽出する範囲を示す条件として、項目「方向」、「距離」を挙げたが、条件には、他の項目が含まれていても良い。
したがって、例えば、項目ID「2」の項目名「合計」という文字列と外接する矩形の右下の座標から下に向かって20mm以内の範囲から抽出された文字列は、項目名「合計」と対応する項目の値と認識される。
なお、汎用定義情報251では、帳票に含まれる全ての項目に関する情報が含まれるものとした。
図7は、個社定義情報の一例を示す図である。本実施形態の個社定義情報252は、利用者毎に登録されるものであり、情報の項目として、利用者ID、定義ID、項目名、方向、距離等を含む。
項目「利用者ID」の値は、利用者を特定するための識別情報である。なお、本実施形態では、定義ID、項目名、方向、距離等は、汎用定義情報251と同様であるから説明を省略する。
なお、本実施形態では、定義種別が個社定義情報となる帳票定義情報の定義IDは、利用者IDを含むようにしても良い。
また、個社定義情報252では、利用者によって、項目名と、項目の値が記載されている範囲を示す条件とが登録された項目に関する情報が格納される。したがって、個社定義情報252に含まれる項目IDは、汎用定義情報251に含まれる項目IDの一部となる場合がある。
図7の例では、利用者ID「A」によって登録された個社定義情報252を示しており、この個社定義情報252は、定義IDが「A01」であり、文書種別が「R社用請求書」となる。
図8は、特定定義情報の一例を示す図である。本実施形態の特定定義情報253は、特定の帳票毎に登録されるものであり、情報の項目として、定義ID、項目名、方向、距離等を含む。図8の本実施形態では、定義ID、項目名、方向、距離等は、汎用定義情報251と同様であるから説明を省略する。
なお、本実施形態の特定定義情報253は、特定の事業者毎に設けられていても良い。この場合には、特定定義情報253には、情報の項目として、事業者IDが含まれていても良い。
また、以下の説明では、請求書を帳票の一例とし、請求書情報を帳票情報の一例とし、請求書の発行元(請求元)を、請求書情報の管理に用いる所定の情報(主キー)として説明する。
以下に、図9を参照して、本実施形態の管理情報データベース265について説明する。図9は、管理情報データベースの一例を示す図である。
本実施形態の管理情報データベース265は、情報の項目として、管理情報ID、請求元の名称、編集後の請求元の名称、電話番号、口座情報を含む。
項目「管理情報ID」の値は、管理情報に付与される情報であり、管理情報を特定するための識別情報である。管理情報IDは、例えば、管理情報が管理情報データベース265に格納される際に付与されてもよい。
項目「請求元の名称」の値は、請求書の請求元の名称を示す。より具体的には、項目「請求元の名称」の値は、法人名・個人名のみであり、支店名や部門名等は含まない。なお、請求元の名称とは、言い換えれば、所定の情報である。
項目「編集後の請求元の名称」の値は、編集後の請求書情報に含まれる請求元を示す。より具体的には、「編集後の請求元の名称」とは、請求書情報の主キーとなる項目「請求元」の編集後の項目値を示す。言い換えれば、編集後の請求書情報の請求元は、編集後の所定の情報である。
項目「電話番号」の値は、編集後の請求元の名称と対応する電話番号であり、項目「口座番号」の値は、編集後の請求元の名称と対応する口座番号である。つまり、項目「電話番号」、「口座番号」の値は、編集後の請求元の名称を特定する情報と言える。言い換えれば、項目「電話番号」、「口座番号」の値は、編集後の帳票の発行元を特定する情報である。
このように、本実施形態の管理情報データベース265に格納される管理情報では、請求元を示す情報と、編集後の請求元を示す情報と、編集後の請求元を特定する情報とが対応付けられている。
次に、図10を参照して、本実施形態のサーバ装置200の機能について説明する。図10は、サーバ装置の機能を説明する図である。
本実施形態のサーバ装置200では、例えば、RAM203やHD204等に格納された情報処理プログラムをCPU201が読み出して実行することで、後述する各部の機能が実現される。
本実施形態のサーバ装置200は、帳票認識部220、帳票管理部290、通信部298を有する。帳票認識部220は、入力受付部221、認証処理部222、認識処理部270を有する。帳票管理部290は、操作受付部291、表示制御部292、情報更新部293を含む。
帳票認識部220において、入力受付部221(第一の入力受付部)は、サーバ装置200に対する各種の入力を受け付ける。具体的には、入力受付部221は、帳票認識システム100にログインするための認証情報の入力を受け付ける。認証情報とは、例えば、利用者IDとパスワード等である。また、入力受付部221は、例えば、画像形成装置300から送信された帳票画像データの入力を受け付ける。また、入力受付部221は、端末装置400から送信される各種の要求や通知を受け付ける。入力受付部221は、通信部298を介してサーバ装置200に対する入力を受け付けて良いし、サーバ装置200に対して直接行われた入力を受け付けても良い。
認証処理部222は、入力受付部221が入力を受け付けた認証情報に基づき、認証を行う。なお、認証処理部222は、例えば、サーバ装置200の外部に設けられた認証サーバに対して、入力された認証情報を送信し、認証サーバによる認証の結果を取得しても良い。認証処理部222は、利用者が認証されると、入力受付部221が受け付けた帳票画像データを認識処理部270に渡しても良い。
本実施形態の認識処理部270は、画像データ格納部271、ジョブリスト生成部272、画像データ取得部273、前処理部274、文字認識部275、定義特定部276、項目抽出部277、表示画面生成部278、出力部279を有する。
画像データ格納部271は、入力受付部221が、画像形成装置300から通信部298を介して帳票画像データを受信すると、帳票画像データベース230に格納する。
ジョブリスト生成部272は、入力受付部221が、通信部298を介して画像形成装置300から帳票画像データの入力を受け付けると、ジョブリストにジョブを登録し、ジョブリストを管理する。ジョブリストの詳細は後述する。
画像データ取得部273は、帳票画像データベース230に格納された帳票画像データを取得する。前処理部274は、画像データ取得部273が取得した帳票画像データに対して、帳票認識を行うための前処理を行う。
文字認識部275は、帳票画像データから、文字列と、文字列が配置された位置を示す情報とを抽出し、読取結果データとして保持する。読取結果データの詳細は後述する。
定義特定部276は、読取結果データに含まれる文字列に基づき、帳票認識の際に参照する明細定義情報を特定し、特定した明細定義情報を帳票定義データベース250から取得する取得部である。
項目抽出部277は、読取結果データに基づき、帳票画像データに含まれる項目と、項目の値とを抽出して対応付けを行った認識結果データを生成し、認識結果データベース260へ格納する。
このとき、本実施形態の項目抽出部277は、定義特定部276により特定された明細定義情報を参照し、帳票の明細部に記載された明細項目名と、明細項目の値とを対応付けて抽出する。
以下の説明では、帳票の明細部に記載された明細項目名と、明細項目の値とを対応付けた情報を明細情報と呼ぶ場合がある。本実施形態の明細情報は、認識結果データに含まれる情報であり、認識結果データの一部である。
また、本実施形態の認識結果データは、帳票に記載された帳票の発行元を示す情報(発行元情報)等を含む。つまり、認識結果データには、帳票に記載された文字列が示す情報が含まれる。
表示画面生成部278は、認識結果データベース260に格納された認識結果データを用いて、認識結果の確認画面を生成する。
出力部279は、表示画面生成部278が生成した認識結果の確認画面を、通信部298を介して出力する。言い換えれば、出力部279は、表示画面生成部278が生成した認識結果の確認画面を、通信部298を介して端末装置400のウェブブラウザ上で表示させる。
本実施形態の帳票管理部290は、操作受付部291、表示制御部292、情報更新部293を有する。
操作受付部291は、通信部298を介して、端末装置400のウェブブラウザ上に表示された画面に対して入力された操作を受け付ける。より具体的には、本実施形態では、通信部298が端末装置400から操作を示す情報を受信し、操作受付部291が、通信部298が受信した情報の入力を受け付ける。
表示制御部292(第一の表示制御部)は、通信部298を介して、端末装置400に対する画面の表示を指示する。具体的には、表示制御部292は、管理情報を登録するための入力画面や、個社定義情報を生成するための入力画面を端末装置400に表示させる。また、表示制御部292は、画面を表示させるためのXML形式のファイルを生成し、通信部298を介して端末装置400のウェブブラウザ上に入力画面を表示させる。
なお、表示制御部292が画面を表示させる装置は、サーバ装置200であっても良いし、端末装置400以外の装置あっても良く、表示機能を有する表示装置であれば良い。
情報更新部293は、端末装置400から入力された情報に基づき、個社定義情報を生成して帳票定義データベース250へ格納する。また、情報更新部293は、端末装置400から入力された情報に基づき、管理情報を生成して管理情報データベース265へ格納する。
本実施形態の通信部298は、例えば、ネットワークI/F209等によって実現される機能であり、サーバ装置200と外部装置との間でデータの送受信を行う。具体的には、例えば、通信部298は、表示制御部292に制御に応じて、端末装置400に対して、画面の表示を指示する通知を送信する。
次に、図11を参照して、本実施形態の端末装置400の機能について説明する。図11は、端末装置の機能を説明する図である。
後述する各部の機能は、端末装置400の有するCPU401が、ROM402等に格納されたプログラムを読み出して実行することで実現される。
本実施形態の端末装置400は、入力受付部431、表示制御部432、通信部433を有する。
入力受付部431(第二の入力受付部)は、表示制御部432によって端末装置400のウェブブラウザ上に表示された画面に対する入力を受け付ける。具体的には、入力受付部431は、端末装置400のウェブブラウザ上に表示された、認識結果の確認画面に対し、認識結果を編集する操作を受け付ける。
表示制御部432(第二の表示制御部)は、端末装置400のディスプレイ418の表示を制御する。具体的には、表示制御部432は、サーバ装置200からの指示に応じた画面をディスプレイ418(表示部)に表示させる。
通信部433は、遠距離通信回路412、遠距離通信回路412のアンテナ412a等によって実現される機能であり、端末装置400と他の装置との間でデータの送受信を行う。
以下に、図12を参照して、本実施形態の帳票認識システム100の動作について説明する。図12は、帳票認識システムの動作を説明するシーケンス図である。
帳票認識システム100において、画像形成装置300は、利用者から帳票認識を行うためのアプリケーションの起動要求を受け付けると(ステップS1201)、このアプリケーションを起動させる(ステップS1202)。
続いて、画像形成装置300は、利用者から認証情報の入力を受け付けると(ステップS1203)、この認証情報をサーバ装置200へ送信し、認証要求を行う(ステップS1204)。
サーバ装置200は、認証要求を受けて、認証処理部222により認証を行い、その結果を画像形成装置300へ通知する(ステップS1205)。なお、ここでは、利用者が認証された場合の動作を示している。
続いて、画像形成装置300は、帳票のスキャン指示を受け付け(ステップS1206)、帳票のスキャンを行い、帳票画像データを取得する(ステップS1207)。続いて、画像形成装置300は、帳票画像データをサーバ装置200へ送信する(ステップS1208)。
サーバ装置200は、入力受付部221が帳票画像データの入力を受け付けると、認証処理部222がこの帳票画像データを認識処理部270へ渡す(ステップS1209)。なお、図12の例では、認証処理部222を介して帳票画像データが認識処理部270へ渡されるものとしたが、これに限定されない。帳票画像データは、認証処理部222を介さずに認識処理部270に渡されても良い。
サーバ装置200の認識処理部270は、帳票画像データを受け取ると、ジョブリスト生成部272により、ジョブリストにジョブを登録する(ステップS1210)。続いて、認識処理部270は、画像データ格納部271により、帳票画像データを帳票画像データベース230へ格納する(ステップS1211)。
続いて、認識処理部270は、画像データ取得部273により、帳票画像データベース230から認識する対象となる帳票画像データを取得し(ステップS1212)、帳票画像を認識する処理を実行する(ステップS1213)。ステップS1212の処理の詳細は後述する。
続いて、認識処理部270は、項目抽出部277が生成した認識結果データを認識結果データベース260に格納する(ステップS1214)。
帳票認識システム100において、端末装置400は、入力受付部431により、利用者からのブラウザの表示指示の入力を受け付けると(ステップS1215)、通信部433を介して、サーバ装置200に対して認識結果データを表示させるブラウザの表示要求を行う(ステップS1216)。
また、端末装置400は、入力受付部431により、利用者から認証情報の入力を受け付けて(ステップS1217)、通信部433により、この認証情報をサーバ装置200へ送信する(ステップS1218)。
サーバ装置200は、認証処理部222により、利用者の認証を行い(ステップS1219)、その結果を端末装置400へ通知し、ジョブリストの一覧を端末装置400に表示させる(ステップS1220)。なお、ここでは、利用者が認証された場合の処理を示す。
続いて、端末装置400は、入力受付部431により、ジョブリストの一覧からジョブの選択を受け付けると(ステップS1221)、この選択を、帳票画像の認識結果の閲覧指示として、通信部433により、サーバ装置200に対して閲覧要求を行う(ステップS1222)。
サーバ装置200は、閲覧要求を受けて、認識処理部270により、認識結果データベース260に格納されている認識結果データを取得し(ステップS1223)、認識結果の確認画面を生成して端末装置400のブラウザ上に表示させ(ステップS1224)、利用者に、表示された認識結果の確認画面で認識結果を確認させる。
続いて、端末装置400は、入力受付部431により、個社定義情報や管理情報の登録指示の入力を受け付けると(ステップS1225)、通信部433を介して、個社定義情報や管理情報の登録要求をサーバ装置200へ送信する(ステップS1226)。この登録要求は、言い換えれば、個社定義情報や管理情報を入力するための入力画面の表示要求である。
サーバ装置200は、入力受付部221により、この表示要求を受け付けると、帳票管理部290の表示制御部292により、端末装置400に個社定義情報や管理情報の入力画面を表示させる(ステップS1227)。
続いて、端末装置400は、個社定義情報や管理情報の入力を受け付けると(ステップS1228)、入力された情報をサーバ装置200へ送信する(ステップS1229)。サーバ装置200における帳票管理部290は、情報更新部293により、端末装置400から送信された情報に基づき、個社定義情報や管理情報を生成し(ステップS1230)、帳票定義データベース250や管理情報データベース265に格納して(ステップS1231)、処理を終了する。
ここで、図13を参照して、本実施形態のジョブリスト生成部272により生成されるジョブリストについて説明する。図13は、ジョブリストの一例を示す図である。
本実施形態のサーバ装置200は、画像形成装置300から帳票画像データが入力されると、ジョブリスト生成部272により、帳票画像データとジョブIDとを対応付けたジョブリストとして保持する。
本実施形態のジョブリスト101は、情報の項目として、ジョブID、利用者ID、帳票画像ファイルパス、認識結果ファイルパス、ステータスを有する。
項目「ジョブID」の値は、ジョブを特定する識別情報である。言い換えれば、項目「ジョブID」の値は、画像形成装置300から受信した帳票画像データを特定するための識別情報である。
項目「利用者ID」の値は、帳票認識システム100にログインした利用者を特定するための識別情報である。
項目「画像ファイルパス」の値は、帳票画像データが格納されている場所を示す情報である。項目「認識結果ファイルパス」の値は、帳票画像を認識した結果の認識結果データが格納されている場所を示す情報である。
項目「ステータス」の値は、帳票画像の認識の進捗を示す。言い換えれば、項目「ステータス」の値は、ジョブの状態を示す。
本実施形態では、項目「ステータス」の値として、未処理状態、下書き保存状態、確定済み状態、外部出力済み状態の4つがある。各状態は、以下の通りである。
・未処理状態(状態1) 帳票認識によって認識結果データが取得された直後であり、認識結果の確認等が行われていない状態。
・下書き保存状態(状態2) 認識結果データの確認等の作業の途中等であり、認識結果データが確定される前の状態。
・確定済み状態(状態3) 認識結果データの確認等の作業が完了し、確定された情報として認識結果データベース260へ格納された状態。
・外部出力済み状態(状態4) 帳票認識システム100と連携する基幹システム500への認識結果データの出力が完了した状態。
本実施形態のサーバ装置200は、画像形成装置300から帳票画像データを受信すると、ジョブリスト生成部272により、ジョブIDを付与し、認証情報として取得した利用者IDを対応付けて、ジョブリスト101にレコードを追加する。そして、ジョブリスト生成部272は、帳票画像データが帳票画像データベース230に格納されると、この格納先を示す情報を項目「画像ファイルパス」の値として、追加する。
さらに、ジョブリスト生成部272は、認識結果データが認識結果データベース260に格納されると、この格納先を示す情報を項目「認識結果ファイルパス」の値として追加し、項目「ステータス」の値を確定済み状態とする。
本実施形態では、例えば、ジョブリスト生成部272によって生成されたジョブリストを表示しても良い。この場合、利用者は、ジョブリストに基づいて表示されたジョブリスト画面を介して、帳票画像の認識の進捗を確認することができる。
次に、図14を参照して、本実施形態の認識処理部270の処理について説明する。図14は、帳票認識部の処理を説明する第一のフローチャートである。図14では、図12のステップS1213の処理の詳細を示している。また、図14では、複数の帳票画像データを画像形成装置300から受け取った場合の処理を示している。
本実施形態の認識処理部270は、画像データ取得部273により、帳票画像データベース230から帳票画像データを取得すると(ステップS1401)、前処理部274により、帳票画像データの形式をpng形式に変換する(ステップS1402)。
続いて、前処理部274は、1ページ分の帳票画像データを選択し(ステップS1403)、前処理を行う(ステップS1404)。前処理とは、具体的には、例えば、帳票画像の向きを揃える補正処理等である。
続いて、認識処理部270は、文字認識部275により、帳票画像から、文字が形成されている領域(以下、文字フィールド)を切り取る(ステップS1405)。続いて、認識処理部270は、文字認識部275により、切り取られた文字フィールドの中の文字を切り取り、文字認識する(ステップS1406)。このとき、文字認識部275は、切り出した文字の位置を示す座標も取得する。
続いて、認識処理部270は、文字認識部275により認識された各文字の位置関係に基づいて読取結果データを生成して、保持する(ステップS1407)。具体的に、認識処理部270は、認識された各文字の座標に基づいて、互いの距離が予め設定された閾値以内の文字を1つの文字列として認識し、文字列と、文字列が形成された領域の位置を示す座標などの情報とを対応付けて読取結果データを生成する。読取結果データの詳細は後述する。
続いて、認識処理部270は、項目抽出部277により、読取結果データと種別判定データベース240と、管理情報データベース265と、に基づき特定した個社定義情報252を用いて、項目と項目の値とを抽出する(ステップS1408)。
続いて、認識処理部270は、項目抽出部277により、読取結果データと種別判定データベース240とに基づき特定した特定定義情報253を用いて、項目と項目の値とを抽出する(ステップS1409)。
続いて、認識処理部270は、項目抽出部277により、読取結果データと種別判定データベース240とに基づき特定した汎用定義情報251を用いて、項目と項目の値とを抽出する(ステップS1410)。ステップS1408からステップS1410の各処理の詳細は後述する。
続いて、認識処理部270は、項目と、項目の値との抽出に成功したか否かを判定する(ステップS1411)。具体的には、認識処理部270は、ステップS1408からステップS1410までの間で、項目抽出部277により抽出された項目と項目の値とが存在する場合に、項目と、項目の値との抽出に成功したと判定しても良い。
ステップS1411において、項目と項目の値の抽出に失敗した場合、認識処理部270は、端末装置400又は画像形成装置300に対してエラーを通知し(ステップS1412)、後述するステップS1415へ進む。
ステップS1411において、項目と項目の値との抽出に成功すると、認識処理部270は、項目抽出部277により、抽出された項目と項目の値とを対応付けてマージした認識結果データを生成する(ステップS1413)。マージする処理の詳細は後述する。
続いて、認識処理部270は、ジョブリスト生成部272により、認識結果データの生成に用いられた帳票定義情報の定義IDと、認識結果データの格納先とを、ジョブリスト101に登録する(ステップS1414)。
続いて、認識処理部270は、最後のページまで処理を実行したか否かを判定する(ステップS1415)。ステップS1415において、最後のページまで処理を実行していない場合、認識処理部270は、ステップS1403へ戻る。
ステップS1415において、最後のページまで処理を実行した場合、認識処理部270は、表示画面生成部278により、認識結果データを用いて生成された認識結果確認画面を端末装置400に表示させ(ステップS1416)、処理を終了する。
なお、認識処理部270は、端末装置400から、認識結果データの閲覧要求を受け付けてから、認識結果データを表示させてもよい。
次に、図15を参照して、本実施形態の項目抽出部277の処理について説明する。図15は、帳票認識部の処理を説明する第二のフローチャートである。図15は、図14のステップS1408~ステップS1410までにおいて行われる各定義情報を特定する処理の詳細を示す。
本実施形態の認識処理部270は、読取結果データが保持されると、定義特定部276により、種別判定データベース240から、読取結果データに含まれる識別文字列と対応する定義IDを抽出する(ステップS1501)。
続いて、定義特定部276は、抽出した定義IDの中に、定義種別が個社定義情報である定義IDが存在するか否かを判定する(ステップS1502)。つまり、ここでは、読取結果データに含まれる識別文字列が示す種類の帳票に対して、個社定義情報252が登録されているか否かを判定している。
ステップS1502において、該当する定義IDが存在しない場合、この種類の帳票には、利用者固有のレイアウトを定義した個社定義情報252は登録されていないため、項目抽出部277は、処理を終了し、図14のステップS1409へ進む。
ステップS1402において、該当する定義IDが存在する場合、定義特定部276は、帳票定義データベース250を参照し、定義IDを含む個社定義情報252を特定する(ステップS1503)。該当する定義IDが存在する場合とは、この帳票は、利用者固有のレイアウトである場合である。ステップS1503の詳細は後述する。
続いて、項目抽出部277は、特定された個社定義情報に基づき、読取結果データから、項目と、項目の値とを抽出し、対応付ける(ステップS1504)。
尚、ステップS1409における特定定義情報を用いた項目と項目の値の抽出処理と、ステップS1410における汎用定義情報251を用いた項目と項目の値の抽出処理とは、ステップS1408の個社定義情報が、特定定義情報又は汎用定義情報となること以外は同様であるから、説明を省略する。
次に、図16を参照して、個社定義情報を特定する処理について説明する。図16は、帳票認識部の処理を説明する第三のフローチャートである。図16では、図15のステップS1503における、定義特定部276の処理の詳細を示している。より具体的には、図16は、個社定義情報を特定する処理を示している。
本実施形態の定義特定部276は、認識結果データベース260へ格納された認識結果データのうち、確定済み状態とされた認識結果データを選択する(ステップS1601)。
続いて、定義特定部276は、選択された認識結果データと、図14のステップS1407で保持された読取結果データとを比較し、文字の一致率が所定の閾値以上であるか否かを判定する(ステップS1602)。
ステップS1602において、文字の一致率が所定の閾値未満である場合には、定義特定部276は、後述するステップS1609へ進む。
ステップS1602において、文字の一致率が所定の閾値以上である場合、定義特定部276は、読取結果データにおける項目「請求元」の値が、管理情報データベース265の項目「編集後の請求元の名称」に含まれるか否か判定する(ステップS1603)。ステップS1603において、項目「請求元」の値が、管理情報データベース265の項目「請求元の名称」に含まれない場合、定義特定部276は、後述するステップS1609へ進む。
ステップS1603において、項目「請求元」の値が、管理情報データベース265の項目「請求元の名称」に含まれる場合、定義特定部276は、項目「請求元の名称」の値が項目「請求元」の値と一致する管理情報を特定する(ステップS1604)。
続いて、定義特定部276は、読取結果データに含まれる項目のうち、項目の値が、特定された管理情報に含まれる項目の値と一致する項目が存在するか否かを判定する(ステップS1605)。なお、ステップS1605では、項目の値が、特定された管理情報に含まれる項目の値と完全に一致していなくてもよく、項目の値が、特定された管理情報に含まれる項目の値の一部と一致していれば、一致するものと判定する。
ステップS1605において、該当する項目が存在しない場合、定義特定部276は、後述するステップS1609へ進む。
ステップS1605において、該当する項目が存在する場合、該当する項目により、請求元が1つに特定されるか否かを判定する(ステップS1606)。
ステップS1606において、請求元が1つに特定される場合、定義特定部276は、特定された管理情報を、請求元を特定する際に参照すべき管理情報として、リストに保持し(ステップS1607)、ステップS1609へ進む。なお、このリストには、管理情報に含まれる管理情報IDのみが保持されてもよい。
ステップS1606において、請求元が1つに特定されない場合、定義特定部276は、リストに登録する管理情報を選択し(ステップS1608)、ステップS1607へ進む。
具体的には、定義特定部276は、特定された管理情報のうち、管理情報に含まれる文字列が、読取結果データに含まれる文字列と一致する数が多い管理情報を選択する。
定義特定部276は、リストに管理情報を格納すると、認識結果データベース260において、全ての確定済み状態とされた認識結果データについて、ステップS1608までの処理を行ったか否かを判定する(ステップS1609)。
ステップS1609において、全ての確定済み状態の認識結果データについて、処理を行っていない場合、定義特定部276は、ステップS1601へ戻る。
ステップS1609において、全ての確定済み状態の認識結果データについて、処理を行った場合、定義特定部276はリストに格納された管理情報を参照し、請求元を特定する(ステップS1610)。
具体的には、定義特定部276は、リストに格納された管理情報のうち、文字列が、読取結果データの文字列と一致する数が最も多い管理情報を特定し、特定された管理情報の請求元の名称を、請求元に特定する。
続いて、定義特定部276は、特定された請求元と対応する個社定義情報を、帳票認識に用いる個社定義情報に特定し(ステップS1611)、処理を終了する。
本実施形態では、このように、管理情報データベース265に格納された管理情報を用いて請求元を特定する。したがって、本実施形態によれば、請求元を高い精度で特定することができる。
さらに、本実施形態では、請求元を高い精度で特定することができるため、適切な個社定義情報を特定することができ、帳票認識の精度を向上させることができる。
次に、図17を参照して、帳票管理部290による管理情報の登録について説明する。図17は、帳票管理部の処理を説明するフローチャートである。図17では、図12のステップS1221からステップS1231までの処理の詳細を示す。
本実施形態の帳票管理部290は、操作受付部291により、端末装置400からの認識結果データの閲覧指示を受け付けると、表示制御部292により、認識結果データの確認画面を端末装置400に表示させる(ステップS1701)。
続いて、帳票管理部290は、操作受付部291により、端末装置400からの認識結果データの登録要求を受け付けたか否かを判定する(ステップS1702)。具体的には、サーバ装置200は、認識結果データベース260に対する、確認画面に表示された認識結果データの格納が指示されたか否かを判定している。
ステップS1702において、登録要求を受け付けない場合、帳票管理部290は、後述するステップS1707へ進む。
ステップS1702において、登録要求を受け付けた場合、帳票管理部290は、認識結果データに対して修正が行われたか否かを判定する(ステップS1703)。
ステップS1703において、修正が行われていない場合、帳票管理部290は、処理を終了する。
ステップS1703において、修正が行われていた場合、帳票管理部290は、この認識結果データを生成する際に、個社定義情報252が参照されているか否かを判定する(ステップS1704)。具体的には、帳票管理部290は、読取結果データに含まれる請求元と対応付けられた個社定義情報252が存在するか否かを判定している。
ステップS1704において、個社定義情報が参照されていない場合、帳票管理部290は、後述するステップS1708へ進む。
ステップS1704において、個社定義情報が参照されている場合、帳票管理部290は、修正された箇所が請求元であるいか否かを判定する(ステップS1705)。
ステップS1705において、修正された箇所が請求元でない場合、帳票管理部290は、情報更新部293により、個社定義情報を修正内容に合わせて更新し(ステップS1706)、処理を終了する。修正された箇所が請求元でない場合とは、例えば、認識結果データにおける明細部の修正が行われた場合等である。
なお、本実施形態では、帳票管理部290による処理が終了した後に、認識結果データの登録を行ってもよい。具体的には、帳票管理部290は、図17の処理が終了した後に、認識結果データを認識結果データベース260に格納してもよい。
ステップS1705において、修正(編集)された箇所が請求元である場合、帳票管理部290は、表示制御部292により、管理情報の入力画面を端末装置400に表示させる(ステップS1707)。
続いて、帳票管理部290は、操作受付部291により、端末装置400に表示された入力画面に対する情報の入力を受け付ける(ステップS1708)。
続いて、帳票管理部290は、情報更新部293により、管理情報データベース265を更新し(ステップS1709)、処理を終了する。
具体的には、情報更新部293は、入力画面に入力された情報と、認識結果データの確認画面において修正された請求元とを対応付けて管理情報を生成し、生成した管理情報を管理情報データベース265に格納する。
確認画面において修正された請求元とは、言い換えれば、編集後の発行元であり、編集後の所定の情報である。
ステップS1702において、認識結果の登録要求を受け付けない場合、帳票管理部290は、操作受付部291により、帳票定義の登録指示を受け付けたか否かを判定する(ステップS1710)。
ステップS1710において、帳票定義の登録指示を受け付けない場合、帳票管理部290は、ステップS1701へ戻る。
ステップS1701において、帳票定義の登録指示を受け付けた場合、帳票管理部290は、表示制御部292により、個社定義情報252の入力画面を端末装置400に表示させる(ステップS1711)。
続いて、帳票管理部290は、操作受付部291により、入力画面に対する個社定義情報の入力を受け付ける(ステップS1712)。
続いて、帳票管理部290は、情報更新部293により、帳票定義データベース250に、入力された個社定義情報252を格納して(ステップS1713)、処理を終了する。
以下に、図18乃至図20を参照して、端末装置400の表示例について説明する。図18は、端末装置の表示例を示す第一の図である。
図18に示す画面501は、例えば、図11のステップS1224で端末装置400に表示される認識結果の確認画面の一例である。
画面501は、表示欄502、表示欄503と、表示部品508、509とを含む。表示欄502には、帳票画像データが示す帳票画像が表示される。図18の例では、帳票が請求書であり、帳票画像における明細部を示す領域504が含まれる。
図20に示すように、帳票画像における明細部は、表形式で表される。つまり、帳票画像における明細部は、表形式の画像の一例である。
表示欄503は、表示欄502に表示された帳票画像を示す帳票画像データに対して帳票認識部220による帳票認識を行った結果の認識結果データが表示される。
表示欄503は、表示欄505、506、507を含む。表示欄505は、ジョブリスト101の項目「ステータス」の値が表示される。表示欄506は、請求元を含む請求元情報が表示される。請求元情報は、認識結果データの一部である。
また、表示欄506は、表示欄506aを含む。表示欄506aは、請求元の名称「○○商事株式会社」が表示される。なお、図18に示す表示欄506aに表示された請求元の名称は、表示欄502に表示された帳票画像データから抽出された請求元の名称である。つまり、図18に示す表示欄506aには、編集前の請求元の名称が表示されている。
表示欄507は、明細情報が表示される。具体的には、表示欄507には、明細情報に含まれる明細項目の値の一覧が表示される。表示欄507は、表示欄511、512、513、514、515、516を含む。また、表示欄507は、表示部品510を含む。
表示部品510は、抽出ガイド画像の表示を指示するための表示部品である。言い換えれば、表示部品510は、表形式の画像から抽出する項目名と項目値の領域の設定指示をサーバ装置200に対して通知するための表示部品である。
表示欄511は、帳票画像における明細部を示す領域504に表示された、明細項目名「品名」の明細項目の値が表示される。表示欄512は、領域504に表示された、明細項目名「商品コード」の明細項目の値が表示される。表示欄513は、領域504に表示された、明細項目名「商品金額」の明細項目の値が表示される。
表示欄514は、領域504に表示された、明細項目名「単価」の明細項目の値が表示される。表示欄515は、領域504に表示された、明細項目名「数量」の明細項目の値が表示される。表示欄516は、領域504に表示された、明細項目名「注文番号」の明
本実施形態では、このように、帳票画像の明細部における明細項目名のそれぞれに対応する項目から項目値を抽出して、表示欄511、512、513、514、515、516に表示する。すなわち、これらの明細項目名に対応する項目は、抽出の対象となる項目(抽出対象項目)である。また、抽出対象項目は、固定に決められた項目であってもよいし、ユーザにより変更できるようにしてもよい。
図18の例では、帳票画像データからの認識結果データの抽出が成功した場合を示している。したがって、領域504に表示された明細部の全ての明細項目名の値が表示欄507に表示されている。
表示部品508は、ジョブリスト101のステータスの値を、未処理状態から下書き保存状態とするための表示部品である。表示部品508が操作されると、表示欄505は、「未処理」から「下書き保存」に変化する。
表示部品509は、ジョブリスト101のステータスの値を、確定済み状態とするための表示部品である。本実施形態では、表示部品509が操作されると、ジョブリスト101のステータスの値が、確定済み状態とされ、個社定義情報252の生成は行われない。
次に、図19を参照して、請求元が編集された場合について説明する。図19は、端末装置の表示例を示す第二の図である。
図19に示す画面501Aにおいて、表示欄506aには、編集前の請求元の名称「○○商事株式会社」に加えて、「××支店」が入力されている。言い換えれば、図19に示す画面501Aでは、請求元の名称は編集されており、表示欄506aには、編集後の請求元の名称が表示されている。
本実施形態では、図19に示す画面501Aにおいて、表示部品509が操作されると、図18の表示欄506aに表示された、編集前の請求元の名称と関連する情報を入力するための入力画面を表示させる。
図20を参照して、入力画面について説明する。図20は、端末装置の表示例を示す第三の図である。
図20に示す画面501Bには、入力画面520が表示される。入力画面520は、入力欄521、522、523、表示欄524、表示部品525を含む。
入力欄521は、請求元の名称を入力するための入力欄であり、入力欄522は、請求元の電話番号を入力するための入力欄であり、入力欄523は、請求元の口座番号を入力するための入力欄である。
言い換えれば、入力欄521は、編集前の請求元の名称が入力され、入力欄522と、入力欄523とは、編集後の請求元を特定するための情報が入力される。
表示欄524は、入力欄521、522、523に情報を入力する際の注意事項が表示される。具体的には、表示欄524には、入力欄521に請求元を入力する際に、支店名、部門名等を入力せず、法人名や個人名のみを入力することを促すメッセージが表示される。また、表示欄524には、入力欄522、523には、表示欄502に表示された帳票画像に含まれる電話番号と口座番号とを入力することを促すメッセージが表示される。
表示部品525は、入力欄521~523に対する入力が完了した後に操作される。本実施形態において、端末装置400は、入力欄521~523に対する入力が完了し、表示部品525が操作されると、入力画面520において入力された情報を、サーバ装置200に送信する。
サーバ装置200は、入力画面において入力された情報を受け付けると、この情報と、表示欄506aに表示された編集後の請求元と対応付けて管理情報とし、管理情報データベース265に格納する。
図20の例では、表示欄506aに表示された、編集後の請求元「○商事株式会社××支店」と、入力欄521に入力された、編集前の請求元「○○商事株式会社」と、入力欄522に入力された電話番号と、入力欄523に入力された口座番号とが対応付けられて、管理情報とされる。
このように、本実施形態では、認識結果データにおいて、請求元が編集された場合には、編集後の請求元と、編集前の請求元を対応付けるための情報を入力させるための入力画面を端末装置400に表示させる。そして、本実施形態では、入力された情報と、編集後の請求元とを対応付けた管理情報を生成して管理情報データベース265に格納することで、編集後の請求元と、編集前の請求元とを別々の項目として管理することができる。
したがって、本実施形態によれば、帳票認識において抽出された帳票の発行元が、ユーザによって編集された場合であっても、管理情報データベース265を参照することで、帳票情報を、発行元が編集される前と同じように、効率的に管理することができる。
以下に、基幹システム500を会計システムとし、帳票認識システム100のユーザが、会計システムで認識結果データを利用することを想定して、請求元(会社名)に、請求元の支店名、請求先の支店名、認識結果データの用途といった文字列を追加する編集を行った場合について説明する。
この場合、編集によって追加された文字列は、請求書(帳票)上においては、請求元と一連の文字列として記載されておらず請求元と対応付けられていない。このため、編集後の請求元を個社定義情報における請求元として登録した場合、帳票認識における請求元の認識精度が低下する可能性がある。
本実施形態では、このように、帳票上で請求元と対応付けられていない文字列を請求元とする編集がされた場合には、帳票上の請求元と、編集後の請求元とをそれぞれ別の項目し、対応付けて管理する。
したがって、本実施形態では、このような編集が行われた場合であっても、帳票認識システム100における認識結果データの管理が煩雑になることを抑制できる。
言い換えれば、本実施形態では、帳票認識システム100のユーザによって、請求元の記載の仕方がまちまちに編集された場合であっても、帳票情報の管理が煩雑になることを抑制できる。
また、本実施形態では、帳票認識を行う際に、管理情報データベース265を参照して、使用する個社定義情報を特定する。したがって、本実施形態によれば、帳票認識の精度を向上させることができる。
上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(digital signal processor)、FPGA(field programmable gate array)や従来の回路モジュール等のデバイスを含むものとする。
また、実施形態に記載された装置群は、本明細書に開示された実施形態を実施するための複数のコンピューティング環境のうちの1つを示すものにすぎない。
ある実施形態では、サーバ装置200は、サーバクラスタといった複数のコンピューティングデバイスを含む。複数のコンピューティングデバイスは、ネットワークや共有メモリなどを含む任意のタイプの通信リンクを介して互いに通信するように構成されており、本明細書に開示された処理を実施する。同様に、サーバ装置200は、互いに通信するように構成された複数のコンピューティングデバイスを含むことができる。
さらに、サーバ装置200は、開示された処理ステップを様々な組み合わせで共有するように構成できる。例えば、サーバ装置200によって実行されるプロセスは、他のサーバ装置によって実行され得る。同様に、サーバ装置200の機能は、他のサーバ装置によって実行することができる。また、サーバ装置と他のサーバ装置の各要素は、1つのサーバ装置にまとめられていても良いし、複数の装置に分けられていても良い。
また、明細書中のデータベースは、機械学習の学習効果によって生成されたものでもよい。また、取引内容の記載に含まれうるキーワードと勘定項目とを機械学習にて分類付けすることで、対応テーブルを使用しなくてもよい。
ここで、機械学習とは、コンピュータに人のような学習能力を獲得させるための技術であり、コンピュータが、データ識別等の判断に必要なアルゴリズムを、事前に取り込まれる学習データから自律的に生成し、新たなデータについてこれを適用して予測を行う技術のことをいう。機械学習のための学習方法は、教師あり学習、教師なし学習、半教師学習、強化学習、深層学習のいずれかの方法でもよく、さらに、これらの学習方法を組み合わせた学習方法でもよく、機械学習のための学習方法は問わない。
以上、各実施形態に基づき本発明の説明を行ってきたが、上記実施形態に示した要件に本発明が限定されるものではない。これらの点に関しては、本発明の主旨をそこなわない範囲で変更することができ、その応用形態に応じて適切に定めることができる。
100 帳票認識システム
200 サーバ装置200
210 記憶部
220 帳票認識部
230 帳票画像データベース
240 種別判定データベース
250 帳票定義データベース
260 認識結果データベース
265 管理情報データベース
270 認識処理部
290 帳票管理部
292 表示制御部
293 情報更新部
300 画像形成装置
400 端末装置
500 基幹システム
特開2004-158030号公報

Claims (12)

  1. 帳票情報に含まれる所定の情報に対する編集が行われた場合に、編集後の前記所定の情報と関連する情報の入力画面を端末装置に表示させる表示制御部と、
    前記入力画面において入力された情報と、編集後の前記所定の情報とを対応付けた管理情報を格納する記憶部と、を有する情報処理装置。
  2. 前記所定の情報と関連する情報は、
    編集後の前記所定の情報を特定する識別情報と、前記所定の情報とを含む、請求項1記載の情報処理装置。
  3. 前記入力画面は、前記帳票情報を含む帳票画像を示す帳票画像データと共に表示される、請求項1又は2記載の情報処理装置。
  4. 前記所定の情報は、
    前記帳票画像が示す帳票の発行元を示す情報である、請求項3記載の情報処理装置。
  5. 利用者固有の帳票の項目及び項目の値の位置関係を定義した帳票定義情報が前記記憶部に格納されており、
    前記記憶部に格納された管理情報を用いて、帳票画像から帳票情報を抽出する際に参照する前記帳票定義情報を特定する定義特定部を有する、請求項1乃至4の何れか一項に記載の情報処理装置。
  6. 情報処理装置による情報処理方法であって、前記情報処理装置が、
    帳票情報に含まれる所定の情報に対する編集が行われた場合に、編集後の前記所定の情報と関連する情報の入力画面を端末装置に表示させ、
    前記入力画面において入力された情報と、編集後の前記所定の情報とを対応付けた管理情報を記憶部に格納する、情報処理方法。
  7. 前記所定の情報と関連する情報は、
    編集後の前記所定の情報を特定する識別情報と、前記所定の情報とを含む、請求項6記載の情報処理方法。
  8. 前記入力画面は、前記帳票情報を含む帳票画像を示す帳票画像データと共に表示される、請求項6又は7記載の情報処理方法。
  9. 前記所定の情報は、
    前記帳票画像が示す帳票の発行元を示す情報である、請求項8記載の情報処理方法。
  10. 利用者固有の帳票の項目及び項目の値の位置関係を定義した帳票定義情報が前記記憶部に格納されており、
    前記記憶部に格納された管理情報を用いて、帳票画像から帳票情報を抽出する際に参照する前記帳票定義情報を特定する、請求項6乃至9の何れか一項に記載の情報処理方法。
  11. 帳票情報に含まれる所定の情報に対する編集が行われた場合に、編集後の前記所定の情報と関連する情報の入力画面を端末装置に表示させ、
    前記入力画面において入力された情報と、編集後の前記所定の情報とを対応付けた管理情報を記憶部に格納する、処理を情報処理装置に実行させる、プログラム。
  12. 端末装置と情報処理装置がネットワークを介して接続された情報処理システムであって、
    前記情報処理装置は、
    前記端末装置において、帳票情報に含まれる所定の情報に対する編集が行われた場合に、前記端末装置から送信される表示要求を受け付ける第一の入力受付部と、
    前記表示要求を受け付けて、編集後の前記所定の情報と関連する情報の入力画面を前記端末装置に表示させる第一の表示制御部と、
    前記入力画面において入力された情報と、編集後の前記所定の情報とを対応付けた管理情報を格納する記憶部と、を有し、
    前記端末装置は、
    前記帳票情報に対する編集を受け付ける第二の入力受付部と、
    前記入力画面を表示部に表示させる第二の表示制御部と、を有する、情報処理システム。
JP2022013474A 2022-01-31 2022-01-31 情報処理装置、情報処理方法、プログラム、情報処理システム Pending JP2023111566A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2022013474A JP2023111566A (ja) 2022-01-31 2022-01-31 情報処理装置、情報処理方法、プログラム、情報処理システム
US18/053,502 US20230244860A1 (en) 2022-01-31 2022-11-08 Information processing apparatus, information processing method, and information processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022013474A JP2023111566A (ja) 2022-01-31 2022-01-31 情報処理装置、情報処理方法、プログラム、情報処理システム

Publications (1)

Publication Number Publication Date
JP2023111566A true JP2023111566A (ja) 2023-08-10

Family

ID=87432108

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022013474A Pending JP2023111566A (ja) 2022-01-31 2022-01-31 情報処理装置、情報処理方法、プログラム、情報処理システム

Country Status (2)

Country Link
US (1) US20230244860A1 (ja)
JP (1) JP2023111566A (ja)

Also Published As

Publication number Publication date
US20230244860A1 (en) 2023-08-03

Similar Documents

Publication Publication Date Title
US9025851B2 (en) Image recreation using image lift data
US11941672B2 (en) Information processing system, information processing method, and non-transitory recording medium
US9082007B2 (en) Image recreation using templates
JP2021071758A (ja) プログラム、方法、及び情報処理システム
US20210279460A1 (en) Information processing system, information processing method, and non-transitory recording medium
US12020462B2 (en) Information processing apparatus, information processing method, and computer program product
US11887390B2 (en) Information processing apparatus, information processing system, information processing method, and non-transitory recording medium
JP7421866B2 (ja) 学習情報製造装置、情報処理装置、学習情報の製造方法、情報処理方法、およびプログラム
JP2023111566A (ja) 情報処理装置、情報処理方法、プログラム、情報処理システム
JP7484466B2 (ja) 情報処理装置、情報処理方法、プログラム及び情報処理システム
JP7338211B2 (ja) 通信端末、共用システム、通信方法およびプログラム
US20220309236A1 (en) Information processing apparatus, information processing system, and information processing method
US11960949B2 (en) Information processing apparatus, information processing system, and information processing method
JP7447928B2 (ja) 情報処理装置、プログラム、情報処理システム、情報処理方法
JP7380653B2 (ja) 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム
JP7456131B2 (ja) 情報処理システム、情報処理方法及びプログラム
JP2023006434A (ja) 情報処理システム、情報処理装置、情報処理方法、情報処理プログラム
CN106170798A (zh) 用于上下文相关的工作流的智能光学输入/输出(i/o)扩展
JP6187236B2 (ja) データ特定プログラム、データ特定方法および情報処理装置
KR101768090B1 (ko) 명함 제작 및 관리 시스템
JP2023081199A (ja) 情報処理装置、情報処理方法、プログラム、情報処理システム
US20220309234A1 (en) Information processing apparatus, information processing system, and information processing method
JP2023079978A (ja) 情報処理装置、情報処理方法、プログラム、情報処理システム
JP2021149336A (ja) 情報処理装置、情報処理方法、プログラム、情報処理システム
JP2023127405A (ja) 情報処理装置、情報処理方法、プログラム、情報処理システム