JP2021149336A - 情報処理装置、情報処理方法、プログラム、情報処理システム - Google Patents

情報処理装置、情報処理方法、プログラム、情報処理システム Download PDF

Info

Publication number
JP2021149336A
JP2021149336A JP2020046921A JP2020046921A JP2021149336A JP 2021149336 A JP2021149336 A JP 2021149336A JP 2020046921 A JP2020046921 A JP 2020046921A JP 2020046921 A JP2020046921 A JP 2020046921A JP 2021149336 A JP2021149336 A JP 2021149336A
Authority
JP
Japan
Prior art keywords
information
correction
character string
recognition
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020046921A
Other languages
English (en)
Inventor
史裕 手島
Fumihiro Tejima
史裕 手島
寛 小林
Hiroshi Kobayashi
寛 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2020046921A priority Critical patent/JP2021149336A/ja
Publication of JP2021149336A publication Critical patent/JP2021149336A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】帳票における文字列の抽出の精度を向上させることを目的としている。【解決手段】帳票画像から文字認識により読み取られた文字列と、文字列の位置を示す情報とが対応付けられた読取結果情報から、項目及び項目値を抽出して対応づけた帳票情報を生成する帳票認識部と、記憶部に格納された、前記文字認識より認識された文字列である認識文字列と、前記認識文字列を修正した修正文字列とが対応付けられた補正情報を参照し、前記帳票情報に補正の対象となる文字列が存在するか否かを判定する補正判定部と、前記補正の対象となる文字列が存在する場合に、前記帳票情報を表示装置に表示させる表示用データにおいて、前記補正の対象となる文字列を、前記補正情報に基づき補正する補正部と、を有する。【選択図】図8

Description

本発明は、情報処理装置、情報処理方法、プログラム、情報処理システムに関する。
従来の仕入れ業務では、納品書等の帳票に記載された内容を、商品を管理するシステム等に手入力するため、膨大な時間がかかっていた。そこで、近年では、納品書等の帳票に記載された文字列を文字認識(OCR;Optical Character Recognition)技術により抽出し、項目と項目値として、システム等に入力することで、業務の効率化を図る技術が知られている。
従来の技術では、帳票に含まれる項目のうち、多くの帳票で共通する項目は、高い精度で、項目値を抽出することができる。しかしながら、例えば、項目値に、業界や各社独自の名称が存在するような、バリエーションが豊富な項目については、項目値となる文字列の抽出の精度を維持することが困難であった。
開示の技術は、帳票における文字列の抽出の精度を向上させることを目的としている。
開示の技術は、帳票画像から文字認識により読み取られた文字列と、文字列の位置を示す情報とが対応付けられた読取結果情報から、項目及び項目値を抽出して対応づけた帳票情報を生成する帳票認識部と、記憶部に格納された、前記文字認識より認識された文字列である認識文字列と、前記認識文字列を修正した修正文字列とが対応付けられた補正情報を参照し、前記帳票情報に補正の対象となる文字列が存在するか否かを判定する補正判定部と、前記補正の対象となる文字列が存在する場合に、前記帳票情報を表示装置に表示させる表示用データにおいて、前記補正の対象となる文字列を、前記補正情報に基づき補正する補正部と、を有する情報処理装置である。
帳票における文字列の抽出の精度を向上させることができる。
第一の実施形態の情報処理システムのシステム構成の一例を示す図である。 情報処理装置のハードウェア構成の一例を示す図である。 端末装置のハードウェア構成の一例を示す図である。 第一の実施形態の情報処理システムの有する各装置の機能構成を説明する図である。 帳票認識部について説明する図である。 明細情報の一例を示す図である。 第一の実施形態の補正情報の一例を示す図である。 第一の実施形態の情報処理装置の動作を説明する第一のフローチャートである。 納品書情報の一覧が表示された画面の例を示す図である。 表示用データの表示例を示す図である。 第一の実施形態の情報処理装置の動作を説明する第二のフローチャートである。 第二の実施形態の情報処理システムの有する各装置の機能構成を説明する図である。 個社補正情報の一例を示す図である。 第二の実施形態の情報処理装置の動作を説明する第一のフローチャートである。 共通補正情報の一例を示す図である。 第二の実施形態の情報処理装置の動作を説明する第二のフローチャートである。
(第一の実施形態)
以下に、図面を参照して、実施形態について説明する。図1は、第一の実施形態の情報処理システムのシステム構成の一例を示す図である。
本実施形態の情報処理システム100は、情報処理装置200と、端末装置300とを含む。情報処理装置200と、端末装置300とは、ネットワーク等を介して接続される。尚、図1の例では、情報処理システム100に含まれる端末装置300は1台としたが、これに限定されない。情報処理システム100に含まれる端末装置300の台数は任意であって良い。
また、図1の例では、情報処理システム100に含まれる情報処理装置200は1台としたが、これに限定されない。本実施形態の情報処理装置200が有する機能は、複数の情報処理装置によって実現されても良い。
本実施形態の情報処理装置200は、例えば、スキャナ等によって帳票を読み取った帳票画像データが格納されており、帳票画像データを用いた各種の処理が行われる。
本実施形態の端末装置300は、情報処理装置200による処理の結果の表示や、情報処理装置200に対する入力等が行われる。
以下に、図2、図3を参照して、情報処理システム100の有する各装置のハードウェア構成について説明する。
図2は、情報処理装置のハードウェア構成の一例を示す図である。
本実施形態の情報処理装置200は、コンピュータによって構築されており、図2に示されているように、CPU201、ROM202、RAM203、HD204、HDD(Hard Disk Drive)コントローラ205、ディスプレイ206、外部機器接続I/F(Interface)208、ネットワークI/F209、データバス210、キーボード211、ポインティングデバイス212、DVD−RW(Digital Versatile Disk Rewritable)ドライブ214、メディアI/F216を備えている。
これらのうち、CPU201は、情報処理装置200全体の動作を制御する。ROM202は、IPL等のCPU201の駆動に用いられるプログラムを記憶する。RAM203は、CPU201のワークエリアとして使用される。HD204は、プログラム等の各種データを記憶する。HDDコントローラ205は、CPU201の制御にしたがってHD204に対する各種データの読み出し又は書き込みを制御する。ディスプレイ206は、カーソル、メニュー、ウィンドウ、文字、又は画像などの各種情報を表示する表示部である。
外部機器接続I/F208は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリやプリンタ等である。ネットワークI/F209は、通信ネットワークNを利用してデータ通信をするためのインターフェースである。データバス210は、図2に示されているCPU201等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
また、キーボード211は、文字、数値、各種指示などの入力のための複数のキーを備えた入力手段の一種である。ポインティングデバイス212は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行う入力手段の一種である。DVD−RWドライブ214は、着脱可能な記録媒体の一例としてのDVD−RW213に対する各種データの読み出し又は書き込みを制御する。尚、DVD−RWに限らず、DVD−R等であってもよい。メディアI/F216は、フラッシュメモリ等の記録メディア215に対するデータの読み出し又は書き込み(記憶)を制御する。
図3は、端末装置のハードウェア構成の一例を示す図である。本実施形態の端末装置300は、例えば、スマートフォンやタブレット端末であっても良い。
本実施形態の端末装置300は、CPU301、ROM302、RAM303、EEPROM304、CMOSセンサ305、撮像素子I/F306、加速度・方位センサ307、メディアI/F309、GPS受信部311を備えている。
これらのうち、CPU301は、端末装置300全体の動作を制御する。ROM302は、CPU301やIPL等のCPU301の駆動に用いられるプログラムを記憶する。RAM303は、CPU301のワークエリアとして使用される。EEPROM304は、CPU301の制御にしたがって、端末装置用プログラム等の各種データの読み出し又は書き込みを行う。CMOS(Complementary Metal Oxide Semiconductor)センサ305は、CPU301の制御に従って被写体(主に自画像)を撮像して画像データを得る内蔵型の撮像手段の一種である。なお、CMOSセンサではなく、CCD(Charge Coupled Device)センサ等の撮像手段であってもよい。撮像素子I/F306は、CMOSセンサ305の駆動を制御する回路である。加速度・方位センサ307は、地磁気を検知する電子磁気コンパスやジャイロコンパス、加速度センサ等の各種センサである。メディアI/F309は、フラッシュメモリ等の記録メディア308に対するデータの読み出し又は書き込み(記憶)を制御する。GPS受信部311は、GPS衛星からGPS信号を受信する。
また、端末装置300は、遠距離通信回路312、マイク315、スピーカ316、音入出力I/F317、ディスプレイ318、外部機器接続I/F(Interface)319、近距離通信回路320、近距離通信回路320のアンテナ320a、及びタッチパネル321を備えている。
これらのうち、遠距離通信回路312は、通信ネットワークを介して、他の機器と通信する回路である。マイク315は、音を電気信号に変える内蔵型の回路である。
スピーカ316は、電気信号を物理振動に変えて音楽や音声などの音を生み出す内蔵型の回路である。音入出力I/F317は、CPU301の制御に従ってマイク315及びスピーカ316との間で音信号の入出力を処理する回路である。ディスプレイ318は、被写体の画像や各種アイコン等を表示する液晶や有機EL(Electro Luminescence)などの表示手段の一種である。
外部機器接続I/F319は、各種の外部機器を接続するためのインターフェースである。近距離通信回路420は、NFC(Near Field Communication)やBluetooth(登録商標)等の通信回路である。タッチパネル421は、利用者がディスプレイ318を押下することで、端末装置300を操作する入力手段の一種である。
また、端末装置300は、バスライン310を備えている。バスライン310は、図3に示されているCPU301等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
次に、図4を参照して、本実施形態の情報処理システム100の有する各装置の機能構成について説明する。図4は、第一の実施形態の情報処理システムの有する各装置の機能構成を説明する図である。
本実施形態の情報処理装置200は、画像受付部220、帳票画像記憶部230、登録情報記憶部240、OCR(Optical Character Recognition)処理部250、帳票認識部260、表示用データ生成部270、補正情報記憶部280、補正処理部290を有する。
本実施形態の画像受付部220、OCR処理部250、帳票認識部260、表示用データ生成部270、補正処理部290は、CPU201がROM202等に格納されたプログラムを読み出して実行することで実現される。また、本実施形態の帳票画像記憶部230、登録情報記憶部240、補正情報記憶部280は、例えば、HD204等によって実現される。
画像受付部220は、例えば、帳票をスキャナ等によって読み取った画像形成装置等から、帳票画像データの入力を受け付け、帳票画像データを取得する。具体的には、情報処理装置200は、スキャナ機能を有する画像形成装置等と通信を行って、画像形成装置から受信した帳票画像データを受付部220により受け付け、帳票画像記憶部230に格納しても良い。また、情報処理装置200は、その他の方法によって帳票画像データを取得して帳票画像記憶部230に格納しても良い。
帳票画像記憶部230は、例えば、納品書等の帳票の画像を示す画像データが格納される。以下の説明では、帳票の画像を帳票画像と呼び、帳票の画像を示す画像データは、帳票画像データと呼ぶ場合がある。
登録情報記憶部240は、登録情報255が格納される。登録情報255は、納品書情報241、ステータス情報242、表示用データ243を含む。本実施形態において、納品書情報241、ステータス情報242、表示用データ243は、納品元毎に対応付けられる。本実施形態の納品書情報241は、帳票(納品書)に記載された各種の情報が含まれる。
より具体的には、納品書情報241は、OCR処理部250による文字認識処理によって、帳票画像データから取得された文字列と文字列の位置を示す情報から、帳票認識部260によって、帳票画像に含まれる項目と項目の値とを抽出し、項目と項目の値とを対応付けることで生成される。
したがって、納品書情報241には、OCR処理部250により帳票画像から取得した文字列と文字列の位置を示す情報を含まれる。以下の説明では、OCR処理部250が帳票画像から取得した文字列と文字列の位置を示す情報を読取結果情報と表現する場合がある。
本実施形態において、帳票画像に含まれる項目とは、例えば、納品元、納品日、品名、単価、金額等である。したがって、本実施形態の納品書情報241には、帳票画像データが示す納品書の納品元に関する情報に加え、納品される商品の品名、単価、個数、金額の内訳等を示す明細情報244が含まれる。言い換えれば、本実施形態の明細情報244は、納品書情報241に含まれる情報であって、取引の内訳(明細)を示す情報である。
また、本実施形態の納品書情報241は、帳票画像記憶部230における、納品書情報241と対応する納品書の帳票画像データの格納先を示す情報(URL;Uniform Resource Locator)が含まれる。
以下の説明では、帳票画像に含まれる項目と、この項目の値とを抽出し、項目と項目の値とをテキストデータに変換して対応付けることを、帳票認識と呼ぶ。つまり、納品書情報241は、帳票認識によって、帳票画像データから取得される情報を含む。以下の説明では、項目の値を項目値と表現する場合がある。
尚、本実施形態では、納品書を帳票の一例とし、納品書情報241を帳票認識によって帳票画像データから取得される帳票情報の一例として説明するが、帳票は、納品書に限定されない。本実施形態の帳票は、例えば、請求書や領収書、見積書等であっても良い。この場合、帳票情報は、請求書情報や領収書情報、見積書情報となる。
ステータス情報242は、登録情報255の状態を示す情報であり、納品書情報241と対応する各種の情報の入力状態等に応じて、帳票認識部260によって生成される。ステータス情報242が示す登録情報255の状態は、複数存在する。具体的には、ステータス情報242が示す登録情報255の状態には、例えば、以下の4つが存在する。
・未処理状態(状態1) 帳票認識によって納品書情報241が取得された直後であり、納品書情報241が端末装置300に一度も表示されていない状態。
・下書き保存状態(状態2) 納品書情報241の確認や修正等の作業の途中等であり、登録情報255が確定される前の状態。
・確定済み状態(状態3) 納品書情報241の確認や修正等の作業が完了し、確定された情報として外部へ出力できる状態。
・外部出力済み状態(状態4) 情報処理システム100と連携する会計システム等への納品書情報241の出力が完了した状態。
本実施形態のステータス情報242は、登録情報255の状態が、上述した状態1〜4のうち、どの状態であるかを示す情報である。
尚、図4の例では、帳票画像記憶部230と登録情報記憶部240は、情報処理装置200が有する構成としたが、これに限定されない。帳票画像記憶部230と登録情報記憶部240は、一部又は全部が、情報処理装置200と通信可能な、情報処理装置200以外の装置に設けられていても良い。
表示用データ243は、納品書情報241を含む情報であり、納品書情報241と、納品書情報241に含まれるURLが示す納品書の帳票画像データとを、一画面に表示させるための表示用データである。本実施形態では、情報処理装置200は、端末装置300から、納品書情報241の表示要求を受け付けると、出力部295により、表示用データを端末装置300に出力する。
OCR処理部250は、帳票画像記憶部230から読み出した帳票画像データに対して文字認識処理を行う。尚、図4では、OCR処理部250は、情報処理装置200が有する機能としたが、これに限定されない。帳票画像データに対するOCR処理は、例えば、情報処理装置200以外の装置で行われても良い。
帳票認識部260は、OCR処理部250によって読み取られた文字列と文字列の位置を示す情報が対応付けられた読取結果情報から、帳票画像に含まれる項目と項目値とを抽出し、項目と項目値とを対応付ける帳票認識を行う。尚、本実施形態では、OCR処理部250は、帳票認識部260とは別に設けられるものとしたが、これに限定されない。情報処理装置200には、OCR処理部250と帳票認識部260とを含む1つの機能部によって、帳票認識が行われても良い。その場合には、帳票認識部260に、OCR処理部250が含まれるようにしても良い。
また、帳票認識部260は、登録情報記憶部240への明細情報244の登録(格納)を行う。帳票認識部260によって抽出された明細情報244の詳細は後述する。
表示用データ生成部270は、納品書情報241と、納品書情報241に対応する帳票画像データとに基づき、登録情報を端末装置300に表示させるための表示用データを生成する。
補正情報記憶部280は、補正処理部290による処理において参照される補正情報281が格納される。補正情報281は、OCR処理部250による文字認識された結果の文字列(キーワード)と、認識された文字列が修正された修正後の文字列(キーワード)とが対応づけられた情報である。
認識された文字列の修正は、情報処理システム100のユーザ等によって行われても良い。また、認識された文字列の修正は、OCR処理部250が認識を誤りがユーザによって発見された場合や、OCR処理部250による認識は誤っていないが、ユーザ固有の表現が用いられる場合等がある。
以下の説明では、OCR処理部250により認識された結果の文字列を、認識キーワード(認識文字列)と呼び、認識キーワードを修正した文字列を修正キーワード(修正文字列)と呼ぶ場合がある。
補正処理部290は、端末装置300から納品書情報241の表示要求を受け付けて、納品書情報241を含む登録情報255が状態1(未処理状態)である場合に、納品書情報241に含まれるキーワードに、補正情報281を用いた補正を行うか否かを判定する。
そして、補正処理部290は、補正を行うと判定したキーワードについて、補正情報281を参照して補正を行う。また、補正処理部290は、端末装置300に表示用データ243が表示された状態で、表示されたキーワードが修正された場合、表示用データ243に修正を反映させる。また、補正処理部290は、修正前のキーワードと、修正後のキーワードとを対応付けて、補正情報281として補正情報記憶部280に登録(格納)する。
以下に、補正処理部290の詳細を説明する。補正処理部290は、操作受付部291、ステータス判定部292、補正判定部293、補正部294、出力部295、登録部296を有する。
操作受付部291は、端末装置300に対する操作による入力を受け付ける。具体的には、操作受付部291は、端末装置300から、納品書情報241の一覧の表示要求を受け付ける。また、操作受付部291は、納品書情報241の一覧から選択された納品書情報241の表示要求を受け付ける。また、操作受付部291は、登録情報255の状態を確定済み状態とする操作に基づく要求を受け付ける。
ステータス判定部292は、表示要求を受け付けた納品書情報241のステータス情報242を参照し、納品書情報241の状態を確認する。具体的には、ステータス判定部292は、納品書情報241の状態が未処理状態であるか否かを判定する。また、ステータス判定部292は、納品書情報241の状態が、確定済み状態とされたか否かを判定する。
補正判定部293は、ステータス判定部292により判定された納品書情報241の状態に応じて、補正部294により補正を行うか否かを判定する。具体的には、ステータス判定部292は、納品書情報241のステータス情報242が、未処理状態である場合にのみ、補正部294による補正を行うものと判定する。
補正部294は、補正判定部293によって、補正の対象と判定された納品書情報241に対し、納品書情報241のうち、補正の対象となる種別のキーワードのそれぞれについて、補正情報281の認識キーワードと一致するか否かを判定する。そして、補正部294は、キーワードが認識キーワードと一致する場合に、このキーワードを修正キーワードに置き換える。
尚、本実施形態では、例えば、補正部294による補正の対象となるキーワードの種別を、納品書情報241に含まれるキーワードとしても良い。また、本実施形態では、例えば、補正部294による補正の対象となるキーワードの種別を、明細情報244に含まれるキーワードとしても良いし、明細情報244に含まれる項目値としても良い。補正の対象とするキーワードの種別は、情報処理システム100の管理者や、情報処理システム100のユーザ等により、予め、補正部294に設定されていても良い。
出力部295は、納品書情報241の一覧を表示させるためのデータや、表示用データ243等を端末装置300へ出力する。
登録部296は、端末装置300に表示された表示用データ243が修正された場合に、修正されたキーワードと、修正前のキーワードとを対応付けた補正情報281として、補正情報記憶部280ら格納する。
本実施形態の端末装置300は、例えば、ネットワークを介して、本実施形態の情報処理システム100と連携する基幹システムと接続される。基幹システムとは、例えば、情報処理システム100から出力される納品書情報241に対して、特定の処理を行うシステムである。具体的には、例えば、基幹システムは、商品管理システム等の納品書を取り扱うシステムである。
本実施形態の端末装置300は、表示制御部330を有する。表示制御部330は、例えば、情報処理装置200から出力されるデータに基づき、端末装置300のディスプレイ(表示装置)318等に、納品書情報241の一覧や、納品書情報241の表示用データを表示させる。
次に、図5と図6を参照して、帳票認識部260の処理についてさらに説明する。図5は、帳票認識部について説明する図である。
図5(A)に示す読取結果情報101は、OCR処理部250によるOCR処理を行った結果である。本実施形態では、読取結果情報101は、納品書情報241に含まれる。
読取結果情報101は、帳票画像データから文字フィールドを切り取り、文字フィールドの中の文字を認識した結果と、文字の位置を示す座標とから抽出されたものである。
本実施形態の帳票認識部260は、この読取結果情報101から、隣り合う位置にある文字同士をつなげて文字列(文字列)を認識する。具体的には、帳票認識部260は、文字と文字との間の距離が、所定ピクセル以内である文字の組み合わせを、1つの単語として認識しても良い。
図5(B)に示す情報102は、帳票認識部260により認識された文字列と、文字列の領域とを示す情報である。帳票認識部260は、帳票画像データから、縦線と横線で区切られた領域を1つのセルとして認識し、セル毎にセルを識別する識別情報(セルID)を付与する。
本実施形態では、明細情報244は、表形式で示されるものとしているため、帳票認識部260は、セルの領域内で認識された文字列を、明細情報244に含まれる文字列(キーワード)として抽出する。
図5(C)に示す情報103は、帳票画像データから認識されたセル毎の領域とセルIDとの対応付けを示す情報である。
図5では、例えば、情報102において、文字列「品名」が認識された領域は、X座標とY座標によって示される位置を基準として、高さと幅とから特定される。
また、情報103において、文字列「品名」が認識された領域は、セルID「2」に含まれることがわかる。したがって、文字列「品名」は、明細情報244に含まれる文字列として、セルID「2」と対応付けられる。
本実施形態の帳票認識部260は、このようにして、帳票画像データから、文字列とセルとを対応付けた明細情報244を抽出する。
図6は、明細情報の一例を示す図である。図6の例では、明細情報244を、テーブル(表)形式の情報として示しているが、明細情報244の形式は、これに限定されない。
明細情報244は、帳票画像に含まれる表における各行と対応した情報であれば良い。言い換えれば、明細情報244は、例えば、セルIDと、セルIDによって特定される領域内の文字列とを対応付けた情報を含んでいれば良い。
尚、上述した明細情報244の抽出の仕方は、一例であり、これに限定されるものではない。
次に、図7を参照して、本実施形態の補正情報281について説明する。図7は、第一の実施形態の補正情報の一例を示す図である。本実施形態の補正情報281は、後述する登録部296の処理によって作成される。尚、本実施形態では、情報処理システム100の管理者等が予め作成した補正情報281が初期情報として格納されていても良い。
本実施形態の補正情報281は、項目「認識キーワード」と、項目「修正キーワード」とが対応付けられている。
項目「認識キーワード」の値は、ユーザによって修正される前のOCR処理部250による文字認識の結果を示す。具体的には、項目「認識キーワード」の値は、納品書情報241に含まれる文字列である。
項目「修正キーワード」の値は、認識キーワードを含む表示用データ243が表示された端末装置300において、ユーザによって認識キーワードが修正された後のキーワードを示す。
図7では、例えば、認識キーワード「ミネウルウォーター」が、ユーザによって、修正キーワード「ミネラルウォーター」に修正されたことがわかる。
次に、図8を参照して、本実施形態の情報処理装置200の動作について説明する。図8は、第一の実施形態の情報処理装置の動作を説明する第一のフローチャートである。
図8では、補正処理部290による、納品書情報241の一覧から、表示させる納品書情報241が選択された場合に、選択された納品書情報241を端末装置300に表示させる処理を示している。
情報処理装置200は、補正処理部290の操作受付部291により、端末装置300から納品書情報241の一覧の表示要求を受け付けたか否か判定する(ステップS801)。ステップS801において、表示要求を受け付けない場合、補正処理部290は、待機する。
ステップS801において、表示要求を受け付けると、補正処理部290は、出力部295により、端末装置300に対し、登録情報記憶部240に格納された納品書情報241の一覧を示すデータを出力する(ステップS802)。端末装置300では、表示制御部330がこの一覧を示すデータを受信して、ディスプレイ318に納品書情報241の一覧画面を表示させる。
尚、このとき、操作受付部291は、納品書情報241の一覧の表示要求と共に、納品元を示す情報の入力を受け付けても良い。
この場合、補正処理部290は、納品元が、入力された納品元と一致する納品書情報241の一覧を出力部295により端末装置300に出力させても良い。
続いて、補正処理部290は、操作受付部291により、納品書情報241の一覧から納品書情報241の選択を受け付ける(ステップS803)。続いて、補正処理部290は、ステータス判定部292により、選択された納品書情報241と対応するステータス情報242を参照し、この納品書情報241が未処理状態であるか否かを判定する(ステップS804)。
ステップS804において、未処理状態でない場合、情報処理装置200は、後述するステップS813に進む。
ステップS804において、未処理状態である場合、補正処理部290は、補正部294により、補正の対象となるキーワードの種別を特定する(ステップS805)。キーワードの種別とは、例えば、「納品書情報241に含まれる全てのキーワード」や、「明細情報244に含まれるキーワード」等である。
補正の対象となるキーワードの種別は、予め補正部294に設定されていても良い。以下の説明では、明細情報244に含まれるキーワードが補正の対象として特定されるものとする。
続いて、情報処理装置200は、補正処理部290の補正判定部293により、変数N=1とする(ステップS806)。続いて、補正判定部293は、補正の対象に特定されたキーワードの中から、N個目のキーワードを抽出し、このキーワードで補正情報281を検索する(ステップS807)。
続いて、補正判定部293は、補正情報281の認識キーワードの中に、N個目のキーワードと一致するものが存在するか否かを判定する(ステップS808)。つまり、補正判定部293は、帳票情報である明細情報244において、補正情報281を用いた補正の対象となる文字列が存在するか否かを判定している。
ステップS808において、一致する認識キーワードが存在しない場合、つまり、補正の対象となる文字列が存在しない場合、補正判定部293は、後述するステップS810へ進む。
ステップS808において、一致する認識キーワードが存在する場合、つまり、補正の対象となる文字列が存在する場合、補正判定部293は、補正情報281において、一致する認識キーワードと対応する修正キーワードを取得し、保持する(ステップS809)。
つまり、補正判定部293は、補正情報281において、N個目のキーワードと一致する認識キーワードが存在しない場合、このキーワードを、補正を行う必要がないキーワードと判定する。また、補正判定部293は、補正情報281において、N個目のキーワードと一致する認識キーワードが存在する場合、このキーワードを、補正を行う必要があるキーワードと判定する。
続いて、補正処理部290は、ステップS805で特定された種別のキーワードに、次のキーワードが存在するか否かを判定する(ステップS810)。ステップS810において、次のキーワードが存在する場合、補正処理部290は、変数Nの値をN=N+1とし(ステップS811)、ステップS807へ戻る。
ステップS810において、次のキーワードが存在しない場合、補正処理部290は、補正部294により、補正判定部293が保持している修正キーワードが存在するか否かを判定する(ステップS812)。言い換えれば、補正部294は、補正の必要があると判定されたキーワードが存在するか否かを判定する。
ステップS812において、修正キーワードが保持されていない場合、補正処理部290は、後述するステップS814へ進む。
ステップS812において、修正キーワードが保持されている場合、補正部294は、表示用データ243において、補正判定部293が保持した修正キーワードと対応する認識キーワードと一致するキーワードを、修正キーワードに上書する(ステップS813)。つまり、補正部294は、表示用データ243において、認識キーワードと一致したキーワードを、補正判定部293が保持した修正キーワードに置き換える補正を行う。
続いて、補正処理部290は、出力部295により、表示用データ243を端末装置300へ出力し(ステップS814)、納品書情報241を端末装置300に表示させる処理を終了する。
次に、図9と図10を参照して、端末装置300の表示例について説明する。図9は、納品書情報の一覧が表示された画面の例を示す図である。
画面91は、納品書情報の一覧が表示される表示欄92と、納品元を指定する選択欄93と、を含む。
表示欄92では、レコード毎に選択欄が設けられており、図9の例では、納品元が「R商会」のレコード92aが選択されている。
本実施形態において、情報処理装置200は、画面91において、レコード92aが選択されと、図8のステップS804以降の処理を実行し、レコード92aと対応する納品書情報241の表示用データ243を端末装置300に送信する。
図10は、表示用データの表示例を示す図である。図10の画面110は、表示欄120、130、140と、操作ボタン150、160と、を含む。
表示欄120には、表示用データに含まれるURLによって特定された帳票画像データが表示される。表示用データ243に含まれるURLとは、画面91で選択された納品書情報241と対応する納品書の帳票画像データの格納先を示す。
表示欄130には、選択された納品書情報241と対応するステータス情報242が表示される。図10の例では、表示欄130には、「未処理」と表示されており、画面110に表示された納品書情報241は、未処理状態(状態1)であることがわかる。
したがって、画面110を表示させるための表示用データ243は、補正処理部290によって、図8のステップS805以降の処理が実行された後の表示用データ243である。
表示欄140には、表示用データ243に含まれる納品元に関する情報や、納品される商品の品名、単価、個数、金額等が表示される。
尚、表示用データ243に含まれ品名等のキーワードは、補正情報281において、認識キーワードと一致するキーワードが存在する場合には、この認識キーワードを修正キーワードに修正された後の状態で表示される。
また、本実施形態では、画面110において、操作ボタン150が操作されると、画面110に表示された表示用データ243と対応するステータス情報242が、「未処理状態」から「下書き保存状態」に変更される。
また、本実施形態では、画面110において、操作ボタン160が操作されると、画面110に表示された表示用データ243と対応するステータス情報242が、「下書き保存状態」から「確定済み状態」に変更される。
本実施形態の情報処理装置200は、ステータス情報242を「確定済み状態」とする操作を受け付けると、補正情報281に含まれる認識キーワード以外に、ユーザが手動で修正したキーワードが存在するか否かを判定する。そして、情報処理装置200は、ユーザが手動で修正したキーワードが存在する場合に、修正前の認識キーワードと、修正後の修正キーワードとを対応付けて補正情報281に追加する。
以下に、図11を参照して、情報処理装置200が、ステータス情報242を「確定済み状態」とする操作を受け付けた場合の処理について説明する。図11は、第一の実施形態の情報処理装置の動作を説明する第二のフローチャートである。
本実施形態の情報処理装置200において、補正処理部290は、操作受付部291により、ステータス情報242を確定済み状態とする操作を受け付けたか否かを判定する(ステップS1101)。ステップS1101において、該当する操作を受け付けない場合、補正処理部290は、操作を受け付けるまで待機する。
ステップS1101において、該当する操作を受け付けた場合、補正処理部290は、変数N=1とする(ステップS1102)。
続いて、補正処理部290は、登録部296により、表示用データ243に含まれるキーワードのうち、N個目のキーワードと、明細情報244に含まれるN個目のキーワードとを比較する(ステップS1103)。
続いて、補正処理部290は、登録部296により、表示用データ243のN個目のキーワードが変更されているか否かを判定する(ステップS1104)。ステップS1104において、変更されていない場合、補正処理部290は、後述するステップS1109へ進む。
ステップS1104において、キーワードが変更されている場合、登録部296は、明細情報244のN個目のキーワードを認識キーワードとし、表示用データ243のN個目のキーワードを修正キーワードとする組み合わせが、補正情報281に存在するか否かを判定する(ステップS1105)。
ステップS1105において、該当する組み合わせが補正情報281に存在しない場合、登録部296は、明細情報244のN個目のキーワードを認識キーワードとし、表示用データ243のN個目のキーワードを修正キーワードとする組み合わせを補正情報281へ追加し(ステップS1106)、後述するステップS1107へ進む。
ステップS1105において、該当する組み合わせが補正情報281に存在する場合、登録部296は、表示用データ243に次のキーワードが存在するか否かを判定する(ステップS1107)。ステップS1107において、次のキーワードが存在する場合、登録部296は、変数N=N+1とし(ステップS1108)、ステップS1103へ戻る。
ステップS1107において、次のキーワードが存在しない場合、補正処理部290は、処理を終了する。
尚、本実施形態では、新たな組み合わせを補正情報281に追加する際に、補正情報281に含まれる認識キーワードのうち、出現頻度が一定値よりも低い認識キーワードは、この認識キーワードと修正キーワードとの組み合わせを削除しても良い。
このように、補正情報281のうち、補正に用いられる頻度が低い組み合わせを削除することで、補正情報281が肥大化し、補正処理部290の処理負荷が増大することを抑制できる。
以上のように、本実施形態では、OCR処理部250による文字認識の結果に誤りがあった場合等に、補正情報281を参照して、自動的に誤りを修正することができる。また、本実施形態では、帳票認識部260による認識結果をユーザが閲覧した際に、ユーザによって修正された内容に基づき、補正情報281を更新する。
このため、本実施形態によれば、帳票におけるキーワード(文字列)の抽出精度を向上させことができる。より具体的には、本実施形態によれば、補正部294による補正の対象となるキーワードを明細情報244に含まれる項目値とした場合には、帳票における項目値の抽出の精度を向上させることができる。
また、本実施形態では、納品書情報241が未処理状態の場合にのみ、補正処理部290による補正が行われる。このため、本実施形態では、ユーザが画面110等において、明細情報244の項目値を手入力で修正した内容が、補正処理部290によって変更されることがない。
また、本実施形態では、表示用データ243において、認識キーワードが修正キーワードに補正されるため、OCR処理部250による読取結果情報をそのまま保管することができる。さらに、本実施形態では、OCR処理部250による誤認識が存在した場合でも、納品書情報241が表示される際に、誤認識されたキーワードが修正キーワードに上書される。したがって、本実施形態によれば、ユーザにOCR処理部250による誤認識を意識させる頻度を低減させることができ、利便性を向上させることができる。
(第二の実施形態)
以下に図面を参照して、第二の実施形態について説明する。第二の実施形態では、ユーザ毎の個社補正情報と、ユーザ間で共通する共通補正情報とを、補正情報として用いる点が第一の実施形態と相違する。よって、以下の第二の実施形態の説明では、第一の実施形態との相違点について説明し、第一の実施形態と同様の機能を有するものには、第一の実施形態の説明で用いた符号と同様の符号を付与し、その説明を省略する。
図12は、第二の実施形態の情報処理システムの有する各装置の機能構成を説明する図である。
本実施形態の情報処理システム100Aは、情報処理装置200Aと端末装置300とを有する。
情報処理装置200Aは、画像受付部220、帳票画像記憶部230、登録情報記憶部240、OCR(Optical Character Recognition)処理部250、帳票認識部260、表示用データ生成部270、補正情報記憶部280A、補正処理部290Aを有する。
補正情報記憶部280Aは、個社補正情報282、共通補正情報283を有する。
個社補正情報282は、情報処理システム100を利用するユーザ独自の補正情報であり、ユーザ毎に設けられる。共通補正情報283は、ユーザ間で共通する補正情報である。
補正処理部290Aは、操作受付部291、ステータス判定部292、補正判定部293A、補正部294A、出力部295、登録部296A、補正情報生成部297を有する。
本実施形態の補正判定部293Aは、個社補正情報282、共通補正情報283を参照して、補正部294Aにより補正を行うか否かを判定する。
本実施形態の補正部294Aは、納品書情報241のうち、補正の対象となる種別のキーワードを、補正情報282、共通補正情報283を用いて補正する。
本実施形態の登録部296Aは、新たな明細情報244のN個目のキーワードを認識キーワードとし、表示用データ243のN個目のキーワードを修正キーワードとする組み合わせが存在する場合に、この組み合わせを、ユーザと対応する個社補正情報282に追加する。
本実施形態の補正情報生成部297は、ユーザ毎の個社補正情報282から、共通する組み合わせを抽出し、共通補正情報283を生成する。
具体的には、補正情報生成部297は、ある条件が一致するユーザを、補正情報を共有するユーザのグループに特定し、グループ毎の補正情報を特定補正情報283として生成する。
ある条件とは、ユーザ同士で共通する事項であり、例えば、ユーザの業種や、親会社等であって良い。つまり、補正情報生成部297は、共通項を有するユーザを特定して1つのグループとし、グループ毎に特定補正情報283を生成する。
尚、ユーザをグループ化する際の条件(共通項)は、ユーザの業種や親会社等に限定されない。例えば、ユーザをグループ化する際の条件は、例えば、納品元としても良い。この場合には、同じ納品元から商品を仕入れているユーザが1つのグループとされる。
次に、図13乃至図15を参照して、本実施形態の補正情報記憶部280Aについて説明する。図13は、個社補正情報の一例を示す図である。
補正情報記憶部280Aにおいて、個社補正情報282は、ユーザを特定するための識別情報を含み、ユーザ毎に設けられる。具体的には、個社補正情報282は、ユーザを特定するためのテナントIDと、認識キーワードと、修正キーワードとが対応付けられている。
図13に示す個社補正情報282−1は、テナントID「1」で特定されるユーザの補正情報であり、個社補正情報282-2、テナントID「2」で特定されるユーザの補正情報であり、個社補正情報282−3は、テナントID「3」で特定されるユーザの補正情報である。
例えば、個社補正情報282−1では、認識キーワード「ミネラルウーター」、修正キーワード「ミネラルウォーター」の組み合わせと、認識キーワード「あ茶」、修正キーワード「お茶」の組み合わせと、がテナントID「1」と対応付けられている。したがって、テナントID「1」で特定されるユーザの納品書では、OCR処理部250において、「お茶」というが、「あ茶」と誤認識されたことがわかる。
以下に、図14を参照して、補正処理部290Aによる共通補正情報283の生成について説明する。図14は、第二の実施形態の情報処理装置の動作を説明する第一のフローチャートである。図14では、補正情報生成部297による共通補正情報283の生成処理を示している。
尚、図14の例では、ユーザをグループする条件を業種とした場合を示している。言い換えれば、図14の例では、補正情報生成部297は、業種が一致するユーザを1つのグループとし、共通補正情報283を生成する。
補正処理部290Aにおいて、補正情報生成部297は、業種が一致するユーザを特定し、1つのグループとする(ステップS1401)。本実施形態では、例えば、個社補正情報282に、ユーザの業種を示す情報が含まれており、この情報に基づき、業種が一致するユーザを特定しても良い。
続いて、補正情報生成部297は、特定したユーザ毎の個社補正情報282を参照し、認識キーワード及び修正キーワードが共通する組み合わせを特定する(ステップS1402)。
続いて、補正情報生成部297は、ステップS1402で特定された組み合わせが存在するか否かを判定する(ステップS1403)。ステップS1403において、該当する組み合わせが存在しない場合、補正情報生成部297は、処理を終了する。
ステップS1403において、該当する組み合わせが存在する場合、補正情報生成部297は、この組み合わせと一致する組み合わせが、このグルーブと対応する共通補正情報283に存在するか否かを判定する(ステップS1404)。
ステップS1404において、この組み合わせと一致する組み合わせが、グループと対応する共通補正情報283に存在する場合、補正情報生成部297は、処理を終了する。
ステップS1404において、この組み合わせと一致する組み合わせが、グループと対応する共通補正情報283に存在しない場合、補正情報生成部297は、この組み合わせをこのグループと対応する共通補正情報283に追加して登録する(ステップS1405)。
続いて、補正情報生成部297は、グループ化されたユーザの個社補正情報282のそれぞれから、共通補正情報283に追加された組み合わせと一致する組み合わせを削除し(ステップS1406)、処理を終了する。
本実施形態では、図14に示す処理を、定期的に実行することで、複数の個社補正情報282において、認識キーワードと修正キーワードの組み合わせが重複して格納されることを抑制でき、情報量の低減に貢献できる。
尚、図14の例では、グループ化されたユーザの個社補正情報282において、共通する組み合わせのみを抽出するものとしたが、これに限定されない。例えば、補正情報生成部297は、グループに含まれるユーザ数に対し、一定の割合以上のユーザ数において、認識キーワードと修正キーワードとが一致する組み合わせが存在する場合には、この組み合わせを共通補正情報283に追加しても良い。
以下に、補正情報生成部297によって生成された共通補正情報283の例を示す。図15は、共通補正情報の一例を示す図である。図15(A)は、共通補正情報283を示す。図15(B)は、共通補正情報283が生成された後の個社補正情報282を示す。
図15(A)の例では、業種が「小売」であり、認識キーワード「ミネラルウーター」と修正キーワード「ミネラルウォーター」との組み合わせと対応付けられている。
この組み合わせは、例えば、図13の個社補正情報282−1、個社補正情報282−2、個社補正情報282−3において共通する組み合わせである。
本実施形態では、共通補正情報283を生成するために、個社補正情報282から抽出された組み合わせは、個社補正情報282から削除される。
図15(B)に示す個社補正情報282A−1、282A−2、282A−3は、個社補正情報282−1、282−2、282−3のそれぞれから、認識キーワード「ミネラルウーター」と修正キーワード「ミネラルウォーター」との組み合わせが削除された状態を示す。
本実施形態では、このように、共通補正情報283の生成のために抽出された組み合わせを個社補正情報282から削除することで、個社補正情報282の肥大化を抑制でき、処理の負荷を軽減できる。
次に、図16を参照して、本実施形態の情報処理装置200Aの動作について説明する。図16は、第二の実施形態の情報処理装置の動作を説明する第二のフローチャートである。
図16のステップS1601からステップS1606までの処理は、図8のステップS801からステップS806までの処理と同様であるから、説明を省略する。
ステップS1606に続いて、補正処理部290Aは、補正判定部293Aにより、参照する個社補正情報282を特定する(ステップS1607)。
本実施形態では、例えば、納品書情報241の一覧の表示要求を受け付ける際に、ユーザを特定するテナントIDも共に取得する。補正判定部293Aは、補正情報記憶部280を参照し、表示要求と共に取得したテナントIDと対応する個社補正情報282を特定する。
続いて、補正判定部293Aは、補正の対象に特定されたキーワードの中から、N個目のキーワードを抽出し、このキーワードで特定された個社補正情報282を検索する(ステップS1608)。
続いて、補正判定部293Aは、個社補正情報282の認識キーワードの中に、N個目のキーワードと一致するものが存在するか否かを判定する(ステップS1609)。ステップS1609において、一致する認識キーワードが存在する場合、補正判定部293Aは、後述するステップS1613へ進む。
ステップS1609において、一致する認識キーワードが存在しない場合、補正判定部293Aは、N個目のキーワードで特定された共通補正情報283を検索する(ステップS1610)。
続いて、補正判定部293Aは、特定補正情報283の認識キーワードの中に、N個目のキーワードと一致するものが存在するか否かを判定する(ステップS1611)。ステップS1611において、共通補正情報283に該当するキーワードが存在する場合、補正処理部290Aは後述するステップS1613へ進む。
ステップS1611において、共通補正情報283に該当するキーワードが存在しない場合、補正処理部290Aは、補正部294Aにより、個社補正情報282又は共通補正情報283の認識キーワードと対応する修正キーワードを取得して保持し(ステップS1612)、ステップS1613へ進む。
図16のステップS1613からステップS1617の処理は、図8のステップS810からステップS814の処理と同様であるから、説明を省略する。
また、本実施形態の補正処理部290Aは、ユーザの手入力によって修正がなされた場合、登録部296Aにより、この修正に対応した組み合わせを個社補正情報282へ追加する。
登録部296Aの処理は、図11に示す処理において、ステップS1106の処理が、ユーザと対応する個社補正情報282となる以外は、同様であるから、説明を省略する。
以上のように、本実施形態では、補正を行う際に、最初にユーザ毎の個社補正情報282を参照するため、個々のユーザに合わせた補正情報を生成することができる。したがって、ユーザ独自の項目値等が存在する場合でも、項目値の抽出の精度を向上させることができる。言い換えれば、本実施形態では、ユーザ独自の表現が含まれる帳票であっても、帳票における文字列の抽出精度を向上させることができる。
尚、本実施形態では、補正処理部290Aは、個社補正情報282と共通補正情報283を参照して補正を行うものとしたが、共通補正情報283を参照した後に、補正情報281を参照するようにしても良い。
具体的には、図16のステップS1611において、一致する認識キーワードが存在しない場合に、補正情報281の認識キーワードに一致する認識キーワードが存在するか否かを判定しても良い。この場合、補正情報281に該当する認識キーワードが存在する場合はステップS1612へ進み、存在しない場合にはステップS1613へ進めばよい。
上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(digital signal processor)、FPGA(field programmable gate array)や従来の回路モジュール等のデバイスを含むものとする。
また、上述した実施形態に記載された装置群は、本明細書に開示された実施形態を実施するための複数のコンピューティング環境のうちの1つを示すものにすぎない。ある実施形態では、情報処理装置200は、サーバクラスタといった複数のコンピューティングデバイスを含む。複数のコンピューティングデバイスは、ネットワークや共有メモリなどを含む任意のタイプの通信リンクを介して互いに通信するように構成されており、本明細書に開示された処理を実施する。
同様に、情報処理装置200は、互いに通信するように構成された複数のコンピューティングデバイスを含むことができる。さらに、情報処理装置200は、開示された処理ステップ、例えば図8、11、15、16を様々な組み合わせで共有するように構成できる。例えば、所定のユニットによって実行されるプロセスは、情報処理装置200によって実行され得る。同様に、所定のユニットの機能は、情報処理装置200によって実行することができる。また、情報処理装置200の各要素は、1つのサーバ装置にまとめられていても良いし、複数の装置に分けられていても良い。
また、明細書中の補正情報は、機械学習の学習効果によって生成されたものでもよい。ここで、機械学習とは、コンピュータに人のような学習能力を獲得させるための技術であり,コンピュータが,データ識別等の判断に必要なアルゴリズムを,事前に取り込まれる学習データから自律的に生成し,新たなデータについてこれを適用して予測を行う技術のことをいう。機械学習のための学習方法は、教師あり学習、教師なし学習、半教師学習、強化学習、深層学習のいずれかの方法でもよく、さらに、これらの学習方法を組み合わせた学習方法でもよく、機械学習のための学習方法は問わない。
以上、各実施形態に基づき本発明の説明を行ってきたが、上記実施形態に示した要件に本発明が限定されるものではない。これらの点に関しては、本発明の主旨をそこなわない範囲で変更することができ、その応用形態に応じて適切に定めることができる。
100、100A 情報処理システム
200、200A 情報処理装置
230 帳票画像記憶部
240 登録情報記憶部
241 納品書情報
242 ステータス情報
243 表示用データ
244 明細情報
255 登録情報
250 OCR処理部
260 帳票認識部
290、290A 補正処理部
291 操作受付部
292、292A ステータス判定部
293、293A 補正判定部
294、294A 補正部
295 出力部
296、296A 登録部
297 補正情報生成部
300 端末装置
330 表示制御部
特開2011−107966号公報

Claims (10)

  1. 帳票画像から文字認識により読み取られた文字列と、文字列の位置を示す情報とが対応付けられた読取結果情報から、項目及び項目値を抽出して対応づけた帳票情報を生成する帳票認識部と、
    記憶部に格納された、前記文字認識より認識された文字列である認識文字列と、前記認識文字列を修正した修正文字列とが対応付けられた補正情報を参照し、前記帳票情報に補正の対象となる文字列が存在するか否かを判定する補正判定部と、
    前記補正の対象となる文字列が存在する場合に、前記帳票情報を表示装置に表示させる表示用データにおいて、前記補正の対象となる文字列を、前記補正情報に基づき補正する補正部と、を有する情報処理装置。
  2. 前記帳票情報の状態を判定するステータス判定部を有し、
    前記補正判定部は、
    前記ステータス判定部により、前記帳票情報の状態が、前記帳票認識部によって取得された直後の状態であると判定された場合に、前記帳票情報に補正の対象となる文字列が存在するか否かを判定する、請求項1記載の情報処理装置。
  3. 前記補正部は、
    前記記憶部から、前記帳票情報に含まれる文字列のうち、前記補正情報に含まれる前記認識文字列と一致する文字列と対応する修正文字列を取得し、
    前記表示用データにおいて、前記認識文字列と一致する文字列を、前記修正文字列に置き換える、請求項2記載の情報処理装置。
  4. 認識文字列と修正文字列との組み合わせを前記補正情報に追加する登録部を有し、
    前記登録部は、
    前記ステータス判定部により、前記帳票情報の状態が、確定された状態とされたときに、前記表示用データに含まれる文字列のうち、前記帳票情報に含まれる文字列と異なる文字列が存在するか否かを判定し、
    前記異なる文字列が存在する場合に、前記異なる文字列を修正文字列とし、前記帳票情報において、前記異なる文字列と対応する文字列を認識文字列とした組み合わせを、前記補正情報に追加する、請求項2又は3記載の情報処理装置。
  5. 前記補正情報は、前記ユーザ毎の個社補正情報と、ユーザ間で共通する共通補正情報とを含み、
    前記補正判定部は、
    前記個社補正情報を参照し、前記帳票情報に補正の対象となる文字列が存在するか否かを判定し、
    前記補正部は、
    前記補正の対象となる文字列が存在すると判定された場合に、前記表示用データにおいて、前記補正の対象となる文字列を、前記個社補正情報に基づき補正する請求項1乃至4の何れか一項に記載の情報処理装置。
  6. 前記補正判定部は、
    前記個社補正情報を参照し、前記帳票情報に補正の対象となる文字列が存在しないと判定した場合に、前記共通補正情報を参照して、前記補正の対象となる文字列が存在するか否かを判定し、
    前記補正部は、
    前記補正の対象となる文字列が存在すると判定された場合に、前記表示用データにおいて、前記補正の対象となる文字列を、前記共通補正情報に基づき補正する請求項5記載の情報処理装置。
  7. 複数の前記個社補正情報において、認識文字列と前記認識文字列に対応付けられた修正文字列とが一致する組み合わせが存在する場合、前記認識文字列と前記修正文字列の組み合わせを前記共通補正情報に追加し、前記個社補正情報から、前記組み合わせを削除する、補正情報生成部を有する、請求項5又は6記載の情報処理装置。
  8. 情報処理装置による情報処理方法であって、前記情報処理装置が
    帳票画像から文字認識により読み取られた文字列と、文字列の位置を示す情報とが対応付けられた読取結果情報から、項目及び項目値を抽出して対応づけた帳票情報を生成し、
    記憶部に格納された、前記文字認識より認識された文字列である認識文字列と、前記認識文字列を修正した修正文字列とが対応付けられた補正情報を参照し、前記帳票情報に補正の対象となる文字列が存在するか否かを判定し、
    前記補正の対象となる文字列が存在する場合に、前記帳票情報を表示装置に表示させる表示用データにおいて、前記補正の対象となる文字列を、前記補正情報に基づき補正する、情報処理方法。
  9. 帳票画像から文字認識により読み取られた文字列と、文字列の位置を示す情報とが対応付けられた読取結果情報から、項目及び項目値を抽出して対応づけた帳票情報を生成し、
    記憶部に格納された、前記文字認識より認識された文字列である認識文字列と、前記認識文字列を修正した修正文字列とが対応付けられた補正情報を参照し、前記帳票情報に補正の対象となる文字列が存在するか否かを判定し、
    前記補正の対象となる文字列が存在する場合に、前記帳票情報を表示装置に表示させる表示用データにおいて、前記補正の対象となる文字列を、前記補正情報に基づき補正する、処理を情報処理装置に実行させる、プログラム。
  10. 情報処理装置と、端末装置とを有する情報処理システムであって、
    前記情報処理装置は、
    帳票画像から文字認識により読み取られた文字列と、文字列の位置を示す情報とが対応付けられた読取結果情報から、項目及び項目値を抽出して対応づけた帳票情報を生成する帳票認識部と、
    記憶部に格納された、前記文字認識より認識された文字列である認識文字列と、前記認識文字列を修正した修正文字列とが対応付けられた補正情報を参照し、前記帳票情報に補正の対象となる文字列が存在するか否かを判定する補正判定部と、
    前記補正の対象となる文字列が存在する場合に、前記帳票情報を前記端末装置の表示装置に表示させる表示用データにおいて、前記補正の対象となる文字列を、前記補正情報に基づき補正する補正部と、を有し、
    前記端末装置は、
    前記表示用データを表示させる表示装置を有する、情報処理システム。
JP2020046921A 2020-03-17 2020-03-17 情報処理装置、情報処理方法、プログラム、情報処理システム Pending JP2021149336A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020046921A JP2021149336A (ja) 2020-03-17 2020-03-17 情報処理装置、情報処理方法、プログラム、情報処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020046921A JP2021149336A (ja) 2020-03-17 2020-03-17 情報処理装置、情報処理方法、プログラム、情報処理システム

Publications (1)

Publication Number Publication Date
JP2021149336A true JP2021149336A (ja) 2021-09-27

Family

ID=77848799

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020046921A Pending JP2021149336A (ja) 2020-03-17 2020-03-17 情報処理装置、情報処理方法、プログラム、情報処理システム

Country Status (1)

Country Link
JP (1) JP2021149336A (ja)

Similar Documents

Publication Publication Date Title
US11941672B2 (en) Information processing system, information processing method, and non-transitory recording medium
US20210209291A1 (en) Systems and methods for presentation of a terminal application screen
US20210124973A1 (en) Information processing system and method
US11804055B2 (en) Information processing apparatus, information processing method, and information processing system
US11875587B2 (en) Information processing system, information processing method, and non-transitory recording medium
CN110321880B (zh) 系统和控制方法
JP2022017751A (ja) 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム
JP2021149336A (ja) 情報処理装置、情報処理方法、プログラム、情報処理システム
US11960949B2 (en) Information processing apparatus, information processing system, and information processing method
JP5065001B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2017084198A (ja) システム、プログラム及び制御方法
US20230244860A1 (en) Information processing apparatus, information processing method, and information processing system
US20220382804A1 (en) Information processing apparatus, information processing system, and method of information processing
CN108092875B (zh) 一种表情提供方法、介质、装置和计算设备
JP7456131B2 (ja) 情報処理システム、情報処理方法及びプログラム
JP2021140260A (ja) 情報処理装置及び情報処理プログラム
JP7447928B2 (ja) 情報処理装置、プログラム、情報処理システム、情報処理方法
JP2020135402A (ja) 情報処理装置、情報処理システム、情報処理方法及びプログラム
JP2016066335A (ja) 情報処理システム、情報処理装置、情報処理システムの制御方法、及びプログラム
JP7199755B1 (ja) 投稿連携装置、投稿連携方法及び投稿連携プログラム
US20230281072A1 (en) Information processing apparatus, information processing method, and information processing system
JP6686093B2 (ja) 画面対応付け方法、情報処理装置、操作再現システム及び画面対応付けプログラム
JP2016066941A (ja) 情報処理システム、制御方法、及びプログラム
JP5346967B2 (ja) Faxocrシステムおよびfaxocrプログラム
JP2024123962A (ja) 画像処理装置、画像処理システム、出力装置、画像処理方法、及び画像処理プログラム