JP2020170465A - 情報処理装置、制御方法、プログラム - Google Patents

情報処理装置、制御方法、プログラム Download PDF

Info

Publication number
JP2020170465A
JP2020170465A JP2019072949A JP2019072949A JP2020170465A JP 2020170465 A JP2020170465 A JP 2020170465A JP 2019072949 A JP2019072949 A JP 2019072949A JP 2019072949 A JP2019072949 A JP 2019072949A JP 2020170465 A JP2020170465 A JP 2020170465A
Authority
JP
Japan
Prior art keywords
correction
data
recognition data
area
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019072949A
Other languages
English (en)
Inventor
占部 健
Takeshi Urabe
健 占部
橋本 紘
Hiroshi Hashimoto
紘 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Canon IT Solutions Inc
Original Assignee
Canon Marketing Japan Inc
Canon IT Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc, Canon IT Solutions Inc filed Critical Canon Marketing Japan Inc
Priority to JP2019072949A priority Critical patent/JP2020170465A/ja
Publication of JP2020170465A publication Critical patent/JP2020170465A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】本発明は、OCR認識結果に対する訂正内容に応じて訂正箇所を確認できる仕組みを提供することを目的とする。【解決手段】本発明は、複数の文字列の領域を含む画像から認識した文字列および当該文字列を認識した領域を認識データとして取得する情報処理装置であって、前記取得した認識データの訂正を受け付ける受付手段と、前記受け付けた訂正の前後の認識データに基づいて、当該訂正の内容が所定の条件を満たすか否かを判定する判定手段と、前記所定の条件を満たすと判定された場合に、前記訂正を受け付けた認識データの訂正箇所を通知する通知手段とを備えることを特徴とする。【選択図】図4

Description

本発明は、OCR結果の訂正内容を確認する技術に関する。
OCR(Optical Character Recognition。光学文字認識)を使ってテキスト情報を画像より抽出する技術が広く知られているが、アナログ情報をデジタル情報に変換するという性質上、OCRの精度は100%ではない。そのため、OCRの結果を確認・訂正する手順が必要とされている。また、OCRの対象のドキュメントが、請求書のような業務帳票である場合、OCRで読み取ったデータを最終的に会計システムに登録する前に、担当部門の上長等の承認者による承認が必要となっている。具体的には、請求書のケースでは、承認者は請求書画像から読み取った請求内容(特に請求元、請求対象、請求金額)を承認時に確認している。
特許文献1には、OCR結果の確からしさを確認するために、認識処理の各処理(前処理、認識処理、解析処理)の状況を取得し、取得した処理状況により評価した信頼性情報に基づいて、認識候補の確からしさを評価、分類する技術が示されている。
特開2015−146075号公報
しかし、通常の業務の流れとして、承認者が承認する前に、業務担当者が目視でOCR結果の確認を行い、認識結果に誤りがある場合には訂正を行う。この作業にはOCR認識誤りの見落としや訂正時の入力ミス等のリスクが存在する。また、業務担当者が故意に請求金額等を変更して会社に不正な金額を請求するリスクも考えられる。
特許文献1に記載の方法では、OCR認識結果の確からしさを確認することはできるが、OCR認識結果そのものが変更された場合に、その変更内容が妥当か否かをすぐに確認することはできない。
そこで、本発明は、OCR認識結果に対する訂正内容に応じて訂正箇所を確認できる仕組みを提供することを目的とする。
本発明は、複数の文字列の領域を含む画像から認識した文字列および当該文字列を認識した領域を認識データとして取得する情報処理装置であって、前記取得した認識データの訂正を受け付ける受付手段と、前記受け付けた訂正の前後の認識データに基づいて、当該訂正の内容が所定の条件を満たすか否かを判定する判定手段と、前記所定の条件を満たすと判定された場合に、前記訂正を受け付けた認識データの訂正箇所を通知する通知手段とを備えることを特徴とする。
本発明によれば、OCR認識結果に対する訂正内容に応じて訂正箇所を確認できる仕組みを提供できるようになる。
本発明の実施形態である情報処理システム1の構成の一例を示すシステム構成図である。 情報処理システム1を構成するクライアントPC200、業務サーバ300、DBサーバ400、OCRサーバ500、メールサーバ600に適用可能な情報処理装置のハードウェア構成の一例を示すブロック図である。 情報処理システム1を構成する複合機100に適用可能な情報処理装置のハードウェア構成の一例を示すブロック図である。 情報処理システム1を構成する各情報処理装置の機能構成の一例を示すブロック図である。 情報処理システム1のOCR(読取・認識)処理の一例を示すフローチャートである。 情報処理システム1のOCR(読取・認識)処理の一例を示すフローチャートである。 情報処理システム1のVerification(確認・訂正)処理の一例を示すフローチャートである。 情報処理システム1のVerification(確認・訂正)処理の一例を示すフローチャートである。 情報処理システム1のApproval(承認/否認)処理の一例を示すフローチャートである。 情報処理システム1のApproval(承認/否認)処理の一例を示すフローチャートである。 クライアントPC200のブラウザに表示される請求書詳細画面の一例を示す画面イメージである。 クライアントPC200のブラウザに表示される承認依頼詳細画面の一例を示す画面イメージである。 クライアントPC200のブラウザに表示される承認依頼詳細画面の一例を示す画面イメージである。 情報処理システム1で使用するデータ類の一例を示すデータ構成図である。
以下、図面を参照して、本発明の実施形態を詳細に説明する。
図1は、本発明における情報処理システム1のシステム構成の一例を示す図である。
情報処理システム1は、複合機100、クライアントPC200、業務サーバ300、DBサーバ400、OCRサーバ500、メールサーバ600が、LAN10(Local Area Network)等のネットワークにて通信可能に接続されて構成される。
それぞれの情報処理機器の機能については、図4にて後述する。
以上で図1のシステム構成図の説明を終了する。
以下、図2を用いて、図1に示したクライアントPC200、業務サーバ300、DBサーバ400、OCRサーバ500、メールサーバ600に適用可能な情報処理装置のハードウェア構成の一例について説明する。
図2は、情報処理装置のハードウェア構成の一例を示すブロック図である。
図2において、2001はCPUで、システムバス2004に接続される各デバイスやコントローラを統括的に制御する。また、ROM2002あるいは外部メモリ2011には、CPU2001の制御プログラムであるBIOS(Basic Input / Output System)やオペレーティングシステムプログラム(以下、OS)や、各サーバ或いは各PCの実行する機能を実現するために必要な後述する各種プログラム等が記憶されている。
2003はRAMで、CPU2001の主メモリ、ワークエリア等として機能する。CPU2001は、処理の実行に際して必要なプログラム等をROM2002あるいは外部メモリ2011からRAM2003にロードして、該ロードしたプログラムを実行することで各種動作を実現するものである。
また、2005は入力コントローラで、キーボード(KB)2009や不図示のマウス等のポインティングデバイス等からの入力を制御する。2006はビデオコントローラで、ディスプレイ2010等の表示器への表示を制御する。なお、表示器はCRTや、液晶ディスプレイ等の様々な種類が存在する。
2007はメモリコントローラで、ブートプログラム,各種のアプリケーション,フォントデータ,ユーザファイル,編集ファイル,各種データ等を記憶する外部記憶装置(ハードディスク(HD))や、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるCFカードメモリ等の外部メモリ2011へのアクセスを制御する。
2008は通信I/Fコントローラで、ネットワーク(例えば、図1に示したLAN10)を介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信等が可能である。
なお、CPU2001は、例えばRAM2003内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ2010上での表示を可能としている。また、CPU2001は、ディスプレイ2010上の不図示のマウスカーソル等でのユーザ指示を可能とする。
本発明を実現するための後述する各種プログラムは、外部メモリ2011に記録されており、必要に応じてRAM2003にロードされることによりCPU2001によって実行されるものである。さらに、上記プログラムの実行時に用いられる定義ファイル及び各種情報テーブル等も、外部メモリ2011に格納されており、これらについての詳細な説明も後述する。
以上で図2のハードウェア構成図の説明を終了する。
以下、図3を用いて、図1に示した複合機100に適用可能な情報処理装置のハードウェア構成の一例について説明する。
図3は、情報処理装置のハードウェア構成の一例を示すブロック図である。
図3において、3020はコントローラユニットで、画像入力デバイスとして機能するスキャナ3060や、画像出力デバイスとして機能するプリンタ3050と接続する一方、LAN(例えば、図1に示したLAN10)や公衆回線(WAN)(例えば、PSTNまたはISDN等)と接続することで、画像データやデバイス情報の入出力を行う。
コントローラユニット3020において、3001はCPUで、システム全体を制御するプロセッサである。3002はRAMで、CPU3001が動作するためのシステムワークメモリであり、プログラムを記録するためのプログラムメモリや、画像データを一時記録するための画像メモリでもある。
3003はROMで、システムのブートプログラムや各種制御プログラムが格納されている。3004は外部記憶装置(ハードディスクドライブ(HDD))で、システムを制御するための各種プログラム,画像データ等を格納する。
3007は操作部インタフェース(操作部I/F)で、操作部(UI)3030とのインタフェース部であり、操作部3030に表示する画像データを操作部3030に対して出力する。また、操作部I/F3007は、操作部3030から本システム使用者が入力した情報(例えば、ユーザ情報等)をCPU3001に伝える役割をする。なお、操作部3030はタッチパネルを有する表示部を備え、該表示部に表示されたボタンを、ユーザが押下(指等でタッチ)することにより、各種指示を行うことができる。
3005はネットワークインタフェース(Network I/F)で、ネットワーク(LAN)に接続し、データの入出力を行う。3006はモデム(MODEM)で、公衆回線に接続し、FAXの送受信等のデータの入出力を行う。
3009は外部インタフェース(外部I/F)で、USB、IEEE1394,プリンタポート,RS−232C等の外部入力を受け付けるI/F部であり、本実施形態においては認証で必要となるICカードの読み取り用のカードリーダ3040が外部I/F3009に接続されている。そして、CPU3001は、この外部I/F3009を介してカードリーダ3040によるICカードからの情報読み取りを制御し、該ICカードから読み取られた情報を取得可能である。尚、ICカードに限らず、ユーザを特定することが可能な記憶媒体であればよい。この場合、記憶媒体にはユーザを識別するための識別情報が記憶される。この識別情報は、記憶媒体の製造番号でも、ユーザが企業内で与えられるユーザコードであってもよい。
以上のデバイスがシステムバス3010上に配置される。
3008はイメージバスインタフェース(IMAGE BUS I/F)であり、システムバス3010と画像データを高速で転送する画像バス3015とを接続し、データ構造を変換するバスブリッジである。
画像バス3015は、PCIバスまたはIEEE1394で構成される。画像バス3015上には以下のデバイスが配置される。
3011はラスタイメージプロセッサ(RIP)で、例えば、PDLコード等のベクトルデータをビットマップイメージに展開する。3012はプリンタインタフェース(プリンタI/F)で、プリンタ3050とコントローラユニット3020を接続し、画像データの同期系/非同期系の変換を行う。また、3013はスキャナインタフェース(スキャナI/F)で、スキャナ3060とコントローラユニット3020を接続し、画像データの同期系/非同期系の変換を行う。
3014は画像処理部で、入力画像データに対し補正、加工、編集や、プリント出力画像データに対して、プリンタの補正、解像度変換等を行う。また、これに加えて、画像処理部3014は、画像データの回転や、多値画像データに対してはJPEG、2値画像データはJBIG、MMR、MH等の圧縮伸張処理を行う。
スキャナ3060は、原稿となる紙上の画像を照明し、CCDラインセンサで走査することで、ラスタイメージデータとして電気信号に変換する。原稿用紙は原稿フィーダのトレイにセットし、装置使用者が操作部3030から読み取り起動指示することにより、CPU3001がスキャナ3060に指示を与え、フィーダは原稿用紙を1枚ずつフィードし原稿画像の読み取り動作を行う。
プリンタ3050は、ラスタイメージデータを用紙上の画像に変換する部分であり、その方式は感光体ドラムや感光体ベルトを用いた電子写真方式、微少ノズルアレイからインクを吐出して用紙上に直接画像を印字するインクジェット方式等があるが、どの方式でも構わない。プリント動作の起動は、CPU3001からの指示によって開始する。なお、プリンタ3050には、異なる用紙サイズまたは異なる用紙向きを選択できるように複数の給紙段を持ち、それに対応した用紙カセットがある。
操作部3030は、LCD表示部を有し、LCD上にタッチパネルシートが貼られており、システムの操作画面を表示するとともに、表示してあるキーが押されるとその位置情報を操作部I/F3007を介してCPU3001に伝える。また、操作部3030は、各種操作キーとして、例えば、スタートキー、ストップキー、IDキー、リセットキー等を備える。
ここで、操作部3030のスタートキーは、原稿画像の読み取り動作を開始する時などに用いる。スタートキーの中央部には、緑と赤の2色LEDがあり、その色によってスタートキーが使える状態にあるかどうかを示す。また、操作部3030のストップキーは、稼働中の動作を止める働きをする。また、操作部3030のIDキーは、使用者のユーザIDを入力する時に用いる。リセットキーは、操作部からの設定を初期化する時に用いる。
カードリーダ3040は、CPU3001からの制御により、ICカード(例えば、ソニー社のFeliCa(登録商標))内に記憶されている情報を読み取り、該読み取った情報を外部I/F3009を介してCPU3001へ通知する。
以上で図3のハードウェア構成図の説明を終了する。
図4を用いて、本実施形態の各装置の機能について説明する。
まず、複合機100の処理を実行するための機能について説明する。
複合機100はスキャン部101、ファイル送信部102から構成される。
スキャン部101は、複合機100のスキャナ3060を制御して、原稿となる紙上の画像をデジタル化し、任意の画像形式に変換して、任意のサーバの任意のフォルダに送信する機能を提供する。ファイル形式について、例えば、JPEG(Joint Photographic Expert Group)、TIFF(Taged Image File Format)、PDF(Portable Document Format)、XPS(XML Paper Specification)、OOXML(Office Open XML)などがある。
ファイル送信部102は、FTP、SMB、WebDAVなどのプロトコルを使って、任意のサーバに対してファイルを送信する。
次に、クライアントPC200の処理を実行するための機能について説明する。
クライアントPC200はブラウザ部201から構成される。
ブラウザ部201は、任意のサーバ上で実行されているWebアプリケーションにHTTPないしはHTTPSプロトコルでリクエストを送信し、サーバから返されるHTMLメッセージのレスポンスを、クライアントPC200上の画面にUIとして表示する。
次に、業務サーバ300の処理を実行するための機能について説明する。
業務サーバ300は画面表示部301、データ送受信部302、業務データ管理部303から構成される。
画面表示部301は、クライアントPC200のブラウザ部201等からのHTTP・HTTPSプロトコルを使ったリクエストを受け付け、レスポンスとして画面情報をHTMLデータにして返却する。
データ送受信部302は、DBサーバ400のデータ送受信部402に対して、請求書データ1303のリクエストを送信する。また、DBサーバ400のデータ送受信部402から請求書データ1303のレスポンスを受信する
業務データ管理部303は、データ送受信部302で取得した請求書データ1303を参照し、画面表示部301で返却する画面情報の切り替えを行う。また、データ送受信部302で送信する請求書データ1303を書き換える。
次に、DBサーバ400の処理を実行するための機能について説明する。
DBサーバ400はデータ管理部401、データ送受信部402、業務データ記憶部410から構成される。
データ管理部401はデータ送受信部402で取得した請求書データ1303を業務データ記憶部410に書き込んだり、業務データ記憶部410の請求書データ1303を書き換えたりする。
データ送受信部402は業務サーバ300のデータ送受信部302で取得したリクエストに対して請求書データ1303をレスポンスとして返却する。また、OCRサーバ500からOCRで抽出されたテキスト情報を受信する。
次に、OCRサーバ500の処理を実行するための機能について説明する。
OCRサーバ500はメール監視部501、OCR部502、ネットワーク共有フォルダ部503から構成される。
メール監視部501はメールサーバ600のメール管理部601を監視し、新規のメールが存在するかを確認したり、添付ファイルが存在するかを確認したりする。添付ファイルが存在する場合にはネットワーク共有フォルダ部503にファイルを保存する。
OCR部502はネットワーク共有フォルダ部503に保存されたファイルを読み込み、OCRを行って画像からテキスト情報を抽出する。抽出したテキスト情報をDBサーバ400のデータ送受信部402に送信する。
ネットワーク共有フォルダ部503は複合機100のファイル送信部102から受信したファイルを保存したり、OCRサーバ500のメール監視部501で存在を確認した添付ファイルを保存したりする。
次に、メールサーバ600の処理を実行するための機能について説明する。
メールサーバ600はメール管理部601、メール送受信部602から構成される。
メール管理部601は受信したメール及び送信したメールの管理を行う。OCRサーバ500のメール監視部501からの監視を受け、新規のメールが存在する場合には該当のメール情報をOCRサーバ500のメール監視部501に引き渡す。
メール送受信部602はメールを受信したり、メールを送信したりする。
次に、図5、図6、図7、図8、図9、図10を参照しながら、本発明に係る各ステップでの処理について説明する。
まず、図5、図6を参照しながら、OCR(読取・認識)処理の処理フローについて説明する。
メールの添付ファイルを取得し、OCRするフローについて図5を用いて説明する。OCRサーバ500ではメールサーバ600に新規メールが存在するかを監視する(ステップS500)。新規メールが存在する場合にはメールサーバ600に対してメール取得の要求を行う(ステップS501)。メールサーバ600はOCRサーバ500のメール取得要求に対し、メールの返却を行う(ステップS502)。OCRサーバ500はメールサーバ600から返却されたメールを受信する(ステップS503)。OCRサーバ500はメールに添付ファイルが存在するか確認する(ステップS504)。添付ファイルが存在しない場合、OCRサーバ500は引き続きメールサーバ600の監視を行う。添付ファイルが存在する場合には添付ファイルをネットワーク共有フォルダに保存する(ステップS505)。
OCRサーバ500はステップS505でネットワーク共有フォルダに保存されたファイルに対してOCRを行う(ステップS506)。OCR完了後、OCRしたデータ及び対象となったファイルをDBサーバ400に送信する(ステップS507)。
DBサーバ400はOCRサーバ500から送信されたOCRデータと対象となったファイルを受信する(ステップS508)。DBサーバ400は受信したOCRデータを図14の請求書データ1303のレコードとして業務データ記憶部410に保存し、対象となったデータを図14のファイルデータ1314として保存する(ステップS509)。
複合機のスキャンファイルをOCRするフローについて図6を用いて説明する。複合機100でスキャンされたファイルをOCRサーバ500に送信する(ステップS600)。OCRサーバ500では受信したスキャンファイルをネットワーク共有フォルダに保存する(ステップS601)。S601以降の処理については図5と同様となるため、割愛する。
次に、図7、図8を参照しながらVerification(確認・訂正)処理の処理フローについて説明する。
クライアントPC200はブラウザを起動する(ステップS700)。ブラウザから本システムにアクセスすることで、クライアントPC200はログイン画面を業務サーバ300にリクエストする(ステップS701)。業務サーバ300はログイン画面を生成する(ステップS702)。クライアントPC200は生成されたログイン画面をブラウザに描画する(ステップS703)。
クライアントPC200はブラウザからログイン画面で入力を受け付け、業務サーバ300に入力情報を送信する(ステップS704)。業務サーバ300は図14のユーザデータ1300と入力情報を照会し、認証を行う(ステップS705)。
認証後、業務サーバ300はログインユーザに紐づく請求書リストの取得をDBサーバ400に対してリクエストする(ステップS706)。DBサーバ400はログインユーザのユーザIDと図14の請求書データ1303の担当者ID1310が一致する請求書データを業務データ記憶部410から取得して請求書リストを返却する(ステップS707)。業務サーバ300は取得した請求書リストから請求書リスト画面を生成し、クライアントPC200に返却する(ステップS708)。クライアントPC200は返却された請求書リスト画面をブラウザに描画する(ステップS709)。
クライアントPC200はブラウザから請求書選択を受け付け、業務サーバ300に選択された請求書の情報を送信する(ステップS710)。業務サーバ300では受信した請求書の情報をDBサーバ400に引き渡し、請求書詳細情報を要求する(ステップS711)。DBサーバ400は受信した請求書の情報をキーとして業務データ記憶部410から該当する請求書の請求書データ1303を抽出する。抽出した請求書データ1303のファイルID1313に一致するファイルデータ1314も併せて抽出する。DBサーバ400は抽出した請求書データ1303とファイルデータ1314を請求書の詳細情報として業務サーバ300に返却する(ステップS712)。業務サーバ300は取得した請求書の詳細情報を基に図11の請求書詳細画面1100を生成して、クライアントPC200に返却する(ステップS713)。クライアントPC200は請求書詳細画面1100をブラウザに表示する(ステップS714)。請求書詳細画面1100は、左側にOCR処理の対象となったスキャンファイルの画像プレビュー、右側に請求データとしてOCRの認識結果を表示する。
クライアントPC200はブラウザから領域訂正、または、手入力訂正を受け付ける。ここで、領域訂正・手入力訂正について記載する。
領域訂正はOCR処理の読み取り領域の誤りを訂正するものである。クライアントPC200のブラウザに表示された図11の請求書詳細画面1100にて請求データの入力項目Gross Amtのフィールド値(1101)にカーソルを合わせると、スキャンファイルの1103のように読み取り対象となった領域を強調表示する(本例では、誤った領域Sales Taxを認識している)。スキャンファイルに強調表示された読み取り領域が請求データの対象項目と一致しない場合に、OCR処理の読み取り領域の誤りを訂正し、訂正した領域についてOCRを再実行する。操作としては、例えば、請求書詳細画面1102において、項目Gross Amtのフィールド値にフォーカスがある状態で、スキャンファイルの領域を1104のように移動する。これが領域訂正である。
手入力訂正はOCR処理の認識結果の請求データに誤りがある場合に、直接認識結果を訂正するものである。OCR処理の読み取り領域は請求データの対象項目と一致していても、OCRした結果、スキャンファイルの値と請求データの値が一致しないことがある。例として、数字の「1」と「7」や「0」と「6」など、誤った数値として認識する場合などが挙げられる。このような場合に、認識結果をスキャンファイルに一致させるよう、請求データを直接訂正する。これが手入力訂正である。
クライアントPC200はブラウザに表示している請求書詳細画面1100から領域訂正を受け付ける(ステップS800)。クライアントPC200は訂正前の領域と訂正後の領域のデータをブラウザ内で保持し(ステップS801)、領域訂正フラグを有効化する(ステップS802)。
クライアントPC200はブラウザに表示している請求書詳細画面1100から手入力訂正を受け付ける(ステップS803)。クライアントPC200は訂正前のフィールド値と訂正後のフィールド値のデータをブラウザ内で保持し(ステップS815)、直接訂正フラグを有効化する(ステップS804)。
請求書詳細画面1100の承認依頼ボタンが押下されると、クライアントPC200は図14の請求書データ1303のデータを業務サーバ300に送信する(ステップS805)。
業務サーバ300はクライアントPC200から請求書データ1303のデータを受信する(ステップS806)。
業務サーバ300は請求書データ1303のフィールド毎に直接訂正フラグ1306が有効であるかを確認する(ステップS807)。直接訂正フラグが有効である場合、業務サーバ300は訂正前のフィールド値と訂正後のフィールド値により、手入力訂正の内容がOCR誤認パターンと一致するかを判断する(ステップS808)。OCR誤認パターンとは、数字の「1」と「7」や「0」と「6」などOCR処理において認識誤りの可能性が高いケースを集めたものである。OCR誤認パターンはパターンテーブル(不図示)で設定してもよいし、プログラムで判断してもよい。OCR誤認パターンと手入力訂正の内容が一致する場合、業務サーバ300は重要度を低に設定する(ステップS809)。OCR誤認パターンと訂正内容が一致することから、OCRの認識誤りを訂正した可能性が高いためである。OCR誤認パターンと手入力訂正の内容が一致しない場合、業務サーバ300は重要度を高に設定する(ステップS810)。OCR誤認パターンと訂正内容が一致しないため、入力誤りや意図的に数値の変更を行った可能性が高いためである。
請求書データ1303の各フィールドに対して直接訂正フラグの確認とOCR誤認パターンの確認が終わった後、業務サーバ300は請求書データ1303をDBサーバ400に送信する(ステップS811)。
DBサーバ400は受信した請求書データ1303で業務データ記憶部410の該当する請求書データ1303を更新する。(ステップS812)
業務サーバ300は承認依頼完了画面を生成し、クライアントPC200に送信する(ステップS813)。
クライアントPC200はブラウザに承認依頼完了画面(不図示)を表示する(ステップS814)。
次に、図9、10を参照しながらApproval(承認/否認)処理の処理フローについて説明する。
ステップS900からステップS905までは図7のステップS700からステップS705までと同様の処理となるため、割愛する。
ステップS705の認証後、業務サーバ300はログインユーザに紐づく承認依頼リストの取得をDBサーバ400に対してリクエストする(ステップS906)。DBサーバ400はログインユーザのユーザIDと図14の請求書データ1303の承認者ID1311が一致する請求書データを業務データ記憶部410から取得して承認依頼リストを返却する(ステップS907)。業務サーバ300は取得した承認依頼リストから承認依頼リスト画面を生成し、クライアントPC200に返却する(ステップS908)。クライアントPC200は返却された承認依頼リスト画面をブラウザに描画する(ステップ909)。
クライアントPC200はブラウザから承認依頼選択を受け付け、業務サーバ300に選択された承認依頼の情報を送信する(ステップS910)。業務サーバ300では受信した承認依頼の情報をDBサーバ400に引き渡し、承認依頼詳細情報を要求する(ステップS911)。DBサーバ400は受信した請求書の情報をキーとして業務データ記憶部410から該当する請求書の請求書データ1303を抽出する。抽出した請求書データ1303のファイルID1313に一致するファイルデータ1314も併せて抽出する。DBサーバ400は抽出した請求書データ1303とファイルデータ1314を承認依頼詳細情報として業務サーバ300に返却する(ステップS912)。業務サーバ300は取得した承認依頼詳細情報から承認依頼詳細画面1220を生成する。承認依頼詳細画面1220は、左側にOCR処理の対象となったスキャンファイルの画像プレビュー、右側に請求データとしてOCRの認識結果または訂正結果を表示する。
承認依頼詳細画面を生成する際、業務サーバ300は領域訂正フラグ・直接訂正フラグ・重要度の高低から表示情報を変更する。変更内容の一例を以下に示す。
業務サーバ300は承認依頼詳細情報の各フィールドに対して、領域訂正フラグが有効であるかを判別する(ステップS1000)。
領域訂正フラグが有効である場合、訂正前・訂正後領域を図12の承認依頼詳細画面1200のようにハイライトする(ステップS1001)。具体的には請求データの領域訂正が行われたGross Amtのフィールド値(1201)をハイライトする。また、スキャンデータの訂正前領域(1202)と訂正後領域(1203)を強調表示したうえ、矢印で結び訂正の前後を強調表示する(本例では、誤ってSales Taxの領域が読み取られていたが、正しくGross Amtの領域に訂正した結果を表示している)。これにより承認依頼詳細画面を参照するユーザは訂正前及び訂正後の領域の変更を目視で確認しやすくなる。
業務サーバ300は承認依頼詳細情報の各フィールドに対して、直接訂正フラグが有効であるかを判別する(ステップS1002)。
直接訂正フラグが有効である場合、業務サーバ300は重要度の高低を判別する(ステップS1003)。
重要度が高い場合、生成する承認依頼詳細画面は図13の1210のようになる(例えば、認識結果”12,240”を”92,240”に訂正した場合)。具体的には、訂正された領域を1211のように背景色を赤とし、1212のように強調マーク「!」を表示する(ステップS1004)。これにより、承認依頼詳細画面を参照するユーザは直接フィールド値が変更されていることを判別できる。また、入力誤りや意図的に変更された値である可能性が高いことを目視で確認しやすくなる。
重要度が低い場合、生成する承認依頼詳細画面は図12の1204のようになる(例えば、認識結果”12,246”を”12,240”に訂正した場合)。具体的には、訂正された領域を1205のように文字色を赤で表示する(ステップS1005)。これにより、承認依頼詳細画面を参照するユーザは直接フィールド値が変更されていることを判別できる。また、OCRの認識誤りを訂正した可能性が高いことを目視で確認しやすくなる。
また、直接フィールド値が変更された場合に、スキャンファイルのプレビュー上で、変更内容に対応する領域を強調表示してもよい。
領域訂正フラグが有効であり、かつ、直接訂正フラグが有効である場合について記載する。
領域訂正フラグが有効であり、かつ、直接訂正フラグが有効であり、かつ、手入力訂正の重要度が高い場合、生成する承認依頼詳細画面は図13の1213のようになる。具体的には、訂正された領域を1214のように背景色を赤とし、1215のように強調マーク「!」を表示する。また、スキャンデータの訂正前領域1216と訂正後領域1217を強調表示したうえ、矢印で結び訂正の前後を強調表示する。
領域訂正フラグが有効であり、かつ、直接訂正フラグが有効であり、かつ、手入力訂正の重要度が低い場合、生成する承認依頼詳細画面は図13の1206のようになる。具体的には、訂正された領域を1207のように文字色を赤とする。また、スキャンデータの訂正前領域1208と訂正後領域1209を強調表示したうえ、矢印で結び訂正の前後を強調表示する。
このように、Verificationステップでの訂正方法に従って重要度を付与し、承認依頼詳細画面の表示を変更することで、承認依頼詳細画面を参照するユーザは重点的に確認すべき箇所を目視で瞬時に判別できる。また、訂正時の入力誤りや不正な数値の修正の見落としを防止すことができ、ユーザの利便性が向上する。
業務サーバ300は上記のステップS1000からステップS1005までを経て、承認依頼詳細画面を生成し、クライアントPC200に送信する(ステップS1006)。
クライアントPC200はブラウザ上に業務サーバから承認依頼詳細画面を受信し、図12の承認依頼詳細画面1220をブラウザに描画する(ステップS1007)。
クライアントPC200は承認依頼詳細画面の承認ボタンまたは否認ボタンから承認または否認を受け付け、業務サーバ300に送信する(ステップS1008)。
業務サーバ300は受信した承認または否認のステータスをDBサーバ400に送信する(ステップS1009)。
DBサーバ400は受信した承認または否認のステータスによって、業務データ記憶部410に格納されている請求書データ1303のステータス1312を更新する(ステップS1010)。
業務サーバ300は承認または否認に従い、承認または否認完了画面を生成して、クライアントPC200に送信する(ステップS1011)。
クライアントPC200は受信した承認または否認完了画面をブラウザ上に描画する(ステップS1012)。
次に、図11、図12、図13の各画面について説明する。
図11の請求書詳細画面1100はOCR結果が正しく読み取られているか確認を行うための画面である。OCR結果が正しくない場合には認識結果の編集も行われる。請求書詳細画面1100は、少なくともスキャンファイルと請求データが表示される。スキャンファイルはOCRの対象となっているファイルのプレビューが表示されるものである。請求データはOCRの結果、抽出されたデータの参照及び編集を行うものである。
請求書詳細画面1100上の請求データはあくまでも一例であり、OCRの対象となる請求書のフォーマット、利用者によって異なるものである。請求書詳細画面1100では請求データのフィールド(項目)の一例として、From、Bill To、inv Date、Gross Amtを含めている。Fromは請求書に記載されているFromから抽出されたフィールドの表示箇所であり、請求元を示すものである。Bill Toは請求書に記載されているBill Toから抽出されたフィールドの表示箇所であり、請求書の送付先を示すものである。inv Dateは請求書に記載されているinv Dateから抽出されたフィールドの表示箇所であり、請求書の日付を示すものである。Gross Amtは請求書に記載されているGross Amtから抽出されたフィールドの表示箇所であり、請求書の総額を示すものである。
請求書詳細画面1100は承認依頼ボタンを備えている。承認依頼ボタンが選択されると、該当のOCRした請求書データは確認が完了したものとして扱われ、承認者への承認依頼に回される。
図11の請求書詳細画面1102は請求書詳細画面1100と同様の画面であり、図8の領域訂正の受付(ステップS800)について説明するものであるため、詳細の記載は割愛する。
図12の承認依頼詳細画面1220は請求書詳細画面1100のOCR結果の確認及び訂正の結果に誤りがないか、承認者が確認するための画面である。スキャンファイル及び請求データの各項目の詳細については請求書詳細画面1100と同様のため割愛する。承認依頼詳細画面1220が請求書詳細画面1100と異なる点としては請求データの各項目は編集不可であり、参照のみ可能という点である。これは承認者のデータ訂正を不可とすることで、承認者による入力の誤りや不正な入力を防止するためである。
承認依頼詳細画面1220は承認ボタン・否認ボタンを備えている。承認ボタンが押下されると該当の請求データは請求書詳細画面1100での訂正内容に問題がなかったものと判断され、承認済み扱いとされる。承認済み扱いとなった請求データはその後の業務フローに従い、請求が行われる。否認ボタンが押下されると該当の請求データは請求書詳細画面1100での訂正内容に問題があった、または未訂正の箇所があるものと判断され、否認扱いとされる。否認扱いとなったデータは再度確認者が請求書詳細画面1100にて確認し、編集を行う。
図12、図13の1200、1204、1206、1213は全て承認依頼詳細画面の表示形態の一例である。各承認依頼詳細画面の詳細は図10のフローチャートにて記載しているので割愛する。
次に、図14の各データについて説明する。
図14のユーザデータ1300はシステム内でのユーザの管理のために使用されるものである。ユーザID1301はユーザデータ1300の各レコードを識別するためのもので、一意の値となるものである。ユーザ名1302は利用ユーザの名称が登録される。
図14の請求書データ1303は請求書のOCR後の認識結果情報を登録するものである。フィールド名1317は請求書の各フィールドの名称(項目名)を示す。フィールド値1304は請求書の各フィールドのOCRの結果を格納するためのカラムである。
読取領域1305はフィールド値1304の認識を行う際のOCRの対象となった領域の情報である。例えば図11の請求書詳細画面1102のFromの読み取り領域である1103を示すものである。
直接訂正フラグ1306は図8のステップS803からステップS805の手入力訂正を行ったか否かを保持するための領域である。該当フィールドの手入力訂正が行われた場合には1が、行われていない場合には0が格納される。領域訂正フラグ1307は図8ステップS800からステップS802の領域訂正を行ったか否かを保持するための領域である。該当フィールドの領域訂正が行われた場合には1が、行われていない場合には0が格納される。
変更前フィールド値1318及び変更後フィールド値1319は図8のステップS800の領域訂正、または、ステップS803において手入力訂正が行われた場合に、訂正前のフィールド値と訂正後のフィールド値を保持するために利用される。図14のデータ例では、領域訂正によりフィールド値が変更され、変更前フィールド値1318には訂正前のフィールド値が保持され、変更後フィールド値1319には訂正後のフィールド値が保持される。
変更前領域1308及び変更後領域1309は図8のステップS800において領域訂正が行われた場合に、訂正前の領域と訂正後の領域を保持するために利用される。図14のデータ例では、領域の情報には画像内の所定の箇所を示すコードを設定しているが、画像内の相対的な座標等を設定してもよい。変更前領域1308には訂正前の読み取り領域情報が保持され、変更後領域1309には訂正後の読み取り領域情報が保持される。
ここまで記載してきた請求データ1303のフィールド名1317、フィールド値1304、読取領域1305、直接訂正フラグ1306、領域訂正フラグ1307、変更前フィールド値1318、変更後フィールド値1319、変更前領域1308及び変更後領域1309は全て請求データに含まれる項目の数だけ存在するものである。例えば図11のFromのためのフィールド名1317、フィールド値1304、読取領域1305、直接訂正フラグ1306、領域訂正フラグ1307、変更前フィールド値1318、変更後フィールド値1319、変更前領域1308及び変更後領域1309が存在し、Bill Toのための同様のカラムが存在するといった具合である。
担当者ID1310は該当の請求書データ1303の確認者のユーザID1301を格納するカラムである。該当の確認者はシステムにログイン後、自身のユーザIDに紐づく請求書データ1303を参照し、請求書詳細画面1100にて請求データの確認及び訂正を行う。承認者ID1311は該当の請求データ1303の承認者のユーザID1301を格納するカラムである。該当の承認者はシステムにログイン後、自身のユーザIDに紐づく請求書データ1303を参照し、承認依頼詳細画面1220にて請求データの承認及び否認を行う。
ステータス1312は該当請求データ1303の業務フローでの状態を管理するために利用される。具体的には、ステップS508からステップS509のOCRデータの保持の際には新規というステータスが格納される。ステップS812の請求書詳細・訂正情報保存の際には承認依頼というステータスが格納される。ステップS1010のステータス更新では、承認済み・否認のいずれかのステータスが格納される。ファイルIDはOCRの対象となったファイルデータ1314のファイルID1315と一致する値が格納される。これはOCR処理で作成された請求書データ1303とOCRの対象となったファイルデータ1314を関連づけるためのものである。
ファイルデータ1314はOCRの対象となったファイルのデータを格納しておくためのテーブルである。ファイルID1315はファイルデータ1314の各レコードを識別するための一意の値が格納されるものである。ファイル1316はOCRの対象となったファイルのデータを格納するカラムである。ファイルデータはBase64dataにデコードされた状態で保存される。
上記により、承認者はOCR認識結果に対する訂正内容に応じて訂正箇所を確認できるようになる。
以上、一実施形態について示したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記録媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
また、本発明におけるプログラムは、各フローチャートの処理方法をコンピュータが実行可能なプログラムであり、本発明の記憶媒体は各フローチャートの処理方法をコンピュータが実行可能なプログラムが記憶されている。なお、本発明におけるプログラムは図4の各装置の処理方法ごとのプログラムであってもよい。
以上のように、前述した実施形態の機能を実現するプログラムを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムを読出し実行することによっても、本発明の目的が達成されることは言うまでもない。
この場合、記録媒体から読み出されたプログラム自体が本発明の新規な機能を実現することになり、そのプログラムを記憶した記録媒体は本発明を構成することになる。
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハーfドディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、DVD−ROM、磁気テープ、不揮発性のメモリカード、ROM、EEPROM、シリコンディスク、ソリッドステートドライブ等を用いることができる。
また、コンピュータが読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
また、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。
さらに、本発明を達成するためのプログラムをネットワーク上のサーバ、データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。
なお、上述した各実施形態およびその変形例を組み合わせた構成も全て本発明に含まれるものである。
1 情報処理システム
10 ネットワーク(LAN)
100 複合機
200 クライアントPC
300 業務サーバ
400 DBサーバ
500 OCRサーバ
600 メールサーバ

Claims (6)

  1. 複数の文字列の領域を含む画像から認識した文字列および当該文字列を認識した領域を認識データとして取得する情報処理装置であって、
    前記取得した認識データの訂正を受け付ける受付手段と、
    前記受け付けた訂正の前後の認識データに基づいて、当該訂正の内容が所定の条件を満たすか否かを判定する判定手段と、
    前記所定の条件を満たすと判定された場合に、前記訂正を受け付けた認識データの訂正箇所を通知する通知手段と
    を備えることを特徴とする情報処理装置。
  2. 前記受付手段により前記認識した文字列の訂正を受け付けた場合に、前記判定手段は所定の文字訂正パターンに基づいて判定することを特徴とする請求項1に記載の情報処理装置。
  3. 前記判定手段は、前記受付手段により前記文字列を認識した領域の訂正を受け付けたか否かにより判定することを特徴とする請求項1または2に記載の情報処理装置。
  4. 前記通知手段は、前記所定の条件を満たすと判定された場合に、前記画像において前記認識データの訂正箇所に対応する領域を識別表示することを特徴とする請求項1〜3のいずれか1項に記載の情報処理装置。
  5. 複数の文字列の領域を含む画像から認識した文字列および当該文字列を認識した領域を認識データとして取得する情報処理装置の制御方法であって、
    受付手段が、前記取得した認識データの訂正を受け付ける受付ステップと、
    判定手段が、前記受け付けた訂正の前後の認識データに基づいて、当該訂正の内容が所定の条件を満たすか否かを判定する判定ステップと、
    通知手段が、前記所定の条件を満たすと判定された場合に、前記訂正を受け付けた認識データの訂正箇所を通知する通知ステップと
    を備えることを特徴とする情報処理装置の制御方法。
  6. 複数の文字列の領域を含む画像から認識した文字列および当該文字列を認識した領域を認識データとして取得する情報処理装置において実行可能なプログラムであって、
    前記情報処理装置を、
    前記取得した認識データの訂正を受け付ける受付手段と、
    前記受け付けた訂正の前後の認識データに基づいて、当該訂正の内容が所定の条件を満たすか否かを判定する判定手段と、
    前記所定の条件を満たすと判定された場合に、前記訂正を受け付けた認識データの訂正箇所を通知する通知手段
    として機能させるためのプログラム。

JP2019072949A 2019-04-05 2019-04-05 情報処理装置、制御方法、プログラム Pending JP2020170465A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019072949A JP2020170465A (ja) 2019-04-05 2019-04-05 情報処理装置、制御方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019072949A JP2020170465A (ja) 2019-04-05 2019-04-05 情報処理装置、制御方法、プログラム

Publications (1)

Publication Number Publication Date
JP2020170465A true JP2020170465A (ja) 2020-10-15

Family

ID=72745990

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019072949A Pending JP2020170465A (ja) 2019-04-05 2019-04-05 情報処理装置、制御方法、プログラム

Country Status (1)

Country Link
JP (1) JP2020170465A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4250202A1 (en) 2022-03-23 2023-09-27 Fujifilm Business Innovation Corp. Information processing device, and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4250202A1 (en) 2022-03-23 2023-09-27 Fujifilm Business Innovation Corp. Information processing device, and program

Similar Documents

Publication Publication Date Title
US20070076240A1 (en) Image processing system
US8225375B2 (en) Information processing system, information processing apparatus and method and program therefor
JP5004142B2 (ja) 文書管理システム、画像処理装置、情報処理装置、文書管理方法、制御方法およびプログラム。
JP4958118B2 (ja) 画像形成装置、情報処理システムと、その処理方法およびプログラム
JP5825195B2 (ja) 文書管理システム、画像処理装置、情報処理装置、文書管理方法、制御方法およびプログラム。
JP4961535B2 (ja) 画像形成装置、制御方法、プログラム
JP6813784B2 (ja) 画像処理装置とその処理方法及びプログラム
JP5158654B2 (ja) 画像処理システム、及びその制御方法、プログラム、プログラムを記録した記録媒体
JP6817517B2 (ja) 情報処理システム、情報処理装置、制御方法、プログラム
JP4846830B2 (ja) 画像形成装置とその情報処理方法及びプログラム
JP5630101B2 (ja) 情報処理システム、画像形成装置、認証サーバ、その処理方法およびプログラム
JP2020170465A (ja) 情報処理装置、制御方法、プログラム
JP2021089618A (ja) 情報処理装置、制御方法、プログラム
JP5316891B2 (ja) ファクシミリ装置及びその制御方法、プログラム。
JP6394345B2 (ja) 情報処理装置とその処理方法とプログラム
JP6813930B2 (ja) 情報処理装置とその処理方法とプログラム
JP5375884B2 (ja) 認証装置、認証方法、及びコンピュータプログラム
JP5445476B2 (ja) 情報処理装置とその処理方法及びプログラム
JP6931160B2 (ja) 情報処理装置、制御方法、プログラム
JP2019067114A (ja) 処理装置、処理システム、その制御方法及びプログラム。
JP5376546B2 (ja) 画像形成装置、情報処理システムと、その処理方法およびプログラム
JP5870518B2 (ja) 画像形成装置、画像形成装置の制御方法、及びコンピュータプログラム。
JP5116174B2 (ja) 画像処理システム、画像処置装置、ユーザ端末、その制御方法、プログラム、プログラムを記録した記録媒体
JP2014044601A (ja) 画像形成装置、認証システム、その制御方法およびプログラム。
JP5692120B2 (ja) 画像形成装置、制御方法、プログラム