JP7346931B2

JP7346931B2 - 情報処理装置、情報処理方法及び情報処理プログラム

Info

Publication number: JP7346931B2
Application number: JP2019115412A
Authority: JP
Inventors: 寛小林; 慶春東條; 浩二石倉; 敏文山合
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 2018-07-20
Filing date: 2019-06-21
Publication date: 2023-09-20
Anticipated expiration: 2039-06-21
Also published as: JP2020021469A

Description

本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。

従来、紙等に印刷された各種の文書をスキャナにより光学的に読み込んでＰＤＦ（Portable Document Format）等のファイルを生成し、生成したＰＤＦ等のファイルに含まれる画像から文字を認識する技術が知られている。

また、従来、帳票等の文書の画像から文字を認識し、各項目の文字列を抽出する技術が知られている（例えば、特許文献１を参照）。

従来、例えば、ＰＤＦ等のファイルに含まれる画像中の文字を誤認識した等の場合、正しいテキストデータを利用できない場合がある。

そこで、より精度が高いテキストデータを利用可能とすることを目的とする。

情報処理装置は、第１テキストデータを含むファイルを取得する取得部と、前記取得部により取得されるファイルに含まれる画像を文字認識して生成される第２テキストデータを用いて所定の処理を行うか、前記第１テキストデータを用いて前記所定の処理を行うかを、前記取得部により取得されるファイルに基づいて決定する処理部と、を有する。

より精度が高いテキストデータを利用可能とすることができる。

実施形態に係る情報処理システムのシステム構成の一例を示す図である。実施形態に係るサーバ装置のハードウェア構成の一例を示す図である。第１の実施形態に係る種別判定データベースの一例を示す図である。第１の実施形態に係る帳票定義データベースに格納される帳票定義情報の種類を示す図である。第１の実施形態に係る汎用定義情報の一例を示す図である。第１の実施形態に係る個社定義情報の一例を示す図である。第１の実施形態に係る特定定義情報の一例を示す図である。第１の実施形態に係るサーバ装置の機能を説明する図である。第１の実施形態に係る情報処理システムの処理の一例（その一）を説明するシーケンス図である。第１の実施形態に係る情報処理システムの処理の一例（その二）を説明するシーケンス図である。第１の実施形態に係るジョブリストの一例を示す図である。第１の実施形態に係る処理部の処理を説明するフローチャートである。第１の実施形態に係る処理部の処理を説明するフローチャートである。実施形態に係るテキストデータの利用判定処理の一例を示すフローチャートである。第１の実施形態に係る項目抽出部の処理を説明するフローチャートである。実施形態に係る処理対象のテキストデータの一例を示す図である。第１の実施形態に係る読取結果情報の一例を示す図である。第１の実施形態に係る認識結果確認画面の一例を示す図である。第１の実施形態に係る認識結果データの一例を示す図である。第２の実施形態に係る処理部の処理を説明するフローチャートである。実施形態に係るテキストデータの利用判定処理の一例を示すフローチャートである。実施形態に係る端末装置の設定画面の一例について説明する図である。

［第１の実施形態］
第１の実施形態では、サーバ装置２００が、画像形成装置３００、及び端末装置４００から受信した帳票のファイルから、各項目のデータを抽出する例について説明する。第１の実施形態では、サーバ装置２００は、例えば、受信したファイルが、ファイルのフォーマットが変換された、テキストデータを含むファイルでない場合、受信したファイルを文字認識して生成したテキストデータを利用する。また、サーバ装置２００は、例えば、受信したファイルが、ファイルのフォーマットが変換された、テキストデータを含むファイルである場合、当該テキストデータを利用する。なお、ファイルのフォーマットが変換された、テキストデータを含むファイルとは、例えば、文書、表、及びスライド等の所定のファイルフォーマットのファイルから、ＰＤＦ（Portable Document Format）等のファイルフォーマットに変換されたＰＤＦファイル等である。これにより、より精度が高いテキストデータを利用可能とすることができる。以下では、ＰＤＦファイルを処理対象とする例について説明するが、開示の技術は、ＰＤＦ以外のファイルフォーマットのファイルを処理対象とするシステムにも適用できる。

以下に図面を参照して、実施形態について説明する。図１は、実施形態に係る情報処理システムのシステム構成の一例を示す図である。

実施形態に係る情報処理システム１００は、サーバ装置２００、画像形成装置３００、端末装置４００を有する。実施形態に係る情報処理システム１００において、サーバ装置２００と、画像形成装置３００と、端末装置４００とは、ネットワークを介して接続される。

また、実施形態に係る端末装置４００は、例えば、ネットワークを介して基幹システム５００と接続される。基幹システム５００とは、例えば、実施形態に係る情報処理システム１００において帳票を認識した結果を用いて、特定の処理を行うシステムである。具体的には、例えば、基幹システム５００は、会計システムや、見積もり作成システム等であってもよい。

実施形態に係る情報処理システム１００において、サーバ装置２００は、画像形成装置３００のスキャナ機能によって読み取られた帳票の画像を含むＰＤＦファイルを、画像形成装置３００から受信する。また、サーバ装置２００は、ファイルのフォーマットが変換された、テキストデータを含むＰＤＦファイルを、端末装置４００から受信する。そして、サーバ装置２００は、受信したＰＤＦファイルから、帳票に含まれる項目と項目の値とを抽出し、項目と項目の値とを対応付けたテキストデータとする。

以下の説明では、画像形成装置３００のスキャナ機能によって読み取られた帳票の画像を帳票画像と呼ぶ。

また、以下の説明では、帳票に含まれる項目と、この項目の値とを抽出し、項目と項目の値とをテキストデータに変換して対応付けることを、帳票認識と呼ぶ。

実施形態に係るサーバ装置２００は、記憶部２１０と、制御部２２０とを有する。記憶部２１０には、ＰＤＦファイルデータベース２３０、種別判定データベース２４０、帳票定義データベース２５０、認識結果データベース２６０が設けられている。

ＰＤＦファイルデータベース２３０は、ＰＤＦファイルが格納される。種別判定データベース２４０は、帳票の種類を判別する際に参照される情報が格納される。帳票定義データベース２５０は、制御部２２０による帳票認識を行う際に参照される帳票定義情報が格納される。認識結果データベース２６０は、制御部２２０による帳票認識の結果を示す情報が格納される。

実施形態に係る制御部２２０は、ＰＤＦファイルデータベース２３０に格納されたＰＤＦファイルを取得し、種別判定データベース２４０を参照して帳票の種別の判定と、参照すべき帳票定義情報の特定を行う。そして、制御部２２０は、帳票定義データベース２５０において、特定された帳票定義情報を用いて帳票認識を行い、その結果を認識結果データベース２６０へ格納する。帳票定義情報とは、帳票に含まれる項目名の記載位置を示す情報と、項目名と項目の値との位置関係を示す情報とを含む。

ここで、実施形態に係る制御部２２０は、帳票認識を行う際に、帳票定義データベース２５０に格納された、汎用定義情報と、個社定義情報と、を参照する。

実施形態に係る汎用定義情報とは、一般的な帳票のレイアウトを定義した帳票定義情報であり、個社定義情報とは、情報処理システム１００を利用する利用者固有の帳票のレイアウトを定義した帳票定義情報である。種別判定データベース２４０と、帳票定義データベース２５０の詳細は後述する。

本実施形態では、このように、帳票認識の際に、２種類の帳票定義情報を用いることで、汎用的な帳票に加えて、利用者固有の帳票も認識することができ、帳票の認識の精度を向上させることができる。

実施形態に係る情報処理システム１００において、画像形成装置３００は、スキャナ機能を有する複合機である。画像形成装置３００は、コピー機能、ＦＡＸ機能、スキャナ機能等を実現するためのアプリケーションが搭載されており、各機能と対応するアプリケーションを選択することで、これらの機能が実現される。

実施形態に係る端末装置４００は、情報処理システム１００を利用する利用者によって使用される。また、端末装置４００には、サーバ装置２００による帳票認識の結果が表示されてもよい。

尚、本実施形態における利用者とは、例えば、企業等である。より具体的には、例えば、利用者とは、情報処理システム１００が提供するサービスを利用するための契約を締結している事業所や企業、団体等である。

尚、図１の例では、サーバ装置２００は、記憶部２１０内に４つのデータベースを有する構成としたが、これに限定されない。各データベースは、一部がサーバ装置２００の外部装置に設けられていてもよいし、各データベース全てが外部装置に設けられていてもよい。

また、図１の例では、サーバ装置２００が制御部２２０を実現するものとしたが、これに限定されない。制御部２２０は、複数の情報処理装置によって実現されてもよい。

また、図１の例では、情報処理システム１００に含まれる画像形成装置３００と端末装置４００とは、それぞれ１台としているが、情報処理システム１００に含まれる画像形成装置３００と端末装置４００の台数は、任意の数であってよい。

次に、図２を参照して、実施形態に係るサーバ装置２００のハードウェア構成について説明する。図２は、実施形態に係るサーバ装置のハードウェア構成の一例を示す図である。

実施形態に係るサーバ装置２００は、それぞれバスＢで相互に接続されている入力装置２１、出力装置２２、ドライブ装置２３、補助記憶装置２４、メモリ装置２５、演算処理装置２６及びインターフェース装置２７を含む情報処理装置である。

入力装置２１は、各種の情報の入力を行うための装置であり、例えばキーボードやポインティングデバイス等であってもよい。出力装置２２は、各種の情報の出力を行うためものであり、例えばディスプレイ等であってもよい。インターフェース装置２７は、ＬＡＮカード等を含み、ネットワークに接続する為に用いられる。

情報処理プログラムは、サーバ装置２００を制御する各種プログラムの少なくとも一部である。情報処理プログラムは例えば記憶媒体２８の配布やネットワークからのダウンロード等によって提供される。情報処理プログラムを記録した記憶媒体２８は、ＣＤ－ＲＯＭ、フレキシブルディスク、光磁気ディスク等の様に情報を光学的、電気的或いは磁気的に記録する記憶媒体、ＲＯＭ、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記憶媒体を用いることができる。

また、情報処理プログラムは、情報処理プログラムを記録した記憶媒体２８がドライブ装置２３にセットされると、記憶媒体２８からドライブ装置２３を介して補助記憶装置２４にインストールされる。ネットワークからダウンロードされた情報処理プログラムは、インターフェース装置２７を介して補助記憶装置２４にインストールされる。

補助記憶装置２４は、インストールされた情報処理プログラムを格納すると共に、必要なファイル、データ等を格納する。メモリ装置２５は、サーバ装置２００の起動時に補助記憶装置２４から情報処理プログラムを読み出して格納する。そして、演算処理装置２６はメモリ装置２５に格納された情報処理プログラムに従って、後述するような各種処理を実現している。

実施形態に係る端末装置４００のハードウェア構成は、サーバ装置２００と同様であるから、説明を省略する。尚、端末装置４００は、例えば、タブレット型の端末装置や、スマートフォン等であっても良く、入力装置２１と出力装置２２との代わりに、タッチパネル等により実現される表示操作装置を有していてもよい。

次に、実施形態に係るサーバ装置２００の有する種別判定データベース２４０と帳票定義データベース２５０について説明する。

図３は、第１の実施形態に係る種別判定データベースの一例を示す図である。実施形態に係る種別判定データベース２４０は、情報の項目として、定義ＩＤ、定義種別、文書種別、識別文字列を有する。種別判定データベース２４０において、項目「定義ＩＤ」は、その他の項目と対応付けられており、項目「定義ＩＤ」の値と、その他の項目の値とを含む情報を、種別判定情報と呼ぶ。

項目「定義ＩＤ」の値は、帳票定義情報を特定するための識別子を示す。

項目「定義種別」の値は、帳票定義情報の種類を示す。本実施形態では、帳票定義情報の種類として、汎用定義情報と個社定義情報の他に、特定定義情報を含む。特定定義情報とは、特定の事業者等によって発行される特定の帳票を定義する帳票定義情報である。特定の帳票とは、具体的には、例えば、一般的に使用されている宅配業者の伝票等である。

項目「文書種別」の値は、帳票の種類を示す。帳票の種類とは、具体的には、例えば、請求書、見積書、注文書等である。項目「識別文字列」の値は、帳票の種類を特定するための文字列を示す。具体的には、例えば、「請求書」又は「請求」という文字列を含む帳票は、項目「文書種別」が示す帳票の種類が「請求書」となる。また、「Ｒ社」及び「請求」という両方の文字列を含む帳票画像は、項目「文書種別」が示す帳票の種類が「Ｒ社用請求書」となる。

図３の例では、例えば、定義ＩＤ「Ｈ０１」の帳票定義情報の種類は汎用定義情報であり、定義ＩＤ「Ｈ０１」の汎用定義情報は、「請求書」のレイアウトを定義した情報であり、ＰＤＦファイルから「請求」又は「請求書」という文字列が抽出された場合に、参照される。

次に、図４乃至図７を参照して、実施形態に係る帳票定義データベース２５０について説明する。図４は、第１の実施形態に係る帳票定義データベースに格納される帳票定義情報の種類を示す図である。

実施形態に係る帳票定義データベース２５０には、汎用定義情報２５１と、個社定義情報２５２と、特定定義情報２５３と、が格納されている。

実施形態に係る汎用定義情報２５１とは、帳票の中でも、複数の利用者により利用される汎用性の高いレイアウトの帳票の帳票定義情報である。汎用定義情報２５１は、３つの帳票定義情報のうち、最も優先度の低い帳票定義情報である。

実施形態に係る個社定義情報２５２とは、帳票の中でも、利用者が独自に設計したレイアウトの帳票の帳票定義情報であり、利用者専用の帳票定義情報である。個社定義情報２５２は、３つの帳票定義情報のうち、最も尊重されるべき定義であり、最も優先度が高い帳票定義情報である。

実施形態に係る特定定義情報２５３は、帳票の中でも、一般的に利用される帳票のレイアウトを示す帳票定義情報である。特定定義情報２５３の優先度は、３つの帳票定義情報のうちの中間となる。

実施形態に係る制御部２２０は、この３つの帳票定義情報を参照して、ＰＤＦファイルの認識を行う。したがって、本実施形態では、例えば、ＰＤＦファイルが、個社定義情報２５２においてレイアウトが定義されていない帳票のものであった場合でも、汎用定義情報２５１や特定定義情報２５３で定義されていれば、このＰＤＦファイルを認識できる。

図５は、第１の実施形態に係る汎用定義情報の一例を示す図である。汎用定義情報２５１は、定義ＩＤ毎に生成されるものであり、情報の項目として、項目ＩＤ、項目名、方向、距離等を含む。つまり、実施形態に係る汎用定義情報２５１は、項目「定義ＩＤ」と、その他の項目とが対応付けられており、項目「定義ＩＤ」の値と、その他の項目の値とを含む。

項目「項目ＩＤ」の値は、帳票に含まれる項目を特定するための識別子である。項目「項目名」の値は、項目の名称を示す。

項目「方向」、「距離」等は、文字列を抽出する範囲を示す。例えば、項目「方向」の値が「ＲＤ」であり、項目「距離」の値が「２０ｍｍ」であった場合、項目名となる文字列と外接する矩形の右下の座標から下に向かって２０ｍｍ以内の範囲から、文字列を抽出することを示す。

つまり、実施形態に係る項目「方向」、「距離」等は、文字列を抽出する範囲を示す条件であり、この条件は、項目名と対応付けられている。尚、図５の例では、文字列を抽出する範囲を示す条件として、項目「方向」、「距離」を挙げたが、条件には、他の項目が含まれていてもよい。

したがって、例えば、項目ＩＤ「２」の項目名「合計」という文字列と外接する矩形の右下の座標から下に向かって２０ｍｍ以内の範囲から抽出された文字列は、項目名「合計」と対応する項目の値と認識される。

尚、汎用定義情報２５１では、帳票に含まれる可能性のある複数の項目に関する情報が含まれるものとした。

図６は、第１の実施形態に係る個社定義情報の一例を示す図である。実施形態に係る個社定義情報２５２は、利用者毎に登録されるものであり、情報の項目として、利用者ＩＤ、定義ＩＤ、項目名、方向、距離等を含む。

項目「利用者ＩＤ」の値は、利用者を特定するための識別子である。尚、本実施形態では、定義ＩＤ、項目名、方向、距離等は、汎用定義情報２５１と同様であるから説明を省略する。

尚、本実施形態では、定義種別が個社定義情報となる帳票定義情報の定義ＩＤは、利用者ＩＤを含むようにしてもよい。

また、個社定義情報２５２では、利用者によって、項目名と、項目の値が記載されている範囲を示す条件とが登録された項目に関する情報が格納される。したがって、個社定義情報２５２に含まれる項目ＩＤは、汎用定義情報２５１に含まれる項目ＩＤの一部となる場合がある。

図６の例では、利用者ＩＤ「Ａ」によって登録された個社定義情報２５２を示しており、この個社定義情報２５２は、定義ＩＤが「Ａ０１」であり、文書種別が「Ｒ社用請求書」となる。

図７は、第１の実施形態に係る特定定義情報の一例を示す図である。実施形態に係る特定定義情報２５３は、特定の帳票毎に登録されるものであり、情報の項目として、定義ＩＤ、項目名、方向、距離等を含む。図７の本実施形態では、定義ＩＤ、項目名、方向、距離等は、汎用定義情報２５１と同様であるから説明を省略する。

尚、実施形態に係る特定定義情報２５３は、特定の事業者毎に設けられていてもよい。この場合には、特定定義情報２５３には、情報の項目として、事業者ＩＤが含まれていてもよい。

次に、図８を参照して、実施形態に係るサーバ装置２００の機能について説明する。図８は、第１の実施形態に係るサーバ装置の機能を説明する図である。

実施形態に係るサーバ装置２００では、例えば、メモリ装置２５や補助記憶装置２４等に格納された情報処理プログラムを演算処理装置２６が読み出して実行することで、後述する各部の機能が実現される。

実施形態に係るサーバ装置２００は、制御部２２０を有する。制御部２２０は、入力受付部２２１、認証処理部２２２、処理部２７０を有する。

入力受付部２２１は、サーバ装置２００に対する各種の入力を受け付ける。具体的には、入力受付部２２１は、情報処理システム１００にログインするための認証情報の入力を受け付ける。認証情報とは、例えば、利用者ＩＤとパスワード等である。また、入力受付部２２１は、例えば、画像形成装置３００、及び端末装置４００から送信されたＰＤＦファイルの入力を受け付ける。

認証処理部２２２は、入力受付部２２１が入力を受け付けた認証情報に基づき、認証を行う。尚、認証処理部２２２は、例えば、サーバ装置２００の外部に設けられた認証サーバに対して、入力された認証情報を送信し、認証サーバによる認証の結果を取得してもよい。認証処理部２２２は、利用者が認証されると、入力受付部２２１が受け付けたＰＤＦファイルを処理部２７０に渡してもよい。

処理部２７０は、例えば、入力受付部２２１により第１テキストデータを含むＰＤＦファイルが取得されると、当該ＰＤＦファイルに含まれる画像を文字認識して生成される第２テキストデータを用いて所定の処理を行うか、当該第１テキストデータを用いて当該所定の処理を行うかを、当該ＰＤＦファイルに基づいて決定する。

処理部２７０は、データ格納部２７１、ジョブリスト生成部２７２、前処理部２７４、文字認識部２７５、定義特定部２７６、項目抽出部２７７、表示画面生成部２７８、出力部２７９を有する。

データ格納部２７１は、画像形成装置３００からＰＤＦファイルを受信すると、ＰＤＦファイルデータベース２３０に格納する。

ジョブリスト生成部２７２は、入力受付部２２１が画像データの入力を受け付けると、ジョブリストにジョブを登録し、ジョブリストを管理する。ジョブリストの詳細は後述する。

前処理部２７４は、ＰＤＦファイルデータベース２３０から取得したＰＤＦファイルに対して、帳票認識を行うための前処理を行う。

文字認識部２７５は、ＰＤＦファイルから、文字列と、文字列が配置された位置を示す情報とを抽出し、認識結果情報として保持する。認識結果情報の詳細は後述する。

定義特定部２７６は、種別判定データベース２４０を参照し、認識結果情報に含まれる文字列と対応する定義ＩＤを特定する。言い換えれば、定義特定部２７６は、帳票画像データから抽出された文字列に基づき、帳票認識の際に参照する帳票定義情報を特定し、特定した帳票定義情報を帳票定義データベース２５０から取得する取得部である。

項目抽出部２７７は、定義特定部２７６により特定された帳票定義情報と、認識結果情報とに基づき、帳票画像データに含まれる項目と、項目の値とを抽出して対応付けを行い、項目の項目ＩＤと、項目の値とを対応付けた認識結果データを生成する。尚、ＸＭＬ形式のファイル（eXtensible Markup Language）を認識結果データとして生成しても良い。また、項目抽出部２７７は、帳票における項目の記載位置と、項目と項目の値との位置関係を抽出する。

表示画面生成部２７８は、認識結果データベース２６０に格納された認識結果データを用いて、認識結果確認画面を生成する。尚、認識結果確認画面に表示する項目名は、予め項目ＩＤと対応付けて登録しておき、認識結果確認画面を生成するときに、認識結果データに含まれる項目ＩＤに対応する項目名を特定して認識結果確認画面に表示させると良い。

出力部２７９は、表示画面生成部２７８が生成した認識結果確認画面を出力する。言い換えれば、出力部２７９は、表示画面生成部２７８が生成した認識結果確認画面を端末装置４００のウェブブラウザ上で表示させる。

以下に、図９Ａを参照して、第１の実施形態に係る情報処理システム１００の処理の一例について説明する。図９Ａは、第１の実施形態に係る情報処理システムの処理の一例（その一）を説明するシーケンス図である。以下では、サーバ装置２００が、画像形成装置３００から受信したＰＤＦファイルを処理する例について説明する。

情報処理システム１００において、画像形成装置３００は、利用者から帳票認識を行うためのアプリケーションの起動要求を受け付けると（ステップＳ９０１）、このアプリケーションを起動させる（ステップＳ９０２）。

続いて、画像形成装置３００は、利用者から認証情報の入力を受け付けると（ステップＳ９０３）、この認証情報をサーバ装置２００へ送信し、認証要求を行う（ステップＳ９０４）。

サーバ装置２００は、認証要求を受けて、認証処理部２２２により認証を行い、その結果を画像形成装置３００へ通知する（ステップＳ９０５）。尚、ここでは、利用者が認証された場合の処理を示している。

続いて、画像形成装置３００は、帳票のスキャン指示を受け付け（ステップＳ９０６）、帳票のスキャンを行い、スキャンした画像を含むＰＤＦファイルを生成する（ステップＳ９０７）。続いて、画像形成装置３００は、生成したＰＤＦファイルをサーバ装置２００へ送信する（ステップＳ９０８）。

サーバ装置２００は、入力受付部２２１がＰＤＦファイルの入力を受け付けると、認証処理部２２２がこのＰＤＦファイルを処理部２７０へ渡す（ステップＳ９０９）。なお、サーバ装置２００は、認証処理部２２２を介さずに、入力受付部２２１から処理部２７０へＰＤＦファイルを渡すようにしてもよい。

サーバ装置２００の処理部２７０は、ＰＤＦファイルを受け取ると、ジョブリスト生成部２７２により、ジョブリストにジョブを登録する（ステップＳ９１０）。続いて、処理部２７０は、データ格納部２７１により、ＰＤＦファイルをＰＤＦファイルデータベース２３０へ格納する（ステップＳ９１１）。

続いて、処理部２７０は、ＰＤＦファイルデータベース２３０から認識する対象となるＰＤＦファイルを取得し（ステップＳ９１２）、帳票を認識する処理を実行する（ステップＳ９１３）。ステップＳ９１２の処理の詳細は後述する。

続いて、処理部２７０は、項目抽出部２７７が生成した認識結果データを認識結果データベース２６０に格納する（ステップＳ９１４）。

情報処理システム１００において、端末装置４００は、利用者からのブラウザの表示指示の入力を受け付けると（ステップＳ９１５）、サーバ装置２００に対して認識結果データを表示させるブラウザの表示要求を行う（ステップＳ９１６）。

また、端末装置４００は、利用者から認証情報の入力を受け付けて（ステップＳ９１７）、この認証情報をサーバ装置２００へ送信する（ステップＳ９１８）。

サーバ装置２００は、認証処理部２２２により、利用者の認証を行い（ステップＳ９１９）、その結果を端末装置４００へ通知する（ステップＳ９２０）。尚、ここでは、利用者が認証された場合の処理を示す。

続いて、端末装置４００は、利用者から、帳票画像の認識結果の閲覧指示の入力を受け付けると（ステップＳ９２１）、サーバ装置２００に対して閲覧要求を行う（ステップＳ９２２）。

サーバ装置２００は、閲覧要求を受けて、認識結果データベース２６０に格納されている認識結果データを取得し（ステップＳ９２３）、端末装置４００のブラウザ上に表示させ（ステップＳ９２４）、処理を終了する。

以下に、図９Ｂを参照して、第１の実施形態に係る情報処理システム１００の処理の一例について説明する。図９Ｂは、第１の実施形態に係る情報処理システムの処理の一例を説明するシーケンス図（その二）である。以下では、サーバ装置２００が、端末装置４００から受信したＰＤＦファイルを処理する例について説明する。

情報処理システム１００において、端末装置４００は、利用者から帳票認識を行うためのアプリケーションの起動要求を受け付けると（ステップＳ９５１）、このアプリケーションを起動させる（ステップＳ９５２）。

続いて、端末装置４００は、利用者から認証情報の入力を受け付けると（ステップＳ９５３）、この認証情報をサーバ装置２００へ送信し、認証要求を行う（ステップＳ９５４）。

サーバ装置２００は、認証要求を受けて、認証処理部２２２により認証を行い、その結果を端末装置４００へ通知する（ステップＳ９５５）。尚、ここでは、利用者が認証された場合の処理を示している。

続いて、端末装置４００は、帳票のアップロード指示を受け付け（ステップＳ９５６）、予め記憶されているＰＤＦファイルをサーバ装置２００へ送信する（ステップＳ９５８）。なお、当該ＰＤＦファイルは、他の端末装置４００において、文書、表、及びスライド等の所定のファイルフォーマットのファイルが、ＰＤＦ（Portable Document Format）等のファイルフォーマットに変換（エクスポート）されたファイルでもよい。なお、以下のステップＳ９５９からステップＳ９７４の処理は、上述した図９ＡのステップＳ９１９からステップＳ９２４の処理と同様でもよい。

サーバ装置２００は、入力受付部２２１がＰＤＦファイルの入力を受け付けると、認証処理部２２２がこのＰＤＦファイルを処理部２７０へ渡す（ステップＳ９５９）。なお、サーバ装置２００は、認証処理部２２２を介さずに、入力受付部２２１から処理部２７０へＰＤＦファイルを渡すようにしてもよい。

サーバ装置２００の処理部２７０は、ＰＤＦファイルを受け取ると、ジョブリスト生成部２７２により、ジョブリストにジョブを登録する（ステップＳ９６０）。続いて、処理部２７０は、データ格納部２７１により、ＰＤＦファイルをＰＤＦファイルデータベース２３０へ格納する（ステップＳ９６１）。

続いて、処理部２７０は、ＰＤＦファイルデータベース２３０から認識する対象となるＰＤＦファイルを取得し（ステップＳ９６２）、帳票を認識する処理を実行する（ステップＳ９６３）。

続いて、処理部２７０は、表示画面生成部２７８が生成した認識結果データを認識結果データベース２６０に格納する（ステップＳ９６４）。

情報処理システム１００において、端末装置４００は、利用者からのブラウザの表示指示の入力を受け付けると（ステップＳ９６５）、サーバ装置２００に対して認識結果データを表示させるブラウザの表示要求を行う（ステップＳ９６６）。

また、端末装置４００は、利用者から認証情報の入力を受け付けて（ステップＳ９６７）、この認証情報をサーバ装置２００へ送信する（ステップＳ９６８）。

サーバ装置２００は、認証処理部２２２により、利用者の認証を行い（ステップＳ９６９）、その結果を端末装置４００へ通知する（ステップＳ９７０）。尚、ここでは、利用者が認証された場合の処理を示す。

続いて、端末装置４００は、利用者から、帳票画像の認識結果の閲覧指示の入力を受け付けると（ステップＳ９７１）、サーバ装置２００に対して閲覧要求を行う（ステップＳ９７２）。

サーバ装置２００は、閲覧要求を受けて、認識結果データベース２６０に格納されている認識結果データを取得し（ステップＳ９２３）、認識結果確認画面を生成して端末装置４００のブラウザ上に表示させ（ステップＳ９２４）、利用者に、表示された認識結果確認画面で認識結果を確認させて、処理を終了する。

ここで、図１０を参照して、第１の実施形態に係るジョブリスト生成部２７２により生成されるジョブリストについて説明する。図１０は、ジョブリストの一例を示す図である。

実施形態に係るサーバ装置２００は、画像形成装置３００からＰＤＦファイルが入力されると、ジョブリスト生成部２７２により、ＰＤＦファイルとジョブＩＤとを対応付けたジョブリストとして保持する。

実施形態に係るジョブリスト１０１は、情報の項目として、ジョブＩＤ、利用者ＩＤ、帳票画像ファイルパス、認識結果ファイルパス、ステータス、定義ＩＤを有する。

項目「ジョブＩＤ」の値は、ジョブを特定する識別子である。言い換えれば、項目「ジョブＩＤ」の値は、画像形成装置３００から受信したＰＤＦファイルを特定するための識別子である。

項目「利用者ＩＤ」の値は、情報処理システム１００にログインした利用者を特定するための識別子である。

項目「画像ファイルパス」の値は、ＰＤＦファイルが格納されている場所を示す情報である。項目「認識結果ファイルパス」の値は、帳票画像を認識した結果の認識結果データが格納されている場所を示す情報である。

項目「ステータス」の値は、帳票画像の認識の進捗を示す。項目「定義ＩＤ」の値は、項目「画像ファイルパス」の値が示す場所に格納されたＰＤＦファイルを認識する際に参照される帳票定義情報の定義ＩＤを示す。

実施形態に係るサーバ装置２００は、画像形成装置３００からＰＤＦファイルを受信すると、ジョブリスト生成部２７２により、ジョブＩＤを付与し、認証情報として取得した利用者ＩＤを対応付けて、ジョブリスト１０１にレコードを追加する。そして、ジョブリスト生成部２７２は、ＰＤＦファイルがＰＤＦファイルデータベース２３０に格納されると、この格納先を示す情報を項目「画像ファイルパス」の値として、追加する。

さらに、ジョブリスト生成部２７２は、帳票画像の認識において、参照する帳票定義情報が特定されると、その定義ＩＤを項目「定義ＩＤ」の値として追加する。そして、ジョブリスト生成部２７２は、が完了して、認識結果データが認識結果データベース２６０に格納されると、この格納先を示す情報を項目「認識結果ファイルパス」の値として追加し、項目「ステータス」の値を完了とする。

次に、図１１Ａ、及び図１１Ｂを参照して、第１の実施形態に係る処理部２７０の処理について説明する。図１１Ａ、及び図１１Ｂは、第１の実施形態に係る処理部２７０の処理を説明するフローチャートである。図１１Ａ、及び図１１Ｂでは、図９ＡのステップＳ９１３、及び図９ＢのステップＳ９６３の処理の詳細を示している。また、図１１Ａ、及び図１１Ｂでは、複数のＰＤＦファイルを受け取った場合の処理を示している。

処理部２７０は、ＰＤＦファイルデータベース２３０からＰＤＦファイルを取得する（ステップＳ１１０１）。なお、処理部２７０は、端末装置４００のユーザにより、ＰＤＦファイルに含まれているテキストデータを使用することが設定されている場合は、ステップＳ１１０２の処理に進み、端末装置４００のユーザにより、ＰＤＦファイルに含まれているテキストデータを使用しないことが設定されている場合は、ステップＳ１１０５の処理に進む正にしてもよい。続いて、処理部２７０は、取得したＰＤＦファイルに、テキストデータが含まれているか否かを判定する（ステップＳ１１０２）。ここで、画像形成装置３００、及び端末装置４００から受信したＰＤＦファイルには、例えば、以下の（１）及び（２）のような場合に、テキストデータが含まれている。

（１）他の端末装置４００等において、帳票の印刷物がスキャンされて（光学的に読み込まれて）作成されたＰＤＦファイルの画像が文字認識され、文字認識の結果のテキストデータ（「第１テキストデータ」の一例。）が当該ＰＤＦに付加された場合。（２）他の端末装置４００等において、文書、表、スライド等のテキストデータを含むファイルが、ＰＤＦファイルに変換された場合。

テキストデータが含まれていない場合（ステップＳ１１０２でＮＯ）、ステップＳ１１０５の処理に進む。

一方、テキストデータが含まれている場合（ステップＳ１１０２でＹＥＳ）、当該テキストデータを利用するか否かを判定する（ステップＳ１１０３）。ここで、取得したＰＤＦファイルが、上述した（２）のような、ファイルのフォーマットが変換された、テキストデータを含むＰＤＦファイルである等の場合に、当該テキストデータを利用すると判定してもよい。なお、この処理については後述する。

当該テキストデータを利用する場合（ステップＳ１１０３でＹＥＳ）、処理部２７０は、当該テキストデータを処理対象のテキストデータ（「第１テキストデータ」の一例。）として保持し（ステップＳ１１０４）、後述するステップＳ１１１０の処理に進む。図１４Ａは、実施形態に係る処理対象のテキストデータの一例を示す図である。図１４Ａの例では、ＩＤに対応付けて、座標Ｘ、座標Ｙ、文字の幅、文字の高さ、確信度、及び文字が記憶される。ＩＤは、各文字のＩＤである。座標Ｘ及び座標Ｙは、それぞれ、ＩＤに係る文字の横方向、及び縦方向の位置の座標である。文字の幅、及び文字の高さは、それぞれ、ＩＤに係る文字の幅、及び高さである。確信度は、ＩＤに係る文字の画像認識の精度である。なお、確信度は必須ではない。

当該テキストデータを利用しない場合（ステップＳ１１０３でＮＯ）、処理部２７０は、前処理部２７４により、ＰＤＦファイルをｐｎｇ、またはｊｐｅｇ形式等の画像に変換する（ステップＳ１１０５）。

続いて、前処理部２７４は、１ページ分の画像を選択し（ステップＳ１１０６）、前処理を行う（ステップＳ１１０７）。前処理とは、具体的には、例えば、画像の向きを揃える補正処理等である。

続いて、処理部２７０は、文字認識部２７５により、帳票画像から、文字が形成されている領域（以下、文字フィールド）を切り取る（ステップＳ１１０８）。続いて、処理部２７０は、文字認識部２７５により、切り取られた文字フィールドの中の文字を切り取り、文字認識し、文字認識の結果を処理対象のテキストデータ（「第２テキストデータ」の一例。）として保持する（ステップＳ１１０９）。このとき、文字認識部２７５は、切り出した文字の位置を示す座標も取得する。

続いて、処理部２７０は、処理対象のテキストデータに含まれる各文字の位置関係に基づいて読取結果情報を生成する（ステップＳ１１１０）。具体的に、処理部２７０は、認識された各文字の座標に基づいて、互いの距離が予め設定された閾値以内の文字を１つの文字列として認識し、文字列と、文字列が形成された領域の位置を示す座標などの情報とを対応付けて読取結果情報を生成する。読取結果情報の詳細は後述する。

続いて、処理部２７０は、項目抽出部２７７により、読取結果情報と種別判定データベース２４０とに基づき特定した個社定義情報２５２を用いて、項目と項目の値とを抽出する（ステップＳ１１１１）。

続いて、処理部２７０は、項目抽出部２７７により、読取結果情報と種別判定データベース２４０とに基づき特定した特定定義情報２５３を用いて、項目と項目の値とを抽出する（ステップＳ１１１２）。

続いて、処理部２７０は、項目抽出部２７７により、読取結果情報と種別判定データベース２４０とに基づき特定した汎用定義情報２５１を用いて、項目と項目の値とを抽出する（ステップＳ１１１３）。

続いて、処理部２７０は、項目と、項目の値との抽出に成功したか否かを判定する（ステップＳ１１１４）。具体的には、処理部２７０は、ステップＳ１１１１からステップＳ１１１３までの間で、項目抽出部２７７により抽出された項目と項目の値とが存在する場合に、項目と、項目の値との抽出に成功したと判定してもよい。

ステップＳ１１１４において、項目と項目の値の抽出に失敗した場合、処理部２７０は、端末装置４００又は画像形成装置３００に対してエラーを通知し（ステップＳ１１１５）、後述するステップＳ１１１８へ進む。

ステップＳ１１１４において、項目と項目の値との抽出に成功すると、処理部２７０は、項目抽出部２７７により、抽出された項目と項目の値とを対応付けてマージした認識結果データを生成する（ステップＳ１１１６）。マージする処理の詳細は後述する。

続いて、処理部２７０は、ジョブリスト生成部２７２により、認識結果データの生成に用いられた帳票定義情報の定義ＩＤと、認識結果データの格納先とを、ジョブリスト１０１に登録する（ステップＳ１１１７）。

続いて、処理部２７０は、最後のページまで処理を実行したか否かを判定する（ステップＳ１１１８）。ステップＳ１１１７において、最後のページまで処理を実行していない場合、処理部２７０は、ステップＳ１１０６へ戻る。

ステップＳ１１１８において、最後のページまで処理を実行した場合、処理部２７０は、表示画面生成部２７８により、認識結果データを用いて生成された認識結果確認画面を端末装置４００に表示させ（ステップＳ１１１９）、処理を終了する。

尚、図１１Ａ、及び図１１Ｂの例では、認識結果データを表示させる処理まで実行するものとして説明したが、これに限定されない。処理部２７０は、端末装置４００から、認識結果データの閲覧要求を受け付けてから、認識結果データを表示させてもよい。

≪テキストデータの利用判定処理≫
次に、図１２を参照し、図１１ＡのステップＳ１１０２の、テキストデータの利用判定処理の一例について説明する。図１２は、実施形態に係るテキストデータの利用判定処理の一例を示すフローチャートである。

ステップＳ１０１において、処理部２７０は、取得したＰＤＦファイルが所定の条件を満たすか否かを判定する。ここで、処理部２７０は、例えば、取得したＰＤＦファイルの拡張領域に、所定の企業により提供されるアプリケーション及びサービス等の機能により文字認識されたことを示す情報が含まれている場合、所定の条件を満たすと判定してもよい。これは、例えば、当該所定の企業と、サーバ装置２００を提供する企業が同一である等の場合、取得したＰＤＦファイルに予め付加されている文字認識の結果の精度と、サーバ装置２００にて文字認識した結果の精度とが同等であると考えられるためである。これにより、例えば、サーバ装置２００における文字認識の処理負荷を削減することができる。なお、当該拡張領域の情報は、例えば、画像形成装置３００の文字認識モジュールにより設定されてもよい。

また、処理部２７０は、例えば、取得したＰＤＦファイルの拡張領域に、端末装置４００のユーザにより設定された所定の情報が含まれている場合、所定の条件を満たすと判定してもよい。これにより、ＰＤＦファイルに含まれるテキストデータを利用させるか、ＰＤＦファイルに含まれる画像をサーバ装置２００に文字認識された結果を利用させるかを、ユーザが指定できる。

所定の条件を満たす場合（ステップＳ１０１でＹＥＳ）、当該ファイルに含まれるテキストデータを利用すると判定し（ステップＳ１０２）、処理を終了する。

所定の条件を満たさない場合（ステップＳ１０１でＮＯ）、処理部２７０は、取得したＰＤＦファイルが、ファイルのフォーマットが変換された、テキストデータを含むファイルであるか否かを判定する（ステップＳ１０３）。ここで、処理部２７０は、例えば、以下の各条件のうち１以上の条件を用いてこの判定を行ってもよい。すなわち、処理部２７０は、以下の各条件のうち複数の条件を組み合わせてこの判定を行ってもよい。

処理部２７０は、例えば、取得したＰＤＦファイルに所定の表示サイズ以上の画像データが含まれない場合（すなわち、画像データが含まれない場合や、所定の表示サイズ以下の画像データしか含まれていない場合）、ファイルのフォーマットが変換された、テキストデータを含むファイルであると判定してもよい。なお、処理部２７０は、当該所定の表示サイズを、ＰＤＦファイルの各ページの表示サイズに応じて決定してもよい。この場合、処理部２７０は、当該所定の表示サイズを、例えば、ＰＤＦファイルの各ページの表示サイズの８０％の大きさとしてもよい。これは、例えば、Ａ４サイズの印刷物がスキャンされて生成されたＰＤＦファイルの場合、Ａ４サイズの各頁の領域のうち、余白以外の全領域が、スキャンされて生成された画像の表示領域であると考えられるためである。

また、処理部２７０は、取得したＰＤＦファイルが、画像形成装置３００から取得されたファイルである場合、ファイルのフォーマットが変換された、テキストデータを含むファイルでないと判定してもよい。この場合、処理部２７０は、例えば、取得したファイルが、画像形成装置３００からＰＤＦを受信するための所定の通信プロトコルの通信ポートにて受信されていた場合に、取得したファイルが、画像形成装置３００から取得されたファイルであると判定してもよい。

また、処理部２７０は、取得したＰＤＦファイルが、印刷物が光学的に読み込まれて作成された等の画像から文字認識されたテキストデータを含むファイルである場合、ファイルのフォーマットが変換された、テキストデータを含むファイルでないと判定してもよい。この場合、処理部２７０は、例えば、取得したＰＤＦファイルの拡張領域に、文字認識したことを示す情報が含まれている場合、当該画像から文字認識されたテキストデータ等を含むファイルであると判定してもよい。なお、当該拡張領域の情報は、例えば、画像形成装置３００の文字認識モジュールにより設定されてもよい。

ファイルのフォーマットが変換された、テキストデータを含むファイルである場合（ステップＳ１０３でＹＥＳ）、ステップＳ１０２の処理に進む。ＰＤＦファイルへの変換処理では、元のファイルに含まれているテキストデータは保持されるため、変換後のＰＤＦファイルに含まれるテキストデータは、文字認識処理をされていない、正しいテキストデータである。そのため、この処理により、例えば、文書等のファイルがＰＤＦに変換されたファイルを処理対象とする場合、当該文書等に含まれていた元のテキストデータと同一のテキストデータを利用することができる。

ファイルのフォーマットが変換された、テキストデータを含むファイルでない場合（ステップＳ１０３でＮＯ）、当該ファイルに含まれるテキストデータを利用しないと判定し（ステップＳ１０４）、処理を終了する。これにより、ＰＤＦファイルに含まれているテキストデータの文字認識の精度が担保できない場合に、当該テキストデータを利用せず、サーバ装置２００で文字認識したテキストデータを利用することができる。

次に、図１３を参照して、第１の実施形態に係る項目抽出部２７７の処理について説明する。図１３は、第１の実施形態に係る項目抽出部の処理を説明するフローチャートである。図１３は、図１１ＢのステップＳ１１１０の処理の詳細を示している。

実施形態に係る処理部２７０は、読取結果情報が保持されると、定義特定部２７６により、種別判定データベース２４０から、読取結果情報に含まれる識別文字列と対応する定義ＩＤを抽出する（ステップＳ１２０１）。

続いて、定義特定部２７６は、抽出した定義ＩＤの中に、定義種別が個社定義情報である定義ＩＤが存在するか否かを判定する（ステップＳ１２０２）。つまり、ここでは、読取結果情報に含まれる識別文字列が示す種類の帳票に対して、個社定義情報２５２が登録されているか否かを判定している。

ステップＳ１２０２において、該当する定義ＩＤが存在しない場合、この種類の帳票には、利用者固有のレイアウトを定義した個社定義情報２５２は登録されていないため、項目抽出部２７７は、処理を終了し、図１１ＡのステップＳ１１０９へ進む。

ステップＳ１２０２において、該当する定義ＩＤが存在する場合、定義特定部２７６は、帳票定義データベース２５０を参照し、定義ＩＤを含む個社定義情報２５２を特定する（ステップＳ１２０３）。該当する定義ＩＤが存在する場合とは、この帳票は、利用者固有のレイアウトである場合である。

続いて、項目抽出部２７７は、特定された個社定義情報に基づき、読取結果情報から、項目と、項目の値とを抽出し、対応付ける（ステップＳ１２０４）。

尚、ステップＳ１１０９における特定定義情報を用いた項目と項目の値の抽出処理と、ステップＳ１１１０における汎用定義情報２５１を用いた項目と項目の値の抽出処理とは、ステップＳ１１０８の個社定義情報が、特定定義情報又は汎用定義情報となること以外は同様であるから、説明を省略する。

ここで、第１の実施形態に係る認識結果データの生成について説明する。図１４Ｂは、第１の実施形態に係る読取結果情報の一例を示す図である。

図１４Ｂに示す読取結果情報１３０は、例えば、ある請求書のＰＤＦファイルから文字フィールドを切り取り、文字フィールドの中の文字を認識した結果と、文字の位置を示す座標とから抽出されたものである。

この読取結果情報１３０には、文字列「請求書」、「Ｒ社」、「計」、「１２，９６０」が存在している。ここで、定義特定部２７６は、種別判定データベース２４０を参照し、読取結果情報１３０に含まれる文字列が識別文字列とされた定義ＩＤを抽出する。この場合、定義ＩＤ「Ｈ０１」、「Ａ０１」が抽出される（図３参照）。

次に、定義特定部２７６は、抽出された定義ＩＤのうち、対応する定義種別が、個社定義情報である定義ＩＤを特定する。ここでは、定義ＩＤ「Ａ０１」が特定される。つまり、読取結果情報１３０が抽出された帳票は、定義ＩＤ「Ａ０１」の個社定義情報が設定された帳票であることがわかる。

次に、項目抽出部２７７は、帳票定義データベース２５０において、定義ＩＤ「Ａ０１」の個社定義情報２５２を参照する（図６参照）。

個社定義情報２５２では、請求額を示す項目である項目ＩＤ「２」の項目「計」の下の領域にある文字列が、項目名「計」の値であることが定義されている。したがって、項目抽出部２７７は、読取結果情報１３０に含まれる文字列「計」を項目名「計」とし、この文字列「計」の下の領域にある文字列「１２，９６０」を項目名「計」の値として、抽出する。

項目抽出部２７７は、このようにして、個社定義情報２５２に定義されている各項目名に対応する文字列と、項目の値となる文字列とを読取結果情報１３０から抽出する。

項目抽出部２７７により、個社定義情報２５２に定義されている項目名と項目の値との抽出が終了すると、次に、定義特定部２７６は、抽出された定義ＩＤのうち、対応する定義種別が、特定定義情報である定義ＩＤの有無を判定する。

ここでは、該当する定義ＩＤは存在しない。つまり、読取結果情報１３０が抽出された帳票について、特定定義情報は定義されていないことがわかる。

次に、定義特定部２７６は、抽出された定義ＩＤのうち、対応する定義種別が、汎用定義情報である定義ＩＤの有無を判定する。この場合、定義ＩＤ「Ａ０１」が特定される。つまり、読取結果情報１３０が抽出された帳票は、定義ＩＤ「Ｈ０１」の汎用定義情報によっても定義されていることがわかる。

ここで、項目抽出部２７７は、定義ＩＤ「Ａ０１」の汎用定義情報２５１を参照する（図５参照）。そして、項目抽出部２７７は、個社定義情報２５２を参照したときと同様に、汎用定義情報２５１に定義されている項目名と項目の値とを抽出する。

尚、汎用定義情報２５１では、文書種別「請求書」の帳票に含まれる全ての項目名と項目の値について定義されているため、汎用定義情報２５１を参照した場合、個社定義情報２５２で定義されていなかった項目名と項目の値とが抽出される。

また、個社定義情報２５２とは異なり、汎用定義情報２５１では、請求額を示す項目である項目ＩＤ「２」の項目「合計」の右下の領域にある文字列が、項目名「合計」の値であることが定義されている。ここでは、読取結果情報１３０には、文字列「合計」が含まれていないため、項目抽出部２７７は、項目ＩＤが「２」の項目の値が「空」と判断する。

仮に読取結果情報１３０には文字列「合計」が含まれている場合には、項目抽出部２７７は、読取結果情報１３０に含まれる文字列「合計」を項目名「合計」とし、この文字列「合計」の右下の領域にある文字列を項目名「合計」の値として抽出する。

このように、本実施形態では、異なる種類の帳票定義情報を参照し、それぞれの帳票定義情報に基づいて、項目名と項目の値とが抽出される。

以下に、項目抽出部２７７による、マージする処理について説明する。実施形態に係る表示画面生成部２７８では、同一の項目ＩＤについて、異なる種類の帳票定義情報のそれぞれから項目名と項目の値とが抽出された場合、優先度の高い種類の帳票定義情報から抽出された項目名と項目の値を採用して、認識結果データを生成する。

本実施形態では、汎用定義情報、個社定義情報、特定定義情報のうち、個社定義情報の優先度を最も高くしている。これは、個社定義情報は、利用者が固有に設定した定義であり、最も優先して参照されるべき定義だからである。

また、本実施形態では、個社定義情報の次に、特定定義情報の優先度を高くし、汎用定義情報の優先度を最も低くしている。

したがって、例えば、３種類の帳票定義情報のそれぞれから、項目名と項目の値とが抽出された場合には、個社定義情報に基づき抽出された項目名と項目の値とが採用される。

具体的には、例えば、汎用定義情報２５１と個社定義情報２５２のそれぞれには、項目ＩＤ「２」の項目について定義がされている。

したがって、本実施形態では、項目ＩＤ「２」の項目について、汎用定義情報２５１にしたがって抽出された項目名と項目の値と、個社定義情報２５２にしたがって抽出された項目名と項目の値とが存在する。

この場合、項目抽出部２７７は、項目ＩＤ「２」の項目については、個社定義情報２５２にしたがって抽出された項目名と項目の値とを、認識結果データの生成に使用する。具体的に、個社定義情報２５２にしたがって文字列「１２，９６０」が項目の値として抽出され、汎用定義情報２５１にしたがって項目の値が「空」と判断され、項目抽出部２７７は、優先度の高い個社定義情報２５２から抽出された「１２，９６０」を、認識結果データの生成に使用する。

一般的に請求書では、請求額を示す項目の項目名として「合計」が使用されているため、汎用定義情報２５１では、項目「合計」が設定されている。一方で、利用者Ａに対するＲ社からの請求書は、「合計」ではなく、「計」が項目名として使用されているため、汎用定義情報２５１を用いてこのような請求書の請求額を認識できない。従って、利用者Ａに対するＲ社からの請求書から請求額を抽出するために、項目「計」が設定された利用者Ａ固有の個社定義情報２５２が必要である。

さらに、一般的な請求書に比べて、利用者Ａに対するＲ社からの請求書では、請求額を示す項目の項目名として「合計」を使用されているが、項目値が記載された位置が異なる場合に、利用者Ａ固有の個社定義情報２５２における項目「合計」の方向、距離などの項目値を、汎用定義情報２５１とは異なるものに設定すれば良い。

また、汎用定義情報２５１に定義されている項目ＩＤ「１０」の項目については、個社定義情報２５２では定義されていない。したがって、項目ＩＤ「１０」の項目については、汎用定義情報２５１にしたがった項目名と項目の値のみが抽出される。よって、表示画面生成部２７８は、項目ＩＤ「１０」の項目については、汎用定義情報２５１にしたがって抽出された項目名と項目の値とを、認識結果データの生成に使用する。

このように、本実施形態では、複数種類の帳票定義情報に対して優先度を付与し、各帳票定義情報にしたがって抽出された項目名と項目の値のうち、優先度が最も高い帳票定義情報にしたがって抽出された項目名と項目の値とを使用して、帳票画像の認識結果となる認識結果データを生成する。

図１５Ａは、第１の実施形態に係る認識結果確認画面の一例を示す図である。図１５Ａに示す画面１４０は、端末装置４００に表示された画面の例であり、帳票を認識した結果として生成された認識結果が表示されている。

画面１４０には、画像形成装置３００が読み取った帳票画像１４１と、処理部２７０によって抽出された項目と項目の値とを対応付けた情報１４２とが表示されている。また、画面１４０には、登録ボタン１４３が表示されている。利用者は、帳票画像１４１を参照し、表示されている項目と項目の値とをチェックし、必要に応じて項目の値を修正する。そして、登録ボタン１４３が選択されると、修正後の項目の値が認識結果データに登録される。

本実施形態では、例えば、この登録ボタン１４３が選択されると、帳票画像１４１を示す画像データと、情報１４２とが基幹システム５００等に格納されても良い。また、利用者は、認識結果確認画面を介して、登録した認識結果データをダウンロードして、基幹システム５００の操作画面を介して、基幹システムに登録してもよい。

また、画面１４０では、帳票画像１４１を認識する際に参照された帳票定義情報を示す情報１４４が表示されていても良い。本実施形態では、この情報１４４を表示させることで、帳票画像１４１が、どの種類の帳票定義情報を用いて認識されたかを、利用者に通知できる。

以下に、本実施形態の認識結果データの一例を示す。図１５Ｂは、認識結果データの一例を示す図である。

図１５Ｂに示す認識結果データ１５１では、帳票画像データに含まれる項目と、項目の値とを抽出して対応付けを行い、項目の項目ＩＤと、項目の値とを対応付けた結果が、ＸＭＬ形式で記述されている。

本実施形態では、この認識結果データ１５１が生成されて認識結果データベース２６０に格納されると、この格納先が、ジョブリスト１０１の項目「認識結果ファイルパス」の値とされる。

第２の実施形態では、サーバ装置２００が、画像形成装置３００、及び端末装置４００から受信したファイルから、当該ファイルの内容が翻訳されたテキストデータを生成する例について説明する。なお、第２の実施形態は一部を除いて第１の実施形態と同様であるため、適宜説明を省略する。以下では、第１の実施形態と共通する部分については説明を省略し、異なる部分についてのみ説明する。

次に、図１６を参照して、第２の実施形態に係る処理部２７０の処理について説明する。図１６は、第２の実施形態に係る処理部２７０の処理を説明するフローチャートである。

処理部２７０は、ＰＤＦファイルデータベース２３０からＰＤＦファイルを取得し（ステップＳ１６０１）、取得したＰＤＦファイルに、テキストデータが含まれているか否かを判定する（ステップＳ１６０２）。

テキストデータが含まれていない場合（ステップＳ１６０２でＮＯ）、ステップＳ１６０５の処理に進む。

一方、テキストデータが含まれている場合（ステップＳ１６０２でＹＥＳ）、当該テキストデータを利用するか否かを判定する（ステップＳ１６０３）。

当該テキストデータを利用する場合（ステップＳ１６０３でＹＥＳ）、処理部２７０は、当該テキストデータを処理対象のテキストデータ（「第１テキストデータ」の一例。）として保持し（ステップＳ１６０４）、後述するステップＳ１６１０の処理に進む。当該テキストデータを利用しない場合（ステップＳ１６０３でＮＯ）、処理部２７０は、前処理部２７４により、ＰＤＦファイルをｐｎｇ、またはｊｐｅｇ形式等の画像に変換する（ステップＳ１６０５）。

続いて、前処理部２７４は、１ページ分の画像を選択し（ステップＳ１６０６）、前処理を行う（ステップＳ１６０７）。

続いて、処理部２７０は、文字認識部２７５により、画像から、文字が形成されている領域（以下、文字フィールド）を切り取る（ステップＳ１６０８）。続いて、処理部２７０は、文字認識部２７５により、切り取られた文字フィールドの中の文字を切り取り、文字認識し、文字認識の結果を処理対象のテキストデータ（「第２テキストデータ」の一例。）として保持する（ステップＳ１６０９）。

続いて、処理部２７０は、処理対象のテキストデータに含まれる各文字の位置関係に基づいて読取結果情報を生成する（ステップＳ１６１０）。

なお、ステップＳ１６０１からステップＳ１６１０の処理は、図１１Ａ、及び図１１ＢのステップＳ１１０１からステップＳ１１１０の処理と同様でもよい。

続いて、処理部２７０は、読取結果情報の翻訳を行い（ステップＳ１６１１）、翻訳結果を端末装置４００に出力する（ステップＳ１６１２）。これにより、例えば、ユーザは、所定のＷｅｂサイト等から取得した英語等の論文のＰＤＦファイルをサーバ装置２００にアップロードすると、当該論文が日本語等に翻訳されたデータを取得できる。

≪テキストデータの利用判定処理≫
次に、図１７、及び図１８を参照し、図１１ＡのステップＳ１１０２の、テキストデータの利用判定処理の一例について説明する。図１７は、実施形態に係るテキストデータの利用判定処理の一例を示すフローチャートである。図１８は、実施形態に係る端末装置４００の設定画面の一例について説明する図である。なお、処理部２７０は、図１７の処理を、上述した図１２の処理と適宜組み合わせて実行してもよい。

ステップＳ１７０１において、処理部２７０は、例えば、取得したＰＤＦファイルの属性情報（メタデータ）から、ＰＤＦ以外の形式のデータであって、取得したＰＤＦファイルの変換元となるデータであるオリジナルデータを作成した第１ツール（アプリケーションプログラム）を示す情報と、当該オリジナルデータをＰＤＦファイルに変換した第２ツールを示す情報とを取得する。

なお、ISO 32000-1規格で規定されたＰＤＦのデータ構造では、ＰＤＦファイルには、ヘッダー、ボディー、クロスリファレンス・テーブル、及びトレイラー(Trailer)の情報が含まれる。また、ＰＤＦファイルのトレイラーには、「Info」項目に文書情報(Document Information) ディクショナリのメタデータが含まれている。

処理部２７０は、例えば、文書情報ディクショナリに含まれる各メタデータのうち、「Creator」項目に対応付けられた、「ＰＤＦ以外の形式から変換した場合に、そのオリジナルの作成ツール（第１ファイルのフォーマットが変換されて生成されたＰＤＦファイルである場合の当該第１ファイルを作成したツール）」を示す情報を、当該第１ツールを示す情報として取得してもよい。

また、処理部２７０は、例えば、文書情報ディクショナリに含まれる各メタデータのうち、「Producer」項目に対応付けられた、「ＰＤＦ以外の形式から変換した場合に、その変換ツール（第３ファイルのフォーマットが変換されて生成されたＰＤＦファイルである場合の当該第３ファイルをＰＤＦファイルに変換したツール）」を示す情報を、当該第２ツールを示す情報として取得してもよい。

続いて、処理部２７０は、ＰＤＦファイルに含まれるテキストデータの作成ツールとして許可されている第３ツールを示す情報と、当該テキストデータの変換ツールとして許可されている第４ツールを示す情報とを取得する（ステップＳ１７０２）。ここで、当該第３ツール、及び当該第４ツールは、予め設定されていてもよい。また、当該第３ツール、及び当該第４ツールは、端末装置４００のユーザにより予め設定されてもよい。また、当該第３ツールを示すキーワード、及び当該キーワードと第１ツールを示す情報との一致を判定する条件とが設定されていてもよい。一致を判定する条件としては、例えば、部分一致、完全一致、前方一致、及び後方一致等が設定されてもよい。また、同様に、当該第４ツールを示すキーワード、及び当該キーワードと第２ツールを示す情報との一致を判定する条件とが設定されていてもよい。

図１８の例では、端末装置４００は、表示画面１８０１において、作成ツールに関する条件設定１８０２、変換ツールに関する条件設定１８０３、及び「決定」ボタン１８０４を表示させている。図１８の例では、作成ツールに関する条件設定１８０２において、第３ツールを示すキーワードとして「Excel」、及び「Word」がユーザにより指定され、各キーワードと第１ツールを示す情報との一致を判定する条件として「部分一致」が指定されている。

また、同様に、変換ツールに関する条件設定１８０３において、第４ツールを示すキーワードとして「Excel」、及び「Word」がユーザにより指定され、各キーワードと第２ツールを示す情報との一致を判定する条件として「部分一致」が指定されている。「決定」ボタン１８０４が押下されると、端末装置４００は、ユーザにより指定された、作成ツールに関する条件設定１８０２、及び変換ツールに関する条件設定１８０３の情報をサーバ装置２００に送信する。そして、サーバ装置２００は、ユーザにより指定された設定情報を記憶しておく。

続いて、処理部２７０は、作成ツールが許可されているか否かを判定する（ステップＳ１７０３）。ここで、処理部２７０は、ステップＳ１７０１で取得した第１ツールが、ステップＳ１７０２で取得した第３ツールと合致する場合に、作成ツールが許可されていると判定する。

この場合、処理部２７０は、例えば、第１ツールを示す情報が「Microsoft Word 2016 Professional」であり、第３ツールを示す情報が「Excel」、及び「Word」であり、指定された条件が「部分一致」である場合、第１ツールが第３ツールと合致すると判定してもよい。

作成ツールが許可されている場合（ステップＳ１７０３でＹＥＳ）、処理部２７０は、当該ファイルに含まれるテキストデータを利用すると判定し（ステップＳ１７０４）、処理を終了する。

一方、作成ツールが許可されていない場合（ステップＳ１７０３でＮＯ）、処理部２７０は、変換ツールが許可されているか否かを判定する（ステップＳ１７０５）。ここで、処理部２７０は、ステップＳ１７０１で取得した第２ツールが、ステップＳ１７０２で取得した第４ツールと合致する場合に、変換ツールが許可されていると判定する。

この場合、処理部２７０は、例えば、第２ツールを示す情報が「Microsoft Word 2016 Professional」であり、第４ツールを示す情報が「Excel」、及び「Word」であり、指定された条件が「部分一致」である場合、第２ツールが第４ツールと合致すると判定してもよい。また、処理部２７０は、例えば、第２ツールを示す情報が「PDF Easy Parse」であり、第４ツールを示す情報が「Excel」、及び「Word」であり、指定された条件が「部分一致」である場合、第２ツールが第４ツールと合致しないと判定してもよい。

変換ツールが許可されている場合（ステップＳ１７０５でＹＥＳ）、処理部２７０は、ステップＳ１７０４の処理に進む。一方、変換ツールが許可されていない場合（ステップＳ１７０５でＮＯ）、処理部２７０は、当該ファイルに含まれるテキストデータを利用しないと判定し（ステップＳ１７０６）、処理を終了する。これにより、変換後のＰＤＦファイルに付加されるテキストデータの精度が担保できないオリジナルデータの作成ツール、及び変換ツールが利用された場合に、当該テキストデータを利用せず、サーバ装置２００で文字認識したテキストデータを利用することができる。

＜変形例＞
サーバ装置２００の各機能部は、例えば１以上のコンピュータにより構成されるクラウドコンピューティングにより実現されていてもよい。また、サーバ装置２００と端末装置４００とを一体の構成としてもよい。また、端末装置４００、及び画像形成装置３００の機能の少なくとも一部を、サーバ装置２００が有する構成としてもよい。

＜実施形態のまとめ＞
従来、例えば、ＦＡＸで送信された請求書を印刷した紙文書を電子化（例えば、ＰＤＦ化）して、文字認識及び帳票認識が行われていた。近年、ＦＡＸの代わりに、文書作成ソフト等で作成した請求書をＰＤＦ化して、電子メールで送信するケースが増加している。

一方で、従来の帳票認識方法では、例えば、文字によって（例えば、半角カナなど）認識率が低い場合があった。

例えば、文書作成ソフト等で作成された請求書がＰＤＦ化される場合、このＰＤＦ化されたファイルに含まれるテキストデータは１００％正確であるとも言える。上述した各実施形態によれば、サーバ装置２００は、処理対象のファイルが、ファイルのフォーマットが変換された、テキストデータを含むファイル等の場合、当該ファイルに含まれるテキストデータを用いて帳票認識等の処理を行う。これにより、より精度が高いテキストデータを利用可能とすることができる。また、サーバ装置２００は、処理対象のファイルが、例えば、印刷物が光学的に読み込まれて作成された画像から文字認識された第１テキストデータを含むファイル等の場合、当該ファイルを文字認識して第２テキストデータを生成し、当該第２テキストデータを利用して帳票認識等の処理を行う。

以上、各実施形態に基づき本発明の説明を行ってきたが、上記実施形態に示した要件に本発明が限定されるものではない。これらの点に関しては、本発明の主旨をそこなわない範囲で変更することができ、その応用形態に応じて適切に定めることができる。

１００情報処理システム
２００サーバ装置
２１０記憶部
２２０制御部
２２１入力受付部（「取得部」の一例。）
２３０ＰＤＦファイルデータベース
２４０種別判定データベース
２５０帳票定義データベース
２６０認識結果データベース
２７０処理部
２７１データ格納部
２７２ジョブリスト生成部
２７４前処理部
２７５文字認識部
２７６定義特定部
２７７項目抽出部
２７８表示画面生成部
２７９出力部
３００画像形成装置
４００端末装置
５００基幹システム

特開２０１６－０５１３３９号公報

Claims

第１テキストデータを含むファイルを取得する取得部と、
前記取得部により取得されるファイルに含まれる画像を文字認識して生成される第２テキストデータを用いて所定の処理を行うか、前記第１テキストデータを用いて前記所定の処理を行うかを、前記取得部により取得されるファイルに基づいて決定する処理部と、を有し、
前記処理部は、所定の企業により提供される機能により文字認識されたことを示す情報が前記取得部により取得されるファイルに含まれる場合、前記第１テキストデータを用いて前記所定の処理を行う、
情報処理装置。
前記取得部により取得されるファイルは、ＰＤＦ（ＰｏｒｔａｂｌｅＤｏｃｕｍｅｎｔＦｏｒｍａｔ）のデータである、
請求項１に記載の情報処理装置。
前記処理部は、前記取得部により取得されるファイルが、テキストデータを含むファイルのフォーマットが変換されて生成されたファイルである場合、前記第１テキストデータを用いて前記所定の処理を行う、
請求項１または２に記載の情報処理装置。
前記処理部は、前記取得部により取得されるファイルに所定の表示サイズ以上の画像データが含まれない場合、前記第１テキストデータを用いて前記所定の処理を行う、
請求項１乃至３のいずれか一項に記載の情報処理装置。
前記処理部は、前記第１テキストデータが画像から文字認識されたことを示す情報が前記取得部により取得されるファイルに含まれる場合、前記第２テキストデータを用いて前記所定の処理を行う、
請求項１乃至４のいずれか一項に記載の情報処理装置。
前記処理部は、画像形成装置から前記取得部によりファイルが取得されると、前記第２テキストデータを用いて前記所定の処理を行う、
請求項１乃至５のいずれか一項に記載の情報処理装置。
前記取得部は、帳票のファイルを取得し
前記所定の処理は、前記帳票から所定の項目のデータを抽出する処理である、
請求項１乃至６のいずれか一項に記載の情報処理装置。
前記処理部は、前記取得部により取得されるファイルの属性情報に基づいて、前記第２テキストデータを用いて前記所定の処理を行うか、前記第１テキストデータを用いて前記所定の処理を行うかを決定する、
請求項１乃至７のいずれか一項に記載の情報処理装置。
前記処理部は、前記取得部により取得されるファイルの属性情報に含まれる、当該ファイルが第１ファイルのフォーマットが変換されて生成された第２ファイルである場合の前記第１ファイルを作成したツールを示す情報に基づいて、前記第２テキストデータを用いて前記所定の処理を行うか、前記第１テキストデータを用いて前記所定の処理を行うかを決定する、
請求項８に記載の情報処理装置。
前記処理部は、前記取得部により取得されるファイルの属性情報に含まれる、当該ファイルが第３ファイルのフォーマットが変換されて生成された第４ファイルである場合の前記第３ファイルを前記第４ファイルに変換したツールを示す情報に基づいて、前記第２テキストデータを用いて前記所定の処理を行うか、前記第１テキストデータを用いて前記所定の処理を行うかを決定する、
請求項８または９に記載の情報処理装置。
情報処理装置が、
第１テキストデータを含むファイルを取得する処理と、
前記取得する処理により取得されるファイルに含まれる画像を文字認識して生成される第２テキストデータを用いて所定の処理を行うか、前記第１テキストデータを用いて前記所定の処理を行うかを、前記取得する処理により取得されるファイルに基づいて決定する処理と、を実行し、
前記決定する処理は、所定の企業により提供される機能により文字認識されたことを示す情報が前記取得する処理により取得されるファイルに含まれる場合、前記第１テキストデータを用いて前記所定の処理を行うことを決定する、
情報処理方法。
情報処理装置に、
第１テキストデータを含むファイルを取得する処理と、
前記取得する処理により取得されるファイルに含まれる画像を文字認識して生成される第２テキストデータを用いて所定の処理を行うか、前記第１テキストデータを用いて前記所定の処理を行うかを、前記取得する処理により取得されるファイルに基づいて決定する処理と、を実行させ、
前記決定する処理は、所定の企業により提供される機能により文字認識されたことを示す情報が前記取得する処理により取得されるファイルに含まれる場合、前記第１テキストデータを用いて前記所定の処理を行うことを決定する、
情報処理プログラム。