JP2020135296A - 情報処理装置および情報処理システム - Google Patents

情報処理装置および情報処理システム Download PDF

Info

Publication number
JP2020135296A
JP2020135296A JP2019026604A JP2019026604A JP2020135296A JP 2020135296 A JP2020135296 A JP 2020135296A JP 2019026604 A JP2019026604 A JP 2019026604A JP 2019026604 A JP2019026604 A JP 2019026604A JP 2020135296 A JP2020135296 A JP 2020135296A
Authority
JP
Japan
Prior art keywords
conversion processing
processing unit
image data
information processing
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019026604A
Other languages
English (en)
Other versions
JP7298178B2 (ja
Inventor
吉田 大輔
Daisuke Yoshida
大輔 吉田
哲史 山口
Tetsushi Yamaguchi
哲史 山口
陽介 岡
Yosuke Oka
陽介 岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2019026604A priority Critical patent/JP7298178B2/ja
Priority to US16/794,024 priority patent/US11367269B2/en
Publication of JP2020135296A publication Critical patent/JP2020135296A/ja
Application granted granted Critical
Publication of JP7298178B2 publication Critical patent/JP7298178B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

【課題】画像データを文字コードデータに変換可能な複数の情報処理部を選択して使用できる。【解決手段】情報処理システム(100)は、画像読取装置(10)と、情報処理装置(20)とを備える。画像読取装置(10)は、原稿を読み取って対象画像データ(OG)を生成する。情報処理装置(20)は、対象画像データ(OG)を処理する。情報処理装置(20)は、第1変換処理部(22a)と、第2変換処理部(22b)と、選択部(24)とを含む。第1変換処理部(22a)は、画像データを文字コードデータに変換可能である。第2変換処理部(22b)は、画像データを文字コードデータに変換可能である。選択部(24)は、第1変換処理部(22a)および第2変換処理部(22b)のいずれが前記対象画像データ(OG)を文字コードに変換するかを選択する。【選択図】図2

Description

本発明は、情報処理装置および情報処理システムに関する。
原稿を読み取って原稿中の文字を認識する文字認識が知られている。このような処理は、光学文字認識(Optical Character Recognition:OCR)処理とも呼ばれる。光学文字認識処理では、画像データを文字コードデータに変換する。
MFPでスキャンしたデータをOCRサーバーに送信し、OCRサーバーがOCR処理を実行するスキャンシステムが検討されている(例えば、特許文献1)。特許文献1のスキャンシステムでは、スキャンしたデータのうちフォーマットデータ部分を消去した上で、残った文字列をOCR処理している。
特開2018−160897号公報
しかしながら、特許文献1のスキャンシステムでは、OCRサーバーに搭載されたOCR実行部は1種類のみであり、用途に応じて異なるOCR処理を行うことができなかった。
本発明は上記課題に鑑みてなされたものであり、その目的は、複数の情報処理部を選択して使用可能な情報処理装置および情報処理システムを提供することにある。
本発明による情報処理システムは、画像読取装置と、情報処理装置とを備える。前記画像読取装置は、原稿を読み取って対象画像データを生成する。前記情報処理装置は、前記対象画像データを処理する。前記情報処理装置は、第1変換処理部と、第2変換処理部と、選択部とを備える。前記第1変換処理部は、画像データを文字コードデータに変換可能である。前記第2変換処理部は、画像データを文字コードデータに変換可能である。前記選択部は、前記第1変換処理部および前記第2変換処理部のいずれが前記対象画像データを文字コードに変換するかを選択する。
本発明による情報処理装置は、第1変換処理部と、第2変換処理部と、通信部と、選択部とを備える。前記第1変換処理部は、画像データを文字コードデータに変換可能である。前記第2変換処理部は、画像データを文字コードデータに変換可能である。前記通信部は、対象画像データを受信する。前記選択部は、前記第1変換処理部および前記第2変換処理部のいずれが前記対象画像データを文字コードに変換するかを選択する。
本発明によれば、複数の情報処理部を選択して使用できる。
本実施形態の情報処理システムの模式図である。 本実施形態の情報処理システムの模式的なブロック図である。 本実施形態の情報処理システムにおける情報処理装置による情報処理のフロー図である。 本実施形態の情報処理システムにおける情報処理装置による情報処理のフロー図である。 本実施形態の情報処理システムの模式的なブロック図である。 本実施形態の情報処理システムにおける領域の指定された画像データの模式図である。 本実施形態の情報処理システムの模式的なブロック図である。 (a)〜(c)は、本実施形態の情報処理システムにおける画像読取装置の表示部の表示画面を示す模式図である。 本実施形態の情報処理システムにおける画像読取装置による情報処理のフロー図である。 本実施形態の情報処理システムにおける情報処理装置による情報処理のフロー図である。 本実施形態の情報処理システムの模式的なブロック図である。 (a)および(b)は、本実施形態の情報処理システムにおける画像読取装置の表示部の表示画面を示す模式図である。 本実施形態の情報処理システムの模式図である。
以下、図面を参照して本発明の実施形態を説明する。なお、図中、同一または相当部分については同一の参照符号を付して説明を繰り返さない。
まず、図1を参照して、本実施形態の情報処理システム100の構成を説明する。図1は、情報処理システム100の模式図である。情報処理システム100は、画像読取装置10と、情報処理装置20とを備える。
画像読取装置10および情報処理装置20はネットワークNで接続されている。ネットワークNは、ローカル・エリア・ネットワーク(Local Area Network:LAN)であってもよく、ワイド・エリア・ネットワーク(Wide Area Network:WAN)であってもよい。あるいは、ネットワークNは、インターネットであってもよい。
画像読取装置10は、原稿を読み取って対象画像データOGを生成する。画像読取装置10は、対象画像データOGを情報処理装置20に送信する。
対象画像データOGのファイル形式は特に限定されない。例えば、対象画像データOGのファイル形式は、ポータブル・ドキュメント・フォーマット(Portable Document Format:PDF)、ポータブル・ネットワーク・グラフィックス(Portable Network Graphics:PNG)、タグドイメージファイルフォーマット(Tagged Image File Formart:TIFF)またはジョイントフォトグラフィックエキスパーツグループ(Joint Photographic Experts Group:JPEG)のいずれであってもよい。
情報処理装置20は、画像読取装置10から対象画像データOGを受信する。ここでは、対象画像データOGの送信元は、画像読取装置10である。
情報処理装置20は、対象画像データOGを処理する。情報処理装置20は、対象画像データOGを文字コードデータに変換する。情報処理装置20は、光学文字認識(Optical Character Recognition:OCR)処理により、対象画像データOGを文字コードデータCDに変換する。例えば、情報処理装置20はサーバーである。文字コードデータCDは、言語、数字または記号を示すデータである。
文字コードデータCDのファイル形式は特に限定されない。例えば、文字コードデータCDのファイル形式は、エクステンシブル・マークアップ・ランゲージ(Extensible Markup Language:XML)、PDF、文書作成ソフトウェア、表計算ソフトウェアおよびプレゼンテーションソフトウェアのいずれであってもよい。
例えば、情報処理装置20は、文字コードデータCDを保存する。情報処理装置20自身が、文字コードデータを記憶してもよい。または、情報処理装置20は、別の記憶装置が文字コードデータを記憶するように文字コードデータを送信してもよい。例えば、情報処理装置20は、文字コードデータを画像読取装置10に送信してもよい。あるいは、情報処理装置20は、文字コードデータを別の機器にファクスしてもよい。
情報処理装置20は、画像読取装置10と連動して動作してもよい。例えば、画像読取装置10には、情報処理装置20を駆動するためのアプリケーションソフトウェアがインストールされていてもよい。画像読取装置10のアプリケーションソフトウェアの起動により、画像読取装置10は、情報処理装置20と連動して動作する。
情報処理システム100は、情報処理装置30をさらに備えてもよい。情報処理装置30はネットワークNに接続されている。情報処理装置20は、情報処理装置30に文字コードデータCDを送信できる。情報処理装置30は、文字コードデータCDを処理する。情報処理装置30は、例えば、パーソナルコンピューター(Personal Computer:PC)またはスマートフォン(Smart Phone)を含む。
次に、図1および図2を参照して、本実施形態の情報処理システム100を説明する。図2は、本実施形態の情報処理システム100のブロック図である。
画像読取装置10は、読取部12と、通信部16と、制御部17とを備える。制御部17は、読取部12および通信部16を制御する。制御部17は、プロセッサーを含む。プロセッサーは、中央処理演算機(Central ProcessingUnit:CPU)を含んでもよい。あるいは、プロセッサーは、マイクロコンピューターを含んでもよい。または、プロセッサーは、特定用途用集積回路(application specific integrated circuit:ASIC)を含んでもよい。
読取部12は、原稿を読み取って画像データを生成可能である。読取部12は、原稿を読み取って対象画像データOGを生成する。
通信部16は、外部の電子機器と通信する。ここでは、通信部16は、対象画像データOGを情報処理装置20に送信する。
情報処理装置20は、第1変換処理部22aと、第2変換処理部22bと、選択部22cと、通信部26と、制御部27と、記憶部27sとを備える。制御部27は、第1変換処理部22aと、第2変換処理部22bと、選択部22cと、通信部26とを制御する。制御部27は、プロセッサーを含む。プロセッサーは、CPU、マイクロコンピューターまたは特定用途用集積回路を含んでもよい。
第1変換処理部22aは、画像データを文字コードデータに変換できる。例えば、第1変換処理部22aは、対象画像データOGを文字コードデータCDに変換できる。なお、本明細書において、第1変換処理部22aによって変換された文字コードデータを第1文字コードデータまたは文字コードデータCD1と記載することがある。また、本明細書において、第1変換処理部22aによる変換処理を第1変換処理と記載することがある。
典型的には、第1変換処理部22aが画像データを文字コードデータに変換する場合、第1変換処理の認識率も生成される。認識率は、第1変換処理部22aによって適切に変換されたと認識された文字の割合を示す。認識率が高い場合、第1変換処理は誤りなく適切に変換されていることが多い。本明細書において、第1変換処理部22aによる認識率を第1認識率と記載することがある。
第2変換処理部22bは、画像データを文字コードデータに変換できる。例えば、第2変換処理部22bは、対象画像データOGを文字コードデータCDに変換できる。本明細書において、第2変換処理部22bによって変換された文字コードデータを第2文字コードデータまたは文字コードデータCD2と記載することがある。また、本明細書において、第2変換処理部22bによる変換処理を第2変換処理と記載することがある。
第2変換処理部22bが画像データを文字コードデータに変換する場合、第2変換処理の認識率も生成される。本明細書において、第2変換処理部22bによる認識率を第2認識率と記載することがある。
第1変換処理部22aおよび第2変換処理部22bは、いずれも画像データを文字コードデータに変換する。例えば、第1変換処理部22aは、ある対象画像データを日本語の文字コードデータに変換する。同様に、第2変換処理部22bは、同じ対象画像データを日本語の文字コードデータに変換する。
ただし、対象画像データが同じであり、第1変換処理部22aが第2変換処理部22bと同種の変換処理をした場合でも、第1変換処理部22aの変換処理は、第2変換処理部22bの変換処理と同じではなく、文字コードデータCD1は、文字コードデータCD2と同じにならないことがある。例えば、第1変換処理部22aの変換処理は通常レベルであり、第2変換処理部22bの変換処理は、第1変換処理部22aの変換処理よりも優れている。一例では、第2変換処理部22bは、第1変換処理部22aの変換処理では正しく変換できない画像データであっても、適切に変換できる。この場合、第2認識率は第1認識率よりも大きい。
選択部22cは、第1変換処理部22aおよび第2変換処理部22bのいずれが対象画像データを変換するかを選択する。例えば、選択部22cは、予め定められた手順に従って第1変換処理部22aおよび第2変換処理部22bのいずれが対象画像データを変換するかを選択してもよい。一例では、選択部22cは、情報処理装置20が対象画像データOGを受信する前に予め定められた手順に従って第1変換処理部22aおよび第2変換処理部22bのいずれが対象画像データを変換するかを選択してもよい。
あるいは、選択部22cは、対象画像データOGを生成する画像読取装置10のユーザーからの指定に従って第1変換処理部22aおよび第2変換処理部22bのいずれが対象画像データを変換するかを選択してもよい。例えば、画像読取装置10は、原稿を読み取って対象画像データを生成し、対象画像データを情報処理装置20に送信する直前、同時または直後に、第1変換処理部22aおよび第2変換処理部22bのいずれが対象画像データを変換するかを指定する。その後、画像読取装置10からの指定に従って、選択部22cは、第1変換処理部22aおよび第2変換処理部22bのいずれが対象画像データを変換するかを選択してもよい。
第1変換処理部22aおよび第2変換処理部22bの少なくとも一方は、選択部22cの選択結果に基づいて、対象画像データOGを文字コードデータに変換する。例えば、選択部22cが第1変換処理部22aを選択する場合、第1変換処理部22aは、対象画像データOGを文字コードデータCD1に変換する。あるいは、選択部22cが第2変換処理部22bを選択する場合、第2変換処理部22bは、対象画像データOGを文字コードデータCD2に変換する。
なお、選択部22cは、第1変換処理部22aおよび第2変換処理部22bのいずれかを複数回選択してもよい。例えば、選択部22cは、先に、第1変換処理部22aおよび第2変換処理部22bの一方を選択し、変換結果が所定の条件を満たさない場合、後で、第1変換処理部22aおよび第2変換処理部22bの他方を選択してもよい。
記憶部27sは、制御プログラムを記憶する。制御プログラムは、非一時的コンピューター読取可能記憶媒体に記憶される。非一時的コンピューター読取可能記憶媒体は、ROM(Read Only Memory)、RAM(Random Access Memory)、CD−ROM,磁気テープ、磁気ディスクまたは光データ記憶装置を含む。制御部27は、記憶部27sに記憶された制御プログラムを実行することによって、情報処理装置20の各構成要素の動作を制御する。
本実施形態の情報処理システムによれば、第1変換処理部22aおよび第2変換処理部22bの少なくとも一方が対象画像データOGを文字コードデータに変換する。例えば、第1変換処理部22aおよび第2変換処理部22bは、費用または使用料に基づいて選択されてもよい。あるいは、第1変換処理部22aおよび第2変換処理部22bは認識率に基づいて選択されてもよい。
なお、対象画像データおよび/または文字コードデータの種類にかかわらず、第1認識率と第2認識率との大小関係は、一定であってもよい。例えば、対象画像データおよび/または文字コードデータの種類にかかわらず、第2認識率が第1認識率よりも大きい場合、第2変換処理部22bの性能は、第1変換処理部22aの性能よりも優れている。
なお、第1認識率と第2認識率との大小関係は、対象画像データおよび/または文字コードデータの種類に応じて変化してもよい。例えば、対象画像データを日本語の文字コードデータに変換する場合、第2認識率は第1認識率よりも高く、対象画像データを英語の文字コードデータに変換する場合、第1認識率は第2認識率よりも高くてもよい。
また、第1変換処理部22aの使用条件は、第2変換処理部22bの使用条件と異なってもよい。例えば、第1変換処理部22aは無償で使用可能であり、第2変換処理部22bは有償で使用可能である。第1変換処理部22aはライセンスなしで使用可能であり、第2変換処理部22bはライセンスによって使用可能である。または、第1変換処理部22aの使用料は安価であり、第2変換処理部22bの使用料は高価である。あるいは、第1変換処理部22aの使用料は定額制であり、第2変換処理部22bの使用料は従量制である。
なお、第1変換処理部22aおよび第2変換処理部22bの使用料は、画像データの処理量(使用量)に応じて増大してもよく、画像データの処理量(使用量)にかかわらず一定であってもよい。例えば、第1変換処理部22aおよび第2変換処理部22bの使用料は、画像データの処理量(使用量)にかかわらず一定期間にわたって一定であってもよい。
典型的には、第1変換処理部22aは、使用料の課されないものであってもよい。例えば、第1変換処理部22aは、オープンソースを利用してもよい。
第2変換処理部22bは、使用料の課されるものであってもよい。例えば、第2変換処理部22bは、ベンダーの開発したソフトウェアであってもよい。
例えば、重要度の比較的低い原稿を対象とする場合、選択部22cは、ユーザーの設定に基づいて、使用料の安い情報処理部を選択してもよい。あるいは、重要度の比較的高い原稿を対象とする場合、選択部22cは、ユーザーの設定に基づいて、認識率の高い情報処理部を選択してもよい。さらには、ユーザーは、状況に応じて選択する情報処理部を設定したい場合には、選択部22cは、変換処理ごとに使用する情報処理部をユーザーに問合せ、ユーザーからの指示にしたがって、情報処理部を選択してもよい。あるいは、選択部22cは、ユーザーの予め決めた希望設定条件に基づいて、情報処理部を選択してもよい。
例えば、第1変換処理部22aは、画像データを数字および/またはアルファベットの文字コードデータに高い認識率で変換できる一方で、画像データを別の文字コードデータには高い認識率で変換できなくてもよい。また、第2変換処理部22bは、画像データを数字および/またはアルファベットの文字コードデータに高い認識率で変換できてもよい。このように、第1変換処理部22aは、マルチバイト文字への変換が不充分であるのに対して、第2変換処理部22bは、マルチバイト文字への変換が充分であってもよい。
なお、第1変換処理部22aは、画像データから文字コードデータに変換する際に、文字コードデータの認識率を取得することが好ましい。第1変換処理部22aが画像データから文字コードデータに変換する際に正しい変換を行うほど文字コードデータの認識率が高くなる。
例えば、対象画像データで示されている文字の言語について、第1変換処理部22aが、自身または読み出し可能なデータベースに、複数種類のフォントを記憶している場合、第1変換処理部22aにおける文字コードデータの認識率は高くなる。反対に、対象画像データで示されている文字の言語について、第1変換処理部22aが、自身または読み出し可能なデータベースに、1〜2種類のフォントを記憶している場合、第1変換処理部22aにおける文字コードデータの認識率は低くなる。同様に、第2変換処理部22bは、画像データから文字コードデータに変換する際に、文字コードデータの認識率を取得することが好ましい。
例えば、第2変換処理部22bは、第1変換処理部22aと比べて高精度に変換処理できる一方で、第2変換処理部22bの使用料は第1変換処理部22aの使用料よりも高いことがある。一例では、第2変換処理部22bの使用料は使量に応じて定められている一方で、情報処理装置20のユーザーであれば、第1変換処理部22aは制限なく使用可能であってもよい。
第1変換処理部22aおよび第2変換処理部22bは、画像データを変換した文字コードデータのうちの一部をメタデータとして抽出してもよい。また、文字コードデータ自体は、ファイルとして保存してもよく、ファイルとして保存しなくてもよい。また、ファイルとして保存する場合、抽出したメタデータをファイル名として付してもよい。
次に、図1〜図3を参照して、本実施形態の情報処理装置20による情報処理方法を説明する。図3は、本実施形態の情報処理装置20の情報処理方法のフロー図である。
まず、ステップS102において対象画像データを受信する。画像読取装置10は、原稿を読み取って対象画像データOGを生成し、対象画像データOGを情報処理装置20に送信する。情報処理装置20は、対象画像データOGを画像読取装置10から受信する。
ステップS104において、情報処理装置20の第1変換処理部22aおよび第2変換処理部22bのいずれが対象画像データOGを文字コードデータに変換するかを選択する。詳細には、選択部22cは、第1変換処理部22aおよび第2変換処理部22bのいずれが対象画像データOGを文字コードデータに変換するかを選択する。
選択部22cは、予め定められた手順に従って第1変換処理部22aおよび第2変換処理部22bのいずれが対象画像データを変換するかを選択してもよい。あるいは、選択部22cは、画像読取装置10のユーザーからの指示に従って第1変換処理部22aおよび第2変換処理部22bのいずれが対象画像データを変換するかを選択してもよい。
ステップS106において、選択された変換処理部が対象画像データOGを文字コードデータCDに変換する。なお、選択部22cにおいて選択された変換処理部の変換結果が所定の要件を満たさない場合、最初に選択部22cにおいて選択されなかった変換処理部が選択され、後で選択された変換処理部が対象画像データOGを文字コードデータCDに変換してもよい。例えば、選択部22cにおいて最初に選択された変換処理部の認識率が閾値よりも低い場合、選択部22cにおいて最初に選択されなった変換処理部が次に選択され、後で選択された変換処理部が対象画像データOGを文字コードデータCDに変換してもよい。
ステップS108において、記憶部27sは文字コードデータCDを記憶する。記憶部27sは、文字コードデータをXMLデータとして記憶してもよい。また、記憶部は文字コードデータをメタデータとして記憶してもよい。
または、記憶部27sは、文字コードデータを検索可能に記憶することが好ましい。例えば、記憶部27sは、対象画像データに対応する文字コードデータを検索可能にPDFで記憶してもよい。一例では、記憶部27sは、対象画像データの全体に対応する文字コードデータをPDFで記憶してもよい。あるいは、記憶部27sは、対象画像データの一部に対応する文字コードデータをPDFで記憶してもよい。
図3を参照して説明したように、本実施形態によれば、複数の情報処理部を選択して使用可能である。このため、原稿の重要度およびコスト等に応じて、複数の変換処理を使い分けることができる。
なお、原稿は書式の定まったものであり、対象画像データは、書式の定まった画像データであることが好ましい。例えば、原稿は、書式の定まった請求書である。典型的には、請求書には、請求先、請求額、発行日、振込期限等が記載されている。一般に、発行者の同じ請求書は、同じ書式で発行される。
一例では、請求書の右上には請求先が記載されており、請求書の右下には請求額が記載されている。この場合、画像読取装置10が請求書を読み取って対象画像データを生成すれば、情報処理装置20は対象画像データに対応する文字コードデータを生成する。そのため、情報処理装置20は、原稿を好適に文字コード化できる。
なお、選択部22cは、先に第1変換処理部22aを選択して、第1変換処理部22aの変換処理の後に、第2変換処理部22bによる変換処理を行うか否かを判定してもよい。第2変換処理部22bによる変換処理を行うか否かは、第1変換処理部22aの変換時の認識率と閾値との比較に基づいて判定されてもよい。
例えば、閾値が80%と設定される場合、第1変換処理部22aによる変換処理の認識率が75%であるとき、第2変換処理部22bは、対象画像データを第2文字コードデータに変換し、対象画像データに対応して第2文字コードデータが用いられる。一方、第1変換処理部22aによる変換処理の認識率が85%であるとき、第2変換処理部22bは変換処理を行わず、対象画像データに対応して第1文字コードデータが用いられる。
なお、対象画像データを文字コードデータに変換した場合には、文字コードデータに基づく表示を人間が目視にて確認することが多い。例えば、第2変換処理部22bの1ヵ月の使用量が決められている場合、当該月中の第2変換処理部22bの使用量に応じて閾値を変更してもよい。あるいは、対象画像データの変換された文字コードデータは検収装置において検収されてよい。
例えば、当該月中に使用可能な第2変換処理部22bの使用量が多い場合、閾値を高くしてもよい。一例では、閾値を80%から90%に変更することにより、第1変換処理部22aによる変換処理の認識率が85%であっても、第2変換処理部22bは、対象画像データを第2文字コードデータに変換し、対象画像データに対応して第2文字コードデータが用いられる。
当該月中に使用可能な第2変換処理部22bの使用量が少ない場合、閾値を低くしてもよい。一例では、閾値を80%から70%に変更することにより、第1変換処理部22aによる変換処理の認識率が75%であっても、第2変換処理部22bは変換処理を行わず、対象画像データに対応して第1文字コードデータが用いられる。
次に、図1、図2および図4を参照して、本実施形態の情報処理装置20による情報処理方法を説明する。図4は、本実施形態の情報処理装置20の情報処理方法のフロー図である。図4のフロー図は、第1変換処理の後に、認識率に応じて第2変換処理を行う点を除いて、図3のフロー図と同様である。このため、冗長を避けるために重複する説明を省略する。
まず、ステップS102において対象画像データOGを受信する。画像読取装置10は、原稿を読み取って対象画像データOGを生成し、対象画像データOGを情報処理装置20に送信する。情報処理装置20は、対象画像データを画像読取装置10から受信する。
ステップS104aにおいて、選択部22cは、第1変換処理部22aを選択する。ここでは、選択部22cは、予め第1変換処理部22aを選択するように設定されている。
その後、ステップS106aにおいて、第1変換処理部22aが対象画像データOGを文字コードデータCD1に変換する。第1変換処理において、第1認識率が生成される。
ステップS107において、選択部122cは、第1認識率が閾値よりも大きいか判定する。第1認識率が閾値よりも大きいと判定される場合(ステップS107においてYes)、ステップS108aに進む。ステップS108aにおいて、記憶部27sは文字コードデータCD1を記憶する。
第1認識率が閾値よりも大きくないと判定される場合(ステップS107においてNo)、ステップS104bに進む。ステップS104bにおいて、選択部22cは、第2変換処理部22bを選択する。ここでは、選択部22cは、第2変換処理部22bを選択するように予め設定されている。
その後、ステップS106bにおいて、第2変換処理部22bが対象画像データOGを文字コードデータCD2に変換する。第2変換処理において、第2認識率が生成される。なお、典型的には、第1認識率は第2認識率よりも大きい。その後、ステップS108bにおいて、記憶部27sは文字コードデータCD2を記憶する。情報処理装置20の情報処理は終了する。
以上のようにして、情報処理装置20は、対象画像データを文字コードデータに変換する。本実施形態によれば、変換された文字コードデータは、閾値を超えた認識率、または、情報処理装置20のうちのより高い認識率で変換されているため、十分な精度で変換処理の行われた文字コードデータを使用できる。
なお、図4を参照して上述したステップS108bでは、記憶部27sは、文字コードデータCD2を記憶したが、本実施形態はこれに限定されない。選択部22cは、第2変換処理の後に、第1認識率と第2認識率とを比較してより大きい認識率を判定し、記憶部27sは、より大きい認識率に対応する文字コードデータを記憶してもよい。
なお、情報処理装置20の設定は、画像読取装置10において行われてもよい。例えば、選択部122cによる第1変換処理部22aおよび第2変換処理部22bの選択順序は、画像読取装置10において設定されてもよい。
また、画像読取装置10において生成された画像データに対する処理の流れ(ワークフロー)は、画像読取装置10において設定されてもよい。例えば、ワークフローの設定により、書類に応じて文字コードデータを記憶するフォルダーを異ならせることができる。
一例では、個人IDとともに個人情報の記載された複数の書類を画像読取装置10において読み取って複数の対象画像データを生成することにより、個人IDに応じて作成された複数のフォルダーに複数の書類に記載された個人情報に対応する電子データを個別に保存することができる。
また、ワークフローにより、請求先、請求書番号、請求項目および請求額の記載された複数の請求書を画像読取装置10において読み取った複数の対象画像データの記憶場所を設定することにより、請求先に応じて作成された複数のフォルダーに複数の書類に記載された請求書関連情報に対応する文字コードデータを個別に保存することができる。
なお、第1変換処理部22aが対象画像データに対して第1変換処理を行う場合、第1変換処理部22aが対象画像データ全体に対して第1変換処理を行ってもよい。あるいは、第1変換処理部22aが対象画像データの一部の領域に対して第1変換処理を行ってもよい。この場合、特定の領域は、予め指定されていることが好ましい。
同様に、第2変換処理部22bが対象画像データに対して第2変換処理を行う場合、第2変換処理部22bが対象画像データ全体に対して第2変換処理を行ってもよい。あるいは、第2変換処理部22bが対象画像データの一部の対象領域に対して第2変換処理を行ってもよい。この場合、対象領域は、予め指定されていることが好ましい。
次に、図5を参照して、本実施形態の情報処理システム100を説明する。図5は、情報処理システム100の模式図である。図5の情報処理システム100は、情報処理装置20が領域指定部24をさらに備える点を除いて、図2を参照して上述した情報処理システム100と同様の構成を有している。このため、冗長を避けるために重複する説明を省略する。
情報処理装置20は、第1変換処理部22a、第2変換処理部22b、選択部22c、通信部26、制御部27および記憶部27sに加えて、領域指定部24をさらに備える。領域指定部24は、対象画像データのうち変換処理を行う対象領域を指定する。典型的には、情報処理装置20は、対象画像データを、原稿の頁ごとに分けて受信する。領域指定部24は、原稿の頁に対応する対象画像データごとに変換処理を行う対象領域を指定する。
領域指定部24は、画像読取装置10から受信するすべての対象画像データについて変換処理を行う対象領域を指定してもよい。あるいは、領域指定部24は、対象画像データに応じて、変換処理を行う対象領域を指定してもよい。例えば、領域指定部24は、画像読取装置10からの指定信号に基づいて、対象画像データのうち変換処理を行う対象領域を指定してもよい。
例えば、変換処理を行う対象領域が指定された場合、第1変換処理部22aおよび第2変換処理部22bのうちの選択された変換処理部は、対象画像データのうちの指定された対象領域について文字コードに変換する。
一例では、画像読取装置10のユーザーは、原稿の文字に合わせて、第1変換処理部22aおよび第2変換処理部22bのいずれで変換処理を行うかを指定してもよい。例えば、原稿の第1領域に記載される文字は、第1変換処理部22aの認識率よりも第2変換処理部22bの認識率が高いと想定される場合、選択部22cは、原稿の第1領域に相当する対象画像データを処理する場合、第1変換処理部22aを選択する。一方、原稿の第2領域に記載される文字は、第2変換処理部22bの認識率よりも第1変換処理部22aの認識率が高いと想定される場合、選択部22cは、原稿の第2領域に相当する対象画像データを処理する場合、第2変換処理部22bを選択する。
なお、画像読取装置10が原稿を読み取る場合、同じ原稿であっても、生成された画像データが同一にならないことがある。例えば、画像読取装置10において原稿自動送り装置(Auto Document Feeder:ADF)を利用して原稿を読み取る場合、読み取り状況に応じて画像データが変動することがある。このため、原稿には特定の基準マークが付されており、情報処理装置20は、基準マークを基準として対象画像データのうちの対象領域を指定してもよい。
以下、図5および図6を参照して、本実施形態の情報処理システム100における情報処理装置20の領域指定について説明する。図6は、領域の指定された対象画像データを示す模式図である。ここでは、原稿は請求書であり、対象画像データは、請求書を読み取ったものである。
図6に示すように、対象画像データには領域R1、R2が指定されている。領域R1は、請求書の請求先欄に対応して指定されている。また、領域R2は、請求書の請求額に対応して指定されている。
情報処理装置20の第1変換処理部22aおよび第2変換処理部22bのいずれかが領域R1について変換処理することにより、請求先を示す文字コードデータを生成できる。また、第1変換処理部22aおよび第2変換処理部22bのいずれかが領域R2について変換処理することにより、請求額を示す文字コードデータを生成できる。
なお、原稿の請求書には基準マークMが記載されているため、領域指定部24は、基準マークMを基準として、対象画像データに対して領域R1、R2を設定できる。このため、原稿を読み取る際に多少変動した画像データが生成されても、所定の領域を高精度に変換処理できる。
なお、対象画像データの変換処理を行う対象領域を指定する場合、原稿が予め対象領域に対応していたものとは異なると、対象領域についての変換処理結果は実質的な意味をなさないことがある。例えば、第1変換処理部22aおよび第2変換処理部22bのいずれかが領域指定部24で指定された対象領域について変換処理を行った結果、認識率が低い場合、対象画像データの元となった原稿が所定のものではない可能性がある。このため、記憶部27sは、認識率の低い文字コードデータと、認識率の高い文字コードデータとを分けて記憶し、情報処理装置20は、認識率の高い文字コードデータのみを出力してもよい。
なお、図1〜図6を参照した上述の説明では、選択部22cは、予め定められた手順に従って第1変換処理部22aおよび第2変換処理部22bのいずれかを選択したが、本実施形態はこれに限定されない。選択部22cは、対象画像データを生成した画像読取装置10からの指定に基づいて、第1変換処理部22aおよび第2変換処理部22bのいずれかを選択してもよい。
図7を参照して、本実施形態の情報処理システム100を説明する。図7は、情報処理システム100の模式図である。情報処理システム100は、画像読取装置10と、情報処理装置20とを備える。図7の情報処理システム100は、画像読取装置10が表示部18および入力部18aをさらに備える点を除いて、図7を参照して上述した情報処理システム100と同様の構成を有している。このため、冗長を避けるために重複する説明を省略する。
画像読取装置10は、読取部12、通信部16および制御部17に加えて、表示部18と、入力部18aとを備える。制御部17は、読取部12、通信部16、表示部18および入力部18aを制御する。
表示部18は、ディスプレーを有する。例えば、ディスプレーは液晶ディスプレーまたは有機ELディスプレーを含む。
入力部18aは、ユーザーの指示の入力を受け付ける。入力部18aは、キーボードおよびマウスを含む。あるいは、入力部18aは、タッチセンサーを含み得る。なお、表示部18および入力部18aは、両者の一体化されたタッチパネルであってもよい。
入力部18aは、原稿を読み取った対象画像データOGを変換する変換処理部を指定するための情報を入力できる。ユーザーは、入力部18aにより、情報処理装置20の第1変換処理部22aが対象画像データOGを変換処理するように第1変換処理部22aを指定できる。この場合、通信部16は、情報処理装置20の通信部26に、第1変換処理部22aが指定されたことを示す指定信号を送信する。指定信号の送信は、対象画像データOGの送信の直前、同時、または直後であってもよい。
あるいは、ユーザーは、入力部18aにより、情報処理装置20の第2変換処理部22bが対象画像データOGを変換処理するように第2変換処理部22bを指定できる。この場合、通信部16は、情報処理装置20の通信部26に、第2変換処理部22bが指定されたことを示す指定信号を送信する。指定信号の送信は、対象画像データOGの送信の直前、同時、または直後であってもよい。
情報処理装置20は、第1変換処理部22aと、第2変換処理部22bと、選択部22cと、通信部26と、制御部27と、記憶部27sとを備える。記憶部27sは、認識率情報27tおよび閾値情報27uを記憶する。
認識率情報27tは、変換処理ごとの認識率に分かれている。詳細には、認識率情報27tは、第1変換処理部22aによる第1認識率と、第2変換処理部22bによる第2認識率とに分かれている。さらに、認識率情報27tは、ワークフローごとの認識率に分かれていることが好ましい。この場合、原稿の書式が同じであるため、過去の認識率を用いた判定が妥当となる蓋然性が高い。
閾値情報27uは、ワークフローごとの閾値に分かれていることが好ましい。例えば、原稿に記載された多くの数字を変換処理する場合、閾値は低くてもよい。あるいは、原稿に記載された多くの文章を変換処理する場合、閾値は高いことが好ましい。このように、原稿に記載された文字の種類に応じて、用いる閾値を異ならせてもよい。
本実施形態によれば、画像読取装置10が、原稿を読み取った画像データを変換する変換処理部を選択できる。このため、画像読取装置10のユーザーは、ユーザーの要望にしたがって情報処理装置20のいずれの変換処理部で原稿を読み取った画像データを変換処理するかを決定できる。
画像読取装置10は、ユーザーが情報処理装置20のいずれの変換処理部で変換処理をするかを指定する前に、ユーザーに変換処理についての情報を表示することが好ましい。表示部18は、情報処理装置20の第1変換処理部22aおよび第2変換処理部22bのいずれかを選択する前に変換処理についての情報を表示する。
この場合、画像読取装置10は、表示部18が変換処理についての情報を表示する前に、変換処理についての情報を情報処理装置20から読み出すことが好ましい。画像読取装置10の通信部16は、情報処理装置20の通信部26に、記憶部27sの認識率情報27tを送信するように要求する。通信部26は、通信部16からの要求にしたがって認識率情報27tを通信部26に送信する。このため、表示部18は、認識率情報27tを表示できる。
次に、図8を参照して本実施形態の画像読取装置10における情報処理部の指定について説明する。図8(a)〜図8(c)は、画像読取装置10の表示部18の表示画面の模式図である。
図8(a)は、原稿Rの読取変換処理を開始する際の表示部18の表示画面の模式図である。図8(a)に示すように、表示部18の表示画面は、複数のブロックを表示する。表示部18は、上方に左右方向に並んだ4つのブロックを表示するともに、下方に左右方向に並んだ4つのブロックを表示し、合計8つのブロックを表示する。上方左端のブロックには、ワークフロー1として「A社請求書」と表示されている。ユーザーが入力部18aを介してこのブロックを選択すると、画像読取装置10の通信部16は情報処理装置20の通信部26と通信して、情報処理装置20の記憶部27sから「A社請求書」に関する情報を読み出して、表示部18の表示画面に表示する。
なお、図8(a)に示すように、表示部18の上方には、左端のブロックと同様に、左から順番に、ワークフロー2、ワークフロー3およびワークフロー4に対応するブロックが表示される。ワークフロー2は「A社見積書」に対応し、ワークフロー3は「A社発注書」に対応し、ワークフロー4は「B社請求書」に対応している。
さらに、表示部18の表示画面の下方には左から順番に、ワークフロー5、ワークフロー6、ワークフロー7、およびワークフロー8に対応するブロックが表示される。ワークフロー5は「B社見積書」に対応し、ワークフロー6は「C社見積書」に対応し、ワークフロー7は「交通費精算」に対応し、ワークフロー8は「領収書」に対応する。
例えば、画像読取装置10のユーザーが、交通費精算に関する原稿を読み取る場合、画像読取装置10のユーザーは、入力部18aを介してワークフロー7のブロックを選択する。ワークフロー7のブロックが選択されると、通信部16は、情報処理装置20の通信部26を介して、情報処理装置20の記憶部27sに記憶された交通費精算に関する認識率を読み出す。画像読取装置10の表示部18は、読み出した認識率を表示画面に表示する。
図8(b)は、ワークフロー7が選択された場合の表示部18の表示画面を示す模式図である。図8(b)に示すように、表示部18は、変換処理情報、読取解像度、原稿サイズ、原稿向き、および、文字コードデータの出力先を設定するための表示画面を表示する。
変換処理情報には、選択可能な変換処理部と、その費用および認識率を表示する。ここでは、情報処理装置20は、使用毎には料金の課されない第1変換処理部22aおよび使用毎に料金の課される第2変換処理部22bを備えるため、表示部18は、変換処理情報として第1変換処理部22aおよび第2変換処理部22bを表示しており、第2変換処理部22bの横には「有償」と付されている。また、変換処理情報は、第1変換処理部22aおよび第2変換処理部22bが過去に交通費精算に関する原稿を読み取った際の平均認識率を含む。なお、平均認識率は、過去の交通費精算に関するすべての原稿の平均認識率であってもよい。あるいは、平均認識率は、過去の1カ月間の交通費精算に関する原稿の平均認識率であってもよい。
図8(b)では、第1変換処理部22aの平均認識率は75%であり、第2変換処理部22bの平均認識率は80%である。
画像読取装置10のユーザーは、変換処理情報から、第1変換処理部22aおよび第2変換処理部22bを選択できる。例えば、ユーザーは、第1変換処理部22aに対応する領域をタッチすることにより、第1変換処理部22aを選択できる。また、ユーザーは、第2変換処理部22bに対応する領域をタッチすることにより、第2変換処理部22bを選択できる。
表示部18は、読取解像度の候補として複数の読取解像度を表示する。読取解像度の候補は、300×300、600×600、1200×1200である。画像読取装置10のユーザーは、読取解像度から、読取解像度を選択できる。例えば、ユーザーは、読取部12の読取解像度として、300×300を選択できる。読取処理を行う場合、読取部12は、選択された読取解像度で原稿を読み取って対象画像データを生成する。その後、対象画像データは、通信部16から情報処理装置20の通信部26に送信される。
表示部18は、原稿サイズの候補を表示する。ここでは、原稿サイズの候補は、A3、A4、A5である。画像読取装置10のユーザーは、原稿サイズの候補から、原稿のサイズを選択する。例えば、原稿のサイズがA4である場合、ユーザーは、原稿のサイズとしてA4を選択する。読取処理を行う場合、読取部12は、選択されたサイズで原稿を読み取って対象画像データを生成する。
表示部18は、原稿の向きを表示する。ここでは、原稿の向きは、縦または横である。原稿の向きが縦である場合、原稿の長手方向が、読取部12の主走査方向に延びて配置されるように設定される。原稿の向きが横である場合、原稿の長手方向が、読取部12の副走査方向に延びて配置されるように設定される。例えば、原稿の長手方向が主走査方向に沿って配置される場合、ユーザーは、原稿の向きを縦と選択する。読取処理を行う場合、読取部12は、選択された向きおよびサイズの領域で原稿を読み取って対象画像データを生成する。
表示部18は、文字コードデータの出力先を表示する。情報処理装置20において対象画像データから変換された文字コードデータは、指定された出力先に送信される。ここでは、文字コードデータは、電子メールにて、所定のアドレスに向けて出力される。
上述したように、情報処理装置20における第1変換処理部22aは使用に応じて料金が課されない一方で、第2変換処理部22bは使用に応じて料金が課されることがある。この場合、費用の増大を防ぐために、第1変換処理部22aの過去の認識率が比較的高い場合、今回の原稿の画像データを第1変換処理部22aで変換処理しても、認識率は比較的高くなる蓋然性が高い。この場合、第2変換処理部22bが選択されないように、表示部18は第2変換処理部22bをグレーアウトに表示してもよい。
図8(c)は、ワークフロー1が選択された場合の表示部18の表示画面を示す模式図である。図8(c)は、選択されたワークフローおよび平均認識率を除き、図8(b)と同様であるため、重複する説明を省略する。
なお、図8(c)では、第1変換処理部22aの平均認識率は80%であり、第2変換処理部22bの平均認識率は85%である。このように、ワークフロー1の「A社請求書」では、第1変換処理部22aの平均認識率が比較的高い。したがって、第2変換処理部22bを使用するまでもなく第1変換処理部22aによって原稿の画像データを高い認識率で文字データに変換できる可能性が高い。このため、表示部18は、第2変換処理部22bをグレーアウトに表示している。これにより、画像読取装置10のユーザーは、第2変換処理部22bではなく第1変換処理部22aを選択するため、費用の発生を抑制できる。
次に、図1、図7から図9を参照して、本実施形態の画像読取装置10による情報処理方法を説明する。図9は、本実施形態の画像読取装置10の情報処理方法のフロー図である。
まず、ステップS202において、画像読取装置10は、原稿の読取変換処理のための表示画面を表示する。詳細には、画像読取装置10のユーザーが入力部18aに文字認識処理を開始するよう入力すると、表示部18は、文字認識処理のための表示画面を表示する。例えば、表示部18は、図8(a)に示した表示画面を表示する。
ステップS204において、画像読取装置10のユーザーは、文字認識処理のための表示画面のうちの特定のワークフローを選択する。
ステップS206において、通信部16は、特定のワークフローについての情報を読み出すように要求を情報処理装置20に送信する。
ステップS208において、通信部16は、特定のワークフローについての情報を情報処理装置20から受信する。例えば、通信部16は、特定のワークフローについての平均認識率を受信する。
ステップS210において、表示部18は、特定のワークフローについての情報を表示する。例えば、表示部18は、図8(b)に示した表示画面を表示する。
ステップS212において、制御部17は、入力部18aに入力があるか否かを判定する。入力部18aに入力がないと判定される場合(ステップS212においてNo)、処理はステップS212に戻り、入力部18aに入力があるまで待機する。
制御部17が入力部に入力があると判定する場合(ステップS212においてYes)、ステップS214に進む。
ステップS214において、読取部12は、入力部18aからの入力にしたがって原稿を読み取り、対象画像データを生成する。
ステップS216において、通信部16は、対象画像データを情報処理装置20に送信する。また、通信部16は、第1変換処理部22aおよび第2変換処理部22bのいずれかを指定した指定信号を情報処理装置20に送信する。以上のようにして、画像読取装置10による情報処理方法を終了する。
このようにして、画像読取装置10は、原稿の対象画像データとともに第1変換処理部22aおよび第2変換処理部22bのいずれかを指定した指定信号を情報処理装置20に送信する。その後、情報処理装置20において、指定信号で指定された変換処理部が対象画像データを文字コードデータに変換する。例えば、情報処理装置20は、図2を参照して上述したように、対象画像データを文字コードデータに変換する。したがって、画像読取装置10のユーザーは、ユーザーの要望に応じて原稿を文字コードデータに変換できる。
なお、上述したように、画像読取装置10からの指定信号によって第1変換処理部22aが指定されている場合、第1変換処理部22aは、対象画像データを文字コードデータに変換する一方で、第2変換処理部22bは、対象画像データを文字コードデータに変換しない。第2変換処理部22bが変換処理を行わないことにより、新たな費用の発生を抑制できる。
上述したように、画像読取装置10のユーザーは、画像読取装置10において原稿の対象画像データを変換処理するための情報処理部を指定できる。なお、図7〜図9を参照した上述の説明では、画像読取装置10において指定された情報処理部が対象画像データを文字コードデータに変換したが、本実施形態はこれに限定されない。画像読取装置10において指定された情報処理部が対象画像データを文字コードデータに変換して出力する一方で、画像読取装置10において指定されなかった情報処理部が対象画像データを文字コードデータに変換してもよい。例えば、画像読取装置10からの指定信号の内容にかかわらず、情報処理装置20の第1変換処理部22aは、対象画像データを文字コードデータに変換してもよい。
本実施形態の情報処理システム100において、第1変換処理部22aは、画像読取装置10からの指定信号の内容にかかわらず、対象画像データを文字コードデータに変換する。第1変換処理部22aは、画像読取装置10からの指定信号によって第1変換処理部22aが指定されている場合、第1変換処理部22aは、対象画像データを文字コードデータに変換する。
詳細には、画像読取装置10からの指定信号が第2変換処理部22bを指定する場合、第2変換処理部22bは、対象画像データOGを文字コードデータCD2に変換し、文字コードデータCD2を出力する。一方、本実施形態では、画像読取装置10からの指定信号が第2変換処理部22bを指定している場合でも、第1変換処理部22aは、対象画像データOGを文字コードデータCD1に変換する。ただし、この場合、文字コードデータCD1は出力されないが、対象画像データOGを文字コードデータCD1に変換する際の第1認識率が取得される。記憶部27sは、対象画像データOGの第1変換処理時の第1認識率を用いて、認識率を更新する。第1変換処理部22aが対象画像データOGを変換処理することにより、新たな費用を発生させることなく、より正確な認識率を取得できる。
次に、図10を参照して、本実施形態の情報処理装置20による情報処理方法を説明する。図10は、本実施形態の情報処理装置20の情報処理方法のフロー図である。図10のフロー図は、画像読取装置10からの指定信号の指定内容にかかわらず、第1変換処理部22aが対象画像データを文字コードデータに変換する点を除いて、図2を参照してフロー図と同様である。このため、冗長を避けるために重複する説明を省略する。
まず、ステップS102において対象画像データを受信する。画像読取装置10は、原稿を読み取って対象画像データOGを生成し、対象画像データOGを情報処理装置20に送信する。情報処理装置20は、対象画像データを画像読取装置10から受信する。
ステップS104aにおいて、選択部22cは、指定信号において第1変換処理部22aが指定されているかを判定する。第1変換処理部22aが指定されている場合(ステップS104aにおいてYes)、ステップS104bに進む。ステップS104bにおいて、選択部22cは、第1変換処理部22aを選択する。
その後、ステップS106aにおいて、第1変換処理部22aは、対象画像データOGを文字コードデータCD1に変換する。この場合、第1変換処理部22aが第1変換処理をする一方で、第2変換処理部22bは第2変換処理しない。
その後、ステップS108aにおいて、記憶部27sは、文字コードデータCD1を記憶する。なお、文字コードデータCD1は、必要に応じて出力される。その後、処理は終了する。
また、第1変換処理部22aが指定されていない場合(ステップS104aにおいてNo)、ステップS104cに進む。ステップS104cにおいて、選択部22cは、第1変換処理部22aとともに第2変換処理部22bを選択する。
その後、ステップS106bにおいて、第1変換処理部22aが対象画像データOGを文字コードデータCD1に変換するとともに、第2変換処理部22bが対象画像データOGを文字コードデータCD2に変換する。
その後、ステップS108bにおいて、記憶部27sは、文字コードデータCD2を記憶する。なお、文字コードデータCD2は、必要に応じて出力される。一方、記憶部27sは、文字コードデータCD1を記憶せず、文字コードデータCD1は出力されない。ただし、記憶部27sは、対象画像データOGを第1変換処理した際の第1認識率を記憶する。例えば、記憶部27sは、第1変換処理部22aによる第1変換処理時の認識率を更新する。その後、処理は終了する。
図7〜図10を参照した上述の説明では、記憶部27sは、第1認識率および第2認識率を記憶していたが、本実施形態はこれに限定されない。記憶部27sは、第1変換処理部22aによる第1文字コードデータと第1変換処理部22aによる第2文字コードデータとの一致率を記憶していてもよい。
以下、図11を参照して本実施形態の情報処理システム100を説明する。図11は、本実施形態の情報処理システム100の模式図である。図11の情報処理システム100は、情報処理装置20が比較部25をさらに備える点を除いて、図7を参照して上述した情報処理システム100と同様の構成を有している。このため、冗長を避けるために重複する説明を省略する。
情報処理装置20は、第1変換処理部22a、第2変換処理部22b、選択部22c、通信部26、制御部27、記憶部27sに加えて比較部25をさらに備える。比較部25は、文字コードデータCD1および文字コードデータCD2が生成された場合に、文字コードデータCD1と文字コードデータCD2とを比較する。比較部25は、比較結果に基づいて、文字コードデータCD1と文字コードデータCD2との一致率を生成する。文字コードデータCD1が文字コードデータCD2と等しい場合、一致率は100%である。また、文字コードデータCD1が文字コードデータCD2と完全に異なる場合、一致率は0%である。
記憶部27sは、一致率情報17vを記憶する。また、記憶部27sは、一致率を判定するための閾値を記憶してもよい。一致率情報は、画像読取装置10の表示部18に表示されてもよい。
図12は、ワークフロー7が選択された場合の表示部18の表示画面を示す模式図である。図12に示すように、表示部18は、変換処理情報、読取解像度、原稿サイズ、原稿向き、および、文字コードデータの出力先を設定するための表示画面を表示する。なお、図12の表示画面は、変換処理情報として一致率が表示されている点を除いて、図8(b)に示した表示画面と同様である。このため、冗長を避けるために重複する説明を省略する。
図12(a)は、ワークフロー7が選択された場合の表示部18の表示画面を示す模式図である。図12(a)に示すように、変換処理情報として一致率が表示されている。ここでは、一致率は、過去の交通費精算に関する書類を読み取った際の文字コードデータCD1と文字コードデータCD2との一致率を示す。図12(a)において、一致率は98%である。
図12(b)は、ワークフロー1が選択された場合の表示部18の表示画面を示す模式図である。図12(b)に示すように、変換処理情報として一致率が表示されている。ここでは、一致率は、過去のA社請求書に関する書類を読み取った際の文字コードデータCD1と文字コードデータCD2との一致率を示す。図12(b)において、一致率は100%である。この場合、少なくとも過去のA社請求書に関しては、第1変換処理部22aによる第1変換処理で充分であり、第2変換処理部22bによる第2変換処理までは不要であったことが理解される。このように、画像読取装置10のユーザーは、一致率の観点から情報処理装置20の第1変換処理部22aではなく第2変換処理部22bを使用する意義があるか否かを判断できる。
上述したように、一致率は100%である場合、第2変換処理部22bを使用するまでもない。このため、図12(b)に示すように、第2変換処理部22bが選択されないように、表示部18は第2変換処理部22bをグレーアウトに表示してもよい。また、一致率が一致率閾値よりも高い場合、表示部18は、第2変換処理部22bをグレーアウトに表示してもよい。
本実施形態によれば、画像読取装置10のユーザーは、画像読取装置10において原稿の対象画像データを変換処理するための情報処理部を指定できる。なお、図7〜図9を参照した上述の説明では、画像読取装置10において指定された情報処理部が対象画像データを文字コードデータに変換したが、本実施形態はこれに限定されない。画像読取装置10において指定された情報処理部が対象画像データを文字コードデータに変換して出力として用いる一方で、画像読取装置10において指定されなかった情報処理部が対象画像データを文字コードデータに変換してもよい。
なお、図1〜図12を参照した上述の説明では、情報処理装置20は、画像データを文字コードデータに変換したが、本実施形態はこれに限定されない。情報処理装置20は、画像データの二次元コードを抽出して処理可能であってもよい。
また、図1〜図12を参照して上述した説明では、情報処理装置20は、画像読取装置10において原稿を読み取った対象画像データOGを受信したが、本実施形態はこれに限定されない。情報処理装置20は、別の機器から対象画像データOGを受信してもよい。例えば、情報処理装置20に対象画像データを送信する装置は、ファクス装置であってもよく、パーソナルコンピューター(Personal Computer:PC)またはスマートフォン(Smart Phone)等の別の情報処理装置であってもよい。また、情報処理装置20は、電子メールに添付された画像データを処理してもよい。あるいは、情報処理装置20は、ファクス通信を介して受信した画像データを処理してもよい。
次に、図1および図13を参照して、本実施形態の情報処理システムを説明する。図13は、本実施形態の情報処理システム100の模式図である。
情報処理装置20は、複合機、サーバーまたは情報処理端末から対象画像データOGを受信してもよい。また、情報処理装置20は、電子メールとして対象画像データOGを受信してもよい。
情報処理装置20は、対象画像データOGを文字コードデータに変換可能であるとともに二次元コードを抽出して読み取り可能である。情報処理装置20は、変換した文字コードデータおよび読み取った二次元コードに示されるデータを記憶する。また、情報処理装置20は、変換した文字コードデータおよび読み取った二次元コードに示されるデータをメタデータとして記憶してもよい。例えば、データのフォーマットは、XML、PDF、文書作成ソフトウェア、表計算ソフトウェアおよびプレゼンテーションソフトウェアのいずれの形式であってもよい。
情報処理装置20は、処理されたデータを所定の記憶素子に記憶してもよい。例えば、情報処理装置20は、処理されたデータを情報処理装置20の記憶素子に記憶してもよい。あるいは、情報処理装置20は、処理されたデータを記憶可能な外部装置に処理されたデータを出力してもよい。または、情報処理装置20は、処理されたデータを電子メールとして外部装置に送信してもよい。例えば、情報処理装置20は、外部データベースまたはクラウトストレージに送信してもよい。あるいは、情報処理装置20は、画像データを生成した画像読取装置10に処理されたデータを送信してもよい。
また、画像読取装置10において情報処理装置20のワークフローを設定してもよい。この場合、画像読取装置10にインストールされたアプリケーションを利用できる。
また、図1〜図13を参照して上述した説明では、情報処理装置20は、画像データを文字コードデータに変換したが、本実施形態はこれに限定されない。情報処理装置20は、文字コードデータを別の文字コードデータに変換してもよい。あるいは、情報処理装置20は、文字コードデータに電子署名を付してもよい。
以上、図面を参照しながら本発明の実施形態について説明した。ただし、本発明は、上記の実施形態に限定されるものではなく、その要旨を逸脱しない範囲で種々の態様において実施することが可能である。また、上記の実施形態に開示されている複数の構成要素を適宜組み合わせることによって、種々の発明の形成が可能である。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。図面は、理解しやすくするために、それぞれの構成要素を主体に模式的に示しており、図示された各構成要素の厚さ、長さ、個数、間隔等は、図面作成の都合上から実際とは異なる場合もある。また、上記の実施形態で示す各構成要素の材質、形状、寸法等は一例であって、特に限定されるものではなく、本発明の効果から実質的に逸脱しない範囲で種々の変更が可能である。
本発明は、情報処理装置および情報処理システムに関するものであり、産業上の利用可能性を有する。
10 画像読取装置
20 情報処理装置
100 情報処理システム

Claims (11)

  1. 原稿を読み取って対象画像データを生成する画像読取装置と、
    前記対象画像データを処理する情報処理装置と
    を備える、情報処理システムであって、
    前記情報処理装置は、
    画像データを文字コードデータに変換可能な第1変換処理部と、
    画像データを文字コードデータに変換可能な第2変換処理部と、
    前記第1変換処理部および前記第2変換処理部のいずれが前記対象画像データを文字コードに変換するかを選択する選択部と
    を含む、情報処理システム。
  2. 前記第2変換処理部は、前記第1変換処理部よりも高い認識率で前記画像データを前記文字コードデータに変換する、請求項1に記載の情報処理システム。
  3. 前記第2変換処理部は、使用量に応じて使用料が増加するように設定されている、請求項1または2に記載の情報処理システム。
  4. 前記第1変換処理部は、使用量に応じて使用料が変化しないように設定されている、請求項1から3のいずれかに記載の情報処理システム。
  5. 前記選択部は、前記第1変換処理部を選択した後、前記第1変換処理部が前記対象画像データを第1文字コードデータに変換した際の認識率に基づいて、前記第2変換処理部が前記対象画像データを第2文字コードデータに変換するか否かを判定する、請求項1から4のいずれかに記載の情報処理システム。
  6. 前記選択部で選択された前記第1変換処理部および前記第2変換処理部の少なくとも一方が、前記対象画像データのうちの文字コードに変換する領域を指定する領域指定部をさらに備える、請求項1から5のいずれかに記載の情報処理システム。
  7. 前記画像読取装置は、前記第1変換処理部および前記第2変換処理部のいずれが前記対象画像データを文字コードに変換するかを指定する、請求項1から6のいずれかに記載の情報処理システム。
  8. 前記画像読取装置は、前記第1変換処理部の過去の変換結果と前記第2変換処理部の過去の変換結果との一致率を示す一致率情報を表示する、請求項1から7のいずれかに記載の情報処理システム。
  9. 画像データを文字コードデータに変換可能な第1変換処理部と、
    画像データを文字コードデータに変換可能な第2変換処理部と、
    対象画像データを受信する通信部と、
    前記第1変換処理部および前記第2変換処理部のいずれが前記対象画像データを文字コードに変換するかを選択する選択部と
    を備える、情報処理装置。
  10. 前記選択部は、前記第1変換処理部を選択した後、前記第1変換処理部が前記対象画像データを第1文字コードデータに変換した際の認識率に基づいて、前記第2変換処理部が前記対象画像データを第2文字コードデータに変換するか否かを判定する、請求項9に記載の情報処理装置。
  11. 前記通信部は、前記対象画像データを送信元から受信し、
    前記選択部は、前記送信元からの指定に基づいて、前記第1変換処理部および前記第2変換処理部のいずれが前記対象画像データを文字コードに変換するか選択する、請求項9または10に記載の情報処理装置。
JP2019026604A 2019-02-18 2019-02-18 情報処理装置および情報処理システム Active JP7298178B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019026604A JP7298178B2 (ja) 2019-02-18 2019-02-18 情報処理装置および情報処理システム
US16/794,024 US11367269B2 (en) 2019-02-18 2020-02-18 Information processing device and information processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019026604A JP7298178B2 (ja) 2019-02-18 2019-02-18 情報処理装置および情報処理システム

Publications (2)

Publication Number Publication Date
JP2020135296A true JP2020135296A (ja) 2020-08-31
JP7298178B2 JP7298178B2 (ja) 2023-06-27

Family

ID=72263171

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019026604A Active JP7298178B2 (ja) 2019-02-18 2019-02-18 情報処理装置および情報処理システム

Country Status (1)

Country Link
JP (1) JP7298178B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002366899A (ja) * 2001-06-06 2002-12-20 Toppan Printing Co Ltd 文字情報認識方法および文字情報認識装置
JP2008181383A (ja) * 2007-01-25 2008-08-07 Konica Minolta Business Technologies Inc 文字認識装置、文字認識装置の制御方法、および文字認識装置の制御プログラム
JP2015018361A (ja) * 2013-07-10 2015-01-29 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2017216505A (ja) * 2016-05-30 2017-12-07 京セラドキュメントソリューションズ株式会社 画像形成装置および管理アプリケーション
JP2019008697A (ja) * 2017-06-28 2019-01-17 コニカミノルタ株式会社 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002366899A (ja) * 2001-06-06 2002-12-20 Toppan Printing Co Ltd 文字情報認識方法および文字情報認識装置
JP2008181383A (ja) * 2007-01-25 2008-08-07 Konica Minolta Business Technologies Inc 文字認識装置、文字認識装置の制御方法、および文字認識装置の制御プログラム
JP2015018361A (ja) * 2013-07-10 2015-01-29 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2017216505A (ja) * 2016-05-30 2017-12-07 京セラドキュメントソリューションズ株式会社 画像形成装置および管理アプリケーション
JP2019008697A (ja) * 2017-06-28 2019-01-17 コニカミノルタ株式会社 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム

Also Published As

Publication number Publication date
JP7298178B2 (ja) 2023-06-27

Similar Documents

Publication Publication Date Title
JP6891073B2 (ja) スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
JP5187057B2 (ja) レイアウト印刷システム、レイアウト文書閲覧方法、及びプログラム
JP6953230B2 (ja) スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
JP6968647B2 (ja) スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム
JP5712487B2 (ja) 画像処理装置、画像処理システム、画像処理方法、及びプログラム
US10528679B2 (en) System and method for real time translation
CN109961069B (zh) 图像处理装置以及存储介质
JP2007042106A (ja) 文書処理方法、文書処理メディア、文書管理方法、文書処理システム及び文書管理システム
JP5005787B2 (ja) 文書データ管理装置
CN106326332B (zh) 检索装置以及检索方法
US9614984B2 (en) Electronic document generation system and recording medium
US11321558B2 (en) Information processing apparatus and non-transitory computer readable medium
US20200174637A1 (en) Device, method, and storage medium
JP4631900B2 (ja) 情報処理装置、情報処理システム、および情報処理プログラム
JP2007148486A (ja) 文書閲覧支援方法および文書閲覧支援システム並びに文書処理装置およびプログラム
JP4541770B2 (ja) 画像処理装置及びその制御方法、プログラム
JP7298178B2 (ja) 情報処理装置および情報処理システム
JP2020135295A (ja) 情報処理システム
US11367269B2 (en) Information processing device and information processing system
JP2018007085A (ja) 情報処理装置、画像処理装置およびプログラム
JP2022014856A (ja) Ocr認識精度向上支援システム及びプログラム
US20220269855A1 (en) Information generation system, workflow system, computer-readable non-transitory recording medium storing information generation program, and computer-readable non-transitory recording medium storing workflow program
US10609246B1 (en) System and method for ascertaining and printing supplemental forms identified from content of a scanned base form
JP2009199404A (ja) 情報処理システム及びプログラム
JP7388411B2 (ja) 情報処理システム、通信システム、情報処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230412

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230516

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230529

R150 Certificate of patent or registration of utility model

Ref document number: 7298178

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150