JP6606890B2 - 情報処理装置及び情報処理プログラム - Google Patents

情報処理装置及び情報処理プログラム Download PDF

Info

Publication number
JP6606890B2
JP6606890B2 JP2015136665A JP2015136665A JP6606890B2 JP 6606890 B2 JP6606890 B2 JP 6606890B2 JP 2015136665 A JP2015136665 A JP 2015136665A JP 2015136665 A JP2015136665 A JP 2015136665A JP 6606890 B2 JP6606890 B2 JP 6606890B2
Authority
JP
Japan
Prior art keywords
character recognition
image
value
recognition processing
service providing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015136665A
Other languages
English (en)
Other versions
JP2017021459A (ja
Inventor
洋平 内海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2015136665A priority Critical patent/JP6606890B2/ja
Publication of JP2017021459A publication Critical patent/JP2017021459A/ja
Application granted granted Critical
Publication of JP6606890B2 publication Critical patent/JP6606890B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、情報処理装置及び情報処理プログラムに関する。
特許文献1には、ネットワークを介して接続された外部サーバーに画像データの処理を依頼することが可能な画像処理装置において、画像処理を効率的に行えるようにすることを課題とし、画像処理装置は、外部サーバーから画像処理用プログラムをダウンロードする受信手段と、前記プログラムを当該画像処理装置において実行する画像処理手段と、外部サーバーに画像データの処理を依頼する送信手段と、所定条件により、画像処理手段と外部サーバーのいずれで画像データの処理を行うかを切り換える切換手段とを備えることが開示されている。
特開2003−036435号公報
本発明は、通信可能な複数の文字認識処理装置のうち、いずれかの文字認識処理装置に文字認識処理を行わせる場合にあって、対象となっている画像の特徴に応じて、画像に対して文字認識処理を行わせる文字認識処理装置を決定するようにした情報処理装置及び情報処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、画像の特徴を検出する検出手段と、通信可能な複数の文字認識処理装置のうち、前記特徴に応じて、前記画像に対して文字認識処理を行わせる文字認識処理装置を決定する決定手段と、前記画像を前記決定手段によって決定された文字認識処理装置に送信する送信手段を具備し、前記検出手段は、前記特徴として、前記画像の色度の統計値、色度又は彩度の分布値を検出することを特徴とする情報処理装置である。
請求項2の発明は、前記送信手段によって画像を送信した文字認識処理装置から、文字認識処理の結果を受信する受信手段をさらに具備し、前記決定手段は、前記受信手段によって受信された結果に基づいて、前記画像に対して文字認識処理を行わせる文字認識処理装置を決定することを特徴とする請求項1に記載の情報処理装置である。
請求項3の発明は、前記決定手段は、前記特徴と各文字認識処理装置の重み付け値で算出した値が、通信可能な複数の文字認識処理装置の該値の合計値に占める割合に応じて、前記画像に対して文字認識処理を行わせる文字認識処理装置を決定することを特徴とする請求項1又は2に記載の情報処理装置である。
請求項4の発明は、コンピュータを、画像の特徴を検出する検出手段と、通信可能な複数の文字認識処理装置のうち、前記特徴に応じて、前記画像に対して文字認識処理を行わせる文字認識処理装置を決定する決定手段と、前記画像を前記決定手段によって決定された文字認識処理装置に送信する送信手段として機能させ、前記検出手段は、前記特徴として、前記画像の色度の統計値、色度又は彩度の分布値を検出する情報処理プログラムである。
請求項1の情報処理装置によれば、通信可能な複数の文字認識処理装置のうち、いずれかの文字認識処理装置に文字認識処理を行わせる場合にあって、対象となっている画像の特徴に応じて、画像に対して文字認識処理を行わせる文字認識処理装置を決定することができる。
請求項2の情報処理装置によれば、文字認識処理の結果に基づいて、画像に対して文字認識処理を行わせる文字認識処理装置を決定することができる。
請求項3の情報処理装置によれば、特徴と各文字認識処理装置の重み付け値で算出した値が、通信可能な複数の文字認識処理装置のその値の合計値に占める割合に応じて、画像に対して文字認識処理を行わせる文字認識処理装置を決定することができる。
請求項4の情報処理プログラムによれば、通信可能な複数の文字認識処理装置のうち、いずれかの文字認識処理装置に文字認識処理を行わせる場合にあって、対象となっている画像の特徴に応じて、画像に対して文字認識処理を行わせる文字認識処理装置を決定することができる。
本実施の形態の構成例についての概念的なモジュール構成図である。 本実施の形態を利用したシステム構成例を示す説明図である。 本実施の形態による処理例を示すフローチャートである。 パラメータテーブルのデータ構造例を示す説明図である。 重み付けテーブルのデータ構造例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
本実施の形態である情報処理装置100は、通信可能な複数の文字認識サービス提供装置250のうち、いずれかの文字認識サービス提供装置250に文字認識処理を行わせるものであって、図1の例に示すように、画像特徴検出モジュール105、依頼先決定モジュール110、相関データ記憶モジュール115、パラメータ保存モジュール120を有している。
情報処理装置100は、画像処理装置210、複数の文字認識サービス提供装置250と接続されている。画像処理装置210も複数あってもよい。
画像処理装置210は、ユーザー155の操作にしたがって、文書を読み込んで、文字認識対象となるスキャン画像160を生成する。例えば、スキャナ、ファックス、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)等が該当する。スキャン画像160は、情報処理装置100によって選択された文字認識サービス提供装置250のいずれかによって文字認識される。また、文字認識結果は、例えば、スキャン画像160とともに文書管理装置等に格納される。スキャン画像160は、2値画像、多値画像(カラー画像を含む)であってもよい。受け付ける画像は、1枚であってもよいし、複数枚であってもよい。また、画像の内容として、文字認識の対象となるものであればよく、例えば、ビジネスに用いられる文書、広告宣伝用のパンフレット等であってもよい。
文字認識サービス提供装置250は、複数あり、文字認識処理を行う。各文字認識サービス提供装置250は、それぞれ異なる文字認識処理(アルゴリズム、認識用辞書等を含む)を行うようにしてもよいし、それぞれ異なるハードウェア性能(CPUの処理速度、メモリ容量等)を有していてもよいし、また、情報処理装置100が依頼した時点での処理量がそれぞれ異なっていてもよい。つまり、依頼するスキャン画像160の特徴によって、それぞれが異なる処理結果(文字認識結果の他に、処理時間等を含めてもよい)となってもよい。もちろんのことながら、文字認識処理が同じであるもの、ハードウェア性能が同じであるもの、情報処理装置100が依頼した時点での処理量が同じであるものが含まれていてもよい。
画像特徴検出モジュール105は、依頼先決定モジュール110、画像処理装置210と接続されている。画像特徴検出モジュール105は、画像処理装置210によって生成されたスキャン画像160を受け取って、そのスキャン画像160の特徴を検出する。なお、画像特徴検出モジュール105は、画像処理装置210からスキャン画像160を受け取ることの他に、ハードディスク(情報処理装置100に内蔵されているものの他に、通信回線を介して接続されているもの等を含む)等に記憶されているスキャン画像160を読み出すようにしてもよい。
そして、例えば、画像特徴検出モジュール105は、次のような画像の特徴を抽出する。
(1)外部余白率
スキャン画像160の外周の余白の面積が、スキャン画像160の面積に対して、何%を占めるかを示す特徴である。また、スキャン画像160の外周の余白の幅(又は高さ)が、スキャン画像160の全体の幅(又は高さ)に対して、何%を占めるかを示す特徴としてもよい。なお「外周の余白」とは、スキャン画像160の外側に沿って存在する余白をいう。その余白には、ノイズが含まれていてもよい。
(2)内部余白率
前述の外周の余白を除いて、スキャン画像160内の白色部分が、全体の何%を占めるかを示す特徴である。
(3)色度相対値
スキャン画像160全体における色度の統計値(平均値、最頻値、中央値等)である。具体的には、白黒データ(スキャン画像160が白黒のみからなっている場合)を0、カラフルなサンプルの色度の統計値を100としたときの数値である。ここでのサンプルは、予め定められたスキャン画像160である。
(4)色度分布率
カラフルな部分の分布状況を示す値である。具体的には、全体的にカラフルなら100に近い値となり、一箇所だけがカラフルなら0に近い値となる。
(5)彩度分布率
前述の色度分布率を、彩度で測定する。
(6)フォーマット化率
文字が規則的に並んでいることを数値化したものである。例えば、帳票のように規則的に文字が並んでいるようなスキャン画像160であれば100に近い値となり、ランダムに近い文字配置となっているようなスキャン画像160であれば0に近い値となる。
例えば、画像特徴検出モジュール105は、パラメータテーブル400を生成する。図4は、パラメータテーブル400のデータ構造例を示す説明図である。パラメータテーブル400は、パラメータ項目欄410、評価値欄420を有している。パラメータ項目欄410は、パラメータ項目(前述の6つの画像の特徴)を記憶している。評価値欄420は、その画像の特徴に対応する評価値(画像特徴検出モジュール105によって検出した特徴を示す値)を記憶している。
画像特徴検出モジュール105が検出する特徴として、スキャン画像160は、白黒データであるかカラーデータであるかを示す特徴を用いてもよい。また、スキャン画像160のファイルサイズ、スキャン画像160内の文字数を特徴としてもよい。
依頼先決定モジュール110は、画像特徴検出モジュール105、相関データ記憶モジュール115、文字認識サービス提供装置250と接続されている。依頼先決定モジュール110は、通信可能な複数の文字認識サービス提供装置250のうち、画像特徴検出モジュール105によって検出された特徴に応じて、スキャン画像160に対して文字認識処理を行わせる文字認識サービス提供装置250を決定する。
また、依頼先決定モジュール110は、画像特徴検出モジュール105によって検出された特徴と各文字認識サービス提供装置250の重み付け値で算出した値が、通信可能な複数の文字認識サービス提供装置250のその値の合計値に占める割合に応じて、スキャン画像160に対して文字認識処理を行わせる文字認識サービス提供装置250を決定するようにしてもよい。
そして、依頼先決定モジュール110は、決定した文字認識サービス提供装置250にスキャン画像160を送信する。つまり、その文字認識サービス提供装置250に文字認識処理を依頼する。
なお、情報処理装置100も文字認識処理機能を有しており、選択対象としての文字認識サービス提供装置250の1つとして、情報処理装置100自身を含めるようにしてもよい。
さらに、依頼先決定モジュール110は、文字認識サービス提供装置250を利用するにあたっての利用料金を用いて、文字認識処理を行わせる文字認識サービス提供装置250を決定するようにしてもよい。例えば、文字認識処理を1ページ実施したときに、1ページあたりでかかる(かかった)価格を用いてもよい。
相関データ記憶モジュール115は、依頼先決定モジュール110、パラメータ保存モジュール120と接続されている。相関データ記憶モジュール115は、各文字認識サービス提供装置250における文字認識処理における、画像の特徴との相関関係を示す情報を記憶している。つまり、情報処理装置100が文字認識サービス提供装置250を選択するにあたって、処理対象となる画像の各特徴に対して乗算する重み付け値を記憶している。例えば、重み付けテーブル500を記憶している。図5は、重み付けテーブル500のデータ構造例を示す説明図である。重み付けテーブル500は、文字認識サービス提供装置250A欄510、文字認識サービス提供装置250B欄520、文字認識サービス提供装置250C欄530を有している。文字認識サービス提供装置250A欄510は、文字認識サービス提供装置250Aの重み付け値を記憶している。文字認識サービス提供装置250B欄520は、文字認識サービス提供装置250Bの重み付け値を記憶している。文字認識サービス提供装置250C欄530は、文字認識サービス提供装置250Cの重み付け値を記憶している。
パラメータ保存モジュール120は、相関データ記憶モジュール115、文字認識サービス提供装置250と接続されている。パラメータ保存モジュール120は、依頼先決定モジュール110によってスキャン画像160を送信した文字認識サービス提供装置250から、文字認識処理の結果を受信する。
そして、依頼先決定モジュール110は、パラメータ保存モジュール120によって受信された結果に基づいて、スキャン画像160に対して文字認識処理を行わせる文字認識サービス提供装置250を決定するようにしてもよい。
具体的には、依頼先決定モジュール110は、文字認識処理の結果から各文字認識サービス提供装置250の重み付け値を更新する。そして、その後は、その変更された重み付け値を用いて、依頼先決定モジュール110が、文字認識サービス提供装置250の決定処理を行う。
図2は、本実施の形態を利用したシステム構成例を示す説明図である。
文字認識処理の対象データであるスキャン画像160を生成する画像処理装置210、文字認識処理を行う複数のサーバー250と、文字認識サービス提供装置250への文字認識処理の振り分けを行う情報処理装置100によって構成されているシステムである例を示す。
図2(A)に示す例では、情報処理装置100Aは、画像処理装置210A、画像処理装置210B、画像処理装置210C、文字認識サービス提供装置250A、文字認識サービス提供装置250B、文字認識サービス提供装置250C、文字認識サービス提供装置250Dと接続されている。情報処理装置100Bは、画像処理装置210D、画像処理装置210E、画像処理装置210F、文字認識サービス提供装置250A、文字認識サービス提供装置250B、文字認識サービス提供装置250G、文字認識サービス提供装置250Hと接続されている。情報処理装置100、文字認識サービス提供装置250は、サーバーとして構成してもよいし、情報処理装置100、文字認識サービス提供装置250の機能による機能は、クラウドサービスとして実現してもよい。
図2(B)に示す例では、情報処理装置100A、情報処理装置100B、画像処理装置210A、画像処理装置210B、画像処理装置210C、文字認識サービス提供装置250A、文字認識サービス提供装置250B、文字認識サービス提供装置250C、文字認識サービス提供装置250Dは、通信回線290を介してそれぞれ接続されている。通信回線290は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。また、画像処理装置210内に、情報処理装置100を含んで構成してもよいし、文字認識サービス提供装置250内に情報処理装置100を含んで構成(前述のように情報処理装置100が文字認識処理機能を有している場合)してもよい。
ユーザーの操作によって、画像処理装置210で文書が読み込まれ、文字認識処理の指示が行われ、画像処理装置210から情報処理装置100に対して指示が行われる。そして、情報処理装置100では、スキャン画像160の画像特徴に応じて、文字認識処理を行わせる文字認識サービス提供装置250を選択し、その文字認識サービス提供装置250にスキャン画像160を送信する。その文字認識サービス提供装置250によって文字認識処理が行われる。そして、例えば、その文字認識結果とスキャン画像160を対応させて、文書データベースとしての機能を有する文書管理装置等に記憶させる。
また、画像処理装置210で、文字認識処理の対象となる複数ページの文書を読み込み、情報処理装置100は、スキャン画像160の各ページの画像データの画像特徴に合わせて、複数の文字認識サービス提供装置250に文字認識処理を行わせるようにしてもよい。
図3は、本実施の形態による処理例を示すフローチャートである。
ステップS302では、ユーザー155の操作に応じて、画像処理装置210は原稿のスキャンを行い、スキャン画像160を生成する。
ステップS304では、画像処理装置210は、情報処理装置100に対して、フローを起動する。ここで、フローとは、スキャン画像160に対する一連の処理を行わせるプログラムであり、この処理の中に文字認識処理が含まれている。
ステップS306では、情報処理装置100は、スキャン画像160の画像特徴(原稿パラメータ)を算出する。
ステップS308では、情報処理装置100は、スキャン画像160の画像特徴に応じて、文字認識サービス提供装置250を選択し、その文字認識サービス提供装置250に対して、文字認識処理の実施依頼を行う。なお、依頼が少ない間(ステップS314の処理が予め定められた回数以上行われていない場合)は、ラウンドロビンで文字認識サービス提供装置250を選択するようにしてもよい。なお、ラウンドロビンで選択するとは、予め定められた順序で選択してもよいし、ランダム(疑似乱数を含む)で選択してもよい。
ステップS310では、文字認識サービス提供装置250は、文字認識処理を行い、処理が完了したことを情報処理装置100に通知する。
ステップS312では、情報処理装置100は、画像処理装置210の液晶ディスプレイ等の表示装置に、文字認識処理が完了した旨のメッセージを表示することによって、ユーザー155に対して、完了結果を通知する。
ステップS314では、情報処理装置100は、できばえスコアを算出し、文字認識処理を行った文字認識サービス提供装置250の重み付け値を変更する。
図6は、本実施の形態による処理例を示す説明図である。図6の例では、依頼先決定モジュール110が行う、文字認識サービス提供装置250を選択する処理を示している。
図6(A)の例に示すパラメータテーブル400は、図4の例に示したものである。つまり、画像特徴検出モジュール105によって、特徴を検出し、その検出した特徴を示す値が評価値欄420にそれぞれ記憶されている。
図6(B)の例に示す重み付けテーブル500は、図5の例に示したものである。つまり、各文字認識サービス提供装置250における、画像の特徴に対応する重み付け値である。
パラメータ項目欄410内の各値に、各文字認識サービス提供装置250の重み付け値を乗算し、トータルスコアを算出する。具体的には、図6(C)の例に示すトータルスコア600は、各文字認識サービス提供装置250に、評価値欄420内の値と重み付けテーブル500内の値を乗算して加算した値を示している。つまり、文字認識サービス提供装置250Aでは、(8×10+12×30+95×91+70×82+32×24+33×25)/100=164.18となり、文字認識サービス提供装置250Bでは、(8×5+12×71+95×14+70×13+32×82+33×91)/100=87.59となり、文字認識サービス提供装置250Cでは、(8×12+12×11+95×53+70×46+32×50+33×8)/100=103.47となる。
このトータルスコア600をもとに、どの文字認識サービス提供装置250へ依頼するかを決定する。例えば、(文字認識サービス提供装置250のトータルスコア/各トータルスコアの合計値)を算出し、その値(確率値)になるように、文字認識サービス提供装置250を選択すればよい。具体的には、文字認識サービス提供装置250Aに依頼する確率値は、(164.18/(164.18+87.59+103.47))=0.46となる。文字認識サービス提供装置250Bに依頼する確率値は、(87.59/(164.18+87.59+103.47))=0.25となる。同様に、文字認識サービス提供装置250Cに依頼する確率値は、(103.47/(164.18+87.59+103.47))=0.29となる。この確率値に沿うように、文字認識サービス提供装置250を選択すればよい。例えば、0以上1未満の乱数(疑似乱数を含む)を発生させ、その乱数が、0.00以上0.46未満の間にあれば文字認識サービス提供装置250Aを選択し、0.46以上0.71未満の間にあれば文字認識サービス提供装置250Bを選択し、0.71以上1.00未満の間にあれば文字認識サービス提供装置250Cを選択すればよい。
図7は、本実施の形態による処理例を示す説明図である。図7の例では、パラメータ保存モジュール120が行う、文字認識サービス提供装置250を選択するための重み付け値の更新処理を示している。重み付けテーブル720は、もとのスコア欄730、変更後のスコア欄740を有している。もとのスコア欄730は、もとのスコア(重み付け値)を記憶している。変更後のスコア欄740は、更新後のスコア(重み付け値)を記憶している。
文字認識サービス提供装置250の実行結果からできばえスコアを算出する。文字認識処理のできばえを計算する方法は、既存の技術を利用すればよい。例えば、各文字認識結果の文字に対する文字認識確信度の統計値(平均値、最頻値、中央値等)を用いてもよい。文字認識確信度は、文字認識処理で、その文字である確率を示しており、例えば、認識辞書パタンと認識対象のパタンとの距離の逆数等によって表される。文字認識確信度の統計値を0〜100の間の数値に正規化して、できばえスコアを算出してもよい。また、1文字あたりの処理時間を0〜100の間の数値に正規化して、できばえスコアを算出してもよい。さらに、文字認識確信度の統計値と1文字あたりの処理時間を加算した値を0〜100の間の数値に正規化して、できばえスコアを算出してもよい。また、文字認識結果を操作者が確認して、正解率を算出し、その正解率をできばえスコアとしてもよい。
そして、以下の式を用いて、重み付け値を更新してもよい。
(もとの重み付け値:もとのスコア欄730の値)+(特徴値:評価値欄420の値)×((できばえスコア)−A)/100=(更新後の重み付け値:変更後のスコア欄740の値)
定数Aは、0〜100の間の予め定められた値(例えば、50等)であるが、適宜調整した値としてよい。
具体的には、図7の例に示すようにできばえスコア710が「30」であった場合、重み付けテーブル720の1行目では、
10+8×(30−50)/100=8
となる。
依頼先決定モジュール110は、更新後の重み付け値を用いて、次回の文字認識サービス提供装置250の選択処理を行うこととなる。
なお、画像の特徴以外に、各文字認識サービス提供装置250における処理時間(ファイルサイズあたりの処理時間、1文字あたりの文字認識処理時間等)を、文字認識サービス提供装置250を選択する場合のパラメータとしてもよい。また、文字認識サービス提供装置250のできばえスコアを、文字認識サービス提供装置250を選択する場合のパラメータとしてもよい。もちろんのことながら、このできばえスコアは、過去の文字認識処理におけるできばえスコアを用いたものである。例えば、直前の文字認識処理におけるできばえスコアであってもよいし、過去のできばえスコアの統計値であってもよい。
そして、ユーザー155の操作によって、「品質優先」、「処理時間優先」、「品質と処理時間との間のバランス」を、設定するようにしてもよい。
「処理時間優先」が設定されたならば、「ファイルサイズあたりの処理時間」又は「1文字あたりの文字認識処理時間」が、予め定められた値よりも短い(つまり、処理速度が速い)文字認識サービス提供装置250における重み付け値を高くするようにしてもよい。
「品質優先」が設定されたならば、「できばえスコア」が、予め定められた値よりも大きい(つまり、認識精度がよい)文字認識サービス提供装置250における重み付け値を高くするようにしてもよい。
「品質と処理時間との間のバランス」が設定されたならば、「ファイルサイズあたりの処理時間」又は「1文字あたりの文字認識処理時間」を3段階にグループ分けし、「できばえスコア」についても3段階にグループ分けし、両者が同じグループに属している文字認識サービス提供装置250における重み付け値を高くするようにしてもよい。「3段階にグループ分け」として、例えば、異なる2つの閾値を用いて、3つのグループに分けるようにすればよい。具体的には、閾値T1、T2(T1<T2)を予め定めておき、T1未満のグループ(1)、T1以上T2未満のグループ(2)、T2以上のグループ(3)のように分ければよい。
ここで「重み付け値を高くする処理」として、例えば、その文字認識サービス提供装置250における重み付け値に対して、予め定められた値(0より大きい値)を加算すること、予め定められた値(1以上の値)を乗算すること等を行えばよい。
図8を参照して、本実施の形態の情報処理装置のハードウェア構成例について説明する。図8に示す構成は、例えばパーソナルコンピュータ(PC)等によって構成されるものであり、スキャナ等のデータ読み取り部817と、プリンタ等のデータ出力部818を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)801は、前述の実施の形態において説明した各種のモジュール、すなわち、画像特徴検出モジュール105、依頼先決定モジュール110、パラメータ保存モジュール120等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)802は、CPU801が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)803は、CPU801の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバス等から構成されるホストバス804により相互に接続されている。
ホストバス804は、ブリッジ805を介して、PCI(Peripheral Component Interconnect/Interface)バス等の外部バス806に接続されている。
キーボード808、マウス等のポインティングデバイス809は、操作者により操作される入力デバイスである。ディスプレイ810は、液晶表示装置又はCRT(Cathode Ray Tube)等があり、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)811は、ハードディスク(フラッシュメモリ等であってもよい)を内蔵し、ハードディスクを駆動し、CPU801によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、ハードディスクは、相関データ記憶モジュール115等としての機能を実現させる。さらに、その他の各種データ(画像データ、文字認識結果、重み付け値等)、各種コンピュータ・プログラム等が格納される。
ドライブ812は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体813に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース807、外部バス806、ブリッジ805、及びホストバス804を介して接続されているRAM803に供給する。リムーバブル記録媒体813も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート814は、外部接続機器815を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート814は、インタフェース807、及び外部バス806、ブリッジ805、ホストバス804等を介してCPU801等に接続されている。通信部816は、通信回線に接続され、外部とのデータ通信処理を実行する。データ読み取り部817は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部818は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図8に示す情報処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図8に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図8に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器(携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、情報家電、ロボット、複写機、ファックス、スキャナ、プリンタ、複合機などに組み込まれていてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
100…情報処理装置
105…画像特徴検出モジュール
110…依頼先決定モジュール
115…相関データ記憶モジュール
120…パラメータ保存モジュール
155…ユーザー
160…スキャン画像
210…画像処理装置
250…文字認識サービス提供装置
290…通信回線

Claims (4)

  1. 画像の特徴を検出する検出手段と、
    通信可能な複数の文字認識処理装置のうち、前記特徴に応じて、前記画像に対して文字認識処理を行わせる文字認識処理装置を決定する決定手段と、
    前記画像を前記決定手段によって決定された文字認識処理装置に送信する送信手段
    を具備し
    前記検出手段は、前記特徴として、前記画像の色度の統計値、色度又は彩度の分布値を検出する
    ことを特徴とする情報処理装置。
  2. 前記送信手段によって画像を送信した文字認識処理装置から、文字認識処理の結果を受信する受信手段
    をさらに具備し、
    前記決定手段は、前記受信手段によって受信された結果に基づいて、前記画像に対して文字認識処理を行わせる文字認識処理装置を決定する
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記決定手段は、前記特徴と各文字認識処理装置の重み付け値で算出した値が、通信可能な複数の文字認識処理装置の該値の合計値に占める割合に応じて、前記画像に対して文字認識処理を行わせる文字認識処理装置を決定する
    ことを特徴とする請求項1又は2に記載の情報処理装置。
  4. コンピュータを、
    画像の特徴を検出する検出手段と、
    通信可能な複数の文字認識処理装置のうち、前記特徴に応じて、前記画像に対して文字認識処理を行わせる文字認識処理装置を決定する決定手段と、
    前記画像を前記決定手段によって決定された文字認識処理装置に送信する送信手段
    として機能させ
    前記検出手段は、前記特徴として、前記画像の色度の統計値、色度又は彩度の分布値を検出する
    情報処理プログラム。
JP2015136665A 2015-07-08 2015-07-08 情報処理装置及び情報処理プログラム Active JP6606890B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015136665A JP6606890B2 (ja) 2015-07-08 2015-07-08 情報処理装置及び情報処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015136665A JP6606890B2 (ja) 2015-07-08 2015-07-08 情報処理装置及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2017021459A JP2017021459A (ja) 2017-01-26
JP6606890B2 true JP6606890B2 (ja) 2019-11-20

Family

ID=57888124

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015136665A Active JP6606890B2 (ja) 2015-07-08 2015-07-08 情報処理装置及び情報処理プログラム

Country Status (1)

Country Link
JP (1) JP6606890B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019145981A (ja) * 2018-02-20 2019-08-29 コニカミノルタ株式会社 サービス使用支援装置、サービス利用方法、およびコンピュータプログラム
JP2020086975A (ja) * 2018-11-27 2020-06-04 辻・本郷税理士法人 通帳変換装置、通帳変換システム及びプログラム
JP7162778B2 (ja) * 2020-05-15 2022-10-28 三菱電機ビルソリューションズ株式会社 保守管理作業支援装置及び保守管理作業携帯端末

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455872A (en) * 1993-04-26 1995-10-03 International Business Machines Corporation System and method for enhanced character recogngition accuracy by adaptive probability weighting
JP3490294B2 (ja) * 1998-06-24 2004-01-26 インターナショナル・ビジネス・マシーンズ・コーポレーション メッセージ・マルチキャスト方法及びコンピュータ
JP4429541B2 (ja) * 2001-03-21 2010-03-10 株式会社リコー 文書入力代行方法、文書入力代行用のコンピュータプログラム及び文書入力代行装置
JP2006163463A (ja) * 2004-12-02 2006-06-22 Canon Inc ダイレクトプリントシステム、ダイレクトプリントシステムの画像処理方法、記憶媒体及びプログラム

Also Published As

Publication number Publication date
JP2017021459A (ja) 2017-01-26

Similar Documents

Publication Publication Date Title
US11115553B2 (en) Information processing system for detecting image information and non-transitory computer readable medium
JP6503926B2 (ja) プログラム及び情報処理装置
US11023188B2 (en) Information processing apparatus and non-transitory computer readable medium for presenting a schedule of plural print jobs
JP6606890B2 (ja) 情報処理装置及び情報処理プログラム
CN106649420B (zh) 图像处理设备和图像处理方法
US20150213332A1 (en) Image processing apparatus, non-transitory computer readable medium, and image processing method
AU2011254013A1 (en) Image processing apparatus, image processing method, and program
US9626738B2 (en) Image processing apparatus, image processing method, and storage medium
US20090164465A1 (en) Image search system, image search apparatus, and computer readable medium
US11670067B2 (en) Information processing apparatus and non-transitory computer readable medium
US10356257B2 (en) Information processing apparatus, non-transitory computer readable medium, and information processing method for presenting a contact name
US11321038B2 (en) Display control device and non-transitory computer readable medium storing display control program for setting display time according to display priority
JP6596848B2 (ja) アクセス権推定装置及びアクセス権推定プログラム
US11316992B2 (en) Information processing apparatus and non-transitory computer readable medium
JP5742283B2 (ja) 画像処理装置及び画像処理プログラム
JP5742367B2 (ja) 画像処理装置及び画像処理プログラム
JP5440043B2 (ja) 画像処理装置及び画像処理プログラム
JP5970862B2 (ja) 情報処理装置、画像形成装置、画像形成システム、情報処理プログラム及び画像形成プログラム
US11399112B2 (en) Information processing apparatus, non-transitory computer readable medium storing information processing program, and information processing system
JP6031936B2 (ja) 画像処理装置及び画像処理プログラム
JP2017027100A (ja) 画像処理装置及び画像処理プログラム
JP6943113B2 (ja) 情報処理装置及び情報処理プログラム
JP6421568B2 (ja) 情報処理装置及び情報処理プログラム
JP2012022359A (ja) 画像処理装置及び画像処理プログラム
JP2019153230A (ja) 情報処理装置及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190924

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191007

R150 Certificate of patent or registration of utility model

Ref document number: 6606890

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350