JP2008293354A - 文書画像認識システム - Google Patents
文書画像認識システム Download PDFInfo
- Publication number
- JP2008293354A JP2008293354A JP2007139362A JP2007139362A JP2008293354A JP 2008293354 A JP2008293354 A JP 2008293354A JP 2007139362 A JP2007139362 A JP 2007139362A JP 2007139362 A JP2007139362 A JP 2007139362A JP 2008293354 A JP2008293354 A JP 2008293354A
- Authority
- JP
- Japan
- Prior art keywords
- character recognition
- ocr
- user
- server
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
【課題】 今後需要の増加が見込まれる紙文書の電子化業務を、ユーザに大きな負担がかからないよう、より自動化し、高精度かつ高速度に行う。
【解決手段】 ユーザから文書画像を受信し、複数のOCRサーバからユーザの入力条件に合った最適なOCRサーバを、前もって測定された評価値や文字認識処理速度を指標として、より自動的に選択し、文字認識処理をさせる。文書画像認識処理後、文字コード認識結果をユーザに提供する。
【選択図】 図1
【解決手段】 ユーザから文書画像を受信し、複数のOCRサーバからユーザの入力条件に合った最適なOCRサーバを、前もって測定された評価値や文字認識処理速度を指標として、より自動的に選択し、文字認識処理をさせる。文書画像認識処理後、文字コード認識結果をユーザに提供する。
【選択図】 図1
Description
本発明は、文書画像認識処理を行うOCRサーバとネットワークを介して文書画像の認識処理を依頼するユーザとの間での文書画像認識方法に関する。
近年、ネットワークを介して文書画像を認識するシステムが開発されている。例えば、特開2002−279348公報には、ユーザが複数のOCRサーバからユーザの条件に合ったひとつのOCRサーバを選択し、そのOCRサーバに文字認識処理をさせ、文字認識結果を得るというものである。
しかしながら、OCRサーバの性能(評価値)を基準として、最適なOCRサーバを自動的に選択するような文書画像認識システムに関する従来技術は見当たらない。
特開2002−279348号公報
上記の複数のOCRサーバからユーザがひとつのOCRサーバを選択する手法は、ユーザが複数のOCRサーバの性能や課金条件を考慮した上で、ひとつのOCRサーバを選択する必要があるので、ユーザに対する負荷が大きい。
本発明の目的は、今後需要の増加が見込まれる紙文書の電子化業務を、ユーザに大きな負担がかからないよう、より自動化することである。また別の目的としては、複数のOCRサーバから選択することで各OCRサーバ間に競合化を促すことができ、その結果、高精度かつ高速度に文字認識処理できるようにすることである。
請求項1記載の発明は、OCRサービスを提供する複数のOCRサーバを登録・管理する制御手段と、ユーザから文書画像を受信する画像取得手段と、ユーザが希望する処理内容に応じて事前に作成した評価値や処理速度をもとに1つまたは複数のOCRサーバを選択する処理サーバ選択手段と、選択されたOCRサーバに対し前記画像を配信する配信手段と、各OCRサーバが文字認識処理を行った結果をユーザに提供する提供手段と、ユーザが最終的にどのOCRサーバから得られた文字認識結果を選択したのかを確認する選択確認手段と、選択確認結果を評価値に反映させる評価反映手段と、を有することを特徴とする文字認識装置である。
請求項2の発明は、前記処理サーバ選択手段に用いられる評価値の初期値は、事前にOCR処理サービス提供者による文字認識率の評価結果に基づくことを特徴とする請求項1に記載の文字認識装置である。
請求項3の発明は、前記処理サーバ選択手段に用いられる評価値は、選択確認手段にて選択が確認されたOCRサーバによって文字認識処理された文字数、ページ数、単語数等を加味し、更新されていくことを特徴とする請求項1に記載の文字認識装置である。
請求項4の発明は、前記処理サーバ選択手段に用いられる評価値は、新しいOCRサーバが登録される、OCRサービスのバージョンがアップするなどのタイミングで初期値に戻されることを特徴とする請求項1に記載の文字認識装置である。
請求項5の発明は、前記文字認識結果提供手段は、配信画像の一部の文字コード認識結果であることを特徴とする請求項1に記載の文字認識装置である。
請求項6の発明は、前記文字認識結果提供手段は、結果を画像として提供することを特徴とする請求項1に記載の文字認識装置である。
請求項7の発明は、前記文字認識結果の選択確認手段による選択後に、全ての文字認識結果を提供する提供手段を有することを特徴とする請求項1に記載の文字認識装置である。
評価値を基準にして、複数のOCRサーバからひとつ、又は複数のOCRサーバを自動的に選択することが可能となり、ユーザの指定する入力条件が減り、ユーザに対する負荷が軽減される。また、複数のOCRサーバに競合化を促すことができ、より高精度に、より高速度に文字認識処理ができるようになることが期待される。
本発明の実施の形態を構成する概略構成について図1を参照しながら説明する。
システム構成例を図1に示す。本システムは、ユーザが扱うユーザ端末と、文書画像認識処理システムのサービスの提供者が管理するサービス提供装置と、複数のOCRサーバとが、通信回線を介して接続されている。
ユーザ端末、サービス提供装置及びOCRサーバは、それぞれがコンピュータとしてのアーキテクチャを備えており、それぞれの機器の記憶領域には、それぞれの機能を実現するために必要なコンピュータプログラムがインストールされている。以下、コンピュータプログラムに従いコンピュータとしてのアーキテクチャを備えるユーザ端末、サービス提供装置及びOCRサーバが自らのプロセッサによって実行される機能そのものについて説明する。
基本的な動作を次に説明する。
まず、文書画像認識処理を依頼するユーザはスキャナやデジタルカメラ等
の画像入力装置を用いて、文書画像に変換する。
の画像入力装置を用いて、文書画像に変換する。
次に、ユーザは、通信回線を介して、変換された文書画像をサービス提供装置に送る。
サービス提供装置では、選択したOCRサーバを用いて文書画像を電子化し、得られた結果をユーザ端末に送り返す。
サービス提供装置の動作については、本発明の中心をなす部分であるので、以下の実施の形態にて詳しく説明する。
<実施形態1>
本発明の実施形態を図2〜図7に基づいて説明する。
本発明の実施形態を図2〜図7に基づいて説明する。
実施形態においては、ユーザから評価値順、速度順かの簡単な入力条件を得、それに基づいて自動的にOCRサーバを選択する例について説明する。
評価値の初期値は、予めOCRサーバの精度評価を行っておく。精度評価前には、すべてのOCRサーバの評価値はゼロに設定しておく。図2のような文書画像をすべてのOCRサーバで文字認識処理した結果に対して文字認識の精度評価を行い、ある一定の認識率を超えた場合は、精度の良いものから順に、処理した文字数分、処理した文字数の半分、処理した文字数の3分の1などというように重み付けを行い、そのOCRサーバの評価値に加算していく。図3のように、この精度評価をすべてのOCRサーバで評価値に差がつくまで行っておく。処理速度の初期値は、図3のように、1文字あたりの文字認識処理速度を予め計算しておく。評価値と処理速度は、サービス提供装置が、OCRサーバを選択する際の指標として、保持しておく。
ここで用いる入力条件を図4、図5、図6、図7に示す。
サービス提供装置は、ユーザに図4、図5、図6、図7のように入力条件を指定させ、文書画像と共に入力条件を受信する。
サービス提供装置では、その入力条件を基に複数のOCRサーバから、ひとつ、又は複数のOCRサーバを選択する。例えば、図4のような入力条件の場合、評価値の高いOCRサーバをひとつ選択する。図5のような入力条件の場合、処理速度の速いOCRサーバをひとつ選択する。図6のような入力条件の場合、評価値の高いOCRサーバを3つ選び、その中で最も処理速度の速いOCRサーバを選択する。図7のような入力条件の場合、処理速度の速いOCRサーバを4つ選び、その中で評価値の高いOCRサーバを2つ選択する。図4〜図7のように、評価値順と処理速度順の出力サンプル数は、常に異なることを前提とする。
サービス提供装置は、選択したOCRサーバに文書画像を送る。
OCRサーバは文書画像を文字認識処理し、文字コード認識結果をサービス提供装置に送る。
サービス提供装置は、OCRサーバから送られてきた文字コード認識結果を文書画像化し、ユーザに送り返す。
サービス提供装置は、送られてきた文字コード認識結果の文書画像をユーザに確認させ、ひとつを選択させる。ユーザが選択しない場合は、文字コード認識結果はユーザには送り返さず、今までの入力条件も無効とする。
サービス提供装置は、選択された文字コード認識結果をユーザに送り、文字認識処理した文字数分だけ、文字認識処理したOCRサーバの評価値として加算する。
サービス提供装置は、文字認識処理した文字数分の課金をユーザに対して行い、その一部を文字認識処理したOCRサーバに支払う。
ある一定期間が立てば、全OCRサーバの評価値をゼロにし、処理速度も測定し直す。このとき、OCRサーバの文字認識エンジンのバージョンアップや新規参入を受け入れる。ただし、新規参入のOCRサーバがある場合は、もう一度OCRサーバの精度評価を行う。
Claims (7)
- OCRサービスを提供する複数のOCRサーバを登録・管理する制御手段と、ユーザから文書画像を受信する画像取得手段と、ユーザが希望する処理内容に応じて事前に作成した評価値や処理速度をもとに1つまたは複数のOCRサーバを選択する処理サーバ選択手段と、選択されたOCRサーバに対し前記画像を配信する配信手段と、各OCRサーバが文字認識処理を行った結果をユーザに提供する提供手段と、ユーザが最終的にどのOCRサーバから得られた文字認識結果を選択したのかを確認する選択確認手段と、選択確認結果を評価値に反映させる評価反映手段、とを有することを特徴とする文字認識装置。
- 前記処理サーバ選択手段に用いられる評価値の初期値は、事前にOCR処理サービス提供者による文字認識率の評価結果に基づくことを特徴とする請求項1に記載の文字認識装置。
- 前記処理サーバ選択手段に用いられる評価値は、選択確認手段にて選択が確認されたOCRサーバによって文字認識処理された文字数、ページ数、単語数を加味し、更新されていくことを特徴とする請求項1に記載の文字認識装置。
- 前記処理サーバ選択手段に用いられる評価値は、新しいOCRサーバが登録されるタイミングで初期値に戻されることを特徴とする請求項1に記載の文字認識装置。
- 前記文字認識結果提供手段は、配信画像の一部の文字コード認識結果であることを特徴とする請求項1に記載の文字認識装置。
- 前記文字認識結果提供手段は、結果を画像として提供することを特徴とする請求項1に記載の文字認識装置。
- 前記文字認識結果の選択確認手段による選択後に、全ての文字認識結果を提供する提供手段を有することを特徴とする請求項1に記載の文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007139362A JP2008293354A (ja) | 2007-05-25 | 2007-05-25 | 文書画像認識システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007139362A JP2008293354A (ja) | 2007-05-25 | 2007-05-25 | 文書画像認識システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008293354A true JP2008293354A (ja) | 2008-12-04 |
Family
ID=40168000
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007139362A Pending JP2008293354A (ja) | 2007-05-25 | 2007-05-25 | 文書画像認識システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008293354A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014191246A (ja) * | 2013-03-28 | 2014-10-06 | Nec Corp | 認識処理制御装置、認識処理制御方法および認識処理制御プログラム |
JPWO2022044067A1 (ja) * | 2020-08-24 | 2022-03-03 | ||
CN115552446A (zh) * | 2020-05-15 | 2022-12-30 | 三菱电机楼宇解决方案株式会社 | 维护管理作业辅助装置以及维护管理作业便携终端 |
-
2007
- 2007-05-25 JP JP2007139362A patent/JP2008293354A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014191246A (ja) * | 2013-03-28 | 2014-10-06 | Nec Corp | 認識処理制御装置、認識処理制御方法および認識処理制御プログラム |
CN115552446A (zh) * | 2020-05-15 | 2022-12-30 | 三菱电机楼宇解决方案株式会社 | 维护管理作业辅助装置以及维护管理作业便携终端 |
CN115552446B (zh) * | 2020-05-15 | 2023-10-31 | 三菱电机楼宇解决方案株式会社 | 维护管理作业辅助装置以及维护管理作业便携终端 |
JPWO2022044067A1 (ja) * | 2020-08-24 | 2022-03-03 | ||
JP7134380B2 (ja) | 2020-08-24 | 2022-09-09 | 三菱電機ビルソリューションズ株式会社 | 文書画像認識システム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9924067B2 (en) | Information processing device, information processing system, control method, and storage medium | |
CN105491008B (zh) | 公众账号二维码生成方法和装置、公众账号关注方法和装置 | |
JP5633317B2 (ja) | 情報処理装置、ワークフロー管理システム、ワークフローの実行方法およびプログラム | |
JP5495629B2 (ja) | ワークフロー制御方法、制御装置及びプログラム | |
US20110238859A1 (en) | Information processing apparatus and document data producing method | |
US20150006374A1 (en) | Information processing apparatus and recording medium | |
US20160224282A1 (en) | Print control system, method of controlling printing, and recording medium | |
US11134169B2 (en) | Information processing device, information management device, information processing system, and non-transitory computer readable medium | |
JP7087598B2 (ja) | 情報処理装置、情報処理システムおよびプログラム | |
CN107180343A (zh) | 一种自动缴费的方法和装置 | |
US11770492B2 (en) | Information processing system, apparatus, and method for controlling usage of service in accordance with previous resource usage | |
CN110738784A (zh) | 发票管理方法、装置、服务器和系统 | |
CN111259882A (zh) | 票据识别的方法、装置及计算机设备 | |
JP2008293354A (ja) | 文書画像認識システム | |
KR20150120597A (ko) | 번역가를 선택하는 사용자 인터페이스를 제공하는 번역 중개 서비스 방법 및 시스템 | |
JP7098986B2 (ja) | 情報処理装置、プログラムおよび情報処理システム | |
CN109919573A (zh) | 数据处理方法、装置及计算机设备 | |
JP2009223593A (ja) | 翻訳者選択方法、翻訳者選択プログラム、および翻訳者選択サーバ | |
JP7247492B2 (ja) | 情報処理装置、情報処理システム、及び情報処理プログラム | |
CN1196314C (zh) | 元信息处理 | |
JP4429541B2 (ja) | 文書入力代行方法、文書入力代行用のコンピュータプログラム及び文書入力代行装置 | |
CN115134414B (zh) | 一种etc账户的充值提示方法、装置、服务器、介质及产品 | |
US20230205853A1 (en) | Copyright protection assistance system | |
JP2016163982A (ja) | 情報処理装置、及び情報処理システム | |
JP2004112639A (ja) | 情報処理装置およびその制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100201 |