JP2005301793A - Ocr evaluation system - Google Patents
Ocr evaluation system Download PDFInfo
- Publication number
- JP2005301793A JP2005301793A JP2004118833A JP2004118833A JP2005301793A JP 2005301793 A JP2005301793 A JP 2005301793A JP 2004118833 A JP2004118833 A JP 2004118833A JP 2004118833 A JP2004118833 A JP 2004118833A JP 2005301793 A JP2005301793 A JP 2005301793A
- Authority
- JP
- Japan
- Prior art keywords
- image
- evaluation
- server
- layout
- ocr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Abandoned
Links
Images
Abstract
Description
本発明は、ネットワークを介してOCR評価サービスを提供するOCR評価システムに関するものである。 The present invention relates to an OCR evaluation system that provides an OCR evaluation service via a network.
一般的に、OCRは、スキャナ部と認識部とから構成され、例えば銀行の窓口の振込業務などで入力手段として使用されている。スキャナ部は、光学センサなどを用いて帳票の画像を取得する手段を有し、認識部は、画像の補正や正規化を行う手段、文字位置を特定する手段、文字の認識を行って一つ以上の文字コードに変換する手段、一つ以上の文字コードから前後の文字との関連を見て文字コードを選択する知識処理手段などで構成されている。
OCRの認識性能は、認識率で評価する場合が多く、その認識率には、正読率、誤読率及び不読率がある。正読率は、全体の中で正しく読み取ることができた文字の割合であり、誤読率は、誤った文字を読み取った割合であり、不読率は、文字コードを決定することができなかった割合である。また、文字単位で正読率、誤読率及び不読率を求める場合もあれば、帳票単位や帳票の項目単位で求める場合もあり、業務の特徴に応じて評価方法が決定される。
正しく読めなかった文字や文字コードを決定できなかった文字を修正してクリアデータにするための修正作業がある。この修正作業に必要となる端末台数やオペレータ数を認識率から導くこともあり、事前に認識率の把握をしたい場合がある。OCR開発ベンダでは、仮想的なOCR運用システムを構築し、OCRの認識率の評価サービスを提供することができ、事前に認識率を把握できる。例えば、ある銀行の支点が増えて、新たに読取文字が追加になる場合に、認識率がどのように変化するかを事前に把握することができる。
In general, the OCR is composed of a scanner unit and a recognition unit, and is used as an input unit in, for example, a bank transfer service. The scanner unit has means for acquiring a form image using an optical sensor or the like, and the recognition unit is means for correcting or normalizing an image, means for specifying a character position, character recognition, and It comprises means for converting to the above character code, knowledge processing means for selecting a character code from one or more character codes by looking at the relationship with the preceding and succeeding characters, and the like.
The recognition performance of OCR is often evaluated by a recognition rate, and the recognition rate includes a correct reading rate, a misreading rate, and a non-reading rate. The correct reading rate is the proportion of characters that can be read correctly in the whole, the misreading rate is the proportion of reading wrong characters, and the unread rate cannot determine the character code. It is a ratio. In addition, the correct reading rate, the misreading rate, and the unreading rate may be obtained for each character, or may be obtained for each form item or each item item of the form, and the evaluation method is determined according to the business characteristics.
There is a correction work to correct characters that could not be read correctly or characters that could not be determined, to clear data. In some cases, the number of terminals and the number of operators required for the correction work are derived from the recognition rate, and it is sometimes desired to grasp the recognition rate in advance. An OCR development vendor can construct a virtual OCR operation system, provide an OCR recognition rate evaluation service, and grasp the recognition rate in advance. For example, when the fulcrum of a certain bank is increased and a new reading character is added, it is possible to grasp in advance how the recognition rate changes.
ところで、前記のような従来のOCRの認識率の評価サービスは、次のような解決すべき課題があった。
OCRベンダのローカルサイトにて実施され、OCRユーザが直接評価を行うことができないため、OCRユーザは、OCRベンダへの文書による依頼や、回答の受理といった手間が発生するなど、評価結果の入手に時間がかかる場合があった。
By the way, the conventional OCR recognition rate evaluation service as described above has the following problems to be solved.
Since it is performed at the OCR vendor's local site and cannot be directly evaluated by the OCR user, the OCR user is required to obtain evaluation results such as taking the time to write a request to the OCR vendor and accepting the response. It may take time.
本発明に係るOCR評価システムは、ユーザ端末からの評価対象の画像、及び画像認識と画像評価に必要なデータが公衆通信網を介して受信されると、前記データを用いて、評価対象の画像を認識し、かつ、この認識画像の評価結果を求め、ユーザ端末からの要求に応じてその評価結果を送信するOCR評価サーバを備えたものである。 When an image to be evaluated from a user terminal and data necessary for image recognition and image evaluation are received via a public communication network, the OCR evaluation system according to the present invention uses the data to evaluate the image to be evaluated. And an OCR evaluation server for obtaining the evaluation result of the recognition image and transmitting the evaluation result in response to a request from the user terminal.
本発明においては、ユーザ端末からの評価対象の画像、及び画像認識と画像評価に必要なデータが公衆通信網を介して受信されると、前記データを用いて、評価対象の画像を認識し、かつ、この認識画像の評価結果を求め、ユーザ端末からの要求に応じてその評価結果を送信するようにしたので、ユーザ側にとっては、長い時間を要することなく評価結果を容易に入手することができる。 In the present invention, when an image to be evaluated from a user terminal and data necessary for image recognition and image evaluation are received via a public communication network, the image to be evaluated is recognized using the data, In addition, since the evaluation result of the recognition image is obtained and the evaluation result is transmitted in response to a request from the user terminal, the user can easily obtain the evaluation result without taking a long time. it can.
実施の形態1.
以下に、本発明の実施の形態1について図1〜図16を用いて説明する。
図1に示すベンダネットワーク3は、OCRベンダ側に構築されたネットワークで、ゲートウェイ4によって公開セグメント5と非公開セグメント6とに分割されている。そのゲートウェイ4は、ファイアウォール機能を有し、後述するOCR評価サーバ7、メールサーバ8、OCRの開発部門に設置されたOCR開発用のPC9(パソコン)、システム設計部門に設置されたシステム設計用のPC10などの機器に対する不正アクセスの防止やウィルスプログラムの排除を行う。また、非公開セグメント6へ出入りするパケットのIPアドレス変換やポート番号の変換などを行うようになっている。前記の公開セグメント5は、インターネット2上に配置されたユーザPC1に公開しているLANであり、非公開セグメント6はOCRベンダ内で使用されているLANである。
Hereinafter,
A
インターネット2上に配置されたユーザPC1は、例えば金融機関の銀行などに設けられ、図示していないが、インターネット2と接続する手段、OCR評価サーバ7とHTTPコネクションを設定するための手段、画面上にブラウザを表示する手段などを有し、金融取引業務に用いられる帳票の内容を読み取るOCR(図示せず)と接続されている。このユーザPC1は、ブラウザを立ち上げた後に、認識評価に必要な例えば評価バッチリスト、画像バッチ、レイアウト情報、認識パッケージ、正解バッチ及び自己のメールアドレスが入力可能な評価パラメータ画面を表示し、この画面に従って入力される各種情報に基づいて評価パラメータを作成する。そして、OCR評価サーバ7を指定するHTTPが入力されたときは、インターネット2上のプロバイダ(図示せず)を介してそのOCR評価サーバ7と接続し、作成した評価パラメータをOCR評価サーバ7に送信する。前記の認識パッケージは、OCRの認識プログラムである。
The
ベンダネットワーク3上に配置されたOCR評価サーバ7は、図2に示すように、ユーザPC1とHTTPコネクションを設定するためのHTTPコネクション部100と、評価環境設定部101と、認識評価部106と、認識結果ファイル107と、集計部109と、メール送信部111と、評価結果ファイル113と、評価パラメータファイル150と、評価バッチリストファイル151と、画像バッチファイル152と、レイアウト情報ファイル153と、認識パッケージファイル154と、正解バッチファイル155とを有し、ユーザPC1からの評価パラメータがHTTPコネクション部100を通じて受信されたとき、図3に示すように評価パラメータファイル150に格納する。前述した各ファイルは、本サーバ7に設けられた記憶部である。
As shown in FIG. 2, the
前記の評価環境設定部101は、評価パラメータが評価パラメータファイル150に格納されると、OCRの認識評価に必要な環境設定のために、その評価パラメータを解析し、予め定められた各ファイル151〜155にそれぞれ格納する。評価バッチリストファイル151は、図4に示すように、複数の評価バッチB001,B002を格納する構成となっており、各評価バッチB001,B002の内部構成については後述するが、評価対象の画像や認識に必要な認識パッケージなどが指定されている。なお、評価バッチB001,B002は、評価対象画像に対する評価処理の1単位を示すものである。
When the evaluation parameter is stored in the
画像バッチファイル152は、OCRによって認識された評価対象の画像集団を格納するためのファイルで、図5に示すように、画像I001,I002,I003にそれぞれ対応して評価対象画像(帳票毎の画像)が格納されている。画像集団とは、過去に評価した画像も含めたものである。評価対象画像は、主に帳票全体の画像、読取領域を切り出した画像、一文字毎に切り出した文字パターン画像の3種類に分類され、評価バッチB001,B002に指定されている。レイアウト情報ファイル153は、図6(a)に示すように、レイアウト情報を帳票種別1,2,3毎に格納するためのファイルである。このレイアウト情報には、同図(b)〜(d)に示すように、帳票種別1,2,3に応じて設定された帳票上の読取領域01〜03の各座標、読取領域、種類(カナ、漢字、数字など)などが書き込まれている。また、レイアウト情報には、読取領域をグループ化したものもあり、例えば図6(e)に示すように、読取領域01,02をGR1と定義し、読取領域03をGR2と定義した場合、各GR1,2の定義した情報が書き込まれている。
The
認識パッケージファイル154は、図7に示すように、バージョンの異なる認識パッケージP001,P002を格納可能なファイルである。認識パッケージP001,P002は、前述したようにOCRの認識プログラムで、メインプログラム、サブプログラム、パラメータなどから構成されている。バージョンの異なった認識パッケージP001,P002が格納された場合、認識パッケージP001,P002の違いによる認識性能の差を確認することができる。正解バッチファイル155は、図8に示すように、正解情報S001〜S003にそれぞれ対応して評価対象画像の正解情報、例えば正しい文字(文字コード)及び文字座標が書き込まれている。その正解情報と評価対象画像とを比較することで、OCRの認識性能を求めることができる。
As shown in FIG. 7, the
認識評価部106は、動作説明時に詳述するが、評価バッチリストファイル151に格納された評価バッチB001,B002の指定に基づいて、評価対象画像を読取領域毎に認識し、その認識画像を認識結果ファイル107に格納する。この認識は、評価バッチB001,B002に指定されている認識パッケージP001,P002毎に行われる。集計部109は、認識結果ファイル107に格納された認識画像とこの認識画像に対して設定された正解情報とを比較して、正読、誤読或いは不読の何れかを判別し、その結果を評価結果ファイル113に格納する。評価バッチB001,B002の指定による評価対象画像の認識評価が完了すると、後で詳述するが、評価結果ファイル113に格納した評価結果をデータとして、正読率、誤読率及び不読率をそれぞれ求め、これに基づいて各種評価表を作成し、また、作成した評価表に基づいてバージョンの異なる認識パッケージP001,P002の性能比較表を作成し、評価結果ファイル113に格納する。前記の評価表は、バージョンの異なる認識パッケージP001,P002毎に作成され、性能比較表については、認識パッケージが一つの場合不要になる。メール送信部111は、評価完了メッセージを受けたときに、評価パラメータファイル101から送信先のメールアドレスを読み込んで、その送信先のユーザPC1に評価完了メッセージを送信する。
As will be described in detail when the operation is described, the
ここで、前述した評価バッチの内部構成について図9を用いて説明する。図中(a)は評価バッチB001を示す詳細図であり、(b)は評価バッチB002を示す詳細図でありる。各評価バッチB001,B002には、評価バッチの種別を示すバッチ番号、評価の目的を表すバッチ名、認識評価の実行順位を指定する評価番号、画像バッチファイル152の画像バッチに存在する評価対象の画像を指定する評価画像、認識パッケージファイル154に格納された認識パッケージを指定する認識パッケージ番号、レイアウト情報ファイル153に格納された帳票種別を指定するレイアウト情報、正解バッチファイル155に格納された正解情報を指定する正解情報番号が書き込まれている。
Here, the internal configuration of the evaluation batch described above will be described with reference to FIG. In the figure, (a) is a detailed view showing an evaluation batch B001, and (b) is a detailed view showing an evaluation batch B002. Each of the evaluation batches B001 and B002 includes a batch number indicating the type of the evaluation batch, a batch name indicating the purpose of the evaluation, an evaluation number for specifying the execution order of recognition evaluation, and an evaluation target existing in the image batch of the
次に、実施の形態1の動作について図10〜図16を用いて説明する。
ユーザPC1は、ブラウザを立ち上げた後に、OCRの認識評価に必要な評価バッチリスト、画像バッチ、レイアウト情報、認識パッケージ、正解バッチ及び自己のメールアドレスが入力可能な評価パラメータ画面を表示し、この画面に従って入力される各種情報に基づいて評価パラメータを作成する。そして、OCR評価サーバ7を指定するHTTPが入力されたときは、インターネット2上のプロバイダ(図示せず)を介してそのOCR評価サーバ7と接続して、作成した評価パラメータをOCR評価サーバ7に送信する(P1)。
Next, the operation of the first embodiment will be described with reference to FIGS.
After launching the browser, the
OCR評価サーバ7は、評価パラメータがインターネット2を介して受信されたとき、その評価パラメータを評価パラメータファイル150に格納し(図3参照)、認識中メッセージをユーザPC1に送信して本サーバ7との接続を切断するように促し、OCRの認識評価の実行に入る(P2)。本サーバ7との切断の指示は、OCRの認識評価に時間を要するためである。一方、OCR評価サーバ7の評価環境設定部101は、評価パラメータファイル150にアクセスして評価パラメータを解析し、予め定められた各ファイル151〜155にそれぞれ格納する。これは、前述した如く認識評価に必要な環境を設定するためで、評価バッチリストを評価バッチリストファイル151に、画像バッチを画像バッチファイル152に格納し、レイアウト情報をレイアウト情報ファイル153に、認識パッケージを認識パッケージファイル154に、正解バッチを正解バッチファイル155に格納する。
When the evaluation parameter is received via the
評価環境設定部101による環境設定が完了すると、認識評価部106は、評価バッチリストファイル151の評価バッチリストにアクセスして、最初の評価バッチB001を読み込み、その評価バッチB001に書き込まれている評価番号1の列に記載の認識パッケージP001を認識パッケージファイル154から読み込んで実行し、評価対象画像の認識に入る。まず、評価番号1の列に記載の画像I001に設定されている評価対象画像を画像バッチファイル152から読み込み、帳票種別1に設定されている読取領域01〜03をレイアウト情報ファイル153から読み込む。そして、読み込んだ評価対象画像に対して、読み込んだ帳票種別1の読取領域01〜03から例えば文字や罫線の位置をそれぞれ特定し、文字の切り出し及び認識をそれぞれ行い、各読取領域01,02,03における文字座標と認識文字を認識結果ファイル107に格納する。次に、評価バッチB001に記載の評価番号2,3に従って画像I002,I003の評価対象画像に対する認識処理を順に行い、それぞれの結果(文字座標と認識文字)を認識結果ファイル107に格納する。評価バッチB001の指定に基づく認識処理が完了したときは、図9(b)に示す評価バッチB002の指定に基づいて認識処理を行う。この一例では、図9(a)(b)に示すように、同一の帳票種別1に対して前記と異なるバージョンの認識パッケージP002で認識することになる。なお、文字座標と認識文字を認識結果ファイル107に格納する際、例えば、バッチ番号、バッチ名及び評価番号と、帳票種別1毎の読取領域01,02,03の文字座標及び認識文字と、評価番号毎に設定された正解情報番号を格納する。
When the environment setting by the evaluation
認識評価部106による認識処理が完了すると、集計部109は、認識結果ファイル107から評価番号1に設定された帳票種別1の読取領域01,02,03の文字座標及び認識文字を読み出すと共に、その評価番号1に設定された正解情報S001の正解情報(正しい文字及び文字座標)を正解バッチファイル155から読み込む。そして、読取領域01〜03の各認識文字に対する正しい文字を双方の文字座標から判別して比較し、帳票種別1における読取領域01〜03の各認識文字の正読、誤読或いは不読の何れかをそれぞれ判別し、その結果をバッチ番号、バッチ名及び評価番号と関連付けて評価結果ファイル113に格納する。さらに、認識結果ファイル107から評価番号2,3に設定された帳票種別1の各読取領域01,02,03の文字座標及び認識文字を順に読み出し、前記と同様にそれぞれの正解情報(S002,S003)と比較して、各認識文字に対する正読、誤読或いは不読の何れかをそれぞれ判別し、それぞれの結果を前記と同様にして評価結果ファイル113に格納する。評価バッチB001側の認識文字に対する評価が完了したときは、評価バッチB002側の文字座標及び認識文字を認識結果ファイル107から読み出して正解バッチファイル155の正解情報と比較する。この比較は、前記と同様に評価番号の順に行い、各帳票種別1における読取領域01〜03の各認識文字の正読、誤読或いは不読の何れかをそれぞれ判別し、その結果をバッチ番号、バッチ名及び評価番号と関連付けて評価結果ファイル113に格納する。
When the recognition process by the
その後は、評価バッチB001側の評価結果をデータとして、評価番号順に、かつ読取領域毎に正読率、誤読率及び不読率を算出して、図11に示す領域単位の評価表を作成し、また、評価番号順に、かつ帳票種別1に対して予め設定されたグループ毎に正読率、誤読率及び不読率を算出して、図12に示すグループ単位の評価表を作成し、さらに、帳票種別1毎に正読率、誤読率及び不読率を算出して、図13に示す帳票単位の評価表を作成し、それぞれの評価表を評価結果ファイル113に保存する。また、作成した領域単位の評価表に基づいてバージョンの異なる認識パッケージP001,P002の性能比較表を作成し(図14参照)、グループ単位の評価表に基づいてその認識パッケージP001,P002の性能比較表を作成し(図15参照)、さらに、帳票単位の評価表に基づいてその認識パッケージP001,P002の性能比較表を作成し(図16参照)、それぞれの性能比較表を評価結果ファイル113に保存する。そして、評価表及び性能比較表の作成完了時に、メール送信部111に評価完了メッセージを通知する。この時、メール送信部111は、評価パラメータファイル101からユーザPC1のメールアドレスを読み込んで、その送信先に評価完了メッセージを送信する。
Thereafter, using the evaluation result on the evaluation batch B001 side as data, the correct reading rate, the misreading rate, and the unreading rate are calculated for each reading region in the order of the evaluation number, and the evaluation unit for the region unit shown in FIG. 11 is created. Further, the correct reading rate, the misreading rate, and the unreading rate are calculated for each group set in advance in the order of the evaluation number and for the
一方、ユーザPC1は、評価完了メッセージが受信されたとき、OCR評価サーバ7に評価結果(評価表及び性能比較表)を要求して取得し(P3)、OCR評価サーバ7は、その要求に応じて評価表及び性能比較表を評価結果ファイル113から読み出し、ユーザPC1に送信する(P4)。
On the other hand, when the evaluation completion message is received, the
以上のように実施の形態1によれば、ユーザPC1によって作成された評価対象の画像及び画像認識と画像評価に必要な評価パラメータがインターネット2を介して受信されると、その評価パラメータを用いて、評価対象の画像を認識し、かつ、この認識画像の評価結果(正読・誤読・不読)を求め、ユーザPC1からの要求に応じてその評価結果を送信するようにしたので、ユーザ側にとっては、長い時間を要することなく評価結果を容易に入手することができる。
As described above, according to the first embodiment, when an evaluation target image created by the
実施の形態2.
本発明の実施の形態2について図17〜図20を用いて説明する。なお、図1で説明した実施の形態1と同一又は相当部分には同じ符号を付し説明を省略する。
実施の形態2においては、図17に示すように、Webサービスサーバ11と、認証サーバ12と、拠点情報サーバ13とをベンダネットワーク3上に付加したものである。OCR評価サーバ7は、認証サーバ12及び拠点情報サーバ13と同様に非公開セグメント6上に配置され、Webサービスサーバ11は、公開セグメント5上に設置されている。
A second embodiment of the present invention will be described with reference to FIGS. In addition, the same code | symbol is attached | subjected to the same or equivalent part as
In the second embodiment, as shown in FIG. 17, a
このWebサービスサーバ11は、動作説明時に詳述するが、ユーザPC1からOCR評価の依頼を受けたときに、ユーザPC1に対しユーザIDとパスワードを要求して取得し、取得したユーザIDとパスワードを認証サーバ12に転送して照合させ、この照合が成功(一致)したときは、ユーザIDを再び認証サーバ12に送信して拠点情報サーバ13のアドレスを取得する。その後は、ユーザPC1に対して認識評価に必要な評価パラメータを要求すると共に、先に取得したアドレスを用いて拠点情報サーバ13にアクセスし、そのアドレスに関連付けられたユーザIDの認識パッケージ(OCRの認識プログラム)を拠点情報サーバ13から取得する。そして、ユーザPC1に要求した評価パラメータが受信されたときは、評価パラメータに認識パッケージを添付してOCR評価サーバ7に送信しOCR評価を実行させる。
As will be described in detail when the operation is described, the
前記の認証サーバ12は、図18に示すようにユーザID毎に拠点情報サーバ13のアドレスが書き込まれた拠点情報テーブル12aを有し、Webサービスサーバ11からのユーザIDとパスワードが受信されたときに、予め設定されたユーザ識別情報ファイル(図示せず)にアクセスして、同一のユーザIDとパスワードが存在するか否かを検索し、同一のユーザIDとパスワードが存在しないときは、Webサービスサーバ11にユーザの認証失敗を通知し、同一のユーザIDとパスワードを検索したときは、Webサービスサーバ11にユーザの認証成功を通知する。そして、再びユーザIDが受信されたときは、拠点情報テーブル12aにアクセスして、そのユーザIDに設定された拠点情報サーバ13のアドレスを検索し、Webサービスサーバ11へ送信する。
The
拠点情報サーバ13は、図19に示すように、ユーザID毎に設定された認識パッケージP001,P002が格納された認識パッケージファイル13aを有し、Webサービスサーバ11から前記アドレスを用いて認識パッケージの要求を受けたときは、そのアドレスに関連付けられたユーザIDの認識パッケージP001,P002を認識パッケージファイル13aから読み出し、Webサービスサーバ11に送信する。その認識パッケージP001,P002は、実施の形態1で述べたように、バージョンの異なるOCRの認識プログラムで、メインプログラム、サブプログラム、パラメータなどから構成されている。
As shown in FIG. 19, the
次に、実施の形態2の動作を図20のシーケンス図を用いて説明する。
ユーザPC1からのHTTPコネクションの設定により、ユーザPC1とWebサービスサーバ11とがインターネット2を介して接続されると、Webサービスサーバ11は、P10において、ユーザPC1に対しアカウントの入力を要求する。この時、ユーザPC1は、HTTPコネクション設定時に立ち上げたブラウザ画面がアカウントの入力画面となり(P11)、オペレータのキー操作によって例えば「U001」のユーザIDとパスワードが入力されたときは、そのユーザID(U001)とパスワードをWebサービスサーバ11に送信する。Webサービスサーバ11は、ユーザPC1からのユーザID(U001)とパスワードが受信されると、それらを認証サーバ12に転送する。
Next, the operation of the second embodiment will be described with reference to the sequence diagram of FIG.
When the
認証サーバ12は、ユーザID(U001)とパスワードが受信されると、予め設定されたユーザ識別情報ファイル(図示せず)にアクセスして、同一のユーザIDとパスワードが存在するか否かを検索し、同一のユーザIDとパスワードが存在しないときは、Webサービスサーバ11にユーザの認証失敗を通知し、同一のユーザIDとパスワードを検索したときは、Webサービスサーバ11にユーザの認証成功を通知する(P17)。Webサービスサーバ11は、認証失敗の通知を受けたとき、P10において、ユーザPC1にコネクション切断要求を出してHTTPコネクションを終了させ、認証成功の通知を受けたときは、P10からP12に移行して認証サーバ12に再びユーザID(U001)を送信する。認証サーバ12は、再びWebサービスサーバ11からのユーザIDが受信されると拠点情報テーブル12aにアクセスし、そのユーザID(U001)をキーとして拠点情報サーバ13のアドレス(SV013)を検索し、Webサービスサーバ11へ送信する(P18)。
When the
Webサービスサーバ11は、ユーザID(U001)に対応して設定されたアドレス(SV013)が受信されると、P12からP14へ移行してユーザPC1に評価パラメータを要求する。一方、ユーザPC1は、この要求を受けたときに、認識評価に必要な評価パラメータ(評価バッチリスト、画像バッチ、レイアウト情報、正解バッチ及び自己のメールアドレス)をWebサービスサーバ11に送信する(P13)。この評価パラメータは、実施の形態1で述べたようにオペレータによって作成されたものであり、本実施の形態の場合は、評価パラメータには認識パッケージが含まれていない。これは、前述したように拠点情報サーバ13が保持しているためである。
When the
Webサービスサーバ11は、評価パラメータが受信されると、先に取得したアドレス(SV013)を用いて拠点情報サーバ13に認識パッケージの取得を要求する(P14)。拠点情報サーバ13は、この要求を受けたときに、受信されたアドレスに関連付けられたユーザID(U001)の認識パッケージP001,P002を認識パッケージファイル13aから読み出し、Webサービスサーバ11に提供する(P19)。なお、Webサービスサーバ11は、ユーザPC1から取得した評価パラメータに不足分があった場合、不足分の要求を行い、また、ユーザIDに対する拠点情報サーバ13のアドレスが無効になっていた場合には、そのユーザIDを有するユーザPC1に認識パッケージP001,P002を要求する。そして、Webサービスサーバ11は、要求した認識パッケージP001,P002が受信されたときにP14からP15へ移行し、先に受信した評価パラメータに認識パッケージP001,P002を添付してOCR評価サーバ7に送信し、OCR評価サーバ7からの認識中メッセージが受信されたときは、P16に移行してユーザPC1に対しコネクション切断を要求し、本サーバ11との接続を一旦切断させる。
When the evaluation parameter is received, the
一方、OCR評価サーバ7は、認識パッケージP001,P002が添付された評価パラメータが受信されたとき、認識パラメータファイル150に格納する。その後は、実施の形態1と同様に、評価環境設定部101が、認識評価に必要な環境設定のために、その評価パラメータを解析して、予め定められた各ファイル151〜155にそれぞれ格納する。次いで、認識評価部106が、評価バッチリストファイル151に格納された評価バッチB001,B002の指定に基づいて、評価対象画像を読取領域毎に認識し、その認識画像を認識結果ファイル107に格納する。その後は、集計部109が、認識結果ファイル107に格納された認識画像とこの認識画像に対して設定された正解情報とを比較して、正読、誤読或いは不読の何れかを判別し、その結果を評価結果ファイル113に格納し、そして、評価バッチB001,B002の指定による評価対象画像の認識評価が完了すると、評価結果ファイル113に格納した認識評価の結果をデータとして、正読率、誤読率及び不読率をそれぞれ求め、これに基づいて各種評価表を作成し(図11〜図13参照)、また、作成した評価表に基づいてバージョンの異なる認識パッケージP001,P002の性能比較表を作成し(図14〜図16参照)、評価結果ファイル113に格納する。評価表及び性能比較表の作成が終了したときは、メール送信部111が、評価パラメータファイル101に格納されているメールアドレスを用いて、ユーザPC1に評価完了メッセージを送信する(P20)。
On the other hand, the
ユーザPC1は、評価完了メッセージが受信されると、評価結果を取得するために、再びユーザID(U001)とパスワードをWebサービスサーバ11に送信し、この送信により評価結果(評価表及び性能比較表)が受信されたときは、それを読み込んで終了する(P21)。一方、Webサービスサーバ11は、P10において、受信されたユーザID(U001)とパスワードを認証サーバ12に転送し、この転送により認証成功の通知を受けたときは、P22に移行してOCR評価サーバ7に評価結果の取得を要求する。OCR評価サーバ7は、この要求に応じた評価結果を評価結果ファイル113から読み出して、Webサービスサーバ11に送信する(P23)。この時、Webサービスサーバ11は、受信された評価結果の評価表及び性能比較表をユーザPC1に転送して終了する(P22)。
When the evaluation completion message is received, the
以上のように実施の形態2によれば、Webサービスサーバ11と拠点情報サーバ13とでユーザ側の認識パッケージの管理を代行するようにしたので、ユーザ側においては、認識パッケージの管理から開放される。また、認識パッケージの管理がなくなるため、評価パラメータの作成時間が軽減され、評価パラメータの送信処理時間が短縮される。
As described above, according to the second embodiment, the management of the recognition package on the user side is performed by the
実施の形態3.
本発明の実施の形態3について図21〜図27を用いて説明する。なお、図17で説明した実施の形態2と同一又は相当部分には同じ符号を付し説明を省略する。
実施の形態3においては、図21に示すように、ベンダネットワーク3の非公開セグメント6上に画像データベースサーバ14を付加したものである。
A third embodiment of the present invention will be described with reference to FIGS. Note that the same or corresponding parts as those in the second embodiment described with reference to FIG.
In the third embodiment, as shown in FIG. 21, an
この画像データベースサーバ14は、図22に示すように、ユーザID毎に画像バッチが書き込まれたユーザ別画像バッチファイル14aを有し、ユーザIDが添付された画像バッチ取得要求をWebサービスサーバ11から受けたときに、そのユーザIDに設定された画像バッチをユーザ別画像バッチファイル14aから抽出し、Webサービスサーバ11に送信する。ユーザ別画像バッチファイル14aに記載の画像I001,I002は、評価対象の画像(文字や数字)を指定する番号で、各番号と帳票上の評価対象の画像とが関連付けられて前記ファイル14aに書き込まれている。
As shown in FIG. 22, the
また、画像データベースサーバ14は、図23に示すように画像サービスメニューを有し、ユーザPC1からのメニュー読込要求を受けたときにその画像サービスメニューを画面上に表示させ、何れかのメニューが指定されたときは、該当する手段が実行するようになっている。画像サービスメニューの「画像登録」が指定された後に、ユーザIDと画像バッチ番号及び評価対象の画像が受信されたときは、評価対象の画像をユーザID及び画像バッチ番号と関連付けてユーザ別画像バッチファイル14aに登録する。「画像参照」が指定されたときは、ユーザID及び画像バッチ番号をキーとしてユーザ別画像バッチファイル14aから該当する画像を読み出しユーザPC1の画面上に表示させる。
Also, the
この状態において「画像削除」が指定された後に、削除対象の画像が選択されたときは、その画像をユーザ別画像バッチファイル14aから削除する。画像を画面上に表示しているときに「画像補正」が指定された場合は、その画像の傾きなどを補正する。これは、画像を参照するときの視認性をよくするための機能である。「画質チエック」が指定された場合は、ユーザが登録した各画像の画質をチェックする。「画像シュリンク」が指定された後に、シュリンク対象の画像が選択されたときは、その画像をシュリンクする。
If an image to be deleted is selected after “Delete image” is specified in this state, the image is deleted from the user-specific
前記の画像補正は、例えば、図24(a)に示すように背景が白の帳票の画像傾きを補正する場合、画像内を1ライン又は数ライン毎にスキャニングして、白から黒、黒から白への変化点を検出して罫線を認識する。そして、いくつか認識した罫線の最も外側の位置から仮想的な帳票の4つのコーナの座標を算出し、この4点の座標から帳票の中心座標を算出する。次いで、帳票のコーナの座標から帳票の傾きの角度を算出し、帳票の中心座標を中心に傾き角度がゼロになるように回転させて画像の傾きを補正する。また、図24(b)に示すように回転補正する場合は、ユーザPC1からの指定角度に基づいて行う。 For example, in the case of correcting the image inclination of a form with a white background as shown in FIG. 24A, the image correction is performed by scanning the inside of the image every one line or every several lines, and from white to black or black. The ruled line is recognized by detecting the change point to white. Then, the coordinates of the four corners of the virtual form are calculated from the outermost positions of the recognized ruled lines, and the center coordinates of the form are calculated from the coordinates of these four points. Next, the inclination angle of the form is calculated from the coordinates of the corners of the form, and the inclination of the image is corrected by rotating the form so that the inclination angle becomes zero around the center coordinates of the form. Further, as shown in FIG. 24B, the rotation correction is performed based on a specified angle from the user PC1.
画質チエックは、図25に示すように罫線かすれ、文字かすれ、文字潰れなどをチエックするためのもので、例えば、文字矩形(面積)内の黒ブロックの数や黒点数(黒点数密度)を計算し、黒ブロックが多数点在している場合は「かすれ」と判断し、また、黒点密度が高い部分があるときは「潰れ」と判断する。この画質チエックにより、品質の悪い画像をチエックすることが可能になる。画像シュリンクは、図26(a)に示すように帳票画像群から登録画像の読取対象部分だけを抽出して領域シュリンク画像を作成し(b)、さらに、この画像から文字だけを抽出して文字シュリンク画像を作成する。これにより、評価対象の画像のファイルサイズ(ユーザ別画像バッチファイル14a)を削減することができ、評価時間の短縮、及び記録媒体(ハードディスクやバックアップテープなど)の容量を節約できる。
As shown in FIG. 25, the image quality check is used to check for blurred lines, blurred characters, crushing characters, and the like. For example, the number of black blocks and the number of black dots (black dot density) in a character rectangle (area) are calculated. If a large number of black blocks are scattered, it is determined as “blurred”, and if there is a portion where the black dot density is high, it is determined as “collapsed”. This image quality check makes it possible to check an image with poor quality. In the image shrink, as shown in FIG. 26 (a), only the read target portion of the registered image is extracted from the form image group to create a region shrink image (b). Create a shrink image. Thereby, the file size of the image to be evaluated (user-specific
次に、ユーザ側からOCR評価の依頼を受けたときの動作を図27に示すシーケンス図に基づいて説明する。なお、実施の形態3では、Webサービスサーバ11と画像データベースサーバ14との間の動作だけとし、その他の部分については、実施の形態2と同じであるため動作の説明を省略する。
Webサービスサーバ11は、P14において、拠点情報サーバ13から所望の認識パッケージを受け取ると、画像データベースサーバ14に対しユーザIDを添付した画像バッチ要求を通知する。一方、画像データベースサーバ14は、そのユーザIDがU001のときは、そのIDに設定された画像バッチ(画像I001,I002)をユーザ別画像バッチファイル14aから抽出し、Webサービスサーバ11に送信する(P19−2)。なお、Webサービスサーバ11は、画像データベースサーバ14から所望の画像バッチの提供を受けられなかった場合には、ユーザPC1に対し、評価パラメータ不足として画像バッチの取得を要求するようになっている。また、このWebサービスサーバ11は、画像バッチ(画像I001,I002)が受信されたとき、P14からP15に移行して、先に取得した評価パラメータに認識パッケージ及び画像バッチ(画像I001,I002)を添付し、OCR評価サーバ7に送信する。
Next, the operation when receiving a request for OCR evaluation from the user will be described based on the sequence diagram shown in FIG. In the third embodiment, only the operation between the
When the
なお、評価画像に文字パターン画像を使用する場合は、画像バッチファイルの指定は省略される。このような場合、OCR評価サーバ7の評価環境設定部101は、以下のような動作を行う。
(1)正解バッチを参照して認識評価を行うべき文字の情報を得る。
(2)その文字の情報に基づいて評価対象の文字のパターン画像を画像データベースサーバ14から取得する。
(3)取得した画像を文字毎に一つの画像に結合する。
(4)結合した画像に合わせてレイアウト情報を作成する。
(5)結合した画像とレイアウト情報を基にそれぞれ画像バッチファイル及びレイアウト情報ファイルを作成する。
前記の(3)では、実際の使用条件に近づけるためにパターンを合成して一つの画像にするとしたが、文字パターン画像を合成せずにそのまま使用してもよい。
When a character pattern image is used as the evaluation image, the designation of the image batch file is omitted. In such a case, the evaluation
(1) Get information on characters to be recognized and evaluated by referring to the correct batch.
(2) A pattern image of the character to be evaluated is acquired from the
(3) Combine the acquired images into one image for each character.
(4) Create layout information according to the combined image.
(5) Create an image batch file and a layout information file based on the combined image and layout information, respectively.
In the above (3), the pattern is synthesized to form one image in order to approximate the actual use conditions. However, the character pattern image may be used as it is without being synthesized.
以上のように実施の形態3によれば、画像データベースサーバ14がユーザ毎の評価対象の画像を管理しているので、ユーザ側においては、認識パッケージ及び画像バッチの管理から開放される。また、認識パッケージ及び画像バッチの管理がなくなるため、評価パラメータの作成時間がさらに軽減され、評価パラメータの送信処理時間がさらに短縮される。
As described above, according to the third embodiment, since the
実施の形態4.
本発明の実施の形態4について図28〜図34を用いて説明する。なお、図21で説明した実施の形態3と同一又は相当部分には同じ符号を付し説明を省略する。
実施の形態4においては、図28に示すように、ベンダネットワーク3の非公開セグメント6上にレイアウトデータベースサーバ15を付加したものである。
In the fourth embodiment, as shown in FIG. 28, a
このレイアウトデータベースサーバ15は、図29に示すように、ユーザID毎にレイアウト情報が書き込まれたユーザ別レイアウト情報ファイル15aを有し、ユーザIDが添付されたレイアウト取得要求をWebサービスサーバ11から受けたときに、そのユーザIDに設定された帳票種別1,2をユーザ別レイアウト情報ファイル15aから抽出し、Webサービスサーバ11に送信する。ユーザ別レイアウト情報ファイル15aに記載の帳票種別1,2は、評価対象の帳票画像を指定する番号で、各番号と帳票画像とが関連付けられて前記ファイル15aに書き込まれている。
As shown in FIG. 29, the
また、レイアウトデータベースサーバ15は、図30に示すようにレイアウトサービスメニューを有し、ユーザPC1からのメニュー読込要求を受けたときにそのサービスメニューを画面上に表示させ、何れかのメニューが指定されたときは、該当する手段を実行するようになっている。レイアウトサービスメニューの「レイアウト登録」が指定された後に、ユーザIDと帳票種別及び評価対象の帳票のレイアウトが受信されたときは、評価対象のレイアウトをユーザID及び帳票種別と関連付けてユーザ別レイアウト情報ファイル15aに登録する。「レイアウト参照」が指定されたときは、ユーザID及び帳票種別をキーとしてユーザ別レイアウト情報ファイル15aから該当するレイアウトを読み出しユーザPC1の画面上に表示させる。この機能により、ユーザ側は標準のレイアウトを取得することが可能になる。
Further, the
この状態において「レイアウト削除」が指定され、削除対象のレイアウトが選択されたときは、その帳票をユーザ別レイアウト情報ファイル15aから削除する。「レイアウト作成」が指定され、例えば図31(a)に示すような帳票全体の画像が受信されたときは、その画像から罫線検出により読取領域を設定して抽出し、前記帳票のレイアウトを作成する((b)参照)。この機能により、ユーザ側はレイアウトの作成から開放される。なお、作成したレイアウトは、メニューの「レイアウト登録」を指定することにより、ユーザ別レイアウト情報ファイル15aに登録することができる。
In this state, when “delete layout” is designated and a layout to be deleted is selected, the form is deleted from the user-specific
「レイアウト参照」により画面上に表示されたレイアウトが図32(a)に示すように読取領域がずれていた場合に、「レイアウト補正」を指定すると、前記と同様にその画像から罫線検出により読取領域を補正する((b)参照)。この機能により、ラフに作成したレイアウトを正確な位置に補正することが可能になり、ユーザによるレイアウト作成が容易になる。なお、この場合も「レイアウト登録」が指定されたときに、補正した読取領域のレイアウトを登録する。「レイアウトシュリンク」が指定された後に、シュリンク画像のレイアウトが選択されたときは、その画像をシュリンクする(図33(a)(b)参照)。この機能により、シュリンク画像のレイアウト作成が容易になる。なお、特に、文字パターン画像については、過去の表間を行った帳票や領域毎の画像からその都度切り出して蓄積すると共に、かすれ、潰れ、歪みなどをフィルタ処理によってパターンのバリエーションを充実させる。 When the layout displayed on the screen by “reference layout” is shifted as shown in FIG. 32A and “layout correction” is designated, reading is performed from the image by ruled line detection as described above. The area is corrected (see (b)). This function makes it possible to correct a roughly created layout to an accurate position, and facilitates layout creation by the user. In this case as well, the layout of the corrected reading area is registered when “layout registration” is designated. When the layout of the shrink image is selected after “Layout Shrink” is designated, the image is shrunk (see FIGS. 33A and 33B). This function makes it easy to create a shrink image layout. In particular, with regard to the character pattern image, it is cut out and accumulated each time from the form and the image for each area in the past, and the pattern variation is enhanced by filtering processing such as blurring, crushing, and distortion.
次に、ユーザ側からOCR評価の依頼を受けたときの動作を図34に示すシーケンス図に基づいて説明する。なお、実施の形態4では、Webサービスサーバ11とレイアウトデータベースサーバ15との間の動作だけとし、その他の部分については、実施の形態3と同じであるため動作の説明を省略する。
Webサービスサーバ11は、P14において、画像データベースサーバ14から所望の画像バッチを受け取ると、レイアウトデータベースサーバ15に対しユーザIDを添付したレイアウト要求を通知する。一方、レイアウトデータベースサーバ15は、そのユーザIDがU001のときは、そのIDに設定されたレイアウト情報(帳票種別1,2)をユーザ別レイアウトファイル15aから抽出し、Webサービスサーバ11に送信する(P19−3)。なお、Webサービスサーバ11は、レイアウトデータベースサーバ15から所望のレイアウト情報の提供を受けられなかった場合には、ユーザPC1に対し、評価パラメータ不足としてレイアウト情報の取得を要求するようになっている。また、このWebサービスサーバ11は、レイアウト情報(帳票種別1,2)が受信されると、P14からP15に移行して、先に取得した評価パラメータに認識パッケージ、画像バッチ及びレイアウト情報(帳票種別1,2)を添付し、OCR評価サーバ7に送信する。
Next, the operation when a request for OCR evaluation is received from the user side will be described based on the sequence diagram shown in FIG. In the fourth embodiment, only the operation between the
When the
以上のように実施の形態4によれば、レイアウトデータベースサーバ15がユーザ毎のレイアウト情報を管理しているので、ユーザ側においては、認識パッケージ、画像バッチ及びレイアウト情報の管理から開放される。また、認識パッケージ、画像バッチ及びレイアウト情報の管理がなくなるため、評価パラメータの作成に要する労力が軽減され、評価パラメータの送信処理時間が実施の形態3と比べてさらに短縮される。
As described above, according to the fourth embodiment, since the
実施の形態5.
本発明の実施の形態5について図35〜図40を用いて説明する。なお、図28で説明した実施の形態4と同一又は相当部分には同じ符号を付し説明を省略する。
実施の形態5においては、図35に示すように、ベンダネットワーク3の非公開セグメント6上に正解データベースサーバ16を付加したものである。
In the fifth embodiment, as shown in FIG. 35, a
この正解データベースサーバ16は、図36に示すように、ユーザID毎に正解情報が書き込まれたユーザ別正解情報ファイル16aを有し、ユーザIDが添付された正解情報取得要求をWebサービスサーバ11から受けたときに、そのユーザIDに設定された正解情報S001、S002をユーザ別正解情報ファイル16aから抽出し、Webサービスサーバ11に送信する。ユーザ別正解情報ファイル16aに記載の正解情報S001、S002は、正解の画像を指定する番号で、各番号と帳票画像とが関連付けられて前記ファイル16aに書き込まれている。
As shown in FIG. 36, the
また、正解データベースサーバ16は、図37に示すように正解サービスメニューを有し、ユーザPC1からのメニュー読込要求を受けたときにそのサービスメニューを画面上に表示させ、何れかのメニューが指定されたときは、該当する手段を実行するようになっている。レイアウトサービスメニューの「正解登録」が指定された後に、ユーザIDと正解情報番号及び正解画像が受信されたときは、その画像をユーザID及び正解情報番号と関連付けてユーザ別正解情報ファイル16aに登録する。「正解参照」が指定されたときは、ユーザID及び正解情報番号をキーとしてユーザ別正解情報ファイル16aから該当する正解情報を読み出しユーザPC1の画面上に表示させる。
Further, the
この状態において「正解削除」が指定され、削除対象の正解画像が選択されたときは、その画像をユーザ別正解情報ファイル16aから削除する。「正解作成」が指定され、例えばスキャナによって読み込まれた図38(a)に示すような画像が受信されたときは、その画像から罫線検出により読取領域を検索して、その領域の画像を正解情報として作成する((b)参照)。この機能を使用することで、ユーザ側は正解情報の作成から開放される。なお、作成した正解情報は、メニューの「正解登録」を指定することにより、ユーザ別正解情報ファイル16aに登録することができる。
In this state, when “correct answer deletion” is designated and the correct image to be deleted is selected, the image is deleted from the user-specific
「正解補正」が指定された後に、図39(a)(b)に示すように、正解画像と補正を要する画像とが受信されたときは、補正を要する画像に対して正解画像を基に補正する。この機能により、ラフに作成した正解の画像を正しく補正することが可能になり、ユーザによる正解画像の作成が容易になる。なお、この場合も「正解登録」が指定されたときに、補正した正解画像を正解情報として登録する。 After the “correction correction” is designated, as shown in FIGS. 39A and 39B, when the correct image and the image that requires correction are received, the correct image is determined based on the correct image. to correct. With this function, it is possible to correct a rough image of a correct answer correctly, and a user can easily create a correct image. In this case as well, when “correct answer registration” is designated, the corrected correct image is registered as correct answer information.
次に、ユーザ側からOCR評価の依頼を受けたときの動作を図40に示すシーケンス図に基づいて説明する。なお、実施の形態5では、Webサービスサーバ11と正解データベースサーバ16との間の動作だけとし、その他の部分については、実施の形態4と同じであるため動作の説明を省略する。
Webサービスサーバ11は、P14において、レイアウトデータベースサーバ15から所望のレイアウト情報を受け取ると、正解データベースサーバ16に対しユーザIDを添付した正解情報要求を通知する。一方、正解データベースサーバ16は、そのユーザIDがU001のときは、そのIDに設定された正解情報S001、S002をユーザ別正解情報ファイル16aから抽出し、Webサービスサーバ11に送信する(P19−4)。なお、Webサービスサーバ11は、正解データベースサーバ16から所望の正解情報の提供を受けられなかった場合には、ユーザPC1に対し、評価パラメータ不足として正解情報の取得を要求するようになっている。また、このWebサービスサーバ11は、正解情報S001、S002が受信されると、P14からP15に移行して、先に取得した評価パラメータに認識パッケージ、画像バッチ、レイアウト情報及び正解情報S001、S002を添付し、OCR評価サーバ7に送信する。
Next, the operation when receiving a request for OCR evaluation from the user will be described based on the sequence diagram shown in FIG. In the fifth embodiment, only the operation between the
When the
以上のように実施の形態5によれば、正解データベースサーバ16がユーザ毎の正解情報を管理しているので、ユーザ側においては、認識パッケージ、画像バッチ、レイアウト情報及び正解情報の管理から開放される。また、認識パッケージ、画像バッチ、レイアウト情報及び正解情報の管理がなくなるため、評価パラメータの作成に要する労力がさらに軽減され、評価パラメータの送信処理時間が実施の形態4と比べさらに短縮される。
As described above, according to the fifth embodiment, since the correct
実施の形態6.
本発明の実施の形態6について図41〜図44を用いて説明する。なお、図35で説明した実施の形態5と同一又は相当部分には同じ符号を付し説明を省略する。
実施の形態6においては、図41に示すように、ベンダネットワーク3の非公開セグメント6上に分析サービスサーバ17を付加したものである。
A sixth embodiment of the present invention will be described with reference to FIGS. In addition, the same code | symbol is attached | subjected to the same or equivalent part as
In the sixth embodiment, as shown in FIG. 41, an
この分析サービスサーバ17は、OCR評価サーバ7によって認識された画像のうち誤読又は不読の画像を分析して、例えば図42に示すような分析表を作成する。この分析表には、評価したときの「バッチ番号」、「評価番号」、評価対象の帳票の「読取領域番号」、正解情報に基づく「正解画像」、OCR評価サーバ7によって認識された「認識結果の画像」、OCR評価サーバ7による「判定結果」、評価対象の「領域画像」、「原因」などが示される。
The
また、分析サービスサーバ17は、図43に示すように分析サービスメニューを有し、ユーザPC1からのメニュー読込要求を受けたときにそのサービスメニューを画面上に表示させ、何れかのメニューが指定されたときはその機能を実行するようになっている。「分析結果参照」が指定された場合は、作成した分析表をユーザPC1の画面上に表示させ、「分析結果作成」が指定されたときは、前述したように、OCR評価サーバ7によって認識された画像のうち誤読又は不読の画像を分析して、その分析表を画面上に表示させる。
The
次に、ユーザ側からOCR評価の依頼を受けたときの動作を図40に示すシーケンス図に基づいて説明する。なお、実施の形態6では、OCR評価サーバ11と分析サービスサーバ17との間の動作だけとし、その他の部分については、実施の形態5と同じであるため動作の説明を省略する。
OCR評価サーバ11は、P20において、評価バッチの指定による評価対象画像の認識評価(正読、誤読及び不読)が完了したときに、分析サービスサーバ17に対して分析依頼をする。この時、誤読及び不読に関するバッチ番号、評価番号、評価対象の帳票の読取領域番号、正解情報に基づく正解画像、認識した認識結果の画像、判定結果(誤読或いは不読)、評価対象の領域画像などをデータとして分析サービスサーバ17に通知する。一方、分析サービスサーバ17は、分析に必要なデータが受信されると、このデータに基づいて図42に示すような分析表を作成する。この分析表を作成する際、判定結果が不読の場合は「原因」の欄に不読の原因を書き込む。そして、分析表の作成完了時にOCR評価サーバ11に通知する(P24)。
Next, the operation when a request for OCR evaluation is received from the user will be described based on the sequence diagram shown in FIG. In the sixth embodiment, only the operation between the
In P20, the
以上のように実施の形態6によれば、OCR評価サーバ7によって認識された画像のうち誤読又は不読の画像を分析して、その結果をユーザ側に通知するようにしたので、ユーザ側にとっては、誤読、不読の原因がわかり、その原因の内容によっては事前に対処できる。
As described above, according to the sixth embodiment, misread or unread images among the images recognized by the
1 ユーザPC、 2 インターネット、3 ベンダネットワーク、4 ゲートウェイ、5 公開セグメント、6 非公開セグメント、7 OCR評価サーバ、8 メールサーバ、9 OCR開発用PC、10 システム設計用PC、11 Webサービスサーバ、12 認証サーバ、13 拠点情報サーバ、14 画像データベースサーバ、15 レイアウトデータベースサーバ、16 正解データベースサーバ、17 分析サービスサーバ。
1 User PC, 2 Internet, 3 Vendor Network, 4 Gateway, 5 Public Segment, 6 Private Segment, 7 OCR Evaluation Server, 8 Mail Server, 9 OCR Development PC, 10 System Design PC, 11 Web Service Server, 12 Authentication server, 13 site information server, 14 image database server, 15 layout database server, 16 correct database server, 17 analysis service server.
Claims (11)
前記Webサービスサーバは、ユーザ端末からのユーザ識別情報が公衆通信網を介して受信されたときに前記認証サーバに転送して認証させ、認証が成功のときは、ユーザ端末に対して評価対象の画像、及び画像評価に必要なデータを要求し、この要求により評価対象の画像、及び画像評価に必要なデータが受信されたときは、拠点情報サーバから認識プログラムを読み込んで、評価対象の画像及び前記データと共にOCR評価サーバに通知し、
前記OCR評価サーバは、認識プログラムに基づいて評価対象の画像を認識し、かつ、前記データを用いて認識画像の評価結果を求めることを特徴とするOCR評価システム。 A web service server, an authentication server having at least user identification information, a base information server having a recognition program for recognizing an image to be evaluated, and an OCR evaluation server are arranged on a network constructed in a predetermined area,
When the user identification information from the user terminal is received via the public communication network, the Web service server forwards the authentication information to the authentication server, and when the authentication is successful, When an image and data necessary for image evaluation are requested and the image to be evaluated and data necessary for image evaluation are received by this request, the recognition program is read from the base information server, and the image to be evaluated and Notify the OCR assessment server with the data,
The OCR evaluation server recognizes an image to be evaluated based on a recognition program and obtains a recognition image evaluation result using the data.
前記Webサービスサーバは、前記認証サーバによるユーザ識別情報の認証が成功のとき、ユーザ端末に対して画像評価に必要なデータを要求し、この要求によりそのデータが受信されたときは、拠点情報サーバから認識プログラムを読み込むと共に、前記画像データベースサーバから評価対象の画像を読み込んで、前記データと共にOCR評価サーバに通知することを特徴とする請求項2記載のOCR評価システム。 An image database server arranged on the network and having an image to be evaluated as data is arranged on the network,
When the authentication of the user identification information by the authentication server is successful, the Web service server requests data required for image evaluation from the user terminal, and when the data is received by this request, the base information server 3. The OCR evaluation system according to claim 2, wherein a recognition program is read from the image database, an image to be evaluated is read from the image database server, and the OCR evaluation server is notified together with the data.
前記Webサービスサーバは、前記認証サーバによるユーザ識別情報の認証が成功のとき、ユーザ端末に対して、認識プログラム及びレイアウト情報を除く画像評価に必要なデータを要求し、この要求により前記データが受信されたときは、前記拠点情報サーバから認識プログラムを、前記画像データベースサーバから評価対象の画像をそれぞれ読み込むと共に、前記レイアウトデータベースサーバからレイアウト情報を読み込んで、前記データと共にOCR評価サーバに通知し、
前記OCR評価サーバは、認識プログラムに基づいて評価対象の画像をレイアウト情報を適用して認識し、かつ、前記データを用いて認識画像の評価結果を求めることを特徴とする請求項3記載のOCR評価システム。 A layout database server having layout information of an image to be evaluated among data necessary for image evaluation is arranged on the network,
When the authentication of the user identification information by the authentication server is successful, the Web service server requests the user terminal for data necessary for image evaluation excluding the recognition program and layout information, and the data is received by this request. When the recognition program is read from the site information server, the image to be evaluated is read from the image database server, the layout information is read from the layout database server, and notified to the OCR evaluation server together with the data,
4. The OCR evaluation server according to claim 3, wherein the OCR evaluation server recognizes an image to be evaluated by applying layout information based on a recognition program, and obtains an evaluation result of the recognized image using the data. Evaluation system.
前記Webサービスサーバは、前記認証サーバによるユーザ識別情報の認証が成功のとき、前記拠点情報サーバから認識プログラムを、前記画像データベースサーバから評価対象の画像を、前記レイアウトデータベースサーバからレイアウト情報をそれぞれ読み込むと共に、前記正解データベースサーバから正解情報を読み込んで、それぞれOCR評価サーバに通知し、
前記OCR評価サーバは、認識プログラムに基づいて評価対象の画像をレイアウト情報を適用して認識し、かつ、正解情報に基づいて認識画像の評価結果を求めることを特徴とする請求項4記載のOCR評価システム。 A correct database server having correct information to be compared with an image to be evaluated among data necessary for image evaluation is arranged on the network,
When the authentication of user identification information by the authentication server is successful, the Web service server reads a recognition program from the site information server, an image to be evaluated from the image database server, and layout information from the layout database server. In addition, the correct answer information is read from the correct answer database server and notified to each OCR evaluation server,
5. The OCR evaluation server according to claim 4, wherein the OCR evaluation server recognizes an image to be evaluated by applying layout information based on a recognition program, and obtains an evaluation result of the recognized image based on correct answer information. Evaluation system.
The analysis service server transmits the analysis result of the recognition image to the user terminal in response to the analysis result reference request from the user terminal, analyzes the recognition image in response to the analysis result creation request from the user terminal, and outputs the result. The OCR evaluation system according to claim 3, wherein the OCR evaluation system transmits to the user terminal.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004118833A JP2005301793A (en) | 2004-04-14 | 2004-04-14 | Ocr evaluation system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004118833A JP2005301793A (en) | 2004-04-14 | 2004-04-14 | Ocr evaluation system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005301793A true JP2005301793A (en) | 2005-10-27 |
Family
ID=35333228
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004118833A Abandoned JP2005301793A (en) | 2004-04-14 | 2004-04-14 | Ocr evaluation system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005301793A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007264833A (en) * | 2006-03-27 | 2007-10-11 | Oki Electric Ind Co Ltd | Document classification process system, method for creating electronic medium receipt, and delivery method |
US8228522B2 (en) | 2007-01-29 | 2012-07-24 | Kabushiki Kaisha Toshiba | Document data management apparatus to manage document data read and digitized by an image reading apparatus and a technique to improve reliability of various processing using document data |
JP2015176242A (en) * | 2014-03-13 | 2015-10-05 | 株式会社東芝 | Character recognition device, divider and program |
-
2004
- 2004-04-14 JP JP2004118833A patent/JP2005301793A/en not_active Abandoned
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007264833A (en) * | 2006-03-27 | 2007-10-11 | Oki Electric Ind Co Ltd | Document classification process system, method for creating electronic medium receipt, and delivery method |
US8228522B2 (en) | 2007-01-29 | 2012-07-24 | Kabushiki Kaisha Toshiba | Document data management apparatus to manage document data read and digitized by an image reading apparatus and a technique to improve reliability of various processing using document data |
JP2015176242A (en) * | 2014-03-13 | 2015-10-05 | 株式会社東芝 | Character recognition device, divider and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4561474B2 (en) | Electronic document storage system | |
US20090285444A1 (en) | Web-Based Content Detection in Images, Extraction and Recognition | |
US20070046982A1 (en) | Triggering actions with captured input in a mixed media environment | |
JPH10320410A (en) | Address input system, and computer readable recording medium recorded with address input program | |
JP6387704B2 (en) | Information processing system, information processing method, terminal device, and program | |
US20090240519A1 (en) | Dwell-unit-management supporting system, dwell-unit-management supporting method, computer-readable recording medium, server and multiple function processing machine | |
KR100587876B1 (en) | Method and program for linking different applications through data displayed on screen | |
JP4769655B2 (en) | Scanning apparatus and data registration method | |
CN109857499B (en) | Universal method for acquiring cash register software screen amount based on windows system | |
US20210397798A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
CN102004869B (en) | Authentication apparatus and authentication method | |
US20040044775A1 (en) | Content relay method for transmitting entry history information stored in history storage of content relay device to user terminal | |
JP2009252041A (en) | Business form image management system, method, and program | |
JP5403725B2 (en) | Service providing system and service providing method using server | |
JP2005301793A (en) | Ocr evaluation system | |
JP5243054B2 (en) | Data management system, method and program | |
JP2005057501A (en) | Mobile communication terminal and communication system using the same | |
JPWO2004068407A1 (en) | Data linkage support method between applications | |
JP4430490B2 (en) | Data entry device, control method therefor, and program | |
CN102194070A (en) | Data processing method and system as well as computer program product thereof | |
CN106055693A (en) | Information processing method and terminal | |
JP2017228084A (en) | Personal information registration/management system | |
US20240037214A1 (en) | Information processing device, information processing method, and computer readable medium | |
JP2003099700A (en) | Form processing system, form processor, form processing method, form processing program and computer-readable recording medium with form processing program recorded | |
JP2023172261A (en) | Information processing apparatus and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070116 |
|
A762 | Written abandonment of application |
Free format text: JAPANESE INTERMEDIATE CODE: A762 Effective date: 20090812 |