WO2009122696A1

WO2009122696A1 - 文字認識装置、文字認識プログラム、及び、文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number: WO2009122696A1
Application number: PCT/JP2009/001412
Authority: WO
Inventors: 松田博明
Original assignee: Matsuda Hiroaki
Priority date: 2008-04-04
Filing date: 2009-03-27
Publication date: 2009-10-08
Also published as: JP2009251918A

Abstract

　元画像２０１とＯＣＲ結果２０６から認識文字を活字体フォントデータに置換したＯＣＲ可逆化分割画像２０７を生成して表示し、管理者から誤認識文字と誤未認識文字を含む領域を特定可能な目減り結果２０９の入力を受け付ける管理者端末３を提供する。管理者端末３によれば、文字認識に不備があった文字、すなわち認識された文字のうち誤認識された文字と、文字として認識されなかった領域に含まれる文字が未認識である領域と、を認識結果合成データの中から識別できる。これにより、文字認識に不備があった文字に確実に出力できる。

Description

文字認識装置、文字認識プログラム、及び、文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体

　本発明は、原稿に書かれている文字を光学的に認識して、文字データとして出力するための文字認識装置に関する。

　従来、原稿に書かれている文字を光学的に認識して文字データとして出力するための文字認識装置には、誤認識を低減したいという要望があった。

　また、このような文字認識装置を用いて出力した文字データは、その後、誤認識した文字を人手により入力しなおす場合が多く、誤認識した文字の数や位置などの情報を出力したいという要望があった。

　そこで、認識できた文字と認識できなかった文字とを識別可能に表示するものが提案されている（例えば、特許文献１参照）。

特開２００５－１８６７８号公報、請求項１

　しかしながら、特許文献１にあっては、認識できた文字と認識できなかった領域とを識別可能に表示しているが、認識できた文字には、認識が正しかった文字と誤認識した文字とが含まれうる。また、認識できなかった領域には、未認識である文字が含まれうる。このうち、その後の入力対象となるのは、認識できた文字に含まれる誤認識した文字と、認識できなかった領域に含まれる文字であるが、これらの文字認識に不備があった文字を見分けることが難しいという問題があった。

　本発明は、このような問題点に着目してなされたもので、文字認識に不備があった文字に確実に出力できる文字認識装置を提供することを目的とする。

　上記課題を解決するために、本発明の請求項１に記載の文字認識装置は、
　画像データ（元画像２０１（図２））に含まれる文字を光学的に認識して、認識された文字と該文字に該当する領域とを特定可能な認識文字データ（ＯＣＲ結果２０６）を生成する認識文字データ生成手段（ＯＣＲ処理Ｓ１０４においてＯＣＲ結果２０６を生成する処理を行う管理者端末３のＣＰＵ）と、
　前記画像データの全領域のうち、前記認識文字データ生成手段にて文字として認識された領域（二重丸マークの領域）と、文字として認識されなかった領域（はてなマークの領域）とを、利用者が識別可能な認識可否合成データ（ＯＣＲ可逆化分割画像２０７）を生成する認識可否合成データ生成手段（目減り処理Ｓ１０５においてＯＣＲ可逆化分割画像２０７を生成する処理を行う管理者端末３のＣＰＵ）と、
　前記認識可否合成データ生成手段にて生成した前記認識可否合成データと、前記画像データと、を表示する認識可否合成データ表示手段（目減り処理Ｓ１０５において元画像２０１とＯＣＲ可逆化分割画像２０７を送信する処理を行う管理者端末３のＣＰＵ）と、
　前記利用者から、前記認識可否合成データに含まれる前記文字として認識された領域のうち誤認識した文字（誤認識文字）の領域の指定（バツマークの領域）と、前記認識可否合成データに含まれる前記文字として認識されなかった領域のうち文字が未認識（誤未認識文字）である領域の指定（ゼットマークの領域）と、からなる誤認識文字データ（目減り結果２０９）を、前記認識可否合成データ表示手段に表示している前記画像データに対応付けて受け付ける誤認識文字データ受付手段（目減り処理Ｓ１０５において目減り結果２０９を受け付ける処理を行う管理者端末３のＣＰＵ））と、
　前記画像データの全領域のうち、前記認識文字データ生成手段にて前記文字として認識された領域と、前記文字として認識されなかった領域と、前記文字として認識された領域のうち、前記誤認識文字データ受付手段にて受け付けた誤認識データに含まれる誤認識した文字（誤認識文字）に該当する領域と、前記認識文字データ生成手段にて前記文字として認識されなかった領域のうち、前記誤認識文字データ受付手段にて受け付けた誤認識文字データに含まれる文字が未認識（誤未認識文字）である領域と、を、前記利用者が識別可能な認識結果合成データ（入力用画像２１０）を生成する認識結果合成データ生成手段（入力処理Ｓ１０６の一部として入力用画像２１０の生成処理を行う管理者端末３のＣＰＵ）と、
　を備える、
　ことを特徴としている。
　この特徴によれば、文字認識に不備があった文字、すなわち認識された文字のうち誤認識された文字と、文字として認識されなかった領域に含まれる文字が未認識である領域と、を認識結果合成データの中から識別できる。これにより、文字認識に不備があった文字に確実に出力できる。

　本発明の請求項２に記載の文字認識装置は、請求項１に記載の文字認識装置であって、
　前記文字認識装置（管理者端末３）は、
　前記画像データの種類（テンプレート画像２０２（図４）を特定可能な情報（例えばファイル名））と、該種類ごとに予め定められた区画（テンプレート分割画像２０４）を雛型として記憶する雛型記憶手段（テンプレート画像２０２、テンプレート分割画像２０４を記憶する記憶部）と、
　前記画像データの種類を特定する種類特定手段（テンプレート画像２０２（図４）を特定可能な情報（例えばファイル名）を管理者から受け付ける処理を行う管理者端末３のＣＰＵ）と、
　前記種類特定手段にて特定した前記画像データの種類に対応付けて、前記雛型記憶手段に記憶された雛型を特定し、該特定された雛型毎に予め定められた区画に、前記画像データを分割した分割画像データ（元画像の分割画像２０５）を前記画像データとして生成する分割画像データ生成手段（分割処理Ｓ１０３を行う管理者端末３のＣＰＵ）と、
　を備え、
　前記認識可否合成データ生成手段（目減り処理Ｓ１０５においてＯＣＲ可逆化分割画像２０７を生成する処理を行う管理者端末３のＣＰＵ）は、前記分割画像データ生成手段にて生成された前記分割画像データに含まれる文字を光学的に認識して、前記認識可否合成データ（ＯＣＲ可逆化分割画像２０７）を生成し、
　前記認識結果合成データ生成手段（入力処理Ｓ１０６において入力用画像２１０を生成する処理を行う管理者端末３のＣＰＵ）は、前記分割画像データ毎に、前記認識結果合成データ（入力用画像２１０）を生成する、
　ことを特徴としている。
　この特徴によれば、前記文字認識装置では、前記画像データの種類に応じて予め定められた区画に分割された前記認識可否合成データと、前記認識結果合成データとが生成される。そのため前記利用者は、個々の区画のみを出力させることができる。これにより、文字認識に不備があった文字を利用者が一層見つけやすくできる。

　本発明の請求項３に記載の文字認識装置は、請求項１または２のいずれかに記載の文字認識装置であって、
　前記認識結果合成データ生成手段（入力処理Ｓ１０６において入力用画像２１０を生成する処理を行う管理者端末３のＣＰＵ）は、前記画像データ（元画像２０１）の全領域のうち、前記認識文字データ生成手段（ＯＣＲ処理Ｓ１０４においてＯＣＲ結果２０６を生成する処理を行う管理者端末３のＣＰＵ）にて前記文字として認識された領域のうち、前記誤認識文字データ受付手段（目減り処理Ｓ１０５において目減り結果２０９を受け付ける処理を行う管理者端末３のＣＰＵ）にて受け付けた誤認識文字データ（目減り結果２０９）に含まれる誤認識した文字に該当する領域（バツマークの領域）と、前記認識文字データ生成手段にて前記文字として認識されなかった領域のうち、前記誤認識文字データ受付手段にて受け付けた誤認識文字データに含まれる文字が未認識である領域（ゼットマークの領域）のみを含む、前記認識結果合成データ（入力用画像２１０）を生成する、
　ことを特徴としている。
　この特徴によれば、前記利用者は、文字認識に不備があった文字のみ、すなわち文字として認識された領域においては誤認識された文字に該当する領域のみ、また、文字として認識されなかった領域においては未認識である領域のみ、が含まれた認識結果合成データを出力させることができる。これにより、前記利用者は、文字認識に不備があった文字を一層見つけやすくできる。

　本発明の請求項４に記載の文字認識装置は、請求項１～３のいずれかに記載の文字認識装置であって、
　前記認識結果合成データ生成手段（入力処理Ｓ１０６において入力用画像２１０を生成する処理を行う管理者端末３のＣＰＵ）は、前記画像データ（元画像２０１）の全領域のうち、前記認識文字データ生成手段（ＯＣＲ処理Ｓ１０４においてＯＣＲ結果２０６を生成する処理を行う管理者端末３のＣＰＵ）にて文字として認識された領域（二重丸マークの領域）と、文字として認識されなかった領域（はてなマークの領域）と、前記誤認識文字データ受付手段（目減り処理Ｓ１０５において目減り結果２０９を受け付ける処理を行う管理者端末３のＣＰＵ）にて受け付けた誤認識文字データ（目減り結果２０９）に含まれる、前記文字として認識された領域のうち誤認識した文字に該当する領域（バツマークの領域）と、前記文字として認識されなかった領域のうち未認識である文字に該当する領域（ゼットマークの領域）と、に対して互いに異なる色（たとえば、緑と黄）を付与した前記認識結果合成データ（入力用画像２１０）を生成する、
　ことを特徴としている。
　この特徴によれば、前記利用者は、文字認識に不備があった文字を、認識結果合成データの中から色により容易に識別できる。これにより、前記利用者は、文字認識に不備があった文字を一層見つけやすくできる。

　本発明の請求項５に記載の文字認識装置は、請求項１～４のいずれかに記載の文字認識装置であって、
　前記認識可否合成データ生成手段（目減り処理Ｓ１０５においてＯＣＲ可逆化分割画像２０７を生成する処理を行う管理者端末３のＣＰＵ）は、前記画像データ（元画像２０１）の全領域のうち、前記認識文字データ生成手段（ＯＣＲ処理Ｓ１０４においてＯＣＲ結果２０６を生成する処理を行う管理者端末３のＣＰＵ）にて文字として認識された領域（二重丸マークの領域）と、文字として認識されなかった領域（はてなマークの領域）と、に対して互いに異なる色（たとえば、黒と青）を付与した前記認識可否合成データ（ＯＣＲ可逆化分割画像２０７）を生成する、
　ことを特徴としている。
　この特徴によれば、前記誤認識文字データ受付手段において前記利用者は、前記認識可否合成データ中の個々の領域においてはそれぞれ１種類の文字認識の不備、すなわち、文字として認識されなかった領域においては未認識の文字、また、文字として認識された領域においては誤認識された文字、をそれぞれ見分ければ良いが、それぞれの領域には異なる色が付与されており、どの領域に対して作業しているのか、どの不備を見分けようとしているのか、という点において、前記利用者が間違いづらくなっている。これにより、前記認識可否合成データのうち、文字認識に不備があった文字を利用者が見分けやすく、さらには指示しやすくできるので、総合的な文字認識にかかるコストを低減できる。

　本発明の請求項６に記載の文字認識装置は、請求項１～５のいずれかに記載の文字認識装置であって、
　前記認識可否合成データ生成手段（目減り処理Ｓ１０５においてＯＣＲ可逆化分割画像２０７を生成する処理を行う管理者端末３のＣＰＵ）は、前記認識文字データ生成手段（ＯＣＲ処理Ｓ１０４においてＯＣＲ結果２０６を生成する処理を行う管理者端末３のＣＰＵ）にて文字として認識された領域（二重丸マークの領域）においては、前記利用者（管理者）が、（活字体フォントデータの埋め込みにより）該文字をかたどる部分のみを識別可能にした前記認識可否合成データを生成する、
　ことを特徴としている。
　この特徴によれば、前記誤認識文字データ受付手段において前記利用者は、認識可否合成データに含まれる認識された文字のうち、誤認識された文字をその文字の形により容易に識別できる。これにより、前記認識可否合成データのうち、文字認識に不備があった文字を利用者が見分けやすく、さらには指示しやすくできるので、総合的な文字認識にかかるコストを低減できる。

　本発明の請求項７に記載の文字認識装置は、請求項１～６のいずれかに記載の文字認識装置であって、
　前記文字認識装置（管理者端末３）は、
　前記利用者から３種類の異なる指示入力（エンターキー、エックスキー、リターンキー）が可能な指示入力手段（キーボードを含む入力部）を備え、
　前記誤認識文字データ受付手段（目減り処理Ｓ１０５において目減り結果２０９を受け付ける処理を行う管理者端末３のＣＰＵ）は、前記認識可否合成データ（ＯＣＲ可逆化分割画像２０７）に含まれる、文字として認識された領域（二重丸マークの領域）においては、前記指示入力手段により、文字として認識した個々の領域に対応付けて、１文字が認識できている旨を示す１の指示（エンターキー）か、１文字が認識できていない旨を示す２の指示（二重丸マークの文字に対するエックスキー）のいずれかを受け付け、また、前記認識可否合成データに含まれる文字として認識されなかった領域（はてなマークの領域）においては、１文字が認識できていない旨を示す２の指示（はてなマークの領域におけるエックスキー）を認識できていない文字の数だけ受け付け、次に、該領域の指示入力が終了した旨を示す３の指示（リターンキー）を受け付けることで、前記認識可否合成データに含まれる文字として認識された領域における誤認識された文字の領域と、前記文字として認識されなかった領域における未認識とされた文字の領域の数とを特定する、
　ことを特徴としている。
　この特徴によれば、前記誤認識文字データ受付手段において前記利用者は、文字として認識された領域においては誤認識された文字とその領域を、また、文字として認識されなかった領域においては未認識の文字の数を、それぞれ前記指示入力手段より指示入力を行うのみで容易に指示できる。これにより、総合的な文字認識にかかるコストを低減できる。

　本発明の請求項８に記載の文字認識プログラムは、
　コンピュータ（管理者端末３）を、
　画像データ（元画像２０１（図２））に含まれる文字を光学的に認識して、認識された文字と該文字に該当する領域とを特定可能な認識文字データ（ＯＣＲ結果２０６）を生成する認識文字データ生成手段（ＯＣＲ処理Ｓ１０４においてＯＣＲ結果２０６を生成する処理を行う管理者端末３のＣＰＵ）と、
　前記画像データの全領域のうち、前記認識文字データ生成手段にて文字として認識された領域（二重丸マークの領域）と、文字として認識されなかった領域（はてなマークの領域）とを、利用者が識別可能な認識可否合成データ（ＯＣＲ可逆化分割画像２０７）を生成する認識可否合成データ生成手段（目減り処理Ｓ１０５においてＯＣＲ可逆化分割画像２０７を生成する処理を行う管理者端末３のＣＰＵ）と、
　前記認識可否合成データ生成手段にて生成した前記認識可否合成データと、前記画像データと、を表示する認識可否合成データ表示手段（目減り処理Ｓ１０５において元画像２０１とＯＣＲ可逆化分割画像２０７を送信する処理を行う管理者端末３のＣＰＵ）と、
　前記利用者から、前記認識可否合成データに含まれる前記文字として認識された領域のうち誤認識した文字（誤認識文字）の領域の指定（バツマークの領域）と、前記認識可否合成データに含まれる前記文字として認識されなかった領域のうち文字が未認識（誤未認識文字）である領域の指定（ゼットマークの領域）と、からなる誤認識文字データ（目減り結果２０９）を、前記認識可否合成データ表示手段に表示している前記画像データに対応付けて受け付ける誤認識文字データ受付手段（目減り処理Ｓ１０５において目減り結果２０９を受け付ける処理を行う管理者端末３のＣＰＵ））と、
　前記画像データの全領域のうち、前記認識文字データ生成手段にて前記文字として認識された領域と、前記文字として認識されなかった領域と、前記文字として認識された領域のうち、前記誤認識文字データ受付手段にて受け付けた誤認識データに含まれる誤認識した文字（誤認識文字）に該当する領域と、前記認識文字データ生成手段にて前記文字として認識されなかった領域のうち、前記誤認識文字データ受付手段にて受け付けた誤認識文字データに含まれる文字が未認識（誤未認識文字）である領域と、を、前記利用者が識別可能な認識結果合成データ（入力用画像２１０）を生成する認識結果合成データ生成手段（入力処理Ｓ１０６の一部として入力用画像２１０の生成処理を行う管理者端末３のＣＰＵ）と、
　して機能させる、
　ことを特徴としている。
　この特徴によれば、文字認識に不備があった文字、すなわち認識された文字のうち誤認識された文字と、文字として認識されなかった領域に含まれる文字が未認識である領域と、を認識結果合成データの中から識別できる。これにより、文字認識に不備があった文字に確実に出力できる。

　本発明の請求項９に記載の文字認識プログラムを記録したコンピュータ読み取り可能な記録媒は、
　コンピュータ（管理者端末３）を、
　画像データ（元画像２０１（図２））に含まれる文字を光学的に認識して、認識された文字と該文字に該当する領域とを特定可能な認識文字データ（ＯＣＲ結果２０６）を生成する認識文字データ生成手段（ＯＣＲ処理Ｓ１０４においてＯＣＲ結果２０６を生成する処理を行う管理者端末３のＣＰＵ）と、
　前記画像データの全領域のうち、前記認識文字データ生成手段にて文字として認識された領域（二重丸マークの領域）と、文字として認識されなかった領域（はてなマークの領域）とを、利用者が識別可能な認識可否合成データ（ＯＣＲ可逆化分割画像２０７）を生成する認識可否合成データ生成手段（目減り処理Ｓ１０５においてＯＣＲ可逆化分割画像２０７を生成する処理を行う管理者端末３のＣＰＵ）と、
　前記認識可否合成データ生成手段にて生成した前記認識可否合成データと、前記画像データと、を表示する認識可否合成データ表示手段（目減り処理Ｓ１０５において元画像２０１とＯＣＲ可逆化分割画像２０７を送信する処理を行う管理者端末３のＣＰＵ）と、
　前記利用者から、前記認識可否合成データに含まれる前記文字として認識された領域のうち誤認識した文字（誤認識文字）の領域の指定（バツマークの領域）と、前記認識可否合成データに含まれる前記文字として認識されなかった領域のうち文字が未認識（誤未認識文字）である領域の指定（ゼットマークの領域）と、からなる誤認識文字データ（目減り結果２０９）を、前記認識可否合成データ表示手段に表示している前記画像データに対応付けて受け付ける誤認識文字データ受付手段（目減り処理Ｓ１０５において目減り結果２０９を受け付ける処理を行う管理者端末３のＣＰＵ））と、
　前記画像データの全領域のうち、前記認識文字データ生成手段にて前記文字として認識された領域と、前記文字として認識されなかった領域と、前記文字として認識された領域のうち、前記誤認識文字データ受付手段にて受け付けた誤認識データに含まれる誤認識した文字（誤認識文字）に該当する領域と、前記認識文字データ生成手段にて前記文字として認識されなかった領域のうち、前記誤認識文字データ受付手段にて受け付けた誤認識文字データに含まれる文字が未認識（誤未認識文字）である領域と、を、前記利用者が識別可能な認識結果合成データ（入力用画像２１０）を生成する認識結果合成データ生成手段（入力処理Ｓ１０６の一部として入力用画像２１０の生成処理を行う管理者端末３のＣＰＵ）と、
　して機能させるためのプログラムを記録した、
　ことを特徴としている。
　この特徴によれば、文字認識に不備があった文字、すなわち認識された文字のうち誤認識された文字と、文字として認識されなかった領域に含まれる文字が未認識である領域と、を認識結果合成データの中から識別できる。これにより、文字認識に不備があった文字に確実に出力できる。

本発明の実施例における文字認識装置を含むデータ入力システムの全体像を示すシステム図である。本発明の実施例における元画像の一例を示す図である。本発明の実施例における処理の全体を示すフローチャートである。本発明の実施例におけるテンプレート画像の一例を示す図である。（ａ）は本発明の実施例におけるテンプレート分割画像の一例を示す図である。（ｂ）は本発明の実施例における元画像の分割画像の一例を示す図である。（ｃ）は本発明の実施例におけるＯＣＲ可逆化分割画像の一例を示す図である。本発明の実施例における目減り画面の一例を示す図である。本発明の実施例における入力画面の一例を示す図である。本発明の実施例におけるベリファイ画面の一例を示す図である。

符号の説明

１　　　　データ入力サーバ
２ａ　　　専用型文字認識装置
２ｂ　　　兼用型文字認識装置
３　　　　管理者用文字認識装置
４　　　　スキャナ
５　　　　インターネット
２０１　　元画像
２０２　　テンプレート画像
２０３　　元画像の領域設定状況
２０４　　テンプレート分割画像
２０５　　元画像の分割画像
２０６　　ＯＣＲ結果
２０７　　ＯＣＲ可逆化分割画像
２０９　　目減り結果
２１０　　入力用画像
２１１　　入力結果
２１２　　ベリファイ結果
２１３　　納品用データ

　本発明の実施例を以下に説明する。

［実施例］
　本発明の実施例を図面に基づいて説明すると、まず図１は、本発明の実施例における文字認識装置を含むデータ入力システムの全体像を示すシステム図である。

　本実施例のデータ入力システムは、データ入力サーバ１と、データ入力サーバ１とインターネット５を介して接続された、作業者端末２ａ、２ｂ、及び、本発明の文字認識装置となる管理者端末３と、管理者端末３に接続されたスキャナ４から主に構成されている。

　まず、データ入力システムの概要と、データ入力システムの利用者について説明していく。

　このデータ入力システムが提供するデータ入力サービスは、管理者が発注者からデータ入力の依頼（発注）を受けて、作業者が発注内容に基づいて文字データを入力し、管理者が文字データを発注者に納品する、というものである。

　また、データ入力システムは、企業がデータ入力サービスを他社に有料で提供するために運営しても良いし、企業が自社内のデータ入力を処理するために運営しても良い。つまり、データ入力システムの運営組織は、企業または企業内のデータ入力部門となる。

　データ入力サーバ１の利用者は、本発明における発注者と、作業者と、本発明における利用者となる管理者と、の３種類となる。管理者は、図１に示す管理者端末３とスキャナ４を利用し、作業者は、図１に示す作業者端末２ａ、２ｂを利用する。

　本実施例の発注者は、データ入力の対象となる画像データ化された発注データ（例えば、図２）を自らデータ入力サーバ１に登録することで運営組織に発注する。または、発注者は、発注データを運営組織の管理者に登録させることでデータ入力を発注する。発注データを運営組織の管理者に登録させる場合には、発注者は、いまだ画像データ化されていない状態（例えば、紙の帳票）で発注を行い、運営組織の管理者は、発注された紙媒体をスキャナ４を用いて光学的に読み取って画像データ化を行って、発注データをデータ入力サーバ１に登録する。

　本実施例の作業者は、データ入力サーバ１に登録されている発注データ内に画像として出力されている文字を目で見て、これら文字に該当する文字データを、作業者端末２ａ、２ｂの入力部（キーボード、マウスなど）から入力（打鍵）する後述する入力処理を行う。この入力処理において、作業者は入力にかかる打鍵数に応じて収入を得る、言い換えると、データ入力には作業者の打鍵数に応じたコストがかかる。

　また、作業者のデータ入力にはミスが避けられず、管理者による入力後のチェック（ベリファイ作業を呼ばれる）は欠かせない。このベリファイ作業には、チェック対象の文字数に応じたコストがかかるが、チェック作業は打鍵をともなう作業である。

　すなわち、データ入力にかかる総合的なコストは、作業者または管理者の打鍵数に応じたものであり、作業者または管理者の打鍵数を低減させることでコストを低減することができる。

　本実施例の管理者は、管理者端末３を用いてデータ入力サーバ１にアクセスすることで、発注の受け付けから文字データの納品までのデータ入力の全工程を管理する。具体的には、データ入力にかかる作業者または管理者の打鍵数に応じたコストを低減させるための後述する目減り処理や、前述のベリファイ処理を行う。

　次に、データ入力システムを構成するデータ入力サーバ１、作業者端末２ａ、２ｂ、管理者端末３について説明していく。

　データ入力サーバ１は、各種データを記憶する記憶部、インターネット５を介して各種データの送受信を行うための通信部、各種処理プログラムを実行するためのＣＰＵ（Central Processing Unit）、各種処理プログラムの実行に必要なデータを一時的に記憶しておく読み書き可能な揮発性メモリであるＲＡＭ（Random Access Memory）、各種処理プログラムの実行に必要なデータを記憶しておく不揮発性メモリであるＲＯＭ（Read Only Memory）を備えた通常のサーバコンピュータである。

　データ入力サーバ１の記憶部には、図１に示すように、各種画像データと、各種台帳データと、各種業務支援プログラムと、が記憶されている。

　各種画像データは、データ入力の対象となる帳票等の書式のみを画像データ化したテンプレート画像２０２（図４）と、このテンプレート画像を記載領域ごと、例えば、住所などの帳票内の記載項目ごとに分割したテンプレート分割画像（図５（ａ））と、データ入力の対象となる画像データ化された発注データである元画像２０１（図２）と、テンプレート画像及びテンプレート分割画像を参照して元画像を記載領域ごとに分割した元画像の分割画像２０５（図５（ｂ））と、画像データに画像として出力されている文字を光学的に認識して文字データを出力するＯＣＲ（光学的な文字認識、Optical Character Recognition）の出力結果を元画像に合成したＯＣＲ可逆化画像と、ＯＣＲの出力結果を元画像の分割画像に合成したＯＣＲ可逆化分割画像（図５（ｃ））と、からなる。

　各種台帳データは、発注者の氏名や住所などを記憶させるための注文先管理台帳データと、前述の各種画像データの作成者やファイル名などを記憶させるための受注データ管理台帳と、作業者の氏名や住所などを記憶させるためのデータ入力者管理台帳と、受発注にかかる入出金記録を記憶させるための入出金管理台帳と、作業者の作業内容や作業日時を記憶させるためのデータ入力作業者作業管理台帳と、からなる。

　業務支援プログラムは、各種処理を行うためのプログラムである。各種処理は、管理者端末３から発注者の氏名や住所などを受け付けて注文先管理台帳データに登録したり、発注データを受け付けて受注データ管理台帳に登録する受注処理、発注処理と、画像データに対するＯＣＲ処理と、テンプレート画像及びテンプレート分割画像を参照して元画像を記載領域ごとに分割した元画像の分割画像を生成する分割処理と、ＯＣＲ可逆化分割画像を送信した管理者端末３から管理者が入力したＯＣＲの結果に含まれる認識の誤りに関するデータを受信する目減り処理と、ＯＣＲによる認識が誤っており人手による入力が必要な部分のみを送信した作業者端末２ａ、２ｂから作業者が入力した文字データを受信する入力処理と、作業者が入力した文字データを送信した作業者端末２ａ、２ｂから作業者が入力したか、もしくは、管理者端末３から管理者が入力した作業者の入力の誤りに関するデータを受信するベリファイ処理と、ＯＣＲ処理により認識した文字データと作業者が入力した文字データからなる納品用データを管理者端末３から受け付けて発注が完了した旨を記憶する最終チェック処理と、からなる。

　特に、ＯＣＲ処理、分割処理、目減り処理、入力処理、のための業務支援プログラムのうち、ＯＣＲ処理、分割処理、目減り処理、入力処理のために管理者端末３において実行されるプログラムが、本発明の文字認識プログラムを構成する。

　作業者端末２ａは、記憶部、通信部、ＣＰＵ、ＲＡＭ、ＲＯＭ、キーボードやマウスなどの入力部、ディスプレイなどの表示部を備え、予め定められたデータ入力サーバ１にアクセスして入力処理を実施するように作られた、データ入力専用のコンピュータである。作業者が前述の入力処理を行うときに利用する。

　作業者端末２ｂは、記憶部、通信部、ＣＰＵ、ＲＡＭ、ＲＯＭ、入力部、表示部、ＵＳＢ（Universal Serial Bus）メモリなどの外付け記憶装置６を接続可能なインタフェースを備えた通常のコンピュータである。外付け記憶装置６には、予め定められたデータ入力サーバ１にアクセスして入力処理を実施するためのプログラムが記憶されている。この外付け記憶装置６を装着して内部に記憶しているプログラムを実行している間、作業者端末２ｂは、作業者端末２ａと同様にデータ入力専用のコンピュータとなる。作業者が前述の入力処理を行うときに利用する。

　本発明の文字認識装置である管理者端末３は、記憶部、通信部、ＣＰＵ、ＲＡＭ、ＲＯＭ、入力部、表示部を備えた通常のコンピュータである。管理者が前述の目減り処理やベリファイ処理を行うときに利用する。また、前述の入力処理を行うこともできる。すなわち管理者は作業者でもある。

　本発明の文字認識装置である、管理者端末３の記憶部には、図１に示すように、前述のデータ入力サーバ１に記憶されている業務支援プログラムと同じものが記憶されている。これら業務支援プログラムは、管理者端末３の記憶部に予め記憶しておいても良いし、データ入力サーバ１から受信して一時的にこれらに記憶しても良い。どちらの場合にも、管理者端末３のＣＰＵで業務支援プログラムが実行されるようになっている。
　尚、業務支援プログラムは、管理者端末３のＣＰＵで実行され、これら業務支援プログラムで参照される前述した各種台帳データや前述した各種画像データは、データ入力サーバ１と管理者端末３との間で送受信され、データ入力サーバ１の記憶部に記憶される構成としているが、本発明はこれに限定されるものではない。例えば、前述した各種台帳データおよび前述した各種画像データは、管理者端末３の記憶部に記憶される構成としても良い。このような構成の場合には、データ入力システムではなく、本発明の文字認識装置である管理者端末３のみで、文字認識やデータ入力にかかる処理をすべて実施できる。

　次に、本実施例のデータ入力システムにおけるデータ入力処理の流れを、図３に基づいて説明していく。

　データ入力処理は、図３に示すように、発注処理Ｓ１０１、受注処理Ｓ１０２、分割処理Ｓ１０３、ＯＣＲ処理Ｓ１０４、目減り処理Ｓ１０５、入力処理Ｓ１０６、ベリファイ処理Ｓ１０７、最終チェック処理Ｓ１０８という８つの処理からなる。原則的には、Ｓ１０１～Ｓ１０８の処理を順次実行することにより、発注者と管理者の間でのデータ入力の受発注や、作業者が入力した文字データの発注者への納品までを行うようになっている。

　まず、発注処理Ｓ１０１において、データ入力の対象となる帳票などを画像データ化していた発注者は、この画像データ（元画像２０１、図２）を発注データとして、データ入力サーバ１の受注データ管理台帳（図１）に登録させることでデータ入力サーバ１の運営組織に所属する管理者に対して発注を行う。一方、画像データ化していない発注者は、管理者に画像データ化させるとともに、データ入力サーバ１の受注データ管理台帳に登録させることで、運営組織に対して発注を行う。この段階では発注データ（元画像２０１、図２）の状態は未受注となっている。

　また、各種台帳データおよび各種画像データが管理者端末３に記憶されている場合には、発注処理Ｓ１０１において、データ入力の対象となる帳票などを画像データ化していた発注者は、この画像データ（元画像２０１、図２）を発注データとして、管理者端末３の受注データ管理台帳（図１）に登録させることで管理者端末３の運営組織に所属する管理者に対して発注を行う。一方、画像データ化していない発注者は、管理者に画像データ化させるとともに、管理者端末３の受注データ管理台帳に登録させることで、運営組織に対して発注を行う。この段階では発注データ（元画像２０１、図２）の状態は未受注となっている。

　尚、発注処理Ｓ１０１においては、発注者は発注に際して、企業名、住所、担当者名、担当者への連絡先などが注文先管理台帳（図１）に登録してある必要がある。登録の時期は、発注の前でも良いし最初の発注時でも良い。

　受注データ管理台帳（図１）への登録内容としては、少なくとも画像データ化された発注データ（元画像２０１、図２）と注文先管理台帳（図１）の登録データとを対応付けられれば良い。例えば、注文先管理台帳（図１）における識別情報により対応付ければ良い。また、画像データ以外の発注に必要なデータも、例えば、発注者の希望料金なども発注データとして受注データ管理台帳に登録するようになっている。これら発注に必要なデータの項目は運営組織が適宜に定めれば良い。

　次に、受注処理Ｓ１０２において、管理者は、受注データ管理台帳（図１）に登録されている発注データのうち、状態が未受注である発注データを特定する。管理者は、発注データの画像データ（元画像２０１、図２）や希望料金を確認して受注可能と判断した場合に、発注データの状態を受注に更新して、この発注データの画像データ（元画像２０１、図２）を対象に以降の処理を行う。

　次に、分割処理Ｓ１０３において、管理者は、管理者端末３において、元画像２０１（図２）に対応するテンプレート画像２０２（図４）を特定する操作を行う。例えば、元画像２０１（図２）とテンプレート画像の一覧を表示させて、対応するテンプレート画像２０２（図４）の指示操作を行えば良い。

　尚、テンプレート画像２０２の特定は、管理者の指示操作によらず、例えば、元画像２０１の特徴により自動的に行っても良い。例えば、元画像２０１の特定の位置に特定のパターン（文字やバーコードなど）が存在することを条件に、テンプレート画像２０２を特定すれば良い

　そして、各種画像データがデータ入力サーバ１に記憶されている場合には、管理者端末３は、テンプレート画像２０２（図４）を特定可能な情報（例えばファイル名）をデータ入力サーバ１に送信し、データ入力サーバ１は、テンプレート画像２０２（図４）を特定可能な情報（例えばファイル名）に基づいて、このテンプレート画像２０２（図４）に対応付けられたテンプレート分割画像２０４（図５（ａ））を特定する。テンプレート分割画像２０４（図５（ａ））は、元画像２０１（図２）のどの場所に相当するかを特定可能な情報（例えば、元画像２０１（図２）の左上の端点からの縦方向の距離と、横方向の距離の組み合わせ）とともに記憶されている。そして、特定されたテンプレート分割画像２０４（図５（ａ））が、管理者端末３に送信される。

　また、各種画像データが管理者端末３に記憶されている場合には、管理者端末３は、テンプレート画像２０２（図４）を特定可能な情報（例えばファイル名）テンプレート画像２０２（図４）を特定可能な情報（例えばファイル名）に基づいて、このテンプレート画像２０２（図４）に対応付けられたテンプレート分割画像２０４（図５（ａ））を特定する。

　管理者端末３は、テンプレート分割画像２０４（図５（ａ））に基づいて、元画像２０１（図２）に記載領域を設定して（元画像の領域設定状況２０３（図３））、設定した記載領域を元画像の分割画像２０５（図５（ｂ））として抽出する。言い換えると、元画像２０１（図２）を元画像の分割画像２０５（図５（ｂ））に分割する。このとき、元画像の分割画像２０５は、元画像２０１に対応付けて記憶される。これにより元画像の分割画像２０５は元画像２０１と対応付けられる。

　ここで、各種画像データがデータ入力サーバ１に記憶されている場合には、管理者端末３は、元画像の分割画像２０５をデータ入力サーバ１に送信して記憶させる。

　ここでテンプレート画像２０２（図４）に対して、複数のテンプレート分割画像２０４（図５（ａ））が対応付けられている場合には、元画像２０１（図２）も複数の記載領域に分割される。

　つまり、分割処理Ｓ１０３により、管理者からのテンプレート画像２０２（図４）の指定を受け付けた管理者端末３は、テンプレート分割画像２０５（図５（ｂ））を生成する。

　ここで、各種画像データがデータ入力サーバ１に記憶されている場合には、管理者端末３は、テンプレート分割画像２０５（図５（ｂ））をデータ入力サーバ１に送信して記憶させる。

　次に、ＯＣＲ処理Ｓ１０４において、管理者端末３は、テンプレート分割画像２０５（図５（ｂ））に対してＯＣＲを行う。ＯＣＲの結果は、文字データ２０６（図３）に示すように、認識できた文字と、その文字に対応する領域（例えば、画像データにおける４隅の座標）である。認識できた文字に対応する領域以外は、文字があると認識できなかった領域として扱われる。

　この認識できた文字の中には、正しく認識できた文字（認識文字）と、誤って認識された文字（誤認識文字）とが含まれうる。一方、文字があると認識できなかった領域（未認識領域）には、誤って認識されなかった文字（誤未認識文字）が含まれうる。

　例えば、図３の元画像のＯＣＲ結果２０６に示すように、「ゼロ」を「小文字アルファベットのオー」と認識していることから「小文字アルファベットのオー」は誤認識文字である。一方、「千代」が含まれる領域は文字があると認識できなかった領域であり、「千代」は誤未認識文字である。

　次に、目減り処理Ｓ１０５において、管理者端末３は、元画像の分割画像２０５（図５（ｂ））に、ＯＣＲ結果である文字データ２０６（図３）、言い換えると認識文字に対応する活字体のフォントデータを、この認識文字に対応する元画像の分割画像２０５（図５（ｂ））中の領域に重ね合わせることで、元画像のＯＣＲ可逆化分割画像２０７（図５（ｃ））を生成する。このとき、ＯＣＲ可逆化分割画像２０７は、元画像の分割画像２０５に対応付けて記憶される。これにより、ＯＣＲ可逆化分割画像２０７は最終的に元画像２０１と対応付けられる。

　ここで、各種画像データがデータ入力サーバ１に記憶されている場合には、管理者端末３は、ＯＣＲ可逆化分割画像２０７（図５（ｃ））をデータ入力サーバ１に送信して記憶させる。

　図５（ｃ）に示すように、元画像のＯＣＲ可逆化分割画像２０７において、認識文字は活字体のフォントデータとなっているため、画像データのままである未認識領域に含まれる誤未認識文字に比べると視認しやすくなっているが、本実施例においては、さらに、認識文字である旨を示すマーク（二重丸）を併記することで、一層認識文字を視認しやすくしている。

　一方、未認識領域には、未認識領域である旨を示すマーク（はてな）を併記することで、認識できなかった箇所である旨を視認しやすくしている。

　尚、認識文字である旨を示すマーク（二重丸）と、未認識領域である旨を示すマーク（はてな）を併記することにより、認識文字と未認識領域を視認しやすくしているが、本発明はこれに限定されるものではなく、認識文字と、未認識領域にそれぞれ異なる色（たとえば、黒と青）を付与する構成としても良い。

　次に、管理者端末３は、元画像のＯＣＲ可逆化分割画像２０７（図５（ｃ））を表示する。図６に示す目減り画面が表示される。

　目減り画面（図６）は、元画像の分割画像２０５（図５（ｂ））と、元画像のＯＣＲ可逆化分割画像２０７（図５（ｃ））と、管理者が入力した目減り結果と、から構成されている。

　ここで、各種画像データがデータ入力サーバ１に記憶されている場合には、管理者端末３は、元画像の分割画像２０５（図５（ｂ））とＯＣＲ可逆化分割画像２０７（図５（ｃ））をデータ入力サーバ１から受信して表示する。

　このとき、元画像の分割画像２０５（図５（ｂ））中に、入力欄が複数区画あった場合には、例えば、図６に示すように２行（２区画）あった場合には、目減り結果も２行（２か所）表示されるようになっている。

　尚、元画像の分割画像２０５（図５（ｂ））に関わらず、目減り結果は１行（１区画）にまとめても良い。

　そして、元画像のＯＣＲ可逆化分割画像２０７（図５（ｃ））には、現在着目している箇所を示す矢印（白抜き）が表示されている。目減り画面（図６）が表示された時点、すなわち初期状態においては、矢印（白抜き）は、一番上の一番左に位置する文字となる先頭文字を示す位置に表示されている。一方、一番上の一番左に位置するのが未認識領域の場合には、矢印（白抜き）は、その領域の中心を示す位置に表示される。

　管理者は、管理者端末３の目減り画面（図６）を見ながら、入力部（キーボード）に対して、４種類の操作のいずれかを行う。

　１種類目の操作は、認識文字が正しく認識できた旨を指示する「スペースキー」である。矢印（白抜き）が認識文字を指示しているときに、管理者が「スペースキー」を入力すると、目減り画面（図６）の元画像のＯＣＲ可逆化分割画像２０７（図５（ｃ））には、矢印（白抜き）が指し示していた場所に認識文字が正しかった旨を示すマーク（レ）が表示される。また、目減り結果にも認識文字が正しかった旨を示すマーク（丸）が追加表示される。その後、矢印（白抜き）は右隣の認識文字か未認識領域のいずれかに移動する。

　一方、矢印（白抜き）が未認識領域を指し示していた場合には、一種類目の操作は、未認識領域に文字が含まれていない、すなわち正しく未認識だった旨を指示する操作となる。矢印（白抜き）が未認識領域を指示しているときに、管理者が「スペースキー」を入力すると、目減り画面（図６）の元画像のＯＣＲ可逆化分割画像２０７（図５（ｃ））には、矢印（白抜き）が指し示していた場所に未認識領域が正しかった旨を示すマーク（レ）が表示される。また、目減り結果には何も追加表示されない。文字がなかったためである。その後、矢印（白抜き）は右隣の認識文字か未認識領域のいずれかに移動する。

　２種類目の操作は、認識文字が正しく認識できなかった旨を指示する「エックスキー」である。管理者が「エックスキー」を入力すると、目減り画面（図６）の元画像のＯＣＲ可逆化分割画像２０７（図５（ｃ））には、矢印（白抜き）が指し示していた場所に認識文字が誤っていた旨を示すマーク（バツ）が表示される。また、目減り結果にも認識文字が誤っていた旨を示すマーク（バツ）が追加表示される。その後、矢印（白抜き）は右隣の認識文字か未認識領域のいずれかに移動する。

　３種類目の操作は、未認識領域に文字が含まれている旨、すなわち誤未認識文字が含まれている旨を指示する「エックスキー」である。管理者が「エックスキー」を入力すると、目減り画面（図６）の元画像のＯＣＲ可逆化分割画像２０７（図５（ｃ））には、矢印（白抜き）が指し示していた場所に誤未認識文字が含まれている旨を示すマーク（ゼット）が表示される。また、目減り結果にも誤未認識文字が含まれている旨を示すマーク（ゼット）が追加表示される。

　尚、指示操作の対象となるキーが同じため、２種類目の操作と３種類目の操作は、操作内容としては同一である。すなわち少なくとも３種類の指示操作があれば良いようになっている。ただし、管理者端末３においては、そのキーが操作された状況が、「二重丸マーク」がついた文字を対象としているか、「はてなマーク」がついた領域を対象としているかを区別することにより、「エックスマーク」をつけるべき操作であるか、「ゼットマーク」をつけるべき操作であるかを判定できるようになっている。例えば、３種類目の操作を「ゼットキー」の押下とすることで、すなわち４種類の指示操作を用意することで、管理者端末３における判定を簡略化しても良い。

　ここで未認識領域に含まれる誤未認識文字が何文字かは不定であるため、矢印（白抜き）の移動は行われない。管理者は、未認識領域に含まれる誤未認識文字の数だけ誤未認識文字が含まれている旨を指示する「エックスキー」を押下することとなる。図６に示す例では、「レセプト整理番号」の記入欄に存在する未認識領域（「？」の領域）が２つあるが、そのうち最初の未認識領域には３つの誤未認識文字が含まれており、矢印（白抜き）がこの未認識領域を指し示しているときに、管理者は３回「エックスキー」を押下する。すると、押下した数（ここでは３）だけ、誤未認識文字が含まれている旨を示すマーク（ゼット）が未認識領域に表示される。

　未認識領域に含まれる誤未認識文字の数だけ「エックスキー」を押下した管理者は、「エックスキー」以外の操作を行うことで、矢印（白抜き）は右隣の認識文字か未認識領域のいずれかに移動させることができる。

　４種類目の操作は、目減りが終了した旨を指示する「エンターキー」である。管理者が「エンターキー」を入力すると、目減りの対象となっている区画（１行）の目減り結果が確定する。このときに、目減り結果に含まれている文字数を数えることで、目減りの対象となっている区画（１行）に含まれている文字数も確定する。

　前述したように、矢印（白抜き）が未認識領域を指し示しているときに「エンターキー」を押下した場合には、矢印（白抜き）は右隣の認識文字か未認識領域のいずれかに移動するのみである。ただし、右隣に認識文字か未認識領域のいずれもなかった場合には、目減り結果が確定する。

　尚、目減り画面（図６）の元画像のＯＣＲ可逆化分割画像２０７（図５（ｃ））において、認識が正しかった旨を認識文字にマーク（レ）をつけることで、認識が誤っていた旨を認識文字にマーク（バツ）をつけることで、それぞれ示しているが、本発明はこれに限定されるものではなく、認識が正しかった旨を認識文字（レ）の色を変えることで、認識が誤っていた旨を認識文字（バツ）をさらに異なる色に変えることで示すようにしても良い。

　また、これらキーはどのようなキーであっても良い。例えば、ファンクションキーなどの通常のデータ入力に使わないキーを使うと、入力操作自体は慣れないものとなる一方で、入力操作自体をその操作の意味を留意しながら行うようになる。

　すべての区画（行）の目減り結果を確定した管理者は、「終了」ボタンをクリックすることで、管理者端末３に目減り結果を記憶させる。この目減り結果は、目減り処理の対象となったＯＣＲ可逆化分割画像２０７の特定情報（例えば、ファイル名）とともに記憶される。

　ここで、各種画像データがデータ入力サーバ１に記憶されている場合には、管理者端末３は、目減り結果をデータ入力サーバ１に送信して記憶させる。

　目減り結果を記憶した管理者端末３は、入力用画像２１０（図７上部）を生成する。このとき、目減り結果とともに記憶されるＯＣＲ可逆化分割画像２０７の特定情報（例えば、ファイル名）に対応付けて目減り結果は記憶される。これにより、目減り結果は最終的に元画像２０１と対応付けられる。

　具体的には、目減り結果において、認識が誤っていた旨が特定された認識文字（バツマーク）に対応する領域と、誤未認識文字（ゼットマーク）が含まれる誤未認識領域とを、元画像の分割画像２０５（図５（ｂ））から抽出することで、入力用画像２１０（図７上部）を生成する。

　ここで、各種画像データがデータ入力サーバ１に記憶されている場合には、管理者端末３は、入力用画像２１０（図７上部）をデータ入力サーバ１に送信して記憶させる。

　これは、認識が誤っていた旨が特定された認識文字（バツマーク）と、誤未認識領域に含まれる誤未認識文字（ゼットマーク）のみを入力処理Ｓ１０６の対象とすればよいためである。

　この入力用画像２１０（図７上部）にあっては、入力処理Ｓ１０６の対象とする文字数が減少する場合が多いことから、元画像の分割画像２０５（図５（ｂ））中に入力欄が複数区画あった場合にも、これら元々の区画によらず、少ない区画（本実施例では１つ）に集約させるようにしている。このようにして、１区画あたりの文字数が少ない場合にも、文字を入力する頻度に対して画面をスクロールさせる頻度が高まるのを抑えているのである。

　尚、元画像の分割画像２０５（図５（ｂ））中に、入力欄が複数区画あった場合には、例えば、図５（ｂ）に示すように２行（２区画）あった場合には、入力用画像２１０（図７上部）も2行（２区画）になるようにしてもよい。

　また、各々の文字が、目減り処理Ｓ１０５において、認識が誤っていた旨が特定された認識文字（バツマーク）か、誤未認識領域に含まれる誤未認識文字（ゼットマーク）かを特定可能なように、同様のマークを付けても良い。また、マークでなく異なる色（たとえば、緑と黄）を付けても良い。

　次に、入力処理Ｓ１０６において、作業者端末２ａ、作業者端末２ｂ、管理者端末３は、入力用画像２１０（図７上部）を表示する。図７に示す入力画面が表示される。

　入力画面（図７）は、入力用画像２１０（図７上部）と、作業者が入力した入力結果と、から構成されている。

　ここで、各種画像データがデータ入力サーバ１に記憶されている場合には、作業者端末２ａ、作業者端末２ｂ、管理者端末３は、入力用画像２１０（図７上部）をデータ入力サーバ１から受信して表示する。

　入力結果を受け付けた作業者端末２ａ、作業者端末２ｂ、管理者端末３は、入力結果を記憶する。このとき、入力結果とともに受け付ける入力用画像２１１の特定情報（例えば、ファイル名）に対応付けて入力結果は記憶される。これにより、入力結果は最終的に元画像２０１と対応付けられる。

　ここで、各種画像データがデータ入力サーバ１に記憶されている場合には、作業者端末２ａ、作業者端末２ｂ、管理者端末３は、入力結果をデータ入力サーバ１に送信して記憶させる。

　次に、ベリファイ処理Ｓ１０７において、作業者端末２ａ、作業者端末２ｂ、管理者端末３は、入力用画像２１０（図８上部）と入力結果を表示する。図８に示すベリファイ画面が表示される。

　ベリファイ画面（図８）は、入力用画像２１０（図８上部）と、作業者が入力した入力結果（図８中部）と、ベリファイ結果（図８下段）と、から構成されている。

　ここで、各種画像データがデータ入力サーバ１に記憶されている場合には、作業者端末２ａ、作業者端末２ｂ、管理者端末３は、入力用画像２１０（図８上部）と、作業者が入力した入力結果（図８中部）と、をデータ入力サーバ１から受信して表示する。

　作業者または管理者は、作業者端末２ａ、作業者端末２ｂ、管理者端末３のいずれかのベリファイ画面（図８）を見ながら、入力部（キーボード）に対して、２種類の操作のいずれかを行う。

　１種類目の操作は、入力用画像２１０（図８上部）に対して、作業者が入力した入力結果（図８中部）が１文字分正しかった旨を指示する「スペースキー」である。管理者が「スペースキー」を入力すると、ベリファイ結果（図８下段）に１文字分が正しかった旨を示すマーク（丸）が追加表示される。

　２種類目の操作は、入力用画像２１０（図８上部）に対して、作業者が入力した入力結果（図８中部）が１文字分誤っていた旨を指示する「エックスキー」である。管理者が「エックスキー」を入力すると、ベリファイ結果（図８下段）に１文字分が誤っていた旨を示すマーク（バツ）が追加表示される。

　ベリファイを終了した作業者または管理者は、「終了」ボタンをクリックすることで、作業者端末２ａ、作業者端末２ｂ、管理者端末３のいずれかにベリファイ結果を記憶させる。このベリファイ結果は、ベリファイ処理の対象となった入力結果の特定情報（例えば、ファイル名）とともに記憶される。

　ここで、各種画像データがデータ入力サーバ１に記憶されている場合には、管理者端末３は、ベリファイ結果をデータ入力サーバ１に送信して記憶させる。

　この後、ベリファイ結果において誤っている文字があった場合には、作業者または管理者は、ベリファイの対象となったデータを入力した作業者に対して入力処理Ｓ１０６を指示したり、自ら入力処理Ｓ１０６を行ったりしても良い。また、入力処理Ｓ１０６を行わなくても良い。これらのいずれを選択するかは、さらには、入力処理Ｓ１０６の実施後さらにベリファイ処理Ｓ１０７を行うかは、作業者または管理者が発注者からの発注内容である期間や希望料金に応じて適宜に判断すれば良い。

　最後に、最終チェック処理Ｓ１０８において、管理者が、発注に対するデータ入力が完了した旨を示す操作を管理者端末３から行うと、データ入力サーバ１は、発注データの状態を終了に更新する。

　このとき、管理者は、ＯＣＲ処理Ｓ１０４により認識した文字データと、作業者が入力した文字データと、をまとめて、所定の形式、例えば、ＣＳＶ（Comma Separated Values）形式のデータを作成し、これをデータ入力サーバ１にアップロードすることで、納品用データ２１３としてデータ入力サーバ１に記憶させる。

　シンクライアントネットワークシステムの運営組織から発注者への納品に際しては、管理者がデータ入力サーバ１から納品用データ２１３を適宜取り出すようになっている。

　以上、本実施例によれば、文字認識（ＯＣＲ処理Ｓ１０４）に不備があった文字、すなわち認識された文字のうち誤認識された文字（目減り処理Ｓ１０５においてバツでマークされた文字）と、文字として認識されなかった領域に含まれる文字が未認識である領域（目減り処理Ｓ１０５においてゼットでマークされた領域）と、を認識結果合成データの中から識別できる。これにより、文字認識に不備があった文字に確実に出力できる。

　また、本実施例によれば、文字認識装置（管理者端末３）では、画像データ（元画像２０１（図２））の種類に応じて予め定められた区画にテンプレート分割画像２０４（図５（ａ））により分割されたＯＣＲ可逆化分割画像２０７と、入力用画像２１０とが生成される。そのため前記利用者（管理者）は、誤認識文字データ受付手段（目減り処理Ｓ１０５において目減り結果２０９を受け付ける処理）や前記入力データ受付手段（入力処理Ｓ１０６において入力結果２１１を受け付ける処理）において、受信した個々の区画のみが表示されており、これら個々の区画のみを出力させることができる。これにより、元画像２０１のうち、文字認識に不備があった文字を利用者が一層見つけやすくできる。

　また、本実施例によれば、利用者（管理者）は、文字認識（ＯＣＲ処理Ｓ１０４）に不備があった文字のみ、すなわち文字として認識された領域においては誤認識された文字（目減り処理Ｓ１０５においてバツでマークされた文字）に該当する領域のみ、また、文字として認識されなかった領域においては未認識である領域（目減り処理Ｓ１０５においてゼットでマークされた領域）のみ、が含まれた入力用データ（入力用画像２１０（図７上部））を出力させることができる。これにより、利用者（管理者）は、入力用データのうち文字認識に不備があった文字を一層見つけやすくできる。

　また、本実施例によれば、利用者（管理者）は、文字認識（ＯＣＲ処理Ｓ１０４）に不備があった文字を、入力用データ（入力用画像２１０（図７上部））の中から色により容易に識別できる。これにより、利用者（管理者）は、入力用データのうち文字認識に不備があった文字を一層見つけやすくできる。

　また、本実施例によれば、誤認識文字データ受付手段（目減り処理Ｓ１０５において目減り結果２０９を受け付ける処理）において利用者（管理者）は、認識可否合成データ（ＯＣＲ可逆化分割画像２０７（図６中部））中の個々の領域においてはそれぞれ１種類の文字認識の不備、すなわち、文字として認識されなかったはてなマークの領域においては未認識の文字（ゼットでマークすべき文字）、また、文字として認識された二重丸マークの領域においては誤認識された文字（バツでマークすべき文字）、をそれぞれ見分ければ良いが、それぞれの領域には異なる色が付与されており、どの領域に対して作業しているのか、どの不備を見分けようとしているのか、という点において、利用者が間違いづらくなっている。これにより、認識可否合成データのうち、文字認識に不備があった文字を利用者が見分けやすく、さらには指示しやすくできるので、総合的な文字認識にかかるコストを低減できる。

　また、本実施例によれば、誤認識文字データ受付手段（目減り処理Ｓ１０５において目減り結果２０９を受け付ける処理）において利用者（管理者）は、認識可否合成データ（ＯＣＲ可逆化分割画像２０７（図６中部））に含まれる認識された文字のうち、誤認識された文字をその文字の形（活字フォントデータ）により容易に識別できる。これにより、認識可否合成データのうち、文字認識に不備があった文字を利用者が見分けやすく、さらには指示しやすくできるので、総合的な文字認識にかかるコストを低減できる。

　また、本実施例によれば、前記誤認識文字データ受付手段（目減り処理Ｓ１０５において目減り結果２０９を受け付ける処理）において利用者（管理者）は、文字として認識された二重丸マークの領域においては誤認識された文字とその領域（バツマークの領域）を、また、文字として認識されなかったはてなマークの領域においては未認識の文字の数（ゼットマークの領域）を、それぞれ前記指示入力手段（エンターキー、エックスキー、リターンキー）より指示入力を行うのみで容易に指示できる。これにより、総合的な文字認識にかかるコストを低減できる。

　以上、本発明の実施例を図面により説明してきたが、具体的な構成はこれら実施例に限られるものではなく、本発明の要旨を逸脱しない範囲における変更や追加があっても本発明に含まれる。

　例えば、前記実施例では、図３に示すようにデータ入力処理において、Ｓ１０１～Ｓ１０８の処理のすべてを順次実施する構成としているが、本発明はこれに限定されるものではなく、少なくともＯＣＲ処理Ｓ１０４と、目減り処理Ｓ１０５と、入力処理Ｓ１０６と、が実施されていれば本発明の適用対象となる。その他の処理は発注者の要望や、データ入力の対象となる画像データ化された発注データの種類に応じて適宜に組み合わせても良い。

　例えば、発注処理Ｓ１０１、受注処理Ｓ１０２は、データ入力システムが運営組織自身のために、言い換えると、顧客企業のためにではなく、自社のために運営されている場合には行わないようにしても良い。

　また、分割処理Ｓ１０３は、記載領域が少ない単純な帳票である場合や、テンプレート画像が予め用意されてない場合には行わないようにしても良い。分割処理Ｓ１０３を行わない場合には、以降の処理において、元画像２０１（図２）を対象にしてＯＣＲ処理Ｓ１０４、目減り処理Ｓ１０５、入力処理Ｓ１０６、ベリファイ処理Ｓ１０７、最終チェック処理Ｓ１０８等を行えば良い。

　また、ベリファイ処理Ｓ１０７は、発注者が要望した期間や料金が十分でない場合には省略しても良いし、期間や料金が十分ある場合には複数人による処理を数回行って納品データの品質を高めようとしても良い。ベリファイ処理が複数回行われるということは、ベリファイ処理において不具合が確認されたことを条件に、入力処理Ｓ１０６も複数回行われる場合があることを示している。すなわちベリファイ処理が複数回行われると期間も料金も余分に消費されることとなる。

　また、前記実施例では、発注処理Ｓ１０１を発注データの登録と、受注処理Ｓ１０２を発注データに対する管理者の確認により、言い換えると主として人間による判断により受発注を行うものとしているが、本発明はこれに限定されるものではなく、データ入力システムにおける管理者（図１）が複数いて、それぞれが異なる企業に所属している場合には、発注データに対して複数の企業が受注しようとすることになる。このような場合には、オークションにより受発注を行っても良い。その場合、発注処理Ｓ１０１はオークションへの出品処理、受注処理Ｓ１０２は管理者によるオークションへの入札処理、および、発注者によるオークションへの落札処理とみなして、これら処理に対応する機能を実装すれば良い。

　また、前記実施例では、データ入力サーバ１を１台のサーバコンピュータとして構成しているが、本発明はこれに限定されるものではなく、スケーラビリティ向上の観点から複数台のサーバコンピュータで構成しても良い。このような場合には、データ入力サーバ群とインターネット５の間に負荷分散用のハードウェア（いわゆるロードバランサ）を設置し、負荷分散用のハードウェアがインターネット５から送受信されてくるデータを、各データ入力サーバに対して適宜分散して配信することで、各データ入力サーバに対する負荷分散を行うようにすれば良い。

　また、前記実施例では、データ入力サーバ１を１台のサーバコンピュータとして構成しているが、本発明はこれに限定されるものではなく、可用性向上の観点から同じ機能をもつサーバコンピュータを複数台用意して、ハードウェアの二重化を行っても良い。このような場合には、データ入力サーバ１と同様の構成をもつデータ入力サーバ１´を用意したり、前述のように負荷分散用のハードウェアと、データ入力サーバ群を構成する場合には、これらも適宜２台ずつ用意して二重化を行えば良い。１台は通常利用する通常系のハードウェアで、もう１台は通常系に異常が出たときに代替する待機系のハードウェアとなる。この状態で、異常を検知して自動的に通常系から待機系にハードウェアを切り替える障害復旧用のハードウェアをさらに備えることにより、いっそう可用性が向上できる。

　また、前記実施例では、データ入力サーバ１を、データを管理する機能と、それ以外の機能を備えた１台のサーバコンピュータとして構成しているが、本発明はこれに限定されるものではなく、異なる役割を備えた複数のサーバコンピュータとして構成しても良い。例えば、データを管理する機能を備えたサーバ（いわゆるデータベースサーバ）と、それ以外の機能を備えたサーバとに分割しても良い。

　特にデータベースサーバにおいて、スケーラビリティを向上させるためには、複数のデータベースサーバが１台のデータベースであるかのように動作させるためのクラスタリング技術を適用しても良い。これはいわゆるデータベースクラスタと呼ばれる構成である。このような構成により、スケーラビリティと可用性を同時に高めることができる。

　また、複数台のサーバコンピュータをクラスタとして構成する技術があり、このような技術を導入した場合も、スケーラビリティと可用性を同時に高めることができる。たとえば、ＬＶＳ（Linux Virtual Server）と呼ばれる技術がある。

Claims

　画像データに含まれる文字を光学的に認識して、認識された文字と該文字に該当する領域とを特定可能な認識文字データを生成する認識文字データ生成手段と、
　前記画像データの全領域のうち、前記認識文字データ生成手段にて文字として認識された領域と、文字として認識されなかった領域とを、利用者が識別可能な認識可否合成データを生成する認識可否合成データ生成手段と、
　前記認識可否合成データ生成手段にて生成した前記認識可否合成データと、前記画像データと、を表示する認識可否合成データ表示手段と、
　前記利用者から、前記認識可否合成データに含まれる前記文字として認識された領域のうち誤認識した文字の領域の指定と、前記認識可否合成データに含まれる前記文字として認識されなかった領域のうち文字が未認識である領域の指定と、からなる誤認識文字データを、前記認識可否合成データ表示手段に表示している前記画像データに対応付けて受け付ける誤認識文字データ受付手段と、
　前記画像データの全領域のうち、前記認識文字データ生成手段にて前記文字として認識された領域と、前記文字として認識されなかった領域と、前記文字として認識された領域のうち、前記誤認識文字データ受付手段にて受け付けた誤認識データに含まれる誤認識した文字に該当する領域と、前記認識文字データ生成手段にて前記文字として認識されなかった領域のうち、前記誤認識文字データ受付手段にて受け付けた誤認識文字データに含まれる文字が未認識である領域と、を、前記利用者が識別可能な認識結果合成データを生成する認識結果合成データ生成手段と、
　を備える、
　ことを特徴とする文字認識装置。
　前記文字認識装置は、
　前記画像データの種類と、該種類ごとに予め定められた区画を雛型として記憶する雛型記憶手段と、
　前記画像データの種類を特定する種類特定手段と、
　前記種類特定手段にて特定した前記画像データの種類に対応付けて、前記雛型記憶手段に記憶された雛型を特定し、該特定された雛型毎に予め定められた区画に、前記画像データを分割した分割画像データを前記画像データとして生成する分割画像データ生成手段と、
　を備え、
　前記認識可否合成データ生成手段は、前記分割画像データ生成手段にて生成された前記分割画像データに含まれる文字を光学的に認識して、前記認識可否合成データを生成し、　前記認識結果合成データ生成手段は、前記分割画像データ毎に、前記認識結果合成データを生成する、
　ことを特徴とする請求項１に記載の文字認識装置。
　前記認識結果合成データ生成手段は、前記画像データの全領域のうち、前記認識文字データ生成手段にて前記文字として認識された領域のうち、前記誤認識文字データ受付手段にて受け付けた誤認識文字データに含まれる誤認識した文字に該当する領域と、前記認識文字データ生成手段にて前記文字として認識されなかった領域のうち、前記誤認識文字データ受付手段にて受け付けた誤認識文字データに含まれる文字が未認識である領域のみを含む、前記認識結果合成データを生成する、
　ことを特徴とする請求項１または２に記載の文字認識装置。
　前記認識結果合成データ生成手段は、前記画像データの全領域のうち、前記認識文字データ生成手段にて文字として認識された領域と、文字として認識されなかった領域と、前記誤認識文字データ受付手段にて受け付けた誤認識文字データに含まれる、前記文字として認識された領域のうち誤認識した文字に該当する領域と、前記文字として認識されなかった領域のうち未認識である文字に該当する領域と、に対して互いに異なる色を付与した前記認識結果合成データを生成する、
　ことを特徴とする請求項１～３のいずれかに記載の文字認識装置。
　前記認識可否合成データ生成手段は、前記画像データの全領域のうち、前記認識文字データ生成手段にて文字として認識された領域と、文字として認識されなかった領域と、に対して互いに異なる色を付与した前記認識可否合成データを生成する、
　ことを特徴とする請求項１～４のいずれかに記載の文字認識装置。
　前記認識可否合成データ生成手段は、前記認識文字データ生成手段にて文字として認識された領域においては、前記利用者が、該文字をかたどる部分のみを識別可能にした前記認識可否合成データを生成する、
　ことを特徴とする請求項１～５のいずれかに記載の文字認識装置。
　前記文字認識装置は、
　前記利用者から３種類の異なる指示入力が可能な指示入力手段を備え、
　前記誤認識文字データ受付手段は、前記指示入力手段により、前記認識可否合成データに含まれる文字として認識された領域においては、文字として認識した個々の領域に対応付けて、１文字が認識できている旨を示す１の指示か、１文字が認識できていない旨を示す２の指示のいずれかを受け付け、また、前記認識可否合成データに含まれる文字として認識されなかった領域においては、１文字が認識できていない旨を示す２の指示を認識できていない文字の数だけ受け付け、次に、該領域の指示入力が終了した旨を示す３の指示を受け付けることで、前記認識可否合成データに含まれる文字として認識された領域における誤認識された文字の領域と、前記文字として認識されなかった領域における未認識とされた文字の領域の数とを特定する、
　ことを特徴とする請求項１～６のいずれかに記載の文字認識装置。
　コンピュータを、
　画像データに含まれる文字を光学的に認識して、認識された文字と該文字に該当する領域とを特定可能な認識文字データを生成する認識文字データ生成手段と、
　前記画像データの全領域のうち、前記認識文字データ生成手段にて文字として認識された領域と、文字として認識されなかった領域とを、利用者が識別可能な認識可否合成データを生成する認識可否合成データ生成手段と、
　前記認識可否合成データ生成手段にて生成した前記認識可否合成データと、前記画像データと、を表示する認識可否合成データ表示手段と、
　前記利用者から、前記認識可否合成データに含まれる前記文字として認識された領域のうち誤認識した文字の領域の指定と、前記認識可否合成データに含まれる前記文字として認識されなかった領域のうち文字が未認識である領域の指定と、からなる誤認識文字データを、前記認識可否合成データ表示手段に表示している前記画像データに対応付けて受け付ける誤認識文字データ受付手段と、
　前記画像データの全領域のうち、前記認識文字データ生成手段にて前記文字として認識された領域と、前記文字として認識されなかった領域と、前記文字として認識された領域のうち、前記誤認識文字データ受付手段にて受け付けた誤認識データに含まれる誤認識した文字に該当する領域と、前記認識文字データ生成手段にて前記文字として認識されなかった領域のうち、前記誤認識文字データ受付手段にて受け付けた誤認識文字データに含まれる文字が未認識である領域と、を、前記利用者が識別可能な認識結果合成データを生成する認識結果合成データ生成手段と、
　して機能させることを特徴とする文字認識プログラム。
　コンピュータを、
　画像データに含まれる文字を光学的に認識して、認識された文字と該文字に該当する領域とを特定可能な認識文字データを生成する認識文字データ生成手段と、
　前記画像データの全領域のうち、前記認識文字データ生成手段にて文字として認識された領域と、文字として認識されなかった領域とを、利用者が識別可能な認識可否合成データを生成する認識可否合成データ生成手段と、
　前記認識可否合成データ生成手段にて生成した前記認識可否合成データと、前記画像データと、を表示する認識可否合成データ表示手段と、
　前記利用者から、前記認識可否合成データに含まれる前記文字として認識された領域のうち誤認識した文字の領域の指定と、前記認識可否合成データに含まれる前記文字として認識されなかった領域のうち文字が未認識である領域の指定と、からなる誤認識文字データを、前記認識可否合成データ表示手段に表示している前記画像データに対応付けて受け付ける誤認識文字データ受付手段と、
　前記画像データの全領域のうち、前記認識文字データ生成手段にて前記文字として認識された領域と、前記文字として認識されなかった領域と、前記文字として認識された領域のうち、前記誤認識文字データ受付手段にて受け付けた誤認識データに含まれる誤認識した文字に該当する領域と、前記認識文字データ生成手段にて前記文字として認識されなかった領域のうち、前記誤認識文字データ受付手段にて受け付けた誤認識文字データに含まれる文字が未認識である領域と、を、前記利用者が識別可能な認識結果合成データを生成する認識結果合成データ生成手段と、
　して機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。