JP3640429B2 - ファクシミリocrデ−タ誤り表示方式およびファクシミリocr装置 - Google Patents
ファクシミリocrデ−タ誤り表示方式およびファクシミリocr装置 Download PDFInfo
- Publication number
- JP3640429B2 JP3640429B2 JP10057295A JP10057295A JP3640429B2 JP 3640429 B2 JP3640429 B2 JP 3640429B2 JP 10057295 A JP10057295 A JP 10057295A JP 10057295 A JP10057295 A JP 10057295A JP 3640429 B2 JP3640429 B2 JP 3640429B2
- Authority
- JP
- Japan
- Prior art keywords
- field
- facsimile
- noise
- character recognition
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
- Facsimiles In General (AREA)
Description
【産業上の利用分野】
本発明はファクシミリ装置から送信されたイメージデータを認識処理して得た認識結果(データ)の修正を行うためのファクシミリOCRデータ誤り表示方式、およびファクシミリ装置から送信されたデータを受信し認識処理等を行うファクシミリOCR装置に関する。
【0002】
【従来の技術】
送信側ファクシミリ装置から送られてきた帳票データを受信し、文字認識するファクシミリOCRシステムがある。このようなファクシミリOCRシステムとしては、例えば、(1)送信側のファクシミリから伝送されてきた帳票データをOCRで読取ってから文字認識してデータ処理する方式や、(2)特開昭63−207266号に開示された技術のように、送信側のファクシミリ装置から送られてきた帳票データを一旦ディスク装置等に格納してから格納データを読み出してOCRで文字認識を行う、ファクシミリ装置とOCR(光学的文字認識)装置を備えたファクシミリシステムなどがある。
【0003】
ファクシミリOCR装置により文字認識された結果はフロッピーディスク等の記憶媒体に記憶され、例えば、会計帳票データなら会計処理用応用プログラムでのデータとして用いられ、文書データなら文書処理用プログラムでのデータとして用いられる。
【0004】
このようなファクシミリOCRシステムでは、文字認識処理を行う以上、現在の技術では程度の差であれある確率で"誤認識"データが生ずるが、通常の文字認識装置(ここではファクシミリOCRシステムにおける文字認識装置以外をいう)と異なり、ファクシミリOCRシステムでは回線を介してデータを伝送し、受信データに対して文字認識を行うため、回線条件、送受信条件等データ送信上の諸条件が加味されるので認識率が低下するという問題点がある。
【0005】
このような認識率の低下に対しては、図13,14に示すように認識結果のみか、受信イメージと認識結果をモニターの画面上で対比させ、オペレータが目視によりチェックし誤認識された文字を発見した場合に、キーボードから正しい文字を入力して認識結果を修正する、といった方法がとられていた。
【0006】
しかしながら、ファクシミリOCRシステムで通常の文字認識装置より認識率が低下する最も大きい原因は、送信側ファクシミリ装置で光学的に読取られイメージデータに変換されたデータの送受信が通信回線網を介して行われるため、現在の技術ではノイズが不可避的に生ずることであり、回線ノイズの含まれている文字パターンの文字認識を行うと、読取り不能文字の発生率または誤認識の惹起率が高くなることによる。
【0007】
ファクシミリOCRシステムで読取り不能文字の発生が生じた場合の処理(エラー処理)方法としては、(1)特開昭61−236269号の「ファクシミリデータ誤り表示方式」のように、送信側ファクシミリ装置で誤り認識用マークデータを挿入して送信し、受信側でオペレータが誤り認識用マークデータの存否をイメージデータ上でチェックすることにより、回線ノイズの存否を知る方法や、(2)特開平1−320862号の「ファクシミリ装置」のように、相手端末より受信した原稿が認識不可能な場合、相手端末に受信異常信号を送出することにより再受信を可能にするもの、(3)特開平2−94773号の「OCRファクシミリ装置」のように、文字認識の認識度合いによって相手側ファクシミリ装置に対する帳票の画信号の再送信を要求するもの、(4)特開平6−44402号の「ファクシミリ制御装置」のように、ファクシミリ装置を利用して文字認識システムを構築する時に、文字認識結果を入力者に分かりやすくするため認識OKキャラクタと不読イメージのデータを合成し返送するもの、等がある。
【0008】
【発明が解決しようとする課題】
しかしながら、上記(1)の方法では送信側のファクシミリ装置に「自動的に誤り認識用マークデータを挿入する機構」を設ける必要があるので、例えば、会計事務所等の顧客が現に保有しているファクシミリ装置を送信側端末としてファクシミリOCRシステムを顧客の特別の設備上の負担なしに簡単に構築するには不向きであるという問題点があり、上記(2)〜(4)の方法では、回線にノイズによる場合およびその他記入方法を原因とする場合も含めて認識不能の場合に認識結果(または/および受信イメージデータ)を送信側に自動的に返送し、再送を促して(送信側での再入力による)認識率の向上を行うものであり認識不能文字に対しては有効であるが、回線ノイズの混入により他の文字として認識された場合、すなわち、誤認識の場合には対処できないという問題点があった。
【0009】
本発明は上記従来の不都合および問題点を解決するためになされたものであり、ファクシミリOCRシステムにおいて、受信側でノイズによる誤認識の可能性の有無を検査することにより誤認識文字の修正作業を容易に成し得る、ファクシミリOCRデータ誤り表示方式およびその検査処理等を行うファクシミリOCR装置の提供を目的とする。
【0010】
【課題を解決するための手段】
上記の目的を達成するために、第1の発明のファクシミリOCRデータ誤り表示方式は、ファクシミリOCR装置と、記憶装置及び表示部を備えた外部データ修正装置とからなるファクシミリOCRデ−タ誤り表示方式であって、ファクシミリOCR装置側において、ファクシミリ受信したイメージデータをフィールド毎に回線ノイズが含まれているか否かを検査し、イメージデータについて文字認識を行い、少なくとも、フィールド毎の検査結果と該フィールドの文字認識結果とをフィールド単位で外部データ修正装置に出力し、外部データ修正装置側において、ファクシミリOCR装置による検査結果と文字認識結果を記憶装置に格納し、格納した検査結果と文字認識結果を所望の時期に読み出し、検査結果が回線ノイズが含まれていないことを意味するフィールドについては表示部にフィールド毎の文字認識結果および/またはフィールド毎のイメージデータを表示し、検査結果が回線ノイズが含まれていることを意味するフィールドについてはノイズの存在を示す情報を文字認識結果にフィールド単位で重畳させて表示することを特徴とする。
【0011】
また、第2の発明のファクシミリOCRデータ誤り表示方式は、ファクシミリOCR装置と、記憶装置及び表示部を備えた外部データ修正装置とからなるファクシミリOCRデ−タ誤り表示方式であって、ファクシミリOCR装置側において、ファクシミリ受信したイメージデータをフィールド毎に回線ノイズが含まれているか否かを検査し、イメージデータについて文字認識を行い、少なくとも、フィールド毎の検査結果と該フィールドの文字認識結果とをフィールド単位で外部データ修正装置に出力し、外部データ修正装置側において、ファクシミリOCR装置による検査結果と文字認識結果を記憶装置に格納し、格納した検査結果と文字認識結果を所望の時期に読み出し、検査結果が回線ノイズが含まれていないことを意味するフィールドについては表示部にフィールド毎の文字認識結果およびフィールド毎のイメージデータを表示し、前記検査結果が回線ノイズが含まれていることを意味するフィールドについてはノイズの存在を示す情報をフィールド毎のイメージデータに重畳させて文字認識結果と対応表示することを特徴とする。
【0012】
また、第3の発明のファクシミリOCR装置は、通信回線網を介してイメージ制御情報及びファクシミリ符号化されたイメージデータを受信する受信手段と、イメージ制御情報に基づいて受信したイメージを復号すると共に、1ライン分のイメージデータにノイズが含まれているとき、ライン番号をノイズメモリに格納すると共に、復号したイメージデータをイメージメモリに格納する復号化手段と、フィールド情報を作成するフィールド処理手段と、フィールド情報に基づくフィールドの位置座標とノイズメモリに格納されているライン番号からそのフィールドに回線ノイズが含まれているか否かを判定し、判定結果を出力手段に出力するフィールドノイズ判定手段と、フィールド情報に基づくフィールドの位置座標や文字数からイメージメモリ上の文字パターンを1文字毎に切出し、該文字パターンから文字を認識して出力手段に出力する文字認識手段と、フィールドノイズ判定手段による判定結果と文字認識手段による文字認識結果とを外部データ修正装置に出力する出力手段と、を有することを特徴とする。
【0013】
【実施例】
<実施例1>
図1はファクシミリOCRデータ修正方式の一例であり、送信側ファクシミリ装置101,102,103で、認識対象である帳票原稿や文書原稿等を光学的に読取り、そのイメージデータを通信回線網を介してファクシミリOCR装置200に送出する。
【0014】
ファクシミリOCR装置200は、受信したイメージデータに回線ノイズが含まれているか否かを検査し、ノイズが存在する場合にはノイズの存在を示す情報(フラグ、特定パターン若しくは行番号コード等)を生成する。ファクシミリOCR装置200は、イメージデータから指定された文字種の文字を認識し、少なくとも、フィールド毎の認識結果,及びノイズの存否を示す情報を出力する(図2参照)。なお、この場合、フィールド毎のビットマップイメージ(イメージデータ)も併せて出力するように構成してもよい。
【0015】
また、ノイズが含まれているとき対応する認識結果を特定の記号等に変換して出力するようファクシミリOCR装置200を構成してもよいし(図7、8参照)、ノイズが含まれているとき対応するフィールドのビットマップイメージを加工し、認識結果と共に出力するようファクシミリOCR装置200を構成してもよいし(図12参照;この場合はノイズの存在を示す情報(特定パターン)がビットマップイメージに重畳されて出力されることを意味する)。
【0016】
ホストコンピュータ120は、ファクシミリOCR装置200から出力された認識結果等を図示しない記憶装置に格納する。格納された認識結果等は所望の時期に読み出され、認識結果の修正作業が行われる。修正作業時にはホストコンピュータ120はオペレータの指示により認識結果等を読み出し、ディスプレイ121の画面上に認識結果(および/またはビットマップイメージ)を表示する。認識結果は、回線ノイズが含まれていないフィールドについてはディスプレイ画面上に認識結果および/またはフィールド毎のイメージデータを表示し、回線ノイズが含まれているフィールドについては、オペレータが誤認識文字を発見しやすいように下記のいずれかにより表示する。
【0017】
(1)ノイズの存在を示す情報を認識結果と重畳させて表示する(図7参照)。
(2)認識結果を特定パターンで置換して表示する(図8参照)。
(3)ノイズの存在を示す情報をフィールド毎のイメージデータ(ビットマップイメージ)に重畳させて認識結果と対応表示する(図12参照)。
【0018】
上記(1)の表示方法によれば、オペレータはディスプレイ121の画面上に表示された認識結果等を見て誤認識文字を容易に発見することができる。オペレータは誤認識文字あるいは読取り不能文字を見出した場合はキーボード122から正しい文字を入力する。ホストコンピュータ120はキーボード122から入力された文字と該当箇所の誤認識文字あるいは読取り不能文字とを置換し、置換結果を表示する。
【0019】
上記(2)の表示方法によれば、ディスプレイ画面上で回線ノイズを含んだイメージデータを基に認識された認識文字は他のパターンで全部置き換えられて表示されるので、オペレータはそのフィールドの文字のみを再入力すればよくチェックの労力が省略でき修正が容易であり、見逃し等による未修正の誤認文字がなくなる。
【0020】
上記(3)の表示方法によれば、ディスプレイ画面上で回線ノイズを含んだイメージデータには特定のパターンが重畳されて表示され、また、認識文字と対応付けられて表示されるので、オペレータは特定のパターンが重畳されたそのフィールドのみをチェックし再入力すればよく、従来の単なる認識結果およびビットマップイメージの対応表示と比べチェックの労力が省略でき修正が容易となる。
【0021】
<実施例2>
図2はファクシミリOCR装置200の一実施例の構成を示すブロック図である。図2で、ファクシミリ通信手段201は通信回線網110を介して送信側ファクシミリ装置とファクシミリ通信を行い、主走査線画素数、副走査線密度、符号化文字の種類等のイメージ制御情報と、符号化されたままのイメージデータを受信し、イメージ制御情報はOCR制御化手段206に、符号化イメージデータは符号化メモリ202に格納する。
【0022】
復号化手段203は、OCR制御手段206からイメージ制御情報を受取り、その情報を基に符号化データメモリ202のデータを復号化してイメージメモリ205に展開する。このとき、符号化データに回線ノイズが含まれていると復号化手段203は後述するように([復号化手段の動作原理](図6)参照)正常動作ができなくなるので、イメージメモリ205のライン番号を回線ノイズメモリ204に格納する。
【0023】
帳票(または文書)1枚分のイメージデータの復号化を終了した場合で、例えば、図3に示すようにイメージメモリ205上の400ライン目(副走査方向)と1600ライン目に回線ノイズが発生しているとすると、回線ノイズメモリ204には図4に示すように回線ノイズの発生したライン番号(400,1600)が格納されている。なお、図3で、イメージメモリ205上の回線ノイズは黒く塗り潰して示してあるがこれは説明上のものであり、回線ノイズの発生したラインのイメージデータの処理方法は任意の方法でよく、例えば、前ラインを複写するような方法でもよい。
【0024】
OCR制御手段206は、復号化処理を終了した旨の報告を受け取ると、全てのフィールドの処理が終了するまで1フィールド毎にフィールド処理手段207を起動する。フィールド処理手段207は処理を行うフィールドのイメージメモリ205上の位置座標、フィールド内文字数、フィールド番号等のフィールド情報を作成し、文字認識手段208、フィールドノイズ判定手段209、出力手段120に出力する。
【0025】
フィールドノイズ判定手段209はフィールドのイメージメモリ205上の位置座標と回線ノイズメモリ204に格納されている、回線ノイズが発生したイメージメモリ上のライン番号とから、そのフィールドに回線ノイズが含まれているか否かを判定し、判定結果を出力手段210に出力する。例えば、図5に示すフィールドの処理を行うとすると、その位置座標は主走査方向が120画素から640画素まで、副走査方向が385ラインから420ラインまでとすると、回線ノイズメモリ204に格納されている数値は副走査方向のライン数を示すものであるため、その格納数値400は385以上425以下であるから、図5のフィールド内に回線ノイズが含まれていることがわかる。このとき、フィールドノイズ判定手段209は出力手段210にこのフィールドが回線ノイズを含むフィールドであることを示すフィールドノイズ情報を出力する。このフィールドノイズ判定手段209はファクシミリOCR装置200内で位置ずれや方向等を修正するためイメージデータがローテーション(回転)された場合にも、イメージデータをローテーションすると同時に回線ノイズメモリ204に格納されているデータをローテーション後の対応するラインに変換することにより、適用できる。
【0026】
文字認識手段208は、フィールドの位置座標や文字数からイメージメモリ上の文字パターンを1文字毎に切出し、文字パターンの形状を調べることにより文字を認識し、その認識結果を出力手段210に出力する。
【0027】
出力手段210は、該フィールドのフィールド番号と、1フィールド分の認識結果と、当該フィールドが回線ノイズを含む場合にそのことを示すフィールドノイズ情報を外部装置(例えば、ホストコンピュータ)に出力し、フィールド処理手段207に1フィールドの結果が終了した旨の報告を行い、全てのフィールドの処理が終了するまでこれらの処理を繰返す。なお、この場合、当該フィールドが回線ノイズを含むことを示すフィールドノイズ情報のみでなく、回線ノイズを含まない正常なフィールドであることを示す情報もフィールドノイズ情報として出力するようにしてもよい。
【0028】
[復号化手段の動作原理]
復号化手段203は、送信側ファクシミリ装置でファクシミリ符号化されたファクシミリ符号を復号する。ファクシミリ符号化方式は国際的に標準化されており、その制定母体としてITU−TS(国際電機通信連合(旧CCITT(国際電信電話諮問委員会))がある。ITU−TS SG8では一次元符号化方式(いわゆるMH方式)と2次元符号化方式(いわゆるMR方式)がある。
【0029】
以下、復号化手段203の動作原理について述べ、説明上、図6(a)に示すようなMH方式の符号8個からなる符号化方式でファクシミリ送信が行われるものとして説明するが、本発明の復号化手段203の動作方式は上述したITU−TSのMH方式およびMR方式による符号化方式に適用することができる。
【0030】
図6(a)の符号化方式で、白ランレングス(ランレングス;画素の連続をいう)4画素、黒ランレングス2画素の連続するイメージデータをファクシミリ送信する場合について考えると、最初に送信側ファクシミリ装置の符号化手段(図示せず)で白ランレングス4画素はそれに対応する符号語の「00001」に符号化される。次に、黒ランレングス2画素が対応する符号語の「110」に符号化される。1枚分の帳票若しくは文書に相当するイメージのデータは同様にライン毎に符号化を繰返され、イメージデータ1ラインの符号は、例えば、図3(b)に示す符号化コードAとなる。
【0031】
この符号化コードAは、送信側のファクシミリ通信制御手段によって通信回線上に送出され受信側のファクシミリ通信制御手段で受信されるが、受信した符号化コードBが通信回線上でなんらかの回線ノイズにより図6(c)に示すように符号化コードAの14ビット目の「1」が「0」に変ってしまったとすると、受信側の復号化手段203は受信した符号化コードBの最初の5ビットが符号語の「00001」に一致するのでイメージデータの最初の5ビットを白ランレングス4画素に復号化し、次に続く3ビットについても符号語の「110」に一致するのでイメージデータを黒ランレングス2画素に復号化するというように順次復号化を行っていく。
【0032】
しかし、2番目に表われるはずの黒ランレングス2画素の部分で「110」であるはずの符号化コードBが回線ノイズにより「100」に変ってしまったため、図6(a)の符号化方式では3ビットの「100」に対応する符号語がないため、復号化手段203は2ビット「10」に対応する符号語を調べ黒ランレングス1画素と解釈して復号化してしまう。
【0033】
この時点で復号化手段203は、回線ノイズがあったことを検出するわけではないが、それに続く符号化コードBは符号長の最長ビットである5ビット(図6(a))としても「00000」であり、図6(a)の表に示す符号とは一致するものがないので、復号化が不可能となり、復号化手段203は回線ノイズの存在を検出することができる。回線ノイズの存在を検出したとき復号化手段203は前述したように回線ノイズの存在するライン番号を回線ノイズメモリ204に格納する。
【0034】
なお、本実施例の出力は、実施例1で述べたように、ホストコンピュータ120(若しくは、データ入力専用機)の図示しない記憶装置に格納れ、格納された認識結果等は所望の時期に読み出され、ディスプレイ画面上に表示されオペレータにより認識結果の修正作業が行われる。この場合、前述したように、ノイズの存在を示す情報を認識結果と重畳させて表示する方法、若しくは、認識結果を特定パターンに置換表示する方法でディスプレイ画面に表示することが望ましい。
【0035】
図7は、ノイズの存在を示す情報を基に特定パターンを認識結果と重畳させて表示する方法により画面表示された認識データの例であり、画面上で回線ノイズを含んだイメージデータを基に認識された認識文字列(フィールドデータ)上には網目が重畳されて表示されるので、オペレータはそのフィールドのみをチェックすればよく、誤認識の発見が容易である。ホストコンピュータはそのフィールドが回線ノイズを含んだイメージデータを基に認識された認識文字列か否かをフィールドノイズ情報によって判別し、回線ノイズを含んだものである場合には、そのフィールドが回線ノイズを含んだイメージデータを基に認識された認識文字列であることを示す特定のパターン(網目等)を重畳させて表示するか、或いはフィールドの前/後に特定のサインを表示する等、ノイズの存在を示す情報を認識結果と対応表示することにより、オペレータに回線ノイズの存在と誤認識の可能性を示唆する。
【0036】
図8は、認識結果を特定パターンに置換表示する方法により画面表示された認識データの例であり、画面上で回線ノイズを含んだイメージデータを基に認識された認識文字(フィールドデータ)のフィールドは他のパターン(図8では?で全部置き換えられて表示されるので、オペレータはそのフィールドのみを再入力すればよくチェックの労力が省略でき修正が容易であり、見逃し等による未修正の誤認文字がなくなる。ホストコンピュータはファクシミリOCR200から出力される認識結果等を記憶装置に格納する際に、認識文字フィールドが回線ノイズを含んだイメージデータを基に認識された認識文字列か否かをフィールドノイズ情報によって判別し、回線ノイズを含んだものである場合にはそのフィールドの文字認識結果を強制的にリジェクトして、特定のパターン(例えば、?)で全部置き換えて格納し、認識文字の修正時にはそのままフォーマットにしたがって画面表示する。なお、後者の場合、ホストコンピュータはファクシミリOCR200から出力される認識結果等をそのまま記憶装置に格納し、修正時の表示の際に、認識文字フィールドが回線ノイズを含んだイメージデータを基に認識された認識文字列か否かをフィールドノイズ情報によって判別し、回線ノイズを含んだものである場合にはそのフィールドの文字認識結果を特定のパターン(例えば、?)で全部置き換えて表示するようにしてもよい。
【0037】
<実施例3>
図9はファクシミリOCR装置200の他の実施例の構成を示すブロック図である。図9で、ファクシミリOCR装置200のファクシミリ通信制御手段201〜フィールド制御手段207の構成は図2のファクシミリOCR装置200の場合と同様であり、説明を省略する。
【0038】
図9で、フィールドノイズ判定手段209は図2のフィールドノイズ判定手段209と同様、フィールドのイメージメモリ205上の位置座標と回線ノイズメモリ204に格納されている、回線ノイズが発生したイメージメモリ上のライン番号とから、そのフィールドに回線ノイズが含まれているか否かを判定するが、判定結果は文字認識手段208に出力する。また、フィールドノイズ判定手段209はファクシミリOCR装置200内で位置ずれや方向等を修正するためイメージデータがローテーション(回転)された場合にも適用できる点もフィールドノイズ判定手段209と同様である。
【0039】
文字認識手段208はフィールドノイズ判定手段209からのフィールドノイズ情報を調べ、該フィールドにノイズが無かった場合には、フィールドの位置座標や文字数からイメージメモリ上の文字パターンを1文字毎に切出し、文字パターンの形状を調べることにより文字を認識し、その認識結果を出力手段210に出力するが、該フィールドにノイズがあった場合には、文字認識処理を行わず認識結果を強制的にリジェクトして特定のパターン(例えば、?)で置き換えて、出力手段210に出力する。
【0040】
出力手段210は該フィールドのフィールド番号と、1フィールド分の認識結果を外部装置(例えば、ホストコンピュータ)に出力し、フィールド処理手段207に1フィールドの結果が終了した旨の報告をおこない、全てのフィールドの処理が終了するまでこれらの処理を繰返す。
【0041】
また、ホストコンピュータはファクシミリOCR200から出力される認識結果等を記憶装置に格納し、認識文字の修正時にはそのままフォーマットにしたがって画面表示する(図8参照)。この場合、画面上では回線ノイズを含んだイメージデータを基に認識された認識文字(フィールドデータ)は他のパターン(図8では?)で全部置き換えられて表示されるので、オペレータはそのフィールドのみを再入力すればよくチェックの労力が省略でき修正が容易であり、見逃し等による未修正の誤認文字がなくなる。
【0042】
<実施例4>
図10はファクシミリOCR装置200の第3の実施例の構成を示すブロック図である。図10で、ファクシミリOCR装置200"のファクシミリ通信制御手段201〜イメージメモリ205及び文字認識手段208の構成は図2のファクシミリOCR装置200の場合と同様であり、説明を省略する。
【0043】
図10で、フィールド処理手段207"は処理を行うフィールドのイメージメモリ205上の位置座標、フィールド内文字数、フィールド番号等のフィールド情報を作成し、文字認識手段208、フィールドノイズ判定手段209"、フィールドイメージ作成手段211、および出力手段210"に出力する。
【0044】
フィールドノイズ判定手段209"は図2のフィールドノイズ判定手段209と同様、フィールドのイメージメモリ205上の位置座標と回線ノイズメモリ204に格納されている、回線ノイズが発生したイメージメモリ上のライン番号とから、そのフィールドに回線ノイズが含まれているか否かを判定するが、判定結果はフィールドイメージ作成手段211に出力する。また、フィールドノイズ判定手段209"はファクシミリOCR装置200"内で位置ずれや方向等を修正するためイメージデータがローテーション(回転)された場合にも適用できる点もフィールドノイズ判定手段209と同様である。
【0045】
フィールドイメージ作成手段211はフィールドの位置座標からフィールド内のビットマップイメージを切出すが、そのフィールドがフィールドノイズ判定手段209"によって回線ノイズの含まれているフィールドと判定された場合には、例えば、図11に示すようにビトマップイメージの回線ノイズ発生ラインを軸とする横線を重畳させるような加工を施し、出力手段210"に出力する。フィールドに回線ノイズが含まれていない場合には加工を施すことなく出力手段210"に出力する。
【0046】
出力手段210"は該フィールドのフィールド番号と、1フィールド分の認識結果と、ビットマップイメージを外部装置(例えば、ホストコンピュータ)に出力し、フィールド処理手段207"に1フィールドの結果が終了した旨の報告をおこない、全てのフィールドの処理が終了するまでこれらの処理を繰返す。また、ホストコンピュータはファクシミリOCR装置200"から出力される認識結果およびビットマップイメージを記憶装置に格納し、認識文字の修正時にはそのままフォーマットにしたがって画面上に認識結果およびビットマップイメージを対応表示する(図12参照)。
【0047】
図12の場合は、ノイズの存在を示す情報をフィールド毎のイメージデータに重畳させて認識結果と対応表示する例であり、画面上で回線ノイズを含んだイメージデータには特定のパターンが重畳されて表示され、また、認識文字と対応付けられて表示されるので、オペレータは特定のパターンが重畳されたそのフィールドのみをチェックし再入力すればよく、図14に示す従来の単なる認識結果およびビットマップイメージの対応表示と比べチェックの労力が省略でき修正が容易となる。
【0048】
なお、本実施例ではファクシミリOCR側でビットマップイメージを加工しているが、図2のOCR装置200で認識結果とフィールドが回線ノイズを含むことを示すフィールドノイズ情報に加え、ビットマップイメージを出力するよう構成し、ホストコンピュータ側で回線ノイズを含んだイメージデータに特定のパターンを重畳させるようにして認識結果とそのビットマップイメージを対応表示するようにしてもよい。
【0049】
【発明の効果】
以上説明したように、第1の発明のファクシミリOCRデータ誤り表示方式は、ファクシミリOCR装置側において、少なくとも、フィールド毎の認識結果及びノイズが存在する場合についてはその存在を示す情報を出力し、表示装置側では、ファクシミリOCR装置から出力された認識結果等について、回線ノイズが含まれていないフィールドについてはディスプレイ画面上に認識結果および/またはフィールド毎のイメージデータを表示し、回線ノイズが含まれているフィールドについては、ノイズの存在を示す情報を認識結果と重畳させて表示できる。オペレータはデータの修正作業時にディスプレイ画面上で回線ノイズが含まれているフィールドを容易に見出すことができる。
【0050】
また、第2の発明のファクシミリOCRデータ誤り表示方式では、ディスプレイ画面上で回線ノイズを含んだイメージデータを基に認識された認識文字は他のパターンで全部置き換えられて表示されるので、オペレータはそのフィールドのみを再入力すればよくチェックの労力が省略でき修正が容易であり、見逃し等による未修正の誤認文字がなくなる。
【0051】
更に、第3の発明のファクシミリOCRデータ誤り表示方式では、ディスプレイ画面上で回線ノイズを含んだイメージデータには特定のパターンが重畳されて表示され、また、認識文字と対応付けられて表示されるので、オペレータは特定のパターンが重畳されたそのフィールドのみをチェックし再入力すればよく、従来の単なる認識結果およびビットマップイメージの対応表示と比べチェックの労力が省略でき修正が容易となる。
【0052】
第4の発明のファクシミリOCR装置は、文字認識結果と、フィールドに回線ノイズが含まれている場合にはそのことを示すフィールドノイズ情報と、を外部装置に出力するので、表示装置側では、ファクシミリOCR装置の出力を格納しておき、所望の時期に読み出して、ノイズの存在を示す情報に基づいて、(1)ノイズの存在を示す情報を認識結果と重畳させて表示する方法、(2)認識結果をノイズの存在を示す情報としての特定パターンに置換表示する方法、(3)ノイズの存在を示す情報をフィールド毎のイメージデータに重畳させて認識と対応表示する方法、のずれか1つの方法により表示できる。
【0053】
第5の発明のファクシミリOCR装置は、フィールドにノイズがあった場合に文字認識処理を行わず認識結果を特定のパターンで置き換えて認識結果として出力し、出力手段が認識結果を外部装置に出力するので、表示装置側では、ファクシミリOCR装置の出力を格納しておき、所望の時期に読み出して表示装置に表示できる。これにより、ディスプレイ画面上で回線ノイズを含んだイメージデータを基に認識された認識文字は他のパターンで全部置き換えられて表示されるので、オペレータはそのフィールドのみを再入力すればよくチェックの労力が省略でき修正が容易であり、見逃し等による未修正の誤認文字がなくなる。
【0054】
第6の発明のファクシミリOCR装置は、フィールドが回線ノイズを含んでいるものと判定された場合には、当該フィールドのイメージデータに特定の加工を施して、認識結果と当該認識結果に対応するイメージデータとを出力する。表示装置側では、ファクシミリOCR装置の出力を格納しておき、所望の時期に読み出して表示装置に表示できる。これにより、ディスプレイ画面上で回線ノイズを含んだイメージデータには特定のパターンが重畳されて表示され、また、認識文字と対応付けられて表示されるので、オペレータは特定のパターンが重畳されたそのフィールドのみをチェックし再入力すればよく、従来の単なる認識結果およびビットマップイメージの対応表示と比べチェックの労力が省略でき修正が容易となる。
【図面の簡単な説明】
【図1】 ファクシミリOCRデータ修正方式の一例である。
【図2】 本発明のファクシミリOCR装置の一実施例の構成を示すブロック図である。
【図3】 イメージメモリに格納されたイメージデータの例である。
【図4】 回線ノイズメモリに格納されたノイズ発生ライン番号の例である。
【図5】 フィールドとノイズ発生ラインの関係を示す説明図である。
【図6】 符号化及び復号化の原理と回線ノイズの発生と復号化手段の動作の説明図である。
【図7】 本発明のファクシミリOCRデータ誤り表示方式により、ノイズの存在を示す情報を認識結果に重畳させて表示した修正画面の例である。
【図8】 本発明のファクシミリOCRデータ誤り表示方式により、ノイズのあるフィールドを特定パターンに置き換えて表示した修正画面の例である。
【図9】 本発明のファクシミリOCR装置の他の実施例の構成を示すブロック図である。
【図10】 本発明のファクシミリOCR装置の第3の実施例の構成を示すブロック図である。
【図11】 回線ノイズのあるビットマップイメージに加える加工例の説明図である。
【図12】 本発明のファクシミリOCRデータ誤り表示方式により、認識結果と特定パターンを重畳させたビットマップイメージを対応表示させて表示した修正画面の例である。
【図13】 従来の修正画面の例である。
【図14】 対応表示の場合の従来の修正画面の例である。
【符号の説明】
100,101,102 送信側ファクシミリ装置
120 ホストコンピュータ(外部データ修正装置)
200,200,200" ファクシミリOCR装置
202 符号化データメモリ
203 復号化手段
204 回線ノイズメモリ
205 イメージメモリ
206 OCR制御手段
207,207" フィールド処理手段
208,208 文字認識手段
209,209,209" フィールドノイズ判定手段
210,210,210" 出力手段
211 フィールドイメージ作成手段
Claims (3)
- ファクシミリOCR装置と、記憶装置及び表示部を備えた外部データ修正装置とからなるファクシミリOCRデ−タ誤り表示方式であって、
ファクシミリOCR装置側において、ファクシミリ受信したイメージデータをフィールド毎に回線ノイズが含まれているか否かを検査し、イメージデータについて文字認識を行い、少なくとも、前記フィールド毎の検査結果と該フィールドの文字認識結果とをフィールド単位で前記外部データ修正装置に出力し、
前記外部データ修正装置側において、前記ファクシミリOCR装置による前記検査結果と文字認識結果を記憶装置に格納し、格納した前記検査結果と文字認識結果を所望の時期に読み出し、前記検査結果が回線ノイズが含まれていないことを意味するフィールドについては前記表示部にフィールド毎の文字認識結果および/またはフィールド毎のイメージデータを表示し、前記検査結果が回線ノイズが含まれていることを意味するフィールドについてはノイズの存在を示す情報を前記文字認識結果にフィールド単位で重畳させて表示することを特徴とするファクシミリOCRデータ誤り表示方式。 - ファクシミリOCR装置と、記憶装置及び表示部を備えた外部データ修正装置とからなるファクシミリOCRデ−タ誤り表示方式であって、
ファクシミリOCR装置側において、ファクシミリ受信したイメージデータをフィールド毎に回線ノイズが含まれているか否かを検査し、イメージデータについて文字認識を行い、少なくとも、前記フィールド毎の検査結果と該フィールドの文字認識結果とをフィールド単位で前記外部データ修正装置に出力し、
前記外部データ修正装置側において、前記ファクシミリOCR装置による前記検査結果と文字認識結果を記憶装置に格納し、格納した前記検査結果と文字認識結果を所望の時期に読み出し、前記検査結果が回線ノイズが含まれていないことを意味するフィールドについては前記表示部にフィールド毎の文字認識結果およびフィールド毎のイメージデータを表示し、前記検査結果が回線ノイズが含まれていることを意味するフィールドについてはノイズの存在を示す情報をフィールド毎のイメージデータに重畳させて文字認識結果と対応表示することを特徴とするファクシミリOCRデータ誤り表示方式。 - 通信回線網を介してイメージ制御情報及びファクシミリ符号化されたイメージデータを受信する受信手段と、イメージ制御情報に基づいて受信したイメージを復号すると共に、1ライン分のイメージデータにノイズが含まれているとき、ライン番号をノイズメモリに格納すると共に、復号したイメージデータをイメージメモリに格納する復号化手段と、フィールド情報を作成するフィールド処理手段と、前記フィールド情報に基づくフィールドの位置座標とノイズメモリに格納されているライン番号からそのフィールドに回線ノイズが含まれているか否かを判定し、判定結果を出力手段に出力するフィールドノイズ判定手段と、前記フィールド情報に基づくフィールドの位置座標や文字数からイメージメモリ上の文字パターンを1文字毎に切出し、該文字パターンから文字を認識して出力手段に出力する文字認識手段と、前記フィールドノイズ判定手段による判定結果と文字認識手段による文字認識結果とを外部データ修正装置に出力する出力手段と、を有することを特徴とするファクシミリOCR装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10057295A JP3640429B2 (ja) | 1995-03-31 | 1995-03-31 | ファクシミリocrデ−タ誤り表示方式およびファクシミリocr装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10057295A JP3640429B2 (ja) | 1995-03-31 | 1995-03-31 | ファクシミリocrデ−タ誤り表示方式およびファクシミリocr装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH08274921A JPH08274921A (ja) | 1996-10-18 |
JP3640429B2 true JP3640429B2 (ja) | 2005-04-20 |
Family
ID=14277625
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10057295A Expired - Fee Related JP3640429B2 (ja) | 1995-03-31 | 1995-03-31 | ファクシミリocrデ−タ誤り表示方式およびファクシミリocr装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3640429B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110334707A (zh) * | 2019-06-28 | 2019-10-15 | 苏宁云计算有限公司 | 一种模型修正方法及修正系统 |
CN110334640A (zh) * | 2019-06-28 | 2019-10-15 | 苏宁云计算有限公司 | 一种票据审核方法及系统 |
-
1995
- 1995-03-31 JP JP10057295A patent/JP3640429B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH08274921A (ja) | 1996-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5227893A (en) | Pseudo-bar code control of image transmission | |
US5363214A (en) | Facsimile transmission system | |
US5974203A (en) | Pattern recognition communication apparatus for transmitting and receiving image data | |
US9154663B2 (en) | Communication device and method for decoding image data | |
US6407828B1 (en) | Document transmission module connectable to data source for transmitting data in standard or high speed modes | |
JP3640429B2 (ja) | ファクシミリocrデ−タ誤り表示方式およびファクシミリocr装置 | |
GB2332801A (en) | Prediction image generating apparatus | |
JP3240273B2 (ja) | 帳票読み取り装置 | |
JPH0869250A (ja) | 暗号化鍵または復号鍵の入力装置および通信装置 | |
JPH0512288A (ja) | 情報処理装置 | |
JP3524208B2 (ja) | 複合画像処理装置及び画像処理方法 | |
JPH08181837A (ja) | ファクシミリ装置および画像信号の文字認識方法 | |
JP2586842B2 (ja) | ファクシミリ受信装置 | |
KR100274626B1 (ko) | 원고비틀림보정장치및방법 | |
JPH1175044A (ja) | 画像中継伝送方法、音声中継伝送方法、画像中継伝送装置及び音声中継伝送装置 | |
JPS63105565A (ja) | 画像入力確認方式 | |
JPH0412061B2 (ja) | ||
JPH0220171A (ja) | ファクシミリ装置 | |
JPH09130567A (ja) | メッセージ送信装置、ならびに、画像情報読取装置とこれを用いた装置 | |
JP3135785B2 (ja) | ファクシミリ装置 | |
JP2507377B2 (ja) | ファクシミリを用いた文字認識装置 | |
JPS62160866A (ja) | 表示機能付フアクシミリ装置 | |
JPH1117833A (ja) | ファクシミリ装置および宛先シート作成装置 | |
JPH07200721A (ja) | 文字認識電子メール装置 | |
JPH0316362A (ja) | 画像通信装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040413 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20040608 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20040608 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040611 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041221 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20050118 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110128 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |