JPH0594562A - Ocr認識装置 - Google Patents

Ocr認識装置

Info

Publication number
JPH0594562A
JPH0594562A JP3255397A JP25539791A JPH0594562A JP H0594562 A JPH0594562 A JP H0594562A JP 3255397 A JP3255397 A JP 3255397A JP 25539791 A JP25539791 A JP 25539791A JP H0594562 A JPH0594562 A JP H0594562A
Authority
JP
Japan
Prior art keywords
ocr
original
data
character
font
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3255397A
Other languages
English (en)
Inventor
Kunio Shijo
邦夫 四條
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP3255397A priority Critical patent/JPH0594562A/ja
Publication of JPH0594562A publication Critical patent/JPH0594562A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】OCR原稿を容易に作成でき、このOCR原稿
の認識および解析を簡単な構成でできるようにする。 【構成】OCR原稿1の先頭には、同一文字が同一間隔
で複数ライン記入される。これによってOCR認識装置
では白黒データの変化が規則的であることを識別したと
き、これがOCR原稿1であると判別可能となる。OC
R原稿1には次にフォントデータ登録用文字列3が記入
され、これがOCR認識装置に登録される。そして、次
に読み取った画像データがフォントデータと比較される
ことによって文字データに変換される。この文字データ
が解析され、解析された情報に従ってOCR認識装置を
適用した装置、例えばファクシミリ装置であれば、各部
が動作することにより中継送信やマルチコピーなどが行
われる。この発明によれば、OCR原稿1はワープロや
パソコンなどで容易に作成できると共に、文字認識部も
簡単な構成にすることができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、OCR認識装置に関す
る。
【0002】
【発明の背景】OCR(Optical Character Recogni
tion:光学的文字認識)用原稿を使用して通信を行うよ
うにした通信装置がある。OCRとは周知のように、光
学的に文字画像を読み取り、これを文字として認識する
ものである。
【0003】OCR用の原稿には、まずOCR用の原稿
であることを判断するための特別マークが設けられ、ま
た、文字の認識率を上げるため字体の制限が行われるこ
とが多い。
【0004】この字体の制限は例えば数字の場合は日マ
ークや田マークの上に数字を書き込むようにすることな
どによって行われる。
【0005】また、OCR原稿を用いた通信において
は、まず送信側でOCR原稿を読み取り、これをラスタ
ーデータとして送信する。受信側では送られてきたデー
タを受信したとき、この受信データに含まれる特別マー
クを判別するか、もしくはOCR処理を操作者が指定し
た場合に受信データの文字認識を行う。
【0006】そして、認識した文字情報に従って各種の
動作が行われる。例えばファクシミリ装置の場合には中
継同報送信、親展送信、マルチコピーなどの動作が設定
されたり、短縮番号やワンタッチキーの登録が行われ
る。
【0007】さらに、通信装置がコンピュータに接続さ
れている場合には、そのコンピュータに受信した文字デ
ータを送出することなどもできる。通常の原稿が必要な
場合は、OCR原稿の次にこの通常原稿が添付されて送
信され、受信側ではこれを例えば中継送信したり、マル
チコピーしたりする。
【0008】
【発明が解決しようとする課題】従来のOCR原稿で
は、OCR原稿であることを示す特別マークを設定しな
ければならず、しかもこの特別マークは寸法的に高精度
を必要とするので、予め原稿に印刷しておかなければな
らない。
【0009】したがって、このような特別マークが記入
された原稿が用意されていない場合にはOCRを使用す
ることができない。
【0010】さらに字体の制限があるので作業が面倒で
あり、また、通信時の回線ノイズによるエラーの影響を
避けることができないなどの問題がある。
【0011】従来のOCR認識装置においては、文字認
識のアルゴリズムが非常に複雑であるから回路構成が複
雑となり、したがって高価になってしまう。OCRに代
えてOMR(Optical Mark Reader)用の原稿を用い
る認識装置もあるが、このOMR原稿は所定の範囲にマ
ークを付けるものであるから情報量が非常に少なくなる
という問題がある。
【0012】このような問題は、通信装置に限らずOC
R認識装置を適用した各種の装置に共通するものであ
る。
【0013】そこで、この発明は上述したような課題を
解決したものであって、字体制限がなく、簡単に作成可
能なOCR原稿を使用でき、しかも安価に構成できるO
CR認識装置を提案するものである。
【0014】
【課題を解決するための手段】上述の課題を解決するた
め、本発明においては、最初に入力された画像データの
白黒変化が規則的であるときOCR原稿であることを判
別するOCR原稿判別手段と、白黒変化が規則的な画像
データの次に入力された画像データをフォントデータと
して登録するフォントデータ登録手段と、フォントデー
タの次に入力された画像データをフォントデータと比較
することによって文字データに変換する文字データ変換
手段と、文字データの示す意味を解析する文字データ解
析手段を備えたことを特徴とするものである。
【0015】
【作用】図2に示すように、送信側ではパソコン5など
でOCR原稿1(図1)を作成し、これをFAXボード
6もしくはFAXアダプター7でラスターデータに変換
して相手側に送信する。
【0016】OCR原稿1には1ライン中に同一間隔で
同一文字、例えば「+」が複数個記入され、これが例え
ば3ライン記入される。このOCR原稿識別用文字列2
は白黒の変化が完全に規則的であるから、図3に示す受
信側ではOCR原稿識別部16でこの白黒データの規則
性を判別することによって受信データがOCR原稿であ
ることを容易に識別できる。
【0017】OCR原稿1のOCR原稿識別用文字列2
の次にはフォントデータ登録用文字列3が記入され、こ
れが受信側のフォントデータ登録部17に登録される。
そして、次に受信した画像データすなわち動作指示文字
列4がこのフォントデータと比較されて文字データに変
換され、これが文字解析部18で解析される。
【0018】そして、ここで解析された内容に従って指
示動作処理部19が各部の動作を制御し、これによって
例えば中継送信やマルチコピーなどが行われる。中継送
信される原稿やマルチコピーされる原稿は、送信側でO
CR原稿1の次から順次送信され、これが受信側で記憶
もしくは記録される。
【0019】
【実施例】続いて、本発明に係るOCR認識装置を通信
装置に適用した場合の一実施例について、図面を参照し
て詳細に説明する。
【0020】図1は本発明のOCR認識装置が使用する
OCR原稿1の一例を示す。このOCR原稿1には、ワ
ードプロセッサーやパーソナルコンピュータなどによっ
て、まずOCR原稿識別用文字列2が複数ライン、本例
では3ライン記入される。このOCR原稿識別用文字列
2は例えば「+」など同一の文字を同一間隔で複数回繰
り返すものである。
【0021】これによってOCR認識装置では、完全に
規則的な白、黒の変化を識別することにより、読み取っ
た原稿がOCR原稿であることが判断可能となる。
【0022】後述するようにこのOCR原稿1を用いて
通信を行なう場合には、キャラクタ情報がラスター情報
に直接変換されるため、白黒の変化位置の誤差が発生し
ないので、通常のCCDなどによって読み取る原稿との
区別が可能になる。また、このときの黒の位置と間隔
で、次に続くキャラクタの位置が明らかになる。
【0023】識別用文字列2の後に、このOCR原稿1
で使用される文字のフォントデータをOCR認識装置に
登録するため、フォントデータ登録用文字列3が記入さ
れる。このフォントデータ登録用文字列3は予め決めら
れた順番で、これ以降使用される全ての文字が複数ライ
ン記入される。
【0024】OCR認識装置はこのフォントデータ登録
用文字列3を記憶し、以降のOCR処理にこの文字デー
タを使用する。このデータと次に説明する動作指示文字
列4で使われる文字のフォントデータは完全に一致し、
これによってOCRが実現できる。
【0025】フォントデータ登録用文字列3の次に例え
ば動作指示文字列4が複数ライン記入される。動作指示
文字列4に記入する内容は、予めOCR認識装置を適用
した装置に登録されており、これによってその装置は読
み取った動作指示の内容に従って各種の動作、例えばフ
ァクシミリ装置であれば中継同報通信、親展送信、マル
チコピーなどが行われたり、短縮番号やワンタッチキー
の登録などが行われる。
【0026】なお、上述した全ての文字列を複数ライン
としているのは、OCR原稿1を通信装置で使用する場
合の回線ノイズによるエラー対策であり、各ラインの先
頭にはエラー検出マークとして例えば@が付けられる。
この@マークが認識された文字列を有効とすることによ
り、エラーが防止できる。
【0027】ECM(誤り訂正モード)などのエラーの
ない通信手段で通信する場合は、1ラインでも良い。
【0028】このようなOCR原稿1を用いれば、1ペ
ージ分のデータとして非常に多くのデータを記入するこ
とができる。
【0029】上述のOCR原稿1を通信装置で使用する
場合は、図2に示すような送信用の通信装置で作成され
て送信される。同図(a)は通常のパソコン5にFAX
ボード6を装備したものであり、同図(b)はパソコン
5にFAXアダプタ7を装備したものである。また、同
図(c)に示すようなOCR原稿発生機能付きファクシ
ミリ装置8を用いることもできる。
【0030】なお、FAXボード6およびFAXアダプ
タ7は周知のようにワープロ(図示せず)やパソコン5
などで作成されたキャラクタデータを白黒2値化し、こ
れを例えばMH(モディファイドハフマン)符号に変換
して通信回線に送出する装置である。
【0031】図3は上述のOCR原稿1を受信するOC
R認識装置を適用した通信装置の構成を示す。同図にお
いて、11は送受信制御を管理するCPU(中央処理装
置)、12は送受信用プログラム等の各種制御プログラ
ムが格納されたROM、13は受信したOCR原稿1の
情報や送信する画情報等が格納されるRAMである。
【0032】通信回線より入力した画像データは、NC
Uおよびモデム14を経て復号部15で復号される。次
にOCR原稿識別部16で上述したように最初に受信し
た画像データの白黒変化が規則的か否かによって、この
データがOCR原稿1かどうか識別される。
【0033】また、受信したフォントデータはフォント
データ登録部17に登録される。次に、受信した画像デ
ータは文字解析部18で解析され、この文字データが示
す動作内容に従って、指示動作処理部19が各部の動作
を制御する。これによって同報中継送信やワンタッチキ
ーの登録などが行われれる。OCR原稿1に添付された
通常原稿の記録は記録部20によって行われる。
【0034】図4は上述したOCR原稿受信処理30の
フローチャートである。同図において、まず通常の前手
順として呼の設定および回線確立のフェーズAおよび端
末、伝送路などの状態確認と端末制御のフェーズBが行
われ(ステップ31)、次にフェーズCに移り、まず受
信した画像データの復号が行われる(ステップ32)。
【0035】次に、最初に入力した画像データの1ライ
ン中で白黒の変化点の距離が規則的か否か判断され(ス
テップ33)、規則的である場合は続いてこれが複数ラ
イン連続しているかどうか判断される(ステップ3
4)。ここで、複数ライン連続している場合は、OCR
原稿1であることを示しているので、その文字間隔が記
憶される(ステップ35)。
【0036】次に、受信データがフォントデータ登録ラ
インかどうか判断される(ステップ36)。この判断は
OCR原稿識別用文字列2とは異なる文字列が複数ライ
ンあるかどうかによって行われる。フォントデータ登録
ラインの場合はこれが登録される(ステップ37)。
【0037】次に、受信データの文字解析が行われ(ス
テップ38)、この文字列が示す指示動作が実行される
(ステップ39)。このようにして1ページのデータを
受信した後、次ページが有るか否か判断され(ステップ
40)、次ページが有る場合はステップ32で受信デー
タが復号され、以下ステップ33以降の処理が行われ
る。次ページがない場合は、次にフェーズDすなわちメ
ッセージ終了と受信確認などが行われ(ステップ4
1)、続いて回線切断のフェーズEが行われて(ステッ
プ42)、受信処理30が終了する。
【0038】なお、ステップ33、ステップ34、ステ
ップ36が否定された場合、すなわちOCR原稿1では
ないと判断された場合、もしくはフォントデータ登録用
文字列3が記入されていないと判断された場合は、受信
データが記録され(ステップ43)、次にステップ40
以降の処理が行われる。
【0039】なお、上述した実施例ではワープロやパソ
コンで作成したOCR原稿をラスターデータに変換して
そのまま送信する場合を説明したが、一旦プリントアウ
トしたOCR原稿を通常のファクシミリ装置で読み取っ
てこれを送信してもよい。
【0040】
【発明の効果】以上のように本発明は、例えばワープロ
やパソコンなどでOCR原稿を作成し、このOCR原稿
の最初に白黒変化が規則的な文字列があるか否かによっ
て、OCR原稿の判別をするとともに、OCR原稿で用
いる文字をすべて記入し、これをOCR認識装置に登録
するようにしたものである。
【0041】したがって、本発明によれば字体制限をす
る必要がないので、OCR原稿を容易に作成でき、さら
にこのOCR原稿を用いて通信を行なう場合は回線ノイ
ズによるエラーの影響も防止できる。
【0042】また、OCR原稿に使用される文字が正確
な形状であるので誤りなく文字認識が可能であり、装置
の構成も簡略化できるなどの効果がある。
【図面の簡単な説明】
【図1】本発明に係るOCR認識装置で用いられるOC
R原稿の一例を説明する説明図である。
【図2】OCR原稿送信用の通信装置を説明する説明図
である。
【図3】本発明に係わるOCR認識装置を適用した通信
装置の構成図である。
【図4】受信処理手順を説明する説明図である。
【符号の説明】
1 OCR原稿 2 OCR原稿識別用文字列 3 フォントデータ登録用文字列 4 動作指示文字列 5 パソコン 6 FAXボード 7 FAXアダプタ 11 CPU 12 ROM 13 RAM 14 NCUおよびモデム 15 復号部 16 OCR原稿識別部 17 フォントデータ登録部 18 文字解析部 19 指示動作処理部 20 記録部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 最初に入力された画像データの白黒変化
    が規則的であるときOCR原稿であることを判別するO
    CR原稿判別手段と、 上記白黒変化が規則的な画像データの次に入力された画
    像データをフォントデータとして登録するフォントデー
    タ登録手段と、 上記フォントデータの次に入力された画像データを上記
    フォントデータと比較することによって文字データに変
    換する文字データ変換手段と、 上記文字データの示す意味を解析する文字データ解析手
    段を備えたことを特徴とするOCR認識装置。
JP3255397A 1991-10-02 1991-10-02 Ocr認識装置 Pending JPH0594562A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3255397A JPH0594562A (ja) 1991-10-02 1991-10-02 Ocr認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3255397A JPH0594562A (ja) 1991-10-02 1991-10-02 Ocr認識装置

Publications (1)

Publication Number Publication Date
JPH0594562A true JPH0594562A (ja) 1993-04-16

Family

ID=17278197

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3255397A Pending JPH0594562A (ja) 1991-10-02 1991-10-02 Ocr認識装置

Country Status (1)

Country Link
JP (1) JPH0594562A (ja)

Similar Documents

Publication Publication Date Title
US5974203A (en) Pattern recognition communication apparatus for transmitting and receiving image data
US5130818A (en) Communication terminal apparatus, and communication method
JP2765874B2 (ja) 通信処理装置
US5224180A (en) Facsimile apparatus and the method
JPH0594562A (ja) Ocr認識装置
US7006259B1 (en) Facsimile apparatus and method of controlling the apparatus
JP2830511B2 (ja) Omrシート認識方式
JP2935860B2 (ja) ファクシミリ装置
KR950006752B1 (ko) 팩시밀리의 화상 데이타 처리 방법
JP2878430B2 (ja) 通信端末装置
JP2717333B2 (ja) ファクシミリ装置
JP3070137B2 (ja) 画像データ転送装置
KR100193805B1 (ko) 팩시밀리와 컴퓨터 및 프린터를 이용한 복합기 및 그 제어방법
KR920001695B1 (ko) 퍼스널 컴퓨터와 팩시밀리간의 인터페이싱 방법
KR100229040B1 (ko) 팩시밀리를 이용한 문자 원고의 송,수신 방법
JPH0258474A (ja) ファクシミリ装置
KR19990074819A (ko) 팩시밀리의 원고 송신 방법
JP2001069299A (ja) ファクシミリ装置
JPS6156656B2 (ja)
JPH07212555A (ja) ファクシミリ装置
JPH07200721A (ja) 文字認識電子メール装置
JPH05160986A (ja) ファクシミリ装置
JPH07322044A (ja) 自動ダイヤル機能付きファクシミリ装置
JPH01160255A (ja) 自動送信ファクシミリ
JPH11275297A (ja) ファクシミリ電子メール伝送装置