JPH0896074A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0896074A
JPH0896074A JP6229521A JP22952194A JPH0896074A JP H0896074 A JPH0896074 A JP H0896074A JP 6229521 A JP6229521 A JP 6229521A JP 22952194 A JP22952194 A JP 22952194A JP H0896074 A JPH0896074 A JP H0896074A
Authority
JP
Japan
Prior art keywords
image data
storage means
ocr
character
character line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6229521A
Other languages
English (en)
Inventor
Kiyohiko Honda
清彦 本田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic System Solutions Japan Co Ltd
Original Assignee
Matsushita Graphic Communication Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Graphic Communication Systems Inc filed Critical Matsushita Graphic Communication Systems Inc
Priority to JP6229521A priority Critical patent/JPH0896074A/ja
Publication of JPH0896074A publication Critical patent/JPH0896074A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 記憶容量の少ない記憶手段を使用して確実に
OCR認識をすることができる文字認識装置を提供す
る。 【構成】 所定のフォーマットに従って複数の文字行を
有するOCR用紙を読取る読取手段1と、各文字行単位
に対応する画像データを格納する領域を有する第1の記
憶手段2と、OCR用紙における各文字行の間隔に対応
するデータを格納する第2の記憶手段3と、第2の記憶
手段3内のデータに基づいてOCR用紙における各文字
行単位毎に対応する画像データを第1の記憶手段2に格
納させる制御手段4と、第1の記憶手段2内の画像デー
タをOCR認識する認識手段7とを備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字認識装置、特に容量
の少ない記憶手段を使用してOCR認識を行う文字認識
装置に関するものである。
【0002】
【従来の技術】従来、文字認識装置の低価格機種に採用
されている代表的な方式は、OCR用紙の画像データを
一時格納する記憶手段として図7に示すようなOCR用
紙1枚分の画像データを格納することができる領域を有
する記憶手段を備え、OCR用紙の読取手段においてO
CR用紙を2値化の画像データに光電変換し、記憶手段
に格納して文字の認識処理を行い、認識処理が完了する
と記憶手段に格納したOCR用紙1枚分の画像データを
消去して、次のOCR用紙を入力する方式を採っている
のがほとんどである。
【0003】また、近年、この記憶手段の容量を削減し
て、認識用マークを備えたOCR用紙を副走査方向に分
割しながら読取り、この読取った画像データに対し、随
時、前記認識用マークを検出して、認識用マークが検出
された画像データに対し文字の認識を行う方式が考慮さ
れてきている。
【0004】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の低価格機種の文字認識装置において、前者の
OCR用紙1枚分の画像データを格納する領域を有する
記憶手段を備えるものは、記憶容量の大きな記憶手段が
必要となり、例えばOCRの認識に最適な200ドット
/インチの解像度でA4サイズのOCR用紙を読取ると
約512Kbyte(キロバイト)の記憶容量を有する
記憶手段が必要となり、低価格機種の文字認識装置に備
える記憶手段としてはコストがかさむ。
【0005】一方、後者の記憶手段の容量を削減して、
認識用マークを備えたOCR用紙を副走査方向に分割し
ながら読取り、この読取った画像データに対し、随時、
認識用マークを検出して、文字の認識を行う画像データ
を検出する方式では、副走査方向に分割して読取った画
像データ全てに対し、認識用マークを検出しなければな
らないので、処理が複雑になるという不具合があった。
【0006】本発明は前記課題に鑑みてなされたもの
で、第1に記憶容量の少ない記憶手段を使用してOCR
認識をすることができる文字認識装置を提供することを
目的とする。
【0007】また、第2にOCR用紙の読取手段で傾き
が発生しても、記憶容量の少ない記憶手段を使用してO
CR認識が正確、かつ、簡単に処理することができる文
字認識装置を提供することを目的とする。
【0008】
【課題を解決するための手段】本発明は、上記第1の目
的を達成するために、所定のフォーマットに従って複数
の文字行を有するOCR用紙を読取る読取手段と、前記
各文字行単位に対応する画像データを格納する領域を有
する第1の記憶手段と、前記OCR用紙における各文字
行の間隔に対応するデータを格納する第2の記憶手段
と、この第2の記憶手段内のデータに基づいて前記OC
R用紙における各文字行単位毎に対応する画像データを
前記第1の記憶手段に格納させる制御手段と、前記第1
の記憶手段内の画像データをOCR認識する認識手段と
を備えたものである。
【0009】また、本発明は上記第2の目的を達成する
ために、所定のフォーマットに従って複数の文字行を有
し、各文字行毎に傾き用マークを備えたOCR用紙を読
取る読取手段と、前記傾き用マークを検出する検出手段
と、前記各文字行単位に対応する画像データを格納する
領域を有する第1の記憶手段と、前記OCR用紙におけ
る各文字行の間隔に対応するデータを格納する第2の記
憶手段と、この第2の記憶手段内のデータに基づいて前
記OCR用紙における各文字行単位毎に対応する画像デ
ータを前記第1の記憶手段に格納させる一方、格納させ
る際に前記検出手段の検出結果に基づいてその傾きを補
正する制御手段と、補正後の画像データをOCR認識す
る認識手段とを備えたものである。
【0010】
【作用】本発明は、上記した第1の構成により、各文字
行単位に対応する画像データが格納できる領域を有する
第1の記憶手段に、制御手段が第2の記憶手段に格納さ
れているOCR用紙における各文字行の間隔に対応する
データに基づいて各文字行単位毎に対応する画像データ
を格納するので、従来のOCR用紙1枚分の画像データ
を格納する領域を有する記憶手段を備える必要性がな
い。このため、記憶容量の少ない記憶手段を用いてもO
CR認識を良好に実行することができる。
【0011】また、本発明は上記した第2の構成によ
り、傾き用マークを検出してこの検出結果に基づいてそ
の傾きを補正してデータを第1の記憶手段に格納させる
ため、OCR用紙が傾いた状態で読取られても、正確に
OCR認識を行えることができる。
【0012】
【実施例】以下、本発明の一実施例を図面を用いて説明
する。図1は本実施例における文字認識装置の構成を示
すブロック図である。図1において、1は所定のフォー
マットのOCR用紙を読取る読取手段、2は所定フォー
マットのOCR用紙における各文字行単位毎の画像デー
タを格納する領域を有する第1の記憶手段、3は所定フ
ォーマットのOCR用紙における各文字行の間隔に対応
するデータを格納する第2の記憶手段であり、データは
図3に示すような構成で格納される。
【0013】4は読取手段1において2値化データに光
電変換されて出力された画像データから、各文字行単位
毎の画像データを第1の記憶手段2へ格納する制御手段
である。なお、この格納時における画像の切出し処理に
ついては図2の動作フロー図で詳細に説明する。5は制
御手段4にて第1の記憶手段2へ格納された各文字行単
位毎の画像データから図4に示す傾き用マークを検出す
る検出手段である。6は制御手段4によって第1の記憶
手段2に格納された各文字行単位毎の画像データを、第
2の記憶手段3に格納されている各文字行単位毎のOC
R情報に基づいてOCR認識を行う認識手段、7は制御
手段4によって第1の記憶手段2に格納された各文字行
単位毎の画像データを、第2の記憶手段3に格納されて
いる各文字行単位毎のイメージ情報に基づいてイメージ
領域の切り出しを行うイメージ切出手段である。
【0014】8はイメージ切出手段7によって第1の記
憶手段2に格納されている各文字行単位毎の画像データ
より切り出されたイメージ領域のイメージデータを、第
2の記憶手段3に格納されている各文字行単位毎のイメ
ージ情報に基づいて圧縮をする圧縮手段である。
【0015】以上のように構成された本実施例の文字認
識装置において、読取手段1より出力される2値化デー
タに光電変換された所定フォーマットのOCR用紙の画
像データから、制御手段4によって図5が示すような各
文字行単位毎の画像データが第1の記憶手段2に格納さ
れる。なお、読取手段1において所定フォーマットのO
CR用紙を読取る際、傾きが発生したときは、制御手段
4において図6が示すような各文字行単位毎の画像デー
タが第1の記憶手段に格納される。
【0016】第1の記憶手段2に格納された各文字行単
位毎の画像データは、検出手段5において図4が示す傾
き用マークが検出される。前記制御手段4は、この検出
結果から読取手段1において所定フォーマットのOCR
用紙を読取る際、傾きが発生したときは、図6が示すよ
うな各文字行単位毎の画像データを第1の記憶手段2に
格納する。
【0017】前記制御手段4により第1の記憶手段2に
格納た各文字行単位毎の画像データは、認識手段6によ
り第2の記憶手段3に格納されている各文字行単位毎の
OCR情報に基づきOCR認識がされる。また、イメー
ジ切出手段7において第2の記憶手段3に格納されてい
る各文字行単位毎のイメージ情報に基づきイメージ領域
の切り出しがされ、圧縮手段8において第2の記憶手段
3に格納されている各文字行単位毎のイメージ情報に基
づき、前記イメージ切出手段7により切り出されたイメ
ージ領域のイメージデータが圧縮される。
【0018】図2は前記実施例に係る文字認識装置の動
作を説明するフロー図である。また、図3及び図4は前
記実施例に係る文字認識装置で第2の記憶手段3に格納
される所定フォーマットのOCR用紙の各文字行の間隔
に対応するデータを説明する図、図5及び図6は前記実
施例に係る文字認識装置で第1の記憶手段2に格納され
る各文字行単位毎の画像データを説明する図である。
【0019】以下図2のフロー図に基づいて本発明の文
字認識装置の動作を説明する。この文字認識装置が動作
を開始すると、処理ステップ(以下単にステップとい
う。)ST1において制御手段4は、第2の記憶手段3
に格納されている所定フォーマットのOCR用紙におけ
る先頭行情報の先頭読取開始位置を取得し、読取手段1
に読取開始点として設定する。ステップST2において
制御手段4は、第2の記憶手段に格納されている所定フ
ォーマットのOCR用紙における先頭行情報の先頭読取
長さを取得し、前記ステップST1において取得した先
頭読取開始位置と前記先頭読取長さから読取手段1に読
取終了点を設定する。ステップST3〜4において読取
手段1は、前記ステップST1、または、ステップST
14(後出の説明参照。)において制御手段4より設定
された読取開始点まで、所定フォーマットのOCR用紙
の原稿送りを行う。
【0020】ステップST5において読取手段1は、前
記ステップST3〜4において前記読取開始点まで所定
フォーマットのOCR用紙の原稿送りを行ったので、前
記ステップST2、または、ステップST15(後出の
説明参照。)において制御手段4より設定された読取終
了点まで、所定フォーマットのOCR用紙の読取りを行
う。ステップST6〜7において制御手段4は、前記ス
テップST5により読取手段1が出力する前記読取開始
点から前記読取終了点までの所定フォーマットのOCR
用紙の画像データを第1の記憶手段2へ各文字行単位毎
の画像データとして格納する。
【0021】ステップST8において読取手段1は、前
記ステップST6〜7において制御手段4が第1の記憶
手段2へ各文字行単位毎の画像データの格納を行ったの
で、前記所定フォーマットのOCR用紙の読取りを停止
する。ステップST9において検出手段5は、前記ステ
ップST6〜7において制御手段4が第1の記憶手段2
へ格納した各文字行単位毎の画像データに対し、図4に
示す各文字行毎に備えた左右傾き用マークの検出を行
う。
【0022】ステップ10において認識手段6は、前記
ステップST6〜7において制御手段4が第1の記憶手
段2に格納した各文字行単位毎の画像データに対し、第
2の記憶手段3格納されている各文字行毎のOCR情報
に基づいてOCR認識を行う。
【0023】ステップST11においてイメージ切出手
段7は、前記ステップST6〜7において制御手段4が
第1の記憶手段2に格納した各文字行単位毎の画像デー
タに対し、第2の記憶手段3に格納されている各文字行
毎のイメージ情報に基づいてイメージデータの切り出し
を行う。
【0024】ステップST12において圧縮手段8は、
前記ステップST11においてイメージ切出手段7が第
1の記憶手段2に格納されている各文字行単位毎の画像
データから切り出したイメージデータに対し、第2に記
憶手段3に格納されいてる各文字行毎のイメージ情報に
基づいてイメージデータの圧縮を行う。ステップST1
3において制御手段4は、第2の記憶手段3に格納され
ている所定フォーマットのOCR用紙の行数から、全て
の各文字行単位毎の画像データに対する前記ステップS
T9〜12における認識動作を行ったか判別する。ステ
ップST14において制御手段4は、前記ステップST
13において、全ての各文字行単位毎の画像データに対
する認識動作を行っていないと判別されたので、次に第
1の記憶手段2に格納する各文字行単位毎の画像データ
の前記所定フォーマットのOCR用紙に対する次行読取
開始点を、第2の記憶手段3に格納されている各文字行
単位毎の読取開始距離と、前記ステップST9において
検出手段5が検出した検出結果から算出し、読取手段1
へ前記次行読取開始点を設定する。
【0025】次行読取開始点の算出方法は、前記ステッ
プST9において検出手段5が検出した左右傾き用マー
クのうち、OCR用紙上端方向にあるどちらかの傾きマ
ークの検出位置に第2の記憶手段3に格納されている各
文字行単位毎の読取開始距離を加算した位置を次行読取
開始点とする。
【0026】次行読取開始点=上端傾きマーク検出位置
+読取開始距離 ステップST15において制御手段4は、次に第1の記
憶手段2に格納する各文字行単位毎の画像データの前記
所定フォーマットのOCR用紙に対する次行読取終了点
を、第2の記憶手段3に格納されている各文字行単位毎
の読取開始距離、読取長さと、前記ステップST9にお
いて検出手段5が検出した検出結果から算出し、読取手
段1へ前記次行読取終了点を設定して、前記ステップS
T3へ戻る。次行読取終了点の算出方法は、前記ステッ
プST9において検出手段5が検出した左右傾き用マー
クのうち、OCR用紙下端方向にあるどちらかの傾きマ
ークの検出位置に第2の記憶手段3に格納されている各
文字行単位毎の読取開始距離と読取長さを加算した位置
を次行読取終了点とする。
【0027】次行読取終了点=下端傾きマーク検出位置
+読取開始距離+読取長さ 前記ステップST14とステップST15において、次
に第1の記憶手段2に格納する各文字行単位毎の画像デ
ータに、イメージ領域が含まれる場合、イメーージ領域
の副走査方向のサイズによっては、前記第1の記憶手段
2が有する領域に1回で格納できないときがある。この
場合、前記ステップST14とステップST15におい
て、前記次行読取開始点と次行読取終了点を図5で示す
ように複数回に分割して、前記第1の記憶手段2に格納
する画像データとする。
【0028】ステップST16〜17において読取手段
1は、前記ステップST13において制御手段4が全て
の各文字行単位毎の画像データに対する認識動作を行っ
たと判別されたので、前記読取手段1が読取っている所
定フォーマットのOCR用紙の原稿排出を行う。ステッ
プST18において制御手段4は、前記ステップST1
6〜17において読取手段1が読取っている所定フォー
マットのOCR用紙の原稿排出を行った後、次のOCR
用紙が有るか判別し、次のOCR用紙が有りならば、前
記ステップST1へ戻って、前記次のOCR用紙に対す
る認識動作を行う。また、次のOCR用紙が無ければ認
識動作を終了する。
【0029】このような一連の処理によって所定フォー
マットのOCR用紙の認識動作を行うと、各文字行単位
毎の画像データを格納する領域を有する第1の記憶手段
2に格納される各文字行単位毎の画像データは、図5が
示すような各文字行の画像データが格納され、第1の記
憶手段2として設ける記憶容量は各文字行単位毎の画像
データが格納できる領域まで削減することができる。ま
た、所定フォーマットのOCR用紙を読取る読取手段1
において傾きが発生しても、各文字行単位の画像データ
を格納する領域を有する第1の記憶手段2には、図6が
示すような各文字行の画像データが格納されるため、簡
単な処理で認識手段6はOCR認識を行うことができ
る。
【0030】
【発明の効果】以上説明したように本発明によれば、第
1に各文字行単位に対応する画像データが格納できる領
域を有する第1の記憶手段に、制御手段が第2の記憶手
段に格納されているOCR用紙における各文字行の間隔
に対応するデータに基づいて各文字行単位毎に対応する
画像データを格納するので、従来のようにOCR用紙1
枚分の画像データを格納する領域を有する記憶手段を備
える必要性がなく、また、認識用マークを備えOCR用
紙を副走査方向に分割しながら読取り、随時、この画像
データに対し認識用マークを検出しOCR認識をする文
字行を検出する必要性もなく、各文字行単位に対応する
画像データが格納できる領域を有する記憶手段でOCR
認識をすることができるという効果が得られる。
【0031】また、第2に各文字行単位に対応する画像
データが格納できる領域を有する第1の記憶手段に、制
御手段が第2の記憶手段に格納されているデータと検出
手段における検出結果に基づいて各文字行単位毎に対応
する画像データを格納するため、従来のように読取った
画像データ全てに対しマークを検出する必要性がなく、
OCR用紙を読取る読取手段においてOCR用紙を読取
るときに傾きが発生しても、簡単な処理で正確にOCR
認識をすることができるという効果が得られる。
【図面の簡単な説明】
【図1】本発明における文字認識装置の構成を示すブロ
ック図
【図2】本発明における認識動作を説明するフローチャ
ート
【図3】本発明における第2の記憶手段内のデータを説
明する図
【図4】所定フォーマットのOCR用紙の各文字行の間
隔に対応するデータを説明する図
【図5】本発明における第1の記憶手段に格納される各
文字行単位毎の画像データを説明する図
【図6】同OCR用紙が傾いた場合の第1の記憶手段に
格納される各文字行単位毎の画像データを説明する図
【図7】従来の文字認識装置に採用されていたOCR用
紙1枚分の画像データを格納する領域を有する記憶手段
の容量を示す図
【符号の説明】
1 読取り手段 2 第1の記憶手段 3 第2の記憶手段 4 制御手段 5 検出手段 6 認識手段 7 イメージ切出手段 8 圧縮手段

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 所定のフォーマットに従って複数の文字
    行を有するOCR用紙を読取る読取手段と、前記各文字
    行単位に対応する画像データを格納する領域を有する第
    1の記憶手段と、前記OCR用紙における各文字行の間
    隔に対応するデータを格納する第2の記憶手段と、この
    第2の記憶手段内のデータに基づいて前記OCR用紙に
    おける各文字行単位毎に対応する画像データを前記第1
    の記憶手段に格納させる制御手段と、前記第1の記憶手
    段内の画像データをOCR認識する認識手段とを具備し
    た文字認識装置。
  2. 【請求項2】 所定のフォーマットに従って複数の文字
    行を有し、各文字行毎に傾き用マークを備えたOCR用
    紙を読取る読取手段と、前記傾き用マークを検出する検
    出手段と、前記各文字行単位に対応する画像データを格
    納する領域を有する第1の記憶手段と、前記OCR用紙
    における各文字行の間隔に対応するデータを格納する第
    2の記憶手段と、この第2の記憶手段内のデータに基づ
    いて前記OCR用紙における各文字行単位毎に対応する
    画像データを前記第1の記憶手段に格納させる一方、格
    納させる際に前記検出手段の検出結果に基づいてその傾
    きを補正する制御手段と、補正後の画像データをOCR
    認識する認識手段とを具備した文字認識装置。
JP6229521A 1994-09-26 1994-09-26 文字認識装置 Pending JPH0896074A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6229521A JPH0896074A (ja) 1994-09-26 1994-09-26 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6229521A JPH0896074A (ja) 1994-09-26 1994-09-26 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0896074A true JPH0896074A (ja) 1996-04-12

Family

ID=16893477

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6229521A Pending JPH0896074A (ja) 1994-09-26 1994-09-26 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0896074A (ja)

Similar Documents

Publication Publication Date Title
JPH08123900A (ja) ライン走査画像のための位置決定方法及びその装置
JPH08202815A (ja) 書類の上下方向検知方法及び装置
EP0452131A2 (en) Output method and apparatus
EP0602180B1 (en) Locating characters for character recognition
JPH0896074A (ja) 文字認識装置
JP2001052110A (ja) 文書処理方法、文書処理プログラムを記録した記録媒体及び文書処理装置
JP2021169192A (ja) 画像形成装置、画像形成システム、制御方法およびプログラム
JPH07121734A (ja) 文字画像編集装置
JPS58186261A (ja) フアクシミリ装置
JPH07210628A (ja) 免許証読み取り装置
JPH0563868A (ja) 画像形成装置のジヨブコントローラ
JP3279772B2 (ja) Ocr認識装置およびファクシミリ装置
JP2812392B2 (ja) 文字処理装置及び方法
JP2570571B2 (ja) 光学文字読取装置
JPS6027436B2 (ja) 文字認識修正方式
JPH11250179A (ja) 文字認識装置および文字認識方法
JPH0473192B2 (ja)
JPH04255088A (ja) 光学式文字読取装置
JPH0782524B2 (ja) 光学的文字読取装置
JP2003099710A (ja) 光学式読み取り装置の印字制御方法
JPH06274683A (ja) 光学文字読取装置
JP2001209755A (ja) 書損じ修正装置、書損じ修正方法および書損じ修正プログラムを格納したコンピュータ読取り可能な記録媒体
JP2539026B2 (ja) 文字切り出し装置
JPS59206987A (ja) 文字認識装置
JPH0954666A (ja) 印字位置決定機能付プリンタ