JPH05210761A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH05210761A
JPH05210761A JP4040259A JP4025992A JPH05210761A JP H05210761 A JPH05210761 A JP H05210761A JP 4040259 A JP4040259 A JP 4040259A JP 4025992 A JP4025992 A JP 4025992A JP H05210761 A JPH05210761 A JP H05210761A
Authority
JP
Japan
Prior art keywords
character
character recognition
pattern
cpu
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4040259A
Other languages
English (en)
Inventor
Yoshiaki Asougawa
佳誠 麻生川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP4040259A priority Critical patent/JPH05210761A/ja
Publication of JPH05210761A publication Critical patent/JPH05210761A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 切り出された文字に不要なノイズが含まれて
いても正しく文字認識処理を行なうことのできる文字認
識装置を提供すること。 【構成】 CPU1がスキャナで読み取られたパターン
の切り出し処理と、文字認識処理とを実行し、文字認識
処理の実行結果が良好でない場合には切り出されたパタ
ーンの内、規格外のパターン部分を除去した後、再度文
字認識処理を実行することで、前後の文字の一部が食い
込んでいたり、文字の周囲に汚れが存在する場合でも正
しい文字認識処理を行なうことができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はスキャナで読み取られた
文字を解析して文字データとして出力する文字認識装置
に関する。
【0002】
【従来の技術】従来の文字認識装置は、スキャナで読み
取られた文字パターンを文字間、行間等の境界を判別し
て単一の文字を切り出す切り出し手段と、切り出し手段
により切り出された各文字を基準パターンと照会して比
較する文字認識手段とを有し、文字データを生成する様
にしていた。
【0003】ところで文字間あるいは行間が接触し、あ
るいは食い込んでいる場合には単一の文字を切り出すこ
とが困難であるため、従来の文字認識装置はスキャナで
読み取られたパターンを行方向あるいは列方向に濃度投
影し、濃度投影データの微分変化点や、濃度投影データ
の最小値を与える点で強制的に文字を切り出す様にして
いた。
【0004】
【発明が解決しようとする課題】しかしながらかかる文
字の切り出し方法では、前後の文字の一部が切り出し画
像に含まれてしまい、正しい文字認識ができない欠点を
有している。
【0005】また、文字の周囲に汚れ等によるノイズが
存在する場合、このノイズによって正しい文字認識がで
きない欠点を有している。
【0006】本発明は、かかる従来の文字認識装置の有
する課題を克服するためになされたものであり、切り出
された文字に不要なノイズが含まれていても正しく文字
認識処理を行なうことのできる文字認識装置を提供する
ことを目的とする。
【0007】
【課題を解決するための手段】本発明の請求項1に記載
の文字認識装置は、原稿に印字された文字を切り出し
て、切り出された文字ごとにこれを認識する装置であっ
て、切り出された文字を所定のパターンと比較して文字
認識処理を行ない、規格外のパターンが含まれる場合こ
れを除去した後再度前記文字認識処理を行なう制御手段
としてのCPU1を備えたことを特徴とする。
【0008】本発明の請求項2に記載の文字認識装置
は、制御手段としてのCPU1は、文字認識処理の実行
回数の最高値を制限することを特徴とする。
【0009】
【作用】請求項1に記載の文字認識装置においては、C
PU1がスキャナで読み取られたパターンの切り出し処
理と、文字認識処理とを実行し、文字認識処理の実行結
果が良好でない場合には切り出されたパターンの内、規
格外のパターン部分を除去した後、再度文字認識処理を
実行することで、前後の文字の一部が食い込んでいた
り、文字の周囲に汚れが存在する場合でも正しい文字認
識処理を行なうことができる。
【0010】請求項2に記載の文字認識装置において
は、CPU1による文字認識処理の1文字当たりの実行
回数を制限することにより、元来文字認識を行なうのに
不適切なパターンに対しての文字認識処理に要する不必
要な時間を短縮することができる。
【0011】
【実施例】以下、本発明の一実施例を図面を参照して説
明する。
【0012】図において制御手段としてのCPU1は、
図示しないスキャナ等のパターン読み取り手段により読
み取られたパターンの文字ごとの切り出し、切り出され
たパターンを基準パターンと比較照会する文字認識処
理、文字認識処理された文字データが適切なものである
か判断し、不適当な規格外のパターン部分が含まれるこ
とによって文字認識された文字データが不適切であると
判断された場合に規格外パターンを除去する除去処理を
行なう。
【0013】通信制御装置2はスキャナから伝送された
パターンを受信してCPU1にバスライン8を介して伝
送する。
【0014】切り出し制御プログラムROMはCPU1
がスキャナで読み取られたパターンを、例えば文字列方
向に投影し、濃度投影データの微分変化点や最小値を与
える点、不連続点等の文字切り出し条件により文字切り
出し処理を行なうのに必要なプログラムを格納したRO
Mである。
【0015】画像保存用RAM4は、一度切り出した文
字を一時格納しておくメモリであり、認識プログラムR
OM5は、画像保存用RAM4に記憶された文字と、辞
書記憶ROMに予め記憶された基準パターンとを比較し
てCPU1が行なう文字認識処理に必要なプログラムを
格納したROMである。
【0016】演算用RAM6は、文字認識処理された文
字の例えば文字列方向の投影像において、その不連続
点、微分変化点等をCPU1が算出するために必要なプ
ログラムが格納されたRAMである。
【0017】これら通信制御装置2、切り出し制御プロ
グラムROM3、画像保存用RAM4、認識プログラム
ROM5、演算用RAM6、辞書記憶ROM7はそれぞ
れバスライン8を介してCPU1と接続されている。
【0018】次にCPU1が実行する文字認識処理の一
実施例を図2に示すフローチャートに基づいて説明す
る。
【0019】まずCPU1はステップS1において、通
信制御装置2を介して供給されるパターンを受けてこれ
を画像保存用RAM4に格納するとともに、演算用RA
M6に格納されたプログラムに基づいて文字切り出し処
理を行なう。
【0020】切り出された文字に対してCPU1はステ
ップS2において認識プログラムROM5に格納された
プログラムに基づいて文字認識処理を行なう。
【0021】ステップS2で認識された文字が、辞書記
憶ROM7に格納された基準パターンと十分に対比出来
て、意味のある文字として判別されるか否かがCPU1
によりステップS3で判別され、意味のある文字として
判別可能な場合にはステップS9に進んでその文字を確
定し、ステップS10に進んで認識された文字を出力す
る。
【0022】一方ステップS3による判断において、切
り出された文字に前後の文字の一部が含まれたり、周囲
にノイズが含まれている場合にはステップS4に進み、
CPU1はノイズ判定を行なう。このノイズ判定は、切
り出された文字の投影像における微小点、及びこの微小
点と他の投影像部分との距離、切り出し部分の領域中の
座標等からノイズ部分を算定することにより行なわれ、
ノイズとして判定された部分が除去され、画像保存用R
AM4に書き込まれる。
【0023】ノイズ部分を除去する作業を行なうごとに
CPU1は図示しないカウンタをインクリメントし、そ
の結果をステップS5にて基準値と比較する。これは過
去に基準回数以上ノイズ除去を行なったことのある文字
の場合は、それ以上ノイズ除去を行なっても文字認識を
行なうことは不可能であると判断して以後の同一文字に
対する文字認識作業を禁止するためである。この基準値
は2以上の値が用いられ、例えば「2」を基準値として
用いれば、過去に一度でもノイズ除去を行なった文字の
場合、ステップS5からステップS8に進み、文字認識
作業を停止する。
【0024】一方ステップS5の結果で、まだノイズ除
去の回数が基準値に至らない場合にはステップS6に進
み、CPU1はステップS6において再度文字認識処理
を行なう。そしてその結果がステップS7にて判定さ
れ、もしも意味のある文字として認識可能な場合にはス
テップS9に進み、反対にステップS7にてまだ認識可
能な文字として判定されなかった場合にはステップS4
からの作業を繰り返す。
【0025】かかる図2のフローチャートにより実行さ
れる文字認識処理の具体例を図3を参照しながら説明す
る。
【0026】図3はkpの各文字が図3(a)に示すよ
うに近接して印字されている場合の文字認識処理を説明
するものであり、図3(a)の切り出し処理を行なった
文字を同図(b)に示す。
【0027】図3(b)においてはkの文字の下方にp
の文字の一部がノイズとして切り出されており、このま
までは文字認識は行なえない。そこで図3(b)の文字
を図の左右方向に投影すると同図(c)のような線画部
分(イ)と微小点部分(ロ)とに分離される。
【0028】この微小点部分(ロ)は、線画部分(イ)
に比較して微小であるとともに、線画部分(イ)からの
距離が離れている。従ってCPU1はこの微小点部分
(ロ)をノイズとして認識することができ、これを除去
する。
【0029】ノイズを除去して得られる文字が図3
(d)に示されており、かかる文字は文字kとして十分
認識可能となっていることが理解される。
【0030】
【発明の効果】以上のように本発明の請求項1に記載の
文字認識装置によれば、制御手段としてのCPU1が切
り出された文字に含まれるノイズ部分を判定し、これを
除去した後再度文字認識処理を行なう用にしたので、文
字どうしが重なりあっていたり、文字の周囲にノイズが
あるような場合でも、正しい文字認識処理を行なうこと
が可能となる。
【0031】また本発明の請求項2に記載の文字認識装
置によれば、CPU1がノイズ除去処理の回数の上限を
定める様にしたので、元来文字認識に不適切なパターン
に対する不必要な文字認識処理を行なわないようにする
ことができ、文字認識処理に要する時間を短縮すること
ができる。
【図面の簡単な説明】
【図1】本発明の文字認識装置の一実施例の構成を示す
ブロック図である。
【図2】図1のCPU1が行なう文字認識処理のフロー
チャートである。
【図3】本発明の文字認識装置による文字認識処理の具
体的説明を行なうためのパターンの一実施例である。
【符号の説明】
1 CPU(制御手段) 2 通信制御装置 3 切り出し制御プログラムROM 4 画像保存用RAM 5 認識プログラムROM 6 演算用RAM 7 辞書記憶ROM 8 バスライン

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 原稿に印字された文字を切り出して、切
    り出された文字ごとにこれを認識する装置であって、切
    り出された文字を所定のパターンと比較して文字認識処
    理を行ない、規格外のパターンが含まれる場合これを除
    去した後再度前記文字認識処理を行なう制御手段を備え
    たことを特徴とする文字認識装置。
  2. 【請求項2】 前記制御手段は、前記文字認識処理の実
    行回数の最高値を制限することを特徴とする請求項1記
    載の文字認識装置。
JP4040259A 1992-01-30 1992-01-30 文字認識装置 Withdrawn JPH05210761A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4040259A JPH05210761A (ja) 1992-01-30 1992-01-30 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4040259A JPH05210761A (ja) 1992-01-30 1992-01-30 文字認識装置

Publications (1)

Publication Number Publication Date
JPH05210761A true JPH05210761A (ja) 1993-08-20

Family

ID=12575681

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4040259A Withdrawn JPH05210761A (ja) 1992-01-30 1992-01-30 文字認識装置

Country Status (1)

Country Link
JP (1) JPH05210761A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010020394A (ja) * 2008-07-08 2010-01-28 Canon Inc 画像処理装置および方法
KR100977713B1 (ko) * 2003-03-15 2010-08-24 삼성전자주식회사 영상신호의 글자 인식을 위한 전처리 장치 및 방법
US8306327B2 (en) 2008-12-30 2012-11-06 International Business Machines Corporation Adaptive partial character recognition

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100977713B1 (ko) * 2003-03-15 2010-08-24 삼성전자주식회사 영상신호의 글자 인식을 위한 전처리 장치 및 방법
JP2010020394A (ja) * 2008-07-08 2010-01-28 Canon Inc 画像処理装置および方法
US8452095B2 (en) 2008-07-08 2013-05-28 Canon Kabushiki Kaisha Image processing for post-processing rate of character rectangle extraction and character recognition accuracy
US8306327B2 (en) 2008-12-30 2012-11-06 International Business Machines Corporation Adaptive partial character recognition
US8594431B2 (en) 2008-12-30 2013-11-26 International Business Machines Corporation Adaptive partial character recognition

Similar Documents

Publication Publication Date Title
JPH0789363B2 (ja) 文字認識装置
JPH05210761A (ja) 文字認識装置
JP2786044B2 (ja) 光学的文字読み取り装置
JPH09237319A (ja) 文字認識装置
JP3548234B2 (ja) 文字認識方法及び装置
JPH05274476A (ja) 文字切り出し方法
JPH08161426A (ja) 手書き文字ストローク切出し装置
JP3349243B2 (ja) 文字列読み取り装置
JPH0785221A (ja) 図面自動認識装置の文字とシンボルの分離・認識方法
JP2812392B2 (ja) 文字処理装置及び方法
JPH06231307A (ja) 光学式文字認識方式
JPS61251982A (ja) 光学的文字読取装置
JPH06215187A (ja) 光学文字読取装置
JPH04311283A (ja) 行方向判定装置
JPH09114925A (ja) 光学式文字読取装置
JPH10171924A (ja) 文字認識装置
JPH05159098A (ja) 文字間の空白認識方法
JP2925270B2 (ja) 文字読取装置
JP3635552B2 (ja) 文字パターン切り出し装置および文字パターン切り出しプログラムを記録した記録媒体
JP3566738B2 (ja) 網掛け領域処理方法および網掛け領域処理装置
JPH05128305A (ja) 領域分割方法
JPH05108880A (ja) 英文字認識装置
JPH05189599A (ja) 光学文字読取装置
JPH0281282A (ja) 文字認識方法
JPH0554193A (ja) 文字認識装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990408