JP2578768B2 - 画像処理方法 - Google Patents

画像処理方法

Info

Publication number
JP2578768B2
JP2578768B2 JP61123727A JP12372786A JP2578768B2 JP 2578768 B2 JP2578768 B2 JP 2578768B2 JP 61123727 A JP61123727 A JP 61123727A JP 12372786 A JP12372786 A JP 12372786A JP 2578768 B2 JP2578768 B2 JP 2578768B2
Authority
JP
Japan
Prior art keywords
character
stroke
strokes
line
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP61123727A
Other languages
English (en)
Other versions
JPS62281097A (ja
Inventor
明彦 植草
敏明 矢ケ崎
新子 石谷
由美恵 郷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP61123727A priority Critical patent/JP2578768B2/ja
Publication of JPS62281097A publication Critical patent/JPS62281097A/ja
Application granted granted Critical
Publication of JP2578768B2 publication Critical patent/JP2578768B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、文字の画像情報を入力して、その入力した
画像情報の文字を認識するための画像処理方法に関する
ものである。
[従来の技術] 従来、この種の文字認識装置は非常に複雑な認識処理
を行つており、その分認識処理に時間を要し、装置が高
価であつた。
第9図は従来の文字認識処理の一例を示すフローチヤ
ートである。図において、用紙P上の文字は光電変換さ
れて読み取られ(ステツプS81)、論理“1"及び“0"の
2値化文化パターンに変換される(ステツプS82)。そ
して前記文字パターンにはその後の認識処理を容易かつ
確実なものとするための前処理が行われる(ステツプS8
3)。前処理は、例えば用紙P上の黒点等に起因するノ
イズの除去処理や文字線の境界に生じているピーク又は
ボイド等の平滑化処理を含む一連の処理である。次に、
いくつかの特徴情報(交点、分岐点、ループ数、ストロ
ーク長等の情報)を抽出する特徴抽出処理が行われる
(ステツプS84)。認識対象が多様になると特徴抽出情
報も相当の数になる。そして、この特徴抽出結果の情報
に応じて単一文字候補が選び出されるときは、その文字
候補が認識出力になる(ステツプS85→ステツプS88)。
即ち、辞書誘導を要しない場合である。しかし、多くの
場合は特徴情報を共通する複数の文字候補が選び出さ
れ、更に唯一の文字を選び出すための詳細な識別処理が
なされる(ステツプS85→ステツプS86)。この詳細な識
別処理は一般に辞書照合処理といわれ、認識対象が多様
になるとかなり複雑化し、その照合に時間を要する。そ
して、この照合処理によつて照合一致が得られたときは
特定の文字候補が選び出される。また、この照合処理に
よつても不一致の場合は最終的に認識不能の結果が出力
される(ステツプS87→ステツプS88)。
このように、従来の文字認識装置は多様な文字を認識
対象とするためにアルフアベツト、数字等の簡易な文字
(認識し易い文字)を認識する場合でも上述のような複
雑な認識処理を行うことになる。従つて、処理に時間が
かかり過ぎ、業務によつてはコストパフオーマンスを著
しく低下させていた。
[発明が解決しようとする問題点] 本発明は上記従来例に鑑みてなされたもので、入力さ
れた画像情報より高速に文字を認識するための画像処理
方法を提供することを目的とする。
[問題点を解決するための手段] 上記目的を達成するために本発明の画像処理方法は以
下のような工程を備える。即ち、 文字の画像情報を入力し、 前記入力した画像情報を所定の領域に分割し、 前記分割された各領域毎に、各ライン上に現れる黒画
素の個数を計数して、該各領域内における各1ライン毎
の黒画素の個数の最大値を求め、 前記分割された領域ごとに、各ライン上に現れるスト
ロークの個数を計数して該各領域内における各1ライン
毎のストロークの個数の最小値を求め、 前記黒画素の個数の最大値及び前記ストロークの個数
の最小値を、予め記憶してある標準特徴情報と比較する
ことにより、前記入力した画像情報の文字を認識するこ
とを特徴とする。
[作用] かかる構成において、文字の画像情報を入力し、その
入力した画像情報を所定の領域に分割し、その分割され
た各領域毎に、各ライン上に現れる黒画素の個数を計数
して、該各領域内における各1ライン毎の黒画素の個数
の最大値を求め、その分割された領域ごとに、各ライン
上に現れるストロークの個数を計数して該各領域内にお
ける各1ライン毎のストロークの個数の最小値を求め、
その黒画素の個数の最大値及びストロークの個数の最小
値を、予め記憶してある標準特徴情報と比較することに
より、入力した画像情報の文字を認識するように動作す
る。
[実施例] 以下、添付図面を参照して本発明の実施例を詳細に説
明する。第1図は実施例のマーク・文字認識装置(OM
R)のブロツク構成図である。尚、実施例のマーク・文
字認識装置は手書マーク及び本実施例に係る手書文字の
認識の他、一般の画像処理も行なえる汎用機能の認識装
置であるが、本発明は手書マーク及び特定のグループの
文字のみを認識する簡易な認識装置として実現できる。
第1図において、1は手書マーク、手書文字等の他原
稿画像を読み取つて電気信号に変換するリーダ、7はリ
ーダ1と連動してマークシート、画像原稿等をリーダ1
の読取部にフイードするオートフイーダ、2はリーダ1
で読み取つた画像情報及びマーク、文字の認識結果の情
報を記憶する光デイスク、3はマーク・文字認識装置の
全体を制御するホストコンピユータ、4は各種の制御指
令、認識不能文字等の入力を行うキーボード、5は画像
情報、マーク及び文字の認識結果の情報、その他のオペ
レーシヨン情報等を表示するCRT表示装置(CRT)、6は
マーク及び文字の認識結果の情報その他画像情報等を印
刷出力するプリンタである。
ホストコンピユータ3において、50は各種プログラム
を実行するセントラルプロセツシングユニツト(例えば
モトローラ社製のマイクロコンピユータMC68000)、51
はCPU50が実行する実施例の第3図の文字認識処理プロ
グラムの他文字認識のための標準特徴情報51aを記憶し
ているROMである。52はCRTインタフエース、53はキーボ
ードインタフエース、54は光デイスクインタフエース、
55はリーダインタフエース、56はプリンタインタフエー
ス、57はプログラム実行の処理経過情報や、読み取つた
文字パターン情報の他文字認識に必要な特徴抽出情報を
記憶するRAM、60はCPU50の共通バスである。
RAM57において、571は読み取つた文字パターンデータ
を格納する文字バツフア、572は文字バツフアの文字パ
ターン上を水平及び垂直方向にその黒画素数を計数する
ことにより抽出した前記文字パターンのストローク長情
報を記憶するエリア、573は前記文字パターン上を水平
及び垂直方向に走査して計数した前記各方向を横切る前
記文字パターンのストローク数情報を記憶するエリア、
574は認識結果のマークコード、文字コード等を記憶す
るエリアである。
第2図は第1図の構成を備えるマーク・文字認識装置
の外観図である。図中、第1図と同一の構成には同一番
号を付した。8はリーダ1とホストコンピユータ3を結
ぶインタフエースケーブル、9はプリンタ6とホストコ
ンピユータ3を結ぶインタフエースケーブルである。
次に本実施例装置による文字の認識原理を説明する。
第8図は実施例装置の認識対象であるアルフアベツト文
字及び数字の文字形態を示す図である。図において、実
施例の文字は16セグメントからなる要素の組合せで構成
される。これらの要素の組合せで構成される代表的な文
字ストロークは、例えば水平(x)方向の上、中又は下
段に記入される全長又は半長の文字ストローク、同様に
して垂直(y)方向の左、中又は右に記入される全長又
は半長の文字ストローク、及び斜方向の全長又は半長の
文字ストロークである。例えば第7図の1行1列目には
アルフアベツト文字「A」を示している。該文字のx方
向のストローク長は上から順に「長」「長」「短」であ
る。尚、「短」のストローク長は実際にはないが、後述
する如く例えば縦長の文字ストロークを横方向に見たと
きに「短」と認識することになる。またy方向のストロ
ーク長は左から順に「長」「短」「長」である。1行2
列目にはアルフアベツト文字「B」を示している。同様
にしてx方向のストローク長は上から順に「長」「半」
「長」であり、y方向のストローク長は左から順に
「短」「長」「長」である。
この場合に、各走査方向を横切る方向に長さをもつ文
字ストロークはそのストローク幅が各画素数に投影され
る。また斜めの文字ストロークがある場合はそのストロ
ーク幅が両方向の画素数に投影される。更に紙面のゴ
ミ、文字境界付近のピーク又はボイドは本来あるべき画
素数に対して僅かな凹凸を与えることになる。本実施例
装置はこのようにして投影されるストローク幅、紙面の
ゴミ、ピーク又はボイドによる影響も含めてx方向及び
y方向の画素数を得、例えば各方向に文字パターンを5
分割してストローク長の特徴抽出する。具体的にいう
と、第5図(a)の文字「A」について水平にエリア分
割を設定すると第5図(b)のエリア1〜5になる。ま
た垂直にエリア分割を設定すると第5図(c)のエリア
6〜10になる。このうち、エリア1,3,5,6,8,10で計数し
た画素数はx方向、y方向の文字ストロークの長さをよ
く表わす。またエリア2,4,7,9で計数した画素数には斜
めストロークの存在による影響がよく表われる。こうし
て得た10個のストローク長情報は各文字毎にユニークと
なり文字認識のための特徴抽出情報になる。
しかし、いくつかの文字は上述したストローク長の特
徴摘出のみでは判別が困難である。例えば第8図の3行
4列目の文字「P」と3行6列目の文字「R」との違い
は、前記の画素数でみると第5図(b),(c)の夫々
エリア4,9に投影された斜めストロークのx,y方向への寄
与分だけである。従って、この部分にノイズある場合も
考えると(例えば、不正確な手書文字の場合やゴミが存
在する場合)、これだけの違いで判別することは誤認識
を頻発する原因となる。
そこで、このような斜めストロークの存在を明確にす
るために、文字パターン上を水平及び垂直方向に前記各
方向を横切る前記文字パターンのストローク数を計数す
ることにより前記文字パターンのストローク数情報を抽
出する。かかるストローク数情報も併用することによ
り、前記した文字「P」と「R」、及び3行3列目の文
字「O」と3行5列目の文字「Q」等との違い明瞭にな
る。第3図は実施例の文字認識処理手順のフローチヤー
トである。この処理にはシート上の文字が読み取られ、
2値化処理され、文字バツフア571に格納された後に入
力する。前記2値化処理では先ず用紙P上の文字を例え
ば1文字毎に光電変換する。ここでは、第8図に示すよ
うに反射率の高いドロツプアウトカラーで16セグメント
のプレプリントを行い、文字をセグメント上に書き込む
ようにしておくとその後の認識処理は簡単である。次に
光電変換した文字をさらに“1",“0"の2値パターンに
変換する。こうして文字バツフア571に格納された文字
パターンは第4図のように48×48ビツトのパターンサイ
ズを持つている。
ステツプS1では先ずx方向の黒画素の個数をカウント
してRAM57にストアする。例えば第4図の第1行目は長
ストロークを構成するものでありその個数は48である。
第2行目も長ストロークを構成するものでありその個数
は48でる。第3行目はy方向の長ストロークを2回横切
るものでありその個数は4である。こうして第48行目ま
での各個数をカウントしてRAM57にストアする。次に同
様にしてy方向の黒画素の個数をカウントしてRAM57に
ストアする。第4図の第1列目及び第2列目は長ストロ
ークを構成するものでありその個数は夫々48である。第
3列目はx方向の長ストロークを2回横切るものであり
その個数は4である。ステツプS2ではRAM57にストアし
たデータを第5図(b),(c)のような所定エリア毎
に分割してそれぞれ個数の最大値を抽出する。従つて、
第5図(a)のような文字「A」を読み取つた場合はエ
リア1の最大値は48、エリア2の最大値は中央にあるノ
イズをカウントしたとして5、エリア3の最大値は48、
エリア4の最大値は4、エリア5の最大値は4である。
エリア6〜10についても同様にして最大値が抽出され
る。ステツプS3では各エリアの最大値を、第5図(b)
のようにx軸方向に設けた画素数のスライスレベルx1,x
2、及び第5図(c)のようにy軸方向に設けた画素数
のスライスレベルy1,y2を基準にして3値化する。例え
ば第5図(b)においてエリア1の黒画素数の最大値48
はx1及びx2以上であるから“3"に量子化される。同様に
してエリア2は“1"、エリア3は“3"、エリア4は
“1"、エリア5は“1"となる。エリア6〜10についても
同様にして3値化される。ステツプS4ではこれらの3値
化値がエリア572にストアされ、特徴抽出情報の一部を
構成する。
ステツプS5では前記所定エリア1〜10を横切る文字ス
トロークの数をカウントする。第6図の文字パターンに
ついていえば、x方向第1行目の走査線を横切る文字ス
トローク数は“1"である。これは1ラインの全ての画素
が黒画素であることによる。同様にして、第2行目の走
査線を横切る文字ストローク数は“1"、第3行目の走査
線を横切る文字ストローク数は“2"である。第3行目の
場合はy方向の文字ストロークを2回横切るからであ
る。こうして第48行目までストローク数をカウントす
る。また同様にして第1列目から第48列目までのストロ
ーク数もカウントする。ステツプS6では前記所定エリア
毎に各ストローク数の最小値を抽出する。具体的にいう
と、第7図(a)のエリア1の一部の詳細が第7図
(b)に示されており、その第1行目のストローク数は
“1"、第2行目のストローク数は“1"、第3行目のスト
ローク数はノイズをひろつたことにより“3"、第4行目
のストローク数は“2"、第5行目のストローク数は“2"
というように続く。従つて、エリア1のストローク数の
最小値は“1"である。同様にしてエリア2〜10の各スト
ローク数の最小値が抽出される。勿論、斜めの文字スト
ロークも同様にして確実に検出される。ステツプS7では
抽出したストローク数の最小値を第7図(c)の如くテ
ーブル状にしてエリア573にストアする。これも特徴抽
出情報の一部を構成する。
こうして得られた合計20個の特徴情報が1文字から抽
出した特徴パターンとなり、ステツプS8ではエリア572,
573の特徴情報とROM5の標準特徴情報51aを照合する。ス
テツプS9で照合一致が得られればステツプS10でROM5か
ら対応文字コードを取り出してコードバツフア574にス
トアする。またステツプS9で照合一致が得らないときは
ステツプS11でリジエクトコードをコードバツフア574に
ストアする。
尚、前述の実施例ではストローク数の分布についても
第7図(a)に示すように10のエリアについて調べた
が、ストローク数の分布は主に斜めの文字ストロークの
存在を調べるためのものであるから、例えば第7図
(a)のエリア2,4,7,9についてだけ調べても充分な効
果がある。さらにエリア2,4だけにしぼつても原理的に
は充分である。こうすることによつて、より高速な認識
を行うことができる。
また、実施例のマーク・文字認識装置は、例えば第9
図に示すようなマークシートに記入されたマーク及び手
書文字を読み取る。該マークシートの第1列目には幅広
のタイミングマークが印刷されており、装置はタイミン
グマークを読み取ることにより手書マーク又は手書文字
の読取タイミングを決定する。また第1行目にはキーワ
ードマークが印刷されている。第2行目からはデータ欄
が続き、ここにはデータマークを記入する。そして手書
文字は下欄の2行に記入される。手書文字は必ずしもプ
レプリントしたセグメント内に正確に記入する必要はな
いが、こうすることで記入が容易になり認識確度も高
い。上記マークシートは電子フアイルシステムのキーワ
ードの登録、フアクシミリの電話番号入力、複写機など
の画像形成装置のコピー枚数、縮率などのモード設定用
に使うことが考えられる。
[発明の効果] 以上述べた如く本発明によれば、特徴照合処理で照合
される特徴情報量が少ないため処理時間が大幅に短縮さ
れる。しかも各特徴情報量は簡単な処理で求められる。
また所定領域を横切るストローク数を数回カウント
し、その中でカウント値が最小となるものをもつて前記
所定領域を横切るストロークと判定するのでその領域内
のゴミ、ピーク、ボイドの影響が軽減され、文字認識の
確度が向上する。
[発明の効果] 以上述べた如く本発明によれば、特徴照合処理で照合
される特徴情報量が少ないため処理時間が大幅に短縮さ
れる。しかも各特徴情報量は簡単な処理で求められる。
また所定領域を横切るストローク数を数回カウント
し、その中でカウント値が最小となるものをもつて前記
所定領域を横切るストロークと判定するのでその領域内
のゴミ、ピーク、ボイドの影響が軽減でき、文字認識の
確度が向上する。
【図面の簡単な説明】
第1図は実施例のマーク・文字認識装置(OMR)のブロ
ツク構成図、 第2図は第1図の構成を備えるマーク・文字認識装置の
外観図、 第3図は実施例の文字認識処理手順のフローチヤート、 第4図は文字パターンのビツトサイズを示す図、 第5図(a)〜(c)は文字パターンのストローク長の
検出を説明する図、 第6図は文字の縦及び横ストローク数の計数を説明する
図、 第7図(a)〜(c)は文字の縦及び横ストローク数の
特徴情報抽出を説明する図、 第8図は実施例装置の認識対象であるアルフアベツト及
び数字の文字形態を示す図、 第9図はマークシートの一例を示す図、 第10図は従来の文字認識処理の一例を示すフローチヤー
トである。 図中、1……リーダ、2……光デイスク、3……ホスト
コンピユータ、4……キーボード、5……CRT表示装
置、6……プリンタ、7……オートフイーダである。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】文字の画像情報を入力し、 前記入力した画像情報を所定の領域に分割し、 前記分割された各領域毎に、各ライン上に現れる黒画素
    の個数を計数して、該各領域内における各1ライン毎の
    黒画素の個数の最大値を求め、 前記分割された領域ごとに、各ライン上に現れるストロ
    ークの個数を計数して該各領域内における各1ライン毎
    のストロークの個数の最小値を求め、 前記黒画素の個数の最大値及び前記ストロークの個数の
    最小値を、予め記憶してある標準特徴情報と比較するこ
    とにより、前記入力した画像情報の文字の認識すること
    を特徴とする画像処理方法。
JP61123727A 1986-05-30 1986-05-30 画像処理方法 Expired - Fee Related JP2578768B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61123727A JP2578768B2 (ja) 1986-05-30 1986-05-30 画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61123727A JP2578768B2 (ja) 1986-05-30 1986-05-30 画像処理方法

Publications (2)

Publication Number Publication Date
JPS62281097A JPS62281097A (ja) 1987-12-05
JP2578768B2 true JP2578768B2 (ja) 1997-02-05

Family

ID=14867862

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61123727A Expired - Fee Related JP2578768B2 (ja) 1986-05-30 1986-05-30 画像処理方法

Country Status (1)

Country Link
JP (1) JP2578768B2 (ja)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55140975A (en) * 1979-04-20 1980-11-04 Nec Corp Character recognizing system
JPS5745682A (en) * 1980-08-29 1982-03-15 Matsushita Graphic Commun Syst Inc Character recognition system
JPS57153387A (en) * 1981-03-19 1982-09-21 Ricoh Co Ltd Character recognizing method
JPS59100990A (ja) * 1982-12-02 1984-06-11 Ricoh Co Ltd パタ−ン認識装置
JPS60147891A (ja) * 1984-01-12 1985-08-03 Matsushita Electric Ind Co Ltd 文字認識装置
JPS60153578A (ja) * 1984-01-24 1985-08-13 Matsushita Electric Ind Co Ltd 文字認識装置
JPS6180477A (ja) * 1984-09-28 1986-04-24 Matsushita Electric Ind Co Ltd 文書清書装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55140975A (en) * 1979-04-20 1980-11-04 Nec Corp Character recognizing system
JPS5745682A (en) * 1980-08-29 1982-03-15 Matsushita Graphic Commun Syst Inc Character recognition system
JPS57153387A (en) * 1981-03-19 1982-09-21 Ricoh Co Ltd Character recognizing method
JPS59100990A (ja) * 1982-12-02 1984-06-11 Ricoh Co Ltd パタ−ン認識装置
JPS60147891A (ja) * 1984-01-12 1985-08-03 Matsushita Electric Ind Co Ltd 文字認識装置
JPS60153578A (ja) * 1984-01-24 1985-08-13 Matsushita Electric Ind Co Ltd 文字認識装置
JPS6180477A (ja) * 1984-09-28 1986-04-24 Matsushita Electric Ind Co Ltd 文書清書装置

Also Published As

Publication number Publication date
JPS62281097A (ja) 1987-12-05

Similar Documents

Publication Publication Date Title
KR100658119B1 (ko) 문자 인식 장치 및 방법
CA1160347A (en) Method for recognizing a machine encoded character
KR19980023917A (ko) 패턴 인식 장치 및 방법
EP0266140B1 (en) Optical character recognition by forming and detecting matrices of geographical features
JP4280355B2 (ja) 文字認識装置
KR19980086524A (ko) 패턴 추출 장치
Lakshmi et al. An optical character recognition system for printed Telugu text
US11593591B2 (en) Optical character recognition systems and methods
US5119441A (en) Optical character recognition apparatus and method using masks operation
Bushofa et al. Segmentation of Arabic characters using their contour information
JP2578768B2 (ja) 画像処理方法
AU613013B2 (en) Data acquisition control method and system for a hand held reader
JP2578767B2 (ja) 画像処理方法
JP4585837B2 (ja) 印字データ読取り方法、印字データ読み取り装置、印字データ読み取りプログラム
JP3064391B2 (ja) 文字認識方法
KR100241447B1 (ko) 윤곽선 정보를 이용한 영문/숫자 인식방법
JP2993533B2 (ja) 情報処理装置及び文字認識装置
Choudhary et al. An efficient algorithm for characters recognition of printed oriya script
JP2022051199A (ja) 画像判定装置、画像判定方法、及びプログラム
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JPH0782524B2 (ja) 光学的文字読取装置
JPH0562021A (ja) 標準フオント及び利用者指定カスタムフオントを認識するための光学式文字認識(ocr)システム
JPH10162103A (ja) 文字認識装置
JPS62281094A (ja) パタ−ン情報認識方法
JPH0778820B2 (ja) 画像処理方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees