JPS62281093A - パタ−ン情報認識方法 - Google Patents

パタ−ン情報認識方法

Info

Publication number
JPS62281093A
JPS62281093A JP61123707A JP12370786A JPS62281093A JP S62281093 A JPS62281093 A JP S62281093A JP 61123707 A JP61123707 A JP 61123707A JP 12370786 A JP12370786 A JP 12370786A JP S62281093 A JPS62281093 A JP S62281093A
Authority
JP
Japan
Prior art keywords
area
pattern
black density
value
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61123707A
Other languages
English (en)
Inventor
Shinko Ishitani
石谷 新子
Toshiaki Yagasaki
矢ケ崎 敏明
Yumie Gou
郷 由美恵
Akihiko Uekusa
植草 明彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP61123707A priority Critical patent/JPS62281093A/ja
Publication of JPS62281093A publication Critical patent/JPS62281093A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 3、発明の詳細な説明 [産業上の利用分野コ 本発明は未知の英字、数字等の文字を自動的に読み取っ
て認識するパターン情報認識方法に関する。
[従来の技術] 従来この種の文字認識装置のパターン情報認識処理を第
13図に示す。
原稿用紙P上の文字をステップS81に示す如く1文字
毎に読込んで光電変換し、これを更にステップS82で
“1”、”O″′の2値データのパターンに変換してい
る。続くステップS83で、後に説明する処理を効果的
にするための前処理、即ちステップS82で2値化され
たパターンに基づき文字が記録されている用紙P上の黒
点などのノイズ処理や文字図形境界面の平滑化などを含
む一連の処理がなされる。
次にステップS84で文字認識を行うのに必要ないくつ
かの特徴(交点、分岐点、ループ数、ス]・ローフの長
さ情報など)を抽出する特徴抽出処理が行われる。この
抽出結果に応じて、多数の文字より特徴が共通するいく
つかの文字が選択さオ]る。
更に、ステップS85以下でその中から唯一の文字の選
択を行うための識別処理としての辞書照合処理、及び認
識処理がなされる。
まずステップS85で抽出された特徴に従って辞書を誘
導(検索)することが可能か否かを調べる。ここで抽出
した特徴が辞書を誘導するに値しないものである場合に
はステップS88に進み、認識不能が出力される。一方
、抽出特徴点により辞書誘導可能であればステップS8
6で備えつりの辞書を検索し、先に抽出した特徴と順次
照合する。ステップS87で照合の結果一致すると、ス
テップ388で当該一致した結果を認識出力として出力
する。一致がとれない場合には認識不能として出力する
[発明が解決しようとする問題点コ ところが、この従来の認識方法によると、簡易な文字(
認識されやすい文字)、アルファベット、数字だけの場
合に対しても、前記の複雑な処理を行うため、処理時間
がかかり過きるという欠点があった。
又、上記処理を実現するための構成も複雑であり、コス
トアップや信頼性の点においても種々の問題点を抱えて
いた。
[問題点を解決するための手段] 本発明は前記した従来時桁の問題点に鑑み成されたもの
で、上述の問題点を解決する一手段として以下の構成を
備える。
即ち、読取面上のパターン情報を光学的に読取る読取手
段と、該手段に続ぎ誘み取ったパターン情報を所定の領
域毎に分°割する領域分割手段と、該領域分割手段で分
割された各領域毎の黒密度の量を検出する検出手段と、
領域分割手段で分割された各領域毎に入力されるべき予
想黒密度の最大値に対応した複数のスレッシュホールド
レベルを設定する設定手段と、検出手段で検出した各領
域毎の黒密度の量を該設定手段で設定した異なる複数の
スレッシュホールドレベルと比較した結果にに基づいて
読取りパターンの認識を行なう認識手段とを備える。
[作用] 以上の構成において、認識手段は検出手段で検出した黒
密度の量を、設定手段で設定した異なる複数のスレッシ
ュボールドレベルと比較して各領域の代表値を求め、こ
の代表値に基づいて読取りパターンの認識を行なう。
[実施例] 以下、図面を参照して本発明に係る一実施例を詳細に説
明する。
第1図は本発明の一実施例のブロック図であり、図中1
はOMRによるキーワードを含む文書画像情報を読み込
み電気信号に変換するリーダ、2はリーダ1で読み取っ
た画像情報を記憶する光ディスク、3は本実施例全体を
制御するホストコンピュータ、4はキーボード、5は画
像情報やオペレーション情報等を表示するCRT、6は
画像情報等を印刷出力するプリンタである。また、7は
リーダ1の原稿読み取り面に原稿を1枚毎に自動送りす
るオートフィーダである。
ホストコンピュータ3において、50はROM51に記
憶された第4図に示す制御プログラムに従って本装置全
体を制御するCPUであり、CPU50は例えばモトロ
ーラ社製のマイクロコンピュータMC68000等で構
成することが望ましい。51はROMであり、ROM5
1には標準特徴パターン記憶領域51aが含まれる。5
2はCRT5とのインタフェースを司どるCRTインタ
フェース、53はキーボード4とのインタフェースを司
どるキーボードインタフェース、54は光、ディスクと
のインタフェースを司どる光デイスクインタフェースで
ある。また、55はリーダ1とのインタフェースを司ど
るリーダインタフェース、56はプリンタ6とのインタ
フェースを司どるプリンタインタフェース、57は処理
経過や、読み取りマークの認識処理経過等の記憶される
RAM、60は各構成間を接続するバスである。
RAM57の詳細記憶領域を第2図に示す。
第2図において、21はパター・ンバッファ、22はラ
インヒストグラムバッファ、23は領域ヒス]・グラム
バッファ、24はスレッシュホールドバッファ、25は
代表値バッファである。
以上の構成を備える本実施例の外観図を第3図に示す。
図中第1図と同様構成については同一番号を付した。8
はリーダ1とホストコンピュータ3とのインタフェース
ケーブル、9はプリンタ6とホストコンピュータ3との
インタフェースケーブルである。
以上の構成を備える本実施例の動作を第4図のフローチ
ャートを参照して以下に説明する。
第4図においても第13図と同様に、リーダ1にセット
された原稿上のPに示すパターンを読み取り、認識する
処理を例に説明する。
本実施例においては、リーダ1が読み取り原稿面を走査
して、原稿面の画像データを読み込む。
原稿面は例えば第5図に示すOMRシートの下部に図の
マークを配置し、該マークの枠内に活字パターンを第6
図に示すように塗る。そして、上記OMRシートは電子
ファイルシステムのキーワードの登録、ファクシミリの
電話番号入力、複写機などの画像形成装置のコピ一枚数
、縮率などのモード設定用に使用する。
第6図に示すようなフォーマットを固定し、その上に定
形パターンの文字を書く方法を取ると、その後の処理は
より簡単になる。なお、第6図には“A”〜″z ”及
び°゛1”〜゛0°°の定型パターンが示されている。
第6図のフォーマットの基本パターンはX方向3木、X
方向3木のストロークで構成された「田」の字と斜め2
方のストローク「xJを組み合せた形の一部となってい
る。
本実施例ではり−ダ1の読み取りパターンデータは、リ
ーダインタフェース55に内蔵のアナログ−デジタルコ
ンバータにより、1°’、”o”の2値パターンのデジ
タル信号に変換され、この1文字分のデータはパターン
バッファ21の48ビツト×48ビツトの領域に格納さ
れる。
まずステップS1で上記読み取り定形パターンを所定の
領域に分割する。例えば、第7図の如く縦方向(Y方向
)を領域1〜5、横方向(X方向)を領域6〜10に分
割する。そしてステップS2で分割した領域が第1の領
域か否かを調へ、第1の領域の場合にはステップS3で
第1のスレッシュホールドレベルを設定し、第1の領域
でない場合(第2の領域の場合)にはステップs4で第
2のスレッシュホール下レベルを設定し、共にステップ
S5に進み、設定したスレッシュホールドレベルをRA
M57のスレッシュホールドバッファ24に格納する。
そして続くステップS6において全ての領域についての
スレッシュホールドレベルの設定が終了したか否かを調
べ、終了していなければステップS2に戻り、全ての領
域についてのスレッシュホールドレベルの設定を行なう
ここで、領域を第7図に示す如く分割した場合には、領
域1においては入力されるストローク(黒密度)の最大
値は全領域に渡り、0ビツトから最大48ビツトとなる
。一方、領域2については、第8図(A)〜(D)に示
すように4通りの入カバターンが考えられる。同様に領
域3及び5は最大48ビツトとなり、領域4においては
領域2と同様となる。このため、第5図に示す入力スト
ロークの枠の幅が4ビツトである場合には、各領域のス
トロークの最大値は第9図(A)に示す如く、領域1,
3.5において48ビツト、領域2.4において16ビ
ツトとなる。従って第1の領域を最大値が48ビツトと
なる領域とし、第2の領域を他の領域とすると、スレッ
シュホールドレベルをそれぞれ3レベル設定するときは
、第1の領域の場合には、例えば。×1を16ビツト、
x2を32ビツト、x3は48ビツトとし、第2の領域
の場合には多少余裕を取り、x′lを6ビツト、X′2
は12ビツト、X’3を18ビットとすればよい。この
スレッシュホールドレベルの設定例を第9図(B)に示
す。
ステップS6で全領域に対するスレッシュホールドレベ
ルの設定が終了すると、ステップ37以下において人カ
バターンの読み込み、認識処理を行なう。
以下、原稿面のマーク位置Pに、例えば′A°。
が書込まれ、これを読み込んだ場合を例に説明する。
CPL150はステップS7で、リーダインタフェース
55を介してリーダ1を起動し、読み取り原稿面Pを走
査して原稿面の画像データを読み込む。リーダ1により
光電変換されて読み込まれた信号は、ステップS8に示
す如くリーダインタフェース55に送られ、”1’、 
 “0°°の2値のデジタル信号に変換され、変換され
たデジタル信号はCPU50に入力される。CPU50
は、ステップS9でこのようにして入力されたデジタル
データを順次RAM57のパターンバッファ21に格納
する。
”A”を読み込んだ場合の、読み取りデータのパターン
バッファ21への格納例を第10図に示す。第10図に
示すパターンの場合には、横方向の(X方向の)最上ラ
インの黒密度の数は“48”、第7ライン目は°°4°
’十”4°°の“′8゛となり、縦方向の(Y方向の)
最左ラインの黒密度の数は’48”、第7ライン目は4
°°+″4”の8′°となる。
そしてステップSIOで、各ライン毎の横方向(X方向
)及び縦方向(Y方向)のそれぞれに対しての°゛1”
である黒密度(ストローク密度)の数を調べ、黒密度の
数を計数する。モしてステップSIOで求められた黒密
度の数はステップs11で順次RAM57のラインヒス
トグラムバッファ22に格納される。この各ラインの黒
密度の数をステップS3で分解した各領域毎に計数した
結果を棒グラフの形で示し、たのが第11図(A)、(
B)である。第11図(A)は横方向の積算量を、第1
0図(B)は縦方向の積算量を示している。
続いてステップS12で先に分割された所定領域内のラ
イン毎の黒密度の数の最大値を求め、この値を当該領域
の一応の代表値としてRAM57の領、域ヒストグラム
バッファ23に格納する。
領域1においては黒密度の数の最大値は48°゛となり
、領域ヒストグラムバッファ23にはこの” 48 ”
が格納される。同様に領域2においては黒密度の数の最
大値は°゛8°′となり、領域ヒストグラムバッファ2
3にはこの8”が格納される。次に、ステップS13で
各領域の黒密度の最大値に対して、ステップS5でRA
M57のスレッシュホールドバッファ24に格納された
スレッシュホールドレベルに従ってこれを対応する多値
データに変換する。そして、この値を当該領域の代表値
として代表値バッファ25に格納する。
本実施例においては、各領域について、縦方向にも横方
向と同様に、第11図(B)に示す如く:Yl、:Y2
. y3及び、:Y’i、 y’2. y’3の各3レ
ベルのスレッシュホールドレベルを設定している。本実
施例においてはスレッシュホールドレベルが3レベルで
あり、代表値は3値となる。従って、代表値Pが(xz
>P)のときは1°゛、(X2  <P <X3 )の
ときは” 2 ”、(x3 <P)のときは3”となる
。この代表値バッファ25に格納される図”A″入力時
の各領域毎の代表値を第12図(A)に示す。
続くステップS14でROM51の標準特徴パターン5
1aに記憶の標準パターンと、代表値バッファ25に格
納されて・いる読取りパターンの代表値とのマツチング
を行なう。その結果、ステップS15でパターンの一致
が得られれば、ステップS16で一致の得られたパター
ンの人力として認識し、結果を出力する。一方一致が得
られない場合にはステップS17に進み、認識不能を出
力して処理を終了する。そして再び次のパターンの読み
込み処理等を実行する。
人力標準特徴パターン51aの“A”の標準パターンは
第12図(B)に示すパターンであり、第12図(A)
に示す読取りパターンの代表値と一致し、第12図(A
)の入カバターンはA ”の人力であると認識される。
以上説明した様に本実施例によれば、例えば第10図に
示す文字パターンを認識する上で、次のような効果が考
えられる。
■所定の領域での黒密度(ストローク密度)の黒密度の
数を計数し、この計数した黒密度の最大値を代表値とし
て認識し、かつこの値を所定のスレッシュホールドレベ
ルで3値化することにより、少ない量のパターンマツチ
ングでパターン認識がされ、同時に領域内の誤読取であ
るゴミ等の読み取りを除去するという効果を含んでいる
。このため、領域内ゴミ等があって当該ラインの黒密度
の数が多少変化しても、その影響を防ぐことができ、正
確な文字認識が可能となる。
■さらに、照合されるデータ量が少ないため、処理時間
が大幅に削減され、第12図(A)のパターンと第12
図(B)に示す標準特徴パターンという少量のデータの
照合のみで認識が可能となる。
このように、文字認識°装置の簡易な文字の認識におけ
る欠点を解消し、簡易な文字の認識に必要な処理時間を
短縮し、高速、かつ、高精度の文字認識が可能となる。
更に、定形パターン(活字型)の数字、もしくはアルフ
ァベットの文字を、高速かつ高精度に認識することかで
きる。
また、以上の説明において、更にスレッシュホールドレ
ベルの数を増やし、5レベルにする等して認識精度を上
げるよう制御してもよい。
[発明の効果] 以上説明した如く、本発明によれば、非常に短時間で、
かつ正確なパターン認識処理が行なえる。
【図面の簡単な説明】
第1図は本発明に係る一実施例のブロック図、第2図は
第1図に示すRAMの詳細構成図、第3図は本実施例の
外観図、 第4図は本実施例のパターン認識制御フローチャート、 第5図は本実施例で用いられるOMRシートを示す図、 第6図は本実施例で用いる標準入カバターンを示す図、 第7図は本実施例のOMRシートの入力枠への人力レイ
アウトを示す図、 第8図(A)〜(D)は本実施例のOMRシートの入力
枠への入力態様を示す図、 第9図(A)は本実施例の各領域毎の入力ストローク密
度を示す図、 第9図(B)は本実施例の各領域毎の入力ストローク密
度と設定スレツスユホールドレベルの関係を示す図、 第10図は本実施例のパターンバッファへの読取りパタ
ーン格納例を示す図、 第11図(A)、(B)は“A”読み取り時の各領域毎
の入力ストローク密度と設定スレツスユホールドレベル
の関係を示す図、 第12図(A)は本実施例の°゛A”読み取り時の読取
りパターンの代表値を示す図、 第12図(B)は標準特徴パターンにおける“A”の格
納パターンを示す図、 第13図は従来のパターン認:Jl理を示すフローチャ
ートである。 図中、1・・・ リーグ、2・・・光ディスク、3・・
・ホストコンピュータ、4・・・キーボード、5・・・
CRT、6・・・プリンタ、7・・・オートフィーダ、
50・・・CPU、51−ROM、51a−・−標準特
徴パターン記憶領域、52・・・CRTインタフェース
、53・・・キ・−ボードインタフェース、54・・・
光デイスクインタフェース、55・・・リーグインタフ
ェース、56・・・プリンタインタフェース、57・・
・RAM、60・・・バスである。 特許出願人   キャノン株式会社 第10図 Xi’ X1Xi 第11図 (A) 第11図 (B)

Claims (2)

    【特許請求の範囲】
  1. (1)読取面上のパターン情報を光学的に読取る読取工
    程と、該工程に続き読み取つたパターン情報を所定の領
    域毎に分割する領域分割工程と、該領域分割工程で分割
    された各領域毎の黒密度の量を検出する検出工程と、前
    記領域分割工程で分割された各領域毎に入力されるべき
    予想黒密度の最大値に対応した複数のスレツシユホール
    ドレベルを設定する設定工程と、前記検出工程で検出し
    た各領域毎の黒密度の量を該設定工程で設定した異なる
    複数のスレツシユホールドレベルと比較した結果により
    前記分割領域の代表値を判別し、該代表値に基づきパタ
    ーン認識する認識工程とより成ることを特徴とするパタ
    ーン情報認識方法。
  2. (2)認識工程は各領域の代表値を該領域内の黒密度の
    最大値とすることを特徴とする特許請求の範囲第1項記
    載のパターン情報認識方法。
JP61123707A 1986-05-30 1986-05-30 パタ−ン情報認識方法 Pending JPS62281093A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61123707A JPS62281093A (ja) 1986-05-30 1986-05-30 パタ−ン情報認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61123707A JPS62281093A (ja) 1986-05-30 1986-05-30 パタ−ン情報認識方法

Publications (1)

Publication Number Publication Date
JPS62281093A true JPS62281093A (ja) 1987-12-05

Family

ID=14867354

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61123707A Pending JPS62281093A (ja) 1986-05-30 1986-05-30 パタ−ン情報認識方法

Country Status (1)

Country Link
JP (1) JPS62281093A (ja)

Similar Documents

Publication Publication Date Title
US4944022A (en) Method of creating dictionary for character recognition
US3755780A (en) Method for recognizing characters
EP0054439A2 (en) Character segmentation method
US20040213458A1 (en) Image processing method and system
JPH0564834B2 (ja)
US7016535B2 (en) Pattern identification apparatus, pattern identification method, and pattern identification program
JPS62281093A (ja) パタ−ン情報認識方法
JPH02293989A (ja) 文字認識装置
JPS62281094A (ja) パタ−ン情報認識方法
JPS62281092A (ja) 画像処理方法
JPS62281095A (ja) パタ−ン情報認識方法
JPS62281091A (ja) パタ−ン情報認識方法
JP2578767B2 (ja) 画像処理方法
JPS62281089A (ja) 画像処理方法
JP2578768B2 (ja) 画像処理方法
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JPS62281088A (ja) 画像処理方法
JPS62281090A (ja) パタ−ン情報認識方法
JP2848560B2 (ja) 画像認識方法及び装置
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JPH0514952B2 (ja)
JP2851102B2 (ja) 文字切出し方法
JPH0782524B2 (ja) 光学的文字読取装置
JPS5914078A (ja) 帳票読取装置