JPS62281095A - パタ−ン情報認識方法 - Google Patents

パタ−ン情報認識方法

Info

Publication number
JPS62281095A
JPS62281095A JP61123709A JP12370986A JPS62281095A JP S62281095 A JPS62281095 A JP S62281095A JP 61123709 A JP61123709 A JP 61123709A JP 12370986 A JP12370986 A JP 12370986A JP S62281095 A JPS62281095 A JP S62281095A
Authority
JP
Japan
Prior art keywords
pattern
area
black density
reading
prescribed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61123709A
Other languages
English (en)
Inventor
Shinko Ishitani
石谷 新子
Toshiaki Yagasaki
矢ケ崎 敏明
Yumie Gou
郷 由美恵
Akihiko Uekusa
植草 明彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP61123709A priority Critical patent/JPS62281095A/ja
Publication of JPS62281095A publication Critical patent/JPS62281095A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 3、発明の詳細な説明 [産業上の利用分野] 本発明は未知の英字、数字等の文字を自動的に読み取っ
て認識するパターン情報認識方法に関する。
[従来の技術] 従来この種の文字認識装置のパターン情報認識処理を第
10図に示す。
原稿用紙P上の文字をステップS81に示す如く1文字
毎に読込んで光電変換し、これを更にステップS82で
“1°” 、  ”O” (7)24jlチー’l(D
パターンに変換している。続くステップS83で、後に
説明する処理を効果的にするための前処理、即ちステッ
プS82で2値化されたパターンに基づき文字が記録さ
れている用紙P上の黒点などのノイズ処理や文字図形境
界面の平滑化などを含む一連の処理がなされる。
次にステップS84で文字認識を行うのに必要ないくつ
かの特徴(交点、分岐点、ループ数、ストロークの長さ
情報など)を抽出する特徴抽出処理が行われる。この抽
出結果に応じて、多数の文字より特徴が共通するいくつ
かの文字が選択される。
更に、ステップS85以下でその中から唯一の文字の選
択を行うための識別処理としての辞書照合処理、及び認
識処理がなされる。
まずステップS85で抽出された特徴に従って辞書を誘
導(検索)することか可能か否かを調べる。ここで抽出
した特徴が辞書を誘導するに値しないものである場合に
はステップ388に進み、認識不能が出力される。一方
、抽出特徴点により辞書誘導可能であればステップS8
6で備えっりの辞書を検索し、先に抽出した特徴と順次
照合する。ステップS87で照合の結果一致すると、ス
テップS88で当該一致した結果を認識出力として出力
する。一致がとれない場合には認識不能として出力する
[発明が解決しようとする問題点] ところが、この従来の認識方法によると、簡易な文字(
認識されやすい文字)、アルファベット、数字だけの場
合などに対しても、前記の複雑な処理を行うため、処理
時間がかかり過ぎるという欠点があった。
又、上記処理を実現するための構成も複雑であり、コス
トアップや信頼性の点においても種々の問題点を抱えて
いた。
[問題点を解決するための手段] 本発明は前記した従来時相の問題点に鑑み成されたもの
で、上述の問題点を解決する一手段として以下の構成を
備える。
即ち、読取面上のパターン情報を光学的に読取る読取手
段と、該手段に続き読み取ったパターン情報を所定の領
域毎に分割する領域分割手段と、該領域分割手段で分割
された各領域毎の所定量以上連続する黒密度の量を検出
する検出手段と、該検出手段で検出した黒密度の最大値
に基づいて読取りパターンの認識を行なう認識手段とを
備える。
[作用コ 以上の構成において、認識手段は検出手段で検出した黒
密度の最大値を、異なる複数の所定の量と比較した結果
により、分割領域の代表値を判別し、該代表値に基づき
パターン認識する。
[実施例] 以下、図面を参照して本発明に係る一実施例を詳細に説
明する。
第1図は本発明の一実施例のブロック図であり、図中1
はOMRによるキーワードを含む文書画像情報を読み込
み電気信号に変換するリーダ、2はリーダ1で読み取っ
た画像情報を記憶する光ディスク、3は本実施例全体を
制御するホストコンピュータ、4はキーボード、5は画
像情報やオペレーション情報等を表示するCRT、6は
画像情報等を印刷出力するプリンタである。また、7は
リーダ1の原稿読み取り面に原稿を1枚毎に自動送りす
るオートフィーダである。
ホストコンピュータ3において、50はROM51に記
憶された第4図に示す制御プログラムに従って本装置全
体を制御するCPUであり、CPU50は例えばモトロ
ーラ社製のマイクロコンビュータMC68000等で構
成することが望ましい。51はROMであり、ROM5
1には標準特徴パターン記憶領域51aが含まれる。5
2はCRT5とのインタフェースを司どるCRTインタ
フェース、53はキーボード4とのインタフェースを司
どるキーボードインタフェース、54は光ディスクとの
インタフェースを司どる光デイスクインタフェースであ
る。また、55はリーダ1とのインタフェースを司どる
リーダインタフェース、56はプリンタ6とのインタフ
ェースを司どるプリンタインタフェース、57は処理経
過や、読み取りマークの認識処理経過等の記憶されるR
AM、60は各構成間を接続するバスである。
RAM57の詳細記憶領域を第2図に示す。
第2図において、21はパターンバッファ、22はライ
ンヒストグラムバッファ、23は領域ヒストグラムバッ
ファ、24はスレッシュホールドバッファ、25は代表
値バッファである。
以上の構成を備える本実施例の外観図を第3図に示す。
図中第1図と同様構成については同一番号を付した。8
はリーダ1とホストコンピュータ3とのインタフェース
ケーブル、9はプリンタ6とホストコンピュータ3との
インタフェースケーブルである。
以上の構成を備える本実施例の動作を第4図のフローチ
ャートを参照して以下に説明する。
第4図においても第10図と同様に、リーダ1にセット
された原稿上のPに示すパターンを読み取り、認識する
処理を例に説明する。
まず、ステップS1でCPU50はリーダインタフェー
ス55を介してリーダ1を起動し、読み取り原稿面を走
査して原稿面の画像データを読み込む。
原稿面は例えば第9図に示すOMRシートの下部に図の
マークを配置し、該マーク上に活字パターンを第8図に
示すように塗る。そして、上記OMRシートは電子ファ
イルシステムのキーワードの登録、ファクシミリの電話
番号人力、複写機などの画像形成装置のコピ一枚数、縮
率などのモード設定用に使用する。
第8図に示すようなフォーマットを固定し、その上に定
形パターンの文字を書く方法を取ると、その後の処理は
より簡単になる。なお、第8図にはA”〜” z ”及
び1゛〜” o ”の定型パターンが示されている。第
8図のフォーマットの基本パターンはX方向3木、X方
向3木のストロークで構成された「田」の字と斜め2方
のストローク「x」を組み合せた形の一部となっている
このようにして書き込まれた原稿面のマーク位置の1文
字、例えば°A°°を読み込んだ場合を例に以下説明す
る。
ステップS1でリーダ1により光電変換されて読み込ま
れた信号は、ステップS2に示す如くリーダインタフェ
ース55に送られ、リーダインタフェース55に内蔵の
アナログ−デジタルコンバータにより1”、“0°゛の
2値パターンのデジタル信号に変換され、変換されたデ
ジタル信号はCPU50に人力される。
CPU50は、このようにして入力されたデジタルデー
タを順次RAM57のパターンバッファ21に格納する
。本実施例においては、文字バターンは1文字48ビツ
ト×48ビツトの領域に区切られ、A”を読み込んだ場
合の読み取りデータのパターンバッファ21への格納例
を第5図に示す。第5図に示すパターンの場合には、横
方向の(X方向の)最上ラインの黒密度の数は48°°
、第7ライン目は“6″”十”6”の” 12 ”とな
り、縦方向の(Y方向の)最左ラインの黒密度の数はパ
48°゛、第7ライン目は”6”+”6°゛の′12°
゛となる。
CPU50はステップS3で読み込んだパターンを所定
領域に分割する。本実施例では第6図(A)に示す如く
、縦方向を領域1〜5に、横方向を領域6〜10の各領
域に分割する。そしてステップS4でこの分割した各領
域においてライン毎の所定範囲内の黒密度の連続による
ストローク入力を検出し、該人力ストローク分布のヒス
トグラムを求める。各ライン毎の横方向(X方向)及び
縦方向(Y方向)のそれぞれに対しての1″である黒密
度(ストローク密度)の所定量以上の連続が有るか否か
を調べる。そして、所定量以上の黒密度の連続があれば
この連続した部分の黒密度の数を計数する。このスレッ
シュホールドレベルとしての所定量は、第8図に示され
る入力枠に塗られるパターンの幅を考慮して任意の値と
することかできるが、枠の幅が黒密度6連続分とすると
、例えば“3″に取ることができる。
ここで、読み取りパターンが第5図に示すようなきれい
なパターンでなく、第6図(A)に61で示すように途
中にゴミが付着した場合においても、このゴミの幅がス
レッシュホールドレベルである“3°゛以下であれば、
黒密度の計数には加算されない。このため、当該ゴミの
あるラインにおいても、このゴミが黒密度の計数に加算
されることがない。
そしてステップS3で求められた黒密度の数はステップ
S4で順次RAM57のラインヒストグラムバッファ2
2に格納される。この各ラインの黒密度の数をステップ
s3で分解した各領域毎に計数した結果を棒グラフの形
で示したのが第6図(B)、(C)である。第6図(B
)は横方向の積算量を、第6図(C)は縦方向の積算量
を示している。
続いてステップS6で先に求めた所定領域内のライン毎
の黒密度の数の最大値を求め、この値を当該領域の代表
値としてRAM57の領域ヒストグラムバッファ23に
格納する。エリア1においては黒密度の数の最大値は“
48”となり、領域ヒストグラムバッファ23にはとの
’ 48 ”が格納される。同様にエリア2においては
黒密度の数の最大値は12°゛となり、領域ヒストグラ
ムバッファ23にはこの“12°°が格納される。領域
ヒストグラムバッファ23に格納される各領域(エリア
)毎の代表値を第6図(D)に示す。
次に、ステップS7で先に求めた所定領域の代表値に対
するスレッシュボールドレベルを設定する。このスレッ
シュホールドレベルは、各領域毎に任意のレベルを設定
することができ、この領域毎に設定したスレッシュホー
ルドレベルはRAM57のスレッシュボールドバッファ
24に格納される。本実施例においては各領域について
横方向にxl、x2.x3の3レベル、縦方向にもyl
、 y2. y3の3レベルのスレッシュホールドレベ
ルを設定している。このスレッシュホールドレベルの設
定状態を第6図(B)、(C)に示している。
しかし、本実施例はこれに限るものではなく、領域1,
3,5,6,8.10は横方向にx1+x2.x3の3
レベル、縦方向にyz、y2゜y3の3レベルのスレッ
シュホールドレベルを設定し、領域2.4,7.9は横
方向にy′1゜y′2.X’3.X’4.X’5の5レ
ベル、縦方向にy′1. y′2.3/’3. y′4
.V′5の5レベルのスレッシュホールドレベルを設定
してもよい。これらの多値は任意に設定できるが、例え
ば、3レベル時は16,32,4.8とし、5レベル時
は9,19,29,39.48とすればよい。
次にステップS8でステップS6で求めた各領域の黒密
度の最大値に対して、ステップs7で設定したスレッシ
ュホールドレベルに従ってこれを対応する多値データに
変換する。ここで、スレッシュホールドレベルが3レベ
ルの時には代表値は3値となる。例えば代表値Pが(x
z)P)のときは1′°となり、(X2  <P <X
3 )のとぎは” 2 ”、(X3  <P)のとぎは
3”となる。このそれぞれの代表値も第6図(B)、(
C)に示されている。そしてこのようにして求められた
代表値はRAM57の代表値バッファ25に格納される
。従って代表値バッファ25に格納される各代表値は第
7図(A)に示すものとなる。
続くステップSIOでROM51の標準特徴パターン5
1aに記憶の標準パターンと、代表値バッファ25に格
納されている読取りパターンの代表値とのマツチングを
行なう。その結果、ステップSitでパターンの一致が
得られれば、ステップS12で一致の得られたパターン
の人力とじて田識し、結果を出力する。一方一致が得ら
れない場合にはステップ31.3に進み、認識不能を出
力してIA理を終了する。そして再び次のパターンの読
み込み処理等を実行する。
入力標準特徴パターン51aの“A ”の標準パターン
は第7図(B)に示すパターンであり、第7図(A)に
示す読取りパターンの代表値と一致し、第7図(A)の
人カバターンは°゛A′°の人力であると認識される。
以上説明した様に本実施例によれば、例えば第5図に示
す文字パターンを認識する上で、次のような効果が考え
られる。
■所定の領域での黒密度(ストローク密度)が所定量以
上連続した場合のみこの黒密度の数を計数し、この計数
した黒密度の最大値を代表値として認識し、かつこの値
を所定のスレツシユホールドレベルで3値化することに
より、少ない量のパターンマツチングでパターン認識が
され、同時に領域内の誤読取であるゴミ等の読み取りを
除去するという効果を含んでいる。このため、第6図(
A)の61の如く、領域内ゴミ等があって当該ラインの
黒密度の数が多少変化しても、その影響を防ぐことがで
き、正確な文字認識が可能となる。
■さらに、照合されるデータ量が少ないため、処理時間
が大幅に削減され、第7図(A)のパターンと第7図(
B)に示す標準特徴パターンという少量のデータの照合
のみで認識が可能となる。
このように、文字認識装置のm易な文字の認識における
欠点を解消し、簡易な文字の認識に必要な処理時間を短
縮し、高速、かつ、高精度の文字認識が可能となる。
更に、定形パターン(活字型)の数字、もしくはアルフ
ァベットの文字を、高速かつ高精度に認識することがで
とる。
また、以上の説明において、スレッシュホールドレベル
の選定を、3レベルでの値が低い場合に更にスレッシュ
ホールドレベルの数を増やし、5レベルにする等して認
識精度を上げるよう制御してもよい。
[発明の効果] 以上説明した如く、本発明によれば、非常に短時間で、
かつ正確なパターン認識処理が行なえる。
【図面の簡単な説明】
第1図は本発明に係る一実施例のブロック図、第2図は
第1図に示すRAMの詳細構成図、第3図は本実施例の
外観図、 第4図は本実施例のパターン認識制御フローチャート、 第5図は本実施例のパターンバッファへの読取りパター
ン格納例を示す図、 第6図(A)〜(D)は本実施例によるパターン゛A”
の認識処理及びスレッシュホールドレベルの設定例を説
明するための図、 第7図(A)は本実施例の°°A″読み取り時の読取り
パターンの代表値を示す図、 第7図(B)は標準特徴パターンにおける” A ”の
格納パターンを示す図、 第8図は本実施例で用いる標準人カバターンを示す図、 第9図は本実施例で用いられるOMRシートを示す図、 第10図は従来のパターン認識処理を示すフローチャー
トである。 図中、1・・・ リーダ、2・・・光ディスク、3・・
・ホストコンピュータ、4・・・キーボード、5・・・
CRT、6・・・プリンタ、7・・・オートフィーダ、
50 ・−CP U 、 51−ROM 、 51 a
 −・−標準特徴パターン記憶領域、52・・・CRT
インタフェース、53・・・キーボードインタフェース
、54・・・光デイスクインタフェース、55・・・リ
ーダインタフェース、56・・・プリンタインタフェー
ス、57・・・RAM、60・・・バスである。 特許出願人   キャノン株式会社 特開口8G2−281095  (8)(48x 48
 bit)  第6図(A)第6図(C) 第61i−4(B) 第6図 (D) 桃準パターン 第7図 (B)

Claims (1)

    【特許請求の範囲】
  1. (1)読取面上のパターン情報を光学的に読取る読取工
    程と、該工程に続き読み取つたパターン情報を所定の領
    域毎に分割する領域分割工程と、該領域分割工程で分割
    された各領域毎の所定量以上連続する黒密度の量を検出
    する検出工程と、該検出工程で検出した黒密度の最大値
    を異なる複数の所定の量と比較した結果により前記分割
    領域の代表値を判別し、該代表値に基づきパターン認識
    する認識工程とより成ることを特徴とするパターン情報
    認識方法。
JP61123709A 1986-05-30 1986-05-30 パタ−ン情報認識方法 Pending JPS62281095A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61123709A JPS62281095A (ja) 1986-05-30 1986-05-30 パタ−ン情報認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61123709A JPS62281095A (ja) 1986-05-30 1986-05-30 パタ−ン情報認識方法

Publications (1)

Publication Number Publication Date
JPS62281095A true JPS62281095A (ja) 1987-12-05

Family

ID=14867409

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61123709A Pending JPS62281095A (ja) 1986-05-30 1986-05-30 パタ−ン情報認識方法

Country Status (1)

Country Link
JP (1) JPS62281095A (ja)

Similar Documents

Publication Publication Date Title
EP0472313B1 (en) Image processing method and apparatus therefor
EP0054439A2 (en) Character segmentation method
US4944022A (en) Method of creating dictionary for character recognition
JP2644041B2 (ja) 文字認識装置
US7016535B2 (en) Pattern identification apparatus, pattern identification method, and pattern identification program
JPH11219409A (ja) 文書読取装置
JPS6141029B2 (ja)
JPS62281095A (ja) パタ−ン情報認識方法
JPS62281094A (ja) パタ−ン情報認識方法
JPS62281093A (ja) パタ−ン情報認識方法
JPS62281092A (ja) 画像処理方法
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JPS62281088A (ja) 画像処理方法
JPS62281090A (ja) パタ−ン情報認識方法
JPS62281089A (ja) 画像処理方法
JP3710164B2 (ja) 画像処理装置及び方法
JP2578767B2 (ja) 画像処理方法
JP2578768B2 (ja) 画像処理方法
JPS62281091A (ja) パタ−ン情報認識方法
JPH0782524B2 (ja) 光学的文字読取装置
JPS60181880A (ja) 光学的文字入力装置
JP2851102B2 (ja) 文字切出し方法
JPH1125214A (ja) 画像識別装置
JPH11219408A (ja) 文書読取装置