JPS62281091A - パタ−ン情報認識方法 - Google Patents

パタ−ン情報認識方法

Info

Publication number
JPS62281091A
JPS62281091A JP61123705A JP12370586A JPS62281091A JP S62281091 A JPS62281091 A JP S62281091A JP 61123705 A JP61123705 A JP 61123705A JP 12370586 A JP12370586 A JP 12370586A JP S62281091 A JPS62281091 A JP S62281091A
Authority
JP
Japan
Prior art keywords
pattern
recognition
pattern information
histogram
black density
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61123705A
Other languages
English (en)
Inventor
Shinko Ishitani
石谷 新子
Toshiaki Yagasaki
矢ケ崎 敏明
Yumie Gou
郷 由美恵
Akihiko Uekusa
植草 明彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP61123705A priority Critical patent/JPS62281091A/ja
Publication of JPS62281091A publication Critical patent/JPS62281091A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 3、発明の詳細な説明 し産業上の利用分野] 本発明は未知の英字、数字等の文字を自動的に読み取っ
て認識するパターン情報認識方法に関する。
[従来の技術] 従来この種の文字認識装置の文字認識処理を第10図に
示す。
原稿用紙P上の文字をステップS81に示す如く1文字
毎に読込んで光電変換し、これを更にステップS82で
“1”、”O”の2値データのパターンに変換している
。続くステップS83で、後に説明する処理を効果的に
するための前処理、即ちステップS82で2値化された
パターンに基づき文字が記録されている用紙P上の黒点
などのノイズ処理や文字図形境界面の平滑化などを含む
一連のIA理がなされる。
次にステップS84で文字認識を行うのに必要ないくつ
かの特徴(交点、分岐点、ループ数、ストロークの長さ
情報など)を抽出する特徴抽出処理が行われる。この抽
出結果に応じて、多数の文字より特徴が共通ずるいくつ
かの文字が選択される。
更に、ステップ585以下でその中から唯一の文字の選
択を行うための識別処理としての辞書照合処理、及び認
識処理がなされる。
まずステップS85で抽出された特徴に従って辞書を誘
導(検索)することが可能か否かを調べる。ここで抽出
した特徴が辞書を誘導するに値しないものである場合に
はステップ588に進み、認識不能が出力される。一方
、抽出特徴点により辞書誘導可能であればステップS8
6で備えっけの辞書を検索し、先に抽出した特徴と順次
照合する。ステップS87で照合の結果一致すると、ス
テップ38Bで当該一致した結果を認識出力として出力
する。一致がとれない場合には認識不能として出力する
[発明が解決しようとする問題点] ところが、この従来の認識方法によると、簡易な文字(
認識されやすい文字)、アルファベット、数字だけの場
合などに対しても、前記の複雑なIA理を行うため、処
理時間がかかり過ぎるという欠点があった。
又、上記処理を実現するための構成も複雑であり、コス
トアップや信顆性の点においても種々の問題点を抱えて
いた。
[問題点を解決するための手段] 本発明は前記した従来技術の問題点に鑑み成されたもの
で、上述の問題点を解決する一手段として以下の構成を
備える。
即ち、読取面上のパターン情報を光学的に読取る読取手
段と、該手段により読み取ったパターン情報を所定の領
域毎に分割する領域分割手段と、該領域分割手段で分割
された各領域毎の一定範囲内の黒密度の連続を検出する
検出手段と、該検出手段で検出した黒密度の連続を入力
ストロークとして認識する認識手段より成る。
[作用コ 以上の構成において、読取手段で読み取ったパターン情
報を分割手段により所定の領域毎に分割し、該分割手段
により分割された各領域毎の一定範囲内の長さを有する
黒密度の連続を検出手段で検出し、認識手段は該検出手
段で検出した一定範囲内の長さの黒密度の′a続を入力
ストロークとして認識する。
[実施例] 以下、図面を参照して本発明に係る一実施例を詳細に説
明する。
第1図は本発明の一実施例のブロック図であり、図中1
はOMRによるキーワードを含む文書画像情報を読み込
み電気信号に変換するリーダ、2はリーダ1で読み取っ
た画像情報を記憶する光ディスク、3は本実施例全体を
制御するポストコンピュータ、4はキーボード、5は画
像情報やオペレーション情報等を表示するCRT、6は
画像情報等を印刷出力するプリンタである。また、7は
リーダ1の原稿読み取り面に原稿を1枚毎に自動送りす
るオートフィーダである。
ホストコンピュータ3において、50はROM51に記
憶された第4図に示す制御プログラムに従って本装置全
体を制御するCPUであり、CPU50は例えばモトロ
ーラ社製のマイクロコンピュータMC68000等で構
成することが望ましい。51はROMであり、ROM5
1には標準特徴パターン記憶領域51aが含まれる。5
2はCRT5とのインタフェースを司どるCRTインタ
フェース、53はキーボード4とのインタフェースを司
どるキーボードインタフェース、54は光ディスクとの
インタフェースを司どる光デイスクインタフェースであ
る。また、55はリーダ1とのインタフェースを司どる
リーダインタフェース、56はプリンタ6とのインタフ
ェースを司どるプリンタインタフェース、57は処理経
過や、読み取りマークの認識処理経過等の記憶されるR
AM、60は各構成間を接続するバスである。
RAM57の詳細記憶領域を第2図に示す。
第2図において、21はパターンバッファ、22はライ
ンヒストグラムバッファ、23は領域ヒストグラムバッ
ファ、24は読み取りパターンである。
以上の構成を備える本実施例の外観図を第3図に示す。
図中第1図と同様構成については同一番号を付した。8
はリーダ1とホストコンピュータ3とのインタフェース
ケーブル、9はプリンタ6とホストコンピュータ3との
インタフェースケーブルである。
以上の構成を備える本実施例の動作を第4図のフローチ
ャートを参照して以下に説明する。
第4図においても第10図と同様に、リーダ1にセット
された原稿上のPに示すパターンを読み取り、認識する
処理を例に説明する。
まず、ステップS1でCPU50はリーダインタフェー
ス55を介してリーダ1を起動し、読み取り原稿面を走
査して原稿面の画像データを読み込む。
原稿面は例えば第9図に示すOMRシートの下部に区の
マークを配置し、該マーク上に活字パターンを第8図に
示すように塗る。そして、上記OMRシートは電子ファ
イルシステムのキーワードの登録、ファクシミリの電話
番号入力、複写機などの画像形成装置のコピ一枚数、縮
率などのモード設定用に使用する。
第8図に示すようなフォーマットを固定し、その上に定
形パターンの文字を書く方法を取ると、その後の処理は
より簡単になる。なお、第8図には°A″〜“Z″及び
′1°°〜“°0°゛の定型パターンが示されている。
第8図のフォーマットの基本パターンはX方向3木、y
方向3木のストロークで構成された「田」の字と斜め2
方のストロークrXJを組み合せた形の一部となってい
る。
このようにして書き込まれた原稿面のマーク位置の1文
字、例えば°A”を読み込んだ場合を例に以下説明する
ステップS1でリーダ1により光電変換されて読み込ま
れた信号は、ステップS2に示す如く −リーダインタ
フェース55に送られ、リーダインタフェース55に内
蔵のアナログ−デジタルコンバータにより“1”、0°
“の2値パターンのデジタル信号に変換され、変換され
たデジタル信号はCPU50に入力される。
CPU50は、このようにして入力されたデジタルデー
タを順次RAM57のパターンバッファ21に格納する
。本実施例においては、文字パターンは1文字48ビツ
ト×48ビツトの領域に区切られ、“A°゛を読み込ん
だ場合の読み取りデータのパターンバッファ21への格
納例を第5図に示す。
CPU50はステップS3でこのデジタルデータな複数
の所定領域毎に分割する。そしてステップS4でこの分
割した各領域のライン毎の所定範囲り内の黒密度の連続
によるストローク入力を検出し、該入力ストローク分布
のヒストグラムを求める。そしてステップS5で求めた
ストローク分布のヒストグラムをRAM57のラインヒ
ストグラムバッファ22に格納する。
読取パターンは、例えば第6図(A)の1〜6及びA−
Dに示す各所定領域に分割される。分割された各領域に
おいて、例えば第6図(A)の領域4は、第6図(B)
に示すパターンとなり、各ライン毎のストローク分布の
ヒストグラムは51に示すものとなる。なお、黒密度の
連続の長さが所定範囲りよりも大きい場合にはヒストグ
ラムは°0”となり、黒密度の連続の長さが所定範囲り
よりも小さい場合にはヒストグラムは′1°°となる。
このため、ラインの長さkはhより大きいためヒストグ
ラムは“0”となり、見1及び立2はhより短いためヒ
ストグラムは“°1°゛となる。
同様にして領域Aにおける各ライン毎のヒストグラムは
第6図(C)の如くなり、ヒストグラム分布は52に示
す如きものになる。
続いてステップS6で先に求めた所定領域内のライン毎
のヒストグラムの最小値を求め、RAM57の領域ヒス
トグラムバッファ23に格納する。同様にステップS7
で先に求めた所定領域内のライン毎のヒストグラム分布
の黒密度の連続する最大発生ストロータ数を求め、RA
M 57の領域ヒストグラムバッファ23に格納する。
そしてステップS8で各領域毎の代表値を求め、RAM
57の読み取りパターン24に格納する。ここで、第6
図(A)に示す領域1〜6においてはヒストグラム分布
の最小値を代表値とし、領域A−Dにおいては最大発生
ストローク値を代表値とする。第6図(B)に示す領域
4においては代表値は“O”となり、第6図(C)に示
す領域Aにおいては代表値は2”となる。
読み取りパターン24への全ての領域における代表値の
格納状態を第6図(D)に示す。
続くステップS10でROM51の標準特徴パターン5
1aに記憶の標準パターンと、読み取りパターン24に
格納されているパターンとのマツヂングな行なう。その
結果、ステップs11でパターンの一致が得られれば、
ステップs12で一致の得られたパターンの入力として
認識し、結果を出力する。一方一致が得られない場合に
はステップS13に進み、認識不能を出力して処理を終
了する。そして再び次のパターンの読み込み処理等を実
行する。
入力標準特徴パターン51aの″△″の標準パターンは
第7図に示すパターンであり、読取りパターン24の格
納パターンと一致し、第6図(A)の人カバターンはA
 ”の入力であると認識される。
以上説明した様に本実施例によれば、例えば第8図に示
す人カバターンを認識する上で、次のような効果が考え
られる。
■所定範囲内の黒密度の連続においてストロークの検出
を行ない、所定範囲以上の黒密度の連続の場合にはスト
ローク入力として計数しないため、少ないストローク数
(少ないデータ量)の処理でより正確な文字の認識が可
能となる。さらに、照合されるデータ量が少ないため、
処理時間が大幅に削減される。
■所定の領域での最大発生ストローク数を代表値とする
ことにより、領域内の誤読取であるゴミ等の読み取りを
除去するという効果を含んでいる。また、領域内でのヒ
ストグラムが多少変化しても、最大発生ストローク数を
代表値とすることにより、正確な文字認識が可能となる
このように、文字認識装置の簡易な文字の認識における
欠点を解消し、簡易な文字の認識に必要な処理時間を短
縮し、高速、かつ、高精度の文字認識が可能となる。
更に、定形パターン(活字型)の数字、もしくはアルフ
ァベットの文字を、高速かつ高精度に認識することがで
きる。
[発明の効果] 以上説明した如く、本発明によれば、少ないデータ量の
照合でパターン認識でき、非常に短時間で、かつ正確な
パターン認識処理が行なえる。
【図面の簡単な説明】
第1図は本発明に係る一実施例のブロック図、第2図は
第1図に示すRAMの詳細構成図、第3図は本実施例の
外観図、 第4図は本実施例のパターン認識制御フローチャート、 第5図は読取パターンの格納例を示す図、第6図も一コ
ー宍→は本実施例によるバターン°A″の認識処理を説
明するための図、第7図は標準特徴パターンにおける′
八“′の格納パターンを示す図、 第8図は本実施例で用いる標準人カバターンを示す図、 第9図は本実施例で用いられるOMRシートを示す図、 第10図は従来のパターン認識IA埋を示すフローチャ
ートである。 図中、1・・・ リーダ、2・・・光ディスク、3・・
・ホストコンピュータ、4・・・キーボード、5・・・
CRT、6・・・プリンタ、7・・・オートフィーダ、
5O−CPU、51・・・ROM、51 a−標準特徴
パターン記憶領域、52・・・CRTインタフェース、
53・・・キーボードインタフェース、54・・・光デ
ィスクインタフェース、55・・・リーグインタフェー
ス、56・・・プリンタインタフェース、57・・・R
AM、60・・・バスである。

Claims (3)

    【特許請求の範囲】
  1. (1)読取面上のパターン情報を光学的に読取る読取工
    程と、該工程に続き読み取つたパターン情報を所定の領
    域毎に分割する領域分割工程と、該領域分割工程で分割
    された各領域毎の一定範囲内の黒密度の連続を検出する
    検出工程と、該検出工程で検出した黒密度の連続を入力
    ストロークとして認識する認識工程とより成ることを特
    徴とするパターン情報認識方法。
  2. (2)認識工程での入力ストロークの認識は各領域内の
    黒密度の連続の分布ヒストグラムの最小値を当該領域の
    代表値とすることを特徴とする特許請求の範囲第1項記
    載パターン情報認識方法。
  3. (3)認識工程での入力ストロークの認識は各領域内の
    黒密度の連続の分布ヒストグラムの最大発生値を当該領
    域の代表値とすることを特徴とする特許請求の範囲第1
    項記載パターン情報認識方法。
JP61123705A 1986-05-30 1986-05-30 パタ−ン情報認識方法 Pending JPS62281091A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61123705A JPS62281091A (ja) 1986-05-30 1986-05-30 パタ−ン情報認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61123705A JPS62281091A (ja) 1986-05-30 1986-05-30 パタ−ン情報認識方法

Publications (1)

Publication Number Publication Date
JPS62281091A true JPS62281091A (ja) 1987-12-05

Family

ID=14867306

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61123705A Pending JPS62281091A (ja) 1986-05-30 1986-05-30 パタ−ン情報認識方法

Country Status (1)

Country Link
JP (1) JPS62281091A (ja)

Similar Documents

Publication Publication Date Title
EP0621542B1 (en) Method and apparatus for automatic language determination of a script-type document
JPH0564834B2 (ja)
JPS62281091A (ja) パタ−ン情報認識方法
JPS62281088A (ja) 画像処理方法
JPS62281089A (ja) 画像処理方法
JPS62281090A (ja) パタ−ン情報認識方法
JPS62281093A (ja) パタ−ン情報認識方法
JP2578767B2 (ja) 画像処理方法
JPS62281092A (ja) 画像処理方法
JPS62281094A (ja) パタ−ン情報認識方法
JP2578768B2 (ja) 画像処理方法
JPS6095689A (ja) 光学的文字読取装置
JPS62281095A (ja) パタ−ン情報認識方法
JPS60181880A (ja) 光学的文字入力装置
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JPS60138689A (ja) 文字認識方法
JPH0769938B2 (ja) 文字読取装置
JP2851865B2 (ja) 文字認識装置
JPS5914078A (ja) 帳票読取装置
JPH0484380A (ja) 文字認識装置
JPH01171080A (ja) 誤り自動訂正文字認識装置
JPH03123989A (ja) 文字認識装置
JPH0272497A (ja) 光学的文字読取装置
JPH0632074B2 (ja) 正規化方法