JPS62281094A - パタ−ン情報認識方法 - Google Patents

パタ−ン情報認識方法

Info

Publication number
JPS62281094A
JPS62281094A JP61123708A JP12370886A JPS62281094A JP S62281094 A JPS62281094 A JP S62281094A JP 61123708 A JP61123708 A JP 61123708A JP 12370886 A JP12370886 A JP 12370886A JP S62281094 A JPS62281094 A JP S62281094A
Authority
JP
Japan
Prior art keywords
pattern
area
value
recognition
pattern information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61123708A
Other languages
English (en)
Inventor
Shinko Ishitani
石谷 新子
Toshiaki Yagasaki
矢ケ崎 敏明
Yumie Gou
郷 由美恵
Akihiko Uekusa
植草 明彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP61123708A priority Critical patent/JPS62281094A/ja
Publication of JPS62281094A publication Critical patent/JPS62281094A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 3、発明の詳細な説明 [産業上の利用分野コ 本発明は未知の英字、数字等の文字を自動的に読み取っ
て認識するパターン情報認識方法に関する。
[従来の技術] 従来この種の文字認識装置のパターン情報認識処理を第
10図に示す。
原稿用紙P上の文字をステップs81に示す如く1文字
毎に読込んで光電変換し、これを更にステップS82で
’1” 、”O” の2値データツバターンに変換して
いる。続くステップS83で、後に説明する処理を効果
的にするだめの前処理、即ちステップS82で2値化さ
れたパターンに基づき文字が記録されている用紙P上の
黒点などのノイズ処理や文字図形境界面の平滑化などを
含む一連の処理がなされる。
次にステップS84で文字認識を行うのに必要ないくつ
かの特徴(交点、分岐点、ループ数、ストロークの長さ
情報など)を抽出する特徴抽出処理が行われる。この抽
出結果に応じて、多数の文字より特徴が共通するいくつ
かの文字が選択される。
更に、ステップ385以下でその中から唯一の文字の選
択を行うための識別処理としての辞書照合処理、及び認
識処理がなされる。
まずステップS85て抽出された特徴に従って辞書を誘
導(検索)することが可能か否かを調べる。ここで抽出
した特徴が辞書を誘導するに値しないものである場合に
はステップ388に進み、認識不能が出力される。一方
、抽出特徴点により辞書誘導可能てあればステップ38
6で備えっけの辞書を検索し、先に抽出した特徴と順次
照合する。ステップS87で照合の結果一致すると、ス
テップ388で当該一致した結果を認識出力として出力
する。一致がとれない場合には認識不能として出力する
[発明が解決しようとする問題点] ところが、この従来の認識方法によると、簡易な文字(
認識されやすい文字)、アルファベット、数字だけの場
合に対しても、前記の複雑な処理を行うため、処理時間
がかかり過ぎるという欠点があった。
又、上記処理を実現するための構成も複雑であり、コス
トアップや信頼性の点においても種々の問題点を抱えて
いた。
[問題点を解決するための手段] 本発明は前記した従来時桁の問題点に鑑み成されたもの
で、上述の問題点を解決する一手段として以下の構成を
備える。
即ち、読取面上のパターン情報を光学的に読取る読取手
段と、該手段に続き読み取ったパターン情報を所定の領
域毎に分割する領域分割手段と、該領域分割手段で分割
された各領域毎の黒密度の量を検出する検出手段と、該
検出手段で検出した黒密度の最大値に基づいて読取りパ
ターンの認識を行なう認識手段とを備える。
[作用] 以上の構成において、認識手段は検出手段で検出した黒
密度の最大値を、異なる複数の所定の量と比較した結果
により、分割領域の代表値を判別し、該代表値に基づぎ
パターン認識する。
[実施例] 以下、図面を参照して本発明に係る一実施例を詳細に説
明する。
第1図は本発明の一実施例のブロック図であり、図中1
はOMHによるキーワードを含む文書画像情報を読み込
み電気信号に変換するリーダ、2はリーダ1で読み取ま
た画像情報を記憶する光ディスク、3は本実施例全体を
制御するホストコンピュータ、4はキーボード、5は画
像情報やオペレーション情報等を表示するCRT、6は
画像情報等を印刷出力するプリンタである。また、7は
リーダ1の原稿読み取り面に原稿を1枚毎に自動送りす
るオートフィーダである。
ホストコンピュータ3において、50はROM51に記
憶された第4図に示す制御プログラムに従って本装置全
体を制御するCPUであり、CPU50は例えばモトロ
ーラ社製のマイクロコンピュータM C’68000等
で構成することが望ましい。51はROMであり、RO
M51には標準特徴パターン記憶領域51aが含まれる
。52はCRT5とのインタフェースを司どるCRTイ
ンタフェース、53はキーボード4とのインタフェース
を司どるキーボードインタフェース、54は光ディスク
とのインタフェースを司どる光デイスクインタフェース
である。また、55はリーダ1とのインタフェースを司
どるリーダインタフェース、56はプリンタ6とのイン
タフェースを司どるプリンタインタフェース、57は処
理経過や、読み取りマークの認識処理経過等の記憶され
るRAM、60は各構成間を接続するバスである。
RAM57の詳細記憶領域を第2図に示す。
第2図において、21はパターンバッファ、22はライ
ンヒストグラムバッファ、23は領域ヒストグラムバッ
ファ、24はスレッシュホールドバッファ、25は代表
値バッファである。
以上の構成を備える本実施例の外観図を第3図に示す。
図中第1図と同様構成については同一番号を付した。8
はリーダ1とホストコンピュータ3とのインタフェース
ケーブル、9はプリンタ6とホストコンピュータ3との
インタフェースケーブルである。
以上の構成を備える本実施例の動作を第4図のフローチ
ャートを参照して以下に説明する。
第4図においても第10図と同様に、リーダ1にセット
された原稿上のPに示すパターンを読み取り、認識する
処理を例に説明する。
まず、ステップS1でCPU50はリーダインタフェー
ス55を介してリーダ1を起動し、読み取り原稿面を走
査して原稿面の画像データを読み込む。
原稿面は例えば第9図に示すOMRシートの下部に旧の
マークを配置し、該マーク上に活字パターンを第8図に
示すように塗る。そして、上記OMRシートは電子ファ
イルシステムのキーワードの登録、ファクシミリの電話
番号入力、複写機などの画像形成装置のコピ一枚数、縮
率などのモード設定用に使用する。
第8図に示すようなフォーマットを固定し、その上に定
形パターンの文字を書く方法を取ると、その後の処理は
より簡単になる。なお、第8図にはA″〜″Z″及び1
″〜″0°′の定型パターンが示されている。第8図の
フォーマットの基本パターンはX方向3本、X方向3本
のストロークで構成された「田」の字と斜め2方のスト
リーグr X Jを組み合せた形の一部となっている。
このようにして書き込まれた原稿面のマーク位置の1文
字、例えばA”を読み込んだ場合を例に以下説明する。
ステップS1でリーダ1により光電変換されて読み込ま
れた信号は、ステップS2に示す如くリーグインタフェ
ース55に送られ、リーダインタフェース55に内蔵の
アナログ−デジタルコンバータにより’1”、”o”の
2値パターンのデジタル信号に変換され、変換されたデ
ジタル信号はCPU50に入力される。
CPU50は、このようにして人力されたデジタルデー
タな順次RAM57のパターンバッファ21に格納する
。本実施例においては、文字パターンは1文字48ビツ
トX48ビツトの領域に区切られ、“A゛°を読み込ん
だ場合の読み取りデータのパターンバッファ21への格
納例を第5図に示す。
CPU50はステップS3で第5図に示す読取りパター
ンを第6図(A)の1〜10に示す各所定領域に分割す
る。続くステップS4で各ライン毎の横方向(X方向)
及び縦方向(Y方向)のそれぞれに対しての°゛1′°
である黒密度(ストローク密度)の数を計数する。具体
的には第5図に示す如く、横方向の(X方向の)最上ラ
インの黒密度の数は’48”、第4ラインは4゛″とな
り、縦方向の(Y方向の)最左ライン及び次ラインの黒
密度の数は′48°”第3ラインは゛4パとなる。そし
てステップS5でステップS4で求めた黒密度の数をR
AM57のラインヒストダラムバツファ22に格納する
。この各ラインの黒密度の数を各領域毎に計数した結果
を棒グラフの形で示したのが第6図(B)、(C)であ
る。
続いてステップS6で先に求めた所定領域内のライン毎
の黒密度の数の最大値を求め、この値を当該領域の代表
値としてRA M 57の領域ヒストグラムバッファ2
3に格納する。エリア1においては黒密度の数の最大値
は’ 48 ”となり、領域ヒストグラムバッファ23
にはとの’ 48 ”が格納される。同様にステップS
7で先に求めた所定領域におけるスレッシュボールドレ
ベルを設定する。
このスレッシュホールドレベルは、各領域毎に任意のレ
ベルを設定することができ、この領域毎に設定したスレ
ッシュホールドレベルはRAM57のスレッシュホール
ドバッファ24に格納される。例えば、領域1,3,5
,6,8.10は横方向にXi、X2.X3の3レベル
、縦方向にもyL、V2.3’3の3レベルのスレッシ
ュホールドレベルを設定し、領域2,4,7.9は横方
向にx’l、X’2.X′3.X’4.X′5の5レベ
ル、縦方向にもy’i、:Y′2.、Y’3゜y’4.
、Y’5の5レベルのスレッシュホールドレベルを設定
する。これらの各値は任意に設定できるが、例えば、3
レベル時は1.6,32.48とし、5レベル時は9,
19,29,39.48とすればよい。そして、例えば
、3レベル時は代表値Pが(xl>P)のときは1“°
となり、(X2 <P <X3 )は2゛、(X3 <
P)のときは3°゛となる。
次にステップS8でステップS6で求めた各領域の黒密
度の最大値に対して、ステップS7で設定したスレッシ
ュホールドレベルに従ってこれを対応する多値データに
変換し、これを当該領域の代表値としてRAM57の読
み取りパターン24に格納する。ここで、スレッシュホ
ールドレベルが3レベルの場合には代表値は3値となり
、スレッシュホールドレベルが5レベルの場合には代表
値は5値となる。
第6図(A)に示す領域1,3.5においてはスレッシ
ュホールドレベルが3レベルであり、代表値は第6図(
B)に示すように、領域1.3゜5でそれぞれ3,3.
1となる。一方、領域2゜4においてはスレッシュホー
ルドレベルが5レベルであり、代表値は第6図(C)に
示すように、それぞれ2となる。同様に領域6〜10に
ついても代表値を求める。そしてこのようにして求めら
れた代表値はRAM57の代表値バッファ25に格納す
る。従って代表値バッファ25に格納される各代表値は
第7図(A)に示すものとなる。
続くステップSIOでROM51の標準特徴パターン5
1aに記憶の標準パターンと、代表値バッファ25に格
納されている読取りパターンの代表値とのマツチングを
行なう。その結果、ステップSllでパターンの一致が
得られれば、ステップS12で一致の得られたパターン
の人力として認識し、結果を出力する。一方一致が得ら
れない場合にはステップS13に進み、認識不能を出力
して処理を終了する。そして再び次のパターンの読み込
み処理等を実行する。
人力標準特徴パターン51aの°A°′の標準パターン
は第7図(B)に示すパターンであり、第7図(A)に
示す読取りパターンの代表値と一致し、第7図(A)の
入カバターンは°゛AAパ力であると認識される。
以上説明した様に木実流側によれば、例えば第5図に示
す文字パターンを認識する上で、次のような効果が考え
られる。
■所定の領域での黒密度(ストローク密度)の最大値を
代表値とじて、かつこの値を所定のスレッシュホールド
レベルで3値化することにより、領域内の誤読取である
ゴミ等の読み取りを除去するという効果を含んでいる。
このため、第6図(A)の61の如く、領域内ゴミ等が
あって当該ラインの黒密度の数が多少変化しても、その
影響を防ぐことかでき、正確な文字認識が可能となる。
■さらに、照合されるデータ量が少ないため、処理時間
が大幅に削減され、第7図(A)のパターンと第7図(
B)に示す標準特徴パターンという少量のデータの照合
のみで認識が可能となる。
このように、文字認識装置の簡易な文字の認識における
欠点を解消し、簡易な文字の認識に必要な処理時間を短
縮し、高速、かつ、高精度の文字認識が可能となる。
更に、定形パターン(活字型)の数字、もしくはアルフ
ァベットの文字を、高速かつ高精度に認識することがで
きる。
また、以上の説明において、スレッシュホールドレベル
の選定を、3レベルでの値が低い場合に更にスレッシュ
ホールドレベルの数を増やし、5レベルにする等して認
識精度を上げるよう制御してもよい。
[又明の効果] 以上説明した如く、本発明によれば、非常に短時間で、
かつ正確なパターン認識処理が行なえる。
【図面の簡単な説明】
第1図は本発明に係る一実施例のブロック図、第2図は
第1図に示すRAMの詳細構成図、第3図は本実施例の
外観図、 第4図は本実施例のパターン認識制御フローチャート、 第5図は本実施例のパターンバッファへの読取りパター
ン格納例を示す図、 第6図(A)〜(C)は本実施例によるパターン゛A″
の認識処理及びスレッシュホールドレベルの設定例を説
明するための図、 第7図(A)は本実施例の“A”読み取り時の読取りパ
ターンの代表値を示す図、 第7図(B)は標準特徴パターンにおける” A ”の
格納パターンを示す図、 第8図は本実施例で用いる標準入カバターンを示す図、 第9図は本実施例で用いられるOMRシートを示す図、 第10図は従来のパターン認識処理を示すフローチャー
トである。 図中、1・・・ リーダ、2・・・光ディスク、3・・
・ホストコンピュータ、4・・・キーボード、5・・・
CRT、6・・・プリンタ、7・・・オートフィーダ、
50・=CPU、51−ROM、51 a−標準特徴パ
ターン記憶領域、52・・・CRTインタフェース、5
3・・・キーボードインタフェース、54・・・光デイ
スクインタフェース、55・・・リーダインタフェース
、56・・・プリンタインタフェース、57・・・RA
M、60・・・バスである。 特開臼’tG2−281094  (8)第6図(A) 第6図(B) 第6図 (C)

Claims (3)

    【特許請求の範囲】
  1. (1)読取面上のパターン情報を光学的に読取る読取工
    程と、該工程に続き読み取つたパターン情報を所定の領
    域毎に分割する領域分割工程と、該領域分割工程で分割
    された各領域毎の黒密度の量を検出する検出工程と、該
    検出工程で検出した黒密度の最大値を異なる複数の所定
    の量と比較した結果により前記分割領域の代表値を判別
    し、該代表値に基づきパターン認識する認識工程とより
    成ることを特徴とするパターン情報認識方法。
  2. (2)認識工程における複数の所定量の数は分割領域に
    より異なることを特徴とする特許請求の範囲第1項記載
    のパターン情報認識方法。
  3. (3)認識工程における分割領域の代表値は複数の所定
    量の数に従つた多値の値を有することを特徴とする特許
    請求の範囲第2項記載のパターン情報認識方法。
JP61123708A 1986-05-30 1986-05-30 パタ−ン情報認識方法 Pending JPS62281094A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61123708A JPS62281094A (ja) 1986-05-30 1986-05-30 パタ−ン情報認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61123708A JPS62281094A (ja) 1986-05-30 1986-05-30 パタ−ン情報認識方法

Publications (1)

Publication Number Publication Date
JPS62281094A true JPS62281094A (ja) 1987-12-05

Family

ID=14867382

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61123708A Pending JPS62281094A (ja) 1986-05-30 1986-05-30 パタ−ン情報認識方法

Country Status (1)

Country Link
JP (1) JPS62281094A (ja)

Similar Documents

Publication Publication Date Title
EP0621542B1 (en) Method and apparatus for automatic language determination of a script-type document
US4944022A (en) Method of creating dictionary for character recognition
US20040213458A1 (en) Image processing method and system
JPS63158678A (ja) 単語間スペ−ス検出方法
JPH0430070B2 (ja)
JPS6141029B2 (ja)
JPS62281094A (ja) パタ−ン情報認識方法
JPS62281093A (ja) パタ−ン情報認識方法
JPS62281095A (ja) パタ−ン情報認識方法
JP2578767B2 (ja) 画像処理方法
JPS62281092A (ja) 画像処理方法
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JP2578768B2 (ja) 画像処理方法
JPS62281091A (ja) パタ−ン情報認識方法
JPS62281090A (ja) パタ−ン情報認識方法
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JPS62281089A (ja) 画像処理方法
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JPH0778820B2 (ja) 画像処理方法
JPS5914078A (ja) 帳票読取装置
JP3090928B2 (ja) 文字認識装置
JPH0514952B2 (ja)
JPH0259504B2 (ja)