JPS62281094A

JPS62281094A - パタ−ン情報認識方法

Info

Publication number: JPS62281094A
Application number: JP61123708A
Authority: JP
Inventors: Shinko Ishitani; 石谷　新子; Toshiaki Yagasaki; 矢ケ崎　敏明; Yumie Gou; 郷　由美恵; Akihiko Uekusa; 植草　明彦
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1986-05-30
Filing date: 1986-05-30
Publication date: 1987-12-05

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】３、発明の詳細な説明［産業上の利用分野コ本発明は未知の英字、数字等の文字を自動的に読み取っ
て認識するパターン情報認識方法に関する。

［従来の技術］従来この種の文字認識装置のパターン情報認識処理を第
１０図に示す。

原稿用紙Ｐ上の文字をステップｓ８１に示す如く１文字
毎に読込んで光電変換し、これを更にステップＳ８２で
’１”　、”Ｏ”　の２値データツバターンに変換して
いる。続くステップＳ８３で、後に説明する処理を効果
的にするだめの前処理、即ちステップＳ８２で２値化さ
れたパターンに基づき文字が記録されている用紙Ｐ上の
黒点などのノイズ処理や文字図形境界面の平滑化などを
含む一連の処理がなされる。

次にステップＳ８４で文字認識を行うのに必要ないくつ
かの特徴（交点、分岐点、ループ数、ストロークの長さ
情報など）を抽出する特徴抽出処理が行われる。この抽
出結果に応じて、多数の文字より特徴が共通するいくつ
かの文字が選択される。

更に、ステップ３８５以下でその中から唯一の文字の選
択を行うための識別処理としての辞書照合処理、及び認
識処理がなされる。

まずステップＳ８５て抽出された特徴に従って辞書を誘
導（検索）することが可能か否かを調べる。ここで抽出
した特徴が辞書を誘導するに値しないものである場合に
はステップ３８８に進み、認識不能が出力される。一方
、抽出特徴点により辞書誘導可能てあればステップ３８
６で備えっけの辞書を検索し、先に抽出した特徴と順次
照合する。ステップＳ８７で照合の結果一致すると、ス
テップ３８８で当該一致した結果を認識出力として出力
する。一致がとれない場合には認識不能として出力する
。

［発明が解決しようとする問題点］ところが、この従来の認識方法によると、簡易な文字（
認識されやすい文字）、アルファベット、数字だけの場
合に対しても、前記の複雑な処理を行うため、処理時間
がかかり過ぎるという欠点があった。

又、上記処理を実現するための構成も複雑であり、コス
トアップや信頼性の点においても種々の問題点を抱えて
いた。

［問題点を解決するための手段］本発明は前記した従来時桁の問題点に鑑み成されたもの
で、上述の問題点を解決する一手段として以下の構成を
備える。

即ち、読取面上のパターン情報を光学的に読取る読取手
段と、該手段に続き読み取ったパターン情報を所定の領
域毎に分割する領域分割手段と、該領域分割手段で分割
された各領域毎の黒密度の量を検出する検出手段と、該
検出手段で検出した黒密度の最大値に基づいて読取りパ
ターンの認識を行なう認識手段とを備える。

［作用］以上の構成において、認識手段は検出手段で検出した黒
密度の最大値を、異なる複数の所定の量と比較した結果
により、分割領域の代表値を判別し、該代表値に基づぎ
パターン認識する。

［実施例］以下、図面を参照して本発明に係る一実施例を詳細に説
明する。

第１図は本発明の一実施例のブロック図であり、図中１
はＯＭＨによるキーワードを含む文書画像情報を読み込
み電気信号に変換するリーダ、２はリーダ１で読み取ま
た画像情報を記憶する光ディスク、３は本実施例全体を
制御するホストコンピュータ、４はキーボード、５は画
像情報やオペレーション情報等を表示するＣＲＴ、６は
画像情報等を印刷出力するプリンタである。また、７は
リーダ１の原稿読み取り面に原稿を１枚毎に自動送りす
るオートフィーダである。

ホストコンピュータ３において、５０はＲＯＭ５１に記
憶された第４図に示す制御プログラムに従って本装置全
体を制御するＣＰＵであり、ＣＰＵ５０は例えばモトロ
ーラ社製のマイクロコンピュータＭ　Ｃ’６８０００等
で構成することが望ましい。５１はＲＯＭであり、ＲＯ
Ｍ５１には標準特徴パターン記憶領域５１ａが含まれる
。５２はＣＲＴ５とのインタフェースを司どるＣＲＴイ
ンタフェース、５３はキーボード４とのインタフェース
を司どるキーボードインタフェース、５４は光ディスク
とのインタフェースを司どる光デイスクインタフェース
である。また、５５はリーダ１とのインタフェースを司
どるリーダインタフェース、５６はプリンタ６とのイン
タフェースを司どるプリンタインタフェース、５７は処
理経過や、読み取りマークの認識処理経過等の記憶され
るＲＡＭ、６０は各構成間を接続するバスである。

ＲＡＭ５７の詳細記憶領域を第２図に示す。

第２図において、２１はパターンバッファ、２２はライ
ンヒストグラムバッファ、２３は領域ヒストグラムバッ
ファ、２４はスレッシュホールドバッファ、２５は代表
値バッファである。

以上の構成を備える本実施例の外観図を第３図に示す。

図中第１図と同様構成については同一番号を付した。８
はリーダ１とホストコンピュータ３とのインタフェース
ケーブル、９はプリンタ６とホストコンピュータ３との
インタフェースケーブルである。

以上の構成を備える本実施例の動作を第４図のフローチ
ャートを参照して以下に説明する。

第４図においても第１０図と同様に、リーダ１にセット
された原稿上のＰに示すパターンを読み取り、認識する
処理を例に説明する。

まず、ステップＳ１でＣＰＵ５０はリーダインタフェー
ス５５を介してリーダ１を起動し、読み取り原稿面を走
査して原稿面の画像データを読み込む。

原稿面は例えば第９図に示すＯＭＲシートの下部に旧の
マークを配置し、該マーク上に活字パターンを第８図に
示すように塗る。そして、上記ＯＭＲシートは電子ファ
イルシステムのキーワードの登録、ファクシミリの電話
番号入力、複写機などの画像形成装置のコピ一枚数、縮
率などのモード設定用に使用する。

第８図に示すようなフォーマットを固定し、その上に定
形パターンの文字を書く方法を取ると、その後の処理は
より簡単になる。なお、第８図にはＡ″〜″Ｚ″及び１
″〜″０°′の定型パターンが示されている。第８図の
フォーマットの基本パターンはＸ方向３本、Ｘ方向３本
のストロークで構成された「田」の字と斜め２方のスト
リーグｒ　Ｘ　Ｊを組み合せた形の一部となっている。

このようにして書き込まれた原稿面のマーク位置の１文
字、例えばＡ”を読み込んだ場合を例に以下説明する。

ステップＳ１でリーダ１により光電変換されて読み込ま
れた信号は、ステップＳ２に示す如くリーグインタフェ
ース５５に送られ、リーダインタフェース５５に内蔵の
アナログ−デジタルコンバータにより’１”、”ｏ”の
２値パターンのデジタル信号に変換され、変換されたデ
ジタル信号はＣＰＵ５０に入力される。

ＣＰＵ５０は、このようにして人力されたデジタルデー
タな順次ＲＡＭ５７のパターンバッファ２１に格納する
。本実施例においては、文字パターンは１文字４８ビツ
トＸ４８ビツトの領域に区切られ、“Ａ゛°を読み込ん
だ場合の読み取りデータのパターンバッファ２１への格
納例を第５図に示す。

ＣＰＵ５０はステップＳ３で第５図に示す読取りパター
ンを第６図（Ａ）の１〜１０に示す各所定領域に分割す
る。続くステップＳ４で各ライン毎の横方向（Ｘ方向）
及び縦方向（Ｙ方向）のそれぞれに対しての°゛１′°
である黒密度（ストローク密度）の数を計数する。具体
的には第５図に示す如く、横方向の（Ｘ方向の）最上ラ
インの黒密度の数は’４８”、第４ラインは４゛″とな
り、縦方向の（Ｙ方向の）最左ライン及び次ラインの黒
密度の数は′４８°”第３ラインは゛４パとなる。そし
てステップＳ５でステップＳ４で求めた黒密度の数をＲ
ＡＭ５７のラインヒストダラムバツファ２２に格納する
。この各ラインの黒密度の数を各領域毎に計数した結果
を棒グラフの形で示したのが第６図（Ｂ）、（Ｃ）であ
る。

続いてステップＳ６で先に求めた所定領域内のライン毎
の黒密度の数の最大値を求め、この値を当該領域の代表
値としてＲＡ　Ｍ　５７の領域ヒストグラムバッファ２
３に格納する。エリア１においては黒密度の数の最大値
は’　４８　”となり、領域ヒストグラムバッファ２３
にはとの’　４８　”が格納される。同様にステップＳ
７で先に求めた所定領域におけるスレッシュボールドレ
ベルを設定する。

このスレッシュホールドレベルは、各領域毎に任意のレ
ベルを設定することができ、この領域毎に設定したスレ
ッシュホールドレベルはＲＡＭ５７のスレッシュホール
ドバッファ２４に格納される。例えば、領域１，３，５
，６，８．１０は横方向にＸｉ、Ｘ２．Ｘ３の３レベル
、縦方向にもｙＬ、Ｖ２．３’３の３レベルのスレッシ
ュホールドレベルを設定し、領域２，４，７．９は横方
向にｘ’ｌ、Ｘ’２．Ｘ′３．Ｘ’４．Ｘ′５の５レベ
ル、縦方向にもｙ’ｉ、：Ｙ′２．、Ｙ’３゜ｙ’４．
、Ｙ’５の５レベルのスレッシュホールドレベルを設定
する。これらの各値は任意に設定できるが、例えば、３
レベル時は１．６，３２．４８とし、５レベル時は９，
１９，２９，３９．４８とすればよい。そして、例えば
、３レベル時は代表値Ｐが（ｘｌ＞Ｐ）のときは１“°
となり、（Ｘ２　＜Ｐ　＜Ｘ３　）は２゛、（Ｘ３　＜
Ｐ）のときは３°゛となる。

次にステップＳ８でステップＳ６で求めた各領域の黒密
度の最大値に対して、ステップＳ７で設定したスレッシ
ュホールドレベルに従ってこれを対応する多値データに
変換し、これを当該領域の代表値としてＲＡＭ５７の読
み取りパターン２４に格納する。ここで、スレッシュホ
ールドレベルが３レベルの場合には代表値は３値となり
、スレッシュホールドレベルが５レベルの場合には代表
値は５値となる。

第６図（Ａ）に示す領域１，３．５においてはスレッシ
ュホールドレベルが３レベルであり、代表値は第６図（
Ｂ）に示すように、領域１．３゜５でそれぞれ３，３．
１となる。一方、領域２゜４においてはスレッシュホー
ルドレベルが５レベルであり、代表値は第６図（Ｃ）に
示すように、それぞれ２となる。同様に領域６〜１０に
ついても代表値を求める。そしてこのようにして求めら
れた代表値はＲＡＭ５７の代表値バッファ２５に格納す
る。従って代表値バッファ２５に格納される各代表値は
第７図（Ａ）に示すものとなる。

続くステップＳＩＯでＲＯＭ５１の標準特徴パターン５
１ａに記憶の標準パターンと、代表値バッファ２５に格
納されている読取りパターンの代表値とのマツチングを
行なう。その結果、ステップＳｌｌでパターンの一致が
得られれば、ステップＳ１２で一致の得られたパターン
の人力として認識し、結果を出力する。一方一致が得ら
れない場合にはステップＳ１３に進み、認識不能を出力
して処理を終了する。そして再び次のパターンの読み込
み処理等を実行する。

人力標準特徴パターン５１ａの°Ａ°′の標準パターン
は第７図（Ｂ）に示すパターンであり、第７図（Ａ）に
示す読取りパターンの代表値と一致し、第７図（Ａ）の
入カバターンは°゛ＡＡパ力であると認識される。

以上説明した様に木実流側によれば、例えば第５図に示
す文字パターンを認識する上で、次のような効果が考え
られる。

■所定の領域での黒密度（ストローク密度）の最大値を
代表値とじて、かつこの値を所定のスレッシュホールド
レベルで３値化することにより、領域内の誤読取である
ゴミ等の読み取りを除去するという効果を含んでいる。

このため、第６図（Ａ）の６１の如く、領域内ゴミ等が
あって当該ラインの黒密度の数が多少変化しても、その
影響を防ぐことかでき、正確な文字認識が可能となる。

■さらに、照合されるデータ量が少ないため、処理時間
が大幅に削減され、第７図（Ａ）のパターンと第７図（
Ｂ）に示す標準特徴パターンという少量のデータの照合
のみで認識が可能となる。

このように、文字認識装置の簡易な文字の認識における
欠点を解消し、簡易な文字の認識に必要な処理時間を短
縮し、高速、かつ、高精度の文字認識が可能となる。

更に、定形パターン（活字型）の数字、もしくはアルフ
ァベットの文字を、高速かつ高精度に認識することがで
きる。

また、以上の説明において、スレッシュホールドレベル
の選定を、３レベルでの値が低い場合に更にスレッシュ
ホールドレベルの数を増やし、５レベルにする等して認
識精度を上げるよう制御してもよい。

［又明の効果］以上説明した如く、本発明によれば、非常に短時間で、
かつ正確なパターン認識処理が行なえる。

【図面の簡単な説明】

第１図は本発明に係る一実施例のブロック図、第２図は
第１図に示すＲＡＭの詳細構成図、第３図は本実施例の
外観図、第４図は本実施例のパターン認識制御フローチャート、第５図は本実施例のパターンバッファへの読取りパター
ン格納例を示す図、第６図（Ａ）〜（Ｃ）は本実施例によるパターン゛Ａ″
の認識処理及びスレッシュホールドレベルの設定例を説
明するための図、第７図（Ａ）は本実施例の“Ａ”読み取り時の読取りパ
ターンの代表値を示す図、第７図（Ｂ）は標準特徴パターンにおける”　Ａ　”の
格納パターンを示す図、第８図は本実施例で用いる標準入カバターンを示す図、第９図は本実施例で用いられるＯＭＲシートを示す図、第１０図は従来のパターン認識処理を示すフローチャー
トである。図中、１・・・　リーダ、２・・・光ディスク、３・・
・ホストコンピュータ、４・・・キーボード、５・・・
ＣＲＴ、６・・・プリンタ、７・・・オートフィーダ、
５０・＝ＣＰＵ、５１−ＲＯＭ、５１　ａ−標準特徴パ
ターン記憶領域、５２・・・ＣＲＴインタフェース、５
３・・・キーボードインタフェース、５４・・・光デイ
スクインタフェース、５５・・・リーダインタフェース
、５６・・・プリンタインタフェース、５７・・・ＲＡ
Ｍ、６０・・・バスである。特開臼’ｔＧ２−２８１０９４　　（８）第６図（Ａ）第６図（Ｂ）第６図　（Ｃ）

Claims

【特許請求の範囲】

（１）読取面上のパターン情報を光学的に読取る読取工
程と、該工程に続き読み取つたパターン情報を所定の領
域毎に分割する領域分割工程と、該領域分割工程で分割
された各領域毎の黒密度の量を検出する検出工程と、該
検出工程で検出した黒密度の最大値を異なる複数の所定
の量と比較した結果により前記分割領域の代表値を判別
し、該代表値に基づきパターン認識する認識工程とより
成ることを特徴とするパターン情報認識方法。
（２）認識工程における複数の所定量の数は分割領域に
より異なることを特徴とする特許請求の範囲第１項記載
のパターン情報認識方法。
（３）認識工程における分割領域の代表値は複数の所定
量の数に従つた多値の値を有することを特徴とする特許
請求の範囲第２項記載のパターン情報認識方法。