JPH0776979B2

JPH0776979B2 - 画像処理方法

Info

Publication number: JPH0776979B2
Application number: JP61123706A
Authority: JP
Inventors: 新子石谷; 敏明矢ケ崎; 由美恵郷; 明彦植草
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1986-05-30
Filing date: 1986-05-30
Publication date: 1995-08-16
Anticipated expiration: 2010-08-16
Also published as: JPS62281092A

Description

【発明の詳細な説明】［産業上の利用分野］本発明は原稿画像情報を自動的に読み取つて処理する画
像処理方法に関するものである。

［従来の技術］従来この種の文字認識装置のパターン情報認識処理を第
10図に示す。

原稿用紙Ｐ上の文字をステツプS81に示す如く１文字毎
に読込んで光電変換し、これを更にステツプS82で“1",
“0"の２値データのパターンに変換している。続くステ
ツプS83で、後に説明する処理を効果的にするための前
処理、即ちステツプS82で２値化されたパターンに基づ
き文字が記録されている用紙Ｐ上の黒点などのノイズ処
理や文字図形境界面の平滑化などを含む一連の処理がな
される。次にステツプS84で文字認識を行うのに必要な
いくつかの特徴（交点、分岐点、ループ数、ストローク
の長さ情報など）を抽出する特徴抽出処理が行われる。
この抽出結果に応じて、多数の文字より特徴が共通する
いくつかの文字が選択される。次に、ステツプS85以下
でその中から唯一の文字の選択を行うための識別処理と
しての辞書照合処理、及び認識処理がなされる。

まずステツプS85で抽出された特徴に従つて辞書を誘導
（検索）することが可能か否かを調べる。ここで抽出し
た特徴が辞書を誘導するに値しないものである場合には
ステツプS88に進み、認識不能が出力される。一方、抽
出特徴点により辞書誘導可能であればステツプS86で備
えつけの辞書を検索し、先に抽出した特徴と順次照合す
る。ステツプS87で照合の結果一致すると、ステツプS88
で当該一致した結果を認識出力として出力する。一致が
とれない場合には認識不能として出力する。

［発明が解決しようとする問題点］ところが、この従来の認識方法によると、簡易な文字
（認識されやすい文字）、アルフアベツト、数字だけの
場合に対しても、前記の複雑な処理を行うため、処理時
間がかかり過ぎるという欠点があつた。

又、上記処理を実現するための構成も複雑であり、コス
トアツプや信頼性の点においても種々の問題点を抱えて
いた。

［問題点を解決するための手段］本発明は前記した従来技術の問題点に鑑み成されたもの
で、上述の問題点を解決する一手段として以下の構成を
備える。

即ち、原稿を光学的に読み取る読み取り手段と、該読み
取り手段で読み取つた原稿画像情報を所定の領域に分割
する分割手段と、該分割手段で分割した各領域毎に、所
定数のライン上に現われる黒画素個数を検出する検出手
段と、該検出手段で検出した黒画素の個数の最大値を当
該領域の代表値として決定する決定手段とを備える。

［作用］以上の構成において、原稿を光学的に読み取つた画像情
報を入力し、前記入力した画像情報を所定の領域に分割
し、前記分割された各領域毎に、所定数のライン上に現
われる連続する黒画素個数を検出し、前記検出した黒画
素の個数の最大値を当該領域の代表値として決定するこ
とにより、非常に短時間で、かつ正確なパターン認識処
理が行える。

［実施例］以下、図面を参照して本発明に係る一実施例を詳細に説
明する。

第１図は本発明の一実施例のブロツク図であり、図中１
はOMRによるキーワードを含む文書画像情報を読み込み
電気信号に変換するリーダ、２はリーダ１で読み取つた
画像情報を記憶する光デイスク、３は本実施例全体を制
御するホストコンピユータ、４はキーボード、５は画像
情報やオペレーシヨン情報等を表示するCRT、６は画像
情報等を印刷出力するプリンタである。また、７はリー
ダ１の原稿読み取り面に原稿を１枚毎に自動送りするオ
ートフイーダである。

ホストコンピユータ３において、50はROM51に記憶され
た第４図に示す制御プログラムに従つて本装置全体を制
御するCPUであり、CPU50は例えばモトローラ社製のマイ
クロコンピユータMC68000等で構成することが望まし
い。51はROMであり、ROM51には標準特徴パターン記憶領
域51aが含まれる。52はCRT5とのインタフエースを司ど
るCRTインタフエース、53はキーボード４とのインタフ
エースを司どるキーボードインタフエース、54は光デイ
スクとのインタフエースを司どる光デイスクインタフエ
ースである。また、55はリーダ１とのインタフエースを
司どるリーダインタフエース、56はプリンタ６とのイン
タフエースを司どるプリンタインタフエース、57は処理
経過や、読み取りマークの認識処理経過等の記憶される
RAM、60は各構成間を接続するバスである。

RAM57の詳細記憶領域を第２図に示す。

第２図において、21はパターンバツフア、22はラインヒ
ストグラムバツフア、23は領域ヒストグラムバツフア、
24は読取りパターンである。

以上の構成を備える本実施例の外観図を第３図に示す。

図中第１図と同様構成については同一番号を付した。８
はリーダ１とホストコンピユータ３とのインタフエース
ケーブル、９はプリンタ６とホストコンピユータ３との
インタフエースケーブルである。

以上の構成を備える本実施例の動作を第４図のフローチ
ヤートを参照して以下に説明する。

第４図においても第10図と同様に、リーダ１にセツトさ
れた原稿上のＰに示すパターンを読み取り、認識する処
理を例に説明する。

まず、ステツプS1でCPU50はリーダインタフエース55を
介してリーダ１を起動し、読み取り原稿面を走査して原
稿面の画像データを読み込む。

原稿面は例えば第８図に示すOMRシートの下部にのマークを配置し、該マーク上に活字パターンを第９図
に示すように塗る。そして、上記OMRシートは電子フア
イルシステムのキーワードの登録、フアクシミリの電話
番号入力、複写機などの画像形勢装置のコピー枚数、縮
率などのモード設定用に使用する。

第９図に示すようなフオーマツトを固定し、その上に定
形パターンの文字を書く方法を取ると、その後の処理は
より簡単になる。なお、第９図には“A"〜“Z"及び“1"
〜“0"の定型パターンが示されている。第９図のフオー
マツトの基本パターンはｘ方向３本、ｙ方向３本のスト
ロークで構成された「田」の字と斜め２方のストローク
「Ｘ」をく組み合せた形の一部となつている。

このようにして書き込まれた原稿面のマーク位置の１文
字、例えば“A"を読み込んだ場合を例に以下説明する。

ステツプS1でリーダ１により光電変換されて読み込まれ
た信号は、ステツプS2に示す如くリーダインタフエース
55に送られ、リーダインタフエース55に内蔵のアナログ
ーデジタルコンバータにより“1",“0"の２値パターン
のデジタル信号に変換され、変換されたデジタル信号は
CPU50に入力される。

CPU50は、このようにして入力されたデジタルデータを
順次RAM57のパターンバツフア21に格納する。本実施例
においては、文字パターンは１文字48ビツト×48ビツト
の領域に区切られ、“A"を読み込んだ場合の読み取りデ
ータのパターンバツフア21への格納例を第５図に示す。

CPU50はステツプS3で各ライン毎の横方向（Ｘ方向）及
び縦方向（Ｙ方向）のそれぞれに対しての“1"である黒
密度（ストローク密度）の数を計数する。具体的には第
５図に示す如く、横方向の（Ｘ方向の）第１ラインの黒
密度の数は“48"、第４ラインは“4"となり、縦方向の
（Ｙ方向の）第１ライン及び次ラインの黒密度の数は
“48"第３ラインは“4"となる。そしてステツプS4で求
めた黒密度の数をRAM57のラインヒストグラムバツフア2
2に格納する。次のステツプS5で、第５図に示す読取り
パターンを、第６図（Ａ）の１〜10に示す各所定領域に
分割する。この黒密度の数を各領域毎に計数した結果
を、棒グラフの形で示したのが第６図（Ｂ）、（Ｃ）で
ある。

続いてステツプS6で先に求めた所定領域内のライン毎の
黒密度の数の最大値を求め、この値を当該領域の代表値
としてRAM57の領域ヒストグラムバツフア23に格納す
る。エリア１においては黒密度の数の最大値は“48"と
なり、領域ヒストグラムバツフア23にはこの“48"が格
納される。同様にステツプS7で先に求めた所定領域内の
ライン毎の黒密度の数の平均値を求め、この値を当該領
域の代表値としてステツプS6と同様にRAM57の領域ヒス
トグラムバツフア23に格納する。領域（エリア）２が第
10ライン〜20ラインであるとすると、この間に第６図
（Ａ）の61に示すゴミ（例えば、２×２の４ビツト）等
が読み取られた場合においても、当該エリアの黒密度の
量は（８×10＋２）82ビツトであり、エリア２の黒密度
の平均値は8.2となる。

次に、ステツプS8において、ステツプS5で分割した各領
域におけるスレツシユホールドレベルを設定する。例え
ば横方向においてはx1,x2,x3の、縦方向においてはy1,y
2,y3の各スレツシユホールドレベルを設定する。これら
の各値は任意に設定できるが、例えばそれぞれ16,32,48
としてもよい。

次にステツプS9で領域ヒストグラムバツフア23に格納し
た各領域の最大値及び平均値のうち１つを選択し、選択
した値をステツプS8で設定したスレツシユホールドレベ
ルに従い多値化して領域毎の代表値を求める。そして求
めた代表値を代表値バツフア25に格納する。

領域を第６図（Ａ）に示す如く分割した場合には、領域
１においては入力されるストローク（黒密度）の最大値
は全領域に渡り、０ビツトから最大48ビツトとなる。一
方、領域２については、第９図に示すように枠１つ〜枠
４つ分の４通りのストローク入力が考えられる。同様に
領域３及び５は最大48ビツトとなり、領域４においては
領域２と同様となる。このため、第９図に示す入力スト
ロークの枠の幅が４ビツトである場合には、各領域のス
トロークの最大値は領域1,3,5において48ビツト、領域
2,4において16ビツトとなる。従つて領域1,3,5,6,8,10
においては最大値、領域2,4,7,9においては平均値をと
ることにより、ゴミ等の影響の少ない、かつ高精度のも
のとすることができる。このようにして特定した各領域
の値に対して、ステツプS8で設定したスレツシユホール
ドレベルに従つてこれを３値化する。

即ち、代表値Ｐが（x1＞Ｐ）の時は“1"、（x2＜Ｐ＜x3
9の時は“2"、（x3＜Ｐ）の時は“3"となる。ここで、
第６図（Ａ）に示す領域１〜５においては各領域の代表
値は第６図（Ｂ）に示す如く、“3",“1",“3",“1",
“1"となり、領域６〜10においては各領域の代表値は、
第６図（Ｃ）に示す如く“3",“1",“1",“1",“3"とな
る。従つて読み取りパターンに格納される各代表値は第
７図（Ａ）に示すものとなる。

続くステツプS10でROM51の標準特徴パターン51aに記憶
の標準パターンと、読取りパターン24に格納されている
読取りパターンとのマツチングを行なう。その結果、ス
テツプS11でパターンの一致が得られれば、ステツプS12
で一致の得られたパターンの入力として認識し、結果を
出力する。一方一致が得られない場合にはステツプ13に
進み、認識不能を出力して処理を終了する。そして再び
次のパターンの読み込み処理等を実行する。

入力標準特徴パターン51aの“A"の標準パターンは第７
図（Ｂ）に示すパターンであり、第７図（Ａ）に示す読
取りパターンと一致し、第７第４図においても第10図と
同様に、リーダ１にセツトされた原稿上のＰに示すパタ
ーンを読み取り、認識する処理を例に説明する。

以上説明した様に本実施例によれば、例えば第５図に示
す文字パターンを認識する上で、次のような効果が考え
られる。

所定の領域での黒密度（ストローク密度）の最大値
を代表値として、かつこの値を所定のスレツシユホール
ドレベルで３値化することにより、領域内の誤読取であ
るゴミ等の読み取りを除去するという効果を含んでい
る。このため、第６図（Ａ）の61の如く、領域内ゴミ等
があつて当該ラインの黒密度の数が多少変化しても、そ
の影響を防ぐことができ、正確な文字認識が可能とな
る。

さらに、照合されるデータ量が少ないため、処理時
間が大幅に削減され、第７図（Ａ）のパターンと第７図
（Ｂ）に示す標準特徴パターンという少量のデータの照
合のみで認識が可能となる。

このように、文字認識装置の簡易な文字の認識における
欠点を解消し、簡易な文字の認識に必要な処理時間を短
縮し、高速、かつ、高精度の文字認識が可能となる。

更に、定形パターン（活字型）の数字、もしくはアルフ
アベツトの文字を、高速かつ高精度に認識することがで
きる。

［発明の効果］以上説明した如く、本発明によれば、非常に短時間で、
かつ正確なパターン認識処理が行なえる。

【図面の簡単な説明】

第１図は本発明に係る一実施例のブロツク図、第２図は第１図に示すRAMの詳細構成図、第３図は本実施例の外観図、第４図は本実施例のパターン認識制御フローチヤート、第５図は本実施例のパターンバツフアへの読取パターン
格納例を示す図、第６図（Ａ）〜（Ｃ）は本実施例によるパターン“A"の
認識処理を説明するための図、第７図（Ａ）は本実施例の“A"読み取り時の読取りパタ
ーンの代表値を示す図、第７図は（Ｂ）は標準特徴パターンにおける“A"の格納
パターンを示す図、第８図は本実施例で用いられるOMRシートを示す図、第９図は本実施例で用いる標準入力パターンを示す図、第10図は従来のパターン認識処理を示すフローチヤート
である。図中、１……リーダ、２……光デイスク、３……ホスト
コンピユータ、４……キーボード、５……CRT、６……
プリンタ、７……オートフイーダ、50……CPU、51……R
OM、51a……標準特徴パターン記憶領域、52……CRTイン
タフエース、53……キーボードインタフエース、54……
光デイスクインタフエース、55……リーダインタフエー
ス、56……プリンタインタフエース、57……RAM、60…
…バスである。

フロントページの続き (72)発明者植草明彦東京都大田区下丸子３丁目30番２号キヤノン株式会社内 (56)参考文献特開昭57−45682（ＪＰ，Ａ)

Claims

【特許請求の範囲】

【請求項１】原稿を光学的に読み取つた画像情報を入力
し、前記入力した画像情報を所定の領域に分割し、前記分割された各領域毎に、所定数のライン上に現われ
る黒画素個数を検出し、前記検出した黒画素の個数の最大値を当該領域の代表値
として決定することを特徴とする画像処理方法。