JPH0776979B2 - 画像処理方法 - Google Patents

画像処理方法

Info

Publication number
JPH0776979B2
JPH0776979B2 JP61123706A JP12370686A JPH0776979B2 JP H0776979 B2 JPH0776979 B2 JP H0776979B2 JP 61123706 A JP61123706 A JP 61123706A JP 12370686 A JP12370686 A JP 12370686A JP H0776979 B2 JPH0776979 B2 JP H0776979B2
Authority
JP
Japan
Prior art keywords
pattern
area
interface
reading
black
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP61123706A
Other languages
English (en)
Other versions
JPS62281092A (ja
Inventor
新子 石谷
敏明 矢ケ崎
由美恵 郷
明彦 植草
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP61123706A priority Critical patent/JPH0776979B2/ja
Publication of JPS62281092A publication Critical patent/JPS62281092A/ja
Publication of JPH0776979B2 publication Critical patent/JPH0776979B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は原稿画像情報を自動的に読み取つて処理する画
像処理方法に関するものである。
[従来の技術] 従来この種の文字認識装置のパターン情報認識処理を第
10図に示す。
原稿用紙P上の文字をステツプS81に示す如く1文字毎
に読込んで光電変換し、これを更にステツプS82で“1",
“0"の2値データのパターンに変換している。続くステ
ツプS83で、後に説明する処理を効果的にするための前
処理、即ちステツプS82で2値化されたパターンに基づ
き文字が記録されている用紙P上の黒点などのノイズ処
理や文字図形境界面の平滑化などを含む一連の処理がな
される。次にステツプS84で文字認識を行うのに必要な
いくつかの特徴(交点、分岐点、ループ数、ストローク
の長さ情報など)を抽出する特徴抽出処理が行われる。
この抽出結果に応じて、多数の文字より特徴が共通する
いくつかの文字が選択される。次に、ステツプS85以下
でその中から唯一の文字の選択を行うための識別処理と
しての辞書照合処理、及び認識処理がなされる。
まずステツプS85で抽出された特徴に従つて辞書を誘導
(検索)することが可能か否かを調べる。ここで抽出し
た特徴が辞書を誘導するに値しないものである場合には
ステツプS88に進み、認識不能が出力される。一方、抽
出特徴点により辞書誘導可能であればステツプS86で備
えつけの辞書を検索し、先に抽出した特徴と順次照合す
る。ステツプS87で照合の結果一致すると、ステツプS88
で当該一致した結果を認識出力として出力する。一致が
とれない場合には認識不能として出力する。
[発明が解決しようとする問題点] ところが、この従来の認識方法によると、簡易な文字
(認識されやすい文字)、アルフアベツト、数字だけの
場合に対しても、前記の複雑な処理を行うため、処理時
間がかかり過ぎるという欠点があつた。
又、上記処理を実現するための構成も複雑であり、コス
トアツプや信頼性の点においても種々の問題点を抱えて
いた。
[問題点を解決するための手段] 本発明は前記した従来技術の問題点に鑑み成されたもの
で、上述の問題点を解決する一手段として以下の構成を
備える。
即ち、原稿を光学的に読み取る読み取り手段と、該読み
取り手段で読み取つた原稿画像情報を所定の領域に分割
する分割手段と、該分割手段で分割した各領域毎に、所
定数のライン上に現われる黒画素個数を検出する検出手
段と、該検出手段で検出した黒画素の個数の最大値を当
該領域の代表値として決定する決定手段とを備える。
[作用] 以上の構成において、原稿を光学的に読み取つた画像情
報を入力し、前記入力した画像情報を所定の領域に分割
し、前記分割された各領域毎に、所定数のライン上に現
われる連続する黒画素個数を検出し、前記検出した黒画
素の個数の最大値を当該領域の代表値として決定するこ
とにより、非常に短時間で、かつ正確なパターン認識処
理が行える。
[実施例] 以下、図面を参照して本発明に係る一実施例を詳細に説
明する。
第1図は本発明の一実施例のブロツク図であり、図中1
はOMRによるキーワードを含む文書画像情報を読み込み
電気信号に変換するリーダ、2はリーダ1で読み取つた
画像情報を記憶する光デイスク、3は本実施例全体を制
御するホストコンピユータ、4はキーボード、5は画像
情報やオペレーシヨン情報等を表示するCRT、6は画像
情報等を印刷出力するプリンタである。また、7はリー
ダ1の原稿読み取り面に原稿を1枚毎に自動送りするオ
ートフイーダである。
ホストコンピユータ3において、50はROM51に記憶され
た第4図に示す制御プログラムに従つて本装置全体を制
御するCPUであり、CPU50は例えばモトローラ社製のマイ
クロコンピユータMC68000等で構成することが望まし
い。51はROMであり、ROM51には標準特徴パターン記憶領
域51aが含まれる。52はCRT5とのインタフエースを司ど
るCRTインタフエース、53はキーボード4とのインタフ
エースを司どるキーボードインタフエース、54は光デイ
スクとのインタフエースを司どる光デイスクインタフエ
ースである。また、55はリーダ1とのインタフエースを
司どるリーダインタフエース、56はプリンタ6とのイン
タフエースを司どるプリンタインタフエース、57は処理
経過や、読み取りマークの認識処理経過等の記憶される
RAM、60は各構成間を接続するバスである。
RAM57の詳細記憶領域を第2図に示す。
第2図において、21はパターンバツフア、22はラインヒ
ストグラムバツフア、23は領域ヒストグラムバツフア、
24は読取りパターンである。
以上の構成を備える本実施例の外観図を第3図に示す。
図中第1図と同様構成については同一番号を付した。8
はリーダ1とホストコンピユータ3とのインタフエース
ケーブル、9はプリンタ6とホストコンピユータ3との
インタフエースケーブルである。
以上の構成を備える本実施例の動作を第4図のフローチ
ヤートを参照して以下に説明する。
第4図においても第10図と同様に、リーダ1にセツトさ
れた原稿上のPに示すパターンを読み取り、認識する処
理を例に説明する。
まず、ステツプS1でCPU50はリーダインタフエース55を
介してリーダ1を起動し、読み取り原稿面を走査して原
稿面の画像データを読み込む。
原稿面は例えば第8図に示すOMRシートの下部に のマークを配置し、該マーク上に活字パターンを第9図
に示すように塗る。そして、上記OMRシートは電子フア
イルシステムのキーワードの登録、フアクシミリの電話
番号入力、複写機などの画像形勢装置のコピー枚数、縮
率などのモード設定用に使用する。
第9図に示すようなフオーマツトを固定し、その上に定
形パターンの文字を書く方法を取ると、その後の処理は
より簡単になる。なお、第9図には“A"〜“Z"及び“1"
〜“0"の定型パターンが示されている。第9図のフオー
マツトの基本パターンはx方向3本、y方向3本のスト
ロークで構成された「田」の字と斜め2方のストローク
「X」をく組み合せた形の一部となつている。
このようにして書き込まれた原稿面のマーク位置の1文
字、例えば“A"を読み込んだ場合を例に以下説明する。
ステツプS1でリーダ1により光電変換されて読み込まれ
た信号は、ステツプS2に示す如くリーダインタフエース
55に送られ、リーダインタフエース55に内蔵のアナログ
ーデジタルコンバータにより“1",“0"の2値パターン
のデジタル信号に変換され、変換されたデジタル信号は
CPU50に入力される。
CPU50は、このようにして入力されたデジタルデータを
順次RAM57のパターンバツフア21に格納する。本実施例
においては、文字パターンは1文字48ビツト×48ビツト
の領域に区切られ、“A"を読み込んだ場合の読み取りデ
ータのパターンバツフア21への格納例を第5図に示す。
CPU50はステツプS3で各ライン毎の横方向(X方向)及
び縦方向(Y方向)のそれぞれに対しての“1"である黒
密度(ストローク密度)の数を計数する。具体的には第
5図に示す如く、横方向の(X方向の)第1ラインの黒
密度の数は“48"、第4ラインは“4"となり、縦方向の
(Y方向の)第1ライン及び次ラインの黒密度の数は
“48"第3ラインは“4"となる。そしてステツプS4で求
めた黒密度の数をRAM57のラインヒストグラムバツフア2
2に格納する。次のステツプS5で、第5図に示す読取り
パターンを、第6図(A)の1〜10に示す各所定領域に
分割する。この黒密度の数を各領域毎に計数した結果
を、棒グラフの形で示したのが第6図(B)、(C)で
ある。
続いてステツプS6で先に求めた所定領域内のライン毎の
黒密度の数の最大値を求め、この値を当該領域の代表値
としてRAM57の領域ヒストグラムバツフア23に格納す
る。エリア1においては黒密度の数の最大値は“48"と
なり、領域ヒストグラムバツフア23にはこの“48"が格
納される。同様にステツプS7で先に求めた所定領域内の
ライン毎の黒密度の数の平均値を求め、この値を当該領
域の代表値としてステツプS6と同様にRAM57の領域ヒス
トグラムバツフア23に格納する。領域(エリア)2が第
10ライン〜20ラインであるとすると、この間に第6図
(A)の61に示すゴミ(例えば、2×2の4ビツト)等
が読み取られた場合においても、当該エリアの黒密度の
量は(8×10+2)82ビツトであり、エリア2の黒密度
の平均値は8.2となる。
次に、ステツプS8において、ステツプS5で分割した各領
域におけるスレツシユホールドレベルを設定する。例え
ば横方向においてはx1,x2,x3の、縦方向においてはy1,y
2,y3の各スレツシユホールドレベルを設定する。これら
の各値は任意に設定できるが、例えばそれぞれ16,32,48
としてもよい。
次にステツプS9で領域ヒストグラムバツフア23に格納し
た各領域の最大値及び平均値のうち1つを選択し、選択
した値をステツプS8で設定したスレツシユホールドレベ
ルに従い多値化して領域毎の代表値を求める。そして求
めた代表値を代表値バツフア25に格納する。
領域を第6図(A)に示す如く分割した場合には、領域
1においては入力されるストローク(黒密度)の最大値
は全領域に渡り、0ビツトから最大48ビツトとなる。一
方、領域2については、第9図に示すように枠1つ〜枠
4つ分の4通りのストローク入力が考えられる。同様に
領域3及び5は最大48ビツトとなり、領域4においては
領域2と同様となる。このため、第9図に示す入力スト
ロークの枠の幅が4ビツトである場合には、各領域のス
トロークの最大値は領域1,3,5において48ビツト、領域
2,4において16ビツトとなる。従つて領域1,3,5,6,8,10
においては最大値、領域2,4,7,9においては平均値をと
ることにより、ゴミ等の影響の少ない、かつ高精度のも
のとすることができる。このようにして特定した各領域
の値に対して、ステツプS8で設定したスレツシユホール
ドレベルに従つてこれを3値化する。
即ち、代表値Pが(x1>P)の時は“1"、(x2<P<x3
9の時は“2"、(x3<P)の時は“3"となる。ここで、
第6図(A)に示す領域1〜5においては各領域の代表
値は第6図(B)に示す如く、“3",“1",“3",“1",
“1"となり、領域6〜10においては各領域の代表値は、
第6図(C)に示す如く“3",“1",“1",“1",“3"とな
る。従つて読み取りパターンに格納される各代表値は第
7図(A)に示すものとなる。
続くステツプS10でROM51の標準特徴パターン51aに記憶
の標準パターンと、読取りパターン24に格納されている
読取りパターンとのマツチングを行なう。その結果、ス
テツプS11でパターンの一致が得られれば、ステツプS12
で一致の得られたパターンの入力として認識し、結果を
出力する。一方一致が得られない場合にはステツプ13に
進み、認識不能を出力して処理を終了する。そして再び
次のパターンの読み込み処理等を実行する。
入力標準特徴パターン51aの“A"の標準パターンは第7
図(B)に示すパターンであり、第7図(A)に示す読
取りパターンと一致し、第7第4図においても第10図と
同様に、リーダ1にセツトされた原稿上のPに示すパタ
ーンを読み取り、認識する処理を例に説明する。
以上説明した様に本実施例によれば、例えば第5図に示
す文字パターンを認識する上で、次のような効果が考え
られる。
所定の領域での黒密度(ストローク密度)の最大値
を代表値として、かつこの値を所定のスレツシユホール
ドレベルで3値化することにより、領域内の誤読取であ
るゴミ等の読み取りを除去するという効果を含んでい
る。このため、第6図(A)の61の如く、領域内ゴミ等
があつて当該ラインの黒密度の数が多少変化しても、そ
の影響を防ぐことができ、正確な文字認識が可能とな
る。
さらに、照合されるデータ量が少ないため、処理時
間が大幅に削減され、第7図(A)のパターンと第7図
(B)に示す標準特徴パターンという少量のデータの照
合のみで認識が可能となる。
このように、文字認識装置の簡易な文字の認識における
欠点を解消し、簡易な文字の認識に必要な処理時間を短
縮し、高速、かつ、高精度の文字認識が可能となる。
更に、定形パターン(活字型)の数字、もしくはアルフ
アベツトの文字を、高速かつ高精度に認識することがで
きる。
[発明の効果] 以上説明した如く、本発明によれば、非常に短時間で、
かつ正確なパターン認識処理が行なえる。
【図面の簡単な説明】
第1図は本発明に係る一実施例のブロツク図、 第2図は第1図に示すRAMの詳細構成図、 第3図は本実施例の外観図、 第4図は本実施例のパターン認識制御フローチヤート、 第5図は本実施例のパターンバツフアへの読取パターン
格納例を示す図、 第6図(A)〜(C)は本実施例によるパターン“A"の
認識処理を説明するための図、 第7図(A)は本実施例の“A"読み取り時の読取りパタ
ーンの代表値を示す図、 第7図は(B)は標準特徴パターンにおける“A"の格納
パターンを示す図、 第8図は本実施例で用いられるOMRシートを示す図、 第9図は本実施例で用いる標準入力パターンを示す図、 第10図は従来のパターン認識処理を示すフローチヤート
である。 図中、1……リーダ、2……光デイスク、3……ホスト
コンピユータ、4……キーボード、5……CRT、6……
プリンタ、7……オートフイーダ、50……CPU、51……R
OM、51a……標準特徴パターン記憶領域、52……CRTイン
タフエース、53……キーボードインタフエース、54……
光デイスクインタフエース、55……リーダインタフエー
ス、56……プリンタインタフエース、57……RAM、60…
…バスである。
フロントページの続き (72)発明者 植草 明彦 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (56)参考文献 特開 昭57−45682(JP,A)

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】原稿を光学的に読み取つた画像情報を入力
    し、 前記入力した画像情報を所定の領域に分割し、 前記分割された各領域毎に、所定数のライン上に現われ
    る黒画素個数を検出し、 前記検出した黒画素の個数の最大値を当該領域の代表値
    として決定することを特徴とする画像処理方法。
JP61123706A 1986-05-30 1986-05-30 画像処理方法 Expired - Fee Related JPH0776979B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61123706A JPH0776979B2 (ja) 1986-05-30 1986-05-30 画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61123706A JPH0776979B2 (ja) 1986-05-30 1986-05-30 画像処理方法

Publications (2)

Publication Number Publication Date
JPS62281092A JPS62281092A (ja) 1987-12-05
JPH0776979B2 true JPH0776979B2 (ja) 1995-08-16

Family

ID=14867330

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61123706A Expired - Fee Related JPH0776979B2 (ja) 1986-05-30 1986-05-30 画像処理方法

Country Status (1)

Country Link
JP (1) JPH0776979B2 (ja)

Also Published As

Publication number Publication date
JPS62281092A (ja) 1987-12-05

Similar Documents

Publication Publication Date Title
EP0472313B1 (en) Image processing method and apparatus therefor
EP0081767B1 (en) Character and image processing apparatus
EP0125877B1 (en) Information input apparatus
JPS63158678A (ja) 単語間スペ−ス検出方法
JP2644041B2 (ja) 文字認識装置
JPS6141029B2 (ja)
JPH0776979B2 (ja) 画像処理方法
JPH0776978B2 (ja) 画像処理方法
JPH0778820B2 (ja) 画像処理方法
JPS62281094A (ja) パタ−ン情報認識方法
JPS62281095A (ja) パタ−ン情報認識方法
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JP2578767B2 (ja) 画像処理方法
JP3090928B2 (ja) 文字認識装置
JP2578768B2 (ja) 画像処理方法
JPS62281093A (ja) パタ−ン情報認識方法
JPS62281090A (ja) パタ−ン情報認識方法
JPH0782524B2 (ja) 光学的文字読取装置
JPH0632074B2 (ja) 正規化方法
JPS62281091A (ja) パタ−ン情報認識方法
JPH0259502B2 (ja)
JPH0433074B2 (ja)
JPH1125214A (ja) 画像識別装置
JPH0222427B2 (ja)
JPH0677270B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees