JPS622382A - 画像処理方法 - Google Patents

画像処理方法

Info

Publication number
JPS622382A
JPS622382A JP60140426A JP14042685A JPS622382A JP S622382 A JPS622382 A JP S622382A JP 60140426 A JP60140426 A JP 60140426A JP 14042685 A JP14042685 A JP 14042685A JP S622382 A JPS622382 A JP S622382A
Authority
JP
Japan
Prior art keywords
pattern
circuit
character
picture element
patterns
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60140426A
Other languages
English (en)
Other versions
JPH07109612B2 (ja
Inventor
Kenichi Oota
健一 太田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP60140426A priority Critical patent/JPH07109612B2/ja
Publication of JPS622382A publication Critical patent/JPS622382A/ja
Publication of JPH07109612B2 publication Critical patent/JPH07109612B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 LH業上の利用分野」 本発明は、パターンデータから特徴を抽出するためのパ
ターンの特徴抽出装置に関するものである。
し開示の概要」 本明細書及び図面は1図形パターンから所定方向のスト
ロークを抽出するパターンの特徴抽出装置において、原
図形パターンを前記所定方向から所定の角度ずれた方向
に平行移動して得た図形パターンと原図形パターンの画
素同士とに所定の論理演算をして得た二次元パターンを
原図形パターンの前記所定方向のストロークとする事に
より、少ない処理手順と、小さい装置規模で、原図形の
文字線巾変動や文字の位置変動の影響を減少せしめて、
パターンの特徴を抽…する技術を開示する。
「従来の技林t」 従来、活字等の定形文字を読み取り認識する例えば光学
的文字認識装置等において、識別判定処理を行う場合、
入力図形と、辞書メモリ中に格納された標準文字図形と
を重ね合わせ、その重なり度が最大となる標準文字を認
m結果として出力するという、いわゆるテンプレートマ
ツチング法が広く採用されている。しかし、テンプレー
トマツチング法は当然ながら入力図形パターンと辞書図
形パターンとの正確な位置合わせが必要であり、文字線
巾が変動すると、図形の重なり度が大きく影響を受ける
ために、入力図形を得るための原図形の2値化を慎重に
行う必要があった。又、二次元図形同士のマツチングを
行う故に、辞書パターンは2次元パターンとしてもつ必
要があり、そのため辞書メモリ容量が増大する等の欠点
が存在する。
上記欠点を補うため、辞書パターンを単なる2個のテン
プレートではなく、黒画素領域と白画素領域の間に、白
、黒どちらでもよいという遷移領域を設け、3個テンプ
レートとする方法がとられる場合があるが、辞書メモリ
容量は更に増大し不適当である。
また、入力文字の線巾変動の影響を減少させ図形の構造
的特徴も取り入れるために、与えられた図形パターンよ
り特定方向のストロークを抽出し、それら抽出されたス
トロークの相互関係等を用いて該図形の特徴量を求める
事が必要となる。
その場合に、例えば文学誌m装置を例にとれば、一般に
次のようなストローク抽出方式が広く採用されている。
それは文字図形の輪郭を追跡し検出された輪郭点系列に
ついて、その曲率、傾き等から所定ストロークを検出し
抽出する方式、或いは、前記文字図形を第2図(a)、
(b)に示すような3×3の微分フィルタを用いて走査
することにより、特定の傾きを持つ輪郭成分を検知し抽
出する方式等である。
しかし前者の方式においては1文字図形パター    
□ンが大きくなり、又は複雑化すると輪郭追跡の処理量
が増大し、また検出された輪郭点系列に対し、更に傾き
、長さ、接続関係を求める処理を行って、初めてストロ
ークが検出されるといった欠点が存在する。また、後者
の方式においては、フィルタ走査に手間がかかり、しか
も画像サイズが増大すると処理時間が飛躍的に増加する
といった欠点がある。
[発明が解決しようとする問題点] 上述した従来例の問題点は、結局図形の特徴の抽出を久
方図形の変動等があっても如何に効率よく行うかという
問題に帰結できる。そこで、本発明の目的は、少ない処
理手順と、小さい装置規模で文字線巾変動や文字の位置
変動の影響を減少せしめるようなパターンの特徴抽出装
置を提供することにある。
L問題点を解決するための手段」 この問題を解決する一手段として1例えば第1図に示す
実施例のパターンの特徴抽出装置は、原図形パターン1
00を抽出すべきストローク方向から所定の角度だけず
れた方向にパターン平行移動する平行移動手段101と
、画素同士の所定の論理演算を行う論理@箕手段102
とからなる。
し作用」 かかる第1図の構成において、パターン平行移動手段1
03によって得られたパターン103と原図形パターン
100との画素同士に所定の論理演算、例えば排他論理
和演算を行うと、抽出すべさストローク情報が得られる
し実施例」 以下、添付図面に従って本発明の実施例を更に詳細に説
明する。
第3図は本発明に係る実施例の特徴抽出装置を文字認識
装置に適用した場合の構成例である。原画像である帳票
1上に印字された文字画像は適当な光源で照明され、レ
ンズ2により光電変換器3上に結像される。光電変検器
3から出力されるアナログデータは4のA/D変換器で
デジタル信号に変換され、更に5の2値化回路で2個体
号となり、6の文字切り出し回路に入力される。文字切
り出し回路6では@梁上の1文字分に対応する部分画像
を切り出し、正規化回路7へ該部分画像を出力する。正
規化回路7ではこの1文字画像が基準の大きさとなるよ
う拡大又は縮小した画像を8の特徴抽出回路へ送るが、
帳票上の文字の大きざが予め一種類に統一されている場
合は、正規化回路7は必要ではない。特徴抽出回路8は
入力された文字画像から後述するような特徴量を抽出し
、文字認識部12にて文字認識を行う0文字認識部12
は、例えば9の相違度夏山回路で辞書メモリ10中の辞
書パターンとの相違度計算を行い、11の識別回路によ
り相違度が最小となるような辞書パターンを横用して、
それを認識結果として出力する。
次に、本実施例の主眼である文字図形の特徴抽出から識
別判定までの処理手順を詳細に説明する。この特徴抽出
から識別判定迄は第3図においでは特徴抽出回路8〜識
別回路11に対応する。
ます、特徴抽出回路8は次のような手段を用いた文字ス
トローク抽出を行う。
第4図〜第9図(a)〜(b)は、入力文字図形22を
特徴抽出回路8に入力して、特徴抽出の手順に従い、処
理を行った結果を順を追って示し    ゛たものであ
る。第4図22の入カバターンは文字枠21のような、
例えば8ピツhX12ビツトの大きざに入るように正規
化回路7により正規化されているものとする。尚、第4
図では第2図の帳票lの数字°°1“を表しており、斜
線部は黒画素(ビットの(IiI’=1)、空白部は白
画素(ビットの個=0)である。以下、特徴抽出の処理
手順を図に従って順を追って説明する。
まず、第4図に示した如く座標x、y軸をとリ、パター
ン内の各画素をM (!、り (x、y)とおく。但し
、(x = 1.2.・・・、8 、 Y = 1.2
.・・・、12)である。即ち、 M (!、YJ = f l  (x、yJが黒画素1
0  Cx、y)が白画素 ・・・(1) である: 第5図(a)、(b)は第4図の画素パターンM(x、
y)を夫々左上(−45度)、右上(+45度)方向(
第5図(a)、(bJ中の矢印方向)に一画素分平行移
動させたパターンを表している。
第6図(a) 、 (b)は夫々、第5図(a)と第4
図、第5図(b)と第4図のパターンを互いに文字枠が
一致するように重ね合わせ、画素単位で排多的論理和を
とり、その結果を更に右方向に一画素平行移動させたも
のである。即ち、第6図(a)、(b)の画像をE t
 (x、y) 、 F2 (x、y)と書けば、 E 1 (x、y) =M(x−1,1)(ト)M(4,y−1)E 2 (
x、y) =   MCx、y)  0M(菫−t、y+x)・・
・(2) と表せる。ここで■は排多的論理和を表す記号である。
第6図(a)、(b)のパターン31゜32からも分か
る通り、文字パターンの輪郭成分のうち、第6図(a)
においては第5図(a)のパターンを得るのに行った一
45度の平行移動の方向に平行な成分は消去され(原パ
ターンには一45度成分が少ないので)、それに垂直な
成分(即ち+45度成分〕は強調されるという結果が得
られている。−万、第6図(b)においては、平行移動
方向(−45度)に平行な成分が消去されている。
次に、第6図(a)と(b)とのパターンの文字枠が重
なるように重ね合わせ、画素同士の論理、ljl (A
ND)をとることにより第7図が得られる。このように
して得られた第7図のパターン51は原パターン22か
ら斜め方向〔±45度〕以外の輪郭線を抽出したものと
なっている。
最後にこの第7図のパターン51と第6図(a)、及び
第7図と第6図(b)とを夫々やはり文字枠が重なるよ
うに重ね合わせ、画素単位に排多的論理和をとり、結局
第8図(a)、(b)のパターン61.62が得られる
。第7図(a)、(b)を夫々F I Cx*y) +
 F 2 (!IY)と書くと、 F 1  (x、y)  = F、t  (x、y)■
 (E 1  (!、YJ  X E 2  (x、y
)  )F 2  (x、y)  = E 2  D、
y)0+  (E t  (x、y)  X E 2 
 (x、y))・・・ (3) で表される。ここで記号のは論理積演算を示す。
以上の操作を行うことにより、第8図(a)のF 1 
(x、y)  、第8図(b) (7)F2 Cx、y
)が得られるわけであるが、夫々に現れている黒画素7
1゜72はF 1’ (x、y)においては、X軸と+
45度の傾きを成すストローク成分、F 2 (x、y
)においてはX軸と一45度の傾きを成すストローク成
分に対応している。
第9図(a)、(b)は上記と同様の手法によりy軸に
平行なストローク(81)、及びX軸に平行なストロー
ク(82)を抽出した結果である。即ち先ず、原パター
ン22をX軸に平行に1画素平行移動して、第5図(a
)に類似のパターンを得、同様にy軸に平行に1画素平
行移動して第5図(b)に類似のパターンを得る。こう
して得られた2つのパターンを原パターン22との画素
同士の排他論理和をとり、更に論理積をとる事により第
7図類似のパターンが得られる。今度の第7図類似のパ
ターンは±45度成分が抽出されている筈である。従っ
て第7図(a)。
(b)のパターンを得たのと同様な手法により排他論理
和をとると、第9図(&)、(b)に示されたパターン
71.72の如き夫々y軸、X軸に平行なストローク成
分が得られる。
以上のように本実施例の特徴抽出回路によれば、2次元
の文字パターンに対し、数回のシフト操作と単純な論理
演箕により、X軸の+45度方向、−45度方向、X軸
に平行な方向、y軸に平行な方向の4方向のストローク
(−即ち、0度。
45度、90度、135度、180度、225度、27
0度、315度の8方向のストローク)を、それらが存
在する場所に黒画素の密度という形で抽出することがで
き、第8図(a)及び(b)、第9図(a)、(b)の
パターン61゜62.71.72の黒画素分布を計数す
ることにより、文字パターンの特徴量を得ることができ
る。
ストローク抽出画像から文字パターンの特徴量を得る手
段についてその一例を第10図に示す。
第10図の例は、第8図(&)のX軸と45度を成すス
トロークを抽出したパターン61をy軸方向の度数分布
81に変換し、y軸を82.83゜84の様な3等分領
域に分割して、夫々の領域内の度数の合計価を計数する
ものである。この計数値は度数分布が81の場合、82
.83.84の各領域に対し、夫々”7” 、”3” 
、  ′1″となる。同様の処理を第8図(b)、第9
図(a)。
(b)の3画像62,71.72に対しても行うと、各
計数値は第8図(b)で’2”、  “”i”。
”O”、ff19図(a)で’5” 、−11” 。
” 8 ” 、第9図(b、lで’3”、“3” 、”
2”となる。以上4画像について12個の数値列が得ら
れるので、これを順番に並べた12次元ベクトルを入カ
バターンの特徴量(以後、入力ベクトルと呼ぶ)とする
ことができる。
第3図の相違度検出回路9では、上記入力ベクトルを得
たのと同様の手法により、基準となる文字について予め
ストロークをベクトル化して、そのベクトルを辞書メモ
リ10に記憶する。この辞書メモリlOに記憶されたベ
クトル(以後、辞書ベクトルと呼ぶ)との相違度をベク
トル間のユークリッド距離、絶対値距離等周知の方法に
より求める。識別回路11では辞書メモリ中に格納され
た全ての文字カテゴリーについて上記束められた相違度
の中から最小のものを選び出しく最小二乗法)、それに
対応する辞書カテゴリー名を認識結果として出力する。
第11図は本発明の特ひ抽出回路の構成の一例である。
201のパターンレジスタには2値化処理、正規化処理
後の一文字分のパターンが入力される。このパターンか
ら202のW/Rコントローラで制御しながら、203
〜206のパターンレジスタ内に所定ビット数の平行移
動を施した画像を生成する。パターンレジスタを例えば
RA M (Random Access Memor
y)等で構成すれば、W/Rコントローラ202はアド
レスカウンタのようなもので構成できる。
これらのパターンレジスタ201.及び203〜206
に格納されたパターンを207の論理演算回路に入カレ
、(2)〜(3)式のような所定の論理演算処理を実行
した後、209〜212のカウンタへ出力する。即ち、
論理演算回路207からの出力は、コントローラ208
により制御されるカウンタ209〜212によって特定
部分領域内画素数を計数され、計数値は213のメモリ
に収納される。即ち、メモリ213には前述した12次
元ベクトルの各要素が記憶されることとなる。
以上述べた如く本発明に係る実施例の特徴を列挙すれば
、簡略な装置構成により、効率良く文字パターンのスト
ロークを画素分布として油田できる。又、ストロークの
有無が画素密度で表現されるために、度数を計数する事
により゛パターンのベクトル化も容易に行うことができ
る。従って、比較対象となる辞書パターンも二次元パタ
ーンとしてではなくベクトルとして記憶すればよいので
、記憶に必要な記憶容量が少なくて済む。更に、文字の
輪郭線がストロークとして抽出されるので。
文字線巾の変動、即ち、2値化閾値の変動による認識率
の低下を減少させることができ、文字の構造的特徴も取
り入れることができる。また、パターンのベクトル化の
際の領域分割数を大きくせずに充分な認識能力が得られ
るため1文字の位置変動による認識率の低下も削減する
ことが可能となる。
次に、前記実施例の変形例について以下数例述べる。第
12図は特徴抽出回路8の他の例である。第12図を第
11図と比べてみると、第12図ではパターンレジスタ
301からのデータをカウンタ302の制御により平行
移動すべくパターンレジスタ301の出力をANDゲー
トを介してパターンレジスタ304〜307へ入力する
又、論理@箕回路207を具体的にANDゲート及びE
X−OR(排他論理和)ゲートにより構成しており、更
に第11図のカウンタ209〜212を省略している。
又更に、第11図、12図において、画像の平行移動に
はカウンタとパターンレジスタとを用いているが、これ
らの変わりに平行移動に必要な画素数分のビットをもつ
シフトレジスタを使ってリアルタイムにデータを転送す
る等の方式も可能である。前記特徴抽出回路において、
前記方式では4方向(実質的に8方向〕のストローク抽
出を行つたが、場合によっては4方向以下としても充分
な認識率が得られるならば4方向以下でもかまわない。
逆に、4方向以上に増やすために平行移動量をX方向に
1画素、y方向に2画素、またはX方向に2画素、y方
向に1画素とすれば、夫々、30度、60度、120度
、150度。
210度、240度、300度、330度というように
ストロークの検出方向を増やす事ができる。又、第10
図で示される領域分割数も3分割に限られるものではな
く、認識精度を上げるのならば分割数を増やしてもよい
〔発明の効果] 以上説明したように本発明によれば、少ない処理手順と
、小さい装置規模で文字線巾変動や文字の位置変動の影
響を減少せしめるようなパターンの特徴抽出装置を提供
する事ができる。
【図面の簡単な説明】
第1図は本発明に係る実施例の基本構成図、第2図(L
)  、 (b)は従来例において輪郭線検出に用いら
れている3×3の微分フィルタ、第3図は本発明を文字
認識装置に適用した場合における当該文字認識装置の構
成例、 第4図、第5図C&)、(b)、第6図(a) 、 (
b) 、第7図、第8図(a) 、 (b)及びP89
図(a)、(b)は実施例における特徴抽出のために処
理される画像を順を追って示した図。 第10図は抽出されたパターンの特徴のベクトル化を説
明する図。 第11図は特徴抽出回路の回路構成の一例を示す図、 第12図は特徴抽出回路の回路構成の変形例を示す図で
ある。 図中、 1・・・帳票(原画像)、2・・・レンズ、3・・・光
電変換器、4・・・A/D変換器、5・・・2値化回路
、6・・・文字切り出し回路、7・・・正規化回路、8
・・・特徴抽出回路、9・・・相違度算出回路、10・
・・辞書メモリ、11・・・識別回路、12・・・認識
回路、21・・・文字枠、31,32,41,42,5
1,61゜62.71,72・・・抽出パターン、81
・・・濃度度数、82〜84・・・分割領域、201,
203〜206・・・パターンレジスタ、301,30
3〜311・・・パターンレジスタ、202・・・W/
Rコントローラ、207・・・論理演算回路、208・
・・コントローラ、209〜212・・・カウンタ、2
13・・・メモリ、302・・・カウンタである。 第1 図 7、s 2図 褒5図 (G)             (b)ヴ6図 (a)(b) 第7図 第8図 (a)            (b)礎9図 (0)            (b)怜10図

Claims (3)

    【特許請求の範囲】
  1. (1)図形パターンから所定方向のストローク情報を抽
    出するパターンの特徴抽出装置において、原図形パター
    ンを前記所定方向から所定の角度ずれた方向に平行移動
    して得た図形パターンと原図形パターンの画素同士とに
    所定の論理演算を行い、該論理演算により得た二次元パ
    ターンを原図形パターンの前記所定方向のストローク情
    報とするパターンの特徴抽出装置。
  2. (2)更に認識手段を備え、該認識手段は画素の濃度分
    布として得られたストローク情報の二次元パターンを黒
    である画素の一次元密度分布に変換して、該密度分布か
    ら原図形パターンの図形認識を行う事を特徴とする特許
    請求の範囲第1項に記載のパターンの特徴抽出装置。
  3. (3)所定の角度は90度である事を特徴とする特許請
    求の範囲第1項又は第2項いずれかに記載のパターンの
    特徴抽出装置。
JP60140426A 1985-06-28 1985-06-28 画像処理方法 Expired - Fee Related JPH07109612B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60140426A JPH07109612B2 (ja) 1985-06-28 1985-06-28 画像処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60140426A JPH07109612B2 (ja) 1985-06-28 1985-06-28 画像処理方法

Publications (2)

Publication Number Publication Date
JPS622382A true JPS622382A (ja) 1987-01-08
JPH07109612B2 JPH07109612B2 (ja) 1995-11-22

Family

ID=15268413

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60140426A Expired - Fee Related JPH07109612B2 (ja) 1985-06-28 1985-06-28 画像処理方法

Country Status (1)

Country Link
JP (1) JPH07109612B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04353990A (ja) * 1991-05-30 1992-12-08 Hitachi Eng Co Ltd パターンマッチングを用いる検査装置およびパターンマッチング方法
US7354301B2 (en) 2004-05-19 2008-04-08 Sony Corporation DC adapter and electronic apparatus using the same
JP2015014843A (ja) * 2013-07-03 2015-01-22 大日本印刷株式会社 図形のアウトライン表示装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62280971A (ja) * 1986-05-29 1987-12-05 Fanuc Ltd 画像処理方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62280971A (ja) * 1986-05-29 1987-12-05 Fanuc Ltd 画像処理方式

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04353990A (ja) * 1991-05-30 1992-12-08 Hitachi Eng Co Ltd パターンマッチングを用いる検査装置およびパターンマッチング方法
US7354301B2 (en) 2004-05-19 2008-04-08 Sony Corporation DC adapter and electronic apparatus using the same
US7494368B2 (en) 2004-05-19 2009-02-24 Sony Corporation DC adapter and electronic apparatus using the same
JP2015014843A (ja) * 2013-07-03 2015-01-22 大日本印刷株式会社 図形のアウトライン表示装置

Also Published As

Publication number Publication date
JPH07109612B2 (ja) 1995-11-22

Similar Documents

Publication Publication Date Title
CN109993160B (zh) 一种图像矫正及文本与位置识别方法及系统
EP2783328B1 (en) Text detection using multi-layer connected components with histograms
US5077805A (en) Hybrid feature-based and template matching optical character recognition system
EP0063454B1 (en) Method for recognizing machine encoded characters
Das et al. A fast algorithm for skew detection of document images using morphology
JPH0312750B2 (ja)
JPH01253077A (ja) 文字列検出方法
Gour et al. Fingerprint feature extraction using midpoint ridge contour method and neural network
JPS622382A (ja) 画像処理方法
JPH07168910A (ja) 文書レイアウト解析装置及び文書フォ−マット識別装置
CN115082944A (zh) 表格的智能识别切分方法、系统和终端
JPH10162139A (ja) 画像処理装置、および画像処理プログラムを記録した媒体
JP3095470B2 (ja) 文字認識装置
CN113705430B (zh) 基于检测模型的表格检测方法、装置、设备及存储介质
CN112183538B (zh) 一种满文识别方法及系统
JPS58165178A (ja) 文字読取り装置
JPH0656625B2 (ja) 特徴抽出方式
JPH02294791A (ja) 文字パターン切り出し装置
JPH01229388A (ja) 数字認識方法および装置
JPH0420221B2 (ja)
JP2803224B2 (ja) パターンマッチング方法
JPS62224871A (ja) 文書画像処理方式
JPH0420228B2 (ja)
JPH04579A (ja) 図形の特微点抽出方法
JPH0434668A (ja) 画像処理方法および装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees