JPH0769935B2 - 複数パターン処理装置 - Google Patents

複数パターン処理装置

Info

Publication number
JPH0769935B2
JPH0769935B2 JP2221659A JP22165990A JPH0769935B2 JP H0769935 B2 JPH0769935 B2 JP H0769935B2 JP 2221659 A JP2221659 A JP 2221659A JP 22165990 A JP22165990 A JP 22165990A JP H0769935 B2 JPH0769935 B2 JP H0769935B2
Authority
JP
Japan
Prior art keywords
segment
pattern
file
single piece
argument
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2221659A
Other languages
English (en)
Other versions
JPH03228194A (ja
Inventor
保夫 本郷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Original Assignee
Fuji Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd filed Critical Fuji Electric Co Ltd
Priority to JP2221659A priority Critical patent/JPH0769935B2/ja
Publication of JPH03228194A publication Critical patent/JPH03228194A/ja
Publication of JPH0769935B2 publication Critical patent/JPH0769935B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 この発明は、刻印文字または印刷文字等のパターンの識
別のための前処理として、1画面内の複数のパターンを
背景から分離して走査線毎にセグメント化し、セグメン
トの集合体からなる各パターンを独立のパターンとして
それぞれ分離し、処理するために用いられる複数パター
ン処理装置に関するものである。
従来、この種のパターン識別方式として、マトリックス
マッチング法と呼ばれる方法がある。
第1図はかかる方法を説明するための説明図である。こ
れは、文字毎に荷重パターンと称される特徴が予め決め
られているもので、同図には文字“B"の荷重パターンが
示されている。すなわち、各文字が含まれる領域を複数
の小領域に分割し、該領域毎に荷重または重み付け(図
では数字をもって示されている。)をする。この重み付
けは各文字毎に異なり、したがって標準の文字の荷重パ
ターンと読み取られた文字等の荷重パターン(入力パタ
ーン)とを比較することにより文字の識別を行うことが
できる。
しかるに、この方法によれば、標準文字の荷重パターン
と入力パターンとの相対的な位置ずれ、または文字線幅
の変動等によって一致度が変化し、不安定となる欠点を
有している。したがって、本出願人と上記の欠点を除去
すべく形状マトリックスによる文字識別方式(特開昭58
−78273号)を提案している。これは、各文字を例えば
9×8の小領域に分割し、該分解された領域内にパター
ンが存在するか否かによって、各文字毎の形状マトリッ
クスを考え、該形状マトリックスと標準の形状マトリッ
クスとを比較することにより文字を識別する。しかし、
この方法によれば、例えば刻印文字を読み取る場合、打
刻面の切削痕や煤などの汚れによって読み取られる文字
の形状マトリックスが変動し、したがって正確な識別が
困難となり、また、9×8の形状マトリックスでは、文
字の種類が多くなると(10以上)、読み取りが出来なく
なるという欠点を有している。
このために、刻印文字等をテレビカメラにより撮像して
得られるビデオ信号を2値化することによりセグメント
化し、該セグメント化された情報からその特徴量を抽出
してメモリに記憶させ、該記憶された情報に基づいて所
定の演算処理により刻印文字等を識別することが考えら
れている。すなわちセグメントの連結性を解析すること
により未知の文字パターンをいくつかのセグメントの集
合に分類するとともに、この分類に基づいて文字パター
ンを外接四角形によって未知パターンとして切出しを行
い、この未知パターンについて識別処理を行うのであ
る。
ところで、未知の文字パターンの切出しのために、従来
は未知パターンをセグメントに分解して、各セグメント
からセグメント長、座標、スタート情報、合流情報、接
続情報等をハード的に抽出してメモリ上に記録してい
き、これらの情報によってソフト的に連結しているセグ
メントの集合から独立のパターン(一文字パターン)を
分離し、その特徴量に基づいて外接四角形によって独立
パターンを切り出すことが行われているが、独立パター
ンの分離のための処理は煩雑であり、しかも相当の時間
を要するのが普通であった。
この発明は、上記に鑑み、未知のパターンをいくつかの
セグメントの集合(単片と呼ぶ)に分離し、各単片の中
で互いに接続される単片の集合(含片と呼ぶ)に同じ番
号を付与することにより、容易に独立のパターンを分類
することが可能な複数パターン処理装置を提供すること
を目的とする。
その特徴は、複数のパターンを含む画面を走査して得ら
れる出力信号を2値化することにより各パターンを背景
から分離して走査線毎にセグメント化し、セグメントの
集合体からなる各パターンを独立のパターンとしてそれ
ぞれ分離し、分離された各パターンに番号を付与する複
数パターン処理装置であって、前走査における何れのセ
グメントとも接続しないセグメント抽出する手段と、該
手段により抽出された各セグメントに発生順番を示す単
片番号を付与する手段と、前走査における何れか1つの
セグメントと接続するセグメントに対しては同じ単片番
号を付与し、前走査における複数のセグメントと接続す
るセグメントに対しては何れか1つのセグメントと同じ
単片番号を付与することにより各セグメントを単片とし
て分類する手段と、前走査における2つのセグメントが
現走査において接続する場合に、2つのセグメントの単
片番号を対として第1ファイルに順番記憶させる第1処
理手段と、該第1ファイルに記憶された単片番号を読み
出し、各単片に接続される単片の単片番号を記憶した単
片ファイルを作成する第2処理手段と、該単片ファイル
に記憶された単片番号を読出し、互いに接続される単片
の集合を示す複片番号を各単片に順次付与する第3処理
手段とを具備する点にある。
以下、この発明の実施例を図面を参照して説明する。
第2図はこの発明の実施例を示すブロック図、第3図は
文字“W"の量子化画像を説明する説明図、第4図はセグ
メント化された画像を説明する説明図、第5図は第4図
に示されるセグメント情報から抽出された各種の特徴抽
出情報を説明する説明図である。
第2図において、1は例えばMOSトランジスタまたはCCD
(Charge Coupled Device)形の固体撮像装置(以
下、単にカメラともいう。)、2は2値化回路、3は特
徴抽出回路、4は画像データ記憶回路(RAM1)、5はマ
イクロプロセッサ等の演算処理装置、6は主としてプロ
グラムが記憶されるP−ROMタイプのメモリ、7は主と
してデータが記憶されるメモリ(RAM2)、8は判定出力
部である。
すなわち、対象となる文字,図形をカメラ1を用いてX
方向に水平走査しながら順次Y方向に垂直走査を行い、
各水平走査によって得られるビデオ信号を2値化回路2
により或るしきい値レベルで2値化する。なお、この2
値化画像を模式的に示すと、第3図の如くなる。文字パ
ターンの存在するところを、例えば“1"で表し、該パタ
ーンが水平走査線と交わる論理レベル“1"の連なりをセ
グメントと呼ぶことにすると、各文字パターンは第4図
の如く各水平走査毎(SC8,SC9,SCi,SCK……)にセグメ
ント化(SE81,SE82,SEij,SEkl……)され、したがって
文字パターンはこれらのセグメントのかたまりで表すこ
とができる。この各セグメントが同一の文字パターンに
属していると識別するためには、セグメント毎に座標比
較を行うことが必要である。例えば、現在走査しいる走
査線が現走査SC9であると、現走査SC9のセグメントSE91
が1つ前の走査線であるSC8のセグメントSE81と同一パ
ターンに属するものであると判断するためには、現走査
SC9と前走査SC8のセグメントのY座標が1つだけ異なっ
ていて、しかもセグメントSE81,SE91のX座標が一部分
でも重なっていることである。そこで、これらの関係を
明瞭に把握しうるようにするために各セグメントについ
てスタート情報,合流情報および接続情報を考える。す
なわち、スタート情報は前走査においていずれのセグメ
ントとも重ならないセグメント、つまり現走査において
始めて出現するセグメントに対してつけられるもので、
第4図ではSE81,SE82,SEijがそれである。また、接続情
報は各走査線上に出現するセグメントの発生順番を表
し、合流情報はセグメントの重なり具合を示すもので、
前の走査線上にある2本以上のセグメントが互いに接続
していることを表す。そして、スタート情報が付される
各セグメントと接続または合流しているセグメントは同
一の単片に属するものとして各セグメントSE81,SE82,SE
ijにそれぞれ単片番号1,2,3を付ける。なお、合流情報
が付されるセグメント、例えばSEk+1には右側のセグメ
ントSEk2と同一の単片番号をつけるものとする。
このようにして、セグメント化された画像データから第
5図の如き特徴がそれぞれ抽出される。すなわち、同図
(イ)には上述のセグメントの単片番号が、同図(ロ)
には各セグメントの右端座標が、同図(ハ)にはY座標
(水平走査線の番号)が、同図(ニ)にはセグメント長
が同図(ホ),(ヘ)には合流している端片番号の組
が、同図(ト)にはセグメントの総個数が、同図(チ)
には合流回数が、また同図(リ)には端片の個数がそれ
ぞれ示され、同図の如き態様で記憶装置4(第1図参
照)に記憶される。なお、セグメント長Aは右端X座標
(XR)と左端X座標(XL)との差に+1した値で表され
る(XR−XL+1)が+1するのは右端および左端座標が
等しい場合はセグメント長が零となり、不都合であるか
らである。
第6図は上述の如き各特徴量を抽出する特徴抽出回路の
構成を示すブロック図である。
同図において、9は走査線3本分の今回,前回および前
々回の2値化信号を記憶する3×3局部メモリ、10はス
タートセグメント検出回路、11は単片番号カウンタ回
路、12は単片番号レジスタ、13は右点検出回路、14はX
座標発生回路、15はY座標発生回路、16はセグメント長
カウンタ回路、17は合流検出回路、18は合流回数カウン
タ回路、19はセグメント数カウンタ回路である。
先の2値化回路により2値化されたビデオ信号は、まず
3×3局部メモリ9に入力され、その出力から検出回路
10ではスタートセグメントを検出し、カウンタ回路11で
カウントして最新の単片番号を単片番号レジスタ12に記
憶する。右点検出回路13では各セグメントの右点の位置
を検出するとともに、そのタイミングでX座標,Y座標発
生回路14,15からの出力XR,YRを画像メモリ4(第1図参
照)へ書き込む。カウンタ回路16では2値化信号が“1"
の領域をカウントし、セグメント長Aとして出力する。
一方、検出回路17では局部メモリ9の出力から合流を検
出して合流回数(NTJ)カウンタ回路18へ供給するとと
もに、単片番号レジスタ12へ入力する。単片番号レジス
タ12によって合流を情報が検出されると、結合される単
片情報E1,E2を出力する一方、単片番号NSを毎回出力す
る。セグメント数カウンタ回路19では右点検出信号をカ
ウントしてセグメント総数NTSを出力する。
第7図は各セグメントの単片番号を説明する説明図、第
8図は該単片番号を一時的に記憶するレジスタ(第6図
の記号12を参照)の内容を説明するための説明図であ
る。
すなわち、第4図および第5図においても説明したよう
に、例えば文字“W"をセグメント化し各セグメントの水
平走査線上に現れる順番とスタート情報とにもとづいて
各セグメントに番号、つまり単片番号を付すことにする
と、該文字“W"は第7図に示される如く“1",“2"およ
び“3"なる単片番号が付されたセグメントの集合と考え
ることができる。ここで、例えばセグメントの水平走査
線SC19(Y=19)およびSC20(Y=20)上に現れる順
番、すなわち単片番号について考えると、同図からも明
らかなように走査線SC19の現走査ラインでは1,3,3およ
び2であり、走査線SC20の現走査ラインでは3および2
であるから、単片番号レジスタにはこれらの情報が第8
図の如く記憶される。なお、該レジスタの前回の走査結
果も第8図の如く記憶され、したがって、これらの内容
を調べることによって単片の個数NSSおよび互いに合流
する単片番号の組E1,E2をしることができる。このよう
にして、1つの文字パターンは単片番号が付されたセグ
メントの集合と考えられるので、特徴抽出回路によって
各文字パターンからその特徴を抽出することができる。
なお、このようにして得られる文字パターンの各特徴量
はメモリ(RAM1)に記憶されるので、第2図に示される
マイクロプロセッサμ−CPU等の演算処理装置5は該記
憶情報およびP−ROM6に記憶されたプログラムにもとづ
き所定の演算処理をすることにより文字パターンを識別
する。
以上は、主として簡単な文字パターンについて説明した
が、一般的に複雑な文字,図形パターンも上記と同様に
処理することができる。以下、その処理方法について簡
単に説明する。
第9図に任意パターンの単片番号とその単片領域との関
係を示す説明図、第10図は第9図における単片番号の組
と単片および複片ファイルとを説明する説明図、第11図
は単片ファイル作成プログラムを示すフローチャート、
第12図は複片ファイル作成プログラムを示すフローチャ
ートである。なお、第11図、第12図においてi,j,k,l,m
等は種々設けられているファイルの各引数を示し、E
1(i),E2(i)は引数iにおけるファイルE1,E2の内
容FT(j)は引数iにおけるファイルFTの内容R
S(i1),RS(i2)は引数i1,i2におけるファイルRSの内
容、Rc(k)は引数kにおけるファイルRcの内容をそれ
ぞれ示している。
すなわち、対象パターンが第9図に示される如き複雑な
図形である場合にも、上記と同様にしてスタート情報に
もとづき各セグメントに同図の数字で示される如き単片
番号1〜18を付ける。したがって、この場合は単片総数
NSS=18で、合流回数NTJ=17である。また、同図の点線
は各単片の領域をわかり易くするために付したもので、
この点線の部分で各セグメントが合流(ジョイント)し
ていること、例えばセグメント1と2,セグメント3と1,
セグメン5と4…が合流していることがわかるので、こ
れらを対として第10図(イ)の如きE1,E2ファイルに記
憶する。なお、E1は左側,E2は右側の各セグメントファ
イルを示す。
次に、このE1,E2ファイルから同図(ロ)の如き単片フ
ァイルRSを作成する手順について説明する。
つまり、単片ファイルRSは引数として単片番号1〜18が
与えられとり、かつファイルは最初はゼロクリアされて
いる。そして、E1,E2ファイルを引数iを更新しながら
上から順に読み出し、単片E2と連結する単片E1を順次調
べ互いに重複するもの、また冗長なものを除去しながら
次のように単片ファイルRSに作成する。
(1)E1,E2ファイルのi=1では、E2=2,E1=1であ
るから、E2=2に基づき単片ファイルRS(以下において
は単にRSと記載する)の引数i=2のところに単片1を
入れる。
(2)i=2では、E2=1,E1=3であるから、ESの引数
i=1のところに単片3を入れる。
(3)i=3では、E2=4,E1=5であるから、ESの引数
i=4のところに単片5を入れる。
(4)i=4では、E2=2,E1=6でRSの引数i=2のと
ころに単片6が入るべきところ、i=2には既に単片1
が入っており、単片番号1(i=1)のところには単片
3がはいっているが、単片番号3のところは空いている
ので、ここに単片6を入れる。
(5)i=5では、E2=4,E1=7であるから、RSの引数
i=4のところに単片7を入れるべきところ、ここには
単片5が入っているので、単片番号5のところに単片7
を入れる。
(6)i=6では、E2=10,E1=11であるから、RSの引
数i=10のところに単片11を入れる。
(7)i=7では、E2=9,E1=8であるから、RSの引数
i=9のところに単片8を入れる。
(8)i=8では、E2=10,E1=4であるが、RSの引数
i=10のところはすでに単片11が入っており、RSの単片
番号11のところは空いているので、ここに単片番号4を
入れる。
(9)i=9では、E2=10,E1=12であるが、RSの引数
i=10のところには単片11,i=11には単片4,i=4には
単片5,i=5には単片7がそれぞれ入っており、i=7
は空いているので、ここに単片番号12を入れる。
(10)i=10では、E2=10,E1=7であるが、(9)で
単片7はRSの引数i=5に既に入っていて重複するの
で、無視する。
(11)i=11では、E2=9,E1=10であるが、RSの引数i
=9には単片8,i=8には単片10が入っていてこれも重
複するので、無視する。
(12)i=12では、E2=13,E1=14であるから、RSの引
数i=13のところに単片14を入れる。
(13)i=13では、E2=16,E1=13であるから、RSの引
数i=16のところに単片13を入れる。
(14)i=14では、E2=15,E1=9であるから、RSの引
数i=15のところに単片9を入れる。
(15)i=15では、E2=17,E1=13であるから、RSの引
数i=17のところに単片13を入れる。
(16)i=16では、E2=15,E1=10であるが、RSの引数
i=15には9、i=9には8、i=8にはすでに10が入
っているので、これも無視する。
(17)i=17では、E2=18,E1=1であるので、RSの引
数i=18のところに単片1を入れる。
なお、RSの引数i=6,12,14の個所にも入れられなかっ
たので、ゼロ設定のままとして残る。
以上のように、単片ファイルRSは合流している単片番号
の組E1,E2の関係から互いに重複するもの、または冗長
なものを除去することにより作成されるが、その作成プ
ログラム例を示すのが第11図である。
同図を簡単に説明すると、ステップ〜はファイルE1
とE2の内容を比較し、両者の内容が等しくないとき、E1
の引数iをE1の内容で置き換える一方、FTファイルの引
数jを1にする操作を示す。なお、FTファイルは単片E1
と連結する単片の重複関係を調べるための一時ファイル
である。また、ステップ〜は引数i1を基点とした単
片のつらなり(連結したもの)の集合をFTファイルに書
き込む操作を示し、ステップ〜はE2ファイルの引数
i2がFTファイルの中に含まれる単片か否かをチェック
し、含まれていれば次の連結対(i←i+1)のチェッ
クに移る操作を示している。さらに、〜のループで
は引数i2を基点としてファイルRSの連結単片集合がFT
ァイルと同一の単片を含まないことをチェックしてい
る。
第11図の処理における各ステップの意味を第9図、第10
図を参照して詳細に説明すると次のとおりである。
〔ステップ〕 E1,E2ファイル引数i=1の個所のE1=1,E2=2を読み
出す。
〔ステップ〕 E1とE2が不一致であるかを判定する。この場合には、E1
=1,E2=2であるので不一致と判定され、ステップへ
進む。
〔ステップ〕 E1=1の値をi1とする。すなわち、i1=1となる。
〔ステップ〕 FTファイルの引数j=1とする。
〔ステップ〕 FTファイルの引数j=1の個所にi1=1を書き込む。
〔ステップ〕 RSファイルの引数i=1の個所の値をi1の値とする。こ
の場合、RSファイルの引数i=1の個所はゼロクリアさ
れているので、i1=0となる。
〔ステップ〕 FTファイルの引数j=2とする。
〔ステップ〕 i1=0であるかを判定する。この場合、ステップにお
いてi1=0となっているので、ステップに進む。
〔ステップ〕 FTファイルの引数jから減算した値をJとする。ステッ
プでj=2になっているので、J=1となる。
〔ステップ〕 E2ファイルの引数i=1の個所のE2=2の値をi2とす
る。すなわち、i2=2となる。
〔ステップ〕 FTファイルの引数j=1とする。
〔ステップ〕 FTファイルの引数j=1の個所の値とi2とが不一致であ
るかを判定する。この場合、FTファイルの引数j=1の
個所にはステップでi1=1が書き込まれており、i2
2であるので不一致と判定され、ステップに進む。
〔ステップ〕 FTファイルの引数jを加算する。すなわち、j=2とな
る。
〔ステップ〕 FTファイルの引数jとステップで求められたJの大小
関係を比較する。この場合、j=2,J=1であるのでj
>Jとなり、ステップに進む。
〔ステップ〕 i2=2の値をi2′とする。すなわち、i2′=2となる。
〔ステップ〕 R2ファイルの引数i=2の個所の値i2の値とする。この
場合、RSファイルの引数i=2の個所はゼロクリアされ
ているので、i2=0となる。
〔ステップ〕 i2=0であるかを判定する。この場合、ステップでi2
=0となっているので、ステップに進む。
〔ステップ〕 R2ファイルの引数i=2(i2′=2であるので)の個所
にE1=1を書き込む。これにより、前述の(1)の処理
が行われる。
〔ステップ〕 E1,E2ファイルの引数iの加算に行われてi=2とな
り、E1,E2ファイルの引数i=2の個所のE1=3,E2=1
の読み出しの準備が行われる。
〔ステップ〕 E1,E2ファイルの読み出しがNTJまで達したかを判定する
ものである。
以下、ステップ〜までの処理を繰り返してE1,E2
ァイルの処理が行われるが、前述の(4)に示すように
RSファイルに既に他の単片番号が書き込まれている場合
には次の処理となる。すなわち、一旦ステップまで進
んだのち、i2≠0となるのでステップに戻り、ステッ
プ,を通過するたびにRSファイルの引数iを2→1
→3と変えていき、RSファイルの引数i=3の個所が0
であることを見つけたのち、E1=6を書き込む。また、
前述の(10)のように無視する場合には、次の処理とな
る。すなわち、既に入っていて重複する場合にはステッ
プにおいてFT(j)=i2が成立するので、そこからス
テップに進み、書き込みが行われずに無視されるので
ある。
次に、こうして得られる単片ファイルRSをさらに整理す
ることにより、互いに接続される単片の集合である複片
(対象とする文字または図形のパターン)の番号を各単
片に付すための処理が行われるが、RSファイルから(1
−3−6,2−1,18−1)の連結,(4−5−7−12,8−1
0−11−4,9−8,15−9)の連結,(13−14−,16−13,17
−13)の連結があることがわかるので、これらの連結に
属する各単片には第10図(ハ)の如く、各連結ごとに同
一の複片番号(1),(2),(3)が付けられること
になる。その複片ファイルを示すのがRCである。その結
果、第9図における図形パターンの個数NCSは、第10図
(ニ)にも示すように「3」となることがわかる。
以上の処理を示すのが第12図で、概略的にはステップ
〜で複片番号を更新、ステップ〜で複片番号の書
き換えを行い、ステップを経て最終的な複片総数NTS
を出力するものである。RCは複片ファイル(第10図
(ハ)参照)を示し、これもファイルRSと同様最初はゼ
ロクリアされている。
第12図の処理により、第10図(ハ)のRCファイルを作成
する手順は次のとおりである。
(1)引数i=1とし(ステップ)、複片番号j=1
とする(ステップ)。さらに、RCファイルの引数kを
i、すなわち、k=1とする(ステップ)。
(2)RCファイルの引数k=1の個所の値が“0"である
かを判定する。この場合、RCファイルの引数k=1の個
所はゼロクリアされているのでステップに進む(ステ
ップ)。
(3)RCファイルの引数k=1の個所に複片番号jの値
を書き込む。この場合、ステップにより複片番号j=
1であるので、“1"が書き込まれる(ステップ)。
(4)RCファイルの引数k=1の個所の値をkとする。
この場合、RCファイルの引数k=1の個所の値は第10図
(ロ)により“3"であるので、k=3となる(ステップ
)。
(5)kが“0"であるかを判定する。この場合、ステッ
プによりk=3であるので、ステップに戻る(ステ
ップ)。
(6)RCファイルの引数k=3の個所の値が“0"である
かを判定する。この場合、RCファイルの引数k=3の個
所はゼロクリアされているのでステップに進む(ステ
ップ)。
(7)RCファイルの引数k=3の個所に複片番号jの値
を書き込む。この場合、ステップにより複片番号j=
1であるので、“1"が書き込まれる(ステップ)。
(8)RCファイルの引数k=3の個所の値をkとする。
この場合、RSファイルの引数k=3個所の値は第10図
(ロ)により“6"であるので、k=6となる(ステップ
)。
(9)kが“0"であるかを判定する。この場合、ステッ
プによりk=6であるので、ステップに戻る(ステ
ップ)。
(10)同様の処理が行われてRCファイルの引数k=6の
個所に複片番号j=1が書き込まれたのちは、RSファイ
ルの引数k=6の個所の値が第10図(ロ)により“0"で
あるので、ステップに進む。これによりRSファイルの
1−3−6の連結の処理が終了し、単片1,3,6に複片番
号j=1が付与される。
(11)複片番号j=2とし(ステップ)、引数i=2
とする(ステップ)。
(12)引数iが単片総数NSSより小さいかを判定する。
この場合には小さいのでステップに戻る(ステップ
)。
(13)同様の処理が行われて、ステップ〜によりRC
ファイルの引数k=2の個所に複片番号j=2が書き込
まれる。
(14)RSファイルの引数k=2の個所の値をkとする。
この場合、RSファイルの引数k=2の個所の値は第10図
(ロ)により“1"であるので、k=1としたのち(ステ
ップ)、ステップを経由してステップに戻る。
(15)RCファイルの引数k=1の個所の値が“0"である
かを判定する。この場合、RCファイルの引数k=1の個
所には既に“1"が書き込まれているのでステップに進
む(ステップ)。
(16)RCファイルの引数k=1の個所の値が“1"を引数
l、すぬわち、l=1とする(ステップ)。次に、引
数kの値を引数m、すなわち、m=1とする(ステップ
)。さらに、引数iの値を引数k、すなわち、k=2
とする(ステップ)。
(17)RCファイルの引数k=2の個所なl=1を書き込
む。すなわち、既に書き込まれた複片番号j=2が“1"
に変更される(ステップ)。
(18)RSファイルの引数k=2の個所の値をkとする。
この場合、RSファイルの引数k=2の個所の値は第10図
(ロ)により“1"であるので、k=1となる(ステップ
)。
(19)引数kとmとが一致するかを判定する。この場合
には、k=m=1で一致するのでステップに戻る(ス
テップ)。これにより、RSファイルの2−1の連結の
処理が終了し、単片2に複片番号j=1が付与される。
引数kとmとが一致しない状態は、単片が2つ以上の連
結の場合に生じる。
(20)以上の処理を、ステップで引数iが単片総数N
SSよりも大きくなるまで繰り返し実行することにより、
RCファイルが第10図(ハ)のように作成され、各単片1
〜18に複片番号1〜3が付与される。
このようにして、複片番号を付与することにより複片
(独立パターン)の数が高速で判るとともに、各単片の
中で互いに接続される単片に同じ複片番号を付与するこ
とにより、第9図に示すような複雑に入り組んだ図形パ
ターンでも複片番号−単片番号−セグメントという追跡
を行うことにより独立パターンを構成するセグメントを
抽出することができる。これにより、独立パターンを構
成するセグメントの座標、セグメント長等を用いて各独
立パターン毎に面積AC,幅WC,高さHC,左点,右点の最大
X,Y及び最少座標XR,XL,YT,YB、さらには中心座標XC,YC
等を高速で全て求めることができるようになり、独立パ
ターンを切り出すための最適な外接枠(外接四角形)を
高速で設定することができる。
次に、この発明とは別問題であるが、上記の如くして分
離された独立パターンについて、どのように認識を行う
かの一例を文字パターンについて説明する。
第13図は文字パターンの切り出し方法を説明するための
説明図、第14図は文字の量子化画像とその外接枠(外接
四角形)との関係を説明する説明図、第15図は第14図の
量子化画像のビットマトリックスを示す説明図、第16図
は第14図のパターンと対応する標準のビットマトリック
ス例を示す説明図である。
まず、文字の切り出しを行なうが、その方法には次の2
通りものが考えられる。
1)刻印文字の場合のように、文字パターンが局部的に
細く文字パターンが切れている場合、または切削痕,
油,煤汚れ等のパターンが小さい粒状のノイズパターン
として発生する場合は、まず、汚れあるいは傷パターン
を面積,幅または高さによって除去し、残ったパターン
から文字の大きさに相当するパターンを探す。そして、
第13図の如く文字の大きさに相当するパターンの中心PC
を基準にして他の文字パターンとの中心距離DPにもとづ
いて文字中心PCを外挿して行き、予め決められた大きさ
の探索枠(幅WA,高さHA)内に含まれるパターンを文字
パターンを考える方法である。なお、第13図は文字“A"
の方はノイズパターンの影響を受けておらず、文字“B"
の方がノイズパターンNPによる影響を受けている場合の
例である。したがって、同図の文字“B"の如くノイズNP
が存在する場合、文字枠としては文字高さの上限HBの範
囲内とし、それを越える部分については無視することと
する。ただし、対象パターンが1文字の場合は文字枠の
外挿が不能である。
2)文字パターンが鮮明で、ノイズパターンが存在しな
いと考えられる場合は、高さHU(上限),HL(下限)、
幅WU(上限),WL(下限)で決まる文字枠内に入るパタ
ーンを文字パターンとする。つまり、文字パターンの幅
および高さをそれぞれWC,HCとするとき、 WL≦WC≦WU,HL≦HC≦HU の条件を満たすものを文字パターンとする。
このようにして、各文字パターンの切り出しを行ない文
字枠を抽出する。第14図は文字“5"と文字枠Lを示す図
であり、最大X,Y座標および最小X,L座標はそれぞれXFR,
YFBおよびXFL,YFTである。なお、この場合、文字パター
ンは横向きであるが、横向きであるか縦向きであるかは
本質的なことではない。
次に、上述の如くして切り出された文字枠の、例えばX
軸方向を24、Y軸方向を12にそれぞれ分割し、分割され
た小領域毎に文字パターンが存在する場合を例えば
“1"、存在しない場合を“0"として、第15図の如く表現
し、これを行列またはマトリックスと考えて、以降ビッ
トマトリックスBと呼ぶこととする。なお、第15図の空
白個所は“0"を示すものである。
一方、各文字毎に予めビットマトリックスを測定してお
き、該マトリックスの各要素を以下の4種類のビットま
たはエレメントに分類する。
(イ)パターンビット;常に“1"となる要素。
(ロ)ブランクビット;常に“0"となる要素。
(ハ)マスクビット;“1"か“0"か不足の要素。
(ニ)デフオメーションビット;水平または垂直方向の
ビットの連なりで、そのうちのいずれか1つが“1"であ
ればその連なり全体を“1"としてもよい要素。
第16図は例えば文字“5"について予め測定したビットマ
トリックスの例を示すものである。なお、同図には記号
で表現されているが、空白部はブランクビットを、
(△)印はマスクビットを、また(□−□)印はデフォ
メーションビットをそれぞれ示すものである。また、同
図はパターンビットが含まれない例である。
このようにして、識別の対象となる全ての文字,図形パ
ターンに対してビットマトリックスBを測定するととも
に、その各要素を上記の4種類に分類してビットマトリ
ックス▲BK S▼、マスクビックマトリックス▲BK M▼お
よびデフォメーションオペレータDを各文字毎に定義
するとともに、測定ビットマトリックスBに作用するデ
フォメーションオペレータDを各文字k毎に定義す
る。なお、ビットマトリックスおよびデフォメーション
オペレータの決め方は次の通りである。
また、所定の文字KとビットマトリックスBで表される
未知の文字パターンとの距離Dを次式によって定義す
る。
〔▲BK M▼(i,f)∧D(B(i,j))〕} ただし、第16図はM=12,N=24の場合である。また、
(∀)は排他的論理和演算、(∧)は論理積算演算を施
することを意味する。
上記の距離{D}を全ての文字パターンについて求
め、そのうちの最小値D1とその大きな距離D2を求める。
そして、最小値D1をとるパターンをK1とし、 D1≦DU(設定値) D2−D1≧DL(設定値) なる条件を満たすとき前記未知パターンをパターンK1
判定する。なお、上記設定DU,DLは文字読取りの場合
と、文字検査の場合とではその値を異ならせるものであ
る。
以上のように、本発明によれば、複数のパターンあ含む
画面を走査して得られる出力信号を2値化することによ
り各パターンを背景から分離して走査線毎にセグメント
化し、各セグメントについて単片−複片というような連
結処理を行って独立パターンを分離するようにしたの
で、独立パターンの数が複片番号として高速で判るとと
もに、各単片の中で互いに接続される単片に同じ複片番
号を付与することにより、複雑に入り組んだ図形パター
ンでも複片番号−単片番号−セグメントという追跡を行
うことにより独立パターンを構成するセグメントを抽出
することができ、これにより、独立パターンを構成する
セグメントの特徴量に基づいて外接四角形によって独立
パターンを切り出すことが容易となるという効果を得る
ことができる。
【図面の簡単な説明】
第1図は従来の荷重パターンによる文字識別方式を説明
するための説明図、第2図はこの文字の発明の実施例を
示すブロック図、第3図は文字“W"の2値化画像を示す
説明図、第4図は第3図の画像のセグメント化された様
子を説明する説明図、第5図はセグメント情報から抽出
される各種の特徴抽出情報を説明する説明図、第6図は
特徴抽出回路の構成を示すブロック図、第7図はセグメ
ントの単片番号を説明する説明図、第8図は単片番号レ
ジスタを示す構成図、第9図は任意パターンの単片番号
とその単片領域との関係を示す説明図、第10図は第9図
における単片番号の組と単片,複片ファイルとを説明す
る説明図、第11図は単片ファイル作成プログラムを示す
フローチャート、第12図は複片ファイル作成プログラム
を示すフローチャート、第13図は文字パターンの切り出
し方法を説明するための説明図、第14図は文字パターン
の量子化画像とその外接枠との関係を説明する説明図、
第15図は第14図の量子化画像のビットマトリックスを示
す説明図、第16図は第14図のパターンと対応する標準の
ビットマトリックス例を示す説明図である。 符号説明 1……固体撮像装置(カメラ)、2……2値化回路、3
……特徴抽出回路、4,6,7……メモリ、5……演算処理
装置(マイクロプロセッサ)、8……判定出力部、9…
…局部メモリ、10……スタートセグメント検出回路、11
……単片番号カウンタ、12……単片番号レジスタ、13…
…右点検出回路、14……X座標発生回路、15……Y座標
発生回路、16……セグメント長カウンタ、17……合流検
出回路、18……合流回数カウンタ、19……セグメント数
カウンタ。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】複数のパターンを含む画面を走査して得ら
    れる出力信号を2値化することにより各パターンを背景
    から分離して走査線毎にセグメント化し、セグメントの
    集合体からなる各パターンを独立のパターンとしてぞれ
    分離し、分離された各パターンに番号を付与する複数パ
    ターン処理装置であって、前走査における何れのセグメ
    ントとも接続しないセグメントを抽出する手段と、該手
    段により抽出された各セグメントに発生順番を示す単片
    番号を付与する手段と、前走査における何れか1つのセ
    グメントと接続するセグメントに対しては同じ単片番号
    を付与し、前走査における複数のセグメントと接続する
    セグメントに対しては何れか1つのセグメントと同じ単
    片番号を付与することにより各セグメントを単片として
    分離する手段と、前走査における2つのセグメントが現
    走査において接続する場合に、2つのセグメントの単片
    番号を対として第1ファイルに順次記憶させる第1処理
    手段と、該第1ファイルに記憶された単片番号の対を読
    出し、各単片に接続される単片の単片番号を記憶した単
    片ファイルを作成する第2処理手段と、該単片ファイル
    に記憶された単片番号を読出し、互いに接続される単片
    の集合を示す複片番号を各単片に順次付与する第3処理
    手段とを具備したことを特徴とする複数パターン処理装
    置。
JP2221659A 1990-08-23 1990-08-23 複数パターン処理装置 Expired - Lifetime JPH0769935B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2221659A JPH0769935B2 (ja) 1990-08-23 1990-08-23 複数パターン処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2221659A JPH0769935B2 (ja) 1990-08-23 1990-08-23 複数パターン処理装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP57109746A Division JPS59790A (ja) 1982-06-28 1982-06-28 パタ−ン識別装置

Publications (2)

Publication Number Publication Date
JPH03228194A JPH03228194A (ja) 1991-10-09
JPH0769935B2 true JPH0769935B2 (ja) 1995-07-31

Family

ID=16770249

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2221659A Expired - Lifetime JPH0769935B2 (ja) 1990-08-23 1990-08-23 複数パターン処理装置

Country Status (1)

Country Link
JP (1) JPH0769935B2 (ja)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
昭和57年電気学会全国大会講演論文集第13分冊No.1267,昭和57年3月10日,社団法人電気学会発行

Also Published As

Publication number Publication date
JPH03228194A (ja) 1991-10-09

Similar Documents

Publication Publication Date Title
EP1497787B1 (en) System and method for identifying and extracting character strings from captured image data
JP2951814B2 (ja) 画像抽出方式
JPH0467234B2 (ja)
CN101122953A (zh) 一种图片文字分割的方法
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
JP2000285190A (ja) 帳票識別方法および帳票識別装置および記憶媒体
JP2008011484A (ja) 文字図形列抽出装置,文字図形列抽出方法,その方法を実行するプログラム,そのプログラムを記録した記録媒体
JPH07105312A (ja) 光学式文字読取装置における文字イメージのごみ除去方法及び装置
JPH09311905A (ja) 行検出方法および文字認識装置
JPH0256707B2 (ja)
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JP4867894B2 (ja) 画像認識装置、画像認識方法及びプログラム
JP2005250786A (ja) 画像認識方法
JP4228592B2 (ja) 文字認識装置
JPH0769935B2 (ja) 複数パターン処理装置
Peng et al. Document image matching based on component blocks
JP4194309B2 (ja) 文書方向推定方法および文書方向推定プログラム
JP2001126027A (ja) ナンバープレート認識装置
JP3077929B2 (ja) 文字切出し方式
JP4132234B2 (ja) 文字認識方法および装置および文字認識プログラムを記録した記録媒体
JP2000207490A (ja) 文字切出装置、および文字切出方法
JP3112190B2 (ja) 認識対象領域の設定方法
JPH04260980A (ja) 図形認識装置
JP2000113101A (ja) 文字切り出し方法および装置
JP3039427B2 (ja) 文字切り出し方式及び方法