JPH0769935B2

JPH0769935B2 - 複数パターン処理装置

Info

Publication number: JPH0769935B2
Application number: JP2221659A
Authority: JP
Inventors: 保夫本郷
Original assignee: Fuji Electric Co Ltd
Current assignee: Fuji Electric Co Ltd
Priority date: 1990-08-23
Filing date: 1990-08-23
Publication date: 1995-07-31
Anticipated expiration: 2010-07-31
Also published as: JPH03228194A

Description

【発明の詳細な説明】この発明は、刻印文字または印刷文字等のパターンの識
別のための前処理として、１画面内の複数のパターンを
背景から分離して走査線毎にセグメント化し、セグメン
トの集合体からなる各パターンを独立のパターンとして
それぞれ分離し、処理するために用いられる複数パター
ン処理装置に関するものである。

従来、この種のパターン識別方式として、マトリックス
マッチング法と呼ばれる方法がある。

第１図はかかる方法を説明するための説明図である。こ
れは、文字毎に荷重パターンと称される特徴が予め決め
られているもので、同図には文字“B"の荷重パターンが
示されている。すなわち、各文字が含まれる領域を複数
の小領域に分割し、該領域毎に荷重または重み付け（図
では数字をもって示されている。）をする。この重み付
けは各文字毎に異なり、したがって標準の文字の荷重パ
ターンと読み取られた文字等の荷重パターン（入力パタ
ーン）とを比較することにより文字の識別を行うことが
できる。

しかるに、この方法によれば、標準文字の荷重パターン
と入力パターンとの相対的な位置ずれ、または文字線幅
の変動等によって一致度が変化し、不安定となる欠点を
有している。したがって、本出願人と上記の欠点を除去
すべく形状マトリックスによる文字識別方式（特開昭58
−78273号）を提案している。これは、各文字を例えば
９×８の小領域に分割し、該分解された領域内にパター
ンが存在するか否かによって、各文字毎の形状マトリッ
クスを考え、該形状マトリックスと標準の形状マトリッ
クスとを比較することにより文字を識別する。しかし、
この方法によれば、例えば刻印文字を読み取る場合、打
刻面の切削痕や煤などの汚れによって読み取られる文字
の形状マトリックスが変動し、したがって正確な識別が
困難となり、また、９×８の形状マトリックスでは、文
字の種類が多くなると（10以上）、読み取りが出来なく
なるという欠点を有している。

このために、刻印文字等をテレビカメラにより撮像して
得られるビデオ信号を２値化することによりセグメント
化し、該セグメント化された情報からその特徴量を抽出
してメモリに記憶させ、該記憶された情報に基づいて所
定の演算処理により刻印文字等を識別することが考えら
れている。すなわちセグメントの連結性を解析すること
により未知の文字パターンをいくつかのセグメントの集
合に分類するとともに、この分類に基づいて文字パター
ンを外接四角形によって未知パターンとして切出しを行
い、この未知パターンについて識別処理を行うのであ
る。

ところで、未知の文字パターンの切出しのために、従来
は未知パターンをセグメントに分解して、各セグメント
からセグメント長、座標、スタート情報、合流情報、接
続情報等をハード的に抽出してメモリ上に記録してい
き、これらの情報によってソフト的に連結しているセグ
メントの集合から独立のパターン（一文字パターン）を
分離し、その特徴量に基づいて外接四角形によって独立
パターンを切り出すことが行われているが、独立パター
ンの分離のための処理は煩雑であり、しかも相当の時間
を要するのが普通であった。

この発明は、上記に鑑み、未知のパターンをいくつかの
セグメントの集合（単片と呼ぶ）に分離し、各単片の中
で互いに接続される単片の集合（含片と呼ぶ）に同じ番
号を付与することにより、容易に独立のパターンを分類
することが可能な複数パターン処理装置を提供すること
を目的とする。

その特徴は、複数のパターンを含む画面を走査して得ら
れる出力信号を２値化することにより各パターンを背景
から分離して走査線毎にセグメント化し、セグメントの
集合体からなる各パターンを独立のパターンとしてそれ
ぞれ分離し、分離された各パターンに番号を付与する複
数パターン処理装置であって、前走査における何れのセ
グメントとも接続しないセグメント抽出する手段と、該
手段により抽出された各セグメントに発生順番を示す単
片番号を付与する手段と、前走査における何れか１つの
セグメントと接続するセグメントに対しては同じ単片番
号を付与し、前走査における複数のセグメントと接続す
るセグメントに対しては何れか１つのセグメントと同じ
単片番号を付与することにより各セグメントを単片とし
て分類する手段と、前走査における２つのセグメントが
現走査において接続する場合に、２つのセグメントの単
片番号を対として第１ファイルに順番記憶させる第１処
理手段と、該第１ファイルに記憶された単片番号を読み
出し、各単片に接続される単片の単片番号を記憶した単
片ファイルを作成する第２処理手段と、該単片ファイル
に記憶された単片番号を読出し、互いに接続される単片
の集合を示す複片番号を各単片に順次付与する第３処理
手段とを具備する点にある。

以下、この発明の実施例を図面を参照して説明する。

第２図はこの発明の実施例を示すブロック図、第３図は
文字“W"の量子化画像を説明する説明図、第４図はセグ
メント化された画像を説明する説明図、第５図は第４図
に示されるセグメント情報から抽出された各種の特徴抽
出情報を説明する説明図である。

第２図において、１は例えばMOSトランジスタまたはCCD
（Charge Coupled Device）形の固体撮像装置（以
下、単にカメラともいう。）、２は２値化回路、３は特
徴抽出回路、４は画像データ記憶回路（RAM1）、５はマ
イクロプロセッサ等の演算処理装置、６は主としてプロ
グラムが記憶されるＰ−ROMタイプのメモリ、７は主と
してデータが記憶されるメモリ（RAM2）、８は判定出力
部である。

すなわち、対象となる文字，図形をカメラ１を用いてＸ
方向に水平走査しながら順次Ｙ方向に垂直走査を行い、
各水平走査によって得られるビデオ信号を２値化回路２
により或るしきい値レベルで２値化する。なお、この２
値化画像を模式的に示すと、第３図の如くなる。文字パ
ターンの存在するところを、例えば“1"で表し、該パタ
ーンが水平走査線と交わる論理レベル“1"の連なりをセ
グメントと呼ぶことにすると、各文字パターンは第４図
の如く各水平走査毎（SC₈,SC₉,SC_i,SC_K……）にセグメ
ント化（SE₈₁,SE₈₂,SE_ij,SE_kl……）され、したがって
文字パターンはこれらのセグメントのかたまりで表すこ
とができる。この各セグメントが同一の文字パターンに
属していると識別するためには、セグメント毎に座標比
較を行うことが必要である。例えば、現在走査しいる走
査線が現走査SC₉であると、現走査SC₉のセグメントSE₉₁
が１つ前の走査線であるSC₈のセグメントSE₈₁と同一パ
ターンに属するものであると判断するためには、現走査
SC₉と前走査SC₈のセグメントのＹ座標が１つだけ異なっ
ていて、しかもセグメントSE₈₁,SE₉₁のＸ座標が一部分
でも重なっていることである。そこで、これらの関係を
明瞭に把握しうるようにするために各セグメントについ
てスタート情報，合流情報および接続情報を考える。す
なわち、スタート情報は前走査においていずれのセグメ
ントとも重ならないセグメント、つまり現走査において
始めて出現するセグメントに対してつけられるもので、
第４図ではSE₈₁,SE₈₂,SE_ijがそれである。また、接続情
報は各走査線上に出現するセグメントの発生順番を表
し、合流情報はセグメントの重なり具合を示すもので、
前の走査線上にある２本以上のセグメントが互いに接続
していることを表す。そして、スタート情報が付される
各セグメントと接続または合流しているセグメントは同
一の単片に属するものとして各セグメントSE₈₁,SE₈₂,SE
_ijにそれぞれ単片番号1,2,3を付ける。なお、合流情報
が付されるセグメント、例えばSE_k+1には右側のセグメ
ントSE_k2と同一の単片番号をつけるものとする。

このようにして、セグメント化された画像データから第
５図の如き特徴がそれぞれ抽出される。すなわち、同図
（イ）には上述のセグメントの単片番号が、同図（ロ）
には各セグメントの右端座標が、同図（ハ）にはＹ座標
（水平走査線の番号）が、同図（ニ）にはセグメント長
が同図（ホ），（ヘ）には合流している端片番号の組
が、同図（ト）にはセグメントの総個数が、同図（チ）
には合流回数が、また同図（リ）には端片の個数がそれ
ぞれ示され、同図の如き態様で記憶装置４（第１図参
照）に記憶される。なお、セグメント長Ａは右端Ｘ座標
（X_R）と左端Ｘ座標（X_L）との差に＋１した値で表され
る（X_R−X_L＋１）が＋１するのは右端および左端座標が
等しい場合はセグメント長が零となり、不都合であるか
らである。

第６図は上述の如き各特徴量を抽出する特徴抽出回路の
構成を示すブロック図である。

同図において、９は走査線３本分の今回，前回および前
々回の２値化信号を記憶する３×３局部メモリ、10はス
タートセグメント検出回路、11は単片番号カウンタ回
路、12は単片番号レジスタ、13は右点検出回路、14はＸ
座標発生回路、15はＹ座標発生回路、16はセグメント長
カウンタ回路、17は合流検出回路、18は合流回数カウン
タ回路、19はセグメント数カウンタ回路である。

先の２値化回路により２値化されたビデオ信号は、まず
３×３局部メモリ９に入力され、その出力から検出回路
10ではスタートセグメントを検出し、カウンタ回路11で
カウントして最新の単片番号を単片番号レジスタ12に記
憶する。右点検出回路13では各セグメントの右点の位置
を検出するとともに、そのタイミングでＸ座標,Y座標発
生回路14,15からの出力X_R,Y_Rを画像メモリ４（第１図参
照）へ書き込む。カウンタ回路16では２値化信号が“1"
の領域をカウントし、セグメント長Ａとして出力する。
一方、検出回路17では局部メモリ９の出力から合流を検
出して合流回数（N_TJ）カウンタ回路18へ供給するとと
もに、単片番号レジスタ12へ入力する。単片番号レジス
タ12によって合流を情報が検出されると、結合される単
片情報E₁,E₂を出力する一方、単片番号N_Sを毎回出力す
る。セグメント数カウンタ回路19では右点検出信号をカ
ウントしてセグメント総数N_TSを出力する。

第７図は各セグメントの単片番号を説明する説明図、第
８図は該単片番号を一時的に記憶するレジスタ（第６図
の記号12を参照）の内容を説明するための説明図であ
る。

すなわち、第４図および第５図においても説明したよう
に、例えば文字“W"をセグメント化し各セグメントの水
平走査線上に現れる順番とスタート情報とにもとづいて
各セグメントに番号、つまり単片番号を付すことにする
と、該文字“W"は第７図に示される如く“1",“2"およ
び“3"なる単片番号が付されたセグメントの集合と考え
ることができる。ここで、例えばセグメントの水平走査
線SC₁₉（Ｙ＝19）およびSC₂₀（Ｙ＝20）上に現れる順
番、すなわち単片番号について考えると、同図からも明
らかなように走査線SC₁₉の現走査ラインでは1,3,3およ
び２であり、走査線SC₂₀の現走査ラインでは３および２
であるから、単片番号レジスタにはこれらの情報が第８
図の如く記憶される。なお、該レジスタの前回の走査結
果も第８図の如く記憶され、したがって、これらの内容
を調べることによって単片の個数N_SSおよび互いに合流
する単片番号の組E₁,E₂をしることができる。このよう
にして、１つの文字パターンは単片番号が付されたセグ
メントの集合と考えられるので、特徴抽出回路によって
各文字パターンからその特徴を抽出することができる。
なお、このようにして得られる文字パターンの各特徴量
はメモリ（RAM1）に記憶されるので、第２図に示される
マイクロプロセッサμ−CPU等の演算処理装置５は該記
憶情報およびＰ−ROM6に記憶されたプログラムにもとづ
き所定の演算処理をすることにより文字パターンを識別
する。

以上は、主として簡単な文字パターンについて説明した
が、一般的に複雑な文字，図形パターンも上記と同様に
処理することができる。以下、その処理方法について簡
単に説明する。

第９図に任意パターンの単片番号とその単片領域との関
係を示す説明図、第10図は第９図における単片番号の組
と単片および複片ファイルとを説明する説明図、第11図
は単片ファイル作成プログラムを示すフローチャート、
第12図は複片ファイル作成プログラムを示すフローチャ
ートである。なお、第11図、第12図においてi,j,k,l,m
等は種々設けられているファイルの各引数を示し、E
₁（ｉ）,E₂（ｉ）は引数ｉにおけるファイルE₁,E₂の内
容F_T（ｊ）は引数ｉにおけるファイルF_Tの内容R
_S（i₁）,R_S（i₂）は引数i₁,i₂におけるファイルR_Sの内
容、R_c（ｋ）は引数ｋにおけるファイルR_cの内容をそれ
ぞれ示している。

すなわち、対象パターンが第９図に示される如き複雑な
図形である場合にも、上記と同様にしてスタート情報に
もとづき各セグメントに同図の数字で示される如き単片
番号１〜18を付ける。したがって、この場合は単片総数
N_SS＝18で、合流回数N_TJ＝17である。また、同図の点線
は各単片の領域をわかり易くするために付したもので、
この点線の部分で各セグメントが合流（ジョイント）し
ていること、例えばセグメント１と2,セグメント３と1,
セグメン５と４…が合流していることがわかるので、こ
れらを対として第10図（イ）の如きE₁,E₂ファイルに記
憶する。なお、E₁は左側,E₂は右側の各セグメントファ
イルを示す。

次に、このE₁,E₂ファイルから同図（ロ）の如き単片フ
ァイルR_Sを作成する手順について説明する。

つまり、単片ファイルR_Sは引数として単片番号１〜18が
与えられとり、かつファイルは最初はゼロクリアされて
いる。そして、E₁,E₂ファイルを引数ｉを更新しながら
上から順に読み出し、単片E₂と連結する単片E₁を順次調
べ互いに重複するもの、また冗長なものを除去しながら
次のように単片ファイルR_Sに作成する。

（１）E₁,E₂ファイルのｉ＝１では、E₂＝2,E₁＝１であ
るから、E₂＝２に基づき単片ファイルR_S（以下において
は単にR_Sと記載する）の引数ｉ＝２のところに単片１を
入れる。

（２）ｉ＝２では、E₂＝1,E₁＝３であるから、E_Sの引数
ｉ＝１のところに単片３を入れる。

（３）ｉ＝３では、E₂＝4,E₁＝５であるから、E_Sの引数
ｉ＝４のところに単片５を入れる。

（４）ｉ＝４では、E₂＝2,E₁＝６でR_Sの引数ｉ＝２のと
ころに単片６が入るべきところ、ｉ＝２には既に単片１
が入っており、単片番号１（ｉ＝１）のところには単片
３がはいっているが、単片番号３のところは空いている
ので、ここに単片６を入れる。

（５）ｉ＝５では、E₂＝4,E₁＝７であるから、R_Sの引数
ｉ＝４のところに単片７を入れるべきところ、ここには
単片５が入っているので、単片番号５のところに単片７
を入れる。

（６）ｉ＝６では、E₂＝10,E₁＝11であるから、R_Sの引
数ｉ＝10のところに単片11を入れる。

（７）ｉ＝７では、E₂＝9,E₁＝８であるから、R_Sの引数
ｉ＝９のところに単片８を入れる。

（８）ｉ＝８では、E₂＝10,E₁＝４であるが、R_Sの引数
ｉ＝10のところはすでに単片11が入っており、R_Sの単片
番号11のところは空いているので、ここに単片番号４を
入れる。

（９）ｉ＝９では、E₂＝10,E₁＝12であるが、R_Sの引数
ｉ＝10のところには単片11,i＝11には単片4,i＝４には
単片5,i＝５には単片７がそれぞれ入っており、ｉ＝７
は空いているので、ここに単片番号12を入れる。

（10）ｉ＝10では、E₂＝10,E₁＝７であるが、（９）で
単片７はR_Sの引数ｉ＝５に既に入っていて重複するの
で、無視する。

（11）ｉ＝11では、E₂＝9,E₁＝10であるが、R_Sの引数ｉ
＝９には単片8,i＝８には単片10が入っていてこれも重
複するので、無視する。

（12）ｉ＝12では、E₂＝13,E₁＝14であるから、R_Sの引
数ｉ＝13のところに単片14を入れる。

（13）ｉ＝13では、E₂＝16,E₁＝13であるから、R_Sの引
数ｉ＝16のところに単片13を入れる。

（14）ｉ＝14では、E₂＝15,E₁＝９であるから、R_Sの引
数ｉ＝15のところに単片９を入れる。

（15）ｉ＝15では、E₂＝17,E₁＝13であるから、R_Sの引
数ｉ＝17のところに単片13を入れる。

（16）ｉ＝16では、E₂＝15,E₁＝10であるが、R_Sの引数
ｉ＝15には９、ｉ＝９には８、ｉ＝８にはすでに10が入
っているので、これも無視する。

（17）ｉ＝17では、E₂＝18,E₁＝１であるので、R_Sの引
数ｉ＝18のところに単片１を入れる。

なお、R_Sの引数ｉ＝6,12,14の個所にも入れられなかっ
たので、ゼロ設定のままとして残る。

以上のように、単片ファイルR_Sは合流している単片番号
の組E₁,E₂の関係から互いに重複するもの、または冗長
なものを除去することにより作成されるが、その作成プ
ログラム例を示すのが第11図である。

同図を簡単に説明すると、ステップ〜はファイルE₁
とE₂の内容を比較し、両者の内容が等しくないとき、E₁
の引数ｉをE₁の内容で置き換える一方、F_Tファイルの引
数ｊを１にする操作を示す。なお、F_Tファイルは単片E₁
と連結する単片の重複関係を調べるための一時ファイル
である。また、ステップ〜は引数i₁を基点とした単
片のつらなり（連結したもの）の集合をF_Tファイルに書
き込む操作を示し、ステップ〜はE₂ファイルの引数
i₂がF_Tファイルの中に含まれる単片か否かをチェック
し、含まれていれば次の連結対（ｉ←ｉ＋１）のチェッ
クに移る操作を示している。さらに、〜のループで
は引数i₂を基点としてファイルR_Sの連結単片集合がF_Tフ
ァイルと同一の単片を含まないことをチェックしてい
る。

第11図の処理における各ステップの意味を第９図、第10
図を参照して詳細に説明すると次のとおりである。

〔ステップ〕 E₁,E₂ファイル引数ｉ＝１の個所のE₁＝1,E₂＝２を読み
出す。

〔ステップ〕 E₁とE₂が不一致であるかを判定する。この場合には、E₁
＝1,E₂＝２であるので不一致と判定され、ステップへ
進む。

〔ステップ〕 E₁＝１の値をi₁とする。すなわち、i₁＝１となる。

〔ステップ〕 F_Tファイルの引数ｊ＝１とする。

〔ステップ〕 F_Tファイルの引数ｊ＝１の個所にi₁＝１を書き込む。

〔ステップ〕 R_Sファイルの引数ｉ＝１の個所の値をi₁の値とする。こ
の場合、R_Sファイルの引数ｉ＝１の個所はゼロクリアさ
れているので、i₁＝０となる。

〔ステップ〕 F_Tファイルの引数ｊ＝２とする。

〔ステップ〕 i₁＝０であるかを判定する。この場合、ステップにお
いてi₁＝０となっているので、ステップに進む。

〔ステップ〕 F_Tファイルの引数ｊから減算した値をＪとする。ステッ
プでｊ＝２になっているので、Ｊ＝１となる。

〔ステップ〕 E₂ファイルの引数ｉ＝１の個所のE₂＝２の値をi₂とす
る。すなわち、i₂＝２となる。

〔ステップ〕 F_Tファイルの引数ｊ＝１とする。

〔ステップ〕 F_Tファイルの引数ｊ＝１の個所の値とi₂とが不一致であ
るかを判定する。この場合、F_Tファイルの引数ｊ＝１の
個所にはステップでi₁＝１が書き込まれており、i₂＝
２であるので不一致と判定され、ステップに進む。

〔ステップ〕 F_Tファイルの引数ｊを加算する。すなわち、ｊ＝２とな
る。

〔ステップ〕 F_Tファイルの引数ｊとステップで求められたＪの大小
関係を比較する。この場合、ｊ＝2,J＝１であるのでｊ
＞Ｊとなり、ステップに進む。

〔ステップ〕 i₂＝２の値をi₂′とする。すなわち、i₂′＝２となる。

〔ステップ〕 R₂ファイルの引数ｉ＝２の個所の値i₂の値とする。この
場合、R_Sファイルの引数ｉ＝２の個所はゼロクリアされ
ているので、i₂＝０となる。

〔ステップ〕 i₂＝０であるかを判定する。この場合、ステップでi₂
＝０となっているので、ステップに進む。

〔ステップ〕 R₂ファイルの引数ｉ＝２（i₂′＝２であるので）の個所
にE₁＝１を書き込む。これにより、前述の（１）の処理
が行われる。

〔ステップ〕 E₁,E₂ファイルの引数ｉの加算に行われてｉ＝２とな
り、E₁,E₂ファイルの引数ｉ＝２の個所のE₁＝3,E₂＝１
の読み出しの準備が行われる。

〔ステップ〕 E₁,E₂ファイルの読み出しがN_TJまで達したかを判定する
ものである。

以下、ステップ〜までの処理を繰り返してE₁,E₂フ
ァイルの処理が行われるが、前述の（４）に示すように
R_Sファイルに既に他の単片番号が書き込まれている場合
には次の処理となる。すなわち、一旦ステップまで進
んだのち、i₂≠０となるのでステップに戻り、ステッ
プ，を通過するたびにR_Sファイルの引数ｉを２→１
→３と変えていき、R_Sファイルの引数ｉ＝３の個所が０
であることを見つけたのち、E₁＝６を書き込む。また、
前述の（10）のように無視する場合には、次の処理とな
る。すなわち、既に入っていて重複する場合にはステッ
プにおいてF_T（ｊ）＝i₂が成立するので、そこからス
テップに進み、書き込みが行われずに無視されるので
ある。

次に、こうして得られる単片ファイルR_Sをさらに整理す
ることにより、互いに接続される単片の集合である複片
（対象とする文字または図形のパターン）の番号を各単
片に付すための処理が行われるが、R_Sファイルから（１
−３−6,2−1,18−１）の連結，（４−５−７−12,8−1
0−11−4,9−8,15−９）の連結，（13−14−,16−13,17
−13）の連結があることがわかるので、これらの連結に
属する各単片には第10図（ハ）の如く、各連結ごとに同
一の複片番号（１），（２），（３）が付けられること
になる。その複片ファイルを示すのがR_Cである。その結
果、第９図における図形パターンの個数N_CSは、第10図
（ニ）にも示すように「３」となることがわかる。

以上の処理を示すのが第12図で、概略的にはステップ
〜で複片番号を更新、ステップ〜で複片番号の書
き換えを行い、ステップを経て最終的な複片総数N_TS
を出力するものである。R_Cは複片ファイル（第10図
（ハ）参照）を示し、これもファイルR_Sと同様最初はゼ
ロクリアされている。

第12図の処理により、第10図（ハ）のR_Cファイルを作成
する手順は次のとおりである。

（１）引数ｉ＝１とし（ステップ）、複片番号ｊ＝１
とする（ステップ）。さらに、R_Cファイルの引数ｋを
ｉ、すなわち、ｋ＝１とする（ステップ）。

（２）R_Cファイルの引数ｋ＝１の個所の値が“0"である
かを判定する。この場合、R_Cファイルの引数ｋ＝１の個
所はゼロクリアされているのでステップに進む（ステ
ップ）。

（３）R_Cファイルの引数ｋ＝１の個所に複片番号ｊの値
を書き込む。この場合、ステップにより複片番号ｊ＝
１であるので、“1"が書き込まれる（ステップ）。

（４）R_Cファイルの引数ｋ＝１の個所の値をｋとする。
この場合、R_Cファイルの引数ｋ＝１の個所の値は第10図
（ロ）により“3"であるので、ｋ＝３となる（ステップ
）。

（５）ｋが“0"であるかを判定する。この場合、ステッ
プによりｋ＝３であるので、ステップに戻る（ステ
ップ）。

（６）R_Cファイルの引数ｋ＝３の個所の値が“0"である
かを判定する。この場合、R_Cファイルの引数ｋ＝３の個
所はゼロクリアされているのでステップに進む（ステ
ップ）。

（７）R_Cファイルの引数ｋ＝３の個所に複片番号ｊの値
を書き込む。この場合、ステップにより複片番号ｊ＝
１であるので、“1"が書き込まれる（ステップ）。

（８）R_Cファイルの引数ｋ＝３の個所の値をｋとする。
この場合、R_Sファイルの引数ｋ＝３個所の値は第10図
（ロ）により“6"であるので、ｋ＝６となる（ステップ
）。

（９）ｋが“0"であるかを判定する。この場合、ステッ
プによりｋ＝６であるので、ステップに戻る（ステ
ップ）。

（10）同様の処理が行われてR_Cファイルの引数ｋ＝６の
個所に複片番号ｊ＝１が書き込まれたのちは、R_Sファイ
ルの引数ｋ＝６の個所の値が第10図（ロ）により“0"で
あるので、ステップに進む。これによりR_Sファイルの
１−３−６の連結の処理が終了し、単片1,3,6に複片番
号ｊ＝１が付与される。

（11）複片番号ｊ＝２とし（ステップ）、引数ｉ＝２
とする（ステップ）。

（12）引数ｉが単片総数N_SSより小さいかを判定する。
この場合には小さいのでステップに戻る（ステップ
）。

（13）同様の処理が行われて、ステップ〜によりR_C
ファイルの引数ｋ＝２の個所に複片番号ｊ＝２が書き込
まれる。

（14）R_Sファイルの引数ｋ＝２の個所の値をｋとする。
この場合、R_Sファイルの引数ｋ＝２の個所の値は第10図
（ロ）により“1"であるので、ｋ＝１としたのち（ステ
ップ）、ステップを経由してステップに戻る。

（15）R_Cファイルの引数ｋ＝１の個所の値が“0"である
かを判定する。この場合、R_Cファイルの引数ｋ＝１の個
所には既に“1"が書き込まれているのでステップに進
む（ステップ）。

（16）R_Cファイルの引数ｋ＝１の個所の値が“1"を引数
ｌ、すぬわち、ｌ＝１とする（ステップ）。次に、引
数ｋの値を引数ｍ、すなわち、ｍ＝１とする（ステップ
）。さらに、引数ｉの値を引数ｋ、すなわち、ｋ＝２
とする（ステップ）。

（17）R_Cファイルの引数ｋ＝２の個所なｌ＝１を書き込
む。すなわち、既に書き込まれた複片番号ｊ＝２が“1"
に変更される（ステップ）。

（18）R_Sファイルの引数ｋ＝２の個所の値をｋとする。
この場合、R_Sファイルの引数ｋ＝２の個所の値は第10図
（ロ）により“1"であるので、ｋ＝１となる（ステップ
）。

（19）引数ｋとｍとが一致するかを判定する。この場合
には、ｋ＝ｍ＝１で一致するのでステップに戻る（ス
テップ）。これにより、R_Sファイルの２−１の連結の
処理が終了し、単片２に複片番号ｊ＝１が付与される。
引数ｋとｍとが一致しない状態は、単片が２つ以上の連
結の場合に生じる。

（20）以上の処理を、ステップで引数ｉが単片総数N
_SSよりも大きくなるまで繰り返し実行することにより、
R_Cファイルが第10図（ハ）のように作成され、各単片１
〜18に複片番号１〜３が付与される。

このようにして、複片番号を付与することにより複片
（独立パターン）の数が高速で判るとともに、各単片の
中で互いに接続される単片に同じ複片番号を付与するこ
とにより、第９図に示すような複雑に入り組んだ図形パ
ターンでも複片番号−単片番号−セグメントという追跡
を行うことにより独立パターンを構成するセグメントを
抽出することができる。これにより、独立パターンを構
成するセグメントの座標、セグメント長等を用いて各独
立パターン毎に面積A_C,幅W_C,高さH_C,左点，右点の最大
X,Y及び最少座標X_R,X_L,Y_T,Y_B、さらには中心座標X_C,Y_C
等を高速で全て求めることができるようになり、独立パ
ターンを切り出すための最適な外接枠（外接四角形）を
高速で設定することができる。

次に、この発明とは別問題であるが、上記の如くして分
離された独立パターンについて、どのように認識を行う
かの一例を文字パターンについて説明する。

第13図は文字パターンの切り出し方法を説明するための
説明図、第14図は文字の量子化画像とその外接枠（外接
四角形）との関係を説明する説明図、第15図は第14図の
量子化画像のビットマトリックスを示す説明図、第16図
は第14図のパターンと対応する標準のビットマトリック
ス例を示す説明図である。

まず、文字の切り出しを行なうが、その方法には次の２
通りものが考えられる。

１）刻印文字の場合のように、文字パターンが局部的に
細く文字パターンが切れている場合、または切削痕，
油，煤汚れ等のパターンが小さい粒状のノイズパターン
として発生する場合は、まず、汚れあるいは傷パターン
を面積，幅または高さによって除去し、残ったパターン
から文字の大きさに相当するパターンを探す。そして、
第13図の如く文字の大きさに相当するパターンの中心P_C
を基準にして他の文字パターンとの中心距離D_Pにもとづ
いて文字中心P_Cを外挿して行き、予め決められた大きさ
の探索枠（幅W_A,高さH_A）内に含まれるパターンを文字
パターンを考える方法である。なお、第13図は文字“A"
の方はノイズパターンの影響を受けておらず、文字“B"
の方がノイズパターンN_Pによる影響を受けている場合の
例である。したがって、同図の文字“B"の如くノイズN_P
が存在する場合、文字枠としては文字高さの上限H_Bの範
囲内とし、それを越える部分については無視することと
する。ただし、対象パターンが１文字の場合は文字枠の
外挿が不能である。

２）文字パターンが鮮明で、ノイズパターンが存在しな
いと考えられる場合は、高さH_U（上限）,H_L（下限）、
幅W_U（上限）,W_L（下限）で決まる文字枠内に入るパタ
ーンを文字パターンとする。つまり、文字パターンの幅
および高さをそれぞれW_C,H_Cとするとき、 W_L≦W_C≦W_U,H_L≦H_C≦H_U の条件を満たすものを文字パターンとする。

このようにして、各文字パターンの切り出しを行ない文
字枠を抽出する。第14図は文字“5"と文字枠Ｌを示す図
であり、最大X,Y座標および最小X,L座標はそれぞれX_FR,
Y_FBおよびX_FL,Y_FTである。なお、この場合、文字パター
ンは横向きであるが、横向きであるか縦向きであるかは
本質的なことではない。

次に、上述の如くして切り出された文字枠の、例えばＸ
軸方向を24、Ｙ軸方向を12にそれぞれ分割し、分割され
た小領域毎に文字パターンが存在する場合を例えば
“1"、存在しない場合を“0"として、第15図の如く表現
し、これを行列またはマトリックスと考えて、以降ビッ
トマトリックスＢと呼ぶこととする。なお、第15図の空
白個所は“0"を示すものである。

一方、各文字毎に予めビットマトリックスを測定してお
き、該マトリックスの各要素を以下の４種類のビットま
たはエレメントに分類する。

（イ）パターンビット；常に“1"となる要素。

（ロ）ブランクビット；常に“0"となる要素。

（ハ）マスクビット；“1"か“0"か不足の要素。

（ニ）デフオメーションビット；水平または垂直方向の
ビットの連なりで、そのうちのいずれか１つが“1"であ
ればその連なり全体を“1"としてもよい要素。

第16図は例えば文字“5"について予め測定したビットマ
トリックスの例を示すものである。なお、同図には記号
で表現されているが、空白部はブランクビットを、
（△）印はマスクビットを、また（□−□）印はデフォ
メーションビットをそれぞれ示すものである。また、同
図はパターンビットが含まれない例である。

このようにして、識別の対象となる全ての文字，図形パ
ターンに対してビットマトリックスＢを測定するととも
に、その各要素を上記の４種類に分類してビットマトリ
ックス▲Ｂ^K _S▼、マスクビックマトリックス▲Ｂ^K _M▼お
よびデフォメーションオペレータＤ^Ｋを各文字毎に定義
するとともに、測定ビットマトリックスＢに作用するデ
フォメーションオペレータＤ^Ｋを各文字ｋ毎に定義す
る。なお、ビットマトリックスおよびデフォメーション
オペレータの決め方は次の通りである。

また、所定の文字ＫとビットマトリックスＢで表される
未知の文字パターンとの距離Ｄ^Ｋを次式によって定義す
る。

〔▲Ｂ^K _M▼（i,f）∧Ｄ^Ｋ（Ｂ（i,j））〕｝ただし、第16図はＭ＝12,N＝24の場合である。また、
（∀）は排他的論理和演算、（∧）は論理積算演算を施
することを意味する。

上記の距離｛Ｄ^Ｋ｝を全ての文字パターンについて求
め、そのうちの最小値D₁とその大きな距離D₂を求める。
そして、最小値D₁をとるパターンをK₁とし、 D₁≦D_U（設定値） D₂−D₁≧D_L（設定値）なる条件を満たすとき前記未知パターンをパターンK₁と
判定する。なお、上記設定D_U,D_Lは文字読取りの場合
と、文字検査の場合とではその値を異ならせるものであ
る。

以上のように、本発明によれば、複数のパターンあ含む
画面を走査して得られる出力信号を２値化することによ
り各パターンを背景から分離して走査線毎にセグメント
化し、各セグメントについて単片−複片というような連
結処理を行って独立パターンを分離するようにしたの
で、独立パターンの数が複片番号として高速で判るとと
もに、各単片の中で互いに接続される単片に同じ複片番
号を付与することにより、複雑に入り組んだ図形パター
ンでも複片番号−単片番号−セグメントという追跡を行
うことにより独立パターンを構成するセグメントを抽出
することができ、これにより、独立パターンを構成する
セグメントの特徴量に基づいて外接四角形によって独立
パターンを切り出すことが容易となるという効果を得る
ことができる。

【図面の簡単な説明】

第１図は従来の荷重パターンによる文字識別方式を説明
するための説明図、第２図はこの文字の発明の実施例を
示すブロック図、第３図は文字“W"の２値化画像を示す
説明図、第４図は第３図の画像のセグメント化された様
子を説明する説明図、第５図はセグメント情報から抽出
される各種の特徴抽出情報を説明する説明図、第６図は
特徴抽出回路の構成を示すブロック図、第７図はセグメ
ントの単片番号を説明する説明図、第８図は単片番号レ
ジスタを示す構成図、第９図は任意パターンの単片番号
とその単片領域との関係を示す説明図、第10図は第９図
における単片番号の組と単片，複片ファイルとを説明す
る説明図、第11図は単片ファイル作成プログラムを示す
フローチャート、第12図は複片ファイル作成プログラム
を示すフローチャート、第13図は文字パターンの切り出
し方法を説明するための説明図、第14図は文字パターン
の量子化画像とその外接枠との関係を説明する説明図、
第15図は第14図の量子化画像のビットマトリックスを示
す説明図、第16図は第14図のパターンと対応する標準の
ビットマトリックス例を示す説明図である。符号説明１……固体撮像装置（カメラ）、２……２値化回路、３
……特徴抽出回路、4,6,7……メモリ、５……演算処理
装置（マイクロプロセッサ）、８……判定出力部、９…
…局部メモリ、10……スタートセグメント検出回路、11
……単片番号カウンタ、12……単片番号レジスタ、13…
…右点検出回路、14……Ｘ座標発生回路、15……Ｙ座標
発生回路、16……セグメント長カウンタ、17……合流検
出回路、18……合流回数カウンタ、19……セグメント数
カウンタ。

Claims

【特許請求の範囲】

【請求項１】複数のパターンを含む画面を走査して得ら
れる出力信号を２値化することにより各パターンを背景
から分離して走査線毎にセグメント化し、セグメントの
集合体からなる各パターンを独立のパターンとしてぞれ
分離し、分離された各パターンに番号を付与する複数パ
ターン処理装置であって、前走査における何れのセグメ
ントとも接続しないセグメントを抽出する手段と、該手
段により抽出された各セグメントに発生順番を示す単片
番号を付与する手段と、前走査における何れか１つのセ
グメントと接続するセグメントに対しては同じ単片番号
を付与し、前走査における複数のセグメントと接続する
セグメントに対しては何れか１つのセグメントと同じ単
片番号を付与することにより各セグメントを単片として
分離する手段と、前走査における２つのセグメントが現
走査において接続する場合に、２つのセグメントの単片
番号を対として第１ファイルに順次記憶させる第１処理
手段と、該第１ファイルに記憶された単片番号の対を読
出し、各単片に接続される単片の単片番号を記憶した単
片ファイルを作成する第２処理手段と、該単片ファイル
に記憶された単片番号を読出し、互いに接続される単片
の集合を示す複片番号を各単片に順次付与する第３処理
手段とを具備したことを特徴とする複数パターン処理装
置。