JP2004030188A - 画像の領域分割方法、画像の領域分割装置、画像の領域分割プログラム - Google Patents
画像の領域分割方法、画像の領域分割装置、画像の領域分割プログラム Download PDFInfo
- Publication number
- JP2004030188A JP2004030188A JP2002184889A JP2002184889A JP2004030188A JP 2004030188 A JP2004030188 A JP 2004030188A JP 2002184889 A JP2002184889 A JP 2002184889A JP 2002184889 A JP2002184889 A JP 2002184889A JP 2004030188 A JP2004030188 A JP 2004030188A
- Authority
- JP
- Japan
- Prior art keywords
- block
- area
- image
- blocks
- divided
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
【解決手段】記憶手段12に格納された濃淡画像は、画像分割処理部13がそれぞれ複数個の画素を含む矩形状の複数個のブロックに分割する。特徴量演算部14はブロック内の濃度値の平均値および標準偏差を特徴量として求め、追跡処理部15では隣接するブロックのうち特徴量の差が閾値内であるブロックに同ラベルを付与する。同ラベルが付与されているブロックからなるブロック連結領域の境界部分に位置するブロックは、ブロック分割処理部16において分割ブロックに分割され、分割ブロックの特徴量が隣接するブロックの特徴量と類似していると、当該ブロックを含むブロック連結領域に当該分割ブロックが統合される。この処理が繰り返され多値画像に含まれる全画素にラベルが付与される。
【選択図】 図1
Description
【発明の属する技術分野】
本発明は、モノクロ濃淡画像、カラー画像、距離画像のように各画素の画素値を多段階に割り当てた多値画像を処理対象として、多値画像を画素値の類似度が高い画素群からなる複数個の領域に分割する画像の領域分割方法、画像の領域分割装置、画像の領域分割プログラムに関するものである。
【0002】
【従来の技術】
近年、画像によって各種対象物の識別、検査、計測、認識を行うために画像処理技術が利用されている。この種の画像処理技術では、画像内において対象物を識別する必要があるから、画像内において対象物を抽出する技術が各種提案されている。たとえば、撮像装置と対象物との位置関係に応じて適宜方向から照明を行うことによって画像内における対象物と背景との濃度値の差が大きくなるようにしておき、濃淡画像における各画素の画素値である濃度値に対して適宜の閾値を適用して濃淡画像を二値化することにより、対象物を背景から分離する技術が広く用いられている。
【0003】
しかしながら、濃淡画像を単純に二値化する技術では、対象物と背景との濃度値の差が不十分な場合や背景に地模様があるような場合には、背景から対象物を分離することができないという問題を有している。たとえば、光学式文字読み取り装置では文字の周囲に図柄や地模様が存在していると、文字の認識精度が低下するという問題が生じる。また、生産ラインにおいてコンベア上を搬送される物品を撮像した画像内でパターンマッチングを行うことによって物品の種別を判別するような場合に、画像内にベルトコンベアなどの画像が含まれていると部品を特定できない場合がある。
【0004】
そこで、画像内において類似した特徴を有する部分ごとに領域を分割することによって、着目する領域を画像内から抽出する技術が種々提案されている。
【0005】
たとえば、特開平11−167634号公報には、キー画像と同一あるいは類似した目的の画像を検索するために、カラー画像を小領域に分割し、平均色や代表色を特徴量として特徴量の類似する小領域を統合することにより多角形の分割領域を形成する技術が記載されている。また、この公報では小領域に多くの色が含まれるときには小領域を再分割し、再分割した小領域の画素数が閾値以上であれば、特徴量を求めて再分割した小領域について類似性を評価する技術が記載されている。
【0006】
また、特開平4−154368号公報には、文書画像を、文字、図形、表、写真などの構成要素に分割することを目的として、画像をブロック化し、隣接するブロックで特徴量が大きく異なる部分を輪郭部位とみなし、輪郭部位のブロック内でさらに領域を細分化する技術が記載されている。
【0007】
さらに、特開平1−312675号公報には、濃淡画像において濃度値にむらがある場合でも輪郭を正しく抽出するために、画像内の画素値を複数の閾値との大小比較により多段階に分割し、分割された各領域ごとに濃度の範囲を拡げたときの面積の増加の有無を判定し、面積が増加しなくなった時点で領域を確定する技術が記載されている。
【0008】
特開平8−167028号公報には、写真画像の処理のために画像を「ライト」「中間」「シャドウ」に分割するために、画像をブロック化し、ブロックを対ごとに類似度を評価することによりブロックを統合するクラスタリングを行い、クラスタリングにより形成された領域を統合の履歴を参照しながら再度評価を行って輪郭を確定する技術が記載されている。
【0009】
【発明が解決しようとする課題】
上述した各公報のうち、特開平11−167634号公報に記載の技術では、小領域内に多くの色が存在するときに小領域を再分割し、かつ分割した小領域の画素数が閾値以上であるときにのみ特徴量の類似性を評価するものであるから、1画素単位まで領域を分割することはできず、また図柄や地模様やノイズによって小領域内に多くの色が存在するようなときに、背景となる領域の分割数が多くなって処理時間が増加する可能性がある。
【0010】
特開平4−154368号公報に記載の技術では、隣接するブロック間の特徴量の差が大きく異なるときに輪郭部位とみなしているから、濃淡画像において濃度むらがある場合や輪郭が不鮮明である場合には、輪郭を正確に抽出することができないことがある。
【0011】
特開平1−312675号公報に記載の技術は、濃淡画像において濃度むらがある場合でも目的とする領域を抽出できる可能性があるが、図柄や地模様やノイズが領域内に残る可能性がある。
【0012】
特開平8−167028号公報に記載の技術では、クラスタリングにより3種類の領域に分割しているが、ノイズが存在する場合にノイズを十分に除去する技術ではなく、とくに文字認識や部品の種別認識のように対象物の領域を背景から分離する目的では採用することができない。
【0013】
本発明は上記事由に鑑みて為されたものであり、その目的は、複雑な背景であっても背景となる領域と対象となる領域とを明瞭に分離することが可能であって、しかも1画素単位までの領域の分割を可能としながらも高速な処理が期待できる画像の領域分割方法、画像の領域分割装置、画像の領域分割プログラムを提供することにある。
【0014】
【課題を解決するための手段】
請求項1の発明は、多値画像をそれぞれ複数個の画素を含む矩形状の複数個のブロックに分割した後に、ブロック内の画素値の分布に関する特徴量を隣接する各一対のブロック間で比較し特徴量の類似度が規定値以上である各一対のブロックには同じラベルを付与するとともに特徴量の類似度が規定値未満である各一対のブロックには異なるラベルを付与して前記多値画像内のすべてのブロックにラベルを付与する初期分割段階と、同ラベルが付与されているブロックからなるブロック連結領域の境界部分に位置するブロックを複数個の分割ブロックに分割するとともに、分割前のブロックに隣接するブロックの前記特徴量と分割ブロックの画素値の分布に関する特徴量との類似度が規定値以上になるときに隣接するブロックと同じラベルを当該分割ブロックに付与することにより当該分割ブロックを前記ブロック連結領域を構成するブロックとして前記ブロック連結領域に統合する細分化段階とを有し、細分化段階を繰り返すことにより多値画像に含まれる全画素にラベルを付与することを特徴とする。
【0015】
請求項2の発明は、請求項1の発明において、前記ブロックおよび前記分割ブロックは2n ×2n 画素の矩形の領域であることを特徴とする。
【0016】
請求項3の発明は、請求項1または請求項2の発明において、前記初期分割段階において、各一対のブロック間で特徴量を比較する前に、各ブロックの画素値の平均値を規定の閾値と比較することにより前記多値画像内で背景側となるブロックを抽出するとともに、背景側となるブロックには規定した背景側のラベルを付与することを特徴とする。
【0017】
請求項4の発明は、請求項1ないし請求項3の発明において、前記初期分割段階において、着目するブロックに隣接する複数個のブロックを時計方向と反時計方向とのいずれか一方の順で選択するとともに選択したブロックと着目するブロックとの特徴量の類似度が規定値以上であるときに選択したブロックを次に着目するブロックとして追跡し、着目するブロックと選択したブロックとの特徴量の類似度が規定値以上でありかつ選択したブロックに着目するブロックと同ラベルが付与されているときに追跡済みのブロックを前記ブロック連結領域の境界部分に位置するブロックとすることを特徴とする。
【0018】
請求項5の発明は、請求項4の発明において、前記初期分割段階において、着目するブロックと選択したブロックとの特徴量の類似度が規定値以上でありかつ選択したブロックに着目するブロックとは異なるラベルが付与されているときに追跡済みのブロックに選択したブロックと同じラベルを付与することを特徴とする。
【0019】
請求項6の発明は、請求項1の発明において、前記特徴量の類似度は前記ブロック内の画素値の平均値の差であることを特徴とする。
【0020】
請求項7の発明は、請求項1の発明において、前記特徴量の類似度は前記ブロック内の画素値の平均値の差および標準偏差の差であることを特徴とする。
【0021】
請求項8の発明は、請求項1の発明において、前記細分化段階において、分割ブロックが1画素以上の所定の画素数に達した状態で前記ブロック連結領域に統合できない分割ブロックは前記多値画像内で背景側となるブロック連結領域に統合することを特徴とする。
【0022】
請求項9の発明は、請求項1の発明において、前記ラベルが互いに異なる複数個の前記ブロック連結領域について、画素値の分布に関する特徴量の類似度が規定値以上である各一対のブロック連結領域をグループ化することを特徴とする。
【0023】
請求項10の発明は、請求項1の発明において、前記ラベルが互いに異なる複数個の前記ブロック連結領域について、最短距離が規定した閾値以内である各一対のブロック連結領域に同ラベルを付与して統合することを特徴とする。
【0024】
請求項11の発明は、請求項1の発明において、前記細分化段階の終了後において前記ブロック連結領域のうち面積が規定の閾値以上であるブロック連結領域を前記多値画像内での背景側の領域とみなし、当該ブロック連結領域には規定した背景側のラベルを付与することを特徴とする。
【0025】
請求項12の発明は、請求項11の発明において、前記多値画像内における背景側の領域の画素値の分布に関する特徴量を求め、前記ブロック連結領域のうち面積が前記閾値未満であってブロック連結領域内の画素の画素値の分布に関する特徴量と背景側の領域の特徴量との類似度が規定値以上であるブロック連結領域には規定した背景側のラベルを付与することを特徴とする。
【0026】
請求項13の発明は、請求項1の発明において、前記細分化段階の終了後において前記ブロック連結領域のうち面積が規定の閾値以下であるブロック連結領域を着目するブロック連結領域として着目するブロック連結領域内の画素の画素値から画素値の分布に関する特徴量を求め、他のブロック連結領域であってブロック連結領域内の画素の画素値の分布に関する特徴量との類似度が規定値以上になるブロック連結領域が着目するブロック連結領域から規定の距離範囲内に存在しないときに、着目するブロック連結領域に前記多値画像内における背景側であることを示す規定した背景側のラベルを付与することを特徴とする。
【0027】
請求項14の発明は、請求項1の発明において、前記細分化段階の終了後において前記ブロック連結領域ごとにブロック連結領域に外接する最小の矩形を設定し、設定した矩形の大きさが規定範囲を逸脱するときには当該ブロック連結領域に前記多値画像内における背景側であることを示す規定した背景側のラベルを付与することを特徴とする。
【0028】
請求項15の発明は、請求項1の発明において、前記細分化段階の終了後において前記ブロック連結領域ごとに主軸の方向を求め、後処理においてブロック連結領域との類似度を比較するマッチングパターンの主軸の方向にブロック連結領域の主軸の方向が一致するようにブロック連結領域を回転させることを特徴とする。
【0029】
請求項16の発明は、請求項1の発明において、前記細分化段階の終了後において前記ブロック連結領域ごとにブロック連結領域に外接する最小の矩形を設定し、当該矩形のサイズが規定したサイズになるように各ブロック連結領域を拡大または縮小することを特徴とする。
【0030】
請求項17の発明に係る画像の領域分割装置は、多値画像を記憶する記憶手段と、記憶手段に格納された多値画像をそれぞれ複数個の画素を含む矩形状の複数個のブロックに分割する画像分割処理部と、ブロック内の画素値の分布に関する特徴量を求める特徴量演算部と、隣接する各一対のブロック間で特徴量を比較し特徴量の類似度が規定値以上である各一対のブロックには同じラベルを付与するとともに特徴量の類似度が規定値未満である各一対のブロックには異なるラベルを付与して前記多値画像内のすべてのブロックにラベルを付与する追跡処理部と、同ラベルが付与されているブロックからなるブロック連結領域の境界部分に位置するブロックを複数個の分割ブロックに分割するブロック分割処理部とを備え、特徴量演算部はブロック分割処理部で分割した分割ブロックについて特徴量を求める機能を有し、追跡処理部は、分割前のブロックに隣接するブロックの前記特徴量と分割ブロックの画素値の分布に関する特徴量との類似度が規定値以上になるときに隣接するブロックと同じラベルを当該分割ブロックに付与することにより当該分割ブロックを前記ブロック連結領域を構成するブロックとして前記ブロック連結領域に統合する機能を有し、ブロック分割処理部と特徴量演算部と追跡処理部とによりブロックを分割ブロックに分割してラベルを付与する処理を繰り返すことにより多値画像に含まれる全画素にラベルを付与することを特徴とする。
【0031】
請求項18の発明に係るプログラムは、請求項1ないし請求項16のいずれか1項に記載の画像の領域分割方法をコンピュータを用いて実現する。
【0032】
【発明の実施の形態】
本実施形態では、図1に示すように、文字が表記された対象物1をCCDカメラのような撮像装置2を用いて撮像し、撮像装置2により得られた画像内において文字の領域を他の領域から分離する場合を例として説明する。ここでは撮像装置2としてモノクロ信号を出力するものを想定する。撮像装置2の出力は後述の処理を行う画像処理装置10に入力される。撮像装置2の出力はアナログ信号であって画像処理装置10に設けたA/D変換器11においてデジタル信号に変換された後、画像処理装置10に設けた記憶手段12に格納される。記憶手段12は、A/D変換器11から出力された濃淡画像を一時的に記憶する一時記憶領域および濃淡画像に対して後述する各種処理を行う間に発生するデータを一時的に記憶する作業記憶領域を備えるメモリと、各種データを長期的に記憶するためのハードディスク装置のような記憶装置とを含む。記憶手段12における一時記憶領域に格納される濃淡画像は、画素がマトリクス状に配列されるとともに各画素に多段階の画素値が設定される多値画像になる。なお、本実施形態では、濃淡画像(グレー画像)を用いるから以下では画素値として濃度値を用いるが、多値画像としてはカラー画像や距離画像を用いることができ、カラー画像では画素値として色相あるいは彩度を用いればよく、距離画像では画素値として距離を用いることになる。また、カラー画像では、適宜の基準色との色差を用いて各画素に1つの画素値を対応させたり、L* a* b* 表色系の明度L* 色度a* ,b* の3つの値を1画素の画素値として対応させてもよい。
【0033】
画像処理装置10はマイクロコンピュータを主構成とし、記憶手段12に格納した画像に対して図2に示す処理を実行することによって、本実施形態の目的である文字の領域を他の領域から分離する。なお、画像処理装置10にはモニタ3が付設され、記憶手段12に格納された画像や処理中の画像をモニタ3で監視することが可能になっている。いま、記憶手段12に格納された画像が図5(a)に示す内容であるとすれば、画像処理装置10では図5(a)に示す画像内から図5(b)に示すように文字Cの領域を抽出する。ただし、図5(a)に示す画像においては、文字Cのほかにデザインによる図柄Dや地模様Eの領域が含まれ、文字Cのうち「B」では不連続部分(左右両部分の間に隙間)が存在し、また「X」では明暗のむらが大きい部分が存在している。したがって、図5(a)の画像を従来の技術として説明したように画像の画素値(濃度)で単純に二値化すると、図5(c)のように、文字C以外に図柄Dや地模様Eの一部が画像内に残り、「B」の文字Cはひとまとまりに扱うことができず、「X」の文字Cについては形状を明確に抽出することができなくなる。さらに、図5(a)に示す画像内には撮像手段12により生じるノイズが含まれていることもあり、ノイズが含まれていると二値化した画像内で文字Cと同じ画素値の画素が不規則に発生することがある。図5(c)では図柄Dや地模様Eの中にノイズにより生じた画素も含まれている。つまり、図5(c)の画像のように、文字C以外の情報が含まれていたり、本来は1文字Cであるのにひとまとまりに扱っていない情報が含まれていたり、文字Cの形状が不明瞭であったりすると、光学的文字読み取り装置などにおいて文字Cを認識しようとするときに図5(a)のような元の画像の濃度値を二値化しただけでは、得られる情報に過不足が生じ、結果的に文字Cの認識率が低下することになる。
【0034】
そこで、文字C以外の不要な情報(以下、「背景領域」という)を画像内から除去し、さらに文字Cごとに1つのまとまった領域として扱うことを可能にするとともに、文字Cの中で濃度値にばらつきがあっても文字Cの形状をほぼ正確に抽出することを可能にすることが要求される。以下では、文字Cのような目的の領域を「物体領域」と呼ぶ。光学的文字読み取り装置においては、文字Cの認識率を向上させるために、文字の領域である物体領域と背景領域とを分離することが前処理として要求される。また、物品の種別をパターンマッチングによって認識するような場合にも、パターンマッチングの精度を高めるために、物品の領域である物体領域と背景領域とを分離することが前処理として要求される。
【0035】
このような前処理を行うために、本実施形態では記憶手段12に格納された濃淡画像に対して、図2に示す手順の処理を行って物体領域と背景領域とを分離する。すなわち、まず画像分割処理部13では、記憶手段12に格納された濃淡画像を2の累乗個(nを正整数として2n 個)の画素を一辺とする正方領域であるブロックB(図6参照)に分割する(S1)。画像のアスペクト比は適宜に設定してよいが、現状では4:3が一般的であるから、1画面の画素数は640×480画素、800×600画素、1024×768画素、1152×864画素のいずれかであるものとする。これらの画素数のいずれかを選択すると、2n×2n 画素のブロックBとして設定可能な最大サイズは、それぞれ32×32画素(n=5)、8×8画素(n=3)、256×256画素(n=8)、32×32画素(n=5)になる。ブロックBのサイズは、文字Cを物体領域とする場合であれば、ブロックBの一辺が文字Cの線幅程度になるように設定される。このようなブロックBのサイズは画像における空間周波数に基づいて自動的に設定することができる。
【0036】
次に、画像分割処理部13で得られた各ブロックBは特徴量演算部14に引き渡され、各ブロックBの画素値の分布に関する特徴量がそれぞれ求められる(S2)。本実施形態では特徴量としてブロックBに含まれる各画素の濃度値の平均値および標準偏差を用いる。各ブロックBについて求めた特徴量は追跡処理部15において比較され、着目しているブロックBに隣接するブロックBであって着目しているブロックBとの特徴量の類似度が規定値以上であるブロックBを追跡する(S3)。隣接する各一対のブロックBの類似度が規定値以上であるときには両ブロックBに同じラベルを付与することによって、同ラベルを付与した複数個のブロックBからなるブロック連結領域を形成する。すなわち、着目するブロックBに対して特徴量の類似度が規定値以上になるような隣接するブロックBを順次追跡し、追跡されたブロックBによって図7に示すような形でブロック連結領域が形成される(図7において濃淡の異なるひとまとまりの部分がそれぞれブロック連結領域になる)。追跡可能であったブロックBについては、ブロック連結領域ごとにラベルを付与して記憶手段12に格納する。隣接するブロックBの特徴量を比較してブロック連結領域を追跡する処理手順については後述する。
【0037】
一方、上述のようにしてブロックBを追跡して濃淡画像に複数個のブロック連結領域が形成されると、異なるラベルが付与されたブロック連結領域の境界部分のブロックBをブロック分割処理部16に引き渡す(S4)。ブロック分割処理部16ではブロック連結領域の境界部分である各ブロックBを縦横にそれぞれ2分割した分割ブロックBn(=B1、nは正整数、図13参照)を形成する(S5,S6)。つまり、分割ブロックB1に含まれる画素数はブロックBの画素数の4分の1になる。ブロック分割処理部16において生成された分割ブロックB1は、特徴量演算部14に引き渡されて特徴量が求められ、分割ブロックB1について求めた特徴量は追跡処理部15において周囲のブロックBの特徴量との類似度が評価される。分割ブロックB1の特徴量と周囲のブロックBの特徴量との類似度が規定値以上であるときには、分割ブロックB1に周囲のブロックBと同じラベルが付与され、この分割ブロックB1は周囲のブロックBと同じブロック連結領域に統合される(S7)。このようなラベル付けの処理によって各分割ブロックB1にラベルが付与され、ブロック連結領域の境界部分では分割ブロックB1の単位でブロック連結領域の形状が微細化される。このようにして、ブロック連結領域の境界部分には分割ブロックB1が並ぶから、分割ブロックB1をブロックBと等価に扱い、分割ブロックB1をさらに分割ブロックB2に分割して上述の処理を繰り返し、最終的には1画素単位まで分割する(S8,S9)。ここにおいて、分割ブロックBnを用いて形成したブロック連結領域を記憶手段12に格納するのはもちろんのことである。上述のようにしてすべてのブロックBと分割ブロックBn(nは正整数)とにラベルが付与されれば各ブロック連結領域が物体領域または背景領域であると考えられるから、物体領域と背景領域とを分離することが可能になる。
【0038】
以下では、ブロック連結領域を求める処理についてさらに具体的に説明する。本発明の基本的な処理手順は、上述したように濃淡画像を分割したブロックBを用いる段階と、ブロックBをさらに分割した分割ブロックBn(nは正整数)を用いる段階とを有している。つまり、物体領域と背景領域とのおおまかな分類を行うために濃淡画像を分割したブロックBを用いる初期分割段階と、ブロックBでは物体領域と背景領域とに分類できないような境界付近についてブロックBよりも小さい単位である分割ブロックBnを用いる細分化段階とを有している。
【0039】
まずブロックBを用いる初期分割段階について図3を用いて説明する。上述したように、初期分割段階では、まず記憶手段12に格納されている濃淡画像を、一辺の画素数が2の累乗である正方形のブロックBに分割する。たとえば、図5(a)に示した濃淡画像を図6のような形でブロックBに分割する。図示するブロックBのサイズは一辺の画素数が文字Cの線幅の画素数程度に設定されている。また、ブロックBの一辺の画素数を2の累乗個に設定しておけば、細分化段階においてはブロックBの一辺を2分割することにより等面積の分割ブロックBnを形成することができるから、分割ブロックBnを設定する処理が簡単になる。
【0040】
上述したように、初期分割段階においては、各ブロックBについて求めた特徴量の類似度が高いブロックBを追跡してグループ化することによりブロック連結領域を形成するのであって、ブロック連結領域を形成する複数個のブロックBには同じラベルが付与される。ここでは、ラベルとして数値を用いるものとし、ブロック連結領域ごとに付与されるラベルを「識別番号」と呼ぶことにする。ブロック連結領域を形成するブロックBを追跡する際には、濃淡画像の全体を用いてもよいが、背景領域を確実に分離することができる場合には、追跡の前に背景領域を分離するのが望ましい。追跡の前に背景領域の少なくとも一部を分離しておけば、追跡すべき領域が少なくなるから、処理量の低減につながり、結果的に処理の高速化が期待できる。たとえば、図5(a)に示した濃淡画像であれば、図柄Dの一部や地模様Eの部分については分離することが可能である。
【0041】
本実施形態では、ブロックBの追跡の前に背景領域の一部を分離する処理として、各ブロックBの濃度値の平均値を求め、濃度値の平均値に対する適宜の閾値を設定してブロックBを二値化することにより背景領域を分離する(S1)。たとえば、図5(a)に示した濃淡画像であれば、図柄Dの一部や地模様Eの部分については文字Cの部分の濃度値の平均値よりも十分に小さいから(ここでは、図において白から黒に向かって濃度が増加するものとする)、適宜の閾値との大小比較によって背景領域の一部を分離することができる。このように、各ブロックBごとに濃度値の平均値を求め、濃度値の平均値が規定した閾値以下であるブロックBは識別番号を0に設定する(S2)。図5(a)の濃淡画像に対して識別番号が0である領域を白画素の領域とした例を図7に示す。図7では識別番号として0を付与した領域は白画素の領域になっているが、文字Cや図柄Dの一部を含む領域のブロックBについては識別番号が付与されていないから、このことを利用して以下の手順によってブロック連結領域に含まれるブロックBを追跡する。
【0042】
ブロック連結領域の追跡には、まず濃淡画像の左上端のブロックBを開始点とし、最上段に並ぶブロックBについて識別番号の付与されていないブロックBを左から右に順に追跡し、右端に達した後には1段下に並ぶブロックBについて識別番号の付与されていないブロックBを左から右に順に追跡する。つまり、いわゆるラスタ走査を行う。このようにして、識別番号Bの付与されていないブロックBが最初に発見されると(S3)、このブロックBに適宜の識別番号を付与する(S4)。ここでは、識別番号を0から順次大きくなる整数値として付与する。したがって、最初に発見されたブロックBには1が付与される。また、以下の説明においては、ブロックBの位置を示す必要があるときには図に示した座標(x,y)を用いてブロックB(x,y)と表し、ブロックBを追跡する際に着目しているブロックBに対して追跡の候補になっているブロックBの相対位置を示す必要があるときには相対位置を追跡ベクトルVと呼び、図に示した座標の差(dx,dy)を用いて追跡ベクトルV(dx,dy)と表す。
【0043】
いま、図7に示した画像内で識別番号の付与されていないブロックBを追跡したときに、図8(a)のようにブロックB(3,1)が最初に発見されたとする。この場合に、ブロックB(3,1)に識別番号として1を付与する(S4)。つまり、このブロックB(3,1)は1つのブロック連結領域A1の要素と推定されるから、ブロック連結領域A1を構成する要素としてブロックB(3,1)を加える(S5)。なお、図8では各ブロックBの識別番号を丸付き数字で示してある。
【0044】
上述のようにして識別番号を付与するブロックB(3,1)が発見されると、このブロックB(3,1)を着目するブロックBとし、このブロック(3,1)に近接するブロックBとの間で特徴量(濃度値の平均値および標準偏差)の類似度を評価し、着目するブロックB(3,1)に近接するブロックBとの特徴量の類似度が規定値を超えているときには、近接しているブロックBに対して着目するブロック(3,1)と同じ識別番号を付与する。ここで、着目するブロックBに近接するブロックBは、着目するブロックBの周囲の8個のブロックBであって、着目するブロックBに対する周囲の8個のブロックBの相対位置を表すために方向値kを設定してある。方向値kは0〜7の数値であり、ブロックBを追跡する際の向きを「3」として時計方向の順で45度ずつ4,5,6の値を付与し、「3」に対して反時計方向の順で45度ずつ2,1,0の値を付与する。ただし、最初に識別番号が付与されたブロックB(3,1)については、着目するブロックBの右隣りの方向値kを0とし、時計方向の順で1,2,……,7の番号を付与することにより着目するブロックBとの相対位置を方向値kによって識別可能にしてある。以下では、ブロックB(x,y)に対して方向値kをもって隣接するブロックBを、ブロックBk(x,y)と表記する。
【0045】
そこで、着目するブロックB(3,1)との類似度を評価するブロックBを識別するために、まず方向値kを0に設定し(S7)、設定した方向において隣接するブロックBが存在するか否かを判断し(S8)、図8(b)のようにブロックB0(3,1)(=B(4,1))が存在する場合には、そのブロックB0(3,1)にすでに識別番号が付与されているか否かが判断される(S9)。識別番号が付与されていなければ、このブロックB0(3,1)との類似度を評価し、同じ識別番号を付与するか否かを判断する(S10,S11)。類似度の評価には、まずブロック連結領域A1に含まれる画素の濃度値の平均値とブロックB(4,1)に含まれる画素の濃度値の平均値との差を求める。ここで、両者の差が規定の閾値内であるときには(S10)、ブロック連結領域A1に含まれる画素の濃度値の標準偏差とブロックB(4,1)に含まれる画素の濃度値の標準偏差とを求め、両者の標準偏差の差が規定の閾値内であるときには(S11)、ブロックB(4,1)をブロック連結領域A1に含まれると判断し、このブロックB(4,1)にブロック連結領域A1と同じ識別番号を与える(S12)。つまり、図8(b)のようにブロックB(4,1)にはブロックB(3,1)と同様に識別番号が1になる。このようにして、ブロック連結領域A1にブロックB(4,1)が加えられ(S13)、あらたに生成されたブロック連結領域A1について濃度分布が求められる(S14)。ここに、濃度分布の値としては濃度値の平均値を用いている。
【0046】
一方、ステップS8,S9において比較対象として抽出されたブロックBk(x,y)がステップS10,S11のいずれかにおいて類似しないと判断されたときには、方向値kをインクリメントし(S15)、次のブロックB1(3,1)(=B(4,2))についてステップS8〜S11の処理を行う。上述のようにして、追跡の開始点となるブロックB(3,1)に対して方向値kを順に時計回りに変化させ、B(4,1)→B(4,2)→B(3,2)→B(2,2)→B(2,1)→B(2,0)→B(3,0)→B(4,0)の順で各ブロックBk(3,1)がブロック連結領域A1に含まれるか否かを判断する。ただし、追跡の開始点となるブロックB(3,1)に近接するブロックBk(3,1)のうちでブロック連結領域A1に付加するブロックBk(3,1)が見つかれば、ブロックBk(3,1)の中でブロック連結領域A1に含まれるものを追跡するのではなく、発見したブロックBk(3,1)を次の開始点としてステップS7以降の処理を繰り返す。
【0047】
図8に示す例では、ブロックB(3,1)に隣接するブロックB(4,1)はブロックB(3,1)に類似すると判断されており、ブロックB(3,1)に隣接する他のブロックB(4,2)、B(3,2)、B(2,2)、B(2,1)、B(2,0)、B(3,0)、B(4,0)については類似度を判断していない。したがって、ブロックB(4,1)の識別番号が1に設定され、ブロックB(4,1)を追跡の開始点としてブロックB(4,1)に隣接するブロックBk(4,1)についてブロックB(4,1)と類似するか否かが判定されることになる。
【0048】
ブロックB(4,1)については、図8(b)のように、ブロックB(3,1)からブロックB(4,1)に向かう向きが右向きであるから(つまり、追跡ベクトルがV(1,0)であるから)、ブロックB(4,1)の右隣りであるブロックB(5,1)の方向値kが3になる。つまり、ブロックB(4,1)に隣接するブロックBk(4,1)は、B(3,0)→B(4,0)→B(5,0)→B(5,1)→B(5,2)→B(4,2)→B(3,2)の順で類似度が判定される。ここでは、図8(c)のように、ブロックB(5,2)がブロックB(4,1)と類似すると判断された例を示しており、ブロックB(5,2)に1という識別番号を与えている。以下同様にして、ブロック連結領域A1に含まれるブロックBを追跡するのである。
【0049】
上述のようにして、ブロック連結領域Am(mは0および正整数)に含めるブロックBを追跡する際に、着目するブロックB(x、y)に隣接するブロックBk(x、y)を時計方向に追跡しているから、物体領域の輪郭に相当するブロック連結領域Amが検出されることになる。ここで、図8に示す例では、図8(d)のようにブロック連結領域A1に含めるブロックBを追跡するとブロックB(3,2)に達し、ブロックB(3,2)に隣接するブロックBk(3,2)をB(2,2)→B(2,1)→B(3,1)→B(4,1)→B(4,2)→B(4,3)→B(3,3)の順で追跡すると、識別番号が未設定であってかつ類似度が規定値以上であるブロックB(4,2)の前に、識別番号が既設定であるブロックB(3,1)、B(4,1)が類似度の比較対象として抽出されることになる。しかしながら、これらのブロックB(3,1)、B(4,1)は識別番号がすでに設定されているから、類似度を判断する必要がない。そこで、着目するブロックB(x,y)に隣接しているブロックBk(x,y)にすでに識別番号が設定されているときには(S9)、着目するブロックB(x,y)と同じ識別番号が設定されているか否か(つまり、同じブロック連結領域A1に含まれているか否か)を判断し(S16)、識別番号が一致しているときには、その時点までに追跡されたブロックBをブロック連結領域A1の輪郭(境界部分)O1として記憶手段12に登録する(S17)。要するに、着目するブロックB(x,y)と隣接するブロックBk(x,y)との識別番号が一致すれば、ひとまとまりの物体領域に関する輪郭O1の抽出を終了する。なお、ブロックB(3,1)を抽出した時点で輪郭を記憶手段12に登録するから、その後に、ブロック連結領域A1に含まれかつ識別番号が既設定であるブロックBが発見されても無視する。
【0050】
上述のようにして物体領域の輪郭を決定した後には、輪郭の抽出の終端となったブロックB(x,y)に隣接するブロックBk(x,y)について右回りに追跡を続け、識別番号が未設定であってかつ類似度が規定値以上になるブロックBを抽出する。図8に示す例では、図8(e)のように、ブロックB(3,2)の周囲においてブロックB(4,2)が抽出され、同様にしてブロックB(4,2)に隣接するブロックBk(4,2)をB(3,1)→B(4,1)→B(5,1)→B(5,2)→B(5,3)→B(4,3)→B(3,3)の順で追跡すると、識別番号が付与されておらず類似度が規定値以上になるブロックB(3,3)が抽出される。ブロックB(4,2)に隣接するブロックBk(4,2)を追跡する際には、識別番号が既設定であって類似度が規定値以上であるブロックB(3,1)、B(4,1)、B(5,2)、B(5,3)が存在するが、ブロック連結領域A1の輪郭O1は記憶手段12にすでに記憶されているので、ブロックB(3,1)、B(4,1)、B(5,2)、B(5,3)については輪郭として採用せずに無視する。
【0051】
上述のようにして抽出されたブロックB(3,5)に隣接するブロックBk(3,3)を追跡すると、識別番号が未設定であってかつ類似度が規定値未満であるブロックBは存在しないから、この時点で追跡が終了する。すなわち、各ブロックB(x、y)に隣接するブロックBk(x、y)について、識別番号が未設定かつ類似度が規定値以上であるという条件を満たすブロックBが存在しなくなった時点で追跡を終了するから、図8(f)に示すように、物体領域の輪郭を渦巻き状に追跡してブロック連結領域A1を決定することができる。
【0052】
なお、上述のようにブロック連結領域Amに属するブロックBを追跡する過程において濃度値の平均値および標準偏差を比較するにあたり(S10)、すでに追跡したブロックB(つまり、追跡済みのブロック連結領域Am)の全画素の濃度値の平均値および標準偏差を随時求め(S14)、この値を用いてブロックBを追跡する。いま、図5に示した「X」の文字Cのように濃度にむらを生じているような物体領域を追跡することによって、図9(a)に矢印で示しているような経路でブロックBが追跡されたとする。この経路上の各ブロックBごとの平均濃度は図9(b)の折線イのように変化するのに対して、上述のように追跡済みのブロック連結領域Amの平均濃度を用いると図9(b)の折線ロのように変化する。つまり、各ブロックBごとの平均濃度の差を用いて追跡すると濃度むらの生じている部位で急激な濃度変化が生じるために追跡が中断するおそれがあるが、追跡済みのブロック連結領域Amの平均濃度を用いることによって急激な濃度変化が抑制され、結果的に濃度むらが生じていても追跡の中断を回避することが可能になる。
【0053】
上述のようにしてひとまとまりのブロック連結領域A1の追跡が終了すると(S8)、識別番号をインクリメントし(S18)、濃淡画像の左上端から順にブロックBを追跡して識別番号が未設定であるブロックBについて上述した処理を繰り返す。つまり、図8に示した例では識別番号が1であるブロック連結領域A1に含まれるブロックBを追跡したから、次は識別番号が2であるブロック連結領域A2に含まれるブロックBを追跡するのである。
【0054】
なお、ブロック連結領域Amに含まれるブロックBを追跡する過程において、着目しているブロックB(x,y)に隣接するブロックBk(x,y)の中に類似度が規定値以上になるブロックBが複数個存在している場合(このような場合を追跡において「分岐」がある場合という)、上述の処理では、先に発見されたブロックBのみがブロック連結領域Amに含まれ、残りのブロックBがひとまとまりのブロック連結領域Amに含まれなくなる可能性がある。つまり、本来は1つのブロック連結領域Amに含むべきブロックBであるのに、追跡において分岐があると複数個のブロック連結領域Amに分割されるおそれがある。たとえば、図5に示した「Z」の文字Cでは、図10(a)に矢印で示す経路でブロックBを追跡すると、ブロックB(5,2)ではブロックB(4,3)とブロックB(4,2)とに分岐が生じ、同様にブロックB(4,3)やブロックB(3,5)においても分岐が生じる。このような分岐が生じるとブロック連結領域Amが分割される可能性があるから、分岐を生じるブロックBを記憶手段12に一時的に記憶しておき、追跡の終端側で生じた分岐から順に分岐先を開始点とする追跡を行うことによって、ブロック連結領域Amの分割を回避する。たとえば、図10に示す例では、ブロックB(6,6)が追跡の終端になるから、終端にもっとも近い分岐を生じたブロックB(3,5)に隣接するブロックBk(3,5)のうち、時計方向に追跡したときに追跡の終了したブロックB(4,6)の次に発見されるブロックB(3,6)を開始点として追跡を再開する。ここに、ブロックB(3,6)はブロックB(3,5)から分岐しているので、ブロックB(3,5)と同じ識別番号を付与する。このように追跡を再開すれば、図10(b)のように、B(3,6)→B(2,6)→B(1,6)→B(2,5)→B(3,4)という経路でブロック連結領域Amに含まれるブロックBを追跡することができる。分岐を生じたブロックB(4,3)、ブロックB(3,5)の分岐先は、図10(b)に示した経路に含まれ、追跡を完了していない分岐先のブロックBは、ブロックB(5,2)の分岐先であるブロックB(4,2)のみになるから、ブロックB(4,2)を開始点として追跡を行い、すべての分岐先について追跡を行う。上述のように分岐が生じたときに分岐先からの追跡を行うことにより、ひとまとまりのブロック連結領域Amに含まれるすべてのブロックBを追跡することが可能になる。
【0055】
分岐によるブロック連結領域Amの分割を防止する技術として、図10(c)に矢印で示すように、追跡の終了しているブロックB(つまり、識別番号の付与されているブロックB)について再追跡を許容し、追跡の向きを逆行させる技術を採用してもよい。つまり、図10に示す例では、ブロックB(5,2)とブロックB(4,3)とブロックB(3,5)とにおいて分岐が生じているから、これらのブロックBを記憶手段12に記憶しておき、追跡の終端のブロックB(6,6)に達した後に追跡した経路を逆行する。ブロックB(4,6)は分岐を生じたブロックB(3,5)の分岐先の1つであって、ここでブロックB(3,5)の次の分岐先であるブロックB(3,6)を通る経路での追跡を行うと、分岐を生じたブロックB(4,3)の分岐先の1つであるブロックB(3,4)を経由し、ブロックB(5,2)の分岐先の1つであるブロックB(4,2)に達するように連続した経路が形成されることになる。このようにしてブロック連結領域Amに含まれるブロックBを漏れなく抽出することができる。
【0056】
なお、分岐が生じたブロックBを記憶手段12に記憶しておき、同じブロックBの追跡を許容する処理を行うと処理が煩雑になるから、処理を簡潔化するために分岐を生じたブロックBを記憶手段12に記憶せずに追跡を行い、追跡を行った複数の領域についてひとまとまりになるか否かを検証し、ひとまとまりになる場合に追跡結果を統合するようにしてもよい。この処理について図11の例を用いて説明する。
【0057】
すなわち、図11では図5に示した「田」の文字Cについてブロック連結領域Amに含まれるブロックBを追跡する例を示している。追跡の開始点は図11(a)に示すブロックB(1,1)であって、通常の追跡を行うと図11(a)に矢印で示す経路で文字Cの外周となる「口」形状のブロックBのみがブロック連結領域Amとして抽出される。つまり、「口」形状の内側の「十」形状の部分のブロックBは追跡されないのであるが、ここでは分岐について考慮せず、「十」形状の部分については別のブロック連結領域A(m+1)とみなして追跡する。すなわち、「田」の文字Cにおける外周のブロックBの追跡を終了した後に、濃淡画像の左上端から再度走査して識別番号が付与されていないブロックB(4,2)を抽出し、このブロックB(4,2)を開始点として追跡を行う。ブロックB(4,2)を開始点とする追跡には新たな識別番号が設定されるから、この時点では「田」の文字Cの外周のブロックBにより形成されるブロック連結領域Amとは異なるブロック連結領域A(m+1)とみなされる。ただし、「十」形状の追跡の途中では図11(b)のように、ブロックB(5,3)に隣接するブロックBk(5,3)において、「田」の文字Cの外周の一部であって、識別番号が既設定であるブロックB(6,2)が発見されるから(S9)、識別番号が不一致であることを確認し(S16)、さらに、このブロックB(6,2)についてブロックB(5,3)との類似度を判定し(S19)、類似度が規定値以上であればブロック連結領域A(m+1)をブロック連結領域Amに属するものとみなして、ブロック連結領域A(m+1)をブロック連結領域Amに統合するのである(S20,S21)。要するに、「十」形状の部分の識別番号を「田」の文字Cの外周の識別番号に変更した後に追跡を継続する。2つのブロック連結領域Am,A(m+1)を統合した後には、ブロック連結領域Am,A(m+1)の全体の濃度分布を求め(S22)、次のブロック連結領域の追跡のための識別番号をmに戻す(S23)。
【0058】
上述の処理を行うと、図11(c)のようにブロックB(2,3)を開始点とするブロック連結領域Amでは、ブロックB(3,3)に隣接するブロックB(4,2)が抽出され、このブロックB(4,2)にはすでに識別番号が付与されているから、図11(d)のように統合される。同様の処理を行うことによって、追跡中に識別番号が既設定であるブロック連結領域AmのブロックBを検出したときに、類似度が規定値以上であるときには追跡中のブロック連結領域Amを識別番号が既設定であるブロック連結領域Amに統合するので、ひとまとまりのブロック連結領域Amが分割されるのを防止することができ、ブロック連結領域Amを適正に形成することができる。
【0059】
上述のような処理を、識別番号が付与されていないブロックBがなくなるまで繰り返し行うことにより、濃淡画像のすべてのブロックBがいずれかのブロック連結領域Amに属することになる。図12は図5(a)の濃淡画像を17個のブロック連結領域A0〜A16に分割した例を示している。
【0060】
上述のようにして濃淡画像の含まれるすべてのブロックBをブロック連結領域A0〜A16に分割した後に、各ブロック連結領域A0〜A16の境界部分を形成するブロックBについて細分化する細分化段階に移行し、各ブロック連結領域A0〜A16の境界部分の形状を微細に追跡する。つまり、細分化段階では、上述した初期分割段階において得られたブロック連結領域A0〜A16の境界部分を形成するブロックBを分割ブロックBnに分割し、各分割ブロックBnがどのブロック連結領域A0〜A16に属するかを決定する。
【0061】
次に細分化段階について図4を用いて説明する。細分化段階では、まず細分化の対象であるブロックBを縦横に2等分し、図13(a)のように1個のブロックBを4個の分割ブロックB1に分割する(図4ではL×L個に分割している)。細分化の対象とするブロックBは識別番号の小さいほうから順に選択する。つまり、最初は識別番号がもっとも小さいブロック連結領域A0のブロックBのうち他のブロック連結領域A1〜A16との境界部分に位置するブロックBを分割の対象とする。したがって、図4に示すように、まず識別番号mを0に設定し(S1)、ブロック連結領域Am(=A0)の中で輪郭Om(=O1)のブロックB(x,y)の有無を確認し(S2)、輪郭OmのブロックB(x,y)がない場合にはすべてのブロック連結領域A0〜A16について処理済みか否かを判定し(S3)、未処理のブロック連結領域A0〜A16があれば識別番号をインクリメントして(S4)、未処理のブロック連結領域A0〜A16について分割ブロックBnを生成する処理を行う(S5)。分割ブロックBnは上述のようにブロックBを4分割したものであるから、2n−1 画素×2n−1 画素の大きさになる。
【0062】
次に、各分割ブロックBnの濃度分布(ここでは、平均値および標準偏差)を求め(S8)、各分割ブロックBnごとに分割前のブロックB(x,y)の上下左右に隣接する4個のブロックB(x,y−1)、B(x+1,y)、B(x,y+1)、B(x−1,y)と濃度分布を比較し(S9)、濃度分布の類似度が最大であるブロックBの識別番号を分割ブロックBnに付与する(S10)。ここに、類似度の判断にはたとえば平均濃度の差および標準偏差の差を用い、分割ブロックBnとの平均濃度の差および標準偏差の差が規定の閾値以下であるブロックBのうち、平均濃度の差が最小であるブロックBを類似度が最大であると判断する。上述のような処理により、図13(a)のようにブロックBを用いて設定したブロック連結領域の境界部分の領域を、図13(b)のようにさらに詳細に分割することが可能になる。
【0063】
ところで、ブロック連結領域の境界部分において濃度値が大きく異なるノイズ状のパターンが存在するような場合に、細分化段階において生成した分割ブロックBnの濃度分布を求めると、分割ブロックBnの周囲のブロックBの濃度分布との類似度が規定値未満になり、周囲のどのブロックBとも統合することができない場合がある。つまり、ステップS9において分割ブロックBnに類似するブロックBが存在しないと判断されることがある。このような場合には、分割ブロックBnをさらに分割して分割ブロックB(n+1)を生成し(S12)、分割ブロックBnに対する処理と同様の処理を行う。つまり、各分割ブロックB(n+1)について濃度分布を求め(S13)、分割ブロックB(n+1)に分割する前のブロックBに対して上下左右に位置するブロックBとの濃度分布(平均値および標準偏差)と分割ブロックB(n+1)の濃度分布とを比較し(S14)、類似度が最大になる分割ブロックBnと同じ識別番号を付与するのである(S15)。ここで、類似度に関して条件を満たすものがない分割ブロックB(n+1)については、新規の識別番号を付与する(S16)。このようにしてすべての分割ブロックB(n+1)について処理を行う。要するに、図14のような形で分割ブロックBnを4分割した分割ブロックB(n+1)を生成し、各分割ブロックB(n+1)について類似度を評価するのである。
【0064】
図4のステップS6、S7、S11におけるtはすべての分割ブロックBnについて処理を行うためのカウンタであって、L×L個(つまり4個)のすべての分割ブロックBnについて上述した処理を行った後には、分割ブロックBnをさらに細分化した分割ブロックB(n+1)を生成して同様の処理を行うことにより、ブロック連結領域の境界部分の領域分割をさらに詳細に行うことができる。この処理は、図4におけるステップS2、S5、S9、S10、S14、S15におけるブロックBを分割ブロックBnと読み替えた処理になる。上述のような処理を繰り返すことによって、ブロック連結領域の境界部分において最終的には1画素単位まで領域を分割することができる。また、1画素単位まで領域を分割しても識別番号が付与されない画素については背景領域とみなし、背景領域の識別番号を付与する。なお、領域の分割の際に必ずしも1画素単位まで領域を分割しなくてもよく、適宜設定した所定の画素数になるまで領域を分割した時点で分割の処理を終了してもよい。
【0065】
上述した細分化段階の処理をブロック連結領域の境界部分に存在するすべてのブロックBに対し行うことによって境界部分を細分化すれば、図15に示すような形で領域を分割することができる。領域の分割後には後処理に必要な物体領域を背景領域から分離する。
【0066】
物体領域と背景領域とを分離するには、以下のような2種類の判断を行う。第1には、一般に物体領域については画像内での大きさが既知であることが多いことを利用するのであって、物体領域と背景領域とを分離するための閾値を面積(画素数)について設定しておき、画像内での面積がこの閾値以上である領域は背景領域とみなす。次に、背景領域とみなした領域の全画素の画素値から特徴量として濃度分布(平均値と標準偏差)を求め、上述した閾値よりも面積が小さい領域のうち背景領域と濃度分布が類似している領域は背景領域とみなす。第2には、物体領域よりも面積が十分に小さい領域はノイズの可能性が高いことを利用するのであって、物体領域とノイズとの分離用に設定した閾値よりも面積が小さい領域で、しかもこの領域の近傍に濃度分布の類似した領域が存在しない場合に背景領域とみなす。なお、近傍の程度は画素数によって適宜に設定する。第1の判断によって、物体領域に形成された孔も含めて背景領域の見えている部分を分離することができ、第2の判断によって物体領域よりも小さいノイズ状の背景領域を分離することができる。
【0067】
いま、図16に示すようなブロック連結領域A0〜A4を抽出済みである濃淡画像について考察すると、ブロック連結領域A0およびブロック連結領域A1は面積が大きいから適宜の閾値を用いることによって背景領域として分離することができる。また、ブロック連結領域A3は面積が小さく、しかも濃度分布が背景領域A1と類似していることにより背景領域として分離される。さらに、ブロック連結領域A4は面積が小さく、ブロック連結領域A4の近傍には濃度の類似する領域が存在しないから背景領域として分離される。このようにして、ブロック連結領域A2のみが物体領域として残り後処理への入力になる。
【0068】
上述した初期分割段階および細分化段階の処理を行い、さらに背景領域を分離する処理を行うことによって、物体領域を背景領域から分離して抽出できるが、後処理の内容によっては抽出した物体領域を統合することが必要になる場合もある。たとえば、図5(a)に示した「B」の文字Cには隙間があり、2個の物体領域として抽出されることになるから、後処理が文字認識であるような場合には2個に分離された物体領域を統合して1つの物体領域として扱うことが要求される。
【0069】
そこで、本実施形態では、得られた物体傾城のうちで濃度分布の類似度が規定値以上である場合に1個の物体領域として統合し、また、物体領域ごとに近傍の物体領域との間の最短距離を求め、求めた距離が規定した閾値以下である2個の物体領域については1個の物体領域として統合している。ここに類似度の評価は初期分割段階や細分化段階における類似度の評価と同様に行い、また物体領域の近傍の判断は画素数によって近傍の範囲を適宜に設定する。濃度分布の類似度に基づいて物体領域を統合する技術は、図5(a)に示した「B」の文字Cのように隙間を有するために2個の物体領域に分割されてしまう場合に有効であって、一般に1文字は同色であることを利用して1個の物体領域に統合することができる。また、また、図17に示すように、文字列をグループ化しようとする場合に、複数個の文字列が近接して印刷されている場合に一連の文字列G1〜G3ごとにひとまとめにすることが可能になる。また、図5(a)に示した「B」の文字Cのように隙間を有している場合に、2個の物体領域の距離を用いて統合する技術を採用しても1文字になるように物体領域を統合することが可能である。物体領域を統合するための2種類の技術は組み合わせて用いることが可能である。
【0070】
ところで、画像内の特定のパターンを認識する処理、たとえばニューラルネットワークに文字画像を二値化したパターン入力して文字の判別を行うような文字認識処理を正しく行うには、文字部分だけを物体領域として抽出し、文字部分以外の不要な情報を含まない画像を生成することが必要である。また、コンベア上を搬送される部品であれば、コンベアの模様を除去することによって対象画像の範囲を大幅に絞り込むことが可能になり、また部品の種類をパターンマッチングで認識するような場合には、画像内での部品の姿勢をあらかじめ補正しておけばパターンマッチングの負荷を軽減することでタクトタイムの向上が期待できる。
【0071】
さらに、抽出された物体領域について物体領域の特徴を利用することにより後処理に必要な補正を行うことも可能である。たとえば、抽出した物体領域に外接する最小の矩形を求めるとともに、この矩形の大きさ(高さおよび幅の少なくとも一方)が規定の範囲内かどうかを判断し、規定の範囲を逸脱していればこの物体領域(ブロック連結領域)を背景領域とみなすのである。このような処理によって、抽出された物体領域のうち後処理の処理対象ではない可能性が高い不要な物体領域を除去して後処理の高速化を図ることができる。たとえば図18に示す例では、図柄Dに対応する領域A3,A7に外接する矩形Rと文字Cに対応する領域A1,A2,S10,A11,A12に外接する矩形Rとの高さおよび幅の差を求め、これらの差を規定の閾値と比較することにより、文字Cの領域A1,A2,S10,A11,A12との差が大きい領域A3,A7を背景領域として分離することが可能である。
【0072】
また、抽出した物体領域の主軸方向を求めるとともに、主軸方向が濃淡画像の上下方向あるいは左右方向に一致するよう物体領域を回転変換すれば、対象となる物体の向きを揃えることができ、後処理の負荷を軽減することができる。たとえば、図19に示すように既知形状の部品Pをパターンマッチングによって認識する場合には、部品Pの主軸Axの方向を求めマッチングパターンの主軸の方向に一致させるように部品Pの領域(物体領域)を回転させておけばパターンマッチングの処理が容易になる。
【0073】
さらに、抽出した物体領域について物体領域に外接する最小の矩形を設定し、この矩形の大きさおよび縦横比に基づいて物体領域の大きさおよび縦横比を求め、物体領域の大きさや縦横比を規格化するように物体領域を変形させれば、画像の歪みを補正することによって、後処理における認識精度の向上が期待できる。たとえば、図20(b)(c)のように大きさや縦横比が異なる文字Cがある場合に、設定した矩形Rの大きさおよび縦横比を図20(a)に一致させるように補正すれば、文字認識を後処理とする場合などでは認識精度の向上につながる。
【0074】
なお、上述した例では、濃度分布として濃度値の平均値および標準偏差を用いているが、画像にノイズや濃度むらがほとんどないことがあらかじめわかっているときには標準偏差を用いなくてもよい。また、上述の例では、平均値および標準偏差の差に対して適宜の閾値を設定して類似度を判断したが、濃度値のばらつきを正規化し濃度分布の類似度を求めることを目的として統計的検定法を適用することにより、母集団の平均値・標準偏差を推定した上で両母集団の同一性を検定する方法を用いてもよい。さらに、対象となる画像がカラー画像である場合には、濃度値に加えて色相や彩度の平均値・標準偏差を用いることが可能である。さらに、濃淡画像ではなく距離画像にも本発明の技術思想は適用可能である。また、上述の例ではブロックBを2n ×2n 画素に設定しているが、分割ブロックBnに分割する際に最終的に1×1画素が得られるような分割方法を採用するのであれば、ブロックBは2n ×2n 画素でなくてもよい。また、ブロックBの追跡の際に時計方向に追跡しているが、反時計方向に追跡してもよいのはもちろんのことである。
【0075】
本実施形態の処理によって領域分割を行った例を図21〜図22に示す。図21は元の画像であって、図22は初期分割段階でのブロック連結領域を示し、図23は細分化処理を行った後のブロック連結領域を示している。この例から明らかなように、元の画像を複数の領域に分割することができ、しかも元の画像内でひとまとまりと考えられる領域がほぼ正確に分割されていることがわかる。図示例のような非常に複雑な画像であっても、よい精度で領域を分割することができるから、たとえば文字認識に用いる画像や部品の種別を識別するために用いる画像では物体領域を正確に抽出することが可能である。
【0076】
【発明の効果】
請求項1の発明は、多値画像をそれぞれ複数個の画素を含む矩形状の複数個のブロックに分割した後に、ブロック内の画素値の分布に関する特徴量を隣接する各一対のブロック間で比較し特徴量の類似度が規定値以上である各一対のブロックには同じラベルを付与するとともに特徴量の類似度が規定値未満である各一対のブロックには異なるラベルを付与して前記多値画像内のすべてのブロックにラベルを付与する初期分割段階と、同ラベルが付与されているブロックからなるブロック連結領域の境界部分に位置するブロックを複数個の分割ブロックに分割するとともに、分割前のブロックに隣接するブロックの前記特徴量と分割ブロックの画素値の分布に関する特徴量との類似度が規定値以上になるときに隣接するブロックと同じラベルを当該分割ブロックに付与することにより当該分割ブロックを前記ブロック連結領域を構成するブロックとして前記ブロック連結領域に統合する細分化段階とを有し、細分化段階を繰り返すことにより多値画像に含まれる全画素にラベルを付与することを特徴としており、初期分割段階において画像内で類似性を有する領域をブロックによっておおまかに分割するから、ブロックのサイズよりも小さい領域で画素値が変化するようなノイズや地模様のような背景を容易に分離することができる。また、隣接するブロックのうち画素値の分布が類似しているブロックに同ラベルを付与してブロック連結領域を形成しているので、背景との画素値分布は異なるが同一領域内で画素値にばらつきが生じている(明るさのむらがある場合など)ような対象物、たとえば、かすれた文字や陰影の付いたマークなどの領域を正しく抽出することができる。しかも、ブロック連結領域の境界部分についてのみブロックを細分化し、全画素にラベルを付与するから、ブロック連結領域の境界部分では1画素単位まで微細化することが可能であり、対象物の輪郭形状を正確に抽出することができる。その結果、ノイズが含まれる画像や地模様や図形を背景に含むような画像であっても、対象物を画像内から容易に抽出することができ、結果的に文字認識や物品の種別の認識などにおいて不要な情報を除去でき、高精度かつ高速な処理が期待できる。その上、対象物の内側の領域はブロックの単位で処理することによって処理の負荷が少ないから、ブロック連結領域の境界部分では高精度に形状を抽出しながらも全体では処理の負荷が少なく、結果的に高速な処理が期待できる。
【0077】
請求項2の発明は、請求項1の発明において、前記ブロックおよび前記分割ブロックは2n ×2n 画素の矩形の領域であることを特徴としており、細分化段階においてブロックないし分割ブロックを分割する際に等分することができ、細分化段階における分割ブロックの生成が容易である。
【0078】
請求項3の発明は、請求項1または請求項2の発明において、前記初期分割段階において、各一対のブロック間で特徴量を比較する前に、各ブロックの画素値の平均値を規定の閾値と比較することにより前記多値画像内で背景側となるブロックを抽出するとともに、背景側となるブロックには規定した背景側のラベルを付与することを特徴としており、背景側とみなしてよいブロックには背景側のラベルを付与しているから、処理の不要な画素を無視することができ処理効率を大幅に向上させることができる。
【0079】
請求項4の発明は、請求項1ないし請求項3の発明において、前記初期分割段階において、着目するブロックに隣接する複数個のブロックを時計方向と反時計方向とのいずれか一方の順で選択するとともに選択したブロックと着目するブロックとの特徴量の類似度が規定値以上であるときに選択したブロックを次に着目するブロックとして追跡し、着目するブロックと選択したブロックとの特徴量の類似度が規定値以上でありかつ選択したブロックに着目するブロックと同ラベルが付与されているときに追跡済みのブロックを前記ブロック連結領域の境界部分に位置するブロックとすることを特徴としており、ブロックの追跡が一定の回転方向について行われるから、ブロック連結領域を追跡する処理によって同時にブロック連結領域の境界部分が検出されることになり、他の方法でブロック連結領域を求めた後にブロック連結領域の境界部分を抽出する場合に比較して処理速度が大幅に向上する。
【0080】
請求項5の発明は、請求項4の発明において、前記初期分割段階において、着目するブロックと選択したブロックとの特徴量の類似度が規定値以上でありかつ選択したブロックに着目するブロックとは異なるラベルが付与されているときに追跡済みのブロックに選択したブロックと同じラベルを付与することを特徴としており、ブロックを追跡する途中で追跡すべきブロックの選択肢が複数個である場合、つまり分岐を生じる場合に、ひとまとまりになるべきブロック連結領域に異なるラベルが付与されてしまうのを防止することができる。
【0081】
請求項6の発明は、請求項1の発明において、前記特徴量の類似度は前記ブロック内の画素値の平均値の差であることを特徴としており、ブロックの画素値の平均値を比較しているから、ブロック内の微細構造にかかわらずブロック同士の類似性を判断することができる。
【0082】
請求項7の発明は、請求項1の発明において、前記特徴量の類似度は前記ブロック内の画素値の平均値の差および標準偏差の差であることを特徴とする。画素値のレベルだけではなくばらつきの程度を評価することができ、たとえば、テクスチャが同じである2つのブロックについて特徴量として濃度値の平均値および標準偏差を用いることにより、両ブロックに同ラベルを付与することが可能になる。
【0083】
請求項8の発明は、請求項1の発明において、前記細分化段階において、分割ブロックが1画素以上の所定の画素数に達した状態で前記ブロック連結領域に統合できない分割ブロックは前記多値画像内で背景側となるブロック連結領域に統合することを特徴としており、強いノイズや画素値の大きなばらつき(濃度むらや色むら)などによってどのブロック連結領域にも統合できない領域があるときに、このような領域を背景側に統合させることによって、この種の領域を処理の対象外として除去することができる。
【0084】
請求項9の発明は、請求項1の発明において、前記ラベルが互いに異なる複数個の前記ブロック連結領域について、画素値の分布に関する特徴量の類似度が規定値以上である各一対のブロック連結領域をグループ化することを特徴としており、1個の領域として扱うべき部分が互いに離間していることによって複数のブロック連結領域に分割されている場合でも、これらの領域をグループ化するから1個の領域として扱うことが可能になる。
【0085】
請求項10の発明は、請求項1の発明において、前記ラベルが互いに異なる複数個の前記ブロック連結領域について、最短距離が規定した閾値以内である各一対のブロック連結領域に同ラベルを付与して統合することを特徴としており、1個の領域として扱うべき部分が画素値のばらつき(文字のかすれなど)によって複数の領域に分割されている場合でも、これらの領域を統合して1個の領域として扱うことが可能になる。
【0086】
請求項11の発明は、請求項1の発明において、前記細分化段階の終了後において前記ブロック連結領域のうち面積が規定の閾値以上であるブロック連結領域を前記多値画像内での背景側の領域とみなし、当該ブロック連結領域には規定した背景側のラベルを付与することを特徴としており、ブロック連結領域の面積を用いて背景領域を簡単な処理で分離することができる。
【0087】
請求項12の発明は、請求項11の発明において、前記多値画像内における背景側の領域の画素値の分布に関する特徴量を求め、前記ブロック連結領域のうち面積が前記閾値未満であってブロック連結領域内の画素の画素値の分布に関する特徴量と背景側の領域の特徴量との類似度が規定値以上であるブロック連結領域には規定した背景側のラベルを付与することを特徴としており、対象物に穴が存在することによって対象物の外側の輪郭線の内側に背景領域が飛び地として存在するような場合にも、この種の領域を背景領域に統合することが可能になる。
【0088】
請求項13の発明は、請求項1の発明において、前記細分化段階の終了後において前記ブロック連結領域のうち面積が規定の閾値以下であるブロック連結領域を着目するブロック連結領域として着目するブロック連結領域内の画素の画素値から画素値の分布に関する特徴量を求め、他のブロック連結領域であってブロック連結領域内の画素の画素値の分布に関する特徴量との類似度が規定値以上になるブロック連結領域が着目するブロック連結領域から規定の距離範囲内に存在しないときに、着目するブロック連結領域に前記多値画像内における背景側であることを示す規定した背景側のラベルを付与することを特徴としており、ノイズなどにより偶発的に発生した不要な領域を背景領域に統合することができる。
【0089】
請求項14の発明は、請求項1の発明において、前記細分化段階の終了後において前記ブロック連結領域ごとにブロック連結領域に外接する最小の矩形を設定し、設定した矩形の大きさが規定範囲を逸脱するときには当該ブロック連結領域に前記多値画像内における背景側であることを示す規定した背景側のラベルを付与することを特徴としており、対象物の大きさが既知であるときには不要な領域を簡単な処理で容易に除去することができる。
【0090】
請求項15の発明は、請求項1の発明において、前記細分化段階の終了後において前記ブロック連結領域ごとに主軸の方向を求め、後処理においてブロック連結領域との類似度を比較するマッチングパターンの主軸の方向にブロック連結領域の主軸の方向が一致するようにブロック連結領域を回転させることを特徴としており、対象物の向きをマッチングパターンの向きと一致させることによって、対象物とマッチングパターンとの回転による誤差を補正するから、パターンマッチングの処理を容易かつ正確に行うことが可能になる。
【0091】
請求項16の発明は、請求項1の発明において、前記細分化段階の終了後において前記ブロック連結領域ごとにブロック連結領域に外接する最小の矩形を設定し、当該矩形のサイズが規定したサイズになるように各ブロック連結領域を拡大または縮小することを特徴としており、画像に歪みがあって対象物の縦横比にばらつきが生じているような場合でも、対象物のサイズを揃えることによって対象物に対する後処理が容易になる。
【0092】
請求項17の発明に係る画像の領域分割装置は、多値画像を記憶する記憶手段と、記憶手段に格納された多値画像をそれぞれ複数個の画素を含む矩形状の複数個のブロックに分割する画像分割処理部と、ブロック内の画素値の分布に関する特徴量を求める特徴量演算部と、隣接する各一対のブロック間で特徴量を比較し特徴量の類似度が規定値以上である各一対のブロックには同じラベルを付与するとともに特徴量の類似度が規定値未満である各一対のブロックには異なるラベルを付与して前記多値画像内のすべてのブロックにラベルを付与する追跡処理部と、同ラベルが付与されているブロックからなるブロック連結領域の境界部分に位置するブロックを複数個の分割ブロックに分割するブロック分割処理部とを備え、特徴量演算部はブロック分割処理部で分割した分割ブロックについて特徴量を求める機能を有し、追跡処理部は、分割前のブロックに隣接するブロックの前記特徴量と分割ブロックの画素値の分布に関する特徴量との類似度が規定値以上になるときに隣接するブロックと同じラベルを当該分割ブロックに付与することにより当該分割ブロックを前記ブロック連結領域を構成するブロックとして前記ブロック連結領域に統合する機能を有し、ブロック分割処理部と特徴量演算部と追跡処理部とによりブロックを分割ブロックに分割してラベルを付与する処理を繰り返すことにより多値画像に含まれる全画素にラベルを付与するものであり、画像内で類似性を有する領域をブロックによっておおまかに分割するから、ブロックのサイズよりも小さい領域で画素値が変化するようなノイズや地模様のような背景を容易に分離することができる。また、隣接するブロックのうち画素値の分布が類似しているブロックに同ラベルを付与してブロック連結領域を形成しているので、背景との画素値分布は異なるが同一領域内で画素値にばらつきが生じている(明るさのむらがある場合など)ような対象物、たとえば、かすれた文字や陰影の付いたマークなどの領域を正しく抽出することができる。しかも、ブロック連結領域の境界部分についてのみブロックを細分化し、全画素にラベルを付与するから、ブロック連結領域の境界部分では1画素単位まで微細化することが可能であり、対象物の輪郭形状を正確に抽出することができる。その結果、ノイズが含まれる画像や地模様や図形を背景に含むような画像であっても、対象物を画像内から容易に抽出することができ、結果的に文字認識や物品の種別の認識などにおいて不要な情報を除去でき、高精度かつ高速な処理が期待できる。その上、対象物の内側の領域はブロックの単位で処理することによって処理の負荷が少ないから、ブロック連結領域の境界部分では高精度に形状を抽出しながらも全体では処理の負荷が少なく、結果的に高速な処理が期待できる。
【0093】
請求項18の発明に係るプログラムは、請求項1ないし請求項16のいずれか1項に記載の画像の領域分割方法をコンピュータを用いて実現するものであって、請求項1ないし請求項16と同様の効果を奏する。
【図面の簡単な説明】
【図1】本発明の実施の形態を示すブロック図である。
【図2】同上の動作の概要を示す動作説明図である。
【図3】同上における初期分割段階の処理手順を示す動作説明図である。
【図4】同上における細分化段階の処理手順を示す動作説明図である。
【図5】同上の動作説明図である。
【図6】同上においてブロックを設定した状態の動作説明図である。
【図7】同上においてブロック連結領域を形成した状態の動作説明図である。
【図8】同上においてブロックを追跡する手順を示す動作説明図である。
【図9】同上の動作説明図である。
【図10】同上においてブロックを追跡する手順を示す動作説明図である。
【図11】同上においてブロックを追跡する手順を示す動作説明図である。
【図12】同上においてブロック連結領域が形成された状態を示す動作説明図である。
【図13】同上の動作説明図である。
【図14】同上の動作説明図である。
【図15】同上において細分化段階の結果を示す動作説明図である。
【図16】同上の動作説明図である。
【図17】同上の動作説明図である。
【図18】同上の動作説明図である。
【図19】同上の動作説明図である。
【図20】同上の動作説明図である。
【図21】同上を説明するための中間調画像をプリンタで印刷した写真である。
【図22】同上を説明するための中間調画像をプリンタで印刷した写真である。
【図23】同上を説明するための中間調画像をプリンタで印刷した写真である。
【符号の説明】
1 対象物
2 撮像装置
3 モニタ
10 画像処理装置
11 A/D変換器
12 記憶手段
13 画像分割処理部
14 特徴量演算部
15 追跡処理部
16 ブロック分割処理部
Claims (18)
- 多値画像をそれぞれ複数個の画素を含む矩形状の複数個のブロックに分割した後に、ブロック内の画素値の分布に関する特徴量を隣接する各一対のブロック間で比較し特徴量の類似度が規定値以上である各一対のブロックには同じラベルを付与するとともに特徴量の類似度が規定値未満である各一対のブロックには異なるラベルを付与して前記多値画像内のすべてのブロックにラベルを付与する初期分割段階と、同ラベルが付与されているブロックからなるブロック連結領域の境界部分に位置するブロックを複数個の分割ブロックに分割するとともに、分割前のブロックに隣接するブロックの前記特徴量と分割ブロックの画素値の分布に関する特徴量との類似度が規定値以上になるときに隣接するブロックと同じラベルを当該分割ブロックに付与することにより当該分割ブロックを前記ブロック連結領域を構成するブロックとして前記ブロック連結領域に統合する細分化段階とを有し、細分化段階を繰り返すことにより多値画像に含まれる全画素にラベルを付与することを特徴とする画像の領域分割方法。
- 前記ブロックおよび前記分割ブロックは2n ×2n 画素の矩形の領域であることを特徴とする請求項1記載の画像の領域分割方法。
- 前記初期分割段階において、各一対のブロック間で特徴量を比較する前に、各ブロックの画素値の平均値を規定の閾値と比較することにより前記多値画像内で背景側となるブロックを抽出するとともに、背景側となるブロックには規定した背景側のラベルを付与することを特徴とする請求項1または請求項2記載の画像の領域分割方法。
- 前記初期分割段階において、着目するブロックに隣接する複数個のブロックを時計方向と反時計方向とのいずれか一方の順で選択するとともに選択したブロックと着目するブロックとの特徴量の類似度が規定値以上であるときに選択したブロックを次に着目するブロックとして追跡し、着目するブロックと選択したブロックとの特徴量の類似度が規定値以上でありかつ選択したブロックに着目するブロックと同ラベルが付与されているときに追跡済みのブロックを前記ブロック連結領域の境界部分に位置するブロックとすることを特徴とする請求項1ないし請求項3のいずれか1項に記載の画像の領域分割方法。
- 前記初期分割段階において、着目するブロックと選択したブロックとの特徴量の類似度が規定値以上でありかつ選択したブロックに着目するブロックとは異なるラベルが付与されているときに追跡済みのブロックに選択したブロックと同じラベルを付与することを特徴とする請求項4記載の画像の領域分割方法。
- 前記特徴量の類似度は前記ブロック内の画素値の平均値の差であることを特徴とする請求項1記載の画像の領域分割方法。
- 前記特徴量の類似度は前記ブロック内の画素値の平均値の差および標準偏差の差であることを特徴とする請求項1記載の画像の領域分割方法。
- 前記細分化段階において、分割ブロックが1画素以上の所定の画素数に達した状態で前記ブロック連結領域に統合できない分割ブロックは前記多値画像内で背景側となるブロック連結領域に統合することを特徴とする請求項1記載の画像の領域分割方法。
- 前記ラベルが互いに異なる複数個の前記ブロック連結領域について、画素値の分布に関する特徴量の類似度が規定値以上である各一対のブロック連結領域をグループ化することを特徴とする請求項1記載の画像の領域分割方法。
- 前記ラベルが互いに異なる複数個の前記ブロック連結領域について、最短距離が規定した閾値以内である各一対のブロック連結領域に同ラベルを付与して統合することを特徴とする請求項1記載の画像の領域分割方法。
- 前記細分化段階の終了後において前記ブロック連結領域のうち面積が規定の閾値以上であるブロック連結領域を前記多値画像内での背景側の領域とみなし、当該ブロック連結領域には規定した背景側のラベルを付与することを特徴とする請求項1記載の画像の領域分割方法。
- 前記多値画像内における背景側の領域の画素値の分布に関する特徴量を求め、前記ブロック連結領域のうち面積が前記閾値未満であってブロック連結領域内の画素の画素値の分布に関する特徴量と背景側の領域の特徴量との類似度が規定値以上であるブロック連結領域には規定した背景側のラベルを付与することを特徴とする請求項11記載の画像の領域分割方法。
- 前記細分化段階の終了後において前記ブロック連結領域のうち面積が規定の閾値以下であるブロック連結領域を着目するブロック連結領域として着目するブロック連結領域内の画素の画素値から画素値の分布に関する特徴量を求め、他のブロック連結領域であってブロック連結領域内の画素の画素値の分布に関する特徴量との類似度が規定値以上になるブロック連結領域が着目するブロック連結領域から規定の距離範囲内に存在しないときに、着目するブロック連結領域に前記多値画像内における背景側であることを示す規定した背景側のラベルを付与することを特徴とする請求項1記載の画像の領域分割方法。
- 前記細分化段階の終了後において前記ブロック連結領域ごとにブロック連結領域に外接する最小の矩形を設定し、設定した矩形の大きさが規定範囲を逸脱するときには当該ブロック連結領域に前記多値画像内における背景側であることを示す規定した背景側のラベルを付与することを特徴とする請求項1記載の画像の領域分割方法。
- 前記細分化段階の終了後において前記ブロック連結領域ごとに主軸の方向を求め、後処理においてブロック連結領域との類似度を比較するマッチングパターンの主軸の方向にブロック連結領域の主軸の方向が一致するようにブロック連結領域を回転させることを特徴とする請求項1記載の画像の領域分割方法。
- 前記細分化段階の終了後において前記ブロック連結領域ごとにブロック連結領域に外接する最小の矩形を設定し、当該矩形のサイズが規定したサイズになるように各ブロック連結領域を拡大または縮小することを特徴とする請求項1記載の画像の領域分割方法。
- 多値画像を記憶する記憶手段と、記憶手段に格納された多値画像をそれぞれ複数個の画素を含む矩形状の複数個のブロックに分割する画像分割処理部と、ブロック内の画素値の分布に関する特徴量を求める特徴量演算部と、隣接する各一対のブロック間で特徴量を比較し特徴量の類似度が規定値以上である各一対のブロックには同じラベルを付与するとともに特徴量の類似度が規定値未満である各一対のブロックには異なるラベルを付与して前記多値画像内のすべてのブロックにラベルを付与する追跡処理部と、同ラベルが付与されているブロックからなるブロック連結領域の境界部分に位置するブロックを複数個の分割ブロックに分割するブロック分割処理部とを備え、特徴量演算部はブロック分割処理部で分割した分割ブロックについて特徴量を求める機能を有し、追跡処理部は、分割前のブロックに隣接するブロックの前記特徴量と分割ブロックの画素値の分布に関する特徴量との類似度が規定値以上になるときに隣接するブロックと同じラベルを当該分割ブロックに付与することにより当該分割ブロックを前記ブロック連結領域を構成するブロックとして前記ブロック連結領域に統合する機能を有し、ブロック分割処理部と特徴量演算部と追跡処理部とによりブロックを分割ブロックに分割してラベルを付与する処理を繰り返すことにより多値画像に含まれる全画素にラベルを付与することを特徴とする画像の領域分割装置。
- 請求項1ないし請求項16のいずれか1項に記載の画像の領域分割方法をコンピュータを用いて実現する画像の領域分割プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002184889A JP4062987B2 (ja) | 2002-06-25 | 2002-06-25 | 画像の領域分割方法、画像の領域分割装置、画像の領域分割プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002184889A JP4062987B2 (ja) | 2002-06-25 | 2002-06-25 | 画像の領域分割方法、画像の領域分割装置、画像の領域分割プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004030188A true JP2004030188A (ja) | 2004-01-29 |
JP4062987B2 JP4062987B2 (ja) | 2008-03-19 |
Family
ID=31180693
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002184889A Expired - Fee Related JP4062987B2 (ja) | 2002-06-25 | 2002-06-25 | 画像の領域分割方法、画像の領域分割装置、画像の領域分割プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4062987B2 (ja) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005339180A (ja) * | 2004-05-26 | 2005-12-08 | Matsushita Electric Works Ltd | 画像処理方法 |
JP2006024149A (ja) * | 2004-07-09 | 2006-01-26 | Foundation For The Promotion Of Industrial Science | 画像上移動物体認識方法及び装置 |
JP2009064287A (ja) * | 2007-09-07 | 2009-03-26 | Meidensha Corp | 侵入者検知装置 |
JP2010016546A (ja) * | 2008-07-02 | 2010-01-21 | Nikon Corp | 撮像装置 |
JP2010277227A (ja) * | 2009-05-27 | 2010-12-09 | Sharp Corp | 画像処理装置、画像処理方法、コンピュータプログラム及び記録媒体 |
JP2012138013A (ja) * | 2010-12-27 | 2012-07-19 | Canon Inc | 追尾装置およびその制御方法 |
US8363933B2 (en) | 2008-08-13 | 2013-01-29 | Morpho, Inc. | Image identification method and imaging apparatus |
WO2013136546A1 (ja) * | 2012-03-16 | 2013-09-19 | 株式会社東芝 | 画像処理装置、及び画像処理方法 |
JP2014041476A (ja) * | 2012-08-22 | 2014-03-06 | Canon Inc | 画像処理装置、画像処理方法及びプログラム |
JP6664574B1 (ja) * | 2019-09-06 | 2020-03-13 | 三菱電機株式会社 | 画像処理システムおよび画像処理方法 |
CN114882482A (zh) * | 2021-10-12 | 2022-08-09 | 北京九章云极科技有限公司 | 印章防伪识别方法及装置 |
CN116229438A (zh) * | 2023-05-04 | 2023-06-06 | 山东超越纺织有限公司 | 一种纺纱质量视觉识别系统 |
CN116740056A (zh) * | 2023-08-10 | 2023-09-12 | 梁山水泊胶带股份有限公司 | 用于整芯高花纹输送带涂覆层的缺陷检测方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110210469A (zh) * | 2019-05-31 | 2019-09-06 | 中科软科技股份有限公司 | 一种识别图片文字语种的方法及系统 |
-
2002
- 2002-06-25 JP JP2002184889A patent/JP4062987B2/ja not_active Expired - Fee Related
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005339180A (ja) * | 2004-05-26 | 2005-12-08 | Matsushita Electric Works Ltd | 画像処理方法 |
JP4534599B2 (ja) * | 2004-05-26 | 2010-09-01 | パナソニック電工株式会社 | 画像処理方法 |
JP2006024149A (ja) * | 2004-07-09 | 2006-01-26 | Foundation For The Promotion Of Industrial Science | 画像上移動物体認識方法及び装置 |
JP4628712B2 (ja) * | 2004-07-09 | 2011-02-09 | 財団法人生産技術研究奨励会 | 画像上移動物体認識方法及び装置 |
JP2009064287A (ja) * | 2007-09-07 | 2009-03-26 | Meidensha Corp | 侵入者検知装置 |
JP2010016546A (ja) * | 2008-07-02 | 2010-01-21 | Nikon Corp | 撮像装置 |
US8363933B2 (en) | 2008-08-13 | 2013-01-29 | Morpho, Inc. | Image identification method and imaging apparatus |
JP2010277227A (ja) * | 2009-05-27 | 2010-12-09 | Sharp Corp | 画像処理装置、画像処理方法、コンピュータプログラム及び記録媒体 |
US8606014B2 (en) | 2009-05-27 | 2013-12-10 | Sharp Kabushiki Kaisha | Image Processing apparatus, extracting foreground pixels for extracted continuous variable density areas according to color information |
JP2012138013A (ja) * | 2010-12-27 | 2012-07-19 | Canon Inc | 追尾装置およびその制御方法 |
JP2013196136A (ja) * | 2012-03-16 | 2013-09-30 | Toshiba Corp | 画像処理装置、及び画像処理方法 |
WO2013136546A1 (ja) * | 2012-03-16 | 2013-09-19 | 株式会社東芝 | 画像処理装置、及び画像処理方法 |
CN104137119A (zh) * | 2012-03-16 | 2014-11-05 | 株式会社东芝 | 图像处理装置及图像处理方法 |
US9275279B2 (en) | 2012-03-16 | 2016-03-01 | Kabushiki Kaisha Toshiba | Image processing apparatus and image processing method |
CN104137119B (zh) * | 2012-03-16 | 2017-10-13 | 株式会社东芝 | 图像处理装置及图像处理方法 |
JP2014041476A (ja) * | 2012-08-22 | 2014-03-06 | Canon Inc | 画像処理装置、画像処理方法及びプログラム |
JP6664574B1 (ja) * | 2019-09-06 | 2020-03-13 | 三菱電機株式会社 | 画像処理システムおよび画像処理方法 |
WO2021044629A1 (ja) * | 2019-09-06 | 2021-03-11 | 三菱電機株式会社 | 画像処理システムおよび画像処理方法 |
CN114882482A (zh) * | 2021-10-12 | 2022-08-09 | 北京九章云极科技有限公司 | 印章防伪识别方法及装置 |
CN116229438A (zh) * | 2023-05-04 | 2023-06-06 | 山东超越纺织有限公司 | 一种纺纱质量视觉识别系统 |
CN116740056A (zh) * | 2023-08-10 | 2023-09-12 | 梁山水泊胶带股份有限公司 | 用于整芯高花纹输送带涂覆层的缺陷检测方法 |
CN116740056B (zh) * | 2023-08-10 | 2023-11-07 | 梁山水泊胶带股份有限公司 | 用于整芯高花纹输送带涂覆层的缺陷检测方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4062987B2 (ja) | 2008-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110678901B (zh) | 信息处理设备、信息处理方法和计算机可读存储介质 | |
US11694318B2 (en) | Electronic substrate defect detection | |
JP4396376B2 (ja) | 図形読み取り方法及びその装置並びに主要色抽出方法及びその装置 | |
CN109523529B (zh) | 一种基于surf算法的输电线路缺陷识别方法 | |
CN114937055A (zh) | 基于人工智能的图像自适应分割方法与系统 | |
Wu et al. | An automated vision system for container-code recognition | |
CN108985305B (zh) | 一种激光蚀刻工业雷管编码图像定位及校正方法 | |
JP4062987B2 (ja) | 画像の領域分割方法、画像の領域分割装置、画像の領域分割プログラム | |
CN110390643B (zh) | 一种车牌增强方法、装置及电子设备 | |
CN103543394A (zh) | 一种高压电气设备放电紫外成像量化参数提取方法 | |
CN108805126B (zh) | 一种文本图像的长干扰线去除方法 | |
KR101549495B1 (ko) | 문자 추출 장치 및 그 방법 | |
JP6890427B2 (ja) | 車番認識装置 | |
US20090245640A1 (en) | Image determination apparatus, image search apparatus and a recording medium on which an image search program is recorded | |
CN114863492B (zh) | 一种低质量指纹图像的修复方法及修复装置 | |
US20060210164A1 (en) | Image processing device | |
CN112115948A (zh) | 一种基于深度学习的芯片表面字符识别方法 | |
CN117094975A (zh) | 钢铁表面缺陷检测方法、装置及电子设备 | |
CN115272350A (zh) | 一种计算机pcb主板生产质量检测方法 | |
JPH04315272A (ja) | 図形認識装置 | |
CN114693651A (zh) | 基于图像处理的橡胶圈流痕检测方法及装置 | |
CN112818983A (zh) | 一种利用图片相识度判断字符倒置的方法 | |
CN115239595A (zh) | 一种包装印刷品二维码合格性检测方法 | |
CN111311696B (zh) | 一种基于高光谱解混技术的车牌真伪检测方法 | |
Yang et al. | A novel binarization approach for license plate |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050216 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070820 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070911 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071112 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071211 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071224 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110111 Year of fee payment: 3 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110111 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120111 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120111 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130111 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130111 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |