JP4578000B2 - パターン認識処理装置、方法および情報記憶媒体 - Google Patents
パターン認識処理装置、方法および情報記憶媒体 Download PDFInfo
- Publication number
- JP4578000B2 JP4578000B2 JP2001019679A JP2001019679A JP4578000B2 JP 4578000 B2 JP4578000 B2 JP 4578000B2 JP 2001019679 A JP2001019679 A JP 2001019679A JP 2001019679 A JP2001019679 A JP 2001019679A JP 4578000 B2 JP4578000 B2 JP 4578000B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- recognition
- imaging data
- registered
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
Description
【発明の属する技術分野】
本発明は、カメラを用いてトランプやタロットカード等の各種のカード類やサイコロ等を撮像してそれらに対して画像認識を行うパターン認識処理装置、方法および情報記憶媒体に関する。
【0002】
【従来の技術】
一般に、パターン認識技術では、あらかじめ認識対象としたい物(認識対象物)を撮像した撮像データ(以後、これを「登録パターン」と呼ぶ)を用意しておき、認識対象物を撮像して得られた撮像データと登録パターンとを比較して一致あるいは最も類似するものを検索することにより、認識対象物の内容の特定等が行われる。このようなパターン認識技術は、FA(Factory Automation)などの分野における部品等の位置合わせや製品の仕分け、あるいは指紋認識や網膜認識等のバイオメトリクス分野など様々な分野に応用されている。
【0003】
【発明が解決しようとする課題】
ところで、従来のパターン認識技術では、認識対象物に対する照明の当たり方(照明条件)が変化することにより認識精度が低下してしまうという問題がある。
【0004】
例えば、トランプやタロットカード等のカード類やサイコロ等の小道具を認識対象物とし、パターン認識を用いてこれらの小道具の内容(例えば、タロットカードの絵柄など)を特定する占い装置やゲーム装置等を考える。この場合に、ゲーム装置等が設置されるゲームセンタ等の照明設備が各ゲームセンタ等によって相違するために、登録パターンを作成した際の照明条件と実際にカード等を撮影してパターン認識処理を行う際の照明条件とは同じにならない場合が多く、このために認識精度が低下してしまう。
【0005】
また、ゲームや占い等を行う利用者や周囲の観客等の身長や立ち位置などは、各利用者により異なるのが普通である。このため、カード等に照射される光が遮られることもあり、しかもその度合いが各利用者によってその都度異なることから、認識対象物に対する照明条件が毎回変化してしまい、この点からもパターン認識の精度が低下する。
【0006】
また、カード等の内容を認識する際には、カード等を所定のステージ等に載せてカメラにより撮像することとなるが、一般にカメラを通して見たステージ上の明るさは、カメラのレンズ系の特性に起因して周辺部分が暗くなったり(周辺減光)、照明による光の照射自体が不均一であったりする場合がある。このようにステージ上の明るさが不均一の場合には、カード等を置いた場所により照明条件が異なってしまうため、この点も認識精度を低下させてしまう要因となる。
【0007】
本発明は、このような点に鑑みて創作されたものであり、その目的は、照明条件が変化する場合においても高い認識率を達成することができるパターン認識処理装置、方法および情報記憶媒体を提供することにある。
【0008】
【課題を解決するための手段】
上述した課題を解決するために、本発明のパターン認識処理装置は、境界抽出手段、認識対象画像抽出手段、正規化処理手段、登録パターン格納手段、パターン比較手段を含んで構成されている。境界抽出手段は、撮像によって得られた認識対象物に対応する多値の撮像データに基づいて、認識対象物の境界線を抽出する。認識対象画像抽出手段は、境界抽出手段によって抽出された境界線に囲まれる領域に対応する撮像データを抽出する。正規化処理手段は、認識対象画像抽出手段によって抽出された認識対象物に対応する多値の撮像データが入力されて所定の正規化処理を行う。登録パターン格納手段は、複数の認識対象物のそれぞれについて、複数の照明条件下で撮像したときに得られる多値の撮像データが複数の登録パターンとして格納されている。パターン比較手段は、正規化処理手段によって正規化処理が行われた後の撮像データを複数の登録パターンと比較することにより、この撮像データに最も類似度が大きい登録パターンを抽出し、この登録パターンに対応する認識対象物の内容を特定する。パターン比較手段によって、認識対象画像抽出手段によって抽出された認識対象物の内容の特定が行われる。一の認識対象物に対応させて複数の照明条件を考慮した登録パターンを予め用意しておくことにより、認識対象物を置いた場所等によって照明条件が変化する場合であっても、正確にこの認識対象物の内容を特定することができる。
また、認識対象物の境界線によって囲まれた領域の撮像データを抽出して、いくつかの認識結果候補としての登録パターンや補間パターンと比較するという比較的単純な処理で、認識対象物の内容を認識することができる。また、境界線が所定の形状を有していることが予めわかっている場合には、撮像データが登録パターン等に一致するか否かを正確に判定することができるため、高い認識率を達成することができる。
【0009】
また、一の認識対象物に対応する複数の登録パターンに基づいて補間処理を行うことにより、中間の照明条件下で得られる撮像データを予測した補間パターンを計算する補間パターン作成手段をさらに備えるとともに、上述したパターン比較手段によって、登録パターンとともに補間パターンを用いて認識対象物の特定を行うことが望ましい。登録パターンの他に補間パターンを用いることにより、照明条件が変化した場合の認識精度をさらに向上させることができる。また、複数の登録パターンの一部を補間パターンで代用することにより、登録パターンの数を減らすことができる。
【0010】
また、上述した撮像データを、認識対象物を構成する各画素の階調値を示す階調データとした場合に、正規化処理手段によって、一の認識対象物に含まれる階調値のばらつきの範囲が一定になるように、階調データに対して所定の変換処理を行うことが望ましい。照明条件の相違に基づく階調値のばらつきを調整することにより、照明条件が異なることによって階調値の分布が偏ることによる影響を取り除くことができるため、パターン比較を行う際の精度を上げることができる。
【0011】
また、上述した正規化処理手段は、一の認識対象物に含まれる階調値の上限値と下限値を取得し、これらの値に基づいて、階調値が所定の範囲に含まれるように変換関数を決定することが望ましい。階調値の上限値と下限値を取得することにより、正規化処理前の階調値の範囲を把握することができるため、この範囲を正規化処理によって所定の範囲に変換する場合の変換関数を決定することが容易となる。
【0012】
特に、上述した変換関数は、直線補間関数であることが望ましい。直線補間関数は単純な一次関数で表すことができるため、その演算内容が比較的単純であり、正規化処理を実施する際の処理負担を軽減することができる。
また、上述した補間パターン作成手段は、認識対象物を複数の領域に分割した各分割領域毎に、中間の照明条件下で得られる撮像データを予測することが望ましい。これにより、例えば認識対象物の一部が影になったりする場合のように、不均一な照明下においても高い認識率を実現することができる。
【0014】
また、認識対象物を載置する載置台をさらに備えるとともに、この載置台の色を認識対象物の外周部の色と異ならせることが望ましい。載置台の色を認識対象物の色と異ならせることにより、境界線抽出を容易かつ高精度に行うことができる。
【0015】
また、上述した境界抽出手段は、撮像データを二値化したデータに基づいて境界線の抽出を行うことが望ましい。二値化したデータを用いることにより、さらに処理の簡略化や処理負担の軽減が可能になる。
また、認識対象物を撮像手段から見た撮像面の形状をほぼ多角形としたときに、境界抽出手段によって抽出された境界線に基づいて多角形の複数の頂点を検出する頂点検出手段をさらに備えるとともに、上述した認識対象画像抽出手段によって、頂点検出手段によって検出された複数の頂点の位置を基準にして、境界線に囲まれる領域に対応する撮像データの抽出を行うことが望ましい。認識対象物の撮像面の頂点近傍が丸みを帯びている場合に、境界線の外側に頂点が存在することになる。このような場合であっても、正確に頂点位置を求めることができれば、この頂点位置を基準にして正確な座標の計算を行うことができるため、パターン比較手段によって撮像データ同士の比較を行う際の精度を高めることができる。
【0016】
また、上述した撮像面をほぼ正方形形状あるいはほぼ長方形形状とした場合に、頂点検出手段は、境界線を構成する画素列に沿って、複数の画素からなる部分画素列を移動させたときに、部分画素列の先頭部分と末尾部分の向きがほぼ直角になるコーナーの位置を抽出することによって、頂点の検出を行うことが望ましい。部分画素列の先頭部分と末尾部分のそれぞれの向きがなす角度を調べるという簡単な処理によって、コーナーの一を抽出することができる。
【0017】
また、上述したコーナーにおいて画素列に含まれる複数の画素がほぼ円弧状に配列されている場合に、頂点検出手段は、境界線を構成する画素列に含まれる隣接コーナー間の複数の画素の配列を直線近似した4本の直線の交点を求めて、頂点として設定することが望ましい。丸みを帯びたコーナーを除く境界線には、平行な2組の直線が含まれており、これら4本の直線の交点を求める処理によって、容易に頂点位置を決定することができる。
【0018】
また、上述した認識対象物を撮像手段から見た撮像面の形状をほぼ長方形としたときに、認識対象画像抽出手段によって抽出された撮像データの配列を、比較対象となる登録パターンの向きに合わせて補正する回転補正手段をさらに備えることが望ましい。比較対象物に方向性がある場合に、回転補正を行うことにより、明らかに不一致となる撮像データ同士(例えば、横長の形状を有する認識対象物と縦長の形状を有する登録パターンとの比較を行うような場合)の比較処理を省略することができるため、さらに処理の簡略化が可能になる。
【0019】
また、本発明のパターン認識処理方法は、境界抽出手段、認識対象画像抽出手段、正規化処理手段、登録パターン格納手段、パターン比較手段を備えるパターン認識処理におけるパターン認識処理方法であって、撮像によって得られた認識対象物に対する多値の撮像データが入力されて、この撮像データに基づいて、認識対象物の境界線を境界抽出手段によって抽出する第1のステップと、第1のステップにおいて境界抽出手段によって抽出された境界線に囲まれる領域に対応する撮像データを認識対象画像抽出手段によって抽出する第2のステップと、第2のステップにおいて認識対象画像抽出手段によって抽出された認識対象物に対応する多値の撮像データが入力されて、正規化処理手段によって所定の正規化処理を行う第3のステップと、複数の認識対象物のそれぞれについて複数の照明条件下で撮像したときに得られる多値の撮像データが複数の登録パターンとして登録パターン格納手段に登録されており、第3のステップによる処理が行われた後の撮像データをこれら複数の登録パターンと比較することにより、この撮像データに最も類似度が大きい登録パターンを抽出し、この登録パターンに対応する認識対象物の内容を特定する第4のステップとを有している。第4のステップにおいて、第2のステップにて認識対象画像抽出手段によって抽出された認識対象物の内容の特定が行われる。
また、本発明の情報記憶媒体は、コンピュータを、撮像によって得られた認識対象物に対応する多値の撮像データに基づいて、認識対象物の境界線を抽出する境界抽出手段と、境界抽出手段によって抽出された境界線に囲まれる領域に対応する撮像データを抽出する認識対象画像抽出手段と、認識対象画像抽出手段によって抽出された認識対象物に対応する多値の撮像データが入力されて所定の正規化処理を行う正規化処理手段と、複数の認識対象物のそれぞれについて、複数の照明条件下で撮像したときに得られる多値の撮像データが複数の登録パターンとして格納された登録パターン格納手段と、正規化処理手段によって正規化処理が行われた後の撮像データを複数の登録パターンと比較することにより、この撮像データに最も類似度が大きい登録パターンを抽出し、この登録パターンに対応する認識対象物の内容を特定するパターン比較手段と、して機能させるためのプログラムを格納した情報記憶媒体であって、パターン比較手段によって、認識対象画像抽出手段によって抽出された認識対象物の内容の特定を行っている。
【0020】
本発明のパターン認識処理方法を実施することにより、あるいは本発明の情報記憶媒体に含まれるプログラムを実行することにより、認識対象物を置いた場所等によって照明条件が変化する場合であっても、正確にこの認識対象物の内容を特定することができる。
【0021】
【発明の実施の形態】
以下、本発明を適用した一実施形態のパターン認識処理装置について、図面を参照しながら詳細に説明する。
図1は、本実施形態のパターン認識処理装置の構成を示す図である。図1に示す本実施形態のパターン認識処理装置は、カメラ10、パターン認識処理部40、情報記憶媒体50を含んで構成されている。
【0022】
カメラ10は、ステージ30上に並べられたカード100を撮像する。例えば、撮像素子としてCCD(電荷結合素子)が用いられている。
パターン認識処理部40は、カメラ10によって撮像されたカード100の内容を所定のパターン認識処理を行うことによって特定する。このために、パターン認識処理部40は、前処理部12、二値化処理部14、境界追跡処理部16、頂点検出部18、回転補正部20、切り出し処理部22、正規化処理部24、登録パターン格納部26、補間パターン作成部27、パターン比較部28を含んで構成されている。
【0023】
前処理部12は、カメラ10から出力される3色の色データからなる撮像データをグレースケールの多値の階調データからなる撮像データに変換するとともに、この変換処理後の撮像データに対して所定の前処理を行う。前処理には、ステージ30をカメラ10によって撮像したときに生じる明るさの不均一さを補正する処理が含まれる。
【0024】
二値化処理部14は、前処理部12によって所定の前処理が行われた撮像データを二値化する。境界追跡処理部16は、二値化された撮像データに含まれるカード100の境界線(輪郭線)を抽出する。頂点検出部18は、境界追跡処理部16によって抽出された境界線に基づいて、カード100の4つの頂点を検出する。一般に、トランプやタロットカードはほぼ長方形を有しているが、4つのコーナーは丸くなっている。頂点検出部18では、隣接する2辺を延長したときに交わる真の頂点が計算される。
【0025】
回転補正部20は、頂点検出部18によって検出された4つの頂点の相対的な位置を、必要に応じて1つ分または2つ分ずらす処理を行う。切り出し処理部22は、前処理部12から出力される前処理後の撮像データ(階調データ)の中から、4つの頂点を結んだ領域に対応する部分を切り出す処理を行う。
【0026】
正規化処理部24は、切り出し処理部22により切り出された階調データに対してその明るさ、すなわち、階調データの値(階調値)の大きさを正規化する所定の正規化処理を行う。正規化処理の詳細については後述する。
登録パターン格納部26は、認識対象となる可能性のあるカード100の撮像データを登録パターンとしてあらかじめ登録しておくためのものである。本実施形態では、一のカード100を複数の照明条件下で撮影して得られた複数の撮像データが登録パターンとして格納されている。なお、切り出し処理部22によって切り出された撮像データに対して正規化処理部24による所定の正規化処理が行われるため、登録パターン格納部26には、同等の正規化処理が行われた後の登録パターンが格納されている。
【0027】
補間パターン作成部27は、一のカード100に対応して登録パターン格納部26に格納されている複数の登録パターンに基づいて、中間の照明条件下で得られる撮像データを予測した補間パターンを計算する。
パターン比較部28は、正規化処理部24によって正規化処理が行われた後の撮像データと、登録パターン格納部26に格納された複数の登録パターンおよび補間パターン作成部27によって計算された複数の補間パターンとを比較することにより、撮像データとの間の類似度が最も大きい登録パターンあるいは補間パターンを抽出することにより、撮像されたカード100の内容を特定する。
【0028】
情報記憶媒体50は、パターン認識処理部40によって行われるパターン認識処理の実施に必要なプログラムや登録パターンのデータを格納するためのものである。この情報記憶媒体50は、CD(コンパクトディスク)等の光学式のディスク型記憶媒体や、ROM、RAM等の半導体メモリ、あるいはハードディスク装置などを用いて構成されている。
【0029】
例えば、情報記憶媒体50として一連のパターン認識処理用のプログラムを格納したROMやRAMを考えた場合には、パターン認識処理部40に含まれる前処理部12、二値化処理部14、境界追跡処理部16、頂点検出部18、回転補正部20、切り出し処理部22、正規化処理部24、補間パターン作成部27、パターン比較部28は、このプログラムをCPUによって実行することにより実現することができ、登録パターン格納部26は、登録パターンデータを格納するRAMによって実現することができる。
【0030】
上述したカメラ10が撮像手段に、二値化処理部14、境界追跡処理部16が境界抽出手段に、頂点検出部18が頂点検出手段に、回転補正部20が回転補正手段に、切り出し処理部22が認識対象画像抽出手段にそれぞれ対応する。また、正規化処理部24が正規化処理手段に、登録パターン格納部26が登録パターン格納手段に、補間パターン作成部27が補間パターン作成手段に、パターン比較部28がパターン比較手段に、ステージ30が載置台にそれぞれ対応する。
【0031】
本実施形態のパターン認識処理装置はこのような構成を有しており、次にその詳細な処理手順を説明する。
図2は、ステージ30上に並べられたカード100をカメラ10によって撮像し、カード100の内容を認識するまでの一連のパターン認識手順を示す流れ図である。以下、図2を参照しながら、一連のパターン認識動作について説明する。
【0032】
撮像(ステップ100)
まず、カメラ10によって、ステージ30上に並べられたカード100を撮像する。例えば、カメラ10からは、ステージ30上の座標(x,y)の画素に対応するR、G、B成分の色データR(x,y)、G(x,y)、B(x,y)が出力される。
【0033】
ステージ上の明るさの補正処理(ステップ101)
前処理部12は、カメラ10から出力された3種類の色データR(x,y)、G(x,y)、B(x,y)に基づいて、各画素に対応したグレースケールの階調データ(以下、単に「階調データ」と称する)c(x,y)を計算するとともに、ステージ30上の明るさの不均一さを補正する処理を行う。
【0034】
一般に、カメラ10を通して見たステージ30上の明るさは均一ではない。例えば、カメラ10のレンズ系の特性に起因して周辺部分が暗くなる場合が考えられる(周辺減光)。このように、ステージ30上の明るさが不均一の場合には、カード100を置いた場所によって異なる値を有する撮像データが得られることになるため、認識率を低下させる要因となる。このため、前処理部12は、ステージ30上の最も暗い場所の画素値(階調データ)を基準にして、それ以外の場所における画素値を補正する処理を行う。
【0035】
図3は、カメラ10を通して撮像された画像の明るさの不均一さを説明するための図である。例えば、均一な着色がなされた布や紙等をステージ30上に載せてカメラ10で撮像し、その結果を階調データに変換した場合の具体例が示されている。図3では、明るさの程度がハッチングを構成する線の間隔で示されており、例えば中心部分が最も明るく、周辺にいくにしたがって次第に暗くなる様子が示されている。周辺近傍の最も暗い画素の階調データをmin(c(x,y))とすると、座標(x,y)で指定される各画素の階調データc(x,y)と、最も暗い画素の階調データmin(c(x,y))との差分値d(x,y)は、
d(x,y)=c(x,y)−min(c(x,y))
=r(x,y)+g(x,y)+b(x,y)
−min(c(x,y)) …(1)となる。ここで、r(x,y)、g(x,y)、b(x,y)は、均一な着色がなされた布や紙等を撮像したときにカメラ10から出力されるR、G、B成分の各色データである。
【0036】
したがって、座標(x,y)のそれぞれの画素に対応する差分値d(x,y)を(1)式を用いてあらかじめ求めておいて、上述したステップ100において実際にカード100を撮像して得られた階調データC(x,y)からこの差分値d(x,y)を差し引くことにより、補正後の階調データs(x,y)が得られる。
【0037】
s(x,y)=C(x,y)−d(x,y)
=R(x,y)+G(x,y)+B(x,y)−d(x,y)
二値化処理(ステップ102)
次に、二値化処理部14は、上述したステップ101における補正処理がなされた後の階調データs(x,y)を所定の閾値と比較することにより二値化処理を行う。
【0038】
本実施形態の認識対象物としてのカード100は、その外縁部分の色がステージ30の色と識別可能なものが使用されているものとする。例えば、カード100として、外縁部分に白色の縁取りがなされたトランプやタロットカードが用いられている。このようなカード100が、黒色あるいは濃い緑色のステージ30上に並べられており、二値化処理によってカード100の外縁部分の抽出が行われる。
【0039】
具体的には、二値化処理部14は、前処理部12から出力される階調データs(x,y)を所定の閾値STHと比較することにより、二値データF(x,y)に変換する。s(x,y)≧STHの場合には、二値データF(x,y)=1に設定される。また、s(x,y)<STHの場合には、二値データF(x,y)=0に設定される。
【0040】
図4は、二値化処理がなされた後の画像(二値化画像)の具体例を示す図である。図4において、各正方形領域が各画素に対応している。また、ハッチングが付された領域が二値データF(x,y)=0の各画素を、それ以外の領域が二値データF(x,y)=1の各画素をそれぞれ示している。なお、図4に示した二値化画像は、二値化処理および後述する境界追跡処理の説明を簡略化するために画素数を減らした場合であって、一例として大きさが異なる3枚のカード100がステージ30上に並べられた場合が示されている。以下では、二値データF(x,y)=1の画素を「白画素」、F(x,y)=0の画素を「黒画素」と称して説明を行うものとする。
【0041】
境界追跡処理(ステップ103)
境界追跡処理部16は、二値化画像をスキャンして最初に到達する白画素を抽出し、この白画素に隣接する他の白画素を最初の白画素に戻ってくるまで順番に辿ることにより、各カード100とステージ30との境界(輪郭線)追跡を行う。
【0042】
図5は、境界追跡処理の具体例を示す図である。図5に示した例では、スキャン開始点SSが二値化画像の左上に設定されており、下方向に順番に各画素のスキャンが行われ、最終的に右下のスキャン終了点SEで終了する。境界追跡処理部16は、このようなスキャン動作において、最初に到達した白画素をトレース開始点TSとして抽出し、図5の実線の矢印で示した順番に、再びこのトレース開始点TSに到達するまで境界追跡を行う。
【0043】
以下、境界追跡処理の詳細について説明する。まず、境界追跡処理部16は、その時点における白画素の位置を中心にその周囲の8画素を調べ、次に辿るべき白画素の位置を決定する。
図6は、上述した境界追跡処理において次の白画素を決定する手法を説明するための図である。図6において、「C」は現在の着目画素(白画素)を、「P」は現在の画素に至る直前の画素(白画素)の位置をそれぞれ示している。また、「1」〜「8」のそれぞれの数字は、次に辿っていく白画素の選択の優先順番を示している。例えば、直前の白画素が現在の着目画素の真上に位置する場合には、左上、左、左下、下、右下、右、右上、上の各画素を順番に見ていって、最初に現れる白画素が、次に辿るべき白画素として決定される。但し、直前の白画素がどの位置にあった場合であっても、「1」に対応する画素が、次に辿る白画素となることはないため、実際には最も多い場合であっても「2」〜「8」の7個の画素を調べればよい。
【0044】
このようにして、1枚のカード100に対応して、いずれかのトレース開始点TSから順番に白画素を辿っていく処理が一巡すると、このカード100の境界線を構成する各白画素の座標値が境界追跡処理部16によって抽出される。
次に、境界追跡処理部16は、順番に辿った白画素で囲まれた領域を全て黒画素で塗りつぶす。例えば、境界線を追跡していく処理と並行して、境界追跡処理部16は、図7に示すようなX座標の最小値Xminと最大値Xmaxと、Y座標の最小値Yminと最大値Ymaxを抽出する。そして、この追跡処理が終了した後に、YminからYmaxまでの各Y座標について、対応するXminからXmaxまでの各画素に対応する二値データF(x,y)を0に設定する。
【0045】
このようにして全て(図4に示した例では3枚)のカード100に対する境界追跡と境界で囲まれた領域に対して、黒画素による塗りつぶし処理が行われる。
なお、上述した説明では、各カード100の境界を構成する最初の白画素を抽出するためのスキャン動作を左上の画素から下方向に向かって行ったが、左上から右方向に行ったり、スキャン開始点SSを変更したりしてもよい。
【0046】
頂点検出処理(ステップ104)
次に、頂点検出部18は、上述したステップ103における境界追跡処理によって抽出された境界線のデータに基づいて、カード100の4つの頂点を計算する。
【0047】
一般に用いられるトランプやタロットカード等の各種のカード類は、四隅のコーナーが丸くなっているものが多い。本実施形態のカード100もそのような形状のものが用いられている。ところで、後のステップにおいてカード100に対応して切り出した階調データと登録パターンとの比較が行われるが、カード100に描かれた模様の位置が登録パターンの模様の位置とずれてしまうと、登録パターンとカード100のそれぞれの模様が全く同じであっても、異なる模様が付されていると誤って判断されるおそれがある。このような誤った判断を回避するためには、カード100に付された模様の正確な位置を求める必要があり、このために本実施形態では、隣接する2辺が仮想的に交わる点を「頂点」として計算により求めている。
【0048】
図8は、各コーナーと頂点との関係を示す図である。図8において、「○」はコーナー開始点を、「●」はコーナー終了点をそれぞれ示している。図8(A)に示すように、上述したステップ103における境界追跡処理によって抽出された境界線は、カード100の四隅のコーナーに対応する部分が丸みを帯びている。頂点検出処理では、まず、図8(A)に示すように、トレース開始点TSから境界線を一方向に巡回することにより、4つのコーナーのそれぞれに対応するコーナー開始点とコーナー終了点が抽出される。次に、図8(B)に示すように、コーナーを挟まないで隣接するコーナー開始点とコーナー終了点とを通る辺を延長したときに交差する点が「頂点」として設定される。
【0049】
次に、コーナー開始点とコーナー終了点を抽出する詳細な動作について説明する。なお、このコーナー開始点とコーナー終了点を抽出する動作は、上述したステップ104における境界追跡処理と並行して行うことが可能であり、処理の効率化を考えた場合にはこれらの処理を同時に行うことが望ましい。
【0050】
頂点検出部18は、ステップ103において抽出された境界線に沿って所定の長さLの部分画素列を移動させながら、この部分画素列の頭部(先頭部分)と尾部(末尾部分)のそれぞれに対応するように設定された2つのベクトルの内積値IPの計算を行う。
【0051】
図9は、境界線に沿って移動する部分画素列の具体例を示す図である。例えば長さL=10とすると、境界線に沿った10個の画素からなる部分画素列が生成される。また、この部分画素列の頭部と尾部のそれぞれには、所定の長さMの2つのベクトルA、B(頭部のベクトルAをVA 、尾部のベクトルBをVB とする)が設定されている。例えば長さM=3とすると、VA は、部分画素列の先頭の画素を終点とし、3個目の画素を始点とする向きを有する。また、VB は、部分画素列の最後尾の画素を始点とし、後ろから3個目の画素を終点とする向きを有する。
【0052】
ところで、VA とVB のそれぞれは以下のように表すことができる。
VA =(VA のX成分の差,VA のY成分の差)
=(vax,vay)
VB =(VB のX成分の差,VB のY成分の差)
=(vbx,vby)
したがって、VA とVB の内積値IPは、
IP=VA ・VB =vax×vbx+vay×vby
となる。頂点検出部18は、この内積値IPと所定の閾値TIPとを比較し、|IP|≦TIPの場合には、VA とVB とのなす角ががほぼ直角であって、コーナーが部分画素列に含まれていると判断し、|IP|>TIPの場合にはコーナーが部分画素列に含まれていないと判断する。
【0053】
なお、正確には、VA とVB とのなす角θはarccos(IP/(|VA |×|VB |))の式で計算されるため、ベクトルの長さを計算したり、除算等を行う必要があるが、VA 、VB について考えた場合にはベクトルの長さは2から2√2までの範囲に含まれることがわかっているので、本実施形態ではTIPの値を2とすることにより、これらの面倒な計算を省略している。
【0054】
このようにして、部分画素列を境界線に沿って移動させることにより、4つのコーナーの全てが検出され、それぞれのコーナーに対応するコーナー開始点とコーナー終了点がそれぞれ登録される。
図10は、コーナー開始点とコーナー終了点の登録手順を示す図である。図10(A)に示すように、境界線に沿って部分画素列が移動し、その先頭部分がコーナーに突入した段階では、VA とVB の内積値IPがTIPより大きく、まだコーナーが部分画素列に含まれない状態にある。そして、部分画素列の移動が進むと、図10(B)に示すように、内積値IPがTIP以下になって、コーナーが部分画素列に含まれた状態になる。このときのVA の始点に対応する画素がコーナーの終了点「●」となる。さらに部分画素列の移動が進むと、VB の向きがコーナーの曲線に沿って変化し始める。図10(C)に示すように、VB の向きがコーナーの曲線に沿って変化し始める直前のVB の終点に対応する画素がコーナーの終了点「○」となる。そして、部分画素列の移動がさらに進むと、図10(D)に示すように、VB がコーナーから抜けて、部分画素列全体が次のコーナーに向かって移動する。このようにして、4つのコーナーのそれぞれに対応してコーナー終了点とコーナー開始点が検出され、その都度頂点検出部18によって登録される。
【0055】
ところで、ステップ103の境界追跡処理によって抽出される境界線は、理論的には直線であっても、実際にはノイズの混入による凹凸が生じる。このため、VA とVB の長さをあまり短く設定すると、コーナーの位置を誤検出する可能性が高くなる。
【0056】
図11は、コーナーの誤検出の原理を説明するための図である。図11(A)は、抽出された境界線にノイズが含まれておらず、しかも着目している部分的な境界線がX軸に平行に配置された場合であり、このような限られた条件のときに段差が全くない画素列となる。しかし、実際の境界線は、カメラ10による撮像時や二値化処理等において混入するノイズの影響により一直線にはならない。したがって、このような境界線に沿って移動する部分画素列の形状も直線状にはならない。このため、VA とVB の長さをあまり短く、例えば図11(B)に示すようにLの長さを2に設定すると、VA とVB の向きが画素列の移動に伴って大きく変化し、本来直線状の境界線に沿って移動しているにもかかわらず、VA とVB の内積値がほぼ0になって、実際には存在しないコーナーを誤検出してしまう。このような誤検出を回避するためには、VA とVB の長さをある程度長く、例えば図11(C)に示すようにLの長さを3あるいはそれ以上に設定すればよい。
【0057】
なお、部分画素列にコーナーが含まれている場合であっても、ノイズ等のために、部分画素列がコーナーから抜け出したものとして誤検出される場合がある。
図12は、部分画素列がコーナーを抜け出したものとして誤検出される場合の具体例を示す図である。図12に示すように、部分画素列にコーナーが含まれる状態において、ノイズ等によってVA およびVB の少なくもと一方の向きが大きく変化すると上述した誤検出が発生する。
【0058】
このようにして発生する誤検出に対する対策としては、所定個数の画素からなる不感領域を設け、コーナー終了点あるいはコーナー開始点が検出されても、即座にこれらの登録を行うのではなく、この検出タイミングから不感領域に対応する画素数分経過しても再度コーナーへの進入を検出しない場合に限って、先に検出したコーナー終了点あるいはコーナー開始点を登録するようにすればよい。
【0059】
上述した一連の処理によって4つのコーナーが検出される。検出される順に、第0コーナー、第1コーナー、第2コーナー、第3コーナーとする。それぞれのコーナー開始点およびコーナー終了点の座標を、
第0コーナー開始点(s0x,s0y)、第0コーナー終了点(e0x,e0y)
第1コーナー開始点(s1x,s1y)、第1コーナー終了点(e1x,e1y)
第2コーナー開始点(s2x,s2y)、第2コーナー終了点(e2x,e2y)
第3コーナー開始点(s3x,s3y)、第3コーナー終了点(e3x,e3y)
とすると、図8(B)において「×」で示される4つの頂点は、第0コーナー終了点(e0x,e0y)と第1コーナー開始点(s1x,s1y)とを通る第1の直線と、第1コーナー終了点(e1x,e1y)と第2コーナー開始点(s2x,s2y)とを通る第2の直線と、第2コーナー終了点(e2x,e2y)と第3コーナー開始点(s3x,s3y)とを通る第3の直線と、第3コーナー終了点(e3x,e3y)と第0コーナー開始点(s0x,s0y)とを通る第4の直線とがそれぞれ交差する4つの交点を算出することにより求めることができる。
【0060】
一般に、点(x0,y0)と点(x1,y1)とを通る直線Aの方程式
(y1−y0)×x+(x0−x1)×y=
(y1−y0)×x0+(x0−x1)×y0
を、
a0×x+b0×y=c0
とする。ここで、a0=y1−y0、b0=x0−x1、c0=(y1−y0)×x0+(x0−x1)×y0である。
【0061】
同様に、点(x2,y2)と点(x3,y3)とを通る直線Bの方程式
(y3−y2)×x+(x2−x3)×y=
(y3−y2)×x2+(x2−x3)×y2
を、
a1×x+b1×y=c1
とする。ここで、a1=y3−y2、b2=x2−x3、c2=(y3−y2)×x2+(x2−x3)×y2である。
【0062】
上述した2つの直線A,Bの交点の座標(X,Y)を求めると、
X=(b1×c0−b0×c1)/(a0×b1−b0×a1) …(2)
Y=(−a1×c0+a0×c1)/(a0×b1−b0×a1)…(3)
となる。
【0063】
(2)式および(3)式を用いることにより、第0コーナーの外側近傍にある頂点(c0x,c0y)、第1コーナーの外側近傍にある頂点(c1x,c1y)、第2コーナーの外側近傍にある頂点(c2x,c2y)、第3コーナーの外側近傍にある頂点(c3x,c3y)が計算される。
【0064】
回転補正処理(ステップ105)
次に、回転補正部20は、上述したステップ104における頂点検出処理によって検出された各頂点の相対位置を必要に応じて変更する回転補正を実施する。
図13は、回転補正の概略を示す図である。図13に示すように、「A」という文字が描かれた長方形のカードに対応する登録パターンG0が存在する場合に、実際に切り出された画像には、縦長の切り出し画像G1と、横長の切り出し画像G2とが存在するものとする。しかし、カードを横長に配置して見たときのこのカードの模様と、縦長の登録パターンG0の模様とが一致するということはない。あるいは、一致する場合があったとしても、もともと横長のカードと縦長のカードの一致判定を行いたいわけではなく、これらのカードについては不一致判定を行う必要がある。したがって、上述したステップ104における頂点検出処理によって検出された4つの頂点の位置関係(カード100を縦長にして配置したときに、例えば第0コーナーの外側近傍にある頂点がどこにくるか)を調べることにより、実際に切り出された撮像データと登録パターンとの比較を行う際の処理の簡略化が可能になる。
【0065】
図14は、回転補正の詳細な内容を示す図である。図14において、模様「A」のカードの四隅に付された「C0」あるいは「0」は、最初に検出される第0コーナーの外側近傍の頂点を示している。同様に、「C1」あるいは「1」は第1コーナーの外側近傍の頂点を、「C2」あるいは「2」は第2コーナーの外側近傍の頂点を、「C3」あるいは「3」は第3コーナーの外側近傍の頂点をそれぞれ示している。また、「L01」は2つの頂点C0、C1に挟まれた境界線の直線部分を示している。同様に、「L12」は2つの頂点C1、C2に挟まれた境界線の直線部分を、「L23」は2つの頂点C2、C3に挟まれた境界線の直線部分を、「L30」は2つの頂点C3、C0に挟まれた境界線の直線部分をそれぞれ示している。
【0066】
ステージ30上に長手方向がほぼ縦向きとなるようにカード100を置いた場合であっても、ノイズ等の影響によって、最初に検出される頂点の位置が一つ分ずれる場合がある。頂点位置が一つ分ずれるということは、同じように置いたカード100について、頂点の位置を揃えてパターン比較を行った場合であっても、切り出される撮像データが90度回転してしまう場合があるということを示している。
【0067】
本実施形態では、図14の最上段に示したように、縦置きされたカード100の右下に、最初に検出された頂点C0が対応する場合を「標準登録配置」とする。この場合には、回転補正を行わない。回転補正部20は、境界線L01が境界線L12よりも長く、かつ境界線L01の傾きが右上がりになっている場合に、このカード100が図14の最上段に示した標準登録配置になっているものと判断する。
【0068】
また、図14の上から2段目あるいは3段目に示したように、縦置きされたカード100の左下に、最初に検出された頂点C0が対応する場合には、4つの頂点位置を反時計回り方向に一つずつずらす回転補正が実施される。回転補正部20は、境界線L01が境界線L12よりも短い場合に、このカード100が図14の上から2段目あるいは3段目に示した配置状態になっているものと判断する。
【0069】
また、図14の最下段に示したように、縦置きされたカード100の左上に、最初に検出された頂点C0が対応する場合には、4つの頂点位置を2つ分ずらす回転補正が実施される。回転補正部20は、境界線L01が境界線L12よりも長く、かつ境界線L01の傾きが右下がりになっている場合に、このカード100が図14の最下段に示した配置状態になっているものと判断する。
【0070】
図15は、回転補正によって向きが変更された後のカードの配置状態を示す図である。回転補正を行うことによって、図15(A)に示すように、上向きを中心として所定の範囲に含まれる向きに配置されたカード100は、上向きに配置されたものとして判断され、図15(B)に示すように、下向きを中心として所定の範囲に含まれる向きに配置されたカード100は、下向きに配置されたものとして判断される。
【0071】
撮像データの切り出し処理(ステップ106)
次に、切り出し処理部22は、上述したステップ105における回転補正がなされた後の4つの頂点を有する矩形の内部に含まれるグレースケールの階調データS(x,y)を切り出す処理を行う。
【0072】
図16は、撮像データの切り出し処理の概要を示す図である。切り出し処理部22は、4つの頂点によって特定される矩形の長辺と短辺のそれぞれを64分割して、各格子点に対応する画素のグレースケールの階調データS(x,y)を切り出すことにより、64×64個の比較データH(u,v)を生成する。ここで、「u,v」は、第2コーナーの外側近傍の頂点C2を原点として、短辺方向および長辺方向に沿った格子点の位置に対応している。なお、短辺方向および長辺方向の分割数は任意であり、異なる値を設定してもよい。
【0073】
さらに、ステージ30の色やその素材の持つ反射特性などの影響を抑えるために、カード100の外周部の格子点の情報は利用しなくてもよい。例えば、長辺、短辺をそれぞれ64分割した場合、中央部の54×54個の部分のみを利用すれば、カード100の識別には充分であり、かつステージ30の色やその素材の持つ反射特性などによる悪影響を抑制することが可能になる。
【0074】
撮像データの正規化処理(ステップ107)
次に、正規化処理部24は、上述したステップ106における切り出し処理によって得られた比較データH(u,v)に対して所定の正規化処理を行う。
図17は、正規化処理の詳細な手順を示す流れ図である。まず、正規化処理部24は、切り出し処理部22によって切り出された比較データH(u,v)を取得して階調値のヒストグラムを作成し(ステップ200)、ノイズ等に起因すると考えられる極端な値を有する比較データを削除する(ステップ201)。
【0075】
図18は、ステップ201において極端な階調値を有する比較データを削除する処理の内容を示す図である。図18(A)に示すように、横軸を階調値とし、縦軸を度数(同じ階調値を有する比較データの数)とした比較データのヒストグラムがステップ200に示した処理により作成される。このときに、範囲aにより示されている比較データ群から外れて、階調値の下限値(min)付近および上限値(max)付近にそれぞれ比較データが存在するような場合には、それらの比較データは「極端な階調値を有する」ものとして削除される。具体的には、取得した比較データの上限値と下限値の間の範囲bを求め、この範囲bの上下数%程度を除く範囲cに含まれる比較データだけを有効とし、この範囲cから外れる比較データが削除される。このようにして、極端な階調値を有する比較データの削除が行われた後には、図18(B)に示すような比較データのヒストグラムが得られる。
【0076】
次に、正規化処理部24は、比較データを正規化するために必要な変換関数のパラメータを設定する(ステップ202)。例えば、変換関数として単純な一次関数で表すことができる直線補間関数を用いる場合を考えると、正規化処理部24は、比較データの最大値や最小値などに基づいて一次関数のパラメータ(傾き、切片)を設定する。
【0077】
変換関数のパラメータを設定すると、次に正規化処理部24は、この変換関数にしたがって比較データの正規化を行う(ステップ203)。
図19は、正規化処理の前後における比較データの階調値の変化を示す図である。図19において、縦軸は階調値を示しており、比較データの存在する範囲(ばらつきの範囲)が棒グラフにより示されている。また、「前」とは正規化処理が行われる前を、「後」とは正規化処理が行われた後をそれぞれ示している。例えば、図19(A)では、正規化処理前の比較データは、階調値の可変範囲の中央付近から上限付近にかけた範囲に存在していることが表されている。
【0078】
図19(A)〜図19(E)に示すように、照明光(環境光)の強弱により、同一のカード100を撮像した場合であっても、正規化処理前の比較データは、異なった範囲に存在することとなる。具体的には、カード100に当たる環境光の照度が強い場合には、図19(A)や図19(B)に示すように比較データの範囲が全体的に上限値(max)側に偏り、逆にカード100に当たる環境光の照度が弱い場合には、図5(D)や図5(E)に示すように比較データの範囲が下限値(min)側に偏る。この場合に、上述したような正規化処理を行うことにより、環境光の強弱に関係なく比較データのばらつきの範囲をすべて同じに揃えることができる。
【0079】
パターン比較処理(ステップ108)
次に、パターン比較部28は、上述したステップ107による正規化処理が行われた後の比較データh(u,v)を用いて、登録パターン格納部26に格納された複数の登録パターンおよび補間パターン作成部27によって作成される複数の補間パターンとの間でパターン比較による照合処理を行う。これにより、比較データh(u,v)に最も類似する一の登録パターンあるいは補間パターンが抽出され、抽出された登録パターンや補間パターンを作成するために使用されたカード100が特定される。
【0080】
図20は、ステップ108のパターン比較処理の詳細な手順を示す流れ図である。
正規化処理後の比較データ(階調データ)が正規化処理部24から出力されると、パターン比較部28から補間パターン作成部27に対してその旨が通知される。補間パターン作成部27は、あらかじめ登録されている複数のカードの中からいずれか一のカードを選択し、選択したカードに対応して格納されている複数の登録パターンを登録パターン格納部26から読み出し、これらの登録パターンを用いて補間パターンを作成する(ステップ300)。
【0081】
図21は、補間パターンの作成方法の一例を示す図である。一のカードに対して3種類の登録パターンが用意されている場合の例が示されている。図21において、実線の四角形で示された3つの登録パターンT1、T2、T3は、それぞれ照明条件が異なる登録パターンを模式的に表している。具体的には、登録パターンT1は明るい照明の下、登録パターンT2は標準的な照明の下、登録パターンT3は暗い照明の下でそれぞれ撮像された登録パターンであり、照明の強度差がハッチングの密度によって表現されている。
【0082】
また、これら3つの登録パターンに基づいて作成される4つの補間パターンがそれぞれ点線の四角形により示されている。例えば、登録パターンT1とT2に基づいて、これらの登録パターンT1とT2を補間する中間的な照明条件を有する2つの補間パターンt1、t2が作成される。同様に登録パターンT2とT3に基づいて、これらの登録パターンT2とT3を補間する中間的な照明条件を有する2つの補間パターンt3、t4が作成される。これにより、照明条件がそれぞれ異なる7つのパターン(登録パターンと補間パターン)が得られることとなる。
【0083】
このようにして補間パターンが作成されると、次にパターン比較部28は、登録パターン格納部26に格納されている複数の登録パターンおよび補間パターン作成部27によって作成された複数の補間パターンのそれぞれと、正規化処理部24から出力された比較データh(u,v)とを比較して誤差を求める所定の照合処理を行う(ステップ301)。
【0084】
例えば、登録パターンiあるいは補間パターンiに対応する階調データをEi(u,v)とする。パターン比較部28は、階調データEi(u,v)と比較データh(u,v)との誤差T(i)を次式を用いて計算する。
【0085】
【数1】
【0086】
本実施形態では、着目しているカード100の比較データh(u,v)と登録パターンi(あるいは補間パターンi)を180度回転させた場合(向きを反転させた場合)の階調データE′i(u,v)との誤差T′(i)の計算を、次式を用いて並行に行っている。
【0087】
【数2】
【0088】
これら2種類の誤差T(i)、T′(i)の計算が、一のカードに対応する全ての登録パターンおよび補間パターンについて行われる。
なお、上述した例では、4つの頂点によって特定される矩形の長辺と短辺のそれぞれの分割数を「64」とした場合について説明したが、それぞれの分割数をU、Vとした場合には、上述した各式において、uに対応した「63」を「U−1」に、vに対応した「63」を「V−1」に置き換えればよい。
【0089】
次に、パターン比較部28は、登録パターン格納部26に登録パターンが格納されている全てのカードについて照合処理を行ったか否かを判定する(ステップ302)。全てのカードについての照合処理がまだ行われていない場合には、ステップ302で否定判断が行われる。この場合には上述したステップ300に戻り、まだ選択されていない他のカードに対応する補間パターンを作成する処理以降が繰り返される。
【0090】
また、登録パターン格納部26に格納されている全てのカードについての照合処理が行われた場合には、ステップ302で肯定判断が行われる。次に、パターン比較部28は、照合処理により最も誤差の少ない照合結果が得られたカードの内容をカード100についての識別結果として出力する(ステップ303)。
【0091】
なお、ステージ30に複数のカード100が並べられている場合には、上述した一連の処理が各カード100毎に行われる。
このように、本実施形態のパターン認識処理装置では、一のカードに対応させて複数の照明条件を考慮した複数の登録パターンを予め用意しておくことにより、カードを置いた場所等によって照明条件が変化する場合であっても、正確にこのカードの内容を特定することができる。特に、登録パターンの他に補間パターンを組み合わせて用いることにより、照明条件が変化した場合の認識精度をさらに向上させることができる。また、複数の登録パターンの一部を補間パターンで代用することにより、登録パターンの数を減らすことができる。
【0092】
また、正規化処理部24によって、一のカード内での階調値のばらつきの範囲が一定になるように、階調データに対して所定の正規化処理を行うことにより、照明条件が異なることによって階調値の分布が偏ることによる影響を取り除くことができるため、パターン比較を行う際の精度を上げることができる。
【0093】
また、本実施形態のパターン認識処理装置では、カード100の境界線によって囲まれた領域の撮像データを抽出して、いくつかの認識結果候補としての登録パターンや補間パターンと比較するという単純な処理で、カード100の内容を認識することができる。特に、境界線がほぼ長方形を有していることが予めわかっているため、撮像データが登録パターンに一致するか否かを正確に判定することができ、高い認識率を達成することができる。また、ステージ30の色をカード100の色と異ならせることにより、境界線抽出を容易かつ高精度に行うことができる。
【0094】
また、カメラ10から出力される3色の色データをグレースケールの階調データに変換して、その後の処理を行っているため、処理の簡略化が可能になる。特に、境界線を抽出する処理については、この階調データを二値化したデータを用いることにより、さらなる処理の簡略化による処理量の低減が可能になる。
【0095】
また、一般には、カード100のコーナーは丸みを帯びているが、このような場合であっても、正確に頂点位置を求めることにより、この頂点位置を基準にして正確な座標の計算を行うことができ、パターン比較の精度を高めることができ、認識精度を向上させることができる。
【0096】
また、境界線に沿って部分画素列を移動させることにより、この部分画素列の先頭部分と末尾部分のそれぞれによって定義されるベクトルがなす角度を調べるという簡単な処理によって、コーナーを検出することが可能になる。また、丸みを帯びたコーナーを除く境界線には、平行な2組の直線が含まれており、これら4本の直線の交点を求める処理によって、容易に頂点位置を決定することができる。
【0097】
また、カード100はほぼ長方形形状を有しており、方向性があるため、回転補正部20によって頂点位置の回転補正を行うことにより、明らかに不一致となる撮像データ同士の比較処理を省略することができ、さらに処理の簡略化が可能になる。
【0098】
なお、本発明は上記実施形態に限定されるものではなく、本発明の要旨の範囲内において種々の変形実施が可能である。例えば、上述した図21に示した3つの登録パターンT1、T2、T3では、カード全体に対する照明の明るさは均一であり、その強度だけが可変に設定されていたが、カード全体に対する照明の明るさを不均一に設定した登録パターンを用いるようにしてもよい。
【0099】
図22は、照明の明るさを不均一に設定した登録パターンを用いる場合の例を示す図である。図22に示す4つの登録パターンT5〜T8のうち、登録パターンT6およびT7は、カードの上下半分ずつの領域で照明の強度を変えて撮像した撮像データに基づいて作成されている。このような場合にも、図21に示した場合と同様にして、4つの登録パターンT5〜T8に基づいて、これらの中間的な照明条件下での9つの補間パターンt5〜t13を作成することができる。このように、明るさを不均一に設定した登録パターンを用い、各領域毎に補間パターンを作成することにより、認識対象のカードに対する照明が不均一となっている場合(例えば、カード100の半分に人の影がかかっているような場合)における認識精度を向上させることができる。
【0100】
また、図22に示した例では、カードの上下半分ずつの領域で照明の強度を可変に設定した場合を示したが、領域の分け方はこれに限定されるものではなく、カードの左右方向に分割したり、上下左右で4領域に分割してもよく、上下または左右で不均等な面積比率にしてもよい。また、カードの領域内で連続的に照明の強度が変わるような設定にしてもよい。
【0101】
また、図22に示した例のように、照合処理の対象となる登録パターンや補間パターンの数が多くなる場合には、予備照合処理を行うことにより、処理量の低減を図るようにしてもよい。
図23は、予備照合処理を行う場合のパターン認識処理の手順を示す流れ図である。この処理は、図2に示した流れ図におけるステップ108において行われるものである。
【0102】
正規化処理後の比較データが正規化処理部24から出力されると、パターン比較部28は、あらかじめ登録されているカードの中からいずれか一のカードを選択し、選択したカードに対応して格納されている複数の登録パターンを登録パターン格納部26から読み出す(ステップ400)。例えば、図22に示した4つの登録パターンT5〜T8が読み出される。
【0103】
次にパターン比較部28は、読み出した登録パターンのみを用いて、これらの登録パターンと正規化処理部24から出力された比較データを比較して誤差を求める所定の照合処理を行う(ステップ401)。
次にパターン比較部28は、登録されている全てのカードについて照合処理を行ったか否かを判定する(ステップ402)。全てのカードについての照合処理がまだ行われていない場合には、ステップ402で否定判断が行わる。この場合には上述したステップ400に戻り、まだ選択されていないカードについて、登録パターンの読み出し処理以降が繰り返される。
【0104】
また、登録されている全てのカードについて、登録パターンのみを用いた照合処理が行われた場合には、ステップ402で肯定判断が行われ、次にパターン比較部28は、各カードについての照合結果に基づいて、ステージ30上に並べられているカード100と適合する可能性の高いカードのみを選出する(ステップ403)。例えば、4つの登録パターンを用いた照合処理により得られる4つの照合結果、すななち誤差のいずれもが所定基準よりも大きいカードについてのみ、ステージ30上に並べられたカード100に適合する可能性が低いものとみなして除外され、それ以外のカードが選出される。
【0105】
なお、誤差を評価するための所定基準については、上述したものに限定されるものではなく、他にも種々の方法が考えられる。例えば、4つの登録パターンに対応して求められた誤差の平均値を計算し、この平均値が所定値よりも小さいカードのみを選出するようにしてもよい。
【0106】
ステップ400〜ステップ403に示した予備照合処理が行われると、次に、補間パターン作成部27は、ステージ30上に並べられたカード100に適合する可能性が高いとして選出されたカードの中からいずれか一のカードを選択し、このカードに対応する登録パターンを用いて補間パターンを作成する(ステップ404)。補間パターンの具体的な作成方法は、上述した図22等において説明した通りである。
【0107】
補間パターンが作成されると、パターン比較部28は、登録パターン格納部26に格納されている複数の登録パターンおよび補間パターン作成部27によって作成された複数の補間パターンのそれぞれと、正規化処理部24から出力された比較データh(u,v)とを比較して誤差を求める所定の照合処理を行う(ステップ405)。なお、登録パターンを用いた照合処理は、上述したステップ401において既に実施しているため、ここでは補間パターンを用いた場合の誤差計算のみを行えばよい。
【0108】
次にパターン比較部28は、予備照合処理によって選出された全てのカードについて照合処理を行ったか否かを判定する(ステップ406)。選出された全てのカードについての照合処理がまだ行われていない場合には、ステップ406で否定判断が行われる。この場合には上述したステップ404に戻り、まだ選択されていないカードについて、補間パターンの作成処理以降が繰り返される。
【0109】
また、予備照合処理によって選出された全てのカードについての照合処理が行われた場合には、ステップ406で肯定判断が行われる。次にパターン比較部28は、上述したステップ401および405に示した照合処理によって得られた各誤差を参照し、最も誤差の少ない照合結果が得られたカードの内容をカード100の識別結果として出力する(ステップ407)。
【0110】
このように、少ない数(例えば、一のカードについて4つ程度)の登録パターンを用いた予備照合処理を行い、この予備照合結果に基づいてステージ30上のカード100に適合する可能性の高いカードのみを選出し、選出されたカードについて、補間パターンを用いた詳細な照合処理を行うことにより、パターン比較処理に要する時間を短縮するとともに、処理負担を軽減することができる。
【0111】
また、上述した正規化処理において用いる変換関数は、直線補間関数に限定されるものではなく他の関数を用いてもよい。照明条件が変化した場合に、階調データの分布状態が直線的に変化しない場合も考えられるが、このような場合には、変換関数として二次関数など他の関数を適宜用いることにより、より適切な正規化処理を行うことができる。
【0112】
また、上述した正規化処理と、複数の登録パターンおよび補間パターンを用いた照合処理は、各処理のいずれか一方のみを採用することによってもパターン認識処理の精度を向上させる効果がある。具体的には、正規化処理のみを採用することによっても、各カード100毎の照明条件の差異を吸収して、認識精度を向上させることができる。また、複数の登録パターンやこれらに基づいて作成される補間パターンを用いた照合処理のみを採用することによっても、各カード100毎の照明条件の差異によらず、認識精度を向上させることができる。
【0113】
また、上述した実施形態では、トランプやタロットカード等のカード100の内容を認識する場合について説明していたが、本発明の用途はこれに限定されるものではなく、他の用途、例えばサイコロの出目などを認識する場合に適用することができる。
【0114】
【発明の効果】
上述したように、本発明によれば、一の認識対象物に対応させて複数の照明条件を考慮した登録パターンを予め用意しておくことにより、認識対象物を置いた場所等によって照明条件が変化する場合であっても、正確にこの認識対象物の内容を特定することができる。
【図面の簡単な説明】
【図1】一実施形態のパターン認識処理装置の構成を示す図である。
【図2】ステージ上に並べられたカードをカメラによって撮像してその内容を認識するまでの一連のパターン認識手順を示す流れ図である。
【図3】カメラを通して撮像された画像の明るさの不均一さを説明するための図である。
【図4】二値化処理がなされた後の画像(二値化画像)の具体例を示す図である。
【図5】境界追跡処理の具体例を示す図である。
【図6】境界追跡処理において次の白画素を決定する手法を説明するための図である。
【図7】境界追跡処理と並行して収集する座標値を説明するための図である。
【図8】各コーナーと頂点との関係を示す図である。
【図9】境界線に沿って移動する部分画素列の具体例を示す図である。
【図10】コーナー開始点とコーナー終了点の登録手順を示す図である。
【図11】コーナーの誤検出の原理を説明するための図である。
【図12】部分画素列がコーナーを抜け出したものとして誤検出する場合の具体例を示す図である。
【図13】回転補正の概略を示す図である。
【図14】回転補正の詳細な内容を示す図である。
【図15】回転補正によって向きが変更された後のカードの配置状態を示す図である。
【図16】撮像データの切り出し処理の概要を示す図である。
【図17】正規化処理の詳細な手順を示す流れ図である。
【図18】極端な階調値を有する階調データを削除する場合の概略を示す図である。
【図19】正規化処理の前後における階調値の変化を示す図である。
【図20】パターン比較処理の詳細な手順を示す流れ図である。
【図21】補間パターンの作成方法の一例を示す図である。
【図22】不均一な照明条件を考慮した登録パターンを用いる場合の補間パターンの作成方法の一例を示す図である。
【図23】予備照合処理を行う場合のパターン比較処理の手順を示す流れ図である。
【符号の説明】
10 カメラ
12 前処理部
14 二値化処理部
16 境界追跡処理部
18 頂点検出部
20 回転補正部
22 切り出し処理部
24 正規化処理部
26 登録パターン格納部
27 補間パターン作成部
28 パターン比較部
30 ステージ
40 パターン認識処理部
50 情報記憶媒体
100 カード
Claims (15)
- 撮像によって得られた認識対象物に対応する多値の撮像データに基づいて、前記認識対象物の境界線を抽出する境界抽出手段と、
前記境界抽出手段によって抽出された境界線に囲まれる領域に対応する前記撮像データを抽出する認識対象画像抽出手段と、
前記認識対象画像抽出手段によって抽出された前記認識対象物に対応する多値の前記撮像データが入力されて所定の正規化処理を行う正規化処理手段と、
複数の前記認識対象物のそれぞれについて、複数の照明条件下で撮像したときに得られる多値の撮像データが複数の登録パターンとして格納された登録パターン格納手段と、
前記正規化処理手段によって正規化処理が行われた後の前記撮像データを前記複数の登録パターンと比較することにより、この撮像データに最も類似度が大きい前記登録パターンを抽出し、この登録パターンに対応する前記認識対象物の内容を特定するパターン比較手段と、
を備え、前記パターン比較手段によって、前記認識対象画像抽出手段によって抽出された前記認識対象物の内容の特定を行うことを特徴とするパターン認識処理装置。 - 請求項1において、
一の前記認識対象物に対応する複数の前記登録パターンに基づいて補間処理を行うことにより、中間の照明条件下で得られる前記撮像データを予測した補間パターンを計算する補間パターン作成手段をさらに備え、
前記パターン比較手段は、前記登録パターンとともに前記補間パターンを用いて前記認識対象物の特定を行うことを特徴とするパターン認識処理装置。 - 請求項1または2において、
前記撮像データは、前記認識対象物を構成する各画素の階調値を示す階調データであり、
前記正規化処理手段は、一の前記認識対象物に含まれる前記階調値のばらつきの範囲が一定になるように、前記階調データに対して所定の変換処理を行うことを特徴とするパターン認識処理装置。 - 請求項3において、
前記正規化処理手段は、一の前記認識対象物に含まれる前記階調値の上限値と下限値を取得し、これらの値に基づいて、前記階調値が所定の範囲に含まれるように変換関数を決定することを特徴とするパターン認識処理装置。 - 請求項4において、
前記変換関数は、直線補間関数であることを特徴とするパターン認識処理装置。 - 請求項2において、
前記補間パターン作成手段は、前記認識対象物を複数の領域に分割した各分割領域毎に、前記中間の照明条件下で得られる前記撮像データを予測することを特徴とするパターン認識処理装置。 - 請求項1〜6のいずれかにおいて、
前記認識対象物を撮像する撮像手段をさらに備えることを特徴とするパターン認識処理装置。 - 請求項7において、
前記認識対象物を載置する載置台をさらに備え、
この載置台の色を前記認識対象物の外周部の色と異ならせることを特徴とするパターン認識処理装置。 - 請求項7において、
前記境界抽出手段は、前記撮像データを二値化したデータに基づいて前記境界線の抽出を行うことを特徴とするパターン認識処理装置。 - 請求項7〜9のいずれかにおいて、
前記認識対象物を前記撮像手段から見た撮像面の形状はほぼ多角形を有しており、
前記境界抽出手段によって抽出された前記境界線に基づいて、前記多角形の複数の頂点を検出する頂点検出手段をさらに備え、
前記認識対象画像抽出手段は、前記頂点検出手段によって検出された複数の前記頂点の位置を基準にして、前記境界線に囲まれる領域に対応する前記撮像データの抽出を行うことを特徴とするパターン認識処理装置。 - 請求項10において、
前記撮像面はほぼ正方形形状あるいはほぼ長方形形状を有しており、
前記頂点検出手段は、前記境界線を構成する画素列に沿って、複数の画素からなる部分画素列を移動させたときに、前記部分画素列の先頭部分と末尾部分の向きがほぼ直角になるコーナーの位置を抽出することによって、前記頂点の検出を行うことを特徴とするパターン認識処理装置。 - 請求項11において、
前記コーナーにおいて前記画素列に含まれる複数の画素がほぼ円弧状に配列されており、
前記頂点検出手段は、前記境界線を構成する画素列に含まれる隣接コーナー間の複数の画素の配列を直線近似した4本の直線の交点を求めて、前記頂点として設定することを特徴とするパターン認識処理装置。 - 請求項7〜9のいずれかにおいて、
前記認識対象物を前記撮像手段から見た撮像面の形状はほぼ長方形を有しており、
前記認識対象画像抽出手段によって抽出された前記撮像データの配列を、比較対象となる前記登録パターンの向きに合わせて補正する回転補正手段をさらに備えていることを特徴とするパターン認識処理装置。 - 境界抽出手段、認識対象画像抽出手段、正規化処理手段、登録パターン格納手段、パターン比較手段を備えるパターン認識処理におけるパターン認識処理方法であって、
撮像によって得られた認識対象物に対する多値の撮像データが入力されて、この撮像データに基づいて、前記認識対象物の境界線を前記境界抽出手段によって抽出する第1のステップと、
前記第1のステップにおいて前記境界抽出手段によって抽出された境界線に囲まれる領域に対応する前記撮像データを前記認識対象画像抽出手段によって抽出する第2のステップと、
前記第2のステップにおいて前記認識対象画像抽出手段によって抽出された前記認識対象物に対応する多値の前記撮像データが入力されて、前記正規化処理手段によって所定の正規化処理を行う第3のステップと、
複数の前記認識対象物のそれぞれについて、複数の照明条件下で撮像したときに得られる多値の撮像データが複数の登録パターンとして前記登録パターン格納手段に登録されており、前記パターン比較手段によって、前記第3のステップによる処理が行われた後の前記撮像データをこれら複数の登録パターンと比較することにより、この撮像データに最も類似度が大きい前記登録パターンを抽出し、この登録パターンに対応する前記認識対象物の内容を特定する第4のステップと、
を有し、前記第4のステップにおいて、前記第2のステップにて前記認識対象画像抽出手段によって抽出された前記認識対象物の内容の特定を行うことを特徴とするパターン認識処理方法。 - コンピュータを、
撮像によって得られた認識対象物に対応する多値の撮像データに基づいて、前記認識対象物の境界線を抽出する境界抽出手段と、
前記境界抽出手段によって抽出された境界線に囲まれる領域に対応する前記撮像データを抽出する認識対象画像抽出手段と、
前記認識対象画像抽出手段によって抽出された前記認識対象物に対応する多値の前記撮像データが入力されて所定の正規化処理を行う正規化処理手段と、
複数の前記認識対象物のそれぞれについて、複数の照明条件下で撮像したときに得られる多値の撮像データが複数の登録パターンとして格納された登録パターン格納手段と、
前記正規化処理手段によって正規化処理が行われた後の前記撮像データを前記複数の登録パターンと比較することにより、この撮像データに最も類似度が大きい前記登録パターンを抽出し、この登録パターンに対応する前記認識対象物の内容を特定するパターン比較手段と、
して機能させるためのプログラムを格納した情報記憶媒体であって、
前記パターン比較手段によって、前記認識対象画像抽出手段によって抽出された前記認識対象物の内容の特定を行うコンピュータにより読み取り可能な情報記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001019679A JP4578000B2 (ja) | 2001-01-29 | 2001-01-29 | パターン認識処理装置、方法および情報記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001019679A JP4578000B2 (ja) | 2001-01-29 | 2001-01-29 | パターン認識処理装置、方法および情報記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002222421A JP2002222421A (ja) | 2002-08-09 |
JP4578000B2 true JP4578000B2 (ja) | 2010-11-10 |
Family
ID=18885517
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001019679A Expired - Fee Related JP4578000B2 (ja) | 2001-01-29 | 2001-01-29 | パターン認識処理装置、方法および情報記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4578000B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4001568B2 (ja) * | 2003-05-21 | 2007-10-31 | 株式会社バンダイナムコゲームス | 占いゲームシステム、プログラム、情報記憶媒体および占いゲーム画像生成方法 |
JP4495606B2 (ja) * | 2005-01-19 | 2010-07-07 | 日本放送協会 | 色識別装置及び色識別プログラム |
JP2008165496A (ja) * | 2006-12-28 | 2008-07-17 | Toyota Central R&D Labs Inc | 画像正規化装置、対象物検出装置、対象物検出システム及びプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000268172A (ja) * | 1999-03-16 | 2000-09-29 | Victor Co Of Japan Ltd | 画像正規化装置 |
JP2000306095A (ja) * | 1999-04-16 | 2000-11-02 | Fujitsu Ltd | 画像照合・検索システム |
JP2001216518A (ja) * | 2000-02-07 | 2001-08-10 | Fuji Photo Film Co Ltd | マッチング方法および装置並びに記録媒体 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01318169A (ja) * | 1988-06-20 | 1989-12-22 | Sanyo Electric Co Ltd | コーナ補正装置 |
JPH02176982A (ja) * | 1988-12-28 | 1990-07-10 | Fuji Electric Co Ltd | 図形特徴抽出方法 |
JP2988401B2 (ja) * | 1996-11-28 | 1999-12-13 | 日本電気株式会社 | 切手類認識装置 |
-
2001
- 2001-01-29 JP JP2001019679A patent/JP4578000B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000268172A (ja) * | 1999-03-16 | 2000-09-29 | Victor Co Of Japan Ltd | 画像正規化装置 |
JP2000306095A (ja) * | 1999-04-16 | 2000-11-02 | Fujitsu Ltd | 画像照合・検索システム |
JP2001216518A (ja) * | 2000-02-07 | 2001-08-10 | Fuji Photo Film Co Ltd | マッチング方法および装置並びに記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP2002222421A (ja) | 2002-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100361385B1 (ko) | 2차원코드인식방법 | |
WO2012098842A1 (ja) | 特徴抽出装置、特徴抽出方法、特徴抽出プログラム、および、画像処理装置 | |
JP6532642B2 (ja) | 生体情報認証装置および生体情報処理方法 | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
JP2003506767A (ja) | 走査イメージを照合するための装置および方法 | |
EP1826707A2 (en) | Fingerprint collation apparatus, fingerprint pattern area extracting apparatus and quality judging apparatus, and method and program of the same | |
JP7062722B2 (ja) | 光学コードのモジュールサイズの特定 | |
US6880758B2 (en) | System and method for identifying object information | |
US8396301B2 (en) | System and method for document location and recognition | |
KR100923935B1 (ko) | Ocr을 위한 문서 영상의 자동 평가 방법 및 시스템 | |
CN112634262A (zh) | 一种基于互联网的写字质量评价方法 | |
JP5870745B2 (ja) | 画像処理装置、二値化閾値算出方法及びコンピュータプログラム | |
CN112419207A (zh) | 一种图像矫正方法及装置、系统 | |
Subasic et al. | Face image validation system | |
JP4062987B2 (ja) | 画像の領域分割方法、画像の領域分割装置、画像の領域分割プログラム | |
CN113569859B (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
JP4578000B2 (ja) | パターン認識処理装置、方法および情報記憶媒体 | |
CN112597868A (zh) | 基于无定位点的试卷识别和矫正方法 | |
JP3890844B2 (ja) | 外観検査方法 | |
JP2005242600A (ja) | パターン認識処理装置、方法およびプログラム | |
KR100888674B1 (ko) | 주파수영역을 이용한 지폐의 유사도 측정방법 | |
CA2648054C (en) | Apparatus and method for detection and analysis of imagery | |
JP5653308B2 (ja) | 領域検出装置、領域検出方法及びプログラム | |
JP5337844B2 (ja) | 領域検出装置、領域検出方法及びプログラム | |
JP2002133424A (ja) | 文書の傾き角度及び境界の検出方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071114 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071218 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20071218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100607 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100615 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100809 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100824 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100824 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130903 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4578000 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130903 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |