JP2005242600A - パターン認識処理装置、方法およびプログラム - Google Patents

パターン認識処理装置、方法およびプログラム Download PDF

Info

Publication number
JP2005242600A
JP2005242600A JP2004050692A JP2004050692A JP2005242600A JP 2005242600 A JP2005242600 A JP 2005242600A JP 2004050692 A JP2004050692 A JP 2004050692A JP 2004050692 A JP2004050692 A JP 2004050692A JP 2005242600 A JP2005242600 A JP 2005242600A
Authority
JP
Japan
Prior art keywords
pattern
processing
data
recognition
differential
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004050692A
Other languages
English (en)
Inventor
Koutarou Satou
皇太郎 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Namco Ltd
Original Assignee
Namco Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Namco Ltd filed Critical Namco Ltd
Priority to JP2004050692A priority Critical patent/JP2005242600A/ja
Publication of JP2005242600A publication Critical patent/JP2005242600A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】 処理量が少なく、認識率を高めることができるパターン処理装置、方法およびプログラムを提供すること。
【解決手段】
2次微分処理部34は、認識対象物に対応した複数画素の撮像データに対して2次微分処理を行う。ぼかし処理部38は、微分処理によって得られた微分データに対して、着目画素とその周辺に配置された周囲画素のそれぞれの微分データを平均化して着目画素の新たな微分データを生成する。パターン比較手段は、ぼかし処理後の微分データを用いて、あらかじめ登録されている複数の登録パターンのそれぞれに対応する微分データに対する比較処理を行うことにより、認識対象物に最も近い登録パターンを抽出する。
【選択図】 図2

Description

本発明は、カメラを用いてタロットカード等を撮像して得られた画像に対して画像認識を行うパターン処理装置、方法およびプログラムに関する。
従来から、カメラで撮像した画像に基づいて、その中に含まれるタロットカード等の種類や向きを認識するパターン処理装置が知られている(例えば、特許文献1参照。)。このパターン処理装置では、カメラによって撮像したグレースケールの階調データの中からカードに対応する領域を切り出して、予め登録された登録パターンと比較して最も近い登録パターンを選択することにより、切り出した画像に対応するカードの種類や向きを認識する処理を行っている。
また、カメラの撮像によって得られた階調データそのものではなく微分入力画像を用いてパターン認識を行う画像処理装置が従来から知られている(例えば、特許文献2参照。)。この画像処理装置では、従来の相互相関演算によるパターン認識と輪郭相互相関演算によるパターン認識とを組み合わせることにより、多種多様な画像に対して確実かつ正確なパターン認識を行うことができる。
特開2002−222421号公報(第5−13頁、図1−23) 特開平5−28273号公報(第4−9頁、図1−12)
ところで、特許文献1に開示されたパターン処理装置では、認識対象物としてのタロットカードに対して照明のあたり方が一定していないと、認識率が低下するという問題があった。また、光の反射等の影響で一部分が白く映ると、撮像された画像と登録パターンとの差異が大きくなって認識率が低下するという問題があった。
また、特許文献2に開示された画像処理装置では、特許文献1に開示されているようにあらかじめ切り出された所定領域の画像を対象に認識処理を行う場合に、撮像された画像と登録パターンの画像とが1画素分ずれてしまうと相関値が低下して認識率が低下するという問題があった。なお、特許文献2には、撮像された全体画像の中から認識対象の画像を切り出す範囲を1画素分ずつずらしていって、切り出されたそれぞれの画像に対してパターン認識を行っているため、切り出された画像と登録パターン画像とのわずかなずれは問題にならないが、この処理手順では処理量が多くなるため処理負担が重く、撮像された画像を取得してからパターン認識結果を得るまでの時間を短くしたいような用途や、タロットカードのように登録パターンの内容が複雑でしかも数が多い場合などには適していない。
本発明は、このような点に鑑みて創作されたものであり、その目的は、処理量が少なく、認識率を高めることができるパターン処理装置、方法およびプログラムを提供することにある。
上述した課題を解決するために、本発明のパターン認識処理装置は、認識対象物に対応した複数画素の撮像データに対して微分処理を行う微分処理手段と、微分処理手段によって微分処理が行われた後の微分データに対して、着目画素とその周辺に配置された周囲画素のそれぞれの微分データを平均化して着目画素の新たな微分データを生成するぼかし処理を行う第1のぼかし処理手段と、ぼかし処理手段によるぼかし処理後の微分データを用いて、あらかじめ登録されている複数の登録パターンのそれぞれに対応する微分データに対する比較処理を行うことにより、認識対象物に最も近い登録パターンを抽出するパターン比較手段とを備えている。
また、本発明のパターン認識処理方法は、認識対象物に対応した複数画素の撮像データに対して微分処理を行う第1のステップと、微分処理が行われた後の微分データに対して、着目画素とその周辺に配置された周囲画素のそれぞれの微分データを平均化して着目画素の新たな微分データを生成する第2のステップと、第2のステップにおいて生成された微分データを用いて、あらかじめ登録されている複数の登録パターンのそれぞれに対応する微分データに対する比較処理を行うことにより、認識対象物に最も近い登録パターンを抽出する第3のステップとを有している。
また、本発明のパターン認識処理プログラムは、コンピュータを、認識対象物に対応した複数画素の撮像データに対して微分処理を行う微分処理手段と、微分処理手段によって微分処理が行われた後の微分データに対して、着目画素とその周辺に配置された周囲画素のそれぞれの微分データを平均化して着目画素の新たな微分データを生成するぼかし処理を行う第1のぼかし処理手段と、ぼかし処理手段によるぼかし処理後の微分データを用いて、あらかじめ登録されている複数の登録パターンのそれぞれに対応する微分データに対する比較処理を行うことにより、認識対象物に最も近い登録パターンを抽出するパターン比較手段として機能させる。認識対象物に対応した撮像データに対して微分処理を行った結果をパターン比較に直接用いるのではなく、ぼかし処理を行った後に微分データを用いてパターン比較を行っているため、実際の撮像によって得られた範囲が若干ずれた場合であっても、比較されるデータ同士の相関値が極端に低下することがなく、認識率を高めることができる。しかも、ぼかし処理を行わずに1画素分ずらしながらパターン比較を繰り返し行う場合に比べて処理量(計算量)を大幅に低減することが可能になる。
また、上述した比較処理は、撮像データの値が所定の範囲から外れる画素を除外して行われることが望ましい。これにより、光の照射状態が悪くて有効な情報が得られない撮像データを除いてパターン認識処理を行うことができ、認識精度をさらに高めることが可能になる。
また、上述した所定の範囲とは、撮像データの値が基準値以下の場合であることが望ましい。これにより、照射光が強く反射してしまって白く光ってしまった部分を除いてパターン認識処理を行うことができ、認識精度をさらに高めることができる。
また、上述した微分処理手段は、着目画素とその周囲に配置された周辺画素のそれぞれの撮像データを用いて2次微分処理を行うことにより微分データを出力することを特徴とすることが望ましい。これにより、方向性のない微分データを得ることができるため、認識対象物の配置や認識対象物に含まれる模様の方向等に関係なく正確なパターン認識処理を行うことができる。
また、上述した微分処理手段による2次微分処理によって得られた微分データに対して絶対値処理を行う絶対値処理手段をさらに備えることが望ましい。これにより、撮像データの値の変化の方向に関係しないパターン認識処理を行うことができるため、照明条件によって認識対象物の色や階調度が変化した場合であっても高い認識精度を維持することが可能になる。
また、上述したパターン比較処理を行う前の微分データに対して正規化処理を行う第1の正規化処理手段をさらに備えることが望ましい。これにより、照明条件や撮像素子(カメラ)の特性等の相違に基づく微分データの値の分布が偏ることによる影響を取り除くことができるため、パターン比較を行う際の精度をさらに上げることができる。
また、上述した撮像データは、認識対象物を構成する各画素の階調値を示す階調データであり、認識対象物を撮像した色データを階調データに変換する前処理手段をさらに備えることが望ましい。例えばRGB3色の色データを用いてパターン認識を行う場合に比べて処理量を大幅に低減することができる。特に、微分データを用いてパターン認識を行う場合には、色そのものはあまり重要ではなく、階調データに変換しても高い認識精度を維持することが可能になる。
また、上述した色データは、カメラ付携帯電話機によって撮像されてメールに添付された画像ファイル、またはカメラ付携帯電話機上のアプリケーションプログラムから送信された画像データとして入力されることが望ましい。携帯電話機に搭載されたカメラを用いて撮像された画像は解像度が低く、しかも、メールに添付可能な画像ファイルの解像度はさらに低い値に制限されていることが多い。あるいは、カメラ付携帯電話機上のアプリケーションプログラムによって送信される場合であっても通信時間や通信料金等の観点から送信される画像データは解像度が低い方が望ましい。また、各ユーザが自分のカメラ付携帯電話機を使用して認識対象物を撮像する場合には、照明条件や手振れの状態などがユーザ毎に異なることになり、撮像された画像の色や階調値、手振れの状態が一定しない。このような場合であっても、微分データに対してぼかし処理を行った結果を用いてパターン比較を行うことにより、認識対象物の画像全体の模様の傾向が一致する登録パターンを正確に抽出することができる。
また、上述した画像ファイルに基づいて判定した認識対象物の数が所定数と異なるときにエラー通知を行うエラー通知手段をさらに備えることが望ましい。これにより、パターン認識の結果を用いる各種のアプリケーションにおいて明らかに誤りの結果しか得られない場合の複雑な処理を省略することができ、処理量をさらに低減することができる。
また、一あるいは複数の認識対象物が含まれる撮像データに基づいて、認識対象物の境界線を抽出する境界抽出手段と、境界抽出手段によって抽出された境界線に囲まれる領域に対応する撮像データを認識対象物毎に抽出する認識対象画像抽出手段とをさらに備えることが望ましい。認識対象物の境界線を抽出することにより、処理対象となる撮像データを限定することが可能になり、パターン比較に要する処理量を低減することが可能になる。
また、上述した認識対象画像抽出手段は、認識対象物を構成する第1の画素数が登録パターンを構成する第2の画素数と異なるときに、認識対象物に対応する第2の画素数分の撮像データを抽出することが望ましい。これにより、パターン比較の対象となる認識対象物と登録パターンの各構成画素数を一致させることができ、パターン認識の処理手順を簡素化することができる。
また、上述した認識対象物に対応した撮像データに対して、着目画素毎とその周辺に配置された周囲画素のそれぞれの撮像データを平均化して着目画素の新たな撮像データを生成するぼかし処理を行う第2のぼかし処理手段をさらに備え、微分処理手段は、第2のぼかし処理手段によって生成された撮像データを用いて微分処理を行うことが望ましい。これにより、認識対象物と登録パターンとの間の正確な位置合わせを行うことなく精度の高いパターン認識処理を行うことが可能になる。
また、上述した認識対象物に対応した撮像データに対して正規化処理を行う第2の正規化処理手段をさらに備えることが望ましい。これにより、照明条件や撮像素子(カメラ)の特性等の相違に基づく撮像データの値の分布が偏ることによる影響を取り除くことができるため、パターン比較を行う際の精度をさらに上げることができる。
登録パターンのそれぞれには微分データとともに撮像データが対応しており、パターン比較手段は、認識対象物に対応する微分データと撮像データのそれぞれを用いて最も類似する登録パターンを抽出することが望ましい。特に、上述したパターン比較手段は、認識対象物に対応する微分データと登録パターンに対応する微分データとを用いて計算した第1の誤差と、認識対象物に対応する撮像データと登録パターンに対応する撮像データとを用いて計算した第2の誤差とを所定の重み付けをして加算した合計値が最小となる一の登録パターンを抽出することが望ましい。微分データと撮像データとを併用してパターン認識を行うことにより、様々な照明条件や模様等に対応した精度の高い認識処理を行うことが可能になる。
また、上述した撮像データには、認識対象物を構成する各画素の階調値を示す階調データと、認識対象物を構成する各画素の色データとが含まれており、パターン比較手段は、認識対象物に対応する微分データと階調データと色データのそれぞれを用いて最も類似する登録パターンを抽出することが望ましい。階調データだけでなく色データも用いることにより、特徴的な色合いの模様等を有する認識対象物に対してさらに精度の高い認識処理を行うことが可能になる。
また、上述した認識対象物に対応する撮像データは、複数の分割領域に分散した対応付けがなされており、これら複数の分割領域のそれぞれ毎に登録パターンが抽出され、これら複数の分割領域のそれぞれに対応して抽出された登録パターンに基づいて一の登録パターンが決定されることが望ましい。これにより、特徴のある模様等が認識対象物の一部に含まれている場合においてこの模様等を強調したパターン認識を行うことができる。
以下、本発明のパターン認識処理装置を適用した一実施形態の占いシステムについて、図面を参照しながら詳細に説明する。
図1は、一実施形態の占いシステムの構成を示す図である。図1に示す本実施形態の占いシステムは、カメラ付携帯電話機300から送られてくるメールに添付された画像ファイルの内容を解析することによりタロットカード占いを実施してカメラ付携帯電話機300に向けて占い結果のメールを送信する占いサーバ100を備えている。カメラ付携帯電話機300から送信される画像ファイル付きのメールは、周辺に存在する基地局310を経由してキャリア(通信事業者)が運営するメール・サーバ320に送られ、さらにインターネット200を経由して占いサーバ100に到達する。反対に、占いサーバ100から送信される占い結果のメールは、インターネット200を経由してメール・サーバ320に送られ、さらに、基地局310を経由してカメラ付携帯電話機300に到達する。
占いサーバ100は、メール・サーバ110、受信メール処理部120、画像認識処理部130、占い結果作成処理部140、全体制御部150を含んで構成されている。占いサーバ100によって送受信されるメールとしては、主に、占いを希望するユーザから送られてくる画像ファイル付メールや占い結果のテキストデータが含まれる占い結果メールの他に、ユーザに対して各種のエラーを通知するエラーメールがある。本実施形態では、ユーザ自身が並べた6枚のタロットカードをカメラ付携帯電話機300で撮像し、その撮像結果を添付ファイルとして付加したメールを、占いサーバ100に対応する特定のメールアドレスに向けて送信することによりタロットカード占いの依頼を行うようになっている。占いサーバ100では、メールに添付されて送られてきた画像の内容を解析することにより、ユーザによって並べられた6枚のタロットカードの種類や向きを判定してタロットカード占いを実施し、その結果を文字で示したメールをカメラ付携帯電話機300に対応するメールアドレスに送り返す。ユーザから送られてくるメールに画像ファイルが添付されていない場合や、画像ファイルは添付されているがタロット占いを行うために必要な要件を満たしていない場合(例えば、撮像されたタロットカードの枚数が6枚と異なる場合やタロットカードを撮像した画像が不鮮明であってその種類を特定することができない場合等)には、占いサーバ100からユーザに対してエラー通知用のメールが送信される。
メール・サーバ110は、上述した画像ファイル付メール、占い結果メール、エラーメールを、インターネット200を介して送受信する処理を行う。受信メール処理部120は、メール・サーバ110によって受信された画像ファイル付メールを受信順に格納した後、これらの画像ファイル付メールのヘッダ部分から送信元アドレスを抽出するとともに、添付された画像ファイルを分離する。抽出された送信元アドレスは、占い結果メールの送信先アドレスとして使用される。添付された画像ファイルは、例えばJPEG形式で圧縮されており、画像認識処理部130に送られる。なお、本実施形態では、比較的圧縮率の高い(データ量の少ない)JPEG形式で圧縮された画像ファイルが添付されているものとして説明を行うが、占いサーバ100側で開くことができるファイル形式であれば、JPEG形式以外の形式で圧縮された、あるいは非圧縮の画像ファイルであってもよい。また、カメラ付携帯電話機300から送られてくるので、この画像ファイルに対応する画像のサイズは小さく設定されている。例えば、撮像範囲に対応して縦横ともに144画素のサイズの画像ファイルが作成されて、添付ファイルとして送られてくる。
画像認識処理部130は、受信メール処理部120から入力される画像ファイルを用いて画像認識処理を行い、ユーザによって撮像された画像に含まれる6枚のタロットカードの種類と向きを判定する。この判定結果は、占い結果作成処理部140に送られる。
占い結果作成処理部140は、画像認識処理部130による画像認識処理によって得られた6枚のタロットカードの種類と向きに基づいて、占い結果を示す文章(テキストデータ)を作成する。6枚のタロットカードの種類と向きに対応する占い結果の文章が予め占いデータベースとして格納されており、占い結果作成処理部140は、この占いデータベースを検索することにより、該当する占い結果の文章を取得することができる。そして、占い結果の文章を「本文」部分に、受信メール処理部120によって抽出された送信元アドレスを「宛先(送信先アドレス)」にそれぞれ対応させた占い結果メールが作成される。
全体制御部150は、占いサーバ100の全体の動作手順を制御するとともに、必要に応じてエラーメールを作成する。上述したように、添付された画像ファイルに基づいたタロットカード占いを行うことができない場合にこのエラーメールが作成されるため、占い結果作成処理部140によって作成される占い結果メールとこのエラーメールは、いずれか一方のメールのみが出力される。
上述した構成を有する占いサーバ100には情報記録媒体160が接続されている。この情報記録媒体160は、占いサーバ100に含まれる各構成部の動作プログラムや、画像認識処理部130による画像認識処理の実施に必要な登録パターン(後述する)のデータを格納するためのものである。この情報記録媒体160は、CD(コンパクトディスク)等の光学式のディスク型記録媒体や、ROM、RAM等の半導体メモリ、あるいはハードディスク装置などを用いて構成されており、占いサーバ100に内蔵あるいは外付けされている。
次に、画像認識処理部130の詳細について説明する。図2は、画像認識処理部130の詳細構成を示す図である。図2に示すように、画像認識処理部130は、前処理部10、画像切り出し部20、ぼかし処理部30、38、正規化処理部32、40、2次微分処理部34、絶対値処理部36、登録パターン格納部42、パターン比較部44を含んで構成されている。
前処理部10は、画像ファイルとして入力される3色の色データからなる撮像データをグレースケールの多値の階調データからなる撮像データに変換する前処理を行う。画像切り出し部20は、前処理部10から出力される撮像データの中から、6枚のタロットカードに対応する部分を切り出す処理を行う。図3は、画像切り出し部20の詳細構成を示す図である。図3に示すように、画像切り出し部20は、二値化処理部21、境界追跡処理部22、頂点検出部23、回転補正部24、切り出し処理部25を有している。
二値化処理部21は、前処理部10によって所定の前処理が行われた撮像データを二値化する。境界追跡処理部22は、二値化された撮像データに含まれるタロットカードの境界線(輪郭線)を抽出する。この抽出処理およびこれ以後の処理は、6枚のタロットカードのそれぞれについて行われる。頂点検出部23は、境界追跡処理部22によって抽出された境界線に基づいて、各タロットカードの4つの頂点を検出する。タロットカードはほぼ長方形を有しているが、4つのコーナーは丸くなっている。頂点検出部23では、隣接する2辺を延長したときに交わる真の頂点が計算される。
回転補正部24は、頂点検出部23によって検出された4つの頂点の相対的な位置を、必要に応じて1つ分または2つ分ずらす処理を行う。切り出し処理部25は、前処理部10から出力される前処理後の撮像データ(階調データ)の中から、4つの頂点を結んだ領域に対応する部分を切り出す処理を行う。
ところで、本実施形態で行われるパターン比較処理では、階調データの値が所定の範囲から外れる画素を除外してパターン比較処理が行われる。したがって、この画像切り出し部20よりも後段に配置されたぼかし処理部30からパターン比較部44のそれぞれでは、除外された画素についての処理は省略される。
ぼかし処理部30は、画像切り出し部20によって切り出された各タロットカード毎の撮像データに対してぼかし処理を行う。このぼかし処理とは、着目画素が中央に配置された3×3画素の各階調データを用いた平均化処理であり、所定のぼかしフィルタを用いて行われる。ぼかしフィルタの具体例については後述する。
正規化処理部32は、画像切り出し部20によって切り出され、ぼかし処理部30によってぼかし処理された後の階調データに対してその明るさ、すなわち、階調データの値(階調値)の大きさを正規化する所定の正規化処理を行う。
2次微分処理部34は、正規化処理部32による正規化処理が終了した後の階調データに対して2次微分処理を行う。絶対値処理部36は、2次微分処理部34によって2次微分処理が行われた後の微分データに対して絶対値処理を行う。ぼかし処理部38は、絶対値処理部36によって絶対値処理がなされた後の微分データに対してぼかし処理を行う。このぼかし処理は、ぼかし処理部30によって行われるぼかし処理と基本的に同じ内容を有しており、着目画素が中央に配置された3×3画素の各微分データを用いた平均化処理が所定のぼかしフィルタを用いて行われる。正規化処理部40は、ぼかし処理部38によるぼかし処理が行われた後の微分データに対してその値を正規化する所定の正規化処理を行う。
登録パターン格納部42は、認識対象となる可能性のあるタロットカードの微分データを登録パターンとしてあらかじめ登録しておくためのものである。本実施形態では、1組のタロットカードのそれぞれを明暗2種類の照明条件下で撮像した撮像データに対して、画像認識処理部130に含まれる前処理部10から正規化処理部40までの各処理を行った後の微分データが登録パターンとして格納されている。パターン比較部44は、正規化処理部40によって正規化処理が行われた後の微分データと、登録パターン格納部42に格納された複数の登録パターンとを比較することにより、微分データとの間の類似度が最も大きい登録パターンを抽出することにより、撮像されたタロットカードの種類と方向とを特定し、これらを内容とする認識結果を出力する。
上述した2次微分処理部34が微分処理手段に、ぼかし処理部38が第1のぼかし処理手段に、パターン比較部44がパターン比較手段に、絶対値処理部36が絶対値処理手段に、正規化処理部40が第1の正規化処理手段に、前処理部10が前処理手段に、全体制御部150がエラー通知手段にそれぞれ対応する。また、境界追跡処理部22が境界抽出手段に、切り出し処理部25が認識対象画像抽出手段に、ぼかし処理部30が第2のぼかし処理手段に、正規化処理部32が第2の正規化処理手段にそれぞれ対応する。
本実施形態の占いシステムはこのような構成を有しており、次に画像認識処理部130の詳細な処理手順を説明する。
図4は、カメラ付携帯電話機300から送られてくるメールに添付された画像ファイルを取得し、この画像ファイルに対応する画像に含まれる6枚のタロットカードの種類と方向を認識するまでの一連のパターン認識手順を示す流れ図である。以下、図4を参照しながら、一連のパターン認識動作について説明する。
画像ファイルの取得(ステップ100)
まず、画像認識処理部130内の前処理部10は、受信メール処理部120から送られてくる画像ファイルを取得する。この画像ファイルには、カメラ付携帯電話機300の撮像範囲の各座標(x,y)の画素に対応するR、G、B成分の色データR(x,y)、G(x,y)、B(x,y)が含まれている。
例えば、本実施形態では、占いシステムを用いてタロットカード占いをしようとするユーザは、あらかじめ一組のタロットカードとこの中から6枚のタロットカードを選んで並べるためのシート部材とを所持しており、このシート部材上に並べられた6枚のタロットカードが撮像されて画像ファイルが作成される。
図5は、画像ファイルに対応する撮像範囲と各タロットカードとの関係を示す図である。シート部材400は、6枚のタロットカード401〜406を並べたときに、それらの全体よりも大きいサイズを有する単一色の布であり、例えば濃紺色のフェルト生地が用いられる。シート部材400は、持ち運び時には折りたたんだ状態で収納され、タロットカード401〜406を並べる際に広げて使用される。したがって、おりたたまれた状態から広げたときに、折り目が残らない材質であることが望ましく、材料費等を考慮するとフェルト生地が適している。但し、ビロード等の生地や紙によってシート部材400を形成してもよく、同等の色合いを有する板材等の上にタロットカード401〜406を並べる場合にはシート部材400を省略するようにしてもよい。
図5に示すように、本実施形態では、タロットカード占いの対象となるユーザは、6枚のタロットカード401〜406を3枚ずつ上下2列に並べた後に、これら6枚のタロットカード401〜406の全体がカメラ付携帯電話機300の内蔵カメラの撮像範囲410に含まれ、しかも、この撮像範囲410の全体がシート部材400に含まれるようにカメラ付携帯電話機300を用いた撮像が行われる。この撮像によって、例えば撮像範囲410が144×144画素に対応するRGBの撮像データが得られ、カメラ付携帯電話機300から占いサーバ100にメールの添付ファイルとして送られてくる。画像認識処理部130には、この撮像データのみが入力される。
なお、実際のタロットカード占いでは、6枚のタロットカードを横一列に並べることになっているが、本実施形態では、カメラ付携帯電話機300による撮像範囲410が正方形に近いことを考慮して、3枚のタロットカードを上下2列に配置するようにしている。この配置では、下段の3枚のタロットカード401〜403が横一列に並べた6枚のタロットカード中の左半分の3枚のタロットカードに対応し、上段の3枚のタロットカード404〜406が横一列に並べた6枚のタロットカード中の右半分の3枚のタロットカードに対応している。したがって、占い結果を判定する際に、上下2列に配置された6枚のタロットカード401〜406のそれぞれの種類および向きは、「遠い過去」、「近い過去」、「現在」、「障害」、「近い未来」、「遠い未来」のそれぞれの出来事を示している。
グレースケール変換処理(ステップ101)
次に、前処理部10は、取得した画像ファイルとしての3種類の色データR(x,y)、G(x,y)、B(x,y)を各画素毎のグレースケールの階調データ(以下、単に「階調データ」と称する)C(x,y)に変換する処理を行う。
二値化処理(ステップ102)
次に、画像切り出し部20内の二値化処理部21は、上述したステップ101の変換処理によって得られた階調データC(x,y)を所定の閾値と比較することにより二値化処理を行う。
本実施形態の認識対象物としてのタロットカード401〜406は、その外縁部分の色がシート部材400の色と識別可能なものが使用されている。例えば、本実施形態では、タロットカード401〜406は、標準的な模様のものが用いられており、外縁部分に白色の縁取りがなされている。このようなタロットカード401〜406が、濃紺色のシート部材400上に並べられており、二値化処理によってタロットカード401〜406のそれぞれの外縁部分の抽出が行われる。
具体的には、二値化処理部21は、前処理部10から出力される階調データC(x,y)を所定の閾値STHと比較することにより、二値データF(x,y)に変換する。C(x,y)≧STHの場合には、二値データF(x,y)=1に設定される。また、C(x,y)<STHの場合には、二値データF(x,y)=0に設定される。
図6は、二値化処理がなされた後の画像(二値化画像)の具体例を示す図である。図6において、各正方形領域が各画素に対応している。また、ハッチングが付された領域が二値データF(x,y)=0の各画素を、それ以外の領域が二値データF(x,y)=1の各画素をそれぞれ示している。なお、図6に示した二値化画像は、二値化処理および後述する境界追跡処理の説明を簡略化するために画素数を減らした場合であって、一例として1枚のタロットカード401がシート部材400上に並べられた場合が示されている。以下では、二値データF(x,y)=1の画素を「白画素」、F(x,y)=0の画素を「黒画素」と称して説明を行うものとする。
境界追跡処理(ステップ103)
境界追跡処理部22は、二値化画像をスキャンして最初に到達する白画素を抽出し、この白画素に隣接する他の白画素を最初の白画素に戻ってくるまで順番に辿ることにより、タロットカード401とシート部材400の境界(輪郭線)追跡を行う。
図7は、境界追跡処理の具体例を示す図である。図7に示した例では、スキャン開始点SSが二値化画像の左上に設定されており、下方向に順番に各画素のスキャンが行われ、最終的に右下のスキャン終了点SEで終了する。境界追跡処理部22は、このようなスキャン動作において、最初に到達した白画素をトレース開始点TSとして抽出し、図7の実線の矢印で示した順番に、再びこのトレース開始点TSに到達するまで境界追跡を行う。
以下、境界追跡処理の詳細について説明する。まず、境界追跡処理部22は、その時点における白画素の位置を中心にその周囲の8画素を調べ、次に辿るべき白画素の位置を決定する。
図8は、上述した境界追跡処理において次の白画素を決定する手法を説明するための図である。図8において、「C」は現在の着目画素(白画素)を、「P」は現在の画素に至る直前の画素(白画素)の位置をそれぞれ示している。また、「1」〜「8」のそれぞれの数字は、次に辿っていく白画素の選択の優先順番を示している。例えば、直前の白画素が現在の着目画素の真上に位置する場合には、左上、左、左下、下、右下、右、右上、上の各画素を順番に見ていって、最初に現れる白画素が、次に辿るべき白画素として決定される。但し、直前の白画素がどの位置にあった場合であっても、「1」に対応する画素が、次に辿る白画素となることはないため、実際には最も多い場合であっても「2」〜「8」の7個の画素を調べればよい。
このようにして、1枚のタロットカード401に対応して、トレース開始点TSから順番に白画素を辿っていく処理が一巡すると、このタロットカード401の境界線を構成する各白画素の座標値が境界追跡処理部22によって抽出される。
次に、境界追跡処理部22は、順番に辿った白画素で囲まれた領域を全て黒画素で塗りつぶす。例えば、境界線を追跡していく処理と並行して、境界追跡処理部22は、図9に示すようなX座標の最小値Xminと最大値Xmaxと、Y座標の最小値Yminと最大値Ymaxを抽出する。そして、この追跡処理が終了した後に、YminからYmaxまでの各Y座標について、対応するXminからXmaxまでの各画素に対応する二値データF(x,y)を0に設定する。
このようにして全て(6枚)のタロットカード401〜406に対する境界追跡と境界で囲まれた領域に対して、黒画素による塗りつぶし処理が行われる。なお、上述した説明では、各タロットカード401の境界を構成する最初の白画素を抽出するためのスキャン動作を左上の画素から下方向に向かって行ったが、左上から右方向に行ったり、スキャン開始点SSを変更したりしてもよい。
頂点検出処理(ステップ104)
次に、頂点検出部23は、上述したステップ103における境界追跡処理によって抽出された境界線のデータに基づいて、タロットカード401〜406のそれぞれについて4つの頂点を計算する。
一般に用いられるタロットカードは、四隅のコーナーが丸くなっているものが多い。本実施形態のタロットカード401等もそのような形状のものが用いられている。ところで、後のステップにおいてタロットカード401〜406のそれぞれについて登録パターンを用いた比較処理が行われるが、タロットカード401等に描かれた模様の位置が登録パターンの模様の位置と大きくずれてしまうと、登録パターンとタロットカード401等のそれぞれの模様が全く同じであっても、異なる模様が付されていると誤って判断されるおそれがある。このような誤った判断を回避するためには、タロットカード401等に付された模様の正確な位置を求める必要があり、このために本実施形態では、隣接する2辺が仮想的に交わる点を「頂点」として計算により求めている。
図10は、各コーナーと頂点との関係を示す図である。図10において、「○」はコーナー開始点を、「●」はコーナー終了点をそれぞれ示している。図10(A)に示すように、上述したステップ103における境界追跡処理によって抽出された境界線は、タロットカード401の四隅のコーナーに対応する部分が丸みを帯びている。頂点検出処理では、まず、図10(A)に示すように、トレース開始点TSから境界線を一方向に巡回することにより、4つのコーナーのそれぞれに対応するコーナー開始点とコーナー終了点が抽出される。次に、図10(B)に示すように、コーナーを挟まないで隣接するコーナー開始点とコーナー終了点とを通る辺を延長したときに交差する点が「頂点」として設定される。
次に、コーナー開始点とコーナー終了点を抽出する詳細な動作について説明する。なお、このコーナー開始点とコーナー終了点を抽出する動作は、上述したステップ103における境界追跡処理と並行して行うことが可能であり、処理の効率化を考えた場合にはこれらの処理を同時に行うことが望ましい。
頂点検出部23は、ステップ103において抽出された境界線に沿って所定の長さLの部分画素列を移動させながら、この部分画素列の頭部(先頭部分)と尾部(末尾部分)のそれぞれに対応するように設定された2つのベクトルの内積値IPの計算を行う。
図11は、境界線に沿って移動する部分画素列の具体例を示す図である。例えば長さL=10とすると、境界線に沿った10個の画素からなる部分画素列が生成される。また、この部分画素列の頭部と尾部のそれぞれには、所定の長さMの2つのベクトルA、B(頭部のベクトルAをVA 、尾部のベクトルBをVB とする)が設定されている。例えば長さM=3とすると、VA は、部分画素列の先頭の画素を終点とし、3個目の画素を始点とする向きを有する。また、VB は、部分画素列の最後尾の画素を始点とし、後ろから3個目の画素を終点とする向きを有する。
ところで、VA とVB のそれぞれは以下のように表すことができる。
VA =(VA のX成分の差,VA のY成分の差)
=(vax,vay)
VB =(VB のX成分の差,VB のY成分の差)
=(vbx,vby)
したがって、VA とVB の内積値IPは、
IP=VA ・VB =vax×vbx+vay×vby
となる。頂点検出部23は、この内積値IPと所定の閾値TIPとを比較し、|IP|≦TIPの場合には、VA とVB とのなす角ががほぼ直角であって、コーナーが部分画素列に含まれていると判断し、|IP|>TIPの場合にはコーナーが部分画素列に含まれていないと判断する。
なお、正確には、VA とVB とのなす角θはarccos(IP/(|VA |×|VB |))の式で計算されるため、ベクトルの長さを計算したり、除算等を行う必要があるが、VA 、VB について考えた場合にはベクトルの長さは2から2√2までの範囲に含まれることがわかっているので、本実施形態ではTIPの値を2とすることにより、これらの面倒な計算を省略している。
このようにして、部分画素列を境界線に沿って移動させることにより、4つのコーナーの全てが検出され、それぞれのコーナーに対応するコーナー開始点とコーナー終了点がそれぞれ登録される。
図12は、コーナー開始点とコーナー終了点の登録手順を示す図である。図12(A)に示すように、境界線に沿って部分画素列が移動し、その先頭部分がコーナーに突入した段階では、VA とVB の内積値IPがTIPより大きく、まだコーナーが部分画素列に含まれない状態にある。そして、部分画素列の移動が進むと、図12(B)に示すように、内積値IPがTIP以下になって、コーナーが部分画素列に含まれた状態になる。このときのVA の始点に対応する画素がコーナーの終了点「●」となる。さらに部分画素列の移動が進むと、VB の向きがコーナーの曲線に沿って変化し始める。図12(C)に示すように、VB の向きがコーナーの曲線に沿って変化し始める直前のVB の終点に対応する画素がコーナーの終了点「○」となる。そして、部分画素列の移動がさらに進むと、図12(D)に示すように、VB がコーナーから抜けて、部分画素列全体が次のコーナーに向かって移動する。このようにして、4つのコーナーのそれぞれに対応してコーナー終了点とコーナー開始点が検出され、その都度、頂点検出部23によって登録される。
ところで、ステップ103の境界追跡処理によって抽出される境界線は、理論的には直線であっても、実際にはノイズの混入による凹凸が生じる。このため、VA とVB の長さをあまり短く設定すると、コーナーの位置を誤検出する可能性が高くなる。
図13は、コーナーの誤検出の原理を説明するための図である。図13(A)は、抽出された境界線にノイズが含まれておらず、しかも着目している部分的な境界線がX軸に平行に配置された場合であり、このような限られた条件のときに段差が全くない画素列となる。しかし、実際の境界線は、カメラ付携帯電話機300による撮像時や二値化処理等において混入するノイズの影響により一直線にはならない。したがって、このような境界線に沿って移動する部分画素列の形状も直線状にはならない。このため、VA とVB の長さをあまり短く、例えば図13(B)に示すようにLの長さを2に設定すると、VA とVB の向きが画素列の移動に伴って大きく変化し、本来直線状の境界線に沿って移動しているにもかかわらず、VA とVB の内積値がほぼ0になって、実際には存在しないコーナーを誤検出してしまう。このような誤検出を回避するためには、VA とVB の長さをある程度長く、例えば図13(C)に示すようにLの長さを3あるいはそれ以上に設定すればよい。
なお、部分画素列にコーナーが含まれている場合であっても、ノイズ等のために、部分画素列がコーナーから抜け出したものとして誤検出される場合がある。
図14は、部分画素列がコーナーを抜け出したものとして誤検出される場合の具体例を示す図である。図14に示すように、部分画素列にコーナーが含まれる状態において、ノイズ等によってVA およびVB の少なくとも一方の向きが大きく変化すると上述した誤検出が発生する。
このようにして発生する誤検出に対する対策としては、所定個数の画素からなる不感領域を設け、コーナー終了点あるいはコーナー開始点が検出されても、即座にこれらの登録を行うのではなく、この検出タイミングから不感領域に対応する画素数分経過しても再度コーナーへの進入を検出しない場合に限って、先に検出したコーナー終了点あるいはコーナー開始点を登録するようにすればよい。
上述した一連の処理によって4つのコーナーが検出される。検出される順に、第0コーナー、第1コーナー、第2コーナー、第3コーナーとする。それぞれのコーナー開始点およびコーナー終了点の座標を、
第0コーナー開始点(s0x,s0y)、第0コーナー終了点(e0x,e0y)
第1コーナー開始点(s1x,s1y)、第1コーナー終了点(e1x,e1y)
第2コーナー開始点(s2x,s2y)、第2コーナー終了点(e2x,e2y)
第3コーナー開始点(s3x,s3y)、第3コーナー終了点(e3x,e3y)
とすると、図10(B)において「×」で示される4つの頂点は、第0コーナー終了点(e0x,e0y)と第1コーナー開始点(s1x,s1y)とを通る第1の直線と、第1コーナー終了点(e1x,e1y)と第2コーナー開始点(s2x,s2y)とを通る第2の直線と、第2コーナー終了点(e2x,e2y)と第3コーナー開始点(s3x,s3y)とを通る第3の直線と、第3コーナー終了点(e3x,e3y)と第0コーナー開始点(s0x,s0y)とを通る第4の直線とがそれぞれ交差する4つの交点を算出することにより求めることができる。
一般に、点(x0,y0)と点(x1,y1)とを通る直線Aの方程式
(y1−y0)×x+(x0−x1)×y=
(y1−y0)×x0+(x0−x1)×y0
を、
a0×x+b0×y=c0
とする。ここで、a0=y1−y0、b0=x0−x1、c0=(y1−y0)×x0+(x0−x1)×y0である。
同様に、点(x2,y2)と点(x3,y3)とを通る直線Bの方程式
(y3−y2)×x+(x2−x3)×y=
(y3−y2)×x2+(x2−x3)×y2
を、
a1×x+b1×y=c1
とする。ここで、a1=y3−y2、b2=x2−x3、c2=(y3−y2)×x2+(x2−x3)×y2である。
上述した2つの直線A,Bの交点の座標(X,Y)を求めると、
X=(b1×c0−b0×c1)/(a0×b1−b0×a1) …(1)
Y=(−a1×c0+a0×c1)/(a0×b1−b0×a1)…(2)
となる。
(1)式および(2)式を用いることにより、第0コーナーの外側近傍にある頂点(c0x,c0y)、第1コーナーの外側近傍にある頂点(c1x,c1y)、第2コーナーの外側近傍にある頂点(c2x,c2y)、第3コーナーの外側近傍にある頂点(c3x,c3y)が計算される。
回転補正処理(ステップ105)
次に、回転補正部24は、上述したステップ104における頂点検出処理によって検出された各頂点の相対位置を必要に応じて変更する回転補正を実施する。
図15は、回転補正の概略を示す図である。図15に示すように、「A」という文字が描かれた長方形のカードに対応する登録パターンG0が存在する場合に、実際に切り出された画像には、縦長の切り出し画像G1と、横長の切り出し画像G2とが存在するものとする。しかし、カードを横長に配置して見たときのこのカードの模様と、縦長の登録パターンG0の模様とが一致するということはない。あるいは、一致する場合があったとしても、もともと横長のカードと縦長のカードの一致判定を行いたいわけではなく、これらのカードについては不一致判定を行う必要がある。したがって、上述したステップ104における頂点検出処理によって検出された4つの頂点の位置関係(タロットカード401等を縦長にして配置したときに、例えば第0コーナーの外側近傍にある頂点がどこにくるか)を調べることにより、実際に切り出された撮像データと登録パターンとの比較を行う際の処理の簡略化が可能になる。
図16は、回転補正の詳細な内容を示す図である。図16において、模様「A」のカードの四隅に付された「C0」あるいは「0」は、最初に検出される第0コーナーの外側近傍の頂点を示している。同様に、「C1」あるいは「1」は第1コーナーの外側近傍の頂点を、「C2」あるいは「2」は第2コーナーの外側近傍の頂点を、「C3」あるいは「3」は第3コーナーの外側近傍の頂点をそれぞれ示している。また、「L01」は2つの頂点C0、C1に挟まれた境界線の直線部分を示している。同様に、「L12」は2つの頂点C1、C2に挟まれた境界線の直線部分を、「L23」は2つの頂点C2、C3に挟まれた境界線の直線部分を、「L30」は2つの頂点C3、C0に挟まれた境界線の直線部分をそれぞれ示している。
シート部材400上に長手方向がほぼ縦向きとなるようにタロットカード401等を置いた場合であっても、ノイズ等の影響によって、最初に検出される頂点の位置が一つ分ずれる場合がある。頂点位置が一つ分ずれるということは、同じように置いたタロットカード401等について、頂点の位置を揃えてパターン比較を行った場合であっても、切り出される撮像データが90度回転してしまう場合があるということを示している。
本実施形態では、図16の最上段に示したように、縦置きされたタロットカード401等の右下に、最初に検出された頂点C0が対応する場合を「標準登録配置」とする。この場合には、回転補正を行わない。回転補正部24は、境界線L01が境界線L12よりも長く、かつ境界線L01の傾きが右上がりになっている場合に、このタロットカード401等が図16の最上段に示した標準登録配置になっているものと判断する。
また、図16の上から2段目あるいは3段目に示したように、縦置きされたタロットカード401等の左下に、最初に検出された頂点C0が対応する場合には、4つの頂点位置を反時計回り方向に一つずつずらす回転補正が実施される。回転補正部24は、境界線L01が境界線L12よりも短い場合に、このタロットカード401等が図16の上から2段目あるいは3段目に示した配置状態になっているものと判断する。
また、図16の最下段に示したように、縦置きされたタロットカード401等の左上に、最初に検出された頂点C0が対応する場合には、4つの頂点位置を2つ分ずらす回転補正が実施される。回転補正部24は、境界線L01が境界線L12よりも長く、かつ境界線L01の傾きが右下がりになっている場合に、このタロットカード401等が図16の最下段に示した配置状態になっているものと判断する。
図17は、回転補正によって向きが変更された後のカードの配置状態を示す図である。回転補正を行うことによって、図17(A)に示すように、上向きを中心として所定の範囲に含まれる向きに配置されたタロットカード401等は、上向きに配置されたものとして判断され、図17(B)に示すように、下向きを中心として所定の範囲に含まれる向きに配置されたタロットカード401等は、下向きに配置されたものとして判断される。
階調データの切り出し処理(ステップ106)
次に、切り出し処理部25は、上述したステップ105における回転補正がなされた後の4つの頂点を有する矩形の内部に含まれるグレースケールの階調データC(x,y)を切り出す処理を行う。
図18は、撮像データの切り出し処理の概要を示す図である。切り出し処理部25は、4つの頂点によって特定される矩形の長辺と短辺のそれぞれを50分割して、各格子点に対応する画素のグレースケールの階調データC(x,y)を切り出すことにより、50×50個の階調データH(u,v)を生成する。ここで、「u,v」は、第2コーナーの外側近傍の頂点C2を原点として、短辺方向および長辺方向に沿った格子点の位置に対応している。
なお、短辺方向および長辺方向の分割数は任意であり、異なる値を設定してもよい。また、上述したようにタロットカード401等の外周部には模様と無関係の一定幅の白枠部分が含まれているため、この白枠部分をパターン認識の対象から除外するために、本実施形態では、この白枠部分を除いた領域に対応するように50×50個の階調データが生成されている。例えば、切り出されたタロットカード401等の階調データを用いて(50+α)×(50+α)分割した後に、中央の50×50個の部分のみを利用することにより、その周囲の白枠部分を容易に排除することができる。
また、階調データの値が所定の範囲を外れるか否かを判定する単位となる各画素とは、この50×50に分割された各画素に対応している。例えば、階調データの値が基準値を越えるとき、すなわち光が反射して画像が白くなってしまう部分に対応する各画素についてステップ107以後の各ステップの処理が省略される。
ぼかし処理(ステップ107)
次に、ぼかし処理部30は、ステップ106における切り出し処理後の階調データH(u,v)に対して、着目画素とその周囲の画素の各階調データを用いたぼかし処理を行う。以後の処理では、処理対象となる各画素は、切り出し処理部25によって50×50個に分割された各分割画素に対応している。
図19は、ぼかし処理において用いられるぼかしフィルタの具体例を示す図である。本実施形態では、中央の着目画素とその周囲の8個の隣接画素のそれぞれに同じ重み付けがなされている。具体的には、着目画素と8個の隣接画素のそれぞれの階調データに係数値「1」を乗算した値を合計した後に所定の利得(例えば1/9)を乗算することにより、この着目画素の新たな階調データH’(u,v)が得られる。すなわち、着目画素を含む9画素分の階調データを平均化するぼかし処理が行われる。なお、周囲に8個の隣接画素が存在しない外周部分の着目画素については、この着目画素と同じ階調データの隣接画素が存在するものとして計算が行われる。
図20は、外周部分の着目画素に対応するぼかし処理の説明図である。図20に示すように、外周部分に位置する着目画素b、c、d、eについては、その外側にこれらの着目画素と同じ階調データを有する隣接画素を仮想的に配置する。また、角部に位置する着目画素aについては、その垂直、水平および斜め方向にこの着目画素と同じ階調データを有する3個の隣接画素を仮想的に配置する。このような仮想的な隣接画素の配置を行った後に、角部を含む外周部分に位置する着目画素a〜e等についてぼかし処理が行われる。なお、階調データの値が基準値を越える各画素については、これらの画素に隣接する画素が外周部分あるいは角部の画素と同等に扱われてぼかし処理が行われる。
正規化処理(ステップ108)
次に、正規化処理部32は、ステップ107におけるぼかし処理によって得られた階調データH’(u,v)に対して所定の正規化処理を行う。
図21は、正規化処理の詳細な手順を示す流れ図である。まず、正規化処理部32は、ぼかし処理部30によってぼかし処理された後の階調データH’(u,v)を取得して階調値のヒストグラムを作成し(ステップ200)、ノイズ等に起因すると考えられる極端な値を有する比較データを削除する(ステップ201)。
図22は、ステップ201において極端な階調値を有する比較データを削除する処理の内容を示す図である。図22(A)に示すように、横軸を階調値とし、縦軸を度数(同じ階調値を有する階調データの数)とした階調データのヒストグラムがステップ200の処理により作成される。このときに、範囲aにより示されている階調データ群から外れて、階調値の下限値(min)付近および上限値(max)付近にそれぞれ階調データが存在し、かつそれらの度数が比較的少ない場合には、それらの階調データは「極端な階調値を有する」ものとして削除される。具体的には、取得した階調データの上限値と下限値の間の範囲bを求め、この範囲bの上下数%程度を除く範囲cに含まれる階調データだけを有効とし、この範囲cから外れる階調データが削除される。このようにして、極端な階調値を有する階調データの削除が行われた後には、図22(B)に示すような階調データのヒストグラムが得られる。
また、より単純に、一定の閾値で上限値と下限値を定めるようにしてもよい。この場合には、動的ではなく静的な閾値を利用するため、精度的には若干不利になることもあるが、ヒストグラム作成処理を省くことができるので、計算処理を大幅に軽減することが可能になる。ここで言う「一定の閾値」は、全ての認識対象画像(またはカード)について共通に設定してもよいし、各認識対象画像(またはカード)毎にその階調値の最大値・最小値などの情報を基に機械的に設定してもよい。さらに計算処理を軽減するためには、ステップ200とステップ201自体の処理を実行しないという方法もある。
次に、正規化処理部32は、階調データを正規化するために必要な変換関数のパラメータを設定する(ステップ202)。例えば、変換関数として単純な一次関数で表すことができる直線補間関数を用いる場合を考えると、正規化処理部32は、階調データの最大値や最小値などに基づいて一次関数のパラメータ(傾き、切片)を設定する。
変換関数のパラメータを設定すると、次に正規化処理部32は、この変換関数にしたがって階調データの正規化を行う(ステップ203)。
図23は、正規化処理の前後における階調データの階調値の変化を示す図である。図23において、縦軸は階調値を示しており、階調データの存在する範囲(ばらつきの範囲)が棒グラフにより示されている。また、「前」とは正規化処理が行われる前を、「後」とは正規化処理が行われた後をそれぞれ示している。例えば、図23(A)では、正規化処理前の階調データは、階調値の可変範囲の中央付近から上限付近にかけた範囲に存在していることが表されている。
図23(A)〜図23(E)に示すように、照明光(環境光)の強弱により、同一のタロットカード401等を撮像した場合であっても、正規化処理前の階調データは、異なった範囲に存在することとなる。具体的には、タロットカード401等に当たる環境光の照度が強い場合には、図23(A)や図23(B)に示すように階調データの範囲が全体的に上限値(max)側に偏り、逆にタロットカード401等に当たる環境光の照度が弱い場合には、図23(D)や図23(E)に示すように階調データの範囲が下限値(min)側に偏る。この場合に、上述したような正規化処理を行うことにより、環境光の強弱に関係なく階調データのばらつきの範囲をすべて同じに揃えることができる。
2次微分処理(ステップ109)
次に、2次微分処理部34は、ステップ108による正規化処理が行われた後の階調データh(u,v)に対して、着目画素とその周囲の画素の階調データを用いた2次微分処理を行う。
図24は、2次微分処理を行う際に用いられる3×3の2次微分オペレータの具体例を示す図である。本実施形態では、中央の着目画素に重み付け係数「8」が、8個の隣接画素のそれぞれに重み付け係数「−1」が設定されており、これらの各画素に重み付け係数を乗算した値を合計した後に所定の利得(例えば1)を乗算することにより、この着目画素に対応する2次微分データK(u,v)が得られる。なお、周囲に8個の隣接画素が存在しない外周部分の着目画素については、ステップ107において行われたぼかし処理と同様に各着目画素と同じ階調データの隣接画素が存在するものとして計算を行うようにしてもよいし、外周部の各画素については2次微分処理を行わないようにしてもよい。
絶対値処理(ステップ110)
次に、絶対値処理部36は、2次微分処理部34によって2次微分処理が行われた後の2次微分データK(u,v)に対して絶対値処理を行う。この2次微分データは、2次微分処理前の階調データの傾向によって正あるいは負の符号を有しており、絶対値処理によってこれらの大きさのみが抽出される。
ぼかし処理(ステップ111)
次に、ぼかし処理部38は、絶対値処理された後の2次微分データK’(u,v)に対して、着目画素とその周囲の画素の2次微分データを用いたぼかし処理を行う。このぼかし処理は、階調データに対して行われたステップ107のぼかし処理と同じ要領で行われる。すなわち、着目画素と8個の隣接画素のそれぞれの2次微分データK’(u,v)に係数値「1」を乗算した値を合計した後に所定の利得(例えば1/9)を乗算することにより、この着目画素の新たな2次微分データK”(u,v)が得られる。なお、周囲に8個の隣接画素が存在しない外周部分の着目画素については、この着目画素と同じ2次微分データの隣接画素が存在するものとして計算が行われる。
正規化処理(ステップ112)
次に、正規化処理部40は、ステップ111におけるぼかし処理によって得られた2次微分データK”(u,v)に対して所定の正規化処理を行う。この正規化処理は、階調データに対して行われたステップ108の正規化処理と同じ要領で行われる。すなわち、図21および図22に含まれる比較データあるいは階調値を2次微分データあるいは2次微分値に置き換えて同様の処理が行われる。
図25は、上述した2次微分処理から正規化処理までの内容を概略的に示す説明図である。図25(A)に示すように画素の色が白から黒に変化する境界部分(階調データに変換後の画素の濃淡を黒白色に対応させた場合)を1回微分すると、図25(B)に示す形状に対応する1回微分データが得られる。本実施形態では、この1回微分データをさらに微分して図25(C)に示す波形に対応する2回微分データを得ている。但し、本実施形態では、階調データに対して直接2回微分を行うことが可能な2次微分オペレータ(図24)が用いられているため、図25(A)に対応する階調データから図25(C)に対応する2次微分データが直接得られる。
その後の絶対値処理では符号に関係なく2次微分データの大きさのみが得られ(図25(D))、この絶対値処理された2次微分データに対してぼかし処理を行うことにより、図25(E)に示すような境界部分に対応した値を有する2次微分データが得られる。この2次微分データに対して正規化処理を行うことにより、図25(F)に示すような境界部分を強調することができる。
パターン比較処理(ステップ113)
次に、パターン比較部44は、上述したステップ112において正規化処理が行われた後の2次微分データK”(u,v)を用いて、登録パターン格納部42に格納された複数の登録パターンとの間でパターン比較による照合処理を行う。これにより、2次微分データK”(u,v)に最も類似する一の登録パターンが抽出され、この抽出された登録パターンを作成するために使用されたタロットカードの種類と方向が特定される。
図26は、ステップ113のパターン比較処理の詳細な手順を示す流れ図である。正規化処理後の2次微分データが正規化処理部40から出力されると、パターン比較部44は、登録パターン格納部42に格納されている一のタロットカードに対応する照明条件が異なる2種類の登録パターンを読み出し(ステップ300)、これらの登録パターンのそれぞれと、正規化処理部40から出力された2次微分データK”(u,v)とを比較して誤差を求める照合処理を行う(ステップ301)。例えば、登録パターンiに対応する2次微分データをEi(u,v)とする。パターン比較部44は、この2次微分データEi(u,v)と実際の撮像によって得られた2次微分データK”(u,v)との誤差T(i)を次式を用いて計算する。
Figure 2005242600
本実施形態では、着目しているタロットカード401等に対応する2次微分データK”(u,v)と登録パターンiを180度回転させた場合(向きを反転させた場合)の2次微分データE’i(u,v) との誤差T’(i)の計算を、次式を用いて並行して行っている。
Figure 2005242600
これら2種類の誤差T(i)、T’(i)の計算が、一のタロットカードに対応する2種類の登録パターンについて行われる。
なお、上述した例では、4つの頂点によって特定される矩形の長辺と短辺のそれぞれの分割数を「50」とした場合について説明したが、それぞれの分割数をU、Vとした場合には、上述した各式において、uに対応した「49」を「U−1」に、vに対応した「49」を「V−1」に置き換えればよい。
次に、パターン比較部44は、登録パターン格納部42に登録パターンが格納されている全てのタロットカードについて照合処理を行ったか否かを判定する(ステップ302)。全てのタロットカードについての照合処理がまだ行われていない場合には、ステップ302で否定判断が行われる。この場合には上述したステップ300に戻り、まだ選択されていない他のタロットカードに対応する処理が繰り返される。
また、登録パターン格納部42に格納されている全てのタロットカードについての照合処理が行われた場合には、ステップ302で肯定判断が行われる。次に、パターン比較部44は、照合処理により最も誤差の少ない照合結果が得られたタロットカードの種類と方向をタロットカード401等についての認識結果として出力する(ステップ303)。なお、画像認識処理部130に入力された画像ファイルには、6枚のタロットカード401〜406の画像が含まれているため、それぞれのタロットカード401等について上述した一連の処理が行われる。
このように、本実施形態の占いサーバ100に含まれる画像認識処理部130では、認識対象物としてのタロットカード401〜406を撮像して得られた階調データに対して微分処理を行った結果をパターン比較に直接用いるのではなく、ぼかし処理を行った後にパターン比較を行っているため、実際の撮像によって得られた範囲が若干ずれた場合であっても、比較されるデータ同士の相関値が極端に低下することがなく、認識率を高めることができる。しかも、ぼかし処理を行わずに1画素分ずらしながらパターン比較を繰り返し行う場合に比べて処理量(計算量)を大幅に低減することが可能になる。
また、このパターン比較処理は、階調データの値が所定の範囲から外れる画素、具体的には基準値よりも大きな値を有する画素を除外して行われる。これにより、光の照射状態が悪くて有効な情報が得られない撮像データ(例えば、照射光が強く反射してしまって白く光ってしまった部分)を除いてパターン認識処理を行うことができ、認識精度をさらに高めることが可能になる。
また、着目画素とその周囲に配置された周辺画素のそれぞれの撮像データを用いて2次微分処理を行うことにより微分データを生成しており、方向性のない微分データを得ることができるため、タロットカード401〜406の配置やそれぞれに含まれる模様の方向等に関係なく正確なパターン認識処理を行うことができる。
また、2次微分処理によって得られた微分データに対して絶対値処理を行うことにより、階調データの値の変化の方向に関係しないパターン認識処理を行うことができるため、照明条件によってタロットカード401〜406の色や階調度が変化した場合であっても高い認識精度を維持することが可能になる。
また、パターン比較処理を行う前の2次微分データに対して正規化処理を行うことにより、照明条件やカメラ付携帯電話機300に搭載されたカメラの特性等の相違によって2次微分データの値の分布が偏ることによる影響を取り除くことができるため、パターン比較を行う際の精度をさらに上げることができる。
また、本実施形態の画像認識処理部130では、色データそのものではなく色データを階調データに変換して用いている。これにより、RGBの色データを用いてパターン認識を行う場合に比べて処理量を大幅に低減することができる。特に、2次微分データを用いてパターン認識を行う場合には、色そのものはあまり重要ではなく、階調データに変換しても高い認識精度を維持することが可能になる。
また、階調データを生成するために用いられる色データは、カメラ付携帯電話機300によって撮像されてメールに添付された画像ファイルとして画像認識処理部130に入力されている。一般に、カメラ付携帯電話機300に搭載されたカメラを用いて撮像された画像は解像度が低く、しかも、メールに添付可能な画像ファイルの解像度はさらに低い値に制限されていることが多い。また、各ユーザが自分のカメラ付携帯電話機300を使用してタロットカード401〜406を撮像する場合には、照明条件や手振れの状態などがユーザ毎に異なることになり、撮像された画像の色や階調値、手振れの状態が一定しない。このような場合であっても、2次微分データに対してぼかし処理を行った結果を用いてパターン比較を行うことにより、タロットカード401〜406のそれぞれの画像全体の模様の傾向が一致する登録パターンを正確に抽出することができる。
また、メールに添付された画像ファイルに基づいて判定したタロットカードの数が所定数(6枚)と異なるときに全体制御部150によってエラー通知を行う行うことにより、パターン認識の結果を用いる占い等の各種のアプリケーションにおいて、明らかに誤りの結果しか得られない場合の複雑な処理を省略することができ、処理量をさらに低減することができる。
また、タロットカード401〜406のそれぞれに対応する階調データを切り出す際に、各タロットカードの境界線を追跡して抽出することにより、処理対象となる階調データの範囲を限定することが可能になり、パターン比較に要する処理量を低減することが可能になる。
また、画像切り出し部20内の切り出し処理部25では、各タロットカードを構成する画素数(第1の画素数)が登録パターンを構成する画素数(第2の画素数、具体的には50×50画素)と異なるときに、各タロットカードに対応する第2の画素数分の階調データを生成している。これにより、パターン比較の対象となる各タロットカードと登録パターンの各構成画素数を一致させることができ、パターン認識の処理手順を簡素化することができる。
また、ぼかし処理部30によって、着目画素毎とその周辺に配置された周囲画素のそれぞれの階調データを平均化して着目画素の新たな階調データを生成するぼかし処理を行うことにより、各タロットカードと登録パターンとの間の正確な位置合わせを行うことなく精度の高いパターン認識処理を行うことが可能になる。
また、正規化処理部32によって、各タロットカードに対応した階調データに対して正規化処理を行うことにより、照明条件やカメラの特性等の相違に基づく階調データの値の分布が偏ることによる影響を取り除くことができるため、パターン比較を行う際の精度をさらに上げることができる。
なお、本発明は上記実施形態に限定されるものではなく、本発明の要旨の範囲内において種々の変形実施が可能である。例えば、上述した実施形態では、2次微分データを用いたパターン認識処理によってタロットカード401〜406のそれぞれの種類と方向を判定するようにしたが、2次微分データと階調データの両方を用いてパターン認識処理を行うようにしてもよい。この場合には、登録パターン格納部42には、各タロットカード毎に2次微分データと階調データの両方を対応させて格納しておく必要がある。パターン比較部44は、階調データを用いて計算した第1の誤差と、2次微分データを用いて計算した第2の誤差とを所定の重み付けを行って加算し、合計値が最小となる一の登録パターンを抽出する。微分データと階調データとを併用してパターン認識を行うことにより、様々な照明条件や模様等に対応した精度の高い認識処理を行うことが可能になる。
また、2次微分データと階調データの他に、階調データの生成に用いた元の色データを用いてパターン認識処理を行うようにしてもよい。この場合には、登録パターン格納部42には、各タロットカード毎に2次微分データ、階調データ、色データのそれぞれを対応させて格納しておく必要がある。パターン比較部44は、階調データを用いて計算した第1の誤差と、2次微分データを用いて計算した第2の誤差と、色データを用いて計算した第3の誤差とを所定の重み付けを行って加算し、合計値が最小となる一の登録パターンを抽出する。階調データだけでなく色データも用いることにより、特徴的な色合いの模様等を有する認識対象物に対してさらに精度の高い認識処理を行うことが可能になる。
また、上述した実施形態では、登録パターンとして明暗2種類の照明に対応した2次微分データ(階調データや色データを用いる場合にはこれらについても明暗2種類の照明に対応したデータ)を用いたが、中間の明るさの照明に対応した2次微分データを補間処理によって作成して登録パターンの種類を増やすようにしてもよい。図27は、補間処理によって登録パターンの種類を増やす場合の画像認識処理部130Aの変形例を示す図である。この画像認識処理部130Aに含まれる補間パターン作成部43は、図28に示すように、一のタロットカードに対応する明暗2種類の登録パターンT1、T2としての2次微分データ(あるいは階調データや色データ)を用いて補間処理(例えば直線補間処理)を行い、中間の明るさの照明に対応する3種類の登録パターンとしての補間パターンt1、t2、t3を作成する。パターン比較部44は、登録パターンT1、T2と補間パターンt1、t2、t3のいずれかに対応する誤差が最小となったときに、これら5種類のパターンに対応するタロットカードの種類と方向をパターン認識結果として出力する。
但し、上述したように補間処理によって照合用パターンを増やすのではなく、あらかじめ例えば5種類の照明条件の下で登録パターンを作成してもよい。
また、上述した実施形態では、タロットカード401〜406のそれぞれに対応する単一の領域を切り出してパターン認識処理を行うようにしたが、一のタロットカードに対応する領域を複数の分割領域に分け、それぞれの分割領域毎に誤差が最小の登録パターンを抽出した後、多数決判定等によって最終的に一の登録パターンに対応するタロットカードの種類と方向を決定するようにしてもよい。これにより、特徴のある模様等がタロットカードの一部に含まれている場合においてこの模様等を強調したパターン認識を行うことができる。
また、上述した実施形態では、6枚のタロットカードと異なる枚数のタロットカードが撮像された場合にエラーメールを送信するようにしたが、撮像されたタロットカードの枚数が6枚であっても、例えば、照明条件等により、白く光りすぎて撮像されているカードが6枚中1枚でもあれば、そのカードの認識に必要な信頼性の高いデータを十分に取得することができない可能性があると判断して、全体制御部150からエラーメールが送信される。「白く光りすぎている」かどうかの判定には、ヒストグラムのデータを利用してもよいし、階調値がある閾値を超えた画素数をカウントしてもよい。いずれにしても1枚のタロットカード総画素にしめる「明るすぎる画素」の割合が一定の値を超えていた場合に「白く光りすぎている」と見なしている。
また、上述した実施形態では、カメラ付携帯電話機300からメールに添付された画像ファイルとして撮像データを取得するようにしたが、カメラ付携帯電話機300上のアプリケーションプログラムから直接送信された画像データとして撮像データが取得可能な場合には、この撮像データを用いてタロットカードの認識処理を行うようにしてもよい。
また、上述した実施形態では、タロットカード401〜406のカードデザインについては言及していないが、本発明における照合処理に適しているカードデザインとして以下の特徴(1)〜(6)を有するタロットカードを用いることが望ましい。
(1)彩色時にグラデーションは使わない、あるいは可能な限り少なくする。模様にグラデーションがかかっていると、それが照明による影響であると判断し、2次微分を行うことでその効果を打ち消そうとするように補正が働くようになっているからである。
(2)ある程度広い面積を同じ明るさで単一階調の色で塗りつぶすこと。さらに、隣接した領域とのコントラストが大きいこと。
(3)グレースケールにした後に、大きなコントラストが得られる画像であること。コントラストが小さい画像のカードではノイズに弱いからである。
(4)濃淡差が現れる場所は、できるだけ他の種類のカードと重ならないようにすること。
(5)濃淡(階調値)の絶対値についても、同じような模様が他の種類のカードの同じような場所に現れないようにすること。
(6)細かい模様はあまり使わないこと。画像全体に対してぼかし処理を行っているため、細かい模様がつぶれてしまうからである。反対に、画像認識時の指標として使いたい部分には、ある程度、大きな面積が必要となる。
一実施形態の占いシステムの構成を示す図である。 画像認識処理部の詳細構成を示す図である。 画像切り出し部の詳細構成を示す図である。 画像ファイルを取得してタロットカードの種類と方向を認識するまでの一連のパターン認識手順を示す流れ図である。 画像ファイルに対応する撮像範囲と各タロットカードとの関係を示す図である。 二値化処理がなされた後の画像の具体例を示す図である。 境界追跡処理の具体例を示す図である。 境界追跡処理において次の白画素を決定する手法を説明するための図である。 境界追跡処理と並行して収集する座標値を説明するための図である。 各コーナーと頂点との関係を示す図である。 境界線に沿って移動する部分画素列の具体例を示す図である。 コーナー開始点とコーナー終了点の登録手順を示す図である。 コーナーの誤検出の原理を説明するための図である。 部分画素列がコーナーを抜け出したものとして誤検出する場合の具体例を示す図である。 回転補正の概略を示す図である。 回転補正の詳細な内容を示す図である。 回転補正によって向きが変更された後のカードの配置状態を示す図である。 撮像データの切り出し処理の概要を示す図である。 ぼかし処理において用いられるぼかしフィルタの具体例を示す図である。 外周部分の着目画素に対応するぼかし処理の説明図である。 正規化処理の詳細な手順を示す流れ図である。 極端な階調値を有する階調データを削除する場合の概略を示す図である。 正規化処理の前後における階調値の変化を示す図である。 2次微分処理を行う際に用いられる3×3の2次微分オペレータの具体例を示す図である。 2次微分処理から正規化処理までの内容を概略的に示す説明図である。 パターン比較処理の詳細な手順を示す流れ図である。 画像認識処理部の変形例を示す図である。 補間パターンの作成方法の一例を示す図である。
符号の説明
10 前処理部
20 画像切り出し部
21 二値化処理部
22 境界追跡処理部
23 頂点検出部
24 回転補正部
25 切り出し処理部
30、38 ぼかし処理部
32、40 正規化処理部
34 2次微分処理部
36 絶対値処理部
42 登録パターン格納部
43 補間パターン作成部
44 パターン比較部
100 占いサーバ
110、320 メール・サーバ
120 受信メール処理部
130 画像認識処理部
140 占い結果作成処理部
150 全体制御部
160 情報記録媒体
200 インターネット
300 カメラ付携帯電話機
310 基地局
400 シート部材
401〜406 タロットカード
410 撮像範囲

Claims (21)

  1. 認識対象物に対応した複数画素の撮像データに対して微分処理を行う微分処理手段と、
    前記微分処理手段によって微分処理が行われた後の微分データに対して、着目画素とその周辺に配置された周囲画素のそれぞれの微分データを平均化して着目画素の新たな微分データを生成するぼかし処理を行う第1のぼかし処理手段と、
    前記ぼかし処理手段によるぼかし処理後の微分データを用いて、あらかじめ登録されている複数の登録パターンのそれぞれに対応する微分データに対する比較処理を行うことにより、前記認識対象物に最も近い前記登録パターンを抽出するパターン比較手段と、
    を備えることを特徴とするパターン認識処理装置。
  2. 請求項1において、
    前記パターン比較手段による比較処理は、前記撮像データの値が所定の範囲から外れる画素を除外して行われることを特徴とするパターン認識処理装置。
  3. 請求項2において、
    前記所定の範囲とは、前記撮像データの値が基準値以下の場合であることを特徴とするパターン認識処理装置。
  4. 請求項1〜3のいずれかにおいて、
    前記微分処理手段は、着目画素とその周囲に配置された周辺画素のそれぞれの撮像データを用いて2次微分処理を行うことにより前記微分データを出力することを特徴とするパターン認識処理装置。
  5. 請求項4において、
    前記微分処理手段による2次微分処理によって得られた微分データに対して絶対値処理を行う絶対値処理手段をさらに備えることを特徴とするパターン認識処理装置。
  6. 請求項1〜5のいずれかにおいて、
    前記パターン比較処理を行う前の前記微分データに対して正規化処理を行う第1の正規化処理手段をさらに備えることを特徴とするパターン認識処理装置。
  7. 請求項1〜6のいずれかにおいて、
    前記撮像データは、前記認識対象物を構成する各画素の階調値を示す階調データであり、
    前記認識対象物を撮像した色データを前記階調データに変換する前処理手段をさらに備えることを特徴とするパターン認識処理装置。
  8. 請求項7において、
    前記色データは、カメラ付携帯電話機によって撮像されてメールに添付された画像ファイル、またはカメラ付携帯電話機上のアプリケーションプログラムから送信された画像データとして入力されることを特徴とするパターン認識処理装置。
  9. 請求項8において、
    前記画像ファイルに基づいて判定した前記認識対象物の数が所定数と異なるときにエラー通知を行うエラー通知手段をさらに備えることを特徴とするパターン認識処理装置。
  10. 請求項1〜9のいずれかにおいて、
    一あるいは複数の前記認識対象物が含まれる撮像データに基づいて、前記認識対象物の境界線を抽出する境界抽出手段と、
    前記境界抽出手段によって抽出された境界線に囲まれる領域に対応する前記撮像データを前記認識対象物毎に抽出する認識対象画像抽出手段と、
    をさらに備えることを特徴とするパターン認識処理手段。
  11. 請求項10において、
    前記認識対象画像抽出手段は、前記認識対象物を構成する第1の画素数が前記登録パターンを構成する第2の画素数と異なるときに、前記認識対象物に対応する前記第2の画素数分の前記撮像データを抽出することを特徴とするパターン認識処理装置。
  12. 請求項1〜11のいずれかにおいて、
    前記認識対象物に対応した前記撮像データに対して、着目画素毎とその周辺に配置された周囲画素のそれぞれの前記撮像データを平均化して着目画素の新たな撮像データを生成するぼかし処理を行う第2のぼかし処理手段をさらに備え、
    前記微分処理手段は、前記第2のぼかし処理手段によって生成された撮像データを用いて微分処理を行うことを特徴とするパターン認識処理装置。
  13. 請求項1〜12のいずれかにおいて、
    前記認識対象物に対応した前記撮像データに対して正規化処理を行う第2の正規化処理手段をさらに備えることを特徴とするパターン認識処理装置。
  14. 請求項1〜13のいずれかにおいて、
    前記登録パターンのそれぞれには前記微分データとともに前記撮像データが対応しており、
    前記パターン比較手段は、前記認識対象物に対応する前記微分データと前記撮像データのそれぞれを用いて最も類似する前記登録パターンを抽出することを特徴とするパターン認識処理装置。
  15. 請求項14において、
    前記パターン比較手段は、前記認識対象物に対応する微分データと前記登録パターンに対応する微分データとを用いて計算した第1の誤差と、前記認識対象物に対応する撮像データと前記登録パターンに対応する撮像データとを用いて計算した第2の誤差とを所定の重み付けをして加算した合計値が最小となる一の前記登録パターンを抽出することを特徴とするパターン認識処理装置。
  16. 請求項14において、
    前記撮像データには、前記認識対象物を構成する各画素の階調値を示す階調データと、前記認識対象物を構成する各画素の色データとが含まれており、
    前記パターン比較手段は、前記認識対象物に対応する前記微分データと前記階調データと前記色データのそれぞれを用いて最も類似する前記登録パターンを抽出することを特徴とするパターン認識処理装置。
  17. 請求項1〜16のいずれかにおいて、
    前記認識対象物に対応する前記撮像データは、複数の分割領域に分散した対応付けがなされており、これら複数の分割領域のそれぞれ毎に前記登録パターンが抽出され、これら複数の分割領域のそれぞれに対応して抽出された前記登録パターンに基づいて一の前記登録パターンが決定されることを特徴とするパターン認識処理装置。
  18. 認識対象物に対応した複数画素の撮像データに対して微分処理を行う第1のステップと、
    前記微分処理が行われた後の微分データに対して、着目画素とその周辺に配置された周囲画素のそれぞれの微分データを平均化して着目画素の新たな微分データを生成する第2のステップと、
    前記第2のステップにおいて生成された微分データを用いて、あらかじめ登録されている複数の登録パターンのそれぞれに対応する微分データに対する比較処理を行うことにより、前記認識対象物に最も近い登録パターンを抽出する第3のステップと、
    を有することを特徴とするパターン認識処理方法。
  19. 請求項18において、
    前記第3のステップにおいて行われる比較処理は、前記撮像データの値が所定の範囲から外れる画素を除外して行われることを特徴とするパターン認識処理方法。
  20. コンピュータを、
    認識対象物に対応した複数画素の撮像データに対して微分処理を行う微分処理手段と、
    前記微分処理手段によって微分処理が行われた後の微分データに対して、着目画素とその周辺に配置された周囲画素のそれぞれの微分データを平均化して着目画素の新たな微分データを生成するぼかし処理を行う第1のぼかし処理手段と、
    前記ぼかし処理手段によるぼかし処理後の微分データを用いて、あらかじめ登録されている複数の登録パターンのそれぞれに対応する微分データに対する比較処理を行うことにより、前記認識対象物に最も近い前記登録パターンを抽出するパターン比較手段と、
    して機能させるためのパターン認識処理プログラム。
  21. 請求項20において、
    前記パターン比較手段による比較処理は、前記撮像データの値が所定の範囲から外れる画素を除外して行われることを特徴とするパターン認識処理プログラム。
JP2004050692A 2004-02-26 2004-02-26 パターン認識処理装置、方法およびプログラム Pending JP2005242600A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004050692A JP2005242600A (ja) 2004-02-26 2004-02-26 パターン認識処理装置、方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004050692A JP2005242600A (ja) 2004-02-26 2004-02-26 パターン認識処理装置、方法およびプログラム

Publications (1)

Publication Number Publication Date
JP2005242600A true JP2005242600A (ja) 2005-09-08

Family

ID=35024289

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004050692A Pending JP2005242600A (ja) 2004-02-26 2004-02-26 パターン認識処理装置、方法およびプログラム

Country Status (1)

Country Link
JP (1) JP2005242600A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008003765A (ja) * 2006-06-21 2008-01-10 Namco Bandai Games Inc 入力された画像データから少なくとも1以上の認識対象画像を抽出するための画像認識装置、方法、プログラム及び情報記録媒体
JP2011138537A (ja) * 2011-02-24 2011-07-14 Nintendo Co Ltd 画像認識プログラム、画像認識装置、画像認識システム、および画像認識方法
US8571266B2 (en) 2011-02-24 2013-10-29 Nintendo Co., Ltd. Computer-readable storage medium, image processing apparatus, image processing system, and image processing method
US8699749B2 (en) 2011-02-24 2014-04-15 Nintendo Co., Ltd. Computer-readable storage medium, image processing apparatus, image processing system, and image processing method
US8705868B2 (en) 2011-02-24 2014-04-22 Nintendo Co., Ltd. Computer-readable storage medium, image recognition apparatus, image recognition system, and image recognition method
US8705869B2 (en) 2011-02-24 2014-04-22 Nintendo Co., Ltd. Computer-readable storage medium, image recognition apparatus, image recognition system, and image recognition method
US8718325B2 (en) 2011-02-24 2014-05-06 Nintendo Co., Ltd. Computer-readable storage medium, image processing apparatus, image processing system, and image processing method

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008003765A (ja) * 2006-06-21 2008-01-10 Namco Bandai Games Inc 入力された画像データから少なくとも1以上の認識対象画像を抽出するための画像認識装置、方法、プログラム及び情報記録媒体
JP2011138537A (ja) * 2011-02-24 2011-07-14 Nintendo Co Ltd 画像認識プログラム、画像認識装置、画像認識システム、および画像認識方法
US8571266B2 (en) 2011-02-24 2013-10-29 Nintendo Co., Ltd. Computer-readable storage medium, image processing apparatus, image processing system, and image processing method
US8625898B2 (en) 2011-02-24 2014-01-07 Nintendo Co., Ltd. Computer-readable storage medium, image recognition apparatus, image recognition system, and image recognition method
US8699749B2 (en) 2011-02-24 2014-04-15 Nintendo Co., Ltd. Computer-readable storage medium, image processing apparatus, image processing system, and image processing method
US8705868B2 (en) 2011-02-24 2014-04-22 Nintendo Co., Ltd. Computer-readable storage medium, image recognition apparatus, image recognition system, and image recognition method
US8705869B2 (en) 2011-02-24 2014-04-22 Nintendo Co., Ltd. Computer-readable storage medium, image recognition apparatus, image recognition system, and image recognition method
US8718325B2 (en) 2011-02-24 2014-05-06 Nintendo Co., Ltd. Computer-readable storage medium, image processing apparatus, image processing system, and image processing method

Similar Documents

Publication Publication Date Title
US11062176B2 (en) Object detection and image cropping using a multi-detector approach
CN111401372B (zh) 一种扫描文档图文信息提取与鉴别的方法
US7454040B2 (en) Systems and methods of detecting and correcting redeye in an image suitable for embedded applications
US8144986B2 (en) Method and apparatus for binarization threshold calculation
US10853903B1 (en) Detection of encoded signals and icons
Gebhardt et al. Document authentication using printing technique features and unsupervised anomaly detection
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US8155442B2 (en) Method and apparatus for modifying the histogram of an image
CN102360419B (zh) 计算机扫描阅读管理方法及系统
US20070253040A1 (en) Color scanning to enhance bitonal image
EP2974261A2 (en) Systems and methods for classifying objects in digital images captured using mobile devices
WO2014160426A1 (en) Classifying objects in digital images captured using mobile devices
RU2726185C1 (ru) Детектирование и идентификация объектов на изображениях
US8699794B2 (en) Variable glyph system and method
Attivissimo et al. An automatic reader of identity documents
US9076225B2 (en) Image processing device, an image processing method and a program to be used to implement the image processing
JP2005242600A (ja) パターン認識処理装置、方法およびプログラム
US9424488B2 (en) Applying a segmentation engine to different mappings of a digital image
US6694059B1 (en) Robustness enhancement and evaluation of image information extraction
JP2010186246A (ja) 画像処理装置、方法、及び、プログラム
US7813547B1 (en) Apparatus and method for detection and analysis of imagery
JP4578000B2 (ja) パターン認識処理装置、方法および情報記憶媒体
CN101467441A (zh) 自相似图像捕获系统
JP2007025899A (ja) 画像処理装置、画像処理方法
US11983944B2 (en) Object detection and image cropping using a multi-detector approach

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070814

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071012

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071106