JP2004013319A - 画像中の物体認識方法 - Google Patents
画像中の物体認識方法 Download PDFInfo
- Publication number
- JP2004013319A JP2004013319A JP2002163062A JP2002163062A JP2004013319A JP 2004013319 A JP2004013319 A JP 2004013319A JP 2002163062 A JP2002163062 A JP 2002163062A JP 2002163062 A JP2002163062 A JP 2002163062A JP 2004013319 A JP2004013319 A JP 2004013319A
- Authority
- JP
- Japan
- Prior art keywords
- image
- recognition
- template
- recognized
- object recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
【課題】被認識画像中の物体の認識精度および効率を高める。
【解決手段】手書き入力画像をテンプレート画像として被認識画像と比較するものである。すなわち、座標指示入力装置からの手書き画像データを入力してこれを正規化し、前記で入力されたままの手書き画像データまたは前記で正規化された手書き画像データをグレースケール化または輝度信号化してこれを量子化したものをテンプレート画像とし、このテンプレート画像を別途入力された被認識画像と比較するものである。このような処理を実行することにより、たとえばユーザがマウス等で眼鏡を描いた場合にもこの眼鏡を特徴点として画像中の眼鏡をかけた人物の特定が可能となる。
【選択図】 図1
【解決手段】手書き入力画像をテンプレート画像として被認識画像と比較するものである。すなわち、座標指示入力装置からの手書き画像データを入力してこれを正規化し、前記で入力されたままの手書き画像データまたは前記で正規化された手書き画像データをグレースケール化または輝度信号化してこれを量子化したものをテンプレート画像とし、このテンプレート画像を別途入力された被認識画像と比較するものである。このような処理を実行することにより、たとえばユーザがマウス等で眼鏡を描いた場合にもこの眼鏡を特徴点として画像中の眼鏡をかけた人物の特定が可能となる。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、画像中に表示された物体を認識するための技術に適用して有効な技術に関する。
【0002】
【従来の技術】
デジタル処理された写真画像データ中から物体を認識する従来技術としては、情報処理装置内にあらかじめ多数のテンプレート画像を用意しておき、パターンマッチング等の比較技術により、撮影された写真中の画像が特定の物体であると認識するものが一般的だった。
【0003】
この種の従来技術としてたとえば、特開2002?83297号公報がある。この先行技術では、画像処理と物体認識の精度を両立させるために、複数代のカメラを用いて物体を撮影し、これらのカメラの位置状態に基づいて3次元処理を行い当該物体を把握するものだった。
【0004】
【発明が解決しようとする課題】
ところで、前記のような従来技術は、複数のカメラを用いることにより三次元処理を効率的に行うことができるものの、物体の認識については、画像中から特徴点を見いだして、あらかじめ記憶しているパターンを照合する方式であるため、比較画像間の誤差を尺度として認識を行わざるを得なかった。
【0005】
そのため、これらの従来技術では、被認識対象データ中の対象物(オブジェクト)の大きさや傾きが異なっていると正確な物体認識ができないという問題があった。
【0006】
たとえば、特定の個人を認識したい場合、テンプレート画像は正面からの顔写真であり、オブジェクトは横顔の写真であるような場合、認識が困難であった。
【0007】
本発明は、このような従来技術に鑑みてなされたものであり、テンプレート画像に対して変形されたオブジェクトであっても認識可能な物体認識技術を提供することを技術的課題とする。
【0008】
【課題を解決するための手段】
本発明は、第1に、手書き入力画像をテンプレート画像として被認識画像と比較するものである。すなわち、座標指示入力装置からの手書き画像データを入力してこれを正規化し、前記で入力されたままの手書き画像データまたは前記で正規化された手書き画像データをグレースケール化または輝度信号化してこれを量子化したものをテンプレート画像とし、このテンプレート画像を別途入力された被認識画像と比較するものである。このような処理を実行することにより、たとえばユーザがマウス等で眼鏡を描いた場合にもこの眼鏡を特徴点として画像中の眼鏡をかけた人物の特定が可能となる。
【0009】
また、本発明は、第2に、認識画像を読み込んで、類似物体認識のために当該認識画像を縦または横方向に分割し、前記分割領域毎に異なる縮尺率で認識画像を変換し、類似物体認識用の複数のテンプレート画像とするものである。テンプレート画像が正面から撮影された顔写真のみである場合、被認識画像中の正面顔は認識可能であるが、同一人物であっても横顔である場合には認識が困難となる。この点について本発明では分割領域毎に縮尺率を変化させて画像を変換し、正面からの顔写真のみが与えられている場合であっても右横、左横、斜め上、斜め下方向からの顔写真をテンプレート画像として生成できる。そのため、複数のカメラ画像を用いることなく同一物体の認識精度を高めることができる。
より具体的には、認識画像を類似物体認識のために当該認識画像を縦または横方向に分割し、この分割領域毎に以下の式に基づいて元画像の縮尺率を決定し、領域毎の画像変換を実行し、
x = (( X − x0 ) COSθ − ( Y − y0 ) SINθ ) / a + x0
y = (( X − x0 ) SINθ − ( Y − y0 ) COSθ ) / b + y0
(ただし、画像上の任意の点x0,y0を中心として横方向にa倍、縦方向にb倍したものとする。
前記変換後の複数のテンプレート画像を生成して、これら複数のテンプレート画像を別途入力された被認識画像と比較するようにした。上記式において、座標(x、y)が拡大・縮小された画像位置であるが、これに対応するもとの画像位置(X、Y)にある画素データを、そのまま拡大・縮小画素として利用する事ができる利点がある。
【0010】
さらに、本発明は、第3に、被認識画像に対して、複数のテンプレート画像を用いて段階的に絞り込みを行ったり、同時に複数のテンプレート画像を用いて比較処理を行うことにより、物体認識処理の高速化・高効率化を実現することができる。
【0011】
【発明の実施の形態】
【実施例】
以下、図面に基づいて、本発明の実施の形態を説明する。
【0012】
図1は、本発明のシステム構成を示している。本システムは同図に示すように、認識画像テンプレート画像作成部と被認識画像入力部とからなる入力インターフェース部と、物体画像認識エンジン部とで構成されている。
【0013】
本システムは、汎用のパーソナルコンピュータ等で実現することができ、入力装置としては、マウスまたはデジタイザ等の座標入力手段、またはキーボード等を用いることができる。また、記憶手段としてはハードディスク装置を備えており、この記憶手段内に、認識画像、被認識画像および本実施例の機能を実現するための各種プログラムが格納されている。
【0014】
(認識画像テンプレート画像作成部)
認識画像テンプレート画像作成部は、マウスまたはデジタイザから座標入力された図形または、記憶手段内の認識画像(画像ファイルまたは画像ソース)を入力するようになっており、機能部としては、ビットマップ画像入力部と、画像変換部と、2ビット相当量子化器と、テンプレート画像展開部とで構成されている。
【0015】
ここで、ビットマップ画像入力部は、上記で入力された画像データをコンピュータ上で扱える様、ビットマップ・データ(RGBのカラーデータ)に変換し、さらに効率のよい認識処理のためにグレー・スケール(256レベル、8bit相当)または、輝度信号Yに変換する。このようにして変換された画像データが、検索対象画像として後段の物体画像認識エンジン部に渡され、認識処理されるようになっている。
【0016】
ところで、認識用テンプレート画像を、画像ファイルまたは画像ソースより作成する方法としては以下の3通りがある。
(1).画像ファイルや画像ソースから作成する方法
(2).マウスやデジタイザ等による手描き画像から作成する方法
(3).認識テンプレート画像から、その画像変形による複数のテンプレート画像を作成する方法
【0017】
以下、それぞれの方法について説明する。
(1).画像ファイルや画像ソースから作成する方法
画像データをコンピュータ上で扱える様にするため、当該画像データをビットマップ・データに変換し、マウスやデジタイザ等による入力機器を用い、認識したい物体の領域を指定する。そして、さらに効率のよい認識処理のためにグレー・スケール(256レベル、8bit相当)または、輝度信号Yに変換する。ここで、同一画像認識の場合と類似が像認識の場合では、以下の通り処理が別れる;
【0018】
▲1▼同一画像認識の場合、この領域の画像データをそのまま変換する。
【0019】
▲2▼類似画像認識の場合、この領域の画像データを正規化して利用する。正規化の方法は、x座標を32点の画素に正規化し、y座標をこれの縮尺に合わせ正規化する。ここで、正規化処理を説明したものが図2である。同図に示すように、まず、得られたビットマップ画像データ中から認識したい物体をマウスやデジタイザを用いて領域指定する。そして、指定領域の画像を正規化し、ビットマップ画像とする。
【0020】
▲3▼上記▲1▼と▲2▼の処理後、RGBにより構成されるビットマップ・データをグレー・スケール(256レベル、8bit相当)または、輝度信号Yに変換し、認識処理の高速化を計る。これらの処理終了後、後段の物体認識エンジン部へ入力する。この変換式は図3に示す通りである。
【0021】
(2).マウスやデジタイザ等による手描き画像から作成する方法
コンピュータ上で、マウスやデジタイザ等による入力機器を用い、認識したい物体を描き、これを以下の通り処理し効率のよい画像認識を行う場合であり、以下の処理を行う。
【0022】
▲1▼同一画像認識の場合、マウスやデジタイザで描画された画像データをそのまま利用する。
【0023】
▲2▼類似画像認識の場合、この描画された画像データを正規化して利用する。正規化の方法は、x座標を32点の画素に正規化し、y座標をこれの縮尺に合わせ正規化する。
【0024】
▲3▼上記▲1▼と▲2▼の処理後、グレー・スケール(256レベル、8bit相当)または、輝度信号Yに変換し、これをさらに2ビット相当に量子化し効率のよい認識処理を行う。このようにして量子化するためのデータは図10に示すような量子化テーブルとしてハードディスク装置のような記憶手段に記憶される。
【0025】
これらの処理終了後、変換されたデータは、後段の物体認識エンジン部へ入力する。
【0026】
図4は、マウスで「眼鏡」を描画し、この眼鏡を装着した人物を認識する場合の入力インターフェース部の処理例を示したものである。
【0027】
このように、本実施例では、与えられた自然画像に対し、手描き画像を用いて認識を効果的に行うことができる。
【0028】
ヒストグラムを用いた自然画像と手描き画像の典型的なモデルは、図11(各ヒストグラムと処理の流れを示した図)の通りとなる。
【0029】
たとえば、自然画像がガウス分布および白色ノイズ過程に帰結されるのに対し、手描き画像はそのキャンバス色(白色)とペン色(黒色)の2色程度の突出した分布を持つ。つまり、このままではその画像モデルが異なるため、後段の認識部で積算誤差が大きくなり、的確な認識処理が行われない。このため、2ビット相当の量子化器を用いて手描き画像データの正規化(つまり、ガウス分布に近付ける)を行うことで、後段の認識部で効果的に処理が可能となる。 実際の画像による処理の流れを図12に示す。
図12は、手描き画像データと自然画像でのヒストグラム分布の違いを示し、本処理により同一の分布モデルに近付けている例である。
また図12には参考として、自然画像のデータから「目」の特長情報を消したヒストグラム分布も示した。 このヒストグラムと本処理後の手描き画像のヒストグラム分布の間に類似性が出てきている点を観察する事ができる。
【0030】
(3).認識テンプレート画像から、その画像変形による複数のテンプレート画像を作成する方法
【0031】
この方法では、まず類似画像認識のための変形された複数のテンプレート画像を作成する。この変形された認識テンプレート画像も併用することにより、たとえば、物体正面画像と共に、横方向や上下方向から見た物体画像も認識可能となる
【0032】
変形テンプレート画像作成は、基本となる認識テンプレート画像に対し上下方向と左右方向に対し行われる。これにより、同一の物体画像に対し上下左右から見た画像に対しても的確に認識処理を行うことが可能となる
【0033】
認識用テンプレート画像を作成後に、類似物体画像(変形されたオブジェクトとしてモデル化)の認識も可能とするため以下の手順で認識用テンプレート画像を変形する。
【0034】
ここでは、以下の一般的に用いられている式から、類似画像認識のための変形されたテンプレート画像を作成する。
x = (( X − x0 ) COSθ − ( Y − y0 ) SINθ ) / a + x0
y = (( X − x0 ) SINθ − ( Y − y0 ) COSθ ) / b + y0
【0035】
上式では、任意の画像上の点(x0, y0)を中心にして横方向にa倍、縦方向にb倍の拡大・縮小処理を行う。 また、中心点(x0, y0)に対しθ回転も行うことができるが、縦横方向だけの処理の場合、θ=0で演算を行う。ここで、座標(x、y)が拡大・縮小された画像位置であるが、これに対応するもとの画像位置(X、Y)にある画素データを、そのまま拡大・縮小画素として利用する事ができる利点がある。
【0036】
この変形された認識テンプレート画像も併用することにより、たとえば、物体正面画像と共に、横方向や上下方向から見た物体画像も認識可能となる;
【0037】
図5は、変形画像テンプレート画像の作成方法を示す具体例である。
【0038】
同図では、基になる画像テンプレート画像を縦に4分割、横に4分割してから、各分割領域の縮尺を変えることでそれぞれの変形画像テンプレート画像を作成している。このとき、プログラム上では基になる画像テンプレート画像の縮尺および、各変形方向に対する縮尺はテーブルとして可変可能とする。
【0039】
このような、変形画像テンプレート画像を作成しておくことにより、たとえば、同一人物の顔画像が含まれている全ての画像ファイルを検索する場合、その人物の1画像を入力することにより、その人物が上下左右から写っている画像も検索可能となる。 これにより、検索するために複数のテンプレート画像を用意することなく、効率的な画像検索が可能となる。
【0040】
実際のプログラム上では基になる画像テンプレート画像の縮尺および、各変形方向に対する縮尺はテーブルとして可変可能である。また、ブロックの分割数も可変となる。
これは、コンピュータのCPU性能向上速度が早く、また複数のCPUを搭載したサーバ等も考慮されていることによる。実際の変形されたテンプレート画像例を図6に示す。同図では、基になる画像テンプレート画像を4分割し、それぞれの分割領域において縮尺率を変更している。すなわち、右図の場合、縮尺率は左側の領域から順番に、1.75→1.25→0.75→0.25となっている。このように変形させることにより、人物の正面からの顔写真画像しか与えられていなくても、当該人物が左方向または右方向に向いた顔の状態をテンプレート画像として用意することができる。
【0041】
(物体画像認識エンジン部)
物体認識エンジン部は、認識画像中の物体を種々のアルゴリズムに基づいて認識する機能部である。物体認識のアルゴリズムについては種々の公知技術があるのでここでは説明を省略する。
(被認識画像入力部)
被認識画像入力部は、認識対象となる画像データを入力するインターフェース部であり、ビットマップ画像入力部と、画像変換部とで構成されている。これらの各構成部は図1で説明した認識用画像テンプレート画像作成部におけるビットマップ画像入力部と画像変換部と同様であるので説明を省略する。
【0042】
次に、物体認識エンジンにおける検索方法について説明する。
物体認識エンジンは、認識画像テンプレート画像作成部からテンプレート画像データが、被認識画像入力部から被認識画像データが入力されると、この被認識画像データに対して物体認識のための検索処理を開始する。
【0043】
具体的な物体認識のための絞り込み方法としては、第1に、認識用テンプレート画像により検索された結果に対し、さらに新たな認識テンプレート画像を用いて絞り込み検索を行う手法、第2に、一度に2つ以上の異なった認識テンプレート画像を用い、効率的な絞り込み検索を行う手法とがある。たとえば、眼鏡をかけている男性を認識する場合において、眼鏡が認識のための主要なオブジェクトとなり、男女を見分けることがむすかしい場合がある。この場合、眼鏡と鼻および口といった顔の特徴を表すオブジェクトを併用することにより的確な物体画像認識が可能となる。
【0044】
以下、それぞれの手法について説明する。
(1).認識用テンプレート画像により検索された結果に対し、さらに新たな認識テンプレート画像を用い絞りみ検索を行う手法
【0045】
図12および図13に処理のフローチャートを示す。
【0046】
本方法では、まず、最初に読み込んだテンプレート画像を用い、類似画像と認識される全てのファイルをリストアップする
【0047】
次に、これらのリストアップされたファイル群に対し、別のテンプレート画像を用いることにより、絞り込み検索機能を実現する。
つまり、検索条件の論理和であり、(1項 AND 2項)の処理を行う。
【0048】
また、図13のフローチャートでは、何度でもAND項(論理積)を追加できる処理になっている。
【0049】
(2).一度に2つ以上の異なった認識テンプレート画像を用い、効率的な絞り込み検索を行う手法。
【0050】
図14および図15に処理のフローチャートを示す。
本方法は、一度に複数のテンプレート画像を用い、一括で絞り込み検索を行う手法であり、主に処理能力の高いCPU(Central Prosessing Unit)およびマルチプロセッサ型サーバを動作プラットフォームとして想定している。
【0051】
この方法では、最初にランダムに選択したテンプレート画像を基に、この物体画像にマッチングした画像に対し、残りのテンプレート画像とのマッチングを次々に行って行く。そして、全てのテンプレート画像に対しマッチングして被認識画像を検索結果として出力・表示するようになっている。
【0052】
以上述べたように、本実施例によれば、画像ファイルに限らず、マウスやデジタイザ等の手書き画像からも認識用テンプレート画像を作成できる。また、認識テンプレート画像から複数の変形テンプレート画像を作成しておくことにより、物体の大きさや角度が異なっていたとしても、 指定された被認識画像から、この被認識画像と本来同じものと見える変形された物体をも認識することが可能となる。
【発明の効果】
本発明によれば、被認識画像中からより精度の高い物体の認識を行うことが可能となる。
【図面の簡単な説明】
【図1】本発明のシステム構成を示す図
【図2】実施例においてビットマップ画像データに対して正規化処理行った場合の例を示す説明図
【図3】入力インターフェース部における画像変換の変換式
【図4】手書き描画に基づく処理を説明する図
【図5】変形画像テンプレート画像の作成方法を示す図
【図6】変形画像テンプレート画像の具体例を示す図
【図7】同一画像検索と類似画像検索におけるパラメータの適用関係を示す図
【図8】検索モード毎のテンプレートの適用関係を示す図
【図9】入力インターフェース部における量子化テーブルへの変換例を示す図
【図10】手書き描画の類似検索におけるヒストグラムと処理の流れを示した図
【図11】手書き描画の類似検索の概念を説明するための図
【図12】実施例の処理手順を示す概念図(1)
【図13】実施例の処理手順を示すフローチャート(1)
【図14】実施例の処理手順を示す概念図(2)
【図15】実施例の処理手順を示すフローチャート(2)
【発明の属する技術分野】
本発明は、画像中に表示された物体を認識するための技術に適用して有効な技術に関する。
【0002】
【従来の技術】
デジタル処理された写真画像データ中から物体を認識する従来技術としては、情報処理装置内にあらかじめ多数のテンプレート画像を用意しておき、パターンマッチング等の比較技術により、撮影された写真中の画像が特定の物体であると認識するものが一般的だった。
【0003】
この種の従来技術としてたとえば、特開2002?83297号公報がある。この先行技術では、画像処理と物体認識の精度を両立させるために、複数代のカメラを用いて物体を撮影し、これらのカメラの位置状態に基づいて3次元処理を行い当該物体を把握するものだった。
【0004】
【発明が解決しようとする課題】
ところで、前記のような従来技術は、複数のカメラを用いることにより三次元処理を効率的に行うことができるものの、物体の認識については、画像中から特徴点を見いだして、あらかじめ記憶しているパターンを照合する方式であるため、比較画像間の誤差を尺度として認識を行わざるを得なかった。
【0005】
そのため、これらの従来技術では、被認識対象データ中の対象物(オブジェクト)の大きさや傾きが異なっていると正確な物体認識ができないという問題があった。
【0006】
たとえば、特定の個人を認識したい場合、テンプレート画像は正面からの顔写真であり、オブジェクトは横顔の写真であるような場合、認識が困難であった。
【0007】
本発明は、このような従来技術に鑑みてなされたものであり、テンプレート画像に対して変形されたオブジェクトであっても認識可能な物体認識技術を提供することを技術的課題とする。
【0008】
【課題を解決するための手段】
本発明は、第1に、手書き入力画像をテンプレート画像として被認識画像と比較するものである。すなわち、座標指示入力装置からの手書き画像データを入力してこれを正規化し、前記で入力されたままの手書き画像データまたは前記で正規化された手書き画像データをグレースケール化または輝度信号化してこれを量子化したものをテンプレート画像とし、このテンプレート画像を別途入力された被認識画像と比較するものである。このような処理を実行することにより、たとえばユーザがマウス等で眼鏡を描いた場合にもこの眼鏡を特徴点として画像中の眼鏡をかけた人物の特定が可能となる。
【0009】
また、本発明は、第2に、認識画像を読み込んで、類似物体認識のために当該認識画像を縦または横方向に分割し、前記分割領域毎に異なる縮尺率で認識画像を変換し、類似物体認識用の複数のテンプレート画像とするものである。テンプレート画像が正面から撮影された顔写真のみである場合、被認識画像中の正面顔は認識可能であるが、同一人物であっても横顔である場合には認識が困難となる。この点について本発明では分割領域毎に縮尺率を変化させて画像を変換し、正面からの顔写真のみが与えられている場合であっても右横、左横、斜め上、斜め下方向からの顔写真をテンプレート画像として生成できる。そのため、複数のカメラ画像を用いることなく同一物体の認識精度を高めることができる。
より具体的には、認識画像を類似物体認識のために当該認識画像を縦または横方向に分割し、この分割領域毎に以下の式に基づいて元画像の縮尺率を決定し、領域毎の画像変換を実行し、
x = (( X − x0 ) COSθ − ( Y − y0 ) SINθ ) / a + x0
y = (( X − x0 ) SINθ − ( Y − y0 ) COSθ ) / b + y0
(ただし、画像上の任意の点x0,y0を中心として横方向にa倍、縦方向にb倍したものとする。
前記変換後の複数のテンプレート画像を生成して、これら複数のテンプレート画像を別途入力された被認識画像と比較するようにした。上記式において、座標(x、y)が拡大・縮小された画像位置であるが、これに対応するもとの画像位置(X、Y)にある画素データを、そのまま拡大・縮小画素として利用する事ができる利点がある。
【0010】
さらに、本発明は、第3に、被認識画像に対して、複数のテンプレート画像を用いて段階的に絞り込みを行ったり、同時に複数のテンプレート画像を用いて比較処理を行うことにより、物体認識処理の高速化・高効率化を実現することができる。
【0011】
【発明の実施の形態】
【実施例】
以下、図面に基づいて、本発明の実施の形態を説明する。
【0012】
図1は、本発明のシステム構成を示している。本システムは同図に示すように、認識画像テンプレート画像作成部と被認識画像入力部とからなる入力インターフェース部と、物体画像認識エンジン部とで構成されている。
【0013】
本システムは、汎用のパーソナルコンピュータ等で実現することができ、入力装置としては、マウスまたはデジタイザ等の座標入力手段、またはキーボード等を用いることができる。また、記憶手段としてはハードディスク装置を備えており、この記憶手段内に、認識画像、被認識画像および本実施例の機能を実現するための各種プログラムが格納されている。
【0014】
(認識画像テンプレート画像作成部)
認識画像テンプレート画像作成部は、マウスまたはデジタイザから座標入力された図形または、記憶手段内の認識画像(画像ファイルまたは画像ソース)を入力するようになっており、機能部としては、ビットマップ画像入力部と、画像変換部と、2ビット相当量子化器と、テンプレート画像展開部とで構成されている。
【0015】
ここで、ビットマップ画像入力部は、上記で入力された画像データをコンピュータ上で扱える様、ビットマップ・データ(RGBのカラーデータ)に変換し、さらに効率のよい認識処理のためにグレー・スケール(256レベル、8bit相当)または、輝度信号Yに変換する。このようにして変換された画像データが、検索対象画像として後段の物体画像認識エンジン部に渡され、認識処理されるようになっている。
【0016】
ところで、認識用テンプレート画像を、画像ファイルまたは画像ソースより作成する方法としては以下の3通りがある。
(1).画像ファイルや画像ソースから作成する方法
(2).マウスやデジタイザ等による手描き画像から作成する方法
(3).認識テンプレート画像から、その画像変形による複数のテンプレート画像を作成する方法
【0017】
以下、それぞれの方法について説明する。
(1).画像ファイルや画像ソースから作成する方法
画像データをコンピュータ上で扱える様にするため、当該画像データをビットマップ・データに変換し、マウスやデジタイザ等による入力機器を用い、認識したい物体の領域を指定する。そして、さらに効率のよい認識処理のためにグレー・スケール(256レベル、8bit相当)または、輝度信号Yに変換する。ここで、同一画像認識の場合と類似が像認識の場合では、以下の通り処理が別れる;
【0018】
▲1▼同一画像認識の場合、この領域の画像データをそのまま変換する。
【0019】
▲2▼類似画像認識の場合、この領域の画像データを正規化して利用する。正規化の方法は、x座標を32点の画素に正規化し、y座標をこれの縮尺に合わせ正規化する。ここで、正規化処理を説明したものが図2である。同図に示すように、まず、得られたビットマップ画像データ中から認識したい物体をマウスやデジタイザを用いて領域指定する。そして、指定領域の画像を正規化し、ビットマップ画像とする。
【0020】
▲3▼上記▲1▼と▲2▼の処理後、RGBにより構成されるビットマップ・データをグレー・スケール(256レベル、8bit相当)または、輝度信号Yに変換し、認識処理の高速化を計る。これらの処理終了後、後段の物体認識エンジン部へ入力する。この変換式は図3に示す通りである。
【0021】
(2).マウスやデジタイザ等による手描き画像から作成する方法
コンピュータ上で、マウスやデジタイザ等による入力機器を用い、認識したい物体を描き、これを以下の通り処理し効率のよい画像認識を行う場合であり、以下の処理を行う。
【0022】
▲1▼同一画像認識の場合、マウスやデジタイザで描画された画像データをそのまま利用する。
【0023】
▲2▼類似画像認識の場合、この描画された画像データを正規化して利用する。正規化の方法は、x座標を32点の画素に正規化し、y座標をこれの縮尺に合わせ正規化する。
【0024】
▲3▼上記▲1▼と▲2▼の処理後、グレー・スケール(256レベル、8bit相当)または、輝度信号Yに変換し、これをさらに2ビット相当に量子化し効率のよい認識処理を行う。このようにして量子化するためのデータは図10に示すような量子化テーブルとしてハードディスク装置のような記憶手段に記憶される。
【0025】
これらの処理終了後、変換されたデータは、後段の物体認識エンジン部へ入力する。
【0026】
図4は、マウスで「眼鏡」を描画し、この眼鏡を装着した人物を認識する場合の入力インターフェース部の処理例を示したものである。
【0027】
このように、本実施例では、与えられた自然画像に対し、手描き画像を用いて認識を効果的に行うことができる。
【0028】
ヒストグラムを用いた自然画像と手描き画像の典型的なモデルは、図11(各ヒストグラムと処理の流れを示した図)の通りとなる。
【0029】
たとえば、自然画像がガウス分布および白色ノイズ過程に帰結されるのに対し、手描き画像はそのキャンバス色(白色)とペン色(黒色)の2色程度の突出した分布を持つ。つまり、このままではその画像モデルが異なるため、後段の認識部で積算誤差が大きくなり、的確な認識処理が行われない。このため、2ビット相当の量子化器を用いて手描き画像データの正規化(つまり、ガウス分布に近付ける)を行うことで、後段の認識部で効果的に処理が可能となる。 実際の画像による処理の流れを図12に示す。
図12は、手描き画像データと自然画像でのヒストグラム分布の違いを示し、本処理により同一の分布モデルに近付けている例である。
また図12には参考として、自然画像のデータから「目」の特長情報を消したヒストグラム分布も示した。 このヒストグラムと本処理後の手描き画像のヒストグラム分布の間に類似性が出てきている点を観察する事ができる。
【0030】
(3).認識テンプレート画像から、その画像変形による複数のテンプレート画像を作成する方法
【0031】
この方法では、まず類似画像認識のための変形された複数のテンプレート画像を作成する。この変形された認識テンプレート画像も併用することにより、たとえば、物体正面画像と共に、横方向や上下方向から見た物体画像も認識可能となる
【0032】
変形テンプレート画像作成は、基本となる認識テンプレート画像に対し上下方向と左右方向に対し行われる。これにより、同一の物体画像に対し上下左右から見た画像に対しても的確に認識処理を行うことが可能となる
【0033】
認識用テンプレート画像を作成後に、類似物体画像(変形されたオブジェクトとしてモデル化)の認識も可能とするため以下の手順で認識用テンプレート画像を変形する。
【0034】
ここでは、以下の一般的に用いられている式から、類似画像認識のための変形されたテンプレート画像を作成する。
x = (( X − x0 ) COSθ − ( Y − y0 ) SINθ ) / a + x0
y = (( X − x0 ) SINθ − ( Y − y0 ) COSθ ) / b + y0
【0035】
上式では、任意の画像上の点(x0, y0)を中心にして横方向にa倍、縦方向にb倍の拡大・縮小処理を行う。 また、中心点(x0, y0)に対しθ回転も行うことができるが、縦横方向だけの処理の場合、θ=0で演算を行う。ここで、座標(x、y)が拡大・縮小された画像位置であるが、これに対応するもとの画像位置(X、Y)にある画素データを、そのまま拡大・縮小画素として利用する事ができる利点がある。
【0036】
この変形された認識テンプレート画像も併用することにより、たとえば、物体正面画像と共に、横方向や上下方向から見た物体画像も認識可能となる;
【0037】
図5は、変形画像テンプレート画像の作成方法を示す具体例である。
【0038】
同図では、基になる画像テンプレート画像を縦に4分割、横に4分割してから、各分割領域の縮尺を変えることでそれぞれの変形画像テンプレート画像を作成している。このとき、プログラム上では基になる画像テンプレート画像の縮尺および、各変形方向に対する縮尺はテーブルとして可変可能とする。
【0039】
このような、変形画像テンプレート画像を作成しておくことにより、たとえば、同一人物の顔画像が含まれている全ての画像ファイルを検索する場合、その人物の1画像を入力することにより、その人物が上下左右から写っている画像も検索可能となる。 これにより、検索するために複数のテンプレート画像を用意することなく、効率的な画像検索が可能となる。
【0040】
実際のプログラム上では基になる画像テンプレート画像の縮尺および、各変形方向に対する縮尺はテーブルとして可変可能である。また、ブロックの分割数も可変となる。
これは、コンピュータのCPU性能向上速度が早く、また複数のCPUを搭載したサーバ等も考慮されていることによる。実際の変形されたテンプレート画像例を図6に示す。同図では、基になる画像テンプレート画像を4分割し、それぞれの分割領域において縮尺率を変更している。すなわち、右図の場合、縮尺率は左側の領域から順番に、1.75→1.25→0.75→0.25となっている。このように変形させることにより、人物の正面からの顔写真画像しか与えられていなくても、当該人物が左方向または右方向に向いた顔の状態をテンプレート画像として用意することができる。
【0041】
(物体画像認識エンジン部)
物体認識エンジン部は、認識画像中の物体を種々のアルゴリズムに基づいて認識する機能部である。物体認識のアルゴリズムについては種々の公知技術があるのでここでは説明を省略する。
(被認識画像入力部)
被認識画像入力部は、認識対象となる画像データを入力するインターフェース部であり、ビットマップ画像入力部と、画像変換部とで構成されている。これらの各構成部は図1で説明した認識用画像テンプレート画像作成部におけるビットマップ画像入力部と画像変換部と同様であるので説明を省略する。
【0042】
次に、物体認識エンジンにおける検索方法について説明する。
物体認識エンジンは、認識画像テンプレート画像作成部からテンプレート画像データが、被認識画像入力部から被認識画像データが入力されると、この被認識画像データに対して物体認識のための検索処理を開始する。
【0043】
具体的な物体認識のための絞り込み方法としては、第1に、認識用テンプレート画像により検索された結果に対し、さらに新たな認識テンプレート画像を用いて絞り込み検索を行う手法、第2に、一度に2つ以上の異なった認識テンプレート画像を用い、効率的な絞り込み検索を行う手法とがある。たとえば、眼鏡をかけている男性を認識する場合において、眼鏡が認識のための主要なオブジェクトとなり、男女を見分けることがむすかしい場合がある。この場合、眼鏡と鼻および口といった顔の特徴を表すオブジェクトを併用することにより的確な物体画像認識が可能となる。
【0044】
以下、それぞれの手法について説明する。
(1).認識用テンプレート画像により検索された結果に対し、さらに新たな認識テンプレート画像を用い絞りみ検索を行う手法
【0045】
図12および図13に処理のフローチャートを示す。
【0046】
本方法では、まず、最初に読み込んだテンプレート画像を用い、類似画像と認識される全てのファイルをリストアップする
【0047】
次に、これらのリストアップされたファイル群に対し、別のテンプレート画像を用いることにより、絞り込み検索機能を実現する。
つまり、検索条件の論理和であり、(1項 AND 2項)の処理を行う。
【0048】
また、図13のフローチャートでは、何度でもAND項(論理積)を追加できる処理になっている。
【0049】
(2).一度に2つ以上の異なった認識テンプレート画像を用い、効率的な絞り込み検索を行う手法。
【0050】
図14および図15に処理のフローチャートを示す。
本方法は、一度に複数のテンプレート画像を用い、一括で絞り込み検索を行う手法であり、主に処理能力の高いCPU(Central Prosessing Unit)およびマルチプロセッサ型サーバを動作プラットフォームとして想定している。
【0051】
この方法では、最初にランダムに選択したテンプレート画像を基に、この物体画像にマッチングした画像に対し、残りのテンプレート画像とのマッチングを次々に行って行く。そして、全てのテンプレート画像に対しマッチングして被認識画像を検索結果として出力・表示するようになっている。
【0052】
以上述べたように、本実施例によれば、画像ファイルに限らず、マウスやデジタイザ等の手書き画像からも認識用テンプレート画像を作成できる。また、認識テンプレート画像から複数の変形テンプレート画像を作成しておくことにより、物体の大きさや角度が異なっていたとしても、 指定された被認識画像から、この被認識画像と本来同じものと見える変形された物体をも認識することが可能となる。
【発明の効果】
本発明によれば、被認識画像中からより精度の高い物体の認識を行うことが可能となる。
【図面の簡単な説明】
【図1】本発明のシステム構成を示す図
【図2】実施例においてビットマップ画像データに対して正規化処理行った場合の例を示す説明図
【図3】入力インターフェース部における画像変換の変換式
【図4】手書き描画に基づく処理を説明する図
【図5】変形画像テンプレート画像の作成方法を示す図
【図6】変形画像テンプレート画像の具体例を示す図
【図7】同一画像検索と類似画像検索におけるパラメータの適用関係を示す図
【図8】検索モード毎のテンプレートの適用関係を示す図
【図9】入力インターフェース部における量子化テーブルへの変換例を示す図
【図10】手書き描画の類似検索におけるヒストグラムと処理の流れを示した図
【図11】手書き描画の類似検索の概念を説明するための図
【図12】実施例の処理手順を示す概念図(1)
【図13】実施例の処理手順を示すフローチャート(1)
【図14】実施例の処理手順を示す概念図(2)
【図15】実施例の処理手順を示すフローチャート(2)
Claims (10)
- 座標指示入力装置からの手書き画像データを入力し、
前記手書き画像データを正規化し、
前記で入力されたままの手書き画像データまたは前記で正規化された手書き画像データをグレースケール化または輝度信号化し、
前記グレースケール化信号または輝度信号を量子化したものをテンプレート画像とし、
前記テンプレート画像を別途入力された被認識画像と比較することにより物体認識を行う画像中の物体認識方法。 - 認識画像を読み込んで、類似物体認識のために当該認識画像を縦または横方向に分割し、前記分割領域毎に異なる縮尺率で認識画像を変換し、類似物体認識用の複数のテンプレート画像とし、
前記複数のテンプレート画像を別途入力された被認識画像と比較することにより物体認識を行う画像中の物体認識方法。 - 認識画像を読み込んで、類似物体認識のために、当該認識画像を以下の式に基づいて拡大または縮小処理を行い、
x = (( X − x0 ) COSθ − ( Y − y0 ) SINθ ) / a + x0
y = (( X − x0 ) SINθ − ( Y − y0 ) COSθ ) / b + y0
(ただし、画像上の任意の点x0,y0を中心として横方向にa倍、縦方向にb倍したものとする)
該拡大または縮小処理した類似物体認識用の複数のテンプレート画像を用意し、
前記複数のテンプレート画像を別途入力された被認識画像と比較することにより物体認識を行う画像中の物体認識方法。 - 第1のテンプレート画像と被認識画像とを比較して物体認識の候補を索出し、
さらに第2のテンプレート画像と前記被認識画像とを比較して絞り込み検索を行う画像中の物体認識方法。 - 少なくとも2以上のテンプレート画像と被認識画像とを比較して物体認識を行う画像中の物体認識方法。
- 被認識画像中の物体を認識するコンピュータ実行可能なプログラムであって、
座標指示入力装置からの手書き画像データを入力し、
前記手書き画像データを正規化し、
前記で入力されたままの手書き画像データまたは前記で正規化された手書き画像データをグレースケール化または輝度信号化し、
前記グレースケール化信号または輝度信号を量子化したものをテンプレート画像とし、
前記テンプレート画像を別途入力された被認識画像と比較することにより物体認識を行うコンピュータ実行可能なプログラム。 - 読み込まれた認識画像からテンプレート画像を生成し、当該テンプレート画像を別途入力された被認識画像と比較することにより被認識画像中の物体を認識するコンピュータ実行可能なプログラムであって、
認識画像を読み込むステップと、
前記認識画像を類似物体認識のために当該認識画像を縦または横方向に分割するステップと、
前記分割された認識画像の分割領域毎に異なる縮尺率で当該領域画像を変換するステップと、
前記分割領域毎に前記とは異なる縮尺率で当該領域画像を変換するステップと、
前記分割領域毎に縮尺率を変更した画像を2以上のテンプレート画像とし、
これらのテンプレート画像を別途入力された被認識画像と比較するステップとからなるコンピュータ実行可能なプログラム。 - 読み込まれた認識画像からテンプレート画像を生成し、当該テンプレート画像を別途入力された被認識画像と比較することにより被認識画像中の物体を認識するコンピュータ実行可能なプログラムであって、
前記認識画像を類似物体認識のために当該認識画像を縦または横方向に分割するステップと、
前記分割領域毎に以下の式に基づいて元画像の縮尺率を決定し、領域毎の画像変換を実行するステップと、
x = (( X − x0 ) COSθ − ( Y − y0 ) SINθ ) / a + x0
y = (( X − x0 ) SINθ − ( Y − y0 ) COSθ ) / b + y0
(ただし、画像上の任意の点x0,y0を中心として横方向にa倍、縦方向にb倍したものとする)
前記変換後の複数のテンプレート画像を生成するステップと、
前記複数のテンプレート画像を別途入力された被認識画像と比較するステップとからなるコンピュータ実行可能なプログラム。 - 読み込まれた認識画像からテンプレート画像を生成し、当該テンプレート画像を別途入力された被認識画像と比較することにより被認識画像中の物体を認識する物体認識装置であって、
認識画像を読み込む手段と、
前記認識画像を類似物体認識のために当該認識画像を縦または横方向に分割する手段と、
前記分割された認識画像の分割領域毎に異なる縮尺率で当該領域画像を変換する手段と、
前記分割領域毎に前記とは異なる縮尺率で当該領域画像を変換する手段と、
前記分割領域毎に縮尺率を変更した画像を2以上のテンプレート画像を生成する手段と、
これらのテンプレート画像を別途入力された被認識画像と比較する手段とからなる物体認識装置。 - 読み込まれた認識画像からテンプレート画像を生成し、当該テンプレート画像を別途入力された被認識画像と比較することにより被認識画像中の物体を認識するコンピュータ実行可能なプログラムであって、
認識画像を読み込むステップと、
前記認識画像を類似物体認識のために当該認識画像を縦または横方向に分割するステップと、
前記分割された認識画像の分割領域毎に異なる縮尺率で当該領域画像を変換するステップと、
前記分割領域毎に前記とは異なる縮尺率で当該領域画像を変換するステップと、
前記分割領域毎に縮尺率を変更した画像を2以上のテンプレート画像とし、
これらのテンプレート画像を別途入力された被認識画像と比較するステップとからなるプログラムを記憶したコンピュータ実行可能な媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002163062A JP2004013319A (ja) | 2002-06-04 | 2002-06-04 | 画像中の物体認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002163062A JP2004013319A (ja) | 2002-06-04 | 2002-06-04 | 画像中の物体認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004013319A true JP2004013319A (ja) | 2004-01-15 |
Family
ID=30431637
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002163062A Pending JP2004013319A (ja) | 2002-06-04 | 2002-06-04 | 画像中の物体認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004013319A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1317673C (zh) * | 2004-03-18 | 2007-05-23 | 致伸科技股份有限公司 | 利用神经网络分辨影像中文字与图形的系统及其方法 |
JP2013018406A (ja) * | 2011-07-12 | 2013-01-31 | Fujitsu Ten Ltd | 駐車枠の認識装置、駐車枠の認識方法、及び、プログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0944685A (ja) * | 1995-07-28 | 1997-02-14 | Mitsubishi Electric Corp | 顔画像処理装置 |
JPH10162118A (ja) * | 1996-11-29 | 1998-06-19 | Canon Inc | 画像処理装置及び方法 |
JP2000215319A (ja) * | 1999-01-22 | 2000-08-04 | Canon Inc | 画像抽出方法及び装置並びに記憶媒体 |
-
2002
- 2002-06-04 JP JP2002163062A patent/JP2004013319A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0944685A (ja) * | 1995-07-28 | 1997-02-14 | Mitsubishi Electric Corp | 顔画像処理装置 |
JPH10162118A (ja) * | 1996-11-29 | 1998-06-19 | Canon Inc | 画像処理装置及び方法 |
JP2000215319A (ja) * | 1999-01-22 | 2000-08-04 | Canon Inc | 画像抽出方法及び装置並びに記憶媒体 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1317673C (zh) * | 2004-03-18 | 2007-05-23 | 致伸科技股份有限公司 | 利用神经网络分辨影像中文字与图形的系统及其方法 |
JP2013018406A (ja) * | 2011-07-12 | 2013-01-31 | Fujitsu Ten Ltd | 駐車枠の認識装置、駐車枠の認識方法、及び、プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109359538B (zh) | 卷积神经网络的训练方法、手势识别方法、装置及设备 | |
Ban et al. | Face detection based on skin color likelihood | |
Wang et al. | 3D facial expression recognition based on primitive surface feature distribution | |
KR101007276B1 (ko) | 3차원 안면 인식 | |
US6975750B2 (en) | System and method for face recognition using synthesized training images | |
Huang et al. | Biologically inspired features for scene classification in video surveillance | |
US7643683B2 (en) | Generation of image database for multifeatured objects | |
Li et al. | A comprehensive survey on 3D face recognition methods | |
JP2003323622A (ja) | 画像認識システム及びその認識方法並びにプログラム | |
JP2003346162A (ja) | 手の画像認識による入力システム | |
Islam et al. | A review of recent advances in 3D ear-and expression-invariant face biometrics | |
CN110991258B (zh) | 一种人脸融合特征提取方法及系统 | |
CN106909895B (zh) | 一种基于随机投影多核学习的手势识别方法 | |
JPWO2010104181A1 (ja) | 特徴点生成システム、特徴点生成方法および特徴点生成プログラム | |
Stiene et al. | Contour-based object detection in range images | |
Zhou et al. | Shape-appearance-correlated active appearance model | |
Reddy et al. | Face recognition based on cross diagonal complete motif matrix | |
Zarkasi et al. | Face movement detection using template matching | |
Rosato et al. | Automatic registration of vertex correspondences for 3D facial expression analysis | |
Pradhan et al. | A hand gesture recognition using feature extraction | |
Abid et al. | Dynamic hand gesture recognition from Bag-of-Features and local part model | |
Ayinde et al. | Region-based face detection | |
Curran et al. | The use of neural networks in real-time face detection | |
JP2004013319A (ja) | 画像中の物体認識方法 | |
CN111553195B (zh) | 基于多位图切平面与多尺度uLBP的三维人脸遮挡判别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040727 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060919 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070130 |