JP2005004612A - 画像認識装置 - Google Patents
画像認識装置 Download PDFInfo
- Publication number
- JP2005004612A JP2005004612A JP2003169264A JP2003169264A JP2005004612A JP 2005004612 A JP2005004612 A JP 2005004612A JP 2003169264 A JP2003169264 A JP 2003169264A JP 2003169264 A JP2003169264 A JP 2003169264A JP 2005004612 A JP2005004612 A JP 2005004612A
- Authority
- JP
- Japan
- Prior art keywords
- partial
- similarity
- partial area
- model
- image recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】認識対象をより好適に認識することのできる画像認識装置を提供する。
【解決手段】画像入力部1から取り込まれる入力画像とモデル特徴記憶装置4に記憶されているモデルとについて、これらを分割した各部分領域の類似度が部分領域類似度算出装置5にて算出される。詳しくは、入力画像の所定の部分領域と該所定の部分領域に近接する部分領域との相対的な幾何学特性と、モデルについての所定の部分領域と該所定の部分領域に近接する部分領域との相対的な幾何学特性との類似度が算出される。そして、認識部7では、この類似度の算出結果に基づいてモデルの表記する物体と入力画像とが一致するか否かを認識する。
【選択図】 図1
【解決手段】画像入力部1から取り込まれる入力画像とモデル特徴記憶装置4に記憶されているモデルとについて、これらを分割した各部分領域の類似度が部分領域類似度算出装置5にて算出される。詳しくは、入力画像の所定の部分領域と該所定の部分領域に近接する部分領域との相対的な幾何学特性と、モデルについての所定の部分領域と該所定の部分領域に近接する部分領域との相対的な幾何学特性との類似度が算出される。そして、認識部7では、この類似度の算出結果に基づいてモデルの表記する物体と入力画像とが一致するか否かを認識する。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、認識対象となる画像から抽出された輪郭及び該輪郭によって複数に分割された部分領域と、特定の物体の分割された領域である部分領域及びそれら各部分領域間の結合関係を示すモデルとに基づき、認識対象と物体とが一致するか否かを認識する画像認識装置に関する。
【0002】
【従来の技術】
画像認識技術の分野においては、物体についてのモデルと画像から抽出された特徴との間のマッチングに基づき画像を認識するモデルベーストビジョンが周知である。このモデルベーストビジョンとしては、物体を部分的な特徴とその結合関係としてモデル化し、そのモデルを使って物体を認識するものがある(特許文献1)。このように複数の部分特徴に分割されたモデルを用い、画像から抽出された部分特徴とモデルの部分特徴との対応関係の決定に基づいて画像を認識することができる。
【0003】
ここで、画像から抽出された部分特徴とモデルの部分特徴との対応関係を決定するパターンマッチングを行う技術としては、例えば下記非特許文献1に見られるように、ニューラルネットワークを用いたものがある。すなわち、生態における形態視機能の基本単位となるコラム構造をニューラルネットワークにより構成し、画像中の複数の部分特徴のそれぞれに反応する層により抽出された部分特徴に基づき画像を認識する。この手法によれば、顔画像についての様々なバリエーションに対し、「80%」以上の精度で顔となる領域を正しく抽出することができる。
【0004】
【特許文献1】
特開平8−212329号公報
【非特許文献1】
丹内 哲也、萩原 将文、「形態視系の情報処理に基づく多重構造ニューラルネットワーク」、電子情報通信学会論文誌、D−II、No.4 pp694−702、1999年4月
【0005】
【発明が解決しようとする課題】
ところで、上記文献のニューラルネットワークを用いた手法では、大きさに対して2割程度の変化しか許容せず、画像の大きさの変化に対するロバスト性が低いという問題がある。また、ニューラルネットワークでは、最適な解を学習によって求めることが困難であり、最適な解から離間した解を学習しやすいという問題もある。更に、ニューラルネットワークでは、所望とする入力と出力との関係を学習させるものであり、ネットワーク内部の処理についてはブラックボックスとなるため、動きや変化などの情報をシステム設計者の意図に併せて設計することは困難となる。
【0006】
本発明は、こうした実情に鑑みてなされたものであり、その目的は、認識対象をより好適に認識することのできる画像認識装置を提供することにある。
【0007】
【課題を解決するための手段】
こうした目的を達成すべく、請求項1記載の画像認識装置では、前記物体と前記認識対象とが一致するか否かを認識するに際し、前記認識対象の所定の部分領域と該所定の部分領域に近接する部分領域との相対的な幾何学特性と、前記モデルについての所定の部分領域と該所定の部分領域に近接する部分領域との相対的な幾何学特性とに基づいて前記モデルの所定の部分領域と前記認識対象の所定の部分領域との類似度を求め、該求めた類似度に基づいて前記物体と前記認識対象とが一致するか否かを認識する認識手段を備えるようにした。
【0008】
このように物体と認識対象とが一致するか否かを認識するに際し、モデルと認識対象との部分領域同士の類似度を求めるようにすることで、モデルと認識対象との類似度を直接的に求める場合と比較して演算負荷を低減することができる。また、この際、所定の部分領域と該所定の部分領域に近接する部分領域との相対的な幾何学特性を用いるため、画像の傾きや測定距離の変化等による認識対象の回転や大きさの変化等に対するロバスト性を確保することができる。したがって、認識対象と物体との一致、不一致の認識についても画像の傾きや測定距離の変化等による認識対象の回転や大きさの変化等に対するロバスト性を確保することができる。したがって、上記構成によれば、認識対象をより好適に認識することができるようになる。
【0009】
また、請求項2記載の画像認識装置では、前記類似度に基づいて前記物体と前記認識対象とが一致するか否かを認識する基準にかかるデータが、明確に指定された記憶領域に記憶されてなるようにした。
【0010】
これにより、上記類似度に基づいて物体と認識対象とが一致するか否かを認識する際の基準を、特定の物体の変形に対する該物体の所定の部分領域と該所定の部分領域に近接する部分領域との相対的な幾何学特性の変化に基づいて任意に設定することができる。このため、ニューラルネットワークの学習による場合と比較して、上記基準を設計者の意図に併せて簡易に設定することができるようになる。
【0011】
また、請求項3記載の画像認識装置では、前記認識手段が、前記認識対象の各部分領域とこれに近接する任意の部分領域との相対的な幾何学特性のうち、前記モデルの各部分領域とこれに近接する予め定められた部分領域との相対的な幾何学特性のそれぞれと類似度の高い複数の候補をそれぞれ抽出し、前記モデルの各部分領域のそれぞれについての前記複数の候補のいずれか1つずつからなる各部分領域間の前記幾何学特性と、前記モデルの各部分領域間の前記幾何学特性との類似度に基づいて前記物体と前記認識対象とが一致するか否かを認識するようにした。
【0012】
これにより、複数の候補の数を適宜制限することで、物体と認識対象とが一致するか否かを認識する際に用いる類似度の算出量を低減させることができるようになる。
【0013】
また、請求項4記載の画像認識装置では、前記認識手段が、前記モデルの部分領域のうちの一部について、これらと類似度の高い前記認識対象の部分領域の複数の候補をそれぞれ抽出する処理と、前記モデルの残りの部分領域と対応する前記認識対象の部分領域を前記抽出された候補に基づいて推論するとともに、該推論によって取得された部分領域について該部分領域とこれに近接する部分領域との相対的な幾何学特性と、前記取得された部分領域に対応する前記モデルの部分領域とこれに近接する部分領域との相対的な幾何学特性との類似度を求める処理とを行うようにした。
【0014】
上記構成では、「モデルの部分領域の一部」の数や、「複数の候補」の数を適宜制限することで、物体と認識対象とが一致するか否かを認識する際に用いる類似度の算出量を低減させることができるようになる。
【0015】
また、請求項5記載の画像認識装置では、前記相対的な幾何学特性が、所定の部分領域と該所定の部分領域に近接する部分領域との間の距離、及びこれらの間の大小関係、及びこれらの間を結ぶ線と予め定められた基準となる線との間の角度の少なくとも1つに関するものを含むようにした。
【0016】
これにより、上記相対的な幾何学特性を簡易に定量化することができるようになる。
また、請求項6記載の画像認識装置では、前記類似度が、複数の相対的な幾何学特性のそれぞれについての類似度を定量化した値毎に所定の重みを付加したものの和として求められるようにした。
【0017】
このように複数の相対的な幾何学特性を用いることで、類似度をより信頼性の高い値として定量化することができるようになる。しかも、この際、各相対的な幾何学特性毎に所定の重みを付加することで、物体の変形に対する物体の所定の部分領域と該所定の部分領域に近接する部分領域との相対的な幾何学特性の変化度合いが、各特性毎に異なる場合であれ、これを適切に反映させることができるようになる。
【0018】
また、請求項7記載の画像認識装置では、前記所定の重みが、明確に指定された記憶領域に記憶されてなるようにした。
これにより、所定の重みを、特定の物体の変形に対する該物体の所定の部分領域と該所定の部分領域に近接する部分領域との相対的な幾何学特性毎の変化度合いに基づいて任意に設定することができるようになる。このように上記重みを任意に設定することができるために、換言すればニューラルネットワークの学習によらず設定するために、物体と認識対象とが一致するか否かを認識する基準を設計者の意図に併せて簡易に設定することができるようになる。
【0019】
また、請求項8記載の画像認識装置では、前記認識手段によって求められた前記モデルの部分領域と前記認識対象の部分領域との類似度に基づき、前記画像から抽出された輪郭及び該輪郭によって複数に分割された部分領域の少なくとも一方を変更する手段を更に備えるようにした。
【0020】
モデルの部分領域と前記認識対象の部分領域との類似度が低い場合、物体と認識対象とが一致しない可能性の他、認識対象となる物体から抽出された輪郭や同輪郭による物体の部分領域への分割態様が不適切な可能性もある。
【0021】
この点、上記構成では、画像から抽出された輪郭及び該輪郭によって複数に分割された部分領域の少なくとも一方を変更する手段を備えることで、物体と認識対象とが一致するか否かの認識をより高精度に行うことができるようになる。
【0022】
また、請求項9記載の画像認識装置では、前記認識手段が、前記モデルの部分領域と前記認識対象の部分領域との類似度を、これら部分領域が互いに一致する旨を示す同一、該部分領域が互いに相違する旨を示す不一致、該部分領域が互いに一致するか不一致であるかを判断できない旨を示す不定、該部分領域が互いに一致するか否かの判断を保留する旨を示す保留の4段階に区分する機能を有するようにした。
【0023】
これにより、認識対象が特性の物体に一致するか否かの認識を行う際、これらの部分領域毎の類似度について同一、不一致、不定、保留の4段階の情報を用いることができ、上記認識にかかる処理の自由度を向上させることができるようになる。また、同一、不一致、不定、保留の4段階の情報を外部に出力可能とするなら、部分領域の類似度について詳細な情報を外部に提供することもできる。
【0024】
また、請求項10記載の画像認識装置では、前記認識手段が、所定の部分領域について前記保留である旨判断するとき、前記モデルの他の部分領域と前記認識対象の他の部分領域との類似度に基づいて前記保留とされている部分領域が互いに一致するか否かを判断するようにした。
【0025】
特定の物体を構成する所定の部分領域は、同物体内の他の部分領域とその幾何学的な配置が略固定されている等、同他の部分領域と相関を有する。
この点、上記構成では、所定の部分領域について保留である旨判断された場合であれ、この所定の部分領域同士が一致するか否かを判断することができるようになる。
【0026】
また、請求項11記載の画像認識装置では、前記認識手段が、前記保留である旨判断したとき、対応する前記モデルの部分領域を複数の領域に分割した詳細な部分領域と、対応する前記認識対象の部分領域を複数の領域に分割した詳細な部分領域とについての前記相対的な幾何学特性の類似度を求めることで、前記保留とした部分領域同士の類似度を再度求めるようにした。
【0027】
部分領域は、これを複数の領域に分割した詳細な部分領域に関する情報を有する場合、各詳細な部分領域についても上記相対的な幾何学特性を利用してこれを特定することが可能となる。
【0028】
この点、上記構成では、保留である旨判断された部分領域についても、その内部情報(詳細な部分領域)を用いることで、保留と判断された部分領域同士が一致するか否かを判断することができるようになる。
【0029】
なお、請求項11記載の画像認識装置は、請求項12記載の画像認識装置によるように、前記認識手段が、前記分割した詳細な部分領域の類似度を求めた結果、更に保留と判断されるときには、前記分割の対象となった部分領域の類似度の判断を不定とするようにしてもよい。
【0030】
これにより、上記詳細な部分領域を再度分割し、これを用いて再度類似度を算出する等の処理を回避することができる。
また、請求項13記載の画像認識装置では、前記認識手段が、前記モデルと前記認識対象とが一致するか否かの認識を、これらが互いに一致する旨を示す同一、これらが互いに相違する旨を示す不一致、これらが互いに一致するか不一致であるかを判断できない旨を示す不定、これらが互いに一致するか否かの判断を保留する旨を示す保留の4段階に区分する機能を有するようにした。
【0031】
これにより、認識対象が特性の物体に一致するか否かを認識するに際し、同一、不一致、不定、保留の4段階の情報を用いることができ、上記認識にかかる処理の自由度を向上させることができるようになる。
【0032】
また、請求項14記載の画像認識装置では、前記特定の物体の周囲の物体及びこれら特定の物体と周囲の物体との結合関係を示す上位モデルを更に備え、前記認識手段が、前記モデルと前記認識対象とが一致するか否かの判断を保留したとき、前記認識対象及びその周囲の対象との相対的な幾何学特性と、前記上位モデル内における前記モデルの相対的な幾何学特性とに基づいて前記モデルと前記認識対象とが一致するか否かを再度認識するようにした。
【0033】
特定の物体が更に大きな物体の一部である場合、この大きな物体内における特定の物体の幾何学的な配置が略固定されている等、大きな物体内の他の物体と特定の物体とは相関を有する。
【0034】
この点、上記構成では、モデルと認識対象とが一致するか否かの判断を保留した場合であれ、これらが一致するか否かを判断することができるようになる。
なお、請求項14記載の画像認識装置は、請求項15記載の画像認識装置によるように、前記認識手段は、前記再度の認識の結果、前記モデルと前記認識対象とが一致するか否かの認識が保留となったときには、前記認識対象と前記モデルとの関係ついて不定である旨判断するようにしてもよい。
【0035】
これにより、上記上位モデルの更に上位モデルを用いて、再度類似度を算出する等の処理を回避することができる。
【0036】
【発明の実施の形態】
(第1の実施形態)
以下、本発明にかかる画像認識装置を具体化した第1の実施形態を図面を参照しつつ説明する。
【0037】
図1に、本実施形態にかかる画像認識装置の全体構成を示す。
画像入力部1は、CCDカメラ等から構成されており、外部にある観測対象を観測する部分である。領域分割・領域抽出装置2は、画像入力部1から出力される画像データに対し例えばエッジ検出等を行うことで、観測対象の輪郭を抽出する。更に、領域分割・領域抽出装置2は、抽出された輪郭によって複数に分割された画像データについての部分領域を抽出する。
【0038】
こうして抽出された部分領域にかかるデータは、入力画像特徴保持装置3にて記憶保持される。
これに対し、モデル特徴記憶装置4は、特定の物体についてのモデルのうち、同モデルの分割された領域である部分領域毎にその形状、大きさ、位置等の特徴にかかるデータを記憶保持する装置である。ちなみに、上記モデルとして、顔を例とした場合の部分領域特徴記憶装置5に記憶される情報は、図2に例示するようなものとなる。すなわち、図2(a)に示す顔のモデルについて、図2(b)に示すように、形状、大きさ、配置態様(座標)等の特徴にかかるデータが保持されることとなる。
【0039】
なお、こうしてモデルの表現手法としては、一般化円筒表現やワイヤフレーム表現等を用いてもよい。また、モデルの獲得手法としては、CADデータの流用や、レンジファインダ等の利用、複数枚の2次元画像からモデルを獲得する手法等をもちいてもよい。
【0040】
一方、部分領域類似度算出装置5では、モデル及び入力画像にかかる部分領域同士の類似度を算出する。すなわち、例えば入力画像が人間の顔と一致するか否かを認識する場合、モデルの顔についての部分領域である目、鼻、口等に対応する部分領域と上記入力画像の部分領域との類似度が算出される。
【0041】
領域集合情報類似度算出装置6は、部分領域類似度算出装置5によって算出されたモデルの各部分領域と入力画像の各部分領域との類似度に基づき、これらモデルと入力画像との類似度を算出する装置である。
【0042】
認識部7は、領域集合情報類似度算出装置6によって算出された類似度に基づき、入力画像とモデルの示す物体とが一致するか否かを認識する部分である。
上記構成により、本実施形態では、認識対象となる画像から抽出された輪郭及び該輪郭によって複数に分割された部分領域と、特定の物体の分割された領域である部分領域及びそれら各部分領域間の結合関係を示すモデルとに基づき、認識対象と物体とが一致するか否かを認識する。そしてこの際、モデルと入力画像との部分領域同士の類似度を求めるようにすることで、モデルと入力画像との類似度を直接的に求める場合と比較して演算負荷の低減を図る。
【0043】
更に、本実施形態では、モデルの部分領域と入力画像の部分領域との類似度の算出を、これら部分領域と同部分領域に近接する部分領域との相対的な幾何学特性に基づいて行うようにする。これにより、画像の傾きや測定距離の変化等による認識対象の大きさの変化や回転等に対するロバスト性を確保することができる。
【0044】
すなわち例えば、図3(a)に示す部材L1〜L3と図3(b)に示す部材S1〜S3とは相似な図形であり、これら部材L1〜L3間の相対的な幾何学特性と、部材S1〜S3間の相対的な幾何学特性とは不変である。すなわち、例えば部材L1とL2との大きさの比率と、部材S1と部材S2との大きさの比率とは保存される。したがって、認識対象と物体との一致、不一致の認識についても画像の傾きや測定距離の変化等による認識対象の大きさの変化や回転等に対するロバスト性を確保することができる。
【0045】
次に、こうした類似度の算出処理や、こうして求められた類似度に基づく入力画像と物体とが一致するか否かを認識する処理について詳細に説明する。
図4に、上記部分領域類似度算出装置5や、領域集合情報類似度算出装置6の行う処理の手順を示す。
【0046】
図4に示すように、この一連の処理においては、まずステップ100において、入力画像のN個の部分領域のそれぞれについて、任意のL個の部分領域との相対的な幾何学特性と、モデルの各部分領域と関連する部分領域(L個)との相対的な幾何学特性との類似度を算出する。
【0047】
そして、上記幾何学特性として、本実施形態では、これらの間の大きさの比と、これらの間の距離と、これらを結ぶ線と予め定められた基準となる線とのなす角度とを用いる。そして、更に、本実施形態では、これら相対的な幾何学特性に加えて、モデルの部分領域と入力画像の部分領域との形状の類似度を考慮する。
【0048】
そして、上記大きさ、距離、角度にかかる相対的な幾何学特性の類似度と、形状の類似度とのそれぞれの定量化された値に所定の重みが付加されたものの和として上記類似度を定量化する。すなわち、上記大きさ、距離、角度、形状にかかる類似度の定量値をそれぞれSize、Length、Angle、Shapeとし、これらに付加される重みをそれぞれα、β、γ、ζ、とすると、定量化された上記類似度Similarityは、下式(1)となる。
【0049】
Similarity
=αSize+βLength+γAngle+ζShape …(1)
ここで、相対的な幾何学特性の類似度を示すSize、Lengthについては、本実施形態では、相関関数を用いて定量化する。すなわち、モデル及び入力画像の部分領域の幾何学特性の定量値をそれぞれMQ(i)、NQ(i)とし、上記各定量値の平均をそれぞれAMQ及びANQ、分散をVMQ及びVNQとすると、類似度Sは、下式(2)となる。
【0050】
【数1】
ちなみに、上式(2)において、MQ(i)やNQ(i)には、大きさ、距離にかかる定量値が代入される。
【0051】
ここで、各部分領域との相対的な幾何学特性を求める対象とする部分領域の数をL=3と例示し、入力画像の中に顔と一致する部分があるか否かを認識する場合を例にとって、図5に基づき上記相対的な幾何学特性の類似度の算出態様について説明する。
【0052】
図5(a)には、上記モデル特徴記憶装置4の記憶する顔に関するデータを示す。ここで、顔を示すモデルの部分領域は、眉を示す部分領域M1、M2と、目を示す部分領域M3、M4と、鼻を示す部分領域M5と、口を示す部分領域M6とからなる。モデルの各部分領域と関連する部分領域との相対的な幾何学特性とは、例えば目を示す部分領域M3と関連する部分領域M1、M2、M4との相対的な幾何学特性等を意味する。そして、この際、各部分領域と関連する部分領域については、上式(2)において加算される順番も一義的に決定しておく。
【0053】
また図5(b)には、上記領域分割・領域抽出装置2により輪郭及び部分領域の抽出された入力画像を示す。ここでは、眉を示す部分領域N1、N2と、目を示す部分領域N3、N4と、鼻を示す部分領域N5と、口を示す部分領域N6とに加えて、耳を示す部分領域N7、N8と、首を示す部分領域N9と、腕を示す部分領域N10、N11とを有する。
【0054】
ここで、入力画像の各部分領域と任意の3個の部分領域との相対的な幾何学特性とは、例えば部分領域N4については、これと部分領域N1、N2、N3との相対的な幾何学特性や、部分領域N1、N2、N5との相対的な幾何学特性等、「10P3」通りの幾何学特性となる。ちなみに、任意の3つの部分領域が決定されても、上式(2)に加算される順番がそれぞれ「3P3」通りずつある。これは、所定の部分領域とこれに近接する部分領域との相対的な幾何学特性には、上記近接する部分領域についてもモデル及び入力画像間での対応関係が反映されるためである。そして、入力画像の各部分領域について任意の3つの部分領域との相対的な幾何学特性を算出することで、合計「11×10P3=11P3」通りの幾何学特性を考慮することとなる。
【0055】
そして、これら「11P3」通りの幾何学特性と、モデルの各部分領域と関連する部分領域との相対的な幾何学特性(6通り)との類似度をそれぞれ求める。ここで求められる類似度のうち、大きさ、距離にかかる類似度がそれぞれ上式(1)におけるSize、Lengthとなる。
【0056】
また、相対的な幾何学特性の類似度の定量値としてのAngleについては、本実施形態では、以下に示す評価式で定量化する。
モデル及び入力画像の部分領域のそれぞれの相対角度(所定の部分領域を中心としたときこれと関連する部分領域とを結ぶ直線と上記基準となる線との間の角度:0〜2π)の定量値をそれぞれMAQ(i)、NAQ(i)とすると、類似度Sは、下式(3)となる。
【0057】
【数2】
上式(3)において、MAQ(1)及びNAQ(1)は、所定の部分領域についてこれと相対的な幾何学特性を求める対象とする部分領域のうちの1つとの相対的な角度にかかる定量値であり、MAQ(1)とNAQ(1)とでそれぞれ対応する部分領域となるように設定されている。すなわち、例えば所定の部分領域を先の図5(a)に示した目を示す部分領域M3、N3とすると、MAQ(1)とNAQ(1)を算出する際に用いる部分領域は、例えば鼻を示す部分領域M5、N5とするというように入力画像とモデルとで同一の部分領域となるようにする。
【0058】
また、MAQ(i)、NAQ(i)は、所定の部分領域についてこれと相対的な幾何学特性を求める対象とする部分領域のうち、上記MAQ(1)、NAQ(1)の算出に用いられていない部分領域との相対的な角度にかかる定量値を示す。ちなみに、上式(3)においても、MAQ(i)とNAQ(i)(i=2〜L)が同じ集合であっても、これらが異なる順番で和をとる場合には、異なる幾何学的特性を示すものとなる。
【0059】
また、上式(3)におけるK(A、B)は、所定の部分領域とこれに関連する第1の部分領域とを結ぶ直線と、同所定の部分領域とこれに関連する第2の部分領域とを結ぶ直線とのなす角度にかかる定量値である。ちなみに、Kについて場合分けがなされているのは、なす角度の絶対値のみを相対的な角度として考慮するためである。
【0060】
このように、上式(3)においては、入力画像とモデルとについて、所定の部分領域と関連する部分領域との相対的な角度の定量値の偏差を算出することで、これらの相対的な角度に関する特性を定量化している。なお、上式(3)において、関数Pを用いているのは、上記相対的な角度の偏差が例えば「15°」と「345°」となるものは互いに類似した幾何学特性を有すると考えられるためである。
【0061】
そして、上記各相対的な幾何学特性に入力画像の部分領域とモデルの部分領域との形状の類似度Shapeを加味することで、上式(1)により、入力画像の部分領域とモデルの部分領域との類似度を算出する。ちなみに、ここで形状の類似度については、例えば多角形に関しては各辺の比に基づいて定量化する等、相似な図形を同一とした上で形状自体を適宜定量化する手法を用いる。なお、この形状の類似度については、モデルの部分領域と入力画像の部分領域とによって値が1つに定まるため、各部分領域についての上記「10P3」通りの幾何学特性の類似度について共通の値を用いて上記Similarityを求める。
【0062】
こうして、上式(1)に基づき、画像入力の各部分領域とこれに近接する任意の部分領域との相対的な幾何学特性と、モデルの各部分領域とこれに近接する予め定められた部分領域との相対的な幾何学特性のそれぞれとの類似度を算出すると、ステップ110に移行する。
【0063】
ステップ110では、入力画像の各部分領域とこれに近接する任意の部分領域との相対的な幾何学特性のうち、モデルの各部分領域とこれに近接する予め定められた部分領域との相対的な幾何学特性のそれぞれと類似度の高い複数の候補をそれぞれ抽出する。すなわち、上記ステップ100において算出された「11P3」通りの類似度(Similarity)の中から、モデルの各部分領域毎に、これと類似度の高い上位R個ずつの候補を抽出する。
【0064】
更に、ステップ120では、ステップ110において抽出された候補について、モデルの各部分領域と類似度の高い入力画像のR個の部分領域の中から1つずつを取り出した「R6」個の組について、これらの相対的な幾何学特性とモデルの各部分領域の相対的な幾何学特性との類似度を算出する。詳しくは、ここでは、上記ステップ100において算出された6個の類似度(Similarity)の平均として算出する。
【0065】
こうして先の図1に示した領域集合情報類似度算出装置6において上記ステップ120の処理が終了すると、先の図1に示した認識部7においてステップ120の処理結果に基づき、入力画像の中にモデルと一致する部分があるか否かを認識する。
【0066】
ちなみに、先の図5に示した例については、ステップ120によって算出された最も類似度の高いものについての類似度の算出結果は図6に示すものとなった。同図6に示されるように、ここでは、先の図5に示したモデルの部分領域と入力画像の部分領域とが正しく対応付けられている。そして、これら対応付けられた各部分領域同士についての上記SizeやLength等の値は、「1」に極めて近い値となっている。そして、上式(1)にて定義されたSimilarityについても、各部分領域で極めて「1」に近い値となっており、これらの平均は「0.989285」となった。
【0067】
このように、本実施形態によれば、先の図5(b)に例示するように入力画像が傾いたりした場合等においても、相対的な幾何学特性を利用することで認識対象の認識に対するロバスト性を確保することができる。
【0068】
また、本実施形態では、先の図4に示す態様にて部分領域の特定を行うことで、記号推論の負荷を低減することもできる。すなわち、入力画像及びモデルの部分領域数をそれぞれN、Mとする場合、部分領域の特定を行う中間層を有しない場合には、「NPM」のオーダーの類似度の算出処理を必要とするのに対し、本実施形態では、「M×NPL+RM」のオーダーの類似度の算出でよい。このため、上記Rを適宜設定することで、演算負荷を好適に低減することができるようになる。
【0069】
更に、本実施形態では、入力画像とモデルの表記する物体とが一致するか否かを認識する基準を、物体の変形に対する同物体の所定の部分領域と同所定の部分領域に近接する領域との相対的な幾何学特性の変化に基づいて任意に設定することができる。
【0070】
詳しくは、上式(1)における各重みα、β、γ、ζを、モデルの表記する物体の変形に対する同物体の所定の部分領域と同所定の部分領域に近接する領域との相対的な幾何学特性毎の変化度合いに基づいて任意に設定することができる。これは、上記部分領域類似度算出装置5や領域集合情報類似度算出装置6が先の図1に示すように、類似度を算出する類似度算出部SCと、上記各重みα、β、γ、ζを記憶する明確に指定された記憶領域である重み記憶部WMとを備え構成されるためである。
【0071】
また、上記ステップ120により算出された類似度に基づく上記認識部7による処理の基準についても、上記物体の変形に対する同物体の所定の部分領域と同所定の部分領域に近接する領域との相対的な幾何学特性の変化に基づいて任意に設定することができる。これは、上記認識部7が図1に示すように、一致、不一致を認識する判定部JCと同判定部JCにおいて判定にかかる閾値Thを記憶する明確に指定された記憶領域である閾値記憶部SMとを備えて構成されているためである。
【0072】
一方、ニューラルネットワークの学習による場合には、学習が自動的に行われ、ネットワーク内部の処理についてはブラックボックスとなる。このため、入力画像とモデルの表記する物体とが一致するか否かを認識する基準を設計者の意図に併せて簡易に設定することはできない。これに対し、本実施形態では、入力画像とモデルの表記する物体とが一致するか否かを認識するための処理がプログラミングされたものであるため、重みα、β、γ、ζや閾値Thを設計者の意図に併せて簡易に設定することができる。
【0073】
以上詳述した本実施形態によれば、以下の効果が得られるようになる。
(1)モデルの部分領域と入力画像の部分領域との類似度の算出を、これら部分領域と同部分領域に近接する部分領域との相対的な幾何学特性に基づいて行った。これにより、画像の傾きや測定距離の変化等による認識対象の大きさの変化や回転等に対するロバスト性を確保することができる。
【0074】
(2)部分領域の特定を行う中間層を有することで、認識処理にかかる演算負荷を好適に低減することができるようになる。
(3)入力画像とモデルの表記する物体とが一致するか否かを認識する基準を、明確に指定された記憶領域に記憶した。これにより、上記基準を、物体の変形に対する同物体の所定の部分領域と同所定の部分領域に近接する領域との相対的な幾何学特性の変化に基づいて任意に設定することができる。
【0075】
(4)モデルと認識対象との類似度の定量値を、複数の相対的な幾何学特性のそれぞれについての類似度を定量化した値毎に所定の重みを付加したものの和として求めた。これにより、物体の変形に対する物体の所定の部分領域と該所定の部分領域に近接する部分領域との相対的な幾何学特性の変化度合いが、上記各特性毎に異なる場合であれ、これを適切に反映させることができるようになる。
【0076】
(第2の実施形態)
次に、本発明にかかる画像認識装置を具体化した第2の実施形態について、上記第1の実施形態との相違点を中心に図面を参照しつつ説明する。
【0077】
図7に本実施形態において、上記部分領域類似度算出装置5や、領域集合情報類似度算出装置6の行う処理の手順を示す。
この一連の処理に先立ち、まずモデルの部分領域に、予め順位を付与しておく。すなわち、先ほどの図5(a)では、例えば部分領域M1を第1の部分領域、部分領域M2を第2の部分領域、…というように順位を付与しておく。
【0078】
そして、ステップ200においては、モデルの第1、第2の部分領域の相対的な幾何学特性と、入力画像のN個の部分領域のうちの任意の2つの部分領域との相対的な幾何学特性との類似度を算出する。すなわち、例えば先の図5に示した例では、モデルの第1、第2の部分領域の相対的な幾何学特性と、入力画像の「11P2」通りの相対的な幾何学特性との類似度を算出する。ちなみに、上式(2)において加算される順序は、モデルについては上記予め順位と一致させる。また、入力画像については、上式(2)において加算される順序の異なる部分領域の組は異なるものとして扱う。
【0079】
続くステップ210においては、上記入力画像の「11P2」通りの部分領域の組のうち、類似度の高いR個の組を抽出する。ここで、Rは、先の第1の実施形態の上記R同様、演算負荷を低減するために適宜設定する。
【0080】
一方、ステップ220では、モデルの部分領域に上記予め付与された順位に基づき新たに1つの部分領域を付け加えるとともに、入力画像についてのM個の組についても任意の1つの部分領域を新たに加える。そして、これら新たに1つずつ部分領域が加えられたものについて相対的な幾何学特性の類似度を算出する。
【0081】
続くステップ230では、上記ステップ220において算出された類似度が高いものから順にR個の入力画像の部分領域の組を抽出する。更に、ステップ240では、モデルの全ての部分領域が抽出されたか否かを判断する。そして、全ての部分領域が抽出されていない場合には、ステップ220に戻る。これに対し、全ての部分領域が抽出された場合には、ステップ250に移行する。
【0082】
ステップ250では、モデルの全ての部分領域の数に対応した数の部分領域からなる入力画像の部分領域の組の全て(R個)について、モデルとの類似度を先の図1に示した認識部7に出力する。この認識部7では、入力された類似度の値のうち、一番類似度の高いものと所定の閾値とを比較することで、モデルの表記する物体と入力画像とが一致するか否かを認識する。
【0083】
こうした態様にて類似度の算出を行う本実施形態によれば、「N×(N−1)+R×{(N−2)+(N−3)+…+1}」のオーダーの類似度の算出でよい。このため、上記Rを適宜設定することで、演算負荷を好適に低減することができるようになる。
【0084】
以上説明した本実施形態によっても、先の第1の実施形態の上記(1)〜(4)に準じた効果を得ることができる。
(第3の実施形態)
次に、本発明にかかる画像認識装置を具体化した第3の実施形態について、上記第1の実施形態との相違点を中心に図面を参照しつつ説明する。
【0085】
本実施形態では、先の図1に示した部分領域類似度算出装置5で算出された類似度に基づいて同図1に示した領域分割・領域抽出装置2における入力画像の輪郭や部分領域への分割態様を変更する。すなわち、例えばエッジ抽出で抽出される入力画像の輪郭が同入力画像の信号強度に基づき行われている場合、エッジ抽出に用いる閾値を上記算出された類似度に基づいて変更するなどすることで、輪郭や部分領域への分割態様を変更する。
【0086】
これは、モデルの部分領域と入力画像の部分領域との類似度が低い場合、物体と入力画像とが一致しない可能性の他、入力画像となる物体から抽出された輪郭や同輪郭による物体の部分領域への分割態様が不適切な可能性もあるためである。
【0087】
すなわち、例えば図8(a)に示すように、人間についての入力画像においてラインLが不適切に引かれてしまった場合、これと先の図5(a)に示した人間の顔のモデルとの一致を認識することができない。すなわち、この場合、図5(a)に示した口を示す部分領域M6に対応する部分領域が存在しない。そして、口を示す部分領域を含むかたちでボディを示す部分領域N12が抽出されている。
【0088】
こうした場合、本実施形態では、図8(b)に示すようにラインLを変更する。これにより、口を示す部分領域N6を抽出することができる。
このように本実施形態では、算出される類似度に基づき画像から抽出された輪郭や該輪郭によって複数に分割された部分領域を変更することで、物体と入力画像とが一致するか否かの認識をより高精度に行うことができるようになる。
【0089】
以上説明した本実施形態によれば、先の第1の実施形態の上記(1)〜(4)の効果に加えて、更に以下の効果が得られるようになる。
(5)算出される類似度に基づき画像から抽出された輪郭や該輪郭によって複数に分割された部分領域を変更することで、物体と入力画像とが一致するか否かの認識をより高精度に行うことができるようになる。
【0090】
(第4の実施形態)
次に、本発明にかかる画像認識装置を具体化した第4の実施形態について、上記第1の実施形態との相違点を中心に図面を参照しつつ説明する。
【0091】
本実施形態では、上記部分領域類似度算出装置5では、算出する類似度を同一、保留、不一致、不定の4段階に区分する機能を有する。また、上記領域集合情報類似度算出装置6及び認識部7では、部分領域類似度算出装置5で算出された類似度に基づいて認識対象とモデルとの類似度を同一、保留、不一致、不定の4段階に区分する機能を有する。そして、部分領域類似度算出装置5や、領域集合情報類似度算出装置6及び認識部7で保留判定がなされる場合には、新たに追加された情報を用いて再度類似度を算出するようにする。
【0092】
ここで、図9を用いて、部分領域類似度算出装置5で行う処理について更に説明する。
この一連の処理においては、まずステップ300において、上記部分領域類似度算出装置5で、先の図4に示したステップ100における処理態様にて算出される類似度Similarityを所定値Aと比較する。この所定値Aは、モデルの部分領域と入力画像の部分領域とが一致している旨判断できる値に設定される。そして、上記類似度Similarityが所定値Aよりも大きい場合には、ステップ310に移行し同一である旨判断した後、この一連の処理を一旦終了する。
【0093】
なお、上記所定値Aは、先の図1に示した重み記憶部WMと同様、明確に指定された記憶領域に記憶させる。
これに対し、ステップ300において上記類似度Similarityが所定値A以下であると判断されたときには、ステップ320に移行する。このステップ320においては、上記類似度Similarityが所定値Bよりも大きいか否かを判断する。この所定値Bは、モデルの部分領域と入力画像の部分領域とが不一致である旨を判断することのできる値に設定されている。そして、上記類似度Similarityが所定値B以下である場合には、ステップ330に移行し、不一致である旨判断した後、この一連の処理を一旦終了する。
【0094】
なお、上記所定値Bは、先の図1に示した重み記憶部WMと同様、明確に指定された記憶領域に記憶させる。
これに対し、ステップ320において上記類似度Similarityが所定値Bよりも大きいと判断されると、ステップ340において一致するか不一致であるかの判断を保留する旨を示す判定し、ステップ350に移行する。このステップ350では、今回の保留判定が2回目であるか否かを判断する。そして、2回目でない場合には、ステップ360に移行し、今回の類似度の算出に用いた情報に更に情報を追加して類似度を再度算出し、同類似度を再度評価する。
【0095】
これに対し、ステップ350において、保留判定が2回目であると判断されると、換言すれば、ステップ360の処理の後、再度保留判定がなされたときには、ステップ370において、一致するか不一致であるかを判断することができない旨を示す不定の判定をし、この一連の処理を一旦終了する。
【0096】
上記ステップ360にかかる処理は、例えば次のような処理となる。図10(a)に例示するように、ステップ340の処理において保留とされた部分領域N4(ここでは、左目を示す)について、図10(b)に示すように、これを更に分割した詳細な部分領域n1〜n3を調べる。すなわち、これら詳細な部分領域n1〜n3のそれぞれと、図10(c)に示すモデルの部分領域M4の詳細な部分領域m1〜m3のそれぞれとの類似度を算出する。ここでは、先の図4に示した処理において、入力画像を部分領域N4とし、モデルを部分領域M4とすることで、これら部分領域N4と部分領域M4との類似度Similarityを算出する。
【0097】
次に、領域集合情報類似度算出装置6において行われる処理について、図11を参照しつつ説明する。
この一連の処理においては、まずステップ400において、上記部分領域類似度算出装置5において算出された類似度に基づき、モデルの各部分領域の全てについて、これと類似度が同一又は保留となる部分領域があるか否かを判断する。
【0098】
そして、ステップ400において上記判断が肯定の場合、ステップ410に移行する。ステップ410では、上記部分領域類似度算出装置5において算出された類似度に基づき、モデルの各部分領域との類似度が同一であるものの割合が所定の割合Cよりも大きいか否かを判断する。この所定の割合Cは、認識対象とモデルの表記する物体とが一致する旨を判断できる値に設定されている。そして、所定の割合Cよりも大きいときにはステップ420に移行し、認識対象とモデルの表記する物体とが一致する旨を判断し、この一連の処理を一旦終了する。
【0099】
これに対し、ステップ410において、所定の割合C以下であると判断された場合には、ステップ430において、上記部分領域類似度算出装置5において算出された類似度に基づき、モデルの各部分領域との類似度が同一であるものの割合が所定の割合Dよりも大きいか否かを判断する。この所定の割合Dは、認識対象とモデルの表記する物体とが不一致である旨を判断できる値に設定されている。
【0100】
一方、ステップ400の判断が否定である場合、上記部分領域類似度算出装置5において算出された類似度に基づき、モデルの各部分領域との類似度が同一であるものの割合が所定の割合Eよりも大きいか否かを判断する。この所定の割合E(>C)は、認識対象とモデルの表記する物体とが一致する旨を判断できる値に設定されている。
【0101】
そして、ステップ430において所定の割合D以下であると判断されるときや、ステップ440において所定の割合E以下であると判断されたときには、ステップ450において不一致である旨判断し、この一連の処理を一旦終了する。
【0102】
一方、ステップ430において所定の割合Dよりも大きいと判断されたときや、ステップ440において所定の割合Eよりも大きいと判断されたときには、ステップ460において一致するか不一致であるかの判断を保留する旨を示す判定し、ステップ470に移行する。このステップ470では、今回の保留判定が2回目であるか否かを判断する。そして、2回目でない場合には、ステップ480に移行し、今回の類似度の算出に用いた情報に更に情報を追加して類似度を再度算出し、同類似度を再度評価する。
【0103】
これに対し、ステップ470において、保留判定が2回目であると判断されると、換言すれば、ステップ480の処理の後、再度保留判定がなされたときには、ステップ490において、一致するか不一致であるかを判断することができない旨を示す不定の判定をし、この一連の処理を一旦終了する。
【0104】
上記ステップ480にかかる処理は、例えば次のような処理となる。図12(a)に、ステップ460の処理において入力画像の顔を示す領域NFと、図12(b)に示す顔を示すモデルMFとが一致するか否かの判断を保留する旨の判断がなされた場合を例示する。すなわち、図12(a)では先の図5(b)に示した左の眉を示す部分領域N2が抽出されなかったために、領域NFとモデルMFとの一致、不一致の判定が保留とされている。
【0105】
この場合、顔を示すモデルMFについて、更にその周囲にある首を示す部分領域M9や腕を示す部分領域M10、M11を含むとともに、これら部分領域M9〜M11とモデルMFとの結合関係の定義された上位モデルを考慮する。また、入力画像の顔を示す領域NFの周囲の部分領域である首を示す部分領域N9や腕を示す部分領域N10、N11を考慮する。そして、これらモデルMFと部分領域M9〜M11との相対的な幾何学特性と、領域NFと部分領域N9〜N11との相対的な幾何学特性との類似度を算出することで、領域NFとモデルMFとの類似度を再度算出する。
【0106】
以上説明した本実施形態によれば、先の第1の実施形態の上記(1)〜(4)の効果に加えて、更に以下の効果が得られるようになる。
(6)部分領域毎の類似度について同一、不一致、不定、保留の4段階の情報を用いることで、認識にかかる処理の自由度を向上させることができるようになる。
【0107】
(7)部分領域について保留判定がなされたとき、同部分領域を複数の領域に分割した詳細な部分領域同士の類似度を求めることで、保留とした部分領域同士が一致するか否かの認識を再度行うことができるようになる。
【0108】
(8)分割した詳細な部分領域の類似度を求めた結果、更に保留と判断されるときには、分割の対象となった部分領域の類似度の判断を不定とすることで、詳細な部分領域を再度分割し、これを用いて再度類似度を算出する等の処理を回避することができる。
【0109】
(9)モデルと入力画像との類似度について同一、不一致、不定、保留の4段階の情報を用いることで、認識にかかる処理の自由度を向上させることができるようになる。
【0110】
(10)モデルと入力画像とについて保留判定がなされたとき、上位モデル内におけるモデルの相対的な幾何学特性と、入力画像のうち保留とされた部分とその周囲の領域との相対的な幾何学特性との類似度を用いることで、これらの一致、不一致について再度認識することができる。
【0111】
(11)再度の認識の結果、モデルと入力画像とが一致するか否かの認識が保留となったときには、これらの関係ついて不定である旨判断することで、上位モデルの更に上位モデルを用いて再度類似度を算出する等の処理を回避することができる。
【0112】
(第5の実施形態)
次に、本発明にかかる画像認識装置を具体化した第5の実施形態について、上記第1の実施形態との相違点を中心に図面を参照しつつ説明する。
【0113】
図13に、本実施形態の画像認識装置の全体構成を示す。
画像入力部11は、先の図1に示した画像入力部1と同様、CCDカメラ等から構成されており、外部にある観測対象を観測する部分である。領域分割・領域抽出装置12は、先の図1に示した領域分割・領域抽出装置2同様、画像入力部11から出力される画像データに対し例えばエッジ検出等を行うことで、観測対象の輪郭を抽出する。更に、領域分割・領域抽出装置2は、抽出された輪郭によって複数に分割された画像データについての部分領域を抽出する。
【0114】
一方、部分領域特徴抽出装置13では、上記領域分割・領域抽出装置12で抽出された部分領域毎にその形状、大きさ、位置、輝度、色彩等の特徴を抽出する。
【0115】
こうして抽出された部分領域にかかるデータは、部分領域特徴保持装置14にて記憶保持される。
これに対し、モデル特徴記憶装置15は、特定の物体についてのモデルのうち、同モデルの分割された領域である部分領域毎にその形状、大きさ、位置等の特徴にかかるデータを記憶保持する装置である。ただし、ここでは、部分領域として、特定の物体のうち他の物体とで共有される代表的な部分特徴のみの特徴にかかるデータが記憶保持されている。そして、例えば猫、犬、人間の顔で共有される目、鼻、口等については、共通の部分領域として同一のデータとなっている。すなわち、これら複数の動物の目や鼻、口については、その形状や互いの相対的な幾何学特性も類似度が高いために、これらの大きさ位置等の幾何学特性や、形状等について複数の動物で共通する値に設定する。
【0116】
更に、部分領域対応決定装置16では、部分領域特徴保持装置14の保持する入力画像の部分領域の特徴と、部分領域特徴記憶装置15の保持するモデルの部分領域の特徴とに基づき、これら入力画像の部分領域とモデルの部分領域との対応関係を仮に決定する。ここでは、例えば入力画像から人間の顔を認識する場合、入力画像についての部分領域からボディー、腕、足等から区別された「顔」である可能性が高い部分領域の見積もりを行う。この見積もりにかかる処理は、例えば、上記入力画像の部分領域について、Hough変換等により形状認識を行い、この形状とモデルの部分領域の形状との類似に基づき行えばよい。
【0117】
一方、部分領域類似度算出装置17では、部分領域対応決定装置16によって対応付けられた部分領域特徴保持装置14の保持する部分領域と、部分領域特徴記憶装置15の保持するモデルの部分領域との類似度を算出する。すなわち、例えば上記部分領域対応決定装置16において、モデルの顔と入力画像の所定の領域とが対応付けられた場合、モデルの顔となる領域を分割した部分領域である目、鼻、口等に対応する部分領域と上記所定の領域を分割した部分領域との類似度が算出される。
【0118】
なお、部分領域類似度算出装置17での類似度の算出結果に基づき、領域分割・領域抽出装置12では、先の第2の実施形態同様、抽出する輪郭や部分領域への分割態様を変更するようフィードバック制御を行う。
【0119】
こうして算出された部分領域の類似度に関するデータは、部分領域認識結果保持装置18に記憶保持される。
また、部分領域特徴保持装置14に保持されるデータのうち、部分領域対応決定装置16においてモデルと対応付けられたものは、領域集合情報保持装置19に記憶保持される。
【0120】
一方、領域集合情報記憶装置20は、特定の物体についてのモデルの部分領域についての上記部分領域特徴保持装置14の保持する情報を特定するデータや、これらの間の結合関係等の特徴にかかるデータを記憶保持する装置である。
【0121】
ここで、部分領域特徴保持装置14の保持する情報を特定するデータとは、部分領域特徴保持装置14において複数の物体の部分領域で共通化されていた特徴を、各物体毎に異なる厳密な特徴として定量化したものである。例えば、部分領域特徴保持装置14では複数の動物の顔についての部分領域が共通化されていたものを、各動物毎に厳密な特徴として定量化したデータである。ちなみに、これは、犬、猫、人間等の複数の動物において、目、口、鼻等の形状や、これらの互いの相対的な幾何学特性は大きくは類似しているとはいえ、より細分化、厳密化された基準に従えば各種毎に異なることを利用している。
【0122】
また、この領域集合情報記憶装置20は、各物体が固有に有する部分領域についての特徴にかかるデータも有する。すなわち、例えば複数の動物の顔についての情報において、猫のみに「ひげ」に対応する部分領域を付与する。
【0123】
そして、領域集合対応決定装置21は、領域集合情報記憶装置20の有する情報に基づいて、認識対象を、モデルの表記する複数の物体のいずれかと対応付ける処理を行う。
【0124】
そして、領域集合情報類似度算出装置22は、上記モデルと認識対象との類似度を算出する装置である。なお、領域集合情報類似度算出装置22での類似度の算出結果に基づき、領域分割・領域抽出装置12では、先の第2の実施形態同様、抽出する輪郭や部分領域への分割態様を変更するようフィードバック制御を行う。
【0125】
また、領域集合認識結果保持装置23は、上記領域集合情報類似度算出装置
22にて算出された類似度に関するデータを記憶保持する装置である。
更に、認識結果照合装置24は、部分領域認識結果保持装置18の保持する部分領域の類似度に関するデータと領域集合認識結果保持装置23の領域集合情報の類似度に関するデータとを照合し、整合性をチェックする装置である。そして、ここでこれら部分領域認識結果保持装置18及び領域集合認識結果保持装置23で保持されるデータの整合性に問題が生じるときには、上記部分領域対応決定装置16や、領域集合対応決定装置21にその旨をフィードバックする。また、認識結果照合装置24では、部分領域認識結果保持装置18及び領域集合認識結果保持装置23で保持されるデータを認識結果として外部に出力する。
【0126】
以上説明した本実施形態によれば、先の第1の実施形態の上記(1)〜(4)の効果や、先の第2の実施形態の上記(5)の効果に加えて、更に以下の効果が得られるようになる。
【0127】
(12)部分領域対応決定装置16を備えることで、入力画像とモデルとのそれぞれの部分領域の対応関係について、少ない演算量で見積もりを行うことができるため、認識処理にかかる類似度の算出の演算負荷を低減することができる。
【0128】
(13)部分領域特徴保持装置14において、特定の物体のうち他の物体とで共有される代表的な部分特徴のみの特徴にかかるデータが記憶保持されるようにした。これにより、互いに類似した特徴を有する複数の物体の認識を行う機能を有する場合であれ、同認識にかかる演算負荷を低減することができるようになる。
【0129】
なお、上記各実施形態は、以下のように変更して実施してもよい。
・モデルの所定の部分領域とこれに近接する部分領域との相対的な幾何学特性と、入力画像の所定の部分領域とこれに近接する部分領域との相対的な幾何学特性との類似度の定量化手法としては、上式(2)や上式(3)に例示したものに限らない。
【0130】
・モデルの部分領域と入力画像の部分領域との類似度の定量化手法としては、上式(1)に例示したものに限らない。
・また、モデルの部分領域と入力画像の部分領域との類似度に基づくこれらモデル及び入力画像の類似度の算出手法としては、先の図4や図7、図12に例示したものに限らない。例えば、モデルの部分領域のうちの一部について、これらと類似度の高い前記認識対象の部分領域の複数の候補をそれぞれ抽出する処理と、前記モデルの残りの部分領域と対応する前記認識対象の部分領域を前記抽出された候補に基づいて推論する範囲で、図7に示した算出手法を適宜変更してもよい。
【0131】
・類似度についての同一、不一致、不定、保留の判断態様や、こうした判定の利用手法についても上記第4の実施形態で例示したものに限らない。例えば先の図4や図7に例示した態様にて類似度の算出をした後、モデルと入力画像とが一致するか否かの判定時にのみこうした4段階の区分を行ってもよい。
【0132】
・上記各実施形態やその変形例では、類似度に基づいて特定の物体と認識対象とが一致するか否かを認識する基準にかかるデータを、明確に指定された記憶領域に格納するようにしたが、これに限らない。モデルの所定の部分領域とこれに近接する部分領域との相対的な幾何学特性と、入力画像の所定の部分領域とこれに近接する部分領域との相対的な幾何学特性との類似度に基づく認識にかかる上記基準を、例えばニューラルネットワークによる学習によって取得するようにしてもよい。この場合であれ、例えば先の第1の実施形態の上記(1)の効果を得ることはできる。
【0133】
・物体と認識対象とが一致するか否かを認識する認識手段としては、上記各実施形態等で例示した相対的な幾何学特性に基づいてモデルの所定の部分領域と前記認識対象の所定の部分領域との類似度を求め、該求めた類似度に基づいて上記認識を行う範囲で適宜変更してよい。
【図面の簡単な説明】
【図1】本発明にかかる画像認識装置の第1の実施形態の全体構成を示すブロック図。
【図2】同実施形態におけるモデルに関するデータを示す図。
【図3】互いに相似な図形を示す図。
【図4】同実施形態にかかるモデルと入力画像との類似度の算出処理にかかるフローチャート。
【図5】同実施形態におけるモデル及び入力画像を例示する図。
【図6】同実施形態におけるモデル及び入力画像の類似度の算出結果を例示する図。
【図7】第2の実施形態にかかるモデルと入力画像との類似度の算出処理にかかるフローチャート。
【図8】第3の実施形態において、エッジ抽出の変更態様を例示する図。
【図9】第4の実施形態における部分領域の類似度の算出処理にかかるフローチャート。
【図10】同実施形態における部分領域の類似度の再度の算出態様を説明する図。
【図11】同実施形態におけるモデル及び入力画像の類似度の算出処理にかかるフローチャート。
【図12】同実施形態におけるモデル及び入力画像の類似度の再度の算出態様を説明する図。
【図13】第5の実施形態の全体構成を示すブロック図。
【符号の説明】
1…画像入力部、2…領域分割・領域抽出装置、5…部分領域類似度算出装置、6…領域集合情報類似度算出装置、7…認識部、11…画像入力部、12…領域分割・領域抽出装置、16…部分領域対応決定装置、17…部分領域類似度算出装置、18…部分領域認識結果保持装置、19…領域集合情報保持装置、20…領域集合情報記憶装置、21…領域集合対応決定装置、22…領域集合情報類似度算出装置、23…保持装置、24…照合装置。
【発明の属する技術分野】
本発明は、認識対象となる画像から抽出された輪郭及び該輪郭によって複数に分割された部分領域と、特定の物体の分割された領域である部分領域及びそれら各部分領域間の結合関係を示すモデルとに基づき、認識対象と物体とが一致するか否かを認識する画像認識装置に関する。
【0002】
【従来の技術】
画像認識技術の分野においては、物体についてのモデルと画像から抽出された特徴との間のマッチングに基づき画像を認識するモデルベーストビジョンが周知である。このモデルベーストビジョンとしては、物体を部分的な特徴とその結合関係としてモデル化し、そのモデルを使って物体を認識するものがある(特許文献1)。このように複数の部分特徴に分割されたモデルを用い、画像から抽出された部分特徴とモデルの部分特徴との対応関係の決定に基づいて画像を認識することができる。
【0003】
ここで、画像から抽出された部分特徴とモデルの部分特徴との対応関係を決定するパターンマッチングを行う技術としては、例えば下記非特許文献1に見られるように、ニューラルネットワークを用いたものがある。すなわち、生態における形態視機能の基本単位となるコラム構造をニューラルネットワークにより構成し、画像中の複数の部分特徴のそれぞれに反応する層により抽出された部分特徴に基づき画像を認識する。この手法によれば、顔画像についての様々なバリエーションに対し、「80%」以上の精度で顔となる領域を正しく抽出することができる。
【0004】
【特許文献1】
特開平8−212329号公報
【非特許文献1】
丹内 哲也、萩原 将文、「形態視系の情報処理に基づく多重構造ニューラルネットワーク」、電子情報通信学会論文誌、D−II、No.4 pp694−702、1999年4月
【0005】
【発明が解決しようとする課題】
ところで、上記文献のニューラルネットワークを用いた手法では、大きさに対して2割程度の変化しか許容せず、画像の大きさの変化に対するロバスト性が低いという問題がある。また、ニューラルネットワークでは、最適な解を学習によって求めることが困難であり、最適な解から離間した解を学習しやすいという問題もある。更に、ニューラルネットワークでは、所望とする入力と出力との関係を学習させるものであり、ネットワーク内部の処理についてはブラックボックスとなるため、動きや変化などの情報をシステム設計者の意図に併せて設計することは困難となる。
【0006】
本発明は、こうした実情に鑑みてなされたものであり、その目的は、認識対象をより好適に認識することのできる画像認識装置を提供することにある。
【0007】
【課題を解決するための手段】
こうした目的を達成すべく、請求項1記載の画像認識装置では、前記物体と前記認識対象とが一致するか否かを認識するに際し、前記認識対象の所定の部分領域と該所定の部分領域に近接する部分領域との相対的な幾何学特性と、前記モデルについての所定の部分領域と該所定の部分領域に近接する部分領域との相対的な幾何学特性とに基づいて前記モデルの所定の部分領域と前記認識対象の所定の部分領域との類似度を求め、該求めた類似度に基づいて前記物体と前記認識対象とが一致するか否かを認識する認識手段を備えるようにした。
【0008】
このように物体と認識対象とが一致するか否かを認識するに際し、モデルと認識対象との部分領域同士の類似度を求めるようにすることで、モデルと認識対象との類似度を直接的に求める場合と比較して演算負荷を低減することができる。また、この際、所定の部分領域と該所定の部分領域に近接する部分領域との相対的な幾何学特性を用いるため、画像の傾きや測定距離の変化等による認識対象の回転や大きさの変化等に対するロバスト性を確保することができる。したがって、認識対象と物体との一致、不一致の認識についても画像の傾きや測定距離の変化等による認識対象の回転や大きさの変化等に対するロバスト性を確保することができる。したがって、上記構成によれば、認識対象をより好適に認識することができるようになる。
【0009】
また、請求項2記載の画像認識装置では、前記類似度に基づいて前記物体と前記認識対象とが一致するか否かを認識する基準にかかるデータが、明確に指定された記憶領域に記憶されてなるようにした。
【0010】
これにより、上記類似度に基づいて物体と認識対象とが一致するか否かを認識する際の基準を、特定の物体の変形に対する該物体の所定の部分領域と該所定の部分領域に近接する部分領域との相対的な幾何学特性の変化に基づいて任意に設定することができる。このため、ニューラルネットワークの学習による場合と比較して、上記基準を設計者の意図に併せて簡易に設定することができるようになる。
【0011】
また、請求項3記載の画像認識装置では、前記認識手段が、前記認識対象の各部分領域とこれに近接する任意の部分領域との相対的な幾何学特性のうち、前記モデルの各部分領域とこれに近接する予め定められた部分領域との相対的な幾何学特性のそれぞれと類似度の高い複数の候補をそれぞれ抽出し、前記モデルの各部分領域のそれぞれについての前記複数の候補のいずれか1つずつからなる各部分領域間の前記幾何学特性と、前記モデルの各部分領域間の前記幾何学特性との類似度に基づいて前記物体と前記認識対象とが一致するか否かを認識するようにした。
【0012】
これにより、複数の候補の数を適宜制限することで、物体と認識対象とが一致するか否かを認識する際に用いる類似度の算出量を低減させることができるようになる。
【0013】
また、請求項4記載の画像認識装置では、前記認識手段が、前記モデルの部分領域のうちの一部について、これらと類似度の高い前記認識対象の部分領域の複数の候補をそれぞれ抽出する処理と、前記モデルの残りの部分領域と対応する前記認識対象の部分領域を前記抽出された候補に基づいて推論するとともに、該推論によって取得された部分領域について該部分領域とこれに近接する部分領域との相対的な幾何学特性と、前記取得された部分領域に対応する前記モデルの部分領域とこれに近接する部分領域との相対的な幾何学特性との類似度を求める処理とを行うようにした。
【0014】
上記構成では、「モデルの部分領域の一部」の数や、「複数の候補」の数を適宜制限することで、物体と認識対象とが一致するか否かを認識する際に用いる類似度の算出量を低減させることができるようになる。
【0015】
また、請求項5記載の画像認識装置では、前記相対的な幾何学特性が、所定の部分領域と該所定の部分領域に近接する部分領域との間の距離、及びこれらの間の大小関係、及びこれらの間を結ぶ線と予め定められた基準となる線との間の角度の少なくとも1つに関するものを含むようにした。
【0016】
これにより、上記相対的な幾何学特性を簡易に定量化することができるようになる。
また、請求項6記載の画像認識装置では、前記類似度が、複数の相対的な幾何学特性のそれぞれについての類似度を定量化した値毎に所定の重みを付加したものの和として求められるようにした。
【0017】
このように複数の相対的な幾何学特性を用いることで、類似度をより信頼性の高い値として定量化することができるようになる。しかも、この際、各相対的な幾何学特性毎に所定の重みを付加することで、物体の変形に対する物体の所定の部分領域と該所定の部分領域に近接する部分領域との相対的な幾何学特性の変化度合いが、各特性毎に異なる場合であれ、これを適切に反映させることができるようになる。
【0018】
また、請求項7記載の画像認識装置では、前記所定の重みが、明確に指定された記憶領域に記憶されてなるようにした。
これにより、所定の重みを、特定の物体の変形に対する該物体の所定の部分領域と該所定の部分領域に近接する部分領域との相対的な幾何学特性毎の変化度合いに基づいて任意に設定することができるようになる。このように上記重みを任意に設定することができるために、換言すればニューラルネットワークの学習によらず設定するために、物体と認識対象とが一致するか否かを認識する基準を設計者の意図に併せて簡易に設定することができるようになる。
【0019】
また、請求項8記載の画像認識装置では、前記認識手段によって求められた前記モデルの部分領域と前記認識対象の部分領域との類似度に基づき、前記画像から抽出された輪郭及び該輪郭によって複数に分割された部分領域の少なくとも一方を変更する手段を更に備えるようにした。
【0020】
モデルの部分領域と前記認識対象の部分領域との類似度が低い場合、物体と認識対象とが一致しない可能性の他、認識対象となる物体から抽出された輪郭や同輪郭による物体の部分領域への分割態様が不適切な可能性もある。
【0021】
この点、上記構成では、画像から抽出された輪郭及び該輪郭によって複数に分割された部分領域の少なくとも一方を変更する手段を備えることで、物体と認識対象とが一致するか否かの認識をより高精度に行うことができるようになる。
【0022】
また、請求項9記載の画像認識装置では、前記認識手段が、前記モデルの部分領域と前記認識対象の部分領域との類似度を、これら部分領域が互いに一致する旨を示す同一、該部分領域が互いに相違する旨を示す不一致、該部分領域が互いに一致するか不一致であるかを判断できない旨を示す不定、該部分領域が互いに一致するか否かの判断を保留する旨を示す保留の4段階に区分する機能を有するようにした。
【0023】
これにより、認識対象が特性の物体に一致するか否かの認識を行う際、これらの部分領域毎の類似度について同一、不一致、不定、保留の4段階の情報を用いることができ、上記認識にかかる処理の自由度を向上させることができるようになる。また、同一、不一致、不定、保留の4段階の情報を外部に出力可能とするなら、部分領域の類似度について詳細な情報を外部に提供することもできる。
【0024】
また、請求項10記載の画像認識装置では、前記認識手段が、所定の部分領域について前記保留である旨判断するとき、前記モデルの他の部分領域と前記認識対象の他の部分領域との類似度に基づいて前記保留とされている部分領域が互いに一致するか否かを判断するようにした。
【0025】
特定の物体を構成する所定の部分領域は、同物体内の他の部分領域とその幾何学的な配置が略固定されている等、同他の部分領域と相関を有する。
この点、上記構成では、所定の部分領域について保留である旨判断された場合であれ、この所定の部分領域同士が一致するか否かを判断することができるようになる。
【0026】
また、請求項11記載の画像認識装置では、前記認識手段が、前記保留である旨判断したとき、対応する前記モデルの部分領域を複数の領域に分割した詳細な部分領域と、対応する前記認識対象の部分領域を複数の領域に分割した詳細な部分領域とについての前記相対的な幾何学特性の類似度を求めることで、前記保留とした部分領域同士の類似度を再度求めるようにした。
【0027】
部分領域は、これを複数の領域に分割した詳細な部分領域に関する情報を有する場合、各詳細な部分領域についても上記相対的な幾何学特性を利用してこれを特定することが可能となる。
【0028】
この点、上記構成では、保留である旨判断された部分領域についても、その内部情報(詳細な部分領域)を用いることで、保留と判断された部分領域同士が一致するか否かを判断することができるようになる。
【0029】
なお、請求項11記載の画像認識装置は、請求項12記載の画像認識装置によるように、前記認識手段が、前記分割した詳細な部分領域の類似度を求めた結果、更に保留と判断されるときには、前記分割の対象となった部分領域の類似度の判断を不定とするようにしてもよい。
【0030】
これにより、上記詳細な部分領域を再度分割し、これを用いて再度類似度を算出する等の処理を回避することができる。
また、請求項13記載の画像認識装置では、前記認識手段が、前記モデルと前記認識対象とが一致するか否かの認識を、これらが互いに一致する旨を示す同一、これらが互いに相違する旨を示す不一致、これらが互いに一致するか不一致であるかを判断できない旨を示す不定、これらが互いに一致するか否かの判断を保留する旨を示す保留の4段階に区分する機能を有するようにした。
【0031】
これにより、認識対象が特性の物体に一致するか否かを認識するに際し、同一、不一致、不定、保留の4段階の情報を用いることができ、上記認識にかかる処理の自由度を向上させることができるようになる。
【0032】
また、請求項14記載の画像認識装置では、前記特定の物体の周囲の物体及びこれら特定の物体と周囲の物体との結合関係を示す上位モデルを更に備え、前記認識手段が、前記モデルと前記認識対象とが一致するか否かの判断を保留したとき、前記認識対象及びその周囲の対象との相対的な幾何学特性と、前記上位モデル内における前記モデルの相対的な幾何学特性とに基づいて前記モデルと前記認識対象とが一致するか否かを再度認識するようにした。
【0033】
特定の物体が更に大きな物体の一部である場合、この大きな物体内における特定の物体の幾何学的な配置が略固定されている等、大きな物体内の他の物体と特定の物体とは相関を有する。
【0034】
この点、上記構成では、モデルと認識対象とが一致するか否かの判断を保留した場合であれ、これらが一致するか否かを判断することができるようになる。
なお、請求項14記載の画像認識装置は、請求項15記載の画像認識装置によるように、前記認識手段は、前記再度の認識の結果、前記モデルと前記認識対象とが一致するか否かの認識が保留となったときには、前記認識対象と前記モデルとの関係ついて不定である旨判断するようにしてもよい。
【0035】
これにより、上記上位モデルの更に上位モデルを用いて、再度類似度を算出する等の処理を回避することができる。
【0036】
【発明の実施の形態】
(第1の実施形態)
以下、本発明にかかる画像認識装置を具体化した第1の実施形態を図面を参照しつつ説明する。
【0037】
図1に、本実施形態にかかる画像認識装置の全体構成を示す。
画像入力部1は、CCDカメラ等から構成されており、外部にある観測対象を観測する部分である。領域分割・領域抽出装置2は、画像入力部1から出力される画像データに対し例えばエッジ検出等を行うことで、観測対象の輪郭を抽出する。更に、領域分割・領域抽出装置2は、抽出された輪郭によって複数に分割された画像データについての部分領域を抽出する。
【0038】
こうして抽出された部分領域にかかるデータは、入力画像特徴保持装置3にて記憶保持される。
これに対し、モデル特徴記憶装置4は、特定の物体についてのモデルのうち、同モデルの分割された領域である部分領域毎にその形状、大きさ、位置等の特徴にかかるデータを記憶保持する装置である。ちなみに、上記モデルとして、顔を例とした場合の部分領域特徴記憶装置5に記憶される情報は、図2に例示するようなものとなる。すなわち、図2(a)に示す顔のモデルについて、図2(b)に示すように、形状、大きさ、配置態様(座標)等の特徴にかかるデータが保持されることとなる。
【0039】
なお、こうしてモデルの表現手法としては、一般化円筒表現やワイヤフレーム表現等を用いてもよい。また、モデルの獲得手法としては、CADデータの流用や、レンジファインダ等の利用、複数枚の2次元画像からモデルを獲得する手法等をもちいてもよい。
【0040】
一方、部分領域類似度算出装置5では、モデル及び入力画像にかかる部分領域同士の類似度を算出する。すなわち、例えば入力画像が人間の顔と一致するか否かを認識する場合、モデルの顔についての部分領域である目、鼻、口等に対応する部分領域と上記入力画像の部分領域との類似度が算出される。
【0041】
領域集合情報類似度算出装置6は、部分領域類似度算出装置5によって算出されたモデルの各部分領域と入力画像の各部分領域との類似度に基づき、これらモデルと入力画像との類似度を算出する装置である。
【0042】
認識部7は、領域集合情報類似度算出装置6によって算出された類似度に基づき、入力画像とモデルの示す物体とが一致するか否かを認識する部分である。
上記構成により、本実施形態では、認識対象となる画像から抽出された輪郭及び該輪郭によって複数に分割された部分領域と、特定の物体の分割された領域である部分領域及びそれら各部分領域間の結合関係を示すモデルとに基づき、認識対象と物体とが一致するか否かを認識する。そしてこの際、モデルと入力画像との部分領域同士の類似度を求めるようにすることで、モデルと入力画像との類似度を直接的に求める場合と比較して演算負荷の低減を図る。
【0043】
更に、本実施形態では、モデルの部分領域と入力画像の部分領域との類似度の算出を、これら部分領域と同部分領域に近接する部分領域との相対的な幾何学特性に基づいて行うようにする。これにより、画像の傾きや測定距離の変化等による認識対象の大きさの変化や回転等に対するロバスト性を確保することができる。
【0044】
すなわち例えば、図3(a)に示す部材L1〜L3と図3(b)に示す部材S1〜S3とは相似な図形であり、これら部材L1〜L3間の相対的な幾何学特性と、部材S1〜S3間の相対的な幾何学特性とは不変である。すなわち、例えば部材L1とL2との大きさの比率と、部材S1と部材S2との大きさの比率とは保存される。したがって、認識対象と物体との一致、不一致の認識についても画像の傾きや測定距離の変化等による認識対象の大きさの変化や回転等に対するロバスト性を確保することができる。
【0045】
次に、こうした類似度の算出処理や、こうして求められた類似度に基づく入力画像と物体とが一致するか否かを認識する処理について詳細に説明する。
図4に、上記部分領域類似度算出装置5や、領域集合情報類似度算出装置6の行う処理の手順を示す。
【0046】
図4に示すように、この一連の処理においては、まずステップ100において、入力画像のN個の部分領域のそれぞれについて、任意のL個の部分領域との相対的な幾何学特性と、モデルの各部分領域と関連する部分領域(L個)との相対的な幾何学特性との類似度を算出する。
【0047】
そして、上記幾何学特性として、本実施形態では、これらの間の大きさの比と、これらの間の距離と、これらを結ぶ線と予め定められた基準となる線とのなす角度とを用いる。そして、更に、本実施形態では、これら相対的な幾何学特性に加えて、モデルの部分領域と入力画像の部分領域との形状の類似度を考慮する。
【0048】
そして、上記大きさ、距離、角度にかかる相対的な幾何学特性の類似度と、形状の類似度とのそれぞれの定量化された値に所定の重みが付加されたものの和として上記類似度を定量化する。すなわち、上記大きさ、距離、角度、形状にかかる類似度の定量値をそれぞれSize、Length、Angle、Shapeとし、これらに付加される重みをそれぞれα、β、γ、ζ、とすると、定量化された上記類似度Similarityは、下式(1)となる。
【0049】
Similarity
=αSize+βLength+γAngle+ζShape …(1)
ここで、相対的な幾何学特性の類似度を示すSize、Lengthについては、本実施形態では、相関関数を用いて定量化する。すなわち、モデル及び入力画像の部分領域の幾何学特性の定量値をそれぞれMQ(i)、NQ(i)とし、上記各定量値の平均をそれぞれAMQ及びANQ、分散をVMQ及びVNQとすると、類似度Sは、下式(2)となる。
【0050】
【数1】
ちなみに、上式(2)において、MQ(i)やNQ(i)には、大きさ、距離にかかる定量値が代入される。
【0051】
ここで、各部分領域との相対的な幾何学特性を求める対象とする部分領域の数をL=3と例示し、入力画像の中に顔と一致する部分があるか否かを認識する場合を例にとって、図5に基づき上記相対的な幾何学特性の類似度の算出態様について説明する。
【0052】
図5(a)には、上記モデル特徴記憶装置4の記憶する顔に関するデータを示す。ここで、顔を示すモデルの部分領域は、眉を示す部分領域M1、M2と、目を示す部分領域M3、M4と、鼻を示す部分領域M5と、口を示す部分領域M6とからなる。モデルの各部分領域と関連する部分領域との相対的な幾何学特性とは、例えば目を示す部分領域M3と関連する部分領域M1、M2、M4との相対的な幾何学特性等を意味する。そして、この際、各部分領域と関連する部分領域については、上式(2)において加算される順番も一義的に決定しておく。
【0053】
また図5(b)には、上記領域分割・領域抽出装置2により輪郭及び部分領域の抽出された入力画像を示す。ここでは、眉を示す部分領域N1、N2と、目を示す部分領域N3、N4と、鼻を示す部分領域N5と、口を示す部分領域N6とに加えて、耳を示す部分領域N7、N8と、首を示す部分領域N9と、腕を示す部分領域N10、N11とを有する。
【0054】
ここで、入力画像の各部分領域と任意の3個の部分領域との相対的な幾何学特性とは、例えば部分領域N4については、これと部分領域N1、N2、N3との相対的な幾何学特性や、部分領域N1、N2、N5との相対的な幾何学特性等、「10P3」通りの幾何学特性となる。ちなみに、任意の3つの部分領域が決定されても、上式(2)に加算される順番がそれぞれ「3P3」通りずつある。これは、所定の部分領域とこれに近接する部分領域との相対的な幾何学特性には、上記近接する部分領域についてもモデル及び入力画像間での対応関係が反映されるためである。そして、入力画像の各部分領域について任意の3つの部分領域との相対的な幾何学特性を算出することで、合計「11×10P3=11P3」通りの幾何学特性を考慮することとなる。
【0055】
そして、これら「11P3」通りの幾何学特性と、モデルの各部分領域と関連する部分領域との相対的な幾何学特性(6通り)との類似度をそれぞれ求める。ここで求められる類似度のうち、大きさ、距離にかかる類似度がそれぞれ上式(1)におけるSize、Lengthとなる。
【0056】
また、相対的な幾何学特性の類似度の定量値としてのAngleについては、本実施形態では、以下に示す評価式で定量化する。
モデル及び入力画像の部分領域のそれぞれの相対角度(所定の部分領域を中心としたときこれと関連する部分領域とを結ぶ直線と上記基準となる線との間の角度:0〜2π)の定量値をそれぞれMAQ(i)、NAQ(i)とすると、類似度Sは、下式(3)となる。
【0057】
【数2】
上式(3)において、MAQ(1)及びNAQ(1)は、所定の部分領域についてこれと相対的な幾何学特性を求める対象とする部分領域のうちの1つとの相対的な角度にかかる定量値であり、MAQ(1)とNAQ(1)とでそれぞれ対応する部分領域となるように設定されている。すなわち、例えば所定の部分領域を先の図5(a)に示した目を示す部分領域M3、N3とすると、MAQ(1)とNAQ(1)を算出する際に用いる部分領域は、例えば鼻を示す部分領域M5、N5とするというように入力画像とモデルとで同一の部分領域となるようにする。
【0058】
また、MAQ(i)、NAQ(i)は、所定の部分領域についてこれと相対的な幾何学特性を求める対象とする部分領域のうち、上記MAQ(1)、NAQ(1)の算出に用いられていない部分領域との相対的な角度にかかる定量値を示す。ちなみに、上式(3)においても、MAQ(i)とNAQ(i)(i=2〜L)が同じ集合であっても、これらが異なる順番で和をとる場合には、異なる幾何学的特性を示すものとなる。
【0059】
また、上式(3)におけるK(A、B)は、所定の部分領域とこれに関連する第1の部分領域とを結ぶ直線と、同所定の部分領域とこれに関連する第2の部分領域とを結ぶ直線とのなす角度にかかる定量値である。ちなみに、Kについて場合分けがなされているのは、なす角度の絶対値のみを相対的な角度として考慮するためである。
【0060】
このように、上式(3)においては、入力画像とモデルとについて、所定の部分領域と関連する部分領域との相対的な角度の定量値の偏差を算出することで、これらの相対的な角度に関する特性を定量化している。なお、上式(3)において、関数Pを用いているのは、上記相対的な角度の偏差が例えば「15°」と「345°」となるものは互いに類似した幾何学特性を有すると考えられるためである。
【0061】
そして、上記各相対的な幾何学特性に入力画像の部分領域とモデルの部分領域との形状の類似度Shapeを加味することで、上式(1)により、入力画像の部分領域とモデルの部分領域との類似度を算出する。ちなみに、ここで形状の類似度については、例えば多角形に関しては各辺の比に基づいて定量化する等、相似な図形を同一とした上で形状自体を適宜定量化する手法を用いる。なお、この形状の類似度については、モデルの部分領域と入力画像の部分領域とによって値が1つに定まるため、各部分領域についての上記「10P3」通りの幾何学特性の類似度について共通の値を用いて上記Similarityを求める。
【0062】
こうして、上式(1)に基づき、画像入力の各部分領域とこれに近接する任意の部分領域との相対的な幾何学特性と、モデルの各部分領域とこれに近接する予め定められた部分領域との相対的な幾何学特性のそれぞれとの類似度を算出すると、ステップ110に移行する。
【0063】
ステップ110では、入力画像の各部分領域とこれに近接する任意の部分領域との相対的な幾何学特性のうち、モデルの各部分領域とこれに近接する予め定められた部分領域との相対的な幾何学特性のそれぞれと類似度の高い複数の候補をそれぞれ抽出する。すなわち、上記ステップ100において算出された「11P3」通りの類似度(Similarity)の中から、モデルの各部分領域毎に、これと類似度の高い上位R個ずつの候補を抽出する。
【0064】
更に、ステップ120では、ステップ110において抽出された候補について、モデルの各部分領域と類似度の高い入力画像のR個の部分領域の中から1つずつを取り出した「R6」個の組について、これらの相対的な幾何学特性とモデルの各部分領域の相対的な幾何学特性との類似度を算出する。詳しくは、ここでは、上記ステップ100において算出された6個の類似度(Similarity)の平均として算出する。
【0065】
こうして先の図1に示した領域集合情報類似度算出装置6において上記ステップ120の処理が終了すると、先の図1に示した認識部7においてステップ120の処理結果に基づき、入力画像の中にモデルと一致する部分があるか否かを認識する。
【0066】
ちなみに、先の図5に示した例については、ステップ120によって算出された最も類似度の高いものについての類似度の算出結果は図6に示すものとなった。同図6に示されるように、ここでは、先の図5に示したモデルの部分領域と入力画像の部分領域とが正しく対応付けられている。そして、これら対応付けられた各部分領域同士についての上記SizeやLength等の値は、「1」に極めて近い値となっている。そして、上式(1)にて定義されたSimilarityについても、各部分領域で極めて「1」に近い値となっており、これらの平均は「0.989285」となった。
【0067】
このように、本実施形態によれば、先の図5(b)に例示するように入力画像が傾いたりした場合等においても、相対的な幾何学特性を利用することで認識対象の認識に対するロバスト性を確保することができる。
【0068】
また、本実施形態では、先の図4に示す態様にて部分領域の特定を行うことで、記号推論の負荷を低減することもできる。すなわち、入力画像及びモデルの部分領域数をそれぞれN、Mとする場合、部分領域の特定を行う中間層を有しない場合には、「NPM」のオーダーの類似度の算出処理を必要とするのに対し、本実施形態では、「M×NPL+RM」のオーダーの類似度の算出でよい。このため、上記Rを適宜設定することで、演算負荷を好適に低減することができるようになる。
【0069】
更に、本実施形態では、入力画像とモデルの表記する物体とが一致するか否かを認識する基準を、物体の変形に対する同物体の所定の部分領域と同所定の部分領域に近接する領域との相対的な幾何学特性の変化に基づいて任意に設定することができる。
【0070】
詳しくは、上式(1)における各重みα、β、γ、ζを、モデルの表記する物体の変形に対する同物体の所定の部分領域と同所定の部分領域に近接する領域との相対的な幾何学特性毎の変化度合いに基づいて任意に設定することができる。これは、上記部分領域類似度算出装置5や領域集合情報類似度算出装置6が先の図1に示すように、類似度を算出する類似度算出部SCと、上記各重みα、β、γ、ζを記憶する明確に指定された記憶領域である重み記憶部WMとを備え構成されるためである。
【0071】
また、上記ステップ120により算出された類似度に基づく上記認識部7による処理の基準についても、上記物体の変形に対する同物体の所定の部分領域と同所定の部分領域に近接する領域との相対的な幾何学特性の変化に基づいて任意に設定することができる。これは、上記認識部7が図1に示すように、一致、不一致を認識する判定部JCと同判定部JCにおいて判定にかかる閾値Thを記憶する明確に指定された記憶領域である閾値記憶部SMとを備えて構成されているためである。
【0072】
一方、ニューラルネットワークの学習による場合には、学習が自動的に行われ、ネットワーク内部の処理についてはブラックボックスとなる。このため、入力画像とモデルの表記する物体とが一致するか否かを認識する基準を設計者の意図に併せて簡易に設定することはできない。これに対し、本実施形態では、入力画像とモデルの表記する物体とが一致するか否かを認識するための処理がプログラミングされたものであるため、重みα、β、γ、ζや閾値Thを設計者の意図に併せて簡易に設定することができる。
【0073】
以上詳述した本実施形態によれば、以下の効果が得られるようになる。
(1)モデルの部分領域と入力画像の部分領域との類似度の算出を、これら部分領域と同部分領域に近接する部分領域との相対的な幾何学特性に基づいて行った。これにより、画像の傾きや測定距離の変化等による認識対象の大きさの変化や回転等に対するロバスト性を確保することができる。
【0074】
(2)部分領域の特定を行う中間層を有することで、認識処理にかかる演算負荷を好適に低減することができるようになる。
(3)入力画像とモデルの表記する物体とが一致するか否かを認識する基準を、明確に指定された記憶領域に記憶した。これにより、上記基準を、物体の変形に対する同物体の所定の部分領域と同所定の部分領域に近接する領域との相対的な幾何学特性の変化に基づいて任意に設定することができる。
【0075】
(4)モデルと認識対象との類似度の定量値を、複数の相対的な幾何学特性のそれぞれについての類似度を定量化した値毎に所定の重みを付加したものの和として求めた。これにより、物体の変形に対する物体の所定の部分領域と該所定の部分領域に近接する部分領域との相対的な幾何学特性の変化度合いが、上記各特性毎に異なる場合であれ、これを適切に反映させることができるようになる。
【0076】
(第2の実施形態)
次に、本発明にかかる画像認識装置を具体化した第2の実施形態について、上記第1の実施形態との相違点を中心に図面を参照しつつ説明する。
【0077】
図7に本実施形態において、上記部分領域類似度算出装置5や、領域集合情報類似度算出装置6の行う処理の手順を示す。
この一連の処理に先立ち、まずモデルの部分領域に、予め順位を付与しておく。すなわち、先ほどの図5(a)では、例えば部分領域M1を第1の部分領域、部分領域M2を第2の部分領域、…というように順位を付与しておく。
【0078】
そして、ステップ200においては、モデルの第1、第2の部分領域の相対的な幾何学特性と、入力画像のN個の部分領域のうちの任意の2つの部分領域との相対的な幾何学特性との類似度を算出する。すなわち、例えば先の図5に示した例では、モデルの第1、第2の部分領域の相対的な幾何学特性と、入力画像の「11P2」通りの相対的な幾何学特性との類似度を算出する。ちなみに、上式(2)において加算される順序は、モデルについては上記予め順位と一致させる。また、入力画像については、上式(2)において加算される順序の異なる部分領域の組は異なるものとして扱う。
【0079】
続くステップ210においては、上記入力画像の「11P2」通りの部分領域の組のうち、類似度の高いR個の組を抽出する。ここで、Rは、先の第1の実施形態の上記R同様、演算負荷を低減するために適宜設定する。
【0080】
一方、ステップ220では、モデルの部分領域に上記予め付与された順位に基づき新たに1つの部分領域を付け加えるとともに、入力画像についてのM個の組についても任意の1つの部分領域を新たに加える。そして、これら新たに1つずつ部分領域が加えられたものについて相対的な幾何学特性の類似度を算出する。
【0081】
続くステップ230では、上記ステップ220において算出された類似度が高いものから順にR個の入力画像の部分領域の組を抽出する。更に、ステップ240では、モデルの全ての部分領域が抽出されたか否かを判断する。そして、全ての部分領域が抽出されていない場合には、ステップ220に戻る。これに対し、全ての部分領域が抽出された場合には、ステップ250に移行する。
【0082】
ステップ250では、モデルの全ての部分領域の数に対応した数の部分領域からなる入力画像の部分領域の組の全て(R個)について、モデルとの類似度を先の図1に示した認識部7に出力する。この認識部7では、入力された類似度の値のうち、一番類似度の高いものと所定の閾値とを比較することで、モデルの表記する物体と入力画像とが一致するか否かを認識する。
【0083】
こうした態様にて類似度の算出を行う本実施形態によれば、「N×(N−1)+R×{(N−2)+(N−3)+…+1}」のオーダーの類似度の算出でよい。このため、上記Rを適宜設定することで、演算負荷を好適に低減することができるようになる。
【0084】
以上説明した本実施形態によっても、先の第1の実施形態の上記(1)〜(4)に準じた効果を得ることができる。
(第3の実施形態)
次に、本発明にかかる画像認識装置を具体化した第3の実施形態について、上記第1の実施形態との相違点を中心に図面を参照しつつ説明する。
【0085】
本実施形態では、先の図1に示した部分領域類似度算出装置5で算出された類似度に基づいて同図1に示した領域分割・領域抽出装置2における入力画像の輪郭や部分領域への分割態様を変更する。すなわち、例えばエッジ抽出で抽出される入力画像の輪郭が同入力画像の信号強度に基づき行われている場合、エッジ抽出に用いる閾値を上記算出された類似度に基づいて変更するなどすることで、輪郭や部分領域への分割態様を変更する。
【0086】
これは、モデルの部分領域と入力画像の部分領域との類似度が低い場合、物体と入力画像とが一致しない可能性の他、入力画像となる物体から抽出された輪郭や同輪郭による物体の部分領域への分割態様が不適切な可能性もあるためである。
【0087】
すなわち、例えば図8(a)に示すように、人間についての入力画像においてラインLが不適切に引かれてしまった場合、これと先の図5(a)に示した人間の顔のモデルとの一致を認識することができない。すなわち、この場合、図5(a)に示した口を示す部分領域M6に対応する部分領域が存在しない。そして、口を示す部分領域を含むかたちでボディを示す部分領域N12が抽出されている。
【0088】
こうした場合、本実施形態では、図8(b)に示すようにラインLを変更する。これにより、口を示す部分領域N6を抽出することができる。
このように本実施形態では、算出される類似度に基づき画像から抽出された輪郭や該輪郭によって複数に分割された部分領域を変更することで、物体と入力画像とが一致するか否かの認識をより高精度に行うことができるようになる。
【0089】
以上説明した本実施形態によれば、先の第1の実施形態の上記(1)〜(4)の効果に加えて、更に以下の効果が得られるようになる。
(5)算出される類似度に基づき画像から抽出された輪郭や該輪郭によって複数に分割された部分領域を変更することで、物体と入力画像とが一致するか否かの認識をより高精度に行うことができるようになる。
【0090】
(第4の実施形態)
次に、本発明にかかる画像認識装置を具体化した第4の実施形態について、上記第1の実施形態との相違点を中心に図面を参照しつつ説明する。
【0091】
本実施形態では、上記部分領域類似度算出装置5では、算出する類似度を同一、保留、不一致、不定の4段階に区分する機能を有する。また、上記領域集合情報類似度算出装置6及び認識部7では、部分領域類似度算出装置5で算出された類似度に基づいて認識対象とモデルとの類似度を同一、保留、不一致、不定の4段階に区分する機能を有する。そして、部分領域類似度算出装置5や、領域集合情報類似度算出装置6及び認識部7で保留判定がなされる場合には、新たに追加された情報を用いて再度類似度を算出するようにする。
【0092】
ここで、図9を用いて、部分領域類似度算出装置5で行う処理について更に説明する。
この一連の処理においては、まずステップ300において、上記部分領域類似度算出装置5で、先の図4に示したステップ100における処理態様にて算出される類似度Similarityを所定値Aと比較する。この所定値Aは、モデルの部分領域と入力画像の部分領域とが一致している旨判断できる値に設定される。そして、上記類似度Similarityが所定値Aよりも大きい場合には、ステップ310に移行し同一である旨判断した後、この一連の処理を一旦終了する。
【0093】
なお、上記所定値Aは、先の図1に示した重み記憶部WMと同様、明確に指定された記憶領域に記憶させる。
これに対し、ステップ300において上記類似度Similarityが所定値A以下であると判断されたときには、ステップ320に移行する。このステップ320においては、上記類似度Similarityが所定値Bよりも大きいか否かを判断する。この所定値Bは、モデルの部分領域と入力画像の部分領域とが不一致である旨を判断することのできる値に設定されている。そして、上記類似度Similarityが所定値B以下である場合には、ステップ330に移行し、不一致である旨判断した後、この一連の処理を一旦終了する。
【0094】
なお、上記所定値Bは、先の図1に示した重み記憶部WMと同様、明確に指定された記憶領域に記憶させる。
これに対し、ステップ320において上記類似度Similarityが所定値Bよりも大きいと判断されると、ステップ340において一致するか不一致であるかの判断を保留する旨を示す判定し、ステップ350に移行する。このステップ350では、今回の保留判定が2回目であるか否かを判断する。そして、2回目でない場合には、ステップ360に移行し、今回の類似度の算出に用いた情報に更に情報を追加して類似度を再度算出し、同類似度を再度評価する。
【0095】
これに対し、ステップ350において、保留判定が2回目であると判断されると、換言すれば、ステップ360の処理の後、再度保留判定がなされたときには、ステップ370において、一致するか不一致であるかを判断することができない旨を示す不定の判定をし、この一連の処理を一旦終了する。
【0096】
上記ステップ360にかかる処理は、例えば次のような処理となる。図10(a)に例示するように、ステップ340の処理において保留とされた部分領域N4(ここでは、左目を示す)について、図10(b)に示すように、これを更に分割した詳細な部分領域n1〜n3を調べる。すなわち、これら詳細な部分領域n1〜n3のそれぞれと、図10(c)に示すモデルの部分領域M4の詳細な部分領域m1〜m3のそれぞれとの類似度を算出する。ここでは、先の図4に示した処理において、入力画像を部分領域N4とし、モデルを部分領域M4とすることで、これら部分領域N4と部分領域M4との類似度Similarityを算出する。
【0097】
次に、領域集合情報類似度算出装置6において行われる処理について、図11を参照しつつ説明する。
この一連の処理においては、まずステップ400において、上記部分領域類似度算出装置5において算出された類似度に基づき、モデルの各部分領域の全てについて、これと類似度が同一又は保留となる部分領域があるか否かを判断する。
【0098】
そして、ステップ400において上記判断が肯定の場合、ステップ410に移行する。ステップ410では、上記部分領域類似度算出装置5において算出された類似度に基づき、モデルの各部分領域との類似度が同一であるものの割合が所定の割合Cよりも大きいか否かを判断する。この所定の割合Cは、認識対象とモデルの表記する物体とが一致する旨を判断できる値に設定されている。そして、所定の割合Cよりも大きいときにはステップ420に移行し、認識対象とモデルの表記する物体とが一致する旨を判断し、この一連の処理を一旦終了する。
【0099】
これに対し、ステップ410において、所定の割合C以下であると判断された場合には、ステップ430において、上記部分領域類似度算出装置5において算出された類似度に基づき、モデルの各部分領域との類似度が同一であるものの割合が所定の割合Dよりも大きいか否かを判断する。この所定の割合Dは、認識対象とモデルの表記する物体とが不一致である旨を判断できる値に設定されている。
【0100】
一方、ステップ400の判断が否定である場合、上記部分領域類似度算出装置5において算出された類似度に基づき、モデルの各部分領域との類似度が同一であるものの割合が所定の割合Eよりも大きいか否かを判断する。この所定の割合E(>C)は、認識対象とモデルの表記する物体とが一致する旨を判断できる値に設定されている。
【0101】
そして、ステップ430において所定の割合D以下であると判断されるときや、ステップ440において所定の割合E以下であると判断されたときには、ステップ450において不一致である旨判断し、この一連の処理を一旦終了する。
【0102】
一方、ステップ430において所定の割合Dよりも大きいと判断されたときや、ステップ440において所定の割合Eよりも大きいと判断されたときには、ステップ460において一致するか不一致であるかの判断を保留する旨を示す判定し、ステップ470に移行する。このステップ470では、今回の保留判定が2回目であるか否かを判断する。そして、2回目でない場合には、ステップ480に移行し、今回の類似度の算出に用いた情報に更に情報を追加して類似度を再度算出し、同類似度を再度評価する。
【0103】
これに対し、ステップ470において、保留判定が2回目であると判断されると、換言すれば、ステップ480の処理の後、再度保留判定がなされたときには、ステップ490において、一致するか不一致であるかを判断することができない旨を示す不定の判定をし、この一連の処理を一旦終了する。
【0104】
上記ステップ480にかかる処理は、例えば次のような処理となる。図12(a)に、ステップ460の処理において入力画像の顔を示す領域NFと、図12(b)に示す顔を示すモデルMFとが一致するか否かの判断を保留する旨の判断がなされた場合を例示する。すなわち、図12(a)では先の図5(b)に示した左の眉を示す部分領域N2が抽出されなかったために、領域NFとモデルMFとの一致、不一致の判定が保留とされている。
【0105】
この場合、顔を示すモデルMFについて、更にその周囲にある首を示す部分領域M9や腕を示す部分領域M10、M11を含むとともに、これら部分領域M9〜M11とモデルMFとの結合関係の定義された上位モデルを考慮する。また、入力画像の顔を示す領域NFの周囲の部分領域である首を示す部分領域N9や腕を示す部分領域N10、N11を考慮する。そして、これらモデルMFと部分領域M9〜M11との相対的な幾何学特性と、領域NFと部分領域N9〜N11との相対的な幾何学特性との類似度を算出することで、領域NFとモデルMFとの類似度を再度算出する。
【0106】
以上説明した本実施形態によれば、先の第1の実施形態の上記(1)〜(4)の効果に加えて、更に以下の効果が得られるようになる。
(6)部分領域毎の類似度について同一、不一致、不定、保留の4段階の情報を用いることで、認識にかかる処理の自由度を向上させることができるようになる。
【0107】
(7)部分領域について保留判定がなされたとき、同部分領域を複数の領域に分割した詳細な部分領域同士の類似度を求めることで、保留とした部分領域同士が一致するか否かの認識を再度行うことができるようになる。
【0108】
(8)分割した詳細な部分領域の類似度を求めた結果、更に保留と判断されるときには、分割の対象となった部分領域の類似度の判断を不定とすることで、詳細な部分領域を再度分割し、これを用いて再度類似度を算出する等の処理を回避することができる。
【0109】
(9)モデルと入力画像との類似度について同一、不一致、不定、保留の4段階の情報を用いることで、認識にかかる処理の自由度を向上させることができるようになる。
【0110】
(10)モデルと入力画像とについて保留判定がなされたとき、上位モデル内におけるモデルの相対的な幾何学特性と、入力画像のうち保留とされた部分とその周囲の領域との相対的な幾何学特性との類似度を用いることで、これらの一致、不一致について再度認識することができる。
【0111】
(11)再度の認識の結果、モデルと入力画像とが一致するか否かの認識が保留となったときには、これらの関係ついて不定である旨判断することで、上位モデルの更に上位モデルを用いて再度類似度を算出する等の処理を回避することができる。
【0112】
(第5の実施形態)
次に、本発明にかかる画像認識装置を具体化した第5の実施形態について、上記第1の実施形態との相違点を中心に図面を参照しつつ説明する。
【0113】
図13に、本実施形態の画像認識装置の全体構成を示す。
画像入力部11は、先の図1に示した画像入力部1と同様、CCDカメラ等から構成されており、外部にある観測対象を観測する部分である。領域分割・領域抽出装置12は、先の図1に示した領域分割・領域抽出装置2同様、画像入力部11から出力される画像データに対し例えばエッジ検出等を行うことで、観測対象の輪郭を抽出する。更に、領域分割・領域抽出装置2は、抽出された輪郭によって複数に分割された画像データについての部分領域を抽出する。
【0114】
一方、部分領域特徴抽出装置13では、上記領域分割・領域抽出装置12で抽出された部分領域毎にその形状、大きさ、位置、輝度、色彩等の特徴を抽出する。
【0115】
こうして抽出された部分領域にかかるデータは、部分領域特徴保持装置14にて記憶保持される。
これに対し、モデル特徴記憶装置15は、特定の物体についてのモデルのうち、同モデルの分割された領域である部分領域毎にその形状、大きさ、位置等の特徴にかかるデータを記憶保持する装置である。ただし、ここでは、部分領域として、特定の物体のうち他の物体とで共有される代表的な部分特徴のみの特徴にかかるデータが記憶保持されている。そして、例えば猫、犬、人間の顔で共有される目、鼻、口等については、共通の部分領域として同一のデータとなっている。すなわち、これら複数の動物の目や鼻、口については、その形状や互いの相対的な幾何学特性も類似度が高いために、これらの大きさ位置等の幾何学特性や、形状等について複数の動物で共通する値に設定する。
【0116】
更に、部分領域対応決定装置16では、部分領域特徴保持装置14の保持する入力画像の部分領域の特徴と、部分領域特徴記憶装置15の保持するモデルの部分領域の特徴とに基づき、これら入力画像の部分領域とモデルの部分領域との対応関係を仮に決定する。ここでは、例えば入力画像から人間の顔を認識する場合、入力画像についての部分領域からボディー、腕、足等から区別された「顔」である可能性が高い部分領域の見積もりを行う。この見積もりにかかる処理は、例えば、上記入力画像の部分領域について、Hough変換等により形状認識を行い、この形状とモデルの部分領域の形状との類似に基づき行えばよい。
【0117】
一方、部分領域類似度算出装置17では、部分領域対応決定装置16によって対応付けられた部分領域特徴保持装置14の保持する部分領域と、部分領域特徴記憶装置15の保持するモデルの部分領域との類似度を算出する。すなわち、例えば上記部分領域対応決定装置16において、モデルの顔と入力画像の所定の領域とが対応付けられた場合、モデルの顔となる領域を分割した部分領域である目、鼻、口等に対応する部分領域と上記所定の領域を分割した部分領域との類似度が算出される。
【0118】
なお、部分領域類似度算出装置17での類似度の算出結果に基づき、領域分割・領域抽出装置12では、先の第2の実施形態同様、抽出する輪郭や部分領域への分割態様を変更するようフィードバック制御を行う。
【0119】
こうして算出された部分領域の類似度に関するデータは、部分領域認識結果保持装置18に記憶保持される。
また、部分領域特徴保持装置14に保持されるデータのうち、部分領域対応決定装置16においてモデルと対応付けられたものは、領域集合情報保持装置19に記憶保持される。
【0120】
一方、領域集合情報記憶装置20は、特定の物体についてのモデルの部分領域についての上記部分領域特徴保持装置14の保持する情報を特定するデータや、これらの間の結合関係等の特徴にかかるデータを記憶保持する装置である。
【0121】
ここで、部分領域特徴保持装置14の保持する情報を特定するデータとは、部分領域特徴保持装置14において複数の物体の部分領域で共通化されていた特徴を、各物体毎に異なる厳密な特徴として定量化したものである。例えば、部分領域特徴保持装置14では複数の動物の顔についての部分領域が共通化されていたものを、各動物毎に厳密な特徴として定量化したデータである。ちなみに、これは、犬、猫、人間等の複数の動物において、目、口、鼻等の形状や、これらの互いの相対的な幾何学特性は大きくは類似しているとはいえ、より細分化、厳密化された基準に従えば各種毎に異なることを利用している。
【0122】
また、この領域集合情報記憶装置20は、各物体が固有に有する部分領域についての特徴にかかるデータも有する。すなわち、例えば複数の動物の顔についての情報において、猫のみに「ひげ」に対応する部分領域を付与する。
【0123】
そして、領域集合対応決定装置21は、領域集合情報記憶装置20の有する情報に基づいて、認識対象を、モデルの表記する複数の物体のいずれかと対応付ける処理を行う。
【0124】
そして、領域集合情報類似度算出装置22は、上記モデルと認識対象との類似度を算出する装置である。なお、領域集合情報類似度算出装置22での類似度の算出結果に基づき、領域分割・領域抽出装置12では、先の第2の実施形態同様、抽出する輪郭や部分領域への分割態様を変更するようフィードバック制御を行う。
【0125】
また、領域集合認識結果保持装置23は、上記領域集合情報類似度算出装置
22にて算出された類似度に関するデータを記憶保持する装置である。
更に、認識結果照合装置24は、部分領域認識結果保持装置18の保持する部分領域の類似度に関するデータと領域集合認識結果保持装置23の領域集合情報の類似度に関するデータとを照合し、整合性をチェックする装置である。そして、ここでこれら部分領域認識結果保持装置18及び領域集合認識結果保持装置23で保持されるデータの整合性に問題が生じるときには、上記部分領域対応決定装置16や、領域集合対応決定装置21にその旨をフィードバックする。また、認識結果照合装置24では、部分領域認識結果保持装置18及び領域集合認識結果保持装置23で保持されるデータを認識結果として外部に出力する。
【0126】
以上説明した本実施形態によれば、先の第1の実施形態の上記(1)〜(4)の効果や、先の第2の実施形態の上記(5)の効果に加えて、更に以下の効果が得られるようになる。
【0127】
(12)部分領域対応決定装置16を備えることで、入力画像とモデルとのそれぞれの部分領域の対応関係について、少ない演算量で見積もりを行うことができるため、認識処理にかかる類似度の算出の演算負荷を低減することができる。
【0128】
(13)部分領域特徴保持装置14において、特定の物体のうち他の物体とで共有される代表的な部分特徴のみの特徴にかかるデータが記憶保持されるようにした。これにより、互いに類似した特徴を有する複数の物体の認識を行う機能を有する場合であれ、同認識にかかる演算負荷を低減することができるようになる。
【0129】
なお、上記各実施形態は、以下のように変更して実施してもよい。
・モデルの所定の部分領域とこれに近接する部分領域との相対的な幾何学特性と、入力画像の所定の部分領域とこれに近接する部分領域との相対的な幾何学特性との類似度の定量化手法としては、上式(2)や上式(3)に例示したものに限らない。
【0130】
・モデルの部分領域と入力画像の部分領域との類似度の定量化手法としては、上式(1)に例示したものに限らない。
・また、モデルの部分領域と入力画像の部分領域との類似度に基づくこれらモデル及び入力画像の類似度の算出手法としては、先の図4や図7、図12に例示したものに限らない。例えば、モデルの部分領域のうちの一部について、これらと類似度の高い前記認識対象の部分領域の複数の候補をそれぞれ抽出する処理と、前記モデルの残りの部分領域と対応する前記認識対象の部分領域を前記抽出された候補に基づいて推論する範囲で、図7に示した算出手法を適宜変更してもよい。
【0131】
・類似度についての同一、不一致、不定、保留の判断態様や、こうした判定の利用手法についても上記第4の実施形態で例示したものに限らない。例えば先の図4や図7に例示した態様にて類似度の算出をした後、モデルと入力画像とが一致するか否かの判定時にのみこうした4段階の区分を行ってもよい。
【0132】
・上記各実施形態やその変形例では、類似度に基づいて特定の物体と認識対象とが一致するか否かを認識する基準にかかるデータを、明確に指定された記憶領域に格納するようにしたが、これに限らない。モデルの所定の部分領域とこれに近接する部分領域との相対的な幾何学特性と、入力画像の所定の部分領域とこれに近接する部分領域との相対的な幾何学特性との類似度に基づく認識にかかる上記基準を、例えばニューラルネットワークによる学習によって取得するようにしてもよい。この場合であれ、例えば先の第1の実施形態の上記(1)の効果を得ることはできる。
【0133】
・物体と認識対象とが一致するか否かを認識する認識手段としては、上記各実施形態等で例示した相対的な幾何学特性に基づいてモデルの所定の部分領域と前記認識対象の所定の部分領域との類似度を求め、該求めた類似度に基づいて上記認識を行う範囲で適宜変更してよい。
【図面の簡単な説明】
【図1】本発明にかかる画像認識装置の第1の実施形態の全体構成を示すブロック図。
【図2】同実施形態におけるモデルに関するデータを示す図。
【図3】互いに相似な図形を示す図。
【図4】同実施形態にかかるモデルと入力画像との類似度の算出処理にかかるフローチャート。
【図5】同実施形態におけるモデル及び入力画像を例示する図。
【図6】同実施形態におけるモデル及び入力画像の類似度の算出結果を例示する図。
【図7】第2の実施形態にかかるモデルと入力画像との類似度の算出処理にかかるフローチャート。
【図8】第3の実施形態において、エッジ抽出の変更態様を例示する図。
【図9】第4の実施形態における部分領域の類似度の算出処理にかかるフローチャート。
【図10】同実施形態における部分領域の類似度の再度の算出態様を説明する図。
【図11】同実施形態におけるモデル及び入力画像の類似度の算出処理にかかるフローチャート。
【図12】同実施形態におけるモデル及び入力画像の類似度の再度の算出態様を説明する図。
【図13】第5の実施形態の全体構成を示すブロック図。
【符号の説明】
1…画像入力部、2…領域分割・領域抽出装置、5…部分領域類似度算出装置、6…領域集合情報類似度算出装置、7…認識部、11…画像入力部、12…領域分割・領域抽出装置、16…部分領域対応決定装置、17…部分領域類似度算出装置、18…部分領域認識結果保持装置、19…領域集合情報保持装置、20…領域集合情報記憶装置、21…領域集合対応決定装置、22…領域集合情報類似度算出装置、23…保持装置、24…照合装置。
Claims (15)
- 認識対象となる画像から抽出された輪郭及び該輪郭によって複数に分割された部分領域と、特定の物体の分割された領域である部分領域及びそれら各部分領域間の結合関係を示すモデルとに基づき、前記認識対象と前記物体とが一致するか否かを認識する画像認識装置において、
前記認識対象の所定の部分領域と該所定の部分領域に近接する部分領域との相対的な幾何学特性と、前記モデルについての所定の部分領域と該所定の部分領域に近接する部分領域との相対的な幾何学特性とに基づいて前記モデルの所定の部分領域と前記認識対象の所定の部分領域との類似度を求め、該求めた類似度に基づいて前記物体と前記認識対象とが一致するか否かを認識する認識手段を備える
ことを特徴とする画像認識装置。 - 前記類似度に基づいて前記物体と前記認識対象とが一致するか否かを認識する基準にかかるデータが、明確に指定された記憶領域に記憶されてなる
請求項1記載の画像認識装置。 - 請求項1又は2記載の画像認識装置において、
前記認識手段は、前記認識対象の各部分領域とこれに近接する任意の部分領域との相対的な幾何学特性のうち、前記モデルの各部分領域とこれに近接する予め定められた部分領域との相対的な幾何学特性のそれぞれと類似度の高い複数の候補をそれぞれ抽出し、前記モデルの各部分領域のそれぞれについての前記複数の候補のいずれか1つずつからなる各部分領域間の前記幾何学特性と、前記モデルの各部分領域間の前記幾何学特性との類似度に基づいて前記物体と前記認識対象とが一致するか否かを認識する
ことを特徴とする画像認識装置。 - 請求項1又は2記載の画像認識装置において、
前記認識手段は、前記モデルの部分領域のうちの一部について、これらと類似度の高い前記認識対象の部分領域の複数の候補をそれぞれ抽出する処理と、前記モデルの残りの部分領域と対応する前記認識対象の部分領域を前記抽出された候補に基づいて推論するとともに、該推論によって取得された部分領域について該部分領域とこれに近接する部分領域との相対的な幾何学特性と、前記取得された部分領域に対応する前記モデルの部分領域とこれに近接する部分領域との相対的な幾何学特性との類似度を求める処理とを行う
ことを特徴とする画像認識装置。 - 前記相対的な幾何学特性は、所定の部分領域と該所定の部分領域に近接する部分領域との間の距離、及びこれらの間の大小関係、及びこれらの間を結ぶ線と予め定められた基準となる線との間の角度の少なくとも1つに関するものを含む
請求項1〜4のいずれか1項に記載の画像認識装置。 - 前記類似度は、複数の相対的な幾何学特性のそれぞれについての類似度を定量化した値毎に所定の重みを付加したものの和として求められる
請求項1〜5のいずれか1項に記載の画像認識装置。 - 前記所定の重みが、明確に指定された記憶領域に記憶されてなる
請求項6記載の画像認識装置。 - 請求項1〜7のいずれか1項に記載の画像認識装置において、
前記認識手段によって求められた前記モデルの部分領域と前記認識対象の部分領域との類似度に基づき、前記画像から抽出された輪郭及び該輪郭によって複数に分割された部分領域の少なくとも一方を変更する手段を更に備える
ことを特徴とする画像認識装置。 - 請求項1〜7のいずれか1項に記載の画像認識装置において、
前記認識手段は、前記モデルの部分領域と前記認識対象の部分領域との類似度を、これら部分領域が互いに一致する旨を示す同一、該部分領域が互いに相違する旨を示す不一致、該部分領域が互いに一致するか不一致であるかを判断できない旨を示す不定、該部分領域が互いに一致するか否かの判断を保留する旨を示す保留の4段階に区分する機能を有する
ことを特徴とする画像認識装置。 - 請求項9記載の画像認識装置において、
前記認識手段は、所定の部分領域について前記保留である旨判断するとき、前記モデルの他の部分領域と前記認識対象の他の部分領域との類似度に基づいて前記保留とされている部分領域が互いに一致するか否かを判断する
ことを特徴とする画像認識装置。 - 請求項9又は10記載の画像認識装置において、
前記認識手段は、前記保留である旨判断したとき、対応する前記モデルの部分領域を複数の領域に分割した詳細な部分領域と、対応する前記認識対象の部分領域を複数の領域に分割した詳細な部分領域とについての前記相対的な幾何学特性の類似度を求めることで、前記保留とした部分領域同士の類似度を再度求める
ことを特徴とする画像認識装置。 - 請求項11記載の画像認識装置において、
前記認識手段は、前記分割した詳細な部分領域の類似度を求めた結果、更に保留と判断されるときには、前記分割の対象となった部分領域の類似度の判断を不定とする
ことを特徴とする画像認識装置。 - 請求項1〜12のいずれか1項に記載の画像認識装置において、
前記認識手段は、前記モデルと前記認識対象とが一致するか否かの認識を、これらが互いに一致する旨を示す同一、これらが互いに相違する旨を示す不一致、これらが互いに一致するか不一致であるかを判断できない旨を示す不定、これらが互いに一致するか否かの判断を保留する旨を示す保留の4段階に区分する機能を有する
ことを特徴とする画像認識装置。 - 請求項13記載の画像認識装置において、
前記特定の物体の周囲の物体及びこれら特定の物体と周囲の物体との結合関係を示す上位モデルを更に備え、
前記認識手段は、前記モデルと前記認識対象とが一致するか否かの判断を保留したとき、前記認識対象及びその周囲の対象との相対的な幾何学特性と、前記上位モデル内における前記モデルの相対的な幾何学特性とに基づいて前記モデルと前記認識対象とが一致するか否かを再度認識する
ことを特徴とする画像認識装置。 - 請求項14記載の画像認識装置において、
前記認識手段は、前記再度の認識の結果、前記モデルと前記認識対象とが一致するか否かの認識が保留となったときには、前記認識対象と前記モデルとの関係ついて不定である旨判断する
ことを特徴とする画像認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003169264A JP2005004612A (ja) | 2003-06-13 | 2003-06-13 | 画像認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003169264A JP2005004612A (ja) | 2003-06-13 | 2003-06-13 | 画像認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005004612A true JP2005004612A (ja) | 2005-01-06 |
Family
ID=34094455
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003169264A Pending JP2005004612A (ja) | 2003-06-13 | 2003-06-13 | 画像認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005004612A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010147137A1 (ja) * | 2009-06-16 | 2010-12-23 | キヤノン株式会社 | パターン処理装置及びその方法、プログラム |
US8355569B2 (en) | 2006-08-10 | 2013-01-15 | Nec Corporation | Object region extracting device |
JP2013519409A (ja) * | 2010-02-10 | 2013-05-30 | アイモーフィクス リミテッド | 画像解析 |
JP7417504B2 (ja) | 2020-10-23 | 2024-01-18 | 株式会社日立ソリューションズ | 類似画像差分抽出装置、類似画像差分抽出方法、プログラム及び記録媒体 |
-
2003
- 2003-06-13 JP JP2003169264A patent/JP2005004612A/ja active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8355569B2 (en) | 2006-08-10 | 2013-01-15 | Nec Corporation | Object region extracting device |
WO2010147137A1 (ja) * | 2009-06-16 | 2010-12-23 | キヤノン株式会社 | パターン処理装置及びその方法、プログラム |
JP2011022994A (ja) * | 2009-06-16 | 2011-02-03 | Canon Inc | パターン処理装置及びその方法、プログラム |
US9117111B2 (en) | 2009-06-16 | 2015-08-25 | Canon Kabushiki Kaisha | Pattern processing apparatus and method, and program |
JP2013519409A (ja) * | 2010-02-10 | 2013-05-30 | アイモーフィクス リミテッド | 画像解析 |
JP7417504B2 (ja) | 2020-10-23 | 2024-01-18 | 株式会社日立ソリューションズ | 類似画像差分抽出装置、類似画像差分抽出方法、プログラム及び記録媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10380759B2 (en) | Posture estimating apparatus, posture estimating method and storing medium | |
JP4318465B2 (ja) | 人物検出装置および人物検出方法 | |
JP4709723B2 (ja) | 姿勢推定装置及びその方法 | |
Tsogkas et al. | Learning-based symmetry detection in natural images | |
CN110909618B (zh) | 一种宠物身份的识别方法及装置 | |
Shams et al. | Iris recognition based on LBP and combined LVQ classifier | |
CN109376604B (zh) | 一种基于人体姿态的年龄识别方法和装置 | |
JP2008059197A (ja) | 画像照合装置、画像照合方法、コンピュータプログラム及び記憶媒体 | |
Borotschnig et al. | Active Object Recognition in Parametric Eigenspace. | |
KR102325259B1 (ko) | 반려동물 생애 관리 시스템 및 그 방법 | |
JP4419543B2 (ja) | 検出装置および検出方法 | |
JP2009093490A (ja) | 年齢推定装置及びプログラム | |
Ouyang et al. | Fingerprint pose estimation based on faster R-CNN | |
Pereira et al. | Goat leather quality classification using computer vision and machine learning | |
JP2005351814A (ja) | 検出装置および検出方法 | |
Verma et al. | Estimation of sex through morphometric landmark indices in facial images with strength of evidence in logistic regression analysis | |
JP2015219868A (ja) | 情報処理装置、情報処理方法、プログラム | |
JP2005004612A (ja) | 画像認識装置 | |
JP2012128638A (ja) | 画像処理装置、位置合わせ方法及びプログラム | |
JP6486084B2 (ja) | 画像処理方法、画像処理装置、及びプログラム | |
Bustamin et al. | A portable cattle tagging based on muzzle pattern | |
Pramadihanto et al. | Integrated person identification and expression recognition from facial images | |
Velasco et al. | Segmentation of bovine livestock images using GA and ASM in a two-step approach | |
Angelopoulou et al. | Learning 2 d hand shapes using the topology preservation model gng | |
Norhikmah et al. | Implementation of 2dpca and som algorithms to determine sex according to lip shapes |