<第1の実施の形態>
本発明の第1の実施の形態について、図面を参照して説明する。図1は、本実施の形態に係る特徴量抽出装置1の機能構成の一例を示す機能ブロック図である。図1に示す通り、本実施の形態に係る特徴量抽出装置1は、第1の特徴量抽出部110と、第2の特徴量抽出部120と、特徴量生成部130と、を備えている。
第1の特徴量抽出部110は、図示しない撮像装置等によって撮影された画像内の領域であって、該画像内の部分的な領域である部分領域に含まれる画素値から第1の特徴量を抽出する。
第2の特徴量抽出部120は、画像内の領域のうち、部分領域の周辺に配置された領域である周辺領域に含まれる画素の配置情報に基づいて、第2の特徴量を抽出する。
なお、第1の特徴量は、第2の特徴量よりも、詳細に記述された特徴量である。
特徴量生成部130は、第1の特徴量と第2の特徴量とに基づいて、第3の特徴量を生成する。
このように、本実施の形態に係る特徴量抽出装置1は、画像から第1の特徴量と、第1の特徴量を抽出した領域の周辺の領域の画素の配置情報に基づいて抽出された第2の特徴量とを、抽出する。そして、特徴量抽出装置1は、抽出した第1の特徴量および第2の特徴量に基づいて、画像内に含まれる物体を認識するための特徴量を生成する。このように、画像内に含まれる物体の認識に用いる特徴量を、第1の特徴量と、第2の特徴量とから生成するため、本実施の形態に係る特徴量抽出装置1は、画像から、該画像内に含まれる物体の認識に、より有効な特徴量を抽出することができる。
<第2の実施の形態>
次に、上述した第1の実施の形態に係る特徴量抽出装置1を基本とする第2の実施の形態について説明する。なお、説明の便宜上、前述した第1の実施の形態で説明した図面に含まれる部材と同じ機能を有する部材については、同じ符号を付す。なお、図2に示す特徴量抽出システム2は、本実施の形態に特有な構成について示したものであり、図2に示す特徴量抽出システム2が図2に示されていない部材を有していてもよいことは言うまでもない。同様に、特徴量抽出装置100は、本実施の形態に特有な構成について示したものであり、特徴量抽出装置100が図2に示されていない部材を有していてもよいことは言うまでもない。
図2は、本実施の形態に係る特徴量抽出装置100を含む特徴量抽出システム2の構成および特徴量抽出装置100の機能構成の一例を示すブロック図である。図2に示す通り、特徴量抽出システム2は、撮像装置99と、特徴量抽出装置100とを備えている。撮像装置99と特徴量抽出装置100とは、互いに有線通信または無線通信可能に接続されている。これらは、互いに、例えば、ケーブル等を介して直接接続してもよいし、ネットワークを介して接続してもよい。
撮像装置99は、画像を表現する画像データを取得する手段である。撮像装置99は、被写体を撮影することにより、画像データを取得する。撮像装置99の種類は特に限定されず、たとえば、RBGカメラであってもよいし、その他の波長を用いたカメラであってもよい。また、撮像装置99は、距離センサであってもよい。この場合、撮像装置99は、距離画像を取得する。このように、本実施の形態で用いる撮像装置99の種類は特に限定されるものではなく、画像を表現する画像データが取得できるものであればよい。また、撮像装置99が取得する画像は、静止画像であってもよいし、動画像であってもよい。
撮像装置99は、取得した画像データを特徴量抽出装置100に送信する。
(特徴量抽出装置100)
特徴量抽出装置100は、撮像装置99から画像データを受信する。特徴量抽出装置100は、図2に示す通り、第1の特徴量抽出部110と、第2の特徴量抽出部120と、特徴量生成部130と、特徴量抽出領域決定部140と、を備える。
特徴量抽出領域決定部140は、撮像装置99が取得した画像データを受け取る。なお、撮像装置99が取得した画像データは、撮像装置99から特徴量抽出装置100の特徴量抽出領域決定部140に直接送信されるものであってもよい。また、撮像装置99が取得した画像データは、図示しない記憶部に格納された後、特徴量抽出装置100の特徴量抽出領域決定部140によって、該記憶部から取得されるものであってもよい。この記憶部は、特徴量抽出装置100内に内蔵されるものであってもよいし、特徴量抽出装置100とは別個の記憶装置によって実現されるものであってもよい。
特徴量抽出領域決定部140は、受け取った画像データによって表される画像から、特徴量の抽出を行う領域(特徴量抽出領域と呼ぶ)を決定する。特徴量抽出領域の大きさは、特に限定されるものではなく、任意の大きさであってもよい。特徴量抽出領域の大きさは、例えば、予め定めた一定値でもよいし、画像中に含まれる物体の大きさに合わせて正規化された大きさであってもよい。また、撮像装置99が距離センサの場合、特徴量抽出領域の大きさは、該距離センサが画像データを取得可能な距離に応じて決定されるものであってもよい。
また、特徴量抽出領域決定部140が決定する特徴量抽出領域の画像内の場所について、図3を参照して説明する。図3は、画像内における特徴量抽出領域の場所を説明するための図である。図3に示すように画像IMG30内には、被写体としてりんごが含まれる。
特徴量抽出領域決定部140は、図3に示すように、予め定めた一定の間隔ごとに、特徴量抽出領域A31の場所を決定してもよい。また、特徴量抽出領域決定部140は、画像内のランダムな場所を特徴量抽出領域の場所として決定してもよい。なお、特徴量抽出領域決定部140が決定する特徴量抽出領域の場所は、これに限定されるものではなく、任意の条件に基づいて決定されるものであってもよい。例えば、特徴量抽出領域決定部140は、画像内の領域のうち、色の偏りが、その周辺の領域より高いまたは低い場所を含む領域を特徴量抽出領域として決定してもよい。また、特徴量抽出領域決定部140は、例えば、輝度勾配が局所的に最大になるような点の場所を含む、所定の大きさの領域を特徴量抽出領域として決定してもよい。
また、特徴量抽出領域決定部140が決定する特徴量抽出領域の形状は、図3に示すような円状であってもよいし、矩形であってもよいし、その他の形状であってもよい。
特徴量抽出領域決定部140は、撮像装置99から受け取った画像データと、該画像データによって示される画像における決定した特徴量抽出領域を示す情報とを、第1の特徴量抽出部110および第2の特徴量抽出部120に供給する。なお、特徴量抽出領域決定部140は、決定した各特徴量抽出領域に含まれる画像を示す画像データ(抽出領域画像データ)を、第1の特徴量抽出部110および第2の特徴量抽出部120に供給してもよい。
第1の特徴量抽出部110は、特徴量抽出領域決定部140から、画像データと、特徴量抽出領域を示す情報とを、受け取る。または、第1の特徴量抽出部110は、特徴量抽出領域決定部140から抽出領域画像データを受け取る。第1の特徴量抽出部110は、図2に示す通り、部分領域決定部111と、部分領域特徴量抽出部112とを含む。
部分領域決定部111は、特徴量抽出領域を示す情報と、画像データとに基づいて、特徴量抽出領域内の画像から部分領域を決定する。または、部分領域決定部111は、特徴量抽出領域決定部140から抽出領域画像データを受け取った場合、該抽出領域画像データによって示される画像(特徴量抽出領域の画像)から部分領域を決定する。ここで、部分領域とは、後述する第2の特徴量抽出部120が抽出する特徴量よりも詳細な特徴量を抽出する領域を示す。この部分領域について、図4を参照して説明する。図4は、本実施の形態に係る第1の特徴量抽出部110が決定する部分領域および第2の特徴量抽出部120が決定する周辺領域の一例を説明するための図である。なお、周辺領域については、第2の特徴量抽出部120の説明のところで、詳述する。
図4では、図3を用いて説明した特徴量抽出領域A31を破線で示している。部分領域決定部111は、この特徴量抽出領域A31内の中央付近に、所定の面積を有するように、部分領域C41を決定する。なお、部分領域決定部111が部分領域C41を決定する方法は特に限定されず、特徴量抽出領域A31の中央付近でなくてもよい。また、部分領域決定部111は、部分領域C41の面積が、他の領域(後述する周辺領域)の面積に対して所定の比となるように、部分領域C41を決定してもよい。
部分領域決定部111は、決定した部分領域が、特徴量抽出領域内のどの領域であるかを示す情報(部分領域情報)を、第2の特徴量抽出部120に供給する。この部分領域情報には、部分領域が含まれる特徴量抽出領域を示す情報と、該特徴量抽出領域内の部分領域の位置や大きさを示す情報が含まれる。
また、部分領域決定部111は、決定した部分領域の画像を示す部分領域画像データを、部分領域特徴量抽出部112に供給する。このとき、部分領域決定部111は、部分領域がどの位置の部分領域か(どの特徴量抽出領域の部分領域か)を示す情報も併せて、部分領域特徴量抽出部112に供給する。
部分領域特徴量抽出部112は、部分領域決定部111から、該部分領域決定部111が決定した部分領域における画像を示す部分領域画像データを受信する。部分領域特徴量抽出部112は、受け取った部分領域画像データに基づいて、部分領域決定部111が決定した部分領域の画素値から、該画素を表現する特徴量(第1の特徴量と呼ぶ)を抽出する。部分領域特徴量抽出部112は、該部分領域の画素値に基づいて、該部分領域に含まれる1または複数の画素の夫々における色や濃度の特徴、該部分領域のテクスチャの特徴等の第1の特徴量を抽出する。第1の特徴量は、後述する第2の特徴量(第2の特徴量抽出部120が抽出する特徴量)よりも、詳細に記述された特徴量である。第1の特徴量は、例えば、第2の特徴量よりも次元数が多い特徴量であってもよい。また、第1の特徴量は、例えば、第2の特徴量を表す特徴量空間における量子化幅より狭い量子化幅を有する特徴量空間で表される特徴量であってもよい。
また、例えば、部分領域特徴量抽出部112は、部分領域に含まれる画素の画素値を量子化し、該部分領域において、この量子化された画素値の出現頻度をヒストグラム化する。そして、部分領域特徴量抽出部112は、このヒストグラムを第1の特徴量として抽出してもよい。これにより、部分領域特徴量抽出部112は、より詳細に記述された第1の特徴量を得ることができる。
部分領域特徴量抽出部112は、抽出した第1の特徴量を特徴量生成部130に供給する。このとき、部分領域特徴量抽出部112は、抽出した第1の特徴量が、どの特徴量抽出領域における部分領域の特徴量かを示す情報と共に、特徴量生成部130に供給することが好ましい。
第2の特徴量抽出部120は、特徴量抽出領域決定部140から、画像データと、特徴量抽出領域を示す情報とを、受け取る。または、第2の特徴量抽出部120は、特徴量抽出領域決定部140から抽出領域画像データを受け取る。また、第2の特徴量抽出部120は、第1の特徴量抽出部110の部分領域決定部111から、部分領域情報を受信する。第2の特徴量抽出部120は、図2に示す通り、周辺領域決定部121と、周辺領域特徴量抽出部122とを含む。
周辺領域決定部121は、特徴量抽出領域を示す情報と、画像データと、部分領域情報とに基づいて、該特徴量抽出領域内の部分領域の周辺の領域を周辺領域として決定する。なお、周辺領域決定部121が特徴量抽出領域決定部140から、抽出領域画像データを受け取った場合、該抽出領域画像データによって示される画像(特徴量抽出領域の画像)から部分領域の周辺の領域を周辺領域として決定する。
この周辺領域について、図4を参照して説明する。周辺領域決定部121は、図4に示す部分領域C41の周辺の領域を周辺領域P42として、決定する。このとき、周辺領域決定部121は、部分領域C41の周囲を囲む領域を所定の大きさに分割して、該分割した各領域を夫々周辺領域P42として決定している。なお、分割の方法はこれに限定されるものではない。図5に、本実施の形態に係る第1の特徴量抽出部110が決定する部分領域および第2の特徴量抽出部120が決定する周辺領域の他の例を示す。図5に示す通り、周辺領域P42は、部分領域C41の周囲に、該部分領域C41を中心とした同心円で区切られた領域を、更に該部分領域C41を中心として放射状に伸びた線分で区切った領域であってもよい。
また、周辺領域決定部121は、図5に示すような複数の周辺領域P42の夫々と、部分領域C41との画素情報の差を算出し、その差の値の大小に応じて、特徴量を抽出する周辺領域を決定してもよい。ここで、画素情報とは、各領域に含まれる画素値の合計であってもよいし、画素値の平均であってもよい。また、例えば、周辺領域決定部121は、各領域と他の領域との境界の画素値そのものを画素情報として用いて、上記周辺領域を決定してもよい。
このように、周辺領域決定部121は、部分領域の位置、および、部分領域と、その近傍との画素情報の少なくとも何れかに基づいて、周辺領域を決定すればよい。これにより、周辺領域決定部121は、認識に用いるより最適な特徴量を抽出する領域を決定することができる。
また、周辺領域決定部121が決定する周辺領域の形状は、特に限定されるものではなく、円形であってもよいし、矩形であってもよいし、その他の形状であってもよい。
周辺領域決定部121は、決定した1または複数の周辺領域の画像を示す周辺領域画像データを、周辺領域特徴量抽出部122に供給する。このとき、周辺領域決定部121は、周辺領域がどの位置の領域か(どの特徴量抽出領域の周辺領域か)を示す情報も併せて、周辺領域特徴量抽出部122に供給する。
周辺領域特徴量抽出部122は、周辺領域決定部121から、該周辺領域決定部121が決定した周辺領域における画像を示す周辺領域画像データを受信する。周辺領域特徴量抽出部122は、受け取った周辺領域画像データに基づいて、周辺領域決定部121が決定した周辺領域における画素の配置を示す情報(配置情報)から、該周辺領域の特徴量(第2の特徴量と呼ぶ)を抽出する。
ここで、図6を参照して、周辺領域特徴量抽出部122が抽出する第2の特徴量について説明する。図6は、本実施の形態に係る第2の特徴量抽出部120の周辺領域特徴量抽出部122の動作を説明するための図である。図6の左側の図は、図3と同様の画像IMG30である。そして、説明の便宜上、図6では、1箇所の特徴量抽出領域を用いて、第2の特徴量を抽出することについて説明するが、特徴量抽出領域は1箇所に限定されるものではない。
図6の左側の画像IMG30において、特徴量抽出領域A31内には、部分領域決定部111によって決定された部分領域C41が含まれる。また、特徴量抽出領域A31内において、部分領域C41の周辺には、周辺領域決定部121によって決定された8箇所の周辺領域P42が含まれる。
周辺領域特徴量抽出部122は、この8箇所の周辺領域P42の夫々において、特徴量を抽出する。例えば、周辺領域特徴量抽出部122は、図6の右下に示すようなヒストグラムを用いて、各周辺領域P42の特徴量を抽出する。図6の右下に示すヒストグラムの横軸は、ビンを示す。図6では、各ビンを破線で区切って表現している。図6では、1か所の周辺領域に対し、1つのビンが関連付けられている。図6に示すヒストグラムの1つのビンは、代表的なテクスチャとして、無地の部分と、網掛けの部分を示している。また、図6に示すヒストグラムの縦軸は、各テクスチャの値を示している。
このように、周辺領域特徴量抽出部122は、各周辺領域に対し、該周辺領域に含まれる画素値を量子化し、周辺領域毎に量子化した画素値の出現頻度のヒストグラムを算出する。
なお、図6のヒストグラムでは、代表テクスチャを用いて、各周辺領域の特徴量を表したが、本実施の形態はこれに限定されるものではなく、各周辺領域の代表色を用いて各周辺領域の特徴量を表現してもよい。
そして、周辺領域特徴量抽出部122は、このように抽出されたヒストグラムを用いて、第2の特徴量を記述する。例えば、周辺領域特徴量抽出部122は、図6の右上に示すような、ベクトルで第2の特徴量を表現してもよい。第2の特徴量は、算出したヒストグラムの値を連結したベクトルであってもよい。また、第2の特徴量は、各周辺領域間のヒストグラム値の差を算出し、これらを連結したベクトルであってもよい。また、第2の特徴量は、各周辺領域の部分領域に対する位置を量子化したものと量子化した画素値(ヒストグラム値)とが同時に出現する頻度を示すヒストグラムであってもよい。
また、第2の特徴量は、周辺領域の位置の情報、各周辺領域に含まれる画素値、周辺領域間の画素値の差や位置の差などを並べて表現したベクトルであってもよい。また、第2の特徴量は、周辺領域間の相対位置と各周辺領域の代表色の組み合わせを並べたベクトルであってもよい。また、第2の特徴量は、これに限定されるものではなく、他の配置に関連する画素情報を表す特徴量であってもよい。このように、第2の特徴量は、周辺領域に含まれる画素の配置情報を含む特徴量であることが好ましい。
周辺領域特徴量抽出部122は、抽出した第2の特徴量を特徴量生成部130に供給する。このとき、周辺領域特徴量抽出部122は、抽出した第2の特徴量が、どの特徴量抽出領域における周辺領域の特徴量かを示す情報と共に、特徴量生成部130に供給することが好ましい。
特徴量生成部130は、部分領域特徴量抽出部112から第1の特徴量を受け取る。また、特徴量生成部130は、周辺領域特徴量抽出部122から第2の特徴量を受け取る。特徴量生成部130は、第1の特徴量が抽出された部分領域が含まれる特徴量抽出領域と、同じ特徴量抽出領域の周辺領域から抽出された第2の特徴量を、該特徴量抽出領域に対する特徴量(第3の特徴量)として生成する。このとき、特徴量生成部130は、例えば、以下の式(1)を用いて、特徴量抽出領域毎の特徴量vを生成する。
ここで、αおよびβは夫々スカラー係数を示す。また、vfirstは、第1の特徴量を示し、vsecondは、第2の特徴量を示す。そして、(vfirst,vsecond)は、ベクトルvfirstと、ベクトルvsecondとを連結することを示す。これにより、特徴量生成部130は、上記特徴量v(統合特徴量と呼ぶ)を、特徴量抽出領域毎に生成することができる。
(特徴量抽出装置100の動作)
次に、図7を用いて、特徴量抽出装置100の動作(特徴量抽出処理)について説明する。図7は、本実施の形態に係る特徴量抽出装置100の動作の流れの一例を示すフローチャートである。
図7に示す通り、まず、特徴量抽出装置100の特徴量抽出領域決定部140が画像データを取得(受信)する(ステップS101)。そして、該特徴量抽出領域決定部140は、取得した画像データによって表される画像から、特徴量抽出領域を決定する(ステップS102)。
そして、第1の特徴量抽出部110の部分領域決定部111が、ステップS102で決定された特徴量抽出領域から部分領域を決定する(ステップS103)。このステップS103以降の処理は、ステップS102にて決定された特徴量抽出領域毎に行われる。その後、第1の特徴量抽出部110の部分領域特徴量抽出部112がステップS103で決定された部分領域から、第1の特徴量を抽出する(ステップS104)。
また、第2の特徴量抽出部120の周辺領域決定部121が、ステップS102で決定された特徴量抽出領域から、ステップS103で決定された部分領域の周辺の領域である周辺領域を決定する(ステップS105)。なお、ステップS105は、ステップS103の後であればよく、ステップS104より先に行われてもよいし、同時に行われてもよい。
その後、第2の特徴量抽出部120の周辺領域特徴量抽出部122が、ステップS105で決定された周辺領域から、第2の特徴量を抽出する(ステップS106)。
そして、特徴量生成部130が、ステップS104にて抽出された第1の特徴量と、ステップS106にて抽出された第2の特徴量とに基づいて、これらを統合した統合特徴量を生成し(ステップS107)、特徴量抽出装置100の処理を終了する。
この特徴量抽出処理によって、特徴量抽出装置100は、ステップS101で取得した画像データによって表される画像に対し、ステップS102にて決定された特徴量抽出領域の数と同数の統合特徴量を抽出することができる。
(効果)
本実施の形態に係る特徴量抽出装置100によれば、画像から、該画像内に含まれる物体の認識に、より有効な特徴量を抽出することができる。
なぜならば、第1の特徴量抽出部110が、画像の部分領域に含まれる画素値から第1の特徴量を抽出し、第2の特徴量抽出部120が部分領域の周辺に配置された領域である周辺領域に含まれる画素の配置情報に基づいて、第2の特徴量を抽出するからである。そして、特徴量生成部130が、第1の特徴量と第2の特徴量とに基づいて、統合特徴量を生成するからである。
第1の特徴量は、特徴量抽出領域内において、第2の特徴量より詳細に記述された特徴量である。第1の特徴量抽出部110は、このような第1の特徴量を抽出可能な領域を部分領域として決定し、該部分領域の画素値から第1の特徴量を抽出する。また、第2の特徴量抽出部120は、部分領域の周辺に配置された画素の配置の特徴量を抽出するために、該部分領域の周辺の領域を周辺領域として決定する。そして、第2の特徴量抽出部120は、決定した周辺領域に含まれる画素の配置情報に基づいて、該周辺領域に配置された画素の画素値から第2の特徴量を抽出する。
このように、本実施の形態に係る特徴量抽出装置100は、第1の特徴量と第2の特徴量との夫々を抽出する領域を効果的に決定している。このように決定された領域から抽出された第1の特徴量および第2の特徴量に基づいて生成された統合特徴量は、該画像内に含まれる物体の認識に、より有効な特徴量となる。
したがって、本実施の形態に係る特徴量抽出装置100は、認識性能が高い特徴量を、画像から抽出することができる。
また、第1の特徴量が第2の特徴量よりも、詳細に記述された特徴量である。そのため、全ての周辺領域の夫々に対する第2の特徴量を、第1の特徴量と同じように詳細に記述した場合に比べ、本実施の形態に係る第2の特徴量抽出部120が出力する第2の特徴量のデータ量は、小さくなる。これにより、本実施の形態に係る特徴量抽出装置100は、認識精度を下げることなく、認識に用いるデータ量を削減することができる。
また、上述したとおり、特徴量抽出領域決定部140が、画像データから、特徴量抽出領域を決定する。これにより、第1の特徴量抽出部110および第2の特徴量抽出部120が夫々部分領域および周辺領域を決定する際に用いるデータ量および計算量を、画像データそのものを用いて決定する場合に比べ、削減することができる。
<第3の実施の形態>
次に、本発明の第3の実施の形態について説明する。なお、説明の便宜上、前述した第1および第2の実施の形態で説明した図面に含まれる部材と同じ機能を有する部材については、同じ符号を付し、その説明を省略する。
図8は、本実施の形態に係る特徴量抽出装置200を含む特徴量抽出システム3の構成および特徴量抽出装置200の機能構成の一例を示すブロック図である。図8に示す特徴量抽出システム3の特徴量抽出装置200は、第2の実施の形態に係る特徴量抽出装置100に、重要度算出部250と、認識部260とを更に備える構成である。このように、本実施の形態に係る特徴量抽出装置200は、認識部260を備えた認識装置であるともいえる。つまり、本実施の形態に係る特徴量抽出装置200は、上述した特徴量抽出装置100を備えた認識装置と言い換えることができる。
図8に示す通り、特徴量抽出システム3は、撮像装置99と、特徴量抽出装置200とを備えている。撮像装置99と特徴量抽出装置200とは、互いに有線通信または無線通信可能に接続されている。これらは、互いに、例えば、ケーブル等を介して直接接続してもよいし、ネットワークを介して接続してもよい。
(特徴量抽出装置200)
特徴量抽出装置200は、撮像装置99から画像データを受信する。特徴量抽出装置200は、図8に示す通り、第1の特徴量抽出部110と、第2の特徴量抽出部120と、特徴量生成部130と、特徴量抽出領域決定部140と、重要度算出部250と、認識部260とを備える。
なお、第1の特徴量抽出部110、第2の特徴量抽出部120、特徴量生成部130および特徴量抽出領域決定部140については、第2の実施の形態で説明した動作と異なる点だけ説明する。
特徴量抽出領域決定部140は、撮像装置99から受け取った画像データと、決定した特徴量抽出領域を示す情報とを、重要度算出部250に供給する。また、第1の特徴量抽出部110の部分領域決定部111は、決定した部分領域を示す情報を重要度算出部250に供給する。また、第2の特徴量抽出部120の周辺領域決定部121は、決定した周辺領域を示す情報を重要度算出部250に供給する。また、特徴量生成部130は、生成した特徴量抽出領域毎の統合特徴量を、どの特徴量抽出領域の統合特徴量かを示す情報と共に、認識部260に出力する。
重要度算出部250は、特徴量抽出領域決定部140から、画像データと、特徴量抽出領域を示す情報とを受け取る。また、重要度算出部250は、部分領域決定部111から、部分領域を示す情報を受け取る。また、重要度算出部250は、周辺領域決定部121から周辺領域を示す情報を受け取る。特徴量抽出領域決定部140、第1の特徴量抽出部110、第2の特徴量抽出部120の夫々から受け取った情報を用いて、画像データによって表される画像における各特徴量抽出領域に対する重要度を算出する。ここで、特徴量生成部130は、上述したとおり、特徴量抽出領域毎に、統合特徴量を生成するため、重要度算出部250が算出する重要度は、各統合特徴量に対する重要度ともいえる。重要度算出部250は、例えば、部分領域と、各周辺領域との画素値の差を算出し、この差に基づいて、各特徴量抽出領域の重要度を決定してもよい。
重要度算出部250が算出する特徴量抽出領域の重要度について、図9を参照して説明する。図9は、本実施の形態に係る特徴量抽出装置200の重要度算出部250の動作を説明するための図である。図9の左図は、特徴量抽出装置200が取得(受信)した画像データによって示される画像IMG80を示している。図9の左図に示すように画像IMG80内には、被写体としてトマト(認識対象T81)が含まれる。特徴量抽出領域決定部140は、この画像IMG80から特徴量抽出領域を決定する。そして、第1の特徴量抽出部110が、各特徴量抽出領域に対し、第1の特徴量を抽出し、第2の特徴量抽出部120が、各特徴量抽出領域第2の特徴量を抽出しているとする。
そして、重要度算出部250が、特徴量抽出領域毎に、部分領域と1以上の周辺領域との画素値の差を算出する。図9の右図は、重要度算出部250が算出した画素値の差に応じた色を画像IMG80にマッピングした図(MAP84)である。図9の右図(MAP84)では、画素値の差がより大きい値の場所を白く、より小さい値の場所を黒くしている。
図9の左図に示す通り、認識対象T81において、へたの部分(T82)は実の部分(T83)と異なる色である。そのため、このへたの部分(T82)の画素値と、周辺領域(例えば、実の部分(T83))の画素値との差は、大きい値となる。また、認識対象T81の外周部分は、IMG80の背景と異なる色であるため、この部分(外周部分)と、背景部分との画素値の差は大きくなる。
したがって、図9の右図に示す通り、MAP84において、へたの部分に対応する箇所(T85)、および、認識対象T81の外周部分に対応する箇所(T86)は、白に近い色で表現される。また、MAP84において、その他の部分は、より黒に近い色で表現される。
そして、重要度算出部250は、MAP84において、白い箇所をより重要度が高い箇所とし、黒い箇所をより重要度が低い箇所とする。この重要度は、0から1の数値で表されてもよい。この場合、1に近づくにつれ、重要度が高くなる。また、重要度算出部250は、ある特徴量抽出領域内で、重要度が高い場所と低い場所と、が存在する場合、重要度の平均を特徴量抽出領域に対する重要度としてもよいし、合計をこの特徴量抽出領域に対する重要度としてもよい。
なお、重要度算出部250が重要度を算出する方法は特に限定されず、例えば、重要度算出部250は、ある特徴量抽出領域における周辺領域の画素値が一様である場合に重要度が高くなるように、重要度を算出してもよい。また、特徴量抽出領域決定部140が、特徴量抽出領域を決定する際に用いたデータに基づいて、重要度を算出してもよい。特徴量抽出領域決定部140が特徴量抽出領域を決定する際に用いたデータとは、例えば、特徴量抽出領域決定部140が画像内の領域のうち、色の偏りが、その周辺の領域より高いまたは低い場所を含む領域を特徴量抽出領域として決定した場合に用いた値である。また、重要度算出部250は、部分領域特徴量抽出部112および/または周辺領域特徴量抽出部122が特徴量を抽出する際に用いた値(例えば、画素値)に基づいて、重要度を算出してもよい。このように、重要度算出部250は、部分領域の画素値および周辺領域の画素値の少なくとも何れかに基づいて、重要度を算出する。
これにより、特徴量抽出装置200は、画像中において、どの特徴量抽出領域から抽出された統合特徴量がより重要度が高いかを示すことができる。
重要度算出部250は、算出した特徴量抽出領域毎の重要度を、重要度を算出した特徴量抽出領域を示す情報に関連付けて、認識部260に出力する。
認識部260は、特徴量生成部130から特徴量抽出領域毎の統合特徴量を受け取る。また、認識部260は、重要度算出部250から特徴量抽出領域毎の重要度を受け取る。そして、認識部260は、統合特徴量と、重要度とを用いて、特徴量抽出領域決定部140が受信(取得)した画像データによって示される画像内の物体(図9の左図においては、認識対象T81)の認識を行う。
認識部260の動作について、図10を参照して説明する。図10は、本実施の形態に係る特徴量抽出装置200の認識部260の動作の一例を説明するための図である。まず、特徴量抽出領域決定部140が、図9に示した画像IMG80から、例えば、3箇所の特徴量抽出領域を決定したとする。なお、以下では、この3箇所の特徴量抽出領域の夫々を、特徴量抽出領域(A91、A92、A93)と呼ぶ。そして、特徴量生成部130によって、この特徴量抽出領域(A91、A92、A93)の夫々の統合特徴量(F91、F92、F93)が生成されたとする。統合特徴量(F91、F92、F93)は、夫々、図10に示す通り、(0.3、0.1、・・・)、(0.2、0.4、・・・)、(0.1、0.1、・・・)であるとする。
また、重要度算出部250によって、特徴量抽出領域(A91、A92、A93)の夫々の重要度(W91、W92、W93)が、算出されたとする。重要度(W91、W92、W93)は、夫々、図10に示す通り、0.5、0.9、0.2であるとする。
認識部260は、図10に示す通り、識別器261と、記憶部262と、投票部263と、選択部264と、を備えている。なお、図10に示す認識部260の構成は、認識部260の動作の一例を説明するための部材であり、本実施の形態はこれに限定されるものではない。
認識部260の識別器261は、図10に示す通り、特徴量生成部130から統合特徴量(F91、F92、F93)を受け取る。ここで、識別器261は、統合特徴量(F91、F92、F93)を別々に受け取ってもよいし、これらをまとめた状態で受け取ってもよい。
記憶部262には、識別器261で識別に使用するための辞書が格納されている。なお、記憶部262は、識別器261内に内蔵されるものであってもよいし、認識部260とは別個の記憶部であってもよい。この辞書は、予め学習用画像として用意された正解ラベル付きの画像に基づいて、第1の特徴量抽出部110および第2の特徴量抽出部120が夫々算出した第1の特徴量および第2の特徴量を用いて、識別器261を学習させることにより生成されたものである。識別器261は、例えば、Support Vector Machineを用いた識別器であってもよいし、最近傍識別器であってもよいし、その他の識別器であってもよい。
識別器261は、統合特徴量毎に、認識を行う。そして、識別器261は、統合特徴量(F91、F92、F93)の夫々に対する識別結果(R91、R92、R93)を、投票部263に出力する。なお、識別器261は、図10に示す通り、各識別結果を別個に出力してもよいし、まとめて出力してもよい。
投票部263は、重要度算出部250から、重要度(W91、W92、W93)を受け取る。なお、投票部263は、重要度(W91、W92、W93)を別々に受け取ってもよいし、これらをまとめた状態で受け取ってもよい。また、投票部263は、識別器261から識別結果(R91、R92、R93)を受け取る。
そして、投票部263は、識別結果に対し、該識別結果に関連付く統合特徴量の重要度に基づいて、重みづけを行う。本実施の形態では、重要度を重みとして掛け合わせるとするが、重みづけの方法はこれに限定されるものではない。
具体的には、投票部263は、識別結果R91に対し、識別を行った統合特徴量F91に関連付けられた特徴量抽出領域A91の重要度W91を掛け合わせる。同様に、投票部263は、識別結果R92に、重要度W92を掛け合わせ、識別結果R93に、重要度W93を掛け合わせる。
その後、投票部263は、重みづけを行った識別結果を用いて、投票を行う。図11に投票部263が投票を行った結果の一例を示す。図11に示す投票結果の横軸は、認識されたカテゴリを示す情報(例えばカテゴリ名)を示し、縦軸は各カテゴリに対するスコアを示す。このスコアは高いほど、認識の信頼度が高いことを示す。ここで、カテゴリとは、認識された物体を表すものであり、物体そのものであってもよいし、物体を示す名前や識別子であってもよいし、物体の種類であってもよい。
本実施の形態では、投票結果は、図11に示すように、カテゴリBB、カテゴリAA、カテゴリCCの順番であるとする。投票部263は、このような投票結果を、選択部264に出力する。
選択部264は、投票部263から投票結果を受信する。選択部264は、投票結果に基づいて、画像IMG80に含まれる認識対象T81に対する最終的な認識結果を出力する。本実施の形態では、上述したとおり、図11に示す各カテゴリに対するスコアが高いものが認識の信頼度が高いことを示しているため、選択部264は、スコアが最も高いカテゴリBBを、認識対象T81に対する認識結果として選択する。
これにより、認識部260は、選択部264が選択した認識結果(上記の例では、「カテゴリBB」)を出力する。なお、認識部260が出力する認識結果は、カテゴリを表す名称、および/または、該カテゴリを示すインデックスであってもよい。また、認識部260は、カテゴリを表す名称および/またはインデックスに加え、上述したスコアを認識結果として出力してもよい。
(特徴量抽出装置200の動作)
次に、図12を用いて、特徴量抽出装置200の動作について説明する。図12は、本実施の形態に係る特徴量抽出装置200の動作の流れの一例を示すフローチャートである。
図12に示すステップS201〜ステップS207の夫々は、上述したステップS101〜ステップS107と同様の特徴量抽出処理であるため、説明を省略する。
ステップS207終了後、重要度算出部250は、特徴量抽出領域毎の重要度を算出する(ステップS208)。なお、ステップS208は、ステップS204およびステップS207と同時に行われてもよいし、これらの前に行われてもよい。ステップS208は、ステップS203と、ステップS205とが終了した時点で行われればよい。
そして、認識部260は、認識処理を行う(ステップS209)。認識部260が図10に示す構成の場合、認識部260の識別器261がこの認識処理を行う。そして、認識部260の投票部263が重み付け投票を行う(ステップS210)。その後、認識部260は、全ての統合特徴量に対して、認識処理を行ったか否かを確認する(ステップS211)。言い換えれば、認識部260は、全ての特徴量抽出領域に対して、認識処理を行ったか否かを確認する。
全ての統合特徴量に対して、認識処理を行っていない場合(ステップS211にてNO)、認識部260は、ステップS209に戻り、認識処理を行っていない統合特徴量に対し、認識処理を行う。全ての統合特徴量に対して、認識処理を行った場合(ステップS211にてYES)、認識部260の選択部264は、投票結果に基づいて、ステップS201にて取得した画像データに含まれる認識対象(物体)の認識結果を選択(決定)し、出力する(ステップS212)。
これにより、特徴量抽出装置200は、一連の処理を終了する。
なお、本実施の形態では、1つの画像内に1つの対象物が含まれることを例に説明を行ったが、本発明はこれに限定されるものではなく、1つの画像内に複数の対象物が含まれていてもよい。この場合、認識部260は、認識結果を対象物ごとに出力すればよい。また、1つの画像内に複数の対象物が含まれている場合、特徴量抽出領域決定部140が特徴量抽出領域を抽出する前に、対象物ごとに画像を分割して、その分割した画像ごとに、上記の一連の処理を行ってもよい。
(効果)
本実施の形態に係る特徴量抽出装置200は、上述した第2の実施の形態と同様の効果を得ることができる。また、本実施の形態に係る特徴量抽出装置200は、各特徴量抽出領域に対して算出された重要度を用いて、物体の認識を行うため、より高い精度で認識を行うことができる。
なお、本実施の形態に係る特徴量抽出装置(認識装置)200は、重要度算出部250が重要度を算出し、この重要度を用いて認識を行ったが、本発明はこれに限定されるものではない。認識装置は、統合特徴量のみを用いて認識を行ってもよい。つまり、認識装置は、第1の実施の形態に係る特徴量抽出装置100に認識部260を備える構成であってもよい。このような構成であっても、統合特徴量が部分領域の特徴量と、周辺領域の特徴量とを含んでいるため、認識装置は、精度が高い(識別性能が高い)認識を行うことができる。また、重要度を用いて認識を行うことにより、認識装置は、より高い精度で認識を行うことができる。
<第4の実施の形態>
次に、本発明の第4の実施の形態について説明する。なお、説明の便宜上、前述した第1から第3の実施の形態で説明した図面に含まれる部材と同じ機能を有する部材については、同じ符号を付し、その説明を省略する。
上述した各実施の形態では、画像データを用いて、特徴量抽出処理を行った。この場合、画像データによって示される画像は、静止画像であってもよいし、動画像であってもよい。これらの画像には、ノイズが含まれる可能性がある。したがって、本実施の形態では、画像データからノイズを除去する方法について説明する。
図13は、本実施の形態に係る特徴量抽出装置300を含む特徴量抽出システム4の構成および特徴量抽出装置200の機能構成の一例を示すブロック図である。図13に示す特徴量抽出システム4の特徴量抽出装置300は、第2の実施の形態に係る特徴量抽出装置100に、フレーム選択部370と、ノイズ除去部380とを更に備える構成である。なお、本実施の形態に係る特徴量抽出装置300は、第1の実施の形態に係る特徴量抽出装置1にフレーム選択部370と、ノイズ除去部380とを備える構成であってもよい。また、本実施の形態に係る特徴量抽出装置300は、第3の実施の形態に係る特徴量抽出装置200に、フレーム選択部370と、ノイズ除去部380とを備える構成であってもよい。
図13に示す通り、特徴量抽出システム4は、撮像装置99と、特徴量抽出装置300とを備えている。撮像装置99と特徴量抽出装置300とは、互いに有線通信または無線通信可能に接続されている。これらは、互いに、例えば、ケーブル等を介して直接接続してもよいし、ネットワークを介して接続してもよい。
(特徴量抽出装置300)
特徴量抽出装置300は、撮像装置99から画像データを受信する。特徴量抽出装置300は、図13に示す通り、第1の特徴量抽出部110と、第2の特徴量抽出部120と、特徴量生成部130と、特徴量抽出領域決定部140と、フレーム選択部370と、ノイズ除去部380とを備える。
ここで、本実施の形態に係る撮像装置99が撮影し、特徴量抽出装置300に送信する画像データは、連続したデータであるとする。例えば、撮像装置99が撮影した画像が動画像の場合、撮像装置99は、特徴量抽出装置300に連続した複数枚のフレームを送信する。また、撮像装置99が撮影した画像が静止画像であり、例えば、連写等によって連続して撮影された画像である場合、撮像装置99は、この連続した複数枚の静止画像を送信する。本実施の形態では、このように、特徴量抽出装置300が連続した複数枚の画像を受信することを前提に説明を行う。
以下では、連続した複数枚の画像における各画像をフレームと呼ぶこととする。
フレーム選択部370は、撮像装置99が取得した、複数のフレームからなる画像データを受け取る。なお、フレーム選択部370は、画像データを第2の実施の形態に係る特徴量抽出領域決定部140と同様に、撮像装置99から直接受信してもよいし、図示しない記憶部から取得してもよい。
フレーム選択部370は受信(取得)した、複数のフレームから、任意の枚数のフレームを選択する。フレーム選択部370は、所定の間隔のフレームを取得してもよいし、所定の枚数ごとに取得してもよい。また、フレーム選択部370は、例えば、あるフレームと、このあるフレームの直前のフレームまたは所定枚数分前のフレームとの間の差分値を算出し、この差分値に基づいて、フレームを選択してもよい。この場合、フレーム選択部370は、例えば、この差分値が所定の閾値よりも小さいフレームを選択してもよい。同様に、フレーム選択部370は、例えば、あるフレームと、このあるフレームの直後のフレームまたは所定枚数分後のフレームとの間の差分値を算出し、この差分値に基づいて、フレームを選択してもよい。なお、フレーム選択部370は、取得した複数のフレームが連続した静止画像の場合、すべてのフレーム(静止画像)を選択してもよい。
フレーム選択部370は、選択した1以上のフレームを、ノイズ除去部380に供給する。
ノイズ除去部380は、フレーム選択部370から、該フレーム選択部370が選択したフレームを受信する。そして、ノイズ除去部380は、受信した1以上のフレームを用いて、ノイズ除去を行う。
ノイズ除去部380は、撮像装置99が撮影した画像が動画像の場合、ノイズ除去を行った1以上のフレームを用いて、1枚の画像を生成する。また、撮像装置99が撮影した画像が静止画像の場合、ノイズ除去部380フレーム毎にフレームからノイズ除去を行い、ノイズ除去を行ったフレーム(静止画像)を生成する。
ノイズ除去部380は、各フレームに含まれる画素値を用いて、フレーム間の平均値や中間値を求めてノイズ除去を行ってもよいし、他の方法を用いてノイズ除去を行ってもよい。ノイズ除去部380が行うノイズ除去の方法は特に限定されない。
その後、ノイズ除去部380は、生成した画像を特徴量抽出領域決定部140に出力する。特徴量抽出領域決定部140は、ノイズ除去部380から出力された画像を用いて、第2の実施の形態に係る特徴量抽出領域決定部140と同様の処理を行う。
(特徴量抽出装置300の動作)
次に、図14を用いて、特徴量抽出装置300の動作について説明する。図14は、本実施の形態に係る特徴量抽出装置300の動作の流れの一例を示すフローチャートである。
図14に示す通り、まず、特徴量抽出装置300のフレーム選択部370が画像データを取得(受信)する(ステップS301)。そして、フレーム選択部370は、ノイズ除去を行う対象となるフレーム(認識に用いる画像を生成するためのフレーム)を選択する(ステップS302)。
そして、ノイズ除去部380が、ステップS302で選択されたフレームに対し、ノイズ除去を行う(ステップS303)。その後、特徴量抽出領域決定部140が、ノイズ除去が行われたフレームから生成された画像から、特徴量抽出領域を決定する(ステップS304)。
なお、図14に示すステップS305〜ステップS309の夫々は、上述したステップS103〜ステップS107と同様の特徴量抽出処理であるため、説明を省略する。
(効果)
本実施の形態に係る特徴量抽出装置300は、上述した第2の実施の形態と同様の効果を得ることができる。また、本実施の形態に係る特徴量抽出装置300は、ノイズ除去を行った画像を用いて、特徴量抽出を行うため、ノイズの影響を減らした特徴量を抽出することができる。したがって、本実施の形態に係る特徴量抽出装置300は、より高い精度の認識を行うことが可能な統合特徴量を出力することができる。
<第5の実施の形態>
次に、本発明の第5の実施の形態について説明する。なお、説明の便宜上、前述した第1から第4の実施の形態で説明した図面に含まれる部材と同じ機能を有する部材については、同じ符号を付し、その説明を省略する。
図15は、本実施の形態に係る特徴量抽出装置400を含む特徴量抽出システム5の構成および特徴量抽出装置400の機能構成の一例を示すブロック図である。図15に示す特徴量抽出システム5の特徴量抽出装置400は、第2の実施の形態に係る特徴量抽出装置100の第2の特徴量抽出部120を、第2の特徴量抽出部420に置き換え、更に第4の実施の形態において説明したフレーム選択部370を備える構成である。
なお、本実施の形態に係る特徴量抽出装置400は、第1の実施の形態または第3の実施の形態または第4の実施の形態に係る特徴量抽出装置と組み合わせてもよい。
図15に示す通り、特徴量抽出システム5は、撮像装置99と、特徴量抽出装置400とを備えている。撮像装置99と特徴量抽出装置400とは、互いに有線通信または無線通信可能に接続されている。これらは、互いに、例えば、ケーブル等を介して直接接続してもよいし、ネットワークを介して接続してもよい。
(特徴量抽出装置400)
特徴量抽出装置400は、撮像装置99から画像データを受信する。特徴量抽出装置400は、図15に示す通り、第1の特徴量抽出部110と、第2の特徴量抽出部420と、特徴量生成部130と、特徴量抽出領域決定部140と、フレーム選択部370とを備える。特徴量抽出装置400は、記憶部490を更に備える構成であってもよい。なお、記憶部490は、特徴量抽出装置400に内蔵されるものであってもよいし、特徴量抽出装置400とは別個の記憶装置によって実現されるものであってもよい。
ここで、本実施の形態に係る撮像装置99が撮影し、特徴量抽出装置400に送信する画像データは、第4の実施の形態と同様に、連続したデータであるとする。なお、本実施の形態では、撮像装置99が撮影する画像は連続した静止画像であってもよいが、撮像装置99が撮影する画像が動画像である場合、特徴量抽出装置400は、より好適に、特徴量を抽出することが可能である。したがって、本実施の形態では、撮像装置99が撮影する画像が動画像であることを前提に説明を行う。
フレーム選択部370は、第4の実施の形態に係るフレーム選択部370と同様の機能を有する。本実施の形態に係るフレーム選択部370は、更に、動画像に含まれる物体に動きが検知された場合、動きが検知されたフレームを選択してもよい。
フレーム選択部370は、選択した1以上のフレームを、特徴量抽出領域決定部140に供給する。
また、フレーム選択部370は、受信(取得)した複数のフレームを、記憶部490に格納してもよい。このとき、フレーム選択部370は、選択したフレームに対し選択したことを示す情報を関連付けて、受信した複数のフレームを記憶してもよい。
特徴量抽出領域決定部140は、フレーム選択部370から、該フレーム選択部370が選択した1以上のフレームを受信する。そして、特徴量抽出領域決定部140は、受信した1以上のフレームの夫々に対して、上述した第2から第4の実施の形態に係る特徴量抽出領域決定部140と同様に、特徴量抽出領域を決定する。本実施の形態に係る特徴量抽出領域決定部140は、第2から第4の実施の形態に係る特徴量抽出領域決定部140と同様の方法で特徴量抽出領域を決定する。また、本実施の形態に係る特徴量抽出領域決定部140は、例えば、フレーム内の領域のうち、色の偏りが、その前後のフレームより高いまたは低い場所を含む領域を特徴量抽出領域として決定してもよい。
第1の特徴量抽出部110は、フレーム選択部370によって選択された1以上のフレームの夫々に対して、特徴量抽出領域決定部140が決定した特徴量抽出領域から、部分領域を決定する。本実施の形態に係る第1の特徴量抽出部110が行う動作については、上述した第2の実施の形態に係る第1の特徴量抽出部110の動作と同様であるため、詳細な説明を省略する。
第2の特徴量抽出部420は、図2に示す通り、周辺領域決定部421と、周辺領域特徴量抽出部422とを含む。
周辺領域決定部421は、特徴量抽出領域を示す情報と、フレーム(画像データ)と、部分領域情報とに基づいて、該特徴量抽出領域内の部分領域の周辺の領域および他のフレームにおける該部分領域に対応する部分の周辺領域を周辺領域として決定する。
この周辺領域について、図16を参照して説明する。図16において、フレーム選択部370が選択したフレームを、FR1とする。FR0は、FR1より時間的に前のフレームであり、FR2は、FR1より、時間的に後ろのフレームである。FR0およびFR2は、フレーム選択部370によって選択されたフレームであってもよいし、選択されていないフレームであってもよい。
周辺領域決定部421は、フレームFR1における特徴量抽出領域(不図示)内の部分領域C41の周辺の領域を周辺領域P42として、決定する。周辺領域P42の分割については、第2の実施の形態と同様である。
また、周辺領域決定部421は、部分領域C41を含むフレームFR1の前後のフレーム(FR0、FR2)を、記憶部490から取得する。そして、周辺領域決定部421は、フレームFR1の前後のフレーム(FR0、FR2)において、該部分領域C41に対応する部分(図16では、夫々、C41’C41”とする)の周辺の領域も、周辺領域P42として決定する。このとき、周辺領域決定部421は、フレームFR0およびフレームFR2に含まれる複数の周辺領域の夫々と、部分領域C41(または、部分領域C41’、部分領域C41”)との画素情報の差を算出し、その差の値の大小に応じて、周辺領域を決定してもよい。
なお、周辺領域決定部421が周辺領域を決定する際に使用する、あるフレームの前後のフレーム(図16においては、FR0、FR2)は、特徴量抽出領域決定部140によって、選択されたフレームであってもよい。また、周辺領域決定部421が周辺領域を決定する際に使用する、あるフレームの前後のフレーム(図16においては、FR0、FR2)は、時間軸的にこのあるフレームの直前または直後のフレームであってもよい。また、周辺領域決定部421は、図16では前後に1枚ずつを用いて周辺領域を決定したが、所定枚数前のフレームおよび/または所定枚数後のフレームを用いて周辺領域を決定してもよい。
なお、周辺領域の分割の方法は、図16に示す方法に限定されるものではない。周辺領域決定部421は、上述した第2の実施の形態に係る第2の特徴量抽出部120と同様に、図17に示すような複数の周辺領域P42の夫々と、部分領域C41との画素情報の差を算出し、その差の値の大小に応じて、特徴量を抽出する周辺領域を決定してもよい。
なお、周辺領域の形状は、図16および図17に示すように、同心円を用いてできる領域を所定の数に分割したアーチ形であってもよいし、球領域を分割することによってできる領域の形であってもよい。また、周辺領域の形状はこれに限定されず、例えば、略矩形の領域や略直方体の領域を分割することによってできる形であってもよい。
このように、周辺領域決定部421は、時空間上に存在するフレーム(FR0、FR2)における、該部分領域の周辺の領域を周辺領域として決定する。そして、周辺領域特徴量抽出部422は、第2の実施の形態に係る周辺領域特徴量抽出部122と同様に、決定した周辺領域から第2の特徴量を抽出する。周辺領域が複数のフレームにわたる領域となるため、周辺領域決定部421は、第2の特徴量として、複数のフレームにおける画素値の変化を抽出することができる。
(特徴量抽出装置400の動作)
次に、図18を用いて、特徴量抽出装置400の動作について説明する。図18は、本実施の形態に係る特徴量抽出装置400の動作の流れの一例を示すフローチャートである。
図18に示す通り、まず、まず、特徴量抽出装置400のフレーム選択部370が画像データを取得(受信)する(ステップS401)。そして、フレーム選択部370は、認識に用いる画像を生成するためのフレームを選択する(ステップS402)。
その後、特徴量抽出領域決定部140が、ステップS402にて選択されたフレームから、特徴量抽出領域を決定する(ステップS403)。そして、第1の特徴量抽出部110の部分領域決定部111が、ステップS403で決定された特徴量抽出領域から部分領域を決定する(ステップS404)。このステップS404以降の処理は、ステップS403にて決定された特徴量抽出領域毎に行われる。その後、第1の特徴量抽出部110の部分領域特徴量抽出部112がステップS404で決定された部分領域から、第1の特徴量を抽出する(ステップS405)。
また、第2の特徴量抽出部420の周辺領域決定部421が、ステップS403で決定された特徴量抽出領域、および、該特徴量抽出領域が含まれるフレームの前後のフレームにおける、該特徴量抽出領域に対応する領域から、周辺領域を決定する(ステップS406)。なお、ステップS406は、ステップS404の後であればよく、ステップS405より先に行われてもよいし、同時に行われてもよい。
その後、第2の特徴量抽出部420の周辺領域特徴量抽出部422が、ステップS406で決定された周辺領域から、第2の特徴量を抽出する(ステップS407)。
そして、特徴量生成部130が、ステップS405にて抽出された第1の特徴量と、ステップS407にて抽出された第2の特徴量とに基づいて、これらを統合した統合特徴量を生成し(ステップS408)、特徴量抽出装置400の処理を終了する。
この特徴量抽出処理によって、特徴量抽出装置400は、ステップS401で取得した画像データによって表される動画像に対し、ステップS403にて決定された特徴量抽出領域の数と同数の統合特徴量を抽出することができる。
これにより、本実施の形態に係る特徴量抽出装置400は、上述した各実施の形態と同様の効果を得ることができる。
また、本実施の形態に係る特徴量抽出装置400は、周辺領域の特徴量として、取得した画像データによって表される動画像を構成する複数のフレームにおける画素値の変化を抽出する。これにより、特徴量抽出装置400は、動物体についての認識精度を向上することができる。
(適用例)
次に、各実施の形態に係る特徴量抽出装置を適用したシステムの一例について説明する。図19は、各実施の形態に係る特徴量抽出装置を適用した情報処理システム6の構成の一例を示す図である。本適用例では、上述した第3の実施の形態に係る特徴量抽出システム3を適用した情報処理システム6について、説明するとするが、その他の実施の形態に係る装置またはシステムを適用してもよい。
図19には、ある小売店舗内の会計カウンターに特徴量抽出装置を適用した情報処理システム6が示されている。そのため、本適用例に係る情報処理システム6は、会計処理システムとも呼ぶ。情報処理システム6は、カメラ(撮像装置、撮像手段)61と、認識装置62と、表示装置(表示手段)63とを備えている。カメラ61は、第3の実施の形態に係る撮像装置99に相当し、認識装置62は、第3の実施の形態に係る特徴量抽出装置200に相当する。そのため、認識装置62の機能構成については、特徴量抽出装置200と同様であるため、説明を省略する。
この小売店舗の店員は、購入者が購入を希望している商品を、カメラ61を用いて撮影する(カメラ61に読み取らせる)。これは、例えば、小売店舗の店員が、商品に記載されたバーコード等をバーコードリーダで読み取る際に行う動作と同様の動作である。
カメラ61で撮影された画像データは、認識装置62に入力される。これにより、認識装置62は、上述した特徴量抽出装置200と同様の特徴量抽出処理および認識処理を行う。そして、認識装置62は、認識結果を表示装置63に供給する。
表示装置63は、認識結果を画面に表示する。具体的には、表示装置63は、認識装置62から供給された認識結果に基づいて、認識結果を示す画像を画面に表示する。
これにより、店員は購入された商品を画面上で確認することができ、会計作業を行うことができる。
このように、本発明の各実施の形態に係る特徴量抽出装置は、画像認識を行うPOS(Point of Sales)に好適に適用可能である。本発明の各実施の形態に係る特徴量抽出装置は、その他にも、映像監視、顔認証などのシステムにも適用可能である。
以上のように、本発明の各実施の形態に係る特徴量抽出装置および特徴量抽出装置を備えた認識装置および特徴量抽出システムは、画像から、該画像内に含まれる物体の認識に、より有効な特徴量を抽出することができる。
また、これらの特徴量抽出装置、認識装置または特徴量抽出システムによって実行される特徴量抽出方法および/または認識方法も、上記装置またはシステムと同様の効果を得ることができる。また、これらの特徴量抽出装置、認識装置または特徴量抽出システムで実行されるプログラムも、上記装置またはシステムと同様の効果を得ることができる。
<ハードウェアの構成例>
ここで、上述した各実施の形態に係る特徴量抽出装置(1、100、200、300、400)を実現可能なハードウェアの構成例について説明する。上述した特徴量抽出装置(1、100、200、300、400)は、専用の装置として実現してもよいが、コンピュータを用いて実現してもよい。
図20は、本発明の各実施の形態を実現可能なコンピュータのハードウェア構成を例示する図である。
図20に示したコンピュータ10のハードウェアは、CPU(Central Processing Unit)11、通信インタフェース(I/F)12、入出力ユーザインタフェース13、ROM(Read Only Memory)14、RAM(Random Access Memory)15、記憶装置17、及びコンピュータ読み取り可能な記憶媒体19のドライブ装置18を備え、これらがバス16を介して接続された構成を有する。入出力ユーザインタフェース13は、入力デバイスの一例であるキーボードや、出力デバイスとしてのディスプレイ等のマンマシンインタフェースである。通信インタフェース12は、上述した各実施の形態に係る装置(図1、図2、図8、図13および図15)が、外部装置と、通信ネットワーク20を介して通信するための一般的な通信手段である。係るハードウェア構成において、CPU11は、各実施の形態に係る特徴量抽出装置(1、100、200、300、400)を実現するコンピュータ10について、全体の動作を司る。
上述した各実施の形態を例に説明した本発明は、例えば、上記各実施の形態において説明した処理を実現可能なプログラム(コンピュータプログラム)を、図20に示すコンピュータ10に対して供給した後、そのプログラムを、CPU11に読み出して実行することによって達成される。なお、係るプログラムは、例えば、上記各実施の形態の説明において参照したフローチャート(図7、図12、図14および図18)に記載した各種処理や、或いは、図1、図2、図8、図10、図13および図15に示したブロック図において当該装置内に示した各部(各ブロック)を実現可能なプログラムであってもよい。
また、コンピュータ10内に供給されたプログラムは、読み書き可能な一時記憶メモリ(15)またはハードディスクドライブ等の不揮発性の記憶装置(17)に格納されてもよい。即ち、記憶装置17において、プログラム群17Aは、例えば、上述した各実施の形態における特徴量抽出装置(1、100、200、300、400)内に示した各部の機能を実現可能なプログラムである。また、各種の記憶情報17Bは、例えば、上述した各実施の形態における画像データ、選択されたフレーム、識別器において使用する学習用画像等である。ただし、コンピュータ10へのプログラムの実装に際して、個々のプログラム・モジュールの構成単位は、ブロック図(図1、図2、図8、図10、図13および図15)に示した各ブロックの区分けには限定されず、当業者が実装に際して適宜選択してよい。
また、前記の場合において、当該装置内へのプログラムの供給方法は、CD(Compact Disk)−ROM、フラッシュメモリ等のコンピュータ読み取り可能な各種の記録媒体(19)を介して当該装置内にインストールする方法や、インターネット等の通信回線(20)を介して外部よりダウンロードする方法等のように、現在では一般的な手順を採用することができる。そして、このような場合において、本発明は、係るコンピュータプログラムを構成するコード(プログラム群17A)或いは係るコードが格納された記憶媒体(19)によって構成されると捉えることができる。
以上、本発明を、上述した模範的な実施の形態およびその実施例に適用した例として説明した。しかしながら、本発明の技術的範囲は、上述した各実施の形態及び実施例に記載した範囲には限定されない。当業者には、係る実施の形態に対して多様な変更または改良を加えることが可能であることは明らかである。そのような場合、係る変更または改良を加えた新たな実施の形態も、本発明の技術的範囲に含まれ得る。そしてこのことは、特許請求の範囲に記載した事項から明らかである。
上記の実施の形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)画像の部分領域に含まれる画素値から第1の特徴量を抽出する第1の特徴量抽出手段と、前記部分領域の周辺に配置された領域である周辺領域に含まれる画素の配置情報に基づいて、第2の特徴量を抽出する第2の特徴量抽出手段と、前記第1の特徴量と前記第2の特徴量とに基づいて、第3の特徴量を生成する特徴量生成手段と、を備えることを特徴とする特徴量抽出装置。
(付記2)前記第1の特徴量は、前記第2の特徴量よりも、詳細に記述された特徴量である、ことを特徴とする付記1に記載の特徴量抽出装置。
(付記3)前記第1の特徴量抽出手段は、前記部分領域に含まれる画素値を量子化し、前記部分領域内において、前記量子化された画素値の出現頻度のヒストグラムを前記第1の特徴量として抽出する、ことを特徴とする付記1または2に記載の特徴量抽出装置。
(付記4)前記第2の特徴量抽出手段は、前記部分領域の位置、並びに、前記部分領域の画素値および該部分領域の近傍の画素値の少なくとも何れかに基づいて、前記周辺領域を決定し、該決定した周辺領域に含まれる画素の配置情報に基づいて、に基づいて、前記第2の特徴量を抽出する、ことを特徴とする付記1から3の何れか1つに記載の特徴量抽出装置。
(付記5)前記第2の特徴量抽出手段は、(a)前記周辺領域に含まれる画素値を量子化し、前記量子化した画素値の出現頻度のヒストグラムからなるベクトル、(b)前記周辺領域間の前記ヒストグラムの差からなるベクトル、(c)各周辺領域の部分領域に対する位置を量子化したものと量子化した画素値とが同時に出現する頻度を示すヒストグラム、(d)前記周辺領域間の相対位置と各周辺領域の代表色の組み合わせとを並べたベクトル、の少なくともいずれかを、前記第2の特徴量として抽出する、ことを特徴とする付記1から4の何れか1つに記載の特徴量抽出装置。
(付記6)前記部分領域の画素値および前記周辺領域の画素値の少なくとも何れかに基づいて、前記第3の特徴量に対する重要度を算出する重要度算出手段を更に備えることを特徴とする、付記1から5の何れか1つに記載の特徴量抽出装置。
(付記7)前記画像は、連続したフレームからなる画像であり、前記特徴量抽出装置は、更に、該画像から所定枚数のフレームを選択するフレーム選択手段を備え、前記第2の特徴量抽出手段は、前記周辺領域として、前記選択されたフレーム内の前記部分領域の周辺に配置された領域、および、該選択されたフレームの時系列的に前後のフレームにおける前記部分領域に対応する領域の周辺の領域を、前記周辺領域として決定し、前記決定した周辺領域に含まれる画素の配置情報に基づいて、に基づいて、前記第2の特徴量を抽出する、ことを特徴とする付記1から6の何れか1つに記載の特徴量抽出装置。
(付記8)前記第1の特徴量および前記第2の特徴量を抽出するための特徴量抽出領域を決定する特徴量抽出領域決定手段を更に備え、前記第1の特徴量抽出手段は、前記決定された特徴量抽出領域内の部分領域から前記第1の特徴量を抽出し、前記第2の特徴量抽出手段は、前記部分領域の周辺に配置された領域であって、前記特徴量抽出領域内の領域である周辺領域に基づいて、前記第2の特徴量を抽出する、ことを特徴とする付記1から7の何れか1つに記載の特徴量抽出装置。
(付記9)前記第3の特徴量に基づいて、前記画像中に含まれる1以上の対象物を認識する認識手段を更に備えることを特徴とする付記1から8の何れか1つに記載の特徴量抽出装置。
(付記10)画像の部分領域に含まれる画素値から第1の特徴量を抽出する第1の特徴量抽出手段と、前記部分領域の周辺に配置された領域である周辺領域に含まれる画素の配置情報に基づいて、第2の特徴量を抽出する第2の特徴量抽出手段と、前記第1の特徴量と前記第2の特徴量とに基づいて、第3の特徴量を生成する特徴量生成手段と、前記第3の特徴量に基づいて、前記画像中に含まれる1以上の対象物を認識する認識手段と、を備えることを特徴とする認識装置。
(付記11)前記第1の特徴量は、前記第2の特徴量よりも、詳細に記述された特徴量である、ことを特徴とする付記10に記載の認識装置。
(付記12)前記第1の特徴量抽出手段は、前記部分領域に含まれる画素値を量子化し、前記部分領域内において、前記量子化された画素値の出現頻度のヒストグラムを前記第1の特徴量として抽出する、ことを特徴とする付記10または11に記載の認識装置。
(付記13)前記第2の特徴量抽出手段は、前記部分領域の位置、並びに、前記部分領域の画素値および該部分領域の近傍の画素値の少なくとも何れかに基づいて、前記周辺領域を決定し、該決定した周辺領域に含まれる画素の配置情報に基づいて、に基づいて、前記第2の特徴量を抽出する、ことを特徴とする付記10から12の何れか1つに記載の認識装置。
(付記14)前記第2の特徴量抽出手段は、(a)前記周辺領域に含まれる画素値を量子化し、前記量子化した画素値の出現頻度のヒストグラムからなるベクトル、(b)前記周辺領域間の前記ヒストグラムの差からなるベクトル、(c)各周辺領域の部分領域に対する位置を量子化したものと量子化した画素値とが同時に出現する頻度を示すヒストグラム、(d)前記周辺領域間の相対位置と各周辺領域の代表色の組み合わせとを並べたベクトル、の少なくともいずれかを、前記第2の特徴量として抽出する、ことを特徴とする付記10から13の何れか1つに記載の認識装置。
(付記15)前記部分領域の画素値および前記周辺領域の画素値の少なくとも何れかに基づいて、前記第3の特徴量に対する重要度を算出する重要度算出手段を更に備え、前記認識手段は、前記重要度を、前記第3の特徴量に対する重みとして用いて、前記画像中に含まれる1以上の対象物を認識する、ことを特徴とする付記10から14の何れか1つに記載の認識装置。
(付記16)前記画像は、連続したフレームからなる画像であり、前記認識装置は、更に、該画像から所定枚数のフレームを選択するフレーム選択手段を備え、前記第2の特徴量抽出手段は、前記周辺領域として、前記選択されたフレーム内の前記部分領域の周辺に配置された領域、および、該選択されたフレームの時系列的に前後のフレームにおける前記部分領域に対応する領域の周辺の領域を、前記周辺領域として決定し、前記決定した周辺領域に含まれる画素の配置情報に基づいて、に基づいて、前記第2の特徴量を抽出する、ことを特徴とする付記10から15の何れか1つに記載の認識装置。
(付記17)前記第1の特徴量および前記第2の特徴量を抽出するための特徴量抽出領域を決定する特徴量抽出領域決定手段を更に備え、前記第1の特徴量抽出手段は、前記決定された特徴量抽出領域内の部分領域から前記第1の特徴量を抽出し、前記第2の特徴量抽出手段は、前記部分領域の周辺に配置された領域であって、前記特徴量抽出領域内の領域である周辺領域に基づいて、前記第2の特徴量を抽出する、ことを特徴とする付記10から16の何れか1つに記載の認識装置。
(付記18)画像を撮影する撮像手段と、前記画像の部分領域に含まれる画素値から第1の特徴量を抽出する第1の特徴量抽出手段と、前記部分領域の周辺に配置された領域である周辺領域に含まれる画素の配置情報に基づいて、第2の特徴量を抽出する第2の特徴量抽出手段と、前記第1の特徴量と前記第2の特徴量とに基づいて、第3の特徴量を生成する特徴量生成手段と、前記第3の特徴量に基づいて、前記画像中に含まれる1以上の対象物を認識する認識手段と、認識結果を表示する表示手段と、を備えることを特徴とする情報処理システム。
(付記19)画像の部分領域に含まれる画素値から第1の特徴量を抽出し、前記部分領域の周辺に配置された領域である周辺領域に含まれる画素の配置情報に基づいて、第2の特徴量を抽出し、前記第1の特徴量と前記第2の特徴量とに基づいて、第3の特徴量を生成する、ことを特徴とする特徴量抽出方法。
(付記20)画像の部分領域に含まれる画素値から第1の特徴量を抽出し、前記部分領域の周辺に配置された領域である周辺領域に含まれる画素の配置情報に基づいて、第2の特徴量を抽出し、前記第1の特徴量と前記第2の特徴量とに基づいて、第3の特徴量を生成し、前記第3の特徴量に基づいて、前記画像中に含まれる1以上の対象物を認識する、ことを特徴とする認識方法。
(付記21)画像を撮影し、前記画像の部分領域に含まれる画素値から第1の特徴量を抽出し、前記部分領域の周辺に配置された領域である周辺領域に含まれる画素の配置情報に基づいて、第2の特徴量を抽出し、前記第1の特徴量と前記第2の特徴量とに基づいて、第3の特徴量を生成し、前記第3の特徴量に基づいて、前記画像中に含まれる1以上の対象物を認識し、認識結果を表示する、ことを特徴とする方法。
(付記22)画像の部分領域に含まれる画素値から第1の特徴量を抽出する処理と、前記部分領域の周辺に配置された領域である周辺領域に含まれる画素の配置情報に基づいて、第2の特徴量を抽出する処理と、前記第1の特徴量と前記第2の特徴量とに基づいて、第3の特徴量を生成する処理と、をコンピュータに実行させることを特徴とするプログラム。
(付記23)画像の部分領域に含まれる画素値から第1の特徴量を抽出する処理と、前記部分領域の周辺に配置された領域である周辺領域に含まれる画素の配置情報に基づいて、第2の特徴量を抽出する処理と、前記第1の特徴量と前記第2の特徴量とに基づいて、第3の特徴量を生成する処理と、前記第3の特徴量に基づいて、前記画像中に含まれる1以上の対象物を認識する処理と、をコンピュータに実行させることを特徴とするプログラム。
(付記24)画像を撮影する処理と、前記画像の部分領域に含まれる画素値から第1の特徴量を抽出する処理と、前記部分領域の周辺に配置された領域である周辺領域に含まれる画素の配置情報に基づいて、第2の特徴量を抽出する処理と、前記第1の特徴量と前記第2の特徴量とに基づいて、第3の特徴量を生成する処理と、前記第3の特徴量に基づいて、前記画像中に含まれる1以上の対象物を認識する処理と、認識結果を表示する処理と、をコンピュータに実行させることを特徴とするプログラム。
(付記25)上記付記22から付記24に記載のプログラムを記憶する、ことを特徴とするコンピュータ読み取り可能な記録媒体。