JP2016162072A - 特徴量抽出装置 - Google Patents
特徴量抽出装置 Download PDFInfo
- Publication number
- JP2016162072A JP2016162072A JP2015038549A JP2015038549A JP2016162072A JP 2016162072 A JP2016162072 A JP 2016162072A JP 2015038549 A JP2015038549 A JP 2015038549A JP 2015038549 A JP2015038549 A JP 2015038549A JP 2016162072 A JP2016162072 A JP 2016162072A
- Authority
- JP
- Japan
- Prior art keywords
- feature
- cell
- unit
- learning
- feature points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/107—Static hand or arm
- G06V40/113—Recognition of static hand signs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/467—Encoded features or binary features, e.g. local binary patterns [LBP]
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
【課題】識別対象物を高精度に識別することができる特徴量抽出装置を提供する。
【解決手段】本実施形態による特徴量抽出装置は、学習用対象物を含む複数の画像に基づき、対象物の特徴量を集計するための位置および範囲を示す複数のセルを設定するセル学習部を備える。セル学習部は、正規化部と、特徴点情報算出部と、セル決定部とを有する。正規化部は、画像内に設定され、学習用対象物を示す3箇所以上の特徴点の中から2箇所の特徴点を選択して、特徴点のサイズおよび方向を正規化する。特徴点情報算出部は、正規化された特徴点のうち、選択された2箇所の特徴点以外の特徴点のそれぞれについて、平均位置および当該平均位置からのバラツキを算出する。セル決定部は、平均位置に基づいてセル毎の位置を決定するとともに、バラツキに基づいてセル毎のサイズを決定する。
【選択図】図1
Description
本発明の実施形態は、特徴量抽出装置に関する。
画像データ中の物体を識別する技術として、例えば、物体のパーツ同士の配置を評価することによって該物体の姿勢を推定する技術がある。この技術は、画像中に識別すべき物体が存在することを前提とするため、物体の姿勢を詳細に検出するのには適しているが、該物体の有無を検出することには適さず、結果的に該物体を高精度に識別できないという問題がある。
また、全体の領域を検出した後に、該領域中の個別の局所領域ごとに特徴量を探索する技術がある。しかし、この技術は、個別の局所領域が変化すると全体の領域を精度よく検出できなくなるため、結果的に物体の識別精度が悪くなるといった問題がある。
また、検出された特徴点ごとに、コードブックとの比較によって尤度を算出し、算出された尤度を統合することによって物体を識別する技術がある。しかし、この技術は、特徴点の検出結果を用いるため、特徴点の検出精度によって識別精度が変動してしまい、識別精度が安定しないという問題がある。
本発明が解決しようとする課題は、識別対象物を高精度に識別することができる特徴量抽出装置を提供することにある。
本実施形態による特徴量抽出装置は、学習用対象物を含む複数の画像に基づき、対象物の特徴量を集計するための位置および範囲を示す複数のセルを設定するセル学習部を備える。セル学習部は、正規化部と、特徴点情報算出部と、セル決定部とを有する。正規化部は、画像内に設定され、学習用対象物を示す3箇所以上の特徴点の中から2箇所の特徴点を選択して、特徴点のサイズおよび方向を正規化する。特徴点情報算出部は、正規化された特徴点のうち、選択された2箇所の特徴点以外の特徴点のそれぞれについて、平均位置および当該平均位置からのバラツキを算出する。セル決定部は、平均位置に基づいてセル毎の位置を決定するとともに、バラツキに基づいてセル毎のサイズを決定する。
以下、図面を参照して本発明に係る実施形態を説明する。以下の実施形態では、特徴量抽出装置の特徴的な構成および動作を中心に説明するが、特徴量抽出装置には以下の説明で省略した構成および動作が存在しうる。これらの省略した構成および動作も本実施形態の範囲に含まれるものである。
(第1の実施形態)
図1は、第1の実施形態を示す特徴量抽出装置1のブロック図である。本実施形態の特徴量抽出装置1は、例えば、イメージセンサを搭載したカメラの撮像画像から所定の物体(以下、識別対象物ともいう)を識別するために用いる。識別対象物は、例えば人間の手などの多関節体である。識別対象物の識別結果は、ジェスチャ入力などに用いる。
図1は、第1の実施形態を示す特徴量抽出装置1のブロック図である。本実施形態の特徴量抽出装置1は、例えば、イメージセンサを搭載したカメラの撮像画像から所定の物体(以下、識別対象物ともいう)を識別するために用いる。識別対象物は、例えば人間の手などの多関節体である。識別対象物の識別結果は、ジェスチャ入力などに用いる。
特徴量抽出装置1は、画像データ取得部12と、特徴量算出部13と、特徴集計部14と、認識部15とを備える。また、特徴量抽出装置1は、セル学習部11を備えてもよい。各構成部11〜15は、例えば演算処理装置や記憶装置などのハードウェアである。また、各構成部11〜15は、1つの機器や設備に搭載されていてもよく、または、一部の構成部が、他の構成部との間で外部ネットワークを通じて通信可能な装置(例えばクラウド上のサーバやデータベース)上にあってもよい。
(セル学習部11)
セル学習部11は、複数の学習用対象物の各画像の少なくとも一部に、対象物の特徴量を集計するための位置および範囲を示す複数のセルを設定する。設定された複数のセルは、特徴集計部14においてヒストグラムを生成する際に用いられる。セル学習部11は、例えば対象物が人間の手の場合、指の先端や根元、関節位置、手の平の中央付近などの各位置に応じた範囲のセルを設定する。特徴量は、対象物の画素ごとに得られる値であり、例えばローカルバイナリパターンまたはその亜種などのコードパターンである。
セル学習部11は、複数の学習用対象物の各画像の少なくとも一部に、対象物の特徴量を集計するための位置および範囲を示す複数のセルを設定する。設定された複数のセルは、特徴集計部14においてヒストグラムを生成する際に用いられる。セル学習部11は、例えば対象物が人間の手の場合、指の先端や根元、関節位置、手の平の中央付近などの各位置に応じた範囲のセルを設定する。特徴量は、対象物の画素ごとに得られる値であり、例えばローカルバイナリパターンまたはその亜種などのコードパターンである。
セルを設定する意義は次の通りである。対象物が識別対象物であるか否かの判断は、対象物の特徴量を集計して作成したヒストグラムに基づく。もし、特徴量を集計する領域が、画像データの全画素領域に亘る場合、特徴量の集計に時間がかかり識別対象物か否かの迅速な識別ができなくなってしまう。また、統計的に見て識別対象物の特徴点の存在確率が低い領域の特徴量を集計するといった、識別精度に殆ど影響しない無駄な処理をすることになってしまう。そこで、セル学習部11は、特徴量の集計領域を、識別対象物の特徴点の存在確率が統計的に高い領域に限定すべく、学習用対象物の画像の複数箇所にセルを設定する。これらセルは、学習用対象物の特徴的な部分を示す領域であり、これらセルを用いることで、対象物が識別対象物であるか否かを迅速かつ高精度に識別することが可能となる。
なお、セル学習部11は、認識部15によって対象物が識別された場合に、この対象物を学習用対象物として用いてもよい。これにより、識別結果を学習データとして有効利用することができる。
セル学習部11は、正規化部111、特徴点情報算出部112およびセル決定部113を備える。
(正規化部111)
正規化部111は、複数の学習用対象物の各画像内に設定される3箇所以上の特徴点の中から2箇所の特徴点を用いて、各特徴点のサイズおよび方向を正規化する。ここで、特徴点は、学習用対象物における特徴となり得る任意の場所に設定される。
正規化部111は、複数の学習用対象物の各画像内に設定される3箇所以上の特徴点の中から2箇所の特徴点を用いて、各特徴点のサイズおよび方向を正規化する。ここで、特徴点は、学習用対象物における特徴となり得る任意の場所に設定される。
正規化部111は、学習用対象物における任意の2箇所の特徴点を選択して、学習用対象物を基準の向き、基準のサイズに正規化する。2箇所の特徴点は、例えば、学習用対象物の最も中央側に位置する点である。正規化部111は、学習用対象物が基準の向きから回転している場合、2箇所の特徴点を結ぶ線分の傾きを補正し正規化する。また、正規化部111は、学習用対象物のサイズが基準のサイズと異なる場合、2箇所の特徴点間の距離を一定値に補正し正規化する。すなわち、正規化部111は、複数の学習用対象物の回転の有無の違いおよびサイズの違いを解消し、各学習用対象物の特徴点を同じ基準にする。なお、特徴点は、例えば入力装置の操作によって手作業で設定(教示)してもよく、または、画像認識などによって自動設定してもよい。
(特徴点情報算出部112)
特徴点情報算出部112は、正規化に用いた2箇所の特徴点以外の特徴点について、平均位置および平均位置からのバラツキを算出する。平均位置とは、正規化に用いた2箇所の特徴点以外の特徴点の位置の平均値である。バラツキは、例えば分散や標準偏差などである。例えば分散は、2箇所の特徴点の中点を原点(0、0)とし、残りの特徴点の座標(x、y)のベクトルをX、特徴点の平均位置のベクトル(平均ベクトル)をuとした場合に、(X−u)(X−u)^Tの固有値によって求めることができる。(X−u)^Tは、(X−u)の転置行列である。
特徴点情報算出部112は、正規化に用いた2箇所の特徴点以外の特徴点について、平均位置および平均位置からのバラツキを算出する。平均位置とは、正規化に用いた2箇所の特徴点以外の特徴点の位置の平均値である。バラツキは、例えば分散や標準偏差などである。例えば分散は、2箇所の特徴点の中点を原点(0、0)とし、残りの特徴点の座標(x、y)のベクトルをX、特徴点の平均位置のベクトル(平均ベクトル)をuとした場合に、(X−u)(X−u)^Tの固有値によって求めることができる。(X−u)^Tは、(X−u)の転置行列である。
(セル決定部113)
セル決定部113は、算出された各特徴点の平均位置に基づいて、セルの領域を決定する。平均位置は、複数の学習用対象物における同一の特徴点の存在確率が統計的に高いとみなすことができる。したがって、セルは、該特徴点の存在確率が高い領域に設定される。もし、対象物が学習用対象物と同種物であれば、このようなセルを用いて集計された対象物の特徴量は、学習用対象物の特徴点を表す確率が高い。したがって、セル決定部113は、学習用対象物の特徴点を含む物体すなわち識別対象物を高精度に識別できるセルを決定する。
セル決定部113は、算出された各特徴点の平均位置に基づいて、セルの領域を決定する。平均位置は、複数の学習用対象物における同一の特徴点の存在確率が統計的に高いとみなすことができる。したがって、セルは、該特徴点の存在確率が高い領域に設定される。もし、対象物が学習用対象物と同種物であれば、このようなセルを用いて集計された対象物の特徴量は、学習用対象物の特徴点を表す確率が高い。したがって、セル決定部113は、学習用対象物の特徴点を含む物体すなわち識別対象物を高精度に識別できるセルを決定する。
また、セル決定部113は、算出された各特徴点の平均位置のバラツキに基づいて、セルのサイズを決定する。より具体的には、セル決定部113は、分散を定数倍した値に基づいてセルのサイズを決定する。ここで、学習用対象物は、例えば指の関節部分のように、動きの自由度が高い(すなわち個体差が大きい)ことによって偏差が大きくなる部分を含む。偏差が大きい部分は、偏差が小さい部分に比べて、該部分の高い存在確率が広い領域に亘る。セル決定部113は偏差に応じた特徴点の存在確率の分布を考慮して、セルのサイズを決定する。すなわち、偏差が大きければセルのサイズを大きくする。したがって、セル決定部113によれば、動きが大きい部分を特徴点とするセルを取りこぼし少なく設定できる。なお、対象物の種類に応じて分散の定数倍の値を設定してもよい。このようにすれば、識別対象物の種類に応じて動きの大小が異なっても、各種類の識別対象物をいずれも取りこぼし少なくできる。
(画像データ取得部12)
画像データ取得部12は、対象物を含む画像データを取得し、取得した画像データを特徴量算出部13に出力する。画像データ取得部12は、例えばイメージセンサであってもよいし、該イメージセンサで撮像された画像データを入力する装置であってもよいし、その他の手法により画像データを取得する装置であってよい。
画像データ取得部12は、対象物を含む画像データを取得し、取得した画像データを特徴量算出部13に出力する。画像データ取得部12は、例えばイメージセンサであってもよいし、該イメージセンサで撮像された画像データを入力する装置であってもよいし、その他の手法により画像データを取得する装置であってよい。
(特徴量算出部13)
特徴量算出部13は、画像データに基づいて、特徴量を画素ごとに算出する。特徴量算出部13は、算出された特徴量を特徴集計部14に出力する。0031
特徴量算出部13は、画像データに基づいて、特徴量を画素ごとに算出する。特徴量算出部13は、算出された特徴量を特徴集計部14に出力する。0031
(特徴集計部14)
特徴集計部14は、特徴量算出部13で算出された特徴量と、セル学習部11によって設定されたセルとに基づいて、画像内の特徴量をセルごとに集計する。具体的には、特徴集計部14は、対象物を含む画像内に、セル学習部11で得られた複数のセルを、該セルの位置およびサイズに対応する画素領域に亘って設定する。例えば、特徴集計部14は、セル学習部で使用した教師データである正規化された特徴点の分布を正規分布に当てはめ、平均位置を中心とし、標準偏差σの一定数倍(たとえば2σや3σ)の大きさの領域(矩形でも楕円でもよい)を設定してよい。このとき、画像のサイズに合わせて、セルのサイズを調整する場合もありうる。そして、特徴集計部14は、画像内に設定されたセルごとの特徴量を集計したヒストグラムを生成する。ここで、特徴集計部14は、特徴点の存在確率が高い領域(セル)を特徴量の集計領域としているため、特徴量(バイナリパターンの出現数)の頻度を示すヒストグラムを迅速に生成できる。そして、特徴集計部14は、生成されたヒストグラムを認識部15に出力する。
特徴集計部14は、特徴量算出部13で算出された特徴量と、セル学習部11によって設定されたセルとに基づいて、画像内の特徴量をセルごとに集計する。具体的には、特徴集計部14は、対象物を含む画像内に、セル学習部11で得られた複数のセルを、該セルの位置およびサイズに対応する画素領域に亘って設定する。例えば、特徴集計部14は、セル学習部で使用した教師データである正規化された特徴点の分布を正規分布に当てはめ、平均位置を中心とし、標準偏差σの一定数倍(たとえば2σや3σ)の大きさの領域(矩形でも楕円でもよい)を設定してよい。このとき、画像のサイズに合わせて、セルのサイズを調整する場合もありうる。そして、特徴集計部14は、画像内に設定されたセルごとの特徴量を集計したヒストグラムを生成する。ここで、特徴集計部14は、特徴点の存在確率が高い領域(セル)を特徴量の集計領域としているため、特徴量(バイナリパターンの出現数)の頻度を示すヒストグラムを迅速に生成できる。そして、特徴集計部14は、生成されたヒストグラムを認識部15に出力する。
(認識部15)
認識部15は、ヒストグラムを用いて対象物が識別対象物であるか否かを判断する。ここで、認識部15は、バイナリパターンの出現頻度の分布を示すヒストグラムを解析することで、対象物が識別対象物か否かを高精度に識別することができる。認識部15は、サポートベクターマシン(SVM)であってもよい。なお、認識部15は、予め学習用対象物に基づいて作成した基準ヒストグラムと特徴集計部14によって生成されたヒストグラムとを比較して、対象物が識別対象物であるか否かを判断してもよい。
認識部15は、ヒストグラムを用いて対象物が識別対象物であるか否かを判断する。ここで、認識部15は、バイナリパターンの出現頻度の分布を示すヒストグラムを解析することで、対象物が識別対象物か否かを高精度に識別することができる。認識部15は、サポートベクターマシン(SVM)であってもよい。なお、認識部15は、予め学習用対象物に基づいて作成した基準ヒストグラムと特徴集計部14によって生成されたヒストグラムとを比較して、対象物が識別対象物であるか否かを判断してもよい。
以下、図を用いて、特徴量抽出装置1の特徴量抽出方法を、セル学習動作および認識動作に分けて説明する。
(セル学習動作)
図2は、特徴量抽出装置1のセル学習動作を示すフローチャートである。図3は、セル学習動作を説明するための図である。ここでは、人間の手を学習用対象物として説明する。
セル学習部11は先ず、学習用対象物の画像として、人間の手Hの画像ILを複数取得する(S1)。各画像ILには、予め共通の3つ以上の特徴点Pi(iは自然数)が設定されている。図3に示すように、例えば中央の2箇所の特徴点P1、P2は手Hの中央を示し、残りの特徴点Pi(i≧3)は指の関節部分などを示すものとする。なお、図3に示される特徴点Piはあくまで一例であり、実際はより多数の特徴点が設定され得る。セル学習部11は、各画像ILを、セル学習部11の図示しない記憶領域又は外部記憶装置から取得してもよく、或いは、イメージセンサ等の撮像装置から随時取得してもよい。
図2は、特徴量抽出装置1のセル学習動作を示すフローチャートである。図3は、セル学習動作を説明するための図である。ここでは、人間の手を学習用対象物として説明する。
セル学習部11は先ず、学習用対象物の画像として、人間の手Hの画像ILを複数取得する(S1)。各画像ILには、予め共通の3つ以上の特徴点Pi(iは自然数)が設定されている。図3に示すように、例えば中央の2箇所の特徴点P1、P2は手Hの中央を示し、残りの特徴点Pi(i≧3)は指の関節部分などを示すものとする。なお、図3に示される特徴点Piはあくまで一例であり、実際はより多数の特徴点が設定され得る。セル学習部11は、各画像ILを、セル学習部11の図示しない記憶領域又は外部記憶装置から取得してもよく、或いは、イメージセンサ等の撮像装置から随時取得してもよい。
次いで、正規化部111は、特徴点P1、P2を選択して、特徴点Piのサイズおよび方向を正規化する(S2)。正規化部111は、各画像ILについて、例えば座標変換などにより、特徴点P1、P2間の距離および特徴点P1、P2を結ぶ線分の傾きを統一する。これにより、各画像ILにおける手Hのサイズおよび向きを揃える。
次いで、特徴点情報算出部112は、画像ILごとに、正規化された特徴点Pi(i≧3)について、平均位置gi(i≧3)および平均位置giからのバラツキとして例えば分散σi(i≧3)を算出する(S3)。
次いで、セル決定部113は、平均位置giに基づいて各セルの位置を決定するとともに、分散σiに基づいて各セルのサイズを決定する(S4)。図4は、画像ILにセルが設定された図である。例えば、セル決定部113は、平均位置giを中心とした分散σiの定数倍の領域Ai(略円形または略楕円形領域)に外接する矩形領域を、セルCiに決定する。分散の定数倍の領域より若干大きな矩形領域をセルとすることで、学習用対象物と検出されるべき対象物との特徴点の分布に若干の相違があったとしても、特徴集計部14にて特徴量の分布を精度よく検出することができる。
(認識動作)
図5は、特徴量抽出装置1の識別動作を示すフローチャートである。先ず、画像データ取得部12は、画像データIFを取得する(S5)。図6には、人間の指先部分の画像データIFが、各画素pixの256階調の画素値(輝度値)とともに示されている。図6では、明るい画素pixほど画素値が大きく、暗い画素pixほど画素値が小さい。
図5は、特徴量抽出装置1の識別動作を示すフローチャートである。先ず、画像データ取得部12は、画像データIFを取得する(S5)。図6には、人間の指先部分の画像データIFが、各画素pixの256階調の画素値(輝度値)とともに示されている。図6では、明るい画素pixほど画素値が大きく、暗い画素pixほど画素値が小さい。
次いで、特徴量算出部13は、画像データIFに基づいて、特徴量を算出する(S6)。特徴量算出部13は、着目画素pix_cと、これを囲む8つの周辺画素pix_p1〜pix_p8との画素値の大小関係に基づいて、バイナリパターンBPを算出する。このバイナリパターンは、着目画素の特徴量を表している。
図7(A)は、着目画素およびその周辺画素の画素値の一例を示した図である。図7(B)は、二値化された周辺画素の画素値を示した図である。図7(C)は、バイナリ―パターンを示す図である。具体的には、特徴量算出部13は、着目画素pix_cの画素値“131”よりも低い周辺画素pix_p3〜6の画素値“109”、“103”、“98”、“125”を、二値における“0”に変換する。また、特徴量算出部13は、着目画素pix_cの画素値“131”よりも高い周辺画素pix_p1、2、7、8の画素値“144”、“134”、“142”、“144”を、二値における“1”に変換する。そして、特徴量算出部13は、二値化した周辺画素pix_p1〜pix_p8の画素値を、図7(B)の矢印に示す順序にしたがって並べることで、バイナリパターンBP“11000011” (図7(c))を算出する。特徴量算出部13は、着目画素を1画素ずつずらしながら、着目画素ごとにバイナリパターンを算出する。図8は、画素ごとのバイナリ―パターンの一例を示す図である。図9は、図8を10進数化して表現したものであり、実体は図8と同じである。
なお、特徴量算出部13は、図7と異なる手法でバイナリパターンを算出してもよい。例えば、特徴量算出部13は、次の(1)式および(2)式にしたがってバイナリパターンを算出してもよい。
0 if c/(1+α)<In<c(1+α) (1)
1 otherwise (2)
ここで、cは、着目画素の画素値である。αは、0より大きい閾値である。Inは、周辺画素の画素値である。この式に従えば、周辺画素の画素値Inは、着目画素の画素値cを1+α(所定値)で除した値より大きく、かつ、着目画素の画素値cに1+αを乗じた値より小さい場合に、“0”(第1の値)になる。一方、周辺画素の画素値Inは、着目画素の画素値cを1+αで除した値以下、または、着目画素の画素値cに1+αを乗じた値以上の場合に、“1”(第2の値)になる。これらの条件式により、着目画素の画素値との差が小さい周辺画素の画素値は“0”となり、着目画素の画素値との差が大きい周辺画素の画素値は“1”となる。これにより、物体に当る光が正面からの場合でも後ろからの場合(逆光)でも高い精度で検出できるという効果を奏する。
0 if c/(1+α)<In<c(1+α) (1)
1 otherwise (2)
ここで、cは、着目画素の画素値である。αは、0より大きい閾値である。Inは、周辺画素の画素値である。この式に従えば、周辺画素の画素値Inは、着目画素の画素値cを1+α(所定値)で除した値より大きく、かつ、着目画素の画素値cに1+αを乗じた値より小さい場合に、“0”(第1の値)になる。一方、周辺画素の画素値Inは、着目画素の画素値cを1+αで除した値以下、または、着目画素の画素値cに1+αを乗じた値以上の場合に、“1”(第2の値)になる。これらの条件式により、着目画素の画素値との差が小さい周辺画素の画素値は“0”となり、着目画素の画素値との差が大きい周辺画素の画素値は“1”となる。これにより、物体に当る光が正面からの場合でも後ろからの場合(逆光)でも高い精度で検出できるという効果を奏する。
次いで、特徴集計部14は、セル学習部11で設定されたセルごとに、特徴量を集計したヒストグラムを生成する(S7)。
特徴集計部14は、例えば図9に示すバイナリパターンにおいて、左上端側の8×8画素の領域が図4のセルC3に該当する場合、この領域に対して、図10(A)に示すようにセルC3を設定する。そして、特徴集計部14は、セルのバイナリパターンを集計し、ヒストグラムを得る。図10(B)のヒストグラムは、横軸を画素値、縦軸をセルC3における該画素値の発生回数としている。セルC3は図4の特徴点P3の平均位置および分散に基づいて設定された領域であるので、図10(B)のヒストグラムは特徴点P3の出現頻度の分布を表している。
また、特徴集計部14は、例えば図9に示すバイナリパターンにおいて、右下端側の10×10画素の領域が図4のセルC4に該当する場合、この領域に対して、図11(A)に示すようにセルC4を設定する。そして、特徴集計部14は、バイナリパターンを集計し、ヒストグラムを得る。セルC4は図4の特徴点P4の平均位置および分散に基づいて設定された領域であるので、図11(B)のヒストグラムは特徴点P4の分布を表している。
次いで、認識部15は、生成されたヒストグラムに基づいて対象物を認識する(S8)。認識部15は、図10(B)、図11(B)のヒストグラムに基づき、特徴点P3、P4を有する人間の手Hを識別することができる。また、ヒストグラムは、予め設定されたセルに限定して生成されており、認識部15は、ヒストグラムを解析することで対象物の認識を短時間で済ませることができる。
以上説明したように、本実施形態によれば、セル学習部11にて学習用対象物の複数の画像を用いてセルを設定する。そして、画像内における各セル内の特徴量を集計したヒストグラムを作成する。これにより、対象物に特徴点を設定しなくても、セル内での特徴量を集計するだけで、対象物の特徴を精度よく検出できる。このように、本実施形態によれば、特徴量の集計領域を設定したセルに限定することで、識別対象物を迅速かつ高精度に識別することができる。
(第2の実施形態)
識別したい対象物のサイズは、学習用対象物のサイズと必ずしも同一ではない。第2の実施形態は、セルのサイズに合わせて、画像のサイズを調整する第1の実施形態に対応する構成部については同一の符号を付して重複した説明は省略する。
識別したい対象物のサイズは、学習用対象物のサイズと必ずしも同一ではない。第2の実施形態は、セルのサイズに合わせて、画像のサイズを調整する第1の実施形態に対応する構成部については同一の符号を付して重複した説明は省略する。
図12は、第2の実施形態を示す特徴量抽出装置1のブロック図である。本実施形態の特徴量抽出装置1は、画像データ取得部12と特徴量算出部13との間に画像サイズ調整部16を備える。画像サイズ調整部16は、対象物を含む画像データをセルの大きさに適合するように拡大または縮小する。また、画像サイズ調整部16は、画像データの大きさを、正規化部111が正規化する画像のサイズに合致させてもよい。本実施形態によれば、画像データ取得部12によって取得された画像データのサイズを、セル学習部11によって決定されたセルのサイズに適合させることができるので、画像データの倍率の違いにかかわらず、識別対象物を高精度に識別できる。
(第3の実施形態)
図13は、第3の実施形態を示す特徴量抽出装置1のブロック図である。第1の実施形態に対応する構成部については同一の符号を付して重複した説明は省略する。本実施形態は、特徴集計部14とセル学習部11との間にセルサイズ調整部114を備える。セルサイズ調整部114は、セルを画像データの大きさに適合するように拡大または縮小する。本実施形態によれば、セル決定部113によって決定されたセルのサイズを、画像データ取得部12によって取得された画像データのサイズに適合させることができるので、画像データのサイズにかかわらず、識別対象物を高精度に識別できる。
図13は、第3の実施形態を示す特徴量抽出装置1のブロック図である。第1の実施形態に対応する構成部については同一の符号を付して重複した説明は省略する。本実施形態は、特徴集計部14とセル学習部11との間にセルサイズ調整部114を備える。セルサイズ調整部114は、セルを画像データの大きさに適合するように拡大または縮小する。本実施形態によれば、セル決定部113によって決定されたセルのサイズを、画像データ取得部12によって取得された画像データのサイズに適合させることができるので、画像データのサイズにかかわらず、識別対象物を高精度に識別できる。
本実施形態の特徴量抽出装置の少なくとも一部は、ハードウェアで構成してもよいし、ソフトウェアで構成してもよい。ソフトウェアで構成する場合には、特徴量抽出装置の少なくとも一部の機能を実現するプログラムをフレキシブルディスクやCD−ROM等の記録媒体に収納し、コンピュータに読み込ませて実行させてもよい。記録媒体は、磁気ディスクや光ディスク等の着脱可能なものに限定されず、ハードディスク装置やメモリなどの固定型の記録媒体でもよい。
また、特徴量抽出装置の少なくとも一部の機能を実現するプログラムを、インターネット等の通信回線(無線通信も含む)を介して頒布してもよい。さらに、同プログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、あるいは記録媒体に収納して頒布してもよい。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
1 特徴量抽出装置、11 セル学習部、12 画像データ取得部、13 特徴量算出部、14 特徴集計部
Claims (5)
- 学習用対象物を含む複数の画像に基づき、対象物の特徴量を集計するための位置および範囲を示す複数のセルを設定するセル学習部を備え、
前記セル学習部は、
前記画像内に設定され、前記学習用対象物を示す3箇所以上の特徴点の中から2箇所の特徴点を選択して、前記特徴点のサイズおよび方向を正規化する正規化部と、
前記正規化された特徴点のうち、前記選択された2箇所の特徴点以外の特徴点のそれぞれについて、平均位置および当該平均位置からのバラツキを算出する特徴点情報算出部と、
前記平均位置に基づいて前記セル毎の位置を決定するとともに、前記バラツキに基づいて前記セル毎のサイズを決定するセル決定部と、を有する特徴量抽出装置。 - 対象物を含む画像の画像データを取得する画像データ取得部と、
前記画像データに基づいて、前記対象物の特徴量を算出する特徴量算出部と、
前記対象物を含む画像内の複数の領域に設定され各領域に対応したサイズを有する複数のセルのそれぞれについて、各セル内のすべての前記特徴量を集計する特徴集計部と、を備える、特徴量抽出装置。 - 学習用対象物を含む複数の画像に基づき、前記対象物の特徴量を集計するための位置および範囲を示す前記複数のセルを設定するセル学習部と、をさらに備える請求項2に記載の特徴量抽出装置。
- 前記特徴集計部は、前記セルごとに、前記特徴量を集計したヒストグラムを生成する請求項2に記載の特徴量抽出装置。
- 前記特徴集計部によって生成された前記ヒストグラムを用いて前記対象物を認識する認識部を更に備える、請求項4に記載の特徴量抽出装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015038549A JP2016162072A (ja) | 2015-02-27 | 2015-02-27 | 特徴量抽出装置 |
US14/847,678 US10013602B2 (en) | 2015-02-27 | 2015-09-08 | Feature vector extraction device based on cell positioning |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015038549A JP2016162072A (ja) | 2015-02-27 | 2015-02-27 | 特徴量抽出装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016162072A true JP2016162072A (ja) | 2016-09-05 |
Family
ID=56798288
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015038549A Pending JP2016162072A (ja) | 2015-02-27 | 2015-02-27 | 特徴量抽出装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10013602B2 (ja) |
JP (1) | JP2016162072A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019198701A1 (ja) * | 2018-04-13 | 2019-10-17 | 日本電気株式会社 | 分析装置および分析方法 |
JPWO2018235198A1 (ja) * | 2017-06-21 | 2020-04-09 | 日本電気株式会社 | 情報処理装置、制御方法、及びプログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019229979A1 (ja) * | 2018-06-01 | 2019-12-05 | 日本電気株式会社 | 情報処理装置、制御方法、及びプログラム |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4612477B2 (ja) | 2005-02-14 | 2011-01-12 | 日本電信電話株式会社 | パターン認識装置、パターン認識方法、パターン認識プログラム、及びパターン認識プログラムの記録媒体 |
JP4884305B2 (ja) | 2007-06-06 | 2012-02-29 | シャープ株式会社 | 画像処理装置、画像形成装置、コンピュータプログラム、及び記録媒体 |
JP2011154501A (ja) | 2010-01-27 | 2011-08-11 | Sony Corp | 学習装置、学習方法、識別装置、識別方法、プログラム、及び情報処理システム |
JP5391144B2 (ja) | 2010-05-10 | 2014-01-15 | 日本放送協会 | 顔表情変化度測定装置およびそのプログラム並びに番組興味度測定装置 |
JP2012123667A (ja) | 2010-12-09 | 2012-06-28 | Panasonic Corp | 姿勢推定装置および姿勢推定方法 |
JP5715833B2 (ja) | 2011-01-24 | 2015-05-13 | パナソニック株式会社 | 姿勢状態推定装置および姿勢状態推定方法 |
JP5771413B2 (ja) | 2011-03-02 | 2015-08-26 | パナソニック株式会社 | 姿勢推定装置、姿勢推定システム、および姿勢推定方法 |
JP5755046B2 (ja) | 2011-06-22 | 2015-07-29 | キヤノン株式会社 | 画像認識装置、画像認識方法及びプログラム |
JP5877053B2 (ja) | 2011-12-14 | 2016-03-02 | パナソニック株式会社 | 姿勢推定装置および姿勢推定方法 |
US9659210B1 (en) * | 2014-01-13 | 2017-05-23 | Carnegie Mellon University | System and method for detecting and tracking facial features in images |
US9361507B1 (en) * | 2015-02-06 | 2016-06-07 | Hoyos Labs Ip Ltd. | Systems and methods for performing fingerprint based user authentication using imagery captured using mobile devices |
-
2015
- 2015-02-27 JP JP2015038549A patent/JP2016162072A/ja active Pending
- 2015-09-08 US US14/847,678 patent/US10013602B2/en active Active
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2018235198A1 (ja) * | 2017-06-21 | 2020-04-09 | 日本電気株式会社 | 情報処理装置、制御方法、及びプログラム |
JP7197171B2 (ja) | 2017-06-21 | 2022-12-27 | 日本電気株式会社 | 情報処理装置、制御方法、及びプログラム |
US11763463B2 (en) | 2017-06-21 | 2023-09-19 | Nec Corporation | Information processing apparatus, control method, and program |
WO2019198701A1 (ja) * | 2018-04-13 | 2019-10-17 | 日本電気株式会社 | 分析装置および分析方法 |
JPWO2019198701A1 (ja) * | 2018-04-13 | 2021-05-13 | 日本電気株式会社 | 分析装置、分析方法、プログラムおよび水中生物監視システム |
JP7006776B2 (ja) | 2018-04-13 | 2022-01-24 | 日本電気株式会社 | 分析装置、分析方法、プログラムおよび水中生物監視システム |
Also Published As
Publication number | Publication date |
---|---|
US10013602B2 (en) | 2018-07-03 |
US20160253570A1 (en) | 2016-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200192464A1 (en) | Gesture recognition using multi-sensory data | |
CN109934065B (zh) | 一种用于手势识别的方法和装置 | |
CN108230383B (zh) | 手部三维数据确定方法、装置及电子设备 | |
US10964057B2 (en) | Information processing apparatus, method for controlling information processing apparatus, and storage medium | |
JP2020507836A (ja) | 重複撮像を予測した手術アイテムの追跡 | |
CN108573471B (zh) | 图像处理装置、图像处理方法以及记录介质 | |
US10452953B2 (en) | Image processing device, image processing method, program, and information recording medium | |
JPWO2011148596A1 (ja) | 顔特徴点位置補正装置、顔特徴点位置補正方法および顔特徴点位置補正プログラム | |
JP6317725B2 (ja) | 取得された画像内のクラッタを決定するためのシステム及び方法 | |
JP6071002B2 (ja) | 信頼度取得装置、信頼度取得方法および信頼度取得プログラム | |
US20130243251A1 (en) | Image processing device and image processing method | |
JP2019008622A (ja) | 商品特定システム | |
CN111783770A (zh) | 图像的矫正方法、装置和计算机可读存储介质 | |
TW202201275A (zh) | 手部作業動作評分裝置、方法及電腦可讀取存儲介質 | |
CN108875506B (zh) | 人脸形状点跟踪方法、装置和系统及存储介质 | |
US11036974B2 (en) | Image processing apparatus, image processing method, and storage medium | |
US20210174062A1 (en) | Image processing device, image processing method, and recording medium | |
CN107145741B (zh) | 基于图像分析的耳诊数据采集方法及装置 | |
JP2016162072A (ja) | 特徴量抽出装置 | |
CN110969045A (zh) | 一种行为检测方法、装置、电子设备和存储介质 | |
CN113780201B (zh) | 手部图像的处理方法及装置、设备和介质 | |
JP2014021602A (ja) | 画像処理装置及び画像処理方法 | |
US20240104769A1 (en) | Information processing apparatus, control method, and non-transitory storage medium | |
JP2015170206A (ja) | 検出装置および検出方法 | |
JP6567638B2 (ja) | 鼻紋照合システム、鼻紋照合方法及び鼻紋照合プログラム |