JP2018507494A

JP2018507494A - 特徴抽出方法及び装置

Info

Publication number: JP2018507494A
Application number: JP2017552214A
Authority: JP
Inventors: ロン，フェイ; チェン，チジュン; チャン，タオ
Original assignee: シャオミ・インコーポレイテッド
Priority date: 2015-11-25
Filing date: 2015-12-29
Publication date: 2018-03-15
Also published as: MX2016003579A; MX360694B; RU2016110146A; RU2644516C2; CN105654094A; US20170147896A1; KR20170074213A; KR101792961B1; WO2017088248A1; EP3173977A1; CN105654094B

Abstract

【課題】ＨＯＧ特徴抽出方法において、パターン認識における検出率及び正確度が低いという問題を解決する。【解決手段】画像を複数のセルを含む複数のブロックに区分することと、サンプル画像に反復的アルゴリズムを用いて計算し得られた辞書Ｄを用いて、各セルに対してスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得することと、スパースベクトルに基づき、画像の勾配方向ヒストグラムＨＯＧ特徴を抽出することと、を含む特徴抽出方法を提供する。【選択図】図１

Description

本発明は画像処理技術分野に関し、特に特徴抽出方法及び装置に関する。
本発明は出願番号２０１５１０８２９０７１．７であり、出願日２０１５年１１月２５日である中国特許出願に基づいて提出され、該中国特許出願の優先権を主張し、該中国特許出願の全ての内容はここで参考として本発明に引用される。

画像検出及び認識はコンピュータビジョンにおける一つの重要な研究分野である。画像検出及び認識技術において最もよく使われる方法は、画像におけるある特徴を抽出することにより、画像に対して検出及び認識を行う。

関わる技術において、画像のＨＯＧ（ＨｉｓｔｏｇｒａｍｏｆＯｒｉｅｎｔｅｄＧｒａｄｉｅｎｔ、勾配方向ヒストグラム）特徴を抽出することにより、画像に対して検出及び認識を行う。ＨＯＧ特徴抽出方法は、画像における各画素の勾配を計算することと、画像を複数の画素を含む複数のセルに区分し、各隣接するｎ個のセルを一つのブロックに形成することと、各セルにおける全ての画素の勾配ヒストグラムを統計し、各ブロックにおける全てのセルの勾配ヒストグラムに基づき、各ブロックのＨＯＧ特徴を取得することと、画像における全てのブロックのＨＯＧ特徴を統計し画像のＨＯＧ特徴を取得することと、を含む。

関わる技術に存在した問題を解決するために、本発明は特徴抽出方法及び装置を提供する。前記技術的解決手段は以下のとおりである。

本発明の実施例の第１様態によれば、画像を複数のセルを含む複数のブロックに区分することと、サンプル画像に反復的アルゴリズムを用いて計算し得られた辞書Ｄを用いて、各セルに対してスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得することと、スパースベクトルに基づき、画像の勾配方向ヒストグラムＨＯＧ特徴を抽出することと、を含む特徴抽出方法を提供する。

好ましい実施例において、該方法は、さらに、複数の種類の画像集を含むサンプル画像を取得することと、下記の式を用いて、反復により得られた最適な辞書を所定の辞書Ｄとすることと、を含み、
Ｒ＝［ｒ１，ｒ２，…，ｒｃ］はＣ個のサンプル画像のスパース係数行列、Ｙは全ての種類のサンプル画像、
は一つのベクトルにおける非ゼロ要素の数を計算すること、Ｔ０は予め与えられたスパースの上限、
はベクトルの各要素の平方和を計算してから平方根を計算することを示す。

好ましい実施例において、所定の辞書Ｄを用いて、各セルに対してスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得することは、各セルにおける画素をｎ＊１次元のベクトルに調整することと、下記の式を用いて、所定の辞書Ｄにおいて、各セルにおけるベクトルに対してスパース信号分解を行い、対応するスパースベクトルを取得することと、を含み、
ｙは各セルにおけるベクトルであり、ｘは所定の辞書Ｄにおいてｙをスパース化して得られたスパースベクトルであり、
はスパースベクトルｘの各列の絶対値の和を求めることを示し、各スパースベクトルはｍ＊１次元のベクトルであり、所定の辞書Ｄはｎ＊ｍの行列である。

好ましい実施例において、スパースベクトルに基づき、画像の勾配方向ヒストグラムＨＯＧ特徴を抽出することは、スパースベクトルに基づき、各セルの勾配の大きさと勾配方向を計算し、各セルの記述子を取得することと、各ブロックにおける各記述子を統計し、各ブロックのＨＯＧ特徴を取得することと、画像における各ブロックのＨＯＧ特徴を統計し、画像のＨＯＧ特徴を取得することと、を含む。

好ましい実施例において、画像における各ブロックのＨＯＧ特徴を統計し、画像のＨＯＧ特徴を取得することは、画像における各ブロックのＨＯＧ特徴を一つの列として一つの行列に直列接続し、画像のＨＯＧ特徴を取得することを含む。

好ましい実施例において、画像における各ブロックのＨＯＧ特徴を統計し、画像のＨＯＧ特徴を取得することは、画像における、Ｍ＊Ｎ個の画像を含む各ブロックのＨＯＧ特徴を初期のＬ＊１次元のベクトルからＭ＊Ｎの行列（Ｌ＝Ｍ＊Ｎ）に調整することと、各ブロックの調整後のＨＯＧ特徴と画像における各ブロックの対応的な位置に基づき、画像のＨＯＧ特徴を取得することと、を含む。

好ましい実施例において、該方法は、さらに、画像に対して正規化処理を行い、所定のサイズの画像を取得することを含む。

本発明の実施例の第２様態によれば、画像を複数のセルを含む複数のブロックに区分するように配置された区分モジュールと、サンプル画像に反復的アルゴリズムを用いて計算し得られた辞書Ｄを用いて、各セルに対してスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得するように配置された区分モジュールと、スパースベクトルに基づき、画像の勾配方向ヒストグラムＨＯＧ特徴を抽出するように配置された抽出モジュールと、を含む特徴抽出装置を提供している。

好ましい実施例において、該装置は、さらに、複数の種類の画像集を含むサンプル画像を取得するように配置された取得モジュールと、下記の式を用いて、反復により得られた最適な辞書を所定の辞書Ｄとするように配置された反復モジュールと、を含み、
Ｒ＝［ｒ１，ｒ２，…，ｒｃ］はＣ個のサンプル画像のスパース係数行列、Ｙは全ての種類のサンプル画像、
は一つのベクトルにおける非ゼロ要素の数を計算すること、Ｔ０は予め与えられたスパースの上限、
はベクトルの各要素の平方和を計算してから平方根を計算することを示す。

好ましい実施例において、分解モジュールは、各セルにおける画素をｎ＊１次元のベクトルに調整するように配置された第１調整サブモジュールと、下記の式を用いて、所定の辞書Ｄにおいて、各セルにおけるベクトルに対してスパース信号分解を行い、対応するスパースベクトルを取得するように配置された信号分解サブモジュールと、
ｙは各セルにおけるベクトルであり、ｘは所定の辞書Ｄにおいてｙをスパース化して得られたスパースベクトルであり、
スパースベクトルｘの各列の絶対値の和を求めることを示し、各スパースベクトルはｍ＊１次元のベクトルであり、所定の辞書Ｄはｎ＊ｍの行列である。

好ましい実施例において、抽出モジュールは、スパースベクトルに基づき、各セルの勾配の大きさと勾配方向を計算し、各セルの記述子を取得するように配置された計算サブモジュールと、各ブロックにおける各記述子を統計し、各ブロックのＨＯＧ特徴を取得するように配置された第１統計サブモジュールと、画像における各ブロックのＨＯＧ特徴を統計し、画像のＨＯＧ特徴を取得するように配置された第２統計サブモジュールと、を含む。

好ましい実施例において、第２統計サブモジュールは、画像における各ブロックのＨＯＧ特徴を一つの列として一つの行列に直列接続し、画像のＨＯＧ特徴を取得するように配置される。

好ましい実施例において、第２統計サブモジュールは、画像における、Ｍ＊Ｎ個の画素を含む各ブロックのＨＯＧ特徴を初期のＬ＊１次元ベクトルからＭ＊Ｎの行列（Ｌ＝Ｍ＊Ｎ）に調整するように配置された第２調整サブモジュールと、各ブロックの調整後のＨＯＧ特徴と前記画像における各前記ブロックの対応的な位置に基づき、画像のＨＯＧ特徴を取得するように配置された特徴抽出サブモジュールとを含む。

好ましい実施例において、該装置は、さらに、画像に対して正規化処理を行い、所定のサイズの画像を取得するように配置された処理モジュールを含む。

本発明の実施例の第３様態によれば、画像を複数のセルを含む複数のブロックに区分し、サンプル画像に反復的アルゴリズムを用いて計算し得られた辞書Ｄを用いて、各セルに対してスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得し、スパースベクトルに基づき、画像の勾配方向ヒストグラムＨＯＧ特徴を抽出するように配置された、プロセッサと、前記プロセッサの実行可能なコマンドを記憶するメモリと、を含む特徴抽出装置を提供している。

本発明の実施例により提供される技術的解決手段は以下の好適な効果を含むことができる。画像を複数のセルを含む複数のブロックに区分し、サンプル画像に反復的アルゴリズムを用いて計算し得られた辞書Ｄを用いて、各セルに対してスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得し、スパースベクトルに基づき、画像の勾配方向ヒストグラムＨＯＧ特徴を抽出することにより、ＨＯＧ特徴の抽出過程における画像の空間領域に対して直接的に計算して取得することによるパターン認識における検出率及び正確度が低いという問題を解決する。周波数領域における画像のＨＯＧ特徴の抽出を実現し、パターン認識における検出率及び正確度を向上させる効果を達成している。

理解すべきことは、以上の一般的な説明と後の詳細な説明は例示的なものに過ぎず、本発明を限定するものではない。

ここの図面は明細書に合わせ本明細書の一部を構成し、本発明本発明に適合する実施例を示し、明細書と共に本発明の原理を解釈するのに用いられる。
一例示的な実施例により示された特徴抽出方法のフローチャートである。別の一例示的な実施例により示された特徴抽出方法のフローチャートである。一例示的な実施例により示された画像区分の概略図である。別の一例示的な実施例により示された画像区分の概略図である。一例示的な実施例により示されたセルの画素調整の概略図である。一例示的な実施例により示されたブロックにおけるＨＯＧ特徴の概略図である。一例示的な実施例により示された特徴抽出方法のフローチャートである。一例示的実施例により示された画像ＨＯＧ特徴を統計する概略図である。一例示的な実施例により示された特徴抽出装置のブロック図である。別の一例示的な実施例により示された特徴抽出装置のブロック図である。一例示的な実施例により示された特徴抽出装置のサブモジュールのブロック図である。別の一例示的実施例により示された特徴抽出装置のブロック図である。

ここで例示的な実施例について詳しく説明し、その実例は図面に示す通りである。下記の説明が図面に関わる時、別途に表示されない限り、異なる図面における同じ数字は同じ又は類似する要素を表示する。以下の例示的な実施例に説明される実施形態は本発明と一致する全ての実施形態を代表するわけではない。逆に、それらは添付の特許請求の範囲に詳細に記載された本発明の一部の態様と一致する装置と方法の例に過ぎない。

図１は一例示的な実施例により示された特徴抽出方法のフローチャートであり、図１に示すように、本実施例は該方法をパターン認識のハードウェアに用いることを例として説明し、該方法は下記ステップを含むことができる。

ステップ１０２において、画像を複数のセルを含む複数のブロックに区分する。ステップ１０４において、サンプル画像に反復的アルゴリズムを用いて計算し得られた辞書Ｄを用いて、各セルに対して、所与の観測信号を所定の辞書Ｄに従って複数の要素の値が０であるスパースベクトルに変換するスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得する。

本実施例において、各セルにおける画素を所与の観測信号とし、各セルにおける画素を所定の辞書Ｄに従って対応するスパースベクトルに変換し、よって各セルにそれぞれ対応するスパースベクトルを取得する。

ステップ１０６において、スパースベクトルに基づき、画像のＨＯＧ特徴を抽出する。得られたスパース信号分解後のスパースベクトルに基づき、画像のＨＯＧ特徴を抽出する。

上に述べたように、本発明の実施例により提供される特徴抽出方法は、画像を複数のセルを含む複数のブロックに区分し、サンプル画像に反復的アルゴリズムを用いて計算し得られた辞書Ｄを用いて、各セルに対してスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得し、スパースベクトルに基づき、画像の勾配方向ヒストグラムＨＯＧ特徴を抽出し、ＨＯＧ特徴の抽出過程における画像の空間領域に対して直接的に計算して取得することによるパターン認識における検出率及び正確度が低いという問題を解決する。周波数領域における画像のＨＯＧ特徴の抽出を実現し、パターン認識における検出率及び正確度の効果を向上させる効果を達成している。

図２Ａは別の一例示的な実施例により示された特徴抽出方法のフローチャートであり、図２Ａに示すように、本実施例は該方法をパターン認識のハードウェアに用いることを例として説明し、該方法は下記ステップを含むことができる。

ステップ２０１において、画像に対して正規化処理を行い、所定のサイズの画像を取得する。パターン認識において、一般的に複数の画像から特徴を抽出することに関し、画像に対する統一処理が便利であるように、画像に対して特徴抽出を行う前、まず端末により画像に対して正規化処理を行い、異なるサイズの画像を所定のサイズの画像に処理する。

ステップ２０２において、複数の種類の画像集を含むサンプル画像を取得する。端末はサンプル画像ライブラリにより、例えば、顔の種類、人体の種類又は車両の種類などである複数の種類の画像集が含まれているサンプル画像を取得し、本実施例はそれを限定しない。

好ましくは、端末はサンプル画像を取得した後、画像に対する統一処理が便利であるように、サンプル画像に対して正規化処理を行い、異なるサイズの画像を所定のサイズの画像に処理する。

ステップ２０３において、下記の式を用いて、反復により得られた最適な辞書を所定の辞書Ｄとする。
Ｒ＝［ｒ１，ｒ２，…，ｒｃ］はＣ個のサンプル画像のスパース係数行列、Ｙは全ての種類のサンプル画像、
は一つのベクトルにおける非ゼロ要素の数を計算すること、Ｔ０は予め与えられたスパースの上限、
はベクトルの各要素の平方和を計算してから平方根を計算することを示す。上記の式は、即ち、Ｋ−ＳＶＤ（Ｋ−ｍｅａｎｓＳｉｎｇｕｌａｒＶａｌｕｅＤｅｃｏｍｐｏｓｉｔｉｏｎ、Ｋ−平均値特異値分解）アルゴリズムである。

Ｋ−ＳＶＤアルゴリズムは反復的過程を通じて辞書のサンプル画像における学習を実現し、スパース表現係数を用いて辞書における原子を更新し、連続的反復によって、最後に画像特徴を反映できる、原子が辞書における要素である辞書原子集合、即ち、サンプル画像の学習により得られた最適な辞書である所定の辞書Ｄを取得する。

Ｋ−ＳＶＤアルゴリズムの反復的過程は以下のとおりである。総計Ｘ類のサンプル画像があると仮定し、ｉ番目種類に対して、Ｎｉ個のサンプル画像を与える。行列Ｙｉ＝［ｙｉｌ，…，ｙｉＮｉ］を用いて、ｉ番目に属する全てのサンプル画像を表示し、Ｙ＝［Ｙｌ，…，Ｙｘ］を用いて、全ての種類のサンプル画像を表示する。上記の式を用いて、サンプル画像において学習し、最後に最適な所定の辞書Ｄを取得する。

ステップ２０４において、画像を複数のセルを含む複数のブロックに区分する。好ましくは、端末が正規化処理後の画像を区分することは、画像を複数のブロックに区分し、各ブロックを複数のセルに区分することを含む。

好ましくは、端末が正規化処理後の画像を区分することは、画像を複数のセルに区分し、接続されたセルを複数のセルを含む一つのブロックに組み合わせ、例えば、二つずつ隣接する四つの田字状に配列されたセルを一つのブロックに組み合わせることを含む。

本実施例において、画像区分過程において、ブロックの区分とセルの区分の順序を詳しく限定せず、ブロックを区分してからセルを区分してもよく、セルを区分してからブロックに組み合わせてもよい。

本実施例において、画像が区分されたブロックの間には重複領域が存在するか否かを詳しく限定せず、ブロックの間には重複領域が存在しても、存在しなくてもよい。例えば、図２Ｂに示すように、まず１２８画素＊１２８画素の画像２０を互いに重なっていない１６画素＊１６画素のブロック２１に区分し、さらに１６画素＊１６画素の各ブロック２１を８画素＊８画素のセル２２に区分する場合、画像には８個＊８個＝６４個の互いに重なっていないブロック２１が含まれ、各ブロックには２個＊２個＝４個のセルが含まれている。

例えば、図２Ｃに示すように、まず１２８画素＊１２８画素の画像２０を重複領域が存在する１６画素＊１６画素のブロック２３に区分し、さらに１６画素＊１６画素の各ブロック２３を８画素＊８画素のセル２４に区分する場合、画像には１６個＊１６個＝２５６個の重複領域が存在するブロック２３が含まれ、各ブロックには２個＊２個＝４個のセルが含まれている。

ステップ２０５において、各セルにおける画素をｎ＊１次元のベクトルに調整する。画像を区分した後、各セルにおける画素を一つの行列と考えてもよく、各セルにおける画素に対応する行列をｎ＊１次元のベクトルに調整する。行列調整過程において、図２Ｄ示すように、画素に対応する行列２５の第２列Ｋ２２７を第１列Ｋ１２６の下方に直列接続し、画素に対応する行列２５の第３列（図示せず）を直列接続された第２列Ｋ２２７の下方に直列接続し、これによって類推し、各セルにおける画素に対応する行列２５をｎ＊１次元のベクトル２８に調整する。

ステップ２０６において、下記の式を用いて、各セルにおけるベクトルに対してスパース信号分解を行い、対応するスパースベクトルを取得する。
ｙは各セルにおけるベクトルであり、ｘは所定の辞書Ｄにおいてｙをスパース化して得られたスパースベクトルであり、
はスパースベクトルｘの各列の絶対値の和を求めることを示し、各スパースベクトルはｍ＊１次元のベクトルであり、所定の辞書Ｄはｎ＊ｍの行列である。

画像における各セルに対して、端末は反復的計算により最適な所定の辞書Ｄを取得し、各セルにおけるベクトルを所与の観測信号ｙとする場合、上記の式によって計算して各セルにおけるベクトルの最適な辞書Ｄにおけるスパースベクトルを取得する。各セルにおける調整後のベクトルはｎ＊１次元であり、端末が反復的計算により得られた所定の辞書Ｄはｎ＊ｍの行列であるため、上記の式によって計算して得られた各セルにおけるベクトルに対応するスパースベクトルはｍ＊１次元である。

ステップ２０７において、スパースベクトルに基づき、各セルの勾配の大きさと勾配方向を計算し、各セルの記述子を取得する。端末は勾配演算子を用いて、スパース信号分解後の各セルにおける各画素の横方向勾配と縦方向勾配を計算する。

即ち、勾配演算子を用いて、各セルに対応するスパースベクトルにおける各画素に対して横方向勾配と縦方向勾配を計算する。例示的に、一般的な勾配演算子は下記テーブル１に示すようである。

本実施例において、各セルにおける画素の勾配の大きさを計算する時、テーブル１におけるいずれかの勾配演算子を選択してもよく、他の勾配演算子を選択してもよく、本実施例において勾配演算子の選択を詳しく限定しない。

スパースベクトルにおける要素の横方向勾配はＨ（ｘ，ｙ）と、縦方向勾配はＶ（ｘ，ｙ）と仮定する場合、該要素に対応する勾配方向と勾配ゲインを下記の式（１）と式（２）で計算する。

θ（ｘ，ｙ）はスパースベクトルにおける要素（ｘ，ｙ）の勾配方向であり、ｍ（ｘ，ｙ）は要素（ｘ，ｙ）の勾配の大きさである。

勾配方向θ（ｘ，ｙ）の値の範囲は−９０度から９０度までであり、勾配方向θ（ｘ，ｙ）をｚ個の部分に均等に区分し、各セルに対応するスパースベクトルにおける全ての要素に対して重み付けｍ（ｘ，ｙ）に従って勾配方向に区分された各部分を統計し、最後に各セルはｚ次元のベクトル、即ち、各セルに対応する記述子を取得する。

例えば、勾配方向θ（ｘ，ｙ）を９部分に均等に区分し、各部分に対応する角度は２０度であり、各セルに対応するスパースベクトルにおける全ての要素を重み付けｍ（ｘ，ｙ）に従って２０度ごとに統計し、最後に各セルに対応して９次元のベクトルを取得する。

本実施例において、勾配方向を何個の部分に区分するかを詳しく限定しない。ステップ２０８において、各ブロックにおける各記述子を統計し、各ブロックのＨＯＧ特徴を取得する。

端末は各ブロックに含まれている各セルにおける計算により取得された記述子を統計し、各ブロックのＨＯＧ特徴を取得する。各セルおける計算により取得された記述子を統計する時、端末は各セルに対応する記述子を直列接続し、各ブロックのＨＯＧ特徴が一つのベクトルであるようにして、該ベクトルの次元が該ブロックに含まれているセルに対応する記述子の次元のｋ倍である。

例えば、各セルにおける記述子は９次元のベクトルであり、各ブロックに４個のセルが含まれている場合、４個のセルにおける９次元の記述子を直列接続し、３６次元のベクトルを形成し、該３６次元のベクトルを対応するブロックのＨＯＧ特徴とする。

ステップ２０９において、画像における各ブロックのＨＯＧ特徴を統計し、画像のＨＯＧ特徴を取得する。端末が画像における各ブロックのＨＯＧ特徴を統計し、画像のＨＯＧ特徴を取得する。画像における各ブロックのＨＯＧ特徴を一つの列として一つの行列に直列接続し、画像のＨＯＧ特徴を取得する。

例えば、図２Ｅに示すように、画像にはＨＯＧ特徴がＫｉであるＫ個のブロックが含まれている場合、Ｋｉ個のＨＯＧ特徴を一つの行列２５０に直列接続し、Ｋ１を直列接続された行列の第１列２６０に置き、Ｋ２を直列接続された行列の第２列２７０に置き、これによって類推する。

上に述べたように、本発明の実施例により提供される特徴抽出方法は、複数の種類の画像集を含むサンプル画像を取得し、式を用いて、反復により得られた最適な辞書を所定の辞書Ｄとし、画像を複数のセルを含む複数のブロックに区分し、各セルにおける画素をｎ＊１次元のベクトルに調整し、式を用いて、各セルにおけるベクトルに対してスパース信号分解を行い、対応するスパースベクトルを取得し、スパースベクトルに基づき、各セルの勾配の大きさと勾配方向を計算し、各セルの記述子を取得し、各ブロックにおける各記述子を統計し、各ブロックのＨＯＧ特徴を取得し、画像における各ブロックのＨＯＧ特徴を統計し、画像のＨＯＧ特徴を取得することにより、ＨＯＧ特徴の抽出過程における画像の空間領域に対して直接的に計算して取得することによるパターン認識における検出率及び正確度が低いという問題を解決する。周波数領域における画像のＨＯＧ特徴の抽出を実現し、パターン認識における検出率及び正確度を向上させる効果を達成している。

図２Ａにより示された好ましい実施例において、画像における各ブロックのＨＯＧ特徴を統計し画像のＨＯＧ特徴を取得する過程において、画像における対応的な位置に従うように配列することができる。図３Ａに示すようにステップ２０９を下記ステップ２０９ａ及び２０９ｂで代替する。

ステップ２０９ａにおいて、画像における、Ｍ＊Ｎ個の画像を含む各ブロックのＨＯＧ特徴を初期のＬ＊１次元のベクトルからＭ＊Ｎの行列（Ｌ＝Ｍ＊Ｎ）に調整する。各ブロックのＨＯＧ特徴は各セルに対応する記述子を直列接続してＬ＊１次元のベクトルを取得して、端末がＬ＊１次元のベクトルをＭ＊Ｎの行列に調整するものであり、即ち、各ブロックにおけるＬ＊１次元のベクトルを含まれているセルに従って、各列が一つのセルの記述子である対応する行列に調整し、各セルの記述子を対応する画素に従って調整し、得られた調整後の行列の各列は対応するブロックにおける対応する列の画素に対応するＨＯＧ特徴である。

ステップ２０９ｂにおいて、各ブロックの調整後のＨＯＧ特徴と画像における各前記ブロックの対応的な位置に基づき、画像のＨＯＧ特徴を取得する。各ブロックの調整後のＨＯＧ特徴と画像における各ブロックの対応的な位置に基づき、画像における画素位置に対応するＨＯＧ特徴を取得する。

例えば、図３Ｂに示すように、画像にＨＯＧ特徴がＫｉであるＫ個のブロックが含まれている場合、Ｋｉ個のＨＯＧ特徴をＭ＊Ｎの行列に調整し、Ｋ１の調整後の行列３１を画像における第１のブロック３２の対応的な位置に置き、Ｋ２の調整後の行列３３を画像における第２のブロック３４の対応的な位置に置き、これによって類推し、行列ＭＮを画像における最後のブロックＭＮの対応的な位置に置く。

上に述べたように、本実施例により提供される特徴抽出方法は、画像における、Ｍ＊Ｎ個の画素を含むブロックのＨＯＧ特徴を初期のＬ＊１次元のベクトルをＭ＊Ｎの行列（Ｌ＝Ｍ＊Ｎ）に調整し、各ブロックの調整後のＨＯＧ特徴と画像における各ブロックの対応的な位置に基づき、画像のＨＯＧ特徴を取得することにより、抽出後の画像のＨＯＧ特徴は画像における各ブロックの対応的な位置に対応し、画像における各ブロックの特徴をより良く強調することができる。

以下は本発明に関わる装置の実施例であり、本発明に関わる方法の実施例を実行するのに用いることができる。本発明に関わる装置の実施例に開示されていない詳細については、本発明に関わる方法の実施例を参照する。

図４は一例示的な実施例により示された特徴抽出装置のブロック図であり、図４に示すように、該特徴抽出装置は、区分モジュール４２０と、分解モジュール４４０と、抽出モジュール４６０とを含むがそれに限定されない。

前記区分モジュール４２０は、画像を複数のセルを含む複数のブロックに区分するように配置される。前記分解モジュール４４０は、サンプル画像に反復的アルゴリズムを用いて計算し得られた所定の辞書Ｄを用いて、各セルに対して、所与の観測信号を所定の辞書Ｄに従って複数の要素の値が０であるスパースベクトルに変換するスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得するように配置される。

前記抽出モジュール４６０は、スパースベクトルに基づき、画像の勾配方向ヒストグラムＨＯＧ特徴を抽出するように配置される。スパース信号分解後の得られたスパースベクトルに基づき、画像のＨＯＧ特徴を抽出する。

上に述べたように、本発明の実施例により提供される特徴抽出装置は、画像を複数のセルを含む複数のブロックに区分し、サンプル画像に反復的アルゴリズムを用いて計算し得られた所定の辞書Ｄを用いて、各セルに対してスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得し、スパースベクトルに基づき、画像の勾配方向ヒストグラムＨＯＧ特徴を抽出することにより、ＨＯＧ特徴の抽出過程における画像の空間領域に対して直接的に計算して取得することによるパターン認識における検出率及び正確度が低いという問題を解決する。周波数領域における画像のＨＯＧ特徴の抽出を実現し、パターン認識における検出率及び正確度を向上させる効果を達成している。

図５は別の一例示的な実施例により示された特徴抽出装置のブロック図であり、図５に示すように、該特徴抽出装置は、処理モジュール５１０と、取得モジュール５２０と、反復モジュール５３０と、区分モジュール５４０と、分解モジュール５５０と、抽出モジュール５６０とを含むがそれに限定されない。

前記処理モジュール５１０は、画像に対して正規化処理を行い、所定のサイズの画像を取得するように配置される。パターン認識において、一般的に複数の画像を特徴抽出することが多い。

画像に対する統一処理が便利であるように、画像に対して特徴抽出を行う前、処理モジュール４１０は、画像に対して正規化処理を行い、異なるサイズの画像を所定サイズの画像に処理する。

前記取得モジュール５２０は、複数の種類の画像集を含むサンプル画像を取得するように配置される、サンプル画像ライブラリにより、取得モジュール５２０は、例えば、顔の種類、人体の種類又は車両の種類などである複数の種類の画像集を含むサンプル画像を取得する。

前記反復モジュール５３０は、下記の式を用いて、反復により得られた最適な辞書を所定の辞書Ｄとするように配置される。
Ｒ＝［ｒ１，ｒ２，…，ｒｃ］はＣ個のサンプル画像のスパース係数行列、Ｙは全ての種類のサンプル画像、
は一つのベクトルにおける非ゼロ要素の数を計算すること、Ｔ０は予め与えられたスペースの上限、
はベクトルの各要素の平方和を計算してから平方根を計算することを示す。

Ｋ−ＳＶＤアルゴリズムは反復的過程を通じてサンプル画像における辞書の学習を実現し、スパース表現係数を用いて辞書における原子を更新し、最後に画像特徴を反映できる、原子が辞書における要素である辞書原子集合、即ち、サンプル画像の学習における画像特徴をよく反映できる最適な辞書である所定の辞書Ｄを取得する。

Ｋ−ＳＶＤアルゴリズムの反復的過程は以下のとおりである。総計Ｘ類のサンプル画像があると仮定し、ｉ番目の種類に対して、Ｎｉ個のサンプル画像を与える。行列Ｙｉ＝［ｙｉｌ，…，ｙｉＮｉ］を用いて、ｉ番目の種類に属する全てのサンプル画像を表示し、Ｙ＝［Ｙｌ，…，Ｙｘ］を用いて、全ての種類のサンプル画像を表示する。上記の式を用いて、サンプル画像において学習し、最後に最適な所定の辞書Ｄを取得する。

前記区分モジュール５４０は、画像を複数のセルを含む複数のブロックに区分するように配置される。好ましくは、区分モジュール５４０が正規化処理後の画像を区分することは、画像を複数のブロックに区分し、各ブロックを複数のセルに区分することを含む。

好ましくは、区分モジュール５４０が正規化処理後の画像を区分することは、画像を複数のセルに区分し、接続されたセルを複数のセルを含む一つのブロックに組み合わせ、例えば、二つずつ隣接する四つの田字状に配列されたセルを一つのブロックに組み合わせることを含む。

本実施例において、区分モジュール５４０は画像区分過程に、ブロックの区分とセルの区分の順序を詳しく限定せず、ブロックを区分してからセルを区分してもよく、セルを区分してからブロックに組み合わせてもよい。

本実施例において、区分モジュール５４０は画像が区分されたブロックの間に重複領域が存在するか否かを詳しく限定せず、ブロックの間には重複領域が存在してもよく、存在しなくてもよい。

前記分解モジュール５５０は、サンプル画像に反復的アルゴリズムを用いて計算し得られた所定の辞書Ｄを用いて、各セルに対して、所与の観測信号を所定の辞書Ｄに従って多くの要素の値が０であるスパースベクトルに変換するスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得するように配置される。

本実施例において、区分ジュール５５０は、第１調整サブモジュール５５１と、信号分解サブモジュール５５２とを含むことができる。前記第１調整サブモジュール５５１は、各セルにおける画素をｎ＊１次元のベクトルに調整するように配置される。

画像を区分した後、各セルにおける画素を一つの行列と考えてもよく、各セルにおける画素に対応する行列をｎ＊１次元のベクトルに調整する。

前記信号分解サブモジュール５５２は、下記の式を用いて、所定の辞書Ｄにおいて、各セルにおけるベクトルに対してスパース信号分解を行い、対応するスパースベクトルを取得するように配置される。
ｙは各セルにおけるベクトルであり、ｘは所定の辞書Ｄにおいてｙをスパース化して得られたスパースベクトルであり、
はスパースベクトルｘの各列の絶対値の和を求めることを示し、各スパースベクトルはｍ＊１次元のベクトルであり、所定の辞書Ｄはｎ＊ｍの行列である。

画像における各セルに対して、反復モジュール５３０によって、計算により最適な所定の辞書Ｄを取得し、信号分解サブモジュール５５２は、各セルにおけるベクトルを所与の観測信号ｙとする場合、上記の式の計算により各セルにおけるベクトルの最適な辞書Ｄにおけるスパースベクトルｘを取得する。各セルにおける調整後のベクトルはｎ＊１次元であり、反復モジュール５３０は反復的計算により取得された所定の辞書Ｄはｎ＊ｍの行列であるため、上記の式によって計算して取得された各セルにおけるベクトルに対応するスパースベクトルはｍ＊１次元である。

前記抽出モジュール５６０は、スパースベクトルに基づき、画像の勾配方向ヒストグラムＨＯＧ特徴を抽出するように配置される。スパース信号分解により得られたスパースベクトルに基づき、画像のＨＯＧ特徴を抽出する。

本実施例において、抽出モジュールは、計算サブモジュール５６１と、第１統計サブモジュール５６２と、第２統計サブモジュール５６３とを含むことができる。前記計算サブモジュール５６１は、スパースベクトルに基づき、各セルの勾配の大きさと勾配方向を計算し、各セルの記述子を取得するように配置される。

計算サブモジュール５６１は、勾配演算子を用いて、スパース信号分解後の各セルにおける各画素の横方向勾配と縦方向勾配を計算する。

即ち、勾配演算子を用いて、計算サブモジュール５６１は各セルに対応するスパースベクトルにおける各画素に対して横方向勾配と縦方向勾配を計算する。本実施例は勾配演算子の選択を詳しく限定しない。

スパースベクトルにおける要素の横方向勾配はＨ（ｘ，ｙ）、縦方向勾配はＶ（ｘ，ｙ）であると仮定する場合、該要素に対応する勾配方向と勾配ゲインを下記の式（１）と式（２）で計算する。

θ（ｘ，ｙ）はスパースベクトルにおける要素（ｘ，ｙ）の勾配方向であり、ｍ（ｘ，ｙ）は（ｘ，ｙ）の勾配の大きさである。

勾配方向θ（ｘ，ｙ）の値の範囲は−９０度から９０度までであり、勾配方向θ（ｘ，ｙ）をｚ個の部分に均等に区分し、各セルに対応するスパースベクトルにおける全ての要素に対して重み付けｍ（ｘ，ｙ）に従って勾配方向に区分された各部分を統計し、最後に各セルは一つのｚ次元のベクトル、即ち、各セルに対応する記述子を取得する。

第１統計サブモジュール５６２は、各ブロックにおける各記述子を統計し、各ブロックのＨＯＧ特徴を取得するように配置される。第１統計サブモジュール５６２は、各ブロックに含まれている各セルにおける計算により取得された記述子を統計し、各ブロックのＨＯＧ特徴を取得する。

各セルにおける計算により取得された記述子を統計する時、第１統計サブモジュール５６２は各セルに対応する記述子を直列接続し、各ブロックのＨＯＧ特徴が一つのベクトルであるようにして、該ベクトルの次元が該ブロックに含まれているセルに対応する記述子の次元のｋ倍である。前記第２統計サブモジュール５６３は、画像における各ブロックのＨＯＧ特徴を統計し、画像のＨＯＧ特徴を取得するように配置される。

第２統計サブモジュール５６３は、画像における各ブロックのＨＯＧ特徴を統計し、画像のＨＯＧ特徴を取得する。好ましくは、第２統計サブモジュール５６３は、画像における各ブロックのＨＯＧ特徴を一つの列として一つの行列に直列接続し、画像のＨＯＧ特徴を取得するように配置される。

上に述べたように、本発明の実施例により提供される特徴抽出装置は、複数の種類の画像集を含むサンプル画像を取得し、式を用いて、反復により得られた最適な辞書を所定の辞書Ｄとし、画像を複数のセルを含む複数のブロックに区分し、各セルにおける画素をｎ＊１次元のベクトルに調整し、式を用いて、各セルにおけるベクトルに対してスパース信号分解を行い、対応するスパースベクトルを取得し、スパースベクトルに基づき、各セルの勾配の大きさと勾配方向を計算し、各セルの記述子を取得し、各ブロックにおける各記述子を統計し、各ブロックのＨＯＧ特徴を取得し、画像における各ブロックのＨＯＧ特徴を統計し、画像のＨＯＧ特徴を取得することにより、ＨＯＧ特徴の抽出過程における画像の空間領域に対して直接的に計算して取得することによるパターン認識における検出率及び正確度が低いという問題を解決する。周波数領域における画像のＨＯＧ特徴の抽出を実現し、パターン認識における検出率及び正確度を向上させる効果を達成している。

図５により示された好ましい実施例において、図６に示すように、第２統計サブモジュール５６３は、第２調整サブモジュール６１０と、特徴抽出サブモジュール６２０とを含むことができる。前記第２調整サブモジュール６１０は、画像における、Ｍ＊Ｎ個の画素を含む各ブロックのＨＯＧ特徴を初期のＬ＊１次元ベクトルからＭ＊Ｎの行列（Ｌ＝Ｍ＊Ｎ）に調整するように配置される。

各ブロックのＨＯＧ特徴は各セルに対応する記述子を直列接続してＬ＊１次元のベクトルを取得して、調整サブモジュール６１０はＬ＊１次元のベクトルをＭ＊Ｎの行列に調整し、即ち、各ブロックにおけるＬ＊１次元のベクトルを含まれているセルに従って、各列が一つのセルの記述子である対応する行列に調整し、各セルの記述子を対応する画素に従って調整し、得られた調整後の行列の各列は対応するブロックにおける対応する列の画素に対応するＨＯＧ特徴である。

前記特徴抽出サブモジュール６２０は、各ブロックの調整後のＨＯＧ特徴と前記画像における各ブロックの対応的な位置に基づき、画像のＨＯＧ特徴を取得するように配置される。

特徴抽出サブモジュール６２０は、各ブロックの調整後のＨＯＧ特徴と画像における各ブロックの対応的な位置に基づき、画像における画素位置に対応するＨＯＧ特徴を取得する。

上に述べたように、本実施例により提供される特徴抽出装置は、画像における、Ｍ＊Ｎ個の画素を含むブロックのＨＯＧ特徴を初期のＬ＊１次元のベクトルをＭ＊Ｎの行列（Ｌ＝Ｍ＊Ｎ）に調整することにより、各ブロックの調整後のＨＯＧ特徴と画像における各ブロックの対応的な位置に基づき、画像のＨＯＧ特徴を取得し、抽出後の画像のＨＯＧ特徴は画像における各ブロックに対応的な位置に対応し、画像における各ブロックの特徴をより良く強調することができる。

上記実施例における装置について、各モジュールの操作を実行する具体的な形態は、すでに該方法に関する実施例において詳しく説明されたため、ここで詳細な説明を省略する。

本発明の一例示的な実施例は特徴抽出装置を提供し、本発明により提供される特徴抽出方法を実現することができ、該特徴抽出装置は、画像を複数のセルを含む複数のブロックに区分し、サンプル画像に反復的アルゴリズムを用いて計算し得られた所定の辞書Ｄを用いて、各セルスパース信号分解を行い、各セルにそれぞれ対応するスパースベクトルを取得し、前記スパースベクトルに基づき、前記画像の勾配方向ヒストグラムのＨＯＧ特徴を抽出するように配置された、プロセッサと、プロセッサの実行可能なコマンドを記憶するメモリと、を含む。

図７は一例示的な実施例により示された特徴抽出装置のブロック図である。例えば、装置７００は、携帯電話、コンピュータ、デジタル放送端末、メッセージ送受信装置、ゲームコンソール、タブレット型装置、医療機器、フィットネス装置、パーソナルデジタルアシスタントなどであってもよい。

図１１に示すように、装置７００は、処理部１１０２、メモリ１１０４、電源部１１０６、マルチメディア部１１０８、音声部１１１０、入力／出力（Ｉ／Ｏ）のインタフェース１１１２、センサー部１１１４、及び通信部１１１６のうちの一つ又は複数の部材を含むことができる。

処理部７０２は、一般的に装置７００の全体的操作、例えば、表示、電話呼び出し、データ通信、カメラ操作及び記録操作に関する操作を制御する。処理部７０２は、上記方法の全部又は一部のステップを完成するために、一つ又は複数のプロセッサ７２０を含んでコマンドを実行してもよい。さらに、処理部７０２は、その他のモジュールとのインタラクションを便利にするように、一つ又は複数のモジュールを含んでもよい。例えば、処理部７０２は、マルチメディア部７０８と処理部７０２とのインタラクションを便利にするように、マルチメディアモジュールを含んでもよい。

メモリ７０４は、装置７００の操作をサポートするために、様々な種類のデータを記憶するように配置される。これらのデータの実例は、装置７００において操作される如何なるアプリケーション又は方法のコマンド、連絡先データ、電話帳データ、メッセージ、画像、ビデオなどを含む。メモリ７０４は、如何なる種類の揮発性又は不揮発性メモリ又はそれらの組合せ、例えば、スタティックランダムアクセスメモリ（ＳＲＡＭ）、電気的消去可能なプログラマブル読み取り専用メモリ（ＥＥＰＲＯＭ）、消去可能なプログラマブル読み取り専用メモリ（ＥＰＲＯＭ）、プログラマブル読み取り専用メモリ（ＰＲＯＭ）、読み取り専用メモリ（ＲＯＭ）、磁気メモリ、フラッシュメモリ、磁気ディスク又は光ディスクにより実現することができる。

電源部７０６は、装置７００の様々な部材のために電力を供給する。電源部７０６は、電源管理システム、一つ又は複数の電源、及びその他の装置７００のための電力の生成、管理及び供給に関連する部材を含むことができる。

マルチメディア部７０８は、前記装置７００とユーザーの間の一つの出力インタフェースを提供するスクリーンを含む。一部の実施例において、スクリーンは液晶ディスプレイ（ＬＣＤ）とタッチパネル（ＴＰ）を含んでもよい。スクリーンにタッチパネルが含まれる場合、スクリーンはユーザーからの入力信号を受信するために、タッチスクリーンに実現されることができる。タッチパネルは、タッチ、スワイプ及びタッチパネルにおけるジェスチャーを感知するために、一つ又は複数のタッチセンサを含む。前記タッチセンサは、タッチ又はスワイプ動作の境界を感知するとともに、前記タッチ又はスワイプ動作に関わる持続時間及び圧力を検出することができる。一部の実施例において、マルチメディア部７０８は、フロントカメラ及び／又はバックカメラを含む。装置７００が操作モードである場合、例えば、撮影モード又はビデオモードである場合、フロントカメラ及び／又はバックカメラは外部のマルチメディアデータを受信することができる。各フロントカメラ及びバックカメラは、固定された光学レンズシステムであってもよく、又は焦点距離と光学ズーム能力を有する。

音声部７１０は、音声信号を出力及び／又は入力するように配置される。例えば、音声部７１０は、マイクロホン（ＭＩＣ）を含み、装置７００が操作モードである場合、例えば、呼び出しモード、記録モード及び音声認識モードである場合、マイクロホンは外部の音声信号を受信するように配置される。受信された音声信号は、さらにメモリ７０４に記憶され、又は通信部７１６を介して送信される。一部の実施例において、音声部７１０は、さらに音声信号を出力するスピーカーを含む。

Ｉ／Ｏインタフェース７１２は、処理部７０２と周辺インターフェース部との間にインタフェースを提供し、上記周辺インターフェース部は、キーボード、クリックホイール、ボタンなどであってもよい。これらのボタンは、ホームボタン、ボリュームボタン、スタートボタン及びホールドボタンを含むことができるが、それに限定されない。

センサー部７１４は、一つ又は複数のセンサを含み、装置７００に各方面の状態評価を提供するためである。例えば、センサー部７１４は、装置７００のオン／オフ状態、部材の相対的位置決めを検出することができ、例えば、前記部材が装置７００のディスプレイ及びキーパッドであり、センサー部７１４は、さらに装置７００又は装置７００の一つの部材の位置変化、ユーザーと装置７００との接触の有無、装置７００の方角又は加速／減速及び装置７００の温度変化を検出することができる。センサー部７１４は、近接センサを含むことができ、如何なる物理的接触がない時、近傍物体の存在を検出するように配置される。センサー部７１４は、さらに光学センサ、例えば、ＣＭＯＳ又はＣＣＤイメージセンサを含むことができ、イメージングアプリケーションに用いられる。一部の実施例において、該センサー部７１４は、さらに加速度センサ、ジャイロセンサ、磁気センサ、圧力センサ又は温度センサを含むことができる。

通信部７１６は、装置７００とその他の装置との有線又は無線方式による通信を便利にするように配置される。装置７００は、通信標準に基づく無線ネットワーク、例えば、Ｗｉ−Ｆｉ、２Ｇ又は３Ｇ、又はそれらの組み合わせにアクセスすることができる。一例示的な実施例において、通信部７１６は、放送チャネルを介して外部放送管理システムからの放送信号又は放送関連情報を受信する。一例示的な実施例において、通信部７１６は、狭域通信を促進するために、さらに近距離無線通信（ＮＦＣ）モジュールを含む。例えば、ＮＦＣモジュールにおいて、無線周波数認識（ＲＦＩＤ）技術、赤外線データ協会（ＩｒＤＡ）技術、超広帯域（ＵＷＢ）技術、ブルートゥース（ＢＴ）及びその他の技術に基づいて実現することができる。

例示的な実施例において、装置７００は、一つ又は複数の特定用途向け集積回路（ＡＳＩＣ）、デジタル信号プロセッサ（ＤＳＰ）、デジタル信号処理装置（ＤＳＰＤ）、プログラマブルロジックデバイス（ＰＬＤ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、コントローラ、マイクロコントローラ、マイクロプロセッサ又はその他の電子部品により実現することができ、上記特徴抽出方法を実行するのに用いられる。

例示的な実施例において、さらに、コマンドを含む非一時的コンピュータ可読記憶媒体、例えば、コマンドを含むメモリ７０４を提供し、上記方法を完成するために、上記コマンドは装置７００のプロセッサ７２０により実行することができる。例えば、前記非一時的なコンピュータ可読記憶媒体は、ＲＯＭ、ランダムアクセスメモリ（ＲＡＭ）、ＣＤ−ＲＯＭ、磁気テープ、フロッピー（登録商標）ディスク及び光データ記憶装置などであってもよい。

当業者であれば、明細書を考慮しここに開示された発明を実践した後、本発明のその他の実施様態を容易に想到できる。本発明は、本発明の如何なる変形、用途又は適応的変化を含むためのものであり、これらの変形、用途又は適応的変化は本発明の一般的な原理に準じ、本発明の開示されていない当該技術分野における一般的知識又は慣用の技術手段を含む。明細書と実施例は例示的なものに過ぎず、本発明の実際の範囲と精神は下記特許請求の範囲により与えられる。

理解すべきことは、本発明は既に上記のように説明され、図面に示された正確な構造に限定されず、その範囲を逸脱しない限りにおいて様々な修正や変更を行うことができる。本発明の範囲は特許請求の範囲のみにより限定される。

Claims

特徴抽出方法であって、
画像を複数のセルを含む複数のブロックに区分することと、
サンプル画像に反復的アルゴリズムを用いて計算し得られた辞書Ｄを用いて、各前記セルに対してスパース信号分解を行い、各前記セルにそれぞれ対応するスパースベクトルを取得することと、
前記スパースベクトルに基づき、前記画像の勾配方向ヒストグラムＨＯＧ特徴を抽出することと、
を含むことを特徴とする方法。
前記方法は、さらに、
複数の種類の画像集を含む前記サンプル画像を取得することと、
下記の式を用いて、反復により得られた最適な辞書を前記所定の辞書Ｄとすることと、を含み、
Ｒ＝［ｒ１，ｒ２，…，ｒｃ］はＣ個の前記サンプル画像のスパース係数行列、Ｙは全ての種類の前記サンプル画像、
は一つのベクトルにおける非ゼロ要素の数を計算すること、Ｔ０は予め与えられたスペースの上限、
はベクトルの各要素の平方和を計算してから平方根を計算することを示すことを特徴とする請求項１に記載の方法。
前記所定の辞書Ｄを用いて、各前記セルに対してスパース信号分解を行い、各前記セルにそれぞれ対応するスパースベクトルを取得することは、
各前記セルにおける画素をｎ＊１次元のベクトルに調整することと、
下記の式を用いて、前記所定の辞書Ｄにおいて、各前記セルにおける前記ベクトルに対してスパース信号分解を行い、対応するスパースベクトルを取得することと、を含み、
ｙは各前記セルにおける前記ベクトルであり、ｘは前記所定の辞書Ｄにおいてｙをスパース化して得られたスパースベクトルであり、
は前記スパースベクトルｘの各列の絶対値の和を求めることを示し、各前記スパースベクトルはｍ＊１次元のベクトルであり、前記所定の辞書Ｄはｎ＊ｍの行列であることを特徴とする請求項２に記載の方法。
前記スパースベクトルに基づき、前記画像の勾配方向ヒストグラムＨＯＧ特徴を抽出することは、
前記スパースベクトルに基づき、各前記セルの勾配の大きさと勾配方向を計算し、各前記セルの記述子を取得することと、
各前記ブロックにおける各前記記述子を統計し、各前記ブロックのＨＯＧ特徴を取得することと、
前記画像における各前記ブロックのＨＯＧ特徴を統計し、前記画像のＨＯＧ特徴を取得することと、
を含むことを特徴とする請求項１に記載の方法。
前記画像における各前記ブロックのＨＯＧ特徴を統計し、前記画像のＨＯＧ特徴を取得することは、
前記画像における各前記ブロックのＨＯＧ特徴を一つの列として一つの行列に直列接続し、前記画像のＨＯＧ特徴を取得することを含むことを特徴とする請求項４に記載の方法。
前記画像における各前記ブロックのＨＯＧ特徴を統計し、前記画像のＨＯＧ特徴を取得することは、
前記画像における、Ｍ＊Ｎ個の画像を含む各前記ブロックのＨＯＧ特徴を初期のＬ＊１次元のベクトルからＭ＊Ｎの行列（Ｌ＝Ｍ＊Ｎ）に調整することと、
各前記ブロックの調整後の前記ＨＯＧ特徴と前記画像における各前記ブロックの対応的な位置に基づき、前記画像のＨＯＧ特徴を取得することと、
を含むことを特徴とする請求項４に記載の方法。
前記方法は、さらに、
前記画像正規化処理を行い、所定のサイズの前記画像を取得することを含むことを特徴とする請求項１〜６のいずれかに記載の方法。
特徴抽出装置であって、
画像を複数のセルを含む複数のブロックに区分するように配置された区分モジュールと、
サンプル画像に反復的アルゴリズムを用いて計算し得られた辞書Ｄを用いて、各前記セルに対してスパース信号分解を行い、各前記セルにそれぞれ対応するスパースベクトルを取得するように配置された分解モジュールと、
前記スパースベクトルに基づき、前記画像の勾配方向ヒストグラムＨＯＧ特徴を抽出するように配置された抽出モジュールと、
を含むことを特徴とする装置。
前記装置は、さらに、
複数の種類の画像集を含むサンプル画像を取得するように配置された取得モジュールと、
下記の式を用いて、反復により得られた最適な辞書を前記所定の辞書Ｄとするように配置された反復モジュールと、を含み、
Ｒ＝［ｒ１，ｒ２，…，ｒｃ］はＣ個の前記サンプル画像のスパース係数行列、Ｙは全ての種類の前記サンプル画像、
は一つのベクトルにおける非ゼロ要素の数を計算すること、Ｔ０は予め与えられたスパースの上限、
はベクトルの各要素の平方和を計算してから平方根を計算することを示すことを特徴とする請求項８に記載の装置。
前記区分モジュールは、
各前記セルにおける画素をｎ＊１次元のベクトルに調整するように配置された第１調整サブモジュールと、
下記の式を用いて、前記所定の辞書Ｄにおいて、各前記セルにおける前記ベクトルに対してスパース信号分解を行い、対応するスパースベクトルを取得するように配置された信号分解サブモジュールと、を含み、
ｙは各前記セルにおける前記ベクトルであり、ｘは前記所定の辞書Ｄにおいてｙをスパース化して得られたスパースベクトルであり、
は前記スパースベクトルｘの各列の絶対値の和を求めることを示し、各前記スパースベクトルはｍ＊１次元のベクトルであり、前記所定の辞書Ｄはｎ＊ｍの行列であることを特徴とする請求項９に記載の装置。
前記抽出モジュールは、
前記スパースベクトルに基づき、各前記セルの勾配の大きさと勾配方向を計算し、各前記セルの記述子を取得するように配置された計算サブモジュールと、
各前記ブロックにおける各前記記述子を統計し、各前記ブロックのＨＯＧ特徴を取得するように配置された第１統計サブモジュールと、
前記画像における各前記ブロックのＨＯＧ特徴を統計し、前記画像のＨＯＧ特徴を取得するように配置された第２統計サブモジュールと、
を含むことを特徴とする請求項８に記載の装置。
前記第２統計サブモジュールは、
前記画像における各前記ブロックのＨＯＧ特徴を一つの列として一つの行列に直列接続し、前記画像のＨＯＧ特徴を取得するように配置されたことを特徴とする請求項１１に記載の装置。
前記第２統計サブモジュールは、
前記画像における、Ｍ＊Ｎ個の画素を含む各前記ブロックのＨＯＧ特徴を初期のＬ＊１次元ベクトルからＭ＊Ｎの行列（Ｌ＝Ｍ＊Ｎ）に調整するように配置された第２調整サブモジュールと、
各前記ブロックの調整後の前記ＨＯＧ特徴と前記画像における各前記ブロックの対応的な位置に基づき、前記画像のＨＯＧ特徴を取得するように配置された特徴抽出サブモジュールと、
を含むことを特徴とする請求項１１に記載の装置。
前記装置は、さらに、
前記画像に対して正規化処理を行い、所定のサイズの前記画像を取得するように配置された処理モジュールを含むことを特徴とする請求項８〜１３のいずれかに記載の装置。
特徴抽出装置であって、
画像を複数のセルを含む複数のブロックに区分し、
サンプル画像に反復的アルゴリズムを用いて計算し得られた辞書Ｄを用いて、各前記セルに対してスパース信号分解を行い、各前記セルにそれぞれ対応するスパースベクトルを取得し、
前記スパースベクトルに基づき、前記画像の勾配方向ヒストグラムＨＯＧ特徴を抽出するように配置されたプロセッサと、
前記プロセッサの実行可能なコマンドを記憶するメモリと、
を含むことを特徴とする装置。