JP5756443B2 - 画像分類装置及び画像識別装置並びにプログラム - Google Patents

画像分類装置及び画像識別装置並びにプログラム Download PDF

Info

Publication number
JP5756443B2
JP5756443B2 JP2012211299A JP2012211299A JP5756443B2 JP 5756443 B2 JP5756443 B2 JP 5756443B2 JP 2012211299 A JP2012211299 A JP 2012211299A JP 2012211299 A JP2012211299 A JP 2012211299A JP 5756443 B2 JP5756443 B2 JP 5756443B2
Authority
JP
Japan
Prior art keywords
image
pattern
feature
unit
extraction unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012211299A
Other languages
English (en)
Other versions
JP2014067174A (ja
Inventor
数藤 恭子
恭子 数藤
行信 谷口
行信 谷口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012211299A priority Critical patent/JP5756443B2/ja
Publication of JP2014067174A publication Critical patent/JP2014067174A/ja
Application granted granted Critical
Publication of JP5756443B2 publication Critical patent/JP5756443B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、画像分類装置及び画像識別装置並びにプログラムに関する。
衣服等の柄やパターンをコンピュータ等の装置に識別させるための手法が検討されている(例えば、非特許文献1〜3)。非特許文献1では、テンプレートマッチングによる方法が示されている。このテンプレートマッチングの方法は、全く同じ柄を識別するには適している。しかし、この方法では、同じ縞模様というカテゴリでも縞模様の幅が異なったり、同じ水玉模様というカテゴリでも水玉の大きさや間隔が異なったりする場合に、これらを同一のカテゴリと識別することが難しい。また、様々な柄に対応するには、柄を予め記憶する辞書の生成において、柄を分類して、柄の種類ごとにスケーリングや位置を揃えた画像を多数収集しなくてはならないという欠点がある。更に、衣服の変形やひずみにも弱いという欠点がある。そのため、この方法においては、衣服を細かいパッチ領域に分割し、領域ごとにアフィン変換をすることで対応している。
非特許文献2では、周波数解析による方法と局所特徴を用いる方法とが示されている。この周波数解析による方法は、比較的単純な幾何学的な柄、すなわち縞模様等の特定の単純な柄を識別する場合には有効と考えられる。また、縞模様とチェックを区別することは容易であると考えられる。しかし、画像の解像度の変化がある場合や間隔の異なる縞模様をどちらも縞模様という同じカテゴリとして識別したい場合、それらを同一のカテゴリとして識別したい場合、それらを同一のカテゴリとして識別することは難しい。
また、局所特徴を用いる方法は、細かい模様を識別するのに適している。また、スケールの変化には強い。しかし、模様のひずみやノイズに弱いと考えられる。まあ、縞模様などの大局的な特徴の抽出には適さない。
非特許文献3では、テクスチャ解析による方法が示されている。このテクスチャ解析による方法は、画像中の繰り返しパターンの方向性を検出することができ、例えば、布地を拡大した画像のように、細かい繰り返しパターンの識別に適している。しかし、花柄や動物柄などのように、細かい単位の繰り返しパターンではなく、多様な変化を含む複雑な柄の識別には適さない。なお、テクスチャ解析は、非特許文献3に記載されているビットラン解析の他、同時生起行列やモーメント特徴などを用いる手法がある。
田口哲典、青木輝勝、安田浩、「"MIRACLE"システムのための布形状認識の一検討」、電子情報通信学会技術研究報告 IE2002−113、pp.55−58、2002年 山口順平、嶋田和孝、榎田修一、江島俊朗、遠藤勉、「顔特徴とコンテキスト情報に基づく人物識別」、日本知能情報ファジイ学会誌 Vol.23、No.2、pp.137−145、2011年 森俊夫、井出和美、「レース模様のテクスチャ特徴とビットラン解析」、岐阜女子大学紀要、No.30、pp.161−166、2010年
しかしながら、非特許文献1〜3に示されている方法では、柄の特徴などを記憶した辞書の作成や、識別結果などを安定して得るためには、辞書作成用のデータや識別領域を切り出す際に衣服の折り目や外形と背景の境界などのない部分を選択する必要があるが、これを手動で行うことには手間が掛かり、大量のデータを用意することは困難であるという問題がある。
本発明は、上記問題を解決すべくなされたもので、その目的は、辞書の作成や識別結果を安定して得られるようにするとともに、柄を識別する精度を向上させることができる画像分類装置及び画像識別装置並びにプログラムを提供することにある。
上記問題を解決するために、本発明における画像分類装置は、学習画像及び該学習画像に含まれる柄を示すラベルの複数の組み合わせが学習データとして入力される画像分類装置であって、前記学習画像に撮像されている生地の柄が不連続な領域又は生地のしわがある領域を検出し、前記学習画像内の当該領域以外の領域であって前記生地の柄が含まれる領域を切り出す第1の画像切り出し部と、前記第1の画像切り出し部が切り出した画像に含まれる柄の特徴を示す特徴量を複数抽出する第1の特徴量抽出部と、前記第1の特徴量抽出部が抽出した複数の特徴量ごとに代表ベクトルを抽出する代表ベクトル抽出部と、前記代表ベクトル抽出部が抽出した代表ベクトルに基づいて該代表ベクトルに対応する特徴量のヒストグラムを生成する第1の特徴ヒストグラム生成部と、前記第1の特徴ヒストグラム生成部が生成するヒストグラムと、前記画像に対応するラベルとに基づいて、ヒストグラムに対する重み係数である識別パラメータとを算出し、算出した識別パラメータと該識別パラメータに対応する代表ベクトルとを対応付けた柄分類データを生成する学習部とを備えていることを特徴とする。
また、本発明における画像分類装置は、学習画像及び該学習画像に含まれる柄を示すラベルの複数の組み合わせが学習データとして入力される画像分類装置であって、前記学習画像に撮像されている生地の柄が不連続な領域又は生地のしわがある領域を検出し、前記学習画像内の当該領域以外の領域であって前記生地の柄が含まれる領域を切り出す第1の画像切り出し部と、前記第1の画像切り出し部が切り出した画像に含まれる柄の特徴を示す特徴量を複数抽出する第1の特徴量抽出部と、前記第1の特徴量抽出部が抽出した複数の特徴量を連結して得られる特徴量ごとに代表ベクトルを抽出する代表ベクトル抽出部と、前記代表ベクトル抽出部が抽出した代表ベクトルに基づいて該代表ベクトルに対応する特徴量のヒストグラムを生成する第1の特徴ヒストグラム生成部と、前記第1の特徴ヒストグラム生成部が生成するヒストグラムと、前記画像に対応するラベルとに基づいて、ヒストグラムに対する重み係数である識別パラメータとを算出し、算出した識別パラメータと該識別パラメータに対応する代表ベクトルとを対応付けた柄分類データを生成する学習部とを備えていることを特徴とする。
また、本発明における画像識別装置は、入力される画像に撮像されている生地の柄が不連続な領域又は生地のしわがある領域を検出し、前記画像内の当該領域以外の領域であって前記生地の柄が含まれる領域を切り出す第2の画像切り出し部と、前記第2の画像切り出し部が切り出した画像に含まれる柄の特徴を示す特徴量を複数抽出する第2の特徴量抽出部と、上記に記載の画像分類装置によって生成された柄分類データに含まれる代表ベクトルに基づいて、前記第2の特徴量抽出部が抽出した複数の特徴量ごとにヒストグラムを生成する第2の特徴ヒストグラム生成部と、前記画像分類装置に記憶されている柄分類データに含まれる識別パラメータと、前記第2の特徴ヒストグラム生成部が生成したヒストグラムとに基づいて、前記入力される画像の生地の柄を識別する識別部とを備えていることを特徴とする。
また、本発明におけるプログラムは、上記に記載の画像分類装置としてコンピュータを機能させるためのプログラムである。
また、本発明におけるプログラムは、上記に記載の画像識別装置としてコンピュータを機能させるためのプログラムである。
この発明によれば、生地の柄が不連続な領域やしわのある領域などのひずみが少ない領域を画像から切り出し、切り出した画像から複数の特徴量を抽出し、抽出した特徴量を組み合わせて識別パラメータを算出することにより、辞書の作成や識別結果を安定して得られるようにすることができる。また、ひずみが少ない領域の画像に基づいて得られた識別パラメータを用いて柄の識別を行うことにより、柄を識別する精度を向上させることができる。
本実施形態における画像分類装置1の構成を示す概略ブロック図である。 同実施形態における画像切り出し部11が方法例1を用いて行う処理の一例を示す図である。 同実施形態における画像識別装置2の構成例を示す概略ブロック図である。 同実施形態における画像識別装置2による柄の識別結果の一例を示す図である。 画像分類装置1の変形例としての画像分類装置1Aの構成を示す概略ブロック図である。
以下、図面を参照して、本発明の一実施形態における画像分類装置及び画像識別装置並びにプログラムを説明する。
図1は、本実施形態における画像分類装置1の構成を示す概略ブロック図である。画像分類装置1は、衣服やバッグ等が撮像された画像(学習画像)と、当該画像に撮像されている衣服やバッグ等の生地の柄(又はパターン)を識別するラベルとを学習データとして入力し、柄を識別するための情報である柄分類データを生成して記憶する。本実施形態における画像分類装置1は、同図に示すように、画像切り出し部11、特徴抽出部12、代表ベクトル抽出部13、特徴ヒストグラム生成部14、学習部15、及び、代表ベクトル・識別パラメータ記憶部16を備えている。
画像切り出し部11は、入力された画像に含まれる衣服等の形状やしわの影響を受けずに安定してテクスチャを得られる領域を画像から選択して切り出す。画像切り出し部11は、切り出した画像を特徴抽出部12に出力する。換言すると、画像切り出し部11は、画像内の生地の柄が不連続な領域又は生地のしわがある領域を検出し、画像内の当該領域以外の領域であって生地の柄が含まれる領域の画像を切り出す。以下に、画像切り出し部11がしわの少ない領域を入力された画像から切り出す方法例を3通り示す。
(方法例1)
方法例1に示す方法では、モホロジ処理を利用して袖や襟元などの形状の影響を除いた領域を切り出す。具体的には、まず入力された画像を二値化する。二値化した画像にモホロジ処理のオープニングを施す。なお、モホロジ処理におけるオープニングとは、収縮(erosion)ののち膨張(dilation)を行うことで凹凸のノイズを除去する処理である。
オープニングを施して得られた二値画像をマスクとして、入力された画像からしわの少ない領域を切り出し、切り出した画像を出力する。
図2は、本実施形態における画像切り出し部11が方法例1を用いて行う処理の一例を示す図である。同図において、画像例1は縞模様のカットソーの画像(A)からしわの少ない領域を切り出す例を示している。画像(A)に対する二値化により画像(B)を生成し、画像(B)に対してオープニングを施して画像(C)を得る。この画像(C)をマスクとすることにより画像(A)からしわの少ない領域を切り出した画像(D)を得ることができる。
また、画像例2はチェック柄のシャツの画像(E)からしわの少ない領域を切り出す例を示している。画像例1と同様に、画像(E)に対する二値化により画像(F)を生成し、画像(F)に対してオープニングを施して画像(G)を得る。画像(G)をマスクとして入力された画像(E)からしわの少ない領域を切り出した画像(H)を得ることができる。
(方法例2)
方法例2では、主に衣類の場合、公知の技術による衣服画像の確率モデルあてはめを用いて、ジャケットやワンピースなどの形状のカテゴリごとに、衣服の襟、形、裾などを大まかに位置合わせすることができる。このような技術は、例えば、参考文献1(数藤恭子、島村潤、森本正志、「Procrustes解析を用いた形状マッチング手法の提案と衣服画像における類似性判定への適用」、信学技法、vol.11、no.353、PRMU2011−139、pp.83−88、2011年)に記載されている。位置合わせの結果、衣服画像の特徴点が確率モデルのどの分布に属するかによって、衣服のどのあたりの特徴点なのかを推定できる。そこで、カテゴリごとにしわの少ない領域の分布を示す情報を予め記憶しておくことで、しわの少ない領域の特徴点を特定し、特定した特徴点を含む周辺の領域を画像から切り出す。これにより、入力された画像からしわの少ない領域を切り出した画像を得ることができる。
(方法例3)
公知の技術のしわ特徴を検出する技術を用いて、入力された画像からしわ特徴の少ない領域を切り出す。これについては、同様のサンプル画像に基づいてしわが生じている場合の周波数成分を予め学習しておき、その周波数成分の少ない領域を抽出したり、公知の技術によるしわ特徴を検出する技術を用いて、しわ特徴の少ない領域を抽出したりすることができる。公知の技術としては、例えば、参考文献2(山崎公俊、稲葉雅幸、「生活支援ロボットのためのしわ特徴に基づく衣類発見法」、日本ロボット学会学術講演会予稿集、2R1−05、2009年)に記載されている技術がある。
特徴抽出部12は、画像切り出し部11が切り出した画像から異なる特徴を抽出するk(k≧2)個の特徴抽出部を有する。図1に示す例では、特徴抽出部12は、テクスチャ特徴抽出部121や、色特徴抽出部122、形状特徴抽出部123などを有している。
テクスチャ特徴抽出部121、色特徴抽出部122、形状特徴抽出部123などは、衣服などの見た目の属性に関わる特徴を示す特徴量を抽出する。例えば、テクスチャ特徴抽出部121は、画像に撮像されている生地の柄に対する、SIFT(Scale Invariant Feature Transform)などの局所特徴量、Hog特徴量、勾配特徴、周波数特徴などを画像から抽出する。
色特徴抽出部122は、画像に撮像されている生地の柄に対する、RGB、Lab、HSVなどの表色系(カラーモデル)における、画像切り出し部11が切り出した画像のヒストグラムなどを出力する。
形状特徴抽出部123は、衣服全体の輪郭形状の特徴を表現する特徴量を抽出する。例えば、形状特徴抽出部123は、予め用意された特定の輪郭形状のテンプレートと画像に含まれる形状との距離や、複雑度を示すフラクタル次元や、曲率に基づく特徴量などを抽出する。
このように異なる特徴に応じて得られる特徴量を組み合わせて用いることにより、衣服全体の形状と柄とに相関が高い場合などにおいて柄認識の精度を高められる可能性がある。
代表ベクトル抽出部13は、特徴抽出部12において画像から抽出するk個の特徴量に対応して、k個のベクトル抽出部131〜13kを有している。例えば、図1に示される例では、ベクトル抽出部131にはテクスチャ特徴抽出部121が抽出した特徴量が入力され、ベクトル抽出部132には色特徴抽出部122が抽出した特徴量が入力され、ベクトル抽出部133には形状特徴抽出部123が抽出した特徴量が入力される。
各ベクトル抽出部131〜13kは、特徴抽出部12において得られた各特徴量をクラスタリングし、代表ベクトルを抽出する。例えば、テクスチャ特徴抽出部121が抽出する特徴量がSIFT特徴量である場合、ベクトル抽出部131が抽出する代表ベクトルは、Bag−of−Feature手法のVisual Wordに相当するものになる。ここで、代表ベクトルは、特徴抽出部12が有する各部において得られる特徴量ごとに、各ベクトル抽出部131〜13kが特徴量に対してクラスタリングをして求める。
特徴ヒストグラム生成部14は、代表ベクトル抽出部13において抽出される代表ベクトルに対応する、k個のヒストグラム生成部141〜14kを有している。ヒストグラム生成部14i(i=1,2,…,k)には、ベクトル抽出部13iが抽出した代表ベクトルが入力される。ヒストグラム生成部14i(i=1,2,…,k)は、入力された代表ベクトルをbinの軸とするヒストグラムを生成する。
以上の代表ベクトル抽出部13と特徴ヒストグラム生成部14とにおける処理の考え方は、Bag−of−Feature手法に相当するものである。Bag−of−Feature手法については、例えば、参考文献3(永橋知行、井原有仁、藤吉弘亘、「前景と背景情報の共起表現を用いたBag−of−featureによる画像分類」、画像の認識・理解シンポジウムMIRU2010、2010年7月)などに示されている。
学習部15は、画像とともに学習データとして入力されるラベルを参照しながら、衣服等の柄のカテゴリを分類する識別パラメータを学習する。学習部15において用いられる分類器として、例えば、SVM(Support Vector Machine)を用いることができる。この場合は、柄のカテゴリがA〜Fの6通りあったとすると、Aの柄を示す識別パラメータ、Bの柄を示す識別パラメータ、…、Fの柄を示す識別パラメータというように、6種類それぞれの識別パラメータを学習する。換言すると、学習部15は、入力されるラベルと、特徴ヒストグラム生成部14において生成される各特徴量のヒストグラムとに基づいて、ラベルに対応する重み係数である識別パラメータを算出する。学習部15は、異なる多数の学習データを用いた学習により得られた、識別パラメータと代表ベクトルとを対応付けた柄分類データを生成し、生成した柄分類データを代表ベクトル・識別パラメータ記憶部16に記憶させる。
なお、特徴ヒストグラム生成部14が生成した特徴ヒストグラム間の距離である特徴ヒストグラム間距離を、識別パラメータ及び代表ベクトルと対応付けた柄分類データを代表ベクトル・識別パラメータ記憶部16に記憶させるようにしてもよい。
図3は、本実施形態における画像識別装置2の構成例を示す概略ブロック図である。画像識別装置2は、画像分類装置1が生成した柄分類データ、すなわち代表ベクトル・識別パラメータ記憶部16に記憶されている柄分類データに基づいて、入力される画像に含まれる柄を識別し、入力される画像の柄に対応するカテゴリを示す情報を出力する。画像識別装置2は、図3に示すように、画像切り出し部21、特徴抽出部22、特徴ヒストグラム生成部23、及び、識別部24を備えている。
画像切り出し部21は、画像分類装置1が備えている画像切り出し部11と同様に、入力される画像において、衣服等の形状やしわの影響を受けずに安定してテクスチャを得られる領域を選択する。画像切り出し部21は、選択した領域を切り出し、切り出した領域の画像を特徴抽出部22に出力する。
特徴抽出部22は、特徴抽出部12と同様に、k個の異なる特徴ごとに当該特徴を抽出する特徴抽出部を有する。図3に示されている例では、特徴抽出部22は、テクスチャ特徴抽出部221や、色特徴抽出部222、形状特徴抽出部223などを有している。テクスチャ特徴抽出部221、色特徴抽出部222、及び、形状特徴抽出部223は、図1に示されているテクスチャ特徴抽出部121、色特徴抽出部122、及び、形状特徴抽出部123と同じ構成を有している。
特徴ヒストグラム生成部23は、特徴ヒストグラム生成部14と同様に、特徴抽出部22において抽出された特徴量に対応する、k個のヒストグラム生成部231〜23kを有している。ヒストグラム生成部23i(i=1,2,…,k)は、入力される特徴量に対応する代表ベクトルと識別パラメータとであって代表ベクトル・識別パラメータ記憶部16に柄分類データとして記憶されている代表ベクトルと識別パラメータとを読み出す。ヒストグラム生成部23iは、特徴抽出部22から入力される特徴量から、読み出した代表ベクトルをbinの軸とするヒストグラムを生成する。ヒストグラム生成部23iは生成した特徴量のヒストグラムを識別部24に出力する。
識別部24は、代表ベクトル・識別パラメータ記憶部16に記憶されている柄分類データに含まれる柄(パターン)の数(m)に応じたm個の識別器241〜24mを有している。代表ベクトル・識別パラメータ記憶部16に記憶されている柄分類データに含まれる識別パラメータごと、換言すると画像識別装置2が識別の対象とする柄ごとに、識別器241〜24mは設けられる。各識別器241〜24mは、代表ベクトル・識別パラメータ記憶部16に記憶されている柄分類データと、特徴ヒストグラム生成部23が生成する各特徴量のヒストグラムとに基づいて、入力された画像に自身に対応する柄が含まれているか否かを判定し、判定結果を出力する。各識別器241〜24mは、学習部15において用いられた手法と同じ識別手法を用いて、柄分類データに含まれる識別パラメータと、特徴量のヒストグラムとから、入力された画像に自身に対応する柄が含まれているか否かを判定する。
例えば、識別器241〜24mがSVMであり、柄のカテゴリがA〜Fの6通りであったとすると、代表ベクトル・識別パラメータ記憶部16にはAの柄の識別パラメータ、Bの柄の識別パラメータ、…、Fの柄の識別パラメータそれぞれに対応する代表ベクトルとが記憶されている。すなわち、画像分類装置1がA〜Fの柄を学習し、学習により得られた柄ごとの代表ベクトルと識別パラメータとの組み合わせが代表ベクトル・識別パラメータ記憶部16に記憶される。この場合、画像識別装置2に備えられる識別器241〜246はA〜Fの柄に対応する。各識別器241〜246は、入力された画像に自身に対応する柄が含まれる場合に所定の値(例えば、「1」)を出力し、当該画像に当該柄が含まれない場合に異なる値(例えば、「0」)を出力する。識別部24は、各識別器241〜246の出力に基づいて、入力された画像に含まれる柄を識別し、当該柄を示す情報を出力する。
また、各識別器241〜24mの出力は、1または0の二値とするほか、2クラス判別器による多クラス判別器を構成し、入力画像に各柄が含まれる確率(連続値)とすることも可能である。その場合、識別部24は、各識別器241〜246の出力に基づいて、入力された画像に各柄が含まれる確率を出力する。例えば合計して1になる数字の並び「0.1,0.05,0.15,0.6,0.04,0.06」などである。
なお、複数の識別器241〜24mから「1」が出力される場合もあり得る。そのような場合には、複数の柄を示す情報が出力される。画像識別装置2が出力する柄を一つの柄に決定するには、画像切り出し部21において複数の異なる領域を切り出すようにし、複数の領域の画像に基づいて得られる識別器241〜24mの出力結果の多数決を採るようにしてもよい。
また、識別器241〜24mの出力結果を連続値とする場合には、最も数値の大きい柄を識別結果とする。例えば、識別部24の出力が上述の例の数字の並びである場合、柄Dであると判定する。
図4は、本実施形態における画像識別装置2による柄の識別結果の一例を示す図である。なお、画像識別装置2が用いる柄分類データは、画像分類装置1における学習する際、すなわち画像分類装置1において柄分類データを生成する際に、柄のラベルとしてborder(縞柄)、dots(水玉)、check(格子柄)、zebra(しまうま柄)、leopard(豹柄)、python(蛇柄)、及び、liberty(小花柄)の7種類とした。また、テクスチャ特徴抽出部121、221ではSIFTを用いて特徴量を抽出し、色特徴抽出部122、222ではRGBを用いて特徴量を抽出した。形状特徴抽出部123、223は用いていない。柄を識別する対象としての画像は、インターネット上のウェブ購入サイトに表示されていた衣服の画像である。
図4に示されているように、従来では同じ柄として識別が困難であった、幅の異なる縞柄や格子柄を同じ縞柄や格子柄として識別したり、大きさの異なる水玉それぞれを同じ水玉柄として認識したりできることが確認できる。また、複雑な動物柄や小花柄もかなり認識できていることが確認できる。
本実施形態における画像分類装置1及び画像識別装置2を用いることにより、衣服やバッグなどの商品の柄を識別する精度を向上させることができる。
また、図4に示されているように、縞柄において縞の幅や間隔によらず縞柄を識別したり、水玉の柄において水玉の大きさや密度によらず水玉柄を識別したりすることができ、カテゴリ内のばらつきを吸収して柄を識別することができるので、画像分類装置1及び画像識別装置2は検索等の用途で商品の模様を分類する際に好適である。
また、画像分類装置1及び画像識別装置2は、複数の特徴を抽出する特徴抽出部12、22を備え、抽出された特徴に基づいて柄を識別するようにしたので、衣服などにおける色と柄、柄と柄、柄と形状の相関を考慮して柄を識別することができ、柄の識別精度を向上させることができる。
また、画像分類装置1及び画像識別装置2は、画像切り出し部11、21を備えていることにより、入力される画像内の衣服にしわやひずみがあっても、しわやひずみの領域を除いた画像を用いることができるので、柄の識別精度を向上させることができる。
また、特徴抽出部12、22では、複数の特徴に対応する特徴量を抽出することにより、例えば非特許文献1や非特許文献2に記載されている技術の欠点であった画像のスケーリングや解像度により生じる柄の識別精度の低下を抑えることができる。
また、画像分類装置1は、柄以外の特徴、例えば色や形状の特徴を含めた複数の特徴の特徴量に基づいた代表ベクトルと、その重みとを学習する学習部15を備えたことにより、柄のみを単独で識別する場合に比べ、識別精度を向上させることができる。また、柄以外の特徴を含めた複数の特徴を用いて識別をすることにより、花柄は赤系の衣服に多い、動物柄は茶色系の衣服に多い、縞柄は寒色系の衣服に多い、といった傾向や、花柄はスカートやワンピースの形状を有する衣服に多いがジャケットの形状を有する衣服には少ない、チェック柄はシャツの形状を有する衣服に多いがズボンの形状を有する衣服には少ない、等の傾向がある場合は、柄の識別精度を高精度化することが可能になる。
(変形例)
図1に示した画像分類装置1では、特徴抽出部12において抽出された特徴量ごとに、ベクトル抽出部131〜13kが代表ベクトルを抽出する構成について説明した。しかし、これに限ることなく、特徴抽出部12において抽出された特徴量を連結して得られる特徴量を用いて代表ベクトルを抽出するようにしてもよい。
図5は、画像分類装置1の変形例としての画像分類装置1Aの構成を示す概略ブロック図である。同図に示されている画像分類装置1Aにおいて、画像分類装置1と異なる点は、特徴抽出部12で抽出された特徴量が組み合わされて、ベクトル抽出部331〜33kに入力される点である。組み合わされた特徴量は、上述のように、連結され一つの特徴量としてベクトル抽出部331〜33kにおいてクラスタリングされ、代表ベクトルが求められる。例えば、テクスチャ特徴量が128次元であり、色特徴量が27次元である場合、この2つの特徴量を組み合わせた155次元の特徴量としてクラスタリングや代表ベクトルの算出をベクトル抽出部331〜33kが行う。これにより更に精度の高い柄の識別を行うことができる。この場合、画像識別装置2においても同様に、特徴抽出部22において抽出された特徴量を連結して得られる特徴量に基づいて、ヒストグラムを生成する。
なお、本発明における画像分類装置と画像識別装置との機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各機能部の処理を行わせるようにしてもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。更に「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。更に、前述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
1、1A…画像分類装置
2…画像識別装置
11、21…画像切り出し部
12、22…特徴抽出部
13…代表ベクトル抽出部
14、23…特徴ヒストグラム生成部
15…学習部
16…代表ベクトル・識別パラメータ記憶部
24…識別部
33…代表ベクトル抽出部
121、221…テクスチャ特徴抽出部
122、222…色特徴抽出部
123、223…形状特徴抽出部
131、132、133、13k…ベクトル抽出部
141、142、143、14k、231、232、23k…ヒストグラム生成部
241、242、24m…識別器
331、332、333、33k…ベクトル抽出部

Claims (5)

  1. 学習画像及び該学習画像に含まれる柄を示すラベルの複数の組み合わせが学習データとして入力される画像分類装置であって、
    前記学習画像に撮像されている生地の柄が不連続な領域又は生地のしわがある領域を検出し、前記学習画像内の当該領域以外の領域であって前記生地の柄が含まれる領域を切り出す第1の画像切り出し部と、
    前記第1の画像切り出し部が切り出した画像に含まれる柄の特徴を示す特徴量を複数抽出する第1の特徴量抽出部と、
    前記第1の特徴量抽出部が抽出した複数の特徴量ごとに代表ベクトルを抽出する代表ベクトル抽出部と、
    前記代表ベクトル抽出部が抽出した代表ベクトルに基づいて該代表ベクトルに対応する特徴量のヒストグラムを生成する第1の特徴ヒストグラム生成部と、
    前記第1の特徴ヒストグラム生成部が生成するヒストグラムと、前記画像に対応するラベルとに基づいて、ヒストグラムに対する重み係数である識別パラメータとを算出し、算出した識別パラメータと該識別パラメータに対応する代表ベクトルとを対応付けた柄分類データを生成する学習部と
    を備えていることを特徴とする画像分類装置。
  2. 学習画像及び該学習画像に含まれる柄を示すラベルの複数の組み合わせが学習データとして入力される画像分類装置であって、
    前記学習画像に撮像されている生地の柄が不連続な領域又は生地のしわがある領域を検出し、前記学習画像内の当該領域以外の領域であって前記生地の柄が含まれる領域を切り出す第1の画像切り出し部と、
    前記第1の画像切り出し部が切り出した画像に含まれる柄の特徴を示す特徴量を複数抽出する第1の特徴量抽出部と、
    前記第1の特徴量抽出部が抽出した複数の特徴量を連結して得られる特徴量ごとに代表ベクトルを抽出する代表ベクトル抽出部と、
    前記代表ベクトル抽出部が抽出した代表ベクトルに基づいて該代表ベクトルに対応する特徴量のヒストグラムを生成する第1の特徴ヒストグラム生成部と、
    前記第1の特徴ヒストグラム生成部が生成するヒストグラムと、前記画像に対応するラベルとに基づいて、ヒストグラムに対する重み係数である識別パラメータとを算出し、算出した識別パラメータと該識別パラメータに対応する代表ベクトルとを対応付けた柄分類データを生成する学習部と
    を備えていることを特徴とする画像分類装置。
  3. 入力される画像に撮像されている生地の柄が不連続な領域又は生地のしわがある領域を検出し、前記画像内の当該領域以外の領域であって前記生地の柄が含まれる領域を切り出す第2の画像切り出し部と、
    前記第2の画像切り出し部が切り出した画像に含まれる柄の特徴を示す特徴量を複数抽出する第2の特徴量抽出部と、
    請求項1又は請求項2に記載の画像分類装置によって生成された柄分類データに含まれる代表ベクトルに基づいて、前記第2の特徴量抽出部が抽出した複数の特徴量ごとにヒストグラムを生成する第2の特徴ヒストグラム生成部と、
    前記画像分類装置に記憶されている柄分類データに含まれる識別パラメータと、前記第2の特徴ヒストグラム生成部が生成したヒストグラムとに基づいて、前記入力される画像の生地の柄を識別する識別部と
    を備えていることを特徴とする画像識別装置。
  4. 請求項1又は請求項2に記載の画像分類装置としてコンピュータを機能させるためのプログラム。
  5. 請求項3に記載の画像識別装置としてコンピュータを機能させるためのプログラム。
JP2012211299A 2012-09-25 2012-09-25 画像分類装置及び画像識別装置並びにプログラム Expired - Fee Related JP5756443B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012211299A JP5756443B2 (ja) 2012-09-25 2012-09-25 画像分類装置及び画像識別装置並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012211299A JP5756443B2 (ja) 2012-09-25 2012-09-25 画像分類装置及び画像識別装置並びにプログラム

Publications (2)

Publication Number Publication Date
JP2014067174A JP2014067174A (ja) 2014-04-17
JP5756443B2 true JP5756443B2 (ja) 2015-07-29

Family

ID=50743527

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012211299A Expired - Fee Related JP5756443B2 (ja) 2012-09-25 2012-09-25 画像分類装置及び画像識別装置並びにプログラム

Country Status (1)

Country Link
JP (1) JP5756443B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101539058B1 (ko) * 2014-06-20 2015-07-23 연세대학교 산학협력단 이미지 분류 및 검색 장치 및 그 방법
US10275677B2 (en) 2014-12-26 2019-04-30 Nec Solution Innovators, Ltd. Image processing apparatus, image processing method and program
JP6359001B2 (ja) * 2015-11-26 2018-07-18 株式会社Lifull 情報処理システム、及び情報処理方法
US10867378B2 (en) 2016-11-30 2020-12-15 Rakuten, Inc. Image processing device, image processing method, server, and computer program
JP6992590B2 (ja) 2018-02-23 2022-01-13 日本電信電話株式会社 特徴表現装置、特徴表現方法、およびプログラム
JP7075005B2 (ja) 2018-04-03 2022-05-25 株式会社ミクシィ 情報処理装置、コンテンツ表示方法及びコンテンツ表示プログラム
CN109522961B (zh) * 2018-11-23 2022-09-13 中山大学 一种基于字典深度学习的半监督图像分类方法
CN111645072B (zh) * 2020-05-26 2021-09-24 山东大学 一种基于多模字典控制策略的机器人缝制方法及系统
CN112418168B (zh) * 2020-12-10 2024-04-02 深圳云天励飞技术股份有限公司 车辆识别方法、装置、系统、电子设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7756341B2 (en) * 2005-06-30 2010-07-13 Xerox Corporation Generic visual categorization method and system
JP5189439B2 (ja) * 2008-09-02 2013-04-24 トヨタ自動車株式会社 布検出装置及び布検出方法

Also Published As

Publication number Publication date
JP2014067174A (ja) 2014-04-17

Similar Documents

Publication Publication Date Title
JP5756443B2 (ja) 画像分類装置及び画像識別装置並びにプログラム
Gunay et al. Automatic age classification with LBP
Malik et al. Image processing techniques for identification of fish disease
Bourdev et al. Describing people: A poselet-based approach to attribute classification
US8798362B2 (en) Clothing search in images
Herdiyeni et al. Combination of morphological, local binary pattern variance and color moments features for indonesian medicinal plants identification
Anwar et al. Ancient coin classification using reverse motif recognition: Image-based classification of roman republican coins
CN105760828B (zh) 一种基于视觉的静态手势识别方法
Weerasekera et al. Robust asl fingerspelling recognition using local binary patterns and geometric features
Pradhan et al. A hand gesture recognition using feature extraction
Wang et al. Human hair segmentation and length detection for human appearance model
Beaudry et al. Action recognition in videos using frequency analysis of critical point trajectories
Anjomshoae et al. Enhancement of template-based method for overlapping rubber tree leaf identification
Sun et al. Clothing style recognition using fashion attribute detection
Azad et al. Real-time human face detection in noisy images based on skin color fusion model and eye detection
Prabha et al. Three dimensional object detection and classification methods: a study
Caraka et al. Batik parang rusak detection using geometric invariant moment
Hanmandlu et al. Palm print recognition using local binary pattern operator and support vector machines
Madni et al. Hand Gesture Recognition Using Semi Vectorial Multilevel Segmentation Method with Improved ReliefF Algorithm.
Elsayed et al. Hybrid method based on multi-feature descriptor for static sign language recognition
Chua et al. Fingerprint Singular Point Detection via Quantization and Fingerprint Classification.
Alzahrani et al. Face segmentation based object localisation with deep learning from unconstrained images
Pillai et al. A Novel Approach to Detect Copy Move Forgery using Deep Learning
Martin Sagayam et al. Application of pseudo 2-D hidden Markov model for hand gesture recognition
Abdulmunim et al. Logo matching in Arabic documents using region based features and SURF descriptor

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140711

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150515

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150526

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150529

R150 Certificate of patent or registration of utility model

Ref document number: 5756443

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees