JP5756443B2 - 画像分類装置及び画像識別装置並びにプログラム - Google Patents
画像分類装置及び画像識別装置並びにプログラム Download PDFInfo
- Publication number
- JP5756443B2 JP5756443B2 JP2012211299A JP2012211299A JP5756443B2 JP 5756443 B2 JP5756443 B2 JP 5756443B2 JP 2012211299 A JP2012211299 A JP 2012211299A JP 2012211299 A JP2012211299 A JP 2012211299A JP 5756443 B2 JP5756443 B2 JP 5756443B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- pattern
- feature
- unit
- extraction unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
また、局所特徴を用いる方法は、細かい模様を識別するのに適している。また、スケールの変化には強い。しかし、模様のひずみやノイズに弱いと考えられる。まあ、縞模様などの大局的な特徴の抽出には適さない。
また、本発明におけるプログラムは、上記に記載の画像識別装置としてコンピュータを機能させるためのプログラムである。
図1は、本実施形態における画像分類装置1の構成を示す概略ブロック図である。画像分類装置1は、衣服やバッグ等が撮像された画像(学習画像)と、当該画像に撮像されている衣服やバッグ等の生地の柄(又はパターン)を識別するラベルとを学習データとして入力し、柄を識別するための情報である柄分類データを生成して記憶する。本実施形態における画像分類装置1は、同図に示すように、画像切り出し部11、特徴抽出部12、代表ベクトル抽出部13、特徴ヒストグラム生成部14、学習部15、及び、代表ベクトル・識別パラメータ記憶部16を備えている。
方法例1に示す方法では、モホロジ処理を利用して袖や襟元などの形状の影響を除いた領域を切り出す。具体的には、まず入力された画像を二値化する。二値化した画像にモホロジ処理のオープニングを施す。なお、モホロジ処理におけるオープニングとは、収縮(erosion)ののち膨張(dilation)を行うことで凹凸のノイズを除去する処理である。
オープニングを施して得られた二値画像をマスクとして、入力された画像からしわの少ない領域を切り出し、切り出した画像を出力する。
また、画像例2はチェック柄のシャツの画像(E)からしわの少ない領域を切り出す例を示している。画像例1と同様に、画像(E)に対する二値化により画像(F)を生成し、画像(F)に対してオープニングを施して画像(G)を得る。画像(G)をマスクとして入力された画像(E)からしわの少ない領域を切り出した画像(H)を得ることができる。
方法例2では、主に衣類の場合、公知の技術による衣服画像の確率モデルあてはめを用いて、ジャケットやワンピースなどの形状のカテゴリごとに、衣服の襟、形、裾などを大まかに位置合わせすることができる。このような技術は、例えば、参考文献1(数藤恭子、島村潤、森本正志、「Procrustes解析を用いた形状マッチング手法の提案と衣服画像における類似性判定への適用」、信学技法、vol.11、no.353、PRMU2011−139、pp.83−88、2011年)に記載されている。位置合わせの結果、衣服画像の特徴点が確率モデルのどの分布に属するかによって、衣服のどのあたりの特徴点なのかを推定できる。そこで、カテゴリごとにしわの少ない領域の分布を示す情報を予め記憶しておくことで、しわの少ない領域の特徴点を特定し、特定した特徴点を含む周辺の領域を画像から切り出す。これにより、入力された画像からしわの少ない領域を切り出した画像を得ることができる。
公知の技術のしわ特徴を検出する技術を用いて、入力された画像からしわ特徴の少ない領域を切り出す。これについては、同様のサンプル画像に基づいてしわが生じている場合の周波数成分を予め学習しておき、その周波数成分の少ない領域を抽出したり、公知の技術によるしわ特徴を検出する技術を用いて、しわ特徴の少ない領域を抽出したりすることができる。公知の技術としては、例えば、参考文献2(山崎公俊、稲葉雅幸、「生活支援ロボットのためのしわ特徴に基づく衣類発見法」、日本ロボット学会学術講演会予稿集、2R1−05、2009年)に記載されている技術がある。
テクスチャ特徴抽出部121、色特徴抽出部122、形状特徴抽出部123などは、衣服などの見た目の属性に関わる特徴を示す特徴量を抽出する。例えば、テクスチャ特徴抽出部121は、画像に撮像されている生地の柄に対する、SIFT(Scale Invariant Feature Transform)などの局所特徴量、Hog特徴量、勾配特徴、周波数特徴などを画像から抽出する。
形状特徴抽出部123は、衣服全体の輪郭形状の特徴を表現する特徴量を抽出する。例えば、形状特徴抽出部123は、予め用意された特定の輪郭形状のテンプレートと画像に含まれる形状との距離や、複雑度を示すフラクタル次元や、曲率に基づく特徴量などを抽出する。
以上の代表ベクトル抽出部13と特徴ヒストグラム生成部14とにおける処理の考え方は、Bag−of−Feature手法に相当するものである。Bag−of−Feature手法については、例えば、参考文献3(永橋知行、井原有仁、藤吉弘亘、「前景と背景情報の共起表現を用いたBag−of−featureによる画像分類」、画像の認識・理解シンポジウムMIRU2010、2010年7月)などに示されている。
なお、特徴ヒストグラム生成部14が生成した特徴ヒストグラム間の距離である特徴ヒストグラム間距離を、識別パラメータ及び代表ベクトルと対応付けた柄分類データを代表ベクトル・識別パラメータ記憶部16に記憶させるようにしてもよい。
また、各識別器241〜24mの出力は、1または0の二値とするほか、2クラス判別器による多クラス判別器を構成し、入力画像に各柄が含まれる確率(連続値)とすることも可能である。その場合、識別部24は、各識別器241〜246の出力に基づいて、入力された画像に各柄が含まれる確率を出力する。例えば合計して1になる数字の並び「0.1,0.05,0.15,0.6,0.04,0.06」などである。
また、識別器241〜24mの出力結果を連続値とする場合には、最も数値の大きい柄を識別結果とする。例えば、識別部24の出力が上述の例の数字の並びである場合、柄Dであると判定する。
また、図4に示されているように、縞柄において縞の幅や間隔によらず縞柄を識別したり、水玉の柄において水玉の大きさや密度によらず水玉柄を識別したりすることができ、カテゴリ内のばらつきを吸収して柄を識別することができるので、画像分類装置1及び画像識別装置2は検索等の用途で商品の模様を分類する際に好適である。
また、画像分類装置1及び画像識別装置2は、複数の特徴を抽出する特徴抽出部12、22を備え、抽出された特徴に基づいて柄を識別するようにしたので、衣服などにおける色と柄、柄と柄、柄と形状の相関を考慮して柄を識別することができ、柄の識別精度を向上させることができる。
また、特徴抽出部12、22では、複数の特徴に対応する特徴量を抽出することにより、例えば非特許文献1や非特許文献2に記載されている技術の欠点であった画像のスケーリングや解像度により生じる柄の識別精度の低下を抑えることができる。
図1に示した画像分類装置1では、特徴抽出部12において抽出された特徴量ごとに、ベクトル抽出部131〜13kが代表ベクトルを抽出する構成について説明した。しかし、これに限ることなく、特徴抽出部12において抽出された特徴量を連結して得られる特徴量を用いて代表ベクトルを抽出するようにしてもよい。
図5は、画像分類装置1の変形例としての画像分類装置1Aの構成を示す概略ブロック図である。同図に示されている画像分類装置1Aにおいて、画像分類装置1と異なる点は、特徴抽出部12で抽出された特徴量が組み合わされて、ベクトル抽出部331〜33kに入力される点である。組み合わされた特徴量は、上述のように、連結され一つの特徴量としてベクトル抽出部331〜33kにおいてクラスタリングされ、代表ベクトルが求められる。例えば、テクスチャ特徴量が128次元であり、色特徴量が27次元である場合、この2つの特徴量を組み合わせた155次元の特徴量としてクラスタリングや代表ベクトルの算出をベクトル抽出部331〜33kが行う。これにより更に精度の高い柄の識別を行うことができる。この場合、画像識別装置2においても同様に、特徴抽出部22において抽出された特徴量を連結して得られる特徴量に基づいて、ヒストグラムを生成する。
2…画像識別装置
11、21…画像切り出し部
12、22…特徴抽出部
13…代表ベクトル抽出部
14、23…特徴ヒストグラム生成部
15…学習部
16…代表ベクトル・識別パラメータ記憶部
24…識別部
33…代表ベクトル抽出部
121、221…テクスチャ特徴抽出部
122、222…色特徴抽出部
123、223…形状特徴抽出部
131、132、133、13k…ベクトル抽出部
141、142、143、14k、231、232、23k…ヒストグラム生成部
241、242、24m…識別器
331、332、333、33k…ベクトル抽出部
Claims (5)
- 学習画像及び該学習画像に含まれる柄を示すラベルの複数の組み合わせが学習データとして入力される画像分類装置であって、
前記学習画像に撮像されている生地の柄が不連続な領域又は生地のしわがある領域を検出し、前記学習画像内の当該領域以外の領域であって前記生地の柄が含まれる領域を切り出す第1の画像切り出し部と、
前記第1の画像切り出し部が切り出した画像に含まれる柄の特徴を示す特徴量を複数抽出する第1の特徴量抽出部と、
前記第1の特徴量抽出部が抽出した複数の特徴量ごとに代表ベクトルを抽出する代表ベクトル抽出部と、
前記代表ベクトル抽出部が抽出した代表ベクトルに基づいて該代表ベクトルに対応する特徴量のヒストグラムを生成する第1の特徴ヒストグラム生成部と、
前記第1の特徴ヒストグラム生成部が生成するヒストグラムと、前記画像に対応するラベルとに基づいて、ヒストグラムに対する重み係数である識別パラメータとを算出し、算出した識別パラメータと該識別パラメータに対応する代表ベクトルとを対応付けた柄分類データを生成する学習部と
を備えていることを特徴とする画像分類装置。 - 学習画像及び該学習画像に含まれる柄を示すラベルの複数の組み合わせが学習データとして入力される画像分類装置であって、
前記学習画像に撮像されている生地の柄が不連続な領域又は生地のしわがある領域を検出し、前記学習画像内の当該領域以外の領域であって前記生地の柄が含まれる領域を切り出す第1の画像切り出し部と、
前記第1の画像切り出し部が切り出した画像に含まれる柄の特徴を示す特徴量を複数抽出する第1の特徴量抽出部と、
前記第1の特徴量抽出部が抽出した複数の特徴量を連結して得られる特徴量ごとに代表ベクトルを抽出する代表ベクトル抽出部と、
前記代表ベクトル抽出部が抽出した代表ベクトルに基づいて該代表ベクトルに対応する特徴量のヒストグラムを生成する第1の特徴ヒストグラム生成部と、
前記第1の特徴ヒストグラム生成部が生成するヒストグラムと、前記画像に対応するラベルとに基づいて、ヒストグラムに対する重み係数である識別パラメータとを算出し、算出した識別パラメータと該識別パラメータに対応する代表ベクトルとを対応付けた柄分類データを生成する学習部と
を備えていることを特徴とする画像分類装置。 - 入力される画像に撮像されている生地の柄が不連続な領域又は生地のしわがある領域を検出し、前記画像内の当該領域以外の領域であって前記生地の柄が含まれる領域を切り出す第2の画像切り出し部と、
前記第2の画像切り出し部が切り出した画像に含まれる柄の特徴を示す特徴量を複数抽出する第2の特徴量抽出部と、
請求項1又は請求項2に記載の画像分類装置によって生成された柄分類データに含まれる代表ベクトルに基づいて、前記第2の特徴量抽出部が抽出した複数の特徴量ごとにヒストグラムを生成する第2の特徴ヒストグラム生成部と、
前記画像分類装置に記憶されている柄分類データに含まれる識別パラメータと、前記第2の特徴ヒストグラム生成部が生成したヒストグラムとに基づいて、前記入力される画像の生地の柄を識別する識別部と
を備えていることを特徴とする画像識別装置。 - 請求項1又は請求項2に記載の画像分類装置としてコンピュータを機能させるためのプログラム。
- 請求項3に記載の画像識別装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012211299A JP5756443B2 (ja) | 2012-09-25 | 2012-09-25 | 画像分類装置及び画像識別装置並びにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012211299A JP5756443B2 (ja) | 2012-09-25 | 2012-09-25 | 画像分類装置及び画像識別装置並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014067174A JP2014067174A (ja) | 2014-04-17 |
JP5756443B2 true JP5756443B2 (ja) | 2015-07-29 |
Family
ID=50743527
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012211299A Expired - Fee Related JP5756443B2 (ja) | 2012-09-25 | 2012-09-25 | 画像分類装置及び画像識別装置並びにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5756443B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101539058B1 (ko) * | 2014-06-20 | 2015-07-23 | 연세대학교 산학협력단 | 이미지 분류 및 검색 장치 및 그 방법 |
US10275677B2 (en) | 2014-12-26 | 2019-04-30 | Nec Solution Innovators, Ltd. | Image processing apparatus, image processing method and program |
JP6359001B2 (ja) * | 2015-11-26 | 2018-07-18 | 株式会社Lifull | 情報処理システム、及び情報処理方法 |
US10867378B2 (en) | 2016-11-30 | 2020-12-15 | Rakuten, Inc. | Image processing device, image processing method, server, and computer program |
JP6992590B2 (ja) | 2018-02-23 | 2022-01-13 | 日本電信電話株式会社 | 特徴表現装置、特徴表現方法、およびプログラム |
JP7075005B2 (ja) | 2018-04-03 | 2022-05-25 | 株式会社ミクシィ | 情報処理装置、コンテンツ表示方法及びコンテンツ表示プログラム |
CN109522961B (zh) * | 2018-11-23 | 2022-09-13 | 中山大学 | 一种基于字典深度学习的半监督图像分类方法 |
CN111645072B (zh) * | 2020-05-26 | 2021-09-24 | 山东大学 | 一种基于多模字典控制策略的机器人缝制方法及系统 |
CN112418168B (zh) * | 2020-12-10 | 2024-04-02 | 深圳云天励飞技术股份有限公司 | 车辆识别方法、装置、系统、电子设备及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7756341B2 (en) * | 2005-06-30 | 2010-07-13 | Xerox Corporation | Generic visual categorization method and system |
JP5189439B2 (ja) * | 2008-09-02 | 2013-04-24 | トヨタ自動車株式会社 | 布検出装置及び布検出方法 |
-
2012
- 2012-09-25 JP JP2012211299A patent/JP5756443B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014067174A (ja) | 2014-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5756443B2 (ja) | 画像分類装置及び画像識別装置並びにプログラム | |
Gunay et al. | Automatic age classification with LBP | |
Malik et al. | Image processing techniques for identification of fish disease | |
Bourdev et al. | Describing people: A poselet-based approach to attribute classification | |
US8798362B2 (en) | Clothing search in images | |
Herdiyeni et al. | Combination of morphological, local binary pattern variance and color moments features for indonesian medicinal plants identification | |
Anwar et al. | Ancient coin classification using reverse motif recognition: Image-based classification of roman republican coins | |
CN105760828B (zh) | 一种基于视觉的静态手势识别方法 | |
Weerasekera et al. | Robust asl fingerspelling recognition using local binary patterns and geometric features | |
Pradhan et al. | A hand gesture recognition using feature extraction | |
Wang et al. | Human hair segmentation and length detection for human appearance model | |
Beaudry et al. | Action recognition in videos using frequency analysis of critical point trajectories | |
Anjomshoae et al. | Enhancement of template-based method for overlapping rubber tree leaf identification | |
Sun et al. | Clothing style recognition using fashion attribute detection | |
Azad et al. | Real-time human face detection in noisy images based on skin color fusion model and eye detection | |
Prabha et al. | Three dimensional object detection and classification methods: a study | |
Caraka et al. | Batik parang rusak detection using geometric invariant moment | |
Hanmandlu et al. | Palm print recognition using local binary pattern operator and support vector machines | |
Madni et al. | Hand Gesture Recognition Using Semi Vectorial Multilevel Segmentation Method with Improved ReliefF Algorithm. | |
Elsayed et al. | Hybrid method based on multi-feature descriptor for static sign language recognition | |
Chua et al. | Fingerprint Singular Point Detection via Quantization and Fingerprint Classification. | |
Alzahrani et al. | Face segmentation based object localisation with deep learning from unconstrained images | |
Pillai et al. | A Novel Approach to Detect Copy Move Forgery using Deep Learning | |
Martin Sagayam et al. | Application of pseudo 2-D hidden Markov model for hand gesture recognition | |
Abdulmunim et al. | Logo matching in Arabic documents using region based features and SURF descriptor |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140711 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150515 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150526 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150529 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5756443 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |