JPWO2012032788A1 - 排他的分類器による一般物体の画像認識装置及び方法 - Google Patents
排他的分類器による一般物体の画像認識装置及び方法 Download PDFInfo
- Publication number
- JPWO2012032788A1 JPWO2012032788A1 JP2012532872A JP2012532872A JPWO2012032788A1 JP WO2012032788 A1 JPWO2012032788 A1 JP WO2012032788A1 JP 2012532872 A JP2012532872 A JP 2012532872A JP 2012532872 A JP2012532872 A JP 2012532872A JP WO2012032788 A1 JPWO2012032788 A1 JP WO2012032788A1
- Authority
- JP
- Japan
- Prior art keywords
- image
- exclusive
- objects
- existence probability
- recognition apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/30—Scenes; Scene-specific elements in albums, collections or shared content, e.g. social network photos or video
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Image Analysis (AREA)
Abstract
Description
以下、本発明を実施するための形態について説明する。
2.変形例
なお、本発明を上記の実施の形態に基づいて説明してきたが、本発明は、上記の実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。
(A)上述の式(1)の最適化問題を解くため、ラグランジェ未定乗数法を適用することができる。よって、式(1)で表される制約付き最適化問題を解くのに代えて、式(2)に記載する緩和された非制約最適化問題を解くこととしてもよい。
(B)排他的ラベルセット抽出手段14は、排他的ラベルセットを予め保持しているものとしたが、これに限らず収集画像からグラフシフト法(非特許文献3参照)などを用いて生成することとしてもよい。グラフシフト法は、元々、共起性の度合を抽出するための手法であるが、画像内に物体が共起しないグラフを取得することで排他的ラベルセットを生成することができる。
(C)以下、更に本発明の一実施形態としての画像認識装置と効果について説明する。
(D)上記の各装置を構成する構成要素の一部又は全部について、画像認識装置のプロセッサ、及びそのプロセッサに接続された各種回路に実行させるための機械語或いは高級言語のプログラムコードからなる制御プログラムを、記録媒体に記録すること、又は各種通信路等を介して流通させ頒布することもできる。このような記録媒体には、ICカード、ハードディスク、光ディスク、フレキシブルディスク、ROM、フラッシュメモリ等がある。流通、頒布された制御プログラムはプロセッサに読み出され得るメモリ等に格納されることにより利用に供され、そのプロセッサがその制御プログラムを実行することにより各実施形態で示したような各機能が実現されるようになる。なお、プロセッサは、制御プログラムを直接実行する他、コンパイルして実行或いはインタプリタにより実行してもよい。
(E)上記の各装置を構成する構成要素の一部又は全部は、構成要素の機能を実現する回路で構成し、若しくは、構成要素の機能を実現するプログラムとそのプログラムを実行するプロセッサとで構成し、又は、1個のシステムLSI(Large Scale Integration:大規模集積回路)から構成されているとしてもよい。システムLSIは、複数の構成部を1個のチップ上に集積して製造された超多機能LSIであり、具体的には、マイクロプロセッサ、ROM、RAMなどを含んで構成されるコンピュータシステムである。前記RAMには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムに従って動作することにより、システムLSIは、その機能を達成する。これらは個別に1チップ化されても良いし、一部又は全てを含むように1チップ化されても良い。
(F)上記の各装置を構成する構成要素の一部又は全部は、各装置に脱着可能なICカード又は単体のモジュールから構成されているとしてもよい。前記ICカード又は前記モジュールは、マイクロプロセッサ、ROM、RAM、などから構成されるコンピュータシステムである。前記ICカード又は前記モジュールは、上記の超多機能LSIを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムに従って動作することにより、前記ICカード又は前記モジュールは、その機能を達成する。このICカード又はこのモジュールは、耐タンパ性を有するとしてもよい。
(G)本発明は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるデジタル信号であるとしてもよい。
(H)上記実施の形態及び上記変形例をそれぞれ組み合わせるとしてもよい。
11 画像蓄積部
12 学習画像入力手段
13 画像特徴量算出手段
14 排他的ラベルセット抽出手段
15 分類辞書生成手段
16 分類モデル情報蓄積手段
17 分類画像入力手段
18 画像特徴量算出手段
19 分類手段
20 画像分類情報蓄積手段
Claims (10)
- 一般物体認識を行う画像認識装置であって、
複数種の物体それぞれの画像特徴を示す特徴情報を参照し、入力画像において1以上の物体の存在確率を算出し、前記存在確率に基づき、存在する物体の種類を特定する種類特定手段と、
同一画像内に共存しないと推定された異種物体の組合せを表す排他的関係情報を記憶する情報蓄積手段とを備え、
前記種類特定手段は、前記排他的関係情報を用いて各物体の存在確率を調整する
ことを特徴とする画像認識装置。 - 前記調整は、前記排他的関係情報により表された組合せに該当する物体の存在確率を低下させることである
ことを特徴とする請求項1記載の画像認識装置。 - 前記存在確率の算出には、LASSO(Least Absolute Shrinkage and Selection Operator)推定が用いられ、
前記存在確率の低下は、LASSO正則化項にペナルティ値を与えることで行う
ことを特徴とする請求項2記載の画像認識装置。 - 前記排他的関係情報は、異種物体の組合せを複数規定しており、
前記ペナルティ値は、前記所定確率以上の存在確率が算出された各物体を所定個ずつ組み合わせたときに、前記排他的関係情報で規定された組合せに該当する数が多いほど大きい値が与えられる
ことを特徴とする請求項3記載の画像認識装置。 - 前記排他的関係情報は、画像内に存在する物体が既知である学習用の画像群から統計的手法を用いて決定する
ことを特徴とする請求項1記載の画像認識装置。 - 前記排他的関係情報は、画像内に存在する物体が既知である学習用の画像群からグラフシフト法を用いて決定する
ことを特徴とする請求項1記載の画像認識装置。 - 一般物体認識を行う画像認識装置に用いられる画像認識方法であって、
同一画像内に共存しないと推定された異種物体の組合せを表す排他的関係情報を記憶する情報蓄積ステップと、
複数種の物体それぞれの画像特徴を示す特徴情報を参照し、入力画像において1以上の物体の存在確率を算出し、前記存在確率に基づき、存在する物体の種類を特定する種類特定ステップとを含み、
前記種類特定ステップにおいて、前記存在確率の算出にあたり、前記排他的関係情報を用いて各物体の存在確率を調整する
ことを特徴とする画像認識方法。 - 一般物体認識を行う画像認識装置に用いられるコンピュータプログラムであって、
同一画像内に共存しないと推定された異種物体の組合せを表す排他的関係情報を記憶する情報蓄積ステップと、
複数種の物体それぞれの画像特徴を示す特徴情報を参照し、入力画像において1以上の物体の存在確率を算出し、前記存在確率に基づき、存在する物体の種類を特定する種類特定ステップとをコンピュータに実行させ、
前記種類特定ステップにおいて、前記存在確率の算出にあたり、前記排他的関係情報を用いて各物体の存在確率を調整する
ことを特徴とするコンピュータプログラム。 - 一般物体認識を行う画像認識装置に用いられる集積回路であって、
複数種の物体それぞれの画像特徴を示す特徴情報を参照し、入力画像において1以上の物体の存在確率を算出し、前記存在確率に基づき、存在する物体の種類を特定する種類特定手段と、
同一画像内に共存しないと推定された異種物体の組合せを表す排他的関係情報を記憶する情報蓄積手段とを備え、
前記種類特定手段は、前記排他的関係情報を用いて各物体の存在確率を調整する
ことを特徴とする集積回路。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US38160810P | 2010-09-10 | 2010-09-10 | |
US61/381,608 | 2010-09-10 | ||
PCT/JP2011/005081 WO2012032788A1 (ja) | 2010-09-10 | 2011-09-09 | 排他的分類器による一般物体の画像認識装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2012032788A1 true JPWO2012032788A1 (ja) | 2014-01-20 |
JP5782037B2 JP5782037B2 (ja) | 2015-09-24 |
Family
ID=45810398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012532872A Active JP5782037B2 (ja) | 2010-09-10 | 2011-09-09 | 排他的分類器による一般物体の画像認識装置及び方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8687851B2 (ja) |
JP (1) | JP5782037B2 (ja) |
CN (1) | CN102667859B (ja) |
WO (1) | WO2012032788A1 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103164713B (zh) | 2011-12-12 | 2016-04-06 | 阿里巴巴集团控股有限公司 | 图像分类方法和装置 |
US8489585B2 (en) * | 2011-12-20 | 2013-07-16 | Xerox Corporation | Efficient document processing system and method |
CN102867193B (zh) * | 2012-09-14 | 2015-06-17 | 成都国科海博信息技术股份有限公司 | 一种生物检测方法、装置及生物检测器 |
DE102014113817A1 (de) * | 2013-10-15 | 2015-04-16 | Electronics And Telecommunications Research Institute | Vorrichtung und Verfahren zur Erkennung eines Objekts in Einem Bild |
CN104899820B (zh) * | 2014-03-11 | 2018-11-20 | 腾讯科技(北京)有限公司 | 为图像添加标签的方法、系统和装置 |
CN105718937B (zh) * | 2014-12-03 | 2019-04-05 | 财团法人资讯工业策进会 | 多类别对象分类方法及系统 |
US9842390B2 (en) * | 2015-02-06 | 2017-12-12 | International Business Machines Corporation | Automatic ground truth generation for medical image collections |
JP6402653B2 (ja) * | 2015-03-05 | 2018-10-10 | オムロン株式会社 | 物体認識装置、物体認識方法、およびプログラム |
US9864931B2 (en) | 2016-04-13 | 2018-01-09 | Conduent Business Services, Llc | Target domain characterization for data augmentation |
US20180146624A1 (en) * | 2016-11-28 | 2018-05-31 | The Climate Corporation | Determining intra-field yield variation data based on soil characteristics data and satellite images |
US10838699B2 (en) | 2017-01-18 | 2020-11-17 | Oracle International Corporation | Generating data mappings for user interface screens and screen components for an application |
US10733754B2 (en) * | 2017-01-18 | 2020-08-04 | Oracle International Corporation | Generating a graphical user interface model from an image |
JP2019220163A (ja) * | 2018-06-06 | 2019-12-26 | コグネックス・コーポレイション | ビジョンシステムでラインを検出するためのシステム及び方法 |
CN111738274B (zh) * | 2020-05-08 | 2022-04-22 | 华南理工大学 | 基于局部光滑投影的抗对抗攻击相机源识别方法 |
CN112598648B (zh) * | 2020-12-24 | 2022-08-26 | 重庆邮电大学 | 一种基于图像梯度方向的图像接缝裁剪篡改检测方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101536035B (zh) * | 2006-08-31 | 2012-09-26 | 公立大学法人大阪府立大学 | 图像识别方法、以及图像识别装置 |
JP2008217706A (ja) | 2007-03-07 | 2008-09-18 | Tokyo Institute Of Technology | ラベリング装置、ラベリング方法及びプログラム |
US8320679B2 (en) * | 2007-04-23 | 2012-11-27 | Siemens Corporate Research, Inc. | Method for detecting objects using flexible edge arrangements |
US8538102B2 (en) * | 2008-12-17 | 2013-09-17 | Synarc Inc | Optimised region of interest selection |
-
2011
- 2011-09-09 JP JP2012532872A patent/JP5782037B2/ja active Active
- 2011-09-09 US US13/508,850 patent/US8687851B2/en active Active
- 2011-09-09 WO PCT/JP2011/005081 patent/WO2012032788A1/ja active Application Filing
- 2011-09-09 CN CN201180004489.4A patent/CN102667859B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN102667859B (zh) | 2016-01-20 |
CN102667859A (zh) | 2012-09-12 |
JP5782037B2 (ja) | 2015-09-24 |
US8687851B2 (en) | 2014-04-01 |
US20120230546A1 (en) | 2012-09-13 |
WO2012032788A1 (ja) | 2012-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5782037B2 (ja) | 排他的分類器による一般物体の画像認識装置及び方法 | |
JP6843086B2 (ja) | 画像処理システム、画像においてマルチラベル意味エッジ検出を行う方法、および、非一時的コンピューター可読記憶媒体 | |
US11687781B2 (en) | Image classification and labeling | |
Van Horn et al. | The inaturalist species classification and detection dataset | |
CN105981008B (zh) | 学习深度人脸表示 | |
CN105144239B (zh) | 图像处理装置、图像处理方法 | |
US9355337B2 (en) | Consistent hierarchical labeling of image and image regions | |
Lucchi et al. | Are spatial and global constraints really necessary for segmentation? | |
Amer et al. | Sum-product networks for modeling activities with stochastic structure | |
Liu et al. | Label to region by bi-layer sparsity priors | |
US9563822B2 (en) | Learning apparatus, density measuring apparatus, learning method, computer program product, and density measuring system | |
CN111027600B (zh) | 图像类别预测方法和装置 | |
Xu et al. | Weakly supervised deep semantic segmentation using CNN and ELM with semantic candidate regions | |
CN107004116A (zh) | 用于预测脸部属性的方法和设备 | |
Awang et al. | Vehicle counting system based on vehicle type classification using deep learning method | |
Cogswell et al. | Combining the best of graphical models and convnets for semantic segmentation | |
CN114266927A (zh) | 一种无监督的显著性目标检测方法、系统、设备及介质 | |
CN107203788B (zh) | 一种中级视觉毒品图像识别方法 | |
Khelifi et al. | Mc-SSM: nonparametric semantic image segmentation with the ICM algorithm | |
Goldfarb | Understanding deep neural networks using topological data analysis | |
JP2015109024A (ja) | 画像辞書生成装置、画像辞書生成方法及びコンピュータプログラム | |
Xie et al. | Markov random field based fusion for supervised and semi-supervised multi-modal image classification | |
Carvajal et al. | Comparative evaluation of action recognition methods via Riemannian manifolds, Fisher vectors and GMMs: Ideal and challenging conditions | |
CN113408546A (zh) | 基于相互全局上下文注意力机制的单样本目标检测方法 | |
CN112949728A (zh) | 基于切片图像筛选和特征聚合的mri图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140307 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20140606 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150623 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150716 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5782037 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |