JP5591178B2 - テスト画像内のオブジェクトを分類するための方法 - Google Patents
テスト画像内のオブジェクトを分類するための方法 Download PDFInfo
- Publication number
- JP5591178B2 JP5591178B2 JP2011108543A JP2011108543A JP5591178B2 JP 5591178 B2 JP5591178 B2 JP 5591178B2 JP 2011108543 A JP2011108543 A JP 2011108543A JP 2011108543 A JP2011108543 A JP 2011108543A JP 5591178 B2 JP5591178 B2 JP 5591178B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- proposition
- image
- classifier
- boolean
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Description
大量の候補特徴から最も弁別的な特徴を選択するために、本発明では、離散AdaBoost手順を用いる。なぜなら出力が二値であり、離散AdaBoostフレームワーク内で良好に適合するためである。AdaBoostは一連のラウンドにおいて弱識別器を反復して呼び出す。呼び出し毎に、分類のためのデータセット内の事例の重要度を示す重みDtの分布が更新される。各ラウンドにおいて、各不正確に分類された事例の重みが増加され、各正確に分類された事例の重みが減少され、それによって新たな識別器は正確に分類された事例により集中する。
関係演算子gは、非常に単純なマージンに基づく距離の形態を有する。したがって、式(1)において与えられる距離ノルムの場合、命題毎に応答を符号化する2Dルックアップテーブルを構築し、次に応答を連結して別個の仮説2Dルックアップテーブルにすることが可能である。複合仮説内のn連結の場合、これらのルックアップテーブルはn次元になる。テーブルへのインデックスは、特徴表現に依拠して、ピクセル輝度値、又はベクトル値の量子化された範囲とすることができる。256レベルの輝度値等の固定数の離散特徴低レベル表現の場合、情報損失、及び離散していない他の特徴低レベル表現に関する有意でない適応量子化損失がないので、ルックアップテーブルを用いることによって、関係演算子gの正確な結果がもたらされる。
本発明は、オブジェクトウィンドウの直接ピクセル輝度又は特徴ベクトルから非常に単純な関係特徴の連結を用いる検出方法である。本方法は、ブースティングフレームワークにおいて、SVM−RBFと同じだけ優位性があるが、計算負荷の一部しか必要としない識別器を構築するのに用いることができる。
Claims (18)
- テスト画像内のオブジェクトを分類するための方法であって、トレーニング画像のセット内のトレーニング画像毎に、
前記トレーニング画像内のウィンドウから特徴を抽出するステップであって、該ウィンドウは前記オブジェクトを含む、抽出するステップと、
前記特徴の係数cをランダムにサンプリングするステップと、
前記係数の可能なセット毎にn連結を求めるステップと、
前記係数の可能な連結毎に、関係演算子を用いてブール値命題を定義して、命題空間を生成するステップと、
前記命題空間にブール演算子の連結関数を適用することによって識別器の複合仮説を構築し、前記命題空間内の全ての可能な論理命題を構築するステップと、
前記テスト画像から抽出された特徴に前記識別器の前記複合仮説を適用して、前記テスト画像が前記オブジェクトを含むか否かを検出するステップと
を含み、
前記各ステップは、プロセッサが実行する、方法。 - 前記係数は、トレーニングデータセット画像に関して、前記テスト画像内で正規化される、請求項1に記載の方法。
- 前記特徴はピクセル輝度である、請求項1に記載の方法。
- 前記特徴は勾配ヒストグラムである、請求項1に記載の方法。
- 前記特徴は、前記トレーニング画像に関連付けられる記述子ベクトルの前記係数である、請求項1に記載の方法。
- 前記ブール値命題はpijであり、前記関係演算子はgであり、pij=g(ci,cj)であり、ここで、ci及びcjは前記特徴の係数である、請求項1に記載の方法。
- 前記ブール演算子は、論理積及び論理和を含む、請求項1に記載の方法。
- 前記ブール演算子は、ファジー論理システム、三値論理システム、多値論理システムにおいて適用される演算子を含む非二値論理演算子を含む、請求項1に記載の方法。
- 前記特徴は、d次元ベクトルx内に格納される、請求項1に記載の方法。
- 前記識別器は、AdaBoost手順、離散AdaBoost手順、LogitBoost手順、BrownBoost手順、及びGentleBoost手順の変形を含むブースティングされた学習器の形態である、請求項1に記載の方法。
- 前記論理命題は、前記識別器の前記複合仮説を適用するとき、前記命題毎の応答のルックアップテーブルにおいて符号化される、請求項1に記載の方法。
- 前記構築された複合仮説のそれぞれは、nルックアップテーブルにおいて符号化され、該ルックアップテーブルはn次元である、請求項1に記載の方法。
- 前記複合仮説の前記適用は、前記ルックアップテーブルにアクセスすると共に前記応答の重み付けされた和を合算することによって行われる、請求項12に記載の方法。
- 前記ルックアップテーブルのインデックスは、前記画像内のピクセルの輝度値の範囲内にある、請求項12に記載の方法。
- 前記ルックアップテーブルのインデックスは、ベクトル値の量子化された範囲内にある、請求項12に記載の方法。
- 前記識別器はブースティングされた識別器であり、拒絶カスケードを構成する、請求項1に記載の方法。
- 前記マージン値は、前記トレーニング画像のセットに対する対応する複合仮説の検出性能を最適化する、請求項7に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/786,648 US20110293173A1 (en) | 2010-05-25 | 2010-05-25 | Object Detection Using Combinations of Relational Features in Images |
US12/786,648 | 2010-05-25 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2011248879A JP2011248879A (ja) | 2011-12-08 |
JP2011248879A5 JP2011248879A5 (ja) | 2014-05-01 |
JP5591178B2 true JP5591178B2 (ja) | 2014-09-17 |
Family
ID=45022186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011108543A Active JP5591178B2 (ja) | 2010-05-25 | 2011-05-13 | テスト画像内のオブジェクトを分類するための方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20110293173A1 (ja) |
JP (1) | JP5591178B2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8913783B2 (en) * | 2009-10-29 | 2014-12-16 | Sri International | 3-D model based method for detecting and classifying vehicles in aerial imagery |
KR101395094B1 (ko) * | 2010-09-29 | 2014-05-16 | 안동대학교 산학협력단 | 개체 검출 방법 및 시스템 |
JP5671928B2 (ja) * | 2010-10-12 | 2015-02-18 | ソニー株式会社 | 学習装置、学習方法、識別装置、識別方法、およびプログラム |
US9275306B2 (en) * | 2013-11-13 | 2016-03-01 | Canon Kabushiki Kaisha | Devices, systems, and methods for learning a discriminant image representation |
CN106575364A (zh) | 2014-04-11 | 2017-04-19 | 英特尔公司 | 使用定向滤波的目标检测 |
JP6474210B2 (ja) | 2014-07-31 | 2019-02-27 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 大規模画像データベースの高速検索手法 |
US9697443B2 (en) * | 2014-12-11 | 2017-07-04 | Intel Corporation | Model compression in binary coded image based object detection |
CN105184312B (zh) * | 2015-08-24 | 2018-09-25 | 中国科学院自动化研究所 | 一种基于深度学习的文字检测方法及装置 |
US11250256B2 (en) | 2015-12-26 | 2022-02-15 | Intel Corporation | Binary linear classification |
KR20190117584A (ko) | 2017-02-09 | 2019-10-16 | 페인티드 도그, 인크. | 스트리밍 비디오 내의 객체를 검출하고, 필터링하고 식별하기 위한 방법 및 장치 |
CN107403192B (zh) * | 2017-07-18 | 2020-09-29 | 四川长虹电器股份有限公司 | 一种基于多分类器的快速目标检测方法及系统 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2167748A1 (en) * | 1995-02-09 | 1996-08-10 | Yoav Freund | Apparatus and methods for machine learning hypotheses |
US7536044B2 (en) * | 2003-11-19 | 2009-05-19 | Siemens Medical Solutions Usa, Inc. | System and method for detecting and matching anatomical structures using appearance and shape |
US7447359B2 (en) * | 2004-09-07 | 2008-11-04 | Siemens Medical Solutions Usa, Inc. | System and method for anatomical structure parsing and detection |
US7876934B2 (en) * | 2004-11-08 | 2011-01-25 | Siemens Medical Solutions Usa, Inc. | Method of database-guided segmentation of anatomical structures having complex appearances |
CN100472556C (zh) * | 2005-10-09 | 2009-03-25 | 欧姆龙株式会社 | 特定被摄体检测装置及方法 |
US7693301B2 (en) * | 2006-10-11 | 2010-04-06 | Arcsoft, Inc. | Known face guided imaging method |
US8306262B2 (en) * | 2008-05-15 | 2012-11-06 | Arcsoft, Inc. | Face tracking method for electronic camera device |
US20090290791A1 (en) * | 2008-05-20 | 2009-11-26 | Holub Alex David | Automatic tracking of people and bodies in video |
US8121424B2 (en) * | 2008-09-26 | 2012-02-21 | Axis Ab | System, computer program product and associated methodology for video motion detection using spatio-temporal slice processing |
JP2011013732A (ja) * | 2009-06-30 | 2011-01-20 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム |
-
2010
- 2010-05-25 US US12/786,648 patent/US20110293173A1/en not_active Abandoned
-
2011
- 2011-05-13 JP JP2011108543A patent/JP5591178B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011248879A (ja) | 2011-12-08 |
US20110293173A1 (en) | 2011-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5591178B2 (ja) | テスト画像内のオブジェクトを分類するための方法 | |
Nandhini Abirami et al. | Deep CNN and Deep GAN in Computational Visual Perception‐Driven Image Analysis | |
US20190087726A1 (en) | Hypercomplex deep learning methods, architectures, and apparatus for multimodal small, medium, and large-scale data representation, analysis, and applications | |
CN115937655B (zh) | 多阶特征交互的目标检测模型及其构建方法、装置及应用 | |
US11443514B2 (en) | Recognizing minutes-long activities in videos | |
KR20090131626A (ko) | 영상 데이터내의 특정 클래스의 오브젝트를 세그멘테이션하기 위한 시스템 및 방법 | |
Xiang et al. | Towards interpretable skin lesion classification with deep learning models | |
Parashar et al. | Deep learning pipelines for recognition of gait biometrics with covariates: a comprehensive review | |
KR102214922B1 (ko) | 행동 인식을 위한 특징 벡터 생성 방법, 히스토그램 생성 방법, 및 분류기 학습 방법 | |
CN110827265B (zh) | 基于深度学习的图片异常检测方法 | |
CN109242097B (zh) | 无监督学习的视觉表示学习系统及方法 | |
CN110111365B (zh) | 基于深度学习的训练方法和装置以及目标跟踪方法和装置 | |
JP7225731B2 (ja) | 多変数データシーケンスの画像化 | |
Jemilda et al. | Moving object detection and tracking using genetic algorithm enabled extreme learning machine | |
CN111340051A (zh) | 图片处理方法、装置及存储介质 | |
CN109508640A (zh) | 一种人群情感分析方法、装置和存储介质 | |
Yao | A compressed deep convolutional neural networks for face recognition | |
CN113869234A (zh) | 人脸表情识别方法、装置、设备及存储介质 | |
CN115410000A (zh) | 对象分类方法以及装置 | |
WO2022126367A1 (en) | Sequence processing for a dataset with frame dropping | |
Cristin et al. | Image forgery detection using supervised learning algorithm | |
EP4058940A1 (en) | Permutation invariant convolution (pic) for recognizing long-range activities | |
Rao et al. | Learning semantic features for classifying very large image datasets using convolution neural network | |
Shi et al. | A novel artificial fish swarm algorithm for pattern recognition with convex optimization | |
Thakur et al. | Machine Learning and Deep Learning Techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140313 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140313 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20140313 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20140416 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140422 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140428 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140701 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140729 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5591178 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |