JP5849558B2 - 画像処理装置、画像処理方法、制御プログラムおよび記録媒体 - Google Patents
画像処理装置、画像処理方法、制御プログラムおよび記録媒体 Download PDFInfo
- Publication number
- JP5849558B2 JP5849558B2 JP2011202427A JP2011202427A JP5849558B2 JP 5849558 B2 JP5849558 B2 JP 5849558B2 JP 2011202427 A JP2011202427 A JP 2011202427A JP 2011202427 A JP2011202427 A JP 2011202427A JP 5849558 B2 JP5849558 B2 JP 5849558B2
- Authority
- JP
- Japan
- Prior art keywords
- target
- detection
- estimated
- heterogeneous
- detection target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 9
- 238000001514 detection method Methods 0.000 claims description 956
- 241000282414 Homo sapiens Species 0.000 description 79
- 241000282326 Felis catus Species 0.000 description 31
- 238000000034 method Methods 0.000 description 30
- 238000010586 diagram Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 210000000887 face Anatomy 0.000 description 6
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 101150012579 ADSL gene Proteins 0.000 description 1
- 102100020775 Adenylosuccinate lyase Human genes 0.000 description 1
- 108700040193 Adenylosuccinate lyases Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/255—Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/809—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of classification results, e.g. where the classifiers operate on the same input data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/248—Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Description
まず、画像処理装置について図1に基づいて説明する。画像処理装置は、画像上における所定の主体の全部または一部である検出対象を検出するものである。ここで、検出対象とは、画像上の任意の有形物であり、例えば、人間の全身、顔、目、鼻、口、手、腕もしくは脚など、または、犬、猫、鳥等の動物の全身もしくは顔など、または、自動車、バイク等の車体全体もしくはタイヤなど、または、ビル、家屋等の建造物など、または、木、雲、太陽等の自然物などである。また、例えば、検出対象が「人間の顔」の場合、検出対象の主体は「人間」である。また、検出対象が「犬の顔」の場合、検出対象の主体は「犬」である。また、検出対象が「自動車のタイヤ」の場合、検出対象の主体は「自動車」である。
次に、画像処理装置1が実行する検出対象を検出する検出処理について図4〜22に基づいて説明する。最初に、図4〜9に基づいて、画像からペットの顔を検出する検出処理例(実施例1)を説明する。次に、図10〜図15に基づいて、画像から人間の顔を検出する検出処理例(実施例2)を説明する。次に、図5、16〜20に基づいて、画像から人間の顔を検出する検出処理例(実施例3)を説明する。次に、図21に基づいて、検出対象領域判定部25が検出対象領域であるか否かを判定する判定処理例(実施例4)を説明する。最後に、図22に基づいて、検出対象領域判定部25が検出対象領域であるか否かを判定する他の判定処理例(実施例5)を説明する。
まず、実施例1として、図5に示す入力画像41からペットの顔を検出する検出処理例を説明する。図4は、図5に示す入力画像41からペットを検出する検出処理の一例を示す図である。また、図5は、実施例1で用いる入力画像41を示す図である。
次に、実施例2として、図11に示す入力画像61から人間の顔を検出する検出処理例を説明する。図10は、図11に示す入力画像61から人間の顔を検出する検出処理の一例を示す図である。また、図11は、実施例2で用いる入力画像61を示す図である。
次に、実施例3として、図5に示す入力画像41から人間の顔を検出する検出処理例を説明する。図16は、図5に示す入力画像41から人間の顔を検出する検出処理の一例を示す図である。
次に、実施例4として、或る入力画像から人間の顔を検出する検出処理において、図21に示す異種対象の検出結果に基づいて、各候補領域が検出対象領域であるか否かを判定する判定処理例を説明する。
最後に、実施例5として、或る入力画像から人間の顔を検出する検出処理において、異種対象確度、または、異種対象確度および検出対象確度に基づいて、各候補領域が検出対象領域であるか否かを判定する判定処理例を説明する。
また、変形例1として、異種対象検出部24が検出対象確度に基づいて、検出種別の内容および/または種別数を決定する例を説明する。
本実施形態では、異種対象検出部24が検出する対象である異種対象を、検出対象の主体と種別が異なる主体の全部または一部と考えられる対象としているがこれに限るものではない。例えば、異種対象を検出対象と種別が異なる対象としてもよい。
本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
22 検出対象検出部(検出対象検出手段)
24 異種対象検出部(異種対象判定手段)
25 検出対象領域判定部(検出対象判定手段)
Claims (12)
- 画像上における所定の主体の全部または一部である検出対象を検出する画像処理装置であって、
上記画像から上記検出対象と考えられる推定検出対象を検出する検出対象検出手段と、
上記検出対象検出手段が検出した推定検出対象が、上記主体と種別が異なる主体の全部または一部である異種対象と考えられる推定異種対象であるか否かを判定する異種対象判定手段と、
上記異種対象判定手段の判定結果に基づいて、上記検出対象検出手段が検出した推定検出対象が、上記検出対象であるか否かを判定する検出対象判定手段とを備えることを特徴とする画像処理装置。 - 上記異種対象判定手段は、複数の種別の推定異種対象について、種別毎に、上記検出対象検出手段が検出した推定検出対象が推定異種対象であるか否かをそれぞれ判定することを特徴とする請求項1に記載の画像処理装置。
- 上記検出対象検出手段は、上記推定検出対象を検出すると共に、当該推定検出対象が上記検出対象である確度を示す検出対象確度を特定し、
上記異種対象判定手段は、上記検出対象検出手段が検出した推定検出対象の検出対象確度に基づいて、判定する推定異種対象の種別内容および/または種別数を決定することを特徴とする請求項1に記載の画像処理装置。 - 上記検出対象判定手段は、上記異種対象判定手段が上記推定検出対象を上記推定異種対象であると判定した場合、当該推定検出対象を上記検出対象ではないと判定することを特徴とする請求項1〜3の何れか1項に記載の画像処理装置。
- 上記検出対象判定手段は、上記異種対象判定手段が上記推定検出対象を所定の種別の推定異種対象であると判定した場合、当該推定検出対象を上記検出対象ではないと判定することを特徴とする請求項2または3に記載の画像処理装置。
- 上記検出対象判定手段は、上記異種対象判定手段が、所定数の種別数の推定異種対象について、上記推定検出対象を上記推定異種対象であると判定した場合、当該推定検出対象を上記検出対象ではないと判定することを特徴とする請求項2、3または5に記載の画像処理装置。
- 上記異種対象判定手段は、上記推定検出対象を上記推定異種対象であると判定した場合、推定異種対象毎に、当該推定異種対象が対応する異種対象である確度を示す異種対象確度を特定し、
上記検出対象判定手段は、各推定異種対象の異種対象確度を合計した合計値が所定の閾値以上の場合、上記推定検出対象を上記検出対象ではないと判定することを特徴とする請求項1〜3の何れか1項に記載の画像処理装置。 - 上記検出対象検出手段は、上記推定検出対象を検出すると共に、当該推定検出対象が上記検出対象である確度を示す検出対象確度を特定し、
上記異種対象判定手段は、上記推定検出対象を上記推定異種対象であると判定した場合、推定異種対象毎に、当該推定異種対象が対応する異種対象である確度を示す異種対象確度を特定し、
上記検出対象判定手段は、各推定異種対象の異種対象確度と上記検出対象確度とに基づいて、上記推定検出対象が上記検出対象であるか否かを判定することを特徴とする請求項1〜3の何れか1項に記載の画像処理装置。 - 上記検出対象判定手段は、上記推定異種対象毎に予め定められている所定の重み付け値を、各推定異種対象の異種対象確度にそれぞれ乗算し、乗算後の複数の異種対象確度に基づいて、上記推定検出対象が上記検出対象であるか否かを判定することを特徴とする請求項7または8に記載の画像処理装置。
- 画像上における所定の主体の全部または一部である検出対象を検出する画像処理方法であって、
上記画像から上記検出対象と考えられる推定検出対象を検出する検出対象検出ステップと、
上記検出対象検出ステップにおいて検出された推定検出対象が、上記主体と種別が異なる主体の全部または一部である異種対象と考えられる推定異種対象であるか否かを判定する異種対象判定ステップと、
上記異種対象判定ステップの判定結果に基づいて、上記検出対象検出ステップにおいて検出された推定検出対象が、上記検出対象であるか否かを判定する検出対象判定ステップとを含むことを特徴とする画像処理方法。 - 請求項1〜9の何れか1項に記載の画像処理装置を動作させるための制御プログラムであって、コンピュータを上記各手段として機能させるための制御プログラム。
- 請求項11に記載の制御プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011202427A JP5849558B2 (ja) | 2011-09-15 | 2011-09-15 | 画像処理装置、画像処理方法、制御プログラムおよび記録媒体 |
CN201280035765.8A CN103688290B (zh) | 2011-09-15 | 2012-03-13 | 图像处理装置、图像处理方法 |
PCT/JP2012/056479 WO2013038732A1 (ja) | 2011-09-15 | 2012-03-13 | 画像処理装置、画像処理方法、制御プログラムおよび記録媒体 |
EP12832067.8A EP2747029B1 (en) | 2011-09-15 | 2012-03-13 | Image processing device, image processing method, control program, and recording medium |
US14/234,403 US9202135B2 (en) | 2011-09-15 | 2012-03-13 | Image processing device, image processing method, control program, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011202427A JP5849558B2 (ja) | 2011-09-15 | 2011-09-15 | 画像処理装置、画像処理方法、制御プログラムおよび記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013065107A JP2013065107A (ja) | 2013-04-11 |
JP5849558B2 true JP5849558B2 (ja) | 2016-01-27 |
Family
ID=47882978
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011202427A Active JP5849558B2 (ja) | 2011-09-15 | 2011-09-15 | 画像処理装置、画像処理方法、制御プログラムおよび記録媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9202135B2 (ja) |
EP (1) | EP2747029B1 (ja) |
JP (1) | JP5849558B2 (ja) |
CN (1) | CN103688290B (ja) |
WO (1) | WO2013038732A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9360124B2 (en) | 2013-03-15 | 2016-06-07 | Cook Medical Technologies Llc | Bi-directional valve device for selective control of fluid flow through multiple converging paths |
JP6426441B2 (ja) * | 2014-11-13 | 2018-11-21 | 株式会社東芝 | 密度計測装置、密度計測方法、およびプログラム |
CN106558039B (zh) * | 2015-09-23 | 2019-11-19 | 腾讯科技(深圳)有限公司 | 一种人像处理方法及装置 |
JP6965803B2 (ja) * | 2018-03-20 | 2021-11-10 | 株式会社Jvcケンウッド | 認識装置、認識方法及び認識プログラム |
CN109771952A (zh) * | 2018-12-28 | 2019-05-21 | 努比亚技术有限公司 | 基于游戏疲劳度的提醒方法、终端及计算机可读存储介质 |
CN112528977B (zh) * | 2021-02-10 | 2021-07-02 | 北京优幕科技有限责任公司 | 目标检测方法、装置、电子设备和存储介质 |
KR20230020708A (ko) * | 2021-08-04 | 2023-02-13 | 삼성전자주식회사 | 객체 검출 장치 및 객체 검출 방법 |
CN116935290B (zh) * | 2023-09-14 | 2023-12-12 | 南京邮电大学 | 机场场景下高分辨率阵列摄像机异构目标检测方法及系统 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5949675A (ja) * | 1982-09-16 | 1984-03-22 | Fujitsu Ltd | 文字認識装置 |
US4802231A (en) * | 1987-11-24 | 1989-01-31 | Elliot Davis | Pattern recognition error reduction system |
US5912986A (en) * | 1994-06-21 | 1999-06-15 | Eastman Kodak Company | Evidential confidence measure and rejection technique for use in a neural network based optical character recognition system |
JPH08263655A (ja) * | 1995-03-17 | 1996-10-11 | Nissan Motor Co Ltd | パターン認識方法 |
JP2006048322A (ja) * | 2004-08-04 | 2006-02-16 | Seiko Epson Corp | オブジェクト画像検出装置、顔画像検出プログラムおよび顔画像検出方法 |
US8483283B2 (en) * | 2007-03-26 | 2013-07-09 | Cisco Technology, Inc. | Real-time face detection |
JP5099488B2 (ja) * | 2007-08-31 | 2012-12-19 | カシオ計算機株式会社 | 撮像装置、顔認識方法およびそのプログラム |
JP2009289230A (ja) * | 2008-06-02 | 2009-12-10 | Olympus Corp | 画像処理装置、画像処理方法及び画像処理プログラム |
JP5249146B2 (ja) * | 2009-07-03 | 2013-07-31 | 富士フイルム株式会社 | 撮影制御装置および方法並びにプログラム |
US8515184B1 (en) * | 2009-07-28 | 2013-08-20 | Hrl Laboratories, Llc | System for visual object recognition using heterogeneous classifier cascades |
WO2011034525A1 (en) * | 2009-09-16 | 2011-03-24 | Hewlett-Packard Development Company, Lp | System and method for assessing photographer competence |
JP5895624B2 (ja) * | 2012-03-14 | 2016-03-30 | オムロン株式会社 | 画像処理装置、画像処理方法、制御プログラムおよび記録媒体 |
-
2011
- 2011-09-15 JP JP2011202427A patent/JP5849558B2/ja active Active
-
2012
- 2012-03-13 WO PCT/JP2012/056479 patent/WO2013038732A1/ja active Application Filing
- 2012-03-13 CN CN201280035765.8A patent/CN103688290B/zh active Active
- 2012-03-13 EP EP12832067.8A patent/EP2747029B1/en active Active
- 2012-03-13 US US14/234,403 patent/US9202135B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN103688290A (zh) | 2014-03-26 |
WO2013038732A1 (ja) | 2013-03-21 |
EP2747029A4 (en) | 2016-09-14 |
EP2747029A1 (en) | 2014-06-25 |
CN103688290B (zh) | 2016-12-28 |
EP2747029B1 (en) | 2021-03-03 |
JP2013065107A (ja) | 2013-04-11 |
US9202135B2 (en) | 2015-12-01 |
US20140198953A1 (en) | 2014-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5849558B2 (ja) | 画像処理装置、画像処理方法、制御プログラムおよび記録媒体 | |
US10395103B2 (en) | Object detection method, object detection apparatus, and program | |
KR20220062338A (ko) | 스테레오 카메라들로부터의 손 포즈 추정 | |
US20130011049A1 (en) | Image processing apparatus, method, and program | |
US9613296B1 (en) | Selecting a set of exemplar images for use in an automated image object recognition system | |
KR20190056720A (ko) | 뉴럴 네트워크 학습 방법 및 디바이스 | |
US11816876B2 (en) | Detection of moment of perception | |
CN111242273B (zh) | 一种神经网络模型训练方法及电子设备 | |
US20220269883A1 (en) | Methods, apparatuses, devices and storage media for predicting correlation between objects involved in image | |
EP2639746B1 (en) | Image processor, image processing method, control program, and recording medium | |
CN113837257B (zh) | 一种目标检测方法及装置 | |
KR20160106649A (ko) | 증강 현실 스킨의 평가 | |
KR101413587B1 (ko) | 화상처리장치, 화상처리방법, 제어 프로그램 및 기록매체 | |
JP2014199506A (ja) | 物体検出装置、物体検出方法及びプログラム | |
CN111753813A (zh) | 图像处理方法、装置、设备及存储介质 | |
US20140050404A1 (en) | Combining Multiple Image Detectors | |
JP2009289230A (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
JP2021189554A (ja) | 携帯端末、情報処理方法及び情報処理プログラム | |
US11847859B2 (en) | Information processing device, method, and program recording medium | |
KR20140088597A (ko) | 객체 맥락적 정보의 분류 방지 | |
JP2010182078A (ja) | 画像処理装置及び画像処理プログラム | |
CN114511779A (zh) | 场景图生成模型的训练方法、场景图生成方法及装置 | |
JP2018073076A (ja) | 個人識別装置、ロボット、個人識別方法、及び、プログラム | |
KR20140103036A (ko) | 객체 추적이 가능한 전자 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140704 |
|
TRDD | Decision of grant or rejection written | ||
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20151023 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20151028 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151104 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151117 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5849558 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D04 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |