JP6149710B2 - 画像処理装置及びプログラム - Google Patents
画像処理装置及びプログラム Download PDFInfo
- Publication number
- JP6149710B2 JP6149710B2 JP2013244842A JP2013244842A JP6149710B2 JP 6149710 B2 JP6149710 B2 JP 6149710B2 JP 2013244842 A JP2013244842 A JP 2013244842A JP 2013244842 A JP2013244842 A JP 2013244842A JP 6149710 B2 JP6149710 B2 JP 6149710B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- identification
- partial image
- identification result
- specific type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000006870 function Effects 0.000 claims description 16
- 239000000284 extract Substances 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000000034 method Methods 0.000 description 36
- 230000010354 integration Effects 0.000 description 11
- 238000010801 machine learning Methods 0.000 description 9
- 238000013139 quantization Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 238000011156 evaluation Methods 0.000 description 7
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000000513 principal component analysis Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/768—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24317—Piecewise classification, i.e. whereby each classification requires several discriminant rules
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Description
次に、図1及び図2に示された機能ブロック図に基づいて、本実施形態に係る画像処理装置10に備えられた機能の一例について説明する。
図1には、画像処理装置10に備えられた機能のうち、オブジェクトの画像特徴を機械学習モデル(識別器)に学習させる処理に関する機能の一例を示した。
図2に示されるように、画像処理装置10は、対象画像取得部21、局所画像特徴生成部13、局所画像特徴クラスタ設定部14、局所画像特徴量子化部15、識別モデル選択部22、識別対象領域設定部23、矩形特徴量生成部17、識別部24、識別モデルパラメータ記憶部20、識別結果統合部25、識別結果出力部26を備える。
次に、図6乃至図9を参照しながら、画像処理装置10により実行される処理の一例について説明する。
図6には、画像処理装置10により実行される学習処理のフロー図を示した。図6に示されるように、画像処理装置10は、予め学習用の標本画像から得た局所特徴量をクラスタリングし(S101)、各クラスタの中心の情報を記憶しておく。
図7には、局所特徴量の算出処理のフロー図を示した。図7に示されるフローでは、局所特徴量を算出する対象の画像の画素数をA(Aは1以上の整数)、スケール数をB(1以上の整数)とする。
図8に示されるように、画像処理装置10は、ラベルLについて得られた学習用の矩形特徴量を取得し(S301)、取得した学習用の矩形特徴量に基づいてラベルLのオブジェクトを識別するための識別モデルパラメータを算出し(S302)、算出した識別モデルパラメータを、ラベルLに対応する識別器に関連付けて保存する(S303)。
次に、図9に示したフロー図を参照しながら、識別対象の画像(対象画像)に写し出されたオブジェクトの識別処理の一例について説明する。
Claims (8)
- 処理対象の画像を取得する取得手段と、
前記処理対象の画像中に、他の部分画像領域と重複する領域を有する部分画像領域を含む複数の部分画像領域を設定する設定手段と、
前記複数の部分画像領域のそれぞれについて特定種類のオブジェクトが含まれる可能性を示す第1の識別結果を取得する取得手段と、
前記複数の部分画像領域のそれぞれについての前記第1の識別結果の中から一部の第1の識別結果を抽出する抽出手段と、
前記抽出手段により抽出した第1の識別結果に基づいて、前記処理対象の画像中に前記特定種類のオブジェクトが含まれる可能性を示す第2の識別結果を生成する生成手段と、を含む
画像処理装置。 - 前記第1の識別結果は、前記特定種類のオブジェクトが含まれる確率であり、
前記抽出手段は、前記複数の部分画像領域のそれぞれについての第1の識別結果である確率が大きい順に、予め定められた数又は割合の第1の識別結果を抽出する
請求項1に記載の画像処理装置。 - 前記第1の識別結果は、前記特定種類のオブジェクトが含まれる確率であり、
前記抽出手段は、前記複数の部分画像領域のそれぞれについての第1の識別結果である確率が閾値以上の第1の識別結果を抽出する
請求項1に記載の画像処理装置。 - 前記第1の識別結果は、前記特定種類のオブジェクトが含まれる確率であり、
前記生成手段は、前記複数の部分画像領域のそれぞれについての第1の識別結果である確率の合計、積、又は、前記複数の部分画像領域のそれぞれについての第1の識別結果である確率が閾値以上である第1の識別結果の数と閾値未満である第1の識別結果の数との比較結果に基づいて、前記処理対象の画像中に前記特定種類のオブジェクトが含まれる可能性を示す第2の識別結果を生成する
請求項1に記載の画像処理装置。 - 前記特定種類のオブジェクトを含む1以上の標本画像にそれぞれ設定した部分画像領域の画像特徴に基づいて、該特定種類のオブジェクトの識別条件を識別器に学習させる手段をさらに含み、
前記取得手段は、前記複数の部分画像領域のそれぞれの画像特徴に基づいて、前記識別器により前記複数の部分画像領域のそれぞれについて特定種類のオブジェクトが含まれる可能性を示す第1の識別結果を取得する
請求項1乃至4のいずれかに記載の画像処理装置。 - 前記標本画像に設定した部分画像領域の位置及びサイズに関する特徴を学習する部分領域情報学習手段をさらに含み、
前記設定手段は、前記部分領域情報学習手段により学習された部分画像領域の位置及びサイズに関する特徴に基づいて、前記処理対象の画像中に複数の部分画像領域を設定する
請求項5に記載の画像処理装置。 - 前記部分画像領域の画像特徴は、該部分画像領域に含まれる1以上の画素のそれぞれの局所特徴の分布に基づき生成される
請求項5又は6に記載の画像処理装置。 - 処理対象の画像を取得する取得手段と、
前記処理対象の画像中に、他の部分画像領域と重複する領域を有する部分画像領域を含む複数の部分画像領域を設定する設定手段と、
前記複数の部分画像領域のそれぞれについて特定種類のオブジェクトが含まれる可能性を示す第1の識別結果を取得する取得手段と、
前記複数の部分画像領域のそれぞれについての前記第1の識別結果の中から一部の第1の識別結果を抽出する抽出手段と、
前記抽出手段により抽出した第1の識別結果に基づいて、前記処理対象の画像中に前記特定種類のオブジェクトが含まれる可能性を示す第2の識別結果を生成する生成手段
としてコンピュータを機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013244842A JP6149710B2 (ja) | 2013-11-27 | 2013-11-27 | 画像処理装置及びプログラム |
US14/296,594 US9122957B2 (en) | 2013-11-27 | 2014-06-05 | Image processing apparatus, image processing method, and non-transitory computer readable medium |
CN201410321273.6A CN104683686B (zh) | 2013-11-27 | 2014-07-07 | 图像处理设备和图像处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013244842A JP6149710B2 (ja) | 2013-11-27 | 2013-11-27 | 画像処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015103144A JP2015103144A (ja) | 2015-06-04 |
JP6149710B2 true JP6149710B2 (ja) | 2017-06-21 |
Family
ID=53182719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013244842A Active JP6149710B2 (ja) | 2013-11-27 | 2013-11-27 | 画像処理装置及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9122957B2 (ja) |
JP (1) | JP6149710B2 (ja) |
CN (1) | CN104683686B (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107636678B (zh) * | 2015-06-29 | 2021-12-14 | 北京市商汤科技开发有限公司 | 用于预测图像样本的属性的方法和设备 |
US20180032843A1 (en) * | 2016-07-29 | 2018-02-01 | Hewlett Packard Enterprise Development Lp | Identifying classes associated with data |
KR101883350B1 (ko) * | 2016-11-22 | 2018-08-02 | (주) 테크로스 | 샘플수 분석장치 및 방법 |
US20200012890A1 (en) | 2018-07-06 | 2020-01-09 | Capital One Services, Llc | Systems and methods for data stream simulation |
CN111031232B (zh) * | 2019-04-24 | 2022-01-28 | 广东小天才科技有限公司 | 一种听写实时检测的方法及电子设备 |
JP7433782B2 (ja) * | 2019-06-14 | 2024-02-20 | キヤノン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
CN110807486B (zh) * | 2019-10-31 | 2022-09-02 | 北京达佳互联信息技术有限公司 | 类别标签的生成方法、装置、电子设备及存储介质 |
WO2021085258A1 (ja) * | 2019-10-31 | 2021-05-06 | キヤノン株式会社 | 画像処理装置、画像処理装置の制御方法、識別器の生成方法、識別方法、識別装置、識別器の生成装置、及び識別器 |
JP2022105385A (ja) * | 2021-01-04 | 2022-07-14 | 株式会社東芝 | 進捗判定システム、進捗判定方法、プログラム、及び記憶媒体 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005250771A (ja) * | 2004-03-03 | 2005-09-15 | Fuji Photo Film Co Ltd | 対象物識別装置および方法並びにプログラム |
EP2049983A2 (en) * | 2006-08-07 | 2009-04-22 | Yeda Research And Development Co. Ltd. | Data similarity and importance using local and global evidence scores |
JP2011013732A (ja) * | 2009-06-30 | 2011-01-20 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム |
WO2012124000A1 (ja) * | 2011-03-17 | 2012-09-20 | 日本電気株式会社 | 画像認識システム、画像認識方法および画像認識用プログラムが格納された非一時的なコンピュータ可読媒体 |
US8873813B2 (en) * | 2012-09-17 | 2014-10-28 | Z Advanced Computing, Inc. | Application of Z-webs and Z-factors to analytics, search engine, learning, recognition, natural language, and other utilities |
JP5823270B2 (ja) * | 2011-11-30 | 2015-11-25 | Kddi株式会社 | 画像認識装置及び方法 |
JP5648655B2 (ja) * | 2012-04-27 | 2015-01-07 | 株式会社デンソー | 対象物識別装置 |
-
2013
- 2013-11-27 JP JP2013244842A patent/JP6149710B2/ja active Active
-
2014
- 2014-06-05 US US14/296,594 patent/US9122957B2/en active Active
- 2014-07-07 CN CN201410321273.6A patent/CN104683686B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
US20150146974A1 (en) | 2015-05-28 |
CN104683686A (zh) | 2015-06-03 |
CN104683686B (zh) | 2019-03-12 |
JP2015103144A (ja) | 2015-06-04 |
US9122957B2 (en) | 2015-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6149710B2 (ja) | 画像処理装置及びプログラム | |
Zhao et al. | Learning mid-level filters for person re-identification | |
CN110991465B (zh) | 一种物体识别方法、装置、计算设备及存储介质 | |
JP5823270B2 (ja) | 画像認識装置及び方法 | |
EP3274921B1 (en) | Multi-layer skin detection and fused hand pose matching | |
JP5916886B2 (ja) | 画像特徴の類似性に基づく画像索引作成 | |
Li et al. | 3D facial expression recognition via multiple kernel learning of multi-scale local normal patterns | |
US9098775B2 (en) | Multi-class identifier, method, and computer-readable recording medium | |
JP5538967B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
CN110717554B (zh) | 图像识别方法、电子设备及存储介质 | |
JP5725918B2 (ja) | 情報処理方法及び情報処理装置 | |
JP5997545B2 (ja) | 信号処理方法及び信号処理装置 | |
JP5361664B2 (ja) | 画像処理装置、画像処理方法 | |
WO2012124000A1 (ja) | 画像認識システム、画像認識方法および画像認識用プログラムが格納された非一時的なコンピュータ可読媒体 | |
Marini et al. | Bird species classification based on color features | |
CN104268552B (zh) | 一种基于部件多边形的精细类别分类方法 | |
CN111881849A (zh) | 图像场景检测方法、装置、电子设备及存储介质 | |
CN112633297A (zh) | 目标对象的识别方法、装置、存储介质以及电子装置 | |
JP2012221061A (ja) | 画像認識装置、画像認識方法、及びプログラム | |
CN109034239B (zh) | 遥感影像分类方法、分布式风电场的选址方法和设备 | |
CN109741380B (zh) | 纺织品图片快速匹配方法和装置 | |
Gou et al. | mom: Mean of moments feature for person re-identification | |
CN112241736A (zh) | 一种文本检测的方法及装置 | |
Liu et al. | Flower classification using fusion descriptor and SVM | |
CN113963295A (zh) | 视频片段中地标识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170123 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170131 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170324 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170425 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170508 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6149710 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |