JP7298776B2 - 物体認識装置、物体認識方法、及び、プログラム - Google Patents
物体認識装置、物体認識方法、及び、プログラム Download PDFInfo
- Publication number
- JP7298776B2 JP7298776B2 JP2022510252A JP2022510252A JP7298776B2 JP 7298776 B2 JP7298776 B2 JP 7298776B2 JP 2022510252 A JP2022510252 A JP 2022510252A JP 2022510252 A JP2022510252 A JP 2022510252A JP 7298776 B2 JP7298776 B2 JP 7298776B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- model
- unit
- recognition model
- input image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Description
学習済みの第1の認識モデルを用いて、入力画像中の物体を認識する第1の認識手段と、
前記第1の認識モデルによる認識精度が低い物体を認識するように学習された第2の認識モデルを用いて、前記入力画像中の物体を認識する第2の認識手段と、
前記入力画像に基づいて、前記第1の認識手段及び前記第2の認識手段に対する重みを算出する重み付け手段と、
前記重みを用いて、前記第1の認識手段の認識結果と、前記第2の認識手段の認識結果を融合する融合手段と、を備える。
学習済みの第1の認識モデルを用いて、入力画像中の物体を認識し、
前記第1の認識モデルによる認識精度が低い物体を認識するように学習された第2の認識モデルを用いて、前記入力画像中の物体を認識し、
前記入力画像に基づいて、前記第1の認識手段及び前記第2の認識手段に対する重みを算出し、
前記重みを用いて、前記第1の認識手段の認識結果と、前記第2の認識手段の認識結果を融合する。
学習済みの第1の認識モデルを用いて、入力画像中の物体を認識し、
前記第1の認識モデルによる認識精度が低い物体を認識するように学習された第2の認識モデルを用いて、前記入力画像中の物体を認識し、
前記入力画像に基づいて、前記第1の認識手段及び前記第2の認識手段に対する重みを算出し、
前記重みを用いて、前記第1の認識手段の認識結果と、前記第2の認識手段の認識結果を融合する処理をコンピュータに実行させる。
次に、本発明の第1実施形態について説明する。
[ハードウェア構成]
図1は、物体認識装置のハードウェア構成を示すブロック図である。図示のように、物体認識装置10は、インタフェース(IF)2と、プロセッサ3と、メモリ4と、記録媒体5と、データベース(DB)6と、を備える。
次に、本実施形態の物体認識装置の基本原理について説明する。ある物体認識モデル(以下、「既存モデル」と呼ぶ。)を用いた物体認識装置の運用中に、特定の物体についての認識エラーが多く発生した場合、通常は、認識エラーが発生した画像を用いて既存モデルを再学習する。しかし、再学習は、既存モデルのパラメータの更新を伴うため、認識エラーが発生した物体の認識精度は改善するが、逆にそれまで高精度で認識できていた物体の認識精度が低下してしまうことがある。そこで、本実施形態では、既存モデルとは別に、認識エラーが発生した画像で学習したエラー対策モデル(以下、「苦手対策モデル」と呼ぶ。)を生成し、既存モデルと苦手対策モデルを併用する。
次に、物体認識装置10の学習時の機能構成について説明する。図4は、学習時の物体認識装置10xの機能構成を示すブロック図である。図示のように、物体認識装置10xは、画像入力部11と、重み付け部12と、第1の認識部13と、第2の認識部14と、融合部15と、パラメータ修正部16と、損失算出部17と、正解ラベル記憶部18とを備える。画像入力部11は、図1に示すインタフェース2により実現される、重み付け部12、第1の認識部13、第2の認識部14、融合部15、パラメータ修正部16、及び、損失算出部17は、図1に示すプロセッサ3により実現される。正解ラベル記憶部18は図1に示すデータベース6により実現される。
”Learning Efficient Object Detection Models with Knowledge Distillation”,NeurIPS2017
次に、物体認識装置10xによる学習処理について説明する。図7は、物体認識装置10xによる学習処理のフローチャートである。この処理は、図1に示すプロセッサ3が予め用意されたプログラムを実行することにより実現される。
次に、物体認識装置の推論時の構成について説明する。図8は、推論時の物体認識装置10yの機能構成を示すブロック図である。なお、推論時の物体認識装置10yも、基本的に図1に示すハードウェア構成で実現される。
次に、物体認識装置10yによる推論処理について説明する。図9は、物体認識装置10xによる推論処理のフローチャートである。この処理は、図1に示すプロセッサ3が予め用意されたプログラムを実行することにより実現される。
本実施形態の物体認識装置による認識精度を従来手法による認識精度と比較した。従来手法としては、上記の既存モデルを、苦手対策モデルの学習用データでファインチューニングする方法(「従来手法1」とする)と、苦手対策モデルの学習用データを使用し、EWC(Elastic Weight Consolidation)の手法により、重要なパラメータを更新せずに既存モデルを再学習する方法(「従来手法2」とする。)を用いた。既存モデルにより認識エラーを生じる物体を「苦手物体」と呼ぶことすると、従来手法1では、苦手物体の認識精度は上昇したが、苦手物体以外の認識精度が低下した。従来手法2でも、苦手物体の認識精度は上昇したが、従来手法1ほどではないものの、苦手物体以外の認識精度が低下した。一方、本実施形態の手法では、苦手物体の認識精度を上昇させるとともに、苦手物体外の認識精度の低下も従来手法1及び従来手法2よりも低く抑えることができた。
上記の第1実施形態に対しては、以下の変形例を適用することができる。
(変形例1)
既存モデルが認識エラーを生じる苦手物体が複数ある場合には、以下のいずれかの方法を用いることができる。第1の方法では、それら複数の苦手物体を高精度で認識できる1つの苦手対策モデルを生成し、第1実施形態と同様に、既存モデルと苦手対策モデルの2つのモデルを使用して物体認識を行う。一方、第2の方法では、苦手物体毎に苦手対策モデルを生成し、それらを既存モデルと並列に使用する。例えば、2つの苦手物体A、Bがある場合、物体A用の苦手対策モデルと、物体B用の苦手対策モデルを個別に生成し、それらと既存モデルとを含む3つのモデルを使用して物体認識を行う。
上記の第1実施形態では、物体認識装置は画像に含まれる物体を検知するタスクを行っている。その代わりに、物体認識装置は画像全体が何かを分類するタスクを行うこととしてもよい。その場合、物体認識装置は、各認識部が出力するスコア情報のみを用いて学習を行えばよい。また、その場合の認識エラーは誤認識のみになり、苦手対策モデルは、既存モデルが誤認識した画像を学習する。
次に、本発明の第2実施形態について説明する。図10は、第2実施形態に係る物体認識装置50の機能構成を示すブロック図である。なお、物体認識装置50は、図1に示すハードウェア構成により実現される。
学習済みの第1の認識モデルを用いて、入力画像中の物体を認識する第1の認識手段と、
前記第1の認識モデルによる認識精度が低い物体を認識するように学習された第2の認識モデルを用いて、前記入力画像中の物体を認識する第2の認識手段と、
前記入力画像に基づいて、前記第1の認識手段及び前記第2の認識手段に対する重みを算出する重み付け手段と、
前記重みを用いて、前記第1の認識手段の認識結果と、前記第2の認識手段の認識結果を融合する融合手段と、
を備える物体認識装置。
前記第2の認識モデルは、前記第1の認識モデルによる認識精度が他の物体よりも低い特定の物体を、前記第1の認識モデルよりも高い精度で認識するように学習されたモデルである付記1に記載の物体認識装置。
前記第2の認識モデルは、前記第1の認識モデルが認識エラーを生じた物体の画像を用いて学習されたモデルである付記1又は2に記載の物体認識装置。
前記第2の認識モデルは、前記第1の認識モデルが認識エラーを生じた物体の画像を用いて、前記第1の認識モデルを学習して生成されたモデルである付記1又は2に記載の物体認識装置。
前記第2の認識モデルは、前記第1の認識モデルが認識エラーを生じた物体について、前記第1の認識モデルを過学習させたモデルである付記1又は2に記載の物体認識装置。
前記第1の認識手段及び前記第2の認識手段は、前記入力画像に対して設定される部分領域毎に、予め定めた物体が存在する確からしさを示すスコアを前記認識結果として出力し、
前記重み付け手段は、前記入力画像の複数の部分領域毎に前記第1の認識手段及び前記第2の認識手段に対する重みを算出し、
前記融合手段は、前記重み付け手段が算出した重みで、前記第1の認識手段及び前記第2の認識手段が出力するスコアを前記部分領域毎に融合する付記1乃至5のいずれか一項に記載の物体認識装置。
前記融合手段は、前記第1の認識手段及び前記第2の認識手段が出力するスコアに、前記重み付け手段が算出したそれぞれの認識手段についての重みを乗じて加算した後、平均値を求める付記6に記載の物体認識装置。
学習済みの第1の認識モデルを用いて、入力画像中の物体を認識し、
前記第1の認識モデルによる認識精度が低い物体を認識するように学習された第2の認識モデルを用いて、前記入力画像中の物体を認識し、
前記入力画像に基づいて、前記第1の認識モデル及び前記第2の認識モデルに対する重みを算出し、
前記重みを用いて、前記第1の認識モデルの認識結果と、前記第2の認識モデルの認識結果を融合する物体認識方法。
学習済みの第1の認識モデルを用いて、入力画像中の物体を認識し、
前記第1の認識モデルによる認識精度が低い物体を認識するように学習された第2の認識モデルを用いて、前記入力画像中の物体を認識し、
前記入力画像に基づいて、前記第1の認識モデル及び前記第2の認識モデルに対する重みを算出し、
前記重みを用いて、前記第1の認識モデルの認識結果と、前記第2の認識モデルの認識結果を融合する処理をコンピュータに実行させるプログラムを記録した記録媒体。
11 画像入力部
12 重み付け部
13 第1の認識部
14 第2の認識部
15 融合部
16 パラメータ修正部
17 損失算出部
18 正解ラベル記憶部
19 極大値選択部
51 第1の認識手段
52 第2の認識手段
53 重み付け手段
54 融合手段
Claims (9)
- 学習済みの第1の認識モデルを用いて、入力画像中の物体を認識する第1の認識手段と、
前記第1の認識モデルによる認識精度が低い物体を認識するように学習された第2の認識モデルを用いて、前記入力画像中の物体を認識する第2の認識手段と、
前記入力画像に基づいて、前記第1の認識手段及び前記第2の認識手段に対する重みを算出する重み付け手段と、
前記重みを用いて、前記第1の認識手段の認識結果と、前記第2の認識手段の認識結果を融合する融合手段と、
を備える物体認識装置。 - 前記第2の認識モデルは、前記第1の認識モデルによる認識精度が他の物体よりも低い特定の物体を、前記第1の認識モデルよりも高い精度で認識するように学習されたモデルである請求項1に記載の物体認識装置。
- 前記第2の認識モデルは、前記第1の認識モデルが認識エラーを生じた物体の画像を用いて学習されたモデルである請求項1又は2に記載の物体認識装置。
- 前記第2の認識モデルは、前記第1の認識モデルが認識エラーを生じた物体の画像を用いて、前記第1の認識モデルを学習して生成されたモデルである請求項1又は2に記載の物体認識装置。
- 前記第2の認識モデルは、前記第1の認識モデルが認識エラーを生じた物体について、前記第1の認識モデルを過学習させたモデルである請求項1又は2に記載の物体認識装置。
- 前記第1の認識手段及び前記第2の認識手段は、前記入力画像に対して設定される部分領域毎に、予め定めた物体が存在する確からしさを示すスコアを前記認識結果として出力し、
前記重み付け手段は、前記入力画像の複数の部分領域毎に前記第1の認識手段及び前記第2の認識手段に対する重みを算出し、
前記融合手段は、前記重み付け手段が算出した重みで、前記第1の認識手段及び前記第2の認識手段が出力するスコアを前記部分領域毎に融合する請求項1乃至5のいずれか一項に記載の物体認識装置。 - 前記融合手段は、前記第1の認識手段及び前記第2の認識手段が出力するスコアに、前記重み付け手段が算出したそれぞれの認識手段についての重みを乗じて加算した後、平均値を求める請求項6に記載の物体認識装置。
- 学習済みの第1の認識モデルを用いて、入力画像中の物体を認識し、
前記第1の認識モデルによる認識精度が低い物体を認識するように学習された第2の認識モデルを用いて、前記入力画像中の物体を認識し、
前記入力画像に基づいて、前記第1の認識モデル及び前記第2の認識モデルに対する重みを算出し、
前記重みを用いて、前記第1の認識手段の認識モデルと、前記第2の認識モデルの認識結果を融合する物体認識方法。 - 学習済みの第1の認識モデルを用いて、入力画像中の物体を認識し、
前記第1の認識モデルによる認識精度が低い物体を認識するように学習された第2の認識モデルを用いて、前記入力画像中の物体を認識し、
前記入力画像に基づいて、前記第1の認識モデル及び前記第2の認識モデルに対する重みを算出し、
前記重みを用いて、前記第1の認識手段の認識モデルと、前記第2の認識モデルの認識結果を融合する処理をコンピュータに実行させるプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/013582 WO2021192133A1 (ja) | 2020-03-26 | 2020-03-26 | 物体認識装置、物体認識方法、及び、記録媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2021192133A1 JPWO2021192133A1 (ja) | 2021-09-30 |
JPWO2021192133A5 JPWO2021192133A5 (ja) | 2022-11-22 |
JP7298776B2 true JP7298776B2 (ja) | 2023-06-27 |
Family
ID=77891658
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022510252A Active JP7298776B2 (ja) | 2020-03-26 | 2020-03-26 | 物体認識装置、物体認識方法、及び、プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7298776B2 (ja) |
WO (1) | WO2021192133A1 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010003117A (ja) | 2008-06-20 | 2010-01-07 | Toyota Central R&D Labs Inc | 対象物判定装置及びプログラム |
WO2010050334A1 (ja) | 2008-10-30 | 2010-05-06 | コニカミノルタエムジー株式会社 | 情報処理装置 |
JP2019215755A (ja) | 2018-06-13 | 2019-12-19 | 株式会社デンソーテン | 画像認識装置、画像認識方法、機械学習モデル提供装置、機械学習モデル提供方法、機械学習モデル生成方法、および機械学習モデル装置 |
JP2020008899A (ja) | 2018-07-02 | 2020-01-16 | キヤノン株式会社 | 画像処理装置及び画像処理方法、プログラム、記憶媒体 |
JP2020017229A (ja) | 2018-07-27 | 2020-01-30 | 国立大学法人 東京大学 | 画像処理装置、画像処理方法及び画像処理プログラム |
JP2020024534A (ja) | 2018-08-07 | 2020-02-13 | 日本放送協会 | 画像分類装置及びプログラム |
-
2020
- 2020-03-26 WO PCT/JP2020/013582 patent/WO2021192133A1/ja active Application Filing
- 2020-03-26 JP JP2022510252A patent/JP7298776B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010003117A (ja) | 2008-06-20 | 2010-01-07 | Toyota Central R&D Labs Inc | 対象物判定装置及びプログラム |
WO2010050334A1 (ja) | 2008-10-30 | 2010-05-06 | コニカミノルタエムジー株式会社 | 情報処理装置 |
JP2019215755A (ja) | 2018-06-13 | 2019-12-19 | 株式会社デンソーテン | 画像認識装置、画像認識方法、機械学習モデル提供装置、機械学習モデル提供方法、機械学習モデル生成方法、および機械学習モデル装置 |
JP2020008899A (ja) | 2018-07-02 | 2020-01-16 | キヤノン株式会社 | 画像処理装置及び画像処理方法、プログラム、記憶媒体 |
JP2020017229A (ja) | 2018-07-27 | 2020-01-30 | 国立大学法人 東京大学 | 画像処理装置、画像処理方法及び画像処理プログラム |
JP2020024534A (ja) | 2018-08-07 | 2020-02-13 | 日本放送協会 | 画像分類装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JPWO2021192133A1 (ja) | 2021-09-30 |
WO2021192133A1 (ja) | 2021-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6781415B2 (ja) | ニューラルネットワーク学習装置、方法、プログラム、およびパターン認識装置 | |
JP6889279B2 (ja) | デジタル画像内の物体を検出するためのシステムおよび方法、ならびに物体検出を再スコアリングするためのシステムおよび方法 | |
JP2020061066A (ja) | 学習プログラム、検出プログラム、学習装置、検出装置、学習方法および検出方法 | |
US20210166679A1 (en) | Self-training data selection apparatus, estimation model learning apparatus, self-training data selection method, estimation model learning method, and program | |
JP7353198B2 (ja) | 計算機、識別器の学習方法、および分析システム | |
US20230059265A1 (en) | Computer-readable recording medium storing machine learning program, method of machine learning, and machine learning apparatus | |
JP6258560B2 (ja) | ニューラルネットワークの学習装置及び学習方法 | |
US20240005171A1 (en) | Relearning system and relearning method | |
US20230186118A1 (en) | Computer-readable recording medium storing accuracy estimation program, device, and method | |
US10915799B2 (en) | Image processing apparatus and image recognition apparatus | |
JP7298776B2 (ja) | 物体認識装置、物体認識方法、及び、プログラム | |
JP2020052935A (ja) | 学習済みモデルを生成する方法、データを分類する方法、コンピュータおよびプログラム | |
JP2014174693A (ja) | パターン識別装置、パターン識別方法、プログラム、学習装置および学習方法 | |
JP7348945B2 (ja) | 情報処理方法、および、情報処理システム | |
KR20210158740A (ko) | 기계학습 성능 기반 클러스터링 평가 장치 및 그 방법 | |
JP4997524B2 (ja) | 多変数決定木構築システム、多変数決定木構築方法および多変数決定木を構築するためのプログラム | |
KR102393951B1 (ko) | 객체 중심 데이터 증강 방법 | |
JP7364047B2 (ja) | 学習装置、学習方法、及びプログラム | |
JP7235134B2 (ja) | 物体検知装置、学習方法、及び、プログラム | |
CN114428720A (zh) | 基于p-k的软件缺陷预测方法、装置、电子设备及介质 | |
US20220277552A1 (en) | Object sensing device, learning method, and recording medium | |
KR20220009662A (ko) | 신경망 모델 학습 방법 및 이를 제공하는 장치 | |
JP2023130961A (ja) | 判定プログラム、装置、及び方法 | |
JP7164049B2 (ja) | 物体検知装置、学習方法、及び、プログラム | |
JP2023132304A (ja) | 情報処理プログラム、装置、及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220916 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220916 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230516 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230529 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7298776 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |