JP7086878B2 - 学習装置、学習方法、プログラムおよび認識装置 - Google Patents
学習装置、学習方法、プログラムおよび認識装置 Download PDFInfo
- Publication number
- JP7086878B2 JP7086878B2 JP2019028606A JP2019028606A JP7086878B2 JP 7086878 B2 JP7086878 B2 JP 7086878B2 JP 2019028606 A JP2019028606 A JP 2019028606A JP 2019028606 A JP2019028606 A JP 2019028606A JP 7086878 B2 JP7086878 B2 JP 7086878B2
- Authority
- JP
- Japan
- Prior art keywords
- loss
- neural network
- learning
- data
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Description
第1の実施形態にかかる学習装置は、訓練データとして、入力画像、認識対象を表すラベル(対象ラベル)、および、対象領域を用意し、入力画像から、認識対象を含まない画像と、認識対象を含む画像を生成する。そして本実施形態にかかる学習装置は、認識対象を含まない画像の認識率が低く、認識対象を含む画像の認識率が高いほど値が小さくなるロス関数により、ニューラルネットワークのパラメータを最適化する。対象領域は、入力画像の領域のうち認識対象が含まれる領域を表す。
yAi=f(xAi) ・・・(1)
yBi=f(xBi) ・・・(2)
LA=Σi(ti T・yAi) ・・・(3)
LA=Σi(exp(-(ti・(yBi-yAi)))) ・・・(4)
LB=-Σi(ti Tln(yAi)) ・・・(5)
第2の実施形態にかかる学習装置は、ニューラルネットワークによる認識に寄与した領域を示すデータ(注目度データ)を用いて学習を行う。
yDi=f(xi) ・・・(6)
LD=-Σi(ti Tln(yDi)) ・・・(7)
si=g(w、xi、ti) ・・・(8)
LC=Σi(d(mi、si)) ・・・(9)
第1の実施形態で用いるロスは、上記に限られるものではない。例えば、ロスAのみを用いて学習が実行されてもよい。また、ロスBの代わりに第2の実施形態で用いたロスCまたはロスDを用いてもよい。すなわち、ロスAとロスCとの組み合わせ、または、ロスAとロスDとの組み合わせを用いて学習が実行されてもよい。さらに、ロスA、ロスB、および、ロスCの組み合わせ、ロスA、ロスD、および、ロスCの組み合わせ、または、ロスA、ロスB、ロスC、および、ロスDの組み合わせを用いて学習が実行されてもよい。
第2の実施形態で用いるロスは、上記に限られるものではない。例えば、ロスCのみを用いて学習が実行されてもよい。また、ロスDの代わりに第1の実施形態で用いたロスBを用いてもよい。すなわち、ロスCとロスBとを用いて学習が実行されてもよい。また、ロスC、ロスB、および、ロスDの組み合わせを用いて学習が実行されてもよい。
上記実施形態では、対象領域を含む訓練データを使用する。すべての訓練データについて対象領域を指定できない場合は、一部の訓練データについて対象領域を指定し、対象領域が指定された訓練データのみに対して上記実施形態の手法を適用してもよい。
変形例3のように対象領域が指定されていない訓練データが存在する場合に、対象領域を指定させるための情報を提示する機能を備えるように構成してもよい。例えば学習装置は、ニューラルネットワークの学習を終えた後、対象領域が付与されていない訓練データについて、入力画像、対象ラベル、注目度画像、および、ニューラルネットワークの出力などの情報を学習装置の操作者に提示する。操作者は、提示された情報を参照して、対象領域を指定することができる。学習装置は、このようにして対象領域が新たに指定された訓練データを用いて、再度学習を実行することができる。このような構成により、効率的に訓練データを拡張し、ニューラルネットワークの認識率を向上させることができる。
第3の実施形態では、第1の実施形態の学習装置100で学習したニューラルネットワークを用いて認識処理を実行する認識装置を備える情報処理システムについて説明する。
101 取得部
102、102-2 生成部
103、103-2 ロス算出部
104、104-2 学習部
105 出力制御部
121 記憶部
200 認識装置
201 通信制御部
202 取得部
203 認識部
204 出力制御部
221 記憶部
300 ネットワーク
Claims (10)
- 入力データと、認識対象を表すラベルと、前記入力データ内の前記認識対象が含まれる対象領域と、を取得する取得部と、
前記入力データおよび前記対象領域に基づいて、前記認識対象の少なくとも一部を含まない第1データを生成する生成部と、
前記第1データをニューラルネットワークに入力したときの前記ニューラルネットワークの出力に基づく値と、前記ラベルと、が一致する度合いが小さいほど値が小さくなる第1ロスを算出するロス算出部と、
前記第1ロスに基づいて前記ニューラルネットワークを学習する学習部と、
を備える学習装置。 - 前記生成部は、さらに、前記認識対象の少なくとも一部を含み、前記第1データとは異なる第2データを生成し、
前記ロス算出部は、さらに、前記第2データを前記ニューラルネットワークに入力したときの前記ニューラルネットワークの出力と、前記ラベルと、が一致する度合いが大きいほど値が小さくなる第2ロスを算出し、
前記学習部は、前記第1ロスおよび前記第2ロスに基づいて前記ニューラルネットワークを学習する、
請求項1に記載の学習装置。 - 前記ロス算出部は、前記第1データをニューラルネットワークに入力したときの前記ニューラルネットワークの第1出力に対する、前記第2データを前記ニューラルネットワークに入力したときの前記ニューラルネットワークの第2出力の相対値と、前記ラベルと、が一致する度合いが小さいほど値が小さくなる第1ロスを算出する、
請求項2に記載の学習装置。 - 前記ロス算出部は、さらに、前記入力データを前記ニューラルネットワークに入力したときの前記ニューラルネットワークの出力と、前記ラベルと、が一致する度合いが大きいほど値が小さくなる第2ロスを算出し、
前記学習部は、前記第1ロスおよび前記第2ロスに基づいて前記ニューラルネットワークを学習する、
請求項1に記載の学習装置。 - 前記生成部は、さらに、前記入力データをニューラルネットワークに入力したときの前記入力データの認識に寄与した領域を示す注目度データを生成し、
前記ロス算出部は、さらに、前記注目度データと前記対象領域との誤差が小さいほど値が小さくなる第2ロスを算出し、
前記学習部は、前記第1ロスおよび前記第2ロスに基づいて前記ニューラルネットワークを学習する、
請求項1に記載の学習装置。 - 前記ロス算出部は、さらに、前記入力データを前記ニューラルネットワークに入力したときの前記ニューラルネットワークの出力と、前記ラベルと、が一致する度合いが大きいほど値が小さくなる第3ロスを算出し、
前記学習部は、前記第1ロス、前記第2ロスおよび前記第3ロスに基づいて前記ニューラルネットワークを学習する、
請求項5に記載の学習装置。 - 前記生成部は、さらに、前記認識対象の少なくとも一部を含む第2データを生成し、
前記ロス算出部は、さらに、前記第2データを前記ニューラルネットワークに入力したときの前記ニューラルネットワークの出力と、前記ラベルと、が一致する度合いが大きいほど値が小さくなる第3ロスを算出し、
前記学習部は、前記第1ロス、前記第2ロスおよび前記第3ロスに基づいて前記ニューラルネットワークを学習する、
請求項5に記載の学習装置。 - 学習装置が備えるコンピュータで実行される学習方法であって、
前記コンピュータが、入力データと、認識対象を表すラベルと、前記入力データ内の前記認識対象が含まれる対象領域と、を取得する取得ステップと、
前記コンピュータが、前記入力データおよび前記対象領域に基づいて、前記認識対象の少なくとも一部を含まない第1データを生成する生成ステップと、
前記コンピュータが、前記第1データをニューラルネットワークに入力したときの前記ニューラルネットワークの出力に基づく値と、前記ラベルと、が一致する度合いが小さいほど値が小さくなる第1ロスを算出するロス算出ステップと、
前記コンピュータが、前記第1ロスに基づいて前記ニューラルネットワークを学習する学習ステップと、
を含む学習方法。 - コンピュータを、
入力データと、認識対象を表すラベルと、前記入力データ内の前記認識対象が含まれる対象領域と、を取得する取得部と、
前記入力データおよび前記対象領域に基づいて、前記認識対象の少なくとも一部を含まない第1データを生成する生成部と、
前記第1データをニューラルネットワークに入力したときの前記ニューラルネットワークの出力に基づく値と、前記ラベルと、が一致する度合いが小さいほど値が小さくなる第1ロスを算出するロス算出部と、
前記第1ロスに基づいて前記ニューラルネットワークを学習する学習部と、
として機能させるためのプログラム。 - 請求項1に記載の学習装置により学習された前記ニューラルネットワークを用いて、入力データの認識を実行する認識部と、
前記認識部による認識結果を出力する出力制御部と、
を備える認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019028606A JP7086878B2 (ja) | 2019-02-20 | 2019-02-20 | 学習装置、学習方法、プログラムおよび認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019028606A JP7086878B2 (ja) | 2019-02-20 | 2019-02-20 | 学習装置、学習方法、プログラムおよび認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020135465A JP2020135465A (ja) | 2020-08-31 |
JP7086878B2 true JP7086878B2 (ja) | 2022-06-20 |
Family
ID=72263195
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019028606A Active JP7086878B2 (ja) | 2019-02-20 | 2019-02-20 | 学習装置、学習方法、プログラムおよび認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7086878B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7106486B2 (ja) | 2019-04-22 | 2022-07-26 | 株式会社東芝 | 学習装置、学習方法、プログラムおよび情報処理システム |
JP7055769B2 (ja) | 2019-04-23 | 2022-04-18 | 株式会社東芝 | データ生成装置、データ生成方法およびプログラム |
US20220172064A1 (en) * | 2020-12-02 | 2022-06-02 | Htc Corporation | Machine learning method and machine learning device for eliminating spurious correlation |
WO2022185432A1 (ja) * | 2021-03-03 | 2022-09-09 | Heroz株式会社 | 画像認識学習システム、画像認識学習方法、画像認識学習プログラム、画像認識機械学習器、および画像認識システム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105809704A (zh) | 2016-03-30 | 2016-07-27 | 北京小米移动软件有限公司 | 识别图像清晰度的方法及装置 |
US20180129906A1 (en) | 2016-11-07 | 2018-05-10 | Qualcomm Incorporated | Deep cross-correlation learning for object tracking |
CN108765423A (zh) | 2018-06-20 | 2018-11-06 | 北京七鑫易维信息技术有限公司 | 一种卷积神经网络训练方法及装置 |
JP2018173814A (ja) | 2017-03-31 | 2018-11-08 | 富士通株式会社 | 画像処理装置、画像処理方法、画像処理プログラム、及び教師データ生成方法 |
CN109002787A (zh) | 2018-07-09 | 2018-12-14 | Oppo广东移动通信有限公司 | 图像处理方法和装置、存储介质、电子设备 |
WO2018232388A1 (en) | 2017-06-16 | 2018-12-20 | Rensselaer Polytechnic Institute | Systems and methods for integrating tomographic image reconstruction and radiomics using neural networks |
-
2019
- 2019-02-20 JP JP2019028606A patent/JP7086878B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105809704A (zh) | 2016-03-30 | 2016-07-27 | 北京小米移动软件有限公司 | 识别图像清晰度的方法及装置 |
US20180129906A1 (en) | 2016-11-07 | 2018-05-10 | Qualcomm Incorporated | Deep cross-correlation learning for object tracking |
JP2018173814A (ja) | 2017-03-31 | 2018-11-08 | 富士通株式会社 | 画像処理装置、画像処理方法、画像処理プログラム、及び教師データ生成方法 |
WO2018232388A1 (en) | 2017-06-16 | 2018-12-20 | Rensselaer Polytechnic Institute | Systems and methods for integrating tomographic image reconstruction and radiomics using neural networks |
CN108765423A (zh) | 2018-06-20 | 2018-11-06 | 北京七鑫易维信息技术有限公司 | 一种卷积神经网络训练方法及装置 |
CN109002787A (zh) | 2018-07-09 | 2018-12-14 | Oppo广东移动通信有限公司 | 图像处理方法和装置、存储介质、电子设备 |
Also Published As
Publication number | Publication date |
---|---|
JP2020135465A (ja) | 2020-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7086878B2 (ja) | 学習装置、学習方法、プログラムおよび認識装置 | |
JP6807471B2 (ja) | セマンティックセグメンテーションモデルの訓練方法および装置、電子機器、ならびに記憶媒体 | |
CN110222787B (zh) | 多尺度目标检测方法、装置、计算机设备及存储介质 | |
JP6798183B2 (ja) | 画像解析装置、画像解析方法およびプログラム | |
KR102521544B1 (ko) | 디노이징 네트워크의 학습 방법, 및 이미지 처리 방법 및 그 장치 방법 | |
JP2017059207A (ja) | 画像認識方法 | |
JP2012032370A (ja) | 欠陥検出方法、欠陥検出装置、学習方法、プログラム、及び記録媒体 | |
JP2017211939A (ja) | 生成装置、生成方法、及び生成プログラム | |
WO2018207334A1 (ja) | 画像認識装置、画像認識方法および画像認識プログラム | |
WO2009152509A1 (en) | Method and system for crowd segmentation | |
JP7055769B2 (ja) | データ生成装置、データ生成方法およびプログラム | |
US11640530B2 (en) | Learning device, learning method, computer program product, and recognition device | |
CN113706558A (zh) | 图像分割方法、装置及计算机设备 | |
JP7176616B2 (ja) | 画像処理システム、画像処理装置、画像処理方法、及び画像処理プログラム | |
JP2012234466A (ja) | 状態追跡装置、方法、及びプログラム | |
JP2020080047A (ja) | 学習装置、推定装置、学習方法およびプログラム | |
JP7472471B2 (ja) | 推定システム、推定装置および推定方法 | |
JP2018022332A (ja) | 判定装置、判定方法、及び判定プログラム | |
JP2018005405A (ja) | 情報処理装置および情報処理方法 | |
JP2023017091A (ja) | 推定装置、推定方法及びプログラム | |
KR20230111010A (ko) | 관절 예측을 위한 학습 데이터 생성 방법 및 장치 | |
KR20230049969A (ko) | 글로벌 측위 장치 및 방법 | |
US20230196752A1 (en) | Information processing apparatus, information processing method, and non-transitory computer-readable storage medium | |
JP2021056928A (ja) | 最適解獲得プログラム、最適解獲得方法および情報処理装置 | |
JP7135517B2 (ja) | 三次元形状モデル生成装置、三次元モデル生成方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200826 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210921 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20211122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211217 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220510 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220608 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7086878 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |