JP2021051589A5 - - Google Patents

Download PDF

Info

Publication number
JP2021051589A5
JP2021051589A5 JP2019174542A JP2019174542A JP2021051589A5 JP 2021051589 A5 JP2021051589 A5 JP 2021051589A5 JP 2019174542 A JP2019174542 A JP 2019174542A JP 2019174542 A JP2019174542 A JP 2019174542A JP 2021051589 A5 JP2021051589 A5 JP 2021051589A5
Authority
JP
Japan
Prior art keywords
information processing
learning
neural network
hierarchical neural
learning data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019174542A
Other languages
English (en)
Other versions
JP2021051589A (ja
JP7453767B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2019174542A priority Critical patent/JP7453767B2/ja
Priority claimed from JP2019174542A external-priority patent/JP7453767B2/ja
Priority to US17/029,164 priority patent/US20210089823A1/en
Publication of JP2021051589A publication Critical patent/JP2021051589A/ja
Publication of JP2021051589A5 publication Critical patent/JP2021051589A5/ja
Application granted granted Critical
Publication of JP7453767B2 publication Critical patent/JP7453767B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

次に、DNNを用いて分類タスクを行うニューラルネットワーク処理装置の機能構成例について、図1のブロック図を用いて説明する。学習データ群110は、学習画像と、該学習画像に含まれるオブジェクトが属するクラスを表す文字列である正解クラスラベルと、のペアを複数含むデータセットであり、分類タスクのためのデータセットである。初期DNNモデル120は、予め学習データ群110を用いて学習されたDNNモデルである。分類タスクを行う初期DNNモデル120の一例を図7(a)に示す。図7(a)に示す初期DNNモデル120は、96画素×96画素のRGB画像(Rプレーン、Gブレーン、プレーンの3プレーンを有する)を入力とし、2つの畳み込み層と3つの全結合層を通して3つのクラスのいずれかに分類するDNNモデルである。最後の畳み込み層から出力される9216×1のテンソル(1次元ベクトル)が初期DNNモデル120におけるCNN特徴量となる。なお、本実施形態に適用可能なDNNの構造はこのような構造に限らず、他の構造を採用しても良い。探索部1100は、初期DNNモデル120で誤分類(誤分類b)された学習データを探索する。更新部1200は、探索部1100による探索結果に基づき、困難事例を検出する困難事例検出タスクを実施可能なネットワーク構造を初期DNNモデル120に追加した新しい構造のDNNモデルを生成する。学習処理部1300は、更新部1200によって更新された新しいネットワーク構造を有するDNNモデルの学習処理を行う。
互いの間のCNN特徴量類似度が閾値以上となる学習データ群を構成するそれぞれの学習データの正解クラスラベルが互いに異なる場合、現状のCNN特徴量でこれらの学習データを分離することはできず、これは上記の誤分類aに属する誤分類パターンとなる。
物体領域検出タスクを行う初期DNNモデル120の一例を図9(a)に示す。図9(a)に示す初期DNNモデル120は、96画素×96画素のRGB画像(Rプレーン、Gブレーン、プレーンの3プレーンを有する)を入力とし、2つの畳み込み層(Conv1、Conv2)と2つの逆畳み込み層(Deconv1、Deconv2)を通して96画素×96画素の1chの推定マップを出力するニューラルネットワークモデルである。なお、本実施形態に適用可能なDNNの構造はこのような構造に限らず、他の構造を採用しても良い。
図9(a)に示す構造を有する初期DNNモデル120を更新部1200によって更新した更新後の初期DNNモデル120(更新DNNモデル)の構造の一例を図9(b)に示す。ここで示すのは分類困難な領域の種類が1パターン、すなわち分類困難ラベルが1種類の時の構造である。便宜上、初期DNNモデル120の2つの畳み込み層をそれぞれConv1層、Conv2層、2つの逆畳み込み層をDeconv1層、Deconv2層と称する。Conv1層は96画素×96画素のRGB画像(Rプレーン、Gブレーン、プレーンの3プレーンを有する)を入力とし、48×48×32chの3次元テンソルを出力する。Conv2層はConv1層の出力を入力として24×24×64chの3次元テンソルを出力する。Deconv1層はConv2層の出力を入力として48×48×32chの3次元テンソルを出力し、Deconv2層はDeconv1層の出力を入力として96×96×1chの推定検出マップを出力する。ステップS202における困難事例探索処理に用いたCNN特徴量としてConv2層の出力である24×24×64chの3次元テンソルを用いたとき、ステップS203のネットワーク構造更新処理によって初期DNNモデル120のネットワーク構造にDeconv1’層、Deconv2’層が追加される。Deconv1’層はConv2層の出力である24×24×64chの3次元テンソルを入力として48×48×32chの3次元テンソルを出力する。Deconv2’層はDeconv1’層の出力を入力として「未検出事例を検出した推定マップ」もしくは「誤検出事例を検出した推定マップ」を出力する。更にステップS203では、Deconv1層の出力である3次元テンソルとDeconv1’層の出力である3次元テンソルを加算する構造が初期DNNモデル120のネットワーク構造に追加される。なお、追加する1つ以上の層の構成はこれに限定するものではなく、任意の構造を追加することが可能である。

Claims (11)

  1. 学習データ群を用いて学習した階層型ニューラルネットワークにおいて誤った結果を出力する学習データを困難事例データに設定する設定手段と、
    前記困難事例データを検出する層を前記階層型ニューラルネットワークに追加した更新階層型ニューラルネットワークを生成する更新手段と、
    前記学習データ群を用いて前記更新階層型ニューラルネットワークの学習処理を行う学習手段と
    を備えることを特徴とする情報処理装置。
  2. 前記設定手段は、
    前記階層型ニューラルネットワークにおいて誤った結果を出力する学習データについて該階層型ニューラルネットワークの中間層から得られる特徴量を取得し、該取得した特徴量間の類似度に基づいて前記設定を行うことを特徴とする請求項1に記載の情報処理装置。
  3. 前記設定手段は、
    前記階層型ニューラルネットワークにおいて誤った結果を出力する学習データのうち、前記類似度が閾値以上となる学習データを困難事例データに設定することを特徴とする請求項2に記載の情報処理装置。
  4. 前記設定手段は、
    前記階層型ニューラルネットワークにおいて正解を出力する学習データについて該階層型ニューラルネットワークの中間層から得られる特徴量を取得し、該学習データのうち、前記困難事例データの特徴量との類似度が閾値以上となる特徴量の学習データを困難事例データに設定することを特徴とする請求項1乃至3の何れか1項に記載の情報処理装置。
  5. 前記学習手段は、前記学習処理では、前記層における損失に基づいて、前記層および該層以降の層における重み係数を更新することを特徴とする請求項1乃至4の何れか1項に記載の情報処理装置。
  6. 前記設定手段は前記困難事例データをユーザに提示することを特徴とする請求項1乃至5の何れか1項に記載の情報処理装置。
  7. 更に、
    前記学習データ群に新たな学習画像を追加する追加手段を備え、
    前記設定手段は、前記新たな学習画像のうち前記階層型ニューラルネットワークにおいて誤った結果を出力する学習データを困難事例データに設定することを特徴とする請求項1乃至6の何れか1項に記載の情報処理装置。
  8. 前記誤った結果は、オブジェクトの誤分類であることを特徴とする請求項1乃至7の何れか1項に記載の情報処理装置。
  9. 前記誤った結果は、オブジェクトの未検出もしくは誤検出であることを特徴とする請求項1乃至7の何れか1項に記載の情報処理装置。
  10. 情報処理装置が行う情報処理方法であって、
    前記情報処理装置の設定手段が、学習データ群を用いて学習した階層型ニューラルネットワークにおいて誤った結果を出力する学習データを困難事例データに設定する設定工程と、
    前記情報処理装置の更新手段が、前記困難事例データを検出する層を前記階層型ニューラルネットワークに追加した更新階層型ニューラルネットワークを生成する更新工程と、
    前記情報処理装置の学習手段が、前記学習データ群を用いて前記更新階層型ニューラルネットワークの学習処理を行う学習工程と
    を備えることを特徴とする情報処理方法。
  11. コンピュータを、請求項1乃至9の何れか1項に記載の情報処理装置の各手段として機能させるためのコンピュータプログラム。
JP2019174542A 2019-09-25 2019-09-25 情報処理装置、情報処理方法 Active JP7453767B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019174542A JP7453767B2 (ja) 2019-09-25 2019-09-25 情報処理装置、情報処理方法
US17/029,164 US20210089823A1 (en) 2019-09-25 2020-09-23 Information processing device, information processing method, and non-transitory computer-readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019174542A JP7453767B2 (ja) 2019-09-25 2019-09-25 情報処理装置、情報処理方法

Publications (3)

Publication Number Publication Date
JP2021051589A JP2021051589A (ja) 2021-04-01
JP2021051589A5 true JP2021051589A5 (ja) 2022-10-04
JP7453767B2 JP7453767B2 (ja) 2024-03-21

Family

ID=74881018

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019174542A Active JP7453767B2 (ja) 2019-09-25 2019-09-25 情報処理装置、情報処理方法

Country Status (2)

Country Link
US (1) US20210089823A1 (ja)
JP (1) JP7453767B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111044525B (zh) * 2019-12-30 2021-10-29 歌尔股份有限公司 一种产品缺陷检测方法、装置与系统
WO2023007859A1 (ja) * 2021-07-27 2023-02-02 ソニーグループ株式会社 情報処理装置、情報処理方法及びコンピュータプログラム
KR20230043318A (ko) * 2021-09-24 2023-03-31 삼성전자주식회사 영상 내 객체를 분류하는 객체 분류 방법 및 장치

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5123759B2 (ja) 2008-06-30 2013-01-23 キヤノン株式会社 パターン検出器の学習装置、学習方法及びプログラム
CN103679185B (zh) 2012-08-31 2017-06-16 富士通株式会社 卷积神经网络分类器系统、其训练方法、分类方法和用途
JP2016006626A (ja) * 2014-05-28 2016-01-14 株式会社デンソーアイティーラボラトリ 検知装置、検知プログラム、検知方法、車両、パラメータ算出装置、パラメータ算出プログラムおよびパラメータ算出方法
JP2016057918A (ja) * 2014-09-10 2016-04-21 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
JP6258560B2 (ja) 2015-05-27 2018-01-10 株式会社日立製作所 ニューラルネットワークの学習装置及び学習方法
WO2017055412A1 (en) * 2015-09-30 2017-04-06 Siemens Healthcare Gmbh Method and system for classification of endoscopic images using deep decision networks
US10002313B2 (en) * 2015-12-15 2018-06-19 Sighthound, Inc. Deeply learned convolutional neural networks (CNNS) for object localization and classification
JP6983800B2 (ja) * 2016-03-15 2021-12-17 イムラ ウーロプ ソシエテ・パ・アクシオンス・シンプリフィエ ニューラルネットワークにおける強化学習によるユニーク/希少なケースの分類のための方法
JP6832504B2 (ja) * 2016-08-08 2021-02-24 パナソニックIpマネジメント株式会社 物体追跡方法、物体追跡装置およびプログラム
US9947102B2 (en) * 2016-08-26 2018-04-17 Elekta, Inc. Image segmentation using neural network method
US20180075368A1 (en) * 2016-09-12 2018-03-15 International Business Machines Corporation System and Method of Advising Human Verification of Often-Confused Class Predictions
CN106446148B (zh) * 2016-09-21 2019-08-09 中国运载火箭技术研究院 一种基于聚类的文本查重方法
US10664722B1 (en) * 2016-10-05 2020-05-26 Digimarc Corporation Image processing arrangements
US10303979B2 (en) * 2016-11-16 2019-05-28 Phenomic Ai Inc. System and method for classifying and segmenting microscopy images with deep multiple instance learning
US10242443B2 (en) * 2016-11-23 2019-03-26 General Electric Company Deep learning medical systems and methods for medical procedures
US10181082B2 (en) * 2017-02-06 2019-01-15 Brown University Method and system for automated behavior classification of test subjects
CA3056498A1 (en) * 2017-03-14 2018-09-20 University Of Manitoba Structure defect detection using machine learning algorithms
US11417082B2 (en) * 2017-06-16 2022-08-16 Markable, Inc. Image processing system
JP7149692B2 (ja) * 2017-08-09 2022-10-07 キヤノン株式会社 画像処理装置、画像処理方法
JP6844564B2 (ja) 2018-03-14 2021-03-17 オムロン株式会社 検査システム、識別システム、及び学習データ生成装置
US11010902B2 (en) * 2018-06-04 2021-05-18 University Of Central Florida Research Foundation, Inc. Capsules for image analysis
US11587555B1 (en) * 2018-09-26 2023-02-21 Verily Life Sciences Llc Recognizing hazard events based on sounds of in-home activities
US11055566B1 (en) * 2020-03-12 2021-07-06 Adobe Inc. Utilizing a large-scale object detector to automatically select objects in digital images

Similar Documents

Publication Publication Date Title
US11367271B2 (en) Similarity propagation for one-shot and few-shot image segmentation
US10936911B2 (en) Logo detection
US10650508B2 (en) Automatic defect classification without sampling and feature selection
CN106570453B (zh) 用于行人检测的方法、装置和系统
WO2019100723A1 (zh) 训练多标签分类模型的方法和装置
US9002101B2 (en) Recognition device, recognition method, and computer program product
EP3069302B1 (en) Memory facilitation using directed acyclic graphs
JP2018097807A (ja) 学習装置
JP2007128195A (ja) 画像処理システム
JP2021051589A5 (ja)
TWI701608B (zh) 用於圖片匹配定位的神經網路系統、方法及裝置
JP6997369B2 (ja) プログラム、測距方法、及び測距装置
JP6612486B1 (ja) 学習装置、分類装置、学習方法、分類方法、学習プログラム、及び分類プログラム
CN114677565B (zh) 特征提取网络的训练方法和图像处理方法、装置
KR102370910B1 (ko) 딥러닝 기반 소수 샷 이미지 분류 장치 및 방법
JP6107531B2 (ja) 特徴抽出プログラム及び情報処理装置
US11301723B2 (en) Data generation device, data generation method, and computer program product
Yigitbasi et al. Edge detection using artificial bee colony algorithm (ABC)
US20210089823A1 (en) Information processing device, information processing method, and non-transitory computer-readable storage medium
CN112651418B (zh) 数据分类方法、分类器训练方法及系统
CN112364916A (zh) 基于迁移学习的图像分类方法、相关设备及存储介质
US10580127B2 (en) Model generation apparatus, evaluation apparatus, model generation method, evaluation method, and storage medium
US20240071056A1 (en) Percentile-based pseudo-label selection for multi-label semi-supervised classification
CN112189217A (zh) 使用深区域生长来分割图像中的不规则形状
KR20180082680A (ko) 분류기를 학습시키는 방법 및 이를 이용한 예측 분류 장치