JP7221892B2 - 学習装置、学習方法、および学習プログラム - Google Patents
学習装置、学習方法、および学習プログラム Download PDFInfo
- Publication number
- JP7221892B2 JP7221892B2 JP2020021893A JP2020021893A JP7221892B2 JP 7221892 B2 JP7221892 B2 JP 7221892B2 JP 2020021893 A JP2020021893 A JP 2020021893A JP 2020021893 A JP2020021893 A JP 2020021893A JP 7221892 B2 JP7221892 B2 JP 7221892B2
- Authority
- JP
- Japan
- Prior art keywords
- target data
- loss
- latent vector
- learning
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 43
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 239000013598 vector Substances 0.000 claims description 152
- 238000004364 calculation method Methods 0.000 claims description 75
- 230000006870 function Effects 0.000 claims description 6
- 230000007423 decrease Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 16
- 239000010755 BS 2869 Class G Substances 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 7
- 238000007796 conventional method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 240000006829 Ficus sundaica Species 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000007689 inspection Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
- G06V10/763—Non-hierarchical techniques, e.g. based on statistics of modelling distributions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2132—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
- G06F18/2193—Validation; Performance evaluation; Active pattern learning techniques based on specific statistical tests
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Description
20B 取得部
20C 潜在ベクトル算出部
20D 第1確率算出部
20E 第1損失算出部
20F 第2損失算出部
20G 更新部
20H 分類部
Claims (12)
- 対象データから前記対象データの潜在空間上の特徴を示す潜在ベクトルを出力する学習モデルのパラメータを用いて、分類対象の前記対象データである複数の第1対象データの各々の前記潜在ベクトルを算出する潜在ベクトル算出部と、
複数の前記第1対象データが互いに異なる仮想クラスに属すると仮定し、複数の前記第1対象データの各々ごとに、複数の前記仮想クラスの各々に属する第1確率を算出する第1確率算出部と、
複数の前記第1対象データの各々ごとに、前記第1確率の第1損失を算出する第1損失算出部と、
複数の前記第1対象データの各々に含まれる複数の要素の各々が属する要素クラスの各々ごとに、他の前記要素クラスとの関係性が低いほど低い第2損失を算出する第2損失算出部と、
前記第1損失および前記第2損失が低くなるように前記パラメータを更新する更新部と、
を備える学習装置。 - 前記第1損失算出部は、前記第1確率を用いて、複数の前記第1対象データが各々の属する前記仮想クラスに分類されるほど低くなる、前記第1損失を算出する、
請求項1または請求項2に記載の学習装置。 - 前記パラメータを更新された前記学習モデルを用いて算出された、複数の前記第1対象データの各々の前記潜在ベクトルに基づいて、複数の前記第1対象データの各々を複数のクラスタに分類する分類部、
を備える請求項1~請求項3の何れか1項に記載の学習装置。 - 前記分類部は、
複数の前記第1対象データの各々の前記潜在ベクトル間の距離および類似度の少なくとも一方を用いて、複数の前記第1対象データの各々を複数の前記クラスタに分類する、
請求項4に記載の学習装置。 - 前記分類部は、
前記パラメータを更新された前記学習モデルを用いて算出された、複数の前記第1対象データの各々の前記潜在ベクトルに基づいて、
複数の前記第1対象データの内の特定の前記第1対象データに類似する他の前記第1対象データを検索する、
請求項4または請求項5の何れか1項に記載の学習装置。 - 前記分類部は、
前記パラメータを更新された前記学習モデルを用いて算出された、複数の前記第1対象データの各々の前記潜在ベクトルの、複数の前記クラスタの各々ごとの分類統計値と、
該学習モデルを用いて算出された、前記第1対象データ以外の他の前記対象データである第2対象データの前記潜在ベクトルと、
に基づいて、前記第2対象データを複数の前記クラスタの何れかに分類する、
請求項4~請求項6の何れか1項に記載の学習装置。 - 前記分類部は、
前記パラメータを更新された前記学習モデルを用いて算出された、前記第1対象データの前記潜在ベクトルと、
該学習モデルを用いて算出された、前記第1対象データ以外の他の前記対象データである第2対象データの前記潜在ベクトルと、
に基づいて、前記第2対象データを複数の前記クラスタの何れかに分類する、
請求項4~請求項6の何れか1項に記載の学習装置。 - 前記分類部は、
前記パラメータを更新された前記学習モデルを用いて算出された、前記第1対象データ以外の他の前記対象データである、複数の第2対象データの各々の前記潜在ベクトルに基づいて、
複数の前記第2対象データの内の特定の前記第2対象データに類似する、他の前記第2対象データを検索する、
請求項4~請求項8の何れか1項に記載の学習装置。 - 前記第1確率算出部は、
1つの前記第1対象データが自身の前記仮想クラスに属する前記第1確率と、該第1対象データが該仮想クラス以外の他の前記仮想クラスに属する前記第1確率と、の差を所定範囲とするための変数を含む関数を用いて、前記第1対象データの第1確率を算出する、
請求項1~請求項9の何れか1項に記載の学習装置。 - コンピュータが実行する学習方法であって、
対象データから前記対象データの潜在空間上の特徴を示す潜在ベクトルを出力する学習モデルのパラメータを用いて、分類対象の前記対象データである複数の第1対象データの各々の前記潜在ベクトルを算出するステップと、
複数の前記第1対象データが互いに異なる仮想クラスに属すると仮定し、複数の前記第1対象データの各々ごとに、複数の前記仮想クラスの各々に属する第1確率を算出するステップと、
複数の前記第1対象データの各々ごとに、前記第1確率の第1損失を算出するステップと、
複数の前記第1対象データの各々に含まれる複数の要素の各々が属する要素クラスの各々ごとに、他の前記要素クラスとの関係性が低いほど低い第2損失を算出するステップと、
前記第1損失および前記第2損失が低くなるように前記パラメータを更新するステップと、
を含む学習方法。 - 対象データから前記対象データの潜在空間上の特徴を示す潜在ベクトルを出力する学習モデルのパラメータを用いて、分類対象の前記対象データである複数の第1対象データの各々の前記潜在ベクトルを算出するステップと、
複数の前記第1対象データが互いに異なる仮想クラスに属すると仮定し、複数の前記第1対象データの各々ごとに、複数の前記仮想クラスの各々に属する第1確率を算出するステップと、
複数の前記第1対象データの各々ごとに、前記第1確率の第1損失を算出するステップと、
複数の前記第1対象データの各々に含まれる複数の要素の各々が属する要素クラスの各々ごとに、他の前記要素クラスとの関係性が低いほど低い第2損失を算出するステップと、
前記第1損失および前記第2損失が低くなるように前記パラメータを更新するステップと、
をコンピュータに実行させるための学習プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020021893A JP7221892B2 (ja) | 2020-02-12 | 2020-02-12 | 学習装置、学習方法、および学習プログラム |
US17/000,535 US12033370B2 (en) | 2020-02-12 | 2020-08-24 | Learning device, learning method, and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020021893A JP7221892B2 (ja) | 2020-02-12 | 2020-02-12 | 学習装置、学習方法、および学習プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021128474A JP2021128474A (ja) | 2021-09-02 |
JP7221892B2 true JP7221892B2 (ja) | 2023-02-14 |
Family
ID=77177096
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020021893A Active JP7221892B2 (ja) | 2020-02-12 | 2020-02-12 | 学習装置、学習方法、および学習プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US12033370B2 (ja) |
JP (1) | JP7221892B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011086643A1 (ja) | 2010-01-14 | 2011-07-21 | 日本電気株式会社 | パターン認識装置、パターン認識方法及びパターン認識用プログラム |
US20200027002A1 (en) | 2018-07-20 | 2020-01-23 | Google Llc | Category learning neural networks |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10922793B2 (en) * | 2018-05-16 | 2021-02-16 | Nvidia Corporation | Guided hallucination for missing image content using a neural network |
-
2020
- 2020-02-12 JP JP2020021893A patent/JP7221892B2/ja active Active
- 2020-08-24 US US17/000,535 patent/US12033370B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011086643A1 (ja) | 2010-01-14 | 2011-07-21 | 日本電気株式会社 | パターン認識装置、パターン認識方法及びパターン認識用プログラム |
US20200027002A1 (en) | 2018-07-20 | 2020-01-23 | Google Llc | Category learning neural networks |
Non-Patent Citations (1)
Title |
---|
WU, Zhirong, et al.,Unsupervised Feature Learning via Non-Parametric Instance Discrimination,arXiv,2018年,https://arxiv.org/abs/1805.01978 |
Also Published As
Publication number | Publication date |
---|---|
US20210248426A1 (en) | 2021-08-12 |
JP2021128474A (ja) | 2021-09-02 |
US12033370B2 (en) | 2024-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110163258B (zh) | 一种基于语义属性注意力重分配机制的零样本学习方法及系统 | |
CN112633350B (zh) | 一种基于图卷积的多尺度点云分类实现方法 | |
WO2020114378A1 (zh) | 视频水印的识别方法、装置、设备及存储介质 | |
WO2019100723A1 (zh) | 训练多标签分类模型的方法和装置 | |
US10970313B2 (en) | Clustering device, clustering method, and computer program product | |
CN109033978B (zh) | 一种基于纠错策略的cnn-svm混合模型手势识别方法 | |
US20110060708A1 (en) | Information processing device, information processing method, and program | |
CN112308862A (zh) | 图像语义分割模型训练、分割方法、装置以及存储介质 | |
JP2017224156A (ja) | 情報処理装置、情報処理方法及びプログラム | |
CN110751027B (zh) | 一种基于深度多示例学习的行人重识别方法 | |
CN111223128A (zh) | 目标跟踪方法、装置、设备及存储介质 | |
CN109840518B (zh) | 一种结合分类与域适应的视觉追踪方法 | |
CN113298009B (zh) | 一种基于熵正则化的自适应近邻人脸图像聚类方法 | |
CN110991500A (zh) | 一种基于嵌套式集成深度支持向量机的小样本多分类方法 | |
Venegas et al. | Automatic ladybird beetle detection using deep-learning models | |
CN108846845B (zh) | 基于缩略图与分层模糊聚类的sar图像分割方法 | |
CN112287935B (zh) | 一种基于显著性先验的图像语义分割方法及系统 | |
CN110910325A (zh) | 一种基于人工蝴蝶优化算法的医疗影像处理方法及装置 | |
CN113762005B (zh) | 特征选择模型的训练、对象分类方法、装置、设备及介质 | |
Prokop | Grey wolf optimizer combined with k-nn algorithm for clustering problem. | |
CN111488923B (zh) | 增强的锚点图半监督分类方法 | |
JP7221892B2 (ja) | 学習装置、学習方法、および学習プログラム | |
US20240119077A1 (en) | Apparatus and method for sharing and pruning weights for vision and language models | |
CN118279320A (zh) | 基于自动提示学习的目标实例分割模型建立方法及其应用 | |
CN114037931B (zh) | 一种自适应权重的多视图判别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220228 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221228 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230104 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230202 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7221892 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |