JP2020087103A - 学習方法、コンピュータプログラム、分類器、及び生成器 - Google Patents
学習方法、コンピュータプログラム、分類器、及び生成器 Download PDFInfo
- Publication number
- JP2020087103A JP2020087103A JP2018222302A JP2018222302A JP2020087103A JP 2020087103 A JP2020087103 A JP 2020087103A JP 2018222302 A JP2018222302 A JP 2018222302A JP 2018222302 A JP2018222302 A JP 2018222302A JP 2020087103 A JP2020087103 A JP 2020087103A
- Authority
- JP
- Japan
- Prior art keywords
- image data
- neural network
- convolutional neural
- learning
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
- G06F18/2193—Validation; Performance evaluation; Active pattern learning techniques based on specific statistical tests
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
- G06V10/431—Frequency domain transformation; Autocorrelation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/772—Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
制御部10は学習処理実行部101の機能により、ステップS3及びステップS5により得られるラベル付きの画像データ群を分類器112に与え(ステップS6)、分類器112の損失関数を算出して学習させる(ステップS7)。これにより分類器112は、上述したように、予め用意されている画像データについては情報量が削減されている画像データを所定の割合で含む学習用の画像データ群を用いて学習される。
10 制御部
101 学習処理実行部
102 画像処理実行部
11 画像処理部
112 分類器
113 生成器
12 記憶部
1P 画像処理プログラム
121L DLライブラリ
122L 分類器ライブラリ
123L 生成器ライブラリ
Claims (11)
- 画像データに対して畳み込みを行なう畳み込み層を含む畳み込みニューラルネットワーク、又は、画像データを出力する畳み込みニューラルネットワークを、情報量を削減させた画像データを所定の割合で含む学習用データで学習する
学習方法。 - 画像データが入力された場合に、前記画像データの分類を出力するように定義された畳み込み層を含む畳み込みニューラルネットワークに、
情報量を削減させた画像データを所定の割合で含む学習用データを与え、
前記畳み込みニューラルネットワークを分類器として学習する、学習方法。 - 任意のデータが入力された場合に、特定の画像データを出力するように定義された畳み込み層を含む画像生成用の畳み込みニューラルネットワークと、
前記画像生成用の畳み込みニューラルネットワークから出力された画像データ、又は他の画像データが入力された場合に、前記画像データの分類を出力するように定義された畳み込み層を含む分類用の畳み込みニューラルネットワークとを用い、
情報量を削減させた画像データを所定の割合で含む学習用データを用い、
前記分類用の畳み込みニューラルネットワーク、及び、前記画像生成用の畳み込みニューラルネットワークをGAN(Generative Adversarial Networks)によって学習する
学習方法。 - 前記分類用の畳み込みニューラルネットワークの損失関数を、前記画像生成用の畳み込みニューラルネットワークから出力された画像データ、及び前記他の画像データの両方、又はいずれか一方の内の所定の割合の画像データの情報量を削減させて前記分類用の畳み込みニューラルネットワークに与えて算出し、
前記画像生成用の畳み込みニューラルネットワークの損失関数を、前記画像生成用の畳み込みニューラルネットワークから出力される画像データの情報量を削減させずに前記分類用の畳み込みニューラルネットワークに与えて算出する
請求項3に記載の学習方法。 - 前記画像生成用の畳み込みニューラルネットワークの損失関数を、前記画像生成用の畳み込みニューラルネットワークから出力される画像データの内の所定の割合の画像データの情報量を削減させて前記分類用の畳み込みニューラルネットワークに与えて算出する
前記分類用の畳み込みニューラルネットワークの損失関数を、前記画像生成用の畳み込みニューラルネットワークから出力された画像データ、及び他の画像データの両方、又はいずれか一方の内の所定の割合の画像データの情報量を削減させずに前記分類用の畳み込みニューラルネットワークに与えて算出する
請求項3に記載の学習方法。 - 画像データを出力する畳み込みニューラルネットワークの損失関数を、前記ニューラルネットワークから出力される画像データ、又は前記畳み込みニューラルネットワークへ与える画像データの内の所定の割合の画像データの情報量を削減させて算出する
請求項1に記載の学習方法。 - 情報量を削減させた画像データは、視覚上判別しにくい成分から欠損させて作成する
請求項1から6のいずれか1項に記載の学習方法。 - コンピュータに、
画像データが入力された場合に、前記画像データに基づく画像の分類を出力するように定義された畳み込み層を含む畳み込みニューラルネットワークの定義データを記憶し、
前記定義データに基づく畳み込みニューラルネットワークに、情報量を削減させた画像データを所定の割合で含む学習用データを与え、
前記畳み込みニューラルネットワークを分類器として学習する
処理を実行させるコンピュータプログラム。 - コンピュータに、
任意のデータが入力された場合に、特定の画像データを出力するように定義された畳み込み層を含む画像生成用の畳み込みニューラルネットワークの定義データと、
前記画像生成用の畳み込みニューラルネットワークから出力された画像データ、又は他の画像データが入力された場合に、前記画像データに基づく画像の分類を出力するように定義された畳み込み層を含む分類用の畳み込みニューラルネットワークの定義データとを記憶し、
前記分類用の畳み込みニューラルネットワークから出力される画像データ、又は前記分類用の畳み込みニューラルネットワークへ与える画像データの内の所定の割合の画像データの情報量を削減し、
前記分類用の畳み込みニューラルネットワーク、及び、前記画像生成用の畳み込みニューラルネットワークをGANによって学習する
処理を実行させるコンピュータプログラム。 - 画像データを入力する入力層と、
前記画像データに基づく画像の分類を出力する出力層と、
畳み込み層を含む畳み込みニューラルネットワークを含む中間層と
を備え、
コンピュータに、入力された画像データの分類を出力させるように、情報量を削減させた画像データを所定の割合で含む学習用の画像データと、該画像データの分類ラベルとを含む教師データによって学習されてある分類器。 - 任意のデータを入力する入力層と、
前記データに基づいて生成される画像の画像データを出力する出力層と、
畳み込み層を含む畳み込みニューラルネットワークを含む中間層と
を備え、
前記出力層から出力された画像データを、前記出力層から出力された画像データであるか否かを分類する分類用の畳み込みニューラルネットワークを含むGANにより、前記出力層から出力された画像データ、又は、前記分類用の畳み込みニューラルネットワークへ与える画像データの内の所定の割合の画像データの情報量を削減した学習用データを用いて学習されており、
コンピュータに、入力された任意のデータに基づく画像データを出力させるように学習されてある生成器。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018222302A JP6569047B1 (ja) | 2018-11-28 | 2018-11-28 | 学習方法、コンピュータプログラム、分類器、及び生成器 |
US16/698,252 US11620480B2 (en) | 2018-11-28 | 2019-11-27 | Learning method, computer program, classifier, and generator |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018222302A JP6569047B1 (ja) | 2018-11-28 | 2018-11-28 | 学習方法、コンピュータプログラム、分類器、及び生成器 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6569047B1 JP6569047B1 (ja) | 2019-09-04 |
JP2020087103A true JP2020087103A (ja) | 2020-06-04 |
Family
ID=67844752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018222302A Active JP6569047B1 (ja) | 2018-11-28 | 2018-11-28 | 学習方法、コンピュータプログラム、分類器、及び生成器 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11620480B2 (ja) |
JP (1) | JP6569047B1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021193564A (ja) * | 2020-06-05 | 2021-12-23 | 宏達國際電子股▲ふん▼有限公司 | 機械学習方法、機械学習システム及び非一時的コンピュータ可読記憶媒体 |
WO2022070343A1 (ja) * | 2020-09-30 | 2022-04-07 | 日本電信電話株式会社 | 学習装置、学習方法及び学習プログラム |
WO2022070342A1 (ja) * | 2020-09-30 | 2022-04-07 | 日本電信電話株式会社 | 学習装置、学習方法及び学習プログラム |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11842283B2 (en) | 2019-06-17 | 2023-12-12 | Axell Corporation | Learning method, computer program, classifier, generator, and processing system |
CN112304952B (zh) * | 2019-07-23 | 2024-04-02 | 纬创资通股份有限公司 | 影像辨识装置、影像辨识方法及其计算机程序产品 |
KR102537207B1 (ko) * | 2019-12-30 | 2023-05-25 | 포항공과대학교 산학협력단 | 머신 러닝에 기반한 이미지 처리 방법 및 장치 |
US11763135B2 (en) * | 2021-03-01 | 2023-09-19 | Robert Bosch Gmbh | Concept-based adversarial generation method with steerable and diverse semantics |
CN113691818B (zh) * | 2021-08-25 | 2023-06-30 | 深圳龙岗智能视听研究院 | 视频目标检测方法、系统、存储介质、计算机视觉终端 |
CN115439702B (zh) * | 2022-11-08 | 2023-03-24 | 武昌理工学院 | 一种基于频域处理的弱噪声图像分类方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000032271A (ja) * | 1998-07-10 | 2000-01-28 | Sony Corp | 画像生成装置及び方法 |
WO2018203374A1 (ja) * | 2017-05-01 | 2018-11-08 | 株式会社Preferred Networks | 線画自動着色プログラム、線画自動着色装置及びグラフィカルユーザインターフェース用プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6208552B2 (ja) | 2013-11-14 | 2017-10-04 | 株式会社デンソーアイティーラボラトリ | 識別器、識別プログラム、及び識別方法 |
WO2018053340A1 (en) * | 2016-09-15 | 2018-03-22 | Twitter, Inc. | Super resolution using a generative adversarial network |
US10430685B2 (en) * | 2016-11-16 | 2019-10-01 | Facebook, Inc. | Deep multi-scale video prediction |
US10586310B2 (en) * | 2017-04-06 | 2020-03-10 | Pixar | Denoising Monte Carlo renderings using generative adversarial neural networks |
-
2018
- 2018-11-28 JP JP2018222302A patent/JP6569047B1/ja active Active
-
2019
- 2019-11-27 US US16/698,252 patent/US11620480B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000032271A (ja) * | 1998-07-10 | 2000-01-28 | Sony Corp | 画像生成装置及び方法 |
WO2018203374A1 (ja) * | 2017-05-01 | 2018-11-08 | 株式会社Preferred Networks | 線画自動着色プログラム、線画自動着色装置及びグラフィカルユーザインターフェース用プログラム |
Non-Patent Citations (4)
Title |
---|
三鼓 悠ほか: "半教師あり学習によるアイコンタクト検出", 情報処理学会 研究報告 コンピュータビジョンとイメージメディア(CVIM) 2018−CVIM−21, JPN6019003686, 11 January 2018 (2018-01-11), JP, pages 57, ISSN: 0003972632 * |
大矢 剛史ほか: "生成NNによる輝度画像の確率的自動カラー化の基礎検討", 第31回 画像符号化シンポジウム 第21回 映像メディア処理シンポジウム, JPN6019003682, 16 November 2016 (2016-11-16), JP, pages 78 - 79, ISSN: 0003972630 * |
宋 京舟ほか: "機械学習を用いたアニメ絵コンテの自動着色手法", 映像情報メディア学会技術報告, vol. 42, no. 12, JPN6019003679, 9 March 2018 (2018-03-09), JP, pages 233 - 236, ISSN: 0003972629 * |
米辻 泰山: "線画自動着色サービス「PaintsChainer」について", 映像情報メディア学会誌, vol. 第72巻 第3号, JPN6019003684, 1 May 2018 (2018-05-01), JP, pages 47 - 51, ISSN: 0003972631 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021193564A (ja) * | 2020-06-05 | 2021-12-23 | 宏達國際電子股▲ふん▼有限公司 | 機械学習方法、機械学習システム及び非一時的コンピュータ可読記憶媒体 |
JP7226696B2 (ja) | 2020-06-05 | 2023-02-21 | 宏達國際電子股▲ふん▼有限公司 | 機械学習方法、機械学習システム及び非一時的コンピュータ可読記憶媒体 |
TWI831016B (zh) * | 2020-06-05 | 2024-02-01 | 宏達國際電子股份有限公司 | 機器學習方法、機器學習系統以及非暫態電腦可讀取媒體 |
WO2022070343A1 (ja) * | 2020-09-30 | 2022-04-07 | 日本電信電話株式会社 | 学習装置、学習方法及び学習プログラム |
WO2022070342A1 (ja) * | 2020-09-30 | 2022-04-07 | 日本電信電話株式会社 | 学習装置、学習方法及び学習プログラム |
JP7537506B2 (ja) | 2020-09-30 | 2024-08-21 | 日本電信電話株式会社 | 学習装置、学習方法及び学習プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20200210783A1 (en) | 2020-07-02 |
JP6569047B1 (ja) | 2019-09-04 |
US11620480B2 (en) | 2023-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6569047B1 (ja) | 学習方法、コンピュータプログラム、分類器、及び生成器 | |
EP3686848A1 (en) | Semantic image synthesis for generating substantially photorealistic images using neural networks | |
US9111375B2 (en) | Evaluation of three-dimensional scenes using two-dimensional representations | |
US11727717B2 (en) | Data-driven, photorealistic social face-trait encoding, prediction, and manipulation using deep neural networks | |
US20210089845A1 (en) | Teaching gan (generative adversarial networks) to generate per-pixel annotation | |
AU2021379758A1 (en) | A temporal bottleneck attention architecture for video action recognition | |
US20210397954A1 (en) | Training device and training method | |
US20220101144A1 (en) | Training a latent-variable generative model with a noise contrastive prior | |
KR20200143450A (ko) | 화상 처리 방법, 장치, 전자 장치 및 저장 매체 | |
JP2022546681A (ja) | 分類モデルの解釈容易化 | |
JPWO2019215904A1 (ja) | 予測モデル作成装置、予測モデル作成方法、および予測モデル作成プログラム | |
CN117237756A (zh) | 一种训练目标分割模型的方法、目标分割方法及相关装置 | |
Park et al. | How to train your pre-trained GAN models | |
JP6947460B1 (ja) | プログラム、情報処理装置、及び方法 | |
CN114841887B (zh) | 一种基于多层次差异学习的图像恢复质量评价方法 | |
EP3975071A1 (en) | Identifying and quantifying confounding bias based on expert knowledge | |
CN113077383B (zh) | 一种模型训练方法及模型训练装置 | |
US20220101145A1 (en) | Training energy-based variational autoencoders | |
JP2010257344A (ja) | 視線位置推定方法、視線位置推定装置、プログラム、及び記録媒体 | |
JP7379300B2 (ja) | 推定装置、推定方法及びプログラム | |
US20230394734A1 (en) | Generating Machine-Learned Inverse Rig Models | |
US20220319158A1 (en) | Cell nuclei classification with artifact area avoidance | |
WO2024157507A1 (ja) | モデル評価装置、モデル評価方法、プログラム | |
WO2021161542A1 (ja) | 学習装置、学習方法および学習プログラム | |
CN108230413B (zh) | 图像描述方法和装置、电子设备、计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181226 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20181226 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20190111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190329 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190611 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190618 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6569047 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R157 | Certificate of patent or utility model (correction) |
Free format text: JAPANESE INTERMEDIATE CODE: R157 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |