JP6569047B1 - 学習方法、コンピュータプログラム、分類器、及び生成器 - Google Patents
学習方法、コンピュータプログラム、分類器、及び生成器 Download PDFInfo
- Publication number
- JP6569047B1 JP6569047B1 JP2018222302A JP2018222302A JP6569047B1 JP 6569047 B1 JP6569047 B1 JP 6569047B1 JP 2018222302 A JP2018222302 A JP 2018222302A JP 2018222302 A JP2018222302 A JP 2018222302A JP 6569047 B1 JP6569047 B1 JP 6569047B1
- Authority
- JP
- Japan
- Prior art keywords
- image data
- neural network
- convolutional neural
- learning
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
- G06F18/2193—Validation; Performance evaluation; Active pattern learning techniques based on specific statistical tests
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/42—Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
- G06V10/431—Frequency domain transformation; Autocorrelation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/772—Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
制御部10は学習処理実行部101の機能により、ステップS3及びステップS5により得られるラベル付きの画像データ群を分類器112に与え(ステップS6)、分類器112の損失関数を算出して学習させる(ステップS7)。これにより分類器112は、上述したように、予め用意されている画像データについては情報量が削減されている画像データを所定の割合で含む学習用の画像データ群を用いて学習される。
10 制御部
101 学習処理実行部
102 画像処理実行部
11 画像処理部
112 分類器
113 生成器
12 記憶部
1P 画像処理プログラム
121L DLライブラリ
122L 分類器ライブラリ
123L 生成器ライブラリ
Claims (11)
- 画像データに対して畳み込みを行なう畳み込み層を含む畳み込みニューラルネットワーク、又は、画像データを出力する畳み込みニューラルネットワークを、視覚上判別しにくい成分を欠損させて情報量を削減させた画像データを所定の割合で含む学習用データで学習する
学習方法。 - 画像データが入力された場合に、前記画像データの分類を出力するように定義された畳み込み層を含む畳み込みニューラルネットワークに、
視覚上判別しにくい成分を欠損させて情報量を削減させた画像データを所定の割合で含む学習用データを与え、
前記畳み込みニューラルネットワークを分類器として学習する、学習方法。 - 任意のデータが入力された場合に、特定の画像データを出力するように定義された畳み込み層を含む画像生成用の畳み込みニューラルネットワークと、
前記画像生成用の畳み込みニューラルネットワークから出力された画像データ、又は他の画像データが入力された場合に、前記画像データの分類を出力するように定義された畳み込み層を含む分類用の畳み込みニューラルネットワークとを用い、
視覚上判別しにくい成分を欠損させて情報量を削減させた画像データを所定の割合で含む学習用データを用い、
前記分類用の畳み込みニューラルネットワーク、及び、前記画像生成用の畳み込みニューラルネットワークをGAN(Generative Adversarial Networks)によって学習する
学習方法。 - 前記分類用の畳み込みニューラルネットワークの損失関数を、前記画像生成用の畳み込みニューラルネットワークから出力された画像データ、及び前記他の画像データの両方、又はいずれか一方の内の所定の割合の画像データの情報量を削減させて前記分類用の畳み込みニューラルネットワークに与えて算出し、
前記画像生成用の畳み込みニューラルネットワークの損失関数を、前記画像生成用の畳み込みニューラルネットワークから出力される画像データの情報量を削減させずに前記分類用の畳み込みニューラルネットワークに与えて算出する
請求項3に記載の学習方法。 - 前記画像生成用の畳み込みニューラルネットワークの損失関数を、前記画像生成用の畳み込みニューラルネットワークから出力される画像データの内の所定の割合の画像データの情報量を削減させて前記分類用の畳み込みニューラルネットワークに与えて算出し、
前記分類用の畳み込みニューラルネットワークの損失関数を、前記画像生成用の畳み込みニューラルネットワークから出力された画像データ、及び他の画像データの両方、又はいずれか一方の内の所定の割合の画像データの情報量を削減させずに前記分類用の畳み込みニューラルネットワークに与えて算出する
請求項3に記載の学習方法。 - 画像データを出力する畳み込みニューラルネットワークの損失関数を、前記ニューラルネットワークから出力される画像データ、又は前記畳み込みニューラルネットワークへ与える画像データの内の所定の割合の画像データの情報量を削減させて算出する
請求項1に記載の学習方法。 - 情報量を削減させた画像データは、視覚上判別しにくい成分から優先的に欠損させて作成する
請求項1から6のいずれか1項に記載の学習方法。 - コンピュータに、
画像データが入力された場合に、前記画像データに基づく画像の分類を出力するように定義された畳み込み層を含む畳み込みニューラルネットワークの定義データを記憶し、
前記定義データに基づく畳み込みニューラルネットワークに、視覚上判別しにくい成分を欠損させて情報量を削減させた画像データを所定の割合で含む学習用データを与え、
前記畳み込みニューラルネットワークを分類器として学習する
処理を実行させるコンピュータプログラム。 - コンピュータに、
任意のデータが入力された場合に、特定の画像データを出力するように定義された畳み込み層を含む画像生成用の畳み込みニューラルネットワークの定義データと、
前記画像生成用の畳み込みニューラルネットワークから出力された画像データ、又は他の画像データが入力された場合に、前記画像データに基づく画像の分類を出力するように定義された畳み込み層を含む分類用の畳み込みニューラルネットワークの定義データとを記憶し、
前記分類用の畳み込みニューラルネットワークから出力される画像データ、又は前記分類用の畳み込みニューラルネットワークへ与える画像データの内の所定の割合の画像データの視覚上判別しにくい成分を欠損させて情報量を削減し、
前記分類用の畳み込みニューラルネットワーク、及び、前記画像生成用の畳み込みニューラルネットワークをGANによって学習する
処理を実行させるコンピュータプログラム。 - 画像データを入力する入力層と、
前記画像データに基づく画像の分類を出力する出力層と、
畳み込み層を含む畳み込みニューラルネットワークを含む中間層と
を備え、
コンピュータに、入力された画像データの分類を出力させるように、視覚上判別しにくい成分を欠損させて情報量を削減させた画像データを所定の割合で含む学習用の画像データと、該画像データの分類ラベルとを含む教師データによって学習されてある分類器。 - 任意のデータを入力する入力層と、
前記データに基づいて生成される画像の画像データを出力する出力層と、
畳み込み層を含む畳み込みニューラルネットワークを含む中間層と
を備え、
前記出力層から出力された画像データを、前記出力層から出力された画像データであるか否かを分類する分類用の畳み込みニューラルネットワークを含むGANにより、前記出力層から出力された画像データ、又は、前記分類用の畳み込みニューラルネットワークへ与える画像データの内の所定の割合の画像データの視覚上判別しにくい成分を欠損させて情報量を削減した学習用データを用いて学習されており、
コンピュータに、入力された任意のデータに基づく画像データを出力させるように学習されてある生成器。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018222302A JP6569047B1 (ja) | 2018-11-28 | 2018-11-28 | 学習方法、コンピュータプログラム、分類器、及び生成器 |
US16/698,252 US11620480B2 (en) | 2018-11-28 | 2019-11-27 | Learning method, computer program, classifier, and generator |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018222302A JP6569047B1 (ja) | 2018-11-28 | 2018-11-28 | 学習方法、コンピュータプログラム、分類器、及び生成器 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6569047B1 true JP6569047B1 (ja) | 2019-09-04 |
JP2020087103A JP2020087103A (ja) | 2020-06-04 |
Family
ID=67844752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018222302A Active JP6569047B1 (ja) | 2018-11-28 | 2018-11-28 | 学習方法、コンピュータプログラム、分類器、及び生成器 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11620480B2 (ja) |
JP (1) | JP6569047B1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021137415A1 (ko) * | 2019-12-30 | 2021-07-08 | 포항공과대학교 산학협력단 | 머신 러닝에 기반한 이미지 처리 방법 및 장치 |
US11842283B2 (en) | 2019-06-17 | 2023-12-12 | Axell Corporation | Learning method, computer program, classifier, generator, and processing system |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112304952B (zh) * | 2019-07-23 | 2024-04-02 | 纬创资通股份有限公司 | 影像辨识装置、影像辨识方法及其计算机程序产品 |
EP3920102A1 (en) * | 2020-06-05 | 2021-12-08 | HTC Corporation | Machine learning method and machine learning system involving data augmentation |
JPWO2022070342A1 (ja) * | 2020-09-30 | 2022-04-07 | ||
US20230359904A1 (en) * | 2020-09-30 | 2023-11-09 | Nippon Telegraph And Telephone Corporation | Training device, training method and training program |
US11763135B2 (en) * | 2021-03-01 | 2023-09-19 | Robert Bosch Gmbh | Concept-based adversarial generation method with steerable and diverse semantics |
CN113691818B (zh) * | 2021-08-25 | 2023-06-30 | 深圳龙岗智能视听研究院 | 视频目标检测方法、系统、存储介质、计算机视觉终端 |
CN115439702B (zh) * | 2022-11-08 | 2023-03-24 | 武昌理工学院 | 一种基于频域处理的弱噪声图像分类方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000032271A (ja) * | 1998-07-10 | 2000-01-28 | Sony Corp | 画像生成装置及び方法 |
JP6208552B2 (ja) | 2013-11-14 | 2017-10-04 | 株式会社デンソーアイティーラボラトリ | 識別器、識別プログラム、及び識別方法 |
WO2018053340A1 (en) * | 2016-09-15 | 2018-03-22 | Twitter, Inc. | Super resolution using a generative adversarial network |
US10430685B2 (en) * | 2016-11-16 | 2019-10-01 | Facebook, Inc. | Deep multi-scale video prediction |
US10572979B2 (en) * | 2017-04-06 | 2020-02-25 | Pixar | Denoising Monte Carlo renderings using machine learning with importance sampling |
US11238623B2 (en) * | 2017-05-01 | 2022-02-01 | Preferred Networks, Inc. | Automatic line drawing coloring program, automatic line drawing coloring apparatus, and graphical user interface program |
-
2018
- 2018-11-28 JP JP2018222302A patent/JP6569047B1/ja active Active
-
2019
- 2019-11-27 US US16/698,252 patent/US11620480B2/en active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11842283B2 (en) | 2019-06-17 | 2023-12-12 | Axell Corporation | Learning method, computer program, classifier, generator, and processing system |
WO2021137415A1 (ko) * | 2019-12-30 | 2021-07-08 | 포항공과대학교 산학협력단 | 머신 러닝에 기반한 이미지 처리 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
JP2020087103A (ja) | 2020-06-04 |
US20200210783A1 (en) | 2020-07-02 |
US11620480B2 (en) | 2023-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6569047B1 (ja) | 学習方法、コンピュータプログラム、分類器、及び生成器 | |
US11334971B2 (en) | Digital image completion by learning generation and patch matching jointly | |
EP3686848A1 (en) | Semantic image synthesis for generating substantially photorealistic images using neural networks | |
CN111754596B (zh) | 编辑模型生成、人脸图像编辑方法、装置、设备及介质 | |
US20210089845A1 (en) | Teaching gan (generative adversarial networks) to generate per-pixel annotation | |
US11727717B2 (en) | Data-driven, photorealistic social face-trait encoding, prediction, and manipulation using deep neural networks | |
US10742990B2 (en) | Data compression system | |
CN109598231A (zh) | 一种视频水印的识别方法、装置、设备及存储介质 | |
WO2018203549A1 (ja) | 信号変更装置、方法、及びプログラム | |
US20230267381A1 (en) | Neural trees | |
CN110288513B (zh) | 用于改变人脸属性的方法、装置、设备和存储介质 | |
CN112488923A (zh) | 图像超分辨率重建方法、装置、存储介质及电子设备 | |
CN113939870A (zh) | 为基于生成和检索的应用学习有效音乐特征的技术 | |
US20220101121A1 (en) | Latent-variable generative model with a noise contrastive prior | |
KR20220131808A (ko) | 이미지 분류 모델 생성 방법 및 장치 | |
JP6723488B1 (ja) | 学習装置及び推論装置 | |
JP7482620B2 (ja) | データ生成方法、データ表示方法、データ生成装置及びデータ表示システム | |
CN115631285A (zh) | 基于统一驱动的人脸渲染方法、装置、设备及存储介质 | |
CN113822790B (zh) | 一种图像处理方法、装置、设备及计算机可读存储介质 | |
WO2018123202A1 (ja) | 動画像処理装置、表示装置、動画像処理方法、および制御プログラム | |
JP2022036131A (ja) | 学習装置、推論装置、学習方法、推論方法、コンピュータシステムおよびプログラム | |
JP6947460B1 (ja) | プログラム、情報処理装置、及び方法 | |
US20240169701A1 (en) | Affordance-based reposing of an object in a scene | |
US20230377214A1 (en) | Identity-preserving image generation using diffusion models | |
Paul et al. | An improved deepfake detection using deep learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181226 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20181226 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20190111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190329 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190611 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190618 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6569047 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R157 | Certificate of patent or utility model (correction) |
Free format text: JAPANESE INTERMEDIATE CODE: R157 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |