JP6859577B2 - 学習方法、学習プログラム、学習装置及び学習システム - Google Patents
学習方法、学習プログラム、学習装置及び学習システム Download PDFInfo
- Publication number
- JP6859577B2 JP6859577B2 JP2019532833A JP2019532833A JP6859577B2 JP 6859577 B2 JP6859577 B2 JP 6859577B2 JP 2019532833 A JP2019532833 A JP 2019532833A JP 2019532833 A JP2019532833 A JP 2019532833A JP 6859577 B2 JP6859577 B2 JP 6859577B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- learning
- classification model
- classification
- predetermined ratio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 92
- 238000013145 classification model Methods 0.000 claims description 291
- 239000002131 composite material Substances 0.000 claims description 88
- 238000012549 training Methods 0.000 claims description 72
- 230000002194 synthesizing effect Effects 0.000 claims description 24
- 238000006243 chemical reaction Methods 0.000 claims description 16
- 230000001131 transforming effect Effects 0.000 claims 1
- 238000013528 artificial neural network Methods 0.000 description 20
- 241000282326 Felis catus Species 0.000 description 19
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 241000282472 Canis lupus familiaris Species 0.000 description 7
- 238000013434 data augmentation Methods 0.000 description 7
- 238000007493 shaping process Methods 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000011176 pooling Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 3
- 238000009826 distribution Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000009827 uniform distribution Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/772—Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/26—Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
Claims (14)
- 少なくとも1つのハードウェアプロセッサと、少なくとも1つのメモリとを備えるコンピュータによって、
それぞれ分類が定められた複数の学習用データ又は前記複数の学習用データを変換して得られた複数の変換データを所定の比率で合成し、1つの合成データを生成することと、
1又は複数の前記合成データを分類モデルに入力することと、
前記分類モデルの出力によって、前記合成データに含まれる前記複数の学習用データの分類が前記所定の比率で再現されるように、前記分類モデルのパラメータを更新することと、
を実行する学習方法。 - 前記合成データを生成することを実行する前に、前記所定の比率を決定することをさらに含む、
請求項1に記載の学習方法。 - 前記所定の比率を決定することは、所定の数値範囲から1つの数値をランダムに選択することと、選択された前記数値に基づいて前記所定の比率を決定することとを含む、
請求項2に記載の学習方法。 - 前記所定の比率を決定することは、前記合成データを生成することを実行する度に行われる、
請求項2又は3に記載の学習方法。 - 前記合成データを生成することを実行する前に、初期データセットのうちから前記複数の学習用データを選択することをさらに含む、
請求項1から4のいずれか一項に記載の学習方法。 - 前記複数の学習用データを選択することは、前記初期データセットのうちからランダムにデータを選択することを含む、
請求項5に記載の学習方法。 - 前記合成データを生成することを実行する前に、前記複数の学習用データを変換し、前記複数の変換データを生成することをさらに含む、
請求項1から6のいずれか一項に記載の学習方法。 - 前記複数の学習用データは、複数の音データであり、
前記合成データを生成することは、前記複数の音データを前記所定の比率で重ね合わせて、1つの合成音データを生成することを含む、
請求項1から7のいずれか一項に記載の学習方法。 - 前記複数の学習用データは、複数の画像データであり、
前記合成データを生成することは、前記複数の画像データのピクセル毎に、ピクセル値を前記所定の比率で加算して、1つの合成画像データを生成することを含む、
請求項1から7のいずれか一項に記載の学習方法。 - 前記複数の学習用データは、複数のテキストデータであり、
前記合成データを生成することは、前記複数のテキストデータを複数のベクトルデータに変換することと、前記複数のベクトルデータを、前記所定の比率で加算して、1つの合成ベクトルデータを生成することとを含む、
請求項1から7のいずれか一項に記載の学習方法。 - 少なくとも1つのハードウェアプロセッサと、少なくとも1つのメモリとを備えるコンピュータによって、
それぞれ分類が定められた複数の学習用データ又は前記複数の学習用データを変換して得られた複数の変換データを分類モデルに入力し、前記分類モデルの複数の中間出力を取得することと、
前記複数の中間出力を所定の比率で合成し、1つの合成データを生成することと、
1又は複数の前記合成データを、前記分類モデルのうち前記中間出力を出力した構成の後段に入力することと、
前記分類モデルの出力によって、前記合成データに含まれる前記複数の学習用データの分類が前記所定の比率で再現されるように、前記分類モデルのパラメータを更新することと、
を実行する学習方法。 - 少なくとも1つのハードウェアプロセッサと、少なくとも1つのメモリとを備えるコンピュータに、
それぞれ分類が定められた複数の学習用データ又は前記複数の学習用データを変換して得られた複数の変換データを所定の比率で合成し、1つの合成データを生成することと、
1又は複数の前記合成データを分類モデルに入力することと、
前記分類モデルの出力によって、前記合成データに含まれる前記複数の学習用データの分類が前記所定の比率で再現されるように、前記分類モデルのパラメータを更新することと、
を実行させる学習プログラム。 - それぞれ分類が定められた複数の学習用データ又は前記複数の学習用データを変換して得られた複数の変換データを所定の比率で合成し、1つの合成データを生成する生成部と、
1又は複数の前記合成データを分類モデルに入力する投入部と、
前記分類モデルの出力によって、前記合成データに含まれる前記複数の学習用データの分類が前記所定の比率で再現されるように、前記分類モデルのパラメータを更新する更新部と、
を備える学習装置。 - それぞれ分類が定められた初期データセットを記憶するデータベースと、
入力されたデータの分類を出力する分類モデルと、
前記初期データセットのうちから選択された複数の学習用データ又は前記複数の学習用データを変換して得られた複数の変換データを所定の比率で合成し、1つの合成データを生成する生成部、1又は複数の前記合成データを前記分類モデルに入力する投入部及び前記分類モデルの出力によって、前記合成データに含まれる前記複数の学習用データの分類が前記所定の比率で再現されるように、前記分類モデルのパラメータを更新する更新部を有する学習装置と、
を備える学習システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017144029 | 2017-07-25 | ||
JP2017144029 | 2017-07-25 | ||
PCT/JP2018/027895 WO2019022136A1 (ja) | 2017-07-25 | 2018-07-25 | 学習方法、学習プログラム、学習装置及び学習システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019022136A1 JPWO2019022136A1 (ja) | 2020-09-17 |
JP6859577B2 true JP6859577B2 (ja) | 2021-04-14 |
Family
ID=65040254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019532833A Active JP6859577B2 (ja) | 2017-07-25 | 2018-07-25 | 学習方法、学習プログラム、学習装置及び学習システム |
Country Status (4)
Country | Link |
---|---|
US (1) | US11488060B2 (ja) |
EP (1) | EP3660753A4 (ja) |
JP (1) | JP6859577B2 (ja) |
WO (1) | WO2019022136A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10417527B2 (en) * | 2017-09-06 | 2019-09-17 | Irdeto B.V. | Identifying an object within content |
CN110533158B (zh) * | 2018-05-25 | 2023-10-13 | 宏达国际电子股份有限公司 | 模型建构方法、系统及非易失性电脑可读取记录介质 |
CN111079813B (zh) * | 2019-12-10 | 2023-07-07 | 北京百度网讯科技有限公司 | 基于模型并行的分类模型计算方法和装置 |
CN111104482A (zh) * | 2019-12-18 | 2020-05-05 | 北京百度网讯科技有限公司 | 数据处理方法和装置 |
US11687780B2 (en) * | 2020-07-02 | 2023-06-27 | Samsung Electronics Co., Ltd | Method and apparatus for data efficient semantic segmentation |
WO2022153432A1 (ja) * | 2021-01-14 | 2022-07-21 | 日本電気株式会社 | 情報処理装置、情報処理システム、情報処理方法、及び、記録媒体 |
WO2022249392A1 (ja) * | 2021-05-27 | 2022-12-01 | 日本電気株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US20220405570A1 (en) * | 2021-06-11 | 2022-12-22 | International Business Machines Corporation | Post-hoc loss-calibration for bayesian neural networks |
CN114445805A (zh) * | 2022-01-29 | 2022-05-06 | 北京百度网讯科技有限公司 | 属性识别模型训练、属性识别方法、装置及设备 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006080746A (ja) * | 2004-09-08 | 2006-03-23 | Nikon Corp | 画像処理装置、電子カメラ、および画像処理プログラム |
JP6118752B2 (ja) * | 2014-03-28 | 2017-04-19 | セコム株式会社 | 学習データ生成装置 |
JP6365032B2 (ja) * | 2014-07-08 | 2018-08-01 | 富士通株式会社 | データ分類方法、データ分類プログラム、及び、データ分類装置 |
WO2016125310A1 (ja) * | 2015-02-06 | 2016-08-11 | 株式会社Ubic | データ分析システムおよびデータ分析方法並びにデータ分析プログラム |
CN105938558B (zh) | 2015-03-06 | 2021-02-09 | 松下知识产权经营株式会社 | 学习方法 |
EP4009246A1 (en) * | 2015-09-30 | 2022-06-08 | Just, Inc. | Systems and methods for identifying entities that have a target property |
US20170147909A1 (en) * | 2015-11-25 | 2017-05-25 | Canon Kabushiki Kaisha | Information processing apparatus, information processing method, and storage medium |
US10949889B2 (en) * | 2016-01-04 | 2021-03-16 | Exelate Media Ltd. | Methods and apparatus for managing models for classification of online users |
WO2018220700A1 (ja) * | 2017-05-30 | 2018-12-06 | 株式会社日立国際電気 | 新規学習データセット生成方法、新規学習データセット生成装置および生成された学習データセットを用いた学習方法 |
US10839269B1 (en) * | 2020-03-20 | 2020-11-17 | King Abdulaziz University | System for fast and accurate visual domain adaptation |
KR20220085589A (ko) * | 2020-12-15 | 2022-06-22 | 현대모비스 주식회사 | 딥러닝 기반 제품 불량 검출방법 및 시스템 |
-
2018
- 2018-07-25 WO PCT/JP2018/027895 patent/WO2019022136A1/ja unknown
- 2018-07-25 EP EP18838701.3A patent/EP3660753A4/en not_active Withdrawn
- 2018-07-25 US US16/633,803 patent/US11488060B2/en active Active
- 2018-07-25 JP JP2019532833A patent/JP6859577B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
US20200210893A1 (en) | 2020-07-02 |
WO2019022136A1 (ja) | 2019-01-31 |
EP3660753A4 (en) | 2021-05-12 |
EP3660753A1 (en) | 2020-06-03 |
US11488060B2 (en) | 2022-11-01 |
JPWO2019022136A1 (ja) | 2020-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6859577B2 (ja) | 学習方法、学習プログラム、学習装置及び学習システム | |
CA3043621C (en) | Method and system for color representation generation | |
JP6441980B2 (ja) | 教師画像を生成する方法、コンピュータおよびプログラム | |
CN118172460A (zh) | 用于使用神经网络生成基本逼真图像的语义图像合成 | |
US11961203B2 (en) | Image processing device and operation method therefor | |
JP7144699B2 (ja) | 信号変更装置、方法、及びプログラム | |
McCormack et al. | Deep learning of individual aesthetics | |
WO2018203550A1 (ja) | 信号生成装置、信号生成学習装置、方法、及びプログラム | |
US20230268035A1 (en) | Method and apparatus for generating chemical structure using neural network | |
JP2020098453A (ja) | 学習装置、印刷制御装置及び学習済モデル | |
JP2008015824A (ja) | フィルタ列生成装置、フィルタ列生成方法、コンピュータをフィルタ列生成装置として機能させるためのプログラム、および記録媒体 | |
Valdez et al. | A framework for interactive structural design exploration | |
JP2009288933A (ja) | 学習装置、学習方法、及びプログラム | |
JP2021144461A (ja) | 学習装置及び推論装置 | |
EP1587003B1 (en) | Song search system and song search method | |
WO2022264461A1 (ja) | 情報処理システム及び情報処理方法 | |
JP6795240B1 (ja) | 制御装置、方法及びプログラム | |
JP2019153223A (ja) | 画像生成装置、画像生成方法および画像生成プログラム | |
JP5076138B2 (ja) | 自己組織化マップを用いたパターン生成方法、そのプログラム及び装置 | |
JP2022045087A (ja) | モデル解析装置、モデル解析方法、及びプログラム | |
KR102689642B1 (ko) | 확산 모델과 암시적 신경망 기반의 임의의 해상도와 스케일의 이미지를 생성하는 방법 및 이를 위한 장치 | |
KR102539746B1 (ko) | 영상 변환 장치 및 이를 이용한 영상 변환 방법 | |
US20240135201A1 (en) | Automated Performative Sequence Generation | |
JP7402552B2 (ja) | 学習装置及び推論装置 | |
KR102127913B1 (ko) | 신경망 학습 방법 및 그 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200526 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210202 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210302 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6859577 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |