JP7483751B2 - 教師なしデータ拡張を使用した機械学習モデルのトレーニング - Google Patents
教師なしデータ拡張を使用した機械学習モデルのトレーニング Download PDFInfo
- Publication number
- JP7483751B2 JP7483751B2 JP2021563340A JP2021563340A JP7483751B2 JP 7483751 B2 JP7483751 B2 JP 7483751B2 JP 2021563340 A JP2021563340 A JP 2021563340A JP 2021563340 A JP2021563340 A JP 2021563340A JP 7483751 B2 JP7483751 B2 JP 7483751B2
- Authority
- JP
- Japan
- Prior art keywords
- training
- model
- machine learning
- input
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims description 209
- 238000010801 machine learning Methods 0.000 title claims description 95
- 238000013434 data augmentation Methods 0.000 title claims description 14
- 238000000034 method Methods 0.000 claims description 72
- 230000003190 augmentative effect Effects 0.000 claims description 35
- 238000009826 distribution Methods 0.000 claims description 21
- 238000003860 storage Methods 0.000 claims description 9
- 230000036541 health Effects 0.000 claims description 6
- 230000000007 visual effect Effects 0.000 claims description 2
- 230000008569 process Effects 0.000 description 20
- 238000012545 processing Methods 0.000 description 18
- 238000013528 artificial neural network Methods 0.000 description 14
- 230000003416 augmentation Effects 0.000 description 13
- 238000004590 computer program Methods 0.000 description 13
- 230000015654 memory Effects 0.000 description 7
- 230000000306 recurrent effect Effects 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 239000002131 composite material Substances 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000026676 system process Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 241000009334 Singa Species 0.000 description 1
- 240000001949 Taraxacum officinale Species 0.000 description 1
- 235000005187 Taraxacum officinale ssp. officinale Nutrition 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
- Image Analysis (AREA)
Description
本出願は、その全体が参照により本明細書に組み込まれている、2019年4月25日に出願した米国特許出願第62/838,932号の優先権を主張するものである。
102 モデル入力
110 機械学習モデル
112 モデル出力
140 ラベルありトレーニングデータ
150 ラベルなしトレーニングデータ
200 プロセス
300 プロセス
Claims (13)
- 特定の機械学習タスクを実行するためにモデル入力をモデル出力にマッピングするように機械学習モデルをトレーニングするための、トレーニングデータを受領するステップであって、前記トレーニングデータが、
複数のラベルなしトレーニング入力、ならびに
複数のラベルありトレーニング入力、および各ラベルありトレーニング入力について、前記機械学習モデルが前記ラベルありトレーニング入力に対して前記特定の機械学習タスクを実行することにより生成すべきグラウンドトゥルース出力
を含む、ステップと、
拡張トレーニングデータを生成するステップであって、前記複数のラベルなしトレーニング入力のそれぞれについて、前記ラベルなしトレーニング入力にデータ拡張技法を適用することによって、それぞれに対応する拡張トレーニング入力を生成するステップを含む、ステップと、
前記拡張トレーニングデータに対して前記機械学習モデルをトレーニングするステップであって、
前記ラベルなしトレーニング入力および前記拡張トレーニング入力に対して、(i)所与のラベルなしトレーニング入力について前記機械学習モデルによって生成されたモデル出力と、(ii)前記ラベルなしトレーニング入力から生成された前記拡張トレーニング入力について前記機械学習モデルによって生成されたモデル出力との間の差異の尺度となる教師なし目的を最適化するように、前記機械学習モデルをトレーニングするステップ、ならびに
前記ラベルありトレーニング入力に対して、(i)所与のラベルありトレーニング入力について前記機械学習モデルによって生成されたモデル出力と、(ii)前記所与のラベルありトレーニング入力についての前記グラウンドトゥルース出力との間の差異の尺度となる教師あり目的を最適化するように、前記機械学習モデルをトレーニングするステップ
を含む、ステップと
を含む、コンピュータ実装方法。 - 前記モデル出力が確率分布であり、
前記教師なし目的が、(i)前記所与のラベルなしトレーニング入力について前記機械学習モデルによって生成された前記モデル出力と、(ii)前記ラベルなしトレーニング入力から生成された前記拡張トレーニング入力について前記機械学習モデルによって生成された前記モデル出力との間のK-Lダイバージェンスに基づく、請求項1に記載の方法。 - 前記モデル出力が確率分布であり、
前記教師あり目的が、前記所与のラベルありトレーニング入力について生成された前記確率分布による前記所与のグラウンドトゥルース出力の負の対数尤度に基づく、請求項1から2のいずれか一項に記載の方法。 - 前記拡張トレーニングデータ内の前記ラベルありトレーニング入力および前記ラベルなしトレーニング入力が、拡張ラベルなしトレーニング入力を生成するために使用される前記データ拡張技法とは異なるデータ拡張技法を適用することによって拡張されている、請求項1から3のいずれか一項に記載の方法。
- 前記モデル出力が確率分布であり、
前記教師あり目的が、
前記確率分布によって前記所与のグラウンドトゥルース出力に割り当てられた確率が確信度しきい値未満であるときに、前記所与のラベルありトレーニング入力について生成された確率分布による前記所与のグラウンドトゥルース出力の負の対数尤度に基づき、
前記確率分布によって前記所与のグラウンドトゥルース出力に割り当てられた前記確率が前記確信度しきい値以上であるときに、ゼロに等しい、
請求項1から4のいずれか一項に記載の方法。 - トレーニングする前記ステップが、
トレーニングが進行するにつれて前記確信度しきい値を増大させるステップ
を含む、請求項5に記載の方法。 - 前記確信度しきい値を増大させるステップが、各トレーニングステップ後に前記確信度しきい値を増大させるステップを含む、請求項6に記載の方法。
- 前記機械学習モデルが、視覚データを含むモデル入力をモデル出力にマッピングし、それにより、コンピュータビジョンタスクを実行するようにトレーニングされる、請求項1から7のいずれか一項に記載の方法。
- 前記機械学習タスクが画像分類であり、
前記モデル入力が画像であり、
所与の画像についての前記モデル出力が、物体カテゴリの集合のそれぞれについての確率であり、
各確率が、前記画像が前記物体カテゴリに属する物体を含む推定尤度を表す、請求項1から8のいずれか一項に記載の方法。 - 前記機械学習モデルが、音声分類タスクを実行するために口頭による発話を表すオーディオデータを含む入力を出力にマッピングするようにトレーニングされる、請求項1から7のいずれか一項に記載の方法。
- モデル入力が、患者の電子健康記録データを含み、
前記対応するモデル出力が、前記患者にとってあり得る診断の確率分布を含む、請求項1から7のいずれか一項に記載の方法。 - 1つまたは複数のコンピュータと、命令を記憶した1つまたは複数の記憶デバイスとを備え、前記命令が、前記1つまたは複数のコンピュータによって実行されると、前記1つまたは複数のコンピュータに請求項1~11のいずれか一項に記載のそれぞれの方法の動作を実行させる、システム。
- 1つまたは複数のコンピュータによって実行されると、前記1つまたは複数のコンピュータに請求項1~11のいずれか一項に記載のそれぞれの方法の動作を実行させる命令を記憶した、1つまたは複数のコンピュータ記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962838932P | 2019-04-25 | 2019-04-25 | |
US62/838,932 | 2019-04-25 | ||
PCT/US2020/029945 WO2020219971A1 (en) | 2019-04-25 | 2020-04-24 | Training machine learning models using unsupervised data augmentation |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022530127A JP2022530127A (ja) | 2022-06-27 |
JP7483751B2 true JP7483751B2 (ja) | 2024-05-15 |
Family
ID=70918958
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021563340A Active JP7483751B2 (ja) | 2019-04-25 | 2020-04-24 | 教師なしデータ拡張を使用した機械学習モデルのトレーニング |
Country Status (5)
Country | Link |
---|---|
US (1) | US12118064B2 (ja) |
EP (1) | EP3942479A1 (ja) |
JP (1) | JP7483751B2 (ja) |
CN (1) | CN113826125A (ja) |
WO (1) | WO2020219971A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11922303B2 (en) * | 2019-11-18 | 2024-03-05 | Salesforce, Inc. | Systems and methods for distilled BERT-based training model for text classification |
US11687780B2 (en) * | 2020-07-02 | 2023-06-27 | Samsung Electronics Co., Ltd | Method and apparatus for data efficient semantic segmentation |
CN113642741B (zh) * | 2021-08-12 | 2023-08-15 | 北京百度网讯科技有限公司 | 模型、数据生成方法、装置、电子设备及存储介质 |
CN113792146A (zh) * | 2021-09-17 | 2021-12-14 | 平安科技(深圳)有限公司 | 基于人工智能的文本分类方法、装置、电子设备及介质 |
CN115392456B (zh) * | 2022-08-30 | 2023-10-10 | 北京交通大学 | 融合优化算法渐近正态性的高迁移对抗样本生成方法 |
KR102576320B1 (ko) * | 2023-04-19 | 2023-09-11 | (주)유알피 | 딥러닝 기반 생성형 ai 시스템의 학습용 데이터셋 증폭장치 및 그 방법 |
KR102655929B1 (ko) * | 2023-08-18 | 2024-04-11 | 주식회사 티사이언티픽 | 생성형 ai 모델을 활용한 대화형 텍스트 데이터 생성 시스템 및 그 방법 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017037588A (ja) | 2015-08-14 | 2017-02-16 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
US20180285771A1 (en) | 2017-03-31 | 2018-10-04 | Drvision Technologies Llc | Efficient machine learning method |
JP2018205920A (ja) | 2017-05-31 | 2018-12-27 | 富士通株式会社 | 学習プログラム、学習方法および物体検知装置 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10803143B2 (en) * | 2015-07-30 | 2020-10-13 | Siemens Healthcare Gmbh | Virtual biopsy techniques for analyzing diseases |
WO2017158058A1 (en) * | 2016-03-15 | 2017-09-21 | Imra Europe Sas | Method for classification of unique/rare cases by reinforcement learning in neural networks |
US10809361B2 (en) * | 2017-05-31 | 2020-10-20 | Uatc, Llc | Hybrid-view LIDAR-based object detection |
US11694109B2 (en) * | 2017-08-16 | 2023-07-04 | ODH, Inc. | Data processing apparatus for accessing shared memory in processing structured data for modifying a parameter vector data structure |
US10768628B2 (en) * | 2017-12-12 | 2020-09-08 | Uatc, Llc | Systems and methods for object detection at various ranges using multiple range imagery |
US11443178B2 (en) * | 2017-12-15 | 2022-09-13 | Interntional Business Machines Corporation | Deep neural network hardening framework |
US11069030B2 (en) * | 2018-03-22 | 2021-07-20 | Adobe, Inc. | Aesthetics-guided image enhancement |
US20190310651A1 (en) * | 2018-04-10 | 2019-10-10 | Uber Technologies, Inc. | Object Detection and Determination of Motion Information Using Curve-Fitting in Autonomous Vehicle Applications |
US20190354839A1 (en) * | 2018-05-18 | 2019-11-21 | Google Llc | Systems and Methods for Slate Optimization with Recurrent Neural Networks |
US20200034707A1 (en) * | 2018-07-27 | 2020-01-30 | drchrono inc. | Neural Network Encoders and Decoders for Physician Practice Optimization |
US20200202210A1 (en) * | 2018-12-24 | 2020-06-25 | Nokia Solutions And Networks Oy | Systems and methods for training a neural network |
US11048935B2 (en) * | 2019-01-28 | 2021-06-29 | Adobe Inc. | Generating shift-invariant neural network outputs |
US11580317B2 (en) * | 2019-03-16 | 2023-02-14 | Nec Corporation | Tracking RFID groups with spatio-temporal proximity |
-
2020
- 2020-04-24 CN CN202080031320.7A patent/CN113826125A/zh active Pending
- 2020-04-24 US US17/606,190 patent/US12118064B2/en active Active
- 2020-04-24 EP EP20729262.4A patent/EP3942479A1/en active Pending
- 2020-04-24 JP JP2021563340A patent/JP7483751B2/ja active Active
- 2020-04-24 WO PCT/US2020/029945 patent/WO2020219971A1/en unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017037588A (ja) | 2015-08-14 | 2017-02-16 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
US20180285771A1 (en) | 2017-03-31 | 2018-10-04 | Drvision Technologies Llc | Efficient machine learning method |
JP2018205920A (ja) | 2017-05-31 | 2018-12-27 | 富士通株式会社 | 学習プログラム、学習方法および物体検知装置 |
Non-Patent Citations (1)
Title |
---|
SAJJADI, Mehdi et al.,Regularization With Stochastic Transformations and Perturbations for Deep Semi-Supervised Learning,arXiv.org,Cornell University,2016年06月14日,pp. 1-9,[検索日 2024.03.25], インターネット <URL: https://doi.org/10.48550/arXiv.1606.04586> |
Also Published As
Publication number | Publication date |
---|---|
US12118064B2 (en) | 2024-10-15 |
US20220215209A1 (en) | 2022-07-07 |
EP3942479A1 (en) | 2022-01-26 |
JP2022530127A (ja) | 2022-06-27 |
WO2020219971A1 (en) | 2020-10-29 |
CN113826125A (zh) | 2021-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7483751B2 (ja) | 教師なしデータ拡張を使用した機械学習モデルのトレーニング | |
US11568207B2 (en) | Learning observation representations by predicting the future in latent space | |
CN110520871B (zh) | 使用学习进度测量训练机器学习模型 | |
US11875262B2 (en) | Learning neural network structure | |
US11227581B2 (en) | Systems and methods for generating a response based on task-independent conversational responses or task-specific responses | |
US20240127058A1 (en) | Training neural networks using priority queues | |
US20220092416A1 (en) | Neural architecture search through a graph search space | |
US11922281B2 (en) | Training machine learning models using teacher annealing | |
US10824946B2 (en) | Training neural networks using posterior sharpening | |
US20220230065A1 (en) | Semi-supervised training of machine learning models using label guessing | |
US20200104707A1 (en) | Sampling from a generator neural network using a discriminator neural network | |
CN115398446A (zh) | 使用符号编程的机器学习算法搜索 | |
CN111832699A (zh) | 用于神经网络的计算高效富于表达的输出层 | |
US20240152809A1 (en) | Efficient machine learning model architecture selection | |
CN114730380A (zh) | 神经网络的深度并行训练 | |
US12056613B2 (en) | Training neural network systems to perform multiple machine learning tasks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230407 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240312 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240401 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240501 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7483751 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |