JP7494316B2 - ブートストラッピングされた潜在表現を使用する自己教師付き表現学習 - Google Patents
ブートストラッピングされた潜在表現を使用する自己教師付き表現学習 Download PDFInfo
- Publication number
- JP7494316B2 JP7494316B2 JP2022560500A JP2022560500A JP7494316B2 JP 7494316 B2 JP7494316 B2 JP 7494316B2 JP 2022560500 A JP2022560500 A JP 2022560500A JP 2022560500 A JP2022560500 A JP 2022560500A JP 7494316 B2 JP7494316 B2 JP 7494316B2
- Authority
- JP
- Japan
- Prior art keywords
- neural network
- data item
- parameters
- online
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013528 artificial neural network Methods 0.000 claims description 307
- 238000012549 training Methods 0.000 claims description 92
- 238000000034 method Methods 0.000 claims description 83
- 238000012545 processing Methods 0.000 claims description 64
- 230000009466 transformation Effects 0.000 claims description 29
- 238000004590 computer program Methods 0.000 claims description 17
- 239000013598 vector Substances 0.000 description 16
- 230000008569 process Effects 0.000 description 12
- 238000000844 transformation Methods 0.000 description 10
- 238000003709 image segmentation Methods 0.000 description 9
- 230000003190 augmentative effect Effects 0.000 description 8
- 238000001514 detection method Methods 0.000 description 8
- 230000011218 segmentation Effects 0.000 description 8
- 239000003795 chemical substances by application Substances 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000004807 localization Effects 0.000 description 3
- 238000011524 similarity measure Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 101100153586 Caenorhabditis elegans top-1 gene Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 101100370075 Mus musculus Top1 gene Proteins 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Description
本出願は、2020年6月5に出願された米国仮特許出願第63/035,583号、および2020年6月15日に出願された米国仮特許出願第63/039,343号に対する優先権を主張するものである。先願の開示は、本出願の開示の一部と見なされ、参照によって本開示に組み込まれている。
102 データ項目
110 オンラインニューラルネットワーク
112、122 エンコーダニューラルネットワーク
114、124 投影ニューラルネットワーク
116 予測ニューラルネットワーク
118 予測
120 ターゲットニューラルネットワーク
126 ターゲット出力
130 訓練エンジン
400 コンピュータ実装データ項目処理ニューラルネットワークシステム
402 システムヘッド
404 システム出力
Claims (18)
- 自己教師付き学習方法においてラベルの無い訓練データを用いてニューラルネットワークを訓練する、コンピュータに実装される方法であって、
訓練データ項目の第1の変換されたビュー (ν') を、第1のエンコーダニューラルネットワークを備えるターゲットニューラルネットワークを用いて処理して、前記訓練データ項目の表現を含むターゲット出力を生成するステップと、
前記訓練データ項目の第2の変換されたビュー (ν) を、第2のエンコーダニューラルネットワークを備えるオンラインニューラルネットワークを用いて処理して、前記訓練データ項目の表現を含む前記ターゲット出力の予測を生成するステップと、
前記ターゲット出力の前記予測と前記ターゲット出力との間の誤差を最小化するために、前記オンラインニューラルネットワークの1つまたは複数のパラメータを更新するステップと、
前記オンラインニューラルネットワークの前記パラメータに基づいて前記ターゲットニューラルネットワークの1つまたは複数のパラメータを更新するステップと
を含み、
前記オンラインニューラルネットワークは前記ターゲット出力を予測するための予測ニューラルネットワークをさらに備え、前記ターゲットニューラルネットワークは予測ニューラルネットワークを備えず、
前記方法は、
前記訓練データ項目の表現を受信するステップと、
前記予測ニューラルネットワークのパラメータによって具現化される回帰モデルを用いて、前記訓練データ項目の前記表現を処理することによって前記ターゲット出力の前記予測を生成するステップと
を含む命令を前記予測ニューラルネットワークによって実行するステップをさらに含む
方法。 - 前記ターゲットニューラルネットワークの1つまたは複数のパラメータを更新するステップが、
前記オンラインニューラルネットワークの前記パラメータの移動平均を用いて前記ターゲットニューラルネットワークの1つまたは複数のパラメータを更新するステップ
を含む、請求項1に記載の方法。 - 前記ターゲットニューラルネットワークの1つまたは複数のパラメータを更新するステップが、
ξ←τξ+(1-τ)θに従って前記ターゲットニューラルネットワークの前記1つまたは複数のパラメータの更新された値を決定するステップを含み、式中、ξが、前記ターゲットニューラルネットワークの前記パラメータを表し、θが、前記オンラインニューラルネットワークの前記パラメータを表し、τが、減衰率である、
請求項1または2に記載の方法。 - 前記第1のエンコーダニューラルネットワークが、第1の残差ニューラルネットワークを含み、前記第2のエンコーダニューラルネットワークが、第2の残差ニューラルネットワークを含む
請求項1に記載の方法。 - 前記オンラインニューラルネットワークおよび前記ターゲットニューラルネットワークがそれぞれ、それぞれの投影ニューラルネットワークを含み、前記方法が、各投影ニューラルネットワークによって、
前記訓練データ項目の前記表現を受信することと、
前記訓練データ項目の前記表現を処理して、前記表現の次元を低減させることと
を含む動作を行うステップをさらに含む、
請求項1または4に記載の方法。 - 各投影ニューラルネットワークが、多層パーセプトロンを含む、請求項5に記載の方法。
- 前記予測ニューラルネットワークが、多層パーセプトロンを含む、請求項1に記載の方法。
- 前記オンラインニューラルネットワークおよび/または前記ターゲットニューラルネットワークの前記パラメータをランダム値に初期化するステップ
をさらに含む、請求項1から7のいずれか一項に記載の方法。 - 第1のデータ項目変換を前記訓練データ項目に適用して、前記訓練データ項目の前記第1の変換されたビューを生成するステップと、
第2のデータ項目変換を前記訓練データ項目に適用して、前記訓練データ項目の前記第2の変換されたビューを生成するステップであって、前記第2のデータ項目変換が、前記第1のデータ項目変換とは異なる、ステップと
をさらに含む、請求項1から8のいずれか一項に記載の方法。 - 前記オンラインニューラルネットワークの1つまたは複数のパラメータを更新するステップが、
前記ターゲット出力の前記予測を正規化するステップ、および
前記ターゲット出力の前記正規化された予測と前記ターゲット出力との間の二乗誤差を最小化するステップ
を含む、請求項1から9のいずれか一項に記載の方法。 - 複数の訓練データ項目を含むバッチ内の各訓練データ項目について、前記ターゲットニューラルネットワークを用いて前記訓練データ項目の前記第1の変換されたビューを処理する動作、および前記オンラインニューラルネットワークを用いて前記訓練データ項目の前記第2の変換されたビューを処理する動作、次いで、前記オンラインニューラルネットワークの前記1つまたは複数のパラメータを更新する動作、および前記ターゲットニューラルネットワークの前記1つまたは複数のパラメータを更新する動作を反復的に行うステップをさらに含む、請求項1から10のいずれか一項に記載の方法。
- データ項目を処理する、コンピュータに実装される方法であって、
入力データ項目を訓練されたオンラインニューラルネットワークの一部に提供するステップであって、前記オンラインニューラルネットワークが、請求項1から11のいずれか一項に記載の方法のそれぞれの動作を行うことによって訓練済みである、ステップと、
前記訓練されたオンラインニューラルネットワークの前記一部を使用して、前記入力データ項目を処理するステップと、
前記訓練されたオンラインニューラルネットワークの前記一部から前記入力データ項目の表現を出力するステップと、
前記入力データ項目の前記表現を処理するステップと
を含む
方法。 - 前記オンラインニューラルネットワークが、前記入力データ項目の前記表現を生成するように構成されている残差ニューラルネットワークを含む、請求項12に記載の方法。
- 前記入力データ項目の前記表現を処理するステップが、
前記入力データ項目の前記表現を使用して、前記入力データ項目を分類するステップを含む、請求項12または13に記載の方法。 - 前記訓練データ項目が、訓練画像を含み、前記入力データ項目が入力画像を含む、請求項12から14のいずれか一項に記載の方法。
- 前記訓練データ項目が、画像を含み、前記方法が、前記訓練されたオンラインニューラルネットワークのエンコーダニューラルネットワークを使用して、入力画像のピクセルの表現を生成するステップと、前記表現を使用して、画像処理タスクを行うステップとをさらに含む、請求項1から11のいずれか一項に記載の方法。
- 1つまたは複数のコンピュータと、命令を記憶した1つまたは複数のストレージデバイスとを備えるシステムであって、前記命令が、前記1つまたは複数のコンピュータによって実行されると、前記1つまたは複数のコンピュータに、請求項1から16のいずれか一項に記載のそれぞれの方法を行わせる、システム。
- コンピュータプログラムであって、前記プログラムが、1つまたは複数のコンピュータによって実行されると、前記1つまたは複数のコンピュータに、請求項1から16のいずれか一項に記載のそれぞれの方法を行わせる、コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024082493A JP2024110969A (ja) | 2020-06-05 | 2024-05-21 | ブートストラッピングされた潜在表現を使用する自己教師付き表現学習 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063035583P | 2020-06-05 | 2020-06-05 | |
US63/035,583 | 2020-06-05 | ||
US202063039343P | 2020-06-15 | 2020-06-15 | |
US63/039,343 | 2020-06-15 | ||
PCT/EP2021/065071 WO2021245277A1 (en) | 2020-06-05 | 2021-06-04 | Self-supervised representation learning using bootstrapped latent representations |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024082493A Division JP2024110969A (ja) | 2020-06-05 | 2024-05-21 | ブートストラッピングされた潜在表現を使用する自己教師付き表現学習 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023527510A JP2023527510A (ja) | 2023-06-29 |
JP7494316B2 true JP7494316B2 (ja) | 2024-06-03 |
Family
ID=76375056
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022560500A Active JP7494316B2 (ja) | 2020-06-05 | 2021-06-04 | ブートストラッピングされた潜在表現を使用する自己教師付き表現学習 |
JP2024082493A Pending JP2024110969A (ja) | 2020-06-05 | 2024-05-21 | ブートストラッピングされた潜在表現を使用する自己教師付き表現学習 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024082493A Pending JP2024110969A (ja) | 2020-06-05 | 2024-05-21 | ブートストラッピングされた潜在表現を使用する自己教師付き表現学習 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20210383225A1 (ja) |
EP (1) | EP4111376A1 (ja) |
JP (2) | JP7494316B2 (ja) |
KR (1) | KR20220148274A (ja) |
CN (1) | CN115427970A (ja) |
CA (1) | CA3174279A1 (ja) |
WO (1) | WO2021245277A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11922314B1 (en) * | 2018-11-30 | 2024-03-05 | Ansys, Inc. | Systems and methods for building dynamic reduced order physical models |
US12106549B2 (en) * | 2021-11-12 | 2024-10-01 | Siemens Healthineers Ag | Self-supervised learning for artificial intelligence-based systems for medical imaging analysis |
CN114299361A (zh) * | 2021-12-27 | 2022-04-08 | 北京达佳互联信息技术有限公司 | 视频质量确定模型的训练方法、视频推荐方法及装置 |
CN114419395A (zh) * | 2022-01-20 | 2022-04-29 | 江苏大学 | 基于中间位置编码的在线目标检测模型训练方法 |
CN114863348B (zh) * | 2022-06-10 | 2024-08-23 | 西安电子科技大学 | 基于自监督的视频目标分割方法 |
WO2023244567A1 (en) * | 2022-06-13 | 2023-12-21 | Rensselaer Polytechnic Institute | Self-supervised representation learning with multi-segmental informational coding |
CN115186720B (zh) * | 2022-09-07 | 2023-01-06 | 中国科学技术大学 | 预训练模型、无线感知模型的训练方法及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018055259A (ja) | 2016-09-27 | 2018-04-05 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP2019528511A (ja) | 2016-11-22 | 2019-10-10 | 三菱電機株式会社 | ニューロンネットワークをトレーニングする方法及び能動学習システム |
JP2019220104A (ja) | 2018-06-22 | 2019-12-26 | 日本電信電話株式会社 | センサノード及びデータセンタとして機能する装置、センサネットワーク、通信方法及びプログラム |
WO2020110775A1 (ja) | 2018-11-30 | 2020-06-04 | 富士フイルム株式会社 | 画像処理装置、画像処理方法、及びプログラム |
-
2021
- 2021-06-04 JP JP2022560500A patent/JP7494316B2/ja active Active
- 2021-06-04 WO PCT/EP2021/065071 patent/WO2021245277A1/en unknown
- 2021-06-04 CA CA3174279A patent/CA3174279A1/en active Pending
- 2021-06-04 EP EP21731442.6A patent/EP4111376A1/en active Pending
- 2021-06-04 US US17/338,777 patent/US20210383225A1/en active Pending
- 2021-06-04 CN CN202180025878.9A patent/CN115427970A/zh active Pending
- 2021-06-04 KR KR1020227034239A patent/KR20220148274A/ko unknown
-
2024
- 2024-05-21 JP JP2024082493A patent/JP2024110969A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018055259A (ja) | 2016-09-27 | 2018-04-05 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP2019528511A (ja) | 2016-11-22 | 2019-10-10 | 三菱電機株式会社 | ニューロンネットワークをトレーニングする方法及び能動学習システム |
JP2019220104A (ja) | 2018-06-22 | 2019-12-26 | 日本電信電話株式会社 | センサノード及びデータセンタとして機能する装置、センサネットワーク、通信方法及びプログラム |
WO2020110775A1 (ja) | 2018-11-30 | 2020-06-04 | 富士フイルム株式会社 | 画像処理装置、画像処理方法、及びプログラム |
Non-Patent Citations (2)
Title |
---|
SOHN, Kihyuk et.al.,"FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence",arXiv [online],2020年01月21日,[2023年10月19日検索],インターネット<URL:https://arxiv.org/abs/2001.07685v1>, arXiv:2001.07685v1 |
TARVAINEN, Antti et.al.,"Mean teachers are better role models: Weight-averaged consistency targets improve semi-supervised deep learning results",arXiv [online],2018年04月16日,[2023年10月19日検索],インターネット<URL:https://arxiv.org/abs/1703.01780v6>, arXiv:1703.01780v6 |
Also Published As
Publication number | Publication date |
---|---|
US20210383225A1 (en) | 2021-12-09 |
CA3174279A1 (en) | 2021-12-09 |
CN115427970A (zh) | 2022-12-02 |
KR20220148274A (ko) | 2022-11-04 |
JP2024110969A (ja) | 2024-08-16 |
JP2023527510A (ja) | 2023-06-29 |
WO2021245277A1 (en) | 2021-12-09 |
EP4111376A1 (en) | 2023-01-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7494316B2 (ja) | ブートストラッピングされた潜在表現を使用する自己教師付き表現学習 | |
US11361546B2 (en) | Action recognition in videos using 3D spatio-temporal convolutional neural networks | |
US20230229919A1 (en) | Learning to generate synthetic datasets for training neural networks | |
US12073304B2 (en) | Classifying input examples using a comparison set | |
US11875269B2 (en) | Large scale generative neural network model with inference for representation learning using adversarial training | |
CN110730970B (zh) | 优化策略控制器的方法和系统 | |
CN113039555B (zh) | 在视频剪辑中进行动作分类的方法、系统及存储介质 | |
US20230351203A1 (en) | Method for knowledge distillation and model genertation | |
US20220237890A1 (en) | Method and apparatus with neural network training | |
CN116210030A (zh) | 基于半监督关键点的模型 | |
US20220292765A1 (en) | Fitting 3d primitives to a high-resolution point cloud | |
CN116997908A (zh) | 用于分类类型任务的连续学习神经网络系统训练 | |
CN118382878A (zh) | 跨域图像扩散模型 | |
WO2024081778A1 (en) | A generalist framework for panoptic segmentation of images and videos | |
US20210383226A1 (en) | Cross-transformer neural network system for few-shot similarity determination and classification | |
CN117377983A (zh) | 具有卷积和注意力的机器学习模型的系统和方法 | |
WO2023169696A1 (en) | Training object discovery neural networks and feature representation neural networks using self-supervised learning | |
Storey et al. | Atypical facial landmark localisation with stacked hourglass networks: a study on 3D facial modelling for medical diagnosis | |
WO2024184457A1 (en) | Adaptive systems including pre-trained neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221202 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221202 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231011 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231030 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240422 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240522 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7494316 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |