JP2023527511A - 少数ショット類似性決定および分類のためのクロストランスフォーマニューラルネットワークシステム - Google Patents
少数ショット類似性決定および分類のためのクロストランスフォーマニューラルネットワークシステム Download PDFInfo
- Publication number
- JP2023527511A JP2023527511A JP2022560956A JP2022560956A JP2023527511A JP 2023527511 A JP2023527511 A JP 2023527511A JP 2022560956 A JP2022560956 A JP 2022560956A JP 2022560956 A JP2022560956 A JP 2022560956A JP 2023527511 A JP2023527511 A JP 2023527511A
- Authority
- JP
- Japan
- Prior art keywords
- neural network
- query
- support
- embeddings
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 184
- 238000000034 method Methods 0.000 claims abstract description 64
- 238000011524 similarity measure Methods 0.000 claims abstract description 62
- 230000008569 process Effects 0.000 claims abstract description 26
- 238000012549 training Methods 0.000 claims description 167
- 230000009471 action Effects 0.000 claims description 24
- 230000009466 transformation Effects 0.000 claims description 16
- 230000001667 episodic effect Effects 0.000 claims description 12
- 238000000844 transformation Methods 0.000 claims description 5
- 238000012937 correction Methods 0.000 claims description 3
- 230000004931 aggregating effect Effects 0.000 claims description 2
- 238000002372 labelling Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 37
- 238000012545 processing Methods 0.000 description 20
- 238000004590 computer program Methods 0.000 description 12
- 239000013598 vector Substances 0.000 description 12
- 238000009826 distribution Methods 0.000 description 8
- 230000015654 memory Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 230000002776 aggregation Effects 0.000 description 4
- 238000004220 aggregation Methods 0.000 description 4
- 230000000306 recurrent effect Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 238000012886 linear function Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000002787 reinforcement Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000001994 activation Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000012015 optical character recognition Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
Description
本出願は、2020年6月5日に出願された米国仮出願第63/035,469号、および2020年6月16日に出願された第63/039,748号に対する優先権を主張する。先行出願の開示は、本出願の開示の一部と見なされ、参照により本出願の開示に組み込まれる。
qp=Ω・φ(xq)p
上式で、qpはクエリキー埋め込みの空間位置pのベクトルである。次の式は、クエリキー埋め込みとサポートキー埋め込みjの空間位置ペアpおよびmに対応するアテンションマップ値の例示的な計算を示している。
wp=Λ・φ(xq)p
上式で、wpはクエリ値埋め込みの空間位置pにおけるベクトルである。類似性測度112は、以下の例示的な式に従ってユークリッド距離に基づいて計算され得る。
101 クエリデータ項目
102 サポートセット
103 サポートキー埋め込み
104 サポート値埋め込み
105 キー埋め込みニューラルネットワークサブシステム
106 クエリキー埋め込み
107 アテンションマップサブシステム
108 アテンションマップ
109 値埋め込みニューラルネットワークサブシステム
110 クエリ値埋め込み
111 類似性サブシステム
112 類似性測度
113 分類子サブシステム
114 出力分類
201 サポートセット
202 サポートキー埋め込み
206 プロトタイプ
Claims (30)
- クエリデータ項目とサポートデータ項目のセットとの間の類似性測度を決定するためのニューラルネットワークシステムであって、前記ニューラルネットワークシステムが、1つまたは複数のコンピュータと、前記1つまたは複数のコンピュータによって遂行されると、前記1つまたは複数のコンピュータに、
前記クエリデータ項目を受信することと、
サポートセットであって、前記サポートセット内のそれぞれのサポートデータ項目に対するサポートキー埋め込みおよびサポート値埋め込みを備える1つまたは複数のサポートデータ項目のサポートセットを取得することと、
キー埋め込みを生成するためにデータ項目を処理するように構成されたキー埋め込みニューラルネットワークサブシステムを使用して、前記クエリデータ項目のクエリキー埋め込みを生成することと、
それぞれのサポートデータ項目に対する前記クエリキー埋め込みと前記サポートキー埋め込みとの間の類似性に基づいて、アテンションマップを生成することと、
値埋め込みを生成するためにデータ項目を処理するように構成された値埋め込みニューラルネットワークサブシステムを使用して、前記クエリデータ項目に対してクエリ値埋め込みを生成することと、
前記アテンションマップ、それぞれのサポートデータ項目に対する前記サポート値埋め込み、および前記クエリ値埋め込みに基づいて、前記クエリデータ項目と前記サポートセットとの間の類似性尺度の類似性測度を決定することと
を備える動作を実行させる命令を記憶する1つまたは複数のストレージデバイスとによって実装される、ニューラルネットワークシステム。 - 前記動作が、
前記キー埋め込みニューラルネットワークサブシステムを使用して、前記サポートキー埋め込みを生成することをさらに備える、請求項1に記載のニューラルネットワークシステム。 - 前記動作が、
前記値埋め込みニューラルネットワークサブシステムを使用して、前記サポート値埋め込みを生成することをさらに備える、請求項1または2に記載のニューラルネットワークシステム。 - 前記サポートデータ項目が1つまたは複数のカテゴリに関連付けられる、請求項1から3のいずれか一項に記載のニューラルネットワークシステム。
- 前記動作が、
前記クエリデータ項目を、それぞれのカテゴリごとに決定された類似性測度に基づいて分類することをさらに備える、請求項4に記載のニューラルネットワークシステム。 - 前記動作が、
前記サポート値埋め込みを、前記アテンションマップに基づいて重み付けすることと、
前記サポートセットに関連付けられるカテゴリごとのプロトタイプを生成するために、同じカテゴリに関連付けられる前記サポートデータ項目の前記重み付けされたサポート値埋め込みが集計することと
をさらに備える、請求項4または5に記載のニューラルネットワークシステム。 - 類似性測度を決定することが、それぞれのカテゴリごとに、前記クエリ値埋め込みと前記プロトタイプとの間の類似性測度を決定することを備える、請求項6に記載のニューラルネットワークシステム。
- 前記類似性測度が、前記クエリ値埋め込みと前記プロトタイプとの間の距離に基づく、請求項6または7に記載のニューラルネットワークシステム。
- 前記距離がユークリッド距離に基づく、請求項8に記載のニューラルネットワークシステム。
- 前記アテンションマップが、それぞれのサポートデータ項目に対する前記クエリキー埋め込みと前記サポートキー埋め込みとの間のスケーリングされていない類似性測度に基づいて生成される、請求項1から9のいずれか一項に記載のニューラルネットワークシステム。
- それぞれのサポートデータ項目に対する前記クエリキー埋め込みと前記サポートキー埋め込みとの間の前記類似性が、内積に基づいている、請求項1から10のいずれか一項に記載のニューラルネットワークシステム。
- それぞれのサポートデータ項目に対する前記クエリキー埋め込みと前記サポートキー埋め込みとの間の前記類似性が、前記クエリキー埋め込みの特徴と前記サポートキー埋め込みのそれぞれの特徴との間の類似性に基づいている、請求項1から11のいずれか一項に記載のニューラルネットワークシステム。
- 前記特徴が空間的特徴である、請求項12に記載のニューラルネットワークシステム。
- 前記アテンションマップが、同じカテゴリのそれぞれのサポートデータ項目に対する前記クエリキー埋め込みと前記サポートキー埋め込みとの間の前記類似性測度を受信するソフトマックス関数に基づいて生成される、請求項4から13のいずれか一項に記載のニューラルネットワークシステム。
- 前記キー埋め込みニューラルネットワークサブシステムおよび/または前記値埋め込みサブシステムが線形出力層を備える、請求項1から14のいずれか一項に記載のニューラルネットワークシステム。
- 前記キー埋め込みニューラルネットワークサブシステムおよび/または前記値埋め込みニューラルネットワークサブシステムが畳み込み層を備える、請求項1から15のいずれか一項に記載のニューラルネットワークシステム。
- 前記データ項目が画像である、請求項1から16のいずれか一項に記載のニューラルネットワークシステム。
- 請求項1から17のいずれか一項に記載のニューラルネットワークシステムによって実装される動作を備える、クエリデータ項目とサポートデータ項目のセットとの間の類似性測度を決定する、コンピュータ実装方法。
- クエリデータ項目とサポートデータ項目のセットとの間の類似性測度を決定するためのニューラルネットワークシステムをトレーニングする方法であって、
複数のトレーニングエピソードにグループ化されたトレーニングデータ項目を備えるエピソードトレーニングデータセットを受信するステップであって、各トレーニングエピソードが、サポートトレーニングデータ項目のサポートセットとクエリセットに分割されたトレーニングデータ項目を備える、ステップと、
修正のためのトレーニングエピソードを選択するステップと、
前記選択されたトレーニングエピソードの前記サポートセット内の複数のサポートトレーニングデータ項目の各々について、前記サポートトレーニングデータ項目の第1および第2の変換されたバージョンを生成して、前記第1および第2の変換されたバージョンを、元の前記サポートトレーニングデータ項目を示すラベルでラベル付けするステップと、
前記サポートトレーニングデータ項目の前記第2の変換されたバージョンに基づいて、前記トレーニングエピソードの新しいクエリセットを生成するステップと、
前記選択されたトレーニングエピソードの前記クエリセットを前記新しいクエリセットで置き換えることによって、修正されたエピソードトレーニングデータセットを形成するステップと、
前記修正されたエピソードトレーニングデータセットを含むトレーニングセットを使用してニューラルネットワークを生成するステップと
を備える、方法。 - 前記第1の変換されたバージョンに基づいて、前記選択されたトレーニングエピソードの前記サポートセットを修正するステップをさらに備える、請求項19に記載の方法。
- 前記選択されたトレーニングエピソードの前記サポートセット内の複数のサポートトレーニングデータ項目の各々について、前記サポートトレーニングデータ項目の第1および第2の変換されたバージョンを生成するステップが、
前記選択されたトレーニングエピソードの前記サポートセット内のそれぞれのサポートトレーニングデータ項目ごとに、前記サポートトレーニングデータ項目の第1の変換されたバージョンを生成するステップと、
前記選択されたトレーニングエピソードの前記サポートセット内の前記サポートトレーニングデータ項目のサブセットについて、前記サポートトレーニングデータ項目のそれぞれの第2の変換されたバージョンを生成するステップと
を備える、請求項19または20に記載の方法。 - 前記ニューラルネットワークが、修正されたトレーニングエピソードと修正されていないトレーニングエピソードの両方について、同じ損失関数に基づいて生成される、請求項19から21のいずれか一項に記載の方法。
- 前記ニューラルネットワークが、分類損失関数に基づいて生成される、請求項19から22のいずれか一項に記載の方法。
- 前記ニューラルネットワークが、クロスエントロピ損失関数に基づいて生成される、請求項19から23のいずれか一項に記載の方法。
- 前記ニューラルネットワークが、正規化された確率的勾配降下技法に基づいて生成される、請求項19から24のいずれか一項に記載の方法。
- サポートトレーニングデータ項目の変換されたバージョンを生成するステップが、トリミング動作、色歪み動作、またはガウスぼかし動作に基づいて変換を適用するステップを備える、請求項19から25のいずれか一項に記載の方法。
- サポートトレーニングデータ項目の変換されたバージョンを生成するステップが、前記サポートデータ項目の変換されたバージョンを生成するために、前記サポートトレーニングデータ項目にランダムに選択された変換関数を適用するステップを備える、請求項19から26のいずれか一項に記載の方法。
- 前記生成されたニューラルネットワークが、請求項1から17のいずれか一項に記載のニューラルネットワークシステムである、請求項19から27のいずれか一項に記載の方法。
- 1つまたは複数のコンピュータと、前記1つまたは複数のコンピュータによって遂行されると、前記1つまたは複数のコンピュータに、請求項19から28のいずれか一項に記載のそれぞれの方法の動作を実行させる命令を記憶する1つまたは複数のストレージデバイスとを備える、システム。
- 1つまたは複数のコンピュータによって遂行されると、前記1つまたは複数のコンピュータに、請求項1から17および29のいずれか一項に記載のシステムを実装させ、ならびに/または請求項18から28のいずれか一項に記載のそれぞれの方法の動作を実行させる命令を記憶する1つまたは複数のコンピュータストレージ媒体。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063035469P | 2020-06-05 | 2020-06-05 | |
US63/035,469 | 2020-06-05 | ||
US202063039748P | 2020-06-16 | 2020-06-16 | |
US63/039,748 | 2020-06-16 | ||
PCT/EP2021/065125 WO2021245287A2 (en) | 2020-06-05 | 2021-06-07 | Cross-transformer neural network system for few-shot similarity determination and classification |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023527511A true JP2023527511A (ja) | 2023-06-29 |
Family
ID=76392368
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022560956A Pending JP2023527511A (ja) | 2020-06-05 | 2021-06-07 | 少数ショット類似性決定および分類のためのクロストランスフォーマニューラルネットワークシステム |
Country Status (6)
Country | Link |
---|---|
US (1) | US20210383226A1 (ja) |
EP (1) | EP4115341A2 (ja) |
JP (1) | JP2023527511A (ja) |
KR (1) | KR20220154181A (ja) |
CN (1) | CN115362446A (ja) |
WO (1) | WO2021245287A2 (ja) |
-
2021
- 2021-06-04 US US17/338,809 patent/US20210383226A1/en active Pending
- 2021-06-07 WO PCT/EP2021/065125 patent/WO2021245287A2/en unknown
- 2021-06-07 CN CN202180025868.5A patent/CN115362446A/zh active Pending
- 2021-06-07 KR KR1020227035481A patent/KR20220154181A/ko unknown
- 2021-06-07 EP EP21731745.2A patent/EP4115341A2/en active Pending
- 2021-06-07 JP JP2022560956A patent/JP2023527511A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4115341A2 (en) | 2023-01-11 |
WO2021245287A3 (en) | 2022-01-13 |
US20210383226A1 (en) | 2021-12-09 |
KR20220154181A (ko) | 2022-11-21 |
WO2021245287A2 (en) | 2021-12-09 |
CN115362446A (zh) | 2022-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10248664B1 (en) | Zero-shot sketch-based image retrieval techniques using neural networks for sketch-image recognition and retrieval | |
CN110574049B (zh) | 多任务多模态机器学习系统 | |
US20210271968A1 (en) | Generative neural network systems for generating instruction sequences to control an agent performing a task | |
US10997472B2 (en) | Classifying input examples using a comparison set | |
CN111727441A (zh) | 实现用于高效学习的条件神经过程的神经网络系统 | |
CN113795851A (zh) | 具有针对使用对抗训练的表示学习的推理的大规模生成神经网络模型 | |
JP7494316B2 (ja) | ブートストラッピングされた潜在表現を使用する自己教師付き表現学習 | |
CN110770759A (zh) | 神经网络系统 | |
CN112789626A (zh) | 可扩展和压缩的神经网络数据储存系统 | |
EP3884426A1 (en) | Action classification in video clips using attention-based neural networks | |
Huttunen | Deep neural networks: A signal processing perspective | |
US20230351203A1 (en) | Method for knowledge distillation and model genertation | |
US20240152749A1 (en) | Continual learning neural network system training for classification type tasks | |
JP2023527511A (ja) | 少数ショット類似性決定および分類のためのクロストランスフォーマニューラルネットワークシステム | |
WO2022167485A1 (en) | Neural networks with adaptive gradient clipping | |
Ji | [Retracted] Research on Recognition Effect of DSCN Network Structure in Hand‐Drawn Sketch | |
US11755883B2 (en) | Systems and methods for machine-learned models having convolution and attention | |
US20220245428A1 (en) | Machine-Learned Attention Models Featuring Omnidirectional Processing | |
WO2023169696A1 (en) | Training object discovery neural networks and feature representation neural networks using self-supervised learning | |
Du et al. | IGCE: A Compositional Energy Concept Based Deep Image Generation Neural Network | |
Mohit Sai Aravind et al. | Military Hand Signal Classification Using Deep Learning | |
WO2023059737A1 (en) | Self-attention based neural networks for processing network inputs from multiple modalities | |
WO2024138177A1 (en) | Recurrent interface networks | |
CN115769236A (zh) | 经由lambda函数以减少的特征物化进行长程交互的建模 | |
CN114386562A (zh) | 减少神经模型的资源需求的方法、系统和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221205 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240423 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240527 |