JP7471514B2 - 多様な人分析のための勾配分割によるマルチタスク学習 - Google Patents
多様な人分析のための勾配分割によるマルチタスク学習 Download PDFInfo
- Publication number
- JP7471514B2 JP7471514B2 JP2023514020A JP2023514020A JP7471514B2 JP 7471514 B2 JP7471514 B2 JP 7471514B2 JP 2023514020 A JP2023514020 A JP 2023514020A JP 2023514020 A JP2023514020 A JP 2023514020A JP 7471514 B2 JP7471514 B2 JP 7471514B2
- Authority
- JP
- Japan
- Prior art keywords
- task
- feature extractor
- gradient
- parameters
- tasks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims description 25
- 238000000638 solvent extraction Methods 0.000 title claims description 17
- 238000012549 training Methods 0.000 claims description 59
- 238000000034 method Methods 0.000 claims description 58
- 238000003062 neural network model Methods 0.000 claims description 8
- 238000003860 storage Methods 0.000 claims description 8
- 238000004891 communication Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 23
- 238000012545 processing Methods 0.000 description 22
- 238000004590 computer program Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000013459 approach Methods 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 208000035473 Communicable disease Diseases 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Description
Claims (20)
- 多様な人分析にふさわしい勾配分割によるマルチタスク学習のための方法であって、
各データセットがそれぞれ1つのタスクに関連付けられた、複数のデータセットを有する訓練データから画像を抽出し(1001)、
特徴量抽出器共有コンポーネント及び特徴量抽出器タスク固有コンポーネントを有する特徴量抽出器、並びにタスク固有ヘッドを含むニューラルネットワークモデルに前記訓練データを供給し(1003)、
前記特徴量抽出器の畳み込み層のより深い層のフィルタを、タスクの数であるN個のグループに分割し(1005)、
前記N個のグループの各グループにそれぞれ1つのタスクを割り当て(1007)、
前記特徴量抽出器タスク固有コンポーネントにおけるパラメータを、前記パラメータから、定数と、前記特徴量抽出器タスク固有コンポーネントの割り当てられたタスクの損失の前記パラメータに対しての勾配との積を減算することのみによって更新する、方法。 - 前記特徴量抽出器は前記抽出された画像から特徴量マップを生成し、前記タスク固有ヘッドは前記生成された特徴量マップに基づいてタスク予測を出力する、請求項1に記載の方法。
- 前記特徴量抽出器タスク固有コンポーネントにおけるパラメータは、その割り当てられたタスクのみの損失を最小化するように更新される、請求項1に記載の方法。
- 訓練中、前記N個のグループの各グループは、対応するタスク勾配によってのみ更新される、請求項1に記載の方法。
- 各タスクは、他のタスクから干渉されることなくその特徴量を学習する、請求項1に記載の方法。
- 前記フィルタを分割することは誤差逆伝播のみに適用される、請求項1に記載の方法。
- ラウンドロビンのバッチレベル更新メカニズムが適用される、請求項1に記載の方法。
- 多様な人分析にふさわしい勾配分割によるマルチタスク学習のためのコンピュータで読み取り可能なプログラムを含む、非一時的なコンピュータで読み取り可能な記録媒体であって、
前記コンピュータで読み取り可能なプログラムが前記コンピュータで実行されると、前記コンピュータに、
各データセットがそれぞれ1つのタスクに関連付けられた、複数のデータセットを有する訓練データから画像を抽出させ(1001)、
特徴量抽出器共有コンポーネント及び特徴量抽出器タスク固有コンポーネントを有する特徴量抽出器、並びにタスク固有ヘッドを含むニューラルネットワークモデルに前記訓練データを供給させ(1003)、
前記特徴量抽出器の畳み込み層のより深い層のフィルタを、タスクの数であるN個のグループに分割させ(1005)、
前記N個のグループの各グループにそれぞれ1つのタスクを割り当てさせ(1007)、
前記特徴量抽出器タスク固有コンポーネントにおけるパラメータを、前記パラメータから、定数と、前記特徴量抽出器タスク固有コンポーネントの割り当てられたタスクの損失の前記パラメータに対しての勾配との積を減算することのみによって更新させる、非一時的なコンピュータで読み取り可能な記録媒体。 - 前記特徴量抽出器は前記抽出された画像から特徴量マップを生成し、前記タスク固有ヘッドは前記生成された特徴量マップに基づいてタスク予測を出力する、請求項8に記載の非一時的なコンピュータで読み取り可能な記録媒体。
- 前記特徴量抽出器のタスク固有コンポーネントにおけるパラメータは、その割り当てられたタスクのみの損失を最小化するように更新される、請求項8に記載の非一時的なコンピュータで読み取り可能な記録媒体。
- 訓練中、前記N個のグループの各グループは、対応するタスク勾配によってのみ更新される、請求項8に記載の非一時的なコンピュータで読み取り可能な記録媒体。
- 各タスクは、他のタスクから干渉されることなくその特徴量を学習する、請求項8に記載の非一時的なコンピュータで読み取り可能な記録媒体。
- 前記フィルタを分割することは誤差逆伝播のみに適用される、請求項8に記載の非一時的なコンピュータで読み取り可能な記録媒体。
- ラウンドロビンのバッチレベル更新メカニズムが適用される、請求項8に記載の非一時的なコンピュータで読み取り可能な記録媒体。
- 多様な人分析にふさわしい勾配分割によるマルチタスク学習のためのシステムであって、
メモリと、
各データセットがそれぞれ1つのタスクに関連付けられた、複数のデータセットを有する訓練データから画像を抽出し(1001)、
特徴量抽出器共有コンポーネント及び特徴量抽出器タスク固有コンポーネントを有する特徴量抽出器、並びにタスク固有ヘッドを含むニューラルネットワークモデルに前記訓練データを供給し(1003)、
前記特徴量抽出器の畳み込み層のより深い層のフィルタを、タスクの数であるN個のグループに分割し(1005)、
前記N個のグループの各グループにそれぞれ1つのタスクを割り当て(1007)、
前記特徴量抽出器タスク固有コンポーネントにおけるパラメータは、前記パラメータから、定数と、前記特徴量抽出器タスク固有コンポーネントの割り当てられたタスクの損失の前記パラメータに対しての勾配との積を減算することのみによって更新されるように構成された、前記メモリと通信する1つまたは複数のプロセッサと、
を有するシステム。 - 前記特徴量抽出器は前記抽出された画像から特徴量マップを生成し、前記タスク固有ヘッドは前記生成された特徴量マップに基づいてタスク予測を出力する、請求項15に記載のシステム。
- 前記特徴量抽出器タスク固有コンポーネントにおけるパラメータは、その割り当てられたタスクのみの損失を最小化するように更新される、請求項15に記載のシステム。
- 訓練中、前記N個のグループの各グループは、対応するタスク勾配によってのみ更新される、請求項15に記載のシステム。
- 各タスクは、他のタスクから干渉されることなくその特徴量を学習する、請求項15に記載のシステム。
- 前記フィルタを分割することは誤差逆伝播のみに適用される、請求項15に記載のシステム。
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063094365P | 2020-10-21 | 2020-10-21 | |
US63/094,365 | 2020-10-21 | ||
US202063111662P | 2020-11-10 | 2020-11-10 | |
US63/111,662 | 2020-11-10 | ||
US202063113944P | 2020-11-15 | 2020-11-15 | |
US63/113,944 | 2020-11-15 | ||
US17/496,214 | 2021-10-07 | ||
US17/496,214 US20220121953A1 (en) | 2020-10-21 | 2021-10-07 | Multi-task learning via gradient split for rich human analysis |
PCT/US2021/054142 WO2022086728A1 (en) | 2020-10-21 | 2021-10-08 | Multi-task learning via gradient split for rich human analysis |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023540933A JP2023540933A (ja) | 2023-09-27 |
JP7471514B2 true JP7471514B2 (ja) | 2024-04-19 |
Family
ID=81186327
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023514020A Active JP7471514B2 (ja) | 2020-10-21 | 2021-10-08 | 多様な人分析のための勾配分割によるマルチタスク学習 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20220121953A1 (ja) |
JP (1) | JP7471514B2 (ja) |
DE (1) | DE112021005555T5 (ja) |
WO (1) | WO2022086728A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114783003B (zh) * | 2022-06-23 | 2022-09-20 | 之江实验室 | 一种基于局部特征注意力的行人重识别方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019084189A1 (en) | 2017-10-26 | 2019-05-02 | Magic Leap, Inc. | SYSTEMS AND METHODS FOR GRADIENT NORMALIZATION FOR ADAPTIVE LOSS BALANCING IN DEEP MULTITASK NETWORKS |
JP2019087237A (ja) | 2017-11-08 | 2019-06-06 | アドビ インコーポレイテッド | 敵対的ニューラル・ネットワーク・トレーニングを使用するフォント認識の改善 |
WO2020180469A1 (en) | 2019-03-07 | 2020-09-10 | Nec Laboratories America, Inc. | Multi-task perception network with applications to scene understanding and advanced driver-assistance system |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016146174A (ja) * | 2015-02-06 | 2016-08-12 | パナソニックIpマネジメント株式会社 | 決定方法およびプログラム |
KR20190051697A (ko) * | 2017-11-07 | 2019-05-15 | 삼성전자주식회사 | 뉴럴 네트워크의 디컨벌루션 연산을 수행하는 장치 및 방법 |
US11049000B2 (en) * | 2018-03-27 | 2021-06-29 | International Business Machines Corporation | Distributed state via cascades of tensor decompositions and neuron activation binding on neuromorphic hardware |
US11363002B2 (en) * | 2019-12-13 | 2022-06-14 | TripleBlind, Inc. | Systems and methods for providing a marketplace where data and algorithms can be chosen and interact via encryption |
-
2021
- 2021-10-07 US US17/496,214 patent/US20220121953A1/en active Pending
- 2021-10-08 DE DE112021005555.0T patent/DE112021005555T5/de active Pending
- 2021-10-08 JP JP2023514020A patent/JP7471514B2/ja active Active
- 2021-10-08 WO PCT/US2021/054142 patent/WO2022086728A1/en active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019084189A1 (en) | 2017-10-26 | 2019-05-02 | Magic Leap, Inc. | SYSTEMS AND METHODS FOR GRADIENT NORMALIZATION FOR ADAPTIVE LOSS BALANCING IN DEEP MULTITASK NETWORKS |
JP2019087237A (ja) | 2017-11-08 | 2019-06-06 | アドビ インコーポレイテッド | 敵対的ニューラル・ネットワーク・トレーニングを使用するフォント認識の改善 |
WO2020180469A1 (en) | 2019-03-07 | 2020-09-10 | Nec Laboratories America, Inc. | Multi-task perception network with applications to scene understanding and advanced driver-assistance system |
Also Published As
Publication number | Publication date |
---|---|
DE112021005555T5 (de) | 2023-08-17 |
WO2022086728A1 (en) | 2022-04-28 |
JP2023540933A (ja) | 2023-09-27 |
US20220121953A1 (en) | 2022-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7335274B2 (ja) | ジオロケーションの予測のためのシステムおよび方法 | |
US9971958B2 (en) | Method and system for generating multimodal digital images | |
US20190392587A1 (en) | System for predicting articulated object feature location | |
US10936912B2 (en) | Image classification using a mask image and neural networks | |
CN108230346B (zh) | 用于分割图像语义特征的方法和装置、电子设备 | |
US10776662B2 (en) | Weakly-supervised spatial context networks to recognize features within an image | |
US10742990B2 (en) | Data compression system | |
CN108229280A (zh) | 时域动作检测方法和系统、电子设备、计算机存储介质 | |
WO2021218471A1 (zh) | 一种用于图像处理的神经网络以及相关设备 | |
CN112507990A (zh) | 视频时空特征学习、抽取方法、装置、设备及存储介质 | |
CN115885289A (zh) | 利用全局自注意力神经网络对依赖性建模 | |
Torres et al. | Patient facial emotion recognition and sentiment analysis using secure cloud with hardware acceleration | |
WO2023273668A1 (zh) | 图像分类方法、装置、设备、存储介质及程序产品 | |
US20230177384A1 (en) | Attention Bottlenecks for Multimodal Fusion | |
KR20090123757A (ko) | 비디오 시퀀스의 움직이는 객체들의 중심들을 추정하는 시스템 및 방법 | |
CN111612010A (zh) | 图像处理方法、装置、设备以及计算机可读存储介质 | |
JP7471514B2 (ja) | 多様な人分析のための勾配分割によるマルチタスク学習 | |
WO2022222854A1 (zh) | 一种数据处理方法及相关设备 | |
Xiong et al. | Face2Statistics: user-friendly, low-cost and effective alternative to in-vehicle sensors/monitors for drivers | |
US20210018978A1 (en) | Method and apparatus for predicting intention of user | |
Uddin et al. | Dynamic facial expression understanding using deep spatiotemporal LDSP on spark | |
WO2023231753A1 (zh) | 一种神经网络的训练方法、数据的处理方法以及设备 | |
JP7225731B2 (ja) | 多変数データシーケンスの画像化 | |
WO2022052647A1 (zh) | 一种数据处理方法、神经网络的训练方法以及相关设备 | |
CN113408694A (zh) | 用于生成式神经网络的权重解调 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240409 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7471514 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |