JP2022530738A - 非対称rpuデバイスによるdnnの訓練 - Google Patents
非対称rpuデバイスによるdnnの訓練 Download PDFInfo
- Publication number
- JP2022530738A JP2022530738A JP2021557551A JP2021557551A JP2022530738A JP 2022530738 A JP2022530738 A JP 2022530738A JP 2021557551 A JP2021557551 A JP 2021557551A JP 2021557551 A JP2021557551 A JP 2021557551A JP 2022530738 A JP2022530738 A JP 2022530738A
- Authority
- JP
- Japan
- Prior art keywords
- crosspoint array
- array
- matrix
- rpu
- crosspoint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 24
- 239000011159 matrix material Substances 0.000 claims abstract description 111
- 239000013598 vector Substances 0.000 claims abstract description 71
- 238000000034 method Methods 0.000 claims abstract description 59
- 238000003491 array Methods 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims description 18
- 238000013528 artificial neural network Methods 0.000 claims description 7
- 210000002569 neuron Anatomy 0.000 claims description 7
- 230000008878 coupling Effects 0.000 claims 1
- 238000010168 coupling process Methods 0.000 claims 1
- 238000005859 coupling reaction Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 10
- 210000002364 input neuron Anatomy 0.000 description 7
- 210000004205 output neuron Anatomy 0.000 description 7
- 230000006399 behavior Effects 0.000 description 6
- 239000010410 layer Substances 0.000 description 6
- 230000009471 action Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000001902 propagating effect Effects 0.000 description 4
- 229940050561 matrix product Drugs 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000001149 cognitive effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000003920 cognitive function Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000001208 nuclear magnetic resonance pulse sequence Methods 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
- G06N3/065—Analogue means
Abstract
Description
yA=Ax
yC=Cx
y=γyA+yC
である。
図5に示されるように、順方向サイクルで異なるアレイによって生成されるが同じ列に対応する信号は、標準の乗算および加算演算が実施されるデジタル領域でスケーリングおよび加算される。
zA=Aδ
zC=Cδ
z=γzA+zC
である。
図6に示されるように、逆方向サイクルで異なるアレイによって生成されるが同じ行に対応する信号は、デジタル領域でスケーリングおよび合計される。
Claims (15)
- ディープ・ニューラル・ネットワーク(DNN:deep neural network)を訓練する方法であって、
行列Aおよび行列Cの線形結合としての重み行列(W)を提供するステップであって、前記行列Aおよび前記行列Cは、伝導性列ワイヤに直交する伝導性行ワイヤをそれぞれ有する抵抗処理ユニット(RPU:resistive processing unit)デバイスの別々のクロスポイント・アレイAおよびCの記憶された伝導性値によって形成され、前記RPUデバイスは、前記伝導性行ワイヤと前記伝導性列ワイヤとの間の交差部を分離し、これにより前記RPUデバイスは前記DNNのニューロン間の重み付き接続部として機能する、ステップと、
順方向サイクルにおいて、入力ベクトルxを電圧パルスとして前記クロスポイント・アレイAおよび前記クロスポイント・アレイCの前記伝導性列ワイヤを通して伝送し、結果として生じる出力ベクトルyを、前記クロスポイント・アレイAおよび前記クロスポイント・アレイCの前記伝導性行ワイヤから出力される電流として読み出すステップと、
逆方向サイクルにおいて、前記出力ベクトルyから算出された誤差信号δを電圧パルスとして前記クロスポイント・アレイAおよび前記クロスポイント・アレイCの前記伝導性行ワイヤを通して伝送し、結果として生じる出力ベクトルzを、前記クロスポイント・アレイAおよび前記クロスポイント・アレイCの前記伝導性列ワイヤから出力される電流として読み出すステップと、
前記クロスポイント・アレイAの更新において、前記入力ベクトルxを電圧パルスとして前記クロスポイント・アレイAの前記伝導性列ワイヤを通して伝送すると同時に、前記誤差信号δを電圧パルスとして前記クロスポイント・アレイAの前記伝導性行ワイヤを通して伝送するステップと、
順方向サイクルにおいて、入力ベクトルeiを電圧パルスとして前記クロスポイント・アレイAの前記伝導性列ワイヤを通して伝送し、結果として生じる出力ベクトルy’を前記クロスポイント・アレイAの前記伝導性行ワイヤから出力される電流として読み出すステップと、
y’を使用してf(y’)を算出するステップと、
前記クロスポイント・アレイCの更新において、前記入力ベクトルeiを電圧パルスとして前記クロスポイント・アレイCの前記伝導性列ワイヤを通して伝送すると同時に、f(y’)を電圧パルスとして前記クロスポイント・アレイCの前記伝導性行ワイヤを通して伝送するステップと
を含む方法。 - |y’|>閾値Tの場合に限りf(y’)=y’であり、それ以外の場合にはf(y’)=0である、請求項1に記載の方法。
- 収束基準が満たされるまで前記方法の前記ステップを繰り返すステップ
をさらに含む、請求項1に記載の方法。 - 前記クロスポイント・アレイAおよび前記クロスポイント・アレイCからの前記出力ベクトルyをデジタル信号に変換するステップ
をさらに含む、請求項1に記載の方法。 - 前記クロスポイント・アレイAおよび前記クロスポイント・アレイCからの前記出力ベクトルyの線形結合を算出するステップ
をさらに含む、請求項4に記載の方法。 - 前記クロスポイント・アレイAおよび前記クロスポイント・アレイCからの前記出力ベクトルzをデジタル信号に変換するステップ
をさらに含む、請求項1に記載の方法。 - 前記クロスポイント・アレイAおよび前記クロスポイント・アレイCからの前記出力ベクトルzの線形結合を算出するステップ
をさらに含む、請求項6に記載の方法。 - 前記クロスポイント・アレイAの全ての前記RPUデバイスが自身の対称点に収束するまで、前記クロスポイント・アレイAの前記RPUデバイスに繰り返し電圧パルスを印加するステップと、
前記クロスポイント・アレイAの前記RPUデバイスのゼロの重みの伝導性値を参照アレイにコピーするステップと
をさらに含む、請求項1に記載の方法。 - 前記参照アレイからの前記ゼロの重みの伝導性値によって前記クロスポイント・アレイAの出力をゼロシフトするステップ
をさらに含む、請求項8に記載の方法。 - クロスポイント・アレイAの前記RPUデバイスに印加される前記繰り返し電圧パルスは、アップおよびダウン電圧パルスを含む、請求項8に記載の方法。
- 前記アップおよびダウン電圧パルスは、クロスポイント・アレイAの前記RPUデバイスにランダムに印加される、請求項10に記載の方法。
- 前記アップおよびダウン電圧パルスは、クロスポイント・アレイAの前記RPUデバイスに交互に印加される、請求項10に記載の方法。
- 前記入力ベクトルeiは、ワン・ホット・エンコードされたベクトルを含む、請求項1に記載の方法。
- 前記入力ベクトルeiは、アダマール行列から選択される、請求項1に記載の方法。
- 請求項1~14のいずれかに記載の方法の全てのステップを実行するために適合された手段を含むシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/400,674 | 2019-05-01 | ||
US16/400,674 US11562249B2 (en) | 2019-05-01 | 2019-05-01 | DNN training with asymmetric RPU devices |
PCT/IB2020/053538 WO2020222064A1 (en) | 2019-05-01 | 2020-04-15 | Dnn training with asymmetric rpu devices |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022530738A true JP2022530738A (ja) | 2022-07-01 |
JP7422782B2 JP7422782B2 (ja) | 2024-01-26 |
Family
ID=73016099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021557551A Active JP7422782B2 (ja) | 2019-05-01 | 2020-04-15 | 非対称rpuデバイスによるdnnの訓練 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11562249B2 (ja) |
JP (1) | JP7422782B2 (ja) |
CN (1) | CN113728338B (ja) |
DE (1) | DE112020002186T5 (ja) |
GB (1) | GB2598856B (ja) |
WO (1) | WO2020222064A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11334731B2 (en) * | 2018-04-24 | 2022-05-17 | University of Pittsburgh—of the Commonwealth System of Higher Education | System and method of decoding a barcode using machine learning |
US11922314B1 (en) * | 2018-11-30 | 2024-03-05 | Ansys, Inc. | Systems and methods for building dynamic reduced order physical models |
US11562249B2 (en) * | 2019-05-01 | 2023-01-24 | International Business Machines Corporation | DNN training with asymmetric RPU devices |
US11507642B2 (en) * | 2019-05-02 | 2022-11-22 | Silicon Storage Technology, Inc. | Configurable input blocks and output blocks and physical layout for analog neural memory in deep learning artificial neural network |
US20220207344A1 (en) * | 2020-12-26 | 2022-06-30 | International Business Machines Corporation | Filtering hidden matrix training dnn |
KR20220148558A (ko) * | 2021-04-29 | 2022-11-07 | 삼성전자주식회사 | 뉴로모픽 컴퓨팅 장치 및 그 설계 방법 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6594382B1 (en) | 1999-11-04 | 2003-07-15 | The United States Of America As Represented By The Secretary Of The Navy | Neural sensors |
CN103150596B (zh) | 2013-02-22 | 2015-12-23 | 百度在线网络技术(北京)有限公司 | 一种反向传播神经网络dnn的训练系统 |
US9715655B2 (en) * | 2013-12-18 | 2017-07-25 | The United States Of America As Represented By The Secretary Of The Air Force | Method and apparatus for performing close-loop programming of resistive memory devices in crossbar array based hardware circuits and systems |
US10185803B2 (en) | 2015-06-15 | 2019-01-22 | Deep Genomics Incorporated | Systems and methods for classifying, prioritizing and interpreting genetic variants and therapies using a deep neural network |
US10748064B2 (en) | 2015-08-27 | 2020-08-18 | International Business Machines Corporation | Deep neural network training with native devices |
US10325006B2 (en) | 2015-09-29 | 2019-06-18 | International Business Machines Corporation | Scalable architecture for analog matrix operations with resistive devices |
US10387778B2 (en) * | 2015-09-29 | 2019-08-20 | International Business Machines Corporation | Scalable architecture for implementing maximization algorithms with resistive devices |
US10248907B2 (en) | 2015-10-20 | 2019-04-02 | International Business Machines Corporation | Resistive processing unit |
US11263521B2 (en) | 2016-08-30 | 2022-03-01 | International Business Machines Corporation | Voltage control of learning rate for RPU devices for deep neural network training |
US9715656B1 (en) | 2016-09-12 | 2017-07-25 | International Business Machines Corporation | Killing asymmetric resistive processing units for neural network training |
US9646243B1 (en) | 2016-09-12 | 2017-05-09 | International Business Machines Corporation | Convolutional neural networks using resistive processing unit array |
US10608017B2 (en) | 2017-01-31 | 2020-03-31 | Semiconductor Energy Laboratory Co., Ltd. | Display device, display module, and electronic device |
US10755170B2 (en) | 2017-03-01 | 2020-08-25 | International Business Machines Corporation | Resistive processing unit with hysteretic updates for neural network training |
US10783432B2 (en) | 2017-04-14 | 2020-09-22 | International Business Machines Corporation | Update management for RPU array |
US10134472B1 (en) | 2017-06-30 | 2018-11-20 | International Business Machines Corporation | Floating gate architecture for deep neural network application |
US10922610B2 (en) | 2017-09-14 | 2021-02-16 | Intel Corporation | Synchronization scheduler of distributed neural network training |
CN108596780B (zh) | 2018-04-28 | 2019-05-21 | 中国石油大学(华东) | 一种基于多元信息的储层类型划分方法及系统 |
US10831860B2 (en) * | 2018-10-11 | 2020-11-10 | International Business Machines Corporation | Alignment techniques to match symmetry point as zero-weight point in analog crosspoint arrays |
US11562249B2 (en) * | 2019-05-01 | 2023-01-24 | International Business Machines Corporation | DNN training with asymmetric RPU devices |
-
2019
- 2019-05-01 US US16/400,674 patent/US11562249B2/en active Active
-
2020
- 2020-04-15 JP JP2021557551A patent/JP7422782B2/ja active Active
- 2020-04-15 GB GB2117040.2A patent/GB2598856B/en active Active
- 2020-04-15 DE DE112020002186.6T patent/DE112020002186T5/de active Granted
- 2020-04-15 CN CN202080031308.6A patent/CN113728338B/zh active Active
- 2020-04-15 WO PCT/IB2020/053538 patent/WO2020222064A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JP7422782B2 (ja) | 2024-01-26 |
CN113728338A (zh) | 2021-11-30 |
CN113728338B (zh) | 2022-11-25 |
US20200349440A1 (en) | 2020-11-05 |
WO2020222064A1 (en) | 2020-11-05 |
GB202117040D0 (en) | 2022-01-12 |
GB2598856A (en) | 2022-03-16 |
GB2598856B (en) | 2022-12-07 |
US11562249B2 (en) | 2023-01-24 |
DE112020002186T5 (de) | 2022-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7422782B2 (ja) | 非対称rpuデバイスによるdnnの訓練 | |
JP7288047B2 (ja) | アナログ・クロスポイント・アレイにおいて対称点をゼロ重み点として一致させるためのアライメント方法、そのベクトル行列 | |
US11188825B2 (en) | Mixed-precision deep-learning with multi-memristive devices | |
JP2021507349A (ja) | 抵抗処理ユニット・アレイのクロスポイント・デバイスに重みを記憶するための方法、そのクロスポイント・デバイス、ニューラル・ネットワークを実施するためのクロスポイント・アレイ、そのシステム、およびニューラル・ネットワークを実施するための方法 | |
KR20170041724A (ko) | 비동기 펄스 변조를 이용한 인공 뉴런들 및 스파이킹 뉴런들 | |
CN110428042A (zh) | 往复地缩放神经元的连接权重和输入值来挫败硬件限制 | |
JP2019046072A (ja) | ニューロモルフィック素子を含むアレイの制御装置、離散化ステップサイズの演算方法およびプログラム | |
US20200293855A1 (en) | Training of artificial neural networks | |
Kim et al. | Zero-shifting technique for deep neural network training on resistive cross-point arrays | |
US10832773B1 (en) | Architecture for enabling zero value shifting | |
JP7357080B2 (ja) | Rpuアレイのためのノイズおよび信号管理 | |
KR20230029759A (ko) | 아날로그 크로스바 어레이들을 업데이트하기 위한 희소 수정가능 비트 길이 결정 펄스 생성 | |
US20200380349A1 (en) | Auto Weight Scaling for RPUs | |
JP2024502785A (ja) | 隠れ行列訓練dnnのフィルタリング | |
US20220327375A1 (en) | Training dnn by updating an array using a chopper | |
KR20230005309A (ko) | 아날로그 인공지능 네트워크 추론을 위한 행별 컨볼루션 신경망 매핑을 위한 효율적 타일 매핑 | |
US20240135166A1 (en) | Dnn training algorithm with dynamically computed zero-reference | |
US20220138579A1 (en) | Weight repetition on rpu crossbar arrays | |
Pavlíček | Škálovatelná reprezentace neuronových sítí | |
Pavlíček | Scalable Representations of Neural Networks | |
Probst | A neural implementation of probabilistic inference in binary probability spaces | |
Kuruvada | Memory storage in a variable threshold artificial neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20220512 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220922 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230721 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230809 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231026 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240116 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7422782 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |