JP7004083B2 - 演算処理装置及び演算処理装置の制御方法 - Google Patents
演算処理装置及び演算処理装置の制御方法 Download PDFInfo
- Publication number
- JP7004083B2 JP7004083B2 JP2020551749A JP2020551749A JP7004083B2 JP 7004083 B2 JP7004083 B2 JP 7004083B2 JP 2020551749 A JP2020551749 A JP 2020551749A JP 2020551749 A JP2020551749 A JP 2020551749A JP 7004083 B2 JP7004083 B2 JP 7004083B2
- Authority
- JP
- Japan
- Prior art keywords
- arithmetic
- calculation
- data
- unit
- arithmetic processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 281
- 238000000034 method Methods 0.000 title claims description 103
- 238000004891 communication Methods 0.000 claims description 286
- 238000004364 calculation method Methods 0.000 claims description 254
- 230000006870 function Effects 0.000 claims description 20
- 238000012544 monitoring process Methods 0.000 claims description 14
- 238000010586 diagram Methods 0.000 description 23
- 238000013500 data storage Methods 0.000 description 17
- 238000007796 conventional method Methods 0.000 description 12
- 238000012546 transfer Methods 0.000 description 7
- 239000004065 semiconductor Substances 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000002457 bidirectional effect Effects 0.000 description 3
- 102220496775 Lymphocyte expansion molecule_S23C_mutation Human genes 0.000 description 1
- 102220521910 THAP domain-containing protein 1_S21C_mutation Human genes 0.000 description 1
- 102220538564 TNF receptor-associated factor 2_S11D_mutation Human genes 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 102220328583 rs111822347 Human genes 0.000 description 1
- 102220076183 rs796052896 Human genes 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/163—Interprocessor communication
- G06F15/173—Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Multi Processors (AREA)
- Advance Control (AREA)
Description
図1は、第1実施例における演算処理装置の一例を示すブロック図である。図1に示す演算処理装置1は、4個の演算器11-0~11-3と、2個の通信器12-0,12-1とを有する。各通信器12-0,12-1は、4個の演算器11-0~11-3と通信可能に接続されている。この例では、各演算器11-0~11-3は、通信機能を含む同じ構成を有し、同じ演算処理を行う。また、各通信器12-0,12-1は、演算機能を含む同じ構成を有し、データの演算と移動を繰り返す、同じ所定の演算処理を行う。説明の便宜上、図1中、太い一点鎖線は、例えば後述する演算結果の奇数番目の分割データの通信路を示し、太い二点鎖線は、例えば後述する演算結果の偶数番目の分割データの通信路を示す。各通信路は、例えば双方向のバスである。演算処理装置1は、例えば単一のモジュール、或いは、半導体チップであっても良い。
第2実施例では、2つのグループG0,G1が接続されている。
第3実施例では、2つのグループG0,G1が接続されている。
第4実施例では、演算処理装置が4個の演算器と、3個の通信器を有する。本実施例では、通信器の個数が上記第1実施例の場合と異なるため、演算結果の分割数が上記第1実施例の場合と異なる。このため、データの移動方法が上記第1実施例とは異なる。第4実施例は、m=4でn=3の例である。
第5実施例では、演算処理装置が5個の演算器と、2個の通信器を有する。本実施例では、演算処理装置が有する演算器の個数が上記第1実施例の場合と異なるが、上記第1実施例と略同様にして集合演算を行うことができる。第5実施例は、m=5でn=2の例である。
1-0~1-3,1A-0~1A-3,1B-0~1B-3 演算処理装置
11,11-0~11-4 演算器
12,12-0~12-2 通信器
100 演算処理システム
111 演算部
112 データ保存用メモリ
113 演算制御部
114 通信部
115 データ監視部
121 演算部
122 データ保存用メモリ
123 演算制御部
124 通信部
Claims (10)
- 同じ演算処理を行うm個の演算器と、
演算機能を有し、前記m個の演算器と通信可能に接続されたn個の通信器と、
を備え、mは4以上の自然数であり、nは2以上の自然数であり、
各演算器は、前記m個の演算器の演算結果の総データ量を前記通信器の個数n×2=Nで分割した各N分割データに相当する演算結果を、対応する前記n個の通信器に移動し、
各通信器は、対応するN分割データに相当する演算結果にデータの演算と移動を繰り返す所定の演算処理を施した演算結果を、前記m個の演算器にブロードキャストすることを特徴とする、演算処理装置。 - 各演算器は、
前記同じ演算処理を行う演算機能に関する処理を実行する、第1の演算部及び第1の演算制御部と、
各N分割データに相当する演算結果を対応する前記n個の通信器に移動する演算機能以外に関する処理を実行する、データ監視部及び第1の通信部とを有し、
各通信器は、
前記所定の演算処理を行う所定の演算機能に関する処理を実行する、第2の演算部、第2の演算制御部、及び第2の通信部を有することを特徴とする、請求項1記載の演算処理装置。 - 前記演算機能に関する処理は、
前記第1の演算制御部が、前記m個の演算器の演算結果の総データ量をN分割し、
前記第1の演算制御部が、N分割した演算結果を順時出力するよう前記第1の演算部を制御し、
前記第1の演算制御部が、前記第1の演算部による演算が終了したと判定し、前記第1の演算部が、各通信器から前記所定の演算結果を受信すると前記演算機能に関する処理を終了する、
処理を含み、
前記演算機能以外に関する処理は、
前記データ監視部が、前記m個の演算器の演算結果の総データ量の1/Nに相当する演算結果のデータ量が揃ったと判定すると、前記第1の通信部が、揃った演算結果のデータを各通信器に移動し、
前記データ監視部が、前記第1の演算部による演算が終了したと判定すると、前記演算機能以外に関する処理を終了する、
処理を含み、
前記所定の演算機能に関する処理は、
各通信器の前記第2の演算部が、前記第2の通信部が受信した演算結果を用いて前記所定の演算処理を行い、
前記第2の演算制御部が、前記第2の演算部による前記所定の演算処理が終了したと判定すると、前記第2の通信部が、前記所定の演算処理の演算結果のデータを前記m個の演算器にブロードキャストする、
処理を含むことを特徴とする、請求項2記載の演算処理装置。 - m=4又はm=5かつn=2であり、
第1の通信器が4分割データの半分に相当する2つのデータに前記所定の演算処理を順次施して前記m個の演算器にブロードキャストし、
第2の通信器が4分割データの残りの半分に相当する2つのデータに前記所定の演算処理を順次施して前記m個の演算器にブロードキャストすることを特徴とする、請求項1乃至3のいずれか1項記載の演算処理装置。 - m=4かつn=3であり、
第1の通信器が6分割データの1/3に相当する2つのデータに前記所定の演算処理を順次施して前記m個の演算器にブロードキャストし、
第2の通信器が6分割データの他の1/3に相当する2つのデータに前記所定の演算処理を順次施して前記m個の演算器にブロードキャストし、
第3の通信器が6分割データの残りの1/3に相当する2つのデータに前記所定の演算処理を順次施して前記m個の演算器にブロードキャストすることを特徴とする、請求項1乃至3のいずれか1項記載の演算処理装置。 - 前記所定の演算処理は、集合演算処理であることを特徴とする、請求項1乃至5のいずれか1項記載の演算処理装置。
- 請求項1乃至6のいずれか1項記載の演算処理装置をL個備え、Lは2以上の自然数であり、
前記L個の演算処理装置の対応する通信器が通信可能に接続されていることを特徴とする、演算処理システム。 - 同じ演算処理を行うm個の演算器と、演算機能を有し、前記m個の演算器と通信可能に接続されたn個の通信器と、を備え、mは4以上の自然数であり、nは2以上の自然数である演算処理装置の制御方法であって、
各演算器が、前記m個の演算器の演算結果の総データ量を通信器の個数n×2=Nで分割した各N分割データに相当する演算結果を、対応する前記n個の通信器に移動し、
各通信器が、対応するN分割データに相当する演算結果にデータの演算と移動を繰り返す所定の演算処理を施した演算結果を、前記m個の演算器にブロードキャストすることを特徴とする、演算処理装置の制御方法。 - 前記所定の演算処理は、集合演算処理であることを特徴とする、請求項8記載の演算処理装置の制御方法。
- L個の演算処理装置の対応する通信器を通信可能に接続し、Lは2以上の自然数であり、
請求項8又は9記載の演算処理装置の制御方法を前記L個の演算処理装置の各々で実行することを特徴とする、演算処理装置の制御方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/039384 WO2020084693A1 (ja) | 2018-10-23 | 2018-10-23 | 演算処理装置及び演算処理装置の制御方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020084693A1 JPWO2020084693A1 (ja) | 2021-09-02 |
JP7004083B2 true JP7004083B2 (ja) | 2022-01-21 |
Family
ID=70331809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020551749A Active JP7004083B2 (ja) | 2018-10-23 | 2018-10-23 | 演算処理装置及び演算処理装置の制御方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7004083B2 (ja) |
WO (1) | WO2020084693A1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002175288A (ja) | 2000-09-27 | 2002-06-21 | Sony Computer Entertainment Inc | マルチプロセッサシステム、データ処理システム、データ処理方法、コンピュータプログラム |
JP2006277635A (ja) | 2005-03-30 | 2006-10-12 | Nec Corp | 情報処理システムとjob実行方法 |
JP2007249810A (ja) | 2006-03-17 | 2007-09-27 | Fujitsu Ltd | 並列計算機のリダクション処理方法及び並列計算機 |
-
2018
- 2018-10-23 WO PCT/JP2018/039384 patent/WO2020084693A1/ja active Application Filing
- 2018-10-23 JP JP2020551749A patent/JP7004083B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002175288A (ja) | 2000-09-27 | 2002-06-21 | Sony Computer Entertainment Inc | マルチプロセッサシステム、データ処理システム、データ処理方法、コンピュータプログラム |
JP2006277635A (ja) | 2005-03-30 | 2006-10-12 | Nec Corp | 情報処理システムとjob実行方法 |
JP2007249810A (ja) | 2006-03-17 | 2007-09-27 | Fujitsu Ltd | 並列計算機のリダクション処理方法及び並列計算機 |
Also Published As
Publication number | Publication date |
---|---|
WO2020084693A1 (ja) | 2020-04-30 |
JPWO2020084693A1 (ja) | 2021-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6983154B2 (ja) | 計算グラフの処理 | |
US10902315B2 (en) | Device for implementing artificial neural network with separate computation units | |
US20180307973A1 (en) | Device for implementing artificial neural network with flexible buffer pool structure | |
US20180307974A1 (en) | Device for implementing artificial neural network with mutiple instruction units | |
US7574466B2 (en) | Method for finding global extrema of a set of shorts distributed across an array of parallel processing elements | |
KR20130090147A (ko) | 신경망 컴퓨팅 장치 및 시스템과 그 방법 | |
JP2020532778A (ja) | 変換方法、装置、コンピューターデバイス及び記憶媒体 | |
CN109034373A (zh) | 卷积神经网络的并行处理器及处理方法 | |
EP3822773A1 (en) | Enhanced input of machine-learning accelerator activations | |
US20240104012A1 (en) | Topological scheduling | |
US11580369B2 (en) | Inference apparatus, convolution operation execution method, and program | |
CN113469355B (zh) | 分布式系统中的多模型训练管道 | |
CN113159285B (zh) | 神经网络加速器 | |
CN112541584B (zh) | 深度神经网络模型并行模式选择方法 | |
CN106991006A (zh) | 支持依赖和时间平衡的云工作流任务聚类方法 | |
CN106295670A (zh) | 数据处理方法及数据处理装置 | |
CN103914556A (zh) | 大规模图数据处理方法 | |
CN102566423A (zh) | 一种单边装配线的平衡控制方法 | |
JP7004083B2 (ja) | 演算処理装置及び演算処理装置の制御方法 | |
US11709783B1 (en) | Tensor data distribution using grid direct-memory access (DMA) controller | |
JP2023145676A (ja) | 伝搬レイテンシの短縮 | |
CN104778044B (zh) | 触摸屏手势事件流分发的方法及装置 | |
CN109582911A (zh) | 用于实行卷积的计算装置及实行卷积的计算方法 | |
WO2018070376A1 (ja) | 領域確保装置、領域確保方法、及び、領域確保プログラムが記録された記録媒体 | |
CN109948785B (zh) | 一种高效的神经网络电路系统和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210121 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211130 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211213 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7004083 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |