JP6915562B2 - 分散処理システムおよび分散処理方法 - Google Patents
分散処理システムおよび分散処理方法 Download PDFInfo
- Publication number
- JP6915562B2 JP6915562B2 JP2018025942A JP2018025942A JP6915562B2 JP 6915562 B2 JP6915562 B2 JP 6915562B2 JP 2018025942 A JP2018025942 A JP 2018025942A JP 2018025942 A JP2018025942 A JP 2018025942A JP 6915562 B2 JP6915562 B2 JP 6915562B2
- Authority
- JP
- Japan
- Prior art keywords
- distributed
- processing node
- data
- aggregation
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L7/00—Arrangements for synchronising receiver with transmitter
- H04L7/0079—Receiver details
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L7/00—Arrangements for synchronising receiver with transmitter
- H04L7/0091—Transmitter details
Description
こうして、分散処理が行われることにより、深層学習には、集約通信(II)と全ノード集計処理(III)と分配通信(IV)の各処理時間が加わる。
近年、深層学習がより複雑な問題に適用されるようになってきており、重みの総数が増加する傾向にある。このため、分散データや集計データのデータ量が増大し、集約通信時間と分配通信時間が増大している。
また、本発明の分散処理システムの1構成例において、前記集計処理ノードは、各分散処理ノードから送信されたパケットを受信して前記分散データD[m,n]を番号mの順番に取得する受信部と、全分散処理ノードの分散データD[m,n]を重みw[m]毎に集計した前記集計データR[m]を生成する集計処理部と、前記集計データR[m]を番号mの順番にパケット化して各分散処理ノードに送信する送信部とを備えることを特徴とするものである。
以下、本発明の実施例について図面を参照して説明する。図1は本発明の第1の実施例に係る深層学習用分散処理システムの構成例を示すブロック図である。図1の分散処理システムは、1個の集計処理ノード1と、ニューラルネットワークのサンプルデータ(学習データ)の集合毎に設けられたN個(Nは2以上の整数)の分散処理ノード2[n](n=1,・・・,N)とを備える。各分散処理ノード2[n]は、双方向の通信が可能なネットワーク3により、集計処理ノード1と接続されている。
Pg番目の集約通信パケットSP[Pg,n]については、(M−Lg×(Pg−1))個の分散データD[i,n]の後に、{Lg−(M−Lg×(Pg−1))}個のダミーの数値を追加し、全ての集約通信パケットが等しくLg個のデータを格納するようにしてもよい。
Ps番目の分配通信パケットDP[Ps,n]については、(M−Ls×(Ps−1))個の集計データR[j]の後に、{Ls−(M−Ls×(Ps−1))}個のダミーの数値を追加し、全ての分配通信パケットが等しくLs個のデータを格納するようにしてもよい。
次に、本発明の第2の実施例について説明する。本実施例は、第1の実施例の深層学習用分散処理システムの構成要素である集計処理ノード1の構成例を説明するものである。図11は集計処理ノード1の構成例を示すブロック図である。
Claims (4)
- 集計処理ノードとN個(Nは2以上の整数)の分散処理ノードとを備え、
各分散処理ノードは、
学習対象のニューラルネットワークの学習用のサンプルデータが入力されたときに、前記ニューラルネットワークのM個(Mは2以上の整数)の重みw[m](m=1,・・・,M)の各々について、前記ニューラルネットワークの損失関数の勾配をサンプルデータ毎に計算する勾配計算処理部と、
サンプルデータ毎の前記勾配を集計した数値である分散データD[m,n](n=1,・・・,N)を重みw[m]毎に生成して保持するノード内集計処理部とを備え、
各分散処理ノードは、前記ニューラルネットワークの重みw[m]毎の分散データD[m,n]を重みw[m]の番号mの順番にパケット化して前記集計処理ノードに送信し、前記集計処理ノードから送信されたパケットを受信して集計データR[m]を番号mの順番に取得して、この集計データR[m]に基づいて前記ニューラルネットワークの重みw[m]を更新し、
前記集計処理ノードは、各分散処理ノードから送信されたパケットを受信して分散データD[m,n]を番号mの順番に取得し、全分散処理ノードの分散データD[m,n]を重みw[m]毎に集計した前記集計データR[m]を生成して、この集計データR[m]を番号mの順番にパケット化して各分散処理ノードに送信し、
前記集計処理ノードと各分散処理ノードとは、
各分散処理ノードがパケット化した分散データD[m,n]を前記集計処理ノードに送信して、前記集計処理ノードが受信したパケットから前記分散データD[m,n]を取得する集約通信処理と、前記集計処理ノードが前記集計データR[m]を生成する全ノード集計処理と、前記集計処理ノードがパケット化した前記集計データR[m]を各分散処理ノードに送信して、各分散処理ノードが受信したパケットから前記集計データR[m]を取得する分配通信処理と、各分散処理ノードが前記重みw[m]を更新する重み更新処理とを、それぞれ異なる番号mについて並行して行うことを特徴とする分散処理システム。 - 請求項1記載の分散処理システムにおいて、
各分散処理ノードは、
前記分散データD[m,n]を番号mの順番にパケット化して前記集計処理ノードに送信する送信部と、
前記集計処理ノードから送信されたパケットを受信して前記集計データR[m]を番号mの順番に取得する受信部と、
前記集計データR[m]に基づいて前記ニューラルネットワークの重みw[m]を更新する重み更新処理部とを備えることを特徴とする分散処理システム。 - 請求項1または2記載の分散処理システムにおいて、
前記集計処理ノードは、
各分散処理ノードから送信されたパケットを受信して前記分散データD[m,n]を番号mの順番に取得する受信部と、
全分散処理ノードの分散データD[m,n]を重みw[m]毎に集計した前記集計データR[m]を生成する集計処理部と、
前記集計データR[m]を番号mの順番にパケット化して各分散処理ノードに送信する送信部とを備えることを特徴とする分散処理システム。 - N個(Nは2以上の整数)の分散処理ノードの各々が、学習対象のニューラルネットワークの学習用のサンプルデータが入力されたときに、前記ニューラルネットワークのM個(Mは2以上の整数)の重みw[m](m=1,・・・,M)の各々について、前記ニューラルネットワークの損失関数の勾配をサンプルデータ毎に計算する第1のステップと、
前記分散処理ノードの各々が、サンプルデータ毎の前記勾配を集計した数値である分散データD[m,n](n=1,・・・,N)を重みw[m]毎に生成して保持する第2のステップと、
前記分散処理ノードの各々が、前記ニューラルネットワークの重みw[m]毎の分散データD[m,n]を重みw[m]の番号mの順番にパケット化して集計処理ノードに送信する第3のステップと、
前記集計処理ノードが、各分散処理ノードから送信されたパケットを受信して前記分散データD[m,n]を番号mの順番に取得する第4のステップと、
前記集計処理ノードが、全分散処理ノードの分散データD[m,n]を重みw[m]毎に集計した集計データR[m]を生成する第5のステップと、
前記集計処理ノードが、前記集計データR[m]を番号mの順番にパケット化して各分散処理ノードに送信する第6のステップと、
前記分散処理ノードの各々が、前記集計処理ノードから送信されたパケットを受信して前記集計データR[m]を番号mの順番に取得する第7のステップと、
前記分散処理ノードの各々が、前記集計データR[m]に基づいて前記ニューラルネットワークの重みw[m]を更新する第8のステップとを含み、
前記分散処理ノードの前記第3のステップおよび前記集計処理ノードの前記第4のステップと、前記集計処理ノードの前記第5のステップと、前記集計処理ノードの前記第6のステップおよび前記分散処理ノードの前記第7のステップと、前記分散処理ノードの前記第8のステップとを、それぞれ異なる番号mについて並行して行うことを特徴とする分散処理方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018025942A JP6915562B2 (ja) | 2018-02-16 | 2018-02-16 | 分散処理システムおよび分散処理方法 |
PCT/JP2019/004214 WO2019159784A1 (ja) | 2018-02-16 | 2019-02-06 | 分散処理システムおよび分散処理方法 |
US16/967,463 US20210117783A1 (en) | 2018-02-16 | 2019-02-06 | Distributed processing system and distributed processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018025942A JP6915562B2 (ja) | 2018-02-16 | 2018-02-16 | 分散処理システムおよび分散処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019144643A JP2019144643A (ja) | 2019-08-29 |
JP6915562B2 true JP6915562B2 (ja) | 2021-08-04 |
Family
ID=67619370
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018025942A Active JP6915562B2 (ja) | 2018-02-16 | 2018-02-16 | 分散処理システムおよび分散処理方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20210117783A1 (ja) |
JP (1) | JP6915562B2 (ja) |
WO (1) | WO2019159784A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220398457A1 (en) * | 2019-12-02 | 2022-12-15 | Nippon Telegraph And Telephone Corporation | Distributed Deep Learning System and Distributed Deep Learning Method |
CN115282401B (zh) * | 2022-07-22 | 2023-04-21 | 深圳市第二人民医院(深圳市转化医学研究院) | 静脉输液泵控制系统、静脉输液泵控制方法和存储介质 |
-
2018
- 2018-02-16 JP JP2018025942A patent/JP6915562B2/ja active Active
-
2019
- 2019-02-06 US US16/967,463 patent/US20210117783A1/en active Pending
- 2019-02-06 WO PCT/JP2019/004214 patent/WO2019159784A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
US20210117783A1 (en) | 2021-04-22 |
JP2019144643A (ja) | 2019-08-29 |
WO2019159784A1 (ja) | 2019-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019239821A1 (ja) | 分散処理システムおよび分散処理方法 | |
EP3540652B1 (en) | Method, device, chip and system for training neural network model | |
CN106815254B (zh) | 一种数据处理方法和装置 | |
JP6915562B2 (ja) | 分散処理システムおよび分散処理方法 | |
JP6753874B2 (ja) | 分散深層学習システム | |
JP6897434B2 (ja) | 情報処理システム、情報処理装置及び情報処理プログラム | |
JP2019168895A (ja) | 分散深層学習システム | |
US20210357723A1 (en) | Distributed Processing System and Distributed Processing Method | |
WO2020003849A1 (ja) | 分散深層学習システム、分散深層学習方法、およびコンピューティングインタコネクト装置 | |
Morozov et al. | Asymptotic analysis of queueing systems with finite buffer space | |
JP7287492B2 (ja) | 分散深層学習システムおよびデータ転送方法 | |
JP7021132B2 (ja) | 学習装置、学習方法およびプログラム | |
JP7420228B2 (ja) | 分散処理システムおよび分散処理方法 | |
JP7192984B2 (ja) | 分散処理システムおよび分散処理方法 | |
JP7074017B2 (ja) | 分散処理システムおよび分散処理方法 | |
WO2019239802A1 (ja) | 分散処理システムおよび分散処理方法 | |
JP7074018B2 (ja) | 分散処理システムおよび分散処理方法 | |
De Nicola et al. | Stationary Characteristics Of Homogenous Geo/Geo/2 Queue With Resequencing In Discrete Time. | |
JP6760110B2 (ja) | 制御装置、転送装置、および、制御方法 | |
US20220391666A1 (en) | Distributed Deep Learning System and Distributed Deep Learning Method | |
JP6615808B2 (ja) | サーバにおけるパケットの遅延予測方法、装置及びプログラム | |
JP2023099938A (ja) | 学習装置、学習システムおよび学習方法 | |
CN114095402A (zh) | 考虑信道质量的raft分布式系统传输时延分析方法 | |
JP2019029976A (ja) | ネットワーク性能評価方法及びネットワーク性能評価装置 | |
Addie | Snapshot Simulation of Internet Traffic: queueing of fixed-rate flows |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210413 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210520 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210615 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210628 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6915562 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |