JP6115455B2 - 並列計算機システム、並列計算機システムの制御方法、情報処理装置、演算処理装置および通信制御装置 - Google Patents
並列計算機システム、並列計算機システムの制御方法、情報処理装置、演算処理装置および通信制御装置 Download PDFInfo
- Publication number
- JP6115455B2 JP6115455B2 JP2013248582A JP2013248582A JP6115455B2 JP 6115455 B2 JP6115455 B2 JP 6115455B2 JP 2013248582 A JP2013248582 A JP 2013248582A JP 2013248582 A JP2013248582 A JP 2013248582A JP 6115455 B2 JP6115455 B2 JP 6115455B2
- Authority
- JP
- Japan
- Prior art keywords
- atomic operation
- communication control
- control device
- main storage
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0806—Multiuser, multiprocessor or multiprocessing cache systems
- G06F12/0815—Cache consistency protocols
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0804—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches with main memory updating
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0806—Multiuser, multiprocessor or multiprocessing cache systems
- G06F12/0811—Multiuser, multiprocessor or multiprocessing cache systems with multilevel cache hierarchies
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0806—Multiuser, multiprocessor or multiprocessing cache systems
- G06F12/0842—Multiuser, multiprocessor or multiprocessing cache systems for multiprocessing or multitasking
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/52—Program synchronisation; Mutual exclusion, e.g. by means of semaphores
- G06F9/526—Mutual exclusion algorithms
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/10—Providing a specific technical effect
- G06F2212/1016—Performance improvement
- G06F2212/1024—Latency reduction
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/28—Using a specific disk cache architecture
- G06F2212/283—Plural cache memories
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Memory System Of A Hierarchy Structure (AREA)
Description
(1)主記憶装置からデータをキャッシュメモリにリード
(2)リードしたデータとオペランドの加算
(3)加算結果を主記憶装置にライトバック
図1は、本実施形態による並列計算機システムの構築例を説明する図である。
(付記1)
通信を行う通信制御装置と、データを記憶する主記憶装置と、前記通信制御装置と前記主記憶装置とに接続される演算処理装置とをそれぞれ有するとともに前記通信制御装置によりネットワークを介して接続される情報処理装置を複数備える並列計算機システムにおいて、
前記演算処理装置は、
不可分操作であるアトミック操作を要求するアトミック操作要求を前記通信制御装置が出力した場合、対象データを格納するキャッシュメモリ上で前記対象データへの前記アトミック操作を行う処理部と、
前記キャッシュメモリ上で前記アトミック操作を行った結果を前記通信制御装置に通知する通知部と、
を有することを特徴とする並列計算機システム。
(付記2)
前記主記憶装置は、
前記アトミック操作要求を前記通信制御装置が出力した場合に、前記アトミック操作を行う対象データに対して前記アトミック操作を行う他の処理部と、
前記対象データに対する前記アトミック操作を行った結果を前記通信制御装置に通知する他の通知部と、
を有することを特徴とする付記1記載の並列計算機システム。
(付記3)
前記通信制御装置は、
前記アトミック操作を要求するために前記ネットワークを介して送信されるメッセージであるアトミック操作要求メッセージを受信した場合、前記アトミック操作要求を前記演算処理装置と前記主記憶装置とに対して出力する要求部と、
前記要求部が出力したアトミック操作要求によるアトミック操作を行った処理結果の通知である処理結果通知を、前記演算処理装置又は前記主記憶装置から受信する受信部と、
前記受信部が受信した処理結果通知の送信元と前記処理結果通知が表すアトミック操作の実行情報とに基づき、前記アトミック操作要求メッセージの応答の生成に用いる処理結果通知を決定し、決定した前記処理結果通知を用いて前記応答を生成して前記ネットワークに出力する制御部と、
を有することを特徴とする付記1、または2記載の並列計算機システム。
(付記4)
前記制御部は、
前記アトミック操作を前記キャッシュメモリ上で実行した旨を表す実行通知を前記受信部が受信した場合、前記実行通知を用いて前記応答を生成し、前記実行通知を受信せずに前記主記憶装置からの処理結果通知を前記受信部が受信した場合、前記主記憶装置からの処理結果通知を用いて前記応答を生成する、
ことを特徴とする付記3記載の並列計算機システム。
(付記5)
通信を行う通信制御装置と、データを記憶する主記憶装置と、前記通信制御装置と前記主記憶装置とに接続される演算処理装置とをそれぞれ有するとともに前記通信制御装置によりネットワークを介して接続される情報処理装置を複数備える並列計算機システムにおいて、
前記演算処理装置は、
不可分操作であるアトミック操作を要求するアトミック操作要求を前記通信制御装置が出力した場合、対象データを格納するキャッシュメモリ上で前記対象データへの前記アトミック操作を行い、
前記キャッシュメモリ上で前記アトミック操作を行った結果を前記通信制御装置に通知することを特徴とする並列計算機システムの制御方法。
(付記6)
通信を行う通信制御装置と、データを記憶する主記憶装置と、前記通信制御装置と前記主記憶装置とに接続される演算処理装置とをそれぞれ有するとともに前記通信制御装置によりネットワークを介して他の情報処理装置に接続される情報処理装置において、
前記演算処理装置は、
不可分操作であるアトミック操作を要求するアトミック操作要求を前記通信制御装置が出力した場合、対象データを格納するキャッシュメモリ上で前記対象データへの前記アトミック操作を行う処理部と、
前記キャッシュメモリ上で前記アトミック操作を行った結果を前記通信制御装置に通知する通知部と、
を有することを特徴とする情報処理装置。
(付記7)
通信を行う通信制御装置と、データを記憶する主記憶装置と、前記通信制御装置と前記主記憶装置とに接続される演算処理装置において、
不可分操作であるアトミック操作を要求するアトミック操作要求を前記通信制御装置が出力した場合、対象データを格納するキャッシュメモリ上で前記対象データへの前記アトミック操作を行う処理部と、
前記キャッシュメモリ上で前記アトミック操作を行った結果を前記通信制御装置に通知する通知部と、
を有することを特徴とする演算処理装置。
(付記8)
データを記憶する主記憶装置に接続され、不可分操作であるアトミック操作を要求するアトミック操作要求を前記通信制御装置が出力した場合、対象データを格納するキャッシュメモリ上で前記対象データへの前記アトミック操作を行う処理部と、前記キャッシュメモリ上で前記アトミック操作を行った結果を前記通信制御装置に通知する通知部とを備える演算処理装置に接続する通信制御装置において、
前記アトミック操作を要求するために前記ネットワークを介して送信されるメッセージであるアトミック操作要求メッセージを受信した場合、前記アトミック操作要求を前記演算処理装置と前記主記憶装置とに対して出力する要求部と、
前記要求部が出力したアトミック操作要求によるアトミック操作を行った処理結果の通知である処理結果通知を、前記演算処理装置又は前記主記憶装置から受信する受信部と、
前記受信部が受信した処理結果通知の送信元と前記処理結果通知が表すアトミック操作の実行情報とに基づき、前記アトミック操作要求メッセージの応答の生成に用いる処理結果通知を決定し、決定した前記処理結果通知を用いて前記応答を生成して前記ネットワークに出力する制御部と、
を有することを特徴とする通信制御装置。
2 ノード(情報処理装置)
21 プロセッサ
22 ネットワークインタフェース装置
23 主記憶装置
23a メモリコントローラ
25 メモリバス
211 プロセッサコア
212 キャッシュメモリ
213 キャッシュコントローラ
221 パケット送信部
222 パケット受信部
224 制御部
Claims (7)
- 通信を行う通信制御装置と、データを記憶する主記憶装置と、前記通信制御装置と前記主記憶装置とに接続される演算処理装置とをそれぞれ有するとともに前記通信制御装置によりネットワークを介して接続される情報処理装置を複数備える並列計算機システムにおいて、
前記演算処理装置は、
不可分操作であるアトミック操作を要求するアトミック操作要求を前記通信制御装置が出力した場合、対象データを格納するキャッシュメモリ上で前記対象データへの前記アトミック操作を行う処理部と、
前記キャッシュメモリ上で前記アトミック操作を行った結果を前記通信制御装置に通知する通知部と、
を有することを特徴とする並列計算機システム。 - 前記通信制御装置は、
前記アトミック操作を要求するために前記ネットワークを介して送信されるメッセージであるアトミック操作要求メッセージを受信した場合、前記アトミック操作要求を前記演算処理装置と前記主記憶装置とに対して出力する要求部と、
前記要求部が出力したアトミック操作要求によるアトミック操作を行った処理結果の通知である処理結果通知を、前記演算処理装置又は前記主記憶装置から受信する受信部と、
前記受信部が受信した処理結果通知の送信元と前記処理結果通知が表すアトミック操作の実行情報とに基づき、前記アトミック操作要求メッセージの応答の生成に用いる処理結果通知を決定し、決定した前記処理結果通知を用いて前記応答を生成して前記ネットワークに出力する制御部と、
を有することを特徴とする請求項1記載の並列計算機システム。 - 前記制御部は、
前記アトミック操作を前記キャッシュメモリ上で実行した旨を表す実行通知を前記受信部が受信した場合、前記実行通知を用いて前記応答を生成し、前記実行通知を受信せずに前記主記憶装置からの処理結果通知を前記受信部が受信した場合、前記主記憶装置からの処理結果通知を用いて前記応答を生成する、
ことを特徴とする請求項2記載の並列計算機システム。 - 通信を行う通信制御装置と、データを記憶する主記憶装置と、前記通信制御装置と前記主記憶装置とに接続される演算処理装置とをそれぞれ有するとともに前記通信制御装置によりネットワークを介して接続される情報処理装置を複数備える並列計算機システムにおいて、
前記演算処理装置は、
不可分操作であるアトミック操作を要求するアトミック操作要求を前記通信制御装置が出力した場合、対象データを格納するキャッシュメモリ上で前記対象データへの前記アトミック操作を行い、
前記キャッシュメモリ上で前記アトミック操作を行った結果を前記通信制御装置に通知することを特徴とする並列計算機システムの制御方法。 - 通信を行う通信制御装置と、データを記憶する主記憶装置と、前記通信制御装置と前記主記憶装置とに接続される演算処理装置とをそれぞれ有するとともに前記通信制御装置によりネットワークを介して他の情報処理装置に接続される情報処理装置において、
前記演算処理装置は、
不可分操作であるアトミック操作を要求するアトミック操作要求を前記通信制御装置が出力した場合、対象データを格納するキャッシュメモリ上で前記対象データへの前記アトミック操作を行う処理部と、
前記キャッシュメモリ上で前記アトミック操作を行った結果を前記通信制御装置に通知する通知部と、
を有することを特徴とする情報処理装置。 - 通信を行う通信制御装置と、データを記憶する主記憶装置と、前記通信制御装置と前記主記憶装置とに接続される演算処理装置において、
不可分操作であるアトミック操作を要求するアトミック操作要求を前記通信制御装置が出力した場合、対象データを格納するキャッシュメモリ上で前記対象データへの前記アトミック操作を行う処理部と、
前記キャッシュメモリ上で前記アトミック操作を行った結果を前記通信制御装置に通知する通知部と、
を有することを特徴とする演算処理装置。 - データを記憶する主記憶装置に接続され、不可分操作であるアトミック操作を要求するアトミック操作要求を前記通信制御装置が出力した場合、対象データを格納するキャッシュメモリ上で前記対象データへの前記アトミック操作を行う処理部と、前記キャッシュメモリ上で前記アトミック操作を行った結果を前記通信制御装置に通知する通知部とを備える演算処理装置に接続する通信制御装置において、
前記アトミック操作を要求するために前記ネットワークを介して送信されるメッセージであるアトミック操作要求メッセージを受信した場合、前記アトミック操作要求を前記演算処理装置と前記主記憶装置とに対して出力する要求部と、
前記要求部が出力したアトミック操作要求によるアトミック操作を行った処理結果の通知である処理結果通知を、前記演算処理装置又は前記主記憶装置から受信する受信部と、
前記受信部が受信した処理結果通知の送信元と前記処理結果通知が表すアトミック操作の実行情報とに基づき、前記アトミック操作要求メッセージの応答の生成に用いる処理結果通知を決定し、決定した前記処理結果通知を用いて前記応答を生成して前記ネットワークに出力する制御部と、
を有することを特徴とする通信制御装置。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013248582A JP6115455B2 (ja) | 2013-11-29 | 2013-11-29 | 並列計算機システム、並列計算機システムの制御方法、情報処理装置、演算処理装置および通信制御装置 |
| EP14192720.2A EP2879058B1 (en) | 2013-11-29 | 2014-11-11 | Parallel computer system, control method of parallel computer system, information processing device, arithmetic processing device, and communication control device |
| US14/540,381 US9542313B2 (en) | 2013-11-29 | 2014-11-13 | Parallel computer system, control method of parallel computer system, information processing device, arithmetic processing device, and communication control device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013248582A JP6115455B2 (ja) | 2013-11-29 | 2013-11-29 | 並列計算機システム、並列計算機システムの制御方法、情報処理装置、演算処理装置および通信制御装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2015106312A JP2015106312A (ja) | 2015-06-08 |
| JP6115455B2 true JP6115455B2 (ja) | 2017-04-19 |
Family
ID=51900201
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2013248582A Expired - Fee Related JP6115455B2 (ja) | 2013-11-29 | 2013-11-29 | 並列計算機システム、並列計算機システムの制御方法、情報処理装置、演算処理装置および通信制御装置 |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US9542313B2 (ja) |
| EP (1) | EP2879058B1 (ja) |
| JP (1) | JP6115455B2 (ja) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111260025B (zh) * | 2016-12-30 | 2023-11-14 | 上海寒武纪信息科技有限公司 | 用于执行lstm神经网络运算的装置和运算方法 |
| US11016802B2 (en) | 2018-01-26 | 2021-05-25 | Nvidia Corporation | Techniques for ordering atomic operations |
| US10776266B2 (en) * | 2018-11-07 | 2020-09-15 | Arm Limited | Apparatus and method of modification of stored data |
| CN114721996B (zh) * | 2022-06-09 | 2022-09-16 | 南湖实验室 | 一种分布式原子操作的实现方法与实现装置 |
Family Cites Families (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2844679B2 (ja) * | 1989-06-16 | 1999-01-06 | 富士通株式会社 | アクセス制御方法及び情報処理装置 |
| GB2256512B (en) * | 1991-06-04 | 1995-03-15 | Intel Corp | Second level cache controller unit and system |
| JP4362454B2 (ja) * | 2005-04-07 | 2009-11-11 | 富士通株式会社 | キャッシュコヒーレンス管理装置およびキャッシュコヒーレンス管理方法 |
| GB2442984B (en) * | 2006-10-17 | 2011-04-06 | Advanced Risc Mach Ltd | Handling of write access requests to shared memory in a data processing apparatus |
| JP4851958B2 (ja) | 2007-02-19 | 2012-01-11 | エヌイーシーコンピュータテクノ株式会社 | バスインタフェースアダプタ、データ転送方法、データ転送システム及び情報処理装置 |
| US20090077322A1 (en) * | 2007-09-19 | 2009-03-19 | Charles Ray Johns | System and Method for Getllar Hit Cache Line Data Forward Via Data-Only Transfer Protocol Through BEB Bus |
| US8412889B2 (en) * | 2008-10-16 | 2013-04-02 | Microsoft Corporation | Low-level conditional synchronization support |
| EP2399198A4 (en) * | 2009-02-17 | 2012-07-25 | Rambus Inc | COALESCENCE TECHNIQUE OF ATOMIC OPERATIONS IN MULTIPLE CHIP SYSTEMS |
| US8244988B2 (en) * | 2009-04-30 | 2012-08-14 | International Business Machines Corporation | Predictive ownership control of shared memory computing system data |
| US8380935B2 (en) * | 2009-06-12 | 2013-02-19 | Cray Inc. | Atomic memory operation cache protocol with opportunistic combining |
| WO2012137339A1 (ja) * | 2011-04-07 | 2012-10-11 | 富士通株式会社 | 情報処理装置、並列計算機システムおよび演算処理装置の制御方法 |
| GB2518613A (en) * | 2013-09-25 | 2015-04-01 | Ibm | Multiple core processing with high throughput atomic memory operations |
-
2013
- 2013-11-29 JP JP2013248582A patent/JP6115455B2/ja not_active Expired - Fee Related
-
2014
- 2014-11-11 EP EP14192720.2A patent/EP2879058B1/en not_active Not-in-force
- 2014-11-13 US US14/540,381 patent/US9542313B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2015106312A (ja) | 2015-06-08 |
| EP2879058A1 (en) | 2015-06-03 |
| US20150154115A1 (en) | 2015-06-04 |
| US9542313B2 (en) | 2017-01-10 |
| EP2879058B1 (en) | 2018-10-31 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10891228B2 (en) | Cache line states identifying memory cache | |
| CN101523361B (zh) | 数据处理设备中对共享存储器的写访问请求的处理 | |
| CN104508645B (zh) | 用于使用多个子锁来控制对具有读取器‑写入器锁的共享数据结构的访问的系统和方法 | |
| EP3433746B1 (en) | Contended lock request elision scheme | |
| US11403247B2 (en) | Methods and apparatus for network interface fabric send/receive operations | |
| CN111868699B (zh) | 用于一致性共享存储器系统的方法和设备 | |
| JP4474570B2 (ja) | キャッシュコヒーレンシ制御方法 | |
| CN107250995B (zh) | 存储器管理设备 | |
| WO2014038070A1 (ja) | 情報処理装置,並列計算機システム及び情報処理装置の制御方法 | |
| US10782896B2 (en) | Local instruction ordering based on memory domains | |
| JP6115455B2 (ja) | 並列計算機システム、並列計算機システムの制御方法、情報処理装置、演算処理装置および通信制御装置 | |
| JP2017537404A (ja) | メモリアクセス方法、スイッチ、およびマルチプロセッサシステム | |
| CN119135686B (zh) | 一种服务器,片上网络系统及一种报文处理设备和方法 | |
| US10318424B2 (en) | Information processing device | |
| JP5213485B2 (ja) | マルチプロセッサシステムにおけるデータ同期方法及びマルチプロセッサシステム | |
| US7913059B2 (en) | Information processing device, data transfer method, and information storage medium | |
| CN114298892A (zh) | 一种应用于分布式处理单元的高速缓存模块和系统 | |
| US10775870B2 (en) | System and method for maintaining cache coherency | |
| KR101303079B1 (ko) | 멀티-코어 기반의 가상화 환경에서 캐쉬 일관성을 제어하는 장치 및 방법 | |
| JP4414447B2 (ja) | 情報処理装置、情報処理システムおよび情報処理方法 | |
| JP2010061220A (ja) | データ転送装置、データ転送方法およびプロセッサ | |
| JP5549694B2 (ja) | 超並列計算機、同期方法、同期プログラム | |
| JP2019533239A (ja) | アトミックセットのデータアクセスを提供するための装置および方法 | |
| JP4833911B2 (ja) | プロセッサユニットおよび情報処理方法 | |
| CN119065991A (zh) | 一种处理方法、装置、控制器、电子设备及存储介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160804 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170215 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170221 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170306 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6115455 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |