JP2021530022A - Gpu主導の通信のためのネットワークパケットテンプレーティング - Google Patents
Gpu主導の通信のためのネットワークパケットテンプレーティング Download PDFInfo
- Publication number
- JP2021530022A JP2021530022A JP2020570420A JP2020570420A JP2021530022A JP 2021530022 A JP2021530022 A JP 2021530022A JP 2020570420 A JP2020570420 A JP 2020570420A JP 2020570420 A JP2020570420 A JP 2020570420A JP 2021530022 A JP2021530022 A JP 2021530022A
- Authority
- JP
- Japan
- Prior art keywords
- processor
- fields
- network packet
- subset
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004891 communication Methods 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 38
- 230000015654 memory Effects 0.000 claims abstract description 31
- 238000012545 processing Methods 0.000 claims abstract description 19
- 230000008569 process Effects 0.000 claims abstract description 13
- 230000004044 response Effects 0.000 claims abstract description 13
- 230000003068 static effect Effects 0.000 claims abstract description 9
- 230000009471 action Effects 0.000 claims description 4
- 230000000977 initiatory effect Effects 0.000 claims 2
- 238000010586 diagram Methods 0.000 abstract description 13
- 238000012546 transfer Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/546—Message passing systems or structures, e.g. queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/0223—User address space allocation, e.g. contiguous or non contiguous base addressing
- G06F12/023—Free address space management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/163—Interprocessor communication
- G06F15/17—Interprocessor communication using an input/output type connection, e.g. channel, I/O port
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/90—Buffering arrangements
- H04L49/9063—Intermediate storage in different physical parts of a node or terminal
- H04L49/9068—Intermediate storage in different physical parts of a node or terminal in the network interface card
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/22—Parsing or analysis of headers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/30—Definitions, standards or architectural aspects of layered protocol stacks
- H04L69/32—Architecture of open systems interconnection [OSI] 7-layer type protocol stacks, e.g. the interfaces between the data link level and the physical level
- H04L69/321—Interlayer communication protocols or service data unit [SDU] definitions; Interfaces between layers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/10—Providing a specific technical effect
- G06F2212/1016—Performance improvement
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/90—Buffering arrangements
- H04L49/9042—Separate storage for different parts of the packet, e.g. header and payload
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Advance Control (AREA)
Abstract
Description
Claims (20)
- メモリと、
第1のプロセッサであって、テンプレートに従ってネットワークパケットを作成して、前記ネットワークパケットのフィールドの第1のサブセットにデータを入れることと、前記メモリに前記ネットワークパケットを記憶することと、を行うように構成された、第1のプロセッサと、
第2のプロセッサであって、カーネルの実行を開始することと、前記カーネルが実行を完了する前に、前記カーネル内のネットワーク通信要求を検出することに応じて、前記ネットワークパケットのフィールドの第2のサブセットにデータを入れることと、前記ネットワークパケットは処理可能状態であるという通知を生成することと、を行うように構成された、前記第2のプロセッサと、
前記カーネルが実行を完了する前に、前記通知を検出することに応じて、前記ネットワークパケットを処理するように構成されたネットワークインターフェースコントローラと、を含む、システム。 - 前記ネットワークインターフェースコントローラは、フィールドの前記第1のサブセットから、及びフィールドの前記第2のサブセットから取得されたデータを用いて前記ネットワークパケットを処理する、請求項1に記載のシステム。
- フィールドの前記第1のサブセットには静的データが含まれ、
フィールドの前記第2のサブセットにはランタイムデータが含まれる、請求項1に記載のシステム。 - フィールドの前記第1のサブセットには、ネットワーク制御ビットフィールド及びメモリアクセスキーフィールドが含まれ、
フィールドの前記第2のサブセットには、転送元オフセットフィールド、転送先オフセットフィールド、及び動作タイプフィールドが含まれる、請求項1に記載のシステム。 - 前記第1のプロセッサは、前記ネットワークパケットを作成し、前記第2のプロセッサが前記ネットワーク通信要求を検出する前に、前記ネットワークパケットテンプレートのフィールドの前記第1のサブセットにデータを入れるように構成されている、請求項1に記載のシステム。
- 前記第1のプロセッサは、テンプレートに従って前記ネットワークパケットを作成し、第1の条件を検出することに応じてのみ、待ち行列に前記ネットワークパケットを記憶するように構成されている、請求項1に記載のシステム。
- 前記第1の条件は、前記待ち行列の占有レベルが閾値を下回ることである、請求項6に記載のシステム。
- テンプレートに従って、第1のプロセッサによって、ネットワークパケットを作成して、前記ネットワークパケットのフィールドの第1のサブセットにデータを入れることと、
前記第1のプロセッサにより、前記ネットワークパケットをメモリに記憶することと、
第2のプロセッサでカーネルの実行を開始することと、
前記カーネルが実行を完了する前に、前記カーネル内のネットワーク通信要求を検出することに応じて、
前記第2のプロセッサによって、前記ネットワークパケットのフィールドの第2のサブセットにデータを入れることと、
前記第2のプロセッサによって、前記ネットワークパケットテンプレートは処理可能状態であるという通知を作成することと、
前記第2のプロセッサで前記カーネルが実行を完了する前に、前記通知を検出することに応じて、ネットワークインターフェースコントローラによって前記ネットワークパケットテンプレートを処理することと、を含む、方法。 - フィールドの前記第1のサブセットから、及びフィールドの前記第2のサブセットから取得されたデータを用いて前記ネットワークパケットを処理することをさらに含む、請求項8に記載の方法。
- フィールドの前記第1のサブセットには静的データが含まれ、
フィールドの前記第2のサブセットにはランタイムデータが含まれる、請求項8に記載の方法。 - フィールドの前記第1のサブセットには、ネットワーク制御ビットフィールド及びメモリアクセスキーフィールドが含まれ、
フィールドの前記第2のサブセットには、転送元オフセットフィールド、転送先オフセットフィールド、及び動作タイプフィールドが含まれる、請求項8に記載の方法。 - 前記第1のプロセッサによって、前記ネットワークパケットを作成することと、前記第2のプロセッサが前記ネットワーク通信要求を検出する前に、前記ネットワークパケットのフィールドの前記第1のサブセットにデータを入れることと、をさらに含む、請求項8に記載の方法。
- 前記第1のプロセッサによって、テンプレートに従って前記ネットワークパケットを作成することと、第1の条件を検出することに応じてのみ、待ち行列に前記ネットワークパケットを記憶することと、をさらに含む、請求項8に記載の方法。
- 前記第1の条件は、前記待ち行列の占有レベルが閾値を下回ることである、請求項13に記載の方法。
- メモリと、複数の計算ユニットとを含むプロセッサであって、
前記複数の計算ユニットの1つ以上の計算ユニットでカーネルの実行を開始することと、
前記カーネルが実行を完了する前に、前記カーネル内のネットワーク通信要求を検出することに応じて、
フィールドの第1のサブセットのみにデータが入っている状態で、前記メモリ内にネットワークパケットを配置することと、
前記ネットワークパケットのフィールドの第2のサブセットにデータを入れることと、
前記ネットワークパケットテンプレートは処理可能状態であるという通知を生成することと、を行うように構成されている、プロセッサ。 - フィールドの前記第1のサブセットには静的データが含まれ、フィールドの前記第2のサブセットにはランタイムデータが含まれる、請求項15に記載のプロセッサ。
- フィールドの前記第1のサブセットには、ネットワーク制御ビットフィールド及びメモリアクセスキーフィールドが含まれ、
フィールドの前記第2のサブセットには、転送元オフセットフィールド、転送先オフセットフィールド、及び動作タイプフィールドが含まれる、請求項15に記載のプロセッサ。 - 前記プロセッサが前記ネットワーク通信要求を検出する前に、前記ネットワークパケットのフィールドの前記第1のサブセットにデータが入る、請求項15に記載のプロセッサ。
- 前記プロセッサはさらに、フィールドの前記第1のサブセットにデータが入った前記ネットワークパケットを待ち行列に加えるときを決定するための閾値をプログラミングするように構成されている、請求項15に記載のプロセッサ。
- 前記プロセッサはさらに、前記通知をネットワークインターフェースコントローラに伝えて、前記ネットワークパケットを処理させるように構成されている、請求項15に記載のプロセッサ。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/022,498 | 2018-06-28 | ||
US16/022,498 US10740163B2 (en) | 2018-06-28 | 2018-06-28 | Network packet templating for GPU-initiated communication |
PCT/US2019/029040 WO2020005377A1 (en) | 2018-06-28 | 2019-04-25 | Network packet templating for gpu-initiated communication |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021530022A true JP2021530022A (ja) | 2021-11-04 |
JP7461895B2 JP7461895B2 (ja) | 2024-04-04 |
Family
ID=67138012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020570420A Active JP7461895B2 (ja) | 2018-06-28 | 2019-04-25 | Gpu主導の通信のためのネットワークパケットテンプレーティング |
Country Status (6)
Country | Link |
---|---|
US (1) | US10740163B2 (ja) |
EP (1) | EP3814921A1 (ja) |
JP (1) | JP7461895B2 (ja) |
KR (1) | KR102523590B1 (ja) |
CN (1) | CN112313636A (ja) |
WO (1) | WO2020005377A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11861403B2 (en) * | 2020-10-15 | 2024-01-02 | Nxp Usa, Inc. | Method and system for accelerator thread management |
US11677839B2 (en) * | 2021-06-17 | 2023-06-13 | Nvidia Corporation | Automatic coalescing of GPU-initiated network communication |
US11960813B2 (en) | 2021-08-02 | 2024-04-16 | Advanced Micro Devices, Inc. | Automatic redistribution layer via generation |
KR20230092227A (ko) | 2021-12-17 | 2023-06-26 | 삼성전자주식회사 | 멀티코어 프로세서 및 스토리지 장치 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180107627A1 (en) * | 2016-10-18 | 2018-04-19 | Advanced Micro Devices, Inc. | Gpu remote communication with triggered operations |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5613071A (en) * | 1995-07-14 | 1997-03-18 | Intel Corporation | Method and apparatus for providing remote memory access in a distributed memory multiprocessor system |
US8170023B2 (en) * | 2007-02-20 | 2012-05-01 | Broadcom Corporation | System and method for a software-based TCP/IP offload engine for implementing efficient digital media streaming over internet protocol networks |
US9450780B2 (en) * | 2012-07-27 | 2016-09-20 | Intel Corporation | Packet processing approach to improve performance and energy efficiency for software routers |
US9319254B2 (en) * | 2012-08-03 | 2016-04-19 | Ati Technologies Ulc | Methods and systems for processing network messages in an accelerated processing device |
US20170180272A1 (en) * | 2012-10-03 | 2017-06-22 | Tracey Bernath | System and method for accelerating network applications using an enhanced network interface and massively parallel distributed processing |
US9934177B2 (en) * | 2014-11-04 | 2018-04-03 | Cavium, Inc. | Methods and systems for accessing storage using a network interface card |
US9342384B1 (en) * | 2014-12-18 | 2016-05-17 | Intel Corporation | Function callback mechanism between a central processing unit (CPU) and an auxiliary processor |
US10331590B2 (en) * | 2016-06-30 | 2019-06-25 | Intel Corporation | Graphics processing unit (GPU) as a programmable packet transfer mechanism |
-
2018
- 2018-06-28 US US16/022,498 patent/US10740163B2/en active Active
-
2019
- 2019-04-25 EP EP19734943.4A patent/EP3814921A1/en active Pending
- 2019-04-25 WO PCT/US2019/029040 patent/WO2020005377A1/en active Application Filing
- 2019-04-25 CN CN201980040626.6A patent/CN112313636A/zh active Pending
- 2019-04-25 JP JP2020570420A patent/JP7461895B2/ja active Active
- 2019-04-25 KR KR1020207037837A patent/KR102523590B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180107627A1 (en) * | 2016-10-18 | 2018-04-19 | Advanced Micro Devices, Inc. | Gpu remote communication with triggered operations |
Also Published As
Publication number | Publication date |
---|---|
US20200004610A1 (en) | 2020-01-02 |
KR20210013732A (ko) | 2021-02-05 |
EP3814921A1 (en) | 2021-05-05 |
US10740163B2 (en) | 2020-08-11 |
JP7461895B2 (ja) | 2024-04-04 |
WO2020005377A1 (en) | 2020-01-02 |
KR102523590B1 (ko) | 2023-04-19 |
CN112313636A (zh) | 2021-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7092801B2 (ja) | Gpuタスクスケジューリングの継続分析タスク | |
JP7461895B2 (ja) | Gpu主導の通信のためのネットワークパケットテンプレーティング | |
CN110741356B (zh) | 多处理器系统中的中继一致存储器管理 | |
CN109690512B (zh) | 具有触发操作的gpu远程通信 | |
US7200695B2 (en) | Method, system, and program for processing packets utilizing descriptors | |
US9632958B2 (en) | System for migrating stash transactions | |
US20230120934A1 (en) | Gpu networking using an integrated command processor | |
US10970118B2 (en) | Shareable FPGA compute engine | |
EP3830702A1 (en) | Vmid as a gpu task container for virtualization | |
CN116243983A (zh) | 处理器、集成电路芯片、指令处理方法、电子设备和介质 | |
US10713188B2 (en) | Inter-process signaling system and method | |
WO2013109234A2 (en) | Method to accelerate message signaled interrupt processing | |
US10284501B2 (en) | Technologies for multi-core wireless network data transmission | |
WO2021061374A1 (en) | Multi-core processor and inter-core data forwarding method | |
EP3234786B1 (en) | Scalable synchronization mechanism for distributed memory | |
WO2024183678A1 (zh) | 获取数据对象的锁的方法、网卡以及计算设备 | |
WO2024000510A1 (zh) | 一种处理请求的方法、装置及系统 | |
US20220114123A1 (en) | Distributed interrupt priority and resolution of race conditions | |
Heidelberger et al. | Concurrent array-based queue |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220425 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230613 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230913 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20231113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240325 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7461895 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |