CN105391658A - 一种基于物理位置感知的集合通信方法 - Google Patents
一种基于物理位置感知的集合通信方法 Download PDFInfo
- Publication number
- CN105391658A CN105391658A CN201510830368.5A CN201510830368A CN105391658A CN 105391658 A CN105391658 A CN 105391658A CN 201510830368 A CN201510830368 A CN 201510830368A CN 105391658 A CN105391658 A CN 105391658A
- Authority
- CN
- China
- Prior art keywords
- communication
- chip
- conflict
- algorithms
- collective
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/10—Packet switching elements characterised by the switching fabric construction
- H04L49/109—Integrated on microchip, e.g. switch-on-chip
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/25—Routing or path finding in a switch fabric
Abstract
本发明提供了一种基于物理位置感知的集合通信方法,包括:感知目的进程的位置;在目的进程和位于同一物理芯片内时,通过查询确定本地运算核心是否空闲;在本地运算核心空闲的情况下,通过本地运算核心发起存储器直接访问操作,将通信数据直接写入所述同一物理芯片上的目的进程主存中,以使得所述同一物理芯片内的通信不需要再通过网络接口进行中转。本发明进行大规模集合通信时,通过感知目的进程的位置,结合路由芯片路由算法,根据无端口冲突原则,使得通信间的路由冲突最小化。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种基于物理位置感知的集合通信方法。
背景技术
胖树网络是一种以树形结构采用多层路由芯片进行互连,高效可扩展的网络架构。胖树网络以其低成本、高可扩展性的特点受到业界青睐,但是由于需要通过多层交换芯片进行组网,当用户程序需要进行密集消息通信时,存在由于交换芯片端口冲突导致的通信性能下降问题,这是集合通信优化方法不可回避的重要问题之一。此外,异构众核平台的特点在于运算核心阵列拥有强大的聚合通信能力,也为部分邻近的消息密集通信的性能优化提供了可能。
基于异构众核芯片的复合网络体系结构下,并行应用程序通常会因为映射到不同位置的物理核而产生通信带宽差异,从而并行应用程序的集合通信性能产生巨大的影响。
另一方面,全交换集合通信广泛应用于各类并行应用中,以实现各进程间的数据并行。在全交换通信中,所有进程将本进程的数据平均分块,并将其发送到所有其他进程的指定位置。现有全交换通信实现方法过多地关注了点对点通信行为本身对于网络双向带宽能力的发挥,而忽略了大规模环境下的性能可扩展性问题,导致无法充分挖掘底层网络以及CPU本身的通信潜能。
发明内容
本发明所要解决的技术问题是针对现有技术中存在上述缺陷,提供一种基于物理位置感知的集合通信方法,其能够充分利用复合网络体系结构的特征以及异构众核平台中运算核心的强大聚合访存能力,以达到提高并行应用全交换集合通信性能的目的。
本发明进行大规模集合通信时,通过感知目的进程的位置,结合路由芯片路由算法,根据无端口冲突原则,使得通信间的路由冲突最小化。
具体地,根据本发明,提供了一种基于物理位置感知的集合通信方法,包括:
进行点对点通信时,通过物理位置感知,当目的进程和位于同一物理芯片内时,通过查询确定本地运算核心是否空闲;
在本地运算核心空闲的情况下,通过本地运算核心发起存储器直接访问操作,将通信数据直接写入所述同一物理芯片上的目的进程主存中,以使得所述同一物理芯片内的通信不需要再通过网络接口进行中转。
优选地,所述本进程是与目的进程不同的另一进程。
根据本发明,还提供了一种基于物理位置感知的集合通信方法,包括:
感知采用一维通信算法的目的进程的位置;
将一维通信算法修改为两维通信算法;
将采用所述两维通信算法的通信局限于无冲突的底层交换芯片内;
根据目的进程位置,结合路由芯片路由算法,根据无端口冲突原则,使得通信间的路由冲突最小化。
根据本发明,还提供了一种基于物理位置感知的集合通信方法,包括:
感知采用一维通信算法的目的进程的位置;
将一维通信算法修改为多维通信算法;
将采用多维通信算法的通信局限于无冲突的底层交换芯片内;
本发明根据目的进程位置,结合路由芯片路由算法,根据无端口冲突原则,使得通信间的路由冲突最小化。
附图说明
结合附图,并通过参考下面的详细描述,将会更容易地对本发明有更完整的理解并且更容易地理解其伴随的优点和特征,其中:
图1示意性地示出了根据本发明优选实施例的基于物理位置感知的集合通信方法的流程图。
图2示意性地示出了根据本发明第二优选实施例的基于物理位置感知的集合通信方法的流程图。
需要说明的是,附图用于说明本发明,而非限制本发明。注意,表示结构的附图可能并非按比例绘制。并且,附图中,相同或者类似的元件标有相同或者类似的标号。
具体实施方式
为了使本发明的内容更加清楚和易懂,下面结合具体实施例和附图对本发明的内容进行详细描述。
胖树网络通常由多层交换芯片构成,当用户消息数据在多层交换芯片中进行传输时,由交换芯片中的路由算法决定数据传输的路径。在密集通信条件下,如果采用单纯的一维视图进行通信,会由于路由芯片端口间的冲突导致集合通信中的某个步骤性能急剧下降,从而对整体通信性能造成影响。此外,在全交换通信的某个阶段,会集中出现所有进程在芯片内进行数据交互的情况,在这种情况下,消息数据虽然不会通过交换芯片进行传输,但会由于多个进程竞争芯片网络接口资源,导致带宽下降。
本发明在充分提炼全交换通信行为特征的基础上,将通信过程细化为多个子过程,将常规的一维通信修改为多维通信,通过感知应用程序物理资源特征,采用不同优化策略对每个子过程进行有针对性的优化。
下面将结合附图来描述本发明的具体优选实施例。
<第一实施例>
图1示意性地示出了根据本发明第一优选实施例的基于物理位置感知的集合通信方法的流程图。
如图1所示,根据本发明第一优选实施例的基于物理位置感知的集合通信方法包括:
第一步骤S1:进行点对点通信时,进行物理位置感知,当目的进程和本进程(当前进程,是与目的进程不同的另一进程)位于同一物理芯片内时,通过查询确定本地运算核心是否空闲;
第二步骤S2:在本地运算核心空闲的情况下,通过本地运算核心发起存储器直接访问操作,将通信数据直接写入所述同一物理芯片上的目的进程主存中,以使得所述同一物理芯片内的通信不需要再通过网络接口进行中转。
首先,通过感知目的进程的位置,并且在目的进程和本进程位于同一物理芯片内时,通过查询确定本地运算核心是否空闲,如果本地运算核心空闲则通过本地运算核心发起DMA(DirectMemoryAccess,存储器直接访问)操作,将通信数据直接写入目的进程主存中。这样实现的好处在于,所述同一物理芯片内的通信不需要再通过网络接口进行中转,密集通信时,芯片内通信不会由于多对通信的冲突产生带宽损失。
<第二实施例>
图2示意性地示出了根据本发明第二优选实施例的基于物理位置感知的集合通信方法的流程图。
如图2所示,根据本发明第二优选实施例的基于物理位置感知的集合通信方法包括:
第一步骤S10:感知采用一维通信算法的目的进程的位置;
第二步骤S20:将传统的一维通信算法修改为两维通信算法或多维通信算法;
第三步骤S30:将采用所述两维通信算法或多维通信算法的通信局限于无冲突的底层交换芯片内;
第四步骤S40:根据目的进程位置,结合路由芯片路由算法,根据无端口冲突原则,使得通信间的路由冲突最小化。
可以看出,通过感知目的进程的位置,将传统的一维算法修改为两维算法甚至多维算法;先将通信局限于无冲突的底层交换芯片内;再根据目的进程位置,结合路由芯片路由算法,根据无端口冲突原则尽量降低通信间的路由冲突,以保证远距离跨路由芯片通信的消息性能。
可以看出,本发明充分利用空闲计算核心的强大聚合访存能力对邻近进程的通信性能进行优化,而且本发明结合路由算法,采用多维方式降低路由芯片端口冲突,优化通信性能。
本发明以物理节点的标记规则和网络路由交换方式为基础,感知物理节点之间的通信耦合的松紧强度,根据物理节点的形状和规则选择合适的相应的多层通信策略算法,根据不同的硬件资源选择满足一定条件的优化算法。此外,本发明通过感知消息通信的局部性,利用运算核心的空闲计算能力来加速芯片内邻近通信的消息性能。
本发明的优点在于能够利用目标平台体系结构特征,充分挖掘目标平台的通信潜能,将无序通信变为有序通信,将一维通信变为多维通信,以达到获取最佳全交换集合通信性能的目的。
此外,需要说明的是,除非特别指出,否则说明书中的术语“第一”、“第二”、“第三”等描述仅仅用于区分说明书中的各个组件、元素、步骤等,而不是用于表示各个组件、元素、步骤之间的逻辑关系或者顺序关系等。
可以理解的是,虽然本发明已以较佳实施例披露如上,然而上述实施例并非用以限定本发明。对于任何熟悉本领域的技术人员而言,在不脱离本发明技术方案范围情况下,都可利用上述揭示的技术内容对本发明技术方案作出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。
Claims (4)
1.一种基于物理位置感知的集合通信方法,其特征在于包括:
进行点对点通信时,通过物理位置感知,当目的进程和位于同一物理芯片内时,通过查询确定本地运算核心是否空闲;
在本地运算核心空闲的情况下,通过本地运算核心发起存储器直接访问操作,将通信数据直接写入所述同一物理芯片上的目的进程主存中,以使得所述同一物理芯片内的通信不需要再通过网络接口进行中转。
2.根据权利要求1所述的基于物理位置感知的集合通信方法,其特征在于,所述本进程是与目的进程不同的另一进程。
3.一种基于物理位置感知的集合通信方法,其特征在于包括:
感知采用一维通信算法的目的进程的位置;
将一维通信算法修改为两维通信算法;
将采用所述两维通信算法的通信局限于无冲突的底层交换芯片内;
根据目的进程位置,结合路由芯片路由算法,根据无端口冲突原则,使得通信间的路由冲突最小化。
4.一种基于物理位置感知的集合通信方法,其特征在于包括:
感知采用一维通信算法的目的进程的位置;
将一维通信算法修改为多维通信算法;
将采用多维通信算法的通信局限于无冲突的底层交换芯片内;
根据目的进程位置,结合路由芯片路由算法,根据无端口冲突原则,使得通信间的路由冲突最小化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510830368.5A CN105391658B (zh) | 2015-11-24 | 2015-11-24 | 一种基于物理位置感知的集合通信方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510830368.5A CN105391658B (zh) | 2015-11-24 | 2015-11-24 | 一种基于物理位置感知的集合通信方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105391658A true CN105391658A (zh) | 2016-03-09 |
CN105391658B CN105391658B (zh) | 2018-07-06 |
Family
ID=55423504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510830368.5A Active CN105391658B (zh) | 2015-11-24 | 2015-11-24 | 一种基于物理位置感知的集合通信方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105391658B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107733945A (zh) * | 2016-08-11 | 2018-02-23 | 北京百度网讯科技有限公司 | 用于机器人操作系统的信息传输方法及装置 |
CN114244708A (zh) * | 2021-04-26 | 2022-03-25 | 无锡江南计算技术研究所 | 一种胖树网络结构上的通信优化方法 |
WO2022214041A1 (zh) * | 2021-04-09 | 2022-10-13 | 华为技术有限公司 | 集合通信的方法及通信装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070254634A1 (en) * | 2006-04-27 | 2007-11-01 | Jose Costa-Requena | Configuring a local network device using a wireless provider network |
CN101836486A (zh) * | 2007-10-22 | 2010-09-15 | 马维尔国际贸易有限公司 | 用于wlan的位置感知背景接入点扫描 |
CN102183759A (zh) * | 2011-01-25 | 2011-09-14 | 中国船舶重工集团公司第七一五研究所 | 基于Linux集群的声纳实时信号处理实现方法 |
CN102929738A (zh) * | 2012-11-06 | 2013-02-13 | 无锡江南计算技术研究所 | 大规模异构并行计算的容错方法 |
-
2015
- 2015-11-24 CN CN201510830368.5A patent/CN105391658B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070254634A1 (en) * | 2006-04-27 | 2007-11-01 | Jose Costa-Requena | Configuring a local network device using a wireless provider network |
CN101836486A (zh) * | 2007-10-22 | 2010-09-15 | 马维尔国际贸易有限公司 | 用于wlan的位置感知背景接入点扫描 |
CN102183759A (zh) * | 2011-01-25 | 2011-09-14 | 中国船舶重工集团公司第七一五研究所 | 基于Linux集群的声纳实时信号处理实现方法 |
CN102929738A (zh) * | 2012-11-06 | 2013-02-13 | 无锡江南计算技术研究所 | 大规模异构并行计算的容错方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107733945A (zh) * | 2016-08-11 | 2018-02-23 | 北京百度网讯科技有限公司 | 用于机器人操作系统的信息传输方法及装置 |
CN107733945B (zh) * | 2016-08-11 | 2019-03-12 | 北京百度网讯科技有限公司 | 用于机器人操作系统的信息传输方法及装置 |
WO2022214041A1 (zh) * | 2021-04-09 | 2022-10-13 | 华为技术有限公司 | 集合通信的方法及通信装置 |
CN114244708A (zh) * | 2021-04-26 | 2022-03-25 | 无锡江南计算技术研究所 | 一种胖树网络结构上的通信优化方法 |
CN114244708B (zh) * | 2021-04-26 | 2023-08-08 | 无锡江南计算技术研究所 | 一种胖树网络结构上的通信优化方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105391658B (zh) | 2018-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9244880B2 (en) | Automatic construction of deadlock free interconnects | |
Choi et al. | On-chip communication network for efficient training of deep convolutional networks on heterogeneous manycore systems | |
US10348563B2 (en) | System-on-chip (SoC) optimization through transformation and generation of a network-on-chip (NoC) topology | |
US8819611B2 (en) | Asymmetric mesh NoC topologies | |
US9009648B2 (en) | Automatic deadlock detection and avoidance in a system interconnect by capturing internal dependencies of IP cores using high level specification | |
CN105408879A (zh) | 快捷外围部件互连域的资源管理 | |
CN103986664A (zh) | 一种用于片上网络的混合互连Mesh拓扑结构及其路由算法 | |
JP7317727B2 (ja) | 複数のチップ間の通信をサポートする方法、装置、電子機器およびコンピューター記憶媒体 | |
US20160378548A1 (en) | Hybrid heterogeneous host system, resource configuration method and task scheduling method | |
CN105391658A (zh) | 一种基于物理位置感知的集合通信方法 | |
CN105119833A (zh) | 一种用于片上网络的混合互连结构、其网络节点编码方法及其混合路由算法 | |
CN110191204A (zh) | 一种内网设备间通信方法、系统、装置及计算机存储介质 | |
JP2020167665A (ja) | サービスとしてのハードウェアリソースに直接的なリソースアドレス指定能力を提供する技術 | |
CN109242458A (zh) | 基于区块链的信息管理方法及相关设备 | |
US20110252173A1 (en) | Translating a requester identifier to a chip identifier | |
CN106951390A (zh) | 一种可降低跨节点访存延时的numa系统构建方法 | |
CN111901257B (zh) | 一种交换机、报文转发方法及电子设备 | |
US9923794B2 (en) | Method, apparatus, and system for identifying abnormal IP data stream | |
US11113116B2 (en) | Task mapping method of network-on-chip semiconductor device | |
Furhad et al. | A shortly connected mesh topology for high performance and energy efficient network-on-chip architectures | |
WO2020124488A1 (zh) | 应用进程映射方法、电子装置及计算机可读存储介质 | |
Seifi et al. | Clustered NOC, a suitable design for group communications in Network on Chip | |
US9762474B2 (en) | Systems and methods for selecting a router to connect a bridge in the network on chip (NoC) | |
US20230119051A1 (en) | Method and apparatus for constructing fpga chip top-level schematic and storage medium | |
CN110825689B (zh) | 电子芯片的实现方法及电子芯片 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |