CN105391658B - 一种基于物理位置感知的集合通信方法 - Google Patents

一种基于物理位置感知的集合通信方法 Download PDF

Info

Publication number
CN105391658B
CN105391658B CN201510830368.5A CN201510830368A CN105391658B CN 105391658 B CN105391658 B CN 105391658B CN 201510830368 A CN201510830368 A CN 201510830368A CN 105391658 B CN105391658 B CN 105391658B
Authority
CN
China
Prior art keywords
communication
purpose process
physical location
arithmetic core
chip
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510830368.5A
Other languages
English (en)
Other versions
CN105391658A (zh
Inventor
何王全
魏迪
尹万旺
刘勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi Jiangnan Computing Technology Institute
Original Assignee
Wuxi Jiangnan Computing Technology Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi Jiangnan Computing Technology Institute filed Critical Wuxi Jiangnan Computing Technology Institute
Priority to CN201510830368.5A priority Critical patent/CN105391658B/zh
Publication of CN105391658A publication Critical patent/CN105391658A/zh
Application granted granted Critical
Publication of CN105391658B publication Critical patent/CN105391658B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/10Packet switching elements characterised by the switching fabric construction
    • H04L49/109Integrated on microchip, e.g. switch-on-chip
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/25Routing or path finding in a switch fabric

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供了一种基于物理位置感知的集合通信方法,包括:感知目的进程的位置;在目的进程和位于同一物理芯片内时,通过查询确定本地运算核心是否空闲;在本地运算核心空闲的情况下,通过本地运算核心发起存储器直接访问操作,将通信数据直接写入所述同一物理芯片上的目的进程主存中,以使得所述同一物理芯片内的通信不需要再通过网络接口进行中转。本发明进行大规模集合通信时,通过感知目的进程的位置,结合路由芯片路由算法,根据无端口冲突原则,使得通信间的路由冲突最小化。

Description

一种基于物理位置感知的集合通信方法
技术领域
本发明涉及计算机技术领域,具体涉及一种基于物理位置感知的集合通信方法。
背景技术
胖树网络是一种以树形结构采用多层路由芯片进行互连,高效可扩展的网络架构。胖树网络以其低成本、高可扩展性的特点受到业界青睐,但是由于需要通过多层交换芯片进行组网,当用户程序需要进行密集消息通信时,存在由于交换芯片端口冲突导致的通信性能下降问题,这是集合通信优化方法不可回避的重要问题之一。此外,异构众核平台的特点在于运算核心阵列拥有强大的聚合通信能力,也为部分邻近的消息密集通信的性能优化提供了可能。
基于异构众核芯片的复合网络体系结构下,并行应用程序通常会因为映射到不同位置的物理核而产生通信带宽差异,从而并行应用程序的集合通信性能产生巨大的影响。
另一方面,全交换集合通信广泛应用于各类并行应用中,以实现各进程间的数据并行。在全交换通信中,所有进程将本进程的数据平均分块,并将其发送到所有其他进程的指定位置。现有全交换通信实现方法过多地关注了点对点通信行为本身对于网络双向带宽能力的发挥,而忽略了大规模环境下的性能可扩展性问题,导致无法充分挖掘底层网络以及CPU本身的通信潜能。
发明内容
本发明所要解决的技术问题是针对现有技术中存在上述缺陷,提供一种基于物理位置感知的集合通信方法,其能够充分利用复合网络体系结构的特征以及异构众核平台中运算核心的强大聚合访存能力,以达到提高并行应用全交换集合通信性能的目的。
本发明进行大规模集合通信时,通过感知目的进程的位置,结合路由芯片路由算法,根据无端口冲突原则,使得通信间的路由冲突最小化。
具体地,根据本发明,提供了一种基于物理位置感知的集合通信方法,包括:
进行点对点通信时,通过物理位置感知,当目的进程和位于同一物理芯片内时,通过查询确定本地运算核心是否空闲;
在本地运算核心空闲的情况下,通过本地运算核心发起存储器直接访问操作,将通信数据直接写入所述同一物理芯片上的目的进程主存中,以使得所述同一物理芯片内的通信不需要再通过网络接口进行中转。
优选地,所述本进程是与目的进程不同的另一进程。
根据本发明,还提供了一种基于物理位置感知的集合通信方法,包括:
感知采用一维通信算法的目的进程的位置;
将一维通信算法修改为两维通信算法;
将采用所述两维通信算法的通信局限于无冲突的底层交换芯片内;
根据目的进程位置,结合路由芯片路由算法,根据无端口冲突原则,使得通信间的路由冲突最小化。
根据本发明,还提供了一种基于物理位置感知的集合通信方法,包括:
感知采用一维通信算法的目的进程的位置;
将一维通信算法修改为多维通信算法;
将采用多维通信算法的通信局限于无冲突的底层交换芯片内;
本发明根据目的进程位置,结合路由芯片路由算法,根据无端口冲突原则,使得通信间的路由冲突最小化。
附图说明
结合附图,并通过参考下面的详细描述,将会更容易地对本发明有更完整的理解并且更容易地理解其伴随的优点和特征,其中:
图1示意性地示出了根据本发明优选实施例的基于物理位置感知的集合通信方法的流程图。
图2示意性地示出了根据本发明第二优选实施例的基于物理位置感知的集合通信方法的流程图。
需要说明的是,附图用于说明本发明,而非限制本发明。注意,表示结构的附图可能并非按比例绘制。并且,附图中,相同或者类似的元件标有相同或者类似的标号。
具体实施方式
为了使本发明的内容更加清楚和易懂,下面结合具体实施例和附图对本发明的内容进行详细描述。
胖树网络通常由多层交换芯片构成,当用户消息数据在多层交换芯片中进行传输时,由交换芯片中的路由算法决定数据传输的路径。在密集通信条件下,如果采用单纯的一维视图进行通信,会由于路由芯片端口间的冲突导致集合通信中的某个步骤性能急剧下降,从而对整体通信性能造成影响。此外,在全交换通信的某个阶段,会集中出现所有进程在芯片内进行数据交互的情况,在这种情况下,消息数据虽然不会通过交换芯片进行传输,但会由于多个进程竞争芯片网络接口资源,导致带宽下降。
本发明在充分提炼全交换通信行为特征的基础上,将通信过程细化为多个子过程,将常规的一维通信修改为多维通信,通过感知应用程序物理资源特征,采用不同优化策略对每个子过程进行有针对性的优化。
下面将结合附图来描述本发明的具体优选实施例。
<第一实施例>
图1示意性地示出了根据本发明第一优选实施例的基于物理位置感知的集合通信方法的流程图。
如图1所示,根据本发明第一优选实施例的基于物理位置感知的集合通信方法包括:
第一步骤S1:进行点对点通信时,进行物理位置感知,当目的进程和本进程(当前进程,是与目的进程不同的另一进程)位于同一物理芯片内时,通过查询确定本地运算核心是否空闲;
第二步骤S2:在本地运算核心空闲的情况下,通过本地运算核心发起存储器直接访问操作,将通信数据直接写入所述同一物理芯片上的目的进程主存中,以使得所述同一物理芯片内的通信不需要再通过网络接口进行中转。
首先,通过感知目的进程的位置,并且在目的进程和本进程位于同一物理芯片内时,通过查询确定本地运算核心是否空闲,如果本地运算核心空闲则通过本地运算核心发起DMA(Direc tMemory Access,存储器直接访问)操作,将通信数据直接写入目的进程主存中。这样实现的好处在于,所述同一物理芯片内的通信不需要再通过网络接口进行中转,密集通信时,芯片内通信不会由于多对通信的冲突产生带宽损失。
<第二实施例>
图2示意性地示出了根据本发明第二优选实施例的基于物理位置感知的集合通信方法的流程图。
如图2所示,根据本发明第二优选实施例的基于物理位置感知的集合通信方法包括:
第一步骤S10:感知采用一维通信算法的目的进程的位置;
第二步骤S20:将传统的一维通信算法修改为两维通信算法或多维通信算法;
第三步骤S30:将采用所述两维通信算法或多维通信算法的通信局限于无冲突的底层交换芯片内;
第四步骤S40:根据目的进程位置,结合路由芯片路由算法,根据无端口冲突原则,使得通信间的路由冲突最小化。
可以看出,通过感知目的进程的位置,将传统的一维算法修改为两维算法甚至多维算法;先将通信局限于无冲突的底层交换芯片内;再根据目的进程位置,结合路由芯片路由算法,根据无端口冲突原则尽量降低通信间的路由冲突,以保证远距离跨路由芯片通信的消息性能。
可以看出,本发明充分利用空闲计算核心的强大聚合访存能力对邻近进程的通信性能进行优化,而且本发明结合路由算法,采用多维方式降低路由芯片端口冲突,优化通信性能。
本发明以物理节点的标记规则和网络路由交换方式为基础,感知物理节点之间的通信耦合的松紧强度,根据物理节点的形状和规则选择合适的相应的多层通信策略算法,根据不同的硬件资源选择满足一定条件的优化算法。此外,本发明通过感知消息通信的局部性,利用运算核心的空闲计算能力来加速芯片内邻近通信的消息性能。
本发明的优点在于能够利用目标平台体系结构特征,充分挖掘目标平台的通信潜能,将无序通信变为有序通信,将一维通信变为多维通信,以达到获取最佳全交换集合通信性能的目的。
此外,需要说明的是,除非特别指出,否则说明书中的术语“第一”、“第二”、“第三”等描述仅仅用于区分说明书中的各个组件、元素、步骤等,而不是用于表示各个组件、元素、步骤之间的逻辑关系或者顺序关系等。
可以理解的是,虽然本发明已以较佳实施例披露如上,然而上述实施例并非用以限定本发明。对于任何熟悉本领域的技术人员而言,在不脱离本发明技术方案范围情况下,都可利用上述揭示的技术内容对本发明技术方案作出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。

Claims (2)

1.一种基于物理位置感知的集合通信方法,其特征在于包括:
进行点对点通信时,通过物理位置感知,当目的进程和当前进程位于同一物理芯片内时,通过查询确定本地运算核心是否空闲;
在本地运算核心空闲的情况下,通过本地运算核心发起存储器直接访问操作,将通信数据直接写入所述同一物理芯片上的目的进程主存中,以使得所述同一物理芯片内的通信不需要再通过网络接口进行中转。
2.根据权利要求1所述的基于物理位置感知的集合通信方法,其特征在于,所述当前进程是与目的进程不同的另一进程。
CN201510830368.5A 2015-11-24 2015-11-24 一种基于物理位置感知的集合通信方法 Active CN105391658B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510830368.5A CN105391658B (zh) 2015-11-24 2015-11-24 一种基于物理位置感知的集合通信方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510830368.5A CN105391658B (zh) 2015-11-24 2015-11-24 一种基于物理位置感知的集合通信方法

Publications (2)

Publication Number Publication Date
CN105391658A CN105391658A (zh) 2016-03-09
CN105391658B true CN105391658B (zh) 2018-07-06

Family

ID=55423504

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510830368.5A Active CN105391658B (zh) 2015-11-24 2015-11-24 一种基于物理位置感知的集合通信方法

Country Status (1)

Country Link
CN (1) CN105391658B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107733945B (zh) * 2016-08-11 2019-03-12 北京百度网讯科技有限公司 用于机器人操作系统的信息传输方法及装置
CN115208964A (zh) * 2021-04-09 2022-10-18 华为技术有限公司 集合通信的方法及通信装置
CN114244708B (zh) * 2021-04-26 2023-08-08 无锡江南计算技术研究所 一种胖树网络结构上的通信优化方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101836486A (zh) * 2007-10-22 2010-09-15 马维尔国际贸易有限公司 用于wlan的位置感知背景接入点扫描
CN102183759A (zh) * 2011-01-25 2011-09-14 中国船舶重工集团公司第七一五研究所 基于Linux集群的声纳实时信号处理实现方法
CN102929738A (zh) * 2012-11-06 2013-02-13 无锡江南计算技术研究所 大规模异构并行计算的容错方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070254634A1 (en) * 2006-04-27 2007-11-01 Jose Costa-Requena Configuring a local network device using a wireless provider network

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101836486A (zh) * 2007-10-22 2010-09-15 马维尔国际贸易有限公司 用于wlan的位置感知背景接入点扫描
CN102183759A (zh) * 2011-01-25 2011-09-14 中国船舶重工集团公司第七一五研究所 基于Linux集群的声纳实时信号处理实现方法
CN102929738A (zh) * 2012-11-06 2013-02-13 无锡江南计算技术研究所 大规模异构并行计算的容错方法

Also Published As

Publication number Publication date
CN105391658A (zh) 2016-03-09

Similar Documents

Publication Publication Date Title
US8819611B2 (en) Asymmetric mesh NoC topologies
KR101937211B1 (ko) 상호 연결에서 이종 채널 용량
CN103986664B (zh) 一种用于片上网络的混合互连Mesh拓扑结构及其路由算法
US9294354B2 (en) Using multiple traffic profiles to design a network on chip
Abadal et al. On the area and energy scalability of wireless network-on-chip: A model-based benchmarked design space exploration
CN105075199B (zh) 具有到每一资源的多个分布式连接的直接网络系统
CN105391658B (zh) 一种基于物理位置感知的集合通信方法
US20150103822A1 (en) Noc interface protocol adaptive to varied host interface protocols
US9160627B2 (en) Multiple heterogeneous NoC layers
CN105049353B (zh) 一种为业务配置路由路径的方法及控制器
US10218581B2 (en) Generation of network-on-chip layout based on user specified topological constraints
TW201124909A (en) Multiprocessing computing with distributed embedded switching
CN105634974B (zh) 软件定义网络中的路由确定方法和装置
CN107430574A (zh) 用于分析系统的io、处理和存储器带宽的优化的方法和装置
CN107959643A (zh) 一种通过交换芯片构建的交换系统及其路由算法
Murray et al. Sustainable wireless network-on-chip architectures
US8953497B2 (en) Modified tree-based multicast routing schema
CN103346950B (zh) 一种机架式无线控制器用户业务板间负载均摊方法及装置
Duraisamy et al. Enabling high-performance SMART NoC architectures using on-chip wireless links
US9864728B2 (en) Automatic generation of physically aware aggregation/distribution networks
CN105426793B (zh) 一种多端口设备控制器加解密调度控制方法
Mamaghani et al. An adaptive congestion-aware routing algorithm based on network load for wireless routers in wireless network-on-chip
CN107181694B (zh) 一种运用多线程技术实现的路由频谱分配方法
Lee et al. Design of a feasible on-chip interconnection network for a chip multiprocessor (cmp)
US10084725B2 (en) Extracting features from a NoC for machine learning construction

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant