CN114244708A - 一种胖树网络结构上的通信优化方法 - Google Patents

一种胖树网络结构上的通信优化方法 Download PDF

Info

Publication number
CN114244708A
CN114244708A CN202110452524.4A CN202110452524A CN114244708A CN 114244708 A CN114244708 A CN 114244708A CN 202110452524 A CN202110452524 A CN 202110452524A CN 114244708 A CN114244708 A CN 114244708A
Authority
CN
China
Prior art keywords
communication
super node
nodes
fat tree
super
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110452524.4A
Other languages
English (en)
Other versions
CN114244708B (zh
Inventor
王飞
林蓉芬
尹万旺
郑岩
袁欣辉
魏迪
孙浩男
孙强
史俊达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi Jiangnan Computing Technology Institute
Original Assignee
Wuxi Jiangnan Computing Technology Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi Jiangnan Computing Technology Institute filed Critical Wuxi Jiangnan Computing Technology Institute
Priority to CN202110452524.4A priority Critical patent/CN114244708B/zh
Publication of CN114244708A publication Critical patent/CN114244708A/zh
Application granted granted Critical
Publication of CN114244708B publication Critical patent/CN114244708B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • H04L41/083Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability for increasing network speed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0896Bandwidth or capacity management, i.e. automatically increasing or decreasing capacities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开一种胖树网络结构上的通信优化方法,包括以下步骤:S1、假设每个超节点包含的节点数量为N,根据裁剪胖树裁剪比例1/X,计算每个超节点同时通信的最大进程数M=N*(1/X),M为同时通信时,理论上能用满带宽的超节点内最大进程数;S2、根据课题的通信方式,得到课题需要同时通信的进程数量K;S3、若K小于超节点内节点数量,将每个超节点按照K个进程为1组,分为若干组,转S;S4、按超节点内的组号和组内编号,结合具体的路由规则,对超节点进行逻辑编号;S5、按照新的逻辑编号和课题特征,依次进行组内和组间通信。本发明实现了应用课题和系统的结合,显著提高了课题的带宽利用率,充分发挥了系统的网络性能。

Description

一种胖树网络结构上的通信优化方法
技术领域
本发明涉及一种胖树网络结构上的通信优化方法,属于网络通信的性能优化技术领域。
背景技术
胖树网络是目前高性能计算领域常见的网络拓扑结构。由于超级计算机规模越来越大,目前TOP500第一名的超级计算机系统峰值已经达到500P,节点数量超过15万。在经济、效益等各方面考量下,有裁剪的胖树是许多超级计算机系统的选择,引入裁剪后,胖树网络面临带宽裁剪和通信冲突的问题。如何用好裁剪胖树网络,避免网络冲突,充分发挥网络性能,在现实的高性能应用中具有重要意义。
目前裁剪胖树网络的性能优化,一般都是基于硬件底层的网络路由算法优化或者基于MPI层的通信算法优化。基于硬件底层的网络路由算法优化,优化的视角是基于网络拓扑,保证尽可能多的情况下路由的尽量不冲突;基于MPI层的通信算法优化,优化的视角是典型的集合通信算法。这两种优化思路,属于粗粒度的、整体层面的系统优化,很难满足课题的特定通信方式的需求。
裁剪胖树网络结构由于带宽无法保证任意叶节点间有专属通路,叶节点间通信达不到理论网络带宽,当所有叶节点进程同时通信时,得到的最大带宽相当于理论带宽的1/X,裁剪比例越大,可得到的实际带宽越少。在超大规模的裁剪胖树网络下,如何得到标称的理论带宽,是个实际且重要的问题。
发明内容
本发明的目的是提供一种胖树网络结构上的通信优化方法,以解决硬件底层路由优化和MPI层通信算法优化只针对系统整体优化、针对性不强的问题。
为达到上述目的,本发明采用的技术方案是:提供一种胖树网络结构上的通信优化方法,包括以下步骤:
S1、假设每个超节点包含的节点数量为N,根据裁剪胖树裁剪比例1/X,计算每个超节点同时通信的最大进程数N*(1/X)=M,M为同时通信时,理论上能用满带宽的超节点内最大进程数;
S2、根据课题的通信方式,得到课题需要同时通信的进程数量K;
S3、若K小于超节点内节点数量N,将每个超节点按照K个进程为1组,分为若干组,转S4,若K不小于超节点内节点数量N, 则按N个进程为1组进行编号;
S4、按超节点内的组号和组内编号,结合具体的路由规则,对通信节点进行逻辑编号;
S5、按照新的逻辑编号和课题特征,依次进行组内和组间通信。
由于上述技术方案的运用,本发明与现有技术相比具有下列优点:
本发明一种胖树网络结构上的通信优化方法,实现了应用课题和系统的结合,显著提高了课题的带宽利用率,充分发挥了系统的网络性能。
附图说明
附图1为发明一种胖树网络结构上的通信优化方法的流程示意图。
具体实施方式
实施例:本发明提供一种胖树网络结构上的通信优化方法,具体包括以下步骤:
S1、假设每个超节点包含的节点数量为N,根据裁剪胖树裁剪比例1/X,计算每个超节点同时通信的最大进程数M=N*(1/X),M为同时通信时,理论上能用满带宽的超节点内最大进程数;
S2、根据课题的通信方式,得到课题需要同时通信的进程数量K,K与课题特点紧密相关,也与实现的算法相关,由课题作者具体给定;
S3、若K小于超节点内节点数量N,将每个超节点按照K个进程为1组,分为若干组,转S4,若K不小于超节点内节点数量N, 则按N个进程为1组进行编号;
S4、按超节点内的组号和组内编号,结合具体的路由规则,对通信节点进行逻辑编号;
S5、按照新的逻辑编号和课题特征,依次进行组内和组间通信。
对上述实施例的进一步解释如下:
本发明结合裁剪胖树网络拓扑结构,建立了网络拓扑结构到课题通信方式的有机联系,设计与课题的通信特点相适应的进程映射方式,将进程的物理编号映射成相应的逻辑编号,在网络拓扑视角改变进程的通信时空顺序,达到无冲突使用网络的目的,避免了进程只能得到理论带宽的1/X,使得进程得到的网络带宽贴近标称的理论带宽,使得课题使用裁剪胖树时达到网络冲突最小化和网络带宽利用最大化,最大程度利用了裁剪胖树的网络带宽,充分发挥了裁剪胖树网络的性能。
如附图1所示:
设每个超节点数量为N,根据裁剪胖树裁剪比例1/X,计算出要保证每个节点用满带宽 ,理论上每个超节点同时通信的最大进程数为N*(1/X)=M;
根据实际课题通信方式,得到需要同时通信的进程数量K;
若K小于超节点内节点数量,将每个超节点按照K进程为1组,分为若干组;
按超节点组号和组内编号对超节点进行逻辑编号;
按照新的逻辑编号进行组内和组间通信。
采用上述一种胖树网络结构上的通信优化方法时,其实现了应用课题和系统的结合,显著提高了课题的带宽利用率,充分发挥了系统的网络性能。
为了便于更好的理解本发明,下面将对本文中使用的术语进行简要的解释:
树形网络拓扑:形状像一棵倒置的树,顶端是树根,树根以下是分支,每个分支可以再带子分支,底端是树叶。
胖树:是传统树形网络拓扑的变形,节点之间的通路自叶向根逐渐变宽,适应通信量自叶向根逐渐变大的实际需求。
1/X裁剪:表示胖树自叶向根的宽度比叶节点数少,宽度为叶节点数的1/X。
逻辑编号:由通信方式决定的一种进程编号方式。
物理编号:由网络连接方式决定的进程所在的实际物理位置。
进程映射:通信节点的逻辑编号与物理编号的对应关系。
超节点:网络拓扑中宽度和节点数量一致的最大叶节点集合。
上述实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所作的等效变化或修饰,都应涵盖在本发明的保护范围之内。

Claims (1)

1.一种胖树网络结构上的通信优化方法,其特征在于,包括以下步骤:
S1、假设每个超节点包含的节点数量为N,根据裁剪胖树裁剪比例1/X,计算每个超节点同时通信的最大进程数N*(1/X)=M,M为同时通信时,理论上能用满带宽的超节点内最大进程数;
S2、根据课题的通信方式,得到课题需要同时通信的进程数量K;
S3、若K小于超节点内节点数量N,将每个超节点按照K个进程为1组,分为若干组,转S4,若K不小于超节点内节点数量N, 则按N个进程为1组进行编号;
S4、按超节点内的组号和组内编号,结合具体的路由规则,对通信节点进行逻辑编号;
S5、按照新的逻辑编号和课题特征,依次进行组内和组间通信。
CN202110452524.4A 2021-04-26 2021-04-26 一种胖树网络结构上的通信优化方法 Active CN114244708B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110452524.4A CN114244708B (zh) 2021-04-26 2021-04-26 一种胖树网络结构上的通信优化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110452524.4A CN114244708B (zh) 2021-04-26 2021-04-26 一种胖树网络结构上的通信优化方法

Publications (2)

Publication Number Publication Date
CN114244708A true CN114244708A (zh) 2022-03-25
CN114244708B CN114244708B (zh) 2023-08-08

Family

ID=80742829

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110452524.4A Active CN114244708B (zh) 2021-04-26 2021-04-26 一种胖树网络结构上的通信优化方法

Country Status (1)

Country Link
CN (1) CN114244708B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117135107A (zh) * 2023-10-25 2023-11-28 苏州元脑智能科技有限公司 一种网络通信拓扑系统、路由方法、设备及介质

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5859981A (en) * 1995-07-12 1999-01-12 Super P.C., L.L.C. Method for deadlock-free message passing in MIMD systems using routers and buffers
US20040054850A1 (en) * 2002-09-18 2004-03-18 Fisk David C. Context sensitive storage management
US20140237069A1 (en) * 2013-02-20 2014-08-21 Red Hat, Inc. Assigning pre-existing processes to select sets of non-uniform memory access (numa) aligned resources
CN104461467A (zh) * 2013-09-25 2015-03-25 广州中国科学院软件应用技术研究所 针对SMP集群系统采用MPI和OpenMP混合并行提高计算速度的方法
CN105391658A (zh) * 2015-11-24 2016-03-09 无锡江南计算技术研究所 一种基于物理位置感知的集合通信方法
US20170005946A1 (en) * 2015-07-02 2017-01-05 Fujitsu Limited Method of allocating processes on node devices, apparatus, and storage medium
CN106713273A (zh) * 2016-11-23 2017-05-24 中国空间技术研究院 一种基于字典树剪枝搜索的协议关键字识别方法
CN107748706A (zh) * 2017-10-27 2018-03-02 郑州云海信息技术有限公司 一种绑定方法及装置
US20180069803A1 (en) * 2016-09-08 2018-03-08 Bull Sas Message exchange during parallel execution of processes in a high-performance computer
US20180095800A1 (en) * 2016-09-30 2018-04-05 Netease (Hangzhou) Network Co., Ltd. Method and device for allocating core resources of a multi-core cpu
CN109739670A (zh) * 2019-02-01 2019-05-10 中国人民解放军国防科技大学 节点内进程通信方法、装置、计算机设备和存储介质
CN110191155A (zh) * 2019-05-07 2019-08-30 中国人民解放军国防科技大学 一种面向胖树互连网络的并行作业调度方法、系统及存储介质
US10560351B1 (en) * 2017-12-28 2020-02-11 Architecture Technology Corporation Network monitoring tool for supercomputers
US20200136898A1 (en) * 2018-10-24 2020-04-30 Cox Communications, Inc. Systems and Methods for Network Configuration Management
CN112202599A (zh) * 2020-09-11 2021-01-08 北京科技大学 针对异构多核平台通信优化的拓扑感知映射方法及系统

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5859981A (en) * 1995-07-12 1999-01-12 Super P.C., L.L.C. Method for deadlock-free message passing in MIMD systems using routers and buffers
US20040054850A1 (en) * 2002-09-18 2004-03-18 Fisk David C. Context sensitive storage management
US20140237069A1 (en) * 2013-02-20 2014-08-21 Red Hat, Inc. Assigning pre-existing processes to select sets of non-uniform memory access (numa) aligned resources
CN104461467A (zh) * 2013-09-25 2015-03-25 广州中国科学院软件应用技术研究所 针对SMP集群系统采用MPI和OpenMP混合并行提高计算速度的方法
US20170005946A1 (en) * 2015-07-02 2017-01-05 Fujitsu Limited Method of allocating processes on node devices, apparatus, and storage medium
CN105391658A (zh) * 2015-11-24 2016-03-09 无锡江南计算技术研究所 一种基于物理位置感知的集合通信方法
US20180069803A1 (en) * 2016-09-08 2018-03-08 Bull Sas Message exchange during parallel execution of processes in a high-performance computer
US20180095800A1 (en) * 2016-09-30 2018-04-05 Netease (Hangzhou) Network Co., Ltd. Method and device for allocating core resources of a multi-core cpu
CN106713273A (zh) * 2016-11-23 2017-05-24 中国空间技术研究院 一种基于字典树剪枝搜索的协议关键字识别方法
CN107748706A (zh) * 2017-10-27 2018-03-02 郑州云海信息技术有限公司 一种绑定方法及装置
US10560351B1 (en) * 2017-12-28 2020-02-11 Architecture Technology Corporation Network monitoring tool for supercomputers
US20200136898A1 (en) * 2018-10-24 2020-04-30 Cox Communications, Inc. Systems and Methods for Network Configuration Management
CN109739670A (zh) * 2019-02-01 2019-05-10 中国人民解放军国防科技大学 节点内进程通信方法、装置、计算机设备和存储介质
CN110191155A (zh) * 2019-05-07 2019-08-30 中国人民解放军国防科技大学 一种面向胖树互连网络的并行作业调度方法、系统及存储介质
CN112202599A (zh) * 2020-09-11 2021-01-08 北京科技大学 针对异构多核平台通信优化的拓扑感知映射方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
彭大芹;赖香武;刘艳林;: "基于SDN的胖树数据中心网络多路径路由算法", 计算机工程, no. 04, pages 47 - 51 *
许建亚;杨磊;张延师;张勋超;付芬;张雅玲;杨琼;: "MPI在蒙特卡罗程序GMT中的应用和发展", 原子核物理评论, no. 02, pages 78 - 84 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117135107A (zh) * 2023-10-25 2023-11-28 苏州元脑智能科技有限公司 一种网络通信拓扑系统、路由方法、设备及介质
CN117135107B (zh) * 2023-10-25 2024-02-13 苏州元脑智能科技有限公司 一种网络通信拓扑系统、路由方法、设备及介质

Also Published As

Publication number Publication date
CN114244708B (zh) 2023-08-08

Similar Documents

Publication Publication Date Title
US11853245B2 (en) Computing system framework and method for configuration thereof
CN108923979B (zh) 软件定义网络虚拟网络映射方法
WO2020019342A1 (zh) 服务器集群中的消息传递方法、装置及存储介质
CN102394809A (zh) 一种多线程边界网关协议并行处理方法
CN114244708A (zh) 一种胖树网络结构上的通信优化方法
CN111224883B (zh) 一种高阶路由器的瓦片结构及其构建的高阶路由器
CN111193971B (zh) 一种面向机器学习的分布式计算互连网络系统及通信方法
CN113488996A (zh) 一种基于分布式并行图计算框架的配电网原生图建模方法
CN102130810A (zh) 一种树形拓扑的同层域内互联结构的实现方法
Zhao et al. A survey of data center network topology structure
Li et al. Progressive forwarding disaster backup among cloud datacenters
CN115643008A (zh) 一种基于划分聚类的pbft算法
CN109522630A (zh) 一种基于对角加边形式的电力系统暂态稳定仿真并行计算方法
CN110719193B (zh) 一种面向高性能计算的高可靠泛树网络拓扑方法及结构
CN105119830A (zh) 基于装箱优化的负载均衡软件定义网络路由聚合方法
CN106789750A (zh) 一种高性能计算互连网络系统及通信方法
CN106506408A (zh) 一种96+6接口交换机的实现方法
CN109003222B (zh) 一种异步高能效图计算加速器
CN114221871A (zh) 一种网格化流水的全收集方法
CN107682369A (zh) 双网分离式高效可扩展云网络架构系统
Nie et al. AggTree: A Routing Tree With In-Network Aggregation for Distributed Training
Zhu et al. HyperDC: A Re-Arrangeable Non-Blocking Data Center Networks Topology
CN104717111A (zh) 一种扩展交换立方体的互联网络结构
Chen et al. Energy and delay-aware mapping for real-time digital processing system on network on chip platforms
Meng et al. Research on data lakehouse architecture for grid business data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant