CN118606253A - 数据传输方法、装置、设备及存储介质 - Google Patents

数据传输方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN118606253A
CN118606253A CN202410171460.4A CN202410171460A CN118606253A CN 118606253 A CN118606253 A CN 118606253A CN 202410171460 A CN202410171460 A CN 202410171460A CN 118606253 A CN118606253 A CN 118606253A
Authority
CN
China
Prior art keywords
processor
operation data
switch
server
communication cable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410171460.4A
Other languages
English (en)
Other versions
CN118606253B (zh
Inventor
李宝嘉
陈明卓
何春志
夏寅贲
李翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202410171460.4A priority Critical patent/CN118606253B/zh
Publication of CN118606253A publication Critical patent/CN118606253A/zh
Application granted granted Critical
Publication of CN118606253B publication Critical patent/CN118606253B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本申请公开了一种数据传输方法、装置、设备及存储介质,属于通信技术领域。该方法由第一处理器执行,第一处理器和第二处理器归属于同一服务器,第一处理器和第二处理器通过服务器内的总线连接,第一处理器和第二处理器通过通信线缆与交换机相连,该方法包括:基于服务器内的总线连接,第一处理器向第二处理器发送运算数据;在运算数据传输失败的情况下,基于通信线缆和交换机,第一处理器向第二处理器发送运算数据。通过在运算数据基于总线连接传输失败的情况下,基于交换机和第一处理器、第二处理器相连的通信线缆重传运算数据,避免了基于总线连接传输失败造成服务器内的处理器之间无法执行数据传输的问题,避免了处理器计算中断的风险。

Description

数据传输方法、装置、设备及存储介质
技术领域
本申请涉及通信技术领域,特别涉及一种数据传输方法、装置、设备及存储介质。
背景技术
随着互联网技术的发展,需要计算的数据量日益增加,存在使用多个处理器协同计算数据的需求。
在相关技术中,以图像处理器(Graphics Processing Unit,GPU)为例,归属于同一服务器的GPU之间通过高速互联通信信道传输数据,以实现GPU之间的信息传递,进而实现对数据的协同计算。
然而,在高速互联通信信道发生故障的情况下,GPU之间无法相互通信,会造成计算中断的风险。
发明内容
本申请提供了一种数据传输方法、装置、设备及存储介质,所述技术方案如下:
根据本申请的一方面,提供了一种数据传输方法,所述方法由第一处理器执行,所述第一处理器和第二处理器归属于同一服务器,所述第一处理器和所述第二处理器通过所述服务器内的总线连接,所述第一处理器和所述第二处理器通过通信线缆与交换机相连,所述方法包括:
基于所述服务器内的所述总线连接,所述第一处理器向所述第二处理器发送运算数据;
在所述运算数据传输失败的情况下,基于所述通信线缆和所述交换机,所述第一处理器向所述第二处理器发送所述运算数据。
根据本申请的另一方面,提供了一种数据传输方法,所述方法由服务器中的控制设备执行,第一处理器、第二处理器归属于所述服务器,所述第一处理器和所述第二处理器通过所述服务器内的总线连接,所述第一处理器和所述第二处理器通过通信线缆与交换机相连,所述方法包括:
控制所述第一处理器基于所述服务器内的所述总线连接,向所述第二处理器发送运算数据;
在所述运算数据传输失败的情况下,控制所述第一处理器基于所述通信线缆和所述交换机,向所述第二处理器发送运算数据。
根据本申请的另一方面,提供了一种数据传输方法,所述方法由第一处理器执行,所述第一处理器和第二处理器归属于同一服务器,所述第一处理器和所述第二处理器通过所述服务器内的总线连接,所述第一处理器和所述第二处理器通过通信线缆与交换机相连,所述方法包括:
基于所述通信线缆和所述交换机,所述第一处理器向所述第二处理器发送所述运算数据;
在所述运算数据传输失败的情况下,基于所述服务器内的所述总线连接,所述第一处理器向所述第二处理器发送运算数据。
根据本申请的另一方面,提供了一种数据传输方法,所述方法由服务器中的控制设备执行,第一处理器、第二处理器归属于所述服务器,所述第一处理器和所述第二处理器通过所述服务器内的总线连接,所述第一处理器和所述第二处理器通过通信线缆与交换机相连,所述方法包括:
控制所述第一处理器基于所述通信线缆和所述交换机,向所述第二处理器发送运算数据;
在所述运算数据传输失败的情况下,控制所述第一处理器基于所述服务器内的所述总线连接,向所述第二处理器发送运算数据。
根据本申请的另一方面,提供了一种数据传输装置,第一处理器和第二处理器归属于同一服务器,所述第一处理器和所述第二处理器通过所述服务器内的总线连接,所述第一处理器和所述第二处理器通过通信线缆与交换机相连,所述装置包括:
发送模块,用于基于所述服务器内的所述总线连接,所述第一处理器向所述第二处理器发送运算数据;
所述发送模块,还用于在所述运算数据传输失败的情况下,基于所述通信线缆和所述交换机,所述第一处理器向所述第二处理器发送所述运算数据。
在本申请的一个可选设计中,所述第一处理器、所述第二处理器分别与第一接入层交换机相连,所述第一接入层交换机用于直接连接多个处理器;所述发送模块还用于:
所述第一处理器经过第一路径,向所述第二处理器发送所述运算数据,所述第一路径以所述第一处理器为起点、所述第二处理器为终点,途径所述第一接入层交换机。
在本申请的一个可选设计中,所述第一处理器与第二接入层交换机相连,所述第二处理器与第三接入层交换机相连,第一汇聚层交换机与所述第二接入层交换机、所述第三接入层交换机分别相连;所述发送模块还用于:
所述第一处理器经过第二路径,向所述第二处理器发送所述运算数据,所述第二路径以所述第一处理器为起点、所述第二处理器为终点,依次经过所述第二接入层交换机、所述第一汇聚层交换机、所述第三接入层交换机。
在本申请的一个可选设计中,所述第一处理器与第四接入层交换机相连,所述第二处理器与第五接入层交换机相连,第二汇聚层交换机与所述第四接入层交换机相连,第三汇聚层交换机与所述第五接入层交换机相连,核心层交换机与所述第二汇聚层交换机、所述第三汇聚层交换机分别相连;所述发送模块还用于:
所述第一处理器经过第三路径,向所述第二处理器发送所述运算数据,所述第三路径以所述第一处理器为起点、所述第二处理器为终点,依次经过所述第四接入层交换机、所述第二汇聚层交换机、所述核心层交换机、所述第三汇聚层交换机、所述第五接入层交换机。
根据本申请的另一方面,提供了一种数据传输装置,第一处理器、第二处理器归属于同一服务器,所述第一处理器和所述第二处理器通过所述服务器内的总线连接,所述第一处理器和所述第二处理器通过通信线缆与交换机相连,所述装置包括:
控制模块,用于控制所述第一处理器基于所述服务器内的所述总线连接,向所述第二处理器发送运算数据;
所述控制模块,还用于在所述运算数据传输失败的情况下,控制所述第一处理器基于所述通信线缆和所述交换机,向所述第二处理器发送运算数据。
在本申请的一个可选设计中,所述控制模块还用于:
控制所述第一处理器基于所述服务器内的所述总线连接提供的互联信道,向所述第二处理器发送运算数据。
在本申请的一个可选设计中,所述控制模块还用于:
控制所述第一处理器基于所述通信线缆和所述交换机提供的网络信道,向所述第二处理器发送运算数据。
在本申请的一个可选设计中,所述控制模块还用于:
在所述运算数据传输失败的情况下,将所述第一处理器的数据传输状态设置为初始状态,以及修正数据指针指向所述运算数据之前的历史数据,所述历史数据是基于所述总线连接成功传输的数据。
根据本申请的另一方面,提供了一种数据传输装置,第一处理器和第二处理器归属于同一服务器,所述第一处理器和所述第二处理器通过所述服务器内的总线连接,所述第一处理器和所述第二处理器通过通信线缆与交换机相连,所述装置包括:
发送模块,用于基于所述通信线缆和所述交换机,所述第一处理器向所述第二处理器发送所述运算数据;
所述发送模块,还用于在所述运算数据传输失败的情况下,基于所述服务器内的所述总线连接,所述第一处理器向所述第二处理器发送运算数据。
根据本申请的另一方面,提供了一种数据传输装置,第一处理器、第二处理器归属于同一服务器,所述第一处理器和所述第二处理器通过所述服务器内的总线连接,所述第一处理器和所述第二处理器通过通信线缆与交换机相连,所述装置包括:
控制模块,用于控制所述第一处理器基于所述通信线缆和所述交换机,向所述第二处理器发送运算数据;
所述控制模块,还用于在所述运算数据传输失败的情况下,控制所述第一处理器基于所述服务器内的所述总线连接,向所述第二处理器发送运算数据。
根据本申请的另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上方面所述的数据传输方法。
根据本申请的另一方面,提供了一种计算机可读存储介质,所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上方面所述的数据传输方法。
根据本申请的另一方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机指令,所述计算机指令存储在计算机可读存储介质中,处理器从所述计算机可读存储介质读取并执行所述计算机指令,以实现上述如上方面所述的数据传输方法。
本申请提供的技术方案带来的有益效果至少包括:
在运算数据基于总线连接传输失败的情况下,基于交换机和第一处理器、第二处理器相连的通信线缆重传运算数据,实现归属于同一服务器的两个处理器之间的数据传输,充分利用处理器与交换机连接的通信线缆的带宽资源;避免了基于总线连接传输失败造成服务器内的处理器之间无法执行数据传输的问题,避免了处理器计算中断的风险。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个示例性实施例提供的计算机系统的示意图;
图2是本申请一个示例性实施例提供的处理器连接关系的示意图;
图3是本申请一个示例性实施例提供的信息传输方法的示意图;
图4是本申请一个示例性实施例提供的信息传输方法的流程图;
图5是本申请一个示例性实施例提供的信息传输方法的流程图;
图6是本申请一个示例性实施例提供的信息传输方法的流程图;
图7是本申请一个示例性实施例提供的信息传输方法的流程图;
图8是本申请一个示例性实施例提供的交换机和服务器之间连接关系的示意图;
图9是本申请一个示例性实施例提供的网络信道和互联信道的示意图;
图10是本申请一个示例性实施例提供的处理器单机性能的示意图;
图11是本申请一个示例性实施例提供的处理器单机性能的示意图;
图12是本申请一个示例性实施例提供的信息传输方法的流程图;
图13是本申请一个示例性实施例提供的信息传输方法的流程图;
图14是本申请一个示例性实施例提供的数据传输装置的结构框图;
图15是本申请一个示例性实施例提供的数据传输装置的结构框图;
图16是本申请一个示例性实施例提供的服务器的结构框图。
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如,本申请中涉及到的处理器的总线标识等信息都是在充分授权的情况下获取的。
应当理解,尽管在本公开可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一参数也可以被称为第二参数,类似地,第二参数也可以被称为第一参数。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
图1示出了本申请一个实施例提供的计算机系统的示意图。该计算机系统可以实现成为数据传输方法的系统架构。
服务器10以处理器作为计算核心,具有数据处理能力。本实施例以服务器10包括四个处理器(第一处理器11、第二处理器12、第三处理器13、第四处理器14)为例进行说明,但不排除处理器包括更多或更少数量的处理器;可选的,一个服务器10包括的处理器数量是2的正整数次方。示例性的,服务器10中还包括有控制设备,通过信令控制服务器内的处理器执行数据传输、数据运算、数据存储中的至少之一。
本实施例以处理器是图像处理器(Graphics Processing Unit,GPU)为例进行介绍,但并不排除在其他示例中,处理器实现为主处理器和/或其他协处理器的情况。
示例性的,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器(Central Processing Unit,CPU);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器如上介绍,实现为图像处理器(GraphicsProcessing Unit,GPU);示例性的,GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器还可以包括人工智能(Artificial Intelligence,AI)处理器,该AI处理器用于处理有关机器学习的计算操作。
示例性的,服务器10包括的多个处理器安装在卡槽上,由卡槽提供服务器10内的多个处理器之间的硬件连接,以实现在服务器10内实现多个处理器之间的互联通信。在一个示例中,同一服务器10的GPU之间通过总线连接实现互联通信。进一步的,基于高速互联通信信道(比如Nvlink信道)传输数据。
服务器10包括的每个处理器均连接有至少一个交换机20;交换机20用于连接多个处理器,以实现对连接的多个处理器实现数据的交换转发;示例性的,交换机20基于以太网对以太网帧承载的数据执行交换转发。
在一些实施例中,交换机包括接入层交换机(Access Layer,LA)、汇聚层交换机(Layer Convergence,LC)、核心层交换机(Switched Gigabit Linecard,SGLC);其中,每一个LA可以连接一个或多个处理器,每一个LA可以接入一个或多个LC;核心层交换机用于连接多个LC;本申请对此不作限定。
示例性的,服务器10包括的每个处理器存在共同相连的一个交换机,示例性的,处理器可以和共同相连的交换机直接相连,也可以经过其他交换机与上述共同相连的交换机间接相连。
在一些实施例中,处理器之间基于环状结构(Ring-based)的方式进行通信,通信具体是指处理器之间进行数据(流量)传输。处理器之间的数据传输路径首尾连接形成一个环,该环也称为通信流量环。示例性的,对于环状结构上的任意一个处理器,存在有一个左邻处理器和一个右邻处理器;上述处理器从左邻处理器接收数据,向右邻处理器发送数据。
如图2所示,以四个处理器(第一处理器11、第二处理器12、第三处理器13、第四处理器14)之间基于环状结构的方式进行通信为例,上述四个处理器基于Ring-based方式进行通信,在流量交互上会首尾连接形成一个环。如对于处理器11,从其左邻处理器,即处理器14接收数据;向其右邻处理器,即处理器12发送数据。示例性的,在图2中每个处理器的存储空间被划分为四个数据块(chunk);对处理器划分chunk可以增加通信的并行性。每个处理器处理对应的数据块,不同的处理器可以实现并行地执行通信操作,从而提高整体的吞吐量。
图3示出了本申请一个实施例提供的信息传输方法的示意图。
在本实施例中,以服务器10包括四个GPU(GPU0、GPU1、GPU2、GPU3)为例进行说明。可以理解的,在不同示例中,服务器10中可以包括有更多或更少数量个GPU。
上述四个GPU均连接有接入层交换机;具体的,LA0通过通信线缆与GPU0、GPU1相连、LA1通过通信线缆与GPU1相连、LA2通过通信线缆与GPU2、GPU3相连、LA3通过通信线缆与GPU3相连。
上述四个接入层交换机均连接有汇聚层交换机;具体的,LC0通过通信线缆与LA0相连、LC1通过通信线缆与LA1相连、LC2通过通信线缆与LA2相连、LC3通过通信线缆与LA3相连。上述四个汇聚层交换机均通过通信线缆与核心层交换机相连。
基于服务器10内的总线连接,GPU0向GPU1发送运算数据;示例性的,总线连接提供有互联信道,互联信道可以具体实现为一种高速互联通信信道(比如Nvlink信道),以实现在GPU0与GPU1之间传输运算数据。
在运算数据传输失败的情况下,基于通信线缆和交换机,GPU0向GPU1重新发送运算数据;示例性的,通信线缆和交换机提供有网络信道。进一步的,交换机和通信线缆基于以太网实现网络信道的通信。
综上所述,即使出现运算数据传输失败的情况,基于通信线缆和交换机能够保证对运算数据的再次传输,保证运算数据传输的稳定性。充分利用处理器与交换机连接的通信线缆的带宽资源;避免了基于总线连接传输失败造成服务器内的处理器之间无法执行数据传输的问题,避免了处理器计算中断的风险。
图4示出了本申请一个示例性实施例提供的信息传输方法的流程图。该方法可以由第一处理器执行。该方法包括:
步骤510:基于服务器内的总线连接,第一处理器向第二处理器发送运算数据;
第一处理器、第二处理器归属于同一服务器。在一个示例中,服务器提供有归属于服务器的各个处理器的卡槽,或集成在服务器内的主板上。第一处理器和第二处理器通过服务器内的总线连接。
示例性的,运算数据的传输可以是独享总线连接的带宽,也可以在总线连接内以并行方式传输数据,共享总线连接的带宽。
如上介绍,本申请中的处理器可以实现为不同类型,对应于不同功能的处理器,以下的各个实施例中,以处理器实现为GPU为例进行举例,但不排除实现为其他类型的处理器的情况。
示例性的,运算数据是第一处理器、第二处理器协同执行数据处理的过程中需要计算的运算数据,比如服务器用于执行人工智能神经网络的训练,运算数据是第一GPU的计算结果数据,第一GPU向第二GPU发送运算数据,第二GPU将运算数据作为上述训练过程中的输入参数,以实现服务器中的第一GPU、第二GPU协同执行人工智能神经网络的训练。
步骤520:在运算数据传输失败的情况下,基于通信线缆和交换机,第一处理器向第二处理器发送运算数据;
第一处理器和第二处理器通过通信线缆与交换机相连,交换机用于提供数据的转发,向连接的处理器转发携带有数据的报文或数据包。
和上文中的总线连接的传输方式相似的,运算数据的传输可以独享通信线缆的带宽,也可以在通信线缆内以并行方式传输数据,共享通信线缆的带宽。
示例性的,运算数据传输失败是在上述总线连接的方式下传输失败的;示例性的,运算数据可以是在初次传输过程中传输失败的;也可以是重传数据传输失败的,比如运算数据基于总线连接的传输失败次数超过预设门限,比如三次。
在一个示例中,运算数据传输失败的情况包括如下至少之一:第一处理器在预设时间内未收到运算数据的确认反馈、第一处理器无法确定第二处理器的数据接收地址、第一处理器收到针对运算数据的重传请求。
示例性的,运算数据传输失败的原因可以是总线连接中断,运算数据无法传输,也可以是运算数据传输过程中受到噪声影响,第二处理器无法获取完整的运算数据。本申请对运算数据传输失败的原因不进行限制。
综上所述,本实施例提供的方法,在运算数据基于总线连接传输失败的情况下,基于交换机和第一处理器、第二处理器相连的通信线缆重传运算数据,实现归属于同一服务器的两个处理器之间的数据传输,充分利用处理器与交换机连接的通信线缆的带宽资源;避免了基于总线连接传输失败造成服务器内的处理器之间无法执行数据传输的问题,避免了处理器计算中断的风险。
接下来,对第一处理器和第二处理器通过通信线缆与交换机相连的方式进行进一步介绍。
在一种实现方式中,第一处理器、第二处理器分别与第一接入层交换机相连,第一接入层交换机用于直接连接多个处理器。可以理解的,第一接入层交换机通常连接有更多数量的处理器。第一接入层交换机连接的处理器可以仅包括第一处理器、第二处理器所属的服务器内的其他处理器,也可以包括归属于不同服务器的其他处理器。
相应的,运算数据的传输方式可以具体实现为:
第一处理器经过第一路径,向第二处理器发送运算数据,第一路径以第一处理器、第二处理器为起点和终点,途径第一接入层交换机。
进一步的,第一处理器发送第一报文,第一报文经过第一接入层交换机转发至第二处理器;
示例性的,第一报文的发送端地址是第一处理器的地址,目的地址是第二处理器的地址,第一报文携带有运算数据。
参考图3,在一个例子中,运算数据是GPU1向GPU0发送的,具体的,GPU1经过如下路径向GPU0发送运算数据:以GPU1为起点,途径LA1,以GPU0为终点。
综上所述,本实施例提供的方法,在运算数据基于总线连接传输失败的情况下,基于交换机和第一处理器、第二处理器相连的通信线缆重传运算数据,实现归属于同一服务器的两个处理器之间的数据传输;在服务器内的总线连接之外,为共同连接有第一接入层交换机的两个处理器,拓展了新的数据传输方式;避免了基于总线连接传输失败造成服务器内的处理器之间无法执行数据传输的问题,避免了处理器计算中断的风险。
在另一种实现方式中,第一处理器与第二接入层交换机相连,第二处理器与第三接入层交换机相连,第一汇聚层交换机与第二接入层交换机、第三接入层交换机分别相连。可以理解的,第二接入层交换机、第三接入层交换机和上文中的第一接入层交换机相似的,通常连接有更多数量的处理器。第一汇聚层交换机通常连接有更多数量的接入层交换机。示例性的,接入层交换机可以与一个或多个汇聚层交换机相连。
相应的,运算数据的传输方式可以具体实现为:
第一处理器经过第二路径,向第二处理器发送运算数据,第二路径以第一处理器为起点、第二处理器为终点,依次经过第二接入层交换机、第一汇聚层交换机、第三接入层交换机。
进一步的,第一处理器发送第二报文,第二报文依次经过第二接入层交换机、第一汇聚层交换机、第三接入层交换机,逐个转发至第二处理器;
示例性的,第二报文的发送端地址是第一处理器的地址,目的地址是第二处理器的地址,第二报文携带有运算数据。
参考图3,在一个例子中,运算数据是GPU2向GPU1发送的,具体的,GPU2经过如下路径向GPU1发送运算数据:以GPU2为起点,依次途径LA2、LC1、LA1,以GPU1为终点。
综上所述,本实施例提供的方法,在运算数据基于总线连接传输失败的情况下,基于交换机和第一处理器、第二处理器相连的通信线缆重传运算数据,实现归属于同一服务器的两个处理器之间的数据传输;在服务器内的总线连接之外,为共同连接有第一汇聚层交换机的两个处理器,拓展了新的数据传输方式;避免了基于总线连接传输失败造成服务器内的处理器之间无法执行数据传输的问题,避免了处理器计算中断的风险。
在又一种实现方式中,第一处理器与第四接入层交换机相连,第二处理器与第五接入层交换机相连,第二汇聚层交换机与第四接入层交换机相连,第三汇聚层交换机与第五接入层交换机相连,核心层交换机与第二汇聚层交换机、第三汇聚层交换机分别相连;可以理解的,第四接入层交换机、第五接入层交换机和上文中的第一接入层交换机相似的,通常连接有更多数量的处理器。第二汇聚层交换机、第三汇聚层交换机通常连接有更多数量的接入层交换机。示例性的,接入层交换机可以与一个或多个汇聚层交换机相连。
相应的,运算数据的传输方式可以具体实现为:
第一处理器经过第三路径,向第二处理器发送运算数据,第三路径以第一处理器为起点、第二处理器为终点,依次经过第四接入层交换机、第二汇聚层交换机、核心层交换机、第三汇聚层交换机、第五接入层交换机。
进一步的,第一处理器发送第三报文,第三报文依次经过第四接入层交换机、第二汇聚层交换机、核心层交换机、第三汇聚层交换机、第五接入层交换机,逐个转发至第二处理器;
示例性的,第三报文的发送端地址是第一处理器的地址,目的地址是第二处理器的地址,第三报文携带有运算数据。
参考图3,在一个例子中,运算数据是GPU3向GPU2发送的,具体的,GPU3经过如下路径向GPU2发送运算数据:以GPU3为起点,依次途径LA3、LC3、SGLC、LC2、LA2,以GPU2为终点。
综上所述,本实施例提供的方法,在运算数据基于总线连接传输失败的情况下,基于交换机和第一处理器、第二处理器相连的通信线缆重传运算数据,实现归属于同一服务器的两个处理器之间的数据传输;在服务器内的总线连接之外,为共同连接有核心层交换机的两个处理器,拓展了新的数据传输方式;避免了基于总线连接传输失败造成服务器内的处理器之间无法执行数据传输的问题,避免了处理器计算中断的风险。
图5示出了本申请一个示例性实施例提供的信息传输方法的流程图。该方法可以由第一处理器执行。即在图4示出的实施例中,步骤510可以实现为步骤512,步骤520可以实现为步骤522:
步骤512:基于总线连接提供的互联信道,第一处理器向第二处理器发送运算数据;
互联信道用于在服务器内提供至少两个处理器之间的数据传输通路。进一步的,服务器内还包括更多数量的处理器,互联信道还用于提供服务器内的任意两个服务器之间的数据传输通路。
在一个示例中,互联信道提供数据传输通路可以是如图2介绍的基于环状结构(Ring-based)的方式进行通信的数据传输通路;若第二处理器是第一处理器的右邻处理器,则在第一处理器与第二处理器之间直接传输运算数据。若第二处理器是第一处理器的左邻处理器,则第一处理器发送的运算数据,由经过服务器内的至少一个处理器转发至第二处理器。
在一个示例中,第一处理器、第二处理器是图像处理器,互联信道是图像处理器对应的高速互联通信信道(比如Nvlink信道);进一步的,不同厂商的图像处理器的高速互联通信信道对应有不同名称,均是用于为同一服务器内的图像处理器之间提供数据传输的数据传输通路。
步骤522:在运算数据传输失败的情况下,基于通信线缆和交换机提供的网络信道,第一处理器向第二处理器发送运算数据;
网络信道用于提供通信线缆连接的两个处理器之间的数据传输通路。进一步的,归属于同一服务器的任意两个处理之间存在共同连接的交换机,该共同连接的交换机是处理器直连的接入层交换机,或通过接入层交换机间接连接的汇聚层交换机或核心层交换机。
在一个可选示例中,服务器中还包括第三处理器,第一处理器、第二处理器和第三处理器中的任意两个处理器之间,均通信线缆和交换机提供的网络信道,能够实现在任意两个处理器之间传输数据。
在一种可选实现方式中,网络信道是基于环状结构的信道;以第一处理器向第二处理器发送运算数据为例,若第二处理器是第一处理器的右邻处理器,则在第一处理器与第二处理器之间直接传输运算数据。若第二处理器是第一处理器的左邻处理器,则第一处理器发送的运算数据,由经过服务器内的至少一个处理器和至少一个交换机转发至第二处理器。示例性的,在基于环状结构的网络信道中,每个处理器仅需要处理对应的数据,不同的处理器可以同时发送或接收数据,并行传输数据,以实现共享通信线缆和交换机的带宽。
需要说明的是,本实施例仅介绍了步骤512、步骤522同时执行的情况,但并不排除上述两个步骤单独执行,比如步骤512和上文中的步骤520组合、或步骤522和上文中的步骤510组合,形成新的实施例单独实施的情况,本申请对此不进行限制。
综上所述,本实施例提供的方法,在运算数据基于总线连接传输失败的情况下,基于交换机和第一处理器、第二处理器相连的通信线缆提供的网络信道,重传运算数据,实现归属于同一服务器的两个处理器之间的数据传输,充分利用处理器与交换机连接的通信线缆的带宽资源;避免了基于总线连接提供的互联信道传输失败,造成服务器内的处理器之间无法执行数据传输的问题,避免了处理器计算中断的风险。
图6示出了本申请一个示例性实施例提供的信息传输方法的流程图。该方法可以由第一处理器执行。即在图5示出的实施例的基础上,还包括步骤515、步骤525、步骤526,步骤522可以实现为步骤520a:
步骤515:获取通信线缆对应的第一信道资源带宽、总线连接提供的串行信道对应的第二信道资源带宽;
示例性的,第一信道资源带宽是通信线缆和交换机对应的网络信道资源带宽。第二信道资源带宽是总线连接对应的串行信道的带宽。
在一个示例中,以服务器中的处理器是图像处理器为例,本实施例中的互联信道是图像处理器对应的高速互联通信信道(比如Nvlink信道);而在高速互联通信信道无法成功传输计算数据的情况下,由总线连接提供的串行信道或通信线缆提供的网络信道,对运算数据执行重传,保证服务器内的图像处理器能够实现数据传输,进而实现协同执行数据处理的过程。
进一步的,为了保证运算数据的传输效率,获取上述第一信道资源带宽、第二信道资源带宽,以实现采用更高传输速率的方式重传运算数据。
步骤520a:在第一信道资源带宽超过第二信道资源带宽,且运算数据传输失败的情况下,基于通信线缆和交换机提供的网络信道,第一处理器向第二处理器发送运算数据;
在第一信道资源带宽超过第二信道资源带宽的情况下,基于通信线缆和交换机提供的网络信道能够实现以更大传输速率传输运算数据。在总线连接无法实现运算数据的成功传输的情况下,拓展了新的数据传输方式,避免了服务器内的处理器之间无法执行数据传输的问题。同时考虑了网络信道和串行信道的传输速率的区别,基于更大传输速率网络信道,以提高数据传输速率。
在一个可选实现方式中,在基于通信线缆和交换机,第一处理器向第二处理器发送运算数据之前,需要确定第一处理器和第二处理器之间是否直达。
在一个示例中,在第一处理器和第二处理器和所述第三处理器之间直达,且运算数据传输失败的情况下,基于通信线缆和交换机提供的网络信道,第一处理器向第二处理器发送运算数据。
示例性的,在第一处理器和第二处理器之间直达的情况下,上述两个处理器归属于同一服务器,且处理器之间采用张量并行(Tensor Parallelism,TP)策略进行分布式计算,以实现并行执行数据处理。避免了数据并行(Data Parallelism,DP)、流水线并行(Pipeline Parallelism,PP)策略下,无需调用互联信道传输数据的情况。
进一步的,可以实现为:在第一处理器和第二处理器中的任意一个处理器,以不需要经过中间设备的方式获取到其他处理器的总线标识,且运算数据传输失败的情况下,基于通信线缆和交换机提供的网络信道,第一处理器向第二处理器发送运算数据。
示例性的,总线标识(Bus ID)是处理器在服务器内的全局标识。以不需要经过中间设备的方式获取到其他处理器的总线标识,也称为Bus ID的直接可达;相应的,处理器之间直接通过总线进行通信,无需通过额外的设备或接口进行中转。示例性的,总线标识是通过调用计算统一设备架构(Compute Unified Device Architecture,CUDA)驱动函数得到的。
步骤525:在第二信道资源带宽超过第一信道资源带宽,且运算数据传输失败的情况下,基于总线连接提供的串行信道,第一处理器向第二处理器发送运算数据;
在第二信道资源带宽超过第一信道资源带宽的情况下,基于总线连接提供的串行信道能够实现以更大传输速率传输运算数据。在总线连接无法实现运算数据的成功传输的情况下,拓展了新的数据传输方式。
步骤526:在运算数据基于通信线缆传输失败的情况下,基于总线连接提供的串行信道,第一处理器向第二处理器发送运算数据;
示例性的,运算数据基于通信线缆传输失败的情况用于指示本实施例中的步骤520a中的运算数据传输失败的情况。基于总线连接提供的串行信道,在网络信道、互联信道均传输失败的情况下,提供了再次重传运算数据的实现方式。
在一个具体的示例中,服务器内的第一处理器、第二处理器是图像处理器。互联信道可以具体实现为一种高速互联通信信道(比如Nvlink信道),以实现在服务器内的两个图像处理器之间传输运算数据。串行信道可以具体实现为外围部件互连快速通道(Peripheral Component Interconnect Express,PCIE)。网络信道可以具体实现为基于以太网提供的有线数据传输信道。
需要说明的是,本实施例仅介绍了上述四个步骤均执行的情况,但并不排除上述步骤单独执行,比如步骤515、步骤520a和图4中的步骤510组合;或步骤515、步骤525和图4中的步骤510组合,形成新的实施例单独实施的情况,本申请对此不进行限制。
综上所述,本实施例提供的方法,在运算数据基于总线连接提供的互联信道传输失败的情况下,利用处理器与交换机连接的通信线缆的带宽资源、或总线连接提供的串行信道重传运算数据;避免了基于总线连接传输失败造成服务器内的处理器之间无法执行数据传输的问题,在重传过程中保证了数据传输速率,避免了处理器计算中断的风险。
图7示出了本申请一个示例性实施例提供的信息传输方法的流程图。该方法可以由控制设备执行。该方法包括:
步骤550:控制第一处理器基于服务器内的总线连接,向第二处理器发送运算数据;
第一处理器和第二处理器归属于同一服务器。第一处理器和第二处理器通过服务器内的总线连接。
示例性的,控制设备通常基于控制信令向第一处理器和/或第二处理器指示传输运算数据。其中,控制信令可以用于指示第一处理器发送运算数据,也可以用于指示第二处理器接收运算数据。示例性的,控制信令可以是基于总线连接(比如总线连接提供的PCIE通道)向第一处理器和/或第二处理器发送的,也不排除是通过共享内存等方式传递的。
在一种可选实现方式中,本步骤可以实现为:控制第一处理器基于服务器内的总线连接提供的互联信道,向第二处理器发送运算数据。
互联信道用于在服务器内提供至少两个处理器之间的数据传输通路。进一步的,互联信道还用于提供服务器内的任意两个服务器之间的数据传输通路。
控制设备通过向第一处理器和/或第二处理器发送调用互联信道的指示信令,以实现控制传输运算数据。
步骤555:在运算数据传输失败的情况下,将第一处理器的数据传输状态设置为初始状态,以及修正数据指针指向运算数据之前的历史数据;
示例性的,初始状态是对运算数据的预备发送状态,以实现控制第一处理器不再以总线连接方式传输运算数据,而通过通信线缆和交换机的方式预备发送运算数据。比如将排队等候(Queue Pair)状态重置。
示例性的,历史数据是基于总线连接成功传输的数据。在控制第一处理器再次发送数据时,发送的数据是数据指针当前指向的数据的下一个数据。
示例性的,运算数据传输失败是在上述总线连接的方式下传输失败的;示例性的,运算数据可以是在初次传输过程中传输失败的;也可以是重传数据传输失败的,比如运算数据基于总线连接的传输失败次数超过预设门限,比如三次。
步骤560:在运算数据传输失败的情况下,控制第一处理器基于通信线缆和交换机,向第二处理器发送运算数据;
第一处理器和第二处理器通过通信线缆与交换机相连,交换机用于提供数据的转发,向连接的处理器转发携带有数据的报文或数据包。
与上文中运算数据的基于总线连接的传输方式相似的,控制设备通常基于控制信令向第一处理器和/或第二处理器指示传输运算数据。其中,控制信令可以用于指示第一处理器发送运算数据,也可以用于指示第二处理器接收运算数据。
在一种可选实现方式中,本步骤可以实现为:在运算数据传输失败的情况下,控制第一处理器基于通信线缆和交换机提供的网络信道,向第二处理器发送运算数据。
网络信道用于提供通信线缆连接的两个处理器之间的数据传输通路。进一步的,归属于同一服务器的任意两个处理之间存在共同连接的交换机。服务器内的任意两个服务器之间均存在有通过通信线缆和交换机提供的网络信道。
在总线连接无法实现运算数据的成功传输的情况下,拓展了基于通信线缆和交换机的数据传输方式,避免了服务器内的处理器之间无法执行数据传输的问题,避免了处理器计算中断的风险。
示例性的,关于数据传输失败、第一处理器和第二处理器通过通信线缆与交换机的连接方式的介绍,可以参考上文中的图3至图6,在这里不再一一重复。
需要说明的是,本实施例中的步骤550、步骤560可以组合成为新的实施例单独实施,本申请对此不进行限制。
综上所述,本实施例提供的方法,在运算数据基于总线连接传输失败的情况下,基于交换机和第一处理器、第二处理器相连的通信线缆重传运算数据,实现归属于同一服务器的两个处理器之间的数据传输,充分利用处理器与交换机连接的通信线缆的带宽资源;避免了基于总线连接传输失败造成服务器内的处理器之间无法执行数据传输的问题,避免了处理器计算中断的风险。
图8示出了本申请一个示例性实施例提供的交换机和服务器之间连接关系的示意图。
在本实施例中,以服务器10包括八个GPU(GPU0至GPU7)为例进行说明。上述八个GPU均连接有接入层交换机,共计八个接入层交换机;每个GPU连接有序号相同的接入层交换机,比如:LA0通过通信线缆与GPU1相连;和图3相似的,服务器10包括的八个GPU存在一一对应的NIC。
需要说明的是,LA0通过通信线缆还与GPU1相连、LA2通过通信线缆还与GPU3相连、LA4通过通信线缆还与GPU5相连、LA6通过通信线缆还与GPU7相连。
示例性的,上述八个接入层交换机连接有汇聚层交换机,共计八个汇聚层交换机;每个接入层交换机连接有序号相同的汇聚层交换机,比如:LC0通过通信线缆与LA0相连。示例性的,上述八个汇聚层交换机均与核心层交换机连接。
在本实施例中,候选网络信道是基于环状结构的信道。
具体的:GPU0通过LA0和GPU1进行通信。
GPU1通过LA1、LC1、SGLC、LC2、LA2和GPU2进行通信。
GPU2通过LA2和GPU3进行通信。
GPU3通过LA3、LC3、SGLC、LC4、LA4和GPU4进行通信。
GPU4通过LA4和GPU5进行通信。
GPU5通过LA5、LC5、SGLC、LC6、LA6和GPU6进行通信。
GPU6通过LA6和GPU7进行通信。
GPU7通过LA7、LC7、SGLC、LC0、LA0和GPU0进行通信。
图9示出了本申请一个示例性实施例提供的网络信道和互联信道的示意图。
其中,第一互联信道601、第二互联信道602至第N互联信道603,是总线连接提供的互联信道;如上文的介绍,互联信道是基于环状结构的信道。在上文的示例中,互联信道的数量为16,即N的取值为16。每个互联信道上用于传输一个数据块,比如基于第一互联信道601传输第一数据块611。需要说明的是,图中示出了第一数据块611经过GPU0至GPU7中的全部处理器,但在一些示例中,第一数据块能够经过更少数量的GPU,比如仅在GPU0和GPU1之间传输第一数据块611。示例性的,不同互联信道上传输的数据块不同,能够实现多个数据块的并行传输,互不干扰。
示例性的,在互联信道的数据块传输失败的情况下,转而基于网络信道传输数据块。具体的,第一网络信道621、第二网络信道622至第N网络信道623,是通信线缆和交换机提供的网络信道;如上文的介绍,网络信道是基于环状结构的信道。在本实施例中,网络信道的数量和互联信道的数量相同,即N的取值为16。每个网络信道上用于传输一个数据块,比如基于第一网络信道611传输第一数据块611。示例性的,不同网络信道上传输的数据块不同。示例性的,不同网络信道上传输的数据块不同,能够实现多个数据块的并行传输,互不干扰。
需要说明的是,上文中介绍了网络信道的数量和互联信道的数量相同的实施例。在另一种可选实现方式中,在网络信道的信道资源带宽小于互联信道的信道资源带宽的情况下,为了保证单个数据的传输速率,网络信道的数量小于互联信道的数量,相较于互联信道,降低了网络信道支持的并行传输数据的数量,以保证从单个网络信道的数据传输速率上,网络信道和互联信道相同。
图10示出了本申请一个示例性实施例提供的处理器单机性能的示意图。用于指示处理器采用全归约操作(All Reduce Operation,AllReduce)执行分布式计算时的数据传输速率。发生Nvlink信道故障时,采用网络信道传输运算数据,实现了在不中断通信的同时,保持47GB/s的传输带宽。
图11示出了本申请一个示例性实施例提供的处理器单机性能的示意图。用于指示处理器采用所有参与者之间进行数据交换(比如AlltoAll)执行分布式计算时的数据传输速率。发生Nvlink信道故障时,采用网络信道传输运算数据,实现了在不中断通信的同时,保持28GB/s的传输带宽。
图12示出了本申请一个示例性实施例提供的信息传输方法的流程图。该方法可以由第一处理器执行。该方法包括:
步骤650:基于通信线缆和交换机,第一处理器向第二处理器发送运算数据;
第一处理器、第二处理器归属于同一服务器。在一个示例中,服务器提供有归属于服务器的各个处理器的卡槽,或集成在服务器内的主板上。第一处理器和第二处理器通过通信线缆与交换机相连,交换机用于提供数据的转发,向连接的处理器转发携带有数据的报文或数据包。
运算数据的传输可以独享通信线缆的带宽,也可以在通信线缆内以并行方式传输数据,共享通信线缆的带宽。
关于第一处理器、第二处理器通过通信线缆与交换机连接的具体方式,请参考上文中图3对应的实施例,以及针对第一接入层交换机、第一汇聚层交换机、核心层交换机的介绍,在这里不再一一重复。
步骤660:在运算数据传输失败的情况下,基于服务器内的总线连接,第一处理器向第二处理器发送运算数据;
第一处理器和第二处理器通过服务器内的总线连接。
和上文中的通信线缆和交换机的传输方式相似的,运算数据的传输可以是独享总线连接的带宽,也可以在总线连接内以并行方式传输数据,共享总线连接的带宽。
示例性的,运算数据传输失败是在上述通信线缆和交换机的方式下传输失败的;示例性的,运算数据可以是在初次传输过程中传输失败的;也可以是重传数据传输失败的,比如运算数据基于总线连接的传输失败次数超过预设门限,比如三次。
本实施例中,关于通信线缆、交换机、总线连接、传输失败的介绍的未尽事宜,请参考上文中图4对应的实施例。关于通信线缆和交换机提供的网络信道、总线连接提供的互联信道的介绍,请参考上文中图5对应的实施例,在这里不再一一赘述。
在一种可选实现方式中,在步骤660之前还包括:
获取总线连接提供的互联信道对应的第一信道资源带宽、总线连接提供的串行信道对应的第二信道资源带宽;
相应的,步骤660实现为:在第一信道资源带宽超过第二信道资源带宽,且运算数据传输失败的情况下,基于服务器内的总线连接提供的互联信道,第一处理器向第二处理器发送运算数据;
在一个示例中,以服务器中的处理器是图像处理器为例,本实施例中的通信线缆和交换机提供有网络信道,在网络信道无法成功传输计算数据的情况下,由总线连接提供的串行信道或互联信道,对运算数据执行重传,保证服务器内的图像处理器能够实现数据传输,进而实现协同执行数据处理的过程。
进一步的,为了保证运算数据的传输效率,获取上述第一信道资源带宽、第二信道资源带宽,以实现采用更高传输速率的方式重传运算数据。
可以看出,在第一信道资源带宽超过第二信道资源带宽的情况下,基于总线连接提供的互联信道能够实现以更大传输速率传输运算数据。在通信线缆和交换机提供的网络信道无法实现运算数据的成功传输的情况下,拓展了新的数据传输方式,避免了服务器内的处理器之间无法执行数据传输的问题。同时考虑了互联信道和串行信道的传输速率的区别,基于更大传输速率网络信道,以提高数据传输速率。
进一步的,还包括:在第二信道资源带宽超过第一信道资源带宽,且运算数据传输失败的情况下,基于服务器内的总线连接提供的串行信道,第一处理器向第二处理器发送运算数据;即是在第二信道资源带宽超过第一信道资源带宽的情况下,基于总线连接提供的串行信道能够实现以更大传输速率传输运算数据。
示例性的,关于网络信道、互联信道、串行信道的具体试实现方式,可以参考上文中的步骤526中的介绍。
在一个可选实现方式中,在基于服务器内的总线连接,第一处理器向第二处理器发送运算数据之前,需要确定第一处理器和第二处理器之间是否直达。关于第一处理器、第二处理器是否直达的介绍,请参考上文中的步骤520a中的介绍,在这里不再一一重复。
综上所述,本实施例提供的方法,在运算数据基于通信线缆传输失败的情况下,基于服务器内提供的第一处理器、第二处理器之间的总线连接重传运算数据,实现归属于同一服务器的两个处理器之间的数据传输,充分利用总线连接的带宽资源;避免了基于通信线缆和交换机传输失败造成服务器内的处理器之间无法执行数据传输的问题,避免了处理器计算中断的风险。
图13示出了本申请一个示例性实施例提供的信息传输方法的流程图。该方法可以由控制设备执行。该方法包括:
步骤670:控制第一处理器基于通信线缆和交换机,向第二处理器发送运算数据;
第一处理器和第二处理器归属于同一服务器。第一处理器和第二处理器通过通信线缆与交换机相连,交换机用于提供数据的转发,向连接的处理器转发携带有数据的报文或数据包。
示例性的,控制设备通常基于控制信令向第一处理器和/或第二处理器指示传输运算数据。其中,控制信令可以用于指示第一处理器发送运算数据,也可以用于指示第二处理器接收运算数据。示例性的,控制信令可以是基于总线连接(比如总线连接提供的PCIE通道)向第一处理器和/或第二处理器发送的,也不排除是通过共享内存等方式传递的。
在一种可选实现方式中,本步骤可以实现为:控制第一处理器基于通信线缆和交换机提供的网络信道,向第二处理器发送运算数据。
网络信道用于提供通信线缆连接的两个处理器之间的数据传输通路。进一步的,归属于同一服务器的任意两个处理之间存在共同连接的交换机。服务器内的任意两个服务器之间均存在有通过通信线缆和交换机提供的网络信道。
步骤680:在运算数据传输失败的情况下,控制第一处理器基于服务器内的总线连接,向第二处理器发送运算数据;
第一处理器和第二处理器通过服务器内的总线连接。
与上文中运算数据的基于通信线缆的传输方式相似的,控制设备通常基于控制信令向第一处理器和/或第二处理器指示传输运算数据。其中,控制信令可以用于指示第一处理器发送运算数据,也可以用于指示第二处理器接收运算数据。
在一种可选实现方式中,本步骤可以实现为:在运算数据传输失败的情况下,控制第一处理器基于服务器内的总线连接提供的互联信道,向第二处理器发送运算数据。
互联信道用于在服务器内提供至少两个处理器之间的数据传输通路。进一步的,互联信道还用于提供服务器内的任意两个服务器之间的数据传输通路。
控制设备通过向第一处理器和/或第二处理器发送调用互联信道的指示信令,以实现控制传输运算数据。
在通信线缆和交换机无法实现运算数据的成功传输的情况下,拓展了基于总线连接的数据传输方式,避免了服务器内的处理器之间无法执行数据传输的问题,避免了处理器计算中断的风险。
示例性的,关于数据传输失败、第一处理器和第二处理器通过通信线缆与交换机的连接方式的介绍,可以参考上文中的图3至图6,在这里不再一一重复。
在一种可选实现方式中,在步骤680之前,还包括:在运算数据传输失败的情况下,将第一处理器的数据传输状态设置为初始状态,以及修正数据指针指向运算数据之前的历史数据;
和上文中的步骤555相似的,初始状态是对运算数据的预备发送状态,以实现控制第一处理器不再以通信线缆和交换机的方式传输运算数据,而通过总线连接的方式预备发送运算数据。比如将排队等候(Queue Pair)状态重置。
示例性的,历史数据是基于通信线缆和交换机的方式成功传输的数据。在控制第一处理器再次发送数据时,发送的数据是数据指针当前指向的数据的下一个数据。
综上所述,本实施例提供的方法,在运算数据基于通信线缆传输失败的情况下,基于服务器内提供的第一处理器、第二处理器之间的总线连接重传运算数据,实现归属于同一服务器的两个处理器之间的数据传输,充分利用总线连接的带宽资源;避免了基于通信线缆和交换机传输失败造成服务器内的处理器之间无法执行数据传输的问题,避免了处理器计算中断的风险。
本领域普通技术人员可以理解,上述实施例可以独立实施,也可以将上述实施例进行自由组合,组合出新的实施例实现本申请的数据传输方法。
图14示出了本申请一个示例性实施例提供的数据传输装置的结构框图。第一处理器和第二处理器归属于同一服务器,所述第一处理器和所述第二处理器通过所述服务器内的总线连接,所述第一处理器和所述第二处理器通过通信线缆与交换机相连,所述装置包括:
发送模块810,用于基于所述服务器内的所述总线连接,所述第一处理器向所述第二处理器发送运算数据;
所述发送模块810,还用于在所述运算数据传输失败的情况下,基于所述通信线缆和所述交换机,所述第一处理器向所述第二处理器发送所述运算数据。
在本申请的一个可选设计中,所述第一处理器、所述第二处理器分别与第一接入层交换机相连,所述第一接入层交换机用于直接连接多个处理器;所述发送模块810还用于:
所述第一处理器经过第一路径,向所述第二处理器发送所述运算数据,所述第一路径以所述第一处理器为起点、所述第二处理器为终点,途径所述第一接入层交换机。
在本申请的一个可选设计中,所述第一处理器与第二接入层交换机相连,所述第二处理器与第三接入层交换机相连,第一汇聚层交换机与所述第二接入层交换机、所述第三接入层交换机分别相连;所述发送模块810还用于:
所述第一处理器经过第二路径,向所述第二处理器发送所述运算数据,所述第二路径以所述第一处理器为起点、所述第二处理器为终点,依次经过所述第二接入层交换机、所述第一汇聚层交换机、所述第三接入层交换机。
在本申请的一个可选设计中,所述第一处理器与第四接入层交换机相连,所述第二处理器与第五接入层交换机相连,第二汇聚层交换机与所述第四接入层交换机相连,第三汇聚层交换机与所述第五接入层交换机相连,核心层交换机与所述第二汇聚层交换机、所述第三汇聚层交换机分别相连;所述发送模块810还用于:
所述第一处理器经过第三路径,向所述第二处理器发送所述运算数据,所述第三路径以所述第一处理器为起点、所述第二处理器为终点,依次经过所述第四接入层交换机、所述第二汇聚层交换机、所述核心层交换机、所述第三汇聚层交换机、所述第五接入层交换机。
在本申请的一个可选设计中,所述发送模块810还用于:
基于所述通信线缆和所述交换机提供的网络信道,所述第一处理器向所述第二处理器发送所述运算数据;所述网络信道用于提供通信线缆连接的两个处理器之间的数据传输通路。
在本申请的一个可选设计中,所述服务器中还包括第三处理器,所述网络信道是基于环状结构的信道;
其中,所述第一处理器、所述第二处理器和所述第二处理器中的任意两个处理器之间,基于网络信道的传输路径经过至少一个交换机。
在本申请的一个可选设计中,所述发送模块810还用于:
基于所述总线连接提供的互联信道,所述第一处理器向所述第二处理器发送所述运算数据;所述互联信道用于在所述服务器内提供至少两个处理器之间的数据传输通路。
在本申请的一个可选设计中,所述装置还包括:
获取模块820,用于获取所述通信线缆对应的第一信道资源带宽、所述总线连接提供的串行信道对应的第二信道资源带宽;
所述发送模块810还用于:
在所述第一信道资源带宽超过所述第二信道资源带宽,且所述运算数据传输失败的情况下,基于所述通信线缆和所述交换机提供的网络信道,所述第一处理器向所述第二处理器发送所述运算数据。
在本申请的一个可选设计中,所述发送模块810还用于:
在所述第二信道资源带宽超过所述第一信道资源带宽,且所述运算数据传输失败的情况下,基于所述总线连接提供的所述串行信道,所述第一处理器向所述第二处理器发送所述运算数据。
在本申请的一个可选设计中,所述发送模块810还用于:
在所述运算数据基于所述通信线缆传输失败的情况下,基于所述总线连接提供的所述串行信道,所述第一处理器向所述第二处理器发送所述运算数据。
图15示出了本申请一个示例性实施例提供的数据传输装置的结构框图。第一处理器、第二处理器归属于同一服务器,所述第一处理器和所述第二处理器通过所述服务器内的总线连接,所述第一处理器和所述第二处理器通过通信线缆与交换机相连,所述装置包括:
控制模块830,用于控制所述第一处理器基于所述服务器内的所述总线连接,向所述第二处理器发送运算数据;
所述控制模块830,还用于在所述运算数据传输失败的情况下,控制所述第一处理器基于所述通信线缆和所述交换机,向所述第二处理器发送运算数据。
在本申请的一个可选设计中,所述控制模块830还用于:
控制所述第一处理器基于所述服务器内的所述总线连接提供的互联信道,向所述第二处理器发送运算数据。
在本申请的一个可选设计中,所述控制模块830还用于:
控制所述第一处理器基于所述通信线缆和所述交换机提供的网络信道,向所述第二处理器发送运算数据。
在本申请的一个可选设计中,所述控制模块830还用于:
在所述运算数据传输失败的情况下,将所述第一处理器的数据传输状态设置为初始状态,以及修正数据指针指向所述运算数据之前的历史数据,所述历史数据是基于所述总线连接成功传输的数据。
本申请一个示例性实施例提供有一种数据传输装置。第一处理器和第二处理器归属于同一服务器,所述第一处理器和所述第二处理器通过所述服务器内的总线连接,所述第一处理器和所述第二处理器通过通信线缆与交换机相连,所述装置包括:
发送模块,用于基于所述通信线缆和所述交换机,所述第一处理器向所述第二处理器发送所述运算数据;
所述发送模块,还用于在所述运算数据传输失败的情况下,基于所述服务器内的所述总线连接,所述第一处理器向所述第二处理器发送运算数据。
本申请一个示例性实施例提供有一种数据传输装置。第一处理器、第二处理器归属于同一服务器,所述第一处理器和所述第二处理器通过所述服务器内的总线连接,所述第一处理器和所述第二处理器通过通信线缆与交换机相连,所述装置包括:
控制模块,用于控制所述第一处理器基于所述通信线缆和所述交换机,向所述第二处理器发送运算数据;
所述控制模块,还用于在所述运算数据传输失败的情况下,控制所述第一处理器基于所述服务器内的所述总线连接,向所述第二处理器发送运算数据。
需要说明的一点是,上述实施例提供的装置在实现其功能时,仅以上述各个功能模块的划分进行举例说明,实际应用中,可以根据实际需要而将上述功能分配由不同的功能模块完成,即将设备的内容结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述;各个模块执行操作取得的技术效果与有关该方法的实施例中的技术效果相同,此处将不做详细阐述说明。
本申请实施例还提供了一种计算机设备,该计算机设备包括:处理器和存储器,存储器中存储有计算机程序;所述处理器,用于执行所述存储器中的所述计算机程序以实现上述各方法实施例提供的数据传输方法。
可选地,该计算机设备为服务器。示例地,图16是本申请一个示例性实施例提供的服务器的结构框图。
通常,服务器2300包括有:处理器2301和存储器2302。
处理器2301可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器2301可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器2301也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器(CentralProcessing Unit,CPU);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器2301可以在集成有图像处理器(Graphics Processing Unit,GPU),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器2301还可以包括人工智能(Artificial Intelligence,AI)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器2302可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器2302还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器2302中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器2301所执行以实现本申请中方法实施例提供的数据传输方法。
在一些实施例中,服务器2300还可选包括有:输入接口2303和输出接口2304。处理器2301、存储器2302和输入接口2303、输出接口2304之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与输入接口2303、输出接口2304相连。输入接口2303、输出接口2304可被用于将输入/输出(Input/Output,I/O)相关的至少一个外围设备连接到处理器2301和存储器2302。在一些实施例中,处理器2301、存储器2302和输入接口2303、输出接口2304被集成在同一芯片或电路板上;在一些其他实施例中,处理器2301、存储器2302和输入接口2303、输出接口2304中的任意一个或两个可以在单独的芯片或电路板上实现,本申请实施例对此不加以限定。
本领域技术人员可以理解,上述示出的结构并不构成对服务器2300的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
在示例性实施例中,还提供了一种芯片,所述芯片包括可编程逻辑电路和/或程序指令,当所述芯片在计算机设备上运行时,用于实现上述方面所述的数据传输方法。
在示例性实施例中,还提供了一种计算机程序产品,该计算机程序产品包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器从计算机可读存储介质读取并执行该计算机指令,以实现上述各方法实施例提供的数据传输方法。
在示例性实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现上述各方法实施例提供的数据传输方法。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本申请实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (23)

1.一种数据传输方法,其特征在于,所述方法由第一处理器执行,所述第一处理器和第二处理器归属于同一服务器,所述第一处理器和所述第二处理器通过所述服务器内的总线连接,所述第一处理器和所述第二处理器通过通信线缆与交换机相连,所述方法包括:
基于所述服务器内的所述总线连接,所述第一处理器向所述第二处理器发送运算数据;
在所述运算数据传输失败的情况下,基于所述通信线缆和所述交换机,所述第一处理器向所述第二处理器发送所述运算数据。
2.根据权利要求1所述的方法,其特征在于,所述第一处理器、所述第二处理器分别与第一接入层交换机相连,所述第一接入层交换机用于直接连接多个处理器;
所述第一处理器向所述第二处理器发送运算数据,包括:
所述第一处理器经过第一路径,向所述第二处理器发送所述运算数据,所述第一路径以所述第一处理器为起点、所述第二处理器为终点,途径所述第一接入层交换机。
3.根据权利要求1所述的方法,其特征在于,所述第一处理器与第二接入层交换机相连,所述第二处理器与第三接入层交换机相连,第一汇聚层交换机与所述第二接入层交换机、所述第三接入层交换机分别相连;
所述第一处理器向所述第二处理器发送运算数据,包括:
所述第一处理器经过第二路径,向所述第二处理器发送所述运算数据,所述第二路径以所述第一处理器为起点、所述第二处理器为终点,依次经过所述第二接入层交换机、所述第一汇聚层交换机、所述第三接入层交换机。
4.根据权利要求1所述的方法,其特征在于,所述第一处理器与第四接入层交换机相连,所述第二处理器与第五接入层交换机相连,第二汇聚层交换机与所述第四接入层交换机相连,第三汇聚层交换机与所述第五接入层交换机相连,核心层交换机与所述第二汇聚层交换机、所述第三汇聚层交换机分别相连;
所述第一处理器向所述第二处理器发送运算数据,包括:
所述第一处理器经过第三路径,向所述第二处理器发送所述运算数据,所述第二路径以所述第一处理器为起点、所述第二处理器为终点,依次经过所述第四接入层交换机、所述第二汇聚层交换机、所述核心层交换机、所述第三汇聚层交换机、所述第五接入层交换机。
5.根据权利要求1所述的方法,其特征在于,所述基于所述通信线缆和所述交换机,所述第一处理器向所述第二处理器发送所述运算数据,包括:
基于所述通信线缆和所述交换机提供的网络信道,所述第一处理器向所述第二处理器发送所述运算数据;所述网络信道用于提供通信线缆连接的两个处理器之间的数据传输通路。
6.根据权利要求5所述的方法,其特征在于,所述服务器中还包括第三处理器,所述网络信道是基于环状结构的信道;
其中,所述第一处理器、所述第二处理器和所述第二处理器中的任意两个处理器之间,基于网络信道的传输路径经过至少一个交换机。
7.根据权利要求1至6任一所述的方法,其特征在于,所述基于所述服务器内的所述总线连接,所述第一处理器向所述第二处理器发送运算数据,包括:
基于所述总线连接提供的互联信道,所述第一处理器向所述第二处理器发送所述运算数据;所述互联信道用于在所述服务器内提供至少两个处理器之间的数据传输通路。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
获取所述通信线缆对应的第一信道资源带宽、所述总线连接提供的串行信道对应的第二信道资源带宽;
所述在所述运算数据传输失败的情况下,基于所述通信线缆和所述交换机,所述第一处理器向所述第二处理器发送所述运算数据,包括:
在所述第一信道资源带宽超过所述第二信道资源带宽,且所述运算数据传输失败的情况下,基于所述通信线缆和所述交换机提供的网络信道,所述第一处理器向所述第二处理器发送所述运算数据。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
在所述第二信道资源带宽超过所述第一信道资源带宽,且所述运算数据传输失败的情况下,基于所述总线连接提供的所述串行信道,所述第一处理器向所述第二处理器发送所述运算数据。
10.根据权利要求8所述的方法,其特征在于,所述方法还包括:
在所述运算数据基于所述通信线缆传输失败的情况下,基于所述总线连接提供的所述串行信道,所述第一处理器向所述第二处理器发送所述运算数据。
11.一种数据传输方法,其特征在于,所述方法由服务器中的控制设备执行,第一处理器、第二处理器归属于所述服务器,所述第一处理器和所述第二处理器通过所述服务器内的总线连接,所述第一处理器和所述第二处理器通过通信线缆与交换机相连,所述方法包括:
控制所述第一处理器基于所述服务器内的所述总线连接,向所述第二处理器发送运算数据;
在所述运算数据传输失败的情况下,控制所述第一处理器基于所述通信线缆和所述交换机,向所述第二处理器发送运算数据。
12.根据权利要求11所述的方法,其特征在于,所述控制所述第一处理器基于所述服务器内的所述总线连接,向所述第二处理器发送运算数据,包括:
控制所述第一处理器基于所述服务器内的所述总线连接提供的互联信道,向所述第二处理器发送运算数据。
13.根据权利要求11所述的方法,其特征在于,所述控制所述第一处理器基于所述通信线缆和所述交换机,向所述第二处理器发送运算数据,包括:
控制所述第一处理器基于所述通信线缆和所述交换机提供的网络信道,向所述第二处理器发送运算数据。
14.根据权利要求11至13任一所述的方法,其特征在于,所述方法还包括:
在所述运算数据传输失败的情况下,将所述第一处理器的数据传输状态设置为初始状态,以及修正数据指针指向所述运算数据之前的历史数据,所述历史数据是基于所述总线连接成功传输的数据。
15.一种数据传输方法,其特征在于,所述方法由第一处理器执行,所述第一处理器和第二处理器归属于同一服务器,所述第一处理器和所述第二处理器通过所述服务器内的总线连接,所述第一处理器和所述第二处理器通过通信线缆与交换机相连,所述方法包括:
基于所述通信线缆和所述交换机,所述第一处理器向所述第二处理器发送所述运算数据;
在所述运算数据传输失败的情况下,基于所述服务器内的所述总线连接,所述第一处理器向所述第二处理器发送运算数据。
16.一种数据传输方法,其特征在于,所述方法由服务器中的控制设备执行,第一处理器、第二处理器归属于所述服务器,所述第一处理器和所述第二处理器通过所述服务器内的总线连接,所述第一处理器和所述第二处理器通过通信线缆与交换机相连,所述方法包括:
控制所述第一处理器基于所述通信线缆和所述交换机,向所述第二处理器发送运算数据;
在所述运算数据传输失败的情况下,控制所述第一处理器基于所述服务器内的所述总线连接,向所述第二处理器发送运算数据。
17.一种数据传输装置,其特征在于,第一处理器和第二处理器归属于同一服务器,所述第一处理器和所述第二处理器通过所述服务器内的总线连接,所述第一处理器和所述第二处理器通过通信线缆与交换机相连,所述装置包括:
发送模块,用于基于所述服务器内的所述总线连接,所述第一处理器向所述第二处理器发送运算数据;
所述发送模块,还用于在所述运算数据传输失败的情况下,基于所述通信线缆和所述交换机,所述第一处理器向所述第二处理器发送所述运算数据。
18.一种数据传输装置,其特征在于,第一处理器、第二处理器归属于同一服务器,所述第一处理器和所述第二处理器通过所述服务器内的总线连接,所述第一处理器和所述第二处理器通过通信线缆与交换机相连,所述装置包括:
控制模块,用于控制所述第一处理器基于所述服务器内的所述总线连接,向所述第二处理器发送运算数据;
所述控制模块,还用于在所述运算数据传输失败的情况下,控制所述第一处理器基于所述通信线缆和所述交换机,向所述第二处理器发送运算数据。
19.一种数据传输装置,其特征在于,第一处理器和第二处理器归属于同一服务器,所述第一处理器和所述第二处理器通过所述服务器内的总线连接,所述第一处理器和所述第二处理器通过通信线缆与交换机相连,所述装置包括:
发送模块,用于基于所述通信线缆和所述交换机,所述第一处理器向所述第二处理器发送所述运算数据;
所述发送模块,还用于在所述运算数据传输失败的情况下,基于所述服务器内的所述总线连接,所述第一处理器向所述第二处理器发送运算数据。
20.一种数据传输装置,其特征在于,第一处理器、第二处理器归属于同一服务器,所述第一处理器和所述第二处理器通过所述服务器内的总线连接,所述第一处理器和所述第二处理器通过通信线缆与交换机相连,所述装置包括:
控制模块,用于控制所述第一处理器基于所述通信线缆和所述交换机,向所述第二处理器发送运算数据;
所述控制模块,还用于在所述运算数据传输失败的情况下,控制所述第一处理器基于所述服务器内的所述总线连接,向所述第二处理器发送运算数据。
21.一种计算机设备,其特征在于,所述计算机设备包括:处理器和存储器,所述存储器中存储有至少一段程序;所述处理器,用于执行所述存储器中的所述至少一段程序以实现上述如权利要求1至16任一所述的数据传输方法。
22.一种计算机可读存储介质,其特征在于,所述可读存储介质中存储有可执行指令,所述可执行指令由处理器加载并执行以实现上述如权利要求1至16任一所述的数据传输方法。
23.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机指令,所述计算机指令存储在计算机可读存储介质中,处理器从所述计算机可读存储介质读取并执行所述计算机指令,以实现上述如权利要求1至16任一所述的数据传输方法。
CN202410171460.4A 2024-02-05 2024-02-05 数据传输方法、装置、设备及存储介质 Active CN118606253B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410171460.4A CN118606253B (zh) 2024-02-05 2024-02-05 数据传输方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410171460.4A CN118606253B (zh) 2024-02-05 2024-02-05 数据传输方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN118606253A true CN118606253A (zh) 2024-09-06
CN118606253B CN118606253B (zh) 2025-05-16

Family

ID=92557808

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410171460.4A Active CN118606253B (zh) 2024-02-05 2024-02-05 数据传输方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN118606253B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003006173A (ja) * 2001-04-18 2003-01-10 Matsushita Electric Works Ltd 情報処理装置
CN1758622A (zh) * 2005-11-11 2006-04-12 哈尔滨工业大学 信息处理装置之间的异构多总线数据传输方法
CN202617301U (zh) * 2012-06-06 2012-12-19 上海锐递光电技术有限公司 一种光交换机
CN112491700A (zh) * 2020-12-14 2021-03-12 成都颜创启新信息技术有限公司 网络路径调整方法、系统、装置、电子设备及存储介质
CN114359015A (zh) * 2021-12-08 2022-04-15 北京百度网讯科技有限公司 数据传输方法、装置和图形处理服务器
CN115098250A (zh) * 2022-06-15 2022-09-23 阿里巴巴(中国)有限公司 资源处理方法、交换设备、服务器和存储介质
CN116737469A (zh) * 2023-06-21 2023-09-12 浪潮商用机器有限公司 一种隔离数据传输故障的方法、装置、介质以及服务器
CN117119982A (zh) * 2021-03-30 2023-11-24 西拉格国际有限公司 用于模块化能量系统的架构
CN117493237A (zh) * 2023-12-29 2024-02-02 苏州元脑智能科技有限公司 计算设备、服务器、数据处理方法和存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003006173A (ja) * 2001-04-18 2003-01-10 Matsushita Electric Works Ltd 情報処理装置
CN1758622A (zh) * 2005-11-11 2006-04-12 哈尔滨工业大学 信息处理装置之间的异构多总线数据传输方法
CN202617301U (zh) * 2012-06-06 2012-12-19 上海锐递光电技术有限公司 一种光交换机
CN112491700A (zh) * 2020-12-14 2021-03-12 成都颜创启新信息技术有限公司 网络路径调整方法、系统、装置、电子设备及存储介质
CN117119982A (zh) * 2021-03-30 2023-11-24 西拉格国际有限公司 用于模块化能量系统的架构
CN114359015A (zh) * 2021-12-08 2022-04-15 北京百度网讯科技有限公司 数据传输方法、装置和图形处理服务器
CN115098250A (zh) * 2022-06-15 2022-09-23 阿里巴巴(中国)有限公司 资源处理方法、交换设备、服务器和存储介质
CN116737469A (zh) * 2023-06-21 2023-09-12 浪潮商用机器有限公司 一种隔离数据传输故障的方法、装置、介质以及服务器
CN117493237A (zh) * 2023-12-29 2024-02-02 苏州元脑智能科技有限公司 计算设备、服务器、数据处理方法和存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
C.L.TOH ET AL.: "Implementation of high speed control network with fail-safe control and communication cable redundancy in modular multilevel converter", 《2013 15TH EUROPEAN CONFERENCE ON POWER ELECTRONICS AND APPLICATIONS (EPE)》, 17 October 2013 (2013-10-17), pages 1 - 10 *
罗正时,毕强: "煤矿安全监控技术及网络简介", 《金属矿山》, 30 November 2009 (2009-11-30), pages 576 - 580 *
高振东 等: "基于StarFabric交换式总线的系统结构优化方法", 《计算机工程》, vol. 34, 30 September 2008 (2008-09-30), pages 85 - 87 *

Also Published As

Publication number Publication date
CN118606253B (zh) 2025-05-16

Similar Documents

Publication Publication Date Title
JP5828966B2 (ja) Pcieスイッチング・ネットワークにおけるパケット伝送を実現する方法、装置、システム、及び記憶媒体
US20070133415A1 (en) Method and apparatus for flow control initialization
JPH0817388B2 (ja) プロトコル・システム、動的結合装置のポートの状態を制御するための方法、動的スイッチ及び双方向伝送システムを動作させるための方法
CZ385291A3 (en) Communication system
CN106453156B (zh) 一种虚拟设备间的通信方法及装置
CN105763472B (zh) 一种跨板转发的方法和装置
CN107948063B (zh) 一种建立聚合链路的方法和接入设备
CN100407619C (zh) 使用网络处理器实现端口主备切换的方法
WO2024156226A1 (zh) 报文传输方法、装置及系统
JPS5992654A (ja) 電子文書配送システム
CN110518978B (zh) 基于光纤链路的混合数据传输组件
CN118606253A (zh) 数据传输方法、装置、设备及存储介质
CN102055657B (zh) Fc数据报文的负载分担方法和fc交换机系统
CN116614459B (zh) 一种基于以太网rdma协议的链路聚合组管理方法及装置
JP2008148290A (ja) 論理リンク接続性検証方法およびシステム
WO2013000231A1 (zh) 批量业务处理的方法和装置
JP7456603B2 (ja) スイッチ装置
CN118606254A (zh) 数据传输方法、装置、设备及存储介质
JPWO2007096987A1 (ja) エラー制御装置
CN107800639B (zh) 交换装置、交换装置组、数据传输方法和计算机系统
CN112148659B (zh) 数据传输电路
CN110928828A (zh) 处理器间业务处理系统
JP2020178180A (ja) 通信制御プログラム、通信制御方法および情報処理装置
TW202011715A (zh) 控制器、調整封包通信規則的方法及網路通信系統
US20240086265A1 (en) Selective aggregation of messages in collective operations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant