CN109783433A - 一种算法加速系统以及加速卡的配置方法 - Google Patents

一种算法加速系统以及加速卡的配置方法 Download PDF

Info

Publication number
CN109783433A
CN109783433A CN201910016890.8A CN201910016890A CN109783433A CN 109783433 A CN109783433 A CN 109783433A CN 201910016890 A CN201910016890 A CN 201910016890A CN 109783433 A CN109783433 A CN 109783433A
Authority
CN
China
Prior art keywords
data packet
accelerator card
configuration
sent
subfile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910016890.8A
Other languages
English (en)
Inventor
黄广奎
张静东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201910016890.8A priority Critical patent/CN109783433A/zh
Publication of CN109783433A publication Critical patent/CN109783433A/zh
Withdrawn legal-status Critical Current

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种算法加速系统,包括第一预设数目个第一加速卡;与服务器以及第一预设数目个第一加速卡连接的以太网交换机,用于构建服务器与第一预设数目个第一加速卡之间的以太网通路;服务器,用于通过以太网通路对第一预设数目个第一加速卡进行配置,并通过以太网通路控制经过配置的第一加速卡对自身的算法进行加速。由于以太网交换机可以连接不限数量的第一加速卡,因此可以根据实际需求不受限制地调整第一预设数目的数值,也即可以根据自身需求不受限制地对算法进行加速,提高了工作效率。本发明还公开了一种加速卡的配置方法,数据传输稳定性高,配置的成功率高。

Description

一种算法加速系统以及加速卡的配置方法
技术领域
本发明涉及算法加速领域,特别是涉及一种算法加速系统,本发明还涉及一种加速卡的配置方法。
背景技术
为了对服务器中运行的算法进行加速,通常将加速卡插在服务器的PCIE(peripheral component interconnect express,高速串行计算机扩展总线标准)接口上以便对服务器中运行的算法进行加速,随着算法复杂性的增加,需要很多块加速卡同时对算法进行加速,但是服务器上的PCIE接口数量是有限的,且一个PCIE接口只能插装一个加速卡,这也就限制了同时使用加速卡的数量,影响了对于算法的加速工作,工作效率较低。
因此,如何提供一种解决上述技术问题的方案是本领域技术人员目前需要解决的问题。
发明内容
本发明的目的是提供一种算法加速系统,可以使用不限数量的加速卡为同一服务器中的算法进行加速,提高了工作效率;本发明的另一目的是提供一种加速卡的配置方法,提高了数据传输的稳定性以及配置成功率。
为解决上述技术问题,本发明提供了一种算法加速系统,包括:
第一预设数目个第一加速卡;
与服务器以及第一预设数目个所述第一加速卡连接的以太网交换机,用于构建所述服务器与第一预设数目个所述第一加速卡之间的以太网通路;
服务器,用于通过所述以太网通路对第一预设数目个所述第一加速卡进行配置,并通过所述以太网通路控制经过配置的所述第一加速卡对自身的算法进行加速。
优选地,所述通过所述以太网通路对第一预设数目个所述第一加速卡进行配置具体为:
在对每个所述第一加速卡进行配置时,将每个所述第一加速卡对应的配置文件分割为第二预设数目个配置子文件;
将所述第二预设数目、待发送的所述配置子文件的发送次序以及校验数据均与待发送的所述配置子文件绑定,作为一个数据包;
按照所述发送次序通过所述以太网通路将所述数据包发送至对应的所述第一加速卡;
在接受到所述校验失败信息后,将与所述校验失败信息中的所述发送次序对应的所述数据包重新发送至对应的所述第一加速卡;
则所述第一加速卡具体用于:
接收所述数据包后,通过所述校验数据校验所述数据包是否错误;
若是,则将包含所述数据包中的所述发送次序的校验失败信息发送至所述服务器;
若否,则判断所述数据包中的所述发送次序是否等于所述第二预设数目,若是,则加载接收到的所有的所述数据包。
优选地,所述将每个所述第一加速卡对应的配置文件分割为第二预设数目个配置子文件之后,所述将所述第二预设数目、待发送的所述配置子文件的发送次序以及校验数据均与待发送的所述配置子文件绑定之前,所述服务器还用于:
对每个所述配置子文件进行纠错编码;
则所述将所述第二预设数目、待发送的所述配置子文件的发送次序以及校验数据均与待发送的所述配置子文件绑定,作为一个数据包具体为:
将所述第二预设数目、待发送的所述配置子文件的发送次序、校验数据以及纠错码均与待发送的经过纠错编码的所述配置子文件绑定,作为一个数据包;
则所述通过所述校验数据校验所述数据包错误之后,所述将包含所述数据包中的所述发送次序的校验失败信息通过所述以太网通路发送至服务器之前,所述第一加速卡还用于:
通过所述纠错码验证所述配置子文件是否错误;
若是,则通过所述纠错码对所述配置子文件进行纠错,若纠错成功,则通过所述校验数据校验所述数据包是否错误,若依然错误,则执行后续步骤,若纠错失败,则执行后续步骤;
若所述配置子文件没有错误,则执行后续步骤。
优选地,所述接收所述数据包具体为:
通过所述数据包中的标识符确定所述数据包为包含所述配置子文件的数据包后,接收所述数据包。
优选地,所述将所述第二预设数目、待发送的所述配置子文件的发送次序、校验数据以及纠错码均与待发送的经过纠错编码的所述配置子文件绑定,作为一个数据包之后,所述按照所述发送次序通过所述以太网通路将所述数据包发送至对应的所述第一加速卡之前,所述服务器还用于:
验证待发送的所述数据包是否正确,若是,则执行后续步骤,否则重新生成待发送的所述数据包。
优选地,所述在对每个所述第一加速卡进行配置时,将每个所述第一加速卡对应的配置文件分割为第二预设数目个配置子文件具体为:
在对每个所述第一加速卡进行配置时,根据获取到的所述第一加速卡的媒体访问控制MAC地址,确定出所述第一加速卡对应的配置文件,将所述配置文件分割为第二预设数目个配置子文件。
优选地,该算法加速系统还包括:
均与所述服务器的PCIE接口连接的第三预设数目个第二加速卡,用于在所述服务器的控制下为自身的算法进行加速。
为解决上述技术问题,本发明还提供了一种加速卡的配置方法,应用于如上任一项所述的算法加速系统,包括:
在对每个所述第一加速卡进行配置时,所述服务器将每个所述第一加速卡对应的配置文件分割为第二预设数目个配置子文件;
所述服务器将所述第二预设数目、待发送的所述配置子文件的发送次序以及校验数据均与待发送的所述配置子文件绑定,作为一个数据包;
所述服务器按照所述发送次序通过所述以太网通路将所述数据包发送至对应的所述第一加速卡;
所述第一加速卡在接收所述数据包后,通过所述校验数据校验所述数据包是否错误;
若是,所述第一加速卡则将包含所述数据包中的所述发送次序的校验失败信息发送至所述服务器;
所述服务器在接受到所述校验失败信息后,将与所述校验失败信息中的所述发送次序对应的所述数据包重新发送至对应的所述第一加速卡;
若否,所述第一加速卡则判断所述数据包中的所述发送次序是否等于所述第二预设数目,若是,则加载接收到的所有的所述数据包。
优选地,所述将每个所述第一加速卡对应的配置文件分割为第二预设数目个配置子文件之后,所述将所述第二预设数目、待发送的所述配置子文件的发送次序以及校验数据均与待发送的所述配置子文件绑定之前,该配置方法还包括:
所述服务器对每个所述配置子文件进行纠错编码;
则将所述第二预设数目、待发送的所述配置子文件的发送次序以及校验数据均与待发送的所述配置子文件绑定,作为一个数据包具体为:
将所述第二预设数目、待发送的所述配置子文件的发送次序、校验数据以及纠错码均与待发送的经过纠错编码的所述配置子文件绑定,作为一个数据包;
则所述通过所述校验数据校验所述数据包错误之后,所述将包含所述数据包中的所述发送次序的校验失败信息通过所述以太网通路发送至服务器之前,该配置方法还包括:
所述第一加速卡通过所述纠错码验证所述配置子文件是否错误;
若是,则通过所述纠错码对所述配置子文件进行纠错,若纠错成功,则通过所述校验数据校验所述数据包是否错误,若依然错误,则执行后续步骤,若纠错失败,则执行后续步骤;
若所述配置子文件没有错误,则执行后续步骤。
优选地,所述第一加速卡接收所述数据包具体为:
所述第一加速卡通过所述数据包中的标识符确定所述数据包为包含所述配置子文件的数据包后,接收所述数据包。
本发明提供了一种算法加速系统,包括第一预设数目个第一加速卡;与服务器以及第一预设数目个第一加速卡连接的以太网交换机,用于构建服务器与第一预设数目个第一加速卡之间的以太网通路;服务器,用于通过以太网通路对第一预设数目个第一加速卡进行配置,并通过以太网通路控制经过配置的第一加速卡对自身的算法进行加速。
可见,本发明中的以太网交换机与服务器以及第一预设数目个第一加速卡连接,并构建服务器与所有的第一加速卡之间的以太网通路,此种情况下,服务器便可以通过以太网通路控制第一预设数目个第一加速卡为自身的算法进行加速,具体为首先对第一预设数目个第一加速卡进行配置,然后控制经过配置的第一加速卡对自身的算法进行加速,由于以太网交换机可以连接不限数量的第一加速卡,因此可以根据实际需求不受限制地调整第一预设数目的数值,也即可以根据自身需求不受限制地对算法进行加速,提高了工作效率。
本发明还提供了一种加速卡的配置方法,包括在对每个第一加速卡进行配置时,服务器将每个第一加速卡对应的配置文件分割为第二预设数目个配置子文件;服务器将第二预设数目、待发送的配置子文件的发送次序以及校验数据均与待发送的配置子文件绑定,作为一个数据包;服务器按照发送次序通过以太网通路将数据包发送至对应的第一加速卡;第一加速卡在接收数据包后,通过校验数据校验数据包是否错误;若是,第一加速卡则将包含数据包中的发送次序的校验失败信息发送至服务器;服务器在接受到校验失败信息后,将与校验失败信息中的发送次序对应的数据包重新发送至对应的第一加速卡;若否,第一加速卡则判断数据包中的发送次序是否等于第二预设数目,若是,则加载接收到的所有的数据包。
本发明中,服务器能够将每个第一加速卡对应的配置文件分割为第二预设数目个配置子文件,便于缩小每个数据包的数据量,有利于提高数据传输的稳定性,然后服务器将第二预设数目、待发送的配置子文件的发送次序以及校验数据均与待发送的配置子文件绑定,作为一个数据包,然后服务器可以按照发送次序将数据包发送至对应的第一加速卡,其中,加速卡可以通过校验数据校验数据包是否错误,如果错误,还可以将包含发送次序的校验失败信息发送至服务器,以便重新发送该数据包,可以自动发送受到损坏的数据包,提高了配置的成功率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种算法加速系统的结构示意图;
图2为本发明提供的一种加速卡的配置方法的流程示意图。
具体实施方式
本发明的核心是提供一种算法加速系统,可以使用不限数量的加速卡为同一服务器中的算法进行加速,提高了工作效率;本发明的另一核心是提供一种加速卡的配置方法,提高了数据传输的稳定性以及配置成功率。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明提供的一种算法加速系统的结构示意图,包括:
第一预设数目个第一加速卡1;
与服务器3以及第一预设数目个第一加速卡1连接的以太网交换机2,用于构建服务器3与第一预设数目个第一加速卡1之间的以太网通路;
服务器3,用于通过以太网通路对第一预设数目个第一加速卡1进行配置,并通过以太网通路控制经过配置的第一加速卡1对自身的算法进行加速。
具体的,以太网交换机2可以通过网线连接服务器3以及第一预设数目个第一加速卡1,实现服务器3与第一预设数目个第一加速卡1之间的数据通信,由于通过以太网交换机2,可以实现不限数量个第一加速卡1与服务器3进行连接,且以太网交换机2也可以构建服务器3与所有已经连接的第一加速卡1之间的以太网通路,此种情况下,服务器3便摆脱了PCIE接口数量的限制,能够控制第一预设数目个第一加速卡1对自身的算法进行加速,算法速度提升后,进而提高了工作效率。
其中,第一预设数目可以根据实际需求进行自主设定,例如当需要十块第一加速卡1时,可以将十块第一加速卡1通过以太网交换机2与服务器3连接,本发明实施例在此不做限定。
具体的,以太网交换机2可以为多个,例如当第一预设数目过大时,可以通过多台以太网交换机2,实现数量较多的第一预设数目的第一加速卡1与服务器3的连接,本发明实施例在此不做限定。
其中,以太网交换机2可以基于服务器3上已有的以太网接口进行连接,例如可以仅仅与服务器3上的一个以太网接口连接,也可以连接服务器3上的多个以太网接口进行连接等,本发明实施例在此不做限定。
其中,当使用多台以太网交换机2时,多台以太网交换机2之间的连接方式可以为多种,例如树状连接结构等,本发明实施例在此不做限定。
具体的,首先可以决定第一预设数目的具体数值,然后可以根据第一预设数目的具体数值决定以太网交换机2的具体规格以及数量,以免造成资源的浪费,也可以降低成本。
另外,需要说明的是,配置文件可以是多种类型,例如其中可以包含第一加速卡1所需要的程序等,本发明实施例在此不做限定。
其中,服务器3在发送每个数据包的时候,可以将数据包封装在以太网的有效载荷payload部分进行发送。
具体的,服务器3在控制第一预设数目个第一加速卡1对自身的算法进行加速时,可以首先通过以太网通路对所有连接的第一加速卡1进行配置,在配置完成后,便可以通过以太网通路控制经过配置的第一加速卡1对自身的算法进行加速,可以实现自动化地配置过程,提高了工作效率,降低了人力成本。
当然,也可以选择通过人工预先配置的方式,本发明实施例在此不做限定。
本发明提供了一种算法加速系统,包括第一预设数目个第一加速卡;与服务器以及第一预设数目个第一加速卡连接的以太网交换机,用于构建服务器与第一预设数目个第一加速卡之间的以太网通路;服务器,用于通过以太网通路对第一预设数目个第一加速卡进行配置,并通过以太网通路控制经过配置的第一加速卡对自身的算法进行加速。
可见,本发明中的以太网交换机与服务器以及第一预设数目个第一加速卡连接,并构建服务器与所有的第一加速卡之间的以太网通路,此种情况下,服务器便可以通过以太网通路控制第一预设数目个第一加速卡为自身的算法进行加速,具体为首先对第一预设数目个第一加速卡进行配置,然后控制经过配置的第一加速卡对自身的算法进行加速,由于以太网交换机可以连接不限数量的第一加速卡,因此可以根据实际需求不受限制地调整第一预设数目的数值,也即可以根据自身需求不受限制地对算法进行加速,提高了工作效率。
在上述实施例的基础上:
作为一种优选的实施例,通过以太网通路对第一预设数目个第一加速卡1进行配置具体为:
在对每个第一加速卡1进行配置时,将每个第一加速卡1对应的配置文件分割为第二预设数目个配置子文件;
将第二预设数目、待发送的配置子文件的发送次序以及校验数据均与待发送的配置子文件绑定,作为一个数据包;
按照发送次序通过以太网通路将数据包发送至对应的第一加速卡1;
在接受到校验失败信息后,将与校验失败信息中的发送次序对应的数据包重新发送至对应的第一加速卡1;
则第一加速卡1具体用于:
接收数据包后,通过校验数据校验数据包是否错误;
若是,则将包含数据包中的发送次序的校验失败信息发送至服务器3;
若否,则判断数据包中的发送次序是否等于第二预设数目,若是,则加载接收到的所有的数据包。
具体的,可以将第一加速卡1对应的配置文件首先分割为第二预设数目个配置子文件,通过此方式可以减小每个发送的数据包的数据量,不易产生错误或丢失数据,提高了数据传输的稳定性。
具体的,在将配置文件分割为第二预设数目个配置子文件时,可以划分为大小相等的第一预设数目个配置子文件,也可以不均等划分,本发明实施例在此不做限定。
其中,第二预设数目可以根据需求进行自主设定,本发明实施例在此不做限定。
具体的,为了成功完成配置,需要将第二预设数目、待发送的配置子文件的发送次序以及校验数据均与待发送的配置子文件绑定在一起,作为一个数据包,一方面,第一加速卡1可以根据数据包中的发送次序以及第二预设数目,判断所有的数据包是否已经发送完毕,另一方面,第一加速卡1还可以根据每个数据包中的校验数据,校验该加速包是否错误,若是,则还可以将包含发送次序的校验失败信息发送至服务器3,此种情况下,服务器3便可根据接收到的包含发送次序的校验失败信息,再次发送该发送次序对应的数据包,能够自动化地重新发送存在错误的数据包,提高了工作效率。
其中,第一加速卡1可以根据校验数据验证配置子文件是否存在错误,这里的错误可以为该配置子文件在数据传输过程中产生的错误情况,例如文件损坏或者数据丢失等,谨防错误的配置子文件影响配置工作的正常进行,且通过将包含发送次序的校验失败信息发送给服务器3,可以实现自动化的重新发送正确的配置子文件,工作效率较高。
其中,服务器3根据校验失败信息中的发送次序便可以自动化地重新发送正确的配置子文件至对应的第一加速卡1,例如,A文件是第一加速卡1B的配置子文件,且B的配置子文件一共有30份,A文件的发送次序是10,在服务器3第一次将A文件对应的数据包发送至B的时候,B返回了包含10的校验失败信息,服务器3便可以将B的发送次序为10的配置子文件对应的数据包再次发送至B,可以在数据包产生错误的情况下,实现自动化地重新发送正确的数据包。
当然,无论第几次发送数据包,第一加速卡1均可以通过校验数据对数据包进行验证,服务器3也均可以在接收到校验失败信息后进行如上动作,本发明实施例在此不做限定。
其中,校验数据可以为多种类型,本发明实施例在此不做限定。
具体的,第一加速卡1每次接收到数据包后,若该数据包不存在错误,则会验证该数据包中的发送次序是否等于第二预设数目,若相等,则证明该数据包为所有数据包中的最后一个,即已经全部接收到了所有的配置子文件,此时第一加速卡1便可以加载接收到的所有的数据包,完成配置工作,以便服务器3控制配置后的第一加速卡1对自身的算法进行加速。
其中,服务器3可以严格按照发送次序发送数据包,为了更方便服务器3按照发送次序发送数据包,第一加速卡1在验证数据包没有错误后,可以发送包含该数据包中的发送次序的验证成功信息至服务器3,以便服务器3发送下一个发送次序的数据包。
当然,服务器3还可以通过其他的方式来按照发送次序发送数据包,例如在发送完一个数据包后,若在预设时间内没有接收到校验失败信息,则发送下一个发送次序的数据包等,本发明实施例在此不做限定。
其中,第一加速卡1在接收到数据包后,可以先将每个数据包都存储起来,在接收完毕所有的数据包后,便获取存储起来的所有的数据包进行加载,其中,可以将数据包存储在多个位置,例如闪存flash芯片中等,本发明实施例在此不做限定。
作为一种优选的实施例,将每个第一加速卡1对应的配置文件分割为第二预设数目个配置子文件之后,将第二预设数目、待发送的配置子文件的发送次序以及校验数据均与待发送的配置子文件绑定之前,服务器3还用于:
对每个配置子文件进行纠错编码;
则将第二预设数目、待发送的配置子文件的发送次序以及校验数据均与待发送的配置子文件绑定,作为一个数据包具体为:
将第二预设数目、待发送的配置子文件的发送次序、校验数据以及纠错码均与待发送的经过纠错编码的配置子文件绑定,作为一个数据包;
则通过校验数据校验数据包错误之后,将包含数据包中的发送次序的校验失败信息通过以太网通路发送至服务器3之前,第一加速卡1还用于:
通过纠错码验证配置子文件是否错误;
若是,则通过纠错码对配置子文件进行纠错,若纠错成功,则通过校验数据校验数据包是否错误,若依然错误,则执行后续步骤,若纠错失败,则执行后续步骤;
若配置子文件没有错误,则执行后续步骤。
具体的,可以在将配置文件分割为第二预设数目个配置子文件后立即对所有的配置子文件进行纠错编码,也可以在准备发送某个配置子文件之前,首先对该配置子文件进行纠错编码,然后再生成数据包进行发送等,本发明实施例在此不做限定。
其中,其中,纠错码为纠错编码的过程中生成的,第一加速卡1可以通过纠错码,验证对应的配置子文件是否产生了错误,也可以通过纠错码对产生了错误的配置子文件进行纠正,纠正可能成功,也可能失败。
具体的,第一加速卡1在验证数据包错误之后,可以先通过纠错码校验配置子文件是否产生了错误,若产生了错误,则可以通过纠错码对配置子文件进行纠正,纠正成功后便可以再次通过校验数据验证整个数据包是否错误,若没有错误,则可以正常地等待下一个数据包,或者主动地向服务器3发送包含该数据包的发送次序的验证成功信息。
其中,在以下三种情况下,仍会正常执行后续步骤,即发送包含数据包中的发送次序的校验失败信息:
1、若纠错成功后,数据包依然存在错误,则证明数据包中不仅仅配置子文件存在错误;
2、若纠错失败,则证明数据包必然存在错误;
3、若配置子文件没有错误,此种情况下,数据包依然存在其他的错误。
其中,通过纠错码对错误的数据包中的配置子文件进行验证并纠错后,可以修复一部分错误的数据包,第一加速卡1也无需发送包含发送次序的校验失败信息给服务器3,减少了数据传输的压力,提高了工作效率。
作为一种优选的实施例,接收数据包具体为:
通过数据包中的标识符确定数据包为包含配置子文件的数据包后,接收数据包。
具体的,本发明实施例中提供了一种辅助第一加速卡1识别数据包为包含配置子文件的数据包的方式,具有数据量小以及稳定性强的优点。
当然,除了本发明实施例中提供的识别方式外,还可以采用其他的识别方式,本发明实施例在此不做限定。
具体的,为了更好地对本发明实施例进行描述,请参考下表1,表1为本发明实施例提供的一种数据包格式的结构示意图,其中,包头即为上述的标识符,而总包数即为第二预设数目,序列号即为上述的发送次序,而表1中的配置数据指的是配置子文件,纠错编码区指的是纠错码,校验区指的是校验数据。
其中,每个第一加速卡1的包头可以都不同,此种情况下,每个第一加速卡1便可以从众多数据包中,得知哪一个数据包是自己需要的数据包,然后再进行进一步的处理,本发明实施例在此不做限定。
表1
包头 总包数 序列号 配置数据 纠错编码区 校验区
作为一种优选的实施例,将第二预设数目、待发送的配置子文件的发送次序、校验数据以及纠错码均与待发送的经过纠错编码的配置子文件绑定,作为一个数据包之后,按照发送次序通过以太网通路将数据包发送至对应的第一加速卡1之前,服务器3还用于:
验证待发送的数据包是否正确,若是,则执行后续步骤,否则重新生成待发送的数据包。
具体的,验证待发送的数据包是否正确的时机可以有很多种,例如可以集中验证某个第一加速卡1的所有数据包是否正确,如果有错误,则可以生成正确的数据包,直到所有的数据包都正确后再按照发送次序发送,也可以在发送每个数据包前进行验证,本发明实施例在此不做限定。
具体的,考虑到生成的数据包本身就可能存在错误,若果发送了错误的数据包,那么就浪费了很多的数据传输资源以及运算资源,本发明实施例中可以在发送数据包前,对数据包进行验证,防止发送了本身就存在错误的数据包,减少了对资源的浪费。
作为一种优选的实施例,在对每个第一加速卡1进行配置时,将每个第一加速卡1对应的配置文件分割为第二预设数目个配置子文件具体为:
在对每个第一加速卡1进行配置时,根据获取到的第一加速卡1的MAC(MediaAccess Control,媒体访问控制)地址,确定出第一加速卡1对应的配置文件,将配置文件分割为第二预设数目个配置子文件。
具体的,本发明实施例提供了一种确定第一加速卡1对应的配置文件的方式,即服务器3可以获取每个第一加速卡1的MAC地址,根据该MAC地址,服务器3便可以确定出该MAC地址对应的配置文件,服务器3中可以包含有预设的MAC地址与配置文件的对应关系,服务器3可以根据MAC地址以及该对应关系确定出该MAC地址对应的配置文件,效率比较高。
当然,除了本发明实施例中提供的确定第一加速卡1的配置文件的方式外,还可以采用其他方式确定出第一加速卡1的配置文件,本发明实施例在此不做限定。
作为一种优选的实施例,该算法加速系统还包括:
均与服务器3的PCIE接口连接的第三预设数目个第二加速卡,用于在服务器3的控制下为自身的算法进行加速。
具体的,本发明实施例中,在上述的算法加速系统的基础上,服务器3还可以通过自身的PCIE接口连接第三预设数目个第二加速卡,以便控制第二加速卡为自身的算法进行加速,可以同时控制两种接口的加速卡为自身算法进行加速。
其中,第三预设数目可以根据自身需求进行自主设定,但是第三预设数目应小于服务器3本身的PCIE接口数。
请参考图2,图2为本发明提供的一种加速卡的配置方法,应用于如上任一项的算法加速系统,包括:
步骤S1:在对每个第一加速卡1进行配置时,服务器3将每个第一加速卡1对应的配置文件分割为第二预设数目个配置子文件;
步骤S2:服务器3将第二预设数目、待发送的配置子文件的发送次序以及校验数据均与待发送的配置子文件绑定,作为一个数据包;
步骤S3:服务器3按照发送次序通过以太网通路将数据包发送至对应的第一加速卡1;
步骤S4:第一加速卡1在接收数据包后,通过校验数据校验数据包是否错误;
步骤S5:若是,第一加速卡1则将包含数据包中的发送次序的校验失败信息发送至服务器3;
步骤S6:服务器3在接受到校验失败信息后,将与校验失败信息中的发送次序对应的数据包重新发送至对应的第一加速卡1;
步骤S7:若否,第一加速卡1则判断数据包中的发送次序是否等于第二预设数目,若是,则加载接收到的所有的数据包。
作为一种优选的实施例,将每个第一加速卡1对应的配置文件分割为第二预设数目个配置子文件之后,将第二预设数目、待发送的配置子文件的发送次序以及校验数据均与待发送的配置子文件绑定之前,该配置方法还包括:
服务器3对每个配置子文件进行纠错编码;
则将第二预设数目、待发送的配置子文件的发送次序以及校验数据均与待发送的配置子文件绑定,作为一个数据包具体为:
将第二预设数目、待发送的配置子文件的发送次序、校验数据以及纠错码均与待发送的经过纠错编码的配置子文件绑定,作为一个数据包;
则通过校验数据校验数据包错误之后,将包含数据包中的发送次序的校验失败信息通过以太网通路发送至服务器3之前,该配置方法还包括:
第一加速卡1通过纠错码验证配置子文件是否错误;
若是,则通过纠错码对配置子文件进行纠错,若纠错成功,则通过校验数据校验数据包是否错误,若依然错误,则执行后续步骤,若纠错失败,则执行后续步骤;
若配置子文件没有错误,则执行后续步骤。
优选地,第一加速卡接收数据包具体为:
第一加速卡通过数据包中的标识符确定数据包为包含配置子文件的数据包后,接收数据包。
对于本发明提供的加速卡的配置方法请参照前述算法加速系统的实施例,本发明实施例在此不再赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种算法加速系统,其特征在于,包括:
第一预设数目个第一加速卡;
与服务器以及第一预设数目个所述第一加速卡连接的以太网交换机,用于构建所述服务器与第一预设数目个所述第一加速卡之间的以太网通路;
服务器,用于通过所述以太网通路对第一预设数目个所述第一加速卡进行配置,并通过所述以太网通路控制经过配置的所述第一加速卡对自身的算法进行加速。
2.根据权利要求1所述的算法加速系统,其特征在于,所述通过所述以太网通路对第一预设数目个所述第一加速卡进行配置具体为:
在对每个所述第一加速卡进行配置时,将每个所述第一加速卡对应的配置文件分割为第二预设数目个配置子文件;
将所述第二预设数目、待发送的所述配置子文件的发送次序以及校验数据均与待发送的所述配置子文件绑定,作为一个数据包;
按照所述发送次序通过所述以太网通路将所述数据包发送至对应的所述第一加速卡;
在接受到所述校验失败信息后,将与所述校验失败信息中的所述发送次序对应的所述数据包重新发送至对应的所述第一加速卡;
则所述第一加速卡具体用于:
接收所述数据包后,通过所述校验数据校验所述数据包是否错误;
若是,则将包含所述数据包中的所述发送次序的校验失败信息发送至所述服务器;
若否,则判断所述数据包中的所述发送次序是否等于所述第二预设数目,若是,则加载接收到的所有的所述数据包。
3.根据权利要求2所述的算法加速系统,其特征在于,所述将每个所述第一加速卡对应的配置文件分割为第二预设数目个配置子文件之后,所述将所述第二预设数目、待发送的所述配置子文件的发送次序以及校验数据均与待发送的所述配置子文件绑定之前,所述服务器还用于:
对每个所述配置子文件进行纠错编码;
则所述将所述第二预设数目、待发送的所述配置子文件的发送次序以及校验数据均与待发送的所述配置子文件绑定,作为一个数据包具体为:
将所述第二预设数目、待发送的所述配置子文件的发送次序、校验数据以及纠错码均与待发送的经过纠错编码的所述配置子文件绑定,作为一个数据包;
则所述通过所述校验数据校验所述数据包错误之后,所述将包含所述数据包中的所述发送次序的校验失败信息通过所述以太网通路发送至服务器之前,所述第一加速卡还用于:
通过所述纠错码验证所述配置子文件是否错误;
若是,则通过所述纠错码对所述配置子文件进行纠错,若纠错成功,则通过所述校验数据校验所述数据包是否错误,若依然错误,则执行后续步骤,若纠错失败,则执行后续步骤;
若所述配置子文件没有错误,则执行后续步骤。
4.根据权利要求3所述的算法加速系统,其特征在于,所述接收所述数据包具体为:
通过所述数据包中的标识符确定所述数据包为包含所述配置子文件的数据包后,接收所述数据包。
5.根据权利要求4所述的算法加速系统,其特征在于,所述将所述第二预设数目、待发送的所述配置子文件的发送次序、校验数据以及纠错码均与待发送的经过纠错编码的所述配置子文件绑定,作为一个数据包之后,所述按照所述发送次序通过所述以太网通路将所述数据包发送至对应的所述第一加速卡之前,所述服务器还用于:
验证待发送的所述数据包是否正确,若是,则执行后续步骤,否则重新生成待发送的所述数据包。
6.根据权利要求5所述的算法加速系统,其特征在于,所述在对每个所述第一加速卡进行配置时,将每个所述第一加速卡对应的配置文件分割为第二预设数目个配置子文件具体为:
在对每个所述第一加速卡进行配置时,根据获取到的所述第一加速卡的媒体访问控制MAC地址,确定出所述第一加速卡对应的配置文件,将所述配置文件分割为第二预设数目个配置子文件。
7.根据权利要求1至6任一项所述的算法加速系统,其特征在于,该算法加速系统还包括:
均与所述服务器的PCIE接口连接的第三预设数目个第二加速卡,用于在所述服务器的控制下为自身的算法进行加速。
8.一种加速卡的配置方法,应用于如权利要求1至7任一项所述的算法加速系统,其特征在于,包括:
在对每个所述第一加速卡进行配置时,所述服务器将每个所述第一加速卡对应的配置文件分割为第二预设数目个配置子文件;
所述服务器将所述第二预设数目、待发送的所述配置子文件的发送次序以及校验数据均与待发送的所述配置子文件绑定,作为一个数据包;
所述服务器按照所述发送次序通过所述以太网通路将所述数据包发送至对应的所述第一加速卡;
所述第一加速卡在接收所述数据包后,通过所述校验数据校验所述数据包是否错误;
若是,所述第一加速卡则将包含所述数据包中的所述发送次序的校验失败信息发送至所述服务器;
所述服务器在接受到所述校验失败信息后,将与所述校验失败信息中的所述发送次序对应的所述数据包重新发送至对应的所述第一加速卡;
若否,所述第一加速卡则判断所述数据包中的所述发送次序是否等于所述第二预设数目,若是,则加载接收到的所有的所述数据包。
9.根据权利要求8所述的配置方法,其特征在于,所述将每个所述第一加速卡对应的配置文件分割为第二预设数目个配置子文件之后,所述将所述第二预设数目、待发送的所述配置子文件的发送次序以及校验数据均与待发送的所述配置子文件绑定之前,该配置方法还包括:
所述服务器对每个所述配置子文件进行纠错编码;
则将所述第二预设数目、待发送的所述配置子文件的发送次序以及校验数据均与待发送的所述配置子文件绑定,作为一个数据包具体为:
将所述第二预设数目、待发送的所述配置子文件的发送次序、校验数据以及纠错码均与待发送的经过纠错编码的所述配置子文件绑定,作为一个数据包;
则所述通过所述校验数据校验所述数据包错误之后,所述将包含所述数据包中的所述发送次序的校验失败信息通过所述以太网通路发送至服务器之前,该配置方法还包括:
所述第一加速卡通过所述纠错码验证所述配置子文件是否错误;
若是,则通过所述纠错码对所述配置子文件进行纠错,若纠错成功,则通过所述校验数据校验所述数据包是否错误,若依然错误,则执行后续步骤,若纠错失败,则执行后续步骤;
若所述配置子文件没有错误,则执行后续步骤。
10.根据权利要求9所述的算法加速系统,其特征在于,所述第一加速卡接收所述数据包具体为:
所述第一加速卡通过所述数据包中的标识符确定所述数据包为包含所述配置子文件的数据包后,接收所述数据包。
CN201910016890.8A 2019-01-08 2019-01-08 一种算法加速系统以及加速卡的配置方法 Withdrawn CN109783433A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910016890.8A CN109783433A (zh) 2019-01-08 2019-01-08 一种算法加速系统以及加速卡的配置方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910016890.8A CN109783433A (zh) 2019-01-08 2019-01-08 一种算法加速系统以及加速卡的配置方法

Publications (1)

Publication Number Publication Date
CN109783433A true CN109783433A (zh) 2019-05-21

Family

ID=66500145

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910016890.8A Withdrawn CN109783433A (zh) 2019-01-08 2019-01-08 一种算法加速系统以及加速卡的配置方法

Country Status (1)

Country Link
CN (1) CN109783433A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022095348A1 (zh) * 2020-11-06 2022-05-12 浪潮(北京)电子信息产业有限公司 一种计算资源的远程映射方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022095348A1 (zh) * 2020-11-06 2022-05-12 浪潮(北京)电子信息产业有限公司 一种计算资源的远程映射方法、装置、设备及存储介质
US11960430B2 (en) 2020-11-06 2024-04-16 Inspur (Beijing) Electronic Information Industry Co., Ltd. Remote mapping method, apparatus and device for computing resources, and storage medium

Similar Documents

Publication Publication Date Title
CN104539739B (zh) 一种文件上传的系统、方法及装置
CN104967497B (zh) 一种基于网络通信协议的数据可靠传输方法及升级方法
CN102281121B (zh) 一种数据文件传输和校验的方法、设备及系统
EP0281785A2 (en) Bridge system for connecting networks
WO2011137640A1 (zh) 文件传输方法、文件发送装置和文件接收装置
CN104917586A (zh) 传输数据的校验方法、装置及系统
US20140337680A1 (en) Can communication apparatus and method thereof
US8631110B2 (en) Combined header processing for network packets
US6574744B1 (en) Method of determining a uniform global view of the system status of a distributed computer network
CN105554042A (zh) 一种UDP远程传输log的方法及系统
CN108052094A (zh) 一种扩展卡识别方法、装置及变频器
CN106788894A (zh) 分段独立传输校验方法
CN103259797A (zh) 数据文件传输方法及平台
CN106453156A (zh) 一种虚拟设备间的通信方法及装置
CN109286477A (zh) 一种支持乱序传输的数据传输方法
CN104429013B (zh) 传输反馈信息的方法、用户设备和基站
CN112994839A (zh) 灵活以太网开销复帧接收方法、装置、设备及介质
CN109783433A (zh) 一种算法加速系统以及加速卡的配置方法
CN106911428A (zh) 信息的传输方法和装置
CN104579605B (zh) 一种数据传输方法及装置
CN104853447B (zh) 一种数据信息处理方法和装置
CN109889418B (zh) 基于can总线的数据传输方法和装置
CN107257265A (zh) 实时传输数据流前向纠错方法、设备及存储介质
CN107547412B (zh) 一种stp计算方法和装置
US20160266887A1 (en) Method and System of Processing an Image Upgrade

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20190521