CN117135029A - 通信故障处理方法、系统及设备 - Google Patents
通信故障处理方法、系统及设备 Download PDFInfo
- Publication number
- CN117135029A CN117135029A CN202310938744.7A CN202310938744A CN117135029A CN 117135029 A CN117135029 A CN 117135029A CN 202310938744 A CN202310938744 A CN 202310938744A CN 117135029 A CN117135029 A CN 117135029A
- Authority
- CN
- China
- Prior art keywords
- target
- network
- ncsi
- network card
- band controller
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004891 communication Methods 0.000 title claims abstract description 511
- 238000003672 processing method Methods 0.000 title abstract description 18
- 230000002159 abnormal effect Effects 0.000 claims abstract description 233
- 230000005856 abnormality Effects 0.000 claims abstract description 221
- 238000000034 method Methods 0.000 claims abstract description 119
- 230000005540 biological transmission Effects 0.000 claims description 72
- 230000004048 modification Effects 0.000 claims description 59
- 238000012986 modification Methods 0.000 claims description 59
- 238000012544 monitoring process Methods 0.000 claims description 25
- 230000008439 repair process Effects 0.000 claims description 17
- 230000004044 response Effects 0.000 claims description 7
- 230000009286 beneficial effect Effects 0.000 abstract description 22
- 238000011084 recovery Methods 0.000 abstract description 15
- 238000004904 shortening Methods 0.000 abstract description 6
- 230000006870 function Effects 0.000 description 84
- 230000002776 aggregation Effects 0.000 description 61
- 238000004220 aggregation Methods 0.000 description 61
- 230000008569 process Effects 0.000 description 42
- 238000012545 processing Methods 0.000 description 31
- 238000013507 mapping Methods 0.000 description 26
- 238000007726 management method Methods 0.000 description 20
- 230000008030 elimination Effects 0.000 description 10
- 238000003379 elimination reaction Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 9
- 230000015654 memory Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 230000000593 degrading effect Effects 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- GOLXNESZZPUPJE-UHFFFAOYSA-N spiromesifen Chemical compound CC1=CC(C)=CC(C)=C1C(C(O1)=O)=C(OC(=O)CC(C)(C)C)C11CCCC1 GOLXNESZZPUPJE-UHFFFAOYSA-N 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 102100035373 Cyclin-D-binding Myb-like transcription factor 1 Human genes 0.000 description 1
- 101000804518 Homo sapiens Cyclin-D-binding Myb-like transcription factor 1 Proteins 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0813—Configuration setting characterised by the conditions triggering a change of settings
- H04L41/082—Configuration setting characterised by the conditions triggering a change of settings the condition being updates or upgrades of network functionality
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/50—Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Small-Scale Networks (AREA)
Abstract
本申请提供了一种通信故障处理方法、系统及设备,涉及通信技术领域。该方法中,带外控制器与网卡连接,网卡的目标网口用于传输带外控制器与外部网络的数据报文。带外控制器通过主动获取能够指示带外控制器与外部网络的通信状态的目标参数,实现监控带外控制器与外部网络的通信状态是否异常。若目标参数指示通信状态异常,带外控制器主动向网卡发送目标参数所对应的目标命令,并指示网卡执行目标命令,以使通信状态恢复为正常。由于带外控制器能够主动监测通信状态,并在通信状态异常时主动向网卡发送用于修复通信状态异常的目标命令,实现自动恢复通信状态为正常,这样,就无需人工参与修复通信状态异常,有助于降低人工成本以及缩短恢复周期。
Description
本申请是分案申请,原申请的申请号是202211202680.6,原申请日是2022年09月29日,原申请的全部内容通过引用结合在本申请中。
技术领域
本申请涉及计算机设备的通信技术领域,尤其涉及一种通信故障处理方法、系统及设备。
背景技术
随着网卡的不断升级,相关技术中提出网络控制器边带接口(networkcontroller sideband interface,NCSI)网卡,NCSI网卡可以同时为中央处理器CPU和带外控制器提供与外部网络通信的网口,这样,带外控制器就可以复用CPU的网卡,实现与外部网络进行通信,不必再另外配置单独的网卡。然而,若NCSI网卡的固件程序发生重启、升级、降级或修改配置等事件,带外控制器会出现网络断连且无法自动恢复的问题。
目前,在带外控制器出现网络断连的问题时,通常是人工重新进行NCSI网卡与带外控制器之间的网络配置。这样的方式,不仅人工成本极高,而且恢复周期特别长。
发明内容
本申请实施例提供一种通信故障处理方法、系统及设备,有助于降低人工成本以及缩短恢复周期。
为达到上述目的,本申请的实施例采用如下技术方案:
第一方面,提供了一种通信故障处理方法,用于服务器,服务器包括网卡和与网卡连接的带外控制器,方法由带外控制器执行;该方法包括:获取网卡的目标网口的目标参数;目标网口用于传输带外控制器与外部网络之间的数据报文;目标参数是指示带外控制器与外部网络之间的通信状态的参数;若目标参数指示通信状态为异常,向网卡发送目标参数所对应的目标命令;目标命令用于指示网卡执行目标命令,以使通信状态恢复为正常。
在该方案中,带外控制器与网卡连接,网卡的目标网口用于传输带外控制器与外部网络之间的数据报文。带外控制器通过主动获取能够指示带外控制器与外部网络之间的通信状态的目标参数,实现主动监测带外控制器与外部网络之间的通信状态是否异常。若目标参数指示通信状态异常,带外控制器向网卡发送目标参数所对应的目标命令,并指示网卡执行目标命令,以使通信状态恢复为正常。由于带外控制器能够主动监测通信状态是否异常,并在通信状态异常时,主动向网卡发送用于修复通信状态异常的目标命令,实现自动将通信状态恢复为正常,这样,就无需人工参与修复带外控制器与外部网络之间的通信状态异常,不仅有助于降低人工成本,还有助于缩短恢复周期。
此外,由于向网卡发送的目标命令是由指示通信状态异常目标参数所触发的,因此,有助于提高修复通信状态异常的目标命令与导致通信状态异常的异常原因之间的匹配度,这样,有助于提高目标命令的修复可靠性,进而提高目标命令修复通信状态异常的成功率。另外,由于本申请实施的方案无需要关注导致通信状态异常的场景,也即,网卡的固件程序重启、网卡的固件程序升级、网卡的固件程序降级、修改固件程序的配置、命令时序错误导致的NCSI参数配置错误等场景所导致的通信状态异常,均可使用本申请实施例的进行通信状态恢复,因此,本申请实施例的应用场景非常广泛。并且,由于本申请实施例的方案,不依赖网卡厂商提供的任何命令,因此,对网卡的兼容性也非常好,适用于任意厂商所提供的网卡。
在一种可能的实现方式中,目标参数包括目标网口的链接状态参数,该方法还包括:若链接状态参数所指示的目标网口与外部网络之间的网络控制器边带接口NCSI链接状态为异常状态,确定链接状态参数指示通信状态为异常。
在该实现方式中,目标参数具体包括目标网口的链接状态参数,该链接状态参数是指示目标网口与外部网络之间的NCSI链接状态的参数。通过确定链接状态参数所指示的NCSI链接状态异常时通信状态异常,实现将链接状态参数指示通信状态异常的异常原因确定为NCSI链接状态异常。基于此,若将该异常原因用于确定修复通信状态异常所使用的目标命令,有助于提高修复通信状态异常所使用的目标命令与异常原因之间的匹配度,进而有助于提高目标命令修复通信状态异常的准确性以及可靠性。
另一种可能的实现方式中,带外控制器存储有链接状态参数与网卡初始化命令之间的对应关系;若目标参数指示通信状态为异常,向网卡发送目标参数所对应的目标命令,包括:若链接状态参数指示通信状态为异常,基于对应关系向网卡发送网卡初始化命令;网卡初始化命令用于指示将NCSI链接状态设置为预定义NCSI链接状态,预定义NCSI链接状态指为正常状态。
在该实现方式中,由于链接状态参数指示通信状态异常的异常原因为NCSI链接状态异常,而网卡初始化命令能够指示网卡将NCSI链接状态设置为正常状态,因此,带外控制器预先建立链接状态参数与网卡初始化命令之间的对应关系,并在链接状态参数指示通信状态异常时,向网卡发送网卡初始化命令,提高了用于修复通信状态异常的网卡初始化命令与导致通信状态异常的异常原因(即NCSI链接状态异常)之间的匹配度,这样,有助于保证网卡初始化命令修复通信状态异常的准确性以及可靠性,进而有助于保证消除导致通信状态异常的异常原因,以将通信状态恢复为正常。
另一种可能的实现方式中,网卡初始化命令包括选择网卡命令、清除初始状态命令、启用网口命令、禁用网口网络发送命令、启用网口网络发送命令、启用广播过滤器命令、禁用全局多播筛选器命令、设置局域网标签筛选器命令、启用局域网标签命令和禁用局域网标签命令中的至少一项。
另一种可能的实现方式中,目标参数包括NCSI参数配置信息,该方法还包括:若目标网口为NCSI发送网口,且NCSI参数配置信息指示目标网口的NCSI发送功能未开启,确定NCSI参数配置信息指示通信状态为异常。
在该实现方式中,目标参数包括NCSI参数配置信息,NCSI参数配置信息指示了NCSI发送网口的使能状态。由于目标网口为NCSI发送网口时,目标网口需要发送带外控制器发往外部网络的数据报文,因此,若目标网口为NCSI发送网口,而其NCSI发送功能未开启,则会导致目标网口无法向外部网络发送带外控制器要发往外部网络的数据报文。因此,通过确定目标网口为NCSI发送网口、且NCSI参数配置信息指示目标网口的NCSI发送功能未开启时通信状态异常,实现将NCSI参数配置信息指示通信状态异常的异常原因确定为NCSI发送网口参数配置异常(即目标网口为NCSI发送网口时,NCSI发送功能未开启)。基于此,若将该异常原因用于确定修复通信状态异常所使用的目标命令,有助于提高修复通信状态异常所使用的目标命令与异常原因之间的匹配度,进而有助于提高目标命令修复通信状态异常的准确性以及可靠性。
另一种可能的实现方式中,若目标网口为NCSI发送网口,若目标参数指示通信状态为异常,向网卡发送目标参数所对应的目标命令,包括:若NCSI参数配置信息指示通信状态为异常,向网卡发送NCSI参数配置信息所对应的启用网口命令,启用网口命令用于指示开启目标网口的NCSI发送功能,以使目标网口能够传输带外控制器与外部网络之间的数据报文。
在该实现方式中,由于NCSI参数配置信息指示通信状态异常的异常原因为NCSI发送网口参数配置异常,而启用网口命令能够指示网卡开启目标网口的NCSI发送功能,因此,在确定NCSI参数配置信息指示通信状态异常时,向网卡发送启用网口命令,提高了用于修复通信状态异常的启用网口命令与导致通信状态异常的异常原因(即NCSI发送网口参数配置异常)之间的匹配度,这样,有助于保证启用网口命令修复通信状态异常的准确性以及可靠性,进而有助于保证消除导致通信状态异常的异常原因,以将通信状态恢复为正常。
另一种可能的实现方式中,目标参数包括NCSI参数配置信息,方法还包括:若目标网口为NCSI非发送网口,且NCSI参数配置信息指示目标网口的NCSI发送功能已开启,确定NCSI参数配置信息指示通信状态为异常。
在该实现方式中,目标参数包括NCSI参数配置信息,NCSI参数配置信息指示了NCSI非发送网口的使能状态。由于目标网口为NCSI非发送网口时,目标网口不可以发送带外控制器发往外部网络的数据报文,因此,若目标网口为NCSI非发送网口,而NCSI发送功能已开启,则会导致目标网口向外部网络发送带外控制器要发往外部网络的数据报文,造成通信状态异常。因此,通过确定目标网口为NCSI非发送网口、且NCSI参数配置信息指示目标网口的NCSI发送功能已开启时通信状态异常,实现将NCSI参数配置信息指示通信状态异常的异常原因确定为NCSI非发送网口参数配置异常(即目标网口为NCSI非发送网口时,NCSI发送功能已开启)。基于此,若将该异常原因用于确定修复通信状态异常所使用的目标命令,有助于提高修复通信状态异常所使用的目标命令与异常原因之间的匹配度,进而有助于提高目标命令修复通信状态异常的准确性以及可靠性。
另一种可能的实现方式中,若目标网口为NCSI非发送网口,若目标参数指示通信状态为异常,向网卡发送目标参数所对应的目标命令,包括:若NCSI参数配置信息指示通信状态为异常,向网卡发送NCSI参数配置信息所对应的禁用网口命令,禁用网口命令用于指示关闭目标网口的NCSI发送功能,以禁止目标网口传输带外控制器与外部网络之间的数据报文。
在该实现方式中,由于NCSI参数配置信息指示通信状态异常的异常原因为NCSI非发送网口参数配置异常,而禁用网口命令能够指示网卡关闭目标网口的NCSI发送功能,因此,在确定NCSI参数配置信息指示通信状态异常时,向网卡发送禁用网口命令,提高了用于修复通信状态异常的禁用网口命令与导致通信状态异常的异常原因(即NCSI非发送网口参数配置异常)之间的匹配度,这样,有助于保证禁用网口命令修复通信状态异常的准确性以及可靠性,进而有助于保证消除导致通信状态异常的异常原因,以将通信状态恢复为正常。
另一种可能的实现方式中,目标参数包括NCSI参数配置信息,NCSI参数配置信息指示了网卡所记载的带外控制器的媒体访问控制MAC地址,该方法还包括:若MAC地址与带外控制器的实际MAC地址不同,确定NCSI参数配置信息指示通信状态为异常。
在该实现方式中,目标参数包括NCSI参数配置信息,NCSI参数配置信息指示了MAC地址。由于网卡开启数据报文过滤功能时,会对数据报文中记载的接收端地址(即带外控制器的实际MAC地址)进行验证,因此,若网卡所记载的MAC地址与带外控制器的实际MAC地址不同,则会导致数据报文中记载的接收端地址与网卡所记载的MAC地址不同,此时,网卡会确定验证失败,并过滤掉该数据报文,不会将该数据报文发送给带外控制器。因此,通过确定MAC地址与MAC地址不同时通信状态异常,实现了将实现将NCSI参数配置信息指示通信状态异常的异常原因确定为MAC地址异常(即网卡所记载的带外控制器的MAC地址与带外控制器的实际MAC地址不同)。基于此,若将该异常原因用于确定修复通信状态异常所使用的目标命令,有助于提高修复通信状态异常所使用的目标命令与异常原因之间的匹配度,进而有助于提高目标命令修复通信状态异常的准确性以及可靠性。
另一种可能的实现方式中,在NCSI参数配置信息指示了MAC地址的情况下,若目标参数指示通信状态为异常,向网卡发送目标参数所对应的目标命令,包括:若NCSI参数配置信息指示通信状态为异常,向网卡发送NCSI参数配置信息所对应的第一修改配置命令,第一修改配置命令用于指示将网卡所记载的MAC地址修改为带外控制器实际MAC地址。
在该实现方式中,由于NCSI参数配置信息指示通信状态异常的异常原因为MAC地址异常,而第一修改配置命令能够指示网卡将其所记载的带外控制器的MAC地址修改为带外控制器的实际MAC地址,因此,在确定NCSI参数配置信息指示通信状态异常时,向网卡发送第一修改配置命令,提高了用于修复通信状态异常的第一修改配置命令与导致通信状态异常的异常原因(即MAC地址异常)之间的匹配度,这样,有助于保证第一修改配置命令修复通信状态异常的准确性以及可靠性,进而有助于保证消除导致通信状态异常的异常原因,以将通信状态恢复为正常。
另一种可能的实现方式中,目标参数包括NCSI参数配置信息,NCSI参数配置信息指示了网口所记载的带外控制器的虚拟局域网VLAN标识,该方法还包括:若VLAN标识与带外控制器的实际VLAN标识不同,确定NCSI参数配置信息指示通信状态为异常。
在该实现方式中,目标参数包括NCSI参数配置信息,NCSI参数配置信息指示了VLAN标识。由于网卡开启数据报文过滤功能时,会对数据报文中记载的接收端的VLAN标识(即带外控制器的实际VLAN标识)进行验证,因此,若网卡所记载的VLAN标识与带外控制器的实际VLAN标识不同,则会导致数据报文中记载的接收端的VLAN标识与网卡所记载的VLAN标识不同,此时,网卡会确定验证失败,并过滤掉该数据报文,不会再将该数据报文发送给带外控制器。因此,通过确定VLAN标识与带外控制器的实际VLAN标识不同时通信状态异常,实现将NCSI参数配置信息指示通信状态异常的异常原因确定为VLAN标识异常(即网卡所记载的带外控制器的VLAN标识与带外控制器的实际VLAN标识不同)。基于此,若将该异常原因用于确定修复通信状态异常所使用的目标命令,有助于提高修复通信状态异常所使用的目标命令与异常原因之间的匹配度,进而有助于提高目标命令修复通信状态异常的准确性以及可靠性。
另一种可能的实现方式中,在NCSI参数配置信息指示了VLAN标识的情况下,若目标参数指示通信状态为异常,向网卡发送目标参数所对应的目标命令,包括:若NCSI参数配置信息指示通信状态为异常,向网卡发送NCSI参数配置信息所对应的第二修改配置命令,第二修改配置命令用于指示将网卡所记载的VLAN标识修改为带外控制器的实际VLAN标识。
在该实现方式中,由于NCSI参数配置信息指示通信状态异常的异常原因为VLAN标识异常,而第二修改配置命令能够指示网卡将其所记载的带外控制器的VLAN标识修改为带外控制器的实际VLAN标识,因此,在确定NCSI参数配置信息指示通信状态异常时,向网卡发送第二修改配置命令,提高了用于修复通信状态异常的第二修改配置命令与导致通信状态异常的异常原因(即VLAN标识异常)之间的匹配度,这样,有助于保证第二修改配置命令修复通信状态异常的准确性以及可靠性,进而有助于保证消除导致通信状态异常的异常原因,以将通信状态恢复为正常。
另一种可能的实现方式中,带外控制器中存储有网卡与外部网络之间的目标链路聚合信息,目标链路聚合信息用于指示网卡的NCSI发送网口标识和NCSI接收网口标识;该方法还包括:在通信状态恢复为正常的情况下,若网卡的链路聚合功能已开启、且网卡的当前链路聚合信息所指示的内容与目标链路聚合信息所指示的内容不同,向网卡发送链路聚合命令;链路聚合命令用于指示将NCSI发送网口标识指示的网口设置为网卡的NCSI发送网口,以及将NCSI接收网口标识指示的网口设置为网卡的NCSI接收网口,网卡的NCSI发送网口或网卡的NCSI接收网口为目标网口。
在该实现方式中,带外控制器中存储有网卡与外部网络之间的目标链路聚合信息,在通信状态恢复为正常之后,若网卡的链路聚合功能已开启,且网卡的当前链路聚合信息所指示的内容与目标链路聚合信息所指示的内容不同,带外控制器向网卡发送链路聚合命令,以指示网卡按照目标链路聚合信息设置其与外部网络之间的链路聚合模式。这样,在网卡侧导致通信状态异常的目标操作同时导致链路聚合模式改变时,可以将链路聚合模式恢复成发生通信状态异常前的模式。
另一种可能的实现方式中,目标参数包括目标网口的链接状态参数,链接状态参数是指示带外控制器与外部网络之间的NCSI链接状态的参数,带外控制器存储有链接状态参数与网卡初始化命令之间的对应关系;该方法还包括:若未能成功获取链接状态参数,确定链接状态参数指示通信状态为异常;基于对应关系,向网卡发送网卡初始化命令;网卡初始化命令用于指示将NCSI链接状态设置为预定义NCSI链接状态,预定义NCSI链接状态为正常状态。
在该实现方式中,目标参数包括目标网口的链接状态参数,该链接状态参数是指示目标网口与外部网络之间的NCSI链接状态的参数。通过确定链接状态参数所指示的NCSI链接状态异常时通信状态异常,实现将链接状态参数指示通信状态异常的异常原因确定为NCSI链接状态异常(即获取链接状态参数失败)。基于此,将该异常原因用于确定修复通信状态异常所使用的目标命令,预先建立链接状态参数与网卡初始化命令之间的对应关系,并在确定链接状态参数指示通信状态异常时,向网卡发送网卡初始化命令,提高了用于修复通信状态异常的网卡初始化命令与导致通信状态异常的异常原因(即NCSI链接状态异常)之间的匹配度,这样,有助于保证网卡初始化命令修复通信状态异常的准确性以及可靠性,进而有助于保证消除导致通信状态异常的异常原因,以将通信状态恢复为正常。
另一种可能的实现方式中,获取网卡的目标网口的目标参数,包括:确定网卡支持NCSI协议;获取网卡的目标网口的目标参数。
在该实现方式中,由于支持NCSI协议的网卡的网口才能够传输带外控制器与外部网络之间的数据报文,因此,通过确定网卡支持NCSI协议,可以保证所获取的目标参数指示的是带外控制器与外部网络之间的通信状态。这样,有助于保证带外控制器能够准确监测其与外部网络之间的通信状态,并在目标参数指示通信状态为异常时,及时恢复通信状态为正常。
另一种可能的实现方式中,带外控制器存储有网卡的四元组信息与NCSI协议之间的第一映射关系;该方法还包括:获取网卡的四元组信息;根据网卡的四元组信息以及第一映射关系,确定网卡支持NCSI协议。
在该实现方式中,提供了确定网卡支持NCSI协议的具体实现方式,通过预先存储网卡的四元组信息与NCSI协议之间的第一映射关系,并获取网卡的四元组信息,从而实现根据网卡的四元组信息以及第一映射关系,确定网卡支持NCSI协议,操作简单,方便,难度低。
另一种可能的实现方式中,带外控制器存储有网卡的编码与NCSI协议之间的第二映射关系;该方法还包括:获取网卡的编码;根据网卡的编码以及第二映射关系,确定网卡支持NCSI协议。
在该实现方式中,提供了确定网卡支持NCSI协议的具体实现方式,通过预先存储网卡的编码与NCSI协议之间的第二映射关系,并获取网卡的编码,从而实现根据网卡的编码以及第二映射关系,确定网卡支持NCSI协议,操作简单,方便,难度低。
另一种可能的实现方式中,获取网卡的目标网口的目标参数,包括:按照预设周期,获取网卡的目标网口的目标参数。
在该实现方式中,带外控制器按照预设周期,获取网卡的目标网口的目标参数,从而实现按照预设周期监测带外控制器与外部网络之间的通信状态,这样,就可以通过调整预设周期的时长,实现控制获取目标参数的频率,有助于提高对通信状态监测的及时性,进而有助于及时发现通信状态异常,并在通信状态异常时及时通信状态异常修复,缩短恢复周期。
另一种可能的实现方式中,获取网卡的目标网口的目标参数,包括:接收网卡发送的目标信息,目标信息用于指示确定带外控制器与外部网络之间的通信状态;响应于目标信息,获取网卡的目标网口的目标参数。
在该实现方式中,带外控制器在接收到网卡发送的指示确定通信状态的目标信息后,响应于目标信息,获取网卡的目标网口的目标参数,这样,带外控制器不必为了保证及时发现通信状态异常而频繁获取目标参数,有助于节省带外控制器的运算资源。
第二方面,提供了一种通信故障处理方法,用于服务器,服务器包括网卡和与网卡连接的带外控制器,方法由网卡执行;该方法包括:方法包括:接收带外控制器发送的网卡的目标网口的目标参数所对应的目标命令;其中,目标网口用于传输带外控制器与外部网络之间的数据报文,目标参数是指示带外控制器与外部网络之间的通信状态的参数;目标命令是带外控制器基于目标网口的目标参数,确定带外控制器与外部网络之间的通信状态为异常的情况下发送的;执行目标命令,以使通信状态恢复为正常。
在该方案中,网卡与带外控制器连接,网卡的目标网口用于传输带外控制器与外部网络之间的数据报文,目标网口的目标参数是指示带外控制器与外部网络之间的通信状态的参数。带外控制器通过监测目标参数,实现监测带外控制器与外部网络之间的通信状态是否异常。在带外控制器与外部网络之间的通信状态为异常时,网卡接收带外控制器发送的目标参数所对应的目标命令,并通过执行目标命令,使得带外控制器与外部网络之间的通信状态恢复为正常。由于带外控制器能够主动监测通信状态是否异常,并在通信状态异常时主动向网卡发送用于修复通信状态异常的目标命令,实现自动将通信状态恢复为正常,这样,就无需人工参与修复带外控制器与外部网络之间的通信状态异常,不仅有助于降低人工成本,还有助于缩短恢复周期。
此外,由于向网卡发送的目标命令是由指示通信状态异常目标参数所触发的,因此,有助于提高修复通信状态异常的目标命令与导致通信状态异常的异常原因之间的匹配度,这样,有助于提高目标命令的修复可靠性,进而提高目标命令修复通信状态异常的成功率。另外,由于本申请实施的方案无需要关注导致通信状态异常的场景,也即,网卡的固件程序重启、网卡的固件程序升级、网卡的固件程序降级、修改固件程序的配置、命令时序错误导致的NCSI参数配置错误等场景所导致的通信状态异常,均可使用本申请实施例的进行通信状态恢复,因此,本申请实施例的应用场景非常广泛。并且,由于本申请实施例的方案,不依赖网卡厂商提供的任何命令,因此,对网卡的兼容性也非常好,适用于任意厂商所提供的网卡。
在一种可能的实现方式中,目标参数包括链接状态参数,目标命令包括网卡初始化命令;所述网卡初始化命令用于指示将所述NCSI链接状态设置为预定义NCSI链接状态,预定义NCSI链接状态为正常。
另一种可能的实现方式中,目标参数包括NCSI参数配置信息,若目标网口为NCSI发送网口,目标命令包括启用网口命令;启用网口命令用于指示开启目标网口的NCSI发送功能,以使目标网口能够传输带外控制器与外部网络之间的数据报文。
另一种可能的实现方式中,目标参数包括NCSI参数配置信息,若目标网口为NCSI非发送网口,目标命令包括禁用网口命令;禁用网口命令用于指示关闭目标网口的NCSI发送功能,以禁止目标网口传输带外控制器与外部网络之间的数据报文。
另一种可能的实现方式中,目标参数包括NCSI参数配置信息,NCSI参数配置信息包括网卡所记载的带外控制器的MAC地址,目标命令包括第一修改配置命令;第一修改配置命令用于指示将网卡将所记载的带外控制器的MAC地址修改为带外控制器的实际MAC地址。
另一种可能的实现方式中,目标参数包括NCSI参数配置信息,NCSI参数配置信息还包括网卡所记载的带外控制器的虚拟局域网VLAN标识,目标命令包括第二修改配置命令;第二修改配置命令用于指示将网卡所记载的带外控制器的虚拟局域网VLAN标识修改为带外控制器的实际VLAN标识。
另一种可能的实现方式中,该方法还包括:响应于所执行的目标操作已生效,向带外控制器发送目标信息,目标信息用于指示确定带外控制器与外部网络的通信状态;目标操作包括网卡的固件程序重启、网卡的固件程序升级、网卡的固件程序降级和修改网卡的固件程序的配置中的任一项。
在该实现方式中,由于网卡的固件程序重启、升级、降级和修改网卡的固件程序配置等操作生效后,通常会导致带外控制器与外部网络之间的通信状态异常,因此,在目标操作生效后,网卡主动向带外控制器发送目标信息,以指示带外控制器确定通信状态,这样,有助于带外控制器及时发现通信状态异常,并且不必为了保证及时发现通信状态异常而频繁获取目标参数,有助于节省带外控制器的运算资源。
第三方面,提供了一种通信故障处理装置,该装置包括:用于执行第一方面提供的任意一种方法的功能单元,各个功能单元所执行的动作通过硬件实现或通过硬件执行相应的软件实现。例如,通信故障处理装置可以包括:获取单元和发送单元;获取单元,用于获取网卡的目标网口的目标参数;目标网口用于传输带外控制器与外部网络之间的数据报文;目标参数是指示带外控制器与外部网络的通信状态的参数;发送单元,用于若目标参数指示通信状态为异常,向网卡发送目标参数所对应的目标命令;目标命令用于指示网卡执行目标命令,以使通信状态恢复为正常。
第四方面,提供了一种通信故障处理装置,该装置包括:用于执行第二方面提供的任意一种方法的功能单元,各个功能单元所执行的动作通过硬件实现或通过硬件执行相应的软件实现。例如,通信故障处理装置可以包括:接收单元和执行单元;接收单元,用于接收带外控制器发送的网卡的目标网口的目标参数所对应的目标命令;目标网口用于传输带外控制器与外部网络之间的数据报文,目标参数是指示带外控制器与外部网络之间的通信状态的参数;目标命令是带外控制器基于目标网口的目标参数,确定带外控制器与外部网络之间的通信状态为异常的情况下发送的;执行单元,用于执行目标命令,以使通信状态恢复为正常。
第五方面,提供了一种通信故障处理系统,包括:网卡以及与网卡连接的带外控制器;网卡的目标网口用于传输带外控制器与外部网络之间的数据报文。其中,带外控制器用于执行上述第一方面提供的任意一种方法,网卡用于执行上述第二方面提供的任意一种方法。
第六方面,提供了一种通信故障处理系统,包括:网卡以及与网卡连接的带外控制器;网卡的目标网口用于传输带外控制器与外部网络之间的数据报文。带外控制器,用于获取网卡的目标网口的目标参数;目标网口用于传输带外控制器与外部网络之间的数据报文;目标参数是指示带外控制器与外部网络的通信状态的参数;带外控制器还用于:若目标参数指示通信状态为异常,向网卡发送目标参数所对应的目标命令;目标命令用于指示网卡执行目标命令,以使通信状态恢复为正常;网卡,用于接收带外控制器发送的网卡的目标网口的目标参数所对应的目标命令;网卡还用于:执行目标命令,以使通信状态恢复为正常。
在一种可能的实现方式中,目标参数包括目标网口的链接状态参数,带外控制器还用于:若链接状态参数所指示的目标网口与外部网络之间的网络控制器边带接口NCSI链接状态为异常状态,确定链接状态参数指示通信状态为异常。
另一种可能的实现方式中,带外控制器存储有链接状态参数与网卡初始化命令之间的对应关系;带外控制器具体用于:若链接状态参数指示通信状态为异常,基于对应关系,向网卡发送网卡初始化命令;网卡初始化命令用于指示将NCSI链接状态设置为预定义NCSI链接状态,预定义NCSI链接状态为正常状态;网卡具体用于:接收带外控制器发送的网卡初始化命令,并执行网卡初始化命令,以使链接状态参数所指示的NCSI链接状态恢复为正常状态。
另一种可能的实现方式中,网卡初始化命令包括选择网卡命令、清除初始状态命令、启用网口命令、禁用网口网络发送命令、启用网口网络发送命令、启用广播过滤器命令、禁用全局多播筛选器命令、设置局域网标签筛选器命令、启用局域网标签命令和禁用局域网标签命令中的至少一项。
另一种可能的实现方式中,目标参数包括NCSI参数配置信息,带外控制器还用于:若目标网口为NCSI发送网口,且NCSI参数配置信息指示目标网口的NCSI发送功能未开启,确定NCSI参数配置信息指示通信状态为异常。
另一种可能的实现方式中,若目标网口为NCSI发送网口,带外控制器具体用于:若NCSI参数配置信息指示通信状态为异常,向网卡发送NCSI参数配置信息所对应的启用网口命令,启用网口命令用于指示开启目标网口的NCSI发送功能,以使目标网口能够发送带外控制器与外部网络之间的数据报文。网卡具体用于:接收带外控制器发送的NCSI参数配置信息所对应的启用网口命令,并执行启用网口命令,以使目标网口能够发送带外控制器与外部网络之间的数据报文。
另一种可能的实现方式中,目标参数包括NCSI参数配置信息,带外控制器还用于:若目标网口为NCSI非发送网口,且NCSI参数配置信息指示目标网口的NCSI发送功能已开启,确定NCSI参数配置信息指示通信状态为异常。
另一种可能的实现方式中,若目标网口为NCSI非发送网口,带外控制器具体用于:若NCSI参数配置信息指示通信状态为异常,向网卡发送NCSI参数配置信息所对应的禁用网口命令,禁用网口命令用于指示关闭目标网口的NCSI发送功能,以禁止目标网口发送带外控制器与外部网络之间的数据报文。网卡具体用于:接收带外控制器发送的禁用网口命令,并执行禁用网口命令,以禁止目标网口发送带外控制器与外部网络之间的数据报文。
另一种可能的实现方式中,目标参数包括NCSI参数配置信息,NCSI参数配置信息指示了网卡所记载的带外控制器的媒体访问控制MAC地址,带外控制器还用于:若MAC地址与带外控制器的实际MAC地址不同,确定NCSI参数配置信息指示通信状态为异常。
另一种可能的实现方式中,在NCSI参数配置信息指示了网卡所记载的带外控制器的MAC地址的情况下,带外控制器具体用于:若NCSI参数配置信息指示通信状态为异常,向网卡发送NCSI参数配置信息所对应的第一修改配置命令,第一修改配置命令用于指示将网卡所记载的带外控制器的MAC地址修改为带外控制器的实际MAC地址。网卡具体用于:接收带外控制器发送的NCSI参数配置信息所对应的第一修改配置命令,并执行第一修改配置命令,以将网卡所记载的带外控制器的MAC地址修改为带外控制器的实际MAC地址。
另一种可能的实现方式中,目标参数包括NCSI参数配置信息,NCSI参数配置信息指示了网卡所记载的带外控制器的虚拟局域网VLAN标识,带外控制器还用于:若VLAN标识与带外控制器的实际VLAN标识不同,确定NCSI参数配置信息指示通信状态为异常。
另一种可能的实现方式中,在NCSI参数配置信息指示网卡所记载的带外控制器的VLAN标识的情况下,带外控制器具体用于:若NCSI参数配置信息指示通信状态为异常,向网卡发送NCSI参数配置信息所对应的第二修改配置命令,第二修改配置命令用于指示将网卡所记载的带外控制器的VLAN标识修改为带外控制器的实际VLAN标识。网卡具体用于:接收带外控制器发送的NCSI参数配置信息所对应的第二修改配置命令,并执行第二修改配置命令,以将网卡所记载的带外控制器的VLAN标识修改为带外控制器的实际VLAN标识。
另一种可能的实现方式中,带外控制器中存储有网卡与外部网络之间的目标链路聚合信息,目标链路聚合信息用于指示网卡的NCSI发送网口标识和NCSI接收网口标识;带外控制器还用于:在通信状态恢复为正常的情况下,若网卡的链路聚合功能已开启、且网卡的当前链路聚合信息所指示的内容与目标链路聚合信息所指示的内容不同,向网卡发送链路聚合命令;链路聚合命令用于指示将NCSI发送网口标识指示的网口设置为网卡的NCSI发送网口,以及将NCSI接收网口标识指示的网口设置为网卡的NCSI接收网口,网卡的NCSI发送网口或网卡的NCSI接收网口为目标网口;网卡还用于:接收带外控制器发送的链路聚合命令,并执行链路聚合命令,以将NCSI发送网口标识指示的网口设置为网卡的NCSI发送网口,NCSI接收网口标识指示的网口设置为网卡的NCSI接收网口。
另一种可能的实现方式中,带外控制器存储有链接状态参数与网卡初始化命令之间的对应关系;带外控制器还用于:若未能成功获取链接状态参数,确定链接状态参数指示通信状态为异常;基于对应关系,向网卡发送网卡初始化命令;网卡初始化命令用于指示将NCSI链接状态设置为预定义NCSI链接状态,预定义NCSI链接状态为正常状态。网卡还用于:接收带外控制器发送的网口初始化命令,并执行网卡初始化命令,以使链接状态参数所指示的NCSI链接状态为正常状态。
另一种可能的实现方式中,带外控制器具体用于:若网卡支持NCSI协议,获取网卡的目标网口的目标参数。
另一种可能的实现方式中,带外控制器存储有网卡的四元组信息与NCSI协议之间的第一映射关系;带外控制器还用于:获取网卡的四元组信息;根据网卡的四元组信息以及第一映射关系,确定网卡支持NCSI协议。
另一种可能的实现方式中,带外控制器存储有网卡的编码与NCSI协议之间的第二映射关系;带外控制器还用于:获取网卡的编码;根据网卡的编码以及第二映射关系,确定网卡支持NCSI协议。
另一种可能的实现方式中,带外控制器具体用于:按照预设周期,获取网卡的目标网口的目标参数。
另一种可能的实现方式中,网卡还用于:响应于所执行的目标操作已生效,向带外控制器发送目标信息,目标信息用于指示确定带外控制器与外部网络的通信状态;目标操作包括网卡的固件程序重启、网卡的固件程序升级、网卡的固件程序降级和修改网卡的固件程序的配置中的任一项。带外控制器还用于:接收网卡发送的目标信息;响应于目标信息,获取网卡的目标网口的目标参数。
第七方面,提供了一种计算机设备,包括:包括:处理器和存储器,处理器与存储器连接。存储器用于存储计算机执行指令,处理器执行存储器存储的计算机执行指令,从而实现第一方面提供的任意一种方法,或实现第二方面提供的任意一种方法。
第八方面,提供了一种芯片,该芯片包括:处理器和接口电路;接口电路,用于接收代码指令并传输至处理器;处理器,用于运行代码指令以执行上述第一方面提供的任意一种方法,或执行上述第二方面提供的任意一种方法。
第九方面,提供了一种计算机可读存储介质,存储有计算机执行指令,当计算机执行指令在计算机上运行时,使得计算机执行上述第一方面提供的任意一种方法,或执行上述第二方面提供的任意一种方法。
第十方面,提供了一种计算机程序产品,包括计算机执行指令,当计算机执行指令在计算机上运行时,使得计算机执行上述第一方面提供的任意一种方法,或执行上述第二方面提供的任意一种方法。
其中,第二方面至第十方面中任一种实现方式所带来的技术效果可参见第一方面中不同实现方式所带来的技术效果,此处不再赘述。
附图说明
图1为本申请实施例提供的一种计算机设备的架构图;
图2为本申请实施例提供的一种网卡的通信原理图;
图3为本申请实施例提供的一种通信故障处理方法的流程图;
图4为本申请实施例提供的另一种通信故障处理方法的流程图;
图5为本申请实施例提供的另一种通信故障处理方法的流程图;
图6为本申请实施例提供的另一种通信故障处理方法的流程图;
图7为本申请实施例提供的另一种通信故障处理方法的流程图;
图8为本申请实施例提供的另一种通信故障处理方法的流程图;
图9为本申请实施例提供的一种通信故障处理装置的示意图;
图10为本申请实施例提供的另一种通信故障处理装置的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
其中,在本申请的描述中,除非另有说明,“/”表示前后关联的对象是一种“或”的关系,例如,A/B可以表示A或B;本申请中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况,其中A,B可以是单数或者复数。
并且,在本申请的描述中,除非另有说明,“多个”是指两个或多于两个。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a,b,c可以是单个,也可以是多个。
另外,为了便于清楚描述本申请实施例的技术方案,在本申请的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。同时,在本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念,便于理解。
以下,对本申请实施例涉及的术语进行简要介绍。
网络控制器边带接口(network controller sideband interface,NCSI):是由分布式管理任务组(distributed management task force,DMTF)定义的电气接口和协议。NCSI协议允许将带外控制器连接到计算机设备中的一个或多个网络接口卡(networkinterface card,NIS)上,简称网卡,以实现对带外控制器的管理。网卡除了常规通信,还允许带外控制器使用网卡的网口进行通信。
链路聚合控制协议(link aggregation control protocol,LACP):提供了一种用于控制多个物理链路捆绑在一起以形成单个逻辑链路的方法。LACP允许网卡通过将LACP分组发送到它们的对等设备(也实现LACP的直接连接设备)来协商链路的自动绑定。
简化媒体独立接口(reduced media independent interface,RMII):是一种旨在减少将物理层(physical layer,PHY)连接到媒体访问控制器(media access control,MAC)所需的信号数量的标准。
高速串行计算机扩展总线标准(peripheral component interconnect express,PCIE):属于高速串行点对点双通道高带宽传输,所连接的设备分配独享通道带宽,不共享总线带宽。
以下,对本申请实施例的应用场景进行示例性介绍。
为了保证计算机设备的稳定运行,计算机设备配置有带外控制器,负责计算机设备的硬件状态管理、操作系统管理、健康状态管理、功耗管理等功能。为了实现这些功能,带外控制器会监测计算机设备的各个组件的状态,具体来说,就是获取各个组件的状态数据,并通过监控状态数据的变化,以实现对各个组件的状态的监控。
用户可以在局域网内管理带外控制器上的监控数据,或者,也可以使用外部网络远程管理带外控制器上的监控数据,例如,通过远程管理控制台远程监控带外控制器上的监控数据。
在用户使用外部网络远程管理带外控制器时,需要建立带外控制器与外网之间的通信连接,通常是使用能够与外网通信的网卡实现。具体实现时,带外控制器与网卡连接,网卡的网口与外网连接,从而实现带外控制器与外部网络之间的数据报文的传输。
随着网卡的不断升级,相关技术中提出了网络控制器边带接口(networkcontroller sideband interface,NCSI)网卡,NCSI网卡可以同时为中央处理器CPU和带外控制器提供与外部网络通信的网口,这样,带外控制器就可以复用CPU的网卡,实现与外部网络进行通信,不必再另外配置单独的网卡。
然而,若NCSI网卡的固件程序发生重启、升级、降级或修改配置等事件,且升级、降级或修改配置等操作生效,带外控制器会出现通信故障(如网络断连)且无法自动恢复的问题。为了重新恢复带外控制器与外部网络之间的通信,通常是人工重新进行NCSI网卡与带外控制器之间的网络配置。这样的方式,不仅人工成本极高,而且恢复周期特别长。
有鉴于此,本申请实施例提出了一种通信故障处理方法,带外控制器与网卡连接,网卡的目标网口用于传输带外控制器与外部网络之间的数据报文。带外控制器通过主动获取能够指示带外控制器与外部网络之间的通信状态的目标参数,实现主动监测带外控制器与外部网络之间的通信状态是否异常。若目标参数指示通信状态异常,带外控制器向网卡发送目标参数所对应的目标命令,并指示网卡执行目标命令,以使通信状态恢复为正常。由于带外控制器能够主动监测通信状态是否异常,并在通信状态异常时主动向网卡发送用于修复通信状态异常的目标命令,实现自动将通信状态恢复为正常,这样,就无需人工参与修复带外控制器与外部网络之间的通信状态异常,不仅有助于降低人工成本,还有助于缩短恢复周期。
其次,对本申请实施例的系统架构进行示例性介绍。
如图1所示,为计算机设备的系统架构图。该计算机设备包括中央处理器CPU、网卡、带外控制器(也可以称为带外管理芯片)。其中,网卡通过第一总线(如PCIE总线)与CPU连接,并通过第二总线(如RMII总线)与带外控制器连接。网卡包括至少一个网口(图中未示出),网卡通过该至少一个网口与外部网络通信。
其中,网卡支持NCSI协议。在网卡支持NCSI协议的情况下,网卡的至少一个网口中的任意一个网口均可以作为传输带外控制器与外部网络之间的数据报文的网口。
其中,带外控制器可以通过专用的数据通道对计算机设备进行远程维护和管理,该带外控制器是完全独立于计算机设备的操作系统之外,可以通过计算机设备的带外管理接口与CPU中的基本输入输出系统(basic input output system,处理器固件)和OS(或OS管理单元)进行通信。
示例性的,带外控制器可以包括计算机设备外部的监控管理单元、处理器外的管理芯片中的管理系统、计算机设备基板管理单元(baseboard management controller,BMC)、系统管理模块(system management mode,SMM)等。需要说明的,本申请实施例对带外控制器的具体形式并不限定,以上仅为示例性说明。在下述实施例中,仅以带外控制器包括BMC为例进行说明。
在一些实施例中,计算机设备包括多个网卡。带外控制器与多个网卡连接,从而实现分别与多个网卡的多个网口连接。基于此,带外控制器可以使用多个网口中的任意一个网口与外部网络进行通信。
需要说明的,在带外控制器与多个网卡连接时,下述实施例中网卡可以是多个网卡中的任意一个网卡。
如图2所示,为带外控制器、网卡以及外部网络的通信原理图。
其中,带外控制器与网卡之间传输的数据主要包括带外控制器发往外部网络的数据报文以及带外控制器发往网卡的NCSI命令报文。以下,对这两种数据的发送过程进行简要介绍。
带外控制器向外部网络发送第一数据报文过程包括:带外控制器的发送端口将第一数据报文传输至带外控制器的NCSI媒体访问控制器,该NCSI媒体访问控制器通过第二总线向网卡发送第一数据报文。网卡的NCSI媒体访问控制器接收第二总线传输的第一数据报文,并将第一数据报文传输至网卡与带外控制器之间的接收端口。该接收端口将第一数据报文传输至网卡与外部网络之间的发送端口,该发送端口将第一数据报文传输至负责网卡与外部网络之间通信的媒体访问控制器,该媒体访问控制器将第一数据报文传输至网卡的物理层,由网卡的物理层将第一数据报文发送至外部网络,例如,发送至远程管理控制台。
带外控制器接收外部网络发送的第二数据报文的过程包括:网卡的物理层接收外部网络发送的第二数据报文,并将第二数据报文传输至媒体访问控制器,该媒体访问控制器将第二数据报文传输至网卡的接收端口。接收端口将第二数据报文传输至网卡与带外控制器之间的发送端口,发送端口将第二数据报文传输网卡的NCSI媒体访问控制器,该媒体访问控制器通过第二总线向网卡发送第二数据报文。带外控制器的NCSI媒体访问控制器接收到第二数据报文后,将第二数据报文传输至带外控制器的接收端口。
在一些实施例中,网卡可以开启数据报文过滤功能。这样,网卡的接收端口在接收到外部网络发往带外控制器的第二数据报文后,可以先对该第二数据报文进行过滤,再传输至网卡与带外控制器之间的发送端口。例如,可以是基于第二数据报文中的MAC地址和/或VLAN标识,对第二数据报文进行过滤。具体实现过程将在后续实施例中进行说明,此处不再细述。
带外控制器向网卡发送NCSI命令报文的过程包括:带外控制器的发送端口将NCSI命令报文传输至带外控制器的NCSI媒体访问控制器,该媒体访问控制器通过第二总线向网卡发送NCSI命令报文。网卡的NCSI媒体访问控制器接收第二总线传输的NCSI命令报文,并将NCSI命令报文传输至网卡与带外控制器之间的接收端口,这样,就完成了NCSI命令报文的接收。网卡接收到NCSI命令报文后,对该NCSI命令报文进行处理,并向带外控制器返回NCSI响应数据报文。在一些实施例中,网卡还可以主动向带外控制器发送通知报文,例如,在网卡执行的目标操作生效后,网卡柱形向带外控制器发送通知报文。
可选地,带外控制器包括NCSI协议检测模块、NCSI链接状态获取单元、NCSI参数配置获取单元、NCSI状态判断模块以及NCSI异常处理模块。
其中,NCSI协议检测模块,用于检测计算机设备上的所有网口的全部物理网口是否支持NCSI协议,并将支持NCSI协议的网口纳入监测范围。
NCSI链接状态获取单元,用于获取网卡的网口的链接状态参数。
NCSI参数配置获取单元,用于获取网卡的网口的NCSI参数配置信息。
NCSI状态判断模块,用于判断链接状态参数是否异常,若判断结果为是,则记录异常原因为NCSI链接状态异常。否则,进一步判断NCSI参数配置信息是否异常。
判断NCSI参数配置信息是否异常时,包括:判断当前监测的网口是否为NCSI发送网口,若判断结果为是,则检查NCSI参数配置信息是否符合NCSI发送网口的要求(即NCSI发送功能是否开启),若不符合(即未开启),则记录异常原因为NCSI发送网口参数配置异常;如果判断结果为否,则检查NCSI参数配置信息是否符合NCSI非发送网口的要求(即NCSI发送功能是否开启),如若不符合(即已开启),则记录异常原因为NCSI非发送网口参数配置异常。
NCSI异常处理模块,用于根据NCSI状态判断模块所记录的NCSI网口的异常原因,采取异常原因所对应的命令恢复带外控制器与外部网络之间的通信状态。如果异常原因是NCSI链接状态异常,则采用网卡初始化命令,重新初始化网口所在网卡的NCSI状态以及重新激活网口。如果异常原因是NCSI发送网口参数配置异常,则采用启用网口命令,开启网口的NCSI发送功能,使得网口能够发送带外控制器发往外部网络的数据报文。如果异常原因是NCSI非发送网口参数配置异常,则采用禁用网口命令,关闭网口的NCSI发送功能,以禁止网口发送带外控制器发往外部网络的数据报文。
此外,NCSI异常处理模块还用于,根据异常处理前的链路聚合模式,如Bond4模式,对网卡的进行链路聚合模式的恢复。由于,设置网卡的链路聚合模式时,带外控制器会记录当前设置的目标链路聚合信息。当通信状态恢复正常成后,NCSI异常处理模块检查网卡的链路聚合功能是否,如果已开启,且网卡的当前链路聚合信息所指示的内容与目标链路聚合信息所指示的内容不同,则向网卡发送链路聚合命令,以将网卡的链路聚合模式恢复至通信状态异常之前的模式。
需要说明的,本申请实施例描述的系统架构以及应用场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着系统架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
为了便于理解,以下结合附图对本申请提供的通信故障处理方法进行示例性介绍,该通信故障处理方法适用于图3所示的系统架构。
本申请以下实施例将分成五个部分对通信故障处理方法的方案进行示例性介绍。
第一部分,结合图3介绍带外控制器通过监测网卡的目标网口的目标参数,实现监测及修复带外控制器与外部网络之间的通信状态异常的过程。
第二部分,结合图4介绍了第一部分中的目标参数包括链接状态参数时,带外控制器监测及修复带外控制器与外部网络之间的通信状态异常的过程。
第三部分,结合图5介绍了第一部分中的目标参数包括NCSI参数配置信息,且该NCSI参数配置信息指示NCSI发送网口的NCSI发送功能未开启时,带外控制器监测及修复带外控制器与外部网络之间的通信状态异常的过程。
第四部分,结合图6介绍了第一部分中的目标参数包括NCSI参数配置信息,且该NCSI参数配置信息指示NCSI非发送网口的NCSI发送功能已开启时,带外控制器监测及修复带外控制器与外部网络之间的通信状态异常的过程。
第五部分,结合图7介绍了第一部分中的目标参数包括NCSI参数配置信息,且该NCSI参数配置信息指示网卡所记载的带外控制器的MAC地址时,带外控制器监测及修复带外控制器与外部网络之间的通信状态异常的过程。
第六部分,结合图8介绍了第一部分中的目标参数包括NCSI参数配置信息,且该NCSI参数配置信息包括指示网卡所记载的带外控制器的VLAN标识时,带外控制器监测及修复带外控制器与外部网络之间的通信状态异常的过程。
以下,为本本申请实施例的第一部分,将结合图3介绍带外控制器通过监测网卡的目标网口的目标参数,实现监测及修复带外控制器与外部网络之间的通信状态异常的过程。
图3是根据一示例性实施例示出的一种通信故障处理方法的流程图。示例性的,该方法包括S301-S305。
S301:带外控制器获取网卡的目标网口的目标参数。
其中,目标网口用于传输带外控制器与外部网络之间的数据报文。传输带外控制器与外部网络之间的数据报文包括发送带外控制器发往外部网络的数据报文和/或接收外部网络发往带外控制器的数据报文。
需要说明的,在计算机设备包括一个网卡时,该一个网卡为支持NCSI协议的网卡,且该一个网卡用于为带外控制器与外部网络之间的通信提供目标网口。在计算机设备包括多个网卡的情况下,多个网卡中包括至少一个支持NCSI协议的网卡,其中,支持NCSI协议的网卡用于为带外控制器与外部网络之间的通信提供目标网口。
其中,目标参数是指示带外控制器与外部网络之间的通信状态的参数。目标参数的值是网卡基于目标网口的NCSI配置状态确定的。
由于目标网口的NCSI配置状态异常时,带外控制器与外部网络之间的通信状态异常,而目标参数的值基于目标网口的NCSI配置状态确定的,因此,目标参数能够指示带外控制器与外部网络之间的通信状态。此外,NCSI配置状态与带外控制器与外部网络之间的通信状态相关,若NCSI配置状态异常,则通信状态异常。反之,通信状态正常。
在一些实施例中,带外控制器向网卡发送命令报文,该命令报文包括网卡的标识和目标网口的标识。该命令报文用于指示获取目标网口的目标参数,例如,可以是通过命令报文的类型标识指示该命令报文是用于获取目标参数的。网卡在接收到带外控制器发送的命令报文后,基于命令报文的类型以及目标网口的标识,向带外控制器返回目标网口的目标参数。
可选地,在执行S301之前,该方法还包括:确定网卡支持NCSI协议。
由于支持NCSI协议的网卡才可以作为带外控制器与外部网络通信的网卡,因此,在执行S301之前,确定网卡支持NCSI协议,有助于保证当前监测的网卡是带外控制器与外部网络进行通信的网卡,进而可以避免由于监测了其他网卡,导致无法及时监测到带外控制器与外部网络之间的通信状态异常。
对于如何确定网卡支持NCSI协议,包括多种实现方式,以下通过方式1至方式2进行示例性说明。
方式1:根据网卡的四元组信息,确定网卡支持NCSI协议。
可选地,四元组信息包括厂商标识、网卡标识、扩展厂商标识和扩展网卡标识。
其中,厂商标识用于指示生产网卡的厂商的标识。四元组信息为网卡出厂时配置的。
可选地,带外控制器存储有网卡的四元组信息与NCSI协议之间的第一映射关系。该第一映射关系指示了四元组信息所属的网卡支持NCSI协议或不支持NCSI协议。
在一些实施例中,带外控制器获取网卡的四元组信息,例如,可以通过向网卡发送第一命令报文,该第一命令报文的类型标识指示该第一命令报文是用于获取网卡的四元组信息的报文,基于该第一命令报文,网卡向带外控制器返回网卡的四元组信息。带外控制器接收到网卡的四元组信息后,根据该四元组信息以及第一映射关系,确定网卡支持NCSI协议。
方式2:根据网卡的编码,确定网卡支持NCSI协议。
其中,网卡的编码与网卡具有一一对应的关系,不同的网卡具有不同的编码。
在一些实施例中,网卡的编码是网卡出厂后,由使用网卡的用户,为网卡配置的。
可选地,带外控制器存储有网卡的编码与NCSI协议之间的第二映射关系。该第二映射关系指示了编码所属的网口支持NCSI协议或不支持NCSI协议。
在一些实施例中,带外控制器获取网卡的编码,例如,可以通过向卡发送第二命令报文,该第二命令报文的类型标识指示该第二命令报文是用于获取网卡的编码的报文,基于该第二命令报文,网卡向带外控制器返回网卡的编码。带外控制器接收网卡的编码后,根据该编码以及第二映射关系,确定网卡支持NCSI协议。
需要说明的,对于配置有四元组信息的网卡,如PCI E网卡,可以基于上述方式1确定网卡支持NCSI协议,或者,也可以基于上述方式2确定网卡支持NCSI协议。对于未配置四元组信息的网卡,则可以基于上述方式2确定网卡支持NCSI协议。
另外,由于相同厂商的同一型号的网卡具有相同的四元组信息,因此,为了保证确定结果的准确性,对配置有四元组信息的网卡,在基于网卡的四元组信息以及第一映射关系,确定网卡支持NCS I协议之后,可以再基于网卡的编码以及第二映射关系,确定网卡是否支持NCSI协议,以保证确定结果的准确性。
可选地,S301包括多种实现方式,以下通过两种可能的实现方式进行示例性说明。
在一种可能的实现方式中,S301包括:按照预设周期,获取网卡的目标网口的目标参数。
本申请实施例对预设周期的具体时长不做限制,可以根据实际情况进行设置。
该实现方式中,带外控制器按照预设周期,获取网卡的目标网口的目标参数,从而实现按照预设周期监测带外控制器与外部网络之间的通信状态,这样,就可以通过调整预设周期的时长,实现控制获取目标参数的频率,有助于提高对通信状态监测的及时性,进而有助于及时发现通信状态异常,并在通信状态异常时及时进行通信状态异常修复,缩短恢复周期。
在另一种可能的实现方式中,S301包括:
步骤一:接收网卡发送的目标信息。
其中,目标信息用于指示确定带外控制器与外部网络之间的通信状态。
在一些实施例中,网卡执行的目标操作生效后,响应于所执行的目标操作已生效,向带外控制器发送目标信息,以指示带外控制器确定带外控制器与外部网络之间的通信状态。其中,目标操作包括网卡的固件程序重启、网卡的固件程序升级、网卡的固件程序降级和修改网卡的固件程序的配置中的任一项。
步骤二:响应于目标信息,获取网卡的目标网口的目标参数。
在一些实施例中,带外控制器接收到网卡发送的目标信息后,则获取网卡的目标网口的目标参数,以根据目标参数确定带外控制器与外部网络之间的通信状态。
在该实现方式中,带外控制器在接收到网卡发送的指示确定通信状态的目标信息后,响应于目标信息,获取网卡的目标网口的目标参数,这样,带外控制器不必为了保证及时发现通信状态异常而频繁获取目标参数,有助于节省带外控制器的运算资源。
S302:带外控制器判断目标参数所指示的通信状态是否异常。
若判断结果为是,则执行S303。若判断结果为否,则结束。
可选地,带外控制器记载有目标参数的目标值,目标值所指示的通信状态为正常。
在一些实施例中,带外控制器根据目标参数的值,确定目标参数所指示的通信状态是否异常。示例性的,若带外控制器从网卡获取的目标参数的值与带外控制器所记载的目标值不同,则确定目标参数指示通信状态为异常,反之,则确定通信状态为正常。
由于目标参数指示通信状态异常是由于NCSI配置状态异常所导致的。因此,根据目标参数确定通信状态异常,可以实现确定通信状态异常的异常原因为目标参数所指示的NCSI配置状态异常。目标参数所指示的NCSI配置状态,是指用于确定目标参数的值的NCSI配置状态。
S303:带外控制器向网卡发送目标参数所对应的目标命令。
其中,目标命令用于指示网卡执行目标命令,以使通信状态恢复为正常。
可选地,带外控制器存储有目标参数与目标命令之间的目标对应关系。
其中,该目标对应关系指示了目标参数指示通信状态异常时所需使用的修复命令为目标命令,也即,指示了目标参数所指示的NCSI配置状态异常时使用目标命令进行修复。
由于目标命令是用于修复目标参数所对应的NCSI配置状态异常时所需使用的修复命令,也即,是修复导致通信状态异常的异常原因所需使用的修复命令,提高了目标命令修复通信状态异常的可靠性,进而有助于提高目标命令修复通信状态异常的成功率。
在一些实施例中,带外控制器确定目标参数指示通常状态异常后,根据目标参数以及目标对应关系,通过RMII总线向网卡发送修复通信状态异常所需使用的目标命令。
S304:网卡接收带外控制器发送的目标参数所对应的目标命令。
在一些实施例中,网卡通过RMII总线接收带外控制器发送的目标命令。网卡接收到目标后,通过RMII总线向带外控制器返回应答,以通知带外控制器,网卡已收到目标命令。
S305:网卡执行目标命令,以使通信状态恢复为正常。
在一些实施例中,网卡成功执行目标命令之后,向带外控制器发送通知,以通知带外控制器,网卡已成功执行目标命令,通信状态已恢复正常。
可选地,带外控制器中存储有网卡与外部网络之间的目标链路聚合信息,目标链路聚合信息用于指示网卡的NCSI发送网口标识和NCSI接收网口标识。
该通信故障处理方法还包括:在通信状态恢复为正常的情况下,若网卡的链路聚合功能已开启、且网卡的当前链路聚合信息所指示的内容与目标链路聚合信息所指示的内容不同,带外控制器向网卡发送链路聚合命令。
其中,链路聚合命令用于指示将NCSI发送网口标识指示的网口设置为网卡的NCSI发送网口,以及将NCSI接收网口标识指示的网口设置为网卡的NCSI接收网口。网卡的NCSI发送网口或网卡的NCSI接收网口为目标网口。
在一些实施例中,带外控制器中存储有网卡的最近一次设置的目标链路聚合信息。在通信状态恢复为正常后,若带外控制器确定网卡的已开启链路聚合功能,且网卡的当前链路聚合信息所指示的内容与目标链路聚合信息所指示的内容不同,则带外控制器向网卡发送链路聚合命令,指示网卡根据目标链路聚合信息设置链路聚合模式。
由于网卡执行的目标操作生效后,不仅会导致带外控制器与外部网络的通信状态为异常,还会导致网卡与外部网络之间的链路聚合模式发生改变。因此,在通信状态恢复为正常之后,带外控制器向网卡发送链路聚合命令,以使网卡恢复到执行目标操作前的链路聚合模式。
可选地,链路聚合命令包括:启用广播过滤器命令(Enable Broadcast Filtercommand)(0x10)/禁用广播过滤器命令(Disable Broadcast Filter command)(0x11)、启用全局多播筛选器命令(Enable Global Multicast Filter command)(0x12)/禁用全局多播筛选器命令(Disable Global Multicast Filter command)(0x13)、启用通道命令(Enable Channel command)(0x03)/禁用通道命令(Disable Channel command)(0x04)。
在一些实施例中,启用广播过滤器命令(0x10)、启用全局多播筛选器命令(0x12)、启用通道命令(0x03)是对NCSI接收网口标识指示的NCSI接收网口的命令。
在一些实施例中,禁用广播过滤器命令(0x11)、禁用全局多播筛选器命令(0x13)、禁用通道命令(0x04)是对NCSI发送网口标识指示的NCSI发送网口的命令。
上述实施例中,带外控制器通过主动获取能够指示带外控制器与外部网络之间的通信状态的目标参数,实现主动监测带外控制器与外部网络之间的通信状态是否异常。若目标参数指示通信状态异常,带外控制器向网卡发送目标参数所对应的目标命令,并指示网卡执行目标命令,以使通信状态恢复为正常。由于带外控制器能够主动监测通信状态是否异常,并在通信状态异常时主动向网卡发送用于修复通信状态异常的目标命令,实现自动将通信状态恢复为正常,这样,就无需人工参与修复带外控制器与外部网络之间的通信状态异常,不仅有助于降低人工成本,还有助于缩短恢复周期。
以上,介绍了本申请实施例的第一部分的实现过程。以下,为本申请实施例的第二部分,将结合图4介绍了第一部分中的目标参数包括链接状态参数时,带外控制器监测及修复带外控制器与外部网络之间的通信状态异常的过程。
图4是根据一示例性实施例示出的一种通信故障处理方法的流程图。示例性的,该方法包括S401-S405。
S401:带外控制器获取网卡的目标网口的链接状态参数。
其中,链接状态参数是指示目标网口与外部网络之间的NCSI链接状态的参数。
NCSI配置状态包括NCSI链接状态。链接状态参数的值是网卡基于目标网口的NCSI链接状态确定的,因此,带外控制器可以根据链接状态参数的值确定目标网口的NCSI链接状态。此外,NCSI链接状态与带外控制器与外部网络之间的通信状态相关,若NCSI链接状态异常,则通信状态异常。反之,通信状态正常。
在一些实施例中,带外控制器向网卡发送获取链接状态命令(Get Link Statuscommand,0x0a),该获取链接状态命令包括网卡的标识和目标网口的标识,获取链接状态命令的报文类型标识用于指示获取链接状态参数。网卡在接收到带外控制器发送的获取链接状态命令后,基于获取链接状态命令的报文类型标识以及目标网口的标识,向带外控制器返回目标网口的链接状态参数。
需要说明的,S401的实现原理与S301的实现原理相同,因此,S401的实现过程和相关说明,可以参考上述S301,此处不再细述。
S402:带外控制器判断链接状态参数所指示的通信状态是否异常。
若判断结果为是,则执行S403。若判断结果为否,则结束。
在一些实施例中,带外控制器根据链接状态参数所指示的NCSI链接状态是否异常,判断链接状态所指示的通信状态是否异常。若链接状态参数所指示的NCSI链接状态异常,则S402的判断结果为是。若链接状态参数所指示NCSI链接状态正常,则S403的判断结果为否。
可选地,若判断结果为是,带外控制器记录通信状态异常的异常原因为目标网口的NCSI链接状态异常。通过确定通信状态异常的异常原因,可以用于后续为通信状态异常确定合适的目标命令,这样,有助于提高修复通信状态异常的目标命令与导致通信状态异常的异常原因之间的匹配度,进而有助于提高目标命令的成功率,以及目标命令用于修复通信状态异常的可靠性。
可选地,带外控制器记载有链接状态参数的第一值,第一值指示NCSI链接状态正常。由于第一值指示NCSI链接状态正常,因此,第一值所指示通信状态为正常。
可选地,带外控制器根据链接状态参数的值,确定链接状态参数所指示的通信状态是否异常。示例性的,若带外控制器从网卡获取的链接状态参数的值与带外控制器所记载的第一值不同,则确定链接状态参数所指示的通信状态为异常,反之,则确定通信状态为正常。
由于链接状态参数指示通信状态异常是由于NCSI链接状态异常所导致的。因此,根据链接状态参数确定通信状态异常,可以实现确定通信状态异常的异常原因为链接状态参数所指示的NCSI链接状态异常。链接状态参所指示的NCSI链接状态,是指用于确定链接状态参数的值的NCSI链接状态。
需要说明的,S402的实现原理与S302的实现原理相同,因此,S402的实现过程和相关说明,可以参考上述S302,此处不再细述。
S403:带外控制器向网卡发送链接状态参数所对应的网卡初始化命令。
其中,网卡初始化命令用于指示网卡将NCSI链接状态设置为预定义NCSI链接状态,预定义NCSI链接状态为正常状态。
可选地,带外控制器存储有链接状态参数与网卡初始化命令之间的第一对应关系。
该第一对应关系指示了链接状态参数指示通信状态异常时所需使用的修复命令为网卡初始化命令,也即,指示了链接状态参数所指示的NCSI链接状态异常时使用网卡初始化命令进行修复。
可选地,带外控制器存储有预定义NCSI链接状态,该预定义NCSI链接状态为正常状态。
在一些实施例中,带外控制器在确定链接状态参数指示通信状态异常,基于第一对应关系,向网卡发送网口初始化命令,指示网卡将NCSI链接状态设置为预定义NCSI链接状态,以使得目标网口与外部网络之间的NCSI链接状态为正常状态,进而使得带外控制器与外部网络之间的通信状态恢复会正常。
可选地,网卡初始化命令包括选择网卡命令(Select Package command,0x01)、清除初始状态命令(Clear Initial State command,0x00)、启用网口命令(Enable Channelcommand,0x03)、禁用网口网络发送命令(Disable Channel Network TX command,0x07)、启用网口网络发送命令(Enable Channel Network TX command,0x06)、启用广播过滤器命令(Enable Broadcast Filter command,0x10)、禁用全局多播筛选器命令(DisableGlobal Multicast Filter command,0x13)、设置局域网标识筛选器命令(Set VLANFilter command,0x0B)、启用局域网标识命令(Enable VLAN command,0x0C)和禁用局域网标识命令(Disable VLAN command,0x0D)中的至少一项。
其中,启用网口网络发送命令适用于网卡的NCSI发送网口,禁用网口网络发送命令适用于网卡的NCSI非发送网口。
需要说明的,S403的实现原理与S303的实现原理相同,因此,S403的实现过程和相关说明,可以参考上述S303,此处不再细述。
S404:网卡接收带外控制器发送的链接状态参数所对应的网卡初始化命令。
需要说明的,S404的实现原理与S304的实现原理相同,因此,S404的实现过程和相关说明,可以参考上述S304,此处不再细述。
S405:网卡执行网卡初始化命令,以使通信状态恢复为正常。
需要说明的,S405的实现原理与S305的实现原理相同,因此,S405的实现过程和相关说明,可以参考上述S305,此处不再细述。
上述实施例中,带外控制器通过主动获取能够指示带外控制器与外部网络之间的通信状态的链接状态参数,该链接状态参数指示了目标网口与外部网络之间的NCSI链接状态,实现主动监测带外控制器与外部网络之间的通信状态是否异常。若链接状态参数指示通信状态为异常,带外控制器向网卡发送链接状态参数所对应的网卡初始化命令,并指示网卡执行网卡初始化命令,以使通信状态恢复为正常。由于带外控制器能够主动监测通信状态是否异常,并在通信状态异常时,主动向网卡发送用于修复通信状态异常的网卡初始化命令,实现自动将通信状态恢复为正常,这样,就无需人工参与修复带外控制器与外部网络之间的通信状态异常,不仅有助于降低人工成本,还有助于缩短恢复周期。
此外,由于链接状态参数指示通信状态异常的异常原因为NCSI链接状态异常,而网卡初始化命令能够指示网卡将NCSI链接状态设置为正常状态,因此,带外控制器根据预先建立链接状态参数与网卡初始化命令之间的对应关系,在链接状态参数指示通信状态异常时,向网卡发送网卡初始化命令,提高了用于修复通信状态异常的网卡初始化命令与导致通信状态异常的异常原因(即NCSI链接状态异常)之间的匹配度,这样,有助于保证网卡初始化命令修复通信状态异常的准确性以及可靠性,进而有助于保证消除导致通信状态异常的异常原因,以将通信状态恢复为正常。
以上,介绍了本申请实施例的第二部分的实现过程。以下,为本申请实施例的第三部分,将结合图5介绍了第一部分中的目标参数包括NCSI参数配置信息,且该NCSI参数配置信息指示NCSI发送网口的NCSI发送功能未开启时,带外控制器监测及修复带外控制器与外部网络之间的通信状态异常的过程。
图5是根据一示例性实施例示出的一种通信故障处理方法的流程图。示例性的,该方法包括S501-S505。
S501:带外控制器获取网卡的目标网口的NCSI参数配置信息。
目标网口为NCSI发送网口。NCSI参数配置信息指示了NCSI发送网口参数配置状态。NCSI发送网口参数配置状态包括NCSI发送功能已开启或NCSI发送功能未开启。
NCSI配置状态包括NCSI发送网口参数配置。NCSI参数配置信息的值是网卡基于NCSI发送网口参数配置状态确定的,因此,带外控制器可以根据NCSI参数配置信息的值确定NCSI发送网口参数配置状态。
可选地,NCSI参数配置信息包括第一参数,第一参数用于指示NCSI发送功能已开启或NCSI发送功能未开启。
在一些实施例中,带外控制器中预先存储有网卡的网口标识与NCSI发送网口之间的第三映射关系。该第三映射关系指示了网口标识所属的网口是否为NCSI发送网口,基于此,带外控制器可以根据目标网口的标识以及第三映射关系,确定目标网口为NCSI发送网口。
在一些实施例中,带外控制器向网卡发送获取参数命令(Get Parameterscommand,0x17),该获取参数命令包括网卡的标识和目标网口的标识,获取参数命令的报文类型标识用于指示获取NCSI参数配置信息。网卡在接收到带外控制器发送的获取参数命令后,基于获取参数命令的报文类型标识以及目标网口的标识,向带外控制器返回目标网口的NCSI参数配置信息。
需要说明的,S501的实现原理与S401的实现原理相同,因此,S501的实现过程和相关说明,可以参考上述S401,此处不再细述。
S502:带外控制器判断NCSI参数配置信息所指示的通信状态是否异常。
若判断结果为是,则执行S503。若判断结果为否,则结束。
在一些实施例中,带外控制器根据NCSI参数配置信息所指示的NCSI发送网口参数配置状态,判断NCSI参数配置信息所指示的通信状态是否异常。若NCSI参数配置信息指示目标网口的NCSI发送功能未开启,则S502的判断结果为是。若NCSI参数配置信息指示目标网口的NCSI发送功能未开启,则S502的判断结果为否。
可选地,若判断结果为是,带外控制器记录通信状态异常的异常原因为NCSI发送网口参数配置异常。通过确定通信状态异常的异常原因,可以用于后续为通信异常确定合适的目标命令,有助于提高修复通信状态异常的目标命令与导致通信状态异常的异常原因之间的匹配度,进而有助于提高目标命令的成功率,以及目标命令用于修复通信状态异常的可靠性。
由于目标网口为NCSI发送网口,因此,目标网口需要发送带外控制器发往外部网络的数据报文,若目标网口的NCSI发送功能未使能,则目标网口无法向外部网络发送带外控制器要发往外部网络的数据报文,因此,若目标网口的NCSI发送功能未使能,则NCSI参数配置异常,NCSI参数配置信息指示通信状态异常。反之,则NCSI参数配置信息指示通信状态正常。
可选地,带外控制器记载有NCSI参数配置信息的第二值,第二值指示目标网口的NCSI发送功能已开启。由于第二值指示目标网口的NCSI发送功能已开启,因此第二值所指示的通信状态为正常。示例性的,若NCSI参数配置信息包括第一参数,则第二值为第一参数的值。
可选地,带外控制器根据NCSI参数配置信息的值,确定NCSI参数配置信息所指示的通信状态是否异常。示例性的,若带外控制器从网卡获取的NCSI参数配置信息的值与带外控制器所记载的第二值不同,则确定NCSI参数配置信息所指示的通信状态为异常,反之,则确定通信状态为正常。例如,第一参数的值与第二值不同时,则确定NCSI参数配置信息所指示的通信状态为异常,反之,则确定通信状态为正常。
由于NCSI参数配置信息指示通信状态异常是由于NCSI发送网口参数配置异常所导致的。因此,根据NCSI参数配置信息确定通信状态异常,可以实现确定通信状态异常的异常原因为NCSI参数配置信息所指示的NCSI发送网口参数配置异常。NCSI参数配置信息所指示的NCSI发送网口参数配置,是指用于确定NCSI参数配置信息的值的NCSI发送网口参数配置状态。
需要说明的,S502的实现原理与S402的实现原理相同,因此,S502的实现过程和相关说明,可以参考上述S402,此处不再细述。
S503:带外控制器向网卡发送NCSI参数配置信息所对应的启用网口命令。
其中,启用网口命令用于指示网卡开启目标网口的NCSI发送功能,以使目标网口能够发送带外控制器发往外部网络的数据报文。
可选地,带外控制器存储有NCSI参数配置信息与启用网口命令之间的第二对应关系。
其中,该第二对应关系指示了NCSI参数配置信息指示通信状态异常时所需使用的修复命令为启用网口命令,也即,指示了有NCSI参数配置信息所指示的NCSI发送网口参数配置异常时使用启用网口命令。
在一些实施例中,带外控制器在确定NCSI参数配置信息指示通信状态异常时,基于第二对应关系,向网卡发送启用网口命令(Enable Channel command,0x03),指示网卡开启目标网口的NCSI发送功能,以使目标网口能够发送带外控制器发往外部网络的数据报文。
需要说明的,S503的实现原理与S403的实现原理相同,因此,S503的实现过程和相关说明,可以参考上述S403,此处不再细述。
S504:网卡接收带外控制器发送的NCSI参数配置信息所对应的启用网口命令。
需要说明的,S504的实现原理与S304的实现原理相同,因此,S504的实现过程和相关说明,可以参考上述S304,此处不再细述。
S505:网卡执行启用网口命令,以使通信状态恢复为正常。
需要说明的,S505的实现原理与S305的实现原理相同,因此,S505的实现过程和相关说明,可以参考上述S305,此处不再细述。
上述实施例中,带外控制器通过主动获取能够指示带外控制器与外部网络之间的通信状态的NCSI参数配置信息,该NCSI参数配置信息指示了目标网口的NCSI发送功能的使能状态,实现主动监测带外控制器与外部网络之间的通信状态是否异常。若NCSI参数配置信息指示通信状态为异常,带外控制器向网卡发送NCSI参数配置信息所对应的启用网口命令,并指示网卡将目标网口的NCSI发送功能开启,以使通信状态恢复为正常。由于带外控制器能够主动监测通信状态是否异常,并在通信状态异常时,主动向网卡发送用于修复通信状态异常的启用网口命令,实现自动将通信状态恢复为正常,这样,就无需人工参与修复带外控制器与外部网络之间的通信状态异常,不仅有助于降低人工成本,以及缩短恢复周期。
此外,由于NCSI参数配置信息指示通信状态异常的异常原因为NCSI发送网口参数配置异常,而启用网口命令能够指示网卡开启目标网口的NCSI发送功能,因此,在确定NCSI参数配置信息指示通信状态异常时,向网卡发送启用网口命令,提高了用于修复通信状态异常的启用网口命令与导致通信状态异常的异常原因(即NCSI发送网口参数配置异常)之间的匹配度,这样,有助于保证启用网口命令修复通信状态异常的准确性以及可靠性,进而有助于保证消除导致通信状态异常的异常原因,以将通信状态恢复为正常。
以上,介绍了本申请实施例中的第三部分的实现过程。以下,为本申请实施例的第四部分,将结合图6介绍了第一部分中的目标参数包括NCSI参数配置信息,且该NCSI参数配置信息指示NCSI非发送网口的NCSI发送功能已开启时,带外控制器监测及修复带外控制器与外部网络之间的通信状态异常的过程。
图6是根据一示例性实施例示出的一种通信故障处理方法的流程图。示例性的,该方法包括S601-S605。
S601:带外控制器获取网卡的目标网口的NCSI参数配置信息。
目标网口为NCSI非发送网口。NCSI参数配置信息指示了NCSI非发送网口参数配置状态。NCSI非发送网口参数配置状态包括NCSI发送功能已开启或NCSI发送功能未开启。
在一些实施例中,NCSI非发送网口包括NCSI接收网口。在另一些实施例中,NCSI非发送网口还可以包括网卡当前未使用的网口。
NCSI配置状态包括NCSI非发送网口参数配置。NCSI参数配置信息的值是网卡基于NCSI非发送网口参数配置状态确定的,因此,带外控制器可以根据NCSI参数配置信息的值确定NCSI非发送网口参数配置状态。
在一些实施例中,带外控制器中预先存储有网卡的网口标识与NCSI发送网口之间的第三映射关系。该第三映射关系指示了网口标识所属的网口是否为NCSI发送网口,基于此,带外控制器可以根据目标网口的标识以及第三映射关系,确定目标网口为NCSI非发送网口。
需要说明的,S601的实现原理与S501的实现原理相同,因此,S601的实现过程和相关说明,可以参考上述S501,此处不再细述。
S602:带外控制器判断NCSI参数配置信息所指示的通信状态是否异常。
若判断结果为是,则执行S603。若判断结果为否,则结束。
在一些实施例中,带外控制器根据NCSI参数配置信息所指示的NCSI非发送网口参数配置状态,判断NCSI参数配置信息所指示的通信状态是否异常。若NCSI参数配置信息指示目标网口的NCSI发送功能已开启,则S602的判断结果为是。若NCSI参数配置信息指示目标网口的NCSI发送功能未开启,则S602的判断结果为否。
可选地,若判断结果为是,带外控制器记录通信状态异常的异常原因为NCSI非发送网口参数配置异常。通过确定通信状态异常的异常原因,可以用于后续为通信异常确定合适的目标命令,有助于提高修复通信状态异常的目标命令与导致通信状态异常的异常原因的匹配度,进而有助于提高目标命令的成功率,以及目标命令用于修复通信状态异常的可靠性。
由于目标网口为NCSI非发送网口,因此,目标网口不需要发送带外控制器发往外部网络的数据报文,若目标网口的NCSI发送功能使能,则目标网口会向外部网络发送带外控制器要发往外部网络的数据报文,因此,若目标网口的NCSI发送功能使能,则NCSI参数配置异常,NCSI参数配置信息指示通信状态异常。反之,NCSI参数配置信息指示通信状态正常。
由于NCSI参数配置信息指示通信状态异常是由于NCSI非发送网口参数配置异常所导致的。因此,根据NCSI参数配置信息确定通信状态异常,可以实现确定通信状态异常的异常原因为NCSI参数配置信息所指示的NCSI非发送网口参数配置异常。NCSI参数配置信息所指示的NCSI发非送网口参数配置,是指用于确定NCSI参数配置信息的值的NCSI非发送网口参数配置状态。
需要说明的,S602的实现原理与S502的实现原理相同,因此,S602的实现过程和相关说明,可以参考上述S502,此处不再细述。
S603:带外控制器向网卡发送NCSI参数配置信息所对应的禁用网口命令。
其中,禁用网口命令用于指示网口关闭目标网口的NCSI发送功能,以禁止目标网口发送带外控制器发往外部网络的数据报文。
可选地,带外控制器存储有NCSI参数配置信息与禁用网口命令之间的第三对应关系。
其中,该第三对应关系指示了NCSI参数配置信息指示通信状态异常时所需使用的修复命令为禁用网口命令,也即,指示了有NCSI参数配置信息所指示的NCSI非发送网口参数配置异常时使用禁用网口命令。
在一些实施例中,带外控制器在确定NCSI参数配置信息指示通信状态异常时,基于第三对应关系,向网卡发送禁用网口命令(Disable Channel command,0x04),指示网卡关闭目标网口的NCSI发送功能,以禁止目标网口能够发送带外控制器发往外部网络的数据报文。
需要说明的,S603的实现原理与S503的实现原理相同,因此,S603的实现过程和相关说明,可以参考上述S503,此处不再细述。
S604:网卡接收带外控制器发送的禁用网口命令。
需要说明的,S604的实现原理与S304的实现原理相同,因此,S604的实现过程和相关说明,可以参考上述S304,此处不再细述。
S605:网卡执行启用网口命令,以使通信状态恢复为正常。
需要说明的,S605的实现原理与S305的实现原理相同,因此,S605的实现过程和相关说明,可以参考上述S305,此处不再细述。
上述实施例中,带外控制器通过主动获取能够指示带外控制器与外部网络之间的通信状态的NCSI参数配置信息,该NCSI参数配置信息指示了目标网口的NCSI发送功能的使能状态,实现主动监测带外控制器与外部网络之间的通信状态是否异常。若NCSI参数配置信息指示通信状态为异常,带外控制器向网卡发送NCSI参数配置信息所对应的禁用网口命令,并指示网卡关闭目标网口的NCSI发送功能,以使通信状态恢复为正常。由于带外控制器能够主动监测通信状态是否异常,并在通信状态异常时主动向网卡发送用于修复通信状态异常的禁用网口命令,实现自动将通信状态恢复为正常,这样,就无需人工参与修复带外控制器与外部网络之间的通信状态异常,不仅有助于降低人工成本,还有助于缩短恢复周期。
此外,由于NCSI参数配置信息指示通信状态异常的异常原因为NCSI非发送网口参数配置异常,而禁用网口命令能够指示网卡关闭目标网口的NCSI发送功能,因此,在确定NCSI参数配置信息指示通信状态异常时,向网卡发送禁用网口命令,提高了用于修复通信状态异常的禁用网口命令与导致通信状态异常的异常原因(即NCSI非发送网口参数配置异常)之间的匹配度,这样,有助于保证禁用网口命令修复通信状态异常的准确性以及可靠性,进而有助于保证消除导致通信状态异常的异常原因,以将通信状态恢复为正常。
以上,介绍了本申请实施例中的第四部分的实现过程。以下,为本申请实施例的第五部分,将结合图7介绍了第一部分中的目标参数包括NCSI参数配置信息,且该NCSI参数配置信息包括网卡所记载的MAC地址时,带外控制器监测及修复带外控制器与外部网络之间的通信状态异常的过程。
图7是根据一示例性实施例示出的一种通信故障处理方法的流程图。示例性的,该方法包括S701-S705。
S701:带外控制器向网卡获取网卡的目标网口的NCSI参数配置信息。
其中,NCSI参数配置信息指示了网卡所记载的带外控制器的媒体访问控制MAC地址。
需要说明的,S701的实现原理与S301的实现原理相同,因此,S701的实现过程和相关说明,可以参考上述S301,此处不再细述。
S702:带外控制器判断NCSI参数配置信息所指示的通信状态是否异常。
若判断结果为是,则执行S703。若判断结果为否,则结束。
在一些实施例中,带外控制器存储有实际MAC地址,该实际MAC地址为带外控制器的正确地址。带外控制器通过判断MAC地址与带外控制器的实际MAC地址是否相同,确定S702的判断结果。若MAC地址与带外控制器的实际MAC地址不相同,则S702的判断结果为是。若MAC地址与带外控制器的实际MAC地址相同,则S702的判断结果为否。
由于带外控制器的实际MAC地址为带外控制器的正确地址,若网卡所记载的MAC地址与带外控制器的实际MAC地址不同,则说明网卡所记载的带外控制器的实际MAC地址是错误的。而网卡开启数据报文过滤功能时,会对数据报文中记载的接收端地址(即带外控制器的实际MAC地址)进行验证,也即,网卡会验证数据报文中记载的接收端地址与网卡所记载的带外控制器的MAC地址是否相同。若网卡所记载的带外控制器MAC地址是错误的,则验证结果会是不相同,网卡则会过滤掉该数据报文,不会将该数据报文发送给带外控制器,因此,若MAC地址与带外控制器的实际MAC地址不同,则NCSI参数配置信息异常,NCSI参数配置信息指示通信状态异常。反之,则NCSI参数配置信息指示通信状态正常。
可选地,若判断结果为是,带外控制器记录通信状态异常的原因为MAC地址异常。通过确定通信状态异常的原因,可以用于后续为通信异常确定合适的修复命令,这样,有助于提高修复通信状态异常的修复命令与导致通信状态异常的直接原因之间的匹配度,进而有助于提高修复命令的成功率,以及修复通信状态异常的可靠性。
需要说明的,S702的实现原理与S602的实现原理相同,因此,S702的实现过程和相关说明,可以参考上述S602,此处不再细述。
S703:带外控制器向网卡发送NCSI参数配置信息所对应的第一修改配置命令。
其中,第一修改配置命令用于指示将网卡所记载的带外控制器的MAC地址修改为带外控制器的实际MAC地址。
可选地,带外控制器存储有NCSI参数配置信息与第一修改配置命令之间的第四对应关系。
其中,该第四对应关系指示了NCSI参数配置信息指示通信状态异常时所需使用的修复命令为第一修改配置命令,也即,指示了有NCSI参数配置信息所指示的MAC地址异常时使用第一修改配置命令。
在一些实施例中,带外控制器在确定NCSI参数配置信息指示通信状态异常时,基于第四对应关系,向网卡发送第一修改配置命令,以将网卡所记载的带外控制器的MAC地址修改为带外控制器的实际MAC地址。
需要说明的,S703的实现原理与S303的实现原理相同,因此,S703的实现过程和相关说明,可以参考上述S303,此处不再细述。
S704:网卡接收带外控制器发送的NCSI参数配置信息所对应的启用网口命令。
需要说明的,S704的实现原理与S304的实现原理相同,因此,S704的实现过程和相关说明,可以参考上述S304,此处不再细述。
S705:网卡执行启用网口命令,以使通信状态恢复为正常。
需要说明的,S705的实现原理与S305的实现原理相同,因此,S705的实现过程和相关说明,可以参考上述S305,此处不再细述。
上述实施例中,带外控制器通过主动获取能够指示带外控制器与外部网络之间的通信状态的NCSI参数配置信息,该NCSI参数配置信息指示了网卡所记载的带外控制器的MAC地址,实现主动监测带外控制器与外部网络之间的通信状态是否异常。若NCSI参数配置信息指示通信状态为异常,带外控制器向网卡发送NCSI参数配置信息所对应的第一修改配置命令,并指示网卡将其所记载的带外控制器的MAC地址修改为带外控制器的实际MAC地址,以使通信状态恢复为正常。由于带外控制器能够主动监测通信状态是否异常,并在通信状态异常时,主动向网卡发送用于修复通信状态异常的第一修改配置命令,实现自动将通信状态恢复为正常,这样,就无需人工参与修复带外控制器与外部网络之间的通信故障,不仅有助于降低人工成本,还有助于缩短恢复周期。
此外,由于NCSI参数配置信息指示通信状态异常的异常原因为MAC地址异常,而第一修改配置命令能够指示网卡将其所记载的带外控制器的MAC地址修改为带外控制器的实际MAC地址,因此,在确定NCSI参数配置信息指示通信状态异常时,向网卡发送第一修改配置命令,提高了用于修复通信状态异常的第一修改配置命令与导致通信状态异常的异常原因(即MAC地址异常)之间的匹配度,这样,有助于保证第一修改配置命令修复通信状态异常的准确性以及可靠性,进而有助于保证消除导致通信状态异常的异常原因,以将通信状态恢复为正常。
以上,介绍了本申请实施例中的第五部分的实现过程。以下,为本申请实施例的第六部分,将结合图8介绍了第一部分中的目标参数包括NCSI参数配置信息,且该NCSI参数配置信息包括网卡所记载的VLAN标识时,带外控制器监测及修复带外控制器与外部网络之间的通信状态异常的过程。
图8是根据一示例性实施例示出的一种通信故障处理方法的流程图。示例性的,该方法包括S801-S805。
S801:带外控制器获取网卡的目标网口的NCSI参数配置信息。
其中,NCSI参数配置信息指示了网卡所记载的带外控制器的虚拟局域网VLAN标识。
需要说明的,S801的实现原理与S701的实现原理相同,因此,S801的实现过程和相关说明,可以参考上述S701,此处不再细述。
S802:带外控制器判断NCSI参数配置信息所指示的通信状态是否异常。
若判断结果为是,则执行S803。若判断结果为否,则结束。
在一些实施例中,带外控制器存储有实际VLAN标识,该实际VLAN标识为带外控制器的正确标识。带外控制器通过判断VLAN标识与带外控制器的实际VLAN标识是否相同,确定S802的判断结果。若VLAN标识与带外控制器的实际VLAN标识不相同,则S802的判断结果为是。若VLAN标识与第二MVLAN标识相同,则S802的判断结果为否。
由于带外控制器的实际VLAN标识为带外控制器的正确标识,若网卡所记载的VLAN标识与带外控制器的实际VLAN标识不同,则说明网卡所记载的VLAN标识是错误的。而网卡开启数据报文过滤功能时,会对数据报文中记载的接收端的VLAN标识(即带外控制器的实际VLAN标识)进行验证,也即,网卡会验证数据报文中的VLAN标识与网卡所记载的带外控制器的VLAN标识是否相同。若网卡所记载的VLAN标识是错误的,则验证结果会是不相同,网卡则会过滤掉该数据报文,不会再将该数据报文发送给带外控制器,因此,若VLAN标识与带外控制器的实际VLAN标识不同,则NCSI参数配置信息异常,NCSI参数配置信息指示通信状态异常。反之,则NCSI参数配置信息指示通信状态正常。
可选地,若判断结果为是,带外控制器记录通信状态异常的异常原因为VLAN标识异常。通过确定通信状态异常的异常原因,可以用于后续为通信异常确定合适的修复命令,这样,有助于提高修复通信状态异常的目标命令与导致通信状态异常的直接原因之间的匹配度,进而有助于提高目标命令的成功率,以及目标命令用于修复通信状态异常的可靠性。
需要说明的,S802的实现原理与S702的实现原理相同,因此,S802的实现过程和相关说明,可以参考上述S702,此处不再细述。
S803:带外控制器向网卡发送NCSI参数配置信息所对应的第二修改配置命令。
其中,第二修改配置命令用于指示将网卡所记载的带外控制器的VLAN标识修改为带外控制器的实际VLAN标识。
可选地,带外控制器存储有NCSI参数配置信息与第二修改配置命令之间的第五对应关系。
其中,该第五对应关系指示了NCSI参数配置信息指示通信状态异常时所需使用的修复命令为第二修改配置命令,也即,指示了有NCSI参数配置信息所指示的VLAN标识异常时使用第二修改配置命令。
在一些实施例中,带外控制器在确定NCSI参数配置信息指示通信状态异常时,基于第五对应关系,向网卡发送第二修改配置命令,以将网卡所记载的带外控制器的VLAN标识修改为带外控制器的实际VLAN标识。
需要说明的,S803的实现原理与S703的实现原理相同,因此,S803的实现过程和相关说明,可以参考上述S703,此处不再细述。
S804:网卡接收带外控制器发送的启用网口命令。
需要说明的,S804的实现原理与S304的实现原理相同,因此,S804的实现过程和相关说明,可以参考上述S304,此处不再细述。
S805:网卡执行启用网口命令,以使通信状态恢复为正常。
需要说明的,S805的实现原理与S305的实现原理相同,因此,S805的实现过程和相关说明,可以参考上述S305,此处不再细述。
上述实施例中,带外控制器通过主动获取能够指示带外控制器与外部网络之间的通信状态的NCSI参数配置信息,该NCSI参数配置信息指示了网卡所记载的带外控制器的VLAN标识,实现主动监测带外控制器与外部网络之间的通信状态是否异常。若NCSI参数配置信息指示通信状态为异常,带外控制器向网卡发送NCSI参数配置信息所对应的第二修改配置命令,并指示网卡将其所记载的带外控制器的VLAN标识修改为带外控制器的实际VLAN标识,以使通信状态恢复为正常。由于带外控制器能够主动监测带外控制器与外部网络之间的通信状态,并在通信状态异常时,主动向网卡发送用于修复通信状态异常的第二修改配置命令,实现自动将通信状态恢复为正常,这样,就无需人工参与修复带外控制器与外部网络之间的通信故障,不仅有助于降低人工成本,还有助于缩短恢复周期。
此外,由于NCSI参数配置信息指示通信状态异常的异常原因为VLAN标识异常,而第二修改配置命令能够指示网卡将其所记载的带外控制器的VLAN标识修改为带外控制器的实际VLAN标识,因此,在确定NCSI参数配置信息指示通信状态异常时,向网卡发送第二修改配置命令,提高了用于修复通信状态异常的第二修改配置命令与导致通信状态异常的异常原因(即VLAN标识异常)之间的匹配度,这样,有助于保证第二修改配置命令修复通信状态异常的准确性以及可靠性,进而有助于保证消除导致通信状态异常的异常原因,以将通信状态恢复为正常。
上述主要从方法的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能,通信故障处理装置包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法,示例性的对通信故障处理装置进行功能模块的划分,例如,通信故障处理装置可以包括对应各个功能划分的各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
示例性的,图9示出了上述实施例中所涉及的通信故障处理装置(记为通信故障处理装置900)的一种可能的结构示意图,该通信故障处理装置900包括获取单元901和发送单元902。获取单元901,用于获取网卡的目标网口的目标参数;目标网口用于传输带外控制器与外部网络之间的数据报文;目标参数是指示带外控制器与外部网络的通信状态的参数。例如,图3所示的S301,图4所示的S401,图5所示的S501,图6所示的S601,图7所示的S701,以及图8所示的S801。发送单元902,用于若目标参数指示通信状态为异常,向网卡发送目标参数所对应的目标命令;目标命令用于指示网卡执行目标命令,以使通信状态恢复为正常。例如,图3所示的S302-S303,图4所示的S402-S403,图5所示的S502-S503,图6所示的S602-S603,图7所示的S702-S703,以及图8所示的S802-S803。
可选地,目标参数包括目标网口的链接状态参数,该装置还包括处理单元903。处理单元903,用于若链接状态参数所指示的目标网口与外部网络之间的网络控制器边带接口NCSI链接状态为异常状态,确定链接状态参数指示通信状态为异常。
可选地,带外控制器存储有链接状态参数与网卡初始化命令之间的对应关系;发送单元902具体用于,若链接状态参数指示通信状态为异常,基于对应关系,向网卡发送网卡初始化命令;网卡初始化命令用于指示将NCSI链接状态设置为预定义NCSI链接状态,预定义NCSI链接状态为正常状态。
可选地,网卡初始化命令包括选择网卡命令、清除初始状态命令、启用网口命令、禁用网口网络发送命令、启用网口网络发送命令、启用广播过滤器命令、禁用全局多播筛选器命令、设置局域网标签筛选器命令、启用局域网标签命令和禁用局域网标签命令中的至少一项。
可选地,目标参数包括NCSI参数配置信息,处理单元903还用于,若目标网口为NCSI发送网口,且NCSI参数配置信息指示目标网口的NCSI发送功能未开启,确定NCSI参数配置信息指示通信状态为异常;或若目标网口为NCSI非发送网口,且NCSI参数配置信息指示目标网口的NCSI发送功能已开启,确定NCSI参数配置信息指示通信状态为异常。
可选地,若目标网口为NCSI发送网口,发送单元902具体用于,若NCSI参数配置信息指示通信状态为异常,向网卡发送启用网口命令;启用网口命令用于指示开启目标网口的NCSI发送功能,以使目标网口能够发送带外控制器与外部网络之间的数据报文;或若目标网口为NCSI非发送网口,发送单元902具体用于,若NCSI参数配置信息指示通信状态为异常,向网卡发送禁用网口命令;禁用网口命令用于指示关闭目标网口的NCSI发送功能,以禁止目标网口发送带外控制器与外部网络之间的数据报文。
可选地,目标参数包括NCSI参数配置信息,NCSI参数配置信息还包括网卡所记载的带外控制器的目标标识,目标标识包括媒体访问控制MAC地址或虚拟局域网VLAN标识,处理单元903还用于:若MAC地址与带外控制器的实际MAC地址不同,确定NCSI参数配置信息所指示的通信状态为异常;或若VLAN标识与带外控制器的实际VLAN标识不同,确定NCSI参数配置信息所指示的通信状态为异常。
可选地,在目标标识包括MAC地址的情况下,发送单元902具体用于:若NCSI参数配置信息指示通信状态为异常,向网卡发送第一修改配置命令,第一修改配置命令用于指示将网卡所记载的带外控制器的MAC地址修改为带外控制器的实际MAC地址;或在目标标识包括VLAN标识的情况下,发送单元902具体用于:若NCSI参数配置信息指示通信状态为异常,向网卡发送第二修改配置命令,第二修改配置命令用于指示将网卡所记载的带外控制器的VLAN标识修改为带外控制器的实际VLAN标识。
可选地,带外控制器中存储有网卡与外部网络之间的目标链路聚合信息,目标链路聚合信息用于指示网卡的NCSI发送网口标识和NCSI接收网口标识;处理单元903还用于:在通信状态恢复为正常的情况下,若网卡的链路聚合功能已开启、且网卡的当前链路聚合信息所指示的内容与目标链路聚合信息所指示的内容不同,向网卡发送链路聚合命令;链路聚合命令用于指示将NCSI发送网口标识指示的网口设置为网卡的NCSI发送网口,以及将NCSI接收网口标识指示的网口设置为网卡的NCSI接收网口,网卡的NCSI发送网口或网卡的NCSI接收网口为目标网口。
关于上述可选方式的具体描述可以参见前述的方法实施例,此处不再赘述。此外,上述提供的任一种通信故障处理装置900的解释以及有益效果的描述均可参考上述对应的方法实施例,不再赘述。
示例性的,图10示出了上述实施例中所涉及的通信故障处理装置(记为通信故障处理装置100)的一种可能的结构示意图,该通信故障处理装置100包括接收单元110和执行单元120。接收单元110,用于接收带外控制器发送的网卡的目标网口的目标参数所对应的目标命令;目标网口用于传输带外控制器与外部网络之间的数据报文,目标参数是指示带外控制器与外部网络之间的通信状态的参数;目标命令是带外控制器基于目标网口的目标参数,确定带外控制器与外部网络之间的通信状态为异常的情况下发送的。例如,图3所示的S304,图4所示的S404,图5所示的S504,图6所示的S604,图7所示的S704,以及图8所示的S804。执行单元120,用于执行目标命令,以使通信状态恢复为正常。例如,图3所示的S305,图4所示的S405,图5所示的S505,图6所示的S605,图7所示的S705,以及图8所示的S805。
可选地,目标参数包括链接状态参数,目标命令包括网卡初始化命令;网卡初始化命令用于指示将链接状态参数所指示的NCSI链接状态设置为预定义NCSI链接状态,预定义NCSI链接状态为正常状态。
可选地,目标参数包括NCSI参数配置信息,若目标网口为NCSI发送网口,目标命令包括启用网口命令;启用网口命令用于指示开启目标网口的NCSI发送功能,以使目标网口能够传输带外控制器与外部网络之间的数据报文。
可选地,目标参数包括NCSI参数配置信息,若目标网口为NCSI非发送网口,目标命令包括禁用网口命令;禁用网口命令用于指示关闭目标网口的NCSI发送功能,以禁止目标网口传输带外控制器与外部网络之间的数据报文。
可选地,目标参数包括NCSI参数配置信息,NCSI参数配置信息包括网卡所记载的带外控制器的MAC地址,目标命令包括第一修改配置命令;第一修改配置命令用于指示将网卡将所记载的带外控制器的MAC地址修改为带外控制器的实际MAC地址。
可选地,目标参数包括NCSI参数配置信息,NCSI参数配置信息还包括网卡所记载的带外控制器的虚拟局域网VLAN标识,目标命令包括第二修改配置命令;第二修改配置命令用于指示将网卡所记载的带外控制器的虚拟局域网VLAN标识修改为带外控制器的实际VLAN标识。
可选地,执行单元120还用于:响应于所执行的目标操作已生效,向带外控制器发送目标信息,目标信息用于指示确定带外控制器与外部网络之间的通信状态;目标操作包括重启、升级、降级和修改配置中的任一项。
关于上述可选方式的具体描述可以参见前述的方法实施例,此处不再赘述。此外,上述提供的任一种通信故障处理装置100的解释以及有益效果的描述均可参考上述对应的方法实施例,不再赘述。
本申请实施例还提供了一种计算机设备,该计算机设备包括处理器和存储器,处理器与存储器连接,存储器存储有计算机执行指令,处理器执行该计算机执行指令时实现上述实施例中的数据处理方法。本申请实施例对计算机设备的具体形式不作任何限制。例如,计算机设备具体可以是终端装置,也可以是网络设备。其中,终端装置可以被称为:终端、用户设备(user equipment,UE)、终端设备、接入终端、用户单元、用户站、移动站、远方站、远程终端、移动设备、用户终端、无线通信设备、用户代理或用户装置等。终端装置具体可以是手机、增强现实(augmented reality,AR)设备、虚拟现实(virtual reality,VR)设备、平板电脑、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)等。网络设备具体可以是服务器等。其中,服务器可以是一个物理或逻辑服务器,也可以是有两个或两个以上分担不同职责的物理或逻辑服务器、相互协同来实现服务器的各项功能。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,当该计算机程序在计算机上运行时,使得该计算机执行上文提供的任一种计算机设备所执行的方法。
关于上述提供的任一种计算机可读存储介质中相关内容的解释及有益效果的描述,均可以参考上述对应的实施例,此处不再赘述。
本申请实施例还提供了一种芯片。该芯片中集成了用于实现上述计算机设备的功能的控制电路和一个或者多个端口。可选的,该芯片支持的功能可以参考上文,此处不再赘述。本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可通过程序来指令相关的硬件完成。所述的程序可以存储于一种计算机可读存储介质中。上述提到的存储介质可以是只读存储器,随机接入存储器等。上述处理单元或处理器可以是中央处理器,通用处理器、特定集成电路(application specific integrated circuit,ASIC)、微处理器(digital signal processor,DSP),现场可编程门阵列(field programmable gatearray,FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。
本申请实施例还提供了一种包含指令的计算机程序产品,当该指令在计算机上运行时,使得计算机执行上述实施例中的任意一种方法。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如SSD)等。
应注意,本申请实施例提供的上述用于存储计算机指令或者计算机程序的器件,例如但不限于,上述存储器、计算机可读存储介质和通信芯片等,均具有非易失性(non-transitory)。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(digitalsubscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
尽管在此结合各实施例对本申请进行了描述,然而,在实施所要求保护的本申请过程中,本领域技术人员通过查看附图、公开内容、以及所附权利要求书,可理解并实现公开实施例的其他变化。在权利要求中,“包括”(comprising)一词不排除其他组成部分或步骤,“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施,但这并不表示这些措施不能组合起来产生良好的效果。
尽管结合具体特征及其实施例对本申请进行了描述,显而易见的,在不脱离本申请的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本申请的示例性说明,且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种通信故障处理方法,其特征在于,所述方法包括:
带外控制器监测与外部网络的通信状态;
若所述通信状态为异常,所述带外控制器向网卡发送修复通信状态异常的目标命令,所述网卡用于提供所述带外控制器和所述外部网路之间的数据传输网口。
2.根据权利要求1所述方法,其特征在于,所述带外控制器监测与外部网络的通信状态,包括:
所述带外控制器获取所述网卡的目标网口的目标参数;所述目标网口为所述带外控制器和所述外部网路之间的数据传输网口,所述目标参数为指示所述带外控制器和所述外部网路的通信状态的参数。
3.根据权利要求2所述方法,其特征在于,所述目标参数包括所述目标网口的链接状态参数,所述若所述通信状态为异常,所述带外控制器向网卡发送修复通信状态异常的目标命令,包括:
若所述链接状态参数指示所述通信状态为异常,所述带外控制器向所述网卡发送网卡初始化命令;所述网卡初始化命令用于指示将所述网卡的链接状态设置为预置的正常状态。
4.根据权利要求2所述方法,其特征在于,所述目标参数包括所述目标网口的网络控制器边带接口NCSI参数配置信息,所述若所述通信状态为异常,所述带外控制器向网卡发送修复通信状态异常的目标命令,包括:
若所述目标网口为NCSI发送网口,且所述NCSI参数配置信息指示所述目标网口的NCSI发送功能未开启,确定所述NCSI参数配置信息指示所述通信状态为异常;
所述带外控制器向所述网卡发送启用网口命令;所述启用网口命令用于指示开启所述目标网口的NCSI发送功能,以使所述目标网口能够传输所述带外控制器与所述外部网络之间的数据报文。
5.根据权利要求2所述方法,其特征在于,所述目标参数包括所述网卡所记载的所述带外控制器的媒体访问控制MAC地址;所述若所述通信状态为异常,所述带外控制器向网卡发送修复通信状态异常的目标命令,包括:
若所述MAC地址和所述带外控制器的实际MAC地址不同,确定所述通信状态为异常;
所述带外控制器向所述网卡发送第一修改配置命令,所述第一修改配置命令用于指示将所述网卡所记载的所述MAC地址修改为所述带外控制器的实际MAC地址。
6.根据权利要求2所述方法,其特征在于,所述目标参数包括所述网卡所记载的所述带外控制器的虚拟局域网VLAN标识;所述若所述通信状态为异常,所述带外控制器向网卡发送修复通信状态异常的目标命令,包括:
若所述VLAN标识和所述带外控制器的实际VLAN标识不同,确定所述通信状态为异常;
所述带外控制器向所述网卡发送第二修改配置命令,所述第二修改配置命令用于指示将所述网卡所记载的所述VLAN标识修改为所述带外控制器的实际VLAN标识。
7.根据权利要求1-6任一项所述方法,其特征在于,所述带外控制器监测与外部网络的通信状态之前,所述方法包括:
接收所述网卡发送的目标信息;
响应于所述目标信息,所述带外控制器监测与外部网络的通信状态。
8.根据权利要求7所述方法,其特征在于,所述目标信息为所述网卡执行目标操作后发送的,所述目标操作包括所述网卡的固件程序重启、所述网卡的固件程序升级、所述网卡的固件程序降级、修改所述网卡的固件程序的配置中的任一项或多项。
9.一种计算机设备,其特征在于,包括:带外控制器和网卡,所述带外控制器通过网卡与外部网络通信,其中,
所述带外控制器,用于:
监测所述带外控制器与所述外部网络的通信状态;
在所述通信状态异常的情况下,向所述网卡发送修复通信状态异常的目标命令;
所述网卡,用于:基于所述目标命令,将所述异常的通信状态恢复为正常。
10.一种带外控制器,其特征在于,所述带外控制器用于执行如权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310938744.7A CN117135029A (zh) | 2022-09-29 | 2022-09-29 | 通信故障处理方法、系统及设备 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310938744.7A CN117135029A (zh) | 2022-09-29 | 2022-09-29 | 通信故障处理方法、系统及设备 |
CN202211202680.6A CN115733729B (zh) | 2022-09-29 | 2022-09-29 | 通信故障处理方法、系统及设备 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211202680.6A Division CN115733729B (zh) | 2022-09-29 | 2022-09-29 | 通信故障处理方法、系统及设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117135029A true CN117135029A (zh) | 2023-11-28 |
Family
ID=85293539
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310938744.7A Pending CN117135029A (zh) | 2022-09-29 | 2022-09-29 | 通信故障处理方法、系统及设备 |
CN202211202680.6A Active CN115733729B (zh) | 2022-09-29 | 2022-09-29 | 通信故障处理方法、系统及设备 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211202680.6A Active CN115733729B (zh) | 2022-09-29 | 2022-09-29 | 通信故障处理方法、系统及设备 |
Country Status (2)
Country | Link |
---|---|
CN (2) | CN117135029A (zh) |
WO (1) | WO2024066449A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117135029A (zh) * | 2022-09-29 | 2023-11-28 | 超聚变数字技术有限公司 | 通信故障处理方法、系统及设备 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10069718B2 (en) * | 2015-11-26 | 2018-09-04 | Dell Products, L.P. | Switching of host network traffic through baseboard management controller (BMC) |
CN106169965A (zh) * | 2016-09-28 | 2016-11-30 | 北京金山安全软件有限公司 | 一种网络修复方法、装置及终端 |
CN107463456A (zh) * | 2017-08-04 | 2017-12-12 | 郑州云海信息技术有限公司 | 一种提升双网卡ncsi管理系统切换效率的系统及方法 |
CN108259246A (zh) * | 2018-01-15 | 2018-07-06 | 郑州云海信息技术有限公司 | 一种支持ncsi信号管理功能自动切换的电路及服务器 |
CN109992318A (zh) * | 2019-04-12 | 2019-07-09 | 苏州浪潮智能科技有限公司 | 一种ncsi参数配置方法、系统、装置及可读存储介质 |
CN110958132A (zh) * | 2019-10-31 | 2020-04-03 | 苏州浪潮智能科技有限公司 | 监控网卡设备的方法、基板管理控制器及网卡设备 |
CN111030851B (zh) * | 2019-11-29 | 2022-12-27 | 苏州浪潮智能科技有限公司 | 一种网络诊断恢复的管理方法、设备及可读介质 |
CN111212451A (zh) * | 2019-12-26 | 2020-05-29 | 曙光信息产业股份有限公司 | 一种切换网络传输通道的方法和装置 |
CN114338493A (zh) * | 2022-02-24 | 2022-04-12 | 苏州浪潮智能科技有限公司 | 基于网络协议栈的ncsi测试方法、系统、装置及存储介质 |
CN117135029A (zh) * | 2022-09-29 | 2023-11-28 | 超聚变数字技术有限公司 | 通信故障处理方法、系统及设备 |
-
2022
- 2022-09-29 CN CN202310938744.7A patent/CN117135029A/zh active Pending
- 2022-09-29 CN CN202211202680.6A patent/CN115733729B/zh active Active
-
2023
- 2023-06-05 WO PCT/CN2023/098348 patent/WO2024066449A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
CN115733729B (zh) | 2023-09-01 |
WO2024066449A1 (zh) | 2024-04-04 |
CN115733729A (zh) | 2023-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10693813B1 (en) | Enabling and disabling links of a networking switch responsive to compute node fitness | |
US10284499B2 (en) | Dedicated control path architecture for systems of devices | |
US9330045B2 (en) | Controller area network (CAN) device and method for controlling CAN traffic | |
US20150009861A1 (en) | Technique for Handling a Status Change in an Interconnect Node | |
US10892913B2 (en) | Gateway, on-vehicle communication system, communication control method and recording medium | |
CN105406998A (zh) | 基于fpga的双冗余千兆以太网介质访问控制器ip核 | |
CN107948063B (zh) | 一种建立聚合链路的方法和接入设备 | |
WO2017215268A1 (zh) | 路由器控制方法、装置及电源适配器、路由器 | |
CN102104531B (zh) | 一种报文处理装置、方法及系统 | |
CN103686854A (zh) | 控制ap的方法和装置 | |
CN108737188B (zh) | 一种网卡故障切换系统 | |
CN111343019B (zh) | 一种重连方法、装置和存储介质 | |
CN105591817B (zh) | 一种协商模式处理方法及智能网络设备 | |
CN115733729B (zh) | 通信故障处理方法、系统及设备 | |
CN113726573B (zh) | 冗余网络通信方法、装置、电子设备及存储介质 | |
KR20170040326A (ko) | 버스 시스템의 가입자국용 통신 제어 장치, 프로그래밍 툴, 그리고 상이한 프로토콜에 따라 통신하는 가입자국들을 포함하는 버스 시스템에서 가입자국들의 프로그래밍 방법 | |
CN115550291B (zh) | 交换机的复位系统及方法、存储介质、电子设备 | |
WO2011150717A1 (zh) | 通讯芯片故障消除实现方法及装置 | |
CN117579811B (zh) | 一种车辆摄像头故障检测与恢复方法、系统及装置 | |
CN104536853B (zh) | 一种保障双控制器存储设备资源连续可用性的装置 | |
CN108667640B (zh) | 通信方法及设备、网络接入系统 | |
US9100336B2 (en) | Method for managing a switch chip port, main control board, switch board, and system | |
CN103401708A (zh) | 一种端口配置方法及装置 | |
CN102811153A (zh) | Vlan状态的协商方法及边缘设备 | |
JP6134720B2 (ja) | 接続方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |