CN114327986A - Frb2 wdt超时时间确定方法、装置、设备及介质 - Google Patents
Frb2 wdt超时时间确定方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN114327986A CN114327986A CN202111641728.9A CN202111641728A CN114327986A CN 114327986 A CN114327986 A CN 114327986A CN 202111641728 A CN202111641728 A CN 202111641728A CN 114327986 A CN114327986 A CN 114327986A
- Authority
- CN
- China
- Prior art keywords
- time
- frb2wdt
- timeout
- server
- starting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 119
- 238000012360 testing method Methods 0.000 claims abstract description 84
- 230000008569 process Effects 0.000 claims abstract description 68
- 238000012423 maintenance Methods 0.000 claims abstract description 9
- 238000004519 manufacturing process Methods 0.000 claims abstract description 9
- 230000006870 function Effects 0.000 claims description 60
- 230000015654 memory Effects 0.000 claims description 48
- 238000012549 training Methods 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 11
- 230000008859 change Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims 1
- 238000010606 normalization Methods 0.000 abstract description 11
- 238000012938 design process Methods 0.000 abstract description 8
- 239000000047 product Substances 0.000 description 38
- 238000012545 processing Methods 0.000 description 9
- 238000013461 design Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000011161 development Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000008263 repair mechanism Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本申请公开了一种FRB2WDT超时时间确定方法、装置、电子设备及可读存储介质。其中,方法包括在服务器启动过程中,获取模式标识信息,并根据启动类型获取FRB2WDT超时时间的推荐值;根据统计的开机自检时间和内置功能耗费时间,确定启动时间;基于模式标识信息,根据启动时间和推荐值确定FRB2WDT超时时间的设定值;其中,模式标识信息用于标识服务器的工作模式,推荐值为通过分析服务器生产测试和/或维护调试过程中每一次成功启动过程中的统计时间数据所生成。本申请可提高BIOS归一化复用设计过程中的FRB2WDT超时时间设定值的准确度,从而使得FRB2在服务器产品中得到更好更合理地使用。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种FRB2 WDT超时时间确定方法、装置、电子设备及可读存储介质。
背景技术
随着信息化时代进程的不断深化,当代大数据社会需要处理的视频、语音、图像等数据量成倍的递增,通信工程、人工智能、互联网等领域业务对数据存储和处理的需求也越来越大,业务的范围和广度也越来越大。服务器系统作为承载业务和应用的关键基础设施,其部署数量和使用规模逐年剧增。随着产品配置、业务范围、客户群体的增加,服务器制造商对于产品的开发效率、成本和质量提出了越来越高的要求,从硬件主板到软件代码,再到固件镜像文件,从两路到四路,再到八路,各种产品规格和配置下的最大程度归一化复用是一种趋势,这样既可以减少重新开发,又可以保持功能和设计的统一,提高产品开发效率和产品质量。BIOS(Basic Input Output System,基本输入输出系统)领域的归一化设计主要是尽量使用一套代码和设置兼容两路、四路和八路等不同的产品,或者是同一个BIOS镜像覆盖产品的不同配置规格,希望借此节省人力、测试等开发成本,同时,由于归一化设计复用同一套功能代码,大部分配置基本都是相同的,可通过对齐设置参数提高版本的质量。
虽然BIOS归一化复用设计可以提高产品质量,降低开发成本,但是,随着客户需求的不断细化以及产品配置的快速衍生,归一化设计需要解决的问题越来越多,例如不同配置或不同产品FRB2(Fault Resilient Booting level 2,级别2故障恢复启动)WDT(WatchDog Timer,看门狗计时器)时间的设定。FRB2是一种故障恢复机制,通过检测POST(PowerOn Self-Test,开机自检)过程中的FRB2 WDT时间是否超时,并在超时情况发生时进行系统重启试图恢复系统的正常启动。FRB2的WDT超时时间是BIOS中的一个选项配置参数,由于FRB2的WDT超时时间参数是预先编译时就决定好的,对于使用同一个BIOS镜像的产品或配置,FRB2的WDT超时时间设置往往是一样的,在每次开机的时候都会使用到。如果FRB2WDT时间设定值较小,当同一个BIOS运行在四路、八路等高端产品,或者运行在搭配较多内存和PCIE(peripheral component interconnect express,高速串行计算机扩展总线标准)设备的配置,或者系统临时更换为初始化时间较长的特殊外设,又或者当BIOS开启耗时较长的内存测试等内置功能时,容易出现POST时间太长导致FRB2 WDT时间超时的情况发生,继而导致系统无限重启。这种情况下,就必须通过重新修改BIOS代码再次编译修复,或者断电后通过硬件修复,整个过程耗时耗力,还会严重影响测试效率和客户体验。
为了解决该技术弊端,相关技术会通过统计完所有相关产品和配置的实际POST时间长度,然后定一个比较大的数值,确保所有产品和配置在正常状态下不会导致FRB2 WDT超时。或者,尽量利用各产品项目和配置可以区分的硬件标识,或者通过BIOS已开启的内置功能选项,对所有的项目和配置进行简单分类,然后针对各种组别设定不同的FRB2 WDT时间,或者彻底关闭该功能,对于同组的产品和配置设置相同的WDT值。现有技术尽管能在一定程度上避免系统出现无限重启的问题,但是,若通过设置较大的WDT时间值,也即所有产品、所有配置共用一个较大的值,的确可以基本避免无限重启的问题,但对于低规格的项目或是简单配置的项目而言,WDT超时时间过大,当存在故障时,需要额外浪费太多的时间等待系统重启,会降低产品MTBF(Mean Time Between Failure,平均无故障工作时间)的时间,降低产品的可靠性。而对于按组分类的WDT时间设定,在不同的配置情况下,仍然有较大的概率会出现无限重启的问题,尤其是在更换某些设备后的第一次开机过程中;另外,当开启内存测试等某些内置的功能时,为了避免默认的WDT时间设定超时,只能选择将FRB2功能关闭,这样会导致该种情况下出现偶发性错误无法重启修复。
鉴于此,如何提高BIOS归一化复用设计过程中的FRB2 WDT超时时间设定值的准确度,使得FRB2在服务器产品中得到更好更合理地使用,是所属领域技术人员需要解决的技术问题。
发明内容
本申请提供了一种FRB2 WDT超时时间确定方法、装置、电子设备及可读存储介质,提高BIOS归一化复用设计过程中的FRB2 WDT超时时间设定值的准确度,使得FRB2在服务器产品中得到更好更合理地使用。
为解决上述技术问题,本发明实施例提供以下技术方案:
本发明实施例一方面提供了一种FRB2 WDT超时时间确定方法,包括:
在服务器启动过程中,获取模式标识信息,并根据启动类型获取FRB2 WDT超时时间的推荐值;
根据统计的开机自检时间和内置功能耗费时间,确定启动时间;
基于所述模式标识信息,根据所述启动时间和所述推荐值确定所述FRB2 WDT超时时间的设定值;
其中,所述模式标识信息用于标识所述服务器的工作模式,所述推荐值为通过分析所述服务器生产测试和/或维护调试过程中每一次成功启动过程中的统计时间数据所生成。
可选的,所述根据启动类型获取FRB2 WDT超时时间的推荐值之前,还包括:
通过检测BIOS是否为首次启动以及硬件信息数据校验值是否发生变化,判断所述推荐值是否需要重新计算;
若所述BIOS发生了刷新操作或所述服务器的硬件配置更改,则根据当前统计的服务器成功启动时间数据重新计算新推荐值。
可选的,所述根据当前统计的服务器成功启动时间数据重新计算新推荐值之后,还包括:
若所述新推荐值与所述推荐值的差值大于预设差值阈值,则向客户端发送变更信息。
可选的,所述根据统计的开机自检时间和内置功能耗费时间,确定启动时间,包括:
统计所述服务器开机自检的各任务阶段的子阶段时间;
判断所述服务器是否开启内存测试功能;
若所述服务器开启内存测试功能,则计算内存测试时间和当前开机自检时间;
判断所述服务器是否需要进行资源重新分配;
若所述服务器需要进行资源重新分配,则计算资源重新分配时间;
根据所述内存测试时间、所述当前开机自检时间和所述资源重新分配时间确定启动时间。
可选的,所述基于所述模式标识信息,根据所述启动时间和所述推荐值确定所述FRB2 WDT超时时间的设定值,包括:
若所述启动时间大于所述推荐值,判断所述模式标识信息为参数训练模式还是业务上线模式;
若所述模式标识信息为所述参数训练模式,则根据所述启动时间和预设调节因子计算新推荐值,若所述新推荐值小于所述FRB2 WDT超时时间的默认值,则将所述新推荐值作为所述FRB2 WDT超时时间的设定值;
若所述启动时间小于等于所述推荐值,将所述启动时间加入所述统计时间数据中,根据更新后的统计时间数据确定新推荐值,并将所述新推荐值作为所述FRB2 WDT超时时间的设定值。
可选的,所述获取模式标识信息之后,所述根据统计的开机自检时间和内置功能耗费时间,确定启动时间之前,还包括:
所述模式标识信息为参数训练模式,则进行所述FRB2 WDT超时时间的推荐值训练,同时禁用FRB2功能;
所述模式标识信息为业务上线模式,则使能FRB2功能。
可选的,所述获取模式标识信息之后,还包括:
所述模式标识信息为非智能模式,则在所述服务器启动过程中使能FRB2功能;
判断开机自检时间是否大于所述FRB2 WDT超时时间的默认值;
若所述开机自检时间大于所述FRB2 WDT超时时间的默认值,则重启服务器系统并记录日志信息;
若所述开机自检时间小于等于所述FRB2 WDT超时时间的默认值,则正常进入所述服务器系统。
本发明实施例另一方面提供了一种FRB2 WDT超时时间确定装置,包括:
信息获取模块,用于在服务器启动过程中,获取模式标识信息,并根据启动类型获取FRB2 WDT超时时间的推荐值;其中,所述模式标识信息用于标识所述服务器的工作模式,所述推荐值为通过分析所述服务器生产测试和/或维护调试过程中每一次成功启动过程中的统计时间数据所生成;
时间计算模块,用于根据统计的开机自检时间和内置功能耗费时间,确定启动时间;
超时时间设定模块,用于基于所述模式标识信息,根据所述启动时间和所述推荐值确定所述FRB2 WDT超时时间的设定值。
本发明实施例还提供了一种电子设备,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如前任一项所述FRB2WDT超时时间确定方法的步骤。
本发明实施例最后还提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前任一项所述FRB2 WDT超时时间确定方法的步骤。
本申请提供的技术方案的优点在于,基于历史数据的推荐值和当前服务器启动过程中的开机自检时间以及内置功能开启所耗费的时间,共同确定最终的FRB2 WDT超时时间的设定值,从而可以根据产品的实际出货配置进行FRB2 WDT超时时间的最佳设置,提高BIOS归一化复用设计过程中的FRB2 WDT超时时间设定值的准确度,一方面避免了正常启动情况下由于WDT时间设置不合理导致的无限重启问题的发生,节省重新修改代码编译版本导致的开发和测试成本;另一方面,也优化了随便设定一个较大的WDT值的盲目设计,避免了系统真正出现问题时需要花费较多的无效等待时间让系统重启,增加了产品MTBF的时间,提高产品的可靠性,使得FRB2在服务器产品中得到更好更合理地使用。
此外,本发明实施例还针对FRB2 WDT超时时间确定方法提供了相应的实现装置、电子设备及可读存储介质,进一步使得所述方法更具有实用性,所述装置、电子设备及可读存储介质具有相应的优点。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
为了更清楚的说明本发明实施例或相关技术的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种FRB2 WDT超时时间确定方法的流程示意图;
图2为本发明实施例提供的另一种FRB2 WDT超时时间确定方法的流程示意图;
图3为本发明实施例提供的FRB2 WDT超时时间确定装置的一种具体实施方式结构图;
图4为本发明实施例提供的电子设备的一种具体实施方式结构图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
在介绍了本发明实施例的技术方案后,下面详细的说明本申请的各种非限制性实施方式。
首先参见图1,图1为本发明实施例提供的一种FRB2 WDT超时时间确定方法的流程示意图,本发明实施例可包括以下内容:
S101:在服务器启动过程中,获取模式标识信息,并根据启动类型获取FRB2 WDT超时时间的推荐值。
在本实施例中,模式标识信息用于标识服务器的工作模式,工作模式可包括智能模式和非智能模式,智能模式也即FRB2 WDT超时时间是动态调整的,且与服务器实际出货配置相匹配的,其包括参数训练模式和业务上线模式。非智能模式是指不启动智能FRB2功能模式,如可通过统计完所有相关产品和配置的实际POST时间长度,然后定一个比较大的数值,确保所有产品和配置在正常状态下不会导致FRB2WDT超时。或者,尽量利用各产品项目和配置可以区分的硬件标识,或者通过BIOS已开启的内置功能选项,对所有的项目和配置进行简单分类,然后针对各种组别设定不同的FRB2 WDT时间,或者彻底关闭该功能,对于同组的产品和配置设置相同的WDT值。可预先为工作模式设置相应的标识值,并将该标识值存储至BMC(Baseboard Manager Controller,基板管理控制器)FRU(Field Replace Unit,字段可更换单元),举例来说,模式标识信息可为00,01或10,该功能通过在FRU中设置一个2Bit的Flag数据位表示;如果是00,表示不开启智能FRB2功能也即处于非智能模式,WDT时间采用默认的传统方案值;如果是01,表示训练过程也即处于参数训练模式,在此情况下进行的启动过程时间都将作为统计数据用来形成推荐FRB2 WDT超时时间,不会用来判断是否已超时并触发FRB2功能;如果是10,表示系统已经上线也即处于业务上线模式,此后的启动过程不仅会将启动时间进行记录统计数据,还会启用FRB2的功能,如果启动时间大于智能推荐的超时时间,则会触发重启修复机制。
其中,本步骤的FRB2 WDT超时时间的推荐值为通过分析服务器生产测试和/或维护调试过程中每一次成功启动过程中的统计时间数据所生成。启动类型为热重启还是冷启动。具体来说,在服务器制造生产或者在客户现场维护的过程中,充分利用业务正式上线之前的生产测试和维护调试过程,记录每次启动过程中耗费的时间,然后在BIOS启动的过程中根据本次启动类型是冷启动还是热重启,内存测试模式是否打开,以及是否有因为资源重新分配导致的重启过程进行分别记录,同时还可将POST过程根据启动内容阶段细化成多个子阶段,统计每次启动时各个阶段单独的时间。将上线之前的每一次成功启动过程的时间统计数据依靠代码逻辑制作成不同的表单数据,统计各阶段启动平均时间、总过程最大启动时间、总过程最小启动时间、内存测试耗费时间、资源重新分配重启耗费时间等等,并计算POST过程平均总时间。在获取到POST各阶段启动平均时间、总过程最大启动时间、总过程最小启动时间、内存测试耗费时间、资源重新分配重启耗费时间、POST过程平均总时间之后,可根据启动类型并结合这些参数量的权重系数计算得到FRB2 WDT超时时间的推荐值,举例来说,对于有内存测试和资源重新分配的应用场景,FRB2 WDT超时时间的推荐值=[POST各阶段启动平均时间*阶段总数+内存测试耗费时间+资源重新分配重启耗费时间]*1.2。对于有内存测试的应用场景,FRB2 WDT超时时间的推荐值=[POST各阶段启动平均时间*阶段总数+内存测试耗费时间]*1.1。对于有资源重新分配的应用场景,FRB2WDT超时时间的推荐值=[POST各阶段启动平均时间*阶段总数+资源重新分配重启耗费时间]*1.3。对于没有内存测试和资源重新分配的应用场景,FRB2 WDT超时时间的推荐值=[POST各阶段启动平均时间*阶段总数]*1.05。为了便于用户使用这些数据,可将这些经验数据记录在表中并保存在BMC的FRU信息中。
S102:根据统计的开机自检时间和内置功能耗费时间,确定启动时间。
在本步骤中,开机自检时间是指服务器启动过程中,开机自检过程所耗费时间,为了进一步提高设定FRB2 WDT超时时间值的准确度,可将开机自检过程按照启动内容划分为多个子阶段,开机自检时间即为各子阶段时间之和。内置功能耗费时间是指开机启动过程中,是否开启内置功能如内存测试功能,或者是资源重新分配功能,如果开启这些内置功能,则最终的启动时间需要根据开机自检时间和内置功能所耗费时间共同确定,例如可为二者之和。
S103:基于模式标识信息,根据启动时间和推荐值确定FRB2WDT超时时间的设定值。
可以理解的是,不同工作模式下,FRB2 WDT超时时间的设定方式不同,故本步骤在确定最终FRB2 WDT超时时间的设定值时,需要基于当前工作模式。
在本发明实施例提供的技术方案中,基于历史数据的推荐值和当前服务器启动过程中的开机自检时间以及内置功能开启所耗费的时间,共同确定最终的FRB2 WDT超时时间的设定值,从而可以根据产品的实际出货配置进行FRB2 WDT超时时间的最佳设置,提高BIOS归一化复用设计过程中的FRB2 WDT超时时间设定值的准确度,一方面避免了正常启动情况下由于WDT时间设置不合理导致的无限重启问题的发生,节省重新修改代码编译版本导致的开发和测试成本;另一方面,也优化了随便设定一个较大的WDT值的盲目设计,避免了系统真正出现问题时需要花费较多的无效等待时间让系统重启,增加了产品MTBF的时间,提高产品的可靠性,使得FRB2在服务器产品中得到更好更合理地使用。
为了进一步提高FRB2 WDT超时时间的设定准确度,基于上述实施例,在根据启动类型获取FRB2 WDT超时时间的推荐值之前,还可包括:
通过检测BIOS是否为首次启动以及硬件信息数据校验值是否发生变化,判断推荐值是否需要重新计算;
若BIOS发生了刷新操作或服务器的硬件配置更改,则根据当前统计的服务器成功启动时间数据重新计算新推荐值。
若新推荐值与推荐值的差值大于预设差值阈值,则向客户端发送变更信息。
在本实施例中,在服务器启动过程中,会先计算与时间有关的硬件的校验值,也即硬件信息数据校验值,硬件信息数据校验值用于标识服务器的硬件配置是否发生更改,若硬件信息数据校验值发生变化,则表明服务器的硬件配置已发生更新,则服务器的FRU中存储的数据并不适用,需要重新统计数据并计算新的服务器的FRB2 WDT超时时间的推荐值。在启动过程中通过检测BIOS是否首次启动以及硬件信息数据校验值是否发生变化判断是否需要重新计算,如果发生了BIOS刷新或者硬件配置更改,会清除已有的历史约束,然后把当前的统计数据作为新的历史数据存储备份,并重新建立新的数据表进行下一轮的训练过程,如果历史推荐值与新训练得出的值相差超过20%,则发送变更信息给BMC通知到客户。
在上述实施例中,对于如何执行步骤S102并不做限定,本实施例中给出启动时间的一种可选的确定方式,可包括如下步骤:
统计服务器开机自检的各任务阶段的子阶段时间;
判断服务器是否开启内存测试功能;
若服务器开启内存测试功能,则计算内存测试时间和当前开机自检时间;
判断服务器是否需要进行资源重新分配;
若服务器需要进行资源重新分配,则计算资源重新分配时间;
根据内存测试时间、当前开机自检时间和资源重新分配时间确定启动时间。
在本实施例中,开机自检过程可根据执行的开机任务类型分为多类,每类任务对应一个阶段,通过将开机自检过程按照启动内容划分为阶段,单独统计每个阶段的时间,同时考虑内存测试时间和资源重新分配时间,进一步提高FRB2 WDT超时时间的设定准确度。
在上述实施例中,对于如何执行步骤S103并不做限定,本实施例中给出FRB2 WDT超时时间的设定值的一种可选的确定方式,可包括如下步骤:
若启动时间大于推荐值,判断模式标识信息为参数训练模式还是业务上线模式;相应的,若模式标识信息为参数训练模式,则进行FRB2WDT超时时间的推荐值训练,同时禁用FRB2功能;若模式标识信息为业务上线模式,则使能FRB2功能。
若模式标识信息为参数训练模式,则根据启动时间和预设调节因子计算新推荐值,若新推荐值小于FRB2 WDT超时时间的默认值,则将新推荐值作为FRB2 WDT超时时间的设定值;
若启动时间小于等于推荐值,将启动时间加入统计时间数据中,根据更新后的统计时间数据确定新推荐值,并将新推荐值作为FRB2WDT超时时间的设定值。
在本实施例中,预设调节因子可根据实际需求进行灵活确定,例如可为1.1。在本实施例设置顶端边界条件,如果在训练过程中也即处于参数训练模式下,历次启动过程中出现1次时间比平均启动时间高20%及以上时,推荐值变为历次启动时间最大值*1.1,如果仍然有超出边界时间的正常启动发生,则与默认传统方案时间也即FRB2WDT超时时间的默认值对比,如果小于默认值,则将默认值设置为智能推荐WDT时间;如果大于默认传统方案,则认为是配置异常或启动异常,关闭FRB2功能并发送提示信息给BMC,通知到用户进行确认和分析。
为了提高整个方案的灵活性,提升用户使用体验,实用性更好,本申请的服务器在启动过程中还支持采用任何一种FRB2 WDT超时时间设定方法,可包括:
获取模式标识信息,模式标识信息为非智能模式,则在服务器启动过程中使能FRB2功能;
判断开机自检时间是否大于FRB2 WDT超时时间的默认值;
若开机自检时间大于FRB2 WDT超时时间的默认值,则重启服务器系统并记录日志信息;
若开机自检时间小于等于FRB2 WDT超时时间的默认值,则正常进入服务器系统。
为了使所属领域技术人员更加清楚明白本申请的整个技术方案,本申请还结合图2提供了一个示意性例子,本实施例以支持BMC和Intel平台服务器的AMI BIOS为例阐述整个技术方案,但由于该方案的可扩展性和移植性,其不限于Intel平台,也不限于AMI的BIOS,在使用其他BIOS代码的基于其他平台的服务器产品上仍然具有通用的参考应用价值,可包括下述内容:
S11:设定一个默认的FRB2 WDT超时时间值;
在本步骤中,首先跟传统方案一样,设定一个默认的FRB2 WDT超时时间值。
S12:启动过程从BMC获取FRU信息;
S13:判断智能FRB2的Flag;
S14:如果S13结果是00,表示使用传统的FRB2方案,进行S17;
S15:如果S13结果是01,表示智能FRB2训练过程,进行S19;
S16:如果S13结果是10,表示业务上线,使能FRB2功能,进行S20;
S17:使能FRB2功能,并在POST过程检测是否超时;
S18:如果超时,重启系统并产生BMC日志,进行S29;
S19:禁用FRB2功能;
S20:统计POST各阶段时间;
S21:判断是否开启内存测试,如果开启则计算测试时间,并计算POST已进行时间;
S22:判断是否有资源重新分配重启过程,如果有,则计算重启增加时间,并计算POST已进行时间;
S23:根据启动类型是热启动或冷启动,以及是否有内存测试或资源重新分配重启过程,获取相应的FRB2 WDT推荐值T0;
S24:判断POST时间T1与T0的对比,如果T1>T0且FRB2 Flag为01,进行S25;如果T1>T0且FRB2 Flag为10,进行S26;如果T1<T0,进行S27;
S25:给T0重新赋值为1.1*T1,并将T0与传统的FRB2 WDT值T#进行比较,如果大于T#,则执行S26,否则执行S28;
S26:重启系统并记录提示日志信息;
S27:将T1的值参与T0的计算过程,得到T2,并让T0=T2;
S28:使用T0作为新的FRB2 WDT值,更新数据统计表;
S29:结束。
由上可知,本发明实施例提高了BIOS归一化复用设计过程中的FRB2 WDT超时时间设定值的准确度,使得FRB2在服务器产品中得到更好更合理地使用。
需要说明的是,本申请中各步骤之间没有严格的先后执行顺序,只要符合逻辑上的顺序,则这些步骤可以同时执行,也可按照某种预设顺序执行,图1-图2只是一种示意方式,并不代表只能是这样的执行顺序。
本发明实施例还针对FRB2 WDT超时时间确定方法提供了相应的装置,进一步使得方法更具有实用性。其中,装置可从功能模块的角度和硬件的角度分别说明。下面对本发明实施例提供的FRB2 WDT超时时间确定装置进行介绍,下文描述的FRB2 WDT超时时间确定装置与上文描述的FRB2 WDT超时时间确定方法可相互对应参照。
基于功能模块的角度,参见图3,图3为本发明实施例提供的FRB2WDT超时时间确定装置在一种具体实施方式下的结构图,该装置可包括:
信息获取模块301,用于在服务器启动过程中,获取模式标识信息,并根据启动类型获取FRB2 WDT超时时间的推荐值;其中,模式标识信息用于标识服务器的工作模式,推荐值为通过分析服务器生产测试和/或维护调试过程中每一次成功启动过程中的统计时间数据所生成;
时间计算模块302,用于根据统计的开机自检时间和内置功能耗费时间,确定启动时间;
超时时间设定模块303,用于基于模式标识信息,根据启动时间和推荐值确定FRB2WDT超时时间的设定值。
可选的,在本实施例的一些实施方式中,上述装置还可以包括数据更新模块,用于通过检测BIOS是否为首次启动以及硬件信息数据校验值是否发生变化,判断推荐值是否需要重新计算;若BIOS发生了刷新操作或服务器的硬件配置更改,则根据当前统计的服务器成功启动时间数据重新计算新推荐值。
作为上述实施例的一种可选的实施方式,上述数据更新模块还包括变更通知单元,用于若新推荐值与推荐值的差值大于预设差值阈值,则向客户端发送变更信息。
可选的,在本实施例的另一些实施方式中,上述时间计算模块302可进一步用于:统计服务器开机自检的各任务阶段的子阶段时间;判断服务器是否开启内存测试功能;若服务器开启内存测试功能,则计算内存测试时间和当前开机自检时间;判断服务器是否需要进行资源重新分配;若服务器需要进行资源重新分配,则计算资源重新分配时间;根据内存测试时间、当前开机自检时间和资源重新分配时间确定启动时间。
可选的,在本实施例的其他一些实施方式中,上述超时时间设定模块303可进一步用于:若启动时间大于推荐值,判断模式标识信息为参数训练模式还是业务上线模式;若模式标识信息为参数训练模式,则根据启动时间和预设调节因子计算新推荐值,若新推荐值小于FRB2WDT超时时间的默认值,则将新推荐值作为FRB2 WDT超时时间的设定值;若启动时间小于等于推荐值,将启动时间加入统计时间数据中,根据更新后的统计时间数据确定新推荐值,并将新推荐值作为FRB2 WDT超时时间的设定值。
作为本实施例的一种可选的实施方式,上述装置还可包括FRB2功能设置模块,用于模式标识信息为参数训练模式,则进行FRB2 WDT超时时间的推荐值训练,同时禁用FRB2功能;模式标识信息为业务上线模式,则使能FRB2功能。
作为本实施例的另一种可选的实施方式,上述装置例如还可包括非智能实施模块,用于模式标识信息为非智能模式,则在服务器启动过程中使能FRB2功能;判断开机自检时间是否大于FRB2 WDT超时时间的默认值;若开机自检时间大于FRB2 WDT超时时间的默认值,则重启服务器系统并记录日志信息;若开机自检时间小于等于FRB2WDT超时时间的默认值,则正常进入服务器系统。
本发明实施例FRB2 WDT超时时间确定装置的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例提高了BIOS归一化复用设计过程中的FRB2 WDT超时时间设定值的准确度,使得FRB2在服务器产品中得到更好更合理地使用。
上文中提到的FRB2 WDT超时时间确定装置是从功能模块的角度描述,进一步的,本申请还提供一种电子设备,是从硬件角度描述。图4为本申请实施例提供的电子设备在一种实施方式下的结构示意图。如图4所示,该电子设备包括存储器40,用于存储计算机程序;处理器41,用于执行计算机程序时实现如上述任一实施例提到的FRB2 WDT超时时间确定方法的步骤。
其中,处理器41可以包括一个或多个处理核心,比如4核心处理器、8核心处理器,处理器41还可为控制器、微控制器、微处理器或其他数据处理芯片等。处理器41可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable GateArray,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器41也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central Processing Unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器41可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器41还可以包括AI(ArtificialIntelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器40可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器40还可包括高速随机存取存储器以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。存储器40在一些实施例中可以是电子设备的内部存储单元,例如服务器的硬盘。存储器40在另一些实施例中也可以是电子设备的外部存储设备,例如服务器上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器40还可以既包括电子设备的内部存储单元也包括外部存储设备。存储器40不仅可以用于存储安装于电子设备的应用软件及各类数据,例如:执行漏洞处理方法的程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。本实施例中,存储器40至少用于存储以下计算机程序401,其中,该计算机程序被处理器41加载并执行之后,能够实现前述任一实施例公开的FRB2 WDT超时时间确定方法的相关步骤。另外,存储器40所存储的资源还可以包括操作系统402和数据403等,存储方式可以是短暂存储或者永久存储。其中,操作系统402可以包括Windows、Unix、Linux等。数据403可以包括但不限于FRB2 WDT超时时间确定结果对应的数据等。
在一些实施例中,上述电子设备还可包括有显示屏42、输入输出接口43、通信接口44或者称为网络接口、电源45以及通信总线46。其中,显示屏42、输入输出接口43比如键盘(Keyboard)属于用户接口,可选的用户接口还可以包括标准的有线接口、无线接口等。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。通信接口44可选的可以包括有线接口和/或无线接口,如WI-FI接口、蓝牙接口等,通常用于在电子设备与其他电子设备之间建立通信连接。通信总线46可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extendedindustry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
本领域技术人员可以理解,图4中示出的结构并不构成对该电子设备的限定,可以包括比图示更多或更少的组件,例如还可包括实现各类功能的传感器47。
本发明实施例所述电子设备的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例提高了BIOS归一化复用设计过程中的FRB2 WDT超时时间设定值的准确度,使得FRB2在服务器产品中得到更好更合理地使用。
可以理解的是,如果上述实施例中的FRB2 WDT超时时间确定方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电可擦除可编程ROM、寄存器、硬盘、多媒体卡、卡型存储器(例如SD或DX存储器等)、磁性存储器、可移动磁盘、CD-ROM、磁碟或者光盘等各种可以存储程序代码的介质。
基于此,本发明实施例还提供了一种可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时如上任意一实施例所述FRB2WDT超时时间确定方法的步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的硬件包括装置及电子设备而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
以上对本申请所提供的一种FRB2 WDT超时时间确定方法、装置、电子设备及可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
Claims (10)
1.一种FRB2 WDT超时时间确定方法,其特征在于,包括:
在服务器启动过程中,获取模式标识信息,并根据启动类型获取FRB2 WDT超时时间的推荐值;
根据统计的开机自检时间和内置功能耗费时间,确定启动时间;
基于所述模式标识信息,根据所述启动时间和所述推荐值确定所述FRB2 WDT超时时间的设定值;
其中,所述模式标识信息用于标识所述服务器的工作模式,所述推荐值为通过分析所述服务器生产测试和/或维护调试过程中每一次成功启动过程中的统计时间数据所生成。
2.根据权利要求1所述的FRB2 WDT超时时间确定方法,其特征在于,所述根据启动类型获取FRB2 WDT超时时间的推荐值之前,还包括:
通过检测BIOS是否为首次启动以及硬件信息数据校验值是否发生变化,判断所述推荐值是否需要重新计算;
若所述BIOS发生了刷新操作或所述服务器的硬件配置更改,则根据当前统计的服务器成功启动时间数据重新计算新推荐值。
3.根据权利要求2所述的FRB2 WDT超时时间确定方法,其特征在于,所述根据当前统计的服务器成功启动时间数据重新计算新推荐值之后,还包括:
若所述新推荐值与所述推荐值的差值大于预设差值阈值,则向客户端发送变更信息。
4.根据权利要求1所述的FRB2 WDT超时时间确定方法,其特征在于,所述根据统计的开机自检时间和内置功能耗费时间,确定启动时间,包括:
统计所述服务器开机自检的各任务阶段的子阶段时间;
判断所述服务器是否开启内存测试功能;
若所述服务器开启内存测试功能,则计算内存测试时间和当前开机自检时间;
判断所述服务器是否需要进行资源重新分配;
若所述服务器需要进行资源重新分配,则计算资源重新分配时间;
根据所述内存测试时间、所述当前开机自检时间和所述资源重新分配时间确定启动时间。
5.根据权利要求1至4任意一项所述的FRB2 WDT超时时间确定方法,其特征在于,所述基于所述模式标识信息,根据所述启动时间和所述推荐值确定所述FRB2 WDT超时时间的设定值,包括:
若所述启动时间大于所述推荐值,判断所述模式标识信息为参数训练模式还是业务上线模式;
若所述模式标识信息为所述参数训练模式,则根据所述启动时间和预设调节因子计算新推荐值,若所述新推荐值小于所述FRB2 WDT超时时间的默认值,则将所述新推荐值作为所述FRB2 WDT超时时间的设定值;
若所述启动时间小于等于所述推荐值,将所述启动时间加入所述统计时间数据中,根据更新后的统计时间数据确定新推荐值,并将所述新推荐值作为所述FRB2 WDT超时时间的设定值。
6.根据权利要求5所述的FRB2 WDT超时时间确定方法,其特征在于,所述获取模式标识信息之后,所述根据统计的开机自检时间和内置功能耗费时间,确定启动时间之前,还包括:
所述模式标识信息为参数训练模式,则进行所述FRB2 WDT超时时间的推荐值训练,同时禁用FRB2功能;
所述模式标识信息为业务上线模式,则使能FRB2功能。
7.根据权利要求5所述的FRB2 WDT超时时间确定方法,其特征在于,所述获取模式标识信息之后,还包括:
所述模式标识信息为非智能模式,则在所述服务器启动过程中使能FRB2功能;
判断开机自检时间是否大于所述FRB2 WDT超时时间的默认值;
若所述开机自检时间大于所述FRB2 WDT超时时间的默认值,则重启服务器系统并记录日志信息;
若所述开机自检时间小于等于所述FRB2 WDT超时时间的默认值,则正常进入所述服务器系统。
8.一种FRB2 WDT超时时间确定装置,其特征在于,包括:
信息获取模块,用于在服务器启动过程中,获取模式标识信息,并根据启动类型获取FRB2 WDT超时时间的推荐值;其中,所述模式标识信息用于标识所述服务器的工作模式,所述推荐值为通过分析所述服务器生产测试和/或维护调试过程中每一次成功启动过程中的统计时间数据所生成;
时间计算模块,用于根据统计的开机自检时间和内置功能耗费时间,确定启动时间;
超时时间设定模块,用于基于所述模式标识信息,根据所述启动时间和所述推荐值确定所述FRB2 WDT超时时间的设定值。
9.一种电子设备,其特征在于,包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现如权利要求1至7任一项所述FRB2 WDT超时时间确定方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述FRB2 WDT超时时间确定方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111641728.9A CN114327986B (zh) | 2021-12-29 | 2021-12-29 | Frb2 wdt超时时间确定方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111641728.9A CN114327986B (zh) | 2021-12-29 | 2021-12-29 | Frb2 wdt超时时间确定方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114327986A true CN114327986A (zh) | 2022-04-12 |
CN114327986B CN114327986B (zh) | 2023-11-03 |
Family
ID=81016112
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111641728.9A Active CN114327986B (zh) | 2021-12-29 | 2021-12-29 | Frb2 wdt超时时间确定方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114327986B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4597052A (en) * | 1983-05-17 | 1986-06-24 | Nissan Motor Company, Limited | Digital control system with error monitor operative upon starting system operation |
JPH1021121A (ja) * | 1996-06-27 | 1998-01-23 | Nec Home Electron Ltd | マイクロコンピュータ装置 |
CN109086154A (zh) * | 2018-07-26 | 2018-12-25 | 郑州云海信息技术有限公司 | 一种用于检测bios看门狗功能倒计时装置及方法 |
CN110134540A (zh) * | 2019-05-21 | 2019-08-16 | 苏州浪潮智能科技有限公司 | 一种日志信息收集方法、装置、设备及可读存储介质 |
CN110427296A (zh) * | 2019-06-29 | 2019-11-08 | 苏州浪潮智能科技有限公司 | 一种基于硬件wdt进行监测的方法、设备及可读介质 |
-
2021
- 2021-12-29 CN CN202111641728.9A patent/CN114327986B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4597052A (en) * | 1983-05-17 | 1986-06-24 | Nissan Motor Company, Limited | Digital control system with error monitor operative upon starting system operation |
JPH1021121A (ja) * | 1996-06-27 | 1998-01-23 | Nec Home Electron Ltd | マイクロコンピュータ装置 |
CN109086154A (zh) * | 2018-07-26 | 2018-12-25 | 郑州云海信息技术有限公司 | 一种用于检测bios看门狗功能倒计时装置及方法 |
CN110134540A (zh) * | 2019-05-21 | 2019-08-16 | 苏州浪潮智能科技有限公司 | 一种日志信息收集方法、装置、设备及可读存储介质 |
CN110427296A (zh) * | 2019-06-29 | 2019-11-08 | 苏州浪潮智能科技有限公司 | 一种基于硬件wdt进行监测的方法、设备及可读介质 |
Non-Patent Citations (3)
Title |
---|
王征宇;章少云;: "一种看门狗溢出时间的测试方法", 电子与封装, no. 02 * |
胡瑞忠;: "英飞凌XC2336B单片机看门狗编程――基于DAVE2.0平台", 山西电子技术, no. 06 * |
魏艳玲, 钟庆: "软件看门狗定时器", 微型机与应用, no. 02 * |
Also Published As
Publication number | Publication date |
---|---|
CN114327986B (zh) | 2023-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240086269A1 (en) | Method, Apparatus and System for Locating Fault of Server, and Computer-readable Storage Medium | |
CN107122321B (zh) | 硬件修复方法、硬件修复系统以及计算机可读取存储装置 | |
US8850172B2 (en) | Analyzing performance of computing devices in usage scenarios | |
CN105094927B (zh) | 一种设备固件升级方法和装置 | |
CN109670319B (zh) | 一种服务器flash安全管理方法及其系统 | |
CN102819466B (zh) | 操作系统异常的处理方法及其装置 | |
US8909952B2 (en) | Power supply apparatus of computer system and method for controlling power sequence thereof | |
CN112506745B (zh) | 内存温度读取方法、装置及计算机可读存储介质 | |
CN109375956B (zh) | 一种重启操作系统的方法、逻辑设备以及控制设备 | |
CN101201746A (zh) | 基本输出入系统设定方法 | |
CN114138527A (zh) | 一种提高服务器性能的方法、装置及介质 | |
CN114153477A (zh) | Pcie驱动卡固件升级方法、装置、系统、设备及介质 | |
CN104657232A (zh) | Bios自动恢复系统及方法 | |
CN101923503B (zh) | 调整内存内部参数的方法及使用其的电脑系统 | |
CN114327986B (zh) | Frb2 wdt超时时间确定方法、装置、设备及介质 | |
CN111176958A (zh) | 信息监测方法、系统和存储介质 | |
CN111475186A (zh) | 一种基于bmc的固件升级方法、装置、设备及介质 | |
CN113849229A (zh) | 服务器开机方法、装置、电子设备及可读存储介质 | |
CN114153503A (zh) | 一种bios控制方法、装置、介质 | |
CN113849230A (zh) | 服务器启动方法、装置、电子设备及可读存储介质 | |
CN112231704A (zh) | 可信网络环境保护方法、装置和计算机可读存储介质 | |
CN112395121A (zh) | 一种驱动加载的处理方法及装置、存储介质、计算机设备 | |
CN112673354A (zh) | 一种系统状态检测方法、系统状态装置及终端设备 | |
JP2020086606A (ja) | 情報処理装置及び制御プログラム | |
CN103106089A (zh) | 一种智能平台管理控制器的升级方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |