CN114816024B - 对服务器主板负载端进行保护的方法、系统、设备及介质 - Google Patents
对服务器主板负载端进行保护的方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN114816024B CN114816024B CN202210610968.0A CN202210610968A CN114816024B CN 114816024 B CN114816024 B CN 114816024B CN 202210610968 A CN202210610968 A CN 202210610968A CN 114816024 B CN114816024 B CN 114816024B
- Authority
- CN
- China
- Prior art keywords
- scene
- load
- scene tree
- information
- tree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000002159 abnormal effect Effects 0.000 claims abstract description 26
- 230000004044 response Effects 0.000 claims abstract description 21
- 239000002131 composite material Substances 0.000 claims description 34
- 238000002360 preparation method Methods 0.000 claims description 17
- 238000012360 testing method Methods 0.000 claims description 12
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 9
- 238000013139 quantization Methods 0.000 claims description 6
- 230000008878 coupling Effects 0.000 claims description 4
- 238000010168 coupling process Methods 0.000 claims description 4
- 238000005859 coupling reaction Methods 0.000 claims description 4
- 230000001681 protective effect Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 description 13
- 238000001514 detection method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/28—Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/70—Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer
- G06F21/81—Protecting specific internal or peripheral components, in which the protection of a component leads to protection of the entire computer by operating on the power supply, e.g. enabling or disabling power-on, sleep or resume operations
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明公开了一种对服务器主板负载端进行保护的方法、系统、设备及介质,方法包括:采集单元采集主板负载端的功率信息与运行状态信息并发送给BMC,其中,负载端为所述主板上连接的所有负载;BMC将接收到的负载的功率信息和运行状态信息与负载的预设信息进行比较,以判断负载是否出现异常;响应于负载未出现异常,BMC基于功率信息和运行状态信息生成场景树;响应于场景树不为初始场景树,BMC将场景树与历史场景树进行对比,并基于对比结果向CPLD发送对应的指令;CPLD基于接收到的指令执行相应的操作以对对应负载进行保护。通过本发明的方案,实现了对服务器主板的负载端进行保护。
Description
技术领域
本发明涉及服务器技术领域,尤其涉及一种对服务器主板负载端进行保护的方法、系统、设备及介质。
背景技术
在大数据时代,对服务器的存储阵列可靠性提出了更高要求,尤其是针对存储系统供电稳定性。当前的存储设备中,通过BMC(Baseboard Management Controller,基板管理控制器)读取负载端器件的运行状态,通过电源芯片自带的保护措施对负载提供保护,这种检测保护措施既没有对负载的运行状态进行全面的考虑,又不能再意外发生时做出最可靠的处理,存在系统故障时数据丢失的隐患。
发明内容
有鉴于此,本发明提出了一种对服务器主板负载端进行保护的方法、系统、设备及介质,采用生成场景树的方式使得采集到的信息被综合汇总考虑;同时通过场景树确保了服务器主板上挂载的各种硬件设备的运行状态信息能够充分利用,使得控制单元能够充分获取到系统的运行状态;同时将大量的生成场景作为历史记录,并基于此作出了场景整合、预测等准备操作,确保当意外情况发生时,控制单元能在第一时间做出最合理的保护措施,相比于传统的电源芯片的保护措施更为合理准确。
基于上述目的,本发明实施例的一方面提供了一种对服务器主板负载端进行保护的方法,具体包括如下步骤:
采集单元采集主板负载端的功率信息与运行状态信息并发送给BMC,其中,所述负载端为所述主板上连接的所有负载;
所述BMC将接收到的负载的功率信息和运行状态信息与所述负载的预设信息进行比较,以判断所述负载是否出现异常;
响应于所述负载未出现异常,所述BMC基于所述功率信息和运行状态信息生成场景树;
响应于所述场景树不为初始场景树,所述BMC将所述场景树与历史场景树进行对比,并基于对比结果向CPLD发送对应的指令;
所述CPLD基于接收到的指令执行相应的操作以对对应负载进行保护。
在一些实施方式中,基于所述功率信息和运行状态信息生成场景树包括:
基于所述功率信息确定所述负载的负载类型;
将所述负载类型作为场景树的底层树干,将同一负载类型下的负载作为所述底层树干的树枝,将所述负载的功率信息和运行状态信息作为所述树枝的场景因子,以此生成场景树。
在一些实施方式中,方法进一步包括:
对生成的场景树进行场景因子合并以生成复合场景树。
在一些实施方式中,对生成的场景树进行场景因子合并以生成复合场景树包括:
将相互耦合的场景因子进行耦合以生成复合场景因子和独立场景因子;
确定所述复合场景因子中的主导因子,并将所述主导因子所在的负载作为所述复合场景因子的负载,以此生成复合场景树。
在一些实施方式中,采集单元采集主板负载端的功率信息与运行状态信息并发送给BMC包括:
采集单元通过AD转换芯片采集各个负载的功率信息,并通过I2C链路采集各个负载的运行状态信息,并将所述功率信息与所述运行状态信息发送给所述BMC。
在一些实施方式中,所述历史场景树包含历史所有场景树的集合;将所述场景树与历史场景树进行对比,并基于对比结果向CPLD发送对应的指令包括:
将生成的场景树与所述历史所有场景树的集合进行对比;
响应于所述生成的场景树与所述历史所有场景树的集合中任意一个场景树相同,则向CPLD发送执行现有保护措施的命令;
响应于所述生成的场景树与所述历史所有场景树的集合中任意一个场景树均不相同,则向CPLD发送所述生成的场景树和场景预测命令。
在一些实施方式中,所述CPLD基于接收到的指令执行相应的操作包括:
响应于所述CPLD接收到所述生成的场景树和所述场景预测命令,根据预设相似度从所述历史所有场景树中获取相似的树枝以及相应的场景因子;
基于所述相似的树枝以及相应的场景因子,对所述生成的场景树进行场景预测;
基于场景预测结果,在硬件和软件上分别进行相应的准备操作。
在一些实施方式中,在硬件和软件上分别进行相应的准备操作包括:
在硬件上使能对应场景冗余的保护电路以及通路;
在软件上对预测出的场景进行二次预测,并响应于二次预测结果为异常场景,则对对应负载进行镜像备份。
在一些实施方式中,在响应于所述负载未出现异常,所述BMC基于所述功率信息和运行状态信息生成场景树步骤之后,方法进一步包括:
响应于所述场景树为初始场景树,所述BMC将生成的场景树与虚拟场景树进行对比,并基于对比结果向CPLD发送对应的指令。
在一些实施方式中,所述虚拟场景树基于以下步骤生成:
获取电源供电信息以及负载的功率参数与状态参数;
获取负载厂商提供的负载原厂测试信息,并对负载原厂测试信息进行状态量化处理;
将所述电源供电信息以及所述负载的功率参数与状态参数作为场景因子以生成场景树;
基于量化处理后的各个负载的测试信息优化所述虚拟场景树。
本发明实施例的另一方面,还提供了一种对服务器主板负载端进行保护的系统,包括:采集单元、BMC和CPLD;
所述采集单元配置为采集主板负载端的功率信息与运行状态信息并发送给BMC,其中,所述负载端为所述主板上连接的所有负载;
所述BMC配置为将接收到的负载的功率信息和运行状态信息与所述负载的预设信息进行比较,以判断所述负载是否出现异常;
所述BMC还配置为响应于所述负载未出现异常,基于所述功率信息和运行状态信息生成场景树;
所述BMC还配置为响应于所述场景树不为初始场景树,将所述场景树与历史场景树进行对比,并基于对比结果向CPLD发送对应的指令;
所述CPLD配置为基于接收到的指令执行相应的操作以对对应负载进行保护。
在一些实施方式中,所述BMC还配置为:
基于所述功率信息确定所述负载的负载类型;
将所述负载类型作为场景树的底层树干,将同一负载类型下的负载作为所述底层树干的树枝,将所述负载的功率信息和运行状态信息作为所述树枝的场景因子,以此生成场景树。
在一些实施方式中,所述BMC还配置为对生成的场景树进行场景因子合并以生成复合场景树。
本发明实施例的又一方面,还提供了一种计算机设备,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机程序,其中,所述处理器执行所述程序时执行如上所述的方法的步骤。
本发明实施例的再一方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时实现如上方法步骤的计算机程序。
本发明至少具有以下有益技术效果:本发明的方案基于AD(模数)转换芯片和I2C(一种双向二线制同步串行总线)链路能够同时采集负载的功率信息与运行状态信息,使得BMC能够根据采集到的信息生成关于负载运行状态的场景树,该场景树对负载类型及状态进行了详细的检测记录,使得BMC能够对负载运行过程中出现的各类情况均有认知,如果出现了历史场景树以外的情况能够及时记录;CPLD(Complex Programmable Logic Device,复杂可编程逻辑器件)单元可以根据历史的场景树信息进行预测,做出合理的准备操作,当意外情况发生时可以采取合理的措施,保证了系统正常运行,大幅度降低数据丢失的风险;并且本发明通过不断汇总场景信息,能够针对不同的运行场景提供相对应的保护措施,使得保护措施考虑的更周全,响应更迅速。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本发明提供的对服务器主板负载端进行保护的方法的一实施例的框图;
图2为本发明提供的对存储主板负载端进行保护的一实施例的流程图。
图3为本发明提供的生成场景树的一实施例的流程图;
图4为本发明提供的场景树的一实施例的结构示意图;
图5为本发明提供的基于生成的场景树对负载进行保护的一实施例的流程图;
图6为本发明提供的对服务器主板负载端进行保护的系统的一实施例的示意图;
图7为本发明提供的计算机设备的一实施例的结构示意图;
图8为本发明提供的计算机可读存储介质的一实施例的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
基于上述目的,本发明实施例的第一个方面,提出了一种对服务器主板负载端进行保护的方法的实施例。如图1所示,其包括如下步骤:
S10、采集单元采集主板负载端的功率信息与运行状态信息并发送给BMC,其中,所述负载端为所述主板上连接的所有负载;
S20、所述BMC将接收到的负载的功率信息和运行状态信息与所述负载的预设信息进行比较,以判断所述负载是否出现异常;
S30、响应于所述负载未出现异常,所述BMC基于所述功率信息和运行状态信息生成场景树;
S40、响应于所述场景树不为初始场景树,所述BMC将所述场景树与历史场景树进行对比,并基于对比结果向CPLD发送对应的指令;
S50、所述CPLD基于接收到的指令执行相应的操作以对对应负载进行保护。
步骤S10中,采集单元首先通过AD转换芯片采集各个负载的电压、电流等功率信息,再通过I2C链路获取各个负载的状态信息,以及对应的电源侧状态信息,将采集到的负载类型、运行状态等信息提供给控制单元(即BMC)。
步骤S20和S30中,BMC根据预设好的负载参数信息识别采样单元采集到的信息,识别出当前不同的负载类型,及其所处的运行状态,并判断是否满足预设参数要求;根据判断出的满足要求的状态信息,生成场景树,并将各类负载当前的运行状态及可能出现的意外场景做出汇总;记录生成的场景树,用于之后的对比,并且以此不断完善场景树。
步骤S40中,BMC将当前时刻生成的场景树与此前记录的场景树作对比;基于对比结果向CPLD发送对应的指令,以使CPLD针对已有的场景和此前未知的场景分别做出相应的准备,或对此前未知的场景做出日志记录。
步骤S50为保护部分,CPLD依据上一部分生成的场景,提前做出准备。准备过程包括硬件与软件两部分,硬件上使能对应场景保护电路以及通路的冗余措施,软件上包括异常场景的预测以及对应模块数据单元的镜像备份,当供电端过压、过载等异常情况出现时,控制单元根据不同的场景做出最合适的保护措施。
相比于传统的服务器主板利用BMC单元通过I2C信号检测负载的运行状态,本发明方案基于AD转换芯片和I2C链路能够同时采集负载的功率信息与运行状态信息,使得BMC能够根据采集到的信息生成关于负载运行状态的场景树,该场景树对负载类型及状态进行了详细的检测记录,使得BMC能够对负载运行过程中出现的各类情况均有认知,如果出现了历史场景树以外的情况能够及时记录;CPLD单元可以根据历史的场景树信息进行预测,做出合理的准备操作,当意外情况发生时可以采取合理的措施,保证了系统正常运行,大幅度降低数据丢失的风险;并且本发明通过不断汇总场景信息,能够针对不同的运行场景提供相对应的保护措施,使得保护措施考虑的更周全,响应更迅速。
在一些实施方式中,基于所述功率信息和运行状态信息生成场景树包括:
基于所述功率信息确定所述负载的负载类型;
将所述负载类型作为场景树的底层树干,将同一负载类型下的负载作为所述底层树干的树枝,将所述负载的功率信息和运行状态信息作为所述树枝的场景因子,以此生成场景树。
具体的,本发明实施例可用于服务器存储系统中,服务器主板为存储主板。
如图2所示,为一种对存储主板负载端进行保护的流程图。
服务器系统正常工作时,负载端信号通过I2C、AD采样等数据传输模块将负载端信息实时地传递给BMC管理单元,BMC收集此刻的负载端信息,包括功率信息与运行状态信息,基于此刻的信息生成场景树并与以往的场景树序列作对比,对比完成后将下一步的操作计划指令发送给CPLD,下一步计划包括场景预测或按历史记录执行;CPLD接收指令并按照指令信息执行相应的预操作,确保此刻负载端在软件上与硬件上均对改场景下可能发生的意外情况做好准备,当负载端过压/过流等意外情况发生时,系统做出迅速正确的反馈。
生成场景树的具体过程如下:
如图3所示,为生成场景树的流程图。
BMC对采集到的信息首先进行对比,如果不满足预设参数要求或跟参数记录中的异常情况相匹配则向CPLD发出预警信号,该信息由于不符合负载规格书的正常运行情况,不计入场景生成中。
通过采集的功率信息,BMC可以获得该负载供电端的电压值与电流值由此判断出负载类型为大功率型负载、小功率控制类负载、通道保护类负载等,同时也能为负载的运行状态判断提供参考,通过采集I2C信息,BMC可以获得该负载的运行状态信息,负载的功率信息和运行状态信息在场景树生成时作为场景因子。
如图4所示,为场景树的结构示意图。
场景树生成过程中,树的底层树干部分为不同负载类型,负载类型往上的分支为各类负载分支(树枝)中对应的负载,为了便于管理,优选的,当一类负载分支中的负载数多于5时,计入下一分支;对于分支中的每一个负载,负载对应的下一分支为负载的运行状态信息,即场景因子,在这一分支中负载后有多个分支,即每一个分支对应一条状态信息,也即场景生成因子,以上即一个负载场景树的生成过程。
在一些实施方式中,方法进一步包括:
对生成的场景树进行场景因子合并以生成复合场景树。
在一些实施方式中,对生成的场景树进行场景因子合并以生成复合场景树包括:
将相互耦合的场景因子进行耦合以生成复合场景因子和独立场景因子;
确定所述复合场景因子中的主导因子,并将所述主导因子所在的负载作为所述复合场景因子的负载,以此生成复合场景树。
下面结合图4对复合场景树的生成过程进行说明。
为了进一步完善场景树,本实施例将上一实施例中生成的场景树作为基础单元,在场景树基础单元的基础上,考虑各场树枝之间的并行状态,将两路或场景枝合并或更改以生成完善后的场景树,即复合场景树。
并行状态为负载间协调配合的运行状态,即一个负载的运行状态变化会随着与之相关负载变化的改变而改变,二者相互耦合,根据这种关系,可以将几种相互耦合的场景因子合并为一个复合场景因子。按照复合场景因子的规范,将其中相互耦合的场景因子相结合,结合后的场景树枝末端变为了复合场景因子、独立场景因子两种。复合场景因子使得场景树末端的场景树枝的数量大幅降低,便于后面的对比操作。但是由于复合场景因子中包含了不同类型负载间相互耦合的运行状态,即一个复合场景因子的树根包含了多个负载,为此需将复合场景因子中的某一场景因子确定为主导因子。确定出复合场景因子所包含的场景因子中的主导因子后,将该复合场景因子归到主导因子所在的负载下,从而完善成最终的场景树,该场景树末端少且各枝干之间的从属关系清晰,便于下一步的对比准备操作。
在一些实施方式中,采集单元采集主板负载端的功率信息与运行状态信息并发送给BMC包括:
采集单元通过AD转换芯片采集各个负载的功率信息,并通过I2C链路采集各个负载的运行状态信息,并将所述功率信息与所述运行状态信息发送给所述BMC。
具体的,采集单元采集负载端信息的具体过程如下:
功率信息采集部分:采用AD转换芯片,AD转换芯片为多路输入输出对各个负载的端电压进行检测,同时为了节省检测芯片数量,相同类型负载采样同一个转换芯片,同一类型的负载中,相同电压值的端电压经过与逻辑门后汇总至同一转换芯片引脚;此外功率信息采集部分还对各供电端口引脚的电流值进行采样,对于含电流检测引脚的芯片,直接对其进行采样,对于不含电流采样引脚的芯片利用采样电阻的方式进行采样,采样后得到反映电流大小的电压值;
状态信息采集部分:采用I2C链路传输负载的状态信息,传输的状态信息以BMC的日志中记录的出现过的运行状态信息为基准,此日志能够不断补充记录新的运行状态信息,运行状态信息包括各负载运行中的温度信息、当前时刻CPU(中央处理器)的PCIE(一种高速串行计算机扩展总线标准)通道传输数据情况、CPU镜像冗余情况、CPLD控制单元的运行状态以及各类热插拔通道模块上记录的传输信号等,BMC单元对基于I2C链路采集的数据以及AD转换芯片采集的数据进行汇总。
在一些实施方式中,所述历史场景树包含历史所有场景树的集合;将所述场景树与历史场景树进行对比,并基于对比结果向CPLD发送对应的指令包括:
将生成的场景树与所述历史所有场景树的集合进行对比;
响应于所述生成的场景树与所述历史所有场景树的集合中任意一个场景树相同,则向CPLD发送执行现有保护措施的命令;
响应于所述生成的场景树与所述历史所有场景树的集合中任意一个场景树均不相同,则向CPLD发送所述生成的场景树和场景预测命令。
在一些实施方式中,所述CPLD基于接收到的指令执行相应的操作包括:
响应于所述CPLD接收到所述生成的场景树和所述场景预测命令,根据预设相似度从所述历史所有场景树中获取相似的树枝以及相应的场景因子;
基于所述相似的树枝以及相应的场景因子,对所述生成的场景树进行场景预测;
基于场景预测结果,在硬件和软件上分别进行相应的准备操作。
在一些实施方式中,在硬件和软件上分别进行相应的准备操作包括:
在硬件上使能对应场景冗余的保护电路以及通路;
在软件上对预测出的场景进行二次预测,并响应于二次预测结果为异常场景,则对对应负载进行镜像备份。
具体的,如图5所示,为基于生成的场景树对负载进行保护的流程图。
在BMC中,将生成的场景树或复合场景树与记录的历史场景树作对比,当场景树中的分支跟历史记录相同时,BMC根据原有的应对该场景的措施向CPLD发出指令,CPLD控制负载端及各类保护措施正常工作;当生成的场景树或复合场景树与记录的历史场景树相比,出现了未知的状态信息时,BMC首先记录该场景树并在存储设备运行阶段将此状态作为日志汇报给后台,同时将当前的场景树信息传递给CPLD。CPLD作为一个强大的数据处理单元,当未知的状态场景树信息传递给CPLD时,CPLD会优先从已知场景树集合中根据相似度选取出与未知场景树相似度高的场景树枝,并进行相关的状态信息提取,根据提取的大量场景分支集对当前场景下下一步可能出现的场景进行预测,预测算法可以利用神经网络、贝叶斯分布等大量统计学方法,从而确定好下一步可能出现的场景,并做出相应准备工作。
准备工作包括硬件上与软件上两部分,硬件上使能对应场景保护电路以及通路的冗余措施,软件上包括对未知场景树的二次预测,若预测出异常场景,则对对应负载的数据单元进行镜像备份。
保护措施是研发人员针对系统运行过程中出现过的问题而制定的,包括硬件上的开关断开、冗余备电等,软件上的负载变功率、变模式运行等,保护措施的算法流程存到CPLD控制单元中。CPLD会对场景的场景进行判断,判断出场景可能会出现异常危险时做出准备措施。
保护措施视具体场景而定,基于保护措施将大量的场景进行归类划分。例如:当负载端过压、过流等异常场景出现时,CPLD按照原有的准备措施启动对应的保护措施,当大功率负载出现负载端过压时,CPLD控制的电源使能端会及时切断供电,同时按照之前的冗余准备查找备用的负载设备,控制负载设备工作,当准备过程中已查找到负载设备不存在时,及时做好数据备份工作的启用准备,上述的保护流程实例不单单用于一种负载及其状态场景,还可应用于其他的场景。虽然生成的场景树各种各样,但在保护过程中,需要将场景按照保护措施进行分类,这种分类由经验信息所得,不同类型且不同运行状态的负载当异常情况发生时,可能采取相同的保护措施。
在一些实施方式中,在响应于所述负载未出现异常,所述BMC基于所述功率信息和运行状态信息生成场景树步骤之后,方法进一步包括:
响应于所述场景树为初始场景树,所述BMC将生成的场景树与虚拟场景树进行对比,并基于对比结果向CPLD发送对应的指令。
在一些实施方式中,所述虚拟场景树基于以下步骤生成:
获取电源供电信息以及负载的功率参数与状态参数;
获取负载厂商提供的负载原厂测试信息,并对负载原厂测试信息进行状态量化处理;
将所述电源供电信息以及所述负载的功率参数与状态参数作为场景因子以生成场景树;
基于量化处理后的各个负载的测试信息优化所述虚拟场景树。
具体的,当第一次生成初始场景时,对比过程的对比对象由历史记录中的场景树变为虚拟场景,虚拟场景为人为制定出的,系统运行中极大概率可能出现的场景,人为制定虚拟场景的目的是对系统运行过程中可能出现的状况进行预估,且场景准备操作中对比场景过程优先对比虚拟场景,便于更快捷的优化系统运行并制定保护措施,制定虚拟场景可分为如下几步:向BMC单元录入电源供电信息、负载的功率信息与状态参数;根据器件(负载)厂商提供的器件原厂测试信息,将原厂测试中器件跑出的状态量化处理;根据在BMC单元录入的功率、状态参数作为场景因子,按之前的方法生成场景树;根据原厂测试过程中的器件状态信息,对场景树的枝干信息进行完善丰富。
基于同一发明构思,根据本发明的另一个方面,如图6所示,本发明的实施例还提供了一种对服务器主板负载端进行保护的系统,包括采集单元110、BMC 120和CPLD 130;
所述采集单元110配置为采集主板负载端的功率信息与运行状态信息并发送给BMC 120,其中,所述负载端为所述主板上连接的所有负载;
所述BMC 120配置为将接收到的负载的功率信息和运行状态信息与所述负载的预设信息进行比较,以判断所述负载是否出现异常;
所述BMC 120还配置为响应于所述负载未出现异常,基于所述功率信息和运行状态信息生成场景树;
所述BMC 120还配置为响应于所述场景树不为初始场景树,将所述场景树与历史场景树进行对比,并基于对比结果向CPLD 130发送对应的指令;
所述CPLD 130配置为基于接收到的指令执行相应的操作以对对应负载进行保护。
在一些实施方式中,所述BMC120还配置为:
基于所述功率信息确定所述负载的负载类型;
将所述负载类型作为场景树的底层树干,将同一负载类型下的负载作为所述底层树干的树枝,将所述负载的功率信息和运行状态信息作为所述树枝的场景因子,以此生成场景树。
在一些实施方式中,所述BMC120还配置为对生成的场景树进行场景因子合并以生成复合场景树。
基于同一发明构思,根据本发明的又一个方面,如图7所示,本发明的实施例还提供了一种计算机设备30,包括:
至少一个处理器310;以及
存储器320,所述存储器320存储有可在所述处理器上运行的计算机程序321,所述处理器310执行所述程序321时执行本发明所述的方法的步骤。
其中,存储器作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的所述对服务器主板负载端进行保护的方法对应的程序指令/模块。处理器通过运行存储在存储器中的非易失性软件程序、指令以及模块,从而执行装置的各种功能应用以及数据处理,即实现上述方法实施例的对服务器主板负载端进行保护的方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据装置的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至本地模块。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
基于同一发明构思,根据本发明的另一个方面,如图8所示,本发明的实施例还提供了一种计算机可读存储介质40,计算机可读存储介质40存储有被处理器执行时执行本发明所述的方法的计算机程序410。
最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,程序的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。
Claims (13)
1.一种对服务器主板负载端进行保护的方法,其特征在于,包括:
采集单元采集主板负载端的功率信息与运行状态信息并发送给BMC,其中,所述负载端为所述主板上连接的所有负载;
所述BMC将接收到的负载的功率信息和运行状态信息与所述负载的预设信息进行比较,以判断所述负载是否出现异常;
响应于所述负载未出现异常,所述BMC基于所述功率信息和运行状态信息生成场景树;
响应于所述场景树不为初始场景树,所述BMC将所述场景树与历史场景树进行对比,并基于对比结果向CPLD发送对应的指令;
所述CPLD基于接收到的指令执行相应的操作以对对应负载进行保护;
其中,基于所述功率信息和运行状态信息生成场景树包括:
基于所述功率信息确定所述负载的负载类型;
将所述负载类型作为场景树的底层树干,将同一负载类型下的负载作为所述底层树干的树枝,将所述负载的功率信息和运行状态信息作为所述树枝的场景因子,以此生成场景树。
2.根据权利要求1所述的方法,其特征在于,进一步包括:
对生成的场景树进行场景因子合并以生成复合场景树。
3.根据权利要求2所述的方法,其特征在于,对生成的场景树进行场景因子合并以生成复合场景树包括:
将相互耦合的场景因子进行耦合以生成复合场景因子和独立场景因子;
确定所述复合场景因子中的主导因子,并将所述主导因子所在的负载作为所述复合场景因子的负载,以此生成复合场景树。
4.根据权利要求1所述的方法,其特征在于,采集单元采集主板负载端的功率信息与运行状态信息并发送给BMC包括:
采集单元通过AD转换芯片采集各个负载的功率信息,并通过I2C链路采集各个负载的运行状态信息,并将所述功率信息与所述运行状态信息发送给所述BMC。
5.根据权利要求1所述的方法,其特征在于,所述历史场景树包含历史所有场景树的集合;
将所述场景树与历史场景树进行对比,并基于对比结果向CPLD发送对应的指令包括:
将生成的场景树与所述历史所有场景树的集合进行对比;
响应于所述生成的场景树与所述历史所有场景树的集合中任意一个场景树相同,则向CPLD发送执行现有保护措施的命令;
响应于所述生成的场景树与所述历史所有场景树的集合中任意一个场景树均不相同,则向CPLD发送所述生成的场景树和场景预测命令。
6.根据权利要求5所述的方法,其特征在于,所述CPLD基于接收到的指令执行相应的操作包括:
响应于所述CPLD接收到所述生成的场景树和所述场景预测命令,根据预设相似度从所述历史所有场景树中获取相似的树枝以及相应的场景因子;
基于所述相似的树枝以及相应的场景因子,对所述生成的场景树进行场景预测;
基于场景预测结果,在硬件和软件上分别进行相应的准备操作。
7.根据权利要求6所述的方法,其特征在于,在硬件和软件上分别进行相应的准备操作包括:
在硬件上使能对应场景冗余的保护电路以及通路;
在软件上对预测出的场景进行二次预测,并响应于二次预测结果为异常场景,则对对应负载进行镜像备份。
8.根据权利要求1所述的方法,其特征在于,在响应于所述负载未出现异常,所述BMC基于所述功率信息和运行状态信息生成场景树步骤之后,方法进一步包括:
响应于所述场景树为初始场景树,所述BMC将生成的场景树与虚拟场景树进行对比,并基于对比结果向CPLD发送对应的指令。
9.根据权利要求8所述的方法,其特征在于,所述虚拟场景树基于以下步骤生成:
获取电源供电信息以及负载的功率参数与状态参数;
获取负载厂商提供的负载原厂测试信息,并对负载原厂测试信息进行状态量化处理;
将所述电源供电信息以及所述负载的功率参数与状态参数作为场景因子以生成场景树;
基于量化处理后的各个负载的测试信息优化所述虚拟场景树。
10.一种对服务器主板负载端进行保护的系统,其特征在于,包括:采集单元、BMC和CPLD;
所述采集单元配置为采集主板负载端的功率信息与运行状态信息并发送给BMC,其中,所述负载端为所述主板上连接的所有负载;
所述BMC配置为将接收到的负载的功率信息和运行状态信息与所述负载的预设信息进行比较,以判断所述负载是否出现异常;
所述BMC还配置为响应于所述负载未出现异常,基于所述功率信息和运行状态信息生成场景树;
所述BMC还配置为响应于所述场景树不为初始场景树,将所述场景树与历史场景树进行对比,并基于对比结果向CPLD发送对应的指令;
所述CPLD配置为基于接收到的指令执行相应的操作以对对应负载进行保护;
其中,所述BMC还配置为:
基于所述功率信息确定所述负载的负载类型;
将所述负载类型作为场景树的底层树干,将同一负载类型下的负载作为所述底层树干的树枝,将所述负载的功率信息和运行状态信息作为所述树枝的场景因子,以此生成场景树。
11.根据权利要求10所述的对服务器主板负载端进行保护的系统,其特征在于,所述BMC还配置为对生成的场景树进行场景因子合并以生成复合场景树。
12. 一种计算机设备,其特征在于,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机程序,其中,所述处理器执行所述程序时执行如权利要求1至9任意一项所述的方法的步骤。
13.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时执行如权利要求1至9任意一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210610968.0A CN114816024B (zh) | 2022-05-31 | 2022-05-31 | 对服务器主板负载端进行保护的方法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210610968.0A CN114816024B (zh) | 2022-05-31 | 2022-05-31 | 对服务器主板负载端进行保护的方法、系统、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114816024A CN114816024A (zh) | 2022-07-29 |
CN114816024B true CN114816024B (zh) | 2023-07-14 |
Family
ID=82519670
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210610968.0A Active CN114816024B (zh) | 2022-05-31 | 2022-05-31 | 对服务器主板负载端进行保护的方法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114816024B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111475288A (zh) * | 2020-03-27 | 2020-07-31 | 苏州浪潮智能科技有限公司 | 一种服务器及其供电保护系统 |
CN112799950A (zh) * | 2021-02-04 | 2021-05-14 | 北京中交兴路信息科技有限公司 | 后台服务的负载能力测试系统、方法、存储介质及电子设备 |
CN113204277A (zh) * | 2021-04-29 | 2021-08-03 | 山东英信计算机技术有限公司 | 一种多功率cpu的过流保护方法、装置、设备及可读介质 |
CN113589913A (zh) * | 2021-09-27 | 2021-11-02 | 苏州浪潮智能科技有限公司 | 一种cpu性能调节方法、装置及介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10795746B2 (en) * | 2018-12-13 | 2020-10-06 | Micron Technology, Inc. | Automated power down based on state of firmware |
US11158477B2 (en) * | 2020-02-21 | 2021-10-26 | Rockwell Automation Technologies, Inc. | Motor control center with enhanced circuit disconnect |
-
2022
- 2022-05-31 CN CN202210610968.0A patent/CN114816024B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111475288A (zh) * | 2020-03-27 | 2020-07-31 | 苏州浪潮智能科技有限公司 | 一种服务器及其供电保护系统 |
CN112799950A (zh) * | 2021-02-04 | 2021-05-14 | 北京中交兴路信息科技有限公司 | 后台服务的负载能力测试系统、方法、存储介质及电子设备 |
CN113204277A (zh) * | 2021-04-29 | 2021-08-03 | 山东英信计算机技术有限公司 | 一种多功率cpu的过流保护方法、装置、设备及可读介质 |
CN113589913A (zh) * | 2021-09-27 | 2021-11-02 | 苏州浪潮智能科技有限公司 | 一种cpu性能调节方法、装置及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114816024A (zh) | 2022-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113239627B (zh) | 一种分布式智能监控方法和装置 | |
CN110456234B (zh) | 故障电弧的检测方法、装置和系统 | |
CN110739661B (zh) | 一种过流保护装置及板卡 | |
CN112834865B (zh) | 一种电力系统二次回路故障快速查找器 | |
CN113285431A (zh) | 一种智能配电网信息物理融合保护系统及方法 | |
CN110165632A (zh) | 应用于电子设备的断电复位系统 | |
CN105515202B (zh) | 数据采集、处理和发送装置、数据处理和发送的方法 | |
CN116014850A (zh) | 一种储能电池控制优化方法、装置及电子设备 | |
CN104682544A (zh) | 备自投方法和装置 | |
CN114816024B (zh) | 对服务器主板负载端进行保护的方法、系统、设备及介质 | |
CN111641214B (zh) | 一种稳定限额监视校核系统 | |
CN104201784B (zh) | 一种输电线路在线监测系统及其运行状况监控方法和装置 | |
CN117543824A (zh) | 一种用于变电站管理的一键顺控系统 | |
CN104795796A (zh) | 智能环网柜的电机故障监控装置及方法 | |
CN116382227A (zh) | 一种自动化装备远程诊断方法及其系统、电子设备 | |
CN104348153B (zh) | 地区电网主设备故障自动转供电控制执行方法 | |
CN109688679B (zh) | 故障原因的确定方法及装置 | |
CN110531646B (zh) | 基于fpga的功率组件系统故障数据采集方法及系统 | |
CN118523313B (zh) | 基于电流电压监控的数据采集终端过载保护方法及系统 | |
CN117289144B (zh) | 一种故障定位方法、装置、设备、系统和介质 | |
CN117289145B (zh) | 故障分析方法、数据采集方法、装置、设备、系统和介质 | |
CN117955560A (zh) | 光分路器以及光纤传输系统监测方法 | |
CN116909375B (zh) | 主板电源电路、电源健康管控方法、电子设备及存储介质 | |
CN114079322B (zh) | 断路器数据管理方法及智能电网系统 | |
CN110554649B (zh) | 基于面向对象的变电站程序化控制装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |