发明内容
本发明实施例提供一种供电故障处理的方法,能够解决了现有技术中由于不间断电源的供电能力有限,无法在不间断电源的有效供电时间内关闭所有设备而导致仍然异常断电的问题。
本发明第一方面提供一种供电故障处理的方法,所述方法应用于数据中心系统,所述数据中心系统中包括多个设备和不间断电源,所述不间断电源用于在所述多个设备的供电状态异常时为所述多个设备供电,所述方法包括:
监测所述多个设备的供电状态;
当监测到所述供电状态异常时,获取设备断电保护策略,所述设备断电保护策略包含所述多个设备中被保护设备的断电保护优先级;
在所述不间断电源供电时,按照所述被保护设备的断电保护优先级,控制所述被保护设备关机。
结合本发明实施例的第一方面,本发明实施例的第一方面的第一种实现方式中,所述多个设备中的每个设备上运行至少一种业务系统,且每种业务系统对应一个业务优先级,所述获取设备断电保护策略之前,所述方法还包括:
将所述每个设备中优先级最高的业务系统所对应的业务优先级,确定为所述每个设备的断电保护优先级;
将所述断电保护优先级高于预设阈值的设备确定为所述被保护设备;
建立所述被保护设备的设备标识和与所述被保护设备对应的断电保护优先级的对应关系;
将所述对应关系添加到所述设备断电保护策略中;
所述获取设备断电保护策略,包括:
获取所述对应关系;
所述按照所述被保护设备的断电保护优先级,控制所述被保护设备关机,包括:
根据所述被保护设备的设备标识,从所述对应关系中确定所述被保护设备的断电保护优先级;
根据所述被保护设备的断电保护优先级,控制所述被保护设备关机。
结合本发明实施例的第一方面的第一种实现方式,本发明实施例的第一方面的第二种实现方式中,当监测到所述每个设备中任意一个设备上运行的业务系统的数量发生变化时,更新所述设备断电保护策略,包括:
当监测到所述任意一个设备上增加了至少一种新业务系统,且所述至少一种新业务系统的最高业务优先级高于增加前所述任意一个设备的断电保护优先级时,将所述任意一个设备的断电保护优先级更新为所述至少一种新业务系统的最高业务优先级;
当所述任意一个设备的断电优先级高于所述预设阈值,且所述任意一个设备的设备标识与所述任意一个设备更新后的断电保护优先级的对应关系未添加在所述设备断电保护策略中时,将所述任意一个设备的设备标识与所述任意一个设备更新后的断电保护优先级的对应关系添加到所述设备断电保护策略中。
结合本发明实施例的第一方面的第一种实现方式,本发明实施例的第一方面的第三种实现方式中,所述当监测到所述每个设备中任意一个设备上运行的业务系统的数量发生变化时,更新所述设备断电保护策略,包括:
当监测到所述任意一个设备上减少了至少一种业务系统,且所述至少一种业务系统的最高业务优先级为所述任意一个设备的断电保护优先级时,将所述任意一个设备上运行的剩余业务系统中的最高业务优先级更新为所述任意一个设备的断电保护优先级,所述剩余业务系统为除所述至少一种业务系统之外的业务系统;
当所述任意一个设备的断电保护优先级低于或等于所述预设阈值,且所述任意一个设备的设备标识与所述任意一个设备更新前的断电优先级的对应关系已添加在所述设备断电保护策略中时,将所述任意一个设备的设备标识与所述任意一个设备更新前的断电优先级的对应关系从所述设备断电保护策略中删除。
结合本发明实施例的第一方面、本发明实施例的第一方面的第一至第三种实现方式中的任意一种,在本发明实施例的第一方面的第四种实现方式中,所述在所述不间断电源供电时,按照所述被保护设备的断电保护优先级,控制所述被保护设备关机之前,所述方法还包括:
获取所述被保护设备中最大的安全关机时长和所述不间断电源的供电时长;
根据所述被保护设备中最大的安全关机时长和所述不间断电源的供电时长,确定关闭所述被保护设备的最迟关机时间点;
在所述最迟关机时间点到来前,按照所述被保护设备的断电保护优先级,控制所述被保护设备关机。
结合本发明实施例的第一方面,本发明实施例的第一方面的第五种实现方式中,所述按照所述被保护设备的断电保护优先级,控制所述被保护设备关机时,所述方法还包括:
获取所述被保护设备中最新的最大安全关机时长;
当所述最新的最大安全关机时长不等于控制关机前的最大的安全关机时长时,将所述关机前的最大的安全关机时长更新为所述最新的最大安全关机时长。
结合本发明实施例的第一方面、本发明实施例的第一方面的第一至第五种实现方式中的任意一种,在本发明实施例的第一方面的第六种实现方式中,所述按照所述被保护设备的断电保护优先级,控制所述被保护设备关机之后,所述方法还包括:
持续监测当前所述多个设备的供电状态;
当监测到当前所述多个设备的供电状态正常时,按照所述被保护设备的断电保护优先级,控制所述被保护设备开机。
结合本发明实施例的第一方面、本发明实施例的第一方面的第一至第六种实现方式中的任意一种,在本发明实施例的第一方面的第七种实现方式中,所述监测所述多个设备的供电状态,包括:
监测市电交流输入电压,并将所述市电交流输入电压与预设的第一门限值和第二门限值进行比较,所述第二门限值大于所述第一门限值;
当所述市电交流输入电压小于所述第一门限值时,确定所述供电状态异常;
当所述市电交流输入电压大于所述第二门限值时,确定所述供电状态正常。
本发明实施例的第二方面提供了一种供电故障处理的装置,所述装置应用于数据中心系统,所述数据中心系统中包括多个设备和不间断电源,所述不间断电源用于在所述多个设备的供电状态异常时为所述多个设备供电,所述装置包括:
第一监测单元,用于监测所述多个设备的供电状态;
第一获取单元,用于当监测到所述供电状态异常时,获取设备断电保护策略,所述设备断电保护策略包含所述多个设备中被保护设备的断电保护优先级;
第一控制单元,用于在所述不间断电源供电时,按照所述被保护设备的断电保护优先级,控制所述被保护设备关机。
结合本发明实施例的第二方面,本发明实施例的第二方面的第一种实现方式中,所述装置还包括:
第一确定单元,用于确定所述每个设备的断电保护优先级,所述断电保护优先级为所述每个设备中优先级最高的业务系统所对应的业务优先级;
第二确定单元,用于将所述断电保护优先级高于预设阈值的设备确定为所述被保护设备;
建立单元,用于建立所述被保护设备的设备标识和与所述被保护设备对应的断电保护优先级的对应关系;
所述第一获取单元包括:
第一获取模块,用于获取所述建立单元建立的所述对应关系;
第二获取模块,用于获取所述被保护设备的断电保护优先级;
所述第一控制单元包括:
第一确定模块,用于根据所述被保护设备的设备标识,从所述第一获取模块获取的所述对应关系中确定所述被保护设备的断电保护优先级;
第一控制模块,用于根据所述第一确定模块确定的所述断电保护优先级,控制具有相同断电保护优先级的被保护设备并行关机。
结合本发明实施例的第二方面,本发明实施例的第二方面的第二种实现方式中,所述装置还包括:
第二监测单元,用于监测所述每个设备上运行的业务系统的数量;
第一更新单元,用于当监测到所述多个设备中任意一个设备上运行的业务系统的数量发生变化时,更新所述设备断电保护策略和所述断电保护优先级。
进一步,所述第一更新单元包括:
第一更新模块,用于当第二监测单元监测到所述任意一个设备上增加了至少一个新业务系统,且所述至少一种新业务系统的最高业务优先级高于增加前所述任意一个设备的断电保护优先级时,将所述任意一个设备的断电保护优先级更新为所述至少一种新业务系统的最高业务优先级;
第二更新模块,用于当所述任意一个设备的断电优先级高于所述预设阈值,且所述任意一个设备的设备标识与所述任意一个设备更新后的断电保护优先级的对应关系未添加在所述设备断电保护策略中时,将所述任意一个设备的设备标识与所述任意一个设备更新后的断电保护优先级的对应关系添加到所述设备断电保护策略中。
结合本发明实施例的第二方面的第二种实现方式,本发明实施例的第二方面的第三种实现方式中,所述第一更新单元还包括:
第三更新模块,用于当监测到所述任意一个设备上减少了至少一种业务系统,且所述至少一种业务系统的最高业务优先级为所述任意一个设备的断电保护优先级时,将所述任意一个设备上运行的剩余业务系统中的最高业务优先级更新为所述任意一个设备的断电保护优先级,所述剩余业务系统为除所述至少一种业务系统之外的业务系统;
第一删除模块,用于当所述任意一个设备的断电保护优先级低于或等于所述预设阈值,且所述任意一个设备的设备标识与所述任意一个设备更新前的断电优先级的对应关系已添加在所述设备断电保护策略中时,将所述任意一个设备的设备标识与所述任意一个设备更新前的断电优先级的对应关系从所述设备断电保护策略中删除。
结合本发明实施例的第二方面、本发明实施例的第二方面的第一种实现方式至第三种实现方式,本发明实施例的第二方面的第四种实现方式中,所述装置还包括:
第二获取单元,用于获取所述被保护设备中最大的安全关机时长和所述不间断电源的供电时长;
第三确定单元,用于根据所述被保护设备中最大的安全关机时长和所述不间断电源的供电时长,确定关闭所述被保护设备的最迟关机时间点;
第二控制单元,用于在所述最迟关机时间点到来前,按照所述被保护设备的断电保护优先级,控制所述被保护设备关机。
第三获取单元,用于获取所述被保护设备中最新的最大安全关机时长;
第二更新单元,用于当所述最新的最大安全关机时长不等于控制关机前的最大的安全关机时长时,将所述关机前的最大的安全关机时长更新为所述最新的最大安全关机时长。
结合本发明实施例的第二方面、本发明实施例的第二方面的第一种实现方式至第三种实现方式,本发明实施例的第二方面的第五种实现方式中,所述装置还包括:
第三监测单元,用于监测市电交流输入电压;
第一比较单元,用于将所述市电交流输入电压与预设的第一门限值和第二门限值进行比较,所述第二门限值大于所述第一门限值;
第四确定单元,用于当所述市电交流输入电压小于所述第一门限值时,确定所述供电状态异常;
第五确定单元,用于当所述市电交流输入电压大于所述第二门限值时,确定所述供电状态正常。
本发明实施例的第三方面提供了一种供电故障处理系统,包括:
供电监测设备,用于监测数据中心系统中多个设备的供电状态;
策略管理终端,用于在所述供电监测模块监测到所述供电状态异常时,建立设备断电保护策略;
断电保护设备,用于在不间断电源供电时,根据所述策略管理引擎建立的所述设备断电保护策略来控制所述多个设备中被保护设备关机。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例中,监测所述多个设备的供电状态;当监测到所述供电状态异常时,获取设备断电保护策略,所述设备断电保护策略包含所述多个设备中被保护设备的断电保护优先级;在所述不间断电源供电时,按照所述被保护设备的断电保护优先级,控制所述被保护设备关机,解决了现有技术中由于不间断电源的供电能力有限,无法在不间断电源的有效供电时间内关闭所有设备而导致仍然异常断电的问题。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本发明实施例提供了一种供电故障处理的方法及装置,用于解决不间断电源供电时,未安全关闭所有设备而导致仍然异常断电的问题。以下进行详细说明。
本发明实施例应用于数据中心系统,数据中心系统中包括多个设备和不间断电源,不间断电源用于在多个设备的供电状态异常时为多个设备供电。请参照图1,本发明实施例中一种供电故障处理的方法一个实施例包括:
101、监测多个设备的供电状态;
对数据中心系统中多个设备的供电状态进行持续监测,该供电状态可以包括断开状态、待机状态以及开启状态中的任意一个。
102、当监测到供电状态异常时,获取设备断电保护策略;
在监测到供电状态异常时,获取预先设置好的设备断电保护策略,其中,设备断电保护策略包含多个设备中被保护设备的断电保护优先级。
103、在不间断电源供电时,按照被保护设备的断电保护优先级,控制被保护设备关机。
在确定供电状态异常后,不间断电源开始为多个设备供电,在不间断电源供电期间控制被保护设备安全关机。
本发明实施例提供的一种供电故障管理方法,通过持续监测到多个设备的供电状态,当供电状态异常时,获取设备断电保护策略,不间断电源为多个设备供电,按照被保护设备的断电保护优先级,控制被保护设备安全关机,解决了现有技术中由于不间断电源的供电能力有限,无法在不间断电源的有效供电时间内关闭所有设备而导致仍然异常断电的问题。
上面实施例中,设备断电保护策略包含被保护设备的断电保护优先级,根据被保护设备的断电保护优先级,控制被保护设备关机,在实际应用中,多个设备中的每个设备上运行至少一种业务系统,且每种业务系统对应一个业务优先级,被保护设备的断电保护优先级可以根据被保护设备上运行的业务系统的业务优先级来确定,需要说明的是,业务系统的业务优先级可以自定义也可以采用预先的计算方式来计算,只要能确定业务系统的业务优先级即可,具体实现方式本文中均不作限定,本实施例中,以关于如何建立设备断电保护策略,确定断电保护优先级方式来进行描述,具体请参阅图2,本发明实施例一种供电故障处理的方法另一实施例包括:
201、监测多个设备的供电状态;
对数据中心系统中多个设备的供电状态进行持续监测。
202、建立设备断电保护策略;
建立被保护设备的设备标识和与被保护设备对应的断电保护优先级的对应关系,该断电保护优先级为每个设备运行中的业务系统的最高优先级;
将该对应关系添加到设备断电保护策略中。
203、判断多个设备的供电状态是否异常,若是,则进入步骤204,若否,返回步骤201;
本实施例中的供电状态可以包括断开状态、待机状态以及开启状态中的任意一个。
判断供电状态是否异常的具体方式可以为:
监测市电交流输入电压,并将市电交流输入电压与预设的第一门限值进行比较,当市电交流输入电压小于第一门限值时,确定供电状态异常,第一门限值取值范围为45v-55v。
需要说明的是,上面仅以一个例子说明了判断供电状态是否异常的具体方式,在实际应用中,可以通过异常报警或者其他判断方式,只要能确定供电状态异常即可,具体此处不作限定。
204、当确定供电状态异常时,确定被保护设备的断电保护优先级;
将每个设备中优先级最高的业务系统所对应的业务优先级,确定为每个设备的断电保护优先级;
并将断电保护优先级高于预设阈值的设备确定为被保护设备;
205、获取设备断电保护策略;
在监测到供电状态异常时,获取设备断电保护策略,并获取设备保护策略中的对应关系,其中,设备断电保护策略包含多个设备中被保护设备的断电保护优先级。
206、在不间断电源供电时,按照被保护设备的断电保护优先级,控制被保护设备关机。
在确定供电状态异常后,不间断电源开始为多个设备供电,在不间断电源供电期间控制具有相同断电保护优先级的被保护设备并行关机。
本实施例中,在设备上的业务系统运行中,当检测到供电状态异常时,保证在不间断电源供电期间,将所有被保护设备按照设备断电保护优先级都安全关机,避免了人为错误操作导致其他设备无法正常关机以及未及时处理而导致设备仍然异常断电的风险,不需要人工手动关机,提高了工作效率,另外,通过监测设备上运行中的业务系统的数量,及时更新设备上运行的系统信息和设备断电保护策略,避免了新增的被保护设备未在设备断电保护策略中而引起的异常断电,使得断电保护机制更加完善,并且通过建立供电状态恢复正常后自动控制被保护设备开机的机制,实现恢复业务系统正常运行。
下面以更新设备的断电保护优先级和设备断电保护策略为例对本发明实施例进行描述,具体请参阅图3,本发明中一种供电故障处理的方法另一实施例包括:
301、监测多个设备的供电状态和每个设备上运行的业务系统的数量;
对数据中心系统中多个设备的供电状态进行持续监测。
当监测到每个设备上运行的业务系统的数量发生变化时,进入步骤303;若未发生变化,则进入步骤304。
302、建立设备断电保护策略;
建立被保护设备的设备标识和与被保护设备对应的断电保护优先级的对应关系,该断电保护优先级为每个设备运行中的业务系统的最高优先级;
将该对应关系添加到设备断电保护策略中。
303、当监测到每个设备上运行的业务系统的数量发生变化时,更新设备的断电保护优先级和设备断电保护策略;
具体更新方式如下:
当监测到所述任意一个设备上增加了至少一个新业务系统,且所述至少一种新业务系统的最高业务优先级高于增加前所述任意一个设备的断电保护优先级时,将所述任意一个设备的断电保护优先级更新为所述至少一种新业务系统的最高业务优先级;
当所述任意一个设备的断电优先级高于所述预设阈值,且所述任意一个设备的设备标识与所述任意一个设备更新后的断电保护优先级的对应关系未添加在所述设备断电保护策略中时,将所述任意一个设备的设备标识与所述任意一个设备更新后的断电保护优先级的对应关系添加到所述设备断电保护策略中。
和/或
当监测到所述任意一个设备上减少了至少一种业务系统,且所述至少一种业务系统的最高业务优先级为所述任意一个设备的断电保护优先级时,将所述任意一个设备上运行的剩余业务系统中的最高业务优先级更新为所述任意一个设备的断电保护优先级,所述剩余业务系统为除所述至少一种业务系统之外的业务系统;
当所述任意一个设备的断电保护优先级低于或等于所述预设阈值,且所述任意一个设备的设备标识与所述任意一个设备更新前的断电优先级的对应关系已添加在所述设备断电保护策略中时,将所述任意一个设备的设备标识与所述任意一个设备更新前的断电优先级的对应关系从所述设备断电保护策略中删除。
需要说明的是,本发明实施例中,可以是同一时间在不同设备上新增和/或删除业务系统,也可以在不同时间在不同设备上新增和/或删除业务系统,也可以只在一个设备上新增和/或删除业务系统,也可以在一个设备上先后进行新增或删除业务系统,相应的,根据新增和/或删除业务系统来更新设备的断电保护优先级和设备断电保护策略,具体此处均不作限定。
304、判断多个设备的供电状态是否异常,若是,则进入步骤305,若否,返回步骤301;
本实施例中的供电状态可以包括断开状态、待机状态以及开启状态中的任意一个。
判断供电状态是否异常的具体方式可以为:
监测市电交流输入电压,并将市电交流输入电压与预设的第一门限值进行比较;
当所述市电交流输入电压小于第一门限值时,确定供电状态异常,第一门限值取值范围为45v-55v。
需要说明的是,上面仅以几个例子说明了判断供电状态是否异常的具体方式,在实际应用中,可以通过异常报警或者其他判断方式,只要能确定供电状态异常即可,具体的判断方式此处不作限定。
305、当确定供电状态异常时,获取设备断电保护策略;
在监测到供电状态异常时,获取设备断电保护策略,并获取设备保护策略中的对应关系,其中,设备断电保护策略包含多个设备中被保护设备的断电保护优先级。
306、确定被保护设备的断电保护优先级;
将每个设备中优先级最高的业务系统所对应的业务优先级,确定为每个设备的断电保护优先级;
并将断电保护优先级高于预设阈值的设备确定为被保护设备;
307、在不间断电源供电时,按照被保护设备的断电保护优先级,具有相同断电保护优先级的被保护设备并行关机。
在确定供电状态异常后,不间断电源开始为多个设备供电,在不间断电源供电期间控制被保护设备安全关机。
本实施例中,在设备上的业务系统运行中,当检测到供电状态异常时,按照设备断电保护优先级,保证在不间断电源供电期间将所有被保护设备都安全关机,并且不需要人工手动关机,提高了工作效率;另外,通过监测设备上运行中的业务系统的数量,及时更新设备上运行的系统信息和设备断电保护策略,避免了新增的被保护设备未在设备断电保护策略中而引起的异常断电,使得断电保护机制更加完善。
请参阅图4,本实施例以设备中最大的安全关机时长和不间断电源的供电时长的关系确定关机时间为例对本发明进行描述,本发明实施例中另一实施例包括:
401、监测多个设备的供电状态和监测每个设备上运行的业务系统的数量;
对数据中心系统中多个设备的供电状态进行持续监测。
当监测到每个设备上运行的业务系统的数量发生变化时,进入步骤403;若未发生变化,则进入步骤404。
402、建立设备断电保护策略;
建立被保护设备的设备标识和与被保护设备对应的断电保护优先级的对应关系,该断电保护优先级为每个设备运行中的业务系统的最高优先级;
将该对应关系添加到设备断电保护策略中。
403、当监测到每个设备上运行的业务系统的数量发生变化时,更新设备的断电保护优先级和设备断电保护策略;
具体更新方式如下:
当监测到任意一个设备上增加了至少一个新业务系统,且至少一种新业务系统的最高业务优先级高于增加前任意一个设备的断电保护优先级时,将任意一个设备的断电保护优先级更新为至少一种新业务系统的最高业务优先级;
当任意一个设备的断电优先级高于所述预设阈值,且任意一个设备的设备标识与所述任意一个设备更新后的断电保护优先级的对应关系未添加在设备断电保护策略中时,将任意一个设备的设备标识与任意一个设备更新后的断电保护优先级的对应关系添加到设备断电保护策略中。
和/或
当监测到所述任意一个设备上减少了至少一种业务系统,且至少一种业务系统的最高业务优先级为该任意一个设备的断电保护优先级时,将任意一个设备上运行的剩余业务系统中的最高业务优先级更新为任意一个设备的断电保护优先级,剩余业务系统为除至少一种业务系统之外的业务系统;
当任意一个设备的断电保护优先级低于或等于预设阈值,且任意一个设备的设备标识与任意一个设备更新前的断电优先级的对应关系已添加在所述设备断电保护策略中时,将任意一个设备的设备标识与任意一个设备更新前的断电优先级的对应关系从设备断电保护策略中删除。
需要说明的是,本发明实施例中,可以是同一时间在不同设备上新增和/或删除业务系统,也可以在不同时间在不同设备上新增和/或删除业务系统,也可以只在一个设备上新增和/或删除业务系统,也可以在一个设备上先后进行新增或删除业务系统,相应的,根据新增和/或删除业务系统来更新设备的断电保护优先级和设备断电保护策略,具体此处均不作限定。
404、判断多个设备的供电状态是否异常,若是,则进入步骤405,若否,返回步骤401;
本实施例中的供电状态可以包括断开状态、待机状态以及开启状态中的任意一个。
判断供电状态是否异常的具体方式可以为:
监测市电交流输入电压,并将所述市电交流输入电压与预设的第一门限值进行比较;
当所述市电交流输入电压小于所述第一门限值时,确定所述供电状态异常,第一门限值取值范围为45v-55v。
需要说明的是,上面仅以几个例子说明了判断供电状态是否异常的具体方式,在实际应用中,可以通过异常报警或者其他判断方式,只要能确定供电状态异常即可,具体的判断方式此处不作限定。
405、当确定供电状态异常时,获取设备断电保护策略;
在监测到供电状态异常时,获取设备断电保护策略,并获取设备保护策略中的对应关系,其中,设备断电保护策略包含多个设备中被保护设备的断电保护优先级。
406、确定被保护设备的断电保护优先级;
将每个设备中优先级最高的业务系统所对应的业务优先级,确定为每个设备的断电保护优先级;
并将断电保护优先级高于预设阈值的设备确定为被保护设备;
407、获取被保护设备中最大的安全关机时长和不间断电源的供电时长;
根据被保护设备中最大的安全关机时长和所述不间断电源的供电时长,确定关闭被保护设备的最迟关机时间点。
408、控制被保护设备关机;
在最迟关机时间点到来前,按照被保护设备的断电保护优先级,控制被保护设备关机。
进一步,本发明实施例还可以包括:
获取被保护设备中最新的最大安全关机时长;
当最新的最大安全关机时长不等于控制关机前的最大的安全关机时长时,将关机前的最大的安全关机时长更新为最新的最大安全关机时长。
本实施例中,在设备上的业务系统运行中,当检测到供电状态异常时,按照设备断电保护优先级,在被保护设备的最大安全关机时长内控制被保护设备均安全并行关机,并且不需要人工手动关机,提高了工作效率;另外,通过监测设备上运行中的业务系统的数量,及时更新设备上运行的系统信息和设备断电保护策略,避免了新增的被保护设备未在设备断电保护策略中而引起的异常断电,使得断电保护机制更加完善。
请参阅图5,本实施例中以供电状态异常时控制关机,供电状态恢复时控制开机为例对本发明实施例进行描述,本发明实施例中一种供电故障处理的方法另一实施例包括:
501、监测多个设备的供电状态和每个设备上运行的业务系统的数量;
对数据中心系统中多个设备的供电状态进行持续监测。
当监测到每个设备上运行的业务系统的数量发生变化时,进入步骤503;
若未发生变化,则进入步骤504。
502、建立设备断电保护策略;
建立被保护设备的设备标识和与被保护设备对应的断电保护优先级的对应关系,该断电保护优先级为每个设备运行中的业务系统的最高优先级;
将该对应关系添加到设备断电保护策略中。
503、当监测到每个设备上运行的业务系统的数量发生变化时,更新设备的断电保护优先级和设备断电保护策略;
具体更新方式如下:
当监测到所述任意一个设备上增加了至少一个新业务系统,且所述至少一种新业务系统的最高业务优先级高于增加前所述任意一个设备的断电保护优先级时,将所述任意一个设备的断电保护优先级更新为所述至少一种新业务系统的最高业务优先级;
当所述任意一个设备的断电优先级高于所述预设阈值,且所述任意一个设备的设备标识与所述任意一个设备更新后的断电保护优先级的对应关系未添加在所述设备断电保护策略中时,将所述任意一个设备的设备标识与所述任意一个设备更新后的断电保护优先级的对应关系添加到所述设备断电保护策略中。
和/或
当监测到所述任意一个设备上减少了至少一种业务系统,且所述至少一种业务系统的最高业务优先级为所述任意一个设备的断电保护优先级时,将所述任意一个设备上运行的剩余业务系统中的最高业务优先级更新为所述任意一个设备的断电保护优先级,所述剩余业务系统为除所述至少一种业务系统之外的业务系统;
当所述任意一个设备的断电保护优先级低于或等于所述预设阈值,且所述任意一个设备的设备标识与所述任意一个设备更新前的断电优先级的对应关系已添加在所述设备断电保护策略中时,将所述任意一个设备的设备标识与所述任意一个设备更新前的断电优先级的对应关系从所述设备断电保护策略中删除。
需要说明的是,本发明实施例中,可以是同一时间在不同设备上新增和/或删除业务系统,也可以在不同时间在不同设备上新增和/或删除业务系统,也可以只在一个设备上新增和/或删除业务系统,也可以在一个设备上先后进行新增或删除业务系统,相应的,根据新增和/或删除业务系统来更新设备的断电保护优先级和设备断电保护策略,具体此处均不作限定。
504、判断多个设备的供电状态是否异常,若是,则进入步骤505,若否,返回步骤501;
本实施例中的供电状态可以包括断开状态、待机状态以及开启状态中的任意一个。
判断供电状态是否异常的具体方式可以为:
监测市电交流输入电压,并将市电交流输入电压与预设的第一门限值进行比较;
当所述市电交流输入电压小于所述第一门限值时,确定所述供电状态异常,第一门限值取值范围为45v-55v。
需要说明的是,上面仅以一个例子说明了判断供电状态是否异常的具体方式,在实际应用中,可以通过异常报警或者其他判断方式,只要能确定供电状态异常即可,具体此处不作限定。
505、当确定供电状态异常时,获取设备断电保护策略;
在监测到供电状态异常时,获取设备断电保护策略,并获取设备保护策略中的对应关系,其中,设备断电保护策略包含多个设备中被保护设备的断电保护优先级。
506、确定被保护设备的断电保护优先级;
将每个设备中优先级最高的业务系统所对应的业务优先级,确定为每个设备的断电保护优先级;
并将断电保护优先级高于预设阈值的设备确定为被保护设备;
在确定供电状态异常后,不间断电源开始为多个设备供电。
507、不间断电源供电期间,控制具有相同断电保护优先级的被保护设备并行关机。
508、持续监测当前多个设备的供电状态;
509、当监测到当前多个设备的供电状态正常时,按照设备断电保护策略,控制被保护设备开机;
确定供电状态正常的方式具体如下:
监测市电交流输入电压,并将市电交流输入电压与第二门限值进行比较,当市电交流输入电压大于第二门限值时,确定供电状态正常,第二门限值取值范围为115v-125v。
需要说明的是,上面仅仅举了在市电交流输入电压大于第二门限值时确定供电状态恢复的具体方式,在实际应用中,还可以采用其他的方式,如监测灯显示绿光等类似的方式,只要能确定供电状态恢复正常即可,具体此处不作限定。
本实施例中,在设备上的业务系统运行中,当检测到供电状态异常时,保证在不间断电源供电期间,将所有被保护设备按照设备断电保护优先级都安全关机,避免了人为错误操作导致其他设备无法正常关机以及未及时处理而导致设备仍然异常断电的风险,不需要人工手动关机,提高了工作效率,另外,通过监测设备上运行中的业务系统的数量,及时更新设备上运行的系统信息和设备断电保护策略,避免了新增的被保护设备未在设备断电保护策略中而引起的异常断电,使得断电保护机制更加完善,并且通过建立供电状态恢复正常后自动控制被保护设备开机的机制,实现恢复业务系统正常运行。
为便于理解,下面以一具体的应用场景为例对供电故障处理的方法进行详细描述,数据中心系统包括设备A、设备B、设备C、设备D,在设备A上增加一个数据库系统和一个Web服务器,其中数据库系统的业务优先级高于Web服务器的业务优先级,其中,设备A、设备B、设备C为被保护设备,不间断电源为UPS。
请参阅图6,本发明实施例中一种供电故障处理的方法另一实施例包括:
601、监测设备的供电状态和每个设备上运行的业务系统的数量;
环境监测模块监测在数据中心系统运行的设备A、设备B、设备C、设备D的供电状态;
并监测设备A、设备B及设备C上运行中的业务系统的数量变化。
602、建立设备断电保护策略;
分别建立被保护设备的设备标识和与被保护设备对应的断电保护优先级的对应关系,该断电保护优先级为每个设备运行中的业务系统的最高优先级;
将该对应关系添加到设备断电保护策略中。
603、当监测到设备A上增加了数据库系统和Web服务器时,更新设备A的断电保护优先级和设备断电保护策略;
具体更新方式如下:
当监测到设备A上增加了数据库系统和Web服务器,且数据库系统的业务优先级高于增加前设备A的断电保护优先级时,将设备A的断电保护优先级更新为数据库系统的业务优先级;
当设备A的断电保护优先级高于预设阈值,且设备A的设备标识与该设备更新后的断电保护优先级的对应关系未添加在设备断电保护策略中时,将设备A的设备标识与该设备更新后的断电保护优先级的对应关系添加到设备断电保护策略中。
604、当所述市电交流输入电压小于50V时,确定所述供电状态异常;
当确定供电状态异常时,UPS为数据中心系统供电。
605、当确定供电状态异常时,确定设备A、B和C的断电保护优先级;
将每个设备中优先级最高的业务系统所对应的业务优先级,确定为每个设备的断电保护优先级;
确定设备A和设备B的断电保护优先级相同,且高于设备C的断电保护优先级。
606、获取设备断电保护策略;
在监测到供电状态异常时,获取设备断电保护策略,并获取设备保护策略中的对应关系,其中,设备断电保护策略包含设备A、B和C的断电保护优先级。
607、计算设备A、B和C的总安全关机时长和UPS的剩余供电时长;
策略管理引擎解析设备断电保护策略,计算出设备A、B和C的总安全关机时长;
同时启动UPS输出功率和UPS电池剩余供电量的实时检测,利用UPS输出功率和UPS电池剩余供电量计算出UPS的剩余供电时长。
608、远程被保护设备并行关机;
当设备A、B和C的总安全关机时长为UPS的剩余供电时长1.0-1.5倍时,按照被保护设备的断电保护优先级,断电保护模块先控制被保护设备即设备A、B和C安全关机,再控制设备D关机;
策略管理引擎分别将设备A、设备B、设备C、设备D的的实际安全关机时长更新到设备安全关机时长经验库。
609、当监测到市电交流输入电压大于120V时,确定供电状态正常。
610、当确定供电状态正常时,控制所有设备开机;
在确定供电状态恢复时,断电保护模块控制设备A、设备B、设备C、设备D远程开机,实现设备和业务系统的自动恢复。
下面介绍本发明实施例中的供电故障处理的装置实施例,该装置应用于数据中心系统,数据中心系统中包括多个设备和不间断电源,不间断电源用于在多个设备的供电状态异常时为多个设备供电。【装置独权实施例】
请参阅图7,本发明实施例包括:
第一监测单元701;用于监测多个设备的供电状态;
第一获取单元702,用于当监测到供电状态异常时,获取设备断电保护策略,设备断电保护策略包含多个设备中被保护设备的断电保护优先级;
第一控制单元703,用于在不间断电源供电时,按照被保护设备的断电保护优先级,控制被保护设备关机。
本实施例中,在第一监测单元701监测到多个设备的供电状态异常时,第一控制单元703根据第一获取单元702获取到的设备断电保护策略,在不间断电源供电期间,控制所有被保护设备均安全关机,解决了现有技术中由于在不间断电源供电期间内未及时做出相应的有效处理而导致设备依然异常断电的问题。
上面实施例中,在不间断电源供电期间,控制单元703根据设备断电保护策略,控制所有被保护设备关机,请参阅图8,本发明实施例中供电故障处理的装置的另一实施例包括:
第一监测单元801,用于监测多个设备的供电状态;
第一获取单元802,用于当监测到供电状态异常时,获取设备断电保护策略,设备断电保护策略包含多个设备中被保护设备的断电保护优先级;
第一控制单元803,用于在不间断电源供电时,按照被保护设备的断电保护优先级,控制被保护设备关机。
本发明实施例中的装置还包括:
第一确定单元804,用于确定每个设备的断电保护优先级,断电保护优先级为每个设备中优先级最高的业务系统所对应的业务优先级;
第二确定单元805,用于将断电保护优先级高于预设阈值的设备确定为被保护设备;
建立单元806,用于建立被保护设备的设备标识和与被保护设备对应的断电保护优先级的对应关系;
本实施例中的第一获取单元802具体包括:
第一获取模块8021,用于获取建立单元806建立的对应关系;
第二获取模块8022,用于获取被保护设备的断电保护优先级;
本实施例中的第一控制单元803具体包括:
第一确定模块8031,用于根据被保护设备的设备标识,从第一获取模块8021获取的对应关系中确定被保护设备的断电保护优先级;
第一控制模块8032,用于根据第一确定模块确定的断电保护优先级,控制具有相同断电保护优先级的被保护设备并行关机。
本实施例中,在第一监测单元801监测到多个设备的供电状态异常时,第一确定模块8031从第一获取模块8021获取的对应关系中确定被保护设备的断电保护优先级,在不间断电源供电期间,第一控制模块8032控制具有相同断电保护优先级的被保护设备并行关机,减少了人工关机的错误率,提高了处理效率,解决了现有技术中由于在不间断电源供电期间内未及时做出相应的有效处理而导致设备依然异常断电的问题。
请参阅图9,本发明实施例中供电故障处理的装置的另一实施例包括:
第一监测单元901,用于监测多个设备的供电状态;
第一获取单元902,用于当监测到供电状态异常时,获取设备断电保护策略,设备断电保护策略包含多个设备中被保护设备的断电保护优先级;
第一控制单元903,用于在不间断电源供电时,按照被保护设备的断电保护优先级,控制被保护设备关机。
本发明实施例中的装置还包括:
第一确定单元904,用于确定每个设备的断电保护优先级,断电保护优先级为每个设备中优先级最高的业务系统所对应的业务优先级;
第二确定单元905,用于将断电保护优先级高于预设阈值的设备确定为被保护设备;
建立单元906,用于建立被保护设备的设备标识和与被保护设备对应的断电保护优先级的对应关系;
第二监测单元907,用于监测每个设备上运行的业务系统的数量;
第一更新单元908,用于当监测到多个设备中任意一个设备上运行的业务系统的数量发生变化时,更新设备断电保护策略和断电保护优先级。
第一更新单元908具体包括:
第一更新模块9081,用于当第二监测单元807监测到任意一个设备上增加了至少一个新业务系统,且至少一种新业务系统的最高业务优先级高于增加前任意一个设备的断电保护优先级时,将任意一个设备的断电保护优先级更新为至少一种新业务系统的最高业务优先级;
第二更新模块9082,用于当任意一个设备的断电优先级高于预设阈值,且任意一个设备的设备标识与任意一个设备更新后的断电保护优先级的对应关系未添加在设备断电保护策略中时,将任意一个设备的设备标识与任意一个设备更新后的断电保护优先级的对应关系添加到设备断电保护策略中。
第一更新单元908还可以进一步包括:
第三更新模块9083,用于当监测到任意一个设备上减少了至少一种业务系统,且至少一种业务系统的最高业务优先级为任意一个设备的断电保护优先级时,将任意一个设备上运行的剩余业务系统中的最高业务优先级更新为任意一个设备的断电保护优先级,剩余业务系统为除至少一种业务系统之外的业务系统;
删除模块9084,用于当任意一个设备的断电保护优先级低于或等于预设阈值,且任意一个设备的设备标识与任意一个设备更新前的断电优先级的对应关系已添加在设备断电保护策略中时,将任意一个设备的设备标识与任意一个设备更新前的断电优先级的对应关系从设备断电保护策略中删除。
本实施例中,在第一监测单元901监测到多个设备的供电状态异常时,第一确定模块9031从第一获取模块9021获取的对应关系中确定被保护设备的断电保护优先级,在不间断电源供电期间,第一控制模块9032控制具有相同断电保护优先级的被保护设备并行关机,第二监测单元907监测到任意一个设备上运行的业务系统的数量发生变化时,第一更新单元908更新设备断电保护策略和断电保护优先级,提高了设备断电保护策略的准确度,减少了人工关机的错误率,提高了处理效率,解决了现有技术中由于在不间断电源供电期间内未及时做出相应的有效处理而导致设备依然异常断电的问题。
请参阅图10,本发明实施例中供电故障处理的装置的另一实施例包括:
第一监测单元1001,用于监测多个设备的供电状态;
第一获取单元1002,用于当监测到供电状态异常时,获取设备断电保护策略,设备断电保护策略包含多个设备中被保护设备的断电保护优先级;
第一控制单元1003,用于在不间断电源供电时,按照被保护设备的断电保护优先级,控制被保护设备关机。
本实施例中的装置还包括:
第二获取单元1004,用于获取被保护设备中最大的安全关机时长和不间断电源的供电时长;
第三确定单元1005,用于根据第二获取单元1004获取的被保护设备中最大的安全关机时长和不间断电源的供电时长,确定关闭被保护设备的最迟关机时间点;
第二控制单元1006,用于在最迟关机时间点到来前,按照被保护设备的断电保护优先级,控制被保护设备关机。
本实施例中的装置还可以进一步包括:
第三监测单元1007,用于监测市电交流输入电压;
第一比较单元1008,用于将市电交流输入电压与预设的第一门限值和第二门限值进行比较,第二门限值大于第一门限值;
第四确定单元1009,用于当市电交流输入电压小于第一门限值时,确定供电状态异常;
第五确定单元1010,用于当市电交流输入电压大于第二门限值时,确定供电状态正常。
第三控制单元1011,用于在第五确定单元确定供电状态正常后,控制设备开机。
本实施例中,当第三监测单元1007检测到供电状态异常时,第二获取单元1004获取设备的最大安全关机时长和不间断电源的供电时长,保证在不间断电源供电期间,将所有被保护设备按照设备断电保护优先级都安全关机,避免了人为错误操作导致其他设备无法正常关机以及未及时处理而导致设备仍然异常断电的风险,不需要人工手动关机,提高了工作效率,另外,并且通过第三监测单元1007监测市电交流输入电压,第三控制单元1011建立供电状态恢复正常后自动控制被保护设备开机的机制,实现恢复业务系统正常运行。
上面介绍了本发明实施例中一种供电故障处理的方法和供电故障处理的装置,请参阅图11,下面介绍本发明实施例中一种供电故障处理系统的一实施例,包括:
供电监测设备1101,用于监测数据中心系统中多个设备的供电状态;
策略管理终端1102,用于在供电监测设备1101监测到供电状态异常时,建立设备断电保护策略;
断电保护设备1103,用于在不间断电源供电时,根据策略管理终端1102建立的设备断电保护策略来控制多个设备中被保护设备关机。
本发明实施例中,当供电监测设备1101监测到供电状态异常时,获取策略管理终端1102建立的设备断电保护策略,在不间断电源供电时,断电保护设备1103根据该设备断电保护策略来控制多个设备中被保护设备关机,解决了现有技术中由于不间断电源的供电能力有限,无法在不间断电源的有效供电时间内关闭所有设备而导致仍然异常断电的问题。
请参考图12,图12为本发明实施例提供的供电故障处理的装置另一结构示意图,其中,可包括至少一个处理器1201(例如CPU,Central Processing Unit)、至少一个网络接口或者其它通信接口、存储器1202、至少一个通信总线、至少一个输入装置1203、至少一个输出装置1204和不间断电源UPS 1205用于实现这些装置之间的连接通信。所述处理器1201用于执行所述存储器1202中存储的可执行模块,例如计算机程序。所述存储器1202可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个网络接口(可以是有线或者无线)实现该系统网关与至少一个其它网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
如图12所示,在一些实施方式中,所述存储器1202中存储了程序指令,所述程序指令可以被所述处理器1201执行,所述处理器1201具体执行以下步骤:
监测多个设备的供电状态;
当监测到供电状态异常时,获取设备断电保护策略;
在UPS 1205供电时,按照被保护设备的断电保护优先级,控制被保护设备关机。
在一些实施方式中,所述处理器1201还可以执行以下步骤:
将所述每个设备中优先级最高的业务系统所对应的业务优先级,确定为所述每个设备的断电保护优先级;
将所述断电保护优先级高于预设阈值的设备确定为所述被保护设备;
建立所述被保护设备的设备标识和与所述被保护设备对应的断电保护优先级的对应关系;
将所述对应关系添加到所述设备断电保护策略中;
根据所述被保护设备的设备标识,从所述对应关系中确定所述被保护设备的断电保护优先级;
根据所述被保护设备的断电保护优先级,控制所述被保护设备关机。
在一些实施方式中,所述处理器1201还可以执行以下步骤:
监测所述每个设备上运行的业务系统的数量;
当监测到所述每个设备中任意一个设备上运行的业务系统的数量发生变化时,更新所述设备断电保护策略。
在一些实施方式中,所述处理器1201还可以执行以下步骤:
当监测到所述任意一个设备上增加了至少一种新业务系统,且所述至少一种新业务系统的最高业务优先级高于增加前所述任意一个设备的断电保护优先级时,将所述任意一个设备的断电保护优先级更新为所述至少一种新业务系统的最高业务优先级;
当所述任意一个设备的断电优先级高于所述预设阈值,且所述任意一个设备的设备标识与所述任意一个设备更新后的断电保护优先级的对应关系未添加在所述设备断电保护策略中时,将所述任意一个设备的设备标识与所述任意一个设备更新后的断电保护优先级的对应关系添加到所述设备断电保护策略中。
和/或,
当监测到所述任意一个设备上减少了至少一种业务系统,且所述至少一种业务系统的最高业务优先级为所述任意一个设备的断电保护优先级时,将所述任意一个设备上运行的剩余业务系统中的最高业务优先级更新为所述任意一个设备的断电保护优先级,所述剩余业务系统为除所述至少一种业务系统之外的业务系统;
当所述任意一个设备的断电保护优先级低于或等于所述预设阈值,且所述任意一个设备的设备标识与所述任意一个设备更新前的断电优先级的对应关系已添加在所述设备断电保护策略中时,将所述任意一个设备的设备标识与所述任意一个设备更新前的断电优先级的对应关系从所述设备断电保护策略中删除。
在一些实施方式中,所述处理器1201还可以执行以下步骤:
按照所述被保护设备的断电保护优先级,控制具有相同断电保护优先级的被保护设备并行关机。
在一些实施方式中,所述处理器1201还可以执行以下步骤:
获取所述被保护设备中最大的安全关机时长和所述不间断电源的供电时长;
根据所述被保护设备中最大的安全关机时长和所述不间断电源的供电时长,确定关闭所述被保护设备的最迟关机时间点;
在所述最迟关机时间点到来前,按照所述被保护设备的断电保护优先级,控制所述被保护设备关机。
在一些实施方式中,所述处理器1201还可以执行以下步骤:
获取所述被保护设备中最新的最大安全关机时长;
当所述最新的最大安全关机时长不等于控制关机前的最大的安全关机时长时,将所述关机前的最大的安全关机时长更新为所述最新的最大安全关机时长。
在一些实施方式中,所述处理器1201还可以执行以下步骤:
持续监测当前所述多个设备的供电状态;
当监测到当前所述多个设备的供电状态正常时,按照所述被保护设备的断电保护优先级,控制所述被保护设备开机。
在一些实施方式中,所述处理器1201还可以执行以下步骤:
监测市电交流输入电压,并将所述市电交流输入电压与预设的第一门限值和第二门限值进行比较,所述第二门限值大于所述第一门限值;
当所述市电交流输入电压小于所述第一门限值时,确定所述供电状态异常;
当所述市电交流输入电压大于所述第二门限值时,确定所述供电状态正常。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上对本发明所提供的一种供电故障处理的方法及装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。