CN112910691B - 机房故障检测方法及装置 - Google Patents

机房故障检测方法及装置 Download PDF

Info

Publication number
CN112910691B
CN112910691B CN202110067747.9A CN202110067747A CN112910691B CN 112910691 B CN112910691 B CN 112910691B CN 202110067747 A CN202110067747 A CN 202110067747A CN 112910691 B CN112910691 B CN 112910691B
Authority
CN
China
Prior art keywords
equipment
fault
machine room
operation parameters
target machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110067747.9A
Other languages
English (en)
Other versions
CN112910691A (zh
Inventor
尹鹏程
龚慧钦
王超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110067747.9A priority Critical patent/CN112910691B/zh
Publication of CN112910691A publication Critical patent/CN112910691A/zh
Application granted granted Critical
Publication of CN112910691B publication Critical patent/CN112910691B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本申请提供了一种机房故障检测方法及装置,可用于金融领域或其他领域,该方法,包括:获取目标机房的设备运行参数;根据预设的设备故障预测模型和所述设备运行参数,确定所述目标机房中的故障设备,所述预设的设备故障预测模型为应用反向传播算法预先训练得到的神经网络模型;将所述故障设备的报警信息输出。本申请能够在保证确定故障设备定位的准确性的基础上,提高故障设备定位的效率,进而能够提高机房设备运行的安全性。

Description

机房故障检测方法及装置
技术领域
本申请涉及神经网络技术领域,尤其涉及一种机房故障检测方法及装置。
背景技术
传统的数据中心设备故障排查主要依靠人工巡检的方式,基于数据中心基础设施管理系统(Data Center Infrastructure management,简称DCIM)故障报警,通过人工查找机房和设备铭牌来确定故障设备位置,进而对故障设备进行维修。随着数据中心建设步伐不断的加快,运行在数据中心的信息数量和规模呈逐年上升的趋势。这也相应的增加了数据中心的运维工作量,对运维管理提出了更高的要求。同时对于超大型数据中心来说,随着机房和设备数量大幅增多、故障频发,运维过程中故障设备的快速导航与准确定位问题矛盾突出,当DCIM系统生成的设备报警信息较多时,网络拥堵会导致报警信息不能及时输出。
发明内容
针对现有技术中的问题,本申请提出了一种机房故障检测方法及装置,能够在保证确定故障设备定位的准确性的基础上,提高故障设备定位的效率,进而能够提高机房设备运行的安全性。
为了解决上述技术问题,本申请提供以下技术方案:
第一方面,本申请提供一种机房故障检测方法,包括:
获取目标机房的设备运行参数;
根据预设的设备故障预测模型和所述设备运行参数,确定所述目标机房中的故障设备,所述预设的设备故障预测模型为应用反向传播算法预先训练得到的神经网络模型;
将所述故障设备的报警信息输出。
进一步地,在所述确定所述目标机房中的故障设备之后,还包括:
根据所述故障设备的设备类型,设置该故障设备对应的导航路径中的指示灯的颜色状态;
所述导航路径的一端设置在所述故障设备处,另一端设置在所述目标机房的入口处;所述指示灯用于指示所述故障设备的设备位置和设备类型。
进一步地,所述设备运行参数包括:IT设备运行参数和基础设施设备运行参数。
进一步地,所述获取目标机房的设备运行参数,包括:
从服务器带外监控系统中获取所述目标机房的IT设备运行参数,从机房基础设施监控系统中获取所述基础设施设备运行参数。
进一步地,所述根据预设的设备故障预测模型和所述设备运行参数,确定所述目标机房中的故障设备,包括:
将所述IT设备运行参数和基础设施设备运行参数输入预设的设备故障预测模型,根据所述预设的设备故障预测模型的输出结果确定所述目标机房中的故障设备。
第二方面,本申请提供一种机房故障检测装置,包括:
获取模块,用于获取目标机房的设备运行参数;
检测模块,用于根据预设的设备故障预测模型和所述设备运行参数,确定所述目标机房中的故障设备,所述预设的设备故障预测模型为应用反向传播算法预先训练得到的神经网络模型;
输出模块,用于将所述故障设备的报警信息输出。
进一步地,所述的机房故障检测装置,还包括:
设置模块,用于根据所述故障设备的设备类型,设置该故障设备对应的导航路径中的指示灯的颜色状态;
所述导航路径的一端设置在所述故障设备处,另一端设置在所述目标机房的入口处;所述指示灯用于指示所述故障设备的设备位置和设备类型。
进一步地,所述设备运行参数包括:IT设备运行参数和基础设施设备运行参数。
第三方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的机房故障检测方法。
第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现所述的机房故障检测方法。
由上述技术方案可知,本申请提供一种机房故障检测方法及装置。其中,该方法包括:获取目标机房的设备运行参数;根据预设的设备故障预测模型和所述设备运行参数,确定所述目标机房中的故障设备,所述预设的设备故障预测模型为应用反向传播算法预先训练得到的神经网络模型,将所述故障设备的报警信息输出;能够在保证确定故障设备定位的准确性的基础上,提高故障设备定位的效率,进而能够提高机房设备运行的安全性;具体地,可以在超大型数据中心机房中实现设备故障的可视化巡检,基于设备运行参数和深度学习技术对设备故障进行预测,能够解决监控系统设备告警漏报的技术问题,能够快速准确指引现场人员进入目标机房区域,快速准确定位故障设备,减少现场人员的无效和误操作,实现设备故障的快速定位和导航,降低运维难度。另外,可以实现可视化展现故障设备的设备类型,快速指定相应专业工程师处理排查设备故障,能够提升运维效率,优化人力资源配置,提升设备及机房基础设施运维的可视化和智能化水平。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例中机房故障检测方法的流程示意图;
图2是本申请另一实施例中机房故障检测方法的流程示意图;
图3是本申请应用实例中机房故障检测方法的流程示意图;
图4是本申请实施例中机房故障检测装置的结构示意图;
图5为本申请实施例的电子设备9600的系统构成示意框图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
现有的解决方案主要为人工依靠经验和记忆的方式,通过机房和设备铭牌来寻找故障设备进行维护,设备故障仅依靠设备自身告警上报。随着数据中心机房与设备数量增多,且机房装修和设备部署方式一致,使得技术人员难以对故障设备进行快速定位。依靠技术人员经验来寻找故障设备,一方面人员离职时新人存在难以快速定位的问题,另一方面对于目前建设的超大型数据中心仅依靠经验存在一定的运维风险,设备故障仅依靠设备自身告警上报,无法进行智能预判。目前故障设备定位主要依靠人工寻找机房和设备铭牌来确认故障设备位置,在超大型数据中心中,安全运维存在风险,且定位效率低下。基于此,为了提高数据中心机房故障导航与定位效率,解决超大型数据中心机房故障设备快速导航与定位效率低下且系统出现漏报警等问题,本申请实施例提供一种机房故障检测方法及装置,获取目标机房的设备运行参数;根据预设的设备故障预测模型和所述设备运行参数,确定所述目标机房中的故障设备,所述预设的设备故障预测模型为应用反向传播算法预先训练得到的神经网络模型;将所述故障设备的报警信息输出,能够实现同时对多种设备进行故障检测,提高故障检测的智能化程度。
为了在保证确定故障设备定位的准确性的基础上,提高故障设备定位的效率,进而提高机房设备运行的安全性,本申请实施例提供一种机房故障检测装置,该装置可以是一服务器或客户端设备,所述客户端设备可以包括智能手机、平板电子设备、网络机顶盒、便携式计算机、台式电脑、个人数字助理(PDA)、车载设备和智能穿戴设备等。其中,所述智能穿戴设备可以包括智能眼镜、智能手表和智能手环等。
在实际应用中,进行机房故障检测的部分可以在如上述内容所述的服务器侧执行,也可以所有的操作都在所述客户端设备中完成。具体可以根据所述客户端设备的处理能力,以及用户使用场景的限制等进行选择。本申请对此不作限定。若所有的操作都在所述客户端设备中完成,所述客户端设备还可以包括处理器。
上述的客户端设备可以具有通信模块(即通信单元),可以与远程的服务器进行通信连接,实现与所述服务器的数据传输。所述服务器可以包括任务调度中心一侧的服务器,其他的实施场景中也可以包括中间平台的服务器,例如与任务调度中心服务器有通信链接的第三方服务器平台的服务器。所述的服务器可以包括单台计算机设备,也可以包括多个服务器组成的服务器集群,或者分布式装置的服务器结构。
所述服务器与所述客户端设备之间可以使用任何合适的网络协议进行通信,包括在本申请提交日尚未开发出的网络协议。所述网络协议例如可以包括TCP/IP协议、UDP/IP协议、HTTP协议、HTTPS协议等。当然,所述网络协议例如还可以包括在上述协议之上使用的RPC协议(Remote Procedure Call Protocol,远程过程调用协议)、REST协议(Representational State Transfer,表述性状态转移协议)等。
需要说明的是,本申请公开的机房故障检测方法及装置可用于金融技术领域,也可用于除金融技术领域之外的任意领域,本申请公开的机房故障检测方法及装置的应用领域不做限定。
具体通过下述各个实施例进行说明。
为了在保证确定故障设备定位的准确性的基础上,提高故障设备定位的效率,进而提高机房设备运行的安全性,本实施例提供一种执行主体是机房故障检测装置的机房故障检测方法,该机房故障检测装置包括但不限于服务器,如图1所示,该方法具体包含有如下内容:
步骤100:获取目标机房的设备运行参数。
具体地,所述设备运行参数可以包含有:IT设备运行参数和基础设施设备运行参数;基础设施设备可以包含有配电设备和空调等;其中,IT设备运行参数可以包含有:服务器风机转速、CPU占用率和内存占用率等;基础设施设备运行参数可以包含有:用电曲线变化、电流变化、、磁场变化、空调风机转速和全链路温度等;其中,用电曲线变化可以是当前用电量与正常运行状态下用电量的偏离值,电流变化可以是当前电流与正常运行状态下电流的偏离值,磁场变化可以是当前磁场强度与正常运行状态下磁场强度的偏离值。
步骤200:根据预设的设备故障预测模型和所述设备运行参数,确定所述目标机房中的故障设备,所述预设的设备故障预测模型为应用反向传播算法预先训练得到的神经网络模型。
具体地,可以将目标机房的各个设备的设备运行参数输入所述预设的设备故障预测模型,并根据所述预设的设备故障预测模型的输出结果确定目标机房中的故障设备。
步骤300:将所述故障设备的报警信息输出。
具体地,所述报警信息可以包含有:机房、设备铭牌和设备类型信息,用于确定故障设备的位置和类型;可以将所述报警信息输出至管理系统或显示屏等。
由上述描述可知,本实施例提供的机房故障检测方法,通过获取目标机房的设备运行参数;根据预设的设备故障预测模型和所述设备运行参数,确定所述目标机房中的故障设备,所述预设的设备故障预测模型为应用反向传播算法预先训练得到的神经网络模型;将所述故障设备的报警信息输出,能够在保证确定故障设备定位的准确性的基础上,提高故障设备定位的效率,进而能够提高机房设备运行的安全性;具体地,能够避免运维过程中故障设备的快速导航与准确定位问题,实现报警信息的及时输出。
为了实现故障设备的可视化定位与导航,在本申请一个实施例中,在步骤200之后还包括:
步骤400:根据所述故障设备的设备类型,设置该故障设备对应的导航路径中的指示灯的颜色状态;所述导航路径的一端设置在所述故障设备处,另一端设置在所述目标机房的入口处;所述指示灯用于指示所述故障设备的设备位置和设备类型。
具体地,所述设备类型可以包含有:服务器、空调和配电装置等设备类型;可以根据所述故障设备的设备运行参数确定所述故障设备的设备类型;所述导航路径可以由多个指示灯依次连接构成;若目标机房中存在多个设备,则各设备对应的导航路径的一端均可以设置在所述目标机房的入口处,另一端设置在各自对应的设备处;所述指示灯可以是可变色氛围灯;导航路径可以均与所述机房故障检测装置通信连接。
为了进一步提高获取设备运行参数的可靠性,进而应用可靠的设备运行参数提高确定故障设备的准确性,在本申请一个实施例中,步骤100,包含有:
步骤101:从服务器带外监控系统中获取所述目标机房的IT设备运行参数,从机房基础设施监控系统中获取所述基础设施设备运行参数。
为了进一步提高确定故障设备的准确性,参见图2,在本申请一个实施例中,步骤200包含有:
步骤201:将所述IT设备运行参数和基础设施设备运行参数输入预设的设备故障预测模型,根据所述预设的设备故障预测模型的输出结果确定所述目标机房中的故障设备。
为了进一步说明本方案,本申请提供一种机房故障检测方法的应用实例,参见图3,具体描述如下:
故障导航开始,S11:BP算法深度学习设备运行参数,智能预测故障;即通过BP神经网络算法对“服务器带外监控系统”、“DCIM机房基础设施监控系统”中的IT设备与基础设施设备(配电、空调等)运行参数进行深度学习,对神经网络进行训练使其智能预测设备故障;S12:提出故障告警;S13:根据故障告警确定故障设备的设备类型;S14:根据设备类型设置导航灯颜色状态,即对“服务器带外监控系统”、“DCIM机房基础设施监控系统”的设备告警参数进行分析处理,根据不同的设备告警控制可变色氛围灯开关及颜色;S15:故障设备编号定位;S16:导航灯路径亮;故障导航结束。
可以解决对现有的监控报警信息较多时,无法及时输出的问题,同时通过可变色氛围灯的开关作为导航路标,引导现场技术人员快速准确从监控室进入目标机房区域并快速准确实现故障设备的定位;通过可变色氛围灯颜色状态的改变来区分故障设备的设备类型,红色状态表示故障设备为服务器,蓝色状态表示故障设备为配电装置,黄色状态表示故障设备为空调。通过“BP神经网络深度学习系统+服务器带外监控+DCIM系统+可变色氛围灯系统”,能够实现联动控制,实现故障设备智慧导航,能够减少现场技术人员的无效和误操作,提高运维效率。
具体地,可变色氛围灯可以布置于机房通道及设备外边,可变色氛围灯与BP神经网络算法联通,“服务器带外监控系统”、“DCIM机房基础设施监控系统”中运行的设备参数在算法模型的深度学习下,对设备运行状况进行评估并预测设备故障类型,对监控系统中的告警信息进行分析处理,智能识别告警类型并控制氛围灯系统,实现深度学习系统、监控系统、色标管理、灯带导航实现设备故障导航指引,引领现场人员快速准确进入目标机房区域,快速准确定位故障设备,实现设备故障的可视化巡检。
从软件层面来说,为了在保证确定故障设备定位的准确性的基础上,提高故障设备定位的效率,进而提高机房设备运行的安全性,本申请提供一种用于实现所述机房故障检测方法中全部或部分内容的机房故障检测装置的实施例,参见图4,所述机房故障检测装置具体包含有如下内容:
获取模块10,用于获取目标机房的设备运行参数。
检测模块20,用于根据预设的设备故障预测模型和所述设备运行参数,确定所述目标机房中的故障设备,所述预设的设备故障预测模型为应用反向传播算法预先训练得到的神经网络模型。
输出模块30,用于将所述故障设备的报警信息输出。
在本申请一个实施例中,所述的机房故障检测装置,还包括:
设置模块,用于根据所述故障设备的设备类型,设置该故障设备对应的导航路径中的指示灯的颜色状态;所述导航路径的一端设置在所述故障设备处,另一端设置在所述目标机房的入口处;所述指示灯用于指示所述故障设备的设备位置和设备类型。
其中,所述设备运行参数包括:IT设备运行参数和基础设施设备运行参数。
本说明书提供的机房故障检测装置的实施例具体可以用于执行上述机房故障检测方法的实施例的处理流程,其功能在此不再赘述,可以参照上述机房故障检测方法实施例的详细描述。
由上述描述可知,本申请提供的机房故障检测方法及装置,能够在保证确定故障设备定位的准确性的基础上,提高故障设备定位的效率,进而能够提高机房设备运行的安全性;具体地,可以在超大型数据中心机房中实现设备故障的可视化巡检,基于设备运行参数和深度学习技术对设备故障进行预测,能够解决监控系统设备告警漏报的技术问题,能够快速准确指引现场人员进入目标机房区域,快速准确定位故障设备,减少现场人员的无效和误操作,实现设备故障的快速定位和导航,降低运维难度。另外,可以实现可视化展现故障设备的设备类型,快速指定相应专业工程师处理排查设备故障,能够提升运维效率,优化人力资源配置,提升设备及机房基础设施运维的可视化和智能化水平。提高数据中心机房故障导航与定位效率本方案主要解决超大型数据中心机房故障设备快速导航与定位效率低下且系统出现漏报警的问题。
从硬件层面来说,为了在保证确定故障设备定位的准确性的基础上,提高故障设备定位的效率,进而提高机房设备运行的安全性,本申请提供一种用于实现所述机房故障检测方法中的全部或部分内容的电子设备的实施例所述电子设备具体包含有如下内容:
处理器(processor)、存储器(memory)、通信接口(Communications Interface)和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述通信接口用于实现所述机房故障检测装置以及用户终端等相关设备之间的信息传输;该电子设备可以是台式计算机、平板电脑及移动终端等,本实施例不限于此。在本实施例中,该电子设备可以参照实施例用于实现所述机房故障检测方法的实施例及用于实现所述机房故障检测装置的实施例进行实施,其内容被合并于此,重复之处不再赘述。
图5为本申请实施例的电子设备9600的系统构成的示意框图。如图5所示,该电子设备9600可以包括中央处理器9100和存储器9140;存储器9140耦合到中央处理器9100。值得注意的是,该图5是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
在本申请一个或多个实施例中,机房故障检测功能可以被集成到中央处理器9100中。其中,中央处理器9100可以被配置为进行如下控制:
步骤100:获取目标机房的设备运行参数。
步骤200:根据预设的设备故障预测模型和所述设备运行参数,确定所述目标机房中的故障设备,所述预设的设备故障预测模型为应用反向传播算法预先训练得到的神经网络模型。
步骤300:将所述故障设备的报警信息输出。
从上述描述可知,本申请的实施例提供的电子设备,能够在保证确定故障设备定位的准确性的基础上,提高故障设备定位的效率,进而提高机房设备运行的安全性。
在另一个实施方式中,机房故障检测装置可以与中央处理器9100分开配置,例如可以将机房故障检测装置配置为与中央处理器9100连接的芯片,通过中央处理器的控制来实现机房故障检测功能。
如图5所示,该电子设备9600还可以包括:通信模块9110、输入单元9120、音频处理器9130、显示器9160、电源9170。值得注意的是,电子设备9600也并不是必须要包括图5中所示的所有部件;此外,电子设备9600还可以包括图5中没有示出的部件,可以参考现有技术。
如图5所示,中央处理器9100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器9100接收输入并控制电子设备9600的各个部件的操作。
其中,存储器9140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器9100可执行该存储器9140存储的该程序,以实现信息存储或处理等。
输入单元9120向中央处理器9100提供输入。该输入单元9120例如为按键或触摸输入装置。电源9170用于向电子设备9600提供电力。显示器9160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器9140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器9140还可以是某种其它类型的装置。存储器9140包括缓冲存储器9141(有时被称为缓冲器)。存储器9140可以包括应用/功能存储部9142,该应用/功能存储部9142用于存储应用程序和功能程序或用于通过中央处理器9100执行电子设备9600的操作的流程。
存储器9140还可以包括数据存储部9143,该数据存储部9143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器9140的驱动程序存储部9144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块9110即为经由天线9111发送和接收信号的发送机/接收机9110。通信模块(发送机/接收机)9110耦合到中央处理器9100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块9110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)9110还经由音频处理器9130耦合到扬声器9131和麦克风9132,以经由扬声器9131提供音频输出,并接收来自麦克风9132的音频输入,从而实现通常的电信功能。音频处理器9130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器9130还耦合到中央处理器9100,从而使得可以通过麦克风9132能够在本机上录音,且使得可以通过扬声器9131来播放本机上存储的声音。
上述描述可知,本申请的实施例提供的电子设备,能够在保证确定故障设备定位的准确性的基础上,提高故障设备定位的效率,进而提高机房设备运行的安全性。
本申请的实施例还提供能够实现上述实施例中的机房故障检测方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的机房故障检测方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
步骤100:获取目标机房的设备运行参数。
步骤200:根据预设的设备故障预测模型和所述设备运行参数,确定所述目标机房中的故障设备,所述预设的设备故障预测模型为应用反向传播算法预先训练得到的神经网络模型。
步骤300:将所述故障设备的报警信息输出。
从上述描述可知,本申请实施例提供的计算机可读存储介质,能够在保证确定故障设备定位的准确性的基础上,提高故障设备定位的效率,进而提高机房设备运行的安全性。
本申请中上述方法的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。相关之处参见方法实施例的部分说明即可。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本申请中应用了具体实施例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (6)

1.一种机房故障检测方法,其特征在于,包括:
获取目标机房的设备运行参数,所述设备运行参数包括:IT设备运行参数和基础设施设备运行参数,所述IT设备运行参数包括:服务器风机转速、CPU占用率和内存占用率,所述基础设施设备运行参数包括:用电曲线变化、电流变化、磁场变化、空调风机转速和全链路温度;
根据预设的设备故障预测模型和所述设备运行参数,确定所述目标机房中的故障设备,所述预设的设备故障预测模型为应用反向传播算法预先训练得到的神经网络模型,所述故障设备为服务器、空调和配电装置中的一种;
将所述故障设备的报警信息输出;
在所述确定所述目标机房中的故障设备之后,还包括:
根据所述故障设备的设备类型,设置该故障设备对应的导航路径中的指示灯的颜色状态;
所述导航路径的一端设置在所述故障设备处,另一端设置在所述目标机房的入口处;所述指示灯用于指示所述故障设备的设备位置和设备类型。
2.根据权利要求1所述的机房故障检测方法,其特征在于,所述获取目标机房的设备运行参数,包括:
从服务器带外监控系统中获取所述目标机房的IT设备运行参数,从机房基础设施监控系统中获取所述基础设施设备运行参数。
3.根据权利要求1所述的机房故障检测方法,其特征在于,所述根据预设的设备故障预测模型和所述设备运行参数,确定所述目标机房中的故障设备,包括:
将所述IT设备运行参数和基础设施设备运行参数输入预设的设备故障预测模型,根据所述预设的设备故障预测模型的输出结果确定所述目标机房中的故障设备。
4.一种机房故障检测装置,其特征在于,包括:
获取模块,用于获取目标机房的设备运行参数,所述设备运行参数包括:IT设备运行参数和基础设施设备运行参数,所述IT设备运行参数包括:服务器风机转速、CPU占用率和内存占用率,所述基础设施设备运行参数包括:用电曲线变化、电流变化、磁场变化、空调风机转速和全链路温度;
检测模块,用于根据预设的设备故障预测模型和所述设备运行参数,确定所述目标机房中的故障设备,所述预设的设备故障预测模型为应用反向传播算法预先训练得到的神经网络模型;
输出模块,用于将所述故障设备的报警信息输出;
设置模块,用于根据所述故障设备的设备类型,设置该故障设备对应的导航路径中的指示灯的颜色状态;
所述导航路径的一端设置在所述故障设备处,另一端设置在所述目标机房的入口处;所述指示灯用于指示所述故障设备的设备位置和设备类型。
5.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至3任一项所述的机房故障检测方法。
6.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述指令被执行时实现权利要求1至3任一项所述的机房故障检测方法。
CN202110067747.9A 2021-01-19 2021-01-19 机房故障检测方法及装置 Active CN112910691B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110067747.9A CN112910691B (zh) 2021-01-19 2021-01-19 机房故障检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110067747.9A CN112910691B (zh) 2021-01-19 2021-01-19 机房故障检测方法及装置

Publications (2)

Publication Number Publication Date
CN112910691A CN112910691A (zh) 2021-06-04
CN112910691B true CN112910691B (zh) 2023-06-27

Family

ID=76115387

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110067747.9A Active CN112910691B (zh) 2021-01-19 2021-01-19 机房故障检测方法及装置

Country Status (1)

Country Link
CN (1) CN112910691B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114970888B (zh) * 2021-10-08 2023-04-18 淮阴师范学院 基于电力电气控制的元件故障分析系统
CN114002981A (zh) * 2021-10-29 2022-02-01 广东电力信息科技有限公司 基于微服务的机房监控方法、装置、设备及存储介质
CN114240155A (zh) * 2021-12-17 2022-03-25 中国工商银行股份有限公司 机房设备健康度的评估方法、装置、计算机设备
CN115037599A (zh) * 2022-06-13 2022-09-09 中国电信股份有限公司 一种通信网络故障预警方法、装置、设备及介质
CN116165484A (zh) * 2023-02-21 2023-05-26 海南电网有限责任公司信息通信分公司 基于电力自动化运维的故障定位机器人协助定检巡查调度方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016030517A1 (de) * 2014-08-29 2016-03-03 Haunsperger Johann Service- und informationssystem für gebäude sowie verfahren zur automatischen abarbeitung von störungen bzw. von service- und wartungsarbeiten und zu deren dokumentation
CN110146789A (zh) * 2019-06-27 2019-08-20 国网山东省电力公司菏泽供电公司 一种智能运检通报方法及装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140038523A1 (en) * 2012-07-31 2014-02-06 Patrick C. McGeer Hierarchical navigation and remediation in datacenters
CN105159813B (zh) * 2015-08-05 2018-09-14 北京百度网讯科技有限公司 基于数据中心的故障报警方法、装置、管理设备及系统
CN108199922B (zh) * 2018-01-11 2021-07-13 承德石油高等专科学校 一种用于网络设备及服务器故障诊断和修复的系统和方法
CN110659173B (zh) * 2018-06-28 2023-05-26 中兴通讯股份有限公司 一种运维系统及方法
CN109639450B (zh) * 2018-10-23 2023-06-23 平安壹钱包电子商务有限公司 基于神经网络的故障告警方法、系统、计算机设备及介质
CN111126603A (zh) * 2019-12-25 2020-05-08 江苏远望仪器集团有限公司 基于神经网络模型的设备故障预测方法、装置及设备
CN111314137A (zh) * 2020-02-18 2020-06-19 国家电网有限公司 信息通信网络自动化运维方法、装置、存储介质和处理器
CN111368890A (zh) * 2020-02-26 2020-07-03 珠海格力电器股份有限公司 故障检测方法及装置、信息物理融合系统
CN111598346A (zh) * 2020-05-20 2020-08-28 北京三一智造科技有限公司 故障检测方法、装置、检测设备、旋挖机及存储介质
CN112231493A (zh) * 2020-11-10 2021-01-15 泽恩科技有限公司 基于知识图谱的机房故障诊断方法、装置、设备及介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016030517A1 (de) * 2014-08-29 2016-03-03 Haunsperger Johann Service- und informationssystem für gebäude sowie verfahren zur automatischen abarbeitung von störungen bzw. von service- und wartungsarbeiten und zu deren dokumentation
CN110146789A (zh) * 2019-06-27 2019-08-20 国网山东省电力公司菏泽供电公司 一种智能运检通报方法及装置

Also Published As

Publication number Publication date
CN112910691A (zh) 2021-06-04

Similar Documents

Publication Publication Date Title
CN112910691B (zh) 机房故障检测方法及装置
US20190371322A1 (en) Method, apparatus and system for testing intelligent voice device
US11064009B2 (en) Augmented reality-based wiring, commissioning and monitoring of controllers
US11314308B2 (en) Control method for mobile terminal and controlled device, apparatus and system
US20210385304A1 (en) Method for management of intelligent internet of things, system and server
CN104656605A (zh) 工厂监视服务器以及工厂监视方法
WO2015051039A1 (en) High-voltage detector monitoring system
CN102519479A (zh) 基于云服务的无地图导航系统及导航方法
KR20210062988A (ko) 증강현실 공유 기반 다자참여 원격 협업 시스템 및 그 방법
CN104767981A (zh) 配网无线音视频抢修指挥系统
CN110474812A (zh) 采样率自适应调整方法及装置
US20180164758A1 (en) Information processing method, cloud service platform and information processing system
CN106568168A (zh) 一种调试方法、调试器及系统
CN104468288A (zh) 终端网络数据测试方法及装置
CN106657301A (zh) 自动签到方法与装置、考勤计算方法及服务器
CN113422817A (zh) 用于辅助驾驶培训的移动设备、方法和电子设备
EP2975586A1 (en) System and method of augmented reality alarm system installation
CN109993951B (zh) 一种门牌系统及其控制方法和装置
CN110850735A (zh) 智能人居控制系统
CN114095531B (zh) 智慧城市物联网设备的云管理方法以及物联网云平台系统
CN109032725A (zh) 用于显示界面的方法及装置
CN112987597B (zh) Fsu控制方法、装置、设备及计算机可读存储介质
CN114501208A (zh) 无线麦控制方法、装置、设备及存储介质
CN110285529A (zh) 中央空调末端设备自动配置方法、设备、终端及系统
CN204884513U (zh) 一种自助语音讲解装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant