一种机房IT设备故障信息精准检测方法
技术领域
本发明涉及机房智能巡检技术领域,具体涉及一种机房IT设备故障信息精准检测方法。
背景技术
随着信息化社会的高速发展,现代化信息技术和自动化设备呈现爆发式增长趋势,数据中心规模也持续增长,对数据中心的安全性和稳定性要求越来越高。机房作为一个重要的数据中心,对其故障检测和排除变得至关重要。机房设备故障隐患主要在于机房内网络设备、存储设备和服务器等用电设备长时间通电工作、设备老化和人工误操作等造成的。这些情况导致的资产设备故障,如果不及时报警并指出机房运行中出现的异常情况,将导致信息数据存在安全隐患。
针对上述情况,虽然有一些机房采用巡检机器人检测,但是由于其智能化程度低,不能精准地定位到机房设备故障信息。目前大多数企业的机房巡检方式:普遍依靠工作人员对机房进行全天候定时巡检,手动记录设备出现的故障信息。
监测机房设备运行情况的一个核心任务是准确识别摄像头捕获的各类设备信号灯状态信息,以此来判断相关设备是否运行正常,并将故障信息实时传送到控制中心。人工巡检的工作方式不仅会耗费大量的人力成本,而且无法保证巡检数据的真实性,容易出现少检、漏检或误检的情况;另外,当出现故障时,容易出现故障告警不及时,缺乏风险预警,且无法初步对故障信息判断,在多方监管下巡检信息的查询与沟通效率低。虽然目前存在巡检机器人,通过指示灯故障信息与正常状态传统图像对比的巡检方式,但是这种方式灵活性较差,对定位精度要求高,不够智能化。因此,如何实现机房的智能化管理是亟待解决的重要问题。
发明内容
本发明为了克服以上技术的不足,提供了一机房IT设备故障信息精准检测方法。
本发明克服其技术问题所采用的技术方案是:
一种机房IT设备故障信息精准检测方法,包括如下:
S1、机器人移动到待测机柜前方标定的驻点位置;
S2、机器人上的若干个摄像头对待测机柜录制视频,并将不同摄像头录制的视频的第一帧图像拼接成一张上下覆盖整个待测机柜的图像;
S3、图片分析:采集样本,标记IT设备和指示灯数据,训练IT设备检测模型和指示灯状态检测模型,检测经步骤S2拼接后的图像,获取不同区域指示灯状态表达的含义;
S4、视频分析:将视频转换成图像,求取每张图像相同位置像素点的均方差值,判断动态像素点,多个相邻的动态像素点形成一个连通区域,求得动态连通区域的坐标位于哪个IT设备坐标区域内,判断闪烁灯是否正常运行;
S5、综合图片分析和视频分析结果,得到指示灯状态故障信息。
进一步地,步骤S1中,利用相似三角形原理,计算将待测机柜全面拍摄所需的摄像头到待测机柜的横向距离来标定驻点位置,具体如下:
通过摄像头的感光元件靶面参数w、镜头的焦距f、视场大小s及镜头到待测物体之间的横向距离d的关系得出:
那么驻点位置d为:
进一步地,步骤S2中,采用图像特征拼接融合技术将不同摄像头录制的视频的第一帧图像拼接成一张上下覆盖整个待测机柜的图像,具体包括如下:
S21、采用多个摄像头录制的每个视频的第一帧图像,设相邻图像为P和Q;
S22、图像P的某一行像素矢量A匹配图像Q的某一行像素矢量B,利用两像素矢量间的余玄相似度判断其相似性,相似度的公式如下:
式中,n代表视频的第几帧图像,n=1、2、3……、M,那么M表示视频中图像的总帧数;
S23、对相似度最大的行,按行上下图像匹配融合,使得多张图像拼接成一张上下覆盖整个待测机柜的图片。
进一步地,所述步骤S3具体包括:
采集若干个机房IT设备数据图像作为样本,对IT设备分类并进行命名标记;
采集若干个指示灯的颜色数据作为样本,对指示灯的颜色状态信息进行标记;
采用残差卷积网络结构yolo3图像目标检测模型训练IT设备检测模型和指示灯状态检测模型;
使用训练好的IT设备检测模型和指示灯状态检测模型对步骤S2中拼接的图像进行检测,得到各个IT设备的类型名称及其坐标区域RD,以及指示灯的状态信息及其坐标区域RL,其中,RL∈RD;
根据该类型IT设备的配置文件进行信息匹配,获取不同区域指示灯状态表达的含义。
进一步地,所述IT设备的配置文件包括:
不同IT设备的类型Dev、该类型IT设备不同位置处指示灯的位置R以及指示灯状态代表的含义S;
其中,Dev={R:S},R表示为(x,y,w,h),x和y表示指示灯区域左上角的坐标,w和h分别表示指示灯区域的宽和长,每个IT设备的宽度和高度分别为W和H,指示灯区域归一化后的坐标为:
然后,指明指示灯区域归一化后的坐标,并说明该区域R指示灯状态S为红灯、绿灯、橙灯和蓝灯的具体含义,以及是否为闪烁灯。
进一步地,所述步骤S4具体包括:
采集设定时间长度的视频,将视频转换成图像,组成图像数据立方体;
将彩色图像转换为灰度图,对每张图像相同位置像素点的数据求取均方差值;
预设一个均方差阈值,当图像上某位置的均方差值大于预设的均方差阈值时,则判定该位置存在变化的像素值,即该位置为动态像素点;
将多个相邻的动态像素点形成一个连通区域;
对视频的彩色图像的第一帧进行图像分析,检测到IT设备类型及其坐标信息,从而得知视频检测到的连通区域的坐标位于哪个IT设备坐标区域内;
最后将检测到的信息与IT设备的配置文件进行信息匹配,从而判断该闪烁灯是否正常运行工作。
进一步地,步骤S4中,对每张图像相同位置像素点的数据求取均方差值包括如下:
首先,求取每张图像相同位置像素点的数据的均方值mes:
然后,根据均方值mes再求取每张图像相同位置像素点的均方差值diff:
其中,(i,j)表示图像中像素点的位置,n=1、2、3……、M,C(n,i,j)按时间叠加的图像立方体。
本发明的有益效果是:
本发明采用智能巡检机器人对传统的机房巡检模式进行变革,通过机器视觉技术,实现机房内设备定时自动巡检监测,采集图片、视频等数据信息,结合深度学习图像技术手段对IT设备的静态指示灯和闪烁灯状态信息分析,及时发现故障,精准的对设备及其故障指示灯信息报警,预判解决方案,工作人员只需要最终查看巡检报告,为无人值守机房的数据化管理提供创新型的技术检测手段,有效的解决了巡检效率低、记录不全、少检和误检等机房巡检问题,从而大幅提高巡检效率、降低劳动成本、减少人工巡检存在的风险,实现了机器人巡检机房的高度智能化。
附图说明
图1为本发明实施例所述机器人在驻点位置拍摄的示意图。
图2为本发明实施例所述的一种机房IT设备故障信息精准检测方法的流程图。
具体实施方式
为了便于本领域人员更好的理解本发明,下面结合附图和具体实施例对本发明做进一步详细说明,下述仅是示例性的不限定本发明的保护范围。
如图2所示,本实施例所述的一种机房IT设备故障信息精准检测方法,包括如下:
S1、机器人移动到待测机柜前方标定的驻点位置。
本实施例中,如图1所示,1表示待测机柜,2表示指示灯,3表示IT设备,4表示机器人上的摄像头,5表示驻点位置,机器人上至少安装一列摄像头(图1只标识了一个),每一列摄像头自下而上等间距设有若干个,摄像头的个数保证能将待测机柜上所有IT设备拍全。具体地,利用相似三角形原理,计算将待测机柜全面拍摄所需的摄像头到待测机柜的横向距离来标定驻点位置,具体如下:
通过摄像头的感光元件靶面参数w、镜头的焦距f、视场大小s及镜头到待测物体之间的横向距离d的关系得出:
那么驻点位置d为:
计算出每个待测机柜前方的驻点位置,当机柜需要进行检测时,机器人自主导航至待测机柜前方的驻点位置。
S2、机器人上的若干个摄像头对待测机柜录制视频,并将不同摄像头录制的视频的第一帧图像拼接成一张上下覆盖整个待测机柜的图像。
机器人到达待测机柜前方的驻点位置后,启动摄像头对待测机柜录制视频,因为若干个摄像头所覆盖的拍摄/录制区域不同,故每个摄像头只能录制待测机柜某一部分的图像,需要将多个摄像头录制的视频的第一帧图像拼接起来得到覆盖整个待测机柜的图像。
本实施例采用图像特征拼接融合技术将不同摄像头录制的视频的第一帧图像拼接成一张上下覆盖整个待测机柜的图像,具体包括如下:
S21、采用多个摄像头录制的每个视频的第一帧图像,设相邻图像为P和Q;
S22、图像P的某一行像素矢量A匹配图像Q的某一行像素矢量B,利用两像素矢量间的余玄相似度判断其相似性,相似度的公式如下:
式中,n代表视频的第几帧图像,n=1、2、3……、M,那么M表示视频中图像的总帧数,本实施例优选M=30;
S23、对相似度最大的行,按行上下图像匹配融合,使得多张图像拼接成一张上下覆盖整个待测机柜的图片。
S3、图片分析:采集样本,标记IT设备和指示灯数据,训练IT设备检测模型和指示灯状态检测模型,检测经步骤S2拼接后的图像,获取不同区域指示灯状态表达的含义。
本实施例所述步骤S3具体包括如下:
采集若干个机房IT设备数据图像作为样本,对IT设备分类并进行命名标记;
采集若干个指示灯的颜色数据作为样本,对指示灯的颜色状态信息进行标记;
采用残差卷积网络结构yolo3图像目标检测模型训练IT设备检测模型和指示灯状态检测模型,;
使用训练好的IT设备检测模型和指示灯状态检测模型对步骤S2中拼接的图像进行检测,得到各个IT设备的类型名称及其坐标区域RD,以及指示灯的状态信息及其坐标区域RL,其中,RL∈RD;
根据该类型IT设备的配置文件进行信息匹配,获取不同区域指示灯状态表达的含义。
S4、视频分析:将视频转换成图像,求取每张图像相同位置像素点的均方差值,判断动态像素点,多个相邻的动态像素点形成一个连通区域,求得动态连通区域的坐标位于哪个IT设备坐标区域内,判断闪烁灯是否正常运行。
本实施例所述步骤S4具体包括如下:
采集设定时间长度的视频,将M帧的视频转换成图像,组成图像数据立方体;
将彩色图像转换为灰度图,对每张图像相同位置像素点的数据求取均方差值,对每张图像相同位置像素点的数据求取均方差值包括如下:
首先,求取每张图像相同位置像素点的数据的均方值mes:
然后,根据均方值mes再求取每张图像相同位置像素点的均方差值diff:
其中,(i,j)表示图像中像素点的位置,n=1、2、3……、M,C(n,i,j)按时间叠加的图像立方体。
预设一个均方差阈值,当图像上某位置的均方差值大于预设的均方差阈值时,则判定该位置存在变化的像素值,即该位置为动态像素点;
将多个相邻的动态像素点形成一个连通区域;
对视频的彩色图像的第一帧进行图像分析,检测到IT设备类型及其坐标信息,从而得知视频检测到的连通区域的坐标位于哪个IT设备坐标区域内;
最后将检测到的信息与IT设备的配置文件进行信息匹配,从而判断该闪烁灯是否正常运行工作。
S5、综合图片分析和视频分析结果,得到指示灯状态故障信息。
综合图片分析和视频分析结果,结合故障信息专家库预判解决方案,得到指示灯状态故障信息,并将结果实时传输给平台,供巡检人员查看。
本实施中,一般在进行图片分析和视频分析之前,先建立一个IT设备的配置文件,所述IT设备的配置文件包括:
不同IT设备的类型Dev、该类型IT设备不同位置处指示灯的位置R以及指示灯状态代表的含义S;
其中,Dev={R:S},R表示为(x,y,w,h),x和y表示指示灯区域左上角的坐标,w和h分别表示指示灯区域的宽和长,每个IT设备的宽度和高度分别为W和H,指示灯区域归一化后的坐标为:
然后,指明指示灯区域归一化后的坐标,并说明该区域R指示灯状态S为红灯、绿灯、橙灯和蓝灯的具体含义(红灯、绿灯、橙灯和蓝灯是本实施例中优选的颜色,也可以选择其他颜色灯代表不同的含义),以及是否为闪烁灯。
以上仅描述了本发明的基本原理和优选实施方式,本领域人员可以根据上述描述做出许多变化和改进,这些变化和改进应该属于本发明的保护范围。