CN113776783A - 一种基于巡检机器人的机房服务器故障灯检测方法 - Google Patents

一种基于巡检机器人的机房服务器故障灯检测方法 Download PDF

Info

Publication number
CN113776783A
CN113776783A CN202110995065.4A CN202110995065A CN113776783A CN 113776783 A CN113776783 A CN 113776783A CN 202110995065 A CN202110995065 A CN 202110995065A CN 113776783 A CN113776783 A CN 113776783A
Authority
CN
China
Prior art keywords
detection
inspection
inspection robot
machine room
upper computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110995065.4A
Other languages
English (en)
Inventor
陈启军
郭翔
刘成菊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tongji University
Original Assignee
Tongji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tongji University filed Critical Tongji University
Priority to CN202110995065.4A priority Critical patent/CN113776783A/zh
Publication of CN113776783A publication Critical patent/CN113776783A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01MTESTING STATIC OR DYNAMIC BALANCE OF MACHINES OR STRUCTURES; TESTING OF STRUCTURES OR APPARATUS, NOT OTHERWISE PROVIDED FOR
    • G01M11/00Testing of optical apparatus; Testing structures by optical methods not otherwise provided for
    • G01M11/02Testing optical properties
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/20Instruments for performing navigational calculations
    • G01C21/206Instruments for performing navigational calculations specially adapted for indoor navigation
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course or altitude of land, water, air, or space vehicles, e.g. automatic pilot
    • G05D1/02Control of position or course in two dimensions
    • G05D1/021Control of position or course in two dimensions specially adapted to land vehicles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/046Forward inferencing; Production systems

Abstract

本发明涉及一种基于巡检机器人的机房服务器故障灯检测方法,包括以下步骤:1)通过巡检机器人对待巡检机房进行完整建图;2)上位机和巡检机器人的工控机处于同一局域网下;3)巡检机器人按照规划的巡检路径进行巡检;4)上位机采用基于深度学习的目标检测卷积神经网络及TensorRT深度学习推理优化器实时对待检测服务器的指示灯颜色和位置进行检测;5)工控机接收到当前检测位置检测完成信号后,巡检机器人按照巡检路径自动前往下个检测位置点并更新检测位置的ID号,重新发送确认到达信号给上位机,重复步骤4)最终完成整个待巡检机房内服务器指示灯的巡检任务。与现有技术相比,本发明具有高实时性、高准确率、鲁棒性好、高效率、高安全性等优点。

Description

一种基于巡检机器人的机房服务器故障灯检测方法
技术领域
本发明涉及机器视觉检测领域,尤其是涉及一种基于巡检机器人的机房服务器故障灯检测方法。
背景技术
随着互联网的快速发展,云服务、大数据等技术的快速迭代,大部分公司都直接或间接的使用服务器存储公司、客户等重要的数据,服务器的持续高效稳定运行是保证公司及其客户的数据的安全性的必要条件,此外,服务器也在线运行公司的众多在线服务程序,如果宕机后果不堪设想。因此机房服务器的安全性空前重要。
目前机房的服务器都配有一组指示灯用于显示服务器当前的运行状态,例如绿色灯指示服务器正常运行,红色灯指示服务器出现故障。如何能够快速的监测到服务器故障灯并短时间高效的进行维护是目前机房巡检任务的重点,目前的方案有以下两种:
1、机房采用动力环境集中监控系统,其维护模式是以人为基础,依靠人工轮流值班,在固定时间对机房进行人员巡检,记录存在的问题;
2、设置监控摄像头,使用传统的机器学习方法对机房的故障灯进行检测,例如传统的阈值分割方法处理摄像头拍摄的图片,然后判断指示灯颜色,并辅以人员的固定时间巡检从而确保机房服务器的安全稳定运行。
但是以上两种方案存在以下弊端:
1、人工轮流值班效率低下,缺乏科学性,许多重大事故的发生其实都是人为造成的,人工巡检不利于企业科学管理形式;
2、传统机器学习方法鲁棒性低,对于服务器指示灯颜色的检测的准确率受到光照明暗影响大,很难满足高准确率识别要求。
目前基于AGV自主导航小车视频监控平台下的异常事件检测是具有现实意义的巡检任务,其对安防巡检行业形成智能化、无人化、快速化有重大意义。随着SLAM自主定位与导航技术的发展,AGV自主导航小车高度智能化,得到了广泛的应用。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于巡检机器人的机房服务器故障灯检测方法,本发明基于自主导航的巡检机器人,搭配上位机视频监控平台,采用深度学习目标检测神经网络做指示灯检测,再利用TensorRT优化器优化检测算法的时间效率,利用巡检机器人自主移动的优势和卷积神经网络高鲁棒性、高准确率的优点实现机房服务器指示灯识别的巡检任务。
本发明的目的可以通过以下技术方案来实现:
一种基于巡检机器人的机房服务器故障灯检测方法,包括以下步骤:
1)通过巡检机器人对待巡检机房进行完整建图,规划巡检路径,确定待检测服务器的位置,按照规划的巡检路径确定待检测位置的ID号,将待检测服务器位置与ID号相关联;
2)上位机连接工业相机和HDMI显示屏,使上位机和巡检机器人的工控机处于同一局域网下;
3)巡检机器人按照规划的巡检路径进行巡检,工控机采用rosparam的方式向上位机发送到达指定检测设备的位置信息,包括确认到达检测位置的信号以及ID号;
4)上位机接收到确认到达检测位置的信号后,采用基于深度学习的目标检测卷积神经网络及TensorRT深度学习推理优化器实时对待检测服务器的指示灯颜色和位置进行检测,完成检测后上位机通过rosparam的方式发送检测完成信号给巡检机器人;
5)工控机接收到当前检测位置检测完成信号后,巡检机器人按照巡检路径自动前往下个检测位置点并更新检测位置的ID号,重新发送确认到达信号给上位机,重复步骤4)最终完成整个待巡检机房内服务器指示灯的巡检任务,上位机实时通过显示屏显示整个检测过程,当检测结果发现服务器红色或橙色故障灯则立即报警。
所述的步骤1)中,巡检机器人通过激光雷达和里程计对待巡检机房进行高精度建图。
巡检机器人建图过程的要求如下:
能够对整个待巡检机房的所有待检测位置进行精确定位并设置ID号,确保所有待检测服务器在检测时能够被唯一确定;
巡检机器人按照所有的待检测服务器的位置点规划巡检路径,巡检过程中动态更新检测位置编号并以rosparam的方式发送给上位机使得指示灯检测结果与对应设备准确对应。
所述的步骤2)中,上位机采用移动端嵌入式硬件开发平台,具体为Jetson Nano嵌入式开发板,用以实现指示灯检测和检测结果实时显示功能。
所述的步骤2)中,为确保上位机与巡检机器人工控机在同一局域网内,通过rosparam通信方式实现指示灯检测与机器人导航巡检之间的协同关系。
所述的步骤3)中,上位机通过工业相机采集多张服务器指示灯图像并进行标注后形成VOC数据集,构建目标检测卷积神经网络并进行训练,并采用TensorRT推理优化器进行网络的前向推理计算。
所述的目标检测卷积神经网络以YoloV5-s模型结构为基础进行改进并设置超参数训练。
所述的步骤4)中,在上位机进行指示灯检测时,首先通过工业相机依次实时获取三张图像,然后进行图像拼接成为一张图,采用训练好的目标检测卷积神经网络进行检测,得到检测结果,最后对检测结果进行预警分析,并将检测结果实时显示。
所述的步骤5)中,上位机在完成检测后通过rosparam的通信方式告知巡检机器人当前位置检测完成信号,从而确保整个检测过程按照规划的巡检路径完成。
所述的步骤5)还包括以下步骤:
整个机房巡检结束时保存巡检结果上传至服务器供安检人员查阅。
与现有技术相比,本发明具有以下优点:
一、本发明利用深度学习卷积神经网络目标检测方法实现了服务器指示灯的检测,准确率达到了99%,利用TensorRT推理优化器实现了高实时性、高准确率的检测功能,具有很强的鲁棒性。
二、通过上位机实现了对指示灯的检测识别,并与巡检机器人协同共同完成巡检任务,解决了人工巡检的缺点,具备高效率、高安全性的优点。
附图说明
图1为巡检机器人服务器指示灯检测流程图。
图2为机房巡检过程简化示意图。
图3为指示灯检测卷积神经网络结构图。
图4为TensorRT前向推理加速示意图。
图5为测试结果示意图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
如图1所示,本发明提供一种基于巡检机器人的机房服务器故障灯检测方法,包括以下步骤:
S1、巡检机器人在待巡检机房使用激光雷达进行slam建图,确定待检测服务器位置并设定ID号,规划一个合理的巡检路径从而方便完成整个机房的服务器指示灯的检测;
步骤S1中,巡检机器人使用激光雷达和里程计对巡检机房进行高精度建图,在建好的图中标记服务器位置并设置ID号,规划巡检路径。
S2、上位机使用Jetson Nano嵌入式开发板,主要负责指示灯检测和检测结果实时显示功能。上位机的检测模块通过rosparam方式接收工控机检测开始标志位/arrive_current_goal从而开始检测,若/arrive_current_goal为true则开始检测,并设定检测时间,同时获取检测位置ID号,并实时保存显示检测结果,待检测完成后,上位机检测模块通过rosparam置位检测结束标志告知巡检机器人导航至下一个检测点,图2为巡检机器人建图后路径规划的一个简化示意图,机器人设定每个待检测位置的ID号,然后开始巡检任务;
在步骤S2中,设置Jetson Nano上位机与巡检机器人工控机处于同一局域网以便于通过rosparam方式进行通信,上位机直连HDMI显示屏和USB高清工业相机。
在rosparam的通信方式下,为确保指示灯检测程序与巡检机器人导航协同配合完成巡检任务,设置/arrive_current_goal标志位参数用于巡检机器人与检测程序开始结束的标志位。
S3、利用上位机连接工业USB相机,在巡检机房采集200张服务器指示灯图像,使用LabelImg软件进行标注并整理成VOC数据集格式,搭建卷积神经网络模型,网络结构图如图3所示,参考YoloV5-s模型结构并进行针对性改进,然后设置超参数(batch_size、learning_rate、steps)训练网络模型实现指示灯检测功能;
S4、将PyTorch训练的.pt权重文件转成.weights权重文件,使用TensorRT推理优化器进行网络前向推理计算,TensorRT将训练好的模型通过模型量化、动态内存优化、层的融合等技术转化为在Jetson Nano嵌入式平台以高性能运行的代码,即生成推理engine文件来实现服务器指示灯检测任务,从而最终完成适用于巡检机器人的机房服务器指示灯检测功能,图4说明了TensorRT的作用;
在步骤S4中,采用深度学习卷积神经网络检测算法,以PyTorch为深度学习训练框架,在巡检机房采集200张服务器指示灯图像数据,使用LabelImg软件标注制作VOC数据集,对不同颜色指示灯进行分类,然后训练网络模型实现指示灯检测功能。
为了提高模型推理速度,确保网络在移动端嵌入式设备Jetson Nano实现高准确率、高实时性的性能,将PyTorch的.pt权重文件转成.weights权重文件,然后使用TensorRT推理优化器进行网络前向推理计算,完成服务器指示灯检测功能。
S5、上位机在固定时间内完成当前位置指示灯检测后,保存检测结果,若有故障灯则触发报警机制通知安检人员维修,然后将/arrive_current_goal设置为false,通知工控机导航至下一个检测点。以此完成整个巡检任务。
在步骤S5中:上位机获取检测开始标志位及检测位置的ID号,完成检测后保存检测结果,并通过rosparam设置检测结束标志位,如此完成整个机房服务器故障灯检测任务。
本发明与现有技术中的机房巡检方案相比,最大的创新点有以下两点:
1.利用rosparam的通信方式将上位机指示灯检测功能与巡检机器人导航功能完美协同起来,能够利用巡检机器人灵活、精准巡航的特点,使得机房服务器故障灯的巡检任务变得更加安全、可靠、高效。
2.利用深度学习卷积神经网络目标检测方法实现了服务器指示灯的检测,准确率达到了99%,利用TensorRT推理优化器实现了高实时性、高准确率的检测功能,具有很强的鲁棒性。
上述实施例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所作的等效变化或修饰,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种基于巡检机器人的机房服务器故障灯检测方法,其特征在于,包括以下步骤:
1)通过巡检机器人对待巡检机房进行完整建图,规划巡检路径,确定待检测服务器的位置,按照规划的巡检路径确定待检测位置的ID号,将待检测服务器位置与ID号相关联;
2)上位机连接工业相机和HDMI显示屏,使上位机和巡检机器人的工控机处于同一局域网下;
3)巡检机器人按照规划的巡检路径进行巡检,工控机采用rosparam的方式向上位机发送到达指定检测设备的位置信息,包括确认到达检测位置的信号以及ID号;
4)上位机接收到确认到达检测位置的信号后,采用基于深度学习的目标检测卷积神经网络及TensorRT深度学习推理优化器实时对待检测服务器的指示灯颜色和位置进行检测,完成检测后上位机通过rosparam的方式发送检测完成信号给巡检机器人;
5)工控机接收到当前检测位置检测完成信号后,巡检机器人按照巡检路径自动前往下个检测位置点并更新检测位置的ID号,重新发送确认到达信号给上位机,重复步骤4)最终完成整个待巡检机房内服务器指示灯的巡检任务,上位机实时通过显示屏显示整个检测过程,当检测结果发现服务器红色或橙色故障灯则立即报警。
2.根据权利要求1所述的一种基于巡检机器人的机房服务器故障灯检测方法,其特征在于,所述的步骤1)中,巡检机器人通过激光雷达和里程计对待巡检机房进行高精度建图。
3.根据权利要求2所述的一种基于巡检机器人的机房服务器故障灯检测方法,其特征在于,巡检机器人建图过程的要求如下:
能够对整个待巡检机房的所有待检测位置进行精确定位并设置ID号,确保所有待检测服务器在检测时能够被唯一确定;
巡检机器人按照所有的待检测服务器的位置点规划巡检路径,巡检过程中动态更新检测位置编号并以rosparam的方式发送给上位机使得指示灯检测结果与对应设备准确对应。
4.根据权利要求1所述的一种基于巡检机器人的机房服务器故障灯检测方法,其特征在于,所述的步骤2)中,上位机采用移动端嵌入式硬件开发平台,具体为Jetson Nano嵌入式开发板,用以实现指示灯检测和检测结果实时显示功能。
5.根据权利要求1所述的一种基于巡检机器人的机房服务器故障灯检测方法,其特征在于,所述的步骤2)中,为确保上位机与巡检机器人工控机在同一局域网内,通过rosparam通信方式实现指示灯检测与机器人导航巡检之间的协同关系。
6.根据权利要求1所述的一种基于巡检机器人的机房服务器故障灯检测方法,其特征在于,所述的步骤3)中,上位机通过工业相机采集多张服务器指示灯图像并进行标注后形成VOC数据集,构建目标检测卷积神经网络并进行训练,并采用TensorRT推理优化器进行网络的前向推理计算。
7.根据权利要求6所述的一种基于巡检机器人的机房服务器故障灯检测方法,其特征在于,所述的目标检测卷积神经网络以YoloV5-s模型结构为基础进行改进并设置超参数训练。
8.根据权利要求1所述的一种基于巡检机器人的机房服务器故障灯检测方法,其特征在于,所述的步骤4)中,在上位机进行指示灯检测时,首先通过工业相机依次实时获取三张图像,然后进行图像拼接成为一张图,采用训练好的目标检测卷积神经网络进行检测,得到检测结果,最后对检测结果进行预警分析,并将检测结果实时显示。
9.根据权利要求1所述的一种基于巡检机器人的机房服务器故障灯检测方法,其特征在于,所述的步骤5)中,上位机在完成检测后通过rosparam的通信方式告知巡检机器人当前位置检测完成信号,从而确保整个检测过程按照规划的巡检路径完成。
10.根据权利要求1所述的一种基于巡检机器人的机房服务器故障灯检测方法,其特征在于,所述的步骤5)还包括以下步骤:
整个机房巡检结束时保存巡检结果上传至服务器供安检人员查阅。
CN202110995065.4A 2021-08-27 2021-08-27 一种基于巡检机器人的机房服务器故障灯检测方法 Pending CN113776783A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110995065.4A CN113776783A (zh) 2021-08-27 2021-08-27 一种基于巡检机器人的机房服务器故障灯检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110995065.4A CN113776783A (zh) 2021-08-27 2021-08-27 一种基于巡检机器人的机房服务器故障灯检测方法

Publications (1)

Publication Number Publication Date
CN113776783A true CN113776783A (zh) 2021-12-10

Family

ID=78839857

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110995065.4A Pending CN113776783A (zh) 2021-08-27 2021-08-27 一种基于巡检机器人的机房服务器故障灯检测方法

Country Status (1)

Country Link
CN (1) CN113776783A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116805435A (zh) * 2023-08-23 2023-09-26 四川川西数据产业有限公司 一种数电机房智能巡检装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108189043A (zh) * 2018-01-10 2018-06-22 北京飞鸿云际科技有限公司 一种应用于高铁机房的巡检方法及巡检机器人系统
CN110514957A (zh) * 2019-08-19 2019-11-29 深圳供电局有限公司 变电站自动巡检方法和平台
CN110850881A (zh) * 2019-11-29 2020-02-28 国网智能科技股份有限公司 一种变电站巡检机器人的离线巡检系统及方法
CN111080775A (zh) * 2019-12-19 2020-04-28 深圳市原创科技有限公司 一种基于人工智能的服务器巡检方法及系统
CN112766103A (zh) * 2021-01-07 2021-05-07 国网福建省电力有限公司泉州供电公司 一种机房巡检方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108189043A (zh) * 2018-01-10 2018-06-22 北京飞鸿云际科技有限公司 一种应用于高铁机房的巡检方法及巡检机器人系统
CN110514957A (zh) * 2019-08-19 2019-11-29 深圳供电局有限公司 变电站自动巡检方法和平台
CN110850881A (zh) * 2019-11-29 2020-02-28 国网智能科技股份有限公司 一种变电站巡检机器人的离线巡检系统及方法
CN111080775A (zh) * 2019-12-19 2020-04-28 深圳市原创科技有限公司 一种基于人工智能的服务器巡检方法及系统
CN112766103A (zh) * 2021-01-07 2021-05-07 国网福建省电力有限公司泉州供电公司 一种机房巡检方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116805435A (zh) * 2023-08-23 2023-09-26 四川川西数据产业有限公司 一种数电机房智能巡检装置
CN116805435B (zh) * 2023-08-23 2023-10-31 四川川西数据产业有限公司 一种数电机房智能巡检装置

Similar Documents

Publication Publication Date Title
CN108189043B (zh) 一种应用于高铁机房的巡检方法及巡检机器人系统
US20220137612A1 (en) Transformer fault diagnosis and positioning system based on digital twin
CN111310947A (zh) 基于5g的建筑设施运维方法、设备、存储介质及系统
CN110865917A (zh) 基于ar技术的电力机房巡检作业方法、系统及应用
CN111722714A (zh) 一种基于ar技术的数字化变电站计量运检辅助方法
CN112115927B (zh) 一种基于深度学习的机房设备智能识别方法及系统
CN109782364B (zh) 基于机器视觉的交通标志牌缺失检测方法
CN112698618A (zh) 一种基于机器视觉技术的服务器告警识别系统
CN113240249B (zh) 基于无人机增强现实的城市工程质量智能评价方法及其系统
CN111415432A (zh) 一种用于水电站的智能巡检方法
CN110910440A (zh) 一种基于电力影像数据的输电线路长度确定方法和系统
CN116258980A (zh) 一种基于视觉的无人机分布式光伏电站巡检方法
CN113313006A (zh) 基于无人机的城市违建监管方法、系统和存储介质
CN113776783A (zh) 一种基于巡检机器人的机房服务器故障灯检测方法
CN116301046A (zh) 一种基于电力杆塔识别的无人机航拍安全距离自动定位方法
CN115169602A (zh) 电力设备的维护方法、装置、存储介质及计算机设备
CN116772868B (zh) 一种配电室巡检机器人及其自动巡检方法
CN116363397A (zh) 设备故障排查方法、装置及巡检系统
CN115686014A (zh) 一种基于bim模型的地铁巡检机器人
CN115877993A (zh) 一种基于数字孪生的三维视图展示方法及装置
CN114445411A (zh) 一种无人机巡线缺陷识别系统及控制方法
CN114995259A (zh) 一种用于电网配电室巡检的智能无人系统及飞行巡检方法
CN115661966A (zh) 一种基于增强现实的巡检系统和方法
CN115083212A (zh) 一种基于三维建模的无人机定位智能管理系统
CN114744756A (zh) 一种基于机器视觉的输电线路智能巡检系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20211210