CN115225463A - 一种基于it运维的硬件故障监测方法及系统 - Google Patents

一种基于it运维的硬件故障监测方法及系统 Download PDF

Info

Publication number
CN115225463A
CN115225463A CN202211146962.9A CN202211146962A CN115225463A CN 115225463 A CN115225463 A CN 115225463A CN 202211146962 A CN202211146962 A CN 202211146962A CN 115225463 A CN115225463 A CN 115225463A
Authority
CN
China
Prior art keywords
equipment
network structure
fault
hardware
fault identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211146962.9A
Other languages
English (en)
Other versions
CN115225463B (zh
Inventor
陈杰
李雪荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Niu Shopkeeper Technology Co ltd
Original Assignee
Jiangsu Niu Shopkeeper Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Niu Shopkeeper Technology Co ltd filed Critical Jiangsu Niu Shopkeeper Technology Co ltd
Priority to CN202211146962.9A priority Critical patent/CN115225463B/zh
Publication of CN115225463A publication Critical patent/CN115225463A/zh
Application granted granted Critical
Publication of CN115225463B publication Critical patent/CN115225463B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供了一种基于IT运维的硬件故障监测方法及系统,涉及智能监测相关领域,方法包括:连接IT运维管理系统,获取硬件设备集合;分析硬件设备集合之间的连接关系,以各个硬件设备作为节点搭建设备拓扑网络结构,进行设备使用状态同级分析,输出设备分层网络结构,搭建设备故障识别模型;对硬件设备集合进行工作状态监测,输出实时工作参数,输入设备故障识别模型中,获取故障识别结果,生成设备预警信息。解决了IT运维过程中的故障识别精度低,导致无法及时进行设备故障预警的技术问题,达到了对硬件设备分级编号,搭建网络结构,提高故障识别精度,通过云处理器辅助设备故障识别,提高故障识别效率,及时进行设备故障预警的技术效果。

Description

一种基于IT运维的硬件故障监测方法及系统
技术领域
本发明涉及智能监测相关领域,具体涉及一种基于IT运维的硬件故障监测方法及系统。
背景技术
现阶段,通过IT建设和IT运维,可以大力提升自动化生产企业的效率,但是,大量自动化生产企业在IT运维投资成本大,故障预警机制不够完善,故障排除机制不合理,在故障排除后存在连锁反应出现的概率,使得大量IT运维人员花费大部分时间和精力去处理简单重复的问题,亟需硬件故障监测精准度高的方案,对提高硬件故障预警可信度。
现有技术中存在IT运维过程中的故障识别精度低,导致无法及时进行设备故障预警的技术问题。
发明内容
本申请通过提供了一种基于IT运维的硬件故障监测方法及系统,解决了IT运维过程中的故障识别精度低,导致无法及时进行设备故障预警的技术问题,达到了对硬件设备分级编号,搭建网络结构,提高故障识别精度,通过云处理器辅助设备故障识别,提高故障识别效率,及时进行设备故障预警的技术效果。
鉴于上述问题,本申请提供了一种基于IT运维的硬件故障监测方法及系统。
本申请的第一个方面,提供了一种基于IT运维的硬件故障监测方法,其中,所述方法应用于IT运维的硬件故障监测系统,所述系统与云处理器通信连接,所述方法包括:连接IT运维管理系统,获取硬件设备集合;分析所述硬件设备集合之间的连接关系,以各个硬件设备作为节点搭建设备拓扑网络结构,其中,所述设备拓扑网络结构中的各个节点均包括对应的设备信息;通过对所述设备拓扑网络结构进行设备使用状态同级分析,输出设备分层网络结构;按照所述设备分层网络结构,搭建设备故障识别模型,其中,所述设备故障识别模型嵌于所述云处理器;对所述硬件设备集合进行工作状态监测,输出实时工作参数;将所述实时工作参数输入所述设备故障识别模型中,根据所述故障识别模型,获取故障识别结果,其中,所述故障识别结果为实时工作参数与所处设备状态工作时的契合度识别结果;根据所述故障识别结果,生成设备预警信息。
本申请的第二个方面,提供了一种基于IT运维的硬件故障监测系统,其中,所述系统与云处理器通信连接,所述系统包括:数据获取单元,所述数据获取单元用于连接IT运维管理系统,获取硬件设备集合;网络结构搭建单元,所述网络结构搭建单元用于分析所述硬件设备集合之间的连接关系,以各个硬件设备作为节点搭建设备拓扑网络结构,其中,所述设备拓扑网络结构中的各个节点均包括对应的设备信息;同级分析单元,所述同级分析单元用于通过对所述设备拓扑网络结构进行设备使用状态同级分析,输出设备分层网络结构;模型搭建单元,所述模型搭建单元用于按照所述设备分层网络结构,搭建设备故障识别模型,其中,所述设备故障识别模型嵌于所述云处理器;状态监测单元,所述状态监测单元用于对所述硬件设备集合进行工作状态监测,输出实时工作参数;识别结果获取单元,所述识别结果获取单元用于将所述实时工作参数输入所述设备故障识别模型中,根据所述故障识别模型,获取故障识别结果,其中,所述故障识别结果为实时工作参数与所处设备状态工作时的契合度识别结果;预警信息生成单元,所述预警信息生成单元用于根据所述故障识别结果,生成设备预警信息。
本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
由于采用了连接IT运维管理系统,获取硬件设备集合;分析硬件设备集合之间的连接关系,以各个硬件设备作为节点搭建设备拓扑网络结构;通过对设备拓扑网络结构进行设备使用状态同级分析,输出设备分层网络结构;按照设备分层网络结构,搭建设备故障识别模型;对硬件设备集合进行工作状态监测,输出实时工作参数;将实时工作参数输入设备故障识别模型中,根据故障识别模型,获取故障识别结果;根据故障识别结果,生成设备预警信息。本申请实施例达到了对硬件设备分级编号,搭建网络结构,提高故障识别精度,通过云处理器辅助设备故障识别,提高故障识别效率,及时进行设备故障预警的技术效果。
附图说明
图1为本申请一种基于IT运维的硬件故障监测方法的流程示意图;
图2为本申请一种基于IT运维的硬件故障监测方法的输出设备分层网络结构的流程示意图;
图3为本申请一种基于IT运维的硬件故障监测方法的分层链接至设备分层网络结构的流程示意图;
图4为本申请一种基于IT运维的硬件故障监测系统的结构示意图。
附图标记说明:数据获取单元11,网络结构搭建单元12,同级分析单元13,模型搭建单元14,状态监测单元15,识别结果获取单元16,预警信息生成单元17。
具体实施方式
本申请通过提供了一种基于IT运维的硬件故障监测方法及系统,解决了IT运维过程中的故障识别精度低,导致无法及时进行设备故障预警的技术问题,达到了对硬件设备分级编号,搭建网络结构,提高故障识别精度,通过云处理器辅助设备故障识别,提高故障识别效率,及时进行设备故障预警的技术效果。
实施例一
如图1所示,本申请提供了一种基于IT运维的硬件故障监测方法,其中,所述方法应用于IT运维的硬件故障监测系统,所述系统与云处理器通信连接,所述方法包括:
步骤S100:连接IT运维管理系统,获取硬件设备集合;
步骤S200:分析所述硬件设备集合之间的连接关系,以各个硬件设备作为节点搭建设备拓扑网络结构,其中,所述设备拓扑网络结构中的各个节点均包括对应的设备信息;
具体而言,所述IT运维管理系统与所述硬件故障监测系统通信连接,所述IT运维管理系统内部集成一数据采集同步记录装置,通过所述数据采集同步记录装置中的数据信息,获取硬件设备集合,所述硬件设备集合的元素包括网络设备、服务设备、系统设备、数据库设备、中间设备等相关硬件设备,分析所述硬件设备集合之间的连接关系,所述连接关系可以是端口有线连接,也可以是蓝牙共享连接,不对所述连接方式进行限定,通过所述硬件设备集合之间的连接关系,进行设备连通关系映射,以各个硬件设备作为节点搭建设备拓扑网络结构,所述设备拓扑网络结构中的各个节点均包括对应的设备信息,所述设备信息包括设备型号信息、设备运行信息等相关设备信息,所述设备拓扑网络结构可以是总线型、星型等相关形状,具体结合所述硬件设备集合进行确定,为后续进行分析提供数据分析提供支持。
进一步具体说明,IT运维的硬件设备的运行环境复杂,难以对设备运行进行精准的预警,IT运维人员的日常工作重复、IT运维本身质量难以优化,通过所述硬件设备集合中的各个元素,基于硬件设备的连接关系,生成设备拓扑网络结构,为准确筛选出故障硬件提供基础。
步骤S300:通过对所述设备拓扑网络结构进行设备使用状态同级分析,输出设备分层网络结构;
进一步的,如图2所示,通过对所述设备拓扑网络结构进行设备使用状态同级分析,输出设备分层网络结构,步骤S300还包括:
步骤S310:通过对所述设备拓扑网络结构中的各个节点对应的设备信息进行使用状态分析,获取多个寿命检测指标;
步骤S320:根据所述多个寿命检测指标进行设备寿命分析,获取设备寿命指数;
步骤S330:按照所述设备寿命指数进行同级划分,输出设备同级划分结果;
步骤S340:以所述设备同级划分结果对所述设备拓扑网络结构进行分层,输出所述设备分层网络结构。
具体而言,所述设备使用状态包括初期故障状态、偶发故障期状态与磨损故障期状态,对所述设备拓扑网络结构中的各个硬件设备的设备信息进行设备使用状态分析,确定所述设备拓扑网络结构中的各个硬件设备的设备使用状态,对所述设备使用状态进行设备使用状态同级分析,确定所述各个硬件设备的状态分级,对所述设备拓扑网络结构进行分层,输出设备分层网络结构,所述设备分层网络结构包括初期故障层、偶发故障层与磨损故障层,确定设备的状态,生成设备分层网络结构,为及时进行设备维修提供支持。
进一步具体说明,所述设备拓扑网络结构中的各个节点均包括对应的设备信息,通过所述各个节点对应的设备信息确定设备使用状态,具体的,所述设备信息包括设备型号信息、设备运行信息等相关设备信息,通过所述设备运行信息,确定所述设备的设备使用时长指标,所述设备使用时长指标即设备的运行累计时长,通过设备型号信息进行检索,确定设备型号信息对应的设备铭牌,使用所述设备铭牌上标记的使用时间阈值,获取所述寿命检测指标,所述寿命检测指标包括所述设备使用时长指标与所述使用时间阈值,所述设备拓扑网络结构中的各个节点对应的设备的寿命检测指标即所述多个寿命检测指标,通过所述多个寿命检测指标,进行设备寿命分析,确定所述各个节点对应的设备的使用进度,所述设备寿命分析即对所述设备使用时长指标比所述使用时间阈值,确定设备的使用进度,所述设备使用时长指标比所述使用时间阈值所得百分数即所述设备的使用进度,通过所述设备的使用进度,结合设备寿命相关联的指标参数,对设备寿命之间的相关度分析,获取设备寿命指数,所述设备寿命指数以百分比形式表达;将划分等级固定为预设划分等级信息(所述预设划分等级信息可以设定为一级:0~30%、二级:30~60%、三级:60~100%,结合相关管理人员自定义设定),对所述设备寿命指数进行同级划分,将所述设备寿命指数映射至所述划分等级上所得结果定义为设备同级划分结果,通过所述设备同级划分结果,对所述设备拓扑网络结构进行分层,所述划分等级与所述预设划分等级信息对应,输出所述设备分层网络结构,为保证设备分层网络结构精度提供技术支持。
进一步具体而言,所述初期故障状态即设备的运转初期,设备在运转初期故障发生频次高,初期故障的原因包括但不限于设计、制造不良,可以通过运转、测试、调整、维修,降低运转初期故障的发生频次,使得故障率逐步下降并趋于稳定;所述偶发故障期状态即运转初期后,设备的零部件均未达到使用寿命的状态,偶发故障期原因可以是操作失误,导致的部分设备的零部件应力超出零部件应力阈值,所述磨损故障期状态即设备的部分零部件达到使用寿命的状态,所述磨损故障期状态的原因包括但不限于设备的零部件磨损、零部件腐蚀、零部件疲劳,可以通过加强维修,及时更换到达寿命的零部件实现故障的排除。
进一步的,根据所述多个寿命检测指标进行设备寿命分析,获取设备寿命指数,步骤S320包括:
步骤S321:获取所述多个寿命检测指标,其中,所述多个寿命检测指标包括设备零件质量指标、设备使用时长指标和设备负载量化指标;
步骤S322:根据所述设备零件质量指标、所述设备使用时长指标和所述设备负载量化指标分别与设备寿命之间的相关度,配置指标权重因子;
步骤S323:以所述指标权重因子对所述设备零件质量指标、设备使用时长指标和设备负载量化指标进行权重计算,输出所述设备寿命指数。
具体而言,对检测指标进行权重计算,均衡所述多个寿命检测指标的指标差异,为全面评估设备寿命提供基础,所述多个寿命检测指标还包括设备零件质量指标和设备负载量化指标,所述设备负载量化指标包括负载数量指标与负载功率指标,通过IT运维管理系统,进行数据调用,获取所述多个寿命检测指标,进行相关性分析,依次分别计算对所述设备零件质量指标、所述设备使用时长指标和所述设备负载量化指标与设备寿命之间的相关度,分别获取零件质量-寿命相关度、设备使用时长-寿命相关度和设备负载量-寿命相关度,所述指标权重因子包括但不限于零件质量-寿命相关度、设备使用时长-寿命相关度和设备负载量-寿命相关度,通过所述零件质量-寿命相关度、设备使用时长-寿命相关度和设备负载量-寿命相关度,对所述指标权重因子对所述设备零件质量指标、设备使用时长指标和设备负载量化指标进行权重参数配置,输出所述设备寿命指数,为提高设备寿命指数的精度提供支持。
步骤S400:按照所述设备分层网络结构,搭建设备故障识别模型,其中,所述设备故障识别模型嵌于所述云处理器;
进一步的,如图3所示,按照所述设备分层网络结构,搭建设备故障识别模型,步骤S400还包括:
步骤S410:根据所述设备分层网络结构,获取多个分层级别;
步骤S420:以所述多个分层级别进行数据分析,搭建多个设备故障识别模型,其中,所述多个设备故障识别模型与所述多个分层级别一一对应;
步骤S430:将所述多个设备故障识别模型分别链接至所述设备分层网络结构的各个分层中。
具体而言,将所述设备故障识别模型嵌于所述云处理器,通过云处理器进行辅助运算,可以极大程度提高所述IT运维管理系统的数据运算效率,按照所述设备分层网络结构,搭建一设备故障识别模型,所述设备故障识别模型的模型基础为特征识别关联映射信道,通过对所述设备分层网络结构的指标关联特征进行映射匹配,确定所述指标关联特征的映射逻辑,可以通过模型训练确定所述关联映射逻辑,将所述映射逻辑导入所述设备故障识别模型中,搭建设备故障识别模型,为提高所述设备故障识别模型的完整性提供支持。
进一步具体说明,根据所述设备分层网络结构包括初期故障层、偶发故障层与磨损故障层,获取多个分层级别,所述多个分层级别可以对应为初级分层(初期故障层)、中级分层(偶发故障层)与高级分层(磨损故障层);通过同级设备使用状态,在所述IT运维管理系统中进行设备参数指标提取,获取同级的历史工作参数、设备历史状态与历史故障结果,所述多个设备故障识别模型与所述多个分层级别一一对应,通过所述特征识别关联映射信道,对所述多个分层级别分别进行训练,所述设备故障识别模型的模型基础为BP反向传播模型,以所述同级的历史工作参数为训练数据,将所述同级的历史工作参数输入所述BP反向传播模型的输入端口,以所述设备历史状态为监督数据,进行有监督训练,在所述模型的输出趋于稳定状态,对所述模型的输出结果与所述历史故障结果进行比对,在所述比对结果满足预设模型误差阈值阶段,确定所述设备故障识别模型,为后续进行数据分析提供模型基础,通过所述设备分层网络结构,同步搭建多个设备故障识别模型,在所述多个设备故障识别模型搭建完成后,通过云处理器进行导出,将所述多个设备故障识别模型分别对应链接至所述设备分层网络结构的各个分层中,在保障硬件故障监测系统的数据处理效率的同时,通过进行模型训练,确定指标关联特征的映射逻辑,为保证所述设备故障识别模型识别精度提供技术支持。
步骤S500:对所述硬件设备集合进行工作状态监测,输出实时工作参数;
步骤S600:将所述实时工作参数输入所述设备故障识别模型中,根据所述故障识别模型,获取故障识别结果,其中,所述故障识别结果为实时工作参数与所处设备状态工作时的契合度识别结果;
步骤S700:根据所述故障识别结果,生成设备预警信息。
具体而言,对所述硬件设备集合中的各个硬件设备的工作状态进行实时监测,所述实时监测装置即现场实时在线监测装置,通过数据交换机巡查作业,进行工作状态监测,将所述各个硬件设备的数据交换机巡查作业所得数据进行实时传送,输出实时工作参数;将所述实时工作参数输入所述设备故障识别模型中,获取所述故障识别模型的输出,所述故障识别模型的输出即故障识别结果,根据所述故障识别结果,生成设备预警信息,为保证所述设备预警信息的及时性,提高硬件故障监测管理效率。
进一步的,获取故障识别结果,步骤S600还包括:
步骤S610:根据所述实时工作参数的对应的设备类型进行模型匹配分析,获取匹配故障识别模型;
步骤S620:根据所述匹配故障识别模型,获取工作契合度,其中,所述工作契合度用于标识所述实时工作参数与所述匹配故障识别模型中预设工作参数的契合度;
步骤S630:根据所述工作契合度,获取所述故障识别结果。
进一步的,本申请实施例还包括:
步骤S631:判断所述工作契合度是否处于预设工作契合度中;
步骤S632:若所述工作契合度不处于所述预设工作契合度,获取异常定位指令;
步骤S633:根据所述异常定位指令,得到异常工作参数;
步骤S634:对所述异常工作参数的数据源模块进行定位,输出异常工作模块,将所述异常工作模块发送至相关运维管理人员。
具体而言,所述设备类型包括但不限于网络服务类型设备、运算处理类型设备与数据库类型设备,通过所述实时工作参数的参数类型,确定对应的设备类型,在所述多个设备故障识别模型中,通过设备类型进行模型匹配分析,获取匹配故障识别模型,所述匹配故障识别模型为所述多个设备故障识别模型中与所述设备类型匹配的设备故障识别模型,所述故障识别结果为实时工作参数与所处设备状态的契合度识别结果,导出所述匹配故障识别模型中的契合度匹配层的输出,所述契合度匹配层的输出即工作契合度,所述工作契合度用于标识所述实时工作参数与所述匹配故障识别模型中预设工作参数的契合度,所述预设工作参数为一预设参数指标,通过所述硬件故障监测系统相关管理人员自定义设定预设工作参数,利用所述工作契合度,对所述实时工作参数的进行标记,获取所述故障识别结果,在所述硬件故障监测系统出现多个故障检修时,通过所述工作契合度,辅助相关管理人员确定故障检修先后,所述工作契合度低的故障需要优先进行故障维修,以优先恢复IT运维的硬件故障监测系统对应的硬件装置的运行为目标,从故障处理维护角度,进一步完善所述硬件故障监测系统。
具体而言,通过进行指标判断,判断所述工作契合度是否处于预设工作契合度中;若所述工作契合度不处于所述预设工作契合度,获取异常定位指令,所述异常定位指令可以对所述实时工作参数进行异常标记;根据所述异常定位指令,在所述实时工作参数进行识别标记,得到异常工作参数;所述数据源模块为编码指令存储模块,通过异常工作参数,定位所述异常工作参数的数据源模块,对异常工作模块进行异常标记,将所述异常工作模块发送至相关运维管理人员,为辅助相关运维管理人员及时进行设备运维提供支持。
进一步的,本申请实施例还包括:
步骤S810:设置运维设备三元组,其中,所述设备三元组包括设备-模块-寿命;
步骤S820:根据所述运维设备三元组作为编码模组,对所述硬件设备集合进行编码,输出运维设备编码结果;
步骤S830:以所述运维设备编码结果作为所述IT运维管理系统进行IT运维设备管理。
具体而言,设置运维设备三元组,所述设备三元组包括设备-模块-寿命,具体的,通过所述数据源模块,进行管理,查找对应的设备、所属模块(所属模组)、设备寿命,多个所属模块集成所属模组,具体需要结合实际的模块单元的功能进行确定,将所述设备、所属模块、设备寿命设置为所述设备三元组,根据所述运维设备三元组作为编码模组,所述编码模组即所述设备的多个编码模块,通过所述实时工作参数,在编码模组进行数据编码,重复上述操作,对所述硬件设备集合中的各个硬件设备进行编码,将实时工作参数转换为机器数,输出运维设备编码结果,以所述运维设备编码结果作为所述IT运维管理系统进行IT运维设备管理,通过运维设备三元组,将在设备-模块进行数据编码过程,增加以寿命期限为参照基础,全面均衡指标差异,为提高所述数据源模块中编码指令的准确率提供数据支持。
进一步解释说明,增加以寿命期限为参照基础,对设备寿命的剩余寿命期限进行归一化处理,利用变异系数法等客观赋权方法进行加权计算,直接利用设备寿命的剩余寿命期限的信息,通过计算得到所述归一化处理得到的各个结果的权重,确定权重后,对所述数据源模块中编码指令进行权重修正,提高所述数据源模块中编码指令的准确率。
综上所述,本申请所提供的一种基于IT运维的硬件故障监测方法及系统具有如下技术效果:
由于采用了连接IT运维管理系统,获取硬件设备集合;分析硬件设备集合之间的连接关系,以各个硬件设备作为节点搭建设备拓扑网络结构;通过对设备拓扑网络结构进行设备使用状态同级分析,输出设备分层网络结构;按照设备分层网络结构,搭建设备故障识别模型;对硬件设备集合进行工作状态监测,输出实时工作参数;将实时工作参数输入设备故障识别模型中,根据故障识别模型,获取故障识别结果;根据故障识别结果,生成设备预警信息。本申请通过提供了一种基于IT运维的硬件故障监测方法及系统,达到了对硬件设备分级编号,搭建网络结构,提高故障识别精度,通过云处理器辅助设备故障识别,提高故障识别效率,及时进行设备故障预警的技术效果。
由于采用了根据设备分层网络结构,获取多个分层级别;以多个分层级别进行数据分析,搭建多个设备故障识别模型;将多个设备故障识别模型分别链接至设备分层网络结构的各个分层中。在保障硬件故障监测系统的数据处理效率的同时,通过进行模型训练,确定指标关联特征的映射逻辑,为保证设备故障识别模型识别精度提供技术支持。
由于采用了根据实时工作参数的对应的设备类型进行模型匹配分析,获取匹配故障识别模型,获取工作契合度,获取故障识别结果,辅助相关管理人员确定故障检修先后,工作契合度低的故障需要优先进行故障维修,以优先恢复IT运维的硬件故障监测系统对应的硬件装置的运行为目标,从故障处理维护角度,进一步完善硬件故障监测系统。
实施例二
基于与前述实施例中一种基于IT运维的硬件故障监测方法相同的发明构思,如图4所示,本申请提供了一种基于IT运维的硬件故障监测系统,其中,所述系统与云处理器通信连接,所述系统包括:
数据获取单元11,所述数据获取单元11用于连接IT运维管理系统,获取硬件设备集合;
网络结构搭建单元12,所述网络结构搭建单元12用于分析所述硬件设备集合之间的连接关系,以各个硬件设备作为节点搭建设备拓扑网络结构,其中,所述设备拓扑网络结构中的各个节点均包括对应的设备信息;
同级分析单元13,所述同级分析单元13用于通过对所述设备拓扑网络结构进行设备使用状态同级分析,输出设备分层网络结构;
模型搭建单元14,所述模型搭建单元14用于按照所述设备分层网络结构,搭建设备故障识别模型,其中,所述设备故障识别模型嵌于所述云处理器;
状态监测单元15,所述状态监测单元15用于对所述硬件设备集合进行工作状态监测,输出实时工作参数;
识别结果获取单元16,所述识别结果获取单元16用于将所述实时工作参数输入所述设备故障识别模型中,根据所述故障识别模型,获取故障识别结果,其中,所述故障识别结果为实时工作参数与所处设备状态工作时的契合度识别结果;
预警信息生成单元17,所述预警信息生成单元17用于根据所述故障识别结果,生成设备预警信息。
进一步的,所述系统包括:
状态分析单元,所述状态分析单元用于通过对所述设备拓扑网络结构中的各个节点对应的设备信息进行使用状态分析,获取多个寿命检测指标;
寿命指数获取单元,所述寿命指数获取单元用于根据所述多个寿命检测指标进行设备寿命分析,获取设备寿命指数;
同级划分结果输出单元,所述同级划分结果输出单元用于按照所述设备寿命指数进行同级划分,输出设备同级划分结果;
拓扑网络结构分层单元,所述拓扑网络结构分层单元用于以所述设备同级划分结果对所述设备拓扑网络结构进行分层,输出所述设备分层网络结构。
进一步的,所述系统包括:
寿命检测指标获取单元,所述寿命检测指标获取单元用于获取所述多个寿命检测指标,其中,所述多个寿命检测指标包括设备零件质量指标、设备使用时长指标和设备负载量化指标;
权重因子配置单元,所述权重因子配置单元用于根据所述设备零件质量指标、所述设备使用时长指标和所述设备负载量化指标分别与设备寿命之间的相关度,配置指标权重因子;
权重计算单元,所述权重计算单元用于以所述指标权重因子对所述设备零件质量指标、设备使用时长指标和设备负载量化指标进行权重计算,输出所述设备寿命指数。
进一步的,所述系统包括:
网络结构分层单元,所述网络结构分层单元用于根据所述设备分层网络结构,获取多个分层级别;
识别模型搭建单元,所述识别模型搭建单元用于以所述多个分层级别进行数据分析,搭建多个设备故障识别模型,其中,所述多个设备故障识别模型与所述多个分层级别一一对应;
分层链接单元,所述分层链接单元用于将所述多个设备故障识别模型分别链接至所述设备分层网络结构的各个分层中。
进一步的,所述系统包括:
模型匹配分析单元,所述模型匹配分析单元用于根据所述实时工作参数的对应的设备类型进行模型匹配分析,获取匹配故障识别模型;
工作契合度获取单元,所述工作契合度获取单元用于根据所述匹配故障识别模型,获取工作契合度,其中,所述工作契合度用于标识所述实时工作参数与所述匹配故障识别模型中预设工作参数的契合度;
故障识别结果获取单元,所述故障识别结果获取单元用于根据所述工作契合度,获取所述故障识别结果。
进一步的,所述系统包括:
契合度判断单元,所述契合度判断单元用于判断所述工作契合度是否处于预设工作契合度中;
异常定位指令获取单元,所述异常定位指令获取单元用于若所述工作契合度不处于所述预设工作契合度,获取异常定位指令;
异常工作参数确定单元,所述异常工作参数确定单元用于根据所述异常定位指令,得到异常工作参数;
工作模块输出单元,所述工作模块输出单元用于对所述异常工作参数的数据源模块进行定位,输出异常工作模块,将所述异常工作模块发送至相关运维管理人员。
进一步的,所述系统包括:
三元组设置单元,所述三元组设置单元用于设置运维设备三元组,其中,所述设备三元组包括设备-模块-寿命;
设备编码单元,所述设备编码单元用于根据所述运维设备三元组作为编码模组,对所述硬件设备集合进行编码,输出运维设备编码结果;
运维设备管理单元,所述运维设备管理单元用于以所述运维设备编码结果作为所述IT运维管理系统进行IT运维设备管理。
本说明书和附图仅仅是本申请的示例性说明,在不脱离本申请的精神和范围的情况下,可对其进行各种修改和组合。本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请意图包括这些改动和变型在内。

Claims (8)

1.一种基于IT运维的硬件故障监测方法,其特征在于,所述方法应用于IT运维的硬件故障监测系统,所述系统与云处理器通信连接,所述方法包括:
连接IT运维管理系统,获取硬件设备集合;
分析所述硬件设备集合之间的连接关系,以各个硬件设备作为节点搭建设备拓扑网络结构,其中,所述设备拓扑网络结构中的各个节点均包括对应的设备信息;
通过对所述设备拓扑网络结构进行设备使用状态同级分析,输出设备分层网络结构;
按照所述设备分层网络结构,搭建设备故障识别模型,其中,所述设备故障识别模型嵌于所述云处理器;
对所述硬件设备集合进行工作状态监测,输出实时工作参数;
将所述实时工作参数输入所述设备故障识别模型中,根据所述故障识别模型,获取故障识别结果,其中,所述故障识别结果为实时工作参数与所处设备状态工作时的契合度识别结果;
根据所述故障识别结果,生成设备预警信息。
2.如权利要求1所述的方法,其特征在于,通过对所述设备拓扑网络结构进行设备使用状态同级分析,输出设备分层网络结构,所述方法还包括:
通过对所述设备拓扑网络结构中的各个节点对应的设备信息进行使用状态分析,获取多个寿命检测指标;
根据所述多个寿命检测指标进行设备寿命分析,获取设备寿命指数;
按照所述设备寿命指数进行同级划分,输出设备同级划分结果;
以所述设备同级划分结果对所述设备拓扑网络结构进行分层,输出所述设备分层网络结构。
3.如权利要求2所述的方法,其特征在于,根据所述多个寿命检测指标进行设备寿命分析,获取设备寿命指数,所述方法还包括:
获取所述多个寿命检测指标,其中,所述多个寿命检测指标包括设备零件质量指标、设备使用时长指标和设备负载量化指标;
根据所述设备零件质量指标、所述设备使用时长指标和所述设备负载量化指标分别与设备寿命之间的相关度,配置指标权重因子;
以所述指标权重因子对所述设备零件质量指标、设备使用时长指标和设备负载量化指标进行权重计算,输出所述设备寿命指数。
4.如权利要求1所述的方法,其特征在于,按照所述设备分层网络结构,搭建设备故障识别模型,所述方法还包括:
根据所述设备分层网络结构,获取多个分层级别;
以所述多个分层级别进行数据分析,搭建多个设备故障识别模型,其中,所述多个设备故障识别模型与所述多个分层级别一一对应;
将所述多个设备故障识别模型分别链接至所述设备分层网络结构的各个分层中。
5.如权利要求1所述的方法,其特征在于,所述获取故障识别结果,所述方法还包括:
根据所述实时工作参数的对应的设备类型进行模型匹配分析,获取匹配故障识别模型;
根据所述匹配故障识别模型,获取工作契合度,其中,所述工作契合度用于标识所述实时工作参数与所述匹配故障识别模型中预设工作参数的契合度;
根据所述工作契合度,获取所述故障识别结果。
6.如权利要求5所述的方法,其特征在于,所述方法还包括:
判断所述工作契合度是否处于预设工作契合度中;
若所述工作契合度不处于所述预设工作契合度,获取异常定位指令;
根据所述异常定位指令,得到异常工作参数;
对所述异常工作参数的数据源模块进行定位,输出异常工作模块,将所述异常工作模块发送至相关运维管理人员。
7.如权利要求3所述的方法,其特征在于,所述方法还包括:
设置运维设备三元组,其中,所述设备三元组包括设备-模块-寿命;
根据所述运维设备三元组作为编码模组,对所述硬件设备集合进行编码,输出运维设备编码结果;
以所述运维设备编码结果作为所述IT运维管理系统进行IT运维设备管理。
8.一种基于IT运维的硬件故障监测系统,其特征在于,所述系统与云处理器通信连接,所述系统包括:
数据获取单元,所述数据获取单元用于连接IT运维管理系统,获取硬件设备集合;
网络结构搭建单元,所述网络结构搭建单元用于分析所述硬件设备集合之间的连接关系,以各个硬件设备作为节点搭建设备拓扑网络结构,其中,所述设备拓扑网络结构中的各个节点均包括对应的设备信息;
同级分析单元,所述同级分析单元用于通过对所述设备拓扑网络结构进行设备使用状态同级分析,输出设备分层网络结构;
模型搭建单元,所述模型搭建单元用于按照所述设备分层网络结构,搭建设备故障识别模型,其中,所述设备故障识别模型嵌于所述云处理器;
状态监测单元,所述状态监测单元用于对所述硬件设备集合进行工作状态监测,输出实时工作参数;
识别结果获取单元,所述识别结果获取单元用于将所述实时工作参数输入所述设备故障识别模型中,根据所述故障识别模型,获取故障识别结果,其中,所述故障识别结果为实时工作参数与所处设备状态工作时的契合度识别结果;
预警信息生成单元,所述预警信息生成单元用于根据所述故障识别结果,生成设备预警信息。
CN202211146962.9A 2022-09-21 2022-09-21 一种基于it运维的硬件故障监测方法及系统 Active CN115225463B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211146962.9A CN115225463B (zh) 2022-09-21 2022-09-21 一种基于it运维的硬件故障监测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211146962.9A CN115225463B (zh) 2022-09-21 2022-09-21 一种基于it运维的硬件故障监测方法及系统

Publications (2)

Publication Number Publication Date
CN115225463A true CN115225463A (zh) 2022-10-21
CN115225463B CN115225463B (zh) 2022-12-20

Family

ID=83617231

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211146962.9A Active CN115225463B (zh) 2022-09-21 2022-09-21 一种基于it运维的硬件故障监测方法及系统

Country Status (1)

Country Link
CN (1) CN115225463B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115860729A (zh) * 2023-02-17 2023-03-28 河北信服科技有限公司 一种it运维综合管理系统
CN116401614A (zh) * 2023-06-06 2023-07-07 苏州振州机电科技有限公司 设备的故障识别方法及系统
CN116402496A (zh) * 2023-06-08 2023-07-07 山东诚卓信息技术有限公司 一种it资产的可视化维保管控方法及系统
CN117670239A (zh) * 2023-12-07 2024-03-08 广东力王科技股份有限公司 基于物联网的智慧校园数据监控应用系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108259462A (zh) * 2017-11-29 2018-07-06 国网吉林省电力有限公司信息通信公司 基于海量网络监测数据的大数据安全分析系统
CN109325601A (zh) * 2018-08-21 2019-02-12 国网江苏省电力有限公司泰州供电分公司 物流设备故障监测运维管理方法
US20200162352A1 (en) * 2011-07-15 2020-05-21 Inetco Systems Limited Method and system for monitoring performance of an application system
US20200244673A1 (en) * 2019-01-24 2020-07-30 Darktrace Limited Multivariate network structure anomaly detector
CN112202679A (zh) * 2020-11-17 2021-01-08 中国人民解放军战略支援部队信息工程大学 用于分层网络拓扑自动路由分发的硬件设备量化方法及系统
CN113537770A (zh) * 2021-07-15 2021-10-22 广西电网有限责任公司电力科学研究院 一种基于云计算的决策树配置寿命预测的方法及系统
CN113742163A (zh) * 2021-02-02 2021-12-03 北京沃东天骏信息技术有限公司 一种故障预警方法、装置、设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200162352A1 (en) * 2011-07-15 2020-05-21 Inetco Systems Limited Method and system for monitoring performance of an application system
CN108259462A (zh) * 2017-11-29 2018-07-06 国网吉林省电力有限公司信息通信公司 基于海量网络监测数据的大数据安全分析系统
CN109325601A (zh) * 2018-08-21 2019-02-12 国网江苏省电力有限公司泰州供电分公司 物流设备故障监测运维管理方法
US20200244673A1 (en) * 2019-01-24 2020-07-30 Darktrace Limited Multivariate network structure anomaly detector
CN112202679A (zh) * 2020-11-17 2021-01-08 中国人民解放军战略支援部队信息工程大学 用于分层网络拓扑自动路由分发的硬件设备量化方法及系统
CN113742163A (zh) * 2021-02-02 2021-12-03 北京沃东天骏信息技术有限公司 一种故障预警方法、装置、设备及存储介质
CN113537770A (zh) * 2021-07-15 2021-10-22 广西电网有限责任公司电力科学研究院 一种基于云计算的决策树配置寿命预测的方法及系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115860729A (zh) * 2023-02-17 2023-03-28 河北信服科技有限公司 一种it运维综合管理系统
CN116401614A (zh) * 2023-06-06 2023-07-07 苏州振州机电科技有限公司 设备的故障识别方法及系统
CN116401614B (zh) * 2023-06-06 2023-08-18 苏州振州机电科技有限公司 设备的故障识别方法及系统
CN116402496A (zh) * 2023-06-08 2023-07-07 山东诚卓信息技术有限公司 一种it资产的可视化维保管控方法及系统
CN116402496B (zh) * 2023-06-08 2023-08-22 山东诚卓信息技术有限公司 一种it资产的可视化维保管控方法及系统
CN117670239A (zh) * 2023-12-07 2024-03-08 广东力王科技股份有限公司 基于物联网的智慧校园数据监控应用系统

Also Published As

Publication number Publication date
CN115225463B (zh) 2022-12-20

Similar Documents

Publication Publication Date Title
CN115225463B (zh) 一种基于it运维的硬件故障监测方法及系统
CN107358366B (zh) 一种配电变压器故障风险监测方法及系统
CN112817280A (zh) 一种用于火电厂智慧监盘报警系统实现方法
CN110320892A (zh) 基于Lasso回归的污水处理设备故障诊断系统及方法
CN106019195B (zh) 一种电力计量自动化检定流水线故障诊断系统
CN106204330A (zh) 一种配电网智能诊断系统
KR100815032B1 (ko) 발전소 온라인 실시간 성능 감시 시스템
CN109858886B (zh) 一种基于集成学习的费控成功率提升分析方法
CN107967520A (zh) 一种面向新型智能站继电保护设备的综合状态评估理论方法
CN105022373A (zh) 基于zigbee技术的港口设备维护系统
CN111124852A (zh) 一种基于bmc健康管理模块的故障预测方法及系统
CN112016743A (zh) 电网设备的检修预测方法、装置、计算机设备和存储介质
CN112580858A (zh) 设备参数预测分析方法及系统
CN116756909A (zh) 一种基于数据模型及机理模型的火电厂预警诊断系统
CN110262460B (zh) 一种结合聚类思想进行特征提取的砼活塞故障预测方法
CN115037603A (zh) 用电信息采集设备的诊断评估方法、装置及系统
CN116992346A (zh) 一种基于人工智能大数据分析的企业生产数据处理系统
CN113868948A (zh) 一种面向用户的动态阈值模型训练系统及方法
CN117708735A (zh) 一种基于多点校核的量测数据拟合方法、介质及系统
CN117290795A (zh) 一种适用于单个仪表测量结果异常值的在线识别方法
CN112381242A (zh) 核电站设备维修项目数据处理方法及系统
CN108664696B (zh) 一种冷水机组运行状态的测评方法及装置
CN115936663A (zh) 一种电力系统的维护方法及装置
CN110162015B (zh) 一种基于公共饮水装置的故障诊断方法
CN114091811A (zh) 一种核电厂循环水泵维修决策系统及设计方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant