CN111124865A - 一种基于时间和软件统计的工控机维护预警系统 - Google Patents

一种基于时间和软件统计的工控机维护预警系统 Download PDF

Info

Publication number
CN111124865A
CN111124865A CN201911361266.8A CN201911361266A CN111124865A CN 111124865 A CN111124865 A CN 111124865A CN 201911361266 A CN201911361266 A CN 201911361266A CN 111124865 A CN111124865 A CN 111124865A
Authority
CN
China
Prior art keywords
personal computer
industrial personal
time
subsystem
maintenance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911361266.8A
Other languages
English (en)
Inventor
程新平
赵志辉
牛蕾
刘金媛
孟宪尊
罗云锋
杨增刊
冯凤江
刘会杨
艾云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hebei Shangyuan Intelligent Technology Co ltd
Original Assignee
Hebei Shangyuan Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hebei Shangyuan Intelligent Technology Co ltd filed Critical Hebei Shangyuan Intelligent Technology Co ltd
Priority to CN201911361266.8A priority Critical patent/CN111124865A/zh
Publication of CN111124865A publication Critical patent/CN111124865A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3433Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment for load management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computing Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种基于时间和软件统计的工控机维护预警系统,包括数据采集子系统、数据分析子系统、信息通知子系统、客户操作端、组网传输子系统;数据采集子系统用于获取当前运行工控机的相关信息,并记录采集时间;组网传输子系统分别通过网络、串型总线的方式,与数据分析子系统相连并将信息入库;数据分析子系统接受采集的信息并存储后,进行状态评估,得到维护预警评估值,将维护信息发送给信息通知子系统;所述信息通知子系统将数据分析子系统发送的维护信息通知给维护人员进行维护;所述客户操作端接收到信息后进行问题处理,并将处理结果返回至数据分析子系统进行数据更新。本发明能够对工控机进行监控,并提前发现工控机存在隐患并处理。

Description

一种基于时间和软件统计的工控机维护预警系统
技术领域
本发明涉及设备维护技术领域,特别是一种对工控机进行维护的预警系统。
背景技术
在日常和工业应用中,多采用基于工控机的电气控制系统。工控机作为控制系统中的重要一坏,往往要求长期运行,其稳定性是系统的重中之重。工控作为机电产品,其涵盖了以完成系统功能需求为目的的软件和硬件,必然需要定期进行检查与维护,以避免一旦工控机出现问题导致系统异常、宕机等无法进行服务的情况。目前,由于受维护制度的缺失、维护人员技术能力等级所限,工控机往往是在发生问题并造成严重后果以后才能得到处理,不能做到防患于未然,无法提前发现其中的隐患。
发明内容
本发明需要解决的技术问题是提供了一种工控机维护预警系统,能够对工控机进行监控,并提前发现工控机存在隐患,以便于提前进行处理。
为解决上述技术问题,本发明所采取的技术方案如下。
一种基于时间和软件统计的工控机维护预警系统,包括数据采集子系统、数据分析子系统、信息通知子系统、客户操作端以及组网传输子系统;所述数据采集子系统用于获取当前运行工控机的相关信息,并记录采集时间;所述组网传输子系统分别通过网络、串型总线的方式,与数据分析子系统相连并将信息入库;所述数据分析子系统接受采集的信息并存储后,根据工控机的当前信息以及运行状态,结合日常维护记录,进行状态评估,分析可能出现的异常情况,得到维护预警评估值,在下次常规维护时间到达前将维护信息发送给信息通知子系统;所述信息通知子系统将数据分析子系统发送的维护信息通知给维护人员进行维护;所述客户操作端接收到信息后进行问题处理,处理完成后登记,并将处理结果返回至数据分析子系统进行数据更新。
上述一种基于时间和软件统计的工控机维护预警系统,所述相关信息包括工控机系统时间、工控机实时CPU利用率、内存利用率、硬盘吞吐率、占用CPU过高的进程列表、占用硬盘吞吐率过高的进程列表。
上述一种基于时间和软件统计的工控机维护预警系统,所述数据分析子系统包括数据接入层、数据分析层、通讯层以及数据存储层;所述数据接入层通过以太网与数据采集子系统相互通信,并将接收到的数据同时送入数据分析层和数据存储层;数据分析层对接收到的基于时间的工控机信息进行分析,获得维护预警评估值以及工控机维护信息,并将维护信息传输给通讯层,由通讯层通过设定的开放接口将结果推送至信息通知子系统。
上述一种基于时间和软件统计的工控机维护预警系统,所述数据分析层的分析方法包括对工控机实时安全工作等级的评估以及工控机历史状态的评估。
上述一种基于时间和软件统计的工控机维护预警系统,所述工控机实时安全工作等级的评估包括:对工控机实时CPU负荷的分析,如果工控机CPU负荷超出警戒范围,则处于CPU高位工作状态;对工控机实时内存负荷的分析,如果工控机内存占用总数超出警戒范围,则处于内存高位工作状态;对工控机实时IO负荷的分析,如果工控机IO请求超出警戒范围,则处于IO占用高位工作状态;对工控机进程实时CPU负荷的分析,如果某一进程CPU占用超出设定范围,则该进程处于CPU进程高位工作状态;对工控机进程实时内存负荷的分析,如果发现某一进程内存占用超出警戒范围,则该进程处于内存占用高位工作状态;数据分析层对实时高位状态异常进行评估加权,得到当前工控机的安全工作等级评价值。
上述一种基于时间和软件统计的工控机维护预警系统,所述工控机历史状态的评估包括:历史维护间隔评估,当前时间距离最近一次维护的时间间隔时间越长,则评估等级越高;运行工作等级评估趋势分析,如果当前运行工作等级有突发增高趋势,则迅速提高其评估等级,如果有缓慢增长或稳定趋势,则常规提高评估等级;异常进程评估,如果出现异常进程列表项,则迅速提高评估等级。
上述一种基于时间和软件统计的工控机维护预警系统,所述维护预警评估值是数据分析子系统通过综合运行历史记录、可疑的进程、可疑的CPU或IO占用率进行评估获取。
上述一种基于时间和软件统计的工控机维护预警系统,所述开放接口为短信、邮件、QQ、微信用户、微信群、阿里钉钉中的至少一种。
由于采用了以上技术方案,本发明所取得技术进步如下。
本发明可对所有以工控机为重要节点构建的服务系统中的所有工控机进行监控与维护处理,从计划、采集、记录、分析、处理五方面,覆盖了工控机运行的整个链条,通过记录服务系统中各个工控机的运行关键指标和工控机的原有维护记录,对工控机可能出现故障的时间点进行预测,提前进行工控机的养护操作,提升了工控机服务系统的整体服务时间,并减小了由于工控机问题对服务系统产生的影响,提高了服务系统的运行稳定性。
附图说明
图1为本发明所述系统的结构框图。
具体实施方式
下面将结合具体具体实施方式对本发明进行进一步详细说明。
一种基于时间和软件统计的工控机维护预警系统,应用于以工控机为重要节点构建的服务系统中,用于对服务系统中的所有工控机进行监控和维护处理,其结构如图1所示,包括数据采集子系统、数据分析子系统、信息通知子系统、客户操作端以及组网传输子系统,数据采集子系统与数据分析子系统之间通过组网传输子系统进行数据通讯,数据分析子系统与信息通知子系统之间通过互联网进行通讯,信息通知子系统与客户操作端之间通过无线网络或者互联网进行通讯。
数据采集子系统用于获取当前运行工控机的相关信息,并记录采集时间;相关信息包括工控机系统时间、工控机实时CPU利用率、工控机实时的物理内存利用率、工控机实时的硬盘吞吐率、占用CPU过高的进程列表、占用硬盘吞吐率过高的进程列表。
本发明中,数据采集子系统作为软件部署于服务系统中的各工控机上,负责收集待管理工控机上的各种信息,随服务系统的系统启动而自动运行。该子系统基于服务系统底层接口,可以对系统CPU利用率和当前运行任务的CPU占用率进行实时查询,为上层异常检测软件中的负载异常检测功能提供底层数据支持,可以对系统整体物理内存占用率、当前运行任务的内存占用率进行实时查询,为上层异常检测软件中的内存泄漏异常检测功能提供底层数据支持;可以对进程列表进行实时查询,为上层异常检测软件中的非白名单进程进行检测分析提供底层数据支持。
组网传输子系统分别通过网络、串型总线的方式,与数据分析子系统相连,并将数据采集子系统采集的系统内各个工控机的运行状态信息传输给数据分析子系统。组网传输子系统部署于工控机和服务器上,是工控机和服务器以及整个服务系统之间的通讯连接端口。
数据分析子系统可制定工控机的日常维护周期计划,在运行过程中,用于接受采集的信息并存储后,根据工控机的当前信息以及运行状态,结合日常维护记录,进行状态评估,分析可能出现的异常情况,得到维护预警评估值,在下次常规维护时间到达前将维护信息发送给信息通知子系统。其中,维护预警评估值是数据分析子系统通过综合运行历史记录、可疑的进程、可疑的CPU或IO占用率进行评估获取。
数据分析子系统部署于服务系统的服务器上,包括数据接入层、数据分析层、通讯层以及数据存储层。其中,数据接入层通过以太网与数据采集子系统相互通信,并将接收到的数据同时送入数据分析层和数据存储层;数据分析层对接收到的基于时间的工控机信息进行分析,分析其中的异常进程,异常CPU使用情况,异常内存使用情况,维护记录等,并对其维护等级进行评估,得到维护预警评估值以及工控机维护信息,并将维护信息传输给通讯层,由通讯层通过设定的开放接口将结果推送至信息通知子系统。
数据分析层的分析方法主要包括对工控机实时安全工作等级的评估以及工控机历史状态的评估。
工控机实时安全工作等级的评估主要包括但不仅限于以下方面:对工控机实时CPU负荷的分析,如果工控机CPU负荷超出警戒范围,则处于CPU高位工作状态;对工控机实时内存负荷的分析,如果工控机内存占用总数超出警戒范围,则处于内存高位工作状态;对工控机实时IO负荷的分析,如果工控机IO请求超出警戒范围,则处于IO占用高位工作状态;对工控机进程实时CPU负荷的分析,如果某一进程CPU占用超出设定范围,则该进程处于CPU进程高位工作状态;对工控机进程实时内存负荷的分析,如果发现某一进程内存占用超出警戒范围,则该进程处于内存占用高位工作状态;数据分析层对实时高位状态异常进行评估加权,得到当前工控机的安全工作等级评价值。
工控机历史状态的评估主要包括但不仅限于以下方面:历史维护间隔评估,当前时间距离最近一次维护的时间间隔时间越长,则评估等级越高;运行工作等级评估趋势分析,如果当前运行工作等级有突发增高趋势,则迅速提高其评估等级,如果有缓慢增长或稳定趋势,则常规提高评估等级;异常进程评估,如果出现异常进程列表项,则迅速提高评估等级。
数据分析子系统可以将实时采集的信息、历史统计的数据以及评估结果通过通讯层对外提供数据。
信息通知子系统部署于服务器中,用于将数据分析子系统发送的维护信息通知给维护人员进行维护。通讯层输送的信息接入信息通知子系统中的开放接口,开放接口可为短信、邮件、QQ、微信用户、微信群、阿里钉钉中等。
客户操作端为维护人员的移动终端,在客户操作端接收到信息后,进行问题的处理,问题处理完成后进行登记,并将处理结果返回至数据分析子系统进行数据更新。登记的内容包括日常维护的内容、时间和维护效果。
各个工控机的维护周期可预先制定,并存储在数据分析子系统的数据存储层中,当维护人员完成维护以后,自动会将下次的维护时间进行重新登记与处理,并在下次维护周期到达时,将维护信息进行消息推送。

Claims (8)

1.一种基于时间和软件统计的工控机维护预警系统,其特征在于:包括数据采集子系统、数据分析子系统、信息通知子系统、客户操作端以及组网传输子系统;所述数据采集子系统用于获取当前运行工控机的相关信息,并记录采集时间;所述组网传输子系统分别通过网络、串型总线的方式,与数据分析子系统相连并将信息入库;所述数据分析子系统接受采集的信息并存储后,根据工控机的当前信息以及运行状态,结合日常维护记录,进行状态评估,分析可能出现的异常情况,得到维护预警评估值,在下次常规维护时间到达前将维护信息发送给信息通知子系统;所述信息通知子系统将数据分析子系统发送的维护信息通知给维护人员进行维护;所述客户操作端接收到信息后进行问题处理,处理完成后登记,并将处理结果返回至数据分析子系统进行数据更新。
2.根据权利要求1所述的一种基于时间和软件统计的工控机维护预警系统,其特征在于:所述相关信息包括工控机系统时间、工控机实时CPU利用率、内存利用率、硬盘吞吐率、占用CPU过高的进程列表、占用硬盘吞吐率过高的进程列表。
3.根据权利要求1所述的一种基于时间和软件统计的工控机维护预警系统,其特征在于:所述数据分析子系统包括数据接入层、数据分析层、通讯层以及数据存储层;所述数据接入层通过以太网与数据采集子系统相互通信,并将接收到的数据同时送入数据分析层和数据存储层;数据分析层对接收到的基于时间的工控机信息进行分析,获得维护预警评估值以及工控机维护信息,并将维护信息传输给通讯层,由通讯层通过设定的开放接口将结果推送至信息通知子系统。
4.根据权利要求3所述的一种基于时间和软件统计的工控机维护预警系统,其特征在于:所述数据分析层的分析方法包括对工控机实时安全工作等级的评估以及工控机历史状态的评估。
5.根据权利要求4所述的一种基于时间和软件统计的工控机维护预警系统,其特征在于,所述工控机实时安全工作等级的评估包括:对工控机实时CPU负荷的分析,如果工控机CPU负荷超出警戒范围,则处于CPU高位工作状态;对工控机实时内存负荷的分析,如果工控机内存占用总数超出警戒范围,则处于内存高位工作状态;对工控机实时IO负荷的分析,如果工控机IO请求超出警戒范围,则处于IO占用高位工作状态;对工控机进程实时CPU负荷的分析,如果某一进程CPU占用超出设定范围,则该进程处于CPU进程高位工作状态;对工控机进程实时内存负荷的分析,如果发现某一进程内存占用超出警戒范围,则该进程处于内存占用高位工作状态;数据分析层对实时高位状态异常进行评估加权,得到当前工控机的安全工作等级评价值。
6.根据权利要求4所述的一种基于时间和软件统计的工控机维护预警系统,其特征在于,所述工控机历史状态的评估包括:历史维护间隔评估,当前时间距离最近一次维护的时间间隔时间越长,则评估等级越高;运行工作等级评估趋势分析,如果当前运行工作等级有突发增高趋势,则迅速提高其评估等级,如果有缓慢增长或稳定趋势,则常规提高评估等级;异常进程评估,如果出现异常进程列表项,则迅速提高评估等级。
7.根据权利要求3所述的一种基于时间和软件统计的工控机维护预警系统,其特征在于:所述维护预警评估值是数据分析子系统通过综合运行历史记录、可疑的进程、可疑的CPU或IO占用率进行评估获取。
8.根据权利要求3所述的一种基于时间和软件统计的工控机维护预警系统,其特征在于:所述开放接口为短信、邮件、QQ、微信用户、微信群、阿里钉钉中的至少一种。
CN201911361266.8A 2019-12-26 2019-12-26 一种基于时间和软件统计的工控机维护预警系统 Pending CN111124865A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911361266.8A CN111124865A (zh) 2019-12-26 2019-12-26 一种基于时间和软件统计的工控机维护预警系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911361266.8A CN111124865A (zh) 2019-12-26 2019-12-26 一种基于时间和软件统计的工控机维护预警系统

Publications (1)

Publication Number Publication Date
CN111124865A true CN111124865A (zh) 2020-05-08

Family

ID=70502659

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911361266.8A Pending CN111124865A (zh) 2019-12-26 2019-12-26 一种基于时间和软件统计的工控机维护预警系统

Country Status (1)

Country Link
CN (1) CN111124865A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115660260A (zh) * 2022-12-28 2023-01-31 深圳市四格互联信息技术有限公司 物业管理的检查任务动态生成方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050021733A1 (en) * 2003-07-01 2005-01-27 Microsoft Corporation Monitoring/maintaining health status of a computer system
CN103617561A (zh) * 2013-12-02 2014-03-05 深圳供电局有限公司 一种电网智能变电站二次设备状态评估系统和方法
CN106487574A (zh) * 2016-04-01 2017-03-08 国家计算机网络与信息安全管理中心 自动化运行维护监测系统
CN107942255A (zh) * 2017-11-03 2018-04-20 山东智洋电气股份有限公司 一种基于数据融合技术的变电站蓄电池组状态评估方法
CN109933905A (zh) * 2019-03-13 2019-06-25 西安因联信息科技有限公司 一种基于多维预警分析的机械设备健康状态评估方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050021733A1 (en) * 2003-07-01 2005-01-27 Microsoft Corporation Monitoring/maintaining health status of a computer system
CN103617561A (zh) * 2013-12-02 2014-03-05 深圳供电局有限公司 一种电网智能变电站二次设备状态评估系统和方法
CN106487574A (zh) * 2016-04-01 2017-03-08 国家计算机网络与信息安全管理中心 自动化运行维护监测系统
CN107942255A (zh) * 2017-11-03 2018-04-20 山东智洋电气股份有限公司 一种基于数据融合技术的变电站蓄电池组状态评估方法
CN109933905A (zh) * 2019-03-13 2019-06-25 西安因联信息科技有限公司 一种基于多维预警分析的机械设备健康状态评估方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115660260A (zh) * 2022-12-28 2023-01-31 深圳市四格互联信息技术有限公司 物业管理的检查任务动态生成方法及系统

Similar Documents

Publication Publication Date Title
CN105608758B (zh) 一种基于算法组态和分布式流计算的大数据分析平台装置及方法
CN114282434A (zh) 一种工业设备健康管理系统及方法
CN110728443A (zh) 一种电机全生命周期管控系统
CN113708493B (zh) 基于云边协同的配电终端运维方法、装置和计算机设备
CN110213125A (zh) 一种云环境下基于时序数据的异常检测系统
WO2013043170A1 (en) Automated detection of a system anomaly
CN106446181A (zh) 一种大数据处理及远程监控系统
CN107947998B (zh) 一种基于应用系统的实时监测系统
US20170279669A1 (en) Intelligent configuration system for alert and performance monitoring
CN109696883B (zh) 一种基于云存储的数控机床状态监控和预警系统
CN104240467A (zh) 用于过程警报减少的系统和方法
CN101056447A (zh) 无线通信网网络工况监控装置
CN111124865A (zh) 一种基于时间和软件统计的工控机维护预警系统
CN104410686A (zh) 一种银电网络智能监控系统
CN107666399A (zh) 一种监控数据的方法和装置
CN111290908A (zh) 一种Kafka数据消费积压情况监控报警方法
CN117391675B (zh) 一种数据中心基础设施运维管理方法
CN104601374A (zh) 用于数控机床的网络故障处理方法和装置
CN116071902B (zh) 一种监控机房动力设备的方法、设备及介质
CN117742241A (zh) 一种基于云计算的数据采集方法和系统
CN202841168U (zh) 网络资源监控系统
CN116436821A (zh) 一种基于人工智能计算平台的运维管理软件系统
CN113472881B (zh) 在线终端设备的统计方法和装置
CN105550094B (zh) 一种高可用系统状态自动监控方法
CN116416764A (zh) 报警阈值的生成方法和装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200508