CN215954134U - 环保能源企业大规模实时数据通讯状态监控系统 - Google Patents

环保能源企业大规模实时数据通讯状态监控系统 Download PDF

Info

Publication number
CN215954134U
CN215954134U CN202122303593.7U CN202122303593U CN215954134U CN 215954134 U CN215954134 U CN 215954134U CN 202122303593 U CN202122303593 U CN 202122303593U CN 215954134 U CN215954134 U CN 215954134U
Authority
CN
China
Prior art keywords
module
monitoring
data
communication
monitoring module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202122303593.7U
Other languages
English (en)
Inventor
李欢欢
曹光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Everbright Envirotech China Ltd
Everbright Environmental Protection Research Institute Nanjing Co Ltd
Everbright Environmental Protection Technology Research Institute Shenzhen Co Ltd
Original Assignee
Everbright Envirotech China Ltd
Everbright Environmental Protection Research Institute Nanjing Co Ltd
Everbright Environmental Protection Technology Research Institute Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Everbright Envirotech China Ltd, Everbright Environmental Protection Research Institute Nanjing Co Ltd, Everbright Environmental Protection Technology Research Institute Shenzhen Co Ltd filed Critical Everbright Envirotech China Ltd
Priority to CN202122303593.7U priority Critical patent/CN215954134U/zh
Application granted granted Critical
Publication of CN215954134U publication Critical patent/CN215954134U/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Abstract

本实用新型公开了一种环保能源企业大规模实时数据通讯状态监控系统,包括一级子站监控模块,二级子站监控模块,第一主站监控模块和第二主站监控模块;一级子站监控模块设置在数据采集模块中,二级子站监控模块设置在数据汇总模块中,第一主站监控模块设置在主数据服务器中,第二主站监控模块设置在备用数据服务器中;属于同一个电厂的一级子站监控模块与二级子站监控模块连接;二级子站监控模块与所有的第一主站监控模块以及第二主站监控模块连接,所述第一主站监控模块与第二主站监控模块连接。本实用新型实现了对整个集团大规模实时数据流传输过程的监控透明化与管理实时化,保障了基于实时数据的信息化系统运行的安全和稳定。

Description

环保能源企业大规模实时数据通讯状态监控系统
技术领域
本实用新型属于实时数据采集监控领域。
背景技术
在环保能源类企业信息化系统实际运行过程中,由于各类通讯节点数据采集和接收程序运行异常或者数据传输网络异常等问题,会经常产生实时数据通讯中断的问题,轻度会由于数据传输不及时导致实时监控状态不准、状态不刷新、实时计算指标错误等问题,严重情况下会导致数据传输通道阻塞、缓存失效和数据永久丢失,造成较大损失。因此,需要针对环保能源类企业大规模实时数据采集、传输和存储的整个数据流实现智能集中监控和管理。
环保能源企业在大规模实时数据采集的过程中,一般通过直接对应用数据进行监控的方式发现数据异常,并通过层层排查以确认是否为通讯问题以及通讯异常的具体位置,面对环保能源企业进行大规模实时数据采集的场景,可能存在几百条通讯子链路和相应数量的通讯节点装置,将面临数据流各通讯节点的数据采集和接收程序因异常停止不能及时发现和解决的问题,且对于硬件资源使用异常的通讯节点无法做到及时发现和预警。
当前主要环保能源企业基本都完成了SIS系统的部署,通过采集和汇总各生产现场DCS等控制系统的实时运行数据,实现集团集中统一的生产运行实时数据存储,保障SIS系统实时数据监测、实时指标计算、主要设备状态分析、告警服务、各类数据报表以及各类运行优化和智能诊断等应用的正常准确运行,并进一步为企业上层其它各类信息化应用程序提供海量实时数据支撑。为了保障环保能源企业上述信息化系统的正常运行,底层采集和存储的实时数据及时性和准确性至关重要,如果数据的实时采集过程发生异常,将直接导致上层的应用展示或计算结果错误。但是大型环保能源企业的SIS系统构建需要接入大量的DCS等控制层实时数据,数据传输量大、通讯链路和节点众多且复杂,经常发生一个或多个项目现场通讯中断的故障。目前,各个项目现场各通讯节点几乎都缺乏一套自动化智能化的通讯状态管理程序,既无法实现对数据采集和传输异常进行自动识别和自动恢复,也不能及时的通知企业信息系统运维人员通讯问题及时解决。目前常用的方法是人为发现、事后处理的方式,即只有运行管理人员发现应用程序的数据通讯异常时,才会反馈给系统运维人员进行处理,与发生通讯故障的时间点相比有着较大的延迟,且多个节点发生故障时,需要人工对问题一一排查,解决问题过程繁琐而缓慢,导致SIS和上层其它依赖实时数据的各应用系统处于长时间不可用状态,严重影响环保能源企业业务的正常开展。
公开号为CN106375393A的专利申请提出了一种实时数据采集系统及实时数据通讯中断后自动恢复的方法,通过设置在上位机上的数据采集接口网络传输模块监测数据上传状况,当出现异常状况导致数据上传失败时,则数据采集接口重新将上传失败的数据上传到数据库服务器。该专利只阐述了对数据采集接口的自动判断和数据重新上传功能,但未说明如果重新上传再次失败的问题如何及时提醒和数据采集接口网络传输模块本身运行异常时如何解决等问题,此外对于企业大规模实时数据采集全过程的集中监控也未提及。
实用新型内容
实用新型目的:为了解决上述现有技术存在的问题,本实用新型提供了一种环保能源企业大规模实时数据通讯状态监控系统。
技术方案:本实用新型提供了一种环保能源企业大规模实时数据通讯状态监控系统,环保能源企业实时数据流转过程中包括厂站层模块和集控层模块,所述集控层模块中设有数据服务器,所述数据服务器包括主数据服务器和备用数据服务器,所述实时数据通讯状态监控系统包括一级子站监控模块,二级子站监控模块,第一主站监控模块和第二主站监控模块;所述一级子站监控模块设置在厂站层模块中的数据采集模块中,所述二级子站监控模块设置在厂站层模块中的数据汇总模块中,所述第一主站监控模块设置在集控层模块中的主数据服务器中,所述第二主站监控模块设置在集控层模块中的备用数据服务器中;属于同一个电厂的一级子站监控模块与二级子站监控模块连接;所述二级子站监控模块与所有的第一主站监控模块以及第二主站监控模块连接,所述第一主站监控模块与第二主站监控模块连接。
进一步的,所述一级子站监控模块包括第一数据上报模块,以及均与第一数据上报模块连接的数据采集运行信息监测模块,第一通讯中断告警和通讯异常预警模块,第一硬件资源使用信息监控模块和数据采集异常自动恢复模块;
所述数据采集运行信息监测模块包括监测数据采集模块运行状态的运行状态监测模块,监测数据采集模块通讯状态的通讯状态监测模块,监测数据采集模块数据传输速率的数据传输速率监测模块;所述第一通讯中断告警和通讯异常预警模块包括:数据采集失效告警模块,第一通讯中断告警模块和第一通讯异常预警模块;
所述数据采集运行信息监测模块与数据采集异常自动恢复模块以及第一通讯中断告警模块连接,所述数据采集异常自动恢复模块与数据采集失效告警模块连接;所述第一硬件资源使用信息监控模块与第一通讯异常预警模块连接;所述第一数据上报模块与二级子站监控模块连接。
进一步的,所述第一通讯中断告警和通讯异常预警模块还包括截图模块,所述截图模块与数据采集失效告警模块,第一通讯中断告警模块以及第一数据上报模块连接。
进一步的,所述二级子站监控模块包括第一数据接收模块,第二数据上报模块,以及均与第二数据上报模块连接的数据传输运行信息监测模块,第二通讯中断告警和通讯异常预警模块,第二硬件资源使用信息监控模块和数据传输异常自动恢复模块;
所述数据传输运行信息监测模块包括监测数据汇总模块运行状态的运行状态监测模块,监测数据汇总模块通讯状态的通讯状态监测模块,监测数据汇总模块数据传输速率的数据传输速率监测模块;所述第二通讯中断告警和通讯异常预警模块包括:数据传输失效告警模块,第二通讯中断告警模块和第二通讯异常预警模块;
所述数据传输运行信息监测模块与数据传输异常自动恢复模块以及第二通讯中断告警模块连接,所述数据传输异常自动恢复模块与数据传输失效告警模块连接;所述第二通讯异常预警模块与第二硬件资源使用信息监控模块连接;所述第二数据上报模块与第一、二主站监控模块连接,第一数据接收模块与一级子站监控模块连接。
进一步的,所述二级子站监控模块还包括第一下级节点通讯监控程序状态监测模块,所述一级子站监控模块还包括第一心跳生成模块,所述第一心跳生成模块与第一下级节点通讯监控程序状态监测模块连接,所述第一下级节点通讯监控程序状态监测模块与第二数据上报模块连接。
进一步的,第一、二主站监控模块均包括数据存储和调用模块,以及均与数据存储和调用模块连接的第三硬件资源使用信息监控模块,第三通讯中断告警和通讯异常预警模块,数据服务器运行信息监测模块,数据服务器异常自动恢复模块和第二数据接收模块;
所述数据服务器运行信息监测模块包括监测数据服务器运行状态的运行状态监测模块,监测数据服务器通讯状态的通讯状态监测模块,监测数据服务器数据传输速率的数据传输速率监测模块;所述第三通讯中断告警和通讯异常预警模块包括数据服务器运行失效告警模块,第三通讯中断告警模块和第三通讯异常预警模块;
所述数据服务器运行信息监测模块与数据服务异常自动恢复模块和第三通讯中断告警模块连接;所述数据服务异常自动恢复模块和数据服务器运行失效告警模块连接;所述第三硬件资源使用信息监控模块与第三通讯异常预警模块连接,所述第二数据接收模块与二级子站监控模块连接。
进一步的,所述二级子站监控模块还包括第二心跳信号生成模块,所述第一、二主站监控模块还均包括第二下级节点通讯监控程序状态监测模块;所述第二心跳信号生成模块与第二下级节点通讯监控程序状态监测模块连接;所述第二下级节点通讯监控程序状态监测模块与相应的数据存储和调用模块连接。
进一步的,所述第一主站监控模块还包括第三心跳信号生成模块和备用数据服务器通讯监控程序状态监测模块;所述第二主站监控模块还包括第四心跳信号生成模块和主数据服务器通讯监控程序状态监测模块;所述第三心跳信号生成模块与主数据服务器通讯监控程序状态监测模块连接,所述主数据服务器通讯监控程序状态监测模块与第二主站监控模块的数据存储和调用模块连接;所述第四心跳信号生成模块与备用数据服务器通讯监控程序状态监测模块连接,所述备用数据服务器通讯监控程序状态监测模块与第一主站监控模块中的数据存储和调用模块连接。
有益效果:本实用新型针对环保能源企业设计了一套对整个集团大规模实时数据流进行远程智能监控、诊断和维护的系统方案。针对目前大型环保能源企业面临的实时数据通讯节点设备发生通讯故障无法及时发现和解决的问题,设计了一套智能通讯监控程序部署在各个通讯节点,各自实现对本节点数据采集、传输和接收程序的实时监控、自动告警和异常自动恢复功能,一方面可以实现对常见的通讯故障进行自动识别判定和自动恢复,及时有效的解决问题保障数据传输的及时性和上层业务应用数据的有效性;另一方面对无法自动恢复的通讯故障,可以及时发出告警到集控中心,提醒运维管理人员第一时间进行处理,避免了当前由业务人员发现问题通知解决的滞后性以及由此带来的问题扩大化。除此之外,监控程序还可实现对各个节点硬件资源使用情况的实时监控,并对资源不足的节点发出预警,提醒集控中心运维人员及时关注和干预,防止潜在通讯故障问题的发生。
上述系统的正常运行离不开各个通讯节点部署的通讯监控程序的正常运行,因此本实用新型同步设计了对各级通讯节点部署的通讯监控程序本身进行运行状态监控的方案,利用各级通讯节点定时发出的心跳信号,实现上级节点对下级节点的监控,以及集控层主备节点的相互监控,当任意节点发生通讯监控程序运行异常时,可及时通知集控中心运维人员进行处理,以此方法可保障通讯监控程序运行的可靠性继而保障对各级节点数据通讯智能监控、告警和运维的准确性。
本实用新型中各个通讯节点的数据流状态信息和节点运行状态等信息可以通过现场内部网络和公共网络基于TCP协议实时传输至集控中心,利用集控中心部署的通讯状态集中监控应用进行展示和处理,实现了对整个集团大规模实时数据流传输过程的监控透明化与管理实时化,保障了基于实时数据的信息化系统运行的安全和稳定。
附图说明
图1为环保能源企业集团实时数据采集传输与通讯状态监控数据流示意图;
图2为环保能源企业集团实时数据通讯状态监控信息流程;
图3为本实用新型的结构图。
具体实施方式
构成本实用新型的一部分的附图用来提供对本实用新型的进一步理解,本实用新型的示意性实施例及其说明用于解释本实用新型,并不构成对本实用新型的不当限定。
本实施例中一些专业名词的解释:
通讯节点:环保能源企业实时数据采集和传输过程中对数据进行采集、转发和接收的各类装置,包括各项目现场数据采集客户端、数据汇总客户端、远程集控中心数据接收和存储服务器等。
心跳信号:数据通讯过程中设备A每隔一段时间向互联的设备B发送一个很小的数据包,即心跳信号,设备B可根据能否及时接收到该心跳信号判断和设备A之间的通讯链路是否已经断开。
DCS:全称为分散控制系统(Distributed Control System),由过程控制级和过程监控级组成的以通信网络为纽带的多级计算机系统,常用于发电企业生产现场集中监视和自动控制。
SIS:全称为监控信息系统(Supervisory Information System),是集过程实时监测、性能评估、优化运行及生产过程管理为一体的自动化信息系统,是处于环保能源企业DCS等自动控制类系统与管理信息系统之间的一套实时监控信息系统。
主站和子站:环保能源企业集团级信息化部署模式中,主站进行集控中心总控制系统的部署,可实现对各个发电场站部署的子站进行远程集中监控和管理功能。
一般情况下环保能源企业实时数据流转过程包括厂站层节点和集控层节点,其中厂站层节点包括发电厂站控制层数据源(如DCS等)、数据采集节点(如数据采集工控机、智能数据采集器等)、数据汇总节点(如数据采集工控机),集控层节点包括数据服务器(含主服务器和备用服务器)、应用服务器和Web服务器。在上述各数据通讯节点中,控制层节点作为实时数据源,其通讯状态问题由控制系统厂家提供支持。本实用新型即以后续数据采集、汇总和存储各节点为研究对象,设计一套对各节点数据流进行远程自动监控、通讯中断自动恢复、通讯故障告警提醒以及对通讯异常进行局部预警的系统,通过在各数据采集节点和数据汇总节点上部署监控程序,实现对各自本节点数据流通讯状态的监控、本节点底层硬件资源的使用情况监控、数据通讯中断告警以及数据采集程序异常的自动恢复,各级节点信号逐级上传最终传输至集控层主站监控程序进行集中处理。此外,为了保障各级子站和主站节点的监控程序本身的正常运行,需要对各节点的通讯状态监控程序进行实时监测,其中一级子站节点定时发送心跳信号给二级子站节点,二级子站节点定时发送本身的心跳信号和接收的一级子站节点心跳信号给集控主站节点监控程序,主站节点的主备服务器可定时互相发送心跳信号,以此实现对所有节点的通讯状态监控程序的状态监控。环保能源企业集团实时数据采集传输与通讯状态监控数据流示意图如图1所示。本实施例的实时数据通讯状态监控系统包括一级子站监控模块,二级子站监控模块,第一主站监控模块和第二主站监控模块;所述一级子站监控模块设置在厂站层模块中的数据采集模块中,所述二级子站监控模块设置在厂站层模块中的数据汇总模块中,所述第一主站监控模块设置在集控层中的主数据服务器中,所述第二主站监控模块设置在集控层中的备用数据服务器中;属于同一个电厂的一级子站监控模块与二级子站监控模块连接;所述二级子站监控模块与所有的第一主站监控模块以及第二主站监控模块连接,所述第一主站监控模块与第二主站监控模块连接。实时数据传输流程说明如下:
1)各电厂控制层系统(如DCS等)基于OPC等工业通讯协议将数据发送给实时数据采集节点,每个电厂可根据数据采集规模和控制层系统数量灵活设置数据采集节点的数量,一般为每个电厂部署1~4台;
2)各电厂1个或多个数据采集节点基于TCP网络通讯协议,通过厂内网络专线将数据穿越网络安全隔离装置后汇总到现场唯一的数据汇总节点;
3)所有电厂的数据汇总节点基于TCP网络通讯协议,利用运营商公共网络将数据传输到环保能源企业区域或者总集控中心进行存储;(注:本实用新型通过对无区域中心部署的情况进行阐述,其方法也同样适用于包含区域中心的部署场景)
4)集控中心各类应用服务和Web服务与实时数据进行存取交互,满足各类应用程序对实时数据的要求,为业务人员提供信息化服务;
对各通讯节点进行监控的状态信息流包括各级子站和集控主站通讯节点接收、上报、记录和传输的各类型通讯状态信息,其通过部署在各级节点已有设备上的通讯监控程序进行互联实现,详细流程图如图2所示。
(1)一级子站监控程序数据任务
各一级子站通讯状态监控程序数据任务为上报给二级子站四类信息,即数据采集运行信息、通讯异常告警和预警、硬件资源使用数据和监控程序心跳信号,详细定义如下:
1)数据采集运行信息
·数据采集程序运行状态
数据类型:int
取值范围:0—异常;1—正常;NA—未知
上送方式:秒级上送
·数据流比特率
数据类型:float/double
单位:kb/s
上送方式:秒级上送
·通讯状态
数据类型:int
取值范围:0—中断;1—正常;NA—未知
上送方式:变化上送
2)通讯异常告警和预警
·数据采集程序失效告警信息,包括数据采集程序失效告警信号和同步记录的数据采集程序主界面截图
·通讯中断告警信息,包括通讯中断告警信号和同步记录的数据采集程序主界面截图
·通讯异常预警信号
3)硬件资源使用数据
·CPU使用占比,单位:%;上送方式:秒级上送
·内存使用占比,单位:%;上送方式:秒级上送
·硬盘使用占比,单位:%;上送方式:秒级上送
4)通讯监控程序心跳信号
·约定固定数据格式,定时上送
(2)二级子站监控程序数据任务
各二级子站通讯状态监控程序数据任务为接收所有一级子站上报的上述四类信息,并上报给集控总站如下信息:
1)所有下属一级子站的数据采集运行信息、通讯异常告警和预警、硬件资源使用数据;
2)所有下属一级子站的通讯监控程序异常告警;
3)二级子站本身的数据传输运行信息、通讯异常告警和预警、硬件资源使用数据和监控程序心跳信号;
二级子站会将上述所有信息同时上报给集控主站的主服务器和备用服务器。
(3)集控主站监控程序数据任务
集控主站主服务器和备用服务器通讯状态监控程序数据任务为:
1)接收所有二级子站上报的本身的数据传输运行信息、通讯异常告警和预警、硬件资源使用数据、通讯监控程序心跳信号;
2)接收各二级子站下属的所有一级子站的数据采集运行信息、通讯异常告警和预警、硬件资源使用数据和通讯监控程序异常告警;
3)监控和记录二级子站的通讯监控程序异常告警;
4)监控和记录主站自身的数据接收运行信息、通讯异常告警和预警、硬件资源使用数据;
5)主备服务器相互向对方发送自身的监控程序心跳信号;
6)主备服务器互相监控和记录对方的通讯监控程序异常告警;
环保能源企业集团实时数据通讯状态监控功能模块级工作流程包括厂级一级子站、二级子站功能模块层和集控主站功能模块层,其中集控主站功能模块层包括集控主站主机和备用机两块。详细的功能模块级流程图如图3所示。
一级子站监控模块
各现场数据采集节点部署一级子站监控模块实现对其本身数据采集运行信息的监测和上报、通讯异常告警和预警信息上报、硬件资源使用信息上报以及数据采集程序异常的自动恢复功能,此外一级子站监控模块生成的心跳信号将上送给二级子站监控模块进行状态判断。部分主要功能模块的实现过程详细描述如下:
数据采集运行信息监测模块实现数据采集运行信息监测和上报,包括:监测数据采集模块运行状态的运行状态监测模块:通讯监控程序实时监控本站数据采集程序后台所有服务的运行状态,如果监测到部分或全部服务停止运行或运行失效,并持续一定时长(如30s)未恢复,则判定数据采集程序运行异常,输出数据采集程序运行状态值为0;否则判定数据采集程序为正常运行,输出数据采集程序运行状态值为1。若通讯监控程序本身运行异常或者获取不到相应的服务状态数据,则输出为NA(状态未知)。输出数据采集程序运行状态值。
监测数据采集模块通讯状态的通讯状态监测模块:监测数据采集模块通讯状态的通讯状态监测模块实时监控本站数据采集通讯状态,当在一段时间内(如5min,可配置)未接收到任何数据源发送更新的数据时,则判定通讯中断,输出通讯状态值为0;否则为通讯正常,输出通讯状态值为1。若通讯监控程序本身运行异常或者获取不到相应的判定数据时,则输出为NA(状态未知)。
监测数据采集模块数据传输速率的数据传输速率监测模块:实时监控本站数据采集的数据流传输速率,直接调用相应数据采集接口获取该数据。
上述数据采集程序运行状态值、通讯状态值和数据流比特率值实时通过第一数据上报模块上报至二级子站,并经二级子站上报至集控中心主站通讯监控程序进行集中监控和分析。
1)第一通讯中断告警和通讯异常预警模块实现一级子站通讯中断告警和通讯异常预警信息上报,包括:
数据采集失效告警模块:一级子站数据采集传输程序异常自动恢复操作失败后会触发该告警信号上报至二级子站,并经二级子站上报至集控中心主站通讯监控程序,及时提醒集控中心运维管理人员进行处理。告警信号发出之后每隔一段时间(如1min,可配置)判断一次,若处理完成后数据采集程序恢复正常,发送告警解除信号,若未处理完成,则后面持续判断,超过告警信号最大时间阀值(如1h,可配置)时,则再次发出告警信号,直至恢复正常。
第一通讯中断告警模块:当一级子站监控通讯状态值变为0时,触发通讯中断告警信号上报至二级子站,并经二级子站上报至集控中心主站通讯监控程序,及时提醒集控中心运维管理人员进行处理。告警信号发出之后每隔一段时间(如1min,可配置)判断一次,若通讯恢复正常后告警信号解除,未恢复通讯正常,持续判断,直至超过告警信号最大时间阀值(如1h,可配置)时,则再次发出告警信号,直至恢复正常。
截图模块:当一级子站触发数据采集程序失效告警和通讯中断告警信号时,对于具备人机交互条件的现场通讯节点,其通讯监控程序将调用系统接口同步打开异常状态下数据采集程序主界面,并进行自动全屏截图,其包含了异常发生时间、通讯异常状态下各数据通道数据传输速率、数据传输状态、数据源状态和各数据通道状态等信息,截图将与触发生成的告警信号同步上送至二级子站,并经二级子站上报至集控中心主站通讯监控程序,辅助集控中心运维管理人员进行问题分析和处理。
第一通讯异常预警模块:当一级子站通讯正常时,其数据采集程序硬件资源使用占比超警戒线(如CPU使用占比>90%或内存使用占比>80%或硬盘使用占比>80%,可配置)且持续一段时间(如10min,可配置)后,监控程序发出通讯异常预警信号上报至二级子站,并经二级子站上报至集控中心主站通讯监控程序,提示集控中心运维管理人员关注防止通讯中断问题发生。预警信号发出之后每隔一段时间(如1min,可配置)判断一次,当硬件资源使用占比降低到警戒线内后通讯异常预警信号解除,否则后面持续判断,当超过预警信号最大时间阀值(如1h,可配置)时,则再次发出异常预警信号,直至硬件资源使用占比恢复正常。
2)第一硬件资源使用信息监控模块——实现对一级子站硬件资源使用信息上报;
CPU使用占比:调用系统接口获取该数据。
内存使用占比:调用系统接口获取该数据。
硬盘使用占比:调用系统接口获取该数据。
上述三类数据实时上报至二级子站,并经二级子站上报至集控中心主站通讯监控程序进行集中监控和分析。
3)数据采集异常自动恢复模块——实现一级子站数据采集程序异常自动恢复
当数据采集模块运行状态值为0时则表明数据采集状态为异常,此时数据采集模块异常自动恢复模块将自动调用系统接口重启运行异常的数据采集传输后台服务,延迟一段时间(如1min,可配置)后判定服务重启是否成功,若重启失败则等待一段时间(如30s,可配置)后再次重启,而后再次进行判定,若两次重启均失败,则对操作结果进行记录并上报,同时触发数据采集程序失效告警模块上送至二级子站,并经二级子站上报至集控中心主站进行记录和发出提醒。若有至少一次重启成功,则记录操作结果并上报,但不触发告警信号。
二级子站监控模块
各现场数据汇总节点部署二级子站监控模块一方面实现对一级子站上报数据的接收并转发集控中心主站,另一方面实现对其本身数据传输运行信息的监测和上报、通讯异常告警和预警信息上报、硬件资源使用信息上报以及数据传输程序异常的自动恢复功能,还可根据接收的下属一级子站心跳信号实现对一级子站通讯监控程序状态的监测,此外二级子站监控程序生成的心跳信号将上送给集控中心主站进行状态判断。部分主要功能模块的实现过程详细描述如下:
1)第二数据接收模块——实现对一级子站上报数据的接收,并将其实时转发至集控中心主站的第二数据接收模块(主机和备用机同步转发,所述主机也即主数据服务器,所述备用也即备用机数据服务)。
2)数据传输运行信息监测模块——实现数据传输运行信息监测和上报,详细功能实现同一级子站类似,但二级子站需要实现对汇入的多路一级子站数据采集传输服务进行综合判断得到通讯状态值。数据传输程序运行状态值、通讯状态值和数据流比特率值实时上报至集控中心主站通讯监控程序进行集中监控和分析。
3)第二通讯中断告警和通讯异常预警模块——实现二级子站通讯中断告警和通讯异常预警信息上报,详细功能实现同一级子站。
4)第二硬件资源使用信息监控模块——实现对二级子站硬件资源使用信息上报,详细功能实现同一级子站。
5)数据传输异常自动恢复模块——实现二级子站数据传输程序异常自动恢复,详细功能实现同一级子站。
6)第一下级节点通讯监控程序状态监测模块——实现一级子站运行的通讯监控程序运行状态进行记录和上报。
二级子站监控模块可对所属的所有一级子站监控模块运行状态进行监测,二级子站的第一下级节点通讯监控程序状态监测模块通过固定时间间隔Δt(如30s,可配置)接收一级子站通讯监控程序上送的预定义心跳信号数据包,如果连续3倍Δt时长未接收到该心跳信号数据包,则判定一级子站通讯监控程序运行异常,同时发出对应告警信号上报至集控中心主站。
其中,心跳信号检测的详细过程描述如下:
1)被检测节点(如一级子站)带着自己的标识符与检测节点(如二级子站)建立TCPsocket长连接;
2)完成socket连接后,检测节点缓存被检测节点的标识符信息;
3)被检测节点通过socket流定时每隔Δt发送自身当前信息(如IP地址、被检测节点标识符、发送心跳信息时间和其它被检测节点信息)消息到检测节点某个接口;检测节点收到被检测节点发送的信息后更新其状态(如IP地址,被检测节点标识符,接收心跳信息时间和其它被检测节点信息);
4)检测节点定时(如每隔0.5倍Δt)检查所有缓存的被检测节点的会话集合,将各个被检测节点的接收心跳信息时间与当前时间进行对比,如果超过指定的时间(如3倍Δt)还没有来更新则认为该被检测节点的通讯监控程序运行异常,同步发出对应告警信号,随后告警信号发送程序进入静默阶段,如果超过指定的时间(如50倍Δt)且仍然判定被检测节点的通讯监控程序运行异常成立,则继续发出告警信息,直至被检测节点的通讯监控程序异常恢复。
主站监控模块(第一、二主站监控模块)
集控中心部署主站监控程序实现接收各生产现场两级子站数据采集和传输运行信息、通讯异常告警和预警信息和硬件资源使用信息,并监控主站本身数据接收运行信息、通讯异常告警和预警和硬件资源使用信息,可实现主站数据接收程序异常的自动恢复功能。此外主站可实现对二级子站通讯监控程序运行异常进行判定和告警,主站主机和备用机还可实现对相互的通讯监控程序运行异常进行判定和告警。主站通讯监控程序上述各项主要功能的实现原理和各数据计算逻辑同子站通讯监控程序。
第一、二主站监控模块均包括数据存储调用模块(图3中主站主机数据存储、数据调用或者主站备用机数据存储、数据调用),以及均与数据存储和调用模块连接的第三硬件资源使用信息监控模块,第三通讯中断告警和通讯异常预警模块,数据服务器运行信息监测模块,数据服务器异常自动恢复模块和第二数据接收模块;所述第三硬件资源使用信息监控模块,第三通讯中断告警和通讯异常预警模块,数据服务器运行信息监测模块和数据服务器异常自动恢复模块构成图3中的主站主机(备用机)状态监控和告警模块集合。
所述数据服务器运行信息监测模块包括监测数据服务器运行状态的运行状态监测模块,监测数据服务器通讯状态的通讯状态监测模块,监测数据服务器数据传输速率的数据传输速率监测模块;所述第三通讯中断告警和通讯异常预警模块包括数据服务器运行失效告警模块,第三通讯中断告警模块,第三通讯异常预警模块。
所述数据服务器运行信息监测模块与数据服务异常自动恢复模块和第三通讯中断告警模块连接;所述数据服务异常自动恢复模块和数据服务器运行失效告警模块连接;所述第三硬件资源使用信息监控模块与第三通讯异常预警模块连接,所述第二数据接收模块与二级子站监控模块连接。
所述第一主站监控模块还包括第三心跳信号生成模块和备用数据服务器通讯监控程序状态监测模块(备用机通讯监控程序状态监测模块);所述第二主站监控模块还包括第四心跳信号生成模块和主数据服务器通讯监控程序状态监测模块(主机通讯监控程序状态监测模块);所述第三心跳信号生成模块与主数据服务器通讯监控程序状态监测模块连接,所述主数据服务器通讯监控程序状态监测模块与第二主站监控模块的数据存储和调用模块连接;所述第四心跳信号生成模块与备用数据服务器通讯监控程序状态监测模块连接,所述备用数据服务器通讯监控程序状态监测模块与第一主站监控模块中的数据存储和调用模块连接。
本实用新型采用的软件程序均为现有的技术,本实用新型并未对软件程序作出改进,本实用新型的改进仅结构或各模块之间的连接关系。
本具体实施例仅仅是对本实用新型的解释,其并不是对本实用新型的限制,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本实用新型的权利要求范围内都受到专利法的保护。

Claims (8)

1.环保能源企业大规模实时数据通讯状态监控系统,其特征在于,环保能源企业实时数据流转过程中包括厂站层模块和集控层模块,所述集控层模块中设有数据服务器,所述数据服务器包括主数据服务器和备用数据服务器,所述实时数据通讯状态监控系统包括一级子站监控模块,二级子站监控模块,第一主站监控模块和第二主站监控模块;所述一级子站监控模块设置在厂站层模块中的数据采集模块中,所述二级子站监控模块设置在厂站层模块中的数据汇总模块中,所述第一主站监控模块设置在集控层模块中的主数据服务器中,所述第二主站监控模块设置在集控层模块中的备用数据服务器中;属于同一个电厂的一级子站监控模块与二级子站监控模块连接;所述二级子站监控模块与所有的第一主站监控模块以及第二主站监控模块连接,所述第一主站监控模块与第二主站监控模块连接。
2.根据权利要求1所述的环保能源企业大规模实时数据通讯状态监控系统,其特征在于,所述一级子站监控模块包括第一数据上报模块,以及均与第一数据上报模块连接的数据采集运行信息监测模块,第一通讯中断告警和通讯异常预警模块,第一硬件资源使用信息监控模块和数据采集异常自动恢复模块;
所述数据采集运行信息监测模块包括监测数据采集模块运行状态的运行状态监测模块,监测数据采集模块通讯状态的通讯状态监测模块,监测数据采集模块数据传输速率的数据传输速率监测模块;所述第一通讯中断告警和通讯异常预警模块包括:数据采集失效告警模块,第一通讯中断告警模块和第一通讯异常预警模块;
所述数据采集运行信息监测模块与数据采集异常自动恢复模块以及第一通讯中断告警模块连接,所述数据采集异常自动恢复模块与数据采集失效告警模块连接;所述第一硬件资源使用信息监控模块与第一通讯异常预警模块连接;所述第一数据上报模块与二级子站监控模块连接。
3.根据权利要求2所述的环保能源企业大规模实时数据通讯状态监控系统,其特征在于,所述第一通讯中断告警和通讯异常预警模块还包括截图模块,所述截图模块与数据采集失效告警模块,第一通讯中断告警模块以及第一数据上报模块连接。
4.根据权利要求1所述的环保能源企业大规模实时数据通讯状态监控系统,其特征在于,所述二级子站监控模块包括第一数据接收模块,第二数据上报模块,以及均与第二数据上报模块连接的数据传输运行信息监测模块,第二通讯中断告警和通讯异常预警模块,第二硬件资源使用信息监控模块和数据传输异常自动恢复模块;
所述数据传输运行信息监测模块包括监测数据汇总模块运行状态的运行状态监测模块,监测数据汇总模块通讯状态的通讯状态监测模块,监测数据汇总模块数据传输速率的数据传输速率监测模块;所述第二通讯中断告警和通讯异常预警模块包括:数据传输失效告警模块,第二通讯中断告警模块和第二通讯异常预警模块;
所述数据传输运行信息监测模块与数据传输异常自动恢复模块以及第二通讯中断告警模块连接,所述数据传输异常自动恢复模块与数据传输失效告警模块连接;所述第二通讯异常预警模块与第二硬件资源使用信息监控模块连接;所述第二数据上报模块与第一、二主站监控模块连接,第一数据接收模块与一级子站监控模块连接。
5.根据权利要求4所述的环保能源企业大规模实时数据通讯状态监控系统,其特征在于,所述二级子站监控模块还包括第一下级节点通讯监控程序状态监测模块,所述一级子站监控模块还包括第一心跳生成模块,所述第一心跳生成模块与第一下级节点通讯监控程序状态监测模块连接,所述第一下级节点通讯监控程序状态监测模块与第二数据上报模块连接。
6.根据权利要求1所述的环保能源企业大规模实时数据通讯状态监控系统,其特征在于,第一、二主站监控模块均包括数据存储和调用模块,以及均与数据存储和调用模块连接的第三硬件资源使用信息监控模块,第三通讯中断告警和通讯异常预警模块,数据服务器运行信息监测模块,数据服务器异常自动恢复模块和第二数据接收模块;
所述数据服务器运行信息监测模块包括监测数据服务器运行状态的运行状态监测模块,监测数据服务器通讯状态的通讯状态监测模块,监测数据服务器数据传输速率的数据传输速率监测模块;所述第三通讯中断告警和通讯异常预警模块包括数据服务器运行失效告警模块,第三通讯中断告警模块和第三通讯异常预警模块;
所述数据服务器运行信息监测模块与数据服务异常自动恢复模块和第三通讯中断告警模块连接;所述数据服务异常自动恢复模块和数据服务器运行失效告警模块连接;所述第三硬件资源使用信息监控模块与第三通讯异常预警模块连接,所述第二数据接收模块与二级子站监控模块连接。
7.根据权利要求6所述的环保能源企业大规模实时数据通讯状态监控系统,其特征在于,所述二级子站监控模块还包括第二心跳信号生成模块,所述第一、二主站监控模块还均包括第二下级节点通讯监控程序状态监测模块;所述第二心跳信号生成模块与第二下级节点通讯监控程序状态监测模块连接;所述第二下级节点通讯监控程序状态监测模块与相应的数据存储和调用模块连接。
8.根据权利要求6所述的环保能源企业大规模实时数据通讯状态监控系统,其特征在于,所述第一主站监控模块还包括第三心跳信号生成模块和备用数据服务器通讯监控程序状态监测模块;所述第二主站监控模块还包括第四心跳信号生成模块和主数据服务器通讯监控程序状态监测模块;所述第三心跳信号生成模块与主数据服务器通讯监控程序状态监测模块连接,所述主数据服务器通讯监控程序状态监测模块与第二主站监控模块的数据存储和调用模块连接;所述第四心跳信号生成模块与备用数据服务器通讯监控程序状态监测模块连接,所述备用数据服务器通讯监控程序状态监测模块与第一主站监控模块中的数据存储和调用模块连接。
CN202122303593.7U 2021-09-23 2021-09-23 环保能源企业大规模实时数据通讯状态监控系统 Active CN215954134U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202122303593.7U CN215954134U (zh) 2021-09-23 2021-09-23 环保能源企业大规模实时数据通讯状态监控系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202122303593.7U CN215954134U (zh) 2021-09-23 2021-09-23 环保能源企业大规模实时数据通讯状态监控系统

Publications (1)

Publication Number Publication Date
CN215954134U true CN215954134U (zh) 2022-03-04

Family

ID=80427322

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202122303593.7U Active CN215954134U (zh) 2021-09-23 2021-09-23 环保能源企业大规模实时数据通讯状态监控系统

Country Status (1)

Country Link
CN (1) CN215954134U (zh)

Similar Documents

Publication Publication Date Title
CN102447570B (zh) 一种基于健康度分析的监控装置及方法
CN110493042A (zh) 故障诊断方法、装置及服务器
CN107920111A (zh) 一种基于地面气象观测的一体化智能数据采集方法和平台
CN210166487U (zh) 基于边缘计算的供电台区停电故障告警装置
CN102255764A (zh) 传输网故障诊断方法及装置
CN104574219A (zh) 电网业务信息系统运行工况的监测预警方法及系统
CN112468592B (zh) 一种基于电力信息采集的终端在线状态侦测方法及系统
CN107947998A (zh) 一种基于应用系统的实时监测系统
CN112564964A (zh) 一种基于软件定义网络的故障链路检测与恢复方法
CN113014418B (zh) 一种基于网络历史拓扑流量的故障诊断方法
CN108227657A (zh) 一种动力环境监控系统
CN109905275A (zh) 一种基于sdn分层架构的控制平面故障检测与处理方法
CN109005076A (zh) 一种智能变电站交换机监控系统及交换机监控方法
CN102387210B (zh) 一种基于快速同步网络的分布式文件系统监控方法
CN104065503A (zh) 一种智能交通物联网设施故障溯源判别分析方法
CN101854263B (zh) 网络拓扑的分析处理方法、系统和管理服务器
EP1622310B1 (en) Administration method and system for network management systems
CN215954134U (zh) 环保能源企业大规模实时数据通讯状态监控系统
CN103414920A (zh) 通过信令流量判断业务状态的系统和方法
CN108449212B (zh) 基于事件关联的mas消息传递方法
CN109951313A (zh) 一种Hadoop云平台的监控装置及方法
CN102857373A (zh) 针对以局域网为单元、分布式网络设备为信息节点的主动管理系统
CN114124662A (zh) 一种基于跨网环境下的资源智能化运维系统
CN208890819U (zh) 一种智能变电站交换机监控系统
KR100650584B1 (ko) 이엠에스의 성능관리모듈에서 통계데이터 오류 통보방법

Legal Events

Date Code Title Description
GR01 Patent grant
GR01 Patent grant