CN115858288A - 一种基于Consul和JRPC的电力管理系统智能诊断方法及系统 - Google Patents
一种基于Consul和JRPC的电力管理系统智能诊断方法及系统 Download PDFInfo
- Publication number
- CN115858288A CN115858288A CN202211555698.4A CN202211555698A CN115858288A CN 115858288 A CN115858288 A CN 115858288A CN 202211555698 A CN202211555698 A CN 202211555698A CN 115858288 A CN115858288 A CN 115858288A
- Authority
- CN
- China
- Prior art keywords
- consul
- power management
- management system
- service
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241000412611 Consul Species 0.000 title claims abstract description 147
- 238000003745 diagnosis Methods 0.000 title claims abstract description 144
- 238000000034 method Methods 0.000 title claims abstract description 65
- 230000000007 visual effect Effects 0.000 claims abstract description 30
- 230000002159 abnormal effect Effects 0.000 claims abstract description 24
- 238000001514 detection method Methods 0.000 claims description 113
- 230000006870 function Effects 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 24
- 238000004458 analytical method Methods 0.000 claims description 22
- 238000003860 storage Methods 0.000 claims description 17
- 230000036541 health Effects 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 238000009826 distribution Methods 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 6
- 230000003247 decreasing effect Effects 0.000 description 6
- 238000012423 maintenance Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 230000008447 perception Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003862 health status Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000007488 abnormal function Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
一种基于Consul和JRPC的电力管理系统智能诊断方法及系统,包括:在Consul服务器上部署Consul服务器集群,通过Consul服务器提供Consul数据中心和服务中心;在电力管理系统的所有服务器设备上部署节点服务和JRPC模块,并部署系统智能诊断模块;将电力管理系统的相关信息录入Consul数据中心,节点服务注册到Consul服务中心;系统智能诊断模块根据诊断项目通过JRPC模块调用节点服务注册到Consul服务中心的服务接口,获取电力管理系统各节点的实时运行数据;系统智能诊断模块对电力管理系统各节点进行诊断并得到诊断结果;将电力管理系统各节点的诊断结果通过可视化方式展示。本发明能够对电力管理系统基础运行环境和基础服务运行状态进行智能诊断和可视化评价,提前发现异常问题并预警。
Description
技术领域
本发明涉及电力管理系统运行监控的技术领域,更具体地,涉及一种基于Consul和JRPC的电力管理系统智能诊断方法及系统。
背景技术
随着科技的发展进步,电网规模也迅速壮大,对智能化电网集控管理和调度功能提出越来越高的要求,目前使用的电力管理系统,无论是数字换流站、集控站系统或调度系统,其中各模块的正常运行都依赖于大量后台基础服务的正常运行,后台基础服务数量多,功能复杂且可见性低,后台服务功能异常时问题排查难度大,特别是对于功能复杂的电力管理系统。电力管理系统的正常运行及运维管理离不开健康的基础环境和运行正常的基础服务,其对整个管理系统健康、稳定运行至关重要,目前电力管理系统出现问题后,只能通过问题表现逐步排查,最终定位出现问题的服务或运行环境问题。缺少对基础运行环境和基础底层服务的健康状态的提前诊断和评价,缺乏异常预警功能,并且出现异常问题后需要专业的技术人员进行问题排查和定位,工作量大,难度高。
Consul是一个分布式高可用的基础设施,能够提供服务发现和服务配置的功能,JRPC能够通过consul进行服务的注册和发现,满足不同节点不同服务之间的数据通信和功能调用。
随着电力管理系统功能的增加,相应依赖的服务也逐渐增多,对系统的运行稳定性要求越来越高,然而现有技术中,电力管理系统缺乏对基础运行环境和基础服务健康状态进行可视化评价和异常问题提前预警的技术。
现有技术(CN112328320A)公开了一种基于consul的电网调度系统配置管理装置,包括:consul数据中心、nodesrv模块、配置文件自动生成模块和系统配置模块;nodesrv模块和配置文件自动生成模块设置于电网调度系统服务器上;系统配置模块对电网调度系统中的节点和服务进行配置,并将配置信息保存至consul数据中心;配置文件自动生成模块对consul数据中心中的value进行检测,在value变化时重新生成相应的配置文件并分发。现有技术CN112328320A解决了目前调度系统初次部署配置复杂且工作量大,对技术人员技术水平要求高的问题,同时解决了系统运维过程中对底层服务的运行状态的直观、实时监视困难,故障预测功能缺失的问题。但现有技术还存在以下技术问题:现有技术专利主要针对系统的部署配置、文件管理功能和实时监视功能,其故障预测仅针对系统中各服务的cpu、内存实时越限告警,缺乏对基础环境以及其他可能发生的故障的全面感知,对于其他可能存在的故障无法实现准确感知和预测。
发明内容
为解决现有技术中存在的不足,本发明提供一种基于Consul和JRPC的电力管理系统智能诊断方法及系统,解决目前电力管理系统缺乏对基础运行环境和基础服务健康状态进行可视化评价和异常情况提前预警的问题提高电力管理系统的可靠性。
本发明采用如下的技术方案。
一种基于Consul和JRPC的电力管理系统智能诊断方法,包括以下步骤:
步骤1,在Consul服务器上部署Consul服务器集群,通过Consul服务器提供Consul数据中心和服务中心;
步骤2,在电力管理系统的所有服务器设备上部署节点服务和JRPC模块,并在电力管理系统工作站上部署系统智能诊断模块;
步骤3,通过系统配置模块将电力管理系统的相关信息录入Consul数据中心后,电力管理系统的节点服务通过JRPC模块将服务注册到Consul服务中心;
步骤4,系统智能诊断模块根据诊断项目通过JRPC模块调用节点服务注册到Consul服务中心的服务接口,从而获取电力管理系统各节点的实时运行数据;
步骤5,系统智能诊断模块根据各节点的实时运行数据和Consul数据中心中预设的节点阈值信息,对电力管理系统各节点进行诊断并得到诊断结果;
步骤6,将电力管理系统各节点的诊断结果通过可视化方式展示。
优选地,所述步骤1中,Consul服务器为部署Consul服务的服务器,Consul服务启动后对外提供Consul数据中心和服务中心。
优选地,所述步骤1中,Consul数据中心部署3个或5个Consul服务器构成的Consul集群,Consul集群中的Consul服务器上部署按服务端模式启动的Consul服务。
优选地,所述步骤2中,
节点服务为设置在电力管理系统各节点上的服务模块,节点服务提供数据采集功能和远端系统命令执行功能;
JRPC模块为封装的服务注册发现与调用框架,JRPC模块还包括服务注册发现接口和服务调用接口。
优选地,所述步骤3中,
通过系统配置模块将电力管理系统的相关信息录入Consul数据中心,录入Consul数据中心的电力管理系统相关信息包括电力管理系统的节点配置信息、服务分布和诊断逻辑信息。
优选地,诊断逻辑信息包括CPU检测信息、磁盘检测信息、内存检测信息、节点数据采集检测信息、IO检测信息、网卡状态检测信息、对时检测信息、应用状态检测信息、数据库状态检测信息、进程配置检测信息和数据库表记录数检测信息。
优选地,所述步骤4中,
系统智能诊断模块通过JRPC模块的服务调用接口下发诊断项目的执行命令到电力管理系统的各个节点服务器,系统智能诊断模块通过JRPC模块调用电力管理系统节点服务注册到Consul服务中心的服务接口,获取电力管理系统节点服务的实时运行数据信息。
优选地,所述诊断项目包括:节点数据采集检测、磁盘检测、CPU检测、内存检测、IO检测、网卡状态检测、对时检测、进程配置检测、应用状态检测、数据库表记录检测和数据库状态检测。
优选地,所述步骤4中,系统智能诊断模块获取的实时运行数据包括电力管理系统基础环境信息和基础服务运行信息,基础环境信息还包括:磁盘检测信息、CPU检测信息、内存检测信息、IO检测信息、网卡检测信息、对时检测信息;基础服务运行信息还包括:节点数据采集检测信息、进程配置检测信息、应用状态检测信息、数据库状态检测信息。
优选地,所述步骤5中,系统智能诊断模块根据步骤4采集的实时运行数据信息和步骤3设置的诊断逻辑信息进行智能分析和研判,进行系统智能诊断,判断电力管理系统健康状态,并生成诊断结果报告,对异常指标或潜在问题进行分析和报警。
本发明还提供了一种基于Consul和JRPC的电力管理系统智能诊断装置,包括:Consul服务器、JRPC模块、系统配置模块和系统智能诊断模块;
其中,Consul服务器提供Consul数据中心和Consul服务中心,Consul数据中心存储电力管理系统所有的节点信息,Consul服务中心获取电力管理系统的各节点实时运行数据;
JRPC模块还包括服务注册发现接口和服务调用接口,用于连接电力管理系统节点服务和Consul服务中心,以及电力管理系统节点服务和Consul数据中心;
系统配置模块用于将电力管理系统的相关信息录入Consul数据中心,技术人员可以通过系统配置模块设置或修改电力管理系统的相关诊断逻辑;
系统智能诊断模块部署于电力管理系统工作站上,还包括可视化界面、命令解析执行单元、数据采集与智能分析单元,能够通过JRPC模块调用所有节点的节点服务模块数据,从而获取电力管理系统基础环境信息和基础服务运行信息,结合获取的信息对各节点进行诊断,得到诊断结果并进行展示。
本发明还提供了一种终端,包括处理器及存储介质;
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行所述基于Consul和JRPC的电力管理系统智能诊断方法的步骤。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述基于Consul和JRPC的电力管理系统智能诊断方法的步骤。
本发明的有益效果在于,与现有技术相比,本发明能够对电力管理系统基础运行环境和基础服务运行状态进行智能诊断和可视化评价,从而实时掌握和预测系统运行状态,通过系统智能诊断,并对电力管理系统的基础环境或服务出现异常问题时能够提前发现并预警,对系统可能存在的故障感知更全面,降低系统功能异常的概率,降低系统运维管理的专业技术要求,减少异常问题对系统正常运行的影响,提高了电力管理系统的可靠性。本发明至少包括以下有益效果:
1、本发明通过手动执行或定时执行,能够对基础环境和基础服务实现全面、详细的检测和智能分析,对系统可能存在的故障感知更全面,生成更可靠的诊断结果,对可能存在的问题进行预警,降低系统异常的概率
2、本发明中将服务注册到Consul服务中心后,不同节点之间可以通过JRPC模块实现命令传递和数据传输,实现了不同节点间接口直接调用,提高了通信效率,得益于Consul服务注册发现的可靠性和稳定性,本发明使用的服务注册和发现机制更可靠,稳定性和效率更高;
3、本发明智能分析模块的诊断逻辑可以根据实际需要进行针对性的优化修改,适应性更强。
附图说明
图1是本发明中电力管理系统智能诊断方法的整体流程示意图;
图2是本发明中对节点进行智能分析的流程示意图;
图3是本发明中智能诊断系统的智能诊断模块结构示意图;
图4是本发明中电力管理系统智能诊断系统的整体架构示意图;
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明的技术方案进行清楚、完整地描述。本申请所描述的实施例仅仅是本发明一部分的实施例,而不是全部实施例。基于本发明精神,本领域普通技术人员在没有作出创造性劳动前提下所获得的有所其它实施例,都属于本发明的保护范围。
如图1所述,本发明提出了一种基于Consul和JRPC的系统智能诊断方法,其中,Consul是一个分布式高可用的开源项目,可以为基础设施提供服务注册和Key/Value存储服务机制;
JRPC是一种远程过程调用方法,用于系统调用远端服务器的函数接口,配合Consul服务注册可以方便快捷的实现实时数据通信。
该方法具体包括以下步骤:
步骤1,在Consul服务器上部署Consul集群,通过Consul集群提供Consul数据中心和服务中心;
其中,Consul服务器为部署Consul服务的服务器,Consul服务启动后可以对外提供Consul数据中心和服务中心;本发明中Consul服务器与电力管理系统中的应用服务器共用服务器硬件设备,不额外设置Consul服务器。
具体的,为了提高系统的可靠性,Consul数据中心通常部署3个或5个Consul服务器构成的Consul集群。其中,Consul服务包括服务端运行模式和客户端运行模式,Consul集群中的Consul服务器上部署按服务端模式启动的Consul服务。
本实施例中Consul数据中心部署的Consul集群为3个Consul服务器组成的集群。
步骤2,在电力管理系统的所有服务器设备上部署节点服务和JRPC模块,并在电力管理系统工作站上部署系统智能诊断模块;
其中,节点服务为设置在电力管理系统各节点上的服务模块,本发明中节点服务包括提供数据采集功能和远端系统命令执行功能,节点服务的功能包括管理监视电力管理系统服务器节点上运行的所有服务、采集该节点上所有服务以及节点本身相关的数据信息、在远端服务器上执行系统命令。
节点服务还包括磁盘信息采集、CPU信息采集、内存信息采集、IO信息采集、网卡信息采集、应用配置信息和应用状态信息。
JRPC模块为封装的服务注册发现与调用框架,JRPC模块还包括服务注册发现接口和服务调用接口,外部结构如电力管理系统、Consul服务中心均可以通过JRPC模块提供的接口与JRPC模块进行交互。
其中,电力管理系统节点的应用可以通过JRPC模块的服务注册发现接口将相应的服务及接口注册到Consul服务中心,电力管理系统中任意节点上的应用需要调用某个服务的某个接口时,可以通过JRCP模块的服务调用接口以及相应
参数实现服务接口的远程调用。
步骤3,通过系统配置模块将电力管理系统的相关信息录入Consul数据中心后,电力管理系统的节点服务通过JRPC模块将服务注册到Consul服务中心;
其中,通过系统配置模块将电力管理系统的相关信息录入Consul数据中心,系统配置模块为将电力管理系统的配置信息存入Consul数据中心的工具模块,电力管理系统可将其相关节点信息存入Consul数据中心进行统一的配置管理,并通过JRPC模块将其服务注册到Consul服务中心,实现服务的实时跨机调用。
录入Consul数据中心的电力管理系统相关信息包括:电力管理系统的节点配置信息、服务分布和诊断逻辑信息;
具体的,电力管理系统的配置信息包括电力管理系统中服务器的机器名、IP,该电力管理系统系统所依赖的服务等电力管理系统正常运行所需要的配置内容;
电力管理系统的服务分布包括运行各服务的服务器信息,包括各服务分别运行在哪一服务器上;
电力管理系统的诊断逻辑信息可以采用系统默认的诊断逻辑,也可以由技术人员手动设置或在默认的诊断逻辑信息基础上进行修改。
技术人员通过系统配置模块设置电力管理系统智能诊断中的相关诊断逻辑并将其存入Consul数据中心,如图3所示,诊断逻辑信息包括静态展示信息和动态数据,其中静态展示信息主要包括型号、规格、生产厂家等仅用于展示的信息;动态数据主要包括使用率、总通电时长、温度等动态变化的数据,本发明中涉及的诊断逻辑信息至少包括CPU检测信息、磁盘检测信息、内存检测信息、节点数据采集检测信息、1O检测信息、网卡状态检测信息、对时检测信息、应用状态检测信息、数据库状态检测信息、进程配置检测信息和数据库表记录数检测信息;
其中,CPU检测信息包括物理CPU数目、逻辑CPU数目、用户空间占用CPU百分比、内核空间占用CPU百分比、等待输入输出占用CPU百分比、总CPU占用百分比、CPU上下文切换次数、CPU中断次数、近1分钟、5分钟、15分钟CPU负载率平均值。默认的诊断标准是总CPU占用百分比和CPU中断次数中有一项越限认为CPU亚健康,发预警信息,两项都越限认为CPU异常,发异常信息。除此之外,还可以根据现场情况增加诊断标准或减少诊断标准,具体含义如下所示:
例如在默认诊断标准的基础上增加诊断标准,通过配置工具增加15分钟CPU负载率标准并选择增加的标准与现有标准是与的关系还是或的关系;如果是选择和原有标准与的关系,则总CPU占用百分比、CPU中断次数和15分钟CPU负载率中有一项或两项越限认为CPU亚健康,发预警信息,三项都越限认为CPU异常,发异常信息;如果是选择和原有标准或的关系,则15分钟CPU负载率越限认为CPU异常,或者总CPU占用百分比、CPU中断次数同时越限也认为CPU异常,以上及为增加诊断标准,同理可以配置减少诊断标准。
磁盘检测信息包括磁盘型号、生产厂家、序列号、转速、物理规格、总容量、总通电时长、当前温度、磁盘健康状态、磁盘使用率。默认的诊断标准是磁盘使用率、当前温度和磁盘健康状态,磁盘温度越限,其它两项正常,认为磁盘亚健康,发磁盘预警信息;磁盘使用率和健康状态中任一异常认为磁盘异常。增加标准和减少标准同上述方法通过配置工具进行增加或减少。
内存检测信息包括内存使用率、内存总量、最大支持内存、总内存槽总数、当前内存条数目。增加标准和减少标准同上述方法通过配置工具进行增加或减少。
节点数据采集检测信息为采集状态正常或异常,诊断标准是节点数据采集链路连通为正常,否则为异常。
IO检测信息包括CPU等待IO的时间占比、进程每秒下发IO读写请求数量、驱动器读出数据速率(单位为KB/s)、驱动器写入数据速率(单位为KB/s)。默认诊断标准是CPU等待IO的时间占比,越限则认为该节点IO异常。增加标准和减少标准同上述方法通过配置工具进行增加或减少。
网卡状态检测信息包括网络负载率、发送速率、接收速率、发送数据包速率、接收数据包速率、网卡连接状态。默认的诊断标准是网络负载率,越限认为该网卡亚健康。增加标准和减少标准同上述方法通过配置工具进行增加或减少。
对时检测信息为对时状态正常或异常,对时异常时该项异常。
应用状态检测信息包括进程状态、进程CPU使用率、是否频繁启动。默认诊断标准是进程CPU使用率越限认为该进程亚健康,如果出现频繁启动则认为该进程异常。增加标准和减少标准同上述方法通过配置工具进行增加或减少。
数据库状态检测信息包括数据库连接状态、最大运行连接数、当前连接数、数据库名称。默认的诊断标准是数据库连接状态为未连接认为是该数据库异常,当前连接数与最大允许连接数的比例达到指定阈值认为该数据库状态为亚健康。
进程配置检测信息包括节点名、进程名、进程配置状态。该项的检测信息都属于展示类信息,仅用于展示某个进程的分布情况,没有异常情况,所以该项无诊断标准。
数据库表记录数检测信息包括数据库名称、数据库表空间大小、数据库表个数。该项同进程配置检测类似,也属于展示类信息,不存在异常,没有诊断标准。
步骤4,系统智能诊断模块根据诊断项目自动通过JRPC模块调用节点服务注册到Consul服务中心的服务接口,从而获取各节点的实时运行数据;
其中,系统智能诊断模块还包括命令解析执行单元,命令解析执行单元能够根据用户的选择,形成相应的查询命令,通过服务调用的方式进行运行数据查询命令的执行;
系统智能诊断模块的命令解析执行模块通过JRPC模块的服务调用接口下发诊断项目的执行命令到电力管理系统的各个节点服务器,系统智能诊断模块通过JRPC模块调用电力管理系统节点服务注册到Consul服务中心的服务接口,获取节点服务的实时运行数据信息,包括电力管理系统的基础环境信息和基础服务运行信息。
优选的,用户通过可视化界面选择需要执行的诊断项目,并获取诊断项目所对应的实时运行数据。
具体的,系统智能诊断针对不同诊断项目,其诊断逻辑不同;考虑不同系统的兼容性,结合步骤3的诊断逻辑信息,系统智能诊断的诊断项目至少包括:节点数据采集检测、磁盘检测、CPU检测、内存检测、IO检测、网卡状态检测、对时检测、进程配置检测、应用状态检测、数据库表记录检测和数据库状态检测。
针对不同类别的系统智能诊断,系统智能诊断模块获取的实时运行数据包括电力管理系统基础环境信息和基础服务运行信息,其中,基础环境信息包括磁盘检测信息、CPU检测信息、内存检测信息、IO检测信息、网卡检测信息、对时检测信息;基础服务运行信息包括节点数据采集检测信息、进程配置检测信息、应用状态检测信息、数据库状态检测信息。
步骤5,系统智能诊断模块根据各节点的实时运行数据和Consul数据中心中预设的诊断逻辑信息,对各节点进行诊断并得到诊断结果;
系统智能诊断模块还包括数据采集与智能分析单元,当进行某项检测时,系统智能诊断模块在Consul数据中心调用各节点服务注册到Consul的相应的接口,获取相应的数据。
数据采集完成后,用户通过可视化界面进行操作选择诊断项目,由系统智能诊断模块向可视化界面提供各诊断项目的接口,可视化界面通过调用系统智能诊断模块相应诊断接口,数据采集与智能分析单元根据步骤4采集的实时运行数据信息和步骤3设置的诊断逻辑信息进行智能分析和研判,进行系统智能诊断,判断电力管理系统健康状态,并生成诊断结果报告,对异常指标或潜在问题进行分析和报警。
具体的,用户可以通过可视化界面进行操作,单个选择要进行的诊断项目例如CPU检测或磁盘检测等;也可以选择整体系统智能诊断,对所有的诊断项目依次进行诊断,并生成系统诊断报告。
如图2所示,例如对于磁盘检测,智能诊断模块根据磁盘健康状态、磁盘温度、通电时长、磁盘容量占用情况、磁盘生产日期等信息,综合研判该节点健康状态,形成诊断结果。
进一步,当用户通过可视化界面选择CPU检测时,点击选择后可视化界面会调用系统智能诊断模块中CPU检测功能接口,对于系统智能诊断中CPU检测接口内部而言,通过调用节点注册到Consul服务中心的实时CPU信息获取接口获取该节点实时CPU信息,同时获取Consul数据中心中CPU检测相关的阈值及策略信息,对所有节点实时CPU信息根据诊断策略进行诊断并形成诊断结果并返回给可视化界面进行展示。
步骤6,将电力管理系统各节点的诊断结果通过可视化方式展示,运维人员根据诊断结果了解目前系统运行状况和健康状态。
具体的,系统智能诊断模块还包括可视化界面,本发明通过可视化界面进行诊断结果的可视化展示,运维人员可以随时通过可视化界面进行指定检测项的检测诊断工作,也可以定时执行全部检测项目。
如图4所示,本发明还提供了一种基于Consul和JRPC的系统智能诊断系统,该系统能够用于实现上述诊断方法,具体的,该系统包括Consul服务器、JRPC模块、系统配置模块和系统智能诊断模块;
其中,Consul服务器能够提供Consul数据中心和Consul服务中心,Consul数据中心能够存储电力管理系统所有的节点信息,Consul服务中心能够获取电力管理系统的各节点实时运行数据;
JRPC模块还包括服务注册发现接口和服务调用接口,用于连接电力管理系统节点服务和Consul服务中心,以及电力管理系统节点服务和Consul数据中心;
其中,外部结构可以通过JRPC模块提供的接口与JRPC模块进行交互;电力管理系统节点的应用可以通过JRPC模块的服务注册发现接口将相应的服务及接口注册到Consul服务中心,电力管理系统中任意节点上的应用需要调用某个服务的某个接口时,可以通过JRCP模块的服务调用接口以及相应参数实现服务接口的远程调用。
系统配置模块用于将电力管理系统的相关信息录入Consul数据中心,技术人员可以通过系统配置模块设置或修改电力管理系统的相关诊断逻辑;
系统智能诊断模块部署于电力管理系统工作站上,能够通过JRPC模块调用所有节点的节点服务模块数据,从而获取电力管理系统基础环境信息和基础服务运行信息,结合获取的信息对各节点进行诊断,得到诊断结果并进行展示。
其中,系统智能诊断模块还包括可视化界面、命令解析执行单元、数据采集与智能分析单元;
运维人员可以随时通过可视化界面进行指定检测项的检测诊断工作,也可以定时执行全部检测项目,可视化界面还用于向用户展示对电力管理系统的诊断结果,以及对电力管理系统的异常指标或潜在问题进行提示,可视化界面可以采用液晶显示屏幕;
命令解析执行单元能够根据用户的选择,形成相应的查询命令,通过服务调用的方式进行运行数据查询命令的执行;
数据采集与智能分析单元在通过服务调用获取到实时数据后,结合预设的诊断逻辑进行结果分析,生成相应的诊断结果,若数据采集与智能分析模块分析认为电力管理系统中存在故障或隐患,则通过可视化界面在诊断结果中进行提示。
名词释义:
Consul:微服务下的服务治理发现框架;
JPRC:Java Remote Procedure Call,轻量级Java远程过程调用框架。
本发明的有益效果在于,与现有技术相比,本发明使用的服务注册和发现机制更可靠,稳定性和效率更高,且本发明智能分析模块的诊断逻辑可以根据实际需要进行针对性的优化修改,适应性更强。
本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是——但不限于—-电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其它自由传播的电磁波、通过波导或其它传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言-诸如Smalltalk、C++等,以及常规的过程式编程语言一诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络-包括局域网(LAN)或广域网(WAN)-连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其它设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (13)
1.一种基于Consu1和JRPC的电力管理系统智能诊断方法,其特征在于,包括以下步骤:
步骤1,在Consul服务器上部署Consul服务器集群,通过Consul服务器提供Consul数据中心和服务中心;
步骤2,在电力管理系统的所有服务器设备上部署节点服务和JRPC模块,并在电力管理系统工作站上部署系统智能诊断模块;
步骤3,通过系统配置模块将电力管理系统的相关信息录入Consul数据中心后,电力管理系统的节点服务通过JRPC模块将服务注册到Consul服务中心;
步骤4,系统智能诊断模块根据诊断项目通过JRPC模块调用节点服务注册到Consul服务中心的服务接口,从而获取电力管理系统各节点的实时运行数据;
步骤5,系统智能诊断模块根据各节点的实时运行数据和Consul数据中心中预设的节点阈值信息,对电力管理系统各节点进行诊断并得到诊断结果;
步骤6,将电力管理系统各节点的诊断结果通过可视化方式展示。
2.根据权利要求1所述的基于Consul和JRPC的电力管理系统智能诊断方法,其特征在于,
所述步骤1中,Consul服务器为部署Consul服务的服务器,Consul服务启动后对外提供Consul数据中心和服务中心。
3.根据权利要求1所述的基于Consul和JRPC的电力管理系统智能诊断方法,其特征在于,
所述步骤1中,Consul数据中心部署3个或5个Consul服务器构成的Consul集群,Consul集群中的Consul服务器上部署按服务端模式启动的Consul服务。
4.根据权利要求1所述的基于Consul和JRPC的电力管理系统智能诊断方法,其特征在于,
所述步骤2中,
节点服务为设置在电力管理系统各节点上的服务模块,节点服务提供数据采集功能和远端系统命令执行功能;
JRPC模块为封装的服务注册发现与调用框架,JRPC模块还包括服务注册发现接口和服务调用接口。
5.根据权利要求1所述的基于Consul和JRPC的电力管理系统智能诊断方法,其特征在于,
所述步骤3中,
通过系统配置模块将电力管理系统的相关信息录入Consul数据中心,录入Consul数据中心的电力管理系统相关信息包括电力管理系统的节点配置信息、服务分布和诊断逻辑信息。
6.根据权利要求5所述的基于Consul和JRPC的电力管理系统智能诊断方法,其特征在于,
诊断逻辑信息包括CPU检测信息、磁盘检测信息、内存检测信息、节点数据采集检测信息、IO检测信息、网卡状态检测信息、对时检测信息、应用状态检测信息、数据库状态检测信息、进程配置检测信息和数据库表记录数检测信息。
7.根据权利要求1所述的基于Consul和JRPC的电力管理系统智能诊断方法,其特征在于,
所述步骤4中,
系统智能诊断模块通过JRPC模块的服务调用接口下发诊断项目的执行命令到电力管理系统的各个节点服务器,系统智能诊断模块通过JRPC模块调用电力管理系统节点服务注册到Consul服务中心的服务接口,获取电力管理系统节点服务的实时运行数据信息。
8.根据权利要求7所述的基于Consul和JRPC的电力管理系统智能诊断方法,其特征在于,
所述诊断项目包括:节点数据采集检测、磁盘检测、CPU检测、内存检测、IO检测、网卡状态检测、对时检测、进程配置检测、应用状态检测、数据库表记录检测和数据库状态检测。
9.根据权利要求7所述的基于Consul和JRPC的电力管理系统智能诊断方法,其特征在于,
所述步骤4中,系统智能诊断模块获取的实时运行数据包括电力管理系统基础环境信息和基础服务运行信息,基础环境信息还包括:磁盘检测信息、CPU检测信息、内存检测信息、IO检测信息、网卡检测信息、对时检测信息;基础服务运行信息还包括:节点数据采集检测信息、进程配置检测信息、应用状态检测信息、数据库状态检测信息。
10.根据权利要求5所述的基于Consul和JRPC的电力管理系统智能诊断方法,其特征在于,
所述步骤5中,系统智能诊断模块根据步骤4采集的实时运行数据信息和步骤3设置的诊断逻辑信息进行智能分析和研判,进行系统智能诊断,判断电力管理系统健康状态,并生成诊断结果报告,对异常指标或潜在问题进行分析和报警。
11.一种利用权利要求1-10任一项权利要求所述基于Consul和JRPC的电力管理系统智能诊断方法的基于Consul和JRPC的电力管理系统智能诊断装置,其特征在于,包括:Consul服务器、JRPC模块、系统配置模块和系统智能诊断模块;
其中,Consul服务器提供Consul数据中心和Consul服务中心,Consul数据中心存储电力管理系统所有的节点信息,Consul服务中心获取电力管理系统的各节点实时运行数据;
JRPC模块还包括服务注册发现接口和服务调用接口,用于连接电力管理系统节点服务和Consul服务中心,以及电力管理系统节点服务和Consul数据中心;
系统配置模块用于将电力管理系统的相关信息录入Consul数据中心,技术人员可以通过系统配置模块设置或修改电力管理系统的相关诊断逻辑;
系统智能诊断模块部署于电力管理系统工作站上,还包括可视化界面、命令解析执行单元、数据采集与智能分析单元,能够通过JRPC模块调用所有节点的节点服务模块数据,从而获取电力管理系统基础环境信息和基础服务运行信息,结合获取的信息对各节点进行诊断,得到诊断结果并进行展示。
12.一种终端,包括处理器及存储介质;其特征在于:
所述存储介质用于存储指令;
所述处理器用于根据所述指令进行操作以执行根据权利要求1-10任一项所述方法的步骤。
13.计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-10任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211555698.4A CN115858288A (zh) | 2022-12-05 | 2022-12-05 | 一种基于Consul和JRPC的电力管理系统智能诊断方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211555698.4A CN115858288A (zh) | 2022-12-05 | 2022-12-05 | 一种基于Consul和JRPC的电力管理系统智能诊断方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115858288A true CN115858288A (zh) | 2023-03-28 |
Family
ID=85670286
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211555698.4A Pending CN115858288A (zh) | 2022-12-05 | 2022-12-05 | 一种基于Consul和JRPC的电力管理系统智能诊断方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115858288A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050132253A1 (en) * | 2003-11-26 | 2005-06-16 | International Business Machines Corporation | Diagnosing faults and errors from a data repository using directed graphs |
CN105302120A (zh) * | 2015-11-19 | 2016-02-03 | 广州云湾信息技术有限公司 | 智能设备的远程服务装置、系统和方法 |
CN105323113A (zh) * | 2015-11-19 | 2016-02-10 | 国网江西省电力公司信息通信分公司 | 一种基于可视化技术的系统故障应急处置系统及方法 |
CN112328320A (zh) * | 2020-10-14 | 2021-02-05 | 许继集团有限公司 | 一种基于consul的电网调度系统配置管理装置 |
CN115033419A (zh) * | 2022-08-12 | 2022-09-09 | 浩鲸云计算科技股份有限公司 | 一种实现硬件故障自愈的方法和系统 |
-
2022
- 2022-12-05 CN CN202211555698.4A patent/CN115858288A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050132253A1 (en) * | 2003-11-26 | 2005-06-16 | International Business Machines Corporation | Diagnosing faults and errors from a data repository using directed graphs |
CN105302120A (zh) * | 2015-11-19 | 2016-02-03 | 广州云湾信息技术有限公司 | 智能设备的远程服务装置、系统和方法 |
CN105323113A (zh) * | 2015-11-19 | 2016-02-10 | 国网江西省电力公司信息通信分公司 | 一种基于可视化技术的系统故障应急处置系统及方法 |
CN112328320A (zh) * | 2020-10-14 | 2021-02-05 | 许继集团有限公司 | 一种基于consul的电网调度系统配置管理装置 |
CN115033419A (zh) * | 2022-08-12 | 2022-09-09 | 浩鲸云计算科技股份有限公司 | 一种实现硬件故障自愈的方法和系统 |
Non-Patent Citations (1)
Title |
---|
周志明: "《凤凰架构 构建可靠的大型分布式系统》", 31 December 2021, pages: 33 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11394628B1 (en) | Monitoring and performance improvement of enterprise applications | |
CN111104535B (zh) | 一种数据管理系统及数据管理方法 | |
US20080065928A1 (en) | Technique for supporting finding of location of cause of failure occurrence | |
WO2011150715A1 (zh) | 分布式控制系统中采集第三方设备数据的方法及装置 | |
CN107193714B (zh) | 一种告警展示方法及装置 | |
CN112559288B (zh) | 一种基于以太网的分布式惯性平台测试系统 | |
JP2022551978A (ja) | データセンタオペレーションまたはクラウドインフラストラクチャで仮想現実または拡張現実を使用するためのシステムおよび方法 | |
CN111352807A (zh) | 服务器资源实时监控方法及装置 | |
CN112860504A (zh) | 监控方法及装置、计算机存储介质、电子设备 | |
CN112817827B (zh) | 运维方法、装置、服务器、设备、系统及介质 | |
CN113962398A (zh) | 量子计算机自动化管控方法、系统、服务器及存储介质 | |
CN117135030A (zh) | 告警关联分析方法、装置、终端设备以及存储介质 | |
CN111435238A (zh) | 自动发现并归类工厂电力与能量智能设备以供分析的方法 | |
CN113381880B (zh) | 物联网设备管理方法、装置及系统 | |
CN115858288A (zh) | 一种基于Consul和JRPC的电力管理系统智能诊断方法及系统 | |
CN114090382B (zh) | 超融合集群健康巡检方法和装置 | |
CN113835961B (zh) | 告警信息监控方法、装置、服务器及存储介质 | |
CN109614330A (zh) | 存储系统业务测试方法、装置、系统、存储控制器及介质 | |
CN115687026A (zh) | 多节点服务器故障预警方法、装置、设备及介质 | |
CN113778895A (zh) | 接口自动化测试方法及装置 | |
CN111307280A (zh) | 一种换流阀阀基电子设备光功率在线监测系统及监测方法 | |
CN113900898B (zh) | 一种数据处理系统、设备及介质 | |
CN118260294B (zh) | 基于ai的制造业痛觉信号汇总方法、系统、介质及设备 | |
CN112416745B (zh) | 一种测试控制系统、方法及设备 | |
CN111082532B (zh) | 一种安全控制管理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |