CN116961241B - 一种基于电网业务的统一应用监测平台 - Google Patents
一种基于电网业务的统一应用监测平台 Download PDFInfo
- Publication number
- CN116961241B CN116961241B CN202311213983.2A CN202311213983A CN116961241B CN 116961241 B CN116961241 B CN 116961241B CN 202311213983 A CN202311213983 A CN 202311213983A CN 116961241 B CN116961241 B CN 116961241B
- Authority
- CN
- China
- Prior art keywords
- service
- center
- data
- monitoring
- business
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 288
- 238000004458 analytical method Methods 0.000 claims abstract description 226
- 238000010276 construction Methods 0.000 claims abstract description 82
- 230000035515 penetration Effects 0.000 claims abstract description 5
- 238000013507 mapping Methods 0.000 claims abstract description 4
- 238000007726 management method Methods 0.000 claims description 122
- 238000012545 processing Methods 0.000 claims description 51
- 238000012423 maintenance Methods 0.000 claims description 50
- 238000003860 storage Methods 0.000 claims description 37
- 239000008186 active pharmaceutical agent Substances 0.000 claims description 32
- 230000004044 response Effects 0.000 claims description 32
- 238000007619 statistical method Methods 0.000 claims description 31
- 230000036541 health Effects 0.000 claims description 28
- 230000004927 fusion Effects 0.000 claims description 22
- 238000000034 method Methods 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 12
- 238000005516 engineering process Methods 0.000 claims description 9
- 230000000007 visual effect Effects 0.000 claims description 9
- 238000005538 encapsulation Methods 0.000 claims description 6
- 230000003993 interaction Effects 0.000 claims description 6
- 238000012098 association analyses Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 5
- 238000007499 fusion processing Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 238000004140 cleaning Methods 0.000 claims description 4
- 238000009826 distribution Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 4
- 241000744472 Cinna Species 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000011144 upstream manufacturing Methods 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 2
- 230000008676 import Effects 0.000 description 66
- 238000012217 deletion Methods 0.000 description 31
- 230000037430 deletion Effects 0.000 description 31
- 238000010586 diagram Methods 0.000 description 13
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 238000012806 monitoring device Methods 0.000 description 6
- 230000001174 ascending effect Effects 0.000 description 5
- 230000003862 health status Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000013179 statistical model Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000004888 barrier function Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 210000001503 joint Anatomy 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000739 chaotic effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 239000002071 nanotube Substances 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J13/00—Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
- H02J13/00002—Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network characterised by monitoring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Power Engineering (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种基于电网业务的统一应用监测平台,包括采集层、数据层、服务层和展现层;服务层用于基于数据层构建得到中台业务、服务、支撑应用情况这三者之间的映射关系,同时对二级部署业务中台的服务应用情况及其对业务影响进行监测分析和两级监测数据贯通,两级监测数据是指总部级监测数据和子公司级监测数据;服务层包括服务调用链路构建模块、服务通断分析模块、服务集中告警模块、服务错误分析模块、服务通断影响范围分析模块、全链路监测指标体系模块、服务链路数据共享模块、全量服务信息管理模块和服务链路数据采集模块。本发明通过构建业务中台全链路监测工具功能,能够实现业务中台服务、接口调用的全链路监测。
Description
技术领域
本发明涉及电网业务应用平台技术领域,具体涉及一种基于电网业务的统一应用监测平台。
背景技术
目前,客户服务业务中台、电网资源业务中台、财务管理业务中台、项目管理业务中台四大业务中台均采用云上运行,分别在客户服务业务域、电网资源业务域、财务管理业务域、项目管理业务域为上层业务应用系统提供信息支撑服务,对于云平台中台服务的链路监控,主要依托云平台的监测组件实现,如阿里ARMS组件和华为云APM组件,二者对内均已实现底层链路数据采集及监控,采集保存了大量的微服务间调用链路、资源使用等监测数据;对外提供数据服务,将采集指标开放供外部应用使用,为上层业务服务监控提供基础数据支撑。
现有云平台监控工具业务链路监测能力不足,无法从业务角度聚焦业务中台云服务所支撑业务应用信息并展示服务与业务应用的关联关系、微服务、服务间的调用关系等,无法实现业务系统关联预警,缺少业务全链路监测能力。同时,微服务与云平台预警未关联,在云平台预警情况下微服务缺乏主动智能预警能力,导致微服务故障情况下应急处置能力不足,且云资源缺乏集中监控,监测指标混乱,缺乏统一的全链路监测工具。目前仍存在的问题包括:
(1)缺乏整体业务视角,目前服务监测主要侧重于针对微服务本身运行状态的监测,运行服务调用链路与上层业务关联不强,忽略了微服务本身所支撑的业务监测,而业务部门更加熟悉业务而非运行的微服务本身,造成概念逻辑上存在一定割裂,给业务运营及服务运维人员带来不必要的障碍,无法有效保障业务总体有效运营与运维,需要业务层面与微服务运行层面的融合关联,在完成微服务运行层面的全链路监测基础上,结合业务场景及模型,实现业务层面的链路监测。
(2)缺乏全局视角的链路分析,云上中台服务虽然解决了历史“烟筒式”的应用,但是在服务管理方面仍存在一定孤立,业务中台分为项目管理业务中台、电网资源业务中台、客户服务业务中台、财务管理业务中台,各中台划分多个业务中心,若要一览业务中台服务的整体运行情况,需要结合服务信息、链路等基础信息,建立中台、中心与微服务之间关系,进而从全局性视角建立服务调用链路与层级关系,了解服务与模型关系,定位服务错误信息,保障业务中台运行稳定性。
(3)缺乏标准的监测指标体系,四大业务中台在各省市公司分别采用阿里和华为的技术架构,采集监控技术分属不同路线,运行平台及监测指标不统一,导致难以做到精益的系统性监测,难以做到监测指标的贯通,无法有效帮助业务人员对业务中台服务进行针对性优化及性能提升,无法实现统一的管理与运维,需要结合两种采集技术路线及原始指标规则,定义制定统一的监测链路指标体系,支撑业务中台及业务系统统一有效监测管理。
(4)缺乏进一步的融合分析,目前基于云平台采集工具阿里ARMS及华为APM监测系统,仍处于原始指标的初级处理及展示分析上,无法有效追踪服务调用链路,导致错误信息分析能力不足、服务迭代影响范围难以评估。需要结合业务实际需求,对原始采集指标进一步处理分析,实现错误分析、服务通断分析及服务通断影响范围分析等业务需求,有效支撑运维工作的开展。
发明内容
本发明的目的是为了提出一种基于电网业务的统一应用监测平台,通过构建业务中台全链路监测工具功能,实现业务中台服务、接口调用的全链路监测,支撑“服务状态监测、服务调用链路、服务告警及影响范围定位”三大应用场景,助力大数据中心、云运营中心对业务中台、云环境系统的服务及中台服务支撑业务应用情况全面、真实把控,便于后续支撑引导业务中台、云环境的可持续建设,并提升公司云资源利用率,切实提升业务系统及中台服务实用化水平,服务业务高质量发展,指导企业级统筹工作有序开展。
为实现上述技术目的,本发明采取的技术方案为:
一种基于电网业务的统一应用监测平台,所述统一应用监测平台用于对客户服务业务中台、电网资源业务中台、财务管理业务中台、项目管理业务中台这四大业务中台进行监测;
所述统一应用监测平台包括采集层、数据层、服务层和展现层;
所述采集层通过阿里云ARMS、华为云APM组件完成业务中台及业务系统服务全链路监测数据采集、清洗和汇聚,并通过WebService接口服务与数据层集成,实现数据的交互;
所述服务层用于基于数据层构建得到中台业务、服务、支撑应用情况这三者之间的映射关系,同时对二级部署业务中台的服务应用情况及其对业务影响进行监测分析和两级监测数据贯通,两级监测数据是指总部级监测数据和子公司级监测数据;
所述服务层包括服务调用链路构建模块、服务通断分析模块、服务集中告警模块、服务错误分析模块、服务通断影响范围分析模块、全链路监测指标体系模块、服务链路数据共享模块、全量服务信息管理模块和服务链路数据采集模块;
所述服务调用链路构建模块用于基于项目管理业务中台、财务管理业务中台、电网资源业务中台、客户服务业务中台这四大中台的微服务和服务API基础信息,自动发现并搭建各中台服务调用链路关系,并结合图谱技术,构建4大业务中台、中台下的各中心,各中心下部署的各项微服务、服务API及其对应支撑的业务应用之间的链路关系;
所述服务通断分析模块利用监控数据、资源数据以及其他运维数据,对业务运营状态、系统健康状态、以及资源使用情况进行分析,并通过展示层进行可视化的展示;
所述服务集中告警模块对从云平台接收到的告警事件进行标准化处理,提取并翻译告警信息以形成相应的结构化信息,并对处理后的告警信息按照业务类别和重要程度进行分类和分级处理;
所述服务错误分析模块基于服务调用错误和服务代码错误两个维度对业务中台服务进行错误分析;
所述服务通断影响范围分析模块通过纵向及横向监控能力,当服务出现错误时,结合全链路服务监测能力,构建组件关联关系以及业务服务的上下游关系,分析判断业务错误的影响范围,通知相关业务,以及协助快速定位错误;
所述全链路监测指标体系模块依据业务监测需求,建立包括业务、应用、云服务、云平台、基础设施云在内的全链路监测指标体系,用于业务运营监测及系统运行监测工作;
所述服务链路数据共享模块用于开放基于业务中台共享的服务全链路监测全量应用指标数据源,提供共享数据接口或数据封装,通过报表中心,为不同操作水平、不同期望目标、多层次业务人员提供中台运营数据自定义维度、自定义颗粒度分析展示的多维自助分析能力;
所述全量服务信息管理模块针对无法对四大业务中台规划的业务中心、提供的业务服务、支撑的外部应用、运行的服务实例进行统一管理及展示,构建彼此间的层级关系,融合关联服务运行全链路数据;
所述服务链路数据采集模块分别采用阿里ARMS及华为APM两种技术路线实现各子公司云上微服务的全链路监测,并结合业务实际监测需求,对指标进行融合处理,完成业务、应用、接口、资源多层监测对象的关联,形成统一的指标体系与监测服务,支撑中台服务及业务的全链路监测;
所述展现层通过接入层与服务层实现数据交互,展现层基于vue 框架构建,对业务中台及云上业务系统服务全链路数据进行可视化及图表分析处理。
与现有技术相比,本发明的有益效果如下:
第一,本发明的基于电网业务的统一应用监测平台,将系统应用监测工具、业务中台业务链路监测、数据中台数据链路监测及技术中台组件链路监测进行集约管控,形成统一服务监测指标体系、监测协同机制,打破业务、技术、数据监测壁垒,推动业数融合,强化数据价值,避免重复建设,重复投资;
第二,本发明的基于电网业务的统一应用监测平台,统一企业中台自有及共享服务能力,提升业务管控、数据标准、技术规范等统筹能力,构建以技术为底座,业务为导向,数据为链条的统一监测能力,强化业务协同和数据共享能力,高效解决公司跨专业、跨中台等协同问题,以用促治,以用促建,促进业务、数据、技术、管理等要素与各项工作真正实现深度融合,发挥价值作用,促进数字化转型向纵深推进,提升转型质效加深;
第三,本发明的基于电网业务的统一应用监测平台,有助于构建业务视角的应用和数据全局监测能力,深化横向协同,形成各专业监测需求的合力,提升数字化服务支撑水平。
附图说明
图1为本发明实施例的基于电网业务的统一应用监测平台结构图;
图2为本发明实施例的基于电网业务的统一应用监测平台的业务架构图;
图3为本发明实施例的基于电网业务的统一应用监测平台的应用架构图;
图4为本发明实施例的二级部署结构图;
图5为部分采集数据示意图。
具体实施方式
以下结合附图对本发明的实施例作进一步详细描述。
图1为本发明实施例的基于电网业务的统一应用监测平台结构图。参见图1,该统一应用监测平台用于对客户服务业务中台、电网资源业务中台、财务管理业务中台、项目管理业务中台这四大业务中台进行监测; 所述统一应用监测平台包括采集层、数据层、服务层和展现层;
所述采集层通过阿里云ARMS、华为云APM组件完成业务中台及业务系统服务全链路监测数据采集、清洗和汇聚,并通过WebService接口服务与数据层集成,实现数据的交互;
所述服务层用于基于数据层构建得到中台业务、服务、支撑应用情况这三者之间的映射关系,同时对二级部署业务中台的服务应用情况及其对业务影响进行监测分析和两级监测数据贯通,两级监测数据是指总部级监测数据和子公司级监测数据;
所述服务层包括服务调用链路构建模块、服务通断分析模块、服务集中告警模块、服务错误分析模块、服务通断影响范围分析模块、全链路监测指标体系模块、服务链路数据共享模块、全量服务信息管理模块和服务链路数据采集模块;
所述服务调用链路构建模块用于基于项目管理业务中台、财务管理业务中台、电网资源业务中台、客户服务业务中台这四大中台的微服务和服务API基础信息,自动发现并搭建各中台服务调用链路关系,并结合图谱技术,构建4大业务中台、中台下的各中心,各中心下部署的各项微服务、服务API及其对应支撑的业务应用之间的链路关系;
所述服务通断分析模块利用监控数据、资源数据以及其他运维数据,对业务运营状态、系统健康状态、以及资源使用情况进行分析,并通过展示层进行可视化的展示;
所述服务集中告警模块对从云平台接收到的告警事件进行标准化处理,提取并翻译告警信息以形成相应的结构化信息,并对处理后的告警信息按照业务类别和重要程度进行分类和分级处理;
所述服务错误分析模块基于服务调用错误和服务代码错误两个维度对业务中台服务进行错误分析;
所述服务通断影响范围分析模块通过纵向及横向监控能力,当服务出现错误时,结合全链路服务监测能力,构建组件关联关系以及业务服务的上下游关系,分析判断业务错误的影响范围,通知相关业务,以及协助快速定位错误;
所述全链路监测指标体系模块依据业务监测需求,建立包括业务、应用、云服务、云平台、基础设施云在内的全链路监测指标体系,用于业务运营监测及系统运行监测工作;
所述服务链路数据共享模块用于开放基于业务中台共享的服务全链路监测全量应用指标数据源,提供共享数据接口或数据封装,通过报表中心,为不同操作水平、不同期望目标、多层次业务人员提供中台运营数据自定义维度、自定义颗粒度分析展示的多维自助分析能力;
所述全量服务信息管理模块针对无法对四大业务中台规划的业务中心、提供的业务服务、支撑的外部应用、运行的服务实例进行统一管理及展示,构建彼此间的层级关系,融合关联服务运行全链路数据;
所述服务链路数据采集模块分别采用阿里ARMS及华为APM两种技术路线实现各子公司云上微服务的全链路监测,并结合业务实际监测需求,对指标进行融合处理,完成业务、应用、接口、资源多层监测对象的关联,形成统一的指标体系与监测服务,支撑中台服务及业务的全链路监测;
所述展现层通过接入层与服务层实现数据交互,展现层基于vue 框架构建,对业务中台及云上业务系统服务全链路数据进行可视化及图表分析处理。
该统一应用监测平台通过构建全链路监测能力,以及提升业务中台及云上业务系统服务监测能力及感知能力,构建服务状态监测、调用链路一张图、服务告警及服务影响范围定位等三大应用场景,实现云上业务“全景监测、动态分析、故障定位”。参见图2和图3,该统一应用监测平台的各个模块的功能和工作原理如下:
(一)服务调用链路构建模块
服务调用链路构建模块基于项目管理业务中台、财务管理业务中台、电网资源业务中台、客户服务业务中台4大中台微服务、服务API等基础信息,通过阿里ARMS组件监测装置、华为APM组件监测装置,自动发现并搭建各中台服务调用链路关系,并结合图谱技术,构建4大业务中台、中台下的各中心,各中心下部署的各项微服务、服务API及其对应支撑的业务应用之间的链路关系。
以华为APM组件监测装置为例,本发明采用华为APM组件监测装置对后端服务(主要是微服务)进行监控,并根据流量形成图谱。华为APM组件监测装置能够监控整个分布式集群服务的调用链路。APM生成监控图谱的原理是通过对应用程序进行代码级别的监控和分析,收集应用程序的运行数据,并将其可视化为图谱形式,以便用户更直观地了解应用程序的性能状况和潜在问题,图谱生成过程包括以下步骤:1、代码注入对程序进行插桩,如字节码注入、aop;2、进行数据采集:收集应用程序的性能指标、方法调用链、异常信息等数据。包括应用程序的响应时间、吞吐量、错误率、数据库访问时间等;3、数据传输、存储,然后将数据转化为图谱形式:一般是指方法调用链图、依赖关系图、请求流程图等,用于展示应用程序的运行状态和性能瓶颈。
至于使用微服务体系的“服务发现”功能,以阿里微服务dubbo(另外 NetflixEureka、Consul、etcd也是比较流行的服务发现工具)为例,本发明可以使用自定义dubbo协议,向被调用服务传输“服务标记”、“方法名”、“入参”,从而实现服务之间的调用、负载均衡等;微服务体系的“服务发现”功能还会提供注册中心对服务进行监控管理以保证各服务都是健康可用的状态的能力。
本发明所指的使用微服务架构进行服务发现,结合华为APM组件监测装置插桩绘制成图谱,也特指将阿里和华为两种监控工具数据进行融合并绘制出更完整的全链路调用图。
(1)业务中台与业务中心关系自动构建单元
业务中台与业务中心关系自动构建单元根据各业务中台与业务中心运行调用链路采集数据及对应的服务模型信息,按照业务中台与业务中心所规定的命名规则自动模糊匹配中台与中心的层级关系,实现业务中台与业务中心关系图谱的自动化构建,为业务层中台级的链路分析提供数据支撑。业务中台与业务中心关系自动构建单元的功能模块组件包括电网资源业务中台与中心关系自动构建组件、项目管理业务中台与中心关系自动构建组件、客户服务业务中台与中心关系自动构建组件和财务管理业务中台与中心关系自动构建组件。这四个功能组件分别根据电网资源业务中台/项目管理业务中台/客户服务业务中台/财务管理业务中台与相应中台内部各中心服务调用链路采集数据及对应的服务模型信息,按照电网资源业务中台所规定的命名规则自动模糊匹配电网资源业务中台与业务中心的关系,实现电网资源业务中台/项目管理业务中台/客户服务业务中台/财务管理业务中台与业务中心关系图谱的自动化构建,为业务层中台级的链路分析提供数据支撑。
(2)业务中心与业务服务关系自动构建单元
业务中心与业务服务关系自动构建单元根据业务中台各微服务调用链路采集数据以及业务服务信息,按照关键接口URL信息自动构建微服务与业务服务之间的关联关系,同时结合业务中心与微服务关系,实现业务中心与业务服务关系图谱的自动化构建,为业务层中心级的链路分析提供数据支撑。业务中心与业务服务关系自动构建单元的功能模块组件包括:电网资源中台各业务中心与业务服务关系自动构建组件、项目管理中台各业务中心与业务服务关系自动构建组件、客户服务中台各业务中心与业务服务关系自动构建组件和财务管理中台各业务中心与业务服务关系自动构建组件。这四个组件分别根据电网资源业务中台/项目管理业务中台/客户服务业务中台/财务管理业务中台各微服务调用链路采集数据以及电网资源相关的业务服务信息,按照关键接口URL信息自动构建电网资源业务中台/项目管理业务中台/客户服务业务中台/财务管理业务中台的微服务与业务服务之间的关联关系,同时结合业务中心与微服务的关系,实现电网资源业务中心与业务服务关系图谱的自动化构建,为业务层中心级的链路分析提供数据支撑。
(3)业务服务与微服务关系自动构建单元
业务服务与微服务关系自动构建单元根据业务中台下各业务服务模型中URL信息与微服务被调用所采集链路信息中的接口地址数据,对数据进行关联分析处理,自动匹配业务服务与各微服务实例的关系,实现各业务中心与业务服务关系图谱的自动化构建,为业务层服务级的链路分析提供数据支撑。业务服务与微服务关系自动构建单元的功能模块组件包括电网资源中台业务服务与微服务关系自动构建组件、项目管理中台业务服务与微服务关系自动构建组件、客户服务中台业务服务与微服务关系自动构建组件和财务管理中台业务服务与微服务关系自动构建组件。这四个功能组件分别根据电网资源业务服务模型/项目管理业务服务模型/客户服务业务服务模型/财务管理业务服务模型中URL信息与微服务被调用所采集的链路信息中的接口地址信息,二者信息进行关联分析处理,自动匹配电网资源业务中台/项目管理业务中台/客户服务业务中台/财务管理业务中台的业务服务与各微服务的关系,实现电网资源业务中心与业务服务关系图谱的自动化构建,为业务层服务级的链路分析提供数据支撑。
(4)微服务与接口关系自动构建单元
微服务与接口关系自动构建单元根据业务中台内各微服务调用链路中的接口URL及微服务等相关信息,通过去重、合并、筛选等计算处理,自动构建业务中台内各微服务与服务接口的关系,实现中台微服务与服务接口关系图谱的自动化构建,为业务层的链路分析提供数据支撑。微服务与接口关系自动构建单元的功能模块组件包括电网资源业务中台微服务与服务接口关系自动构建组件、项目管理业务中台微服务与服务接口关系自动构建组件、客户服务业务中台微服务与服务接口关系自动构建组件和财务管理业务中台微服务与服务接口关系自动构建组件。这四个功能组件分别根据电网资源业务/项目管理业务/客户服务业务/财务管理业务内各微服务调用链路中的接口URL信息,通过去重、合并、筛选等计算处理方式,自动构建电网资源业务中台/项目管理业务中台/客户服务业务中台/财务管理业务中台下各微服务与服务接口的关系,实现电网资源中台微服务与服务接口关系图谱的自动化构建,为业务层的链路分析提供数据支撑。
(5)微服务间调用链路构建及统计分析单元
微服务间调用链路构建及统计分析单元根据服务调用链路数据,自动构建微服务之间的调用链路关系,并通过搜集处理分析调用链路数据,遵照微服务监测指标模型及模型算法规则,统计计算包含服务总数、服务累计调用次数、正常服务数、错误服务数、受影响服务数等数据指标内容,展示数据为当日累计值。
(6)业务中台调用链路构建及统计分析单元
业务中台调用链路构建及统计分析单元根据微服务间的调用链路关系,结合业务中台与微服务之间的关系图谱,自动构建业务中台间的调用链路关系,并基于微服务调用链路数据以及中台与微服务之间的业务关系,遵照统一的指标统计模型算法,实现业务中台之间的调用情况统计分析。
(7)中心调用链路构建及链路分析单元
中心调用链路构建及链路分析单元根据微服务间的调用链路关系,结合业务中心与微服务之间的关系图谱,自动构建中心间的调用链路关系;并基于微服务调用链路数据以及中台与微服务之间的业务关系,遵照统一的指标统计模型算法,实现业务中台之间的调用情况统计分析。
(8)业务服务调用链路统计分析单元
业务服务调用链路统计分析单元基于微服务调用链路数据,结合业务服务与接口的关系图谱,遵照统一的指标统计模型算法,实现业务服务的调用情况统计分析。
本发明的统一的指标统计模型算法可以参照的算法包括统计分析算法、时序模式算法、关联规则算法、聚类分析算法、分类回归分析算法等,目的是针对从APM获取的性能指标数据进行聚类处理,以得到二次指标。如图5所示,前述统计分析单元用于对资源(cpu、内存、队列、io等)、服务(调用服务次数、异常、超时等)、性能(响应时间、并发数、高可用熔断、限流)、数据库(慢sql、死锁、执行时间)、网络(上行、下行)、其他(网关、业务定义数据)进行采集、分析、度量。
(9)业务应用支撑情况统计分析单元
业务应用支撑情况统计分析单元统计四大中台服务支撑应用情况,包含支撑系统数、受影响系统数、服务支撑的业务应用数、受影响的业务应用数、跨专业调用的服务应用数等数据。
(10)服务应用统计分析单元
服务应用统计分析单元分别统计各业务中台服务应用情况,包含服务次数、服务累计调用次数、正常服务数、错误服务数、受影响服务数,针对客户服务中台、电网资源中心分别统计展示其总部及子公司支撑系统数柱状图和支撑应用数柱状图,并将当日服务调用数按照小时维度实现折线趋势分析。
(11)中台运营分析单元
中台运营分析单元以财务中台、项目中台、电网资源业务中台、客户服务业务中台等单一中台为统计维度,对单一中台整体健康评分、访问分析、热点服务、服务告警统计、服务告警信息、服务错误信息、服务应用统计及中台链路展示等方面进行统计分析。
中台运营分析单元支持整个中台的服务链路关系展示图,中台运营分析单元包括以下组件:1、健康分析组件,用于根据服务请求正常次数及占比、缓慢次数及占比、错误次数及占比、平均响应时间等4个方面完成对中台的健康评分。2、访问分析组件,用于统计展示当日服务调用次数、平均响应时间趋势图。3、热点服务组件,用于展示中台下服务名称、服务累计调用次数,并根据服务累计调用次数按升、降序排列。
(12)中心运营分析单元
中心运营分析单元以单一中台的服务中心为统计维度完成中心服务应用情况统计分析,从服务中心整体基本应用信息、请求服务质量情况、请求量和响应时间趋势分析、请求统计列表、服务告警信统计、服务告警信息、服务错误信息及服务链路展示等方面完成服务中心整体应用情况的完成可视化分析。中心运营分析单元具体包括:1、服务基本情况组件,用于统计中心下三级业务所包含服务应用情况,包含服务总数、服务调用次数、正常服务数、错误服务数、受影响服务数。2、请求统计列表组件,用于展示中心三级业务所包含服务API所有请求信息,包含API别名、API链路、调用次数、响应时间、错误次数、错误率,并根据调用次数、响应时间、错误次数、错误率分别按升、降序排列。3、三级业务组件,用于分析服务调用次数、平均响应时间、服务包含API接口数、云上服务包数、服务描述。4、服务趋势分析组件,用于展示当日三级业务所包含服务请求次数、响应时间趋势图。
(13)微服务运营分析单元
微服务运营分析单元针对单一中台的单个业务信息完成服务应用情况统计分析,从服务调用次数及趋势图、告警次数、错误次数、平均响应时间及趋势图、服务错误列表信息、服务上下游服务或应用支撑链路关系图等方面完成可视化分析展示。微服务运营分析单元具体包括:1、服务基本情况组件,用于统计中台三级业务所包含服务调用情况,包含调用次数、告警次数、错误次数、平均响应时间。2、调用次数分析组件,用于将当日三级业务所包含服务调用次数以柱状图形式进行分析;3、响应时长分析组件,用于将当日三级业务所包含服务调用平均响应时间以折线趋势图形式进行分析;4、三级业务组件,用于分析服务调用次数、平均响应时间、该服务包含API接口数、云上服务包数、服务描述;5、服务支撑情况组件,用于展示服务支撑情况,包含专业名称、服务名称、服务支撑系统名称、服务支撑应用名称。
(二)服务通断分析模块
服务通断分析模块利用监控数据、资源数据以及其他运维数据,对业务运营状态、系统健康状态、以及资源使用情况进行可视化的展示,助力领导层决策,同时优化监控工具本身的数据报表能力,提供更详细的监控数据展示能力。
(1)业务中台系统整体服务通断分析单元
云上业务中台系统整体服务通断分析单元从服务效率、运行状态和服务错误三个维度对包括财务管理中台、项目管理中台、电网资源中台、客户服务中台在内的云上业务中台系统整体进行服务通断分析。
业务中台系统整体的服务效率分析是指基于云上全部业务中台提供服务的服务活跃度的视角,对云上业务中台服务进行整体服务效率状态概览,展现的服务效率指标信息包括服务总数、零调用比率、热点服务列表、僵尸服务列表等关键业务中台服务运行效率指标信息。
业务中台系统整体的运行状态分析是指基于统计云上全部业务中台产生告警的数量以及告警类型分布的视角,对业务中台服务整体运行稳定性状态进行概览,告警统计按照一般、告警、严重三个维度,统计服务告警次数及各类型告警占比。
业务中台系统整体服务错误分析是指以对云上全部业务中台产生错误的数量进行分析的视角,对业务中台服务的整体代码服务进行质量监控,监控的服务错误信息,包含错误名称、服务错误次数,可根据服务错误次数按升、降序排列。
(2)业务中台服务通断分析单元
业务中台服务通断分析单元从业务中台服务规模、服务效率、健康状况、运行状态、服务错误等五个维度对财务管理中台、项目管理中台、电网资源中台、客户服务中台进行服务通断分析。业务中台服务规模分析是指以业务中台提供的服务、API以及对外支撑应用规模的视角进行特定业务中台数据分析,需要输出业务中台的服务数、服务调用情况、服务分类占比,支撑应用情况计,API数及API分类占比分析等多个维度的服务运行数据。同时在各子公司进行业务中台服务规模统计分析的基础上,以各子公司业务中台服务规模对比的视角,结合各子公司特定业务中台服务总数、业务应用数、服务调用次数三个指标数据,完成子公司对于特定业务中台的综合对比统计分析。业务中台服务效率分析是指以业务中台提供服务的服务活跃度的视角,对业务中台服务进行服务效率状态概览,展现的服务效率指标信息包括服务总数、零调用比率、热点服务列表、僵尸服务列表等关键业务中台服务效率指标信息。业务中台健康状况分析是指以业务中台服务运行健康状况进行综合分析的视角进行业务中台健康状态分析,业务中台健康状态分析需要输出的数据包括业务总数、告警数量、服务调用次数、错误数量、服务调用错误率、服务调用平均响应时间、业务调用次数、正常业务率、错误业务率、缓慢业务率、业务调用平均响应时间等信息。业务中台运行状态分析是指以统计业务中台产生告警的数量以及告警类型分布的视角,对业务中台服务运行稳定性状态进行概览,告警统计按照一般、告警、严重三个维度,统计服务告警次数及各类型告警占比。业务中台的服务错误分析是指以对业务中台产生服务调用错误的数量进行分析的视角,对业务中台服务的整体服务代码质量进行监控,监控的指标信息包含服务错误名称、服务错误次数,可根据服务错误次数按升、降序排列。
(3)特定中心/应用服务通断分析单元
特定中心/应用服务通断分析单元包括服务效率、健康状况、运行状态、服务错误四个维度的服务通断分析。特定中心/应用的服务效率分析是指以特定中心/应用提供服务的服务活跃度的视角,对特定中心/应用的服务效率状态进行概览,展现的服务效率指标信息包括服务总数、零调用比率、热点服务列表、僵尸服务列表等关键服务效率指标信息。特定中心/应用的健康状况分析输出的数据包括中心/应用的业务调用次数、正常业务率、错误业务率、缓慢业务率、业务调用平均响应时间等信息。特定中心/应用的运行状态分析是指以统计特定中心/应用产生告警的数量以及告警类型分布的视角,对中心/应用服务运行稳定性状态进行概览,告警统计按照一般、告警、严重三个维度,统计服务告警次数及各类型告警占比。特定中心/应用的服务错误分析是指以对特定中心/应用产生服务错误的数量进行分析的视角,对中心/应用服务的整体代码服务质量进行监控,监控的服务调用错误信息包含服务错误名称、服务错误次数,可根据服务错误次数按升、降序排列。
(4)特定服务的服务通断分析单元
特定服务的服务通断分析单元通过服务调用健康状态、服务接口调用健康状态、服务吞吐率、服务告警、服务实例资源状态率等维度进行服务通断综合分析,具体包括以下组件:
服务调用健康状态分析组件输出的服务调用健康状态数据包括特定服务的平均响应时间、当日请求数量、正常请求次数、错误请求次数、缓慢请求次数、错误率、错误率等信息。服务接口调用健康状态分析组件展示特定服务的微服务接口健康状态列表信息,包括服务接口的平均响应时间、当日请求数量、正常请求次数、错误请求次数、缓慢请求次数、错误率、错误率等信息。服务吞吐率分析组件用于判断服务运行的繁忙程度,可以根据服务标识查看服务的吞吐率指标数值。服务告警分析组件基于告警信息用于判断服务响应时间或者其他运行指标是否处于正常状态,可以根据服务标识查看服务的告警次数指标数值。服务实例资源状态分析组件用于服务实例CPU使用率、服务实例内存使用率、服务实例磁盘使用率等资源状态指标数据的分析,可以根据服务实例标识查看服务实例CPU使用率指标数值,根据服务实例标识查看服务实例内存使用率指标数值,根据服务实例标识查看服务实例磁盘使用率指标数值。
另外,服务通断分析单元还包括:(1)服务的接口状态汇总组件,用于展示特定服务的微服务接口健康状态列表信息,包括服务接口的平均响应时间、当日请求数量、正常请求次数、错误请求次数、缓慢请求次数、错误率、错误率等信息;(2)服务的调用链信息查询组件,用于根据服务标识查看服务的调用链信息,包含TraceID、URL、响应时间、响应状态等信息;(3)服务调用状态查询组件,用于根据服务标识查看服务的调用状态指标数值、业务服务在时间间隔内被调用的总次数、业务服务在时间间隔内被调用的错误次数、业务服务在时间间隔内被调用的平均响应时长、业务服务在时间间隔内被调用的最大响应时长、服务的对下游服务请求的次数指标数值;(4)服务实例查询组件,用于根据服务实例标识查看服务实例主机IP指标数值,以及服务实例JVM信息;(5)服务接口查询组件,用于根据服务接口标识查看业务服务接口在时间间隔内被调用的总次数,业务服务接口在时间间隔内被调用发生错误的总次数,业务服务接口在时间间隔内被调用的平均响应时长,业务服务接口在时间间隔内被调用的最大响应时长,业务服务接口的吞吐率指标数值,业务服务接口的告警次数指标数值等等。
(5)数据库的服务通断分析单元
数据库的服务通断分析单元基于数据库SQL请求数量、数据库SQL请求错误数量、数据库SQL请求平均响应时长、数据库慢SQL数量、数据库慢SQL百分比等数据库监控指标数值进行数据库的服务通断分析判断;数据库的服务通断分析单元可以通过数据库标识来查看数据库的各项指标信息,包括查看数据库所属服务ID、数据库SQL请求数量、数据库SQL请求错误数量、数据库SQL请求平均响应时长、数据库慢SQL数量和数据库慢SQL百分比等指标数值。
(三)服务集中告警模块
服务集中告警模块用于实现告警事件的统一展示、统一查询、统一处理。服务集中告警模块对从云平台接收到的告警事件进行标准化处理,实现告警信息提取、翻译,形成结构化信息,并对接收到的告警信息按照业务类别和重要程度进行分类和分级处理。服务集中告警模块包含告警规则制定单元和告警分析展示单元两个部分。
(1)告警规则制定单元
告警规则制定单元,通过规则的输入,实现对不同监控工具告警的汇聚、收敛、分组等,实现与事务监控、微服务监控、PaaS、IaaS等多个监控事件的对接,实现统一的告警事件检索和告警生命周期管理,对监控的事务调用、微服务、微服务基础资源以及微服务依赖组件的状态进行阈值告警触发,并可以根据全量服务信息,向相应的管理人员进行告警通知。
告警规则制定单元中设置有多个功能组件,分别用于支持以下功能:(1)通过设置不同级别告警/事件对应的颜色,用于用户浏览关注的告警/事件展现;(2)根据告警的不同状态设置不同的告警展示方式,以便当用户需要在监控告警时更方便地识别不同状态的告警,快速识别关注的告警;(3)根据告警级别设置不同级别提示声音或针对告警名称指定告警提示声音;(4)对于上报而不需要关注的告警/事件,创建屏蔽规则,使后续上报的符合屏蔽规则的告警/事件不会显示在当前告警和事件日志中;(5)根据所配置的汇聚规则将指定周期内上报的重复告警汇聚到同一个告警下,以实现告警压缩的目的;(6)通过设置告警/事件名称重定义规则,重新设置告警/事件名称,以便于用户理解告警;(7)对告警/事件的级别和类型进行重定义,以便运维人员将会对该告警/事件优先处理;(8)配置远程通知规则,将关注的告警/事件通过邮件或短消息方式发送给运维人员;(9)创建新的通知内容模板,系统将根据通知内容模板将告警信息发送给相关用户;(10)将多个告警/事件名称添加至一个名称组下,便于用户按照分组对告警进行管理。
(2)告警分析展示单元
告警分析展示单元包括告警分析组件和告警查询组件。 告警分析组件包含告警趋势统计子组件和告警列表统计子组件,其中告警趋势统计子组件,用于以单一中台或云上业务系统为主线,结合时间维度,按照服务告警等级实现告警数量的趋势统计分析目标。告警列表统计字组件,用于以单一中台或云上业务系统为主线,结合时间维度,按照服务告警等级实现告警事件基本信息进行列表统计目标。告警查询组件,用于提供实时告警查询、分组告警查询、历史告警查询、被屏蔽告警查询功能。实时告警查询是指在系统范围内或者在业务中台范围内查看实时更新的当前告警。告警分组查询是指在单击某个分组后,告警列表会立即更新为来自该分组内资源的告警。历史告警查询是指在系统范围内或者在业务中台范围内查看历史告警信息。被屏蔽告警查询是指在系统范围内或者在业务中台范围内查看被屏蔽告警信息。
(四)服务错误分析模块
服务错误分析模块,基于服务调用错误和服务代码错误两个维度实现业务中台服务错误分析。
(1)服务代码错误分析单元
服务代码错误分析单元包含错误历史趋势分析组件和错误信息列表展示组件。错误历史趋势分析组件,对应用系统微服务发生错误的次数,按照时间进行历史趋势分析。错误信息列表展示组件,根据服务标识对应用系统微服务产生的错误信息进行列表展示,展示的信息包括错误所在类名称、错误类型、错误次数、错误消息、错误堆栈等信息。
(2)服务调用错误分析单元
服务调用错误分析单元包含服务错误趋势分析组件、服务错误TOP5统计组件和服务错误信息列表统计组件。服务错误趋势分析组件,以单一中台或云上业务系统为主线,结合时间维度,对服务错误趋势进行统计分析。服务错误TOP5统计组件,以单一中台或云上业务系统为主线,结合时间维度,对服务错误TOP5进行统计展示。服务错误信息列表统计组件,以单一中台或云上业务系统为主线,结合时间维度,对服务错误信息列表进行统计展示。
(五)服务通断影响范围分析模块
服务通断影响范围分析模块是在微服务或者微服务组件发生故障时,对受影响的其他微服务以及业务范围进行分析判断。通过纵向及横向监控能力,当服务出现错误时,结合全链路服务监测能力,构建组件关联关系以及业务服务的上下游关系,分析判断业务错误的影响范围,及时通知相关业务,以及协助快速定位错误。服务通断影响范围分析模块包括服务中断统计分析单元和服务故障影响范围分析单元。
(1)服务中断统计分析单元
服务中断统计分析单元包括业务中台服务中断统计组件、业务服务中断统计组件和业务中台支撑应用中断统计组件。其中,业务中台服务中断统计组件用于统计四大中台服务运行中发生的通断情况,包含中断服务数、受影响服务数、受影响应用数及占比。业务服务中断统计组件用于统计业务中台中特定中心/应用所包含服务运行中发生的通断情况,包含中断服务数、受影响服务数、受影响应用数及占比。业务中台支撑应用中断统计组件用于统计展示中台下服务应用情况,包含服务数、支撑系统数、支撑应用数、中断服务数、受影响服务数、受影响系统数、受影响应用数。
(2)服务故障影响范围分析单元
服务故障影响范围分析单元包括服务影响范围分析组件和业务影响范围分析组件;其中服务影响范围分析组件用于在微服务发生故障时,对受影响的其他微服务进行展现;业务影响范围分析组件用于在微服务发生故障时,对受影响的业务服务范围进行展现。
(六)全链路监测指标体系模块
全链路监测指标体系模块依据总部和子公司的业务监测需求,建立业务、应用、云服务、云平台、基础设施云全链路监测指标体系,用于业务运营监测及系统运行监测工作。云全链路监测平台利用监测指标体系结合链路监测能力,实现云全链路监测能力。总部及子公司在云全链路监测指标体系的基础上,开放数据服务,结合自身业务监测场景,利用报表中心自定义监测大盘,满足个性化业务监测需求。
(1)指标体系标准规范构建单元
指标体系标准规范构建单元根据业务监测需求,建立业务、应用、云服务、云平台、基础设施云全链路监测指标体系的标准和规范,包括指标的分类、指标的名称、指标的单位、指标的意义等。为所有应用提供统一的、规范的标准,杜绝指标杂乱无序、指标乱建、指标歧义等情况。
(2)指标规划定义单元
指标规划定义单元根据业务监测的需求,确定和规范常用的指标,确定指标的名称、含义和单位。部分指标如表1所示。
表1
(3)指标维护管理单元
指标维护管理单元维护各业务中台服务、接口、数据库、服务资源等多维度的指标,包括指标计算规则、业务含义等元信息;以及支持对指标元信息的新增、修改、删除、导入、导出等功能,建议业务全链路监测指标统一维护管理中心。全链路监测指标体系模块的功能组件结构如表2所示。
表2
/>
(七)服务链路数据共享模块
服务链路数据共享模块开放基于业务中台共享的服务全链路监测全量应用指标数据源,提供共享数据接口或数据封装,通过报表中心,为不同操作水平、不同期望目标、多层次业务人员提供中台运营数据自定义维度、自定义颗粒度分析展示等多维自助分析能力,以实现中台运营数据的深层次价值挖掘。
(1)细化数据权限单元
细化数据权限单元根据业务中台业务监测数据需求,面向不同用户、不同业务细化数据层面认证权限,以实现多账号访问权限设置。
(2)监测数据处理单元
监测数据处理单元通过采集获得海量原始的监测数据,而这些数据在入库完成实例化之前,还需要对数据进行一轮的清洗,去除脏数据、歧义数据等不符合规范的数据,以保证数据的有效性,监测数据处理单元基于监测数据需求,完成监测数据的表数据清洗,对同步数据进行无效数据过滤及同类数据的进行融合。
(3)监测数据归集单元
监测数据归集单元基于全链路监测工具对业务中台服务监测数据的处理,完成监测数据统一归集、统一入库,为业务中台运营工作提供数据支持。
(八)全量服务信息管理模块
针对云平台当前服务脉络不清晰,暂时无法对四大业务中台规划的业务中心、提供的业务服务、支撑的外部应用、运行的服务实例等核心对象进行统一的管理及展示这一问题,采用全量服务信息管理模块对业务中台内此类的核心对象,进行统一纳管,构建彼此间的层级关系,实现关键对象的服务管理功能及链路构建,融合关联服务运行全链路数据,有效支撑业务中台服务的统一管理以及服务质量优化等业务工作;同时对外提供查询服务,支撑后续相关的数据分析需求。
(1)中台/系统信息管理单元
中台/系统信息单元用于对财务管理中台、项目管理中台、电网资源业务中台、客户服务业务中台等4大业务中台、云上业务系统基础信息进行维护与管理,实现列表形式展现。具体包括以下组件:1、查询:按照名称,模糊查询中台或系统名称。2、重置:重置查询条件,展示全部中台信息。3、新增:点击新增按钮弹出编辑框,手动输入中台及业务系统名称及其相关描述,维护完成后点击保存按钮完成数据维护。4、删除:选中中台,点击删除按钮进行删除,提示成功后页面自动刷新。5、编辑:选中中台,点击编辑,弹出编辑框,更新中台或系统名称或描述信息,修改完毕后点击保存按钮完成数据更新。6、导入模板下载:点击导入按钮,在导入窗内下载数据导入模板,模板格式为EXCEL格式。7、导入:将模板信息维护完成后,在导入窗内点击选择按钮,将模板内容进行加载,然后点击上传按钮,完成数据的最终导入和存储。8、导出:将页面所示数据,包含分页数据,以EXCEL格式导出,实现本地存储。
(2)业务中心信息管理单元
业务中心信息管理单元用于对财务管理中台、项目管理中台、电网资源业务中台、客户服务业务中台等4大业务中台业务中心信息进行维护与管理。以财务管理中台业务中心管理为例,用于完成财务管理中台业务中心的服务基本信息维护管理,实现列表形式展现;具体包括以下组件:1、查询:按照中台中心名称,模糊查询中台下中心信息。2、重置:重置查询条件。3、新增:点击新增按钮弹出编辑框,手动输入中台下中心及其相关描述,维护完成后点击保存按钮完成数据维护。4、删除:选中删除项,点击删除按钮进行删除,提示成功后页面自动刷新。5、编辑:选中编辑项,点击编辑,弹出编辑框,更新中台下中心或相关描述,修改完成后点击保存按钮完成数据更新。6、导入模板下载:点击导入按钮,在导入窗内下载数据导入模板,模板格式为EXCEL格式。7、导入:将模板信息维护完成后,在导入窗内点击选择按钮,将模板内容进行加载,然后点击上传按钮,完成数据的最终导入和存储。8、导出:将页面所示数据,包含分页数据,以EXCEL格式导出,实现本地存储。项目管理中台业务中心管理、电网资源业务中台业务中心管理、客户服务业务中台业务中心管理与财务管理中台业务中心管理的功能组件类似。
(3)业务信息管理单元
业务信息管理单元用于对财务管理中台、项目管理中台、电网资源业务中台、客户服务业务中台等4大业务中台、云上业务系统业务信息进行维护与管理。同样以财务管理中台业务管理为例,目的在于完成财务中台逻辑业务信息的维护管理,实现列表形式展现;具体包括以下组件:1、查询:按照业务名称,模糊查询定位业务信息。2、重置:重置查询条件3、新增:点击新增按钮弹出编辑框,手动输入中心下业务信息及其相关描述,维护完成后点击保存按钮完成数据维护。4、删除:选中删除项,点击删除按钮进行删除,提示成功后页面自动刷新。5、编辑:选中编辑项,点击编辑,弹出编辑框,更新中心下业务信息或描述,修改完成后点击保存按钮完成数据更新。6、导入模板下载:点击导入按钮,在导入窗内下载数据导入模板,模板格式为EXCEL格式。7、导入:将模板信息维护完成后,在导入窗内点击选择按钮,将模板内容进行加载,然后点击上传按钮,完成数据的最终导入和存储。8、导出:将页面所示数据,包含分页数据,以EXCEL格式导出,实现本地存储。项目管理中台业务管理、电网资源业务中台业务管理、客户服务业务中台业务管理、云上业务系统业务管理与财务管理中台业务管理的组件结构相似。
(4)微服务信息管理单元
微服务信息管理单元用于对财务管理中台、项目管理中台、电网资源业务中台、客户服务业务中台等4大业务中台、云上业务系统微服务信息进行维护与管理。同样以财务管理中台微服务管理为例,用于完成财务中台服务基本信息的维护管理,实现列表形式展现。具体包括以下组件:1、查询:按照名称,模糊查询业务中台或云上业务系统服务信息。2、重置:重置查询条件,展示业务中台或云上业务系统服务信息。3、新增:点击新增按钮弹出编辑框,手动输入业务中台或云上业务系统服务信息及其相关描述,维护完成后点击保存按钮完成数据维护。4、删除:选中删除项,点击删除按钮进行删除,提示成功后页面自动刷新。5、编辑:选中编辑项,点击编辑,弹出编辑框,更新业务中台或云上业务系统服务信息或描述,修改完成后点击保存按钮完成数据更新。6、导入模板下载:点击导入按钮,在导入窗内下载数据导入模板,模板格式为EXCEL格式。7、导入:将模板信息维护完成后,在导入窗内点击选择按钮,将模板内容进行加载,然后点击上传按钮,完成数据的最终导入和存储。8、导出:将页面所示数据,包含分页数据,以EXCEL格式导出,实现本地存储。项目管理中台微服务信息、电网资源业务中台微服务信息、客户服务业务中台微服务信息、云上业务系统微服务信息与财务管理中台微服务信息的功能组件相似。
(5)服务API信息管理单元
服务API信息管理单元用于对财务管理中台、项目管理中台、电网资源业务中台、客户服务业务中台等4大业务中台、云上业务系统服务API信息进行维护与管理。以财务管理中台服务API信息管理为例,目的在于完成财务中台API基本信息的维护管理,实现列表形式展现;具体包括以下组件:1、查询:按照名称,模糊查询服务API信息。2、重置:重置查询条件,展示服务API全部信息。3、新增:点击新增按钮弹出编辑框,手动输入服务名称、API信息及其相关描述,维护完成后点击保存按钮完成数据维护。4、删除:选中删除项,点击删除按钮进行删除,提示成功后页面自动刷新。5、编辑:选中编辑项,点击编辑,弹出编辑框,更新服务名称、API信息或相关描述,更新完成后点击保存按钮完成数据更新。6、导入模板下载:点击导入按钮,在导入窗内下载数据导入模板,模板格式为EXCEL格式。7、导入:将模板信息维护完成后,在导入窗内点击选择按钮,将模板内容进行加载,然后点击上传按钮,完成数据的最终导入和存储。8、导出:将页面所示数据,包含分页数据,以EXCEL格式导出,实现本地存储。项目管理中台服务API信息管理、电网资源业务中台服务API信息管理、客户服务业务中台服务API信息管理以及云上业务系统服务API信息管理的组件构成与财务管理中台服务API信息管理相似。
(6)应用信息管理单元
应用信息管理单元用于对财务管理中台、项目管理中台、电网资源业务中台、客户服务业务中台等4大业务中台应用信息进行维护与管理。以财务管理中台应用信息管理为例,用于完成财务中台支撑应用基本信息的维护管理,实现列表形式展现;具体包括以下功能组件:1、查询:按照名称,模糊查询业务中台支撑应用信息。2、重置:重置查询条件,展示业务中台支撑应用信息。3、新增:点击新增按钮弹出编辑框,手动输入应用名称、应用服务信息及服务相关描述,维护完成后点击保存按钮完成数据维护。4、删除:选中删除项,点击删除按钮进行删除,提示成功后页面自动刷新。5、编辑:选中编辑项,点击编辑,弹出编辑框,更新业务中台支撑应用名称、应用服务信息及服务相关描述,修改完成后点击保存按钮完成数据更新。6、导入模板下载:点击导入按钮,在导入窗内下载数据导入模板,模板格式为EXCEL格式。7、导入:将模板信息维护完成后,在导入窗内点击选择按钮,将模板内容进行加载,然后点击上传按钮,完成数据的最终导入和存储。8、导出:将页面所示数据,包含分页数据,以EXCEL格式导出,实现本地存储。其他几类中台与财务管理中台相似。
(7)中台与业务中心关系管理单元
中台与业务中心关系管理单元用于对财务管理中台、项目管理中台、电网资源业务中台、客户服务业务中台等4大业务中台与业务中心的关系进行维护,并采用列表形式展现分析。以财务中台与业务中心关系维护为例,用于完成财务中台与业务中心的关系维护,实现列表形式展现分析;具体包括以下功能组件:1、查询:按照中台名称模糊查询业务中台所包含的业务中心清单信息。2、重置:重置查询条件,展示业务中台业务中心全部信息。3、新增关系:点击新增关系按钮弹出关联维护框,自动获取所有中台业务中心列表信息,选择相应业务中心与对应中台进行关联。4、删除:选中删除项,点击删除按钮进行删除,删除中台与业务中心之间关联关系,提示成功后页面自动刷新。5、导入模板下载:点击导入按钮,在导入窗内下载数据导入模板,模板格式为EXCEL格式。6、导入:将模板信息维护完成后,在导入窗内点击选择按钮,将模板内容进行加载,然后点击上传按钮,完成数据的最终导入和存储。7、导出:将页面所示数据,包含分页数据,以EXCEL格式导出,实现本地存储。在完成中台与业务中心关联时,形成中台中心列表弹框,并持续按照业务中心名称模糊查询。
(8)业务中心与业务关系管理单元
业务中心与业务关系管理单元用于对财务管理中台、项目管理中台、电网资源业务中台、客户服务业务中台等4大业务中台与业务中心与中台业务信息关系进行维护,并采用列表形式展现分析。以财务中台业务中心与业务关系维护为例,目的在于完成财务中台业务中心与中台业务信息关系维护,实现列表形式展现分析;具体包括以下组件:1、查询:按照业务中心名称模糊查询业务中心所包含的业务清单信息。2、重置:重置查询条件,展示业务中台业务全部信息。3、新增关系:点击新增关系按钮弹出关联维护框,自动获取所有中台业务列表信息,选择相应业务信息与对应业务中心进行关联。4、删除:选中删除项,点击删除按钮进行删除,删除业务与业务中心之间关联关系,提示成功后页面自动刷新。5、导入模板下载:点击导入按钮,在导入窗内下载数据导入模板,模板格式为EXCEL格式。6、导入:将模板信息维护完成后,在导入窗内点击选择按钮,将模板内容进行加载,然后点击上传按钮,完成数据的最终导入和存储。7、导出:将页面所示数据,包含分页数据,以EXCEL格式导出,实现本地存储。在完成业务与业务中心关联时,形成中台业务列表弹框,并支持按照业务信息模糊查询。
(9)业务与服务关系管理单元
业务与服务关系管理单元用于对财务管理中台、项目管理中台、电网资源业务中台、客户服务业务中台等4大业务中台与中台服务信息关系进行维护,并采用列表形式展现分析。以财务中台业务与服务关系维护为例,目的在于完成财务中台业务与中台服务信息关系维护,实现列表形式展现分析。具体包括以下功能组件:1、查询:按照中台服务名称模糊查询中台业务所包含的服务信息。2、重置:重置查询条件,展示业务中台服务全部信息。3、新增关系:点击新增关系按钮弹出关联维护框,自动获取所有中台服务列表信息,选择相应服务信息与对应中台业务进行关联。4、删除:选中删除项,点击删除按钮进行删除,删除中台业务与中台服务之间关联关系,提示成功后页面自动刷新。5、导入模板下载:点击导入按钮,在导入窗内下载数据导入模板,模板格式为EXCEL格式。6、导入:将模板信息维护完成后,在导入窗内点击选择按钮,将模板内容进行加载,然后点击上传按钮,完成数据的最终导入和存储。7、导出:将页面所示数据,包含分页数据,以EXCEL格式导出,实现本地存储。在完成服务与中台业务关联时,形成中台服务信息列表弹框,并支持按照服务信息模糊查询。
(10)业务与微服务关系管理单元
业务与微服务关系管理单元用于对财务管理中台、项目管理中台、电网资源业务中台、客户服务业务中台等4大业务中台与中台微服务信息关系进行维护,并采用列表形式展现分析。以财务中台业务与微服务关系维护为例,目的在于完成财务中台业务与中台微服务信息关系维护,实现列表形式展现分析。具体包括以下功能组件:1、查询:按照中台业务信息模糊查询中台业务信息所包含的微服务信息。2、重置:重置查询条件,展示业务中台微服务全部信息。3、新增关系:点击新增关系按钮弹出关联维护框,自动获取所有中台微服务列表信息,选择相应微服务信息与对应中台业务进行关联。4、删除:选中删除项,点击删除按钮进行删除,删除中台业务与中台微服务之间关联关系,提示成功后页面自动刷新。5、导入模板下载:点击导入按钮,在导入窗内下载数据导入模板,模板格式为EXCEL格式。6、导入:将模板信息维护完成后,在导入窗内点击选择按钮,将模板内容进行加载,然后点击上传按钮,完成数据的最终导入和存储。7、导出:将页面所示数据,包含分页数据,以EXCEL格式导出,实现本地存储。在完成微服务与中台业务关联时,形成中台微服务信息列表弹框,并支持按照微服务信息模糊查询。
(11)业务与应用服务关系管理单元
业务与应用服务关系管理单元对财务管理中台、项目管理中台、电网资源业务中台、客户服务业务中台等4大业务中台与支撑应用服务信息关系进行维护,并采用列表形式展现分析。以财务中台业务与应用服务关系维护为例,目的在于完成财务中台业务与支撑应用服务信息关系维护,实现列表形式展现分析;具体包括以下功能组件:1、查询:按照业务信息模糊查询中台业务所支撑所以应用及应用服务信息。2、重置:重置查询条件,展示业务与应用服务之间关系信息。3、新增关系:点击新增关系按钮弹出关联维护框,自动获取所有应用服务列表信息,选择相应应用服务信息与对应中台业务进行关联。4、删除:选中删除项,点击删除按钮进行删除,删除中台业务与应用服务之间关联关系,提示成功后页面自动刷新。5、导入模板下载:点击导入按钮,在导入窗内下载数据导入模板,模板格式为EXCEL格式。6、导入:将模板信息维护完成后,在导入窗内点击选择按钮,将模板内容进行加载,然后点击上传按钮,完成数据的最终导入和存储。7、导出:将页面所示数据,包含分页数据,以EXCEL格式导出,实现本地存储。在完成应用服务与中台业务关联时,形成中台应用服务信息列表弹框,并支持按照应用名称、服务信息模糊查询。
(九)服务链路数据采集模块
针对目前各子公司云上分别采用阿里ARMS及华为APM两种技术路线实现微服务的全链路监测,使得监测数据模型、指标不一致,无法满足业务实际监测需求等问题,服务链路数据采集模块基于阿里ARMS与华为APM采集服务,对全链路监测指标进行统一采集与处理,并结合业务实际监测需求,对指标进行融合处理,完成业务、应用、接口、资源等多层监测对象的关联,形成统一的指标体系与监测服务,支撑中台服务及业务的全链路监测。
(1)链路基础数据采集单元
链路基础数据采集单元分别基于阿里ARMS组件和华为APM组件,在各服务上进行统一的监测,对一次链路的数据进行统一的采集处理和存储,将同一条链路上的所有的服务调用和第三方组件调用进行关联,记录每一个链路节点、链路层级的信息、记录链路调用的指标数据,标记链路中发生的错误信息、记录链路中的堆栈信息,用于完整描述一条调用链路的数据基础;具体地,通过链路探针及对接集成监测服务,分别对不同国网云下业务中台各微服务调用链路的数据、不同国网云下业务中台各微服务接口的调用链路数据、不同国网云下业务中台各服务所在服务器资源使用用情况统计指标进行实时采集。
(2)告警数据采集单元
告警数据采集单元分别基于阿里ARMS组件和华为APM组件,集成采集各服务告警规则及告警数据,利用监测组件的告警服务,对业务中台各微服务在云监测组件中的告警规则及告警内容进行采集,实现告警数据的统一采集处理与存储。
(3)统计数据采集单元
统计数据采集单元分别基于阿里ARMS组件和华为APM组件,按照服务应用、服务接口、服务资源、数据库等不同维度统计数据采集存储。具体地,通过链路探针及对接集成监测服务,分别对以下数据进行采集:不同国网云下业务中台各微服务的调用请求数、调用错误数以及平均耗时等统计数据;不同国网云下业务中台各服务接口调用情况统计指标;不同国网云下各微服务运行占用资源使用情况统计数据等等。
(4)采集数据融合分析单元
采集数据融合分析单元基于四大业务中台的相关服务信息及构建的基础监测能力,抽象编排业务场景,对业务服务、微服务、告警数据、业务中台、业务中心、业务服务等关键对象与采集监测数据进行关联融合。在此基础上,结合运营运维需求,各监测指标进一步进行加工处理,支撑链路横向与纵向贯通监测。此处的基础监测能力分为服务发现能力、基础监控数据采集和存储、阿里和华为数据融合三部分,具体包括:已经构建好的资源、服务、性能、数据库、网络以及融合阿里和华为apm形成监控数据的能力。
优选的,本发明还能够基于具体的业务中台对基础监测能力再次进行拆分,如图2和图3所示,服务接口被调用次数是基础监测能力,本发明可以将财务中台服务通断分析结果拆分成财务中台服务规模分析结果、财务中台服务效率分析结果和财务中台健康状态分析结果,其中,服务接口被调用错误数查询结果放在健康分析结果里,服务接口被调用次数查询结果放在效率分析结果里。
采集数据融合分析单元具体包括以下组件:1、业务服务模型与全链路监测数据关联融合组件,用于基于业务服务数据信息管理维护的结果信息及构建的基础监测能力,抽象编排业务场景,实现业务场景的监测;2、微服务模型与全链路监测数据关联融合组件,用于基于业务服务数据信息管理维护的结果信息及构建的基础监测能力,与微服务运行全链路监测数据融合关联融合处理;3、告警关联分析组件,用于通过集成云平台全链路监测服务,关联融合告警数据与服务数据,按照业务需求,定义并标识错误服务;同时对告警数据按照不同维度统一,支撑实现业务与服务的健康状态评估;4、错误范围分析组件,用于基于调用链路依赖实现错误微服务或者微服务组件的故障业务影响范围分析,协助运维人员迅速恢复相关业务,降低服务错误的业务影响;5、服务监测指标加工处理组件,用于结合业务需求对链路采集数据进行加工处理,制定统一的指标计算规则,实现云上四大业务中台所有微服务的运行全链路指标统一构建,支撑实现业务中台服务的监测与分析;6、服务接口监测指标加工处理用于,用于结合业务需求对接口相关采集的链路及统计指标数据进行加工处理,按照统一指标计算规则,实现不同国网云上四大业务中台所有微服务接口的指标统一构建,支撑业务中台服务接口的监测与分析;7、业务服务监测指标加工处理组件,用于结合业务需求对业务服务采集的监测数据进行加工处理,按照统一指标计算规则,实现不同国网云上四大业务中台业务服务的指标统一构建,支撑业务服务的监测与分析;8、业务中心监测指标加工处理组件,用于结合业务需求对业务中心相关的采集监测数据进行加工处理,按照统一指标计算规则,实现不同国网云上四大业务中台业务中心的指标统一构建,支撑业务中心的监测与分析;9、业务中台监测指标加工处理组件,用于结合业务需求对业务中台相关的采集监测数据进行加工处理,按照统一指标计算规则,实现不同国网云上四大业务中台的指标统一构建,支撑业务中台的监测与分析。
如图4所示,将阿里和华为的服务存储数据,统一采集、融合、分析,进行二次存储。由于采集的指标过多、业务耦合大、复杂度较高,本发明设定了统一的指标规则,如图5所示,包括告警、接入监控管理、质量管理、api接口、微服务、数据库、服务实例、方法信息、外部调用、拓扑关系图等等。图5中,原始采集指标为阿里和华为云监控数据,二次加工指标为融合后数据,通过原始的采集、归类、存储功能实现。
(十)服务两级监测模块
图4为本发明实施例的二级部署结构图。为加快数字化转型,推进数字化支撑保障体系强化工程中业务中台服务监测能力提升,开展业务中台服务两级监测,以保障业务中台服务稳定运行,提升业务中台服务运营质量。服务两级监测模块的功能包括:数据汇聚:完成各单位业务中台两级监测数据总部侧汇聚;数据计算处理:依托总部侧各单位两级监测汇聚数据,实现单位间、服务间、支撑应用情况等方面开展数据处理工作,并完成数据封装,提供调用服务;数据展示:基于两级监测数据计算处理结果,完成各单位两级监测数据可视化分析展现。
(十一)服务两级监测数据报表统计模块
服务两级监测数据报表统计模块用于对各单位间电网资源中台、客户服务中台微服务数、服务(API)数及支撑应用数进行统计分析。具体地,按照时间维度,对各单位间电网资源中台、客户服务中台微服务调用次数、活跃微服务数、僵尸微服务数进行对比分析;按照时间维度,完成电网资源中台、客户服务中台服务支撑各应用调用次数对比分析;基于中台服务应用情况、通断情况及支撑业务应用情况等维度,分析业务中台实际应用情况,并导出形成业务中台服务应用监测分析报告,实现服务监测成果对外共享,支撑业务应用分析需求,引导中台服务能力提升。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种基于电网业务的统一应用监测平台,其特征在于,所述统一应用监测平台用于对客户服务业务中台、电网资源业务中台、财务管理业务中台、项目管理业务中台这四大业务中台进行监测;
所述统一应用监测平台包括采集层、数据层、服务层和展现层;
所述采集层通过阿里云ARMS、华为云APM组件完成业务中台及业务系统服务全链路监测数据采集、清洗和汇聚,并通过WebService接口服务与数据层集成,实现数据的交互;
所述服务层用于基于数据层构建得到中台业务、服务、支撑应用情况这三者之间的映射关系,同时对二级部署业务中台的服务应用情况及其对业务影响进行监测分析和两级监测数据贯通,两级监测数据是指总部级监测数据和子公司级监测数据;
所述服务层包括服务调用链路构建模块、服务通断分析模块、服务集中告警模块、服务错误分析模块、服务通断影响范围分析模块、全链路监测指标体系模块、服务链路数据共享模块、全量服务信息管理模块和服务链路数据采集模块;
所述服务调用链路构建模块用于基于项目管理业务中台、财务管理业务中台、电网资源业务中台、客户服务业务中台这四大中台的微服务和服务API基础信息,自动发现并搭建各中台服务调用链路关系,并结合图谱技术,构建4大业务中台、中台下的各中心,各中心下部署的各项微服务、服务API及其对应支撑的业务应用之间的链路关系;
所述服务通断分析模块利用监控数据、资源数据,对业务运营状态、系统健康状态、以及资源使用情况进行分析,并通过展示层进行可视化的展示;
所述服务集中告警模块对从云平台接收到的告警事件进行标准化处理,提取并翻译告警信息以形成相应的结构化信息,并对处理后的告警信息按照业务类别和重要程度进行分类和分级处理;
所述服务错误分析模块基于服务调用错误和服务代码错误两个维度对业务中台服务进行错误分析;
所述服务通断影响范围分析模块通过纵向及横向监控能力,当服务出现错误时,结合全链路服务监测能力,构建组件关联关系以及业务服务的上下游关系,分析判断业务错误的影响范围,通知相关业务,以及协助快速定位错误;
所述全链路监测指标体系模块依据业务监测需求,建立包括业务、应用、云服务、云平台、基础设施云在内的全链路监测指标体系,用于业务运营监测及系统运行监测工作;
所述服务链路数据共享模块用于开放基于业务中台共享的服务全链路监测全量应用指标数据源,提供共享数据接口或数据封装,通过报表中心,为不同操作水平、不同期望目标、多层次业务人员提供中台运营数据自定义维度、自定义颗粒度分析展示的多维自助分析能力;
所述全量服务信息管理模块针对无法对四大业务中台规划的业务中心、提供的业务服务、支撑的外部应用、运行的服务实例进行统一管理及展示,构建彼此间的层级关系,融合关联服务运行全链路数据;
所述服务链路数据采集模块分别采用阿里ARMS及华为APM两种技术路线实现各子公司云上微服务的全链路监测,并结合业务实际监测需求,对指标进行融合处理,完成业务、应用、接口、资源多层监测对象的关联,形成统一的指标体系与监测服务,支撑中台服务及业务的全链路监测;
所述展现层通过接入层与服务层实现数据交互,展现层基于vue 框架构建,对业务中台及云上业务系统服务全链路数据进行可视化及图表分析处理。
2.根据权利要求1所述的基于电网业务的统一应用监测平台,其特征在于,所述服务调用链路构建模块包括业务中台与业务中心关系自动构建单元、业务中心与业务服务关系自动构建单元、业务服务与微服务关系自动构建单元和微服务与接口关系自动构建单元;
所述业务中台与业务中心关系自动构建单元根据各业务中台与业务中心运行调用链路采集数据及对应的服务模型信息,按照业务中台与业务中心所规定的命名规则自动模糊匹配中台与中心的层级关系,对业务中台与业务中心关系图谱进行自动化构建;
所述业务中心与业务服务关系自动构建单元根据业务中台各微服务调用链路采集数据以及业务服务信息,按照关键接口URL信息自动构建微服务与业务服务之间的关联关系,同时结合业务中心与微服务关系,对业务中心与业务服务关系图谱进行自动化构建;
所述业务服务与微服务关系自动构建单元根据业务中台下各业务服务模型中URL信息与微服务被调用所采集链路信息中的接口地址数据,对数据进行关联分析处理,自动匹配业务服务与各微服务实例的关系,对各业务中心与业务服务关系图谱进行自动化构建;
所述微服务与接口关系自动构建单元根据业务中台内各微服务调用链路中的接口URL及微服务相关信息,通过去重、合并、筛选计算处理,自动构建业务中台内各微服务与服务接口的关系,对中台微服务与服务接口关系图谱进行自动化构建。
3.根据权利要求2所述的基于电网业务的统一应用监测平台,其特征在于,所述服务调用链路构建模块还包括微服务间调用链路构建及统计分析单元、业务中台调用链路构建及统计单元、中心调用链路构建及链路分析单元、业务服务调用链路统计分析单元、业务应用支撑情况统计分析单元、服务应用统计分析单元、中台运营分析单元、中心运营分析单元和微服务运营分析单元;
所述微服务间调用链路构建及统计分析单元根据服务调用链路数据,自动构建微服务之间的调用链路关系,并通过搜集处理分析调用链路数据,遵照微服务监测指标模型及模型算法规则,统计计算包含服务总数、服务累计调用次数、正常服务数、错误服务数、受影响服务数的指标内容;
所述业务中台调用链路构建及统计分析单元根据微服务间的调用链路关系,结合业务中台与微服务之间的关系图谱,自动构建业务中台间的调用链路关系,并基于微服务调用链路数据以及中台与微服务之间的业务关系,对业务中台之间的调用情况进行统计分析;
所述中心调用链路构建及链路分析单元根据微服务间的调用链路关系,结合业务中心与微服务之间的关系图谱,自动构建中心间的调用链路关系;并基于微服务调用链路数据以及中台与微服务之间的业务关系,对业务中台之间的调用情况进行统计分析;
所述业务服务调用链路统计分析单元基于微服务调用链路数据,结合业务服务与接口的关系图谱,对业务服务的调用情况进行统计分析;
所述业务应用支撑情况统计分析单元用于统计四大中台服务支撑应用情况,包含支撑系统数、受影响系统数、服务支撑的业务应用数、受影响的业务应用数、跨专业调用的服务应用数;
所述服务应用统计分析单元分别统计各业务中台服务应用情况,包含服务次数、服务累计调用次数、正常服务数、错误服务数、受影响服务数,针对客户服务中台、电网资源中心分别统计展示其总部和子公司支撑系统数柱状图和支撑应用数柱状图,并将当日服务调用数按照小时维度实现折线趋势分析;
所述中台运营分析单元以包括财务中台、项目中台、电网资源业务中台、客户服务业务中台在内的单一中台为统计维度,对单一中台整体健康评分、访问分析、热点服务、服务告警信统计、服务告警信息、服务错误信息、服务应用统计及中台链路展示方面进行统计分析;
所述中心运营分析单元以单一中台的服务中心为统计维度完成中心服务应用情况统计分析,从服务中心整体基本应用信息、请求服务质量情况、请求量和响应时间趋势分析、请求统计列表、服务告警信统计、服务告警信息、服务错误信息及服务链路展示方面对服务中心整体应用情况进行可视化分析;
所述微服务运营分析单元针对单一中台的单个业务信息完成服务应用情况统计分析,从服务调用次数及趋势图、告警次数、错误次数、平均响应时间及趋势图、服务错误列表信息、服务上下游服务或应用支撑链路关系图进行可视化分析展示。
4.根据权利要求1所述的基于电网业务的统一应用监测平台,其特征在于,所述服务通断分析模块包括业务中台系统整体的服务通断分析单元、业务中台的服务通断分析单元、特定中心/应用的服务通断分析单元、特定服务的服务通断分析单元和数据库的服务通断分析单元;
所述业务中台系统整体的服务通断分析单元从业务中台系统整体的服务效率、运行状态和服务错误三个维度进行服务通断分析,基于云上全部业务中台,分别从提供服务的服务活跃度、产生告警的数量以及告警类型分布和产生错误的数量这三个视角,对云上业务中台服务的整体服务效率状态、业务中台服务整体运行稳定性状态和业务中台服务的整体代码服务质量进行监控;
所述业务中台的服务通断分析单元从业务中台的服务规模、服务效率、健康状况、运行状态、服务错误这五个维度进行服务通断分析;
所述特定中心/应用的服务通断分析单元从特定中心/应用提供服务的服务效率、健康状况、运行状态、服务错误这四个维度进行服务通断分析;
所述特定服务的服务通断分析单元从特定服务的服务调用健康状态、服务接口调用健康状态、服务吞吐率、服务告警、服务实例资源状态率这几个维度进行服务通断综合分析;
所述数据库的服务通断分析单元基于数据库SQL请求数量、数据库SQL请求错误数量、数据库SQL请求平均响应时长、数据库慢SQL数量、数据库慢SQL百分比这几个数据库监控指标数值进行数据库的服务通断分析判断。
5.根据权利要求1所述的基于电网业务的统一应用监测平台,其特征在于,所述服务集中告警模块包括告警规则制定单元和告警分析展示单元;
所述告警规则制定单元通过规则的输入,对不同监控工具告警进行汇聚、收敛、分组,与事务监控、微服务监控、PaaS、IaaS多个监控事件进行对接,实现统一的告警事件检索和告警生命周期管理,对监控的事务调用、微服务、微服务基础资源以及微服务依赖组件的状态进行阈值告警触发,以及根据全量服务信息,向相应的管理人员进行告警通知;
所述告警分析展示单元包括告警趋势统计组件、告警列表统计组件和告警查询组件;所述告警趋势统计组件用于以单一中台或云上业务系统为主线,结合时间维度,按照服务告警等级实现告警数量的趋势统计分析目标;所述告警列表统计组件用于以单一中台或云上业务系统为主线,结合时间维度,按照服务告警等级实现告警事件基本信息进行列表统计目标;所述告警查询组件用于提供实时告警查询、分组告警查询、历史告警查询、被屏蔽告警查询的功能。
6.根据权利要求1所述的基于电网业务的统一应用监测平台,其特征在于,所述服务错误分析模块包括服务代码错误分析单元和服务调用错误分析单元;
所述服务代码错误分析单元包含错误历史趋势分析组件和错误信息列表展示组件;所述错误历史趋势分析组件按照时间对应用系统微服务发生错误的次数进行历史趋势分析,所述错误信息列表展示组件对应用系统微服务产生的错误信息进行列表展示;
所述服务调用错误分析单元包含服务错误趋势分析组件、服务错误TOP5统计组件和服务错误信息列表统计组件,以单一中台或云上业务系统为主线,结合时间维度,分别对服务错误趋势、服务错误TOP5和服务错误信息列表进行统计分析和展示。
7.根据权利要求1所述的基于电网业务的统一应用监测平台,其特征在于,所述服务通断影响范围分析模块包括服务中断统计分析单元和服务故障影响范围分析单元;
所述服务中断统计分析单元包括业务中台服务中断统计组件、业务服务中断统计组件、业务中台支撑应用中断统计组件;所述业务中台服务中断统计组件统计四大中台服务运行中发生的通断情况,包含中断服务数、受影响服务数、受影响应用数及占比;所述业务服务中断统计组件统计业务中台中特定中心/应用所包含服务运行中发生的通断情况,包含中断服务数、受影响服务数、受影响应用数及占比;所述业务中台支撑应用中断统计组件统计展示中台下服务应用情况,包含服务数、支撑系统数、支撑应用数、中断服务数、受影响服务数、受影响系统数、受影响应用数;
所述服务故障影响范围分析单元在微服务发生故障时,对受影响的微服务和受影响的业务服务范围进行展现。
8.根据权利要求1所述的基于电网业务的统一应用监测平台,其特征在于,所述全链路监测指标体系模块包括指标体系标准规范构建单元、指标规划定义单元和指标维护管理单元;
所述指标体系标准规范构建单元根据业务监测需求,建立业务、应用、云服务、云平台、基础设施云全链路监测指标体系的标准和规范,包括指标的分类、指标的名称、指标的单位、指标的意义;所述指标规划定义单元根据业务监测的需求,确定和规范常用的指标,确定指标的名称、含义和单位;所述指标维护管理单元用于维护各业务中台服务、接口、数据库、服务资源多维度的指标,包括指标计算规则、业务含义元信息,以及提供对指标元信息的新增、修改、删除、导入、导出的功能。
9.根据权利要求1所述的基于电网业务的统一应用监测平台,其特征在于,所述服务链路数据采集模块包括链路基础数据采集单元、告警数据采集单元、统计数据采集单元和采集数据融合分析单元;
所述链路基础数据采集单元分别基于阿里ARMS组件和华为APM组件,在各服务上进行统一的监测,对一次链路的数据进行统一的采集处理和存储,将同一条链路上的所有的服务调用和第三方组件调用进行关联,记录每一个链路节点、链路层级的信息、记录链路调用的指标数据,标记链路中发生的错误信息、记录链路中的堆栈信息,用于完整描述一条调用链路的数据基础;
所述告警数据采集单元分别基于阿里ARMS组件和华为APM组件,集成采集各服务告警规则及告警数据,对告警数据进行统一采集处理与存储;
所述统计数据采集单元分别基于阿里ARMS组件和华为APM组件,按照服务应用、服务接口、服务资源、数据库不同维度统计数据采集存储;
所述采集数据融合分析单元基于四大业务中台的相关服务信息及构建的基础监测能力,抽象编排业务场景,对业务服务、微服务、告警数据、业务中台、业务中心、业务服务与采集监测数据进行关联融合;
所述采集数据融合分析单元包括业务服务模型与全链路监测数据关联融合组件、微服务模型与全链路监测数据关联融合组件、告警关联分析组件、错误范围分析组件、服务监测指标加工处理组件、服务接口监测指标加工处理组件、业务服务监测指标加工处理组件、业务中心监测指标加工处理组件和业务中台监测指标加工处理组件;
所述业务服务模型与全链路监测数据关联融合组件,用于基于业务服务数据信息管理维护的结果信息,抽象编排业务场景,对业务场景进行监测;所述微服务模型与全链路监测数据关联融合组件,将业务侧服务信息管理数据及与微服务运行全链路监测数据融合关联;所述告警关联分析组件,用于通过集成云平台全链路监测服务,关联融合告警数据与服务数据,按照业务需求,定义并标识错误服务,同时对告警数据按照不同维度统一,对业务与服务进行健康状态评估;所述错误范围分析组件,用于基于调用链路依赖对错误微服务或者微服务组件进行故障业务影响范围分析;所述服务监测指标加工处理组件,用于结合业务需求对链路采集数据进行加工处理,统一构建云上客户服务业务中台、电网资源业务中台、财务管理业务中台、项目管理业务中台这四大业务中台所有微服务的运行全链路指标;所述服务接口监测指标加工处理组件,用于结合业务需求对接口相关采集的链路及统计指标数据进行加工处理,统一构建不同国网云上四大业务中台所有微服务接口的指标;所述业务服务监测指标加工处理组件,用于结合业务需求对业务服务采集的监测数据进行加工处理,统一构建不同国网云上四大业务中台业务服务的指标;所述业务中心监测指标加工处理组件,用于结合业务需求对业务中心相关的采集监测数据进行加工处理,统一构建不同国网云上四大业务中台业务中心的指标;所述业务中台监测指标加工处理组件,用于结合业务需求对业务中台相关的采集监测数据进行加工处理,统一构建不同国网云上四大业务中台的指标。
10.根据权利要求1所述的基于电网业务的统一应用监测平台,其特征在于,所述总部和子公司采用二级部署方式,总部与子公司部署的统一应用监测平台架构相同,均独立部署,不涉及级联关系;
所述服务层包括服务两级监测模块和服务两级监测数据报表统计模块;
所述服务两级监测模块完成各单位业务中台两级监测数据总部侧汇聚,依托总部侧各单位两级监测汇聚数据,实现单位间、服务间、支撑应用情况开展数据处理工作,并完成数据封装,提供调用服务,基于两级监测数据计算处理结果,完成各单位两级监测数据可视化分析展现;
所述服务两级监测数据报表统计模块完成各单位间电网资源中台、客户服务中台微服务数、服务API数及支撑应用数的统计分析。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311213983.2A CN116961241B (zh) | 2023-09-20 | 2023-09-20 | 一种基于电网业务的统一应用监测平台 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311213983.2A CN116961241B (zh) | 2023-09-20 | 2023-09-20 | 一种基于电网业务的统一应用监测平台 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116961241A CN116961241A (zh) | 2023-10-27 |
CN116961241B true CN116961241B (zh) | 2023-12-05 |
Family
ID=88462479
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311213983.2A Active CN116961241B (zh) | 2023-09-20 | 2023-09-20 | 一种基于电网业务的统一应用监测平台 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116961241B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107196910A (zh) * | 2017-04-18 | 2017-09-22 | 国网山东省电力公司电力科学研究院 | 基于大数据分析的威胁预警监测系统、方法及部署架构 |
CN110489459A (zh) * | 2019-08-07 | 2019-11-22 | 国网安徽省电力有限公司 | 一种基于大数据平台的企业级业数融合数据分析系统 |
CN112350898A (zh) * | 2020-11-10 | 2021-02-09 | 安徽继远检验检测技术有限公司 | 一种微服务应用全链路性能实时监测系统及其检测方法 |
CN112565011A (zh) * | 2020-12-02 | 2021-03-26 | 国网信息通信产业集团有限公司 | 一种基于云平台的新型用电信息采集系统 |
CN113949155A (zh) * | 2021-09-17 | 2022-01-18 | 国网陕西省电力公司安康供电公司 | 一种具有实时监测功能的全景式电能质量监测系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040193476A1 (en) * | 2003-03-31 | 2004-09-30 | Aerdts Reinier J. | Data center analysis |
CN109636130A (zh) * | 2018-11-21 | 2019-04-16 | 北京域天科技有限公司 | 一种应急通信指挥管理系统 |
US11950151B2 (en) * | 2019-02-13 | 2024-04-02 | Apple Inc. | Self-organizing networks (SON) for mobility robustness optimization (MRO) and automatic network slice creation |
-
2023
- 2023-09-20 CN CN202311213983.2A patent/CN116961241B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107196910A (zh) * | 2017-04-18 | 2017-09-22 | 国网山东省电力公司电力科学研究院 | 基于大数据分析的威胁预警监测系统、方法及部署架构 |
CN110489459A (zh) * | 2019-08-07 | 2019-11-22 | 国网安徽省电力有限公司 | 一种基于大数据平台的企业级业数融合数据分析系统 |
CN112350898A (zh) * | 2020-11-10 | 2021-02-09 | 安徽继远检验检测技术有限公司 | 一种微服务应用全链路性能实时监测系统及其检测方法 |
CN112565011A (zh) * | 2020-12-02 | 2021-03-26 | 国网信息通信产业集团有限公司 | 一种基于云平台的新型用电信息采集系统 |
CN113949155A (zh) * | 2021-09-17 | 2022-01-18 | 国网陕西省电力公司安康供电公司 | 一种具有实时监测功能的全景式电能质量监测系统 |
Non-Patent Citations (1)
Title |
---|
运营监测平台建设与实践;陈广;;大众用电(S2);82-86 * |
Also Published As
Publication number | Publication date |
---|---|
CN116961241A (zh) | 2023-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110019396B (zh) | 一种基于分布式多维分析的数据分析系统及方法 | |
CN107315776B (zh) | 一种基于云计算的数据管理系统 | |
CN109471846A (zh) | 一种基于云日志分析的云上用户行为审计系统及方法 | |
CN107294764A (zh) | 智能监管方法和智能监管系统 | |
CN108197261A (zh) | 一种智慧交通操作系统 | |
CN108255712A (zh) | 数据系统的测试系统和测试方法 | |
CN109902072A (zh) | 一种日志处理系统 | |
CN106778253A (zh) | 基于大数据的威胁情景感知信息安全主动防御模型 | |
CN106371986A (zh) | 一种日志处理运维监控系统 | |
CN109254901B (zh) | 一种指标监测方法及系统 | |
CN107103064B (zh) | 数据统计方法及装置 | |
CN108399199A (zh) | 一种基于Spark的应用软件运行日志的收集与服务处理系统及方法 | |
CN103825755A (zh) | 电力二次系统的建模方法与系统 | |
US20110040805A1 (en) | Techniques for parallel business intelligence evaluation and management | |
CN113222625A (zh) | 一种农产品检测结果的多元异构数据模型及其构建方法 | |
CN113094385A (zh) | 一种基于软件定义开放工具集的数据共享融合平台及方法 | |
CN108182263A (zh) | 一种数据中心综合管理系统的数据存储方法 | |
CN113642299A (zh) | 一种基于电网统计报表一键生成的方法 | |
CN113505048A (zh) | 基于应用系统画像的统一监控平台及实现方法 | |
CN109032904A (zh) | 被监控、管理服务器及数据获取、分析方法和管理系统 | |
CN112052134A (zh) | 一种业务数据的监控方法及装置 | |
CN111125450A (zh) | 一种多层拓扑网络资源对象的管理方法 | |
CN117251414B (zh) | 一种基于异构技术的数据存储及处理方法 | |
CN116961241B (zh) | 一种基于电网业务的统一应用监测平台 | |
CN111414355A (zh) | 一种海上风电场数据监测存储系统及方法、装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |