CN114492877B - 一种业务系统的运维分析方法及装置 - Google Patents
一种业务系统的运维分析方法及装置 Download PDFInfo
- Publication number
- CN114492877B CN114492877B CN202210385620.6A CN202210385620A CN114492877B CN 114492877 B CN114492877 B CN 114492877B CN 202210385620 A CN202210385620 A CN 202210385620A CN 114492877 B CN114492877 B CN 114492877B
- Authority
- CN
- China
- Prior art keywords
- data
- maintenance
- service
- index
- maintenance data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012423 maintenance Methods 0.000 title claims abstract description 213
- 238000004458 analytical method Methods 0.000 title claims abstract description 40
- 238000012544 monitoring process Methods 0.000 claims abstract description 35
- 238000012545 processing Methods 0.000 claims abstract description 29
- 230000002159 abnormal effect Effects 0.000 claims abstract description 22
- 238000000034 method Methods 0.000 claims description 31
- 238000007726 management method Methods 0.000 claims description 19
- 238000011156 evaluation Methods 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 13
- 230000006399 behavior Effects 0.000 claims description 12
- 238000005206 flow analysis Methods 0.000 claims description 11
- 238000007781 pre-processing Methods 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 4
- 238000009960 carding Methods 0.000 claims description 3
- 238000013461 design Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000007670 refining Methods 0.000 claims description 3
- 230000008439 repair process Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 10
- 230000007423 decrease Effects 0.000 description 10
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000004141 dimensional analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3006—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3051—Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Mathematical Physics (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明公开了一种业务系统的运维分析方法及装置,该运维分析方法具体包括如下步骤:实时监控业务系统,收集监控到的业务数据和运维数据;对运维数据进行处理,形成运维数据源,并将运维数据源导入数据中台;对异常的业务数据进行预警,并采用数据中台进行分析处理;根据分析处理的结果,获取业务系统中存在故障的运维数据,并对故障的运维数据进行修复。本发明从业务视角出发,通过完善、多样化的数据指标体系,智能准确的完成业务系统运维分析。快速定位相应的告警点位和告警原因,这能够为企业IT系统运维工作节约大量的问题定位时间,大幅提升运维效率,降低运维成本。
Description
技术领域
本发明涉及业务系统运维数据处理领域,尤其涉及一种业务系统的运维分析方法及装置。
背景技术
随着企业数字化、云化的发展和推进,业务系统逐渐复杂,同时业务系统的数据来源也越来越多。而且,普遍存在部分数据质量偏低的情况。业务系统在运维中出现的故障都不再是某个单一的数据点造成的,对于频发的问题,一直缺少有效的综合定位分析方法和模型,无法进行有效、合理的数据治理。
如CN111722976A公开了基于智能运维的故障流程分析方法、装置及介质,获取设备的历史业务数据,构建告警对应的知识库;获取设备当前的告警数据,自动对告警数据进行多维度的关联分析,根据关联分析结果配知识库,获取对应的设备故障处理流程;根据设备故障处置流程向设备下发对应的操作流程。该方案的智能化判断及自动化故障处理的过程参照的数据指标种类和维度偏少,精准度不够,无法实现智能高效的根因分析。
因此,如何从业务视角出发,通过完善、多样化的数据指标体系,智能准确的完成业务系统运维分析成为本领域人员亟待解决的技术问题。
发明内容
本发明根据构建多维度的数据指标体系,运行业务系统运维分析方法,实现根因分析定位。其中多维度的数据指标之间相互关联、各个指标按照特定的框架组织起来,形成不同维度、不同类别数据之间的指标体系架构。
本发明提供了一种业务系统的运维分析方法,其特征在于,具体包括如下步骤:
实时监控业务系统,收集监控到的业务数据和运维数据;
对运维数据进行处理,形成运维数据源,并将运维数据源导入数据中台;
对异常的业务数据进行预警,并采用数据中台进行分析处理;
根据分析处理的结果,获取业务系统中存在故障的运维数据,并对故障的运维数据进行修复;
其中,实时监控业务系统包括基础监控、日志监控、应用性能监控、网络性能监控、网络流量分析、业务流量分析、配置管理及运维流量管理。
进一步的,对运维数据进行处理,形成运维数据源,具体包括:
对收集监控到的运维数据进行汇集,计算运维数据的指纹并进行保存;
对已保存的运维数据进行预处理,形成运维数据源;
其中,运维数据的类型包括主体标记数据、行为数据和关系数据;
对已保存的运维数据进行预处理,包括:
对业务系统中的主体外延多个类别的对外行为,形成主体标记数据与对外行为的行为数据之间的关联,并给出对应的关系数据;
根据给定的各应用场景,抽取涉及的运维数据,形成各应用场景的运维数据清单;
划分出数据分类,构建运维数据拓扑图,完成对已保存运维数据的预处理。
进一步的,划分出数据分类,构建运维数据拓扑图,具体包括:
对运维数据在业务系统中的流向进行分析梳理,完成业务系统流程的全遍历,实现对业务系统运维逻辑的全局分析;
参照各应用场景的监控和分析需求,自上而下梳理出抽象主题域,形成初始拓扑;
细化初始拓扑,形成各应用场景的子拓扑,完成运维数据拓扑图的构建;
其中,细化初始拓扑,形成各应用场景的子拓扑,包括:将自下向上形成的运维数据清单和自上向下的初始拓扑进行整合及验证校准,形成全面盘点的各应用场景的子拓扑。
进一步的,对异常的业务数据进行预警,并采用数据中台进行分析处理,具体包括:
根据设定的业务数据阈值范围,判别出异常的业务数据;
将异常的业务数据导入数据中台,根据预先建立的数据指标体系对导入的运维数据源进行分析推导;
其中,数据指标体系包括由业务数据组成的业务数据指标体系和由运维数据组成的运维数据指标体系,通过拓扑关系将业务数据指标体系与运维数据指标体系进行关联。
进一步的,建立数据指标体系,具体包括:
配置业务数据,形成业务指标拓扑图,建立业务数据指标体系;
根据业务数据指标体系和物理网络拓扑图,生成对象链路关系图;
设计对象链路关系图中各数据指标的权重,建立数据指标体系;
其中,根据业务数据指标体系和物理网络拓扑图,生成对象链路关系图,具体包括:
给定物理硬件与软件、应用、服务之间的关系;
将业务数据指标体系中每个业务数据指标节点关联到物理网络拓扑图中的运维数据指标节点,生成对象链路关系图。
进一步的,建立业务数据指标体系,具体包括:
确定业务数据指标的来源,明确一级业务数据指标、二级业务数据指标及三级业务数据指标,完成业务数据指标的设计;
采集业务数据,根据业务分组关系对业务数据进行配置,筛选过滤,形成业务指标拓扑图,建立业务数据指标体系;
其中,一级业务数据指标的类别为管理指标,二级业务数据指标和三级业务数据指标的类别为运营指标。
进一步的,设计对象链路关系图中各数据指标的权重,建立数据指标体系,具体包括:
确定每个业务数据指标对应的至少一个关键运维数据指标;
确定各关键运维数据指标的权重比值,将业务数据指标和各关键运维数据指标进行关联,形成业务数据指标的可用性评价关系,建立数据指标体系。
进一步的,将业务数据指标和各关键运维数据指标进行关联,形成业务数据指标的可用性评价关系,具体包括:
根据某业务数据指标单节点的可用性计算,进行递归计算,得到某业务数据指标多节点的可用性计算公式如下:
其中,Cn为某业务数据指标多节点的可用率,Rn为各个关键运维数据指标的不可用率,Lm为关联对象的不可用率,Mn为正常的关键运维数据指标的百分率数据,Pm为关联对象的数据,Kn和Km分别为关键运维数据指标的数据和关联对象的数据在Cn的可用性评价中所占的权重系数;
根据多节点的递归计算,建立业务数据指标的可用性评价关系。
进一步的,根据预先建立的数据指标体系对导入的运维数据源进行分析推导,具体包括:
延伸到多个应用场景中,进行某业务数据指标多节点的可用率统计,计算多应用场景某业务数据指标多节点的可用率计算公式如下:
其中,为某业务数据指标多节点多应用场景的可用率,为运维数据源中
各个关键运维数据指标多应用场景的不可用率,为运维数据源中关联对象多应用场景
的不可用率,为监控到的运维数据源中关键运维数据指标多应用场景的百分率数据,为运维数据源中关联对象多应用场景的数据,和分别为运维数据源中关键运
维数据指标多应用场景的数据和关联对象多应用场景的数据在的可用性评价中所占
的权重系数。
另一方面,本发明还提供一种采用上述的运维分析方法的装置,包括:
数据监控采集模块,被配置为实时监控业务系统,收集监控到的业务数据和运维数据;其中,实时监控业务系统包括基础监控、日志监控、应用性能监控、网络性能监控、网络流量分析、业务流量分析、配置管理及运维流量管理;
数据处理模块,被配置为对运维数据进行处理,形成运维数据源,以及对异常的业务数据进行预警;
数据中台,被配置为接收运维数据源及对异常的业务数据进行分析处理;
故障处理模块,被配置为根据分析处理的结果,获取业务系统中存在故障的运维数据,对故障的运维数据进行修复处理。
本发明提供的业务系统运维分析方法及装置,至少包括如下有益效果:
(1)在业务发展出现问题时能够快速定位问题所在。
(2)达成统一共识的数据指标体系,提供的数据具有很强的说服力,所提供的数据指标相较于传统人工统计,更准确更完整。
附图说明
图1为本发明提供的一种业务系统运维分析方法的流程图;
图2为本发明提供的某一实施例的预处理的流程图;
图3为本发明提供的某一实施例的构建运维数据拓扑图的流程图;
图4为本发明提供的某一实施例的建立数据指标体系的流程图;
图5为本发明提供的一种业务系统运维分析装置的示意图。
具体实施方式
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案做详细的说明。
参见图1所示,本发明实施例提供一种业务系统的运维分析方法,具体可以包括如下步骤:
实时监控业务系统,收集监控到的业务数据和运维数据;
对运维数据进行处理,形成运维数据源,并将运维数据源导入数据中台;
对异常的业务数据进行预警,并采用数据中台进行分析处理;
根据分析处理的结果,获取业务系统中存在故障的运维数据,并对故障的运维数据进行修复;
其中,实时监控业务系统具体包括基础监控、日志监控、应用性能监控、网络性能监控、网络流量分析、业务流量分析、配置管理及运维流量管理。
本实施例可以将业务系统运行过程中产生的业务数据和运维数据进行收集存储;可以在业务数据存在异常时,对其进行快速的分析处理,以定位造成业务数据异常的运维数据,从而实现对故障快速定位并修复的目的。即本实施例在业务发展出现问题时能够快速的定位问题所在,可以将不同维度的指标形成统一共识的数据指标体系,统一共识的数据指标体系进行分析处理后的数据具有很强的说服力,并且得到的数据指标相较于传统人工统计,更准确更完整。
在收集到运维数据时,由于运维数据来源于多个平台,因此,需要对运维数据进行处理,使其形成统一的运维数据源,具体可以包括以下步骤:
对收集监控到的运维数据进行汇集,计算运维数据的指纹并进行保存;
对已保存的运维数据进行预处理,形成运维数据源。
本实施例通过对多平台的运维数据汇集后进行预处理,使其生成可以供数据中台进行处理的统一数据源,从而实现仅采用一个数据中台即可对多个平台的数据进行分析处理。本实施例为了达到多平台的统一分析处理,主要体现于对数据的预处理,其中,运维数据的类型包括主体标记数据、行为数据和关系数据,参见图2所示,本实施例在对已保存的运维数据进行预处理时,具体可以包括:
针对业务系统中的主体外延多个类别的对外行为,形成主体标记数据与对外行为的行为数据之间的关联,并给出对应的关系数据;
根据给定的各应用场景,抽取涉及的运维数据,形成各应用场景的运维数据清单;
划分出数据分类,构建运维数据拓扑图,完成对已保存运维数据的预处理。
参见图3所示,本实施例在进行已保存运维数据的预处理过程中,划分出数据分类,构建运维数据拓扑图,具体可以包括:
对运维数据在业务系统中的流向进行分析梳理,完成业务系统流程的全遍历,实现对业务系统运维逻辑的全局分析;
参照各应用场景的监控和分析需求,自上而下梳理出抽象主题域,形成初始拓扑;
细化初始拓扑,形成各应用场景的子拓扑,完成运维数据拓扑图的构建;
其中,细化初始拓扑,形成各应用场景的子拓扑,包括:将自下向上形成的运维数据清单和自上向下的初始拓扑进行整合及验证校准,形成全面盘点的各应用场景的子拓扑。
本实施例在对异常的业务数据进行预警(例如,OA系统性能下降、收入下降等),并采用数据中台中进行分析处理,为了定位造成业务数据异常的运维数据,其具体可以包括以下步骤:
根据设定的业务数据阈值范围,判别出异常的业务数据;
将异常的业务数据导入数据中台,根据预先建立的数据指标体系对导入的运维数据源进行分析推导;
其中,数据指标体系包括由业务数据组成的业务数据指标体系和由运维数据组成的运维数据指标体系,通过拓扑关系将业务数据指标体系与运维数据指标体系进行关联。
参见图4所示,在上述过程中,建立数据指标体系,具体可以包括以下步骤:
配置业务数据,形成业务指标拓扑图,建立业务数据指标体系;
根据业务数据指标体系和物理网络拓扑图,生成对象链路关系图;
设计对象链路关系图中各数据指标的权重,建立数据指标体系。
本实施例在根据业务指标拓扑图建立业务数据指标体系时,其具体可以包括以下步骤:
确定业务数据指标的来源,明确一级业务数据指标、二级业务数据指标及三级业务数据指标,完成业务数据指标的设计;
采集业务数据,根据业务分组关系对业务数据进行配置,筛选过滤,形成业务指标拓扑图,建立业务数据指标体系;
其中,一级业务数据指标的类别为管理指标,二级业务数据指标和三级业务数据指标的类别为运营指标。
根据物理硬件(如主机、服务器)与软件、应用、服务之间的关系,在业务分组后的业务指标拓扑图上,加入软件、应用、服务等节点及链路,可以得到一张完整的运维数据指标体系的物理网络拓扑图,该物理网络拓扑图可以完整的表现IT系统的网络链路情况,精细到了软件、应用、服务层级。
本实施例的管理指标主要体现在关键、聚焦、管理视角,其是企业高层重点关注的指标,对企业做出战略决策有关键性作用。指标维度随管理角度的不同而不同。运营指标主要体现于分业务,分区域,分职责;根据运营的业务、区域、职责的不同,关注的维度不同。
本实施例在建立数据指标体系时,其实际过程是将运维数据与业务数据建立联系。而要构建一套好的数据指标体系,则需要明确数据指标体系中的数据指标、指标关系以及指标之间必须具备的特征。其中,
数据指标:一个指标通常需要从多维度来分析指标构成,这就要求指标与多维度关联支持多维度分析。
指标关系:指标体系就是将各个指标按照特定的框架组织起来,从不同维度梳理指标,梳理的过程也是对业务本质进行思考的过程。
指标之间必须具备以下特征:
特征一:上能指引高层领导把控业务整体方向,下能指导业务人员落地执行业务目标。
特征二:指标之间要形成闭环相互作用相互影响产生反馈,才能称之为体系,以数据定位问题,再反向作用运维获得和业务活动,最终形成数据驱动业务,甚至驱动客户运营的闭环。
本实施例根据业务数据指标体系和物理网络拓扑图,生成对象链路关系图,即将运维数据与业务数据建立联系时,其具体可以包括以下步骤:
给定物理硬件与软件、应用、服务之间的关系;
将业务数据指标体系中每个业务数据指标节点关联到物理网络拓扑图中的运维数据指标节点,生成对象链路关系图。
本实施例在将运维数据与业务数据建立联系后生成的对象链路关系图,通过设计对象链路关系图中各数据指标的权重,建立数据指标体系,其具体可以包括以下步骤:
确定每个业务数据指标对应的至少一个关键运维数据指标;
确定各关键运维数据指标的权重比值,将业务数据指标和各关键运维数据指标进行关联,形成业务数据指标的可用性评价关系,建立数据指标体系。
本实施例在将业务数据指标和各关键运维数据指标进行关联,并形成业务数据指标的可用性评价关系时,可用性通过可用率的数值进行表示,其具体可以包括:
根据某业务数据指标单节点的可用性计算,进行递归计算,得到某业务数据指标多节点的可用性计算公式如下:
其中,Cn为某业务数据指标多节点的可用率,Rn为各个关键运维数据指标的不可用率,Lm为关联对象的不可用率,Mn为正常的关键运维数据指标的百分率数据,Pm为关联对象的数据,Kn和Km分别为关键运维数据指标的数据和关联对象的数据在Cn的可用性评价中所占的权重系数;
根据多节点的递归计算,建立业务数据指标的可用性评价关系。
本实施例在实际应用场景中,根据预先建立的数据指标体系对导入的运维数据源进行分析推导,其具体可以包括:
在将其延伸至多个应用场景中,进行某业务数据指标多节点的可用率统计,计算多应用场景某业务数据指标多节点的可用率计算公式如下:
其中,为某业务数据指标多节点多应用场景的可用率,为运维数据源中
各个关键运维数据指标多应用场景的不可用率,为运维数据源中关联对象多应用场景
的不可用率,为监控到的运维数据源中关键运维数据指标多应用场景的百分率数据,为运维数据源中关联对象多应用场景的数据,和分别为运维数据源中关键运
维数据指标多应用场景的数据和关联对象多应用场景的数据在的可用性评价中所占
的权重系数。其中,权重系数主要依据运维人员的实际经验得到,当运行时间足够长时,采
用AI学习算法,可以自动给出该权重值,n为关键运维数据指标的节点数量,m为关联对象的
数量;i为场景类型的数量。
在数据指标体系中,每个节点都可以按照上述公式去计算其可用性,最终得到数据指标体系中各个层级节点的可用性指标。根据实际监控实时采集回来的数据,实时计算整个业务系统中各个节点的可用性,通过计算的可用率和建立的可用性评价关系进行快速定位相应的告警点位和告警原因,这能够为企业IT系统运维工作节约大量的问题定位时间,大幅提升运维效率,降低运维成本。
在实际应用场景中,本实施例以收入异常为例,具体的,业务数据的一级指标中收入下降,则通过实时计算整个业务系统中与收入下降该指标相关联的各节点的可用性;例如,通过计算得到,与收入下降该一级指标关联的二级指标中(包括销售收入、投资收入、广告收入等)的广告收入下降,三级指标中(包括线上广告收入、线下广告收入等)的线上广告收入下降,四级指标中(包括官网广告收入、APP广告收入、自媒体广告收入等)的APP广告收入下降,五级指标中(包括APP用户体验、APP用户量、APP访问量等)的APP访问量下降;再根据预先与APP访问量关联的运维数据指标进行快速定位相应的告警点位和告警原因。其中,通过与APP访问量关联的运维数据指标,可以根据不同运维数据的权重进行依次判别得到最终运维数据异常;例如,APP访问量下降由APP应用系统可用性下降导致,而与APP应用系统可用性关联的运维数据包括对应的交换机和交换机端口流量,通过对交换机和交换机端口流量进行依次判断,得到交换机端口流量减少,并通过对交换机端口流量关联的消息服务、后端服务和数据库进行判断,得到其导致收入下降的原因为消息服务。
参见图5所示,本发明实施例还提供一种业务系统运维分析装置,包括:
数据监控采集模块,被配置为实时监控业务系统,收集监控到的业务数据和运维数据;其中,实时监控业务系统包括基础监控、日志监控、应用性能监控、网络性能监控、网络流量分析、业务流量分析、配置管理及运维流量管理;
数据处理模块,被配置为对运维数据进行处理,形成运维数据源,以及对异常的业务数据进行预警;
数据中台,被配置为接收运维数据源及对异常的业务数据进行分析处理;
故障处理模块,被配置为根据分析处理的结果,获取业务系统中存在故障的运维数据,对故障的运维数据进行修复处理。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (8)
1.一种业务系统的运维分析方法,其特征在于,具体包括如下步骤:
实时监控业务系统,收集监控到的业务数据和运维数据;
对运维数据进行处理,形成运维数据源,并将运维数据源导入数据中台;
对异常的业务数据进行预警,并采用数据中台进行分析处理;
根据分析处理的结果,获取业务系统中存在故障的运维数据,并对故障的运维数据进行修复;
其中,实时监控业务系统包括基础监控、日志监控、应用性能监控、网络性能监控、网络流量分析、业务流量分析、配置管理及运维流量管理;
对异常的业务数据进行预警,并采用数据中台进行分析处理,具体包括:
根据设定的业务数据阈值范围,判别出异常的业务数据;
将异常的业务数据导入数据中台,根据预先建立的数据指标体系对导入的运维数据源进行分析推导;
其中,数据指标体系包括由业务数据组成的业务数据指标体系和由运维数据组成的运维数据指标体系,通过拓扑关系将业务数据指标体系与运维数据指标体系进行关联;
建立数据指标体系,具体包括:
配置业务数据,形成业务指标拓扑图,建立业务数据指标体系;
根据业务数据指标体系和物理网络拓扑图,生成对象链路关系图;
设计对象链路关系图中各数据指标的权重,建立数据指标体系;
其中,根据业务数据指标体系和物理网络拓扑图,生成对象链路关系图,具体包括:
给定物理硬件与软件、应用、服务之间的关系;
将业务数据指标体系中每个业务数据指标节点关联到物理网络拓扑图中的运维数据指标节点,生成对象链路关系图。
2.如权利要求1所述的运维分析方法,其特征在于,对运维数据进行处理,形成运维数据源,具体包括:
对收集监控到的运维数据进行汇集,计算运维数据的指纹并进行保存;
对已保存的运维数据进行预处理,形成运维数据源;
其中,运维数据的类型包括主体标记数据、行为数据和关系数据;
对已保存的运维数据进行预处理,包括:
对业务系统中的主体外延多个类别的对外行为,形成主体标记数据与对外行为的行为数据之间的关联,并给出对应的关系数据;
根据给定的各应用场景,抽取涉及的运维数据,形成各应用场景的运维数据清单;
划分出数据分类,构建运维数据拓扑图,完成对已保存运维数据的预处理。
3.如权利要求2所述的运维分析方法,其特征在于,划分出数据分类,构建运维数据拓扑图,具体包括:
对运维数据在业务系统中的流向进行分析梳理,完成业务系统流程的全遍历,实现对业务系统运维逻辑的全局分析;
参照各应用场景的监控和分析需求,自上而下梳理出抽象主题域,形成初始拓扑;
细化初始拓扑,形成各应用场景的子拓扑,完成运维数据拓扑图的构建;
其中,细化初始拓扑,形成各应用场景的子拓扑,包括:将运维数据清单和初始拓扑进行整合及验证校准,形成全面盘点的各应用场景的子拓扑。
4.如权利要求1所述的运维分析方法,其特征在于,建立业务数据指标体系,具体包括:
确定业务数据指标的来源,明确一级业务数据指标、二级业务数据指标及三级业务数据指标,完成业务数据指标的设计;
采集业务数据,根据业务分组关系对业务数据进行配置,筛选过滤,形成业务指标拓扑图,建立业务数据指标体系;
其中,一级业务数据指标的类别为管理指标,二级业务数据指标和三级业务数据指标的类别为运营指标。
5.如权利要求1所述的运维分析方法,其特征在于,设计对象链路关系图中各数据指标的权重,建立数据指标体系,具体包括:
确定每个业务数据指标对应的至少一个关键运维数据指标;
确定各关键运维数据指标的权重比值,将业务数据指标和各关键运维数据指标进行关联,形成业务数据指标的可用性评价关系,建立数据指标体系。
8.一种采用如权利要求1-7任一所述的运维分析方法的装置,其特征在于,包括:
数据监控采集模块,被配置为实时监控业务系统,收集监控到的业务数据和运维数据;其中,实时监控业务系统包括基础监控、日志监控、应用性能监控、网络性能监控、网络流量分析、业务流量分析、配置管理及运维流量管理;
数据处理模块,被配置为对运维数据进行处理,形成运维数据源,以及对异常的业务数据进行预警;
数据中台,被配置为接收运维数据源及对异常的业务数据进行分析处理;
故障处理模块,被配置为根据分析处理的结果,获取业务系统中存在故障的运维数据,对故障的运维数据进行修复处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210385620.6A CN114492877B (zh) | 2022-04-13 | 2022-04-13 | 一种业务系统的运维分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210385620.6A CN114492877B (zh) | 2022-04-13 | 2022-04-13 | 一种业务系统的运维分析方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114492877A CN114492877A (zh) | 2022-05-13 |
CN114492877B true CN114492877B (zh) | 2022-07-05 |
Family
ID=81488165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210385620.6A Active CN114492877B (zh) | 2022-04-13 | 2022-04-13 | 一种业务系统的运维分析方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114492877B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104301147A (zh) * | 2014-10-24 | 2015-01-21 | 国家电网公司 | 一种对业务应用系统中业务及流程活动的监测方法 |
CN106789270A (zh) * | 2016-12-27 | 2017-05-31 | 浪潮软件集团有限公司 | 一种信息系统集中运维管理的实现方法及系统 |
CN111666978A (zh) * | 2020-05-11 | 2020-09-15 | 深圳供电局有限公司 | 一种it系统运维大数据的智能故障预警系统 |
WO2021196521A1 (zh) * | 2020-04-02 | 2021-10-07 | 深圳市国电科技通信有限公司 | 远程运维管理系统及方法 |
CN113505048A (zh) * | 2021-07-09 | 2021-10-15 | 浪潮云信息技术股份公司 | 基于应用系统画像的统一监控平台及实现方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112686773B (zh) * | 2020-12-17 | 2024-05-14 | 贵州电网有限责任公司 | 一种基于融合业务拓扑的电力计量全链路关键业务异常定位模型构建方法 |
-
2022
- 2022-04-13 CN CN202210385620.6A patent/CN114492877B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104301147A (zh) * | 2014-10-24 | 2015-01-21 | 国家电网公司 | 一种对业务应用系统中业务及流程活动的监测方法 |
CN106789270A (zh) * | 2016-12-27 | 2017-05-31 | 浪潮软件集团有限公司 | 一种信息系统集中运维管理的实现方法及系统 |
WO2021196521A1 (zh) * | 2020-04-02 | 2021-10-07 | 深圳市国电科技通信有限公司 | 远程运维管理系统及方法 |
CN111666978A (zh) * | 2020-05-11 | 2020-09-15 | 深圳供电局有限公司 | 一种it系统运维大数据的智能故障预警系统 |
CN113505048A (zh) * | 2021-07-09 | 2021-10-15 | 浪潮云信息技术股份公司 | 基于应用系统画像的统一监控平台及实现方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114492877A (zh) | 2022-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110162445A (zh) | 基于主机日志及性能指标的主机健康评价方法及装置 | |
CN117527622B (zh) | 网络交换机的数据处理方法及系统 | |
CN111325422B (zh) | 一种工单派发方法及系统 | |
CN116485020B (zh) | 一种基于大数据的供应链风险识别预警方法、系统及介质 | |
CN114553671A (zh) | 一种电力通信网故障告警的诊断方法 | |
CN118094531B (zh) | 一种安全运维实时预警一体化系统 | |
CN115689415A (zh) | 一种基于数字孪生的物流监视与仿真系统 | |
CN114611372A (zh) | 一种基于物联网边缘计算的工业设备健康预测方法 | |
CN115719283A (zh) | 一种智能化会计管理系统 | |
CN106951360A (zh) | 数据统计完整度计算方法和系统 | |
CN117614662A (zh) | 大数据与人工智能结合的网络访问风险预测方法及系统 | |
CN118469405A (zh) | 家居供应链数据的处理方法、装置、设备及存储介质 | |
CN117787792B (zh) | 一种基于医疗器械质量安全风险监管的方法及系统 | |
CN118296561A (zh) | 基于设备状态数据整合的混合预警方法及系统 | |
CN117172721B (zh) | 用于融资业务的数据流转监管预警方法及系统 | |
CN115858606A (zh) | 时序数据的异常检测方法、装置、设备及存储介质 | |
CN114492877B (zh) | 一种业务系统的运维分析方法及装置 | |
Wang et al. | LSTM-based alarm prediction in the mobile communication network | |
CN116228312A (zh) | 大额积分兑换行为的处理方法和装置 | |
CN112732773B (zh) | 一种继电保护缺陷数据的唯一性校核方法及系统 | |
CN117350730A (zh) | 一种用于金融交易监管的机器学习算法筛查方法 | |
CN110995465A (zh) | 信通点位全景视图信息运维方法及系统 | |
CN117273467B (zh) | 一种基于多因素耦合的工业安全风险管控方法及系统 | |
CN118539432B (zh) | 一种基于电网结构图的电网优化方法及装置 | |
Mozafari et al. | A method for clustering Bank customers using RFM model and three parameter Grey numbers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220922 Address after: 201107 room 108, block a, building 8, No. 1879, jiangxinsha Road, Pudong New Area, Shanghai Patentee after: Shanghai mengpa Intelligent Technology Co.,Ltd. Patentee after: Beijing mengpa Xinchuang Technology Co.,Ltd. Address before: 100124 1110, floor 1, building a, No. 98, Guangqu Road, Chaoyang District, Beijing Patentee before: Beijing mengpa Xinchuang Technology Co.,Ltd. |
|
TR01 | Transfer of patent right |