CN116895046A - 基于虚拟化的异常运维数据处理方法 - Google Patents
基于虚拟化的异常运维数据处理方法 Download PDFInfo
- Publication number
- CN116895046A CN116895046A CN202310901021.XA CN202310901021A CN116895046A CN 116895046 A CN116895046 A CN 116895046A CN 202310901021 A CN202310901021 A CN 202310901021A CN 116895046 A CN116895046 A CN 116895046A
- Authority
- CN
- China
- Prior art keywords
- monitoring
- data
- abnormal
- acquiring
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 111
- 238000003672 processing method Methods 0.000 title claims abstract description 10
- 238000012423 maintenance Methods 0.000 title description 100
- 238000012544 monitoring process Methods 0.000 claims abstract description 241
- 238000000034 method Methods 0.000 claims abstract description 46
- 230000008569 process Effects 0.000 claims abstract description 22
- 238000012545 processing Methods 0.000 claims abstract description 22
- 230000005856 abnormality Effects 0.000 claims description 10
- 230000000694 effects Effects 0.000 abstract description 5
- 238000007726 management method Methods 0.000 description 36
- 238000005516 engineering process Methods 0.000 description 20
- 238000004458 analytical method Methods 0.000 description 14
- 238000007405 data analysis Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000001514 detection method Methods 0.000 description 7
- 238000013439 planning Methods 0.000 description 6
- 230000000007 visual effect Effects 0.000 description 6
- 238000013473 artificial intelligence Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 230000008439 repair process Effects 0.000 description 5
- 238000012800 visualization Methods 0.000 description 5
- 238000003745 diagnosis Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000008030 elimination Effects 0.000 description 3
- 238000003379 elimination reaction Methods 0.000 description 3
- 238000012550 audit Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000013468 resource allocation Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 230000002547 anomalous effect Effects 0.000 description 1
- 230000002155 anti-virotic effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本申请公开了一种基于虚拟化的异常运维数据处理方法。通过获取当前监控模式,根据当前监控模式确定监控场景;根据监控场景确定目标监控渠道,并在目标监控渠道中获取目标监控数据;获取监控场景对应的预警条件,并结合预警条件判断目标监控数据是否异常;在判定目标监控数据异常时,获取目标监控数据中的异常数据;根据异常数据生成异常报告并在预设策略集合中获取目标策略;执行目标策略以处理异常数据。通过根据当前监控模式确定异常数据触发预警的预警条件,实现了精确根据运行状态实现异常数据处理的技术效果。
Description
技术领域
本申请涉及数据处理领域,尤其是涉及一种基于虚拟化的异常运维数据处理方法。
背景技术
随着互联网和信息技术的快速发展,企业和组织依赖于IT系统的程度越来越高,IT系统的运行稳定性和可靠性对企业的发展至关重要。而IT系统的运维管理是保障系统稳定运行的关键,传统的运维管理模式普遍存在如下弊端:
1. 系统复杂度增加:随着企业IT系统的不断扩展和升级,系统复杂度不断增加,传统的运维方式已经难以胜任。
2. 运维效率低下:传统的运维方式需要人工干预,效率低下,往往需要花费较长的时间来识别和解决问题。
3. 运维质量不稳定:传统的运维方式容易出现疏漏和错误,导致运维质量不稳定,影响企业的业务运行。
4. 运维管理效率低下:传统的运维管理模式效率低下,人工干预多,容易出错,无法满足现代企业对高效、智能、自动化运维管理的需求。
5. 运维管理成本高:传统的运维管理模式需要大量的人力资源和物力资源,运维成本高,无法满足企业降低运维成本的需求。
因此,如何根据当前运维模式有效进行异常数据的处理成为了一个亟待解决的技术问题。
发明内容
为了根据当前运维模式有效进行异常数据的处理,本申请提供一种基于虚拟化的异常运维数据处理方法。
第一方面,本申请提供的一种基于虚拟化的异常运维数据处理方法采用如下的技术方案:
一种基于虚拟化的异常运维数据处理方法,包括:
获取当前监控模式,根据所述当前监控模式确定监控场景;
根据所述监控场景确定目标监控渠道,并在所述目标监控渠道中获取目标监控数据;
获取所述监控场景对应的预警条件,并结合所述预警条件判断所述目标监控数据是否异常;
在判定所述目标监控数据异常时,获取所述目标监控数据中的异常数据;
根据所述异常数据生成异常报告并在预设策略集合中获取目标策略;
执行所述目标策略以处理所述异常数据。
可选的,所述获取当前监控模式,根据所述当前监控模式确定监控场景的步骤,包括:
获取当前监控模式,并在所述当前监控模式中确定模式标签;
根据所述模式标签确定监控场景画像;
根据所述监控场景画像确定监控场景。
可选的,所述根据所述模式标签确定监控场景画像的步骤,包括:
根据所述模式标签生成模式标签集合;
在所述模式标签集合中获取集合总标签分值;
判断所述集合总标签分值是否满足预设最低阈值;
若是,则根据所述模式标签确定监控场景画像。
可选的,所述根据所述监控场景确定目标监控渠道,并在所述目标监控渠道中获取目标监控数据的步骤,包括:
获取所述监控场景中的监控因子;
根据所述监控因子确定监控渠道;
获取所述监控渠道中的渠道属性并根据所述渠道属性判断是否属于稳定渠道;
若是,则将所述监控渠道作为目标监控渠道并获取目标监控数据。
可选的,所述获取所述监控渠道中的渠道属性并根据所述渠道属性判断是否属于稳定渠道的步骤,包括:
获取所述监控渠道中的渠道属性;
在所述渠道属性中获取有效时长标签信息;
获取预设有效时长阈值,并判断所述有效时长标签信息是否大于所述预设有效时长阈值;
若是,则判定所述监控渠道属于稳定渠道。
可选的,所述根据所述异常数据生成异常报告并在预设策略集合中获取目标策略的步骤,包括:
获取所述异常数据中的异常项,根据所述异常项确定异常类型;
根据所述异常项类型和所述异常数据生成异常报告;
获取预设策略集合,在所述预设策略集合中根据所述异常报告获取目标策略。
可选的,所述根据所述异常项类型和所述异常数据生成异常报告的步骤,包括:
根据所述异常项类型确定异常等级;
根据所述异常数据确定异常内容;
根据所述异常等级和所述异常内容生成异常报告。
第二方面,本申请提供一种基于虚拟化的异常运维数据处理系统,所述基于虚拟化的异常运维数据处理系统包括:
模式获取模块,用于获取当前监控模式,根据所述当前监控模式确定监控场景;
数据获取模块,用于根据所述监控场景确定目标监控渠道,并在所述目标监控渠道中获取目标监控数据;
异常判断模块,用于获取所述监控场景对应的预警条件,并结合所述预警条件判断所述目标监控数据是否异常;
异常数据模块,用于在判定所述目标监控数据异常时,获取所述目标监控数据中的异常数据;
策略获取模块,用于根据所述异常数据生成异常报告并在预设策略集合中获取目标策略;
策略执行模块,用于执行所述目标策略以处理所述异常数据。
综上描述,本申请包括以下有益技术效果:
本申请通过获取当前监控模式,根据当前监控模式确定监控场景;根据监控场景确定目标监控渠道,并在目标监控渠道中获取目标监控数据;获取监控场景对应的预警条件,并结合预警条件判断目标监控数据是否异常;在判定目标监控数据异常时,获取目标监控数据中的异常数据;根据异常数据生成异常报告并在预设策略集合中获取目标策略;执行目标策略以处理异常数据。通过根据当前监控模式确定异常数据触发预警的预警条件,实现了精确根据运行状态实现异常数据处理的技术效果。
附图说明
图1是本申请基于虚拟化的异常运维数据处理方法第一实施例的流程示意图;
图2是本申请基于虚拟化的异常运维数据处理系统第一实施例的系统图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下通过附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请实施例提供了一种基于虚拟化的异常运维数据处理方法,参照图1,图1为本申请基于虚拟化的异常运维数据处理方法第一实施例的流程示意图。
本实施例中,所述基于虚拟化的异常运维数据处理方法包括以下步骤:
步骤S10:获取当前监控模式,根据当前监控模式确定监控场景。
需要说明的是,本实施例使用的方法又称基于虚拟化的AI运维服务平台技术,该项目是将虚拟化技术和人工智能技术相结合,实现自动化运维管理的项目。虚拟化技术是将物理服务器划分为多个虚拟机的技术,提高了服务器的利用率和灵活性。虚拟化技术的应用,提高了AI运维服务平台部署的灵活性和可扩展性,以适应不同场景的需求。
AI运维服务平台是一个基于人工智能技术的全自动化运维管理平台。其主要目的是通过自动化监控和分析来精简运维流程,减少人工干预,从而提高效率、降低成本和风险。人工智能技术能够对IT系统的运行状态进行实时监控和分析,能够自动识别和解决问题,提高运维效率和服务质量。
基于虚拟化的AI运维服务平台项目的主要目标是实现以下几个方面:
1. 自动化运维管理:利用虚拟化技术,将运维管理任务自动化,包括资源分配、应用部署、故障检测和修复等。
2. 实时监控和分析:利用人工智能技术,对IT系统的运行状态进行实时监控和分析,自动识别和解决问题,提高运维效率和服务质量。
3. 提高系统可靠性和稳定性:通过自动化的故障检测和修复,提高系统的可靠性和稳定性,降低运维成本。
4. 提高运维效率:通过自动化和智能化的运维管理,提高运维效率,减少人工干预,降低运维成本。
基于虚拟化的AI运维服务平台项目的主要技术包括:
1. 虚拟化技术:利用虚拟化技术,将物理服务器划分为多个虚拟机,提高服务器的利用率和灵活性。
2. 人工智能技术:利用机器学习、深度学习等人工智能技术,对IT系统的运行状态进行实时监控和分析,实现智能故障诊断与故障恢复。
3. 自动化运维管理:利用自动化工具和技术,实现自动化运维管理,包括资源分配、应用部署、故障检测和修复等。
4. 监控和分析工具:利用监控和分析工具,对IT系统的运行状态进行实时监控和分析,快速识别和解决问题。通过将收集的数据进行可视化,帮助运维人员更好地了解软硬件的运行状况,从而更好地管理和优化系统。
5. 安全管理:采用多层次安全防护措施,确保数据的安全性和保密性。
基于虚拟化的AI运维服务平台项目是一种新型的运维服务模式,能够实现自动化运维管理,提高运维效率和服务质量,降低运维成本。
可以理解的是,本实施例在实际运行过程中作为基于虚拟化的AI运维服务平台组成如下:
(1)虚拟化管理器:负责管理物理服务器和虚拟机的创建、删除、迁移、调度等操作,为AI运维服务平台提供虚拟化基础设施。
(2)AI运维引擎:负责对虚拟机的运行数据进行采集、分析和处理,识别出系统中的潜在故障和性能问题,并提供预测性维护、自动化修复等功能。
(3)监控组件:负责对虚拟机和物理服务器的运行状态进行监控,包括CPU、内存、磁盘、网络、数据库运行日志、应用日志、操作系统日志等指标。
(4)告警组件:负责对虚拟机和物理服务器的异常情况进行监控,并发送告警通知给管理员或运维人员。
(5)日志管理组件:负责对虚拟机和物理服务器的日志进行收集和管理,以便于后续故障排查和分析。
(6)自动化运维组件:负责自动化执行运维任务,包括自动化部署、自动化备份、自动化升级、故障恢复等定制的运维任务。
(7)安全组件:负责保障系统的安全性,包括身份认证、访问控制、数据加密、安全审计等。
(8)数据库组件:负责存储系统的配置信息、运行数据等,根据记录的信息不同,选择不同的数据库。
(9)应用程序管理系统:负责管理应用程序的安装、升级和配置,以及应用程序的运行监测和性能优化。
(10)任务调度器:负责定时或实时调度任务。
以上各组件通过协同工作,使得基于虚拟化的AI运维服务平台能够实现高可用性、高性能、高安全性和高可扩展性,提高系统的运行效率,降低运维成本,为用户提供优质的服务。
进一步的,为了实现监控场景确定,获取当前监控模式,根据当前监控模式确定监控场景的步骤,包括:获取当前监控模式,并在当前监控模式中确定模式标签;根据模式标签确定监控场景画像;根据监控场景画像确定监控场景。
需要说明的是,当前监控模式是指本实施例在实际运行中的监控模式,可以是默认监控模式也可以是由系统管理人员进行设定的。
可以理解的是,模式标签即在监控模式执行的初始阶段生成的一种携带模式信息的标签,其中,当运行模式切换时对应的标签的内容也会进行切换。
进一步的,为了确定场景画像,根据模式标签确定监控场景画像的步骤,包括:根据模式标签生成模式标签集合;在模式标签集合中获取集合总标签分值;判断集合总标签分值是否满足预设最低阈值;若是,则根据模式标签确定监控场景画像。
步骤S20:根据监控场景确定目标监控渠道,并在目标监控渠道中获取目标监控数据。
在具体实施中,目标数据即故障数据,通过故障诊断和排除,主要是指通过自动化技术来快速诊断和解决企业IT系统中出现的故障和问题。具体来说,故障诊断和排除可以包括以下几个方面:
(1)故障自动化检测:可以自动化地检测企业IT系统中的故障和问题,例如通过自动化监控系统来实时监控系统状态和性能指标,以及通过自动化告警系统来及时通知相关人员。
(2)故障自动化分析:可以自动化地分析故障和问题,例如通过自动化日志分析系统来自动化地分析系统日志,通过自动化故障定位系统来自动化地定位故障原因。
(3)故障自动化解决:可以自动化地解决故障和问题,例如通过自动化故障恢复系统来自动化地恢复系统服务,通过自动化故障修复系统来自动化地修复系统问题。
(4)故障自动化预防:可以自动化地预防故障和问题,例如通过自动化故障分析系统来分析历史故障数据,以及通过自动化性能优化系统来优化系统性能,从而预防故障的发生。
通过AI运维服务平台的故障诊断和排除,企业可以更快速地发现和解决故障和问题,减少故障的影响,提高IT系统的可靠性和稳定性。同时,通过预防故障的发生,也可以降低企业的IT运维成本和风险。
进一步的,为了实现获取目标监控数据,根据监控场景确定目标监控渠道,并在目标监控渠道中获取目标监控数据的步骤,包括:获取监控场景中的监控因子;根据监控因子确定监控渠道;获取监控渠道中的渠道属性并根据渠道属性判断是否属于稳定渠道;若是,则将监控渠道作为目标监控渠道并获取目标监控数据。
可以理解的是,监控因子是指在监控场景中由数据组成的监控数据,通过对监控因子的分析确定监控渠道,其原理是通过监控因子确定对应的渠道映射关系,通过渠道映射关系确定对应的监控渠道。、
在具体实施中,判断是否属于稳定渠道的方式就是通过渠道的有效时长进行判断。若有效时长即将过期时,则可以判断不属于稳定渠道。具体的对照方式需要跟预设有效时长阈值进行对比。
需要说明的是,获取监控渠道中的渠道属性并根据渠道属性判断是否属于稳定渠道的步骤,包括:获取监控渠道中的渠道属性;在渠道属性中获取有效时长标签信息;获取预设有效时长阈值,并判断有效时长标签信息是否大于预设有效时长阈值;若是,则判定监控渠道属于稳定渠道。
步骤S30:获取监控场景对应的预警条件,并结合预警条件判断目标监控数据是否异常。
步骤S40:在判定目标监控数据异常时,获取目标监控数据中的异常数据。
步骤S50:根据异常数据生成异常报告并在预设策略集合中获取目标策略。
需要说明的是,本实施例AI运维服务平台的多维度数据分析与报告生成是指通过对IT系统的运行数据进行多维度的分析,生成详细的报告,以帮助用户更好地了解系统的运行状况和性能表现。具体包括以下几个方面:
(1)数据采集:AI运维服务平台通过对IT系统的各种运行数据进行采集,包括性能数据、日志数据、事件数据等。
(2)数据存储:AI运维服务平台将采集到的数据存储在数据仓库中,以备后续分析和处理。
(3)数据分析:AI运维服务平台通过数据挖掘和机器学习等技术,对存储在数据仓库中的数据进行多维度分析,包括异常检测、性能分析、趋势分析、故障预测等。
(4)报告生成:AI运维服务平台根据数据分析结果,生成详细的报告,包括故障报告、性能报告、趋势报告等,以帮助用户更好地了解系统的运行状况和性能表现。
(5)可视化展示:AI运维服务平台通过可视化展示的方式,将数据分析结果以图表等形式展示给用户,使用户可以更直观地了解系统的运行状况和性能表现。
通过多维度数据分析和报告生成,AI运维服务平台可以帮助用户更好地了解系统的运行状况和性能表现,及时发现和解决问题,提高系统的可靠性和安全性。
进一步的,为了实现目标策略的获取,根据异常数据生成异常报告并在预设策略集合中获取目标策略的步骤,包括:获取异常数据中的异常项,根据异常项确定异常类型;根据异常项类型和异常数据生成异常报告;获取预设策略集合,在预设策略集合中根据异常报告获取目标策略。
需要说明的是,根据异常项类型和异常数据生成异常报告的步骤,包括:根据异常项类型确定异常等级;根据异常数据确定异常内容;根据异常等级和异常内容生成异常报告。
步骤S60:执行目标策略以处理异常数据。
为了完善运维过程中的功能完整性,本实施例还支持自动化容量规划:AI运维服务平台的自动化容量规划功能是指通过AI技术来预测和规划企业IT系统中各种资源的容量需求,从而帮助企业合理规划资源使用,避免资源浪费和不足的情况。具体来说,AI运维服务平台的自动化容量规划功能可以包括以下几个方面:
(1)容量预测:AI运维服务平台可以自动化地分析历史数据和趋势,预测未来的容量需求,从而提前采取措施来满足资源需求。
(2)容量规划:AI运维服务平台可以根据容量预测结果,自动化地规划资源的使用方案,例如规划服务器的数量、存储设备的容量、网络带宽的带宽等。
(3)容量优化:AI运维服务平台可以对系统中各种资源进行自动化优化,例如通过优化服务器配置、优化存储设备性能、优化网络带宽等,提高系统的性能和可靠性,从而降低资源的使用量。
(4)容量监控:AI运维服务平台可以实时监控系统中各种资源的使用情况和性能指标,例如CPU利用率、内存利用率、磁盘空间利用率、网络带宽利用率等。通过容量监控,可以及时发现资源异常和瓶颈,从而采取相应的措施。
通过AI运维服务平台的自动化容量规划功能,企业可以更好地预测和规划资源使用,避免资源浪费和不足的情况,提高IT系统的性能和可靠性,降低IT运维成本,为企业提供更好的IT运维服务。
安全和合规性管理:AI运维服务平台的安全和合规性管理同样非常重要。包括以下内容:
(1)数据安全管理:确保数据的保密性、完整性和可用性。平台需要采取适当的措施,如数据加密、访问控制、备份和恢复等,来确保数据的安全。
(2)系统安全管理:确保系统的安全,包括网络、服务器和应用程序等。平台需要采取适当的措施,如漏洞修复、防火墙、入侵检测和反病毒等,来确保系统的安全。
(3)合规性管理:遵守各种法规、标准和政策,如GDPR、HIPAA、ISO 27001等。平台需要采取适当的措施,如合规性审计、风险评估和政策制定等,来确保合规性。
(4)模型安全管理:AI运维服务平台使用机器学习和深度学习模型来处理数据和优化运维过程。因此,平台需要确保模型的安全,包括模型的训练数据、算法和输出结果等。平台需要采取适当的措施,如数据隐私保护、模型审计和模型解释等,来确保模型的安全。
(5)事件管理:A采取适当的措施,如事件响应、漏洞管理和风险管理等,来应对各种安全事件和风险。
综上,AIOPS的安全和合规性管理是非常重要的,平台需要采取适当的措施来确保数据和系统的安全,遵守法规和标准,保护模型的安全,以及应对各种安全事件和风险。
数据分析和预测:通过AI算法对IT系统的基础架构和应用程序的数据进行分析和预测,以便持续优化性能和稳定性。
(1)数据采集:AI运维服务平台需要采集各种运维数据,如日志、性能指标、配置信息等。平台需要确保数据的质量和完整性,以便进行有效的数据分析和预测。
(2)数据清洗和处理:AI运维服务平台需要对采集到的数据进行清洗和处理,以去除噪声和错误,同时提取有用的特征和变量。平台需要使用适当的数据处理技术,如数据清洗、数据转换和特征提取等。
(3)数据建模和分析:AI运维服务平台需要使用机器学习和其他数据分析技术来建立模型和分析数据。平台需要选择适当的模型和算法,如回归、分类、聚类和异常检测等。平台还需要使用可视化工具来展示分析结果,以便用户更好地理解数据。
(4)预测和优化:AI运维服务平台需要使用模型来进行预测和优化。平台可以使用预测模型来预测未来的运维事件和性能指标,以便提前做出响应和优化。平台还可以使用优化模型来提高运维效率和降低成本。
(5)持续学习和改进:AI运维服务平台需要不断学习和改进模型和算法,以适应不断变化的运维环境。平台需要采取适当的措施,如持续学习、模型评估和反馈等,来改进模型的准确性和效率。
综上,AI运维服务平台的数据分析和预测是其最重要的功能之一。平台需要采集、清洗和处理数据,使用机器学习和其他数据分析技术来建立模型和分析数据,进行预测和优化,并持续学习和改进模型和算法。
可视化管理和报告:平台可以提供直观的可视化界面和报告,以便管理员和决策者进行管理和决策。
(1)可视化仪表板:AI运维服务平台需要提供可视化仪表板,以便用户可以查看和管理运维数据和事件。仪表板应该包括各种运维指标和事件,如性能指标、故障事件、变更事件等。仪表板还应该支持自定义和交互,以满足用户的不同需求。
(2)报告管理:AI运维服务平台需要提供报告管理功能,以便用户可以生成和分享运维报告。报告应该包括各种运维指标和事件,如性能指标、故障事件、变更事件等。报告还应该支持自定义和导出,以便用户可以根据需要自定义报告内容和格式。
(3)可视化工具:AI运维服务平台需要提供各种可视化工具,以便用户可以更好地理解和管理运维数据和事件。可视化工具应该包括各种图表和图形,如线性图、柱状图、饼状图、地图等。可视化工具还应该支持自定义和交互,以满足用户的不同需求。
(4)实时监控:AI运维服务平台需要提供实时监控功能,以便用户可以实时查看和管理运维数据和事件。实时监控应该支持各种运维指标和事件,如性能指标、故障事件、变更事件等。实时监控还应该支持自定义和告警,以便用户可以及时响应和处理运维事件。
(5)用户管理:AI运维服务平台需要提供用户管理功能,以便管理员可以管理用户和权限。用户管理应该包括用户注册、登录、角色和权限管理等。用户管理还应该支持安全和合规性要求,如密码策略、访问控制等。
在具体实施中,本实施在执行时还支持插件扩展和API接口
(1)插件扩展:AI运维服务平台通常可以通过插件的方式进行扩展,用户可以根据自身需求,编写插件来实现各种功能,如自定义监控项、自定义告警规则等。
(2)API接口:AI运维服务平台通常提供丰富的API接口,用户可以通过API接口进行各种操作,如获取系统信息、添加监控项、修改告警规则等。通过插件扩展和API接口,用户可以根据自身需求对AI运维服务平台进行灵活的定制和扩展,满足不同场景下的需求。
本实施例通过获取当前监控模式,根据当前监控模式确定监控场景;根据监控场景确定目标监控渠道,并在目标监控渠道中获取目标监控数据;获取监控场景对应的预警条件,并结合预警条件判断目标监控数据是否异常;在判定目标监控数据异常时,获取目标监控数据中的异常数据;根据异常数据生成异常报告并在预设策略集合中获取目标策略;执行目标策略以处理异常数据。通过根据当前监控模式确定异常数据触发预警的预警条件,实现了精确根据运行状态实现异常数据处理的技术效果。
参照图2,图2为本申请基于虚拟化的异常运维数据处理系统第一实施例的系统图。
如图2所示,本申请实施例提出的基于虚拟化的异常运维数据处理系统包括:
模式获取模块10,用于获取当前监控模式,根据当前监控模式确定监控场景;
数据获取模块20,用于根据监控场景确定目标监控渠道,并在目标监控渠道中获取目标监控数据;
异常判断模块30,用于获取监控场景对应的预警条件,并结合预警条件判断目标监控数据是否异常;
异常数据模块40,用于在判定目标监控数据异常时,获取目标监控数据中的异常数据;
策略获取模块50,用于根据异常数据生成异常报告并在预设策略集合中获取目标策略;
策略执行模块60,用于执行目标策略以处理异常数据。
应当理解的是,以上仅为举例说明,对本申请的技术方案并不构成任何限定,在具体应用中,本领域的技术人员可以根据需要进行设置,本申请对此不做限制。
本实施例通过获取当前监控模式,根据当前监控模式确定监控场景;根据监控场景确定目标监控渠道,并在目标监控渠道中获取目标监控数据;获取监控场景对应的预警条件,并结合预警条件判断目标监控数据是否异常;在判定目标监控数据异常时,获取目标监控数据中的异常数据;根据异常数据生成异常报告并在预设策略集合中获取目标策略;执行目标策略以处理异常数据。通过根据当前监控模式确定异常数据触发预警的预警条件,实现了精确根据运行状态实现异常数据处理的技术效果。
在一实施例中,模式获取模块10,还用于获取当前监控模式,并在当前监控模式中确定模式标签;根据模式标签确定监控场景画像;
根据监控场景画像确定监控场景。
在一实施例中,模式获取模块10,还用于根据模式标签生成模式标签集合;在模式标签集合中获取集合总标签分值;判断集合总标签分值是否满足预设最低阈值;若是,则根据模式标签确定监控场景画像。
在一实施例中,数据获取模块20,还用于获取监控场景中的监控因子;根据监控因子确定监控渠道;获取监控渠道中的渠道属性并根据渠道属性判断是否属于稳定渠道;若是,则将监控渠道作为目标监控渠道并获取目标监控数据。
在一实施例中,数据获取模块20,还用于获取监控渠道中的渠道属性;在渠道属性中获取有效时长标签信息;获取预设有效时长阈值,并判断有效时长标签信息是否大于预设有效时长阈值;若是,则判定监控渠道属于稳定渠道。
在一实施例中,策略获取模块50,还用于获取异常数据中的异常项,根据异常项确定异常类型;根据异常项类型和异常数据生成异常报告;获取预设策略集合,在预设策略集合中根据异常报告获取目标策略。
在一实施例中,策略获取模块50,还用于根据异常项类型确定异常等级;根据异常数据确定异常内容;根据异常等级和异常内容生成异常报告。
需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本申请的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本申请任意实施例所提供的基于虚拟化的异常运维数据处理的方法,此处不再赘述。
此外,需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器(Read Only Memory,ROM)/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例的方法。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (8)
1.一种基于虚拟化的异常运维数据处理方法,其特征在于,包括:
获取当前监控模式,根据所述当前监控模式确定监控场景;
根据所述监控场景确定目标监控渠道,并在所述目标监控渠道中获取目标监控数据;
获取所述监控场景对应的预警条件,并结合所述预警条件判断所述目标监控数据是否异常;
在判定所述目标监控数据异常时,获取所述目标监控数据中的异常数据;
根据所述异常数据生成异常报告并在预设策略集合中获取目标策略;
执行所述目标策略以处理所述异常数据。
2.根据权利要求1所述的基于虚拟化的异常运维数据处理方法,其特征在于,所述获取当前监控模式,根据所述当前监控模式确定监控场景的步骤,包括:
获取当前监控模式,并在所述当前监控模式中确定模式标签;
根据所述模式标签确定监控场景画像;
根据所述监控场景画像确定监控场景。
3.根据权利要求2所述的基于虚拟化的异常运维数据处理方法,其特征在于,所述根据所述模式标签确定监控场景画像的步骤,包括:
根据所述模式标签生成模式标签集合;
在所述模式标签集合中获取集合总标签分值;
判断所述集合总标签分值是否满足预设最低阈值;
若是,则根据所述模式标签确定监控场景画像。
4.根据权利要求1所述的基于虚拟化的异常运维数据处理方法,其特征在于,所述根据所述监控场景确定目标监控渠道,并在所述目标监控渠道中获取目标监控数据的步骤,包括:
获取所述监控场景中的监控因子;
根据所述监控因子确定监控渠道;
获取所述监控渠道中的渠道属性并根据所述渠道属性判断是否属于稳定渠道;
若是,则将所述监控渠道作为目标监控渠道并获取目标监控数据。
5.根据权利要求4所述的基于虚拟化的异常运维数据处理方法,其特征在于,所述获取所述监控渠道中的渠道属性并根据所述渠道属性判断是否属于稳定渠道的步骤,包括:
获取所述监控渠道中的渠道属性;
在所述渠道属性中获取有效时长标签信息;
获取预设有效时长阈值,并判断所述有效时长标签信息是否大于所述预设有效时长阈值;
若是,则判定所述监控渠道属于稳定渠道。
6.根据权利要求1所述的基于虚拟化的异常运维数据处理方法,其特征在于,所述根据所述异常数据生成异常报告并在预设策略集合中获取目标策略的步骤,包括:
获取所述异常数据中的异常项,根据所述异常项确定异常类型;
根据所述异常项类型和所述异常数据生成异常报告;
获取预设策略集合,在所述预设策略集合中根据所述异常报告获取目标策略。
7.根据权利要求6所述的基于虚拟化的异常运维数据处理方法,其特征在于,所述根据所述异常项类型和所述异常数据生成异常报告的步骤,包括:
根据所述异常项类型确定异常等级;
根据所述异常数据确定异常内容;
根据所述异常等级和所述异常内容生成异常报告。
8.一种基于虚拟化的异常运维数据处理系统,其特征在于,所述基于虚拟化的异常运维数据处理系统包括:
模式获取模块,用于获取当前监控模式,根据所述当前监控模式确定监控场景;
数据获取模块,用于根据所述监控场景确定目标监控渠道,并在所述目标监控渠道中获取目标监控数据;
异常判断模块,用于获取所述监控场景对应的预警条件,并结合所述预警条件判断所述目标监控数据是否异常;
异常数据模块,用于在判定所述目标监控数据异常时,获取所述目标监控数据中的异常数据;
策略获取模块,用于根据所述异常数据生成异常报告并在预设策略集合中获取目标策略;
策略执行模块,用于执行所述目标策略以处理所述异常数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310901021.XA CN116895046B (zh) | 2023-07-21 | 2023-07-21 | 基于虚拟化的异常运维数据处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310901021.XA CN116895046B (zh) | 2023-07-21 | 2023-07-21 | 基于虚拟化的异常运维数据处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116895046A true CN116895046A (zh) | 2023-10-17 |
CN116895046B CN116895046B (zh) | 2024-05-07 |
Family
ID=88313369
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310901021.XA Active CN116895046B (zh) | 2023-07-21 | 2023-07-21 | 基于虚拟化的异常运维数据处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116895046B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117435191A (zh) * | 2023-12-20 | 2024-01-23 | 杭银消费金融股份有限公司 | 一种基于客制化需求的程序处理方法和装置 |
CN118312910A (zh) * | 2024-06-07 | 2024-07-09 | 北京联创高科信息技术有限公司 | 一种针对水害数据中的异常数据筛选方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107992398A (zh) * | 2017-12-22 | 2018-05-04 | 宜人恒业科技发展(北京)有限公司 | 一种业务系统的监控方法和监控系统 |
CN108932613A (zh) * | 2017-05-25 | 2018-12-04 | 北京嘀嘀无限科技发展有限公司 | 互联网支付渠道的监控方法及监控装置、设备和存储介质 |
WO2020259421A1 (zh) * | 2019-06-28 | 2020-12-30 | 深圳前海微众银行股份有限公司 | 一种业务系统的监控方法及装置 |
CN112732536A (zh) * | 2020-12-30 | 2021-04-30 | 平安科技(深圳)有限公司 | 数据监控告警方法、装置、计算机设备及存储介质 |
CN115578838A (zh) * | 2022-09-29 | 2023-01-06 | 筑加智慧城市建设有限公司 | 建筑监测数据异常预警方法及相关装置 |
CN115858311A (zh) * | 2023-03-04 | 2023-03-28 | 北京神州光大科技有限公司 | 运维监控的方法、装置、电子设备及可读存储介质 |
CN115904605A (zh) * | 2021-09-30 | 2023-04-04 | 腾讯科技(深圳)有限公司 | 软件防御方法以及相关设备 |
-
2023
- 2023-07-21 CN CN202310901021.XA patent/CN116895046B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108932613A (zh) * | 2017-05-25 | 2018-12-04 | 北京嘀嘀无限科技发展有限公司 | 互联网支付渠道的监控方法及监控装置、设备和存储介质 |
CN107992398A (zh) * | 2017-12-22 | 2018-05-04 | 宜人恒业科技发展(北京)有限公司 | 一种业务系统的监控方法和监控系统 |
WO2020259421A1 (zh) * | 2019-06-28 | 2020-12-30 | 深圳前海微众银行股份有限公司 | 一种业务系统的监控方法及装置 |
CN112732536A (zh) * | 2020-12-30 | 2021-04-30 | 平安科技(深圳)有限公司 | 数据监控告警方法、装置、计算机设备及存储介质 |
CN115904605A (zh) * | 2021-09-30 | 2023-04-04 | 腾讯科技(深圳)有限公司 | 软件防御方法以及相关设备 |
CN115578838A (zh) * | 2022-09-29 | 2023-01-06 | 筑加智慧城市建设有限公司 | 建筑监测数据异常预警方法及相关装置 |
CN115858311A (zh) * | 2023-03-04 | 2023-03-28 | 北京神州光大科技有限公司 | 运维监控的方法、装置、电子设备及可读存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117435191A (zh) * | 2023-12-20 | 2024-01-23 | 杭银消费金融股份有限公司 | 一种基于客制化需求的程序处理方法和装置 |
CN117435191B (zh) * | 2023-12-20 | 2024-03-26 | 杭银消费金融股份有限公司 | 一种基于客制化需求的程序处理方法和装置 |
CN118312910A (zh) * | 2024-06-07 | 2024-07-09 | 北京联创高科信息技术有限公司 | 一种针对水害数据中的异常数据筛选方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116895046B (zh) | 2024-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116895046B (zh) | 基于虚拟化的异常运维数据处理方法 | |
US20190228296A1 (en) | Significant events identifier for outlier root cause investigation | |
US20190279098A1 (en) | Behavior Analysis and Visualization for a Computer Infrastructure | |
EP2487860B1 (en) | Method and system for improving security threats detection in communication networks | |
US10489711B1 (en) | Method and apparatus for predictive behavioral analytics for IT operations | |
US6311175B1 (en) | System and method for generating performance models of complex information technology systems | |
JP4872944B2 (ja) | 運用管理装置、運用管理システム、情報処理方法、及び運用管理プログラム | |
KR102432284B1 (ko) | It관리대상의 이벤트 알람이나 장애 문제를 실시간 자동으로 조치하는 시스템 및 그 운용방법 | |
US20200401936A1 (en) | Self-aware service assurance in a 5g telco network | |
US20210266228A1 (en) | Network topology management using network element differential history | |
WO2005036308A2 (en) | Regulation compliance and threat identification for business optimization | |
Fu et al. | A hybrid anomaly detection framework in cloud computing using one-class and two-class support vector machines | |
US11372705B1 (en) | Intelligent monitoring of backup and recovery activity in data storage systems | |
WO2020167463A1 (en) | Interface for fault prediction and detection using time-based distributed data | |
US20170214711A1 (en) | Creating a security report for a customer network | |
CN110661811A (zh) | 一种防火墙策略管理方法及装置 | |
CN107566172B (zh) | 一种基于存储系统的主动式管理方法及系统 | |
CA3172788A1 (en) | Endpoint security using an action prediction model | |
CN117331794A (zh) | 基于大数据的应用软件监控分析系统及方法 | |
CN116755992A (zh) | 一种基于OpenStack云计算的日志分析方法及系统 | |
KR20230062761A (ko) | 시스템 장애 통합관리방법 | |
JP5240709B2 (ja) | シンプトンを評価するためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム | |
Gaikwad et al. | A framework design for algorithmic it operations (aiops) | |
Zheng et al. | LEMMA-RCA: A Large Multi-modal Multi-domain Dataset for Root Cause Analysis | |
CN103414717A (zh) | 一种关于c/s结构业务系统的仿真监控方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |