CN112766599A

CN112766599A - 一种基于深度强化学习的智能运维方法

Info

Publication number: CN112766599A
Application number: CN202110126833.2A
Authority: CN
Inventors: 吴汉扬; 魏芸
Original assignee: Guangzhou Yuanchuang Power Technology Co ltd
Current assignee: Guangzhou Yuanchuang Power Technology Co ltd
Priority date: 2021-01-29
Filing date: 2021-01-29
Publication date: 2021-05-07

Abstract

本发明公开了一种基于深度强化学习的智能运维方法，涉及自动化运维技术领域，包括以下步骤：预先采集数据信息并通过数据采集器导入至架构仿真器；对数据采集器采集数据信息构造运维数字孪生环境；推理服务从规则存储数据库中加载模型；运维事件发生后，经过推理服务进行推理，得到匹配的适合Ansible所使用的PlayBook文件，触发运维动作。本发明使用了各类运维数据，保证深度强化学习的训练环境与生产环境保持一致，增强了可靠性与实时性，采用深度强化学习方法对运维规则进行训练，降低了规则维护的人力物力，提升了运维规则的准确性与实效性，其智能化的发现自动化运维的规则，全自动的更新运维规则，大幅降低自动化运维中规则老化的情况。

Description

一种基于深度强化学习的智能运维方法

技术领域

本发明涉及自动化运维技术领域，具体来说，涉及一种基于深度强化学习的智能运维方法。

背景技术

在过去几年，运维从传统低效的人工运维走向了自动化运维，相比起人工运维完全凭借个人的经验进行运维操作，自动化运维通过编写将一系列的规则交给自动化运维工具，典型的技术如Ansible的PlayBook、SaltStack的SLS，通过自动化的运维手段大幅的降低了运维的成本。

但是，基于规则的自动化运维依然有非常多的问题，典型的问题是规则老化，随着所运维的目标业务、目标设备发生变化，自动化运维的规则会出现老化、不适用的情况，这种时候需要运维人员对规则进行人工的重新的修改，这是非常耗费人力的事情。

针对相关技术中的问题，目前尚未提出有效的解决方案。

发明内容

针对相关技术中的问题，本发明提出一种基于深度强化学习的智能运维方法，以克服现有相关技术所存在的上述技术问题。

本发明的技术方案是这样实现的：

一种基于深度强化学习的智能运维方法，包括以下步骤：

预先采集数据信息并通过数据采集器导入至架构仿真器；

基于架构仿真器以Kubernetes作为底层架构，对CMDB中的架构进行拓扑重现，对数据采集器采集数据信息构造运维数字孪生环境，对数字孪生环境使用深度强化学习算法DQN，以ITSM为的数据作为DQN算法的Q值评判依据，寻找最佳的运维规则组合，将训练所得到的模型存放进入规则存储数据库；

推理服务从规则存储数据库中加载模型；

运维事件发生后，经过推理服务进行推理，得到匹配的适合Ansible所使用的PlayBook文件，触发运维动作。

进一步的，所述数据采集器采集数据信息，包括以下步骤：

所述数据采集器从监控系统获取历史指标数据，作为架构仿真器的监控数据基础；

所述数据采集器从日志系统中获取历史日志数据，作为架构仿真器的日志数据基础；

所述数据采集器从网络流量监控系统获取网络流量包的历史数据，作为架构仿真器的流量包数据重播基础；

所述数据采集器从ITSM中获取自动化运维脚本记录和故障维护记录，作为深度强化学习算法的脚本执行基础和Q表评判依据。

进一步的，所述基于架构仿真器以Kubernetes作为底层架构，对CMDB中的架构进行拓扑重现，包括以下步骤：

架构仿真器从CMDB中获取架构信息，作为架构仿真器的架构仿真基础。

本发明的有益效果：

本发明基于深度强化学习的智能运维方法，通过预先采集数据信息并通过数据采集器导入至架构仿真器，基于架构仿真器以Kubernetes作为底层架构，对CMDB中的架构进行拓扑重现，对数据采集器采集数据信息构造运维数字孪生环境，对数字孪生环境使用深度强化学习算法DQN，以ITSM为的数据作为DQN算法的Q值评判依据，寻找最佳的运维规则组合，将训练所得到的模型存放进入规则存储数据库，推理服务从规则存储数据库中加载模型，运维事件发生后，经过推理服务进行推理，得到匹配的适合Ansible所使用的PlayBook文件，触发运维动作，实现充分使用了各类运维数据，采用数字孪生技术对生产环境进行一比一的复现，保证深度强化学习的训练环境与生产环境保持一致，增强了可靠性与实时性，采用深度强化学习方法对运维规则进行训练，使得运维规则不再老化，能和当前的生产环境相匹配，降低了规则维护的人力物力，提升了运维规则的准确性与实效性，其智能化的发现自动化运维的规则，全自动的更新运维规则，大幅降低自动化运维中规则老化的情况。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例的一种基于深度强化学习的智能运维方法的原理示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员所获得的所有其他实施例，都属于本发明保护的范围。

根据本发明的实施例，提供了一种基于深度强化学习的智能运维方法。

如图1所示，根据本发明实施例的基于深度强化学习的智能运维方法，包括以下步骤：

步骤S1，预先采集数据信息并通过数据采集器导入至架构仿真器；

步骤S2，基于架构仿真器以Kubernetes作为底层架构，对CMDB中的架构进行拓扑重现，对数据采集器采集数据信息构造运维数字孪生环境，对数字孪生环境使用深度强化学习算法DQN，以ITSM为的数据作为DQN算法的Q值评判依据，寻找最佳的运维规则组合，将训练所得到的模型存放进入规则存储数据库；

步骤S3，推理服务从规则存储数据库中加载模型；

步骤S4，运维事件发生后，经过推理服务进行推理，得到匹配的适合Ansible所使用的PlayBook文件，触发运维动作。

其中，所述数据采集器采集数据信息，包括以下步骤：

其中，所述基于架构仿真器以Kubernetes作为底层架构，对CMDB中的架构进行拓扑重现，包括以下步骤：

综上所述，借助于本发明的上述技术方案，其通过预先采集数据信息并通过数据采集器导入至架构仿真器，基于架构仿真器以Kubernetes作为底层架构，对CMDB中的架构进行拓扑重现，对数据采集器采集数据信息构造运维数字孪生环境，对数字孪生环境使用深度强化学习算法DQN，以ITSM为的数据作为DQN算法的Q值评判依据，寻找最佳的运维规则组合，将训练所得到的模型存放进入规则存储数据库，推理服务从规则存储数据库中加载模型，运维事件发生后，经过推理服务进行推理，得到匹配的适合Ansible所使用的PlayBook文件，触发运维动作，实现充分使用了各类运维数据，采用数字孪生技术对生产环境进行一比一的复现，保证深度强化学习的训练环境与生产环境保持一致，增强了可靠性与实时性，采用深度强化学习方法对运维规则进行训练，使得运维规则不再老化，能和当前的生产环境相匹配，降低了规则维护的人力物力，提升了运维规则的准确性与实效性，其智能化的发现自动化运维的规则，全自动的更新运维规则，大幅降低自动化运维中规则老化的情况。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于深度强化学习的智能运维方法，其特征在于，包括以下步骤：

预先采集数据信息并通过数据采集器导入至架构仿真器；

推理服务从规则存储数据库中加载模型；

2.根据权利要求1所述的基于深度强化学习的智能运维方法，其特征在于，所述数据采集器采集数据信息，包括以下步骤：

3.根据权利要求2所述的基于深度强化学习的智能运维方法，其特征在于，所述基于架构仿真器以Kubernetes作为底层架构，对CMDB中的架构进行拓扑重现，包括以下步骤：