CN115204424A - 云原生系统的智能运维方法、装置、设备及存储介质 - Google Patents
云原生系统的智能运维方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115204424A CN115204424A CN202210878930.1A CN202210878930A CN115204424A CN 115204424 A CN115204424 A CN 115204424A CN 202210878930 A CN202210878930 A CN 202210878930A CN 115204424 A CN115204424 A CN 115204424A
- Authority
- CN
- China
- Prior art keywords
- maintenance
- data
- native system
- cloud native
- scene
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Human Computer Interaction (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种云原生系统的智能运维方法、装置、设备及存储介质。该方法包括:获取云原生系统对应的运维数据,并根据运维场景,在云原生系统对应的运维数据中筛选得到有效运维数据;获取运维场景对应的微服务组件;通过运维场景对应的微服务组件,根据有效运维数据获取运维结果,并对运维结果进行可视化展示。本实施例的技术方案,通过采用与运维场景对应的微服务组件,对云原生系统对应的运维数据进行处理,可以实现对云原生系统的多场景智能运维,可以提升云原生系统的运维效率。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种云原生系统的智能运维方法、装置、设备及存储介质。
背景技术
随着运营商云网融合工作的推进,云原生技术逐渐成为运营商网络云化的核心和关键,云原生系统的智能运维,对实现云原生系统的成功应用具有重要意义。
目前,现有的云原生系统的运维方法,通常采用传统的被动式的、人工干预的运维方式。然而,在现有技术中,云原生系统的复杂程度较高,为运维管理带来了巨大的挑战;此外,针对云原生系统运维的应用场景比较单一,无法满足多场景的运维需求。
发明内容
本发明提供了一种云原生系统的智能运维方法、装置、设备及存储介质,可以实现对云原生系统的多场景智能运维,可以提升云原生系统的运维效率。
根据本发明的一方面,提供了一种云原生系统的智能运维方法,包括:
获取云原生系统对应的运维数据,并根据运维场景,在所述云原生系统对应的运维数据中筛选得到有效运维数据;
获取所述运维场景对应的微服务组件;
通过所述运维场景对应的微服务组件,根据所述有效运维数据获取运维结果,并对所述运维结果进行可视化展示。
根据本发明的另一方面,提供了一种云原生系统的智能运维装置,包括:
运维数据获取模块,用于获取云原生系统对应的运维数据,并根据运维场景,在所述云原生系统对应的运维数据中筛选得到有效运维数据;
微服务组件获取模块,用于获取所述运维场景对应的微服务组件;
运维结果获取模块,用于通过所述运维场景对应的微服务组件,根据所述有效运维数据获取运维结果,并对所述运维结果进行可视化展示。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的云原生系统的智能运维方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的云原生系统的智能运维方法。
本发明实施例的技术方案,通过获取云原生系统对应的运维数据,并根据运维场景,在云原生系统对应的运维数据中筛选得到有效运维数据;之后,获取运维场景对应的微服务组件,并通过运维场景对应的微服务组件,根据有效运维数据获取运维结果,并对运维结果进行可视化展示,通过采用与运维场景对应的微服务组件,对云原生系统对应的运维数据进行处理,可以实现对云原生系统的多场景智能运维,可以提升云原生系统的运维效率。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1A是根据本发明实施例一提供的一种云原生系统的智能运维方法的流程图;
图1B是根据本发明实施例一提供的一种基于趋势预测组件进行资源使用趋势预测的流程示意图;
图1C是根据本发明实施例一提供的一种基于异常检测组件进行数据异常检测的流程示意图;
图2A是根据本发明实施例二提供的一种云原生系统的智能运维方法的流程图;
图2B是根据本发明实施例二提供的一种云原生系统的智能运维架构的示意图;
图3是根据本发明实施例三提供的一种云原生系统的智能运维装置的结构示意图;
图4是实现本发明实施例的云原生系统的智能运维方法的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“目标”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1A为本发明实施例一提供了一种云原生系统的智能运维方法的流程图,本实施例可适用于对云原生系统进行智能运维的情况,该方法可以由云原生系统的智能运维装置来执行,该云原生系统的智能运维装置可以采用硬件和/或软件的形式实现,该云原生系统的智能运维装置可配置于电子设备中,典型的,电子设备可以是计算机设备或者服务器。如图1A所示,该方法包括:
S110、获取云原生系统对应的运维数据,并根据运维场景,在所述云原生系统对应的运维数据中筛选得到有效运维数据。
其中,云原生系统,可以是基于分布式部署和统一运管的分布式云,是以容器、微服务、DevOps等技术为基础建立的一套云技术产品体系。对应的,云原生应用,可以是面向“云”而设计的应用。在使用云原生技术后,开发者无需考虑底层的技术实现,可以充分发挥云平台的弹性和分布式优势,实现快速部署、按需伸缩和不停机交付等。在本实施例中,云原生系统即为当前需要进行智能运维的对象,具有运行应用按需弹性伸/缩、动态调度的特点。
智能运维,可以是一种基于算法的运维方式,可以通过整合大数据和机器学习能力,采用松耦合和可扩展的方式提取和分析在数据量(volume)、种类(variety)和速度(velocity)这3个维度不断增长的信息技术数据,从而为所有主流ITOM(Informationtechnology operations management,信息技术运维管理)产品提供支撑。
在本实施例中,云原生系统可以包括多个数据源。可选的,云原生系统可以包括云原生微服务、服务器、虚拟机和/或数据库,运维数据可以包括日志数据、指标数据和服务链数据中的至少一项。具体的,可以采用各种ITOM监控工具集,例如,网络性能监测与诊断、中间件服务可用性和性能监控、应用性能管理(Application Performance Monitor,APM)、系统运行日志管理等工具集,采集云原生系统的运维数据。
其中,运维数据的采集,可以满足跨平台、跨语言栈、高兼容性的多模式统一采集质量标准、稳定快速的传送机制、可靠的熔断和止损机制、易于部署和维护等技术要求。运维数据的采集方式,可以包括Flume技术、Kafka和Agent/API(Application ProgrammingInterface,应用程序接口)技术等。
进一步的,在获取到云原生系统的运维数据之后,可以获取当前的运维场景,并在运维数据中筛选得到与该运维场景相关的有效运维数据。需要说明的是,智能运维需要依附在具体的运维场景,故智能运维系统需要包括至少一个运维场景,例如,某研究机构针对电信大视频领域,则运维场景可以包括大视频质差根因分析和硬盘故障预判等。
在本实施例中,运维场景可以包括质量保障、成本管理和效率提升;其中,质量保障可以包括异常检测、根因分析和故障预测等,成本管理可以包括资源优化、容量规划和性能优化等,效率提升可以包括智能变更、智能客服、舆情分析和智能决策等。
S120、获取所述运维场景对应的微服务组件。
在本实施例中,针对每一个运维场景,可以预先建立对应的微服务组件;通过采用微服务架构,各微服务组件可以独立部署,且低耦合。因此,在获取到当前的运维场景之后,可以获取与该运维场景对应的微服务组件。可选的,微服务组件可以包括异常检测组件、趋势预测组件和故障定位组件等。
其中,微服务组件,可以基于预先设置的运维算法(例如,机器学习算法、卷积神经网络等)建立,用于对匹配运维场景的运维数据进行处理,以实现运维管理功能。
上述设置的好处在于,可以随着运维场景的扩展,新增对应的微服务组件,从而适应不断新增的智能运维需求。
S130、通过所述运维场景对应的微服务组件,根据所述有效运维数据获取运维结果,并对所述运维结果进行可视化展示。
具体的,采用当前的运维场景对应的微服务组件对有效运维数据进行处理,以获取运维结果,并可以在前端界面采用图形、表格等形式对运维结果进行可视化展示。其中,前端界面可以用于智能运维场景展示和大屏信息展示。
在一个具体的例子中,当运维场景为趋势预测时,可以通过对应的趋势预测组件,对与趋势预测相关的有效运维数据,例如,微服务资源的历史使用数据进行处理,以预测后续的微服务资源使用趋势。之后,可以绘制与该微服务使用趋势对应的图表,并在前端页面对该图表进行展示。
本发明实施例的技术方案,通过获取云原生系统对应的运维数据,并根据运维场景,在云原生系统对应的运维数据中筛选得到有效运维数据;之后,获取运维场景对应的微服务组件,并通过运维场景对应的微服务组件,根据有效运维数据获取运维结果,并对运维结果进行可视化展示,通过采用与运维场景对应的微服务组件,对云原生系统对应的运维数据进行处理,可以实现对云原生系统的多场景智能运维,可以提升云原生系统的运维效率。
在本实施例的一个可选的实施方式中,通过所述运维场景对应的微服务组件,根据所述有效运维数据获取运维结果,可以包括:
通过趋势预测组件,根据云原生微服务的资源调度数据,获取所述云原生微服务对应的资源使用趋势。
其中,微服务组件,可以包括趋势预测组件,用于根据微服务资源的历史使用数据对微服务资源的使用趋势进行预测。在本实施例中,趋势预测组件,可以由依次连接的卷积神经网络、长短期记忆网络和逻辑回归模型组成。
在一个具体的例子中,基于趋势预测组件进行资源使用趋势预测的流程可以如图1B所示。其中,趋势预测组件的深度学习模型架构由卷积神经网络(Convolutional neuralnetworks,CNN)、长短期记忆网络(Long Short-Term Memory,LSTM)和逻辑回归模型(例如,Softmax)组成。通过将微服务的资源调度数据输入至该趋势预测组件的深度学习模型,可以获取该深度学习模型输出的微服务对应的资源使用趋势。进一步的,可以根据获取的资源使用趋势,对微服务的资源进行规划和配置。
可选的,在通过趋势预测组件,根据云原生微服务的资源调度数据,获取云原生微服务对应的资源使用趋势之前,还可以首先基于CNN、LSTM和Softmax建立初始趋势预测组件;之后,可以采用带有标签的样本数据对该初始趋势预测组件进行有监督训练,直至获取训练完成的趋势预测组件。
上述设置的好处在于,可以满足对云原生微服务架构中,微服务资源分配的细粒度的运维管理需求,可以实现对不同微服务在启动实例数量、计算存储等资源的高效规划配置。
在本实施例的另一个可选的实施方式中,通过所述运维场景对应的微服务组件,根据所述有效运维数据获取运维结果,可以包括:
通过异常检测组件,根据云原生微服务之间的时间序列数据,获取存在数据异常的异常云原生微服务。
其中,运维场景,可以包括异常检测;对应的,微服务组件,还可以包括异常检测组件。在本实施例中,异常检测组件可以基于预训练的对抗网络建立,例如,对抗网络可以是LSTM-RNN(Recurrent Neural Network,循环神经网络)网络。
需要说明的是,在云原生微服务架构中,微服务应用来源于传统单体应用的业务拆分,多个微服务之间往往存在依赖关系。因此,当云原生微服务存在数据异常时,由于微服务之间的关联性,会对整个系统造成影响。在本实施例中,可以通过异常检测组件对云原生微服务之间的时间序列数据进行持续检测,以获取存在数据异常的异常云原生微服务,例如,若检测到对应微服务数据大于预设数据阈值,则可以将该云原生微服务确定为异常云原生微服务。
在一个具体的例子中,基于异常检测组件的数据异常检测流程可以如图1C所示。其中,左侧为对抗网络模型训练框架,右侧为异常数据鉴别框架。具体的,首先,基于训练时间序列数据对LSTM-RNN网络的生成器和鉴别器进行训练,以获取训练完成的LSTM-RNN网络。之后,将测试时间序列数据输入至训练完成的LSTM-RNN网络,以获取对应的数据异常检测评分。进一步的,可以将该数据异常检测评分和预设的评分阈值进行比较,以判断是否存在数据异常。其中,异常值可以是云原生微服务的各个数据点。
在本实施例的另一个可选的实施方式中,通过所述运维场景对应的微服务组件,根据所述有效运维数据获取运维结果,可以包括:
通过故障定位组件,根据所述有效运维数据确定故障云原生微服务。
其中,故障定位组件可以基于机器学习算法建立,机器学习算法可以包括关联规则方法和决策树方法。在本实施例中,可以预先进行日志标准化、全链路追踪和SLA(Service Level Agreement,服务水平协议)规范化等设置,从而在异构的微服务系统中建立共性的标志约定,以为智能运维提供数据支持。
在本实施例中,可以首先建立初始故障定位组件,并结合运维场景对初始故障定位组件的算法模型进行优化,以获取运维场景对应的故障定位组件。进一步的,将有效运维数据输入至故障定位组件,以确定发生故障的故障云原生微服务,例如,发生流量故障的运营商和应用。
实施例二
图2A为本发明实施例二提供的一种云原生系统的智能运维方法的流程图,本实施例是对上述技术方案的进一步细化,本实施例中的技术方案可以与上述一个或者多个实施方式结合。如图2A所示,该方法包括:
S210、获取云原生系统对应的运维数据。
S220、对所述云原生系统对应的运维数据进行数据预处理,获取数据预处理后的运维数据。
在本实施例中,在获取到云原生系统对应的运维数据之后,还可以先对采集的运维数据进行预处理,以获取数据预处理后的运维数据。其中,数据预处理可以包括数据过滤、数据清洗和/或数据格式转换。
S230、根据运维场景,在数据预处理后的运维数据中筛选得到有效运维数据。
具体的,在获取到数据预处理后的运维数据之后,可以在该运维数据中筛选得到与当前的运维场景相关的有效运维数据。
S240、获取所述运维场景对应的微服务组件。
S250、通过所述运维场景对应的微服务组件,根据所述有效运维数据获取运维结果,并对所述运维结果进行可视化展示。
本发明实施例的技术方案,通过获取云原生系统对应的运维数据,并对云原生系统对应的运维数据进行数据预处理,获取数据预处理后的运维数据;之后,根据运维场景,在数据预处理后的运维数据中筛选得到有效运维数据;进一步的,获取运维场景对应的微服务组件,并通过运维场景对应的微服务组件,根据有效运维数据获取运维结果,并对运维结果进行可视化展示;通过在获取到云原生系统对应的运维数据之后,先对运维数据进行数据预处理,可以避免无效数据对运维结果的影响,同时可以降低需要处理的运维数据的数量,可以提升智能运维的效率。
在本实施例的一个可选的实施方式中,在对所述云原生系统对应的运维数据进行数据预处理,获取数据预处理后的运维数据之后,还可以包括:
将所述数据预处理后的运维数据存储至原始数据库,并每间隔预设时间,删除所述原始数据库中的全部数据。
其中,原始数据库,用于对未筛选过的运维数据进行临时存储;预设时间,可以是预先设置的一个时间值,例如,1天等。
在本实施例中,在获取到数据预处理后的运维数据之后,可以先将该运维数据存储到原始数据库。其中,数据预处理后的运维数据,可以包括与当前的运维场景相关的有效运维数据,以及与当前的运维场景不相关的无效运维数据。此外,对于原始数据库,其存储的数据会定时清空,即每间隔预设时间,即执行一次删除全部数据的操作。
对应的,根据运维场景,在数据预处理后的运维数据中筛选得到有效运维数据,可以包括:
根据运维场景,在所述原始数据库存储的数据预处理后的运维数据中筛选得到有效运维数据。
具体的,在查找有效运维数据时,可以在原始数据库中查找与当前的运维场景对应的已存数据,以作为有效运维数据。可选的,在获取到有效运维数据之后,可以将有效运维数据存储到样本数据库。其中,样本数据库中的数据不会删除,数据量会不断增加,数据类型会不断丰富。进一步的,可以通过运维场景对应的微服务组件,根据样本数据库中的有效运维数据获取运维结果。
在本实施例中,根据运维场景,可以在原始数据库中快速筛选出有效运维数据,从而保证可以快速且有目的地删除原始数据库中的历史数据,可以降低存储成本。
在本实施例的一个具体的实施方式中,云原生系统的智能运维架构可以如图2B所示。其中,云原生系统的智能运维架构可以包括运维对象、数据平台、算法平台和门户应用四部分。具体的,运维对象,可以包括运维基础设施和运维数据,运维基础设施可以包括微应用/服务、服务器、虚拟机/容器和数据库,运维数据可以包括日志数据、指标数据和服务链路数据。数据平台,可以用于数据采集、数据预处理和数据存储;其中,数据采集,可以包括Flume、Kafka和Agent/API等方式;数据预处理,可以包括数据过滤、数据清洗和数据格式转换;数据存储,可以包括原始数据库,用于存储未筛选过的运维数据;样本数据库,用于存储筛选过的与运维场景相关的有效运维数据。
其次,算法平台,可以采用分布式结构,各微服务组件独立部署;其中,微服务组件可以包括异常检测组件、趋势预测组件和故障定位组件等。而门户应用,主要用于进行运维结果展示,可以包括智能运维场景展示和大屏信息展示。
在本实施例中,通过采用云原生系统的智能运维架构,可以提供面向云原生系统的智能运维的统一技术标准,可以成功实现对高度复杂的云原生系统的智能运维。
实施例三
图3为本发明实施例三提供的一种云原生系统的智能运维装置的结构示意图。如图3所示,该装置包括:运维数据获取模块310、微服务组件获取模块320和运维结果获取模块330;其中,
运维数据获取模块310,用于获取云原生系统对应的运维数据,并根据运维场景,在所述云原生系统对应的运维数据中筛选得到有效运维数据;
微服务组件获取模块320,用于获取所述运维场景对应的微服务组件;
运维结果获取模块330,用于通过所述运维场景对应的微服务组件,根据所述有效运维数据获取运维结果,并对所述运维结果进行可视化展示。
本发明实施例的技术方案,通过获取云原生系统对应的运维数据,并根据运维场景,在云原生系统对应的运维数据中筛选得到有效运维数据;之后,获取运维场景对应的微服务组件,并通过运维场景对应的微服务组件,根据有效运维数据获取运维结果,并对运维结果进行可视化展示,通过采用与运维场景对应的微服务组件,对云原生系统对应的运维数据进行处理,可以实现对云原生系统的多场景智能运维,可以提升云原生系统的运维效率。
可选的,所述云原生系统的智能运维装置,还包括:
数据预处理模块,用于对所述云原生系统对应的运维数据进行数据预处理,获取数据预处理后的运维数据;
其中,数据预处理包括数据过滤、数据清洗和/或数据格式转换;
运维数据获取模块310,具体用于根据运维场景,在数据预处理后的运维数据中筛选得到有效运维数据。
可选的,所述云原生系统的智能运维装置,还包括:
数据存储模块,用于将所述数据预处理后的运维数据存储至原始数据库,并每间隔预设时间,删除所述原始数据库中的全部数据;
运维数据获取模块310,具体用于根据运维场景,在所述原始数据库存储的数据预处理后的运维数据中筛选得到有效运维数据。
可选的,微服务组件获取模块320,包括:
资源使用趋势获取单元,用于通过趋势预测组件,根据云原生微服务的资源调度数据,获取所述云原生微服务对应的资源使用趋势;
其中,所述趋势预测组件由依次连接的卷积神经网络、长短期记忆网络和逻辑回归模型组成。
可选的,微服务组件获取模块320,包括:
异常云原生微服务获取单元,用于通过异常检测组件,根据云原生微服务之间的时间序列数据,获取存在数据异常的异常云原生微服务;其中,所述异常检测组件基于预训练的对抗网络建立。
可选的,微服务组件获取模块320,包括:
障云原生微服务确定单元,用于通过故障定位组件,根据所述有效运维数据确定故障云原生微服务;其中,所述故障定位组件基于机器学习算法建立。
可选的,所述云原生系统包括云原生微服务、服务器、虚拟机和/或数据库,所述运维数据包括日志数据、指标数据和服务链数据中的至少一项。
本发明实施例所提供的云原生系统的智能运维装置可执行本发明任意实施例所提供的云原生系统的智能运维方法,具备执行方法相应的功能模块和有益效果。
需要说明的是,本实施例的技术方案中,所涉及的用户个人信息的获取、存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
实施例四
图4示出了可以用来实施本发明的实施例的电子设备40的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,电子设备40包括至少一个处理器41,以及与至少一个处理器41通信连接的存储器,如只读存储器(ROM)42、随机访问存储器(RAM)43等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器41可以根据存储在只读存储器(ROM)42中的计算机程序或者从存储单元48加载到随机访问存储器(RAM)43中的计算机程序,来执行各种适当的动作和处理。在RAM 43中,还可存储电子设备40操作所需的各种程序和数据。处理器41、ROM 42以及RAM 43通过总线44彼此相连。输入/输出(I/O)接口45也连接至总线44。
电子设备40中的多个部件连接至I/O接口45,包括:输入单元46,例如键盘、鼠标等;输出单元47,例如各种类型的显示器、扬声器等;存储单元48,例如磁盘、光盘等;以及通信单元49,例如网卡、调制解调器、无线通信收发机等。通信单元49允许电子设备40通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器41可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器41的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器41执行上文所描述的各个方法和处理,例如云原生系统的智能运维方法。
在一些实施例中,云原生系统的智能运维方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元48。在一些实施例中,计算机程序的部分或者全部可以经由ROM 42和/或通信单元49而被载入和/或安装到电子设备40上。当计算机程序加载到RAM 43并由处理器41执行时,可以执行上文描述的云原生系统的智能运维方法的一个或多个步骤。备选地,在其他实施例中,处理器41可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行云原生系统的智能运维方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种云原生系统的智能运维方法,其特征在于,包括:
获取云原生系统对应的运维数据,并根据运维场景,在所述云原生系统对应的运维数据中筛选得到有效运维数据;
获取所述运维场景对应的微服务组件;
通过所述运维场景对应的微服务组件,根据所述有效运维数据获取运维结果,并对所述运维结果进行可视化展示。
2.根据权利要求1所述的方法,其特征在于,在获取云原生系统对应的运维数据之后,还包括:
对所述云原生系统对应的运维数据进行数据预处理,获取数据预处理后的运维数据;
其中,数据预处理包括数据过滤、数据清洗和/或数据格式转换;
根据运维场景,在所述云原生系统对应的运维数据中筛选得到有效运维数据,包括:
根据运维场景,在数据预处理后的运维数据中筛选得到有效运维数据。
3.根据权利要求2所述的方法,其特征在于,在对所述云原生系统对应的运维数据进行数据预处理,获取数据预处理后的运维数据之后,还包括:
将所述数据预处理后的运维数据存储至原始数据库,并每间隔预设时间,删除所述原始数据库中的全部数据;
根据运维场景,在数据预处理后的运维数据中筛选得到有效运维数据,包括:
根据运维场景,在所述原始数据库存储的数据预处理后的运维数据中筛选得到有效运维数据。
4.根据权利要求1所述的方法,其特征在于,通过所述运维场景对应的微服务组件,根据所述有效运维数据获取运维结果,包括:
通过趋势预测组件,根据云原生微服务的资源调度数据,获取所述云原生微服务对应的资源使用趋势;
其中,所述趋势预测组件由依次连接的卷积神经网络、长短期记忆网络和逻辑回归模型组成。
5.根据权利要求1所述的方法,其特征在于,通过所述运维场景对应的微服务组件,根据所述有效运维数据获取运维结果,包括:
通过异常检测组件,根据云原生微服务之间的时间序列数据,获取存在数据异常的异常云原生微服务;其中,所述异常检测组件基于预训练的对抗网络建立。
6.根据权利要求1所述的方法,其特征在于,通过所述运维场景对应的微服务组件,根据所述有效运维数据获取运维结果,包括:
通过故障定位组件,根据所述有效运维数据确定故障云原生微服务;其中,所述故障定位组件基于机器学习算法建立。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述云原生系统包括云原生微服务、服务器、虚拟机和/或数据库,所述运维数据包括日志数据、指标数据和服务链数据中的至少一项。
8.一种云原生系统的智能运维装置,其特征在于,包括:
运维数据获取模块,用于获取云原生系统对应的运维数据,并根据运维场景,在所述云原生系统对应的运维数据中筛选得到有效运维数据;
微服务组件获取模块,用于获取所述运维场景对应的微服务组件;
运维结果获取模块,用于通过所述运维场景对应的微服务组件,根据所述有效运维数据获取运维结果,并对所述运维结果进行可视化展示。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的云原生系统的智能运维方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的云原生系统的智能运维方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210878930.1A CN115204424A (zh) | 2022-07-25 | 2022-07-25 | 云原生系统的智能运维方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210878930.1A CN115204424A (zh) | 2022-07-25 | 2022-07-25 | 云原生系统的智能运维方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115204424A true CN115204424A (zh) | 2022-10-18 |
Family
ID=83584081
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210878930.1A Pending CN115204424A (zh) | 2022-07-25 | 2022-07-25 | 云原生系统的智能运维方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115204424A (zh) |
-
2022
- 2022-07-25 CN CN202210878930.1A patent/CN115204424A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115033463B (zh) | 一种系统异常类型确定方法、装置、设备和存储介质 | |
CN114443443B (zh) | 一种故障自愈方法、装置、设备及存储介质 | |
CN112615742A (zh) | 用于预警的方法、装置、设备以及存储介质 | |
CN111383100A (zh) | 基于风险模型的全生命周期管控方法和装置 | |
CN114662953A (zh) | 物联网设备运维方法、装置、设备及介质 | |
CN114218302A (zh) | 信息处理方法、装置、设备以及存储介质 | |
CN115102836A (zh) | 网络设备故障分析方法、装置及存储介质 | |
CN115687406A (zh) | 一种调用链数据的采样方法、装置、设备及存储介质 | |
CN110958137A (zh) | 流量管理方法、装置及电子设备 | |
CN115774602A (zh) | 一种容器资源的分配方法、装置、设备及存储介质 | |
CN115204424A (zh) | 云原生系统的智能运维方法、装置、设备及存储介质 | |
CN114896418A (zh) | 知识图谱构建方法、装置、电子设备及存储介质 | |
CN114885014A (zh) | 一种外场设备状态的监测方法、装置、设备及介质 | |
CN114881112A (zh) | 一种系统异常检测方法、装置、设备及介质 | |
CN111159237B (zh) | 系统数据分发方法、装置、存储介质及电子设备 | |
CN113656239A (zh) | 针对中间件的监控方法、装置及计算机程序产品 | |
CN112579402A (zh) | 一种应用系统故障定位的方法和装置 | |
CN115964409A (zh) | 一种系统访问数据的管理方法、装置、设备及存储介质 | |
CN118037414A (zh) | 一种项目风险管理方法、装置、电子设备及存储介质 | |
CN115604149A (zh) | 云原生应用的健康探测方法、装置、电子设备及存储介质 | |
CN117808382A (zh) | 一种运输进度数据确定方法、装置、设备及介质 | |
CN117131990A (zh) | 电网基建信息管理方法、装置、电子设备及存储介质 | |
CN117974155A (zh) | 一种用户投诉前置处理方法、装置及设备 | |
CN114048058A (zh) | 直播事件搜索方法、装置、电子设备以及存储介质 | |
CN115455060A (zh) | 一种数据处理方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |