CN112667468B - 多云环境下云资源自动化运维的方法与设备 - Google Patents

多云环境下云资源自动化运维的方法与设备 Download PDF

Info

Publication number
CN112667468B
CN112667468B CN202011551414.5A CN202011551414A CN112667468B CN 112667468 B CN112667468 B CN 112667468B CN 202011551414 A CN202011551414 A CN 202011551414A CN 112667468 B CN112667468 B CN 112667468B
Authority
CN
China
Prior art keywords
cloud
monitoring
reference item
monitoring reference
target operation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011551414.5A
Other languages
English (en)
Other versions
CN112667468A (zh
Inventor
张常见
高海峰
赵平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Lianwei Panyun Technology Co ltd
Original Assignee
Shanghai Lianwei Panyun Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Lianwei Panyun Technology Co ltd filed Critical Shanghai Lianwei Panyun Technology Co ltd
Priority to CN202011551414.5A priority Critical patent/CN112667468B/zh
Publication of CN112667468A publication Critical patent/CN112667468A/zh
Application granted granted Critical
Publication of CN112667468B publication Critical patent/CN112667468B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种多云环境下云资源自动化运维的方法,应用于一用户终端,所述方法包括:获取用户的身份验证信息,所述身份验证信息匹配对应的多个公有云账号识别信息;基于所述多个公有云账号识别信息分别向多台云端设备发送多个元数据请求;接收所述多台云端设备基于所述元数据请求而发送的多条元数据,所述多条元数据包含相应公有云的云资源监控信息;对所述云资源监控信息执行清洗操作,以建立格式统一的监控指标项;根据所述监控指标项的特定状态限定监控参考项;根据各所述监控参考项及其响应的目标操作建立训练数据集;预测各所述监控参考项响应所述目标操作的执行概率;选择具有最高执行概率的监控参考项作为执行所述目标操作的触发条件。

Description

多云环境下云资源自动化运维的方法与设备
技术领域
本发明涉及云计算领域,尤其涉及一种多云环境下云资源自动化运维的方法与设备。
背景技术
云计算经历了多年的发展,目前正处于高速发展期,多云是云计算发展的必经阶段,原因在于:
1、由于企业的敏捷化和数字化,大量公有云被使用;
2、由于现有公有云的独特性,越来越多的企业采用多云的形式;
3、由于企业业务对性能及数据量不同,会有不同的数据库要求。
大量的企业客户采用多公有云支撑企业IT,然而让企业的IT人员管理多个不同的云平台,不同类型的数据库,登录不同的云平台进行操作,显然是件困难的事情。对不同类型数据库运维困扰着目前IT部门,对不同类型数据库自动化运维更是面临的一大难题。
发明内容
鉴于现有技术中的问题,本发明提供了一种多云环境下云资源自动化运维的方法,应用于一用户终端,所述方法包括:
获取用户的身份验证信息,所述身份验证信息匹配对应的多个公有云账号识别信息;
基于所述多个公有云账号识别信息分别向多台云端设备发送多个元数据请求;
接收所述多台云端设备基于所述元数据请求而发送的多条元数据,所述多条元数据包含相应公有云的云资源监控信息;
对所述多条元数据执行清洗操作,以建立格式统一的监控指标项;
根据所述监控指标项的特定状态限定监控参考项;
根据各所述监控参考项及其响应的目标操作建立训练数据集;
预测各所述监控参考项发生时执行所述目标操作的执行概率;
选择具有最高执行概率的监控参考项作为执行所述目标操作的触发条件。
进一步地,所述分别向多台云端设备发送多个元数据请求的步骤,包括:
基于预设的时间间隔分别向多台云端设备发送多个元数据请求。
进一步地,所述监控参考项对应的状态包括相应的云资源处于满负荷状态和数据库存在死锁。
进一步地,所述预测各所述监控参考项响应所述目标操作的执行概率的步骤,包括:
根据所述训练数据集创建频率表;
计算所述目标操作发生时各所述监控参考项的发生概率;
创建似然表;
计算各所述监控参考项的发生概率及所述目标操作的发生概率;
根据所述监控参考项的发生概率、所述目标操作发生时所述监控参考项的发生概率,以及所述目标操作的发生概率,预测所述监控参考项发生时执行所述目标操作的执行概率。
进一步地,所述执行概率的计算公式是:
其中,P(B|A)表示所述监控参考项发生时执行所述目标操作的执行概率;P(A|B)表示所述目标操作发生时所述监控参考项的发生概率,P(A)表示所述监控参考项的发生概率,P(B)表示所述目标操作的发生概率。
进一步地,当一个或多个所述监控指标项达到或超过相应的阈值时,执行报警操作。
进一步地,当满足所述触发条件从而执行所述目标操作时,执行报警操作。
进一步地,响应于用户在所述用户终端的单一界面输入的操作指令,基于至少一项所述监控指标项执行对应的操作,其中所述操作指令包括所述至少一项监控指标信息。
本发明还提供了一种多云环境下云资源自动化运维的设备,所述设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行上述方法的操作。
本发明还提供了一种存储指令的计算机可读介质,所述指令在被执行时使得系统执行上述方法的操作。
与现有技术相比,本发明的多云环境下云资源自动化运维的方法与设备能够对多个公有云的不同类型数据库进行统一的自动化运维,解决了跨云平台环境下多云(公有云/私有云/混合云)、多类型数据库(PAAS/IAAS)的统一识别、展示和管理,以及自动化运维。企业的IT人员即使面对多个不同的云平台、不同类型的数据库,无需分别登录不同的云平台进行操作,只需通过统一的用户终端即可集中管理,本发明的方法从多云角度实现数据库监控,以及实例级别自动化底层扩充。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出本发明的一个实施例的一种系统架构;
图2示出本发明一个实施例的一种多云环境下云资源自动化运维的方法的流程;
图3示出可用于本发明各实施例的一种示例性系统的功能模块。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
在本发明的一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(例如,中央处理器(Central Processing Unit,CPU))、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RandomAccess Memory,RAM)和/或非易失性内存等形式,如只读存储器(Read Only Memory,ROM)或闪存(Flash Memory)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(Phase-Change Memory,PCM)、可编程随机存取存储器(Programmable Random Access Memory,PRAM)、静态随机存取存储器(Static Random-Access Memory,SRAM)、动态随机存取存储器(Dynamic Random AccessMemory,DRAM)、其他类型的随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、电可擦除可编程只读存储器(Electrically-ErasableProgrammable Read-Only Memory,EEPROM)、快闪记忆体(Flash Memory)或其他内存技术、只读光盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、数字多功能光盘(Digital Versatile Disc,DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
本发明所指设备包括但不限于用户设备、网络设备、或用户设备与网络设备通过网络相集成所构成的设备。所述用户设备包括但不限于任何一种可与用户进行人机交互(例如通过触摸板进行人机交互)的移动电子产品,例如智能手机、平板电脑等,所述移动电子产品可以采用任意操作系统,如Android操作系统、iOS操作系统等。其中,所述网络设备包括一种能够按照事先设定或存储的指令,自动进行数值计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(Application Specific IntegratedCircuit,ASIC)、可编程逻辑器件(Programmable Logic Device,PLD)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、数字信号处理器(Digital Signal Processor,DSP)、嵌入式设备等。所述网络设备包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云;在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟超级计算机。所述网络包括但不限于互联网、广域网、城域网、局域网、VPN网络、无线自组织网络(Ad Hoc Network)等。优选地,所述设备还可以是运行于所述用户设备、网络设备、或用户设备与网络设备、网络设备、触摸终端或网络设备与触摸终端通过网络相集成所构成的设备上的程序。
当然,本领域技术人员应能理解上述设备仅为举例,其他现有的或今后可能出现的设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在本发明的实施方式的描述中,“多个”的含义是两个或者更多,除非另有明确具体的限定。
本实施例首先提供了一种多云环境下云资源自动化运维的系统架构。如图1所示,该系统采用B/S模式,总体架构分为五个部分,分别是用户层、应用层、业务层、数据层、基础设施层,其中:
-用户层:为公有云用户提供单云单账户的用户体验,方便云账户以及云资源的统一规划管理。
-应用层:为用户提供系统主页、应用中心、资源中心、配置中心、系统管理、分析中心等功能。
-业务层:主要由多云数据库监控信息的收集、逻辑业务处理、报警信息处理等主要组件构成。
-数据层:主要由基础数据、监控项数据、多云资源数据、多云收集数据、统计分析处理数据等组成。
-基础设施层:基础软硬件设施是整个系统的基础工程,利用现有云资源(虚拟机或容器)实现。
-标准规范及运行管理体系:根据企业和信息化相关的标准规范体系,主要包括法律法规、标准规范以及相关技术要求。
-安全保障及工程管理体系:从物理安全、网络安全、应用安全、系统安全和管理安全五个层次分别加以考虑。
基于上述架构,具体而言,本实施例提供了一种多云环境下云资源自动化运维的方法。该方法应用于一用户终端,并由相应的网络设备(例如云端服务器)提供支撑。参考图2,该方法包括步骤S100、步骤S200、步骤S300、步骤S400、步骤S500、步骤S600和步骤S700。以下以一用户终端为例描述本实施例的具体实施方式。
具体地,在步骤S100中,用户终端获取用户的身份验证信息。例如,用户在用户终端输入自己的用户标识(例如系统账号名称)及认证信息(例如账号密码)。
在步骤S200中,用户终端基于所述身份验证信息匹配对应的多个公有云账号识别信息,其中每个公有云账号识别信息分别对应一公有云账号。例如,管理员所登录的用户账号对应于其所管理的若干个公有云账号;在一些情形下,对于同一套系统而言,不同的管理员可能管理不同的公有云账号。
在步骤S300中,用户终端分别向多台云端设备发送多个元数据请求,其中每个元数据请求包括一公有云账号识别信息,所述公有云账号识别信息用于确定用户对相应公有云账号的访问权限。例如,多台云端设备分别对应于多个不同的云平台。用户对某个云账号的访问权限,在一些实施例中由用户提供的相关账号信息确定,例如阿里云需要获取录入accessKeyId、accessSecret字段,而Azure(亚马逊所提供的云服务平台)需要获取录入subscriptionId、clientSecret字段。录入成功以后验证录入账号是否可用。
在步骤S400中,用户终端接收所述多台云端设备基于所述元数据请求而发送的多条元数据。其中,所述多条元数据包含相应公有云的云资源监控信息。在一些实施例中,将多云账号同步的资源监控数据做持久化,作为优化节约分析计算的基础数据。
在步骤S500中,用户终端对所述多条元数据根据预设的规则和算法进行清洗和分类管理。在一些实施例中,根据各云平台不同的数据清洗规则,将元数据的内容清洗至相应的数据结构中,包括检查数据一致性,处理无效值和缺失值等。本实施例中,将各云平台中的云资源监控信息,如CPU使用率、内存使用率、磁盘使用率等等,经数据清洗后形成格式统一的监控指标项,并根据预设的算法进行分类。在一些实施例中,本步骤中对于接收到的元数据的处理是自动并行执行的。
在步骤S600中,用户终端基于经清洗和分类后的数据信息,根据预设的报警规则,执行报警自动化处理。
在步骤S700中,用户终端响应于用户在用户终端的单一界面输入的操作指令,基于至少一项监控指标项执行对应的目标操作,其中所述操作指令包括所述至少一项监控指标信息。在一些实施例中,相应的操作结果亦在前述单一界面中整合呈现。
从而,用户仅在一个单一的用户界面中,即可实现对多个云账号的云资源自动化运维,无需分别进入各个云账号进行监控管理。
其中在一些实施例中,在上述步骤S300中,用户终端基于预设的时间间隔分别向多台云端设备发送多个元数据请求。例如,在获取用户的身份验证信息后,系统自行地每隔一定时间执行前述操作,以减轻用户的操作负担和提高本地数据的实时性。
在一些实施例中,在上述步骤S500中,用户终端对于经清洗后的元数据根据预设算法进行分类,以确定自动触发特定目标操作的条件,如“自动扩充”。以下以多公有云中sqlserver数据库的管理和自动化运维为例做进一步说明。
根据云资源的监控指标项,如CPU使用率、内存使用率、磁盘使用率等,选择相应监控指标项的特定状态限定监控参考项,如CPU使用率100%、内存使用率100%、磁盘使用率100%等,设计以相应的监控参考项响应目标变量“自动扩充”实例的训练数据集(即计算“自动扩充”的可能性),从而需要对监控参考项所指代的性能条件进行分类,以判断此实例是否需要扩充,本实施例中采用如以下表1中的性能条件(监控参考项)。
表1
本实施例中的训练数据集如下表2所示。
表2
性能条件 是否扩充
CPU100%
Mem100%
LogData100%
DbSize100%
BlockSqlScript
CPU100%
Mem100%
BlockSqlScript
LogData100%
CPU100%
Mem100%
BlockSqlScript
Mem100%
CPU100%
CPU100%
将表2的训练数据集转换成频率表,如下表3所示。
表3
性能条件
CPU100% 3 2
Mem100% 3 1
LogData100% 1 1
DbSize100% 0 1
BlockSqlScript 3 0
计算出现扩充时不同性能条件出现的概率,分别为:
P(CPU=100|是)=2/5=0.4
P(Mem=100|是)=1/5=0.2
P(LogData=100|是)=1/5=0.2
P(DbSize=100|是)=1/5=0.2
P(BlockSqlScript|是)=0/5=0
创建似然表,如下表4所示。
表4
计算出现扩充的概率:
P(是)=5/15=0.333
计算不同性能条件出现的概率,分别为:
P(CPU=100)=5/15=0.333
P(Mem=100)=4/15=0.267
P(LogData=100)=2/15=0.133
P(DbSize=100)=1/15=0.067
P(BlockSqlScript)=3/15=0.2
根据上述各概率,预计不同性能条件出现时执行“自动扩充”的概率,分别为:
P(是|CPU=100)=P(CPU=100|是)×P(是)/P(CPU=100)=40%
P(是|Mem=100)=P(Mem=100|是)×P(是)/P(Mem=100)=25%
P(是|LogData=100)=P(LogData=100|是)×P(是)/P(LogData=100)=50%
P(是|DbSize=100)=P(DbSize=100|是)×P(是)/P(DbSize=100)=100%
P(是|BlockSqlScript)=P(BlockSqlScript|是)×P(是)/P(BlockSqlScript)=0%
选择上述结果中的最高概率对于的性能条件来执行自动扩充,即当DbSize达到100%时才自动扩充。
在一些实施例中,在上述步骤S600中,根据预设的报警规则,当监控指标项符合规则时进行自动报警操作,如包括但不限于以下内容:
1、CPU、Mem或LogData达到90%以上时,发出报警邮件及短信;
2、依据算法分类后所得的最高概率执行自动扩充时,发出邮件及短信;
3、数据库有block语句发生时,发出报警邮件及短信。
在一些实施例中,在步骤S700中,用户终端检测用户在用户终端的浏览器应用中的单一界面输入的操作指令;响应于所述操作指令,用户终端基于至少一项监控指标项执行对应的操作,其中所述操作指令包括所述至少一项监控指标信息。在此,所述对应的操作包括但不限于资源监控信息的筛选、展示、图形化、汇总、输出等,如在用户终端的显示界面中,通过界面中的选择键或下拉菜单栏(相当于操作指令)进行资源监控信息的筛选及多维度展示。
本实施例还提供了一种计算机程序产品,当所述计算机程序产品被计算机设备执行时,如前任一项所述的方法被执行。
本实施例还提供了一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个计算机程序;
当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如前任一项所述的方法。
图3示出了可被用于实施本发明中所述的各个实施例的示例性系统。
如图3所示,在一些实施例中,系统1000能够作为各所述实施例中的任意一个用户终端设备。在一些实施例中,系统1000可包括具有指令的一个或多个计算机可读介质(例如,系统存储器或NVM/存储设备1020)以及与该一个或多个计算机可读介质耦合并被配置为执行指令以实现模块从而执行本发明中所述的动作的一个或多个处理器(例如,(一个或多个)处理器1005)。
对于一个实施例,系统控制模块1010可包括任意适当的接口控制器,以向(一个或多个)处理器1005中的至少一个和/或与系统控制模块1010通信的任意适当的设备或组件提供任意适当的接口。
系统控制模块1010可包括存储器控制器模块1030,以向系统存储器1015提供接口。存储器控制器模块1030可以是硬件模块、软件模块和/或固件模块。
系统存储器1015可被用于例如为系统1000加载和存储数据和/或指令。对于一个实施例,系统存储器1015可包括任意适当的易失性存储器,例如,适当的DRAM。在一些实施例中,系统存储器1015可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。
对于一个实施例,系统控制模块1010可包括一个或多个输入/输出(I/O)控制器,以向NVM/存储设备1020及(一个或多个)通信接口1025提供接口。
例如,NVM/存储设备1020可被用于存储数据和/或指令。NVM/存储设备1020可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(Hard Disk,HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。
NVM/存储设备1020可包括在物理上作为系统1000被安装在其上的设备的一部分的存储资源,或者其可被该设备访问而不必作为该设备的一部分。例如,NVM/存储设备1020可通过网络经由(一个或多个)通信接口1025进行访问。
(一个或多个)通信接口1025可为系统1000提供接口以通过一个或多个网络和/或与任意其他适当的设备通信。系统1000可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信。
对于一个实施例,(一个或多个)处理器1005中的至少一个可与系统控制模块1010的一个或多个控制器(例如,存储器控制器模块1030)的逻辑封装在一起。对于一个实施例,(一个或多个)处理器1005中的至少一个可与系统控制模块1010的一个或多个控制器的逻辑封装在一起以形成系统级封装(SiP)。对于一个实施例,(一个或多个)处理器1005中的至少一个可与系统控制模块1010的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例,(一个或多个)处理器1005中的至少一个可与系统控制模块1010的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(SoC)。
在各个实施例中,系统1000可以但不限于是:服务器、工作站、台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)。在各个实施例中,系统1000可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,系统1000包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。本领域技术人员应能理解,计算机程序指令在计算机可读介质中的存在形式包括但不限于源文件、可执行文件、安装包文件等,相应地,计算机程序指令被计算机执行的方式包括但不限于:该计算机直接执行该指令,或者该计算机编译该指令后再执行对应的编译后程序,或者该计算机读取并执行该指令,或者该计算机读取并安装该指令后再执行对应的安装后程序。在此,计算机可读介质可以是可供计算机访问的任意可用的计算机可读存储介质或通信介质。
通信介质包括藉此包含例如计算机可读指令、数据结构、程序模块或其他数据的通信信号被从一个系统传送到另一系统的介质。通信介质可包括有导的传输介质(诸如电缆和线(例如,光纤、同轴等))和能传播能量波的无线(未有导的传输)介质,诸如声音、电磁、RF、微波和红外。计算机可读指令、数据结构、程序模块或其他数据可被体现为例如无线介质(诸如载波或诸如被体现为扩展频谱技术的一部分的类似机制)中的已调制数据信号。术语“已调制数据信号”指的是其一个或多个特征以在信号中编码信息的方式被更改或设定的信号。调制可以是模拟的、数字的或混合调制技术。
作为示例而非限制,计算机可读存储介质可包括以用于存储诸如计算机可读指令、数据结构、程序模块或其它数据的信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动的介质。例如,计算机可读存储介质包括,但不限于,易失性存储器,诸如随机存储器(RAM,DRAM,SRAM);以及非易失性存储器,诸如闪存、各种只读存储器(ROM,PROM,EPROM,EEPROM)、磁性和铁磁/铁电存储器(MRAM,FeRAM);以及磁性和光学存储设备(硬盘、磁带、CD、DVD);或其它现在已知的介质或今后开发的能够存储供计算机系统使用的计算机可读信息/数据。
在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (8)

1.多云环境下云资源自动化运维的方法,其特征在于,应用于一用户终端,所述方法包括:
获取用户的身份验证信息,所述身份验证信息匹配对应的多个公有云账号识别信息;
基于所述多个公有云账号识别信息分别向多台云端设备发送多个元数据请求;
接收所述多台云端设备基于所述元数据请求而发送的多条元数据,所述多条元数据包含相应公有云的云资源监控信息;
对所述多条元数据执行清洗操作,以建立格式统一的监控指标项;
根据所述监控指标项的特定状态限定监控参考项,所述特定状态包括CPU使用率100%、内存使用率100%、磁盘使用率100%;
根据各所述监控参考项及其响应的目标操作建立训练数据集;
预测各所述监控参考项发生时执行所述目标操作的执行概率;
选择具有最高执行概率的监控参考项作为执行所述目标操作的触发条件;
其中,
所述预测各所述监控参考项响应所述目标操作的执行概率的步骤,包括:
根据所述训练数据集创建频率表;
计算所述目标操作发生时各所述监控参考项的发生概率;
创建似然表;
计算各所述监控参考项的发生概率及所述目标操作的发生概率;
根据所述监控参考项的发生概率、所述目标操作发生时所述监控参考项的发生概率,以及所述目标操作的发生概率,预测所述监控参考项发生时执行所述目标操作的执行概率;
所述执行概率的计算公式是:
其中,P(B|A)表示所述监控参考项发生时执行所述目标操作的执行概率;P(A|B)表示所述目标操作发生时所述监控参考项的发生概率,P(A)表示所述监控参考项的发生概率,P(B)表示所述目标操作的发生概率。
2.根据权利要求1所述的方法,其特征在于,所述分别向多台云端设备发送多个元数据请求的步骤,包括:
基于预设的时间间隔分别向多台云端设备发送多个元数据请求。
3.根据权利要求1所述的方法,其特征在于,所述监控参考项对应的状态包括相应的云资源处于满负荷状态和数据库存在死锁。
4.根据权利要求1所述的方法,其特征在于,当一个或多个所述监控指标项达到或超过相应的阈值时,执行报警操作。
5.根据权利要求1所述的方法,其特征在于,当满足所述触发条件从而执行所述目标操作时,执行报警操作。
6.根据权利要求1所述的方法,其特征在于,响应于用户在所述用户终端的单一界面输入的操作指令,基于至少一项所述监控指标项执行对应的操作,其中所述操作指令包括至少一项监控指标信息。
7.一种多云环境下云资源自动化运维的设备,其特征在于,所述设备包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据权利要求1至6中任一项所述方法的操作。
8.一种存储指令的计算机可读介质,其特征在于,所述指令在被执行时使得系统执行根据权利要求1至6中任一项所述方法的操作。
CN202011551414.5A 2020-12-24 2020-12-24 多云环境下云资源自动化运维的方法与设备 Active CN112667468B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011551414.5A CN112667468B (zh) 2020-12-24 2020-12-24 多云环境下云资源自动化运维的方法与设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011551414.5A CN112667468B (zh) 2020-12-24 2020-12-24 多云环境下云资源自动化运维的方法与设备

Publications (2)

Publication Number Publication Date
CN112667468A CN112667468A (zh) 2021-04-16
CN112667468B true CN112667468B (zh) 2024-07-16

Family

ID=75408393

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011551414.5A Active CN112667468B (zh) 2020-12-24 2020-12-24 多云环境下云资源自动化运维的方法与设备

Country Status (1)

Country Link
CN (1) CN112667468B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113641503B (zh) * 2021-09-01 2024-05-14 上海联蔚盘云科技有限公司 多云多集群的Kubernetes管理系统及方法与设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105337765A (zh) * 2015-10-10 2016-02-17 上海新炬网络信息技术有限公司 一种分布式hadoop集群故障自动诊断修复系统
CN111049904A (zh) * 2019-12-12 2020-04-21 上海联蔚信息科技有限公司 多公有云资源监控的方法与设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111381959A (zh) * 2018-12-29 2020-07-07 中兴通讯股份有限公司 扩容方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105337765A (zh) * 2015-10-10 2016-02-17 上海新炬网络信息技术有限公司 一种分布式hadoop集群故障自动诊断修复系统
CN111049904A (zh) * 2019-12-12 2020-04-21 上海联蔚信息科技有限公司 多公有云资源监控的方法与设备

Also Published As

Publication number Publication date
CN112667468A (zh) 2021-04-16

Similar Documents

Publication Publication Date Title
US11323471B2 (en) Advanced cybersecurity threat mitigation using cyberphysical graphs with state changes
US10560465B2 (en) Real time anomaly detection for data streams
US10944795B2 (en) Rating organization cybersecurity using active and passive external reconnaissance
US11032323B2 (en) Parametric analysis of integrated operational technology systems and information technology systems
US10320827B2 (en) Automated cyber physical threat campaign analysis and attribution
CN109359237B (zh) 一种用于搜索寄宿程序的方法与设备
CN110266505B (zh) 一种管理会话群的方法与设备
US12105735B2 (en) Asynchronous accounting method and apparatus for blockchain, medium and electronic device
CN111049904A (zh) 多公有云资源监控的方法与设备
WO2021216163A2 (en) Ai-driven defensive cybersecurity strategy analysis and recommendation system
CN111316272A (zh) 使用行为和深度分析的先进网络安全威胁减缓
US20240231909A1 (en) System and method for universal computer asset normalization and configuration management
US11366821B2 (en) Epsilon-closure for frequent pattern analysis
CN110727664A (zh) 用于对公有云数据执行目标操作的方法与设备
CN111245897B (zh) 数据处理方法、装置、系统、存储介质及处理器
CN112104663A (zh) 一种用于管理登录用户和用户设备的方法与设备
CN116418653A (zh) 基于多指标根因定位算法的故障定位方法及装置
CN112667468B (zh) 多云环境下云资源自动化运维的方法与设备
US11902309B1 (en) Anomaly prediction for electronic resources
CN112769782B (zh) 多云安全基线管理的方法与设备
CN114218586B (zh) 商业数据智能管理方法、装置、电子设备及存储介质
US20190057151A1 (en) Predictive modeling in event processing systems for big data processing in cloud
US20210092159A1 (en) System for the prioritization and dynamic presentation of digital content
CN114546705A (zh) 操作响应方法、操作响应装置、电子设备以及存储介质
US11012463B2 (en) Predicting condition of a host for cybersecurity applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Tian Xing

Inventor after: Zhang Changjian

Inventor after: Gao Haifeng

Inventor after: Zhao Ping

Inventor before: Zhang Changjian

Inventor before: Gao Haifeng

Inventor before: Zhao Ping