CN113935178A - 一种云原生混沌工程实验的爆炸半径控制系统及方法 - Google Patents

一种云原生混沌工程实验的爆炸半径控制系统及方法 Download PDF

Info

Publication number
CN113935178A
CN113935178A CN202111228466.3A CN202111228466A CN113935178A CN 113935178 A CN113935178 A CN 113935178A CN 202111228466 A CN202111228466 A CN 202111228466A CN 113935178 A CN113935178 A CN 113935178A
Authority
CN
China
Prior art keywords
drilling
explosion radius
explosion
pod
steady
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111228466.3A
Other languages
English (en)
Other versions
CN113935178B (zh
Inventor
朱柯
潘星文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Tongchuang Yongyi Technology Development Co ltd
Original Assignee
Beijing Tongchuang Yongyi Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Tongchuang Yongyi Technology Development Co ltd filed Critical Beijing Tongchuang Yongyi Technology Development Co ltd
Priority to CN202111228466.3A priority Critical patent/CN113935178B/zh
Publication of CN113935178A publication Critical patent/CN113935178A/zh
Application granted granted Critical
Publication of CN113935178B publication Critical patent/CN113935178B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/08Computing arrangements based on specific mathematical models using chaos models or non-linear system models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/02Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Analysis (AREA)
  • Nonlinear Science (AREA)
  • Algebra (AREA)
  • Computer Hardware Design (AREA)
  • Computational Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Geometry (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Numerical Control (AREA)

Abstract

本发明公开了一种云原生混沌工程实验的爆炸半径控制系统及方法,涉及云原生技术领域;本发明技术将爆炸半径的控制提前到演练计划和编排阶段,通过提前计划演练的爆炸半径,通过Kubernetes的Label,以及Network Policy机制来达到流量挡板的目的,演练过程中可以自动的识别演练是否超出了爆炸半径的定义,如果超出爆炸半径,可以自动的跳过故障的注入,另外爆炸半径外的流量是无法到达集群内,从而可以自动进行爆炸半径控制,大幅提升演练的安全控制以及演练自动化。通过配置稳态指标和阈值,实时监控演练的风险,超过预定的稳态阈值,自动终止演练,达到演练风险的自动控制。

Description

一种云原生混沌工程实验的爆炸半径控制系统及方法
技术领域
本发明涉及云原生技术领域,尤其涉及一种云原生混沌工程实验的爆炸半径控制系统及方法。
背景技术
混沌工程故障注入演练过程中,经常运行本来只会影响小部分用户的测试,却由于级联故障无意中影响到了更多的用户。在这些情况下,不得不立即中断实验。虽然不想发生这种情况,但随时遏制和停止实验的能力是必备的,这可以避免造成更大的危机。实验通过很多方法来探寻故障会造成的未知的和不可预见的影响,所以关键在于如何让这些薄弱环节曝光出来而不会因意外造成更大规模的故障。这个过程称之为“最小化爆炸半径”。
能带来最大信心的实验也是风险最大的,是对所有生产流量都有影响的实验。而混沌工程实验应该只承受可以衡量的风险,并采用递进的方式,进行的每一步实验都在前一步的基础之上。这种递进的方式不断增加对系统的信心,而不会对用户造成过多不必要的影响。
为了充分控制混沌工程演练过程中的风险,充分提升混沌工程演练的安全性,亟待提出了一种云原生下混沌工程爆炸半径控制的方法。
发明内容
本发明的目的在于提供一种云原生混沌工程实验的爆炸半径控制系统及方法,从而解决现有技术中存在的前述问题。
为了实现上述目的,本发明采用的技术方案如下:
一种云原生混沌工程实验的爆炸半径控制系统,基于Kubernetes平台资源实现混沌工程故障演练,包括演练对象分组模块、流量挡板配置模块、稳态指标配置模块和爆炸半径控制模块,所述演练对象分组模块用于在演练前通过Kubernetes的Label机制对演练对象配置Label,实现对Kubernetes的资源按照不同的爆炸半径进行分组;所述流量挡板配置模块用于演练实施的时候配置拒绝所有的入口流量,根据配置的演练对象中的演练Pod列表进行访问策略配置;所述稳态指标配置模块用于演练实施前定义演练的稳态指标以及阈值;所述爆炸半径控制模块用于演练实施过程中进行爆炸半径控制,具体的控制方法包括以下三类情况中的至少一类:
第一类:针对所有的故障注入对象,确认该对象是否在本次演练的爆炸半径内,也即是在演练编排是分配的组内;
第二类:针对外部的流量,针对配置的Network Policy实施流量挡板控制,针对本次演练编排中指定的爆炸半径内的Pod才可以接受流量,针对爆炸半径外的Pod访问会被阻止;
第三类:实施监控稳态指标变化,如果发现稳态指标超过指定的阈值,自动终止混沌实验,确保演练的安全。
优选的,所述混沌工程故障演练包括但不限于针对工作节点node注入重启,宕机,Cpu满载,网络延迟;针对Pod注入Pod网络延迟,Pod内存负载。
优选的,所述稳态指标包括系统正常运行状态时的系统指标参数,包括系统吞吐率、错误率以及99%以上的延迟;配置错误率的阈值为50%。
本发明的另一个目的在于采用所述的云原生混沌工程实验的爆炸半径控制系统实现云原生混沌工程实验的爆炸半径控制的方法,包括以下步骤:
S1,资源分组:混沌工程演练前,制作整体的演练计划,包括对所有的资源进行分组,分成1至n个组,分组包括groupA、groupB、...;每个分组中包含但不限于节点Node1,Node2、...、Pod1,Pod2...;
S2,演练编排:进行演练编排时,选择所有或部分分组配置爆炸半径,添加稳态指标及其对应的阈值,对每个节点或负载添加一个或多个演练故障;
S3,配置流量挡板:实施流量挡板配置,包含对演练对象配置Label,阻止所有入口流量,放开爆炸半径内的Pod的入口流量;
S4,实施演练:根据演练编排的内容将混沌工程的故障依次注入演练过程,注入完成后,进入环境爆炸半径恢复流程,并同时开启稳态指标监控过程。
优选的,步骤S2中具体包括:配置爆炸半径,选择演练计划中的所有,或者部分分组,表示本次演练的爆炸半径控制在选定分组的爆炸半径内,超出对爆炸半径外的资源的故障注入是不允许的;添加稳态指标和对应的阈值,定义演练过程中不能超过指定的稳态指标;添加一个或多个演练故障,演练故障是实际可能发生的一些故障,包括但不限于某节点宕机,重启,cpu负荷高;某Pod被杀死,Pod网路延迟。
优选的,步骤S3中,所述演练对象配置Label是根据演练计划的爆炸半径定义,通过Kubernetes Api或者命令对资源配置Label;所述阻止所有入口流量是通过KubernetesNetwork Policy实现为了控制演练期间只接受来自爆炸半径内的Pod的入口流量;放开爆炸半径内的Pod的入口流量,方法是遍历该演练编排的爆炸半径,爆炸半径内的Pod设置Kubernetes Network Policy,从而放开对Pod的访问。
优选的,步骤S4中,所述故障注入的过程具体包括:
S41,遍历演练编排中的注入故障定义,如果遍历结束,本次演练完成,进入S5-3实施演练的环境恢复;
S42,针对S41获取的故障定义,检查该故障注入的对象是否是本次演练的爆炸半径内,方法是获取演练对象的Label chaos/range的值,该值如果是爆炸半径内,进行实际的故障注入演练,否则跳过该故障的注入,回到S5-1继续获取下一个故障的定义;
S43,所有故障注入演练结束后,进入环境爆炸半径恢复流程,针对所有Pod恢复入口流量的访问。
优选的,步骤S4中启动稳态指标的监控具体包括:实时获取稳态指标的值,检查稳态指标的值是否超过了指定的阈值,如果超过阈值,跳转到S43,终止所有演练,并且针对所有Pod恢复入口流量的访问。
本发明的有益效果是:
本发明公开了一种云原生混沌工程实验的爆炸半径控制系统及方法,将爆炸半径的控制提前到演练计划和编排阶段,通过提前计划演练的爆炸半径,通过Kubernetes的Label,以及Network Policy机制来达到流量挡板的目的,演练过程中可以自动的识别演练是否超出了爆炸半径的定义,如果超出爆炸半径,可以自动的跳过故障的注入,另外爆炸半径外的流量是无法到达集群内,从而可以自动进行爆炸半径控制,大幅提升演练的安全控制以及演练自动化。通过配置稳态指标和阈值,实时监控演练的风险,超过预定的稳态阈值,自动终止演练,达到演练风险的自动控制。
附图说明
图1是实施例1中提供的云原生混沌工程实验的爆炸半径控制的系统原理示意图;
图2是实施例2中提供的云原生混沌工程实验的爆炸半径控制的方法流程图;
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。
实施例1
本实施例提供了一种云原生混沌工程实验的爆炸半径控制系统,基于Kubernetes平台资源实现混沌工程故障演练,Kubernetes平台资源包含工作节点Node、容器Container、工作负载Pod、Deployment、ReplicaSet、StatefulSet、DaemonSet、Job、CronJob、服务Service、存储Pv/Pvc、配置ConfigMap,Secret以及其他的自定义CRD资源。
控制系统包括演练对象分组模块、流量挡板配置模块、稳态指标配置模块和爆炸半径控制模块,所述演练对象分组模块用于在演练前通过Kubernetes的Label机制对演练对象配置Label,实现对Kubernetes的资源按照不同的爆炸半径进行分组;所述流量挡板配置模块用于演练实施的时候配置拒绝所有的入口流量,根据配置的演练对象中的演练Pod列表进行访问策略配置;所述稳态指标配置模块用于演练实施前定义演练的稳态指标以及阈值;所述爆炸半径控制模块用于演练实施过程中进行爆炸半径控制,具体的控制方法包括以下三类情况中的至少一类:
第一类:针对所有的故障注入对象,确认该对象是否在本次演练的爆炸半径内,也即是在演练编排是分配的组内;
第二类:针对外部的流量,针对配置的Network Policy实施流量挡板控制,针对本次演练编排中指定的爆炸半径内的Pod才可以接受流量,针对爆炸半径外的Pod访问会被阻止;
第三类:实施监控稳态指标变化,如果发现稳态指标超过指定的阈值,自动终止混沌实验,确保演练的安全。
本实施例中所述混沌工程故障演练包括但不限于针对工作节点node注入重启,宕机,Cpu满载,网络延迟;针对Pod注入Pod网络延迟,Pod内存负载。
本实施例中的所述稳态指标包括系统正常运行状态时的系统指标参数,包括系统吞吐率、错误率以及99%以上的延迟;配置错误率的阈值为50%。
实施例2
本实施例提供了一种采用所述的云原生混沌工程实验的爆炸半径控制系统实现云原生混沌工程实验的爆炸半径控制的方法,包括以下步骤:
S1,资源分组:混沌工程演练前,制作整体的演练计划,包括对所有的资源进行分组,分成1至n个组,分组包括groupA、groupB、...;每个分组中包含但不限于节点Node1,Node2、...、Pod1,Pod2...;
S2,演练编排:进行演练编排时,选择所有或部分分组配置爆炸半径,添加稳态指标及其对应的阈值,对每个节点或负载添加一个或多个演练故障;
演练计划中可以加入多个演练编排,演练计划以及所有的编排需要经过审批之后才能实施,并且审批完成后需要通知所有关系人,尽可能提前控制演练的风险。
S3,配置流量挡板:在演练计划被批准后,实施演练前,需要流量挡板配置,包含对演练对象配置Label,阻止所有入口流量,放开爆炸半径内的Pod的入口流量;
S4,实施演练:根据演练编排的内容将混沌工程的故障依次注入演练过程,注入完成后,进入环境爆炸半径恢复流程,并同时开启稳态指标监控过程。
故障注入的方式方法本专利不做描述,采用传统的混沌工程故障注入方法即可。比如Node关机可以使用shutdown命令。
步骤S2中具体包括:配置爆炸半径,选择演练计划中的所有,或者部分分组,表示本次演练的爆炸半径控制在选定分组的爆炸半径内,超出对爆炸半径外的资源的故障注入是不允许的。比如选择groupA、groupB,表示本次演练的爆炸半径控制在groupA和groupB内,超出对爆炸半径外的资源的故障注入是不允许的;添加稳态指标和对应的阈值,定义演练过程中不能超过指定的稳态指标;添加一个或多个演练故障,演练故障是实际可能发生的一些故障,包括但不限于某节点宕机,重启,cpu负荷高;某Pod被杀死,Pod网路延迟。
本实施例中的步骤S3中,所述演练对象配置Label是根据演练计划的爆炸半径定义,通过Kubernetes Api或者命令对资源配置Label。比如爆炸半径groupA内有node1,配置label的方法是:kubectl label node1 chaos/range=groupA;所述阻止所有入口流量是通过Kubernetes Network Policy实现为了控制演练期间只接受来自爆炸半径内的Pod的入口流量;放开爆炸半径内的Pod的入口流量,方法是遍历该演练编排的爆炸半径,爆炸半径内的Pod设置Kubernetes Network Policy,从而放开对Pod的访问。
本实施例中,步骤S4中,所述故障注入的过程具体包括:
S41,遍历演练编排中的注入故障定义,如果遍历结束,本次演练完成,进入S5-3实施演练的环境恢复;
S42,针对S41获取的故障定义,检查该故障注入的对象是否是本次演练的爆炸半径内,方法是获取演练对象的Label chaos/range的值,该值如果是爆炸半径内,进行实际的故障注入演练,否则跳过该故障的注入,回到S5-1继续获取下一个故障的定义;
S43,所有故障注入演练结束后,进入环境爆炸半径恢复流程,针对所有Pod恢复入口流量的访问。
步骤S4中启动稳态指标的监控具体包括:实时获取稳态指标的值,检查稳态指标的值是否超过了指定的阈值,如果超过阈值,跳转到S43,终止所有演练,并且针对所有Pod恢复入口流量的访问。
通过采用本发明公开的上述技术方案,得到了如下有益的效果:
本发明公开了一种云原生混沌工程实验的爆炸半径控制系统及方法,将爆炸半径的控制提前到演练计划和编排阶段,通过提前计划演练的爆炸半径,通过Kubernetes的Label,以及Network Policy机制来达到流量挡板的目的,演练过程中可以自动的识别演练是否超出了爆炸半径的定义,如果超出爆炸半径,可以自动的跳过故障的注入,另外爆炸半径外的流量是无法到达集群内,从而可以自动进行爆炸半径控制,大幅提升演练的安全控制以及演练自动化。通过配置稳态指标和阈值,实时监控演练的风险,超过预定的稳态阈值,自动终止演练,达到演练风险的自动控制。
本发明在提供混沌演练一键终止的基础上,通过对演练对象的基于标签进行分组,灵活的控制演练范围。通过基于Kubernetes Network Policy流量挡板的方式对流量截流,尽可能的减少对实际业务的影响。通过对演练范围的逐步扩大来控制演练的力度,全面控制演练过程中的风险。通过对稳态指标的监控,自动地发现演练中的风险,如果有风险自动终止实验,克服了现有传统的混沌工程演练平台只是停留在一键终止的缺陷。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。

Claims (8)

1.一种云原生混沌工程实验的爆炸半径控制系统,其特征在于,基于Kubernetes平台资源实现混沌工程故障演练,包括演练对象分组模块、流量挡板配置模块、稳态指标配置模块和爆炸半径控制模块,所述演练对象分组模块用于在演练前通过Kubernetes的Label机制对演练对象配置Label,实现对Kubernetes的资源按照不同的爆炸半径进行分组;所述流量挡板配置模块用于演练实施的时候配置拒绝所有的入口流量,根据配置的演练对象中的演练Pod列表进行访问策略配置;所述稳态指标配置模块用于演练实施前定义演练的稳态指标以及阈值;所述爆炸半径控制模块用于演练实施过程中进行爆炸半径控制,具体的控制方法包括以下三类情况中的至少一类:
第一类:针对所有的故障注入对象,确认该对象是否在本次演练的爆炸半径内,也即是在演练编排是分配的组内;
第二类:针对外部的流量,针对配置的Network Policy实施流量挡板控制,针对本次演练编排中指定的爆炸半径内的Pod才可以接受流量,针对爆炸半径外的Pod访问会被阻止;
第三类:实施监控稳态指标变化,如果发现稳态指标超过指定的阈值,自动终止混沌实验,确保演练的安全。
2.根据权利要求1所述的云原生混沌工程实验的爆炸半径控制系统,其特征在于,所述混沌工程故障演练包括但不限于针对工作节点node注入重启,宕机,Cpu满载,网络延迟;针对Pod注入Pod网络延迟,Pod内存负载。
3.根据权利要求1所述的云原生混沌工程实验的爆炸半径控制系统,其特征在于,所述稳态指标包括系统正常运行状态时的系统指标参数,包括系统吞吐率、错误率以及99%以上的延迟;配置错误率的阈值为50%。
4.采用权利要求1-3任一所述的云原生混沌工程实验的爆炸半径控制系统实现云原生混沌工程实验的爆炸半径控制的方法,其特征在于,包括以下步骤:
S1,资源分组:混沌工程演练前,制作整体的演练计划,包括对所有的资源进行分组,分成1至n个组,分组包括groupA、groupB、...;每个分组中包含但不限于节点Node1,Node2、...、Pod1,Pod2...;
S2,演练编排:进行演练编排时,选择所有或部分分组配置爆炸半径,添加稳态指标及其对应的阈值,对每个节点或负载添加一个或多个演练故障;
S3,配置流量挡板:实施流量挡板配置,包含对演练对象配置Label,阻止所有入口流量,放开爆炸半径内的Pod的入口流量;
S4,实施演练:根据演练编排的内容将混沌工程的故障依次注入演练过程,注入完成后,进入环境爆炸半径恢复流程,并同时开启稳态指标监控过程。
5.根据权利要求4所述的云原生混沌工程实验的爆炸半径控制的方法,其特征在于,步骤S2中具体包括:配置爆炸半径,选择演练计划中的所有,或者部分分组,表示本次演练的爆炸半径控制在选定分组的爆炸半径内,超出对爆炸半径外的资源的故障注入是不允许的;添加稳态指标和对应的阈值,定义演练过程中不能超过指定的稳态指标;添加一个或多个演练故障,演练故障是实际可能发生的一些故障,包括但不限于某节点宕机,重启,cpu负荷高;某Pod被杀死,Pod网路延迟。
6.根据权利要求4所述的云原生混沌工程实验的爆炸半径控制的方法,其特征在于,步骤S3中,所述演练对象配置Label是根据演练计划的爆炸半径定义,通过Kubernetes Api或者命令对资源配置Label;所述阻止所有入口流量是通过Kubernetes Network Policy实现为了控制演练期间只接受来自爆炸半径内的Pod的入口流量;放开爆炸半径内的Pod的入口流量,方法是遍历该演练编排的爆炸半径,爆炸半径内的Pod设置Kubernetes NetworkPolicy,从而放开对Pod的访问。
7.根据权利要求4所述的云原生混沌工程实验的爆炸半径控制的方法,其特征在于,步骤S4中,所述故障注入的过程具体包括:
S41,遍历演练编排中的注入故障定义,如果遍历结束,本次演练完成,进入S5-3实施演练的环境恢复;
S42,针对S41获取的故障定义,检查该故障注入的对象是否是本次演练的爆炸半径内,方法是获取演练对象的Label chaos/range的值,该值如果是爆炸半径内,进行实际的故障注入演练,否则跳过该故障的注入,回到S5-1继续获取下一个故障的定义;
S43,所有故障注入演练结束后,进入环境爆炸半径恢复流程,针对所有Pod恢复入口流量的访问。
8.根据权利要求7所述的云原生混沌工程实验的爆炸半径控制的方法,其特征在于,步骤S4中启动稳态指标的监控具体包括:实时获取稳态指标的值,检查稳态指标的值是否超过了指定的阈值,如果超过阈值,跳转到S43,终止所有演练,并且针对所有Pod恢复入口流量的访问。
CN202111228466.3A 2021-10-21 2021-10-21 一种云原生混沌工程实验的爆炸半径控制系统及方法 Active CN113935178B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111228466.3A CN113935178B (zh) 2021-10-21 2021-10-21 一种云原生混沌工程实验的爆炸半径控制系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111228466.3A CN113935178B (zh) 2021-10-21 2021-10-21 一种云原生混沌工程实验的爆炸半径控制系统及方法

Publications (2)

Publication Number Publication Date
CN113935178A true CN113935178A (zh) 2022-01-14
CN113935178B CN113935178B (zh) 2022-09-16

Family

ID=79280954

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111228466.3A Active CN113935178B (zh) 2021-10-21 2021-10-21 一种云原生混沌工程实验的爆炸半径控制系统及方法

Country Status (1)

Country Link
CN (1) CN113935178B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114609995A (zh) * 2022-03-04 2022-06-10 亚信科技(南京)有限公司 故障控制方法、装置、系统、设备、介质及产品
CN115081653A (zh) * 2022-07-27 2022-09-20 南京争锋信息科技有限公司 一种多环境多架构混沌工程全生命周期管控方法及系统
CN115438518A (zh) * 2022-11-08 2022-12-06 恒丰银行股份有限公司 一种基于混沌理念的故障模拟应用系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180254727A1 (en) * 2015-11-12 2018-09-06 Xi'an University Of Technology Method of realizing single direction chaotic rotation speed of permanent magnet synchronous motor
CN110308969A (zh) * 2019-06-26 2019-10-08 深圳前海微众银行股份有限公司 故障演练方法、装置、设备及计算机存储介质
CN110661657A (zh) * 2019-09-23 2020-01-07 中国—东盟信息港股份有限公司 一种Kubernetes云原生应用的网络安全监控方法及其系统
CN112464497A (zh) * 2020-12-16 2021-03-09 江苏满运物流信息有限公司 基于分布式系统的故障演练方法、装置、设备及介质
CN112540887A (zh) * 2020-12-16 2021-03-23 北京奇艺世纪科技有限公司 故障演练方法、装置、电子设备及存储介质
CN112631846A (zh) * 2020-12-25 2021-04-09 广州品唯软件有限公司 一种故障演练方法、装置、计算机设备及存储介质
CN112988494A (zh) * 2021-03-15 2021-06-18 北京字跳网络技术有限公司 异常测试方法、设备及电子设备
CN113010393A (zh) * 2021-02-25 2021-06-22 北京四达时代软件技术股份有限公司 基于混沌工程的故障演练方法及装置
US20210263836A1 (en) * 2020-02-20 2021-08-26 Jpmorgan Chase Bank, N.A. Chaos engineering trials

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180254727A1 (en) * 2015-11-12 2018-09-06 Xi'an University Of Technology Method of realizing single direction chaotic rotation speed of permanent magnet synchronous motor
CN110308969A (zh) * 2019-06-26 2019-10-08 深圳前海微众银行股份有限公司 故障演练方法、装置、设备及计算机存储介质
CN110661657A (zh) * 2019-09-23 2020-01-07 中国—东盟信息港股份有限公司 一种Kubernetes云原生应用的网络安全监控方法及其系统
US20210263836A1 (en) * 2020-02-20 2021-08-26 Jpmorgan Chase Bank, N.A. Chaos engineering trials
CN112464497A (zh) * 2020-12-16 2021-03-09 江苏满运物流信息有限公司 基于分布式系统的故障演练方法、装置、设备及介质
CN112540887A (zh) * 2020-12-16 2021-03-23 北京奇艺世纪科技有限公司 故障演练方法、装置、电子设备及存储介质
CN112631846A (zh) * 2020-12-25 2021-04-09 广州品唯软件有限公司 一种故障演练方法、装置、计算机设备及存储介质
CN113010393A (zh) * 2021-02-25 2021-06-22 北京四达时代软件技术股份有限公司 基于混沌工程的故障演练方法及装置
CN112988494A (zh) * 2021-03-15 2021-06-18 北京字跳网络技术有限公司 异常测试方法、设备及电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
吉吉·赛凡: "《Kubernetes微服务实战》", 31 July 2020 *
王阳: ""基于微服务架构的云容器管理系统设计与实现"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114609995A (zh) * 2022-03-04 2022-06-10 亚信科技(南京)有限公司 故障控制方法、装置、系统、设备、介质及产品
CN115081653A (zh) * 2022-07-27 2022-09-20 南京争锋信息科技有限公司 一种多环境多架构混沌工程全生命周期管控方法及系统
CN115438518A (zh) * 2022-11-08 2022-12-06 恒丰银行股份有限公司 一种基于混沌理念的故障模拟应用系统

Also Published As

Publication number Publication date
CN113935178B (zh) 2022-09-16

Similar Documents

Publication Publication Date Title
CN113935178B (zh) 一种云原生混沌工程实验的爆炸半径控制系统及方法
CN103745293B (zh) 一种rcm分析方法
CN110308969A (zh) 故障演练方法、装置、设备及计算机存储介质
CN106951559A (zh) 分布式文件系统中数据恢复方法及电子设备
CN110989562B (zh) 一种阀控系统的测试系统及方法
CN109005198A (zh) 一种控制器防攻击安全策略生成方法及系统
CN107885140B (zh) 一种分级整星自主应急管理方法和系统
CN110474327B (zh) 配电网cps信息-物理组合预想故障生成方法及系统
CN100576805C (zh) 对象补救系统及方法
CN105717877B (zh) 基于顺控流程的抽水蓄能机组运行工况校验方法及装置
CN107870777A (zh) 一种热补丁实现方法及装置、终端
CN109995554A (zh) 多级数据中心主备切换的控制方法及云调度指挥器
CN106547609B (zh) 一种事件处理方法和设备
CN110503272B (zh) 满足安全稳定要求的限制短路电流辅助决策方法及系统
CN107124316B (zh) 一种数据通信设备中基于硬件的快速倒换动作实现方法
CN112948065B (zh) 基于Kubernetes的调度自动化系统管理装置
CN106534201A (zh) 一种sdn环境下的虚拟机风险快速隔离方法
CN108082214A (zh) 基于轨道交通scada的一键运行应急响应系统
CN209821633U (zh) 油田控制系统的CCR-FARs结构
CN106896792A (zh) 数据同步方法及装置
CN111682971A (zh) 一种物流系统资源自动化管理方法
Meng et al. A rejuvenation model for software system under normal attack
CN117610027B (zh) 一种私有协议漏洞检测方法及系统
CN112622927A (zh) 一种车辆驾驶控制方法、装置、电子设备和存储介质
CN110188539A (zh) 一种运行应用的方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant