CN113704052B - 一种微服务架构的运维系统、方法、设备及介质 - Google Patents

一种微服务架构的运维系统、方法、设备及介质 Download PDF

Info

Publication number
CN113704052B
CN113704052B CN202110826630.4A CN202110826630A CN113704052B CN 113704052 B CN113704052 B CN 113704052B CN 202110826630 A CN202110826630 A CN 202110826630A CN 113704052 B CN113704052 B CN 113704052B
Authority
CN
China
Prior art keywords
service
micro
maintenance
cluster
recovery
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110826630.4A
Other languages
English (en)
Other versions
CN113704052A (zh
Inventor
王文潇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN202110826630.4A priority Critical patent/CN113704052B/zh
Publication of CN113704052A publication Critical patent/CN113704052A/zh
Application granted granted Critical
Publication of CN113704052B publication Critical patent/CN113704052B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display

Abstract

本申请公开了一种微服务架构的运维系统、方法、设备及介质,包括:若干运维服务平台,其中,任一所述运维服务平台用于维护部署在与其唯一对应的集群中的微服务,并且,任一所述运维服务平台,包括:微服务监听模块,用于实时收集对应集群中各微服务的各项运行数据;集群告警模块,用于判断所述各项运行数据是否满足预设告警条件,若满足,则判定相应的所述微服务状态异常,并生成相应的告警信息;异常处理模块,用于根据所述告警信息调用相应的恢复策略,对相应的所述微服务进行恢复处理。能够有效的实现集群微服务架构的运维,降低运维人员的运维压力。

Description

一种微服务架构的运维系统、方法、设备及介质
技术领域
本申请涉及微服务技术领域,特别涉及一种微服务架构的运维系统、方法、设备及介质。
背景技术
随着信息技术的飞速发展,硬件和软件领域也产生了翻天覆地的变化,业务场景的不断复杂化驱使着信息技术工程师对现有的技术进行迭代升级,改良硬件系统和软件系统的架构,以满足用户需求,应对极端场景的产生,增加系统对抗的风险的能力。微服务是近些年被广泛应用的软件架构,该架构将原先那些重量级的耦合严重的单体应用进行功能性的分割,打散为一个个独立的应用单元,每个应用单元各司其职,并提供相应的接口供其他应用调用,从而大大降低了应用功能间的耦合性。面对一项新功能模块开发,只需要单独创建一个微服务去承载其业务流量即可,不会对现有逻辑进行侵入,而是以插件的形式嵌入到系统中。
然而随着业务逻辑的膨胀,微服务的体量和数量也在一直扩张,微服务间的通讯也变得越来越频繁和复杂。特别地,会有某些核心微服务承载大部分业务流量,这些微服务的健康关系着整个软件系统的平稳运行,如果这些比较重要的微服务由于某些原因不能及时返回响应,则会导致很多请求超时,影响系统的正常运转。有些微服务是需要在每个服务器上运行的,需要跟服务器绑定到一起,当服务器集群达到一定规模的时候,微服务的规模也将会比较庞大,因此将会给集群运维人员带来较大的运维压力,大规模的微服务已经不适合人工运维了。
发明内容
有鉴于此,本申请的目的在于提供一种微服务架构的运维系统、方法、设备及介质,能够有效的实现集群微服务架构的运维,降低运维人员的运维压力。其具体方案如下:
第一方面,本申请公开了一种微服务架构的运维系统,包括:若干运维服务平台,其中,任一所述运维服务平台用于维护部署在与其唯一对应的集群中的微服务,并且,任一所述运维服务平台,包括:
微服务监听模块,用于实时收集对应集群中各微服务的各项运行数据;
集群告警模块,用于判断所述各项运行数据是否满足预设告警条件,若满足,则判定相应的所述微服务状态异常,并生成相应的告警信息;
异常处理模块,用于根据所述告警信息调用相应的恢复策略,对相应的所述微服务进行恢复处理。
可选的,所述微服务监听模块,还用于:
将所述运行数据存储至对应集群的监控数据库。
可选的,所述集群告警模块,具体用于:
根据预设优先级依次判断各项运行数据是否满足各自对应的预设告警条件,当任一项运行数据满足,则判定相应的所述微服务状态异常,并生成相应的告警信息。
可选的,所述运维服务平台,还包括:
服务管理模块,用于基于所述告警信息,生成相应的恢复任务;
其中,所述告警信息的类别与所述恢复任务的类型一一对应。
可选的,所述异常处理模块,具体用于:
为所述恢复任务匹配相应的恢复策略,对相应的所述微服务进行恢复处理。
可选的,所述服务管理模块,具体用于:
基于所述告警信息,生成相应的恢复任务并将该恢复任务添加至任务数据库;
相应的,所述异常处理模块,具体用于:轮询所述任务数据库,当发现存在新建的恢复任务,则为该恢复任务匹配相应的恢复策略,对相应的所述微服务进行恢复处理。
可选的,还包括:
运维控制模块,用于基于各所述运维服务平台对应的集群的集群规模实时调整集群数量和各集群包括的服务器。
第二方面,本申请公开了一种微服务架构的运维方法,包括:利用若干运维服务平台分别执行:
实时收集对应集群中各微服务的各项运行数据;
判断所述各项运行数据是否满足预设告警条件,若满足,则判定相应的所述微服务状态异常,并生成相应的告警信息;
根据所述告警信息调用相应的恢复策略,对相应的所述微服务进行恢复处理;
其中,任一所述运维服务平台用于维护部署在与其唯一对应的集群中的微服务。
第三方面,本申请公开了一种电子设备,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现前述的微服务架构的运维方法。
第四方面,本申请公开了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现前述的微服务架构的运维方法。
可见,本申请实施例公开的微服务架构的运维系统,包括:若干运维服务平台,其中,任一所述运维服务平台用于维护部署在与其唯一对应的集群中的微服务,并且,任一所述运维服务平台,包括:微服务监听模块,用于实时收集对应集群中各微服务的各项运行数据;集群告警模块,用于判断所述各项运行数据是否满足预设告警条件,若满足,则判定相应的所述微服务状态异常,并生成相应的告警信息;异常处理模块,用于根据所述告警信息调用相应的恢复策略,对相应的所述微服务进行恢复处理。也即,本申请部署若干运维服务平台,每个运维服务平台维护对应集群中的微服务,实时的收集各微服务的各项运行数据,判断各项运行数据是否满足预设告警条件,若满足,则基于告警信息调用相应的恢复策略对微服务进行恢复处理。这样,能够有效的实现集群微服务架构的运维,降低运维人员的运维压力。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种微服务架构的运维系统结构示意图;
图2为本申请公开的一种具体的运维服务平台结构示意图;
图3为本申请公开的一种具体的运维服务平台结构示意图;
图4为本申请公开的一种具体的微服务架构的运维系统结构示意图;
图5为本申请公开的一种具体的微服务架构的运维系统结构示意图;
图6为本申请公开的一种微服务架构的运维方法流程图;
图7为本申请公开的一种电子设备结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
目前,随着业务逻辑的膨胀,微服务的体量和数量也在一直扩张,微服务间的通讯也变得越来越频繁和复杂。特别地,会有某些核心微服务承载大部分业务流量,这些微服务的健康关系着整个软件系统的平稳运行,如果这些比较重要的微服务由于某些原因不能及时返回响应,则会导致很多请求超时,影响系统的正常运转。有些微服务是需要在每个服务器上运行的,需要跟服务器绑定到一起,当服务器集群达到一定规模的时候,微服务的规模也将会比较庞大,因此将会给集群运维人员带来较大的运维压力,大规模的微服务已经不适合人工运维了。为此,本申请提供了一种微服务架构的运维方案,能够有效的实现集群微服务架构的运维,降低运维人员的运维压力。
参见图1所示,本申请实施例公开了微服务架构的运维系统,包括:若干运维服务平台,其中,任一所述运维服务平台用于维护部署在与其唯一对应的集群中的微服务,并且,任一所述运维服务平台,包括:
微服务监听模块11,用于实时收集对应集群中各微服务的各项运行数据。
在具体的实施方式中,可以将所述运行数据存储至对应集群的监控数据库。并且,每个集群均可以对应一个监控数据库,也即,不同集群中的微服务的运行数据可以存入不同的数据库。
并且,微服务监听模块11,可以部署于集群中的每个服务器,收集每个服务器上的各个微服务的运行数据。
其中,所述运行数据包括但不限于微服务的响应时长、微服务是否存活信息等。
集群告警模块12,用于判断所述各项运行数据是否满足预设告警条件,若满足,则判定相应的所述微服务状态异常,并生成相应的告警信息。
在具体的实施方式中,可以根据预设优先级依次判断各项运行数据是否满足各自对应的预设告警条件,当任一项运行数据满足,则判定相应的所述微服务状态异常,并生成相应的告警信息。
例如,根据预设优先级先判断微服务是否存活信息为微服务存活,则判断微服务的响应时长是否持续大于预设告警阈值,若是,则判定相应的微服务状态异常,并生成相应的告警信息。其中,连续大于所述预设告警阈值的数据条数大于预设次数阈值,则判定微服务的响应时长持续大于预设告警阈值。若微服务是否存活信息为微服务不存活,则直接判定相应的微服务状态异常。
在具体的实施方式中,微服务模块分析监控数据库中的各微服务的运行数据,筛选出异常数据进行告警。
并且,集群告警模块12,具有用于基于预设轮询间隔判断所述各项运行数据是否满足预设告警条件,若满足,则判定相应的所述微服务状态异常,并生成相应的告警信息。
异常处理模块13,用于根据所述告警信息调用相应的恢复策略,对相应的所述微服务进行恢复处理。
可见,本申请实施例公开的微服务架构的运维系统,包括:若干运维服务平台,其中,任一所述运维服务平台用于维护部署在与其唯一对应的集群中的微服务,并且,任一所述运维服务平台,包括:微服务监听模块,用于实时收集对应集群中各微服务的各项运行数据;集群告警模块,用于判断所述各项运行数据是否满足预设告警条件,若满足,则判定相应的所述微服务状态异常,并生成相应的告警信息;异常处理模块,用于根据所述告警信息调用相应的恢复策略,对相应的所述微服务进行恢复处理。也即,本申请部署若干运维服务平台,每个运维服务平台维护对应集群中的微服务,实时的收集各微服务的各项运行数据,判断各项运行数据是否满足预设告警条件,若满足,则基于告警信息调用相应的恢复策略对微服务进行恢复处理。这样,能够有效的实现集群微服务架构的运维,降低运维人员的运维压力。
参见图2所示,本申请实施例公开了一种具体的运维服务平台,包括:
微服务监听模块21,用于实时收集对应集群中各微服务的各项运行数据。
集群告警模块22,用于判断所述各项运行数据是否满足预设告警条件,若满足,则判定相应的所述微服务状态异常,并生成相应的告警信息。
服务管理模块23,用于基于所述告警信息,生成相应的恢复任务。
其中,所述告警信息的类别与所述恢复任务的类型一一对应。
在具体的实施方式中,服务管理模块23用于实时接收集群告警模块22的告警信息,并根据告警信息自动生成恢复任务,恢复任务的类型根据告警类别进行一一映射,比如告警信息是微服务不存活,则设置恢复任务的类型为“重启微服务”;比如某台服务器多个微服务都出现异常,则设置恢复任务的类型为“重启服务器”。
异常处理模块24,用于根据所述告警信息调用相应的恢复策略,对相应的所述微服务进行恢复处理。
在具体的实施方式中,为所述恢复任务匹配相应的恢复策略,对相应的所述微服务进行恢复处理。
进一步的,在具体的实施方式中,所述服务管理模块23,具体用于:基于所述告警信息,生成相应的恢复任务并将该恢复任务添加至任务数据库;
相应的,所述异常处理模块24,具体用于:轮询所述任务数据库,当发现存在新建的恢复任务,则为该恢复任务匹配相应的恢复策略,对相应的所述微服务进行恢复处理。
例如,参见图3所示,图3为本申请实施例公开的一种具体的运维服务平台结构示意图。在具体的实施方式中,微服务异常告警过程:1)微服务监听模块收集每个服务器节点上的微服务信息。具体的,在每个服务器上启动一个微服务监听模块,负责收集各个微服务的信息,包括微服务的响应时长,微服务是否存活等,将收集到的信息统计存储到监控数据库。2)设置集群告警模块,分析微服务监控数据,筛选异常数据进行告警,包括:设置告警阈值,该阈值用来与微服务的监控信息进行对比。设置轮询间隔,该间隔表示集群告警模块对监控数据的处理时间间隔。告警判定,如果微服务某项监控数据一直在阈值以上,则判定该微服务进入了异常状态,需要进行干预。告警模块将告警信息,包括微服务的具体异常信息,以及微服务所在的服务器信息上报给服务管理模块。3)服务管理模块接收告警模块推送的告警信息,根据规则生成恢复任务。包括:接收来自告警模块的告警信息,解析微服务告警内容。根据告警内容,确定启用何种恢复任务,对微服务进行恢复操作,确定恢复操作后,自动生成一条任务记录存入任务数据库中。4)异常处理模块实时扫描任务数据库中的任务记录,根据任务执行相关恢复操作。轮询任务数据库,当发现有新建任务记录时,则匹配相应的恢复策略。到相应的服务器上,对该微服务进行恢复处理操作。处理完成之后,回调服务管理模块的结构,更新任务的状态。
参见图4所示,本申请实施例公开了一种具体的微服务架构的运维系统,包括:
若干运维服务平台31,其中,任一所述运维服务平台用于维护部署在与其唯一对应的集群中的微服务,并且,任一所述运维服务平台,包括:
微服务监听模块,用于实时收集对应集群中各微服务的各项运行数据;
集群告警模块,用于判断所述各项运行数据是否满足预设告警条件,若满足,则判定相应的所述微服务状态异常,并生成相应的告警信息;
异常处理模块,用于根据所述告警信息调用相应的恢复策略,对相应的所述微服务进行恢复处理。
运维控制模块32,用于基于各所述运维服务平台对应的集群的集群规模实时调整集群数量和各集群包括的服务器。
在具体的实施方式中,可以基于各所述运维服务平台对应的集群的集群规模以及服务器的运行数据实时调整集群数量和各集群包括的服务器。
具体的,可以基于各所述运维服务平台对应的集群的集群规模以及服务器的运行数据,并采用聚类算法,对各集群中的服务器进行聚类,形成新的集群,每个集群部署一个运维服务平台。
在具体的实施方式中,本实施例可以,若当前存在一个集群,运维控制模块32,实时监控该集群大小。当发现集群超过预设规模时,则把集群分配为若干个小集群。分裂运维服务平台,为每个小集群自动配置运维服务平台。每个运维服务平台独立运行,分管各自小集群,对异常微服务进行恢复处理。
例如,参见图5所示,本申请实施例公开了一种具体的微服务架构的运维系统。包括若干运维服务平台和运维控制模块,在具体的实施方式中,对于每个运维服务平台,设置微服务监听模块,该模块会部署在每个服务器上,用来收集微服务的基本信息,包括微服务响应时长、微服务是否存活等信息,然后将收集到的信息存入数据库中间件,为集群告警模块提供必要的数据。设置集群告警模块,该模块负责筛选鉴别各个微服务的监控信息,查看是否有异常数据,如果存在异常数据,说明该微服务的状态是异常的,此时需要进行告警操作,及时通知到服务管理模块。设置服务管理模块,该模块会实时接收告警模块的告警信息,并根据告警信息自动生成恢复任务,设置异常处理模块,该模块负责轮询服务管理模块生成的恢复任务,并根据相应的任务去具体服务器执行恢复任务,并将执行结果告知服务管理模块。进一步的,设置运维控制模块,该模块会实时监控集群规模,当集群在扩或缩容到一定规模时,分裂或者合并相应的运维服务平台,保证运维服务平台在其适应的集群规模下工作。通过这种方式,可以更好地运维集群中的微服务,自动管控服务器集群微服务,针对微服务的异常状态进行自动恢复操作。同时,运维控制模块,可以根据集群大小进行部署调整。
参见图6所示,本申请实施例公开了一种微服务架构的运维方法,包括:利用若干运维服务平台分别执行:
步骤S11:实时收集对应集群中各微服务的各项运行数据。
在具体的实施方式中,将所述运行数据存储至对应集群的监控数据库。
步骤S12:判断所述各项运行数据是否满足预设告警条件,若满足,则判定相应的所述微服务状态异常,并生成相应的告警信息。
在具体的实施方式中,可以根据预设优先级依次判断各项运行数据是否满足各自对应的预设告警条件,当任一项运行数据满足,则判定相应的所述微服务状态异常,并生成相应的告警信息。
进一步的,可以基于所述告警信息,生成相应的恢复任务;其中,所述告警信息的类别与所述恢复任务的类型一一对应。
步骤S13:根据所述告警信息调用相应的恢复策略,对相应的所述微服务进行恢复处理。其中,任一所述运维服务平台用于维护部署在与其唯一对应的集群中的微服务。
在具体的实施方式中,可以为所述恢复任务匹配相应的恢复策略,对相应的所述微服务进行恢复处理。
并且,具体的,可以基于所述告警信息,生成相应的恢复任务并将该恢复任务添加至任务数据库;轮询所述任务数据库,当发现存在新建的恢复任务,则为该恢复任务匹配相应的恢复策略,对相应的所述微服务进行恢复处理。
进一步的,本实施例还可以基于各所述运维服务平台对应的集群的集群规模实时调整集群数量和各集群包括的服务器。
可见,本申请实施例公开利用若干运维服务平台分别执行:实时收集对应集群中各微服务的各项运行数据;判断所述各项运行数据是否满足预设告警条件,若满足,则判定相应的所述微服务状态异常,并生成相应的告警信息;根据所述告警信息调用相应的恢复策略,对相应的所述微服务进行恢复处理;其中,任一所述运维服务平台用于维护部署在与其唯一对应的集群中的微服务。也即,本申请部署若干运维服务平台,每个运维服务平台维护对应集群中的微服务,实时的收集各微服务的各项运行数据,判断各项运行数据是否满足预设告警条件,若满足,则基于告警信息调用相应的恢复策略对微服务进行恢复处理。这样,能够有效的实现集群微服务架构的运维,降低运维人员的运维压力。
参见图7所示,本申请实施例公开了一种电子设备20,包括处理器21和存储器22;其中,所述存储器22,用于保存计算机程序;所述处理器21,用于执行所述计算机程序,前述实施例公开的微服务架构的运维方法。
关于上述微服务架构的运维方法的具体过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
并且,所述存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,存储方式可以是短暂存储或者永久存储。
另外,所述电子设备20还包括电源23、通信接口24、输入输出接口25和通信总线26;其中,所述电源23用于为所述电子设备20上的各硬件设备提供工作电压;所述通信接口24能够为所述电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;所述输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
进一步的,本申请实施例还公开了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述实施例公开的微服务架构的运维方法。
关于上述微服务架构的运维方法的具体过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的方法而言,由于其与实施例公开的系统相对应,所以描述的比较简单,相关之处参见系统部分说明即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的一种微服务架构的运维系统、方法、设备及介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (7)

1.一种微服务架构的运维系统,其特征在于,包括:若干运维服务平台,其中,任一所述运维服务平台用于维护部署在与其唯一对应的集群中的微服务,并且,任一所述运维服务平台,包括:
微服务监听模块,用于实时收集对应集群中各微服务的各项运行数据;
集群告警模块,用于判断所述各项运行数据是否满足预设告警条件,若满足,则判定相应的所述微服务状态异常,并生成相应的告警信息;
异常处理模块,用于根据所述告警信息调用相应的恢复策略,对相应的所述微服务进行恢复处理;
其中,所述运维服务平台,还包括:
服务管理模块,用于基于所述告警信息,生成相应的恢复任务;其中,所述告警信息的类别与所述恢复任务的类型一一对应;相应的,所述异常处理模块,具体用于:为所述恢复任务匹配相应的恢复策略,对相应的所述微服务进行恢复处理;
并且,所述系统还包括:运维控制模块,用于基于各所述运维服务平台对应的集群的集群规模实时调整集群数量和各集群包括的服务器。
2.根据权利要求1所述的微服务架构的运维系统,其特征在于,所述微服务监听模块,还用于:
将所述运行数据存储至对应集群的监控数据库。
3.根据权利要求1所述的微服务架构的运维系统,其特征在于,所述集群告警模块,具体用于:
根据预设优先级依次判断各项运行数据是否满足各自对应的预设告警条件,当任一项运行数据满足,则判定相应的所述微服务状态异常,并生成相应的告警信息。
4.根据权利要求1所述的微服务架构的运维系统,其特征在于,所述服务管理模块,具体用于:
基于所述告警信息,生成相应的恢复任务并将该恢复任务添加至任务数据库;
相应的,所述异常处理模块,具体用于:轮询所述任务数据库,当发现存在新建的恢复任务,则为该恢复任务匹配相应的恢复策略,对相应的所述微服务进行恢复处理。
5.一种微服务架构的运维方法,其特征在于,包括:利用若干运维服务平台分别执行:
实时收集对应集群中各微服务的各项运行数据;
判断所述各项运行数据是否满足预设告警条件,若满足,则判定相应的所述微服务状态异常,并生成相应的告警信息;
根据所述告警信息调用相应的恢复策略,对相应的所述微服务进行恢复处理;
其中,任一所述运维服务平台用于维护部署在与其唯一对应的集群中的微服务;
所述运维服务平台还用于:基于所述告警信息,生成相应的恢复任务;其中,所述告警信息的类别与所述恢复任务的类型一一对应;相应的,所述根据所述告警信息调用相应的恢复策略,对相应的所述微服务进行恢复处理,包括:为所述恢复任务匹配相应的恢复策略,对相应的所述微服务进行恢复处理;
并且,所述方法还包括:基于各所述运维服务平台对应的集群的集群规模实时调整集群数量和各集群包括的服务器。
6.一种电子设备,其特征在于,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现如权利要求5所述的微服务架构的运维方法。
7.一种计算机可读存储介质,其特征在于,用于保存计算机程序,所述计算机程序被处理器执行时实现如权利要求5所述的微服务架构的运维方法。
CN202110826630.4A 2021-07-21 2021-07-21 一种微服务架构的运维系统、方法、设备及介质 Active CN113704052B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110826630.4A CN113704052B (zh) 2021-07-21 2021-07-21 一种微服务架构的运维系统、方法、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110826630.4A CN113704052B (zh) 2021-07-21 2021-07-21 一种微服务架构的运维系统、方法、设备及介质

Publications (2)

Publication Number Publication Date
CN113704052A CN113704052A (zh) 2021-11-26
CN113704052B true CN113704052B (zh) 2023-09-22

Family

ID=78650252

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110826630.4A Active CN113704052B (zh) 2021-07-21 2021-07-21 一种微服务架构的运维系统、方法、设备及介质

Country Status (1)

Country Link
CN (1) CN113704052B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114866606A (zh) * 2022-04-21 2022-08-05 彩讯科技股份有限公司 一种微服务管理系统
CN115269612B (zh) * 2022-09-26 2022-12-13 公安部信息通信中心 一种基于微服务的跨平台多维数据融合系统
CN116192611A (zh) * 2023-03-03 2023-05-30 阿维塔科技(重庆)有限公司 一种基于多个微服务场景的统一告警方法、系统及设备
CN116302862B (zh) * 2023-05-18 2023-08-11 浙江华东工程数字技术有限公司 一种微服务架构下监控告警方法和系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109039733A (zh) * 2018-07-26 2018-12-18 郑州云海信息技术有限公司 一种告警方法、系统及电子设备和存储介质
CN110535902A (zh) * 2019-07-16 2019-12-03 平安普惠企业管理有限公司 基于微服务实现监控智能化的处理方法及电子装置
CN110780636A (zh) * 2019-11-27 2020-02-11 通号万全信号设备有限公司 一种联动管廊运维方法
CN111459770A (zh) * 2020-04-01 2020-07-28 深圳市伊欧乐科技有限公司 服务器运行状态的告警方法、装置、服务器及存储介质
CN112346931A (zh) * 2020-11-04 2021-02-09 青岛以萨数据技术有限公司 基于树莓派的私网服务集群监控报警系统、方法及介质
CN112564980A (zh) * 2020-12-17 2021-03-26 航天精一(广东)信息科技有限公司 一种基于微服务架构的服务监控方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11102060B2 (en) * 2018-01-31 2021-08-24 Hewlett Packard Enterprise Development Lp Identification of a soft failure at a member
US11288164B2 (en) * 2019-12-06 2022-03-29 Red Hat, Inc. Dynamic distributed tracing instrumentation in a microservice architecture

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109039733A (zh) * 2018-07-26 2018-12-18 郑州云海信息技术有限公司 一种告警方法、系统及电子设备和存储介质
CN110535902A (zh) * 2019-07-16 2019-12-03 平安普惠企业管理有限公司 基于微服务实现监控智能化的处理方法及电子装置
CN110780636A (zh) * 2019-11-27 2020-02-11 通号万全信号设备有限公司 一种联动管廊运维方法
CN111459770A (zh) * 2020-04-01 2020-07-28 深圳市伊欧乐科技有限公司 服务器运行状态的告警方法、装置、服务器及存储介质
CN112346931A (zh) * 2020-11-04 2021-02-09 青岛以萨数据技术有限公司 基于树莓派的私网服务集群监控报警系统、方法及介质
CN112564980A (zh) * 2020-12-17 2021-03-26 航天精一(广东)信息科技有限公司 一种基于微服务架构的服务监控方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于微服务架构的应用监控系统设计与实现;丁学英;刘迪;邱镇;;电力信息与通信技术(第07期);全文 *
面向大规模集群的自动化监控系统;杨杰;曾凌波;彭运勇;蒋迁谦;杜量;;计算机工程与科学(第10期);全文 *

Also Published As

Publication number Publication date
CN113704052A (zh) 2021-11-26

Similar Documents

Publication Publication Date Title
CN113704052B (zh) 一种微服务架构的运维系统、方法、设备及介质
CN103605722B (zh) 数据库监控方法及装置、设备
CN106487574A (zh) 自动化运行维护监测系统
CN101632093A (zh) 用于使用统计学分析来管理性能故障的系统和方法
CN101707632A (zh) 一种动态监控服务器集群性能并实时报警的方法
CN106027328A (zh) 一种基于应用容器部署的集群监控的方法及系统
US20090070425A1 (en) Data processing system, method of updating a configuration file and computer program product
US6990518B1 (en) Object-driven network management system enabling dynamically definable management behavior
CN113742066A (zh) 一种用于服务器集群的负载均衡系统和方法
CN115297124A (zh) 一种系统运维管理方法、装置及电子设备
CN109218401A (zh) 日志采集方法、系统、计算机设备和存储介质
CN109639755B (zh) 关联系统服务器解耦方法、装置、介质及电子设备
CN103824017A (zh) 监控恶意程序的方法和监控平台
CN103763126A (zh) 监控数据库的系统、方法及数据库监控装置
CN111427749B (zh) 一种openstack环境下针对ironic服务的监控工具及方法
CN110609761B (zh) 确定故障源的方法、装置、存储介质和电子设备
KR20030056301A (ko) 시스템 장애 통합관리방법
CN116668269A (zh) 一种用于双活数据中心的仲裁方法、装置及系统
CN114816914A (zh) 基于Kubernetes的数据处理方法、设备及介质
CN113656367A (zh) 一种bmc日志收集方法及系统
CN112817827A (zh) 运维方法、装置、服务器、设备、系统及介质
CN109120439B (zh) 分布式集群告警输出方法、装置、设备及可读存储介质
CN115048260A (zh) 一种基于云计算的核电厂PaaS平台资源配额监控方法和系统
CN113765717A (zh) 一种基于涉密专用计算平台的运维管理系统
CN109005072B (zh) 基于策略的集中式多级监管系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant