CN108173911B - 一种微服务故障检测处理方法及装置 - Google Patents

一种微服务故障检测处理方法及装置 Download PDF

Info

Publication number
CN108173911B
CN108173911B CN201711368632.3A CN201711368632A CN108173911B CN 108173911 B CN108173911 B CN 108173911B CN 201711368632 A CN201711368632 A CN 201711368632A CN 108173911 B CN108173911 B CN 108173911B
Authority
CN
China
Prior art keywords
micro
service
fault
terminal
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711368632.3A
Other languages
English (en)
Other versions
CN108173911A (zh
Inventor
郭志川
赵然
朱小勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Xinrand Network Technology Co ltd
Original Assignee
Institute of Acoustics CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Acoustics CAS filed Critical Institute of Acoustics CAS
Priority to CN201711368632.3A priority Critical patent/CN108173911B/zh
Publication of CN108173911A publication Critical patent/CN108173911A/zh
Application granted granted Critical
Publication of CN108173911B publication Critical patent/CN108173911B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/51Discovery or management thereof, e.g. service location protocol [SLP] or web services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0817Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Abstract

本发明实施例提供一种微服务故障检测处理方法及装置,所述方法包括:通过微服务管理程序实时监测至少一个终端上的微服务是否出现故障;当监测到所述至少一个终端上的微服务出现故障时,对微服务出现故障的故障终端进行处理和恢复以及采用云端服务器进行协同服务。当终端微服务管理模块检测到单个终端微服务发生故障的时候,可以利用云端服务器进行协同服务,保证在单个终端微服务故障修复期间整个系统仍然能够正常对外提供服务,提高了整个终端微服务系统的可用性,提升了用户体验度。

Description

一种微服务故障检测处理方法及装置
技术领域
本发明实施例涉及计算机处理领域,尤其涉及一种微服务故障检测处理方法及装置。
背景技术
微服务是一种近年来越来越流行的新兴的软件服务架构,是采用一小组服务来构建一个整体应用的方法,每个服务运行在独立的进程中,不同服务通过一些轻量级交互机制来通信。
随着计算机技术的不断发展,人工智能、边缘计算、物联网等技术与智能终端的结合越来越紧密,智能终端上要承担的计算任务越来越重。由于智能终端上的资源是分散的,所以越来越多的智能终端服务会选择容器化微服务这一非常符合智能终端特点的服务架构。
微服务将整体的终端服务拆分成一组微服务,分别部署在不同的智能终端上面。由于微服务之间存在大量的依赖关系,如果系统中的某一个终端或终端上的微服务发生故障,整个系统对外提供服务的能力会受到很大影响,在故障修复之前用户不能正常收到服务响应,用户体验会迅速下降。
因此,如何检测处理终端容器化微服务故障,以保证系统在某个终端或终端上的微服务发生故障的时候仍然能够稳定地为用户提供服务,保持高可用性,提高用户体验,是本领域技术人员需要解决的问题。
发明内容
本发明实施例提供一种微服务故障检测处理方法及装置,以解决如何检测处理终端容器化微服务故障,以保证系统在某个终端或终端上的微服务发生故障的时候仍然能够稳定地为用户提供服务,保持高可用性,提高用户体验的问题。
第一方面,本发明实施例提供一种微服务故障检测处理方法,包括:
通过微服务管理程序实时监测至少一个终端上的微服务是否出现故障;
当监测到所述至少一个终端上的微服务出现故障时,对微服务出现故障的故障终端进行处理和恢复以及采用云端服务器进行协同服务。
在一个可能的实施方式中,所述采用云端服务器进行协同服务,包括:
云端服务器根据所述故障终端的故障通知中的微服务类型,启动相应微服务容器来接收对应的终端微服务请求流量;
终端微服务管理根据终端故障类型,选择不同的终端故障处理方法向云端服务器发送微服务请求流量
当所述故障终端的微服务故障修复后,终端微服务管理根据故障终端的故障类型,选择不同的终端微服务恢复方法将已修复的微服务请求流量导入到所述至少一个终端进行服务;
云端服务器将协同服务期间微服务数据发送到终端微服务管理,关闭云端服务器上的微服务容器,回收相关资源。
在一个可能的实施方式中,所述对微服务出现故障的故障终端进行处理,包括:
若所述故障终端的故障类型为程序错误故障,则在故障节点启动路由模块,将发送到该节点的微服务请求直接转发到云端服务器上进行处理;
若所述故障终端的故障类型为节点不可达故障,则在终端微服务管理模块中将该微服务的地址由故障节点的地址修改为云端服务器的地址。
在一个可能的实施方式中,所述对微服务出现故障的故障终端进行恢复,包括:
若所述故障终端的故障类型为程序错误故障,则在已修复故障节点关闭路由模块,将发送到该节点的微服务请求直接在该节点上进行处理;
若故障终端的故障类型为节点为不可达故障,则在终端微服务管理模块中将该微服务的地址由云端服务器的地址修改为已修复故障节点的地址。
在一个可能的实施方式中,所述通过微服务管理程序实时监测至少一个终端上的微服务是否出现故障,包括:
所述至少一个终端上的微服务管理程序实时监测每个终端上的微服务容器状态,如果容器状态异常或直接退出,则认为是程序错误故障,其中,节点为可达的状态;
在发送微服务请求的时,若在预设的等待时间内没有收到微服务响应,则在系统内随机通知两个节点向可能发生故障的节点发送微服务测试请求;
若发送的两个微服务测试请求都未收到可能发生故障的节点的响应,则认为该节点确实发生了故障,故障类型为节点不可达;
若发送的两个微服务测试请求中至少有一个收到了可能发生故障的节点的响应,则认为该节点可能并未发生故障,可重新发送正常的微服务请求;
若重新发送的正常的微服务请求在预设等待时间内收到微服务响应,则认为该节点没有发生故障,正常对外提供微服务;
若重新发送的正常的微服务请求在预设等待时间内仍没有收到微服务响应,则认为该节点发生故障,其中,故障类型为节点不可达状态。
第二方面,本发明实施例提供一种微服务故障检测处理装置,包括:
监测模块,用于通过微服务管理程序实时监测至少一个终端上的微服务是否出现故障;
处理模块,用于当监测到所述至少一个终端上的微服务出现故障时,对微服务出现故障的故障终端进行处理和恢复以及采用云端服务器进行协同服务。
在一个可能的实施方式中,所述处理模块,用于根据所述故障终端的故障通知中的微服务类型,启动相应微服务容器来接收对应的终端微服务请求流量;根据终端故障类型,选择不同的终端故障处理装置向云端服务器发送微服务请求流量当所述故障终端的微服务故障修复后,终端微服务管理根据故障终端的故障类型,选择不同的终端微服务恢复装置将已修复的微服务请求流量导入到所述至少一个终端进行服务;云端服务器将协同服务期间微服务数据发送到终端微服务管理,关闭云端服务器上的微服务容器,回收相关资源。
在一个可能的实施方式中,所述处理模块,用于若所述故障终端的故障类型为程序错误故障,则在故障节点启动路由模块,将发送到该节点的微服务请求直接转发到云端服务器上进行处理;若所述故障终端的故障类型为节点不可达故障,则在终端微服务管理模块中将该微服务的地址由故障节点的地址修改为云端服务器的地址。
在一个可能的实施方式中,所述处理模块,用于若所述故障终端的故障类型为程序错误故障,则在已修复故障节点关闭路由模块,将发送到该节点的微服务请求直接在该节点上进行处理;若故障终端的故障类型为节点为不可达故障,则在终端微服务管理模块中将该微服务的地址由云端服务器的地址修改为已修复故障节点的地址。
在一个可能的实施方式中,所述监测模块,用于实时监测每个终端上的微服务容器状态,如果容器状态异常或直接退出,则认为是程序错误故障,其中,节点为可达的状态;在发送微服务请求的时,若在预设的等待时间内没有收到微服务响应,则在系统内随机通知两个节点向可能发生故障的节点发送微服务测试请求;若发送的两个微服务测试请求都未收到可能发生故障的节点的响应,则认为该节点确实发生了故障,故障类型为节点不可达;若发送的两个微服务测试请求中至少有一个收到了可能发生故障的节点的响应,则认为该节点可能并未发生故障,可重新发送正常的微服务请求;若重新发送的正常的微服务请求在预设等待时间内收到微服务响应,则认为该节点没有发生故障,正常对外提供微服务;若重新发送的正常的微服务请求在预设等待时间内仍没有收到微服务响应,则认为该节点发生故障,其中,故障类型为节点不可达状态。
通过以上方案可知,本发明提供一种微服务故障检测方案,通过在智能终端和云端服务器上部署微服务管理程序,实时检测每个终端上的微服务是否出现故障,并初步判断故障类型,根据不同的故障类型,采取不同的故障处理方法将故障微服务请求的流量导入到云端服务器,利用云端服务器进行协同服务。可见,在本方案中,当终端微服务管理模块检测到单个终端微服务发生故障的时候,可以利用云端服务器进行协同服务,保证在单个终端微服务故障修复期间整个系统仍然能够正常对外提供服务,提高了整个终端微服务系统的可用性,提升了用户体验度。
附图说明
图1为本发明实施例提供的一种基于云端协同的智能终端容器化微服务故障检测处理方法的交互示意图;
图2为本发明实施例提供的一种智能终端容器化微服务故障检测方法流程图;
图3为本发明实施例提供的一种基于云端协同的智能终端容器化微服务故障检测装置的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于对本发明实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本发明实施例的限定。
在本实施例中,容器技术选择docker,整个系统分成N个微服务,分别部署在N个终端上面,另有一个用于协同服务的服务器部署在云端。
图1为本发明实施例提供的一种基于云端协同的智能终端容器化微服务故障检测处理方法的交互示意图。如图1所示,所述方法具体包括:
S101、在云端服务器上部署微服务管理程序。
具体地,云端服务器上的微服务管理程序还应该部署docker引擎,拉取相关微服务镜像,配置微服务运行环境。
S102、在智能终端上部署微服务管理程序。
具体地,在智能终端上的微服务管理程序应具有监控智能终端容器化微服务状态、与其他终端及云端微服务管理程序通过网络通信等功能。
S103、在智能终端上为用户提供服务。
S104、智能终端对微服务进行故障检测,若出现故障时,执行S105,否则结束本次流程。
S105、判断故障类型,并向云端服务器报告终端微服务故障情况。
S106、云端服务器接收到终端微服务管理程序发送的终端微服务故障情况,启动相应的微服务容器,为终端微服务提供协同服务。
S107、在云端上为用户提供服务。
具体地,智能终端微服务管理程序将发生故障的终端微服务请求流量导入到云端服务器进行服务。
优选地,智能终端微服务管理程序根据终端微服务故障类型,选择不同的故障微服务请求流量导入方法。
具体地,当故障类型为程序错误故障时,可以在故障节点上启动路由模块,直接将发生故障的终端微服务请求流量转发至云端服务器进行微服务,这样可以不用对系统中的其他终端节点做任何改动,减少额外开销。
具体地,当故障类型为节点不可达故障时,通知系统中其他终端节点,在终端微服务管理程序中将该微服务的地址由故障节点的地址修改为云端服务器的地址。
当智能终端的故障修复成功时,可执行下述步骤:
S108、智能终端微服务管理程序向云端服务器报告终端微服务故障修复情况。
具体地,智能终端微服务管理程序将该微服务请求流量重新导入到提供该微服务的智能终端。
优选地,智能终端微服务管理程序根据终端微服务故障类型,选择不同的故障微服务请求流量恢复方法。
具体地,当故障类型为程序错误故障时,可以在故障节点上关闭路由模块,直接在已修复的智能终端进行微服务,这样可以不用对系统中的其他终端节点做任何改动,减少额外开销。
具体地,当故障类型为节点不可达故障时,通知系统中其他终端节点,在终端微服务管理程序中将该微服务的地址由云端服务器的地址修改为故障节点的地址。
S109、将云端服务请求流量恢复到智能终端。
S110、智能终端提供微服务。
S111、关闭相应微服务容器。
可选地,云端服务器可以将记录下来的协同服务期间接收到的服务请求详细数据发回到对应智能终端,以保证整个服务流程的完整性。
本发明通过在智能终端和云端服务器上部署微服务管理程序,实时检测每个终端上的微服务是否出现故障,并初步判断故障类型,根据不同的故障类型,采取不同的故障处理方法将故障微服务请求的流量导入到云端服务器,利用云端服务器进行协同服务,保证在单个终端微服务故障修复期间整个系统仍然能够正常对外提供服务,提高了整个终端微服务系统的可用性,提升了用户体验度。
图2为本发明实施例提供的一种智能终端容器化微服务故障检测方法流程图。如图2所示,所述方法具体包括:
S201、微服务管理程序检测微服务容器是否正常运行,若微服务容器出错或已退出,则执行S202;若微服务容器正常运行,则执行S202。
S202,微服务管理程序认为该微服务发生程序错误故障。
S203,微服务管理程序判断微服务是否能够正常响应微服务请求,若正常响应,则执行S204,若不能够正常响应,则执行S203。
S204,微服务管理程序认为该微服务正常运行,没有发生故障。
S205,微服务管理程序判断该微服务是否是第一次未收到响应,若是第一次,则执行S206,若不是,则执行S208。
S206,终端微服务管理程序从系统中随机选择两个终端,向被检测的终端发送微服务测试请求。
S207,判断被检测的终端是否能够正常返回两个测试请求,若至少有一个测试请求正常返回,则执行S203,若两个测试请求都不能正常返回,则执行S208。
S208,微服务管理程序该微服务发生节点不可用故障。
本发明通过在智能终端和云端服务器上部署微服务管理程序,实时检测每个终端上的微服务是否出现故障,并初步判断故障类型,根据不同的故障类型,采取不同的故障处理方法将故障微服务请求的流量导入到云端服务器,利用云端服务器进行协同服务,保证在单个终端微服务故障修复期间整个系统仍然能够正常对外提供服务,提高了整个终端微服务系统的可用性,提升了用户体验度。
图3为本发明实施例提供的一种基于云端协同的智能终端容器化微服务故障检测装置的结构示意图,如图3所示,该装置具体包括:
监测模块301,用于通过微服务管理程序实时监测至少一个终端上的微服务是否出现故障;
处理模块302,用于当监测到所述至少一个终端上的微服务出现故障时,对微服务出现故障的故障终端进行处理和恢复以及采用云端服务器进行协同服务。
可选地,所述处理模块302,用于根据所述故障终端的故障通知中的微服务类型,启动相应微服务容器来接收对应的终端微服务请求流量;根据终端故障类型,选择不同的终端故障处理装置向云端服务器发送微服务请求流量当所述故障终端的微服务故障修复后,终端微服务管理根据故障终端的故障类型,选择不同的终端微服务恢复装置将已修复的微服务请求流量导入到所述至少一个终端进行服务;云端服务器将协同服务期间微服务数据发送到终端微服务管理,关闭云端服务器上的微服务容器,回收相关资源。
可选地,所述处理模块302,用于若所述故障终端的故障类型为程序错误故障,则在故障节点启动路由模块,将发送到该节点的微服务请求直接转发到云端服务器上进行处理;若所述故障终端的故障类型为节点不可达故障,则在终端微服务管理模块中将该微服务的地址由故障节点的地址修改为云端服务器的地址。
可选地,所述处理模块302,用于若所述故障终端的故障类型为程序错误故障,则在已修复故障节点关闭路由模块,将发送到该节点的微服务请求直接在该节点上进行处理;若故障终端的故障类型为节点为不可达故障,则在终端微服务管理模块中将该微服务的地址由云端服务器的地址修改为已修复故障节点的地址。
可选地,所述监测模块301,用于实时监测每个终端上的微服务容器状态,如果容器状态异常或直接退出,则认为是程序错误故障,其中,节点为可达的状态;在发送微服务请求的时,若在预设的等待时间内没有收到微服务响应,则在系统内随机通知两个节点向可能发生故障的节点发送微服务测试请求;若发送的两个微服务测试请求都未收到可能发生故障的节点的响应,则认为该节点确实发生了故障,故障类型为节点不可达;若发送的两个微服务测试请求中至少有一个收到了可能发生故障的节点的响应,则认为该节点可能并未发生故障,可重新发送正常的微服务请求;若重新发送的正常的微服务请求在预设等待时间内收到微服务响应,则认为该节点没有发生故障,正常对外提供微服务;若重新发送的正常的微服务请求在预设等待时间内仍没有收到微服务响应,则认为该节点发生故障,其中,故障类型为节点不可达状态。
本发明通过在智能终端和云端服务器上部署微服务管理程序,实时检测每个终端上的微服务是否出现故障,并初步判断故障类型,根据不同的故障类型,采取不同的故障处理方法将故障微服务请求的流量导入到云端服务器,利用云端服务器进行协同服务,保证在单个终端微服务故障修复期间整个系统仍然能够正常对外提供服务,提高了整个终端微服务系统的可用性,提升了用户体验度。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (4)

1.一种微服务故障检测处理方法,其特征在于,包括:
在云端服务器以及智能终端上部署微服务管理程序;
通过微服务管理程序实时监测至少一个终端上的微服务是否出现故障;
当监测到所述至少一个终端上的微服务出现故障时,对微服务出现故障的故障终端进行处理和恢复以及采用云端服务器进行协同服务;其中,
所述对微服务出现故障的故障终端进行处理,包括:
若所述故障终端的故障类型为程序错误故障,则在故障节点启动路由模块,将发送到该节点的微服务请求直接转发到云端服务器上进行处理;
若所述故障终端的故障类型为节点不可达故障,则在终端微服务管理模块中将该微服务的地址由故障节点的地址修改为云端服务器的地址;
所述对微服务出现故障的故障终端进行恢复,包括:
若所述故障终端的故障类型为程序错误故障,则在已修复故障节点关闭路由模块,将发送到该节点的微服务请求直接在该节点上进行处理;
若故障终端的故障类型为节点为不可达故障,则在终端微服务管理模块中将该微服务的地址由云端服务器的地址修改为已修复故障节点的地址;
所述采用云端服务器进行协同服务,包括:
云端服务器根据所述故障终端的故障通知中的微服务类型,启动相应微服务容器来接收对应的终端微服务请求流量;
终端微服务管理根据终端故障类型,选择不同的终端故障处理方法向云端服务器发送微服务请求流量;
当所述故障终端的微服务故障修复后,终端微服务管理根据故障终端的故障类型,选择不同的终端微服务恢复方法将已修复的微服务请求流量导入到所述至少一个终端进行服务;
云端服务器将协同服务期间微服务数据发送到终端微服务管理,关闭云端服务器上的微服务容器,回收相关资源。
2.根据权利要求1所述的方法,其特征在于,所述通过微服务管理程序实时监测至少一个终端上的微服务是否出现故障,包括:
所述至少一个终端上的微服务管理程序实时监测每个终端上的微服务容器状态,如果容器状态异常或直接退出,则认为是程序错误故障,其中,节点为可达的状态;
在发送微服务请求的时,若在预设的等待时间内没有收到微服务响应,则在系统内随机通知两个节点向可能发生故障的节点发送微服务测试请求;
若发送的两个微服务测试请求都未收到可能发生故障的节点的响应,则认为该节点确实发生了故障,故障类型为节点不可达;
若发送的两个微服务测试请求中至少有一个收到了可能发生故障的节点的响应,则认为该节点可能并未发生故障,可重新发送正常的微服务请求;
若重新发送的正常的微服务请求在预设等待时间内收到微服务响应,则认为该节点没有发生故障,正常对外提供微服务;
若重新发送的正常的微服务请求在预设等待时间内仍没有收到微服务响应,则认为该节点发生故障,其中,故障类型为节点不可达状态。
3.一种微服务故障检测处理装置,其特征在于,包括:
监测模块,用于通过微服务管理程序实时监测至少一个终端上的微服务是否出现故障;
处理模块,用于当监测到所述至少一个终端上的微服务出现故障时,对微服务出现故障的故障终端进行处理和恢复以及采用云端服务器进行协同服务;其中,
所述对微服务出现故障的故障终端进行处理包括:若所述故障终端的故障类型为程序错误故障,则在故障节点启动路由模块,将发送到该节点的微服务请求直接转发到云端服务器上进行处理;若所述故障终端的故障类型为节点不可达故障,则在终端微服务管理模块中将该微服务的地址由故障节点的地址修改为云端服务器的地址;
所述对微服务出现故障的故障终端进行恢复包括:若所述故障终端的故障类型为程序错误故障,则在已修复故障节点关闭路由模块,将发送到该节点的微服务请求直接在该节点上进行处理;若故障终端的故障类型为节点为不可达故障,则在终端微服务管理模块中将该微服务的地址由云端服务器的地址修改为已修复故障节点的地址;
根据所述故障终端的故障通知中的微服务类型,启动相应微服务容器来接收对应的终端微服务请求流量;根据终端故障类型,选择不同的终端故障处理装置向云端服务器发送微服务请求流量当所述故障终端的微服务故障修复后,终端微服务管理根据故障终端的故障类型,选择不同的终端微服务恢复装置将已修复的微服务请求流量导入到所述至少一个终端进行服务;云端服务器将协同服务期间微服务数据发送到终端微服务管理,关闭云端服务器上的微服务容器,回收相关资源。
4.根据权利要求3所述的装置,其特征在于,所述监测模块,用于实时监测每个终端上的微服务容器状态,如果容器状态异常或直接退出,则认为是程序错误故障,其中,节点为可达的状态;在发送微服务请求的时,若在预设的等待时间内没有收到微服务响应,则在系统内随机通知两个节点向可能发生故障的节点发送微服务测试请求;若发送的两个微服务测试请求都未收到可能发生故障的节点的响应,则认为该节点确实发生了故障,故障类型为节点不可达;若发送的两个微服务测试请求中至少有一个收到了可能发生故障的节点的响应,则认为该节点可能并未发生故障,可重新发送正常的微服务请求;若重新发送的正常的微服务请求在预设等待时间内收到微服务响应,则认为该节点没有发生故障,正常对外提供微服务;若重新发送的正常的微服务请求在预设等待时间内仍没有收到微服务响应,则认为该节点发生故障,其中,故障类型为节点不可达状态。
CN201711368632.3A 2017-12-18 2017-12-18 一种微服务故障检测处理方法及装置 Active CN108173911B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711368632.3A CN108173911B (zh) 2017-12-18 2017-12-18 一种微服务故障检测处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711368632.3A CN108173911B (zh) 2017-12-18 2017-12-18 一种微服务故障检测处理方法及装置

Publications (2)

Publication Number Publication Date
CN108173911A CN108173911A (zh) 2018-06-15
CN108173911B true CN108173911B (zh) 2020-08-21

Family

ID=62522627

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711368632.3A Active CN108173911B (zh) 2017-12-18 2017-12-18 一种微服务故障检测处理方法及装置

Country Status (1)

Country Link
CN (1) CN108173911B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110908855A (zh) * 2018-09-18 2020-03-24 深圳市鸿合创新信息技术有限责任公司 一种微服务运行维护装置及方法、电子设备
CN109213616A (zh) * 2018-09-25 2019-01-15 江苏润和软件股份有限公司 一种基于调用图分析的微服务软件系统异常检测方法
CN109412944B (zh) * 2018-10-16 2023-05-12 深圳壹账通智能科技有限公司 基于微服务的请求转发方法、装置和服务器
CN109347682B (zh) * 2018-11-15 2021-07-13 国家电网有限公司 基于dhnn的自组织实时微服务故障诊断方法及系统
CN110365762B (zh) * 2019-07-10 2022-03-11 腾讯科技(深圳)有限公司 服务处理方法、装置、设备及存储介质
CN110784554B (zh) * 2019-11-05 2022-07-08 杭州安恒信息技术股份有限公司 web微服务集群服务错误的处理方法和装置
CN111158751B (zh) * 2019-12-30 2023-12-22 无锡睿勤科技有限公司 一种Windows环境部署方法、电子设备及存储介质
CN113282401B (zh) * 2021-07-21 2021-11-23 之江实验室 一种面向物联网异构物体多形态的可重构服务模型
CN113726553A (zh) * 2021-07-29 2021-11-30 浪潮电子信息产业股份有限公司 一种节点故障恢复方法、装置、电子设备及可读存储介质
CN113867129A (zh) * 2021-10-27 2021-12-31 珠海格力电器股份有限公司 一种冗余控制方法、装置、系统、计算机设备及存储介质
CN114363221B (zh) * 2021-12-29 2024-05-03 武汉烽火信息集成技术有限公司 一种基于微服务系统的心跳检测方法、存储介质、电子设备及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106227611A (zh) * 2016-07-26 2016-12-14 北京北森云计算股份有限公司 一种多语言云编译的动态微服务调用方法及装置
CN106254114A (zh) * 2016-05-13 2016-12-21 江苏云途腾科技有限责任公司 云主机故障迁移方法及系统
CN106330576A (zh) * 2016-11-18 2017-01-11 北京红马传媒文化发展有限公司 容器化微服务自动伸缩及迁移调度的方法、系统和设备
CN106533805A (zh) * 2016-12-23 2017-03-22 郑州云海信息技术有限公司 一种微服务请求处理方法、微服务控制器及微服务架构
CN106656604A (zh) * 2016-12-23 2017-05-10 郑州云海信息技术有限公司 微服务请求管理方法、微服务控制器及高并发微服务架构
CN106686132A (zh) * 2017-02-06 2017-05-17 郑州云海信息技术有限公司 一种云海系统部署方法及平台

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9842045B2 (en) * 2016-02-19 2017-12-12 International Business Machines Corporation Failure recovery testing framework for microservice-based applications

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106254114A (zh) * 2016-05-13 2016-12-21 江苏云途腾科技有限责任公司 云主机故障迁移方法及系统
CN106227611A (zh) * 2016-07-26 2016-12-14 北京北森云计算股份有限公司 一种多语言云编译的动态微服务调用方法及装置
CN106330576A (zh) * 2016-11-18 2017-01-11 北京红马传媒文化发展有限公司 容器化微服务自动伸缩及迁移调度的方法、系统和设备
CN106533805A (zh) * 2016-12-23 2017-03-22 郑州云海信息技术有限公司 一种微服务请求处理方法、微服务控制器及微服务架构
CN106656604A (zh) * 2016-12-23 2017-05-10 郑州云海信息技术有限公司 微服务请求管理方法、微服务控制器及高并发微服务架构
CN106686132A (zh) * 2017-02-06 2017-05-17 郑州云海信息技术有限公司 一种云海系统部署方法及平台

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Containers and Cloud: From LXC to Doctor to Kubernetes;David Bernstein;《IEEE Cloud Computing》;20140930;全文 *

Also Published As

Publication number Publication date
CN108173911A (zh) 2018-06-15

Similar Documents

Publication Publication Date Title
CN108173911B (zh) 一种微服务故障检测处理方法及装置
CN107547252B (zh) 一种网络故障处理方法和装置
US8656219B2 (en) System and method for determination of the root cause of an overall failure of a business application service
CN109286529B (zh) 一种恢复RabbitMQ网络分区的方法及系统
EP3142011B1 (en) Anomaly recovery method for virtual machine in distributed environment
CN108429629A (zh) 设备故障恢复方法和装置
CN106533805B (zh) 一种微服务请求处理方法、微服务控制器及微服务架构
CN109274544B (zh) 一种分布式存储系统的故障检测方法及装置
CN103812675A (zh) 一种实现业务交付平台异地容灾切换的方法和系统
CN104065526B (zh) 一种服务器故障报警的方法和装置
US10129114B1 (en) Protocol exposure as network health detection
US20220052916A1 (en) Orchestration of Activities of Entities Operating in a Network Cloud
CN106330588B (zh) 一种bfd检测方法与装置
CN111901422A (zh) 一种集群中节点的管理方法、系统及装置
WO2020212442A1 (fr) Procede et dispositif de traitement d'un message d'alerte notifiant une anomalie detectee dans un trafic emis via un reseau
CN112291075A (zh) 网络故障定位方法、装置、计算机设备及存储介质
CN113726553A (zh) 一种节点故障恢复方法、装置、电子设备及可读存储介质
CN107656847A (zh) 基于分布式集群的节点管理方法、系统、装置及存储介质
CN111314443A (zh) 基于分布式存储系统的节点处理方法、装置和设备及介质
JP6421516B2 (ja) サーバ装置、冗長構成サーバシステム、情報引継プログラム及び情報引継方法
CN109218050B (zh) 一种域名系统故障处理方法和系统
CN113824595B (zh) 链路切换控制方法、装置和网关设备
CN106230666B (zh) 一种业务可用性的监控方法和监控系统
JP2017521802A (ja) スーパーコンピュータ監視用の相関イベントのためのアーキテクチャ
CN111934909B (zh) 主备机ip资源切换方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20210804

Address after: Room 1601, 16th floor, East Tower, Ximei building, No. 6, Changchun Road, high tech Industrial Development Zone, Zhengzhou, Henan 450001

Patentee after: Zhengzhou xinrand Network Technology Co.,Ltd.

Address before: 100190, No. 21 West Fourth Ring Road, Beijing, Haidian District

Patentee before: INSTITUTE OF ACOUSTICS, CHINESE ACADEMY OF SCIENCES

TR01 Transfer of patent right