CN116302861A - 异常处理方法、装置、系统、电子设备及存储介质 - Google Patents

异常处理方法、装置、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN116302861A
CN116302861A CN202310269860.4A CN202310269860A CN116302861A CN 116302861 A CN116302861 A CN 116302861A CN 202310269860 A CN202310269860 A CN 202310269860A CN 116302861 A CN116302861 A CN 116302861A
Authority
CN
China
Prior art keywords
rule
list
container
service cluster
new business
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310269860.4A
Other languages
English (en)
Inventor
杜兆顺
李甲长
刘桢立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202310269860.4A priority Critical patent/CN116302861A/zh
Publication of CN116302861A publication Critical patent/CN116302861A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供一种异常处理方法、装置、系统、电子设备及存储介质,涉及金融科技领域或其他相关领域,方法包括:获取规则计算服务集群的第一列表和第二列表;根据第一列表和第二列表,确定规则计算服务集群中存在未成功加载新业务规则的容器标识时,生成第三列表;将第三列表发送至容器管理平台,以使容器管理平台根据第三列表重启规则计算服务集群中未成功加载新业务规则的容器。通过规则同步检测系统可以获得未成功加载新业务规则的容器名单,并调用容器管理平台重启未成功加载新业务规则的容器。在容器同步新业务规则遇到异常时,可以自动识别异常并进行处理,无需人工介入,提升了异常处理的效率,降低了运维人员的工作量。

Description

异常处理方法、装置、系统、电子设备及存储介质
技术领域
本申请涉及金融科技领域或其他相关领域,尤其涉及一种异常处理方法、装置、系统、电子设备及存储介质。
背景技术
随着电子信息技术的不断发展,各种业务系统所能实现的功能越来越全面、复杂。为了将业务规则从具体的实现代码中分离出来,通常会利用规则引擎来保存和执行业务规则。规则引擎一般会提供可视化规则维护功能和规则计算服务。在分布式环境下,规则计算服务一般运行在容器集群的各容器中,若业务规则发生变化,需要实时同步到规则计算服务的所有容器。如果同步过程中出现错误,则会出现相同的输入,经过不同的容器的服务处理后得出不同的结果,从而影响规则计算服务的质量。
现有技术中,是通过在规则计算服务添加日志以及上报监控的功能,当同步变动的规则过程遇到异常,输出日志和向监控系统发送监控消息,监控系统收到消息后会提醒运维支持人员进行处理。从而导致异常处理的效率较低。
发明内容
本申请实施例提供一种异常处理方法、装置、系统、电子设备及存储介质,可以提高异常处理的效率。
第一方面,本申请实施例提供一种异常处理方法,包括:
获取规则计算服务集群的第一列表和第二列表,所述第一列表用于指示所述规则计算服务集群中成功加载新业务规则的容器标识,所述第二列表用于指示所述规则计算服务集群中运行的各容器标识;
根据所述第一列表和所述第二列表,确定所述规则计算服务集群中存在未成功加载新业务规则的容器标识时,生成第三列表,所述第三列表用于指示所述未成功加载新业务规则的容器标识;
将所述第三列表发送至容器管理平台,以使所述容器管理平台根据所述第三列表重启所述规则计算服务集群中未成功加载新业务规则的容器。
可选的,所述获取规则计算服务集群的第一列表和第二列表,包括:
接收所述规则计算服务集群中至少一个容器发送的规则变动处理结果信息,或者,从消息中间件获取所述规则计算服务集群中至少一个容器发送给所述消息中间件的规则变动处理结果信息;
根据至少一个容器的规则变动处理结果信息,更新或生成所述第一列表;
接收所述规则计算服务集群中各容器发送的注册信息,或者,从消息中间件获取所述规则计算服务集群中各容器发送给所述消息中间件的注册信息;
根据各容器的注册信息,更新或生成所述第二列表。
可选的,所述将所述第三列表发送至容器管理平台,包括:
若所述第三列表包括的容器标识的数量小于或等于第一阈值,则将所述第三列表发送至容器管理平台。
可选的,所述方法还包括:
若所述第三列表包括的容器标识的数量大于第一阈值,则确定所述规则计算服务集群异常;
向监控管理平台发送预警消息,以使所述监控管理平台输出所述预警消息,所述预警消息用于指示所述规则计算服务集群异常。
可选的,所述规则变动处理结果信息包括:所述新业务规则的标识和第一修改时间;所述方法还包括:
若根据所述第一列表和所述第二列表确定所述规则计算服务集群中无未成功加载新业务规则的容器标识,则根据所述新业务规则的标识,获取已记录的除所述新业务规则之外的业务规则的第二修改时间;
若存在晚于第一修改时间的第二修改时间,则确定所述规则计算服务集群异常;
向监控管理平台发送预警消息,以使所述监控管理平台输出所述预警消息,所述预警消息用于指示所述规则计算服务集群异常。
可选的,所述方法还包括:
接收业务规则变更通知;
在预设时长内,若所述第一列表中的容器标识的数量小于或等于第一阈值,则确定所述规则计算服务集群异常。
第二方面,本申请实施例提供一种异常处理装置,包括:
获取模块,用于获取规则计算服务集群的第一列表和第二列表,所述第一列表用于指示所述规则计算服务集群中成功加载新业务规则的容器标识,所述第二列表用于指示所述规则计算服务集群中运行的各容器标识;
确定模块,用于根据所述第一列表和所述第二列表确定所述规则计算服务集群中存在未成功加载新业务规则的容器标识,则生成第三列表,所述第三列表用于指示所述未成功加载新业务规则的容器标识;
发送模块,用于将所述第三列表发送至容器管理平台,以使所述容器管理平台根据所述第三列表重启所述规则计算服务集群中未成功加载新业务规则的容器。
第三方面,本申请实施例提供一种异常处理系统,包括:规则计算服务集群、规则同步检测系统、容器管理平台以及消息中间件;
所述规则计算服务集群,用于发送容器规则变动处理结果信息和容器注册信息;
消息中间件,用于接收所述容器规则变动处理结果信息和所述容器注册信息,并将所述容器规则变动处理结果信息和所述容器注册信息发送至所述规则同步检测系统;
规则同步检测系统,用于根据所述容器规则变动处理结果信息和所述容器注册信息生成第三列表,并将所述第三列表发送至所述容器管理平台,所述第三列表用于指示未成功加载新业务规则的容器标识;
容器管理平台,用于根据所述第三列表重启所述规则计算服务集群中未成功加载新业务规则的容器。
第四方面,本申请提供一种电子设备,包括:存储器和处理器;
存储器用于存储计算机指令;处理器用于运行存储器存储的计算机指令实现第一方面和/或第二方面中任一项的方法。
第五方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行以实现第一方面和/或第二方面中任一项的方法。
第六方面,本申请提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现第一方面和/或第二方面中任一项的方法。
本申请实施例提供的异常处理方法、装置、系统、电子设备及存储介质,通过获取规则计算服务集群的第一列表和第二列表;根据第一列表和第二列表,确定规则计算服务集群中存在未成功加载新业务规则的容器标识时,生成第三列表;将第三列表发送至容器管理平台,以使容器管理平台根据第三列表重启规则计算服务集群中未成功加载新业务规则的容器。通过规则同步检测系统与规则计算服务集群的交互,获得未成功加载新业务规则的容器名单,并通过容器管理平台重启未成功加载新业务规则的容器。在容器同步新业务规则遇到异常时,可以自动识别异常并进行处理,无需人工介入,提升了异常处理的效率,降低了运维人员的工作量。
附图说明
图1为本申请实施例提供的场景示意图;
图2为本申请实施例提供的异常处理方法的流程示意图一;
图3为本申请实施例提供的异常处理方法的流程示意图二;
图4为本申请实施例提供的异常处理装置的结构示意图;
图5为本申请实施例提供的异常处理系统的结构示意图一;
图6为本申请实施例提供的异常处理系统的结构示意图二;
图7为申请实施例提供的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分,并不对其先后顺序进行限定。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。
需要说明的是,本申请实施例中,“示例性的”或者“例如”等词用于表示例子、例证或说明。本申请中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
随着电子信息技术的不断发展,各种业务系统所能实现的功能越来越全面、复杂。为了将业务规则从具体的实现代码中分离出来,通常会利用规则引擎来保存和执行业务规则,并实现规则的修改在规则计算服务中实时生效。
规则引擎一般会提供可视化规则维护功能和规则计算服务。在分布式环境下,规则计算服务一般运行在容器集群的各容器中,若业务规则发生变化,需要实时同步到规则计算服务的所有容器。如果同步过程中出现错误,会导致规则修改在部分容器未生效,容器继续对外服务时出现相同的输入则会出现相同的输入,经过不同的容器的服务处理后得出不同的结果,从而影响规则计算服务的质量。
现有技术中,是通过在规则计算服务添加日志以及上报监控的功能,当同步变动的规则过程遇到异常,输出日志和向监控系统发送监控消息,监控系统收到消息后会提醒运维支持人员进行处理。运维支持人员一般对遇到问题的容器进行重启操作。容器重启后,从关系型数据库加载全量规则,从而确保各容器运行的规则计算服务处理一致,确保服务质量。
由上述内容可知,现有技术中容器同步变动的规则过程遇到异常时,需要人工介入,增加运维支持人员的工作量。从发现问题到运维人员重启容器需要较长时间,异常处理的效率较低,影响规则计算服务的质量。
有鉴于此,本申请实施例提供一种异常处理方法、装置、系统、电子设备及存储介质,通过引入消息通知机制和集成平台即服务(Platform as aService,Paas)平台重启容器接口,可以自动检测同步规则过程中出现异常的容器,并重启同步异常的容器,可以降低运维人员的工作量,从而有效提升规则引擎的决策服务质量。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以独立实现,也可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
图1为本申请实施例的应用场景示意图,如图1所示,包括:规则计算服务集群101、规则同步检测系统102以及容器管理平台103。
规则计算服务集群101中可以包括N个容器,每个容器均使用相同的业务规则。
本申请实施例中,规则计算服务集群101可以与规则同步检测系统102进行交互,例如,在规则计算服务集群101运行时,可以向规则同步检测系统102发送注册信息,规则同步检测系统102在接收到该注册信息时,可以确定当前规则计算服务集群101中运行的各个容器的标识,例如,各容器的身份标识(identity document,ID)。
可以理解的是,规则计算服务集群101与规则同步检测系统102进行交互,可以为规则计算服务集群101中各容器分别与规则同步检测系统102交互。
本申请实施例中,规则同步检测系统102可以与容器管理平台103进行交互。例如,规则同步检测系统102可以通过与规则计算服务集群101的交互,确定规则计算服务集群101中各容器在加载新规则时出现异常的容易名单,并将出现异常的容器名单发送至容器管理平台103。
容器管理平台103可以与规则计算服务集群101进行交互。例如,容器管理平台103接收到规则同步检测系统102发送的出现异常的容器名单时,可以根据出现异常的容器名单重启对应的容器。其中,容器管理平台103可以为Paas平台。
上面对本申请实施例提供的应用场景进行了简单说明,下面以应用于图1中的规则同步检测系统为例,对本申请实施例提供的异常处理方法进行说明。
图2为本申请实施例提供的异常处理流程的示意图一。如图2所示,包括如下步骤:
S201、获取规则计算服务集群的第一列表和第二列表。
本申请实施例中,规则计算服务集群可以为部署了规则计算服务的集群,该集群中可以包括多个容器,各容器中均运行相同的规则计算服务。
其中,容器可以为一种沙盒的技术,主要目的是为了将应用运行在其中,与外界进行隔离,以及方便沙盒可以被转移到其它宿主机器。本质上,容器是一个特殊的进程,通过名称空间(Namespace)、控制组(Control groups)、切根(chroot)等技术把资源、文件、设备、状态和配置划分到一个独立的空间。
规则计算服务可以指容器使用的业务规则,通过规则计算服务容器可以对输入的信息进行处理,输出用户需求的信息。
本申请实施例中,第一列表用于指示规则计算服务集群中成功加载新业务规则的容器标识,第二列表用于指示规则计算服务集群中运行的各容器标识。
示例性的,规则计算服务集群中各容器在开始运行时,可以向规则同步检测系统发送注册消息,规则同步检测系统可以根据接收到的注册消息确定规则计算服务集群中运行的容器,得到第二列表。规则计算服务集群中各容器在接收到新的业务规则时,可以加载并运行新的业务规则,并在加载成功后向规则同步检测系统发送新业务规则加载成功的消息,规则同步检测系统可以根据接收到的新业务规则加载成功的消息确定成功加载新业务规则的容器,得到第一列表。
S202、根据第一列表和第二列表,确定规则计算服务集群中存在未成功加载新业务规则的容器标识时,生成第三列表。
本申请实施例中,第三列表用于指示未成功加载新业务规则的容器标识。
示例性的,规则同步检测系统在得到第一列表以及第二列表时,可以将第一列表和第二列表中的容器标识进行比较,若第一列表中的容器标识与第二列表标识存在不同,则确定规则计算服务集群中存在未成功加载新业务规则的容器标识。
可以理解的是,第二列表包括了规则计算服务集群中运行的全部容器,第一列表包括了成功加载的新业务规则的容器,若第一列表中容器标识数量少于第二列表中容器标识数量,则可以确定存在未成功加载新业务规则的容器。
规则同步检测系统可以将第二列表中与第一列表中相同的容器标识进行剔除,得到剩余的容器标识。根据剩余的容器标识生成第三列表。
S203、将第三列表发送至容器管理平台,以使容器管理平台根据第三列表重启规则计算服务集群中未成功加载新业务规则的容器。
本申请实施例中,规则同步检测系统得到第三列表时,可以将第三列表发送至容器管理平台。容器管理平台可以根据第三列表中包括的容器标识重启规则计算服务集群中对应容器。
本申请实施例提供的异常处理方法,通过获取规则计算服务集群的第一列表和第二列表;根据第一列表和第二列表,确定规则计算服务集群中存在未成功加载新业务规则的容器标识时,生成第三列表;将第三列表发送至容器管理平台,以使容器管理平台根据第三列表重启规则计算服务集群中未成功加载新业务规则的容器。通过规则同步检测系统与规则计算服务集群的交互,获得未成功加载新业务规则的容器名单,并通过容器管理平台重启未成功加载新业务规则的容器。在容器同步新业务规则遇到异常时,可以自动识别异常并进行处理,无需人工介入,提升了异常处理的效率,降低了运维人员的工作量。
图3为本申请实施例提供的异常处理方法的流程示意图二,在图2所示实施例的基础上进一步对异常处理的过程进行进一步说明,如图3所示,包括:
S301、获取规则计算服务集群中容器发送的规则变动处理结果信息和注册信息,根据规则变动处理结果信息和注册信息生成第一列表和第二列表。
本申请实施例中,规则变动处理结果信息可以为容器成功加载新业务规则的信息,包括容器的ID、新业务规则的标识、新业务规则的最后修改时间等。其中,新业务规则的最后修改时间等可以为新业务规则对应的修改时间戳。
注册信息可以为各容器首次运行时发送的信息,包括容器的ID等信息,用于指示计算服务集群中包括或运行的容器数量以及名称。
第一列表和第二列表的生成方式可以根据如下所示步骤
示例性的,接收所述规则计算服务集群中至少一个容器发送的规则变动处理结果信息,或者,从消息中间件获取所述规则计算服务集群中至少一个容器发送给所述消息中间件的规则变动处理结果信息;根据至少一个容器的规则变动处理结果信息,更新或生成所述第一列表。
接收所述规则计算服务集群中各容器发送的注册信息,或者,从消息中间件获取所述规则计算服务集群中各容器发送给所述消息中间件的注册信息;根据各容器的注册信息,更新或生成所述第二列表。
本申请实施例中,规则计算服务集群可以直接与规则同步检测系统进行交互,也可以通过消息中间件与规则同步检测系统进行交互。其中,消息中间件可以为kafka集群,或者其他类型的消息中间件,本申请实施例对此不进行限制。
在使用消息中间件时,规则计算服务集群中可以将注册信息和规则变动处理结果信息发送至指定的预设话题topic中。规则同步检测系统可以通过消息拉取获取所述注册信息和规则变动处理结果信息。
规则同步检测系统接收到接收第一个容器发送的规则变动处理结果信息时,可以进入异常检出处理程序,在等待预设时长后,确定规则计算服务集群中容器发送的规则变动处理结果信息结束。以当前接收到的规则变动处理结果信息生成第一列表。
规则同步检测系统通过消息中间件接收规则变动处理结果信息时,可以以预设时间为周期进行消息拉取,根据当前周期内获得的规则变动处理结果信息生成第一列表。可以理解的是,每一个容器都会发送一次自身的规则变动处理结果信息。
第二列表的生成方法与第一列表类似,此处不在赘述。
可选的,在生成第一列表和/或第二列表前,规则同步检测系统还可以确定是否已存在第一列表和/或第二列表,若存在,可以根据接收到的注册信息和规则变动处理结果信息更新第一列表和/或第二列表。即,清空原第一列表和/或第二列表中的信息,写入新的信息。
S302、根据第一列表和第二列表生成第三列表。
本申请实施例S302的具体实现方式与图2所示实施例S202的具体实现方式类似,此处不再赘述。
可选的,在一些实施例中,规则同步检测系统以预设时间为周期进行消息拉取时,可能存在第一列表和第二列表中的容器标识全部相同。此时,各容器可能都全部成功加载了新的业务规则,或者,全部未加载新的业务规则。规则同步检测系统需要对此进行判断。
示例性的,若根据所述第一列表和所述第二列表确定所述规则计算服务集群中无未成功加载新业务规则的容器标识,则根据所述新业务规则的标识,获取已记录的除所述新业务规则之外的业务规则的第二修改时间;若存在晚于第一修改时间的第二修改时间,则确定所述规则计算服务集群异常;向监控管理平台发送预警消息,以使所述监控管理平台输出所述预警消息,所述预警消息用于指示所述规则计算服务集群异常。
本申请实施例中,每一次新业务规则加载时,该新业务规则会同时写入规则同步检测系统的数据库中。在确定第一列表和所述第二列表中的容器标识全部相同时,即,规则计算服务集群中无未成功加载新业务规则的容器标识。规则同步检测系统可以根据第一列表中的容器标识在数据库中获取除第一列表中的新业务规则之外的全部业务规则,并得到各自对应的最后修改时间。
将第一列表中新业务规则的修改时间与获取的数据库中的各业务规则的时间相对比,若存在晚于第一修改时间的第二修改时间,例如,第一列表中的修改时间为2023.2.15.13:45,各业务规则中最晚的时间为2023.2.15.15:55,则表示有新的业务规则输入,而规则计算服务集群中的各容器都未加载该业务规则。规则同步检测系统可以确定规则计算服务集群出现异常,需要人工进行干预。规则同步检测系统可以向监控管理平台发送预警消息,以使监控管理平台输出预警消息。运维人员在看到预警消息时可以进行人工干预处理。
可选的,在一些实施例中,规则计算服务集群中各容器接收到新的业务规则时,规则同步检测系统也可以接收到业务规则变更通知,通过第一列表中的容器标识的数量来确定规则计算服务集群运行是否正常。
示例性的,接收业务规则变更通知;在预设时长内,若所述第一列表中的容器标识的数量小于或等于第一阈值,则确定所述规则计算服务集群异常。
本申请实施例中,规则同步检测系统接收到业务规则变更通知时,规则计算服务集群中各容器会开始加载新业务规则。若在预设时间内,规则同步检测系统接收到的规则变动处理结果信息数量,即,所述第一列表中的容器标识的数量,小于第一阈值时,可以表示只有少部分容器成功加载了业务规则,或者,无容器成功加载了新业务规则。规则同步检测系统可以确定规则计算服务集群出现异常,并发送预警信息。
S303、判断第三列表中的容器标识的数量是否大于第一阈值,若否,可以执行S304所示步骤,若是,可以执行S305所示步骤。
S304、将第三列表发送至容器管理平台,以使容器管理平台根据第三列表重启规则计算服务集群中未成功加载新业务规则的容器。
示例性的,若所述第三列表包括的容器标识的数量小于或等于第一阈值,则将所述第三列表发送至容器管理平台。
本申请实施例中,第三列表包括的容器标识的数量小于或等于第一阈值时,表示只有少部分容器加载新业务出现异常,则规则计算服务集群总体运行正常,可以通过容器管理平台重启出现异常的容器。
S305、确定规则计算服务集群异常,向监控管理平台发送预警消息。
示例性的,若所述第三列表包括的容器标识的数量大于第一阈值,则确定所述规则计算服务集群异常;向监控管理平台发送预警消息,以使所述监控管理平台输出所述预警消息,所述预警消息用于指示所述规则计算服务集群异常。
本申请实施例中,第三列表包括的容器标识的数量大于第一阈值时,表示大部分容器加载新业务出现了异常,规则计算服务集群总体出现故障,此时,重启容器可能无法解决问题需要人工进行干预。具体实现方式与上述人工干预方式类似,此处不在赘述。
本申请实施例提供的异常处理方法,规则同步检测系统可以记录容器对规则变动的处理结果,根据规则变动处理结果实现对容器加载新业务规则的过程的监控,识别出出现异常的容器,并通过容器管理平台进行重启,提高了异常处理的效率,确保规则计算服务的处理的一致性,提升了规则计算服务服务质量。并在规则计算服务集群出现故障时,进行预警。
本申请实施例还提供一种异常处理装置。
图4为本申请实施例提供的异常处理装置的结构示意图如图4所示,包括:
获取模块401,用于获取规则计算服务集群的第一列表和第二列表,所述第一列表用于指示所述规则计算服务集群中成功加载新业务规则的容器标识,所述第二列表用于指示所述规则计算服务集群中运行的各容器标识。
确定模块402,用于根据所述第一列表和所述第二列表确定所述规则计算服务集群中存在未成功加载新业务规则的容器标识,则生成第三列表,所述第三列表用于指示所述未成功加载新业务规则的容器标识。
发送模块403,用于将所述第三列表发送至容器管理平台,以使所述容器管理平台根据所述第三列表重启所述规则计算服务集群中未成功加载新业务规则的容器。
可选的,获取模块401,还用于接收所述规则计算服务集群中至少一个容器发送的规则变动处理结果信息,或者,从消息中间件获取所述规则计算服务集群中至少一个容器发送给所述消息中间件的规则变动处理结果信息。
可选的,获取模块401,还用于根据至少一个容器的规则变动处理结果信息,更新或生成所述第一列表。
可选的,获取模块401,还用于接收所述规则计算服务集群中各容器发送的注册信息,或者,从消息中间件获取所述规则计算服务集群中各容器发送给所述消息中间件的注册信息。
可选的,获取模块401,还用于根据各容器的注册信息,更新或生成所述第二列表。
可选的,确定模块402,还用于若确定所述第三列表包括的容器标识的数量大于第一阈值,则确定所述规则计算服务集群异常;向监控管理平台发送预警消息,以使所述监控管理平台输出所述预警消息,所述预警消息用于指示所述规则计算服务集群异常。
可选的,发送模块403,还用于确定若所述第三列表包括的容器标识的数量小于或等于第一阈值,则将所述第三列表发送至容器管理平台。
可选的,确定模块402,还用于根据所述第一列表和所述第二列表确定所述规则计算服务集群中无未成功加载新业务规则的容器标识,则根据所述新业务规则的标识,获取已记录的除所述新业务规则之外的业务规则的第二修改时间;若存在晚于第一修改时间的第二修改时间,则确定所述规则计算服务集群异常;向监控管理平台发送预警消息,以使所述监控管理平台输出所述预警消息,所述预警消息用于指示所述规则计算服务集群异常。
可选的,确定模块402,还用于接收业务规则变更通知;在预设时长内,若所述第一列表中的容器标识的数量小于或等于第一阈值,则确定所述规则计算服务集群异常。
本申请实施例提供的异常检测装置,可以执行上述任一实施例提供的异常处理方法的技术方案,其原理和技术效果类似,此处不再赘述。
本申请实施例还提供一种异常处理系统。
图5为本申请实施例还提供的异常处理系统的结构示意图,如图5所示,包括:规则计算服务集群501、规则同步检测系统503、容器管理平台504以及消息中间件502。
所述规则计算服务集群501,用于发送容器规则变动处理结果信息和容器注册信息。
消息中间件502,用于接收所述容器规则变动处理结果信息和所述容器注册信息,并将所述容器规则变动处理结果信息和所述容器注册信息发送至所述规则同步检测系统。
规则同步检测系统503,用于根据所述容器规则变动处理结果信息和所述容器注册信息生成第三列表,并将所述第三列表发送至所述容器管理平台,所述第三列表用于指示所述未成功加载新业务规则的容器标识。
容器管理平台504,用于根据所述第三列表重启所述规则计算服务集群中未成功加载新业务规则的容器。
可选的,Kafka集群中新增Topic,用于消息的存储。规则计算服务集群中各容器将规则变动处理结果信息发送到指定Topic。规则检测系统消费消息获取各容器规则变动处理结果。
可选的,规则同步检测系统:包含消息拉取模块、消息处理模块、规则同步异常检测模块、容器重启服务调用模块和数据库。
消息拉取模块,用于消费Kafka集群制定Topic的消息,并将消息传给消息处理模块处理。
消息处理模块,用于接收消息拉取模块的消息,进行格式解析,并将消息保存到数据库中。消息包含两类:容器注册信息和规则变动处理结果信息。
规则同步异常检测模块,用于定时任务轮询间隔调度,查询数据库获取规则变动处理结果信息和容器注册列表,根据规则判断是否有存在规则变动处理异常的容器。存在处理异常的容器,将处理异常的容器信息传给容器重启服务调用模块处理。
容器重启服务调用模块,用于负责调用管理平台提供的容器重启服务,调用服务上送需要重启的容器ID信息。
数据库:负责数据的存储,提供数据存储和查询功能。数据主要包含容器注册信息表和规则变动处理结果信息表。
容器管理平台:负责规则计算服务集群中容器的部署管理,新增容器重启服务,可根据传入的容器ID重启指定的容器。
可选的,在一些实施例中,如图6所示,规则计算服务的集群容器通过Kafka传输规则变动处理结果,也可以通过直接访问数据库的方式,将各容器规则变动处理的结果信息保存到数据库制定的数据表中。即,异常处理系统包括:规则计算服务集群601、规则同步检测系统603、容器管理平台603。其具体实现方式与图5所示系统类似,此处不再赘述。
本申请实施例提供的异常处理系统,可以执行上述任一实施例提供的异常处理方法,其原理和技术效果类似。此处不再赘述。
图7为本申请提供的一种电子设备结构示意图。如图7所示,该电子设备70可以包括:至少一个处理器701、存储器702、通信接口703。
存储器702,用于存放程序。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。
存储器702可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
处理器701用于执行存储器702存储的计算机执行指令,以实现前述方法实施例所描述的异常处理方法。其中,处理器701可能是一个中央处理器(Central ProcessingUnit,简称为CPU),或者是特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路。
在具体实现上,如果通信接口703、存储器702和处理器701独立实现,则通信接口703、存储器702和处理器701可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(Industry Standard Architecture,简称为ISA)总线、外部设备互连(Peripheral Component,简称为PCI)总线或扩展工业标准体系结构(Extended IndustryStandard Architecture,简称为EISA)总线等。总线可以分为地址总线、数据总线、控制总线等,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果通信接口703、存储器702和处理器701集成在一块芯片上实现,则通信接口703、存储器702和处理器701可以通过内部接口完成通信。
本申请实施例中还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述异常处理方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
一种可能的实现方式中,计算机可读介质可以包括随机存取存储器(RandomAccess Memory,RAM),只读存储器(Read-Only Memory,ROM),只读光盘(compact discread-only memory,CD-ROM)或其它光盘存储器,磁盘存储器或其它磁存储设备,或目标于承载的任何其它介质或以指令或数据结构的形式存储所需的程序代码,并且可由计算机访问。而且,任何连接被适当地称为计算机可读介质。例如,如果使用同轴电缆,光纤电缆,双绞线,数字用户线(Digital Subscriber Line,DSL)或无线技术(如红外,无线电和微波)从网站,服务器或其它远程源传输软件,则同轴电缆,光纤电缆,双绞线,DSL或诸如红外,无线电和微波之类的无线技术包括在介质的定义中。如本文所使用的磁盘和光盘包括光盘,激光盘,光盘,数字通用光盘(Digital Versatile Disc,DVD),软盘和蓝光盘,其中磁盘通常以磁性方式再现数据,而光盘利用激光光学地再现数据。上述的组合也应包括在计算机可读介质的范围内。
本申请实施例中还提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述异常方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
在上述终端设备或者服务器的具体实现中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:ApplicationSpecific Integrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
本领域技术人员可以理解,上述任一方法实施例的全部或部分步骤可以通过与程序指令相关的硬件来完成。前述的程序可以存储于计算机可读取存储介质中,该程序被执行时,执行上述方法实施例的全部或部分的步骤。
本申请技术方案如果以软件的形式实现并作为产品销售或使用时,可以存储在计算机可读取存储介质中。基于这样的理解,本申请的技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括计算机程序或者若干指令。该计算机软件产品使得计算机设备(可以是个人计算机、服务器、网络设备或者类似的电子设备)执行本申请实施例所述方法的全部或部分步骤。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (10)

1.一种异常处理方法,其特征在于,包括:
获取规则计算服务集群的第一列表和第二列表,所述第一列表用于指示所述规则计算服务集群中成功加载新业务规则的容器标识,所述第二列表用于指示所述规则计算服务集群中运行的各容器标识;
根据所述第一列表和所述第二列表,确定所述规则计算服务集群中存在未成功加载新业务规则的容器标识时,生成第三列表,所述第三列表用于指示所述未成功加载新业务规则的容器标识;
将所述第三列表发送至容器管理平台,以使所述容器管理平台根据所述第三列表重启所述规则计算服务集群中未成功加载新业务规则的容器。
2.根据权利要求1所述的方法,其特征在于,所述获取规则计算服务集群的第一列表和第二列表,包括:
接收所述规则计算服务集群中至少一个容器发送的规则变动处理结果信息,或者,从消息中间件获取所述规则计算服务集群中至少一个容器发送给所述消息中间件的规则变动处理结果信息;
根据至少一个容器的规则变动处理结果信息,更新或生成所述第一列表;
接收所述规则计算服务集群中各容器发送的注册信息,或者,从消息中间件获取所述规则计算服务集群中各容器发送给所述消息中间件的注册信息;
根据各容器的注册信息,更新或生成所述第二列表。
3.根据权利要求2所述的方法,其特征在于,所述将所述第三列表发送至容器管理平台,包括:
若所述第三列表包括的容器标识的数量小于或等于第一阈值,则将所述第三列表发送至容器管理平台。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
若所述第三列表包括的容器标识的数量大于第一阈值,则确定所述规则计算服务集群异常;
向监控管理平台发送预警消息,以使所述监控管理平台输出所述预警消息,所述预警消息用于指示所述规则计算服务集群异常。
5.根据权利要求3所述的方法,其特征在于,所述规则变动处理结果信息包括:所述新业务规则的标识和第一修改时间;所述方法还包括:
若根据所述第一列表和所述第二列表确定所述规则计算服务集群中无未成功加载新业务规则的容器标识,则根据所述新业务规则的标识,获取已记录的除所述新业务规则之外的业务规则的第二修改时间;
若存在晚于第一修改时间的第二修改时间,则确定所述规则计算服务集群异常;
向监控管理平台发送预警消息,以使所述监控管理平台输出所述预警消息,所述预警消息用于指示所述规则计算服务集群异常。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
接收业务规则变更通知;
在预设时长内,若所述第一列表中的容器标识的数量小于或等于第一阈值,则确定所述规则计算服务集群异常。
7.一种异常处理装置,其特征在于,包括:
获取模块,用于获取规则计算服务集群的第一列表和第二列表,所述第一列表用于指示所述规则计算服务集群中成功加载新业务规则的容器标识,所述第二列表用于指示所述规则计算服务集群中运行的各容器标识;
确定模块,用于根据所述第一列表和所述第二列表确定所述规则计算服务集群中存在未成功加载新业务规则的容器标识,则生成第三列表,所述第三列表用于指示所述未成功加载新业务规则的容器标识;
发送模块,用于将所述第三列表发送至容器管理平台,以使所述容器管理平台根据所述第三列表重启所述规则计算服务集群中未成功加载新业务规则的容器。
8.一种异常处理系统,其特征在于,所述系统包括:规则计算服务集群、规则同步检测系统、容器管理平台以及消息中间件;
所述规则计算服务集群,用于发送容器规则变动处理结果信息和容器注册信息;
消息中间件,用于接收所述容器规则变动处理结果信息和所述容器注册信息,并将所述容器规则变动处理结果信息和所述容器注册信息发送至所述规则同步检测系统;
规则同步检测系统,用于根据所述容器规则变动处理结果信息和所述容器注册信息生成第三列表,并将所述第三列表发送至所述容器管理平台,所述第三列表用于指示未成功加载新业务规则的容器标识;
容器管理平台,用于根据所述第三列表重启所述规则计算服务集群中未成功加载新业务规则的容器。
9.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现权利要求1-6中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行以实现权利要求1-6中任一项所述的方法。
CN202310269860.4A 2023-03-15 2023-03-15 异常处理方法、装置、系统、电子设备及存储介质 Pending CN116302861A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310269860.4A CN116302861A (zh) 2023-03-15 2023-03-15 异常处理方法、装置、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310269860.4A CN116302861A (zh) 2023-03-15 2023-03-15 异常处理方法、装置、系统、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116302861A true CN116302861A (zh) 2023-06-23

Family

ID=86786642

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310269860.4A Pending CN116302861A (zh) 2023-03-15 2023-03-15 异常处理方法、装置、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116302861A (zh)

Similar Documents

Publication Publication Date Title
CN108566290B (zh) 服务配置管理方法、系统、存储介质和服务器
US11544137B2 (en) Data processing platform monitoring
CN105677469B (zh) 定时任务执行方法及装置
CN112131237B (zh) 数据同步方法、装置、设备及计算机可读介质
CN110750592B (zh) 数据同步的方法、装置和终端设备
US20140143625A1 (en) Computer-readable recording medium, failure prediction device and applicability determination method
CN110225078B (zh) 一种应用服务更新方法、系统及终端设备
CN111190962B (zh) 一种文件同步方法、装置及本地终端
CN110995851B (zh) 消息处理方法、装置、存储介质及设备
CN112579289B (zh) 一种可智能调度的分布式解析引擎方法及装置
CN111010318A (zh) 发现物联网终端设备失联的方法、系统和设备影子服务器
CN109714214B (zh) 一种服务器异常的处理方法及管理设备
CN109684130B (zh) 一种机房间数据备份的方法及装置
CN114020819A (zh) 一种多系统参数同步方法及装置
CN112260902A (zh) 网络设备监控方法、装置、设备及存储介质
CN111092956A (zh) 资源同步方法、装置、存储介质及设备
CN116633766A (zh) 故障处理方法、装置、电子设备及存储介质
CN116302861A (zh) 异常处理方法、装置、系统、电子设备及存储介质
CN111984723A (zh) 数据同步方法、装置及终端设备
CN116303320A (zh) 基于日志文件的实时任务管理方法、装置、设备及介质
CN115437766A (zh) 一种任务处理方法和装置
CN109033134A (zh) 一种消息处理方法、装置、存储介质及计算机设备
CN113946543A (zh) 基于人工智能的数据归档方法、装置、设备及存储介质
CN113297149A (zh) 数据处理请求的监测方法及装置
CN117424843B (zh) 一种管理方法、装置及ate测试系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination