CN113419889A - 一种支付系统的故障自动切换方法及装置 - Google Patents

一种支付系统的故障自动切换方法及装置 Download PDF

Info

Publication number
CN113419889A
CN113419889A CN202110739281.2A CN202110739281A CN113419889A CN 113419889 A CN113419889 A CN 113419889A CN 202110739281 A CN202110739281 A CN 202110739281A CN 113419889 A CN113419889 A CN 113419889A
Authority
CN
China
Prior art keywords
emergency
payment system
transaction
abnormal
switching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110739281.2A
Other languages
English (en)
Inventor
王倩
许泽鹏
唐军文
徐维君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110739281.2A priority Critical patent/CN113419889A/zh
Publication of CN113419889A publication Critical patent/CN113419889A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/445Program loading or initiating
    • G06F9/44505Configuring for program initiating, e.g. using registry, configuration files
    • G06F9/4451User profiles; Roaming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/085Payment architectures involving remote charge determination or related payment systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Technology Law (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供了一种支付系统的故障自动切换方法及装置,可以应用于金融领域,方法包括:对实时获取的交易数据和历史交易数据进行分析,获得分析结果;当分析结果为异常时,判断异常类型并获取异常类型对应的应急参数;应急参数与异常类型的映射关系为预先生成;根据应急参数修改支付系统在配置中心路由中对应的参数,以使支付系统的交易路由对接至应急处理集群服务器,以便应急处理集群服务器能够对外提供支付服务。通过优化故障切换方法,建立起一个外部的支付应急系统,用于在现有的支付系统的核心节点出现短期无法恢复的故障时,将业务通过路由集群切换到此应急集群,以保障重要的业务不被中断。

Description

一种支付系统的故障自动切换方法及装置
技术领域
本申请属于分布式故障处理技术领域,具体地讲,涉及一种支付系统的故障自动切换方法及装置。
背景技术
传统的银行24小时支付系统如果遇到故障应急场景,主要是以人工介入为主。目前银行支付系统主要采用分布式部署模式,通常引起故障的原因有容器故障、网络故障、核心处理节点程序故障等。当生产出现故障时,运维人员首先要根据监控信息确定产生故障的原因,然后根据不同原因采用不同的故障处理方案,如容器隔离、园区切换等。在实际应用中,人工介入操作,人为的判断和操作耗时长,影响银行系统连续提供服务的时间。
发明内容
本申请提供了一种支付系统的故障自动切换方法及装置,以至少解决交易系统发生故障时需要人工介入修复的问题。
根据本申请的第一个方面,提供了一种支付系统的故障自动切换方法,包括:
对实时获取的交易数据和历史交易数据进行分析,获得分析结果;
当分析结果为异常时,判断异常类型并获取异常类型对应的应急参数;应急参数与异常类型的映射关系为预先生成;
根据应急参数修改支付系统在配置中心路由中对应的参数,以使支付系统的交易路由对接至应急处理集群服务器,以便应急处理集群服务器能够对外提供支付服务。
在一实施例中,对实时获取的交易数据和历史交易数据进行分析,获得分析结果,包括:
将实时获取的交易量与历史同期交易量进行比对,获得交易量分析结果;
将实时获取的交易成功率跟历史交易成功率进行对比,获得成功率分析结果。
在一实施例中,当分析结果为异常时,判断异常类型并获取异常类型对应的应急参数,包括:
当交易量分析结果或成功率分析结果异常时,判断异常类型;
根据异常类型从预先生成的应急参数与异常类型映射关系表中查找对应的应急参数。
在一实施例中,支付系统的故障自动切换方法还包括:
实时探测当前交易成功率和交易量是否恢复至正常状态;
如果是,调用配置中心接口修改配置中心中的应急参数,将部分商户切换至正常支付系统。
在一实施例中,支付系统的故障自动切换方法还包括:
将部分商户切换至正常支付系统并运行预设的一段时间后,将部分商户在历史该段时间内的交易成功率与当前交易成功率进行对比;
如果对比结果正常,则调用配置中心接口修改配置中心中的应急参数,将全部商户切换至正常支付系统。
根据本申请的第二个方面,还提供了一种支付系统的故障自动切换装置,包括:
分析单元,用于对实时获取的交易数据和历史交易数据进行分析,获得分析结果;
应急参数调用单元,用于当分析结果为异常时,判断异常类型并获取异常类型对应的应急参数;应急参数与异常类型的映射关系为预先生成;
参数修改切换单元,用于根据应急参数修改支付系统在配置中心路由中对应的参数,以使支付系统的交易路由对接至应急处理集群服务器,以便应急处理集群服务器能够对外提供支付服务。
在一实施例中,分析单元包括:
交易量分析模块,用于将实时获取的交易量与历史同期交易量进行比对,获得交易量分析结果;
成功率分析模块,用于将实时获取的交易成功率跟历史交易成功率进行对比,获得成功率分析结果。
在一实施例中,应急参数调用单元包括:
异常类型判断模块,用于当交易量分析结果或成功率分析结果异常时,判断异常类型;
查找模块,用于根据异常类型从预先生成的应急参数与异常类型映射关系表中查找对应的应急参数。
在一实施例中,支付系统的故障自动切换装置还包括:
探测单元,用于实时探测当前交易成功率和交易量是否恢复至正常状态;
部分切换单元,用于如果是,调用配置中心接口修改配置中心中的应急参数,将部分商户切换至正常支付系统。
在一实施例中,支付系统的故障自动切换装置还包括:
检查单元,用于将部分商户切换至正常支付系统并运行预设的一段时间后,将部分商户在历史该段时间内的交易成功率与当前交易成功率进行对比;
全部切换单元,用于如果对比结果正常,则调用配置中心接口修改配置中心中的应急参数,将全部商户切换至正常支付系统。
根据本申请的第三个方面,还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现支付系统的故障自动切换方法的步骤。
根据本申请的第四个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现支付系统的故障自动切换方法的步骤。
由上技术方案可知,本申请提供了一种实现支付系统的故障自动切换方法及装置,方法包括:对实时获取的交易数据和历史交易数据进行分析,获得分析结果;当分析结果为异常时,判断异常类型并获取异常类型对应的应急参数;应急参数与异常类型的映射关系为预先生成;根据应急参数修改支付系统在配置中心路由中对应的参数,以使支付系统的交易路由对接至应急处理集群服务器,以便应急处理集群服务器能够对外提供支付服务。通过优化故障切换方法,建立起一个外部的支付应急系统,用于在现有的支付系统的核心节点出现短期无法恢复的故障时,将业务通过路由集群切换到此应急系统(集群),以保障重要的业务不被中断,通过应急切换控制系统实现了在支付系统故障时可以自动切换到应急处理集群以完成对外支付功能,并通过自动探测功能,实现系统回切到核心业务系统。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的一种银行支付系统故障自动切换方法流程图。
图2为本申请实施例中分析结果获取方法流程图。
图3为本申请实施例中判断异常类型并获取异常类型对应的应急参数的流程图。
图4为本申请实施例中另一支付系统的故障自动切换方法流程图。
图5为本申请实施例中支付系统的故障自动切换方法的另一实施方式。
图6为本申请提供的支付系统的故障自动切换系统。
图7为本申请提供的一种支付系统的故障自动切换装置的结构框图。
图8为本申请实施例中分析单元的结构框图。
图9为本申请实施例中应急参数调用单元的结构框图。
图10为本申请实施例中另一支付系统的故障自动切换装置的结构框图。
图11为本申请实施例中支付系统的故障自动切换装置的另一实施方式。
图12为本申请实施例中一种电子设备的具体实施方式。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本申请公开的实现支付系统的故障自动切换方法及装置可用于金融技术领域,也可用于除金融技术领域之外的任意领域,本申请对公开的自实现支付系统的故障自动切换方法及装置的应用领域不做限定。
传统的银行24小时支付系统如果遇到故障应急场景,主要是以人工介入为主。目前银行支付系统主要采用分布式部署模式,通常引起故障的原因有容器故障、网络故障、核心处理节点程序故障等。当生产出现故障时,运维人员首先要根据监控信息确定产生故障的原因,然后根据不同原因采用不同的故障处理方案,如容器隔离、园区切换等。在实际应用中,人工介入操作,人为的判断和操作耗时长,影响银行系统连续提供服务的时间。
基于此,需要通过一种银行支付系统故障自动切换方法建立银行支付系统的应急服务集群,针对采集的交易监控信息并进行数据分析,进行自动切换,实现系统的高可用性,减少对客户的业务影响。
为了避免银行支付系统突然出故障给用户造成的不便,本申请分别提供了一种实现支付系统的故障自动切换方法、实现支付系统的故障自动切换装置、电子设备和计算机可读介质,通过优化故障切换方法,建立起一个外部的支付应急系统,用于在现有的支付系统的核心节点出现短期无法恢复的故障时,将业务通过路由集群切换到此应急系统(集群),以保障重要的业务不被中断,通过应急切换控制系统实现了在支付系统故障时可以自动切换到应急处理集群以完成对外支付功能,并通过自动探测功能,实现系统回切到核心业务系统。
根据上述内容,本申请还提供了一种用于实现本申请一个或多个实施例中提供的银行支付系统故障自动切换方法的银行支付系统故障自动切换装置,该银行支付系统故障自动切换装置可以自行或通过第三方服务器等与客户端设备之间通信连接,并将执行结果返回给客户端。
可以理解的是,所述客户端设备可以包括智能手机、平板电子设备、网络机顶盒、便携式计算机、台式电脑、个人数字助理(PDA)、车载设备、智能穿戴设备等。其中,所述智能穿戴设备可以包括智能眼镜、智能手表、智能手环等。
在另一种实际应用情形中,前述的银行支付系统故障自动切换装置进行银行支付系统故障自动切换的部分可以在如上述内容的服务器中执行,也可以所有的操作都在所述客户端设备中完成。具体可以根据所述客户端设备的处理能力,以及用户使用场景的限制等进行选择。本申请对此不作限定。若所有的操作都在所述客户端设备中完成,所述客户端设备还可以包括处理器,用于银行支付系统故障自动切换的具体处理。
上述的客户端设备可以具有通信模块(即通信单元),可以与远程的服务器进行通信连接,实现与所述服务器的数据传输。所述服务器可以包括任务调度中心一侧的服务器,其他的实施场景中也可以包括中间平台的服务器,例如与任务调度中心服务器有通信链接的第三方服务器平台的服务器。所述的服务器可以包括单台计算机设备,也可以包括多个服务器组成的服务器集群,或者分布式装置的服务器结构。
上述服务器与所述客户端设备之间可以使用任何合适的网络协议进行通信,包括在本申请提交日尚未开发出的网络协议。所述网络协议例如可以包括TCP/IP协议、UDP/IP协议、HTTP协议、HTTPS协议等。当然,所述网络协议例如还可以包括在上述协议之上使用的RPC协议(Remote Procedure Call Protocol,远程过程调用协议)、REST协议(Representational State Transfer,表述性状态转移协议)等。
具体通过下述各个实施例及应用实例分别进行详细说明。
本申请提供的一种银行支付系统故障自动切换方法,如图1所示,包括:
S101:对实时获取的交易数据和历史交易数据进行分析,获得分析结果。
S102:当分析结果为异常时,判断异常类型并获取异常类型对应的应急参数;应急参数与异常类型的映射关系为预先生成。
S103:根据应急参数修改支付系统在配置中心路由中对应的参数,以使支付系统的交易路由对接至应急处理集群服务器,以便应急处理集群服务器能够对外提供支付服务。
在一实施例中,对实时获取的交易数据和历史交易数据进行分析,获得分析结果,如图2所示,包括:
S201:将实时获取的交易量与历史同期交易量进行比对,获得交易量分析结果。
S202:将实时获取的交易成功率跟历史交易成功率进行对比,获得成功率分析结果。
在一实施例中,当分析结果为异常时,判断异常类型并获取异常类型对应的应急参数,如图3所示,包括:
S301:当交易量分析结果或成功率分析结果异常时,判断异常类型。
S302:根据异常类型从预先生成的应急参数与异常类型映射关系表中查找对应的应急参数。
在一实施例中,如图4所示,支付系统的故障自动切换方法还包括:
S401:实时探测当前交易成功率和交易量是否恢复至正常状态。
S402:如果是,调用配置中心接口修改配置中心中的应急参数,将部分商户切换至正常支付系统。
在一实施例中,如图5所示,支付系统的故障自动切换方法还包括:
S501:将部分商户切换至正常支付系统并运行预设的一段时间后,将部分商户在历史该段时间内的交易成功率与当前交易成功率进行对比。
S502:如果对比结果正常,则调用配置中心接口修改配置中心中的应急参数,将全部商户切换至正常支付系统。
在一具体实施例中,如图6所示,为一种银行支付系统的故障自动切换系统,包括支付系统1、监控系统2、历史数据系统3、数据分析和自动切换控制系统4、配置中心5。
支付系统1,是指银行支付系统。在收到支付指令信息以及完成处理后,将本次交易的信息发送到监控系统。在该发明中,支付系统采用双园区分布式部署,包括分布式联机容器和数据库。联机服务器采用Docker容器部署,可以支持快速扩容,联机服务采用RPC调用。数据库采用MYSQL一主三备部署模式,支持快速切换到备库提供服务。为了实现系统的高可用,该发明中支付系统包括路由集群、核心处理集群和应急处理集群。包括路由集群、核心处理集群和应急处理集群。与传统的支付系统相比,在该发明中建立了支付系统专用的应急处理集群,应急处理应急业务集群是在核心节点出现短期无法恢复的故障时,将业务通过路由集群切换到此应急集群,应急集群的应用业务集群以简化的业务处理模式提供降级服务,保障重要业务不中断。
监控系统2,是指用于接收支付系统的采集的监控信息,包括可用性监控模块、系统资源监控模块、交易监控模块、服务监控模块等。
历史数据系统3,是指用于存储监控信息的历史数据,在数据分析时结合历史数据做出决策。
数据分析和自动切换控制系统4,是指基于监控系统采集的实时数据和历史数据,并对监控数据进行实时分析和决策,如果系统出现故障,自动进行应急切换处理。包括数据分析处理模块、应急切换模块、服务回切模块、系统可用性探测模块。
配置中心5,是指用于配置支付系统对应的参数,参数修改后实时推送到支付系统,实时生效。
其中,在支付系统中,包括路由集群、业务核心服务集群、应急处理集群。
路由集群用于交易路由到核心处理集群还是到应急处理集群,采用配置中心管理参数,实时生效。
业务核心服务集群用于支付系统的核心处理,处理支付请求,并将交易信息和结果实时发送到监控系统。
应急服务集群用于支付系统出现大面积严重故障且无法短时恢复时,将业务通过路由集群切换到此应急服务集群。该集群在物理部署上跟业务核心服务集群完全独立,程序代码独立,为简化生产实际业务的复杂性,应急系统的程序采用简化处理模式,包括:
1)通过实时自动修改配置中心路由配置信息,将交易路由到应急服务集群,配置修改后实时生效。
2)路由配置支持两种模式:日常运行模式和应急模式。日常运行模式可以按客户和时间段维度进行配置,例行将部分客户运行在应急服务集群。应急模式可以全部将业务切换到应急服务集群。
3)为了保障应急处理集群的可用性,形成应急系统日常运行机制。日常路由配置日常运行模式,确保应急系统在任何时段都是正常可用的。
4)在应急模式下,当检测到业务核心服务集群恢复正常后,支持业务进行回切,
回切分两个阶段进行,按客户维度部分回切和全部回切。
监控系统包括可用性监控、系统资源监控模块、交易监控模块和服务监控模块。
可用性监控用于监控支付系统是否可用;系统资源监控模块用于监控系统资源,如CPU、内存、磁盘等资源情况;交易监控模块用于监控交易量、交易响应时间、业务成功率、系统成功率;服务监控用于监控支付系统的服务是否正常。
数据分析和自动切换控制系统包括数据分析处理模块、应急切换模块、服务回切模块和系统可用性探测模块。
数据分析处理模块用于根据实时监控数据进行分析,识别系统运行是否正常。同时在回切阶段,通过实时监控数据和历史监控数据,分析该批商户在历史该时间段的成功率跟当前成功率进行比对。
应急切换模块用于应急切换时将交易切换到应急服务集群,调用配置中心接口修改支付系统在配置中心路由对应的应急参数,参数实时生效。
服务回切模块用于回切阶段,将交易切换到业务核心服务集群,分两个阶段回切,第一阶段将部分客户回切到核心系统,待监控正常后,再将全部业务回切到核心系统,调用配置中心接口修改支付系统在配置中心路由对应的应急参数,参数实时生效。
系统可用性探测模块用于在核心系统故障时,自动发起报文探测系统是否恢复。
上述介绍的银行支付系统的故障自动切换系统在工作过程中实现自动切换,减少了人工干预,具体包括以下工作步骤:
步骤1:银行支付系统处理支付交易,并采集交易信息到监控系统。
步骤2:监控系统采集交易信息,交易信息包括交易成功率和交易量等。
步骤3:数据分析和自动切换控制系统,根据实时监控数据进行分析,识别系统运行是否正常。
步骤4:数据分析和自动切换控制系统,识别交易量和成功率是否大幅降低,如果正常,则通过步骤3继续检测;如果交易量和成功率是否大幅度降低,则进入步骤5。
步骤5:数据分析和自动切换控制系统,调用配置中心接口修改支付系统在配置中心路由对应的应急参数,参数实时生效。
步骤6:支付系统实时将交易路由修改到应急处理集群,继续对外提供支付服务。
步骤7:数据分析和自动切换控制系统自动开启系统可用性探测模块,探测核心处理系统是否恢复,如果已经恢复,则进入步骤8,否则继续探测。
步骤8:数据分析和自动切换控制系统的服务回切模块,调用配置中心接口修改配置中心修改应急回切路由参数,切换部分商户到正常系统。
步骤9:运行预设的N分钟后,数据分析和自动切换控制系统的数据分析处理模块,分析该批商户在历史该时间段的成功率跟当前成功率进行比对。如果恢复正常,则进入步骤10。
步骤10:数据分析和自动切换控制系统的服务回切模块,调用配置中心接口修改配置中心修改应急回切路由参数,切换全部商户到正常系统。
基于同一发明构思,本申请实施例还提供了一种银行支付系统的故障自动切换装置,可以用于实现上述实施例中所描述的方法,如下面实施例所述。由于该银行支付系统的故障自动切换装置解决问题的原理与银行支付系统的故障自动切换方法相似。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的系统较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本申请提供了一种支付系统的故障自动切换装置,如图7所示,包括:
分析单元701,用于对实时获取的交易数据和历史交易数据进行分析,获得分析结果;
应急参数调用单元702,用于当分析结果为异常时,判断异常类型并获取异常类型对应的应急参数;应急参数与异常类型的映射关系为预先生成;
参数修改切换单元703,用于根据应急参数修改支付系统在配置中心路由中对应的参数,以使支付系统的交易路由对接至应急处理集群服务器,以便应急处理集群服务器能够对外提供支付服务。
在一实施例中,如图8所示,分析单元701包括:
交易量分析模块801,用于将实时获取的交易量与历史同期交易量进行比对,获得交易量分析结果;
成功率分析模块802,用于将实时获取的交易成功率跟历史交易成功率进行对比,获得成功率分析结果。
在一实施例中,如图9所示,应急参数调用单元702包括:
异常类型判断模块901,用于当交易量分析结果或成功率分析结果异常时,判断异常类型;
查找模块902,用于根据异常类型从预先生成的应急参数与异常类型映射关系表中查找对应的应急参数。
在一实施例中,如图10所示,支付系统的故障自动切换装置还包括:
探测单元1001,用于实时探测当前交易成功率和交易量是否恢复至正常状态;
部分切换单元1002,用于如果是,调用配置中心接口修改配置中心中的应急参数,将部分商户切换至正常支付系统。
在一实施例中,如图11所示,支付系统的故障自动切换装置还包括:
检查单元1101,用于将部分商户切换至正常支付系统并运行预设的一段时间后,将部分商户在历史该段时间内的交易成功率与当前交易成功率进行对比;
全部切换单元1102,用于如果对比结果正常,则调用配置中心接口修改配置中心中的应急参数,将全部商户切换至正常支付系统。
在一具体实施例中,本申请提供了一种银行支付系统的故障自动切换系统,包括支付系统1、监控系统2、历史数据系统3、数据分析和自动切换控制系统4、配置中心5。
支付系统1,是指银行支付系统。在收到支付指令信息以及完成处理后,将本次交易的信息发送到监控系统。在该发明中,支付系统采用双园区分布式部署,包括分布式联机容器和数据库。联机服务器采用Docker容器部署,可以支持快速扩容,联机服务采用RPC调用。数据库采用MYSQL一主三备部署模式,支持快速切换到备库提供服务。为了实现系统的高可用,该发明中支付系统包括路由集群、核心处理集群和应急处理集群。包括路由集群、核心处理集群和应急处理集群。与传统的支付系统相比,在该发明中建立了支付系统专用的应急处理集群,应急处理应急业务集群是在核心节点出现短期无法恢复的故障时,将业务通过路由集群切换到此应急集群,应急集群的应用业务集群以简化的业务处理模式提供降级服务,保障重要业务不中断。
监控系统2,是指用于接收支付系统的采集的监控信息,包括可用性监控模块、系统资源监控模块、交易监控模块、服务监控模块等。
历史数据系统3,是指用于存储监控信息的历史数据,在数据分析时结合历史数据做出决策。
数据分析和自动切换控制系统4,是指基于监控系统采集的实时数据和历史数据,并对监控数据进行实时分析和决策,如果系统出现故障,自动进行应急切换处理。包括数据分析处理模块、应急切换模块、服务回切模块、系统可用性探测模块。
配置中心5,是指用于配置支付系统对应的参数,参数修改后实时推送到支付系统,实时生效。
其中,在支付系统中,包括路由集群、业务核心服务集群、应急处理集群。
路由集群用于交易路由到核心处理集群还是到应急处理集群,采用配置中心管理参数,实时生效。
业务核心服务集群用于支付系统的核心处理,处理支付请求,并将交易信息和结果实时发送到监控系统。
应急服务集群用于支付系统出现大面积严重故障且无法短时恢复时,将业务通过路由集群切换到此应急服务集群。该集群在物理部署上跟业务核心服务集群完全独立,程序代码独立,为简化生产实际业务的复杂性,应急系统的程序采用简化处理模式,包括:
1)通过实时自动修改配置中心路由配置信息,将交易路由到应急服务集群,配置修改后实时生效。
2)路由配置支持两种模式:日常运行模式和应急模式。日常运行模式可以按客户和时间段维度进行配置,例行将部分客户运行在应急服务集群。应急模式可以全部将业务切换到应急服务集群。
3)为了保障应急处理集群的可用性,形成应急系统日常运行机制。日常路由配置日常运行模式,确保应急系统在任何时段都是正常可用的。
4)在应急模式下,当检测到业务核心服务集群恢复正常后,支持业务进行回切,回切分两个阶段进行,按客户维度部分回切和全部回切。
监控系统包括可用性监控、系统资源监控模块、交易监控模块和服务监控模块。
可用性监控用于监控支付系统是否可用;系统资源监控模块用于监控系统资源,如CPU、内存、磁盘等资源情况;交易监控模块用于监控交易量、交易响应时间、业务成功率、系统成功率;服务监控用于监控支付系统的服务是否正常。
数据分析和自动切换控制系统包括数据分析处理模块、应急切换模块、服务回切模块和系统可用性探测模块。
数据分析处理模块用于根据实时监控数据进行分析,识别系统运行是否正常。同时在回切阶段,通过实时监控数据和历史监控数据,分析该批商户在历史该时间段的成功率跟当前成功率进行比对。
应急切换模块用于应急切换时将交易切换到应急服务集群,调用配置中心接口修改支付系统在配置中心路由对应的应急参数,参数实时生效。
服务回切模块用于回切阶段,将交易切换到业务核心服务集群,分两个阶段回切,第一阶段将部分客户回切到核心系统,待监控正常后,再将全部业务回切到核心系统,调用配置中心接口修改支付系统在配置中心路由对应的应急参数,参数实时生效。
系统可用性探测模块用于在核心系统故障时,自动发起报文探测系统是否恢复。
上述介绍的银行支付系统的故障自动切换系统在工作过程中实现自动切换,减少了人工干预,具体包括以下工作步骤:
步骤1:银行支付系统处理支付交易,并采集交易信息到监控系统。
步骤2:监控系统采集交易信息,交易信息包括交易成功率和交易量等。
步骤3:数据分析和自动切换控制系统,根据实时监控数据进行分析,识别系统运行是否正常。
步骤4:数据分析和自动切换控制系统,识别交易量和成功率是否大幅降低,如果正常,则通过步骤3继续检测;如果交易量和成功率是否大幅度降低,则进入步骤5。
步骤5:数据分析和自动切换控制系统,调用配置中心接口修改支付系统在配置中心路由对应的应急参数,参数实时生效。
步骤6:支付系统实时将交易路由修改到应急处理集群,继续对外提供支付服务。
步骤7:数据分析和自动切换控制系统自动开启系统可用性探测模块,探测核心处理系统是否恢复,如果已经恢复,则进入步骤8,否则继续探测。
步骤8:数据分析和自动切换控制系统的服务回切模块,调用配置中心接口修改配置中心修改应急回切路由参数,切换部分商户到正常系统。
步骤9:运行预设的N分钟后,数据分析和自动切换控制系统的数据分析处理模块,分析该批商户在历史该时间段的成功率跟当前成功率进行比对。如果恢复正常,则进入步骤10。
步骤10:数据分析和自动切换控制系统的服务回切模块,调用配置中心接口修改配置中心修改应急回切路由参数,切换全部商户到正常系统。
本申请通过优化故障切换方法,建立起一个外部的支付应急系统,用于在现有的支付系统的核心节点出现短期无法恢复的故障时,将业务通过路由集群切换到此应急系统(集群),以保障重要的业务不被中断,通过应急切换控制系统实现了在支付系统故障时可以自动切换到应急处理集群以完成对外支付功能,并通过自动探测功能,实现系统回切到核心业务系统。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
本申请的实施例还提供能够实现上述实施例中的方法中全部步骤的一种电子设备的具体实施方式,参见图12,所述电子设备具体包括如下内容:
处理器(processor)1201、内存1202、通信接口(Communications Interface)1203、总线1204和非易失性存储器1205;
其中,所述处理器1201、内存1202、通信接口1203通过所述总线1204完成相互间的通信;
所述处理器1201用于调用所述内存1202和非易失性存储器1205中的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中的方法中的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
S101:对实时获取的交易数据和历史交易数据进行分析,获得分析结果。
S102:当分析结果为异常时,判断异常类型并获取异常类型对应的应急参数;应急参数与异常类型的映射关系为预先生成。
S103:根据应急参数修改支付系统在配置中心路由中对应的参数,以使支付系统的交易路由对接至应急处理集群服务器,以便应急处理集群服务器能够对外提供支付服务。
本申请的实施例还提供能够实现上述实施例中的方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
S101:对实时获取的交易数据和历史交易数据进行分析,获得分析结果。
S102:当分析结果为异常时,判断异常类型并获取异常类型对应的应急参数;应急参数与异常类型的映射关系为预先生成。
S103:根据应急参数修改支付系统在配置中心路由中对应的参数,以使支付系统的交易路由对接至应急处理集群服务器,以便应急处理集群服务器能够对外提供支付服务。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于硬件+程序类实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。虽然本说明书实施例提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或终端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书实施例的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。以上所述仅为本说明书实施例的实施例而已,并不用于限制本说明书实施例。对于本领域技术人员来说,本说明书实施例可以有各种更改和变化。凡在本说明书实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书实施例的权利要求范围之内。

Claims (12)

1.一种支付系统的故障自动切换方法,其特征在于,包括:
对实时获取的交易数据和历史交易数据进行分析,获得分析结果;
当所述分析结果为异常时,判断异常类型并获取所述异常类型对应的应急参数;所述应急参数与所述异常类型的映射关系为预先生成;
根据所述应急参数修改支付系统在配置中心路由中对应的参数,以使支付系统的交易路由对接至应急处理集群服务器,以便所述应急处理集群服务器能够对外提供支付服务。
2.根据权利要求1所述的支付系统的故障自动切换方法,其特征在于,所述对实时获取的交易数据和历史交易数据进行分析,获得分析结果,包括:
将实时获取的交易量与历史同期交易量进行比对,获得交易量分析结果;
将实时获取的交易成功率跟历史交易成功率进行对比,获得成功率分析结果。
3.根据权利要求2所述的支付系统的故障自动切换方法,其特征在于,所述当所述分析结果为异常时,判断异常类型并获取所述异常类型对应的应急参数,包括:
当所述交易量分析结果或所述成功率分析结果异常时,判断异常类型;
根据所述异常类型从预先生成的应急参数与异常类型映射关系表中查找对应的应急参数。
4.根据权利要求3所述的支付系统的故障自动切换方法,其特征在于,还包括:
实时探测当前交易成功率和交易量是否恢复至正常状态;
如果是,调用配置中心接口修改配置中心中的应急参数,将部分商户切换至正常支付系统。
5.根据权利要求4所述的支付系统的故障自动切换方法,其特征在于,还包括:
将部分商户切换至正常支付系统并运行预设的一段时间后,将所述部分商户在历史该段时间内的交易成功率与当前交易成功率进行对比;
如果对比结果正常,则调用配置中心接口修改配置中心中的应急参数,将全部商户切换至正常支付系统。
6.一种支付系统的故障自动切换装置,其特征在于,包括:
分析单元,用于对实时获取的交易数据和历史交易数据进行分析,获得分析结果;
应急参数调用单元,用于当所述分析结果为异常时,判断异常类型并获取所述异常类型对应的应急参数;所述应急参数与所述异常类型的映射关系为预先生成;
参数修改切换单元,用于根据所述应急参数修改支付系统在配置中心路由中对应的参数,以使支付系统的交易路由对接至应急处理集群服务器,以便所述应急处理集群服务器能够对外提供支付服务。
7.根据权利要求6所述的支付系统的故障自动切换装置,其特征在于,所述分析单元包括:
交易量分析模块,用于将实时获取的交易量与历史同期交易量进行比对,获得交易量分析结果;
成功率分析模块,用于将实时获取的交易成功率跟历史交易成功率进行对比,获得成功率分析结果。
8.根据权利要求7所述的支付系统的故障自动切换装置,其特征在于,所述应急参数调用单元包括:
异常类型判断模块,用于当所述交易量分析结果或所述成功率分析结果异常时,判断异常类型;
查找模块,用于根据所述异常类型从预先生成的应急参数与异常类型映射关系表中查找对应的应急参数。
9.根据权利要求8所述的支付系统的故障自动切换装置,其特征在于,还包括:
探测单元,用于实时探测当前交易成功率和交易量是否恢复至正常状态;
部分切换单元,用于如果是,调用配置中心接口修改配置中心中的应急参数,将部分商户切换至正常支付系统。
10.根据权利要求9所述的支付系统的故障自动切换装置,其特征在于,还包括:
检查单元,用于将部分商户切换至正常支付系统并运行预设的一段时间后,将所述部分商户在历史该段时间内的交易成功率与当前交易成功率进行对比;
全部切换单元,用于如果对比结果正常,则调用配置中心接口修改配置中心中的应急参数,将全部商户切换至正常支付系统。
11.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至5任一项所述的支付系统的故障自动切换方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至5任一项所述的支付系统的故障自动切换方法的步骤。
CN202110739281.2A 2021-06-30 2021-06-30 一种支付系统的故障自动切换方法及装置 Pending CN113419889A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110739281.2A CN113419889A (zh) 2021-06-30 2021-06-30 一种支付系统的故障自动切换方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110739281.2A CN113419889A (zh) 2021-06-30 2021-06-30 一种支付系统的故障自动切换方法及装置

Publications (1)

Publication Number Publication Date
CN113419889A true CN113419889A (zh) 2021-09-21

Family

ID=77717394

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110739281.2A Pending CN113419889A (zh) 2021-06-30 2021-06-30 一种支付系统的故障自动切换方法及装置

Country Status (1)

Country Link
CN (1) CN113419889A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114118991A (zh) * 2021-11-12 2022-03-01 百果园技术(新加坡)有限公司 第三方系统监控系统、方法、装置、设备及存储介质
CN116823251A (zh) * 2023-05-15 2023-09-29 浪潮智慧科技有限公司 一种基于聚合支付的服务商可信支付方法、设备及介质
CN116980463A (zh) * 2023-09-22 2023-10-31 湖南三湘银行股份有限公司 一种基于探测报文系统交易自动切换的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111431980A (zh) * 2020-03-17 2020-07-17 星辰天合(北京)数据科技有限公司 分布式存储系统及其路径切换方法
CN112258167A (zh) * 2020-12-21 2021-01-22 上海富友支付服务股份有限公司 支付平台侧的可动态切换支付路由的方法和支付平台系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111431980A (zh) * 2020-03-17 2020-07-17 星辰天合(北京)数据科技有限公司 分布式存储系统及其路径切换方法
CN112258167A (zh) * 2020-12-21 2021-01-22 上海富友支付服务股份有限公司 支付平台侧的可动态切换支付路由的方法和支付平台系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114118991A (zh) * 2021-11-12 2022-03-01 百果园技术(新加坡)有限公司 第三方系统监控系统、方法、装置、设备及存储介质
CN116823251A (zh) * 2023-05-15 2023-09-29 浪潮智慧科技有限公司 一种基于聚合支付的服务商可信支付方法、设备及介质
CN116823251B (zh) * 2023-05-15 2024-04-05 浪潮智慧科技有限公司 一种基于聚合支付的服务商可信支付方法、设备及介质
CN116980463A (zh) * 2023-09-22 2023-10-31 湖南三湘银行股份有限公司 一种基于探测报文系统交易自动切换的方法
CN116980463B (zh) * 2023-09-22 2024-01-30 湖南三湘银行股份有限公司 一种基于探测报文系统交易自动切换的方法

Similar Documents

Publication Publication Date Title
CN113419889A (zh) 一种支付系统的故障自动切换方法及装置
US11269718B1 (en) Root cause detection and corrective action diagnosis system
US20230224697A1 (en) System, method, apparatus, and computer program product for providing mobile device support services
CN110708196B (zh) 数据处理方法及装置
CN108633311A (zh) 一种基于调用链的并发控制的方法、装置及控制节点
CN111209110B (zh) 一种实现负载均衡的任务调度管理方法、系统和存储介质
CN109286529A (zh) 一种恢复RabbitMQ网络分区的方法及系统
US11934855B2 (en) System and method to autonomously manage hybrid information technology (IT) infrastructure
CN109254876A (zh) 云计算系统中数据库的管理方法和装置
CN115698954A (zh) 管理故障转移区域可用性以实施故障转移服务
CN110413457A (zh) 云服务的容灾方法和装置
CN115812298A (zh) 供应故障的区块链管理
CN109842500A (zh) 一种调度方法及系统、工作节点及监控节点
CN111538585A (zh) 一种基于node.js的服务器进程调度方法、系统和装置
CN114706675A (zh) 基于云边协同系统的任务部署方法及装置
CN113760634A (zh) 一种数据处理方法和装置
CN113760522A (zh) 一种任务处理方法和装置
CN115412610A (zh) 故障场景下的流量调度方法及装置
CN113645153A (zh) 一种流量控制方法、装置、设备及介质
CN106776119A (zh) 服务实例的重启方法、装置及服务器
CN116723111B (zh) 业务请求的处理方法、系统及电子设备
Oliveira et al. Design and implementation of fault tolerance techniques to improve QoS in SOA
JP6502783B2 (ja) 一括管理システム、一括管理方法およびプログラム
CN114125156A (zh) 一种适用外呼产品部署的自适应切换方法及装置
CN110808866B (zh) 一种配置数据传输资源的系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination