CN113778570A - 一种基于AOP+ThreadLocal技术的分布式系统断点重试方法 - Google Patents

一种基于AOP+ThreadLocal技术的分布式系统断点重试方法 Download PDF

Info

Publication number
CN113778570A
CN113778570A CN202111062742.3A CN202111062742A CN113778570A CN 113778570 A CN113778570 A CN 113778570A CN 202111062742 A CN202111062742 A CN 202111062742A CN 113778570 A CN113778570 A CN 113778570A
Authority
CN
China
Prior art keywords
retry
breakpoint
threadlocal
processing
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111062742.3A
Other languages
English (en)
Other versions
CN113778570B (zh
Inventor
徐海洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan XW Bank Co Ltd
Original Assignee
Sichuan XW Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan XW Bank Co Ltd filed Critical Sichuan XW Bank Co Ltd
Priority to CN202111062742.3A priority Critical patent/CN113778570B/zh
Publication of CN113778570A publication Critical patent/CN113778570A/zh
Application granted granted Critical
Publication of CN113778570B publication Critical patent/CN113778570B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/448Execution paradigms, e.g. implementations of programming paradigms
    • G06F9/4488Object-oriented
    • G06F9/449Object-oriented method invocation or resolution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/547Remote procedure calls [RPC]; Web services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Retry When Errors Occur (AREA)

Abstract

本发明公开了一种基于AOP+ThreadLocal技术的分布式系统断点重试方法,属于软件信息技术领域,本发明的技术方案包括:步骤1:通过AOP切面表达式指定需要支持断点重试的方法并定义所有方法的OperationType;步骤2:在需要支持断点重试的业务流程中开启断点重试;步骤3:在发生异常后,持久化已经执行成功的方法返回值;步骤4:清空ThreadLocal变量,防止内存溢出,其目的在于,克服现有技术手工处理人力浪费、耗时长、容易出错的缺陷,实现了断点重试、多次断点重试的效果,同时降低发生异常数据的风险概率。

Description

一种基于AOP+ThreadLocal技术的分布式系统断点重试方法
技术领域
本发明属于软件信息技术领域,具体涉及一种基于AOP+ThreadLocal技术的分布式系统断点重试方法。
背景技术
在业务系统中,因为网络或者异常数据等一些原因,程序会发生异常,在失败后如何保持交易的原子性和一致性是需要着重考虑的一个问题。
在单体架构中,因为只有涉及到一个应用,解决以上原子性和一致性问题,只需要开启声明式事务管理就可以了。在分布式架构中实现原子性和一致性首先想到的是通过分布式事务来实现,分布式事务方案包括:XA、TCC、本地消息表、可靠消息最终一致性等。我们较为熟悉的开源分布式事务框架:Seata,其包含AT模式、TCC模式、sage模式、XA模式。还有蚂蚁金服黑科技:DTX,其包含TCC模式、FMT托管模式、XA模式。
以上方案可以解决分布式一致性问题,但是或多或少需要引入其他中间件,或者部署额外的服务,或者部署一个分布式事务协调中心来实现。但是对于中小型公司而言引入中间件需要专项团队来维护其稳定性,部署额外的服务也需要人力去维护。
所以对于大部分的分布式接口调用,如果使用分布式事务很繁琐,直接就是监控、记录日志、事后快速的定位排查问题、通过重试来保证业务最终执行成功。
在发生异常时,一般主要涉及三种业务场景,1)在业务流程入口处直接中断了;2)在业务流程执行中途中断,但是此时只执行了一些查询操作没有任何修改操作;3)在业务流程执行到中途中断,但此时已经执行了大量的增删改操作。对于前两种业务场景,因为没有涉及到更新操作,那么直接发起重试无需人为过多干预,但是对于第三种业务场景下,同样也是最常见的情况,其通常采用手工处理的方式,需要手工处理大量的数据来回滚已经成功的操作,或者修复未完成的操作,然后才能发起手工重试,存在耗费大量的人力的问题,其次手工干预也带来了一定的异常数据风险。
发明内容
为了解决上述现有技术存在的缺陷,本发明的目的在于提供一种基于AOP+ThreadLocal 技术的分布式系统断点重试方法,其目的在于,克服现有技术手工处理人力浪费、耗时长、容易出错的缺陷,实现了断点重试、多次断点重试的效果,同时降低发生异常数据的风险概率。
本发明采用的技术方案如下:
一种基于AOP+ThreadLocal技术的分布式系统断点重试方法,包括如下步骤:
步骤1:通过AOP切面表达式指定需要支持断点重试的方法并定义所有方法的OperationType;
步骤2:在需要支持断点重试的业务流程中开启断点重试;
步骤3:在发生异常后,持久化已经执行成功的方法返回值;
步骤4:清空ThreadLocal变量,防止内存溢出。
其中,所述步骤1具体包括:
步骤1.1:借助AspectJ插件,通过其中的@PointCut注解来指定切面;
步骤1.2:通过execution、@annotation函数名称进行匹配,或是通过args、@args方法参数进行匹配,或是通过within、target类名来进行匹配;
步骤1.3:指定之后,AOP通过动态代理技术,对于所指定的方法进行环切,在方法执行前做重试的判断,或是在方法执行之后获取执行结果,并获取返回值;
在上述步骤中,在已经指定的方法中,如果想要支持忽略查询方法断点重试,需要在方法中加入此方法的操作类型注解@OperationType,反之则默认为更新交易。
在上述步骤中,如果为查询操作则指定@OperationType(value=“query”),如果为更新操作则指定@OperationType(value=“update”)。
在上述步骤中,在项目中假如我们想对于所有的remote包下面的所有方法支持断点重试,那么我们可以这么定义:execution(*com.company.remote.*.*(..))。..))。
所述步骤2具体包括:
步骤2.1:对于业务流程F开启断点重试,只需要调用supportRetry()方法,其中如果重试标识为false,则是正常交易流程,进行正常逻辑处理;如果重试标识为true,则是重试交易流程,进行重试逻辑处理。
在上述步骤中,所述步骤2.1中为正常交易交易,处理流程具体为:
(1)程序将以上几个参数放入ThreadLocal变量inputThreadLocal;
(2)在业务流程执行过程中,假设执行到方法m1,那么首先判断程序通过inputThreadLocal是否为空,如果为空,说明开启了断点重试,如果不为空则说明没有开启断点重试,如果开启了断点重试,那么从inputThreadLocal中获取当前线程的入参信息,判断重试处理标识;
(3)判断重试处理标识是为false,则首先通过代理类执行实际方法,获取返回结果和返回值信息,判断结果为成功,则继续判断是否为查询交易,如果是忽略查询方法==true&& @OperationType(value=“query”),则不保存方法结果信息,否则将结果放入ThreadLocal 变量outputThreadLocal,并返回;判断结果为失败,则直接返回不做任何处理。
在上述步骤中,所述步骤2.1中为重试交易流程,处理流程具体为:
(1)首先通过交易唯一流水号查询出上次执行的结果信息并放入ThreadLocal变量 outputThreadLocal中,然后将入参放入ThreadLocal变量inputThreadLocal中;
(2)在业务流程执行过程中,假如说执行到方法m2,那么首先判断程序通过inputThreadLocal是否为空,如果为空,说明开启了断点重试,如果不为空则说明没有开启断点重试,如果开启了断点重试,那么从inputThreadLocal中获取当前线程的入参信息,判断重试处理标识。
(3)判断重试处理标识是为true,则首先从outputThreadLocal中上次方法的执行记录,然后通过方法全限定名称和当前调用次数匹配到对应的上次执行记录,如果查询为空,则说明此方法还没有执行或者执行失败,通过代理直接调用方法执行,如果查询存在记录,则取出上次结果信息并反序列化为方法返回,返回调用方。
在上述步骤中,所述步骤2.1中假如在同一个流程中对于同一方法调用了两次,程序引入了第三个ThreadLocal变量callCountThreadLocal,此变量起到了计数器的作用,用于保存此线程每一个方法的执行次数,当第一次调用时,方法m1的调用次数为1,当第二次调用时,方法m1调用次数为2,依次类推。最后将本次执行方法对应次数与方法的返回一同保存起来。
所述步骤3包括以下步骤:
步骤3.1:当流程发生异常后,通过try..catch捕获异常;
步骤3.2:在catch块中调用persistRetryDtos()方法;
步骤3.3:方法首先检索ThreadLocal变量outputThreadLocal中是否存在待保存执行成功的方法返回信息,如果不存在,则不做任何处理;
步骤3.4:如果存在待保存信息,调用持久化方法,将实体信息集合保存到本地数据库。
所述步骤4包括以下步骤:
步骤4.1:在方法执行完毕,返回之前,通过try..finally中的finally处理块中清除缓存;
步骤4.2:在finally块中调用clear()方法;
步骤4.2:方法获取inputThreadLocal、outputThreadLocal、callCountThreadLocal三个线程变量,并调用它们的remove方法做清空,防止程序执行完毕线程变量没有释放,导致内存溢出。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1.程序断点重试。通过基于ThreadLocal+AOP的技术手段,起到了异常后业务流程快速恢复的作用,解决了现有技术中手工处理人力浪费、耗时长、容易出错的缺陷,实现了断点重试、多次断点重试的效果。
2.支持MQ、Dubbo、Sofa等多种调用方式的断点重试。通过统一对于MQ、Dubbo、Sofa公共入口做了切面处理技术手段,起到了灵活配置的作用,解决了断点重试不够灵活、支持场景较少的缺陷,实现了支持多种调用方式重试的效果。
3.支持同一方法多次调用的断点重试。通过巧妙的利用线程变量callCountThreadLocal 来记录每个方法调用次数的技术手段,起到了被调用方法计数的作用,解决了同一方法多次调用无法区别的问题,实现了重试处理时遇到对于同一方法已经执行成功的调用选择跳过,对于没有执行成功的调用继续调用的效果。
4.当考虑流程查询方法无影响时,支持忽略保存查询方法。通过定义@OperationType注解的方式,起到了定义该方法是“查询”或者“更新”的作用,解决了查询方法可以忽略仍然保存带来的效率效率和存储资源浪费问题,实现了查询方法灵活决定是否保存的效果。
5.多种存储方式的支持。通过默认实现的三种存储方式,并开放给使用者自定义存储方式实现的手段,起到了开发者可以灵活选择存储方式的作用,解决了没有Mysql数据库依然支持断点重试的问题,实现了支持Mysql、Redis、Zookeeper多种存储方式灵活选择的效果。
6.在手工处理方案中,需要开发人员非常熟悉业务处理逻辑,在业务失败后根据代码处理逻辑将已经执行成功的交易回退掉。本发明中只需要开发逻辑中加入一定二开三清除几个步骤,开发人员无需了解业务逻辑,只要简单确认后点击程序重试即可。
7.在手工处理方案中,收到预警后需要耗费大量的人力来处理异常数据。本发明中,只需一个人通过页面单笔和批量重试,可以快速处理失败的交易。
8.在手工处理过程中非常容易出错,假如手工恢复一个账务发生异常的交易,但是由于手误或者疏忽大意,把数据恢复错误了,那么可能会影响到后续的账务操作,还可能会导致更复杂的账务问题。在本发明的技术方案中,由于无需手工干预程序业务处理结果数据,故不会存在手工处理带来的数据错误风险。
附图说明
本发明将通过例子并参照附图的方式说明,其中:
图1是本发明中断点重试整体处理流程图;
图2是本发明实施例中正常流程下业务处理逻辑图;
图3是本发明实施例中重试流程下业务处理逻辑图;
名词解释
ThreadLocal:是线程本地存储,在每个线程中都创建了一个ThreadLocalMap对象,每个线程可以访问自己内部ThreadLocalMap对象内的value,步骤中inputThreadLocal、 outputThreadLocal、callCountThreadLocal三个变量是ThreadLocal类型的变量,用来保存线程变量信息;
@OperationType:自定义注解,用来标注此方法是查询方法,还是更新方法,为断点重试功能提供方法的操作功能。里面主要分为“查询操作”和“更新操作”;
MQ:消息队列,此处使用了MQ接收并开始处理整个业务流程,也可以是其他异步的处理流程;
AOP Aspect:切面,底层通过AOP实现,可以通过引入AspectJ插件来定义;
ThreadLocal:线程变量,可以用来定义线程变量,不同线程互不影响,详细步骤中inputThreadLocal、outputThreadLocal、callCountThreadLocal三个变量是ThreadLocal类型的变量;
DB:存储介质,可以是Mysql数据库、Oracle数据库、也可以非关系型数据库Redis、也可以是Zookeeper;
GTW:网关微服务;
LOAN:借据微服务;
ACCT:账务微服务;
FEE:费用微服务;
BATCH:批量微服务;
PORTAL:门户微服务;
Method1/Method2/Method3/Method4:代表四个不同的方法,也可以认为是4个不同的业务处理逻辑,他们处于同一处理流程中,而且有先后调用顺序: Method1->Method2->Method3->Method4;
持久化:就是将每个方法的结果数据保存起来,在断点重试的时候做判断跳过使用。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请实施例的描述中,需要说明的是,术语“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
下面结合图1~图3对本发明作详细说明。
一种基于AOP+ThreadLocal技术的分布式系统断点重试方法,包括如下步骤:
步骤1:通过AOP切面表达式指定需要支持断点重试的方法并定义所有方法的OperationType;
其中,所述步骤1具体包括:
步骤1.1:借助AspectJ插件,通过其中的@PointCut注解来指定切面;
步骤1.2:通过execution、@annotation函数名称进行匹配,或是通过args、@args方法参数进行匹配,或是通过within、target类名来进行匹配;
步骤1.3:指定之后,AOP通过动态代理技术,对于所指定的方法进行环切,在方法执行前做重试的判断,或是在方法执行之后获取执行结果,并获取返回值;
在上述步骤中,在已经指定的方法中,如果想要支持忽略查询方法断点重试,需要在方法中加入此方法的操作类型注解@OperationType,反之则默认为更新交易。
在上述步骤中,如果为查询操作则指定@OperationType(value=“query”),如果为更新操作则指定@OperationType(value=“update”)。
在上述步骤中,在项目中假如我们想对于所有的remote包下面的所有方法支持断点重试,那么我们可以这么定义:execution(*com.company.remote.*.*(..))。..))。
步骤2:在需要支持断点重试的业务流程中开启断点重试;
所述步骤2具体包括:
步骤2.1:对于业务流程F开启断点重试,只需要调用supportRetry()方法,其中如果重试标识为false,则是正常交易流程,进行正常逻辑处理;如果重试标识为true,则是重试交易流程,进行重试逻辑处理;如果重试标识为****,则是同一方法多次调用的处理流程,进行同一方法多次调用的处理流程逻辑处理。其中,方法入参需要指定重试标识、交易唯一流水号、业务类型、是否忽略查询方法几个参数。
上述步骤步骤2.1中,如果为正常交易交易,其处理流程具体为:
(1)程序将以上几个参数放入ThreadLocal变量inputThreadLocal;
(2)在业务流程执行过程中,假设执行到方法m1,那么首先判断程序通过inputThreadLocal是否为空,如果为空,说明开启了断点重试,如果不为空则说明没有开启断点重试,如果开启了断点重试,那么从inputThreadLocal中获取当前线程的入参信息,判断重试处理标识;
(3)判断重试处理标识是为false,则首先通过代理类执行实际方法,获取返回结果和返回值信息,判断结果为成功,则继续判断是否为查询交易,如果是忽略查询方法==true&& @OperationType(value=“query”),则不保存方法结果信息,否则将结果放入ThreadLocal变量outputThreadLocal,并返回;判断结果为失败,则直接返回不做任何处理。
附图2为本实施例中对上述情况的详细解释:
图2中介绍了正常处理流程在分布式系统中的交互流程,途中涉及到5个微服务,包括: GTW-网关微服务,LOAN-借据微服务,ACCT-账务微服务,FEE-费用微服务,BATCH-批量消息微服务,其中BATCH服务负责接收断点重试信息并持久化到数据库DB中;
从GTW服务中开启一个业务流程,然后调用supportRetry()方法“开启断点重试”,将本次交易的唯一标识放入inputThreadLocal中,然后调用本地方法“Method1”,此时执行成功,则将“Method1”返回值序列化为json串保存到outputThreadLocal;
然后调用LOAN服务远程方法“Method2”,此时也执行成功,则将“Method2”返回值序列化为json串保存到outputThreadLocal;
然后调用ACCT服务远程方法“Method3”,此时发生异常,获取ThreadLocal中的执行记录,并调用BATCH服务持久化断点重试信息;如果成功,则继续调用FEE服务“method4”;
最后清空ThreadLocal并结束处理流程。
在上述步骤中,所述步骤2.1中为重试交易流程,处理流程具体为:
(1)首先通过交易唯一流水号查询出上次执行的结果信息并放入ThreadLocal变量 outputThreadLocal中,然后将入参放入ThreadLocal变量inputThreadLocal中;
(2)在业务流程执行过程中,假如说执行到方法m2,那么首先判断程序通过inputThreadLocal是否为空,如果为空,说明开启了断点重试,如果不为空则说明没有开启断点重试,如果开启了断点重试,那么从inputThreadLocal中获取当前线程的入参信息,判断重试处理标识。
(3)判断重试处理标识是为true,则首先从outputThreadLocal中上次方法的执行记录,然后通过方法全限定名称和当前调用次数匹配到对应的上次执行记录,如果查询为空,则说明此方法还没有执行或者执行失败,通过代理直接调用方法执行,如果查询存在记录,则取出上次结果信息并反序列化为方法返回,返回调用方。
其中为重试流程时:MQ接收消息后,程序开启断点重试,首先程序会判断是否重试流程,如果是重试流程,首先通过txnSn从DB中获取上次的执行记录,并保存到THreadLocal中;程序首先执行method1,此时会进入切面逻辑,首先从ThreadLocal中获取此方法的执行记录,如果存在则直接跳过,如果不存在则执行方法的调用;后续调用后的处理逻辑同成功执行流程。
为了清楚的表达重试业务处理逻辑,附图3详细的表示了重试流程下,业务如何流转的。
图3中介绍了重试处理流程在分布式系统中的交互流程,途中涉及到6个微服务,包括: GTW-网关微服务,LOAN-借据微服务,ACCT-账务微服务,FEE-费用微服务,BATCH-批量消息微服务,PORTAL-内管微服务;其中BATCH服务负责接收断点重试信息并持久化到数据库DB 中,PORTAL服务实现通过前端页面发起重试处理;
从PORTAL服务开启重试流程,获取重试报文信息,并通过MQ异步通知GTW服务,其中在消息头Headers中放入重试标识,以标识该交易为重试交易;
GTW服务接收重试通知流水,通过Headers解析重试标识,如果重试标识为1,然后调用 supportRetry()方法“开启断点重试”并传入重试标识,将本次交易的唯一标识txnSn放入inputThreadLocal中;然后根据txnSn调用BATCH服务查询执行日志并将执行日志放入 outputThreadLocal;
然后调用本地方法“Method1”,调用前根据方法“Method1”的全限定名称匹配执行记录,此时存在,则反序列化执行记录方法返回信息,并返回给调用方;
然后调用LOAN服务远程方法“Method2”,调用前根据方法“Method2”的全限定名称匹配执行记录,此时存在,则反序列化执行记录方法返回信息,并返回给调用方;
然后调用ACCT服务远程方法“Method3”,调用前根据方法“Method2”的全限定名称匹配执行记录,此时不存在,则直接进行方法调用,并将返回信息保存到outputThreadLocal;
然后调用FEE服务远程方法“Method4”,调用前根据方法“Method4”的全限定名称匹配执行记录,此时不存在,则直接进行方法调用,此时发生异常,则重复图2中的异常后处理;
最后清空ThreadLocal并结束处理流程。
在上述步骤中,所述步骤2.1中假如在同一个流程中对于同一方法调用了两次,程序引入了第三个ThreadLocal变量callCountThreadLocal,此变量起到了计数器的作用,用于保存此线程每一个方法的执行次数,当第一次调用时,方法m1的调用次数为1,当第二次调用时,方法m1调用次数为2,依次类推。最后将本次执行方法对应次数与方法的返回一同保存起来。
步骤3:在发生异常后,持久化已经执行成功的方法返回值;
所述步骤3包括以下步骤:
步骤3.1:当流程发生异常后,通过try..catch捕获异常;
步骤3.2:在catch块中调用persistRetryDtos()方法;
步骤3.3:方法首先检索ThreadLocal变量outputThreadLocal中是否存在待保存执行成功的方法返回信息,如果不存在,则不做任何处理;
步骤3.4:如果存在待保存信息,调用持久化方法,将实体信息集合保存到本地数据库。
步骤4:清空ThreadLocal变量,防止内存溢出。
所述步骤4包括以下步骤:
步骤4.1:在方法执行完毕,返回之前,通过try..finally中的finally处理块中清除缓存;
步骤4.2:在finally块中调用clear()方法;
步骤4.2:方法获取inputThreadLocal、outputThreadLocal、callCountThreadLocal三个线程变量,并调用它们的remove方法做清空,防止程序执行完毕线程变量没有释放,导致内存溢出。
附图1是正常交易流程中断点重试的实现原理图,以下为该图的详细解释:
流程中通过接收请求开启处理流程,本图以“MQ”接收为例说明;接收到请求数据后开启通过调用supportRetry()方法“开启断点重试”;然后做“是否重试流程”的判断,如果非重试流程,则说明为正常流程,程序首先执行method1,此时会进入切面逻辑,切面中首先进行方法调用,在方法“method1/2/3/4”执行之前首先执行切面“AOP Aspect”逻辑,做“是否开启断点重试”判断,如果已经开启断点重试则进行后续逻辑处理,执行方法“method1/2/3/4”并获取方法返回信息,判断方法返回成功则保存到“ThreadLocal”中,如果方法执行返回失败则获取“ThreadLocal”中保存的所有方法返回信息,持久化到存储中,本图以“DB”为例说明;
如果是“重试流程”,则通过交易流水号txnSn从“DB”中获取上次的执行记录,将执行记录保存到ThreadLocal中,然后在切面逻辑“AOP Aspect”,判断为“重试流程”,则从“ThreadLocal”中根据方法全限定名称获取上次执行记录,如果获取成功则反序列化结果信息返回给调用方,如果获取失败则说明上次执行失败,本次继续执行此方法逻辑;
综上,最终实现了程序异常后,重新发起重试可以从断点处继续执行的目的。
以上所述实施例仅表达了本申请的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请技术方案构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。

Claims (10)

1.一种基于AOP+ThreadLocal技术的分布式系统断点重试方法,其特征在于,包括如下步骤:
步骤1:通过AOP切面表达式指定需要支持断点重试的方法并定义所有方法的OperationType;
步骤2:在需要支持断点重试的业务流程中开启断点重试;
步骤3:在发生异常后,持久化已经执行成功的方法返回值;
步骤4:清空ThreadLocal变量,防止内存溢出。
2.根据权利要求1所述的一种基于AOP+ThreadLocal技术的分布式系统断点重试方法,其特征在于,所述步骤1具体包括:
步骤1.1:借助AspectJ插件,通过其中的@PointCut注解来指定切面;
步骤1.2:通过execution、@annotation函数名称进行匹配,或是通过args、@args方法参数进行匹配,或是通过within、target类名来进行匹配;
步骤1.3:指定之后,AOP通过动态代理技术,对于所指定的方法进行环切,在方法执行前做重试的判断,或是在方法执行之后获取执行结果,并获取返回值。
3.根据权利要求2所述的一种基于AOP+ThreadLocal技术的分布式系统断点重试方法,其特征在于,在已经指定的方法中,如果想要支持忽略查询方法断点重试,需要在方法中加入此方法的操作类型注解@OperationType,反之则默认为更新交易。
4.根据权利要求3所述的一种基于AOP+ThreadLocal技术的分布式系统断点重试方法,其特征在于,如果为查询操作则指定@OperationType(value=“query”),如果为更新操作则指定@OperationType(value=“update”)。
5.根据权利要求1所述的一种基于AOP+ThreadLocal技术的分布式系统断点重试方法,其特征在于,所述步骤2具体包括:
步骤2.1:对于业务流程F开启断点重试,只需要调用supportRetry()方法,其中如果重试标识为false,则是正常交易流程,进行正常逻辑处理;如果重试标识为true,则是重试交易流程,进行重试逻辑处理。
6.根据权利要求5所述的一种基于AOP+ThreadLocal技术的分布式系统断点重试方法,其特征在于,所述步骤2.1中为正常交易交易,处理流程具体为:
(1)程序将以上几个参数放入ThreadLocal变量inputThreadLocal;
(2)在业务流程执行过程中,假设执行到方法m1,那么首先判断程序通过inputThreadLocal是否为空,如果为空,说明开启了断点重试,如果不为空则说明没有开启断点重试,如果开启了断点重试,那么从inputThreadLocal中获取当前线程的入参信息,判断重试处理标识;
(3)判断重试处理标识是为false,则首先通过代理类执行实际方法,获取返回结果和返回值信息,判断结果为成功,则继续判断是否为查询交易,如果是忽略查询方法==true&&@OperationType(value=“query”),则不保存方法结果信息,否则将结果放入ThreadLocal变量outputThreadLocal,并返回;判断结果为失败,则直接返回不做任何处理。
7.根据权利要求5所述的一种基于AOP+ThreadLocal技术的分布式系统断点重试方法,其特征在于,所述步骤2.1中为重试交易流程,处理流程具体为:
(1)首先通过交易唯一流水号查询出上次执行的结果信息并放入ThreadLocal变量outputThreadLocal中,然后将入参放入ThreadLocal变量inputThreadLocal中;
(2)在业务流程执行过程中,假如说执行到方法m2,那么首先判断程序通过inputThreadLocal是否为空,如果为空,说明开启了断点重试,如果不为空则说明没有开启断点重试,如果开启了断点重试,那么从inputThreadLocal中获取当前线程的入参信息,判断重试处理标识;
(3)判断重试处理标识是为true,则首先从outputThreadLocal中上次方法的执行记录,然后通过方法全限定名称和当前调用次数匹配到对应的上次执行记录,如果查询为空,则说明此方法还没有执行或者执行失败,通过代理直接调用方法执行,如果查询存在记录,则取出上次结果信息并反序列化为方法返回,返回调用方。
8.根据权利要求5所述的一种基于AOP+ThreadLocal技术的分布式系统断点重试方法,其特征在于,所述步骤2.1中假如在同一个流程中对于同一方法调用了两次,程序引入了第三个ThreadLocal变量callCountThreadLocal,此变量起到了计数器的作用,用于保存此线程每一个方法的执行次数,当第一次调用时,方法m1的调用次数为1,当第二次调用时,方法m1调用次数为2,依次类推。最后将本次执行方法对应次数与方法的返回一同保存起来。
9.根据权利要求1所述的一种基于AOP+ThreadLocal技术的分布式系统断点重试方法,其特征在于,步骤3包括以下步骤:
步骤3.1:当流程发生异常后,通过try..catch捕获异常;
步骤3.2:在catch块中调用persistRetryDtos()方法;
步骤3.3:方法首先检索ThreadLocal变量outputThreadLocal中是否存在待保存执行成功的方法返回信息,如果不存在,则不做任何处理;
步骤3.4:如果存在待保存信息,调用持久化方法,将实体信息集合保存到本地数据库。
10.根据权利要求1所述的一种基于AOP+ThreadLocal技术的分布式系统断点重试方法,其特征在于所述步骤4包括以下步骤:
步骤4.1:在方法执行完毕,返回之前,通过try..finally中的finally处理块中清除缓存;
步骤4.2:在finally块中调用clear()方法;
步骤4.2:方法获取inputThreadLocal、outputThreadLocal、callCountThreadLocal三个线程变量,并调用它们的remove方法做清空,防止程序执行完毕线程变量没有释放,导致内存溢出。
CN202111062742.3A 2021-09-10 2021-09-10 一种基于AOP+ThreadLocal技术的分布式系统断点重试方法 Active CN113778570B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111062742.3A CN113778570B (zh) 2021-09-10 2021-09-10 一种基于AOP+ThreadLocal技术的分布式系统断点重试方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111062742.3A CN113778570B (zh) 2021-09-10 2021-09-10 一种基于AOP+ThreadLocal技术的分布式系统断点重试方法

Publications (2)

Publication Number Publication Date
CN113778570A true CN113778570A (zh) 2021-12-10
CN113778570B CN113778570B (zh) 2023-06-06

Family

ID=78842532

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111062742.3A Active CN113778570B (zh) 2021-09-10 2021-09-10 一种基于AOP+ThreadLocal技术的分布式系统断点重试方法

Country Status (1)

Country Link
CN (1) CN113778570B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101640587A (zh) * 2008-08-01 2010-02-03 华为技术有限公司 数据同步方法及装置
CN102810057A (zh) * 2011-05-30 2012-12-05 中国银联股份有限公司 一种记录日志的方法
US8656367B1 (en) * 2011-07-11 2014-02-18 Wal-Mart Stores, Inc. Profiling stored procedures
CN105843741A (zh) * 2016-03-24 2016-08-10 腾讯科技(深圳)有限公司 应用程序的信息处理方法和装置
US10042695B1 (en) * 2015-09-28 2018-08-07 Amazon Technologies, Inc. Program exception recovery
CN111062684A (zh) * 2019-11-29 2020-04-24 普元信息技术股份有限公司 云流程平台下实现业务数据与流程数据一致性处理的系统及其方法
CN111580938A (zh) * 2020-03-27 2020-08-25 山东浪潮通软信息科技有限公司 一种工作单元的事务处理方法、装置、设备及介质
CN111737351A (zh) * 2020-06-22 2020-10-02 中国银行股份有限公司 分布式管理系统事务管理方法及装置
CN113157405A (zh) * 2020-01-22 2021-07-23 北京京东振世信息技术有限公司 业务流程断点重试的方法和装置
US11080086B1 (en) * 2019-03-12 2021-08-03 Pivotal Software, Inc. Reactive transaction management

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101640587A (zh) * 2008-08-01 2010-02-03 华为技术有限公司 数据同步方法及装置
CN102810057A (zh) * 2011-05-30 2012-12-05 中国银联股份有限公司 一种记录日志的方法
US8656367B1 (en) * 2011-07-11 2014-02-18 Wal-Mart Stores, Inc. Profiling stored procedures
US10042695B1 (en) * 2015-09-28 2018-08-07 Amazon Technologies, Inc. Program exception recovery
CN105843741A (zh) * 2016-03-24 2016-08-10 腾讯科技(深圳)有限公司 应用程序的信息处理方法和装置
US11080086B1 (en) * 2019-03-12 2021-08-03 Pivotal Software, Inc. Reactive transaction management
CN111062684A (zh) * 2019-11-29 2020-04-24 普元信息技术股份有限公司 云流程平台下实现业务数据与流程数据一致性处理的系统及其方法
CN113157405A (zh) * 2020-01-22 2021-07-23 北京京东振世信息技术有限公司 业务流程断点重试的方法和装置
CN111580938A (zh) * 2020-03-27 2020-08-25 山东浪潮通软信息科技有限公司 一种工作单元的事务处理方法、装置、设备及介质
CN111737351A (zh) * 2020-06-22 2020-10-02 中国银行股份有限公司 分布式管理系统事务管理方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
BLOGZHOUBO: "用AOP实现业务service的重新调用(三)", pages 1 - 5 *
ÉRIC TANTER等: "Execution levels for aspect-oriented programming: Design, semantics, implementations and applications", vol. 80, pages 311 - 342 *
懒惰的小蜗牛: "基于aop+注解方式实现异常重试机制", pages 1 - 9 *
谢锋: "基于TCC的分布式事务处理系统的设计与实现", no. 10, pages 138 - 80 *

Also Published As

Publication number Publication date
CN113778570B (zh) 2023-06-06

Similar Documents

Publication Publication Date Title
CN108076098B (zh) 一种业务处理方法及系统
US20020161840A1 (en) Adapter for interfacing with a workflow engine
US9442822B2 (en) Providing a visual representation of a sub-set of a visual program
US20060282400A1 (en) Apparatus, system, and method for encapsulating logical units of work using business objects
CN107241315B (zh) 银行网关接口的接入方法、装置及计算机可读存储介质
US11169896B2 (en) Information processing system
CN109308227B (zh) 故障检测控制方法及相关设备
CN110175165A (zh) 交易对账方法、装置、计算机设备及存储介质
CN110134385A (zh) 记录c语言函数调用链的方法及c语言通用日志框架
CN112631795A (zh) 业务申请信息自动同步方法、装置、设备及存储介质
CN110088744A (zh) 一种数据库维护方法及其系统
CN112559525B (zh) 数据检查系统、方法、装置和服务器
CN113961332A (zh) 一种工作流引擎实现的方法、装置、电子设备及存储介质
US6185702B1 (en) Method and system for process state management using checkpoints
WO2020253045A1 (zh) 配置化的数据转发异常补处理方法、装置及可读存储介质
CN115664939A (zh) 一种基于自动化技术的综合运维方法、装置和存储介质
CN111367934B (zh) 数据一致性的检验方法、装置、服务器和介质
CN113778570A (zh) 一种基于AOP+ThreadLocal技术的分布式系统断点重试方法
CN116136801B (zh) 云平台的数据处理方法、装置、电子设备及存储介质
CN115220992A (zh) 接口变更监控方法、装置、计算机设备和存储介质
CN110908820B (zh) 一种异步任务的执行方法、装置、设备及存储介质
JP2007141007A (ja) システム運用監視での障害時のサポートシステム化
CN114265769A (zh) 一种基于python脚本测试用例的测试系统及方法
CN116109112B (zh) 基于聚合接口的业务数据处理方法、装置、介质和设备
CN114356643B (zh) 一种遥感卫星处理系统中自动发现任务失败和恢复方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant