WO2017045565A1

WO2017045565A1 - 一种作业的操作重试方法和装置

Info

Publication number: WO2017045565A1
Application number: PCT/CN2016/098508
Authority: WO
Inventors: 李强
Original assignee: 阿里巴巴集团控股有限公司
Priority date: 2015-09-18
Filing date: 2016-09-09
Publication date: 2017-03-23
Also published as: CN106547635A; EP3352078A4; EP3352078A1; US20180203767A1; US10866862B2; CN106547635B; JP2018529164A; JP6818014B2; EP3352078B1

Abstract

一种作业的操作重试方法和装置，所述方法包括：检测作业中的操作是否失败（101）；若是，则统计所述作业的进度（102）；根据所述作业的进度计算重试时间（103）；等待重试时间后，重新执行所述操作（104）。该方法使得在作业的操作失败时，根据作业的进度自适应计算重试时间，尤其是对于长作业，大大增加了重试时间的长度，实现动态进行作业的重试，能应付更长时间的服务中断情况，避免了作业失败时、重新执行作业带来的设备资源浪费，在保证作业的成功率的同时，大大降低了重试成本。

Description

一种作业的操作重试方法和装置

本申请要求2015年09月18日递交的申请号为201510601116.5、发明名称为“一种作业的操作重试方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机处理的技术领域，特别是涉及一种作业的操作重试方法和一种作业的操作重试装置。

背景技术

在计算机系统中，作业在运行中会和其他系统(服务)进行交互，在其他系统(服务)出现短时间不可服务(服务中断)时，作业将运行失败。

在大数据的场景下，现在的产品在运行出错时，一般对作业进行重试，即等待其他系统(服务)恢复，来使作业继续运行，尽量保证作业的成功率。

否则，如果重试全部失败，整个作业将失败。

例如，其他系统(服务)不可服务的时间最长到了10分钟，则要求重试的时间间隔总体要大于10分钟，才能保证作业在出现这种短时间不可服务时能继续运行。

如果重试都调整为10分钟，无疑增大了重试成本，表现在2方面：

1、短作业；例如，预计的运行时间只有30分钟的作业，因重试带来的实际的运行时间将可能长于正常运行的时间；

2、管理员需要手动停止作业时，特别是因为外部系统(服务)不可用时，需要人工进行运维停止作业，并进行一些调整和部署，如果刚好碰到作业重试，则需要等作业重试完10分钟，该作业才能完全停止。

因此，现在一般选择重试的时间不会选择最大的重试时间，而是选择平均值或者满足一定百分比的时间。

例如，若外部系统(服务)的不可用时间均为1分钟，最大不可用时间为10分钟时，一般选择重试为2分钟，确保大部分情况都能重试成功。

但是，这种解决方案对于长作业，可能导致重试成本增加。

例如，对于一个运行10个小时的作业，如果10个小时的作业运行到了80％，即已经运行了8个小时的时候，出现了一次10分钟的服务中断，超过了最大的重试时间，导致该作业失败，重新执行该作业意味着在先8个小时的运行都浪费了，代价是巨大的。

发明内容

鉴于上述问题，提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种作业的操作重试方法和相应的一种作业的操作重试装置。

为了解决上述问题，本申请实施例公开了一种作业的操作重试方法，包括：

检测作业中的操作是否失败；若是，则统计所述作业的进度；

根据所述作业的进度计算重试时间；

等待重试时间后，重新执行所述操作。

可选的，所述作业为数据同步作业，所述检测作业中的操作是否失败的步骤包括：

当从源设备读取数据失败或超时，判定所述数据同步作业中的操作失败；

和/或，

当与数据同步服务交互失败或超时，判定所述数据同步作业中的操作失败；

和/或，

当将数据写入目的设备失败或超时，判定所述数据同步作业中的操作失败。

可选的，所述根据所述作业的进度计算重试时间的步骤包括：

按照所述作业的进度配置增量因子；

依据预设的间隔时间计算重试时间基数；

根据所述增量因子与所述重试时间基数计算重试时间。

可选的，所述依据预设的间隔时间计算重试时间基数的步骤包括：

获取当前的重试次数；

计算预设的间隔时间与当前的重试次数的乘积，作为时间基数；

或者，

将当前的重试次数作为指数，对预设的间隔时间进行增加，作为时间基数。

可选的，在所述统计所述作业的进度的步骤之前，所述方法还包括：

判断是否需要重新执行所述操作；

若是，则执行所述统计所述作业的进度的步骤；

若否，则退出重新执行所述操作。

可选的，所述判断是否需要重新执行所述操作的步骤包括：

判断是否符合次数条件和/或状态条件；

若是，则判定不需要重新执行所述操作；

若否，则判定需要重新执行所述操作；

其中，所述次数条件为当前的重试次数超过预设的重试次数阈值；

所述状态条件为作业停止。

为了解决上述问题，本申请实施例还公开了一种作业的操作重试装置，包括：

作业检测模块，用于检测作业中的操作是否失败；若是，则调用进度统计模块；

进度统计模块，用于统计所述作业的进度；

重试时间计算模块，用于根据所述作业的进度计算重试时间；

作业重试模块，用于等待重试时间后，重新执行所述操作。

可选的，所述作业检测模块包括：

第一判定子模块，用于在从源设备读取数据失败或超时，判定所述数据同步作业中的操作失败；

和/或，

第二判定子模块，用于在与数据同步服务交互失败或超时，判定所述数据同步作业中的操作失败；

和/或，

第三判定子模块，用于在将数据写入目的设备失败或超时，判定所述数据同步作业中的操作失败。

可选的，所述重试时间计算模块包括：

增量因子计算子模块，用于按照所述作业的进度配置增量因子；

重试时间基数计算子模块，用于依据预设的间隔时间计算重试时间基数；

增量调整子模块，用于根据所述增量因子与所述重试时间基数计算重试时间。

可选的，所述重试时间基数计算子模块包括：

重试次数获取单元，用于获取当前的重试次数；

固定计算单元，用于计算预设的间隔时间与当前的重试次数的乘积，作为时间基数；

或者，

指数计算单元，用于将当前的重试次数作为指数，对预设的间隔时间进行增加，作为时间基数。

可选的，所述作业的操作重试装置还包括：

重试判定模块，用于判断是否需要重新执行所述操作；若是，则调用进度统计模块，若否，则调用重试退出模块；

重试退出模块，用于退出重新执行所述操作。

可选的，所述重试判定模块包括：

条件判断子模块，用于判断是否符合次数条件和/或状态条件；若是，则调用第四判定子模块，若否，则调用第五判定子模块；

第四判定子模块，用于判定不需要重新执行所述操作；

第五判定子模块，用于判定需要重新执行所述操作；

所述状态条件为作业停止。

本申请实施例包括以下优点：

本申请实施例在作业的操作失败时，根据作业的进度自适应计算重试时间，尤其是对于长作业，大大增加了重试时间的长度，实现动态进行作业的重试，能应付更长时间的服务中断情况，避免了作业失败时、重新执行作业带来的设备资源浪费，在保证作业的成功率的同时，大大降低了重试成本。

本申请实施例的重试策略中增加作业的状态检测，当作业被停止时，将终止重试，实现重试的快速结束和退出，进一步减少了设备资源的浪费，减少了重试成本。

附图说明

图1是本申请的一种作业的操作重试方法实施例1的步骤流程图；

图2是本申请实施例的一种离线同步工具的架构图；

图3是本申请的一种作业的操作重试方法实施例2的步骤流程图；

图4是本申请的一种作业的操作重试装置实施例1的结构框图；

图5是本申请的一种作业的操作重试装置实施例2的结构框图。

具体实施方式

为使本申请的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本申请作进一步详细的说明。

参照图1，示出了本申请的一种作业的操作重试方法实施例1的步骤流程图，具体可以包括如下步骤：

步骤101，检测作业中的操作是否失败；若是，则执行步骤102；

在某些操作系统中，作业(job)是计算机操作者(或是一个叫做作业调度器的程序)交给操作系统的执行单位。

例如，作业可以是一个应用程序的运行，如一个每周都执行的职工工资册的程序。

作业通常是以批的模式运行的。

操作者或作业调度器交给操作系统一批要执行的作业(职工工资册、花销分析、雇员文件升级等等)，这些作业将在操作系统没有执行具有时间敏感性的交互式操作时被执行。

在本申请实施例中，以数据同步作业为作业的其中一个示例，数据同步作业可以通过同步工具执行。

如图2所示，同步工具是一个通用的多种数据库之间进行同步的工具。

同步工具包括具有datax Service(数据同步服务)的一系列的worker(工作设备)。

其中，datax Service接受作业的命令(如启动作业、停止作业等)，选择一台worker执行该作业，并向datax Service回报状态。

在同步时，工作设备从源设备读取数据，将数据写入目的设备。

源设备和目的设备是任意的关系数据库(如MySQL、PostgreSQL、HBase)或者是非关系数据库。

例如，工作设备可以从MySQL读取数据，写入HBase。

作业在执行过程中，与源设备，目的设备，以及datax Service进行交互。

从源设备读取数据(操作)时，源设备提供的读数据的API(Application Programming Interface，应用程序编程接口)返回的结果通常有3种：成功，失败，超时。

当从源设备读取数据失败或超时，可以判定数据同步作业中的操作失败。

与datax Service的交互(操作)时，datax Service提供的交互的API返回的结果通常有3种：成功，失败，超时。

当与数据同步服务交互失败或超时，可以判定数据同步作业中的操作失败。

从将数据写入目的设备(操作)时，目的设备提供的写数据的API返回的结果通常有3种：成功，失败，超时。

当将数据写入目的设备失败或超时，可以判定数据同步作业中的操作失败。

对于失败和超时这2种情况，确认作业失败，可以进行重试。

当然，上述作业及其失败的判断方式只是作为示例，在实施本申请实施例时，可以根据实际情况设置其他作业及其失败的判断方式，本申请实施例对此不加以限制。另外，除了上述作业及其失败的判断方式外，本领域技术人员还可以根据实际需要采用其它作业及其失败的判断方式，本申请实施例对此也不加以限制。

步骤102，统计所述作业的进度；

在实际应用中，工作设备可以在执行作业的时候，统计作业的进度。

以分批统计为例，可以将一个完整的作业划分为很多分片，统计分片的完成度既可以统计作业的进度。

例如，一个完整的作业划分为10000个分片，则每完成100个分片，则作业的进度前进1％。

步骤103，根据所述作业的进度计算重试时间；

在本申请实施例中，作业的进度作为一个因子，按照该因子计算重试时间，重试时间与作业的进度成正比，使得可以应付更长时间的服务中断情况。

例如，进度为80％时的重试时间将明显大于进度为30％时的重试时间，使得作业有足够的时间等待服务恢复，避免重新执行作业造成浪费。

在本申请的一个实施例中，步骤103可以包括如下子步骤：

子步骤S11，按照所述作业的进度配置增量因子；

在实际应用中，增量因子主要由作业的运行状态决定，可以表征作业的进度对重试时间的影响。

一般而言，作业的进度与增量因子成正比，即作业的进度最大，增量因子越大，反之，作业的进度最小，增量因子越小。

例如，进度为15％的作业的增量因子为1.15，进度为80％的作业的增量因子为1.80。

子步骤S12，依据预设的间隔时间计算重试时间基数；

应用本申请实施例，可以预先设置重试策略，如按照固定时间或指数增长进行重试、间隔时间、允许的最大重试次数等。

若获取了当前的重试次数，则可以按照重试策略计算重试时间基数。

若重试策略为固定时间的重试策略，即每经过间隔时间进行重试，如指定3次重试、每次重试的时间间隔为30秒。

则可以计算预设的间隔时间与当前的重试次数的乘积，作为时间基数。

若重试策略为指数增长的重试策略，则可以将当前的重试次数作为指数，对预设的间隔时间进行增加，作为时间基数。

在一个示例中，时间基数＝间隔时间*2n-1，其中，n为当前的重试次数。

例如，指定4次重试，间隔时间为10s，即第一次重试的时间为10s，第二次重试的时间为10s*2，第三次重试的时间为10s*4，第四次重试的时间为10s*8。

子步骤S13，根据所述增量因子与所述重试时间基数计算重试时间。

通常，可以直接计算增量因子与重试时间基数的乘积，作为重试时间。

步骤104，等待重试时间后，重新执行所述操作。

在本申请实施例中，在等待重试时间后，可以重试作业。

以数据同步作业为作业的其中一个示例，在作业出现失败时，可以重新从源设备读取数据，或者，重新与datax Service的交互，或者，重新将数据写入目的设备等等。

例如，通过datax Service进行离线同步，在某电子商务平台一天的同步量大概在300T左右，每天同步的作业数在6万作业。

这些作业的完成时间大多不一致，有30分钟内完成的作业，有2小时内完成的作业，也有10小时完成的作业，甚至更长时间完成的作业。

对于完成时间较少(如30分钟)的作业，即短作业，如果出现偶然的错误比如断网或者服务重启等，重试结束都没有恢复的话，重新执行整个作业，代价一般是可以接受的。

但是，完成时间较长(如10小时)的作业，即长作业，如果在运行一半时间以上时重试都不能成功的话，重新执行整个作业，代价会比较大。

如果简单调整重试的重试次数，或者重试间隔，则导致所有的作业的重试代价一样。

例如，调整重试为10分钟，所有的短作业的重试时间甚至会长于实际的工作时间，这是不合理，也是代价很大的。

特别是在用户想停止作业，刚好碰到作业在重试时，将会面对不得不等待重试结束后，作业才能结束。

现在的重试策略只能单一缓解作业成功率低的问题，通过调整重试次数或者时间间隔，不管是应用固定时间的还是指数增长的重试策略，也无法解决重试成本的问题，会带来更多的额外重试成本。

参照图3，示出了本申请的一种作业的操作重试方法实施例2的步骤流程图，具体可以包括如下步骤：

步骤301，检测作业中的操作是否失败；若是，则执行步骤302；

步骤302，判断是否需要重新执行所述操作；若是，则执行步骤304；若否，则执行步骤303；

步骤303，退出重新执行所述操作；

应用本申请实施例，可以预先设置重试策略，在符合重试策略的情况下，对作业进行重试，否则，退出重试。

在本申请的一个实施例中，步骤302可以包括如下子步骤：

子步骤S21，判断是否符合次数条件和/或状态条件；若是，则执行子步骤S22，若否，则执行子步骤S23；

子步骤S22，判定不需要重新执行所述操作；

子步骤S23，判定需要重新执行所述操作；

其中，次数条件为当前的重试次数超过预设的重试次数阈值；

状态条件为作业停止。

在具体实现中，诸如按照固定时间或指数增长进行重试、允许的最大重试次数(即重试次数阈值)等重试策略均可以在作业配置时指定，即用户配置作业时，指定该作业如果遇到出错的时候，如何进行重试。

因此，作业下发到工作设备时，工作设备按照这个重试策略进行重试，每重试一次，则可以记录当前的重试次数，以便与允许的最大重试次数(即重试次数阈值)进行比较，当超过允许的最大重试次数(即重试次数阈值)时，停止重试，否则，继续重试。

由于作业是在工作机器上执行，因此工作设备在执行作业时，可以获知作业的执行状态，如正常执行、停止执行、执行的时间，执行的进度等等。

如果用户想手动停止作业，尤其是在外部系统(服务)不可用时，需要人工进行运维停止作业，并进行一些调整和部署等情况，工作设备接收到作业停止指令后，应该尽快停止作业。

如果作业刚好在重试中，传统的重试策略需要整个重试全部结束才能停止成功。

例如，某个用户配置作业重试10次，然后用户发现某个地方配置错误，需要停止作业，但作业刚好进入了重试，则用户需要等待10次重试全部结束，作业才能正确停止。

步骤304，统计所述作业的进度；

步骤305，根据所述作业的进度计算重试时间；

步骤306，等待重试时间后，重新执行所述操作。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请实施例并不受所描述的动作顺序的限制，因为依据本申请实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本申请实施例所必须的。

参照图4，示出了本申请的一种作业的操作重试装置实施例1的结构框图，具体可以包括如下模块：

作业检测模块401，用于检测作业中的操作是否失败；若是，则调用进度统计模块402；

进度统计模块402，用于统计所述作业的进度；

重试时间计算模块403，用于根据所述作业的进度计算重试时间；

作业重试模块404，用于等待重试时间后，重新执行所述操作。

在本申请的一个实施例中，所述作业检测模块401可以包括如下子模块：

和/或，

在本申请的一个实施例中，所述重试时间计算模块403可以包括如下子模块：

在本申请的一个实施例中，所述重试时间基数计算子模块可以包括如下单元：

重试次数获取单元，用于获取当前的重试次数；

或者，

参照图5，示出了本申请的一种作业的操作重试装置实施例2的结构框图，具体可以包括如下模块：

作业检测模块501，用于检测作业中的操作是否失败；若是，则调用重试判定模块502；

重试判定模块502，用于判断是否需要重新执行所述操作；若是，则调用进度统计模块504，若否，则调用重试退出模块503；

重试退出模块503，用于退出重新执行所述操作；

进度统计模块504，用于统计所述作业的进度；

重试时间计算模块505，用于根据所述作业的进度计算重试时间；

作业重试模块506，用于等待重试时间后，重新执行所述操作。

在本申请的一个实施例中，所述重试判定模块502可以包括如下子模块：

第四判定子模块，用于判定不需要重新执行所述操作；

第五判定子模块，用于判定需要重新执行所述操作；

所述状态条件为作业停止。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本申请实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

在一个典型的配置中，所述计算机设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非持续性的电脑可读媒体(transitory media)，如调制的数据信号和载波。

本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本申请所提供的一种作业的操作重试方法和一种作业的操作重试装置，进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

一种作业的操作重试方法，其特征在于，包括：

检测作业中的操作是否失败；若是，则统计所述作业的进度；

根据所述作业的进度计算重试时间；

等待重试时间后，重新执行所述操作。
根据权利要求1所述的方法，其特征在于，所述作业为数据同步作业，所述检测作业中的操作是否失败的步骤包括：

当从源设备读取数据失败或超时，判定所述数据同步作业中的操作失败；

和/或，

当与数据同步服务交互失败或超时，判定所述数据同步作业中的操作失败；

和/或，

当将数据写入目的设备失败或超时，判定所述数据同步作业中的操作失败。
根据权利要求1所述的方法，其特征在于，所述根据所述作业的进度计算重试时间的步骤包括：

按照所述作业的进度配置增量因子；

依据预设的间隔时间计算重试时间基数；

根据所述增量因子与所述重试时间基数计算重试时间。
根据权利要求3所述的方法，其特征在于，所述依据预设的间隔时间计算重试时间基数的步骤包括：

获取当前的重试次数；

计算预设的间隔时间与当前的重试次数的乘积，作为时间基数；

或者，

将当前的重试次数作为指数，对预设的间隔时间进行增加，作为时间基数。
根据权利要求1至4中任一项所述的方法，其特征在于，在所述统计所述作业的进度的步骤之前，所述方法还包括：

判断是否需要重新执行所述操作；

若是，则执行所述统计所述作业的进度的步骤；

若否，则退出重新执行所述操作。
根据权利要求5所述的方法，其特征在于，所述判断是否需要重新执行所述操作的步骤包括：

判断是否符合次数条件和/或状态条件；

若是，则判定不需要重新执行所述操作；

若否，则判定需要重新执行所述操作；

其中，所述次数条件为当前的重试次数超过预设的重试次数阈值；

所述状态条件为作业停止。
一种作业的操作重试装置，其特征在于，包括：

作业检测模块，用于检测作业中的操作是否失败；若是，则调用进度统计模块；

进度统计模块，用于统计所述作业的进度；

重试时间计算模块，用于根据所述作业的进度计算重试时间；

作业重试模块，用于等待重试时间后，重新执行所述操作。
根据权利要求7所述的装置，其特征在于，所述作业检测模块包括：

第一判定子模块，用于在从源设备读取数据失败或超时，判定所述数据同步作业中的操作失败；

和/或，

第二判定子模块，用于在与数据同步服务交互失败或超时，判定所述数据同步作业中的操作失败；

和/或，

第三判定子模块，用于在将数据写入目的设备失败或超时，判定所述数据同步作业中的操作失败。
根据权利要求7所述的装置，其特征在于，所述重试时间计算模块包括：

增量因子计算子模块，用于按照所述作业的进度配置增量因子；

重试时间基数计算子模块，用于依据预设的间隔时间计算重试时间基数；

增量调整子模块，用于根据所述增量因子与所述重试时间基数计算重试时间。
根据权利要求9所述的装置，其特征在于，所述重试时间基数计算子模块包括：

重试次数获取单元，用于获取当前的重试次数；

固定计算单元，用于计算预设的间隔时间与当前的重试次数的乘积，作为时间基数；

或者，

指数计算单元，用于将当前的重试次数作为指数，对预设的间隔时间进行增加，作为时间基数。
根据权利要求7至10中任一项所述的装置，其特征在于，还包括：

重试判定模块，用于判断是否需要重新执行所述操作；若是，则调用进度统计模块，若否，则调用重试退出模块；

重试退出模块，用于退出重新执行所述操作。
根据权利要求11所述的装置，其特征在于，所述重试判定模块包括：

条件判断子模块，用于判断是否符合次数条件和/或状态条件；若是，则调用第四判定子模块，若否，则调用第五判定子模块；

第四判定子模块，用于判定不需要重新执行所述操作；

第五判定子模块，用于判定需要重新执行所述操作；

其中，所述次数条件为当前的重试次数超过预设的重试次数阈值；

所述状态条件为作业停止。