发明内容
本申请实施例所要解决的技术问题是提供一种对异常数据进行处理的方法,用以减少异常处理过程中的人工干预,减少因人工干预异步导致的业务影响范围,降低人力成本,提高异常处理效率。
相应的,本申请实施例还提供了一种对异常数据进行处理的装置以及一种监控系统,用以保证上述方法的实现及应用。
为了解决上述问题,本申请公开了一种对异常数据进行处理的方法,所述方法包括:
在监控系统向被监控系统发送业务对象数据的过程中,当所述监控系统监控到所述被监控系统出现数据异常时,暂停向所述被监控系统发送所述业务对象数据;
所述监控系统向所述被监控系统发送测试数据;
当所述监控系统接收到所述被监控系统返回的与所述测试数据对应的第一报文信息时,基于所述第一报文信息,判断所述数据异常是否消除;
监控系统在判定所述数据异常消除时,停止向所述被监控系统发送所述测试数据,以及,继续向所述被监控系统发送所述业务对象数据。
优选地,所述监控系统中设置有针对所述被监控系统的业务服务能力,所述方法还包括:
当所述监控系统监控到所述被监控系统出现数据异常时,关闭所述业务服务能力。
优选地,所述方法还包括:
所述监控系统在判定所述数据异常消除时,开启所述关闭的业务服务能力。
优选地,所述被监控系统包括用于接收所述业务对象数据和/或所述测试数据的主用通信渠道和/或备用通信渠道,针对所述主用通信渠道具有设定的第一级别的业务服务能力,针对所述备用通信渠道具有设定的第二级别的业务服务能力,所述第一级别的业务服务能力的级别高于所述第二级别的业务服务能力,
所述当所述监控系统监控到所述被监控系统出现数据异常时,关闭所述业务服务能力的步骤包括:
当所述监控系统监控到所述主用通信渠道出现数据异常时,关闭所述第一级别的业务服务能力,以及
开启所述第二级别的业务服务能力。
优选地,所述监控系统在判定所述数据异常消除时,开启所述关闭的业务服务能力的步骤包括:
所述监控系统在判定所述主用通信渠道的数据异常消除时,关闭所述第二级别的业务服务能力,以及
开启所述第一级别的业务服务能力。
优选地,所述第一报文信息包括第一成功响应指令,所述当所述监控系统接收到所述被监控系统返回的与所述测试数据对应的第一报文信息时,基于所述第一报文信息,判断所述数据异常是否消除的步骤包括:
当所述监控系统接收到所述被监控系统返回的与所述测试数据对应的第一报文信息时,从所述接收所述第一报文信息的时间开始的单位时间内,计算所述第一成功响应指令的数量;
若所述第一成功响应指令的数量大于第一预设阈值,则判定所述数据异常消除;
和/或,
从所述接收所述第一报文信息的时间开始的单位时间内,计算所述第一成功响应指令的数量以及发出的所述测试数据的数量的比值,得到第一成功率;
若所述第一成功率大于第二预设阈值,则判定所述数据异常消除。
优选地,所述当所述监控系统接收到所述被监控系统返回的与所述测试数据对应的第一报文信息时,基于所述第一报文信息,判断所述数据异常是否消除的步骤包括:
从所述监控系统接收到所述被监控系统返回的与所述测试数据对应的第一报文信息开始,记录下一次发送所述测试数据的第一时间戳;
记录接收到的,针对所述下一次发送的所述测试数据返回的所述第一报文信息的第二时间戳;
计算所述第一时间戳以及所述第二时间戳的时间差,作为第一响应时间;
从所述接收所述第一报文信息的时间开始的单位时间内,统计所述第一响应时间大于第三预设阈值的测试数据的数量;
若所述第一响应时间大于第三预设阈值的测试数据的数量小于或等于第四预设阈值,则判定所述数据异常消除。
优选地,所述监控系统采用如下方式对所述被监控系统进行数据异常监控:
所述监控系统向所述被监控系统发送业务对象数据;
所述监控系统接收所述被监控系统基于所述业务对象数据返回的第二报文信息;
所述监控系统基于所述第二报文信息,判断所述被监控系统是否出现数据异常。
优选地,所述第二报文信息包括第二成功响应指令,和/或,错误码,所述监控系统基于所述第二报文信息,判断所述被监控系统是否出现数据异常的步骤包括:
计算单位时间内接收的所述第二成功响应指令的数量;
若所述单位时间内接收的第二成功响应指令的数量小于第一预设阈值,则判定所述被监控系统出现数据异常;
和/或,
计算单位时间内接收的第二成功响应指令的数量以及发出的业务对象数据的数量的比值,得到第二成功率;
若第二成功率小于或等于第二预设阈值,则判定所述被监控系统出现数据异常;
和/或,
计算记录的发送所述业务对象数据的时间戳,以及,记录的接收到所述第二报文信息的时间戳的时间差,作为第二响应时间;
统计单位时间内所述第二响应时间差大于第三预设阈值的业务对象数据的数量;
若所述单位时间内所述第二响应时间差大于第三预设阈值的业务对象数据的数量大于第四预设阈值,则判定所述被监控系统出现数据异常;
和/或,
计算记录的发送所述业务对象数据的时间戳,以及,记录的接收到所述第二报文信息的时间戳的时间差,作为第二响应时间;依据所述第二响应时间计算单位时间内的平均处理时效,若所述平均处理时效大于第五预设阈值,则判定所述被监控系统出现数据异常;
和/或,
基于所述错误码,判定所述被监控系统出现数据异常。
优选地,所述监控系统为支付平台,所述被监控系统为银行系统,所述业务对象数据为交易数据,所述业务服务能力包括实时到账服务、两小时到账服务、当天到账服务、第二天到账服务、三天内到账服务的至少一种,所述第一级别的业务服务能力包括实时到账服务或者两小时到账服务,所述第二级别的业务服务能力为当天到账服务、第二天到账服务、三天内到账服务。
本申请还公开了一种对异常数据进行处理的装置,所述装置包括:
暂停模块,用于在监控系统向被监控系统发送业务对象数据的过程中,当所述监控系统监控到所述被监控系统出现数据异常时,暂停向所述被监控系统发送所述业务对象数据;
测试数据发送模块,用于向所述被监控系统发送测试数据;
判断模块,用于在所述监控系统接收到所述被监控系统返回的与所述测试数据对应的第一报文信息时,基于所述第一报文信息,判断所述数据异常是否消除;
重启模块,用于在判定所述数据异常消除时,停止向所述被监控系统发送所述测试数据,以及,继续向所述被监控系统发送所述业务对象数据。
优选地,所述监控系统中设置有针对所述被监控系统的业务服务能力,所述装置还包括:
服务关闭模块,用于在监控到所述被监控系统出现数据异常时,关闭所述业务服务能力。
优选地,所述装置还包括:
服务开启模块,用于在判定所述数据异常消除时,开启所述关闭的业务服务能力。
优选地,所述被监控系统包括用于接收所述业务对象数据和/或所述测试数据的主用通信渠道和/或备用通信渠道,针对所述主用通信渠道具有设定的第一级别的业务服务能力,针对所述备用通信渠道具有设定的第二级别的业务服务能力,所述第一级别的业务服务能力的级别高于所述第二级别的业务服务能力,
所述服务关闭模块包括:
第一关闭子模块,用于在监控到所述主用通信渠道出现数据异常时,关闭所述第一级别的业务服务能力,以及
第一开启子模块,用于开启所述第二级别的业务服务能力。
优选地,所述服务开启模块包括:
第二关闭子模块,用于在判定所述主用通信渠道数据的数据异常消除时,关闭所述第二级别的业务服务能力,以及
第二开启子模块,用于开启所述第一级别的业务服务能力。
优选地,所述第一报文信息包括第一成功响应指令,所述判断模块包括:
第一计算子模块,用于在接收到所述被监控系统返回的与所述测试数据对应的第一报文信息时,从所述接收所述第一报文信息的时间开始的单位时间内,计算所述第一成功响应指令的数量;
第一判定子模块,用于在所述第一成功响应指令的数量大于第一预设阈值时,判定所述数据异常消除;
和/或,
第二计算子模块,用于从所述接收所述第一报文信息的时间开始的单位时间内,计算所述第一成功响应指令的数量以及发出的所述测试数据的数量的比值,得到第一成功率;
第二判定子模块,用于在所述第一成功率大于第二预设阈值时,判定所述数据异常消除。
优选地,所述所述判断模块包括:
第一记录子模块,用于从所述监控系统接收到所述被监控系统返回的与所述测试数据对应的第一报文信息开始,记录下一次发送所述测试数据的第一时间戳;
第二记录子模块,用于记录接收到的,针对所述下一次发送的所述测试数据返回的所述第一报文信息的第二时间戳;
第三计算子模块,用于计算所述第一时间戳以及所述第二时间戳的时间差,作为第一响应时间;
第四计算子模块,用于从所述接收所述第一报文信息的时间开始的单位时间内,统计所述第一响应时间大于第三预设阈值的测试数据的数量;
第三判定子模块,用于在所述第一响应时间大于第三预设阈值的测试数据的数量小于或等于第四预设阈值时,判定所述数据异常消除。
优选地,所述监控系统采用如下方式对所述被监控系统进行数据异常监控:
所述监控系统向所述被监控系统发送业务对象数据;
所述监控系统接收所述被监控系统基于所述业务对象数据返回的第二报文信息;
所述监控系统基于所述第二报文信息,判断所述被监控系统是否出现数据异常。
优选地,所述第二报文信息包括第二成功响应指令,和/或,错误码,所述监控系统基于所述第二报文信息,判断所述被监控系统是否出现数据异常的方式包括:
计算单位时间内接收的所述第二成功响应指令的数量;
若所述单位时间内接收的第二成功响应指令的数量小于第一预设阈值,则判定所述被监控系统出现数据异常;
和/或,
计算单位时间内接收的第二成功响应指令的数量以及发出的业务对象数据的数量的比值,得到第二成功率;
若第二成功率小于或等于第二预设阈值,则判定所述被监控系统出现数据异常;
和/或,
计算记录的发送所述业务对象数据的时间戳,以及,记录的接收到所述第二报文信息的时间戳的时间差,作为第二响应时间;
统计单位时间内所述第二响应时间差大于第三预设阈值的业务对象数据的数量;
若所述单位时间内所述第二响应时间差大于第三预设阈值的业务对象数据的数量大于第四预设阈值,则判定所述被监控系统出现数据异常;
和/或,
计算记录的发送所述业务对象数据的时间戳,以及,记录的接收到所述第二报文信息的时间戳的时间差,作为第二响应时间;依据所述第二响应时间计算单位时间内的平均处理时效,若平均处理时效大于第五预设阈值,则判定所述被监控系统出现数据异常;
和/或,
基于所述错误码,判定所述被监控系统出现数据异常。
优选地,所述监控系统为支付平台,所述被监控系统为银行系统,所述业务对象数据为交易数据,所述业务服务能力包括实时到账服务、两小时到账服务、当天到账服务、第二天到账服务、三天内到账服务的至少一种,所述第一级别的业务服务能力包括实时到账服务或者两小时到账服务,所述第二级别的业务服务能力为当天到账服务、第二天到账服务、三天内到账服务。
本申请还公开了一种监控系统,所述监控系统中设置有针对所述被监控系统的业务服务能力,所述监控系统包括:
网关,用于发送业务对象数据或者测试数据,以及,接收被监控系统针对所述测试数据返回的第一报文信息和/或针对所述业务对象数据返回的第二报文信息,并将所述第一报文信息和/或所述第二报文信息发送至监控模块;
监控模块,用于基于所述第二报文信息,判断所述被监控系统是否出现数据异常,以及,基于所述第一报文信息,判断所述数据异常是否消除,以及,在判断所述被监控系统出现数据异常时,将所述判定所述被监控系统出现数据异常的异常判断结果发送至网关,以通知所述网关停止发送所述业务对象数据并开始发送所述测试数据,以及,在判断所述被监控系统的数据异常消除时,将所述判定所述数据异常消除的异常消除判断结果发送至网关,以通知所述网关停止发送所述测试数据并重新启动所述业务对象数据的发送。
优选地,所述监控系统还包括决策模块以及执行模块,
所述监控模块还用于将所述异常判断结果或者所述异常消除判断结果发送至决策模块;
所述决策模块,用于依据所述异常判断结果生成第一指令;以及,依据所述异常消除判断结果生成第二指令,并将所述第一指令和/或第二指令发送至执行模块,其中,所述第一指令为关闭所述业务服务能力的指令,所述第二指令为开启所述关闭的业务服务能力的指令;
所述执行模块,用于依据所述第一指令关闭所述业务服务能力,以及,依据所述第二指令开启所述关闭的业务服务能力。
优选地,所述被监控系统包括用于接收所述业务对象数据和/或所述测试数据的主用通信渠道和/或备用通信渠道,所述决策模块还用于针对所述主用通信渠道设定的第一级别的业务服务能力,以及,针对所述备用通信渠道设定的第二级别的业务服务能力,其中,所述第一级别的业务服务能力的级别高于所述第二级别的业务服务能力;
所述决策模块包括:
处理结果接收子模块,用于接收所述监控模块发送的第一处理结果以及第二处理结果,所述第一处理结果为所述监控模块在监控到所述主用通信渠道发生数据异常时生成的结果,所述第二处理结果为所述监控模块在监控到所述主用通信渠道的所述数据异常消除时生成的结果;
第一命令生成子模块,用于依据所述第一处理结果,生成关闭所述第一级别的业务服务能力的指令,以及,生成开启所述第二级别的业务服务能力的指令;
第二命令生成子模块,用于依据所述第二处理结果,生成关闭所述第二级别的业务服务能力的指令,以及,生成开启所述第一级别的业务服务能力的指令;
命令发送子模块,用于依次将所述关闭所述第一级别的业务服务能力的指令、所述开启所述第二级别的业务服务能力的指令、所述关闭所述第二级别的业务服务能力的指令,以及,所述开启所述第一级别的业务服务能力的指令发送至执行模块;
则所述执行模块包括:
第一执行子模块,用于依据所述关闭所述第一级别的业务服务能力的指令关闭所述第一级别的业务服务能力,以及,依据所述开启所述第二级别的业务服务能力的指令开启所述第二级别的业务服务能力;
第二执行子模块,用于依据所述关闭所述第二级别的业务服务能力的指令关闭所述第二级别的业务服务能力,以及,依据所述开启所述第一级别的业务服务能力的指令开启所述第一级别的业务服务能力。
优选地,所述监控模块包括:
第一计算子模块,用于在接收到所述被监控系统返回的与所述测试数据对应的第一报文信息时,从所述接收所述第一报文信息的时间开始的单位时间内,计算所述第一成功响应指令的数量;
第一判定子模块,用于在所述第一成功响应指令的数量大于第一预设阈值时,判定所述数据异常消除;
和/或,
第二计算子模块,用于从所述接收所述第一报文信息的时间开始的单位时间内,计算所述第一成功响应指令的数量以及发出的所述测试数据的数量的比值,得到第一成功率;
第二判定子模块,用于在所述第一成功率大于第二预设阈值时,判定所述数据异常消除。
优选地,所述监控模块包括:
第一记录子模块,用于从所述监控系统接收到所述被监控系统返回的与所述测试数据对应的第一报文信息开始,记录下一次发送所述测试数据的第一时间戳;
第二记录子模块,用于记录接收到的,针对所述下一次发送的所述测试数据返回的所述第一报文信息的第二时间戳;
第三计算子模块,用于计算所述第一时间戳以及所述第二时间戳的时间差,作为第一响应时间;
第四计算子模块,用于从所述接收所述第一报文信息的时间开始的单位时间内,统计所述第一响应时间大于第三预设阈值的测试数据的数量;
第三判定子模块,用于在所述第一响应时间大于第三预设阈值的测试数据的数量小于或等于第四预设阈值时,判定所述数据异常消除。
优选地,所述监控系统为支付平台,所述被监控系统为银行系统,所述业务对象数据为交易数据,所述业务服务能力包括实时到账服务、两小时到账服务、当天到账服务、第二天到账服务、三天内到账服务的至少一种,所述第一级别的业务服务能力包括实时到账服务或者两小时到账服务,所述第二级别的业务服务能力为当天到账服务、第二天到账服务、三天内到账服务。
与背景技术相比,本申请实施例包括以下优点:
第一,在本申请实施例中,监控系统可以自动判断被监控系统是否出现数据异常,并在判定被监控系统出现数据异常时,暂停向被监控系统发送业务对象数据,在整个监控及异常处理过程中由于无需人工干预,防止异常发生时正常的业务对象数据还在涌入的情况发生,缩小因人工异步干预导致的业务影响范围的同时,降低人力成本。并且,监控系统可以自动关闭被监控系统对应的业务服务能力,或者,自动对业务服务能力的级别作降级处理,提高异常处理效率。
第二,本申请实施例中,当判定被监控系统出现异常时,可以采用不影响正常用户的业务范围的测试数据来自动嗅探被监控系统出现的异常是否消除,当监控到被监控系统的异常消除时,自动逐步停止测试数据的发送以及逐步开启业务对象数据的发送,可以及时发现异常消除以及时恢复正常业务对象数据的发送,缩小了对正常用户的业务影响范围,减少了因数据异常导致的各种损失,提高了业务对象数据处理的效率。
第三,当监控到被监控系统恢复正常时,监控系统自动开启对应的业务服务能力或对对应的业务服务能力的级别升级到原来能力水平,无需人为干预,降低了人力成本。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
参照图1,示出了本申请的一种对异常数据进行处理的方法实施例的步骤流程图,具体可以包括如下步骤:
步骤101,在监控系统向被监控系统发送业务对象数据的过程中,当监控系统监控到被监控系统出现数据异常时,暂停向所述被监控系统发送所述业务对象数据;
具体而言,在业务对象数据的跨平台处理的过程中,为了能及时发现被监控系统出现的数据异常,减少因数据异常导致的各种损失,监控系统可以实时对被监控系统进行监控。
其中,监控系统是对被监控系统的软件及硬件的运行情况、任务执行情况、数据处理情况等进行记录或者远程察看,以了解被监控系统各项指标是否正常的系统,是执行监控动作的主体。被监控系统相对于监控系统而言,是监控的受体。例如,在电子商务领域,用户进入支付流程时,触发支付平台与银行系统的数据通信,若支付平台想对银行系统进行异常监控,则支付平台可以作为监控系统,银行系统可以作为被监控系统;相应的,若银行系统想对支付平台进行异常监控,则银行系统可以作为监控系统,支付平台可以作为被监控系统。需要说明的是,下文中的例子均以支付平台为监控系统,银行系统为被监控系统进行示例说明。在实际中,更进一步的,本例中的被监控系统可以包括银行系统的某一个或多个渠道(渠道是对具体银行业务的通常叫法,例如,支付平台和某银行XX支行合作的借记卡快捷支付业务就是一个渠道,其对应技术上是一个网关接口,携带标识信息,例如boc901)。
在本申请实施例的一种优选实施例中,监控系统可以采用如下方式对被监控系统进行数据异常监控:
步骤S1,监控系统向被监控系统发送业务对象数据;
其中,业务对象数据可以为某一业务的相关数据,例如,订单支付业务中的交易数据,包括商品编号、订单数量、订单金额等等。
监控系统按照正常的数据处理流程以及预设频率向被监控系统发送业务对象数据,则被监控系统在接收到业务对象数据后,按照预先设定的处理规则进行业务对象数据的处理,并返回处理结果(即第二报文信息)至监控系统,其中,处理结果可以包括处理成功结果(即第二成功响应指令)或处理失败结果(即错误码)。
例如,支付平台按照正常的流程以固定频率向银行系统发送交易数据,银行系统接收到交易数据后,进行相应的订单金额划扣等处理,并在处理完后返回处理结果至支付平台。
步骤S2,监控系统接收被监控系统基于所述业务对象数据返回的第二报文信息;
监控系统可以通过网关来接收被监控系统返回的第二报文信息。在网关中,监控系统进行数据布点,记录针对每个业务对象数据的如下信息:业务对象数据、第二报文信息、发出业务对象数据的时间以及收到第二报文信息的时间等信息。
例如,支付平台通过网关接收银行系统返回的第二报文信息,在网关中,支付平台进行数据布点,记录业务监控的交易数据、某一笔交易数据什么时候发送银行系统、银行系统什么时候回执、结果是成功还是失败等数据。
步骤S3,所述监控系统基于所述第二报文信息,判断所述被监控系统是否出现数据异常。
监控系统接收到被监控系统返回的第二报文信息以后,基于在网关的数据记录,判断被监控系统是否出现数据异常。具体而言,监控系统基于第二报文信息,判断被监控系统是否出现数据异常的方式,可以包括如下一种或多种:
(1)计算单位时间内接收的所述第二成功响应指令的数量;若所述单位时间内接收的第二成功响应指令的数量小于第一预设阈值,则判定所述被监控系统出现数据异常。
具体来说,监控系统接收到被监控系统返回的第二报文信息后,若第二报文信息中包括第二成功响应指令,则监控系统在预设的数据容器中加1,该数据容器设置有定时器,当定时器到达设定的单位时间时,数据容器中计算的数量则为单位时间内接收的第二成功响应指令的数量,即为单位时间内被监控系统处理业务对象数据的成功笔数。
当单位时间内的成功笔数小于第一预设阈值时,则判定被监控系统出现数据异常。
在实际中,方式(1)可以用于监控平时业务对象数据的处理数量不多的被监控系统,例如,用来监控平时交易量不大的渠道。
(2)计算单位时间内接收的第二成功响应指令的数量以及发出的业务对象数据的数量的比值,得到第二成功率;若第二成功率小于或等于第二预设阈值,则判定所述被监控系统出现数据异常。
具体而言,方式(2)以成功率(第二成功率)来判断被监控系统是否出现数据异常,第二成功率的计算方法为:单位时间内被监控系统返回明确成功的第二成功响应指令的数量作为分子,单位时间内发往被监控系统的业务对象数据的数量作为分母,得到第二成功率,若第二成功率小于或等于第二预设阈值,则判定被监控系统出现数据异常。例如,设定单位时间为一分钟,平时某银行系统代发渠道成功率为95%,某一分钟内成功率跌倒50%,则判定该代发渠道异常。
(3)计算记录的发送所述业务对象数据的时间戳,以及,记录的接收到所述第二报文信息的时间戳的时间差,作为第二响应时间;统计单位时间内所述第二响应时间差大于第三预设阈值的业务对象数据的数量;若所述单位时间内所述第二响应时间差大于第三预设阈值的业务对象数据的数量大于第四预设阈值,则判定所述被监控系统出现数据异常。
具体而言,第二响应时间即为被监控系统的回执时间或处理时间,在第二响应时间大于第三预设阈值时,则判定对应的业务对象数据处理超时,例如,可以从某一笔交易数据什么时候发送银行系统,以及银行系统什么时候回执得到处理时间,即银行系统回执时效,若处理时间大于某个阈值(例如8秒)则证明该笔交易数据超时。
统计单位时间内超时的业务对象数据的数量,如果超时的业务对象数据增多到一定程度(如大于第四预设阈值),则判定被监控系统异常。
(4)计算记录的发送所述业务对象数据的时间戳,以及,记录的接收到所述第二报文信息的时间戳的时间差,作为第二响应时间;依据所述第二响应时间计算单位时间内的平均处理时效,若平均处理时效大于第五预设阈值,则判定所述被监控系统出现数据异常;
例如,正常的银行系统的回执时间通常为几百毫秒到5秒之间,如果单位时间内的平均处理时效为15秒,说明银行系统处理能力出现了问题。
(5)当第二报文信息包括错误码时,基于所述错误码,判定所述被监控系统出现数据异常。
错误码显示该笔业务对象数据的处理结果为失败结果,例如,银行系统返回的错误码为账户余额不足的错误码,则判定银行系统在处理该笔交易数据时出现异常。
需要说明的是,对于上述方式(1)-(5),可以是多维度的方式,例如方式(1)-(5)组合的方式,当有一种以上或全部的方式达到规则时,才判定被监控系统出现数据异常,例如1分钟成功笔数低于10同时1分钟成功率低于20%时判定银行系统异常;或者,可以为单维度的方式,当任意一种方式达到规则时,就判定被监控系统出现数据异常。本申请实施例对此无需加以限定。
当监控系统监控到被监控系统出现数据异常时,监控系统可以暂停向被监控系统发送业务对象数据,作为一种示例,监控系统暂停向被监控系统发送业务对象数据的过程可以为,监控系统停止接收用户的处理请求,用户的处理请求中包含业务对象数据,则此时监控系统没有业务对象数据,从而使得监控系统没有业务对象数据发送至被监控系统中。
在实际中,被监控系统可以包括一个或多个用于接收业务对象数据的通信渠道,当监控系统监控到当前通信渠道出现数据异常时,停止向该通信渠道发送业务对象数据,例如,若支付平台监控到boc901渠道异常,则支付平台停止接收用户的交易请求,并停止往boc901渠道发送交易数据。
在本申请实施例中,在监控系统中设置有针对被监控系统的业务服务能力,在监控系统监控到被监控系统出现数据异常时,监控系统暂停向被监控系统发送业务对象数据的同时,监控系统还可以关闭该业务服务能力。
具体来说,针对被监控系统中的每一个通信渠道,监控系统为其设定对应的业务服务能力。其中,业务服务能力(或称用户服务承诺能力)可以为当前通信渠道具备的向用户进行业务服务的能力,包括受理时效服务能力、可受理时间段服务能力等等,例如,若业务对象数据为交易数据,则业务服务能力可以包括实时到账服务、两小时到账服务、当天到账服务、第二天到账服务、三天内到账服务等等。
在本申请实施例的一种优选实施例中,当被监控系统只有一条通信渠道时,则对应的业务服务能力为一条,当监控系统监控到该通信渠道异常时,在监控系统停止向该通信渠道发送业务对象数据后,监控系统可以关闭该通信渠道对应的业务服务能力。例如,如果只有abc007这一个渠道,该渠道的服务能力只有一个,即为实时到账,在监控到abc007出现异常时,监控系统不再接受用户的请求,并且关闭该渠道实时到账的服务。
当业务服务能力被关闭后,展现给用户的是与业务服务能力对应的变灰的字体或功能按键。
在本申请实施例的另一种优选实施例中,所述被监控系统包括用于接收所述业务对象数据和/或所述测试数据的主用通信渠道和/或备用通信渠道,针对所述主用通信渠道具有设定的第一级别的业务服务能力,针对所述备用通信渠道具有设定的第二级别的业务服务能力,所述第一级别的业务服务能力的级别高于所述第二级别的业务服务能力,步骤101具体可以包括如下子步骤:
子步骤S21,当所述监控系统监控到所述主用通信渠道出现数据异常时,关闭所述第一级别的业务服务能力,以及
子步骤S22,开启所述第二级别的业务服务能力。
当被监控系统中有多条通信渠道时,可以选择业务服务能力的级别较高的业务服务能力对应的通信渠道作为主用通信渠道,其他的通信渠道作为备用通信渠道,实际上,若有多条通信渠道,则在监控系统中维护有一个渠道列表,该渠道列表中将通信渠道按照对应的业务服务能力的级别以高低次序依次排序,并选择排在队列第一位(当从高级到低级的降序排列时)或排在队列最后一位(当从低级到高级的升序排列时)作为主用通信渠道,余下的通信渠道作为备用通信渠道,主用通信渠道的业务服务能力称为第一级别的业务服务能力,备用通信渠道的业务服务能力称为第二级别的业务服务能力。
当监控到主用通信渠道出现异常时,监控系统可以关闭该主用通信渠道对应的第一级别的业务服务能力,以及,开启列表中排列在主用通信渠道下一位的备用通信渠道的第二级别的业务服务能力,实际上,这种关闭第一级别的业务服务能力,以及,开启第二级别的业务服务能力的过程可以理解为服务能力降级的过程,使得业务服务能力由第一级别的业务服务能力降级为第二级别的业务服务能力。
例如,假设银行系统中包括具有单笔实时处理能力的主用渠道abc007和具有批量异步能力的备用渠道渠道abc005两个代发至银行卡渠道,其中abc005的处理时效能力是T0当日到账,abc007渠道的处理时效能力是实时到账,正常业务情况下,abc007没有异常,支付平台可以承诺给用户实时到账,而abc005由于时效不高,作为备份渠道或者低时效产品的渠道。某日,通过网关布点的数据,支付平台发现abc007出现巨大异常,连续20分钟成功率跌至10%以下。此时支付平台会关闭abc007的交易报送,不再往银行系统发送用户数据,并根据abc007的渠道能力,判断abc007能力缺失,把前台用户承诺的实时到账变更为T0当日到账(因为abc005还能正常工作)。
在本申请实施例中,监控系统可以自动判断被监控系统是否出现数据异常,并在判定被监控系统出现数据异常时,暂停向被监控系统发送业务对象数据,在整个监控及异常处理过程中由于无需人工干预,防止异常发生时正常的业务对象数据还在涌入的情况发生,缩小因人工异步干预导致的业务影响范围的同时,降低人力成本。并且,监控系统可以自动关闭被监控系统对应的业务服务能力,或者,自动对业务服务能力的级别作降级处理,提高异常处理效率。
步骤102,所述监控系统向所述被监控系统发送测试数据;
应用于本申请实施例,在监控系统停止向被监控系统发送业务对象数据的时间段,为了及时监测被监控系统的异常是否消除以恢复正常的处理流程,以减少对正常用户的业务影响范围,监控系统可以向被监控系统发送测试数据,该测试数据以固定频率发送至被监控系统中。该测试数据是监控系统生成的区别于正常业务对象数据的非正式数据。
被监控系统接收到测试数据后,以正常的数据处理流程对测试数据进行处理,并返回第一报文信息至监控系统,第一报文信息可以包括处理成功信息或者处理失败信息。
例如,若boc901渠道出现数据异常,则支付平台关闭了对该渠道的正常的交易数据的报送,为了检测boc901是否恢复正常,以及减少异常对正常的交易数据的业务影响范围,支付平台可以将交易测试数据以固定频率(如每10秒一笔)发送至银行系统,以对银行系统进行嗅探。
步骤103,当所述监控系统接收到所述被监控系统返回的与所述测试数据对应的第一报文信息时,基于所述第一报文信息,判断所述数据异常是否消除;
需要说明的是,由于在发送测试数据之初被监控系统出现异常了,因此监控系统可能很长一段时间没有接收到银行返回的回执(即第一报文信息),直到被监控系统恢复正常。
当监控系统接收到被监控系统针对测试数据返回的第一个第一报文信息后,表示被监控系统可能恢复正常,此时监控系统从所述接收第一个第一报文信息的时间开始,根据单位时间内接收的第一报文信息,判断被监控系统的异常是否消除。
在本申请实施例的一种优选实施例中,步骤103可以包括如下子步骤:
子步骤S31,当所述监控系统接收到所述被监控系统返回的与所述测试数据对应的第一报文信息时,从所述接收所述第一报文信息的时间开始的单位时间内,计算所述第一成功响应指令的数量;
子步骤S32,若所述第一成功响应指令的数量大于第一预设阈值,则判定所述数据异常消除。
当监控系统接收到被监控系统针对测试数据返回的第一个第一报文信息后,以该第一个第一报文信息的接收时间开始的单位时间内,计算被监控系统对测试数据的成功笔数,若成功笔数大于第一预设阈值,则判定被监控系统出现的数据异常消除,例如,一旦连续多笔交易测试数据,银行系统都正确应答,则可以判断银行系统恢复。其中,具体的成功笔数计算方式可以参照上述方式(1)。
在本申请实施例的另一种优选实施例中,步骤103可以包括如下子步骤:
子步骤S41,从所述接收所述第一报文信息的时间开始的单位时间内,计算所述第一成功响应指令的数量以及发出的所述测试数据的数量的比值,得到第一成功率;
子步骤S42,若所述第一成功率大于第二预设阈值,则判定所述数据异常消除。
与上述方式(2)对应,可以通过计算被监控系统返回的第一报文信息的第一成功率来判断数据异常是否消除,当第一成功率大于第二预设阈值,则判定数据异常消除,第一成功率的计算可以参照上述方式(2)的成功率计算方法。
在本申请实施例的另一种优选实施例中,步骤103可以包括如下子步骤:
子步骤S51,从所述监控系统接收到所述被监控系统返回的与所述测试数据对应的第一报文信息开始,记录下一次发送所述测试数据的第一时间戳;
子步骤S52,记录接收到,针对所述下一次发送的所述测试数据返回的所述第一报文信息的第二时间戳;
子步骤S53,计算所述第一时间戳以及所述第二时间戳的时间差,作为第一响应时间;
子步骤S54,从所述接收所述第一报文信息的时间开始的单位时间内,统计所述第一响应时间大于第三预设阈值的测试数据的数量;
子步骤S55,若所述第一响应时间大于第三预设阈值的测试数据的数量小于或等于第四预设阈值,则判定所述数据异常消除。
与上述方式(3)对应,可以通过计算单位时间内的超时笔数来判断异常是否消除,若超时笔数小于或等于第四预设阈值,则判定数据异常消除。
当然,上述判断被监控系统是否出现数据异常以及判断数据异常是否消除的方法仅仅是本申请实施例的示例,本领域技术人员还可以采用其他方式判断被监控系统是否出现数据异常以及数据异常是否消除,本申请实施例对此无需加以限制。
步骤104,监控系统在判定所述数据异常消除时,停止向所述被监控系统发送所述测试数据,以及,继续向所述被监控系统发送所述业务对象数据。
在监控到被监控系统的数据异常消除后,监控系统可以停止测试数据的发送,以及,重新接收用户的数据处理请求,继续开启正常的业务对象数据发送流程。在实际中,监控系统可以逐步停止测试数据的发送,及逐步开启业务对象数据的发送,例如,在检测被监控系统异常消除之初,单位时间内发送1/3的业务对象数据及2/3的测试数据,过了一段时间后,没有发现新的异常,监控系统可以在单位时间内发送1/2的业务对象数据及1/2的测试数据,再过一段时间,监控系统可以在单位时间内发送2/3的业务对象数据及1/3的测试数据,随后的一段时间,判断被监控系统已经能正常稳定地开展业务处理流程后,监控系统可以在单位时间内只发送业务对象数据。
另一方面,当判定被监控系统的数据异常消除后,监控系统还可以对关闭的业务服务能力进行恢复,即将之前关闭的业务服务能力开启。如,当监控到主用通信渠道数据异常消除时,关闭所述第二级别的业务服务能力,以及,开启所述第一级别的业务服务能力,以达到升级效果。
例如,从某个时间点开始,支付平台发送至银行系统的交易测试数据得到了应答,连续15分钟,则判定银行系统恢复正常,此时,可以正常收发业务报文,并且再次打开服务或者提升服务能力。
本申请实施例中,当判定被监控系统出现异常时,可以采用不影响正常用户的业务范围的测试数据来自动嗅探被监控系统出现的异常是否消除,当监控到被监控系统的异常消除时,自动逐步停止测试数据的发送以及逐步开启业务对象数据的发送,可以及时发现异常消除以及时恢复正常业务对象数据的发送,缩小了对正常用户的业务影响范围,减少了因数据异常导致的各种损失,提高了业务对象数据处理的效率。另外,当监控到被监控系统恢复正常时,监控系统自动开启对应的业务服务能力或对对应的业务服务能力的级别升级到原来能力水平,无需人为干预,降低了人力成本。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请实施例所必须的。
参照图2,示出了本申请一种对异常数据进行处理的装置实施例的结构框图,具体可以包括如下模块:
暂停模块201,用于在监控系统向被监控系统发送业务对象数据的过程中,当所述监控系统监控到所述被监控系统出现数据异常时,暂停向所述被监控系统发送所述业务对象数据;
测试数据发送模块202,用于向所述被监控系统发送测试数据;
判断模块203,用于在所述监控系统接收到所述被监控系统返回的与所述测试数据对应的第一报文信息时,基于所述第一报文信息,判断所述数据异常是否消除;
重启模块204,用于在判定所述数据异常消除时,停止向所述被监控系统发送所述测试数据,以及,继续向所述被监控系统发送所述业务对象数据。
在本申请实施例的一种优选实施例中,所述监控系统中设置有针对所述被监控系统的业务服务能力,所述装置还可以包括:
服务关闭模块,用于在监控到所述被监控系统出现数据异常时,关闭所述业务服务能力。
在本申请实施例的一种优选实施例中,所述装置还可以包括:
服务开启模块,用于在判定所述数据异常消除时,开启所述关闭的业务服务能力。
在本申请实施例的一种优选实施例中,所述被监控系统包括用于接收所述业务对象数据和/或所述测试数据的主用通信渠道和/或备用通信渠道,针对所述主用通信渠道具有设定的第一级别的业务服务能力,针对所述备用通信渠道具有设定的第二级别的业务服务能力,所述第一级别的业务服务能力的级别高于所述第二级别的业务服务能力,
所述服务关闭模块包括:
第一关闭子模块,用于在监控到所述主用通信渠道出现数据异常时,关闭所述第一级别的业务服务能力,以及
第一开启子模块,用于开启所述第二级别的业务服务能力。
在本申请实施例的一种优选实施例中,所述服务开启模块包括:
第二关闭子模块,用于在判定所述主用通信渠道数据异常消除时,关闭所述第二级别的业务服务能力,以及
第二开启子模块,用于开启所述第一级别的业务服务能力。
在本申请实施例的一种优选实施例中,所述第一报文信息包括第一成功响应指令,所述判断模块203可以包括:
第一计算子模块,用于在接收到所述被监控系统返回的与所述测试数据对应的第一报文信息时,从所述接收所述第一报文信息的时间开始的单位时间内,计算所述第一成功响应指令的数量;
第一判定子模块,用于在所述第一成功响应指令的数量大于第一预设阈值时,判定所述数据异常消除;
和/或,
第二计算子模块,用于从所述接收所述第一报文信息的时间开始的单位时间内,计算所述第一成功响应指令的数量以及发出的所述测试数据的数量的比值,得到第一成功率;
第二判定子模块,用于在所述第一成功率大于第二预设阈值时,判定所述数据异常消除。
在本申请实施例的另一种优选实施例中,所述所述判断模块203包括:
第一记录子模块,用于从所述监控系统接收到所述被监控系统返回的与所述测试数据对应的第一报文信息开始,记录下一次发送所述测试数据的第一时间戳;
第二记录子模块,用于记录接收到的,针对所述下一次发送的所述测试数据返回的所述第一报文信息的第二时间戳;
第三计算子模块,用于计算所述第一时间戳以及所述第二时间戳的时间差,作为第一响应时间;
第四计算子模块,用于从所述接收所述第一报文信息的时间开始的单位时间内,统计所述第一响应时间大于第三预设阈值的测试数据的数量;
第三判定子模块,用于在所述第一响应时间大于第三预设阈值的测试数据的数量小于或等于第四预设阈值时,判定所述数据异常消除。
在本申请实施例的一种优选实施例中,所述监控系统采用如下方式对所述被监控系统进行数据异常监控:
所述监控系统向所述被监控系统发送业务对象数据;
所述监控系统接收所述被监控系统基于所述业务对象数据返回的第二报文信息;
所述监控系统基于所述第二报文信息,判断所述被监控系统是否出现数据异常。
在本申请实施例的一种优选实施例中,所述第二报文信息包括第二成功响应指令,和/或,错误码,所述监控系统基于所述第二报文信息,判断所述被监控系统是否出现数据异常的方式包括:
计算单位时间内接收的所述第二成功响应指令的数量;
若所述单位时间内接收的第二成功响应指令的数量小于第一预设阈值,则判定所述被监控系统出现数据异常;
和/或,
计算单位时间内接收的第二成功响应指令的数量以及发出的业务对象数据的数量的比值,得到第二成功率;
若第二成功率小于或等于第二预设阈值,则判定所述被监控系统出现数据异常;
和/或,
计算记录的发送所述业务对象数据的时间戳,以及,记录的接收到所述第二报文信息的时间戳的时间差,作为第二响应时间;
统计单位时间内所述第二响应时间差大于第三预设阈值的业务对象数据的数量;
若所述单位时间内所述第二响应时间差大于第三预设阈值的业务对象数据的数量大于第四预设阈值,则判定所述被监控系统出现数据异常;
和/或,
计算记录的发送所述业务对象数据的时间戳,以及,记录的接收到所述第二报文信息的时间戳的时间差,作为第二响应时间;依据所述第二响应时间计算单位时间内的平均处理时效,若平均处理时效大于第五预设阈值,则判定所述被监控系统出现数据异常;
和/或,
基于所述错误码,判定所述被监控系统出现数据异常。
作为本申请实施例的一种优选示例,所述监控系统为支付平台,所述被监控系统为银行系统,所述业务对象数据为交易数据,所述业务服务能力可以包括实时到账服务、两小时到账服务、当天到账服务、第二天到账服务、三天内到账服务的至少一种,所述第一级别的业务服务能力可以包括实时到账服务或者两小时到账服务,所述第二级别的业务服务能力可以包括当天到账服务、第二天到账服务、三天内到账服务。
对于图2所述的装置实施例而言,由于其与上述方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
参照图3,示出了本申请一种监控系统实施例的结构框图,其中,所述监控系统中设置有针对所述被监控系统的业务服务能力,所述监控系统可以包括:
网关301,用于发送业务对象数据或者测试数据,以及,接收被监控系统针对所述测试数据返回的第一报文信息和/或针对所述业务对象数据返回的第二报文信息,并将所述第一报文信息和/或所述第二报文信息发送至监控模块;
监控模块302,用于基于所述第二报文信息,判断所述被监控系统是否出现数据异常,以及,基于所述第一报文信息,判断所述数据异常是否消除,以及,在判断所述被监控系统出现数据异常时,将所述判定所述被监控系统出现数据异常的异常判断结果发送至网关,以通知所述网关停止发送所述业务对象数据并开始发送所述测试数据,以及,在判断所述被监控系统的数据异常消除时,将所述判定所述数据异常消除的异常消除判断结果发送至网关,以通知所述网关停止发送所述测试数据并重新启动所述业务对象数据的发送。
在本申请实施例的一种优选实施例中,所述监控系统还可以包括决策模块303以及执行模块304,
所述监控模块302还用于将所述异常判断结果或者所述异常消除判断结果发送至决策模块;
所述决策模块303,用于依据所述异常判断结果生成第一指令;以及,依据所述异常消除判断结果生成第二指令,并将所述第一指令和/或第二指令发送至执行模块,其中,所述第一指令为关闭所述业务服务能力的指令,所述第二指令为开启所述关闭的业务服务能力的指令;
所述执行模块304,用于依据所述第一指令关闭所述业务服务能力,以及,依据所述第二指令开启所述关闭的业务服务能力。
在本申请实施例的一种优选实施例中,所述被监控系统包括用于接收所述业务对象数据和/或所述测试数据的主用通信渠道和/或备用通信渠道,所述决策模块303还用于针对所述主用通信渠道设定第一级别的业务服务能力,以及,针对所述备用通信渠道设定第二级别的业务服务能力,其中,所述第一级别的业务服务能力的级别高于所述第二级别的业务服务能力;
所述决策模块303包括:
处理结果接收子模块,用于接收所述监控模块发送的第一处理结果以及第二处理结果,所述第一处理结果为所述监控模块在监控到所述主用通信渠道发生数据异常时生成的结果,所述第二处理结果为所述监控模块在监控到所述主用通信渠道的所述数据异常消除时生成的结果;
第一命令生成子模块,用于依据所述第一处理结果,生成关闭所述第一级别的业务服务能力的指令,以及,生成开启所述第二级别的业务服务能力的指令;
第二命令生成子模块,用于依据所述第二处理结果,生成关闭所述第二级别的业务服务能力的指令,以及,生成开启所述第一级别的业务服务能力的指令;
命令发送子模块,用于依次将所述关闭所述第一级别的业务服务能力的指令、所述开启所述第二级别的业务服务能力的指令、所述关闭所述第二级别的业务服务能力的指令,以及,所述开启所述第一级别的业务服务能力的指令发送至执行模块;
则所述执行模块包括:
第一执行子模块,用于依据所述关闭所述第一级别的业务服务能力的指令关闭所述第一级别的业务服务能力,以及,依据所述开启所述第二级别的业务服务能力的指令开启所述第二级别的业务服务能力;
第二执行子模块,用于依据所述关闭所述第二级别的业务服务能力的指令关闭所述第二级别的业务服务能力,以及,依据所述开启所述第一级别的业务服务能力的指令开启所述第一级别的业务服务能力。
在本申请实施例的一种优选实施例中,所述监控模块302可以包括:
第一计算子模块,用于在接收到所述被监控系统返回的与所述测试数据对应的第一报文信息时,从所述接收所述第一报文信息的时间开始的单位时间内,计算所述第一成功响应指令的数量;
第一判定子模块,用于在所述第一成功响应指令的数量大于第一预设阈值时,判定所述数据异常消除;
和/或,
第二计算子模块,用于从所述接收所述第一报文信息的时间开始的单位时间内,计算所述第一成功响应指令的数量以及发出的所述测试数据的数量的比值,得到第一成功率;
第二判定子模块,用于在所述第一成功率大于第二预设阈值时,判定所述数据异常消除。
在本申请实施例的一种优选实施例中,所述监控模块302包括:
第一记录子模块,用于从所述监控系统接收到所述被监控系统返回的与所述测试数据对应的第一报文信息开始,记录下一次发送所述测试数据的第一时间戳;
第二记录子模块,用于记录接收到的,针对所述下一次发送的所述测试数据返回的所述第一报文信息的第二时间戳;
第三计算子模块,用于计算所述第一时间戳以及所述第二时间戳的时间差,作为第一响应时间;
第四计算子模块,用于从所述接收所述第一报文信息的时间开始的单位时间内,统计所述第一响应时间大于第三预设阈值的测试数据的数量;
第三判定子模块,用于在所述第一响应时间大于第三预设阈值的测试数据的数量小于或等于第四预设阈值时,判定所述数据异常消除。
作为本申请实施例的优选示例,所述监控系统为支付平台,所述被监控系统为银行系统,所述业务对象数据为交易数据,所述业务服务能力包括实时到账服务、两小时到账服务、当天到账服务、第二天到账服务、三天内到账服务的至少一种,所述第一级别的业务服务能力包括实时到账服务或者两小时到账服务,所述第二级别的业务服务能力包括当天到账服务、第二天到账服务、三天内到账服务。
参考图4,示出了图3的监控系统的执行过程的步骤流程图,具体可以包括如下步骤:
步骤401,网关按照固定频率向被监控系统发送业务对象数据;
步骤402,网关在接收到所述被监控系统返回的与所述业务对象数据对应的第二报文信息后,将所述第二报文信息发送至监控模块;
在具体实现中,网关接收到第二报文信息后,可以将第二报文信息记录在本地数据库中,并记录接收所述第二报文信息的时间。网关在本地数据库中还会记录业务对象数据,以及发送所述业务对象数据的时间。在对接收的第二报文信息记录后,将本次业务对象数据的相关信息(包括业务对象数据、发送所述业务对象数据的时间、第二报文信息、接收所述第二报文信息的时间等信息)发送至监控模块。
步骤403,监控模块基于所述第二报文信息,判断所述被监控系统是否出现数据异常;
应用于本申请实施例,监控模块内部设置有一个或多个判断被监控系统出现数据异常的规则阈值,当统计的对应数值触发规则阈值时,判定被监控系统出现数据异常。具体而言,步骤403可以通过如下一种或多种方式实现:
(1)计算单位时间内接收的所述第二成功响应指令的数量;若所述单位时间内接收的第二成功响应指令的数量小于第一预设阈值,则判定所述被监控系统出现数据异常。
即通过计算单位时间内成功响应的业务对象数据的数量(成功笔数的维度)来判定被监控系统是否出现数据异常。
(2)计算单位时间内接收的第二成功响应指令的数量以及发出的业务对象数据的数量的比值,得到第二成功率;若第二成功率小于或等于第二预设阈值,则判定所述被监控系统出现数据异常。
即通过计算单位时间内业务对象数据成功响应的成功率(成功率的维度)来判定被监控系统是否出现数据异常。
(3)计算记录的发送所述业务对象数据的时间戳,以及,记录的接收到所述第二报文信息的时间戳的时间差,作为第二响应时间;统计单位时间内所述第二响应时间大于第三预设阈值的请求的数量;若所述单位时间内所述第二响应时间差大于第三预设阈值的业务对象数据的数量大于第四预设阈值,则判定所述被监控系统出现数据异常。
即从计算单位时间内响应超时的业务对象的数量的维度来判断被监控系统是否出现数据异常。
(4)计算记录的发送所述业务对象数据的时间戳,以及,记录的接收到所述第二报文信息的时间戳的时间差,作为第二响应时间;依据所述第二响应时间计算单位时间内的平均处理时效,若平均处理时效大于第五预设阈值,则判定所述被监控系统出现数据异常;
即通过计算单位时间的平均处理时效的维度来判断被监控系统是否出现数据异常。
(5)当第二报文信息包括错误码时,基于所述错误码,判定所述被监控系统出现数据异常;
即从明确的错误码的维度来判断被监控系统是否出现数据异常。
步骤404,监控模块在判断所述被监控系统出现数据异常时,将所述判定所述被监控系统出现数据异常的异常判断结果发送至网关以及决策模块;
具体而言,当监控模块判断被监控系统出现数据异常时,同时将异常判断结果发送至网关以及决策模块,以触发网关和决策模块的相关工作。
步骤405,网关接收到所述异常判断结果后,暂停向被监控系统发送所述业务对象数据,以及,开始向被监控系统发送测试数据;
步骤406,决策模块接收到所述异常判断结果时,依据所述异常判断结果生成第一指令,并将所述第一指令发送至执行模块,所述第一指令为关闭所述业务服务能力的指令;
在本申请实施例的一种优选实施例中,所述被监控系统包括用于接收所述业务对象数据和/或所述测试数据的主用通信渠道和/或备用通信渠道,所述决策模块还用于针对所述主用通信渠道设定的第一级别的业务服务能力,针对所述备用通信渠道设定的第二级别的业务服务能力,其中,所述第一级别的业务服务能力的级别高于所述第二级别的业务服务能力。
步骤406可以包括如下子步骤:
子步骤S61,接收所述监控模块发送的第一处理结果,所述第一处理结果为监控到所述主用通信渠道发生数据异常时生成的结果;
子步骤S62,依据所述第一处理结果,生成关闭所述第一级别的业务服务能力的指令,以及,生成开启所述第二级别的业务服务能力的指令,并将所述生成的指令发送至执行模块。
步骤407,执行模块依据所述第一指令关闭所述业务服务能力;
针对上述子步骤S61-S62的情况,执行模块相应地执行如下工作:
依据所述关闭所述第一级别的业务服务能力的指令关闭所述第一级别的业务服务能力,以及,依据所述开启所述第二级别的业务服务能力的指令开启所述第二级别的业务服务能力,即完成业务服务能力降级的过程。
步骤408,网关在接收到所述被监控系统返回的与所述测试数据对应的第一报文信息后,将所述第一报文信息发送至监控模块;
在具体实现中,网关接收到第一报文信息后,可以将第一报文信息记录在本地数据库中,并记录接收所述第一报文信息的时间。网关在本地数据库中还会记录测试数据,以及发送所述测试数据的时间。在对接收的第一报文信息记录后,将本次测试数据的相关信息(包括测试数据、发送所述测试数据的时间、第一报文信息、接收所述第一报文信息的时间等信息)发送至监控模块。
步骤409,监控模块基于所述第一报文信息,判断所述被监控系统的数据异常是否消除;
应用于本申请实施例,监控模块内部设置有一个或多个判断被监控系统出现的数据异常是否消除的规则阈值,当统计的对应数值触发规则阈值时,判定被监控系统出现的数据异常消除。具体而言,步骤409可以通过如下一种或多种方式实现:
(1)在接收到所述被监控系统返回的与所述测试数据对应的第一报文信息时,从所述接收所述第一报文信息的时间开始的单位时间内,计算所述第一成功响应指令的数量,在所述第一成功响应指令的数量大于第一预设阈值时,判定所述数据异常消除。
即通过计算单位时间内成功响应的测试数据的数量(成功笔数的维度)来判定被监控系统出现的数据异常是否消除。
(2)从所述接收所述第一报文信息的时间开始的单位时间内,计算所述第一成功响应指令的数量以及发出的所述测试数据的数量的比值,得到第一成功率;在所述第一成功率大于第二预设阈值时,判定所述数据异常消除。
即通过计算单位时间内测试数据成功响应的成功率(成功率的维度)来判定被监控系统出现的数据异常是否消除。
(3)在接收到所述被监控系统返回的与所述测试数据对应的第一报文信息时,记录下一次发送所述测试数据的第一时间戳;记录接收到的,针对所述下一次发送的所述测试数据返回的所述第一报文信息的第二时间戳;计算所述第一时间戳以及所述第二时间戳的时间差,作为第一响应时间;从所述接收所述第一报文信息的时间开始的单位时间内,统计所述第一响应时间大于第三预设阈值的测试数据的数量;在所述第一响应时间大于第三预设阈值的测试数据的数量小于或等于第四预设阈值时,判定所述数据异常消除。
即从计算单位时间内响应超时的测试数据的数量的维度来判断被监控系统出现的数据异常是否消除。
步骤410,监控模块在判断所述被监控系统出现的数据异常消除时,将所述判定所述被监控系统出现的数据异常的异常消除判断结果发送至决策模块以及网关;
步骤411,网关接收到所述异常消除判断结果后,暂停向被监控系统发送所述测试数据,以及,开始向被监控系统发送业务对象数据;
步骤412,决策模块接收到所述异常消除判断结果时,依据所述异常消除判断结果生成第二指令,并将所述第二指令发送至执行模块,所述第二指令为开启所述关闭的业务服务能力的指令;
在本申请实施例的一种优选实施例中,所述被监控系统包括用于接收所述业务对象数据和/或所述测试数据的主用通信渠道和/或备用通信渠道,所述决策模块还用于针对所述主用通信渠道设定的第一级别的业务服务能力,针对所述备用通信渠道设定的第二级别的业务服务能力,其中,所述第一级别的业务服务能力的级别高于所述第二级别的业务服务能力。
步骤412可以包括如下子步骤:
子步骤S71,接收所述监控模块发送的第二处理结果,所述第二处理结果为监控到所述主用通信渠道发生的数据异常消除时生成的结果;
子步骤S72,依据所述第二处理结果,生成开启所述第一级别的业务服务能力的指令,以及,生成关闭所述第二级别的业务服务能力的指令,并将所述生成的指令发送至执行模块;
步骤413,执行模块依据所述第二指令开启所述关闭的业务服务能力。
针对上述子步骤S71-S72的情况,执行模块相应地执行如下工作:
依据所述开启所述第一级别的业务服务能力的指令开启所述第一级别的业务服务能力,以及,依据所述关闭所述第二级别的业务服务能力的指令关闭所述第二级别的业务服务能力,即完成业务服务能力升级的过程。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本申请实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
在一个典型的配置中,所述计算机设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非持续性的电脑可读媒体(transitorymedia),如调制的数据信号和载波。
本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的对异常数据进行处理的方法、对异常数据进行处理的装置和一种监控系统,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。