CN111192130A - 交易监控中确定故障根源的方法、系统、装置及存储介质 - Google Patents

交易监控中确定故障根源的方法、系统、装置及存储介质 Download PDF

Info

Publication number
CN111192130A
CN111192130A CN201911266149.3A CN201911266149A CN111192130A CN 111192130 A CN111192130 A CN 111192130A CN 201911266149 A CN201911266149 A CN 201911266149A CN 111192130 A CN111192130 A CN 111192130A
Authority
CN
China
Prior art keywords
fault
transaction
root
acquiring
field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911266149.3A
Other languages
English (en)
Other versions
CN111192130B (zh
Inventor
李琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN201911266149.3A priority Critical patent/CN111192130B/zh
Publication of CN111192130A publication Critical patent/CN111192130A/zh
Application granted granted Critical
Publication of CN111192130B publication Critical patent/CN111192130B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/02Banking, e.g. interest calculation or account maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种在交易监控中确定故障根源的方法、系统、装置及存储介质,其中,所述方法包括:获得故障告警信息,根据所述故障告警信息确定故障场景;获取与确定的故障场景对应的分析方法,并获取所述确定的故障场景中的全量交易明细数据;根据所述分析方法和所述全量交易明细获取直接根源对象;根据所述直接根源对象获取最终根源组件。采用本发明可以自动计算故障原因,实现快速故障定位,帮助运维人员迅速完成根因排查和故障处置。同时,无需人工参与,在减少人力成本的同时提高了准确率。

Description

交易监控中确定故障根源的方法、系统、装置及存储介质
技术领域
本发明涉及计算机应用技术领域,更为具体而言,涉及一种在交易监控中确定故障根源的方法、系统、装置及存储介质。
背景技术
商业银行数据中心作为“金融业跳动的心脏”,稳定运行和控制风险是第一要务。一方面,基础设施故障、突发业务压力、频繁变更上线等都可能影响系统的稳定和服务质量,随着业务部门和上级监管机构要求不断提高,银行对数据中心高可用性的要求也日益严格;另一方面,数据中心对外部基础设施、外部技术和服务的依赖性不断增强,网络入侵、信息泄露等安全风险日益突出。
目前商业银行数据中心部署有交易监控机制,记录每笔实际发生的交易明细,基于这些交易明细数据,可以进行多维度的统计分析。针对商业银行的常用统计指标,例如:系统成功率、业务成功率、平均响应时间、平均处理时间进行实时监控,可以在单点故障场景中迅速定位故障发生的位置及组件。但是在涉及到多组件同时发现故障场景中,目前还需要运维人员根据专家经验和故障涉及的交易明细一个个组件排查和定位,确定故障的根源组件并处置。这种排查步骤复杂且耗时长,在处理应急过程中不能够满足迅速定位故障根源并处置的运维要求。
发明内容
为了解决现有技术中存在的上述问题,本发明提供了一种在交易监控中确定故障根源的方法、系统、服务器及存储介质,实现自动化快速故障定位。
根据本发明的实施方式,提供了一种在交易监控中确定故障根源的方法,所述方法包括:获得故障告警信息,根据所述故障告警信息确定故障场景;获取与确定的故障场景对应的分析方法,并获取所述确定的故障场景中的全量交易明细;根据所述分析方法和所述全量交易明细获取直接根源对象;根据所述直接根源对象获取最终根源组件。
在本发明的一些实施方式中,所述故障场景包括:系统/业务成功率故障场景和平均响应/平均处理时间故障场景。
在本发明的一些实施方式中,若所述确定的故障场景为所述系统/业务成功率故障场景,所述根据所述分析方法和所述全量交易明细获取直接根源对象包括:按照所述全量交易明细中不同的字段将所述全量交易明细分成多个子组;对于每个所述子组,分别获取候补根源对象;分别判断所有所述候补根源对象是否满足预设条件,确定满足所述预设条件的所述候补根源对象为所述直接根源对象。
在本发明的一些实施方式中,所述不同的字段包括:部署单元字段、服务器ap(服务器主机)字段、接收方字段、发起方字段、错误码字段和交易码字段。
在本发明的一些实施方式中,所述对于每个所述子组,分别获取候补根源对象包括:遍历所述子组中的交易明细,获取系统/业务字段为失败的交易明细;按照所述交易明细的监控对象的不同,对所述系统/业务字段为失败的交易明细进行分组;将所述系统/业务字段为失败的交易明细的条数最多的监控对象作为候补根源对象。
在本发明的一些实施方式中,若所述确定的故障场景为所述平均响应/平均处理时间故障场景,所述根据所述分析方法和所述全量交易明细获取直接根源对象包括:判断所述故障告警信息是否为接收方告警信息;若是,则直接确定发出所述故障告警信息的接收方组件为直接根源对象,并结束本步骤;若不是,则遍历所述全量交易明细,获取平均响应/平均处理时间大于所述告警信息中平均响应/平均处理时间的交易明细;按照所述全量交易明细的接收方的不同,对所述平均响应/平均处理时间字段大于所述告警信息中平均响应/平均处理时间字段的交易明细进行分组;对比每个分组的交易量,获取其中所述交易量最多的分组作为候补根源对象;判断所述候补根源对象是否满足预设条件,若满足,确定所述候补根源对象为所述直接根源对象。
同时,本发明提供了一种在交易监控中确定故障根源的系统,所述系统包括:场景确定模块,用于获得故障告警信息,根据所述故障告警信息确定故障场景;数据获取模块,用于获取与确定的故障场景对应的分析方法,并获取所述确定的故障场景中的全量交易明细;分析模块,用于根据所述分析方法和所述全量交易明细获取直接根源对象;确定模块,用于根据所述直接根源对象获取最终根源组件。
在本发明的一些实施方式中,所述故障场景包括:系统/业务成功率故障场景和平均响应/平均处理时间故障场景。
在本发明的一些实施方式中,若所述确定的故障场景为所述系统/业务成功率故障场景,所述分析模块用于:按照所述全量交易明细中不同的字段将所述全量交易明细分成多个子组;对于每个所述子组,分别获取候补根源对象;分别判断所有所述候补根源对象是否满足预设条件,确定满足所述预设条件的所述候补根源对象为所述直接根源对象。
在本发明的一些实施方式中,所述不同的字段包括:部署单元字段、ap字段、接收方字段、发起方字段、错误码字段和交易码字段。
在本发明的一些实施方式中,所述对于每个所述子组,分别获取候补根源对象包括:遍历所述子组中的交易明细,获取系统/业务字段为失败的交易明细;按照所述交易明细的监控对象的不同,对所述系统/业务字段为失败的交易明细进行分组;将所述系统/业务字段为失败的交易明细的条数最多的监控对象作为候补根源对象。
在本发明的一些实施方式中,若所述确定的故障场景为所述平均响应/平均处理时间故障场景,所述分析模块用于:判断所述故障告警信息是否为接收方告警信息;若是,则直接确定发出所述故障告警信息的接收方组件为直接根源对象,并结束本步骤;若不是,则遍历所述全量交易明细,获取平均响应/平均处理时间大于所述告警信息中平均响应/平均处理时间的交易明细;按照所述全量交易明细的接收方的不同,对所述平均响应/平均处理时间字段大于所述告警信息中平均响应/平均处理时间字段的交易明细进行分组;对比每个分组的交易量,获取其中所述交易量最多的分组作为候补根源对象;判断所述候补根源对象是否满足预设条件,若满足,确定所述候补根源对象为所述直接根源对象。
此外,本发明实施方式提供了一种在交易监控中确定故障根源的装置,包括存储器和处理器,所述存储器用于存储一条或多条计算机可读指令;所述处理器用于执行所述一条或多条计算机可读指令从而实现前述任一项的方法。
本发明实施方式还提供了一种计算机存储介质,存储有一条或多条计算机程序,所述一条或多条计算机程序在执行时实现前述任一项的方法。
本发明基于交易明细数据自动计算故障原因,汇聚计算出导致故障发生可能性最高的监控对象及根源组件,将监控对象和根源组件信息补充到告警信息中,实现快速实现故障定位,帮助运维人员迅速完成根因排查和故障处置。同时,无需人工参与,在减少人力成本的同时提高了准确率。
附图说明
为了便于理解本发明,以下通过具体实施方式并结合附图对本发明进行具体说明。
图1是根据本发明一种实施方式的在交易监控中确定故障根源的方法的流程示意图;
图2是根据图1中确定的故障场景为系统/业务成功率故障场景时,根据分析方法和全量交易明细获取直接根源对象的流程示意图;
图3是根据图2中对于每个子组,分别获取候补根源对象的流程示意图;
图4是根据图1中确定的故障场景为平均响应/平均处理时间故障场景时,根据分析方法和全量交易明细获取直接根源对象的流程示意图;
图5是根据本发明一种实施方式的在交易监控中确定故障根源的系统的框图。
具体实施方式
以下结合附图和具体实施方式对本发明的各个方面进行详细阐述。其中,众所周知的模块、单元及其相互之间的连接、链接、通信或操作没有示出或未作详细说明。并且,所描述的特征、架构或功能可在一个或一个以上实施方式中以任何方式组合。本领域技术人员应当理解,下述的各种实施方式只用于举例说明,而非用于限制本发明的保护范围。还可以容易理解,本文所述和附图所示的各实施方式中的模块或单元或处理方式可以按各种不同配置进行组合和设计。
图1是根据本发明一种实施方式的在交易监控中确定故障根源的方法的流程示意图,在本发明的实施方式中,参照图1,该方法包括:
100:获得故障告警信息,根据故障告警信息确定故障场景;
101:获取与确定的故障场景对应的分析方法,并获取确定的故障场景中的全量交易明细;
102:根据分析方法和全量交易明细获取直接根源对象;
103:根据直接根源对象获取最终根源组件。
在本发明的实施方式中,故障场景包括系统/业务成功率故障场景和平均响应/平均处理时间故障场景。
在发生系统/业务成功率低的告警时,说明存在系统中发生了许多系统/业务失败的交易,可能有系统出现故障。在本发明的实施方式中,当确定的故障场景为系统/业务成功率故障场景时,通过以下方式实现处理102:
图2是在确定的故障场景为系统/业务成功率故障场景时,处理102的流程示意图,参照图2,处理102包括:
104:按照全量交易明细中不同的字段将全量交易明细分成多个子组;
105:对于每个子组,分别获取候补根源对象;
106:分别判断所有候补根源对象是否满足预设条件,确定满足预设条件的候补根源对象为直接根源对象。
具体的,在本发明的实施方式中,全量交易明细中不同的字段包括:部署单元字段、ap字段、接收方字段、发起方字段、错误码字段和交易码字段。
在本发明的实施方式中,给出了一种实现处理105的方式,如图3所示,处理105包括:
107:遍历子组中的交易明细,获取系统/业务字段为失败的交易明细;
108:按照交易明细的监控对象的不同,对系统/业务字段为失败的交易明细进行分组;
109:将系统/业务字段为失败的交易明细的条数最多的监控对象作为候补根源对象。
在发生平均响应/平均处理时间长的告警时,说明存在系统响应时间和处理时间过长,可能有系统出现故障。在本发明的实施方式中,当确定的故障场景为平均响应/平均处理时间故障场景时,通过以下方式实现处理102:
图4是在确定的故障场景为平均响应/平均处理时间故障场景时,处理102的流程示意图,参照图4,处理102包括:
110:判断所故障告警信息是否为接收方告警信息,若是,则执行处理111,若不是,则执行处理112;
111:直接确定发出故障告警信息的接收方组件为直接根源对象;
112:遍历全量交易明细,获取平均响应/平均处理时间大于告警信息中平均响应/平均处理时间的交易明细;
113:按照全量交易明细的接收方的不同,对平均响应/平均处理时间字段大于告警信息中平均响应/平均处理时间字段的交易明细进行分组;
114:对比每个分组的交易量,获取其中交易量最多的分组作为候补根源对象;
115:判断候补根源对象是否满足预设条件,若满足,则执行处理116;
116:确定候补根源对象为直接根源对象。
下面将结合具体例子对本实施方式所提供的在交易监控中确定故障根源的方法进行描述。
系统/业务成功率故障场景下:
获取该场景下的全量交易明细,按交易明细中的不同字段对该全量交易明细进行分组汇聚,不同字段包括交易明细中部署单元字段、ap字段、接收方字段、发起方字段、错误码字段和交易码字段。
交易明细中有系统/业务字段,这两个字段的值表明了这个交易明细是否系统/业务成功,当该值为失败时,则说明该交易明细系统/业务失败。
取出每个分组中的系统/业务字段为失败的交易明细的条数最多的监控对象作为候补根源对象,如果该监控对象的系统/业务失败笔数与总系统/业务失败笔数的比例超过第一阈值(例如,50%),则此监控对象为直接根源对象。如果所有监控对象都不满足条件,则选取每个分组中系统/业务字段为失败的交易明细的条数最多的2个监控对象,计算该2个监控对象系统/业务失败笔数之和占总系统/业务失败笔数的比例,并判断其是否超过第二阈值(例如,55%)。如果还不满足,则选取每个分组中系统/业务字段为失败的交易明细的条数最多的3个监控对象,计算该3个监控对象系统/业务失败笔数之和占总系统/业务失败笔数的比例,并判断其是否超过第三阈值(例如,60%)。在本发明的实施方式中,达到预设条件的监控对象均作为直接根源对象。
获取到直接根源对象后,首先判断该直接根源对象是否属于接收方分组,若属于,则判断该直接根源对象中的交易明细中是否存在esr(错误源)字段。
若存在esr字段,则将该直接根源对象中存在esr字段的交易明细筛选出来,根据esr字段值的不同进行分组,取其中交易量最高的一组,通过该分组对应ear字段值反查所属的组件,确定该组件即为最终根源组件。如果根据ear字段值无法反查出所属的组件,则确定发出告警的组件为最终根源组件。
若不存在ear字段,则获取该直接根源组件的所有系统/业务字段为失败的交易明细的全局事件跟踪号,查找符合这些全局事件跟踪号且系统/业务字段为失败且不是本系统的交易明细,按照全局事件跟踪号对查找出来的交易明细进行分组,取每个分组中开始时间最大的交易明细的组件计算其个数,确定个数值最大的组件为最终根源组件。
若该直接根源对象不属于接收方分组,再次判断其是否属于错误码分组,若属于,则直接将该直接根源对象的错误码、错误占比信息追加到告警信息中,发送给运维人员。
若该直接根源对象也不属于错误码分组,则取该直接根源对象的系统/业务字段为失败的所有交易明细数据,按错误码字段进行分组计算,取交易量最大的分组的错误码,将该错误码、错误占比信息追加到告警信息中,发送给运维人员。
平均响应/平均处理时间故障场景下:
判断故障告警信息是否为接收方告警信息。在本发明的实施方式中,交易明细具有接收方字段,该字段中列明了每笔交易在经过当前组件处理后下一步将会发往哪个组件处理。按照接收方维度对平均响应时间和平均处理时间进行统计,从而对是否发生了某一接收方的告警进行判断。
若故障告警信息为接收方告警信息,则直接确定发出该故障告警信息的接收方组件为直接根源对象。
若故障告警信息不是接收方告警信息,遍历该场景下的全量交易明细,筛选出该全量交易明细中的平均响应/平均处理时间大于告警信息中平均响应/平均处理时间的交易明细,按照交易明细的接收方不同对筛选出的交易明细进行分组。对于每个分组,统计其交易量,选取交易量最高的分组最为候补根源对象。
如果该候补根源对象对应的接收方的交易量与总平均响应/平均处理时间大于告警信息中平均响应/平均处理时间的交易量的比例超过第一阈值(例如,50%),则此候补根源对象为直接根源对象。如果不满足条件,则选取交易量最高的2个分组最为候补根源对象,计算该2个候补根源对象的交易量之和占总平均响应/平均处理时间大于告警信息中平均响应/平均处理时间的交易量的比例,并判断其是否超过第二阈值(例如,55%)。如果还不满足,则选取交易量最高的3个分组最为候补根源对象,计算该3个候补根源对象的交易量之和占总平均响应/平均处理时间大于告警信息中平均响应/平均处理时间的交易量的比例,并判断其是否超过第三阈值(例如,60%)。在本发明的实施方式中,达到预设条件的候补根源对象均作为直接根源对象。
获取到直接根源对象后,选取其对应的接收方组件在当前告警时间下的所有交易明细,筛选出所有平均响应/平均处理时间大于告警信息中平均响应/平均处理时间的交易明细。按筛选出的交易明细的全局事件跟踪号查询全局交易明细,筛选全局交易明细中开始时间大于本系统交易开始时间的记录,并按接收方组件进行分组。求出各分组的总响应/总处理时间,如果存在1个分组的总响应/总处理时间占告警信息中的总响应/总处理时间的50%,则该分组对应的接收方组件为最终根源组件。若不满足,则是否存在2个分组的总响应/总处理时间之和占告警信息中的总响应/总处理时间的55%。若还不满足,则是否存在3个分组的总响应/总处理时间之和占告警信息中的总响应/总处理时间的60%。在本发明的实施方式中,满足预设条件的分组对应的接收方组件均作为最终根源组件。
将确定的直接根源组件、最终根源组件、成因占比追加到告警信息中,发送给运维人员,辅助运维人员及早发现故障根源并处置。
本发明基于交易明细数据自动计算故障原因,汇聚计算出导致故障发生可能性最高的监控对象及根源组件,将监控对象和根源组件信息补充到告警信息中,实现快速实现故障定位,帮助运维人员迅速完成根因排查和故障处置。同时,无需人工参与,在减少人力成本的同时提高了准确率。
图5是根据本发明一种实施方式的在交易监控中确定故障根源的系统1的框图,参照图5,该系统1包括:场景确定模块11,用于获得故障告警信息,根据故障告警信息确定故障场景;数据获取模块12,用于获取与确定的故障场景对应的分析方法,并获取确定的故障场景中的全量交易明细;分析模块13,用于根据分析方法和全量交易明细获取直接根源对象;确定模块14,用于根据直接根源对象获取最终根源组件。
在本发明的实施方式中,故障场景包括系统/业务成功率故障场景和平均响应/平均处理时间故障场景。
在本发明的实施方式中,若确定的故障场景为系统/业务成功率故障场景,则分析模块13用于执行以下操作:
按照全量交易明细中不同的字段将全量交易明细分成多个子组;对于每个子组,分别获取候补根源对象;分别判断所有候补根源对象是否满足预设条件,确定满足预设条件的候补根源对象为直接根源对象。
在本发明的实施方式中,全量交易明细中不同的字段包括:部署单元字段、ap字段、接收方字段、发起方字段、错误码字段和交易码字段。
在本发明的实施方式中,对于每个子组,分别获取候补根源对象包括:遍历子组中的交易明细,获取系统/业务字段为失败的交易明细;按照交易明细的监控对象的不同,对系统/业务字段为失败的交易明细进行分组;将系统/业务字段为失败的交易明细的条数最多的监控对象作为候补根源对象。
在本发明的实施方式中,若确定的故障场景为平均响应/平均处理时间故障场景时,则分析模块13用于执行以下操作:
判断故障告警信息是否为接收方告警信息;若是,则直接确定发出故障告警信息的接收方组件为直接根源对象,并结束本步骤;若不是,则遍历全量交易明细,获取平均响应/平均处理时间大于所述告警信息中平均响应/平均处理时间的交易明细;按照全量交易明细的接收方的不同,对平均响应/平均处理时间字段大于所述告警信息中平均响应/平均处理时间字段的交易明细进行分组;对比每个分组的交易量,获取其中交易量最多的分组作为候补根源对象;判断该候补根源对象是否满足预设条件,若满足,确定该候补根源对象为直接根源对象
可选的,本发明实施方式提供了一种在交易监控中确定故障根源的装置,该装置包括存储器,用于存储一条或多条计算机可读指令;处理器,用于执行所述一条或多条计算机可读指令从而实现本发明前述实施方式或实现方式所提供的在交易监控中确定故障根源的方法。可选地,在本发明实施方式的一种实现方式中,所述装置还可以包括用于进行数据通信的输入输出接口。例如,所述装置可以是计算机、智能终端、服务器等。
本发明实施方式还提供了一种计算机存储介质,存储有一条或多条计算机程序,用于在执行时实现本发明前述实施方式或实现方式提供的在交易监控中确定故障根源的方法。例如,所述存储介质可以包括硬盘、软盘、光盘、磁带、磁盘、优盘、闪存等。
虽然本文举例描述了一些实施方式,但是,在不脱离本发明实质的前提下,可以对这些实施方式进行各种变形,所有这些变形仍属于本发明的构思,并且落入本发明权利要求所限定的保护范围。
本文所公开的具体实施方式仅用于举例说明本发明,对于本领域技术人员而言,显然可以根据本文的教导进行各种修改,可以采用各种等同的方式实施本发明,因此,本发明上述公开的特定的实施方式仅仅是示例性的,其保护范围不受在此公开的结构或设计的细节所限,除非在权利要求中另有说明。因此,上述公开的特定的示例性的实施方式可进行各种替换、组合或修改,其所有的变形都落入本文公开的范围内。在缺少本文没有具体公开的任何元件或缺少本文公开的任选的部件的情况下,本文示例性公开的在交易监控中确定故障根源的方法、系统、装置及存储介质仍可适当地实施。上述公开的所有的数值和范围也可进行一定变化。每当公开了具有下限和上限的数值范围,落入此范围内的任何数值及任何被包含的范围都被具体地公开了。具体而言,本文公开的数值的任一范围均可理解为列举了包含在较宽数值范围内的任一数值和范围。同样,除非申请人明确且清楚地另有定义,权利要求中的术语具有它们的清楚、通常的含义。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件结合硬件平台的方式来实现。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施方式或者实施方式的某些部分所述的方法。
此外,权利要求书中的部件的数量包括一个或至少一个,除非另有说明。如果本发明中的用词或术语与其它文献中的用法或含义存在不一致,则应当以与本发明所定义的为准。

Claims (14)

1.一种在交易监控中确定故障根源的方法,其特征在于,所述方法包括:
获得故障告警信息,根据所述故障告警信息确定故障场景;
获取与确定的故障场景对应的分析方法,并获取所述确定的故障场景中的全量交易明细;
根据所述分析方法和所述全量交易明细获取直接根源对象;
根据所述直接根源对象获取最终根源组件。
2.如权利要求1所述的方法,其特征在于,所述故障场景包括:
系统/业务成功率故障场景和平均响应/平均处理时间故障场景。
3.如权利要求2所述的方法,其特征在于,若所述确定的故障场景为所述系统/业务成功率故障场景,所述根据所述分析方法和所述全量交易明细获取直接根源对象包括:
按照所述全量交易明细中不同的字段将所述全量交易明细分成多个子组;
对于每个所述子组,分别获取候补根源对象;
分别判断所有所述候补根源对象是否满足预设条件,确定满足所述预设条件的所述候补根源对象为所述直接根源对象。
4.如权利要求3所述的方法,其特征在于,所述不同的字段包括:
部署单元字段、ap字段、接收方字段、发起方字段、错误码字段和交易码字段。
5.如权利要求3所述的方法,其特征在于,所述对于每个所述子组,分别获取候补根源对象包括:
遍历所述子组中的交易明细,获取系统/业务字段为失败的交易明细;
按照所述交易明细的监控对象的不同,对所述系统/业务字段为失败的交易明细进行分组;
将所述系统/业务字段为失败的交易明细的条数最多的监控对象作为候补根源对象。
6.如权利要求2所述的方法,其特征在于,若所述确定的故障场景为所述平均响应/平均处理时间故障场景,所述根据所述分析方法和所述全量交易明细获取直接根源对象包括:
判断所述故障告警信息是否为接收方告警信息;
若是,则直接确定发出所述故障告警信息的接收方组件为直接根源对象,并结束本步骤;
若不是,则遍历所述全量交易明细,获取平均响应/平均处理时间大于所述告警信息中平均响应/平均处理时间的交易明细;
按照所述全量交易明细的接收方的不同,对所述平均响应/平均处理时间字段大于所述告警信息中平均响应/平均处理时间字段的交易明细进行分组;
对比每个分组的交易量,获取其中所述交易量最多的分组作为候补根源对象;
判断所述候补根源对象是否满足预设条件,若满足,确定所述候补根源对象为所述直接根源对象。
7.一种在交易监控中确定故障根源的系统,其特征在于,所述系统包括:
场景确定模块,用于获得故障告警信息,根据所述故障告警信息确定故障场景;
数据获取模块,用于获取与确定的故障场景对应的分析方法,并获取所述确定的故障场景中的全量交易明细;
分析模块,用于根据所述分析方法和所述全量交易明细获取直接根源对象;
确定模块,用于根据所述直接根源对象获取最终根源组件。
8.如权利要求7所述的系统,其特征在于,所述故障场景包括:
系统/业务成功率故障场景和平均响应/平均处理时间故障场景。
9.如权利要求8所述的系统,其特征在于,若所述确定的故障场景为所述系统/业务成功率故障场景,所述分析模块用于:
按照所述全量交易明细中不同的字段将所述全量交易明细分成多个子组;
对于每个所述子组,分别获取候补根源对象;
分别判断所有所述候补根源对象是否满足预设条件,确定满足所述预设条件的所述候补根源对象为所述直接根源对象。
10.如权利要求9所述的系统,其特征在于,所述不同的字段包括:
部署单元字段、ap字段、接收方字段、发起方字段、错误码字段和交易码字段。
11.如权利要求9所述的系统,其特征在于,所述对于每个所述子组,分别获取候补根源对象包括:
遍历所述子组中的交易明细,获取系统/业务字段为失败的交易明细;
按照所述交易明细的监控对象的不同,对所述系统/业务字段为失败的交易明细进行分组;
将所述系统/业务字段为失败的交易明细的条数最多的监控对象作为候补根源对象。
12.如权利要求8所述的系统,其特征在于,若所述确定的故障场景为所述平均响应/平均处理时间故障场景,所述分析模块用于:
判断所述故障告警信息是否为接收方告警信息;
若是,则直接确定发出所述故障告警信息的接收方组件为直接根源对象,并结束本步骤;
若不是,则遍历所述全量交易明细,获取平均响应/平均处理时间大于所述告警信息中平均响应/平均处理时间的交易明细;
按照所述全量交易明细的接收方的不同,对所述平均响应/平均处理时间字段大于所述告警信息中平均响应/平均处理时间字段的交易明细进行分组;
对比每个分组的交易量,获取其中所述交易量最多的分组作为候补根源对象;
判断所述候补根源对象是否满足预设条件,若满足,确定所述候补根源对象为所述直接根源对象。
13.一种在交易监控中确定故障根源的装置,包括存储器和处理器,其特征在于,
所述存储器用于存储一条或多条计算机可读指令;
所述处理器用于执行所述一条或多条计算机可读指令以实现如权利要求1-6中任一项所述的方法。
14.一种计算机存储介质,存储有一条或多条计算机程序,其特征在于,所述一条或多条计算机程序在被处理器执行时实现如权利要求1-6中任一项所述的方法。
CN201911266149.3A 2019-12-11 2019-12-11 交易监控中确定故障根源的方法、系统、装置及存储介质 Active CN111192130B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911266149.3A CN111192130B (zh) 2019-12-11 2019-12-11 交易监控中确定故障根源的方法、系统、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911266149.3A CN111192130B (zh) 2019-12-11 2019-12-11 交易监控中确定故障根源的方法、系统、装置及存储介质

Publications (2)

Publication Number Publication Date
CN111192130A true CN111192130A (zh) 2020-05-22
CN111192130B CN111192130B (zh) 2023-11-17

Family

ID=70709181

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911266149.3A Active CN111192130B (zh) 2019-12-11 2019-12-11 交易监控中确定故障根源的方法、系统、装置及存储介质

Country Status (1)

Country Link
CN (1) CN111192130B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111796955A (zh) * 2020-05-28 2020-10-20 中国建设银行股份有限公司 故障根源定位方法、系统、装置及存储介质
CN112181699A (zh) * 2020-09-22 2021-01-05 建信金融科技有限责任公司 故障隔离的方法、装置和多层故障隔离系统
CN112416724A (zh) * 2020-12-04 2021-02-26 中国建设银行股份有限公司 告警处理方法、系统、计算机设备和存储介质
CN112433913A (zh) * 2020-11-23 2021-03-02 中国建设银行股份有限公司 交易路径生成方法、系统、计算机设备和存储介质
CN113282465A (zh) * 2021-06-17 2021-08-20 中国建设银行股份有限公司 一种故障定位方法、装置、电子设备及计算机存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102768639A (zh) * 2012-06-11 2012-11-07 北京奇虎科技有限公司 操作系统内核级错误定位方法及装置
CN105227384A (zh) * 2015-11-10 2016-01-06 中国建设银行股份有限公司 联机事务处理系统之间的交易方法及交易装置
CN105590245A (zh) * 2014-12-31 2016-05-18 中国银联股份有限公司 定位电子交易的故障成因的计算机实施方法和数据处理方法
CN107682173A (zh) * 2017-08-07 2018-02-09 上海天旦网络科技发展有限公司 基于交易模型的自动故障定位方法和系统
CN107992415A (zh) * 2017-11-28 2018-05-04 中国银联股份有限公司 一种交易系统的故障定位和分析方法及相关服务器
CN109697158A (zh) * 2019-01-16 2019-04-30 郑州云海信息技术有限公司 一种基于故障的日志分析方法与装置
CN109787817A (zh) * 2018-12-28 2019-05-21 武汉船舶通信研究所(中国船舶重工集团公司第七二二研究所) 网络故障诊断方法、装置和计算机可读存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102768639A (zh) * 2012-06-11 2012-11-07 北京奇虎科技有限公司 操作系统内核级错误定位方法及装置
CN105590245A (zh) * 2014-12-31 2016-05-18 中国银联股份有限公司 定位电子交易的故障成因的计算机实施方法和数据处理方法
CN105227384A (zh) * 2015-11-10 2016-01-06 中国建设银行股份有限公司 联机事务处理系统之间的交易方法及交易装置
CN107682173A (zh) * 2017-08-07 2018-02-09 上海天旦网络科技发展有限公司 基于交易模型的自动故障定位方法和系统
CN107992415A (zh) * 2017-11-28 2018-05-04 中国银联股份有限公司 一种交易系统的故障定位和分析方法及相关服务器
CN109787817A (zh) * 2018-12-28 2019-05-21 武汉船舶通信研究所(中国船舶重工集团公司第七二二研究所) 网络故障诊断方法、装置和计算机可读存储介质
CN109697158A (zh) * 2019-01-16 2019-04-30 郑州云海信息技术有限公司 一种基于故障的日志分析方法与装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111796955A (zh) * 2020-05-28 2020-10-20 中国建设银行股份有限公司 故障根源定位方法、系统、装置及存储介质
CN111796955B (zh) * 2020-05-28 2024-05-14 中国建设银行股份有限公司 故障根源定位方法、系统、装置及存储介质
CN112181699A (zh) * 2020-09-22 2021-01-05 建信金融科技有限责任公司 故障隔离的方法、装置和多层故障隔离系统
CN112181699B (zh) * 2020-09-22 2023-01-24 建信金融科技有限责任公司 故障隔离的方法、装置和多层故障隔离系统
CN112433913A (zh) * 2020-11-23 2021-03-02 中国建设银行股份有限公司 交易路径生成方法、系统、计算机设备和存储介质
CN112433913B (zh) * 2020-11-23 2024-04-09 中国建设银行股份有限公司 交易路径生成方法、系统、计算机设备和存储介质
CN112416724A (zh) * 2020-12-04 2021-02-26 中国建设银行股份有限公司 告警处理方法、系统、计算机设备和存储介质
CN112416724B (zh) * 2020-12-04 2024-05-07 中国建设银行股份有限公司 告警处理方法、系统、计算机设备和存储介质
CN113282465A (zh) * 2021-06-17 2021-08-20 中国建设银行股份有限公司 一种故障定位方法、装置、电子设备及计算机存储介质

Also Published As

Publication number Publication date
CN111192130B (zh) 2023-11-17

Similar Documents

Publication Publication Date Title
CN111192130B (zh) 交易监控中确定故障根源的方法、系统、装置及存储介质
CN109684179B (zh) 系统故障的预警方法、装置、设备及存储介质
KR102418969B1 (ko) 딥러닝 기반 통신망 장비의 장애 예측 시스템 및 방법
CN110704231A (zh) 一种故障处理方法及装置
CN111796955B (zh) 故障根源定位方法、系统、装置及存储介质
CN110784355B (zh) 一种故障识别方法及装置
CN105426290A (zh) 异常信息智能处理方法和系统
CN113190423B (zh) 业务数据的监控方法、装置及系统
CN111130912A (zh) 内容分发网络的异常定位方法、服务器及存储介质
CN114866396B (zh) 基于文本相似度的实现资源不准下网络故障定位的方法
CN112152833B (zh) 一种网络异常报警方法、装置及电子设备
US10805186B2 (en) Mobile communication network failure monitoring system and method
CN113656252B (zh) 故障定位方法、装置、电子设备以及存储介质
US9674065B2 (en) Method, apparatus and system for detecting network element load imbalance
CN113411209A (zh) 一种分布式的密码服务全链路检测系统及方法
CN110609761B (zh) 确定故障源的方法、装置、存储介质和电子设备
CN113807697B (zh) 基于告警关联的派单方法及装置
CN114640576B (zh) 用于宽带网络的无源接入设备的故障定位的方法和装置
CN106411612A (zh) 一种分布式系统告警分析方法及装置
CN112804070A (zh) 业务障碍定位方法、装置及设备
CN111277805B (zh) 一种针对olt上联链路crc错误的处理方法及装置
CN116107859B (zh) 容器故障预测方法、装置、电子设备及存储介质
CN114124758B (zh) 一种流量监控的方法和装置
CN117714264A (zh) 数据告警的发起方法及装置、存储介质、电子装置
CN117336155A (zh) 故障处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant