CN111526068A - 故障上报方法及终端 - Google Patents

故障上报方法及终端 Download PDF

Info

Publication number
CN111526068A
CN111526068A CN202010357908.3A CN202010357908A CN111526068A CN 111526068 A CN111526068 A CN 111526068A CN 202010357908 A CN202010357908 A CN 202010357908A CN 111526068 A CN111526068 A CN 111526068A
Authority
CN
China
Prior art keywords
fault
terminal
tracking identifier
service
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010357908.3A
Other languages
English (en)
Other versions
CN111526068B (zh
Inventor
张烽
张瑞荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN202010357908.3A priority Critical patent/CN111526068B/zh
Publication of CN111526068A publication Critical patent/CN111526068A/zh
Application granted granted Critical
Publication of CN111526068B publication Critical patent/CN111526068B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/06Generation of reports
    • H04L43/065Generation of reports related to network devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults

Abstract

本发明提出了一种故障上报方法及终端,该方法用于分布式业务系统中的第一终端,第一终端在执行分布式业务的过程中涉及第一关联信息,该方法包括:检测所述第一关联信息是否满足故障识别条件;在所述第一关联信息满足所述故障识别条件的情况下,为所述第一关联信息生成故障跟踪标识;将所述第一关联信息和所述故障跟踪标识上报至与所述分布式业务系统相关的指定位置;将所述故障跟踪标识传递至第二终端,所述第二终端为所述第一终端在所述分布式业务的业务流程中的下游终端。通过本发明的技术方案,可准确定位故障位置,并便捷获取全面的故障信息。

Description

故障上报方法及终端
【技术领域】
本发明涉及终端技术领域,尤其涉及一种故障上报方法及终端。
【背景技术】
随着现在家庭中智能设备越来越多,新的业务形式要求实现分布式业务,即一个业务涉及到多个终端的协同。如完成一次视频通话需要同时调用智能手机、智能音箱和智能电视,通过智能手机建立通话连接,通过智能音箱播放通话音频和通过智能电视实时显示智能通话的视频。在智能手机的单机系统中,可能发生与智能音箱或智能电视的连接失效、无法对来自智能音箱或智能电视的数据请求作出响应。一般地,这些故障的分析和解决依赖于检测到的故障事件、各类流水日志信息。因此,在分布式业务的进程中,任一终端可在单独检测到故障后,上报故障信息。
然而,终端单独上报的故障信息有限,故障处理方很难根据其上报的故障信息快速定位故障位置,这造成了故障定位效率低下的问题。其中,故障处理方可以是分布式业务系统中的任一终端,也可以是对分布式业务系统外设的、专门用于定位和处理故障的其他终端。
因此,如何提升故障定位效率,成为目前亟待解决的技术问题。
【发明内容】
本发明实施例提供了一种故障上报方法及终端,旨在解决相关技术中故障定位效率低下的技术问题。
第一方面,本发明实施例提供了一种故障上报方法,用于分布式业务系统中的第一终端,第一终端在执行分布式业务的过程中涉及第一关联信息,该方法包括:检测第一关联信息是否满足故障识别条件;接着,在第一关联信息满足故障识别条件的情况下,为第一关联信息生成故障跟踪标识;然后,将第一关联信息和故障跟踪标识上报至与分布式业务系统相关的指定位置;最终,将故障跟踪标识传递至第二终端,第二终端为第一终端在分布式业务的业务流程中的下游终端。
由此,可准确定位故障位置,在指定位置获取全面的故障信息,有助于故障处理方对故障进行全面有效的处理。
在一种可能的设计中,在检测第一关联信息是否满足故障识别条件之前,还包括:将第一关联信息和分布式业务的业务跟踪标识关联缓存至本地,其中,业务跟踪标识是由分布式业务流程中执行分布式业务的首个终端设置的,用于唯一标识分布式业务;为第一关联信息生成故障跟踪标识之后,该方法还包括:在缓存至本地的业务跟踪标识中增加与第一关联信息对应的故障跟踪标识;然后,将第一关联信息和故障跟踪标识上报至与分布式业务系统相关的指定位置,包括:将第一关联信息和增加有故障跟踪标识的业务跟踪标识上报至与分布式业务系统相关的指定位置;以及故障跟踪标识传递至第二终端,包括:将增加有故障跟踪标识的业务跟踪标识传递至第二终端。
在一种可能的设计中,为第一关联信息生成故障跟踪标识之后、将第一关联信息和故障跟踪标识上报至与分布式业务系统相关的指定位置之前,该方法还包括:在业务跟踪标识中增加与第一关联信息对应的故障跟踪标识,业务跟踪标识是由分布式业务流程中执行分布式业务的首个终端设置的,用于唯一标识分布式业务;接着,将第一关联信息和增加有故障跟踪标识的业务跟踪标识关联缓存至本地;另外,将第一关联信息和故障跟踪标识上报至与分布式业务系统相关的指定位置,包括:将第一关联信息和增加有故障跟踪标识的业务跟踪标识上报至与分布式业务系统相关的指定位置;将故障跟踪标识传递至第二终端,包括:将增加有故障跟踪标识的业务跟踪标识传递至第二终端。
在本申请中,上报故障信息和缓存故障信息的顺序不受限制。其中,业务跟踪标识可用于区分不同的分布式业务,便于故障处理方有效区分不同分布式业务的故障信息。缓存在本地的第一关联信息和分布式业务的业务跟踪标识,可作为故障检测方处理分布式业务的故障时的备份信息。如在后续步骤中,终端上传至指定位置的、用于故障处理的关联信息丢失,则可获取该终端缓存至本地的关联信息,作为备份使用。
在一种可能的设计中,将故障跟踪标识传递至第二终端之前,该方法还包括:判断第一终端在分布式业务的业务流程中是否处于末端,其中,若判断结果为第一终端在分布式业务的业务流程中未处于末端,将故障跟踪标识传递至第一终端在分布式业务的业务流程中的下游终端。
将故障跟踪标识从发生故障的第一终端传递至第一终端在分布式业务的业务流程中的所有下游终端,可使得与故障相关的终端均上传故障信息至指定位置,从而获取全面的故障信息。
在一种可能的设计中,第一关联信息包括故障点位置信息,故障点位置信息用于指示故障发生的位置。
由此,基于第一关联信息可便捷定位故障位置,有助于快速处理故障。
在一种可能的设计中,故障跟踪标识为64位随机数、128位随机数或字符串。
标识内容统一的故障跟踪标识有助于故障处理方快速准确地在故障位置识别其,并依据其调取故障信息。
第二方面,本发明实施例提供了一种故障上报方法,用于分布式业务系统中的第二终端,第二终端在执行分布式业务的过程中涉及第二关联信息,该方法包括:首先,得第一故障跟踪标识,第一故障跟踪标识来自第二终端在分布式业务系统中的上游终端;接着,将第二关联信息和第一故障跟踪标识上报至与分布式业务系统相关的指定位置;最终,将第一故障跟踪标识传递至下游终端,下游终端为分布式业务的业务流程中位于第二终端下游的终端。
其中,下游终端在接收到自身的上游终端传递的第一故障跟踪标识后,也会上报自身的故障信息至指定位置,指定位置由此可获取全面的故障信息,有助于故障处理方对故障进行全面有效的处理。
在一种可能的设计中,获得故障跟踪标识之前,该方法还包括:接收分布式业务的业务跟踪标识,其中,业务跟踪标识来自第二终端在分布式业务系统中的上游终端,是由分布式业务流程中执行分布式业务的首个终端设置的,用于唯一标识分布式业务;那么,获得第一故障跟踪标识,包括:在业务跟踪标识中确认第一故障跟踪标识;另外,将第二关联信息和第一故障跟踪标识上报至与分布式业务系统相关的指定位置,包括:将第二关联信息和具有第一故障跟踪标识的业务跟踪标识上报至与分布式业务系统相关的指定位置;将第一故障跟踪标识传递至下游终端,包括:将具有第一故障跟踪标识的业务跟踪标识传递至下游终端。
业务跟踪标识可用于区分不同的分布式业务,便于故障处理方有效区分不同分布式业务的故障信息。
在一种可能的设计中,该方法还包括:在获得第一故障跟踪标识之前,将第二关联信息和业务跟踪标识缓存至本地;或者在获得第一故障跟踪标识之后,在将第二关联信息和第一故障跟踪标识上报至与分布式业务系统相关的指定位置之前,将第二关联信息和业务跟踪标识缓存至本地;或者,在将第二关联信息和第一故障跟踪标识上报至与分布式业务系统相关的指定位置之后,将第一故障跟踪标识传递至下游终端之前,将第二关联信息和业务跟踪标识缓存至本地;或者,在将第一故障跟踪标识传递至下游终端之后,将第二关联信息和业务跟踪标识缓存至本地。
缓存在本地的第一关联信息和分布式业务的业务跟踪标识,可作为故障检测方处理分布式业务的故障时的备份信息。如在后续步骤中,终端上传至指定位置的、用于故障处理的关联信息丢失,则可获取该终端缓存至本地的关联信息,作为备份使用。
在一种可能的设计中,在将第二关联信息和第一故障跟踪标识上报至与分布式业务系统相关的指定位置之后,该方法还包括;检测第二关联信息是否满足故障识别条件;在第二关联信息满足故障识别条件的情况下,为第二关联信息生成第二故障跟踪标识;将第二故障跟踪标识上报至指定位置,所述将所述第一故障跟踪标识传递至下游终端,包括:将所述第一故障跟踪标识和所述第二故障跟踪标识传递至所述下游终端;在所述第二关联信息未满足所述故障识别条件的情况下,将所述第一故障跟踪标识传递至下游终端。
因下游终端也具有发生故障的可能性,故在第二终端也需要进行故障检测,以及时发现故障。若其发生故障,则生成第二故障跟踪标识,并将第二故障跟踪标识也上报至所述指定位置,并将其与第一故障跟踪标识一起传递至下游终端。由此,可准确定位任一终端发生故障的位置,在指定位置获取所有故障的全面故障信息,有助于故障处理方对故障进行全面有效的处理。
在一种可能的设计中,在业务跟踪标识中确认第一故障跟踪标识之后,该方法还包括:检测第二关联信息是否满足故障识别条件;其中,在第二关联信息满足故障识别条件的情况下,为第二关联信息生成第二故障跟踪标识,并将第二故障跟踪标识增加至具有第一故障跟踪标识的业务跟踪标识中;另外,将第二关联信息和具有第一故障跟踪标识的业务跟踪标识上报至与分布式业务系统相关的指定位置,包括:将第二关联信息和具有第一故障跟踪标识和第二故障跟踪标识的业务跟踪标识上报至指定位置;以及将具有第一故障跟踪标识的业务跟踪标识传递至下游终端,包括:将具有第一故障跟踪标识和第二故障跟踪标识的业务跟踪标识传递至下游终端。
业务跟踪标识可用于区分不同的分布式业务,便于故障处理方有效区分不同分布式业务的故障信息。
在一种可能的设计中,在将故障跟踪标识传递至下游终端的步骤之前,还包括:判断第二终端在分布式业务的业务流程中是否处于末端,其中,在判断结果为第二终端在分布式业务的业务流程中未处于末端的情况下,可允许将故障跟踪标识传递至第二终端在分布式业务的业务流程中的下游终端。
将故障跟踪标识从发生故障的第一终端传递至第一终端在分布式业务的业务流程中的所有下游终端,可使得与故障相关的终端均上传故障信息至指定位置,从而获取全面的故障信息。
在一种可能的设计中,第二关联信息包括故障点位置信息,故障点位置信息用于指示故障发生的位置。
由此,基于第二关联信息可便捷定位故障位置,有助于快速处理故障。
在一种可能的设计中,第一故障跟踪标识和第二故障跟踪标识为64位随机数、128位随机数或字符串。
标识内容统一的故障跟踪标识有助于故障处理方快速准确地在故障位置识别其,并依据其调取故障信息。
第三方面,本发明实施例提供了一种故障上报装置,用于分布式业务系统中的第一终端,第一终端在执行分布式业务的过程中涉及第一关联信息,该故障上报装置包括:故障检测单元,用于检测第一关联信息是否满足故障识别条件;故障标识生成单元,用于在第一关联信息满足故障识别条件的情况下,为第一关联信息生成故障跟踪标识,其中,当第一关联信息为多个时,为多个第一关联信息分别生成对应的故障跟踪标识;故障信息上报单元,用于将第一关联信息和故障跟踪标识上报至与分布式业务系统相关的指定位置;故障标识传递单元,用于将故障跟踪标识传递至第二终端,第二终端为第一终端在分布式业务的业务流程中的下游终端。
由此,可准确定位故障位置,在指定位置获取全面的故障信息,有助于故障处理方对故障进行全面有效的处理。
在一种可能的设计中,故障上报装置还包括:第一缓存单元,用于在故障检测单元检测第一关联信息是否满足故障识别条件之前,将第一关联信息和分布式业务的业务跟踪标识关联缓存至本地,业务跟踪标识是由分布式业务流程中执行分布式业务的首个终端设置的,用于唯一标识分布式业务;第一故障标识增加单元,用于故障标识生成单元为第一关联信息生成故障跟踪标识之后,在缓存至本地的业务跟踪标识中增加与第一关联信息对应的故障跟踪标识;故障信息上报单元用于:将第一关联信息和增加有故障跟踪标识的业务跟踪标识上报至与分布式业务系统相关的指定位置;故障标识传递单元用于:将增加有故障跟踪标识的业务跟踪标识传递至第二终端。
在一种可能的设计中,故障上报装置还包括:第二故障标识增加单元,用于故障标识生成单元为第一关联信息生成故障跟踪标识之后、故障信息上报单元将第一关联信息和故障跟踪标识上报至与分布式业务系统相关的指定位置之前,在业务跟踪标识中增加与第一关联信息对应的故障跟踪标识,业务跟踪标识是由分布式业务流程中执行分布式业务的首个终端设置的,用于唯一标识分布式业务;第二缓存单元,用于将第一关联信息和增加有故障跟踪标识的业务跟踪标识关联缓存至本地;故障信息上报单元用于:将第一关联信息和增加有故障跟踪标识的业务跟踪标识上报至与分布式业务系统相关的指定位置;故障标识传递单元用于:将增加有故障跟踪标识的业务跟踪标识传递至第二终端。
在本申请中,上报故障信息和缓存故障信息的顺序不受限制。其中,业务跟踪标识可用于区分不同的分布式业务,便于故障处理方有效区分不同分布式业务的故障信息。缓存在本地的第一关联信息和分布式业务的业务跟踪标识,可作为故障检测方处理分布式业务的故障时的备份信息。如在后续步骤中,终端上传至指定位置的、用于故障处理的关联信息丢失,则可获取该终端缓存至本地的关联信息,作为备份使用。
在一种可能的设计中,故障上报装置还包括:故障位置判断单元,用于故障标识传递单元将故障跟踪标识传递至第二终端之前,判断第一终端在分布式业务的业务流程中是否处于末端;故障标识传递单元用于:在判断结果为第一终端在分布式业务的业务流程中未处于末端的情况下,将故障跟踪标识传递至第一终端在分布式业务的业务流程中的下游终端。
将故障跟踪标识从发生故障的第一终端传递至第一终端在分布式业务的业务流程中的所有下游终端,可使得与故障相关的终端均上传故障信息至指定位置,从而获取全面的故障信息。
在一种可能的设计中,第一关联信息包括故障点位置信息,故障点位置信息用于指示故障发生的位置。
由此,基于第一关联信息可便捷定位故障位置,有助于快速处理故障。
在一种可能的设计中,故障跟踪标识为64位随机数、128位随机数或字符串。
标识内容统一的故障跟踪标识有助于故障处理方快速准确地在故障位置识别其,并依据其调取故障信息。
第四方面,本发明实施例提供了一种故障上报装置,用于分布式业务系统中的第二终端,第二终端在执行分布式业务的过程中涉及第二关联信息,该故障上报装置包括:故障标识获得单元,用于获得第一故障跟踪标识,第一故障跟踪标识来自第二终端在分布式业务系统中的上游终端;故障信息上报单元,用于将第二关联信息和第一故障跟踪标识上报至与分布式业务系统相关的指定位置;故障标识传递单元,用于将第一故障跟踪标识传递至下游终端,下游终端为分布式业务的业务流程中位于第二终端下游的终端。
其中,下游终端在接收到自身的上游终端传递的第一故障跟踪标识后,也会上报自身的故障信息至指定位置,指定位置由此可获取全面的故障信息,有助于故障处理方对故障进行全面有效的处理。
在一种可能的设计中,故障上报装置还包括:业务标识接收单元,用于在故障标识获得单元获得故障跟踪标识之前,接收分布式业务的业务跟踪标识,业务跟踪标识来自第二终端在分布式业务系统中的上游终端,是由分布式业务流程中执行分布式业务的首个终端设置的,用于唯一标识分布式业务;故障标识获得单元用于:在业务跟踪标识中确认第一故障跟踪标识;故障信息上报单元用于:将第二关联信息和具有第一故障跟踪标识的业务跟踪标识上报至与分布式业务系统相关的指定位置;故障标识传递单元用于:将具有第一故障跟踪标识的业务跟踪标识传递至下游终端。
业务跟踪标识可用于区分不同的分布式业务,便于故障处理方有效区分不同分布式业务的故障信息。
在一种可能的设计中,故障上报装置还包括:故障信息缓存单元,用于在故障标识获得单元获得第一故障跟踪标识之前,将第二关联信息和业务跟踪标识缓存至本地;或者在获得第一故障跟踪标识之后,在将第二关联信息和第一故障跟踪标识上报至与分布式业务系统相关的指定位置之前,将第二关联信息和业务跟踪标识缓存至本地;或者,在将第二关联信息和第一故障跟踪标识上报至与分布式业务系统相关的指定位置之后,将第一故障跟踪标识传递至下游终端之前,将第二关联信息和业务跟踪标识缓存至本地;或者,在将第一故障跟踪标识传递至下游终端之后,将第二关联信息和业务跟踪标识缓存至本地。
缓存在本地的第一关联信息和分布式业务的业务跟踪标识,可作为故障检测方处理分布式业务的故障时的备份信息。如在后续步骤中,终端上传至指定位置的、用于故障处理的关联信息丢失,则可获取该终端缓存至本地的关联信息,作为备份使用。
在一种可能的设计中,故障上报装置还包括:第一故障检测单元,用于在故障信息上报单元将第二关联信息和第一故障跟踪标识上报至与分布式业务系统相关的指定位置之后,检测第二关联信息是否满足故障识别条件;第一故障标识生成单元,用于在第二关联信息满足故障识别条件的情况下,为第二关联信息生成第二故障跟踪标识;故障信息上报单元还用于:将第二故障跟踪标识上报至指定位置;故障标识传递单元用于:将所述第一故障跟踪标识和所述第二故障跟踪标识传递至所述下游终端;故障标识传递单元还用于:在第二关联信息未满足故障识别条件的情况下,将第一故障跟踪标识传递至下游终端。
因下游终端也具有发生故障的可能性,故在第二终端也需要进行故障检测,以及时发现故障。若其发生故障,则生成第二故障跟踪标识,并将第二故障跟踪标识也上报至所述指定位置,并将其与第一故障跟踪标识一起传递至下游终端。由此,可准确定位任一终端发生故障的位置,在指定位置获取所有故障的全面故障信息,有助于故障处理方对故障进行全面有效的处理。
在一种可能的设计中,故障上报装置还包括:第二故障检测单元,用于在故障标识获得单元在业务跟踪标识中确认第一故障跟踪标识之后,检测第二关联信息是否满足故障识别条件;第二故障标识生成单元,用于在第二关联信息满足故障识别条件的情况下,为第二关联信息生成第二故障跟踪标识,并将第二故障跟踪标识增加至具有第一故障跟踪标识的业务跟踪标识中;故障信息上报单元还用于:将第二关联信息和具有第一故障跟踪标识和第二故障跟踪标识的业务跟踪标识上报至指定位置;故障标识传递单元还用于:将具有第一故障跟踪标识和第二故障跟踪标识的业务跟踪标识传递至下游终端。
业务跟踪标识可用于区分不同的分布式业务,便于故障处理方有效区分不同分布式业务的故障信息。
在一种可能的设计中,故障上报装置还包括:终端位置判断单元,用于在故障标识传递单元将故障跟踪标识传递至下游终端之前,还包括:判断第二终端在分布式业务的业务流程中是否处于末端,其中,在判断结果为第二终端在分布式业务的业务流程中未处于末端的情况下,允许将故障跟踪标识传递至第二终端在分布式业务的业务流程中的下游终端。
将故障跟踪标识从发生故障的第一终端传递至第一终端在分布式业务的业务流程中的所有下游终端,可使得与故障相关的终端均上传故障信息至指定位置,从而获取全面的故障信息。
在一种可能的设计中,第二关联信息包括故障点位置信息,故障点位置信息用于指示故障发生的位置。
由此,基于第二关联信息可便捷定位故障位置,有助于快速处理故障。
在一种可能的设计中,第一故障跟踪标识和第二故障跟踪标识为64位随机数、128位随机数或字符串。
标识内容统一的故障跟踪标识有助于故障处理方快速准确地在故障位置识别其,并依据其调取故障信息。
第五方面,本发明实施例提供了一种终端,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行上述第一方面和第二方面中任一项所述的方法。
第六方面,本发明实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行上述第一方面和第二方面中任一项所述的方法流程。
第七方面,本发明实施例提供了一种计算机程序产品,当计算机程序产品在终端上运行时,使得终端执行上述第一方面和第二方面中任一项所述的方法流程。
通过以上技术方案,可准确定位故障位置,并便捷获取全面的故障信息。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1示出了本申请所涉及到的终端的结构示意图;
图2示出了相关技术中分布式业务进行故障上报的示意图;
图3示出了本发明实施例提供的分布式业务系统中第一终端进行故障上报的流程图;
图4示出了本发明实施例提供的分布式业务系统中第二终端进行故障上报的流程图;
图5示出了本发明实施例提供的分布式业务系统的工作原理图;
图6示出了本发明另一实施例提供的分布式业务系统的工作原理图;
图7示出了本发明实施例提供的分布式业务系统中第一终端进行故障上报的流程图;
图8示出了本发明实施例提供的分布式业务系统中第二终端进行故障上报的流程图;
图9示出了本发明再一实施例提供的分布式业务系统的工作原理图;
图10示出了本发明又一实施例提供的分布式业务系统的工作原理图;
图11示出了本发明实施例提供的故障上报装置的框图;
图12示出了本发明实施例提供的故障上报装置的框图。
【具体实施方式】
为了便于理解,示例地给出了部分与本申请实施例相关概念的说明以供参考。
以下,结合附图对本实施例的实施方式进行详细描述。其中,在本申请实施例的描述中,除非另有说明,“/”表示或的意思,例如,A/B可以表示A或B;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,在本申请实施例的描述中,“多个”是指两个或多于两个。
本申请所提供的技术方案应用于终端,该终端手机、平板电脑、可穿戴设备、车载设备、增强现实(augmented reality,AR)/虚拟现实(virtual reality,VR)设备、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)等任意具有操作系统的终端上,本申请实施例对此不作任何限制。
图1示出了本申请所涉及到的终端的结构示意图。
如图1所示,终端可以包括处理器110,外部存储器接口120,内部存储器121,通用串行总线(universal serial bus,USB)接口130,充电管理模块140,电源管理模块141,电池142,天线1,天线2,移动通信模块150,无线通信模块160,音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,传感器180,按键190,马达191,指示器192,摄像头193,显示屏194,以及用户标识模块(subscriber identification module,SIM)卡接口195等。可以理解的是,本实施例示意的结构并不构成对终端的具体限定。在本申请另一些实施例中,终端可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。例如,当终端为智能电视时,智能电视无需设置SIM卡接口195、摄像头193、按键190、受话器170B、麦克风170C、耳机接口170D中的一个或多个。图示的部件可以以硬件,软件,或软件和硬件的组合实现。
处理器110可以包括一个或多个处理单元,例如:处理器110可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processingunit,GPU),图像信号处理器(image signal processor,ISP),控制器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。在一些实施例中,终端也可以包括一个或多个处理器110。其中,控制器可以是终端的神经中枢和指挥中心。控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。处理器110中还可以设置存储器,用于存储指令和数据。在一些实施例中,处理器110中的存储器为高速缓冲存储器。该存储器可以保存处理器110刚用过或循环使用的指令或数据。如果处理器110需要再次使用该指令或数据,可从所述存储器中直接调用。这就避免了重复存取,减少了处理器110的等待时间,因而提高了终端的效率。
在一些实施例中,处理器110可以包括一个或多个接口。接口可以包括集成电路(inter-integrated circuit,I2C)接口,集成电路内置音频(inter-integrated circuitsound,I2S)接口,脉冲编码调制(pulse code modulation,PCM)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,UART)接口,移动产业处理器接口(mobile industry processor interface,MIPI),通用输入输出(general-purposeinput/output,GPIO)接口,用户标识模块(subscriber identity module,SIM)接口,和/或通用串行总线(universal serial bus,USB)接口等。其中,USB接口130是符合USB标准规范的接口,具体可以是Mini USB接口,Micro USB接口,USB Type C接口等。USB接口130可以用于连接充电器为终端充电,也可以用于终端与外围设备之间传输数据,也可以用于连接耳机,通过耳机播放音频。
可以理解的是,本发明实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对终端的结构限定。在本申请另一些实施例中,终端也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
充电管理模块140用于从充电器接收充电输入。其中,充电器可以是无线充电器,也可以是有线充电器。在一些有线充电的实施例中,充电管理模块140可以通过USB接口130接收有线充电器的充电输入。在一些无线充电的实施例中,充电管理模块140可以通过终端的无线充电线圈接收无线充电输入。充电管理模块140为电池142充电的同时,还可以通过电源管理模块141为终端供电。
电源管理模块141用于连接电池142,充电管理模块140与处理器110。电源管理模块141接收电池142和/或充电管理模块140的输入,为处理器110,内部存储器121,显示屏194,摄像头193,和无线通信模块160等供电。电源管理模块141还可以用于监测电池容量,电池循环次数,电池健康状态(漏电,阻抗)等参数。在其他一些实施例中,电源管理模块141也可以设置于处理器110中。在另一些实施例中,电源管理模块141和充电管理模块140也可以设置于同一个器件中。
终端的无线通信功能可以通过天线1,天线2,移动通信模块150,无线通信模块160,调制解调处理器以及基带处理器等实现。天线1和天线2用于发射和接收电磁波信号。终端中的每个天线可用于覆盖单个或多个通信频带。不同的天线还可以复用,以提高天线的利用率。例如:可以将天线1复用为无线局域网的分集天线。在另外一些实施例中,天线可以和调谐开关结合使用。
移动通信模块150可以提供应用在终端上的包括2G/3G/4G/5G等无线通信的解决方案。移动通信模块150可以包括至少一个滤波器,开关,功率放大器,低噪声放大器等。移动通信模块150可以由天线1接收电磁波,并对接收的电磁波进行滤波,放大等处理,传送至调制解调处理器进行解调。移动通信模块150还可以对经调制解调处理器调制后的信号放大,经天线1转为电磁波辐射出去。在一些实施例中,移动通信模块150的至少部分功能模块可以被设置于处理器110中。在一些实施例中,移动通信模块150的至少部分功能模块可以与处理器110的至少部分模块被设置在同一个器件中。
调制解调处理器可以包括调制器和解调器。其中,调制器用于将待发送的低频基带信号调制成中高频信号。解调器用于将接收的电磁波信号解调为低频基带信号。随后解调器将解调得到的低频基带信号传送至基带处理器处理。低频基带信号经基带处理器处理后,被传递给应用处理器。应用处理器通过音频设备(不限于扬声器170A,受话器170B等)输出声音信号,或通过显示屏194显示图像或视频。在一些实施例中,调制解调处理器可以是独立的器件。在另一些实施例中,调制解调处理器可以独立于处理器110,与移动通信模块150或其他功能模块设置在同一个器件中。
无线通信模块160可以提供应用在终端上的包括无线局域网(wireless localareanetworks,WLAN),蓝牙,全球导航卫星系统(global navigation satellite system,GNSS),调频(frequency modulation,FM),NFC,红外技术(infrared,IR)等无线通信的解决方案。无线通信模块160可以是集成至少一个通信处理模块的一个或多个器件。无线通信模块160经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器110。无线通信模块160还可以从处理器110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
在一些实施例中,终端的天线1和移动通信模块150耦合,天线2和无线通信模块160耦合,使得终端可以通过无线通信技术与网络以及其他设备通信。所述无线通信技术可以包括GSM,GPRS,CDMA,WCDMA,TD-SCDMA,LTE,GNSS,WLAN,NFC,FM,和/或IR技术等。上述GNSS可以包括全球卫星定位系统(global positioning system,GPS),全球导航卫星系统(global navigation satellite system,GLONASS),北斗卫星导航系统(beidounavigation satellite system,BDS),准天顶卫星系统(quasi-zenith satellitesystem,QZSS)和/或星基增强系统(satellite based augmentation systems,SBAS)。
终端通过GPU,显示屏194,以及应用处理器等可以实现显示功能。GPU为图像处理的微处理器,连接显示屏194和应用处理器。GPU用于执行数学和几何计算,用于图形渲染。处理器110可包括一个或多个GPU,其执行指令以生成或改变显示信息。
显示屏194用于显示图像,视频等。显示屏194包括显示面板。显示面板可以采用液晶显示屏(liquid crystal display,LCD),有机发光二极管(organic light-emittingdiode,OLED),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrixorganic light emitting diode的,AMOLED),柔性发光二极管(flex light-emittingdiode,FLED),Miniled,MicroLed,Micro-oLed,量子点发光二极管(quantum dot lightemitting diodes,QLED)等。在一些实施例中,终端可以包括1个或N个显示屏194,N为大于1的正整数。
终端可以通过ISP,摄像头193,视频编解码器,GPU,一个或多个显示屏194以及应用处理器等实现拍摄功能。
ISP用于处理摄像头193反馈的数据。例如,拍照时,打开快门,光线通过镜头被传递到摄像头感光元件上,光信号转换为电信号,摄像头感光元件将所述电信号传递给ISP处理,转化为肉眼可见的图像。ISP还可以对图像的噪点,亮度,肤色进行算法优化。ISP还可以对拍摄场景的曝光、色温等参数优化。在一些实施例中,ISP可以设置在摄像头193中。
摄像头193用于捕获静态图像或视频。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给ISP转换成数字图像信号。ISP将数字图像信号输出到DSP加工处理。DSP将数字图像信号转换成标准的RGB,YUV等格式的图像信号。在一些实施例中,终端100可以包括1个或N个摄像头193,N为大于1的正整数。
数字信号处理器用于处理数字信号,除了可以处理数字图像信号,还可以处理其他数字信号。例如,当终端100在频点选择时,数字信号处理器用于对频点能量进行傅里叶变换等。
视频编解码器用于对数字视频压缩或解压缩。终端100可以支持一种或多种视频编解码器。这样,终端100可以播放或录制多种编码格式的视频,例如:动态图像专家组(movingpicture experts group,MPEG)1,MPEG2,MPEG3,MPEG4等。
NPU为神经网络(neural-network,NN)计算处理器,通过借鉴生物神经网络结构,例如借鉴人脑神经元之间传递模式,对输入信息快速处理,还可以不断的自学习。通过NPU可以实现终端的智能认知等应用,例如:图像识别,人脸识别,语音识别,文本理解等。
外部存储器接口120可以用于连接外部存储卡,例如Micro SD卡,实现扩展终端的存储能力。外部存储卡通过外部存储器接口120与处理器110通信,实现数据存储功能。例如将音乐、照片、视频等数据文件保存在外部存储卡中。
内部存储器121可以用于存储一个或多个计算机程序,该一个或多个计算机程序包括指令。处理器110可以通过运行存储在内部存储器121的上述指令,从而使得终端执行本申请一些实施例中所提供的语音切换方法,以及各种功能应用以及数据处理等。内部存储器121可以包括存储程序区和存储数据区。其中,存储程序区可存储操作系统;该存储程序区还可以存储一个或多个应用程序(比如图库、联系人等)等。存储数据区可存储终端使用过程中所创建的数据(比如照片,联系人等)等。此外,内部存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,UFS)等。在一些实施例中,处理器110可以通过运行存储在内部存储器121的指令,和/或存储在设置于处理器110中的存储器的指令,来使得终端执行本申请实施例中所提供的语音切换方法,以及各种功能应用及数据处理。
终端可以通过音频模块170,扬声器170A,受话器170B,麦克风170C,耳机接口170D,以及应用处理器等实现音频功能。例如音乐播放,录音等。其中,音频模块170用于将数字音频信息转换成模拟音频信号输出,也用于将模拟音频输入转换为数字音频信号。音频模块170还可以用于对音频信号编码和解码。在一些实施例中,音频模块170可以设置于处理器110中,或将音频模块170的部分功能模块设置于处理器110中。
扬声器170A,也称“喇叭”,用于将音频电信号转换为声音信号。终端可以通过扬声器170A收听音乐,或收听免提通话。
受话器170B,也称“听筒”,用于将音频电信号转换成声音信号。当终端接听电话或语音信息时,可以通过将受话器170B靠近人耳接听语音。
麦克风170C,也称“话筒”,“传声器”,用于将声音信号转换为电信号。当拨打电话或发送语音信息时,用户可以通过人嘴靠近麦克风170C发声,将声音信号输入到麦克风170C。终端可以设置至少一个麦克风170C。在另一些实施例中,终端可以设置两个麦克风170C,除了采集声音信号,还可以实现降噪功能。在另一些实施例中,终端还可以设置三个,四个或更多麦克风170C,实现采集声音信号,降噪,还可以识别声音来源,实现定向录音功能等。
耳机接口170D用于连接有线耳机。耳机接口170D可以是USB接口130,也可以是3.5mm的开放移动终端平台(open mobile terminal platform,OMTP)标准接口,还可以是美国蜂窝电信工业协会(cellular telecommunications industry association of theUSA,CTIA)标准接口。
传感器180可以包括压力传感器180A,陀螺仪传感器180B,气压传感器180C,磁传感器180D,加速度传感器180E,距离传感器180F,接近光传感器180G,指纹传感器180H,温度传感器180J,触摸传感器180K,环境光传感器180L,骨传导传感器180M等。
其中,压力传感器180A用于感受压力信号,可以将压力信号转换成电信号。在一些实施例中,压力传感器180A可以设置于显示屏194。压力传感器180A的种类很多,如电阻式压力传感器,电感式压力传感器,电容式压力传感器等。电容式压力传感器可以是包括至少两个具有导电材料的平行板。当有力作用于压力传感器180A,电极之间的电容改变。终端根据电容的变化确定压力的强度。当有触摸操作作用于显示屏194,终端根据压力传感器180A检测所述触摸操作强度。终端也可以根据压力传感器180A的检测信号计算触摸的位置。在一些实施例中,作用于相同触摸位置,但不同触摸操作强度的触摸操作,可以对应不同的操作指令。例如:当有触摸操作强度小于第一压力阈值的触摸操作作用于短消息应用图标时,执行查看短消息的指令。当有触摸操作强度大于或等于第一压力阈值的触摸操作作用于短消息应用图标时,执行新建短消息的指令。
陀螺仪传感器180B可以用于确定终端的运动姿态。在一些实施例中,可以通过陀螺仪传感器180B确定终端围绕三个轴(即,x,y和z轴)的角速度。陀螺仪传感器180B可以用于拍摄防抖。示例性的,当按下快门,陀螺仪传感器180B检测终端抖动的角度,根据角度计算出镜头模组需要补偿的距离,让镜头通过反向运动抵消终端的抖动,实现防抖。陀螺仪传感器180B还可以用于导航,体感游戏场景等。
加速度传感器180E可检测终端在各个方向上(一般为三轴)加速度的大小。当终端静止时可检测出重力的大小及方向。还可以用于识别终端姿态,应用于横竖屏切换,计步器等应用。
距离传感器180F,用于测量距离。终端可以通过红外或激光测量距离。在一些实施例中,拍摄场景,终端可以利用距离传感器180F测距以实现快速对焦。
接近光传感器180G可以包括例如发光二极管(LED)和光检测器,例如光电二极管。发光二极管可以是红外发光二极管。终端通过发光二极管向外发射红外光。终端使用光电二极管检测来自附近物体的红外反射光。当检测到充分的反射光时,可以确定终端附近有物体。当检测到不充分的反射光时,终端可以确定终端附近没有物体。终端可以利用接近光传感器180G检测用户手持终端贴近耳朵通话,以便自动熄灭屏幕达到省电的目的。接近光传感器180G也可用于皮套模式,口袋模式自动解锁与锁屏。
环境光传感器180L用于感知环境光亮度。终端可以根据感知的环境光亮度自适应调节显示屏194亮度。环境光传感器180L也可用于拍照时自动调节白平衡。环境光传感器180L还可以与接近光传感器180G配合,检测终端是否在口袋里,以防误触。
指纹传感器180H(也称为指纹识别器),用于采集指纹。终端可以利用采集的指纹特性实现指纹解锁,访问应用锁,指纹拍照,指纹接听来电等。另外,关于指纹传感器的其他记载可以参见名称为“处理通知的方法及终端”的国际专利申请PCT/CN2017/082773,其全部内容通过引用结合在本申请中。
触摸传感器180K,也可称触控面板。触摸传感器180K可以设置于显示屏194,由触摸传感器180K与显示屏194组成触摸屏,也称触控屏。触摸传感器180K用于检测作用于其上或附近的触摸操作。触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。可以通过显示屏194提供与触摸操作相关的视觉输出。在另一些实施例中,触摸传感器180K也可以设置于终端的表面,与显示屏194所处的位置不同。
骨传导传感器180M可以获取振动信号。在一些实施例中,骨传导传感器180M可以获取人体声部振动骨块的振动信号。骨传导传感器180M也可以接触人体脉搏,接收血压跳动信号。在一些实施例中,骨传导传感器180M也可以设置于耳机中,结合成骨传导耳机。音频模块170可以基于所述骨传导传感器180M获取的声部振动骨块的振动信号,解析出语音信号,实现语音功能。应用处理器可以基于所述骨传导传感器180M获取的血压跳动信号解析心率信息,实现心率检测功能。
按键190包括开机键,音量键等。按键190可以是机械按键,也可以是触摸式按键。终端可以接收按键输入,产生与终端的用户设置以及功能控制有关的键信号输入。
马达191可以产生振动提示。马达191可以用于来电振动提示,也可以用于触摸振动反馈。例如,作用于不同应用(例如拍照,音频播放等)的触摸操作,可以对应不同的振动反馈效果。作用于显示屏194不同区域的触摸操作,马达191也可对应不同的振动反馈效果。不同的应用场景(例如:时间提醒,接收信息,闹钟,游戏等)也可以对应不同的振动反馈效果。触摸振动反馈效果还可以支持自定义。
指示器192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
SIM卡接口195用于连接SIM卡。SIM卡可以通过插入SIM卡接口195,或从SIM卡接口195拔出,实现和终端的接触和分离。终端可以支持1个或N个SIM卡接口,N为大于1的正整数。SIM卡接口195可以支持Nano SIM卡,Micro SIM卡,SIM卡等。同一个SIM卡接口195可以同时插入多张卡。所述多张卡的类型可以相同,也可以不同。SIM卡接口195也可以兼容不同类型的SIM卡。SIM卡接口195也可以兼容外部存储卡。终端通过SIM卡和网络交互,实现通话以及数据通信等功能。在一些实施例中,终端采用eSIM,即:嵌入式SIM卡。eSIM卡可以嵌在终端中,不能和终端分离。
参照图2所示,对于相关技术的一种分布式业务,涉及终端1、终端2、终端3和终端4。
按照分布式业务的流程先后,可将执行分布式业务的终端看作上下游关系。比如,在终端2-终端3-终端4这一执行顺序下,终端3的执行顺序早于终端4。因此,终端3可在执行分布式业务后,向终端4传递关联信息。故可将终端3视为终端4的上游终端,将终端4视为终端3的下游终端。
同理,在接下来的终端4-终端3-终端2这一执行顺序下,终端4的执行顺序早于终端3。因此,终端4可在执行分布式业务后,向终端3传递关联信息。故可将终端3视为终端4的下游终端,将终端4视为终端3的上游终端。
由此可知,终端的上下游关系仅与相邻两个终端的业务执行顺序有关。
图2所示的分布式业务,其业务流程按照终端1-终端2-终端3-终端4-终端3-终端2-终端1的顺序执行。
其中,对于任一终端来说,其在执行业务的时候,会经手分布式业务的关联信息。关联信息指的是分布式业务被执行过程中以接收、发送、转发、连接、接触、产生、使用、更新等任何方式涉及的信息。关联信息由当前终端经手,并由当前终端向其在分布式业务流程中的下游终端传递。
如图2所示的分布式场景,在执行分布式业务的过程中,终端4检测到故障信息,并向网盘上报故障信息。
接着,分布式业务继续进行,直至终端1也检测到故障信息,并向网盘上报故障信息。
参照图2所示,在终端4执行业务后,分布式业务流程会按照终端4-终端3-终端2-终端1的顺序继续下去,则在此情况下,可将终端1看作终端4的下游终端。终端4将自身的关联信息传递至终端3。终端3基于终端4的关联信息执行分布式业务后,再将自身的关联信息传递至终端2。终端2基于终端3的关联信息执行分布式业务后,再将自身的关联信息传递至终端1。终端1基于终端2的关联信息,执行分布式业务。
由此逻辑关系可知,终端1执行分布式业务所需的关联信息,与终端4是有关的。则在一种可能的设计中,终端4在处理分布式业务的过程中,产生故障a,上报故障a对应的故障信息。终端4的故障a影响到位于终端4下游的终端1,使终端1在处理分布式业务的过程中,产生故障b,上报故障b对应的故障信息。
此时,故障a对应的故障信息与故障b对应的故障信息源于相同故障位置。
在另一种可能的设计中,终端4在处理分布式业务的过程中,产生故障a,上报故障a对应的故障信息。终端1在执行分布式业务的过程中,独立生成故障c,上报故障c对应的故障信息。其中,故障c与故障a无关。
此时,故障a对应的故障信息与故障c对应的故障信息源于不同故障位置。
然而,网盘最终只得到终端4和终端1分别上报的故障信息。对于网盘来说,或者,对于任何可获取网盘内故障信息的对象来说,无法区分网盘内的故障信息是否源于同一故障位置。
换言之,网盘得到的故障信息不完整,不能准确给出故障位置。只有准确定位故障位置,才能进一步解决故障问题。
因此,为定位故障位置,需要花费大量的人力成本和时间成本,对网盘内的故障信息进行整理和归纳。并且,即使这样,由于人工作业的可靠性有限,仍难保证准确定位故障位置。
对此,本申请的技术方案,可以便捷获取全部故障信息并高效定位故障位置。以下,通过具体实施例对本申请提供的故障上报方法进行详细描述。
实施例一
参照图3,本申请实施例提供一种故障上报方法,应用于分布式业务系统中的第一终端。第一终端在执行分布式业务的过程中涉及第一关联信息。
第一关联信息指的是第一终端在执行分布式业务的过程中,以接收、发送、转发、连接、接触、产生、使用、更新等任何方式涉及的信息。
应当理解,在上下文中,尽管在本发明实施例中可能采用术语第一、第二等来描述终端、关联信息等,但这些终端、关联信息等不应限于这些术语。这些术语仅用来将终端、关联信息等彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一终端也可以被称为第二终端,类似地,第二终端也可以被称为第一终端。
则该方法包括:
步骤302,第一终端检测第一关联信息是否满足故障识别条件。
第一关联信息的数量为多个,每个第一关联信息具有对应的故障识别条件。
在一种可能的设计中,故障识别条件指的是第一关联信息中的指定属性处于预设的故障属性范围内。
则对于任一第一关联信息,检测其是否满足故障识别条件,只要检测其的指定属性是否处于预设的故障属性范围内即可。
其中,当其指定属性处于预设的故障属性范围内时,可确定其满足故障识别条件。此时,将其识别为故障数据。
反之,当其指定属性未处于预设的故障属性范围内时,可确定其不满足故障识别条件,并非故障数据。
在另一种可能的设计中,故障识别条件指的是第一关联信息中的指定属性未处于预设的正常阈值范围内。
则对于任一第一关联信息,检测其是否满足故障识别条件,只要检测其的指定属性是否未处于预设的正常阈值范围内即可。
其中,当其指定属性未处于预设的正常阈值范围内时,可确定其满足故障识别条件。此时,将其识别为故障数据。
反之,当其指定属性处于预设的正常阈值范围内时,可确定其不满足故障识别条件,并非故障数据。
步骤304,第一终端在第一关联信息满足故障识别条件的情况下,为第一关联信息生成故障跟踪标识。
由于第一关联信息的数量为多个,且每个第一关联信息具有对应的故障识别条件,则每检测到一第一关联信息满足其自身对应的故障识别条件,即为其生成故障跟踪标识。若有多个第一关联信息满足其自身对应的故障识别条件,则为该多个第一关联信息分别生成对应的故障跟踪标识。
第一关联信息满足故障识别条件的情况下,说明第一终端检测出了自身的故障。此时,第一终端可为第一关联信息生成相应的故障跟踪标识,用故障跟踪标识指示该次调用过程中出现了故障。
在一种可能的设计中,故障跟踪标识可为任意类型的标识,包括但不限于字母、符号、数字及其组合。
同时,故障跟踪标识包括但不限于任意位数的数据。
比如,故障跟踪标识可为64位随机数、128位随机数或字符串。无论何种故障跟踪标识,均具有其独特性,以便用易于识别的故障跟踪标识区分不同故障对应的第一关联信息。
在一种可能的设计中,第一关联信息包括故障点位置信息。
进一步地,第一关联信息的故障跟踪标识指示该次调用过程中出现了故障。而在后续的故障处理过程中,第一关联信息中的故障点位置信息可以指示故障发生的位置。
当然,第一关联信息满足未故障识别条件的情况下,说明第一终端未发生故障。此时,分布式流程正常进行。
步骤306,第一终端将第一关联信息和故障跟踪标识上报至与分布式业务系统相关的指定位置。
与分布式业务系统相关的指定位置可根据实际需要进行设置和更改。指定位置包括但不限于分布式业务系统内的任一终端、分布式业务系统指定的网盘等存储位置、分布式业务系统指定的第三方故障检测设备或平台等。
发生故障的第一终端将第一终端自身的第一关联信息和故障跟踪标识上报至与分布式业务系统相关的指定位置,故障处理方即可从指定位置获取到故障跟踪标识。由于故障跟踪标识包括故障点位置信息,则故障处理方可通过故障跟踪标识直接定位故障位置。
同时,故障处理方可从指定位置获取第一终端上报的其自身的第一关联信息,便于后续根据第一关联信息处理和解决故障。
分布式业务系统的同一终端可能迸发多种故障,或者,分布式业务系统中可能有多个终端发生故障。因此,在相近时间范围内,指定位置接收到大量与故障相关的关联信息。故障处理方在处理大量关联信息时,可根据每次故障首发位置提供的故障跟踪标识对大量关联信息进行归类。故障处理方将具有相同的故障跟踪标识的关联信息确定为同一故障对应的信息,从而便于高效解决故障问题。
步骤308,第一终端将故障跟踪标识传递至第二终端,第二终端为第一终端在分布式业务的业务流程中的下游终端。
一般地,在分布式业务流程中,第一终端需向第二终端传递业务数据,该业务数据可以为第一关联信息涉及的部分数据或全部数据。在传递业务数据的同时、之前或之后,第一终端将故障跟踪标识传递至第二终端。
第一终端将自身的第一关联信息和故障跟踪标识上报至指定位置后,故障处理方可在指定位置获取该故障跟踪标识,并通过该故障跟踪标识直接定位故障位置。
在第一终端发生故障并上报第一关联信息和故障跟踪标识后,分布式业务的业务流程仍在继续。第二终端为第一终端在分布式业务的业务流程中的下游终端,则第二终端在根据第一终端提供的业务数据执行分布式业务时,仍有产生故障的可能。
对此,为全面获取故障信息,第一终端可在分布式业务过程中向下游终端传递故障跟踪标识。
也就是说,一旦第一终端检测到故障,在继续分布式业务流程的同时,也将第一终端生成的故障跟踪标识在后续的分布式业务流程中进行传递。这样,其下游的第二终端可基于故障跟踪标识向指定位置上报自身涉及的关联信息。
当然,第二终端若也具有下游终端,则继续在后续的分布式业务流程中传递故障跟踪标识。第二终端若不具有下游终端,则分布式业务流程终止。
至此,指定位置能够接收到全面的故障信息。
在一种可能的设计中,在步骤308之前,还包括:判断第一终端在分布式业务的业务流程中是否处于末端,其中,在判断结果为第一终端在分布式业务的业务流程中未处于末端的情况下,允许将故障跟踪标识传递至第一终端在分布式业务的业务流程中的下游终端。
若第一终端在分布式业务的业务流程中处于末端,则说明其不具有下游终端。此时,无需继续传递故障跟踪标识传。第一终端自身的第一关联信息即全部故障信息。
若第一终端在分布式业务的业务流程中未处于末端,则说明其具有下游终端。此时,需要监测第一终端发生的故障对其下游终端的影响,以全面获取故障信息。故可在继续分布式业务流程的同时,将第一终端生成的故障跟踪标识在后续的分布式业务流程中进行传递,以便第一终端的所有下游终端都基于该故障跟踪标识向指定位置上报自身的关联信息。由此,提升了获取到的故障信息的完整性和准确性。
参照图4,本申请实施例提供一种故障上报方法,应用于分布式业务系统中的第二终端。其中,第二终端为第一终端在分布式业务的业务流程中的下游终端,则第二终端在根据第一终端提供的业务数据执行分布式业务时,仍有产生故障的可能。
该方法包括:
步骤402,第二终端获得第一故障跟踪标识,该第一故障跟踪标识来自第二终端在分布式业务系统中的上游终端。
第一终端作为该上游终端时,发生故障并上报自身的第一关联信息和第一故障跟踪标识(即图3示出的步骤中所述的故障跟踪标识,区别于下文中第二终端自身生成的第二故障跟踪标识)后,分布式业务的业务流程仍在继续。
此时,需要监测第一终端发生的故障对后续业务流程的影响,以全面获取故障信息。故可在继续分布式业务流程的同时,将第一终端生成的第一故障跟踪标识在后续的分布式业务流程中传递至下游的第二终端。这样,第二终端也可基于第一故障跟踪标识向指定位置上报自身的第二关联信息。
步骤404,第二终端将自身的第二关联信息和第一故障跟踪标识上报至与分布式业务系统相关的指定位置。
第二终端在执行分布式业务的过程中涉及第二关联信息。
其中,第二关联信息指的是,第二终端在执行分布式业务过程中以接收、发送、转发、连接、接触、产生、使用、更新等任何方式涉及的信息。
这里所述的指定位置,与上述图3示出的实施例中上报第一关联信息的指定位置相同。
第二终端接收到第一故障跟踪标识后,将自身的第二关联信息和第一故障跟踪标识上报至与分布式业务系统相关的指定位置。可以知晓,第二终端的第一故障跟踪标识由产生故障的第一终端所提供。
因此,在同一分布式业务的业务流程中,发生一个故障后指定位置接收到的所有关联信息具有相同的第一故障跟踪标识。换言之,故障处理方可将同一第一故障跟踪标识对应的所有关联信息,识别为同一故障对应的故障信息。
由此,在分布式业务系统的任一终端发生故障时,可自动、便捷地得到该故障在分布式业务流程中的全部故障信息。
这简化了故障信息的获取方式,降低了人力成本和时间成本。并且,可提升获取到的故障信息的完整性和准确性。
步骤406,第二终端检测自身的第二关联信息是否满足故障识别条件,在判断结果为是时,进入步骤408,在判断结果为否时,进入步骤414。
第二终端作为分布式业务流程中的执行节点,需要检测自身是否发生故障。
具体地,第二关联信息的数量为多个,且每个第二关联信息具有对应的故障识别条件。第二终端需判断自身是否有任一第二关联信息满足故障识别条件。对于第二终端的每种第二关联信息,故障识别条件中均为该第二关联信息的指定属性设置有预设的故障属性范围。
步骤408,为第二关联信息生成第二故障跟踪标识。
由于第二关联信息的数量为多个,且每个第二关联信息具有对应的故障识别条件,则每检测到一第二关联信息满足其自身对应的故障识别条件,即为其生成故障跟踪标识。若有多个第二关联信息满足其自身对应的故障识别条件,则为该多个第二关联信息分别生成对应的故障跟踪标识。
第二关联信息满足故障识别条件的情况下,说明第二终端检测出了自身的故障。此时,第二终端可为第二关联信息生成相应的第二故障跟踪标识,用第二故障跟踪标识指示该次调用过程中出现了故障。
在一种可能的设计中,第二故障跟踪标识可为任意类型的标识,包括但不限于字母、符号、数字及其组合。
同时,第二故障跟踪标识包括但不限于任意位数的数据。
比如,第二故障跟踪标识可为64位随机数、128位随机数或字符串。无论何种故障跟踪标识,均具有其独特性,以便用易于识别的第二故障跟踪标识区分不同故障对应的第一关联信息。
在一种可能的设计中,第二关联信息包括故障点位置信息。
进一步地,第二关联信息的第二故障跟踪标识指示该次调用过程中出现了故障。而在后续的故障处理过程中,第二关联信息中的故障点位置信息可以指示故障发生的位置。
步骤410,第二终端将第二故障跟踪标识上报至与分布式业务系统相关的指定位置。
与分布式业务系统相关的指定位置可根据实际需要进行设置和更改。指定位置包括但不限于分布式业务系统内的任一终端、分布式业务系统指定的网盘等存储位置、分布式业务系统指定的第三方故障检测设备或平台等。
此处所述的指定位置与图3所述的指定位置为同一指定位置。
发生故障的第二终端将第二故障跟踪标识上报至与分布式业务系统相关的指定位置,故障处理方即可从指定位置获取到第二故障跟踪标识。由于第二故障跟踪标识包括故障点位置信息,则故障处理方可通过故障跟踪标识直接定位第二故障跟踪标识对应的故障位置。
同时,前述步骤中第二终端已向指定位置上传了自身的第二关联信息。则故障处理方可基于从指定位置获取的第二关联信息处理和解决与第二故障跟踪标识对应的故障。
分布式业务系统的同一终端可能迸发多种故障,或者,分布式业务系统中可能有多个终端发生故障。因此,在相近时间范围内,指定位置接收到大量与故障相关的关联信息。故障处理方在处理大量关联信息时,可根据每次故障首发位置提供的故障跟踪标识对大量关联信息进行归类。故障处理方将具有相同的故障跟踪标识的关联信息确定为同一故障对应的信息,从而便于高效解决故障问题。
步骤412,第二终端将第一故障跟踪标识和第二故障跟踪标识传递至下游终端,此下游终端指的是第二终端在分布式业务的业务流程中的下游终端。
其中,第二终端向下游传递第一故障跟踪标识和第二故障跟踪标识的先后顺序不受限制。
在一种可能的设计中,可在检测到上游终端传递的第一故障跟踪标识之后,将第一故障跟踪标识单独向下游终端传递,以及在生成第二故障跟踪标识之后,将第二故障跟踪标识向单独向下游终端传递。
在另一种可能的设计中,将第一故障跟踪标识和第二故障跟踪标识同时传递至下游终端。
步骤414,第二终端将第一故障跟踪标识传递至下游终端,此下游终端指的是第二终端在分布式业务的业务流程中的下游终端。
为全面获取故障信息,第二终端可在分布式业务过程中向自身的下游终端传递故障跟踪标识。其中,在第二关联信息不满足故障识别条件的情况下,第二终端将第一故障跟踪标识传递至下游终端;在第二关联信息满足故障识别条件的情况下,第二终端将第一故障跟踪标识和第二故障跟踪标识传递至下游终端。
也就是说,一旦第一终端检测到故障,在继续分布式业务流程的同时,也将第一终端生成的第一故障跟踪标识在后续的分布式业务流程中进行传递。这样,其下游的第二终端可基于第一故障跟踪标识向指定位置上报自身涉及的第二关联信息。
当然,第二终端若也具有下游终端,则继续在后续的分布式业务流程中传递第一故障跟踪标识。第二终端若不具有下游终端,则分布式业务流程终止。
一旦第二终端检测到故障,在继续分布式业务流程的同时,也将第二终端生成的第二故障跟踪标识在后续的分布式业务流程中进行传递。这样,其下游的终端可基于第二故障跟踪标识向指定位置上报自身涉及的关联信息。
当然,第二终端若也具有下游终端,则继续在后续的分布式业务流程中传递第二故障跟踪标识。第二终端若不具有下游终端,则分布式业务流程终止。
至此,每发生一次故障,发生故障的终端会生成该故障对应的故障跟踪标识,该终端及其下游的所有终端均会上传自身的关联信息至指定位置,指定位置即能够接收到该故障对应的全面的故障信息。
当然,步骤414和步骤412之前,还包括:判断第二终端在分布式业务的业务流程中是否处于末端。则在判断结果为第二终端未处于末端的情况下,允许将第一故障跟踪标识传递至第二终端的下游终端。
也就是说,第二终端若具有下游终端,则继续在后续的分布式业务流程中传递第一故障跟踪标识,直至分布式业务流程结束。
如此,需要监测第二终端发生的故障对其下游终端的影响,以全面获取故障信息。那么,在继续分布式业务流程的同时,将第二终端接收到的第一故障跟踪标识在后续的分布式业务流程中进行传递。
换言之,若第二终端仍具有下游终端,则可继续向下游传递该第一故障跟踪标识。这种传递,直至分布式业务流程中第一终端后的全部下游终端均接收到第一故障跟踪标识为止。这样,在分布式业务系统的任一终端发生故障时,该终端及其所有下游终端均可自动、便捷地上报与该故障相关的关联信息。这有助于提升故障信息获取的完整性和便捷性。
若判断结果为第二终端处于末端,则第二终端不具有下游终端。此时,分布式业务流程终止,无需继续传递第一故障跟踪标识。
另外,在图4示出的步骤中,第二终端获得第一故障跟踪标识,与第二终端检测自身的第二关联信息是否满足故障识别条件,这两个步骤的先后顺序不受限制。第二终端将第一故障跟踪标识和自身的第二关联信息上报至指定位置,与第二终端检测自身的第二关联信息是否满足故障识别条件,这两个步骤的先后顺序也不受限制。在一种可能的实现方式中,在执行完步骤402后,可以先执行步骤406,即第二终端先检测自身第二关联信息是否满足故障识别条件,在满足故障识别条件的情况下,执行步骤408,第二终端为第二关联信息生成第二故障跟踪标识,然后将第一故障跟踪标识、第二故障跟踪标识和自身的第二关联信息一起上传至分布式业务系统相关的指定位置,然后执行412;在不满足故障识别条件的情况下,将第一故障跟踪标识和自身的第二关联信息上传至分布式业务系统相关的指定位置,然后执行414。
第二关联信息、第一故障跟踪标识和第二故障跟踪标识可由第二终端以任意上报顺序向指定位置上报,也可由第二终端将其中任两项作为单次上报内容,与剩余一项以任意上报顺序向指定位置上报,还可由第二终端将三者作为单次上报内容向指定位置上报。
接下来,以应用于电商领域的分布式业务系统为例,对上述图3和图4所示的应用于分布式业务流程中的故障上报方法进行说明。
参照图5,用户使用购物软件搜索目标商品时,分布式业务系统可为该用户提供符合该用户的实际需求的关联商品集合。这一分布式业务系统包括用户终端、服务器1、服务器2和服务器3,业务流程按照用户终端-数据处理装置1-数据处理装置2-数据处理装置3-数据处理装置2-数据处理装置1-用户终端的顺序执行。其中,数据处理装置1、数据处理装置2、数据处理装置3可分别为独立的服务器,也可为一个服务器中的三个功能模块,还可为用户终端中的功能模块。
具体来说,用户终端、数据处理装置1、数据处理装置2、数据处理装置3的业务流程和执行功能如下:
用户的访问请求到达用户终端,用户终端在用户的访问请求中解析得到用户身份信息和商品搜索关键词。
用户终端将用户身份信息和商品搜索关键词作为业务数据发送至数据处理装置1。数据处理装置1基于用户身份信息在用户信息数据库中获取该用户的习惯数据。
数据处理装置1将该用户的习惯数据和商品搜索关键词作为业务数据发送至数据处理装置2。数据处理装置2将用户的习惯数据和商品搜索关键词输入预置的神经网络分类模型,并输出适合该用户的价格区间。
数据处理装置2将商品搜索关键词和价格区间作为业务数据发送至数据处理装置3。数据处理装置3在商品信息数据库中查找满足该价格区间且具有该商品搜索关键词的商品集合。
数据处理装置3将商品集合作为业务数据发送至数据处理装置2,数据处理装置2按照商品集合中各商品的销量、营销业务买入水平等因素,对商品集合中的商品进行排序,生成有序的商品列表。
数据处理装置2将商品列表作为业务数据发送至数据处理装置1,数据处理装置1在关联商品数据库中,获取商品列表中各商品的关联商品集合。
数据处理装置1将商品列表和关联商品集合作为业务数据发送至用户终端,用户终端在显示商品列表的同时,显示关联商品集合。
上述分布式业务流程中用户终端、数据处理装置1、数据处理装置2、数据处理装置3进行业务数据的传递和处理的过程在图中未示出。
当然,分布式业务不限于上述实例。分布式业务系统可包括任意数量的终端,任意数量的终端可按照任意顺序执行业务流程,而不限于图5给出的形式。
同时,在上述分布式业务进行的过程中,用户终端首次作为其执行节点时,其自身的关联信息包括用户身份信息和商品搜索关键词等业务数据,还包括与数据处理装置1的连接信息。
此时,用户终端首次作为该分布式业务的执行节点时,用户终端需检测自身是否有任一关联信息满足故障识别条件。对于用户终端的每种关联信息,故障识别条件中均为该种关联信息的指定属性设置有预设的故障属性范围。如用户身份信息,其指定属性为用户识别码,预设的故障属性范围为多个无效用户的用户识别码组成的集合。这样,可判断用户识别码是否为无效用户的用户识别码中的一个,若是,则满足故障识别条件,若否,则不满足故障识别条件。
经判断,用户终端的全部关联信息的指定属性均未处于对应的故障属性范围内,则用户终端可确定自身的全部关联信息均不满足故障识别条件,无需进入生成故障跟踪标识的步骤。
同理,数据处理装置1首次作为该分布式业务的执行节点时,数据处理装置需检测自身是否有任一关联信息满足故障识别条件。数据处理装置1的关联信息包括用户身份信息、商品搜索关键词、用户的习惯数据等业务数据,还包括与用户终端和数据处理装置2的连接信息。
经判断,数据处理装置1自身的全部关联信息的指定属性均未处于对应的故障属性范围内,则数据处理装置1可确定自身的全部关联信息均不满足故障识别条件,无需进入生成故障跟踪标识的步骤。
同理,数据处理装置2首次作为该分布式业务的执行节点时,数据处理装置2需检测自身是否有任一关联信息满足故障识别条件。数据处理装置2自身的关联信息包括用户的习惯数据、商品搜索关键词和价格区间等业务数据,还包括与数据处理装置1和数据处理装置3的连接信息。
示例性的,用户的习惯数据的指定属性为被各商品类型的被用户访问次数的实际加权和,则其在故障识别条件中对应的故障属性范围为指定加权和范围。若实际加权和处于指定加权和范围内,则满足故障识别条件,否则,不满足故障识别条件。
经判断,数据处理装置2的全部关联信息的指定属性均未处于对应的故障属性范围内,则数据处理装置2可确定自身的全部关联信息均不满足故障识别条件,无需进入生成故障跟踪标识的步骤。
接着,数据处理装置3首次作为该分布式业务的执行节点时,数据处理装置3需检测自身是否有任一关联信息满足故障识别条件。数据处理装置3自身的关联信息包括商品搜索关键词、价格区间、商品信息数据库的接口信息和商品集合等业务数据,还包括与数据处理装置2的连接信息。
示例性的,对于商品信息数据库的接口信息,其指定属性为接口数据传输速率,则接口数据传输速率在故障识别条件中对应的故障属性范围为小于或等于100bps。则当数据处理装置3的接口数据传输速率为50bps时,数据处理装置3判定接口数据传输速率满足故障识别条件。
经判断,商品信息数据库的接口信息的指定属性处于对应的故障属性范围内。此时,数据处理装置3为商品信息数据库的接口信息生成64位随机数作为故障跟踪标识a。
可选地,故障跟踪标识a为:
2323564981562352356498162354981623564981498142356498192356498181。
当然,该64位随机数可使用十进制表示,也可使用十六进制表示。
接着,数据处理装置3将自身此时的全部关联信息和故障跟踪标识a上报至网盘,并在分布式业务流程中将故障跟踪标识a向下游的数据处理装置2传递。
数据处理装置2检测到来自上游的数据处理装置3的故障跟踪标识a,故障跟踪标识a指示了故障位置为数据处理装置3。在数据处理装置3发生故障的基础上,数据处理装置2所使用的由数据处理装置3传递而来的业务数据为与故障相关的数据,则数据处理装置2基于与故障相关的数据执行分布式业务时,包括其得到的数据在内的数据处理装置2所涉及的关联信息为与故障相关的数据。
数据处理装置2第二次作为分布式业务流程中的执行节点,其自身此时的关联信息包括商品集合及其中的各商品的销量、营销业务买入水平、商品列表等,还包括与数据处理装置1和数据处理装置3的连接信息。
数据处理装置2将自身的关联信息与故障跟踪标识a一同上报至网盘,网盘将两者关联存储。
接着,数据处理装置2需检测自身是否有任一关联信息满足故障识别条件。对于数据处理装置2的每种关联信息,故障识别条件中均为该种关联信息的指定属性设置有预设的故障属性范围。
经判断,数据处理装置2此时的关联信息的指定属性均未处于对应的故障属性范围内,则数据处理装置2可确定自身的全部关联信息均不满足故障识别条件,无需进入生成新的故障跟踪标识的步骤。
然后,数据处理装置2在分布式业务流程中将故障跟踪标识a向下游的数据处理装置1传递。
需要知晓,对于数据处理装置2、数据处理装置1和用户终端,其检测自身此时的关联信息是否满足故障识别条件、与将自身的关联信息和故障跟踪标识a上报至网盘以及将故障跟踪标识a向下游传递,这三个步骤可同时进行,也可按照任意顺序先后进行。
数据处理装置1第二次作为分布式业务流程中的执行节点,检测到来自上游的数据处理装置2的故障跟踪标识a,故障跟踪标识a指示了故障位置为数据处理装置3。在数据处理装置3发生故障的基础上,数据处理装置2所使用的由数据处理装置3传递而来的业务数据为与故障相关的数据,则数据处理装置2基于与故障相关的数据执行分布式业务时,包括其得到的数据在内的数据处理装置2所涉及的关联信息为与故障相关的数据。在数据处理装置2提供的业务数据为与故障相关的数据的基础上,则数据处理装置1基于该与故障相关的数据执行分布式业务时,包括其得到的数据在内的数据处理装置1所涉及的关联信息为与故障相关的数据。
数据处理装置1第二次作为分布式业务流程中的执行节点时,为数据处理装置2的下游终端。此时,其自身的关联信息包括商品列表、关联商品数据库的接口信息、关联商品集合,还包括与用户终端和数据处理装置2的连接信息。
数据处理装置1将自身的关联信息与故障跟踪标识a一同上报至网盘,网盘将两者关联存储。
接着,数据处理装置1需检测自身是否有任一关联信息满足故障识别条件。对于数据处理装置1此时的每种关联信息,故障识别条件中均为该种关联信息的指定属性设置有预设的故障属性范围。
经判断,数据处理装置1为数据处理装置2的下游终端时,其此时的全部关联信息的指定属性均未处于对应的故障属性范围内,则数据处理装置1可确定自身此时的全部关联信息均不满足故障识别条件,无需进入生成新的故障跟踪标识的步骤。
然后,数据处理装置1在分布式业务流程中将故障跟踪标识a向下游的用户终端传递。
再接下来,用户终端检测到来自上游的数据处理装置1的故障跟踪标识a,故障跟踪标识a指示了故障位置为数据处理装置3。在数据处理装置3发生故障的基础上,数据处理装置2所使用的由数据处理装置3传递而来的业务数据为与故障相关的数据,则数据处理装置2基于与故障相关的数据执行分布式业务时,包括其得到的数据在内的数据处理装置2所涉及的关联信息为与故障相关的数据。在数据处理装置2提供的业务数据为与故障相关的数据的基础上,则数据处理装置1基于该与故障相关的数据执行分布式业务时,包括其得到的数据在内的数据处理装置1所涉及的关联信息为与故障相关的数据。在数据处理装置1提供的业务数据为与故障相关的数据的基础上,则用户终端基于该与故障相关的数据执行分布式业务时,包括其得到的数据在内的用户终端所涉及的关联信息为与故障相关的数据。
因此,用户终端将自身的关联信息与故障跟踪标识a一同上报至网盘,网盘将两者关联存储。
用户终端第二次作为分布式业务流程中的执行节点时,为数据处理装置1的下游终端。其关联信息包括商品列表和关联商品集合,还包括与数据处理装置1的连接信息。此时,用户终端需检测自身是否有任一关联信息满足故障识别条件。对于用户终端的每种关联信息,故障识别条件中均为该种关联信息的指定属性设置有预设的故障属性范围。
经判断,用户终端此时的关联信息的指定属性均未处于对应的故障属性范围内,则用户终端可确定自身的全部关联信息均不满足故障识别条件,无需进入生成新的故障跟踪标识的步骤。
此后用户终端可判断自身是否处于分布式业务流程的末端,若用户终端判断自身处于分布式业务流程的末端,则分布式业务流程结束。
在上述方案的基础上,在另一种可能的设计中,用户终端需检测自身是否有任一关联信息满足故障识别条件时,经判断,用户终端此时有关联信息的指定属性处于对应的故障属性范围内,则用户终端可确定自身的该关联信息均满足故障识别条件,进入生成新的故障跟踪标识的步骤。
参照图6所示,示例性的,用户终端与数据处理装置1的连接信息的指定属性为访问接口传输速率,访问接口传输速率故障识别条件中对应的故障属性范围为小于或等于80bps。则当用户终端对数据处理装置1的访问接口传输速率为50bps时,用户终端判定访问接口传输速率满足处于预设的故障属性范围内,满足故障识别条件。
此时,用户终端生成64位随机数作为故障跟踪标识b。可选地,故障跟踪标识b为:3636754281562352356498231554981623512381498142356498192356498181。当然,该64位随机数可使用十进制表示,也可使用十六进制表示。
接着,用户终端将故障跟踪标识b上报至网盘,在网盘中,故障跟踪标识b与用户终端自身的关联信息关联存储。由于用户终端第二次作为执行节点时为分布式业务流程的末端,不具有下游终端,则无需继续向下传递故障跟踪标识b。
在另一种可能的设计中,用户终端接收到故障跟踪标识a后,将自身涉及的关联信息和故障跟踪标识a上报至网盘,接着,生成了故障跟踪标识b,将自身涉及的关联信息和故障跟踪标识b上报至网盘。
进一步地,在一种可能的设计中,由于用户终端在同一分布式业务流程中所涉及的关联信息是相同的,用户终端可仅上报一次关联信息。即用户终端可将故障跟踪标识a、故障跟踪标识b和自身的关联信息同时关联上报至网盘。或者,用户终端先上报故障跟踪标识b和关联信息至网盘,再上报故障跟踪标识a。
在另一种可能的设计中,用户终端上报故障跟踪标识a和自身的关联信息至网盘,以及,用户终端上报故障跟踪标识b和自身的关联信息至网盘。
在一种可能的设计中,用户终端在接收到上游终端(数据处理装置1),传递的故障跟踪标识a后,可先检测自身涉及的关联信息是否满足故障识别条件。当检测自身涉及的关联信息满足故障识别条件时,生成故障跟踪标识b。然后用户终端将自身涉及的关联信息、故障跟踪标识a和故障跟踪标识b一同上报至网盘。然后用户终端可以判断用户终端在分布式业务的业务流程中是否处于末端。在判断结果为用户终端处于末端的情况下,分布式业务流程结束。
但无论以上述何种方式、何种次序进行上报,对于故障检测方来说,其可在网盘中查询到两个故障跟踪标识。
故障检测方可查询到与故障跟踪标识a关联存储的四组关联信息。这说明,此四组关联信息为同一故障涉及的全部关联信息。
由于关联信息包括故障点位置信息,所述故障点位置信息用于指示故障发生的位置,故此四组关联信息均指示了故障发生的位置为数据处理装置3。换言之,可基于关联信息判断故障是由哪个终端产生的,从而快速有效地定位了故障位置。
接着,故障处理方处理故障跟踪标识a对应的故障时,直接调用网盘中与故障跟踪标识a关联存储的关联信息即获取了全面的故障信息,有助于对故障进行快速有效的处理。
另外,故障检测方可查询到与故障跟踪标识b关联存储的一组关联信息。这说明,此一组关联信息为另一个故障涉及的全部关联信息。
由于关联信息包括故障点位置信息,所述故障点位置信息用于指示故障发生的位置,故此一组关联信息指示了故障发生的位置为用户终端。换言之,可基于关联信息判断故障是由哪个终端产生的,从而快速有效地定位了故障位置。
故障处理方处理故障跟踪标识b对应的故障时,直接调用网盘中与故障跟踪标识b关联存储的关联信息即获取了全面的故障信息,有助于对故障进行快速有效的处理。
综上,两次故障的关联信息可基于不同的故障跟踪标识进行区分。这样,便于准确确定故障发生位置,为进一步解决故障问题提供了有利基础。
实施例二
对于单个终端来说,其往往参与多种分布式业务。终端在参与多种分布式业务时,会产生多组关联信息。每种分布式业务都具有发生故障的可能性,最终得到的故障信息集合中往往有多种分布式业务涉及的故障信息。因此,参照图7,本申请实施例提供的又一种故障上报方法,应用于分布式业务系统中的第一终端,能够有效区分各分布式业务产生的故障信息。
该方法包括:
步骤702,第一终端将第一关联信息和分布式业务的业务跟踪标识关联,缓存至本地。
第一终端在执行分布式业务的过程中涉及第一关联信息。
第一关联信息指的是第一终端在执行分布式业务的过程中,以接收、发送、转发、连接、接触、产生、使用、更新等任何方式涉及的信息。第一关联信息由第一终端经手,并由第一终端向其在分布式业务流程中的下游终端传递。
对于单个终端来说,其往往参与多种分布式业务。终端在参与多种分布式业务时,会产生多组关联信息。因此,为区分多种分布式业务,分布式业务流程中的首个终端可为每种分布式业务设置唯一的业务跟踪标识。换言之,通过不同的业务跟踪标识可以识别不同的分布式业务。业务跟踪标识随分布式业务流程在分布式业务的各终端中传递。
其中,业务跟踪标识可为任何形式的信息,如随机字母、随机数、字符串等。
缓存在本地的第一关联信息和分布式业务的业务跟踪标识,可作为故障检测方处理分布式业务的故障时的备份信息。如在后续步骤中,终端上传至指定位置的、用于故障处理的关联信息丢失,则可获取该终端缓存至本地的关联信息,作为备份使用。
当然,缓存在本地的第一关联信息和分布式业务的业务跟踪标识,也可用于任何与该分布式业务或该第一终端相关的信息处理过程。
对于各终端中缓存至本地的第一关联信息和业务跟踪标识,可设置清理周期。清理周期为有可能使用缓存至本地的第一关联信息和业务跟踪标识的最长时长。对于分布式业务流程中的任一终端,无论其是否将本地的第一关联信息和业务跟踪标识上报至与分布式业务系统相关的指定位置,在其本地的第一关联信息和业务跟踪标识的缓存时长达到清理周期后,均进行删除。由此,在清理周期内,可将本地的第一关联信息和业务跟踪标识作为网盘内数据的备份数据,而超出清理周期后,可释放本地存储空间。
步骤704,第一终端检测第一关联信息是否满足故障识别条件。
需要知晓,第一终端可先将第一关联信息和分布式业务的业务跟踪标识关联缓存至本地,再检测第一关联信息是否满足故障识别条件,也可先检测第一关联信息是否满足故障识别条件,再将第一关联信息和分布式业务的业务跟踪标识关联缓存至本地。在此,对这两个步骤的先后次序不作限制。
第一关联信息的数量为多个,每个第一关联信息具有对应的故障识别条件。
在一种可能的设计中,故障识别条件指的是第一关联信息中的指定属性处于预设的故障属性范围内。
则对于任一第一关联信息,检测其是否满足故障识别条件,只要检测其的指定属性是否处于预设的故障属性范围内即可。
其中,当其指定属性处于预设的故障属性范围内时,可确定其满足故障识别条件。此时,将其识别为故障数据。
反之,当其指定属性未处于预设的故障属性范围内时,可确定其不满足故障识别条件,并非故障数据。
在另一种可能的设计中,故障识别条件指的是第一关联信息中的指定属性未处于预设的正常阈值范围内。
则对于任一第一关联信息,检测其是否满足故障识别条件,只要检测其的指定属性是否未处于预设的正常阈值范围内即可。
其中,当其指定属性未处于预设的正常阈值范围内时,可确定其满足故障识别条件。此时,将其识别为故障数据。
反之,当其指定属性处于预设的正常阈值范围内时,可确定其不满足故障识别条件,并非故障数据。
步骤706,第一终端在第一关联信息满足故障识别条件的情况下,生成故障跟踪标识,并将故障跟踪标识增加至业务跟踪标识中。
由于第一关联信息的数量为多个,且每个第一关联信息具有对应的故障识别条件,则每检测到一第一关联信息满足其自身对应的故障识别条件,即为其生成故障跟踪标识。若有多个第一关联信息满足其自身对应的故障识别条件,则为该多个第一关联信息分别生成对应的故障跟踪标识。
另外,第一终端可先生成故障跟踪标识,并将故障跟踪标识增加至业务跟踪标识中,再将增加有故障跟踪标识的业务跟踪标识与自身的第一关联信息缓存至本地。第一终端也可将业务跟踪标识与自身的第一关联信息缓存至本地,再生成故障跟踪标识,并将故障跟踪标识添加至本地缓存的业务跟踪标识中。
第一关联信息满足故障识别条件的情况下,说明第一终端检测出了自身的故障。此时,第一终端可为第一关联信息生成相应的故障跟踪标识,用故障跟踪标识指示该次调用过程中出现了故障。
在一种可能的设计中,故障跟踪标识可为任意类型的标识,包括但不限于字母、符号、数字及其组合。
同时,故障跟踪标识包括但不限于任意位数的数据。
比如,故障跟踪标识可为64位随机数、128位随机数或字符串。无论何种故障跟踪标识,均具有其独特性,以便用易于识别的故障跟踪标识区分不同故障对应的第一关联信息。
在一种可能的设计中,第一关联信息包括故障点位置信息。
进一步地,第一关联信息的故障跟踪标识指示该次调用过程中出现了故障。而在后续的故障处理过程中,第一关联信息中的故障点位置信息可以指示故障发生的位置。
其中,增加故障跟踪标识的业务跟踪标识可为任何形式的信息,如随机字母、随机数、字符串等。
在一种可能的设计中,第一终端将故障跟踪标识增加至业务跟踪标识的末位后。
在另一种可能的设计中,业务跟踪标识中可设置指定空闲位置,第一终端将故障跟踪标识添加至业务跟踪标识的该指定空闲位置。
步骤708,第一终端将本地的第一关联信息和具有故障跟踪标识的业务跟踪标识上报至与分布式业务系统相关的指定位置。
与分布式业务系统相关的指定位置可根据实际需要进行设置和更改。指定位置包括但不限于分布式业务系统内的任一终端、分布式业务系统指定的网盘等存储位置、分布式业务系统指定的第三方故障检测设备或平台等。
第一终端发生故障,则在业务跟踪标识中增设故障跟踪标识。接着,第一终端将自身的第一关联信息和具有故障跟踪标识的业务跟踪标识上报至指定位置。故障处理方可访问指定位置,通过业务跟踪标识中具有故障跟踪标识,确定该业务跟踪标识对应的分布式业务发生故障。故障跟踪标识包括故障点位置信息,则故障处理方可通过故障跟踪标识直接定位故障位置。
在一种可能的设计中,第一终端在自身的第一关联信息不满足故障识别条件的情况下,无需在缓存至本地的业务跟踪标识中增加故障跟踪标识,也无需将自身的第一关联信息和业务跟踪标识上报至与分布式业务系统相关的指定位置。
对于各终端中缓存至本地的第一关联信息和业务跟踪标识,可设置清理周期。清理周期为故障处理方有可能使用缓存至本地的第一关联信息和业务跟踪标识的最长时长。对于分布式业务流程中的任一终端,无论其是否将本地的第一关联信息和业务跟踪标识上报至与分布式业务系统相关的指定位置,在其本地的第一关联信息和业务跟踪标识的缓存时长达到清理周期后,均进行删除。由此,在清理周期内,可将本地的第一关联信息和业务跟踪标识作为网盘内数据的备份数据,而超出清理周期后,可释放本地存储空间。
步骤710,第一终端将具有故障跟踪标识的业务跟踪标识传递至第二终端,第二终端为第一终端在分布式业务流程中的下游终端。
一般地,在分布式业务流程中,第一终端向第二终端传递业务数据,该业务数据为第一关联信息涉及的部分数据或全部数据。在传递业务数据的同时、之前或之后,第一终端将故障跟踪标识的业务跟踪标识传递至第二终端。
这样,第二终端也得到了业务跟踪标识。由此可知,在分布式业务流程中,每个上游终端均将业务跟踪标识向自身的下游终端传递。也就是说,业务跟踪标识由分布式业务流程中的首个终端逐步传递至最末终端。
故障跟踪标识则由首个识别出故障的终端增加至业务跟踪标识中,由首个识别出故障的终端逐步传递至最末终端。
在一种可能的设计中,在步骤710之前,还包括:判断第一终端在分布式业务的业务流程中是否处于末端,其中,在判断结果为第一终端在分布式业务的业务流程中未处于末端的情况下,允许将具有故障跟踪标识的业务跟踪标识传递至第一终端在分布式业务的业务流程中的下游终端。
若第一终端在分布式业务的业务流程中处于末端,则说明其不具有下游终端。此时,无需继续传递具有故障跟踪标识的业务跟踪标识。第一终端自身的第一关联信息即全部故障信息。
若第一终端在分布式业务的业务流程中未处于末端,则说明其具有下游终端。此时,需要监测第一终端发生的故障对其下游终端的影响,以全面获取故障信息。故可在继续分布式业务流程的同时,将第一终端生成的故障跟踪标识在后续的分布式业务流程中进行传递,以便第一终端的所有下游终端都基于该故障跟踪标识向指定位置上报自身的关联信息。由此,提升了获取到的故障信息的完整性和准确性。
第二终端在执行分布式业务的过程中涉及第二关联信息,其中,第二终端为第一终端在分布式业务的业务流程中的下游终端,则第二终端在根据第一终端提供的业务数据执行分布式业务时,仍有产生故障的可能。
其中,第二关联信息指的是,第二终端在执行分布式业务过程中以接收、发送、转发、连接、接触、产生、使用、更新等任何方式涉及的信息。
参照图8所示,该方法包括:
步骤802,第二终端接收来自第一终端的业务跟踪标识,第一终端为第二终端在分布式业务系统中的上游终端。
步骤804,第二终端将第二关联信息和业务跟踪标识缓存至本地。
在业务跟踪标识中具有故障跟踪标识的情况下,缓存至本地的第二关联信息和业务跟踪标识可作为后续步骤中上报至指定位置的第二关联信息和业务跟踪标识的备份,为故障处理方处理故障提供便利。
在业务跟踪标识中不具有故障跟踪标识的情况下,缓存至本地的第二关联信息和业务跟踪标识可用于数据查验、功能测试等用途。
步骤806,第二终端在业务跟踪标识确认第一故障跟踪标识。
第二终端在业务跟踪标识确认第一故障跟踪标识的方式包括但不限于检测和查询。需要知晓,第二终端可先将自身的第二关联信息和分布式业务的业务跟踪标识关联缓存至本地,再检测或查询业务跟踪标识中是否具有第一故障跟踪标识,也可先检测或查询业务跟踪标识中是否具有第一故障跟踪标识,再将自身的第二关联信息和分布式业务的业务跟踪标识关联缓存至本地。在此,对这两个步骤的先后次序不作限制。
由于第一终端已在业务跟踪标识中增加第一故障跟踪标识,则第二终端接收到的业务跟踪标识为带有第一故障跟踪标识的业务跟踪标识。故第二终端可在接收到的业务跟踪标识中可检测到第一故障跟踪标识。
当然,若第二终端检测业务跟踪标识中不具有第一故障跟踪标识,说明第二终端的上游终端未发生故障,分布式业务流程正常进行。
步骤808,第二终端检测自身的第二关联信息是否满足故障识别条件,在判断结果为是时,进入步骤810,当判断结果为否时,进入步骤816。
第二终端作为分布式业务流程中的执行节点,需要检测自身是否发生故障。
具体地,第二关联信息的数量为多个,且每个第二关联信息具有对应的故障识别条件。第二终端需判断自身是否有任一第二关联信息满足故障识别条件。对于第二终端的每种第二关联信息,故障识别条件中均为该第二关联信息的指定属性设置有预设的故障属性范围。
步骤810,为第二关联信息生成第二故障跟踪标识,并将第二故障跟踪标识增加至具有第一故障跟踪标识的业务跟踪标识中。
由于第二关联信息的数量为多个,且每个第二关联信息具有对应的故障识别条件,则每检测到一第二关联信息满足其自身对应的故障识别条件,即为其生成故障跟踪标识。若有多个第二关联信息满足其自身对应的故障识别条件,则为该多个第二关联信息分别生成对应的故障跟踪标识。
第二关联信息满足故障识别条件的情况下,说明第二终端检测出了自身的故障。此时,第二终端可为第二关联信息生成相应的第二故障跟踪标识,用第二故障跟踪标识指示该次调用过程中出现了故障。
在一种可能的设计中,第二故障跟踪标识可为任意类型的标识,包括但不限于字母、符号、数字及其组合。
同时,第二故障跟踪标识包括但不限于任意位数的数据。
比如,第二故障跟踪标识可为64位随机数、128位随机数或字符串。无论何种故障跟踪标识,均具有其独特性,以便用易于识别的第二故障跟踪标识区分不同故障对应的第一关联信息。
在一种可能的设计中,第二关联信息包括故障点位置信息。
进一步地,第二关联信息的第二故障跟踪标识指示该次调用过程中出现了故障。而在后续的故障处理过程中,第二关联信息中的故障点位置信息可以指示故障发生的位置。
步骤812,第二终端将自身的第二关联信息和具有第一故障跟踪标识和第二故障跟踪标识的业务跟踪标识上报至与分布式业务系统相关的指定位置。
与分布式业务系统相关的指定位置可根据实际需要进行设置和更改。指定位置包括但不限于分布式业务系统内的任一终端、分布式业务系统指定的网盘等存储位置、分布式业务系统指定的第三方故障检测设备或平台等。
此处所述的指定位置与图7所述的指定位置为同一指定位置。
分布式业务系统的同一终端可能迸发多种故障,或者,分布式业务系统中可能有多个终端发生故障。因此,在相近时间范围内,指定位置接收到大量与故障相关的关联信息。故障处理方在处理大量关联信息时,可根据分布式业务的业务跟踪标识中不同的故障跟踪标识对大量关联信息进行归类,将其对应的业务跟踪标识中具有相同故障跟踪标识的关联信息作为该故障跟踪标识对应的故障的故障信息。
步骤814,第二终端将具有第一故障跟踪标识和第二故障跟踪标识的业务跟踪标识传递至下游终端。
为全面获取故障信息,第二终端可在分布式业务过程中向自身的下游终端传递具有第一故障跟踪标识和第二故障跟踪标识的业务跟踪标识。
当然,第二终端若不具有下游终端,则分布式业务流程终止。
步骤816,第二终端将自身的第二关联信息和具有第一故障跟踪标识的业务跟踪标识上报至与分布式业务系统相关的指定位置。
若第二终端检测自身的第二关联信息不满足故障识别条件,说明第二终端未发生故障,无需进入生成第二故障跟踪标识的步骤。此时的第二终端只将自身的第二关联信息和具有第一故障跟踪标识的业务跟踪标识上报至指定位置即可。
步骤818,第二终端将具有第一故障跟踪标识的业务跟踪标识传递至下游终端。
为全面获取故障信息,第二终端可在分布式业务过程中向自身的下游终端传递具有第一故障跟踪标识和第二故障跟踪标识的业务跟踪标识。
若第二终端仍具有下游终端,则可将具有第一故障跟踪标识的业务跟踪标识继续向下游终端传递,直至传递到分布式业务流程的最末终端为止。当然,第二终端若不具有下游终端,则分布式业务流程终止。
分布式业务系统中,最先出现故障的第一终端至分布式业务流程的最末终端均向指定位置上报了自身的关联信息和具有第一故障跟踪标识的业务跟踪标识。
第一终端的所有上游终端的业务跟踪标识内都不具有第一故障跟踪标识。一旦第一终端发生故障,第一终端的业务跟踪标识内即被增设第一故障跟踪标识。因此,第一终端的业务跟踪标识中,以及第一终端的所有下游终端的业务跟踪标识中,均具有第一故障跟踪标识。指定位置即得到该分布式业务对应的一组信息序列,这一信息序列包括第一终端自身的第一关联信息,也包括第一终端下游的所有终端的关联信息。同时,每组关联信息的业务跟踪标识中均具有相同的第一故障跟踪标识。
至此,即可准确定位故障位置为第一终端,并可自动、便捷地获取与故障相关的全部关联信息。进一步地,故障检测方可根据分布式业务的业务跟踪标识对网盘中与其相关的关联信息进行识别和提取等操作。
综上,每发生一次故障,发生故障的终端会在业务跟踪标识中增加该故障对应的故障跟踪标识。该终端及其下游的所有终端均会上传自身的关联信息至指定位置,指定位置即能够接收到该故障对应的全面的故障信息。
比如,第一终端发生故障后,在业务跟踪标识中增加故障跟踪标识c。具有故障跟踪标识c的业务跟踪标识由第一终端至第一终端下游的第二终端。若第二终端发生新的故障,则在具有故障跟踪标识c的业务跟踪标识中增加故障跟踪标识d。接着,第二终端将具有故障跟踪标识c和故障跟踪标识d的业务跟踪标识与自身的关联信息上报至指定位置。
对于指定位置来说,其接收到第一终端上报的具有故障跟踪标识c的业务跟踪标识和第一终端自身的关联信息,以及第二终端上报的具有故障跟踪标识c和故障跟踪标识d的业务跟踪标识和第二终端自身的关联信息,以及第二终端下游的每个终端上报的具有故障跟踪标识c和故障跟踪标识d的业务跟踪标识和其自身的关联信息。
基于此,针对故障跟踪标识c对应的故障,故障处理方可在指定位置的所有业务跟踪标识中识别具有故障跟踪标识c的业务跟踪标识,并将该具有故障跟踪标识c的业务跟踪标识相关的关联信息确定为故障跟踪标识c对应的故障的故障信息。从第一终端起,至分布式业务流程的最末终端,其业务跟踪标识中均具有故障跟踪标识c,则第一终端至分布式业务流程的最末终端中每个终端的关联信息均为故障跟踪标识c对应的故障的故障信息。
同理,针对故障跟踪标识d对应的故障,故障处理方可在指定位置的所有业务跟踪标识中识别具有故障跟踪标识d的业务跟踪标识,并将该具有故障跟踪标识d的业务跟踪标识相关的关联信息确定为故障跟踪标识d对应的故障的故障信息。从第二终端起,至分布式业务流程的最末终端,其业务跟踪标识中均具有故障跟踪标识d,则第二终端至分布式业务流程的最末终端中每个终端的关联信息均为故障跟踪标识d对应的故障的故障信息。
接下来,以应用于电商领域的分布式业务系统为例,对上述图7和图8所示的应用于分布式业务流程中的故障上报方法进行说明。
参照图9,用户使用购物软件搜索目标商品时,分布式业务系统可为该用户提供符合该用户的实际需求的关联商品集合。这一分布式业务系统包括用户终端、服务器1、服务器2和服务器3,业务流程按照用户终端-数据处理装置1-数据处理装置2-数据处理装置3-数据处理装置2-数据处理装置1-用户终端的顺序执行。其中,数据处理装置1、数据处理装置2、数据处理装置3可分别为独立的服务器,也可为一个服务器中的三个功能模块,还可为用户终端中的功能模块。
具体来说,用户终端、数据处理装置1、数据处理装置2、数据处理装置3的业务流程和执行功能如下:
用户的访问请求到达用户终端,用户终端在用户的访问请求中解析得到用户身份信息和商品搜索关键词。
用户终端将用户身份信息和商品搜索关键词作为业务数据发送至数据处理装置1。数据处理装置1基于用户身份信息在用户信息数据库中获取该用户的习惯数据。
数据处理装置1将该用户的习惯数据和商品搜索关键词作为业务数据发送至数据处理装置2。数据处理装置2将用户的习惯数据和商品搜索关键词输入预置的神经网络分类模型,并输出适合该用户的价格区间。
数据处理装置2将商品搜索关键词和价格区间作为业务数据发送至数据处理装置3。数据处理装置3在商品信息数据库中查找满足该价格区间且具有该商品搜索关键词的商品集合。
数据处理装置3将商品集合作为业务数据发送至数据处理装置2,数据处理装置2按照商品集合中各商品的销量、营销业务买入水平等因素,对商品集合中的商品进行排序,生成有序的商品列表。
数据处理装置2将商品列表作为业务数据发送至数据处理装置1,数据处理装置1在关联商品数据库中,获取商品列表中各商品的关联商品集合。
数据处理装置1将商品列表和关联商品集合作为业务数据发送至用户终端,用户终端在显示商品列表的同时,显示关联商品集合。
分布式业务流程中传递业务数据的步骤未在图中示出。当然,分布式业务不限于上述实例。分布式业务系统可包括任意数量的终端,任意数量的终端可按照任意顺序执行业务流程,而不限于图9给出的形式。
为区分此分布式业务与其他分布式业务,用户终端可为此分布式业务设置唯一的业务跟踪标识x。则在后续故障处理步骤中,当故障处理方识别到业务跟踪标识x时,即可知晓发生故障的是此分布式业务。业务跟踪标识x按照用户终端-数据处理装置1-数据处理装置2-数据处理装置3-数据处理装置2-数据处理装置1-用户终端的分布式业务流程传递。
同时,在上述分布式业务进行的过程中,用户终端首次作为其执行节点时,其自身的关联信息包括用户身份信息和商品搜索关键词等业务数据,还包括与数据处理装置1的连接信息。用户终端将自身的关联信息和业务跟踪标识x关联,缓存至本地。示例性的,业务跟踪标识x可为4位随机数,如,2345。
此时,用户终端首次作为该分布式业务的执行节点时,需检测自身是否有任一关联信息满足故障识别条件。对于用户终端的每种关联信息,故障识别条件中均为该种关联信息的指定属性设置有预设的故障属性范围。如用户身份信息,其指定属性为用户识别码,预设的故障属性范围为多个无效用户的用户识别码组成的集合。这样,可判断用户识别码是否为无效用户的用户识别码中的一个,若是,则满足故障识别条件,若否,则不满足故障识别条件。
经判断,用户终端的全部关联信息的指定属性均未处于对应的故障属性范围内,则用户终端可确定自身的全部关联信息均不满足故障识别条件,无需进入生成故障跟踪标识的步骤,只需在分布式业务流程中将业务跟踪标识x向下游的数据处理装置1传递即可。
数据处理装置1接收到用户终端发送的业务跟踪标识x,数据处理装置1将自身此时的关联信息和业务跟踪标识x关联,缓存至本地。
数据处理装置1首次作为该分布式业务的执行节点时,需检测自身是否有任一关联信息满足故障识别条件。数据处理装置1的第一关联信息包括用户身份信息、商品搜索关键词、用户的习惯数据等业务数据,还包括与用户终端和数据处理装置2的连接信息。
经判断,数据处理装置1自身的全部关联信息的指定属性均未处于对应的故障属性范围内,则数据处理装置1可确定自身的全部关联信息均不满足故障识别条件,无需进入生成故障跟踪标识的步骤,只需在分布式业务流程中将业务跟踪标识x向下游的数据处理装置2传递即可。
数据处理装置2接收到数据处理装置1发送的业务跟踪标识x,数据处理装置2将自身此时的关联信息和业务跟踪标识x关联,缓存至本地。
数据处理装置2首次作为该分布式业务的执行节点时,需检测自身是否有任一关联信息满足故障识别条件。数据处理装置2自身的关联信息包括用户的习惯数据、商品搜索关键词和价格区间等业务数据,还包括与数据处理装置1和数据处理装置3的连接信息。
示例性的,用户的习惯数据的指定属性为被各商品类型的被用户访问次数的实际加权和,则其在故障识别条件中对应的故障属性范围为指定加权和范围。若实际加权和处于指定加权和范围内,则满足故障识别条件,否则,不满足故障识别条件。
经判断,数据处理装置2的全部关联信息的指定属性均未处于对应的故障属性范围内,则数据处理装置2可确定自身的全部关联信息均不满足故障识别条件,无需进入生成故障跟踪标识的步骤,只需在分布式业务流程中将业务跟踪标识x向下游的数据处理装置3传递即可。
数据处理装置3接收到数据处理装置2发送的业务跟踪标识x,首先,数据处理装置3将数据处理装置3自身此时的关联信息和业务跟踪标识x缓存至本地。
接着,数据处理装置3首次作为该分布式业务的执行节点时,需检测自身是否有任一关联信息满足故障识别条件。此时,数据处理装置3自身的关联信息包括商品搜索关键词、价格区间、商品信息数据库的接口信息和商品集合等业务数据,还包括与数据处理装置2的连接信息。
经判断,商品信息数据库的接口信息的指定属性处于对应的故障属性范围内。比如,对于商品信息数据库的接口信息,其指定属性为接口数据传输速率,则接口数据传输速率在故障识别条件中对应的故障属性范围为小于或等于100bps。则当数据处理装置3的接口数据传输速率为50bps时,数据处理装置3判定接口数据传输速率满足故障识别条件。
此时,数据处理装置3为商品信息数据库的接口信息生成8位随机数作为故障跟踪标识e,可选地,故障跟踪标识e为11135649。当然,该8位随机数可使用十进制表示,也可使用十六进制表示。接着,数据处理装置3将故障跟踪标识e添加至业务跟踪标识x的末位后,业务跟踪标识x更新为2345+11135649。
接着,数据处理装置3将数据处理装置3自身的关联信息和具有故障跟踪标识e的业务跟踪标识x上报至网盘,并在分布式业务流程中将具有故障跟踪标识e的业务跟踪标识x向下游的数据处理装置2传递。
数据处理装置2接收到数据处理装置3发送的业务跟踪标识x,数据处理装置2将自身此时的关联信息和接收到的业务跟踪标识x缓存至本地,并确认业务跟踪标识x中具有故障跟踪标识e。
此时,数据处理装置2第二次作为分布式业务流程中的执行节点,需检测自身是否有任一关联信息满足故障识别条件。对于数据处理装置2的每种关联信息,故障识别条件中均为该种关联信息的指定属性设置有预设的故障属性范围。数据处理装置2此时自身的关联信息包括商品集合、商品集合及其中的各商品的销量、营销业务买入水平、商品列表等,还包括与数据处理装置1和数据处理装置3的连接信息。
经判断,数据处理装置2此时的关联信息的指定属性均未处于对应的故障属性范围内,则数据处理装置2可确定自身的全部关联信息均不满足故障识别条件,无需进入生成新的故障跟踪标识的步骤。
由于数据处理装置2接收来自上游的数据处理装置3的业务跟踪标识x,并检测到业务跟踪标识x的固定四位后携带有8位的故障跟踪标识e。这说明数据处理装置2的上游终端中有指定发生了故障,才在业务跟踪标识x中增加了故障跟踪标识e。而数据处理装置2所使用的来自其上游的数据处理装置3的业务数据,在数据处理装置3出现故障的情况下,其业务数据不准确,则数据处理装置2依照此业务数据执行分布式业务,所涉及的关联信息也是与该故障相关的信息。因此,数据处理装置2将自身的关联信息与具有故障跟踪标识e的业务跟踪标识x一同上报至网盘,供故障处理方使用。
接着,数据处理装置2将具有故障跟踪标识e的业务跟踪标识x传递至此时下游的数据处理装置1。
数据处理装置1接收到数据处理装置2发送的业务跟踪标识x,数据处理装置1将自身此时的关联信息和接收到的业务跟踪标识x缓存至本地,并确认业务跟踪标识x中具有故障跟踪标识e。
此时,数据处理装置1第二次作为该分布式业务的执行节点时,需检测自身是否有任一关联信息满足故障识别条件。对于数据处理装置1的每种关联信息,故障识别条件中均为该种关联信息的指定属性设置有预设的故障属性范围。数据处理装置1自身此时的关联信息包括商品列表、关联商品数据库的接口信息、关联商品集合,还包括与用户终端和数据处理装置2的连接信息。
经判断,数据处理装置1自身的全部关联信息的指定属性均未处于对应的故障属性范围内,则数据处理装置1可确定自身的全部关联信息均不满足故障识别条件,无需进入生成新的故障跟踪标识的步骤。
由于数据处理装置1接收来自上游的数据处理装置2的业务跟踪标识x,并检测到业务跟踪标识x的固定四位后携带有8位的故障跟踪标识e。这说明数据处理装置1的上游终端中有指定发生了故障,才在业务跟踪标识x中增加了故障跟踪标识e。而数据处理装置1所使用的来自其上游的数据处理装置2的业务数据,是数据处理装置2基于数据处理装置3的业务数据处理得到的。因此,在数据处理装置3出现故障的情况下,数据处理装置1在此基础上执行分布式业务,所涉及的关联信息也是与该故障相关的信息。
基于此,数据处理装置1将自身的关联信息与具有故障跟踪标识e的业务跟踪标识x一同上报至网盘,供故障处理方使用。
接着,数据处理装置1将具有故障跟踪标识e的业务跟踪标识x传递至此时下游的用户终端。
再接下来,用户终端第二次作为分布式业务流程中的执行节点时,为数据处理装置1的下游终端。其自身的关联信息包括商品列表和关联商品集合,还包括与数据处理装置1的连接信息。
数据终端接收到数据处理装置1发送的业务跟踪标识x,,用户终端首先将自身此时的关联信息和接收到的业务跟踪标识x缓存至本地,并确认业务跟踪标识x中具有故障跟踪标识e。
接着,用户终端第二次作为该分布式业务的执行节点时,检测自身是否有任一关联信息满足故障识别条件。对于用户终端的每种关联信息,故障识别条件中均为该种关联信息的指定属性设置有预设的故障属性范围。
经判断,用户终端此时的关联信息的指定属性均未处于对应的故障属性范围内,则用户终端可确定自身的全部关联信息均不满足故障识别条件,无需进入生成新的故障跟踪标识的步骤。
由于用户终端接收来自上游的数据处理装置1的业务跟踪标识x,并检测到业务跟踪标识x的固定四位后携带有8位的故障跟踪标识e。这说明用户终端的上游终端中有指定发生了故障,才在业务跟踪标识x中增加了故障跟踪标识e。而用户终端所使用的来自其上游的数据处理装置1的业务数据,是数据处理装置1基于数据处理装置2的业务数据,数据处理装置2基于数据处理装置3的业务数据处理得到的。因此,在数据处理装置3出现故障的情况下,用户终端在此基础上执行分布式业务,所涉及的关联信息也是与该故障相关的信息。
基于此,用户终端将自身的关联信息与具有故障跟踪标识e的业务跟踪标识x一同上报至网盘,供故障处理方使用。
此后用户终端可判断自身是否处于分布式业务流程的末端,若用户终端判断自身处于分布式业务流程的末端,则分布式业务流程结束。
在另一种可能的设计中,用户终端此时有关联信息的指定属性处于对应的故障属性范围内。
参照图10所示,与数据处理装置1的连接信息的指定属性为访问接口传输速率,访问接口传输速率故障识别条件中对应的故障属性范围为小于或等于80bps。则当用户终端对数据处理装置1的访问接口传输速率为50bps时,用户终端判定访问接口传输速率满足处于预设的故障属性范围内,满足故障识别条件。
此时,用户终端生成8位随机数作为故障跟踪标识f。比如,36367542。当然,该8位随机数可使用十进制表示,也可使用十六进制表示。
接着,用户终端将故障跟踪标识f添加至业务跟踪标识x的末位后,由于此时的业务跟踪标识x已更新为2345+11135649,则增加故障跟踪标识f后,业务跟踪标识x更新为2345+11135649+36367542。
至此,用户终端将自身的关联信息和增加有故障跟踪标识e和故障跟踪标识f的业务跟踪标识x上报至网盘。由于用户终端第二次作为执行节点时为分布式业务流程的末端,不具有下游终端,则无需继续向下继续传递业务跟踪标识x。
由此,故障跟踪标识e最先由数据处理装置3上报,因此,可确定故障跟踪标识e对应的故障发生于数据处理装置3,实现对对故障位置的清楚准确的定位。
同理,故障跟踪标识f最先由用户终端上报,因此,可确定故障跟踪标识f对应的故障发生于用户终端,实现对对故障位置的清楚准确的定位。
对于故障检测方来说,其可在网盘中查询到业务跟踪标识x中具有故障跟踪标识e的四组关联信息。此四组关联信息为同一故障涉及的全部关联信息。这四组关联信息分别对应数据处理装置3、数据处理装置2、数据处理装置1和用户终端。由此,实现了对故障跟踪标识e对应的故障的关联信息的汇总,便于故障处理方对该故障进行高效处理。
对于故障检测方来说,其可在网盘中查询到业务跟踪标识x中具有故障跟踪标识f的一组关联信息。这一组关联信息为同一故障涉及的全部关联信息,对应用户终端。由此,实现了对故障跟踪标识f对应的故障的关联信息的汇总,便于故障处理方对该故障进行高效处理。
另外,分布式业务流程中的各节点均可设置清理周期。如数据处理装置3,可设置清理周期为24h。数据处理装置3缓存自身的关联信息和具有故障跟踪标识e的业务跟踪标识x后,可保留该缓存24h。在此24h内,其缓存内容作为上报至网盘中内容的备份存在。而在24h后,为节省本地缓存空间,可删除缓存的第一关联信息和业务跟踪标识x。
其中,不同的终端可基于实际业务需要,设置不同的清理周期。
当然,分布式业务系统可包括任意数量的终端,其任意数量的终端可以任意次序执行业务流程,而不限于图9和图10给出的形式。
参照图11,本发明实施例提供了一种故障上报装置1100,用于分布式业务系统中的第一终端,第一终端在执行分布式业务的过程中涉及第一关联信息,该故障上报装置1100包括:故障检测单元1102,用于检测第一关联信息是否满足故障识别条件;故障标识生成单元1104,用于在第一关联信息满足故障识别条件的情况下,为第一关联信息生成故障跟踪标识,其中,当第一关联信息为多个时,为多个第一关联信息分别生成对应的故障跟踪标识;故障信息上报单元1106,用于将第一关联信息和故障跟踪标识上报至与分布式业务系统相关的指定位置;故障标识传递单元1108,用于将故障跟踪标识传递至第二终端,第二终端为第一终端在分布式业务的业务流程中的下游终端。
在一种可能的设计中,故障上报装置1100还包括:第一缓存单元,用于在故障检测单元1102检测第一关联信息是否满足故障识别条件之前,将第一关联信息和分布式业务的业务跟踪标识关联缓存至本地,业务跟踪标识是由分布式业务流程中执行分布式业务的首个终端设置的,用于唯一标识分布式业务;第一故障标识增加单元,用于故障标识生成单元1104为第一关联信息生成故障跟踪标识之后,在缓存至本地的业务跟踪标识中增加与第一关联信息对应的故障跟踪标识;故障信息上报单元1106用于:将第一关联信息和增加有故障跟踪标识的业务跟踪标识上报至与分布式业务系统相关的指定位置;故障标识传递单元1108用于:将增加有故障跟踪标识的业务跟踪标识传递至第二终端。
在一种可能的设计中,故障上报装置1100还包括:第二故障标识增加单元,用于故障标识生成单元1104为第一关联信息生成故障跟踪标识之后、故障信息上报单元1106将第一关联信息和故障跟踪标识上报至与分布式业务系统相关的指定位置之前,在业务跟踪标识中增加与第一关联信息对应的故障跟踪标识,业务跟踪标识是由分布式业务流程中执行分布式业务的首个终端设置的,用于唯一标识分布式业务;第二缓存单元,用于将第一关联信息和增加有故障跟踪标识的业务跟踪标识关联缓存至本地;故障信息上报单元1106用于:将第一关联信息和增加有故障跟踪标识的业务跟踪标识上报至与分布式业务系统相关的指定位置;故障标识传递单元1108用于:将增加有故障跟踪标识的业务跟踪标识传递至第二终端。
在一种可能的设计中,故障上报装置1100还包括:故障位置判断单元,用于故障标识传递单元1108将故障跟踪标识传递至第二终端之前,判断第一终端在分布式业务的业务流程中是否处于末端;故障标识传递单元1108用于:在判断结果为第一终端在分布式业务的业务流程中未处于末端的情况下,将故障跟踪标识传递至第一终端在分布式业务的业务流程中的下游终端。
在一种可能的设计中,第一关联信息包括故障点位置信息,故障点位置信息用于指示故障发生的位置。
在一种可能的设计中,故障跟踪标识为64位随机数、128位随机数或字符串。
参照图12,本发明实施例提供了一种故障上报装置1200,用于分布式业务系统中的第二终端,第二终端在执行分布式业务的过程中涉及第二关联信息,该故障上报装置1200包括:故障标识获得单元1202,用于获得第一故障跟踪标识,第一故障跟踪标识来自第二终端在分布式业务系统中的上游终端;故障信息上报单元1204,用于将第二关联信息和第一故障跟踪标识上报至与分布式业务系统相关的指定位置;故障标识传递单元1206,用于将第一故障跟踪标识传递至下游终端,下游终端为分布式业务的业务流程中位于第二终端下游的终端。
在一种可能的设计中,故障上报装置1200还包括:业务标识接收单元,用于在故障标识获得单元1202获得故障跟踪标识之前,接收分布式业务的业务跟踪标识,业务跟踪标识来自第二终端在分布式业务系统中的上游终端,是由分布式业务流程中执行分布式业务的首个终端设置的,用于唯一标识分布式业务;故障标识获得单元1202用于:在业务跟踪标识中确认第一故障跟踪标识;故障信息上报单元1204用于:将第二关联信息和具有第一故障跟踪标识的业务跟踪标识上报至与分布式业务系统相关的指定位置;故障标识传递单元1206用于:将具有第一故障跟踪标识的业务跟踪标识传递至下游终端。
在一种可能的设计中,故障上报装置1200还包括:故障信息缓存单元,用于在故障标识获得单元1202获得第一故障跟踪标识之前,将第二关联信息和业务跟踪标识缓存至本地;或者在获得第一故障跟踪标识之后,在将第二关联信息和第一故障跟踪标识上报至与分布式业务系统相关的指定位置之前,将第二关联信息和业务跟踪标识缓存至本地;或者,在将第二关联信息和第一故障跟踪标识上报至与分布式业务系统相关的指定位置之后,将第一故障跟踪标识传递至下游终端之前,将第二关联信息和业务跟踪标识缓存至本地;或者,在将第一故障跟踪标识传递至下游终端之后,将第二关联信息和业务跟踪标识缓存至本地。
在一种可能的设计中,故障上报装置1200还包括:第一故障检测单元,用于在故障信息上报单元1204将第二关联信息和第一故障跟踪标识上报至与分布式业务系统相关的指定位置之后,检测第二关联信息是否满足故障识别条件;第一故障标识生成单元,用于在第二关联信息满足故障识别条件的情况下,为第二关联信息生成第二故障跟踪标识;故障信息上报单元1204还用于:将第二故障跟踪标识上报至指定位置;故障标识传递单元1206用于:将所述第一故障跟踪标识和所述第二故障跟踪标识传递至所述下游终端;故障标识传递单元1206还用于:在第二关联信息未满足故障识别条件的情况下,将第一故障跟踪标识传递至下游终端。
在一种可能的设计中,故障上报装置1200还包括:第二故障检测单元,用于在故障标识获得单元1202在业务跟踪标识中确认第一故障跟踪标识之后,检测第二关联信息是否满足故障识别条件;第二故障标识生成单元,用于在第二关联信息满足故障识别条件的情况下,为第二关联信息生成第二故障跟踪标识,并将第二故障跟踪标识增加至具有第一故障跟踪标识的业务跟踪标识中;故障信息上报单元1204还用于:将第二关联信息和具有第一故障跟踪标识和第二故障跟踪标识的业务跟踪标识上报至指定位置;故障标识传递单元1206还用于:将具有第一故障跟踪标识和第二故障跟踪标识的业务跟踪标识传递至下游终端。
在一种可能的设计中,故障上报装置1200还包括:终端位置判断单元,用于在故障标识传递单元1206将故障跟踪标识传递至下游终端之前,还包括:判断第二终端在分布式业务的业务流程中是否处于末端,其中,在判断结果为第二终端在分布式业务的业务流程中未处于末端的情况下,允许将故障跟踪标识传递至第二终端在分布式业务的业务流程中的下游终端。
在一种可能的设计中,第二关联信息包括故障点位置信息,故障点位置信息用于指示故障发生的位置。
在一种可能的设计中,第一故障跟踪标识和第二故障跟踪标识为64位随机数、128位随机数或字符串。
除此之外,本发明实施例还提供了一种分布式业务系统,包括若干个终端,其中至少一个终端执行前述任一实现方式所述的故障上报方法。
本申请实施例还进一步提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端上运行时,使得所述终端执行前述任一实现方式所述的故障上报方法。
本申请实施例还进一步提供了一种计算机程序产品,当计算机程序产品在终端上运行时,使得终端执行如前述任一实现方式所述的故障上报方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid StateDisk)等。
总之,以上所述仅为本发明技术方案的实施例而已,并非用于限定本发明的保护范围。凡根据本发明的揭露,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (20)

1.一种故障上报方法,其特征在于,用于分布式业务系统中的第一终端,所述第一终端在执行分布式业务的过程中涉及第一关联信息,该方法包括:
检测所述第一关联信息是否满足故障识别条件;
在所述第一关联信息满足所述故障识别条件的情况下,为所述第一关联信息生成故障跟踪标识;
将所述第一关联信息和所述故障跟踪标识上报至与所述分布式业务系统相关的指定位置;
将所述故障跟踪标识传递至第二终端,所述第二终端为所述第一终端在所述分布式业务的业务流程中的下游终端。
2.根据权利要求1所述的故障上报方法,其特征在于,在所述检测所述第一关联信息是否满足故障识别条件之前,还包括:
将所述第一关联信息和所述分布式业务的业务跟踪标识关联缓存至本地,所述业务跟踪标识是由所述分布式业务流程中执行所述分布式业务的首个终端设置的,用于唯一标识所述分布式业务;
所述为所述第一关联信息生成故障跟踪标识之后,所述方法还包括:
在缓存至本地的所述业务跟踪标识中增加与所述第一关联信息对应的所述故障跟踪标识;
所述将所述第一关联信息和所述故障跟踪标识上报至与所述分布式业务系统相关的指定位置,包括:
将所述第一关联信息和增加有所述故障跟踪标识的业务跟踪标识上报至与所述分布式业务系统相关的指定位置;
所述将所述故障跟踪标识传递至第二终端,包括:
将所述增加有所述故障跟踪标识的业务跟踪标识传递至所述第二终端。
3.根据权利要求1所述的故障上报方法,其特征在于,所述为所述第一关联信息生成故障跟踪标识之后、所述将所述第一关联信息和所述故障跟踪标识上报至与所述分布式业务系统相关的指定位置之前,所述方法还包括:
在业务跟踪标识中增加与所述第一关联信息对应的所述故障跟踪标识,所述业务跟踪标识是由所述分布式业务流程中执行所述分布式业务的首个终端设置的,用于唯一标识所述分布式业务;
将所述第一关联信息和增加有所述故障跟踪标识的业务跟踪标识关联缓存至本地;
所述将所述第一关联信息和所述故障跟踪标识上报至与所述分布式业务系统相关的指定位置,包括:
将所述第一关联信息和增加有所述故障跟踪标识的业务跟踪标识上报至与所述分布式业务系统相关的指定位置;
所述将所述故障跟踪标识传递至第二终端,包括:
将所述增加有所述故障跟踪标识的业务跟踪标识传递至所述第二终端。
4.根据权利要求1所述的故障上报方法,其特征在于,所述将所述故障跟踪标识传递至第二终端之前,所述方法还包括:
判断所述第一终端在所述分布式业务的业务流程中是否处于末端,其中,在判断结果为所述第一终端在所述分布式业务的业务流程中未处于末端的情况下,将所述故障跟踪标识传递至所述第一终端在所述分布式业务的业务流程中的所述下游终端。
5.根据权利要求1至4中任一项所述的故障上报方法,其特征在于,
所述第一关联信息包括故障点位置信息,所述故障点位置信息用于指示故障发生的位置。
6.根据权利要求1至4中任一项所述的故障上报方法,其特征在于,
所述故障跟踪标识为64位随机数、128位随机数或字符串。
7.一种故障上报方法,其特征在于,用于分布式业务系统中的第二终端,所述第二终端在执行分布式业务的过程中涉及第二关联信息,该方法包括:
获得第一故障跟踪标识,所述第一故障跟踪标识来自所述第二终端在所述分布式业务系统中的上游终端;
将所述第二关联信息和所述第一故障跟踪标识上报至与所述分布式业务系统相关的指定位置;
将所述第一故障跟踪标识传递至下游终端,所述下游终端为所述分布式业务的业务流程中位于所述第二终端下游的终端。
8.根据权利要求7所述的故障上报方法,其特征在于,所述获得故障跟踪标识之前,所述方法还包括:
接收所述分布式业务的业务跟踪标识,所述业务跟踪标识来自所述第二终端在所述分布式业务系统中的上游终端,是由所述分布式业务流程中执行所述分布式业务的首个终端设置的,用于唯一标识所述分布式业务;
所述获得第一故障跟踪标识,包括:
在所述业务跟踪标识中确认所述第一故障跟踪标识;
所述将所述第二关联信息和所述第一故障跟踪标识上报至与所述分布式业务系统相关的指定位置,包括:
将所述第二关联信息和具有所述第一故障跟踪标识的业务跟踪标识上报至与所述分布式业务系统相关的指定位置;
所述将所述第一故障跟踪标识传递至下游终端,包括:
将具有所述第一故障跟踪标识的业务跟踪标识传递至下游终端。
9.根据权利要求8所述的故障上报方法,其特征在于,所述方法还包括:
在所述获得第一故障跟踪标识之前,将所述第二关联信息和所述业务跟踪标识缓存至本地;
或者
在所述获得第一故障跟踪标识之后,在所述将所述第二关联信息和所述第一故障跟踪标识上报至与所述分布式业务系统相关的指定位置之前,将所述第二关联信息和所述业务跟踪标识缓存至本地;
或者,
在所述将所述第二关联信息和所述第一故障跟踪标识上报至与所述分布式业务系统相关的指定位置之后,所述将所述第一故障跟踪标识传递至下游终端之前,将所述第二关联信息和所述业务跟踪标识缓存至本地;
或者,
在所述将所述第一故障跟踪标识传递至下游终端之后,将所述第二关联信息和所述业务跟踪标识缓存至本地。
10.根据权利要求7所述的故障上报方法,其特征在于,在所述将所述第二关联信息和所述第一故障跟踪标识上报至与所述分布式业务系统相关的指定位置之后,所述方法还包括;
检测第二关联信息是否满足所述故障识别条件;
在所述第二关联信息满足所述故障识别条件的情况下,为所述第二关联信息生成第二故障跟踪标识;
将所述第二故障跟踪标识上报至所述指定位置;
所述将所述第一故障跟踪标识传递至下游终端,包括:将所述第一故障跟踪标识和所述第二故障跟踪标识传递至所述下游终端;
在所述第二关联信息未满足所述故障识别条件的情况下,将所述第一故障跟踪标识传递至下游终端。
11.根据权利要求8所述的故障上报方法,其特征在于,在所述业务跟踪标识中确认所述第一故障跟踪标识之后,所述方法还包括:
检测第二关联信息是否满足所述故障识别条件;
在所述第二关联信息满足所述故障识别条件的情况下,
为所述第二关联信息生成第二故障跟踪标识,并将所述第二故障跟踪标识增加至具有第一故障跟踪标识的业务跟踪标识中;
所述将所述第二关联信息和具有所述第一故障跟踪标识的业务跟踪标识上报至与所述分布式业务系统相关的指定位置,包括:
将所述第二关联信息和具有所述第一故障跟踪标识和所述第二故障跟踪标识的业务跟踪标识上报至所述指定位置;
所述将具有所述第一故障跟踪标识的业务跟踪标识传递至下游终端,包括:
将具有所述第一故障跟踪标识和所述第二故障跟踪标识的业务跟踪标识传递至所述下游终端。
12.根据权利要求7所述的故障上报方法,其特征在于,在所述将所述故障跟踪标识传递至下游终端的步骤之前,还包括:
判断所述第二终端在所述分布式业务的业务流程中是否处于末端,其中,在判断结果为所述第二终端在所述分布式业务的业务流程中未处于末端的情况下,允许将所述故障跟踪标识传递至所述第二终端在所述分布式业务的业务流程中的所述下游终端。
13.根据权利要求7至12中任一项所述的故障上报方法,其特征在于,
所述第二关联信息包括故障点位置信息,所述故障点位置信息用于指示故障发生的位置。
14.根据权利要求7至12中任一项所述的故障上报方法,其特征在于,
所述第一故障跟踪标识和所述第二故障跟踪标识为64位随机数、128位随机数或字符串。
15.一种故障上报装置,其特征在于,用于分布式业务系统中的第一终端,所述第一终端在执行分布式业务的过程中涉及第一关联信息,该故障上报装置包括:
故障检测单元,用于检测所述第一关联信息是否满足故障识别条件;
故障标识生成单元,用于在所述第一关联信息满足所述故障识别条件的情况下,为所述第一关联信息生成故障跟踪标识,其中,当所述第一关联信息为多个时,为多个所述第一关联信息分别生成对应的故障跟踪标识;
故障信息上报单元,用于将所述第一关联信息和所述故障跟踪标识上报至与所述分布式业务系统相关的指定位置;
故障标识传递单元,用于将所述故障跟踪标识传递至第二终端,所述第二终端为所述第一终端在所述分布式业务的业务流程中的下游终端。
16.一种故障上报装置,其特征在于,用于分布式业务系统中的第二终端,所述第二终端在执行分布式业务的过程中涉及第二关联信息,该故障上报装置包括:
故障标识获得单元,用于获得第一故障跟踪标识,所述第一故障跟踪标识来自所述第二终端在所述分布式业务系统中的上游终端;
故障信息上报单元,用于将所述第二关联信息和所述第一故障跟踪标识上报至与所述分布式业务系统相关的指定位置;
故障标识传递单元,用于将所述第一故障跟踪标识传递至下游终端,所述下游终端为所述分布式业务的业务流程中位于所述第二终端下游的终端。
17.一种终端,其特征在于,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行上述权利要求1至14中任一项所述的方法。
18.一种分布式业务系统,其特征在于,包括第一终端和第二终端,所述第二终端为所述第一终端在分布式业务的业务流程中的下游终端,其中,
所述第一终端用于执行上述权利要求1至6中任一项所述的方法,所述第二终端用于执行上述权利要求7至14中任一项所述的方法。
19.一种计算机可读存储介质,其特征在于,存储有计算机可执行指令,所述计算机可执行指令用于执行如权利要求1至14中任一项所述的方法流程。
20.一种计算机程序产品,其特征在于,当计算机程序产品在终端上运行时,使得终端执行如权利要求1至14中任一项所述的方法流程。
CN202010357908.3A 2020-04-29 2020-04-29 故障上报方法及终端 Active CN111526068B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010357908.3A CN111526068B (zh) 2020-04-29 2020-04-29 故障上报方法及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010357908.3A CN111526068B (zh) 2020-04-29 2020-04-29 故障上报方法及终端

Publications (2)

Publication Number Publication Date
CN111526068A true CN111526068A (zh) 2020-08-11
CN111526068B CN111526068B (zh) 2023-07-11

Family

ID=71903292

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010357908.3A Active CN111526068B (zh) 2020-04-29 2020-04-29 故障上报方法及终端

Country Status (1)

Country Link
CN (1) CN111526068B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022063032A1 (zh) * 2020-09-28 2022-03-31 华为技术有限公司 一种面向分布式系统的故障信息关联上报方法及相关设备
CN115396282A (zh) * 2022-07-20 2022-11-25 北京奇艺世纪科技有限公司 信息处理方法、系统及装置
CN115460071A (zh) * 2022-07-27 2022-12-09 荣耀终端有限公司 故障定位方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1859165A (zh) * 2005-10-22 2006-11-08 华为技术有限公司 一种业务跟踪的方法和系统
CN101056208A (zh) * 2007-05-31 2007-10-17 华为技术有限公司 业务跟踪方法、网络设备、o&m控制器、业务请求装置
CN101453385A (zh) * 2007-11-30 2009-06-10 华为技术有限公司 一种故障通告的方法及设备
CN101459924A (zh) * 2007-12-10 2009-06-17 中兴通讯股份有限公司 一种gsm系统业务跟踪和异常管理的方法、装置及系统
CN101540637A (zh) * 2008-03-21 2009-09-23 北京润光泰力科技发展有限公司 网络故障的定位方法和系统
CN106559166A (zh) * 2015-09-25 2017-04-05 伊姆西公司 用于分布式处理系统中基于指纹的状态检测方法及设备
US20190379573A1 (en) * 2018-06-12 2019-12-12 Arm Limited Interconnection network for integrated circuit

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1859165A (zh) * 2005-10-22 2006-11-08 华为技术有限公司 一种业务跟踪的方法和系统
CN101056208A (zh) * 2007-05-31 2007-10-17 华为技术有限公司 业务跟踪方法、网络设备、o&m控制器、业务请求装置
CN101453385A (zh) * 2007-11-30 2009-06-10 华为技术有限公司 一种故障通告的方法及设备
CN101459924A (zh) * 2007-12-10 2009-06-17 中兴通讯股份有限公司 一种gsm系统业务跟踪和异常管理的方法、装置及系统
CN101540637A (zh) * 2008-03-21 2009-09-23 北京润光泰力科技发展有限公司 网络故障的定位方法和系统
CN106559166A (zh) * 2015-09-25 2017-04-05 伊姆西公司 用于分布式处理系统中基于指纹的状态检测方法及设备
US20190379573A1 (en) * 2018-06-12 2019-12-12 Arm Limited Interconnection network for integrated circuit

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022063032A1 (zh) * 2020-09-28 2022-03-31 华为技术有限公司 一种面向分布式系统的故障信息关联上报方法及相关设备
CN114363144A (zh) * 2020-09-28 2022-04-15 华为技术有限公司 一种面向分布式系统的故障信息关联上报方法及相关设备
CN114363144B (zh) * 2020-09-28 2023-06-27 华为技术有限公司 一种面向分布式系统的故障信息关联上报方法及相关设备
CN115396282A (zh) * 2022-07-20 2022-11-25 北京奇艺世纪科技有限公司 信息处理方法、系统及装置
CN115396282B (zh) * 2022-07-20 2024-03-15 北京奇艺世纪科技有限公司 信息处理方法、系统及装置
CN115460071A (zh) * 2022-07-27 2022-12-09 荣耀终端有限公司 故障定位方法及装置
CN115460071B (zh) * 2022-07-27 2023-09-29 荣耀终端有限公司 故障定位方法及装置

Also Published As

Publication number Publication date
CN111526068B (zh) 2023-07-11

Similar Documents

Publication Publication Date Title
CN114467297B (zh) 一种应用于电子设备的视频通话的显示方法及相关装置
CN113542839B (zh) 电子设备的投屏方法和电子设备
CN110618933B (zh) 性能分析方法与系统、电子设备与存储介质
CN111526068B (zh) 故障上报方法及终端
CN113992663B (zh) 发送文件的方法、电子设备及可读存储介质
WO2020048392A1 (zh) 应用程序的病毒检测方法、装置、计算机设备及存储介质
CN111127509A (zh) 目标跟踪方法、装置和计算机可读存储介质
CN111949879A (zh) 推送消息的方法、装置、电子设备及可读存储介质
CN113973398B (zh) 无线网络连接方法、电子设备及芯片系统
CN113496477A (zh) 屏幕检测方法及电子设备
CN114173286B (zh) 确定测试路径的方法、装置、电子设备及可读存储介质
CN114827069A (zh) 多媒体数据分享方法及装置
CN114911400A (zh) 分享图片的方法和电子设备
CN111982293A (zh) 体温测量方法、装置、电子设备及存储介质
CN112929870A (zh) 事件订阅方法及电子设备
CN115460445B (zh) 电子设备的投屏方法和电子设备
CN114205318B (zh) 头像显示方法及电子设备
CN111246240A (zh) 存储媒体数据的方法和装置
CN115793062B (zh) 一种耳机在位检测方法及装置
CN116087930B (zh) 音频测距方法、设备、存储介质和程序产品
CN113254409B (zh) 文件共享方法、系统及相关设备
CN116450026B (zh) 用于识别触控操作的方法和系统
CN116033341B (zh) 触发围栏事件的方法和装置
CN111490979B (zh) 信息交互方法、装置及存储介质
CN112583651B (zh) 一种用于对小程序通信接口进行测试的方法、装置及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant