CN112508207A - 故障检测方法、装置、设备及存储介质 - Google Patents

故障检测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112508207A
CN112508207A CN202011445179.3A CN202011445179A CN112508207A CN 112508207 A CN112508207 A CN 112508207A CN 202011445179 A CN202011445179 A CN 202011445179A CN 112508207 A CN112508207 A CN 112508207A
Authority
CN
China
Prior art keywords
module
data
user
target user
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011445179.3A
Other languages
English (en)
Inventor
罗斯彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Citic Bank Corp Ltd
Original Assignee
China Citic Bank Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Citic Bank Corp Ltd filed Critical China Citic Bank Corp Ltd
Priority to CN202011445179.3A priority Critical patent/CN112508207A/zh
Publication of CN112508207A publication Critical patent/CN112508207A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/362Software debugging
    • G06F11/3636Software debugging by tracing the execution of the program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/544Buffers; Shared memory; Pipes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/546Message passing systems or structures, e.g. queues

Abstract

本申请提供一种故障检测方法、装置、设备及存储介质,涉及故障检测技术领域。该方法包括:所述数据采集模块采集目标用户的用户数据,所述用户数据包括:行为数据和日志数据;所述数据分析模块根据所述目标用户的用户数据进行分析,确定所述目标用户是否产生故障;所述数据分析模块在确定所述目标用户产生故障后,向所述告警模块发送告警指示信息;所述告警模块将所述告警指示信息转发至所述处理模块,所述处理模块用于根据所述告警指示信息处理故障。相对于现有技术,避免了用户由于故障造成的产品使用过程中使用体验不佳的问题。

Description

故障检测方法、装置、设备及存储介质
技术领域
本申请涉及故障检测技术领域,具体而言,涉及一种故障检测方法、装置、设备及存储介质。
背景技术
大数据实时采集技术目前已广泛应用于我们各种生活场景中,比如实时抗疫大数据地图、长假交通分流分析等,如何将大数据实时采集应用在产品的故障采集或故障检测上是一个有待解决的重要问题。
现有技术中的产品的故障检测一般是在产品出现应用故障后,系统并不会实时主动向后台管理员发出告警,而是需要用户自己联系对应的产品应用商上报故障,以使产品应用商对用户上报的故障进行解决。
但是这样的处理方式,用户可能由于无法快速获取应用商的联系方式,或者故障报修人数太多,用户需要排队太久等问题,会造成用户在产品的使用过程中体验不佳的问题。
发明内容
本申请的目的在于,针对上述现有技术中的不足,提供一种故障检测方法、装置、设备及存储介质,以解决现有技术中用户在产品使用的过程中体验不佳的问题。
为实现上述目的,本申请实施例采用的技术方案如下:
第一方面,本申请一实施例提供了一种故障检测方法,应用于故障监控系统中,所述故障监控系统包括:数据采集模块、数据分析模块、告警模块和处理模块,所述方法包括:
所述数据采集模块采集目标用户的用户数据,所述用户数据包括:行为数据和日志数据;
所述数据分析模块根据所述目标用户的用户数据进行分析,确定所述目标用户是否产生故障;
所述数据分析模块在确定所述目标用户产生故障后,向所述告警模块发送告警指示信息;
所述告警模块将所述告警指示信息转发至所述处理模块,所述处理模块用于根据所述告警指示信息处理故障。
可选地,所述系统还包括:筛选模块,所述数据采集模块采集目标用户的用户数据之前,所述方法还包括:
所述筛选模块根据预设筛选规则,在多个用户中确定通过所述预设筛选规则的用户为所述目标用户。
可选地,所述数据采集模块采集目标用户的用户数据,包括:
获取服务器发送的行为数据和第一日志数据;
获取所述目标用户的终端设备发送的第二日志数据。
可选地,所述获取所述目标用户的终端设备发送的第二日志数据,包括:
所述数据采集模块响应于所述目标用户在终端设备上的上传操作,获取所述第二日志数据。
可选地,所述数据分析模块包括:预设消息队列模块和预设实时计算模块,所述数据分析模块根据所述目标用户的用户数据进行分析,确定所述目标用户是否产生故障,包括:
所述预设消息队列模块获取并缓存所述用户数据;
所述预设实时计算模块实时从所述预设分布式消息队列模块获取所述用户数据;
所述预设实时计算模块根据获取的所述用户数据进行分析,确定所述目标用户是否产生故障。
可选地,所述预设消息队列模块为分布式消息队列模块,所述预设实时计算模块为分布式实时计算模块。
可选地,所述预设筛选规则包括:预设贡献力或预设优先级;
在所述用户的贡献力大于或等于预设贡献力,或所述用户的优先级大于或等于预设优先级时,确定所述用户为所述目标用户。
可选地,所述数据采集模块响应于所述目标用户在终端设备上的上传操作,获取所述第二日志数据,包括:
所述数据采集模块在检测到所述目标用户出现应用故障后,向所述目标用户发送收集指令,所述收集指令用于收集第二日志数据;
在获取到所述目标用户针对所述收集指令的确认操作后,获取所述第二日志数据。
可选地,所述终端设备包括下述任一种:电脑设备、手机设备或可穿戴智能设备。
第二方面,本申请另一实施例提供了一种故障检测装置,所述装置包括:采集模块、确定模块和发送模块,其中:
所述采集模块,用于所述数据采集模块采集目标用户的用户数据,所述用户数据包括:行为数据和日志数据;
所述确定模块,用于所述数据分析模块根据所述目标用户的用户数据进行分析,确定所述目标用户是否产生故障;
所述发送模块,用于所述数据分析模块在确定所述目标用户产生故障后,向所述告警模块发送告警指示信息;所述告警模块将所述告警指示信息转发至所述处理模块,所述处理模块用于根据所述告警指示信息处理故障。
可选地,所述装置还包括:筛选模块,用于根据预设筛选规则,在多个用户中确定通过所述预设筛选规则的用户为所述目标用户。
可选地,所述装置还包括:获取模块,用于获取服务器发送的行为数据和第一日志数据;获取所述目标用户的终端设备发送的第二日志数据。
可选地,所述获取模块,具体用于所述数据采集模块响应于所述目标用户在终端设备上的上传操作,获取所述第二日志数据。
可选地,所述获取模块,具体用于所述预设消息队列模块获取并缓存所述用户数据;所述预设实时计算模块实时从所述预设分布式消息队列模块获取所述用户数据;
所述确定模块,具体用于所述预设实时计算模块根据获取的所述用户数据进行分析,确定所述目标用户是否产生故障。
可选地,所述预设筛选规则包括:预设贡献力或预设优先级;所述确定模块,具体用于在所述用户的贡献力大于或等于预设贡献力,或所述用户的优先级大于或等于预设优先级时,确定所述用户为所述目标用户。
可选地,所述发送模块,具体用于所述数据采集模块在检测到所述目标用户出现应用故障后,向所述目标用户发送收集指令,所述收集指令用于收集第二日志数据;
所述获取模块,具体用于在获取到所述目标用户针对所述收集指令的确认操作后,获取所述第二日志数据。
第三方面,本申请另一实施例提供了一种故障检测系统,所述系统包括:数据采集模块、数据分析模块、告警模块和处理模块;其中:
所述数据采集模块、所述数据分析模块、所述告警模块和所述处理模块之间通信连接;
所述数据采集模块用于采集目标用户的用户数据,并将采集到的所述用户数据发送至所述数据分析模块;
所述数据分析模块用于在确定所述用户数据中存在故障数据时,向所述告警模块发送告警指示信息;
所述告警模块用于将所述告警指示信息转发至所述处理模块,所述处理模块用于根据所述告警指示信息处理故障。
可选地,所述系统还可包括筛选模块,所述筛选模块与所述数据采集模块之间通信连接,用于在多个用户中确定目标用户。
第四方面,本申请另一实施例提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述第一方面任一所述方法的步骤。
本申请的有益效果是:采用本申请提供的方法,在数据采集模块采集到目标用户的用户数据后,将采集到的目标用户数据发送至数据分析模块,数据分析模块根据对用户数据的分析确定目标用户是否产生故障,若确认产生故障,即目标用户在使用过程中存在使用故障,此时数据分析模块则向告警模块发送告警指示信息,告警模块在接收到告警指示信息后,将告警指示信息转发至处理模块,处理模块根据告警指示信息对目标用户的故障进行故障处理,这样的方法可以通过自动采集用户数据的方式,实现自动对目标用户数据进行分析,并且在确认目标用户数据出现故障的情况下,主动根据告警指示信息对故障进行处理,从而无需目标用户联系对应的运营商就可以实现故障信息的自动分析和自动处理,这样的故障检测方法提高了目标用户在使用过程中的目标用户体验,增加了产品与目标用户之间的应用粘性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请一实施例提供的故障检测系统的结构示意图;
图2为本申请一实施例提供的故障检测方法的流程示意图;
图3为本申请另一实施例提供的故障检测方法的流程示意图;
图4为本申请另一实施例提供的故障检测方法的流程示意图;
图5为本申请另一实施例提供的故障检测方法的流程示意图;
图6为本申请一实施例提供的故障检测装置的结构示意图;
图7为本申请另一实施例提供的故障检测装置的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。
通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
另外,本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
本申请提供的故障检测应用于故障检测场景中,在本申请的下述实施例中,均以故障检测场景为针对银行的目标用户在使用该银行的产品时,产生的故障情况进行检测的场景为例进行说明,其中银行的产品例如可以为:银行应用程序、银行小程序、银行网页等;应当理解虽然本申请的实施例主要围绕银行产品的故障检测进行解释说明,但是本申请提供的方法的一个用场景并不局限于此,本申请提供的方法可以应用于任何需要对故障进行检测的场景,例如对任意应用程序、网页、小程序或其他产品在应用过程中的故障进行检测,具体应用场景可以根据用户需要灵活调整,并不以上述实施例给出的为限。
如下结合多个具体的应用示例,对本申请实施例所提供的一种故障检测方法进行解释说明。图1为本申请一实施例提供的一种故障检测系统的结构示意图,如图1所示,该故障检测系统100可以包括:数据采集模块110、数据分析模块120、告警模块130和处理模块140;其中:
数据采集模块110、数据分析模块120、告警模块130和处理模块140之间通信连接;数据采集模块110用于采集目标用户的用户数据,并将采集到的用户数据发送至数据分析模块120;数据分析模块120用于在确定用户数据中存在故障数据时,向告警模块130发送告警指示信息;告警模块130用于将告警指示信息转发至处理模块140,处理模块140用于根据告警指示信息处理故障。
采用本申请提供的系统,数据采集模块110可以在目标用户通过目标用户的终端设备成功登陆预设银行应用程序后,在目标用户使用预设银行应用程序的过程中实时采集目标用户的用户数据,并将采集到的用户数据发送至数据分析模块120,数据分析模块120根据预设分析算法对目标用户的用户数据进行分析,确定用户数据中是否存在故障数据,若存在,则确定当前目标用户在使用预设银行产品的过程中出现使用故障问题,此时为了提高目标用户的使用体验,数据分析模块120根据故障数据生成告警指示信息,并将告警指示信息发送至告警模块130,告警模块130在接收到告警指示信息后,将告警指示信息转发至处理模块140,运维人员在根据处理模块140获取到告警指示信息后,可以通过处理模块140主动联系目标客户进行故障解决,或在不能及时解决的情况下提供可以通过提供备选解决方案的方式,及时做好安抚目标用户和后续跟进的工作,从而提高目标用户在使用银行产品过程中的使用体验。
可选地,系统还可包括筛选模块,筛选模块与数据采集模块之间通信连接,用于在多个用户中确定目标用户。
示例地,在一些可能的实施例中,筛选模块对接的是产品的用户管理系统,例如可以通过预设接口访问产品的用户管理系统,并在用户的管理系统中获取各用户的产品数据,随后根据的各用户的产品数据判断用户是否为目标用户。
仍以产品为银行产品为例进行说明,产品数据例如可以包括:各用户对应的利润贡献率、存款数量、理财产品购买数量或影响力等,具体产品数据包括的内容根据产品本身,及用户需要灵活调整,并不以上述实施例给出的为限。
可选地,在一些可能的实施例中,终端设备可以包括下述任一种:电脑设备、手机设备或可穿戴智能设备;例如可以为平板电脑、掌上电脑、台式电脑、智能手表、智能手机等可以安装并运行预设银行产品的终端设备,具体终端设备的选择可以根据用户需要灵活调整,并不以上述实施例给出的为限。
如下结合多个具体的应用示例,对本申请实施例所提供的一种故障检测方法进行解释说明。图2为本申请一实施例提供的一种故障检测方法的流程示意图,应用于上述故障监控系统中,故障监控系统包括:数据采集模块、数据分析模块、告警模块和处理模块,如图2所示,该方法包括:
S201:数据采集模块采集目标用户的用户数据。
其中,用户数据包括:行为数据和日志数据,数据采集模块例如可以为Flume。
示例地,在一些可能的实施例中,为了更好的分析工行,需要对系统进行统筹的埋点设计,例如可以为对用户的操作行为以及日志进行数据埋点;随后根据预设数据埋点获取各目标用户对应的行为数据和日志数据。
S202:数据分析模块根据目标用户的用户数据进行分析,确定目标用户是否产生故障。
在本申请的一个实施例中,目标用户例如可以为一些有价值或者有影响力的用户,这些用户如果在使用产品时遇到产品故障的情况,可能会降低该目标用户对产品的印象,导致目标用户可能会替换该产品,甚至会在社交圈中宣传该产品的负面消息,从而给产品对应的运营商造成商誉损失或流失客源。
S203:数据分析模块在确定目标用户产生故障后,向告警模块发送告警指示信息。
S204:告警模块将告警指示信息转发至处理模块,处理模块用于根据告警指示信息处理故障。
可选地,在本申请的一个实施例中,后台技术人员通过处理模块获取到故障数据后,可以主动联系目标客户以对故障进行处理,或在不能及时解决的情况下提供可以通过提供备选解决方案的方式,及时做好安抚目标用户和后续跟进的工作。其中备选解决方案例如可以为承诺目标用户在预设时间内会解决该故障,并在解决后及时通知目标用户;或为目标用户提供一定的补偿机制:例如目标用户可以以预设的折扣购买一定数量的产品,或者为目标用户提供预设优惠券,优惠券可在下次使用该产品时抵扣的,具体备选解决方案包括的内容和形式可以根据用户需要灵活调整,并不以上述实施例给出的为限制。
这样的处理方式可以实时根据采集到的目标用户的用户数据进行大数据分析,使得在目标用户使用产品的过程中发生故障后,可以主动为目标用户提供服务,降低产品故障带来的不良影响,避免目标用户流失,增加目标用户与产品之间的使用粘性,从而起到维护产品形象的作用。
采用本申请提供的方法,在数据采集模块采集到目标用户的用户数据后,将采集到的目标用户数据发送至数据分析模块,数据分析模块根据对用户数据的分析确定目标用户是否产生故障,若确认产生故障,即目标用户在使用过程中存在使用故障,此时数据分析模块则向告警模块发送告警指示信息,告警模块在接收到告警指示信息后,将告警指示信息转发至处理模块,处理模块根据告警指示信息对目标用户的故障进行故障处理,这样的方法可以通过自动采集用户数据的方式,实现自动对目标用户数据进行分析,并且在确认目标用户数据出现故障的情况下,主动根据告警指示信息对故障进行处理,从而无需目标用户联系对应的运营商就可以实现故障信息的自动分析和自动处理,这样的故障检测方法提高了目标用户在使用过程中的目标用户体验,增加了产品与目标用户之间的应用粘性。
可选地,在上述实施例的基础上,本申请实施例还可提供一种故障检测方法,如下结合附图对上述方法的实现过程进行示例说明。图3为本申请另一实施例提供的一种故障检测方法的流程示意图,该系统还包括:筛选模块,如图3所示,S201之前,该方法还可包括:
S205:筛选模块根据预设筛选规则,在多个用户中确定通过预设筛选规则的用户为目标用户。
示例地,在本申请的一个实施例中,预设筛选规则包括:预设贡献力或预设优先级;在用户的贡献力大于或等于预设贡献力,或用户的优先级大于或等于预设优先级时,确定用户为目标用户。
在一些可能的实施例中,筛选模块可以通过预设接口实现与产品的用户管理系统的对接,例如可以通过预设接口访问产品的用户管理系统,并在用户的管理系统中获取各用户的产品数据,随后根据的各用户的产品数据判断用户是否为目标用户。
仍以产品为银行产品为例进行说明,产品数据例如可以包括:各用户对应的利润贡献率、存款数量、理财产品购买数量、资金流动率或影响力等,具体产品数据包括的内容根据产品本身,及用户需要灵活调整,并不以上述实施例给出的为限。
仍以应用场景为银行的预设应用场景为例进行说明,目标用户例如可以为对银行利润的贡献率大于或等于预设利润的贡献率;或是根据社会影响力确定的,社会影响力大于或等于预设影响力的用户为目标用户;应当理解上述实施例仅为示例性说明,具体预设筛选规则具体包括的内容可以根据用户需要灵活调整,并不以上述实施例给出的为限。
可选地,在上述实施例的基础上,本申请实施例还可提供一种故障检测方法,如下结合附图对上述方法中采集用户数据的实现过程进行示例说明。图4为本申请另一实施例提供的一种故障检测方法的流程示意图,如图4所示,S201可包括:
S206:获取服务器发送的行为数据和第一日志数据。
其中,由于产品操作的大部分的日志数据和操作行为数据均会记录在产品对应的服务器上,因此可以通过产品服务器获取目标用户对应的行为数据和第一日志数据,其中获取方式例如可以为实时获取,也可以为间每隔预设时间段后获取,具体获取方式可以根据用户需要灵活调整,并不以上述实施例给出的为限。
S207:获取目标用户的终端设备发送的第二日志数据。
其中,除了记录在产品服务器的第一日志数据,还有部分日志数据是记录在终端设备上(例如之智能手机或平板电脑等)的,比如产品在应用过程中由于意外崩溃产生的本地日志是没有上传至产品服务器的,而是仅记录在目标用户对应的终端设备上,那么此时这部分日志数据就需要从目标用户的终端设备上进行采集,即采集目标用户的终端设备上的第二日志数据。
示例地,在本申请的一个实施例中,第二日志数据的获取方式例如可以为:数据采集模块响应于目标用户在终端设备上的上传操作,获取第二日志数据。
举例说明,在一些可能的实例中,上传操作的触发方式例如可以为:数据采集模块可以在检测到目标用户出现应用故障后,向目标用户发送收集指令,收集指令用于收集第二日志数据;在获取到目标用户针对收集指令的确认操作后,获取第二日志数据。
这样的设置方式可以避免目标用户对获取终端设备上的日志数据产生质疑,当故障发生产生本地错误日志数据后,系统可以主动通过弹窗的形式提示目标用户是否同意系统采集错误日志数据,例如可以弹出指示信息“当前操作崩溃,请点击确认上传按键,将错误上报”,只有目标用户选择同意后,系统才会向该终端设备采集错误日志数据,其中弹窗展示的内容仅为示例性说明,具体弹窗内容和弹窗形式可以根据用户需要灵活调整,只需需要在预先征求目标用户的同意后,再进行错误日志数据的采集即可,避免用户产生泄露隐私的疑问,本申请在此不做任何限制。
可选地,在上述实施例的基础上,本申请实施例还可提供一种故障检测方法,如下结合附图对上述方法中确定是否产生故障的实现过程进行示例说明。图5为本申请另一实施例提供的一种故障检测方法的流程示意图,如图5所示,S202可包括:
S208:预设消息队列模块获取并缓存用户数据。
在本申请的一个实施例中,预设消息队列模块例如可以为Apache Kafka,即可以通过Flume从产品服务器和目标用户的终端设备上进行高效的用户数据采集后,Flume可以将采集到的用户数据传输到Apache Kafka,Apache Kafka在成功获取后对获取的用户数据进行缓存。
S209:预设实时计算模块实时从预设分布式消息队列模块获取用户数据。
S210:预设实时计算模块根据获取的用户数据进行分析,确定目标用户是否产生故障。
可选地,在本申请的一个实施例中,预设实时计算模块例如可以为Apache Storm,即Apache Storm实时从Apache Kafka拉取用户数据并进行大数据分析,分析目标用户的用户数据中是否存在故障数据,若存在则说明目标用户在使用产品的过程中产生过故障,此时需要Apache Storm立即生成告警指示信息,并将生成的告警指示信息发送至告警模块。
可选地,在本申请的一个实施例中,预设消息队列模块为分布式消息队列模块,预设实时计算模块为分布式实时计算模块。
其中,分布式消息队列模块和分布式实时计算模块可以提高数据获取和计算的处理效率,从而更加及时的发现目标用户是否存在使用故障,从而提高故障解决的效率,进一步提高目标用户体验,提供目标用户与产品之间的使用粘性。
采用本申请提供的故障检测方法,可以实时采用分布式消息队列模块和分布式实时计算模块,根据采集到的目标用户的用户数据进行大数据分析,不但可以及时发现用户是否存在使用故障,并且在目标用户使用产品的过程中发生故障后,可以主动为目标用户提供服务,以解决目标用户的使用故障,从而降低产品故障带来的不良影响,避免目标用户流失,增加目标用户与产品之间的粘性,从而起到维护产品形象的作用。
下述结合附图对本申请所提供的故障检测装置进行解释说明,该故障检测装置可执行上述图1-图5任一故障检测方法,其具体实现以及有益效果参照上述,如下不再赘述。
图6为本申请一实施例提供的故障检测装置的结构示意图,如图6所示,该装置包括:采集模块301、确定模块302和发送模块303,其中:
采集模块301,用于数据采集模块采集目标用户的用户数据,用户数据包括:行为数据和日志数据;
确定模块302,用于数据分析模块根据目标用户的用户数据进行分析,确定目标用户是否产生故障;
发送模块303,用于数据分析模块在确定目标用户产生故障后,向告警模块发送告警指示信息;告警模块将告警指示信息转发至处理模块,处理模块用于根据告警指示信息处理故障。
图7为本申请一实施例提供的故障检测装置的结构示意图,如图7所示,该装置还包括:筛选模块304,用于根据预设筛选规则,在多个用户中确定通过预设筛选规则的用户为目标用户。
如图7所示,该装置还包括:获取模块305,具体用于获取服务器发送的行为数据和第一日志数据;获取目标用户的终端设备发送的第二日志数据。
可选地,获取模块305,具体用于数据采集模块响应于目标用户在终端设备上的上传操作,获取第二日志数据。
可选地,获取模块305,具体用于预设消息队列模块获取并缓存用户数据;预设实时计算模块实时从预设分布式消息队列模块获取用户数据;
确定模块302,具体用于预设实时计算模块根据获取的用户数据进行分析,确定目标用户是否产生故障。
可选地,预设筛选规则包括:预设贡献力或预设优先级;确定模块302,具体用于在用户的贡献力大于或等于预设贡献力,或用户的优先级大于或等于预设优先级时,确定用户为目标用户。
可选地,发送模块303,具体用于数据采集模块在检测到目标用户出现应用故障后,向目标用户发送收集指令,收集指令用于收集第二日志数据;
获取模块305,具体用于在获取到目标用户针对收集指令的确认操作后,获取第二日志数据。
上述装置用于执行前述实施例提供的方法,其实现原理和技术效果类似,在此不再赘述。
以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
可选地,本申请还提供一种程序产品,例如存储介质,该存储介质上存储有计算机程序,包括程序,该程序在被处理器运行时执行上述方法对应的实施例。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (13)

1.一种故障检测方法,其特征在于,应用于故障监控系统中,所述故障监控系统包括:数据采集模块、数据分析模块、告警模块和处理模块,所述方法包括:
所述数据采集模块采集目标用户的用户数据,所述用户数据包括:行为数据和日志数据;
所述数据分析模块根据所述目标用户的用户数据进行分析,确定所述目标用户是否产生故障;
所述数据分析模块在确定所述目标用户产生故障后,向所述告警模块发送告警指示信息;
所述告警模块将所述告警指示信息转发至所述处理模块,所述处理模块用于根据所述告警指示信息处理故障。
2.如权利要求1所述的方法,其特征在于,所述系统还包括:筛选模块,所述数据采集模块采集目标用户的用户数据之前,所述方法还包括:
所述筛选模块根据预设筛选规则,在多个用户中确定通过所述预设筛选规则的用户为所述目标用户。
3.如权利要求1所述的方法,其特征在于,所述数据采集模块采集目标用户的用户数据,包括:
获取服务器发送的行为数据和第一日志数据;
获取所述目标用户的终端设备发送的第二日志数据。
4.如权利要求3所述的方法,其特征在于,所述获取所述目标用户的终端设备发送的第二日志数据,包括:
所述数据采集模块响应于所述目标用户在终端设备上的上传操作,获取所述第二日志数据。
5.如权利要求1所述的方法,其特征在于,所述数据分析模块包括:预设消息队列模块和预设实时计算模块,所述数据分析模块根据所述目标用户的用户数据进行分析,确定所述目标用户是否产生故障,包括:
所述预设消息队列模块获取并缓存所述用户数据;
所述预设实时计算模块实时从预设分布式消息队列模块获取所述用户数据;
所述预设实时计算模块根据获取的所述用户数据进行分析,确定所述目标用户是否产生故障。
6.如权利要求5所述的方法,其特征在于,所述预设消息队列模块为分布式消息队列模块,所述预设实时计算模块为分布式实时计算模块。
7.如权利要求2所述的方法,其特征在于,所述预设筛选规则包括:预设贡献力或预设优先级;
在所述用户的贡献力大于或等于预设贡献力,或所述用户的优先级大于或等于预设优先级时,确定所述用户为所述目标用户。
8.如权利要求4所述的方法,其特征在于,所述数据采集模块响应于所述目标用户在终端设备上的上传操作,获取所述第二日志数据,包括:
所述数据采集模块在检测到所述目标用户出现应用故障后,向所述目标用户发送收集指令,所述收集指令用于收集第二日志数据;
在获取到所述目标用户针对所述收集指令的确认操作后,获取所述第二日志数据。
9.如权利要求3所述的方法,其特征在于,所述终端设备包括下述任一种:电脑设备、手机设备或可穿戴智能设备。
10.一种故障检测装置,其特征在于,所述装置包括:采集模块、确定模块和发送模块,其中:
所述采集模块,用于数据采集模块采集目标用户的用户数据,所述用户数据包括:行为数据和日志数据;
所述确定模块,用于数据分析模块根据所述目标用户的用户数据进行分析,确定所述目标用户是否产生故障;
所述发送模块,用于所述数据分析模块在确定所述目标用户产生故障后,向告警模块发送告警指示信息;所述告警模块将所述告警指示信息转发至处理模块,所述处理模块用于根据所述告警指示信息处理故障。
11.一种故障检测系统,其特征在于,所述系统包括:数据采集模块、数据分析模块、告警模块和处理模块;其中:
所述数据采集模块、所述数据分析模块、所述告警模块和所述处理模块之间通信连接;
所述数据采集模块用于采集目标用户的用户数据,并将采集到的所述用户数据发送至所述数据分析模块;
所述数据分析模块用于在确定所述用户数据中存在故障数据时,向所述告警模块发送告警指示信息;
所述告警模块用于将所述告警指示信息转发至所述处理模块,所述处理模块用于根据所述告警指示信息处理故障。
12.如权利要求11所述的系统,其特征在于,所述系统还可包括筛选模块,所述筛选模块与所述数据采集模块之间通信连接,用于在多个用户中确定目标用户。
13.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述权利要求1-9中任一项所述的方法。
CN202011445179.3A 2020-12-11 2020-12-11 故障检测方法、装置、设备及存储介质 Pending CN112508207A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011445179.3A CN112508207A (zh) 2020-12-11 2020-12-11 故障检测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011445179.3A CN112508207A (zh) 2020-12-11 2020-12-11 故障检测方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN112508207A true CN112508207A (zh) 2021-03-16

Family

ID=74971149

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011445179.3A Pending CN112508207A (zh) 2020-12-11 2020-12-11 故障检测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112508207A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115550135A (zh) * 2022-10-10 2022-12-30 广州爱浦路网络技术有限公司 一种告警信息传输方法、装置、网元及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115550135A (zh) * 2022-10-10 2022-12-30 广州爱浦路网络技术有限公司 一种告警信息传输方法、装置、网元及存储介质
CN115550135B (zh) * 2022-10-10 2023-10-24 广州爱浦路网络技术有限公司 一种告警信息传输方法、装置、网元及存储介质

Similar Documents

Publication Publication Date Title
CN106062719B (zh) 根据使用数据的结构化日志模式的服务度量分析
CN112491611B (zh) 故障定位系统、方法、装置、电子设备和计算机可读介质
CN114185708A (zh) 基于分布式链路追踪的数据分析方法、装置和电子设备
CN113157545A (zh) 业务日志的处理方法、装置、设备及存储介质
CN109284236B (zh) 数据预热方法、装置、电子设备及存储介质
US20230259436A1 (en) Systems and methods for monitoring application health in a distributed architecture
CN113704018A (zh) 应用运维数据处理方法、装置、计算机设备及存储介质
CN104866296A (zh) 数据处理方法和装置
CN107317708B (zh) 一种法院业务应用系统的监测方法及装置
CN108880838B (zh) 业务故障的监控方法及装置、计算机设备及可读介质
CN112508207A (zh) 故障检测方法、装置、设备及存储介质
CN109409948B (zh) 交易异常检测方法、装置、设备及计算机可读存储介质
CN111382944A (zh) 作业行为风险识别方法、装置、计算机设备和存储介质
CN114238036A (zh) 一种saas平台异常实时的监控方法及装置
CN114398465A (zh) 互联网服务平台的异常处理方法、装置和计算机设备
CN111835583B (zh) 物联网产品的属性巡检方法、装置和计算机设备
CN117271177A (zh) 基于链路数据的根因定位方法、装置、电子设备及存储介质
CN112214517A (zh) 流数据处理方法及装置、电子设备、存储介质
CN116738091A (zh) 页面监控方法、装置、电子设备及存储介质
CN111045935A (zh) 版本自动审核方法、装置、设备及存储介质
CN115439247A (zh) 一种交易数据处理方法及装置
CN107562599A (zh) 一种参数检测方法及装置
CN112860527A (zh) 应用服务器的故障监测方法及装置
CN112527606A (zh) 数据流程分析方法、装置、计算机设备及存储介质
CN112804104A (zh) 一种预警方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination