CN113537268A - 一种故障检测方法、装置、计算机设备及存储介质 - Google Patents

一种故障检测方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN113537268A
CN113537268A CN202011332460.6A CN202011332460A CN113537268A CN 113537268 A CN113537268 A CN 113537268A CN 202011332460 A CN202011332460 A CN 202011332460A CN 113537268 A CN113537268 A CN 113537268A
Authority
CN
China
Prior art keywords
fault
probability
target
candidate
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011332460.6A
Other languages
English (en)
Inventor
岑东益
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202011332460.6A priority Critical patent/CN113537268A/zh
Publication of CN113537268A publication Critical patent/CN113537268A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Probability & Statistics with Applications (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请实施例公开了一种故障检测方法、装置、计算机设备及存储介质,本申请实施例可以接收智能设备发送的设备数据,设备数据包括运行特征;根据预设的监控特征从设备数据中确定目标运行特征;获取基于历史设备数据构建的不同监控特征与故障及其故障概率之间的对应关系;根据对应关系确定与目标运行特征对应的至少一个候选故障的故障概率;基于至少一个候选故障的故障概率,从至少一个候选故障中确定智能设备的目标故障;根据目标故障生成故障检测结果。提高了对智能设备进行故障检测准确性和及时性,保障了智能设备使用的可靠性、稳定性和安全性。

Description

一种故障检测方法、装置、计算机设备及存储介质
技术领域
本申请涉及互联网技术领域,具体涉及一种故障检测方法、装置、计算机设备及存储介质。
背景技术
随着互联网技术以及科技的发展,智能设备越来越普及,例如,可以通过人脸识别的智能设备,对用户的人脸进行识别,以对用户的身份进行验证;又例如,可以通过刷卡支付的智能设备,刷取用户支付卡中的金额,以完成支付等,因此智能设备给人们的生活带来了诸多便利。
目前,智能设备在使用的过程中难免会出现一些故障,而对智能设备出现故障的获知方式,往往是由用户在使用过程中发现故障,并通知维护人员进行维修,或者是维护人员定期到智能设备所在地对其进行定期检查,以确定智能设备是否存在故障。由于需要人为发现故障并反馈,往往会存在反馈不及时的情况,降低了故障发现并解决的及时性和便捷性;以及由于智能设备分散在各地,因此定期到智能设备所在地对其进行定期检查,需要花费较大的人力及物力成本,降低了故障发现并解决的及时性和便捷性,使得智能设备的可用性、稳定性、可靠性以及安全性较低。
发明内容
本申请实施例提供一种故障检测方法、装置、计算机设备及存储介质,可以提高对故障检测准确性和及时性,保障了智能设备使用的可靠性、稳定性和安全性。
为解决上述技术问题,本申请实施例提供以下技术方案:
本申请实施例提供了一种故障检测方法,包括:
接收智能设备发送的设备数据,所述设备数据包括运行特征;
根据预设的监控特征从所述设备数据中确定目标运行特征;
获取基于历史设备数据构建的不同监控特征与故障及其故障概率之间的对应关系;
根据所述对应关系确定与所述目标运行特征对应的至少一个候选故障的故障概率;
基于所述至少一个候选故障的故障概率,从至少一个候选故障中确定所述智能设备的目标故障;
根据所述目标故障生成故障检测结果。
根据本申请的一个方面,还提供了一种故障检测装置,包括:
接收单元,用于接收智能设备发送的设备数据,所述设备数据包括运行特征;
特征确定单元,用于根据预设的监控特征从所述设备数据中确定目标运行特征;
获取单元,用于获取基于历史设备数据构建的不同监控特征与故障及其故障概率之间的对应关系;
概率确定单元,用于根据所述对应关系确定与所述目标运行特征对应的至少一个候选故障的故障概率;
故障确定单元,用于基于所述至少一个候选故障的故障概率,从至少一个候选故障中确定所述智能设备的目标故障;
生成单元,用于根据所述目标故障生成故障检测结果。
根据本申请的一个方面,还提供了一种计算机设备,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行本申请实施例提供的任一种故障检测方法。
根据本申请的一个方面,还提供了一种存储介质,所述存储介质用于存储计算机程序,所述计算机程序被处理器加载,以执行本申请实施例提供的任一种故障检测方法。
本申请实施例可以接收智能设备发送的设备数据,设备数据包括运行特征;根据预设的监控特征从设备数据中确定目标运行特征;获取基于历史设备数据构建的不同监控特征与故障及其故障概率之间的对应关系;根据对应关系确定与目标运行特征对应的至少一个候选故障的故障概率;基于至少一个候选故障的故障概率,从至少一个候选故障中确定智能设备的目标故障;根据目标故障生成故障检测结果。该方案可以基于监控特征与故障及其故障概率之间的对应关系,确定智能设备的设备数据中目标运行特征对应的候选故障的故障概率,基于候选故障的故障概率自动确定智能设备的目标故障,并生成故障检测结果,提高了对智能设备进行故障检测准确性和及时性,保障了智能设备使用的可靠性、稳定性和安全性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的故障检测方法应用的场景示意图;
图2是本申请实施例提供的故障检测方法的流程示意图;
图3是本申请实施例提供的监控特征与故障及其故障概率之间对应关系的示意图;
图4是本申请实施例提供的网络故障与监控特征之间对应的示意图;
图5是本申请实施例提供的基于特征发生故障的示意图;
图6是本申请实施例提供的基于特征导致故障的故障概率计算的示意图;
图7是本申请实施例提供的基于故障的故障概率确定故障检测结果的示意图;
图8是本申请实施例提供的故障检测方法的另一流程示意图;
图9是本申请实施例提供的概率模型建立和应用的流程示意图;
图10是本申请实施例提供的对概率模型更新的流程示意图;
图11是本申请实施例提供基于人类识别场景的特征与故障之间对应关系的示意图;
图12是本申请实施例提供的对故障检测结果显示的示意图;
图13是本申请实施例提供的对故障检测结果显示的另一示意图;
图14是本申请实施例提供的对故障检测结果显示的另一示意图;
图15是本申请实施例提供的对故障检测结果显示的另一示意图;
图16是本申请实施例提供的故障检测装置的示意图;
图17是本申请实施例提供的服务器的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种故障检测方法、装置、计算机设备及存储介质。
请参阅图1,图1为本申请实施例所提供的故障检测方法应用的场景示意图,该故障检测方法应用可以包括故障检测装置,该故障检测装置具体可以集成在服务器10中,该服务器10可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器,但并不局限于此。
服务器10与智能设备20之间可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。该智能设备20可以是手机、平板电脑、笔记本电脑、台式电脑、可穿戴设备、门禁、车站内闸机、或者刷卡机等。
其中,智能设备20在运行的过程中,可以采集自身的设备数据,并向服务器10发送采集到的设备数据,该设备数据可以包括运行特征,服务器10可以用于接收智能设备20发送的设备数据,根据预设的监控特征从设备数据中确定目标运行特征,以及获取基于历史设备数据构建的不同监控特征与故障及其故障概率之间的对应关系,根据该对应关系确定与目标运行特征对应的至少一个候选故障的故障概率;然后可以基于至少一个候选故障的故障概率,从至少一个候选故障中确定智能设备的目标故障,根据目标故障生成故障检测结果。服务器10还可以将故障检测结果发送给智能设备20,还可以将故障检测结果发送给与智能设备20关联的终端或用户联系账号(邮箱、即时通信账号或手机号等),以提示用户处理智能设备20的目标故障。
需要说明的是,图1所示的故障检测方法应用的场景示意图仅仅是一个示例,本申请实施例描述的故障检测方法应用以及场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着故障检测方法应用的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
在本实施例中,将从故障检测装置的角度进行描述,该故障检测装置具体可以集成在服务器等计算机设备中。
请参阅图2,图2是本申请一实施例提供的故障检测方法的流程示意图。该故障检测方法可以包括:
S101、接收智能设备发送的设备数据,设备数据包括运行特征。
其中,智能设备可以是物联网(The Internet of Things,IoT)智能设备,即可以连接互联网能够提供智能服务的硬件设备,以便与服务器进行通信,例如,智能设备可以是手机、电脑、可穿戴设备、门禁、或者刷卡机等,当然智能设备的类型还可以根据实际需要进行灵活设置,具体类型在此处不做限定。
服务器可以接收智能设备发送的在运行过程中产生的设备数据,该设备数据可以包括运行特征以及其他数据等,该运行特征可以包括业务特征和技术特征等,其中,业务特征可以包括交易事件和用户操作事件,交易事件可以包括通过智能设备完成的交易,例如,通过刷卡机完成支付交易等,用户操作事件可以包括用户在智能设备上操作所产生的事件,例如,用户在刷卡机上进行刷卡的操作,技术特征可以包括网络连接状态和设备运行状态,网络连接状态可以包括已连网、未连网、智能设备所处环境的网络带宽满足数据传输需要、智能设备所处环境的网络带宽不满足数据传输需要等状态,设备运行状态可以包括开机状态、某个功能可用状态和某个功能不可用状态等。
S102、根据预设的监控特征从设备数据中确定目标运行特征。
其中,预设的监控特征可以是预先设置的需要对智能设备进行监控的特征,用于表征智能设备健康状态的指标,由于在不同场景下描述智能设备健康状态的指标各不相同,因此可以根据具体的业务需要来设置一个或多个指标(即监控特征)。例如,该监控特征可以包括业务特征和技术特征,业务特征可以包括交易事件和用户操作事件等,技术特征可以包括网络连接状态和设备运行状态等。
服务器可以根据预设的监控特征从设备数据中确定目标运行特征,例如,当监控特征包括网络连接状态时,可以从设备数据中提取与网络连接状态相关的特征作为目标运行特征;又例如,当监控特征包括交易事件时,可以从设备数据中提取与交易事件相关的特征作为目标运行特征;等等。
在一实施方式中,监控特征包括业务特征和技术特征,业务特征包括交易事件和用户操作事件,技术特征包括网络连接状态和设备运行状态,根据预设的监控特征从设备数据中确定目标运行特征可以包括:根据业务特征从设备数据中提取交易事件和用户操作事件,以及根据技术特征从设备数据中提取网络连接状态和设备运行状态,得到目标运行特征。
为了提高目标运行特征确定的准确性和可靠性,可以基于监控特征确定智能设备对应的目标运行特征,例如,服务器可以根据业务特征从设备数据中提取交易事件和用户操作事件等相关的特征作为目标运行特征,以及根据技术特征从设备数据中提取网络连接状态和设备运行状态等相关的特征作为目标运行特征,从而可以基于目标运行特征对智能设备进行相应的监控。
S103、获取基于历史设备数据构建的不同监控特征与故障及其故障概率之间的对应关系。
当需要使用不同监控特征与故障及其故障概率之间的对应关系时,服务器可以从数据库中获取预先存储的基于智能设备的历史设备数据构建的不同监控特征与故障及其故障概率之间的对应关系,或者,服务器可以从数据库中获取预先存储的智能设备的历史设备数据,基于历史设备数据对智能设备的历史故障进行统计分析,得到不同监控特征与故障及其故障概率之间的对应关系。
其中,一个监控特征可以对应一个或多个故障,以及故障发生的故障概率,例如,如图3所示,监控特征1可以对应故障A、故障B和故障C等,即基于监控特征1可以发生故障A、故障B和故障C等,基于监控特征1发生故障A的故障概率为PA1,基于监控特征1发生故障B的故障概率为PB1,以及基于监控特征1发生故障C的故障概率为PC1等。
需要说明的是,监控特征为故障的数据表现,故障与监控特征之间存在因果关系,例如,如图4所示,智能设备的网络故障,会导致智能设备的心跳质量下降,甚至心跳跌为0,还可能会导致智能设备执行业务流程事件的成功率为0等,但反过来没有直接的因果关系,例如,智能设备的心跳跌为0,不一定是网络故障,也可能是用户主动关机或其他原因等。因此,监控特征与故障之间可能存在的一对一关系,也可能存在多对多的关系,不能基于监控特征直接下定论智能设备发送什么故障。
在一实施方式中,获取基于历史设备数据构建的不同监控特征与故障及其故障概率之间的对应关系可以包括:获取智能设备对应的历史设备数据;基于监控特征对历史设备数据进行故障统计分析,得到不同监控特征与故障及其故障概率之间的对应关系。
为了提高不同监控特征与故障及其故障概率之间的对应关系获取的可靠性,服务器可以从数据库(例如Clickhouse数据库)中获取预先存储的智能设备对应的历史设备数据。例如,该数据库中可以按照智能设备的设备标识关联存储多个智能设备对应的历史设备数据,此时服务器可以获取智能设备的设备标识,从数据库中获取与该设备标识对应的历史设备数据,得到智能设备的历史设备数据。其中,设备标识可以用于唯一识别智能设备,该设备标识可以是智能设备的物理地址(Media Access Control Address,MAC)、名称或编号等,该设备标识可以由数字、字母、字符或文字等组成。
然后,服务器可以基于监控特征对历史设备数据进行故障统计分析,得到不同监控特征与故障及其故障概率之间的对应关系。其中,故障统计分析的具体方式可以根据实际需要进行灵活设置。
在一实施方式中,基于监控特征对历史设备数据进行故障统计分析,得到不同监控特征与故障及其故障概率之间的对应关系可以包括:基于历史设备数据统计监控特征的上报数量、基于监控特征发生的故障、以及基于监控特征发生的故障的发生次数;根据上报数量和发生次数计算故障的故障概率。
为了提高对历史设备数据进行故障统计分析的便捷性,可以基于历史设备数据统计监控特征的上报数量、基于监控特征发生的故障、以及基于监控特征发生的故障的发生次数等。当监控特征包括多个时,可以分别统计每个监控特征的上报数量、基于每个监控特征发生的故障、以及基于每个监控特征发生每个故障的发生次数等。例如,如图5所示,对于智能设备执行一个完整的正常流程需要依次执行监控特征A(监控特征可以简称为特征)、监控特征B、监控特征C、监控特征D和监控特征E等,当智能设备在运行的过程中,依次执行监控特征A、监控特征B和监控特征C后,转回执行监控特征B,此时说明智能设备出现重试,基于监控特征C发生了故障,即基于智能设备上报的历史设备数据中包括的特征(即监控特征)确定智能设备基于监控特征C故障退出流程。由于历史设备数据中可以包括智能设备执行的多次流程事件,因此,如图6所示,可以叠加多次流程事件(即叠加事件流),统计监控特征A、监控特征B、监控特征C、监控特征D和监控特征E等每个监控特征的上报数量、以及基于每个监控特征发生每个故障的发生次数等。然后可以根据监控特征的上报数量和基于监控特征发生故障的发生次数计算故障的故障概率,例如可以将发生次数和上报数量之间的比值作为故障概率,如图6中,特征C的上报数量为3次,基于特征C发生故障的发生次数为1次,因此可以计算得到基于特征C发生故障的故障概率为1/3。
在一实施方式中,获取基于历史设备数据构建的不同监控特征与故障及其故障概率之间的对应关系可以包括:获取智能设备对应的历史设备数据,以及获取预先设置的多个候选监控特征;基于每个候选监控特征对历史设备数据进行故障统计分析,得到每个候选监控特征与故障及其故障概率之间的候选对应关系;基于候选对应关系对多个候选监控特征进行聚类,得到监控特征,以及基于候选对应关系确定监控特征对应的故障的故障概率,以得到不同监控特征与故障及其故障概率之间的对应关系。
由于同一故障的发生可能是由多个监控特征引起的,该多个监控特征有可能是线性相关的,因此为了提高监控特征与故障及其故障概率之间的对应关系构建的准确性,可以将线性相关的监控特征进行归类。例如,服务器可以从数据库中获取预先存储的智能设备对应的历史设备数据,以及获取预先设置的多个候选监控特征,按照上述故障统计分析方式基于每个候选监控特征对历史设备数据进行故障统计分析,得到每个候选监控特征与故障及其故障概率之间的候选对应关系。然后,可以基于候选监控特征与故障及其故障概率之间的候选对应关系,对多个候选监控特征进行聚类,得到监控特征,例如,可以将对应同一种或多种故障的不同候选监控特征归为同一类特征,例如基于候选监控特征A会发生故障a、故障b和故障c,且基于候选监控特征A发生故障a的故障概率为x1,基于候选监控特征A发生故障b的故障概率为y1,以及基于候选监控特征A发生故障c的故障概率为z1;基于候选监控特征B会发生故障a、故障b和故障c,且基于候选监控特征B发生故障a的故障概率为x1,基于候选监控特征B发生故障b的故障概率为y1,以及基于候选监控特征B发生故障c的故障概率为z1;基于候选监控特征C会发生故障a、故障d和故障e,且基于候选监控特征C发生故障a的故障概率为x2,基于候选监控特征C发生故障b的故障概率为y2,以及基于候选监控特征C发生故障c的故障概率为z2,此时由于候选监控特征A和候选监控特征B发生的故障相同且发生故障的故障概率相同,因此可以将候选监控特征A和候选监控特征B归为同一类监控特征。以及可以基于候选对应关系确定监控特征对应的故障的故障概率,以得到不同监控特征与故障及其故障概率之间的对应关系,例如,可以得到候选监控特征A与故障a发生的故障概率x1、故障b发生的故障概率y1和故障c发生的故障概率z1之间的对应关系。
需要说明的是,服务器还可以基于历史设备数据统计智能设备的通信建立心跳事件,例如按照预设时间周期统计智能设备的心跳次数,基于智能设备的心跳次数确定智能设备的心跳质量分,以基于心跳质量分判断智能设备的心跳是否正常,若心跳不足则说明智能设备的网络有异常;若心跳为0则说明智能设备未开机或智能设备无法与服务器通信等。服务器还可以基于历史设备数据统计智能设备的网络连接请求耗时,根据预设时间段内智能设备的网络连接请求的平均耗时确定平均网速,以基于平均网速判断智能设备所处环境的网络带宽是否满足数据传输需要,若平均网速大于预设阈值,则说明智能设备所处环境的网络带宽满足数据传输需要,若平均网速小于或等于预设阈值,则说明智能设备所处环境的网络带宽无法满足数据传输需要。服务器还可以基于历史设备数据统计智能设备的完成正常流程事件的数量,根据完成正常流程事件的数量确定执行流程事件的成功率,以基于成功率判断智能设备的人机交互是否正常。当然,还可以根据实际需求对基于历史设备数据统计智能设备的其他信息,具体内容在此处不做限定。
在一实施方式中,故障检测方法还可以包括:按照更新周期检测预先存储的历史设备数据是否发生变化;若历史设备数据发生变化,则基于监控特征对变化后的历史设备数据进行故障统计分析,以更新不同监控特征与故障及其故障概率之间的对应关系。
为了提高对监控特征与故障及其故障概率之间的对应关系更新的及时性性,服务器可以按照更新周期检测预先存储的历史设备数据是否发生变化,该更新周期可以根据实际需要进行灵活设置,例如更新周期可以是每小时或每天等。若历史设备数据发生变化,则按照上述的故障统计分析方式基于监控特征对变化后的历史设备数据进行故障统计分析,以更新不同监控特征与故障及其故障概率之间的对应关系。例如,智能设备上报了设备数据,服务器可以将上报的设备数据存储至数据库中,此时增加了存储的历史设备数据,可以基于变化后的历史设备数据更新不同监控特征与故障及其故障概率之间的对应关系。
在一实施方式中,故障检测方法还可以包括:按照更新周期检测监控特征是否发生变化;若监控特征发生变化,则基于变化后的监控特征对历史设备数据进行故障统计分析,以更新不同监控特征与故障及其故障概率之间的对应关系。
为了提高对监控特征与故障及其故障概率之间的对应关系更新的灵活性性,服务器可以按照更新周期检测监控特征是否发生变化,该更新周期可以根据实际需要进行灵活设置,例如更新周期可以是每小时或每天等。若监控特征发生变化,则按照上述的故障统计分析方式基于变化后的监控特征对历史设备数据进行故障统计分析,以更新不同监控特征与故障及其故障概率之间的对应关系。例如,若增加了监控特征,则服务器可以基于增加后的监控特征和历史设备数据,更新不同监控特征与故障及其故障概率之间的对应关系。
S104、根据对应关系确定与目标运行特征对应的至少一个候选故障的故障概率。
例如,在得到不同监控特征与故障及其故障概率之间的对应关系后,可以查询不同监控特征与故障及其故障概率之间的对应关系,找到与目标运行特征对应的监控特征,并将该监控特征对应的一个或多个故障,作为目标运行特征对应的一个或多个候选故障,以及将该监控特征对应的一个或多个故障的故障概率,作为目标运行特征对应的一个或多个候选故障的故障概率,即可以确定基于目标运行特征发生候选故障以及发生该候选故障的故障概率。
例如,如图3所示,当目标运行特征为监控特征3时,可以将监控特征3对应的故障A、故障B和故障C,设置为目标运行特征对应的候选故障,即该候选故障包括故障A、故障B和故障C,以及将基于监控特征3发生故障A的故障概率PA3、基于监控特征3发生故障B的故障概率PB3和基于监控特征3发生故障C的故障概率PC3,分别设置为基于目标运行特征发生故障A的故障概率PA3、基于目标运行特征发生故障B的故障概率PB3和基于目标运行特征发生故障C的故障概率PC3
S105、基于至少一个候选故障的故障概率,从至少一个候选故障中确定智能设备的目标故障。
在一实施方式中,候选故障包括多个,基于至少一个候选故障的故障概率,从至少一个候选故障中确定智能设备的目标故障可以包括:从多个候选故障的故障概率中,选择故障概率最大所对应的候选故障作为智能设备的目标故障。
其中,候选故障及其对应的故障概率可以包括一个或者多个,当候选故障及其对应的故障概率为一个时,可以直接将该候选故障设置为智能设备的目标故障,以及将该候选故障的故障概率设置为目标故障的故障概率。当候选故障及其对应的故障概率为多个时,可以从多个候选故障的故障概率中,选择故障概率最大所对应的候选故障作为智能设备的目标故障,以及将该候选故障的故障概率设置为目标故障的故障概率。从而能够给快速确定出智能设备的故障,以便及时处理。
S106、根据目标故障生成故障检测结果。
其中,故障检测结果的样式和具体内容等可以实际需要进行灵活设置,通过故障检测结果可以确定智能设备的健康状态,使用故障概率推测的方式来辅助评估智能设备健康状态,及时并主动发现存在故障的智能设备并及时维修,以提高智能设备的服务质量。
在一实施方式中,根据目标故障生成故障检测结果可以包括:当目标故障的故障概率为第一阈值时,生成的故障检测结果为确定智能设备未发生故障;当目标故障的故障概率为第二阈值时,生成的故障检测结果为确定智能设备发生的故障为目标故障,第二阈值大于第一阈值;当目标故障的故障概率为第一阈值至第二阈值范围内时,生成的故障检测结果为预测智能设备发生目标故障,且发生的可能概率为目标故障的故障概率。
其中,第一阈值和第二阈值可以根据实际需要进行灵活设置,例如,第一阈值可以设置为0,第二阈值可以设置为1。如图7所示,当目标故障的故障概率P为0时,可以生成的故障检测结果为确定智能设备未发生故障,即智能设备是健康的;当目标故障的故障概率为1时,可以生成的故障检测结果为确定智能设备发生了该目标故障,当目标故障的故障概率为0至1范围内时,可以生成的故障检测结果为预测智能设备可能发生了该目标故障,且发生的可能概率为该目标故障对应的故障概率,即无法确定智能设备一定会发生该目标故障,故障概率越大,则目标故障发生的可能性越高,此时可以持续监测该目标故障的故障概率的变化情况来确定智能设备是否一定发生该目标故障,或者可以通过人工排查确定智能设备发生的故障等,例如可以通过故障日志或现场检测等方式确定智能设备发生的故障。
在一实施方式中,根据目标故障生成故障检测结果之后,故障检测方法还可以包括:将故障检测结果发送给与智能设备关联的终端或用户联系账号,以提示用户处理目标故障。
在得到故障检测结果后,服务器可以将故障检测结果发送给与智能设备关联的终端,例如该终端可以是用于显示智能设备的故障检测结果的电脑或手机等,服务器还可以将故障检测结果发送给与智能设备关联的用户联系账号,该用户联系账号可以包括邮箱、即时通信账号或手机号等,以提示用户对智能设备发生的目标故障进行及时处理,提升智能设备的业务服务质量。
需要说明的是,在智能设备与服务器之间的网络连接正常的情况下,若智能设备发生了其他故障(非网络故障),服务器还可以将故障检测结果发送给智能设备,以使得智能设备可以通过显示屏显示或语音播报等方式输出故障检测结果,以便提醒当前正在使用智能设备的用户,方便用户获知智能设备发生的哪种故障,以便停止使用,避免在智能设备出现故障的情况下使用,影响智能设备的使用寿命和使用的安全性等。
本申请实施例可以接收智能设备发送的设备数据,设备数据包括运行特征;根据预设的监控特征从设备数据中确定目标运行特征;获取基于历史设备数据构建的不同监控特征与故障及其故障概率之间的对应关系;根据对应关系确定与目标运行特征对应的至少一个候选故障的故障概率;基于至少一个候选故障的故障概率,从至少一个候选故障中确定智能设备的目标故障;根据目标故障生成故障检测结果。该方案可以基于监控特征与故障及其故障概率之间的对应关系,确定智能设备的设备数据中目标运行特征对应的候选故障的故障概率,基于候选故障的故障概率自动确定智能设备的目标故障,并生成故障检测结果,提高了对智能设备进行故障检测准确性和及时性,保障了智能设备使用的可靠性、稳定性和安全性。
根据上述实施例所描述的方法,以下将举例作进一步详细说明。
本实施例以故障检测装置集成在服务器为例,以服务器对智能设备的人脸识别支付应用场景的故障检测为例,请参阅图8,图8为本申请实施例提供的故障检测方法的流程示意图。该方法流程可以包括:
S201、获取智能设备对人脸识别支付的历史设备数据。
智能设备在对人脸识别支付的过程中可以将采集到的设备数据上报给服务器,服务器可以将接收到的设备数据与智能设备的设备标识关联存储至数据库中,此时将数据库中存储的设备数据作为历史设备数据。
S202、基于预先设置的监控特征对历史设备数据进行故障统计分析,以建立不同监控特征与故障及其故障概率之间对应关系的概率模型。
例如,如图9所示,服务器基于预先设置的监控特征对历史设备数据进行故障统计分析,例如,可以基于历史设备数据统计监控特征的上报数量、基于监控特征发生的故障、以及基于监控特征发生的故障的发生次数等,根据上报数量和发生次数计算故障的故障概率,以建立不同监控特征与故障及其故障概率之间对应关系的概率模型。例如,如图3所示,可以建立监控特征1与故障A及其故障概率PA1、故障B及其故障概率PB1和故障C及其故障概率PC1等之间的对应关系,该对应关系即为概率模型。
需要说明的是,如图10所示,可以根据智能设备对人脸识别支付的历史设备数据的变化情况,或根据监控特征的变化情况,及时更新监控特征与故障及其故障概率之间对应关系的概率模型。
例如,如图11所示,以人脸识别支付的应用场景为例,建立的概率模型可以包括连续N(N的取值可以根据实际需要进行灵活设置)天不刷脸、以及连续N天不联网(即连网)等监控特征与商户弃用、商户网络问题以及硬件故障等故障及其故障概率之间的对应关系。
S203、接收智能设备发送的人脸识别支付对应的设备数据,设备数据包括运行特征。
务器可以接收智能设备发送的在人脸识别支付过程中产生的设备数据,该设备数据可以包括运行特征以及其他数据等。
S204、根据目标监控特征从设备数据中确定目标运行特征。
其中,目标监控特征可以是预先设置的需要对智能设备进行监控的特征,服务器可以根据目标监控特征从设备数据中确定目标运行特征。例如,当目标监控特征包括网络连接状态时,可以从设备数据中提取与网络连接状态相关的特征作为目标运行特征。
S205、根据概率模型确定与目标运行特征对应的多个候选故障的故障概率。
在得到概率模型后,可以根据概率模型确定与目标运行特征对应的多个候选故障的故障概率,例如,如图3所示,当目标运行特征为监控特征3时,可以将监控特征3对应的故障A、故障B和故障C,设置为目标运行特征对应的候选故障,即该候选故障包括故障A、故障B和故障C,以及将基于监控特征3发生故障A的故障概率PA3、基于监控特征3发生故障B的故障概率PB3和基于监控特征3发生故障C的故障概率PC3,分别设置为基于目标运行特征发生故障A的故障概率PA3、基于目标运行特征发生故障B的故障概率PB3和基于目标运行特征发生故障C的故障概率PC3
又例如,如图11所示,当目标运行特征为连续N天不刷脸时,可以将连续N天不刷脸对应的商户弃用、商户网络问题以及硬件故障等故障,设置为目标运行特征对应的候选故障,以及将商户弃用、商户网络问题以及硬件故障等故障发生的故障概率设置为连续N天不刷脸对应的各个故障的故障概率。
S206、从多个候选故障的故障概率中,选择故障概率最大所对应的候选故障作为智能设备的目标故障。
当候选故障及其对应的故障概率为多个时,可以从多个候选故障的故障概率中,选择故障概率最大所对应的候选故障作为智能设备的目标故障,以及将该候选故障的故障概率设置为目标故障的故障概率。
需要说明的是,可以将对智能设备的故障检测分为白盒推测和黑盒推测等两类,其中,白盒推测可以是明确获知智能设备发生的故障,黑盒推测可以是不能明确获知智能设备发生的故障,可以通过数据表象推测可能发生的故障。上报的设备数据中目标运行特征与故障有明确关系的用白盒推测,以便可以相对准确的推断对应故障的发生,例如,如图7所示,白盒推测可以包括:明确知道智能设备的故障对应关系的即故障概率P=1,明确知道智能设备是正常健康的即故障概率P=0,当故障概率P为0和1时都能判断出智能设备是健康还是故障,若白盒推测数据不足以让故障概率P为0或1时,可以用概率模型来推测智能设备可能发生的故障。例如,在人脸识别支付(可以称为人脸支付)场景中:人脸相对于采集摄像头过低的事件表示识别到的人脸偏下,而导致的刷脸识别失败的情况,这是一个明确的错误,可以对应明确的故障解决方案。
上报的设备数据中目标运行特征与故障没有直接明确关系的可以用黑盒推测,对应设备数据的运行特征会对智能设备的故障敏感,能够起到检测故障的作用。例如,在人脸支付场景中的,人脸识别支付成功率会受到网络、算法、设备硬件(摄像头以及连接线等)、以及设备软件(APP逻辑)等产生的故障而影响,因此具体通过监测人脸识别支付成功率来推测故障。基于白盒推测与黑盒推测这两种方式综合迭代,可以提升判断智能设备健康状态的准确性。
S207、根据目标故障生成故障检测结果,将故障检测结果发送给与智能设备关联的终端或用户联系账号。
例如,当目标故障的故障概率P为0时,可以生成的故障检测结果为确定智能设备未发生故障;当目标故障的故障概率为1时,可以生成的故障检测结果为确定智能设备发生了该目标故障,当目标故障的故障概率为0至1范围内时,可以生成的故障检测结果为预测智能设备可能发生了该目标故障,且发生的可能概率为该目标故障对应的故障概率,即无法确定智能设备一定会发生该目标故障,故障概率越大,则目标故障发生的可能性越高,此时可以持续监测该目标故障的故障概率的变化情况来确定智能设备是否一定发生该目标故障,或者可以通过人工排查确定智能设备发生的故障等。
在得到故障检测结果后,服务器可以将故障检测结果发送给与智能设备关联的终端,例如该终端可以是用于显示智能设备的故障检测结果的电脑或手机等,服务器还可以将故障检测结果发送给与智能设备关联的用户联系账号,该用户联系账号可以包括邮箱、即时通信账号或手机号等,以提示用户对智能设备发生的目标故障进行及时处理,提升智能设备的业务服务质量。
例如,如图12所示,可以通过终端显示智能设备进行人脸识别支付的故障检测结果,图12中可以以变化曲线的形式显示预设时间段内智能设备的刷脸情况,包括开始刷脸数、刷脸支付笔数、以及识别通过数等,当刷脸支付笔数以及识别通过数等对应的变化曲线归零时,说明智能设备发生了刷脸支付以及人脸识别支付等相关的故障。如图13所示,可以以漏斗图的形式显示智能设备在人脸识别支付过程中各个运行特征对应的转化率(即成功成功率),如图14所示,当智能设备在人脸识别支付过程中各个运行特征对应的转化率较低时,说明智能设备发生了与各个运行特征相关的故障。如图15所示,可以以饼图的形式显示智能设备在人脸识别支付过程中各个运行特征对应的故障,其中,摄像头启流可以是指开启摄像头的视频流,在摄像头打开后可以先开启视频流,然后捕获有人脸的图像等。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对故障检测方法的详细描述,此处不再赘述。
本申请实施例服务器可以基于智能设备对人脸识别支付的历史设备数据,建立不同监控特征与故障及其故障概率之间对应关系的概率模型,以及接收智能设备发送的人脸识别支付对应的设备数据,基于目标监控特征从设备数据中确定目标运行特征,并基于概率模型确定与目标运行特征对应的多个候选故障的故障概率,从多个候选故障的故障概率中选择故障概率最大所对应的候选故障作为智能设备的目标故障,并生成故障检测结果,此时可以将故障检测结果发送给与智能设备关联的终端或用户联系账号,以便提醒用户及时处理,提高了对智能设备进行故障检测准确性和及时性,保障了智能设备使用的可靠性、稳定性和安全性。
为便于更好的实施本申请实施例提供的故障检测方法,本申请实施例还提供一种基于上述故障检测方法的装置。其中名词的含义与上述故障检测方法中相同,具体实现细节可以参考方法实施例中的说明。
请参阅图16,图16为本申请实施例提供的故障检测装置的结构示意图,其中该故障检测装置可以包括接收单元301、特征确定单元302、获取单元303、概率确定单元304、故障确定单元305以及生成单元306等。
其中,接收单元301,用于接收智能设备发送的设备数据,设备数据包括运行特征。
特征确定单元302,用于根据预设的监控特征从设备数据中确定目标运行特征。
获取单元303,用于获取基于历史设备数据构建的不同监控特征与故障及其故障概率之间的对应关系。
概率确定单元304,用于根据对应关系确定与目标运行特征对应的至少一个候选故障的故障概率。
故障确定单元305,用于基于至少一个候选故障的故障概率,从至少一个候选故障中确定智能设备的目标故障。
生成单元306,用于根据目标故障生成故障检测结果。
在一实施方式中,获取单元303可以包括:
获取子单元,用于获取智能设备对应的历史设备数据;
分析子单元,用于基于监控特征对历史设备数据进行故障统计分析,得到不同监控特征与故障及其故障概率之间的对应关系。
在一实施方式中,分析子单元具体可以用于:基于历史设备数据统计监控特征的上报数量、基于监控特征发生的故障、以及基于监控特征发生的故障的发生次数;根据上报数量和发生次数计算故障的故障概率。
在一实施方式中,获取单元303具体可以用于:获取智能设备对应的历史设备数据,以及获取预先设置的多个候选监控特征;基于每个候选监控特征对历史设备数据进行故障统计分析,得到每个候选监控特征与故障及其故障概率之间的候选对应关系;基于候选对应关系对多个候选监控特征进行聚类,得到监控特征,以及基于候选对应关系确定监控特征对应的故障的故障概率,以得到不同监控特征与故障及其故障概率之间的对应关系。
在一实施方式中,故障检测装置还可以包括:
第一更新单元,用于按照更新周期检测预先存储的历史设备数据是否发生变化;若历史设备数据发生变化,则基于监控特征对变化后的历史设备数据进行故障统计分析,以更新不同监控特征与故障及其故障概率之间的对应关系。
在一实施方式中,故障检测装置还可以包括:
第二更新单元,用于按照更新周期检测监控特征是否发生变化;若监控特征发生变化,则基于变化后的监控特征对历史设备数据进行故障统计分析,以更新不同监控特征与故障及其故障概率之间的对应关系。
在一实施方式中,候选故障包括多个,故障确定单元305具体可以用于:从多个候选故障的故障概率中,选择故障概率最大所对应的候选故障作为智能设备的目标故障。
在一实施方式中,监控特征包括业务特征和技术特征,业务特征包括交易事件和用户操作事件,技术特征包括网络连接状态和设备运行状态,特征确定单元302具体可以用于:根据业务特征从设备数据中提取交易事件和用户操作事件,以及根据技术特征从设备数据中提取网络连接状态和设备运行状态,得到目标运行特征。
在一实施方式中,生成单元306具体可以用于:当目标故障的故障概率为第一阈值时,生成的故障检测结果为确定智能设备未发生故障;当目标故障的故障概率为第二阈值时,生成的故障检测结果为确定智能设备发生的故障为目标故障,第二阈值大于第一阈值;当目标故障的故障概率为第一阈值至第二阈值范围内时,生成的故障检测结果为预测智能设备发生目标故障,且发生的可能概率为目标故障的故障概率。
在一实施方式中,故障检测装置还可以包括:
发送单元,用于将故障检测结果发送给与智能设备关联的终端或用户联系账号,以提示用户处理目标故障。
本申请实施例可以由接收单元301接收智能设备发送的设备数据,设备数据包括运行特征;由特征确定单元302根据预设的监控特征从设备数据中确定目标运行特征;由获取单元303获取基于历史设备数据构建的不同监控特征与故障及其故障概率之间的对应关系;由概率确定单元304根据对应关系确定与目标运行特征对应的至少一个候选故障的故障概率;由故障确定单元305基于至少一个候选故障的故障概率,从至少一个候选故障中确定智能设备的目标故障;由生成单元306根据目标故障生成故障检测结果。该方案可以基于监控特征与故障及其故障概率之间的对应关系,确定智能设备的设备数据中目标运行特征对应的候选故障的故障概率,基于候选故障的故障概率自动确定智能设备的目标故障,并生成故障检测结果,提高了对智能设备进行故障检测准确性和及时性,保障了智能设备使用的可靠性、稳定性和安全性。
本申请实施例还提供一种计算机设备,该服务器可以是服务器,如图17所示,其示出了本申请实施例所涉及的服务器的结构示意图,具体来讲:
该服务器可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图17中示出的服务器结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器401是该服务器的控制中心,利用各种接口和线路连接整个服务器的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行服务器的各种功能和处理数据,从而对服务器进行整体监控。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据服务器的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
服务器还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该服务器还可包括输入单元404,该输入单元404可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,服务器还可以包括显示单元等,在此不再赘述。具体在本实施例中,服务器中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:
接收智能设备发送的设备数据,设备数据包括运行特征;根据预设的监控特征从设备数据中确定目标运行特征;获取基于历史设备数据构建的不同监控特征与故障及其故障概率之间的对应关系;根据对应关系确定与目标运行特征对应的至少一个候选故障的故障概率;基于至少一个候选故障的故障概率,从至少一个候选故障中确定智能设备的目标故障;根据目标故障生成故障检测结果。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对故障检测方法的详细描述,此处不再赘述。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中各种可选实现方式中提供的方法。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过计算机指令来完成,或通过计算机指令控制相关的硬件来完成,该计算机指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。为此,本申请实施例提供一种存储介质,其中存储有计算机程序,计算机程序可以包括计算机指令,该计算机程序能够被处理器进行加载,以执行本申请实施例所提供的任一种故障检测方法。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一种故障检测方法中的步骤,因此,可以实现本申请实施例所提供的任一种故障检测方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种故障检测方法、装置、计算机设备及存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (13)

1.一种故障检测方法,其特征在于,包括:
接收智能设备发送的设备数据,所述设备数据包括运行特征;
根据预设的监控特征从所述设备数据中确定目标运行特征;
获取基于历史设备数据构建的不同监控特征与故障及其故障概率之间的对应关系;
根据所述对应关系确定与所述目标运行特征对应的至少一个候选故障的故障概率;
基于所述至少一个候选故障的故障概率,从至少一个候选故障中确定所述智能设备的目标故障;
根据所述目标故障生成故障检测结果。
2.根据权利要求1所述的故障检测方法,其特征在于,所述获取基于历史设备数据构建的不同监控特征与故障及其故障概率之间的对应关系包括:
获取所述智能设备对应的历史设备数据;
基于所述监控特征对所述历史设备数据进行故障统计分析,得到不同监控特征与故障及其故障概率之间的对应关系。
3.根据权利要求2所述的故障检测方法,其特征在于,所述基于所述监控特征对所述历史设备数据进行故障统计分析,得到不同监控特征与故障及其故障概率之间的对应关系包括:
基于所述历史设备数据统计所述监控特征的上报数量、基于所述监控特征发生的故障、以及基于所述监控特征发生的所述故障的发生次数;
根据所述上报数量和发生次数计算所述故障的故障概率。
4.根据权利要求1所述的故障检测方法,其特征在于,所述获取基于历史设备数据构建的不同监控特征与故障及其故障概率之间的对应关系包括:
获取所述智能设备对应的历史设备数据,以及获取预先设置的多个候选监控特征;
基于每个候选监控特征对所述历史设备数据进行故障统计分析,得到每个候选监控特征与故障及其故障概率之间的候选对应关系;
基于所述候选对应关系对所述多个候选监控特征进行聚类,得到所述监控特征,以及基于所述候选对应关系确定所述监控特征对应的故障的故障概率,以得到不同监控特征与故障及其故障概率之间的对应关系。
5.根据权利要求1所述的故障检测方法,其特征在于,所述故障检测方法还包括:
按照更新周期检测预先存储的所述历史设备数据是否发生变化;
若所述历史设备数据发生变化,则基于所述监控特征对变化后的历史设备数据进行故障统计分析,以更新不同监控特征与故障及其故障概率之间的对应关系。
6.根据权利要求1所述的故障检测方法,其特征在于,所述故障检测方法还包括:
按照更新周期检测所述监控特征是否发生变化;
若所述监控特征发生变化,则基于变化后的监控特征对所述历史设备数据进行故障统计分析,以更新不同监控特征与故障及其故障概率之间的对应关系。
7.根据权利要求1所述的故障检测方法,其特征在于,所述候选故障包括多个,所述基于所述至少一个候选故障的故障概率,从至少一个候选故障中确定所述智能设备的目标故障包括:
从多个候选故障的故障概率中,选择故障概率最大所对应的候选故障作为所述智能设备的目标故障。
8.根据权利要求1所述的故障检测方法,其特征在于,所述监控特征包括业务特征和技术特征,所述业务特征包括交易事件和用户操作事件,所述技术特征包括网络连接状态和设备运行状态,所述根据预设的监控特征从所述设备数据中确定目标运行特征包括:
根据所述业务特征从所述设备数据中提取交易事件和用户操作事件,以及根据所述技术特征从所述设备数据中提取网络连接状态和设备运行状态,得到目标运行特征。
9.根据权利要求1至8任一项所述的故障检测方法,其特征在于,所述根据所述目标故障生成故障检测结果包括:
当所述目标故障的故障概率为第一阈值时,生成的所述故障检测结果为确定所述智能设备未发生故障;
当所述目标故障的故障概率为第二阈值时,生成的所述故障检测结果为确定所述智能设备发生的故障为所述目标故障,所述第二阈值大于所述第一阈值;
当所述目标故障的故障概率为第一阈值至第二阈值范围内时,生成的故障检测结果为预测所述智能设备发生所述目标故障,且发生的可能概率为所述目标故障的故障概率。
10.根据权利要求1至8任一项所述的故障检测方法,其特征在于,所述根据所述目标故障生成故障检测结果之后,所述故障检测方法还包括:
将所述故障检测结果发送给与所述智能设备关联的终端或用户联系账号,以提示用户处理所述目标故障。
11.一种故障检测装置,其特征在于,包括:
接收单元,用于接收智能设备发送的设备数据,所述设备数据包括运行特征;
特征确定单元,用于根据预设的监控特征从所述设备数据中确定目标运行特征;
获取单元,用于获取基于历史设备数据构建的不同监控特征与故障及其故障概率之间的对应关系;
概率确定单元,用于根据所述对应关系确定与所述目标运行特征对应的至少一个候选故障的故障概率;
故障确定单元,用于基于所述至少一个候选故障的故障概率,从至少一个候选故障中确定所述智能设备的目标故障;
生成单元,用于根据所述目标故障生成故障检测结果。
12.一种计算机设备,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行如权利要求1至10任一项所述的故障检测方法。
13.一种存储介质,其特征在于,所述存储介质用于存储计算机程序,所述计算机程序被处理器加载以执行权利要求1至10任一项所述的故障检测方法。
CN202011332460.6A 2020-11-24 2020-11-24 一种故障检测方法、装置、计算机设备及存储介质 Pending CN113537268A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011332460.6A CN113537268A (zh) 2020-11-24 2020-11-24 一种故障检测方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011332460.6A CN113537268A (zh) 2020-11-24 2020-11-24 一种故障检测方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN113537268A true CN113537268A (zh) 2021-10-22

Family

ID=78124185

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011332460.6A Pending CN113537268A (zh) 2020-11-24 2020-11-24 一种故障检测方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN113537268A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114237087A (zh) * 2021-11-09 2022-03-25 深圳市移动力量科技有限公司 监控系统预警方法、装置及计算机可读存储介质
CN114359842A (zh) * 2022-03-17 2022-04-15 季华实验室 协作机器人事故检测系统、方法、存储介质和电子设备
CN114924952A (zh) * 2022-04-28 2022-08-19 杭州悦数科技有限公司 分布式图数据库黑盒健康情况的诊断方法、系统和介质
CN115065585A (zh) * 2022-04-29 2022-09-16 北京达佳互联信息技术有限公司 业务异常监测方法、装置、电子设备及存储介质
CN115277362A (zh) * 2022-07-06 2022-11-01 中国电信股份有限公司 故障诊断方法、装置、电子设备和计算机可读介质
CN115693962A (zh) * 2022-12-30 2023-02-03 北京飞利信信息安全技术有限公司 一种变电站设备监测方法、装置、电子设备及介质
CN117193252A (zh) * 2023-09-28 2023-12-08 广东百德朗科技有限公司 基于数据平台的智慧楼宇远程运维方法、装置及电子设备

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114237087A (zh) * 2021-11-09 2022-03-25 深圳市移动力量科技有限公司 监控系统预警方法、装置及计算机可读存储介质
CN114359842A (zh) * 2022-03-17 2022-04-15 季华实验室 协作机器人事故检测系统、方法、存储介质和电子设备
CN114359842B (zh) * 2022-03-17 2022-06-17 季华实验室 协作机器人事故检测系统、方法、存储介质和电子设备
CN114924952A (zh) * 2022-04-28 2022-08-19 杭州悦数科技有限公司 分布式图数据库黑盒健康情况的诊断方法、系统和介质
CN114924952B (zh) * 2022-04-28 2022-12-27 杭州悦数科技有限公司 分布式图数据库黑盒健康情况的诊断方法、系统和介质
CN115065585A (zh) * 2022-04-29 2022-09-16 北京达佳互联信息技术有限公司 业务异常监测方法、装置、电子设备及存储介质
CN115277362A (zh) * 2022-07-06 2022-11-01 中国电信股份有限公司 故障诊断方法、装置、电子设备和计算机可读介质
CN115693962A (zh) * 2022-12-30 2023-02-03 北京飞利信信息安全技术有限公司 一种变电站设备监测方法、装置、电子设备及介质
CN117193252A (zh) * 2023-09-28 2023-12-08 广东百德朗科技有限公司 基于数据平台的智慧楼宇远程运维方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN113537268A (zh) 一种故障检测方法、装置、计算机设备及存储介质
CN110213371B (zh) 消息消费方法、装置、设备及计算机存储介质
US8903559B2 (en) Energy grid device commissioning
CN111193605B (zh) 一种故障定位方法、装置及存储介质
CN112866185B (zh) 网络流量监控设备和异常流量检测方法
CN106161060B (zh) 数据监控方法和装置
CN106302618A (zh) 远程控制方法、远程服务器、管理设备和终端
CN107704387B (zh) 用于系统预警的方法、装置、电子设备及计算机可读介质
CN109376050A (zh) 一种app监测方法、计算机可读存储介质及终端设备
CN106911494A (zh) 一种故障解决方法及装置
WO2022001751A1 (zh) 虚拟云桌面监测方法、客户端、服务端和存储介质
CN110688277A (zh) 用于微服务框架的数据监控方法及装置
CN111738463A (zh) 运维方法、装置、系统、电子设备及存储介质
CN104361517B (zh) 一种金融系统监控方法、装置及相关系统
CN108039956A (zh) 应用监控方法、系统和计算机可读存储介质
CN104937613A (zh) 量化数据质量的探试
WO2024008130A1 (zh) 故障硬件处理方法、装置和系统
CN106790610A (zh) 一种云系统消息分发方法,装置和系统
WO2023273461A1 (zh) 机器人运营状态监控系统及方法
CN115643158A (zh) 设备集群修复方法、装置、设备和存储介质
CN109947630B (zh) 一种故障告示方法、装置及存储介质
CN114661555A (zh) 设备监测方法、装置、服务器及存储介质
CN107957942B (zh) 一种sql脚本的故障修复方法及其终端
CN109508356B (zh) 数据异常预警方法、装置、计算机设备及存储介质
CN112835780A (zh) 一种业务检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40054039

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination