CN114116286A - 物联网设备离线故障诊断方法、装置及电子设备 - Google Patents

物联网设备离线故障诊断方法、装置及电子设备 Download PDF

Info

Publication number
CN114116286A
CN114116286A CN202111389303.3A CN202111389303A CN114116286A CN 114116286 A CN114116286 A CN 114116286A CN 202111389303 A CN202111389303 A CN 202111389303A CN 114116286 A CN114116286 A CN 114116286A
Authority
CN
China
Prior art keywords
target
fault
internet
offline
fault diagnosis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111389303.3A
Other languages
English (en)
Inventor
曲彤晖
寿洲杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision System Technology Co Ltd
Original Assignee
Hangzhou Hikvision System Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision System Technology Co Ltd filed Critical Hangzhou Hikvision System Technology Co Ltd
Priority to CN202111389303.3A priority Critical patent/CN114116286A/zh
Publication of CN114116286A publication Critical patent/CN114116286A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16YINFORMATION AND COMMUNICATION TECHNOLOGY SPECIALLY ADAPTED FOR THE INTERNET OF THINGS [IoT]
    • G16Y30/00IoT infrastructure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/0636Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis based on a decision tree analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Remote Monitoring And Control Of Power-Distribution Networks (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本申请提供了物联网设备离线故障诊断方法、装置及电子设备。本申请实施例基于故障诊断决策树模型对物联网设备的离线故障进行诊断,这可以实现自动化、智能化、准确且及时地分析出设备离线故障的根因,帮助用户快速获悉设备健康状况,找出病因,及时应对。

Description

物联网设备离线故障诊断方法、装置及电子设备
技术领域
本申请涉及物联网技术,特别涉及物联网设备离线故障诊断方法、装置及电子设备。
背景技术
在物联网应用中,物联网设备在运行期间经常会出现离线故障。以物联网设备为摄像头为例,该离线故障可以体现为:断电、断网、设备码流格式问题不断重启、IP地址规划段存在重复等。
然而,一旦物联网设备出现离线故障,常需要投入大量的人力和时间成本进行排查定位,这就造成了排查问题耗时且困难的局面。
发明内容
本申请提供了物联网设备离线故障诊断方法、装置及电子设备,以避免物联网设备出现离线故障时通过人力排查定位带来的问题。
本申请实施例提供了一种物联网设备离线故障诊断方法,该方法包括:
在检测到目标物联网设备离线时,先获得利用已建立的故障诊断决策树模型进行离线故障诊断时所需的目标点位的当前在线状态;所述目标点位为所述目标物联网设备关联的点位;
当所述目标点位的当前在线状态为在线时,通过所述故障诊断决策树模型诊断出引起所述目标物联网设备离线的初步故障原因为所述目标物联网设备故障,之后再获得通过所述故障诊断决策树模型验证所述初步故障原因时所需的特征向量,通过所述故障诊断决策树模型分析所述特征向量确定引起所述目标物联网设备离线的第一目标故障原因;
当所述目标点位的当前在线状态为离线时,再获得所述故障诊断决策树模型进一步进行离线故障诊断时所需的目标取电点的当前在线状态,所述目标取电点为所述目标点位关联的取电点;通过所述故障诊断决策树模型分析所述目标取电点的当前在线状态确定引起所述目标物联网设备离线的第二目标故障原因。
本申请实施例还提供了一种物联网设备离线故障诊断装置,该装置包括:
数据获取单元,用于在检测到目标物联网设备离线时,先获得利用已建立的故障诊断决策树模型进行离线故障诊断时所需的目标点位的当前在线状态;所述目标点位为所述目标物联网设备关联的点位;
故障诊断单元,用于当所述目标点位的当前在线状态为在线时,通过利用所述故障诊断决策树模型诊断出引起所述目标物联网设备离线的初步故障原因为所述目标物联网设备故障,之后触发所述数据获取单元再获得通过所述故障诊断决策树模型验证所述初步故障原因时所需的特征向量;以及,
通过所述故障诊断决策树模型分析所述特征向量确定引起所述目标物联网设备离线的第一目标故障原因;以及,
当所述目标点位的当前在线状态为离线时,触发所述数据获取单元再获得所述故障诊断决策树模型进一步进行离线故障诊断时所需的目标取电点的当前在线状态,所述目标取电点为所述目标点位关联的取电点,并通过所述故障诊断决策树模型分析所述目标取电点的当前在线状态确定引起所述目标物联网设备离线的第二目标故障原因。
本申请实施例还提供了一种电子设备。该电子设备包括:处理器和机器可读存储介质;
所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令;
所述处理器用于执行机器可执行指令,以实现上述公开的方法的步骤。
由以上技术方案可以看出,本申请实施例基于故障诊断决策树模型对物联网设备的离线故障进行诊断,这可以实现自动化、智能化、准确且及时地分析出设备离线故障的根因,帮助用户快速获悉设备健康状况,找出病因,及时应对。
进一步地,在本实施例中,通过故障诊断决策树模型智能自动化诊断物联网设备的离线故障,可以提高工作效率,有效减少运维人员的人力投入,降低运维成本,并且对于资源规划具有重要意义,同时也减少了关键活动下运维不理想引起的安全或信誉损失。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本申请实施例提供的方法流程图;
图2为本申请实施例提供的故障诊断决策树模型示意图;
图3为本申请实施例提供的物联网设备、点位、取电点三者关联示意图;
图4为本申请实施例提供的目标点位X米范围内的取电点的示意图;
图5为本申请实施例提供的装置结构图;
图6为本申请实施例提供的电子设备结构图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
为了使本领域技术人员更好地理解本申请实施例提供的技术方案,并使本申请实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本申请实施例中技术方案作进一步详细的说明。
本申请实施例通过基于历史故障工单学习的专家经验,融合多维数据生成故障诊断决策树模型,对物联网设备在T时刻离线时发生的故障进行离线故障诊断,以使运维人员对物联网设备在生命周期中的(-∞,T]时间区间内的健康状况做到有效“可控”。可选地,上述多维数据比如为物联网设备的在线状态、物联网设备关联的目标点位的在线状态、目标点位关联的目标取电点的在线状态、供电通知、目标点位附近X米内的正常/异常取电点数量、历史工单断网次数/断电次数、当天状态变更次数、抓拍数据量、VQD结果、录像结果等,本实施例并不具体限定。下面结合图1对本申请实施例提供的方法进行描述;
参见图1,图1为本申请实施例提供的方法流程图。作为一个实施例,图1所示的方法应用于物联网设备管理平台或者后台服务器等,本实施例并不具体限定。
如图1所示,该流程可包括以下步骤:
步骤101,在检测到目标物联网设备离线时,先获得利用已建立的故障诊断决策树模型进行离线故障诊断时所需的目标点位的当前在线状态。
如上描述,本申请实施例通过基于历史故障工单学习的专家经验,融合多维数据并按照决策树算法生成故障诊断决策树模型。图2举例示出了故障诊断决策树模型。下文会举例描述如何生成故障诊断决策树模型,这里暂不赘述。
在建立故障诊断决策树模型后,则应用于本步骤101,可先分析故障诊断决策树模型,发现在检测到目标物联网设备离线时需要先获取目标点位的当前在线状态。在本实施例中,目标点位为目标物联网设备关联的点位。这里,所谓点位是指物联网设备的部署位置比如路口上设置的杆件(需要说明的是,一个杆件上可部署多个不同物联网设备)等,本实施例并不具体限定。基于此,如步骤101描述,在当前检测到目标物联网设备离线时,先获得目标物联网设备关联的目标点位的当前在线状态。
可选地,在一个例子中,目标物联网设备关联的目标点位当前的在线状态可通过以下步骤确定:确定目标点位关联的所有物联网设备(至少包括上述目标物联网设备);在目标点位关联的至少一个物联网设备的当前在线状态为在线时,确定目标点位的当前在线状态为在线,否则,确定目标点位的当前在线状态为离线。如图3所示,例如,点位P1中分布了设备D1……Di,其中,设备D1……Di中的一个设备为目标物联网设备,点位P1为上述目标点位,若设备D1……Di均不在线,则认为目标点位即点位P1离线。反之,若设备D1……Di中的至少一个在线,则认为目标点位即点位P1在线。
在获得目标点位的当前在线状态之后,执行下述步骤102。
步骤102,识别目标点位的当前在线状态为在线还是离线,如果是在线,执行步骤103,如果是离线,执行步骤104。
步骤103,通过故障诊断决策树模型诊断出引起目标物联网设备离线的初步故障原因为目标物联网设备故障,之后再获得通过故障诊断决策树模型验证初步故障原因时所需的特征向量,通过故障诊断决策树模型分析特征向量确定引起目标物联网设备离线的第一目标故障原因。
本步骤103是在判断出目标点位的当前在线状态为在线时执行的。当目标点位的当前在线状态为在线,这也意味着目标物联网设备所处的片区是正常的,而此时目标物联网设备离线,则很可能是目标物联网设备自身故障,故通过故障诊断决策树模型诊断出引起目标物联网设备离线的初步故障原因为目标物联网设备故障。至于该诊断出的初步故障原因到底是不是真实的目标故障原因,还需要通过故障诊断决策树模型验证该初步故障原因。通过分析故障诊断决策树模型,则需要获得通过故障诊断决策树模型验证初步故障原因时所需的特征向量。
可选地,在本实施例中,上述特征向量可包括:第一子向量。其中,第一子向量至少包括:目标物联网设备在指定历史时长内的状态变更次数,以及在状态变更次数小于或等于第一设定次数阈值时目标物联网设备在指定历史时长内的工作量。
在本实施例中,上述状态变更次数包括从在线变更为离线、以及从离线变更为在线的次数。可选地,在本实施例中,目标物联网设备的在线状态(包括在线或者离线,比如,在线通过“1”表示,离线通过“0”表示)是按照周期或者定时采集的,基于此,上述状态变更次数可基于指定历史时长内各采集点(也即时间戳)下采集的目标物联网设备的在线状态(包括在线或者离线,比如,在线通过“1”表示,离线通过“0”表示)进行归并计算,最终得到上述目标物联网设备在指定历史时长内的状态变更次数。
在本实施例中,上述工作量,其具体为目标物联网设备在上述指定历史时长运行期间进行工作时产生的数据量。比如当目标物联网设备为摄像头时,工作量可为抓拍数据量。
可选地,在本实施例中,上述特征向量也可为第二子向量。在一个例子中,第二子向量至少包括:目标物联网设备在指定历史时长内的状态变更次数,以及在状态变更次数大于或等于第二设定次数阈值时目标物联网设备在指定历史时长内的工作情况。
其中,状态变更次数如上描述,这里不再赘述。至于工作情况,其具体为目标物联网设备在上述指定历史时长运行期间进行工作时产生的数据。比如当目标物联网设备为摄像头时,工作情况为录制的视频录像的录像质量(其可通过指定历史时长内录制的视频录像进行归并计算得到)。
需要说明的是,在本实施例中,第二设定次数阈值大于第一设定次数阈值,比如,第一设定次数阈值为0,第二设定次数阈值为10。另外,还需要说明的是,在上面描述中,指定历史时长可根据实际需求设置,比如设置为过去一天等。
基于上面有关特征向量为第一子向量的描述,则本步骤103中通过故障诊断决策树模型分析特征向量确定引起目标物联网设备离线的第一目标故障原因可包括:依据故障诊断决策树模型分析出第一子向量中目标物联网设备在指定历史时长内的工作量是否大于工作量阈值,一旦分析出目标物联网设备在指定历史时长内的工作量大于工作量阈值比如0,则表示此时目标物联网设备并没有故障,有可能是目标物联网设备连接的服务链路故障,基于此,可确定第一目标故障原因为目标物联网设备连接的服务链路故障。而假若目标物联网设备在指定历史时长内的工作量小于或等于工作量阈值,比如工作量等于0,此种情况,可进一步确定第一目标故障原因确实为目标物联网设备故障。最终,在特征向量为第一子向量时确定引起目标物联网设备离线的第一目标故障原因。
类似地,在特征向量为第二子向量时,则上述步骤103中通过故障诊断决策树模型分析特征向量确定引起目标物联网设备离线的第一目标故障原因可包括:依据故障诊断决策树模型分析出第二子向量中目标物联网设备在指定历史时长内的工作情况是否为正常工作情况,一旦分析出目标物联网设备在指定历史时长内的工作情况为正常工作情况,则表示此时目标物联网设备并没有故障,还可以继续工作,而之所以离线,有可能是因为目标物联网设备的IP地址与其他物联网设备的IP地址冲突,基于此,可确定第一目标故障原因为目标物联网设备的IP地址与其他物联网设备的IP地址冲突。假若分析出目标物联网设备在指定历史时长内的工作情况为异常工作情况比如视频录像断频等,则此种情况下,表示此时目标物联网设备并没有故障,还可以继续工作,而之所以离线,结合上述异常工作情况比如视频录像断频等,则可推断是因为目标物联网设备的网络链路不稳定,基于此,可直接确定第一目标故障原因为目标物联网设备的网络链路不稳定。最终,在特征向量为第二子向量时确定引起目标物联网设备离线的第一目标故障原因。
步骤104,再获得故障诊断决策树模型进一步进行离线故障诊断时所需的目标取电点的当前在线状态,通过所述故障诊断决策树模型分析所述目标取电点的当前在线状态确定引起所述目标物联网设备离线的第二目标故障原因。
本步骤104是在判断出目标点位的当前在线状态为离线时执行的。当目标点位的当前在线状态为离线,这也意味着目标点位内所有物联网设备可能具有相同的离线故障原因,比如图3所示的点位P1离线,则点位P1中的设备D1……Di可能具有相同的离线故障原因。至于具体是什么离线故障原因,则需要再获得故障诊断决策树模型进一步进行离线故障诊断时所需的目标取电点的当前在线状态。在本实施例中,目标取电点为所述目标点位关联的取电点。这里,所谓取电点是为指定距离内的点位上部署的物联网设备进行供电的部件比如电源等,本实施例并不具体限定。
作为一个实施例,目标取电点的当前在线状态可通过以下步骤确定:确定目标取电点关联的所有点位(至少包括目标点位),在目标取电点关联的至少一个点位的当前在线状态为在线时,确定目标取电点的当前在线状态为在线,否则,确定目标取电点的当前在线状态为离线。仍如图3所示,取电点E1向点位P1……Pj中的所有设备供电,则认为点位P1……Pj与取电点E1关联,若上述目标点位为点位P1……Pj中的其中一个,则取电点E1为目标取电点,假若点位P1……Pj均不在线,则此时认为目标取电点即取电点E1离线,反之,假若点位P1……Pj中的至少一个在线,则此时认为目标取电点即取电点E1在线。
可选地,在本实施例中,上述步骤104中通过故障诊断决策树模型分析目标取电点的当前在线状态来确定引起目标物联网设备离线的第二目标故障原因时需要细分目标取电点的当前在线状态为在线还是离线。
其中,当目标取电点的当前在线状态为在线时,若目标点位的设定距离X米范围内不存在其他取电点,则通过故障诊断决策树模型分析目标物联网设备的历史故障工单记录来确定引起目标物联网设备离线的上述第二目标故障原因。
这里,假若目标取电点的当前在线状态为在线,此时在目标点位的设定距离X米范围内不存在其他取电点,则可通过故障诊断决策树模型分析目标物联网设备的历史故障工单记录来确定引起目标物联网设备离线的上述第二目标故障原因。
可选地,通过故障诊断决策树模型分析目标物联网设备的历史故障工单记录来确定引起目标物联网设备离线的第二目标故障原因可包括:
通过故障诊断决策树模型分析目标物联网设备的历史故障工单记录(具体可汇聚各历史故障工单记录中的断电故障,得到断电次数,以及汇聚各历史故障工单记录中的断网故障,得到断网次数),之后,若依据历史故障工单记录确定上述断电次数大于上述断网次数,则确定第二目标故障原因为断电,若依据历史故障工单记录确定断电次数小于断网次数,则确定第二目标故障原因为断网,若依据历史故障工单记录确定断电次数等于断网次数,确定第二目标故障原因为断电和/或断网(也即,断电、断网占比持平,都有可能出现)。最终确定出目标取电点的当前在线状态为在线时,若此时在目标点位的设定距离X米范围内不存在其他取电点如何确定上述第二目标故障原因。
当然,假若目标取电点的当前在线状态为在线,此时在目标点位的设定距离X米范围内还存在其他取电点,则可通过故障诊断决策树模型进一步分析目标点位的设定距离X米范围内的正常取电点数量、异常取电点数量,通过故障诊断决策树模型分析正常取电点数量、异常取电点数量,确定所述第二目标故障原因。比如,通过故障诊断决策树模型分析出正常取电点数量大于异常取电点数量,则确定第二目标故障原因为断电;通过故障诊断决策树模型分析出正常取电点数量小于异常取电点数量,则确定第二目标故障原因为断网;通过故障诊断决策树模型分析出正常取电点数量等于异常取电点数量,则确定第二目标故障原因为断网和/或断电。
在本实施例中,正常取电点数量是指处于所述目标点位的X米范围内且在线状态为在线的取电点的数量(其可通过对目标点位和取电点关联信息进行归并运算得到),异常取电点数量是指处于目标点位的X米范围内且在线状态为离线的取电点的数量(其可通过对目标点位和取电点关联信息进行归并运算得到)。图4举例示出了目标点位(以点位P1为目标点位为例)的X米范围内的取电点。一般地,由于点位和物联网设备比如摄像机等在安装后位置是固定的,因此可通过在设置X时尽可能扩展经纬度坐标落在目标点位的X米范围内的点位数,并计算出在该范围内正常取电点数量和异常取电点数量。可选地,X可为通过KNN算法不断训练来取得概率分布的最优值。
以上对目标取电点的当前在线状态为在线时如何确定引起目标物联网设备离线的第二目标故障原因进行了描述,下面对目标取电点的当前在线状态为离线时如何确定引起目标物联网设备离线的第二目标故障原因进行描述:
在本实施例中,假若目标取电点的当前在线状态为离线,则在步骤104中,通过故障诊断决策树模型分析目标物联网设备是否在已获得的停电范围确定引起目标物联网设备离线的第二目标故障原因。在本实施例中,停电范围可基于市政施工停电数据得到。
可选地,本实施例中,通过故障诊断决策树模型分析目标物联网设备是否在已获得的停电范围确定引起目标物联网设备离线的第二目标故障原因可包括:
通过故障诊断决策树模型分析目标物联网设备在上述停电范围内,则直接确定上述第二目标故障原因为断电,否则,
通过分析故障诊断决策树模型进一步获得处于所述目标点位的设定距离X米范围内的正常取电点数量、异常取电点数量,正常取电点数量、异常取电点数量如上描述;通过故障诊断决策树模型分析正常取电点数量、异常取电点数量,确定第二目标故障原因。比如,通过故障诊断决策树模型分析出正常取电点数量大于异常取电点数量,则确定第二目标故障原因为断电;通过故障诊断决策树模型分析出正常取电点数量小于异常取电点数量,则确定第二目标故障原因为断网;通过故障诊断决策树模型分析出正常取电点数量等于异常取电点数量,则确定第二目标故障原因为断网和/或断电。最终确定出目标取电点的当前在线状态为离线时,如何确定上述第二目标故障原因。
至此,完成图1所示流程。
通过图1所示流程可以看出,本申请实施例基于故障诊断决策树模型对物联网设备的离线故障进行诊断,这可以实现自动化、智能化、准确且及时地分析出设备离线故障的根因,帮助用户快速获悉设备健康状况,找出病因,及时应对。
进一步地,在本实施例中,通过故障诊断决策树模型智能自动化诊断物联网设备的离线故障,可以提高工作效率,有效减少运维人员的人力投入,降低运维成本,并且对于资源规划具有重要意义,同时也减少了关键活动下运维不理想引起的安全或信誉损失。
需要说明的是,上述第一目标故障原因、第二目标故障原因,虽然都称为目标,但精准来说其应该是疑似。这里之所以称为目标,只是便于好描述而已。为更精准确定故障根因,在确定出上述第一目标故障原因、第二目标故障原因中的任一个时,还可基于人工进行验证。
需要说明的是,如上描述,在本实施例中,故障诊断决策树模型是基于持续积累的专家经验(也称知识库)并结合实际现场情况以及决策树算法得到的,比如图2所示的故障诊断决策树模型。在具体实现时,故障诊断决策树模型比如图2所示的模型,其可以变形为如表1所示的故障诊断决策树模型设计矩阵:
Figure BDA0003368227110000111
Figure BDA0003368227110000121
Figure BDA0003368227110000131
表1
在上述表1中,上述断电、断网概率都是通过专家经验给出的通用值,也即是一般规律。这种规律是可以应用的,具备一定的准确率,但是准确率还可以提升。另外,在表1中“/”表示不考虑。
下面对本申请实施例提供的故障诊断决策树模型进行描述:
首先,汇聚样本数据:
在本实施例中,汇聚样本数据不限于表2所示的数据,表2仅作为示例。如表2所示,在一个例子中,其中物联网设备的设备因子比如设备在线状态数据为关键特征,剩余空域因子等其他因子作为可选特征,可以视作可选实施例之一。
Figure BDA0003368227110000132
Figure BDA0003368227110000141
表2
之后,对上述汇聚的样本数据进行预处理,以将其转换为可轻松提取状态指示器的形式。比如,这里的预处理包括诸如去噪、剔除异常值和删除缺失值等,本实施例并不具体限定。
之后,对经由预处理的样本数据分类,得到表3至表7。其中,表3至表7分别为取电档案数据表、点位状态数据表、设备状态表、历史状态表、停电通知数据表。
Figure BDA0003368227110000142
Figure BDA0003368227110000151
表3
Figure BDA0003368227110000152
表4
Figure BDA0003368227110000153
Figure BDA0003368227110000161
表5
Figure BDA0003368227110000162
表6
Figure BDA0003368227110000163
表7
之后,对上述表3至表7中的数据进行归并计算,可得到如表8所示的特征向量表:
Figure BDA0003368227110000164
表8
在上述表5、表8中,资源标识确定了唯一一个物联网设备。
之后,通过持续积累的专家经验(也称专家知识库、专家规则)并结合实际现场情况,建立上述的故障诊断决策树模型。比如图2所示的故障诊断决策树模型。通过建立故障诊断决策树模型,来完成对物联网设备的离线故障诊断。比如当物联网设备发生离线时,通过故障诊断决策树模型分析其离线故障原因,比如可为供电故障、链路故障、设备故障等。
需要说明的是,在本实施例中,还可以通过持续采集现场运行数据,来反馈改进上述故障诊断决策树模型,使得故障诊断决策树模型更加准确。
另外,可选地,通过KNN算法训练来验证对故障诊断决策树模型诊断出的断电\断网这类故障原因的诊断准确率。
下面以一个具体应用为例描述:
表9示出了通过故障诊断决策树模型诊断出各物联网设备的故障原因:
Figure BDA0003368227110000171
表9
在表9中,资源标识确定了唯一一个物联网设备。
通过表9可以看出,通过故障诊断决策树模型可以自动化、智能化、准确及时地分析出物联网设备离线故障的根因,以帮助用户快速获悉设备健康状况,找出病因,及时应对。
以上对本申请实施例提供的方法进行了描述,下面对本申请实施例提供的装置进行描述:
参见图5,图5为本申请实施例提供的装置结构图。如图5所示,该装置可包括:
数据获取单元,用于在检测到目标物联网设备离线时,先获得利用已建立的故障诊断决策树模型进行离线故障诊断时所需的目标点位的当前在线状态;所述目标点位为所述目标物联网设备关联的点位;
故障诊断单元,用于当所述目标点位的当前在线状态为在线时,通过利用所述故障诊断决策树模型诊断出引起所述目标物联网设备离线的初步故障原因为所述目标物联网设备故障,之后触发所述数据获取单元再获得通过所述故障诊断决策树模型验证所述初步故障原因时所需的特征向量;以及,
通过所述故障诊断决策树模型分析所述特征向量确定引起所述目标物联网设备离线的第一目标故障原因;以及,
当所述目标点位的当前在线状态为离线时,触发所述数据获取单元再获得所述故障诊断决策树模型进一步进行离线故障诊断时所需的目标取电点的当前在线状态,所述目标取电点为所述目标点位关联的取电点,并通过所述故障诊断决策树模型分析所述目标取电点的当前在线状态确定引起所述目标物联网设备离线的第二目标故障原因。
可选地,目标点位的当前在线状态通过以下步骤确定:
确定目标点位关联的所有物联网设备,所述所有物联网设备至少包括所述目标物联网设备;
在所述目标点位关联的至少一个物联网设备的当前在线状态为在线时,确定所述目标点位的当前在线状态为在线,否则,确定所述目标点位的当前在线状态为离线。
可选地,特征向量包括:
第一子向量,所述第一子向量至少包括:所述目标物联网设备在指定历史时长内的状态变更次数,以及在所述状态变更次数小于或等于第一设定次数阈值时所述目标物联网设备在所述指定历史时长内的工作量;所述状态变更次数包括从在线变更为离线、以及从离线变更为在线的次数;当目标物联网设备为摄像头时,所述工作量为抓拍数据量;或者,
第二子向量,所述第二子向量至少包括:所述目标物联网设备在指定历史时长内的状态变更次数,以及在所述状态变更次数大于或等于第二设定次数阈值时所述目标物联网设备在所述指定历史时长内的工作情况,其中,当目标物联网设备为摄像头时,所述工作情况为录制的视频录像的录像质量;所述第二设定次数阈值大于所述第一设定次数阈值。
可选地,所述通过所述故障诊断决策树模型分析所述特征向量确定引起所述目标物联网设备离线的第一目标故障原因包括:
依据所述故障诊断决策树模型分析出所述第一子向量中所述目标物联网设备在指定历史时长内的工作量大于工作量阈值时,确定所述第一目标故障原因为所述目标物联网设备连接的服务链路故障,否则,确定所述第一目标故障原因为所述目标物联网设备故障;或者,
依据所述故障诊断决策树模型分析出所述第二子向量中所述目标物联网设备在指定历史时长内的工作情况为正常工作情况时,确定所述第一目标故障原因为所述目标物联网设备的IP地址与其他物联网设备的IP地址冲突,否则,确定所述第一目标故障原因为所述目标物联网设备的网络链路不稳定。
可选地,所述目标取电点的当前在线状态通过以下步骤确定:
确定所述目标取电点关联的所有点位,所述所有点位至少包括所述目标点位;
在所述目标取电点关联的至少一个点位的当前在线状态为在线时,确定所述目标取电点的当前在线状态为在线,否则,确定所述目标取电点的当前在线状态为离线。
可选地,所述通过所述故障诊断决策树模型分析所述目标取电点的当前在线状态确定引起所述目标物联网设备离线的第二目标故障原因包括:
在所述目标取电点的当前在线状态为离线时,通过所述故障诊断决策树模型分析所述目标物联网设备是否在已获得的停电范围来确定引起所述目标物联网设备离线的所述第二目标故障原因;
在所述目标取电点的当前在线状态为在线时,若所述目标点位的设定距离X米范围内不存在其他取电点,则通过所述故障诊断决策树模型分析所述目标物联网设备的历史故障工单记录来确定引起所述目标物联网设备离线的所述第二目标故障原因。
可选地,上述通过故障诊断决策树模型分析所述目标物联网设备的历史故障工单记录来确定引起所述目标物联网设备离线的所述第二目标故障原因包括:
通过所述故障诊断决策树模型分析所述目标物联网设备的历史故障工单记录;
若依据所述历史故障工单记录确定断电次数大于断网次数,确定所述第二目标故障原因为断电,若依据所述历史故障工单记录确定断电次数小于断网次数,确定所述第二目标故障原因为断网,若依据所述历史故障工单记录确定断电次数等于断网次数,确定所述第二目标故障原因为断电和/或断网。
可选地,上述通过所述故障诊断决策树模型分析所述目标物联网设备是否在已获得的停电范围来确定引起所述目标物联网设备离线的所述第二目标故障原因包括:
通过所述故障诊断决策树模型分析所述目标物联网设备在所述停电范围内,则确定所述第二目标故障原因为断电,否则,
通过分析所述故障诊断决策树模型进一步获得处于所述目标点位的设定距离X米范围内的正常取电点数量、异常取电点数量,正常取电点数量是指处于所述目标点位的X米范围内且在线状态为在线的取电点的数量,异常取电点数量是指处于所述目标点位的X米范围内且在线状态为离线的取电点的数量;
通过所述故障诊断决策树模型分析所述正常取电点数量、异常取电点数量,确定所述第二目标故障原因。
可选地,上述通过所述故障诊断决策树模型分析所述正常取电点数量、异常取电点数量,确定所述第二目标故障原因包括:
通过所述故障诊断决策树模型分析出所述正常取电点数量大于所述异常取电点数量,则确定所述第二目标故障原因为断电;
通过所述故障诊断决策树模型分析出所述正常取电点数量小于所述异常取电点数量,则确定所述第二目标故障原因为断网;
通过所述故障诊断决策树模型分析出所述正常取电点数量等于异常取电点数量,则确定所述第二目标故障原因为断网和/或断电。
至此,完成图5所示装置的结构描述。
本申请实施例还提供了图5所示装置的硬件结构。参见图6,图6为本申请实施例提供的电子设备结构图。如图6所示,该硬件结构可包括:处理器和机器可读存储介质,机器可读存储介质存储有能够被所述处理器执行的机器可执行指令;所述处理器用于执行机器可执行指令,以实现本申请上述示例公开的方法。
基于与上述方法同样的申请构思,本申请实施例还提供一种机器可读存储介质,所述机器可读存储介质上存储有若干计算机指令,所述计算机指令被处理器执行时,能够实现本申请上述示例公开的方法。
示例性的,上述机器可读存储介质可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,机器可读存储介质可以是:RAM(Radom Access Memory,随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、dvd等),或者类似的存储介质,或者它们的组合。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可以由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其它可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其它可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
而且,这些计算机程序指令也可以存储在能引导计算机或其它可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或者多个流程和/或方框图一个方框或者多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其它可编程数据处理设备上,使得在计算机或者其它可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其它可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (11)

1.一种物联网设备离线故障诊断方法,其特征在于,该方法包括:
在检测到目标物联网设备离线时,先获得利用已建立的故障诊断决策树模型进行离线故障诊断时所需的目标点位的当前在线状态;所述目标点位为所述目标物联网设备关联的点位;
当所述目标点位的当前在线状态为在线时,通过所述故障诊断决策树模型诊断出引起所述目标物联网设备离线的初步故障原因为所述目标物联网设备故障,之后再获得通过所述故障诊断决策树模型验证所述初步故障原因时所需的特征向量,通过所述故障诊断决策树模型分析所述特征向量确定引起所述目标物联网设备离线的第一目标故障原因;
当所述目标点位的当前在线状态为离线时,再获得所述故障诊断决策树模型进一步进行离线故障诊断时所需的目标取电点的当前在线状态,所述目标取电点为所述目标点位关联的取电点;通过所述故障诊断决策树模型分析所述目标取电点的当前在线状态确定引起所述目标物联网设备离线的第二目标故障原因。
2.根据权利要求1所述的方法,其特征在于,所述目标点位的当前在线状态通过以下步骤确定:
确定目标点位关联的所有物联网设备,所述所有物联网设备至少包括所述目标物联网设备;
在所述目标点位关联的至少一个物联网设备的当前在线状态为在线时,确定所述目标点位的当前在线状态为在线,否则,确定所述目标点位的当前在线状态为离线。
3.根据权利要求1所述的方法,其特征在于,所述特征向量包括:
第一子向量,所述第一子向量至少包括:所述目标物联网设备在指定历史时长内的状态变更次数,以及在所述状态变更次数小于或等于第一设定次数阈值时所述目标物联网设备在所述指定历史时长内的工作量;所述状态变更次数包括从在线变更为离线、以及从离线变更为在线的次数;当目标物联网设备为摄像头时,所述工作量为抓拍数据量;或者,
第二子向量,所述第二子向量至少包括:所述目标物联网设备在指定历史时长内的状态变更次数,以及在所述状态变更次数大于或等于第二设定次数阈值时所述目标物联网设备在所述指定历史时长内的工作情况,其中,当目标物联网设备为摄像头时,所述工作情况为录制的视频录像的录像质量;所述第二设定次数阈值大于所述第一设定次数阈值。
4.根据权利要求3所述的方法,其特征在于,所述通过所述故障诊断决策树模型分析所述特征向量确定引起所述目标物联网设备离线的第一目标故障原因包括:
依据所述故障诊断决策树模型分析出所述第一子向量中所述目标物联网设备在指定历史时长内的工作量大于工作量阈值时,确定所述第一目标故障原因为所述目标物联网设备连接的服务链路故障,否则,确定所述第一目标故障原因为所述目标物联网设备故障;或者,
依据所述故障诊断决策树模型分析出所述第二子向量中所述目标物联网设备在指定历史时长内的工作情况为正常工作情况时,确定所述第一目标故障原因为所述目标物联网设备的IP地址与其他物联网设备的IP地址冲突,否则,确定所述第一目标故障原因为所述目标物联网设备的网络链路不稳定。
5.根据权利要求1所述的方法,其特征在于,所述目标取电点的当前在线状态通过以下步骤确定:
确定所述目标取电点关联的所有点位,所述所有点位至少包括所述目标点位;
在所述目标取电点关联的至少一个点位的当前在线状态为在线时,确定所述目标取电点的当前在线状态为在线,否则,确定所述目标取电点的当前在线状态为离线。
6.根据权利要求1所述的方法,其特征在于,所述通过所述故障诊断决策树模型分析所述目标取电点的当前在线状态确定引起所述目标物联网设备离线的第二目标故障原因包括:
在所述目标取电点的当前在线状态为离线时,通过所述故障诊断决策树模型分析所述目标物联网设备是否在已获得的停电范围来确定引起所述目标物联网设备离线的所述第二目标故障原因;
在所述目标取电点的当前在线状态为在线时,若所述目标点位的设定距离X米范围内不存在其他取电点,则通过所述故障诊断决策树模型分析所述目标物联网设备的历史故障工单记录来确定引起所述目标物联网设备离线的所述第二目标故障原因。
7.根据权利要求6所述的方法,其特征在于,所述通过故障诊断决策树模型分析所述目标物联网设备的历史故障工单记录来确定引起所述目标物联网设备离线的所述第二目标故障原因包括:
通过所述故障诊断决策树模型分析所述目标物联网设备的历史故障工单记录;
若依据所述历史故障工单记录确定断电次数大于断网次数,确定所述第二目标故障原因为断电,若依据所述历史故障工单记录确定断电次数小于断网次数,确定所述第二目标故障原因为断网,若依据所述历史故障工单记录确定断电次数等于断网次数,确定所述第二目标故障原因为断电和/或断网。
8.根据权利要求6所述的方法,其特征在于,所述通过所述故障诊断决策树模型分析所述目标物联网设备是否在已获得的停电范围来确定引起所述目标物联网设备离线的所述第二目标故障原因包括:
通过所述故障诊断决策树模型分析所述目标物联网设备在所述停电范围内,则确定所述第二目标故障原因为断电,否则,
通过分析所述故障诊断决策树模型进一步获得处于所述目标点位的设定距离X米范围内的正常取电点数量、异常取电点数量,正常取电点数量是指处于所述目标点位的X米范围内且在线状态为在线的取电点的数量,异常取电点数量是指处于所述目标点位的X米范围内且在线状态为离线的取电点的数量;
通过所述故障诊断决策树模型分析所述正常取电点数量、异常取电点数量,确定所述第二目标故障原因。
9.根据权利要求8所述的方法,其特征在于,所述通过所述故障诊断决策树模型分析所述正常取电点数量、异常取电点数量,确定所述第二目标故障原因包括:
通过所述故障诊断决策树模型分析出所述正常取电点数量大于所述异常取电点数量,则确定所述第二目标故障原因为断电;
通过所述故障诊断决策树模型分析出所述正常取电点数量小于所述异常取电点数量,则确定所述第二目标故障原因为断网;
通过所述故障诊断决策树模型分析出所述正常取电点数量等于异常取电点数量,则确定所述第二目标故障原因为断网和/或断电。
10.一种物联网设备离线故障诊断装置,其特征在于,该装置包括:
数据获取单元,用于在检测到目标物联网设备离线时,先获得利用已建立的故障诊断决策树模型进行离线故障诊断时所需的目标点位的当前在线状态;所述目标点位为所述目标物联网设备关联的点位;
故障诊断单元,用于当所述目标点位的当前在线状态为在线时,通过利用所述故障诊断决策树模型诊断出引起所述目标物联网设备离线的初步故障原因为所述目标物联网设备故障,之后触发所述数据获取单元再获得通过所述故障诊断决策树模型验证所述初步故障原因时所需的特征向量;以及,
通过所述故障诊断决策树模型分析所述特征向量确定引起所述目标物联网设备离线的第一目标故障原因;以及,
当所述目标点位的当前在线状态为离线时,触发所述数据获取单元再获得所述故障诊断决策树模型进一步进行离线故障诊断时所需的目标取电点的当前在线状态,所述目标取电点为所述目标点位关联的取电点,通过所述故障诊断决策树模型分析所述目标取电点的当前在线状态确定引起所述目标物联网设备离线的第二目标故障原因。
11.一种电子设备,其特征在于,该电子设备包括:处理器和机器可读存储介质;
所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令;
所述处理器用于执行机器可执行指令,以实现权利要求1-9任一项的方法步骤。
CN202111389303.3A 2021-11-22 2021-11-22 物联网设备离线故障诊断方法、装置及电子设备 Pending CN114116286A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111389303.3A CN114116286A (zh) 2021-11-22 2021-11-22 物联网设备离线故障诊断方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111389303.3A CN114116286A (zh) 2021-11-22 2021-11-22 物联网设备离线故障诊断方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN114116286A true CN114116286A (zh) 2022-03-01

Family

ID=80439625

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111389303.3A Pending CN114116286A (zh) 2021-11-22 2021-11-22 物联网设备离线故障诊断方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN114116286A (zh)

Similar Documents

Publication Publication Date Title
CN111459700B (zh) 设备故障的诊断方法、诊断装置、诊断设备及存储介质
Wang et al. A multi-objective optimization of imperfect preventive maintenance policy for dependent competing risk systems with hidden failure
JP2019185422A (ja) 故障予知方法、故障予知装置および故障予知プログラム
KR20180108446A (ko) Ict 인프라 관리 시스템 및 이를 이용한 ict 인프라 관리 방법
CN111427753A (zh) 基于arima模型的容量预测装置及其控制方法
CN106383760A (zh) 一种计算机故障管理方法及装置
KR20190021560A (ko) 빅데이터를 활용한 고장예지보전시스템 및 고장예지보전방법
CN111242323A (zh) 用于修理机器次优操作的主动自动系统和方法
CN103154904B (zh) 操作管理设备、操作管理方法和程序
CN109684320B (zh) 监测数据在线清洗的方法和设备
CN112633542A (zh) 系统性能指标预测方法、装置、服务器及存储介质
CN109062769B (zh) It系统性能风险趋势预测的方法、装置和设备
JP2009086896A (ja) コンピュータの障害予測システムおよび障害予測方法
CN111061581B (zh) 一种故障检测方法、装置及设备
CN117318069B (zh) 一种供电系统故障自愈方法及系统
CN111901172B (zh) 基于云计算环境下的应用服务监控方法及系统
CN110825466B (zh) 一种程序卡顿的处理方法以及卡顿处理装置
CN113342608A (zh) 流式计算引擎任务的监控方法及装置
CN103713990A (zh) 一种用于软件缺陷预测的方法和装置
JP7339861B2 (ja) 故障確率評価システム
CN117195451A (zh) 一种基于图论的桥梁监测数据修复方法
CN114116286A (zh) 物联网设备离线故障诊断方法、装置及电子设备
US20150073878A1 (en) Device to perform service contract analysis
CN107121616B (zh) 一种用于对智能仪表进行故障定位的方法和装置
CN116108959A (zh) 自助智能机具运营管理评估方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination