CN117114257A - 故障画像的确定方法,处理设备及计算机可读存储介质 - Google Patents

故障画像的确定方法,处理设备及计算机可读存储介质 Download PDF

Info

Publication number
CN117114257A
CN117114257A CN202210518074.9A CN202210518074A CN117114257A CN 117114257 A CN117114257 A CN 117114257A CN 202210518074 A CN202210518074 A CN 202210518074A CN 117114257 A CN117114257 A CN 117114257A
Authority
CN
China
Prior art keywords
fault
determining
heterogeneous network
faults
representation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210518074.9A
Other languages
English (en)
Inventor
余思雨
胡林熙
王东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Zhejiang Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Zhejiang Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Zhejiang Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202210518074.9A priority Critical patent/CN117114257A/zh
Publication of CN117114257A publication Critical patent/CN117114257A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • G06Q10/063112Skill-based matching of a person or a group to a task
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/20Administration of product repair or maintenance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Game Theory and Decision Science (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Fuzzy Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请公开了一种故障画像的确定方法,处理设备及计算机可读存储介质,所述方法包括:基于历史故障数据构建异质网络,所述异质网络以故障为节点,以故障间的关联关系为边;基于所述异质网络确定所述故障之间的关联关系;根据所述关联关系确定故障群体;在接收到待处理故障时,确定所述待处理故障与所述故障群体之间的距离;根据所述距离确定所述待处理故障的故障画像。达成了提高故障调度效率的效果。

Description

故障画像的确定方法,处理设备及计算机可读存储介质
技术领域
本申请涉及数据处理领域,尤其涉及故障画像的确定方法,处理设备及计算机可读存储介质。
背景技术
故障调度是指在一线部门反馈故障后或者监控到异常时迅速反应,调动支撑团队对故障影响的业务进行恢复的行为。在相关技术中,进行故障调度时,一般需要工作人员依据经验判断当前发生的故障应该如何进行故障调度。因此,在进行故障调度时,对决策者有很高的经验要求。需要决策者有相应的故障处理经验,才能快速反映。这样导致存在故障调度效率较低的缺陷。
发明内容
本申请实施例通过提供一种故障画像的确定方法,处理设备及计算机可读存储介质,解决了相关技术中故障调度效率较低的缺陷,实现了提高故障调度效率较的效果。
本申请实施例提供了一种故障画像的确定方法,所述方法包括以下步骤:
基于历史故障数据构建异质网络,所述异质网络以故障为节点,以故障间的关联关系为边;
基于所述异质网络确定所述故障之间的关联关系;
根据所述关联关系确定故障群体;
在接收到待处理故障时,确定所述待处理故障与所述故障群体之间的距离;
根据所述距离确定所述待处理故障的故障画像。
可选地,所述基于所述异质网络确定所述故障之间的关联关系的步骤包括:
基于所述异质网络,通过随机游走网络表示学习方法获取节点序列;
根据所述节点序列确定所述关联关系。
可选地,所述基于所述异质网络,通过随机游走网络表示学习方法获取节点序列的步骤包括:
分别将所述异质网络中的各个节点作为游走起点;
根据预设的边关系组合以及预设游走长度,确定每一所述游走起点对应的节点序列。
可选地,所述异质网络的边类型包括业务影响,故障原因和故障解决耗时中的至少一个。
可选地,所述根据预设的边关系组合以及预设游走长度,确定每一所述游走起点对应的节点序列的步骤包括:
根据所述预设的边关系组合,确定所述游走起点关联的候选节点;
根据所述游走起点与所述候选节点之间的关系权重,在所述候选节点中选定所述游走起点的下一跳节点;
重复执行根据所述预设的边关系组合确定所述下一跳节点的候选节点,并根据所述关系权重在所下一跳节点的候选节点选定所述下一跳节点;
当游走长度大于或者等于所述预设游走长度时,根据游走路径确定所述节点序列。
可选地,所述根据所述距离确定所述待处理故障的故障画像的步骤之前,还包括:
确定所述故障群体的故障群体画像;
所述根据所述距离确定所述待处理故障的故障画像的步骤包括:
确定所述待处理故障对应的目标故障群体,其中,所述目标故障群体为与所述待处理故障之间的所述距离最小的故障群体;
根据所述目标故障群体的故障群体画像,确定所述待处理故障的所述故障画像。
可选地,所述基于历史故障数据构建异质网络的步骤之前,还包括:
在故障数据库更新时,确定所述故障数据库中,处于预设时间窗口的内的故障数据;
将所述故障数据作为所述历史数据。
本申请实施例还提供一种处理设备,所述处理设备包括:
构建模块,用于基于历史故障数据构建异质网络,所述异质网络以故障为节点,以故障间的关联关系为边;
确定模块,用于基于所述异质网络确定所述故障之间的关联关系;以及根据所述关联关系确定故障群体;
计算模块,用于在接收到待处理故障时,确定所述待处理故障与所述故障群体之间的距离;
分析模块,用于根据所述距离确定所述待处理故障的故障画像。
本申请实施例还提供一种处理设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的故障画像的确定程序,所述处理器执行所述故障画像的确定程序时实现如上所述的方法。
本申请实施例还提供一种计算机可读存储介质,其上存储有故障画像的确定程序,该故障画像的确定程序被处理器执行时实现如上所述的方法。
本申请实施例中提供的一个或多个技术方案,通过对历史故障进行画像,融入了历史故障的风险情况以及处理方案等有效信息,将当前的故障与已有故障进行匹配,通过历史故障的窗口预判当前故障的走势。使得可以通过主观经验和客观数据共同预测故障风险,在风险可控时及时调度相关负责人,推动故障按风险优先级进行处理,提供定位故障原因的思路,预演故障的解决方案出,从而达成了提高故障调度效率的效果。
附图说明
图1为本申请故障画像的确定方法的一实施例涉及的流程示意图;
图2为本申请故障画像的确定方法的一实施例涉及的异构网络图;
图3为本申请故障画像的确定方法的一实施例涉及的另一流程示意图;
图4为本申请故障画像的确定方法的一实施例涉及的又一流程示意图;
图5为为本申请故障画像的确定方法涉及的模块示意图;
图6为本申请实施例涉及的终端硬件结构示意图;
图7为本申请实施例涉及的处理设备的模块化示意图。
具体实施方式
在相关技术中,进行故障调度时,一般需要工作人员依据经验判断当前发生的故障应该如何进行故障调度。因此,在进行故障调度时,对决策者有很高的经验要求。需要决策者有相应的故障处理经验,才能快速反映。这样导致存在故障调度效率较低的缺陷。
另外,还有一些相关技术,可以通过监控各种通信局站(包括通信机房、基站、支局、模块局等)的设备运行情况以及设备工作环境,或者监控业务系统的运行情况。进而获取设备、环境、系统的各个维度的指标,并基于不同计算方法得到当前全局环境以及局部系统的健康度。将该健康度和历史正常环境下的健康度进行对比,通过设定阈值进行预警,调度人员可以在第一时间得知预警,然后将该预警与已有的故障进行人工匹配,将预警信息运用到故障调度流程中。
该方案提高了健康度评估的准确性以及预警的及时性,但它更主要地是在预警领域发挥了作用,若要使预警在故障调度领域提供价值,而不能对真实发生的故障如进行调度提供解决思路。
综上,相关的技术方案上都存在不足,体现在人工成本上、参考价值上、分析深度上。目前用户对系统的要求日益严格,系统一旦发生故障,就可能引起用户的不满。如何迅速且合理调度故障使得业务快速恢复,是待优化的问题。该问题的优化可以及时止损,挽回用户。针对传统的故障调度过程受经验等主观因素影响,对调度人员的要求较高,而且调度可能不及时,对风险预判不准的问题。本申请提出了一种故障画像的确定方法,通过挖掘故障调度场景下采集的与故障相关的特征,构建相似群体的故障画像。实现从客观数据角度辅助故障调度,将当前的故障与已有故障进行匹配,通过历史故障的窗口预判当前故障的走势,在风险可控时及时调度相关负责人,提高故障调度的及时性和有效性。
为了更好的理解上述技术方案,下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
实施例一
请参照图1,在本实施例中,所述故障画像的确定方法包括以下步骤:
步骤S10:基于历史故障数据构建异质网络,所述异质网络以故障为节点,以故障间的关联关系为边;
步骤S20:基于所述异质网络确定所述故障之间的关联关系;
步骤S30:根据所述关联关系确定故障群体;
步骤S40:在接收到待处理故障时,确定所述待处理故障与所述故障群体之间的距离;
步骤S50:根据所述距离确定所述待处理故障的故障画像。
在本实施例中,可以先根据历史故障数据,确定故障调度场景下与故障相关的多维属性,包括但不限于故障发现时间、故障影响的业务、故障影响的群体、故障整体耗时、故障升级标准、故障发生原因、故障处理人、故障责任人等。提取用于计算故障关联关系的特征集,可以包括所述多维属性中的一个或者多个。由于故障与故障间在某些特征上具有关联关系,其中,所述关联关系可以是如A故障和B故障影响的业务一致,故障B与故障C发生的原因一致等的关联关系。进而基于该关联关系确定故障群体。
在一些实施方案中,可以通过构建故障间的异质信息网络,在该网络上基于随机游走的方式挖掘故障间的关系。然后,基于聚类算法计算故障间的相似度,得到联系紧密的故障群体,并基于相似故障群体构建群体标签集合,确定故障群体画像,包括但不限于通过文本展示、雷达图展示、柱状图展示等。使得可以在接收到待处理故障时,基于所述待处理故障与故障群体之间的距离,来确定待处理故障对应的故障画像。
可选地,在一实施方案中,可以先基于历史数据,构建异质网络。其中,所述异质网络的节点类型为故障,而边类型可以有多种,不同的边类型表示着故障间的不同语义信息。例如,如图2示出的异质网络,可以包括节点A故障、B故障、C故障、D故障和E故障。A故障和B故障之间的关系(边)包括业务影响,故障原因。A故障和E故障之间的关系包括业务影响和故障处理耗时。A故障和C故障之间的关系包括业务影响。同样的,图中还示出了其它故障之间的关系,再此不再赘述。
在构建出异质网络之后,可以基于所述异质网络,通过随机游走网络表示学习方法获取节点序列,根据所述节点序列确定所述关联关系。
例如,可以在异质网络中,基于元路径进行随机游走的网络表示学习方法挖掘故障间的关联关系,从而计算故障间的相似度。其中,在异质网络中随机游走,从而进行网络表示学习的方法是以元路径为指导的。按照元路径的顺序进行随机游走从而采集并存储网络的异质节点,然后借助表征学习的方法将节点投射到一定维度的向量空间中从而使得节点可以用向量进行表示。
作为一种可选实施方式,可以基于Metapath2vec方法实现,在Metapath2vec方法首先选定网络的元路径,然后以元路径为指导在异质网络上进行随机游走,游走的过程也就是对网络中的节点进行采样。游走结束后也就得到了以元路径为指导的节点序列。需要说明的是,本实施例还可以基于其它可选的方法,来实现节点序列的确定。Metapath2vec方法并不是唯一的实现方式。上方式的解决思路主要是先确定异质网络中故障节点间的关系组合,通过不同的关系将故障节点链接起来,使得可以在元路径的基础上通过随机游走来捕捉网络的节点关系。因此,所述异质网络示意图可以如图2所示。故障与故障之间通过业务影响、故障原因、故障处理耗时等维度的属性链接起来,也就是说该异质网络中的节点类型为故障,而边类型可以有多种,不同的边类型表示着故障间的不同语义信息。当确定节点序列之后,可以将这些节点序列作为神经网络模型的训练语料库,通过训练神经网络模型挖掘节点间的关系。
可选地,在随机游走的过程中将考虑故障节点间的关系权重,与当前故障节点的关系权重越大的节点,成为被游走的下一个节点的可能性越大。比如,当A故障与B故障间的影响业务的相似程度比A故障与C故障间的大,那B故障更可能成为A故障的下一个节点。
示例性地,可以依次选择异质网络中的每个故障节点,并将该节点作为游走的起点。并预先设置游走的长度为N(即预设游走长度为N),按照一定的边关系组合顺序进行游走,比如边关系组合为业务影响-原因,那么当前节点将按照业务影响的关系寻找下一个节点,下一个节点将按照原因的关系寻找下下个节点。如此重复,直至生成由故障节点引导的长度为N的元路径。
需要说明的是,在本示例中,当游走的第t(t<N)步对应的关系是Rt,则节点vi到vi+1的状态转移概率p(vi+1|vi)可被定义为:
其中,N(vi)表示节点vi的邻居节点集合,w(vi→vi+1|Rt)表示节点vi与vi+1在关系Rt中的连接权重,w(vi→vi+1|Rt)表示如下:
w(vi→vi+1|Rt)=sim(vi→vi+1|Rt)*w(Rt)
其中sim(vi→vi+1|Rt)表示节点vi与vi+1在关系Rt中相似程度,每一种关系Rt的相似度计算是不相同的。比如当关系Rt是文本,则可以通过经典的Levenshtein距离和Jaccard相似度进行计算,或者也可以采用word2vec方法计算。当关系Rt是一种离散特征时,可以通过Tanimoto方法计算。
w(Rt)是指关系Rt所具有的权重,比如某段特定时间内故障的出现是由于某些新技术的使用发生的,那么与这个技术相关的Rt成为影响故障间相似程度的权重将更大。例如,因为在网络技术发展的过程中会阶段性地提出战略目标,比如对于信息系统来说,为了拓展线上化,智能化和云化,提出许多新的技术应用,这些新技术在很大程度上给生产系统带来了效益,但在技术使用的不稳定时期,也难免会对系统产生一些影响。也就是说在某些技术被应用到信息系统的初期,一些故障的原因会与技术的应用有着直接的关联,所以当两个故障的原因与当下正在使用的技术有关,这两个故障具有关联性的可信度越高。因此需要修正故障原因这个关系中,节点间的连接权重。可选地,作为一种实现方式,首先需要记录每个时间段技术的更新情况,记录方式可以表格或者映射关系的方式实现。以通过表格记录为例,该记录表包含技术对故障影响的权重,以及根据技术的迭代更新影响面和权重值,权重值可根据实际项目经验确定,为预设的固定值。示例性地,记录表可以如表1所示:
其中,若历史故障的时间命中技术上线的不稳定阶段,在与该技术相关的维度的关系上游走时,可以将初期权重乘上该技术在特定时间段的权重。
另外,针对故障处理耗时的相似度计算,需要将不同处理方式的耗时进行层次划分,比如根据处理方式的不同,将处理耗时分为平台类问题引起的故障处理耗时和代码层面引起的故障处理耗时。显然地,平台类的问题平均处理耗时应该低于代码层面的,因为平台类的问题大部分情况可通过自愈,或标准解决方式解决。而代码问题需要修改代码再进行发布,整个过程耗时长。
可选地,当基于上述方式,根据元路径确定节点序列之后,为了使采集到的网络节点关系更为稳定,可以设置每个故障节点引导的元路径个数为count,且count≥1,从而达到减少采集过程的抖动的效果。示例性地,在图2所示的异质网络上,以A故障为起点进行随机游走可以得到可能的元路径集Paths如下,且Paths的大小为count。
当确定元路径集Paths之后,可以将以每个节点为起点随机游走的路径保存下来,其中路径节点是故障的标识。进而把这些数据作为训练语料库。然后通过训练神经网络模型挖掘节点间的关系。
示例性地,在一些实施方案中,可以使用word2vec模型学习这些数据,挖掘其中存在的关系。最后获得每个故障对应的关系表征向量。这样可以获得一个每一行表示一个故障的表征向量的矩阵A,那么计算故障间的相似度就可以转化为计算矩阵A和矩阵A对应元素间的距离。
在计算矩阵A和矩阵A对应元素间的距离时,可以通过sklearn包提供的成对距离(pair-wise distances)函数来计算矩阵间的距离。紧接着通过聚类算法计算故障间的相似度,并形成多个故障群体,使得同一个群体中各个样本的相似度(距离)要大于不同群体之间样本的相似度(距离)。其中,所述聚类算法,包括但不限于K-Means算法。
进一步地,当故障发生时,即接收到待处理故障时,为了保证画像输出的及时性,在本实施例公开的技术方案中,可以直接基于标签维度计算当前故障(即待处理故障)与历史故障群体的距离。
示例性地,参照图3,首先,可以基于对历史故障画像的分析提取对应的当前故障的标签集L={lable1,lable2,...};接着计算当前故障与已有故障群体的距离。其中,计算的方式包括但不限于使用Tanimoto方法。
例如,假设已有历史故障群体1的标签集为G={lablea,lableb,...},则两者的距离d1通过Tanimoto(L,G)=len(L∩G)/len(L∪G)可计算得到。由此得到当前故障与历史故障n个群体的距离D={d1,d2,...,dn}。
然后可以选择与当前故障最近距离的故障群体m(d=dm)作为候选。并判断该距离是否超过阈值dthreshold。可选地,阈值为已有群体之前距离的最大值。
当dm<dthreshold,则参考最近故障群体m的画像表征当前故障画像,否则将当前故障作为单独群体。最后,将以上故障画像的输出作为客观依据进行故障调度。这样达成了降低计算量同时保证结果的准确性。
最后,可以将当前故障,即待处理故障对应的故障画像作为调度参考,来迅速执行故障调度动作。
可选地,请参照图4,所述步骤S10之前,还包括:
步骤S60:在故障数据库更新时,确定所述故障数据库中,处于预设时间窗口的内的故障数据,将所述故障数据作为所述历史数据。
由于历史故障对当前故障的表征是有时间性的,久远的故障对当前故障画像的参考性低于近期的故障。所以在对故障画像时,需要将时间纳入计算。例如,可以采用滑动窗口算法,来实现对群体故障画像的更新。时间窗口可以根据要求设置为1小时、1天等维度,当故障数据库更新时,移动时间窗口,删除旧有的候选集,再加上新增的候选项目集,再计算群体故障画像。
在本实施例公开的技术方案中,通过对历史故障进行画像,融入了历史故障的风险情况以及处理方案等有效信息,将当前的故障与已有故障进行匹配,通过历史故障的窗口预判当前故障的走势。使得可以通过主观经验和客观数据共同预测故障风险,在风险可控时及时调度相关负责人,推动故障按风险优先级进行处理,提供定位故障原因的思路,预演故障的解决方案出,从而达成了提高故障调度效率的效果。
可选地,请参照图5给出的模块示意图,基于上述实施例,在本实施例中,在实现所述故障画像的确定方法时,分为数据准备阶段、特征挖掘阶段以及结果输出阶段。数据准备阶段包括采集模块(Acquisition Module)和特征选择模块(Feature Selection Module),特征选择模块的主要功能包括提取用于计算故障关联关系的特征集;特征挖掘阶段包括表征学习模块(Representation Learning Module)和聚类模块(Clustering Module),表征学习模块主要功能是挖掘故障间的关联关系,以关系表征向量表示每个故障;聚类模块是通过聚类算法计算相似故障群体,使得相似的故障处于同一个类别;结果输出模块包括标签输出模块(Label Output Module)和画像输出模块(Portrait Output Module),标签输出模块的主要功能是基于相似群体构建群体故障画像的标签集,画像输出模块是指基于群体故障的标签集展示历史单个故障或者当前故障的画像,包括但不限于通过文本展示、雷达图展示、柱状图进行展示。
可选地,请参照图6,图6是本申请实施例方案涉及的硬件运行环境的终端结构示意图。
如图6所示,该终端可以是服务器或者PC机等处理设备,所述处理设备包括:处理器1001,例如CPU,网络接口1003,存储器1004,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。网络接口1003可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1004可以是高速RAM存储器,也可以是稳定的存储器。存储器1004可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图6中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图6所示,作为一种计算机存储介质的存储器1004中可以包括操作系统、网络通信模块、以及故障画像的确定程序。
在图6所示的终端中,处理器1001可以用于调用存储器1004中存储的故障画像的确定程序,并执行以下操作:
基于历史故障数据构建异质网络,所述异质网络以故障为节点,以故障间的关联关系为边;
基于所述异质网络确定所述故障之间的关联关系;
根据所述关联关系确定故障群体;
在接收到待处理故障时,确定所述待处理故障与所述故障群体之间的距离;
根据所述距离确定所述待处理故障的故障画像。
可选地,处理器1001可以调用存储器1004中存储的故障画像的确定程序,还执行以下操作:
基于所述异质网络,通过随机游走网络表示学习方法获取节点序列;
根据所述节点序列确定所述关联关系。
可选地,处理器1001可以调用存储器1004中存储的故障画像的确定程序,还执行以下操作:
分别将所述异质网络中的各个节点作为游走起点;
根据预设的边关系组合以及预设游走长度,确定每一所述游走起点对应的节点序列。
可选地,处理器1001可以调用存储器1004中存储的故障画像的确定程序,还执行以下操作:
根据所述预设的边关系组合,确定所述游走起点关联的候选节点;
根据所述游走起点与所述候选节点之间的关系权重,在所述候选节点中选定所述游走起点的下一跳节点;
重复执行根据所述预设的边关系组合确定所述下一跳节点的候选节点,并根据所述关系权重在所下一跳节点的候选节点选定所述下一跳节点;
当游走长度大于或者等于所述预设游走长度时,根据游走路径确定所述节点序列。
可选地,处理器1001可以调用存储器1004中存储的故障画像的确定程序,还执行以下操作:
确定所述故障群体的故障群体画像;
所述根据所述距离确定所述待处理故障的故障画像的步骤包括:
确定所述待处理故障对应的目标故障群体,其中,所述目标故障群体为与所述待处理故障之间的所述距离最小的故障群体;
根据所述目标故障群体的故障群体画像,确定所述待处理故障的所述故障画像。
可选地,处理器1001可以调用存储器1004中存储的故障画像的确定程序,还执行以下操作:
在故障数据库更新时,确定所述故障数据库中,处于预设时间窗口的内的故障数据;
将所述故障数据作为所述历史数据。
可选地,请参照图7,本申请还提出一种处理设备100,所述处理设备100包括:
构建模块101,用于基于历史故障数据构建异质网络,所述异质网络以故障为节点,以故障间的关联关系为边;
确定模块102,用于基于所述异质网络确定所述故障之间的关联关系;以及根据所述关联关系确定故障群体;
计算模块103,用于在接收到待处理故障时,确定所述待处理故障与所述故障群体之间的距离;
分析模块104,用于根据所述距离确定所述待处理故障的故障画像。
所述处理设备为实施本申请实施例一的方法所采用的设备,故而基于本申请实施例一所介绍的方法,本领域所属人员能够了解该设备的具体结构及变形,故而在此不再赘述。凡是本申请实施例一的方法所采用的系统都属于本申请所欲保护的范围。
本领域内的技术人员应明白,本申请的实施例可提供为方法、装置、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本申请可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (10)

1.一种故障画像的确定方法,其特征在于,所述方法包括以下步骤:
基于历史故障数据构建异质网络,所述异质网络以故障为节点,以故障间的关联关系为边;
基于所述异质网络确定所述故障之间的关联关系;
根据所述关联关系确定故障群体;
在接收到待处理故障时,确定所述待处理故障与所述故障群体之间的距离;
根据所述距离确定所述待处理故障的故障画像。
2.如权利要求1所述的方法,其特征在于,所述基于所述异质网络确定所述故障之间的关联关系的步骤包括:
基于所述异质网络,通过随机游走网络表示学习方法获取节点序列;
根据所述节点序列确定所述关联关系。
3.如权利要求2所述的方法,其特征在于,所述基于所述异质网络,通过随机游走网络表示学习方法获取节点序列的步骤包括:
分别将所述异质网络中的各个节点作为游走起点;
根据预设的边关系组合以及预设游走长度,确定每一所述游走起点对应的节点序列。
4.如权利要求1-3中任一项所述的方法,其特征在于,所述异质网络的边类型包括业务影响,故障原因和故障解决耗时中的至少一个。
5.如权利要求3所述的方法,其特征在于,所述根据预设的边关系组合以及预设游走长度,确定每一所述游走起点对应的节点序列的步骤包括:
根据所述预设的边关系组合,确定所述游走起点关联的候选节点;
根据所述游走起点与所述候选节点之间的关系权重,在所述候选节点中选定所述游走起点的下一跳节点;
重复执行根据所述预设的边关系组合确定所述下一跳节点的候选节点,并根据所述关系权重在所下一跳节点的候选节点选定所述下一跳节点;
当游走长度大于或者等于所述预设游走长度时,根据游走路径确定所述节点序列。
6.如权利要求1所述的方法,其特征在于,所述根据所述距离确定所述待处理故障的故障画像的步骤之前,还包括:
确定所述故障群体的故障群体画像;
所述根据所述距离确定所述待处理故障的故障画像的步骤包括:
确定所述待处理故障对应的目标故障群体,其中,所述目标故障群体为与所述待处理故障之间的所述距离最小的故障群体;
根据所述目标故障群体的故障群体画像,确定所述待处理故障的所述故障画像。
7.如权利要求1所述的方法,其特征在于,所述基于历史故障数据构建异质网络的步骤之前,还包括:
在故障数据库更新时,确定所述故障数据库中,处于预设时间窗口的内的故障数据;
将所述故障数据作为所述历史数据。
8.一种处理设备,其特征在于,所述处理设备包括:
构建模块,用于基于历史故障数据构建异质网络,所述异质网络以故障为节点,以故障间的关联关系为边;
确定模块,用于基于所述异质网络确定所述故障之间的关联关系;以及根据所述关联关系确定故障群体;
计算模块,用于在接收到待处理故障时,确定所述待处理故障与所述故障群体之间的距离;
分析模块,用于根据所述距离确定所述待处理故障的故障画像。
9.一种处理设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的故障画像的确定程序,所述处理器执行所述故障画像的确定程序时实现权利要求1-7任一所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有故障画像的确定程序,该故障画像的确定程序被处理器执行时实现权利要求1-7任一所述的方法。
CN202210518074.9A 2022-05-13 2022-05-13 故障画像的确定方法,处理设备及计算机可读存储介质 Pending CN117114257A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210518074.9A CN117114257A (zh) 2022-05-13 2022-05-13 故障画像的确定方法,处理设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210518074.9A CN117114257A (zh) 2022-05-13 2022-05-13 故障画像的确定方法,处理设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN117114257A true CN117114257A (zh) 2023-11-24

Family

ID=88807881

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210518074.9A Pending CN117114257A (zh) 2022-05-13 2022-05-13 故障画像的确定方法,处理设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN117114257A (zh)

Similar Documents

Publication Publication Date Title
US20160232637A1 (en) Shipment-Volume Prediction Device, Shipment-Volume Prediction Method, Recording Medium, and Shipment-Volume Prediction System
US10515083B2 (en) Event analysis apparatus, an event analysis system, an event analysis method, and an event analysis program
US20160210681A1 (en) Product recommendation device, product recommendation method, and recording medium
CN112183758A (zh) 用于实现模型训练的方法及装置、计算机存储介质
US20160224998A1 (en) Order-volume determination device, order-volume determination method, recording medium, and order-volume determination system
CN110321383A (zh) 大数据平台数据同步方法、装置、计算机设备及存储介质
CN115225536B (zh) 一种基于无监督学习的虚拟机异常检测方法及系统
CN113590370A (zh) 一种故障处理方法、装置、设备及存储介质
CN105471647A (zh) 一种电力通信网故障定位方法
CN114416703A (zh) 数据完整性自动监控方法、装置、设备及介质
CN111325255B (zh) 特定人群圈定方法、装置、电子设备及存储介质
CN111090401B (zh) 存储设备性能预测方法及装置
CN117435999A (zh) 一种风险评估方法、装置、设备以及介质
CN112365269A (zh) 风险检测方法、装置、设备以及存储介质
CN115098362B (zh) 页面测试方法、装置、电子设备以及存储介质
US20220276954A1 (en) Device identification device, device identification method, and device identification program
CN110825466A (zh) 一种程序卡顿的处理方法以及卡顿处理装置
CN117114257A (zh) 故障画像的确定方法,处理设备及计算机可读存储介质
JPH0535484A (ja) 故障診断方法
CN112395119B (zh) 异常数据处理方法、装置、服务器及存储介质
US20170330055A1 (en) Sequential data analysis apparatus and program
WO2022191982A1 (en) Ticket troubleshooting support system
CN113628077A (zh) 生成不重复考题的方法、终端及可读存储介质
Trstenjak et al. A Decision Support System for the Prediction of Wastewater Pumping Station Failures Based on CBR Continuous Learning Model.
CN112508518A (zh) 结合rpa和ai的rpa流程的生成方法以及相应的设备、可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination