CN115599913A - 高压隔离开关发热故障预测方法、系统、设备和存储介质 - Google Patents

高压隔离开关发热故障预测方法、系统、设备和存储介质 Download PDF

Info

Publication number
CN115599913A
CN115599913A CN202211278841.XA CN202211278841A CN115599913A CN 115599913 A CN115599913 A CN 115599913A CN 202211278841 A CN202211278841 A CN 202211278841A CN 115599913 A CN115599913 A CN 115599913A
Authority
CN
China
Prior art keywords
fault
isolating switch
voltage isolating
data
extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211278841.XA
Other languages
English (en)
Inventor
龚泽威一
饶桐
王欣
许志松
曹占国
白春涛
王浩州
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electric Power Research Institute of Yunnan Power Grid Co Ltd
Original Assignee
Electric Power Research Institute of Yunnan Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electric Power Research Institute of Yunnan Power Grid Co Ltd filed Critical Electric Power Research Institute of Yunnan Power Grid Co Ltd
Priority to CN202211278841.XA priority Critical patent/CN115599913A/zh
Publication of CN115599913A publication Critical patent/CN115599913A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R31/00Arrangements for testing electric properties; Arrangements for locating electric faults; Arrangements for electrical testing characterised by what is being tested not provided for elsewhere
    • G01R31/327Testing of circuit interrupters, switches or circuit-breakers
    • G01R31/333Testing of the switching capacity of high-voltage circuit-breakers ; Testing of breaking capacity or related variables, e.g. post arc current or transient recovery voltage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Investigating Or Analyzing Materials Using Thermal Means (AREA)

Abstract

本发明实施例公开了高压隔离开关发热故障预测方法、系统、设备和存储介质。该方法包括:获取高压隔离开关的待分析数据;进行实体抽取获取高压隔离开关实体数据和发热故障实体数据;集合统计抽取、聚类抽取和直接抽取三种抽取方式分别对高压隔离开关实体数据和发热故障实体数据进行三元组抽取,构建高压隔离开关设备信息与故障知识图谱和高压隔离开关故障原因知识图谱;将高压隔离开关设备信息与故障知识图谱与高压隔离开关故障原因知识图谱进行特征融合,抽取高压隔离开关的主要发热故障特征以及故障原因;将主要发热故障特征输入到预设的FL—SVM分类模型中进行发热故障预测。本发明能够有效提升高压隔离开关发热故障预测的准确率和效率。

Description

高压隔离开关发热故障预测方法、系统、设备和存储介质
技术领域
本发明涉及知识图谱与机器学习技术领域,尤其涉及高压隔离开关发热故障预测方法、系统、设备和存储介质。
背景技术
知识图谱就是用结构化的形式来表达现实世界中的概事物和事物间的关系。在当下互联网大数据时代背景下,将互联网中各种各样的信息转换成符合人类感知世界的自然语言信息,运用知识图谱管理和认知各行各业的海量信息逐步成为研究的热点。
当前,知识图谱主要应用于科学研究领域。知识图谱在电力领域也有了一定的应用,但是应用还不广泛,还处在试验阶段,经验较少,运用知识图谱到故障检测的研究有一定的发展,但是应用到电力设备上还需要进一步创新和发展。当前高压隔离开关发热故障预测方法较为传统,更多是依赖从业人员的个人经验,准确度和可靠性不高。
发明内容
基于此,有必要针对上述问题,提出了高压隔离开关发热故障预测方法、系统、设备和存储介质。
一种高压隔离开关发热故障预测方法,包括:
获取高压隔离开关的待分析数据,所述待分析数据包括设备信息数据和发热故障历史数据;
通过正则匹配和最大熵方式对所述待分析数据进行实体抽取获取高压隔离开关实体和发热故障实体;
集合统计抽取、聚类抽取和直接抽取三种抽取方式分别对所述高压隔离开关实体和所述发热故障实体进行三元组抽取,构建高压隔离开关设备信息与故障知识图谱和高压隔离开关故障原因知识图谱;
将所述高压隔离开关设备信息与故障知识图谱与所述高压隔离开关故障原因知识图谱进行特征融合,抽取高压隔离开关的主要发热故障特征以及故障原因;
将所述主要发热故障特征输入到预设的FL—SVM分类模型中进行发热故障预测。
其中,所述将所述高压隔离开关设备信息与故障知识图谱与所述高压隔离开关故障原因知识图谱进行特征融合的步骤,包括:
以所述高压隔离开关设备信息与故障知识图谱和所述所述高压隔离开关故障原因知识图谱中相同的发热故障为媒介,通过TansH模型进行推理,将所述高压隔离开关设备信息与故障知识图谱和所述高压隔离开关故障原因知识图谱中的头实体、尾实体和关系映射到超平面进行关系查找,获取高压隔离开关的设备信息与发热故障原因的关联关系。
其中,所述将所述主要发热故障特征输入到预设的FL—SVM分类模型中进行发热故障预测的步骤,包括:
选择非线性函数Φ(x)高斯核函数作为本发明中SVM分类模型的核函数,其中所述核函数为:
Figure BDA0003897781220000021
在SVM模型的基础上采用Focal Loss损失函数来解决样本不均衡问题,构成所述预设的FL—SVM分类模型,其中,Focal Loss损失函数的公式为:
Figure BDA0003897781220000022
其中,p为分类概率,y为分类类别。
其中,所述构成所述预设的FL—SVM分类模型的步骤之后,包括:
计算所述预设的FL—SVM分类模型的准确率、精确率、召回率和F1分数,对所述预设的FL—SVM分类模型进行评价。
其中,所述构建高压隔离开关设备信息与故障知识图谱和高压隔离开关故障原因知识图谱的步骤,包括:
通过Neo4jde Cypher查询语言将三元组数据保存为CSV文件,利用D3.js可视化框架将所述三元组数据进行可视化。
其中,所述对所述待分析数据进行实体抽取获取高压隔离开关实体和发热故障实体的步骤之前,包括:
对所述待分析数据进行数据清洗与合并,对数据清洗与合并之后的所述待分析数据进行数据预处理以统一数据格式。
其中,所述对所述待分析数据进行数据清洗与合并的步骤,包括:
使用文字识别技术提取图片和PDF文档中的数据信息,使用序列标注对所述数据信息进行标注;
使用Word2vec将所述数据信息中包括的非结构化的文本信息转化为结构化的信息。
一种高压隔离开关发热故障预测系统,包括:
获取模块,用于获取高压隔离开关的待分析数据,所述待分析数据包括设备信息数据和发热故障历史数据;
数据模块,用于通过正则匹配和最大熵方式对所述待分析数据进行实体抽取获取高压隔离开关实体和发热故障实体;
图谱模块,用于集合统计抽取、聚类抽取和直接抽取三种抽取方式分别对所述高压隔离开关实体和所述发热故障实体进行三元组抽取,构建高压隔离开关设备信息知识图谱和高压隔离开关故障知识图谱;
融合模块,用于将所述设备信息数据和所述高压隔离开关设备信息知识图谱与所述高压隔离开关故障知识图谱进行特征融合,抽取高压隔离开关的主要发热故障特征以及故障原因;
预测模块,用于将所述主要发热故障特征输入到预设的FL—SVM分类模型中进行发热故障预测。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上所述方法的步骤。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上所述方法的步骤。
通过实施本发明,具有如下有益效果:
通过正则匹配和最大熵方式对所述待分析数据进行实体抽取获取高压隔离开关实体和发热故障实体,能够对文本数据中的实体进行较好的抽取,错误率较低,结合统计抽取、聚类抽取和直接抽取三种抽取方式分别对所述高压隔离开关实体和所述发热故障实体进行三元组抽取,,能够提取较为完整的设备信息三元组,将所述高压隔离开关设备信息与故障知识图谱与所述高压隔离开关故障原因知识图谱进行特征融合,识别出来了重要的高主要发热故障特征以及故障原因,为检测模型的输入构建了高质量的数据集,从而能够有效提升预测结果的准确性和可靠性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1是本发明提供的高压隔离开关发热故障预测方法的一实施例的流程示意图;
图2是本发明提供的CBOW模型的结构示意图;
图3是本发明提供的高压隔离开关信息与故障知识图谱的结构示意图;
图4是本发明提供的高压隔离开关故障原因知识图谱的结构示意图;
图5是本发明提供的TansH模型的结构示意图;
图6是本发明提供的高压隔离开关发热故障预测系统的一实施例的结构示意图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,图1是本发明提供的高压隔离开关发热故障预测方法的一实施例的流程示意图。本发明提供的高压隔离开关发热故障预测方法包括如下步骤:
S101:获取高压隔离开关的待分析数据,所述待分析数据包括设备信息数据和发热故障历史数据。
在一个具体的实施场景中,获取高压隔离开关的待分析数据,所述待分析数据包括设备信息数据和发热故障历史数据。待分析数据包括结构化数据和非结构化数据,非结构化的待分析数据包括PDF、Excel、图片文本数据等数据。待分析数据包括高压隔离开关日常工作记录数据和历史发热故障数据,也包含了隔离开关设备型号、厂家,以及开关所处位置的地理信息、气候条件等设备基础信息数据。
待分析数据可以通过供电局获取了近几年的历史台账数据获取。设备信息数据包括厂家、设备型号、供电局、变电站、投运日期、海拔高度以及管控等级、电压等级、额定电流、额定电压中的至少一个。发热故障历史数据包括发热时间、发热次数、发热位置、发热地点、发热设备型号中的至少一个。
在其他实施场景中,为了提升待分析数据的质量,对所述待分析数据进行数据清洗与合并,对数据清洗与合并之后的所述待分析数据进行数据预处理以统一数据格式。可以使用Python语言对结构化数据进行数据清洗,对非结构化的待分析数据可以根据文件大小进行删除,例如删除文件尺寸过小的非结构化的待分析数据。结构化的待分析数据清洗可以利用欧氏距离估计每对样本(任意两个结构化的待分析数据A和B)的相似度,进行数据的清洗与合并,处理重复值和异常值,提高数据集质量。
欧氏距离计算公式为:
Figure BDA0003897781220000061
其中:ED(A,B)表示样本A和B之间的欧氏距离;n表示样本维数;ai、bi表示样本A、B的第i维信息。
在本实施场景中,清洗前后对待分析数据选择相同分类器进行分类,分类结果的混淆矩阵(confusion matrix)和ROC(receiver operation characteristic)曲线作为数据集质量的评价指标。
在其他实施场景中,通过自然语言处理技术以及OCR(Optical CharacterRecognition,光学字符识别)技术进行处理。OCR识别技术可以提取图片格式和PDF格式的待分析数据的数据信息,使用序列标注方法对待分析数据进行标注,从而获取其中的文本信息。可以使用文本表示的方法将非结构化的待分析数据中包含的文本数据转化为结构化的信息。可以使用词嵌入的方法Word2vec来实现,模型使用CBOW,请结合参阅图2,图2是本发明提供的CBOW模型的结构示意图。学习目标函数为最大化对数似然函数:
Figure BDA0003897781220000062
将词向量的上下文词语作为输入信息输入到CBOW模型中,开始对文本数据进行分词和题干提取,根据词语出现的概率构造Huffman树形结构,然后生成树节点的二进制编码,接着,使用高效的训练方法层序softmax,使模型得到充分训练。可以将文本数据转化为可处理的向量数据。
在其他实施场景中,若采用Python语言进行编程,因sklearn库只能处理数值型数据,因此需要将待分析数据中的字符型数据转换为数值型数据。
S102:通过正则匹配和最大熵方式对所述待分析数据进行实体抽取获取高压隔离开关实体和发热故障实体。
在一个具体的实施场景中,通过正则匹配和最大熵方式对所述待分析数据进行实体抽取,正则匹配方式用于抽取普通字符和特殊字符中的实体。最大熵将待分析数据中提取出的文字输入模型,然后根据概率分布对实体进行抽取。
使用上述两个模型可以抽取高压隔离开关设备信息实体,包括设备型号、厂家、供电局、变电站、投运日期、地形地貌、海拔高度、极端高温、管控等级、电压等级、额定电流、额定电压中的至少一个。还可以抽取的发热故障实体,包括导致隔离开关发热的因素:触头氧化、触头锈蚀、螺栓松动、弹簧松动、表面破损、弹簧夹紧力不足、材质不合格、加工工艺缺陷、接触面工艺不佳、未镀锌、接触面不足、产品设计、合闸不到位、合闸过位、夹紧力不足、传动部件异常、高温高湿、运维水平和质量中的至少一个。
S103:结合统计抽取、聚类抽取和直接抽取三种抽取方式分别对所述高压隔离开关实体和所述发热故障实体进行三元组抽取,基于抽取的三元组构建高压隔离开关设备信息与故障知识图谱和高压隔离开关故障原因知识图谱。
在一个具体的实施场景中,集合统计抽取、聚类抽取和直接抽取三种抽取方式分别对所述高压隔离开关实体和所述发热故障实体进行三元组抽取。直接抽取是通过专家知识和经验积累来抽取实体和关系,比如已存在的关系数据集(例如,高压隔离开关、产自、厂家名称等);聚类抽取是通过将待分析数据中具有相似关系的实体和关系抽取出来;统计抽取是将待分析数据按照频次和条数等进行信息统计抽取,避免了数据歧义问题;三种方法的结合使用提高了所提取三元组的准确性、有效性。
请结合参阅表1和表2,其中,表1是高压隔离开关信息三元组示意表,表2是发热故障三元组示意表。
表1高压隔离开关信息三元组
Figure BDA0003897781220000071
Figure BDA0003897781220000081
表2高压隔离开关发热故障三元组
头实体 关系 尾实体
高压隔离开关A发热 原因 接触不良
高压隔离开关A发热 位置 触头
高压隔离开关A发热 原因 螺栓松动
在本实施场景中,基于上述获取的多个三元组使用Neo4j进行高压隔离开关信息与故障知识图谱以及高压隔离开关故障原因知识图谱的构建和存储,将上文中获取的多个三元组存入Neo4J数据库中,通过Neo4j的数据库自带的Cypher查询语言将保存的三元组数据保存为CSV文件,将数据封装利用D3.js可视化框架进行可视化。请结合参阅图3和图4,图3是本发明提供的高压隔离开关信息与故障知识图谱的结构示意图。图4是本发明提供的高压隔离开关故障原因知识图谱的结构示意图。
S104:将所述高压隔离开关设备信息与故障知识图谱与所述高压隔离开关故障原因知识图谱进行特征融合,抽取高压隔离开关的主要发热故障特征以及对应的故障原因。
在一个具体的实施场景中,高压隔离开关信息与故障知识图谱能够展示高压隔离开关的设备特征与故障的相关性。高压隔离开关故障原因知识图谱中,有些故障影响因素是客观的,如触头、接触面这些因素即为可观测的客观因素,且投入使用的年限增加此类影响更为加剧;而有些故障影响因素却是不可观测到的,或是人为造成的,比如设备的材质不符合要求、设备本身的设计存在缺陷,或是加工工艺存在缺陷等,此类因素存在难以测量、互相关联等问题,
在本实施场景中,以所述高压隔离开关设备信息与故障知识图谱和所述所述高压隔离开关故障原因知识图谱中相同的发热故障为媒介,通过TansH模型进行推理,将所述高压隔离开关设备信息与故障知识图谱和所述高压隔离开关故障原因知识图谱中的头实体、尾实体和关系映射到超平面进行关系查找,获取高压隔离开关的设备信息与发热故障原因的关联关系。请结合参阅图5,图5是本发明提供的TansH模型的结构示意图。基于高压隔离开关的设备信息与发热故障原因的关联关系进行分析,可以得到主要发热故障特征以及故障原因如表3所示,表3是主要发热故障特征以及故障原因示意表。
表3主要发热故障特征以及故障原因示意表
Figure BDA0003897781220000091
S105:将所述主要发热故障特征输入到预设的FL—SVM分类模型中进行发热故障预测。
在一个具体的实施场景中,将提取出来的主要发热故障特征作为FL-SVM分类模型的输入,进行发热故障检测。例如,可以输入
首先构建预设的FL—SVM分类模型,选择非线性函数Φ(x)高斯核函数作为本发明中SVM分类模型的核函数,其中所述核函数为:
Figure BDA0003897781220000101
在SVM模型的基础上采用Focal Loss损失函数来解决样本不均衡问题,构成所述预设的FL—SVM分类模型,Focal Loss函数来源于交叉熵,二分类的交叉熵如下:
Figure BDA0003897781220000102
其中p为分类概率,y为分类类别。
再交叉熵的基础上增加系数
Figure BDA0003897781220000103
(范围为[0,1])和调制系数(1-pt)y,pt代替p表示1-p和p两个类别,可以控制正负样本的权重。则得到Focal Loss的公式即为:
Figure BDA0003897781220000104
其中,p为分类概率,y为分类类别。
对构建好的预设的FL—SVM分类模型训练完成后,计算所述预设的FL—SVM分类模型的准确率、精确率、召回率和F1分数,对所述预设的FL—SVM分类模型进行评价。
准确率(Accuracy):指对于模型分类的测试集,分类结果正确的样本占样本总数的比值,公式如下:
Figure BDA0003897781220000105
精确率(Precision):指分类结果为正的样本中标签也为正的概率,公式如下:
Figure BDA0003897781220000106
召回率(Recall):指分类正确的样本中被模型归类为正样本的概率,公式如下:
Figure BDA0003897781220000107
F1分数(F1-Score):是精确率与召回率的调和平均,是一个0到1之间的数,一般用于衡量分类器的综合性能,公式如下:
Figure BDA0003897781220000108
其中,TP(True Positive):真正例,标签和预测值都为正值;
TN(True Negative):假正例,标签为负值,预测值为正值;
FP(False Positive):假负例,标签为正值,预测值为负值;
FN(False Negative):真负例,标签和预测值都为负值。
在一个实施场景中,将上文中获取的主要发热故障特征作为输入信息,将总数据样本按照8:2的比例分为训练集和测试集,输入本发明提供的FL—SVM分类模型中进行充分的寻参以及训练,以及和其他模型包括随机森林(Random Forest,RF)、朴素贝叶斯(
Figure BDA0003897781220000112
Bayes)、逻辑回归(Logistic Regression,LR)、支持向量机(Support Vector Machine,SVM)采用相同的输入信息进行训练后做对比,获取对比结果,如表4所示,表4是模型评价结果对比表。
表4模型评价结果对比表
Figure BDA0003897781220000111
由对比结果可知,对比原始模型SVM以及其他机器学习模型,FL-SVM能够取得更好的分类效果,再加入Focal Loss损失函数之后对SVM的分类准确率增加了5个百分点。能够较好的检测出故障样本。
在其他实施场景中,当将所述主要发热故障特征输入到预设的FL—SVM分类模型中进行发热故障预测之后,基于预测的结果(会发生发热故障的高压隔离开关设备的设备信息和发热故障原因)制定高压隔离开关设备的巡检方案。例如,可以对预测会发生故障的高压隔离开关设备的地理位置信息经常分析,规划处适合的巡检路线,避免对一些处于非发热故障状态的高压隔离开关设备进行无效巡检,在巡检时可以直接针对发热故障原因进行巡检,有效节约了巡检时间,降低了巡检人力物力成本。例如,可以将投运年数大于预设年限输入预设的FL—SVM分类模型,获取会发生发热故障的高压隔离开关设备的设备信息,以及对应的故障原因,例如设备A的故障原因为触头氧化和触头锈蚀、设备B的故障原因为螺栓松动、设备C的故障原因为弹簧松动和弹簧夹紧力不足、设备D预测不会发生故障,则可以针对设备A、B、C规划巡检路线,并着重检查各个设备对应的故障原因所对应的部件。
通过上述描述可知,在本实施例中通过正则匹配和最大熵方式对所述待分析数据进行实体抽取获取高压隔离开关实体和发热故障实体,能够对文本数据中的实体进行较好的抽取,错误率较低,结合统计抽取、聚类抽取和直接抽取三种抽取方式分别对所述高压隔离开关实体和所述发热故障实体进行三元组抽取,,能够提取较为完整的设备信息三元组,将所述高压隔离开关设备信息与故障知识图谱与所述高压隔离开关故障原因知识图谱进行特征融合,识别出来了重要的高主要发热故障特征以及故障原因,为检测模型的输入构建了高质量的数据集,从而能够有效提升预测结果的准确性和可靠性。
请参阅图6,图6是本发明提供的高压隔离开关发热故障预测系统的一实施例的结构示意图。高压隔离开关发热故障预测系统10包括:获取模块11、数据模块12、图谱模块13、融合模块14和预测模块15。
获取模块11用于获取高压隔离开关的待分析数据,所述待分析数据包括设备信息数据和发热故障历史数据;数据模块12用于通过正则匹配和最大熵方式对所述待分析数据进行实体抽取获取高压隔离开关实体和发热故障实体;图谱模块13用于集合统计抽取、聚类抽取和直接抽取三种抽取方式分别对所述高压隔离开关实体和所述发热故障实体进行三元组抽取,构建高压隔离开关设备信息知识图谱和高压隔离开关故障知识图谱;融合模块14用于将所述设备信息数据和所述高压隔离开关设备信息知识图谱与所述高压隔离开关故障知识图谱进行特征融合,抽取高压隔离开关的主要发热故障特征以及故障原因;预测模块15用于将所述主要发热故障特征输入到预设的FL—SVM分类模型中进行发热故障预测。
融合模块14还用于以所述高压隔离开关设备信息与故障知识图谱和所述所述高压隔离开关故障原因知识图谱中相同的发热故障为媒介,通过TansH模型进行推理,将所述高压隔离开关设备信息与故障知识图谱和所述高压隔离开关故障原因知识图谱中的头实体、尾实体和关系映射到超平面进行关系查找,获取高压隔离开关的设备信息与发热故障原因的关联关系。
预测模块15还用于选择非线性函数Φ(x)高斯核函数作为本发明中SVM分类模型的核函数,其中所述核函数为:
Figure BDA0003897781220000131
在SVM模型的基础上采用Focal Loss损失函数来解决样本不均衡问题,构成所述预设的FL—SVM分类模型,其中,Focal Loss损失函数的公式为:
Figure BDA0003897781220000132
其中,p为分类概率,y为分类类别。
预测模块15还用于计算所述预设的FL—SVM分类模型的准确率、精确率、召回率和F1分数,对所述预设的FL—SVM分类模型进行评价。
预测模块15还用于基于预测的结果制定高压隔离开关设备的巡检方案。
获取模块11还用于对所述待分析数据进行数据清洗与合并,对数据清洗与合并之后的所述待分析数据进行数据预处理以统一数据格式。
获取模块11还用于使用文字识别技术提取图片和PDF文档中的数据信息,使用序列标注对所述数据信息进行标注;使用Word2vec将所述待处理数据中包括的非结构化的文本信息转化为结构化的信息。
通过上述描述可知,在本实施例中通过正则匹配和最大熵方式对所述待分析数据进行实体抽取获取高压隔离开关实体和发热故障实体,能够对文本数据中的实体进行较好的抽取,错误率较低,结合统计抽取、聚类抽取和直接抽取三种抽取方式分别对所述高压隔离开关实体和所述发热故障实体进行三元组抽取,,能够提取较为完整的设备信息三元组,将所述高压隔离开关设备信息与故障知识图谱与所述高压隔离开关故障原因知识图谱进行特征融合,识别出来了重要的高主要发热故障特征以及故障原因,为检测模型的输入构建了高质量的数据集,从而能够有效提升预测结果的准确性和可靠性。
图7示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端,也可以是服务器。如图7所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现年龄识别方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行年龄识别方法。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提出了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如图1中所示的步骤。
在一个实施例中,提出了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如图1所示的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。请输入具体实施内容部分。

Claims (10)

1.一种高压隔离开关发热故障预测方法,其特征在于,包括:
获取高压隔离开关的待分析数据,所述待分析数据包括设备信息数据和发热故障历史数据;
通过正则匹配和最大熵方式对所述待分析数据进行实体抽取获取高压隔离开关实体和发热故障实体;
结合统计抽取、聚类抽取和直接抽取三种抽取方式分别对所述高压隔离开关实体和所述发热故障实体进行三元组抽取,基于抽取的三元组构建高压隔离开关设备信息与故障知识图谱和高压隔离开关故障原因知识图谱;
将所述高压隔离开关设备信息与故障知识图谱与所述高压隔离开关故障原因知识图谱进行特征融合,抽取高压隔离开关的主要发热故障特征以及对应的故障原因;
将所述主要发热故障特征输入到预设的FL—SVM分类模型中进行发热故障预测。
2.根据权利要求1所述的高压隔离开关发热故障预测方法,其特征在于,所述将所述高压隔离开关设备信息与故障知识图谱与所述高压隔离开关故障原因知识图谱进行特征融合的步骤,包括:
以所述高压隔离开关设备信息与故障知识图谱和所述所述高压隔离开关故障原因知识图谱中相同的发热故障为媒介,通过TansH模型进行推理,将所述高压隔离开关设备信息与故障知识图谱和所述高压隔离开关故障原因知识图谱中的头实体、尾实体和关系映射到超平面进行关系查找,获取高压隔离开关的设备信息与发热故障原因的关联关系。
3.根据权利要求1所述的高压隔离开关发热故障预测方法,其特征在于,所述将所述主要发热故障特征输入到预设的FL—SVM分类模型中进行发热故障预测的步骤之前,包括:
选择非线性函数Φ(x)高斯核函数作为本发明中SVM分类模型的核函数,其中所述核函数为:
Figure FDA0003897781210000021
在SVM模型的基础上采用Focal Loss损失函数来解决样本不均衡问题,构成所述预设的FL—SVM分类模型,其中,Focal Loss损失函数的公式为:
Figure FDA0003897781210000022
其中,p为分类概率,y为分类类别。
4.根据权利要求3所述的高压隔离开关发热故障预测方法,其特征在于,所述构成所述预设的FL—SVM分类模型的步骤之后,包括:
计算所述预设的FL—SVM分类模型的准确率、精确率、召回率和F1分数,对所述预设的FL—SVM分类模型进行评价。
5.根据权利要求1所述的高压隔离开关发热故障预测方法,其特征在于,所述将所述主要发热故障特征输入到预设的FL—SVM分类模型中进行发热故障预测的步骤之后,包括:
基于预测的结果制定高压隔离开关设备的巡检方案。
6.根据权利要求1所述的高压隔离开关发热故障预测方法,其特征在于,所述对所述待分析数据进行实体抽取获取高压隔离开关实体和发热故障实体的步骤之前,包括:
对所述待分析数据进行数据清洗与合并,对数据清洗与合并之后的所述待分析数据进行数据预处理以统一数据格式。
7.根据权利要求6所述的高压隔离开关发热故障预测方法,其特征在于,所述对所述待分析数据进行数据清洗与合并的步骤,包括:
使用文字识别技术提取图片和PDF文档中的数据信息,使用序列标注对所述数据信息进行标注;
使用Word2vec将所述待处理数据中包括的非结构化的文本信息转化为结构化的信息。
8.一种高压隔离开关发热故障预测系统,其特征在于,包括:
获取模块,用于获取高压隔离开关的待分析数据,所述待分析数据包括设备信息数据和发热故障历史数据;
数据模块,用于通过正则匹配和最大熵方式对所述待分析数据进行实体抽取获取高压隔离开关实体和发热故障实体;
图谱模块,用于集合统计抽取、聚类抽取和直接抽取三种抽取方式分别对所述高压隔离开关实体和所述发热故障实体进行三元组抽取,构建高压隔离开关设备信息知识图谱和高压隔离开关故障知识图谱;
融合模块,用于将所述设备信息数据和所述高压隔离开关设备信息知识图谱与所述高压隔离开关故障知识图谱进行特征融合,抽取高压隔离开关的主要发热故障特征以及故障原因;
预测模块,用于将所述主要发热故障特征输入到预设的FL—SVM分类模型中进行发热故障预测。
9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。
CN202211278841.XA 2022-10-19 2022-10-19 高压隔离开关发热故障预测方法、系统、设备和存储介质 Pending CN115599913A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211278841.XA CN115599913A (zh) 2022-10-19 2022-10-19 高压隔离开关发热故障预测方法、系统、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211278841.XA CN115599913A (zh) 2022-10-19 2022-10-19 高压隔离开关发热故障预测方法、系统、设备和存储介质

Publications (1)

Publication Number Publication Date
CN115599913A true CN115599913A (zh) 2023-01-13

Family

ID=84848397

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211278841.XA Pending CN115599913A (zh) 2022-10-19 2022-10-19 高压隔离开关发热故障预测方法、系统、设备和存储介质

Country Status (1)

Country Link
CN (1) CN115599913A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116628551A (zh) * 2023-05-23 2023-08-22 上海发电设备成套设计研究院有限责任公司 在役核电机组的可靠性高精度预测、监控和增长方法
CN116702679A (zh) * 2023-08-02 2023-09-05 深圳新成思达教育科技有限公司 一种隔离开关操动机构控制回路模拟系统及方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116628551A (zh) * 2023-05-23 2023-08-22 上海发电设备成套设计研究院有限责任公司 在役核电机组的可靠性高精度预测、监控和增长方法
CN116628551B (zh) * 2023-05-23 2024-03-08 上海发电设备成套设计研究院有限责任公司 在役核电机组的可靠性高精度预测、监控和增长方法
CN116702679A (zh) * 2023-08-02 2023-09-05 深圳新成思达教育科技有限公司 一种隔离开关操动机构控制回路模拟系统及方法
CN116702679B (zh) * 2023-08-02 2024-02-13 深圳新成思达教育科技有限公司 一种隔离开关操动机构控制回路模拟系统及方法

Similar Documents

Publication Publication Date Title
CN115599913A (zh) 高压隔离开关发热故障预测方法、系统、设备和存储介质
CN109165840B (zh) 风险预测处理方法、装置、计算机设备和介质
KR102574016B1 (ko) 파워 네트워크 애셋들의 조건 분류를 위한 방법들 및 디바이스들
CN111210024A (zh) 模型训练方法、装置、计算机设备和存储介质
CN115081584A (zh) 基于机器学习的电力设备健康管理方法、系统及介质
CN111080117A (zh) 设备风险标签的构建方法、装置、电子设备及存储介质
CN115935807B (zh) 基于图马尔可夫神经网络的诊断模型的训练方法
CN106845728B (zh) 一种电力变压器缺陷的预测方法及装置
CN110866331A (zh) 一种电力变压器家族质量缺陷的评估方法
CN116384487A (zh) 用于储能站锂离子电池故障诊断分析的知识图谱构建方法
Wang Grey-extension method for incipient fault forecasting of oil-immersed power transformer
Glauner et al. Is big data sufficient for a reliable detection of non-technical losses?
CN111861141B (zh) 一种基于模糊故障率预测的配电网可靠性评估方法
CN113010695A (zh) 一种适用于继电保护装置缺陷分析的专业词典构建方法
Melagoda et al. Application of machine learning algorithms for predicting vegetation related outages in power distribution systems
CN117332330A (zh) 基于多源数据图融合模型的变压器故障评估方法及系统
CN111985226B (zh) 标注数据生成方法及装置
Firos et al. Fault detection in power transmission lines using AI model
CN111178556A (zh) 电量异常检测方法、装置、计算机设备和可读存储介质
CN115618286A (zh) 变压器局部放电类型识别方法、系统、设备、终端及应用
CN113591480B (zh) 电力计量的命名实体识别方法、装置和计算机设备
CN114461735A (zh) 工矿数据分级分类方法、装置和计算机设备
Sin et al. Data-driven prediction of battery degradation using EIS-based robust features
Liu et al. Artificial enabled communications energy trade management in sustainable generator based fault detection for work substation recordings
Makota et al. A big data-based ensemble for fault prediction in electrical secondary distribution network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination