CN108304567B - 高压变压器工况模式识别与数据分类方法及系统 - Google Patents

高压变压器工况模式识别与数据分类方法及系统 Download PDF

Info

Publication number
CN108304567B
CN108304567B CN201810134503.6A CN201810134503A CN108304567B CN 108304567 B CN108304567 B CN 108304567B CN 201810134503 A CN201810134503 A CN 201810134503A CN 108304567 B CN108304567 B CN 108304567B
Authority
CN
China
Prior art keywords
working condition
data
pattern recognition
classifier
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810134503.6A
Other languages
English (en)
Other versions
CN108304567A (zh
Inventor
张玄武
蔡一彪
罗静
吴芳基
卢天华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Safety Intelligent Technology Co Ltd
Original Assignee
Hangzhou Safety Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Safety Intelligent Technology Co Ltd filed Critical Hangzhou Safety Intelligent Technology Co Ltd
Priority to CN201810134503.6A priority Critical patent/CN108304567B/zh
Publication of CN108304567A publication Critical patent/CN108304567A/zh
Application granted granted Critical
Publication of CN108304567B publication Critical patent/CN108304567B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply

Abstract

本发明公开了一种高压变压器工况模式识别与数据分类方法,包括以下步骤:采集高压变压器的工况数据,将所述工况数据定义为数值型工况数据和字符型工况数据;分别构建数值型工况数据和字符型工况数据的工况模式识别分类器,记作第一工况模式识别分类器和第二工况模式识别分类器,根据构建好的第一工况模式识别分类器和第二工况模式识别分类器对待分类的工况数据进行分类识别,得到分类结果。本发明的方法应用了大数据技术,将采集到的变压器进行在线监测,并且将数据建立成第一工况模式识别分类器和第二工况模式识别分类器,通过对工况模式数据进行识别分类,并且,随着数据量的增加和积累,分类会不断被细化和精确化。

Description

高压变压器工况模式识别与数据分类方法及系统
技术领域
本发明涉及高压变压器技术领域,尤其涉及了一种高压变压器工况模式识别与数据分类方法及系统。
背景技术
高压变压器是电力系统的关键设备,高压变压器的可靠运行对电力系统的稳定运行至关重要,为了提高供电可靠性,除了在设备生产阶段选用技术过硬、质量过关的变压器以外,还按照国家标准、行业标准、公司标准制定了一系列的阈值,在变压器上安装传感器并且进行实时的在线监测,当变压器的某一项指标超出标准规定的阈值时,判断变压器发生了相应的故障,目前市场上的变压器在线诊断系统多采用这种方式,经过实际观察,发现这种方式误报率非常高,常常会带来不必要的麻烦。此外,当前针对运用机器学习算法的变压器状态评估和故障诊断方法多直接针对变压器的数据进行算法模型的设计、训练和预测,模型的准确率和鲁棒性都较低。以上两种方法均未考虑变压器的工况对监测数据造成的影响。例如当变压器运行环境温度升高时,变压器绝缘油油温会相应的升高,此时无法区分油温温度升高是否为变压器故障造成。当变压器负载增加时,变压器绕组温度升高,此时绕组温度将可能超出阈值,在线监测系统发出警报,但是变压器本身并无故障。
高压变压器专门用于输配电行业,工作环境常常因气候等原因发生变化,夏季由于温度较高会造成变压器整体温度升高,冬季由于温度较低会造成变压器整体温度的降低,昼夜间电量需求的巨大变化会造成变压器负载的巨大变化,季节性的用电需求变化会导致变压器负载的节律性的变化。这些变化都会导致变压器油温、绕组温度升高、油中溶解气体发生变化等影响。因此,针对变压器工况对变压器的监测数据进行分类需求强烈。
在当前的国家标准及行业标准《电力设备预防性试验规程》、《变压器油中溶解气体分析和判断导则》中并无针对变压器工况不同的情况下对变压器监测数据进行分割或分情况处理的说明,而是针对变压器所有工况设定同一或有限阈值,无论变压器处在何种工况下,当变压器在线监测数据变化超出阈值时即判断变压器发生异常,无法得知变压器在线监测数据超出阈值是否为变压器异常或变压器工况发生变化。此外,变压器的工况如温度、负载等往往是连续变化的,也会对工况的定义造成很大的困难,针对变压器在线监测数据需进行工况分割的需求,本专利提出一种工况模式识别的方法,针对变压器工况进行模式识别,为数据分割、分工况进行故障诊断、状态评价、故障预测等工作提供数据基础。
发明内容
本发明针对现有技术中的缺点,提供了一种高压变压器工况模式识别与数据分类方法及系统。
为了解决上述技术问题,本发明通过下述技术方案得以解决:
本发明披露了:
一种高压变压器工况模式识别与数据分类方法,包括以下步骤:
采集高压变压器的工况数据,将所述工况数据定义为数值型工况数据和字符型工况数据;
分别构建数值型工况数据和字符型工况数据的工况模式识别分类器,记作第一工况模式识别分类器和第二工况模式识别分类器,其中,构建所述第一工况模式识别分类器时,首先,对数值型工况数据进行预处理,得到数组序列;其次,对数组序列中的所有元素进行聚类,得到聚类中心,并按照归属度区分各节点所属的类别,并作为训练第一工况模式识别分类器的样本集;再次,通过样本对第一工况模式识别分类器进行训练和测试,得到满足要求的第一工况模式识别分类器;
根据构建好的第一工况模式识别分类器和第二工况模式识别分类器对待分类的工况数据进行分类识别,得到分类结果。
作为一种可实施方式,所述对数值型工况数据进行预处理,得到数组序列的具体步骤为:
根据采集到的工况数据,从工况数据中提取数值型工况数据;
采用箱形法对选取的数值型工况数据进行处理,得到数组序列。
作为一种可实施方式,所述采用箱形法对数据进行处理,得到数组序列的具体步骤为:
从数值型工况数据中选取L个点作为时间窗口,将在时间窗口范围内的数值型工况数据从小到大进行排序,形成排序后的序列;
从序列中选取第
Figure BDA0001575905150000031
大的数字作为下四分位数,其中,L为时间窗口的点数,即序列的长度,从序列中选取第
Figure BDA0001575905150000032
大的数字作为上四分位数;
将序列中大于上四分位数或者小于下四分位数的点作为异常点从序列中剔除,并填入空值;
采用插值法将序列中的空值补全,组成新的序列,记作第一序列,此第一序列即为所述数组序列。
作为一种可实施方式,所述对数组序列中的所有元素进行聚类,得到聚类中心,并按照归属度区分各节点所属的类别,并作为训练第一工况模式识别分类器的样本集的具体步骤为:
对第一序列中所有元素采用AP算法进行聚类,具体步骤为:
计算第一序列中各点两两之间的欧式距离,取欧氏距离的负值称为相似度,进而组成相似度矩阵;
选取相似度矩阵中除0以外最小值,将相似度矩阵中主对角线上的所有零点替换为所述最小值,组成新的相似度矩阵,记作第一相似度矩阵;
计算第一相似度矩阵的吸引度矩阵和归属度矩阵,对样本点的吸引度和归属度求和,得到两者之和,将两者之和作为聚类中心;
重复计算及求和步骤,直到聚类中心不变或者达到指定迭代次数时结束迭代,取吸引度和归属度和为正值的节点作为聚类中心,按照归属度区分各节点所属的类别,形成若干类数组;
将已经聚类为若干类的数组按照数组所属的类别进行标注,组成样本集;
将样本集中每个类别的数组分成两份,一份为训练集,另一份为测试集。
作为一种可实施方式,所述通过样本对第一工况模式识别分类器进行训练和测试,得到满足要求的第一工况模式识别分类器的具体步骤为:
运用Softmax算法构建第一工况模式识别分类器,采用训练集数据对分类器进行训练,采用测试集数据对分类器进行测试,其中,Softmax算法的具体以过程为:
构建Softmax回归模型:
Figure BDA0001575905150000043
其中,P(y(i)=j|x(i);θ)表示输入x(i)属于第j类的概率,j表示所属类别,x(i)表示需要进行分类的输入矩阵,θ表示模型参数;
定义Softmax回归模型的代价函数:
Figure BDA0001575905150000041
其中,1{y(i)=j}表示当{y(i)=j}时1{y(i)=j}=1,当y(i)≠j时1{y(i)=j}=0,
Figure BDA0001575905150000042
为衰减项,λ>0为衰减因子,m表示训练集中样本的数量;
基于训练集数据采用梯度下降法求最小值,即可得到Softmax模型参数;
采用测试集对训练好的Softmax模型进行测试,当测试结果准确率达到预期要求时,则训练好的Softmax模型即为第一工况模式识别分类器,若不满足要求,则返回聚类步骤进行重新聚类,直至Softmax模型达到要求。
作为一种可实施方式,构建第二工况模式识别分类器的步骤为:
根据采集到的工况数据,从工况数据中提取字符型工况数据;
对字符型数据中的文本进行统计,将相同的文本归为一类,不同的文本归为不同的类别,当遇到字符型数据时,将字符型数据与统计结果进行匹配,将字符型数据归类到文本相同的类别,最终构建出第二工况模式识别分类器。
本发明还披露了:
一种高压变压器工况模式识别与数据分类系统,包括数据采集定义模块、分类器构建模块和识别执行模块;
所述数据采集定义模块,用于采集高压变压器的工况数据,将所述工况数据定义为数值型工况数据和字符型工况数据;
所述分类器构建模块,用于分别构建数值型工况数据和字符型工况数据的工况模式识别分类器,记作第一工况模式识别分类器和第二工况模式识别分类器;
所述识别执行模块,用于根据构建好的第一工况模式识别分类器和第二工况模式识别分类器对待分类的工况数据进行分类识别,得到分类结果;
其中,所述分类器构建模块包括第一工况模式识别分类器构建模块和第二工况模式识别分类器构建模块,其中,所述第一工况模式识别分类器构建模块,用于构建所述第一工况模式识别分类器;
所述第一工况模式识别分类器构建模块包括预处理单元、生成样本单元和训练测试单元;所述预处理单元,用于对数值型工况数据进行预处理,得到数组序列;所述生成样本单元,用于对数组序列中的所有元素进行聚类,得到聚类中心,并按照归属度区分各节点所属的类别,并作为训练第一工况模式识别分类器的样本集;所述训练测试单元,用于通过样本对第一工况模式识别分类器进行训练和测试,得到满足要求的第一工况模式识别分类器。
作为一种可实施方式,所述预处理单元包括数据提取单元和数组获取单元;
所述数据提取单元,用于根据采集到的工况数据,从工况数据中提取数值型工况数据;
所述数组获取单元,用于采用箱形法对选取的数值型工况数据进行处理,得到数组序列。
作为一种可实施方式,所述第二工况模式识别分类器构建模块包括字符型数据提取单元和构建单元;
所述字符型数据提取单元,用于根据采集到的工况数据,从工况数据中提取字符型工况数据;
所述构建单元,用于对字符型数据中的文本进行统计,将相同的文本归为一类,不同的文本归为不同的类别,当遇到字符型数据时,将字符型数据与统计结果进行匹配,将字符型数据归类到文本相同的类别,最终构建出第二工况模式识别分类器。
本发明还披露了:
一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现高压变压器工况模式识别与数据分类方法的步骤。
本发明由于采用了以上技术方案,具有显著的技术效果:
采用本发明的方法针对变压器的在线监测数据进行自动工况模式识别,为后续的数据分割提供了基础;
本发明的方法应用了大数据技术,将采集到的变压器进行在线监测,并且将数据建立成第一工况模式识别分类器和第二工况模式识别分类器,通过第一工况模式识别分类器和第二工况模式识别分类器对工况模式数据进行识别分类,并且,随着数据量的增加和积累,第一工况模式识别分类器和第二工况模式识别分类器会不断被细化和精确化。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的整体流程示意图;
图2是本发明的分类识别过程示意图;
图3是本发明采用箱形法对数据进行处理的流程示意图;
图4是本发明具体完整流程示意图;
图5是本发明的系统示意图;
图6是本发明的分类器构建模块的整体结构示意图。
标号说明:100、数据采集定义模块;200、分类器构建模块;300、识别执行模块;210、第一工况模式识别分类器构建模块;220、第二工况模式识别分类器构建模块;211、预处理单元;212、生成样本单元;213、训练测试单元;2111、数据提取单元;2112、数组获取单元;221、字符型数据提取单元;222、构建单元。
具体实施方式
下面结合实施例对本发明做进一步的详细说明,以下实施例是对本发明的解释而本发明并不局限于以下实施例。
实施例1:
一种高压变压器工况模式识别与数据分类方法,如图1所示,包括以下步骤:
S100、采集高压变压器的工况数据,将所述工况数据定义为数值型工况数据和字符型工况数据;
S200、分别构建数值型工况数据和字符型工况数据的工况模式识别分类器,记作第一工况模式识别分类器和第二工况模式识别分类器,其中,构建所述第一工况模式识别分类器时,首先,对数值型工况数据进行预处理,得到数组序列;其次,对数组序列中的所有元素进行聚类,得到聚类中心,并按照归属度区分各节点所属的类别,并作为训练第一工况模式识别分类器的样本集;再次,通过样本对第一工况模式识别分类器进行训练和测试,得到满足要求的第一工况模式识别分类器;
S300、根据构建好的第一工况模式识别分类器和第二工况模式识别分类器对待分类的工况数据进行分类识别,得到分类结果。
在步骤S100中,所述的工况是指设备在和其动作有直接关系的条件下的工作状态,更具体地,在本发明中,工况指变压器在不同的运行环境下的工作状态。
当前能被监测到的变压器的运行工况数据有海拔、天气状况、相对湿度、环境温度、各相电流、各相电压等,将这些数据进行采集,并且整理成以下两个表格,数据如表1表2所示:
表1环境信息表
序号 开关量名称 数据格式 数据来源
1 天气状况 字符 气象局
2 环境温度 数值 传感器
3 相对湿度 数值 传感器
4 海拔 数值 人工填写
表2SCADA数据表
Figure BDA0001575905150000081
Figure BDA0001575905150000091
按照表1和表2来选取数值型工况数据和字符型工况数据。
在步骤S200中,所述对数值型工况数据进行预处理,得到数组序列的具体步骤为:
S210、根据采集到的工况数据,从工况数据中提取数值型工况数据;
S220、采用箱形法对选取的数值型工况数据进行处理,得到数组序列。
在步骤S220中,如图3所示,所述采用箱形法对数据进行处理,得到数组序列的具体步骤为:
从数值型工况数据中选取L个点作为时间窗口,将在时间窗口范围内的数值型工况数据从小到大进行排序,形成排序后的序列A1
从序列A1中选取第
Figure BDA0001575905150000092
大的数字作为下四分位数Q1,其中,L为时间窗口的点数,即序列的长度,从序列中选取第
Figure BDA0001575905150000093
大的数字作为上四分位数Q3
将序列A1中大于上四分位数Q3或者小于下四分位数Q1的点作为异常点从序列A1中剔除,并填入空值;
采用插值法将序列A1中的空值补全,组成新的序列,记作第一序列,此第一序列即为所述数组序列A={A1,A2...,An}。
在步骤S200中,所述对数组序列中的所有元素进行聚类,得到聚类中心,并按照归属度区分各节点所属的类别,并作为训练第一工况模式识别分类器的样本集的具体步骤为:
对第一序列A={A1,A2...,An}中所有元素采用AP算法进行聚类,具体步骤为:
计算第一序列A={A1,A2...,An}中各点两两之间的欧式距离,取欧氏距离的负值称为相似度SI,J,进而组成相似度矩阵S;
选取相似度矩阵S中除0以外最小值a,将相似度矩阵S中主对角线上的所有零点替换为所述最小值a,组成新的相似度矩阵S,记作第一相似度矩阵;
计算第一相似度矩阵的吸引度矩阵和归属度矩阵,对样本点的吸引度和归属度求和,得到两者之和,将两者之和作为聚类中心,在此,吸引度矩阵的计算公式为:
r(i,k)=S(i,k)-maxk'≠k{a(i,k')+S(i,k')}
其中,S(i,k)表示点i对点k的相似程度,在第一次迭代中使用相似度矩阵S代替,a(i,k')表示除k以外其他点对i点的归属度值,初始值为0,S(i,k')表示除k以外其他点对i的吸引度;归属度的计算公式为:
Figure BDA0001575905150000101
和公式
a(k,k)=∑i'≠kmax{0,r(i',k)}
其中,表示k作为除i以外其他点的聚类中心的相似度值,取所有大于等于0的吸引度值,r(k,k)表示k做为聚类中心的可能性;
重复计算及求和步骤,直到聚类中心不变或者达到指定迭代次数时结束迭代,取吸引度和归属度和为正值的节点作为聚类中心,按照归属度区分各节点所属的类别,形成若干类数组;
将已经聚类为k类的数组按照数组所属的类别进行标注,由1至k打上标签,组成样本集,在此,为了防止训练分类算法时产生的不平衡现象,取所有聚类类别中数组数目最少的一类的数组数目为基准,运用随机抽样的方法对其余类别进行抽样,使得每个类别中的数组个数相同,将所有经过处理的类别组成样本集;
将样本集中每个类别的数组分成两份,一份为训练集Train_B,另一份为测试集Test_B,进行训练模型。
更具体地,在步骤S200中,所述通过样本对第一工况模式识别分类器进行训练和测试,得到满足要求的第一工况模式识别分类器的具体步骤为:
运用Softmax算法构建第一工况模式识别分类器,采用训练集数据对分类器进行训练,采用测试集数据对分类器进行测试,其中,Softmax算法的具体以过程为:
构建Softmax回归模型:
Figure BDA0001575905150000111
其中,P(y(i)=j|x(i);θ)表示输入x(i)属于第j类的概率,j表示所属类别,x(i)表示需要进行分类的输入矩阵,θ表示模型参数;
定义Softmax回归模型的代价函数:
Figure BDA0001575905150000112
其中,1{y(i)=j}表示当{y(i)=j}时1{y(i)=j}=1,当y(i)≠j时1{y(i)=j}=0,
Figure BDA0001575905150000113
为衰减项,λ>0为衰减因子,m表示训练集中样本的数量;
基于训练集数据采用梯度下降法求最小值,即可得到Softmax模型参数;
采用测试集对训练好的Softmax模型进行测试,当测试结果准确率达到预期要求时,则训练好的Softmax模型即为第一工况模式识别分类器,若不满足要求,则返回聚类步骤进行重新聚类,直至Softmax模型达到要求。
根据步骤S100和S200,制作出完成的流程图,参加附图4。
更具体地,在步骤S200中,构建第二工况模式识别分类器的步骤为:
根据采集到的工况数据,从工况数据中提取字符型工况数据;
对字符型数据中的文本进行统计,将相同的文本归为一类,不同的文本归为不同的类别,当遇到字符型数据时,将字符型数据与统计结果进行匹配,将字符型数据归类到文本相同的类别,最终构建出第二工况模式识别分类器。
最后,如图2所示,步骤S300中根据构建好的第一工况模式识别分类器和第二工况模式识别分类器对待分类的工况数据进行分类识别,得到分类结果的具体过程为:当有新的工况数据需要进行工况分类时,首先在每一个工况维度对工况数据进行预处理,将预处理过后的工况数据传入其相对应数据类型的工况模式识别分类器中,工况模式识别分类器会自动的给出每一个维度的数据在其维度中所属的类别;
将工况数据每一个维度的分类结果组合成一个数组,数组内所有分类结果都相同的数据为相同工况,否则为不同工况。
本发明还公开了:
一种高压变压器工况模式识别与数据分类系统,如图5所示,包括数据采集定义模块100、分类器构建模块200和识别执行模块300;
所述数据采集定义模块100,用于采集高压变压器的工况数据,将所述工况数据定义为数值型工况数据和字符型工况数据;
所述分类器构建模块200,用于分别构建数值型工况数据和字符型工况数据的工况模式识别分类器,记作第一工况模式识别分类器和第二工况模式识别分类器;
所述识别执行模块300,用于根据构建好的第一工况模式识别分类器和第二工况模式识别分类器对待分类的工况数据进行分类识别,得到分类结果;
其中,所述分类器构建模块200包括第一工况模式识别分类器构建模块210和第二工况模式识别分类器构建模块220,如图6所示,其中,所述第一工况模式识别分类器构建模块210,用于构建所述第一工况模式识别分类器;所述第一工况模式识别分类器构建模块210包括预处理单元211、生成样本单元212和训练测试单元213;所述预处理单元211,用于对数值型工况数据进行预处理,得到数组序列;所述生成样本单元212,用于对数组序列中的所有元素进行聚类,得到聚类中心,并按照归属度区分各节点所属的类别,并作为训练第一工况模式识别分类器的样本集;所述训练测试单元213,用于通过样本对第一工况模式识别分类器进行训练和测试,得到满足要求的第一工况模式识别分类器。
更具体地,所述预处理单元211包括数据提取单元2111和数组获取单元2112;
所述数据提取单元2111,用于根据采集到的工况数据,从工况数据中提取数值型工况数据;
所述数组获取单元2112,用于采用箱形法对选取的数值型工况数据进行处理,得到数组序列。
更具体地,所述第二工况模式识别分类器构建模块220包括字符型数据提取单元221和构建单元222;
所述字符型数据提取单元221,用于根据采集到的工况数据,从工况数据中提取字符型工况数据;
所述构建单元222,用于对字符型数据中的文本进行统计,将相同的文本归为一类,不同的文本归为不同的类别,当遇到字符型数据时,将字符型数据与统计结果进行匹配,将字符型数据归类到文本相同的类别,最终构建出第二工况模式识别分类器。
本发明还披露了:
一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现高压变压器工况模式识别与数据分类方法的步骤。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
此外,需要说明的是,本说明书中所描述的具体实施例,其零、部件的形状、所取名称等可以不同。凡依本发明专利构思所述的构造、特征及原理所做的等效或简单变化,均包括于本发明专利的保护范围内。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离本发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (10)

1.一种高压变压器工况模式识别与数据分类方法,其特征在于,包括以下步骤:
采集高压变压器的工况数据,将所述工况数据定义为数值型工况数据和字符型工况数据;
分别构建数值型工况数据和字符型工况数据的工况模式识别分类器,记作第一工况模式识别分类器和第二工况模式识别分类器,其中,构建所述第一工况模式识别分类器时,首先,对数值型工况数据进行预处理,得到数组序列;其次,对数组序列中的所有元素进行聚类,得到聚类中心,并按照归属度区分各节点所属的类别,并作为训练第一工况模式识别分类器的样本集;再次,通过样本对第一工况模式识别分类器进行训练和测试,得到满足要求的第一工况模式识别分类器;
根据构建好的第一工况模式识别分类器和第二工况模式识别分类器对待分类的工况数据进行分类识别,得到分类结果。
2.根据权利要求1所述的高压变压器工况模式识别与数据分类方法,其特征在于,所述对数值型工况数据进行预处理,得到数组序列的具体步骤为:
根据采集到的工况数据,从工况数据中提取数值型工况数据;
采用箱形法对选取的数值型工况数据进行处理,得到数组序列。
3.根据权利要求2所述的高压变压器工况模式识别与数据分类方法,其特征在于,所述采用箱形法对数据进行处理,得到数组序列的具体步骤为:
从数值型工况数据中选取L个点作为时间窗口,将在时间窗口范围内的数值型工况数据从小到大进行排序,形成排序后的序列;
从序列中选取第
Figure FDA0002308840150000011
大的数字作为下四分位数,其中,L为时间窗口的点数,即序列的长度,从序列中选取第
Figure FDA0002308840150000021
大的数字作为上四分位数;
将序列中大于上四分位数或者小于下四分位数的点作为异常点从序列中剔除,并填入空值;
采用插值法将序列中的空值补全,组成新的序列,记作第一序列,此第一序列即为所述数组序列。
4.根据权利要求3所述的高压变压器工况模式识别与数据分类方法,其特征在于,所述对数组序列中的所有元素进行聚类,得到聚类中心,并按照归属度区分各节点所属的类别,并作为训练第一工况模式识别分类器的样本集的具体步骤为:
对第一序列中所有元素采用AP算法进行聚类,具体步骤为:
计算第一序列中各点两两之间的欧式距离,取欧氏距离的负值称为相似度,进而组成相似度矩阵;
选取相似度矩阵中除0以外最小值,将相似度矩阵中主对角线上的所有零点替换为所述最小值,组成新的相似度矩阵,记作第一相似度矩阵;
计算第一相似度矩阵的吸引度矩阵和归属度矩阵,对样本点的吸引度和归属度求和,得到两者之和,将两者之和作为聚类中心;
重复计算及求和步骤,直到聚类中心不变或者达到指定迭代次数时结束迭代,取吸引度和归属度和为正值的节点作为聚类中心,按照归属度区分各节点所属的类别,形成若干类数组;
将已经聚类为若干类的数组按照数组所属的类别进行标注,组成样本集;
将样本集中每个类别的数组分成两份,一份为训练集,另一份为测试集。
5.根据权利要求4所述的高压变压器工况模式识别与数据分类方法,其特征在于,所述通过样本对第一工况模式识别分类器进行训练和测试,得到满足要求的第一工况模式识别分类器的具体步骤为:
运用Softmax算法构建第一工况模式识别分类器,采用训练集数据对分类器进行训练,采用测试集数据对分类器进行测试,其中,Softmax算法的具体实现过程为:
构建Softmax回归模型:
Figure FDA0002308840150000031
其中,P(y(i)=j|x(i);θ)表示输入x(i)属于第j类的概率,j表示所属类别,x(i)表示需要进行分类的输入矩阵,θ表示模型参数;
定义Softmax回归模型的代价函数:
Figure FDA0002308840150000032
其中,1{y(i)=j}表示当{y(i)=j}时1{y(i)=j}=1,当y(i)≠j时1{y(i)=j}=0,
Figure FDA0002308840150000033
为衰减项,λ>0为衰减因子,m表示训练集中样本的数量;
基于训练集数据采用梯度下降法求最小值,即可得到Softmax模型参数;
采用测试集对训练好的Softmax模型进行测试,当测试结果准确率达到预期要求时,则训练好的Softmax模型即为第一工况模式识别分类器,若不满足要求,则返回聚类步骤进行重新聚类,直至Softmax模型达到要求。
6.根据权利要求1所述的高压变压器工况模式识别与数据分类方法,其特征在于,构建第二工况模式识别分类器的步骤为:
根据采集到的工况数据,从工况数据中提取字符型工况数据;
对字符型数据中的文本进行统计,将相同的文本归为一类,不同的文本归为不同的类别,当遇到字符型数据时,将字符型数据与统计结果进行匹配,将字符型数据归类到文本相同的类别,最终构建出第二工况模式识别分类器。
7.一种高压变压器工况模式识别与数据分类系统,其特征在于,包括数据采集定义模块、分类器构建模块和识别执行模块;
所述数据采集定义模块,用于采集高压变压器的工况数据,将所述工况数据定义为数值型工况数据和字符型工况数据;
所述分类器构建模块,用于分别构建数值型工况数据和字符型工况数据的工况模式识别分类器,记作第一工况模式识别分类器和第二工况模式识别分类器;
所述识别执行模块,用于根据构建好的第一工况模式识别分类器和第二工况模式识别分类器对待分类的工况数据进行分类识别,得到分类结果;
其中,所述分类器构建模块包括第一工况模式识别分类器构建模块和第二工况模式识别分类器构建模块,其中,所述第一工况模式识别分类器构建模块,用于构建所述第一工况模式识别分类器;
所述第一工况模式识别分类器构建模块包括预处理单元、生成样本单元和训练测试单元;所述预处理单元,用于对数值型工况数据进行预处理,得到数组序列;所述生成样本单元,用于对数组序列中的所有元素进行聚类,得到聚类中心,并按照归属度区分各节点所属的类别,并作为训练第一工况模式识别分类器的样本集;所述训练测试单元,用于通过样本对第一工况模式识别分类器进行训练和测试,得到满足要求的第一工况模式识别分类器。
8.根据权利要求7所述的高压变压器工况模式识别与数据分类系统,其特征在于,所述预处理单元包括数据提取单元和数组获取单元;
所述数据提取单元,用于根据采集到的工况数据,从工况数据中提取数值型工况数据;
所述数组获取单元,用于采用箱形法对选取的数值型工况数据进行处理,得到数组序列。
9.根据权利要求8所述的高压变压器工况模式识别与数据分类系统,其特征在于,所述第二工况模式识别分类器构建模块包括字符型数据提取单元和构建单元;
所述字符型数据提取单元,用于根据采集到的工况数据,从工况数据中提取字符型工况数据;
所述构建单元,用于对字符型数据中的文本进行统计,将相同的文本归为一类,不同的文本归为不同的类别,当遇到字符型数据时,将字符型数据与统计结果进行匹配,将字符型数据归类到文本相同的类别,最终构建出第二工况模式识别分类器。
10.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-6任意一项所述方法的步骤。
CN201810134503.6A 2018-02-09 2018-02-09 高压变压器工况模式识别与数据分类方法及系统 Active CN108304567B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810134503.6A CN108304567B (zh) 2018-02-09 2018-02-09 高压变压器工况模式识别与数据分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810134503.6A CN108304567B (zh) 2018-02-09 2018-02-09 高压变压器工况模式识别与数据分类方法及系统

Publications (2)

Publication Number Publication Date
CN108304567A CN108304567A (zh) 2018-07-20
CN108304567B true CN108304567B (zh) 2020-02-21

Family

ID=62864730

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810134503.6A Active CN108304567B (zh) 2018-02-09 2018-02-09 高压变压器工况模式识别与数据分类方法及系统

Country Status (1)

Country Link
CN (1) CN108304567B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110874652B (zh) * 2018-08-14 2023-10-27 阿里巴巴集团控股有限公司 一种设备状态评价方法、装置、设备及系统
WO2020232716A1 (zh) * 2019-05-23 2020-11-26 西门子股份公司 变压器的健康状态评估方法、装置及存储介质
CN111044902B (zh) * 2019-12-31 2022-04-26 朗斯顿科技(北京)有限公司 一种基于电流和电压信号的电机故障诊断方法
CN111951505B (zh) * 2020-08-25 2022-02-08 青岛大学 基于分布式光纤系统的围栏振动入侵定位和模式识别方法
CN113298170B (zh) * 2021-06-02 2022-09-09 浙江大学 非稳定工况下能耗模式识别方法及系统
CN113899971B (zh) * 2021-09-30 2023-11-14 广东电网有限责任公司广州供电局 基于密度相似稀疏聚类的变压器异常工况判别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106067066A (zh) * 2016-05-31 2016-11-02 西安工程大学 基于遗传算法优化装袋算法的电力变压器故障诊断方法
CN106443257A (zh) * 2016-09-27 2017-02-22 河海大学 一种基于振动的特高压变压器状态监测系统
CN106709662A (zh) * 2016-12-30 2017-05-24 山东鲁能软件技术有限公司 一种电力设备运行工况划分方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105373800A (zh) * 2014-08-28 2016-03-02 百度在线网络技术(北京)有限公司 分类方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106067066A (zh) * 2016-05-31 2016-11-02 西安工程大学 基于遗传算法优化装袋算法的电力变压器故障诊断方法
CN106443257A (zh) * 2016-09-27 2017-02-22 河海大学 一种基于振动的特高压变压器状态监测系统
CN106709662A (zh) * 2016-12-30 2017-05-24 山东鲁能软件技术有限公司 一种电力设备运行工况划分方法

Also Published As

Publication number Publication date
CN108304567A (zh) 2018-07-20

Similar Documents

Publication Publication Date Title
CN108304567B (zh) 高压变压器工况模式识别与数据分类方法及系统
WO2021184630A1 (zh) 基于知识图谱定位排污对象的方法及相关设备
CN111507376B (zh) 一种基于多种无监督方法融合的单指标异常检测方法
CN111882446B (zh) 一种基于图卷积网络的异常账户检测方法
CN103076547B (zh) 基于支持向量机的gis局部放电故障类型模式识别方法
CN112949715A (zh) 一种基于svm的轨道交通故障诊断方法
CN101738998B (zh) 一种基于局部判别分析的工业过程监测系统及方法
CN112836809A (zh) 一种基于差分特征融合的卷积神经网络的设备特性提取方法以及故障预测的方法
CN114201374A (zh) 基于混合机器学习的运维时序数据异常检测方法及系统
CN111126820A (zh) 反窃电方法及系统
CN110794360A (zh) 一种基于机器学习预测智能电能表故障的方法及系统
CN113869721A (zh) 一种变电设备健康状态分类方法及装置
CN112419268A (zh) 一种输电线路图像缺陷检测方法、装置、设备及介质
CN110580492A (zh) 一种基于小幅波动检测的轨道电路故障前兆发现方法
CN112308148A (zh) 缺陷类别识别、孪生神经网络训练方法、装置及存储介质
CN106846170B (zh) 一种发电机组跳闸监测方法及其监测装置
CN115526258A (zh) 基于Spearman相关系数特征提取的电力系统暂稳评估方法
CN114091549A (zh) 一种基于深度残差网络的设备故障诊断方法
CN113435759A (zh) 一种基于深度学习的一次设备风险智能评估方法
CN113704389A (zh) 一种数据评估方法、装置、计算机设备及存储介质
CN111737993A (zh) 一种配电网设备的故障缺陷文本提取设备健康状态方法
CN116400168A (zh) 一种基于深度特征聚类的电网故障诊断方法及系统
CN113722239B (zh) 机载嵌入式软件质量检测方法、装置、介质及电子设备
CN116224950A (zh) 面向无人生产线自组织重构的智能故障诊断方法和系统
CN115392710A (zh) 一种基于数据过滤的风电机组运行决策方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant