CN112699921A - 一种基于堆栈降噪自编码的电网暂态故障数据聚类清洗方法 - Google Patents
一种基于堆栈降噪自编码的电网暂态故障数据聚类清洗方法 Download PDFInfo
- Publication number
- CN112699921A CN112699921A CN202011486689.5A CN202011486689A CN112699921A CN 112699921 A CN112699921 A CN 112699921A CN 202011486689 A CN202011486689 A CN 202011486689A CN 112699921 A CN112699921 A CN 112699921A
- Authority
- CN
- China
- Prior art keywords
- data
- fault
- coding
- self
- stack
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
Abstract
本发明涉及一种基于堆栈降噪自编码的电网暂态故障数据聚类清洗方法,属于电力技术领域。该方法包括以下步骤:S1:基于堆栈降噪自编码的故障数据特征提取阶段;S2:基于主成分分析的故障特征降维阶段;S3:基于密度峰快速搜寻聚类的故障数清洗阶段。本发明对故障数据进行聚类清洗和代表数据点提取推送,能有效的从海量的故障数据中提取出真实准确的故障信息,为智能告警提供优质的故障信息,同时解决了配电告警平台频繁刷屏的根本原因。
Description
技术领域
本发明属于电力技术领域,涉及一种基于堆栈降噪自编码的电网暂态故障数据聚类清洗方法。
背景技术
网的高速发展积攒了海量的运行数据,其中录波型故障指示器上传的故障数据中存在着大量的重复、干扰、错误及无效波形。干扰、错误等故障数据混入正常故障数据中,加大了数据的复杂度和冗余度,也是造成配电自动化后台告警窗口数据刷新频繁数据量大的主要原因。如此复杂和繁多的故障数据,运维人员短时间内无法准确定位实际的故障发生与故障类型,数据利用效率低下致使运维人员工作效率低下,如此便可能导致真实故障的恶化与扩散,严重情况下会导致电气设备损坏,大面积长时间停电,造成巨大的经济损失。因此对海量故障数据的处理和应用无疑是个亟需解决的技术问题。
针对集中于状态数据中的噪声点、缺失数据、异常数据进行清洗处理,最终获取运行设备的关键状态故障数据。其清洗过程中对数据个体的完整性造成了一定的破环,因此很难保证清洗效果。针对利用国网技术规范对电网中故指元件的波形要求,结合现场获取的波形文件对其规范性进行逻辑筛选,选取符合要求规范的故障数据。忽略了对具体数据的分析,仅从逻辑规范筛选无法去除故障数据中的重复故障数据。针对故障告警信息总体文本进行数据挖掘,匹配关键词以达到对故障数据的清洗筛选。仅分析了故障告警信息的文本内容,针对诊断元件对波形的错误诊断,此方法无法正确清洗出错误、抖动故障数据。
为此,本发明提出了一种基于堆栈式降噪自编码特征提取的故障数据聚类清洗方法,该方法首先利用堆栈降噪自编码对故障数据进行特征学习与降维,继而用主成分分析对降维后数据再次进行特征再次降维与提取,实现对不同故障数据的特征获取;最后利用密度峰快速搜寻聚类方法对故障特征进行聚类,实现对重复、干扰、错误等故障数据的聚类清洗和真实故障数据推送。创新性的提出了海量故障数据聚类清洗方法,达到了对不同类型故障数据进行清洗去冗的效果,为故障告警智能推送提供了技术支撑,提高了运维人员获取准确故障信息的效率。
发明内容
有鉴于此,本发明的目的在于提供一种基于堆栈降噪自编码的电网暂态故障数据聚类清洗方法,实现对电网中暂态故障数据的高效清洗,建立清洁暂态故障数据库。
为达到上述目的,本发明提供如下技术方案:
一种基于堆栈降噪自编码的电网暂态故障数据聚类清洗方法,该方法包括以下步骤:
S1:基于堆栈降噪自编码的故障数据特征提取阶段;
S2:基于主成分分析的故障特征降维阶段;
S3:基于密度峰快速搜寻聚类的故障数清洗阶段。
可选的,所述S1具体为:
堆栈降噪自编码网络结构为:输入层输入数据为纯净向量数据加噪后的含噪数据,中间隐藏层包含多个网络层构成栈式堆叠效果,以获取更抽象准确的数据特征;经过编码隐藏层的特征学习后进入解码隐藏层,对含噪数据进行纯净向量数据复现学习,最终由输出层输出原纯净数据;
对于输入数据x,通过加噪器:
xn~nD(xn) (1)
对原始数据进行加噪化,从而实现数据加噪;输入加噪数据,经过堆栈式自编码器进行xn 数据更有价值的特征提取,最终输出为复现数据:
yr=Fr(Fn(…F1(xn))) (2)
在整个自编码特征学习过程中可在中间隐藏层进行特征值输出,提取数据的价值特征。
可选的,所述S2具体为:
主成分分析PCA定义为:在d维向量空间{tn},n∈{1,2,…,n}中搜寻q个正交主向量 wk,k∈{1,2,3…,q},获得{tn}在wk子空间上的最大方差值,在高维数据中提取低维的线性无关主成分特征,在方差最大的方向选取投影保留更多的原始数据特征信息。
可选的,所述S3具体为:
密度峰快速搜寻聚类CFSFDP基于假设条件:对于数据集,聚类中心被一些较低局部密度的数据点所包围且较低的局部密度点与其他较高的局部密度点有较大的距离;
dc设定为人为设定截断距离;
xi与比其局部密度更高的数据组的距离为:
在聚类过程中选定对应局部密度ρi较大,δi较大的数据组为各类簇中心,其余的数据组根据自身的ρi,xi归类于各个类簇中心所表示的类簇,再或者由于dc的设置原因,造成其余数组在各类簇中存在交叠点,存在的交叠点则不为类簇的核元素。
可选的,所述CFSFDP中,通过计算正确清洗率和错误清洗率来衡量模型聚类效果:
本发明的有益效果在于:能够充分有效的辨识故障数据特征,对故障数据进行特征学习和故障特征自提取以实现对故障数据进行聚类清洗和建立清洁的暂态故障数据库,模型具有较强的鲁棒性。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:
图1为堆栈降噪自编码网络结构;
图2为主成分分析;
图3为电网暂态故障数据清洗方法结构图;
图4为二维隐含层特征提取;
图5为二维PCA特征提取;
图6为数据点ρi,δi分布图;
图7为dc=0.0004时聚类结果示图;
图8为dc=0.0002时聚类结果示图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本发明的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本发明的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
本发明包括以下三部分:
基于堆栈降噪自编码的故障数据特征提取阶段;
基于主成分分析的故障特征降维阶段;
基于密度峰快速搜寻聚类的故障数清洗阶段;
1、故障数据堆栈自编码特征提取
自编码的模型建立启发于哺乳动物视觉系统简单细胞感受野。其每一维被看作是一种特征,和基于稠密向量的分布式表示相比自编码具有更小的计算量和更好的可解释性等优点。自编码已被证实完全可以应用于电气量故障波形数据的特征获取。由自编码应用发展而来的降噪自编码可以在训练的样本数据中随机加入噪声,在学习训练过程中获得消除数据中噪声的能力,以获得鲁棒性更强的特征表达形式和增强模型本身的泛化能力。
堆栈降噪自编码网络结构如图1。输入层输入数据为纯净向量数据加噪后的含噪数据,中间隐藏层包含多个网络层以此构成栈式堆叠效果,以获取更抽象准确的数据特征。经过编码隐藏层的特征学习后进入解码隐藏层,对含噪数据进行纯净向量数据复现学习,最终由输出层输出原纯净数据。
对于输入数据x,通过加噪器:
xn~nD(xn) (1)
对原始数据进行加噪化,从而实现数据加噪。输入加噪数据,经过堆栈式自编码器进行xn数据更有价值的特征提取,最终输出为复现数据:
yr=Fr(Fn(…F1(xn))) (2)
在整个自编码特征学习过程中可在中间隐藏层进行特征值输出,提取数据的价值特征。
2、故障特征主成分分析降维
主成分分析(principal component analysis,PCA)是常用于数据预处理和图像处理的一种数据降维方法,能有效的从高维数据中提取到低维的数据特征并去除数据中噪声和减少特征之间的相关性。其定义为:在d维向量空间{tn},n∈{1,2,…,n}中搜寻q个正交主向量 wk,k∈{1,2,3…,q},获得{tn}在wk子空间上的最大方差值,其主要目标是在高维数据中提取低维的线性无关主成分特征,图2为二维数据投影到一维空间中,在方差最大的方向选取其投影才能保留更多的原始数据特征信息。
3、故障特征聚类清洗
密度峰快速搜寻聚类(clustering by fast search and find of densitypeaks,CFSFDP)是一种基于数据分布密度为依据进行分类的算法,处理故障数据能够自动的获取聚类簇数和聚类非球面形状数据簇,算法速度更快实现更为简单。CFSFDP聚类算法基于假设条件:对于数据集,聚类中心被一些较低局部密度的数据点所包围且较低的局部密度点与其他较高的局部密度点有较大的距离。
dc设定为人为设定截断距离。
xi与比其局部密度更高的数据组的距离为:
在聚类过程中选定对应局部密度ρi较大,δi较大的数据组为各类簇中心,其余的数据组根据自身的ρi,xi归类于各个类簇中心所表示的类簇,再或者由于dc的设置原因,造成其余数组在各类簇中存在交叠点,存在的交叠点则不为类簇的核元素。
暂态录波故障数据清洗方法逻辑结构图如图3。整个系统主要由3部分组成:第一部分,故障特征提取,针对海量故障录波数据用堆栈降噪自编码神经网络进行特征提取,之后再使用PCA对堆栈降噪特征进行降维提取,从而实现录波故障数据的特征二维表达。需要注意的是导入网络的故障数据应包括干扰、抖动、错误、高频次扰动等故障数据波形,用来训练神经网络的参数以达到对故障数据特征有效的获取。
第二部分,故障数据预处理,对于第一部分提取的二维特征进行CFSFDP聚类分析,找出数据点ρi非常小且远离其他主类簇的离散数据,由于这些离散数据点有很大可能是单频次异常干扰、抖动或者是错误故障数据,在混入真实故障数据后影响清洗效果,故需要对此类数据在进行完全聚类清洗之前进行异常数据预处理。
第三部分,故障数据清洗,在第二部的基础上再次使用CFSFDP对预处理数据进行聚类分析,对于各个类簇实施类簇中心数据识别,确定各类属性。如果聚类中心所表达的故障类型是高频次扰动、错误等无效故障数据,则立即进行隔离清洗。对其余正确故障波形数据进行类簇中心代表数据提取作为推送数据,以达到对重复数据的剔除。继而完成整个清洗过程,提高了海量数据中故障数据及故障属性的识别率,提高了获取主要、准确告警信息的效率。
实施例:
(1)故障波形特征提取
故障波形数据由故障时刻三相电压拼接组成,由于故障指示器记录故障时刻前4后8个周期波形,且往往在故障点左右3个周期便可有效反映故障特征,故取每一相电压波形故障点时刻前1.5周期和故障点后1.5个周期,共256个数据,即每组数据为3*256维矩阵。经过堆栈降噪自编码降维压缩后映射为二维数据,以用于实现后文聚类清洗。如图4为网络设置为一个3层堆栈降噪自编码器进行特征降维后的数据可视化,其中输入层神经元为768维,隐含层特征输出层设置为二维,输出为768维。喂入数据进行训练,调节参数,提取隐含层数据为故障二维特征表达。
图5为在堆栈降噪自编码神经网络降维的基础上加上PCA特征降维,即设置输入层为 768维,隐含特征输出层50维,PCA获取50维数据后再降至二维主成分数据。比较图4图 5有明显发现,堆栈降噪自编码直接降至二维后错误、无效波形数据与真实故障数据分离不明显,离散程度较低,而加入PCA降维后的二维特征数据中错误、无效波形数据与真实故障数据分离较为明显,离散度较高。
造成图4与图5的差别在于把故障数据由768维直接降至二维会导致波形的特征信息损失较大,特征差别提取不明显故可视化效果较差。而图4首先把768维数据降至50维保留了更多的关键信息,而后用PCA在50维数据进行降维提取主成分能更好的保留数据特征,实现关键信息可视化。由此可见加入PCA的网络对特征提取的效果更佳。
(2)故障特征聚类清洗
针对堆栈降噪自编码和PCA对特征的降维提取后,利用CFSFDP进行对特征值进行数据预清洗,由于CFSFDP中截断距离的设置对聚类效果有很大影响,调整适当参数,当截断距离dc设置为0.0004时,计算各特征对应的ρi和δi,对ρi和δi和进行可视化如图6,当ρi小于0.2 时有部分特征数据有较高的δi,即此类特征点为离散数据点,为错误、扰动的可能较极大,故应基于剔除隔离,实现对故障数据的初步预清洗。
对预清洗后的数据进行CFSFDP再次聚类效果如图7,如表1所示为与图7对应的核元素聚类描述,其中可见类簇1和类簇3存在交叠点,这是由于相关参数dc的设置对聚类效果的影响,获取各类簇中心代表点可知类簇2中心为错误无效特征,故由于类簇相似性可知类簇2为错误无效故障波形。应给予类簇2隔离实现聚类清洗的效果。
当设置截断距离dc为0.0002时,减小截断距离后重新聚类,类簇1和类簇3的交叠点消失,得到新的各类簇如图8,可见表2为图8聚类结果表述。同样类簇2为错误无效波形数据需要进行隔离清洗。
表1 CFSFDP聚类结果(dc=0.0004)
表2 CFSFDP聚类结果(dc=0.0002)
其中可以通过计算正确清洗率和错误清洗率来衡量模型聚类效果,通过计算当截断距离 dc设置为0.0004和0.0002时聚类效果如表3。
表3 CFSFDP聚类清洗结果统计表
其中:
即通过调节截断距离,可以更好的获取聚类模型,当截断距离dc为0.0002时,模型正确清洗高达92.50%但其错误清洗率也较高,损失了一部分正确波形。当截断距离dc设置为 0.0004时,可知模型正确波形损失较少即错误清洗率较低为0.93%,但错误识别率降低了5%。
(3)结论
提出一种新型电网暂态故障数据聚类清洗方法,实现对电网中暂态故障数据的高效清洗,建立清洁暂态故障数据库,对未来的电网云平台智能告警、智能决策尤为重要。本发明通过从电网总体故障数据中利用堆栈降噪自编码和PCA降维进行特征学习,然后利用CFSFDP对二维特征进行聚类,实现对故障数据的高效聚类清洗。在文中正确清洗率87.18%,错误清洗率低于1%的情况下,对故障数据进行聚类清洗和代表数据点提取推送,能有效的从海量的故障数据中提取出真实准确的故障信息,为智能告警提供优质的故障信息,同时解决了配电告警平台频繁刷屏的根本原因。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (5)
1.一种基于堆栈降噪自编码的电网暂态故障数据聚类清洗方法,其特征在于:该方法包括以下步骤:
S1:基于堆栈降噪自编码的故障数据特征提取阶段;
S2:基于主成分分析的故障特征降维阶段;
S3:基于密度峰快速搜寻聚类的故障数清洗阶段。
2.根据权利要求1所述的一种基于堆栈降噪自编码的电网暂态故障数据聚类清洗方法,其特征在于:所述S1具体为:
堆栈降噪自编码网络结构为:输入层输入数据为纯净向量数据加噪后的含噪数据,中间隐藏层包含多个网络层构成栈式堆叠效果,以获取更抽象准确的数据特征;经过编码隐藏层的特征学习后进入解码隐藏层,对含噪数据进行纯净向量数据复现学习,最终由输出层输出原纯净数据;
对于输入数据x,通过加噪器:
xn~nD(xn) (1)
对原始数据进行加噪化,从而实现数据加噪;输入加噪数据,经过堆栈式自编码器进行xn数据更有价值的特征提取,最终输出为复现数据:
yr=Fr(Fn(…F1(xn))) (2)
在整个自编码特征学习过程中可在中间隐藏层进行特征值输出,提取数据的价值特征。
3.根据权利要求2所述的一种基于堆栈降噪自编码的电网暂态故障数据聚类清洗方法,其特征在于:所述S2具体为:
主成分分析PCA定义为:在d维向量空间{tn},n∈{1,2,…,n}中搜寻q个正交主向量wk,k∈{1,2,3…,q},获得{tn}在wk子空间上的最大方差值,在高维数据中提取低维的线性无关主成分特征,在方差最大的方向选取投影保留更多的原始数据特征信息。
4.根据权利要求3所述的一种基于堆栈降噪自编码的电网暂态故障数据聚类清洗方法,其特征在于:所述S3具体为:
密度峰快速搜寻聚类CFSFDP基于假设条件:对于数据集,聚类中心被一些较低局部密度的数据点所包围且较低的局部密度点与其他较高的局部密度点有较大的距离;
dc设定为人为设定截断距离;
xi与比其局部密度更高的数据组的距离为:
在聚类过程中选定对应局部密度ρi较大,δi较大的数据组为各类簇中心,其余的数据组根据自身的ρi,xi归类于各个类簇中心所表示的类簇,再或者由于dc的设置原因,造成其余数组在各类簇中存在交叠点,存在的交叠点则不为类簇的核元素。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011486689.5A CN112699921B (zh) | 2020-12-16 | 2020-12-16 | 一种基于堆栈降噪自编码的电网暂态故障数据聚类清洗方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011486689.5A CN112699921B (zh) | 2020-12-16 | 2020-12-16 | 一种基于堆栈降噪自编码的电网暂态故障数据聚类清洗方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112699921A true CN112699921A (zh) | 2021-04-23 |
CN112699921B CN112699921B (zh) | 2022-07-15 |
Family
ID=75508475
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011486689.5A Active CN112699921B (zh) | 2020-12-16 | 2020-12-16 | 一种基于堆栈降噪自编码的电网暂态故障数据聚类清洗方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112699921B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113377761A (zh) * | 2021-07-16 | 2021-09-10 | 贵州电网有限责任公司电力科学研究院 | 过电压数据清洗方法、装置、计算机设备和存储介质 |
CN116484179A (zh) * | 2023-06-20 | 2023-07-25 | 厦门精图信息技术有限公司 | 一种可交互的数据清洗系统及方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080266715A1 (en) * | 2007-04-30 | 2008-10-30 | Bhatia Charanjit S | Slider overcoat for noise reduction of TMR magnetic transducer |
CN105550700A (zh) * | 2015-12-08 | 2016-05-04 | 国网山东省电力公司电力科学研究院 | 一种基于关联分析和主成分分析的时间序列数据清洗方法 |
CN109344146A (zh) * | 2018-09-13 | 2019-02-15 | 海南电网有限责任公司电力科学研究院 | 一种大规模过电压数据智能自清洗方法 |
CN109542884A (zh) * | 2018-11-01 | 2019-03-29 | 清能艾科(深圳)能源技术有限公司 | 采用大数据耦合参数以优化破岩效率的方法和系统 |
CN109947756A (zh) * | 2019-03-18 | 2019-06-28 | 成都好享你网络科技有限公司 | 用于增广数据的数据清洗方法、装置和设备 |
CN109978079A (zh) * | 2019-04-10 | 2019-07-05 | 东北电力大学 | 一种改进的堆栈降噪自编码器的数据清洗方法 |
CN110866604A (zh) * | 2019-10-28 | 2020-03-06 | 国网河北省电力有限公司电力科学研究院 | 一种电力变压器状态监测数据的清洗方法 |
CN111046900A (zh) * | 2019-10-25 | 2020-04-21 | 重庆邮电大学 | 基于局部流形正则化的半监督生成对抗网络图像分类方法 |
CN111614489A (zh) * | 2020-04-27 | 2020-09-01 | 国网山东省电力公司电力科学研究院 | 基于稀疏自编码的暂态录波故障数据清洗方法和系统 |
CN111638428A (zh) * | 2020-06-08 | 2020-09-08 | 国网山东省电力公司电力科学研究院 | 一种基于gis特高频局部放电数据的处理方法及系统 |
-
2020
- 2020-12-16 CN CN202011486689.5A patent/CN112699921B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080266715A1 (en) * | 2007-04-30 | 2008-10-30 | Bhatia Charanjit S | Slider overcoat for noise reduction of TMR magnetic transducer |
CN105550700A (zh) * | 2015-12-08 | 2016-05-04 | 国网山东省电力公司电力科学研究院 | 一种基于关联分析和主成分分析的时间序列数据清洗方法 |
CN109344146A (zh) * | 2018-09-13 | 2019-02-15 | 海南电网有限责任公司电力科学研究院 | 一种大规模过电压数据智能自清洗方法 |
CN109542884A (zh) * | 2018-11-01 | 2019-03-29 | 清能艾科(深圳)能源技术有限公司 | 采用大数据耦合参数以优化破岩效率的方法和系统 |
CN109947756A (zh) * | 2019-03-18 | 2019-06-28 | 成都好享你网络科技有限公司 | 用于增广数据的数据清洗方法、装置和设备 |
CN109978079A (zh) * | 2019-04-10 | 2019-07-05 | 东北电力大学 | 一种改进的堆栈降噪自编码器的数据清洗方法 |
CN111046900A (zh) * | 2019-10-25 | 2020-04-21 | 重庆邮电大学 | 基于局部流形正则化的半监督生成对抗网络图像分类方法 |
CN110866604A (zh) * | 2019-10-28 | 2020-03-06 | 国网河北省电力有限公司电力科学研究院 | 一种电力变压器状态监测数据的清洗方法 |
CN111614489A (zh) * | 2020-04-27 | 2020-09-01 | 国网山东省电力公司电力科学研究院 | 基于稀疏自编码的暂态录波故障数据清洗方法和系统 |
CN111638428A (zh) * | 2020-06-08 | 2020-09-08 | 国网山东省电力公司电力科学研究院 | 一种基于gis特高频局部放电数据的处理方法及系统 |
Non-Patent Citations (5)
Title |
---|
DAIXIAO PENG等: "《An Improved Centered Cycle Method for Identifying the Preisach Distribution Function》", 《IEEE TRANSACTIONS ON MAGNETICS》 * |
JIEJIE DAI等: "《Cleaning Method for Status Monitoring Data of Power Equipment Based on Stacked Denoising Autoencoders》", 《IEEE ACCESS》 * |
和敬涵等: "《新一代人工智能在电力系统故障分析及定位中的研究综述》", 《中国电机工程学报》 * |
张西宁等: "《基于多维缩放和随机森林的轴承故障诊断方法》", 《西安交通大学学报》 * |
赵国锋等: "《一种面向云中心网络入侵检测的多模式匹配算法》", 《信息网络安全》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113377761A (zh) * | 2021-07-16 | 2021-09-10 | 贵州电网有限责任公司电力科学研究院 | 过电压数据清洗方法、装置、计算机设备和存储介质 |
CN116484179A (zh) * | 2023-06-20 | 2023-07-25 | 厦门精图信息技术有限公司 | 一种可交互的数据清洗系统及方法 |
CN116484179B (zh) * | 2023-06-20 | 2023-09-08 | 厦门精图信息技术有限公司 | 一种可交互的数据清洗系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112699921B (zh) | 2022-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107070943B (zh) | 基于流量特征图和感知哈希的工业互联网入侵检测方法 | |
Picard et al. | Improving image similarity with vectors of locally aggregated tensors | |
CN113962259B (zh) | 一种燃料电池系统多模式双层故障诊断方法 | |
Nguyen et al. | Leaf based plant identification system for android using surf features in combination with bag of words model and supervised learning | |
CN112699921B (zh) | 一种基于堆栈降噪自编码的电网暂态故障数据聚类清洗方法 | |
CN111339297A (zh) | 网络资产异常检测方法、系统、介质和设备 | |
CN112101420A (zh) | 一种相异模型下Stacking集成算法的异常用电用户识别方法 | |
Zhang et al. | Face detection algorithm based on improved AdaBoost and new haar features | |
CN113125903A (zh) | 线损异常检测方法、装置、设备及计算机可读存储介质 | |
Yuan et al. | A review of recent advances in ear recognition | |
CN105678349B (zh) | 一种视觉词汇的上下文描述子生成方法 | |
Chouchane et al. | Face Kinship verification based VGG16 and new Gabor wavelet features | |
CN111898694B (zh) | 一种基于随机树分类的非入侵式负荷识别方法及装置 | |
CN104008095A (zh) | 一种基于语义特征提取与匹配的物体识别方法 | |
CN116738204A (zh) | 基于生成对抗Transformer的电力负荷数据异常检测方法 | |
Bouksim et al. | New approach for 3D Mesh Retrieval using data envelopment analysis | |
Pareti et al. | On defining signatures for the retrieval and the classification of graphical drop caps | |
Zhang et al. | Center-Aware Instance Segmentation for Close Objects in Industrial 3-D Point Cloud Scenes | |
CN108959650A (zh) | 基于共生surf特征的图像检索方法 | |
CN113052082B (zh) | 一种基于图像识别的电压暂降事件关联方法 | |
Kitamoto | Typhoon analysis and data mining with kernel methods | |
Icke et al. | Feature extraction through discrete wavelet transform coefficients | |
CN116489002A (zh) | 一种基于机器学习算法的故障定界方法 | |
Avcibas | Morphed Face Detection with Wavelet-Based Co-Occurrence Matrices | |
Tsai et al. | An efficient feature selection approach for clustering: using a Gaussian mixture model of data dissimilarity |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |