CN114168578A - 一种基于聚类和近邻算法的日负荷数据缺失值插补方法 - Google Patents

一种基于聚类和近邻算法的日负荷数据缺失值插补方法 Download PDF

Info

Publication number
CN114168578A
CN114168578A CN202111497646.1A CN202111497646A CN114168578A CN 114168578 A CN114168578 A CN 114168578A CN 202111497646 A CN202111497646 A CN 202111497646A CN 114168578 A CN114168578 A CN 114168578A
Authority
CN
China
Prior art keywords
data
missing
interpolated
clustering
load data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111497646.1A
Other languages
English (en)
Inventor
马云龙
王黎明
裴子霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Jiangsu Electric Power Co Ltd
Original Assignee
State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Jiangsu Electric Power Co Ltd filed Critical State Grid Jiangsu Electric Power Co Ltd
Priority to CN202111497646.1A priority Critical patent/CN114168578A/zh
Publication of CN114168578A publication Critical patent/CN114168578A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/231Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24143Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Complex Calculations (AREA)

Abstract

本发明公开了一种用能异常检测中基于聚类和近邻算法(KNN)的针对单个用户历史电力负荷数据缺失值插补的方法。该方法考虑到了单个用户在相同用电模式下日负荷数据具有相似性的特点,对无缺失值的日负荷数据进行聚类分析,根据聚类结果将日负荷数据分为不同用电模式并打上类别标签,使用这些打上类别标签的数据通过KNN算法对有缺失值的日负荷数据进行插补,插补效果好,对提取负荷特征以及用能异常检测具有重大意义。

Description

一种基于聚类和近邻算法的日负荷数据缺失值插补方法
技术领域
本发明属于用能异常检测技术领域,具体涉及一种用能异常检测中基于聚类和近邻算法的电力日负荷数据缺失值插补方法。
背景技术
在电力系统的电能营销管理中,每年因用能异常导致国网公司遭受大量的经济损失,有效的根据历史负荷数据检测出异常用户,对不法分子进行查处,对于供电企业减少损失、降低供电成本、提高供电质量具有重大意义。
基于用户历史负荷数据进行用能异常检测,通常是对用户的历史负荷数据进行特征提取,根据特征利用一系列的数学方法或学习模型进行分类,进而确定特征与异常之间的关系。故优质的负荷数据是提取更加具有区分度的特征,提高模型准确率的前提。但是由于用能异常检测模型所用的数据来源于采集的真实数据,不可避免的存在数据缺失、数据错误等情况,这些情况将直接影响算法模型的最终结果的准确率以及模型的训练时间。这些情况出现时,就需要人为的干预,通过数学统计方式分析并剔除异常值,然后通过合理有效的方法对剔除的异常值和缺失值进行补充。如何根据实际情况确定合理有效的方法,将具有异常值和缺失值的负荷数据处理为能够直接进行特征提取和后续建模的数据,已经成为异常用能检测模型研究的一个重要组成部分。
发明内容
针对如何将具有缺失值的负荷数据处理为能够直接进行特征提取和后续建模的数据这一问题,考虑单一用户的相同用电模式下的负荷具有相似性,经过聚类分析会被归结为同一聚类簇的情况,本发明提出了一种用能异常检测中基于聚类和近邻算法的日负荷数据缺失值插补方法。该方法是在使用电力用户历史负荷数据对异常用能检测进行建模前,针对负荷数据缺失值进行补充的方法,应用了层次聚类和近邻算法进行插补,包含了对无缺失日负荷数据的聚类分析打上类别标签和给缺失数据打位置标记以及基于KNN算法的缺失值插补三个部分。
将单个用电用户的历史负荷数据按天拆分成日负荷数据,提取出其中的无缺失值数据。无缺失值的数据没有类别标签,不能直接用于KNN算法训练建模,因此,将无缺失值数据进行标准化后,使用层次聚类法聚类分析,画出谱系聚类图,结合无缺失值数据的数量和每一聚类簇内的数据数量,选择合适的聚类数目,根据聚类结果对无缺失值的日负荷数据添加类别的标签。经过类别标记的无缺失数据将作为训练集输入到KNN模型中对KNN模型进行训练,训练完成的KNN模型用来对有缺失值的数据进行缺失值插补。
为了方便识别,提取出有缺失值的用户日负荷数据后,在缺失位置使用缺失标记nan对有缺失值的数据进行填充,填充后的数据构成待插补数据集,使用KNN插补模型一条一条的取出进行插补。
KNN(k-nearst neighbors,K近邻算法)是一种有监督的机器学习方法。它使用有类别标记的训练数据进行训练建模,在输入测试数据时,将会计算测试数据与训练数据的相似性,找到与测试数据最为相似的K个训练数据(“邻居”),然后将测试数据的类别归为K个“邻居”中出现次数最多的那个类。使用KNN算法进行数据的插补,目的不是分类,而是使用其搜索“邻居”的思想。在进行插补时,依次取出待插补数据集中的一条待插补数据作为KNN模型的测试数据,KNN模型根据设定的相似性度量方法选择出测试数据的K个“邻居”,则测试数据类别被标记为K个“邻居”中出现次数最多的那个类(出现次数记作m,m≤k),使用K个“邻居”中属于该类的m个邻居与测试数据缺失值发生处相同位置的数据的均值来插补测试数据的缺失值。
在本发明中,KNN模型的训练数据为经过层次聚类分析并打上类别标签的无缺失日负荷数据。模型的训练构建,是为了通过KNN算法针对每次从待插补数据集中提取出的一个待插值样本的缺失值位置,找到该待插值样本的K个“邻居”,将测试数据打上K个“邻居”中出现次数最多的那个类的标记,计算出K个“邻居”中属于该类的m个“邻居”与待插值样本缺失值发生处位置相同的数据的均值。同时将打上类别标签的插补后数据加入训练集,扩充了训练集中同样类别用电模式的样本数目,对于后续的其他数据的插补效果具有提升作用。K值的选择根据无缺失日负荷数据的聚类结果,也就是KNN算法的训练集进行灵活调整。本发明中,KNN算法的相似性度量方法采用欧式距离。
在经过依次从待插补数据集中一条条取出数据作为待插值样本进行插补后,完成对单个用户的有缺失历史日负荷数据的插补过程。
基于用户历史负荷数据进行数据挖掘,构建用能异常检测模型的过程中,优质的负荷数据有利于提高所提取特征的区分度,使得学习模型的训练效果更佳。有缺失的数据无法直接计算特征,但其具有的可供挖掘信息,不容忽视。为了使这部分用户负荷数据在用于特征提取和模型训练时更好的表现出用户的用电行为特征,本发明公开了一种用能异常检测中基于聚类和近邻算法(KNN)的针对单个用户历史电力负荷数据缺失值插补的方法。该方法考虑到了单一用户在相同用电模式下日负荷数据具有相似性的特点,对无缺失值的日负荷数据进行聚类分析,根据聚类结果将日负荷数据分为不同用电模式并打上类别标签,使用这些打上类别标签的数据通过KNN算法对有缺失值的日负荷数据进行插补,插补效果好,对提取负荷特征以及用能异常检测具有重大意义。
附图说明
图1是使用本发明进行历史日负荷数据插补的处理流程示意图。
具体实施方式
为了使本发明的内容、目的更加清楚,下面结合附图对本发明的实施方式作具体说明。
本发明提出了一种用能异常检测中基于聚类和近邻算法的电力日负荷数据缺失值插补方法,如图1所示,针对单一用户的日负荷数据的缺失值应用聚类和近邻算法的插补,具体分为以下步骤:
步骤一:提取单个电力用户日负荷数据中无缺失值的数据,对提取的无缺失值的数据进行聚类分析。对于该电力用户,聚类结果每一簇内的数据都是具有相似特征的同一种用电模式。根据聚类结果将无缺失值的数据打上类别标签,作为训练集对K近邻算法KNN模型进行训练;
步骤二:步骤一提取无缺失值的数据后,该电力用户日负荷数据中的剩余数据为有缺失值的数据,对缺失值进行处理,在有缺失值的数据的缺失位置打上缺失标记nan,得到待插补数据集;
步骤三:每次从步骤二中得到的待插补数据集中取出一条待插补数据,输入到训练完成的KNN模型中进行缺失值插补,使用KNN算法得到缺失处的插值数据,替换掉缺失标记nan,并将插补后的数据打上类别标签加入训练集,用以扩充单一电力用户相同用电模式下数据项数目。
步骤四:反复执行步骤三,直到完成对待插补数据集中所有待插补数据的插补。
进一步的,步骤一中聚类分析的目的是为了给KNN算法的插值提供有标签的数据。根据聚类数目给无缺失值的数据打上类别标签,作为KNN算法的训练集,用以供给后续KNN缺失值插补使用。提取出的无缺失值的数据,经过标准化,可以直接进行聚类分析。对于这些数据,采用无监督学习的层次聚类法进行分析,画出谱系聚类图,结合无缺失值日负荷数据的数量从谱系聚类图中分析确定聚类的数目。关于层次聚类分析的具体如下:
(1)层次聚类的相似性度量方法选择:本发明中层次聚类采用欧氏距离作为相似性度量,即对于具有p个采样点的n个提取出的无缺失值日负荷数据组成的样本矩阵:
Figure BDA0003401420380000041
其中任意两条数据xi=[xi1,xi2,…,xip]与xj=[xj1,xj2,…,xjp]之间的欧氏距离为:
Figure BDA0003401420380000042
(2)确定聚类数目:层次聚类结束,根据聚类结果画出谱系聚类图,直观的根据图中的结果选择聚类数目。同时,确定聚类的数目时,需要参考无缺失数据样本的数量。在样本数量多时,可以选择更大的类别数目,这有助于后续KNN的插补更加的准确。在数量少时,为了防止KNN过拟合,应选择更小的聚类数目。
从各类只有一个样本点开始,通过计算样本之间的相似度逐级合并,每级只合并两类,直到最后所有样本都归到一类。聚类过程中逐级考查类间相似度,依次决定类别。在聚类过程中把N个没有标签的样本分成一些合理的类,极端情况下,最多可以分成N类,即每个样本为一类,最少可以分成一类,即所有样本为一类。那么最终可以得到从N类到1类逐级地类别划分,一系列类别数从多到少的划分方案。根据一定的指标选择中间某个适当地划分方案作为聚类结果。
进一步的,步骤二中对缺失值进行标记,缺失值包括从原始采集记录中提取的用户日负荷数据的缺失值和经过数据过滤后剔除异常值导致的缺失值。
进一步的,步骤三中KNN算法是通过计算不同数据样本之间的相似性来进行分类的算法,在进行数据样本类别决策时,KNN算法只参考周围的K个“邻居”样本数据的所属类别。在本发明中,主要将KNN算法用于样本点选择,模型根据设定的相似性度量方法选择出待插补数据的K个“邻居”,则待插补数据的类别被标记为K个数据中出现次数最多的那个类(出现次数记作m,m≤k),使用K个“邻居”中属于该类的m个“邻居”与待插补数据缺失值发生处位置相同的数据的均值作为缺失值的插补值。具体计算方式如下:
(1)KNN的相似性度量方法:为了更好的对应聚类类别,KNN算法的相似性度量方法采用和聚类分析时同样的欧式距离。在计算待插补数据与训练集中数据的相似性时,由于待插补数据有缺失值,故采用有缺失值的欧氏距离计算方法:只使用xa中所有存在的值进行计算,有缺失项的计算使用非空值项的均值代替。。
如,有q个缺失值的待插补数据xa=[xa1,xa2,…,xa(q-1),nan1,…,nanq,xa(q+1),…,xap],与训练集中某一无缺失值的数据xb=[xb1,xb2,…,…,xbp]之间的欧氏距离为:
Figure BDA0003401420380000043
Figure BDA0003401420380000051
式中,nant表示xa中第t个缺失值,t=1,2,…,q;p表示单个电力用户日负荷数据的维度。
(2)K值的确定:在训练集样本数量较大,且每一个类别内的数据量也较多时,可以选择较大的K值,反之则应选择较小的值。在本发明的实施过程中,K值的选择根据无缺失值的数据的聚类结果,也就是KNN算法的训练集进行灵活调整。
(3)计算待插补数据与训练集中所有无缺失值的数据之间的欧氏距离,找到与待插补数据欧氏距离最近的K个“邻居”,找出K个“邻居”中出现次数最多的那个类的m个“邻居”(m一定小于等于K),根据KNN算法,待插补数据的类别与这m个“邻居”的类别相同。计算这m个“邻居”与待插值样本缺失值发生处位置相同的数据的均值,将该平均值作为插补值。
如,只有一个缺失值的待插补数据x=[1,2,nan,…],其两个最近的同类别“邻居”(m=2),x1=[2,2,3,…]与x2=[2,3,3,…],则缺失值处的插补数据为
Figure BDA0003401420380000052
插补后的x=[1,2,3,…]。
每次从待插补数据集取出一条待插补数据,重复本过程,直到将待插补数据集中的所有待插补数据插补完毕。
本发明提出了一种应用层次聚类算法和近邻算法的电力用户日负荷数据缺失值的插补方法,其特点在于使用层次聚类算法为近邻算法准备带有类别标签的训练数据,然后使用训练数据对有缺失值的日负荷数据进行插补。本发明的方法充分的利用了相同用电模式下的日负荷具有相似性的特点进行缺失值插补,从而建立起优质的日负荷数据集,提升了特征提取效果和用能异常检测模型的识别效果。
本发明提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的电力用户日负荷数据缺失值的插补方法。该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明提供一种用能异常检测中基于聚类和近邻算法的电力负荷数据缺失值插补系统,包括:存储器和处理器;所述存储器上存储有计算机程序,当所述计算机程序被所述处理器执行时,实现如上所述的电力用户日负荷数据缺失值的插补方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述,仅为本发明在实施例上的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的包含范围之内,因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (8)

1.一种用能异常检测中基于聚类和近邻算法的电力负荷数据缺失值插补方法,其特征在于,包括以下步骤:
步骤一:提取单个电力用户日负荷数据中无缺失值的数据,对提取的无缺失值的数据进行聚类分析,根据聚类结果将无缺失值的数据打上类别标签,作为训练集对K近邻算法KNN模型进行训练;
步骤二:步骤一提取无缺失值的数据后,该电力用户日负荷数据中的剩余数据为有缺失值的数据,在有缺失值的数据的缺失位置打上缺失标记nan作为待插补数据,得到待插补数据集;
步骤三:从步骤二中得到的待插补数据集中取出一条待插补数据,输入到训练完成的KNN模型中进行缺失值插补,并将插补后的数据打上类别标签加入训练集,对KNN模型进行重新训练;
步骤四:反复执行步骤三,直到完成对待插补数据集中所有待插补数据的插补。
2.根据权利要求1所述的一种用能异常检测中基于聚类和近邻算法的电力负荷数据缺失值插补方法,其特征在于,步骤一中对无缺失值的数据进行标准化处理后,采用无监督学习的层次聚类法进行聚类分析,画出谱系聚类图。
3.根据权利要求2所述的一种用能异常检测中基于聚类和近邻算法的电力负荷数据缺失值插补方法,其特征在于,层次聚类法中采用无缺失值的数据之间的欧氏距离作为相似性度量。
4.根据权利要求1所述的一种用能异常检测中基于聚类和近邻算法的电力负荷数据缺失值插补方法,其特征在于,步骤三中对待插补数据中缺失值的插补具体为:
KNN模型根据设定的相似性度量方法从训练集中选择出待插补数据的K个“邻居”,则该待插补数据的类别被标记为K个邻居中出现次数最多的那个类别,使用K个邻居中属于该类别的m个邻居中与缺失处位置相同的数据的均值作为缺失处的插补数据,其中m为出现次数最多的类别的出现次数,m≤K。
5.根据权利要求4所述的一种用能异常检测中基于聚类和近邻算法的电力负荷数据缺失值插补方法,其特征在于,计算待插补数据与训练集中所有无缺失值的数据样本的欧氏距离,找到与该待插补数据欧氏距离最近的K个邻居。
6.根据权利要求5所述的一种用能异常检测中基于聚类和近邻算法的电力负荷数据缺失值插补方法,其特征在于,有q个缺失值的待插补数据xa=[xa1,xa2,…,xa(q-1),nan1,…,nanq,xa(q+1),…,xap]与训练集中某一无缺失值的数据xb=[xb1,xb2,…,…,xbp]之间的欧氏距离为:
Figure FDA0003401420370000021
式中,nant表示xa中第t个缺失值,t=1,2,…,q;p表示单个电力用户日负荷数据的维度。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一所述的方法。
8.一种用能异常检测中基于聚类和近邻算法的电力负荷数据缺失值插补系统,其特征在于,包括:存储器和处理器;所述存储器上存储有计算机程序,当所述计算机程序被所述处理器执行时,实现如权利要求1至6中任一所述的方法。
CN202111497646.1A 2021-12-09 2021-12-09 一种基于聚类和近邻算法的日负荷数据缺失值插补方法 Pending CN114168578A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111497646.1A CN114168578A (zh) 2021-12-09 2021-12-09 一种基于聚类和近邻算法的日负荷数据缺失值插补方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111497646.1A CN114168578A (zh) 2021-12-09 2021-12-09 一种基于聚类和近邻算法的日负荷数据缺失值插补方法

Publications (1)

Publication Number Publication Date
CN114168578A true CN114168578A (zh) 2022-03-11

Family

ID=80484852

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111497646.1A Pending CN114168578A (zh) 2021-12-09 2021-12-09 一种基于聚类和近邻算法的日负荷数据缺失值插补方法

Country Status (1)

Country Link
CN (1) CN114168578A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115329907A (zh) * 2022-10-14 2022-11-11 杭州致成电子科技有限公司 基于dbscan聚类的电负荷补全方法和系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115329907A (zh) * 2022-10-14 2022-11-11 杭州致成电子科技有限公司 基于dbscan聚类的电负荷补全方法和系统
CN115329907B (zh) * 2022-10-14 2023-01-31 杭州致成电子科技有限公司 基于dbscan聚类的电负荷补全方法和系统

Similar Documents

Publication Publication Date Title
CN111882446B (zh) 一种基于图卷积网络的异常账户检测方法
CN110750524A (zh) 一种有源配电网故障特征的确定方法及系统
CN116523320B (zh) 基于互联网大数据的知识产权风险智能分析方法
CN107944622A (zh) 基于连续时段聚类的风电功率预测方法
CN112682273B (zh) 基于代价敏感轻量级梯度提升机的风电机组故障检测方法
CN108416373A (zh) 一种基于正则化Fisher阈值选择策略的不平衡数据分类系统
CN109871880A (zh) 基于低秩稀疏矩阵分解、局部几何结构保持和类别信息最大统计相关的特征提取方法
CN111967535A (zh) 一种储粮管理场景温度传感器故障诊断方法及其诊断装置
CN114168578A (zh) 一种基于聚类和近邻算法的日负荷数据缺失值插补方法
CN116383747A (zh) 基于多时间尺度深度卷积生成对抗网络的异常检测方法
CN115563477A (zh) 谐波数据识别方法、装置、计算机设备和存储介质
CN113110961B (zh) 设备异常检测方法、装置、计算机设备及可读存储介质
CN114358157A (zh) 一种基于时序数据LSTM特征的K-Shape聚类方法
CN114169998A (zh) 一种金融大数据分析与挖掘算法
Zhou et al. Automatic feature selection for unsupervised clustering of cycle-based signals in manufacturing processes
Yao et al. End-to-end Hyperspectral Image Change Detection Based on Band Selection
CN116337377A (zh) 基于多传感器的矿用设备故障状态分析方法和装置
CN115378000A (zh) 基于区间二型模糊聚类分析的配电网运行状态评估方法
Wang et al. Fault detection for the class imbalance problem in semiconductor manufacturing processes
CN114066173A (zh) 资金流动行为分析方法及存储介质
CN112685461A (zh) 一种基于预判模型的窃电用户判断方法
CN110263069B (zh) 新能源使用行为的时序特征隐含因素抽取和刻画方法及系统
Guo et al. A Hybrid clustering method for bridge structure health monitoring
Yang et al. Physical-Knowledge Embedded Convolutional Neural Network for Aluminum Electrolysis Superheat Degree Identification
CN118279912B (zh) 基于图像分析的干细胞分化程度评估方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination