CN104133866A - 一种面向智能电网的缺失数据填充方法 - Google Patents

一种面向智能电网的缺失数据填充方法 Download PDF

Info

Publication number
CN104133866A
CN104133866A CN201410344391.9A CN201410344391A CN104133866A CN 104133866 A CN104133866 A CN 104133866A CN 201410344391 A CN201410344391 A CN 201410344391A CN 104133866 A CN104133866 A CN 104133866A
Authority
CN
China
Prior art keywords
data
bunch
missing
cluster
subset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410344391.9A
Other languages
English (en)
Inventor
祁建
周红林
王青国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
State Grid Jiangsu Electric Power Co Ltd
Jiangsu Electric Power Information Technology Co Ltd
Information and Telecommunication Branch of State Grid Jiangsu Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
State Grid Jiangsu Electric Power Co Ltd
Jiangsu Electric Power Information Technology Co Ltd
Information and Telecommunication Branch of State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, State Grid Jiangsu Electric Power Co Ltd, Jiangsu Electric Power Information Technology Co Ltd, Information and Telecommunication Branch of State Grid Jiangsu Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201410344391.9A priority Critical patent/CN104133866A/zh
Publication of CN104133866A publication Critical patent/CN104133866A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Abstract

本发明公开一种面向智能电网的缺失数据填充方法,首先将源系统数据集中的部分不完整数据打回源系统,由源系统重新生成数据集D;然后将重新生成的数据集D分成两部分,即完整数据子集Dc和缺失数据子集Di,并对完全数据集D进行聚类;最后通过聚类结果对缺失数据子集Di进行填充,得到填充结果Di’。本发明能够在存在噪声和离群点的情况下,有效聚类空间数据,将其应用于缺失值填充中,提升了数据填充的准确性,为电力公司实现对业务系统数据的智能管理奠定了基础。

Description

一种面向智能电网的缺失数据填充方法
技术领域
本发明属于智能电网术领域,涉及一种缺失值填充方法,特别是一种面向智能电网的缺失数据填充方法。
背景技术
由于电力行业数字化技术的广泛应用,电力系统中各种数据正以前所未有的速度剧增,数据类型也越来越复杂。海量多源异构数据的深度分析和利用,对于电力企业盈利与控制水平的提升有很高的价值。有电网专家分析称,每当数据利用率调高10%,便可使电网提高20%~49%的利润。而数据质量的高低对数据分析的准确性和实时性有直接的影响。这是因为由于信息、技术、流程等种种因素,电力系统中数据存在着种种质量问题,如数据不完整、不一致、冗余,程序逻辑错误等,其中至关重要的就是数据缺失问题。
数据缺失在许多研究领域都是一个复杂的问题。对数据挖掘与分析来说,数据缺失可能造成以下影响:(1)系统可能丢失大量的有用信息;(2)系统中所表现出的不确定性可能更加显著;(3)系统产生不可靠的输出。因此在电网数据分析和利用中,为了能够更加充分地利用已经搜集到的数据,对缺失数据进行处理是非常必要的。
针对电网系统中存在的数据缺失问题,综观已有缺失数据填充方法,K-means填补算法是一种比较常用的方法,该方法的主要思想是:首先通过计算完全数据集中各样本间的距离将数据样本分成不同簇,并使同一个簇中的对象之间具有很高的相似度,而不同簇中的对象高度相异;然后计算缺失数据集中各缺失数据与各聚类簇的聚类,并将该缺失数据分到对应的聚类簇中;最后采用不同核函数对缺失数据进行填充。但是该算法针对电网系统缺失数据填充的准确性不甚理想,尤其是对于噪声点和离群点的处理方面,仍待进一步提高。
发明内容
针对电网系统缺失数据填充数据准确性不甚理想的问题,本发明的目的是提供一种面向智能电网的缺失数据填充方法,该方法首先将源系统数据集中的部分不完整数据打回源系统,由源系统重新生成数据集D,D由完整数据子集Dc和缺失数据子集Di构成;然后对D进行聚类,形成N个紧密耦合的簇;最后根据聚类结果对缺失数据子集Di进行填充,得到填充结果Di’。
本发明的目的通过以下技术方案实现:
一种面向智能电网的缺失数据填充方法,其特征在于:该方法首先将源系统数据集中的部分不完整数据打回源系统,由源系统重新生成数据集D,D由完整数据子集Dc和缺失数据子集Di构成;然后对D进行聚类,形成N个紧密耦合的簇;最后根据聚类结果对缺失数据子集进行填充,得到填充结果。具体步骤如下:
1)将源系统数据集中的部分不完整数据打回让源系统重新生成,这些数据包含有较多缺失值的记录和较少完整值的属性;通常情况下如果一条记录的缺失属性值占记录全部属性值的一半及以上需要打回该记录;如果某个属性的完整属性值占全部记录的比例低于50%,也需要打回该属性;
2)对重新生成的数据集D将重新生成的数据集分成完整数据子集Dc和缺失数据子集Di,并对D进行K-Means聚类,从而产生紧密耦合的K个小簇,这些小簇能够将噪声和离群点与其他点有效地分离开来,然后通过动态合并的方式不断地合并这些小簇,在D上产生N个紧密耦合的簇;
3)根据聚类后的结果对缺失数据子集进行填充,在填充过程中,如果簇中含有完整属性的数据,利用该簇相应的属性均值来填充该记录的缺失值。如果簇中没有完整属性的数据,则根据完整数据子集Dc的平均值和方差,基于正态分布数据分发器来对这些缺失值进行填充。
本发明在对数据集进行聚类时,采用基于动态建模的K-means聚类算法,该算法采用K-means算法来划分数据集,并基于自相似性概念合并簇。
对完全数据集D进行聚类的具体步骤如下:
步骤一:选择K个点作为初始质心;
步骤二:根据欧几里得距离(Euclidean Distance)将每个点指派到最近的质心,形成K个小簇,K值一般选取为数据集中总记录条数的10%-20%,欧几里得距离的计算公式如公式(1)所示:
dist ( X , Y ) = Σ i = 1 n ( x i - y i ) 2 - - - ( 1 )
其中:X=(x1,x2,...,xn),Y=(y1,y2,...,yn);
步骤三:根据指派到簇的点,重新计算每个簇的质心;
步骤四:重复步骤二和步骤三,直到簇不发生变化;
步骤五:采用相近邻近度量,合并各个小簇对,并设置一个阈值,如果RC(Ci,Cj)值小于阈值,则不断地合并小簇,如果合并过程中某个类簇对之间的距离大于阈值,则停止类簇合并,并以此阶段得到类簇作为最总的类簇结果,合并后产生N个类簇;相对接近度的计算公式如公式(2)所示:
RC ( C i , C j ) = S ‾ EC ( C i , C j ) k i k i + k j S ‾ EC ( C i ) + k j k i + k j S ‾ EC ( C j ) - - - ( 2 )
其中,ki,kj分别是簇Ci和Cj的大小;是连接簇Ci和Cj的边的平均权值;是二分簇Ci的边的平均权值;是二分簇Cj的边的平均权值;EC表示割边;
基于自相似性概念,两个簇合并,仅当结果簇中的点之间的接近程度与原来的每个簇一样,能够有效聚类空间数据,即便存在噪声和离群点。
本发明的有益效果在于,该方法能够在存在噪声和离群点的情况下,能够有效完成数据聚类,并将其应用于缺失值填充中,提升了数据填充的准确性,为电力公司实现对业务系统数据的智能管理奠定了基础。
附图说明
图1为本发明的总体框架图。
具体实施方式
一种面向智能电网的缺失数据填充方法,首先将源系统数据集中的部分不完整数据打回源系统,由源系统重新生成数据集D,D由完整数据子集Dc和缺失数据子集Di构成;然后对D进行聚类,形成N个紧密耦合的簇;最后根据聚类结果对缺失数据子集进行填充,得到填充结果,总体框架图如图1所示。该方法的具体步骤如下:
1)将源系统数据集中的部分不完整数据打回让源系统重新生成,这些数据包含有较多缺失值的记录和较少完整值的属性。通常情况下如果一条记录的缺失属性值占记录全部属性值的一半及以上需要打回该记录;如果某个属性的完整属性值占全部记录条数的比例低于50%,也需要打回该属性。
2)对重新生成的数据集D将重新生成的数据集分成完整数据子集Dc和缺失数据子集Di,并对D进行K-Means聚类,从而产生紧密耦合的K个小簇,这些小簇能够将噪声和离群点与其他点有效地分离开来,然后通过动态合并的方式不断地合并这些小簇,在D上产生N个紧密耦合的簇。
3)根据聚类后的结果对缺失数据子集进行填充,在填充过程中,如果簇中含有完整属性的数据,利用该簇相应的属性均值来填充该记录的缺失值。如果簇中没有完整属性的数据,则根据完整数据子集Dc的平均值和方差,基于正态分布数据分发器来对这些缺失值进行填充。
对完整数据子集进行聚类时,采用基于动态建模的K-means聚类算法,该算法采用K-means算法来划分数据集,并基于自相似性概念合并簇。
对完全数据集D进行聚类的具体步骤如下:
步骤一:选择K个点作为初始质心;
步骤二:根据欧几里得距离(Euclidean Distance)将每个点指派到最近的质心,形成K个小簇(K值一般选取为数据集中总记录条数的10%-20%),欧几里得距离的计算公式如公式(1)所示:
dist ( X , Y ) = Σ i = 1 n ( x i - y i ) 2 - - - ( 1 )
其中:X=(x1,x2,...,xn),Y=(y1,y2,...,yn)。
步骤三:根据指派到簇的点,重新计算每个簇的质心;
步骤四:重复步骤二和步骤三,直到簇不发生变化;
步骤五:采用相近邻近度量,合并各个小簇对,并设置一个阈值,如果RC(Ci,Cj)值小于阈值,则不断地合并小簇,如果合并过程中某个类簇对之间的距离大于阈值,则停止类簇合并,并以此阶段得到类簇作为最总的类簇结果,合并后产生N个类簇。相对接近度的计算公式如公式(2)所示:
RC ( C i , C j ) = S ‾ EC ( C i , C j ) k i k i + k j S ‾ EC ( C i ) + k j k i + k j S ‾ EC ( C j ) - - - ( 2 )
其中,ki,kj分别是簇Ci和Cj的大小;是连接簇Ci和Cj的边的平均权值;是二分簇Ci的边的平均权值;是二分簇Cj的边的平均权值;EC表示割边。
基于自相似性概念,两个簇合并,仅当结果簇中的点之间的接近程度几乎与原来的每个簇一样,能够有效聚类空间数据,即便存在噪声和离群点。
本发明首先将源系统数据集中的部分不完整数据打回让源系统重新生成,然后将重新生成的数据集分成完整数据子集和缺失数据子集,并对完整数据子集进行层次聚类,最后对缺失数据子集进行填充,填充结果准确。

Claims (3)

1.一种面向智能电网的缺失数据填充方法,其特征在于:首先将源系统数据集中的部分不完整数据打回源系统,由源系统重新生成数据集D,D由完整数据子集Dc和缺失数据子集Di构成;然后对D进行聚类,形成N个紧密耦合的簇;最后根据聚类结果对缺失数据子集Di进行填充,得到填充结果Di’,具体步骤如下:
1)将源系统数据集中的部分不完整数据打回让源系统重新生成,这些数据包含有较多缺失值的记录和较少完整值的属性;通常情况下如果一条记录的缺失属性值占记录全部属性值的一半及以上需要打回该记录;如果某个属性的完整属性值占全部记录的比例低于50%,也需要打回该属性;
2)对重新生成的数据集D将重新生成的数据集分成完整数据子集Dc和缺失数据子集Di,并对D进行K-Means聚类,从而产生紧密耦合的K个小簇,这些小簇能够将噪声和离群点与其他点有效地分离开来,然后通过动态合并的方式不断地合并这些小簇,在D上产生N个紧密耦合的簇;
3)根据聚类后的结果对缺失数据子集进行填充,在填充过程中,如果簇中含有完整属性的数据,利用该簇相应的属性均值来填充该记录的缺失值;如果簇中没有完整属性的数据,则根据完整数据子集Dc的平均值和方差,基于正态分布数据分发器来对这些缺失值进行填充。
2.根据权利要求1所述的面向智能电网的缺失数据填充方法,其特征在于:步骤(2)中,对完整数据子集进行聚类时,采用基于动态建模的K-means聚类算法,该算法采用K-means算法来划分数据集,并基于自相似性概念合并簇。
3.根据权利要求2所述的面向智能电网的缺失数据填充方法,其特征在于:对完全数据集D进行聚类的具体步骤如下:
步骤一:选择K个点作为初始质心;
步骤二:根据欧几里得距离(Euclidean Distance)将每个点指派到最近的质心,形成K个小簇,K值一般选取为数据集中总记录条数的10%-20%,欧几里得距离的计算公式如公式(1)所示:
dist ( X , Y ) = Σ i = 1 n ( x i - y i ) 2 - - - ( 1 )
其中:X=(x1,x2,...,xn),Y=(y1,y2,...,yn);
步骤三:根据指派到簇的点,重新计算每个簇的质心;
步骤四:重复步骤二和步骤三,直到簇不发生变化;
步骤五:采用相近邻近度量,合并各个小簇对,并设置一个阈值,如果RC(Ci,Cj)值小于阈值,则不断地合并小簇,如果合并过程中某个类簇对之间的距离大于阈值,则停止类簇合并,并以此阶段得到类簇作为最总的类簇结果,合并后产生N个类簇;相对接近度的计算公式如公式(2)所示:
RC ( C i , C j ) = S ‾ EC ( C i , C j ) k i k i + k j S ‾ EC ( C i ) + k j k i + k j S ‾ EC ( C j ) - - - ( 2 )
其中,ki,kj分别是簇Ci和Cj的大小;是连接簇Ci和Cj的边的平均权值;是二分簇Ci的边的平均权值;是二分簇Cj的边的平均权值;EC表示割边;
基于自相似性概念,两个簇合并,仅当结果簇中的点之间的接近程度与原来的每个簇一样,能够有效聚类空间数据,即便存在噪声和离群点。
CN201410344391.9A 2014-07-18 2014-07-18 一种面向智能电网的缺失数据填充方法 Pending CN104133866A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410344391.9A CN104133866A (zh) 2014-07-18 2014-07-18 一种面向智能电网的缺失数据填充方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410344391.9A CN104133866A (zh) 2014-07-18 2014-07-18 一种面向智能电网的缺失数据填充方法

Publications (1)

Publication Number Publication Date
CN104133866A true CN104133866A (zh) 2014-11-05

Family

ID=51806544

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410344391.9A Pending CN104133866A (zh) 2014-07-18 2014-07-18 一种面向智能电网的缺失数据填充方法

Country Status (1)

Country Link
CN (1) CN104133866A (zh)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104598618A (zh) * 2015-01-30 2015-05-06 武汉理工大学 一种基于完备相容类的云平台不完备大数据填补方法
CN104809238A (zh) * 2015-05-12 2015-07-29 国家电网公司 用于数据采集系统的数据处理方法及装置
CN104866578A (zh) * 2015-05-26 2015-08-26 大连理工大学 一种不完整数据混合填充方法
CN105372989A (zh) * 2015-08-25 2016-03-02 国网山西省电力公司晋城供电公司 一种调度控制系统不完整数据参数的估计方法和装置
CN106033473A (zh) * 2015-03-20 2016-10-19 阿里巴巴集团控股有限公司 数据的处理方法和装置
CN106371021A (zh) * 2015-07-21 2017-02-01 三星电子株式会社 用于估计电池的状态的方法和设备
CN108932301A (zh) * 2018-06-11 2018-12-04 天津科技大学 数据填充方法及装置
CN109460775A (zh) * 2018-09-20 2019-03-12 国家计算机网络与信息安全管理中心 一种基于信息熵的数据填充方法及装置
CN109522292A (zh) * 2018-08-29 2019-03-26 云南电网有限责任公司信息中心 基于电网标准统一信息模型的数据处理装置和方法
CN110163748A (zh) * 2019-05-28 2019-08-23 京东数字科技控股有限公司 一种流动性期限管理缺失数据回填方法和设备
CN110287256A (zh) * 2019-06-14 2019-09-27 南京邮电大学 一种基于云计算的电网数据并行处理系统及其处理方法
CN110674621A (zh) * 2018-07-03 2020-01-10 北京京东尚科信息技术有限公司 一种属性信息填充方法和装置
CN110704689A (zh) * 2018-07-10 2020-01-17 国际商业机器公司 检测图形模式中的缺失实体
CN110837855A (zh) * 2019-10-30 2020-02-25 云南电网有限责任公司信息中心 一种对电网业务协同监控系统中异构数据集的处理方法
CN111611231A (zh) * 2019-02-25 2020-09-01 新奥数能科技有限公司 设备运行数据的清洗方法、装置、可读介质及电子设备
CN111737463A (zh) * 2020-06-04 2020-10-02 江苏名通信息科技有限公司 大数据缺失值填充方法、装置和计算机程序
CN112990380A (zh) * 2021-05-11 2021-06-18 物鼎安全科技(武汉)有限公司 物联网缺失数据的填充方法及系统
WO2021159655A1 (zh) * 2020-02-12 2021-08-19 平安科技(深圳)有限公司 数据属性填充方法、装置、设备及计算机可读存储介质
CN114401116A (zh) * 2021-12-20 2022-04-26 广东电网有限责任公司 基于HK-Means和安全性检测的可信数据传输方法
CN114443628A (zh) * 2021-12-20 2022-05-06 江南大学 一种基于聚类的金融缺失数据处理方法
CN116112530A (zh) * 2023-04-14 2023-05-12 河海大学 水利工程实时采集数据管理方法及系统
CN116823338A (zh) * 2023-08-28 2023-09-29 国网山东省电力公司临沂供电公司 电力用户经济属性缺失值的推断方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102025531A (zh) * 2010-08-16 2011-04-20 北京亿阳信通软件研究院有限公司 一种性能数据的填补方法及其装置
CN103177088A (zh) * 2013-03-08 2013-06-26 北京理工大学 一种生物医学空缺数据弥补方法
CN103810261A (zh) * 2014-01-26 2014-05-21 西安理工大学 一种基于商空间理论的K-means聚类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102025531A (zh) * 2010-08-16 2011-04-20 北京亿阳信通软件研究院有限公司 一种性能数据的填补方法及其装置
CN103177088A (zh) * 2013-03-08 2013-06-26 北京理工大学 一种生物医学空缺数据弥补方法
CN103810261A (zh) * 2014-01-26 2014-05-21 西安理工大学 一种基于商空间理论的K-means聚类方法

Cited By (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104598618A (zh) * 2015-01-30 2015-05-06 武汉理工大学 一种基于完备相容类的云平台不完备大数据填补方法
CN104598618B (zh) * 2015-01-30 2018-03-27 武汉理工大学 一种基于完备相容类的云平台不完备大数据填补方法
CN106033473A (zh) * 2015-03-20 2016-10-19 阿里巴巴集团控股有限公司 数据的处理方法和装置
CN104809238A (zh) * 2015-05-12 2015-07-29 国家电网公司 用于数据采集系统的数据处理方法及装置
CN104809238B (zh) * 2015-05-12 2018-02-23 国家电网公司 用于数据采集系统的数据处理方法及装置
CN104866578A (zh) * 2015-05-26 2015-08-26 大连理工大学 一种不完整数据混合填充方法
CN104866578B (zh) * 2015-05-26 2018-01-26 大连理工大学 一种不完整物联网数据混合填充方法
CN106371021B (zh) * 2015-07-21 2021-01-01 三星电子株式会社 用于估计电池的状态的方法和设备
CN106371021A (zh) * 2015-07-21 2017-02-01 三星电子株式会社 用于估计电池的状态的方法和设备
CN105372989B (zh) * 2015-08-25 2018-12-18 国网山西省电力公司晋城供电公司 一种调度控制系统不完整数据参数的估计方法和装置
CN105372989A (zh) * 2015-08-25 2016-03-02 国网山西省电力公司晋城供电公司 一种调度控制系统不完整数据参数的估计方法和装置
CN108932301A (zh) * 2018-06-11 2018-12-04 天津科技大学 数据填充方法及装置
CN110674621A (zh) * 2018-07-03 2020-01-10 北京京东尚科信息技术有限公司 一种属性信息填充方法和装置
CN110704689A (zh) * 2018-07-10 2020-01-17 国际商业机器公司 检测图形模式中的缺失实体
CN109522292A (zh) * 2018-08-29 2019-03-26 云南电网有限责任公司信息中心 基于电网标准统一信息模型的数据处理装置和方法
CN109522292B (zh) * 2018-08-29 2020-02-18 云南电网有限责任公司信息中心 基于电网标准统一信息模型的数据处理装置和方法
CN109460775A (zh) * 2018-09-20 2019-03-12 国家计算机网络与信息安全管理中心 一种基于信息熵的数据填充方法及装置
CN109460775B (zh) * 2018-09-20 2020-09-11 国家计算机网络与信息安全管理中心 一种基于信息熵的数据填充方法及装置
CN111611231A (zh) * 2019-02-25 2020-09-01 新奥数能科技有限公司 设备运行数据的清洗方法、装置、可读介质及电子设备
CN110163748B (zh) * 2019-05-28 2021-08-17 京东数字科技控股有限公司 一种流动性期限管理缺失数据回填方法和设备
CN110163748A (zh) * 2019-05-28 2019-08-23 京东数字科技控股有限公司 一种流动性期限管理缺失数据回填方法和设备
CN110287256A (zh) * 2019-06-14 2019-09-27 南京邮电大学 一种基于云计算的电网数据并行处理系统及其处理方法
CN110287256B (zh) * 2019-06-14 2022-10-14 南京邮电大学 一种基于云计算的电网数据并行处理系统及其处理方法
CN110837855A (zh) * 2019-10-30 2020-02-25 云南电网有限责任公司信息中心 一种对电网业务协同监控系统中异构数据集的处理方法
CN110837855B (zh) * 2019-10-30 2023-02-21 云南电网有限责任公司信息中心 一种对电网业务协同监控系统中异构数据集的处理方法
WO2021159655A1 (zh) * 2020-02-12 2021-08-19 平安科技(深圳)有限公司 数据属性填充方法、装置、设备及计算机可读存储介质
CN111737463B (zh) * 2020-06-04 2024-02-09 江苏名通信息科技有限公司 大数据缺失值填充方法、装置和计算机可读存储器
CN111737463A (zh) * 2020-06-04 2020-10-02 江苏名通信息科技有限公司 大数据缺失值填充方法、装置和计算机程序
CN112990380A (zh) * 2021-05-11 2021-06-18 物鼎安全科技(武汉)有限公司 物联网缺失数据的填充方法及系统
CN112990380B (zh) * 2021-05-11 2021-08-03 物鼎安全科技(武汉)有限公司 物联网缺失数据的填充方法及系统
CN114401116A (zh) * 2021-12-20 2022-04-26 广东电网有限责任公司 基于HK-Means和安全性检测的可信数据传输方法
CN114401116B (zh) * 2021-12-20 2023-06-23 广东电网有限责任公司 基于HK-Means和安全性检测的可信数据传输方法
CN114443628A (zh) * 2021-12-20 2022-05-06 江南大学 一种基于聚类的金融缺失数据处理方法
CN114443628B (zh) * 2021-12-20 2024-04-26 江南大学 一种基于聚类的金融缺失数据处理方法
CN116112530A (zh) * 2023-04-14 2023-05-12 河海大学 水利工程实时采集数据管理方法及系统
CN116823338A (zh) * 2023-08-28 2023-09-29 国网山东省电力公司临沂供电公司 电力用户经济属性缺失值的推断方法
CN116823338B (zh) * 2023-08-28 2023-11-17 国网山东省电力公司临沂供电公司 电力用户经济属性缺失值的推断方法

Similar Documents

Publication Publication Date Title
CN104133866A (zh) 一种面向智能电网的缺失数据填充方法
CN106709035B (zh) 一种电力多维全景数据的预处理系统
CN107145586B (zh) 一种基于电力营销数据的标签产出方法和装置
CN102073706B (zh) 分布式文件存储系统和关系数据库的结合应用方法
CN103577605A (zh) 基于数据融合和数据挖掘的数据仓库及其应用方法
CN103093394A (zh) 一种基于用户用电负荷数据细分的聚类融合方法
CN105046160A (zh) 一种基于直方图的面向数据流差分隐私发布方法
CN103455633A (zh) 一种海量网络发票明细数据分布式分析方法
CN104156403A (zh) 一种基于聚类的大数据常态模式提取方法及系统
CN103559588A (zh) 基于Petri网行为轮廓的日志挖掘方法
CN112730938A (zh) 一种基于用电采集大数据的窃电用户判断方法
CN105138650A (zh) 一种基于孤立点挖掘的Hadoop数据清洗方法及系统
CN111159152B (zh) 基于大数据处理技术的二次运维数据融合方法
CN103679288A (zh) 一种径流式小水电集群发电功率短期预测方法及预测系统
CN111082466A (zh) 考虑风电不确定性的新能源接入与网架扩建优化方法
CN104219088A (zh) 一种基于Hive的网络告警信息OLAP方法
CN104156817A (zh) 一种电网综合评估体系智能生成系统及方法
CN102685222B (zh) 一种用于电力系统的云存储资源管理装置
CN105631583A (zh) 一种电网省地一体化调度报表的数据采集处理方法
CN111556108B (zh) 基于云平台的电力大数据采集系统和方法
CN104636492A (zh) 一种基于模糊积分特征融合的动态数据分级方法
CN110162513A (zh) 用于智能电网大数据处理的数据表连接方法及计算机可读存储介质
CN108647321B (zh) 一种树形智能车间制造大数据集成建模与语义计算方法
CN104933529A (zh) 废弃烟丝对卷烟单箱能耗影响的分析系统及分析方法
CN204557477U (zh) 基于数据仓库和olap技术的聚类挖掘系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20141105

WD01 Invention patent application deemed withdrawn after publication