CN112115180A - 一种基于大数据的电网事故预测方法 - Google Patents

一种基于大数据的电网事故预测方法 Download PDF

Info

Publication number
CN112115180A
CN112115180A CN202010950334.0A CN202010950334A CN112115180A CN 112115180 A CN112115180 A CN 112115180A CN 202010950334 A CN202010950334 A CN 202010950334A CN 112115180 A CN112115180 A CN 112115180A
Authority
CN
China
Prior art keywords
data
power grid
distance
big data
centroid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010950334.0A
Other languages
English (en)
Other versions
CN112115180B (zh
Inventor
宋士瞻
王传勇
张健
韩蓬
康文文
杨凤文
王坤
王为帅
李森
张建华
侯文�
张瑞
仇翠
柳涛
潘明
夏清普
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zaozhuang Power Supply Co of State Grid Shandong Electric Power Co Ltd
Jiangsu Hongyuan Electric Co Ltd
Original Assignee
Zaozhuang Power Supply Co of State Grid Shandong Electric Power Co Ltd
Jiangsu Hongyuan Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zaozhuang Power Supply Co of State Grid Shandong Electric Power Co Ltd, Jiangsu Hongyuan Electric Co Ltd filed Critical Zaozhuang Power Supply Co of State Grid Shandong Electric Power Co Ltd
Priority to CN202010950334.0A priority Critical patent/CN112115180B/zh
Publication of CN112115180A publication Critical patent/CN112115180A/zh
Application granted granted Critical
Publication of CN112115180B publication Critical patent/CN112115180B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Computational Linguistics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明属于预测方法,具体涉及一种基于大数据的电网事故预测方法。一种基于大数据的电网事故预测方法,其中,包括下述步骤:步骤1:大数据采集;输入大数据,步骤2:大数据清洗;去除人为因素造成的电网运行异常,经过数据清洗的数据矩阵记为S’;步骤3:大数据归一化;对步骤2得到数据矩阵S’进行归一化;步骤4:数据分类;计算执信并判断有效性;步骤5:提取关键信息;根据阈值提取关键信息;步骤6:新数据预测;用提取的关键信息进行新数据预测。本发明的显著效果是:本发明将产生电网事故的原因分为若干类,分别对各类内容进行大数据统计计算,用计算结果预测本类事件发生的可能性,实现了基于大数据的电网事故预测。

Description

一种基于大数据的电网事故预测方法
技术领域
本发明属于预测方法,具体涉及一种基于大数据的电网事故预测方法。
背景技术
电网在现代工业社会中处于核心地位,电力对于工业来说就像血液对于人体的地位。为了保证电力的有效供应,国家兴建了从国家到地方的一系列电网。电网中既有燃煤发电、核电、风电、太阳能发电等发电厂,也有普通用户、工业用户等用电单元,还有输电线、变压器等电力传输设备。虽然电力部门尽力的做好相关保障工作,但是电网中仍存在电压不稳,谐波干扰,频率波动等电网污染问题。造成电网污染的问题归结起来大致包含以下几种情况:(1)最终用户用电量突变,例如突然有大型用电设备启动;(2)季节性用电高峰,例如夏天几乎家家都开空调;(3)突发自然灾害,例如大风,雨雪,闪电造成线路损坏;(4)人为造成的意外,例如因其他原因施工意外损坏电网等。
现有技术几乎都是发生电网污染或事故时采取补救措施,而没有很好的对未来可能发生的意外进行预测。
发明内容
本发明针对现有技术的缺陷,提供一种基于大数据的电网事故预测方法。
本发明是这样实现的:一种基于大数据的电网事故预测方法,其中,包括下述步骤:
步骤1:大数据采集
输入大数据,
步骤2:大数据清洗
去除人为因素造成的电网运行异常,
经过数据清洗的数据矩阵记为S′;
步骤3:大数据归一化
对步骤2得到数据矩阵S′进行归一化;
步骤4:数据分类
计算执信并判断有效性;
步骤5:提取关键信息
根据阈值提取关键信息;
步骤6:新数据预测
用提取的关键信息进行新数据预测;
步骤7:根据分类结果,做提前预处理
根据事件所属类别特点,采取对应的预处理方案。
如上所述的一种基于大数据的电网事故预测方法,其中,所述的步骤1包括,
输入的数据包括电网的负荷、用电量、天气情况、用户信息、电网运行情况,输入的数据以时间为依据进行整理,即相同时间点的数据作为一组,假设共有n个时间点的数据,共有m个输入参数,则可以得到数据矩阵S;
Figure BDA0002676687190000031
其中第一列对应电网负荷数据,第二列对应用电量数据,第三列对应天气情况,依次类推;
其中电网负荷、用电量均为直接采集的数据,天气情况为气象部门给出的数据,用户信息为电网管理部门的基础数据,电网运行情况只有两种情况,正常运行时为“1”,不正常运行时为“0”;该列用于后续快速剔除污染数据;
所述的同时间信息指的是在数据矩阵S中,同一行的数据应为同一时间点的数据,时间间隔根据需要可以为:周、天、小时或15分钟。
如上所述的一种基于大数据的电网事故预测方法,其中,所述的步骤1包括,在进行大数据采集的时候,为了更加准确的采集数据,有些参数能够扩展为更详细的数据。
如上所述的一种基于大数据的电网事故预测方法,其中,所述的步骤1包括,
在某些时刻需要输入的数据并不能直接得到,此时用近似的方式解决。
如上所述的一种基于大数据的电网事故预测方法,其中,所述的步骤1中的近似的方式包括下述内容,
如果采样时间点与气象部门预报的时间点不重合时,选取采样时间点前后相邻时间点的温度数据,用该两组数据拟合直线,然后将采样时间点带入拟合的直线,求得所需的温度数据,该温度数据作为数据矩阵S相应元素的值。
如上所述的一种基于大数据的电网事故预测方法,其中,所述的步骤2包括
查找步骤1中电网运行情况显示结果为“0”的行的时间点,以时间点为索引在电力档案中查找电网运行情况异常的处理报告;根据报告内容,判断造成电网运行情况异常的原因是否是人为因素;所述的人为因素是指完全是因为人的因素造成的结果,
如果判断结果是人为因素造成的电网运行情况异常,那么直接删除数据矩阵S中的相应行,否则不做处理。
如上所述的一种基于大数据的电网事故预测方法,其中,所述的步骤3包括
数据归一化对列数据进行,同列数据用相同归一化方法进行归一化,不同列数据可以采用相同归一化方法,也可以采用不同归一化方法,归一化后得到的数据矩阵记为S″,数据矩阵S″中的每个元素的值均在0-1之间;
所述的归一化方法可以采用任意现有技术中的归一化方法,也可以采用本申请的下述方法进行
对于同列元素,归一化后的元素a″用下述公式计算
Figure BDA0002676687190000041
其中a′i是数据矩阵S′中的元素,a′min是a′i所在列中值最小的元素,a′max是a′i所在列中值最大的元素,| |为取绝对值。
如上所述的一种基于大数据的电网事故预测方法,其中,所述的步骤4包括
步骤4.1取前5行数据
在数据矩阵S″中取前5行数据,分别记为点
P1(a″11,a″12,…,a″1m),
P2(a″21,a″22,…,a″2m),
P3(a″31,a″32,…,a″3m),
P4(a″41,a″42,…,a″4m),
P5(a″51,a″52,…,a″5m);
该5个点设为初始质心,此时上述5个点的坐标分别记为
P1质(a″11质,a″12质,…,a″1m质),
P2质(a″21质,a″22质,…,a″2m质),
P3质(a″31质,a″32质,…,a″3m质),
P4质(a″41质,a″42质,…,a″4m质),
P5质(a″51质,a″52质,…,a″5m质);
对于数据矩阵S″中的其他行数据,也将其看成点,
即Pi(a″i1,a″i2,…,a″im),数据矩阵S″共可为u=n-e个点,其中n是步骤1输入的时间点的个数,e是步骤2中数据清洗时去掉行的个数;
步骤4.2计算每个点与质心的距离
即对于Pi点,用下述公式计算
Figure BDA0002676687190000061
Figure BDA0002676687190000062
Figure BDA0002676687190000063
Figure BDA0002676687190000064
Figure BDA0002676687190000065
步骤4.3排序
将Li1质-Li5质由小到大排序,取排序后第一个数值对应的集合作为Pi点的集合;
步骤4.4计算集合质心
对上述每个集合用下述公式计算集合质心
Figure BDA0002676687190000066
其中j是集合中元素的个数;
步骤4.5判断是否收敛
当第一次执行时,直接重复执行步骤4.2-4.4,
当第二次以上执行时,判断相邻两次迭代中每个集合中的元素是否相同,若相同判断结果收敛,执行步骤5,若结果不收敛直接重复执行步骤4.2-4.5。
如上所述的一种基于大数据的电网事故预测方法,其中,所述的步骤5包括,
对每个集合中的元素均计算该元素与最新更新的质心之间的距离,该距离称为元素-质心距,具体计算方法与步骤4.2中的计算方法类似;将该集合中所有元素-质心距累加得到总元素-质心距,用总元素-质心距除以元素个数得到第一阈值A1,元素-质心距最大值的0.75倍为第二阈值A2。
如上所述的一种基于大数据的电网事故预测方法,其中,所述的步骤6包括,
当接收到新数据时,用步骤3的方法对数据进行归一化,然后分别计算新收到数据与每个集合质心的距离;因为一共5个集合,因此得到5个距离,然后做下述判断
当只有1个距离在第一阈值A1内时,判定该新数据属于该集合,将该集合特征输出;
当有1个以上距离在第一阈值A1内时,该新数据需人工判断;
当没有距离在第一阈值A1内,且只有1个距离在第二阈值A2以内时,判定该新数据属于该集合,将该集合特征输出;
当没有距离在第一阈值A1内,且有1个以上距离在第二阈值A2内时,则以距离长短为判断依据,即与哪个质心距离短,就该新数据属于该集合,将该集合特征输出;
当没有距离在第一阈值A1内,且没有距离在第二阈值A2内时,该新数据需人工判断;
如果判定结果为属于某个集合,则输出该集合特征;如果判定结果为需要人工判断,则输出该组数据。
本发明的显著效果是:本发明将产生电网事故的原因分为若干类,分别对各类内容进行大数据统计计算,用计算结果预测本类事件发生的可能性,实现了基于大数据的电网事故预测。
具体实施方式
一种基于大数据的电网事故预测方法,包括下述步骤:
步骤1:大数据采集
输入大数据,输入的数据包括电网的负荷、用电量、天气情况、用户信息、电网运行情况,输入的数据以时间为依据进行整理,即相同时间点的数据作为一组,假设共有n个时间点的数据,共有m个输入参数,则可以得到数据矩阵S
Figure BDA0002676687190000081
其中第一列对应电网负荷数据,第二列对应用电量数据,第三列对应天气情况,依次类推。
在进行大数据采集的时候,为了更加准确的采集数据,有些参数可以扩展为更详细的数据,例如天气情况可以扩展为温度、湿度、风力、风向等,当然如果处理数据的系统运算能力不足,也可以根据需要简化参数,例如只保留湿度,或者只保留湿度和风力。又如用户信息可以简化为电网中的用户数量,也可以扩展为电网中用户的数量及每户的用电量,此时只需要根据用户数量增加矩阵的列数,并在增加的每列中填写对应用户的用电量即可。
其中电网负荷、用电量均为直接采集的数据,天气情况为气象部门给出的数据,用户信息为电网管理部门的基础数据,电网运行情况只有两种情况,正常运行时为“1”,不正常运行时为“0”。该列用于后续快速剔除污染数据。
所述的同时间信息指的是在数据矩阵S中,同一行的数据应为同一时间点的数据,时间间隔根据需要可以为:周、天、小时和15分钟。在某些时刻上述数据并不能直接得到,此时用近似的方式解决。例如当时间间隔为15分钟时,天气情况和用户信息并不会每15分钟更新一次,此时用采样时间点前和采样时间点后最接近的数据做线性函数,求得该时间点的数据。
例如以天气情况的温度为例,气象部门职能给出每小时的温度数据,如果采样时间点与气象部门预报的时间点不重合时,选取采样时间点前后相邻时间点的温度数据,用该两组数据拟合直线,然后将采样时间点带入拟合的直线,求得所需的温度数据,该温度数据作为数据矩阵S相应元素的值。
步骤2:大数据清洗
查找步骤1中电网运行情况显示结果为“0”的行的时间点,以时间点为索引在电力档案中查找电网运行情况异常的处理报告。根据报告内容,判断造成电网运行情况异常的原因是否是人为因素。所述的人为因素是指完全是因为人的因素造成的结果,例如因施工意外造成电网损伤,因私搭乱建造成的电网损伤,因偷电造成的电网损伤等。
如果判断结果是人为因素造成的电网运行情况异常,那么直接删除数据矩阵S中的相应行,否则不做处理。
之所以删除因人为因素造成的损伤,是因为人为因素是完全随机的,其原因通过已有的历史数据归纳总结出规律,因此无法预测。而非人为因素,例如因为天气原因造成的电网损伤,损害本身与天气情况具有一定的相关性,因此可以根据天气情况进行一定程度的预测。其他非人为因素也具有可预测性,因而保留。
经过数据清洗的数据矩阵记为S′
步骤3:大数据归一化
对步骤2得到数据矩阵S′进行归一化。
数据归一化对列数据进行,同列数据用相同归一化方法进行归一化,不同列数据可以采用相同归一化方法,也可以采用不同归一化方法,归一化后得到的数据矩阵记为S″,数据矩阵S″中的每个元素的值均在0-1之间。
所述的归一化方法可以采用任意现有技术中的归一化方法,也可以采用本申请的下述方法进行
对于同列元素,归一化后的元素a″用下述公式计算
Figure BDA0002676687190000111
其中a′i是数据矩阵S′中的元素,a′min是a′i所在列中值最小的元素,a′max是a′i所在列中值最大的元素,| |为取绝对值。
步骤4:数据分类
步骤4.1取前5行数据
在数据矩阵S″中取前5行数据,分别记为点
P1(a″11,a″12,…,a″1m),
P2(a″21,a″22,…,a″2m),
P3(a″31,a″32,…,a″3m),
P4(a″41,a″42,…,a″4m),
P5(a″51,a″52,…,a″5m)。
该5个点设为初始质心,此时上述5个点的坐标分别记为
P1质(a″11质,a″12质,…,a″1m质),
P2质(a″21质,a″22质,…,a″2m质),
P3质(a″31质,a″32质,…,a″3m质),
P4质(a″41质,a″42质,…,a″4m质),
P5质(a″51质,a″52质,…,a″5m质)。
对于数据矩阵S″中的其他行数据,也将其看成点,
即Pi(a″i1,a″i2,…,a″im),数据矩阵S″共可为u=n-e个点,其中n是步骤1输入的时间点的个数,e是步骤2中数据清洗时去掉行的个数。
步骤4.2计算每个点与质心的距离
即对于Pi点,用下述公式计算
Figure BDA0002676687190000121
Figure BDA0002676687190000122
Figure BDA0002676687190000123
Figure BDA0002676687190000124
Figure BDA0002676687190000125
步骤4.3排序
将Li1质-Li5质由小到大排序,取排序后第一个数值对应的集合作为Pi点的集合。例如排序完成后Li2质的数值最小,那么Pi点就作为第二集合的元素。
步骤4.4计算集合质心
对上述每个集合用下述公式计算集合质心
Figure BDA0002676687190000126
Figure BDA0002676687190000131
其中j是集合中元素的个数。
例如通过步骤4.3中的计算,得到第四个集合共有3个元素,分别是P6、P7和P9
那么第四个集合新的质心就是
Figure BDA0002676687190000132
其中u是步骤4.1中得到的数据矩阵S″的行的个数。
步骤4.5判断是否收敛
当第一次执行时,直接重复执行步骤4.2-4.4,
当第二次以上执行时,判断相邻两次迭代中每个集合中的元素是否相同,若相同判断结果收敛,执行步骤5,若结果不收敛直接重复执行步骤4.2-4.5。
步骤5:提取关键信息
对每个集合中的元素均计算该元素与最新更新的质心之间的距离,该距离称为元素-质心距,具体计算方法与步骤4.2中的计算方法类似。将该集合中所有元素-质心距累加得到总元素-质心距,用总元素-质心距除以元素个数得到第一阈值A1,元素-质心距最大值的0.75倍为第二阈值A2。
例如某个集合的元素值共有6个,那么该集合中可以得到6个元素-质心距,分别记为e1-e6,那么(e1+e6)/6的结果即为A1,假设e4是e1-e6中数值最大的元素-质心距,那么0.75e4即为A2。
上述每个集合都有各自特点,通过对集合内数据分析可以很容易的判断出该集合的特征,例如电网正常运行,电网因天气原因造成损害,电网因季节性用电高峰造成电网异常等。这些特征作为集合的特征。
步骤6:新数据预测
当接收到新数据时,用步骤3的方法对数据进行归一化,然后分别计算新收到数据与每个集合质心的距离。因为一共5个集合,因此得到5个距离,然后做下述判断
当只有1个距离在第一阈值A1内时,判定该新数据属于该集合,将该集合特征输出;
当有1个以上距离在第一阈值A1内时,该新数据需人工判断;
当没有距离在第一阈值A1内,且只有1个距离在第二阈值A2以内时,判定该新数据属于该集合,将该集合特征输出;
当没有距离在第一阈值A1内,且有1个以上距离在第二阈值A2内时,则以距离长短为判断依据,即与哪个质心距离短,就该新数据属于该集合,将该集合特征输出;
当没有距离在第一阈值A1内,且没有距离在第二阈值A2内时,该新数据需人工判断。
如果判定结果为属于某个集合,则输出该集合特征;如果判定结果为需要人工判断,则输出该组数据。
步骤7:根据分类结果,做提前预处理
同一类事件具有类似的影响,其应对措施也是类似的,例如如果归类后的某一类数据与天气关系紧密,特别是与下雪,冻雨等天气情况有密切关系,则提前加热融冰,准备御寒,准备融冰材料等;如果归类后某类数据与台风或偶发大风相关,那么加固电网相关设备,增派巡查人员就是可选择的预处理方案;类似的其他类型的气候情况,也能够在现有技术中找到相对应的预处理方法,此处就不赘述了。

Claims (10)

1.一种基于大数据的电网事故预测方法,其特征在于,包括下述步骤:
步骤1:大数据采集
输入大数据,
步骤2:大数据清洗
去除人为因素造成的电网运行异常,
经过数据清洗的数据矩阵记为S’;
步骤3:大数据归一化
对步骤2得到数据矩阵S’进行归一化;
步骤4:数据分类
计算执信并判断有效性;
步骤5:提取关键信息
根据阈值提取关键信息;
步骤6:新数据预测
用提取的关键信息进行新数据预测;
步骤7:根据分类结果,做提前预处理
根据事件所属类别特点,采取对应的预处理方案。
2.如权利要求1所述的一种基于大数据的电网事故预测方法,其特征在于:所述的步骤1包括,
输入的数据包括电网的负荷、用电量、天气情况、用户信息、电网运行情况,输入的数据以时间为依据进行整理,即相同时间点的数据作为一组,假设共有n个时间点的数据,共有m个输入参数,则可以得到数据矩阵S;
Figure FDA0002676687180000021
其中第一列对应电网负荷数据,第二列对应用电量数据,第三列对应天气情况,依次类推;
其中电网负荷、用电量均为直接采集的数据,天气情况为气象部门给出的数据,用户信息为电网管理部门的基础数据,电网运行情况只有两种情况,正常运行时为“1”,不正常运行时为“0”;该列用于后续快速剔除污染数据;
所述的同时间信息指的是在数据矩阵S中,同一行的数据应为同一时间点的数据,时间间隔根据需要可以为:周、天、小时或15分钟。
3.如权利要求2所述的一种基于大数据的电网事故预测方法,其特征在于:所述的步骤1包括,在进行大数据采集的时候,为了更加准确的采集数据,有些参数能够扩展为更详细的数据。
4.如权利要求3所述的一种基于大数据的电网事故预测方法,其特征在于:所述的步骤1包括,
在某些时刻需要输入的数据并不能直接得到,此时用近似的方式解决。
5.如权利要求4所述的一种基于大数据的电网事故预测方法,其特征在于:所述的步骤1中的近似的方式包括下述内容,
如果采样时间点与气象部门预报的时间点不重合时,选取采样时间点前后相邻时间点的温度数据,用该两组数据拟合直线,然后将采样时间点带入拟合的直线,求得所需的温度数据,该温度数据作为数据矩阵S相应元素的值。
6.如权利要求1所述的一种基于大数据的电网事故预测方法,其特征在于:所述的步骤2包括
查找步骤1中电网运行情况显示结果为“0”的行的时间点,以时间点为索引在电力档案中查找电网运行情况异常的处理报告;根据报告内容,判断造成电网运行情况异常的原因是否是人为因素;所述的人为因素是指完全是因为人的因素造成的结果,
如果判断结果是人为因素造成的电网运行情况异常,那么直接删除数据矩阵S中的相应行,否则不做处理。
7.如权利要求1所述的一种基于大数据的电网事故预测方法,其特征在于:所述的步骤3包括
数据归一化对列数据进行,同列数据用相同归一化方法进行归一化,不同列数据可以采用相同归一化方法,也可以采用不同归一化方法,归一化后得到的数据矩阵记为S”,数据矩阵S”中的每个元素的值均在0-1之间;
所述的归一化方法可以采用任意现有技术中的归一化方法,也可以采用本申请的下述方法进行
对于同列元素,归一化后的元素a”用下述公式计算
Figure FDA0002676687180000031
其中a’i是数据矩阵S’中的元素,a’min是a’i所在列中值最小的元素,a’max是a’i所在列中值最大的元素,| |为取绝对值。
8.如权利要求1所述的一种基于大数据的电网事故预测方法,其特征在于:所述的步骤4包括
步骤4.1取前5行数据
在数据矩阵S”中取前5行数据,分别记为点
P1(a”11,a”12,…,a”1m),
P2(a”21,a”22,…,a”2m),
P3(a”31,a”32,…,a”3m),
P4(a”41,a”42,…,a”4m),
P5(a”51,a”52,…,a”5m);
该5个点设为初始质心,此时上述5个点的坐标分别记为
P1质(a”11质,a”12质,…,a”1m质),
P2质(a”21质,a”22质,…,a”2m质),
P3质(a”31质,a”32质,…,a”3m质),
P4质(a”41质,a”42质,…,a”4m质),
P5质(a”51质,a”52质,…,a”5m质);
对于数据矩阵S”中的其他行数据,也将其看成点,
即Pi(a”i1,a”i2,…,a”im),数据矩阵S”共可为u=n-e个点,其中n是步骤1输入的时间点的个数,e是步骤2中数据清洗时去掉行的个数;
步骤4.2计算每个点与质心的距离
即对于Pi点,用下述公式计算
Figure FDA0002676687180000051
Figure FDA0002676687180000052
Figure FDA0002676687180000053
Figure FDA0002676687180000054
Figure FDA0002676687180000055
步骤4.3排序
将Li1质-Li5质由小到大排序,取排序后第一个数值对应的集合作为Pi点的集合;
步骤4.4计算集合质心
对上述每个集合用下述公式计算集合质心
Figure FDA0002676687180000056
Figure FDA0002676687180000057
Figure FDA0002676687180000058
其中j是集合中元素的个数;
步骤4.5判断是否收敛
当第一次执行时,直接重复执行步骤4.2-4.4,
当第二次以上执行时,判断相邻两次迭代中每个集合中的元素是否相同,若相同判断结果收敛,执行步骤5,若结果不收敛直接重复执行步骤4.2-4.5。
9.如权利要求1所述的一种基于大数据的电网事故预测方法,其特征在于:所述的步骤5包括,
对每个集合中的元素均计算该元素与最新更新的质心之间的距离,该距离称为元素-质心距,具体计算方法与步骤4.2中的计算方法类似;将该集合中所有元素-质心距累加得到总元素-质心距,用总元素-质心距除以元素个数得到第一阈值A1,元素-质心距最大值的0.75倍为第二阈值A2。
10.如权利要求1所述的一种基于大数据的电网事故预测方法,其特征在于:所述的步骤6包括,
当接收到新数据时,用步骤3的方法对数据进行归一化,然后分别计算新收到数据与每个集合质心的距离;因为一共5个集合,因此得到5个距离,然后做下述判断
当只有1个距离在第一阈值A1内时,判定该新数据属于该集合,将该集合特征输出;
当有1个以上距离在第一阈值A1内时,该新数据需人工判断;
当没有距离在第一阈值A1内,且只有1个距离在第二阈值A2以内时,判定该新数据属于该集合,将该集合特征输出;
当没有距离在第一阈值A1内,且有1个以上距离在第二阈值A2内时,则以距离长短为判断依据,即与哪个质心距离短,就该新数据属于该集合,将该集合特征输出;
当没有距离在第一阈值A1内,且没有距离在第二阈值A2内时,该新数据需人工判断;
如果判定结果为属于某个集合,则输出该集合特征;如果判定结果为需要人工判断,则输出该组数据。
CN202010950334.0A 2020-09-11 2020-09-11 一种基于大数据的电网事故预测方法 Active CN112115180B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010950334.0A CN112115180B (zh) 2020-09-11 2020-09-11 一种基于大数据的电网事故预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010950334.0A CN112115180B (zh) 2020-09-11 2020-09-11 一种基于大数据的电网事故预测方法

Publications (2)

Publication Number Publication Date
CN112115180A true CN112115180A (zh) 2020-12-22
CN112115180B CN112115180B (zh) 2021-09-14

Family

ID=73802474

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010950334.0A Active CN112115180B (zh) 2020-09-11 2020-09-11 一种基于大数据的电网事故预测方法

Country Status (1)

Country Link
CN (1) CN112115180B (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915347A (zh) * 2012-09-26 2013-02-06 中国信息安全测评中心 一种分布式数据流聚类方法及系统
CN106203805A (zh) * 2016-06-30 2016-12-07 中国农业大学 一种有源配电网概率可靠性估计方法及装置
CN108846555A (zh) * 2018-05-24 2018-11-20 四川大学 一种电力负荷大数据缺失值的高效精确填补法
CN109460004A (zh) * 2018-10-26 2019-03-12 国网天津市电力公司 基于大数据的配电网故障预测方法及系统
CN109492002A (zh) * 2018-10-19 2019-03-19 浙江大学华南工业技术研究院 一种智能电网大数据存储与分析系统及处理方法
CN109685567A (zh) * 2018-12-20 2019-04-26 长沙理工大学 一种基于卷积神经网络和模糊聚类的用电客户画像新方法
CN109828182A (zh) * 2018-11-29 2019-05-31 广东电网有限责任公司信息中心 一种基于故障分类处理的电网系统故障分析预警方法
CN110070202A (zh) * 2019-02-19 2019-07-30 浙江华云信息科技有限公司 一种通过用电量数据预测经济产出的方法
CN110378492A (zh) * 2019-05-28 2019-10-25 长春电力设计有限公司 一种加强配网设备运维管控的方法
CN110555144A (zh) * 2019-09-06 2019-12-10 北京奇艺世纪科技有限公司 一种流聚类的方法、装置、电子设备及介质
CN110750524A (zh) * 2019-09-12 2020-02-04 中国电力科学研究院有限公司 一种有源配电网故障特征的确定方法及系统
CN110824270A (zh) * 2019-10-09 2020-02-21 中国电力科学研究院有限公司 结合台区线损和异常事件的窃电用户辨识方法及装置
CN111429034A (zh) * 2020-04-21 2020-07-17 国网信通亿力科技有限责任公司 一种配电网故障预测的方法
CN111563524A (zh) * 2020-03-18 2020-08-21 宁波送变电建设有限公司永耀科技分公司 一种多站融合系统运行态势异常监测和告警合并方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915347A (zh) * 2012-09-26 2013-02-06 中国信息安全测评中心 一种分布式数据流聚类方法及系统
CN106203805A (zh) * 2016-06-30 2016-12-07 中国农业大学 一种有源配电网概率可靠性估计方法及装置
CN108846555A (zh) * 2018-05-24 2018-11-20 四川大学 一种电力负荷大数据缺失值的高效精确填补法
CN109492002A (zh) * 2018-10-19 2019-03-19 浙江大学华南工业技术研究院 一种智能电网大数据存储与分析系统及处理方法
CN109460004A (zh) * 2018-10-26 2019-03-12 国网天津市电力公司 基于大数据的配电网故障预测方法及系统
CN109828182A (zh) * 2018-11-29 2019-05-31 广东电网有限责任公司信息中心 一种基于故障分类处理的电网系统故障分析预警方法
CN109685567A (zh) * 2018-12-20 2019-04-26 长沙理工大学 一种基于卷积神经网络和模糊聚类的用电客户画像新方法
CN110070202A (zh) * 2019-02-19 2019-07-30 浙江华云信息科技有限公司 一种通过用电量数据预测经济产出的方法
CN110378492A (zh) * 2019-05-28 2019-10-25 长春电力设计有限公司 一种加强配网设备运维管控的方法
CN110555144A (zh) * 2019-09-06 2019-12-10 北京奇艺世纪科技有限公司 一种流聚类的方法、装置、电子设备及介质
CN110750524A (zh) * 2019-09-12 2020-02-04 中国电力科学研究院有限公司 一种有源配电网故障特征的确定方法及系统
CN110824270A (zh) * 2019-10-09 2020-02-21 中国电力科学研究院有限公司 结合台区线损和异常事件的窃电用户辨识方法及装置
CN111563524A (zh) * 2020-03-18 2020-08-21 宁波送变电建设有限公司永耀科技分公司 一种多站融合系统运行态势异常监测和告警合并方法
CN111429034A (zh) * 2020-04-21 2020-07-17 国网信通亿力科技有限责任公司 一种配电网故障预测的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蔡立志等: "《大数据测评》", 31 January 2015 *

Also Published As

Publication number Publication date
CN112115180B (zh) 2021-09-14

Similar Documents

Publication Publication Date Title
CN108376262A (zh) 一种风电出力典型特性的分析模型构建方法
CN103853106A (zh) 一种建筑能源供应设备的能耗预测参数优化方法
CN112749904A (zh) 基于深度学习的配电网故障风险预警方法及系统
CN113496311A (zh) 光伏电站发电功率预测方法及系统
CN115829105A (zh) 基于历史数据特征搜索的光伏功率预测方法
Cui et al. Algorithm for identifying wind power ramp events via novel improved dynamic swinging door
CN105095668B (zh) 基于亚洲极涡因子的电网覆冰长期预报方法
CN111461921A (zh) 一种基于机器学习的负荷建模典型用户数据库更新方法
CN105303268A (zh) 基于相似度理论的风力发电输出功率预测方法
CN114386753A (zh) 一种基于主变负载状况的设备风险综合分析预警方法
CN114882373A (zh) 基于深度神经网络的多特征融合沙尘暴预测方法
Meng et al. A new PV generation power prediction model based on GA-BP neural network with artificial classification of history day
CN104298706A (zh) 一种基于数据挖掘的输电杆塔塔材实际强度计算方法
CN112115180B (zh) 一种基于大数据的电网事故预测方法
CN116050666B (zh) 一种辐照特征聚类的光伏发电功率预测方法
CN112132344A (zh) 一种基于相似日和frs-svm的短期风电功率预测方法
CN111126645A (zh) 一种基于数据挖掘技术和改进支持向量机的风电预测算法
CN103473461B (zh) 基于数据特征提取的风功率预测误差估计方法
CN105021888A (zh) 基于数据聚类的谐波数据监测方法
CN112949938B (zh) 改善训练样本类别不均衡的风电爬坡事件直接预报方法
Wu et al. Research on 72-hour thunderstorm prediction method for UHV transmission line based on BPNN
Tuo et al. Research on Feature Extraction Method for Electric Vehicle Load Demand Response Based on Cross Correlation Analysis
CN113409149A (zh) 一种基于发电量预测的光伏电站投融资决策方法及装置
Huang et al. Research on distributed photovoltaic power prediction based on centralized photovoltaic output
CN117973180A (zh) 复杂混联电网雷害风险评估简化模型的构建方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant