CN112115180B - 一种基于大数据的电网事故预测方法 - Google Patents
一种基于大数据的电网事故预测方法 Download PDFInfo
- Publication number
- CN112115180B CN112115180B CN202010950334.0A CN202010950334A CN112115180B CN 112115180 B CN112115180 B CN 112115180B CN 202010950334 A CN202010950334 A CN 202010950334A CN 112115180 B CN112115180 B CN 112115180B
- Authority
- CN
- China
- Prior art keywords
- data
- power grid
- distance
- big data
- centroid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 239000011159 matrix material Substances 0.000 claims abstract description 41
- 241000282414 Homo sapiens Species 0.000 claims abstract description 20
- 238000004364 calculation method Methods 0.000 claims abstract description 8
- 238000004140 cleaning Methods 0.000 claims abstract description 7
- 238000010606 normalization Methods 0.000 claims description 23
- 239000013612 plasmid Substances 0.000 claims description 15
- 230000002159 abnormal effect Effects 0.000 claims description 11
- 238000005070 sampling Methods 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000013480 data collection Methods 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 238000005406 washing Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 2
- 238000010248 power generation Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000001932 seasonal effect Effects 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 230000000246 remedial effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- Computational Linguistics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于预测方法,具体涉及一种基于大数据的电网事故预测方法。一种基于大数据的电网事故预测方法,其中,包括下述步骤:步骤1:大数据采集;输入大数据,步骤2:大数据清洗;去除人为因素造成的电网运行异常,经过数据清洗的数据矩阵记为S’;步骤3:大数据归一化;对步骤2得到数据矩阵S’进行归一化;步骤4:数据分类;计算执信并判断有效性;步骤5:提取关键信息;根据阈值提取关键信息;步骤6:新数据预测;用提取的关键信息进行新数据预测。本发明的显著效果是:本发明将产生电网事故的原因分为若干类,分别对各类内容进行大数据统计计算,用计算结果预测本类事件发生的可能性,实现了基于大数据的电网事故预测。
Description
技术领域
本发明属于预测方法,具体涉及一种基于大数据的电网事故预测方法。
背景技术
电网在现代工业社会中处于核心地位,电力对于工业来说就像血液对于人体的地位。为了保证电力的有效供应,国家兴建了从国家到地方的一系列电网。电网中既有燃煤发电、核电、风电、太阳能发电等发电厂,也有普通用户、工业用户等用电单元,还有输电线、变压器等电力传输设备。虽然电力部门尽力的做好相关保障工作,但是电网中仍存在电压不稳,谐波干扰,频率波动等电网污染问题。造成电网污染的问题归结起来大致包含以下几种情况:(1)最终用户用电量突变,例如突然有大型用电设备启动;(2)季节性用电高峰,例如夏天几乎家家都开空调;(3)突发自然灾害,例如大风,雨雪,闪电造成线路损坏;(4)人为造成的意外,例如因其他原因施工意外损坏电网等。
现有技术几乎都是发生电网污染或事故时采取补救措施,而没有很好的对未来可能发生的意外进行预测。
发明内容
本发明针对现有技术的缺陷,提供一种基于大数据的电网事故预测方法。
本发明是这样实现的:一种基于大数据的电网事故预测方法,其中,包括下述步骤:
步骤1:大数据采集
输入大数据,
步骤2:大数据清洗
去除人为因素造成的电网运行异常,
经过数据清洗的数据矩阵记为S’;
步骤3:大数据归一化
对步骤2得到数据矩阵S’进行归一化;
步骤4:数据分类
计算执信并判断有效性;
步骤5:提取关键信息
根据阈值提取关键信息;
步骤6:新数据预测
用提取的关键信息进行新数据预测;
步骤7:根据分类结果,做提前预处理
根据事件所属类别特点,采取对应的预处理方案。
如上所述的一种基于大数据的电网事故预测方法,其中,所述的步骤1包括,
输入的数据包括电网的负荷、用电量、天气情况、用户信息、电网运行情况,输入的数据以时间为依据进行整理,即相同时间点的数据作为一组,假设共有n个时间点的数据,共有m个输入参数,则可以得到数据矩阵S;
其中第一列对应电网负荷数据,第二列对应用电量数据,第三列对应天气情况,依次类推;
其中电网负荷、用电量均为直接采集的数据,天气情况为气象部门给出的数据,用户信息为电网管理部门的基础数据,电网运行情况只有两种情况,正常运行时为“1”,不正常运行时为“0”;该列用于后续快速剔除污染数据;
所述的同时间信息指的是在数据矩阵S中,同一行的数据应为同一时间点的数据,时间间隔根据需要可以为:周、天、小时或15分钟。
如上所述的一种基于大数据的电网事故预测方法,其中,所述的步骤1包括,在进行大数据采集的时候,为了更加准确的采集数据,有些参数能够扩展为更详细的数据。
如上所述的一种基于大数据的电网事故预测方法,其中,所述的步骤1包括,
在某些时刻需要输入的数据并不能直接得到,此时用近似的方式解决。
如上所述的一种基于大数据的电网事故预测方法,其中,所述的步骤1中的近似的方式包括下述内容,
如果采样时间点与气象部门预报的时间点不重合时,选取采样时间点前后相邻时间点的温度数据,用该两组数据拟合直线,然后将采样时间点带入拟合的直线,求得所需的温度数据,该温度数据作为数据矩阵S相应元素的值。
如上所述的一种基于大数据的电网事故预测方法,其中,所述的步骤2包括
查找步骤1中电网运行情况显示结果为“0”的行的时间点,以时间点为索引在电力档案中查找电网运行情况异常的处理报告;根据报告内容,判断造成电网运行情况异常的原因是否是人为因素;所述的人为因素是指完全是因为人的因素造成的结果,
如果判断结果是人为因素造成的电网运行情况异常,那么直接删除数据矩阵S中的相应行,否则不做处理。
如上所述的一种基于大数据的电网事故预测方法,其中,所述的步骤3包括
数据归一化对列数据进行,同列数据用相同归一化方法进行归一化,不同列数据可以采用相同归一化方法,也可以采用不同归一化方法,归一化后得到的数据矩阵记为S”,数据矩阵S”中的每个元素的值均在0-1之间;
所述的归一化方法可以采用任意现有技术中的归一化方法,也可以采用本申请的下述方法进行
对于同列元素,归一化后的元素a”用下述公式计算
其中a′i是数据矩阵S’中的元素,a′min是a′i所在列中值最小的元素,a′max是a′i所在列中值最大的元素,||为取绝对值。
如上所述的一种基于大数据的电网事故预测方法,其中,所述的步骤4包括
步骤4.1取前5行数据
在数据矩阵S”中取前5行数据,分别记为点
P1(a″11,a″12,…,a″1m),
P2(a″21,a″22,…,a″2m),
P3(a″31,a″32,…,a″3m),
P4(a″41,a″42,…,a″4m),
P5(a″51,a″52,…,a″5m);
该5个点设为初始质心,此时上述5个点的坐标分别记为
P1质(a″11质,a″12质,…,a″1m质),
P2质(a″21质,a″22质,…,a″2m质),
P3质(a″31质,a″32质,…,a″3m质),
P4质(a″41质,a″42质,…,a″4m质),
P5质(a″51质,a″52质,…,a″5m质);
对于数据矩阵S”中的其他行数据,也将其看成点,
即Pi(a″i1,a″i2,…,a″im),数据矩阵S”共可为u=n-e个点,其中n是步骤1输入的时间点的个数,e是步骤2中数据清洗时去掉行的个数;
步骤4.2计算每个点与质心的距离
即对于Pi点,用下述公式计算
步骤4.3排序
将Li1质-Li5质由小到大排序,取排序后第一个数值对应的集合作为Pi点的集合;
步骤4.4计算集合质心
对上述每个集合用下述公式计算集合质心
其中j是集合中元素的个数;
步骤4.5判断是否收敛
当第一次执行时,直接重复执行步骤4.2-4.4,
当第二次以上执行时,判断相邻两次迭代中每个集合中的元素是否相同,若相同判断结果收敛,执行步骤5,若结果不收敛直接重复执行步骤4.2-4.5。
如上所述的一种基于大数据的电网事故预测方法,其中,所述的步骤5包括,
对每个集合中的元素均计算该元素与最新更新的质心之间的距离,该距离称为元素-质心距,具体计算方法与步骤4.2中的计算方法类似;将该集合中所有元素-质心距累加得到总元素-质心距,用总元素-质心距除以元素个数得到第一阈值A1,元素-质心距最大值的0.75倍为第二阈值A2。
如上所述的一种基于大数据的电网事故预测方法,其中,所述的步骤6包括,
当接收到新数据时,用步骤3的方法对数据进行归一化,然后分别计算新收到数据与每个集合质心的距离;因为一共5个集合,因此得到5个距离,然后做下述判断
当只有1个距离在第一阈值A1内时,判定该新数据属于该集合,将该集合特征输出;
当有1个以上距离在第一阈值A1内时,该新数据需人工判断;
当没有距离在第一阈值A1内,且只有1个距离在第二阈值A2以内时,判定该新数据属于该集合,将该集合特征输出;
当没有距离在第一阈值A1内,且有1个以上距离在第二阈值A2内时,则以距离长短为判断依据,即与哪个质心距离短,就该新数据属于该集合,将该集合特征输出;
当没有距离在第一阈值A1内,且没有距离在第二阈值A2内时,该新数据需人工判断;
如果判定结果为属于某个集合,则输出该集合特征;如果判定结果为需要人工判断,则输出该组数据。
本发明的显著效果是:本发明将产生电网事故的原因分为若干类,分别对各类内容进行大数据统计计算,用计算结果预测本类事件发生的可能性,实现了基于大数据的电网事故预测。
具体实施方式
一种基于大数据的电网事故预测方法,包括下述步骤:
步骤1:大数据采集
输入大数据,输入的数据包括电网的负荷、用电量、天气情况、用户信息、电网运行情况,输入的数据以时间为依据进行整理,即相同时间点的数据作为一组,假设共有n个时间点的数据,共有m个输入参数,则可以得到数据矩阵S
其中第一列对应电网负荷数据,第二列对应用电量数据,第三列对应天气情况,依次类推。
在进行大数据采集的时候,为了更加准确的采集数据,有些参数可以扩展为更详细的数据,例如天气情况可以扩展为温度、湿度、风力、风向等,当然如果处理数据的系统运算能力不足,也可以根据需要简化参数,例如只保留湿度,或者只保留湿度和风力。又如用户信息可以简化为电网中的用户数量,也可以扩展为电网中用户的数量及每户的用电量,此时只需要根据用户数量增加矩阵的列数,并在增加的每列中填写对应用户的用电量即可。
其中电网负荷、用电量均为直接采集的数据,天气情况为气象部门给出的数据,用户信息为电网管理部门的基础数据,电网运行情况只有两种情况,正常运行时为“1”,不正常运行时为“0”。该列用于后续快速剔除污染数据。
所述的同时间信息指的是在数据矩阵S中,同一行的数据应为同一时间点的数据,时间间隔根据需要可以为:周、天、小时和15分钟。在某些时刻上述数据并不能直接得到,此时用近似的方式解决。例如当时间间隔为15分钟时,天气情况和用户信息并不会每15分钟更新一次,此时用采样时间点前和采样时间点后最接近的数据做线性函数,求得该时间点的数据。
例如以天气情况的温度为例,气象部门职能给出每小时的温度数据,如果采样时间点与气象部门预报的时间点不重合时,选取采样时间点前后相邻时间点的温度数据,用该两组数据拟合直线,然后将采样时间点带入拟合的直线,求得所需的温度数据,该温度数据作为数据矩阵S相应元素的值。
步骤2:大数据清洗
查找步骤1中电网运行情况显示结果为“0”的行的时间点,以时间点为索引在电力档案中查找电网运行情况异常的处理报告。根据报告内容,判断造成电网运行情况异常的原因是否是人为因素。所述的人为因素是指完全是因为人的因素造成的结果,例如因施工意外造成电网损伤,因私搭乱建造成的电网损伤,因偷电造成的电网损伤等。
如果判断结果是人为因素造成的电网运行情况异常,那么直接删除数据矩阵S中的相应行,否则不做处理。
之所以删除因人为因素造成的损伤,是因为人为因素是完全随机的,其原因通过已有的历史数据归纳总结出规律,因此无法预测。而非人为因素,例如因为天气原因造成的电网损伤,损害本身与天气情况具有一定的相关性,因此可以根据天气情况进行一定程度的预测。其他非人为因素也具有可预测性,因而保留。
经过数据清洗的数据矩阵记为S’
步骤3:大数据归一化
对步骤2得到数据矩阵S’进行归一化。
数据归一化对列数据进行,同列数据用相同归一化方法进行归一化,不同列数据可以采用相同归一化方法,也可以采用不同归一化方法,归一化后得到的数据矩阵记为S”,数据矩阵S”中的每个元素的值均在0-1之间。
所述的归一化方法可以采用任意现有技术中的归一化方法,也可以采用本申请的下述方法进行
对于同列元素,归一化后的元素a”用下述公式计算
其中a′i是数据矩阵S’中的元素,a′min是a′i所在列中值最小的元素,a′max是a′i所在列中值最大的元素,||为取绝对值。
步骤4:数据分类
步骤4.1取前5行数据
在数据矩阵S”中取前5行数据,分别记为点
P1(a″11,a″12,…,a″1m),
P2(a″21,a″22,…,a″2m),
P3(a″31,a″32,…,a″3m),
P4(a″41,a″42,…,a″4m),
P5(a″51,a″52,…,a″5m)。
该5个点设为初始质心,此时上述5个点的坐标分别记为
P1质(a″11质,a″12质,…,a″1m质),
P2质(a″21质,a″22质,…,a″2m质),
P3质(a″31质,a″32质,…,a″3m质),
P4质(a″41质,a″42质,…,a″4m质),
P5质(a″51质,a″52质,…,a″5m质)。
对于数据矩阵S”中的其他行数据,也将其看成点,
即Pi(a″i1,a″i2,…,a″im),数据矩阵S”共可为u=n-e个点,其中n是步骤1输入的时间点的个数,e是步骤2中数据清洗时去掉行的个数。
步骤4.2计算每个点与质心的距离
即对于Pi点,用下述公式计算
步骤4.3排序
将Li1质-Li5质由小到大排序,取排序后第一个数值对应的集合作为Pi点的集合。例如排序完成后Li2质的数值最小,那么Pi点就作为第二集合的元素。
步骤4.4计算集合质心
对上述每个集合用下述公式计算集合质心
其中j是集合中元素的个数。
例如通过步骤4.3中的计算,得到第四个集合共有3个元素,分别是P6、P7和P9
那么第四个集合新的质心就是
其中u是步骤4.1中得到的数据矩阵S”的行的个数。
步骤4.5判断是否收敛
当第一次执行时,直接重复执行步骤4.2-4.4,
当第二次以上执行时,判断相邻两次迭代中每个集合中的元素是否相同,若相同判断结果收敛,执行步骤5,若结果不收敛直接重复执行步骤4.2-4.5。
步骤5:提取关键信息
对每个集合中的元素均计算该元素与最新更新的质心之间的距离,该距离称为元素-质心距,具体计算方法与步骤4.2中的计算方法类似。将该集合中所有元素-质心距累加得到总元素-质心距,用总元素-质心距除以元素个数得到第一阈值A1,元素-质心距最大值的0.75倍为第二阈值A2。
例如某个集合的元素值共有6个,那么该集合中可以得到6个元素-质心距,分别记为e1-e6,那么(e1+e6)/6的结果即为A1,假设e4是e1-e6中数值最大的元素-质心距,那么0.75e4即为A2。
上述每个集合都有各自特点,通过对集合内数据分析可以很容易的判断出该集合的特征,例如电网正常运行,电网因天气原因造成损害,电网因季节性用电高峰造成电网异常等。这些特征作为集合的特征。
步骤6:新数据预测
当接收到新数据时,用步骤3的方法对数据进行归一化,然后分别计算新收到数据与每个集合质心的距离。因为一共5个集合,因此得到5个距离,然后做下述判断
当只有1个距离在第一阈值A1内时,判定该新数据属于该集合,将该集合特征输出;
当有1个以上距离在第一阈值A1内时,该新数据需人工判断;
当没有距离在第一阈值A1内,且只有1个距离在第二阈值A2以内时,判定该新数据属于该集合,将该集合特征输出;
当没有距离在第一阈值A1内,且有1个以上距离在第二阈值A2内时,则以距离长短为判断依据,即与哪个质心距离短,就该新数据属于该集合,将该集合特征输出;
当没有距离在第一阈值A1内,且没有距离在第二阈值A2内时,该新数据需人工判断。
如果判定结果为属于某个集合,则输出该集合特征;如果判定结果为需要人工判断,则输出该组数据。
步骤7:根据分类结果,做提前预处理
同一类事件具有类似的影响,其应对措施也是类似的,例如如果归类后的某一类数据与天气关系紧密,特别是与下雪,冻雨等天气情况有密切关系,则提前加热融冰,准备御寒,准备融冰材料等;如果归类后某类数据与台风或偶发大风相关,那么加固电网相关设备,增派巡查人员就是可选择的预处理方案;类似的其他类型的气候情况,也能够在现有技术中找到相对应的预处理方法,此处就不赘述了。
Claims (6)
1.一种基于大数据的电网事故预测方法,其特征在于,包括下述步骤:
步骤1:大数据采集
输入大数据,
步骤2:大数据清洗
去除人为因素造成的电网运行异常,
经过数据清洗的数据矩阵记为S′;
步骤3:大数据归一化
对步骤2得到数据矩阵S′进行归一化;
步骤4:数据分类
计算质心并判断有效性;
步骤5:提取关键信息
根据阈值提取关键信息;
步骤6:新数据预测
用提取的关键信息进行新数据预测;
步骤7:根据分类结果,做提前预处理
根据事件所属类别特点,采取对应的预处理方案;
所述的步骤1包括,
输入的数据包括电网的负荷、用电量、天气情况、用户信息、电网运行情况,输入的数据以时间为依据进行整理,即相同时间点的数据作为一组,假设共有n个时间点的数据,共有m个输入参数,则可以得到数据矩阵S;
其中第一列对应电网负荷数据,第二列对应用电量数据,第三列对应天气情况,依次类推;
其中电网负荷、用电量均为直接采集的数据,天气情况为气象部门给出的数据,用户信息为电网管理部门的基础数据,电网运行情况只有两种情况,正常运行时为“1”,不正常运行时为“0”;该列用于后续剔除污染数据;
所述的同时间信息指的是在数据矩阵S中,同一行的数据应为同一时间点的数据,时间间隔根据需要可以为:周、天、小时或15分钟;
所述的步骤5包括,
对每个集合中的元素均计算该元素与最新更新的质心之间的距离,该距离称为元素-质心距,具体计算方法与步骤4.2中的计算方法类似;将该集合中所有元素-质心距累加得到总元素-质心距,用总元素-质心距除以元素个数得到第一阈值A1,元素-质心距最大值的0.75倍为第二阈值A2;
所述的步骤6包括,
当接收到新数据时,用步骤3的方法对数据进行归一化,然后分别计算新收到数据与每个集合质心的距离;因为一共5个集合,因此得到5个距离,然后做下述判断
当只有1个距离在第一阈值A1内时,判定该新数据属于该集合,将该集合特征输出;
当有1个以上距离在第一阈值A1内时,该新数据需人工判断;
当没有距离在第一阈值A1内,且只有1个距离在第二阈值A2以内时,判定该新数据属于该集合,将该集合特征输出;
当没有距离在第一阈值A1内,且有1个以上距离在第二阈值A2内时,则以距离长短为判断依据,即与哪个质心距离短,就该新数据属于该集合,将该集合特征输出;
当没有距离在第一阈值A1内,且没有距离在第二阈值A2内时,该新数据需人工判断;
如果判定结果为属于某个集合,则输出该集合特征;如果判定结果为需要人工判断,则输出该数据;
所述的步骤4包括
步骤4.1取前5行数据
在数据矩阵S″中取前5行数据,分别记为点
P1(a″11,a″12,…,a″1m),
P2(a″21,a″22,…,a″2m),
P3(a″31,a″32,…,a″3m),
P4(a″41,a″42,…,a″4m),
P5(a″51,a″52,…,a″5m);
该5个点设为初始质心,此时上述5个点的坐标分别记为
P1质(a″11质,a″12质,…,a″1m质),
P2质(a″21质,a″22质,…,a″2m质),
P3质(a″31质,a″32质,…,a″3m质),
P4质(a″41质,a″42质,…,a″4m质),
P5质(a″51质,a″52质,…,a″5m质);
对于数据矩阵S″中的其他行数据,也将其看成点,
即Pi(a″i1,a″i2,…,a″im),数据矩阵S″共可为u=n-e个点,其中n是步骤1输入的时间点的个数,e是步骤2中数据清洗时去掉行的个数;
步骤4.2计算每个点与质心的距离
即对于Pi点,用下述公式计算
步骤4.3排序
将Li1质-Li5质由小到大排序,取排序后第一个数值对应的集合作为Pi点的集合;
步骤4.4计算集合质心
对上述每个集合用下述公式计算集合质心
……
其中j是集合中元素的个数;
步骤4.5判断是否收敛
当第一次执行时,直接重复执行步骤4.2-4.4,
当第二次以上执行时,判断相邻两次迭代中每个集合中的元素是否相同,若相同判断结果收敛,执行步骤5,若结果不收敛直接重复执行步骤4.2-4.5。
2.如权利要求1所述的一种基于大数据的电网事故预测方法,其特征在于:所述的步骤1包括,在进行大数据采集的时候,为了更加准确的采集数据,有些参数能够扩展为更详细的数据。
3.如权利要求2所述的一种基于大数据的电网事故预测方法,其特征在于:所述的步骤1包括,
在某些时刻需要输入的数据并不能直接得到,此时用近似的方式解决。
4.如权利要求3所述的一种基于大数据的电网事故预测方法,其特征在于:所述的步骤1中的近似的方式包括下述内容,
如果采样时间点与气象部门预报的时间点不重合时,选取采样时间点前后相邻时间点的温度数据,用该两组数据拟合直线,然后将采样时间点带入拟合的直线,求得所需的温度数据,该温度数据作为数据矩阵S相应元素的值。
5.如权利要求4所述的一种基于大数据的电网事故预测方法,其特征在于:所述的步骤2包括
查找步骤1中电网运行情况显示结果为“0”的行的时间点,以时间点为索引在电力档案中查找电网运行情况异常的处理报告;根据报告内容,判断造成电网运行情况异常的原因是否是人为因素;所述的人为因素是指完全是因为人的因素造成的结果,
如果判断结果是人为因素造成的电网运行情况异常,那么直接删除数据矩阵S中的相应行,否则不做处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010950334.0A CN112115180B (zh) | 2020-09-11 | 2020-09-11 | 一种基于大数据的电网事故预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010950334.0A CN112115180B (zh) | 2020-09-11 | 2020-09-11 | 一种基于大数据的电网事故预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112115180A CN112115180A (zh) | 2020-12-22 |
CN112115180B true CN112115180B (zh) | 2021-09-14 |
Family
ID=73802474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010950334.0A Active CN112115180B (zh) | 2020-09-11 | 2020-09-11 | 一种基于大数据的电网事故预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112115180B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106203805A (zh) * | 2016-06-30 | 2016-12-07 | 中国农业大学 | 一种有源配电网概率可靠性估计方法及装置 |
CN108846555A (zh) * | 2018-05-24 | 2018-11-20 | 四川大学 | 一种电力负荷大数据缺失值的高效精确填补法 |
CN110070202A (zh) * | 2019-02-19 | 2019-07-30 | 浙江华云信息科技有限公司 | 一种通过用电量数据预测经济产出的方法 |
CN111429034A (zh) * | 2020-04-21 | 2020-07-17 | 国网信通亿力科技有限责任公司 | 一种配电网故障预测的方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102915347B (zh) * | 2012-09-26 | 2016-10-12 | 中国信息安全测评中心 | 一种分布式数据流聚类方法及系统 |
CN109492002B (zh) * | 2018-10-19 | 2021-03-23 | 浙江大学华南工业技术研究院 | 一种智能电网大数据存储与分析系统及处理方法 |
CN109460004A (zh) * | 2018-10-26 | 2019-03-12 | 国网天津市电力公司 | 基于大数据的配电网故障预测方法及系统 |
CN109828182B (zh) * | 2018-11-29 | 2021-01-19 | 广东电网有限责任公司信息中心 | 一种基于故障分类处理的电网系统故障分析预警方法 |
CN109685567A (zh) * | 2018-12-20 | 2019-04-26 | 长沙理工大学 | 一种基于卷积神经网络和模糊聚类的用电客户画像新方法 |
CN110378492A (zh) * | 2019-05-28 | 2019-10-25 | 长春电力设计有限公司 | 一种加强配网设备运维管控的方法 |
CN110555144A (zh) * | 2019-09-06 | 2019-12-10 | 北京奇艺世纪科技有限公司 | 一种流聚类的方法、装置、电子设备及介质 |
CN110750524A (zh) * | 2019-09-12 | 2020-02-04 | 中国电力科学研究院有限公司 | 一种有源配电网故障特征的确定方法及系统 |
CN110824270B (zh) * | 2019-10-09 | 2022-04-26 | 中国电力科学研究院有限公司 | 结合台区线损和异常事件的窃电用户辨识方法及装置 |
CN111563524A (zh) * | 2020-03-18 | 2020-08-21 | 宁波送变电建设有限公司永耀科技分公司 | 一种多站融合系统运行态势异常监测和告警合并方法 |
-
2020
- 2020-09-11 CN CN202010950334.0A patent/CN112115180B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106203805A (zh) * | 2016-06-30 | 2016-12-07 | 中国农业大学 | 一种有源配电网概率可靠性估计方法及装置 |
CN108846555A (zh) * | 2018-05-24 | 2018-11-20 | 四川大学 | 一种电力负荷大数据缺失值的高效精确填补法 |
CN110070202A (zh) * | 2019-02-19 | 2019-07-30 | 浙江华云信息科技有限公司 | 一种通过用电量数据预测经济产出的方法 |
CN111429034A (zh) * | 2020-04-21 | 2020-07-17 | 国网信通亿力科技有限责任公司 | 一种配电网故障预测的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112115180A (zh) | 2020-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108376262A (zh) | 一种风电出力典型特性的分析模型构建方法 | |
CN113496311A (zh) | 光伏电站发电功率预测方法及系统 | |
CN106845080B (zh) | 基于差异修正的景区旅游气象灾害智能预测方法 | |
CN110334870B (zh) | 基于门控循环单元网络的光伏电站短期功率预测方法 | |
CN116050666B (zh) | 一种辐照特征聚类的光伏发电功率预测方法 | |
CN106919645A (zh) | 复杂地貌大景区的景点气象要素智能精细预测方法 | |
CN111461921A (zh) | 一种基于机器学习的负荷建模典型用户数据库更新方法 | |
CN114386753A (zh) | 一种基于主变负载状况的设备风险综合分析预警方法 | |
CN111179108A (zh) | 用电能耗的预测方法和装置 | |
Meng et al. | A new PV generation power prediction model based on GA-BP neural network with artificial classification of history day | |
CN114882373A (zh) | 基于深度神经网络的多特征融合沙尘暴预测方法 | |
CN112115180B (zh) | 一种基于大数据的电网事故预测方法 | |
CN104298706A (zh) | 一种基于数据挖掘的输电杆塔塔材实际强度计算方法 | |
CN113313403A (zh) | 基于规模化大功率电动汽车充放电的配电网综合评价方法、设备、系统及存储介质 | |
CN116933201A (zh) | 低压充电桩违约用电行为识别的方法和系统 | |
CN112132344A (zh) | 一种基于相似日和frs-svm的短期风电功率预测方法 | |
CN111506636A (zh) | 一种基于自回归和近邻算法的居民用电行为分析的系统及方法 | |
CN116910655A (zh) | 一种基于装置量测数据的智能电能表故障预测方法 | |
CN103473461B (zh) | 基于数据特征提取的风功率预测误差估计方法 | |
CN116142014A (zh) | 一种电动汽车智能充电方法、装置、设备及介质 | |
CN112949938A (zh) | 改善训练样本类别不均衡的风电爬坡事件直接预报方法 | |
CN112529395A (zh) | 一种基于fce和svm融合的输电线路典型冰风灾害分析方法 | |
CN113298298A (zh) | 一种充电桩短期负荷预测方法及其系统 | |
Huang et al. | Research on distributed photovoltaic power prediction based on centralized photovoltaic output | |
CN110826601B (zh) | 基于改进的支持向量机算法的林火预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |