CN107423328A - 大数据电力抢修热点预测系统的构建方法 - Google Patents
大数据电力抢修热点预测系统的构建方法 Download PDFInfo
- Publication number
- CN107423328A CN107423328A CN201710239281.XA CN201710239281A CN107423328A CN 107423328 A CN107423328 A CN 107423328A CN 201710239281 A CN201710239281 A CN 201710239281A CN 107423328 A CN107423328 A CN 107423328A
- Authority
- CN
- China
- Prior art keywords
- analysis
- work order
- data
- electric power
- construction method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 16
- 238000004458 analytical method Methods 0.000 claims abstract description 43
- 238000000034 method Methods 0.000 claims abstract description 36
- 238000010219 correlation analysis Methods 0.000 claims abstract description 8
- 238000010220 Pearson correlation analysis Methods 0.000 claims description 19
- 238000007637 random forest analysis Methods 0.000 claims description 11
- 238000004519 manufacturing process Methods 0.000 claims description 7
- 238000007619 statistical method Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000001543 one-way ANOVA Methods 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000003066 decision tree Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 238000011835 investigation Methods 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 241001269238 Data Species 0.000 description 4
- 210000001520 comb Anatomy 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000007812 deficiency Effects 0.000 description 3
- 238000012952 Resampling Methods 0.000 description 2
- 239000006227 byproduct Substances 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000018199 S phase Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000012098 association analyses Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Operations Research (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- General Health & Medical Sciences (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Public Health (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种大数据电力抢修热点预测系统的构建方法,所述构建方法包括如下步骤:步骤一,将外部各个系统的数据进行获取并得到原始数据,步骤二,将原始数据储存至数据库内,步骤三,根据数据库内的数据类型的不同采用不同的分析方法进行关联性分析,步骤四,将步骤三中的关联性分析结果进行方法建模,形成热点区域性预测地图,步骤五,将所述热点区域性预测地图开发形成分析展示工具。
Description
技术领域
本发明涉及电力领域,尤其是一种大数据电力抢修热点预测系统的构建方法。
背景技术
在国网系统中,工单数据日益庞大,工单信息比较混杂,单纯的人工统计分析已不再满足实际需求。但是传统抢修模式具有以下缺点,1、被动式的抢修其抢修效率以及抢修效果较差,2、台区对于用户消息推送不及时而导致出现较多投诉工单。而在现有的一个工单预测项目中,对于工单信息的挖掘仅局限在数量信息上,工单内部其他信息尚未进行挖掘;抢修热点并未在该项目中提及,但在实际运用过程中对抢修热点的研究会带来许多好处,其既能反映工单数量上的信息,还能反应地区抢修情况,为抢修物资、抢修人员的调配提供更加详细的信息,因此,对如何合理将抢修热点进行分析研究再应用到实际生产工作中并且形成一个整体的系统是现在急需解决的问题。
发明内容
本发明为了解决上述技术的不足,提供了一种电力抢修热点预测系统。
为了解决上述技术问题,所述电力抢修热点地图构建包括如下步骤:步骤一,将外部各个系统的数据进行获取并得到原始数据,步骤二,将原始数据储存至数据库内,步骤三,根据数据库内的数据类型的不同采用不同的分析方法进行关联性分析,步骤四,将步骤三中的关联性分析结果进行方法建模,形成热点区域性预测地图,步骤五,将所述热点区域性预测地图开发形成分析展示工具。
采用了上述结构后,抢修热点预测系统的核心思想是基于大数据获取的背景下,建立数据库系统,再在数据库系统中的数据进行分析比较,获取关联性较大的因素,再对这些因素进行建模,制成预测地图,这样就可以根据以往的数据来推测未来所在地可能发生的抢修工单数,而步骤一中数据获取方式主要包括业务调研、相关系统梳理和相关数据获取三部分内容。业务调研主要以访谈的方式展开,经过讨论形成调研方案,确定最终需求。相关系统梳理主要是基于抢修工单的实际业务现状,列出抢修热点分析所需的相关数据明细,以配网相关的信息系统为搜寻对象,梳理出抢修热点相关数据信息系统。相关数据获取主要是从抢修热点相关信息系统中获取抢修热点相关数据,并整理形成抢修热点数据集合。步骤二中建立数据库主要以计算机硬件为基础,分为数据采集、数据库设计和数据库建立三大步骤。数据采集:基于抢修热点相关系统导出数据,以Excel形式导入数据库,实现系统与库的人工对接。数据库设计:以系统导出的数据为基底,结合相应的业务知识,对数据库进行相应的表格设计。数据库建立:将数据与设计好的表格进行结合,使数据能够实现增删改查,实现数据库的建立。
作为本发明的进一步改进,所述步骤三内的分析方法主要包括如下方法,皮尔森相关分析,单因素方差分析以及统计对比分析。
采用了上述结构后,由于关联性的体现方式多种多样,基于数据的现状,此项目数据既包含类别型变量,也包含数值型变量,因此,以皮尔森相关分析、方差分析法、统计对比法三种方法可以全面适配不同类型的变量形式。
作为本发明的进一步改进,所述外部各个系统的数据包括设备抢修工单数,负载率,停电次数,设备投入年限,设备型号,生产产家。
采用了上述结构后,上述数据均为可能与抢修工单有关联性的数据类型,通过从PMS系统、营配贯通系统、95598工单系统、统计局网站、中国天气网、国家节假日规定等渠道获取工单数据、天气数据、雷暴数据、节假日信息等建模数据。
作为本发明的进一步改进,所述皮尔森相关分析方法中设置有关联度参数,并且设置关联度参数为r,设置变量X,Y以及变量的平均值以及,根据皮尔森相关分析方法的计算公式可以得出。
采用了上述结构后,皮尔森相关分析是建立一个相关系数予以体现两者的关联性强弱,该系数绝对值越接近于1,表明两者的关联性较强,越接近于0,表示较弱,相关系数是按积差方法计算,同样是以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度,一般用r来代表相关系数。采用皮尔森相关分析法可以判断相当一部分数据的关联性。
作为本发明的进一步改进,将抢修工单与设备投运年限进行皮尔森相关分析,并将抢修工单数变量设置为y1,将设备投运年限变量设置为x1,并计算其关联度参数r1,另外,将负载率与抢修工单进行皮尔森相关分析,将抢修工单数变量设置为y2,将负载率变量设置为x2,并计算其关联度参数r2,另外,将每月停电次数与抢修工单进行皮尔森相关分析,将抢修工单数变量设置为y3,将每月停电次数变量设置为x3,并计算其关联度参数r3。
采用了上述结构后,设备投运年限指标反映了该设备从投运到当下的时间间隔,即设备的运行时长,投运年限指标与设备所剩寿命成反比,随着投运年限的增加,寿命逐渐衰减;因此,从设备的投运年限维度出发,以此建立抢修工单与设备投运年限之间的关联分析,采用皮尔森相关算法进行关联计算。基于时间维度上进行抢修工单量化分析,将设备投运年限以半年进行划分,将设备投运年限划分为46个时间段,并量化统计相应的时间段内的平均工单数。停电次数能侧面反应出电网的运维情况,停电分为计划停电和故障停电,计划停电是指因为某种原因可能造成某地区范围内电力线路供电中断,电力公司根据上级指示,在某时间段,对特定地区内实行停电的措施;故障停电是由于设备发生突然性故障导致的停电。停电次数的多少能在一定程度上反应出设备的缺陷问题,常年长时间频繁停电,由于设备缺陷造成的存在很大的概率,由此,极其容易造成抢修工单,因此,分析抢修工单与停电次数之间的关联关系显得十分重要,采用皮尔森相关算法进行计算分析。负荷是系统中所有设备消耗的总功率的总和,反映着设备所承受的工作量,负荷强度的高低与设备损耗成正比,长时间高强度的负荷,容易导致设备出现故障,从而引发抢修工单的产生,但是基于不同容量下的负荷对设备所产生的影响是不同的,因此,应从设备负荷率角度进行分析,从负荷和容量两个维度进行解析,因此,建立抢修工单与负荷率之间的相关系数,分析两者之间的关联性,以Pearson相关系数的大小来反应两者之间的关联性强弱。
作为本发明的进一步改进,将设备型号与抢修工单进行方差分析,设备型号分别设置包括3组型号,每组型号又包括两种型号,并分别将型号设置为M型与非M型,H型与非H型,S型与非S型,获取各个型号的工单数x4,再基于分析软件进行分析,得出显著性具体数值F,再设置显著性水平,并将该值与分析软件分析出的显著性具体数值进行比较。
采用了上述结构后,方差分析的基本原理认为造成不同组之间差异的来源主要有两个:组间差异和组内差异。利用方差分析计算公式或者SPSS统计分析软件可得出具体数值F。
作为本发明的进一步改进,获取生产厂家信息以及相应的抢修工单数,并建立生产厂家信息与抢修工单数坐标轴,对其进行统计分析,获取以抢修工单数对比较多的几家生产厂家。
采用了上述结构后,统计对比法也称比较分析法,是把客观事物加以比较,以达到认识事物的本质和规律并做出正确的评价,通常是把两个相互联系的指标数据进行比较,从数量上展示和说明研究对象的特征。
作为本发明的进一步改进,将经过关联性分析后的结果进行筛选,剔除关联性较差的分析结果,筛选出关联性较大的分析因子,再加入其他相关信息,进行方法建模,所述方法建模方式为建立随机森林预测模型。
采用了上述结构后,随机森林预测模型通过自助法重采样技术,从原始训练样本集N中有放回地重复随机抽取k个样本生成新的训练样本集合,然后根据自助样本集生成k个分类树组成随机森林,新数据的分类结果按分类树投票多少形成的分数而定。其实质是对决策树算法的一种改进,将多个决策树合并在一起,每棵树的建立依赖于一个独立抽取的样品,森林中的每棵树具有相同的分布,分类误差取决于每一棵树的分类能力和它们之间的相关性。特征选择采用随机的方法去分裂每一个节点,然后比较不同情况下产生的误差。能够检测到的内在估计误差、分类能力和相关性决定选择特征的数目。单棵树的分类能力可能很小,但在随机产生大量的决策树后,一个测试样品可以通过每一棵树的分类结果经统计后选择最可能的分类。其优点是:1、在当前的很多数据集上,相对其他算法有着很大的优势,表现良好。2、它能够处理很高维度的数据,并且不用做特征选择。3、在创建随机森林的时候,对泛化误差使用的是无偏估计,模型泛化能力强。4、训练速度快,容易做成并行化方法。
作为本发明的进一步改进,把随机森林预测模型预测出的数据进行汇总,并根据汇总后的数据与地理地图相嵌合,编制成电力抢修热点预测展示地图。
采用了上述结构后,汇总该区域在过去一段时间内的抢修工单数,并预测出将来时间段内该区域可能出现的抢修工单数,并在地理地图的基础上以可能出现的抢修工单数为绘制核心,绘制抢修工单数热点预测地图,用来展示未来该地区可能出现的工单数以便于使用者对其监测以及后期资源的调配。
作为本发明的进一步改进,把随机森林预测模型预测出的数据进行汇总,将汇总后的数据再基于编程软件进行开发,形成热点抢修预测展示工具。
采用了上述结构后,对数据进行汇总后,在以软件为支撑,制成预测模型APP或者手持式预测展示小工具,方便使用者对其监测以及后期资源的调配。
具体实施方式
所述电力抢修热点地图构建包括如下步骤:步骤一,将外部各个系统的数据进行获取并得到原始数据,步骤二,将原始数据储存至数据库内,步骤三,根据数据库内的数据类型的不同采用不同的分析方法进行关联性分析,步骤四,将步骤三中的关联性分析结果进行方法建模,形成热点区域性预测地图,步骤五,将所述热点区域性预测地图开发形成分析展示工具。抢修热点预测系统的核心思想是基于大数据获取的背景下,建立数据库系统,再在数据库系统中的数据进行分析比较,获取关联性较大的因素,再对这些因素进行建模,制成预测地图,这样就可以根据以往的数据来推测未来所在地可能发生的抢修工单数,而步骤一中数据获取方式主要包括业务调研、相关系统梳理和相关数据获取三部分内容。业务调研主要以访谈的方式展开,经过讨论形成调研方案,确定最终需求。相关系统梳理主要是基于抢修工单的实际业务现状,列出抢修热点分析所需的相关数据明细,以配网相关的信息系统为搜寻对象,梳理出抢修热点相关数据信息系统。相关数据获取主要是从抢修热点相关信息系统中获取抢修热点相关数据,并整理形成抢修热点数据集合。步骤二中建立数据库主要以计算机硬件为基础,分为数据采集、数据库设计和数据库建立三大步骤。数据采集:基于抢修热点相关系统导出数据,以Excel形式导入数据库,实现系统与库的人工对接。数据库设计:以系统导出的数据为基底,结合相应的业务知识,对数据库进行相应的表格设计。数据库建立:将数据与设计好的表格进行结合,使数据能够实现增删改查,实现数据库的建立。
所述步骤三内的分析方法主要包括如下方法,皮尔森相关分析,单因素方差分析以及统计对比分析。由于关联性的体现方式多种多样,基于数据的现状,此项目数据既包含类别型变量,也包含数值型变量,因此,以皮尔森相关分析、方差分析法、统计对比法三种方法可以全面适配不同类型的变量形式。所述外部各个系统的数据包括设备抢修工单数,负载率,停电次数,设备投入年限,设备型号,生产产家。上述数据均为可能与抢修工单有关联性的数据类型,通过从PMS系统、营配贯通系统、95598工单系统、统计局网站、中国天气网、国家节假日规定等渠道获取工单数据、天气数据、雷暴数据、节假日信息等建模数据。
所述皮尔森相关分析方法中设置有关联度参数,并且设置关联度参数为r,设置变量X,Y以及变量的平均值以及,根据皮尔森相关分析方法的计算公式可以得出。皮尔森相关分析是建立一个相关系数予以体现两者的关联性强弱,该系数绝对值越接近于1,表明两者的关联性较强,越接近于0,表示较弱,相关系数是按积差方法计算,同样是以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度,一般用r来代表相关系数。采用皮尔森相关分析法可以判断相当一部分数据的关联性。将抢修工单与设备投运年限进行皮尔森相关分析,并将抢修工单数变量设置为y1,将设备投运年限变量设置为x1,并计算其关联度参数r1,另外,将负载率与抢修工单进行皮尔森相关分析,将抢修工单数变量设置为y2,将负载率变量设置为x2,并计算其关联度参数r2,另外,将每月停电次数与抢修工单进行皮尔森相关分析,将抢修工单数变量设置为y3,将每月停电次数变量设置为x3,并计算其关联度参数r3。
设备投运年限指标反映了该设备从投运到当下的时间间隔,即设备的运行时长,投运年限指标与设备所剩寿命成反比,随着投运年限的增加,寿命逐渐衰减;因此,从设备的投运年限维度出发,以此建立抢修工单与设备投运年限之间的关联分析,采用皮尔森相关算法进行关联计算。基于时间维度上进行抢修工单量化分析,将设备投运年限以半年进行划分,将设备投运年限划分为46个时间段,并量化统计相应的时间段内的平均工单数。停电次数能侧面反应出电网的运维情况,停电分为计划停电和故障停电,计划停电是指因为某种原因可能造成某地区范围内电力线路供电中断,电力公司根据上级指示,在某时间段,对特定地区内实行停电的措施;故障停电是由于设备发生突然性故障导致的停电。停电次数的多少能在一定程度上反应出设备的缺陷问题,常年长时间频繁停电,由于设备缺陷造成的存在很大的概率,由此,极其容易造成抢修工单,因此,分析抢修工单与停电次数之间的关联关系显得十分重要,采用皮尔森相关算法进行计算分析。负荷是系统中所有设备消耗的总功率的总和,反映着设备所承受的工作量,负荷强度的高低与设备损耗成正比,长时间高强度的负荷,容易导致设备出现故障,从而引发抢修工单的产生,但是基于不同容量下的负荷对设备所产生的影响是不同的,因此,应从设备负荷率角度进行分析,从负荷和容量两个维度进行解析,因此,建立抢修工单与负荷率之间的相关系数,分析两者之间的关联性,以Pearson相关系数的大小来反应两者之间的关联性强弱。
将设备型号与抢修工单进行方差分析,设备型号分别设置包括3组型号,每组型号又包括两种型号,并分别将型号设置为M型与非M型,H型与非H型,S型与非S型,获取各个型号的工单数x4,再基于分析软件进行分析,得出显著性具体数值F,再设置显著性水平,并将该值与分析软件分析出的显著性具体数值进行比较。
方差分析的基本原理认为造成不同组之间差异的来源主要有两个:组间差异和组内差异。利用方差分析计算公式或者SPSS统计分析软件可得出具体数值F。
获取生产厂家信息以及相应的抢修工单数,并建立生产厂家信息与抢修工单数坐标轴,对其进行统计分析,获取以抢修工单数对比较多的几家生产厂家。统计对比法也称比较分析法,是把客观事物加以比较,以达到认识事物的本质和规律并做出正确的评价,通常是把两个相互联系的指标数据进行比较,从数量上展示和说明研究对象的特征。
将经过关联性分析后的结果进行筛选,剔除关联性较差的分析结果,筛选出关联性较大的分析因子,再加入其他相关信息,进行方法建模,所述方法建模方式为建立随机森林预测模型。随机森林预测模型通过自助法重采样技术,从原始训练样本集N中有放回地重复随机抽取k个样本生成新的训练样本集合,然后根据自助样本集生成k个分类树组成随机森林,新数据的分类结果按分类树投票多少形成的分数而定。其实质是对决策树算法的一种改进,将多个决策树合并在一起,每棵树的建立依赖于一个独立抽取的样品,森林中的每棵树具有相同的分布,分类误差取决于每一棵树的分类能力和它们之间的相关性。特征选择采用随机的方法去分裂每一个节点,然后比较不同情况下产生的误差。能够检测到的内在估计误差、分类能力和相关性决定选择特征的数目。单棵树的分类能力可能很小,但在随机产生大量的决策树后,一个测试样品可以通过每一棵树的分类结果经统计后选择最可能的分类。其优点是:1、在当前的很多数据集上,相对其他算法有着很大的优势,表现良好。2、它能够处理很高维度的数据,并且不用做特征选择。3、在创建随机森林的时候,对泛化误差使用的是无偏估计,模型泛化能力强。4、训练速度快,容易做成并行化方法。
把随机森林预测模型预测出的数据进行汇总,并根据汇总后的数据与地理地图相嵌合,编制成电力抢修热点预测展示地图。汇总该区域在过去一段时间内的抢修工单数,并预测出将来时间段内该区域可能出现的抢修工单数,并在地理地图的基础上以可能出现的抢修工单数为绘制核心,绘制抢修工单数热点预测地图,用来展示未来该地区可能出现的工单数以便于使用者对其监测以及后期资源的调配。把随机森林预测模型预测出的数据进行汇总,将汇总后的数据再基于编程软件进行开发,形成热点抢修预测展示工具。对数据进行汇总后,在以软件为支撑,制成预测模型APP或者手持式预测展示小工具,方便使用者对其监测以及后期资源的调配。
Claims (10)
1.大数据电力抢修热点预测系统的构建方法,其特征在于:所述构建方法包括如下步骤:步骤一,将外部各个系统的数据进行获取并得到原始数据,步骤二,将原始数据储存至数据库内,步骤三,根据数据库内的数据类型的不同采用不同的分析方法进行关联性分析,步骤四,将步骤三中的关联性分析结果进行方法建模,形成热点区域性预测地图,步骤五,将所述热点区域性预测地图开发形成分析展示工具。
2.根据权利要求1所述的大数据电力抢修热点预测系统的构建方法,其特征在于:所述步骤三内的分析方法主要包括如下方法,皮尔森相关分析,单因素方差分析以及统计对比分析。
3.根据权利要求2所述的大数据电力抢修热点预测系统的构建方法,其特征在于:所述外部各个系统的数据包括设备抢修工单数,负载率,停电次数,设备投入年限,设备型号,生产产家。
4.根据权利要求3所述的大数据电力抢修热点预测系统的构建方法,其特征在于:所述皮尔森相关分析方法中设置有关联度参数,并且设置关联度参数为r,设置变量X,Y以及变量的平均值以及,根据皮尔森相关分析方法的计算公式可以得出。
5.根据权利要求4所述的大数据电力抢修热点预测系统的构建方法,其特征在于:将抢修工单与设备投运年限进行皮尔森相关分析,并将抢修工单数变量设置为y1,将设备投运年限变量设置为x1,并计算其关联度参数r1,另外,将负载率与抢修工单进行皮尔森相关分析,将抢修工单数变量设置为y2,将负载率变量设置为x2,并计算其关联度参数r2,另外,将每月停电次数与抢修工单进行皮尔森相关分析,将抢修工单数变量设置为y3,将每月停电次数变量设置为x3,并计算其关联度参数r3。
6.根据权利要求5所述的大数据电力抢修热点预测系统的构建方法,其特征在于:将设备型号与抢修工单进行方差分析,设备型号分别设置包括3组型号,每组型号又包括两种型号,并分别将型号设置为M型与非M型,H型与非H型,S型与非S型,获取各个型号的工单数x4,再基于分析软件进行分析,得出显著性具体数值F,再设置显著性水平,并将该值与分析软件分析出的显著性具体数值进行比较。
7.根据权利要求6所述的大数据电力抢修热点预测系统的构建方法,其特征在于:获取生产厂家信息以及相应的抢修工单数,并建立生产厂家信息与抢修工单数坐标轴,对其进行统计分析,获取以抢修工单数对比较多的几家生产厂家。
8.根据权利要求7所述的大数据电力抢修热点预测系统的构建方法,其特征在于:将经过关联性分析后的结果进行筛选,剔除关联性较差的分析结果,筛选出关联性较大的分析因子,再加入其他相关信息,进行方法建模,所述方法建模方式为建立随机森林预测模型。
9.根据权利要求8所述的大数据电力抢修热点预测系统的构建方法,其特征在于:把随机森林预测模型预测出的数据进行汇总,并根据汇总后的数据与地理地图相嵌合,编制成电力抢修热点预测展示地图。
10.根据权利要求9所述的大数据电力抢修热点预测系统的构建方法,其特征在于:把随机森林预测模型预测出的数据进行汇总,将汇总后的数据再基于编程软件进行开发,形成热点抢修预测展示工具。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710239281.XA CN107423328A (zh) | 2017-04-13 | 2017-04-13 | 大数据电力抢修热点预测系统的构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710239281.XA CN107423328A (zh) | 2017-04-13 | 2017-04-13 | 大数据电力抢修热点预测系统的构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107423328A true CN107423328A (zh) | 2017-12-01 |
Family
ID=60423299
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710239281.XA Pending CN107423328A (zh) | 2017-04-13 | 2017-04-13 | 大数据电力抢修热点预测系统的构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107423328A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108320063A (zh) * | 2018-03-26 | 2018-07-24 | 上海积成能源科技有限公司 | 一种电力负荷预测中对异常数据剔除和去噪处理的方法 |
CN110648009A (zh) * | 2019-07-24 | 2020-01-03 | 国网浙江省电力有限公司湖州供电公司 | 一种基于数据挖掘的抢修服务预测分析方法 |
CN109002924B (zh) * | 2018-07-23 | 2020-08-07 | 山东鲁能软件技术有限公司 | 一种配网故障抢修预测分析系统及方法 |
CN111797146A (zh) * | 2020-07-20 | 2020-10-20 | 贵州电网有限责任公司电力科学研究院 | 一种基于大数据的设备缺陷关联分析方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003196770A (ja) * | 2001-12-25 | 2003-07-11 | Toshiba Eng Co Ltd | 発電所・工場等における災害発生時の避難誘導方法 |
CN103207944A (zh) * | 2013-02-04 | 2013-07-17 | 国家电网公司 | 一种电力统计指标关联性分析方法 |
CN105335816A (zh) * | 2015-10-13 | 2016-02-17 | 国网安徽省电力公司铜陵供电公司 | 基于深度学习的电力通信网运行趋势与业务风险分析方法 |
CN105574614A (zh) * | 2015-12-15 | 2016-05-11 | 东北大学 | 基于多属性分析的电力系统线路脆弱度评估系统及方法 |
CN105701596A (zh) * | 2015-12-24 | 2016-06-22 | 国家电网公司 | 一种基于大数据技术的配网抢修精益化方法以及管理系统 |
CN106022610A (zh) * | 2016-05-20 | 2016-10-12 | 温州电力设计有限公司 | 一种电力系统防台抗台监控应急方法 |
-
2017
- 2017-04-13 CN CN201710239281.XA patent/CN107423328A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003196770A (ja) * | 2001-12-25 | 2003-07-11 | Toshiba Eng Co Ltd | 発電所・工場等における災害発生時の避難誘導方法 |
CN103207944A (zh) * | 2013-02-04 | 2013-07-17 | 国家电网公司 | 一种电力统计指标关联性分析方法 |
CN105335816A (zh) * | 2015-10-13 | 2016-02-17 | 国网安徽省电力公司铜陵供电公司 | 基于深度学习的电力通信网运行趋势与业务风险分析方法 |
CN105574614A (zh) * | 2015-12-15 | 2016-05-11 | 东北大学 | 基于多属性分析的电力系统线路脆弱度评估系统及方法 |
CN105701596A (zh) * | 2015-12-24 | 2016-06-22 | 国家电网公司 | 一种基于大数据技术的配网抢修精益化方法以及管理系统 |
CN106022610A (zh) * | 2016-05-20 | 2016-10-12 | 温州电力设计有限公司 | 一种电力系统防台抗台监控应急方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108320063A (zh) * | 2018-03-26 | 2018-07-24 | 上海积成能源科技有限公司 | 一种电力负荷预测中对异常数据剔除和去噪处理的方法 |
CN109002924B (zh) * | 2018-07-23 | 2020-08-07 | 山东鲁能软件技术有限公司 | 一种配网故障抢修预测分析系统及方法 |
CN110648009A (zh) * | 2019-07-24 | 2020-01-03 | 国网浙江省电力有限公司湖州供电公司 | 一种基于数据挖掘的抢修服务预测分析方法 |
CN111797146A (zh) * | 2020-07-20 | 2020-10-20 | 贵州电网有限责任公司电力科学研究院 | 一种基于大数据的设备缺陷关联分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Piscitelli et al. | Recognition and classification of typical load profiles in buildings with non-intrusive learning approach | |
CN107423328A (zh) | 大数据电力抢修热点预测系统的构建方法 | |
CN110471965A (zh) | 一种电网设备nqi一站式服务云平台系统 | |
CN109615004A (zh) | 一种多源数据融合的防窃电预警方法 | |
CN103020459A (zh) | 一种多维度用电行为的感知方法及系统 | |
CN110109971A (zh) | 一种低压台区用户用电负荷特性分析方法 | |
CN109800995A (zh) | 一种电网设备故障识别方法及系统 | |
CN106910017A (zh) | 一种基于用户行为数据挖掘的电能体验分析方法和系统 | |
CN110046792A (zh) | 基于雷达图综合评价法的零电量用户排查方法 | |
CN111127099A (zh) | 一种基于大数据的电商用户分析系统及其分析方法 | |
CN106168766A (zh) | 一种智能家居的能源监控管理系统及碳资产管理方法 | |
Konstantinos et al. | Smart cities data classification for electricity consumption & traffic prediction | |
Mathumitha et al. | Big data analytics and visualization of residential electricity consumption behavior based on smart meter data | |
CN105900030A (zh) | 用于分析厂房内的生产和/或处理工程工序和/或工序步骤的方法、系统和计算机程序产品 | |
Ullah et al. | Unified Framework to Select an IoT Platform for Industrial Energy Management Systems | |
Tanphet et al. | Applying business intelligence technology for equipment maintenance and repair plan of telecommunications services provider | |
CN109146316A (zh) | 电力营销稽查方法、装置及计算机可读存储介质 | |
Wang et al. | Application of clustering technique to electricity customer classification for load forecasting | |
KR101913343B1 (ko) | Kpi 지표를 이용한 스마트 공장의 모바일 어플리케이션 관리 시스템 | |
CN109687592A (zh) | 变电站信息显示控制方法、装置及电子设备 | |
CN114240102A (zh) | 一种线损异常数据识别方法、装置、电子设备及存储介质 | |
Kim | Data mining for the K-Grid | |
Zhao et al. | Study on credit evaluation of electricity users based on random forest | |
CN110378481A (zh) | 基于粗糙集的决策处理方法、装置、计算机和存储介质 | |
Koncz et al. | Calculation of indirect electricity consumption in product manufacturing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20171201 |