CN114331308A - 一种基于电力大数据的自贸区发展分析系统及其构建方法 - Google Patents
一种基于电力大数据的自贸区发展分析系统及其构建方法 Download PDFInfo
- Publication number
- CN114331308A CN114331308A CN202110921686.8A CN202110921686A CN114331308A CN 114331308 A CN114331308 A CN 114331308A CN 202110921686 A CN202110921686 A CN 202110921686A CN 114331308 A CN114331308 A CN 114331308A
- Authority
- CN
- China
- Prior art keywords
- data
- self
- trade area
- industry
- trade
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011161 development Methods 0.000 title claims abstract description 92
- 238000004458 analytical method Methods 0.000 title claims abstract description 75
- 238000010276 construction Methods 0.000 title claims abstract description 45
- 238000013499 data model Methods 0.000 claims abstract description 26
- 238000012549 training Methods 0.000 claims abstract description 20
- 238000007781 pre-processing Methods 0.000 claims abstract description 17
- 230000009467 reduction Effects 0.000 claims abstract description 17
- 238000000605 extraction Methods 0.000 claims abstract description 14
- 238000011157 data evaluation Methods 0.000 claims abstract description 11
- 230000018109 developmental process Effects 0.000 claims description 90
- 238000000034 method Methods 0.000 claims description 51
- 238000012544 monitoring process Methods 0.000 claims description 29
- 238000011156 evaluation Methods 0.000 claims description 27
- 230000008859 change Effects 0.000 claims description 26
- 238000004422 calculation algorithm Methods 0.000 claims description 19
- 238000012795 verification Methods 0.000 claims description 19
- 230000005611 electricity Effects 0.000 claims description 17
- 238000004519 manufacturing process Methods 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 16
- 230000000007 visual effect Effects 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 13
- 239000011159 matrix material Substances 0.000 claims description 12
- 230000002776 aggregation Effects 0.000 claims description 11
- 238000004220 aggregation Methods 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 10
- 238000004140 cleaning Methods 0.000 claims description 9
- 238000007418 data mining Methods 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 9
- 238000011144 upstream manufacturing Methods 0.000 claims description 9
- 238000005065 mining Methods 0.000 claims description 8
- 238000007405 data analysis Methods 0.000 claims description 7
- 230000010354 integration Effects 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000005265 energy consumption Methods 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 238000009825 accumulation Methods 0.000 claims description 3
- 230000004931 aggregating effect Effects 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000007621 cluster analysis Methods 0.000 claims description 3
- 238000003066 decision tree Methods 0.000 claims description 3
- 238000009826 distribution Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 230000005855 radiation Effects 0.000 claims description 3
- 238000007637 random forest analysis Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 230000001052 transient effect Effects 0.000 claims description 3
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 33
- 229910052710 silicon Inorganic materials 0.000 description 33
- 239000010703 silicon Substances 0.000 description 33
- 239000000463 material Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 239000002210 silicon-based material Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种基于电力大数据的自贸区发展分析系统及其构建方法。本发明系统包括数据采集前端;指标数据展示单元;基础对象数据展示单元;数据预处理单元、数据特征提取单元、数据特征降维单元;指标体系数据构建单元、指标体系数据评估单元;数据模型构建单元、数据模型训练单元;展示后端;所述的数据采集前端与指标数据展示单元、基础对象数据展示单元、数据预处理单元、数据特征提取单元、数据特征降维单元、指标体系数据构建单元、指标体系数据评估单元、数据模型构建单元、数据模型训练单元的输入端相接。
Description
技术领域
本发明涉及信息技术处理技术领域,具体涉及一种基于电力大数据的自贸区发展分析系统及其构建方法。
背景技术
自贸区设立是新时期确定的全方位对外开放新格局,对标国际高标准的投资贸易自由化、便利化。自贸区加快商品、服务、人才、资本、信息等便利自由流动,从要素的开放上升到国际贸易投资规则的开放。自由贸易区主要包括硅基新材料、生物基新材料、新能源等产业,硅基和生物基制造业中心。
现有国内外关于自贸区发展评价研究或为定性研究,缺乏一定的科学性和准确性;或只集中关注自贸区的某一方面功能数据的定量评价,而缺乏对自贸区整体发展评价的大数据框架。
发明内容
本发明目的是提供一种基于电力大数据的自贸区发展分析系统及其构建方法以解决背景技术中提出的问题。
为了实现以上目的,本发明采用的技术方案为:一种基于电力大数据的自贸区发展分析系统,包括数据采集前端;指标数据展示单元;基础对象数据展示单元;数据预处理单元、数据特征提取单元、数据特征降维单元;指标体系数据构建单元、指标体系数据评估单元;数据模型构建单元、数据模型训练单元;展示后端;
所述的数据采集前端与指标数据展示单元、基础对象数据展示单元、数据预处理单元、数据特征提取单元、数据特征降维单元、指标体系数据构建单元、指标体系数据评估单元、数据模型构建单元、数据模型训练单元的输入端相接;
所述的指标数据展示单元、基础对象数据展示单元、数据预处理单元、数据特征提取单元、数据特征降维单元、指标体系数据构建单元、指标体系数据评估单元、数据模型构建单元、数据模型训练单元的输出端与展示后端相接。
进一步的,所述的指标数据展示单元包括自贸区内电量产值数据显示模块和自贸区区域辐射效率数据显示模块。
再进一步的,所述的基础对象数据展示单元包括自贸区企业数据采集展示模块、自贸区企业名录数据展示模块、自贸区企业产值数据展示模块、自贸区企业用电量数据展示模块、自贸区企业用电功率数据展示模块、自贸区企业用电变化趋势数据展示模块和自贸区企业行业类别数据展示模块。
再进一步的,所述的基础对象数据展示单元还包括上级相关政策展示模块。
再进一步的,所述的展示后端包括自贸区监测分析数据库,所述的自贸区监测分析数据库连接展示后端的展示屏单元。
一种基于电力大数据的自贸区发展分析系统构建方法,包括以下步骤:
1)、数据采集、录入:自贸区企业数据采集,对包括自贸区企业名录数据、自贸区企业产值数据、上级相关政策数据、自贸区企业用电量数据、自贸区企业用电功率数据、自贸区企业用电变化趋势数据、自贸区企业行业类别数据进行收集、录入;
2)、数据预处理、数据特征提取以及数据特征降维:对获取到的原始数据在数据中台进行聚合汇总,利用python进行数据清洗,结合具体的数据特征进行离散程度和集中趋势等过渡性分析以及衍生指标计算,形成从原始数据到模型宽表指标的变换,并对清洗后的数据进行特征缩放、均值归一化映射处理;并根据数据实际分布特征结合PCA、LDA、SVD算法对模型宽表指标进行特征降维;
3)、自贸区发展指标数据体系构建与评估:拟定以自贸区企业电力数据为基础结合外部数据,运用层次分析法确定各项数据指标权重,同时根据已设计的两层指标体系,通过评价法,构建指标体系对应的评价矩阵,对自贸区的发展数据进行评估与分析;
4)模型构建与训练:分别采用K-shape、K-means、随机森林、决策树、神经网络算法,对自贸区企业电力用户进行高维空间的聚类分析和企业特征数据分类,构建电力视角下的产业数据挖掘分析模型;并将原始数据集分为训练集和测试集,运用留出法、交叉验证法验证,不断对模型进行优化改进;
5)、得到数据框架。
再进一步的,所述的步骤4)、5)之间还包括如下具体步骤:
电力视角下的产业数据分析与模型构建:
a1)对比上级提供的细分行业与营销业务系统中细分行业的数据差别并形成记录;
b1)通过产业基地各行业用电数据,逐年统计行业增容扩容数据,通过增容扩容分析结果分析行业发展数据以及行业新、旧产能更替数据;
c1)将电力数据与行业产能数据相结合,分析行业用电和产能变化,挖掘行业用电与行业产能之间的关联数据,同时构建重点行业产能预测模型;
d1)基于电力数据分析行业中各企业规模数据,构建企业聚类模型,将同行业下规模量级相近的企业进行聚类,以此挖掘偏离平均产值和能耗大的企业;
e1)基于电力视角对自贸区内重点发展行业的上下游产业链发展均衡度数据进行分析,以此得到产业链上下游企业数量、类型和产能的配比;
基于电力大数据的自贸区发展数据透视分析
a2)依据数据中台接入的营销业务应用、用电采集业务系统数据,结合自贸区企业清单外部数据,利用数据挖掘分析算法构建基于电力大数据的自贸区发展透视分析模型;
b2)基于自贸区发展透视分析模型,设定时间对自贸区专题监测分析,导出专题监测数据报告,导入在线监测报告自动生成工具,自动生成自贸区监测报告;
c2)根据自贸区专题监测分析结果,从自贸区规模数据、自贸区用电同环比数据、自贸区用电发展趋势数据设计制作自贸区监测分析数据库。
进一步的,所述的步骤4)中还包括对外部企业数据获取:外部自贸区企业数据由上级部门网站和行业数据输出,进行数据使用申请或通过网络爬虫爬取数据。
一种基于电力大数据的自贸区发展分析系统构建方法,包括如下步骤:
1)、数据准备:
基于电力数据中台提供数据支撑,利用数据中台的数据清洗、数据转化、数据整合,构建相应的数据模型,形成场景所需的指标数据、业务数据、明细数据库;
2)、数据处理:
通过数据清洗、整合、转换、规约过程将分散的大数据资源重新构建,包括缺失值和异常值处理、特征自相关性筛选、字符编码处理、归一化处理;
3)、指标体系数据构建与评估:
在电力视角下运用层次分析法确定各项指标权重,对自贸区的发展进行评估与分析,将自贸区发展评估指标数据体系分解为自贸区建设热度数据区、自贸区内产业结构分析数据区、产业聚集程度数据区、产业链均衡发展数据区四个一级指标数据区,并在各个一级指标数据区下面进一步细分二级指标数据区;
根据已设计的两层指标体系,通过评价法,构建指标数据体系对应的评价矩阵;然后对评价矩阵进行一致性检验,若一致性检验不通过,则重新评价;通过算数平均法、几何平均法、特征值法确定各层指标权重;最后,通过量化的指标数值与权重的积累加求和,得到自贸区发展评估结果;
4)、模型构建;
5)、应用验证:
对已有模型进行应用验证,采用交叉验证、自助采样验证方法拟通过将部分非训练集用户采集数据作为测试集数据的方式,对模型所得结果进行测试验证;
基于验证结果,通过重新实现特征工程,结合实际结果提取出新的特征、选取不同数据挖掘算法、调试算法参数方法来提高模型的准确率,对模型进行提升;
7)、结果展示:
基于电力视角下自贸区和产业发展分析结果构建自贸区发展分析模型,对自贸区和产业设定时间专题监测分析,同时设计分析报告模板以及原型,报告内容依据模板格式进行填充,分析结果数据依托原型页面进行展示,最终以报告和原型展示自贸区及产业企业数量变化、企业规模变化、产业聚集度、产业链均衡度、企业产能变化、用电变化趋势、企业用电同环比变化数据信息。
本发明的技术效果在于:本发明基于电力视角分析自贸区发展数据、以硅基产业作为对象分析产业发展,建立相应数据库并展示,并运用相应数据库,为执行中心或控制中心制定和优化地方自贸区政策提供参考依据,更好地促进自由贸易发展。即本发明结合自贸区发展的定位和自贸区内企业数据、运作自贸区的需求,以及自贸区内各企业用电特征数据,以电力视角构建一种符合自贸区发展的分析系统。通过自贸区发展指标数据体系构建,运用层次分析法对不同的数据赋予相应的权重。
附图说明
图1为本发明的系统构造简图。
具体实施方式
本发明从电力视角开展自贸区企业发展数据分析,通过电力数据直观反映自贸区企业运营状态,并且以硅基产业为实施例,开展硅基产业发展数据分析,最终以指标体系数据、自贸区企业运营状态数据和硅基产业发展状态数据分析为基础,评估自贸区发展状况。
其一、建立基于电力大数据的自贸区发展指标数据体系,通过电力数据分析反映自贸区整体发展数据,包括自贸区内电量产值数据、上级效率数据、自贸区区域辐射效率数据、产业聚集与产业链均衡发展数据等。
其二、从电力视角透视自贸区重点发展领域内企业经济运营数据,以片区硅基产业,分析重点产业用电量数据、新旧产能更替数据、产值能耗数据、产业链发展数据等,为上级部门提供决策支持。
其三、建立基于电力大数据的自贸区发展透视分析,实现数据的专题分析及专题展示等。
本发明的一种基于电力大数据的自贸区发展分析系统,包括数据采集前端 1;指标数据展示单元3;基础对象数据展示单元4;数据预处理单元51、数据特征提取单元52、数据特征降维单元53;指标体系数据构建单元61、指标体系数据评估单元62;数据模型构建单元63、数据模型训练单元64;展示后端 2;
所述的数据采集前端1与指标数据展示单元3、基础对象数据展示单元4、数据预处理单元51、数据特征提取单元52、数据特征降维单元53、指标体系数据构建单元61、指标体系数据评估单元62、数据模型构建单元63、数据模型训练单元64的输入端相接;
所述的指标数据展示单元3、基础对象数据展示单元4、数据预处理单元51、数据特征提取单元52、数据特征降维单元53、指标体系数据构建单元61、指标体系数据评估单元62、数据模型构建单元63、数据模型训练单元64的输出端与展示后端2相接。
进一步的,所述的指标数据展示单元3包括自贸区内电量产值数据显示模块31和自贸区区域辐射效率数据显示模块32。
再进一步的,所述的基础对象数据展示单元4包括自贸区企业数据采集展示模块41、自贸区企业名录数据展示模块42、自贸区企业产值数据展示模块43、自贸区企业用电量数据展示模块44、自贸区企业用电功率数据展示模块45、自贸区企业用电变化趋势数据展示模块46和自贸区企业行业类别数据展示模块 47。
再进一步的,所述的基础对象数据展示单元4还包括上级相关政策展示模块48。
再进一步的,所述的展示后端2包括自贸区监测分析数据库21,所述的自贸区监测分析数据库21连接展示后端2的展示屏单元22。
具体的:本发明系统执行包括如下步骤:
1)、数据采集、录入:自贸区企业数据采集,对自贸区企业名录数据、自贸区企业产值数据、上级相关政策数据、自贸区企业用电量数据、自贸区企业用电功率数据、自贸区企业用电变化趋势数据、自贸区企业行业类别数据等数据进行收集。
2)数据预处理、数据特征提取以及(数据)特征降维:对获取到的原始数据在数据中台进行聚合汇总,利用python进行数据清洗,结合具体的数据特征进行离散程度和集中趋势的过渡性分析以及衍生指标计算,形成从原始数据到模型宽表指标的变换,并对清洗后的数据进行特征缩放、均值归一化映射处理;并根据数据实际分布特征结合PCA、LDA、SVD算法对模型宽表指标进行特征降维。
3)自贸区发展指标数据体系构建与评估:拟定以自贸区企业电力数据为基础结合外部数据,运用层次分析法确定各项数据指标权重,同时根据已设计的两层指标体系,通过评价法,构建指标体系对应的评价矩阵,对自贸区的发展数据进行评估与分析,为自贸区后续发展建设提供大数据参考。
4)数据模型构建与训练:分别采用K-shape、K-means、随机森林、决策树、神经网络算法,对自贸区企业电力用户进行高维空间的聚类分析和企业特征数据分类,构建电力视角下的产业数据挖掘分析模型;并将原始数据集分为训练集和测试集,运用留出法、交叉验证法验证,不断对模型进行优化改进。
5)、得到数据框架。
具体实施例一,以自贸区硅基新材料产业行业数据为对象例,得到数据框架过程如下:
本发明基于电力视角分析自贸区以及硅基企业发展数据,数据应用建设内容主要包括:
电力视角下的硅基产业数据分析与模型构建:
a1)对比上级提供的硅基新材料细分行业与营销业务系统中细分行业的数据差别并形成记录;
b1)通过硅基产业基地各行业用电数据,逐年统计行业增容扩容数据,通过增容扩容分析结果分析行业发展数据以及行业新、旧产能更替数据;
c1)将电力数据与硅基行业产能数据相结合,分析行业用电和产能变化,挖掘行业用电与行业产能之间的关联数据,以实现用电力数据表征行业产值情况的目的,同时构建重点行业产能预测模型,用于预测未来硅基产业重点行业的产能变化趋势;
d1)基于电力数据分析行业中各企业规模数据,构建企业聚类模型,将同行业下规模量级相近的企业进行聚类,以此挖掘偏离平均产值和能耗大的企业;
e1)基于电力视角对自贸区内硅基新材料重点发展行业的上下游产业链发展均衡度数据进行分析,以此得到产业链上下游企业数量、类型和产能的配比。
基于电力大数据的自贸区发展数据透视分析
a2)依据数据中台接入的营销业务应用、用电采集业务系统数据,结合自贸区企业清单外部数据,利用数据挖掘分析算法构建基于电力大数据的自贸区发展透视分析模型,实现时间、行业双维度并行监测分析功能,有效支撑自贸区专题监测分析工作。
b2)基于自贸区发展透视分析模型,设定时间对自贸区专题监测分析,导出专题监测数据报告,导入在线监测报告自动生成工具,自动生成自贸区监测报告。
c2)根据自贸区专题监测分析结果,从自贸区规模数据、自贸区用电同环比数据、自贸区用电发展趋势数据设计制作自贸区监测分析数据库,对自贸区建设发展数据进行集中展示宣传。
进一步的,还包括对外部企业数据获取:
外部自贸区企业数据由上级部门网站和硅基行业数据输出,进行数据使用申请或通过网络爬虫爬取数据。
具体实施例二,还是以硅基新材料产业行业为例,基于电力数据的硅基产业情况分析与模型构建:
基于电力数据利用挖掘分析,以片区硅基产业为典型,将电力数据与硅基行业产能数据相结合,分析行业用电和产能数据变化趋势,挖掘行业用电与行业产能数据之间的关系,以实现用电力数据表征行业产值数据的目的,同时构建重点行业产能预测模型,用于预测未来硅基产业重点行业的产能变化趋势,从新旧产能更替、产值能耗、产业链发展方面为上级部门和企业提供数据支持。
系统包括如下步骤:
1)、数据准备
基于电力数据中台提供数据支撑,利用数据中台的数据清洗、数据转化、数据整合,构建相应的数据模型,形成场景所需的指标数据、业务数据、明细数据库,保障场景应用数据及时性、准确性、完整性。
2)、数据处理:
电力系统数据在采集和传输的过程中可能受到噪声的干扰,数据质量较低,所以在数据进行相关的处理之前,需要进行相应的数据预处理。
数据预处理是通过数据清洗、整合、转换、规约过程将分散的大数据资源 (按照即定的业务主题)重新构建,为后续的分析、挖掘提供基础数据支撑。数据预处理主要包括缺失值和异常值处理、特征自相关性筛选、字符编码处理、归一化处理。
3)、指标体系数据构建与评估:
在电力视角下运用层次分析法确定各项指标权重,对自贸区的发展进行评估与分析,为自贸区后续发展建设提供参考,将自贸区发展评估指标数据体系分解为自贸区建设热度数据区、自贸区内产业结构分析数据区、产业聚集程度数据区、产业链均衡发展情况数据区四个一级指标数据区,并在各个一级指标数据区下面进一步细分二级指标数据区。
根据已设计的两层指标体系,通过评价法,构建指标数据体系对应的评价矩阵;然后对评价矩阵进行一致性检验,若一致性检验不通过,则重新评价;通过算数平均法、几何平均法、特征值法确定各层指标权重;最后,通过量化的指标数值与权重的积累加求和,得到自贸区发展评估结果。
具体的:
3.1)自贸区建设热度数据分析
通过分析自贸区内新注册企业的数量数据,企业用电量变化数据、转变负荷率数据,自贸区内建筑业新装用户数量、电量数据,新申请临时用电的客户数量、电量及临走时用电转正式用电数据对自贸区内建设热度进行分析;
3.2)自贸区内产业结构分析
对自贸区内企业数量、行业类别、用电量及产值数据进行统计,分析自贸区内企业数量、产能及用电量的变化趋势,以企业数量、产能和用电量变化趋势综合表征自贸区产业发展水平,同时基于自贸区企业现状分析自贸区产业组合状态,最终挖掘产业发展水平与产业组合状态之间关联关系,以实现自贸区内产业结构分析;
3.3)重点行业产能预测模型构建
将上级部门提供的行业产能数据与行业用电数据相结合,深度挖掘行业产能与行业用电之间的关系,用电力数据表征行业产能,运用时间序列等算法构建行业产能预测模型,用该模型实现未来硅基产业重点行业的产能变化趋势预测;
3.4)自贸区产业聚集度分析
硅基产业、生物基产业和新能源产业发展是自贸区重点产业,自贸区内三大产业聚集度可作为自贸区发展的评价依据,区位熵算法可在一定程度上反映出地区层面的产业集聚水平,运用区位熵算法结合地区和自贸区的企业数量、行业类别、企业产能、企业用电量这些数据,综合分析自贸区产业聚集水平;
3.5)企业产值偏离度分析
不同规模下的企业,其产能必然存在差异,为深度挖掘同行业下偏离平均产值(用电)较大的企业,首先将同行业具有相近规模的企业进行聚类,已达到唯一变量的分析效果,挖掘不同规模下企业的用电特征,以用电特征表征企业规模,运用聚类算法构建企业聚类模型,将同行业企业科学分组,实现挖掘偏离均值较大的企业。
4)、模型构建:
4.1)内外部行业明细差异分析
将上级部门提供的硅基企业名录及对应行业类别与电力营销业务系统中行业类别的数据进行比对,如存在行业命名差异,则对差异内容进行记录,以便于电力营销业务系统中行业类别命名完善;
4.2)硅基行业产能更替特征分析
随着行业工艺能力提升,行业产业也会随之提升。运用数理统计方法寻找行业产能更新时的特征,综合分析产能更替特征下的用电数据变化规律,挖掘产能更新时的用电特征,以此寻找电力视角的行业产能更替特征,通过电力数据特征表征产能更替特征;
4.3)硅基产业链均衡度分析
一是依据硅基产业链关系网,探究产业链上下游企业配置数据,分析产业链是否存在链条断点;二是挖掘硅基产业链中各行业产能与电量之间的关联关系,以电量表征行业产能,运用数理统计和大数据技术分析产业链上下游各行业生产产能和消耗的关系,以此作为硅基产业链上下游行业产能均衡度评判依据,依据硅基产业链行业产能均衡度标准挖掘链条薄弱环节,自上而下深度分析链条薄弱环节中各行业的企业配置数据,实现产业链薄弱环节的精准定位。
5)、应用验证:对已有模型进行应用验证,采用交叉验证、自助采样验证方法拟通过将部分非训练集用户采集数据作为测试集数据的方式,对模型所得结果进行测试验证。
基于验证结果,通过重新实现特征工程,结合实际结果提取出新的特征、选取不同数据挖掘算法、调试算法参数等方法来提高模型的准确率,对模型进行提升。
6)、结果展示:
基于电力视角下自贸区和硅基产业发展分析结果构建自贸区发展分析模型,对自贸区和硅基产业设定时间专题监测分析,同时为直观展示自贸区及硅基产业发展情况,设计分析报告模板以及原型,报告内容依据模板格式进行填充,分析结果数据依托原型页面进行展示,最终以报告和原型展示自贸区及硅基产业企业数量变化、企业规模变化、产业聚集度、产业链均衡度、企业产能变化、用电变化趋势、企业用电同环比变化等数据信息。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、同替换、改进,均应包含在本发明的保护范围之内。
Claims (9)
1.一种基于电力大数据的自贸区发展分析系统,其特征在于,包括数据采集前端(1);指标数据展示单元(3);基础对象数据展示单元(4);数据预处理单元(51)、数据特征提取单元(52)、数据特征降维单元(53);指标体系数据构建单元(61)、指标体系数据评估单元(62);数据模型构建单元(63)、数据模型训练单元(64);展示后端(2);
所述的数据采集前端(1)与指标数据展示单元(3)、基础对象数据展示单元(4)、数据预处理单元(51)、数据特征提取单元(52)、数据特征降维单元(53)、指标体系数据构建单元(61)、指标体系数据评估单元(62)、数据模型构建单元(63)、数据模型训练单元(64)的输入端相接;
所述的指标数据展示单元(3)、基础对象数据展示单元(4)、数据预处理单元(51)、数据特征提取单元(52)、数据特征降维单元(53)、指标体系数据构建单元(61)、指标体系数据评估单元(62)、数据模型构建单元(63)、数据模型训练单元(64)的输出端与展示后端(2)相接。
2.根据权利要求1所述的一种基于电力大数据的自贸区发展分析系统,其特征在于,所述的指标数据展示单元(3)包括自贸区内电量产值数据显示模块(31)和自贸区区域辐射效率数据显示模块(32)。
3.根据权利要求1所述的一种基于电力大数据的自贸区发展分析系统,其特征在于,所述的基础对象数据展示单元(4)包括自贸区企业数据采集展示模块(41)、自贸区企业名录数据展示模块(42)、自贸区企业产值数据展示模块(43)、自贸区企业用电量数据展示模块(44)、自贸区企业用电功率数据展示模块(45)、自贸区企业用电变化趋势数据展示模块(46)和自贸区企业行业类别数据展示模块(47)。
4.根据权利要求3所述的一种基于电力大数据的自贸区发展分析系统,其特征在于,所述的基础对象数据展示单元(4)还包括上级相关政策展示模块(48)。
5.根据权利要求1所述的一种基于电力大数据的自贸区发展分析系统,其特征在于,所述的展示后端(2)包括自贸区监测分析数据库(21),所述的自贸区监测分析数据库(21)连接展示后端(2)的展示屏单元(22)。
6.一种基于电力大数据的自贸区发展分析系统构建方法,其特征在于,包括以下步骤:
1)、数据采集、录入:自贸区企业数据采集,对包括自贸区企业名录数据、自贸区企业产值数据、上级相关政策数据、自贸区企业用电量数据、自贸区企业用电功率数据、自贸区企业用电变化趋势数据、自贸区企业行业类别数据进行收集、录入;
2)、数据预处理、数据特征提取以及数据特征降维:对获取到的原始数据在数据中台进行聚合汇总,利用python进行数据清洗,结合具体的数据特征进行离散程度和集中趋势等过渡性分析以及衍生指标计算,形成从原始数据到模型宽表指标的变换,并对清洗后的数据进行特征缩放、均值归一化映射处理;并根据数据实际分布特征结合PCA、LDA、SVD算法对模型宽表指标进行特征降维;
3)、自贸区发展指标数据体系构建与评估:拟定以自贸区企业电力数据为基础结合外部数据,运用层次分析法确定各项数据指标权重,同时根据已设计的两层指标体系,通过评价法,构建指标体系对应的评价矩阵,对自贸区的发展数据进行评估与分析;
4)模型构建与训练:分别采用K-shape、K-means、随机森林、决策树、神经网络算法,对自贸区企业电力用户进行高维空间的聚类分析和企业特征数据分类,构建电力视角下的产业数据挖掘分析模型;并将原始数据集分为训练集和测试集,运用留出法、交叉验证法验证,不断对模型进行优化改进;
5)、得到数据框架。
7.根据权利要求6所述的一种基于电力大数据的自贸区发展分析系统构建方法,其特征在于,所述的步骤4)、5)之间还包括如下具体步骤:
电力视角下的产业数据分析与模型构建:
a1)对比上级提供的细分行业与营销业务系统中细分行业的数据差别并形成记录;
b1)通过产业基地各行业用电数据,逐年统计行业增容扩容数据,通过增容扩容分析结果分析行业发展数据以及行业新、旧产能更替数据;
c1)将电力数据与行业产能数据相结合,分析行业用电和产能变化,挖掘行业用电与行业产能之间的关联数据,同时构建重点行业产能预测模型;
d1)基于电力数据分析行业中各企业规模数据,构建企业聚类模型,将同行业下规模量级相近的企业进行聚类,以此挖掘偏离平均产值和能耗大的企业;
e1)基于电力视角对自贸区内重点发展行业的上下游产业链发展均衡度数据进行分析,以此得到产业链上下游企业数量、类型和产能的配比;
基于电力大数据的自贸区发展数据透视分析
a2)依据数据中台接入的营销业务应用、用电采集业务系统数据,结合自贸区企业清单外部数据,利用数据挖掘分析算法构建基于电力大数据的自贸区发展透视分析模型;
b2)基于自贸区发展透视分析模型,设定时间对自贸区专题监测分析,导出专题监测数据报告,导入在线监测报告自动生成工具,自动生成自贸区监测报告;
c2)根据自贸区专题监测分析结果,从自贸区规模数据、自贸区用电同环比数据、自贸区用电发展趋势数据设计制作自贸区监测分析数据库。
8.根据权利要求7所述的一种基于电力大数据的自贸区发展分析系统构建方法,其特征在于,所述的步骤4)中还包括对外部企业数据获取:外部自贸区企业数据由上级部门网站和行业数据输出,进行数据使用申请或通过网络爬虫爬取数据。
9.一种基于电力大数据的自贸区发展分析系统构建方法,其特征在于,包括如下步骤:
1)、数据准备:
基于电力数据中台提供数据支撑,利用数据中台的数据清洗、数据转化、数据整合,构建相应的数据模型,形成场景所需的指标数据、业务数据、明细数据库;
2)、数据处理:
通过数据清洗、整合、转换、规约过程将分散的大数据资源重新构建,包括缺失值和异常值处理、特征自相关性筛选、字符编码处理、归一化处理;
3)、指标体系数据构建与评估:
在电力视角下运用层次分析法确定各项指标权重,对自贸区的发展进行评估与分析,将自贸区发展评估指标数据体系分解为自贸区建设热度数据区、自贸区内产业结构分析数据区、产业聚集程度数据区、产业链均衡发展数据区四个一级指标数据区,并在各个一级指标数据区下面进一步细分二级指标数据区;
根据已设计的两层指标体系,通过评价法,构建指标数据体系对应的评价矩阵;然后对评价矩阵进行一致性检验,若一致性检验不通过,则重新评价;通过算数平均法、几何平均法、特征值法确定各层指标权重;最后,通过量化的指标数值与权重的积累加求和,得到自贸区发展评估结果;
4)、模型构建;
5)、应用验证:
对已有模型进行应用验证,采用交叉验证、自助采样验证方法拟通过将部分非训练集用户采集数据作为测试集数据的方式,对模型所得结果进行测试验证;
基于验证结果,通过重新实现特征工程,结合实际结果提取出新的特征、选取不同数据挖掘算法、调试算法参数方法来提高模型的准确率,对模型进行提升;
7)、结果展示:
基于电力视角下自贸区和产业发展分析结果构建自贸区发展分析模型,对自贸区和产业设定时间专题监测分析,同时设计分析报告模板以及原型,报告内容依据模板格式进行填充,分析结果数据依托原型页面进行展示,最终以报告和原型展示自贸区及产业企业数量变化、企业规模变化、产业聚集度、产业链均衡度、企业产能变化、用电变化趋势、企业用电同环比变化数据信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110921686.8A CN114331308A (zh) | 2021-08-12 | 2021-08-12 | 一种基于电力大数据的自贸区发展分析系统及其构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110921686.8A CN114331308A (zh) | 2021-08-12 | 2021-08-12 | 一种基于电力大数据的自贸区发展分析系统及其构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114331308A true CN114331308A (zh) | 2022-04-12 |
Family
ID=81034142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110921686.8A Pending CN114331308A (zh) | 2021-08-12 | 2021-08-12 | 一种基于电力大数据的自贸区发展分析系统及其构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114331308A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117369813A (zh) * | 2023-10-13 | 2024-01-09 | 湖北华中电力科技开发有限责任公司 | 一种基于数据中台的用能监测指标体系可视化展示方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105335825A (zh) * | 2015-11-01 | 2016-02-17 | 上海财经大学 | 自贸试验区制度创新绩效评估系统及方法 |
CN107274100A (zh) * | 2017-06-23 | 2017-10-20 | 广东知元机器人科技有限公司 | 基于电力大数据的经济预警分析方法 |
CN110222985A (zh) * | 2019-06-10 | 2019-09-10 | 贵州电网有限责任公司 | 基于用电大数据的经济因素分析与评价系统及操作方法 |
CN112734295A (zh) * | 2021-01-27 | 2021-04-30 | 浙江容大电力工程有限公司 | 一种行业指数分析管理系统及分析方法 |
CN112801339A (zh) * | 2020-12-16 | 2021-05-14 | 国网辽宁省电力有限公司鞍山供电公司 | 一种基于电力大数据的地区经济发展预测方法 |
CN113010595A (zh) * | 2021-03-18 | 2021-06-22 | 国网福建省电力有限公司宁德供电公司 | 一种电力能源数据分析与监控方法及系统 |
-
2021
- 2021-08-12 CN CN202110921686.8A patent/CN114331308A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105335825A (zh) * | 2015-11-01 | 2016-02-17 | 上海财经大学 | 自贸试验区制度创新绩效评估系统及方法 |
CN107274100A (zh) * | 2017-06-23 | 2017-10-20 | 广东知元机器人科技有限公司 | 基于电力大数据的经济预警分析方法 |
CN110222985A (zh) * | 2019-06-10 | 2019-09-10 | 贵州电网有限责任公司 | 基于用电大数据的经济因素分析与评价系统及操作方法 |
CN112801339A (zh) * | 2020-12-16 | 2021-05-14 | 国网辽宁省电力有限公司鞍山供电公司 | 一种基于电力大数据的地区经济发展预测方法 |
CN112734295A (zh) * | 2021-01-27 | 2021-04-30 | 浙江容大电力工程有限公司 | 一种行业指数分析管理系统及分析方法 |
CN113010595A (zh) * | 2021-03-18 | 2021-06-22 | 国网福建省电力有限公司宁德供电公司 | 一种电力能源数据分析与监控方法及系统 |
Non-Patent Citations (1)
Title |
---|
罗慧;李艺丰;王蓓蓓;: "基于层次分析和主成分分析的行业用电发展态势评估", 电力需求侧管理, no. 01, 20 January 2017 (2017-01-20), pages 15 - 20 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117369813A (zh) * | 2023-10-13 | 2024-01-09 | 湖北华中电力科技开发有限责任公司 | 一种基于数据中台的用能监测指标体系可视化展示方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Song et al. | Environmental performance evaluation with big data: Theories and methods | |
Ahmad et al. | Review of various modeling techniques for the detection of electricity theft in smart grid environment | |
CN108564286B (zh) | 一种基于大数据征信的人工智能金融风控授信评定方法和系统 | |
CN102567807B (zh) | 加油卡客户流失预测方法 | |
CN108170769A (zh) | 一种基于决策树算法的装配制造质量数据处理方法 | |
CN110765268B (zh) | 一种基于客户诉求的配网精准投资策略方法 | |
CN103971023B (zh) | 研发过程质量自动评估系统和方法 | |
CN110544035A (zh) | 一种内控检测方法、系统和计算机可读存储介质 | |
CN108491991A (zh) | 基于工业大数据产品工期的约束条件分析系统与方法 | |
CN109934483A (zh) | 一种面向实物质量提升的制造质量信息管控系统及方法 | |
CN113450009A (zh) | 一种企业成长性评价的方法及系统 | |
CN116933010A (zh) | 一种基于多源数据融合与深度学习的负载率分析评价方法和系统 | |
CN114331308A (zh) | 一种基于电力大数据的自贸区发展分析系统及其构建方法 | |
CN117786223A (zh) | 基于大数据的审计数据分析方法及系统 | |
CN107274100A (zh) | 基于电力大数据的经济预警分析方法 | |
Zhang et al. | Implicit contradictions identification and solution process model for complex technical systems | |
CN115328900A (zh) | 一种时段性智能电表数据采集及分析系统 | |
Qiao et al. | Constructing a data warehouse based decision support platform for China tourism industry | |
Cao et al. | Quality-integrated diagnostic platform for aerospace complex product assembly processes | |
CN207232961U (zh) | 一种可实时对水雨情数据进行检验的系统 | |
CN113205274A (zh) | 一种施工质量定量化排名方法 | |
CN111612302A (zh) | 一种集团级数据管理方法和设备 | |
Bagga et al. | Comparison of data mining and auditing tools | |
ESCAP et al. | Measuring participation in global value chains, and developing supportive policies: a user guide | |
Sun | Management Research of Big Data Technology in Financial Decision-Making of Enterprise Cloud Accounting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |