CN112651552A - 一种基于电力大数据产业结构优化方法、装置及存储介质 - Google Patents
一种基于电力大数据产业结构优化方法、装置及存储介质 Download PDFInfo
- Publication number
- CN112651552A CN112651552A CN202011523435.6A CN202011523435A CN112651552A CN 112651552 A CN112651552 A CN 112651552A CN 202011523435 A CN202011523435 A CN 202011523435A CN 112651552 A CN112651552 A CN 112651552A
- Authority
- CN
- China
- Prior art keywords
- industry
- selected area
- data
- region
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000005457 optimization Methods 0.000 title claims abstract description 36
- 238000003860 storage Methods 0.000 title claims abstract description 11
- 238000011161 development Methods 0.000 claims abstract description 61
- 230000008901 benefit Effects 0.000 claims abstract description 14
- 238000000547 structure data Methods 0.000 claims abstract description 14
- 230000005611 electricity Effects 0.000 claims description 53
- 238000004364 calculation method Methods 0.000 claims description 22
- 238000005065 mining Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 239000000126 substance Substances 0.000 claims description 7
- 238000013500 data storage Methods 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 abstract description 7
- 238000004458 analytical method Methods 0.000 abstract description 4
- 238000003745 diagnosis Methods 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 5
- 238000004138 cluster model Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 239000013064 chemical raw material Substances 0.000 description 1
- 239000003245 coal Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- Water Supply & Treatment (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Public Health (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种基于电力大数据产业优化方法、装置及存储介质,该方法涉及产业结构优化方法技术领域,解决了应用电力大数据统计滞后性带来的难以实时诊断和优化,且统计占用大量的人工劳动力的问题;该方法包括:获取选定区域的用电数据,以及国家产业分类标准数据;结合两者,并基于“产业‑行业‑用户”的对应关系,构建产业结构数据池;确定选定区域内每个地区的各行业的电力区位优势指标和潜力发展指标;并构建行业聚类模型,优化选定区域内的产业布局,实现了整个过程无需人工干预,不需要对相关行业的发展进行人工统计,节省了大量的人力资源,同时兼具电力大数据和经济理论,使得分析结果的准确性大大提高。
Description
技术领域
本申请涉及产业结构优化方法技术领域,尤其涉及一种基于电力大数据产业结构优化方法、装置及存储介质。
背景技术
我国的经济发展进入新常态,经济社会发展环境正在发生着深刻的变化,资源和环境约束不断强化,劳动力等生产要素成本不断上升,投资和出口的增长速度逐渐降低,主要依靠要素投入、规模扩张的粗放式发展模式难以再继续,加快产业的布局和结构调整、推进经济转型是必须要做的事情。电力大数据的应用一方面是与宏观经济融合,促进行业发展,另一方面是电力行业或中企业内部扩行业数据融合。
目前,只有统计部门提供季度和年度统计指标时,政府相关部门才能对电力大数据有所了解。
不能将电力大数据进行充分的利用,且政府相关部门统计的季度指标和年度指标相较于数字信息时代太过于数据滞后。在获取相关数据在进行相应措施的采取,显得为时过晚。
发明内容
本申请实施例通过提供一种基于电力大数据的产业结构优化方法、装置及存储介质,解决了现有技术中应用电力大数据统计滞后性带来的难以实时诊断和优化,且统计占用大量的人工劳动力的问题,实现了整个过程无需人工干预,不需要对相关行业的发展进行人工统计,节省了大量的人力资源,同时兼具电力大数据和经济理论,使得分析结果的准确性大大提高,在本申请中使用的电力大数据,与传统的经济数据相比,时效性和准确性都有大幅的提高,实时分析当前的产业布局,反映当前区域的发展动向,能够挖掘各区域的优势行业,为区域经济发展提供助力,在本申请中还结合国家产业分类标准,建立了“产业-行业-用户”为对象的数据贯通机制,具有很强的复用性和扩展性。
第一方面,本发明实施例提供了一种基于电力大数据产业结构优化方法,该方法包括:
获取选定区域的用电数据,以及国家产业分类标准数据;
结合所述用电数据和所述国家产业分类标准数据,并基于“产业-行业-用户”的对应关系,构建产业结构数据池;
基于所述产业结构数据池的数据,确定所述选定区域内每个地区的各行业的电力区位优势指标以及所述选定区域内每个地区的各行业的潜力发展指标;
依据所述电力区位优势指标以及所述潜力发展指标,构建行业聚类模型,优化所述选定区域内的产业布局。
结合第一方面,在一种可能的实现方式中,所述区域用电数据包括:电力用户档案数据和用户用电数据;
其中,所述电力用户档案数据来源于电力营销系统,所述用户用电数据来源于用户用电采集系统。
结合第一方面,在一种可能的实现方式中,在实施所述确定所述选定区域内每个地区的各行业的电力区位优势指标以及所述选定区域内每个地区的各行业的潜力发展指标前,还包括:
对所述用电数据的缺失值进行填充,以及异常值识别和处理。
结合第一方面,在一种可能的实现方式中,所述电力区位优势指标包括电力区位商,所述选定区域内一个地区的一个行业的所述区位商计算公式为:
其中,i表示地区,m表示整个所述选定区域内地区的数量,j表示行业,n表示该地区内的行业数量;ELQij表示i地区j行业的所述电力区位商;Eij表示i地区j行业的用电量。
结合第一方面,在一种可能的实现方式中,所述选定区域内一个地区的一个行业的所述潜力发展指标的计算方法包括:
计算所述选定区域内一个地区的一个行业的电力平均增长率,计算公式如下:
计算所述选定区域内一个地区的一个行业的相对增长比,计算公式如下:
分别对所述选定区域内一个地区的一个行业的用电量以及所述选定区域内一个地区的一个行业的相对增长比归一化处理,去除量纲的差异,计算公式如下:
其中,x表示所述选定区域内一个地区的一个行业的用电量集合,max(X)表示所述选定区域内一个地区的一个行业用电量集合中最大值,min(X)表示所述选定区域内一个地区的一个行业用电量集合中的最小值;或者,x表示所述选定区域内一个地区的一个行业的相对增长比的集合,max(X)表示所述选定区域内一个地区的一个行业相对增长比的集合中最大值,min(X)表示所述选定区域内一个地区的一个行业用电量相对增长比的集合中的最小值;
计算所述选定区域内一个地区的一个行业的所述潜力发展指标,计算公式如下:
其中,wk表示第k个指标的权重,Pij表示i地区j行业的发展潜力。
结合第一方面,在一种可能的实现方式中,所述构建行业聚类模型包括:
对于给定的训练样本{x(1),x(2),...,x(m)},每个x(i)∈R(n),选择K个点作为初始中心{c1,c2,...,ck};
使用每个所述聚类中的样本均值作为新的聚类中心;
判断本次的聚类中心与上次聚类中心的距离是否大于阈值或者迭代次数是否结束,若大于阈值且迭代次数未结束,返回前两个步骤,否则结束得到K类以及中心点。
结合第一方面,在一种可能的实现方式中,所述优化所述选定区域内的产业布局,包括:根据所述聚类模型的聚类结果挖掘符合区域发展的主导行业,优化产业内部布局。
第二方面,本发明实施例提供了一种基于电力大数据的产业结构优化装置,该装置包括:
数据获取单元:用于获取选定区域的用电数据,以及国家产业分类标准数据;
数据确定单元:用于结合所述用电数据和所述国家产业分类标准数据,并基于“产业-行业-用户”的对应关系,构建产业结构数据池;
指标确定单元:用于基于所述产业结构数据池的数据,确定所述选定区域内每个地区的各行业的电力区位优势指标以及所述选定区域内每个地区的各行业的潜力发展指标;
聚类优化单元:用于依据所述电力区位优势指标以及所述潜力发展指标,构建行业聚类模型,优化所述选定区域内的产业布局。
结合第二方面,在一种可能的实现方式中,所述数据获取单元,具体还用于:获取电力用户档案数据和用户用电数据,其中,所述电力用户档案数据来源于电力营销系统,所述用户用电数据来源于用户用电采集系统。
结合第二方面,在一种可能的实现方式中,所述指标确定单元,还具体用于,对所述用电数据的缺失值进行填充,以及异常值识别和处理。
结合第二方面,在一种可能的实现方式中,所述指标确定单元,还具体用于,所述电力区位优势指标包括电力区位商,所述选定区域内一个地区的一个行业的所述区位商计算公式为:
其中,i表示地区,m表示整个所述选定区域内地区的数量,j表示行业,n表示该地区内的行业数量;ELQij表示i地区j行业的所述电力区位商;Eij表示i地区j行业的用电量。
结合第二方面,在一种可能的实现方式中,所述指标确定单元,还具体用于,所述选定区域内一个地区的一个行业的所述潜力发展指标的计算方法包括:
计算所述选定区域内一个地区的一个行业的电力平均增长率,计算公式如下:
计算所述选定区域内一个地区的一个行业的相对增长比,计算公式如下:
分别对所述选定区域内一个地区的一个行业的用电量以及所述选定区域内一个地区的一个行业的相对增长比归一化处理,去除量纲的差异,计算公式如下:
其中,x表示所述选定区域内一个地区的一个行业的用电量集合,max(X)表示所述选定区域内一个地区的一个行业用电量集合中最大值,min(X)表示所述选定区域内一个地区的一个行业用电量集合中的最小值;或者,x表示所述选定区域内一个地区的一个行业的相对增长比的集合,max(X)表示所述选定区域内一个地区的一个行业相对增长比的集合中最大值,min(X)表示所述选定区域内一个地区的一个行业用电量相对增长比的集合中的最小值;
计算所述选定区域内一个地区的一个行业的所述潜力发展指标,计算公式如下:
其中,wk表示第k个指标的权重,Pij表示i地区j行业的发展潜力。
结合第二方面,在一种可能的实现方式中,所述聚类优化单元,还具体用于,所述构建行业聚类模型包括:
对于给定的训练样本{x(1),x(2),...,x(m)},每个x(i)∈R(n),选择K个点作为初始中心{c1,c2,...,ck};
使用每个所述聚类中的样本均值作为新的聚类中心;
判断本次的聚类中心与上次聚类中心的距离是否大于阈值或者迭代次数是否结束,若大于阈值且迭代次数未结束,返回前两个步骤,否则结束得到K类以及中心点。
结合第二方面,在一种可能的实现方式中,所述聚类优化单元,还具体用于,所述优化所述选定区域内的产业布局,包括:根据所述聚类模型的聚类结果挖掘符合区域发展的主导行业,优化产业内部布局。
第三方面,本申请还提供一种基于电力大数据的产业结构优化装置,其特征在于,包括存储器和处理器;
所述存储器用于存储计算机可执行指令;
所述处理器用于执行所述计算机可执行指令,以实现第一方面以及第一方面各种可能实现方式所述的方法。
第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质存储有可执行指令,计算机执行所述可执行指令时以实现第一方面以及第一方面各种可能实现方式所述的方法。
本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
本发明实施例通过采用了获取选定区域的用电数据,以及国家产业分类标准数据,在区域内的电力数据的应用上,能够及时的获取最新数据做数据分析,及时得到变化数据,基于“产业-行业-用户”所构建的产业结构数据池,在所构建的数据池中,产业包括三大产业,行业为电力细分行业,用户为电力非居民用户,根据产业结构数据池中的数据,计算电力区位优势指标以及各行业的潜力发展指标,电力区位优势指标可以找出区域内有一定优势地位的行业,电力区位优势指标值越大,说明该行业的优势地位越突出,各行业的潜力发展指标值越大,则说明该行业发展的潜力越大,上述得出的电力区位优势指标和各行业潜力发展指标,根据指标值结合聚类模型得,优化选定区域内的产业布局;有效解决了现有技术中应用电力大数据统计滞后性带来的难以实时诊断和优化,且统计占用大量的人工劳动力的问题,进而实现了整个过程无需人工干预,不需要对相关行业的发展进行人工统计,节省了大量的人力资源,同时兼具电力大数据和经济理论,使得分析结果的准确性大大提高,在本申请中使用的电力大数据,与传统的经济数据相比,时效性和准确性都有大幅的提高,实时分析当前的产业布局,反映当前区域的发展动向,能够挖掘各区域的优势行业,为区域经济发展提供助力,在本申请中还结合国家产业分类标准,建立了“产业-行业-用户”为对象的数据贯通机制,具有很强的复用性和扩展性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对本发明实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的基于电力大数据的产业结构优化方法的步骤流程图;
图2为本申请实施例提供的基于电力大数据的产业结构优化方法中潜力发展指标的计算步骤流程图;
图3为本申请实施例提供的基于电力大数据的产业结构优化方法中的产业的关系链;
图4为本申请实施例提供的基于电力大数据的产业结构优化方法中的行业详细信息表;
图5为本申请实施例提供的基于电力大数据的产业结构优化装置示意图;
图6为本申请实施例提供的基于电力大数据的产业结构优化实体装置示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请提供了一种基于电力大数据产业结构优化方法,如图1所示,该方法包括:
步骤S101:获取选定区域的用电数据,以及国家产业分类标准数据。
步骤S102:结合用电数据和国家产业分类标准数据,并基于“产业-行业-用户”的对应关系,构建产业结构数据池。
步骤S103:基于产业结构数据池的数据,确定选定区域内每个地区的各行业的电力区位优势指标以及选定区域内每个地区的各行业的潜力发展指标。
步骤S104:依据电力区位优势指标以及潜力发展指标,构建行业聚类模型,优化选定区域内的产业布局。
本申请通过上述的步骤,有效解决了现有技术中应用电力大数据统计滞后性带来的难以实施诊断和优化,且统计占用大量的人工劳动力的问题,进而实现了整个过程无需人工干预,不需要对相关行业的发展进行人工统计,节省了大量的人力资源,同时兼具电力大数据和经济理论,使得分析结果的准确性大大提高,在本申请中使用的电力大数据,与传统的经济数据相比,时效性和准确性都有大幅的提高,实时分析当前的产业布局,反映当前区域的发展动向,能够挖掘各区域的优势行业,为区域经济发展提供助力,在本申请中还结合国家产业分类标准,建立了“产业-行业-用户”为对象的数据贯通机制,具有很强的复用性和扩展性。
在步骤S101中,选定区域的用电数据包括:电力用户档案数据和用户用电数据;其中,电力用户档案数据来源于电力营销系统,用户用电数据来源于用户用电采集系统。并且在步骤S101中,国家产业分类标准数据是由中国统计局起草,国家质量监督检验检疫总局以及国家标准化管理委员会批准发布,主要阐述了行业细分标准及其代码,以及其所代表的含义。
在步骤S102中,“产业-行业-用户”的对应关系,其中包括三大产业,行业为电力细分行业,用户为电力非居民用户。进一步的在对应关系“行业-用户”的关系来源于过年电网用户用电档案数据表;“产业-行业”的关系来源于国民经济行业分类和代码2018,其中第一产业包括:农业、林业、畜牧业以及渔业四个行业,第二产业包括:建筑业和工业两个大行业中除去金属制品、机械和设备修理业的所有细分行业,第三产业为其他剩余细分行业。根据上述数据构建产业结构数据池。
在步骤S103中,在实施确定选定区域内每个地区的各行业的电力区位优势指标以及选定区域内每个地区的各行业的潜力发展指标前,还包括:
对用电数据的缺失值进行填充,以及异常值识别和处理。
在步骤S103中,电力区位优势指标包括电力区位商,选定区域内一个地区的一个行业的区位商计算公式为:
其中,i表示地区,m表示整个选定区域内地区的数量,j表示行业,n表示该地区内的行业数量;ELQij表示i地区j行业的电力区位商;Eij表示i地区j行业的用电量。
进一步的,电力区位商是被用作评价区域优势产业的方法,通过计算选定区域的电力区位商,可以找出该其区域内一个地区中具有一定优势地位的行业,上述ELQ值越大,意味着该行业的优势地位越突出,具体的:
若ELQij<1,则在选定的整个区域内,i地区在j行业上处于劣势地位;
若1<ELQij<2,则在选定的整个区域内,i地区在j行业上处于相对优势地位;
若ELQij>2,则在选定的整个区域内,i地区在j行业上处于绝对优势的地位。
进一步在步骤S103中,选定区域内一个地区的一个行业的潜力发展指标的计算方法包括:如图2所示,
步骤S201:计算选定区域内一个地区的一个行业的电力平均增长率,计算公式如下:
步骤S202:计算选定区域内一个地区的一个行业的相对增长比,计算公式如下:
步骤S203:分别对选定区域内一个地区的一个行业的用电量以及选定区域内一个地区的一个行业的相对增长比归一化处理,去除量纲的差异,计算公式如下:
其中,x表示选定区域内一个地区的一个行业的用电量集合,max(X)表示选定区域内一个地区的一个行业用电量集合中最大值,min(X)表示选定区域内一个地区的一个行业用电量集合中的最小值;或者,x表示选定区域内一个地区的一个行业的相对增长比的集合,max(X)表示选定区域内一个地区的一个行业相对增长比的集合中最大值,min(X)表示选定区域内一个地区的一个行业用电量相对增长比的集合中的最小值;
步骤S204:计算选定区域内一个地区的一个行业的潜力发展指标,计算公式如下:
其中,wk表示第k个指标的权重,Pij表示i地区j行业的发展潜力。
具体上述步骤S103中的计算选定区域内每个地区的各行业电力区位优势指标和选定区域内每个地区的各行业的潜力发展指标的步骤方法,优选的选择一个具体的实例来进行说明。
以辽宁省为例,即辽宁省为选定的区域,具体的实施步骤如下:首先依据电力内部行业细分规则,结合国家2018年国民经济行业与代码标准,构建行业到产业的关系链,具体如图3所示,先构建产业结构数据池,然后利用电力区位商机损公式,计算葫芦岛各行业电力区位商,以渔业为例:
具体的,可以得出辽宁省各个地区各个行业的电力区位商,葫芦岛各行业电力区位商如图4所示,当各行业的区位商ELQij>2时,该行业在辽宁省范围内为显著优势行业,具有很强的竞争力,输出地位突出;当细分行业电力区位商ELQij>1时,该行业在辽宁省范围内为比较优势行业,具有一定的竞争力;当细分行业电力区位商ELQij<1时,该行业在辽宁省范围内为比较劣势行业,竞争力相对较弱,该行业多为输入型行业。
在本申请的试验方法中,一共分析了辽宁身葫芦岛2019年行业62个,其中显著优势行业7个,比较优势的行业17个,比较劣势的行业38个,葫芦岛整体行业在辽宁省范围内的产业布局相对比较薄弱。
对于具有显著优势的行业而言,第一产业上有渔业和林业,第二产业上有有色金属采选业,化学原料和化工制造业,运输设备和煤炭开采洗选业,第三产业方面有农林牧渔辅助产业和铁路运输业。
进一步,就葫芦岛2015年至2019年只能以的用电量,计算葫芦岛电力增长率,基于一个地区的各行业的用电量,计算一个地区的各行业的用电增长率,综合两个指标,计算相对增长比率。
然后分别对葫芦岛内一个地区的一个行业的用电量以及选定区域内一个地区的一个行业的相对增长比归一化处理,去除量纲的差异,计算公式如下:
其中,x表示葫芦岛内一个地区的一个行业的用电量集合,max(X)表示选定区域内一个地区的一个行业用电量集合中最大值,min(X)表示葫芦岛内一个地区的一个行业用电量集合中的最小值;或者,x表示葫芦岛内一个地区的一个行业的相对增长比的集合,max(X)表示葫芦岛内一个地区的一个行业相对增长比的集合中最大值,min(X)表示葫芦岛内一个地区的一个行业用电量相对增长比的集合中的最小值。
然后,赋予一个行业的相对增长率与用电量权重各为1/2,计算区域某行业的发展潜力;
其中,wk表示第k个指标的权重,Pij表示i地区j行业的发展潜力。
在步骤S104中,构建行业聚类模型包括:(1)对于给定的训练样本{x(1),x(2),...,x(m)},每个x(i)∈R(n),选择K个点作为初始中心{c1,c2,...,ck};(2)对于每个样本点计算{d(c1,xi),d(c2,xi),...,d(ck,xi)}按照最小距离原则分配到最邻近的聚类,形成K个簇;其中,距离计算公式为(3)使用每个聚类中的样本均值作为新的聚类中心;(4)判断本次的聚类中心与上次聚类中心的距离是否大于阈值或者迭代次数是否结束,若大于阈值且迭代次数未结束,返回前两个步骤,否则结束得到K类以及中心点。将上述得出的多个电力区位优势指标以及各行业的潜力发展指标代入上述的(1)中,按照上述步骤得到该选地区域的聚类中心,对产业的优化给出建议。
根据步骤S104中,优化选定区域内的产业布局,包括:根据聚类模型的聚类结果挖掘符合区域发展的主导行业,优化产业内部布局。
虽然本申请提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。本实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照本实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
本申请还提供一种基于电力大数据的产业结构优化装置,如图5所示该装置包括:数据获取单元501,数据确定单元502,指标确定单元503,以及聚类优化单元504;其中数据获取单元501:用于获取选定区域的用电数据,以及国家产业分类标准数据;数据确定单元502:用于结合用电数据和国家产业分类标准数据,并基于“产业-行业-用户”的对应关系,构建产业结构数据池;指标确定单元503:用于基于产业结构数据池的数据,确定选定区域内每个地区的各行业的电力区位优势指标以及选定区域内每个地区的各行业的潜力发展指标;聚类优化单元504:用于依据电力区位优势指标以及潜力发展指标,构建行业聚类模型,优化选定区域内的产业布局。
数据获取单元501,具体还用于:获取电力用户档案数据和用户用电数据,其中,电力用户档案数据来源于电力营销系统,用户用电数据来源于用户用电采集系统。
指标确定单元503,还具体用于,对用电数据的缺失值进行填充,以及异常值识别和处理;还可以用于,电力区位优势指标包括电力区位商,选定区域内一个地区的一个行业的区位商计算公式为:
其中,i表示地区,m表示整个选定区域内地区的数量,j表示行业,n表示该地区内的行业数量;ELQij表示i地区j行业的电力区位商;Eij表示i地区j行业的用电量。
指标确定单元503,还具体用于,选定区域内一个地区的一个行业的潜力发展指标的计算方法包括:
计算选定区域内一个地区的一个行业的电力平均增长率,计算公式如下:
计算选定区域内一个地区的一个行业的相对增长比,计算公式如下:
分别对选定区域内一个地区的一个行业的用电量以及选定区域内一个地区的一个行业的相对增长比归一化处理,去除量纲的差异,计算公式如下:
其中,x表示选定区域内一个地区的一个行业的用电量集合,max(X)表示选定区域内一个地区的一个行业用电量集合中最大值,min(X)表示选定区域内一个地区的一个行业用电量集合中的最小值;或者,x表示选定区域内一个地区的一个行业的相对增长比的集合,max(X)表示选定区域内一个地区的一个行业相对增长比的集合中最大值,min(X)表示选定区域内一个地区的一个行业用电量相对增长比的集合中的最小值;
计算选定区域内一个地区的一个行业的潜力发展指标,计算公式如下:
其中,wk表示第k个指标的权重,Pij表示i地区j行业的发展潜力。
上述聚类优化单元504,还具体用于,构建行业聚类模型,包括:
对于给定的训练样本{x(1),x(2),...,x(m)},每个x(i)∈R(n),选择K个点作为初始中心{c1,c2,...,ck};
使用每个聚类中的样本均值作为新的聚类中心;
判断本次的聚类中心与上次聚类中心的距离是否大于阈值或者迭代次数是否结束,若大于阈值且迭代次数未结束,返回前两个步骤,否则结束得到K类以及中心点。
聚类优化单元504,还具体用于,优化选定区域内的产业布局,包括:根据聚类模型的聚类结果挖掘符合区域发展的主导行业,优化产业内部布局。
本申请还提供一种基于电力大数据的产业结构优化装置,如图6所示,该装置包括存储器601和处理器602;存储器601用于存储计算机可执行指令;处理器602用于执行计算机可执行指令,以实现上述基于电力大数据的产业结构优化方法。
上述实施例阐明的装置或模块,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现。当然,也可以将实现某功能的模块由多个子模块或子单元组合实现。
本申请中所述的方法、装置或模块可以以计算机可读程序代码方式实现控制器按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(英文:Application Specific Integrated Circuit;简称:ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本申请所述装置中的部分模块可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本申请还提供一种计算机可读存储介质,计算机可读存储介质存储有可执行指令,计算机执行可执行指令时能够实现上述基于电力大数据的产业结构优化方法。
上述存储介质包括但不限于随机存取存储器(英文:Random Access Memory;简称:RAM)、只读存储器(英文:Read-Only Memory;简称:ROM)、缓存(英文:Cache)、硬盘(英文:Hard Disk Drive;简称:HDD)或者存储卡(英文:Memory Card)。所述存储器可以用于存储计算机程序指令。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的硬件的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,也可以通过数据迁移的实施过程中体现出来。该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施方式采用递进的方式描述,各个实施方式之间相同或相似的部分互相参见即可,每个实施方式重点说明的都是与其他实施方式的不同之处。本申请的全部或者部分可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、移动通信终端、多处理器系统、基于微处理器的系统、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
以上实施例仅用以说明本申请的技术方案,而非对本申请限制;尽管参照前述实施例对本申请进行了详细的说明,本领域普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请技术方案的范围。
Claims (10)
1.一种基于电力大数据产业结构优化方法,其特征在于,包括:
获取选定区域的用电数据,以及国家产业分类标准数据;
结合所述用电数据和所述国家产业分类标准数据,并基于“产业-行业-用户”的对应关系,构建产业结构数据池;
基于所述产业结构数据池的数据,确定所述选定区域内每个地区的各行业的电力区位优势指标以及所述选定区域内每个地区的各行业的潜力发展指标;
依据所述电力区位优势指标以及所述潜力发展指标,构建行业聚类模型,优化所述选定区域内的产业布局。
2.根据权利要求1所述的方法,其特征在于,所述选定区域的用电数据包括:电力用户档案数据和用户用电数据;
其中,所述电力用户档案数据来源于电力营销系统,所述用户用电数据来源于用户用电采集系统。
3.根据权利要求1所述的方法,其特征在于,在实施所述确定所述选定区域内每个地区的各行业的电力区位优势指标以及所述选定区域内每个地区的各行业的潜力发展指标前,还包括:
对所述用电数据的缺失值进行填充,以及异常值识别和处理。
5.根据权利要求1或4所述的方法,其特征在于,所述选定区域内一个地区的一个行业的所述潜力发展指标的计算方法包括:
计算所述选定区域内一个地区的一个行业的电力平均增长率,计算公式如下:
计算所述选定区域内一个地区的一个行业的相对增长比,计算公式如下:
分别对所述选定区域内一个地区的一个行业的用电量以及所述选定区域内一个地区的一个行业的相对增长比归一化处理,去除量纲的差异,计算公式如下:
其中,x表示所述选定区域内一个地区的一个行业的用电量集合,max(X)表示所述选定区域内一个地区的一个行业用电量集合中最大值,min(X)表示所述选定区域内一个地区的一个行业用电量集合中的最小值;或者,x表示所述选定区域内一个地区的一个行业的相对增长比的集合,max(X)表示所述选定区域内一个地区的一个行业相对增长比的集合中最大值,min(X)表示所述选定区域内一个地区的一个行业用电量相对增长比的集合中的最小值;
计算所述选定区域内一个地区的一个行业的所述潜力发展指标,计算公式如下:
其中,wk表示第k个指标的权重,Pij表示i地区j行业的发展潜力。
7.根据权利要求1所述的方法,其特征在于,所述优化所述选定区域内的产业布局,包括:根据所述聚类模型的聚类结果挖掘符合区域发展的主导行业,优化产业内部布局。
8.一种基于电力大数据的产业结构优化装置,其特征在于,包括:
数据获取单元:用于获取选定区域的用电数据,以及国家产业分类标准数据;
数据确定单元:用于结合所述用电数据和所述国家产业分类标准数据,并基于“产业-行业-用户”的对应关系,构建产业结构数据池;
指标确定单元:用于基于所述产业结构数据池的数据,确定所述选定区域内每个地区的各行业的电力区位优势指标以及所述选定区域内每个地区的各行业的潜力发展指标;
聚类优化单元:用于依据所述电力区位优势指标以及所述潜力发展指标,构建行业聚类模型,优化所述选定区域内的产业布局。
9.一种基于电力大数据的产业结构优化装置,其特征在于,包括存储器和处理器;
所述存储器用于存储计算机可执行指令;
所述处理器用于执行所述计算机可执行指令,以实现权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有可执行指令,计算机执行所述可执行指令时能够实现如权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011523435.6A CN112651552A (zh) | 2020-12-22 | 2020-12-22 | 一种基于电力大数据产业结构优化方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011523435.6A CN112651552A (zh) | 2020-12-22 | 2020-12-22 | 一种基于电力大数据产业结构优化方法、装置及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112651552A true CN112651552A (zh) | 2021-04-13 |
Family
ID=75359619
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011523435.6A Pending CN112651552A (zh) | 2020-12-22 | 2020-12-22 | 一种基于电力大数据产业结构优化方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112651552A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113354004A (zh) * | 2021-06-10 | 2021-09-07 | 海南华福环境工程有限公司 | 基于互联网和大数据的污水处理方法及系统 |
CN116029535A (zh) * | 2023-03-27 | 2023-04-28 | 东莞先知大数据有限公司 | 一种供水压力预警方法、装置、电子设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109002520A (zh) * | 2018-07-09 | 2018-12-14 | 广东省农业科学院农业经济与农村发展研究所 | 一种区域农业规划产业选择的智能分析方法 |
CN109377049A (zh) * | 2018-10-23 | 2019-02-22 | 东南大学 | 一种“产业-行业-企业”全流程开发区产业选择方法 |
KR101967575B1 (ko) * | 2018-01-22 | 2019-04-09 | 고려대학교 세종산학협력단 | 광역자치단체의 시군구별 grdp의 효율적 추계를 위한 방법 및 시스템 |
CN110909779A (zh) * | 2019-11-12 | 2020-03-24 | 华北电力大学 | 一种区域综合能源供应系统的供能模式分类方法 |
CN111882235A (zh) * | 2020-08-03 | 2020-11-03 | 浪潮云信息技术股份公司 | 一种网格化的企业管理服务监测方法 |
-
2020
- 2020-12-22 CN CN202011523435.6A patent/CN112651552A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101967575B1 (ko) * | 2018-01-22 | 2019-04-09 | 고려대학교 세종산학협력단 | 광역자치단체의 시군구별 grdp의 효율적 추계를 위한 방법 및 시스템 |
CN109002520A (zh) * | 2018-07-09 | 2018-12-14 | 广东省农业科学院农业经济与农村发展研究所 | 一种区域农业规划产业选择的智能分析方法 |
CN109377049A (zh) * | 2018-10-23 | 2019-02-22 | 东南大学 | 一种“产业-行业-企业”全流程开发区产业选择方法 |
CN110909779A (zh) * | 2019-11-12 | 2020-03-24 | 华北电力大学 | 一种区域综合能源供应系统的供能模式分类方法 |
CN111882235A (zh) * | 2020-08-03 | 2020-11-03 | 浪潮云信息技术股份公司 | 一种网格化的企业管理服务监测方法 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113354004A (zh) * | 2021-06-10 | 2021-09-07 | 海南华福环境工程有限公司 | 基于互联网和大数据的污水处理方法及系统 |
CN113354004B (zh) * | 2021-06-10 | 2022-10-04 | 联合泰泽环境科技发展有限公司 | 基于互联网和大数据的污水处理方法及系统 |
CN116029535A (zh) * | 2023-03-27 | 2023-04-28 | 东莞先知大数据有限公司 | 一种供水压力预警方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Song et al. | Review of environmental efficiency and its influencing factors in China: 1998–2009 | |
CN107729555B (zh) | 一种海量大数据分布式预测方法及系统 | |
CN109446041B (zh) | 一种服务器压力预警方法、系统及终端设备 | |
CN112651552A (zh) | 一种基于电力大数据产业结构优化方法、装置及存储介质 | |
Zhang et al. | China’s energy intensity target allocation needs improvement! Lessons from the convergence analysis of energy intensity across Chinese Provinces | |
CN103559303A (zh) | 一种对数据挖掘算法的评估与选择方法 | |
CN110309131A (zh) | 海量结构化数据的质量评估方法及装置 | |
CN105139282A (zh) | 一种电网指标数据处理方法、装置以及计算设备 | |
CN116307215A (zh) | 一种电力系统的负荷预测方法、装置、设备及存储介质 | |
CN113312578A (zh) | 一种数据指标的波动归因方法、装置、设备、及介质 | |
CN111091245A (zh) | 一种参与有序用能企业的确定方法及装置 | |
CN113962477A (zh) | 一种产业电量关联聚集预测方法、装置、设备及存储介质 | |
CN112508260B (zh) | 基于对比学习的配电变压器中长期负荷预测方法及装置 | |
CN111404974B (zh) | 一种云计算效能评估方法、装置及评估设备 | |
CN111460293A (zh) | 信息推送方法、装置及计算机可读存储介质 | |
CN116894687A (zh) | 一种基于机器学习的用电量分析方法及系统、电子设备 | |
CN112614005B (zh) | 企业复工状态的处理方法和装置 | |
Wakasugi et al. | Productivity and FDI of Taiwan firms: a review from a nonparametric approach | |
CN113516275A (zh) | 一种配电网超短期负荷预测方法、装置及终端设备 | |
CN111882289A (zh) | 一种项目数据审核指标区间测算的装置和方法 | |
CN114580896A (zh) | 一种碳排放量数据分类方法、装置、电子设备及存储介质 | |
Liu et al. | A Discretization Algorithm for Meteorological Data and its Parallelization Based on Hadoop | |
CN115470853A (zh) | 一种特征分箱方法、装置、电子设备及存储介质 | |
CN117909706A (zh) | 造价影响因素的排序方法及装置、非易失性存储介质 | |
CN115455019A (zh) | 一种基于用户行为分析的搜索意图识别方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |