CN110322052B - 一种电能替代方案预测中的特征关联与分簇方法及装置 - Google Patents
一种电能替代方案预测中的特征关联与分簇方法及装置 Download PDFInfo
- Publication number
- CN110322052B CN110322052B CN201910506278.9A CN201910506278A CN110322052B CN 110322052 B CN110322052 B CN 110322052B CN 201910506278 A CN201910506278 A CN 201910506278A CN 110322052 B CN110322052 B CN 110322052B
- Authority
- CN
- China
- Prior art keywords
- energy
- enterprise
- clustering
- substitution
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000006467 substitution reaction Methods 0.000 claims abstract description 76
- 238000005265 energy consumption Methods 0.000 claims abstract description 15
- 238000006243 chemical reaction Methods 0.000 claims abstract description 8
- 238000012216 screening Methods 0.000 claims abstract description 8
- 238000005065 mining Methods 0.000 claims abstract description 6
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 230000008901 benefit Effects 0.000 claims description 11
- 230000007613 environmental effect Effects 0.000 claims description 6
- 238000003064 k means clustering Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 238000013138 pruning Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 230000007547 defect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000005611 electricity Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000739 chaotic effect Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- -1 electricity Substances 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P80/00—Climate change mitigation technologies for sector-wide applications
- Y02P80/10—Efficient use of energy, e.g. using compressed air or pressurized fluid as energy carrier
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Operations Research (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种电能替代方案预测中的特征关联与分簇方法及装置,采集电力企业数据库中各类企业能源替代前后相关数据,并进行预处理,作为能源代替数据进行存储;根据能源代替数据筛选实施能源替代转换的各行业高能耗企业,并将其能源代替数据作为标杆企业样本;对标杆企业样本进行聚类,得到同类能源替代标杆企业样本集;识别同类能源替代标杆企业样本集的能源替代相关频繁项集,得到同类能源替代方案频繁项集;挖掘同类能源替代方案频繁项集中的关联规则;根据关联规则进行电能替代方案预测中的特征关联和分簇。
Description
技术领域
本公开属于能源替代的技术领域,涉及一种电能替代方案预测中的特征关联与分簇方法及装置。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
随着我国工业经济的快速发展,环境污染、资源耗散、气候变化等问题日益突出,为实现国民经济持续健康发展,需加快能耗转型,大力发展清洁能源。然而,能源待转型企业在进行设备安装、改造、升级等过程中,存在工程量大、盈利慢、改换成本高等问题,进行能源替代方案的推行,存在较大的阻力,因此需要根据能源市场各类动态信息、激励机制以及用户对能耗替代的需求作出各类能源替代方案的动态成本预测,并基于概率统计的理念,通过能源等价成本的对比,获取相对竞争优势的最高边界电价,从而为电力企业制定电价标准提供数据支撑,实现以电能消费为主体的电能替代方案预测。
然而,发明人在研发过程中发现,以往的电能替代方案预测方案采用的预测规则及属性存在混乱且复杂的缺陷,导致预测结果不够精确,因此,如何在电能替代方案预测过程中进行特征关联与分簇是当前急需研究的一个课题。
发明内容
针对现有技术中存在的不足,本公开的一个或多个实施例提供了一种电能替代方案预测中的特征关联与分簇方法及装置,采用特征关联与分簇研究方法有效地梳理与分析在电能替代方案预测中的属性因素,提高了电能预测方案中的精确度,能够快速有效地对电能替代方案预测中的特征关联与分簇进行提取,为电能替代方案预测提供了有效的数据支持。
根据本公开的一个或多个实施例的一个方面,提供一种电能替代方案预测中的特征关联与分簇方法。
一种电能替代方案预测中的特征关联与分簇方法,该方法包括:
采集电力企业数据库中各类企业能源替代前后相关数据,并进行预处理,作为能源代替数据进行存储;
根据能源代替数据筛选实施能源替代转换的各行业高能耗企业,并将其能源代替数据作为标杆企业样本;
对标杆企业样本进行聚类,得到同类能源替代标杆企业样本集;
识别同类能源替代标杆企业样本集的能源替代相关频繁项集,得到同类能源替代方案频繁项集;
挖掘同类能源替代方案频繁项集中的关联规则;根据关联规则进行电能替代方案预测中的特征关联和分簇。
进一步地,在该方法中,采用K均值聚类方法对标杆企业样本进行聚类,得到同类能源替代标杆企业样本集。
进一步地,在该方法中,所述采用K均值聚类方法对标杆企业样本进行聚类的具体步骤包括:
随机选取k个标杆企业样本作为初始聚类中心;
分别计算剩余标杆企业样本数据到初始聚类中心的距离;
根据距离最小原则,对标杆企业样本数据进行分类,所述分类规则为将每个企业分配给距离它最近的聚类中心;
依据类内平均距离最小原则,计算每个聚类中的新的聚类中心;返回计算剩余标杆企业样本数据到初始聚类中心的距离,直到聚类中心不发生变化。
进一步地,在该方法中,识别同类能源替代标杆企业样本集的能源替代相关频繁项集的具体步骤包括:
接收同类能源替代标杆企业样本集的属性集合;
根据属性集合中的不同属性,生成单项属性集的集合;
根据单项属性集的集合寻找频繁单项属性集;
执行频繁项集连接,将两个k-1项频繁项集连接生成新的k项集;
将新生成的k项集执行频繁项集剪枝,删除一定不是频繁的k项集;
扫描样本数据库;
判断所有的频繁k项集是否为空,若为空,输出当前找到的所有频繁项集,若不为空,则返回寻找频繁单项属性集;
进一步地,在该方法中,所述同类能源替代标杆企业样本集的属性集合包括标杆企业能源替代前后的相关用能因素、用能产出效益和环保效益。
进一步地,在该方法中,所述根据单项属性集的集合寻找频繁单项属性集的具体步骤包括:
接收设定的最小支持度计数阈值;
统计同类能源替代标杆企业样本集的单项属性集的集合中所有元素出现的次数,得到支持度计数,将支持度计数小于最小支持度计数阈值的项集筛除,得到频繁单项属性集。
进一步地,在该方法中,所述执行频繁项集连接的具体步骤包括:
判断两个k-1项频繁项集是否可连接;
如果两个k-1项频繁项集可连接,则二者生成一个新的k项集。
进一步地,在该方法中,所述挖掘同类能源替代方案频繁项集中的关联规则的具体步骤包括:
提取规则后件只含一个项的所有高置信度规则;
使用在频繁项集产生时计算的支持度计数确定每个规则的置信度;
使用当前的高置信度规则来产生新的候选规则,得到关联规则。
根据本公开的一个或多个实施例的一个方面,提供一种计算机可读存储介质。
一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行所述的一种电能替代方案预测中的特征关联与分簇方法。
根据本公开的一个或多个实施例的一个方面,提供一种终端设备。
一种终端设备,其包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行所述的一种电能替代方案预测中的特征关联与分簇方法。
根据本公开的一个或多个实施例的一个方面,提供一种电能替代方案预测中的特征关联与分簇装置。
一种电能替代方案预测中的特征关联与分簇装置,基于所述的一种电能替代方案预测中的特征关联与分簇方法,包括:
数据采集模块,被配置为采集电力企业数据库中各类企业能源替代前后相关数据,并进行预处理,作为能源代替数据进行存储;
样本选取模块,被配置为根据能源代替数据筛选实施能源替代转换的各行业高能耗企业,并将其能源代替数据作为标杆企业样本;
聚类模块,被配置为对标杆企业样本进行聚类,得到同类能源替代标杆企业样本集;
频繁项集识别模块,被配置为识别同类能源替代标杆企业样本集的能源替代相关频繁项集,得到同类能源替代方案频繁项集;
特征关联和分簇模块,被配置为挖掘同类能源替代方案频繁项集中的关联规则;根据关联规则进行电能替代方案预测中的特征关联和分簇。
本公开的有益效果:
本公开提供的一种电能替代方案预测中的特征关联与分簇方法及装置,通过特征关联与分簇研究方法有效地梳理与分析在电能替代方案预测中的属性因素,解决了电能替代方案预测中,预测规则及属性存在混乱且复杂的缺陷,提高了预测精度,为能源替换提供了数据依据,响应了国家政策号召,改善了生态环境。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1是根据一个或多个实施例的一种电能替代方案预测中的特征关联与分簇方法流程图;
图2是根据一个或多个实施例的识别频繁项集流程流程图。
具体实施方式:
下面将结合本公开的一个或多个实施例中的附图,对本公开的一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本公开的一个或多个实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本实施例使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
需要注意的是,附图中的流程图和框图示出了根据本公开的各种实施例的方法和系统的可能实现的体系架构、功能和操作。应当注意,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分可以包括一个或多个用于实现各个实施例中所规定的逻辑功能的可执行指令。也应当注意,在有些作为备选的实现中,方框中所标注的功能也可以按照不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,或者它们有时也可以按照相反的顺序执行,这取决于所涉及的功能。同样应当注意的是,流程图和/或框图中的每个方框、以及流程图和/或框图中的方框的组合,可以使用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以使用专用硬件与计算机指令的组合来实现。
在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合,下面结合附图与实施例对本公开作进一步说明。
根据本公开的一个或多个实施例的一个方面,提供一种电能替代方案预测中的特征关联与分簇方法。
如图1所示,一种电能替代方案预测中的特征关联与分簇方法,该方法包括:
步骤S1:采集电力企业数据库中各类企业能源替代前后相关数据,并进行预处理,作为能源代替数据进行存储;
步骤S2:根据能源代替数据筛选实施能源替代转换的各行业高能耗企业,并将其能源代替数据作为标杆企业样本;
步骤S3:对标杆企业样本进行聚类,得到同类能源替代标杆企业样本集;
步骤S4:识别同类能源替代标杆企业样本集的能源替代相关频繁项集,得到同类能源替代方案频繁项集;
步骤S5:挖掘同类能源替代方案频繁项集中的关联规则;根据关联规则进行电能替代方案预测中的特征关联和分簇。
在本实施例的步骤S1中,各类企业能源替代前后相关数据抽取及预处理,基于电力企业所构建系统内的数据库,进行各类企业能源替代前后水、电、气、热等相关数据抽取,结合设备替换成本、用能产出效益等经济因素、环保效益等环境因素以及政府补贴等政策因素,作为能源替代采集数据,并进行数据预处理及存储。
在本实施例的步骤S2中,筛选能源替代标杆企业,基于能源替代数据筛选实施能源替代转换的各行业高能耗企业,并将其作为标杆企业样本。
在本实施例的步骤S3中,采用K均值聚类方法对标杆企业样本进行聚类,得到同类能源替代标杆企业样本集。
在该方法中,所述采用K均值聚类方法对标杆企业样本进行聚类的具体步骤包括:
步骤S301:随机选取k个标杆企业样本作为初始聚类中心;
步骤S302:分别计算剩余标杆企业样本数据到初始聚类中心的距离;
步骤S303:根据距离最小原则,对标杆企业样本数据进行分类,所述分类规则为将每个企业分配给距离它最近的聚类中心;
步骤S304:依据类内平均距离最小原则,计算每个聚类中的新的聚类中心;返回计算剩余标杆企业样本数据到初始聚类中心的距离,重复步骤S302-S304;直到聚类中心不发生变化。
在本实施例的步骤S4中,如图2所示,识别同类能源替代标杆企业样本集的能源替代相关频繁项集的具体步骤包括:
步骤S401:接收同类能源替代标杆企业样本集的属性集合;
步骤S402:根据属性集合中的不同属性,生成单项属性集的集合;
步骤S403:根据单项属性集的集合寻找频繁单项属性集;
步骤S404:执行频繁项集连接,将两个k-1项频繁项集连接生成新的k项集;
步骤S405:将新生成的k项集执行频繁项集剪枝,删除一定不是频繁的k项集;
步骤S406:扫描样本数据库;
步骤S407:判断所有的频繁k项集是否为空,若为空,输出当前找到的所有频繁项集,若不为空,则返回寻找频繁单项属性集;
步骤S408:输出当前找到的所有频繁项集。
在本实施例的步骤S401中,所述同类能源替代标杆企业样本集的属性集合包括标杆企业能源替代前后的相关用能因素、用能产出效益和环保效益。对标杆企业能源替代前后的用能量、设备替换成本等相关用能因素以及用能产出效益和环保效益进行搜集,从而获取基于标杆企业样本的包含h个属性的属性集合X=[x1,x2,…,xh]。
在本实施例的步骤S402中,生成单项属性集的集合Q1。将所有标杆企业中出现的各个属性组成一个集合,记为Q1,Q1可以看作是由所有的单项属性集组成的集合,即每个元素其实都是由一个属性构成的集合。
在本实施例的步骤S403中,所述根据单项属性集的集合寻找频繁单项属性集的具体步骤包括:
接收设定的最小支持度计数阈值minsup;
统计同类能源替代标杆企业样本集的单项属性集的集合中所有元素出现的次数,得到支持度计数与minsup比较,将支持度计数小于最小支持度计数阈值minsup的项集筛除,则剩余元素为频繁项集,上述频繁单项属性集组成的集合记为Qk,此时k=1,均为单项属性集合;
在本实施例的步骤S404中,进行频繁项集连接。令k=k+1,将两个k-1项频繁项集,组成一个k项频繁项集,所述执行频繁项集连接的具体步骤包括:
判断两个k-1项频繁项集是否可连接;
如果两个k-1项频繁项集可连接,则二者生成一个新的k项集。如某一k-1项频繁项集和另一个k-1项频繁项集可连接,则这两个k-1项频繁项集生成的新的k项集为lk[k]={l1[1],l1[2],…,l1[k-2],l1[k-1],l2[k-1]},如上所述只需找到所有的个两两组合,挑出其中可连接的,就能生成所有可能是频繁项集的k项候选集,构成的集合记为Qk。
在本实施例的步骤S405中,频繁项集剪枝。剪枝即初步筛选,频繁项集连接后,所有的频繁k项集的候选都存在于Qk中,对于每个候选k项集,找出所有其k-1项子集,并检查其是否存在于Lk-1中,若存在任意一项不在Lk-1内,则该k项集一定不是频繁的,从而删除该k项集。
在本实施例的步骤S406中,扫描样本数据库。扫描样本数据库D,找到所有样本中的项集的所有子集,找出在现在的Qk里面的子集,计数,从而统计出来Qk当中的所有项集的频数,若某一项集频数小于minsup,则删除该项集,得到频繁k项集组成的集合Lk。
在本实施例的步骤S407中,判断所有的频繁k项集Qk是否为空,若为空,输出当前找到的所有频繁项集,若不为空,则跳转到步骤S404。
根据后期预测需求,首先对高置信度的小范围频繁项集制定关联标准,随后,基于各个小范围频繁项集计值对满足置信度的大范围频繁项集设定关联规则,以电窑炉替代燃煤窑炉的部分小范围频繁项集为例进行示例说明,如图1所示
表1电窑炉替代燃煤窑炉部分频繁项集
在本实施例的步骤S5中,所述挖掘同类能源替代方案频繁项集中的关联规则的具体步骤包括:
步骤S501:提取规则后件只含一个项的所有高置信度规则;
步骤S502:使用在频繁项集产生时计算的支持度计数确定每个规则的置信度;
步骤S503:使用当前的高置信度规则来产生新的候选规则,得到关联规则。
在本实施例的步骤S502中,与生成频繁项集的步骤S404原理相似,不同之处在于,在规则产生时,不是通过扫描数据集计算候选规则的置信度,而是使用在频繁项集产生时计算的支持度计数来确定每个规则的置信度,计算公式如下:
此外,如果上层分支的任意节点具有低置信度,则剪掉该节点生成的整个子图。
通过计算得到具有强关联规则的分簇特征属性与各类预测目标的关联,从而实现各类能源替代途径的标杆企业强关联特征的分簇。
根据本公开的一个或多个实施例的一个方面,提供一种计算机可读存储介质。
一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行所述的一种电能替代方案预测中的特征关联与分簇方法。
根据本公开的一个或多个实施例的一个方面,提供一种终端设备。
一种终端设备,其包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行所述的一种电能替代方案预测中的特征关联与分簇方法。
这些计算机可执行指令在设备中运行时使得该设备执行根据本公开中的各个实施例所描述的方法或过程。
在本实施例中,计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
本文所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开内容操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开内容的各个方面。
根据本公开的一个或多个实施例的一个方面,提供一种电能替代方案预测中的特征关联与分簇装置。
一种电能替代方案预测中的特征关联与分簇装置,基于所述的一种电能替代方案预测中的特征关联与分簇方法,包括:
数据采集模块,被配置为采集电力企业数据库中各类企业能源替代前后相关数据,并进行预处理,作为能源代替数据进行存储;
样本选取模块,被配置为根据能源代替数据筛选实施能源替代转换的各行业高能耗企业,并将其能源代替数据作为标杆企业样本;
聚类模块,被配置为对标杆企业样本进行聚类,得到同类能源替代标杆企业样本集;
频繁项集识别模块,被配置为识别同类能源替代标杆企业样本集的能源替代相关频繁项集,得到同类能源替代方案频繁项集;
特征关联和分簇模块,被配置为挖掘同类能源替代方案频繁项集中的关联规则;根据关联规则进行电能替代方案预测中的特征关联和分簇。
应当注意,尽管在上文的详细描述中提及了设备的若干模块或子模块,但是这种划分仅仅是示例性而非强制性的。实际上,根据本公开的实施例,上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之,上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。
本公开的有益效果:
本公开提供的一种电能替代方案预测中的特征关联与分簇方法及装置,通过特征关联与分簇研究方法有效地梳理与分析在电能替代方案预测中的属性因素,解决了电能替代方案预测中,预测规则及属性存在混乱且复杂的缺陷,提高了预测精度,为能源替换提供了数据依据,响应了国家政策号召,改善了生态环境。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (9)
1.一种电能替代方案预测中的特征关联与分簇方法,其特征在于,该方法包括:
采集电力企业数据库中各类企业能源替代前后相关数据,并进行预处理,作为能源代替数据进行存储;
根据能源代替数据筛选实施能源替代转换的各行业高能耗企业,并将其能源代替数据作为标杆企业样本;
对标杆企业样本进行聚类,得到同类能源替代标杆企业样本集;
识别同类能源替代标杆企业样本集的能源替代相关频繁项集,得到同类能源替代方案频繁项集;
挖掘同类能源替代方案频繁项集中的关联规则;
具体步骤为:提取规则后件只含一个项的所有高置信度规则;
使用在频繁项集产生时计算的支持度计数确定每个规则的置信度;计算公式如下:
使用当前的高置信度规则来产生新的候选规则,得到关联规则;
根据关联规则进行电能替代方案预测中的特征关联和分簇。
2.如权利要求1所述的一种电能替代方案预测中的特征关联与分簇方法,其特征在于,在该方法中,采用K均值聚类方法对标杆企业样本进行聚类,得到同类能源替代标杆企业样本集;
所述采用K均值聚类方法对标杆企业样本进行聚类的具体步骤包括:
随机选取k个标杆企业样本作为初始聚类中心;
分别计算剩余标杆企业样本数据到初始聚类中心的距离;
根据距离最小原则,对标杆企业样本数据进行分类,所述分类规则为将每个企业分配给距离它最近的聚类中心;
依据类内平均距离最小原则,计算每个聚类中的新的聚类中心;返回计算剩余标杆企业样本数据到初始聚类中心的距离,直到聚类中心不发生变化。
3.如权利要求1所述的一种电能替代方案预测中的特征关联与分簇方法,其特征在于,在该方法中,识别同类能源替代标杆企业样本集的能源替代相关频繁项集的具体步骤包括:
接收同类能源替代标杆企业样本集的属性集合;
根据属性集合中的不同属性,生成单项属性集的集合;
根据单项属性集的集合寻找频繁单项属性集;
执行频繁项集连接,将两个k-1项频繁项集连接生成新的k项集;
将新生成的k项集执行频繁项集剪枝,删除一定不是频繁的k项集;
扫描样本数据库;
判断所有的频繁k项集是否为空,若为空,输出当前找到的所有频繁项集,若不为空,则返回寻找频繁单项属性集。
4.如权利要求3所述的一种电能替代方案预测中的特征关联与分簇方法,其特征在于,在该方法中,所述同类能源替代标杆企业样本集的属性集合包括标杆企业能源替代前后的相关用能因素、用能产出效益和环保效益。
5.如权利要求3所述的一种电能替代方案预测中的特征关联与分簇方法,其特征在于,在该方法中,所述根据单项属性集的集合寻找频繁单项属性集的具体步骤包括:
接收设定的最小支持度计数阈值;
统计同类能源替代标杆企业样本集的单项属性集的集合中所有元素出现的次数,得到支持度计数,将支持度计数小于最小支持度计数阈值的项集筛除,得到频繁单项属性集。
6.如权利要求3所述的一种电能替代方案预测中的特征关联与分簇方法,其特征在于,在该方法中,所述执行频繁项集连接的具体步骤包括:
判断两个k-1项频繁项集是否可连接;
如果两个k-1项频繁项集可连接,则二者生成一个新的k项集。
7.一种计算机可读存储介质,其中存储有多条指令,其特征在于,所述指令适于由终端设备的处理器加载并执行如权利要求1-6任一项所述的一种电能替代方案预测中的特征关联与分簇方法。
8.一种终端设备,其包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,其特征在于,所述指令适于由处理器加载并执行如权利要求1-6任一项所述的一种电能替代方案预测中的特征关联与分簇方法。
9.一种电能替代方案预测中的特征关联与分簇装置,其特征在于,基于如权利要求1-6任一项所述的一种电能替代方案预测中的特征关联与分簇方法,包括:
数据采集模块,被配置为采集电力企业数据库中各类企业能源替代前后相关数据,并进行预处理,作为能源代替数据进行存储;
样本选取模块,被配置为根据能源代替数据筛选实施能源替代转换的各行业高能耗企业,并将其能源代替数据作为标杆企业样本;
聚类模块,被配置为对标杆企业样本进行聚类,得到同类能源替代标杆企业样本集;
频繁项集识别模块,被配置为识别同类能源替代标杆企业样本集的能源替代相关频繁项集,得到同类能源替代方案频繁项集;
特征关联和分簇模块,被配置为挖掘同类能源替代方案频繁项集中的关联规则;根据关联规则进行电能替代方案预测中的特征关联和分簇。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910506278.9A CN110322052B (zh) | 2019-06-12 | 2019-06-12 | 一种电能替代方案预测中的特征关联与分簇方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910506278.9A CN110322052B (zh) | 2019-06-12 | 2019-06-12 | 一种电能替代方案预测中的特征关联与分簇方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110322052A CN110322052A (zh) | 2019-10-11 |
CN110322052B true CN110322052B (zh) | 2022-05-20 |
Family
ID=68119531
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910506278.9A Active CN110322052B (zh) | 2019-06-12 | 2019-06-12 | 一种电能替代方案预测中的特征关联与分簇方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110322052B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107292508A (zh) * | 2017-06-16 | 2017-10-24 | 北京中电普华信息技术有限公司 | 一种电能替代潜力的分析预测方法及系统 |
CN108227644A (zh) * | 2017-12-07 | 2018-06-29 | 国网北京市电力公司 | 一种设备替代方法、装置、存储介质及电子装置 |
CN109461025A (zh) * | 2018-10-23 | 2019-03-12 | 国网湖南省电力公司节能管理分公司 | 一种基于机器学习的电能替代潜在客户预测方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102636991A (zh) * | 2012-04-18 | 2012-08-15 | 国电科学技术研究院 | 一种基于模糊集关联规则的火电机组运行参数优化方法 |
US10467236B2 (en) * | 2014-09-29 | 2019-11-05 | International Business Machines Corporation | Mining association rules in the map-reduce framework |
CN107145959A (zh) * | 2017-03-23 | 2017-09-08 | 北京国电通网络技术有限公司 | 一种基于大数据平台的电力数据处理方法 |
US10802453B2 (en) * | 2017-06-02 | 2020-10-13 | Bank Of America Corporation | Robotics process automation macro bot |
CN108491987A (zh) * | 2017-12-28 | 2018-09-04 | 国网能源研究院有限公司 | 一种地区电能替代形势分析规划方法 |
CN108764584B (zh) * | 2018-06-05 | 2021-04-09 | 国网浙江省电力有限公司 | 一种企业电能替代潜力评估方法 |
-
2019
- 2019-06-12 CN CN201910506278.9A patent/CN110322052B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107292508A (zh) * | 2017-06-16 | 2017-10-24 | 北京中电普华信息技术有限公司 | 一种电能替代潜力的分析预测方法及系统 |
CN108227644A (zh) * | 2017-12-07 | 2018-06-29 | 国网北京市电力公司 | 一种设备替代方法、装置、存储介质及电子装置 |
CN109461025A (zh) * | 2018-10-23 | 2019-03-12 | 国网湖南省电力公司节能管理分公司 | 一种基于机器学习的电能替代潜在客户预测方法 |
Non-Patent Citations (2)
Title |
---|
Transformer defect correlation analysis based on Apriori algorithm;Yufeng Chen等;《2016 IEEE International Conference on High Voltage Engineering and Application (ICHVE)》;20161229;1-4 * |
基于AHP和灰色关联分析的电能替代效果评估;苗常海;《控制工程》;20180531;第25卷(第5期);903-909 * |
Also Published As
Publication number | Publication date |
---|---|
CN110322052A (zh) | 2019-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10846052B2 (en) | Community discovery method, device, server and computer storage medium | |
CN111782965B (zh) | 意图推荐方法、装置、设备及存储介质 | |
US10157239B2 (en) | Finding common neighbors between two nodes in a graph | |
CN107832407B (zh) | 用于生成知识图谱的信息处理方法、装置和可读存储介质 | |
EP3206146A1 (en) | Data information processing method and device | |
CN108694221B (zh) | 数据实时分析方法、模块、设备和装置 | |
CN102479223A (zh) | 数据查询方法及系统 | |
US20150178406A1 (en) | Counting triangles in a graph | |
CN112183052B (zh) | 一种文档重复度检测方法、装置、设备和介质 | |
CN112364014A (zh) | 数据查询方法、装置、服务器及存储介质 | |
CN112148841A (zh) | 一种对象分类以及分类模型构建方法和装置 | |
CN110674290B (zh) | 一种用于重叠社区发现的关系预测方法、装置和存储介质 | |
CN110473530B (zh) | 指令分类方法、装置、电子设备及计算机可读存储介质 | |
CN112115313A (zh) | 正则表达式的生成、数据提取方法、装置、设备及介质 | |
CN110147223B (zh) | 组件库的生成方法、装置及设备 | |
CN117592561B (zh) | 企业数字化运营多维数据分析方法及系统 | |
CN114491081A (zh) | 基于数据血缘关系图谱的电力数据溯源方法及系统 | |
CN104123393B (zh) | 一种短信文本的分类方法和系统 | |
CN110322052B (zh) | 一种电能替代方案预测中的特征关联与分簇方法及装置 | |
CN111628888B (zh) | 一种故障诊断方法、装置、设备及计算机存储介质 | |
CN112364185A (zh) | 多媒体资源的特征确定方法、装置、电子设备和存储介质 | |
US10169418B2 (en) | Deriving a multi-pass matching algorithm for data de-duplication | |
CN115994534A (zh) | 政务场景热词挖掘方法、装置、设备及存储介质 | |
CN103457829A (zh) | 基于helpdesk自动化邮件系统的邮件处理方法和系统 | |
CN115270689A (zh) | 一种原理图差异位置识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |