CN116701965A - 一种基于birch聚类算法的企业用户全景碳画像方法 - Google Patents
一种基于birch聚类算法的企业用户全景碳画像方法 Download PDFInfo
- Publication number
- CN116701965A CN116701965A CN202310450944.8A CN202310450944A CN116701965A CN 116701965 A CN116701965 A CN 116701965A CN 202310450944 A CN202310450944 A CN 202310450944A CN 116701965 A CN116701965 A CN 116701965A
- Authority
- CN
- China
- Prior art keywords
- user
- carbon
- enterprise
- carbon emission
- users
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 229910052799 carbon Inorganic materials 0.000 title claims abstract description 201
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 title claims abstract description 194
- 238000000034 method Methods 0.000 title claims abstract description 56
- 235000018185 Betula X alpestris Nutrition 0.000 title claims abstract description 24
- 235000018212 Betula X uliginosa Nutrition 0.000 title claims abstract description 24
- 230000005611 electricity Effects 0.000 claims abstract description 71
- 238000004458 analytical method Methods 0.000 claims abstract description 18
- 230000006399 behavior Effects 0.000 claims abstract description 13
- 238000004364 calculation method Methods 0.000 claims abstract description 9
- 238000004140 cleaning Methods 0.000 claims abstract description 7
- 239000013598 vector Substances 0.000 claims description 18
- 238000005265 energy consumption Methods 0.000 claims description 16
- 230000035945 sensitivity Effects 0.000 claims description 10
- 238000003780 insertion Methods 0.000 claims description 8
- 230000037431 insertion Effects 0.000 claims description 8
- 102000003712 Complement factor B Human genes 0.000 claims description 7
- 108090000056 Complement factor B Proteins 0.000 claims description 7
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 claims description 6
- 238000007670 refining Methods 0.000 claims description 5
- 238000013077 scoring method Methods 0.000 claims description 4
- 235000012571 Ficus glomerata Nutrition 0.000 claims description 3
- 244000153665 Ficus glomerata Species 0.000 claims description 3
- 229910002092 carbon dioxide Inorganic materials 0.000 claims description 3
- 239000001569 carbon dioxide Substances 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 238000006467 substitution reaction Methods 0.000 claims description 3
- 238000003384 imaging method Methods 0.000 claims 1
- 238000011160 research Methods 0.000 abstract description 2
- 238000012216 screening Methods 0.000 abstract description 2
- 238000013480 data collection Methods 0.000 abstract 1
- 238000009826 distribution Methods 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/80—Management or planning
- Y02P90/84—Greenhouse gas [GHG] management systems
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Educational Administration (AREA)
- Bioinformatics & Computational Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于BIRCH聚类算法的企业用户全景碳画像方法,属于企业用户碳排放分析技术领域,包括:企业用户调研及数据搜集,包括企业自身多维度特征及历史碳排放数据、用电数据;数据清洗与分析,基于获取的企业数据,分析其碳排放及影响其碳排放的用电行为,筛选出能够有效刻画用户碳排放特征的指标;构建用户碳画像标签库,分为用电标签、碳排放标签和企业经济相关标签,明确各标签的类型和计算方法;采用利用层次方法的平衡迭代规约和聚类算法实现对企业用户的全景碳画像,阐述BIRCH算法实现用户碳画像的具体流程。获得企业用户模型,为企业用户优化自身用能方式和降低碳排放、为综合能源服务商分析用户需求和设计低碳产品及服务提供参考。
Description
技术领域
本发明属于企业用户碳排放分析技术领域,具体涉及一种基于BIRCH聚类算法的企业用户全景碳画像方法。
背景技术
在我国逐步推进“双碳”目标实现的背景下,各企业作为我国当前用能与碳排放的重要主体,对其碳排放限制及考核会更加严格。对企业用户的碳排放和用能水平及特征进行全面、准确的评估有助于企业逐步调整能源消耗习惯,提高科学用能水平,从而逐步降低碳排放。企业用户全景碳画像即分析和刻画企业的碳排放特点,以及影响其碳排放的相关用能特点、企业自身多维度属性,筛选出较为重要的碳画像指标,从而构建标签化的用户模型,能够为企业改变自身用能方式、减少碳排放并降低碳交易成本提供参考,并为提供综合能源及相关碳减排服务的第三方分析用户需求、设计产品和服务提供数据支撑。但目前对如何实现企业用户碳画像的相关研究较为缺乏。
因此,现阶段设计一种基于BIRCH聚类算法的企业用户全景碳画像方法,来解决以上问题。
发明内容
本发明目的在于提供一种基于BIRCH聚类算法的企业用户全景碳画像方法,用于解决上述现有技术中存在的技术问题,从倡导节能减排带来的实际需求出发,需要对企业的碳排放进行全面的分析和评估,可见对其进行全景碳画像具有积极的现实意义。
为实现上述目的,本发明的技术方案是:
一种基于BIRCH聚类算法的企业用户全景碳画像方法,包括以下步骤:
步骤1,调研并收集企业用户,为分析其碳排放、用能特征提供数据支持;
步骤2,数据清洗与分析,筛选出能够有效刻画企业碳排放及影响其碳排放的指标;
步骤3,构建全景碳画像标签库;
步骤4,利用BIRCH算法实现碳画像,并阐述使用此算法画像的具体流程。
进一步的,步骤1中的企业数据包括企业的自身多维度特性以及历史碳排放量、历史用电量,其中,企业的自身多维度特性包括年产值、产业结构、企业人口数目。
进一步的,步骤2中的数据清洗与分析包括对企业用户的用电行为和碳排放行为分析;
前者分析用电模式,并联系企业用户自身特性分析其用电特点;
后者包括企业用户碳排放特征分析和提取,并联系用户用电行为和自身多为特性分析其碳排放特点。
进一步的,步骤3中的碳画像标签库包括:企业用户碳排放特征标签、影响企业碳排放的用电标签、与碳排放相关的企业经济维度特征标签三个一级标签;
各标签计算和打分方法如下:
超额碳排放量占比B1:表示用户在一段时间内实际碳排放量与其碳配额的比值;
式中:V、VA分别为用户的实际碳排放和碳配额;
年碳排放总量B2:反映用户一年的碳排放总量水平,按不同的碳排放量划分为四个等级并赋分,分别为低对应1分、中对应2分、较高对应3分、高对应4分;
人均碳排放量B3:表示在一定时间尺度下,企业用户的碳排放总量与企业内人口数目的比值;
式中:NP为企业用户的总人口数目;
碳排放量增长情况B4:反映用户在相同时间尺度下额碳排放量增长情况;
式中:N为总年数,Vi为用户第i年的碳排放量;
电能-碳集约度B5:即用户发生单位电能消耗时产生的二氧化碳排放量,单位为tCO2/MWh;反映一定时间尺度下用户的能源结构和电能替代水平,以及用户生产过程中的用能效率;
式中:P为企业用户的用电量;
影响企业碳排放的用电标签计算和打分方法如下:
日均用电量D1:反映企业用户在一段时间内每日的平均用电量;
式中:Pi为用户第i天的用电量;
峰谷差率D2:表示用户的日用电曲线中,峰、谷用电量之差与峰时用电量的比值;用户N天内的峰谷差率计算公式如下:
式中:Pi p、Pi v分别为用户第i天的峰时段、谷时段用电量;
峰谷特性偏好D3:按用户典型的日用电曲线中峰、谷、平不同时段的用电情况,分为峰偏好、谷偏好、峰谷均衡三类,同时考虑到聚类算法只能对数字进行处理,将三类峰谷特性进行赋分,分别为峰偏好对应1分、谷偏好对应2分、峰谷均衡对应3分;
用电量增长情况D4:表示用户在相同时间长度N下总用电量增长率;
电价敏感程度D5:反映用户一段时间内的用电曲线和电价曲线变化趋势的相关程度,即用户对电价的敏感程度;采用斯皮尔曼相关系数描述用户用电曲线与电价曲线变化变化趋势的一致性;计算公式为:
式中:ρ为向量x1、x2间的斯皮尔曼相关系数,其取值范围为[-1,1],绝对值越大,代表两个向量间变化方向的相关性越强,反之则越弱,ρ的正负反映两组数据间变化趋势,ρ小于0为负相关,ρ大于0为正相关;T为向量维度,δ(x1,x2)表示向量x1、x2中各元素按降序排列后,对应元素的序号之差;
利用斯皮尔曼相关系数,计算用户在N天内的电价敏感系数D5:
式中:pi、Pi分别表示第i天的电价数据向量和用户负荷数据向量;
与碳排放相关的企业经济维度特征标签的计算方法如下:
单位产值能耗M1:表示企业用户的年用电量与GDP总量的比值,单位MWh/万元,反映企业的产业结构和工序、设备的先进程度;
碳排放强度M2:表示企业用户年碳排放总量与GDP总量的比值,单位t CO2/万元;
进一步的,步骤4中利用层次方法的平衡迭代规约和聚类方法实现企业用户全景碳画像流程为:
S1:初始化聚类参数:设置用户碳画像特征聚类树的内部节点平衡因子B、叶节点平衡因子L、簇半径阈值T;基于获得的企业用户数据,计算用户的各画像标签值,形成N个用户的画像标签特征集,
F={f1,f2,f3,…,fn}
其中,
fi=[Βi,Di,Mi]
Βi=[Bi1,Bi2,Bi3,Bi4,Bi5]
Di=[Di1,Di2,Di3,Di4,Di5]
Mi=[Mi1,Mi2]
并令用户编号i=1;
S2:用户初步碳画像;
步骤S21:选择反映用户碳排放特征的标签集Βi=[Bi1,Bi2,Bi3,Bi4,Bi5],将Βi插入聚类特征树,即CF树;若CF树为空树,则创建一个空的叶子节点和聚类簇,即CF三元组,从属于父节点,并将Βi放入聚类簇中,将这个簇作为叶子节点的第一个孩子节点,并更新聚类簇和此叶子节点的CF数据,进入步骤S27;若CF树非空树,则进入步骤S22;
步骤S22:计算Βi与当前各叶子节点的簇平均连通距离d2选取与表征当前用户碳排放特征的标签集Βi距离最近的用户聚类簇,并插入Βi;
步骤S23:计算插入Βi后的用户聚类簇的分布半径r,若r小于簇半径阈值T,则数据插入结束,进入步骤S27;否则从当前用户聚类簇中删除Βi,进入步骤S24;
步骤S24:比较当前叶子节点下的用户聚类簇数目,即CF数目,与叶节点平衡因子L,若CF数目小于L,则创建一个新的用户聚类簇,将Βi插入其中,并转步骤S27;否则进入步骤S25;
步骤S25:若当前叶子节点所属内部节点的CF数目未超过内部节点平衡因子B的限制,将此叶子节点分裂为两个新叶子节点,将旧叶子节点中两个距离最远的聚类簇分别作为新叶子节点的第一个用户聚类簇,将待插入数据Βi和旧叶子节点内所有的聚类簇按与两个新叶子节点的距离远近插入,形成新的用户聚类簇并进入步骤S27;否则,进入步骤S26;
步骤S26:依次向上直至父节点,检查各节点否需要分裂,若是,则分裂与数据插入过程同步骤S25;
步骤S27:完成对数据Βi插入后,更新路径上所有节点中的用户聚类簇数据;
步骤S28:检查当前用户编号i是否等于所有用户数目N,若是,则按用户碳排放特征标签对所有用户的初步聚类完成,得到具有类似碳排放特征的不同类用户;若不是,则令i=i+1,返回步骤S21;
S3:精细化画像过程;
基于得到的初步用户画像,加入影响用户i碳排放的用电标签特征集Di和经济特征标签集Mi,对用户进行精细化碳画像,聚类过程与初步画像过程类似;精细化画像结束后,得到企业用户的全景碳画像。
与现有技术相比,本发明所具有的有益效果为:
本方案其中一个有益效果在于,通过分析企业用户的碳排放与用电特点、企业自身多维度属性,构建碳排放画像标签库,并采用BIRCH聚类算法实现对企业用户的全景碳画像。能够获得标签化的体现碳排放、用电和自身属性的企业用户模型,为企业用户优化自身用能方式和降低碳排放、为综合能源服务商分析用户需求和设计低碳产品及服务提供参考。
附图说明
图1为本发明的整体方法示意图。
图2为本发明的碳画像标签库分类图。
图3为本发明的基于BIRCH聚类算法的画像流程图。
具体实施方式
为了使本发明的目的,技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,即所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
提出一种基于BIRCH聚类算法的企业用户全景碳画像方法,包括以下步骤:
步骤1,调研并收集企业用户,为分析其碳排放、用能特征提供数据支持;
步骤2,数据清洗与分析,筛选出能够有效刻画企业碳排放及影响其碳排放的指标;
步骤3,构建全景碳画像标签库;
步骤4,利用BIRCH算法实现碳画像,并阐述使用此算法画像的具体流程。
优选的,所述步骤1中企业数据包括企业的自身多维度特性(年产值、产业结构、企业人口数目等)以及历史碳排放量、历史用电量等数据。
优选的,所述步骤2中数据清洗与分析包括对企业用户的用电行为和碳排放行为分析,前者主要分析用电模式,并联系企业用户自身特性分析其用电特点;后者主要包括企业用户碳排放特征分析和提取,并联系用户用电行为和自身多为特性分析其碳排放特点。
优选的,所述步骤3中的碳画像标签库包括:企业用户碳排放特征标签、影响企业碳排放的用电标签、与碳排放相关的企业经济维度特征标签三个一级标签,各一级标签包含的二级标签如下所示:
所述企业用户碳排放特征标签包含的二级标签及各标签类型如表1所示:
表1企业用户碳排放特征标签
表1中各标签计算和打分方法如下:
超额碳排放量占比B1:表示用户在一段时间内(一般为一年)实际碳排放量与其碳配额的比值。
式中:V、VA分别为用户的实际碳排放和碳配额。
年碳排放总量B2:反映用户一年的碳排放总量水平,按不同的碳排放量划分为四个等级并赋分,分别为低(1分)、中(2分)、较高(3分)、高(4分)。
人均碳排放量B3:表示在一定时间尺度(一般为一年)下,企业用户的碳排放总量与企业内人口数目的比值。
式中:NP为企业用户的总人口数目。
碳排放量增长情况B4:反映用户在相同时间尺度下(一般为一年)额碳排放量增长情况。
式中:N为总年数,Vi为用户第i年的碳排放量。
电能-碳集约度B5:即用户发生单位电能消耗时产生的二氧化碳排放量(t CO2/MWh)。能够反映一定时间尺度下用户的能源结构和电能替代水平,以及用户生产过程中的用能效率等。
式中:P为企业用户的用电量。
所述影响企业碳排放的用电标签包含的二级标签及各标签类型如表2所示:
表2影响企业碳排放的用电特征标签
表2中各标签计算和打分方法如下:
日均用电量D1:反映企业用户在一段时间(N天)内每日的平均用电量,一般取一年(N=365)。
式中:Pi为用户第i天的用电量。
峰谷差率D2:表示用户的日用电曲线中,峰、谷用电量之差与峰时用电量的比值。用户N天内的峰谷差率计算公式如下:
式中:Pi p、Pi v分别为用户第i天的峰时段、谷时段用电量。
峰谷特性偏好D3:按用户典型的日用电曲线中峰、谷、平不同时段的用电情况,分为峰偏好、谷偏好、峰谷均衡三类,同时考虑到聚类算法只能对数字进行处理,将三类峰谷特性进行赋分,分别为峰偏好(1分)、谷偏好(2分)、峰谷均衡(3分)。
用电量增长情况D4:表示用户在相同时间长度N(N一般可取年为时间长度)下总用电量增长率。
电价敏感程度D5:反映用户一段时间内的用电曲线和电价曲线变化趋势的相关程度,即用户对电价的敏感程度。采用斯皮尔曼(Spearman)相关系数描述用户用电曲线与电价曲线变化变化趋势的一致性。斯皮尔曼系数是一种秩相关系数,又称等级相关系数,能够反映两个随机变量之间的变化趋势和趋势强度之间的关联,还能同时反映变化趋势的方向。相比要求两组变量为连续变量、满足正态分布且为线性的Pearson相关系数,斯皮尔曼相关系数对数据的要求较为宽松。斯皮尔曼相关系数是将两个随机变量的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量,计算公式为:
式中:ρ为向量x1、x2间的斯皮尔曼相关系数,其取值范围为[-1,1],绝对值越大,代表两个向量间变化方向的相关性越强,反之则越弱,ρ的正负反映了两组数据间变化趋势的方法,ρ小于0为负相关,ρ大于0为正相关。T为向量维度,δ(x1,x2)表示向量x1、x2中各元素按降序排列后,对应元素的序号之差。
利用斯皮尔曼相关系数,计算用户在N天内的电价敏感系数D5:
式中:pi、Pi分别表示第i天的电价数据向量和用户负荷数据向量。
所述与碳排放相关的企业经济维度特征标签包含的二级标签及各标签类型如表3所示:
表3企业经济维度标签
表3中各标签的计算方法如下:
单位产值能耗M1:表示企业用户的年用电量与GDP总量的比值(MWh/万元),能一定程度上反映企业的产业结构和工序、设备的先进程度等特点。
碳排放强度M2:表示企业用户年碳排放总量与GDP总量的比值(t CO2/万元)。
优选的,所述步骤4中利用BIRCH算法实现企业用户全景碳画像的流程为:
S1:初始化聚类参数:设置用户碳画像特征聚类树的内部节点平衡因子B、叶节点平衡因子L、簇半径阈值T。基于获得的企业用户数据,计算用户的各画像标签值,形成n个用户的画像标签特征集
F={f1,f2,f3,…,fn}
其中
fi=[Βi,Di,Mi]
Βi=[Bi1,Bi2,Bi3,Bi4,Bi5]
Di=[Di1,Di2,Di3,Di4,Di5]
Mi=[Mi1,Mi2]
并令用户编号i=1。
S2:用户初步碳画像。
步骤1:选择反映用户碳排放特征的标签集Βi=[Bi1,Bi2,Bi3,Bi4,Bi5],将Βi插入聚类特征树(CF树)。若CF树为空树,则创建一个空的叶子节点和聚类簇(即CF三元组),从属于父节点,并将Βi放入聚类簇中,将这个簇作为叶子节点的第一个孩子节点,并更新聚类簇和此叶子节点的CF数据,进入步骤7;若CF树非空树,则进入步骤2。
步骤2:计算Βi与当前各叶子节点的簇平均连通距离d2选取与表征当前用户碳排放特征的标签集Βi距离最近的用户聚类簇,并插入Βi。
步骤3:计算插入Βi后的用户聚类簇的分布半径r,若r小于簇半径阈值T,则数据插入结束,进入步骤7;否则从当前用户聚类簇中删除Βi,进入步骤4。
步骤4:比较当前叶子节点下的用户聚类簇数目(CF数目)与叶节点平衡因子L,若CF数目小于L,则创建一个新的用户聚类簇,将Βi插入其中,并转步骤7;否则进入步骤5。
步骤5:若当前叶子节点所属内部节点的CF数目未超过内部节点平衡因子B的限制,将此叶子节点分裂为两个新叶子节点,将旧叶子节点中两个距离最远的聚类簇分别作为新叶子节点的第一个用户聚类簇,将待插入数据Βi和旧叶子节点内所有的聚类簇按与两个新叶子节点的距离远近插入,形成新的用户聚类簇并进入步骤7;否则,进入步骤6。
步骤6:依次向上直至父节点,检查各节点否需要分裂,若是,则分裂与数据插入过程同步骤5。
步骤7:完成对数据Βi插入后,更新路径上所有节点中的用户聚类簇数据。
步骤8:检查当前用户编号i是否等于所有用户数目n,若是,则按用户碳排放特征标签对所有用户的初步聚类完成,得到具有类似碳排放特征的不同类用户。若不是,则令i=i+1,返回步骤1。
S3:精细化画像过程。
基于得到的初步用户画像,加入影响用户i碳排放的用电标签特征集Di和经济特征标签集Mi,进一步对用户进行精细化碳画像,聚类过程与初步画像过程类似。精细化画像结束后,得到企业用户的全景碳画像。
其中,具体案例如下:
参考图1,包括以下步骤:
步骤1,调研企业用户,尤其是部分重点控排企业,获取其历史用电数据和碳排放数据,以及企业自身的多维度属性数据,如企业的年产值、企业人口数量、产业结构等;
步骤2,根据获取的企业数据,分析企业的碳排放行为特征,考虑到企业的碳排放主要受用能习惯及企业自身特性等影响,因此还需分析其碳排放行为与用能、自身属性的联系;并分析企业的用能特点。筛选出能够有效刻画企业碳排放及影响其碳排放的用能特性指标;
步骤3,根据筛选出的指标,建立企业全景碳画像标签库;
步骤4,基于BIRCH聚类算法,实现对企业用户的全景碳画像,并阐述基于BIRCH算法的画像流程。
参考图2,本发明中建立的企业用户碳画像标签库包含12个标签,按其所述类型分为企业用户碳排放特征标签、影响碳排放的用电特征标签和企业经济维度特征标签三个一级标签。其中,碳排放特征标签包括超额碳排放量占比、年碳排放总量、人均碳排放量、碳排放量增长情况及电能-碳集约度五个二级标签;用电特征标签包括日均用电量、峰谷差率、峰谷特性偏好、用电量增长情况和电价敏感程度五个二级标签;经济维度特征标签包括单位产值能耗和碳排放强度两个二级标签。
参考图3,图3为基于BIRCH算法的企业用户碳画像流程,主要包括以下步骤:
步骤1,初始化聚类参数。包括BIRCH算法CF树内部节点平衡因子B、叶节点平衡因子L、簇半径阈值T。基于获得的企业用户数据计算各聚类标签,形成用户画像特征标签集;
步骤2,初步碳画像。
S1,选择反映用户碳排放特征的标签Βi插入CF树,判断CF树是否为空树;若是,则创建空的叶子节点和聚类簇并插入Βi,进入S7;否则则进入S2。
S2,计算Βi与当前各叶子节点的簇平均连通距离d2距离最近的聚类簇插入Βi。
S3,判断当前聚类簇的分布半径r是否小于T,若是,进入S7;否则进入S4。
S4,判断当前叶子节点下的聚类簇数目是否小于L,若是,创建新的用户聚类簇并插入Βi,S7;否则进入S5。
S5,判断当前叶子节点所属内部节点CF数是否超过B,若不是,将此叶子节点分裂并插入Βi,进入S7;否则进入S6。
S6,依次向上直至父节点,检查各节点否需要分裂,分裂与数据插入过程同S5。
S7,数据Βi插入完成,更新路径上所有节点中的用户聚类簇数据。
S8,判断i是否等于n,若是,则初步聚类完成;否则令i=i+1,返回S1。
步骤3,精细化碳画像。在初步碳画像的基础上,根据未使用的其他类型标签,对企业用户进行精细化的碳画像,聚类算法的流程与步骤2类似。
步骤4,企业用户全景碳画像完成。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。
Claims (5)
1.一种基于BIRCH聚类算法的企业用户全景碳画像方法,其特征在于,包括以下步骤:
步骤1,调研并收集企业用户,为分析其碳排放、用能特征提供数据支持;
步骤2,数据清洗与分析,筛选出能够有效刻画企业碳排放及影响其碳排放的指标;
步骤3,构建全景碳画像标签库;
步骤4,利用BIRCH算法实现碳画像,并阐述使用此算法画像的具体流程。
2.根据权利要求1所述的一种基于BIRCH聚类算法的企业用户全景碳画像方法,其特征在于,步骤1中的企业数据包括企业的自身多维度特性以及历史碳排放量、历史用电量,其中,企业的自身多维度特性包括年产值、产业结构、企业人口数目。
3.根据权利要求2所述的一种基于BIRCH聚类算法的企业用户全景碳画像方法,其特征在于,步骤2中的数据清洗与分析包括对企业用户的用电行为和碳排放行为分析;
前者分析用电模式,并联系企业用户自身特性分析其用电特点;
后者包括企业用户碳排放特征分析和提取,并联系用户用电行为和自身多为特性分析其碳排放特点。
4.根据权利要求3所述的一种基于BIRCH聚类算法的企业用户全景碳画像方法,其特征在于,步骤3中的碳画像标签库包括:企业用户碳排放特征标签、影响企业碳排放的用电标签、与碳排放相关的企业经济维度特征标签三个一级标签;
各标签计算和打分方法如下:
超额碳排放量占比B1:表示用户在一段时间内实际碳排放量与其碳配额的比值;
式中:V、VA分别为用户的实际碳排放和碳配额;
年碳排放总量B2:反映用户一年的碳排放总量水平,按不同的碳排放量划分为四个等级并赋分,分别为低对应1分、中对应2分、较高对应3分、高对应4分;
人均碳排放量B3:表示在一定时间尺度下,企业用户的碳排放总量与企业内人口数目的比值;
式中:NP为企业用户的总人口数目;
碳排放量增长情况B4:反映用户在相同时间尺度下额碳排放量增长情况;
式中:N为总年数,Vi为用户第i年的碳排放量;
电能-碳集约度B5:即用户发生单位电能消耗时产生的二氧化碳排放量,单位为t CO2/MWh;反映一定时间尺度下用户的能源结构和电能替代水平,以及用户生产过程中的用能效率;
式中:P为企业用户的用电量;
影响企业碳排放的用电标签计算和打分方法如下:
日均用电量D1:反映企业用户在一段时间内每日的平均用电量;
式中:Pi为用户第i天的用电量;
峰谷差率D2:表示用户的日用电曲线中,峰、谷用电量之差与峰时用电量的比值;用户N天内的峰谷差率计算公式如下:
式中:Pi p、Pi v分别为用户第i天的峰时段、谷时段用电量;
峰谷特性偏好D3:按用户典型的日用电曲线中峰、谷、平不同时段的用电情况,分为峰偏好、谷偏好、峰谷均衡三类,同时考虑到聚类算法只能对数字进行处理,将三类峰谷特性进行赋分,分别为峰偏好对应1分、谷偏好对应2分、峰谷均衡对应3分;
用电量增长情况D4:表示用户在相同时间长度N下总用电量增长率;
电价敏感程度D5:反映用户一段时间内的用电曲线和电价曲线变化趋势的相关程度,即用户对电价的敏感程度;采用斯皮尔曼相关系数描述用户用电曲线与电价曲线变化变化趋势的一致性;计算公式为:
式中:ρ为向量x1、x2间的斯皮尔曼相关系数,其取值范围为[-1,1],绝对值越大,代表两个向量间变化方向的相关性越强,反之则越弱,ρ的正负反映两组数据间变化趋势,ρ小于0为负相关,ρ大于0为正相关;T为向量维度,δ(x1,x2)表示向量x1、x2中各元素按降序排列后,对应元素的序号之差;
利用斯皮尔曼相关系数,计算用户在N天内的电价敏感系数D5:
式中:pi、Pi分别表示第i天的电价数据向量和用户负荷数据向量;
与碳排放相关的企业经济维度特征标签的计算方法如下:
单位产值能耗M1:表示企业用户的年用电量与GDP总量的比值,单位MWh/万元,反映企业的产业结构和工序、设备的先进程度;
碳排放强度M2:表示企业用户年碳排放总量与GDP总量的比值,单位t CO2/万元;
5.根据权利要求4所述的一种基于BIRCH聚类算法的企业用户全景碳画像方法,其特征在于,步骤4中利用层次方法的平衡迭代规约和聚类方法实现企业用户全景碳画像流程为:
S1:初始化聚类参数:设置用户碳画像特征聚类树的内部节点平衡因子B、叶节点平衡因子L、簇半径阈值T;基于获得的企业用户数据,计算用户的各画像标签值,形成N个用户的画像标签特征集,
F={f1,f2,f3,…,fn}
其中,
fi=[Βi,Di,Mi]
Βi=[Bi1,Bi2,Bi3,Bi4,Bi5]
Di=[Di1,Di2,Di3,Di4,Di5]
Mi=[Mi1,Mi2]
并令用户编号i=1;
S2:用户初步碳画像;
步骤S21:选择反映用户碳排放特征的标签集Βi=[Bi1,Bi2,Bi3,Bi4,Bi5],将Βi插入聚类特征树,即CF树;若CF树为空树,则创建一个空的叶子节点和聚类簇,即CF三元组,从属于父节点,并将Βi放入聚类簇中,将这个簇作为叶子节点的第一个孩子节点,并更新聚类簇和此叶子节点的CF数据,进入步骤S27;若CF树非空树,则进入步骤S22;
步骤S22:计算Βi与当前各叶子节点的簇平均连通距离d2选取与表征当前用户碳排放特征的标签集Βi距离最近的用户聚类簇,并插入Βi;
步骤S23:计算插入Βi后的用户聚类簇的分布半径r,若r小于簇半径阈值T,则数据插入结束,进入步骤S27;否则从当前用户聚类簇中删除Βi,进入步骤S24;
步骤S24:比较当前叶子节点下的用户聚类簇数目,即CF数目,与叶节点平衡因子L,若CF数目小于L,则创建一个新的用户聚类簇,将Βi插入其中,并转步骤S27;否则进入步骤S25;
步骤S25:若当前叶子节点所属内部节点的CF数目未超过内部节点平衡因子B的限制,将此叶子节点分裂为两个新叶子节点,将旧叶子节点中两个距离最远的聚类簇分别作为新叶子节点的第一个用户聚类簇,将待插入数据Βi和旧叶子节点内所有的聚类簇按与两个新叶子节点的距离远近插入,形成新的用户聚类簇并进入步骤S27;否则,进入步骤S26;
步骤S26:依次向上直至父节点,检查各节点否需要分裂,若是,则分裂与数据插入过程同步骤S25;
步骤S27:完成对数据Βi插入后,更新路径上所有节点中的用户聚类簇数据;
步骤S28:检查当前用户编号i是否等于所有用户数目N,若是,则按用户碳排放特征标签对所有用户的初步聚类完成,得到具有类似碳排放特征的不同类用户;若不是,则令i=i+1,返回步骤S21;
S3:精细化画像过程;
基于得到的初步用户画像,加入影响用户i碳排放的用电标签特征集Di和经济特征标签集Mi,对用户进行精细化碳画像,聚类过程与初步画像过程类似;精细化画像结束后,得到企业用户的全景碳画像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310450944.8A CN116701965A (zh) | 2023-04-23 | 2023-04-23 | 一种基于birch聚类算法的企业用户全景碳画像方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310450944.8A CN116701965A (zh) | 2023-04-23 | 2023-04-23 | 一种基于birch聚类算法的企业用户全景碳画像方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116701965A true CN116701965A (zh) | 2023-09-05 |
Family
ID=87822895
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310450944.8A Pending CN116701965A (zh) | 2023-04-23 | 2023-04-23 | 一种基于birch聚类算法的企业用户全景碳画像方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116701965A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117556526A (zh) * | 2024-01-12 | 2024-02-13 | 国网北京市电力公司 | 建筑碳画像的辨识方法、装置、存储介质和电子设备 |
CN117992809A (zh) * | 2024-04-07 | 2024-05-07 | 江苏开博科技有限公司 | 一种用于银行多数据库运维信息的分级防护方法 |
-
2023
- 2023-04-23 CN CN202310450944.8A patent/CN116701965A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117556526A (zh) * | 2024-01-12 | 2024-02-13 | 国网北京市电力公司 | 建筑碳画像的辨识方法、装置、存储介质和电子设备 |
CN117992809A (zh) * | 2024-04-07 | 2024-05-07 | 江苏开博科技有限公司 | 一种用于银行多数据库运维信息的分级防护方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116701965A (zh) | 一种基于birch聚类算法的企业用户全景碳画像方法 | |
CN111415061B (zh) | 一种可再生能源电力系统的综合评价方法及装置 | |
CN110119948B (zh) | 基于时变权重动态组合的电力用户信用评价方法及系统 | |
CN111612228A (zh) | 一种基于用电信息的用户用电行为分析方法 | |
Justo et al. | Behavioral similarity of residential customers using a neural network based on adaptive resonance theory | |
CN114048436A (zh) | 一种预测企业财务数据模型构建方法及构建装置 | |
CN106447108A (zh) | 一种考虑业扩报装数据的用电需求分析预测方法 | |
CN111798333A (zh) | 一种用能评估与用电安全分析方法和系统 | |
Fernandes et al. | Analysis of residential natural gas consumers using fuzzy c-means clustering | |
CN105447767A (zh) | 一种基于联合矩阵分解模型的电力用户细分方法 | |
CN113450031A (zh) | 居民智慧用能服务潜在台区选取方法及装置 | |
CN116757717A (zh) | 电碳市场耦合运行的评估方法、装置、设备、介质和产品 | |
CN114372835B (zh) | 综合能源服务潜力客户识别方法、系统及计算机设备 | |
CN113837486B (zh) | 一种基于rnn-rbm的配网馈线长期负荷预测方法 | |
CN115829683A (zh) | 一种基于逆奖赏学习优化的电力积分商品推荐方法及系统 | |
CN114004513A (zh) | 一种需求预测方法、系统及存储介质 | |
CN114048200A (zh) | 一种计及缺失数据补齐的用户用电行为分析方法 | |
Bao et al. | An analysis method for residential electricity consumption behavior based on UMAP-CRITIC feature optimization and SSA-assisted clustering | |
CN112001551A (zh) | 一种基于大用户电量信息的地市电网售电量预测方法 | |
CN117236532B (zh) | 一种基于负荷数据的用电高峰负荷预测的方法及系统 | |
Davarzani et al. | Study of missing meter data impact on domestic load profiles clustering and characterization | |
Wang et al. | Target customer identification method of integrated energy service based on logistic regression | |
CN117473301A (zh) | 一种网格化用电客户诉求分析模型及方法 | |
Ma et al. | Non-negative Matrix Decomposition-Based Power Package Recommendation Method | |
CN116628534A (zh) | 基于电力大数据的园区用能动态画像划分方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |