CN116611576A - 碳排量预测方法及装置 - Google Patents
碳排量预测方法及装置 Download PDFInfo
- Publication number
- CN116611576A CN116611576A CN202310658254.1A CN202310658254A CN116611576A CN 116611576 A CN116611576 A CN 116611576A CN 202310658254 A CN202310658254 A CN 202310658254A CN 116611576 A CN116611576 A CN 116611576A
- Authority
- CN
- China
- Prior art keywords
- data
- carbon emission
- neural network
- feature
- scale
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 title claims abstract description 110
- 229910052799 carbon Inorganic materials 0.000 title claims abstract description 110
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000013528 artificial neural network Methods 0.000 claims abstract description 57
- 239000011159 matrix material Substances 0.000 claims abstract description 39
- 238000007637 random forest analysis Methods 0.000 claims abstract description 25
- 238000012549 training Methods 0.000 claims description 45
- 238000003066 decision tree Methods 0.000 claims description 35
- 238000011176 pooling Methods 0.000 claims description 24
- 238000006073 displacement reaction Methods 0.000 claims description 23
- 238000005096 rolling process Methods 0.000 claims description 23
- 238000013507 mapping Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 201000010099 disease Diseases 0.000 claims 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 2
- 238000004422 calculation algorithm Methods 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000009826 distribution Methods 0.000 description 5
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000000750 progressive effect Effects 0.000 description 4
- 229910002092 carbon dioxide Inorganic materials 0.000 description 2
- 239000001569 carbon dioxide Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/80—Management or planning
- Y02P90/84—Greenhouse gas [GHG] management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Marketing (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种碳排量预测方法及装置,涉及数据处理技术领域,用于解决现有方法碳排量预测的精度低、预测的鲁棒性和泛化能力弱的问题,方法包括:获取待预测的碳排放关联数据,其中,待预测的碳排放关联数据包括N个样本数据,N为大于等于2的整数;计算N个样本数据中任意两个数据样本之间的关系强度值,得到至少一个关系强度值,至少一个关系强度值构成邻接矩阵;将邻接矩阵输入图卷积神经网络来提取待预测的碳排放关联数据中不同尺度的特征,得到多尺度特征;将多尺度特征输入基于动态权重的随机森林模型,预测碳排放量。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及碳排量预测技术领域,尤其涉及一种碳排量预测方法及装置。
背景技术
工业园区、大型集团、建筑集群等场所是二氧化碳排放的主要场所,随着国家碳排放权交易市场的成熟和推广,对主要碳排放场所进行排放总量控制显得尤为重要。要实施对碳排放场所二氧化碳排放总量的控制,对碳排放量的计算与预测是基础。排放量预测模型的训练,十分依赖于大量的训练样本,而训练样本的获取十分费时费力,部分企业成立时间较短,训练样本的标注更加困难。当带标记的训练样本不足时,容易产生预测精度低、预测模型鲁棒性差、泛化能力差等问题。
现有的碳排量预测方法存在以下问题:现有技术在特征提取方面可能较为局限,无法有效地捕捉到碳排放量预测任务中的关键特征。现有技术在预测模型方面可能仅依赖于传统的随机森林等方法,预测性能较差。现有技术在样本生成方面可能较为有限,未能充分考虑到碳排放量预测任务所需的样本多样性,导致模型的泛化能力较差。
发明内容
针对上述技术问题,本发明提供一种碳排量预测方法及装置,用于至少部分解决上述技术问题。
基于此,本发明第一方面提供一种碳排量预测方法,包括:获取待预测的碳排放关联数据,其中,待预测的碳排放关联数据包括N个样本数据,N为大于等于2的整数;计算N个样本数据中任意两个数据样本之间的关系强度值,得到至少一个关系强度值,至少一个关系强度值构成邻接矩阵;将邻接矩阵输入图卷积神经网络来提取待预测的碳排放关联数据中不同尺度的特征,得到多尺度特征;将多尺度特征输入基于动态权重的随机森林模型,预测碳排放量。
根据本发明的实施例,计算N个样本数据中任意两个数据样本之间的关系强度值包括:根据
计算N个样本数据中第i个数据样本x i 与第j个数据样本y i 之间的关系强度值,d(x i ,x j )第i个数据样本x i 与第j个数据样本y i 之间的距离,d(x i ,x k ) 第i个数据样本x i 与第k个数据样本y k 之间的距离,σ为条件变分自编码器的高斯核的宽度参数。
根据本发明的实施例,图卷积神经网络为M层,M为大于等于1的整数,不同层图卷积神经网络设置不同尺度的池化操作;将邻接矩阵输入图卷积神经网络来提取待预测的碳排放关联数据中不同尺度的特征,得到多尺度特征包括:将邻接矩阵输入第m层图卷积神经网络进行图卷积操作,得到第一特征;m为大于等于1且小于等于M的整数;基于第m层图卷积神经网络设置的不同尺度的池化操作,对第一特征进行池化操作,得到对应于第m层的多个不同尺度的第二特征;对多个不同尺度的第二特征进行拼接,得到第三特征;将第三特征输入第m+1层图卷积神经网络进行图卷积操作,得到第四特征;基于第m+1层图卷积神经网络设置的不同尺度的池化操作,对第四特征进行池化操作,得到对应于第m+1层的多个不同尺度的第五特征;对多个不同尺度的第五特征进行拼接,得到第六特征;以此迭代,直到所有层图卷积神经网络运算完成,得到多尺度特征。
根据本发明的实施例,图卷积操作为:
其中,H (m+1)为第m+1层图卷积神经网络对应的第四特征,H (m)为第m层图卷积神经网络对应的第三特征,W (m)为第m层图卷积神经网络的权重矩阵,A为邻接矩阵,A'=A+I N 为加入自环I N 的邻接矩阵,D'是A'的度矩阵,δ(⋅)是激活函数。
根据本发明的实施例,基于动态权重的随机森林模型包括多个决策树,每个决策树分配有初始权重;将多尺度特征输入基于动态权重的随机森林模型,预测碳排放量;对于每一决策树,将每一尺度的特征输入该决策树,计算该尺度特征的特征值,特征值表征该尺度特征的重要性;根据该尺度特征的特征值更新该决策树的初始权重,得到更新后的决策树;将多尺度特征输入每个更新后的决策树,每个更新后的决策树输出一个碳排放量预测值;将多个碳排放量预测值进性均值计算,得到碳排放量。
根据本发明的实施例,根据该尺度特征的特征值更新该决策树的初始权重包括:根据
更新初始权重,其中,为第s个尺度特征对应的初始权重,/>为第s个尺度特征对应的更新后的权重,I s 为第s个尺度特征的特征值,β为权重更新的衰减因子。
根据本发明的实施例,方法还包括:获取训练集,包括:获取历史碳排放量数据;对历史碳排放量数据进行扩充,得到第一数据集;采用对抗变分自编码器对第一数据集进行隐空间的映射及对抗训练,得到训练集,其中,训练过程中对抗变分自编码器的隐空间的维度采用逐渐递增的方式;采用训练集训练图卷积神经网络。
根据本发明的实施例,对抗变分自编码器包括编码器、解码器、判断器及生成器;编码器用于实现从历史碳排放量数据到隐空间的映射;解码器用于实现从隐空间到训练集的映射;判断器用于对历史碳排放量数据进行对抗训练;生成器用于基于隐空间的维度采用逐渐递增的方式生成训练集。
根据本发明的实施例,待预测的碳排放关联数据包括企业经营数据、企业生产数据、企业工艺数据中的至少之一。
本发明第二方面提供一种碳排量预测装置,包括:获取模块,用于获取待预测的碳排放关联数据,其中,待预测的碳排放关联数据包括N个样本数据,N为大于等于2的整数;计算模块,用于将计算N个样本数据中任意两个数据样本之间的关系强度值,得到至少一个关系强度值,至少一个关系强度值构成邻接矩阵;提取模块,用于将邻接矩阵输入图卷积神经网络来提取待预测的碳排放关联数据中不同尺度的特征,得到多尺度特征;预测模块,用于将多尺度特征输入基于动态权重的随机森林模型,预测碳排放量。
根据本发明实施例提供的碳排量预测方法及装置,至少包括以下有益效果:
采用自适应图卷积神经网络来提取碳排放量预测任务中的数据特征,结合了自适应邻接矩阵和图卷积神经网络的优点,在此基础上,引入了多尺度池化策略,从而能够有效地提取不同尺度的特征,进而提高了碳排量预测的精度。
基于动态权重的随机森林模型预测碳排放量,结合了随机森林和动态权重的优点,能够对碳排放量进行有效预测。在动态权重的基础上,引入了特征重要性调整策略,使得方法能够自适应地调整特征的重要性,提高了碳排量预测的鲁棒性和泛化能力。
采用对抗变分自编码器对历史碳排量数据进行隐空间的映射及对抗训练来生成训练集,通过对训练样本进行扩充,提高模型的泛化能力,同时增加生成样本的多样性,通过引入了渐进式生成策略,能够逐步生成更精细的样本,从而提高了碳排量预测的精度、鲁棒性和泛化能力。
附图说明
通过以下参照附图对本发明实施例的描述,本发明的上述以及其他目的、特征图像和优点将更为清楚,在附图中:
图1示意性示出了本发明实施例提供的碳排量预测方法流程图。
图2示意性示出了本发明另一实施例提供的碳排量预测方法流程图。
图3示意性示出了本发明实施例提供的碳排量预测装置的框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本发明。在此使用的术语“包括”、“包含”等表明了所述特征图像、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征图像、步骤、操作或部件。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接或可以互相通讯;可以是直接连接,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,需要理解的是,术语“纵向”、“长度”、“周向”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的子系统或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
贯穿附图,相同的元素由相同或相近的附图标记来表示。可能导致本发明的理解造成混淆时,将省略常规结构或构造。并且图中各部件的形状、尺寸、位置关系不反映真实大小、比例和实际位置关系。另外,在本发明中,不应将位于括号之间的任何参考符号构造成对本发明的限制。
类似地,为了精简本发明并帮助理解各个公开方面中的一个或多个,在上面对本发明示例性实施例的描述中,本发明的各个特征图像有时被一起分到单个实施例、图或者对其描述中。参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征图像、结构、材料或者特点包含于本发明的至少一个实施例或示例中。本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征图像、结构、材料或者特点可以在任何的一个或者多个实施例或示例中以合适的方式结合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征图像的数量。因此,限定有“第一”、“第二”的特征图像可以明示或者隐含地包括一个或者更多个该特征图像。在本发明的描述中,“多个”的含义是至少两个,例如两个、三个等,除非另有明确具体的限定。
图1示意性示出了本发明实施例提供的碳排量预测方法流程图。
如图1所示,该碳排量预测方法包括操作S110~操作S140。
在操作S110,获取待预测的碳排放关联数据。
在本发明的实施例中,待预测的碳排放关联数据可以包括N个样本数据,N为大于等于2的整数。待预测的碳排放关联数据可以包括各控排企业的碳排放相关数据,数据属性包括:企业经营数据、企业生产数据、企业工艺数据等,标签为企业碳排放量数据。
在操作S120,计算N个样本数据中任意两个数据样本之间的关系强度值,得到至少一个关系强度值,至少一个关系强度值构成邻接矩阵。
在本发明的实施例中,对碳排放量预测任务中的数据进行有效特征提取;结合了自适应邻接矩阵和图卷积神经网络的优点(可以称之为自适应图卷积神经网络)。在自适应邻接矩阵和图卷积神经网络的基础上引入了多尺度池化策略,能够捕捉不同尺度的特征。
示例性地,为了构建一个能够捕捉数据间关系的图结构,首先引入自适应邻接矩阵。假设输入的待预测的碳排量数据为,其中,N为X中样本数据的数量,F是特征数量。定义自适应邻接矩阵/>,其中A ij 表示第i个样本与第j个样本之间的关系强度。
其中,计算N个样本数据中任意两个数据样本之间的关系强度值包括:根据
计算N个样本数据中第i个数据样本x i 与第j个数据样本y i 之间的关系强度值,d(x i ,x j )第i个数据样本x i 与第j个数据样本y i 之间的距离,d(x i ,x k ) 第i个数据样本x i 与第k个数据样本y k 之间的距离,σ为条件变分自编码器的高斯核的宽度参数。
在操作S130,将邻接矩阵输入图卷积神经网络来提取待预测的碳排放关联数据中不同尺度的特征,得到多尺度特征。
在本发明的实施例中,图卷积神经网络为M层,M为大于等于1的整数,不同层图卷积神经网络设置不同尺度的池化操作;将邻接矩阵输入图卷积神经网络来提取待预测的碳排放关联数据中不同尺度的特征,得到多尺度特征包括:将邻接矩阵输入第m层图卷积神经网络进行图卷积操作,得到第一特征;m为大于等于1且小于等于M的整数;基于第m层图卷积神经网络设置的不同尺度的池化操作,对第一特征进行池化操作,得到对应于第m层的多个不同尺度的第二特征;对多个不同尺度的第二特征进行拼接,得到第三特征;将第三特征输入第m+1层图卷积神经网络进行图卷积操作,得到第四特征;基于第m+1层图卷积神经网络设置的不同尺度的池化操作,对第四特征进行池化操作,得到对应于第m+1层的多个不同尺度的第五特征;对多个不同尺度的第五特征进行拼接,得到第六特征;以此迭代,直到所有层图卷积神经网络运算完成,得到多尺度特征。
示例性地,给定自适应邻接矩阵A和输入数据X,使用图卷积神经网络提取特征。图卷积操作定义如下:
其中,H (m+1)为第m+1层图卷积神经网络对应的第四特征,H (m)为第m层图卷积神经网络对应的第三特征,W (m)为第m层图卷积神经网络的权重矩阵,A为邻接矩阵,A'=A+I N 为加入自环I N 的邻接矩阵,D'是A'的度矩阵,δ(⋅)是激活函数。
为了捕捉不同尺度的特征,本发明引入多尺度池化策略。在每一层图卷积神经网络中,设置多个不同尺度的池化操作,并将池化后的特征进行拼接。具体而言,对于第m层图卷积神经网络,定义S个不同尺度的池化操作:
其中,pool(·) 表示第s个尺度的池化操作。
再将不同尺度的特征进行拼接,得到第m层图卷积神经网络对应的多尺度特征表示:
也即,上述自适应图卷积神经网络的算法步骤如下:
首先,根据输入的待预测的碳排量数据为计算自适应邻接矩阵A,初始化图卷积神经网络的层数M,每层图卷积神经网络的特征维度{F 1,F 2,…,F M},池化操作的尺度数S。然后,对于m=1,2,…,M,执行第m层的图卷积操作,得到H (m),对H (m)执行多尺度池化策略,得到/>,更新特征表示:
依次迭代,输出最终的特征表示H (M+1)。
基于上述自适应图卷积神经网络,可以有效地对碳排放量预测任务中的数据进行特征提取。结合了自适应邻接矩阵和图卷积神经网络的优点,提高了特征提取的准确性。同时,引入多尺度池化策略使得算法能够捕捉不同尺度的特征。
在操作S140,将多尺度特征输入基于动态权重的随机森林模型,预测碳排放量。
在本发明的实施例中,基于动态权重的随机森林模型包括多个决策树,每个决策树分配有初始权重;将多尺度特征输入基于动态权重的随机森林模型,预测碳排放量;对于每一决策树,将每一尺度的特征输入该决策树,计算该尺度特征的特征值,特征值表征该尺度特征的重要性;根据该尺度特征的特征值更新该决策树的初始权重,得到更新后的决策树;将多尺度特征输入每个更新后的决策树,每个更新后的决策树输出一个碳排放量预测值;将多个碳排放量预测值进性均值计算,得到碳排放量。
示例性地,随机森林是一种集成学习方法,通过构建多个决策树进行预测。假设有T个决策树,每个决策树的预测结果为h t (x)。随机森林的预测结果y(x)可以通过对各个决策树的预测结果进行平均得到:
为了使随机森林能够更好地适应不同的数据分布,本发明引入动态权重。首先,定义每个决策树的权重为w t ,并将权重归一化:
其中,α t 表示决策树t的未归一化权重。
接下来,将动态权重应用于随机森林的预测结果y DW (x)为:
为了使算法能够自适应地调整特征的重要性,本发明引入特征重要性调整策略。在每次构建决策树时,计算特征的特征值,特征值表征该特征的重要性,并根据重要性更新特征的权重,具体更新过程可以为:
根据
更新初始权重,其中,为第s个尺度特征对应的初始权重,/>为第s个尺度特征对应的更新后的权重,I s 为第s个尺度特征的特征值,β为权重更新的衰减因子。
也即,基于动态权重的随机森林模型的预测流程可以为:
首先,输入碳排量数据为和标签/>,初始化随机森林的参数,包括决策树的数量T,权重衰减因子β,特征权重/>。然后,对于t=1,2,…,T,从输入数据X和标签y中有放回地抽取样本,构建训练集,根据特征权重调整训练集的特征分布,训练决策树h t (x),计算特征的特征值I s ,根据特征值I s 更新特征权重/>。最后使用更新权重后的随机森林进行碳排量预测。
通过上述动态权重随机森林算法,可以有效地对碳排放量进行预测。结合了随机森林和动态权重的优点,提高了预测的准确性。同时,引入特征重要性调整策略使得算法能够自适应地调整特征的重要性。
图2示意性示出了本发明另一实施例提供的碳排量预测方法流程图
如图2所示,该方法还包括操作S210~操作S220。
在操作S210,获取训练集。
在操作S220,采用训练集训练图卷积神经网络。
在本发明的实施例中,获取训练集可以包括:获取历史碳排放量数据;对历史碳排放量数据进行扩充,得到第一数据集;采用对抗变分自编码器对第一数据集进行隐空间的映射及对抗训练,得到训练集,其中,训练过程中条件变分自编码器的隐空间的维度采用逐渐递增的方式。
其中,对抗变分自编码器包括编码器、解码器、判断器及生成器;编码器用于实现从历史碳排放量数据到隐空间的映射;解码器用于实现从隐空间到训练集的映射;判断器用于对历史碳排放量数据进行对抗训练;生成器用于基于隐空间的维度采用逐渐递增的方式生成训练集。
该新样本生成方法具有以下特点:
通过对碳排放量预测任务的训练样本进行扩充,提高模型的泛化能力。使用条件变分自编码器结合对抗训练的方式,增加生成样本的多样性;在对抗变分自编码器的基础上,引入了渐进式生成策略,使得算法能够逐步生成更精细的训练样本。
示例性地,条件变分自编码器是一种生成模型,通过编码器和解码器来实现从输入数据到隐空间的映射,以及从隐空间到生成数据的映射。定义条件变分自编码器的损失函数:
其中,x表示输入样本,c表示条件变量,z表示隐变量,qϕ(z|x,c)是编码器参数化的后验分布,p θ (x|z,c)是解码器参数化的条件生成分布,p(z)是隐变量的先验分布,KL代表KL散度。
对抗训练可以增加生成样本的多样性。在条件变分自编码器的基础上引入判别器D ω (x,c),通过最小化生成样本与真实样本之间的差异,来提高生成样本的质量。判别器的损失函数定义如下:
其中,G θ (z,c) 表示由解码器生成的样本。
生成器的损失函数为:
为了能够生成更精细的样本,本发明采用了渐进式生成策略。在每个阶段,都会使用一个较低的隐空间维度,并在每个阶段结束后将其逐步增加。具体而言,在第k个阶段,将隐空间维度设置为d k ,并根据当前阶段的隐空间维度重新定义编码器、解码器和判别器。在每个阶段,分别优化条件变分自编码器和对抗训练的损失函数,然后逐步提高隐空间维度。
也即,对抗变分自编码器的算法步骤如下:
初始化阶段数k、隐空间维度序列{d 1,d 2,…,d K }、条件变量c、输入样本x。然后,对于k=1,2,…,K,将隐空间维度设置为d k ,使用当前的隐空间维度定义编码器qϕ(z|x,c)、解码器p θ (x|z,c)和判别器D ω (x,c),优化条件变分自编码器损失函数ξ CVAE (x,c),优化判别器的损失函数ξ D ,优化生成器损失函数ξ G 。最后,基于优化后的条件变分自编码器、判别器和生成器,生成新样本G θ (z,c),其中,z~p θ (z)。
基于此,可以有效地扩充碳排放量预测任务的训练样本。对抗变分自编码器不仅结合了条件变分自编码器的优点,还利用了对抗训练的技术,提高了生成样本的质量。同时,引入渐进式生成策略使得算法能够逐步生成更精细的样本。
进一步地,在生成新样本后,可以继续对数据进行预处理操作。在本发明中,首先对扩充后的新样本数据集进行最大最小归一化,公式如下:
其中,x bmax为数据集中的样本数据的最大值,x bmin为样本数据的最小值。x b 为归一化之前的数据值,x b *为归一化之后的数据值。
在数据归一化后,对冗余数据进行去除,并对异常值进行去除。
图3示意性示出了本发明实施例提供的碳排量预测装置的框图。
如图3所示,该碳排量预测装置300包括:获取模块310、计算模块320、提取模块330及预测模块340。
获取模块310,用于获取待预测的碳排放关联数据,其中,待预测的碳排放关联数据包括N个样本数据,N为大于等于2的整数。
计算模块320,用于将计算N个样本数据中任意两个数据样本之间的关系强度值,得到至少一个关系强度值,至少一个关系强度值构成邻接矩阵。
提取模块330,用于将邻接矩阵输入图卷积神经网络来提取待预测的碳排放关联数据中不同尺度的特征,得到多尺度特征。
预测模块340,用于将多尺度特征输入基于动态权重的随机森林模型,预测碳排放量。
需要说明的是,装置实施例部分的具体实施细节及带来的技术效果与方法实施例不等对应,此处不再赘述。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种碳排量预测方法,其特征在于,包括:
获取待预测的碳排放关联数据,其中,所述待预测的碳排放关联数据包括N个样本数据,N为大于等于2的整数;
计算所述N个样本数据中任意两个数据样本之间的关系强度值,得到至少一个关系强度值,所述至少一个关系强度值构成邻接矩阵;
将所述邻接矩阵输入图卷积神经网络来提取所述待预测的碳排放关联数据中不同尺度的特征,得到多尺度特征;
将所述多尺度特征输入基于动态权重的随机森林模型,预测碳排放量。
2.根据权利要求1所述的碳排量预测方法,其特征在于,所述计算所述N个样本数据中任意两个数据样本之间的关系强度值包括:
根据;
计算N个样本数据中第i个数据样本x i 与第j个数据样本y i 之间的关系强度值,d (x i ,x j )第i个数据样本x i 与第j个数据样本y i 之间的距离,d (x i , x k ) 第i个数据样本x i 与第k个数据样本y k 之间的距离,σ为条件变分自编码器的高斯核的宽度参数。
3.根据权利要求1所述的碳排量预测方法,其特征在于,所述图卷积神经网络为M层,M为大于等于1的整数,不同层图卷积神经网络设置不同尺度的池化操作;所述将所述邻接矩阵输入图卷积神经网络来提取所述待预测的碳排放关联数据中不同尺度的特征,得到多尺度特征包括:
将所述邻接矩阵输入第m层图卷积神经网络进行图卷积操作,得到第一特征;m为大于等于1且小于等于M的整数
基于第m层图卷积神经网络设置的不同尺度的池化操作,对所述第一特征进行池化操作,得到对应于第m层的多个不同尺度的第二特征;
对所述多个不同尺度的第二特征进行拼接,得到第三特征;
将所述第三特征输入第m+1层图卷积神经网络进行图卷积操作,得到第四特征;
基于第m+1层图卷积神经网络设置的不同尺度的池化操作,对所述第四特征进行池化操作,得到对应于第m+1层的多个不同尺度的第五特征;
对所述多个不同尺度的第五特征进行拼接,得到第六特征;
以此迭代,直到所有层图卷积神经网络运算完成,得到所述多尺度特征。
4.根据权利要求3所述的碳排量预测方法,其特征在于,所述图卷积操作为:
;
其中,H (m+1)为第m+1层图卷积神经网络对应的第四特征,H (m)为第m层图卷积神经网络对应的第三特征,W (m)为第m层图卷积神经网络的权重矩阵,A为邻接矩阵,A'=A+I N 为加入自环I N 的邻接矩阵,D'是A'的度矩阵,δ(⋅)是激活函数。
5.根据权利要求1所述的碳排量预测方法,其特征在于,所述基于动态权重的随机森林模型包括多个决策树,每个决策树分配有初始权重;所述将所述多尺度特征输入基于动态权重的随机森林模型,预测碳排放量;
对于每一决策树,将每一尺度的特征输入该决策树,计算该尺度特征的特征值,所述特征值表征该尺度特征的重要性;
根据该尺度特征的特征值更新该决策树的初始权重,得到更新后的决策树;
将所述多尺度特征输入每个更新后的决策树,每个更新后的决策树输出一个碳排放量预测值;
将多个碳排放量预测值进性均值计算,得到所述碳排放量。
6.根据权利要求5所述的碳排量预测方法,其特征在于,所述根据该尺度特征的特征值更新该决策树的初始权重包括:
根据;
更新初始权重,其中,为第s个尺度特征对应的初始权重,/>为第s个尺度特征对应的更新后的权重,I s 为第s个尺度特征的特征值,β为权重更新的衰减因子。
7.根据权利要求1所述的碳排量预测方法,其特征在于,所述方法还包括:
获取训练集,包括:
获取历史碳排放量数据;
对所述历史碳排放量数据进行扩充,得到第一数据集;
采用对抗变分自编码器对所述第一数据集进行隐空间的映射及对抗训练,得到所述训练集,其中,训练过程中所述对抗变分自编码器的隐空间的维度采用逐渐递增的方式;
采用所述训练集训练所述图卷积神经网络。
8.根据权利要求7所述的碳排量预测方法,其特征在于,所述对抗变分自编码器包括编码器、解码器、判断器及生成器;
所述编码器用于实现从所述历史碳排放量数据到隐空间的映射;
所述解码器用于实现从隐空间到所述训练集的映射;
所述判断器用于对所述历史碳排放量数据进行对抗训练;
所述生成器用于基于隐空间的维度采用逐渐递增的方式生成所述训练集。
9.根据权利要求1所述的碳排量预测方法,其特征在于,所述待预测的碳排放关联数据包括企业经营数据、企业生产数据、企业工艺数据中的至少之一。
10.一种碳排量预测装置,其特征在于,包括:
获取模块,用于获取待预测的碳排放关联数据,其中,所述待预测的碳排放关联数据包括N个样本数据,N为大于等于2的整数;
计算模块,用于将所述计算所述N个样本数据中任意两个数据样本之间的关系强度值,得到至少一个关系强度值,所述至少一个关系强度值构成邻接矩阵;
提取模块,用于将所述邻接矩阵输入图卷积神经网络来提取所述待预测的碳排放关联数据中不同尺度的特征,得到多尺度特征;
预测模块,用于将所述多尺度特征输入基于动态权重的随机森林模型,预测碳排放量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310658254.1A CN116611576B (zh) | 2023-06-06 | 2023-06-06 | 碳排量预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310658254.1A CN116611576B (zh) | 2023-06-06 | 2023-06-06 | 碳排量预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116611576A true CN116611576A (zh) | 2023-08-18 |
CN116611576B CN116611576B (zh) | 2023-10-03 |
Family
ID=87678031
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310658254.1A Active CN116611576B (zh) | 2023-06-06 | 2023-06-06 | 碳排量预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116611576B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117010283A (zh) * | 2023-10-07 | 2023-11-07 | 中国矿业大学(北京) | Pba车站钢管柱结构变形预测方法、系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110873783A (zh) * | 2018-08-14 | 2020-03-10 | 上海能链众合科技有限公司 | 碳排量监测方法及装置、存储介质、终端 |
CN115564114A (zh) * | 2022-10-10 | 2023-01-03 | 南京航空航天大学 | 一种基于图神经网络的空域碳排放短期预测方法及系统 |
US20230059038A1 (en) * | 2021-08-19 | 2023-02-23 | International Business Machines Corporation | Optimizing carbon emissions from streaming platforms with artificial intelligence based model |
CN115796358A (zh) * | 2022-11-28 | 2023-03-14 | 国网福建省电力有限公司 | 一种碳排放预测的方法及终端 |
CN116108998A (zh) * | 2023-02-22 | 2023-05-12 | 葛洲坝集团交通投资有限公司 | 一种高速公路建设项目碳排放量预测方法及系统 |
-
2023
- 2023-06-06 CN CN202310658254.1A patent/CN116611576B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110873783A (zh) * | 2018-08-14 | 2020-03-10 | 上海能链众合科技有限公司 | 碳排量监测方法及装置、存储介质、终端 |
US20230059038A1 (en) * | 2021-08-19 | 2023-02-23 | International Business Machines Corporation | Optimizing carbon emissions from streaming platforms with artificial intelligence based model |
CN115564114A (zh) * | 2022-10-10 | 2023-01-03 | 南京航空航天大学 | 一种基于图神经网络的空域碳排放短期预测方法及系统 |
CN115796358A (zh) * | 2022-11-28 | 2023-03-14 | 国网福建省电力有限公司 | 一种碳排放预测的方法及终端 |
CN116108998A (zh) * | 2023-02-22 | 2023-05-12 | 葛洲坝集团交通投资有限公司 | 一种高速公路建设项目碳排放量预测方法及系统 |
Non-Patent Citations (1)
Title |
---|
於慧琳;肖铭哲;: "基于灰色神经网络模型的企业碳排放峰值预测", 计算机测量与控制, no. 12 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117010283A (zh) * | 2023-10-07 | 2023-11-07 | 中国矿业大学(北京) | Pba车站钢管柱结构变形预测方法、系统 |
CN117010283B (zh) * | 2023-10-07 | 2023-12-29 | 中国矿业大学(北京) | Pba车站钢管柱结构变形预测方法、系统 |
Also Published As
Publication number | Publication date |
---|---|
CN116611576B (zh) | 2023-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108231201B (zh) | 一种疾病数据分析处理模型的构建方法、系统及应用方法 | |
CN109948029B (zh) | 基于神经网络自适应的深度哈希图像搜索方法 | |
CN108230278B (zh) | 一种基于生成对抗网络的图像去雨滴方法 | |
CN109886388A (zh) | 一种基于变分自编码器的训练样本数据扩充方法和装置 | |
CN115018021B (zh) | 基于图结构与异常注意力机制的机房异常检测方法及装置 | |
CN110135580A (zh) | 一种卷积网络全整型量化方法及其应用方法 | |
CN111986262B (zh) | 一种图像区域定位方法及装置 | |
CN109146000B (zh) | 一种基于冰冻权值改进卷积神经网络的方法及装置 | |
CN116611576B (zh) | 碳排量预测方法及装置 | |
CN110807544B (zh) | 一种基于机器学习的油田剩余油饱和度分布的预测方法 | |
CN113779675A (zh) | 物理-数据驱动的智能化剪力墙建筑结构设计方法和装置 | |
CN109559297A (zh) | 一种基于三维区域生成网络的肺结节检测的方法 | |
CN112733997A (zh) | 基于woa-lstm-mc的水文时间序列预测优化方法 | |
CN106886793B (zh) | 基于判别信息和流形信息的高光谱图像波段选择方法 | |
CN114841055A (zh) | 一种基于生成对抗网络的无人机集群任务预分配方法 | |
CN111260056B (zh) | 一种网络模型蒸馏方法及装置 | |
CN115496144A (zh) | 配电网运行场景确定方法、装置、计算机设备和存储介质 | |
CN109447147B (zh) | 基于双图稀疏的深度矩阵分解的图像聚类方法 | |
CN111079930A (zh) | 数据集质量参数的确定方法、装置及电子设备 | |
CN109116300A (zh) | 一种基于非充分指纹信息的极限学习定位方法 | |
CN117058079A (zh) | 基于改进ResNet模型的甲状腺显像图像自动诊断方法 | |
CN116106909A (zh) | 一种雷达回波外推方法、系统及存储介质 | |
CN116186824A (zh) | 基于图像嵌入图神经网络模型的建筑结构布置方法 | |
CN115544307A (zh) | 基于关联矩阵的有向图数据特征提取与表达方法和系统 | |
CN109145132B (zh) | 从图像中提取哈希码的方法、装置及图像检索方法、装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |