CN112329262A - 一种居住建筑燃气碳排放量预测方法 - Google Patents

一种居住建筑燃气碳排放量预测方法 Download PDF

Info

Publication number
CN112329262A
CN112329262A CN202011332532.7A CN202011332532A CN112329262A CN 112329262 A CN112329262 A CN 112329262A CN 202011332532 A CN202011332532 A CN 202011332532A CN 112329262 A CN112329262 A CN 112329262A
Authority
CN
China
Prior art keywords
residential building
sample data
carbon emission
prediction model
building
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011332532.7A
Other languages
English (en)
Inventor
李雪
王一帆
袁大昌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University Urban Planning And Design Institute Co ltd
Original Assignee
Tianjin University Urban Planning And Design Institute Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University Urban Planning And Design Institute Co ltd filed Critical Tianjin University Urban Planning And Design Institute Co ltd
Priority to CN202011332532.7A priority Critical patent/CN112329262A/zh
Publication of CN112329262A publication Critical patent/CN112329262A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Abstract

本发明公开了一种居住建筑燃气碳排放量预测方法,包括:获取样本数据;样本数据包括居住建筑特征参数和与居住建筑特征参数对应的居住建筑单位面积碳排放值;根据特征重要性对样本数据进行评分排序,选取评分大于预设值对应的样本数据作为预测模型特征;根据预测模型特征建立预测模型,获得预测结果。根据居住建筑形态指标建立了居住建筑单位面积燃气碳排放预测模型,通过预测模型可以为规划中的居住小区、居住建筑提供燃气减碳建议,相较于传统线性回归预测模型、本模型具有更高的精度。

Description

一种居住建筑燃气碳排放量预测方法
技术领域
本发明涉及二氧化碳预测技术领域,具体涉及一种居住建筑燃气碳排放量预测方法。
背景技术
气候变暖问题已成为全球关注的共同问题,低碳发展作为一种生态环保的发展模式成为社会普遍的共识。城市是碳排放的主体,我国约有85%碳排放来源于城市,根据相关统计数据,中国居住能耗占城市建筑部门能耗的16%-25%。住区作为居住的基本单元,其整体碳排放水平与住区结构、住宅形态密切相关。
目前建筑燃气碳排放的核算往往依赖于能耗模拟软件进行计算,能耗模拟结果很难应用与城市规划管理,同时住区的实际情况千差万别,基于能耗软件的统一模拟往往很难准确核算不同住区的燃气碳排放。
因此如何从规划领域入手实现居住建筑燃气碳排放的准确预测,成为亟待解决的问题。
发明内容
有鉴于此,本发明实施例提供了一种居住建筑燃气碳排放量预测方法,以解决现有技术中基于能耗软件的统一模拟对不同住区的燃气碳排放核算准确度不够高的问题。
本发明实施例提供了一种居住建筑燃气碳排放量预测方法,包括:
获取样本数据;样本数据包括居住建筑特征参数和与居住建筑特征参数对应的居住建筑单位面积碳排放值;
根据特征重要性对样本数据进行评分排序,选取评分大于预设值对应的样本数据作为预测模型特征;
根据预测模型特征建立预测模型,获得预测结果。
可选地,居住建筑特征参数包括:居住建筑燃气排放数据、建筑面积数据和建筑形态特征;其中,建筑形态特征包括建筑面宽进深比、体型系数、四面窗墙比、平均窗墙比、梯户数、层高和层数。
可选地,根据特征重要性对样本数据进行评分排序,选取评分大于预设值对应的样本数据作为预测模型特征包括:
获取每个样本数据在决策树模型中每个子树中的平均贡献度;
采用基尼指数评价平均贡献度,得到特征重要性评分。
可选地,采用基尼指数评价所述平均贡献度,得到特征重要性评分包括:
将特征重要性评分用F表示,将基尼指数用GI表示,假设有m个特征,计算每个样本数据中特征的基尼指数评分:
Figure BDA0002796227020000021
其中,K为类别总数,m、k、K均为自然数,pmk为第m个节点中第k个类别的特征所占比例;
计算每个样本数据特征在第m个节点中的重要性:
Fm=GIm-GIl-GIr
其中,GIl、GIr分别表示在第m个节点之后的两个新节点的基尼指数;
计算每个样本数据特征在决策树的第i棵子树中的重要性:
Figure BDA0002796227020000022
其中,M为同一特征在决策树中出现的节点的集合,i为自然数;
计算每个样本数据特征的得分:
Figure BDA0002796227020000023
其中,n为决策树的总数量。
可选地,根据预测模型特征建立预测模型,获得预测结果包括:
用极端梯度提升算法建立预测模型;
通过预测模型特征训练预测模型;
将待测建筑的特征参数代入预测模型,获得待测建筑的预测单位面积碳排放量;
将预测单位面积碳排放量与待测建筑的居住建筑面积相乘,得到待测建筑的预测燃气碳排放总量。
可选地,居住建筑单位面积碳排放值的计算如下:
Figure BDA0002796227020000031
其中,E为居住建筑单位面积碳排放量,P为统计一年居住建筑燃气排放量,D为燃气二氧化然排放因子,S为居住建筑的建筑面积。
可选地,在根据特征重要性对样本数据进行评分排序之前,还包括:采用数据空值填充规则对样本数据进行预处理;
对样本数据的各个特征进行归一化处理。
可选地,对样本数据的各个特征进行归一化处理包括:
Figure BDA0002796227020000032
其中,X为样本数据的特征值,Xmin为特征值的最小值,Xmax为特征值的最大值,Xstd为特征值的归一化结果。
可选地,通过预测模型特征训练预测模型包括:
对数据集按照3:1的比例随机划分为训练集和测试集;
按预设次数重复训练;
选取均方误差小于等于样本数据平均值10%的预测模型为最优预测模型。
可选地,选取均方误差小于等于样本数据平均值10%的预测模型为最优预测模型包括:
获取每个预测模型的预测结果:
Figure BDA0002796227020000041
其中,
Figure BDA0002796227020000042
为预测结果,j为自然数,fj(xj)表示第j棵树的模型函数,xj为预测模型特征;
选取最优预测模型:
Figure BDA0002796227020000043
其中,yt表示经过训练的第t棵树的优化预测结果,t∈[1,n],N为样本数据总数,Ω(fi)表示正则项优化函数,
Figure BDA0002796227020000044
为误差函数
本发明实施例提供的一种居住建筑燃气碳排放量预测方法,根据居住建筑形态指标建立了居住建筑单位面积燃气碳排放预测模型,通过预测模型可以为规划中的居住小区、居住建筑提供燃气减碳建议,相较于传统线性回归预测模型、本模型具有更高的精度。本预测模型将规划居住小区建筑形态指标输入预测模型,得出规划小区居住建筑的单位面积燃气碳排放量,以碳排放量最小为目标,通过调整居住建筑形态参数,从而得出单位面积燃气碳排放量最小的居住建筑形态结果,从而确定小区实际建筑形态,实现了居住区规划时控制碳排放量的目标。
附图说明
通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
图1示出了本发明实施例中一种居住建筑燃气碳排放量预测方法的流程图;
图2示出了本发明实施例中一种筛选后特征评分示意图;
图3示出了本发明实施例中一种预测结果与实际结果的拟合曲线对比图;
图4示出了本发明实施例中一种居住建筑燃气碳排放量预测终端的结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种居住建筑燃气碳排放量预测方法,如图1所示,包括:
步骤S10,获取样本数据。样本数据包括居住建筑特征参数和与居住建筑特征参数对应的居住建筑单位面积碳排放值。
在本实施例中,居住建筑特征参数包括:居住建筑燃气排放数据、建筑面积数据和建筑形态特征;其中,建筑形态特征包括建筑面宽进深比、体型系数、四面窗墙比、平均窗墙比、梯户数、层高、层数和经纬度坐标等。例如在南方城市的某小区与北方城市的某小区,两种小区的建筑形态存在明显差异,例如冬季供暖;而相同地域的不同小区之间则较为相似。通过居住建筑特征参数可以将不同地区的建筑进行分类,使居住建筑特征与年平均碳排放量互相关联,针对不同经纬度地区的不同小区,均能够取得较为精确的预测结果。
在具体实施例中,居住建筑指每栋居住单元楼,获取居住建筑燃气排放数据、建筑面积数据、建筑形态特征参数以及与居住建筑特征参数对应的居住建筑单位面积碳排放值。
居住建筑单位面积碳排放值的计算过程如下:
Figure BDA0002796227020000061
其中,E为居住建筑单位面积碳排放量,P为统计一年居住建筑燃气排放量,D为燃气二氧化然排放因子,S为居住建筑的建筑面积。
步骤S20,根据特征重要性对样本数据进行评分排序,选取评分大于预设值对应的样本数据作为预测模型特征。
在本实施例中,通过XGBoost算法的feature_importance属性判定样本数据集的特征重要性,feature_importance属性会根据特征对模型的增益给出得分,根据特征得分对其进行排序。在具体实施例中,预设值为0.1,如图2所示,横坐标为特征评分值,纵坐标为特征名称,保留得分超过0.1的特征。
步骤S30,根据预测模型特征建立预测模型,获得预测结果。
在本实施例中,将步骤S20中经过筛选得出的特征按得分高低进行排序,选出最合适的一项或多项特征作为数据集和训练集,用XGBoost算法建立对所述居住建筑单位面积碳排放预测模型,以利用所述模型进行居住建筑燃气碳排放预测。将预测结果与居住建筑面积相乘,得到居住建筑燃气碳排放总量。
在具体实施例中,步骤S30包括:
步骤S301,用极端梯度提升算法建立预测模型。
步骤S302,通过预测模型特征训练预测模型。
步骤S303,将待测建筑的特征参数代入预测模型,获得待测建筑的预测单位面积碳排放量。
步骤S304,将预测单位面积碳排放量与待测建筑的居住建筑面积相乘,得到待测建筑的预测燃气碳排放总量。
本发明实施例提供的一种居住建筑燃气碳排放量预测方法,根据居住建筑形态指标建立了居住建筑单位面积燃气碳排放预测模型,通过预测模型可以为规划中的居住小区、居住建筑提供燃气减碳建议,相较于传统线性回归预测模型、本模型具有更高的精度。本预测模型将规划居住小区建筑形态指标输入预测模型,得出规划小区居住建筑的单位面积燃气碳排放量,以碳排放量最小为目标,通过调整居住建筑形态参数,从而得出单位面积燃气碳排放量最小的居住建筑形态结果,从而确定小区实际建筑形态,实现了居住区规划时控制碳排放量的目标。
作为可选的实施方式,步骤S20包括:
步骤S201,获取每个样本数据在决策树模型中每个子树中的平均贡献度。
步骤S202,采用基尼指数评价平均贡献度,得到特征重要性评分。
在本实施例中,特征重要性排序和选择的计算过程为XGBoost以树模型作为基础学习器,决策树中每一个节点,通过特征条件分裂为两个部分,不断重复这一过程;判断每个特征在决策树中做了多大的贡献,特征越重要,对节点的纯度增加的效果越好,选出基尼指数大于0.1的特征作为最终训练模型的特征。
作为可选的实施方式,步骤S202包括:
步骤S2021,将特征重要性评分用F表示,将基尼指数用GI表示,假设有m个特征,计算每个样本数据中特征的基尼指数评分:
Figure BDA0002796227020000071
其中,K为类别总数,m、k、K均为自然数,pmk为第m个节点中第k个类别的特征所占比例。
步骤S2022,计算每个样本数据特征在第m个节点中的重要性:
Fm=GIm-GIl-GIr
其中,GIl、GIr分别表示在第m个节点之后的两个新节点的基尼指数。
步骤S2023,计算每个样本数据特征在决策树的第i棵子树中的重要性:
Figure BDA0002796227020000081
其中,M为同一特征在决策树中出现的节点的集合,i为自然数。
步骤S2024,计算每个样本数据特征的得分:
Figure BDA0002796227020000082
其中,n为决策树的总数量。
作为可选的实施方式,在步骤S20之前,还包括:
步骤S11,采用数据空值填充规则对样本数据进行预处理。
在本实施例中,数据空值填充规则为,单位面积燃气碳排放数据如果为空值,首先用处于同一个小区相同层数住宅均值填充,若无小区信息,则用面宽进深比、体型系数、层数相同的住宅均值填充。因为周边小区的建筑具有相似性,因此用周边小区的特征参数均值对空值部分进行填充,能够提高预测结果的精度。
步骤S12,对样本数据的各个特征进行归一化处理。
在本实施例中,对样本数据的各个特征进行归一化处理通过以下公式计算:
Figure BDA0002796227020000083
其中,X为样本数据的特征值,Xmin为特征值的最小值,Xmax为特征值的最大值,Xstd为特征值的归一化结果。
对样本数据的各个特征进行归一化处理的作用是剔除不同数据间不同量纲的影响。
作为可选的实施方式,步骤S302包括:
步骤S3021,对数据集按照3:1的比例随机划分为训练集和测试集。
在本实施例中,XGBoost预测模型参数如下:
booster='gbtree',计算模型选用树模型,解决模型预测中非线性问题;
最大增量步长(max_delta_step)=0(取值范围为:[0,∞]),设置每棵树的权重最大增量步长为0表示没有约束;
最大深度(max_depth)=1(取值范围为:[1,∞])树的最大深度为1;
树的最小样本数(min_child_weight)=4(取值范围为:[0,∞]),指节点中最小样本权重和,如果一个节点样本权重和小于4则拆分过程结束,在现行回归模型中,这个参数是指建立每个模型所需要的最小样本数。
步骤S3022,按预设次数重复训练。
在本实施例中,重复训练次数设置为十次。
步骤S3023,选取均方误差小于等于样本数据平均值10%的预测模型为最优预测模型。
在本实施例中,预测模型的计算过程如下:
获取每个预测模型的预测结果:
Figure BDA0002796227020000091
其中,
Figure BDA0002796227020000092
为预测结果,j为自然数,fj表示第j棵树的模型函数,xj为预测模型特征;
选取最优预测模型:
Figure BDA0002796227020000093
其中,yt表示经过训练的第t棵树的优化预测结果,ft为第t轮的训练模型,t∈[1,n],N为样本数据总数,Ω(fi)表示正则项优化函数,
Figure BDA0002796227020000094
为误差函数。
选取最优预测模型的过程即为优化预测模型的过程,通过误差函数以及正则项优化函数优化预测模型,使预测模型的结果误差缩小到10%以内。
计算训练集预测结果同测试集预测结果之间的均方误差(MSE),由于训练次数有限,因此设置了均方误差比样本数据平均值小于或等于10%的判断条件,从而选出最优预测模型。在具体实施例中,可以增加训练次数,同时降低均方误差的参考值,从而进一步提高模型的预测精度。
以四川省金堂县小区燃气数据作为研究对象,具体步骤如下:
步骤1:获取居住建筑燃气排放数据、建筑面积数据、建筑形态特征。
步骤2:利用所述居住建筑燃气排放数据、建筑面积数据将所述居住建筑燃气排放数据转化为居住建筑单位面积碳排放数据。
步骤3:将所述居住建筑单位面积碳排放数据、所述建筑形态特征进行预处理,得到样本数据集。
步骤4:通过XGBoost算法的feature_importance属性判定样本数据集的特征重要性,在Jupyter Notebook上搭建scikit-learn平台,使用XGBoost算法中的model.feature_importances代码调用feature_importance函数输出特征重要性的分排序。
步骤5:根据步骤4所得到的特征排序进行选择,保留得分大于0.1的特征作为应用于模型预测的特征,如图2所示。
步骤6:将步骤5选择出的特征的数据集训练集,用XGBoost算法建立对所述居住建筑单位面积碳排放预测模型,以利用所述模型进行居住建筑燃气碳排放预测。将预测结果与居住建筑面积相乘,得到居住建筑燃气碳排放总量。
取1个实际样本作为预测模型,示例结果如下表:
Figure BDA0002796227020000101
Figure BDA0002796227020000111
一个预测模型的结果拟合曲线如图3所示,实线y为实际结果,虚线y_pred为预测结果。根据表格结果显示,均方差MSE最小为0.024,针对以上述一个实际样本的预测模型,选取均方差为0.024的预测模型为最优模型。当预测模型的均方差最小时,对应的最优预测模型的预测结果曲线与实际结果曲线的拟合度最高,预测模型的稳定性较好。
模型参数根据数据样本进行自优化调整,本方法应用于其他数据时,应根据步骤6所述模型选择最优模型作为最终预测模型,其模型具体参数根据数据样本进行调整,即可应用于不同建筑进行碳排放量预测,并且预测拟合度较高,可靠性强。
本发明实施例还提供了一种居住建筑燃气碳排放量预测终端,如图4所示,该居住建筑燃气碳排放量预测终端可以包括处理器41和存储器42,其中处理器41和存储器42可以通过总线或者其他方式连接,图4中以通过总线连接为例。
处理器41可以为中央处理器(Central Processing Unit,CPU)。处理器41还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器42作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块。处理器41通过运行存储在存储器42中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的居住建筑燃气碳排放量预测方法。
存储器42可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器41所创建的数据等。此外,存储器42可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器42可选包括相对于处理器41远程设置的存储器,这些远程存储器可以通过网络连接至处理器41。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器42中,当被所述处理器41执行时,执行如图1-3所示实施例中的居住建筑燃气碳排放量预测方法。
上述居住建筑燃气碳排放量预测终端具体细节可以对应参阅图1至图3所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random AccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种居住建筑燃气碳排放量预测方法,其特征在于,包括:
获取样本数据;所述样本数据包括居住建筑特征参数和与所述居住建筑特征参数对应的居住建筑单位面积碳排放值;
根据特征重要性对所述样本数据进行评分排序,选取评分大于预设值对应的所述样本数据作为预测模型特征;
根据所述预测模型特征建立预测模型,获得预测结果。
2.根据权利要求1所述的居住建筑燃气碳排放量预测方法,其特征在于,所述居住建筑特征参数包括:居住建筑燃气排放数据、建筑面积数据和建筑形态特征;其中,所述建筑形态特征包括建筑面宽进深比、体型系数、四面窗墙比、平均窗墙比、梯户数、层高和层数。
3.根据权利要求1所述的居住建筑燃气碳排放量预测方法,其特征在于,根据特征重要性对所述样本数据进行评分排序,选取评分大于预设值对应的所述样本数据作为预测模型特征包括:
获取每个所述样本数据在决策树模型中每个子树中的平均贡献度;
采用基尼指数评价所述平均贡献度,得到特征重要性评分。
4.根据权利要求3所述的居住建筑燃气碳排放量预测方法,其特征在于,采用基尼指数评价所述平均贡献度,得到特征重要性评分包括:
将特征重要性评分用F表示,将基尼指数用GI表示,计算每个所述样本数据中特征的基尼指数评分:
Figure FDA0002796227010000011
其中,K为类别总数,m、k、K均为自然数,pmk为第m个节点中第k个类别的特征所占比例;
计算每个所述样本数据特征在第m个节点中的重要性:
Fm=GIm-GIl-GIr
其中,GIl、GIr分别表示在第m个节点之后的两个新节点的基尼指数;
计算每个所述样本数据特征在决策树的第i棵子树中的重要性:
Figure FDA0002796227010000021
其中,M为同一特征在所述决策树中出现的节点的集合,i为自然数;
计算每个所述样本数据特征的得分:
Figure FDA0002796227010000022
其中,n为决策树的总数量。
5.根据权利要求4所述的居住建筑燃气碳排放量预测方法,其特征在于,根据所述预测模型特征建立预测模型,获得预测结果包括:
用极端梯度提升算法建立所述预测模型;
通过所述预测模型特征训练所述预测模型;
将待测建筑的特征参数代入所述预测模型,获得所述待测建筑的预测单位面积碳排放量;
将所述预测单位面积碳排放量与所述待测建筑的居住建筑面积相乘,得到所述待测建筑的预测燃气碳排放总量。
6.根据权利要求1所述的居住建筑燃气碳排放量预测方法,其特征在于,所述居住建筑单位面积碳排放值的计算如下:
Figure FDA0002796227010000023
其中,E为居住建筑单位面积碳排放量,P为统计一年居住建筑燃气排放量,D为燃气二氧化然排放因子,S为居住建筑的建筑面积。
7.根据权利要求1所述的居住建筑燃气碳排放量预测方法,其特征在于,在根据特征重要性对所述样本数据进行评分排序之前,还包括:采用数据空值填充规则对所述样本数据进行预处理;
对所述样本数据的各个特征进行归一化处理。
8.根据权利要求7所述的居住建筑燃气碳排放量预测方法,其特征在于,对所述样本数据的各个特征进行归一化处理包括:
Figure FDA0002796227010000031
其中,X为所述样本数据的特征值,Xmin为所述特征值的最小值,Xmax为所述特征值的最大值,Xstd为所述特征值的归一化结果。
9.根据权利要求5所述的居住建筑燃气碳排放量预测方法,其特征在于,通过所述预测模型特征训练所述预测模型包括:
对数据集按照3:1的比例随机划分为训练集和测试集;
按预设次数重复训练;
选取均方误差小于等于样本数据平均值10%的预测模型为最优预测模型。
10.根据权利要求9所述的居住建筑燃气碳排放量预测方法,其特征在于,选取均方误差小于等于样本数据平均值10%的预测模型为最优预测模型包括:
获取每个所述预测模型的预测结果:
Figure FDA0002796227010000032
其中,
Figure FDA0002796227010000033
为所述预测结果,j为自然数,fj表示第j棵树的模型函数,xj为所述预测模型特征;
选取最优预测模型:
Figure FDA0002796227010000034
其中,yt表示经过训练的第t棵树的优化预测结果,t∈[1,n],N为样本数据总数,Ω(fi)表示正则项优化函数,
Figure FDA0002796227010000035
为误差函数。
CN202011332532.7A 2020-11-24 2020-11-24 一种居住建筑燃气碳排放量预测方法 Pending CN112329262A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011332532.7A CN112329262A (zh) 2020-11-24 2020-11-24 一种居住建筑燃气碳排放量预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011332532.7A CN112329262A (zh) 2020-11-24 2020-11-24 一种居住建筑燃气碳排放量预测方法

Publications (1)

Publication Number Publication Date
CN112329262A true CN112329262A (zh) 2021-02-05

Family

ID=74308576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011332532.7A Pending CN112329262A (zh) 2020-11-24 2020-11-24 一种居住建筑燃气碳排放量预测方法

Country Status (1)

Country Link
CN (1) CN112329262A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113610268A (zh) * 2021-06-28 2021-11-05 天津大学 一种基于居住区空间形态的碳排放量预测方法
CN113742817A (zh) * 2021-08-12 2021-12-03 生态环境部环境规划院 一种建筑二氧化碳排放的预测方法及预测系统
CN113822500A (zh) * 2021-11-23 2021-12-21 阿里云计算有限公司 建筑行业碳排放量预测方法、平台、计算设备及介质
CN117196918A (zh) * 2023-09-21 2023-12-08 国家电网有限公司大数据中心 一种建筑碳排放确定方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012032861A (ja) * 2010-07-28 2012-02-16 Taisei Corp 二酸化炭素の排出量予測装置及びプログラム
CN109146171A (zh) * 2018-08-17 2019-01-04 西安建筑科技大学 用于建筑碳能模拟预测的城市居住建筑类型库构建方法
CN110516818A (zh) * 2019-05-13 2019-11-29 南京江行联加智能科技有限公司 一种基于集成学习技术的高维度数据预测方法
CN111401749A (zh) * 2020-03-17 2020-07-10 三峡大学 一种基于随机森林与极限学习回归的动态安全评估方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012032861A (ja) * 2010-07-28 2012-02-16 Taisei Corp 二酸化炭素の排出量予測装置及びプログラム
CN109146171A (zh) * 2018-08-17 2019-01-04 西安建筑科技大学 用于建筑碳能模拟预测的城市居住建筑类型库构建方法
CN110516818A (zh) * 2019-05-13 2019-11-29 南京江行联加智能科技有限公司 一种基于集成学习技术的高维度数据预测方法
CN111401749A (zh) * 2020-03-17 2020-07-10 三峡大学 一种基于随机森林与极限学习回归的动态安全评估方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
毛希凯: "建筑生命周期碳排放预测模型研究", 《CNKI网络出版》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113610268A (zh) * 2021-06-28 2021-11-05 天津大学 一种基于居住区空间形态的碳排放量预测方法
CN113742817A (zh) * 2021-08-12 2021-12-03 生态环境部环境规划院 一种建筑二氧化碳排放的预测方法及预测系统
CN113742817B (zh) * 2021-08-12 2022-04-12 生态环境部环境规划院 一种建筑二氧化碳排放的预测方法及预测系统
CN113822500A (zh) * 2021-11-23 2021-12-21 阿里云计算有限公司 建筑行业碳排放量预测方法、平台、计算设备及介质
CN117196918A (zh) * 2023-09-21 2023-12-08 国家电网有限公司大数据中心 一种建筑碳排放确定方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN112329262A (zh) 一种居住建筑燃气碳排放量预测方法
CN109858647B (zh) 一种耦合gis和gbdt算法的区域洪涝灾害风险评价与预估方法
CN110276556B (zh) 一种基于多策略的环境承载力指标权重计算方法及装置
CN112184008A (zh) 一种基于层次分析法的基站智慧节能模型评估方法及系统
CN110781947B (zh) 用电负荷预测模型训练、用电负荷预测方法及装置
CN112990500B (zh) 基于改进加权灰色关联分析的台区线损分析方法及系统
CN114331221A (zh) 一种基于机器学习的混凝土工程量指标估算方法
CN115374995A (zh) 一种分布式光伏、小风电场站功率预测方法
CN111861238A (zh) 高速公路桥梁工程风险评估方法、装置及计算机设备
CN115829081A (zh) 一种基于支持向量回归模型的城市交通碳排放预测方法
CN113610268A (zh) 一种基于居住区空间形态的碳排放量预测方法
AU2019100631A4 (en) Self-correcting multi-model numerical rainfall ensemble forecasting method
CN111598457A (zh) 一种电力无线网络质量的确定方法及装置
CN115948964A (zh) 一种基于ga-bp神经网络的路面平整度预测方法
CN111667189A (zh) 一种基于一维卷积神经网络的建筑工程项目风险预测方法
CN109657287B (zh) 基于综合得分法水文模型精度识别的方法
CN114707692A (zh) 基于混合神经网络的湿地出水氨氮浓度预测方法及系统
CN117370766A (zh) 一种基于深度学习的卫星任务规划方案评估方法
CN113537693A (zh) 人员风险等级获取方法、终端、存储装置
CN111461324A (zh) 基于层恢复敏感度的分级剪枝方法
CN110648023A (zh) 基于二次指数平滑改进gm(1,1)的数据预测模型的建立方法
CN116316600A (zh) 基于季节分型的面向风电功率日前预测自适应滤波方法
CN114741972A (zh) 一种空气污染物浓度季节性预测模型的构建方法
CN114049031A (zh) 一种雨水调蓄池优化选址的方法
CN113947332A (zh) 一种地下工程综合保障能力的评估方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210205

RJ01 Rejection of invention patent application after publication