CN116933934A - 融合viirs与统计数据的县域碳排放的预测与分析的方法及系统 - Google Patents
融合viirs与统计数据的县域碳排放的预测与分析的方法及系统 Download PDFInfo
- Publication number
- CN116933934A CN116933934A CN202310918730.9A CN202310918730A CN116933934A CN 116933934 A CN116933934 A CN 116933934A CN 202310918730 A CN202310918730 A CN 202310918730A CN 116933934 A CN116933934 A CN 116933934A
- Authority
- CN
- China
- Prior art keywords
- data
- carbon emission
- county
- viirs
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 229910052799 carbon Inorganic materials 0.000 title claims abstract description 155
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 title claims abstract description 153
- 238000004458 analytical method Methods 0.000 title claims abstract description 21
- 238000007637 random forest analysis Methods 0.000 claims abstract description 47
- 238000000034 method Methods 0.000 claims description 41
- 238000007781 pre-processing Methods 0.000 claims description 15
- 238000010586 diagram Methods 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 14
- 238000005265 energy consumption Methods 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 claims description 9
- 238000012417 linear regression Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 238000005520 cutting process Methods 0.000 claims description 5
- 230000005855 radiation Effects 0.000 claims description 5
- 238000007726 management method Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 238000002790 cross-validation Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 238000005457 optimization Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 238000013468 resource allocation Methods 0.000 claims description 2
- 238000012800 visualization Methods 0.000 claims description 2
- 238000004590 computer program Methods 0.000 claims 2
- 238000006243 chemical reaction Methods 0.000 claims 1
- 238000004140 cleaning Methods 0.000 claims 1
- 238000003860 storage Methods 0.000 claims 1
- 230000009467 reduction Effects 0.000 abstract description 5
- 238000005516 engineering process Methods 0.000 abstract description 4
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 10
- 230000008901 benefit Effects 0.000 description 6
- 230000000875 corresponding effect Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 229910002092 carbon dioxide Inorganic materials 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 239000003245 coal Substances 0.000 description 3
- 238000011835 investigation Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 239000001569 carbon dioxide Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000007789 gas Substances 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000005431 greenhouse gas Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Marketing (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Primary Health Care (AREA)
- Development Economics (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于碳排放预测技术领域,公开了一种融合VIIRS与统计数据的县域碳排放的预测与分析的方法及系统,对某行政区域的VIIRS夜间灯光数据进行预处理;将灯光指数与GDP、人口数量等碳排放相关影响因素的统计数据相拼接;构建随机森林模型。本发明以市县域为单位的小颗粒度数据对预测模型进行构建和训练,可以使得本技术预测模型可用于更细粒度的碳排放估计,能为省级不同区域差异化碳减排政策的制定提供科学依据,因地制宜。
Description
技术领域
本发明属于碳排放预测技术领域,尤其涉及一种融合VIIRS与统计数据的县域碳排放的预测与分析的方法及系统。
背景技术
夜间灯光影像可以有效地反映人类社会活动的强度,在社会经济监测、城市扩张演化和生态环境监测等方面的研究中得到了广泛应用。夜间灯光影像包含的信息与碳排放具有较高的相关性,能够反映区域碳排放的水平,在碳排放估算和空间化方面,夜间灯光影像已成为重要的数据源,一些研究通过融合两类遥感数据对碳排放进行时空分布分析。现有的碳排放量预测模型多为线性或多项式模型。
通过上述分析,现有技术存在的问题及缺陷为:
1.线性或多项式模型的局限性:线性模型和多项式模型只能捕捉数据之间的线性关系或简单的多项式关系,对于复杂的非线性关系很难进行拟合。在碳排放预测中,影响碳排放的因素很多,如人口、GDP、产业结构等,这些因素之间的关系很可能是非线性的。使用线性或多项式模型可能导致预测结果不够准确。
2.特征选择的挑战:线性或多项式模型需要进行相关性分析和共线性分析来选择合适的特征值作为自变量。这个过程需要专业知识和大量的实验,而且难以找到一个通用的特征选择方法,适应不同地区和时间的碳排放预测需求。
3.无法处理高维数据:由于线性或多项式模型需要特征降维和特征选择,这种模型难以处理高维数据。而在碳排放的预测中,有很多影响碳排放的因素,这些因素可能需要用高维数据来表示。使用现有的技术来预测碳排放时,可能会因为数据维度过高而导致计算复杂度过高,甚至无法进行计算。
4.过拟合问题:线性或多项式模型在拟合过程中可能会出现过拟合现象。过拟合是指模型在训练数据上表现得很好,但在测试数据或实际应用中表现得很差。这是因为模型过于复杂,以至于捕捉到了训练数据中的噪声,而非真实的关系。过拟合问题会导致预测结果在实际应用中的准确性降低。
综上所述,现有的线性或多项式模型在碳排放预测中存在诸多缺陷和问题,需要发展更先进的预测方法来解决这些问题。
发明内容
针对现有技术存在的问题,本发明提供了一种融合VIIRS与统计数据的县域碳排放的预测与分析的方法。
本发明是这样实现的,一种融合VIIRS与统计数据的县域碳排放的预测与分析的方法包括:对某行政区域的VIIRS夜间灯光数据进行预处理;将灯光指数与GDP、人口数量等碳排放相关影响因素的统计数据相拼接;构建随机森林模型,形成能够利用多源数据估算山西省各区域碳排放量的模型。
进一步,融合VIIRS与统计数据的县域碳排放的预测与分析的方法包括以下步骤:
步骤一,对某行政区域的VIIRS夜间灯光数据进行预处理;
步骤二,将灯光指数与GDP、人口数量等碳排放相关影响因素的统计数据相拼接,形成k维特征向量;
步骤三,构建随机森林模型,以特征向量为输入,以各市县区相应时间的碳排放量为预测目标,对随机森林进行训练及精度检验,形成能够利用多源数据估算山西省各区域碳排放量的模型。
进一步,步骤一中的预处理方法具体包括:
(1)将行政区划矢量图和2012-2021年全球夜间灯光影像坐标投影转换为GCS_WGS_1984_UTM;
(2)基于行政区划矢量图,利用ArcGIS软件对全球VIIRS影像进行裁剪,裁剪后的NPP-VIIRS影像仅保留X省范围内的数据;
(3)选取全国单元格像元辐射阈值为472.86将大于该阈值的高值噪声,选用8邻域去噪,小于0.5的像素值视为背景噪声,置零后以市、县域为单位计算灯光指数特征。
本发明的另一目的在于融合VIIRS与统计数据的县域碳排放的分析。
步骤一,采用Slope倾向值法,即利用一元线性回归模型计算不同年份各区县或栅格单元的能源消费碳排放的Slope倾向值,对碳排放量时间趋势特征进行分析;
步骤二,基于随机森林的多源数据融合碳排放预测,采用均方根误差(RMSE)、平均绝对误差(MAE)和拟合优度R2作为评价指标进行了分析;
步骤三,采用皮尔逊相关系数,分别对夜间灯光指标与碳排放量的相关性,及统计指标与碳排放量的相关性进行了分析。
步骤三中皮尔逊相关系数r计算公式如下:
式中r的范围是[-1,1];n为样本点的个数;Xi和Yi分别为第i个区县的夜间灯光总量和能源消费碳排放量;X和Y分别为变量的平均值。
步骤三中Slope倾向值法计算公式如下:
式中L,为总年份数,l代表年序号,Cl表示第l年各县区能源消费碳排放量
结合上述的技术方案和解决的技术问题,本发明所要保护的技术方案所具备的优点及积极效果为:
第一,针对现有的碳排放量预测模型需要特征降维和特征选择,不能处理处理高维数据等问题,本发明采用基于集成学习的随机森林模型构建碳排放量预测模型。本发明提出一种融合VIIRS与统计数据的县域碳排放的预测与分析的方法,该方法首先对某行政区域的VIIRS夜间灯光数据进行预处理:将X省行政区划矢量图和2012-2021年全球夜间灯光影像坐标投影转换为GCS_WGS_1984_UTM后,基于X省行政区划矢量图,利用ArcGIS软件对全球VIIRS影像进行裁剪;裁剪后的NPP-VIIRS影像仅保留X省范围内的数据,由于有少量负值和可能由gas flares引起的少量极端异常值,选取全国单元格像元辐射阈值为472.86,将大于该阈值的高值噪声,选用8邻域去噪;并小于0.5的像素值视为背景噪声,置零后以市、县域为单位计算灯光指数特征。然后,将灯光指数与GDP、人口数量等碳排放相关影响因素的统计数据相拼接,形成k维特征向量;最后,构建随机森林模型,以特征向量为输入,以各市县区相应时间的碳排放量为预测目标,对随机森林进行训练及精度检验,形成能够利用多源数据估算山西省各区域碳排放量的模型。
第二,本技术采用基于集成学习的随机森林模型构建碳排放量预测模型。相较于目前大部分研究采用线性或多项式模型,随机森林模型采用特征和数据的随机抽样,具有能够处理高维数据,不需要特征降维,无需进行特征选择的优点。随机森林还可以用来判断特征的重要程度,能够处理数据特征缺失的问题,具有很好的抗过拟合能力,训练过程中采用袋外样本评估模型性能,模型较为稳定。同时,将随机森林与线性回归模型、高斯线性回归模型,及支持向量机模型在县域案例上进行对比实验,随机森林在所有指标上均优于其他模型,在精度上有更大的优势。
本技术采用以市、县域为单位的多源数据,将VIIRS夜间灯光数据与GDP、人口数量等碳排放相关影响因素的统计数据融合,用于碳排放估计。通过分别对夜间灯光指标与碳排放量的相关性,及统计指标与碳排放量的相关性进行了皮尔逊相关系数分析,可证实夜间灯光数据与GDP等碳排放量统计数据跟碳排放量高度相关。与仅使用夜光数据特征或统计数据特征进行碳排放预测相比,融合后的多源数据的模型估算结果与真实值拟合度更佳,比使用单一数据源能够更准确地估算二氧化碳的排放量。
第三,融合VIIRS夜间灯光数据与统计数据的县域碳排放预测与分析方法具有以下技术效果和优点:
1)数据融合:通过结合VIIRS夜间灯光数据和统计数据(如GDP、人口数量等),该方法能够更全面地反映县域碳排放的影响因素。灯光指数能够反映经济活动的强度,与碳排放具有较强的相关性。同时,引入GDP和人口数量等统计数据,可以进一步提高预测精度。
2)模型优势:采用随机森林模型进行预测具有较强的泛化能力和鲁棒性。随机森林是一种集成学习方法,通过构建多棵决策树并综合其结果进行预测。这种模型能够有效处理高维特征数据,减小过拟合的风险,并提高预测精度。
3)预测准确性:通过对随机森林模型的训练和精度检验,可以形成一个能够利用多源数据估算各区域碳排放量的模型。这种方法可以提高县域碳排放预测的准确性,从而为政策制定者和管理部门提供更可靠的参考数据。
4)灵活性:该方法适用于不同地区和时间范围的数据,具有较强的通用性和适应性。这意味着该方法可以应用于其他地区或扩展到更大的地理范围,为碳排放监测和管理提供支持。
5)实用性:通过使用公开可获取的数据(例如VIIRS夜间灯光数据和统计数据),该方法具有较高的实用性。这使得研究人员和政策制定者可以在有限的资源下进行有效的碳排放预测和分析。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的融合VIIRS与统计数据的县域碳排放的预测流程图。
图2是本发明实施例提供的分别以夜光数据特征、统计数据特征、融合后特征为随机森林模型的输入的碳排放预测值与实际值的对比图。
图3是本发明实施例提供的2018-2020山西省市县CO2数据图。
图4是本发明实施例提供的2015-2019山西省碳排放量图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种融合VIIRS与统计数据的县域碳排放的预测与分析的方法,下面结合附图对本发明作详细的描述。
如图1所示,本发明实施例提供的融合VIIRS与统计数据的县域碳排放的预测方法包括以下步骤:
S101,对某行政区域的VIIRS夜间灯光数据进行预处理;
S102,将灯光指数与GDP、人口数量等碳排放相关影响因素的统计数据相拼接;
S103,构建随机森林模型,形成能够利用多源数据估算山西省各区域碳排放量的模型。
本发明实施例提供的融合VIIRS夜间灯光数据与统计数据的县域碳排放预测与分析系统可以分为以下几个主要模块:
1)数据获取模块:负责收集所需的原始数据,包括VIIRS夜间灯光数据、GDP数据、人口数量数据等。这些数据可以从相应的政府部门、统计局或公开数据源获取。
2)数据预处理模块:对收集到的原始数据进行清洗、处理和格式转换。对于VIIRS夜间灯光数据,需要进行去云、去饱和、去噪等预处理操作,以提高数据质量。
3)特征提取与融合模块:从预处理后的数据中提取与碳排放相关的特征,例如灯光指数。然后,将这些特征与GDP、人口数量等统计数据拼接,形成k维特征向量。
4)模型构建与训练模块:基于随机森林算法构建预测模型。以特征向量为输入,以各市县区相应时间的碳排放量为预测目标,对随机森林进行训练。
5)模型评估与优化模块:对训练好的随机森林模型进行精度检验,如使用交叉验证、均方误差(MSE)等评价指标衡量模型性能。根据评估结果,对模型进行调整和优化,以提高预测精度。
6)碳排放预测模块:利用训练好的随机森林模型,对新的输入数据进行碳排放量预测。预测结果可以用于政策制定、资源分配和碳排放管理等应用场景。
7)可视化与报告模块:将预测结果以图表、地图等形式展示,便于分析和解读。同时,生成包含预测结果和相关分析的报告文档,以供政策制定者和管理部门参考。
通过这些模块的协同工作,该系统能够实现基于VIIRS夜间灯光数据和统计数据的县域碳排放预测与分析功能。
作为优选实施例,本发明实施例提供的一种融合VIIRS与统计数据的县域碳排放的预测方法,具体包括以下步骤:
步骤1,对某行政区域的VIIRS夜间灯光数据进行预处理:将X省行政区划矢量图和2012-2021年全球夜间灯光影像坐标投影转换为GCS_WGS_1984_UTM后,基于X省行政区划矢量图,利用ArcGIS软件对全球VIIRS影像进行裁剪;裁剪后的NPP-VIIRS影像仅保留X省范围内的数据,由于有少量负值和可能由gas flares引起的少量极端异常值,选取全国单元格像元辐射阈值为472.86,将大于该阈值的高值噪声,选用8邻域去噪;并小于0.5的像素值视为背景噪声,置零后以市、县域为单位计算灯光指数特征;
步骤2,将灯光指数与GDP、人口数量等碳排放相关影响因素的统计数据相拼接,形成k维特征向量;
步骤3,构建随机森林模型,以特征向量为输入,以各市县区相应时间的碳排放量为预测目标,对随机森林进行训练及精度检验,形成能够利用多源数据估算X省各区域碳排放量的模型。
本发明实施例提供的融合VIIRS与统计数据的县域碳排放的分析方法包括:
采用Slope倾向值法,即利用一元线性回归模型计算不同年份各区县或栅格单元的能源消费碳排放的Slope倾向值,对碳排放量时间趋势特征进行分析;
基于随机森林的多源数据融合碳排放预测,采用均方根误差(RMSE)、平均绝对误差(MAE)和拟合优度R2作为评价指标进行了分析;
采用皮尔逊相关系数,分别对夜间灯光指标与碳排放量的相关性,及统计指标与碳排放量的相关性进行了分析。
实施例1:本发明验证随机森林模型。为了验证随机森林模型的有效性,将其与线性回归模型、高斯线性回归模型,及支持向量机模型进行了对比实验。同时,为验证随机森林模型不需要进行特征选择,根据Pearson相关系数筛选后的特征作为随机森林模型输入,开展了对比实验。此外,为进一步分析融合两种模态数据用于碳排放估计的效果,分别以仅夜光数据特征、仅统计数据特征,与融合两类特征作为随机森林模型的输入,进行了性能对比。所有实验均以2012-2016年数据为训练集,在2017年的数据上进行测试,预测精度的结果如
表1所示。
由表1可见,随机森林在所有指标上均优于其他模型(线性回高、高斯线性回归、支持向量机)。使用随机森林模型,无论是否进行特征筛选,性能接近,均能达到较好碳排放估算效果。图2给出了分别以夜光数据特征、统计数据特征、融合后特征为随机森林模型的输入,对2017年碳排放量估算结果与真实结果的散点图及拟合度指标R2。可以看出,使用融合多源数据的模型估算结果与真实值拟合度最佳。
实施例2:本发明对碳排放量空间分布分析。使用训练好的随机森林模型对2018-2020年的山西省市、县的碳排放量进行估算,结果的空间分布如图3,统计2012-2020年各年度的总碳排放量,并计算各年度相较于2012年的变化率。时间维度上,历史数据显示碳排放量超过5Mt的高碳排放区(市和县),2012年为24个,2013年23个,14年22个,15年20个,16-17年21个。预测结果显示,2018年25个,2019年28个,2020年32个。从碳排放量总量上来看,2012-2020年呈现出先下降后增长的趋势,2015年碳排放量最低为3.82亿吨,2020年为最高4.58亿吨。这与文献总体结论一致,但由于计算数据源及方法的不同,CO2数量上有所差异;本文所测算的碳排放量低于由温室气体核算法计算得到的数值。空间维度上,根据2018-2020年估算的数据来看,山西省的11个地级市除晋城市外,一直都属于高碳排放区,特别是太原市和大同市碳排量远超其他地市,阳泉市和朔州市次之,这与其经济、人口、以煤炭为龙头的产业格局等均有密切关系。山西省11个县级市的CO2排放量大部分处于4-8Mt的范围内,其中孝义市和介休市碳排放量相对较高,原平市、高平市的增长较快。山西省县域中CO2排放量最大的为临汾市所辖的洪洞县,属于高碳排区域,这与洪洞县以原煤为主要产业不无关系,但是2018-2020年以来碳排放总量有一定程度的下降,这可能与2018年洪洞县贯彻落实《山西省大气污染防治2018年行动计划》,加快能源消费结构、产业结构和布局优化调整的成效有关。从总体上看,高碳排放区纵向分布在山西省中部,而碳排放量低于4Mt的低碳排放区纵向分布在山西省的东部和西部,但其最西部和东南部属于中高碳排区。这种分布与山西省“两山夹一川”(某市山和太行山,及黄河支流汾河谷地)的地势有一定的关系。
实施例3:本发明对碳排放量时间趋势特征分析。结合历史和测算出的山西省2012-2020年各市县碳排放量,计算出Slope值,按表1标准将Slope值划分为5种类型,结果如表2所示。为了更好地分析2018-2020年县域碳排放的时空演变,使用ArcGIS软件对碳排放量倾向值进行可视化,并与2015和2017年的情况进行对比。山西省的市县域碳排放量的趋势变化分布图4。
从总体变化趋势上来看,2015年没有碳排放迅速增长的地区,但是有35个地区属于低速增长;2017-2020年迅速增长的区域为2-3个,其中长治市所辖的长子县一直保持了快速增长的势头,虽然其碳排放总量不大,但增速较大。该县2020年成为国家级“互联网+”农产品出村进城工程试点县,近年来县政府一直大力支持蔬菜产业发展,GDP增长较快,因此碳排量的快速增长可能与此有关。此外,某市的碳排放量增长也比较迅速,该市属于煤炭资源型城市,且2015-2019年间某市的区域经济增长明显,GDP增速由2015年的-4.7%增长至2019年的5.7%。2015-2020年间接近50%的区域碳排放量是保持基本不变的;碳排放量迅速降低和低速降低的区域也较为稳定,主要纵向分布在中南部分区域,以及北部的大同市区。
表2山西省能源消费碳排放变化具体类型
实施例1:预测某沿海省份的县域碳排放
在这个实施例中,选取某沿海省份的县域作为研究对象。首先,获取该省份的行政区划矢量图、VIIRS夜间灯光数据和碳排放相关的统计数据。然后,按照权利要求中的方法进行数据预处理、特征拼接和随机森林模型构建。最后,利用构建的模型对该省份各县域的碳排放进行预测和分析。
实施例2:预测某内陆省份的县域碳排放
与实施例1类似,选取某内陆省份的县域作为研究对象。在这个实施例中,由于地理位置的不同,可能需要调整数据预处理的参数,如阈值和邻域去噪方法。其他步骤与实施例1相同。
实施例3:预测某特大城市的区域碳排放
在这个实施例中,选取某特大城市及其辖区作为研究对象。由于特大城市的经济发展水平和人口密度较高,可能需要进一步细化统计数据和灯光指数的计算方法。其他步骤与实施例1相同。
实施例4:预测某高原地区的县域碳排放
选取某高原地区的县域作为研究对象。在这个实施例中,由于地理环境的特殊性,可能需要对数据预处理和模型构建进行相应调整。其他步骤与实施例1相同。
实施例5:预测某河南省的县域碳排放
在这个实施例中,选取某河南省的县域作为研究对象。首先,获取河南省的行政区划矢量图、VIIRS夜间灯光数据和碳排放相关的统计数据。然后,按照权利要求中的方法进行数据预处理、特征拼接和随机森林模型构建。最后,利用构建的模型对河南省各县域的碳排放进行预测和分析。
实施例6:预测某东北省份的县域碳排放
与实施例5类似,选取某东北省份的县域作为研究对象。在这个实施例中,由于地理位置的不同,可能需要调整数据预处理的参数,如阈值和邻域去噪方法。其他步骤与实施例5相同。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种融合VIIRS与统计数据的县域碳排放的预测与分析的方法,其特征在于,对某行政区域的VIIRS夜间灯光数据进行预处理;将灯光指数与GDP、人口数量等碳排放相关影响因素的统计数据相拼接;构建随机森林模型。
2.如权利要求1所述的融合VIIRS与统计数据的县域碳排放的预测方法,其特征在于,融合VIIRS与统计数据的县域碳排放的预测方法包括以下步骤:
步骤一,对某行政区域的VIIRS夜间灯光数据进行预处理;
步骤二,将灯光指数与GDP、人口数量等碳排放相关影响因素的统计数据相拼接,形成k维特征向量;
步骤三,构建随机森林模型,以特征向量为输入,以各市县区相应时间的碳排放量为预测目标,对随机森林进行训练及精度检验,形成能够利用多源数据估算X省各区域碳排放量的模型。
3.如权利要求2所述的融合VIIRS与统计数据的县域碳排放的预测方法,其特征在于,步骤一中的预处理方法具体包括:
(1)将X省行政区划矢量图和2012-2021年全球夜间灯光影像坐标投影转换为GCS_WGS_1984_UTM;
(2)基于X省行政区划矢量图,利用ArcGIS软件对全球VIIRS影像进行裁剪,裁剪后的NPP-VIIRS影像仅保留X省范围内的数据;
(3)选取全国单元格像元辐射阈值为472.86将大于该阈值的高值噪声,选用8邻域去噪,小于0.5的像素值视为背景噪声,置零后以市、县域为单位计算灯光指数特征。
4.如权利要求2所述的融合VIIRS与统计数据的县域碳排放的预测方法,其特征在于,步骤二具体包括:
将行政区划矢量图和2012-2021年全球夜间灯光影像坐标投影转换为GCS_WGS_1984_UTM后,基于行政区划矢量图,利用ArcGIS软件对全球VIIRS影像进行裁剪;
裁剪后的NPP-VIIRS影像仅保留X省范围内的数据,由于有少量负值和可能由gasflares引起的少量极端异常值,选取全国单元格像元辐射阈值为472.86,将大于该阈值的高值噪声,选用8邻域去噪;并将小于0.5的像素值视为背景噪声,置零后以市、县域为单位计算灯光指数特征;
然后,将灯光指数与GDP、人口数量等碳排放相关影响因素的统计数据相拼接,形成k维特征向量。
5.如权利要求2所述的融合VIIRS与统计数据的县域碳排放的预测方法,其特征在于,步骤三具体包括:
构建随机森林模型,以特征向量为输入,以各市县区相应时间的碳排放量为预测目标,对随机森林进行训练及精度检验,形成能够利用多源数据估算X省各区域碳排放量的模型。
6.如权利要求2所述的融合VIIRS与统计数据的县域碳排放的预测与分析的方法,其特征在于,采用Slope倾向值法,即利用一元线性回归模型计算不同年份各区县或栅格单元的能源消费碳排放的Slope倾向值,对碳排放量时间趋势特征进行分析;
基于随机森林的多源数据融合碳排放预测,采用均方根误差(RMSE)、平均绝对误差(MAE)和拟合优度R2作为评价指标进行了分析;
采用皮尔逊相关系数,分别对夜间灯光指标与碳排放量的相关性,及统计指标与碳排放量的相关性进行了分析。
7.如权利要求2所述的融合VIIRS与统计数据的县域碳排放的预测与分析的方法,其特征在于,步骤三中皮尔逊相关系数r计算公式如下:
式中r的范围是[-1,1];n为样本点的个数;Xi和Yi分别为第i个区县的夜间灯光总量和能源消费碳排放量;X和Y分别为变量的平均值。
步骤三中Slope倾向值法计算公式如下:
式中L,为总年份数,l代表年序号,Cl表示第l年各县区能源消费碳排放量。
8.一种融合VIIRS夜间灯光数据与统计数据的县域碳排放预测与分析系统,其特征在于,包括:
1)数据获取模块:负责收集所需的原始数据,包括VIIRS夜间灯光数据、GDP数据、人口数量数据;这些数据可以从相应的政府部门、统计局或公开数据源获取;
2)数据预处理模块:对收集到的原始数据进行清洗、处理和格式转换;对于VIIRS夜间灯光数据,需要进行去云、去饱和、去噪预处理操作,以提高数据质量;
3)特征提取与融合模块:从预处理后的数据中提取与碳排放相关的特征;然后,将这些特征与GDP、人口数量统计数据拼接,形成k维特征向量;
4)模型构建与训练模块:基于随机森林算法构建预测模型;以特征向量为输入,以各市县区相应时间的碳排放量为预测目标,对随机森林进行训练;
5)模型评估与优化模块:对训练好的随机森林模型进行精度检验,如使用交叉验证、均方误差评价指标衡量模型性能;根据评估结果,对模型进行调整和优化,以提高预测精度;
6)碳排放预测模块:利用训练好的随机森林模型,对新的输入数据进行碳排放量预测;预测结果可以用于政策制定、资源分配和碳排放管理应用场景;
7)可视化与报告模块:将预测结果以图表、地图形式展示,便于分析和解读;同时,生成包含预测结果和相关分析的报告文档,以供政策制定者和管理部门参考。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1~7任意一项所述融合VIIRS与统计数据的县域碳排放的预测与分析的方法的步骤。
10.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1~7任意一项所述融合VIIRS与统计数据的县域碳排放的预测与分析的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310918730.9A CN116933934A (zh) | 2023-07-25 | 2023-07-25 | 融合viirs与统计数据的县域碳排放的预测与分析的方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310918730.9A CN116933934A (zh) | 2023-07-25 | 2023-07-25 | 融合viirs与统计数据的县域碳排放的预测与分析的方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116933934A true CN116933934A (zh) | 2023-10-24 |
Family
ID=88382285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310918730.9A Pending CN116933934A (zh) | 2023-07-25 | 2023-07-25 | 融合viirs与统计数据的县域碳排放的预测与分析的方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116933934A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117436729A (zh) * | 2023-12-21 | 2024-01-23 | 山东中翰软件有限公司 | 一种基于政务系统数据治理和数据分析方法 |
CN118627692A (zh) * | 2024-08-12 | 2024-09-10 | 南京江行联加智能科技有限公司 | 基于碳智能管理平台异构数据融合接入方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105205466A (zh) * | 2015-09-21 | 2015-12-30 | 广州地理研究所 | 一种基于夜间灯光影像的能源碳排放量遥感估算方法 |
CN114461697A (zh) * | 2022-01-04 | 2022-05-10 | 武汉理工大学 | 基于夜间灯光遥感和改进stirpat的城市碳排放核算方法 |
CN115658776A (zh) * | 2022-12-05 | 2023-01-31 | 武汉大学 | 联合多源数据生成全国1km碳排放空间分布图的方法 |
CN115879630A (zh) * | 2022-12-17 | 2023-03-31 | 西安交通大学 | 基于土地利用的碳排放即时表征与预测的方法及装置 |
CN116415110A (zh) * | 2023-06-05 | 2023-07-11 | 武汉大学 | 基于多源遥感密度数据进行碳排放量分区网格化的方法 |
-
2023
- 2023-07-25 CN CN202310918730.9A patent/CN116933934A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105205466A (zh) * | 2015-09-21 | 2015-12-30 | 广州地理研究所 | 一种基于夜间灯光影像的能源碳排放量遥感估算方法 |
CN114461697A (zh) * | 2022-01-04 | 2022-05-10 | 武汉理工大学 | 基于夜间灯光遥感和改进stirpat的城市碳排放核算方法 |
CN115658776A (zh) * | 2022-12-05 | 2023-01-31 | 武汉大学 | 联合多源数据生成全国1km碳排放空间分布图的方法 |
CN115879630A (zh) * | 2022-12-17 | 2023-03-31 | 西安交通大学 | 基于土地利用的碳排放即时表征与预测的方法及装置 |
CN116415110A (zh) * | 2023-06-05 | 2023-07-11 | 武汉大学 | 基于多源遥感密度数据进行碳排放量分区网格化的方法 |
Non-Patent Citations (2)
Title |
---|
刘艳姣;王介勇;王志炜;: "基于NPP/VIIRS夜间灯光数据的黄淮海地区城乡常住人口格局模拟", 地域研究与开发, vol. 38, no. 3, pages 176 - 179 * |
郭忻怡;闫庆武;谭晓悦;刘思佳;: "基于DMSP/OLS与NDVI的江苏省碳排放空间分布模拟", 世界地理研究, vol. 25, no. 04, pages 103 - 110 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117436729A (zh) * | 2023-12-21 | 2024-01-23 | 山东中翰软件有限公司 | 一种基于政务系统数据治理和数据分析方法 |
CN118627692A (zh) * | 2024-08-12 | 2024-09-10 | 南京江行联加智能科技有限公司 | 基于碳智能管理平台异构数据融合接入方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116933934A (zh) | 融合viirs与统计数据的县域碳排放的预测与分析的方法及系统 | |
CN114742272A (zh) | 一种基于时空交互关系的土壤镉风险预测方法 | |
CN112287018A (zh) | 一种台风灾害下10kV杆塔受损风险评估方法及系统 | |
CN111079999A (zh) | 一种基于cnn和svm的洪水灾害易发性预测方法 | |
Chen et al. | An adaptive Kalman filtering approach to sensing and predicting air quality index values | |
CN114077970B (zh) | 一种基于城市形态的碳排放相关因子的确定方法及装置 | |
CN118152501B (zh) | 基于资源数据获取土地利用变化信息的方法及系统 | |
Oshan et al. | A scoping review on the multiplicity of scale in spatial analysis | |
Sharma et al. | Forecasting and prediction of air pollutants concentrates using machine learning techniques: the case of India | |
CN116401601B (zh) | 基于逻辑回归模型的停电敏感用户处置方法 | |
Gai et al. | Research on water quality spatiotemporal forecasting model based on ST-BIGRU-SVR neural network | |
Faulkner et al. | Modelling non-stationary flood frequency in England and Wales using physical covariates | |
Cao et al. | Probabilistic runoff forecasting considering stepwise decomposition framework and external factor integration structure | |
CN114398760B (zh) | 区域植被覆盖度与降水关系非一致性识别方法 | |
Yang et al. | Regional Water Environmental Carrying Capacity: Changing Trends and Direction, Obstacle Factors, and Implications | |
Kocharekar et al. | Weather prediction for tourism application using arima | |
Li et al. | Road crack detection and quantification based on segmentation network using architecture of matrix | |
Li et al. | An integrated urban flooding risk analysis framework leveraging machine learning models: A case study of Xi'an, China | |
Abuhammad et al. | Rainfall prediction using deep learning algorithms | |
CN116680518B (zh) | 用于地表水环境的时空态势分析方法 | |
CN118228934B (zh) | 一种用于变电站的碳排放监测管理方法及系统 | |
Lakshmi et al. | Climate Resilience Enhancement, Air Pollution Detects from Images using CNN | |
Zhao et al. | Integrating Multi-source Data for CO₂ Emission Prediction at City and County Level–A Case Study in Shanxi Province, China | |
Ahammad et al. | Machine Learning for GDP Forecasting: Enhancing Economic Projections in Bangladesh | |
Lokesh et al. | A novel approach for air quality prediction using machine learning approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |