CN102305792B - 基于非线性偏最小二乘优化模型的森林碳汇遥感估算方法 - Google Patents

基于非线性偏最小二乘优化模型的森林碳汇遥感估算方法 Download PDF

Info

Publication number
CN102305792B
CN102305792B CN201110207384.0A CN201110207384A CN102305792B CN 102305792 B CN102305792 B CN 102305792B CN 201110207384 A CN201110207384 A CN 201110207384A CN 102305792 B CN102305792 B CN 102305792B
Authority
CN
China
Prior art keywords
variable
model
value
remote sensing
regression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110207384.0A
Other languages
English (en)
Other versions
CN102305792A (zh
Inventor
杜华强
周国模
范渭亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang A&F University ZAFU
Original Assignee
Zhejiang A&F University ZAFU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang A&F University ZAFU filed Critical Zhejiang A&F University ZAFU
Priority to CN201110207384.0A priority Critical patent/CN102305792B/zh
Publication of CN102305792A publication Critical patent/CN102305792A/zh
Application granted granted Critical
Publication of CN102305792B publication Critical patent/CN102305792B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于非线性偏最小二乘优化模型的森林碳汇遥感估算方法,主要步骤是:一是采用核函数把原始变量映射到高维空间得到新变量,并进行标准化处理;二是采用最小二乘法对提取的成分进行回归分析,并将回归系数还原;三是采用LOO交叉有效性对模型进行评价;四是重复步骤二到三,每次重复时将成分数增加1,直到提取成分数达到最大值;五是重复步骤一到四,每次重复时将步骤一中的分段数M增加1,直到M等于预设数;六是从所有模型中寻找估计值与实际值相关系数最大的模型,并用此时的M和提取成分数建模,作为最终的估算模型。本发明将优化的非线性偏最小二乘回归用于建立森林碳储量预测模型,提高了森林碳储量预测精度。

Description

基于非线性偏最小二乘优化模型的森林碳汇遥感估算方法
【技术领域】
本发明涉及基于统计优化模型的森林碳汇遥感估算方法。
【背景技术】
森林是全球碳平衡的重要组成部分,在陆地碳循环中起着关键作用,因此,精确估算森林碳储量对研究全球变化具有重要意义。竹林是中国亚热带地区(如浙江、安徽、江西、福建等省)特殊的森林类型,近年研究表明,竹林资源具有巨大的碳储量,其对全球碳平衡的贡献开始受到关注。
遥感是森林地上碳储量估算的重要手段,但遥感技术不能直接测定生物量、碳储量及其变化,需要对遥感观测数据进行一系列处理、转换,并结合地面观测数据建立相应的遥感信息模型才能定量估算。经验模型是建立森林生物物理变量(如生物量、碳储量、叶面积指数、郁闭度等)与遥感数据之间关系的重要工具,其中普通最小二乘回归分析是广泛使用的经验方法。
基于普通最小二乘的多元线性回归假设遥感数据与生物物理属性存在线性关系,并假设自变量(遥感数据光谱波段)独立,但生物物理属性光谱响应多数为曲线关系,且波段之间存在很高的相关关系,因此,回归分析往往难以满足基本假设,会产生不精确的估计;另外,如果光谱反射率和生物物理属性变量存在测量错误,普通最小二乘回归可能得到一个错误的模型,然而光谱反射率和生物物理属性变量不可能没有误差。
相对普通最小二乘而言,偏最小二乘回归是碳储量遥感估算一个很好的选择。偏最小二乘回归是上个世纪80年代发展起来的一种先进的多元统计分析方法,它能容忍偏最小二乘回归变量之间的多重相关,把多元回归、主成分分析、典型相关分析有机地结合起来,在一个算法下同时实现回归建模、数据结构简化以及两组变量间的相关分析,能够把自变量和因变量之间的相关关系取到最大值,提高模型相关分析精度,具有较强的解析能力。偏最小二乘回归分为线性和非线性两种方法,其中非线性偏最小二乘回归模型是偏最小二乘回归的重要成果,既解决线性偏最小二乘回归只能提取线性成分的问题,又借鉴了线性偏最小二乘回归方法能够有效解决自变量集合高度相关的技术,从而确定数据系统内部的复杂非线性结构关系,增强了模型的可解释性,具有比线性偏最小二乘回归模型较高的预测精度。
因此,生物量碳储量偏最小二乘回归优化模型的优势在于:一、解决了不同波段光谱反射率之间的多重相关问题;二、提高了用统计方法预测森林碳储量的精度。
【发明内容】
本发明所要解决的技术问题是提供了一种基于非线性偏最小二乘优化模型的森林碳汇遥感估算方法。
本方法按如下步骤进行:
(1)、在研究区域内设置调查样地,观测样地内的生物量碳储量并获取与观测时间相对应的遥感影像。将遥感影像的多个波段光谱反射率作为自变量,观测到的生物量碳储量作为因变量;
(2)、按照公式①对自变量空间的每一个自变量xj进行高斯核函数变换,得到新的自变量。将因变量与新的自变量进行标准化处理,处理后的数据符合公式②的线性关系;
Z j = ( z j , 0 , z j , 1 , z j , 2 · · · , z j , M + 2 ) = K ( x j - ξ j , l - 1 h j )
y ~ = Σ j = 1 p Σ l = 0 M + 2 α j , l z ~ j , l + ϵ
其中K为核函数;j=1,2,…,p(p为自变量个数,即遥感数据的波段数);l=0,1,2,…,M+2;ξjl-1=min(xj)+(l-1)hj,为变量xj上划分的区间分点;
Figure GSB00001061548500033
为变量xj上分段长度;M为变量xj上分段数,M的初始值设为1;
Figure GSB00001061548500034
为Z标准化后的值;y为因变量(碳储量),
Figure GSB00001061548500035
为y标准化后的值;
(3)、对公式②进行线性偏最小二乘回归,其中提取的成分数Cp为1,求得回归系数αj,l。将αi,l还原为原变量的回归系数β0,βj,l,最后由全体自变量与因变量的非线性拟合函数公式③得到估计值;
y ^ = β 0 + Σ j = l p f ^ j ( x j ) + ϵ = β 0 + Σ l = 1 p Σ l = 0 M + 2 β j , l K ( x j - ξ j , l - 1 h j )
(4)、采用LOO(Leave One Out)交叉有效性对模型进行评价。LOO交叉有效性检验过程为:去掉一个样本,用剩余n-1个样本建模,并用对去掉的样本进行预测,得到所有样本的估计值。用公式④计算得到估计值与真实值之间的相关系数并作为评价指标;
R = Σ i = 1 n ( y i - y c ‾ ) ( y ^ i - y e ‾ ) Σ i = 1 n ( y i - y c ‾ ) 2 Σ i = l n ( y ^ i - y e ‾ ) 2
其中
Figure GSB00001061548500042
模型估计值,yi观测值,
Figure GSB00001061548500043
观测平均值;
Figure GSB00001061548500044
估计平均值;
(5)、重复步骤(3)到(4),每次重复时将Cp增加1,直到提取成分数达到最大值。对于M,核函数变换可以把原始p维变量映射到
Figure GSB00001061548500045
维空间,可提取的最多成分数为
Figure GSB00001061548500046
(6)、重复步骤(2)到(5),每次重复时将步骤(2)中的M增加1,直到M等于预设值m;
(7)、非线性偏最小二乘回归精度取决于M和Cp。如果各变量的分段数M一定,则对每一个M,Cp从1到C变化,则可以得到C个模型。这样总共可以建立
Figure GSB00001061548500047
个模型。然后,从所有模型中寻找估计值与实际值相关系数最大的模型,并用此时的Mj和Cp建模,作为最终的估算模型。
本发明的有益效果是非线性偏最小二乘优化方法可以建立高精度的森林碳储量预测模型,解决了以往统计模型预测精度低的问题。
图1是本发明的流程图;
【具体实施方式】
本发明下面结合实施例并参照附图予以详述:
现以毛竹林地上部分碳储量的遥感估算为例说明本发明各步骤的具体实施方式。
步骤一:在研究区域内设置调查样地,观测样地内的生物量并转化为碳储量,获取与观测时间相对应的遥感影像。将遥感影像的多个波段光谱反射率作为自变量,碳储量作为因变量。
具体到本毛竹林之例,则在研究区域内设置55个30m×30m的调查样地,样地的大小与所使用的Landsat5TM遥感影像的空间分辨率相等,计算样地内毛竹林的碳储量,采用2倍的标准差准则,对样地碳储量进行异常分析后,去掉其中3个样地。将毛竹林样地对应的Landsat5TM遥感影像第1,2,3,4,5,7波段的光谱反射率作为自变量,毛竹林的碳储量作为因变量。
步骤二:按照公式①对自变量空间的每一维xj进行高斯核函数变换,得到新的自变量。将因变量与新的自变量进行标准化处理,处理后的数据符合公式②的线性关系;
Z j = ( z j , 0 , z j , 1 , z j , 2 , · · · , z j , M + 2 ) = K ( x j - ξ j , l - 1 h j )
y ^ = Σ j = 1 p Σ l = 0 M + 2 α j , l z ~ j , l + ϵ
其中K为核函数;j=1,2,…,p(p为自变量个数,即遥感数据的波段数);l=0,1,2,…,M+2;ξj,l-1=min(xj)+(l-1)hj,为变量xj上划分的区间分点;
Figure GSB00001061548500061
为变量xj上分段长度;M为变量xj上分段数,M的初始值设为1;
Figure GSB00001061548500062
为Z标准化后的值;y为因变量(碳储量),为y标准化后的值;
步骤三:对公式②进行线性偏最小二乘回归,其中提取的成分数Cp为1,求得回归系数αj,l。将αj,l还原为原变量的回归系数β0,βj,l,最后由全体自变量与因变量的非线性拟合函数公式③得到估计值。
y ^ = β 0 + Σ j = l p f ^ j ( x j ) + ϵ = β 0 + Σ l = 1 p Σ l = 0 M + 2 β j , l K ( x j - ξ j , l - 1 h j )
步骤四:采用LOO(Leave One Out)交叉有效性对模型进行评价。LOO交叉有效性检验过程为:去掉一个样本,用剩余n-1个样本建模,并用对去掉的样本进行预测,得到所有样本的估计值。用得到的所有估计值与真实值计算公式④得到相关系数作为评价指标。
R = Σ i = 1 n ( y i - y c ‾ ) ( y ^ i - y e ‾ ) Σ i = 1 n ( y i - y c ‾ ) 2 Σ i = l n ( y ^ i - y e ‾ ) 2
其中
Figure GSB00001061548500066
模型估计值,yi观测值,
Figure GSB00001061548500067
观测平均值;估计平均。
具体到本毛竹林之例,在毛竹林样本中依次去掉1个,用剩余的样本的数据按照步骤四和步骤五进行建模,将去掉的一个样本带入所建立的模型进行预测,这样就得到了所有样地的估计值。将毛竹林样地碳储量的真实值与估计值带入公式⑥,可以计算得到1个相关系数。
步骤五:重复步骤(3)到(4),每次重复时将Cp增加1,直到提取成分数达到最大值。核函数变换可以把原始p维变量映射到
Figure GSB00001061548500071
维空间,可提取的最多成分数为
Figure GSB00001061548500072
具体到本毛竹林之例,p=6,当M=1时,C等于21。
步骤六:重复步骤(2)到(5),每次重复时将步骤(2)中的M增加1,直到M等等于预设值m。
步骤七:非线性偏最小二乘回归精度取决于M和Cp。如果各变量的分段数M一定,则对每一个M,Cp从1到C变化,则可以得到C个模型,这样总共可以建立
Figure GSB00001061548500073
个模型。然后,从所有模型中寻找估计值与实际值相关系数最大的模型,并用此时的M和Cp建模,作为最终的估算模型。
具体到本毛竹林之例,当M=2,Cp=7所构建的非线性偏最小二乘模型是所有模型中碳储量估计值与实际值相关系数值最大(R=0.54)的模型,模型的相关系数(R=0.74)。因此,该模型为此研究区域毛竹林地上部分碳储量的估算模型。该优化模型对未知样本的预测性能较好,同时也比传统的多元线性模型精度提高了25%左右。
本发明内容不仅限于毛竹林碳储量的预测,也适用于其它森林类型的碳储量预测。

Claims (1)

1.一种基于非线性偏最小二乘优化模型的森林碳汇遥感估算方法,其特征在于按如下步骤进行: 
(1)、在研究区域内设置调查样地,观测样地内的地上部分生物量并转化为碳储量,获取与观测时间相对应的遥感影像,将遥感影像的多个波段光谱反射率作为自变量,碳储量作为因变量; 
(2)、按照公式①对自变量空间的每一个自变量xj进行高斯核函数变换,得到新的自变量,将因变量与新的自变量进行标准化处理,处理后的数据符合公式②的线性关系; 
Figure FSB0000115392400000011
    ① 
Figure FSB0000115392400000012
    ② 
其中K为核函数;j=1,2,…,p,p为自变量个数,即遥感数据的波段数;l=0,1,2,…,M+2;ξj,l-1=min(xj)+(l-1)hj,为变量xj上划分的区间分点;
Figure FSB0000115392400000013
为变量xj上分段长度;M为变量xj上分段数,M的初始值设为1;
Figure FSB0000115392400000014
为Z标准化后的值;y为因变量,碳储量,
Figure FSB0000115392400000015
为y标准化后的值; 
(3)、对公式②进行线性偏最小二乘回归,其中提取的成分数Cp为1,求得回归系数αj,l;将αj,l还原为原变量的回归系数β0,βj,l,最后由全体自变量与因变量的非线性拟合函数公式③得到估计值; 
Figure FSB0000115392400000021
    ③ 
(4)、采用LOO(Leave One Out)交叉有效性对模型进行评价,LOO交叉有效性检验过程为:去掉一个样本,用剩余n-1个样本建模,并用对去掉的样本进行预测,得到所有样本的估计值;用公式④计算得到估计值与真实值之间的相关系数并作为评价指标; 
Figure FSB0000115392400000022
    ④ 
其中
Figure FSB0000115392400000023
模型估计值,yi观测值,
Figure FSB0000115392400000024
观测平均值;
Figure FSB0000115392400000025
估计平均值; 
(5)、重复步骤(3)到(4),每次重复时将Cp增加1,直到提取成分数达到最大值;对于M,核函数变换能把原始p维变量映射到 
Figure FSB0000115392400000026
维空间,可提取的最多成分数为
Figure FSB0000115392400000027
(6)、重复步骤(2)到(5),每次重复时将步骤(2)中的M增加1,直到M等于预设值m; 
(7)、非线性偏最小二乘回归精度取决于M和Cp,如果各变量的分段数M一定,则对每一个M,Cp从1到C变化,能得到C个模型,这样总共可以建立个模型;然后,从所有模型中寻找估计值与实际值相关系数最大的模型,并用此时的Mj和Cp建模,作为最终的估算模型。 
CN201110207384.0A 2011-07-22 2011-07-22 基于非线性偏最小二乘优化模型的森林碳汇遥感估算方法 Active CN102305792B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110207384.0A CN102305792B (zh) 2011-07-22 2011-07-22 基于非线性偏最小二乘优化模型的森林碳汇遥感估算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110207384.0A CN102305792B (zh) 2011-07-22 2011-07-22 基于非线性偏最小二乘优化模型的森林碳汇遥感估算方法

Publications (2)

Publication Number Publication Date
CN102305792A CN102305792A (zh) 2012-01-04
CN102305792B true CN102305792B (zh) 2014-03-26

Family

ID=45379673

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110207384.0A Active CN102305792B (zh) 2011-07-22 2011-07-22 基于非线性偏最小二乘优化模型的森林碳汇遥感估算方法

Country Status (1)

Country Link
CN (1) CN102305792B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104020127B (zh) * 2014-06-18 2016-08-17 山东烟草研究院有限公司 一种利用近红外光谱快速测量烟叶中无机元素的方法
CN104236615A (zh) * 2014-10-11 2014-12-24 广东轻工职业技术学院 一种智能传感器自校正方法
CN107578105B (zh) * 2017-08-31 2019-03-26 江苏康缘药业股份有限公司 系统参数设计空间优化方法及装置
CN108549620B (zh) * 2018-03-07 2021-10-15 广东省科学院生态环境与土壤研究所 一种土壤重金属生物有效性的估计方法、系统和装置
CN113177744B (zh) * 2021-06-09 2024-03-01 西安建筑科技大学 一种城市绿地系统碳汇量估算方法及系统
CN113379002B (zh) * 2021-07-20 2022-05-03 浙江大学 一种基于深度偏最小二乘模型的工业软测量方法
US11481904B1 (en) 2022-01-04 2022-10-25 Natural Capital Exchange, Inc. Automated determination of tree inventories in ecological regions using probabilistic analysis of overhead images

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101799871A (zh) * 2010-01-18 2010-08-11 浙江林学院 基于回归参数变换的遥感图像专题信息提取方法
CN102074008A (zh) * 2011-01-05 2011-05-25 哈尔滨工程大学 高光谱图像的全约束最小二乘线性光谱混合分析方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI1012177A2 (pt) * 2009-05-14 2016-04-05 Pioneer Hi Bred Int métodos e sistema para estimar uma característica de planta, métodos de predição de tolerância a seca em uma planta, de predição do teor de um analito-alvo em uma planta, de predição de um teor de introgressão do genoma de um experimento de retrocruzamento.

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101799871A (zh) * 2010-01-18 2010-08-11 浙江林学院 基于回归参数变换的遥感图像专题信息提取方法
CN102074008A (zh) * 2011-01-05 2011-05-25 哈尔滨工程大学 高光谱图像的全约束最小二乘线性光谱混合分析方法

Also Published As

Publication number Publication date
CN102305792A (zh) 2012-01-04

Similar Documents

Publication Publication Date Title
CN102305792B (zh) 基于非线性偏最小二乘优化模型的森林碳汇遥感估算方法
CN109597967B (zh) 一种电力系统配变电站负荷数据异常检测与修复方法
CN109543943B (zh) 一种基于大数据深度学习的电价稽查执行方法
Wu et al. An efficient computational method for global sensitivity analysis and its application to tree growth modelling
CN103747477A (zh) 网络流量分析与预测方法和装置
CN103473408B (zh) 一种融合时空信息的气温缺失记录重建方法
CN106600037B (zh) 一种基于主成分分析的多参量辅助负荷预测方法
CN105224960A (zh) 基于聚类算法的玉米种子高光谱图像分类识别模型更新方法
CN109904878B (zh) 一种多风电场发电时序模拟场景构建方法
CN105069309A (zh) 一种识别水文时间序列非线性趋势的方法
CN105117550A (zh) 一种面向产品多维相关性退化失效的建模方法
CN105426822A (zh) 基于双树复小波变换的非平稳信号多重分形特征提取方法
CN105628670A (zh) 一种适于橄榄油掺杂识别的二维相关光谱多尺度建模方法
Dongming et al. The application of decision tree C4. 5 algorithm to soil quality grade forecasting model
CN102567536A (zh) 一种基于数据统计学的关键绩效指标分析方法
CN115271225A (zh) 一种基于小波降噪和神经网络的风力-风功率建模方法
CN103389973A (zh) 一种利用中文人名判定性别的方法
Zhao et al. Regulation factors driving vegetation changes in China during the past 20 years
CN102542284A (zh) 辨识光谱的方法
Fantazzini et al. Proposed coal power plants and coal-to-liquids plants in the US: Which ones survive and why?
CN103761530B (zh) 一种基于相关向量机的高光谱图像解混方法
CN102750445A (zh) 基于复化Simpson公式改进多变量灰色模型的故障预测方法
CN113537573B (zh) 基于双重时空特征提取的风电功率运行趋势预测方法
CN111521568B (zh) 一种基于光谱角的土壤含水量预测方法
Xia et al. Research on Solar Radiation Estimation based on Singular Spectrum Analysis-Deep Belief Network

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant