CN113283155B

CN113283155B - 一种近地表气温估算方法、系统、存储介质及设备

Info

Publication number: CN113283155B
Application number: CN202110301023.6A
Authority: CN
Inventors: 毛克彪; 袁紫晋; 杜宝裕; 郭中华; 杨昌智; 孙一丹; 毛留喜; 李兴财; 张学艺; 房世波
Original assignee: Ningxia University; Institute of Agricultural Resources and Regional Planning of CAAS
Current assignee: Ningxia University; Institute of Agricultural Resources and Regional Planning of CAAS
Priority date: 2021-03-22
Filing date: 2021-03-22
Publication date: 2024-04-09
Anticipated expiration: 2041-03-22
Also published as: CN113283155A

Abstract

本发明属于近地表气温估算技术领域，公开了一种近地表气温估算方法、系统、存储介质及设备，获取与近地表空气温度相关4个的必选卫星数据反演参数和地面气象站点可以获取的7个备选参数，并对数据进行预处理；采用快速傅里叶变换将各类观测要素的时间序列信息进行快速转换，提取与气象站点气温相关的气象要素间的公共周期；构建长短期记忆神经网络LSTM，并将得到的公共周期与估算时间作为数据组对长短期记忆网络进行训练，得到估算温度；确定估算模型精度评价指标，构建基于FFT‑LSTM神经网络的气温估算模型，估算近地表气温，并对模型进行精度评价。本发明使得模型有较好的估算效果和较高精度，弥补气象站点区域分布不均的缺陷。

Description

一种近地表气温估算方法、系统、存储介质及设备

技术领域

本发明属于近地表气温估算技术领域，尤其涉及一种近地表气温估算方法、系统、存储介质及设备。

背景技术

近地表空气温度一般是指距离地表约2米高左右的温度，它是气候变化研究里一个非常重要的参数[Sun,Y.J.,Wang J.F.,Zhang,R.H.,Gillies,R.R.,Xue Y.and BoY.C.,Air temperature retrieval from remote sensing data based onthermodynamics.Theoretical andApplied Climatology,2005,80:37-48.]。近地表气温(以下简称气温)，是陆表能量平衡中的重要气候参数，是气象观测中重要观测要素之一。

一些学者对气温估算进行研究，提出了不同的近地表气温估算模型。目前，在气候变化研究里公知的三种获得近地表空气温度的方法，一是基于能量平衡的物理方法。物理方法需要空气动力学阻抗，以及地表状态(包括水，土壤和植被的状态等)，这几个参数非常难以获取[Sun,Y.J.,Wang J.F.,Zhang,R.H.,Gillies,R.R.,Xue Y.and Bo Y.C.,Airtemperature retrieval from remote sensing data based onthermodynamics.Theoretical and Applied Climatology,2005,80:37-48.]；另外一个方法就是经验方法[Boyer,D.G.,Estimation ofdailytemperature means using elevationand latitude in mountainous terrain,Water Resource Bull 4,1984,583-588.]。经验方法就是利用GIS(Geographic Information System)气象站点获得的近地表空气温度进行插值得到近地表空气温度的分布图。当气象站点不是很多而且不是均匀分布(特别是在山区)的时，插值得到的结果不是非常好。三是毛克彪等利用ASTER数据的地表温度和发射率作为先验知识，从ASTER数据中反演近地表空气温度，但ASTER数据波段分辨率比较高，很难满足目前的需求。另外就是波段设置得不是非常合理，精度有待进一步提高[Mao,K.,Tang,H.,Wang,X.F.,Zhou,Q.B.,Wang,D.L.,Near-Surface Air Temperature EstimationFrom ASTER Data Using Neural Network,International Journal of Remote Sensing,2008,29(20):6021-6028.]。但由于各种条件的限制，目前普遍采用的是经验方法[Burrough,P.A.,Mc Donnell R.A.,Principles of geographical informationsystems.NewYork:OxfordUniversityPress,1998.]。

近年来深度学习发展迅速，人工神经网络通过数学方法来对神经元进行模拟，模仿人脑对信息处理，所以如何利用人工智能对这些气象大数据进行预测成为了一个研究的重点。毛克彪等在2009年提出利用神经网络从MODIS数据估算近地表空气温度方法[毛克彪，王道龙，张立新，任天志，李三妹，高懋芳，从MODIS数据估算近地表空气温度方法，发明专利，授权号：ZL2009100910294，授权日期：2013-6-5]，这个方法主要是利用MODIS数据地表温度和发射率作为先验知识，精度还有待进一步提高。长短期记忆网络(Long-ShortTerm Memory,LSTM)论文首次发表于1997年。由于独特的设计结构，LSTM适合于处理和预测时间序列中间隔和延迟非常长的重要事件，循环神经网络RNN对于时序数据有着很强的处理能力。

通过上述分析，现有技术存在的问题及缺陷为：传统神经网络方法无法明确获得不同参数之间的数学关系，在计算过程中会将原始数据进行各种特征进行拆分，这些特征跟判断一个事务所使用的特征完全不同，当最后通过模型得到一个结果的时候，不知道它是通过哪些方面来得到这个结果的。为了克服传统神经网络在长期预测过程中可能会出现的梯度消失和梯度爆炸问题，我们选择采用长短期记忆网络(LSTM)来进行气温估算，提高温度估算的精度。与传统方法相比，长短期记忆神经网络较好的解决了高维数、非线性和局部最小值问题，面对海量数据有着更强的学习能力和泛化能力。

解决以上问题及缺陷的意义为：可以更加清楚地分析其物理原因，提高估算精度，在极端灾害中起到重要作用，减少灾害损失。

发明内容

针对现有技术存在的问题，本发明提供了一种近地表气温估算方法、系统、存储介质及设备。

本发明是这样实现的，一种近地表气温估算方法，所述近地表气温估算方法包括以下步骤：

步骤一，通过获取与近地表空气温度相关4个的必选卫星数据反演参数(地表温度、发射率、植被指数、土壤湿度)和地面气象站点可以获取的7个备选参数(高程、平均风速、最大风速、最大风速风向、平均气压、日照时间、平均相对湿度)，并对数据进行预处理；

步骤二，采用快速傅里叶变换将各类观测要素的时间序列信息进行快速转换，提取气象站点气温与其他不同气象要素间的公共周期；

步骤三，构建长短期记忆神经网络LSTM，并将得到的公共周期与估算时间作为数据组对长短期记忆网络进行训练和测试；

步骤四，确定估算模型精度评价指标，构建基于FFT-LSTM神经网络的气温估算模型，将卫星数据反演参数和气象站点的各要素作为输入因子，将公共周期作为输入时间长度，估算近地表气温，并对模型进行精度评价。

通过预处理和规范化，利用FFT变化提取各物理变量之间的周期关系，进一步利用LSTM训练得到各物理量之间的关系，从而提高估算精度。

进一步，步骤一中，所述对数据进行预处理，包括：

首先对数据进行清洗，去掉异常值，修补缺失值，然后通过人工筛选和相关性分析对参数进行筛选，最后进行归一化处理。

相关系数是研究变量之间线性相关程度的量：

其中，X表示气温，Y表示其他各类气象因子，Cov(X,Y)为X与Y的协方差，Var[X]为X的方差，Var[Y]为Y的方差。

进一步，步骤二中，所述快速傅里叶变化FFT是离散傅里叶变换DFT的快速算法，所述傅里叶变换表达为：

其中，ω代表频率，t代表时间，e^-iwt为复变函数。

所述傅里叶变换所计算出来的是信号x(t)的连续频谱。实际采取的是各站点的日平均气温，并不是连续的采样值，是离散的采样值，故选用离散傅里叶变换来计算气温与其他各气象要素的频谱。在一定的离散信号中，DFT的定义为：

在DFT中，假设要计算N个X(k)值，需要计算大约N²次复数乘法和N(N-1)次复数加法。每次复数乘法包括4次实数乘法和2次实数加法，每次复数加法又包括2次实数加法。因此计算一个DFT需要4N²次实数乘法和(2N²+2N·(N-1))次实数加法。当N很大的时候，这是一个非常大的计算量。而FFT算法主要是利用了e^-i2πkn/N具有对称性和周期性的特点，其中虚数单位

进一步，步骤二中，所述提取气象站点气温与其他不同气象要素间的公共周期，包括：

利用快速傅里叶变化FFT方法，把各类相关要素的时间序列信息进行快速处理，将时域信号转换到频域信号；对各类相关要素进行归一化的线性处理，将结果映射在[0,1]之间；采样频率为f_z对全年天平均数据进行采样，频谱可见范围为0-f_zHZ，获得各类气象要素的处理结果。

根据以下公式得到各地区各类相关要素的共同周期为365天，包括：

其中，采样频率为365。

进一步，步骤三中，所述长短期记忆神经网络LSTM的结构包括遗忘门、输入门、输出门以及细胞的状态四部分。

所述LSTM的核心思想就是细胞状态，用贯穿细胞的水平线表示。通过遗忘门、输入门和输出门来对细胞状态进行删除或者添加信息，门能够有选择的决定让哪些信息通过，结构是一个sigmoid层和一个点乘操作的组合。Sigmoid层的输出是0-1的值，这代表着有多少信息能够通过；0表示都不能通过，1表示全部通过。

所述长短期记忆神经网络LSTM接收到输入信息后，首先确定丢弃掉的信息，由遗忘门的sigmoid层进行处理：

f_t＝σ(W_f·[h_t-1,x_t]+b_f) (5)

通过查看h_t-1和x_t的信息来进行判断，输出一个0～1之间的向量，表示信息留存量和遗弃量，W_f和b_f分别为权重和偏置值。如果得到的f_t趋近于0，那么就表示不保留任何信息，如果愈趋近于1，那么就表示保留所有信息。

当信息经过遗忘门以后，一部分信息被剔除，一部分信息被保留下来。接下利用h_t-1和x_t通过输入门来决定更新哪些信息，然后利用h_t-1和x_t通过tanh层得到新的细胞C_t，包括：

当细胞更新完状态后，将输入的h_t-1和x_t来经过一个叫做输出门的sigmoid层，根据输入的h_t-1和x_t来判断细胞输出哪些状态特征，在经过tanh层后会得到一个-1～1之间值的向量，向量与输出门得到的判断条件相乘即可得到最终的输入结果，包括：

h_t＝σ(W_i·[h_t-1,x_t]+b_i)*tanh(C_t) (9)

进一步，步骤三中，所述将得到的公共周期与估算时间作为数据组对长短期记忆网络进行训练的过程中，输入第一组数据，其中包含近地表空气温度相关4个的必选卫星数据反演参数(地表温度、发射率、植被指数、土壤湿度)和地面气象站点可以获取的7个备选参数(高程、平均风速、最大风速、最大风速风向、平均气压、日照时间、平均相对湿度)共11个要素；将估算时间第一天所估算的气温作为第二组数据的平均气温来进行对比，包括：

(1)将11个气象要素作为输入因子，公共周期为输入时间；

(2)公共周期+估算时间作为一组数据，进行滑差处理进行训练；

(3)训练结果提取出估算气温数据与下一组所对应的值进行比较；

(4)训练下一组数据来估算第二天的数据，然后输出估算结果；

(5)重复步骤3,4，提取第二天估算的气温数据；

(6)此过程重复n次。

进一步，步骤四中，所述确定估算模型精度评价指标，包括：

采用均方根误差RMSE、平均绝对误差MAE和决定系数R²三个评价指标来评定估算模型的精度，包括：

均方根误差表示的估算值与真实值之间差异(残差)的样本标准差，说明样本的离散程度；做非线性拟合时，RMSE越小越好。

平均绝对值误差表示估算值与真实值之间误差的平均值，是一种线性分数，所有个体差异在平均值上的权重都相等。

根据气象业务精细化预报的要求，当估算气温与真实气温之间的差值≤2.0℃时，预报结果为正确。

平均百分比误差，估算连续性数据的准确率指的是1-MAPE,范围是[0，+∞)，MAPE为0％表示完美模型，即MAPE越小越好。

其中，T_i表示气温估算值，表示气温真实值，表示气温平均值。当RMSE、MAE、MAPE的值越小，Accuracy越大的时候，说明估算值与实际值之间误差较小，能够说明估算模型的精度越好。

本发明的另一目的在于提供一种应用所述的近地表气温估算方法的近地表气温估算系统，所述近地表气温估算系统包括：

数据集获取模块，用于获取遥感参数和地面站点相关数据；

数据预处理模块，用于对获取的数据集进行预处理；

公共周期提取模块，用于采用快速傅里叶变换将各类观测要素的时间序列信息进行快速转换，提取气象站点气温与其他不同气象要素间的公共周期；

温度估算模型构建模块，用于构建长短期记忆神经网络LSTM，并将得到的公共周期与估算时间作为数据组对长短期记忆网络进行训练，用于构建基于FFT-LSTM的气温估算模型；

精度评价模块，用于确定估算模型精度评价指标，并对模型进行精度评价。

本发明的另一目的在于提供一种存储在计算机可读介质上的计算机程序产品，包括计算机可读程序，供于电子装置上执行时，提供用户输入接口以实施所述的近地表气温估算方法。

本发明的另一目的在于提供一种计算机可读存储介质，储存有指令，当所述指令在计算机上运行时，使得计算机执行所述的近地表气温估算方法。

结合上述的所有技术方案，本发明所具备的优点及积极效果为：本发明提供的基于快速傅里叶变换与长短期记忆网络的近地表气温估算方法，基于FFT-LSTM方法构建气温估算模型，利用2010年至2019年广东东莞、黑龙江漠河、湖北武汉、新疆吐鲁番、云南大理5个站点所采集的天数据，首先通过快速傅里叶变换分析出各个要素的公共周期为365天，然后把各个要素与公共周期作为模型输入，30天的气温作为模型输出，将两者进行结合进行滑差处理增大样本量，获得预期效果。分别与RBF，BP神经网络进行对比分析，将结果进行外部检验，实验结果表明，基于FFT-LSTM估算模型相较于BP、RBF模型，RMSE平均降低1.21、0.68，MAE平均降低1.27、1.30，MAPE平均降低11％、11％，Accuarcy平均提升32％，25％。该模型有较好的估算效果，可以为气温估算提供参考。

本发明通过快速傅里叶变换来寻找到气象站点各要素的公共周期，利用长短期记忆网络(LSTM)来进行估算，气象站点的各要素作为输入因子，将公共周期作为输入时间长度，输出30天的气温估算值，最后对模型进行精度评价。获得以下结论与展望：

(1)各站点多个气象要素的公共周期为365天，但是由于地球公转的时间并不等于地球自转时间的正整数倍，会有闰年的出现也就是366天，实际上以365天作为周期是有误差的。

(2)基于FFT-LSTM模型估算气温的效果要优于BP、RBF模型。相较于BP、RBF模型，RMSE平均降低1.21、0.68，MAE平均降低1.27、1.30，MAPE平均降低11％、11％，Accuarcy平均提升32％，25％。

(3)广东东莞、湖北武汉、云南大理站的估算效果最好，黑龙江漠河，新疆吐鲁番次之。模型检验精度较好，平均RMSE为1.36，平均MAE为1.02，平均MAPE为11％，平均Accuarcy为87％，模型精度较高，可有效估算未来30天的气温值。

本发明选择广东东莞、黑龙江漠河、湖北武汉、新疆吐鲁番、云南大理五个气象站点2010年至2019年日气象数据进行研究，构建FFT-LSTM模型估算气温，得到良好的估算效果。通过对实验对比分析发现，不同时间段下的模型估算结果有所不同，接下来的研究可以从进行不同时间段的气温估算，在模型中加入更多约束条件进行对比分析来改善模型，为估算气温提供参考。本发明通过构建FFT-LSTM模型估算气温，充分利用卫星反演参数和地面站点观测数据，使得模型有较好的估算效果和较高精度，可以为无气象站点的区域提供估算气象数据，弥补气象站点区域分布不均的缺陷。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图做简单的介绍，显而易见地，下面所描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的LSTM神经网络结构图。

图2(a)是本发明实施例提供的门的结构示意图。

图2(b)是本发明实施例提供的sigmoid函数示意图。

图3是本发明实施例提供的tanh函数示意图。

图4是本发明实施例提供的滑差示意图。

图5是本发明实施例提供的LSTM训练示意图。

图6是本发明实施例提供的LSTM估算温度示意图。

图7是本发明实施例提供的LSTM估算气温结构图。

图8(a)是本发明实施例提供的黑龙江漠河的快速傅里叶变换处理后结果示意图。

图8(b)是本发明实施例提供的广东东莞的快速傅里叶变换处理后结果示意图。

图8(c)是本发明实施例提供的湖北武汉的快速傅里叶变换处理后结果示意图。

图8(d)是本发明实施例提供的新疆吐鲁番的快速傅里叶变换处理后结果示意图。

图8(e)是本发明实施例提供的云南大理的快速傅里叶变换处理后结果示意图。

图9(a)是本发明实施例提供的广东东莞站点的估算结果示意图。

图9(b)是本发明实施例提供的黑龙江漠河站点的估算结果示意图。

图9(c)是本发明实施例提供的湖北武汉站点的估算结果示意图。

图9(d)是本发明实施例提供的新疆吐鲁番站点的估算结果示意图。

图9(e)是本发明实施例提供的云南大理站点的估算结果示意图。

图10(a)是本发明实施例提供的广东东莞站点的模型对比结果示意图。

图10(b)是本发明实施例提供的黑龙江漠河站点的模型对比结果示意图。

图10(c)是本发明实施例提供的湖北武汉站点的模型对比结果示意图。

图10(d)是本发明实施例提供的新疆吐鲁番站点的模型对比结果示意图。

图10(e)是本发明实施例提供的云南大理站点的模型对比结果示意图。

图11(a)是本发明实施例提供的不同模型的RMSE精度评定示意图。

图11(b)是本发明实施例提供的不同模型的MAE精度评定示意图。

图11(c)是本发明实施例提供的不同模型的Accuary精度评定示意图。

图11(d)是本发明实施例提供的不同模型的MAPE精度评定示意图。

图12(a)是本发明实施例提供的广东东莞的不同时间估算效果图。

图12(b)是本发明实施例提供的黑龙江漠河的不同时间估算效果图。

图12(c)是本发明实施例提供的湖北武汉的不同时间估算效果图。

图12(d)是本发明实施例提供的新疆吐鲁番的不同时间估算效果图。

图12(e)是本发明实施例提供的云南大理的不同时间估算效果图。

图13是本发明实施例提供的近地表气温估算方法流程图。

图14是本发明实施例提供的近地表气温估算系统结构框图；

图中：1、数据集获取模块；2、数据预处理模块；3、公共周期提取模块；4、温度估算模型构建模块；5、精度评价模块。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

针对现有技术存在的问题，本发明提供了一种近地表气温估算方法、系统、存储介质及设备，下面结合附图对本发明作详细的描述。

如图13所示，本发明实施例提供的近地表气温估算方法包括以下步骤：

S101，获取卫星反演参数和地面气象站点数据资料日值数据集，并对数据进行预处理；

S102，采用快速傅里叶变换将各类观测要素的时间序列信息进行快速转换，提取气象站点气温与其他不同气象要素间的公共周期；

S103，构建长短期记忆神经网络LSTM，并将得到的公共周期与估算时间作为数据组对长短期记忆网络进行训练，得到估算温度；

S104，确定估算模型精度评价指标，构建基于FFT-LSTM神经网络的气温估算模型，将气象站点的各要素作为输入因子，将公共周期作为输入时间长度，估算近地表气温，并对模型进行精度评价。

本发明提供的近地表气温估算方法业内的普通技术人员还可以采用其他的步骤实施，图1的本发明提供的近地表气温估算方法仅仅是一个具体实施例而已。

如图14所示，本发明实施例提供的近地表气温估算系统包括：

数据集获取模块1，用于获取遥感参数和地面站点相关数据；

数据预处理模块2，用于对获取的数据集进行预处理；

公共周期提取模块3，用于采用快速傅里叶变换将各类观测要素的时间序列信息进行快速转换，提取气象站点气温与其他不同气象要素间的公共周期；

温度估算模型构建模块4，用于构建长短期记忆神经网络LSTM，并将得到的公共周期与估算时间作为数据组对长短期记忆网络进行训练，用于构建基于FFT-LSTM的气温估算模型；

精度评价模块5，用于确定估算模型精度评价指标，并对模型进行精度评价。

下面结合实施例对本发明的技术方案作进一步的描述。

本发明获取与近地表空气温度相关4个的必选卫星数据反演参数(地表温度、发射率、植被指数、土壤湿度)和地面气象站点可以获取的7个备选参数(高程、平均风速、最大风速、最大风速风向、平均气压、日照时间、平均相对湿度)，并对数据进行预处理；采用快速傅里叶变换将各类观测要素的时间序列信息进行快速转换，提取与气象站点气温相关的气象要素间的公共周期；构建长短期记忆神经网络LSTM，并将得到的公共周期与估算时间作为数据组对长短期记忆网络进行训练，得到估算温度；确定估算模型精度评价指标，构建基于FFT-LSTM神经网络的气温估算模型，估算近地表气温，并对模型进行精度评价。

1、为了提高估算气温的准确率，本发明提出一种基于FFT-LSTM方法构建气温估算模型，利用2010年至2019年广东东莞、黑龙江漠河、湖北武汉、新疆吐鲁番、云南大理5个站点所采集的天数据，首先通过快速傅里叶变换分析出各个要素的公共周期为365天，然后把各个要素与公共周期作为模型输入，30天的气温作为模型输出，将两者进行结合进行滑差处理增大样本量，获得预期效果。分别与RBF，BP神经网络进行对比分析，将结果进行外部检验，实验结果表明，基于FFT-LSTM估算模型相较于BP、RBF模型，RMSE平均降低1.21、0.68，MAE平均降低1.27、1.30，MAPE平均降低11％、11％，Accuarcy平均提升32％，25％。该模型有较好的估算效果，可以为气温估算提供参考。

2、本发明所用数据资料来自于中国气象数据网(http：//data.cma.cn)2010年到2019年中国地面气候资料日值数据集。算法对深度学习十分重要，良好的数据是使结果能够准确、精细的基本条件。首先对数据进行清洗，去掉异常值，修补缺失值，然后通过人工筛选和相关性分析对参数进行筛选(见表1)，最后由于不同参数大小之间有很大的差异，对于深度学习来说，因为权值的存在会使模型的训练和学习难以继续，所以进行归一化处理，来消除不同参数之间的量纲大小不同所造成的影响。

相关系数是研究变量之间线性相关程度的量。

3、方法

3.1快速傅里叶变换(FFT，fast Fourier transform)

快速傅里叶变化(FFT)是离散傅里叶变换(DFT)的快速算法。在1965年由JamesW.Cooley和John W.Tukey在前人的基础上提出的快速计算DFT的算法。FFT算法是基于可以将一个长度为N的序列的DFT逐次分解为较短的DFT来计算这一基本原理。该方法能够分析时间序列或者空间域中连续或者离散信号，并且将时域信号转换到频域信号上。由于气温数据量的庞大，本发明可以把这些因子看作是一种信号，为了透过这些杂乱的信号进而观察到更直观的本质信息，采用快速傅里叶变换来对这些因子进行快速转换，构建模型寻找它们的公共周期。傅里叶变换表达为：

公式(2)中ω代表频率，t代表时间，e^-iwt为复变函数。傅里叶变换所计算出来的是信号x(t)的连续频谱。但是在实际的采样数据中，本发明所采取的是各站点的日平均气温，并不是连续的采样值，是离散的采样值。因此本发明选用离散傅里叶变换来计算气温与其他各气象要素的频谱。在一定的离散信号中，DFT的定义为：

在DFT中，假设要计算N个X(k)值，需要计算大约N²次复数乘法和N(N-1)次复数加法。每次复数乘法包括4次实数乘法和2次实数加法，每次复数加法又包括2次实数加法。因此计算一个DFT需要4N²次实数乘法和(2N²+2N·(N-1))次实数加法。当N很大的时候，这是一个非常大的计算量。而FFT算法主要是利用了e^-i2πkn/N具有对称性和周期性的特点，极大的加快了计算速度，缩短了计算时间。

其中虚数单位

3.2长短期记忆神经网络(LSTM，Long Short-Term Memory)

长短期记忆神经网络是一种时间循环神经网络，最初是为了解决RNN(循环神经网络)存在的长期依赖问题而专门设计出来的，是一种特殊的RNN结构。由于具有独特的设计结构，适合用来处理和估算在时间序列中间隔和延迟非常长的事件，被广泛的用来处理时间序列方面的问题，能够有效的解决梯度爆炸和梯度消失问题，由于LSTM与之前输入数据的高度相关性，被广泛应用于时间序列数据挖掘中。如图1所示，LSTM结构有四大组成部分，分别为遗忘门，输入门，输出门以及细胞的状态这也是LSTM的核心思想。

LSTM的核心思想就是细胞状态，可以用贯穿细胞的水平线表示。通过遗忘门、输入门和输出门来对细胞状态进行删除或者添加信息，门能够有选择的决定让哪些信息通过。它的结构很简单就是一个sigmoid层和一个点乘操作的组合。Sigmoid层的输出是0-1的值，这代表着有多少信息能够通过。0表示都不能通过，1表示全部通过，如图2所示。

LSTM接收到输入信息以后，第一步就是决定丢弃掉哪些信息。它是由遗忘门的sigmoid层来处理的。

f_t＝σ(W_f·[h_t-1,x_t]+b_f) (17)

当信息经过遗忘门以后，一部分信息被剔除，一部分信息被保留下来。接下来通过两个步骤来决定添加哪些信息。首先利用h_t-1和x_t通过输入门来决定更新哪些信息。然后，利用h_t-1和x_t通过tanh层得到新的细胞C_t。图3为tanh函数。

当细胞更新完状态后，将输入的h_t-1和x_t来经过一个叫做输出门的sigmoid层，根据输入的h_t-1和x_t来判断细胞输出哪些状态特征，在经过tanh层后会得到一个-1～1之间值的向量，向量与输出门得到的判断条件相乘就得到了最终的输入结果。

h_t＝σ(W_i·[h_t-1,x_t]+b_i)*tanh(C_t) (21)

3.3长短期记忆网络训练

本发明将通过快速傅里叶变换来寻找不同气象要素之间的公共周期来作为输入时间进行气温估算。将得到的公共周期与估算时间作为一个数据组来进行训练，假设采用这种方式来进行数据组合，那么10年间的天数据就一共只能构造出9组数据。为了改变这种情况，引入滑差的方式来增大数据量，即以公共周期+估算时间为第一组数据，再将第二天为公共周期的第一天+估算时间为第二组数据，以此类推来增大数据量，如图4所示。

将数据进行滑差处理之后，得到了t个数据组，分别将这些数据组输入LSTM网络进行训练来得到估算温度，如图5所示。

在图6中，本发明输入第一组数据，其中包含近地表空气温度相关4个的必选卫星数据反演参数(地表温度、发射率、植被指数、土壤湿度)和地面气象站点可以获取的7个备选参数(高程、平均风速、最大风速、最大风速风向、平均气压、日照时间、平均相对湿度)共11个要素。将估算时间第一天所估算的气温作为第二组数据的平均气温来进行对比。步骤如下：

(1)将11个气象要素作为输入因子，公共周期为输入时间。

(2)公共周期+估算时间作为一组数据，进行滑差处理进行训练。

(3)训练结果提取出估算气温数据与下一组所对应的值进行比较。

(4)训练下一组数据来估算第二天的数据，然后输出估算结果。

(5)重复步骤3和步骤4，提取第二天估算的气温数据。

(6)此过程重复n次。

图7中是模型中估算n天气温的实际LSTM网络结构，BS代表的是Batch_size，表示的是每次送入模型训练的样本批数量。这一要素的选择是极为重要的，为了在内存效率和内存容量之间寻求最佳平衡，Batch_size的设置关系到最优化网络模型的性能及速度。N表示的是神经元的数量，M表示的是输入的数量。在LSTM网络中被设计可以不断往其中添加所需要的气象要素，每个LSTM单元格输出的是(BS,N)形式的向量。但是本发明所需要的是输出只有一个温度的向量，所以为了转换格式成为(B,1)的向量，进行如图7所示的转换过程。

4、基于FFT的气温与其他气象要素公共周期的提取

气温的变化受到其他气象因素变化的影响，为了构建基于气象站点的气温估算模型，就必须先寻找到各类观测要素的公共周期变化(如表1)。本发明利用快速傅里叶变化(FFT)方法，把各类观测要素的时间序列信息进行快速处理，将时域信号转换到频域信号上来。为了使模型具有更好的估算结果，达到可以全国范围内普遍可以利用的效果，选取新疆吐鲁番，黑龙江漠河，湖北武汉，云南大理和广东东莞作为研究对象。对各类气象要素进行归一化的线性处理，将结果映射在[0,1]之间。数据集为2010年至2019年天数据，一年的采样点数是365(闰年为366)，采样频率为f_z对全年天平均数据进行采样，频谱可见范围为0-f_zHZ，获得各类气象要素的处理结果，如图8所示。

表1各地区公共周期

图8为五个地区各类气象要素处理结果，通过快速傅里叶变换将各类气象要素的时域信息转换到了频域信息上。从图中本发明可以很清楚的看到各类气象要素的变化情况，在频率为1的时候，出现了波峰重叠，由此判断，各类气象要素的公共频率为1。输入的采样率参数为365，那么根据公式(22)就可以得到各地区各类气象要素的共同周期为365天。

公式(9)当中乘以365的原因是设置的采样频率为365，图9中的横坐标为频率(cpy)指的是一年的频率，转换为天数就需要乘以365。

5、基于FFT-LSTM神经网络的气温估算模型

5.1精度评价指标

为了更好的验证模型的估算精度，本发明将采用均方根误差(RMSE)、平均绝对误差(MAE)、决定系数(R²)三个评价指标来评定估算模型的精度。

均方根误差表示的估算值与真实值之间差异(残差)的样本标准差。说明了样本的离散程度。做非线性拟合时，RMSE越小越好。

平均绝对值误差表示估算值与真实值之间误差的平均值，这是一种线性分数，所有个体差异在平均值上的权重都相等。

平均百分比误差，估算连续性数据的准确率指的是1-MAPE，范围是[0，+∞)，MAPE为0％表示完美模型，即MAPE越小越好。

以上公式中，T_i表示气温估算值，表示气温真实值，表示气温平均值。当RMSE、MAE、MAPE的值越小，Accuracy越大的时候，说明估算值与实际值之间误差较小，能够说明估算模型的精度越好。

5.1构建模型

本发明将快速傅里叶变换与长短期记忆网络相结合，构建估算模型。在研究中，用过快速傅里叶变换得到各类气象要素的公共周期为365天，对五个气象站点2010年1月1日至2019年11月30日数据进行处理，按照时间间隔395天(公共周期为365天+估算时间30天)进行滑差分组，增大数据样本。其中80％的数据集进行训练，20％的数据集进行测试，以此来估算未来30天的平均气温。通过大量的测试和研究分析，将Epochs(固定训练次数)设定为300次，Batch_Size(每个批次feed进入LSTM的数据大小)设置为128，学习率设置为0.01时，模型效果最佳，loss函数接近于0.01，最终得到如图9所示的结果。

由图9所示，FFT-LSTM模型估算的结果与实际结果相差不大，为了验证模型的精度，还与其他估算模型进行了对比分析研究。

从图10中可以看出，BP和RBF模型估算的气温值与实际值有着明显的差异。FFT-LSTM模型估算结果接近实际值，拟合效果较好，在广东东莞、湖北武汉、云南大理三个气温波动起伏不太大的站点中，三种模型有着良好的估算效果，比较贴近估算的趋势，在新疆吐鲁番和黑龙江漠河两个气温波动比较大的站点中，FFT-LSTM模型的估算值最接近实际温度，拟合效果最好。

5.2验证与分析

为了更好的验证与分析FFT-LSTM在气温估算模型上相较于其他两种模型有着更好的估算精度，本发明分别采用四种精度评价指标进行评定。

表2气温估算模型精度评价1

从图11和表2中本发明不难发现，FFT-LSTM模型估算气温的精度明显优于另外两种模型。以广东东莞为例，FFT-LSTM模型估算气温结果相对于BP和RBF模型，RMSE提升了52％、57％，MAE提升了61％、66％，Accuracy上提升了54％、52％，MAPE提升了62％、67％。

此外本发明还对FFT-LSTM模型进行了不同时间段的气温估算，来验证模型精度。图12是2018年6月估算数据与真实数据对比图。

表3气温估算模型精度评价2

	RMSE	MAE	Accuracy	MAPE
					广东东莞	0.90	0.71	97％	2.61％
黑龙江漠河	1.23	0.93	93％	5.85％
					湖北武汉	1.20	0.88	83％	3.25％
新疆吐鲁番	1.85	1.48	70％	10.73％
					云南大理	0.86	0.65	100％	3.31％

如图12与表3所示，对FFT-LSTM估算模型在不同时间段估算效果进行研究发现，对比2019年12月的估算效果，2018年6月的估算效果明显要优于前者。除广东东莞站点各项精度有小幅降低，RMSE，MAE，MAPE分别降低0.1、0.1、0.83％，Accuracy保持不变。其余四个站点都有着明显的精度提升。

6、本发明通过快速傅里叶变换来寻找到气象站点各要素的公共周期，利用长短期记忆网络(LSTM)来进行估算，气象站点的各要素作为输入因子，将公共周期作为输入时间长度，输出30天的气温估算值，最后对模型进行精度评价。获得以下结论与展望：

本发明选择广东东莞、黑龙江漠河、湖北武汉、新疆吐鲁番、云南大理五个气象站点2010年至2019年日气象数据进行研究，构建FFT-LSTM模型估算气温，得到良好的估算效果。根据图9与图12、表3与表2对比分析发现，不同时间段下的模型估算结果有所不同，接下来的研究可以从进行不同时间段的气温估算，在模型中加入更多约束条件进行对比分析来改善模型，为估算气温提供参考。本发明通可以通过进一步利用先验知识和动态学习神经网络几何遥感数据估算近地表空气温度，通过融合将遥感估算的近地表空气温度等相关参数和FFT-LSTM结合，将点估算推广到空间面上。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现，所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘SolidState Disk(SSD))等。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，都应涵盖在本发明的保护范围之内。

Claims

1.一种近地表气温估算方法，其特征在于，所述近地表气温估算方法包括：

通过获取与近地表空气温度相关4个的必选卫星数据反演参数和地面气象站点获取的7个备选参数，并对数据进行预处理；

采用快速傅里叶变换将各类观测要素的时间序列信息进行快速转换，提取气象站点气温与其他不同气象要素间的公共周期；

构建长短期记忆神经网络LSTM，并将得到的公共周期与估算时间作为数据组对长短期记忆网络进行训练和测试；

确定估算模型精度评价指标，构建基于FFT-LSTM神经网络的气温估算模型，将卫星数据反演参数和气象站点的各要素作为输入因子，将公共周期作为输入时间长度，估算近地表气温，并对模型进行精度评价；

所述快速傅里叶变化FFT是离散傅里叶变换DFT的快速算法，所述傅里叶变换表达为：

（2）

其中，代表频率，代表时间，为复变函数；

所述傅里叶变换所计算出来的是信号x(t)的连续频谱；实际采取的是各站点的日平均气温，并不是连续的采样值，是离散的采样值，选用离散傅里叶变换来计算气温与其他各气象要素的频谱；在一定的离散信号中，DFT的定义为：

，（3）

在DFT中，假设要计算N个X(k)值，需要计算N²次复数乘法和N(N-1)次复数加法；每次复数乘法包括4次实数乘法和2次实数加法，每次复数加法又包括2次实数加法；因此计算一个DFT需要4N²次实数乘法和(2N²+2N·(N-1))次实数加法；当N很大的时候，这是一个非常大的计算量；而FFT算法主要是利用了具有对称性和周期性的特点，其中虚数单位；

所述提取近地表气温与其他不同气象要素间的公共周期，包括：利用快速傅里叶变化FFT方法，把各类观测要素的时间序列信息进行快速处理，将时域信号转换到频域信号；对各类气象要素进行归一化的线性处理，将结果映射在[0,1]之间；采样频率为对全年天平均数据进行采样，频谱可见范围为0 -HZ，获得各类气象要素的处理结果；

根据以下公式得到各地区各类气象要素的共同周期为365天，包括：

（4）

其中，采样频率为365；

所述长短期记忆神经网络LSTM的结构包括遗忘门、输入门、输出门以及细胞的状态四部分；所述LSTM的核心思想就是细胞状态，用贯穿细胞的水平线表示；通过遗忘门、输入门和输出门来对细胞状态进行删除或者添加信息，门能够有选择的决定让哪些信息通过，结构是一个sigmoid层和一个点乘操作的组合；Sigmoid层的输出是0-1的值，这代表着有多少信息能够通过；0表示都不能通过，1表示全部通过；

（5）

通过查看和的信息来进行判断，输出一个0~1之间的向量，表示信息留存量和遗弃量，和分别为权重和偏置值；如果得到的趋近于0，那么就表示不保留任何信息，如果愈趋近于1，那么就表示保留所有信息；

当信息经过遗忘门以后，一部分信息被剔除，一部分信息被保留下来；接下利用和通过输入门来决定更新哪些信息，然后利用和通过tanh层得到新的细胞，包括：

（6）

（7）

（8）

当细胞更新完状态后，将输入的和来经过一个叫做输出门的sigmoid层，根据输入的和来判断细胞输出哪些状态特征，在经过tanh层后会得到一个-1~1之间值的向量，向量与输出门得到的判断条件相乘即可得到最终的输入结果，包括：

（9）；

所述将得到的公共周期与估算时间作为数据组对长短期记忆网络进行训练的过程中，输入第一组数据，其中包含4个的必选卫星数据反演参数和地面气象站点可以获取的7个备选参数，共11个要素，将对应的近地表空气温度作为输出值，卫星数据反演参数包括地表温度、发射率、植被指数、土壤湿度，备选参数包括高程、平均风速、最大风速、最大风速风向、平均气压、日照时间、平均相对湿度；包括：

（1）将11个相关因子作为输入节点，公共周期为输入时间；

（2）公共周期+估算时间作为一组数据，进行滑差处理进行训练；

（3）训练结果提取出估算气温数据与下一组所对应的值进行比较；

（4）训练下一组数据来估算第二天的数据，然后输出估算结果；

（5）重复步骤3,4，提取第二天估算的气温数据；

（6）此过程重复n次。

2.如权利要求1所述的近地表气温估算方法，其特征在于，所述对数据进行预处理，包括：首先对数据进行清洗，去掉异常值，修补缺失值，然后通过人工筛选和相关性分析对参数进行筛选，最后进行归一化处理；

相关系数是研究变量之间线性相关程度的量：

（1）

其中，X表示气温，Y表示其他各类气象因子，为X与Y的协方差，为X的方差，为Y的方差。

3.如权利要求1所述的近地表气温估算方法，其特征在于，采用以下评价指标来评定估算模型的精度，包括：

（10）

均方根误差表示的估算值与真实值之间差异或残差的样本标准差，说明样本的离散程度；做非线性拟合时，RMSE越小越好；

（11）

平均绝对值误差表示估算值与真实值之间误差的平均值，是一种线性分数，所有个体差异在平均值上的权重都相等；

（12）

根据气象业务精细化预报的要求，当估算气温与真实气温之间的差值1.5℃时，估算结果则可以接受；

（13）

平均百分比误差，估算连续性数据的准确率指的是1-,范围是，MAPE为0%表示完美模型，即MAPE越小越好；

其中，表示气温估算值，表示气温真实值，表示气温平均值；当RMSE、MAE、MAPE的值越小，Accuracy越大的时候，说明估算值与实际值之间误差较小，能够说明估算模型的精度越好。

4.一种计算机设备，其特征在于，所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如权利要求1~3任意一项所述的近地表气温估算方法的步骤：

获取4个的必选卫星数据反演参数和地面气象站点可以获取的7个备选参数，并对数据进行预处理；卫星数据反演参数包括地表温度、发射率、植被指数、土壤湿度，备选参数包括高程、平均风速、最大风速、最大风速风向、平均气压、日照时间、平均相对湿度；

确定估算模型精度评价指标，构建基于FFT-LSTM神经网络的气温估算模型，将卫星数据反演参数和气象站点的各要素作为输入因子，将公共周期作为输入时间长度，估算近地表气温，并对模型进行精度评价。

5.一种实施权利要求1~3任意一项所述的近地表气温估算方法的近地表气温估算系统，其特征在于，所述近地表气温估算系统包括：

数据集获取模块，用于获取遥感参数和地面站点相关数据；

数据预处理模块，用于对获取的数据集进行预处理；