CN113283155B - 一种近地表气温估算方法、系统、存储介质及设备 - Google Patents
一种近地表气温估算方法、系统、存储介质及设备 Download PDFInfo
- Publication number
- CN113283155B CN113283155B CN202110301023.6A CN202110301023A CN113283155B CN 113283155 B CN113283155 B CN 113283155B CN 202110301023 A CN202110301023 A CN 202110301023A CN 113283155 B CN113283155 B CN 113283155B
- Authority
- CN
- China
- Prior art keywords
- air temperature
- data
- meteorological
- estimated
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000013528 artificial neural network Methods 0.000 claims abstract description 35
- 238000011156 evaluation Methods 0.000 claims abstract description 29
- 238000012549 training Methods 0.000 claims abstract description 27
- 230000007787 long-term memory Effects 0.000 claims abstract description 24
- 230000009466 transformation Effects 0.000 claims abstract description 13
- 238000006243 chemical reaction Methods 0.000 claims abstract description 10
- 101001095088 Homo sapiens Melanoma antigen preferentially expressed in tumors Proteins 0.000 claims description 20
- 102100037020 Melanoma antigen preferentially expressed in tumors Human genes 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 20
- 238000007792 addition Methods 0.000 claims description 15
- 238000005070 sampling Methods 0.000 claims description 15
- 230000015654 memory Effects 0.000 claims description 13
- 238000007781 pre-processing Methods 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 9
- 238000001228 spectrum Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 8
- 238000012360 testing method Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 7
- 239000002689 soil Substances 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000000717 retained effect Effects 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 230000001413 cellular effect Effects 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 3
- 238000010219 correlation analysis Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 230000014759 maintenance of location Effects 0.000 claims description 3
- 238000012216 screening Methods 0.000 claims description 3
- 238000012106 screening analysis Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 22
- 230000007547 defect Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 27
- 230000009467 reduction Effects 0.000 description 12
- 210000004027 cell Anatomy 0.000 description 11
- 230000008859 change Effects 0.000 description 8
- 238000011160 research Methods 0.000 description 8
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 230000006872 improvement Effects 0.000 description 6
- 230000006403 short-term memory Effects 0.000 description 6
- 241000132092 Aster Species 0.000 description 4
- 239000004579 marble Substances 0.000 description 4
- 238000010835 comparative analysis Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000004836 empirical method Methods 0.000 description 3
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000008034 disappearance Effects 0.000 description 2
- 230000003631 expected effect Effects 0.000 description 2
- 238000004880 explosion Methods 0.000 description 2
- 210000002816 gill Anatomy 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000003775 Density Functional Theory Methods 0.000 description 1
- 241000286209 Phasianidae Species 0.000 description 1
- 241001122767 Theaceae Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000001507 sample dispersion Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/141—Discrete Fourier transforms
- G06F17/142—Fast Fourier transforms, e.g. using a Cooley-Tukey type algorithm
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/02—Reliability analysis or reliability optimisation; Failure analysis, e.g. worst case scenario performance, failure mode and effects analysis [FMEA]
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Computational Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Discrete Mathematics (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Geometry (AREA)
- Algebra (AREA)
- Computer Hardware Design (AREA)
- Databases & Information Systems (AREA)
- Testing Or Calibration Of Command Recording Devices (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于近地表气温估算技术领域,公开了一种近地表气温估算方法、系统、存储介质及设备,获取与近地表空气温度相关4个的必选卫星数据反演参数和地面气象站点可以获取的7个备选参数,并对数据进行预处理;采用快速傅里叶变换将各类观测要素的时间序列信息进行快速转换,提取与气象站点气温相关的气象要素间的公共周期;构建长短期记忆神经网络LSTM,并将得到的公共周期与估算时间作为数据组对长短期记忆网络进行训练,得到估算温度;确定估算模型精度评价指标,构建基于FFT‑LSTM神经网络的气温估算模型,估算近地表气温,并对模型进行精度评价。本发明使得模型有较好的估算效果和较高精度,弥补气象站点区域分布不均的缺陷。
Description
技术领域
本发明属于近地表气温估算技术领域,尤其涉及一种近地表气温估算方法、系统、存储介质及设备。
背景技术
近地表空气温度一般是指距离地表约2米高左右的温度,它是气候变化研究里一个非常重要的参数[Sun,Y.J.,Wang J.F.,Zhang,R.H.,Gillies,R.R.,Xue Y.and BoY.C.,Air temperature retrieval from remote sensing data based onthermodynamics.Theoretical andApplied Climatology,2005,80:37-48.]。近地表气温(以下简称气温),是陆表能量平衡中的重要气候参数,是气象观测中重要观测要素之一。
一些学者对气温估算进行研究,提出了不同的近地表气温估算模型。目前,在气候变化研究里公知的三种获得近地表空气温度的方法,一是基于能量平衡的物理方法。物理方法需要空气动力学阻抗,以及地表状态(包括水,土壤和植被的状态等),这几个参数非常难以获取[Sun,Y.J.,Wang J.F.,Zhang,R.H.,Gillies,R.R.,Xue Y.and Bo Y.C.,Airtemperature retrieval from remote sensing data based onthermodynamics.Theoretical and Applied Climatology,2005,80:37-48.];另外一个方法就是经验方法[Boyer,D.G.,Estimation ofdailytemperature means using elevationand latitude in mountainous terrain,Water Resource Bull 4,1984,583-588.]。经验方法就是利用GIS(Geographic Information System)气象站点获得的近地表空气温度进行插值得到近地表空气温度的分布图。当气象站点不是很多而且不是均匀分布(特别是在山区)的时,插值得到的结果不是非常好。三是毛克彪等利用ASTER数据的地表温度和发射率作为先验知识,从ASTER数据中反演近地表空气温度,但ASTER数据波段分辨率比较高,很难满足目前的需求。另外就是波段设置得不是非常合理,精度有待进一步提高[Mao,K.,Tang,H.,Wang,X.F.,Zhou,Q.B.,Wang,D.L.,Near-Surface Air Temperature EstimationFrom ASTER Data Using Neural Network,International Journal of Remote Sensing,2008,29(20):6021-6028.]。但由于各种条件的限制,目前普遍采用的是经验方法[Burrough,P.A.,Mc Donnell R.A.,Principles of geographical informationsystems.NewYork:OxfordUniversityPress,1998.]。
近年来深度学习发展迅速,人工神经网络通过数学方法来对神经元进行模拟,模仿人脑对信息处理,所以如何利用人工智能对这些气象大数据进行预测成为了一个研究的重点。毛克彪等在2009年提出利用神经网络从MODIS数据估算近地表空气温度方法[毛克彪,王道龙,张立新,任天志,李三妹,高懋芳,从MODIS数据估算近地表空气温度方法,发明专利,授权号:ZL2009100910294,授权日期:2013-6-5],这个方法主要是利用MODIS数据地表温度和发射率作为先验知识,精度还有待进一步提高。长短期记忆网络(Long-ShortTerm Memory,LSTM)论文首次发表于1997年。由于独特的设计结构,LSTM适合于处理和预测时间序列中间隔和延迟非常长的重要事件,循环神经网络RNN对于时序数据有着很强的处理能力。
通过上述分析,现有技术存在的问题及缺陷为:传统神经网络方法无法明确获得不同参数之间的数学关系,在计算过程中会将原始数据进行各种特征进行拆分,这些特征跟判断一个事务所使用的特征完全不同,当最后通过模型得到一个结果的时候,不知道它是通过哪些方面来得到这个结果的。为了克服传统神经网络在长期预测过程中可能会出现的梯度消失和梯度爆炸问题,我们选择采用长短期记忆网络(LSTM)来进行气温估算,提高温度估算的精度。与传统方法相比,长短期记忆神经网络较好的解决了高维数、非线性和局部最小值问题,面对海量数据有着更强的学习能力和泛化能力。
解决以上问题及缺陷的意义为:可以更加清楚地分析其物理原因,提高估算精度,在极端灾害中起到重要作用,减少灾害损失。
发明内容
针对现有技术存在的问题,本发明提供了一种近地表气温估算方法、系统、存储介质及设备。
本发明是这样实现的,一种近地表气温估算方法,所述近地表气温估算方法包括以下步骤:
步骤一,通过获取与近地表空气温度相关4个的必选卫星数据反演参数(地表温度、发射率、植被指数、土壤湿度)和地面气象站点可以获取的7个备选参数(高程、平均风速、最大风速、最大风速风向、平均气压、日照时间、平均相对湿度),并对数据进行预处理;
步骤二,采用快速傅里叶变换将各类观测要素的时间序列信息进行快速转换,提取气象站点气温与其他不同气象要素间的公共周期;
步骤三,构建长短期记忆神经网络LSTM,并将得到的公共周期与估算时间作为数据组对长短期记忆网络进行训练和测试;
步骤四,确定估算模型精度评价指标,构建基于FFT-LSTM神经网络的气温估算模型,将卫星数据反演参数和气象站点的各要素作为输入因子,将公共周期作为输入时间长度,估算近地表气温,并对模型进行精度评价。
通过预处理和规范化,利用FFT变化提取各物理变量之间的周期关系,进一步利用LSTM训练得到各物理量之间的关系,从而提高估算精度。
进一步,步骤一中,所述对数据进行预处理,包括:
首先对数据进行清洗,去掉异常值,修补缺失值,然后通过人工筛选和相关性分析对参数进行筛选,最后进行归一化处理。
相关系数是研究变量之间线性相关程度的量:
其中,X表示气温,Y表示其他各类气象因子,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差。
进一步,步骤二中,所述快速傅里叶变化FFT是离散傅里叶变换DFT的快速算法,所述傅里叶变换表达为:
其中,ω代表频率,t代表时间,e-iwt为复变函数。
所述傅里叶变换所计算出来的是信号x(t)的连续频谱。实际采取的是各站点的日平均气温,并不是连续的采样值,是离散的采样值,故选用离散傅里叶变换来计算气温与其他各气象要素的频谱。在一定的离散信号中,DFT的定义为:
在DFT中,假设要计算N个X(k)值,需要计算大约N2次复数乘法和N(N-1)次复数加法。每次复数乘法包括4次实数乘法和2次实数加法,每次复数加法又包括2次实数加法。因此计算一个DFT需要4N2次实数乘法和(2N2+2N·(N-1))次实数加法。当N很大的时候,这是一个非常大的计算量。而FFT算法主要是利用了e-i2πkn/N具有对称性和周期性的特点,其中虚数单位
进一步,步骤二中,所述提取气象站点气温与其他不同气象要素间的公共周期,包括:
利用快速傅里叶变化FFT方法,把各类相关要素的时间序列信息进行快速处理,将时域信号转换到频域信号;对各类相关要素进行归一化的线性处理,将结果映射在[0,1]之间;采样频率为fz对全年天平均数据进行采样,频谱可见范围为0-fzHZ,获得各类气象要素的处理结果。
根据以下公式得到各地区各类相关要素的共同周期为365天,包括:
其中,采样频率为365。
进一步,步骤三中,所述长短期记忆神经网络LSTM的结构包括遗忘门、输入门、输出门以及细胞的状态四部分。
所述LSTM的核心思想就是细胞状态,用贯穿细胞的水平线表示。通过遗忘门、输入门和输出门来对细胞状态进行删除或者添加信息,门能够有选择的决定让哪些信息通过,结构是一个sigmoid层和一个点乘操作的组合。Sigmoid层的输出是0-1的值,这代表着有多少信息能够通过;0表示都不能通过,1表示全部通过。
所述长短期记忆神经网络LSTM接收到输入信息后,首先确定丢弃掉的信息,由遗忘门的sigmoid层进行处理:
ft=σ(Wf·[ht-1,xt]+bf) (5)
通过查看ht-1和xt的信息来进行判断,输出一个0~1之间的向量,表示信息留存量和遗弃量,Wf和bf分别为权重和偏置值。如果得到的ft趋近于0,那么就表示不保留任何信息,如果愈趋近于1,那么就表示保留所有信息。
当信息经过遗忘门以后,一部分信息被剔除,一部分信息被保留下来。接下利用ht-1和xt通过输入门来决定更新哪些信息,然后利用ht-1和xt通过tanh层得到新的细胞Ct,包括:
当细胞更新完状态后,将输入的ht-1和xt来经过一个叫做输出门的sigmoid层,根据输入的ht-1和xt来判断细胞输出哪些状态特征,在经过tanh层后会得到一个-1~1之间值的向量,向量与输出门得到的判断条件相乘即可得到最终的输入结果,包括:
ht=σ(Wi·[ht-1,xt]+bi)*tanh(Ct) (9)
进一步,步骤三中,所述将得到的公共周期与估算时间作为数据组对长短期记忆网络进行训练的过程中,输入第一组数据,其中包含近地表空气温度相关4个的必选卫星数据反演参数(地表温度、发射率、植被指数、土壤湿度)和地面气象站点可以获取的7个备选参数(高程、平均风速、最大风速、最大风速风向、平均气压、日照时间、平均相对湿度)共11个要素;将估算时间第一天所估算的气温作为第二组数据的平均气温来进行对比,包括:
(1)将11个气象要素作为输入因子,公共周期为输入时间;
(2)公共周期+估算时间作为一组数据,进行滑差处理进行训练;
(3)训练结果提取出估算气温数据与下一组所对应的值进行比较;
(4)训练下一组数据来估算第二天的数据,然后输出估算结果;
(5)重复步骤3,4,提取第二天估算的气温数据;
(6)此过程重复n次。
进一步,步骤四中,所述确定估算模型精度评价指标,包括:
采用均方根误差RMSE、平均绝对误差MAE和决定系数R2三个评价指标来评定估算模型的精度,包括:
均方根误差表示的估算值与真实值之间差异(残差)的样本标准差,说明样本的离散程度;做非线性拟合时,RMSE越小越好。
平均绝对值误差表示估算值与真实值之间误差的平均值,是一种线性分数,所有个体差异在平均值上的权重都相等。
根据气象业务精细化预报的要求,当估算气温与真实气温之间的差值≤2.0℃时,预报结果为正确。
平均百分比误差,估算连续性数据的准确率指的是1-MAPE,范围是[0,+∞),MAPE为0%表示完美模型,即MAPE越小越好。
其中,Ti表示气温估算值,表示气温真实值,表示气温平均值。当RMSE、MAE、MAPE的值越小,Accuracy越大的时候,说明估算值与实际值之间误差较小,能够说明估算模型的精度越好。
本发明的另一目的在于提供一种应用所述的近地表气温估算方法的近地表气温估算系统,所述近地表气温估算系统包括:
数据集获取模块,用于获取遥感参数和地面站点相关数据;
数据预处理模块,用于对获取的数据集进行预处理;
公共周期提取模块,用于采用快速傅里叶变换将各类观测要素的时间序列信息进行快速转换,提取气象站点气温与其他不同气象要素间的公共周期;
温度估算模型构建模块,用于构建长短期记忆神经网络LSTM,并将得到的公共周期与估算时间作为数据组对长短期记忆网络进行训练,用于构建基于FFT-LSTM的气温估算模型;
精度评价模块,用于确定估算模型精度评价指标,并对模型进行精度评价。
本发明的另一目的在于提供一种存储在计算机可读介质上的计算机程序产品,包括计算机可读程序,供于电子装置上执行时,提供用户输入接口以实施所述的近地表气温估算方法。
本发明的另一目的在于提供一种计算机可读存储介质,储存有指令,当所述指令在计算机上运行时,使得计算机执行所述的近地表气温估算方法。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明提供的基于快速傅里叶变换与长短期记忆网络的近地表气温估算方法,基于FFT-LSTM方法构建气温估算模型,利用2010年至2019年广东东莞、黑龙江漠河、湖北武汉、新疆吐鲁番、云南大理5个站点所采集的天数据,首先通过快速傅里叶变换分析出各个要素的公共周期为365天,然后把各个要素与公共周期作为模型输入,30天的气温作为模型输出,将两者进行结合进行滑差处理增大样本量,获得预期效果。分别与RBF,BP神经网络进行对比分析,将结果进行外部检验,实验结果表明,基于FFT-LSTM估算模型相较于BP、RBF模型,RMSE平均降低1.21、0.68,MAE平均降低1.27、1.30,MAPE平均降低11%、11%,Accuarcy平均提升32%,25%。该模型有较好的估算效果,可以为气温估算提供参考。
本发明通过快速傅里叶变换来寻找到气象站点各要素的公共周期,利用长短期记忆网络(LSTM)来进行估算,气象站点的各要素作为输入因子,将公共周期作为输入时间长度,输出30天的气温估算值,最后对模型进行精度评价。获得以下结论与展望:
(1)各站点多个气象要素的公共周期为365天,但是由于地球公转的时间并不等于地球自转时间的正整数倍,会有闰年的出现也就是366天,实际上以365天作为周期是有误差的。
(2)基于FFT-LSTM模型估算气温的效果要优于BP、RBF模型。相较于BP、RBF模型,RMSE平均降低1.21、0.68,MAE平均降低1.27、1.30,MAPE平均降低11%、11%,Accuarcy平均提升32%,25%。
(3)广东东莞、湖北武汉、云南大理站的估算效果最好,黑龙江漠河,新疆吐鲁番次之。模型检验精度较好,平均RMSE为1.36,平均MAE为1.02,平均MAPE为11%,平均Accuarcy为87%,模型精度较高,可有效估算未来30天的气温值。
本发明选择广东东莞、黑龙江漠河、湖北武汉、新疆吐鲁番、云南大理五个气象站点2010年至2019年日气象数据进行研究,构建FFT-LSTM模型估算气温,得到良好的估算效果。通过对实验对比分析发现,不同时间段下的模型估算结果有所不同,接下来的研究可以从进行不同时间段的气温估算,在模型中加入更多约束条件进行对比分析来改善模型,为估算气温提供参考。本发明通过构建FFT-LSTM模型估算气温,充分利用卫星反演参数和地面站点观测数据,使得模型有较好的估算效果和较高精度,可以为无气象站点的区域提供估算气象数据,弥补气象站点区域分布不均的缺陷。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的LSTM神经网络结构图。
图2(a)是本发明实施例提供的门的结构示意图。
图2(b)是本发明实施例提供的sigmoid函数示意图。
图3是本发明实施例提供的tanh函数示意图。
图4是本发明实施例提供的滑差示意图。
图5是本发明实施例提供的LSTM训练示意图。
图6是本发明实施例提供的LSTM估算温度示意图。
图7是本发明实施例提供的LSTM估算气温结构图。
图8(a)是本发明实施例提供的黑龙江漠河的快速傅里叶变换处理后结果示意图。
图8(b)是本发明实施例提供的广东东莞的快速傅里叶变换处理后结果示意图。
图8(c)是本发明实施例提供的湖北武汉的快速傅里叶变换处理后结果示意图。
图8(d)是本发明实施例提供的新疆吐鲁番的快速傅里叶变换处理后结果示意图。
图8(e)是本发明实施例提供的云南大理的快速傅里叶变换处理后结果示意图。
图9(a)是本发明实施例提供的广东东莞站点的估算结果示意图。
图9(b)是本发明实施例提供的黑龙江漠河站点的估算结果示意图。
图9(c)是本发明实施例提供的湖北武汉站点的估算结果示意图。
图9(d)是本发明实施例提供的新疆吐鲁番站点的估算结果示意图。
图9(e)是本发明实施例提供的云南大理站点的估算结果示意图。
图10(a)是本发明实施例提供的广东东莞站点的模型对比结果示意图。
图10(b)是本发明实施例提供的黑龙江漠河站点的模型对比结果示意图。
图10(c)是本发明实施例提供的湖北武汉站点的模型对比结果示意图。
图10(d)是本发明实施例提供的新疆吐鲁番站点的模型对比结果示意图。
图10(e)是本发明实施例提供的云南大理站点的模型对比结果示意图。
图11(a)是本发明实施例提供的不同模型的RMSE精度评定示意图。
图11(b)是本发明实施例提供的不同模型的MAE精度评定示意图。
图11(c)是本发明实施例提供的不同模型的Accuary精度评定示意图。
图11(d)是本发明实施例提供的不同模型的MAPE精度评定示意图。
图12(a)是本发明实施例提供的广东东莞的不同时间估算效果图。
图12(b)是本发明实施例提供的黑龙江漠河的不同时间估算效果图。
图12(c)是本发明实施例提供的湖北武汉的不同时间估算效果图。
图12(d)是本发明实施例提供的新疆吐鲁番的不同时间估算效果图。
图12(e)是本发明实施例提供的云南大理的不同时间估算效果图。
图13是本发明实施例提供的近地表气温估算方法流程图。
图14是本发明实施例提供的近地表气温估算系统结构框图;
图中:1、数据集获取模块;2、数据预处理模块;3、公共周期提取模块;4、温度估算模型构建模块;5、精度评价模块。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种近地表气温估算方法、系统、存储介质及设备,下面结合附图对本发明作详细的描述。
如图13所示,本发明实施例提供的近地表气温估算方法包括以下步骤:
S101,获取卫星反演参数和地面气象站点数据资料日值数据集,并对数据进行预处理;
S102,采用快速傅里叶变换将各类观测要素的时间序列信息进行快速转换,提取气象站点气温与其他不同气象要素间的公共周期;
S103,构建长短期记忆神经网络LSTM,并将得到的公共周期与估算时间作为数据组对长短期记忆网络进行训练,得到估算温度;
S104,确定估算模型精度评价指标,构建基于FFT-LSTM神经网络的气温估算模型,将气象站点的各要素作为输入因子,将公共周期作为输入时间长度,估算近地表气温,并对模型进行精度评价。
本发明提供的近地表气温估算方法业内的普通技术人员还可以采用其他的步骤实施,图1的本发明提供的近地表气温估算方法仅仅是一个具体实施例而已。
如图14所示,本发明实施例提供的近地表气温估算系统包括:
数据集获取模块1,用于获取遥感参数和地面站点相关数据;
数据预处理模块2,用于对获取的数据集进行预处理;
公共周期提取模块3,用于采用快速傅里叶变换将各类观测要素的时间序列信息进行快速转换,提取气象站点气温与其他不同气象要素间的公共周期;
温度估算模型构建模块4,用于构建长短期记忆神经网络LSTM,并将得到的公共周期与估算时间作为数据组对长短期记忆网络进行训练,用于构建基于FFT-LSTM的气温估算模型;
精度评价模块5,用于确定估算模型精度评价指标,并对模型进行精度评价。
下面结合实施例对本发明的技术方案作进一步的描述。
本发明获取与近地表空气温度相关4个的必选卫星数据反演参数(地表温度、发射率、植被指数、土壤湿度)和地面气象站点可以获取的7个备选参数(高程、平均风速、最大风速、最大风速风向、平均气压、日照时间、平均相对湿度),并对数据进行预处理;采用快速傅里叶变换将各类观测要素的时间序列信息进行快速转换,提取与气象站点气温相关的气象要素间的公共周期;构建长短期记忆神经网络LSTM,并将得到的公共周期与估算时间作为数据组对长短期记忆网络进行训练,得到估算温度;确定估算模型精度评价指标,构建基于FFT-LSTM神经网络的气温估算模型,估算近地表气温,并对模型进行精度评价。
1、为了提高估算气温的准确率,本发明提出一种基于FFT-LSTM方法构建气温估算模型,利用2010年至2019年广东东莞、黑龙江漠河、湖北武汉、新疆吐鲁番、云南大理5个站点所采集的天数据,首先通过快速傅里叶变换分析出各个要素的公共周期为365天,然后把各个要素与公共周期作为模型输入,30天的气温作为模型输出,将两者进行结合进行滑差处理增大样本量,获得预期效果。分别与RBF,BP神经网络进行对比分析,将结果进行外部检验,实验结果表明,基于FFT-LSTM估算模型相较于BP、RBF模型,RMSE平均降低1.21、0.68,MAE平均降低1.27、1.30,MAPE平均降低11%、11%,Accuarcy平均提升32%,25%。该模型有较好的估算效果,可以为气温估算提供参考。
2、本发明所用数据资料来自于中国气象数据网(http://data.cma.cn)2010年到2019年中国地面气候资料日值数据集。算法对深度学习十分重要,良好的数据是使结果能够准确、精细的基本条件。首先对数据进行清洗,去掉异常值,修补缺失值,然后通过人工筛选和相关性分析对参数进行筛选(见表1),最后由于不同参数大小之间有很大的差异,对于深度学习来说,因为权值的存在会使模型的训练和学习难以继续,所以进行归一化处理,来消除不同参数之间的量纲大小不同所造成的影响。
相关系数是研究变量之间线性相关程度的量。
其中,X表示气温,Y表示其他各类气象因子,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差。
3、方法
3.1快速傅里叶变换(FFT,fast Fourier transform)
快速傅里叶变化(FFT)是离散傅里叶变换(DFT)的快速算法。在1965年由JamesW.Cooley和John W.Tukey在前人的基础上提出的快速计算DFT的算法。FFT算法是基于可以将一个长度为N的序列的DFT逐次分解为较短的DFT来计算这一基本原理。该方法能够分析时间序列或者空间域中连续或者离散信号,并且将时域信号转换到频域信号上。由于气温数据量的庞大,本发明可以把这些因子看作是一种信号,为了透过这些杂乱的信号进而观察到更直观的本质信息,采用快速傅里叶变换来对这些因子进行快速转换,构建模型寻找它们的公共周期。傅里叶变换表达为:
公式(2)中ω代表频率,t代表时间,e-iwt为复变函数。傅里叶变换所计算出来的是信号x(t)的连续频谱。但是在实际的采样数据中,本发明所采取的是各站点的日平均气温,并不是连续的采样值,是离散的采样值。因此本发明选用离散傅里叶变换来计算气温与其他各气象要素的频谱。在一定的离散信号中,DFT的定义为:
在DFT中,假设要计算N个X(k)值,需要计算大约N2次复数乘法和N(N-1)次复数加法。每次复数乘法包括4次实数乘法和2次实数加法,每次复数加法又包括2次实数加法。因此计算一个DFT需要4N2次实数乘法和(2N2+2N·(N-1))次实数加法。当N很大的时候,这是一个非常大的计算量。而FFT算法主要是利用了e-i2πkn/N具有对称性和周期性的特点,极大的加快了计算速度,缩短了计算时间。
其中虚数单位
3.2长短期记忆神经网络(LSTM,Long Short-Term Memory)
长短期记忆神经网络是一种时间循环神经网络,最初是为了解决RNN(循环神经网络)存在的长期依赖问题而专门设计出来的,是一种特殊的RNN结构。由于具有独特的设计结构,适合用来处理和估算在时间序列中间隔和延迟非常长的事件,被广泛的用来处理时间序列方面的问题,能够有效的解决梯度爆炸和梯度消失问题,由于LSTM与之前输入数据的高度相关性,被广泛应用于时间序列数据挖掘中。如图1所示,LSTM结构有四大组成部分,分别为遗忘门,输入门,输出门以及细胞的状态这也是LSTM的核心思想。
LSTM的核心思想就是细胞状态,可以用贯穿细胞的水平线表示。通过遗忘门、输入门和输出门来对细胞状态进行删除或者添加信息,门能够有选择的决定让哪些信息通过。它的结构很简单就是一个sigmoid层和一个点乘操作的组合。Sigmoid层的输出是0-1的值,这代表着有多少信息能够通过。0表示都不能通过,1表示全部通过,如图2所示。
LSTM接收到输入信息以后,第一步就是决定丢弃掉哪些信息。它是由遗忘门的sigmoid层来处理的。
ft=σ(Wf·[ht-1,xt]+bf) (17)
通过查看ht-1和xt的信息来进行判断,输出一个0~1之间的向量,表示信息留存量和遗弃量,Wf和bf分别为权重和偏置值。如果得到的ft趋近于0,那么就表示不保留任何信息,如果愈趋近于1,那么就表示保留所有信息。
当信息经过遗忘门以后,一部分信息被剔除,一部分信息被保留下来。接下来通过两个步骤来决定添加哪些信息。首先利用ht-1和xt通过输入门来决定更新哪些信息。然后,利用ht-1和xt通过tanh层得到新的细胞Ct。图3为tanh函数。
当细胞更新完状态后,将输入的ht-1和xt来经过一个叫做输出门的sigmoid层,根据输入的ht-1和xt来判断细胞输出哪些状态特征,在经过tanh层后会得到一个-1~1之间值的向量,向量与输出门得到的判断条件相乘就得到了最终的输入结果。
ht=σ(Wi·[ht-1,xt]+bi)*tanh(Ct) (21)
3.3长短期记忆网络训练
本发明将通过快速傅里叶变换来寻找不同气象要素之间的公共周期来作为输入时间进行气温估算。将得到的公共周期与估算时间作为一个数据组来进行训练,假设采用这种方式来进行数据组合,那么10年间的天数据就一共只能构造出9组数据。为了改变这种情况,引入滑差的方式来增大数据量,即以公共周期+估算时间为第一组数据,再将第二天为公共周期的第一天+估算时间为第二组数据,以此类推来增大数据量,如图4所示。
将数据进行滑差处理之后,得到了t个数据组,分别将这些数据组输入LSTM网络进行训练来得到估算温度,如图5所示。
在图6中,本发明输入第一组数据,其中包含近地表空气温度相关4个的必选卫星数据反演参数(地表温度、发射率、植被指数、土壤湿度)和地面气象站点可以获取的7个备选参数(高程、平均风速、最大风速、最大风速风向、平均气压、日照时间、平均相对湿度)共11个要素。将估算时间第一天所估算的气温作为第二组数据的平均气温来进行对比。步骤如下:
(1)将11个气象要素作为输入因子,公共周期为输入时间。
(2)公共周期+估算时间作为一组数据,进行滑差处理进行训练。
(3)训练结果提取出估算气温数据与下一组所对应的值进行比较。
(4)训练下一组数据来估算第二天的数据,然后输出估算结果。
(5)重复步骤3和步骤4,提取第二天估算的气温数据。
(6)此过程重复n次。
图7中是模型中估算n天气温的实际LSTM网络结构,BS代表的是Batch_size,表示的是每次送入模型训练的样本批数量。这一要素的选择是极为重要的,为了在内存效率和内存容量之间寻求最佳平衡,Batch_size的设置关系到最优化网络模型的性能及速度。N表示的是神经元的数量,M表示的是输入的数量。在LSTM网络中被设计可以不断往其中添加所需要的气象要素,每个LSTM单元格输出的是(BS,N)形式的向量。但是本发明所需要的是输出只有一个温度的向量,所以为了转换格式成为(B,1)的向量,进行如图7所示的转换过程。
4、基于FFT的气温与其他气象要素公共周期的提取
气温的变化受到其他气象因素变化的影响,为了构建基于气象站点的气温估算模型,就必须先寻找到各类观测要素的公共周期变化(如表1)。本发明利用快速傅里叶变化(FFT)方法,把各类观测要素的时间序列信息进行快速处理,将时域信号转换到频域信号上来。为了使模型具有更好的估算结果,达到可以全国范围内普遍可以利用的效果,选取新疆吐鲁番,黑龙江漠河,湖北武汉,云南大理和广东东莞作为研究对象。对各类气象要素进行归一化的线性处理,将结果映射在[0,1]之间。数据集为2010年至2019年天数据,一年的采样点数是365(闰年为366),采样频率为fz对全年天平均数据进行采样,频谱可见范围为0-fzHZ,获得各类气象要素的处理结果,如图8所示。
表1各地区公共周期
图8为五个地区各类气象要素处理结果,通过快速傅里叶变换将各类气象要素的时域信息转换到了频域信息上。从图中本发明可以很清楚的看到各类气象要素的变化情况,在频率为1的时候,出现了波峰重叠,由此判断,各类气象要素的公共频率为1。输入的采样率参数为365,那么根据公式(22)就可以得到各地区各类气象要素的共同周期为365天。
公式(9)当中乘以365的原因是设置的采样频率为365,图9中的横坐标为频率(cpy)指的是一年的频率,转换为天数就需要乘以365。
5、基于FFT-LSTM神经网络的气温估算模型
5.1精度评价指标
为了更好的验证模型的估算精度,本发明将采用均方根误差(RMSE)、平均绝对误差(MAE)、决定系数(R2)三个评价指标来评定估算模型的精度。
均方根误差表示的估算值与真实值之间差异(残差)的样本标准差。说明了样本的离散程度。做非线性拟合时,RMSE越小越好。
平均绝对值误差表示估算值与真实值之间误差的平均值,这是一种线性分数,所有个体差异在平均值上的权重都相等。
根据气象业务精细化预报的要求,当估算气温与真实气温之间的差值≤2.0℃时,预报结果为正确。
平均百分比误差,估算连续性数据的准确率指的是1-MAPE,范围是[0,+∞),MAPE为0%表示完美模型,即MAPE越小越好。
以上公式中,Ti表示气温估算值,表示气温真实值,表示气温平均值。当RMSE、MAE、MAPE的值越小,Accuracy越大的时候,说明估算值与实际值之间误差较小,能够说明估算模型的精度越好。
5.1构建模型
本发明将快速傅里叶变换与长短期记忆网络相结合,构建估算模型。在研究中,用过快速傅里叶变换得到各类气象要素的公共周期为365天,对五个气象站点2010年1月1日至2019年11月30日数据进行处理,按照时间间隔395天(公共周期为365天+估算时间30天)进行滑差分组,增大数据样本。其中80%的数据集进行训练,20%的数据集进行测试,以此来估算未来30天的平均气温。通过大量的测试和研究分析,将Epochs(固定训练次数)设定为300次,Batch_Size(每个批次feed进入LSTM的数据大小)设置为128,学习率设置为0.01时,模型效果最佳,loss函数接近于0.01,最终得到如图9所示的结果。
由图9所示,FFT-LSTM模型估算的结果与实际结果相差不大,为了验证模型的精度,还与其他估算模型进行了对比分析研究。
从图10中可以看出,BP和RBF模型估算的气温值与实际值有着明显的差异。FFT-LSTM模型估算结果接近实际值,拟合效果较好,在广东东莞、湖北武汉、云南大理三个气温波动起伏不太大的站点中,三种模型有着良好的估算效果,比较贴近估算的趋势,在新疆吐鲁番和黑龙江漠河两个气温波动比较大的站点中,FFT-LSTM模型的估算值最接近实际温度,拟合效果最好。
5.2验证与分析
为了更好的验证与分析FFT-LSTM在气温估算模型上相较于其他两种模型有着更好的估算精度,本发明分别采用四种精度评价指标进行评定。
表2气温估算模型精度评价1
从图11和表2中本发明不难发现,FFT-LSTM模型估算气温的精度明显优于另外两种模型。以广东东莞为例,FFT-LSTM模型估算气温结果相对于BP和RBF模型,RMSE提升了52%、57%,MAE提升了61%、66%,Accuracy上提升了54%、52%,MAPE提升了62%、67%。
此外本发明还对FFT-LSTM模型进行了不同时间段的气温估算,来验证模型精度。图12是2018年6月估算数据与真实数据对比图。
表3气温估算模型精度评价2
RMSE | MAE | Accuracy | MAPE | |
广东东莞 | 0.90 | 0.71 | 97% | 2.61% |
黑龙江漠河 | 1.23 | 0.93 | 93% | 5.85% |
湖北武汉 | 1.20 | 0.88 | 83% | 3.25% |
新疆吐鲁番 | 1.85 | 1.48 | 70% | 10.73% |
云南大理 | 0.86 | 0.65 | 100% | 3.31% |
如图12与表3所示,对FFT-LSTM估算模型在不同时间段估算效果进行研究发现,对比2019年12月的估算效果,2018年6月的估算效果明显要优于前者。除广东东莞站点各项精度有小幅降低,RMSE,MAE,MAPE分别降低0.1、0.1、0.83%,Accuracy保持不变。其余四个站点都有着明显的精度提升。
6、本发明通过快速傅里叶变换来寻找到气象站点各要素的公共周期,利用长短期记忆网络(LSTM)来进行估算,气象站点的各要素作为输入因子,将公共周期作为输入时间长度,输出30天的气温估算值,最后对模型进行精度评价。获得以下结论与展望:
(1)各站点多个气象要素的公共周期为365天,但是由于地球公转的时间并不等于地球自转时间的正整数倍,会有闰年的出现也就是366天,实际上以365天作为周期是有误差的。
(2)基于FFT-LSTM模型估算气温的效果要优于BP、RBF模型。相较于BP、RBF模型,RMSE平均降低1.21、0.68,MAE平均降低1.27、1.30,MAPE平均降低11%、11%,Accuarcy平均提升32%,25%。
(3)广东东莞、湖北武汉、云南大理站的估算效果最好,黑龙江漠河,新疆吐鲁番次之。模型检验精度较好,平均RMSE为1.36,平均MAE为1.02,平均MAPE为11%,平均Accuarcy为87%,模型精度较高,可有效估算未来30天的气温值。
本发明选择广东东莞、黑龙江漠河、湖北武汉、新疆吐鲁番、云南大理五个气象站点2010年至2019年日气象数据进行研究,构建FFT-LSTM模型估算气温,得到良好的估算效果。根据图9与图12、表3与表2对比分析发现,不同时间段下的模型估算结果有所不同,接下来的研究可以从进行不同时间段的气温估算,在模型中加入更多约束条件进行对比分析来改善模型,为估算气温提供参考。本发明通可以通过进一步利用先验知识和动态学习神经网络几何遥感数据估算近地表空气温度,通过融合将遥感估算的近地表空气温度等相关参数和FFT-LSTM结合,将点估算推广到空间面上。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘SolidState Disk(SSD))等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
Claims (5)
1.一种近地表气温估算方法,其特征在于,所述近地表气温估算方法包括:
通过获取与近地表空气温度相关4个的必选卫星数据反演参数和地面气象站点获取的7个备选参数,并对数据进行预处理;
采用快速傅里叶变换将各类观测要素的时间序列信息进行快速转换,提取气象站点气温与其他不同气象要素间的公共周期;
构建长短期记忆神经网络LSTM,并将得到的公共周期与估算时间作为数据组对长短期记忆网络进行训练和测试;
确定估算模型精度评价指标,构建基于FFT-LSTM神经网络的气温估算模型,将卫星数据反演参数和气象站点的各要素作为输入因子,将公共周期作为输入时间长度,估算近地表气温,并对模型进行精度评价;
所述快速傅里叶变化FFT是离散傅里叶变换DFT的快速算法,所述傅里叶变换表达为:
(2)
其中,代表频率,代表时间,为复变函数;
所述傅里叶变换所计算出来的是信号x(t)的连续频谱;实际采取的是各站点的日平均气温,并不是连续的采样值,是离散的采样值,选用离散傅里叶变换来计算气温与其他各气象要素的频谱;在一定的离散信号中,DFT的定义为:
, (3)
在DFT中,假设要计算N个X(k)值,需要计算N2次复数乘法和N(N-1)次复数加法;每次复数乘法包括4次实数乘法和2次实数加法,每次复数加法又包括2次实数加法;因此计算一个DFT需要4N2次实数乘法和(2N2+2N·(N-1))次实数加法;当N很大的时候,这是一个非常大的计算量;而FFT算法主要是利用了具有对称性和周期性的特点,其中虚数单位;
所述提取近地表气温与其他不同气象要素间的公共周期,包括:利用快速傅里叶变化FFT方法,把各类观测要素的时间序列信息进行快速处理,将时域信号转换到频域信号;对各类气象要素进行归一化的线性处理,将结果映射在[0,1]之间;采样频率为对全年天平均数据进行采样,频谱可见范围为0 -HZ,获得各类气象要素的处理结果;
根据以下公式得到各地区各类气象要素的共同周期为365天,包括:
(4)
其中,采样频率为365;
所述长短期记忆神经网络LSTM的结构包括遗忘门、输入门、输出门以及细胞的状态四部分;所述LSTM的核心思想就是细胞状态,用贯穿细胞的水平线表示;通过遗忘门、输入门和输出门来对细胞状态进行删除或者添加信息,门能够有选择的决定让哪些信息通过,结构是一个sigmoid层和一个点乘操作的组合;Sigmoid层的输出是0-1的值,这代表着有多少信息能够通过;0表示都不能通过,1表示全部通过;
所述长短期记忆神经网络LSTM接收到输入信息后,首先确定丢弃掉的信息,由遗忘门的sigmoid层进行处理:
(5)
通过查看和的信息来进行判断,输出一个0~1之间的向量,表示信息留存量和遗弃量,和分别为权重和偏置值;如果得到的趋近于0,那么就表示不保留任何信息,如果愈趋近于1,那么就表示保留所有信息;
当信息经过遗忘门以后,一部分信息被剔除,一部分信息被保留下来;接下利用和通过输入门来决定更新哪些信息,然后利用和通过tanh层得到新的细胞,包括:
(6)
(7)
(8)
当细胞更新完状态后,将输入的和来经过一个叫做输出门的sigmoid层,根据输入的和来判断细胞输出哪些状态特征,在经过tanh层后会得到一个-1~1之间值的向量,向量与输出门得到的判断条件相乘即可得到最终的输入结果,包括:
(9);
所述将得到的公共周期与估算时间作为数据组对长短期记忆网络进行训练的过程中,输入第一组数据,其中包含4个的必选卫星数据反演参数和地面气象站点可以获取的7个备选参数,共11个要素,将对应的近地表空气温度作为输出值,卫星数据反演参数包括地表温度、发射率、植被指数、土壤湿度,备选参数包括高程、平均风速、最大风速、最大风速风向、平均气压、日照时间、平均相对湿度;包括:
(1)将11个相关因子作为输入节点,公共周期为输入时间;
(2)公共周期+估算时间作为一组数据,进行滑差处理进行训练;
(3)训练结果提取出估算气温数据与下一组所对应的值进行比较;
(4)训练下一组数据来估算第二天的数据,然后输出估算结果;
(5)重复步骤3,4,提取第二天估算的气温数据;
(6)此过程重复n次。
2.如权利要求1所述的近地表气温估算方法,其特征在于,所述对数据进行预处理,包括:首先对数据进行清洗,去掉异常值,修补缺失值,然后通过人工筛选和相关性分析对参数进行筛选,最后进行归一化处理;
相关系数是研究变量之间线性相关程度的量:
(1)
其中,X表示气温,Y表示其他各类气象因子,为X与Y的协方差,为X的方差,为Y的方差。
3.如权利要求1所述的近地表气温估算方法,其特征在于,采用以下评价指标来评定估算模型的精度,包括:
(10)
均方根误差表示的估算值与真实值之间差异或残差的样本标准差,说明样本的离散程度;做非线性拟合时,RMSE越小越好;
(11)
平均绝对值误差表示估算值与真实值之间误差的平均值,是一种线性分数,所有个体差异在平均值上的权重都相等;
(12)
根据气象业务精细化预报的要求,当估算气温与真实气温之间的差值1.5℃时,估算结果则可以接受;
(13)
平均百分比误差,估算连续性数据的准确率指的是1-,范围是,MAPE为0%表示完美模型,即MAPE越小越好;
其中,表示气温估算值,表示气温真实值,表示气温平均值;当RMSE、MAE、MAPE的值越小,Accuracy越大的时候,说明估算值与实际值之间误差较小,能够说明估算模型的精度越好。
4.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1~3任意一项所述的近地表气温估算方法的步骤:
获取4个的必选卫星数据反演参数和地面气象站点可以获取的7个备选参数,并对数据进行预处理;卫星数据反演参数包括地表温度、发射率、植被指数、土壤湿度,备选参数包括高程、平均风速、最大风速、最大风速风向、平均气压、日照时间、平均相对湿度;
采用快速傅里叶变换将各类观测要素的时间序列信息进行快速转换,提取气象站点气温与其他不同气象要素间的公共周期;
构建长短期记忆神经网络LSTM,并将得到的公共周期与估算时间作为数据组对长短期记忆网络进行训练和测试;
确定估算模型精度评价指标,构建基于FFT-LSTM神经网络的气温估算模型,将卫星数据反演参数和气象站点的各要素作为输入因子,将公共周期作为输入时间长度,估算近地表气温,并对模型进行精度评价。
5.一种实施权利要求1~3任意一项所述的近地表气温估算方法的近地表气温估算系统,其特征在于,所述近地表气温估算系统包括:
数据集获取模块,用于获取遥感参数和地面站点相关数据;
数据预处理模块,用于对获取的数据集进行预处理;
公共周期提取模块,用于采用快速傅里叶变换将各类观测要素的时间序列信息进行快速转换,提取气象站点气温与其他不同气象要素间的公共周期;
温度估算模型构建模块,用于构建长短期记忆神经网络LSTM,并将得到的公共周期与估算时间作为数据组对长短期记忆网络进行训练,用于构建基于FFT-LSTM的气温估算模型;
精度评价模块,用于确定估算模型精度评价指标,并对模型进行精度评价。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110301023.6A CN113283155B (zh) | 2021-03-22 | 2021-03-22 | 一种近地表气温估算方法、系统、存储介质及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110301023.6A CN113283155B (zh) | 2021-03-22 | 2021-03-22 | 一种近地表气温估算方法、系统、存储介质及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113283155A CN113283155A (zh) | 2021-08-20 |
CN113283155B true CN113283155B (zh) | 2024-04-09 |
Family
ID=77275952
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110301023.6A Active CN113283155B (zh) | 2021-03-22 | 2021-03-22 | 一种近地表气温估算方法、系统、存储介质及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113283155B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113486581B (zh) * | 2021-07-02 | 2024-08-16 | 宁夏大学 | 一种基于知识驱动和逻辑推理的机器学习地表温度估算方法、系统、存储介质及设备 |
CN114019579B (zh) * | 2021-08-24 | 2023-11-24 | 中国农业科学院农业资源与农业区划研究所 | 高时空分辨率近地表空气温度重构方法、系统、设备 |
CN113761756B (zh) * | 2021-09-26 | 2022-05-06 | 中国农业科学院农业资源与农业区划研究所 | 一种表面温度高温和低温数据集重构方法 |
CN114723166A (zh) * | 2022-04-27 | 2022-07-08 | 中国科学院地理科学与资源研究所 | 一种基于XGBoost模型的地表温度重建方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019236851A1 (en) * | 2018-06-06 | 2019-12-12 | The Joan and Irwin Jacobs Technion-Cornell Institute | Telecommunications network traffic metrics evaluation and prediction |
CN110633792A (zh) * | 2019-10-22 | 2019-12-31 | 西安交通大学 | 端到端基于卷积循环神经网络的轴承健康指标构建方法 |
CN111798051A (zh) * | 2020-07-02 | 2020-10-20 | 杭州电子科技大学 | 基于长短期记忆神经网络的空气质量时空预测方法 |
CN112348271A (zh) * | 2020-11-12 | 2021-02-09 | 华北电力大学 | 基于vmd-ipso-gru的短期光伏功率预测方法 |
AU2020104000A4 (en) * | 2020-12-10 | 2021-02-18 | Guangxi University | Short-term Load Forecasting Method Based on TCN and IPSO-LSSVM Combined Model |
CN112488396A (zh) * | 2020-12-01 | 2021-03-12 | 国网福建省电力有限公司 | 基于小波变换的Holt-Winters和LSTM组合模型的电力负荷预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11537889B2 (en) * | 2019-05-20 | 2022-12-27 | ClimateAI, Inc. | Systems and methods of data preprocessing and augmentation for neural network climate forecasting models |
-
2021
- 2021-03-22 CN CN202110301023.6A patent/CN113283155B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019236851A1 (en) * | 2018-06-06 | 2019-12-12 | The Joan and Irwin Jacobs Technion-Cornell Institute | Telecommunications network traffic metrics evaluation and prediction |
CN110633792A (zh) * | 2019-10-22 | 2019-12-31 | 西安交通大学 | 端到端基于卷积循环神经网络的轴承健康指标构建方法 |
CN111798051A (zh) * | 2020-07-02 | 2020-10-20 | 杭州电子科技大学 | 基于长短期记忆神经网络的空气质量时空预测方法 |
CN112348271A (zh) * | 2020-11-12 | 2021-02-09 | 华北电力大学 | 基于vmd-ipso-gru的短期光伏功率预测方法 |
CN112488396A (zh) * | 2020-12-01 | 2021-03-12 | 国网福建省电力有限公司 | 基于小波变换的Holt-Winters和LSTM组合模型的电力负荷预测方法 |
AU2020104000A4 (en) * | 2020-12-10 | 2021-02-18 | Guangxi University | Short-term Load Forecasting Method Based on TCN and IPSO-LSSVM Combined Model |
Non-Patent Citations (2)
Title |
---|
The applicability of LSTM-KNN model for real-time flood Forecasting in Different Climate Zones in China;Liu, MY 等;《WATER》;第12卷(第2期);440 * |
基于LSTM⁃Prophet 非线性组合的时间序列预测模型;赵英 等;《计算机与现代化》(第9期);6-18 * |
Also Published As
Publication number | Publication date |
---|---|
CN113283155A (zh) | 2021-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113283155B (zh) | 一种近地表气温估算方法、系统、存储介质及设备 | |
Premalatha et al. | Analysis of different combinations of meteorological parameters in predicting the horizontal global solar radiation with ANN approach: A case study | |
CN111310968A (zh) | 一种基于互信息的lstm神经网络循环水文预报方法 | |
Stathopoulos et al. | Wind power prediction based on numerical and statistical models | |
CN110210644A (zh) | 基于深度神经网络集成的交通流量预测方法 | |
CN111260111B (zh) | 基于气象大数据的径流预报改进方法 | |
CN113379107B (zh) | 基于lstm和gcn的区域电离层tec预报方法 | |
CN111401602A (zh) | 基于神经网络的卫星以及地面降水测量值同化方法 | |
CN113108918B (zh) | 一种极轨气象卫星热红外遥感数据反演气温方法 | |
CN109472283B (zh) | 一种基于多重增量回归树模型的危险天气预测方法和装置 | |
CN109359404A (zh) | 基于经验小波消噪和神经网络融合的中长期径流预报方法 | |
CN111428942A (zh) | 基于变网格技术提取微地形因子的线路覆冰厚度预测方法 | |
CN113139327A (zh) | 一种基于gru网络模型的电离层tec单点预测方法及系统 | |
CN117891005A (zh) | 基于微气象因素时间序列的导地线覆冰预测方法及系统 | |
Dkengne et al. | A limiting distribution for maxima of discrete stationary triangular arrays with an application to risk due to avalanches | |
Terasaki et al. | Multi-year analysis using the NICAM-LETKF data assimilation system | |
CN114529035A (zh) | 一种基于cart的多模式集成模型的风速预报方法 | |
Mazorra-Aguiar et al. | Solar radiation forecasting with statistical models | |
Wang et al. | A data‐driven approach for flood prediction using grid‐based meteorological data | |
CN112561133A (zh) | 一种基于神经网络的水流量预测系统和方法 | |
Gupta et al. | Solar energy radiation forecasting method | |
Liu et al. | Gridded statistical downscaling based on interpolation of parameters and predictor locations for summer daily precipitation in North China | |
Ðalto et al. | Neural-network-based ultra-short-term wind forecasting | |
CN112734073A (zh) | 一种基于长短期记忆网络的光伏发电功率短期预测方法 | |
CN115936236A (zh) | 一种卷烟厂能耗预测方法、系统、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |