CN115951430A - 一种基于lstm的地磁指数预报方法 - Google Patents
一种基于lstm的地磁指数预报方法 Download PDFInfo
- Publication number
- CN115951430A CN115951430A CN202310244079.1A CN202310244079A CN115951430A CN 115951430 A CN115951430 A CN 115951430A CN 202310244079 A CN202310244079 A CN 202310244079A CN 115951430 A CN115951430 A CN 115951430A
- Authority
- CN
- China
- Prior art keywords
- solar
- magnetic field
- geomagnetic
- training
- solar activity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013277 forecasting method Methods 0.000 title claims abstract description 7
- 230000000694 effects Effects 0.000 claims abstract description 105
- 238000012549 training Methods 0.000 claims abstract description 57
- 238000000034 method Methods 0.000 claims abstract description 41
- 230000004907 flux Effects 0.000 claims abstract description 34
- 230000007613 environmental effect Effects 0.000 claims abstract description 24
- 238000000137 annealing Methods 0.000 claims abstract description 8
- 238000005457 optimization Methods 0.000 claims abstract description 8
- 239000013598 vector Substances 0.000 claims description 35
- 230000002159 abnormal effect Effects 0.000 claims description 14
- 238000012795 verification Methods 0.000 claims description 12
- 238000004140 cleaning Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 7
- 210000002780 melanosome Anatomy 0.000 claims description 6
- 238000005192 partition Methods 0.000 claims description 6
- 239000002131 composite material Substances 0.000 claims description 4
- 230000003203 everyday effect Effects 0.000 claims description 4
- 230000004931 aggregating effect Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 210000003061 neural cell Anatomy 0.000 claims description 3
- 238000013528 artificial neural network Methods 0.000 abstract description 7
- 239000010410 layer Substances 0.000 description 13
- 230000015654 memory Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000002354 daily effect Effects 0.000 description 4
- 230000005358 geomagnetic field Effects 0.000 description 4
- 230000000737 periodic effect Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 3
- 230000005855 radiation Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 239000002356 single layer Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 238000002679 ablation Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及太空环境预报技术领域,尤其涉及一种基于LSTM的地磁指数预报方法,包括:获取多个维度的与地磁Ap指数相关的环境数据;环境数据至少包括:地磁Ap指数历史值、10.7cm太阳射电通量、太阳黑子数、太阳活动区和太阳X射线;对环境数据进行特征工程,生成特征参数;将特征参数输入预先训练的LSTM预测模型,输出地磁Ap指数的预报结果;其中,LSTM预测模型的算法策略包括:通过多模型进行联合预测,得到多步长,单一变量的输出策略;LSTM预测模型的训练策略包括:以均方根差作为目标函数,基于预设优化算法、退火策略和超参数搜索策略进行训练。本申请中将环境数据转化为多维特征,保证环境信息被LSTM神经网络更好的学习和分析,得到更准确的预测结果。
Description
技术领域
本申请涉及太空环境预报技术领域,尤其涉及一种基于LSTM(Long short-termmemory, 长短期记忆网络)的地磁指数预报方法。
背景技术
地磁Ap指数是全球的全日地磁扰动强度的指数,称为行星性等效日幅度。它描述一个自然日(世界时)地磁场的扰动幅度,是通过一些典型的高位地磁台站所测量的当地的地磁扰动幅度,经过平均后得到的一天(UT)平均值,单位是:纳特(nT)。
地磁Ap指数是地磁活动水平的重要指标,也是多种重要科学和工程模式的主要输入参量。近年来,由于空间天气对卫星轨道、通讯、导航等领域的影响日益凸显,空间天气重要指标的预报也受到重视。地磁Ap指数指的是在去掉地磁场背景波动后得到的地磁场H分量的变化幅度折合而成的指数参量,通过8个中高纬地磁台站的测量结果计算得到的。地磁Ap指数反映的是一天的地磁活动指标,它是一天中每小时的指数的平均值,而指数是指波动的情况,与短时的地磁亚暴过程密切相关,因此指数的大小决定于极区能量注入,与太阳风和行星际磁场密切相关。
在空间天气业务预报中,地磁Ap指数的短期预报是重要的工作内容。相关技术中,对地磁Ap指数的预报多以时间序列趋势预报为主,这种预报方式定性预报的成分较多,并没有达到定量预报的目标,导致预报结果准确性低,精确度低。
发明内容
为至少在一定程度上克服相关技术中对地磁Ap指数的预报结果准确性低,精确度低问题,本申请提供一种基于LSTM的地磁指数预报方法。
本申请的方案如下:
一种基于LSTM的地磁指数预报方法,包括:
获取多个维度的与地磁Ap指数相关的环境数据;所述环境数据至少包括:地磁Ap指数历史值、10.7cm太阳射电通量、太阳黑子数、太阳活动区和太阳X射线;
对所述环境数据进行特征工程,生成特征参数;
将所述特征参数输入预先训练的LSTM预测模型,输出地磁Ap指数的预报结果;
其中,所述LSTM预测模型的算法策略包括:通过多模型进行联合预测,执行多步长,单一变量的输出策略;
所述LSTM预测模型的训练策略包括:以均方根差作为目标函数,基于预设优化算法、退火策略和超参数搜索策略进行训练。
优选地,所述方法还包括:
获取多个维度的与地磁Ap指数相关的历史环境数据作为样本数据;所述历史环境数据至少包括:地磁Ap指数历史值、10.7cm太阳射电通量、太阳黑子数、太阳活动区和太阳X射线;
对样本数据进行特征工程,生成特征参数;
根据处理后的特征参数训练所述LSTM预测模型。
优选地,将所述样本数据处理成特征参数,包括:
对地磁Ap指数历史值进行提取清洗,去除异常值得到地磁Ap指数的特征参数;
获取10.7cm太阳射电通量历史数据中的10.7cm太阳射电通量观测值,对10.7cm太阳射电通量观测值进行提取清洗,去除异常值得到10.7cm太阳射电通量的特征参数;
对太阳黑子数进行提取清洗,去除异常值得到太阳黑子数的特征参数;
对太阳X射线的全部卫星数据以天为单位进行聚合,去除异常值后,取每天全部卫星数据中的最大值作为太阳X射线的特征参数;所述太阳X射线的特征参数包括:长波通量和短波通量。
优选地,将所述样本数据处理成特征参数,还包括:
以预设经纬线作为分界线,对太阳表面区域进行分割,得到多个分割区域;
依据磁场类型对太阳活动区进行分解,确定需要的太阳活动区磁场类型;
根据分割区域和太阳活动区磁场类型,生成多个维度的太阳活动区向量;
确定各维度太阳活动区向量的初始值;
根据各分割区域存在对应磁场类型太阳活动区的个数以及黑子群的相对大小对各维度太阳活动区的初始值进行更新;
将各维度太阳活动区向量的更新值作为太阳活动区的特征参数。
优选地,依据磁场类型对太阳活动区进行分解,确定需要的太阳活动区磁场类型,包括:
根据黑子群的磁场类型将包含黑子群的太阳活动区划分为基础磁场类型和复合磁场类型;
将复合磁场类型分解为多个基础磁场类型的组合;
将不包含黑子群的太阳活动区视为基础磁场类型,将全部基础磁场类型确定为需要的太阳活动区磁场类型。
优选地,确定各维度太阳活动区向量的值,包括:若当前维度太阳活动区向量对应区域中存在对应磁场类型的太阳活动区,则当前维度值为1,否则为0。
优选地,根据各分割区域存在对应磁场类型太阳活动区的个数以及黑子群的相对大小对各维度太阳活动区的初始值进行更新的计算公式为:
其中,表示太阳活动区磁场类型,表示太阳活动区向量的初始值,表示太阳活动区向量的更新值,表示当前分割区域中磁场类型的太阳活动区个数,表示当前分割区域中第个磁场类型的太阳活动区的黑子群相对面积;H-α型为不包含黑子群的太阳活动区磁场类型;α,β,γ,δ型为包含黑子群的太阳活动区磁场类型。
优选地,根据处理后的特征参数训练所述LSTM预测模型,包括:
将处理后的特征参数依据时间区间划分为训练集和验证集;
将所述训练集按照地磁Ap指数的大小等间距划分为多个区间;
将所述训练集在全区间上进行均等划分,得到多个子集;
将其中一个子集作为验证子集,其他子集作为训练子集进行训练,得到多个子模型;
基于全部子模型进行联合预测,通过所述验证集验证预测结果,在预测结果符合预设要求时完成训练。
优选地,所述子模型采用单一步长单一输出的策略;
所述方法还包括:
根据地磁Ap指数预报结果的需求天数提升子模型的训练数量。
优选地,在训练所述LSTM预测模型时,参与调整的超参数至少包括:隐藏层维度、隐藏层深度、训练神经细胞开关比例、序列长度、批样本数量、训练轮数、最大学习率和l2正则系数。
本申请提供的技术方案可以包括以下有益效果:本申请中的基于LSTM的地磁Ap指数预报方法,包括:获取多个维度的与地磁Ap指数相关的环境数据;环境数据至少包括:地磁Ap指数历史值、10.7cm太阳射电通量、太阳黑子数、太阳活动区和太阳X射线;对环境数据进行特征工程,生成特征参数;将特征参数输入预先训练的LSTM预测模型,输出地磁Ap指数的预报结果;其中,LSTM预测模型的算法策略包括:通过多模型进行联合预测,得到多步长,单一变量的输出策略;LSTM预测模型的训练策略包括:以均方根差作为目标函数,基于预设优化算法、退火策略和超参数搜索策略进行训练。本申请中的技术方案,与现有的预测方法相比,基于LSTM神经网络的预测模型具备更高的预测精确度。将环境数据转化为多维特征,保证环境信息被LSTM神经网络更好的学习和分析,得到更准确的预测结果。并且,多模型联合预测的集成算法可以进一步提高模型的预测精确度。本申请的训练策略也可以加快模型收敛速度,避免模型收敛于局部最优解,在减少训练时间成本的同时,提高了模型的预测性能。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是本申请一个实施例提供的一种基于LSTM的地磁Ap指数预报方法的流程示意图;
图2是本申请一个实施例提供的一种基于LSTM的地磁指数预报方法中的单层LSTM单个循环结构示意图;
图3是本申请一个实施例提供的一种基于LSTM的地磁指数预报方法中训练LSTM预测模型的流程示意图;
图4是本申请一个实施例提供的一种基于LSTM的地磁指数预报方法中获取太阳活动区的特征参数的流程示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
图1是本申请一个实施例提供的一种基于LSTM的地磁指数预报方法的流程示意图,参照图1,一种基于LSTM的地磁指数预报方法,包括:
S11:获取多个维度的与地磁Ap指数相关的环境数据;所述环境数据至少包括:地磁Ap指数历史值、10.7cm太阳射电通量、太阳黑子数、太阳活动区和太阳X射线;
S12:对环境数据进行特征工程,生成特征参数;
S13:将特征参数输入预先训练的LSTM预测模型,输出地磁Ap指数的预报结果;
其中,LSTM预测模型的算法策略包括:通过多模型进行联合预测,执行多步长,单一变量的输出策略;
LSTM预测模型的训练策略包括:以均方根差作为目标函数,基于预设优化算法、退火策略和超参数搜索策略进行训练。
需要说明的是,LSTM是一种重要且常用的循环神经网络,在语音识别,以及时间序列相关领域都有广泛的应用。单层LSTM单个循环结构参照图2。
LSTM参数定性说明:
LSTM循环结构的数学描述:
遗忘门:
输入门:
输出门:
参数更新:
LSTM网络为现有技术中已经成熟的技术手段,此处不做赘述。
在具体实践中,LSTM预测模型的训练策略的优化算法可以但不限于选用Adam优化算法(Adaptive momentum,自适应动量)和SGD(Stochastic Gradient Descent,随机梯度下降)优化算法;退火策略可以但不限于选用onecycle退火策略和余弦退火等策略;超参数的搜索策略可以但不限于选用小范围的网格搜索以及early_stop等方法。
需要说明的是,在训练所述LSTM预测模型时,参与调整的超参数至少包括:隐藏层维度、隐藏层深度、训练神经细胞开关比例、序列长度、批样本数量、训练轮数、最大学习率和l2正则系数。
需要说明的是,本实施例中是对地磁Ap指数进行短期预测,输出的地磁Ap指数的预报结果一般为1-3天。举例对本实施例中的LSTM预测模型的算法策略进行解释说明:
本实施例中的LSTM预测模型的算法策略即通过多个子模型进行联合预测,各子模型采用单一步长单一输出的策略。一步长即为一天,一个子模型只输出一天的预报结果,一天可以通过多个子模型进行联合预测。
例如当前日为10月1号,需要对10月2号的地磁Ap指数进行预报,则通过5个子模型A进行联合预测,得到10月2号的地磁Ap指数预报结果。
若需要对10月2号-4号的地磁Ap指数进行预报时,则每天均需要通过5个子模型进行联合预测,即通过5个子模型A对10月2号的地磁Ap指数进行预报,5个子模型B对10月3号的地磁Ap指数进行预报,5个子模型C对10月4号的地磁Ap指数进行预报。
需要说明的是,参照图3,本实施例中训练LSTM预测模型的方法包括:
S21:获取多个维度的与地磁Ap指数相关的历史环境数据作为样本数据;所述历史环境数据至少包括:地磁Ap指数历史值、10.7cm太阳射电通量、太阳黑子数、太阳活动区和太阳X射线;
S22:对样本数据进行特征工程,生成特征参数;
具体的,对样本数据进行特征工程,生成特征参数,包括:
对地磁Ap指数历史值进行提取清洗,去除异常值得到地磁Ap指数的特征参数;
获取10.7cm太阳射电通量历史数据中的10.7cm太阳射电通量观测值,对10.7cm太阳射电通量观测值进行提取清洗,去除异常值得到10.7cm太阳射电通量的特征参数;
对太阳黑子数进行提取清洗,去除异常值得到太阳黑子数的特征参数;
对太阳X射线的全部卫星数据以天为单位进行聚合,去除异常值后,取每天全部卫星数据中的最大值作为太阳X射线的特征参数;所述太阳X射线的特征参数包括:长波通量和短波通量。
需要说明的是:
1)历史的观测数据显示地磁Ap指数随太阳活动水平存在着11年的长周期性变化,随着太阳的自转存在着27天的短周期性变化,因此地磁Ap指数的历史值对新值的预测有着重要的作用。
并且,基于消融实验得知,在模型的训练参数中加入地磁Ap指数历史值可以明显的提升模型的预测精确度。
2)10.7cm太阳射电通量的测量是在地面以2800 兆赫兹为中心的 100 兆赫频带上,在一个小时内测定的太阳射电辐射强度的平均值。10.7cm太阳射电通量与太阳表面的活动紧密相关,同样存在着11年和27天的长短周期性变化规律,是表征太阳活动的重要指数,而地磁场扰动与太阳的活跃水平存在着强关联性。
10.7cm太阳射电通量历史记录包含观测值和调整值,考虑到到太阳对地磁的影响与地日距离有关系,本实施例中直接采用10.7cm太阳射电通量观测值作为训练模型的特征参数。
3)黑子是太阳强磁场区域,是太阳光球上的低温区。由于磁化等离子体中的对流受到抑制,导致黑子的温度和辐射都低于周围气体,因此黑子与周围相比呈现为光学暗区。单个黑子寿命为几小时到几个星期,黑子群寿命一般可达到几个月。太阳黑子数反映着太阳活动水平的高低,呈现11年周期性变化。
4)太阳X射线通常在太阳大耀斑爆发过程中,相比较其它波段的电磁辐射,太阳X射线波段的辐射相对于耀斑发生之前会有几个量级的增强。
太阳X射线历史数据是从高斯卫星的历史观测数据中提取清洗得到。具体的提取方式是对高斯系列所有的单颗卫星数据以天为单位进行聚合:去除异常值后,取同一天所有卫星的所有数据中最大值作为该日的参数值。高斯卫星数据中合包含长波通量(0.1-0.8nm)和短波通量(0.05-0.4nm),本实施例中将其作为两个独立的参数分别进行计算,因此与太阳X射线相关的特征参数有两个。
将样本数据处理成特征参数,还包括:
5)获取太阳活动区的特征参数,参照图4,包括:
S31:以预设经纬线作为分界线,对太阳表面区域进行分割,得到多个分割区域;
S32:依据磁场类型对太阳活动区进行分解,确定需要的太阳活动区磁场类型;
S33:根据分割区域和太阳活动区磁场类型,生成多个维度的太阳活动区向量;
S34:确定各维度太阳活动区向量的初始值;
S35:根据各分割区域存在对应磁场类型太阳活动区的个数以及黑子群的相对大小对各维度太阳活动区的初始值进行更新;
S36:将各维度太阳活动区向量的更新值作为太阳活动区的特征参数。
在具体实践中,空间天气预报中心将前一天的观测到的太阳活动区图片数据整理为每日报告。本实施例中将所有的历史日报数据整理为表格形式的数据。在数据中太阳活动区可分为两种类型:第一类为可见黑子群的太阳活动区,这部分数据主要包含了太阳活动区存在的时间、空间(经纬度位置)、黑子群相对大小、活跃区域磁场类型等信息;第二类为H-α波段存在光斑但不可见黑子群的太阳活动区,这种活动区是由可见黑子群的太阳活动区演化而来,对应数据中提供了活动区存在的时间、空间(经纬度位置)等信息。
以预设经纬线作为分界线,对太阳表面区域进行分割,得到多个分割区域,包括:
地球可观测太阳表面经度范围为西经90度(W90)到东经90度(E90),纬度范围为北纬90度(N90)—南纬90度(S90)。本实施例中可以将西经经度和南纬纬度均转化为负值,则太阳表面的经纬度范围均为[-90,90]。
在具体实践中,对全体样本数据进行观察,可以发现少量样本其经度在区间[-90,90]之外,属于违背物理实事异常点。本实施例中将这些异常点的位置调整至区间的边界点处,例如:A活动区域的经度为-99,则将其调整为-90。
完成异常样本的空间调整后,以预设经纬线作为分界线,对太阳表面的区域进行分割。在具体实践中,预设经度分界线为-45,-30,-15,0和+45,这5条分界线将太阳表面划分为6个纵向的大区域,分别对应着经度区间[-90,-45),[-45,-30),[-30,-15),[-15,0),[0,45),[45,90];预设纬度分界线为-30,0和30,这3条分界线又将6个大区域分割成了24个小的区域。
对这24个小区域进行编号,0-23分别对应不同的区域。
依据磁场类型对太阳活动区进行分解,确定需要的太阳活动区磁场类型包括:
根据黑子群的磁场类型将包含黑子群的太阳活动区划分为基础磁场类型和复合磁场类型;
将复合磁场类型分解为多个基础磁场类型的组合;
将不包含黑子群的太阳活动区视为基础磁场类型,将全部基础磁场类型确定为需要的太阳活动区磁场类型。
结合太阳活动区类型和黑子磁场类型将太阳活动区分为5类:
包含黑子群的太阳活动区:
现有技术中将黑子的磁场类型划分为了8种,其基础磁场类型有4种,分别为α型(单极性黑子群),β型(偶极性黑子群),γ型(正负极性无规则分布),δ型(一个半影中的黑子本影具有不同极性)四种。其余黑子群的磁场类型为几类基础类型的组合(如β-δ、β-γ-δ等)。
本实施例中将黑子群为复合磁场类型的太阳活动区分解为多个基础磁场类型的太阳活动区,例如在9区存在一个磁场为β-δ型的活动区,则认为9区存在一个β型加一个δ型两个活动区。
这样便可以将所有的包含黑子群的太阳活动区都分解为α,β,γ,δ四种基础磁类型的太阳活动区。
不包含黑子群的太阳活动区:
本实施例中将不包含黑子群的太阳活动区视为一个单独类型的太阳活动区,用H-α型来表示。将H-α型视为一种基础类型,与上述基础磁场类型并列便得到了α,β,γ,δ,H-α五种基础类型的太阳活动区。
确定各维度太阳活动区向量的值,包括:若当前维度太阳活动区向量对应区域中存在对应磁场类型的太阳活动区,则当前维度值为1,否则为0。
在具体实践中,首先使用独热编码的方式生成了120个维度的太阳活动区向量,太阳活动区向量数量为分割区域数量与太阳活动区磁场类型数量的乘积;即120个维度的太阳活动区向量由24个分割区域24维乘以5个太阳活动区磁场类型得到。
此时每个维度的太阳活动区向量的初始值非0即1:若当前维度太阳活动区向量对应区域中存在对应磁场类型的太阳活动区,则当前维度值为1,否则为0。例如,2020年1月1日,分割区域7区中,存在β型的太阳活动区,不存在α型的太阳活动区,则这一天的7区-β型维度的初始值为1,7区-α型维度的初始值为0。
根据各分割区域存在对应磁场类型太阳活动区的个数以及黑子群的相对大小对各维度太阳活动区的初始值进行更新的计算公式为:
其中,表示太阳活动区磁场类型,表示太阳活动区向量的初始值,表示太阳活动区向量的更新值,表示当前分割区域中磁场类型的太阳活动区个数,表示当前分割区域中第个磁场类型的太阳活动区的黑子群相对面积;H-α型为不包含黑子群的太阳活动区磁场类型;α,β,γ,δ型为包含黑子群的太阳活动区磁场类型。
对于H-α型的活跃区域,更新值为对应空间中存在H-α型活跃区域的个数。例如2020年1月1日,分割区域7区中,存在H-α型活跃区域3个,则7区-H-α型对应维度的输入值为3。
对于α,β,γ,δ型活跃区域,更新值为对应空间中的某型活跃区域黑子群相对面积总和。例如2020年1月1日,分割区域8区中,存在α型活跃区域2个,两个α型区域的黑子群大小分别为100和200,则8区-α型对应维度的输入值为300(100+200=300)。
经过上面的处理,将一天的太阳活动区图像数据信息转化为了一个高纬的特征向量(即各维度太阳活动区向量的更新值),将各维度太阳活动区向量的更新值作为太阳活动区的特征参数。
优选地,本实施例中还对特征参数进行清洗和匹配。
本实施例中的特征参数中,包含1个地磁Ap指数特征参数、1个10.7cm太阳射电通量特征参数、1个太阳黑子数特征参数、若干个太阳活动区特征参数和2个太阳X射线特征参数。
首先对对地磁Ap指数特征参数和太阳X射线特征参数进行对数处理:
考虑到LSTM神经网络对输入参数的敏感性,对所有特征参数都进行数值标准化:
S23:根据处理后的特征参数训练LSTM预测模型。
包括:
将处理后的特征参数依据时间区间划分为训练集和验证集;
将训练集按照地磁Ap指数的大小等间距划分为多个区间;
将训练集在全区间上进行均等划分,得到多个子集;
将其中一个子集作为验证子集,其他子集作为训练子集进行训练,得到多个子模型;
基于全部子模型进行联合预测,通过验证集验证预测结果,在预测结果符合预设要求时完成训练。
在具体实践中,可以将1996年至2017年的数据作为训练集,将2018年至2020年的数据作为验证集。根据RiceRule将训练集按照地磁Ap指数的大小等间距划分为40个区间。然后将训练集在全区间上进行了均等划分,分成5个子集,其中4个子集作为训练子集,1个子集作为验证子集,共可生成5组训练-验证样本对,每组样本对用来训练一个子模型,共训练出一组5个子模型,以进行等权重的联合预测。最后通过验证集验证预测结果,在预测结果符合预设要求时完成训练。
优选地,本实施例中采用了比较标准的回归预测评价体系,评价指标包括mre,mae,rmse,mape,CC等。
在具体实践中,子模型采用单一步长单一输出的策略;
方法还包括:
根据地磁Ap指数预报结果的需求天数提升子模型的训练数量。
需要说明的是,本实施例的子模型在输出上采用了单一步长单一输出的策略,即每个子模型只能输出一天的一个预测结果。而地磁Ap指数预报结果往往需要未来几天(如三天)的短期预测,因此要实现地磁Ap指数未来三天的短期预测,共需要训练3组15个子模型(每组5个),每组子模型专门用来预测某一天的指数值。这种输出方案的优势在于具有更高的预测精确度。
本申请中的技术方案,与现有的预测方法相比,基于LSTM神经网络的预测模型具备更高的预测精确度。环境数据包括多种维度,保证环境信息被LSTM神经网络更好的学习和分,根据多维度的环境数据得到的地磁Ap指数预报结果更准确。并且,多模型联合预测的集成算法可以进一步提高模型的预测精确度。本申请的训练策略也可以加快模型收敛速度,避免模型收敛于局部最优解,在减少训练时间成本的同时,提高了模型的预测性能。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本申请的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种基于LSTM的地磁指数预报方法,其特征在于,包括:
获取多个维度的与地磁Ap指数相关的环境数据;所述环境数据至少包括:地磁Ap指数历史值、10.7cm太阳射电通量、太阳黑子数、太阳活动区和太阳X射线;
对所述环境数据进行特征工程,生成特征参数;
将所述特征参数输入预先训练的LSTM预测模型,输出地磁Ap指数的预报结果;
其中,所述LSTM预测模型的算法策略包括:通过多模型进行联合预测,执行多步长,单一变量的输出策略;
所述LSTM预测模型的训练策略包括:以均方根差作为目标函数,基于预设优化算法、退火策略和超参数搜索策略进行训练。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取多个维度的与地磁Ap指数相关的历史环境数据作为样本数据;所述历史环境数据至少包括:地磁Ap指数历史值、10.7cm太阳射电通量、太阳黑子数、太阳活动区和太阳X射线;
对样本数据进行特征工程,生成特征参数;
根据处理后的特征参数训练所述LSTM预测模型。
3.根据权利要求2所述的方法,其特征在于,将所述样本数据处理成特征参数,包括:
对地磁Ap指数历史值进行提取清洗,去除异常值得到地磁Ap指数的特征参数;
获取10.7cm太阳射电通量历史数据中的10.7cm太阳射电通量观测值,对10.7cm太阳射电通量观测值进行提取清洗,去除异常值得到10.7cm太阳射电通量的特征参数;
对太阳黑子数进行提取清洗,去除异常值得到太阳黑子数的特征参数;
对太阳X射线的全部卫星数据以天为单位进行聚合,去除异常值后,取每天全部卫星数据中的最大值作为太阳X射线的特征参数;所述太阳X射线的特征参数包括:长波通量和短波通量。
4.根据权利要求2所述的方法,其特征在于,将所述样本数据处理成特征参数,还包括:
以预设经纬线作为分界线,对太阳表面区域进行分割,得到多个分割区域;
依据磁场类型对太阳活动区进行分解,确定需要的太阳活动区磁场类型;
根据分割区域和太阳活动区磁场类型,生成多个维度的太阳活动区向量;
确定各维度太阳活动区向量的初始值;
根据各分割区域存在对应磁场类型太阳活动区的个数以及黑子群的相对大小对各维度太阳活动区的初始值进行更新;
将各维度太阳活动区向量的更新值作为太阳活动区的特征参数。
5.根据权利要求4所述的方法,其特征在于,依据磁场类型对太阳活动区进行分解,确定需要的太阳活动区磁场类型,包括:
根据黑子群的磁场类型将包含黑子群的太阳活动区划分为基础磁场类型和复合磁场类型;
将复合磁场类型分解为多个基础磁场类型的组合;
将不包含黑子群的太阳活动区视为基础磁场类型,将全部基础磁场类型确定为需要的太阳活动区磁场类型。
6.根据权利要求4所述的方法,其特征在于,确定各维度太阳活动区向量的值,包括:若当前维度太阳活动区向量对应区域中存在对应磁场类型的太阳活动区,则当前维度值为1,否则为0。
8.根据权利要求2所述的方法,其特征在于,根据处理后的特征参数训练所述LSTM预测模型,包括:
将处理后的特征参数依据时间区间划分为训练集和验证集;
将所述训练集按照地磁Ap指数的大小等间距划分为多个区间;
将所述训练集在全区间上进行均等划分,得到多个子集;
将其中一个子集作为验证子集,其他子集作为训练子集进行训练,得到多个子模型;
基于全部子模型进行联合预测,通过所述验证集验证预测结果,在预测结果符合预设要求时完成训练。
9.根据权利要求8所述的方法,其特征在于,所述子模型采用单一步长单一输出的策略;
所述方法还包括:
根据地磁Ap指数预报结果的需求天数提升子模型的训练数量。
10.根据权利要求1所述的方法,其特征在于,在训练所述LSTM预测模型时,参与调整的超参数至少包括:隐藏层维度、隐藏层深度、训练神经细胞开关比例、序列长度、批样本数量、训练轮数、最大学习率和l2正则系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310244079.1A CN115951430B (zh) | 2023-03-15 | 2023-03-15 | 一种基于lstm的地磁指数预报方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310244079.1A CN115951430B (zh) | 2023-03-15 | 2023-03-15 | 一种基于lstm的地磁指数预报方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115951430A true CN115951430A (zh) | 2023-04-11 |
CN115951430B CN115951430B (zh) | 2023-06-06 |
Family
ID=85891408
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310244079.1A Active CN115951430B (zh) | 2023-03-15 | 2023-03-15 | 一种基于lstm的地磁指数预报方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115951430B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116882594A (zh) * | 2023-09-06 | 2023-10-13 | 数字太空(北京)智能技术研究院有限公司 | 基于有限递归和深度学习的地磁ap指数中期预报方法 |
CN117669335A (zh) * | 2024-02-01 | 2024-03-08 | 北京国星创图科技有限公司 | 一种基于太空环境数据挖掘方法及系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060229813A1 (en) * | 2005-03-30 | 2006-10-12 | Tobiska William K | Ionospheric forecast system (IFS) |
CN107390297A (zh) * | 2017-07-14 | 2017-11-24 | 昆明医科大学第附属医院 | 利用多重空间天气观测数据预警地磁暴诱发心脑血管事件的方法 |
KR102059472B1 (ko) * | 2018-11-29 | 2019-12-30 | 대한민국 | 태양 코로나홀 정보를 이용한 지자기 교란 강도 예측 시스템 및 방법 |
CN111160646A (zh) * | 2019-12-30 | 2020-05-15 | 北京航空航天大学 | 一种基于深度学习框架的全球电离层总电子含量预测方法 |
CN111967679A (zh) * | 2020-08-20 | 2020-11-20 | 江苏师范大学 | 基于tcn模型的电离层总电子含量预报方法 |
CN112257847A (zh) * | 2020-10-16 | 2021-01-22 | 昆明理工大学 | 一种基于CNN和LSTM预测地磁Kp指数的方法 |
CN113379107A (zh) * | 2021-05-26 | 2021-09-10 | 江苏师范大学 | 基于lstm和gcn的区域电离层tec预报方法 |
CN113569201A (zh) * | 2021-08-05 | 2021-10-29 | 数字太空(北京)智能技术研究院有限公司 | 地磁Ap指数预报方法、装置及电子设备 |
CN114065845A (zh) * | 2021-11-02 | 2022-02-18 | 中国人民解放军63770部队 | 基于Stacking集成学习的太阳10.7cm射电流量中期预报方法 |
CN114781744A (zh) * | 2022-05-07 | 2022-07-22 | 东南大学 | 基于编码解码器的深度学习多步长辐照度预测方法 |
-
2023
- 2023-03-15 CN CN202310244079.1A patent/CN115951430B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060229813A1 (en) * | 2005-03-30 | 2006-10-12 | Tobiska William K | Ionospheric forecast system (IFS) |
CN107390297A (zh) * | 2017-07-14 | 2017-11-24 | 昆明医科大学第附属医院 | 利用多重空间天气观测数据预警地磁暴诱发心脑血管事件的方法 |
KR102059472B1 (ko) * | 2018-11-29 | 2019-12-30 | 대한민국 | 태양 코로나홀 정보를 이용한 지자기 교란 강도 예측 시스템 및 방법 |
CN111160646A (zh) * | 2019-12-30 | 2020-05-15 | 北京航空航天大学 | 一种基于深度学习框架的全球电离层总电子含量预测方法 |
CN111967679A (zh) * | 2020-08-20 | 2020-11-20 | 江苏师范大学 | 基于tcn模型的电离层总电子含量预报方法 |
CN112257847A (zh) * | 2020-10-16 | 2021-01-22 | 昆明理工大学 | 一种基于CNN和LSTM预测地磁Kp指数的方法 |
CN113379107A (zh) * | 2021-05-26 | 2021-09-10 | 江苏师范大学 | 基于lstm和gcn的区域电离层tec预报方法 |
CN113569201A (zh) * | 2021-08-05 | 2021-10-29 | 数字太空(北京)智能技术研究院有限公司 | 地磁Ap指数预报方法、装置及电子设备 |
CN114065845A (zh) * | 2021-11-02 | 2022-02-18 | 中国人民解放军63770部队 | 基于Stacking集成学习的太阳10.7cm射电流量中期预报方法 |
CN114781744A (zh) * | 2022-05-07 | 2022-07-22 | 东南大学 | 基于编码解码器的深度学习多步长辐照度预测方法 |
Non-Patent Citations (2)
Title |
---|
李志刚等: "空天地海一体化海洋环境数据多步预测", 《信号处理》 * |
梁波等: "基于多变量LSTM 网络的太阳黑子活动预测分析", 《天文研究与技术》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116882594A (zh) * | 2023-09-06 | 2023-10-13 | 数字太空(北京)智能技术研究院有限公司 | 基于有限递归和深度学习的地磁ap指数中期预报方法 |
CN116882594B (zh) * | 2023-09-06 | 2023-12-01 | 数字太空(北京)智能技术研究院有限公司 | 基于有限递归和深度学习的地磁ap指数中期预报方法 |
CN117669335A (zh) * | 2024-02-01 | 2024-03-08 | 北京国星创图科技有限公司 | 一种基于太空环境数据挖掘方法及系统 |
CN117669335B (zh) * | 2024-02-01 | 2024-05-07 | 北京国星创图科技有限公司 | 一种太空环境数据挖掘方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115951430B (zh) | 2023-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ruwali et al. | Implementation of hybrid deep learning model (LSTM-CNN) for ionospheric TEC forecasting using GPS data | |
CN115951430B (zh) | 一种基于lstm的地磁指数预报方法 | |
Anderson | A non-Gaussian ensemble filter update for data assimilation | |
CN113496104A (zh) | 基于深度学习的降水预报订正方法及系统 | |
CN111797573A (zh) | 一种基于深度学习技术的电离层电子浓度总含量时序预测方法 | |
Campos et al. | Nonlinear wave ensemble averaging in the Gulf of Mexico using neural networks | |
Zhang et al. | An automatic and effective parameter optimization method for model tuning | |
CN113139327B (zh) | 一种基于gru网络模型的电离层tec单点预测方法及系统 | |
CN105974495A (zh) | 利用分类拟合法预判目标区域未来平均云量的方法 | |
Moon et al. | Forecasting the ionospheric F2 parameters over Jeju station (33.43 N, 126.30 E) by using long short-term memory | |
EP3441794B1 (en) | Device and method for obtaining local geomagnetic disturbances at mid-latitudes | |
Mooneyham et al. | SWRL Net: A spectral, residual deep learning model for improving short-term wave forecasts | |
Zhang et al. | QRF4P‐NRT: Probabilistic Post‐Processing of Near‐Real‐Time Satellite Precipitation Estimates Using Quantile Regression Forests | |
Vosper et al. | Deep learning for downscaling tropical cyclone rainfall to hazard‐relevant spatial scales | |
Shenvi et al. | Forecasting of ionospheric total electron content data using multivariate deep LSTM model for different latitudes and solar activity | |
Bruinsma et al. | Thermosphere and satellite drag | |
Khouider et al. | A novel method for interpolating daily station rainfall data using a stochastic lattice model | |
CN116933083A (zh) | 一种电离层总电子含量预测方法、系统、电子设备及介质 | |
Tan et al. | Projected changes of typhoon intensity in a regional climate model: Development of a machine learning bias correction scheme | |
Tian et al. | Estimation model of global ionospheric irregularities: an artificial intelligence approach | |
Qiu et al. | A short-term precipitation prediction model based on spatiotemporal convolution network and ensemble empirical mode decomposition | |
CN111523258B (zh) | 基于MS-Net网络的微地震有效信号初至拾取方法及系统 | |
Hadj-Salah et al. | Towards operational application of Deep Reinforcement Learning to Earth Observation satellite scheduling | |
Nguyen | Deep learning for tropical cyclone formation detection | |
CN116449460B (zh) | 基于卷积UNet和迁移学习的区域月降水预测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230804 Address after: Room 0108, 1st Floor, No. 26 Shangdi Information Road, Haidian District, Beijing, 100085 Patentee after: Digital Space (Beijing) Technology Co.,Ltd. Address before: Room 0112-26, Floor 01, No. 26, Shangdi Xinxin Road, Haidian District, Beijing, 100080 Patentee before: Digital space (Beijing) Intelligent Technology Research Institute Co.,Ltd. |
|
TR01 | Transfer of patent right |