CN113392582B - 日冕物质抛射空间环境事件相似推荐方法及系统 - Google Patents
日冕物质抛射空间环境事件相似推荐方法及系统 Download PDFInfo
- Publication number
- CN113392582B CN113392582B CN202110618970.8A CN202110618970A CN113392582B CN 113392582 B CN113392582 B CN 113392582B CN 202110618970 A CN202110618970 A CN 202110618970A CN 113392582 B CN113392582 B CN 113392582B
- Authority
- CN
- China
- Prior art keywords
- characteristic parameter
- events
- coronal mass
- mass ejection
- cme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 238000004880 explosion Methods 0.000 claims abstract description 7
- 238000004364 calculation method Methods 0.000 claims description 58
- 238000010606 normalization Methods 0.000 claims description 41
- 238000012545 processing Methods 0.000 claims description 34
- 238000012549 training Methods 0.000 claims description 32
- 238000012360 testing method Methods 0.000 claims description 18
- 239000013598 vector Substances 0.000 claims description 14
- 238000012795 verification Methods 0.000 claims description 12
- 239000006185 dispersion Substances 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 7
- 239000000126 substance Substances 0.000 claims description 7
- 101100072002 Arabidopsis thaliana ICME gene Proteins 0.000 claims 2
- 230000006872 improvement Effects 0.000 description 7
- 238000010200 validation analysis Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000010276 construction Methods 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 2
- 206010037844 rash Diseases 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 239000005441 aurora Substances 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/10—Devices for predicting weather conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/12—Timing analysis or timing optimisation
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Evolutionary Computation (AREA)
- Human Resources & Organizations (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Environmental & Geological Engineering (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- Geometry (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Atmospheric Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Ecology (AREA)
- Environmental Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种日冕物质抛射空间环境事件相似推荐方法及系统,该方法包括:在设定时间段内采集CPA、MPA、日冕物质抛射角宽度、线速度、初速度、末速度、20个太阳半径处的速度、日冕物质抛射源区的经纬度坐标、日冕物质抛射爆发当天的F10.7指数以及太阳风平均速度、温度、质子密度、动压、等离子体β值和三个方向的磁场分量,经预处理后得到18种日冕物质抛射事件的特征参数值;再输入预先建立和训练好的CME推荐模型,得到历史相似CME事件以及预测到达时间;CME推荐模型,用于根据每种特征参数的权值对特征参数值进行加权处理,然后与预先建立的CME历史数据库的历史事件进行距离匹配,找到距离最近的历史事件。
Description
技术领域
本发明涉及空间物理和人工智能交叉学科技术领域,尤其涉及日冕物质抛射空间环境事件相似推荐方法及系统,并应用于空间天气预报的现实业务应用中。
背景技术
太阳活动对地球的影响按时间跨度分为三轮攻击,其中日冕物质抛射(CoronalMass Ejections,CMEs)是其中第三轮攻击的主要源头,它是发生在太阳大气中对日球层产生影响的重要喷发现象之一。日冕物质抛射本质是将大量携带磁场的等离子体抛向日地空间,并对太阳的日冕层甚至更多层面都会产生剧烈扰动。当抛射物抵达地球时则被称为行星际日冕物质抛射,这时会对地球磁层造成扰动,压缩磁层的向日面,使得磁层的背日面延伸成尾状。当背日面发生磁重连时,会产生数兆瓦特能量,沿着磁层结构注入地球的上层大气,产生极光,同时这些注入的能量达到一定级别时还会破坏电力的输送装备,造成能量的损耗,严重时会造成大面积断电,不仅如此,还会对人造卫星、导航定位系统以及网络通讯装备造成严重损害,对我们如今日益依赖的网络生活造成巨大影响。
日冕物质抛射通常在爆发后的1-3天内可能会引起近地空间环境效应,因此在日常的预报工作中,日冕物质抛射是否到达地球以及日冕物质抛射到达地球的时间对我们能否做出准确的预报特别有意义。目前大多数针对日冕物质抛射预报工作的研究模式还只是依赖于人工经验预报,而人工经验的预报需要充分考虑历史相似事件的效应,再结合当前事件的独特性,并给出最终的日冕物质抛射预报。目前大部分模型都是预报日冕物质抛射的到达时间,没有推荐功能,且预报时间的误差较大,结果不稳定,有很大的偶然性,而且国内和国外并没有推荐日冕物质抛射空间环境事件的模型系统。
发明内容
本发明的目的在于克服现有技术缺陷,提出了日冕物质抛射空间环境事件相似推荐方法及系统。
为了实现上述目的,本发明提出了一种日冕物质抛射空间环境事件相似推荐方法,所述方法包括:
在设定时间段内采集CPA、MPA、日冕物质抛射角宽度、线速度、初速度、末速度、20个太阳半径处的速度、日冕物质抛射源区的经纬度坐标、日冕物质抛射爆发当天的F10.7指数以及太阳风平均速度、温度、质子密度、动压、等离子体β值和三个方向的磁场分量,经预处理后得到18种日冕物质抛射事件的特征参数值;
将18种日冕物质抛射事件的特征参数值输入预先建立和训练好的CME推荐模型,得到历史相似CME事件以及预测到达时间;
所述CME推荐模型,用于根据每种特征参数的权值对特征参数值进行加权处理,然后与预先建立的CME历史数据库的历史事件进行距离匹配,找到距离最近的历史事件,所述历史事件包括18种特征参数和对应的观测时间。
作为上述方法的一种改进,所述方法还包括预先建立和训练CME推荐模型的步骤;具体包括:
从ICME事件列表和CME列表获取CPA、MPA、日冕物质抛射角宽度、线速度、初速度、末速度、20个太阳半径处的速度、日冕物质抛射源区的经纬度坐标、日冕物质抛射爆发当天的F10.7指数以及太阳风平均速度、温度、质子密度、动压、等离子体β值和三个方向的磁场分量共18种特征参数;
经预处理后得到18种日冕物质抛射事件的特征参数值
对18种特征参数值分别进行归一化处理,得到归一化处理后的特征参数;
将一组归一化处理后的特征参数和对应的实际到达时间组成一个事件,将多个事件组成样本集;
从样本集中分别提取不同的事件分别建立训练集、验证集和测试集;
将训练集的数据依次输入CME推荐模型,分别采用余弦距离和欧氏距离两种距离计算方式进行训练,得到采用余弦距离计算方法的三组特征参数权重组合以及采用欧氏距离计算方法的三组特征参数权重组合;
将两种距离计算方法的特征参数权重组合分别作为验证集输入的特征权重,经判断分别得到每种距离计算方法的最优特征参数权重组合;
将两种距离计算方法的最优特征参数权重组合分别作为测试集输入的特征权重,经判断得到一组最优的特征参数权重组合以及对应的距离计算方法,从而得到训练好的CME推荐模型。
作为上述方法的一种改进,所述预处理包括对采集的太阳风平均速度、温度、质子密度、动压、等离子体β值和三个方向的磁场分量分别求取对应的日平均值。
作为上述方法的一种改进,所述对18种特征参数值分别进行归一化处理,得到归一化处理后的特征参数;具体包括:
对日冕物质抛射角宽度、线速度、初速度、末速度、20个太阳半径处的速度以及太阳风平均速度、温度、质子密度、动压、等离子体β值和F10.7指数分别进行离差标准化处理,得到对应的归一化处理后的参数;
对CPA和MPA采用正弦函数进行归一化处理,得到对应的归一化处理后的参数;
对三个方向的磁场分量以及日冕物质抛射源区的经纬度坐标进行除最大值归一化处理,得到对应的归一化处理后的参数。
作为上述方法的一种改进,所述离差标准化处理,具体包括:
p从1至11,分别对应日冕物质抛射角宽度、线速度、初速度、末速度、20个太阳半径处的速度以及太阳风平均速度、温度、质子密度、动压、等离子体β值和F10.7指数这11种参数的参数值,根据下式得到第p种归一化处理后的参数Xp:
其中,Xp,0表示第p种参数的参数值,Xp,min和Xp,max分别为第p种参数的最小值和最大值。
作为上述方法的一种改进,所述将训练集的数据依次输入CME推荐模型,分别采用余弦距离和欧氏距离两种距离计算方式进行训练,得到采用余弦距离计算方法的三组特征参数权重组合以及采用欧氏距离计算方法的三组特征参数权重组合;具体包括:
步骤1)选定一个特征参数a,将训练集中所有事件的特征参数a的权重均设置为[0,50]的整数,其他17种参数的权重均设置为1,分别计算权重调整后的任意两个事件之间的余弦距离和欧几里得距离;
步骤2)当a的权重小于50时,权重+1,转至步骤1);当a的权重为50时,转至步骤3);
步骤3)得到关于特征参数a不同权重的51个余弦距离和51个欧几里得距离;
步骤4)选取另一个特征参数,重复步骤1)-步骤3),得到另一个参数不同权重的51个余弦距离和51个欧几里得距离;重复步骤4)直至得到该特征向量每个参数不同权值的51个余弦距离和51个欧几里得距离;
步骤5)遍历每个特征参数,重复步骤4)共得到18*51个余弦距离和18*51个欧几里得距离;
步骤6)通过对步骤5)得到的余弦距离和欧几里得距离分别计算平均误差、标准差和均方根误差,并从中选取最小平均绝对误差、最小标准差和最小均方根误差,从而得到采用余弦距离计算方法的三组特征参数权重组合以及采用欧氏距离计算方法的三组特征参数权重组合。
作为上述方法的一种改进,所述将两种距离计算方法的特征参数权重组合分别作为验证集输入的特征权重,经判断分别得到每种距离计算方法的最优特征参数权重组合;具体包括:
对于每种距离计算方法的三组特征参数权重组合分别计算验证集的平均绝对误差,取平均绝对误差最小值对应的特征参数权重组合,从而得到每种距离计算方法的最优特征参数权重组合。
作为上述方法的一种改进,所述将两种距离计算方法的最优特征参数权重组合分别作为测试集输入的特征权重,经判断得到一组最优的特征参数权重组合以及对应的距离计算方法;具体包括:
对于每种距离计算方法的最优特征参数权重组合分别计算测试集的平均绝对误差,取平均绝对误差最小值对应的特征参数权重组合作为最优特征参数权重组合,并将该特征参数权重组合对应的距离计算方法作为最优距离计算方法。
一种日冕物质抛射空间环境事件相似推荐系统,所述系统包括:特征参数采集处理模块、推荐输出模块和CME推荐模型;其中,
所述特征参数采集处理模块,用于在设定时间段内采集CPA、MPA、日冕物质抛射角宽度、线速度、初速度、末速度、20个太阳半径处的速度、日冕物质抛射源区的经纬度坐标、日冕物质抛射爆发当天的F10.7指数以及太阳风平均速度、温度、质子密度、动压、等离子体β值和三个方向的磁场分量,经预处理后得到18种日冕物质抛射事件的特征参数值;
所述推荐输出模块,用于将18种日冕物质抛射事件的特征参数值输入预先建立和训练好的CME推荐模型,得到历史相似CME事件以及预测到达时间;
所述CME推荐模型,用于根据每种特征参数的权值对特征参数值进行加权处理,然后与预先建立的CME历史数据库的历史事件进行距离匹配,找到距离最近的历史事件,所述历史事件包括18种特征参数和对应的观测时间
与现有技术相比,本发明的优势在于:
1、本系统不仅可以预报日冕物质抛射的到地时间,并可以推荐历史相似的日冕物质抛射事件,为当前的空间天气预报业务提供参考;
2、本发明将推荐算法应用在日冕物质抛射预报上,乃至空间天气预报上是一次全新的尝试,并有希望将该系统应用在空间天气预报的其它方面;首次将推荐算法应用到CME到达时间的推荐中,甚至是空间天气预报中;
3、构建系统中,在原有距离计算的过程中,加入参数权重的选择,不仅可以更好地利用每一个参数的实际作用,更可以体现不同物理量的重要性,充分发挥最大价值;
4、相比于普通预测日冕物质抛射到达时间的系统,本系统所用的参数更全,更完整;
5、相比于一般的系统对所有的参数都采用统一的归一化方式,本系统中针对不同的参数,根据其物理意义不同采用的归一化方式也不同;
6、本系统的预测时间的平均绝对误差可以达到11.78小时,远远优于其他系统的平均水平。
附图说明
图1是CPA和MPA在日面不同位置处的正弦值区别;
图2是本发明的日冕物质抛射空间环境相似事件推荐方法流程图;
图3是本发明的CME推荐模型训练过程示意图。
具体实施方式
本发明通过借鉴机器学习中推荐算法的思想,通过基于深度学习的推荐系统在现实预报业务中为预报员提供历史上相似日冕物质抛射事件作为参考,最终做出准确的预报
下面结合附图和实施例对本发明的技术方案进行详细的说明。
实施例1
本发明的实施例1提出了一种日冕物质抛射空间环境事件相似推荐方法,所述方法包括:
在设定时间段内采集CPA、MPA、日冕物质抛射角宽度、线速度、初速度、末速度、20个太阳半径处的速度、日冕物质抛射源区的经纬度坐标、日冕物质抛射爆发当天的F10.7指数以及太阳风平均速度、温度、质子密度、动压、等离子体β值和三个方向的磁场分量,经预处理后得到18种日冕物质抛射事件的特征参数值;
将18种日冕物质抛射事件的特征参数值输入预先建立和训练好的CME推荐模型,得到历史相似CME事件以及预测到达时间;
所述CME推荐模型,用于根据每种特征参数的权值对特征参数值进行加权处理,然后与预先建立的CME历史数据库的历史事件进行距离匹配,找到距离最近的历史事件,所述历史事件包括18种特征参数和对应的观测时间。
从数据的组建、原理的运用、数据的处理到最后系统的构建,每一步都至关重要,不可或缺。下面将详细介绍每一部分的内容。
1.数据
目前所用数据来源有ICME行星际日冕物质抛射(Interplanetary Coronal MassEjection,ICME)事件列表215个事件,CME列表包含30321个事件,包含CPA,MPA,角宽度,线速度,初速度,末速度,20个太阳半径处的速度以及源区经纬度坐标等9个特征。并考虑日冕物质抛射爆发当天的F10.7指数以及太阳风平均速度、温度、质子密度、动压、等离子体β值、磁场分量共9个特征,这些物理量以24小时为单位,求日平均值作为对应日冕物质抛射事件的参数。以上共计18个物理特征,相比于其他预测系统的输入参数更多,更全面。
2.原理
基于推荐系统的日冕物质抛射到达时间预测是通过计算日冕物质抛射事件与其它事件之间的距离来衡量它们之间的相似性。通过距离计算,找出除自身以外距离最近的,也就是最相似的历史事件作为最终推荐结果。根据每个日冕物质抛射事件所对应的18个特征,可以构建18维空间。这里我们计算了两种常用的距离:余弦距离(Cosine Distance)和欧氏距离(Euclidean Distance)。对于每个CME事件,在这个18维的空间中都会对应一个向量(余弦距离种)或某个点(欧几里得距离种)来表示每个事件。通过计算每个向量或者点之间的距离,便可以得到每个CME之间的相似度。两个事件之间的距离越小,就代表这两个事件越相似。对于所有事件,10%的事件被选为测试集,而剩下的事件20%被选为验证集,剩余事件为训练集。对于训练集,直接确定每个事件之间的距离,作为最终的结果。而对于测试集和验证集,分别计算的是它们数据集和训练集数据之间的距离。下面介绍两种距离的不同计算原理:
(1)余弦距离
余弦距离是通过n维空间中两个向量之间的夹角的余弦值来比较两个事件之间的相似度。余弦距离的重点在于两个向量之间的方向上差别,而不是个体间的距离或长度。余弦距离在n维空间的公式如下:
上式中,Ai和Bi分别表示要比较的两个事件的空间向量,对应的不同的日冕物质抛射事件,下标i表示表示第i维空间,也就是特征的序号。根据余弦函数的特点,两个事件之间的距离范围一般会落在[-1,1]区间内,余弦值越大表示两个向量之间的夹角越小,代表两个事件越相似。因此,在构建系统时,通过余弦值的大小来衡量两个事件之间的相似度。对于训练集,Ai和Bi分别对应训练集中结合权重的特征向量;对于验证集,Ai表示验证集中的事件结合权重的特征向量而Bi表示训练集中的事件结合权重的特征向量;对于测试集Ai表示测试集中的事件结合权重的特征向量而Bi表示训练集中的事件结合权重的特征向量。
(2)欧几里得距离
欧几里得距离也是推荐算法中一种常用的距离公式,与余弦距离不同,它通常指的是n维空间中两点之间的距离长度,或者有时也用向量的长度(即从空间某点到坐标原点的距离)来表示。一般地,欧氏距离公式如下:
上式中,xi和yi表示不同的日冕物质抛射事件的特征在18维空间中凝聚的点,下角标1~n表示特征空间的维度,也就是不同的特征参数。对于训练集,x和y分别对应训练集中特征点;对于验证集,x表示验证集中的事件结合权重的特征点而y表示训练集中的事件结合权重的特征点;对于测试集x表示测试集中的事件结合权重的特征点而y表示训练集中的事件结合权重的特征点。
3.数据归一化
为了将上述获得的多关联列表中的18个特征在输入系统时减小量值,因此将对所有参数进行归一化处理。由于这18个特征参数的幅值非常宽,我们对这些特征参数进行归一化处理后,可以将每个数据都映射到[-1,1]的范围内,然后再输入到系统中,这样在后续数据处理中会更加地方便快捷。但由于这些特征地物理含义有所不同,为了适应不同的物理量,我们采用以下三种方式对数据进行归一化处理:
(1)离差标准化
对日冕物质抛射角宽度、线速度、二阶初速度、二阶末速度、20个太阳半径处速度(V20Rs)和背景太阳风平均速度、质子密度、温度、动压、等离子体β值以及F10.7指数进行离差标准化,公式如下:
之所以使用离差标准化对以上所提到的数据进行归一化,原因在于它不会移动或者聚合所有的数据,因此不会破坏数据的稀疏性。由于最后多关联列表中,每一列都是同一类别的参数,每一行对应的是一个日冕物质抛射事件,所以公式中axis=0表示的是对每一列进行归一化操作,即不同特征参数的归一化不会影响彼此。X表示的是每一个数据,X.min表示的是该特征参数所有数据内的最小值。之所以将日冕物质抛射的角宽度、线速度、二阶初速度、二阶末速度、20个太阳半径处速度、F10.7指数、太阳风平均速度、质子密度、温度、动压和等离子体β值这11个参数采用同样的归一化方法进行处理,是由于它们均是连续值,且数据范围宽广适用于离差标准化的处理方式。
(2)正弦归一化
根据现实中的预报经验,日冕物质抛射的源区在太阳东西向位置上对地球的效应完全不同,因此对日冕物质抛射的CPA和MPA两个物理参数采用正弦函数进行归一化处理,使其归一化后的数值落在不同的正负区间内,通过数值的正负便可以反映日冕物质抛射的方向。这也是本次创新点之一,之前其他模型对这两个物理量所采取的归一化,只是普通的归一化方式,这次采取了新的正弦方式归一化。
在国际惯例中,一般以太阳对地面的正北方向为0°,逆时针方向旋转到360°后正好重合。按照如此的度量方式,CPA和MPA的正弦值正好也落到了[-1,1]的区间内,日面东半球的度数范围为0°-180°,正弦值的范围正好为[0,1],而西半球的正弦值的范围正好落在[-1,0]。图1可以清晰地看出在日面东西方向上,喷发位置不同,正弦值明显不同
(3)除最大值归一化
除了以上所提的13个特征外,另外还有5个参数:Bx、By、Bz、以及日冕物质抛射源区的经纬度坐标。与之前所提到的两种物理量不同的是,这些物理量的数据本身含有正、负两种符号来表示其方向性特征。因此,为了保留物理量本身的正负性质,我们采用了一种标准化的方法,即直接除以每个物理量的最大值。
综上所述的归一化步骤,我们建立了一个完整统一的无量纲数据集,但采用的方式并不是随机的。在数据处理的过程中,我们充分考虑了每个物理量的不同特点,为每个不同的物理量量身定做了不同的归一化方法,这与其他系统普遍采用的笼统的归一化方式不同,这是为了下一个系统的构建更立体。
4.CME推荐模型的建立与训练
日冕物质抛射到达时间的推荐模型是通过Python语言建立的。在训练过程中,将包含18个特征的日冕物质抛射事件的参数及其实际到达时间作为模型的输入,输出是推荐的历史相似事件及其对应的实际观测时间作为预测时间。在训练过程中,分别循环每个特征的权值,从0到50,步长为1。当调整一个特征的权重时,将其余特征的权重设置为1,以保证实验结果的统一性和可比性。分别利用余弦距离和欧几里得距离分别进行上述操作。通过从0到50共51个参数迭代18个特征权重,我们最终得到51×18=918个试验结果。通过分析平均误差(ME)、平均绝对误差(MAE)、标准差(SD)和均方根误差(RMSE)的预测结果,可以得到该四个误差分别对应的四组权重。训练结束后,分别选取每种距离计算方法下的最小的平均绝对误差、标准差和均方根误差所对应三组的权重作为验证集输入的特征的权重。每种距离计算方法最佳权重的组合的评判标准是通过验证集的平均绝对误差来确定的。评选的标准是验证集中平均绝对误差最小的所对应的权重,最后,再对两种距离计算方法的最佳权重的组合进行评选,由测试集的平均绝对误差来确定,评选的标准是测试集中平均绝对误差最小时所对应的权重即为最后被选择的最优权重,并得到了对应的距离计算方法。至此,模型建立完成。
要预测的事件在输入系统时,每个参数都要赋予上述所选择的权重。然后经过距离计算,匹配到距离最近的事件,系统推荐历史上的相似事件。
实施例2
本发明的实施例2提出了一种日冕物质抛射空间环境事件相似推荐系统,系统包括:CME推荐模型、特征参数采集处理模块和推荐输出模块;具体处理过程同实施例1,其中,
特征参数采集处理模块,用于在设定时间段内采集CPA、MPA、日冕物质抛射角宽度、线速度、初速度、末速度、20个太阳半径处的速度、日冕物质抛射源区的经纬度坐标、日冕物质抛射爆发当天的F10.7指数以及太阳风平均速度、温度、质子密度、动压、等离子体β值和三个方向的磁场分量,经预处理后得到18种日冕物质抛射事件的特征参数值;预处理包括对采集的太阳风平均速度、温度、质子密度、动压、等离子体β值和三个方向的磁场分量分别求取对应的日平均值;
推荐输出模块,用于将18种日冕物质抛射事件的特征参数值输入预先建立和训练好的CME推荐模型,得到历史相似CME事件以及预测到达时间;
CME推荐模型,用于根据每种特征参数的权值对特征参数值进行加权处理,然后与预先建立的CME历史数据库的历史事件进行距离匹配,找到距离最近的历史事件,所述历史事件包括18种特征参数和对应的观测时间。
具体来说:
该系统的输入数据是要预测的日冕物质抛射事件的参数,一共包含角宽度、CPA、MPA、线速度等共计18个参数;将该事件的所有参数输入到系统中后,与数据库中所有的历史事件进行距离的匹配,找到距离最近的事件后,将它的观测时间作为最终预测的时间;最后通过系统输出推荐的历史相似CME事件和预测到达时间。
首先通过不同的渠道和方法建立一个包含历史上所有日冕物质抛射事件的数据列表,作为系统的样本库,该样本库中的每个事件都对应18个物理参数;其次要对这些事件的这些参数进行归一化处理,保持量纲的一致性;然后将整理好的数据分别采用余弦距离和欧氏距离两种距离计算方式进行不同的实验,在实验中同时调整每一个参数的权重,以平均绝对误差作为最后的衡量标准,选择误差最小的一组权重作为系统最后的权重,并通过对比余弦和欧氏距离的结果,发现欧氏距离的结果更好,至此我们构建了一个完整的系统。
相比于一般的预报系统,本系统不仅有预报功能,可以预测CME的到达时间,并且为当前空间环境预报业务提供了新的参考方式,通过为当前要预测的CME事件推荐历史上相似的事件,为预报员给出参考。
在当前的CME的预报业务中,所有的CME预报系统只是单单给出到达时间,不能给出预报员有力的参考,如若可以参考历史上类似的CME事件,会让预报的结果更有说服力。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (7)
1.一种日冕物质抛射空间环境事件相似推荐方法,所述方法包括:
在设定时间段内采集CPA、MPA、日冕物质抛射角宽度、线速度、初速度、末速度、20个太阳半径处的速度、日冕物质抛射源区的经纬度坐标、日冕物质抛射爆发当天的F10.7指数以及太阳风平均速度、温度、质子密度、动压、等离子体β值和三个方向的磁场分量,经预处理后得到18种日冕物质抛射事件的特征参数值;
将18种日冕物质抛射事件的特征参数值输入预先建立和训练好的CME推荐模型,得到历史相似CME事件以及预测到达时间;
所述CME推荐模型,用于根据每种特征参数的权值对特征参数值进行加权处理,然后与预先建立的CME历史数据库的历史事件进行距离匹配,找到距离最近的历史事件,所述历史事件包括18种特征参数和对应的观测时间;
所述预处理包括对采集的太阳风平均速度、温度、质子密度、动压、等离子体β值和三个方向的磁场分量分别求取对应的日平均值;
所述方法还包括预先建立和训练CME推荐模型的步骤;具体包括:
从ICME事件列表和CME列表获取CPA、MPA、日冕物质抛射角宽度、线速度、初速度、末速度、20个太阳半径处的速度、日冕物质抛射源区的经纬度坐标、日冕物质抛射爆发当天的F10.7指数以及太阳风平均速度、温度、质子密度、动压、等离子体β值和三个方向的磁场分量共18种特征参数;
经预处理后得到18种日冕物质抛射事件的特征参数值;
对18种特征参数值分别进行归一化处理,得到归一化处理后的特征参数;
将一组归一化处理后的特征参数和对应的实际到达时间组成一个事件,将多个事件组成样本集;
从样本集中分别提取不同的事件分别建立训练集、验证集和测试集;
将训练集的数据依次输入CME推荐模型,分别采用余弦距离和欧氏距离两种距离计算方式进行训练,得到采用余弦距离计算方法的三组特征参数权重组合以及采用欧氏距离计算方法的三组特征参数权重组合;
将两种距离计算方法的特征参数权重组合分别作为验证集输入的特征权重,经判断分别得到每种距离计算方法的最优特征参数权重组合;
将两种距离计算方法的最优特征参数权重组合分别作为测试集输入的特征权重,经判断得到一组最优的特征参数权重组合以及对应的距离计算方法,从而得到训练好的CME推荐模型。
2.根据权利要求1所述的日冕物质抛射空间环境事件相似推荐方法,其特征在于,所述对18种特征参数值分别进行归一化处理,得到归一化处理后的特征参数;具体包括:
对日冕物质抛射角宽度、线速度、初速度、末速度、20个太阳半径处的速度以及太阳风平均速度、温度、质子密度、动压、等离子体β值和F10.7指数分别进行离差标准化处理,得到对应的归一化处理后的参数;
对CPA和MPA采用正弦函数进行归一化处理,得到对应的归一化处理后的参数;
对三个方向的磁场分量以及日冕物质抛射源区的经纬度坐标进行除最大值归一化处理,得到对应的归一化处理后的参数。
4.根据权利要求1所述的日冕物质抛射空间环境事件相似推荐方法,其特征在于,所述将训练集的数据依次输入CME推荐模型,分别采用余弦距离和欧氏距离两种距离计算方式进行训练,得到采用余弦距离计算方法的三组特征参数权重组合以及采用欧氏距离计算方法的三组特征参数权重组合;具体包括:
步骤1)选定一个特征参数a,将训练集中所有事件的特征参数a的权重均设置为[0,50]的整数,其他17种参数的权重均设置为1,分别计算权重调整后的任意两个事件之间的余弦距离和欧几里得距离;
步骤2)当a的权重小于50时,权重+1,转至步骤1);当a的权重为50时,转至步骤3);
步骤3)得到关于特征参数a不同权重的51个余弦距离和51个欧几里得距离;
步骤4)选取另一个特征参数,重复步骤1)-步骤3),得到另一个参数不同权重的51个余弦距离和51个欧几里得距离;重复步骤4)直至得到该特征向量每个参数不同权值的51个余弦距离和51个欧几里得距离;
步骤5)遍历每个特征参数,重复步骤4)共得到18*51个余弦距离和18*51个欧几里得距离;
步骤6)通过对步骤5)得到的余弦距离和欧几里得距离分别计算平均误差、标准差和均方根误差,并从中选取最小平均绝对误差、最小标准差和最小均方根误差,从而得到采用余弦距离计算方法的三组特征参数权重组合以及采用欧氏距离计算方法的三组特征参数权重组合。
5.根据权利要求4所述的日冕物质抛射空间环境事件相似推荐方法,其特征在于,所述将两种距离计算方法的特征参数权重组合分别作为验证集输入的特征权重,经判断分别得到每种距离计算方法的最优特征参数权重组合;具体包括:
对于每种距离计算方法的三组特征参数权重组合分别计算验证集的平均绝对误差,取平均绝对误差最小值对应的特征参数权重组合,从而得到每种距离计算方法的最优特征参数权重组合。
6.根据权利要求5所述的日冕物质抛射空间环境事件相似推荐方法,其特征在于,所述将两种距离计算方法的最优特征参数权重组合分别作为测试集输入的特征权重,经判断得到一组最优的特征参数权重组合以及对应的距离计算方法;具体包括:
对于每种距离计算方法的最优特征参数权重组合分别计算测试集的平均绝对误差,取平均绝对误差最小值对应的特征参数权重组合作为最优特征参数权重组合,并将该特征参数权重组合对应的距离计算方法作为最优距离计算方法。
7.一种日冕物质抛射空间环境事件相似推荐系统,其特征在于,所述系统包括:特征参数采集处理模块、推荐输出模块和CME推荐模型;其中,
所述特征参数采集处理模块,用于在设定时间段内采集CPA、MPA、日冕物质抛射角宽度、线速度、初速度、末速度、20个太阳半径处的速度、日冕物质抛射源区的经纬度坐标、日冕物质抛射爆发当天的F10.7指数以及太阳风平均速度、温度、质子密度、动压、等离子体β值和三个方向的磁场分量,经预处理后得到18种日冕物质抛射事件的特征参数值;
所述推荐输出模块,用于将18种日冕物质抛射事件的特征参数值输入预先建立和训练好的CME推荐模型,得到历史相似CME事件以及预测到达时间;
所述CME推荐模型,用于根据每种特征参数的权值对特征参数值进行加权处理,然后与预先建立的CME历史数据库的历史事件进行距离匹配,找到距离最近的历史事件,所述历史事件包括18种特征参数和对应的观测时间;
所述预处理包括对采集的太阳风平均速度、温度、质子密度、动压、等离子体β值和三个方向的磁场分量分别求取对应的日平均值;
所述CME推荐模型的训练步骤具体包括:
从ICME事件列表和CME列表获取CPA、MPA、日冕物质抛射角宽度、线速度、初速度、末速度、20个太阳半径处的速度、日冕物质抛射源区的经纬度坐标、日冕物质抛射爆发当天的F10.7指数以及太阳风平均速度、温度、质子密度、动压、等离子体β值和三个方向的磁场分量共18种特征参数;
经预处理后得到18种日冕物质抛射事件的特征参数值;
对18种特征参数值分别进行归一化处理,得到归一化处理后的特征参数;
将一组归一化处理后的特征参数和对应的实际到达时间组成一个事件,将多个事件组成样本集;
从样本集中分别提取不同的事件分别建立训练集、验证集和测试集;
将训练集的数据依次输入CME推荐模型,分别采用余弦距离和欧氏距离两种距离计算方式进行训练,得到采用余弦距离计算方法的三组特征参数权重组合以及采用欧氏距离计算方法的三组特征参数权重组合;
将两种距离计算方法的特征参数权重组合分别作为验证集输入的特征权重,经判断分别得到每种距离计算方法的最优特征参数权重组合;
将两种距离计算方法的最优特征参数权重组合分别作为测试集输入的特征权重,经判断得到一组最优的特征参数权重组合以及对应的距离计算方法,从而得到训练好的CME推荐模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110618970.8A CN113392582B (zh) | 2021-06-03 | 2021-06-03 | 日冕物质抛射空间环境事件相似推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110618970.8A CN113392582B (zh) | 2021-06-03 | 2021-06-03 | 日冕物质抛射空间环境事件相似推荐方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113392582A CN113392582A (zh) | 2021-09-14 |
CN113392582B true CN113392582B (zh) | 2022-03-08 |
Family
ID=77619889
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110618970.8A Active CN113392582B (zh) | 2021-06-03 | 2021-06-03 | 日冕物质抛射空间环境事件相似推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113392582B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103176983A (zh) * | 2011-12-20 | 2013-06-26 | 中国科学院计算机网络信息中心 | 一种基于互联网信息的事件预警方法 |
CN112101440A (zh) * | 2020-09-09 | 2020-12-18 | 昆明理工大学 | 一种基于改进U-Net网络的日冕物质抛射检测方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103176981B (zh) * | 2011-12-20 | 2016-04-27 | 中国科学院计算机网络信息中心 | 一种事件信息挖掘并预警的方法 |
CN103854064B (zh) * | 2012-11-29 | 2017-01-25 | 中国科学院计算机网络信息中心 | 一种面向特定区域的事件发生风险预测并预警方法 |
CN104597523B (zh) * | 2014-12-30 | 2016-10-05 | 西南交通大学 | 一种日冕物质抛射多伴随现象的检测方法 |
CN105118294B (zh) * | 2015-09-25 | 2017-03-29 | 山东易构软件技术股份有限公司 | 一种基于状态模式的短时交通流预测方法 |
CN107895283B (zh) * | 2017-11-07 | 2021-02-09 | 重庆邮电大学 | 一种基于时间序列分解的商家客流量大数据预测方法 |
CN110533100B (zh) * | 2019-07-22 | 2021-11-26 | 南京大学 | 一种基于机器学习进行cme检测和跟踪的方法 |
CN112101444A (zh) * | 2020-09-09 | 2020-12-18 | 昆明理工大学 | 一种基于深度学习的日冕物质抛射检测方法 |
-
2021
- 2021-06-03 CN CN202110618970.8A patent/CN113392582B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103176983A (zh) * | 2011-12-20 | 2013-06-26 | 中国科学院计算机网络信息中心 | 一种基于互联网信息的事件预警方法 |
CN112101440A (zh) * | 2020-09-09 | 2020-12-18 | 昆明理工大学 | 一种基于改进U-Net网络的日冕物质抛射检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113392582A (zh) | 2021-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hu et al. | Fast image recognition of transmission tower based on big data | |
CN110363327A (zh) | 基于ConvLSTM和3D-CNN的短临降水预测方法 | |
CN108205717A (zh) | 一种光伏发电功率多时间尺度预测方法 | |
CN109635332B (zh) | 一种基于遗传算法的变步长星座轨道优化方法及装置 | |
CN108304623A (zh) | 一种基于堆栈降噪自动编码器的概率潮流在线计算方法 | |
CN110084433A (zh) | 基于高斯混合模型的风电功率预测误差分段拟合方法 | |
CN114493052B (zh) | 多模型融合自适应新能源功率预测方法和系统 | |
CN115761378B (zh) | 基于联邦学习的电力巡检图像分类和检测方法及系统 | |
CN111737641B (zh) | 一种基于神经网络的mwhts通道权重函数计算方法 | |
CN113553755A (zh) | 电力系统状态估计方法、装置及设备 | |
CN110766190A (zh) | 一种配电网负荷预测方法 | |
CN116307291A (zh) | 一种基于小波分解的分布式光伏发电预测方法及预测终端 | |
Qu et al. | Research on short‐term output power forecast model of wind farm based on neural network combination algorithm | |
CN114882373A (zh) | 基于深度神经网络的多特征融合沙尘暴预测方法 | |
CN113392582B (zh) | 日冕物质抛射空间环境事件相似推荐方法及系统 | |
CN114358310A (zh) | 一种基于横向安全联邦学习的锂电池soh估计方法 | |
CN111061151B (zh) | 一种基于多元卷积神经网络的分布式能源状态监测方法 | |
CN112926772A (zh) | 一种基于lstm-gpr混合模型的光能预测方法 | |
Zhao et al. | Short-term load forecasting based on RBF neural network | |
CN112734073A (zh) | 一种基于长短期记忆网络的光伏发电功率短期预测方法 | |
CN115793456A (zh) | 基于轻量型灵敏度的配电网边缘侧多模态自适应控制方法 | |
CN115423810A (zh) | 一种风力发电机组叶片覆冰形态分析方法 | |
CN115102868A (zh) | 一种基于SOM聚类与深度自编码器的web服务QoS预测方法 | |
Wang et al. | Optimization of regional coverage reconnaissance satellite constellation by nsga-ii algorithm | |
CN113298304A (zh) | 基于多维气象预报因子图卷积的光伏发电功率预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |