CN114252706B - 一种雷电预警方法和系统 - Google Patents
一种雷电预警方法和系统 Download PDFInfo
- Publication number
- CN114252706B CN114252706B CN202111534551.2A CN202111534551A CN114252706B CN 114252706 B CN114252706 B CN 114252706B CN 202111534551 A CN202111534551 A CN 202111534551A CN 114252706 B CN114252706 B CN 114252706B
- Authority
- CN
- China
- Prior art keywords
- early warning
- electric field
- lightning
- data
- lightning early
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R29/00—Arrangements for measuring or indicating electric quantities not covered by groups G01R19/00 - G01R27/00
- G01R29/08—Measuring electromagnetic field characteristics
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/10—Devices for predicting weather conditions
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Abstract
本发明公开了一种雷电预警方法和系统,涉及雷电预警技术领域。本发明针对电场数据量大,数据维度多的特点,利用稀疏自编码器压缩维度特征,与传统人工选取特征(例如傅里叶分解、小波变换和经验模态分解)相比,能够最大限度保留数据的原始特征,很好的解决了雷电预警领域电场时序特征提取困难的问题,便于进行后续处理。本发明利用LightGBM分布式、高效的特性,很好的解决了雷电预警建模困难、准确率低以及时效性不足的问题。本发明可针对不同地区的状况进行适应性的训练和调试,具有普适性。随着模型运行时间加长、数据量加大,可进行更新迭代,以确保预报性能不断提升。
Description
技术领域
本发明涉及雷电预警技术领域,特别涉及一种雷电预警方法和系统。
背景技术
闪电是一种发生在自然界的云层与云层之间或者云层与地面之间的放电现象,伴随着经济的不断发展和社会的飞速进步,雷电所造成的人身安全和财产损失引起人们的重视,而雷电预警作为主动防雷中的重要措施,对于降低雷电造成的危害具有重大意义。
在雷暴发展期间,云层中的冰晶、霰粒等颗粒物不断摩擦起电,致使其带上较强的电荷,从而在大气和地面之间形成强烈的电场,因此大气电场便可用来推算雷暴的形成、发展和消散的过程。基于此,国内外学者对其进行了深入研究,例如利用大气电场幅值、大气电场差分阈值及电场的快变抖动等特征,结合闪电定位仪、雷达回波图对闪电的发生进行预测。
传统的基于大气电场特征的雷电预警方法多是基于人为设定大气电场阈值和大气电场差分阈值,或是基于傅里叶分解、小波变换和经验模态分解等手段处理电场时序信号,没有深入挖掘大气电场振荡特征,且会丢失部分特征,存在适用性不强,预警准确率不高的问题。若当数据样本较大,计算量较大,难以满足实际雷暴预警的需求。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种雷电预警方法和系统,其目的在于提高雷电预警准确率以及时效性。
为实现上述目的,本发明提供了一种雷电预警方法,包括:
S1:对电场测量数据进行预处理;
S2:将预处理后的电场测量数据划分为雷暴样本和非雷暴样本;
S3:采用稀疏自编码器对上述样本数据进行特征提取和维度压缩;
S4:以压缩后的电场特征作为训练集,采用LightGBM算法训练得到雷电预警模型;
S5:将未知天气的电场数据输入训练好的雷电预警模型,得到未来是否会有雷暴发生的预警结果。
进一步地,电场数据预处理包括采用拉格朗日插值的方法补充缺失值,删除重复值以及剔除异常数据。
进一步地,步骤S2具体为,
将闪电发生时间前一小时内的电场测量数据归为雷暴样本;
随机抽取一小时的电场测量数据,若该段数据前后半小时无闪电发生,则归为非雷暴样本。
进一步地,稀疏自编码器包括输入层、隐藏层和输出层。
进一步地,对输入层数据的编码函数f(x)和对隐藏层数据的解码函数g(h)分别为:
f(x)=f(W1x+b1)
g(h)=g(W2x+b2)
式中W1为输入层到隐藏层的权重,W2为隐藏层到输出层的权重,b1和b2分别为隐藏层和输出层的偏置项。
进一步地,引入KL散度来衡量ρj和ρ之间的差异,稀疏自编码器的损失函数为:
β为稀疏惩罚项的权重系数,ρj为稀疏性参数,ρ为接近于0的常数,L为自编码器损失函数。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果。
(1)本发明针对电场数据量大,数据维度多的特点,利用稀疏自编码器压缩维度特征,与传统人工选取特征(例如傅里叶分解、小波变换和经验模态分解)相比,能够最大限度保留数据的原始特征,很好的解决了雷电预警领域电场时序特征提取困难的问题,便于进行后续处理。
(2)本发明利用LightGBM分布式、高效的特性,很好的解决了雷电预警建模困难、准确率低以及时效性不足的问题。
(3)借助人工智能在数据挖掘领域的优势,可针对不同地区的状况进行适应性的训练和调试,具有普适性。随着模型运行时间加长、数据量加大,可进行更新迭代,以确保预报性能不断提升。
附图说明
图1是雷电预警整体流程图
图2是大气电场仪所测的数据示例。
图3是自编码器结构图。
图4是稀疏自编码器训练过程中训练集和验证集损失函数变化。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
参考图1,本发明提供的雷电预警方法包括:
步骤1:对电场数据进行预处理,主要操作包括:
1.1对缺失值进行插值补充
对于某时刻数据缺失的情况,采用拉格朗日插值的方法填补数据,拉格朗日插值计算公式为:
其中,拉格朗日插值基函数lk(x)表达式为:
1.2对于重复值,即某一时刻对应多个电场数据,删除多余的数据。
1.3检查是否有异常数据,删除异常数据,采用3σ准则,具体计算公式如下:
设样本均值ui,标准差为σi,根据统计学原理,xi落在(ui+3σ,ui+3σ)之外的概率约为0.0026,属于小概率事件,实际问题中不会发生,该部分数据应当剔除。其中,样本均值计算公式为:
样本标准差计算公式为:
若统计量Xi的第j个样本数据(xi)j满足足式下式,则说明该样本数据为异常数据,应当剔除,并将异常数据的位置用空值表示。
|(xi)j-μi|>3σi
如图2所示为经过步骤1处理之后的大气电场仪部分测量数据。
步骤2:确定雷暴样本和非雷暴样本
为了通过大气电场来判别是否有闪电发生,需要截取一定长度的电场时间序列对其进行特征分析,截取序列如果过长则会包含大量的非雷暴电场序列,如果过短则会降低预警的实效性。雷暴发展过程中电场变化可分为四个阶段:外围闪击阶段、雷云临近阶段、雷云到达阶段和雷云过境后阶段。其中外围闪击阶段指的是闪电发生在电场仪侦测范围内,但在15km之外,并且闪电活动在雷云到达阶段尤为剧烈。第一阶段和第三阶段相距约40分钟,为雷电预警提供了短暂而宝贵的时间。
因此在本发明实施例中,对于雷暴天气样本,选取60min的大气电场序列,对于非雷暴天气样本,采取随机抽取等长序列的方式。确定方式如下:
①雷暴样本:根据闪电定位系统侦测到闪电发生的时间,取出其过去一小时内的电场测量数据。
②非雷暴样本:随机抽取一小时的电场测量数据,若其前后半个小时无闪电发生,则归为非雷暴样本。
步骤3:对电场时间序列进行特征提取。
自编码器(AE,Auto encoder)是运用于机器学习和深度学习的常用提取特征的方法之一,包括输入层、隐藏层和输出层3层结构,其基本结构如图3所示。它采用无监督学习的方式,将输入信息作为学习目标,可用于对输入信息的表征进行提取,通过比较原始数据和重构数据的误差来进行训练,使得输入值和输出值尽可能接近,从而在不损失精度的前提下,获取数据信息在更低维度下的表示方法。
本文采用稀疏自编码(Sparse auto encoder,SAE)提取电场特征,该神经元具有稀疏约束机制,激活函数为范围在(0,1)之间的sigmoid的函数,可表示为:
假设第i个隐藏层的输入为X={x1,x2,…,xi,…,xn-1,xN},xi∈R(m),其中N为数据量,m为样本特征的维度。该网络利用σ激活函数对输入层x进行编码,得到隐藏层h,然后解码网络对隐藏层数据进行解码,得到输出向量y。编码函数f(x)和解码函数g(h)如下式所示。
h=f(x)=f(W1x+b1)
式中W1为输入层到隐藏层的权重,W2为隐藏层到输出层的权重,b1和b2分别为隐藏层和输出层的偏置项。
稀疏自编码器的核心思想是将稀疏惩罚项引入到损失函数中,以此限制隐藏神经元的激活程度。对于某一神经元,如果它的输出接近于1,那么其激活程度就很高,若接近于0,则其激活程度很低。设隐藏层中的第j个神经元的输出为hj(x(i)),第j个隐藏层神经元的平均活跃度可表示为:
其中ρj为稀疏性参数,为了降低神经元的激活程度,希望其值趋近于零,引入KL散度作为惩罚项,使ρj趋近于一个接近于0的常数ρ,二者之间的差值可以用相对熵表示:
自编码器的损失函数一般具有如下形式:
引入KL散度后,SAE的损失函数可由下式表示:
式中,β为稀疏惩罚项的权重系数。
将ρ设置为0.05,β设置为3,根据8:2的比例划分训练集和验证集,通过100次的不断迭代训练降低损失,其迭代过程如图4所示。
步骤4:当样本维度过大,使用传统算法会存在计算速度较慢、计算精度不够的缺点,为了解决这一问题,需要选取一种运算精度高且运行速度快的算法,集成学习中LightGBM模型结合了决策树算法且采用直方图做差加速策略构建决策树结点,可自动处理类别特征,相比XGBoost算法和随机森林算法模型精度更高,且不易过拟合,具有更高效的处理能力。
因此本发明以步骤3中经过压缩后的电场特征作为因变量,基于网格寻优进行LightGBM的超参数优化,得到模型的最佳树数量和最优树深度,对归一化后的数据集划分验证集和测试集,之后基于K折交叉验证,通过多次实验对LightGBM模型不断进行拟合调优,确定分类效果最好的LightGBM模型。
步骤5:LightGBM算法模型进行雷电临近预警,上述训练好的模型,即可判别未知天气的电场代表的是雷暴天气还是非雷暴天气,进而得之未来是否会有雷暴发生。发现异常后,将模型所给结果结合人工经验进行预警信号的发出。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种雷电预警方法,其特征在于,包括:
S1:对电场测量数据进行预处理;
S2:将预处理后的电场测量数据划分为雷暴样本和非雷暴样本;
S3:采用稀疏自编码器对上述样本数据进行特征提取和维度压缩;
S4:以压缩后的电场特征作为训练集,采用LightGBM算法训练得到雷电预警模型;
S5:将未知天气的电场数据输入训练好的雷电预警模型,得到未来是否会有雷暴发生的预警结果。
2.根据权利要求1所述的一种雷电预警方法,其特征在于,电场数据预处理包括采用拉格朗日插值的方法补充缺失值,删除重复值以及剔除异常数据。
3.根据权利要求2所述的一种雷电预警方法,其特征在于,步骤S2具体为,
将闪电发生时间前一小时内的电场测量数据归为雷暴样本;
随机抽取一小时的电场测量数据,若该段数据前后半小时无闪电发生,则归为非雷暴样本。
4.根据权利要求1-3任一项所述的一种雷电预警方法,其特征在于,稀疏自编码器包括输入层、隐藏层和输出层。
5.根据权利要求4所述的一种雷电预警方法,其特征在于,对输入层数据的编码函数f(x)和对隐藏层数据的解码函数g(h)分别为:
f(x)=f(W1x+b1)
g(h)=g(W2x+b2)
式中W1为输入层到隐藏层的权重,W2为隐藏层到输出层的权重,b1和b2分别为隐藏层和输出层的偏置项。
7.一种雷电预警系统,其特征在于,包括:计算机可读存储介质和处理器;
所述计算机可读存储介质用于存储可执行指令;
所述处理器用于读取所述计算机可读存储介质中存储的可执行指令,执行权利要求1至6任一项所述的雷电预警方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111534551.2A CN114252706B (zh) | 2021-12-15 | 2021-12-15 | 一种雷电预警方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111534551.2A CN114252706B (zh) | 2021-12-15 | 2021-12-15 | 一种雷电预警方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114252706A CN114252706A (zh) | 2022-03-29 |
CN114252706B true CN114252706B (zh) | 2023-03-14 |
Family
ID=80795195
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111534551.2A Active CN114252706B (zh) | 2021-12-15 | 2021-12-15 | 一种雷电预警方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114252706B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117748437A (zh) * | 2024-02-20 | 2024-03-22 | 中国人民解放军空军预警学院 | 一种强电磁脉冲防护方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108427041A (zh) * | 2018-03-14 | 2018-08-21 | 南京中科九章信息技术有限公司 | 雷电预警方法、系统、电子设备和存储介质 |
CN110796299A (zh) * | 2019-10-23 | 2020-02-14 | 国网电力科学研究院武汉南瑞有限责任公司 | 一种雷电预测方法 |
CN111582551A (zh) * | 2020-04-15 | 2020-08-25 | 中南大学 | 风电场短期风速预测方法、系统及电子设备 |
CN111796343A (zh) * | 2020-06-15 | 2020-10-20 | 兰州中心气象台(兰州干旱生态环境监测预测中心) | 一种基于人工智能算法的强对流天气短时临近识别方法 |
CN112613636A (zh) * | 2020-11-25 | 2021-04-06 | 国网江苏省电力有限公司江阴市供电分公司 | 一种基于特征工程的XGboost风速短期预测方法 |
CN112818912A (zh) * | 2021-02-24 | 2021-05-18 | 南京信息工程大学 | 基于集成经验模态分解和极端梯度提升的雷电预警方法 |
CN112861992A (zh) * | 2021-03-09 | 2021-05-28 | 三峡大学 | 基于独立稀疏堆叠自编码器的风电场超短期功率预测方法 |
CN113408803A (zh) * | 2021-06-24 | 2021-09-17 | 国网浙江省电力有限公司双创中心 | 一种雷电预测方法、装置、设备及计算机可读存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112016734B (zh) * | 2020-04-07 | 2024-03-22 | 沈阳工业大学 | 基于lstm栈式自编码多模型荷预测方法及系统 |
-
2021
- 2021-12-15 CN CN202111534551.2A patent/CN114252706B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108427041A (zh) * | 2018-03-14 | 2018-08-21 | 南京中科九章信息技术有限公司 | 雷电预警方法、系统、电子设备和存储介质 |
CN110796299A (zh) * | 2019-10-23 | 2020-02-14 | 国网电力科学研究院武汉南瑞有限责任公司 | 一种雷电预测方法 |
CN111582551A (zh) * | 2020-04-15 | 2020-08-25 | 中南大学 | 风电场短期风速预测方法、系统及电子设备 |
CN111796343A (zh) * | 2020-06-15 | 2020-10-20 | 兰州中心气象台(兰州干旱生态环境监测预测中心) | 一种基于人工智能算法的强对流天气短时临近识别方法 |
CN112613636A (zh) * | 2020-11-25 | 2021-04-06 | 国网江苏省电力有限公司江阴市供电分公司 | 一种基于特征工程的XGboost风速短期预测方法 |
CN112818912A (zh) * | 2021-02-24 | 2021-05-18 | 南京信息工程大学 | 基于集成经验模态分解和极端梯度提升的雷电预警方法 |
CN112861992A (zh) * | 2021-03-09 | 2021-05-28 | 三峡大学 | 基于独立稀疏堆叠自编码器的风电场超短期功率预测方法 |
CN113408803A (zh) * | 2021-06-24 | 2021-09-17 | 国网浙江省电力有限公司双创中心 | 一种雷电预测方法、装置、设备及计算机可读存储介质 |
Non-Patent Citations (2)
Title |
---|
基于LightGBM算法的强对流天气分类识别研究;刘新伟,黄武斌等;《高原气象》;20210310;第40卷(第4期);第909-918页 * |
自编码神经网络理论及应用综述;袁非牛,章琳等;《计算机学报》;20180921;第42卷(第1期);第203-230页 * |
Also Published As
Publication number | Publication date |
---|---|
CN114252706A (zh) | 2022-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111913156B (zh) | 基于深度学习模型与特征联合的雷达辐射源个体识别方法 | |
Shang et al. | A hybrid method for traffic incident duration prediction using BOA-optimized random forest combined with neighborhood components analysis | |
CN109871749B (zh) | 一种基于深度哈希的行人重识别方法和装置、计算机系统 | |
CN114037844A (zh) | 基于滤波器特征图的全局秩感知神经网络模型压缩方法 | |
CN101893704A (zh) | 一种基于粗糙集的雷达辐射源信号识别方法 | |
CN101710422B (zh) | 基于全局流形原型聚类算法与分水岭算法的图像分割方法 | |
CN108171119B (zh) | 基于残差网络的sar图像变化检测方法 | |
CN114252706B (zh) | 一种雷电预警方法和系统 | |
CN103186794A (zh) | 基于改进的近邻传播聚类的极化sar图像分类方法 | |
CN113779880B (zh) | 一种基于超前钻探数据的隧道围岩二维质量评价方法 | |
CN111242351A (zh) | 基于自编码器和gru神经网络的热带气旋轨迹预测方法 | |
CN115600928A (zh) | 基于oao-rvm的gis盆式绝缘子状态评估方法 | |
CN113780432B (zh) | 基于增强学习的网络信息系统运维异常智能检测方法 | |
CN113206808B (zh) | 一种基于一维多输入卷积神经网络的信道编码盲识别方法 | |
CN112101487B (zh) | 一种细粒度识别模型的压缩方法和设备 | |
CN114037001A (zh) | 基于wgan-gp-c和度量学习的机械泵小样本故障诊断方法 | |
CN113780094A (zh) | 基于混合高斯模型和隐马尔可夫模型的周界入侵识别方法 | |
Silva et al. | Deformation fringes detection in SAR interferograms using deep learning | |
Li et al. | Vessel trajectory similarity measure based on deep convolutional autoencoder | |
Shu et al. | An interference recognition method based on improved genetic algorithm | |
CN113625283A (zh) | 基于残差卷积神经网络的双极化气象雷达水凝物粒子相态识别方法 | |
CN111507423A (zh) | 输电线路通道清理的工程量测算方法 | |
CN112183615B (zh) | 一种带有马尔可夫链数据处理的汽车风险用户筛查方法 | |
Guan et al. | Mixed Pruning Method for Vehicle Detection | |
CN117390515B (zh) | 基于深度学习和SimHash的数据分类方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |