CN117725523B - 基于物理约束的雷暴天气预警方法及预警系统 - Google Patents
基于物理约束的雷暴天气预警方法及预警系统 Download PDFInfo
- Publication number
- CN117725523B CN117725523B CN202410131744.0A CN202410131744A CN117725523B CN 117725523 B CN117725523 B CN 117725523B CN 202410131744 A CN202410131744 A CN 202410131744A CN 117725523 B CN117725523 B CN 117725523B
- Authority
- CN
- China
- Prior art keywords
- thunderstorm
- cloud
- data
- suspected
- sunflower
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 73
- 241000208818 Helianthus Species 0.000 claims abstract description 71
- 235000003222 Helianthus annuus Nutrition 0.000 claims abstract description 71
- 238000001556 precipitation Methods 0.000 claims abstract description 55
- 230000004927 fusion Effects 0.000 claims abstract description 41
- 238000007637 random forest analysis Methods 0.000 claims abstract description 16
- 238000001816 cooling Methods 0.000 claims description 18
- 238000011156 evaluation Methods 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 17
- 230000003595 spectral effect Effects 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000012216 screening Methods 0.000 claims description 10
- 238000010276 construction Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims 1
- 238000002474 experimental method Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 241001424688 Enceliopsis Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Radar Systems Or Details Thereof (AREA)
- Image Processing (AREA)
Abstract
本发明提供一种基于物理约束的雷暴天气预警方法及预警系统,其中,预警方法包括:获取特定区域、特定时间的葵花8号卫星数据、GPM融合降水数据、高程及纬度数据;将通道亮温阈值低于253K的云团作为第一疑似雷暴云团,并采用最小距离法对第一疑似雷暴云团进行追踪;选取葵花8号卫星中预定的若干通道建立阈值判识条件;对葵花8号卫星数据和GPM融合降水数据进行时空匹配处理;将葵花8号卫星数据、高程及纬度数据、基于物理约束的阈值判识条件输入随机森林模型中构建雷暴预警模型。本发明能够降低误报率,更准确的捕捉雷暴天气,提高资源的利用效率,且能够解决因样本不平衡导致的雷暴预测结果过度偏向的问题,提高强雷暴预测的准确性。
Description
技术领域
本发明涉及天气预警技术领域,特别是涉及一种基于物理约束的雷暴天气预警方法及预警系统。
背景技术
雷暴天气的发生是大气中不稳定能量释放导致的结果,一般表现为在某个区域出现一个或者多个雷暴单体不断发展,引起剧烈天气出现,由于复杂的云物理特性和受雷暴发生的环境条件影响,雷暴发生具有较强的局地性。
目前,雷暴预警的研究方向主要是基于物理的方法和基于数据驱动的方法。基于物理的雷暴预警主要包括卫星对流分析与追踪算法、快速发展雷暴算法和雷暴临近预报方法,这些传统的基于物理的算法利用快速发展雷暴云具有云顶冷却率这一物理特性,通过组合静止卫星的多通道数据构建阈值判识条件从而监测雷暴。当前雷暴预警的方法多是采用美国开发的一种风暴检测算法“SATCASTv2”,该算法主要针对美国地区,利用地球静止环境业务卫星的多光谱通道构建阈值判别标准。在实际业务中,由于我国的气候特点与美国不同,尤其华南地区位于亚热带季风气候区,气候条件复杂,高温多雨,雷暴事件频发,直接应用现有算法的雷暴预警能力较低,已有判别标准无法满足我国局地雷暴预警需求。
近年来,应用机器学习结合各种类型的气象数据开展雷暴预警,如决策树、随机森林和人工神经网络,尤其是随机森林在挖掘历史气象数据的潜在模式和非线性关系方面表现出了更好的能力。与传统的雷暴预警方法高度依赖于判别阈值的选择不同,基于机器学习的雷暴预警方法可以通过融合多源数据来提高预测结果的准确度。但在雷暴预警研究中存在不同类型样本不平衡的问题,导致雷暴预测结果出现误报率过高且对强雷暴天气预警能力较弱的问题,严重阻碍了机器学习方法对强雷暴的预警能力。
虽然基于传统和基于机器学习的方法在雷暴预警方面都得到较高的命中率,但通常存在误报率过高的问题且和气象物理知识结合较弱。此外,不同强度雷暴事件样本的不平衡也阻碍了对强雷暴事件的预警能力、误报率较高。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于物理约束的雷暴天气预警方法及预警系统,具有降低误报率、提高雷暴天气预警能力的优点。
为实现上述目的及其他相关目的,本发明实施例第一方面提供如下技术方案:
一种基于物理约束的雷暴天气预警方法,包括:
获取特定区域、特定时间的葵花8号卫星数据、GPM融合降水数据、高程及纬度数据,并将葵花8号卫星数据和GPM融合降水数据的空间分辨率统一为一预定值;
采用红外亮温阈值法筛选亮温阈值低于253K的云团作为第一疑似雷暴云团,并采用最小距离法对第一疑似雷暴云团进行追踪,将连续两个时刻的云顶冷却率小于等于预定阈值的第一疑似雷暴云团标记为第二疑似雷暴云团;
选取葵花8号卫星中预定的若干通道建立阈值判识条件,并通过统计分析局地雷暴样本的光谱特征重新训练阈值判识标准;
对葵花8号卫星数据和GPM融合降水数据进行时空匹配处理构建样本数据集,并依据GPM融合降水数据提供的降雨率对所述样本数据集进行划分以得到不同强度的雷暴样本;
将葵花8号卫星数据、高程及纬度数据、基于物理约束的阈值判识条件输入随机森林模型中构建雷暴预警模型,并依据引入的多个评分指标对雷暴预警能力进行确定性和概率性评估。
于本发明的一实施例中,所述葵花8号卫星数据和GPM融合降水数据的空间分辨率统一为0.025°。
于本发明的一实施例中,所述采用红外亮温阈值法筛选亮温阈值低于253K的云团作为第一疑似雷暴云团具体为:
通过葵花8号卫星的10.4μm通道筛选亮温阈值低于253K的云团作为第一疑似雷暴云团,所述第一疑似雷暴云团的面积在1至96像元点之间。
于本发明的一实施例中,所述采用最小距离法对第一疑似雷暴云团进行追踪具体包括:
以时刻为基准进行最小距离计算;
根据局地极端风速按照距离计算公式计算、/>两个时刻云团之间的最大距离,并剔除超过最大距离的第一疑似雷暴云团,所述距离计算公式为:
(1)
(2)
(3)
(4)
其中,和/>分别表示在/>和/>时刻雷暴云团数;/>和/>分别表示第/>的云团在/>时刻的中心点和第/>个云团在/>时刻的中心点;/>表示在/>时刻的第/>个云团与/>时刻的第/>个云团中心点的距离;/>是第/>个云团在/>时刻出现的/>个距离中的最小值。
于本发明的一实施例中,所述将连续两个时刻的云顶冷却率小于等于预定阈值的第一疑似雷暴云团标记为第二疑似雷暴云团具体为:
选取所述第一疑似雷暴云团内最冷的10%像元点的平均值计算云团的云顶冷却率,当连续两个时刻的第一疑似雷暴云团的云顶冷却率小于等于-16K/h时,则将下一时刻的第一疑似雷暴云团标记为第二疑似雷暴云团。
于本发明的一实施例中,所述选取葵花8号卫星中预定的若干通道建立阈值判识条件,并通过统计分析局地雷暴样本的光谱特征重新训练阈值判识标准具体包括:
选取葵花8号卫星的6.2μm、10.4μm和13.3μm三个通道建立阈值判识条件,并通过统计分析局地雷暴样本的光谱特征选取雷暴事件第75百分位的样本数据作为训练条件重新训练阈值判识标准。
于本发明的一实施例中,所述对葵花8号卫星数据和GPM融合降水数据进行时空匹配处理构建样本数据集,并依据降雨率对所述样本数据集进行分类以得到不同强度的雷暴样本具体包括:
将时间分辨率为10分钟的葵花8号卫星数据作为输入值与时间分辨率为30分钟的GPM融合降水数据作为真值进行时空匹配处理构建样本数据集;
依据降雨率将所述样本数据集划分为云团内最大降雨率为0 mm/h的无雷暴事件、云团内最大降雨率小于2.5 mm/h的弱雷暴事件、云团内最大降雨率大于等于2.5 mm/h且小于16 mm/h的中等强度雷暴事件、云团内最大降雨率大于等于16 mm/h的强雷暴事件四种类型;
分别对四种类型的样本数据进行统计以得到不同强度的雷暴样本。
于本发明的一实施例中,所述得到不同强度的雷暴样本的同时,以误报率为依据利用样本平衡技术调整数据集中不同类型的样本比例。
于本发明的一实施例中,所述依据引入的多个评分指标对雷暴预警能力进行确定性和概率性评估具体包括:
引入命中率POD、误报率FAR和关键成功指数CSI三种评分指数进行确定性评估,所述三种评分指数基于二分类混淆矩阵计算得出,计算公式如下:
(5)
(6)
(7);
以假正类率FPR为横轴、正正类率TRP为纵轴构建ROC曲线进行概率性评估,其中假正类率FPR和正正类率TRP分别定义为:
(8)
(9);
其中,TP表示观测为正类、预测为正类;FN表示观测为正类、预测为负类;FP表示观测为负类、预测为正类 ;TN表示观测为负类、预测为负类。
本发明实施例第二方面提供一种基于物理约束的雷暴天气预警系统,包括:
数据预处理单元,用于获取特定区域、特定时间的葵花8号卫星数据、GPM融合降水数据、高程及纬度数据,并将葵花8号卫星数据和GPM融合降水数据的空间分辨率统一为一预定值;
目标识别追踪单元,用于采用红外亮温阈值法筛选亮温阈值低于253K的云团作为第一疑似雷暴云团,并采用最小距离法对第一疑似雷暴云团进行追踪,将连续两个时刻的云顶冷却率小于等于预定阈值的第一疑似雷暴云团标记为第二疑似雷暴云团;
阈值条件训练单元,用于选取葵花8号卫星中预定的若干通道建立阈值判识条件,并通过统计分析局地雷暴样本的光谱特征重新训练阈值判识标准;
样本构建分类单元,用于对葵花8号卫星数据和GPM融合降水数据进行时空匹配处理构建样本数据集,并依据GPM融合降水数据提供的降雨率对所述样本数据集进行划分以得到不同强度的雷暴样本;
模型构建评估单元,用于将葵花8号卫星数据、高程及纬度数据、基于物理约束的阈值判识条件输入随机森林模型中构建雷暴预警模型,并依据引入的多个评分指标对雷暴预警能力进行确定性和概率性评估。
如上所述,本发明的基于物理约束的雷暴天气预警方法及预警系统,具有以下有益效果:
本发明实施例通过提供一种基于物理约束的雷暴天气预警方法及预警系统,通过在随机森林模型中引入葵花8号卫星数据、高程及纬度数据及基于物理约束条件的阈值判识条件,构建一种基于物理条件约束的雷暴预警模型,结合建立阈值判识条件及训练的阈值判识标准,统计分析局地雷暴样本信息,从而能够更好地适应局地地区的气候特征和云物理特征,能够提供更准确的局地化雷暴天气预警服务,并能够降低误报率,更准确的捕捉真正有风险的雷暴天气,减少不必要的应急响应和资源调用,提高资源的利用效率;同时通过利用样本平衡技术调整数据集中不同类型雷暴事件的样本比例,使得模型能够更好地学习强雷暴事件发生的特征和规律,解决因样本不平衡导致的雷暴预测结果过度偏向的问题,从而提高强雷暴预测的准确性。
附图说明
图1显示为本发明实施例中公开的基于物理约束的雷暴天气预警方法的方法流程图。
图2显示为本发明实施例中公开的基于物理约束的雷暴天气预警方法中应用红外亮温阈值法得到的雷暴云团图。
图3显示为本发明实施例中公开的基于物理约束的雷暴天气预警方法中不同时刻的10.4μm亮温图。
图4显示为本发明实施例中公开的基于物理约束的雷暴天气预警方法中阈值判别条件示意图。
图5显示为本发明实施例中公开的基于物理约束的雷暴天气预警方法中强雷暴发生时的数据图。
图6显示为本发明实施例中公开的基于物理约束的雷暴天气预警系统的结构示意图。
图7显示为本发明实施例中计算机设备基本结构框图。
图中数字和字母所表示的相应部件名称:
601、数据预处理单元;602、目标识别追踪单元;603、阈值条件训练单元;604、样本构建分类单元;605、模型构建评估单元。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
请参阅图1至图4,本发明实施例第一方面提供一种基于物理约束的雷暴天气预警方法,包括:
S100、获取特定区域、特定时间的葵花8号卫星数据、GPM融合降水数据、高程及纬度数据,并将葵花8号卫星数据和GPM融合降水数据的空间分辨率统一为一预定值,其中,葵花8号卫星数据和GPM融合降水数据的空间分辨率统一为0.025°,高程及纬度数据为航天飞机雷达地形测绘生成的高程及纬度数据。
葵花8号卫星为三轴姿态控制的静止卫星,搭载的多通道光谱成像仪能够捕捉亚太地区的可见光和红外图像,观测频率由葵花7号卫星的每30分钟一次缩短至10分钟一次,卫星通道也由过去的5个增加至16个,空间分辨率也有所提高。全球降水观测计划(GlobalPrecipitation Measurement,GPM)是一项国际卫星任务,是利用多传感器多卫星多算法结合卫星网络和雨量计反演得到更高精度的降水数据,利用GPM中所有无源微波仪器的数据提供降水估计,生成能够提供全球范围内每30分钟一次的融合降水数据。
S200、采用红外亮温阈值法筛选亮温阈值低于253K的云团作为第一疑似雷暴云团,并采用最小距离法对第一疑似雷暴云团进行追踪,将连续两个时刻的云顶冷却率小于等于预定阈值的第一疑似雷暴云团标记为第二疑似雷暴云团。
其中,所述采用红外亮温阈值法筛选亮温阈值低于253K的云团作为第一疑似雷暴云团具体为:通过葵花8号卫星的10.4μm通道筛选亮温阈值低于253K的云团作为第一疑似雷暴云团,所述第一疑似雷暴云团的面积在1至96像元点之间。选取云团的面积在1至96像元点之间能够避免将大面积的系统性降水云识别在内,保证所选取的云团为局地突发的雷暴云团,如图2所示,图2示出了本发明实施例应用红外亮温阈值法得到的雷暴云团图。
所述采用最小距离法对第一疑似雷暴云团进行追踪具体包括:
S201、以时刻为基准进行最小距离计算,从而避免/>时刻云团出现时/>时刻云团消失;
S202、再根据局地极端风速按照距离计算公式计算、/>两个时刻云团之间的最大距离,并剔除超过最大距离的第一疑似雷暴云团,所述距离计算公式为:
(1)
(2)
(3)
(4)
其中,和/>分别表示在/>和/>时刻雷暴云团数;/>和/>分别表示第/>的云团在/>时刻的中心点和第/>个云团在/>时刻的中心点;/>表示在/>时刻的第/>个云团与/>时刻的第/>个云团中心点的距离;/>是第/>个云团在/>时刻出现的/>个距离中的最小值。
所述将连续两个时刻的云顶冷却率小于等于预定阈值的第一疑似雷暴云团标记为第二疑似雷暴云团具体为:选取所述第一疑似雷暴云团内最冷的10%像元点的平均值计算云团的云顶冷却率,当连续两个时刻的第一疑似雷暴云团的云顶冷却率小于等于-16K/h时,则将下一时刻的第一疑似雷暴云团标记为第二疑似雷暴云团,其中,第二疑似雷暴云团为可能发展为雷暴的云团。
以一具体实例为例:
利用葵花8号卫星数据,选用2018年8月17号三张连续影像分析雷暴云追踪的具体情况,当连续两个时刻的第一疑似雷暴云团的云顶冷却率≤-16K/h,将下一时刻的云团标记为可能发展为雷暴云。如图3所示,图3从左到右分别显示了第一疑似雷暴云团在04:50-05:10时间间隔为10分钟的葵花8号卫星10.4μm通道亮温图,该云团在04:50的通道亮温值为235K,05:00的通道亮温值为226K,05:10的通道亮温值为221K,从04:50-05:10连续两个时刻,该云团的云顶冷却率分别为-54K/h和-30K/h,云顶冷却率均低于-16K/h,则在下一时刻05:20时将该第一疑似雷暴云团标记为第二疑似雷暴云团,即可能发展为雷暴的云团。
S300、选取葵花8号卫星中预定的若干通道建立阈值判识条件,并通过统计分析局地雷暴样本的光谱特征重新训练阈值判识标准。其具体包括:
基于雷暴云团形成的物理特性,选取葵花8号卫星的6.2μm、10.4μm和13.3μm三个通道建立阈值判识条件,并通过统计分析局地雷暴样本的光谱特征选取雷暴事件第75百分位的样本数据作为训练条件重新训练阈值判识标准。阈值判识条件及其物理意义和阈值判识标准具体如表1所示:
表1 为阈值判识条件及物理意义和阈值判识标准对应表
具体如图4所示,图4示出了本发明实施例中阈值判别条件示意图,通过统计分析局地雷暴样本数量,参考诸葛小勇在我国华南地区训练参数的方法,选取第75百分位训练新的阈值判别标准。其中,“×”符号表示本发明中使用到雷暴事件;对应横轴的每个坐标左侧框体表格有雷暴、右侧框体表格有雷暴,下边框和上边框分别表示第25百分位和第75百分位,框内中间横线表示中位数。
本发明参考美国地球静止环境业务卫星的通道信息,从葵花8号卫星的红外通道中选取与其光谱特征类似的通道,通过统计分析局地雷暴云团的光谱特征重新训练阈值判别标准,旨在针对我国局部地区构建雷暴事件发生的阈值判别条件,训练阈值判识标准以提高雷暴预警能力,满足我国局地化雷暴预警需求。
S400、对葵花8号卫星数据和GPM融合降水数据进行时空匹配处理构建样本数据集,并依据GPM融合降水数据提供的降雨率对所述样本数据集进行划分以得到不同强度的雷暴样本。
其中,S400具体包括:
S401、将时间分辨率为10分钟的葵花8号卫星数据作为输入值与时间分辨率为30分钟的GPM融合降水数据作为真值进行时空匹配处理构建样本数据集;
S402、依据降雨率将所述样本数据集划分为云团内最大降雨率为0 mm/h的无雷暴事件、云团内最大降雨率小于2.5 mm/h的弱雷暴事件、云团内最大降雨率大于等于2.5 mm/h且小于16 mm/h的中等强度雷暴事件、云团内最大降雨率大于等于16 mm/h的强雷暴事件四种类型;
S403、分别对四种类型的样本数据进行统计以得到不同强度的雷暴样本。
同时,在得到不同强度的雷暴样本的同时,以误报率为依据利用样本平衡技术调整数据集中不同类型的样本比例。由于数据集中不同类别样本的比例会显著影响预测模型的最终精度,当模型训练中无雷暴事件样本的比例过多时,最终的预测将会偏向这种过度的类型,本发明实施例着重研究中等强度雷暴和强雷暴事件的预测问题,因此仅保留无雷暴、中等雷暴和强雷暴事件的样本。同时,通过样本平衡技术调整数据集中不同强度雷暴事件样本的比例,设置多个不同比例数据集场景,使得模型在保持较高的命中率的同时降低误报率。
以一具体实例为例:
本发明实施例首先利用最邻近插值法将葵花8号卫星数据与GPM 融合降水数据的空间分辨率统一为0.025°,将华南地区2018年6-8月葵花8号卫星数据作为输入值,GPM融合降水数据作为真值进行匹配。例如,如果葵花8号卫星在UTC 07:10识别到一个雷暴云,则使用UTC 07:30的融合降水数据来确定该云团的降雨率,若该云团在UTC 7:30的降雨率等于0mm/h,则使用UTC 8:00的融合降水数据来确定该云团的降雨率,以此完成葵花8号卫星数据与GPM 融合降水数据2小时内的匹配。将潜在雷暴云团前10% 最冷像素的最大降雨率(来自GPM 融合降水数据)标记为其最终降雨率,并基于配置的数据集,对2018年6-8月的雷暴事件样本进行跟踪识别。在此期间,利用上述方法成功追踪了20943个雷暴事件,包括5037个无雷暴事件、13161个弱雷暴事件、2674个中等雷暴事件和71强雷暴事件,2018年6月至8月追踪的四种类型雷暴事件的数量具体如表2所示:
表2为2018年6月至8月追踪的4种类型雷暴事件数量
S500、将葵花8号卫星数据、高程及纬度数据、基于物理约束的阈值判识条件输入随机森林模型中构建雷暴预警模型,其中,输入随机森林模型中的葵花8号卫星数据着重考虑除可见光通道以外的13个通道(通道4-16),并依据引入的多个评分指标对雷暴预警能力进行确定性和概率性评估。
由于雷暴天气是受多尺度系统共同影响产生的,其实际发生不仅与局地的温度、变温等有关,也与地形及其所在的气候带有关,为综合考虑多尺度系统和云物理约束条件对雷暴产生的影响,建立基于物理约束的雷暴预警模型。根据重新训练得到的新的雷暴云识别阈值判识标准,将符合判别阈值的设为1,反之设为0,再将该物理信息和原始的通道信息、纬度信息、地形信息同时输入到随机森林模型,将GPM 融合降水数据作为真值,进行训练,最终输出雷暴是否发生的结果和其发生时的强度,从而有效的降低误报率。
其中,依据引入的多个评分指标对雷暴预警能力进行确定性和概率性评估具体包括:
S501、引入命中率(probability of detection,POD)、误报率(false alarmratio,FAR)和关键成功指数(critical success index,CSI)三种评分指数进行确定性评估,三种评分指数的最优值分别为1、0、1,所述三种评分指数基于二分类混淆矩阵计算得出,计算公式如下:
(5)
(6)
(7);
二分类混淆矩阵具体如表3所示:
表3为二分类混淆矩阵
预测为正类 | 预测为负类 | |
观测为正类 | Ture Positive (TP) | False Negative (FN) |
观测为负类 | False Positive (FP) | True Negative (TN) |
S502、以假正类率(False Positive Rate,FPR)为横轴、正正类率(True PositiveRate,TPR)为纵轴构建(Receiver Operating Characteristic,ROC)曲线进行概率性评估,其中假正类率FPR和正正类率TRP分别定义为:
(8)
(9)。
ROC曲线下与坐标轴围成的面积被称为曲线下面积(Area Under Curve,AUC),介于0-1之间,用来表示预测结果的准确性。AUC的值越接近1,表示预测准确性越好,反之,表示预测准确性越差。
以一具体实例为例:
为了更好地分析不同阈值选择对雷暴事件的预测能力,对实验期间的雷暴事件进行统计分析。本发明实施例设置了四组对比实验来评估模型的性能,其中实验1和实验2为传统阈值判别方法,实验3和实验4为随机森林法。实验1输入为初始的6个阈值判识条件;实验2为重新训练阈值后的6个阈值判识条件,选择第75百分位设置新的阈值判识标准;实验3输入为葵花8号卫星除可见光通道外的13个红外通道(通道4-16);实验4输入为葵花8号卫星除可见光外13个通道、6个阈值判识条件、高程及纬度数据,其中75%为选择第75百分位设置新的阈值判识标准, 具体评估结果如表4所示。
表4为四组雷暴预警模型设置及评分结果
本发明实施例应用命中率、误报率和关键成功指数对不同实验进行统计分析,通过上表可以发现,相比实验1、实验2的命中率提高了0.18,误报率降低了0.22,整体成功指数提高了0.25,表明通过重新训练阈值选择第75百分位进行阈值设置,可以更好地提取云物理特性,降低误报率。相比实验3,实验4的命中率提高了0.05,误报率降低了0.06,关键成功指数提高了0.08,说明通过增加高程及纬度数据和基于物理约束条件的阈值判识条件能够提高对雷暴的预警能力。
本发明实施例通过在随机森林模型中引入葵花8号卫星数据、高程及纬度数据及基于物理约束条件的阈值判识条件,构建一种基于物理条件约束的雷暴预警模型,结合建立阈值判识条件及训练的阈值判识标准,统计分析局地雷暴样本信息,从而能够更好地适应局地地区的气候特征和云物理特征,能够提供更准确的局地化雷暴天气预警服务,并能够在提高对雷暴预测的命中率的同时降低误报率,实现雷暴提前预警,更准确的捕捉真正有风险的雷暴天气,减少不必要的应急响应和资源调用,提高资源的利用效率,同时使得预测结果的物理可解释性更强;同时通过利用样本平衡技术调整数据集中不同类型雷暴事件的样本比例,进一步优化样本数据集,使得模型能够更好地学习强雷暴事件发生的特征和规律,解决因样本不平衡导致的雷暴预测结果过度偏向的问题,从而提高强雷暴预测的准确性。
作为一个具体实例,通过采用上述预警方法,选用2018年7月16日UTC 17:10在中国广东省雷州市成功捕获的一个强雷暴案例。这场雷暴大概持续了2个小时,图5所示,图5为本实施例强雷暴发生时的数据图,图5的第一行表示基于物理条件约束的雷暴预警模型的葵花8号卫星6.2、10.4、13.3μm三通道合成的云追踪图像结果;第二行表示云追踪图像对应时刻的葵花8号卫星10.4μm通道亮温图;第三行显示由GPM 融合降水数据过去一小时(mm/h)的累计降雨率。
从图5的第一行可以看出,基于物理条件约束的雷暴预警模型最初在UTC 17:10成功捕获了一个突发的强雷暴事件。图5的最后一行的 GPM 融合降水数据清楚地显示首次降雨发生在UTC 18:00,在UTC 18:00时观测到的最大降雨率为16.2 mm/h,因此,在这种情况下,基于物理条件约束的雷暴预警模型可以比GPM融合降水产品提早50分钟捕捉到突发的强雷暴事件。同时,该模型可以预测该雷暴事件发生的概率为0.78,也给出了一个相对较大的概率信息。
本发明实施例第二方面提供一种基于物理约束的雷暴天气预警系统,包括:数据预处理单元601,用于获取特定区域、特定时间的葵花8号卫星数据、GPM融合降水数据、高程及纬度数据,并将葵花8号卫星数据和GPM融合降水数据的空间分辨率统一为一预定值;目标识别追踪单元602,用于采用红外亮温阈值法筛选亮温阈值低于253K的云团作为第一疑似雷暴云团,并采用最小距离法对第一疑似雷暴云团进行追踪,将连续两个时刻的云顶冷却率小于等于预定阈值的第一疑似雷暴云团标记为第二疑似雷暴云团;阈值条件训练单元603,用于选取葵花8号卫星中预定的若干通道建立阈值判识条件,并通过统计分析局地雷暴样本的光谱特征重新训练阈值判识标准;样本构建分类单元604,用于对葵花8号卫星数据和GPM融合降水数据进行时空匹配处理构建样本数据集,并依据降雨率对所述样本数据集进行划分以得到不同强度的雷暴样本;模型构建评估单元605,用于将葵花8号卫星数据、高程及纬度数据、基于物理约束的阈值判识条件输入随机森林模型中构建雷暴预警模型,并依据引入的多个评分指标对雷暴预警能力进行确定性和概率性评估。
本发明实施例通过模型构建评估单元在随机森林模型中引入葵花8号卫星数据、高程及纬度数据及基于物理约束条件的阈值判识条件,构建一种基于物理条件约束的雷暴预警模型,结合建立阈值判识条件及训练的阈值判识标准,统计分析局地雷暴样本信息,从而能够更好地适应局地地区的气候特征和云物理特征,能够提供更准确的局地化雷暴天气预警服务,并能够在提高对雷暴预测的命中率的同时降低误报率,实现雷暴提前预警,更准确的捕捉真正有风险的雷暴天气,减少不必要的应急响应和资源调用,提高资源的利用效率,同时使得预测结果的物理可解释性更强;同时通过样本构建分类单元利用样本平衡技术调整数据集中不同类型雷暴事件的样本比例,进一步优化样本数据集,使得模型能够更好地学习强雷暴事件发生的特征和规律,解决因样本不平衡导致的雷暴预测结果过度偏向的问题,从而提高强雷暴预测的准确性。
本发明实施例第三方面提供一种计算机设备。具体请参阅图7,图7为本实施例计算机设备基本结构框图。
该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中,该计算机设备的非易失性存储介质存储有操作系统、数据库和计算机可读指令,数据库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种反演方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种反演方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
本实施方式中处理器用于执行图6中数据预处理单元601、目标识别追踪单元602、阈值条件训练单元603、样本构建分类单元604和模型构建评估单元605的具体功能,存储器存储有执行上述模块所需的程序代码和各类数据。网络接口用于向用户终端或服务器之间的数据传输。服务器能够调用服务器的程序代码及数据执行所有子模块的功能。
计算机设备在进行雷暴天气预警时,通过在随机森林模型中引入葵花8号卫星数据、高程及纬度数据及基于物理约束条件的阈值判识条件,构建一种基于物理条件约束的雷暴预警模型,结合建立阈值判识条件及训练的阈值判识标准,统计分析局地雷暴样本信息,从而能够更好地适应局地地区的气候特征和云物理特征,能够提供更准确的局地化雷暴天气预警服务,并能够在提高对雷暴预测的命中率的同时降低误报率,实现雷暴提前预警,更准确的捕捉真正有风险的雷暴天气,减少不必要的应急响应和资源调用,提高资源的利用效率,同时使得预测结果的物理可解释性更强;同时通过利用样本平衡技术调整数据集中不同类型雷暴事件的样本比例,进一步优化样本数据集,使得模型能够更好地学习强雷暴事件发生的特征和规律,解决因样本不平衡导致的雷暴预测结果过度偏向的问题,从而提高强雷暴预测的准确性。
本发明实施例第四方面还提供一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述实施例雷暴天气预警方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
Claims (8)
1.一种基于物理约束的雷暴天气预警方法,其特征在于,包括:
获取特定区域、特定时间的葵花8号卫星数据、GPM融合降水数据、高程及纬度数据,并将葵花8号卫星数据和GPM融合降水数据的空间分辨率统一为一预定值;
采用红外亮温阈值法将通道亮温阈值低于253K的云团作为第一疑似雷暴云团,并采用最小距离法对第一疑似雷暴云团进行追踪,将连续两个时刻的云顶冷却率小于等于预定阈值的第一疑似雷暴云团标记为第二疑似雷暴云团;
选取葵花8号卫星中预定的若干通道建立阈值判识条件,并通过统计分析局地雷暴样本的光谱特征重新训练阈值判识标准;
对葵花8号卫星数据和GPM融合降水数据进行时空匹配处理构建样本数据集,并依据GPM融合降水数据提供的降雨率对所述样本数据集进行划分以得到不同强度的雷暴样本;
将葵花8号卫星数据、高程及纬度数据、基于物理约束的阈值判识条件输入随机森林模型中构建雷暴预警模型,并依据引入的多个评分指标对雷暴预警能力进行确定性和概率性评估;
其中,所述采用最小距离法对第一疑似雷暴云团进行追踪具体包括:
以时刻为基准进行最小距离计算;
根据局地极端风速按照距离计算公式计算、/>两个时刻云团之间的最大距离,并剔除超过最大距离的第一疑似雷暴云团,所述距离计算公式为:
(1)
(2)
(3)
(4)
其中,和/>分别表示在/>和/>时刻雷暴云团数;/>和/>分别表示第/>的云团在/>时刻的中心点和第/>个云团在/>时刻的中心点;/>表示在/>时刻的第个云团与/>时刻的第/>个云团中心点的距离;/>是第/>个云团在/>时刻出现的个距离中的最小值;
所述选取葵花8号卫星中预定的若干通道建立阈值判识条件,并通过统计分析局地雷暴样本的光谱特征重新训练阈值判识标准具体包括:
选取葵花8号卫星的6.2μm、10.4μm和13.3μm三个通道建立阈值判识条件,并通过统计分析局地雷暴样本的光谱特征选取雷暴事件第75百分位的样本数据作为训练条件重新训练阈值判识标准。
2.根据权利要求1所述的基于物理约束的雷暴天气预警方法,其特征在于,所述葵花8号卫星数据和GPM融合降水数据的空间分辨率统一为0.025°。
3.根据权利要求1或2所述的基于物理约束的雷暴天气预警方法,其特征在于,所述采用红外亮温阈值法筛选亮温阈值低于253K的云团作为第一疑似雷暴云团具体为:
通过葵花8号卫星的10.4μm通道筛选亮温阈值低于253K的云团作为第一疑似雷暴云团,所述第一疑似雷暴云团的面积在1至96像元点之间。
4.根据权利要求3所述的基于物理约束的雷暴天气预警方法,其特征在于,所述将连续两个时刻的云顶冷却率小于等于预定阈值的第一疑似雷暴云团标记为第二疑似雷暴云团具体为:
选取所述第一疑似雷暴云团内最冷的10%像元点的平均值计算云团的云顶冷却率,当连续两个时刻的第一疑似雷暴云团的云顶冷却率小于等于-16K/h时,则将下一时刻的第一疑似雷暴云团标记为第二疑似雷暴云团。
5.根据权利要求1所述的基于物理约束的雷暴天气预警方法,其特征在于,所述对葵花8号卫星数据和GPM融合降水数据进行时空匹配处理构建样本数据集,并依据降雨率对所述样本数据集进行分类以得到不同强度的雷暴样本具体包括:
将时间分辨率为10分钟的葵花8号卫星数据作为输入值与时间分辨率为30分钟的GPM融合降水数据作为真值进行时空匹配处理构建样本数据集;
依据降雨率将所述样本数据集划分为云团内最大降雨率为0 mm/h的无雷暴事件、云团内最大降雨率小于2.5 mm/h的弱雷暴事件、云团内最大降雨率大于等于2.5 mm/h且小于16mm/h的中等强度雷暴事件、云团内最大降雨率大于等于16 mm/h的强雷暴事件四种类型;
分别对四种类型的样本数据进行统计以得到不同强度的雷暴样本。
6.根据权利要求1或5所述的基于物理约束的雷暴天气预警方法,其特征在于,所述得到不同强度的雷暴样本的同时,以误报率为依据利用样本平衡技术调整数据集中不同类型的样本比例。
7.根据权利要求1所述的基于物理约束的雷暴天气预警方法,其特征在于,所述依据引入的多个评分指标对雷暴预警能力进行确定性和概率性评估具体包括:
引入命中率POD、误报率FAR和关键成功指数CSI三种评分指数进行确定性评估,所述三种评分指数基于二分类混淆矩阵计算得出,计算公式如下:
(5)
(6)
(7);
以假正类率FPR为横轴、正正类率TRP为纵轴构建ROC曲线进行概率性评估,其中假正类率FPR和正正类率TRP分别定义为:
(8)
(9);
其中,TP表示观测为正类、预测为正类;FN表示观测为正类、预测为负类;FP表示观测为负类、预测为正类;TN表示观测为负类、预测为负类。
8.一种基于物理约束的雷暴天气预警系统,其特征在于,包括:
数据预处理单元,用于获取特定区域、特定时间的葵花8号卫星数据、GPM融合降水数据、高程及纬度数据,并将葵花8号卫星数据和GPM融合降水数据的空间分辨率统一为一预定值;
目标识别追踪单元,用于采用红外亮温阈值法筛选亮温阈值低于253K的云团作为第一疑似雷暴云团,并采用最小距离法对第一疑似雷暴云团进行追踪,将连续两个时刻的云顶冷却率小于等于预定阈值的第一疑似雷暴云团标记为第二疑似雷暴云团;
阈值条件训练单元,用于选取葵花8号卫星中预定的若干通道建立阈值判识条件,并通过统计分析局地雷暴样本的光谱特征重新训练阈值判识标准;
样本构建分类单元,用于对葵花8号卫星数据和GPM融合降水数据进行时空匹配处理构建样本数据集,并依据GPM融合降水数据提供的降雨率对所述样本数据集进行划分以得到不同强度的雷暴样本;
模型构建评估单元,用于将葵花8号卫星数据、高程及纬度数据、基于物理约束的阈值判识条件输入随机森林模型中构建雷暴预警模型,并依据引入的多个评分指标对雷暴预警能力进行确定性和概率性评估;
其中,所述目标识别追踪单元采用最小距离法对第一疑似雷暴云团进行追踪具体包括:
以时刻为基准进行最小距离计算;
根据局地极端风速按照距离计算公式计算、/>两个时刻云团之间的最大距离,并剔除超过最大距离的第一疑似雷暴云团,所述距离计算公式为:
(1)
(2)
(3)
(4)
其中,和/>分别表示在/>和/>时刻雷暴云团数;/>和/>分别表示第/>的云团在/>时刻的中心点和第/>个云团在/>时刻的中心点;/>表示在/>时刻的第个云团与/>时刻的第/>个云团中心点的距离;/>是第/>个云团在/>时刻出现的个距离中的最小值;
所述阈值条件训练单元选取葵花8号卫星中预定的若干通道建立阈值判识条件,并通过统计分析局地雷暴样本的光谱特征重新训练阈值判识标准具体包括:
选取葵花8号卫星的6.2μm、10.4μm和13.3μm三个通道建立阈值判识条件,并通过统计分析局地雷暴样本的光谱特征选取雷暴事件第75百分位的样本数据作为训练条件重新训练阈值判识标准。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410131744.0A CN117725523B (zh) | 2024-01-31 | 2024-01-31 | 基于物理约束的雷暴天气预警方法及预警系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410131744.0A CN117725523B (zh) | 2024-01-31 | 2024-01-31 | 基于物理约束的雷暴天气预警方法及预警系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117725523A CN117725523A (zh) | 2024-03-19 |
CN117725523B true CN117725523B (zh) | 2024-04-12 |
Family
ID=90203738
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410131744.0A Active CN117725523B (zh) | 2024-01-31 | 2024-01-31 | 基于物理约束的雷暴天气预警方法及预警系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117725523B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108537368A (zh) * | 2018-03-20 | 2018-09-14 | 国家气象中心 | 一种闪电预警方法、装置及系统 |
CN109738970A (zh) * | 2018-12-07 | 2019-05-10 | 国网江苏省电力有限公司电力科学研究院 | 基于雷电数据挖掘实现雷电预警的方法、装置和存储介质 |
CN115437036A (zh) * | 2022-08-25 | 2022-12-06 | 张立霞 | 一种基于葵花卫星的对流初生预报方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114019514B (zh) * | 2021-11-25 | 2022-11-01 | 浙江省气象台 | 一种雷暴大风预警方法、系统、设备及终端 |
-
2024
- 2024-01-31 CN CN202410131744.0A patent/CN117725523B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108537368A (zh) * | 2018-03-20 | 2018-09-14 | 国家气象中心 | 一种闪电预警方法、装置及系统 |
CN109738970A (zh) * | 2018-12-07 | 2019-05-10 | 国网江苏省电力有限公司电力科学研究院 | 基于雷电数据挖掘实现雷电预警的方法、装置和存储介质 |
CN115437036A (zh) * | 2022-08-25 | 2022-12-06 | 张立霞 | 一种基于葵花卫星的对流初生预报方法 |
Also Published As
Publication number | Publication date |
---|---|
CN117725523A (zh) | 2024-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109738970B (zh) | 基于雷电数据挖掘实现雷电预警的方法、装置和存储介质 | |
CN108037770B (zh) | 基于人工智能的无人机输电线路巡检系统和方法 | |
CN113496104B (zh) | 基于深度学习的降水预报订正方法及系统 | |
CN107728234B (zh) | 一种基于大气电场数据的雷电强度值预测方法 | |
CN109935080B (zh) | 一种交通线路上的车流量实时计算的监测系统及方法 | |
Ghorbanzadeh et al. | Dwelling extraction in refugee camps using cnn–first experiences and lessons learnt | |
CN111339826B (zh) | 一种滑坡无人机线性传感器网络框架检测系统 | |
CN115761513A (zh) | 一种半监督深度学习的山区大型滑坡智能遥感识别方法 | |
Song et al. | Deformable YOLOX: Detection and rust warning method of transmission line connection fittings based on image processing technology | |
CN118470550B (zh) | 一种自然资源资产数据采集方法及平台 | |
KR101274200B1 (ko) | 태풍을 포함하는 저기압 접근 시 재해기상의 시공간적 분포 검색 시스템 | |
Liu et al. | Ground-based cloud classification using weighted local binary patterns | |
CN115690545B (zh) | 训练目标跟踪模型和目标跟踪的方法和装置 | |
CN115272882A (zh) | 一种基于遥感影像的离散建筑物检测方法及系统 | |
Wu et al. | Post-flood disaster damaged houses classification based on dual-view image fusion and Concentration-Based Attention Module | |
Wang et al. | Deep learning in extracting tropical cyclone intensity and wind radius information from satellite infrared images—A review | |
CN113870224A (zh) | 一种洪水监测方法、系统、设备和介质 | |
CN117710508A (zh) | 基于改进条件生成对抗网络的近地表温度反演方法和装置 | |
CN117725523B (zh) | 基于物理约束的雷暴天气预警方法及预警系统 | |
CN112966656A (zh) | 数据处理方法及装置 | |
CN116879900A (zh) | 一种基于灰度处理的雷暴质心定位以及追踪预测方法 | |
CN116704366A (zh) | 基于transformer深度学习模型的暴雨落区识别预警方法和装置 | |
Nakagawa et al. | Application of random forest to classify weather observation into rainfall using GNSS receiver | |
Czibula et al. | RadRAR: A relational association rule mining approach for nowcasting based on predicting radar products’ values | |
CN113936300A (zh) | 建筑工地人员识别方法、可读存储介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |