CN115236676B - 一种基于滑动时空匹配的冰雹数据集生成方法和装置 - Google Patents

一种基于滑动时空匹配的冰雹数据集生成方法和装置 Download PDF

Info

Publication number
CN115236676B
CN115236676B CN202211162612.1A CN202211162612A CN115236676B CN 115236676 B CN115236676 B CN 115236676B CN 202211162612 A CN202211162612 A CN 202211162612A CN 115236676 B CN115236676 B CN 115236676B
Authority
CN
China
Prior art keywords
hail
data
storm
ground
storm body
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211162612.1A
Other languages
English (en)
Other versions
CN115236676A (zh
Inventor
柴文涛
钟科
林超
薛洪斌
谭永强
陈云刚
张一明
任强
谢仲华
郭振东
张志杰
邢武杰
孙永尚
王相浩
刘雪莲
张会彬
宋敏敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Hongxiang Technology Co ltd
Original Assignee
Beijing Hongxiang Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Hongxiang Technology Co ltd filed Critical Beijing Hongxiang Technology Co ltd
Priority to CN202211162612.1A priority Critical patent/CN115236676B/zh
Publication of CN115236676A publication Critical patent/CN115236676A/zh
Application granted granted Critical
Publication of CN115236676B publication Critical patent/CN115236676B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S13/00Systems using the reflection or reradiation of radio waves, e.g. radar systems; Analogous systems using reflection or reradiation of waves whose nature or wavelength is irrelevant or unspecified
    • G01S13/88Radar or analogous systems specially adapted for specific applications
    • G01S13/95Radar or analogous systems specially adapted for specific applications for meteorological use
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S7/00Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
    • G01S7/02Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00
    • G01S7/41Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S13/00 using analysis of echo signal for target characterisation; Target signature; Target cross-section
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/10Devices for predicting weather conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Remote Sensing (AREA)
  • Software Systems (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Electromagnetism (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Atmospheric Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Ecology (AREA)
  • Environmental Sciences (AREA)
  • Radar Systems Or Details Thereof (AREA)

Abstract

本发明提供了一种基于滑动时空匹配的冰雹数据集生成方法和装置,涉及数据处理的技术领域,包括:获取待匹配区域的多普勒天气雷达基数据和地面降雹数据;对多普勒天气雷达基数据进行解析,确定出待匹配区域的风暴体和风暴体的特征参数;对风暴体和地面降雹数据进行滑动时空匹配,确定出地面降雹数据对应的风暴体;基于地面降雹数据对应的风暴体的特征参数和地面降雹数据,构建冰雹数据集,解决了现有的冰雹数据集的可用性和可靠性较差的技术问题。

Description

一种基于滑动时空匹配的冰雹数据集生成方法和装置
技术领域
本发明涉及数据处理的技术领域,尤其是涉及一种基于滑动时空匹配的冰雹数据集生成方法和装置。
背景技术
冰雹属于强对流天气类型的之一,是一种灾害性天气。当气温降到一定程度时,空气中水蒸气过饱和,就会降雨,如果温度急剧下降,就会形成冰雹,冰雹也被称为雹,它俗称雹子,部分地区叫冷子,是一种天气现象,冰雹在夏季或者春夏交替期间比较常见,这时候空气湿度很大,比较容易出现不稳定的温度气候。冰雹天气对许多行业有不同的负面影响:一般冰雹灾害出现的范围比较小、时间也比较短,但是来势凶猛、强度大,常常伴随着狂风、强降水、急剧降温等灾害性天气,农林、通讯、建筑等行业以及人民生命财产带来巨大损失。因此对于冰雹这一类灾害性天气的监测与预警是十分必要的,然而,如何得到高质量的冰雹数据集是此领域研究中较为棘手的问题之一。
针对上述问题,还未提出有效的解决方案。
发明内容
有鉴于此,本发明的目的在于提供一种基于滑动时空匹配的冰雹数据集生成方法和装置,以缓解了现有的冰雹数据集的可用性和可靠性较差的技术问题。
第一方面,本发明实施例提供了一种基于滑动时空匹配的冰雹数据集生成方法,包括:获取待匹配区域的多普勒天气雷达基数据和地面降雹数据;对所述多普勒天气雷达基数据进行解析,确定出所述待匹配区域的风暴体和所述风暴体的特征参数;对所述风暴体和所述地面降雹数据进行滑动时空匹配,确定出所述地面降雹数据对应的风暴体;基于所述地面降雹数据对应的风暴体的特征参数和所述地面降雹数据,构建冰雹数据集。
进一步地,对所述多普勒天气雷达基数据进行解析,确定出所述待匹配区域的风暴体和所述风暴体的特征参数,包括:对所述多普勒天气雷达基数据进行解析,得到目标数据,其中,所述目标数据包括:雷达基本反射率因子,雷达组合反射率因子,径向速度和谱宽;基于所述目标数据和预设风暴体提取算法,确定出所述风暴体;对所述风暴体进行特征参数提取,得到所述风暴体的特征参数,其中,所述特征参数包括:风暴体的生成时间,风暴体对应的地理位置信息,垂直累积液态含水量,风暴顶高,45dBz所在高度,最大反射率因子所在高度和风暴的最大反射率。
进一步地,所述地面降雹数据包括:发生冰雹的开始时间和结束时间,发生冰雹的地理位置信息和质量控制信息,其中,所述质量控制信息用于表征地面降雹数据的准确程度。
进一步地,对所述风暴体和所述地面降雹数据进行滑动时空匹配,确定出所述地面降雹数据对应的风暴体,包括:基于所述增强型冰雹探测算法,对所述风暴体和所述地面降雹数据进行滑动时空匹配,确定出所述地面降雹数据对应的风暴体。
进一步地,基于所述增强型冰雹探测算法,对所述风暴体和所述地面降雹数据进行滑动时空匹配,确定出所述地面降雹数据对应的风暴体,包括:基于所述风暴体对应的地理位置信息和所述发生冰雹的地理位置信息,确定出初始风暴体;基于所述初始风暴体的生成时间和所述发生冰雹的开始时间和结束时间,确定出所述地面降雹数据对应的风暴体。
进一步地,基于所述风暴体对应的地理位置信息和所述发生冰雹的地理位置信息,确定出初始风暴体,包括:基于所述发生冰雹的地理位置信息、空间范围变量滑动系数和机器学习算法,确定出目标空间范围;所述风暴体对应的地理位置信息,将地理位置信息处于所述目标空间范围内的风暴体,确定为所述初始风暴体。
进一步地,基于所述初始风暴体的生成时间和所述发生冰雹的开始时间和结束时间,确定出所述地面降雹数据对应的风暴体,包括:基于所述发生冰雹的开始时间和结束时间,以及时间窗变量滑动系数,确定出目标时间窗;基于所述初始风暴体的生成时间,将所述开始时间和结束时间处于所述目标时间窗内的初始风暴体,确定为所述地面降雹数据对应的风暴体。
第二方面,本发明实施例还提供了一种基于滑动时空匹配的冰雹数据集生成装置,包括:获取单元,解析单元,确定单元和构建单元,其中,所述获取单元,用于获取待匹配区域的多普勒天气雷达基数据和地面降雹数据;所述解析单元,用于对所述多普勒天气雷达基数据进行解析,确定出所述待匹配区域的风暴体和所述风暴体的特征参数;所述确定单元,用于对所述风暴体和所述地面降雹数据进行滑动时空匹配,确定出所述地面降雹数据对应的风暴体;所述构建单元,用于基于所述地面降雹数据对应的风暴体的特征参数和所述地面降雹数据,构建冰雹数据集。
第三方面,本发明实施例还提供了一种电子设备,包括存储器以及处理器,所述存储器用于存储支持处理器执行上述第一方面中所述方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
第四方面,本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序。
在本发明实施例中,通过获取待匹配区域的多普勒天气雷达基数据和地面降雹数据;对所述多普勒天气雷达基数据进行解析,确定出所述待匹配区域的风暴体和所述风暴体的特征参数;对所述风暴体和所述地面降雹数据进行滑动时空匹配,确定出所述地面降雹数据对应的风暴体;基于所述地面降雹数据对应的风暴体的特征参数和所述地面降雹数据,构建冰雹数据集,达到了从时间和空间两个方面对多普勒天气雷达基数据和地面降雹数据进行匹配的目的,进而解决了现有的冰雹数据集的可用性和可靠性较差的技术问题,从而实现了提高冰雹识别的准确率的技术效果。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种基于滑动时空匹配的冰雹数据集生成方法的流程图;
图2为本发明实施例提供的半径为20km时风暴体与地表降雹数据的示意图;
图3为本发明实施例提供的20min时间窗的示意图;
图4为本发明实施例提供的确定目标空间范围的示意图;
图5为本发明实施例提供的确定目标时间窗的示意图;
图6为本发明实施例提供的一种基于滑动时空匹配的冰雹数据集生成装置的示意图;
图7为本发明实施例提供的一种电子设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
根据本发明实施例,提供了一种基于滑动时空匹配的冰雹数据集生成方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的一种基于滑动时空匹配的冰雹数据集生成方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,获取待匹配区域的多普勒天气雷达基数据和地面降雹数据;
需要说明的是,上述的地面降雹数据包括:发生冰雹的开始时间和结束时间,发生冰雹的地理位置信息和质量控制信息,其中,所述质量控制信息用于表征地面降雹数据的准确程度。
发生冰雹的地理位置信息由经纬度表征。
步骤S104,对所述多普勒天气雷达基数据进行解析,确定出所述待匹配区域的风暴体和所述风暴体的特征参数;
步骤S106,对所述风暴体和所述地面降雹数据进行滑动时空匹配,确定出所述地面降雹数据对应的风暴体;
步骤S108,基于所述地面降雹数据对应的风暴体的特征参数和所述地面降雹数据,构建冰雹数据集。
在本发明实施例中,通过获取待匹配区域的多普勒天气雷达基数据和地面降雹数据;对所述多普勒天气雷达基数据进行解析,确定出所述待匹配区域的风暴体和所述风暴体的特征参数;对所述风暴体和所述地面降雹数据进行滑动时空匹配,确定出所述地面降雹数据对应的风暴体;基于所述地面降雹数据对应的风暴体的特征参数和所述地面降雹数据,构建冰雹数据集,达到了从时间和空间两个方面对多普勒天气雷达基数据和地面降雹数据进行匹配的目的,进而解决了现有的冰雹数据集的可用性和可靠性较差的技术问题,从而实现了提高冰雹识别的准确率的技术效果。
在本发明实施例中,步骤S104包括如下步骤:
步骤S11,对所述多普勒天气雷达基数据进行解析,得到目标数据,其中,所述目标数据包括:雷达基本反射率因子,雷达组合反射率因子,径向速度和谱宽;
步骤S12,基于所述目标数据和预设风暴体提取算法,确定出所述风暴体;
步骤S14,对所述风暴体进行特征参数提取,得到所述风暴体的特征参数,其中,所述特征参数包括:风暴体的生成时间,风暴体对应的地理位置信息,垂直累积液态含水量,风暴顶高,45dBz所在高度,最大反射率因子所在高度和风暴的最大反射率。
在本发明实施例中,多普勒天气雷达基数据为二进制数据,对多普勒天气雷达基数据进行解析,得到包括雷达基本反射率因子,雷达组合反射率因子,径向速度和谱宽的目标数据。
接着,利用使用SCIT或算法TITAN算法和目标数据,确定出多普勒天气雷达基数据包括的风暴体。
最后,对风暴体进行特征参数提取,得到风暴体的特征参数。
下面对特征参数进行说明。
垂直累积液态含水量(VIL):
Figure M_220906145557025_025472001
其中,
Figure M_220906145557152_152905001
为第i层高度上的雷达反射率因子,
Figure M_220906145557168_168531002
为第i层和第i+1层之间的高度差,n为风暴体高度的层数;
风暴顶高(H_top):是指风暴体最顶部的高度。本发明的方法为先识别出独立的三维风暴体,计算单体在同一位置上存在反射率值大于30dBZ的点,则最高点所在高度为风暴顶高;
45dBZ所在高度(H_45):含义是指三维风暴体中反射率为45dBZ所在高度的最大值;
最大反射率因子所在高度(H_Rmax):含义是某一风暴体中最大反射率所在高度,它可以突出风暴体核心位置,对特定强天气及其发展潜势具有指导性意义;
风暴的最大反射率(Rmax):含义是风暴体在发生发展过程中其能够达到的最大值,其大小与探测物质的直径大小有关;
风暴体对应的地理位置信息可以通过如下方法确定:
在多普勒雷达基数据中,使用坐标系变化方法,转为直角坐标系,将使用像素值对于经纬度的方法确定风暴体在雷达数据中的空间位置;
经纬度在经度和纬度上的度数与实际公里数的换算:(在不考虑海拔高度的情况下,赤道上一个经度111km,其他地方为11km1×cos纬度数。如:北纬60度上,东经120度与东经121度相差111km×cos60度,即为55.5km)。
纬度距离:1个纬度为111千米(km),0.1纬度即使11.1千米(km);
经度距离:111km×0.001×cosA(A为风暴体所在纬度)。
在空间关系中,坐标系转换的相关方法如下所示:
Figure M_220906145557199_199794001
Figure M_220906145557231_231031001
其中,
Figure M_220906145557294_294561001
Figure M_220906145557311_311581002
分别表示经度和纬度,
Figure M_220906145557405_405337003
Figure M_220906145557452_452220004
分别表示最小经度和最大纬度,
Figure M_220906145557485_485404005
Figure M_220906145557501_501534006
表示每像素所代表的经度和纬度或者叫做比例因子,
Figure M_220906145557532_532791007
Figure M_220906145557548_548426008
分别表示经纬度点所对应的像素坐标位置;
在空间关系中,由于多普勒雷达基数据中有中心经纬度,记作:
Figure M_220906145557579_579676001
Figure M_220906145557595_595287002
,若该雷达基数据原始像素宽度为
Figure M_220906145557610_610917003
,高度为
Figure M_220906145557642_642174004
,那么,风暴体对应的经纬度有如下的描述:
Figure M_220906145557657_657809001
Figure M_220906145557709_709063001
需要说明的是,由于使用的是单站雷达,雷达中心点距离附近观察地理位置处,因此忽略了地球球面的问题,因为在较近地理方位上的弧面造成的误差可以适当的忽略,当然本生中虽未考虑弧面影响,但是本发明的公式中保留弧面影响参数
Figure M_220906145557740_740311001
Figure M_220906145557771_771568002
在本发明实施例中,步骤S106包括如下步骤:
基于所述增强型冰雹探测算法,对所述风暴体和所述地面降雹数据进行滑动时空匹配,确定出所述地面降雹数据对应的风暴体。
具体的,基于所述风暴体对应的地理位置信息和所述发生冰雹的地理位置信息,确定出初始风暴体;
基于所述初始风暴体的生成时间和所述发生冰雹的开始时间和结束时间,确定出所述地面降雹数据对应的风暴体。
其中,基于所述风暴体对应的地理位置信息和所述发生冰雹的地理位置信息,确定出初始风暴体,包括:
基于所述发生冰雹的地理位置信息、空间范围变量滑动系数和机器学习算法,确定出目标空间范围;
所述风暴体对应的地理位置信息,将地理位置信息处于所述目标空间范围内的风暴体,确定为所述初始风暴体。
基于所述初始风暴体的生成时间和所述发生冰雹的开始时间和结束时间,确定出所述地面降雹数据对应的风暴体,包括:
基于所述发生冰雹的开始时间和结束时间,以及时间窗变量滑动系数,确定出目标时间窗;
基于所述初始风暴体的生成时间,将所述开始时间和结束时间处于所述目标时间窗内的初始风暴体,确定为所述地面降雹数据对应的风暴体。
由于地面降雹数据缺乏对风暴体的详细描述,为了将地面的降雹记录与特定的风暴体联系确定哪些单体是降雹单体,参考增强型冰雹探测算法,该方法的主要描述为:在地面有降雹数据的半径为20km 范围内的风暴体确定为初始风暴体,如图2所示,其中圆环表示风暴体的边界位置,中心点表示地面降雹数据,半径为r=20km,即风暴体与地面降雹数据匹配的边界为20km,定义域为[0,20]km,即在此范围内的空间上均表示该地面降雹数据对应的初始风暴体,考虑20km的降雹记录影响范围,主要是因为以下几方面的原因:一是在时间窗内,风暴有一个移动范围;二是降雹点并不一定在风暴的质心上;三是记录的降雹地点有一定误差。
接着,参考增强型冰雹探测算法中的时间窗方法,时间窗的确定主要考虑冰雹已经在风暴体中生成,并降落到地面的时间,这个时间大约为10min,考虑到降雹时间与雷达观测时间的同步误差,在这个时间间隔 (10min≤△t≤0)前后各加5min,即目标时间窗为20min,其中,△t为发生冰雹的开始时间和结束时间之间的时间段,如图3所示,其中水平实线上面的圆圈表示风暴体,实线下面的圆圈表示的是地表降雹数据,其中“T=0此刻”表示现在时间,在时间窗=20min内的初始风暴体(即,地表降雹数据对应的风暴体)均可与T=0此刻的地表降雹数据进行匹配。
需要说明的是,滑动时空匹配方法是作用在时间关系和空间关系上的一种方法,这种方法主要是通过计算机机器学习技术学习到不同滑动系数窗上的参数对于评价结果的影响,在建立的确定数据集合上调整滑动参数。
因此,本申请中将上述目标时间窗为20min的结论进行优化,将此时间窗设置为变量,且在评价体系中观察目标时间窗的性能。
对目标空间范围20km的结论进行优化,将此空间范围设置为变量,且在评价体系中观察该距离所对应的性能;
滑动时空匹配方法主要将时间窗和目标空间范围设置为变量,该变量是基于机器学习模型以及相应评价体系而确定的,通过尝试不同变量系数在模型的训练下得到的评价结果,从而确定变量系数的优劣。
在本发明实施例中,是对于数据集在冰雹识别上应用的研究,因此建立相关机器学习模型,任务分型为:分类任务;其评价方法选用:命中率(Probability Of Detection,POD)、误报率(False Alarm Ratio, FAR)和关键成功指数(Critical Success Index,CSI/TS),可以综合反映雷达产品对冰雹事件发生的客观价值;
如图4所示,不同大小的圆圈表示风暴体边界到地表降雹数据的不同情况,这里采用k个不同的方案,如图中
Figure M_220906145557787_787188001
表示第k个方案下的情况,将不同方案下的半径所匹配组成的k个不同训练集分别放入某个或多个指定的机器学习模型当中学习,通过相关评价函数(如CSI/TS评分)来选择最佳半径
Figure M_220906145557818_818476002
km;
关于上述采用k个不同的方案所选用的方法还有如下备选方案:
等距离的选择k个半径,如设置一个
Figure M_220906145557834_834049001
km,将得到连续的k个不同半径序列;
不等距离的选择k个半径,采用相关随机因子,设置k个不同半径序列;
Figure M_220906145557865_865339001
km的值进行缩放,基于最后的评价函数,设置早停条件,在某一条件满足的情况下,停止半径的模型训练,不在训练新的模型,此次选择的半径数量设置为
Figure M_220906145557882_882857002
,存在
Figure M_220906145557914_914621003
的情况;
其他相关算法用来生成k个或者如3)中所示的
Figure M_220906145557930_930244001
个情况;
如图5所示,水平实线上方的圆圈表示风暴体,水平实线下方的圆圈表示冰雹实况数据,其中“T=0此刻“表示当前风暴体与冰雹实况数据完全相同的时间匹配,设置一个时间窗,表示在此范围内的风暴体均可与“T=0此刻“的冰雹实况数据匹配,其时间窗公式为:
时间窗=(| T - k×
Figure M_220906145557961_961483001
|+ T + m×
Figure M_220906145557977_977124002
)min
其中,| T - k×
Figure M_220906145557992_992762001
| min和T + m×
Figure M_220906145558024_024004002
min 分别表示在前面k个不同时次和后面m个不同时次在相同的时间间隔
Figure M_220906145558039_039624003
min所参产生
Figure M_220906145558055_055254004
个时间窗,从而得到不同时间窗下在不同模型下的评价结果;
在数据质量衡量算法上使用机器学习算法,参考的具体算法有随机森林、GBDT和LightGBM等方法,将基本数据集划分为训练集和测试集,通过相关模型评价指标,来衡量滑动时空匹配方法;
其中模型建立方法如下:
训练多个模型,多个模型可以是相同模型,也可以是不同的模型,在随机试验下或者在不同参数下得到多个模型,使用相同的输入经过多个模型,对结果求平均运算,得到的结果符合客观规律;
在模型构建过程中,本发明选用LightGBM模型,在不同参数下得到多个模型,对其结果求均值运算;
本发明涉及计算机人工智能技术与大气科学交叉领域,提出一种基于滑动时空匹配的高质量冰雹数据集生成方法,通过对多普勒雷达基数据的解析,得到风暴体和相关特征,基于一种滑动时空匹配方式,将风暴数据与地面冰雹实况数据相匹配;在评价函数参与结果筛选的情况下得到在时间和空间上最优的半径和时间窗,从而得到高质量的冰雹数据集,用于相关行业和项目的开展,如冰雹天气的识别和预警等;
本发明实施例,提出一种基于滑动时空匹配的高质量冰雹数据集生成方法,其能够在结合气象领域知识和计算机技术,在两种数据中使用机器学习模型,基于评价指标得到优秀的半径和时间窗(时间和空间上)参数,从而建立高质量的冰雹数据集。
实施例二:
本发明实施例还提供了一种基于滑动时空匹配的冰雹数据集生成装置,该基于滑动时空匹配的冰雹数据集生成装置用于执行本发明实施例上述内容所提供的基于滑动时空匹配的冰雹数据集生成方法,以下是本发明实施例提供的基于滑动时空匹配的冰雹数据集生成装置的具体介绍。
如图6所示,图6为上述基于滑动时空匹配的冰雹数据集生成装置的示意图,该基于滑动时空匹配的冰雹数据集生成装置包括:获取单元10,解析单元20,确定单元30和构建单元40。
所述获取单元,用于获取待匹配区域的多普勒天气雷达基数据和地面降雹数据;
所述解析单元,用于对所述多普勒天气雷达基数据进行解析,确定出所述待匹配区域的风暴体和所述风暴体的特征参数;
所述确定单元,用于对所述风暴体和所述地面降雹数据进行滑动时空匹配,确定出所述地面降雹数据对应的风暴体;
所述构建单元,用于基于所述地面降雹数据对应的风暴体的特征参数和所述地面降雹数据,构建冰雹数据集。
在本发明实施例中,通过获取待匹配区域的多普勒天气雷达基数据和地面降雹数据;对所述多普勒天气雷达基数据进行解析,确定出所述待匹配区域的风暴体和所述风暴体的特征参数;对所述风暴体和所述地面降雹数据进行滑动时空匹配,确定出所述地面降雹数据对应的风暴体;基于所述地面降雹数据对应的风暴体的特征参数和所述地面降雹数据,构建冰雹数据集,达到了从时间和空间两个方面对多普勒天气雷达基数据和地面降雹数据进行匹配的目的,进而解决了现有的冰雹数据集的可用性和可靠性较差的技术问题,从而实现了提高冰雹识别的准确率的技术效果。
实施例三:
本发明实施例还提供了一种电子设备,包括存储器以及处理器,所述存储器用于存储支持处理器执行上述实施例一中所述方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
参见图7,本发明实施例还提供一种电子设备100,包括:处理器50,存储器51,总线52和通信接口53,所述处理器50、通信接口53和存储器51通过总线52连接;处理器50用于执行存储器51中存储的可执行模块,例如计算机程序。
其中,存储器51可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口53(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线52可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器51用于存储程序,所述处理器50在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器50中,或者由处理器50实现。
处理器50可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器50中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器50可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器51,处理器50读取存储器51中的信息,结合其硬件完成上述方法的步骤。
实施例四:
本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述实施例一中所述方法的步骤。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (5)

1.一种基于滑动时空匹配的冰雹数据集生成方法,其特征在于,包括:
获取待匹配区域的多普勒天气雷达基数据和地面降雹数据;
对所述多普勒天气雷达基数据进行解析,确定出所述待匹配区域的风暴体和所述风暴体的特征参数;
对所述风暴体和所述地面降雹数据进行滑动时空匹配,确定出所述地面降雹数据对应的风暴体;
基于所述地面降雹数据对应的风暴体的特征参数和所述地面降雹数据,构建冰雹数据集;
其中,对所述多普勒天气雷达基数据进行解析,确定出所述待匹配区域的风暴体和所述风暴体的特征参数,包括:
对所述多普勒天气雷达基数据进行解析,得到目标数据,其中,所述目标数据包括:雷达基本反射率因子,雷达组合反射率因子,径向速度和谱宽;
基于所述目标数据和预设风暴体提取算法,确定出所述风暴体;
对所述风暴体进行特征参数提取,得到所述风暴体的特征参数,其中,所述特征参数包括:风暴体的生成时间,风暴体对应的地理位置信息,垂直累积液态含水量,风暴顶高,45dBz所在高度,最大反射率因子所在高度和风暴的最大反射率;
其中,所述地面降雹数据包括:发生冰雹的开始时间和结束时间,发生冰雹的地理位置信息和质量控制信息,其中,所述质量控制信息用于表征地面降雹数据的准确程度;
其中,对所述风暴体和所述地面降雹数据进行滑动时空匹配,确定出所述地面降雹数据对应的风暴体,包括:
基于增强型冰雹探测算法,对所述风暴体和所述地面降雹数据进行滑动时空匹配,确定出所述地面降雹数据对应的风暴体;
其中,基于所述增强型冰雹探测算法,对所述风暴体和所述地面降雹数据进行滑动时空匹配,确定出所述地面降雹数据对应的风暴体,包括:
基于所述风暴体对应的地理位置信息和所述发生冰雹的地理位置信息,确定出初始风暴体;
基于所述初始风暴体的生成时间和所述发生冰雹的开始时间和结束时间,确定出所述地面降雹数据对应的风暴体;
其中,基于所述风暴体对应的地理位置信息和所述发生冰雹的地理位置信息,确定出初始风暴体,包括:
基于所述发生冰雹的地理位置信息、空间范围变量滑动系数和机器学习算法,确定出目标空间范围;
所述风暴体对应的地理位置信息,将地理位置信息处于所述目标空间范围内的风暴体,确定为所述初始风暴体。
2.根据权利要求1所述的方法,其特征在于,基于所述初始风暴体的生成时间和所述发生冰雹的开始时间和结束时间,确定出所述地面降雹数据对应的风暴体,包括:
基于所述发生冰雹的开始时间和结束时间,以及时间窗变量滑动系数,确定出目标时间窗;
基于所述初始风暴体的生成时间,将所述开始时间和结束时间处于所述目标时间窗内的初始风暴体,确定为所述地面降雹数据对应的风暴体。
3.一种基于滑动时空匹配的冰雹数据集生成装置,其特征在于,包括:获取单元,解析单元,确定单元和构建单元,其中,
所述获取单元,用于获取待匹配区域的多普勒天气雷达基数据和地面降雹数据;
所述解析单元,用于对所述多普勒天气雷达基数据进行解析,确定出所述待匹配区域的风暴体和所述风暴体的特征参数;
所述确定单元,用于对所述风暴体和所述地面降雹数据进行滑动时空匹配,确定出所述地面降雹数据对应的风暴体;
所述构建单元,用于基于所述地面降雹数据对应的风暴体的特征参数和所述地面降雹数据,构建冰雹数据集;
其中,所述解析单元,用于:
对所述多普勒天气雷达基数据进行解析,得到目标数据,其中,所述目标数据包括:雷达基本反射率因子,雷达组合反射率因子,径向速度和谱宽;
基于所述目标数据和预设风暴体提取算法,确定出所述风暴体;
对所述风暴体进行特征参数提取,得到所述风暴体的特征参数,其中,所述特征参数包括:风暴体的生成时间,风暴体对应的地理位置信息,垂直累积液态含水量,风暴顶高,45dBz所在高度,最大反射率因子所在高度和风暴的最大反射率;
其中,所述地面降雹数据包括:发生冰雹的开始时间和结束时间,发生冰雹的地理位置信息和质量控制信息,其中,所述质量控制信息用于表征地面降雹数据的准确程度;
其中,所述确定单元,用于:
基于增强型冰雹探测算法,对所述风暴体和所述地面降雹数据进行滑动时空匹配,确定出所述地面降雹数据对应的风暴体;
其中,所述确定单元,用于:
基于所述风暴体对应的地理位置信息和所述发生冰雹的地理位置信息,确定出初始风暴体;
基于所述初始风暴体的生成时间和所述发生冰雹的开始时间和结束时间,确定出所述地面降雹数据对应的风暴体;
其中,所述确定单元,用于:
基于所述发生冰雹的地理位置信息、空间范围变量滑动系数和机器学习算法,确定出目标空间范围;
所述风暴体对应的地理位置信息,将地理位置信息处于所述目标空间范围内的风暴体,确定为所述初始风暴体。
4.一种电子设备,其特征在于,包括存储器以及处理器,所述存储器用于存储支持处理器执行权利要求1至2任一项所述方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
5.一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,计算机程序被处理器运行时执行上述权利要求1至2任一项所述方法的步骤。
CN202211162612.1A 2022-09-23 2022-09-23 一种基于滑动时空匹配的冰雹数据集生成方法和装置 Active CN115236676B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211162612.1A CN115236676B (zh) 2022-09-23 2022-09-23 一种基于滑动时空匹配的冰雹数据集生成方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211162612.1A CN115236676B (zh) 2022-09-23 2022-09-23 一种基于滑动时空匹配的冰雹数据集生成方法和装置

Publications (2)

Publication Number Publication Date
CN115236676A CN115236676A (zh) 2022-10-25
CN115236676B true CN115236676B (zh) 2022-12-20

Family

ID=83667031

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211162612.1A Active CN115236676B (zh) 2022-09-23 2022-09-23 一种基于滑动时空匹配的冰雹数据集生成方法和装置

Country Status (1)

Country Link
CN (1) CN115236676B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109116358A (zh) * 2018-08-09 2019-01-01 成都信息工程大学 基于新一代天气雷达的冰雹识别及落区预报方法
CN113936166A (zh) * 2021-09-08 2022-01-14 昆明理工大学 一种基于多普勒天气雷达数据的冰雹回波识别方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210080569A1 (en) * 2019-09-13 2021-03-18 Insurance Services Office, Inc. Systems and Methods for Weather Radar Processing

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109116358A (zh) * 2018-08-09 2019-01-01 成都信息工程大学 基于新一代天气雷达的冰雹识别及落区预报方法
CN113936166A (zh) * 2021-09-08 2022-01-14 昆明理工大学 一种基于多普勒天气雷达数据的冰雹回波识别方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
2015年7月29日呼和浩特市冰雹天气潜势及雷达资料分析;张志杰 等;《内蒙古气象》;20160531(第5期);全文 *
一种基于地面实况的降雹风暴体客观标识方法;刘伯駿 等;《应用气象学报》;20210131;第32卷(第1期);第78-80页 *
基于模糊逻辑的冰雹天气雷达识别算法;张秉祥 等;《应用气象学报》;20140731;第25卷(第4期);全文 *

Also Published As

Publication number Publication date
CN115236676A (zh) 2022-10-25

Similar Documents

Publication Publication Date Title
CN110705115B (zh) 一种基于深度置信网络的气象预报方法和系统
CN114067214B (zh) 一种基于多模型融合卷积网络的暴雨识别方法和装置
CN113469278B (zh) 一种基于深度卷积神经网络的强天气目标识别方法
CN114972191A (zh) 一种耕地变化检测方法和装置
CN109086540B (zh) 一种构建热带气旋路径预报模型的方法及装置
CN109543907B (zh) 一种复杂地形风资源评估方法及其装置
WO2020111934A1 (en) A method and system for detection of natural disaster occurrence
CN110688883A (zh) 车辆和行人检测方法及装置
CN104237890A (zh) 一种由“列车效应”引起的暴雨识别及预报方法
CN115598738A (zh) 一种冰雹预警方法和装置
CN115236676B (zh) 一种基于滑动时空匹配的冰雹数据集生成方法和装置
CN113505643A (zh) 违章目标物检测方法及相关装置
CN112802011A (zh) 一种基于vgg-bls的风机叶片缺陷检测方法
CN116229419B (zh) 一种行人检测方法及装置
CN116704366A (zh) 基于transformer深度学习模型的暴雨落区识别预警方法和装置
CN115877345A (zh) 一种风廓线雷达缺测数据的补齐方法和装置
CN114821978A (zh) 一种误报警的消除方法、装置以及介质
CN114240940A (zh) 一种基于遥感影像的云及云阴影检测方法和装置
CN112966762A (zh) 一种野生动物检测方法、装置、存储介质及电子设备
CN113743293A (zh) 跌倒行为检测方法、装置、电子设备及存储介质
CN112149579A (zh) 一种基于改进yolo_v3的鸟巢隐患检测方法
US20240070832A1 (en) Device and method for detecting wildfire
CN117523420B (zh) 一种基于雷达产品数据的闪电落区识别方法及系统
CN117725523B (zh) 基于物理约束的雷暴天气预警方法及预警系统
CN117688464B (zh) 一种基于多源传感器数据的隐患分析方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Method and Device for Generating Hail Datasets Based on Sliding Spacetime Matching

Effective date of registration: 20230614

Granted publication date: 20221220

Pledgee: Haidian Beijing science and technology enterprise financing Company limited by guarantee

Pledgor: Beijing Hongxiang Technology Co.,Ltd.

Registration number: Y2023110000235