CN116500703A - 一种雷暴单体识别方法和装置 - Google Patents
一种雷暴单体识别方法和装置 Download PDFInfo
- Publication number
- CN116500703A CN116500703A CN202310775566.0A CN202310775566A CN116500703A CN 116500703 A CN116500703 A CN 116500703A CN 202310775566 A CN202310775566 A CN 202310775566A CN 116500703 A CN116500703 A CN 116500703A
- Authority
- CN
- China
- Prior art keywords
- cluster
- thunderstorm
- lightning
- sub
- points
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000000178 monomer Substances 0.000 title claims abstract description 114
- 238000000034 method Methods 0.000 title claims abstract description 44
- 239000011159 matrix material Substances 0.000 claims abstract description 103
- 238000002310 reflectometry Methods 0.000 claims abstract description 37
- 238000012216 screening Methods 0.000 claims abstract description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 9
- 230000001737 promoting effect Effects 0.000 claims description 4
- 238000013138 pruning Methods 0.000 claims description 4
- 230000003190 augmentative effect Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 abstract description 6
- 238000012545 processing Methods 0.000 abstract description 6
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000004590 computer program Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 235000012571 Ficus glomerata Nutrition 0.000 description 1
- 244000153665 Ficus glomerata Species 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/231—Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Environmental & Geological Engineering (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Ecology (AREA)
- Biodiversity & Conservation Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Environmental Sciences (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Atmospheric Sciences (AREA)
- Radar Systems Or Details Thereof (AREA)
Abstract
本发明涉及气候监测技术领域,公开了一种雷暴单体识别方法和装置,通过获取闪电定位仪原始散点数据;按照雷达组合反射率矩阵数据的时间分辨率和矩阵大小将原始散点数据转换为矩阵数据;构建矩阵数据的最小生成树;将最小生成树的每个节点作为一个簇,通过节点簇生成各子簇,以雷暴单体最小簇为筛选条件,删除所有节点簇中不满足筛选条件的子簇;计算每个簇的稳定性,根据稳定性确定选定簇;将选定簇中的点转换为矩阵数据中格点的坐标,得到若干表示雷暴单体的目标簇。本发明无需人工干预,不需要手动设置参数,降低了雷暴单体识别的复杂度,有利于批量自动处理;另外,本发明对密度变化不敏感,有利于提升雷暴单体识别的准度。
Description
技术领域
本发明涉及气候监测技术领域,尤其涉及一种雷暴单体识别方法和装置。
背景技术
随着当今天气监测系统的普及,对于雷暴活动的监测和预测变得越来越重要,目前闪电监测方法是使用闪电定位系统来定位闪电的位置,闪电数据记录的格式,一般为逐条,包含闪电发生的时间位置和强度,同时由于设备的限制,闪电定位仪的数据会有误差点出现,会影响雷暴单体的识别效果。针对闪电原始数据,需要对闪电分布进行识别和聚类得到的雷暴单体。目前一些聚类方法,如K-means和CFSFDP等需要预先知道雷暴单体的数量,或者需要人工干预,使用半监督学习来识别和区分不同的雷暴单体。而在雷暴预警预测领域中,雷暴单体信息的准确全面,是提高雷暴预测准确率的基础,因此,对雷暴单体进行批量自动识别是非常必要的。
现有相关技术中,传统的DBSCAN(Density-Based Spatial Clustering ofApplications with Noise,一种比较有代表性的基于密度的聚类算法)聚类方法可以识别多个单体并具有较好的凹形状识别能力,并且可以去除单点的噪声,同时不需要预先知道雷暴单体数量。具体步骤如下:
步骤如下:
1)选择一个点,将其标记为“核心点”(Core Point)或“噪声点”(Noise Point):如果该点周围的密度(即指定半径范围内的点数)达到预设阈值,则将其标记为核心点,否则将其标记为噪声点。
2)扩展核心点:对于标记为核心点的点,进一步扩展其密度可达区域内的所有点,直到不能再扩展为止。将这些点都归为一个类别,称之为一个“簇”(Cluster)。
3)处理未访问的点:对于未访问过的点,若其属于某个簇的密度可达区域,则将其归入该簇;否则将其标记为噪声点。
4)迭代步骤2和3:继续遍历未访问的点,执行步骤2和3,直到所有点都被访问。
在执行完DBSCAN算法后,每个簇都代表一个雷暴单体,其中核心点代表该单体的中心区域,而边缘点则代表该单体的边界区域。通过对聚类结果的分析,可以得到包含位置、大小、形状等特征信息的雷暴单体。
但是,本申请发明人在实现本申请实施例中发明技术方案的过程中,发现上述技术方案至少存在如下技术问题:
1、参数依赖性:由于DBSCAN算法需要手动设置参数,这需要实施人对闪电数据的特性和聚类目标有一定的先验知识,并且还需要反复试验来寻找最佳参数;而实际上,闪电数据的特征会随时间和空间变化,这就需要重新调整参数,导致增加算法的复杂性,不利于批量自动处理。
2、对密度变化敏感:DBSCAN算法的聚类结果对密度变化敏感,当闪电数据集中存在密度变化的区域时,容易将其划分为多个聚类簇或将多个密度不同的雷暴单体识别为同一个簇,导致聚类结果不准确。
发明内容
本发明旨在通过对传统的DBSCAN算法进行优化,解决现有技术中因传统的DBSCAN算法对参数设置和闪电数据密度敏感,而导致对雷暴单体无法批量自动识别及识别结果准度低的技术问题。
主要通过以下技术方案实现上述发明目的:
第一方面,一种雷暴单体识别、边界提取方法,包括:
通过获取闪电定位仪原始散点数据和雷达组合反射率矩阵数据;按照雷达组合反射率矩阵数据的时间分辨率和矩阵大小,将所述原始散点数据转换为矩阵数据;构建所述矩阵数据的最小生成树;将所述最小生成树的每个节点作为一个簇,通过节点簇生成各子簇,以雷暴单体最小簇为筛选条件,删除所有不满足筛选条件的子簇,所述雷暴单体最小簇是根据所述矩阵数据中发生闪电的格点数量确定的;计算每个簇的稳定性,根据稳定性确定选定簇,所述选定簇的稳定性大于其所属各子簇的稳定性之和;将所述选定簇中的点转换为所述矩阵数据中格点的坐标,得到若干表示雷暴单体的目标簇。
第二方面,一种雷暴单体识别装置,包括:
数据获取模块,用于获取闪电定位仪原始散点数据和雷达组合反射率矩阵数据;
数据转换模块,用于按照雷达组合反射率矩阵数据的时间分辨率和矩阵大小,将所述原始散点数据转换为矩阵数据;
最小树生成模块,用于构建所述矩阵数据的最小生成树;
最小树剪枝模块,用于将所述最小生成树的每个节点作为一个簇,通过节点簇生成各子簇,以雷暴单体最小簇为筛选条件,删除所有不满足筛选条件的子簇,所述雷暴单体最小簇是根据所述矩阵数据中发生闪电的格点数量确定的;
雷暴单体识别模块,用于计算每个簇的稳定性,根据稳定性确定选定簇,所述选定簇的稳定性大于其所属各子簇的稳定性之和;将所述选定簇中的点转换为所述矩阵数据中格点的坐标,得到若干表示雷暴单体的目标簇。
第三方面,一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述一种雷暴单体识别方法的步骤。
第四方面,一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述一种雷暴单体识别方法的步骤。
第五方面,一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如第一方面所述一种雷暴单体识别方法的步骤。
相较于现有技术的有益效果:
本发明通过根据矩阵数据中发生闪电的格点数量确定的雷暴单体最小簇为筛选条件,删除不满足筛选条件的子簇,再通过计算簇的稳定性,以稳定性作为判断标准,使用了一种层次聚类的方法来自动识别确定不同密度的雷暴单体的目标簇,无需人工干预,不需要手动设置参数,如邻域半径eps和该邻域内应有的最小样本数min_samples,因此不需要实施人对闪电数据的特性和聚类目标有一定的先验知识,也不需要反复试验来寻找最佳参数;降低了雷暴单体识别的复杂度,有利于批量自动处理;另外,本发明对密度变化不敏感:避免了因闪电数据集中存在密度变化敏感的区域时,容易将其划分为多个聚类簇或将多个密度不同的雷暴单体识别为同一个簇,导致聚类结果不准确的问题,有利于提升雷暴单体识别的准度。
附图说明
图1示出了本发明一种雷暴单体识别方法的流程示意图;
图2示出了本发明闪电数据的投影示例图;
图3示出了本发明矩阵数据扩充示例图;
图4示出了本发明闪电格点数据聚类生成雷暴单体簇结果示例图;
图5示出了本发明雷暴单体轮廓生成结果示例图;
图6示出了本发明雷暴单体中雷电发生概率的结果示例图;
图7示出了本发明一种雷暴单体识别装置的结构示意图;
图8示出了本发明一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
实施例一
本发明实施例提供了一种雷暴单体识别方法,如图1所示,包括以下步骤:
步骤1,获取闪电定位仪原始散点数据和雷达组合反射率矩阵数据。
本发明使用的闪电定位仪原始散点数据包括数据项:时间(T)、强度、经度(Lon)、纬度(Lat)、省、市、县、乡镇、陡度、误差、定位方式、云闪/云地闪和高度,其中时间T的时间分辨率为分钟级。
步骤2,按照雷达组合反射率矩阵数据的时间分辨率和矩阵大小,将所述原始散点数据转换为矩阵数据。
本发明使用的源数据还包括雷达组合反射率矩阵数据,其时间分辨率为6分钟,格点分辨率为res(0.01°≤res≤0.1°),其起始经度为lon_start,结束经度为lon_end,起始纬度为lat_start,结束纬度为lat_end;其中,73°E≤lon_start,lon_end ≤ 135°E,3°N≤lat_start,lat_end ≤53°,lon_start<lon_end,lat_start<lat_end。
在一种可行的实施方式中,将所述原始散点数据按照雷达组合反射率矩阵数据的时间分辨率切割为若干组闪电数据,将所述若干组闪电数据投影到预先设定的全零格点矩阵中,根据所述闪电数据的经纬度计算其在所述全零格点矩阵中的投影位置,并将投影了闪电数据的格点的数据值置为1,得到矩阵数据,所述全零格点矩阵与雷达组合反射率矩阵的大小相同。
具体的,逐条取出闪电定位仪原始散点数据中的时间(T)、经度(Lon)、纬度(Lat),按照每6分钟为一组将所述原始散点数据进行切割。即,将时间T按照0到60分钟的时间段进行分组,每个时间段左开右闭,分别为(0, 6],(6, 12],(12,18],(18, 24],(24, 30],(30,36],(36,42],(42, 48],(48, 54],(54, 60]。
将时间T映射到对应的时间段,并将时间T的分钟数变为当前时间段的最大分钟数/>。
;
例如,时间T的分钟数为5,5除以6,再向上取整得1,1乘6等于6,那么当前时间T的分钟数5就变为了最大分钟数为6;再例如,时间T的分钟数为7,7除以6,再向上取整得2,2乘6等于12,那么当前时间T的分钟数7就变为了最大分钟数为12。
由于雷达反射率的时间分辨率为6分钟,因此,经过上述计算式变换后,所述原始散点数据的时间分辨率会变为6分钟,使得所述原始散点数据和雷达组合反射率矩阵数据的时间分辨率匹配一致。
将所述若干组闪电数据投影到预先设定的全零格点矩阵中,根据所述闪电数据的经纬度计算其在所述全零格点矩阵中的投影位置,并将投影了闪电数据的格点的数据值置为1,得到矩阵数据,具体实施方式如下:
1)定义一个大小为(lat_len,lon_len)的全零格点矩阵G,用于存储投影后的闪电数据,其中lat_len和lon_len是根据雷达组合反射率的起始经纬度(lon_start,lat_start)、结束经纬度(lon_end,lat_end)和格点分辨率res计算的,其大小和雷达组合反射率矩阵大小一致,计算式如下:
;
;
2)对于每一个闪电数据点,计算其在矩阵数据G上的投影位置。假设闪电数据点的经度为lon,纬度为 lat,则其在矩阵数据上的投影位置可以通过以下公式计算:
投影后的经度位置:
;
其中,proj_lon表示投影后的经度位置。
投影后的纬度位置:
;
其中,proj_lat表示投影后的纬度位置。
其中,lon_min和lat_min分别是雷达组合反射率矩阵数据空间范围的最小经度和最小纬度,res是雷达组合反射率矩阵数据的格点分辨率。
3)对于每个投影位置(proj_lon,proj_lat),将矩阵数据中对应位置的值置为1,表示该位置上发生了闪电。
4)重复步骤2和步骤3,直到处理完所有的闪电数据点。
5)得到投影后的闪电矩阵数据G,即包含了各经纬度闪电点在矩阵数据上的分布情况。
投影示例如图2所示。
在一种可行的实施方式中,扩充所述矩阵数据。
用表示扩充前的原矩阵数据中格点值,表示在经度/>维度/>处是否发生闪电,若/>,则表示在经度/>维度/>处发生闪电,若/>,则表示在经度/>维度/>处未发生闪电;/>表示扩充后得到的最终的矩阵数据中格点值,表示在经度/>维度/>处是否发生闪电,若/>,则表示在经度/>维度/>处发生闪电,若/>,则表示在经度/>维度/>处未发生闪电。
定义扩展后的矩阵数据为,其大小与矩阵数据/>相同,为(lat_len,lon_len)。
根据以下计算式扩充所述矩阵数据:
其中,max表示取最大值操作。扩充示例如图3所示。得到最终的矩阵数据。
在一种可行的实施方式中,还包括:对矩阵数据去噪。
判断所述矩阵数据中发生闪电的格点对应的雷达组合反射率是否达到第一预设阈值;若否,则将该格点的数据值置为0,以对所述矩阵数据去噪。
例如:
闪电定位仪原始散点数据包含噪点,则矩阵数据也包含噪点,定义/>所对应时间的雷达组合反射率矩阵数据为M,则/>对应的雷达组合反射率值为/>。
通过判断闪电发生的点(i,j)对应的雷达组合反射率是否超过30dBZ来判断点(i,j)是否为噪点,当/>小于30dBZ时为噪点,将其在矩阵格点中的数据值/>由1设为0。
步骤3,构建所述矩阵数据的最小生成树。
通过Prim算法,构建闪电矩阵的最小生成树,一次构建一条边,总是添加最小的权重边,任意两点之间的边的权重就是其互可达距离,最后得到闪电数据的最小生成树。
在一种可行的实施方式中,假设有n个闪电点,构建最小生成树具体步骤如下:
1)选择一个起始闪电点,标记为已访问。
2)对于起始点的所有邻居,把这些邻居与起始点的相互可达距离加入到一个优先队列中。
3)从优先队列中选择最小距离的邻居,将其加入到最小生成树中,并标记为已访问。
4)对于新加入的邻居,重新计算它们与已访问点的距离,并更新优先队列中的距离值。
5)重复步骤3和步骤4,直到所有点都被访问过。
6)最终得到的最小生成树即为闪电数据的最小生成树。
在一种可行的实施方式中,闪电矩阵数据G'中有很多闪电发生的点,为了找到不同的雷暴单体簇,定义发生闪电的点x的核心距离为:点x到距离最近发生闪电的k个点的最大距离,表示为;/>。
因此,两点之间的相互可达距离的计算式如下:
;
其中,
表示点/>和点/>之间的相互可达距离;
表示点/>和点/>之间的原始距离;
表示雷暴单体最小簇的大小;
表示点/>到距离最近的发生闪电的/>个点的最大距离;
表示点/>到距离最近的发生闪电的/>个点的最大距离。
在一种可行的实施方式中,根据所述矩阵数据中发生闪电的格点数量确定所述雷暴单体最小簇,计算式如下:
;
其中,
表示雷暴单体最小簇的大小;传统的雷暴单体识别技术中,雷暴单体最小簇的/>值,是需要人工手动指定的,而本发明通过判断闪电在空间出现的次数确定雷暴单体簇中最少出现闪电数量,即/>值,保证在只有很少的闪电出现时也能识别到雷暴单体,在有很多闪电出现时识别的单体尽量不出现过多分裂。无需人工干预,不需要手动设置参数,降低了雷暴单体识别的复杂度,有利于批量自动处理。
定义为表示所述矩阵数据中发生闪电的格点数量除以100向下取整得到的值;其计算式如下:
;
步骤4,将所述最小生成树的每个节点作为一个簇,通过节点簇生成各子簇,以雷暴单体最小簇为筛选条件,删除所有不满足筛选条件的子簇。
在一种可行的实施方式中,将所述最小生成树的每个节点作为一个簇;按照边的权重从小到大的顺序依次选取所述最小生成树的边;对于每条边,将连接的两个节点所属的簇合并为一个新簇,并将该边作为新簇的父边;直至遍历完所述最小生成树的所有边;按照父边的权重从大到小的顺序遍历所有父边,将父边连接的两个节点所属的簇记为第一子簇和第二子簇;
分别判断第一子簇和第二子簇中发生闪电的格点数量,是否小于雷暴单体最小簇的大小;
若第一子簇中发生闪电的格点数量小于雷暴单体最小簇的大小,第二子簇中发生闪电的格点数量大于等于雷暴单体最小簇的大小,则将所述第一子簇删除,并将所述第二子簇晋升为父节点簇;
若第一子簇中发生闪电的格点数量大于等于雷暴单体最小簇的大小,第二子簇中发生闪电的格点数量小于雷暴单体最小簇的大小,则将所述第二子簇删除,并将所述第一子簇晋升为父节点簇;
若第一子簇中发生闪电的格点数量小于雷暴单体最小簇的大小,第二子簇中发生闪电的格点数量小于雷暴单体最小簇的大小,则将所述第一子簇和所述第二子簇都删除;
若第一子簇中发生闪电的格点数量大于等于雷暴单体最小簇的大小,第二子簇中发生闪电的格点数量大于等于雷暴单体最小簇的大小,则继续将所述第一子簇和所述第二子簇的节点分别向下各自分裂为两个子簇,记为第一子簇和第二子簇,返回执行步骤:分别判断第一子簇和第二子簇中发生闪电的格点数量,是否小于雷暴单体最小簇的大小。
具体的,首先根据闪电矩阵数据的最小生成树,将其转换为层次结构。根据相互可达距离对树的边进行排序(按增加的顺序),然后依次选取每条边,将该边链接的两个簇进行合并,得到闪电数据的树状图。
具体步骤如下:
1)将最小生成树中的每个节点看作一个簇。
2)按照边的权重(即相互可达距离)对最小生成树中的边进行排序,从小到大依次选取每条边。
3)对于每条边 (u, v),将节点 u 和节点 v合并为一个新的簇,并将边 (u, v)作为新簇的父边。
4)重复步骤3,直到最后只剩下一个簇,得到闪电数据的层次结构。
然后,自上而下遍历聚类树(即上述最小生成树),并在每个节点分裂时检查两个子簇所包含的样本数是否大于等于,如果左右儿子中有一个孩子样本数小于/>,则直接删除该节点,并让另一个孩子晋升为父节点;如果两个孩子样本数都小于/>,则都删除,当前结点不再向下分裂;如果两个孩子样本数都大于等于/>,则继续向下正常分裂。
步骤5,计算每个簇的稳定性,根据稳定性确定选定簇,所述选定簇的稳定性大于其所属各子簇的稳定性之和。
经过最小生成树的剪枝操作,树中已经不含有稀疏点(不足以成为最小簇的点集),现在需要将最接近的簇节点继续合并,最终希望选择的簇具有更好的稳定性。
定义一个距离的倒数:
;
针对给定的簇,定义值为:当簇分离并成为它自己的簇时的/>值;/>为:簇分别拆分为较小的簇时的/>值。
反过来,对于给定的集群,对于集群中的每个点p,可将值定义为:点p从簇中分离出来的/>值,该值介于/>和/>之间。
现在,对于每个簇,稳定性计算如下:
;
最后,将所有叶节点声明为选定的簇。
现在通过遍历树(反向拓扑排序顺序)。
如果子簇的稳定性之和大于簇的稳定性,那么就将簇稳定性设置为子簇稳定性之和。
另一方面,如果簇的稳定性大于其子簇的总和,那么就将簇声明为选定簇,并取消选择其所有子簇。
当到达根节点时,将当前选定的簇集合称为平面簇并返回它。
步骤6,将所述选定簇中的点转换为所述矩阵数据中格点的坐标,得到若干表示雷暴单体的目标簇。
通过稳定性的判断得到不同的簇之后,将簇中的点转换为格点中的坐标,得到不同雷暴单体的目标簇,示例如图4所示。
在一些情况下,本实施例的方法还包括以下步骤:
步骤7,雷暴单体的边界提取。
在一种可行的实施方式中,用AlphaShapes算法提取雷暴单体簇的边界,对于单个雷暴单体簇有限点集 P,由n个发生闪电的点组成,那么这n 个点可以构成 n × (n – 1)条有向线段。需要判断哪些线段为边界线段,最后根据边界线段生成雷暴单体轮廓。在雷暴单体簇点集P内,过任意两发生闪电的点P1,P2绘制半径为α的圆,如果这个圆内没有其他点,则认为P1, P2为边界点,其连线P1-P2为边界线。
具体的步骤如下:
1、统计目标簇内发生闪电的格点数量N,并计算目标簇构成的凸包面积S;计算所述目标簇内发生闪电的数量占目标簇构成的凸包面积的比例rate,计算式如下:
。
2、根据所述比例rate计算得到目标圆的半径,所述目标圆为经过目标簇内任意两个发生闪电的格点并以半径/>进行绘制的圆。具体计算式如下:
。
3、判断所述目标圆内是否包含除所述任意两个发生闪电的格点以外的其他格点,若否,则确定所述任意两个发生闪电的格点为所述目标簇的边界点,所述任意两个发生闪电的格点的连线为所述目标簇的边界线;根据所述目标簇的边界线得到所述目标簇的轮廓。
选取所述目标簇点集P中任一发生闪电的格点作为圆心,以/>为半径,确定领域点集R,/>为正整数,/>表示所述目标簇点集P中第/>个发生闪电的格点;
选取所述领域点集R内任一发生闪电的格点,确定经过所述格点/>及所述格点/>的圆的圆心/>,/>为正整数,/>表示所述领域点集R中第/>个发生闪电的格点;
则有:
;
其中H:
;
计算所述领域点集R内除所述格点及所述格点/>以外的格点/>,与所述圆心之间的距离d;判断是否/>,若是,则确定所述目标圆内不包含除所述任意两个发生闪电的格点以外的其他格点;所述目标圆为经过所述格点/>及所述格点/>,并以半径/>进行绘制的圆。
按照上述步骤遍历领域点集R和目标簇点集P内的所有格点,直至所有格点都已判断完成。
最后根据提取的若干段边界线确定每个雷暴单体的轮廓,结果示例图如图5所示。
传统的雷暴单体识别技术中,针对半径也是需要人工手动指定的,而本发明中通过判断雷暴单体簇在凸包边界构成的区域中的比例/>,自动指定半径/>,使/>适配雷暴单体簇的形状,保证雷暴单体边界的精细度。无需人工干预,不需要手动设置参数,降低了雷暴单体识别的复杂度,有利于批量自动处理。
在一些情况下,本实施例的方法还包括以下步骤:
步骤8,根据所述目标簇点集对应的雷达组合反射率确定所述目标簇对应的雷暴单体内发生雷暴的概率。
遍历所述目标簇的轮廓内所有格点,判断格点对应的雷达组合反射率是否大于等于第二预设阈值,若是,则将该格点对应位置赋值第一数据值;否则,判断所述格点对应的雷达组合反射率是否小于等于第三预设阈值,若所述格点对应的雷达组合反射率大于等于第三预设阈值,则将该格点对应位置赋值第二数据值;若所述格点对应的雷达组合反射率小于第三预设阈值,将该格点对应位置赋值第三数据值;根据所有格点对应位置的赋值,确定所述目标簇内雷暴单体发生雷暴的概率信息;其中,所述第三数据值<第二数据值<第一数据值;所述第三预设阈值<第二预设阈值。
例如,通过遍历每个雷暴单体区域中的点集,根据点集对应的雷达组合反射率的不同确定雷暴单体内发生雷暴的概率,本发明定义三级概率值(即上述第一、第二和第三数据值),等级越高,概率越高,离雷暴中心越近。
在雷暴单体的目标簇点集P中选择任一发生闪电的格点,根据点/>的时间空间位置,取出对应雷达组合反射率的值,如果值大于等于50dBZ,则将/>对应位置赋值为3,代表对应位置在雷暴单体内发生闪电的可能性极大,如果值大于等于40dBZ且小于50dBZ,则将/>对应位置赋值为2,代表对应位置在雷暴单体内发生闪电的可能性较大,如果小于40dBZ,则将/>对应位置赋值为1,代表对应位置在雷暴单体内发生闪电的可能性一般。遍历点集P中的所有点,重复上述步骤。最后得到雷暴单体包含闪电发生的概率信息,为后续雷暴活动的监测和预测提供了更准确的信息,为雷暴的预测预警提供数据支撑,结果示例图如图6所示。
实施例二
本发明实施例还提供了一种雷暴单体识别装置,如图7所示,所述装置200包括:
数据获取模块210,用于获取闪电定位仪原始散点数据;
数据转换模块220,用于按照雷达组合反射率矩阵数据的时间分辨率,将所述原始散点数据转换为矩阵数据;
最小树生成模块230,用于构建所述矩阵数据的最小生成树;
最小树剪枝模块240,用于将所述最小生成树的每个节点作为一个簇,以雷暴单体最小簇为筛选条件,删除所有不满足筛选条件的子簇,所述雷暴单体最小簇是根据所述矩阵数据中发生闪电的格点数量确定的;
雷暴单体识别模块250,用于计算每个簇的稳定性,根据稳定性确定选定簇,所述选定簇的稳定性大于其所属各子簇的稳定性之和;将所述选定簇中的点转换为所述矩阵数据中格点的坐标,得到若干表示雷暴单体的目标簇。
本发明实施例一种雷暴单体识别装置是对应上述实施例一种雷暴单体识别方法,实现相应的功能。由于上述实施例中已经对一种雷暴单体识别方法的实施方式进行了详细的说明,故在此不再赘述。
实施例三
本发明实施例还提供了一种电子设备3,如图8所示,包括存储器31、处理器32以及存储在所述存储器中并可在所述处理器上运行的计算机程序33,所述处理器执行所述计算机程序时实现如上述实施例一种雷暴单体识别方法的步骤。
实施例四
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例一种雷暴单体识别方法的步骤。
实施例五
本发明实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述实施例一种雷暴单体识别方法的步骤。
以上对本发明实施例进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (15)
1.一种雷暴单体识别方法,其特征在于,包括:
获取闪电定位仪原始散点数据和雷达组合反射率矩阵数据;按照雷达组合反射率矩阵数据的时间分辨率和矩阵大小,将所述原始散点数据转换为矩阵数据;
构建所述矩阵数据的最小生成树;
将所述最小生成树的每个节点作为一个簇,通过节点簇生成各子簇,以雷暴单体最小簇为筛选条件,删除所有不满足筛选条件的子簇,所述雷暴单体最小簇是根据所述矩阵数据中发生闪电的格点数量确定的;
计算每个簇的稳定性,根据稳定性确定选定簇,所述选定簇的稳定性大于其所属各子簇的稳定性之和;
将所述选定簇中的点转换为所述矩阵数据中格点的坐标,得到若干表示雷暴单体的目标簇。
2.如权利要求1所述的雷暴单体识别方法,其特征在于,按照雷达组合反射率矩阵数据的时间分辨率和矩阵大小,将所述原始散点数据转换为矩阵数据,包括:
将所述原始散点数据按照雷达组合反射率矩阵数据的时间分辨率切割为若干组闪电数据,将所述若干组闪电数据投影到预先设定的全零格点矩阵中,根据所述闪电数据的经纬度计算其在所述全零格点矩阵中的投影位置,并将投影了闪电数据的格点的数据值置为1,得到矩阵数据,所述全零格点矩阵与雷达组合反射率矩阵的大小相同。
3.如权利要求2所述的雷暴单体识别方法,其特征在于,还包括:
根据以下计算式扩充所述矩阵数据:
;
其中,表示扩充前的原矩阵数据中格点值,表示在经度/>维度/>处是否发生闪电,若,则表示在经度/>维度/>处发生闪电,若/>,则表示在经度/>维度/>处未发生闪电;
表示扩充后得到的最终的矩阵数据中格点值,表示在经度/>维度/>处是否发生闪电,若/>,则表示在经度/>维度/>处发生闪电,若/>,则表示在经度/>维度处未发生闪电。
4.如权利要求1~3任一项所述的雷暴单体识别方法,其特征在于,还包括:
判断所述矩阵数据中发生闪电的格点对应的雷达组合反射率是否达到第一预设阈值;
若否,则将该格点的数据值置为0,以对所述矩阵数据去噪。
5.如权利要求1所述的雷暴单体识别方法,其特征在于,根据所述矩阵数据中发生闪电的格点数量确定所述雷暴单体最小簇,计算式如下:
;
其中,
表示雷暴单体最小簇的大小;
表示所述矩阵数据中发生闪电的格点数量除以100向下取整得到的值。
6.如权利要求5所述的雷暴单体识别方法,其特征在于,构建所述矩阵数据的最小生成树,包括:
通过Prim算法构建所述矩阵数据的最小生成树,每次构建一条边,每次添加当前最小权重的边,任意两点之间的边的权重即为该两点之间的相互可达距离。
7.如权利要求6所述的雷暴单体识别方法,其特征在于,两点之间的相互可达距离的计算式如下:
;
其中,
表示点/>和点/>之间的相互可达距离;
表示点/>和点/>之间的原始距离;
表示雷暴单体最小簇的大小;
表示点/>到距离最近的发生闪电的/>个点的最大距离;
表示点/>到距离最近的发生闪电的/>个点的最大距离。
8.如权利要求7所述的雷暴单体识别方法,其特征在于,将所述最小生成树的每个节点作为一个簇,通过节点簇生成各子簇,以雷暴单体最小簇为筛选条件,删除所有不满足筛选条件的子簇,包括:
将所述最小生成树的每个节点作为一个簇;
按照边的权重从小到大的顺序依次选取所述最小生成树的边;
对于每条边,将连接的两个节点所属的簇合并为一个新簇,并将该边作为新簇的父边;直至遍历完所述最小生成树的所有边;
按照父边的权重从大到小的顺序遍历所有父边,将父边连接的两个节点所属的簇记为第一子簇和第二子簇;
分别判断第一子簇和第二子簇中发生闪电的格点数量,是否小于雷暴单体最小簇的大小;
若第一子簇中发生闪电的格点数量小于雷暴单体最小簇的大小,第二子簇中发生闪电的格点数量大于等于雷暴单体最小簇的大小,则将所述第一子簇删除,并将所述第二子簇晋升为父节点簇;
若第一子簇中发生闪电的格点数量大于等于雷暴单体最小簇的大小,第二子簇中发生闪电的格点数量小于雷暴单体最小簇的大小,则将所述第二子簇删除,并将所述第一子簇晋升为父节点簇;
若第一子簇中发生闪电的格点数量小于雷暴单体最小簇的大小,第二子簇中发生闪电的格点数量小于雷暴单体最小簇的大小,则将所述第一子簇和所述第二子簇都删除;
若第一子簇中发生闪电的格点数量大于等于雷暴单体最小簇的大小,第二子簇中发生闪电的格点数量大于等于雷暴单体最小簇的大小,则继续将所述第一子簇和所述第二子簇分别向下各自分裂为两个子簇,记为第一子簇和第二子簇,返回执行步骤:分别判断第一子簇和第二子簇中发生闪电的格点数量,是否小于雷暴单体最小簇的大小。
9.如权利要求1所述的雷暴单体识别方法,其特征在于,每个簇的稳定性的计算式如下:
;
其中,
表示簇的稳定性;
表示当簇分离并成为其自己的簇时的/>值;
表示点/>从簇中分离出来的/>值;
表示距离的倒数。
10.如权利要求1所述的雷暴单体识别方法,其特征在于,还包括:
统计目标簇内发生闪电的格点数量N,并计算目标簇构成的凸包面积S;
根据所述格点数量N和面积S计算得到目标圆的半径,所述目标圆为经过目标簇内任意两个发生闪电的格点并以半径/>进行绘制的圆;
判断所述目标圆内是否包含除所述任意两个发生闪电的格点以外的其他格点,若否,则确定所述任意两个发生闪电的格点为所述目标簇的边界点,所述任意两个发生闪电的格点的连线为所述目标簇的边界线;
根据所述目标簇的边界线得到所述目标簇的轮廓。
11.如权利要求10所述的雷暴单体识别方法,其特征在于,根据所述格点数量N和面积S计算得到目标圆的半径的计算式如下:
;
其中,
表示所述目标簇内发生闪电的数量占目标簇构成的凸包面积的比例。
12.如权利要求10所述的雷暴单体识别方法,其特征在于,判断所述目标圆内是否包含除所述任意两个发生闪电的格点以外的其他格点,包括:
选取目标簇点集P中任一发生闪电的格点作为圆心,以/>为半径,确定领域点集R,/>为正整数,/>表示所述目标簇点集P中第/>个发生闪电的格点;
选取所述领域点集R内任一发生闪电的格点,确定经过所述格点/>及所述格点/>的圆的圆心/>,/>为正整数,/>表示所述领域点集R中第/>个发生闪电的格点;
计算所述领域点集R内除所述格点及所述格点/>以外的格点/>,与所述圆心/>之间的距离d;
判断是否,若是,则确定所述目标圆内不包含除所述任意两个发生闪电的格点以外的其他格点;所述目标圆为经过所述格点/>及所述格点/>,并以半径/>进行绘制的圆。
13.如权利要求10所述的雷暴单体识别方法,其特征在于,还包括:
根据所述目标簇点集对应的雷达组合反射率确定所述目标簇对应的雷暴单体内发生雷暴的概率。
14.如权利要求13所述的雷暴单体识别方法,其特征在于,根据所述目标簇点集对应的雷达组合反射率确定所述目标簇对应的雷暴单体内发生雷暴的概率,包括:
遍历所述目标簇的轮廓内所有格点,判断格点对应的雷达组合反射率是否大于等于第二预设阈值,若是,则将该格点对应位置赋值第一数据值;
否则,判断所述格点对应的雷达组合反射率是否小于等于第三预设阈值,若否,则将该格点对应位置赋值第二数据值;
否则,将该格点对应位置赋值第三数据值;
根据所有格点对应位置的赋值,确定所述目标簇内雷暴单体发生雷暴的概率信息;
其中,
所述第三数据值<第二数据值<第一数据值;
所述第三预设阈值<第二预设阈值。
15.一种雷暴单体识别装置,其特征在于,包括:
数据获取模块,用于获取闪电定位仪原始散点数据和雷达组合反射率矩阵数据;
数据转换模块,用于按照雷达组合反射率矩阵数据的时间分辨率和矩阵大小,将所述原始散点数据转换为矩阵数据;
最小树生成模块,用于构建所述矩阵数据的最小生成树;
最小树剪枝模块,用于将所述最小生成树的每个节点作为一个簇,通过节点簇生成各子簇,以雷暴单体最小簇为筛选条件,删除所有不满足筛选条件的子簇,所述雷暴单体最小簇是根据所述矩阵数据中发生闪电的格点数量确定的;
雷暴单体识别模块,用于计算每个簇的稳定性,根据稳定性确定选定簇,所述选定簇的稳定性大于其所属各子簇的稳定性之和;将所述选定簇中的点转换为所述矩阵数据中格点的坐标,得到若干表示雷暴单体的目标簇。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310775566.0A CN116500703B (zh) | 2023-06-28 | 2023-06-28 | 一种雷暴单体识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310775566.0A CN116500703B (zh) | 2023-06-28 | 2023-06-28 | 一种雷暴单体识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116500703A true CN116500703A (zh) | 2023-07-28 |
CN116500703B CN116500703B (zh) | 2023-09-01 |
Family
ID=87330584
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310775566.0A Active CN116500703B (zh) | 2023-06-28 | 2023-06-28 | 一种雷暴单体识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116500703B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117809192A (zh) * | 2024-03-01 | 2024-04-02 | 南京信息工程大学 | 一种基于denclue聚类算法的雷暴识别方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0693696A2 (en) * | 1994-07-13 | 1996-01-24 | BFGoodrich FlightSystems, Inc. | Lightning strike detection and mapping system |
US5528494A (en) * | 1994-10-06 | 1996-06-18 | B. F. Goodrich Flight Systems, Inc. | Statistically based thunderstorm cell detection and mapping system |
US20150276981A1 (en) * | 2014-03-31 | 2015-10-01 | International Business Machines Corporation | Method and apparatus for lightning forecast |
CN106251026A (zh) * | 2016-08-16 | 2016-12-21 | 南京信息工程大学 | 基于pdbscan算法的雷电临近趋势预报方法 |
US20170363773A1 (en) * | 2016-06-20 | 2017-12-21 | Vaisala, Inc. | Forecasting lightning activity |
CN114137637A (zh) * | 2021-11-09 | 2022-03-04 | 国网山东省电力公司应急管理中心 | 基于闪电和雷达数据的雷暴中心踪迹的集合概率预报方法 |
CN114254692A (zh) * | 2021-11-09 | 2022-03-29 | 国网山东省电力公司检修公司 | 基于多源闪电数据的多尺度的雷暴智能分类与识别方法 |
US11353625B1 (en) * | 2015-11-24 | 2022-06-07 | Board Of Trustees Of The University Of Alabama, For And On Behalf Of The University Of Alabama In Huntsville | Systems and methods for forecasting lightning and severe storms |
CN115987867A (zh) * | 2022-12-23 | 2023-04-18 | 中国电子科技集团公司第五十四研究所 | 一种基于均等分簇的光电-雷达传感器网数据收集方法 |
CN116008671A (zh) * | 2022-12-14 | 2023-04-25 | 南京信息工程大学 | 一种基于时差和聚类的闪电定位方法 |
-
2023
- 2023-06-28 CN CN202310775566.0A patent/CN116500703B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0693696A2 (en) * | 1994-07-13 | 1996-01-24 | BFGoodrich FlightSystems, Inc. | Lightning strike detection and mapping system |
US5528494A (en) * | 1994-10-06 | 1996-06-18 | B. F. Goodrich Flight Systems, Inc. | Statistically based thunderstorm cell detection and mapping system |
US20150276981A1 (en) * | 2014-03-31 | 2015-10-01 | International Business Machines Corporation | Method and apparatus for lightning forecast |
US11353625B1 (en) * | 2015-11-24 | 2022-06-07 | Board Of Trustees Of The University Of Alabama, For And On Behalf Of The University Of Alabama In Huntsville | Systems and methods for forecasting lightning and severe storms |
US20170363773A1 (en) * | 2016-06-20 | 2017-12-21 | Vaisala, Inc. | Forecasting lightning activity |
CN106251026A (zh) * | 2016-08-16 | 2016-12-21 | 南京信息工程大学 | 基于pdbscan算法的雷电临近趋势预报方法 |
CN114137637A (zh) * | 2021-11-09 | 2022-03-04 | 国网山东省电力公司应急管理中心 | 基于闪电和雷达数据的雷暴中心踪迹的集合概率预报方法 |
CN114254692A (zh) * | 2021-11-09 | 2022-03-29 | 国网山东省电力公司检修公司 | 基于多源闪电数据的多尺度的雷暴智能分类与识别方法 |
CN116008671A (zh) * | 2022-12-14 | 2023-04-25 | 南京信息工程大学 | 一种基于时差和聚类的闪电定位方法 |
CN115987867A (zh) * | 2022-12-23 | 2023-04-18 | 中国电子科技集团公司第五十四研究所 | 一种基于均等分簇的光电-雷达传感器网数据收集方法 |
Non-Patent Citations (1)
Title |
---|
FRANKLIN T. LOMBARDO,ALEXANDER S. ZICKAR: "Characteristics of measured extreme thunderstorm near-surface wind gusts in the United States", 《JOURNAL OF WIND ENGINEERING AND INDUSTRIAL AERODYNAMICS》, vol. 193, pages 103961 - 98 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117809192A (zh) * | 2024-03-01 | 2024-04-02 | 南京信息工程大学 | 一种基于denclue聚类算法的雷暴识别方法 |
CN117809192B (zh) * | 2024-03-01 | 2024-04-26 | 南京信息工程大学 | 一种基于denclue聚类算法的雷暴识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116500703B (zh) | 2023-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112526513B (zh) | 基于聚类算法的毫米波雷达环境地图构建方法及装置 | |
CN106529469B (zh) | 基于自适应坡度的无人机载LiDAR点云滤波方法 | |
CN116500703B (zh) | 一种雷暴单体识别方法和装置 | |
CN111291776B (zh) | 基于众源轨迹数据的航道信息提取方法 | |
CN111598915A (zh) | 点云单木分割方法、装置、设备及计算机可读介质 | |
CN110443810A (zh) | 基于快速邻接体素查询的点云平面分割方法 | |
CN112462347B (zh) | 基于密度聚类的激光雷达点云快速分类滤波算法 | |
CN115496796B (zh) | 一种通过激光点云测算树干体积的方法和系统 | |
CN111860359B (zh) | 一种基于改进随机森林算法的点云分类方法 | |
CN111950589B (zh) | 结合K-means聚类的点云区域生长优化分割方法 | |
CN113269791A (zh) | 一种基于边缘判定与区域生长的点云分割方法 | |
CN116341961A (zh) | 海洋资源均质区域划分方法、装置及电子设备 | |
CN111275099A (zh) | 一种基于网格粒度计算的聚类方法及聚类系统 | |
CN114693855B (zh) | 一种点云数据的处理方法和装置 | |
CN114581473A (zh) | 一种适用于多种场景的点云降采样方法及装置 | |
CN117851927B (zh) | 一种基于随机森林与气象数据的云预测方法 | |
CN114492540B (zh) | 目标检测模型的训练方法、装置、计算机设备及存储介质 | |
CN117725448A (zh) | 气象导航信号特征的聚类分析方法 | |
CN117095754B (zh) | 一种利用机器学习进行蛋白质分类的方法 | |
CN114882373A (zh) | 基于深度神经网络的多特征融合沙尘暴预测方法 | |
CN110097636B (zh) | 一种基于可视域分析的选址规划方法 | |
KR101737889B1 (ko) | 데이터 마이닝 기법을 이용한 지상 라이다 데이터의 필터링 및 현황선 추출 방법과 그 장치 | |
CN116451088A (zh) | 基于多要素特征相似性和地理区划聚类的优选代站方法 | |
CN113554079B (zh) | 一种基于二次检测法的电力负荷异常数据检测方法及系统 | |
CN116385659A (zh) | 一种点云建筑物建模方法、系统、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |