CN117312875A - 基于knn算法的区域性高温事件相似判别方法 - Google Patents

基于knn算法的区域性高温事件相似判别方法 Download PDF

Info

Publication number
CN117312875A
CN117312875A CN202311323941.4A CN202311323941A CN117312875A CN 117312875 A CN117312875 A CN 117312875A CN 202311323941 A CN202311323941 A CN 202311323941A CN 117312875 A CN117312875 A CN 117312875A
Authority
CN
China
Prior art keywords
temperature
event
regional
historical
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311323941.4A
Other languages
English (en)
Other versions
CN117312875B (zh
Inventor
王丽荣
魏铁鑫
解文娟
赵亮
张安凝知
景华
张素云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hebei Meteorological Disaster Prevention And Environmental Meteorological Center Hebei Early Warning Information Release Center
Original Assignee
Hebei Meteorological Disaster Prevention And Environmental Meteorological Center Hebei Early Warning Information Release Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hebei Meteorological Disaster Prevention And Environmental Meteorological Center Hebei Early Warning Information Release Center filed Critical Hebei Meteorological Disaster Prevention And Environmental Meteorological Center Hebei Early Warning Information Release Center
Priority to CN202311323941.4A priority Critical patent/CN117312875B/zh
Publication of CN117312875A publication Critical patent/CN117312875A/zh
Application granted granted Critical
Publication of CN117312875B publication Critical patent/CN117312875B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于KNN算法的区域性高温事件相似判别方法,该方法包括以下步骤:S1、获取被关注地区不少于三十年的逐日最高气温历史数据和曾经发生的高温灾情记录;S2、以35℃为限划分高温事件,结合高温灾情记录,确定被关注地区的区域性高温事件;S3、集合所有区域性高温事件,构建历史区域性高温事件数据库;S4、通过KNN分类算法从历史区域性高温事件数据库中筛选出与待查询区域性高温事件最相近的K个历史事件;S5、分别计算历史事件与待查询高温事件之间的欧式距离并转化为相似度,则相似度数值最小的历史事件即被认定为是与待查询高温事件最相似的区域性高温事件,从而为气象服务业务所使用。

Description

基于KNN算法的区域性高温事件相似判别方法
所属领域
本发明涉及一种相似气象灾害事件的判别方法,具体地说是一种基于KNN算法的区域性高温事件相似判别方法。
背景技术
高温是华北地区夏季面临的主要气象灾害之一。在全球变暖背景下,高温天气愈发频繁,且可能会进一步加剧。高温天气给人民身体健康、农业和电力行业都会带来较大的危害。持续的高温天气所带来的危害主要包括以下几方面:一是会引发人员中暑甚至死亡;二是会加剧干旱,造成农作物减产绝收,进而影响粮食安全;三是导致用水用电量的激增,给供水供电造成巨大负荷;四是会诱发森林草原发生火灾,还会导致易燃化学品发生火灾。
因此,加强高温灾害的风险预警,可以有效地提升对高温灾害防御的决策能力和水平。在高温历史灾情信息较少的情况下,依据历史相似事件的判别,对于灾损的快速评估以及风险预警等都具有重要的意义。参考历史相似高温事件的灾情,可提高对当前发生的高温事件可能会带来的不利影响的认识,从而为防灾减灾提供决策依据。但是,目前还没有较为有效和准确的方法对区域性高温事件与历史高温事件的相似性进行判别,因而尚不能为防灾减灾提供科学和可靠的决策依据。
发明内容
本发明的目的是提供一种基于KNN算法的区域性高温事件相似判别方法,提高对当前发生的高温事件可能带来的不利影响的认识,为防灾减灾提供较为科学和可靠的决策依据。
本发明的目的是这样实现的:
一种基于KNN算法的区域性高温事件相似判别方法,包括以下步骤:
S1、从气象部门获取被关注地区内各气象观测站点不少于三十年的逐日最高气温观测历史数据,并利用各种途径获取该时段内被关注地区内曾经发生的高温灾情记录。
S2、根据逐个气象观测站点观测的逐日最高气温历史数据,以35℃为限初步划分为高温事件,结合高温灾情记录,确定造成高温灾害的区域性高温事件,并得到区域性高温事件的覆盖面积和持续日数的低限阈值,则高于该低限阈值的区域内发生的高温事件即被确定为被关注地区的区域性高温事件。
S3、将所有区域性高温事件进行数据集合,构建被关注地区的历史区域性高温事件数据库;该数据库的数据信息包括每个区域性高温事件的过程指标和单站指标;所述过程指标包括该区域性高温事件的开始日期、综合强度指数、持续日数、中心点经纬度、最大覆盖面积、逐日平均覆盖面积、发生过程中极端最高气温、平均日最高气温以及最高强度指数等级的中心点经纬度;所述单站指标包括该区域性高温事件中每个气象观测站点的逐日最高气温和单站高温强度指数。
S4、以区域性高温事件发生的开始日期、最大覆盖面积、中心点经纬度、综合强度指数、最高强度指数等级的中心点经纬度、发生过程中极端最高气温以及单站高温强度指数作为相似度评价指标,并利用相似度评价指标通过KNN分类算法进行计算,以从历史区域性高温事件数据库中筛选出与待查询区域性高温事件最相近的K个历史事件。
S5、分别计算这K个历史事件与待查询高温事件之间的欧式距离,对所计算出的各欧式距离进行归一化处理,再转化为相似度,则相似度数值最小的历史事件即被认定为是与待查询高温事件最相似的区域性高温事件。
进一步地,步骤S2中的所述区域性高温事件的确定方式包括以下子步骤:
S2-1、以被关注区域内的一个以上的气象观测站点所记录的最高气温出现35℃以上的日期作为区域性高温事件的开始日期,以被关注区域内当天所有气象观测站点记录的最高气温都低于35℃的前一天作为区域性高温事件的结束日期,初步划分为高温事件,记录所有高温事件的包括持续日数、覆盖面积、极端最高气温、平均日最高气温以及逐个气象观测站点观测的逐日最高气温在内的数据,建立初始高温事件数据库。
S2-2、结合搜集到的高温灾情数据,确定可能造成灾害影响的区域性高温事件的包括覆盖面积和持续日数在内的最低阈值标准;以该阈值标准为选择依据,对初始高温事件数据库中的高温事件进行筛选,对于覆盖面积和持续日数均高于最低阈值标准的,即将该事件确定为被关注地区的区域性高温事件。
进一步地,步骤S3所构建的区域性高温事件数据库包括每个区域性高温事件的过程指标和单站指标;所述过程指标包括该区域性高温事件的开始日期、综合强度指数、持续日数、中心点经纬度、最大覆盖面积、逐日平均覆盖面积、发生过程中极端最高气温、平均日最高气温以及最高强度指数等级的中心点经纬度;所述单站指标是指该区域性高温事件中每个气象观测站点的逐日最高气温和单站高温强度指数。
进一步地,所述单站高温强度指数的计算公式为:
Z单站=W11D+W12C+W13M
其中,单站高温是指某个气象观测站点记录的日最高气温达到35℃以上,Z单站为单站高温强度指数,D为单站高温持续日数,C为单站高温超过35℃阈值的累积温度,M为单站高温的极端最高气温,W11、W12、W13分别为参数D、C、M所对应的权重。
进一步地,所述综合强度指数的计算公式为:
其中,Z区域为区域性高温事件的综合强度指数;Q表示连续性,是指区域性高温事件过程中后一日达到高温阈值的站点数与前一日达到高温阈值的站点数之比值的平均值;为区域性高温事件过程中达到高温阈值的日均最高气温;/>为达到高温阈值的日均发生面积,指区域性高温事件发生过程中每日不低于35℃区域覆盖面积的平均值;D为区域性高温事件的持续日数,W21、W22、W23、W24分别为参数Q、/>D所对应的权重。
进一步地,所述中心点经纬度的计算公式为:
其中,X为区域性高温事件中心点的纬度;Y为区域性高温事件中心点的经度;Ci为该次区域性高温事件第i个气象观测站点的日最高气温;Xi为该次区域性高温事件第i个气象观测站点的纬度;Yi为该次区域性高温事件第i个气象观测站点的经度;m为该次区域性高温事件达到高温阈值的气象观测站点的总数。
进一步地,本发明步骤S4中的最相近的K个历史事件的筛选方式包括以下子步骤:
S4-1、基于历史区域性高温事件数据库,构建相似度评价指标历史样本数据集:
其中,xi,j∈R,i=1,2,3,...,n;n为历史事件的样本总数;j=1,2,3,...,m;m为相似度评价指标的个数;xij为相似度评价指标历史样本数据集中第i个事件的第j个指标的取值。
S4-2、将待查询高温事件的相似度评价指标代入相似度评价指标历史样本数据集中,采用KD树法,从中获得与待查询高温事件最为相似的K个历史事件邻域。
进一步地,本发明步骤S5中的历史事件与待查询高温事件之间的欧式距离的具体计算方式包括以下子步骤:
S5-1、采用Z值法分别对每个历史事件以及待查询高温事件的所有相似度指标进行标准化处理,以得到各个指标的无量纲属性值;相似度指标的标准化处理公式为:
其中,x为原始数据,μ为平均值,σ为标准差。
S5-2、利用标准化后的每个历史事件以及待查询高温事件的相似度指标,分别计算每个历史事件与待查询高温事件之间的欧式距离(distance):
其中,x0,j为待查询事件的指标j的无量纲属性值,xi,j为历史样本数据集中第i个事件的指标j的无量纲属性值,Wj为指标j的权重。
进一步地,本发明步骤S5中的将标准化后的欧式距离转化为相似度的计算方式为:
其中,Sim为相似度,distance为两个事件之间的欧式距离,distance_max为历史样本数据集中两两事件之间的欧式距离最大值。
本发明利用机器学习算法,引入高温强度指数和相似度的概念判别区域性高温相似事件,经检验,判别效果和准确性能够达到气象服务业务应用需求,提高了对当前发生的区域性高温事件可能带来影响的认知,为有效应对区域性高温事件提供科学依据。
附图说明
图1是河北省141个区域性高温事件间最相似事件的相似度累积概率分布图。
具体实施方式
下面结合附图对本发明做进一步详述。
本发明以河北省为例,进行了区域性高温事件相似度判别,其判别方法如下:
S1、从气象部门获取河北省142个气象观测站点自1980年至2020年的逐日最高气温观测数据。从《中国气象灾害大典河北卷》、《中国气象灾害年鉴》、行业部门等渠道获取该时段内河北省曾经发生的区域性高温灾情记录,得到有明确具体发生台站的历史高温灾情记录27条,有14条灾情记录为河北省范围内多站点同时发生灾情的区域性高温事件记录。
S2、根据逐个气象观测站点观测的逐日最高气温历史数据,以35℃为限初步划分为高温事件,结合高温灾情记录,确定造成高温灾害的区域性高温事件,并得到区域性高温事件的覆盖面积和持续日数的低限阈值,则高于该低限阈值的区域内发生的高温事件即被确定为被关注地区的区域性高温事件。区域性高温事件的确定方式包括以下子步骤:
S2-1、将河北省142个气象观测站点≥1站最高气温出现35℃以上的日期作为区域性高温事件的开始日期,河北省内所有站点最高气温都低于35℃的前一天作为此次区域性高温事件的结束日期,河北省1980-2020年共提取出575次区域性高温事件。记录该区域性高温事件的持续日数、覆盖范围、极端最高气温、平均日最高气温以及逐站的逐日最高气温等要素,建立初始高温事件数据库。
S2-2、结合搜集到的高温灾情数据,确定可能造成灾害影响的区域性高温事件的包括最小覆盖面积和持续日数在内的最低阈值标准,将监测区域内日最高气温≥35℃的站数比例≥30%判定为1个区域性组群,某个区域性组群持续2天及以上,则判定其为一个区域性高温事件,连续两日高温站数占比<30%或一日高温站数占比<20%,认定为区域性高温事件结束。通过此标准对前面建立的初始数据库进行筛选,1980-2020年间共识别出141次可能带来灾情的区域性高温事件。
S3、将所有区域性高温事件进行数据集合,构建河北省历史区域性高温事件数据库。该数据库的数据信息包括每个区域性高温事件的过程指标和单站指标。其中,过程指标包括该区域性高温事件的开始日期、综合强度指数、持续日数、中心点经纬度、最大覆盖面积、逐日平均覆盖面积、发生过程中极端最高气温、平均日最高气温以及最高强度指数等级的中心点经纬度;单站指标包括该区域性高温事件中每个气象观测站点的逐日最高气温和单站高温强度指数。
S4、选取区域性高温事件发生的开始日期、最大覆盖面积、中心点经纬度、最高强度指数等级的中心点经纬度、综合强度指数、发生过程中极端最高气温以及单站最高强度指数作为相似度评价指标,采用专家打分法确定各指标的权重(表1)。
表1:区域性高温事件相似判别指标及权重
单站强度指数计算公式为:
Z单站=0.784D+0.211C+0.005M
式中,Z单站为单站高温强度指数,D为单站高温持续日数,C为单站高温超过35℃阈值的累积温度,M为单站高温的极端最高气温。
综合强度指数计算公式为:
式中,Z区域为区域性高温事件的综合强度指数;Q为连续性,是指区域性高温事件过程中后一日达到高温阈值的站点数与前一日达到高温阈值的站点数之比值的平均值;为区域性高温事件过程中达到高温阈值的日均最高气温;/>为达到高温阈值的日均发生面积,指区域性高温事件发生过程中每日不低于35℃区域覆盖面积的平均值;D为区域性高温事件的持续日数。
中心点经纬度具体计算公式为:
式中,X、Y分别为区域性高温事件中心点的纬度、经度;Ci为该次区域性高温事件第i个气象观测站点的日最高气温;Xi、Yi分别为该次区域性高温事件第i个气象观测站点的纬度、经度;m为该次区域性高温事件达到高温阈值的气象观测站点的总数。
利用相似度评价指标,通过KNN(K-Nearest Neighbor)分类算法,从历史区域性高温事件数据库中筛选出与待查询高温事件最相近的K个历史事件。最相近K个事件筛选的具体操作方式是:
S4-1、基于历史区域性高温事件数据库,构建相似度评价指标历史样本数据集:
式中,xi,j∈R,i=1,2,3,...,n;n为历史事件的样本总数;j=1,2,3,...,m;m为相似度评价指标的个数;xij为相似度评价指标历史样本数据集中第i个事件的第j个指标的取值。
S4-2、将待查询高温事件的相似度评价指标代入相似度评价指标历史样本数据集中,采用KD树法,从中获得与待查询高温事件最为相似的K个历史事件邻域。
S5、分别计算这K个历史事件与待查询高温事件之间的欧式距离,对所计算出的各欧式距离进行归一化处理,再转化为相似度,则相似度数值最小的历史事件即被认定为是与待查询高温事件最相似的区域性高温事件。
历史事件与待查询高温事件之间的欧式距离的具体计算方式包括以下子步骤:
S5-1、采用Z值(Z-score)方法分别对每个历史事件以及待查询高温事件的所有相似度指标进行标准化处理,以得到各个指标的无量纲属性值。相似度指标的标准化处理公式为:
式中,x为原始数据,μ为平均值,σ为标准差。
S5-2、利用标准化后的每个历史事件以及待查询高温事件的相似度指标,分别计算每个历史事件与待查询高温事件之间的欧式距离(distance):
式中,x0,j为待查询事件的指标j的无量纲属性值,xi,j为历史样本数据集中第i个事件的指标j的无量纲属性值,Wj为指标j的权重(见表1)。
将标准化后的欧式距离转化为相似度的计算方式为:
式中,Sim为相似度,distance为两个事件之间的距离,distance_max为历史样本数据集中两两事件之间的欧式距离最大值。
对识别出的1980年至2020年间的141个区域性高温事件计算两两之间的相似度,根据相似度的大小确定每个事件的最相似事件。绝大多数最相似事件的相似度在0.9以上,最低的相似度为0.74,为2009年6月23日至2009年7月4日的一次长时间的区域性高温事件,因为此次高温事件综合强度指数达到0.87,远高于历史区域性高温事件数据库中其他的区域性高温事件,而在相似度判别指标中,强度指标的权重最高,故在历史区域性高温事件数据库难以找到与其极为相似的事件。综合来看,采用欧式距离计算空间距离再转化为相似度的相似事件判别方法计算的相似度分布合理。
待查询区域性高温事件一:以1993年6月18-20日的区域性高温事件为例,确定的最相似事件为1998年6月19-21日的区域性高温事件,相似度为0.92,两次过程的特征值见表2。可以看出,识别出的最相似区域性高温事件的各特征量与单站高温风险等级的空间分布与待查询区域性高温事件一非常接近。
表2:待查询区域性高温事件一与最相似事件特征指标值
待查询区域性高温事件二:再以2002年7月14-17日的区域性高温事件为例,确定的最相似区域性高温事件为2002年7月8-12日的区域性高温事件,相似度为0.91,两次过程的特征指标值见表3。与待查询区域性高温事件一相似,识别出的最相似事件单站高温风险等级空间分布与待查询区域性高温事件二极为相似。
表3待查询区域性高温事件二与最相似事件特征指标值
通过河北省141个区域性高温事件及两个待查询区域性高温事件相似性的展示可以发现,基于本发明能够准确地识别出与待查询区域性高温事件最为相似的区域性高温事件,可以为气象服务业务所使用。

Claims (8)

1.一种基于KNN算法的区域性高温事件相似判别方法,其特征是,包括以下步骤:
S1、从气象部门获取被关注地区内各气象观测站点不少于三十年的逐日最高气温观测历史数据,并利用各种途径获取该时段内被关注地区内曾经发生的高温灾情记录;
S2、根据逐个气象观测站点观测的逐日最高气温历史数据,以35℃为限初步划分为高温事件,结合高温灾情记录,确定造成高温灾害的区域性高温事件,并得到区域性高温事件的覆盖面积和持续日数的低限阈值,则高于该低限阈值的区域内发生的高温事件即被确定为被关注地区的区域性高温事件;
S3、将所有区域性高温事件进行数据集合,构建被关注地区的历史区域性高温事件数据库;该数据库的数据信息包括每个区域性高温事件的过程指标和单站指标;所述过程指标包括该区域性高温事件的开始日期、综合强度指数、持续日数、中心点经纬度、最大覆盖面积、逐日平均覆盖面积、发生过程中极端最高气温、平均日最高气温以及最高强度指数等级的中心点经纬度;所述单站指标包括该区域性高温事件中每个气象观测站点的逐日最高气温和单站高温强度指数;
S4、以区域性高温事件发生的开始日期、最大覆盖面积、中心点经纬度、综合强度指数、最高强度指数等级的中心点经纬度、发生过程中极端最高气温以及单站高温强度指数作为相似度评价指标,并利用相似度评价指标通过KNN分类算法进行计算,以从历史区域性高温事件数据库中筛选出与待查询高温事件最相近的K个历史事件;
S5、分别计算这K个历史事件与待查询高温事件之间的欧式距离,对所计算出的各欧式距离进行归一化处理,再转化为相似度,则相似度数值最小的历史事件即被认定为是与待查询高温事件最相似的区域性高温事件。
2.根据权利要求1所述的基于KNN算法的区域性高温事件相似判别方法,其特征是,步骤S2中的所述区域性高温事件的确定方式包括以下子步骤:
S2-1、以被关注区域内的一个以上的气象观测站点所记录的最高气温出现35℃以上的日期作为区域性高温事件的开始日期,以被关注区域内当天所有气象观测站点记录的最高气温都低于35℃的前一天作为区域性高温事件的结束日期,初步划分为高温事件,记录所有高温事件的包括持续日数、覆盖面积、极端最高气温、平均日最高气温以及逐个气象观测站点观测的逐日最高气温在内的数据,建立初始高温事件数据库;
S2-2、结合搜集到的高温灾情数据,确定可能造成灾害影响的区域性高温事件的包括覆盖面积和持续日数在内的最低阈值标准;以该阈值标准为选择依据,对初始高温事件数据库中的高温事件进行筛选,对于覆盖面积和持续日数均高于最低阈值标准的,即将该事件确定为被关注地区的区域性高温事件。
3.根据权利要求2所述的基于KNN算法的区域性高温事件相似判别方法,其特征是,所述单站高温强度指数的计算公式为:
Z单站=W11D+W12C+W13M
其中,单站高温是指某个气象观测站点记录的日最高气温达到35℃以上,Z单站为单站高温强度指数,D为单站高温持续日数,C为单站高温超过35℃阈值的累积温度,M为单站高温的极端最高气温,W11、W12、W13分别为参数D、C、M所对应的权重。
4.根据权利要求2所述的基于KNN算法的区域性高温事件相似判别方法,其特征是,所述综合强度指数的计算公式为:
其中,Z区域为区域性高温事件的综合强度指数;Q表示连续性,是指区域性高温事件过程中后一日达到高温阈值的站点数与前一日达到高温阈值的站点数之比值的平均值;为区域性高温事件过程中达到高温阈值的日均最高气温;/>为达到高温阈值的日均发生面积,指区域性高温事件发生过程中每日不低于35℃区域覆盖面积的平均值;D为区域性高温事件的持续日数;W21、W22、W23、W24分别为参数Q、/>D所对应的权重。
5.根据权利要求2所述的基于KNN算法的区域性高温事件相似判别方法,其特征是,所述中心点经纬度的计算公式为:
其中,X为区域性高温事件中心点的纬度;Y为区域性高温事件中心点的经度;Ci为该次区域性高温事件第i个气象观测站点的日最高气温;Xi为该次区域性高温事件第i个气象观测站点的纬度;Yi为该次区域性高温事件第i个气象观测站点的经度;m为该次区域性高温事件达到高温阈值的气象观测站点的总数。
6.根据权利要求1所述的基于KNN算法的区域性高温事件相似判别方法,其特征是,步骤S4中的最相近的K个历史事件的筛选方式包括以下子步骤:
S4-1、基于历史区域性高温事件数据库,构建相似度评价指标历史样本数据集:
其中,xi,j∈R,i=1,2,3,…,n;n为历史事件的样本总数;j=1,2,3,…,m;m为相似度评价指标的个数;xij为相似度评价指标历史样本数据集中第i个事件的第j个指标的取值;S4-2、将待查询高温事件的相似度评价指标代入相似度评价指标历史样本数据集中,采用KD树法,从中获得与待查询高温事件最为相似的K个历史事件邻域。
7.根据权利要求1所述的基于KNN算法的区域性高温事件相似判别方法,其特征是,步骤S5中的历史事件与待查询高温事件之间的欧式距离的具体计算方式包括以下子步骤:
S5-1、采用Z值法分别对每个历史事件以及待查询高温事件的所有相似度指标进行标准化处理,以得到各个指标的无量纲属性值;相似度指标的标准化处理公式为:
其中,x为原始数据,μ为平均值,σ为标准差;
S5-2、利用标准化后的每个历史事件以及待查询高温事件的相似度指标,分别计算每个历史事件与待查询高温事件之间的欧式距离(distance):
其中,x0,j为待查询事件的指标j的无量纲属性值,xi,j为历史样本数据集中第i个事件的指标j的无量纲属性值,Wj为指标j的权重。
8.根据权利要求7所述的基于KNN算法的区域性高温事件相似判别方法,其特征是,步骤S5中的将标准化后的欧式距离转化为相似度的计算方式为:
其中,Sim为相似度,distance为两个事件之间的欧式距离,distance_max为历史样本数据集中两两事件之间的欧式距离最大值。
CN202311323941.4A 2023-10-13 2023-10-13 基于knn算法的区域性高温事件相似判别方法 Active CN117312875B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311323941.4A CN117312875B (zh) 2023-10-13 2023-10-13 基于knn算法的区域性高温事件相似判别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311323941.4A CN117312875B (zh) 2023-10-13 2023-10-13 基于knn算法的区域性高温事件相似判别方法

Publications (2)

Publication Number Publication Date
CN117312875A true CN117312875A (zh) 2023-12-29
CN117312875B CN117312875B (zh) 2024-04-12

Family

ID=89260071

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311323941.4A Active CN117312875B (zh) 2023-10-13 2023-10-13 基于knn算法的区域性高温事件相似判别方法

Country Status (1)

Country Link
CN (1) CN117312875B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130024118A1 (en) * 2010-01-18 2013-01-24 The Regents Of The University Of California System and Method for Identifying Patterns in and/or Predicting Extreme Climate Events
US20190228221A1 (en) * 2018-05-29 2019-07-25 University Of Electronic Science And Technology Of China Method for separating out a defect image from a thermogram sequence based on weighted naive bayesian classifier and dynamic multi-objective optimization
CN113516577A (zh) * 2021-07-13 2021-10-19 广东海洋大学 一种区域持续性极端高温事件识别的新方法
CN113743673A (zh) * 2021-09-09 2021-12-03 中国南方电网有限责任公司 一种台风期间的电力负荷预测方法
CN114611894A (zh) * 2022-03-01 2022-06-10 中国科学院地理科学与资源研究所 高温热浪预警信息推送方法、装置、设备、介质及产品
CN116108199A (zh) * 2022-12-29 2023-05-12 北京辰安科技股份有限公司 区域暴雨灾害事件链构建方法、装置、电子设备及存储介质
CN116611592A (zh) * 2023-07-21 2023-08-18 成都理工大学 基于深度学习的铁路廊道沿线地热异常区预测方法
CN116628519A (zh) * 2023-07-17 2023-08-22 河海大学 一种生态脆弱区识别方法及系统
CN116663997A (zh) * 2023-06-05 2023-08-29 成都深瑞同华科技有限公司 一种分体式空调节能效果评估方法、系统、设备及介质
CN116719797A (zh) * 2023-07-12 2023-09-08 兰州理工大学 基于if-ddpm的闪速炉缺失数据生成及填补方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130024118A1 (en) * 2010-01-18 2013-01-24 The Regents Of The University Of California System and Method for Identifying Patterns in and/or Predicting Extreme Climate Events
US20190228221A1 (en) * 2018-05-29 2019-07-25 University Of Electronic Science And Technology Of China Method for separating out a defect image from a thermogram sequence based on weighted naive bayesian classifier and dynamic multi-objective optimization
CN113516577A (zh) * 2021-07-13 2021-10-19 广东海洋大学 一种区域持续性极端高温事件识别的新方法
CN113743673A (zh) * 2021-09-09 2021-12-03 中国南方电网有限责任公司 一种台风期间的电力负荷预测方法
CN114611894A (zh) * 2022-03-01 2022-06-10 中国科学院地理科学与资源研究所 高温热浪预警信息推送方法、装置、设备、介质及产品
CN116108199A (zh) * 2022-12-29 2023-05-12 北京辰安科技股份有限公司 区域暴雨灾害事件链构建方法、装置、电子设备及存储介质
CN116663997A (zh) * 2023-06-05 2023-08-29 成都深瑞同华科技有限公司 一种分体式空调节能效果评估方法、系统、设备及介质
CN116719797A (zh) * 2023-07-12 2023-09-08 兰州理工大学 基于if-ddpm的闪速炉缺失数据生成及填补方法
CN116628519A (zh) * 2023-07-17 2023-08-22 河海大学 一种生态脆弱区识别方法及系统
CN116611592A (zh) * 2023-07-21 2023-08-18 成都理工大学 基于深度学习的铁路廊道沿线地热异常区预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
程晋昕;段长春;闫生杰;: "基于MaxEnt模型的薄壳山核桃气候适宜性区划", 应用气象学报, no. 05, 9 September 2020 (2020-09-09) *

Also Published As

Publication number Publication date
CN117312875B (zh) 2024-04-12

Similar Documents

Publication Publication Date Title
Tachiiri et al. Assessing Mongolian snow disaster risk using livestock and satellite data
Gazol et al. Forecasting forest vulnerability to drought in Pyrenean silver fir forests showing dieback
CN112215716A (zh) 农作物生长干预方法、装置、设备及存储介质
CN115631077A (zh) 一种基于风险度的暴雨灾害风险评估方法
Iturritxa et al. Spatial analysis of the risk of major forest diseases in Monterey pine plantations
CN116842435A (zh) 基于swap的场次干旱三维度量及时空演变可视化方法
CN116029860A (zh) 基于gis的智慧农业种植区域规划辅助决策系统
CN117312875B (zh) 基于knn算法的区域性高温事件相似判别方法
CN112907113A (zh) 一种考虑空间相关性的植被变化成因识别方法
Hartsell et al. Forest area and conditions: A 2010 update of Chapter 16 of the Southern forest resource assessment
Latifa et al. Mapping and Estimating the Impact of Drought on Food Crop Farmers Using Remote Sensing in East Nusa Tenggara Province
CN108647853B (zh) 一种有害生物疫情评价分析方法
Lewis et al. Comparing data subsets and transformations for reproducing an expert-based vegetation classification of an Australian tropical savanna
Ribeiro et al. The effect of forest management on the avifauna of a Brazilian dry forest
Njokuocha et al. Effects of weather conditions on selected airborne fungal spores in the southern part of the state of Enugu, Nigeria
Yang et al. Disaster process–based spatiotemporal characteristics of apricot frost in the warm temperate zone (WTZ), China
Topçu Drought Monitoring Using MOWCATL Data Mining Algorithm in Aras Basin, Turkey
CN112528095B (zh) 一种台风生成中期展望预警信息快速查询系统
Purwanti et al. Probability of hotspots emergence using Consecutive Dry Days (CDD) in West Kalimantan
Kumar et al. Detection of Cyclones and Extreme Weather Events Using Advanced Deep Learning Methods
Coscarelli et al. Meteorological Drought Characterization in the Calabria Region (Southern Italy). Climate 2023, 11, 160
De Oliveira et al. Clustering Weather Time Series used for Agricultural Disease Alert Systems in Florida
Jianying et al. Process-Based Indicators for Timely Identification of Apricot Frost Disaster on the Warm Temperate Zone, China
Santana et al. Spatial and temporal variability of rainfall in Western Bahia
Neto et al. Temporal Evolution of Hurricane Activity: Insights from Decades of Category 1-5 Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant