WO2021169271A1

WO2021169271A1 - 雷雨天气预测模型的训练方法及雷雨天气预测方法

Info

Publication number: WO2021169271A1
Application number: PCT/CN2020/117578
Authority: WO
Inventors: 段洪云; 彭琛; 汪伟
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-02-25
Filing date: 2020-09-25
Publication date: 2021-09-02
Also published as: CN111368887B; CN111368887A

Abstract

本申请公开了一种雷雨天气预测模型的训练方法，包括：获取多组数据，其中，每组数据包括雷雨天气、所述雷雨天气的多个特征、以及所述雷雨天气及所述雷雨天气的多个特征的关联关系；从所述多组数据的多个特征中筛选出目标特征，其中，所述目标特征为第一特征重要度满足第一预定条件的特征；在所述多组数据的每组数据中，将与所述目标特征无关的特征剔除，形成多组训练数据；利用所述多组训练数据训练预定算法，得到雷雨天气预测模型。本申请还提供了一种雷雨天气预测方法、一种雷雨天气预测模型的训练装置、一种雷雨天气预测装置、一种计算机设备和一种计算机可读存储介质。

Description

雷雨天气预测模型的训练方法及雷雨天气预测方法

本申请要求于2020年02月25日提交中国专利局、申请号为202010116671.X，发明名称为“雷雨天气预测模型的训练方法及雷雨天气预测方法”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能和计算机技术领域，具体涉及一种雷雨天气预测模型的训练方法、雷雨天气预测方法、装置、计算机设备及计算机可读存储介质。

背景技术

随着气象技术的发展，对天气情况进行预测的方式随之发展。通常，在对天气情况进行预测试时，可以根据卫星、雷达等大型设备采集到的天气数据进行预测，如将采集到的天气数据输入到预先训练完成的天气预测模型中。为了保证天气预测的准确性，通常需要保证天气预测模型的预测准确度，这就对天气预测模型的训练过程有较高的要求。

然而，发明人在研究本申请的过程中发现，现有技术中至少存在如下缺陷：在现有技术中，在训练天气模型时，通常只是对天气因子池中的天气因子进行简单筛选，保留的冗余因子仍会过多，对于模型训练来说，由于无法得到核心因子，导致无法训练出有效的天气预测模型。

发明内容

本申请的目的在于提供一种雷雨天气预测模型的训练方法、雷雨天气预测方、装置、计算机设备及计算机可读存储介质，能够解决上述现有技术中存在的缺陷。

本申请的一个方面提供了一种雷雨天气预测模型的训练方法，包括：获取多组数据，其中，每组数据包括雷雨天气、上述雷雨天气的多个特征、以及上述雷雨天气及上述雷雨天气的多个特征的关联关系；从上述多组数据的多个特征中筛选出目标特征，其中，上述目标特征为第一特征重要度满足第一预定条件的特征；在上述多组数据的每组数据中，将与上述目标特征无关的特征剔除，形成多组训练数据；利用上述多组训练数据训练预定算法，得到雷雨天气预测模型。

本申请的另一个方面提供了一种雷雨天气预测方法，包括：获取当前天气的目标特征；将上述目标特征输入预先训练完成的雷雨天气预测模型，以使上述雷雨天气预测模型输出天气预测结果；根据上述天气预测结果判断未来天气是否为雷雨天气，其中，上述雷雨天气预测模型通过以下的方法得到：获取多组数据，其中，每组数据包括雷雨天气、上述雷雨天气的多个特征、以及上述雷雨天气及上述雷雨天气的多个特征的关联关系；从上述多组数据的多个特征中筛选出目标特征，其中，上述目标特征为第一特征重要度满足第一预定条件的特征；在上述多组数据的每组数据中，将与上述目标特征无关的特征剔除，形成多组训练数据；利用上述多组训练数据训练预定算法，得到雷雨天气预测模型。

本申请的再一个方面提供了一种雷雨天气预测模型的训练装置，包括：第一获取模块，用于获取多组数据，其中，每组数据包括雷雨天气、上述雷雨天气的多个特征、以及上述雷雨天气及上述雷雨天气的多个特征的关联关系；筛选模块，用于从上述多组数据的多个特征中筛选出目标特征，其中，上述目标特征为第一特征重要度满足第一预定条件的特征；剔除模块，用于在上述多组数据的每组数据中，将与上述目标特征无关的特征剔除，形成多组训练数据；训练模块，用于利用上述多组训练数据训练预定算法，得到雷雨天气预测模型。

本申请的又一个方面提供了一种雷雨天气预测装置，包括：第二获取模块，用于获取当前天气的目标特征；输入模块，用于将上述目标特征输入预先训练完成的雷雨天气预测模型，以使上述雷雨天气预测模型输出天气预测结果；判定模块，用于根据上述天气预测结果判断未来天气是否为雷雨天气，其中，上述雷雨天气预测模型通过以下的方法得到：获取多组数据，其中，每组数据包括雷雨天气、上述雷雨天气的多个特征、以及上述雷雨天气及上述雷雨天气的多个特征的关联关系；从上述多组数据的多个特征中筛选出目标特征，其中，上述目标特征为第一特征重要度满足第一预定条件的特征；在上述多组数据的每组数据中，将与上述目标特征无关的特征剔除，形成多组训练数据；利用上述多组训练数据训练预定算法，得到雷雨天气预测模型。

本申请的又一个方面提供了一种计算机设备，该计算机设备包括：存储器、处理器以及存储在上述存储器上并可在上述处理器上运行的计算机程序，上述处理器执行上述计算机程序时实现以下的雷雨天气预测模型的训练方法的步骤：获取多组数据，其中，每组数据包括雷雨天气、上述雷雨天气的多个特征、以及上述雷雨天气及上述雷雨天气的多个特征的关联关系；从上述多组数据的多个特征中筛选出目标特征，其中，上述目标特征为第一特征重要度满足第一预定条件的特征；在上述多组数据的每组数据中，将与上述目标特征无关的特征剔除，形成多组训练数据；利用上述多组训练数据训练预定算法，得到雷雨天气预测模型。

本申请的又一个方面提供了一种计算机设备，该计算机设备包括：存储器、处理器以及存储在上述存储器上并可在上述处理器上运行的计算机程序，上述处理器执行上述计算机程序时实现以下的雷雨天气预测方法的步骤：获取当前天气的目标特征；将上述目标特征输入预先训练完成的雷雨天气预测模型，以使上述雷雨天气预测模型输出天气预测结果；根据上述天气预测结果判断未来天气是否为雷雨天气，其中，上述雷雨天气预测模型通过以下的方法得到：获取多组数据，其中，每组数据包括雷雨天气、上述雷雨天气的多个特征、以及上述雷雨天气及上述雷雨天气的多个特征的关联关系；从上述多组数据的多个特征中筛选出目标特征，其中，上述目标特征为第一特征重要度满足第一预定条件的特征；在上述多组数据的每组数据中，将与上述目标特征无关的特征剔除，形成多组训练数据；利用上述多组训练数据训练预定算法，得到雷雨天气预测模型。

本申请的又一个方面提供了一种计算机可读存储介质，其上存储有计算机程序，上述计算机程序被处理器执行时实现以下的雷雨天气预测模型的训练方法的步骤：获取多组数据，其中，每组数据包括雷雨天气、上述雷雨天气的多个特征、以及上述雷雨天气及上述雷雨天气的多个特征的关联关系；从上述多组数据的多个特征中筛选出目标特征，其中，上述目标特征为第一特征重要度满足第一预定条件的特征；在上述多组数据的每组数据中，将与上述目标特征无关的特征剔除，形成多组训练数据；利用上述多组训练数据训练预定算法，得到雷雨天气预测模型。

本申请的又一个方面提供了一种计算机可读存储介质，其上存储有计算机程序，上述计算机程序被处理器执行时实现以下的雷雨天气预测方法的步骤：获取当前天气的目标特征；将上述目标特征输入预先训练完成的雷雨天气预测模型，以使上述雷雨天气预测模型输出天气预测结果；根据上述天气预测结果判断未来天气是否为雷雨天气，其中，上述雷雨天气预测模型通过以下的方法得到：获取多组数据，其中，每组数据包括雷雨天气、上述雷雨天气的多个特征、以及上述雷雨天气及上述雷雨天气的多个特征的关联关系；从上述多组数据的多个特征中筛选出目标特征，其中，上述目标特征为第一特征重要度满足第一预定条件的特征；在上述多组数据的每组数据中，将与上述目标特征无关的特征剔除，形成多组训练数据；利用上述多组训练数据训练预定算法，得到雷雨天气预测模型

本申请提供的雷雨天气预测模型的训练方法，筛选出第一特征重要度满足第一预定条件的目标特征，并剔除与目标特征无关的特征，得到多组训练数据，进而利用多组训练数据训练出雷雨天气预测模型。由于这些训练数据中已经不包括冗余特征，且这些训练数据中包括的特征的量级也显著降低，因此足以克服现有技术中的缺陷，达到提升训练出的雷雨天气预测模型的准确度的目的。

进一步，本申请在现有特征工程特征筛选的基础上，考虑了两部分特征：线性类型的特征和非线性类型的特征，并且考虑了线性类型的特征和非线性类型的特征的独立作用，并在此基础上，考虑多项特征间的协同作用，加入非线性的影响提升模型的表达能力。

对于线性类型的特征，先通过N次抽和依次输出非线性特征筛选模型筛选出N组初步线性特征，再从N组初步线性特征中统计出次步线性特征，然后通过改进的预定回归模型，选出对输出y响最大的x之后，逐步添加新的因子，并保证新的因子不会导致原来的因子显著性变化，直到模型的拟合优度不再提升，通过两层筛选，不同的筛选过程针对性不同，从而能够很好的提高特征筛选过程的可解释性及最后的线性目标特征的有效性。

对于非线性类型的特征，通过预筛选可以确保特征量级的可控性，便于输入到非线性特征筛选模型中，然后根据特征的第四特征重要度，将每一轮训练后第四特征重要度满足第五预定条件的特征代入下一轮的训练中，逐步删除重要度较低的特征，从而保证输入到非线性特征筛选模型中的特征数量是以递减形式进入的，在提升模型准确性的同时又达到了非线性目标特征筛选的目的。模型的表达能力既依赖于现有的单一特征，同时特征之间的协同表达也能够在一定程度上拟合模型的效果，提升结果的准确性。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本申请的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示意性示出了根据本申请实施例的雷雨天气预测模型的训练方法的流程图；

图2示意性示出了根据本申请实施例的雷雨天气预测方法的流程图；

图3示意性示出了根据本申请实施例的雷雨天气预测模型的训练装置的框图；

图4示意性示出了根据本申请实施例的雷雨天气预测装置的框图；

图5示意性示出了根据本申请实施例的适于实现雷雨天气预测模型的训练方法和/或雷雨天气预测方法的计算机设备的框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

为了更好的了解本申请达到的有益技术效果，在介绍本申请的具体方案之前，先行介绍与本申请相关的现有技术。在现有技术中，在进行模型训练之前，也会进行特征筛选，由于现有的存储技术及运算能力的提高，特征指标的大量存在使得模型的构建更为完善，其结果的准确性得到保证，但大量的冗余特征会导致模型的训练极为耗时，且容易产生过拟合现象。目前特征筛选的方法主要借助基于统计学的特征筛选方式，比如基于空值率、方差、相关性、共线性等形式，这类方法能够在一定程度上起到辨别特征的作用，但在特征池量级巨大的情况下，仅仅依靠这种方式难以有效降低特征的量级，一方面客观筛选的方式对于统计理论的依赖性过大，这就降低了特征在筛选过程中的可解释性，另一方面仅从单一角度进行特征筛选会使得模型不具备良好的可扩展性，缺少多特征拮抗性对因变量的影响。因此利用统计方法的特征选仍不能得到核心的特征，导致无法拟合出有效的归因模型。

而本申请提供的雷雨天气预测模型的训练方法，筛选出第一特征重要度满足第一预定条件的目标特征，并剔除与目标特征无关的特征，得到多组训练数据，进而利用多组训练数据训练出雷雨天气预测模型。由于这些训练数据中已经不包括冗余特征，且这些训练数据中包括的特征的量级也显著降低，因此足以克服现有技术中的缺陷，达到提升训练出的雷雨天气预测模型的准确度的目的。

图1示意性示出了根据本申请实施例的雷雨天气预测模型的训练方法的流程图。

如图1所示，该雷雨天气预测模型的训练方法可以包括步骤S1～步骤S4，其中：

步骤S1，获取多组数据，其中，每组数据包括雷雨天气、雷雨天气的多个特征、以及雷雨天气及雷雨天气的多个特征的关联关系。

本实施例中，每组数据均为历史上某一雷天气日对应的数据，且每组数据均包括输出y和输入x，即，雷雨天气称为输出y，雷雨天气的多个特征称为输入x，且y和x之间的存在关联关系，即雷雨天气与多个特征之间存在关联关系。其中，雷雨天气的多个特征可以为：温度、气压、降雨量、湿度、空气密度及风量等等。

例如，存在4组数据，第一组数据对应3月15日的数据，包括：雷雨天气、3月15日雷雨天气的多个特征、及二者的关联关系；第二组数据对应3月18日的数据，包括：雷雨天气、3月18日雷雨天气的多个特征、及二者的关联关系；第三组数据对应5月7日的数据，包括：雷雨天气、5月7日雷雨天气的多个特征、及二者的关联关系；第三组数据对应6月24日的数据，包括：雷雨天气、6月24日雷雨天气的多个特征、及二者的关联关系。

步骤S2，从多组数据的多个特征中筛选出目标特征，其中，目标特征为第一特征重要度满足第一预定条件的特征。

本实施例的目的在于利用目标特征训练出雷雨天气模型，从而克服现有技术的缺陷。因此，需要从多个特征中筛选出第一特征重要度满足第一预定条件的特征，作为目标特征。其中，每个特征对应一个第一特征重要度，第一特征重要度用于衡量特征与雷雨天气的关联紧密度。可选地，第一特征重要度可以为每一个特征与雷雨天气的相关系数，第一预定条件可以为第一特征重要度排列在预定位置之前的特征。

可选地，步骤S2可以包括步骤S21和/或步骤S22，其中：

步骤S21，利用多组数据，从多个特征中筛选出属于线性类型的线性目标特征；和/或

步骤S22，利用多组数据，从多个特征中筛选出属于非线性类型的非线性目标特征。

其中，多个特征中可能包括线性类型的特征，也可能包括非线性类型的特征，且线性类型的特征也可能同时属于非线性类型。本实施例中，在多个特征中只存在属于线性类型的特征时，将线性目标特征确定为目标特征；在多个特征中只存在属于非线性类型的特征时，将非线性目标特征确定为目标特征；在多个特征中即存在属于线性类型的特征又存在属于非线性类型的特征时，将线性目标特征和非线性目标特征确定为目标特征。

需要说明的是，预先并不知道哪些特征是属于线性类型的，哪些特征是属于非线性类型的，因此，为了确保在存在线性类型的特征时，能够准确筛选出线性目标特征，步骤S2可以包括步骤S21～步骤S24，其中，目标特征可以包括属于线性类型的线性目标特征，具体地：

步骤S21，对多组数据执行N次抽样，得到N个数据集，其中，每个数据集包括多组数据中的一组或多组。

其中，抽样的方式不做限定，如，可以利用Bootstrapping算法的思想进行抽样。例如，N＝3，第一数据集包括：第一组数据、第三组数据和第四组数据；第二数据集包括：第二组数据、第三组数据和第四组数据；第三数据集包括：第一组数据、第二组数据和第四组数据。

步骤S22，针对N个数据集中的每个数据集，将数据集输入线性特征筛选模型，其中，线性特征筛选模型用于针对数据集的多个特征，计算每个特征的第二特征重要度，并输出第二特征重要度满足第二预定条件且属于线性类型的特征，称为一组初步线性特征。

线性特征筛选模型只输出线性类型的特征，且对于线性类型的每一特征，计算特征的第二特征重要度，其中，由于模型在输出特征时，每个特征前面会携带该特征的系数，系数用于表征特征的重要程度，系数越大，重要程度越高，因此，本实施例中第二特征重要度即为每个特征前面的系数。然后输出属于线性类型且第二特征重要度满足第二预定条件的特征，如，输出第二特征重要度不为0且属于线性类型的特征。

可选地，线性特征筛选模型为引入了L1正则项为Lasso模型，该模型用于输出线性类型的特征，并自动计算特征的第二特征重要度，然后将属于线性类型的特征的第二特征重要度作为该特征的系数形式输出，如，0.8湿度，则0.8即为湿度的第二特征重要度。再如，第二预定条件为：第二特征重要度不为0，则针对每一数据集，Lasso模型会输出系数不为0且属于线性类型的特征。

步骤S23，获取线性特征筛选模型输出的N组初步线性特征。

由于依次向线性特征筛选模型中输入的N组数据集，且每一组数据集对应子域初步线性特征，因此，线性筛选模型会依次输出N组初步线性特征，且每组初步线性特征中包含的特征类型可能不同。

例如，结合上述示例，第一组初步线性特征包括：温度、气压和湿度；第二组初步线性特征包括：温度、气压、降雨量和风量；第三组初步线性特征包括：温度和湿度。

步骤S24，利用N组初步线性特征筛选出线性目标特征。

可选地，步骤S24可以包括步骤S241～步骤S243，其中：

步骤S241，对N组初步线性特征中所有特征进行统计，得到每个特征的第三特征重要度；

步骤S242，从N组初步线性特征中，筛选出第三特征重要度满足第三预定条件的特征，称为次步线性特征；

步骤S243，利用次步线性特征筛选出线性目标特征。

本实施例中，第三特征重要度可以为N组初步线性特征中每个特征出现的次数，第三预定条件可以为次数超过预定次数阈值。

如，结合上述示例，温度出现的次数为3，气压出现的次数为2、湿度出现的次数为2、降雨量出现的次数为1、以及风量出现的次数为1。若第三预定条件为次数超过1次，则次步线性特征为温度、气压和湿度。

进一步，可以根据次步线性特征筛选出线性目标特征。如，直接将次步线性特征作为线性目标特征。

但是，由于L1正则项的损失函数是不可导的，因此，通过引入了L1正则项的Lasso模型直接确定出线性目标特征会存在一定的不稳定性。为了解决上述缺陷，本实施例可以将次步线性特征输入预定回归模型，并通过预定回归模型来确定最终的线性目标特征，进而提高线性目标特征确定的准确性。具体地，步骤S243可以包括步骤A1～步骤A8，其中：

步骤A1：计算次步线性特征中所有特征的特征数量M和每个特征与雷雨天气的相关系数；

步骤A2：将相关系数第1大的特征作为线性目标特征的一个特征；

步骤A3：将相关系数第1大的特征和雷雨天气输入第1个预定回归模型，得到第1个显著性；

步骤A4：判断i是否大于M，当i不大于M时，执行步骤A5，当i大于M时，执行步骤A8，其中，i的初始值为1；

步骤A5：将相关系数第i+1大的特征输入第i+1个预定回归模型，得到第i+1个显著性，其中，第i+1个预定回归模型通过将前i个特征和雷雨天气输入第i个预定回归模型得到；

步骤A6：判断第i个显著性和i+1个显著性之间的关系是否满足第六预定条件，若是，则执行步骤A7，若否，则执行步骤A4；

步骤A7：将相关系数第i+1大的特征确定为线性目标特征的一个特征；

步骤A8：将从次步线性特征中确定出所有特征作为线性目标特征。

本实施例是一个循环操作，具体地，先从次步线性特征中挑选出与y的相关系数最大的特征(称为相关系数第1大的特征)，作为线性目标特征的一个特征，并将相关系数第1大的特征和输出y输入预定回归模型(此时称为第1个预定回归模型)中，得到一个的显著性，称为第1个显著性，并且，将相关系数第1大的特征输入第1个预定回归模型后得到的模型称为第2个预定回归模型。进一步，从次步线性特征中挑选出与y的相关系数第2大的特征(称为相关系数第2大的特征)，并将相关系数第2大的特征输入第2个预定回归模型中，得到一个显著性，称为第2个显著性。然后判断第1个显著性和第2个显著性之间的关系是否满足第六预定条件(如，判断两个显著性之间的差异是否大于0.0001)，若是，则表明相关系数第2大的特征会对相关系数第1大的特征有显著的音响，此时继续判断相关系数第3大的特征的显著性与第1个显著之间的关系；若否，则将相关系数第2大的特征也作为线性目标特征中一个特征，并继续判断相关系数第3大的特征的显著性与第2个显著之间的关系，依次类推，直至判断完次步线性特征中所有的特征。

需要说明的是，显著性可以通过T统计量表征。

可选地，在次步线性特征中包括的特征数量很多时，若循环执行完所有特征显著性的判断逻辑会严重加大处理器的工作量，此时可以通过判断预定回归模型的拟合优度决定何时停止显著性的判断逻辑。具体如下：

步骤A3可以包括：将相关系数第1大的特征和雷雨天气输入第1个预定回归模型，得到第1个显著性和第1个第一拟合优度；

步骤A5可以包括：将相关系数第i+1大的特征输入第i+1个预定回归模型，得到第i+1个显著性和第i+1个第一拟合优度；

在步骤A7之后，且在步骤A8之前，雷雨天气预测模型的训练方法还可以包括：判断第i个第一拟合优度和第i+1个第一拟合优度之间的关系是否满足第七预定条件，若否，则执行步骤A4，若是，则执行步骤A8。

本实施例中，在尚未执行完所有特征的显著性的判断逻辑时，若是第i个第一拟合优度和第i+1个第一拟合优度之间的关系满足第七预定条件，则不再继续判断剩余特征显著性的判断逻辑，并将至此为止从次步线性特征中确定出的所有特征作为线性目标特征。例如，第i个第一拟合优度和第i+1个第一拟合优度之间的关系满足第七预定条件可以为：第i个第一拟合优度和第i+1个第一拟合优度的差异小于0.0001。

其中，拟合优度可以通过R2确定，R又称为可决系数。

可选地，为了确保在存在非线性类型的特征时，能够准确筛选出非线性目标特征，步骤S2还可以包括步骤S21’～步骤S24’，其中，目标特征可以包括属于非线性类型的非线性目标特征，具体地：

步骤S21’，将多组数据输入非线性特征筛选模型，其中，非线性特征筛选模型用于利用多组数据，计算多个特征中每个特征的第四特征重要度，并输出第四特征重要度满足第四预定条件且属于非线性类型的特征。

非线性特征筛选模型只输出非线性类型的特征，且对于非线性类型的每一特征，计算特征的第四特征重要度，然后输出属于非线性类型且第四征重要度满足第四预定条件的特征，如，输出第四特征重要度不为0且属于非线性类型的特征。

可选地，非线性特征筛选模型例如为机器学习模型，如机器学习模型中的随机森林算法(Random Forest，简称为RF)或者梯度提升树(Gradient Boosting Decison Tree，简称为GBDT)。以随机森林算法为例，随机森林算法中构建的树，可以在每一个节点统计经过该节点特征分裂后，基尼系数的减少程度，通过随机生成多棵树，并随机选择特征，可以得到大数据条件下，某一个特征均对分类或回归纯度的提升，这个值就是贡献程度，也即第四特征重要度。其中，属于非线性类型的特征的第四特征重要度也可以作为该特征的系数形式输出，如，0.6空气密度，则0.6即为空气密度的第四特征重要度。再如，第四预定条件为：第四特征重要度不为0，则针对每一数据集，非线性筛选模型会输出系数不为0且属于非线性类型的特征。

步骤S22’，从非线性特征筛选模型输出的特征中剔除第四特征重要度满足第五预定条件的特征，得到初步非线性特征。

如，第五预定条件为：第四重要度最低的特征。则本实施例中，可以利用四特征重要度从大到小的顺序对非线性特征筛选模型输出的特征进行排序，然后提剔除排列在末尾的特征，得到初步非线性特征。

步骤S23’，针对多组数据的每组数据，剔除与初步非线性特征无关的特征，得到多组初步筛选数据。

剔除与初步非线性特征无关的特征，即为剔除除初步非线性特征之外的特征。

步骤S24’，将多组初步筛选数据继续输入非线性特征筛选模型，直至筛选出非线性目标特征。

可选地，在步骤S21’之后，该雷雨天气预测模型的训练方法还可以包括：计算本次非线性特征筛选模型的第二拟合优度。

步骤S24’可以包括步骤S241’～步骤S246’，其中：

步骤S241’，将多组初步筛选数据继续输入非线性特征筛选模型，得到次步非线性特征；

步骤S242’，针对多组初步筛选数据的每组初步筛选数据，剔除与次步非线性特征无关的特征，得到多组次步筛选数据；

步骤S243’，计算本次非线性特征筛选模型的第三拟合优度；

步骤S244’，判断第二拟合优度和第三拟合优度之间的关系是否满足第八预定条件；若是，则执行步骤S245’；若否，则执行步骤S246’。

步骤S245’，将次步非线性特征确定为非线性目标特征。

步骤S246’，继续将多组次步筛选数据输入非线性特征筛选模型，直至筛选出非线性目标特征。

本实施例也属于一个循环操作，具体地，先得到多组初步筛选数据，并计算第二拟合优度；然后得到多组次步筛选数据，并计算第三拟合优度，若是第二拟合优度和第三拟合优度之间的关系满足第八预定条件，则将次步非线性特征确定为非线性目标特征，否则，继续将多组次步筛选数据输入非线性特征筛选模型，直至拟合度之间的关系满足第八预定条件。其中，第八预定条件例如为第二拟合优度对应的损失函数和第三拟合优度对应的损失函数之间的差异小于0.0001。

可选地，为了避免直接将多组数据输入非线性特征筛选模型中会导致处理任务在同一时间内过于繁重，从而引起其他方面的问题，如机器瘫痪，本实施例还可以先对多组进行预处理，然后将预处理后的数据输入非线性特征筛选模型中。具体如下：

步骤S21’可以包括步骤S211’和步骤S212’，其中：

步骤S211’，针对多组数据中的每组数据，利用预定规则对多个特征进行预筛选，得到多组预处理数据；

步骤S212’，将多组预处理数据输入非线性特征筛选模型，其中，非线性特征筛选模型用于利用多组预处理数据，计算进行预筛选后的特征中每个特征的第四特征重要度，并输出第四特征重要度满足第四预定条件且属于非线性类型的特征。

本实施例中，预处理可以是，针对每一组数据，计算每两个特征之间的距离，如欧式距离，若存在两个特征之间的距离大于预定阈值，则认为这两个特征之间的相关性很强，只需保留一个即可，此时可以继续计算两个特征中每一个特征与输出y雷雨天气的距离，并剔除与雷雨天气距离较小的这个特征。通过上述预处理，可以得到多组预处理数据。进一步将多组预处理数据输入非线性特征筛选模型，其中，此处的处理逻辑与直接将多组数据输入非线性特征筛选模型的处理逻辑一致，不再赘述。

步骤S3，在多组数据的每组数据中，将与目标特征无关的特征剔除，形成多组训练数据。

其中，在多个特征中只存在属于线性类型的特征时，目标特征只包括线性目标特征；在多个特征中只存在属于非线性类型的特征时，目标特征只包括非线性目标特征；在多个特征中即存在属于线性类型的特征又存在属于非线性类型的特征时，目标特征即包括线性目标特征又包括非线性目标特征。

本实施例中，针对每组数据，从该组数据的多个特征中，剔除除目标特征之外的特征。此时，执行完步骤S3之后的数据中，包括的特征为为对雷雨天气贡献度较大的特征。

步骤S4，利用多组训练数据训练预定算法，得到雷雨天气预测模型。

将多组训练数据作为训练集，训练预设算法，进而可以得到雷雨天气预测模型，其中，雷雨天气预测模型用于通过当前天气的特征预测未来天气是否为雷雨天气。预定算法例如为支持向量机(Support Vector Machine，简称为SVM)算法、自适应增强学习(Adaptive Boosting，简称为AdaBoost)算法、逻辑回归(Logistic Regression，简称为LR)算法或决策树(Decision Tree)算法。

图2示意性示出了根据本申请实施例的雷雨天气预测方法的流程图。

如图2所示，该雷雨天气预测方法可以包括步骤M1～步骤M3，其中：

步骤M1，获取当前天气的目标特征；

步骤M2，将目标特征输入预先训练完成的雷雨天气预测模型，以使雷雨天气预测模型输出天气预测结果。

其中，雷雨天气预测模型通过实施例一的方法得到。

步骤M3，根据天气预测结果判断未来天气是否为雷雨天气。

本实施例中，通过将当前天气的目标特征属于预先训练好的雷雨天气预测模型，由于雷雨天气预测模型训练过程严谨，训练结果准确，因此得到天气预测结果也较为可信。其中，天气预测结果可以为是雷雨天气或者不是雷雨天气，在天气预测结果为是雷雨天气时，表明预测的未来天气是雷雨天气，在天气预测结果为不是雷雨天气时，表明预测的未来天气不是雷雨天气。

本申请的实施例还提供了一种雷雨天气预测模型的训练装置，该雷雨天气预测模型的训练装置与上述实施例提供的雷雨天气预测模型的训练方法相对应，相应的技术特征和技术效果在本实施例中不再详述，相关之处可参考上述实施例。具体地，图3示意性示出了根据本申请实施例的雷雨天气预测模型的训练装置的框图。如图3所示，该雷雨天气预测模型的训练装置300可以包括第一获取模块301、筛选模块302、剔除模块303和训练模块304，其中：

第一获取模块301，用于获取多组数据，其中，每组数据包括雷雨天气、所述雷雨天气的多个特征、以及所述雷雨天气及所述雷雨天气的多个特征的关联关系；

筛选模块302，用于从所述多组数据的多个特征中筛选出目标特征，其中，所述目标特征为第一特征重要度满足第一预定条件的特征；

剔除模块303，用于在所述多组数据的每组数据中，将与所述目标特征无关的特征剔除，形成多组训练数据；

训练模块304，用于利用所述多组训练数据训练预定算法，得到雷雨天气预测模型。

可选地，筛选模块，还用于：利用所述多组数据，从所述多个特征中筛选出属于线性类型的线性目标特征；和/或利用所述多组数据，从所述多个特征中筛选出属于非线性类型的非线性目标特征。

可选地，所述目标特征包括属于线性类型的线性目标特征，筛选模块在从所述多组数据的多个特征中筛选出目标特征时，还用于：对所述多组数据执行N次抽样，得到N个数据集，其中，每个所述数据集包括所述多组数据中的一组或多组；针对所述N个数据集中的每个所述数据集，将所述数据集输入线性特征筛选模型，其中，所述线性特征筛选模型用于针对所述数据集的所述多个特征，计算每个特征的第二特征重要度，并输出所述第二特征重要度满足第二预定条件且属于所述线性类型的特征，称为一组初步线性特征；获取所述线性特征筛选模型输出的N组初步线性特征；利用所述N组初步线性特征筛选出所述线性目标特征。

可选地，筛选模块在利用所述N组初步线性特征筛选出所述线性目标特征时，还用于：对所述N组初步线性特征中所有特征进行统计，得到每个特征的第三特征重要度；从所述N组初步线性特征中，筛选出第三特征重要度满足第三预定条件的特征，称为次步线性特征；利用所述次步线性特征筛选出所述线性目标特征。

可选地，筛选模块在利用所述次步线性特征筛选出所述线性目标特征时，还用于：步骤A1：计算所述次步线性特征中所有特征的特征数量M和每个特征与所述雷雨天气的相关系数；步骤A2：将所述相关系数第1大的特征作为所述线性目标特征的一个特征；步骤A3：将所述相关系数第1大的特征和雷雨天气输入第1个预定回归模型，得到第1个显著性；步骤A4：判断i是否大于M，当i不大于M时，执行步骤A5，当i大于M时，执行步骤A8，其中，i的初始值为1；步骤A5：将所述相关系数第i+1大的特征输入第i+1个所述预定回归模型，得到第i+1个所述显著性，其中，第i+1个所述预定回归模型通过将前i个特征和雷雨天气输入第i个所述预定回归模型得到；步骤A6：判断第i个所述显著性和i+1个所述显著性之间的关系是否满足第六预定条件，若是，则执行步骤A7，若否，则执行步骤A4；步骤A7：将所述相关系数第i+1大的特征确定为所述线性目标特征的一个特征；步骤A8：将从所述次步线性特征中确定出所有特征作为所述线性目标特征。

可选地，筛选模块在执行步骤A3时，还用于：将所述相关系数第1大的特征和雷雨天气输入第1个预定回归模型，得到第1个显著性和第1个第一拟合优度；筛选模块在步骤A5时，还用于：将所述相关系数第i+1大的特征输入第i+1个所述预定回归模型，得到第i+1个所述显著性和第i+1个所述第一拟合优度；在步骤A7之后，且在步骤A8之前，所述装置还包括：判断模块，用于判断第i个所述第一拟合优度和第i+1个所述第一拟合优度之间的关系是否满足第七预定条件，若否，则使筛选模块执行步骤A4，若是，则使筛选模块执行步骤A8。

可选地，所述目标特征包括属于非线性类型的非线性目标特征，筛选模块在从所述多组数据的多个特征中筛选出目标特征时，还用于：将所述多组数据输入非线性特征筛选模型，其中，所述非线性特征筛选模型用于利用所述多组数据，计算所述多个特征中每个特征的第四特征重要度，并输出所述第四特征重要度满足第四预定条件且属于所述非线性类型的特征；从所述非线性特征筛选模型输出的特征中剔除所述第四特征重要度满足第五预定条件的特征，得到初步非线性特征；针对所述多组数据的每组数据，剔除与所述初步非线性特征无关的特征，得到多组初步筛选数据；将所述多组初步筛选数据继续输入所述非线性特征筛选模型，直至筛选出所述非线性目标特征。

可选地，在将所述多组数据输入非线性特征筛选模型之后，所述装置还包括：计算模块，用于计算本次所述非线性特征筛选模型的第二拟合优度；

筛选模块在将所述多组初步筛选数据继续输入所述非线性特征筛选模型，直至筛选出所述非线性目标特征时，还用于：将所述多组初步筛选数据继续输入所述非线性特征筛选模型，得到次步非线性特征；针对所述多组初步筛选数据的每组初步筛选数据，剔除与所述次步非线性特征无关的特征，得到多组次步筛选数据；计算本次所述非线性特征筛选模型的第三拟合优度；判断所述第二拟合优度和所述第三拟合优度之间的关系是否满足第八预定条件；若是，则将所述次步非线性特征确定为所述非线性目标特征。若否，则继续将所述多组次步筛选数据输入所述非线性特征筛选模型，直至筛选出所述非线性目标特征。

可选地，筛选模块在将所述多组数据输入非线性特征筛选模型时，还用于：针对所述多组数据中的每组数据，利用预定规则对所述多个特征进行预筛选，得到多组预处理数据；将所述多组预处理数据输入非线性特征筛选模型，其中，所述非线性特征筛选模型用于利用所述多组预处理数据，计算进行预筛选后的特征中每个特征的所述第四特征重要度，并输出所述第四特征重要度满足所述第四预定条件且属于所述非线性类型的特征。

本申请的实施例还提供了一种雷雨天气预测方装置，该雷雨天气预测方装置与上述实施例提供的雷雨天气预测方方法相对应，相应的技术特征和技术效果在本实施例中不再详述，相关之处可参考上述实施例。具体地，

图4示意性示出了根据本申请实施例的雷雨天气预测装置的框图。如图4所示，该雷雨天气预测装置400可以包括第二获取模块401、输入模块402和判定模块403，其中：

第二获取模块401，用于获取当前天气的目标特征；

输入模块402，用于将所述目标特征输入预先训练完成的雷雨天气预测模型，以使所述雷雨天气预测模型输出天气预测结果，其中，所述雷雨天气预测模型通过上述雷雨天气预测模型的训练方法得到；

判定模块403，用于根据所述天气预测结果判断未来天气是否为雷雨天气。

图5示意性示出了根据本申请实施例的适于实现雷雨天气预测模型的训练方法和/或雷雨天气预测方法的计算机设备的框图。本实施例中，计算机设备500可以是执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器，或者多个服务器所组成的服务器集群)等。如图5所示，本实施例的计算机设备500至少包括但不限于：可通过系统总线相互通信连接的存储器501、处理器502、网络接口503。需要指出的是，图5仅示出了具有组件501-503的计算机设备500，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

本实施例中，存储器501至少包括一种类型的计算机可读存储介质，可读存储介质包括包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，存储器501可以是计算机设备500的内部存储单元，例如该计算机设备500的硬盘或内存。在另一些实施例中，存储器501也可以是计算机设备500的外部存储设备，例如该计算机设备500上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，存储器501还可以既包括计算机设备500的内部存储单元也包括其外部存储设备。在本实施例中，存储器501通常用于存储安装于计算机设备500的操作系统和各类应用软件，例如雷雨天气预测模型的训练方法的程序代码和/或雷雨天气预测方法的程序代码等。此外，存储器501还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器502在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器502通常用于控制计算机设备500的总体操作。例如执行与计算机设备500进行数据交互或者通信相关的控制和处理等。本实施例中，处理器502用于运行存储器501中存储的雷雨天气预测模型的训练方法的程序代码和/或雷雨天气预测方法的程序代码。

在本实施例中，存储于存储器501中的雷雨天气预测模型的训练方法和/或雷雨天气预测方法还可以被分割为一个或者多个程序模块，并由一个或多个处理器(本实施例为处理器502)所执行，以完成本申请。

网络接口503可包括无线网络接口或有线网络接口，该网络接口503通常用于在计算机设备500与其他计算机设备之间建立通信链接。例如，网络接口503用于通过网络将计算机设备500与外部终端相连，在计算机设备500与外部终端之间的建立数据传输通道和通信链接等。网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication，简称为GSM)、宽带码分多址(Wideband Code Division Multiple Access，简称为WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。

本实施例还提供一种计算机可读存储介质，所述计算机可读存储介质可以是非易失性，也可以是易失性，包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等，其上存储有计算机程序，所述计算机程序被处理器执行时实现雷雨天气预测模型的训练方法的步骤和/或雷雨天气预测方法的步骤。

显然，本领域的技术人员应该明白，上述的本申请实施例的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本申请实施例不限制于任何特定的硬件和软件结合。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种雷雨天气预测模型的训练方法，其中，包括：

获取多组数据，其中，每组数据包括雷雨天气、所述雷雨天气的多个特征、以及所述雷雨天气及所述雷雨天气的多个特征的关联关系；

从所述多组数据的多个特征中筛选出目标特征，其中，所述目标特征为第一特征重要度满足第一预定条件的特征；

在所述多组数据的每组数据中，将与所述目标特征无关的特征剔除，形成多组训练数据；

利用所述多组训练数据训练预定算法，得到雷雨天气预测模型。
根据权利要求1所述的雷雨天气预测模型的训练方法，其中，所述目标特征包括属于线性类型的线性目标特征，从所述多组数据的多个特征中筛选出目标特征，包括：

对所述多组数据执行N次抽样，得到N个数据集，其中，每个所述数据集包括所述多组数据中的一组或多组；

针对所述N个数据集中的每个所述数据集，将所述数据集输入线性特征筛选模型，其中，所述线性特征筛选模型用于针对所述数据集的所述多个特征，计算每个特征的第二特征重要度，并输出所述第二特征重要度满足第二预定条件且属于所述线性类型的特征，称为一组初步线性特征；

获取所述线性特征筛选模型输出的N组初步线性特征；

利用所述N组初步线性特征筛选出所述线性目标特征。
根据权利要求2所述的雷雨天气预测模型的训练方法，其中，利用所述N组初步线性特征筛选出所述线性目标特征，包括：

对所述N组初步线性特征中所有特征进行统计，得到每个特征的第三特征重要度；

从所述N组初步线性特征中，筛选出第三特征重要度满足第三预定条件的特征，称为次步线性特征；

利用所述次步线性特征筛选出所述线性目标特征。
根据权利要求1所述的雷雨天气预测模型的训练方法，其中，所述目标特征包括属于非线性类型的非线性目标特征，从所述多组数据的多个特征中筛选出目标特征，包括：

将所述多组数据输入非线性特征筛选模型，其中，所述非线性特征筛选模型用于利用所述多组数据，计算所述多个特征中每个特征的第四特征重要度，并输出所述第四特征重要度满足第四预定条件且属于所述非线性类型的特征；

从所述非线性特征筛选模型输出的特征中剔除所述第四特征重要度满足第五预定条件的特征，得到初步非线性特征；

针对所述多组数据的每组数据，剔除与所述初步非线性特征无关的特征，得到多组初步筛选数据；

将所述多组初步筛选数据继续输入所述非线性特征筛选模型，直至筛选出所述非线性目标特征。
根据权利要求4所述的雷雨天气预测模型的训练方法，其中，将所述多组数据输入非线性特征筛选模型，包括：

针对所述多组数据中的每组数据，利用预定规则对所述多个特征进行预筛选，得到多组预处理数据；

将所述多组预处理数据输入非线性特征筛选模型，其中，所述非线性特征筛选模型用于利用所述多组预处理数据，计算进行预筛选后的特征中每个特征的所述第四特征重要度，并输出所述第四特征重要度满足所述第四预定条件且属于所述非线性类型的特征。
一种雷雨天气预测方法，其中，包括：

获取当前天气的目标特征；

将所述目标特征输入预先训练完成的雷雨天气预测模型，以使所述雷雨天气预测模型输出天气预测结果；

根据所述天气预测结果判断未来天气是否为雷雨天气，

其中，所述雷雨天气预测模型通过以下雷雨天气预测模型的训练方法得到：

获取多组数据，其中，每组数据包括雷雨天气、所述雷雨天气的多个特征、以及所述雷雨天气及所述雷雨天气的多个特征的关联关系；

从所述多组数据的多个特征中筛选出目标特征，其中，所述目标特征为第一特征重要度满足第一预定条件的特征；

在所述多组数据的每组数据中，将与所述目标特征无关的特征剔除，形成多组训练数据；

利用所述多组训练数据训练预定算法，得到所述雷雨天气预测模型。
根据权利要求6所述的雷雨天气预测方法，其中，所述目标特征包括属于线性类型的线性目标特征，从所述多组数据的多个特征中筛选出目标特征，包括：

对所述多组数据执行N次抽样，得到N个数据集，其中，每个所述数据集包括所述多组数据中的一组或多组；

针对所述N个数据集中的每个所述数据集，将所述数据集输入线性特征筛选模型，其中，所述线性特征筛选模型用于针对所述数据集的所述多个特征，计算每个特征的第二特征重要度，并输出所述第二特征重要度满足第二预定条件且属于所述线性类型的特征，称为一组初步线性特征；

获取所述线性特征筛选模型输出的N组初步线性特征；

利用所述N组初步线性特征筛选出所述线性目标特征。
根据权利要求7所述的雷雨天气预测方法，其中，利用所述N组初步线性特征筛选出所述线性目标特征，包括：

对所述N组初步线性特征中所有特征进行统计，得到每个特征的第三特征重要度；

从所述N组初步线性特征中，筛选出第三特征重要度满足第三预定条件的特征，称为次步线性特征；

利用所述次步线性特征筛选出所述线性目标特征。
根据权利要求6所述的雷雨天气预测方法，其中，所述目标特征包括属于非线性类型的非线性目标特征，从所述多组数据的多个特征中筛选出目标特征，包括：

将所述多组数据输入非线性特征筛选模型，其中，所述非线性特征筛选模型用于利用所述多组数据，计算所述多个特征中每个特征的第四特征重要度，并输出所述第四特征重要度满足第四预定条件且属于所述非线性类型的特征；

从所述非线性特征筛选模型输出的特征中剔除所述第四特征重要度满足第五预定条件的特征，得到初步非线性特征；

针对所述多组数据的每组数据，剔除与所述初步非线性特征无关的特征，得到多组初步筛选数据；

将所述多组初步筛选数据继续输入所述非线性特征筛选模型，直至筛选出所述非线性目标特征。
根据权利要求9所述的雷雨天气预测方法，其中，将所述多组数据输入非线性特征筛选模型，包括：

针对所述多组数据中的每组数据，利用预定规则对所述多个特征进行预筛选，得到多组预处理数据；

将所述多组预处理数据输入非线性特征筛选模型，其中，所述非线性特征筛选模型用于利用所述多组预处理数据，计算进行预筛选后的特征中每个特征的所述第四特征重要度，并输出所述第四特征重要度满足所述第四预定条件且属于所述非线性类型的特征。
一种雷雨天气预测模型的训练装置，其中，包括：

第一获取模块，用于获取多组数据，其中，每组数据包括雷雨天气、所述雷雨天气的多个特征、以及所述雷雨天气及所述雷雨天气的多个特征的关联关系；

筛选模块，用于从所述多组数据的多个特征中筛选出目标特征，其中，所述目标特征为第一特征重要度满足第一预定条件的特征；

剔除模块，用于在所述多组数据的每组数据中，将与所述目标特征无关的特征剔除，形成多组训练数据；

训练模块，用于利用所述多组训练数据训练预定算法，得到雷雨天气预测模型。
一种雷雨天气预测装置，其中，包括：

第二获取模块，用于获取当前天气的目标特征；

输入模块，用于将所述目标特征输入预先训练完成的雷雨天气预测模型，以使所述雷雨天气预测模型输出天气预测结果；

判断模块，用于根据所述天气预测结果判断未来天气是否为雷雨天气，

其中，所述雷雨天气预测模型通过以下雷雨天气预测模型的训练方法得到：

获取多组数据，其中，每组数据包括雷雨天气、所述雷雨天气的多个特征、以及所述雷雨天气及所述雷雨天气的多个特征的关联关系；

从所述多组数据的多个特征中筛选出目标特征，其中，所述目标特征为第一特征重要度满足第一预定条件的特征；

在所述多组数据的每组数据中，将与所述目标特征无关的特征剔除，形成多组训练数据；

利用所述多组训练数据训练预定算法，得到所述雷雨天气预测模型。
一种计算机设备，所述计算机设备包括：存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其中，所述处理器执行所述计算机程序时实现如下的步骤：

获取多组数据，其中，每组数据包括雷雨天气、所述雷雨天气的多个特征、以及所述雷雨天气及所述雷雨天气的多个特征的关联关系；

从所述多组数据的多个特征中筛选出目标特征，其中，所述目标特征为第一特征重要度满足第一预定条件的特征；

在所述多组数据的每组数据中，将与所述目标特征无关的特征剔除，形成多组训练数据；

利用所述多组训练数据训练预定算法，得到雷雨天气预测模型。
根据权利要求13所述的计算机设备，其中，所述目标特征包括属于线性类型的线性目标特征，从所述多组数据的多个特征中筛选出目标特征，包括：

对所述多组数据执行N次抽样，得到N个数据集，其中，每个所述数据集包括所述多组数据中的一组或多组；

针对所述N个数据集中的每个所述数据集，将所述数据集输入线性特征筛选模型，其中，所述线性特征筛选模型用于针对所述数据集的所述多个特征，计算每个特征的第二特征重要度，并输出所述第二特征重要度满足第二预定条件且属于所述线性类型的特征，称为一组初步线性特征；

获取所述线性特征筛选模型输出的N组初步线性特征；

利用所述N组初步线性特征筛选出所述线性目标特征。
根据权利要求14所述的计算机设备，其中，利用所述N组初步线性特征筛选出所述线性目标特征，包括：

对所述N组初步线性特征中所有特征进行统计，得到每个特征的第三特征重要度；

从所述N组初步线性特征中，筛选出第三特征重要度满足第三预定条件的特征，称为次步线性特征；

利用所述次步线性特征筛选出所述线性目标特征。
根据权利要求13所述的计算机设备，其中，所述目标特征包括属于非线性类型的非线性目标特征，从所述多组数据的多个特征中筛选出目标特征，包括：

将所述多组数据输入非线性特征筛选模型，其中，所述非线性特征筛选模型用于利用所述多组数据，计算所述多个特征中每个特征的第四特征重要度，并输出所述第四特征重要度满足第四预定条件且属于所述非线性类型的特征；

从所述非线性特征筛选模型输出的特征中剔除所述第四特征重要度满足第五预定条件的特征，得到初步非线性特征；

针对所述多组数据的每组数据，剔除与所述初步非线性特征无关的特征，得到多组初步筛选数据；

将所述多组初步筛选数据继续输入所述非线性特征筛选模型，直至筛选出所述非线性目标特征。
根据权利要求16所述的计算机设备，其中，将所述多组数据输入非线性特征筛选模型，包括：

针对所述多组数据中的每组数据，利用预定规则对所述多个特征进行预筛选，得到多组预处理数据；

将所述多组预处理数据输入非线性特征筛选模型，其中，所述非线性特征筛选模型用于利用所述多组预处理数据，计算进行预筛选后的特征中每个特征的所述第四特征重要度，并输出所述第四特征重要度满足所述第四预定条件且属于所述非线性类型的特征。
一种计算机设备，所述计算机设备包括：存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其中，所述处理器执行所述计算机程序时实现如下的步骤：

获取当前天气的目标特征；

将所述目标特征输入预先训练完成的雷雨天气预测模型，以使所述雷雨天气预测模型输出天气预测结果；

根据所述天气预测结果判断未来天气是否为雷雨天气，

其中，所述雷雨天气预测模型通过以下雷雨天气预测模型的训练方法得到：

获取多组数据，其中，每组数据包括雷雨天气、所述雷雨天气的多个特征、以及所述雷雨天气及所述雷雨天气的多个特征的关联关系；

从所述多组数据的多个特征中筛选出目标特征，其中，所述目标特征为第一特征重要度满足第一预定条件的特征；

在所述多组数据的每组数据中，将与所述目标特征无关的特征剔除，形成多组训练数据；

利用所述多组训练数据训练预定算法，得到所述雷雨天气预测模型。
一种计算机可读存储介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时用于实现如下的步骤：

获取多组数据，其中，每组数据包括雷雨天气、所述雷雨天气的多个特征、以及所述雷雨天气及所述雷雨天气的多个特征的关联关系；

从所述多组数据的多个特征中筛选出目标特征，其中，所述目标特征为第一特征重要度满足第一预定条件的特征；

在所述多组数据的每组数据中，将与所述目标特征无关的特征剔除，形成多组训练数据；

利用所述多组训练数据训练预定算法，得到雷雨天气预测模型。
一种计算机可读存储介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时用于实现如下的步骤：

获取当前天气的目标特征；

将所述目标特征输入预先训练完成的雷雨天气预测模型，以使所述雷雨天气预测模型输出天气预测结果；

根据所述天气预测结果判断未来天气是否为雷雨天气，

其中，所述雷雨天气预测模型通过以下雷雨天气预测模型的训练方法得到：

获取多组数据，其中，每组数据包括雷雨天气、所述雷雨天气的多个特征、以及所述雷雨天气及所述雷雨天气的多个特征的关联关系；

从所述多组数据的多个特征中筛选出目标特征，其中，所述目标特征为第一特征重要度满足第一预定条件的特征；

在所述多组数据的每组数据中，将与所述目标特征无关的特征剔除，形成多组训练数据；

利用所述多组训练数据训练预定算法，得到所述雷雨天气预测模型。