CN107991722A - 天气预测模型的建立方法、预测方法和预测装置 - Google Patents
天气预测模型的建立方法、预测方法和预测装置 Download PDFInfo
- Publication number
- CN107991722A CN107991722A CN201711419608.8A CN201711419608A CN107991722A CN 107991722 A CN107991722 A CN 107991722A CN 201711419608 A CN201711419608 A CN 201711419608A CN 107991722 A CN107991722 A CN 107991722A
- Authority
- CN
- China
- Prior art keywords
- weather
- feature
- data
- predicted
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/10—Devices for predicting weather conditions
Landscapes
- Environmental & Geological Engineering (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Atmospheric Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Ecology (AREA)
- Environmental Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种天气预测模型的建立方法,包括:S1:获取一地理位置的历史天气预报数据,所述历史天气预报数据中包括多个特征;S2:获取该地理位置的天气记录数据,所述天气记录数据包含一天气指标;S3:利用所述天气记录数据,从所述多个特征中抽取出与所述天气指标相关联的特征或特征组;S4:以所述天气记录数据为样本标签,处理所述历史天气预报数据中的所述特征或特征组,建立所述天气预测模型。本发明还涉及一种使用上述天气预测模型的天气预测方法和装置。
Description
技术领域
本申请涉及天气预报领域,尤其涉及雨雪相态预测模型的建立方法和雨雪相态的预测方法。
背景技术
在冬季,随着气温的下降,在不同地区不同的天气形势下,降水的相态难以定性。在短时间内可能有多次的雨雪状态的改变,目前的一些预测方法主要采用单一的参数例如地面温度来对雨雪相态进行预判,这对于短时间内气象预报的雨雪预测来说存在很大的不稳定性,对于用户的使用体验来说也具有不好的影响。
目前的一些应用中,为了让用户对当前地区的降水相态有更直观的理解,会在短时预报的结果中对雨量进行加工,在即将产生降水的地区提示用户是降雨还是降雪。比如:十五分钟后会下雨,一小时后雨停;这场雪会持续两小时,出门请当心。因为短时预报系统是对用户提供分钟级、公里级的降水预报,所以需要对雨雪的相态也有一种分钟级、公里级的预报。
目前为了解决这个问题,采用的方案是根据用户的经纬度坐标,来获取用户位置的城市天气实际状况,以及当地气温,湿度等天气信息。通过这些数据,利用某些规则来判定是否会降雪。但是这些数据都是逐小时的数据,所以用户无法实时感知到当前雨雪的动态变化。因此,如果在某个小时内某地的降水相态发生了变化,那么我们就无法捕捉到这种变化。而且,这种通过当地城市实况来判断降水相态的规则过于简单,容易受到经纬度和地形,海拔等多方面因素的影响,因此其对降水相态的判断准确率仍然不高,因此也影响到了我们短时预报系统的准确率。
最好的现有技术是利用城市天气信息,对城市区域级别进行判断,它在整个城市的区域内,当前小时的雨雪相态结果都是相同的。这样它的时间分辨率就是逐小时,空间分辨率是城市级(10-100KM)。无法满足短时业务中的细粒度预报要求。而且城市的天气信息非常少,得到的结果准确率也十分低。本发明的优势在于,结合时间和细粒度的模式预报数据,对小区域内的雨雪相态进行判断,所以可以达到更高的精度要求和准确率要求。
发明内容
因此,本发明涉及一种利用GFS数据对区域内降水相态进行预报的机器学习算法。本发明可以在冬季降雪多发季节稳定的,高频次对降水相态进行预测,输出全国的雨雪分布区域图,提高短时预报的准确率。
根据本发明的一个方面,提供一种天气预测模型的建立方法,包括:S1:获取多条历史气象预报数据,所述历史气象预报数据中包括多个特征,并对应于一个或多个地理位置和一个或多个时间点;S2:获取与所述多条历史气象预报数据对应的多条天气记录数据,所述天气记录数据包含一天气指标;S3:利用所述天气记录数据,从所述多个特征中抽取出与所述天气指标相关联的特征或特征组;S4:以所述天气记录数据为样本标签,处理所述历史气象预报数据中的所述特征或特征组,建立所述天气预测模型。
根据本发明的另一个方面,所述历史气象预报数据为GFS模式预报数据、EC模式预报数据、WRF模式预报数据、中国气象局模式预报数据、WNI的模式预报数据、英国气象局的模式预报数据或其组合。
根据本发明的另一个方面,所述步骤S4中,通过机器学习算法处理所述历史气象预报数据中的所述特征或特征组,所述机器学习算法包括支持向量机算法、AdaBoost算法、Logistic Regression算法,Decision Tree算法中的一种或多种。
根据本发明的另一个方面,所述天气记录数据为雨雪记录数据,所述天气指标为雨雪相态,所述天气预测模型为雨雪相态预测模型。
根据本发明的另一个方面,所述步骤S3中,通过岭模型、方差选择法、相关系数法、卡方检验、互信息法、递归特征消除法、基于惩罚项的特征选择法、基于树模型的特征选择法中的一种或多种,从所述多个特征中抽取出与一天气指标相关联的所述特征或特征组。
根据本发明的另一个方面,在步骤S1之后,在步骤S3之前,对所述历史气象预报数据进行加工,提高所述历史气象预报数据的空间分辨率,优选通过插值的方式对所述历史气象预报数据进行加工。
根据本发明的另一个方面,还包括对所述多个特征进行处理,获得另外的特征,利用所述天气记录数据,从所述多个特征与所述另外的特征中抽取出与所述天气指标相关联的特征或特征组。
根据本发明的另一个方面,所述另外的特征包括:时间信息的增加,月份信息的增加,前后时刻之间的温度变化,前后时刻之间的湿度变化,大气各层之间的温度,湿度,风速,风力等变化,经纬度信息的增加及其任意组合。
根据本发明的另一个方面,所述多个特征包括:在不同气压层处的风向、风速、温度、湿度、降水量、土壤不同层的温度湿度,气象上的涡度、散度,露点温度。
本发明还涉及一种天气预测方法,包括:SS1:获取待预测的地理位置和待预测的时间;SS2:获取所述待预测的地理位置在所述待预测的时间的预报数据;SS3:以根据权利要求1-9中任一项建立的天气预测模型中与所述天气指标相关联的特征或特征组为参照,从所述预报数据中提取相应的特征;SS4:将提取出的相应的特征输入所述天气预测模型中,获得所述待预测的地理位置在所述待预测的时间的所述天气指标。
根据本发明的另一个方面,所述天气预测方法还包括:获取下一个待预测的时间,重复所述步骤SS2-SS4,获得所述待预测的地理位置在所述下一个待预测时间的所述天气指标。
本发明还涉及一种天气预测装置,包括:获取待预测的地理位置和待预测的时间的单元;获取所述待预测的地理位置在所述待预测的时间的模式预报数据的单元;以根据本发明建立的天气预测模型中与所述天气指标相关联的特征或特征组为参照、从所述模式预报数据中提取相应的特征的单元;和将提取出的相应的特征输入所述天气预测模型中以获得所述待预测的地理位置在所述待预测的时间的所述天气指标的单元。
本发明还涉及一种计算机可读存储介质,包括存储于其上的计算机可执行指令,所述可执行指令在被处理器执行时实施如上所述的天气预测模型的建立方法。
本发明还涉及一种计算机可读存储介质,包括存储于其上的计算机可执行指令,所述可执行指令在被处理器执行时实施如上所述的天气预测方法
这部分旨在提供对本专利申请的主题的概述。这部分并非旨在提供本发明的排他性的或详尽的说明。本文包括了详细的描述,以提供关于本专利申请的进一步信息。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。附图通过示例而非限制的方式概括地图解了本申请中讨论的各个实施例。这些附图不一定是按照比例绘制的。
图1示出了根据本发明第一实施例的雨雪相态预测模型的建立方法;
图2示出了根据本发明第二实施例的雨雪相态预测方法;
图3示出了根据本发明的至少一些实施例布置的计算机程序产品;和
图4示出了根据本发明的至少一些实施例布置的计算机程序产品。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
为了解决无法实时确定某地降水相态的问题(例如逐分钟、逐公里级别的降水相态预测),本发明提供一种新的雨雪相态分辨算法,对未来需求时间范围内(例如未来两小时)和需求空间范围内(例如中国区域)的降水相态进行分钟级、公里级的预测。普通技术人员容易理解,本发明的技术可以应用于雨雪相态分辨以外的其他天气预测,因为本发明的技术其实也是一种气象数据和天气状态之间的拟合,如果有其它类型的天气状态标签,也可以采用同样的过程进行拟合,比如,阴、晴、多云、雾等等天气实况。下面只采用了雨和雪两种降雪相态的预测为例进行说明。事实上,在具备了晴、阴、多云等标签的大量用户反馈数据,也可以对这些天气状况进行预测。
下面参考附图描述根据本发明的雨雪相态预测模型的建立方法和雨雪相态预测方法。
图1示出了根据本发明第一实施例的雨雪相态预测模型的建立方法100。
如图1所示,在步骤S1,获取过往的多条历史气象预报数据。例如,获得一个或多个地理位置在过去一个或多个时刻的气象预报数据,例如北京、上海、成都、广州、武汉、哈尔滨的过往的一个或多个时刻的气象预报数据。优选的,所述多个时刻包括相邻近的多个时刻,例如互相间隔一小时的多个时刻,从而可以获取相邻近的离散时间点的气象预报数据。该气象预报数据例如是美国全球预报系统(GFS)的预报数据、欧洲中期数值预报中心(ECMWF)数据、WRF模式预报数据、中国气象局模式预报数据、日本WNI的模式预报数据、英国气象局的模式预报数据、以及一些商业机构(例如墨迹天气)制作的模式预报数据等。模式预报数据其实是数值预报数据的另一种名字,一般称呼为数值模式,技术定义可以参考百度百科的数值天气预报。所述气象预报数据包括多个特征。以全球预报系统(GFS)为例,其是美国国家环境预报中心(NCEP)的数值预报模型,可以预报很多大气和土壤的要素变化,如风、温度、降水、土壤水分等。另外,对于同一个地理位置,GFS的预报数据还能够给出在垂直方向上不同高度处的气象预报数据,例如在不同气压层1000hPa处、850hPa处、700hPa处、500hPa处、200hPa处、100hPa处的风向、风速、温度、湿度等。GFS还能提供降水量,土壤不同层的温度湿度,气象上的涡度、散度,露点温度等几十甚至上百种气象要素。这些都统称为气象预报数据的特征。气象预报数据中所包含的各个特征,与雨雪相态之间的关联度可能比较高,也可能比较低。
对于同一个地理位置,GFS系统同时能够给出在不同时间的气象预报数据。换句话说,GFS系统将地球表面空间分成立体的方格(每个方格对应于一定的经纬度和一定的高度),能够提供每一个方格在不同时间的气象预报数据。本发明所述的地理位置,不限于空间上的一个点,也可以是空间上的一个地理区域范围。
由于降水的相态受到大气环境的影响,尤其是大气各层的温度、湿度,以及气流变化等因素,和雨雪的形成有强相关性。因此本发明优选采用数值模式的预报数据对雨雪的形成进行了预测。因为模式预报的数据中是对全球进行预报,同时其预报的数据也是和降水相态息息相关的,比如基于全球格点的大气各层气压,温度,湿度,降水量,等等气象预报资料。
在步骤S2,获取过往的真实的天气记录数据,例如雨雪记录数据,所述天气记录数据与所述气象预报数据相对应。例如,当所述气象预报数据为多个地理位置在多个时间点的气象预报数据时,所述雨雪记录数据对应地就是所述多个地理位置在所述多个时间点的真实的雨雪记录数据。所述天气记录数据包含一天气指标,例如雨雪相态。需要注意的是,步骤S1中获取的数据为该地理位置以往的气象预报数据,而步骤S2中获取的是该地理位置过往的真实的雨雪记录,例如包括经纬度、时间、天气状况、降雨/降雪/无降水等中的一个或多个或任意组合。所述真实的雨雪记录数据例如来自气象台的检测、第三方数据库、或者真实的用户反馈记录。气象预报数据。例如,获得一个或多个地理位置在过去一个或多个时刻的气象预报数据
在步骤S3,利用所述天气记录数据(例如雨雪记录数据),从所述气象预报数据的多个特征中抽取出与一天气指标(如雨雪相态)相关联的特征或特征组。例如,使用一种模型特征选择器的技术,对步骤S1中获得的气象预报数据中的所有的特征进行选择过滤,用数学方法挑选出和雨雪相态相关系数较大的特征或者特征组。根据本发明的一个优选实施例,所述对雨雪分类有影响的特征例如包括小时时间信息,月份信息,前后时刻之间的温度变化,前后时刻之间的湿度变化,大气各层之间的温度,湿度,风速,风力等变化,经纬度信息的增加等等。特征选择器例如使用岭Ridge模型,也有其他的特征选择算法,原理上都是计算特征和样本标签之间的相关系数。特征选择是机器学习中的一个步骤,是为了能选择出和标签相关性最高的特征,并且过滤掉那些和标签无关甚至负相关的特征。特征选择的算法有:方差选择法,相关系数法,卡方检验,互信息法,递归特征消除法,基于惩罚项的特征选择法,基于树模型的特征选择法等。根据本发明的一个实施例,在实施本发明的雨雪相态预测模型的建立方法100时,提供了20000个左右的样本数据,即气象预报数据和雨雪记录数据分别大约20000条,并从中有效地提取出与雨雪相态紧密相关联的特征。当然,本发明不限于此,普通技术人员可以根据实际的需求以及所掌握的样本数据的量,来确定样本数量。特征提取的结果为N维向量(N可以由特征选择器自行决定)。
在步骤S4,通过机器学习算法来根据所述以往的气象预报数据和所述真实的雨雪记录数据建立雨雪相态预测模型。
在选择出那些和雨雪相态关联度较大的特征或特征组之后,使用机器学习算法来建立所述的雨雪相态预测模型。在根据本发明的一个实施例,使用的机器学习算法是支持向量机(Support Vector Machine)算法,这是一个有监督学习的模型。本发明还可以使用其他的机器学习算法,例如AdaBoost,Logistic Regression,Decision Tree等算法。使用上述真实的雨雪记录数据作为标签,同时对所述以往的气象预报数据进行了各种特征组合,充分提取每一个可能对雨雪分类有影响的特征来作为输入数据。经过不断地模型优化和训练,完成了对雨雪的二分类效果。将那些对雨雪分类有影响的特征提取出来之后,就建立了所述雨雪相态预测模型。
本发明中,步骤S3用于从气象预报数据的多个特征中抽取出与某一天气指标(例如雨雪相态)相关联的特征或者特征组,步骤S4基于所抽取出的特征或者特征组,利用真实的雨雪记录数据作为标签,来建立雨雪相态预测模型。
本领域普通技术人员能够理解,当把本发明的上述雨雪相态预测模型建立方法应用于其他的天气预测模型的建立时,只需要对上述方法进行适当的调整即可。例如在步骤S2,获取相应的天气记录数据,在步骤S3,从所述历史天气预报数据中抽取出与一天气指标相关联的特征或特征组来建立所述天气预测模型。这些都在本发明的保护范围内。
模式预报的资料种类齐全,预报时间长,范围广。但是其时间和空间分辨率仍然较低。一般是0.5~2小时,5~30公里范围的颗粒度。因此,为了达到逐分钟,逐公里的分辨率,本发明优选对现有的模式预报数据进行二次加工,主要有两个方面。
空间插值
为了解决模式预报的空间分辨率较大的问题,优选地对数据使用数学方法进行插值,根据周围格点的预报数据(5~30公里级别),得到公里级的新格点预报数据。换句话说,GFS预报数据的空间分辨率较大,例如为5-30公里级别。通过将GFS预报数据作为该5-30公里范围中心点的数据,利用两个空间范围的中心点的气象数据进行插值,从而获取公里级别的新格点的气象预报数据。
特征工程
因为本发明中使用了机器学习的方法来对模式预报数据进行运算处理,所以在数据使用之前,需要对得到的模式数据进行特征的提取,加工,组合等操作,然后抽取出和降水相态最相关的特征进行算法运算。提取就是指将原始的模式数据中需要的信息取出来,比如温压湿风等,加工主要是前后时刻的元素之间差值计算,以及不同范围数据的映射等,组合主要是将这些数据进行各种可能的拼接,比如计算大气各层之间的速度差然后整合成一个值,代表当前地点空域的气流变化强弱等。
本发明可以进行的特征工程工作有:时间信息的增加,月份信息的增加,前后时刻之间的温度变化,前后时刻之间的湿度变化,大气各层之间的温度,湿度,风速,风力等变化,经纬度信息的增加等等。通过这些数据,就可以精确的获取某地某时刻的各种气象资料。通过这些数据,就可以利用机器学习算法对降水相态进行拟合。时间信息主要是将当前计算时刻在一天中的小时数添加进去,因为在人的感官中,白天和黑夜对雨雪的形成有一定的影响。还有一周中的星期几,因为雨雪的形成可能和人类活动强弱也有关系。月份信息就是计算时刻所处的月份,因为不同的月份下雪的概率也不相同,前后时刻的变化就是计算之前时刻和当前时刻,当前时刻和之后时刻的温度差,湿度差,风速差,风力差等,因为这些信息都反映了大气变化的剧烈程度,这些都是和雨雪形成有关的,而经纬度信息就是代表计算位置的地理信息,因为不同的地区对雨雪的形成也有影响。
在进行了上述的特征工程工作之后,本发明的特征不止来源于模式预报数据,还有另外添加的时间信息和加工后的模式预报数据等。例如风速,模式预报数据中只能抽取单个时刻的风速,但是通过特征工程的加工,能够得到前后时刻的风速差值。
这部分的主要工作就是充分利用现有的基础数据(时间,模式预报数据,经纬度等),尽量多的加工出所有和预测标签有关的特征。
在获得了模式预报数据并进行了上述特征工程工作之后,通过特征选择器进行抽取特征,可以使用岭Ridge模型,也有其他的特征选择算法,计算特征和样本标签之间的相关系数。
每一个机器学习的算法不仅需要高质量的数据,还需要高可信的样本标签。这样算法才能对数据和标签之间的联系进行最合理的拟合。如果数据样本的标签有异常,那么算法拟合的结果往往也会受到影响,变得很不准确。为了解决样本标签的可信度问题,可以从用户反馈中利用多种过滤规则筛选出了数万条可信度极高的用户反馈雨雪纪录,这些纪录包含了用户反馈的时间,经纬度,和反馈的天气状态。通过这数万条高可信的用户反馈纪录,整理出了对应时刻、对应地点的模式预报数据,并经过特征工程的加工,成为了算法的训练输入数据。为接下来的数据与标签之间的拟合打下了良好的基础。
解决了训练数据的问题后,接下来就是算法的选取和训练。在本专利中使用的算法是机器学习领域中的支持向量机(Support Vector Machine)算法,它是一个有监督学习的模型。使用了大量的用户反馈数据作为标签,同时对模式数据进行了各种特征组合,充分提取每一个可能对雨雪分类有影响的因子来作为输入数据。经过了不断地模型优化和训练,完成了对雨雪的二分类效果。并保存了最好的分类模型,用于接下来的上线预测业务。
如图2所示,本发明还提供一种天气预测方法。仍以雨雪相态预测为例,该方法包括:
SS1:获取待预测的地理位置和待预测的时间;
SS2:获取所述待预测的地理位置在所述待预测的时间的模式预报数据;
SS3:以如上所述的雨雪相态预测模型中与雨雪相态相关联的特征为参照,从所述模式预报数据中提取相应的特征;
SS4将提取出的相应的特征输入所述雨雪相态预测模型中,获得所述待预测的地理位置在所述待预测的时间的雨雪相态。例如将所抽取出的相应特征作为一个向量或者矩阵,输入到所述雨雪相态预测模型中。
根据本发明的一个优选实施例,所述预测方法还包括:获取下一个待预测的时间,重复所述步骤SS2-SS4,获得所述待预测的地理位置在所述下一个待遇测时间的雨雪相态。
在实际的业务处理流程中,可以先设定一个任务的工作时间和空间范围,比如未来两小时,全国范围,之后会逐时刻获取当前任务时刻的全国模式预报数据,经过特征工程的加工后得到全国所有格点的特征数据,然后在经过算法模型的分类,得到每个格点的雨雪分辨情况,并保存为一张灰度图。然后继续下一个时刻的识别任务,直到最后要求的时间范围终点。任务流程图如下:。
本机器学习雨雪分辨方案,本质是通过模式预报的数据,利用机器学习算法来对小区域内的雨雪相态进行判断。本方案中采用的模式预报数据来源于美国的GFS(全球预报系统),在全球,还有很多气象中心提供类似模式预报数据,来对雨雪状况进行判断。以及除了本方案采用的SVM算法,还有很多机器学习的有监督算法可以对数据进行拟合。同样的,本方案中采用的利用用户反馈作为标签,也可以被其他形式的有时间信息,经纬度信息的实况天气数据源所取代。
根据本发明的一个优选实施例,假设想要预测中国区域未来两小时的降水相态分布情况。大致是如下过程:
1获取当前时间和当前时间前后时段的GFS模式预报数据(10~25KM),将模式预报数据使用数学方法插值到需要计算的格点位置(0.5KM)。
2设置要计算降水相态的时间,取计算时间附近的模式预报数据,并将计算的时间和模式预报数据的时间差保存下来。
3做特征:取时间差,月份等时间数据,经纬度等地理信息数据,模式预报数据,经过各种组合,生成一组新的特征向量。这组特征向量就是计算时间和格点的特征,对于全国大小的降水相态分布图,每个时刻大概有11000*9000个格点。
4将所有格点的特征数据放入训练好的分类模型(SVM)中,得到每个格点当前计算时间的降水相态结果。
5将每个格点的结果在全国图中用不同颜色画出来,保存。
6继续下一个计算时刻,回到步骤2。
经过使用大约一万用户反馈进行统计对比,传统城市实况不仅预报时间粒度大(小时级别),而且实况准确率约为42%。而通过本发明一些实施例的预测模型和预报方法,基于GFS模式预报数据,如采用最新时次(6小时内)发布的预报数据,实况准确率可以高达95.6%,如采用之前一个时刻(12小时内)的预报数据,实况准确率可以高达93.7%。
图3是依照本发明的至少一些实施例布置的计算机程序产品300的框图。信号承载介质302可以被实现为或者包括计算机可读介质306、计算机可记录介质308、计算机通信介质310或者它们的组合,其存储可配置处理单元以执行先前描述的过程中的全部或一些的编程指令304。这些指令可以包括:获取一地理位置的历史天气预报数据,所述历史天气预报数据中包括多个特征;获取该地理位置的天气记录数据;利用所述天气记录数据,从所述多个特征中抽取出与一天气指标相关联的特征或特征组;以所述天气记录数据为样本标签,处理所述历史天气预报数据中的所述特征或特征组,建立所述天气预测模型。
图4是依照本发明的至少一些实施例布置的计算机程序产品400的框图。信号承载介质402可以被实现为或者包括计算机可读介质406、计算机可记录介质408、计算机通信介质410或者它们的组合,其存储可配置处理单元以执行先前描述的过程中的全部或一些的编程指令404。这些指令可以包括:获取待预测的地理位置和待预测的时间;获取所述待预测的地理位置在所述待预测的时间的预报数据;以上述建立的天气预测模型中与所述天气指标相关联的特征或特征组为参照,从所述预报数据中提取相应的特征;将提取出的相应的特征输入所述天气预测模型中,获得所述待预测的地理位置在所述待预测的时间的所述天气指标。
本发明还涉及一种天气预测装置,包括:
获取待预测的地理位置和待预测的时间的单元;
获取所述待预测的地理位置在所述待预测的时间的模式预报数据的单元;
以根据本发明建立的天气预测模型中与所述天气指标相关联的特征或特征组为参照、从所述模式预报数据中提取相应的特征的单元;和
将提取出的相应的特征输入所述天气预测模型中以获得所述待预测的地理位置在所述待预测的时间的所述天气指标的单元。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (14)
1.一种天气预测模型的建立方法,包括:
S1:获取一个或多个地理位置在一个或多个时间点的多条历史气象预报数据,所述历史气象预报数据中包括多个特征;
S2:获取所述一个或多个地理位置在所述一个或多个时间点的多条天气记录数据,所述天气记录数据包含一天气指标;
S3:利用所述天气记录数据,从所述多个特征中抽取出与所述天气指标相关联的特征或特征组;
S4:以所述天气记录数据为样本标签,处理所述历史气象预报数据中的所述特征或特征组,建立所述天气预测模型。
2.根据权利要求1所述的建立方法,其中,所述历史气象预报数据为GFS模式预报数据、EC模式预报数据、WRF模式预报数据、中国气象局模式预报数据、WNI的模式预报数据、英国气象局的模式预报数据或其组合。
3.根据权利要求1或2所述的建立方法,其中,所述步骤S4中,通过机器学习算法处理所述历史气象预报数据中的所述特征或特征组,所述机器学习算法包括支持向量机算法、AdaBoost算法、Logistic Regression算法,Decision Tree算法中的一种或多种。
4.根据权利要求1-3中任一项所述的建立方法,其中,所述天气记录数据为雨雪记录数据,所述天气指标为雨雪相态,所述天气预测模型为雨雪相态预测模型。
5.根据权利要求1-4中任一项所述的建立方法,其中,所述步骤S3中,通过岭模型、方差选择法、相关系数法、卡方检验、互信息法、递归特征消除法、基于惩罚项的特征选择法、基于树模型的特征选择法中的一种或多种,从所述多个特征中抽取出与一天气指标相关联的所述特征或特征组。
6.根据权利要求1-5中任一项所述的建立方法,还包括:在步骤S1之后,在步骤S3之前,对所述历史气象预报数据进行加工,提高所述历史气象预报数据的空间分辨率,优选通过插值的方式对所述历史气象预报数据进行加工。
7.根据权利要求1-6中任一项所述的建立方法,还包括:对所述多个特征进行处理,获得另外的特征,利用所述天气记录数据,从所述多个特征与所述另外的特征中抽取出与所述天气指标相关联的特征或特征组。
8.根据权利要求7所述的建立方法,所述另外的特征包括:时间信息的增加,月份信息的增加,前后时刻之间的温度变化,前后时刻之间的湿度变化,大气各层之间的温度,湿度,风速,风力等变化,经纬度信息的增加及其任意组合。
9.根据权利要求1-8中任一项所述的建立方法,其中所述多个特征包括:在不同气压层处的风向、风速、温度、湿度、降水量、土壤不同层的温度湿度,气象上的涡度、散度,露点温度。
10.一种天气预测方法,包括:
SS1:获取待预测的地理位置和待预测的时间;
SS2:获取所述待预测的地理位置在所述待预测的时间的预报数据;
SS3:以根据权利要求1-9中任一项建立的天气预测模型中与所述天气指标相关联的特征或特征组为参照,从所述预报数据中提取相应的特征;
SS4:将提取出的相应的特征输入所述天气预测模型中,获得所述待预测的地理位置在所述待预测的时间的所述天气指标。
11.根据权利要求10所述的天气预测方法,还包括:获取下一个待预测的时间,重复所述步骤SS2-SS4,获得所述待预测的地理位置在所述下一个待预测时间的所述天气指标。
12.一种天气预测装置,包括:
获取待预测的地理位置和待预测的时间的单元;
获取所述待预测的地理位置在所述待预测的时间的模式预报数据的单元;
以根据权利要求1-9中任一项建立的天气预测模型中与所述天气指标相关联的特征或特征组为参照、从所述模式预报数据中提取相应的特征的单元;和将提取出的相应的特征输入所述天气预测模型中以获得所述待预测的地理位置在所述待预测的时间的所述天气指标的单元。
13.一种计算机可读存储介质,包括存储于其上的计算机可执行指令,所述可执行指令在被处理器执行时实施如权利要求1-9中任一项所述的天气预测模型的建立方法。
14.一种计算机可读存储介质,包括存储于其上的计算机可执行指令,所述可执行指令在被处理器执行时实施如权利要求10-11中任一项所述的天气预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711419608.8A CN107991722A (zh) | 2017-12-25 | 2017-12-25 | 天气预测模型的建立方法、预测方法和预测装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711419608.8A CN107991722A (zh) | 2017-12-25 | 2017-12-25 | 天气预测模型的建立方法、预测方法和预测装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107991722A true CN107991722A (zh) | 2018-05-04 |
Family
ID=62042782
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711419608.8A Withdrawn CN107991722A (zh) | 2017-12-25 | 2017-12-25 | 天气预测模型的建立方法、预测方法和预测装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107991722A (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109086916A (zh) * | 2018-07-16 | 2018-12-25 | 国家气象中心 | 一种基于多源观测数据的对流天气临近预报方法及装置 |
CN110632681A (zh) * | 2019-09-17 | 2019-12-31 | 国网湖南省电力有限公司 | 基于机器学习的电网午后雷阵雨的短临预警方法及系统 |
WO2020000860A1 (zh) * | 2018-06-29 | 2020-01-02 | 平安科技(深圳)有限公司 | 降雨量评估方法及装置、电子设备和计算机非易失性可读存储介质 |
CN110807549A (zh) * | 2019-10-29 | 2020-02-18 | 国网电力科学研究院武汉南瑞有限责任公司 | 一种气象预测模型的生成方法、生成装置、生成系统及电子设备 |
WO2020043029A1 (zh) * | 2018-08-25 | 2020-03-05 | 司书春 | 一种通过向量化分析预测大气污染的方法 |
CN110968926A (zh) * | 2018-09-29 | 2020-04-07 | 中国科学院国家空间科学中心 | 一种基于改进背景误差协方差矩阵预测大气参数的方法 |
CN111190243A (zh) * | 2019-12-19 | 2020-05-22 | 成都星时代宇航科技有限公司 | 气象预测图的生成方法、计算机设备及其可读存储介质 |
CN112363251A (zh) * | 2020-10-26 | 2021-02-12 | 上海眼控科技股份有限公司 | 天气预测模型的生成方法、天气预测方法、装置 |
CN112513896A (zh) * | 2018-08-25 | 2021-03-16 | 山东诺方电子科技有限公司 | 一种大气污染预测的方法 |
CN112580844A (zh) * | 2019-09-30 | 2021-03-30 | 北京金风慧能技术有限公司 | 气象数据处理方法、装置、设备及计算机可读存储介质 |
CN113420730A (zh) * | 2021-08-23 | 2021-09-21 | 深圳市维度数据科技股份有限公司 | 基于计算机视觉的环境卫生监测方法及设备 |
CN113574418A (zh) * | 2019-04-15 | 2021-10-29 | 实干研究株式会社 | 气象预测数据创建程序、气象预测数据创建方法及移动体 |
CN114626577A (zh) * | 2022-02-21 | 2022-06-14 | 北京大学 | 一种利用人工智能预报冬季降水相态的方法 |
CN115453661A (zh) * | 2022-11-14 | 2022-12-09 | 中科星图维天信(北京)科技有限公司 | 气象预报方法、装置、设备以及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105279576A (zh) * | 2015-10-23 | 2016-01-27 | 中能电力科技开发有限公司 | 一种风速预报的方法 |
CN105760970A (zh) * | 2016-03-21 | 2016-07-13 | 重庆灵狐科技股份有限公司 | 空气质量指数的预测方法 |
CN106875037A (zh) * | 2016-12-30 | 2017-06-20 | 东软集团股份有限公司 | 风力预测方法及装置 |
CN107169598A (zh) * | 2017-05-05 | 2017-09-15 | 上海斐讯数据通信技术有限公司 | 一种基于深度学习的天气预测方法及系统 |
CN107169575A (zh) * | 2017-06-27 | 2017-09-15 | 北京天机数测数据科技有限公司 | 一种可视化机器学习训练模型的建模系统和方法 |
-
2017
- 2017-12-25 CN CN201711419608.8A patent/CN107991722A/zh not_active Withdrawn
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105279576A (zh) * | 2015-10-23 | 2016-01-27 | 中能电力科技开发有限公司 | 一种风速预报的方法 |
CN105760970A (zh) * | 2016-03-21 | 2016-07-13 | 重庆灵狐科技股份有限公司 | 空气质量指数的预测方法 |
CN106875037A (zh) * | 2016-12-30 | 2017-06-20 | 东软集团股份有限公司 | 风力预测方法及装置 |
CN107169598A (zh) * | 2017-05-05 | 2017-09-15 | 上海斐讯数据通信技术有限公司 | 一种基于深度学习的天气预测方法及系统 |
CN107169575A (zh) * | 2017-06-27 | 2017-09-15 | 北京天机数测数据科技有限公司 | 一种可视化机器学习训练模型的建模系统和方法 |
Non-Patent Citations (3)
Title |
---|
孙丽华等: "基于多机器学习竞争策略的短时雷电预报", 《计算机应用》 * |
李军龙等: "气象要素空间插值方法的比较分析", 《草业科学》 * |
黄奕铭: "支持向量机在雷雨天气预报中的应用", 《广东气象》 * |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020000860A1 (zh) * | 2018-06-29 | 2020-01-02 | 平安科技(深圳)有限公司 | 降雨量评估方法及装置、电子设备和计算机非易失性可读存储介质 |
CN109086916A (zh) * | 2018-07-16 | 2018-12-25 | 国家气象中心 | 一种基于多源观测数据的对流天气临近预报方法及装置 |
CN109086916B (zh) * | 2018-07-16 | 2021-04-02 | 国家气象中心 | 一种基于多源观测数据的对流天气临近预报方法及装置 |
CN113348471B (zh) * | 2018-08-25 | 2023-07-18 | 山东诺方电子科技有限公司 | 一种大气污染预测中对区域边界优化的方法 |
WO2020043029A1 (zh) * | 2018-08-25 | 2020-03-05 | 司书春 | 一种通过向量化分析预测大气污染的方法 |
WO2020043028A1 (zh) * | 2018-08-25 | 2020-03-05 | 司书春 | 一种利用历史空气质量数据特征预测空气污染的方法 |
CN113348471A (zh) * | 2018-08-25 | 2021-09-03 | 山东诺方电子科技有限公司 | 一种大气污染预测中对区域边界优化的方法 |
CN113330456B (zh) * | 2018-08-25 | 2023-05-26 | 山东诺方电子科技有限公司 | 一种利用历史空气质量数据特征预测空气污染的方法 |
CN112513896B (zh) * | 2018-08-25 | 2023-05-23 | 山东诺方电子科技有限公司 | 一种大气污染预测的方法 |
CN112513896A (zh) * | 2018-08-25 | 2021-03-16 | 山东诺方电子科技有限公司 | 一种大气污染预测的方法 |
CN113632101A (zh) * | 2018-08-25 | 2021-11-09 | 山东诺方电子科技有限公司 | 一种通过向量化分析预测大气污染的方法 |
CN113632101B (zh) * | 2018-08-25 | 2024-05-03 | 山东诺方电子科技有限公司 | 一种通过向量化分析预测大气污染的方法 |
CN113330456A (zh) * | 2018-08-25 | 2021-08-31 | 山东诺方电子科技有限公司 | 一种利用历史空气质量数据特征预测空气污染的方法 |
CN110968926A (zh) * | 2018-09-29 | 2020-04-07 | 中国科学院国家空间科学中心 | 一种基于改进背景误差协方差矩阵预测大气参数的方法 |
CN113574418A (zh) * | 2019-04-15 | 2021-10-29 | 实干研究株式会社 | 气象预测数据创建程序、气象预测数据创建方法及移动体 |
CN113574418B (zh) * | 2019-04-15 | 2023-07-18 | 实干研究株式会社 | 气象预测数据创建程序、气象预测数据创建方法及移动体 |
CN110632681A (zh) * | 2019-09-17 | 2019-12-31 | 国网湖南省电力有限公司 | 基于机器学习的电网午后雷阵雨的短临预警方法及系统 |
CN112580844A (zh) * | 2019-09-30 | 2021-03-30 | 北京金风慧能技术有限公司 | 气象数据处理方法、装置、设备及计算机可读存储介质 |
CN110807549A (zh) * | 2019-10-29 | 2020-02-18 | 国网电力科学研究院武汉南瑞有限责任公司 | 一种气象预测模型的生成方法、生成装置、生成系统及电子设备 |
CN111190243A (zh) * | 2019-12-19 | 2020-05-22 | 成都星时代宇航科技有限公司 | 气象预测图的生成方法、计算机设备及其可读存储介质 |
CN112363251A (zh) * | 2020-10-26 | 2021-02-12 | 上海眼控科技股份有限公司 | 天气预测模型的生成方法、天气预测方法、装置 |
CN113420730A (zh) * | 2021-08-23 | 2021-09-21 | 深圳市维度数据科技股份有限公司 | 基于计算机视觉的环境卫生监测方法及设备 |
CN114626577A (zh) * | 2022-02-21 | 2022-06-14 | 北京大学 | 一种利用人工智能预报冬季降水相态的方法 |
CN115453661A (zh) * | 2022-11-14 | 2022-12-09 | 中科星图维天信(北京)科技有限公司 | 气象预报方法、装置、设备以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107991722A (zh) | 天气预测模型的建立方法、预测方法和预测装置 | |
Oñate-Valdivieso et al. | Application of GIS and remote sensing techniques in generation of land use scenarios for hydrological modeling | |
CN110222911B (zh) | 一种卫星遥感与地面数据协同的雨量站网优化布局方法 | |
CN112308292B (zh) | 一种火灾风险等级分布图的绘制方法 | |
CN108227041A (zh) | 基于站点实测数据和模式结果的水平能见度预报方法 | |
Geremew | Assessing the impacts of land use and land cover change on hydrology of watershed: a case study on Gigel-Abbay Watershed, Lake Tana Basin, Ethiopia | |
Opršal et al. | The role of selected biophysical factors in long-term land-use change of cultural landscape | |
CN112418500A (zh) | 一种基于多源数据及复杂模型融合对山区降雨天气预警方法 | |
Maracchi et al. | Applications of geographical information systems and remote sensing in agrometeorology | |
Kumar et al. | GIS-MAP based Spatial Analysis of Rainfall Data of Andhra Pradesh and Telangana States using R. | |
Engeset et al. | Snow map system for Norway | |
Chu | Remote Sensing of Land Use and Land Cover in Mountain Region | |
CN108764527A (zh) | 一种土壤有机碳库时空动态预测最优环境变量筛选方法 | |
KR20090032461A (ko) | 염해 오손 예측 방법 | |
Healey et al. | A GIS for desert locust forecasting and monitoring | |
Jayaminda et al. | Rating Performances of Global Climate Models in Capturing Monsoon Rainfall Patterns in Sri Lanka | |
Bugár et al. | Mosaic landscape structures in relation to the land use of Nitra district | |
Ott et al. | Development of a distributed hydrological model for flood forecasting and impact assessment of land-use change in the International Mosel river basin | |
CN110135103A (zh) | 一种采用水流模拟城市自然通风潜力的方法和系统 | |
Razali et al. | Eucalyptus forest plantation assessment of vegetation health using satellite remote sensing techniques | |
Williams et al. | Mesoscale agroclimatic resource mapping by computer, an example for the Peace River Region of Canada | |
Märker et al. | Explorative spatial analysis of Neandertal sites using terrain analysis and stochastic environmental modelling | |
Budha et al. | Illustration of rapid urban growth in Surkhet Valley of Nepal via land use and land cover dynamics | |
Mokarian et al. | Classification of evaporation stations using fuzzy cluster analysis and Kohonen artificial neural networks | |
Günthert et al. | Modeling and valuation of ecological impacts of land cover and land use changes on Tenerife (Canary Islands) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20180504 |