CN112166352A - 训练机器学习算法并预测特别是田地或子田地级别的天气数据变量的值 - Google Patents
训练机器学习算法并预测特别是田地或子田地级别的天气数据变量的值 Download PDFInfo
- Publication number
- CN112166352A CN112166352A CN201980035008.2A CN201980035008A CN112166352A CN 112166352 A CN112166352 A CN 112166352A CN 201980035008 A CN201980035008 A CN 201980035008A CN 112166352 A CN112166352 A CN 112166352A
- Authority
- CN
- China
- Prior art keywords
- grid
- weather
- machine learning
- weather data
- learning algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/10—Devices for predicting weather conditions
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/02—Instruments for indicating weather conditions by measuring two or more variables, e.g. humidity, pressure, temperature, cloud cover or wind speed
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/02—Instruments for indicating weather conditions by measuring two or more variables, e.g. humidity, pressure, temperature, cloud cover or wind speed
- G01W1/04—Instruments for indicating weather conditions by measuring two or more variables, e.g. humidity, pressure, temperature, cloud cover or wind speed giving only separate indications of the variables measured
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/02—Instruments for indicating weather conditions by measuring two or more variables, e.g. humidity, pressure, temperature, cloud cover or wind speed
- G01W1/06—Instruments for indicating weather conditions by measuring two or more variables, e.g. humidity, pressure, temperature, cloud cover or wind speed giving a combined indication of weather conditions
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W1/00—Meteorology
- G01W1/18—Testing or calibrating meteorological apparatus
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W2201/00—Weather detection, monitoring or forecasting for establishing the amount of global warming
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01W—METEOROLOGY
- G01W2203/00—Real-time site-specific personalized weather information, e.g. nowcasting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Environmental & Geological Engineering (AREA)
- Life Sciences & Earth Sciences (AREA)
- Environmental Sciences (AREA)
- Ecology (AREA)
- Biodiversity & Conservation Biology (AREA)
- Atmospheric Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及优选地在田地或子田地级别训练机器学习算法并预测天气数据变量的值。在这方面,根据本发明,提供了一种用于预测针对未来的至少一个时刻的至少一个天气数据变量的值的方法,该方法包括以下方法步骤:向机器学习算法提供预测天气数据集,该预测天气数据集包括针对未来的所述至少一个时刻和针对覆盖地球表面的至少一部分的第一网格的至少一个网格点的所述至少一个天气数据变量的至少一个预测值,向机器学习算法提供观测的环境数据集,该观测的环境数据集包括针对覆盖地球表面的至少所述部分的第二网格的至少一个网格点的至少一个环境数据变量的至少一个地面真实值,以及由机器学习算法输出针对未来的所述至少一个时刻的所述至少一个天气数据变量的预测值。以该方式,可以提供用于田地特定天气预测的可能性,以在小网状网格级别上提供田地区域特定的处理建议。
Description
技术领域
本发明涉及一种用于训练机器学习算法的方法,包括以下方法步骤:向机器学习算法提供预测天气数据集,该预测天气数据集包括针对至少一个时刻和针对覆盖地球表面的至少一部分的网格的至少一个网格点的至少一个天气数据变量的至少一个预测值,以及向机器学习算法提供观测的天气数据集,该观测的天气数据集包括针对所述至少一个时刻和针对覆盖地球表面的至少所述部分的另一网格的至少一个网格点的所述至少一个天气数据变量的至少一个地面真实值。本发明进一步涉及一种用于预测针对未来的至少一个时刻的至少一个天气数据变量的值的方法,包括以下方法步骤:向机器学习算法提供预测天气数据集,该预测天气数据集包括针对未来的所述至少一个时刻和针对覆盖地球表面的至少一部分的第一网格的至少一个网格点的所述至少一个天气数据变量的至少一个预测值,以及由机器学习算法输出针对未来的所述至少一个时刻的所述至少一个天气数据变量的预测值。
背景技术
如今的天气预报针对田地区域特定的处理建议不够精确。传统天气预报是在13公里x13公里的网格上(即邮政编码区域)进行的,因此无法有效地提供田地区域特定的处理建议。包括大气、陆地和海洋的气候系统的当前状态通过各种气象参数,例如太阳辐射、温度、大气压力、风速和风向、降水等来表征。现代的测量和观测系统(如天气雷达和卫星)生成连续快速的气象(团)数据。尽管如此,具有上述参数的测量能力的经典气象小屋由于其高精度而成为天气气象学和天气预报的支柱。
然而,人们通常不仅对气候系统的当前状态感兴趣,而且还对气候系统的未来演化感兴趣。因此,大气科学家开发了数值模型,例如气候和数值天气预测(NWP)模型,其预报未来时间点和大量地理位置的各种气候参数。这些模型通常是气候系统控制方程的离散化版本,并且包含例如使用时空离散化来保持动量的Navier-Stokes方程。这样做时,在定义二维表面的两个轴上都施加了网格。以该方式,大气例如被切成立方体,并且然后在该网格上数值求解Navier-Stokes方程。
由于这些方程涉及偏导数,因此需要规定初始状态和边界条件。初始状态通常例如来自重新分析,包括观测和数据同化步骤,以在模型网格处得出伪观测。边界条件是例如大气层的高度和海洋的深度。
受过训练的农艺决策在很大程度上取决于准确的超本地的/田间天气信息,特别是考虑到田间部分之间的差异,特别是在农业实践的田间变化。然而,农民通常缺乏这种关键的数据来源,由于NWP网格间距通常在10至100km的量级,因此对田地区域的天气预报经常有偏差并且缺乏准确性。因此,预报表示边缘长度至少为10km的区域的空间平均值。另一方面,气象站通常在单个点收集非常准确的数据,但缺乏空间扩展性。
根据WO 2017/156325 A,计算机接收观测数据集以及重新预测数据集,该观测数据集一次或多次识别环境变量的一个或多个地面真实值预测,该重新预报数据集识别由与一次或多次对应的预报模型得出的环境变量的一个或多个预测值。然后,计算机在观测数据集上训练气候以生成观测气候,以及在重新预报数据集上训练气候以生成预报气候。计算机通过从观测数据集中减去观测的气候来识别观测的异常,并通过从重新预报数据集中减去预报的气候来预报异常。然后,计算机根据预报的异常对观测的异常进行建模,从而得到校准函数,然后计算机可以使用该校准函数来校准从预报模型接收的新预报。
此外,在WO 2017/099951 A1中,描述了一种用于检测云和云阴影的系统。在一种方法中,通过三步过程来检测遥感图像内的云和云阴影。在第一阶段中,使用高精度的低回忆率分类器来识别图像内的云种子像素。在第二阶段中,使用低精度的高回忆分类器来识别图像内潜在的云像素。另外,在第二阶段中,将云种子像素成长为潜在的云像素,以识别具有较高可能性表示云的像素簇。在第三阶段中,使用几何技术来确定可能表示第二阶段中识别的云所投射的阴影的像素。然后将第二阶段中识别出的云和第三阶段中识别出的阴影作为遥感图像的云掩膜和阴影掩膜导出。
发明内容
本发明的目的是提供针对田地特定的天气预测的可能性,以在小网状网格级别,即在田地或子田地级别上提供田地区域特定的处理建议。
该目的通过独立权利要求的主题解决。优选的实施例在从属权利要求中描述。
因此,根据本发明,提供了一种训练机器学习算法的方法,该方法包括以下方法步骤:
-向机器学习算法提供预测天气数据集,该预测天气数据集包括针对至少一个时刻和针对覆盖地球表面的至少一部分的第一网格的至少一个网格点的至少一个天气数据变量的至少一个预测值,
-向机器学习算法提供观测的环境数据集,该观测的环境数据集包括针对所述至少一个时刻和针对覆盖地球表面的至少所述部分的第二网格的至少一个网格点的至少一个环境数据变量的至少一个地面真实值,以及
-向机器学习算法提供观测的天气数据集,该观测的天气数据集包括针对所述至少一个时刻和针对覆盖地球表面的至少所述部分的第三网格的至少一个网格点的所述至少一个天气数据变量的至少一个地面真实值。
因此,根据本发明,使用了三个网格,它们全部覆盖了地球表面的至少公共部分。对于第一网格的至少一个网格点,向机器学习算法提供预测天气数据集,该预测天气数据集包括针对至少一个时刻的至少一个天气数据变量的至少一个预测值。在此,术语“天气数据可变性”涉及可以用作天气参数的任何变量,即,其指示天气的至少一些特征。根据本发明的优选实施例,预测天气数据集的天气数据变量以及观测的天气数据集的天气数据变量是气温、气压、湿度、近地风速和/或风向中的至少一个。
此外,对于第二网格的至少一个网格点,还向机器学习算法提供观测的环境数据集,该数据集包括针对所述至少一个时刻的至少一个环境数据变量的至少一个地面真实值。在此,术语“环境数据变量”是指如上所述的所有类型的天气数据变量,以及除此之外,还可以用于表征地球上某个位置的环境的任何参数。根据本发明的优选实施例,所观测的环境数据集中的至少一个环境数据变量的至少一个地面真实值是气温、气压、湿度、近地风速和/或风向(参考点的迎风/背风侧)、土地覆盖类型和用途(树木、树篱、田野、水、建筑物、森林地区和林地、农业地区、草原、灌溉地区、沙漠和城市地区,…)、作物管理实践(种植方向,…)、太阳角、地形数据(斜坡取向、高程,…)和土壤颜色中的至少一个。此外,术语“地面真实值”涉及以下事实:该值实际上已经在地球表面上或附近被测量/观测到,即,它是真实的,而不仅仅是预测或假定的值。
通过向机器学习算法提供:预测天气数据集和观测的环境数据集,该预测天气数据集包括针对至少一个时刻和针对第一网格的至少一个网格点的至少一个天气数据变量的至少一个预测值,该观测的环境数据集包括针对所述至少一个时刻和针对第二网格的至少一个网格点的至少一个环境数据变量的至少一个地面真实值,机器学习算法已经接收到有关某个天气预测和地球表面的公共区域内至少一个环境数据变量的相应地面真实值的信息。此外,通过向机器学习算法提供观测的天气数据集,该观测的天气数据集包括针对所述至少一个时刻和针对第三网格的至少一个网格点的所述至少一个天气数据变量的至少一个地面真实值,机器学习算法还接收与预测相比天气数据变量实际具有的值有关的信息。结果,机器学习算法可以考虑这三个变量的关系,例如预测值如何取决于环境特征偏离实际观测值。这样,可以针对本地天气预测考虑可能影响天气预报的本地环境因素。
通常,可以以不同的方式选择第一网格、第二网格和第三网格的网格点之间的距离。然而,根据本发明的优选实施例,第二网格比第一网格更不稀疏,即,第二网格的网格点之间的距离小于第一网格的网格点的距离。例如,第一网格可以是网格点为13km x 13km的网格。与第一网格的网格点之间的如此长的距离相反,第二网格的网格点可以在1km x1km、500m x 500m或甚至在100m x 100m处。这样,可以针对在非常小的网状网格级别,即在田地或子田地级别的天气预报中,考虑环境因素。
通常,不同网格的网格点不必相同。实际上,每个网格可能有单独的网格点。这也适用于第一网格和第三网格。然而,根据本发明的优选实施例,第一网格和第三网格具有公共网格点,这意味着至少一些网格点是公共的。优选地,此类公共网格点是地球表面上气象站所在的位置。此外,根据本发明的优选实施例,以使得第一网格的所述至少一个网格点不同于第二网格的所述至少一个网格点的方式选择网格。
此外,根据本发明的优选实施例,预测天气数据集包括针对多个时刻和针对第一网格的多个网格点的多个天气数据变量的预测值,所观测的环境数据集包括针对所述多个时刻和针对第二网格的多个网格点的多个环境数据变量的多个地面真实值,并且所观测的天气数据集包括针对所述多个时刻和针对第三网格的多个网格点的所述多个天气数据变量的多个地面真实值。
本发明可以与基于不同天气预测模型的预测天气数据集一起使用。然而,根据本发明的优选实施例,预测的天气数据集基于数值天气预测模型,例如ICON、ICON-EU、COSMO-DE和/或COSMO-DE EPS。此外,所观测的环境数据集优选地基于原位测量和/或基于捕获雷达和/或卫星图像。尽管本发明可以应用不同类型的机器学习,但是机器学习算法优选地由人工神经网络提供,并且甚至更优选地由具有用于深度学习的隐藏层的人工神经网络提供。
此外,根据本发明,提供了一种用于预测针对未来的至少一个时刻的至少一个天气数据变量的值的方法,该方法包括以下方法步骤:
-向机器学习算法提供预测天气数据集,该预测天气数据集包括针对未来的所述至少一个时刻和针对覆盖地球表面的至少一部分的第一网格的至少一个网格点的所述至少一个天气数据变量的至少一个预测值,
-向机器学习算法提供观测的环境数据集,该观测的环境数据集包括针对覆盖地球表面的至少所述部分的第二网格的至少一个网格点的至少一个环境数据变量的至少一个地面真实值,以及
-由机器学习算法输出针对未来的所述至少一个时刻的所述至少一个天气数据变量的预测值。
因此,根据本发明的该方法涉及使用包括至少一个预测值的预测天气数据集的信息和包括至少一个环境数据变量的至少一个地面真实值的观测环境数据集的信息的天气数据变量的预测。以该方式,在小网状网格的级别考虑环境特征的本地天气预报变为可能。因此,优选地已经预先根据如上所述的用于训练机器学习算法的方法来训练机器学习算法。
根据优选实施例,实时确定第二网格的所述至少一个网格点的所述至少一个环境数据变量的至少一个地面真实值。这可以提高预测的准确性。用于预测至少一个天气数据变量的值的方法的其它优选实施例涉及用于训练如上所述的机器学习算法的方法的优选实施例。
本发明还涉及一种非暂态计算机可读介质,包括存储在其上的指令,该指令在处理器上执行时执行如上所述的方法的步骤。
此外,本发明还涉及一种数据处理系统,其包括处理器和如上所述的非暂态计算机可读介质。
参考下文描述的实施例,本发明的这些和其它方面将变得显而易见并得到阐明。然而,此类实施例不一定代表本发明的全部范围,因此,在此参考权利要求书来解释本发明的范围。
附图说明
在附图中:
图1示意性地描绘了根据本发明的优选实施例的预测田地区域天气信息的方法。
具体实施方式
为了获得田地特定的天气预测,根据本发明的优选实施例,提供了自上而下的天气预报,直到特定的网格。以该方式,天气数据服务可用于基于计算机算法提供本地/田地特定的天气参数和预测,该计算机算法使用机器学习和统计的方法,例如聚类、降维、神经网络、深度学习、超深度学习、时间序列分析、回归模型、高斯过程、马尔可夫模型(Markovmodel)和克里格法(kriging),融合并丰富了计算机仿真中的数据,例如气候或数值天气预测模型,以及地面真实观测,例如原位测量、雷达或卫星图像。
在统计学中,最初是在地统计学中,克里格法或高斯过程回归是一种插值方法,其插值由先验协方差控制的高斯过程建模,而不是选择分段多项式样条来优化拟合值的平滑度。在先验的适当假设下,克里格法给出中间值的最优线性无偏差预测。基于其它标准(诸如平滑度)的插值方法不需要产生最可能的中间值。该方法广泛用于空间分析和计算机实验领域。在Norbert Wiener和Andrey Kolmogorov之后,该技术也称为Wiener-Kolmogorov预测。
因此,本方法在分层结构的建模链中使用数字(自上而下)和经验(自下而上)模型组件的集成来提供气候参数的回顾性高分辨率模拟(每天和每月)、天气状况的短期和中期预测(例如14天,以6小时和每天的数据)以及替代气候环境的可选模拟(例如每天和/或每月)。
在图1中示意性地描绘了本发明的优选实施例的方法步骤。该方法包括具有几个步骤的四个主要阶段(步骤S1a至S4d),如以下详细描述的。
第一阶段包括第一步骤,其中收集来自外部服务提供商的数据,如DeutscherWetterdienst(DWD)或欧洲中距离天气预报中心(ECMWF)(步骤S1a)。该数据包括来自例如气象站网络的观测数据以及来自重新分析或预报模型(如ICON(等面体非静水模型))的模拟数据。以传统方式对该数据进行预处理和准备(步骤S1b),以便提供现有技术中已知的13km x 13km网格的全球预报数据层(步骤S1c)。
许多环境因素都会影响不同规模的天气。因此,根据本发明的优选实施例,在第二阶段中,考虑环境数据以便准备田地区域特定的天气预测。
地形影响的最重要诱因之一是近地风场,其主要由地形、土地覆盖和土地用途驱动。其中,环境影响因素包括参考点的迎风侧或背风侧、水体在迎风方向中与参考点的接近度、树冠和土地覆盖,包括田间要素或田地环境(诸如树木和树篱)、如种植方向中的作物管理实践、地形对地表附近温度的影响,诸如太阳角和斜坡取向以及土壤颜色。
在气象学中,迎风和背风是描述相对障碍物的迎风侧面对盛行风(迎风)的参考点的风向的技术名称。因此,背风描述了相反的方向,即背对风并因此避风的一侧。迎风和背风会导致不同的地形影响。在地形障碍物的迎风侧,空气团被迫上升,然后又导致温度降低。温度随海拔高度的增加而降低,由(竖直)绝热温度梯度或流逝速率来描述。除非是反演,否则该梯度是负的。当达到凝结水平时,云的形成过程开始,直到降水,这称为地形降水。在该过程之后,迎风区域相对凉爽,并且具有更多的云和降雨。相反,背风侧通常是更加阳光充足、干燥和温暖的。
水体在迎风方向中靠近参考点会影响空气湿度方面的天气。来自水体的气团携带着更多的水分,这增加了空气湿度,影响了作物的发育以及作物疾病的传播。
土地覆盖/土地利用的类型尤其包括森林地区和林地、农业地区、草原、灌溉地区、沙漠和城市地区,在功能和理所当然的大小上还有更多可能的子区分。不同的土地利用形式表现出不同的反照率,从而影响局部辐射平衡。反照率描述了主体(body)接收到的总太阳辐射中太阳辐射的漫反射量。它是无量纲的,并且以从零到一的比例进行测量,而黑体吸收所有入射辐射(反照率=0)。由不同的土地覆盖引起的反照率变化造成的表面不均匀加热可驱动天气。小规模的土地覆盖变化(诸如田间要素或如树木和树篱的田地环境)可影响近地风场。这些自然障碍物迫使风向和风速发生变化,并且还可能有意地充当防风林。近地风场也可受到田地特定作物管理实践(如作物行方向)影响。
地形引起的辐射平衡和接近地面温度的影响是由太阳角、斜坡取向以及土壤颜色引起的。太阳角是太阳光照射地球的角度,该角度随位置、一天中的时间和季节而变化。太阳角对气候的直接影响是地球上任何位置的兴趣点处接收到的太阳辐射量。在较低的太阳角下,阳光的能量会散布在较大的区域,从而导致更低的温度。同样,斜坡取向也会影响局部辐射平衡。南半球的朝北斜坡和北半球的朝南斜坡比相对的斜坡接收到更多的阳光。在休耕地的情况下,土壤颜色也有助于上述反照率效应,因为较暗的土壤会吸收更多的入射辐射,而较浅的土壤会反射更多的能量。
总之,所有描述的环境影响因素都会对风场和辐射平衡/温度产生影响。有关地形、土地覆盖/土地利用和土壤的数字信息以不同的方式提供。地形信息是通过数字高程模型(DEM)获得的。数字高程模型是表面的数字模型或3D表示。不同空间分辨率的各种DEM是可用的。如上所述,海拔高度通过影响温度、降水和风场,对局部天气产生影响。除此之外,还需要对气候模型输出进行海拔校正,以便例如将海平面以上2m的给定输出温度转换为给定海拔高度的实际温度。借助DEM,可以考虑山体阴影效果。可用的数据层,例如30m空间分辨率的SRTM或5m空间分辨率的LIDAR DTM。高程数据可用于导出高程的迎风侧、斜坡取向以及树冠高度信息。
与数字高程一起考虑土地覆盖/土地利用的效果也很有帮助。有关土地覆盖/土地利用的信息由各种数据服务提供。数据集例如是德国的ATKIS(Amtliches Topographisch-Kartographisches Informationssystem)、欧盟的30m分辨率的CORINE土地覆盖=CLC(环境信息协调)和全球250m分辨率的GlobCover Land Cover Map。通常,土地覆盖/土地利用信息分类为森林、农业地区、水体和城市地区。进一步的区分取决于数据集。例如,CORINE包括描述土地覆盖的44个类别,并进一步区分了不同类型的农业用地,如非灌溉用地、牧场等。这些数据层的可能参数化将包括土地覆盖/土地利用对风廓线的影响,并且因此会产生指示表面粗糙度的各种参数。水体的位置可以从土地覆盖图得出,也可以通过分析遥感产品来检测。如果未在土壤地图中指示,则土壤颜色也可以借助卫星图像得出。
还可以考虑考虑田间数据,诸如田间自然要素或作物管理实践。这些可能来自专家的输入,可能的专家是农民。
在步骤S2a中收集所有这些环境参数,并考虑到小规模的浮雕效果,即考虑到比上述13km x 13km网格的全局预报数据层更不稀疏的网格中的区域化(步骤S2b)。根据在此描述的优选实施例,使用低至100m的网格点距离。
在阶段3中,根据本发明的优选实施例,计算了来自农业田间气象站的预报数据(阶段1)和地面真实数据之间的偏差(步骤S3a)。这样做是为了校正步骤1中获得的预报的偏差,并通过从地面真实数据中学习来做出最准确的预测(步骤S3b)。在该阶段,根据本发明的优选实施例,使用机器学习模型来找到天气偏差与偏差的潜在原因之间的相关性。机器学习对于扰动相对稳健,并且不需要完全了解控制大气的物理过程以了解如ICON的预报模型如何进行天气预测。因此,机器学习方法提供了有关天气的时空推断。
根据本发明的优选实施例,TensorFlow可以用于该目的。TensorFlow是开源软件库,用于跨一系列任务的数据流编程。它是符号数学库,并且也用于诸如神经网络的机器学习应用。TensorFlow由Google Brain团队开发供Google内部使用。它于2015年11月9日根据Apache 2.0开源许可证发布。TensorFlow的替代产品可以是Scikit-learn库。
关于识别相关性,一次仅探索一个变量是无效的,相反,根据本发明的优选实施例,探索了多种天气参数和现象的联合时空统计。此外,它对远程时空相关性建模也很有帮助。因此,根据本发明优选实施例的机器学习模型被配置如下。
根据本发明的优选实施例的模型能够随时间推移识别经常性区域的特定天气模式并从中学习,并能够进行未来的预测(时间挖掘)。此外,在预测中考虑了大气定律/规则对天气现象的动态影响(空间插值)。作为最后的步骤,通过根据本发明的优选实施例的模型(变量间相互作用)来捕获天气变量与其它环境和作物特定因子之间的局部相互相关性。
天气数据是一个巨大的数据集,并且因此需要“大数据”存储和查询技术来操纵和处理该数据。各种各样的机器学习算法适合捕获数据集中的变化。考虑到该数据的巨大维度,通过执行降维过程来启动该过程将非常有帮助。接下来是研究从监督到无监督的机器学习算法或两者结合的算法。为了捕获参数之间的相互关系,根据本发明的优选实施例,可以使用如回归模型、高斯过程、马尔可夫模型或克里格法的简单算法。
由于人工神经网络(ANN)最近在从示例的理解和学习中取得成功,因此根据本发明的优选实施例也可以部署此类ANN。此外,可以使用由具有多层的ANN提供的深度学习。根据本发明的优选实施例,可以全部使用诸如深度神经网络、深度信度网络、递归神经网络、长短期记忆和多层内核机器的深度学习架构的特点。在阶段3结束时,以13km x 13km的分辨率开始之后,可以实现约100m x 100m分辨率的区域化和校正数据层。
为了从该阶段进入田地特定阶段,根据本发明的优选实施例,在阶段4中,从上述区域化和校正的数据层以约100mx 100m的分辨率开始(步骤S4a),使用作物模型(步骤S4b)以获得作物特定的品质,如生长阶段、粗糙度、土壤蒸发、植物蒸腾等(步骤S4c),并将其与天气预报结合以获得田地区域特定的天气预报(步骤S4d)。
尽管已经在附图和前面的描述中详细地示出和描述了本发明,但是此类图示和描述应被认为是说明性或示例性的而不是限制性的;本发明不限于所公开的实施例。通过研究附图、公开内容和所附权利要求,本领域技术人员在实践所要求保护的发明时可以理解和实现所公开的实施例的其它变型。在权利要求中,单词“包括”不排除其它元件或步骤,并且不定冠词“一”或“一个”不排除多个。在互不相同的从属权利要求中记载某些措施的事实并不指示不能有利地使用这些措施的组合。权利要求中的任何附图标记均不应被解释为对范围的限制。此外,为了清楚起见,可能未在附图中的所有元件上都提供了附图标记。
Claims (14)
1.一种用于训练机器学习算法的方法,包括以下方法步骤:
-向所述机器学习算法提供预测天气数据集,所述预测天气数据集包括针对至少一个时刻和针对覆盖地球表面的至少一部分的第一网格的至少一个网格点的至少一个天气数据变量的至少一个预测值,
-向所述机器学习算法提供观测的环境数据集,所述观测的环境数据集包括针对所述至少一个时刻和针对覆盖地球表面的至少所述部分的第二网格的至少一个网格点的至少一个环境数据变量的至少一个地面真实值,以及
-向所述机器学习算法提供观测的天气数据集,所述观测的天气数据集包括针对所述至少一个时刻和针对覆盖地球表面的至少所述部分的第三网格的至少一个网格点的所述至少一个天气数据变量的至少一个地面真实值。
2.根据权利要求1所述的方法,其中,所述第二网格比所述第一网格更不稀疏。
3.根据权利要求1或2所述的方法,其中,所述第一网格和所述第三网格具有公共网格点。
4.根据前述权利要求中任一项所述的方法,其中,所述第一网格的所述至少一个网格点不同于所述第二网格的所述至少一个网格点。
5.根据前述权利要求中任一项所述的方法,其中,所述预测天气数据集包括针对多个时刻和针对所述第一网格的多个网格点的多个天气数据变量的预测值,
-所观测的环境数据集包括针对所述多个时刻和针对所述第二网格的多个网格点的多个环境数据变量的多个地面真实值,以及
-所观测的天气数据集包括针对所述多个时刻和针对所述第三网格的多个网格点的所述多个天气数据变量的多个地面真实值。
6.根据前述权利要求中任一项所述的方法,其中,所述预测天气数据集基于数值天气预测模型。
7.根据前述权利要求中任一项所述的方法,其中,所观测的环境数据集基于原位测量和/或基于捕获雷达和/或卫星图像。
8.根据前述权利要求中任一项所述的方法,其中,所述预测天气数据集的所述天气数据变量和所观测的天气数据集的所述天气数据变量是气温、气压、湿度、近地风速和/或风向中的至少一个。
9.根据前述权利要求中任一项所述的方法,其中,用于所观测的环境数据集的至少一个环境数据变量的所述至少一个地面真实值是气温、气压、湿度、近地风速和/或风向、土地覆盖的类型和用途、作物管理实践、太阳角、地形数据和土壤颜色中的至少一个。
10.一种用于预测针对未来的至少一个时刻的至少一个天气数据变量的值的方法,包括以下方法步骤:
-向机器学习算法提供预测天气数据集,所述预测天气数据集包括针对未来的所述至少一个时刻和针对覆盖地球表面的至少一部分的第一网格的至少一个网格点的所述至少一个天气数据变量的至少一个预测值,
-向所述机器学习算法提供观测的环境数据集,所述观测的环境数据集包括针对覆盖地球表面的至少所述部分的第二网格的至少一个网格点的至少一个环境数据变量的至少一个地面真实值,以及
-由所述机器学习算法输出针对未来的所述至少一个时刻的所述至少一个天气数据变量的预测值。
11.根据权利要求11所述的方法,其中,实时确定针对所述第二网格的所述至少一个网格点的所述至少一个环境数据变量的所述至少一个地面真实值。
12.根据权利要求10或11所述的方法,其中,已经预先根据权利要求1至9中任一项所述的方法训练所述机器学习算法。
13.一种非暂态计算机可读介质,包括存储在其上的指令,所述指令在处理器上执行时执行根据权利要求1至12中任一项所述的方法的步骤。
14.一种数据处理系统,包括处理器和根据权利要求13所述的非暂态计算机可读介质。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18174325 | 2018-05-25 | ||
EP18174325.3 | 2018-05-25 | ||
PCT/EP2019/063439 WO2019224347A1 (en) | 2018-05-25 | 2019-05-24 | Training a machine learning algorithm and predicting a value for a weather data variable, especially at a field or sub-field level |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112166352A true CN112166352A (zh) | 2021-01-01 |
Family
ID=62599421
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980035008.2A Pending CN112166352A (zh) | 2018-05-25 | 2019-05-24 | 训练机器学习算法并预测特别是田地或子田地级别的天气数据变量的值 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210208307A1 (zh) |
EP (1) | EP3803478A1 (zh) |
CN (1) | CN112166352A (zh) |
BR (1) | BR112020023825A2 (zh) |
WO (1) | WO2019224347A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114137636A (zh) * | 2021-11-11 | 2022-03-04 | 四川九通智路科技有限公司 | 一种环形压力传感器的区域气象监测管理方法及系统 |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11727303B2 (en) * | 2019-08-22 | 2023-08-15 | Kyndryl, Inc. | Precipitation detection using mobile devices |
CN111523381A (zh) * | 2020-03-13 | 2020-08-11 | 上海眼控科技股份有限公司 | 数值天气预报中土地利用信息的更新方法及设备 |
US11295331B2 (en) * | 2020-07-01 | 2022-04-05 | X Development Llc | Analyzing crop fields based on agricultural management practices |
AT524210B1 (de) * | 2020-11-24 | 2022-04-15 | UBIMET GmbH | Verfahren zur Ermittlung einer meteorologischen Größe |
CN112733906B (zh) * | 2020-12-30 | 2022-11-25 | 中国科学院地理科学与资源研究所 | 一种全球高分辨率每日地表动量粗糙度长度估算方法 |
CN113240196A (zh) * | 2021-06-04 | 2021-08-10 | 广州极飞科技股份有限公司 | 农业气象数据确定方法、装置、农业管理平台及存储介质 |
CN117272182B (zh) * | 2023-08-16 | 2024-03-15 | 南京信息工程大学 | 一种逐日气温的预测方法、装置、介质及设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103426026A (zh) * | 2013-09-10 | 2013-12-04 | 信阳师范学院 | 一种混合神经网络预测及识别景区气象要素的方法 |
CN104239706A (zh) * | 2014-09-05 | 2014-12-24 | 中国科学院寒区旱区环境与工程研究所 | 一种地面观测气温时空数据集的制备方法 |
CN106662669A (zh) * | 2014-08-27 | 2017-05-10 | Twc专利信托公司 | 自动化全球天气通知系统 |
US20170131435A1 (en) * | 2015-11-05 | 2017-05-11 | Heriot-Watt University | Localized weather prediction |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100100328A1 (en) * | 2008-06-17 | 2010-04-22 | Moore John S | System and Method for Generating a Cloud Type and Coverage Prediction Database |
US9721181B2 (en) | 2015-12-07 | 2017-08-01 | The Climate Corporation | Cloud detection on remote sensing imagery |
US10175387B2 (en) | 2016-03-10 | 2019-01-08 | The Climate Corporation | Long-range temperature forecasting |
JP2017187371A (ja) * | 2016-04-05 | 2017-10-12 | 株式会社日立パワーソリューションズ | 気象予測装置及び風力発電所 |
-
2019
- 2019-05-24 US US17/056,556 patent/US20210208307A1/en not_active Abandoned
- 2019-05-24 EP EP19726964.0A patent/EP3803478A1/en not_active Withdrawn
- 2019-05-24 BR BR112020023825-2A patent/BR112020023825A2/pt unknown
- 2019-05-24 WO PCT/EP2019/063439 patent/WO2019224347A1/en unknown
- 2019-05-24 CN CN201980035008.2A patent/CN112166352A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103426026A (zh) * | 2013-09-10 | 2013-12-04 | 信阳师范学院 | 一种混合神经网络预测及识别景区气象要素的方法 |
CN106662669A (zh) * | 2014-08-27 | 2017-05-10 | Twc专利信托公司 | 自动化全球天气通知系统 |
CN104239706A (zh) * | 2014-09-05 | 2014-12-24 | 中国科学院寒区旱区环境与工程研究所 | 一种地面观测气温时空数据集的制备方法 |
US20170131435A1 (en) * | 2015-11-05 | 2017-05-11 | Heriot-Watt University | Localized weather prediction |
Non-Patent Citations (1)
Title |
---|
CHAEYEON YI ET AL: "Development of an Urban High-Resolution Air Temperature Forecast System for Local Weather Information Services Based on Statistical Downscaling", 《ATMOSPHERE》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114137636A (zh) * | 2021-11-11 | 2022-03-04 | 四川九通智路科技有限公司 | 一种环形压力传感器的区域气象监测管理方法及系统 |
CN114137636B (zh) * | 2021-11-11 | 2022-08-12 | 四川九通智路科技有限公司 | 一种环形压力传感器的区域气象监测管理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
BR112020023825A2 (pt) | 2021-04-13 |
EP3803478A1 (en) | 2021-04-14 |
WO2019224347A1 (en) | 2019-11-28 |
US20210208307A1 (en) | 2021-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112166352A (zh) | 训练机器学习算法并预测特别是田地或子田地级别的天气数据变量的值 | |
KR102076426B1 (ko) | 상세기상 예측정보 실시간 운영 시스템과 이를 이용하는 폭염 및 열대야 영향 예보 활용 방법 | |
Huang et al. | Jointly assimilating MODIS LAI and ET products into the SWAP model for winter wheat yield estimation | |
US10955584B2 (en) | Predicting microclimate | |
US10613252B1 (en) | Weather forecasting systems and methods | |
Lorite et al. | Using weather forecast data for irrigation scheduling under semi-arid conditions | |
Chen et al. | Spatio-temporal prediction of leaf area index of rubber plantation using HJ-1A/1B CCD images and recurrent neural network | |
KR102540762B1 (ko) | 위성영상을 이용한 저수지 모니터링 방법 | |
Fan et al. | Medium-range forecasting of daily reference evapotranspiration across China using numerical weather prediction outputs downscaled by extreme gradient boosting | |
CN114387516B (zh) | 一种针对复杂地形环境下中小田块的单季稻sar识别方法 | |
CN112585505A (zh) | 确定用于农学决策支持的位置特定的天气信息 | |
Junguo et al. | Using an improved back propagation neural network to study spatial distribution of sunshine illumination from sensor network data | |
Nyolei et al. | High resolution mapping of agricultural water productivity using SEBAL in a cultivated African catchment, Tanzania | |
Paolini et al. | Classification of different irrigation systems at field scale using time-series of remote sensing data | |
Munawir et al. | SEBAL Model to Estimate Biophysics and Energy Flux Variable: Availability of Evapotranspiration Distribution Using Remote Sensing in Lore Lindu National Park | |
Bartkowiak et al. | Land surface temperature reconstruction under long-term cloudy-sky conditions at 250 m spatial resolution: case study of vinschgau/venosta valley in the european alps | |
Zhang et al. | A new method for monitoring start of season (SOS) of forest based on multisource remote sensing | |
Singha et al. | Apple yield prediction mapping using machine learning techniques through the Google Earth Engine cloud in Kashmir Valley, India | |
CN113139347A (zh) | 一种林地旱灾风险预警方法 | |
Orellana-Samaniego et al. | Estimating monthly air temperature using remote sensing on a region with highly variable topography and scarce monitoring in the southern Ecuadorian Andes | |
Priya et al. | Land use land cover representation through supervised machine learning methods: sensitivity on simulation of urban thunderstorms in the east coast of India | |
Yang et al. | An assessment of snow cover duration variability among three basins of Songhua River in Northeast China using binary decision tree | |
Wiederstein et al. | Evaluating spatial and temporal variations in sub-field level crop water demands | |
Park et al. | Estimation of spatially continuous near-surface relative humidity over Japan and South Korea | |
You et al. | Crop Mapping of Complex Agricultural Landscapes Based on Discriminant Space |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20210101 |
|
WD01 | Invention patent application deemed withdrawn after publication |