CN113807454A - 能见度确定方法、装置、计算机设备及可读存储介质 - Google Patents
能见度确定方法、装置、计算机设备及可读存储介质 Download PDFInfo
- Publication number
- CN113807454A CN113807454A CN202111121000.3A CN202111121000A CN113807454A CN 113807454 A CN113807454 A CN 113807454A CN 202111121000 A CN202111121000 A CN 202111121000A CN 113807454 A CN113807454 A CN 113807454A
- Authority
- CN
- China
- Prior art keywords
- visibility
- variability
- minutes
- random forest
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000007637 random forest analysis Methods 0.000 claims abstract description 36
- 238000012549 training Methods 0.000 claims abstract description 29
- 238000012544 monitoring process Methods 0.000 claims abstract description 26
- 238000012360 testing method Methods 0.000 claims description 20
- 230000015654 memory Effects 0.000 claims description 18
- 230000004907 flux Effects 0.000 claims description 12
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 12
- 238000003745 diagnosis Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 5
- 230000011218 segmentation Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000011056 performance test Methods 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种能见度确定方法、装置、计算机设备及可读存储介质,该方法包括:获取与能见度相关的特征参数;将所述与能见度相关的特征参数输入到经过训练的随机森林回归模型中得到能见度。通过实施本发明所确定的能见度,其训练样本是来源于交通气象站探测的常规气象要素数据,既能节省设备成本,又能充分利用已有的历史数据,其使用的特征方案适用于大多数交通气象站,易进行大范围推广。本发明使用的预报模型是点对多的模型,能够基于当前时次预报未来一小时内逐十分钟的能见度值。本发明使用的监测预报模型与现使用的同类其他模型相比,平均绝对误差大幅度降低,监测预报效果显著提高。
Description
技术领域
本发明涉及数据分析系统和应用领域,具体涉及一种能见度确定方法、装置、计算机设备及可读存储介质。
背景技术
能见度是反应大气透明度的一种指标,其变化会受到降水、沙尘暴、雾、霾等天气现象的影响,也与大气污染物含量有关,对航空、海运、铁路、公路等领域具有重要影响。目前,专门针对城市、航空、铁路、海运等应用场景的能见度监测或者预报产品层出不穷,但是这些产品大多只能实现监测或预报功能之一,并不兼具两种功能。此外,针对公路交通的能见度监测预报产品较少,模型和方法也较为单一。
能见度的监测主要包括目视监测、仪器监测和图像/视频识别监测。目视监测主要是以人工观测为主,即视力正常的人在当时天气条件下,能从天空背景中看到和辨认出目标物(黑色、大小适度)轮廓的最大水平距离。但人工观测缺乏规范性和客观性,数据误差较大;仪器监测主要包括透射式能见度仪、散射式能见度仪、激光雷达式能见度仪等光学仪器,数据客观准确,但仪器维护费用高、操作复杂;图像/视频监测是利用视频或者相机采集的画面,使用各类图像识别技术判断图像中能见度的技术,该技术提高了能见度监测的普适性,但是硬件设备昂贵,受相机和视频监控范围限制,模型能监测到的能见度上限值较低,加上模型对样本数据的要求较高,真正业务化、产品化较为困难。此外,目前布设的气象站、区域站、交通站都有常规气象要素的观测,但是很少有相机或视频监控设备配套,限制了图像识别技术的推广使用,而大量积累的气象数据又无人问津导致数据浪费。
能见度的预报主要包括数值模式预报与统计预报两大类。数值模式预报主要是基于流体力学原理、热力学原理、大气动力学原理等数据方程,依据天气学和物理力学原理,预测未来一段时间的大气运动状态和天气现象的方法,如目前常见的ECMWF、GFS、BJ-RUC等。统计预报主要是基于数学公式,从纯数学的角度揭示环境因素和气象因素与能见度的关系,实现对能见度的预报,如多元线性回顾、BP神经网络等。
由于统计方法可根据气象资料调整输入变量,有效弥补数值模式预报部分变量难以获取的缺点,又具有较高的预报精度,加上计算机技术的发展和大数据时代的到来,基于机器学习和深度学习的预报产品也越来越多。但是,大多数短临预报模型都是基于当前时次预报未来某一时次的点对点的预报产品,且其预报的能见度的平均绝对误差都高于1000m。
发明内容
因此,本发明要解决的技术问题在于克服现有能见度的监测和预报业务化产品化困难、不能兼具监测和预报两种功能以及大多数短临预报产品误差大的问题,从而提供一种能见度确定方法、装置、计算机设备及可读存储介质。
为实现上述目的,本发明采用如下技术方案:
根据第一方面,本发明公开了一种能见度确定方法,所述能见度确定方法包括:
获取与能见度相关的特征参数;
将所述与能见度相关的特征参数输入到经过训练的随机森林回归模型中得到能见度。
可选地,所述与能见度相关的特征参数包括以下中的一种或几种:单气象要素特征、要素间关系特征、综合诊断特征、变率特征。
其中,所述监测模型所需的单气象要素特征包括以下中的一种或几种:瞬时风速、温度、相对湿度;所述要素间关系特征包括以下中的一种或几种:上下层温度差、上下层水汽压差;所述变率特征包括以下中的一种或几种:风速40、50、60分钟变率、上下层温度差30、50分钟变率、相对湿度20分钟变率、离地三十公分相对湿度60分钟变率、上下层水汽压差50分钟变率、温度十分钟变率、离地三十公分温度露点差10、50分钟变率、温度60分钟变率、露点温度60分钟变率、汽压30分钟变率。
其中,所述预报模型所需的单气象要素特征包括以下中的一种或几种:温度、相对湿度、水汽压;所述要素间关系特征包括以下中的一种或几种:上下层露点温度差;所述综合诊断特征包括以下中的一种或几种:湿度能见度指数、感热通量、潜热通量;所述变率特征包括以下中的一种或几种:温度5分钟变率、上下层温度差5、10分钟变率、上下层湿度差5、10分钟变率、感热通量5、10分钟变率、潜热通量5、10分钟变率、水气压10分钟变率、能见度10分钟变率。
可选地,所述随机森林回归模型的训练方法包括:
获取训练集和当前超参数组合;
根据所述训练集建立与所述当前超参数组合相对应的当前随机森林回归模型;
获取测试集和与测试集对应的真实值;
将所述测试集输入到所述当前随机森林回归模型中得到最终预测值;
根据所述预测值与真实值确定模型评分;
遍历预设的多个超参数组合,根据得到的多个模型评分确定所述随机森林回归模型的最优建模超参数组合;
根据所述最优建模超参数组合得到所述随机森林回归模型。
可选地,所述根据所述当前超参数组合建立相对应的当前随机森林回归模型包括:
在所述训练集中进行放回抽样得到至少两个训练子集;
针对任一训练子集,确定与该训练子集相对应的分类与回归树模型,遍历所有的训练子集得到与所述当前超参数组合相对应的当前随机森林回归模型。
可选地,所述将所述测试集输入到所述当前随机森林回归模型中得到最终预测值包括:
分别确定所述测试集中的每个测试样本在各分类与回归树模型中所属的单元域及对应单元域的平均值,即为每个分类与回归树模型的预测值;
确定所有分类与回归树模型预测值的平均值,即为对应测试样本的最终预测值。
根据第二方面,本发明还公开了一种能见度确定装置,包括:参数获取模块:用于获取与能见度相关的特征参数;特征输入模块:用于将所述与能见度相关的特征参数输入到经过训练的随机森林回归模型中得到能见度。
根据第三方面,本发明还公开了一种计算机设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如第一方面或第一方面任一可选实施方式所述的能见度确定方法的步骤。
根据第四方面,本发明实施方式还公开了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面或第一方面任一可选实施方式所述的能见度确定方法的步骤。
本发明技术方案,具有如下优点:
1.通过实施本发明所获取的能见度,其训练样本是来源于交通气象站探测的常规气象要素数据,既能节省设备成本,又能充分利用已有的历史数据,其使用的特征方案适用于大多数交通气象站,易进行大范围推广。
2.本发明使用的预报模型是点对多的模型,能够基于当前时次预报未来一小时内逐十分钟的能见度值。
3.本发明使用的监测预报模型与传统的同类其他模型相比,平均绝对误差大幅度降低,监测预报效果显著提高。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中能见度确定方法的一个流程示意图;
图2为本发明实施例中随机森林回归算法的一个流程示意图;
图3为本发明实施例中分类与回归树算法的一个流程示意图;
图4为本发明实施例中能见度确定装置的结构示意图;
图5为本发明实施例中计算机设备的结构示意图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,在本申请说明书和所附权利要求书中使用的术语“及/和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
本发明实施例公开了一种能见度确定方法,如图1所示,该方法包括如下步骤:
步骤101,获取与能见度相关的特征参数;
示例性地,在获取与能见度相关的特征参数中,监测模型需要包括气象要素特征、要素间关系特征、综合诊断特征、变率特征中的一种或几种,其中所述单气象要素特征包括以下中的一种或几种:瞬时风速、温度、相对湿度;所述要素间关系特征包括以下中的一种或几种:上下层温度差、上下层水汽压差;所述变率特征包括以下中的一种或几种:风速40、50、60分钟变率、上下层温度差30、50分钟变率、相对湿度20分钟变率、离地30公分相对湿度60分钟变率、上下层水汽压差50分钟变率、温度10分钟变率、离地30公分温度露点差10、50分钟变率、温度60分钟变率、露点温度60分钟变率、气压30分钟变率。
预报模型需要包括气象要素特征、要素间关系特征、综合诊断特征、变率特征中的一种或几种,其中所述单气象要素特征包括以下中的一种或几种:温度、相对湿度、水汽压;所述要素间关系特征包括以下中的一种或几种:上下层露点温度差;所述综合诊断特征包括以下中的一种或几种:湿度能见度指数、感热通量、潜热通量;所述变率特征包括以下中的一种或几种:温度5分钟变率、上下层温度差5、10分钟变率、上下层湿度差5、10分钟变率、感热通量5、10分钟变率、潜热通量5、10分钟变率、水汽压10分钟变率、能见度10分钟变率。
步骤102,将所述与能见度相关的特征参数输入到经过训练的随机森林回归模型中得到能见度。
示例性地,在确定回归树模型的训练方法中,先获取训练集和当前超参数组合;进而在所述训练集中进行放回抽样得到至少两个训练子集;针对任一训练子集,确定与该训练子集相对应的分类与回归树模型,遍历所有的训练子集得到与所述当前超参数组合相对应的当前随机森林回归模型;再获取测试集以及与测试集相对应的真实值;分别确定所述测试集样本的预测值;将当前预测值与真实值进行比对计算出模型评分;遍历预设的多个超参数组合,根据得到的多个评分确定所述随机森林回归模型的建模最优超参数组合;进而根据所述最优超参数组合建立的随机森林回归模型得到能见度。
其中,本发明使用的训练集样本数据来源于交通气象站探测的常规气象要素数据,既能节省设备成本,又能充分利用已有的历史数据,其使用的特征方案适用于大多数交通气象站,易进行大范围推广。
可选地,在本发明的一些实施方式中,如图2所示,从原始训练集中有放回地随机抽取样本数据,组成样本集S(S>1);使用分类与回归树函数,对随机抽取的各样本集S建立对应的分类与回归树模型;
所述分类与回归树是随机森林回归模型的核心弱学习机,它是在给定输入变量的条件下,以二叉树形式分裂形成决策树,最终输出预测值条件概率分布的机器学习方法。该方法既能解决离散数据的分类问题,也能解决连续数据的回归问题,其算法如图3所示。
分类与回归树的本质是找到各类特征的最优切分点,依据各个特征的重要性程度,依次按照最优切分点进行二叉树分裂,直至满足停止条件(一般是达到预先设置的树深、停止分裂的最小样本数等参数,或者是树已完全分裂),最终将样本数据划分为有限个单元域,各单元域内所有输出值的平均值即为该单元域最优输出值。其数学思路如下:
对于具有n类特征的样本集,每类特征都存在一个切分变量Vn将样本集S划分为R1和R2两个单元域,R1单元域内所有的输出值都小于切分变量,R2单元域内所有的输出值都大于等于切分变量。由此,两个单元域对应的最优输出值分别为:
其中,Cm1和Cm2为第m类(1≤m≤n)特征划分的R1和R2单元域的优输出值;i和j分别为划分后两个单元域对应的样本数量,yi和yj分别为对应两个单元域内的输出值。由此可得损失函数:
当损失函数L达最小时,对应的(m,Vm)即为第m类特征的最优切分结点,其对应的切分变量为Vm。
对每个区域按所述最优输出值和所述损失函数进行重复划分,直至满足停止条件,最终可以将输入的全部特征数据划分为Rk个单元域,每个单元域内包含的输出值的平均值,即为预测值。由此,最终分类与回归树函数为:
其中,I(x∈Rk)为逻辑值,若kx∈R,则I(x∈Rk)=1,否则I(x∈Rk)=0;Ck为单元域Rk内包含的所有输出值的平均值,k为单元域标号。最终分类与回归树函数的本质是先判断输入变量属于哪个单元域,然后返回该单元域的预测值。
可选地,在本发明的一些实施方式中,获取测试集B,根据所述由训练集确定的分类与回归树模型,可以确定测试集中每个样本所述单元域T以及对应单元域的平均值Ct,由此平均值Ct可以得出此分类与回归树模型的测试结果。
可选地,由所有分类与回归树模型预测结果和树模型个数Q,可以得出当前预测值:
其中Q是随机森林中树模型的个数。
可选地,通过遍历所有的超参数组合,并根据得到的预测值Y与真实值之间的关系得出当前超参数组合对应模型的评分,可以确定所述随机森林回归模型的最优超参数组合,进而得到最优随机森林回归模型,并根据此随机森林回归模型得到能见度。
由此方法获取的能见度,其训练样本是来源于交通气象站探测的常规气象要素数据,既能节省设备成本,又能充分利用已有的历史数据,其使用的特征方案适用于大多数交通气象站,易进行大范围推广。其中使用的预报模型是点对多的模型,能够基于当前时次预报未来一小时内逐十分钟的能见度值。
可选地,对所得到的随机森林回归模型进行性能测试,获取全新的验证集样本C,基于所述随机森林回归模型,得到模型预测值zi,并基于真实值wi以及验证样本数量n,得出平均绝对误差:
经过监测模型及未来一小时逐十分钟预报模型不同能见度区间以及总体样本的平均绝对误差验证结果如表1所示,区间阈值来自《中华人民共和国标准——水平能见度》(GB/T33673-2017)。
表1监测及逐十分钟预报模型的平均绝对误差表(单位:m)
注:表中用于划分能见度的阈值点来自国家水平能见度分级标准(GB/T33673-2017),区间左开右闭
本发明使用的预报模型是点对多的模型,能够基于当前时次预报未来一小时内逐十分钟的能见度值,且使用的监测预报模型与传统的同类其他模型相比,平均绝对误差大幅度降低,监测预报效果显著提高。
本发明实施例还提供了一种能见度确定装置,如图4所示,该装置包括:
参数获取模块301,用于获取与能见度相关的特征参数,详细内容参考步骤101所述;
特征输入模块302,用于将所述与能见度相关的特征参数输入到经过训练的随机森林回归模型中得到能见度,详细内容参考步骤102所述.
本发明实施例还提供了一种计算机设备,如图4所示,该计算机设备可以包括处理器401和存储器402,其中处理器401和存储器402可以通过总线或者其他方式连接,图4中以通过总线连接为例。
处理器401可以为中央处理器(Central ProceAAing Unit,CPU)。处理器401还可以为其他通用处理器、数字信号处理器(Digital Aignal ProceAAor,DAP)、专用集成电路(Application Apecific Integrated Circuit,AAIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器402作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的能见度确定装置按键屏蔽方法对应的程序指令/模块(例如,图4所示的参数获取模块31和能见度输入模块32)。处理器41通过运行存储在存储器402中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的能见度确定方法。
存储器402可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器401所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器402可选包括相对于处理器401远程设置的存储器,这些远程存储器可以通过网络连接至处理器401。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器402中,当被所述处理器401执行时,执行如图1-3所示实施例中的能见度确定方法。
上述计算机设备具体细节可以对应参阅图1-3所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random AcceAAMemory,RAM)、快闪存储器(FlaAh Memory)、硬盘(Hard DiAk Drive,缩写:HDD)或固态硬盘(Aolid-Atate Drive,AAD)等;所述存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (10)
1.一种能见度确定方法,其特征在于,包括:
获取与能见度相关的特征参数;
将所述与能见度相关的特征参数输入到经过训练的随机森林回归模型中得到能见度。
2.根据权利要求1所述的能见度确定方法,其特征在于,所述与能见度相关的特征参数包括以下中的一种或几种:单气象要素特征、要素间关系特征、综合诊断特征、变率特征。
3.根据权利要求2所述的能见度确定方法,其特征在于,所述随机森林回归模型为能见度监测模型,所述单气象要素特征包括以下中的一种或几种:瞬时风速、温度、相对湿度;所述要素间关系特征包括以下中的一种或几种:上下层温度差、上下层水汽压差;所述变率特征包括以下中的一种或几种:风速40、50、60分钟变率、上下层温度差30、50分钟变率、相对湿度20分钟变率、离地30公分相对湿度60分钟变率、上下层水汽压差50分钟变率、温度10分钟变率、离地30公分温度露点差10、50分钟变率、温度60分钟变率、露点温度60分钟变率、气压30分钟变率。
4.根据权利要求2所述的能见度确定方法,其特征在于,所述随机森林回归模型为能见度预测模型,所述单气象要素特征包括以下中的一种或几种:温度、相对湿度、水汽压;所述要素间关系特征包括以下中的一种或几种:上下层露点温度差;所述综合诊断特征包括以下中的一种或几种:湿度能见度指数、感热通量、潜热通量;所述变率特征包括以下中的一种或几种:温度5分钟变率、上下层温度差5、10分钟变率、上下层湿度差5、10分钟变率、感热通量5、10分钟变率、潜热通量5、10分钟变率、水汽压10分钟变率、能见度10分钟变率。
5.根据权利要求1所述的能见度确定方法,其特征在于,所述随机森林回归模型的训练方法包括:
获取训练集和当前超参数组合;
根据所述训练集建立与所述当前超参数组合相对应的当前随机森林回归模型;
获取测试集和与测试集对应的真实值;
将所述测试集输入到所述当前随机森林回归模型中得到最终预测值;
根据所述预测值与真实值确定模型评分;
遍历预设的多个超参数组合,根据得到的多个模型评分确定所述随机森林回归模型的最优建模超参数组合;
根据所述最优建模超参数组合得到所述随机森林回归模型。
6.根据权利要求5所述的能见度确定方法,其特征在于,所述根据所述当前超参数组合建立相对应的当前随机森林回归模型包括:
在所述训练集中进行放回抽样得到至少两个训练子集;
针对任一训练子集,确定与该训练子集相对应的分类与回归树模型,遍历所有的训练子集得到与所述当前超参数组合相对应的当前随机森林回归模型。
7.根据权利要求5所述的能见度确定方法,其特征在于,所述将所述测试集输入到所述当前随机森林回归模型中得到最终预测值包括:
分别确定所述测试集中的每个测试样本在各分类与回归树模型中所属的单元域及对应单元域的平均值,即为每个分类与回归树模型的预测值;
确定所有分类与回归树模型预测值的平均值,即为对应测试样本的最终预测值。
8.一种能见度确定装置,其特征在于,包括:
参数获取模块:用于获取与能见度相关的特征参数;
特征输入模块:用于将所述与能见度相关的特征参数输入到经过训练的随机森林回归模型中得到能见度。
9.一种计算机设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如权利要求1-7任一所述的能见度确定方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的能见度确定方法的步骤。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2021111177306 | 2021-09-18 | ||
CN202111117730 | 2021-09-18 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113807454A true CN113807454A (zh) | 2021-12-17 |
CN113807454B CN113807454B (zh) | 2024-09-27 |
Family
ID=78940280
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111121000.3A Active CN113807454B (zh) | 2021-09-18 | 2021-09-24 | 能见度确定方法、装置、计算机设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113807454B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116338819A (zh) * | 2023-03-27 | 2023-06-27 | 北京智科远达数据技术有限公司 | 一种水体溶解氧浓度预测系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019126707A1 (en) * | 2017-12-21 | 2019-06-27 | Climacell Inc. | Improved real-time weather forecasting system |
CN111915068A (zh) * | 2020-07-17 | 2020-11-10 | 同济大学 | 一种基于集成学习的道路能见度短临预测方法 |
CN112649900A (zh) * | 2020-11-27 | 2021-04-13 | 上海眼控科技股份有限公司 | 一种能见度的监测方法、装置、设备、系统和介质 |
CN113240185A (zh) * | 2021-05-25 | 2021-08-10 | 天津大学 | 一种基于随机森林的县域碳排放的预测方法 |
-
2021
- 2021-09-24 CN CN202111121000.3A patent/CN113807454B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019126707A1 (en) * | 2017-12-21 | 2019-06-27 | Climacell Inc. | Improved real-time weather forecasting system |
CN111915068A (zh) * | 2020-07-17 | 2020-11-10 | 同济大学 | 一种基于集成学习的道路能见度短临预测方法 |
CN112649900A (zh) * | 2020-11-27 | 2021-04-13 | 上海眼控科技股份有限公司 | 一种能见度的监测方法、装置、设备、系统和介质 |
CN113240185A (zh) * | 2021-05-25 | 2021-08-10 | 天津大学 | 一种基于随机森林的县域碳排放的预测方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116338819A (zh) * | 2023-03-27 | 2023-06-27 | 北京智科远达数据技术有限公司 | 一种水体溶解氧浓度预测系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113807454B (zh) | 2024-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111815037B (zh) | 一种基于注意力机制的可解释性短临极端降雨预测方法 | |
CN110443969B (zh) | 一种火点检测方法、装置、电子设备及存储介质 | |
CN110879989B (zh) | 基于小样本机器学习模型的ads-b信号目标识别方法 | |
CN109117883B (zh) | 基于长短时记忆网络的sar影像海冰分类方法及系统 | |
US10725008B2 (en) | Automatic siting for air quality monitoring stations | |
CN109344753A (zh) | 一种基于深度学习的航拍图像输电线路细小金具识别方法 | |
CN110208880B (zh) | 一种基于深度学习和卫星遥感技术的海雾检测方法 | |
CN110705115B (zh) | 一种基于深度置信网络的气象预报方法和系统 | |
Zhang et al. | Weather visibility prediction based on multimodal fusion | |
Peng et al. | CNGAT: A graph neural network model for radar quantitative precipitation estimation | |
CN111652835A (zh) | 基于深度学习与聚类的输电线路绝缘子缺失的检测方法 | |
Lo et al. | Meteorology visibility estimation by using multi-support vector regression method | |
CN115511836B (zh) | 基于强化学习算法的桥梁裂缝等级评估方法及系统 | |
CN111325239A (zh) | 一种基于图像的天气识别的方法及设备 | |
Pathan et al. | Analyzing the impact of meteorological parameters on rainfall prediction | |
CN113836808A (zh) | 一种基于重污染特征约束的pm2.5深度学习预测方法 | |
CN114169502A (zh) | 一种基于神经网络的降水预测方法、装置和计算机设备 | |
CN113807454B (zh) | 能见度确定方法、装置、计算机设备及可读存储介质 | |
CN111414878A (zh) | 一种关于地块的社会属性分析、图像处理方法及装置 | |
Pegion et al. | Understanding predictability of daily southeast US precipitation using explainable machine learning | |
Sui et al. | Multi-state ship traffic flow analysis using data-driven method and visibility graph | |
Du et al. | Decision support for aircraft taxi time based on deep metric learning | |
Rossi et al. | Analysis of a statistically initialized fuzzy logic scheme for classifying the severity of convective storms in F inland | |
CN115902812A (zh) | 一种短时暴雨天气背景自动判别方法、系统、设备及终端 | |
Swaminathan et al. | A computational framework for modelling and analyzing ice storms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |