空气质量的预测方法和装置
技术领域
本发明涉及大气预测技术领域,尤其涉及空气质量的预测方法和装置。
背景技术
在工业化进程中,为了追求经济的快速发展,人类对自然环境的破坏比较严重,产生了各种污染,而大气污染便是其中主要的污染之一。大气污染直接危害着人们的身体健康,因此,人们存在能够获知较为准确的未来日期的空气质量的需求,以便安排自己的工作和生活,并且,这一需求比较强烈。
空气质量数据一般主要来自环保部门的实测值。而目前的技术中,也存在对空气质量进行预测的技术,分为两种,一种是基于化学预报模式计算进行预报,即WRF(Weather Research and Forecasting Model,天气预报模式)-Chem(Chemistry,化学),基于化学预报模式计算进行预报的方法,需要极高的计算资源,难以实现;另一种是基于当地历史气象数据及历史空气质量数据,结合预测时刻气象数据,对当地预测时刻的空气质量数据进行预测,这种方法,对当地预测时刻的空气质量数据进行预测时,所选取的历史气象数据及历史空气质量数据为历史日期中与预测时刻相同时刻的数据,比如预测时刻为15:00,则所选取的历史气象数据及历史空气质量数据为历史某或某些日期15:00时的数据,采用这种方法所预测得到的空气质量的数据准确度比较低。
因此,目前的技术,难以在有限计算资源下对空气质量进行比较准确的预测。
发明内容
有鉴于此,本发明提供了一种空气质量的预测方法和装置,用以在有限计算资源下对空气质量进行比较准确的预测。
为实现上述目的,本发明提供如下技术方案:
一种空气质量的预测方法,包括:
从预先建立的数据库中调取以待预测地区为中心方圆预设距离范围内所有地区的历史气象数据和历史空气质量数据;所述数据库包含各地区距离当前时刻第一预设时间内的历史气象数据和历史空气质量数据;
从待预测地区的历史气象数据和历史空气质量数据中,选取第一历史气象数据和第一空气质量数据作为预测输入参数,从以待预测地区为中心方圆预设距离范围内除待预测地区之外所有地区的历史空气质量数据中,选取第二历史空气质量数据作为预测输入参数;所述第一历史气象数据所对应的时刻与待预测时刻之间的差值等于第一时间差;所述第一历史空气质量数据所对应的时刻与所述待预测时刻之间的差值等于第二时间差;所述第二历史空气质量数据所对应的时刻与所述待预测时刻之间的差值等于第三时间差;
获取待预测地区在待预测时间段内各时刻的预测气象数据,从所述待预测时间段内各时刻的预测气象数据中,选取第一预测气象数据作为预测输入参数;所述第一预测气象数据所对应的时刻与所述待预测时刻之间的差值等于第四时间差;
利用各个所述预测输入参数,通过预先确定的不同待预测时刻的预测函数计算所述待预测时间段内各个相应待预测时刻的空气质量数据。
优选的,所述从待预测地区的历史气象数据和历史空气质量数据中,选取第一历史气象数据和第一空气质量数据作为预测输入参数之前,还包括:
从待预测地区的历史气象数据和历史空气质量数据中,通过计算分别确定与待预测地区历史待预测时刻空气质量数据的相关系数大于预设阈值的第二历史气象数据和第三历史空气质量数据;
记录所述第二历史气象数据所对应的第一时刻,记录所述第三历史空气质量数据所对应的第二时刻;
计算所述历史待预测时刻和所述第一时刻的第一时间差,所述历史待预测时刻和所述第二时刻的第二时间差。
优选的,所述从以待预测地区为中心方圆预设距离范围内所有地区的历史空气质量数据中,选取第二历史空气质量数据作为预测输入参数之前,还包括:
从以待预测地区为中心方圆预设距离范围内除待预测地区之外所有地区的历史空气质量数据中,通过计算确定与待预测地区历史待预测时刻空气质量数据的相关系数大于预设阈值的第四历史空气质量数据;
记录所述第四历史空气质量数据所对应的第三时刻;
计算所述历史待预测时刻和所述第三时刻的第三时间差。
优选的,所述从所述待预测时间段内各时刻的预测气象数据中,选取第一预测气象数据作为预测输入参数之前,还包括:
从待预测地区待预测时间段内各时刻的历史预测气象数据中,通过计算确定与待预测地区历史待预测时刻空气质量数据的相关系数大于预设阈值的第一历史预测气象数据;
记录所述第一历史预测气象数据所对应的第四时刻;
计算所述历史待预测时刻和所述第四时刻的第四时间差。
优选的,所述第四时间差等于所述第一时间差。
优选的,所述利用各个所述预测输入参数,通过预先确定的预测函数计算所述待预测时间段内各个待预测时刻的空气质量数据之前,还包括:
利用统计回归的方式,确定所述不同待预测时刻的预测函数。
优选的,当所述统计回归的方式为线性统计回归时,所述利用统计回归的方式,确定所述预测函数,包括:
确定待预测时刻的空气质量数据为所述预测函数的因变量;
确定各个所述预测输入参数为所述预测函数的自变量,为各个自变量分配待定系数生成多个因式,求各个所述因式的和得到线性回归公式;
将与各个所述预测输入参数所对应的历史数据或者历史预测数据带入所述线性回归公式,计算各个所述预测输入参数所对应的待定系数的值,使所述待预测时刻的历史预测空气质量数据与历史实际空气质量数据的差值最小;所述历史数据包括历史气象数据和历史空气质量数据;
将计算得到的各个待定系数的值分别带入相对应的因式,从而得到所述预测函数。
优选的,还包括:
通过预先确定的修正值,对所述待预测时间段内各个待预测时刻的空气质量数据进行修正,得到修正后的各个待预测时刻的空气质量数据。
优选的,还包括:
每隔第二预设时间更新数据库中的各地区距离当前时刻第一预设时间内的历史空气质量数据,每隔第三预设时间更新数据库中的各地区距离当前时刻第一预设时间内的历史气象数据;
每隔第四预设时间,重新确定所述待预测时间段内各个待预测时刻的空气质量数据。
一种空气质量的预测装置,包括:
调取模块,用于从预先建立的数据库中调取以待预测地区为中心方圆预设距离范围内所有地区的历史气象数据和历史空气质量数据;所述数据库包含各地区距离当前时刻第一预设时间内的历史气象数据和历史空气质量数据;
第一选取模块,用于从待预测地区的历史气象数据和历史空气质量数据中,选取第一历史气象数据和第一空气质量数据作为预测输入参数,从以待预测地区为中心方圆预设距离范围内除待预测地区之外所有地区的历史空气质量数据中,选取第二历史空气质量数据作为预测输入参数;所述第一历史气象数据所对应的时刻与待预测时刻之间的差值等于第一时间差;所述第一历史空气质量数据所对应的时刻与所述待预测时刻之间的差值等于第二时间差;所述第二历史空气质量数据所对应的时刻与所述待预测时刻之间的差值等于第三时间差;
第二选取模块,用于获取待预测地区在待预测时间段内各时刻的预测气象数据,从所述待预测时间段内各时刻的预测气象数据中,选取第一预测气象数据作为预测输入参数;所述第一预测气象数据所对应的时刻与所述待预测时刻之间的差值等于第四时间差;
计算模块,用于利用各个所述预测输入参数,通过预先确定的不同待预测时刻的预测函数计算所述待预测时间段内各个相应待预测时刻的空气质量数据。
优选的,还包括:
第一时间差计算模块,用于从待预测地区的历史气象数据中,通过计算确定与待预测地区历史待预测时刻空气质量数据的相关系数大于预设阈值的第二历史气象数据,记录所述第二历史气象数据所对应的第一时刻,计算所述历史待预测时刻和所述第一时刻的第一时间差;
第二时间差计算模块,用于从待预测地区的历史空气质量数据中,通过计算确定与待预测地区历史待预测时刻空气质量数据的相关系数大于预设阈值的第三历史空气质量数据,记录所述第三历史空气质量数据所对应的第二时刻,计算所述历史待预测时刻和所述第二时刻的第二时间差;
第三时间差计算模块,用于从以待预测地区为中心方圆预设距离范围内除待预测地区之外所有地区的历史空气质量数据中,通过计算确定与待预测地区历史待预测时刻空气质量数据的相关系数大于预设阈值的第四历史空气质量数据,记录所述第四历史空气质量数据所对应的第三时刻,计算所述历史待预测时刻和所述第三时刻的第三时间差。
优选的,还包括:
第四时间差计算模块,用于从待预测地区待预测时间段内各时刻的历史预测气象数据中,通过计算确定与待预测地区历史待预测时刻空气质量数据的相关系数大于预设阈值的第一历史预测气象数据;记录所述第一历史预测气象数据所对应的第四时刻;计算所述历史待预测时刻和所述第四时刻的第四时间差。
优选的,还包括:
预测函数生成模块,用于利用统计回归的方式,确定所述不同待预测时刻的预测函数。
优选的,所述预测函数生成模块包括:
预测函数第一生成单元,用于利用线性统计回归的方式,确定所述预测函数,过程包括:确定待预测时刻的空气质量数据为所述预测函数的因变量;确定各个所述预测输入参数为所述预测函数的自变量,为各个自变量分配待定系数生成多个因式,求各个所述因式的和得到线性回归公式;将与各个所述预测输入参数所对应的历史数据或者历史预测数据带入所述线性回归公式,计算各个所述预测输入参数所对应的待定系数的值,使所述待预测时刻的历史预测空气质量数据与历史实际空气质量数据的差值最小;所述历史数据包括历史气象数据和历史空气质量数据;将计算得到的各个待定系数的值分别带入相对应的因式,从而得到所述预测函数。
优选的,还包括:
修正模块,用于通过预先确定的修正值,对所述待预测时间段内各个待预测时刻的空气质量数据进行修正,得到修正后的各个待预测时刻的空气质量数据。
优选的,还包括:
数据库更新模块,用于每隔第二预设时间更新数据库中的各地区距离当前时刻第一预设时间内的历史空气质量数据,每隔第三预设时间更新数据库中的各地区距离当前时刻第一预设时间内的历史气象数据;
空气质量预测数据更新模块,用于每隔第四预设时间,重新计算所述待预测时间段内各个待预测时刻的空气质量数据。
经由上述的技术方案可知,与现有技术相比,本发明提供了一种空气质量的预测方法和装置。具体的,发明人经过大量研究发现,待预测时刻的空气质量数据不仅与之前日期中与待预测时刻相同时刻的历史气象数据和历史空气质量数据有关,也与其他时刻的历史气象数据和历史空气质量数据有关,并且有时其他时刻的历史气象数据和历史空气质量数据对待预测时刻的空气质量数据影响更大,另外,发明人经过研究还发现,待预测地区待预测时刻的空气质量数据不仅与待预测地区本地区之前时刻的空气质量数据有关,还与周围地区之前时刻的空气质量数据有关。基于上述创造性的发现,发明人提出了本发明的技术方案,相对于现有技术,本发明的技术方案能够从待预测地区在待预测时刻之前任意时刻的历史气象数据和历史空气质量数据中,动态选取作为预测输入参数的第一历史气象数据和第一空气质量数据,相对于现有技术,扩大了在时间维度上预测输入参数的选择,能够从以待预测地区为中心方圆预设距离范围内除待预测地区之外所有地区在待预测时刻之前任意时刻的历史空气质量数据中,动态选取作为预测输入参数的第二历史空气质量数据,相对于现有技术,增加了在空间维度上预测输入参数的选择,然后继续获取待预测地区在待预测时间段内各时刻的预测气象数据,从所述待预测时间段内各时刻的预测气象数据中,选取第一预测气象数据作为预测输入参数,最后利用各个所述预测输入参数,通过预先确定的预测函数计算所述待预测时间段内各个待预测时刻的空气质量数据。通过在时间维度和空间维度的扩展,本发明提供的技术方案,能够选取的预测输入参数的范围明显扩大,进而使计算得到的待预测时刻的空气质量数据的准确度能够有效提高。另外,本发明的技术方案,在实施过程中,计算量比较合理,比较易于实现。因此,本发明提供的技术方案,能够在有限计算资源下对空气质量进行比较准确的预测。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种空气质量的预测方法的流程图;
图2为本发明实施例提供的另外一种空气质量的预测方法的流程图;
图3为本发明实施例提供的另外一种空气质量的预测方法的流程图;
图4为本发明实施例提供的一种空气质量的预测装置的结构图;
图5为本发明实施例提供的另外一种空气质量的预测装置的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
实施例一
请参阅图1,图1为本发明实施例提供的一种空气质量的预测方法的流程图。如图1所示,该方法包括:
步骤S101,从预先建立的数据库中调取以待预测地区为中心方圆预设距离范围内所有地区的历史气象数据和历史空气质量数据;
具体的,所述数据库包含各地区距离当前时刻第一预设时间内的历史气象数据和历史空气质量数据。进一步的,所述第一预设时间,可选的,为两个月。所述预设距离,可选的,为300公里。
具体的,气象数据包括风速,风向,温度,压强,大气垂直不稳定度等。
步骤S102,从待预测地区的历史气象数据和历史空气质量数据中,选取第一历史气象数据和第一空气质量数据作为预测输入参数;
具体的,所述第一历史气象数据所对应的时刻与待预测时刻之间的差值等于第一时间差,比如所述第一历史气象数据为风速,与风速相对应的所述第一时间差为8小时。具体的,所述第一历史空气质量数据所对应的时刻与所述待预测时刻之间的差值等于第二时间差。
具体的,第一时间差和第二时间差可以相等,也可以不等,具体由计算确定,二者之间各自独立。
进一步的,执行所述步骤S102之前,已经做完的准备工作包括:
从待预测地区的历史气象数据和历史空气质量数据中,通过计算分别确定与待预测地区历史待预测时刻空气质量数据的相关系数大于预设阈值的第二历史气象数据和第三历史空气质量数据;
具体的,所述预设阈值,可选的,为0.3。
记录所述第二历史气象数据所对应的第一时刻,记录所述第三历史空气质量数据所对应的第二时刻;
计算所述历史待预测时刻和所述第一时刻的第一时间差,所述历史待预测时刻和所述第二时刻的第二时间差。比如,历史待预测时刻提前8小时后的时刻(即第一时刻)北京的风速与北京历史待预测时刻的空气质量数据相关系数达到最高值,为0.4(大于0.3的预设阈值),则将风速作为预测输入参数,并记录提前时间(即第一时间差)为8小时。
具体的,待预测地区的历史气象数据与历史待预测时刻空气质量数据的相关系数的计算公式,可选的,为:
其中,rXY为相关系数,i为从历史待预测时刻开始往前推进的时刻数,Xi为从历史待预测时刻开始往前推进i时刻时的历史空气质量数据,X为从历史待预测时刻开始往前推进1时刻到N时刻时各历史空气质量数据的平均值,Yi+A为从历史待预测时刻之前A时刻开始往前推进i时刻时的历史气象数据,Y为从历史待预测时刻之前A时刻开始往前推进1时刻到N时刻时的各历史气象数据的平均值;具体的,可选的,上述(1)式中,1表示1小时;N的取值,可选的,为1440(24小时乘以60天);可选的,A按照从小到大的顺序依次选取(0~96)之间的整数数值。
具体的,待预测地区的历史空气质量数据与待预测地区的历史待预测时刻空气质量数据的相关系数的计算公式,可选的,为:
其中,rXY为相关系数,i为从历史待预测时刻开始往前推进的时刻数;Xi为待预测地区从历史待预测时刻开始往前推进i时刻时的历史空气质量数据;X为从历史待预测时刻开始往前推进1时刻到N时刻时各历史空气质量数据的平均值;Yi+B为待预测地区从历史待预测时刻之前B时刻开始往前推进i时刻时的历史空气质量数据;Y为待预测地区从历史待预测时刻之前B时刻开始往前推进1时刻到N时刻时,各历史空气质量数据的平均值;具体的,可选的,上述(2)式中,1表示1小时。N的取值,可选的,为1440(24小时乘以60天)。需要说明的是,针对具体不同的历史待预测时刻,B的取值不同。具体的,可选的,历史待预测时刻相对于历史当前时刻是未来的第T个小时,则B的取值要从T开始,可选的,B按照从小到大的顺序依次选取(T~96)之间的整数数值,可选的,T为小于等于24的整数。比如,历史待预测时刻相对于历史当前时刻是未来的第8个小时(比如,昨天18:00为历史待预测时刻,昨天10:00为历史当前时刻),那么,B的取值要从8开始,可选的,B按照从小到大的顺序依次选取(8~96)之间的整数数值。
步骤S103,从以待预测地区为中心、方圆预设距离范围内除待预测地区之外所有地区的历史空气质量数据中,选取第二历史空气质量数据作为预测输入参数;
具体的,所述第二历史空气质量数据所对应的时刻与所述待预测时刻之间的差值等于第三时间差。
第三时间差与第一时间差可以相等,也可以不等,具体由计算确定,二者之间各自独立;第三时间差与第二时间差可以相等,也可以不等,具体由计算确定,二者之间各自独立。
具体的,执行所述步骤S103之前,已经做完的准备工作包括:
从以待预测地区为中心方圆预设距离范围内除待预测地区之外所有地区的历史空气质量数据中,通过计算确定与待预测地区历史待预测时刻空气质量数据的相关系数大于预设阈值的第四历史空气质量数据;
具体的,所述预设阈值,可选的,为0.3。
记录所述第四历史空气质量数据所对应的第三时刻;
计算所述历史待预测时刻和所述第三时刻的第三时间差。
具体的,待预测地区周边其他地区的历史空气质量数据与待预测地区的历史待预测时刻空气质量数据的相关系数的计算公式,可选的,为:
其中,rXY为相关系数,i为从历史待预测时刻开始往前推进的时刻数;Xi为从历史待预测时刻开始往前推进i时刻时的历史空气质量数据;X为从历史待预测时刻开始往前推进1时刻到N时刻时各历史空气质量数据的平均值;Yi+S为其他地区从历史待预测时刻之前S时刻开始往前推进i时刻时的历史空气质量数据;Y为其他地区从历史待预测时刻之前S时刻开始往前推进1时刻到N时刻时,各历史空气质量数据的平均值;其他地区是指以待预测地区为中心方圆预设距离范围内除待预测地区之外的所有地区;具体的,可选的,S24-96上述(3)式中,1表示1小时。N的取值,可选的,为1440(24小时乘以60天)。需要说明的是,针对具体不同的历史待预测时刻,S的取值不同。具体的,可选的,历史待预测时刻相对于历史当前时刻是未来的第T个小时,则S的取值要从T开始,可选的,S按照从小到大的顺序依次选取(T~96)之间的整数数值,可选的,T为小于等于24的整数。比如,历史待预测时刻相对于历史当前时刻是未来的第8个小时(比如,昨天18:00为历史待预测时刻,昨天10:00为历史当前时刻),那么,S的取值要从8开始,可选的,S按照从小到大的顺序依次选取(8~96)之间的整数数值。
步骤S104,获取待预测地区在待预测时间段内各时刻的预测气象数据,从所述待预测时间段内各时刻的预测气象数据中,选取第一预测气象数据作为预测输入参数;
具体的,所述第一预测气象数据所对应的时刻与所述待预测时刻之间的差值等于第四时间差。第四时间差与前述的第一时间差、第二时间差和第三时间差分别可以相等,也可以不等。
进一步的,所述第四时间差与所述第一时间差相等,此时,可以通过上述计算得到的第一时间差直接确定第四时间差。
当然,为了更加精确地确定所述第四时间差,可选的,执行所述步骤S104之前,已经做完的准备工作包括:
从待预测地区待预测时间段内各时刻的历史预测气象数据中,通过计算确定与待预测地区历史待预测时刻空气质量数据的相关系数大于预设阈值的第一历史预测气象数据;
具体的,所述预设阈值,可选的,为0.3。
记录所述第一历史预测气象数据所对应的第四时刻;
计算所述历史待预测时刻和所述第四时刻的第四时间差。
具体的,待预测地区待预测时间段内各时刻的历史预测气象数据与待预测地区历史待预测时刻空气质量数据的相关系数的计算公式,可选的,为:
其中,rXY为相关系数,i为从历史待预测时刻开始往前推进的时刻数,Xi为从历史待预测时刻开始往前推进i时刻时的历史空气质量数据,X为从历史待预测时刻开始往前推进1时刻到N时刻时各历史空气质量数据的平均值,Yi+K为从历史待预测时刻之前K时刻开始往前推进i时刻时的历史预测气象数据,Y为从历史待预测时刻之前K时刻开始往前推进1时刻到N时刻时的各历史预测气象数据的平均值;具体的,可选的,上述(1)式中,1表示1小时。N的取值,可选的,为1440(24小时乘以60天);可选的,K按照从小到大的顺序依次选取(0~96)之间的整数数值。
需要说明的是,对待预测时间段不同待预测时刻所需要的气象数据,若存在符合预设条件的历史气象数据,则优先选取符合预设条件的历史气象数据;若不存在符合预设条件的历史气象数据,则选取相应的预测气象数据来代替历史气象数据。以步骤S102为例,比如第一历史气象数据为风速,第一时间差为8小时,则本段上文提到的预设条件,是指待预测时刻与当前时刻的差值小于第一时间差(8小时),若存在符合预设条件的历史气象数据,那么,待预测时刻提前8小时时刻的风速有实测值,即第一历史气象数据(风速)存在,则选取第一历史气象数据(风速)作为预测输入参数;若不存在符合预设条件的历史气象数据,则待预测时刻提前8小时时刻的风速还没有实测值,即第一历史气象数据(风速)不存在,因为待预测时刻提前8小时的时刻相对于当前时刻乃是未来的时间,则此时,需要选取待预测时刻提前8小时时刻的预测气象数据作为预测输入参数,或者按照步骤S104选取待预测时刻提前第四时间差时刻的第一预测气象数据作为预测输入参数。
需要说明的是,气象数据包括风速,风向,温度,压强,大气垂直不稳定度等,本申请文件中提到的带有第一历史、第二历史、预测、第一预测、第一历史预测或者第二历史预测等前缀的气象数据,也包括上述风速,风向,温度,压强,大气垂直不稳定度等不同的数据,前缀的不同只是为了更加清楚的阐述本发明的技术方案而做的区别阐述。
步骤S105,利用各个所述预测输入参数,通过预先确定的不同待预测时刻的预测函数计算所述待预测时间段内各个相应待预测时刻的空气质量数据。
具体的,将各个所述预测输入参数带入不同待预测时刻所述预测函数的函数式,计算所述待预测时间段内各个相应待预测时刻的空气质量数据。所述待预测时间段,可选的,为24小时,即未来24小时,进一步的,可选的,未来24小时待预测时间段内的待预测时刻为1:00(注:此处1:00表示未来第1小时,以下类推),2:00,3:00……23:00,24:00。需要说明的是,每一个待预测时刻的预测函数可能不相同。
具体的,所述步骤S105之前,已完成的准备工作包括:
利用统计回归的方式,确定所述不同待预测时刻的预测函数。进一步的,可选的,本发明提供的技术方案,选择利用统计回归的方式,确定所述不同待预测时刻的预测函数,具体步骤可选的包括:
确定待预测时刻的空气质量数据为所述预测函数的因变量;
确定各个所述预测输入参数为所述预测函数的自变量,为各个自变量分配待定系数生成多个因式,求各个所述因式的和得到线性回归公式;
将与各个所述预测输入参数所对应的历史数据或者历史预测数据带入所述线性回归公式,计算各个所述预测输入参数所对应的待定系数的值,使所述待预测时刻的历史预测空气质量数据与历史实际空气质量数据的差值最小;所述历史数据包括历史气象数据和历史空气质量数据(历史空气质量数据包括已知的当前空气质量数据);所述历史预测数据包括历史预测气象数据。
具体的,计算各个所述预测输入参数所对应的待定系数的值,所采用的方法,可选的,为最小二乘法,其评价指标为使结果的方差最小,当然,也可以选择以平均偏差最小的评价指标对待定系数进行计算。
将计算得到的各个待定系数的值分别带入相对应的因式,从而得到所述预测函数。
具体的,所述预测函数的函数式,可选的,为:
K=a1X1+a2X2+a3X3......anXn (5)
其中,K表示待预测的空气质量数据;a1,a2,…an表示待定系数,X1,X2,…Xn表示各个预测输入参数。
需要说明的是,不同待预测时刻的预测函数中,a1和a1,a2和a2,…an和an的值各自可能不同。这是因为不同待预测时刻的预测输入参数可能选取的方式不同,比如预测未来第1小时的空气质量数据,比如要选取8小时前的风速作为预测输入参数,则选取的风速值为实测值;比如预测未来第20小时的空气质量,要选取8小时前的风速作为预测输入参数,则选取的风速值为(天气预报)预测值。则,这两个时刻各自对应的预测函数中的a1和a1,a2和a2,…an和an的值各自可能不同。再比如,步骤S102中,未来第1小时选取未来第1小时之前第二时间差(比如2个小时)的时刻所对应的历史空气质量数据作为第一历史空气质量数据,未来第20小时选取当前时刻的空气质量数据作为第一历史空气质量数据(即未来第20小时之前第二时间差的时刻就是当前时刻,也就是说此处第二时间差为20个小时),则,这两个时刻各自对应的预测函数中的a1和a1,a2和a2,…an和an的值各自可能不同。其他类似情况不再赘述。
需要说明的是,利用其他统计回归方式,比如非线性回归、神经网络回归等,也能够确定预测函数,本发明只是选择了较为方便和常用的线性统计回归方式,应用本发明的发明思想,只是确定预测函数方式不同的技术方案,不脱离本发明的保护范围。
经由上述的技术方案可知,本发明提供了一种空气质量的预测方法。具体的,发明人经过大量研究发现,待预测时刻的空气质量数据不仅与之前日期中与待预测时刻相同时刻的历史气象数据和历史空气质量数据有关,也与其他时刻的历史气象数据和历史空气质量数据有关,并且有时其他时刻的历史气象数据和历史空气质量数据对待预测时刻的空气质量数据影响更大,另外,发明人经过研究还发现,待预测地区待预测时刻的空气质量数据不仅与待预测地区本地区之前时刻的空气质量数据有关,还与周围地区之前时刻的空气质量数据有关。基于上述创造性的发现,发明人提出了本发明的技术方案,相对于现有技术,本发明的技术方案能够从待预测地区在待预测时刻之前任意时刻的历史气象数据和历史空气质量数据中,动态选取作为预测输入参数的第一历史气象数据和第一空气质量数据,相对于现有技术,扩大了在时间维度上预测输入参数的选择,能够从以待预测地区为中心方圆预设距离范围内除待预测地区之外所有地区在待预测时刻之前任意时刻的历史空气质量数据中,动态选取作为预测输入参数的第二历史空气质量数据,相对于现有技术,增加了在空间维度上预测输入参数的选择,然后继续获取待预测地区在待预测时间段内各时刻的预测气象数据,从所述待预测时间段内各时刻的预测气象数据中,选取第一预测气象数据作为预测输入参数,最后利用各个所述预测输入参数,通过预先确定的预测函数计算所述待预测时间段内各个待预测时刻的空气质量数据。通过在时间维度和空间维度的扩展,本发明提供的技术方案,能够选取的预测输入参数的范围明显扩大,进而使计算得到的待预测时刻的空气质量数据的准确度能够有效提高。另外,本发明的技术方案,在实施过程中,计算量比较合理,比较易于实现。因此,本发明提供的技术方案,能够在有限计算资源下对空气质量进行比较准确的预测。
本发明实施例一提供的技术方案,相对于现有技术中的第二种方案(基于当地历史气象数据及历史空气质量数据,结合预测时刻气象数据,对当地预测时刻的空气质量数据进行预测),预测得到的空气质量数据已经明显准确很多。但为了进一步提高所预测空气质量数据的准确度,本发明还公开另外一个具体实施例。
实施例二
请参阅图2,图2为本发明实施例提供的另外一种空气质量的预测方法的流程图。如图2所示,该方法包括:
步骤S201,从预先建立的数据库中调取以待预测地区为中心方圆预设距离范围内所有地区的历史气象数据和历史空气质量数据;
具体的,所述数据库包含各地区距离当前时刻第一预设时间内的历史气象数据和历史空气质量数据。进一步的,所述第一预设时间,可选的,为两个月。所述预设距离,可选的,为300公里。
步骤S202,从待预测地区的历史气象数据和历史空气质量数据中,选取第一历史气象数据和第一空气质量数据作为预测输入参数,
具体的,所述第一历史气象数据所对应的时刻与待预测时刻之间的差值等于第一时间差,所述第一历史空气质量数据所对应的时刻与所述待预测时刻之间的差值等于第二时间差。
步骤S203,从以待预测地区为中心方圆预设距离范围内除待预测地区之外所有地区的历史空气质量数据中,选取第二历史空气质量数据作为预测输入参数;
具体的,所述第二历史空气质量数据所对应的时刻与所述待预测时刻之间的差值等于第三时间差。
步骤S204,获取待预测地区在待预测时间段内各时刻的预测气象数据,从所述待预测时间段内各时刻的预测气象数据中,选取第一预测气象数据作为预测输入参数;
具体的,所述第一预测气象数据所对应的时刻与所述待预测时刻之间的差值等于第四时间差。
步骤S205,利用各个所述预测输入参数,通过预先确定的预测函数计算所述待预测时间段内各个待预测时刻的空气质量数据;
步骤S206,通过预先确定的修正值,对所述待预测时间段内各个待预测时刻的空气质量数据进行修正,得到修正后的各个待预测时刻的空气质量数据。
具体的,所述修正值的确定,可选的,包括以下步骤:
对历史预测时间段内连续的若干个(或所有)历史待预测时刻的历史预测空气质量数据和历史空气质量数据(实际空气质量数据)进行对比,获取二者的偏差;
然后将多个偏差按与当前时刻的接近程度做加权平均,将加权平均得到的值作为所述修正值。
如表1所示:
表1
上表中,-3表示距离当前时刻的时间是3天,负号表示是当前时刻之前的时间,其他类似表示同理,不再赘述。
通过预先确定的修正值,对所述待预测时间段内各个待预测时刻的空气质量数据进行修正,具体的,将所述待预测时间段内各个待预测时刻的空气质量数据的值减去所述修正值,便可得到修正后的各个待预测时刻的空气质量数据。
为了进一步优化本发明提供的技术方案,本发明还提供具有及时更新预测空气质量数据的另外一个具体实施例。
实施例三
请参阅图3,图3为本发明实施例提供的另外一种空气质量的预测方法的流程图。如图3所示,该方法包括:
步骤S301,从预先建立的数据库中调取以待预测地区为中心方圆预设距离范围内所有地区的历史气象数据和历史空气质量数据;
具体的,所述数据库包含各地区距离当前时刻第一预设时间内的历史气象数据和历史空气质量数据。进一步的,所述第一预设时间,可选的,为两个月。所述预设距离,可选的,为300公里。
步骤S302,从待预测地区的历史气象数据和历史空气质量数据中,选取第一历史气象数据和第一空气质量数据作为预测输入参数,
具体的,所述第一历史气象数据所对应的时刻与待预测时刻之间的差值等于第一时间差,所述第一历史空气质量数据所对应的时刻与所述待预测时刻之间的差值等于第二时间差。
步骤S303,从以待预测地区为中心方圆预设距离范围内除待预测地区之外所有地区的历史空气质量数据中,选取第二历史空气质量数据作为预测输入参数;
具体的,所述第二历史空气质量数据所对应的时刻与所述待预测时刻之间的差值等于第三时间差。
步骤S304,获取待预测地区在待预测时间段内各时刻的预测气象数据,从所述待预测时间段内各时刻的预测气象数据中,选取第一预测气象数据作为预测输入参数;
具体的,所述第一预测气象数据所对应的时刻与所述待预测时刻之间的差值等于第四时间差。
步骤S305,利用各个所述预测输入参数,通过预先确定的预测函数计算所述待预测时间段内各个待预测时刻的空气质量数据;
步骤S306,通过预先确定的修正值,对所述待预测时间段内各个待预测时刻的空气质量数据进行修正,得到修正后的各个待预测时刻的空气质量数据;
步骤S307,每隔第二预设时间更新数据库中的各地区距离当前时刻第一预设时间内的历史空气质量数据,每隔第三预设时间更新数据库中的各地区距离当前时刻第一预设时间内的历史气象数据;
具体的,所述第二预设时间,可选的,为1小时;所述第三预设时间,可选的,为3小时。
步骤S308,每隔第四预设时间,重新确定所述待预测时间段内各个待预测时刻的空气质量数据。
具体的,所述第四预设时间,可选的,为1小时。即每隔1小时,重新确定所述待预测时间段内各个待预测时刻的空气质量数据,从而保证预测空气质量数据的及时更新,能够提高预测的准确度和自动化程度。具体的,重新确定所述待预测时间段内各个待预测时刻的空气质量数据包括,重新计算和重新修正所述待预测时间段内各个待预测时刻的空气质量数据。
为了更加全面地阐述和保护本发明提供的技术方案,本发明还提供空气质量的预测装置。
请参阅图4,图4为本发明实施例提供的一种空气质量的预测装置的结构图。如图4所示,该装置包括:
调取模块401,用于从预先建立的数据库中调取以待预测地区为中心方圆预设距离范围内所有地区的历史气象数据和历史空气质量数据;所述数据库包含各地区距离当前时刻第一预设时间内的历史气象数据和历史空气质量数据;
第一选取模块402,用于从待预测地区的历史气象数据和历史空气质量数据中,选取第一历史气象数据和第一空气质量数据作为预测输入参数,从以待预测地区为中心方圆预设距离范围内除待预测地区之外所有地区的历史空气质量数据中,选取第二历史空气质量数据作为预测输入参数;所述第一历史气象数据所对应的时刻与待预测时刻之间的差值等于第一时间差,所述第一历史空气质量数据所对应的时刻与所述待预测时刻之间的差值等于第二时间差,所述第二历史空气质量数据所对应的时刻与所述待预测时刻之间的差值等于第三时间差;
第二选取模块403,用于获取待预测地区在待预测时间段内各时刻的预测气象数据,从所述待预测时间段内各时刻的预测气象数据中,选取第一预测气象数据作为预测输入参数;所述第一预测气象数据所对应的时刻与所述待预测时刻之间的差值等于第四时间差;
计算模块404,用于利用各个所述预测输入参数,通过预先确定的不同待预测时刻的预测函数计算所述待预测时间段内各个相应待预测时刻的空气质量数据。
经由上述的技术方案可知,本发明提供了一种空气质量的预测装置。具体的,发明人经过大量研究发现,待预测时刻的空气质量数据不仅与之前日期中与待预测时刻相同时刻的历史气象数据和历史空气质量数据有关,也与其他时刻的历史气象数据和历史空气质量数据有关,并且有时其他时刻的历史气象数据和历史空气质量数据对待预测时刻的空气质量数据影响更大,另外,发明人经过研究还发现,待预测地区待预测时刻的空气质量数据不仅与待预测地区本地区之前时刻的空气质量数据有关,还与周围地区之前时刻的空气质量数据有关。基于上述创造性的发现,发明人提出了本发明的技术方案,相对于现有技术,本发明的技术方案能够从待预测地区在待预测时刻之前任意时刻的历史气象数据和历史空气质量数据中,动态选取作为预测输入参数的第一历史气象数据和第一空气质量数据,相对于现有技术,扩大了在时间维度上预测输入参数的选择,能够从以待预测地区为中心方圆预设距离范围内除待预测地区之外所有地区在待预测时刻之前任意时刻的历史空气质量数据中,动态选取作为预测输入参数的第二历史空气质量数据,相对于现有技术,增加了在空间维度上预测输入参数的选择,然后继续获取待预测地区在待预测时间段内各时刻的预测气象数据,从所述待预测时间段内各时刻的预测气象数据中,选取第一预测气象数据作为预测输入参数,最后利用各个所述预测输入参数,通过预先确定的预测函数计算所述待预测时间段内各个待预测时刻的空气质量数据。通过在时间维度和空间维度的扩展,本发明提供的技术方案,能够选取的预测输入参数的范围明显扩大,进而使计算得到的待预测时刻的空气质量数据的准确度能够有效提高。另外,本发明的技术方案,在实施过程中,计算量比较合理,比较易于实现。因此,本发明提供的技术方案,能够在有限计算资源下对空气质量进行比较准确的预测。
进一步的,本发明实施例提供的空气质量的预测装置,还包括:
第一时间差计算模块,用于从待预测地区的历史气象数据中,通过计算确定与待预测地区历史待预测时刻空气质量数据的相关系数大于预设阈值的第二历史气象数据,记录所述第二历史气象数据所对应的第一时刻,计算所述历史待预测时刻和所述第一时刻的第一时间差;
第二时间差计算模块,用于从待预测地区的历史空气质量数据中,通过计算确定与待预测地区历史待预测时刻空气质量数据的相关系数大于预设阈值的第三历史空气质量数据,记录所述第三历史空气质量数据所对应的第二时刻,计算所述历史待预测时刻和所述第二时刻的第二时间差;
第三时间差计算模块,用于从以待预测地区为中心方圆预设距离范围内除待预测地区之外所有地区的历史空气质量数据中,通过计算确定与待预测地区历史待预测时刻空气质量数据的相关系数大于预设阈值的第四历史空气质量数据,记录所述第四历史空气质量数据所对应的第三时刻,计算所述历史待预测时刻和所述第三时刻的第三时间差。
进一步的,本发明实施例提供的空气质量的预测装置,还包括:
第四时间差计算模块,用于从待预测地区待预测时间段内各时刻的历史预测气象数据中,通过计算确定与待预测地区历史待预测时刻空气质量数据的相关系数大于预设阈值的第一历史预测气象数据;记录所述第一历史预测气象数据所对应的第四时刻;计算所述历史待预测时刻和所述第四时刻的第四时间差。
进一步的,本发明实施例提供的空气质量的预测装置,还包括:
预测函数生成模块,用于利用统计回归的方式,确定所述不同待预测时刻的预测函数。
具体的,可选的,所述预测函数生成模块包括:
预测函数第一生成单元,用于利用线性统计回归的方式,确定所述预测函数,过程包括:确定待预测时刻的空气质量数据为所述预测函数的因变量;确定各个所述预测输入参数为所述预测函数的自变量,为各个自变量分配待定系数生成多个因式,求各个所述因式的和得到线性回归公式;将与各个所述预测输入参数所对应的历史数据或者历史预测数据带入所述线性回归公式,计算各个所述预测输入参数所对应的待定系数的值,使所述待预测时刻的历史预测空气质量数据与历史实际空气质量数据的差值最小;所述历史数据包括历史气象数据和历史空气质量数据;将计算得到的各个待定系数的值分别带入相对应的因式,从而得到所述预测函数。
请参阅图5,图5为本发明实施例提供的另外一种空气质量的预测装置的结构图。如图5所示,该装置包括:
调取模块501,用于从预先建立的数据库中调取以待预测地区为中心方圆预设距离范围内所有地区的历史气象数据和历史空气质量数据;所述数据库包含各地区距离当前时刻第一预设时间内的历史气象数据和历史空气质量数据;
第一选取模块502,用于从待预测地区的历史气象数据和历史空气质量数据中,选取第一历史气象数据和第一空气质量数据作为预测输入参数,从以待预测地区为中心方圆预设距离范围内除待预测地区之外所有地区的历史空气质量数据中,选取第二历史空气质量数据作为预测输入参数;所述第一历史气象数据所对应的时刻与待预测时刻之间的差值等于第一时间差,所述第一历史空气质量数据所对应的时刻与所述待预测时刻之间的差值等于第二时间差,所述第二历史空气质量数据所对应的时刻与所述待预测时刻之间的差值等于第三时间差;
第二选取模块503,用于获取待预测地区在待预测时间段内各时刻的预测气象数据,从所述待预测时间段内各时刻的预测气象数据中,选取第一预测气象数据作为预测输入参数;所述第一预测气象数据所对应的时刻与所述待预测时刻之间的差值等于第四时间差;
计算模块504,用于利用各个所述预测输入参数,通过预先确定的不同待预测时刻的预测函数计算所述待预测时间段内各个相应待预测时刻的空气质量数据;
修正模块505,用于通过预先确定的修正值,对所述待预测时间段内各个待预测时刻的空气质量数据进行修正,得到修正后的各个待预测时刻的空气质量数据。
具体的,通过修正模块505,能够进一步提高所预测空气质量数据的准确度。
进一步的,本发明实施例提供的空气质量的预测装置,还包括:
数据库更新模块,用于每隔第二预设时间更新数据库中的各地区距离当前时刻第一预设时间内的历史空气质量数据,每隔第三预设时间更新数据库中的各地区距离当前时刻第一预设时间内的历史气象数据;
空气质量预测数据更新模块,用于每隔第四预设时间,重新计算所述待预测时间段内各个待预测时刻的空气质量数据。
具体的,通过数据库更新模块和空气质量预测数据更新模块,能够保证预测空气质量数据的及时更新,能够进一步提高预测的准确度以及自动化程度。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。