CN111222672B - 空气质量指数aqi的预测方法和装置 - Google Patents

空气质量指数aqi的预测方法和装置 Download PDF

Info

Publication number
CN111222672B
CN111222672B CN201811429242.7A CN201811429242A CN111222672B CN 111222672 B CN111222672 B CN 111222672B CN 201811429242 A CN201811429242 A CN 201811429242A CN 111222672 B CN111222672 B CN 111222672B
Authority
CN
China
Prior art keywords
grid
predicted
grids
aqi
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811429242.7A
Other languages
English (en)
Other versions
CN111222672A (zh
Inventor
何加伟
钟辉强
刘亮
尹存祥
方军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201811429242.7A priority Critical patent/CN111222672B/zh
Publication of CN111222672A publication Critical patent/CN111222672A/zh
Application granted granted Critical
Publication of CN111222672B publication Critical patent/CN111222672B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • Educational Administration (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种空气质量指数AQI的预测方法和装置。该方法包括:获取M个网格的空气质量指数AQI;分别计算M个网格中每个网格和待预测网格之间的距离以及网格相似度;所述网格相似度包括M个网格中每个网格和所述待预测网格之间的兴趣点POI的相似度、交通拥堵度相似度和用户活跃度相似度;根据所述M个网格的AQI、所述距离、所述网格相似度和预先训练的空间预测模型,确定所述待预测网格的AQI。和现有技术中线性差值的方式相比,提高了预测得到的AQI的准确度。

Description

空气质量指数AQI的预测方法和装置
技术领域
本发明涉及大数据技术领域,尤其涉及一种空气质量指数AQI的预测方法和装置。
背景技术
空气污染指数AQI是根据环境空气质量标准和各项污染物对人体健康、生态以及环境的影响,将常规监测的几种空气污染物浓度简化成为单一的概念性指数值。空气污染指数AQI的预测有助于定位污染源,在对污染源进行精细化管控方面有重要作用。
现有技术中,通常采用线性插值的方法对AQI进行估计,具体的,根据环保监测站中监测的数据进行加权平均,得到某个区域网格内的AQI值。然而,由于区域内的环保监测站数量较少,并且区域网格之间的污染物关系通常是非线性的,因此,通过线性插值的方法估计出的AQI值准确度不高。
发明内容
本发明提供一种空气质量指数AQI的预测方法和装置,用于提高AQI预测准确度。
第一方面,本发明提供一种空气质量指数AQI的预测方法,包括:
获取M个网格的空气质量指数AQI;其中,M为正整数;
分别计算M个网格中每个网格和待预测网格之间的距离以及网格相似度;所述网格相似度包括M个网格中每个网格和所述待预测网格之间的兴趣点POI的相似度、交通拥堵度相似度和用户活跃度相似度;
根据所述M个网格的AQI、所述距离、所述网格相似度和预先训练的空间预测模型,确定所述待预测网格的AQI。
可选的,所述网格相似度包括M个网格中每个网格和所述待预测网格之间的POI的相似度;
计算M个网格中每个网格和待预测网格之间的网格相似度,包括:
分别获取M个网格中每个网格中的POI和所述待预测网格中的POI;
分别确定每个网格中的POI和所述待预测网格中POI的类型;
根据所述每个网格中的POI的类型和所述待预测网格中POI的类型,计算M个网格中每个网格和待预测网格之间的POI的相似度。
可选的,所述网格相似度包括M个网格中每个网格和所述待预测网格之间的交通拥堵度相似度;
计算M个网格中每个网格和待预测网格之间的网格相似度,包括:
分别获取M个网格中每个网格的第一交通数据和所述待预测网格的第二交通数据;
分别根据所述第一交通数据和所述第二交通数据,确定M个网格中每个网格的第一交通拥堵度和所述待预测网格的第二交通拥堵度;
根据所述第一交通拥堵度和所述第二交通拥堵度,确定M个网格中每个网格和待预测网格之间的交通拥堵度相似度。
可选的,所述网格相似度包括M个网格中每个网格和所述待预测网格之间的用户活跃度相似度;
计算M个网格中每个网格和待预测网格之间的网格相似度,包括:
确定M个网格中每个网格的第一用户数量和待预测网格的第二用户数量;
分别根据所述第一用户数量和所述第二用户数量,计算M个网格中每个网格和待预测网格之间的用户活跃度相似度。
可选的,所述根据所述M个网格的AQI、所述距离、所述网格相似度和预先训练的空间预测模型,确定所述待预测网格的AQI,包括:
根据所述M个网格的AQI、所述距离、所述网格相似度和预先训练的空间预测模型,确定所述待预测网格的AQI在不同AQI区间的第一概率值;
根据所述待预测网格中目标时刻对应的气象特征参数和预先训练的时序预测模型,确定所述待预测网格的AQI在不同AQI区间的第二概率值;
根据所述第一概率值和所述第二概率值,确定所述待预测网格的AQI。
可选的,所述根据所述待预测网格中目标时刻对应的气象特征参数和预先训练的时序预测模型,确定所述待预测网格的AQI在不同AQI区间的第二概率值,包括:
分别获取待预测网格中目标时刻对应的气象特征参数、所述目标时刻对应的第三交通拥堵度、所述目标时刻对应的所述第三用户数量;
根据所述气象特征参数、所述第三交通拥堵度、所述第三用户数量和预先训练的时序预测模型,确定所述待预测网格在目标时刻时的AQI在不同AQI区间的第二概率值。
可选的,所述根据所述第一概率值和所述第二概率值,确定所述待预测网格的AQI,包括:
计算所述第一概率值和对应区间的第二概率值的乘积,得到不同AQI区间对应的乘积结果;
将最大的乘积结果对应的AQI区间确定为所述待预测网格的AQI。
可选的,所述气象特征参数包括如下至少一种:气压、湿度、温度、风速或风向。
第二方面,本发明提供一种空气质量指数AQI的预测装置,获取模块,用于获取M个网格的空气质量指数AQI;其中,M为正整数;
计算模块,用于分别计算M个网格中每个网格和待预测网格之间的距离以及网格相似度;所述网格相似度包括M个网格中每个网格和所述待预测网格之间的兴趣点POI的相似度、交通拥堵度相似度和用户活跃度相似度;
确定模块,用于根据所述M个网格的AQI、所述距离、所述网格相似度和预先训练的空间预测模型,确定所述待预测网格的AQI。
可选的,所述计算模块,具体用于:
分别获取M个网格中每个网格中的POI和所述待预测网格中的POI;
分别确定每个网格中的POI和所述待预测网格中POI的类型;
根据所述每个网格中的POI的类型和所述待预测网格中POI的类型,计算M个网格中每个网格和待预测网格之间的POI的相似度。
可选的,所述计算模块,具体用于:
分别获取M个网格中每个网格的第一交通数据和所述待预测网格的第二交通数据;
分别根据所述第一交通数据和所述第二交通数据,确定M个网格中每个网格的第一交通拥堵度和所述待预测网格的第二交通拥堵度;
根据所述第一交通拥堵度和所述第二交通拥堵度,确定M个网格中每个网格和待预测网格之间的交通拥堵度相似度。
可选的,所述计算模块,具体用于:
确定M个网格中每个网格的第一用户数量和待预测网格的第二用户数量;
分别根据所述第一用户数量和所述第二用户数量,计算M个网格中每个网格和待预测网格之间的用户活跃度相似度。
可选的,所述确定模块,具体用于:
根据所述M个网格的AQI、所述距离、所述网格相似度和预先训练的空间预测模型,确定所述待预测网格的AQI在不同AQI区间的第一概率值;
根据所述待预测网格中目标时刻对应的气象特征参数和预先训练的时序预测模型,确定所述待预测网格的AQI在不同AQI区间的第二概率值;
根据所述第一概率值和所述第二概率值,确定所述待预测网格的AQI。
可选的,所述确定模块,具体用于:
分别获取待预测网格中目标时刻对应的气象特征参数、所述目标时刻对应的第三交通拥堵度、所述目标时刻对应的所述第三用户数量;
根据所述气象特征参数、所述第三交通拥堵度、所述第三用户数量和预先训练的时序预测模型,确定所述待预测网格在目标时刻时的AQI在不同AQI区间的第二概率值。
可选的,所述确定模块,具体用于:
计算所述第一概率值和对应区间的第二概率值的乘积,得到不同AQI区间对应的乘积结果;
将最大的乘积结果对应的AQI区间确定为所述待预测网格的AQI。
可选的,所述气象特征参数包括如下至少一种:气压、湿度、温度、风速或风向。
第三方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述空气质量指数AQI的预测方法。
第四方面,本发明提供一种电子设备,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来实现上述空气质量指数AQI的预测方法。
本发明提供的空气质量指数AQI的预测方法和装置,按照一定的规则将某区域划分为若干网格,在预测过程中,获取M个网格的空气质量指数AQI,然后分别计算M个网格中每个网格和待预测网格之间的距离以及网格相似度,进一步将M个网格的AQI、M个网格中每个网格和待预测网格之间的距离以及网格相似度输入预先训练的空间预测模型中,该空间预测模型便可输出待预测网格的AQI。和现有技术中线性差值的方式相比,提高了预测得到的AQI的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的空气质量指数AQI的预测方法的原理图;
图2为本发明提供的空气质量指数AQI的预测方法的实施例一的流程示意图;
图3为本发明提供的网格示意图;
图4为本发明提供的空气质量指数AQI的预测方法的实施例二的流程示意图;
图5为本发明提供的空气质量指数AQI的预测装置的结构示意图;
图6为本发明提供的电子设备的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。
现有技术中,通常采用线性插值的方法对AQI进行估计,具体的过程为,假设某区域设置有两个环保监测站,这两个环保监测站之间相隔10个区域网格,在对这10个区域网格的AQI进行估计时,将上述两个环保监测站监测到的AQI作为端点进行线性插值,从而得到这两个环保监测站之间10个区域网格对应的AQI。然而,现有技术的上述方法存在如下问题:区域内环保监测站的数量较少,以少量的实际监测数据作为参考得到的估计值难以反映实际值;而且,区域网格之间的污染物关系通常是非线性的,通过线性插值的方法得到的估计值和实际值存在偏差。因此,通过现有技术的方法得到的AQI估计值准确度不高。
基于现有技术存在的上述问题,本发明提供一种空气质量指数AQI的预测方法和装置。按照一定的规则将某区域划分为若干网格,将这些网格中需要进行AQI预测的网格称为待预测网格,在预测过程中,获取M个网格的空气质量指数AQI(这M个网格不包含待预测网格),然后分别计算M个网格中每个网格和待预测网格之间的距离以及网格相似度,进一步将M个网格的AQI、M个网格中每个网格和待预测网格之间的距离以及网格相似度等参数输入预先训练的空间预测模型中,该空间预测模型便可输出待预测网格的AQI。上述预测方法在AQI预测过程中,结合了待预测网格和M个已知AQI的网格的距离、网格相似度和空间预测模型来确定待预测网格的AQI,和现有技术中线性差值的方式相比,提高了预测得到的AQI的准确度。
图1为本发明提供的空气质量指数AQI的预测方法的原理图。如图1所示,在执行本发明提供的空气质量指数AQI的预测方法之前,需要对空间预测模型进行训练,得到一个预先训练好的空间预测模型。在此基础上,将获取到的M个网格的空气质量指数AQI,以及计算得到的M个网格中每个网格和待预测网格之间的距离以及网格相似度,输入上述预先训练好的空间预测模型中,该空间预测模型便可输出待预测网格的AQI。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
图2为本发明提供的空气质量指数AQI的预测方法的实施例一的流程示意图。本实施例提供的空气质量指数AQI的预测方法可由对应的空气质量指数AQI的预测装置执行,该空气质量指数AQI的预测装置可以通过软件、硬件或者软硬件结合的方式实现。如图2所示,本实施例提供的空气质量指数AQI的预测方法,包括:
S201、获取M个网格的空气质量指数AQI。
其中,M的取值为正整数,M个网格中不包含待预测网格。
其中,网格指的是:将区域按照一定规则进行划分后形成的区域网格。
将区域进行划分形成区域网格的可实现方式为:以该区域的环保监测站为中心,预设的长度为半径,将该区域划分为若干边长相等的正方形网格。
可选的,M个网格为AQI已知的网格。比如:这M个网格可以为配置有环保监测站的网格,通过配置的环保监测站可以得到M个网格中每个网格的AQI。
举例来说,参见图3所示,图3为按照上述区域划分方法得到网格示意图,图3作为示例仅示出所有网格的一部分,用数字1-20来标识示出的网格,M的值取3。假设,网格8为当前待预测的网格,网格1、网格5和网格18中配置有监测站,则可将网格1、网格5和网格18作为S201中的M个网格。根据网格1中的监测站监测到的数据可获取到网格1的AQI,根据网格5中的监测站监测到的数据可获取到网格5的AQI,根据网格18中的监测站监测到的数据可获取到网格18的AQI。
S202、分别计算M个网格中每个网格和待预测网格之间的距离以及网格相似度。其中,网格相似度包括M个网格中每个网格和所述待预测网格之间的兴趣点POI的相似度、交通拥堵度相似度和用户活跃度相似度。
继续以S201中的例子进行说明:M个网格中每个网格和待预测网格之间的距离以及网格相似度指的是:网格1和待预测网格之间的距离以及网格相似度、网格5和待预测网格之间的距离以及网格相似度、网格18和待预测网格之间的距离以及网格相似度。
下面以网格1为例对上述计算M个网格中每个网格和待预测网格之间的距离的可实现方式进行说明:
获取网格1的中心点的坐标,获取待预测网格的中心点的坐标,根据这两个坐标计算网格1和待预测网格之间的距离。
具体的,分别计算M个网格中每个网格和待预测网格之间的POI的相似度的可实现方式为:
步骤a1、分别获取M个网格中每个网格中的POI和所述待预测网格中的POI。
步骤a2、分别确定每个网格中的POI和所述待预测网格中POI的类型。
其中,POI的类型可包括:生活类、工业类和农业类。
步骤a3、根据所述每个网格中的POI的类型和所述待预测网格中POI的类型,计算M个网格中每个网格和待预测网格之间的POI的相似度。
下面以网格1为例对上述分别计算M个网格中每个网格和待预测网格之间的POI的相似度的可实现方式进行说明:
在计算POI相似度之前,统计所有网格中每个网格包含的POI总数量,以及每个网格包含的POI的类型。假设,网格1包含的POI总数量为A,生活类占a1%,工业类占a2%,农业类占a3%。待预测网格包含的POI总数量为B,生活类占b1%,工业类占b2%,农业类占b3%。则可根据网格1包含的POI总数量、待预测网格包含的POI总数量、网格1包含的POI中各类POI的占比、待预测网格包含的POI中各类POI的占比,计算两个网格的余弦相似度,将该余弦相似度作为两个网格的POI的相似度,两个网格所包含的POI总数量越接近,两个网格的POI的相似度越高,两个网格所包含的POI的POI类别越接近,两个网格的POI的相似度越高。
其中,分别计算M个网格中每个网格和待预测网格之间的交通拥堵度相似度的可实现方式为:
步骤b1、分别获取M个网格中每个网格的第一交通数据和所述待预测网格的第二交通数据。
其中,对于M个网格中的任一网格来说,第一交通数据指的是:该网格所包含的道路的长度以及车辆通过该网格所包含的道路所使用的时间,由于,不同时间段,车辆通过某条道路所使用的时间是不同的,比如:上下班高峰期使用的时间较其他时间段所使用的时间长。因此,车辆通过上述任一网格所使用的时间是一个时间序列。
相应的,第二交通数据指的是:待预测网格包含的道路的长度以及车辆通过待预测网格所包含的道路所使用的时间。车辆通过待预测网格所包含的道路所使用的时间也是一个时间序列。
步骤b2、分别根据所述第一交通数据和所述第二交通数据,确定M个网格中每个网格的第一交通拥堵度和所述待预测网格的第二交通拥堵度。
其中,交通拥堵度可以为某网格包含的道路的长度和车辆通过该网格所包含的道路使用的时间的乘积。
相应的,对于M个网格中的任一网格来说,第一交通拥堵度为该网格包含的道路的长度和车辆通过该网格所包含的道路使用的时间的乘积。第二交通拥堵度为待预测网格包含的道路的长度和车辆通过待预测网格所包含的道路所使用的时间的乘积。
由于,车辆通过M个网格中任一网格所使用的时间是一个时间序列,车辆通过待预测网格所包含的道路所使用的时间也是一个时间序列。因此,上述第一交通拥堵度和第二交通拥堵度也是时间序列,不同时刻第一交通拥堵度和第二交通拥堵度不同。
步骤b3、根据所述第一交通拥堵度和所述第二交通拥堵度,确定M个网格中每个网格和待预测网格之间的交通拥堵度相似度。
具体的,可计算第一交通拥堵度和第二交通拥堵度的皮尔逊相关系数,将该皮尔逊相关系数作为两个网格之间的网格相似度。
其中,分别计算M个网格中每个网格和待预测网格之间的用户活跃度相似度的可实现方式为:
步骤c1、确定M个网格中每个网格的第一用户数量和待预测网格的第二用户数量。
可选的,可根据用户使用某些需要定位的应用程序APP时上报的定位信息来确定各网格中的用户的数量。
由于,用户所处的位置是变化的,在某个时间区间用户可能从一个网格移动到了另一个网格,因此,M个网格中每个网格的第一用户数量是一个时间序列,待预测网格的第二用户数量也是一个时间序列。
步骤c2、分别根据所述第一用户数量和所述第二用户数量,计算M个网格中每个网格和待预测网格之间的网格相似度。
具体的,可计算第一用户数量和第二用户数量的皮尔逊相关系数,将该皮尔逊相关系数作为两个网格之间的用户活跃度相似度。
S203、根据所述M个网格的AQI、所述距离、所述网格相似度和预先训练的空间预测模型,确定所述待预测网格的AQI。
其中,预先训练的空间预测模型指的是:提前根据训练样本训练得到的空间预测模型。
需要说明的是:M的取值和模型训练过程中使用的特征网格的数量有关,比如:有N个训练样本,每个训练样本对应一个网格,N个训练样本的AQI都是已知的,进行模型训练时,将N个训练样本中的一个训练样本视为待预测网格,搭配其他3个训练样本作为特征网格进行训练。相应的,在使用该空间预测模型进行实际预测时,M的值可取3。
继续以图3为例对本步骤的方案进行说明:
假设网格1的AQI为:AQI1,网格1与待预测网格之间的距离为:d1,网格1与待预测网格之间的POI的相似度为:P1,网格1与待预测网格之间的交通拥堵度相似度为:T1,网格1与待预测网格之间的用户活跃度相似度为:G1。网格5上述参数的对应值为:AQI5、d5、P5、T5和G5。网格18上述参数的对应值为:AQI18、d18、P18、T18和G18。可将上述三组参数输入预先训练的空间预测模型,便可得到待预测网格的AQI。
本实施例提供的空气质量指数AQI的预测方法,按照一定的规则将某区域划分为若干网格,在预测过程中,获取M个网格的空气质量指数AQI(这M个网格不包含待预测网格),然后分别计算M个网格中每个网格和待预测网格之间的距离以及网格相似度,进一步将M个网格的AQI、M个网格中每个网格和待预测网格之间的距离以及网格相似度输入预先训练的空间预测模型中,该空间预测模型便可输出待预测网格的AQI。和现有技术中线性差值的方式相比,提高了预测得到的AQI的准确度。
图4为本发明提供的空气质量指数AQI的预测方法的实施例二的流程示意图。如图4所示,本实施例提供的空气质量指数AQI的预测方法,包括:
S401、获取M个网格的空气质量指数AQI。
S402、分别计算M个网格中每个网格和待预测网格之间的距离以及网格相似度。
其中,S401-S402的实现方式可参见上述实施例,本发明对此不再赘述。
S403、根据所述M个网格的AQI、所述距离、所述网格相似度和预先训练的空间预测模型,确定所述待预测网格的AQI在不同AQI区间的第一概率值。
其中,AQI区间可以根据实际需求灵活设定,比如:可将[0-10]、[10-50]、[50-100]设置AQI的三个AQI区间,上述第一概率值指的是:通过空间预测模型预测得到的AQI落入[0-10]、[10-50]或者[50-100]的概率。
具体的,可将S401和S402得到的M个网格的AQI、M个网格中每个网格和待预测网格之间的距离以及网格相似度输入上述空间预测模型,从而得到待预测网格的AQI在不同AQI区间的第一概率值。
需要说明的是:与上述实施例不同的是,本实施例中空间预测模型输出的是待预测网格的AQI在不同AQI区间的第一概率值。因此,在对空间预测模型进行训练时,需将训练样本的概率特征作为训练特征。
S404、根据所述待预测网格中目标时刻对应的气象特征参数和预先训练的时序预测模型,确定所述待预测网格的AQI在不同AQI区间的第二概率值。
其中,确定第二概率值的可实现方式为:
步骤d1、分别获取待预测网格中目标时刻对应的气象特征参数、所述目标时刻对应的第三交通拥堵度、所述目标时刻对应的所述第三用户数量。
其中,气象特征参数包括如下参数中的至少一种:气压、湿度、温度、风速或风向。
其中,第三交通拥堵度表示:在目标时刻时,待预测网格包含的道路的长度和车辆通过待预测网格所包含的道路所使用的时间的乘积。
其中,第三用户数量表示:在目标时刻时,定位信息处于待预测网格的用户的数量。
步骤d2、根据所述气象特征参数、所述第三交通拥堵度、所述第三用户数量和预先训练的时序预测模型,确定所述待预测网格在目标时刻时的AQI在不同AQI区间的第二概率值。
其中,预先训练的时序预测模型指的是:提前根据训练样本训练得到的时序预测模型。
具体的,上述时序预测模型的训练过程为:有N个训练样本,每个训练样本包含的特征有:时间、气压、湿度、温度、风速、风向、交通拥堵度、用户数量和AQI在不同AQI区间的概率值,对该N个训练样本进行训练,便可得到时序预测模型,该时序预测模型指示的是:时间点、气压、湿度、温度、风速、风向、交通拥堵度、用户数量,与,上述时间点对应的AQI在不同AQI区间的概率值,之间的关系。
S405、根据所述第一概率值和所述第二概率值,确定所述待预测网格的AQI。
其中,根据所述第一概率值和所述第二概率值确定待预测网格的AQI的可实现方式为:
计算所述第一概率值和对应区间的第二概率值的乘积,得到不同AQI区间对应的乘积结果;将最大的乘积结果对应的AQI区间确定为所述待预测网格的AQI。
举例来说,AQI区间包括:[0-10]、[10-50]和[50-100]。通过S403得到的待预测网格的AQI在[0-10]、[10-50]和[50-100]的概率分别为a1,a2和a3。通过S404得到的待预测网格的AQI在[0-10]、[10-50]和[50-100]的概率分别为b1,b2和b3。计算得到AQI在[0-10]的概率乘积为:a1×b1;计算得到AQI在[10-50]的概率乘积为:a2×b2;计算得到AQI在[50-100]的概率乘积为:a3×b3。比较a1×b1,a2×b2和a3×b3的大小,将三者之中最大值对应的AQI区间确定为所述待预测网格的AQI。假设三者之中a2×b2最大,则将[10-50]确定为所述待预测网格的AQI。
具体的,由于本步骤在待预测网格的AQI预测过程中融合了时序预测模型,因此可以得到AQI为待预测网格在特定时刻的AQI。充分考虑了网格空气质量在空间和时间两个维度的特征,便于更加有效地分析网格的空气质量。
可知的,对于无法获取POI信息、交通数据以及定位数据的网格,可将距离最近的网格的AQI作为该网格的AQI。
可选的,在生成所有网格的AQI值后,可以对所有网格的AQI值进行热力图可视化,从而可直观展示各网格的空气质量分布。
可选的,可对各网格的AQI值每日、每周或者每月进行统计,可直观展示不同时间粒度的AQI分布。
可选的,在生成所有网格的AQI值后,可对所有网格的AQI值进行排序,从而得到空气质量较差的一些网格。
本实施例提供的空气质量指数AQI的预测方法,对上述实施例中S203确定所述待预测网格的AQI的可实现方式进行了描述,具体为:根据空间预测模型,确定所述待预测网格的AQI在不同AQI区间的第一概率值,根据时序预测模型,确定所述待预测网格的AQI在不同AQI区间的第二概率值,将第一概率值和对应AQI区间的第二概率值相乘,将乘积结果最大时对应的区间确定为所述待预测网格的AQI,充分考虑了网格空气质量在空间和时间两个维度的特征,便于更加有效地分析网格的空气质量。
图5为本发明提供的空气质量指数AQI的预测装置的结构示意图。如图5所示,本发明提供的空气质量指数AQI的预测装置,包括:
获取模块501,用于获取M个网格的空气质量指数AQI;其中,M为正整数;
计算模块502,用于分别计算M个网格中每个网格和待预测网格之间的距离以及网格相似度;所述网格相似度包括M个网格中每个网格和所述待预测网格之间的兴趣点POI的相似度、交通拥堵度相似度和用户活跃度相似度;
确定模块503,用于根据所述M个网格的AQI、所述距离、所述网格相似度和预先训练的空间预测模型,确定所述待预测网格的AQI。
可选的,所述计算模块502,具体用于:
分别获取M个网格中每个网格中的POI和所述待预测网格中的POI;
分别确定每个网格中的POI和所述待预测网格中POI的类型;
根据所述每个网格中的POI的类型和所述待预测网格中POI的类型,计算M个网格中每个网格和待预测网格之间的POI的相似度。
可选的,所述计算模块502,具体用于:
分别获取M个网格中每个网格的第一交通数据和所述待预测网格的第二交通数据;
分别根据所述第一交通数据和所述第二交通数据,确定M个网格中每个网格的第一交通拥堵度和所述待预测网格的第二交通拥堵度;
根据所述第一交通拥堵度和所述第二交通拥堵度,确定M个网格中每个网格和待预测网格之间的交通拥堵度相似度。
可选的,所述计算模块502,具体用于:
确定M个网格中每个网格的第一用户数量和待预测网格的第二用户数量;
分别根据所述第一用户数量和所述第二用户数量,计算M个网格中每个网格和待预测网格之间的用户活跃度相似度。
可选的,所述确定模块503,具体用于:
根据所述M个网格的AQI、所述距离、所述网格相似度和预先训练的空间预测模型,确定所述待预测网格的AQI在不同AQI区间的第一概率值;
根据所述待预测网格中目标时刻对应的气象特征参数和预先训练的时序预测模型,确定所述待预测网格的AQI在不同AQI区间的第二概率值;
根据所述第一概率值和所述第二概率值,确定所述待预测网格的AQI。
可选的,所述确定模块503,具体用于:
分别获取待预测网格中目标时刻对应的气象特征参数、所述目标时刻对应的第三交通拥堵度、所述目标时刻对应的所述第三用户数量;
根据所述气象特征参数、所述第三交通拥堵度、所述第三用户数量和预先训练的时序预测模型,确定所述待预测网格在目标时刻时的AQI在不同AQI区间的第二概率值。
可选的,所述确定模块503,具体用于:
计算所述第一概率值和对应区间的第二概率值的乘积,得到不同AQI区间对应的乘积结果;
将最大的乘积结果对应的AQI区间确定为所述待预测网格的AQI。
可选的,所述气象特征参数包括如下至少一种:气压、湿度、温度、风速或风向。
本实施例提供的空气质量指数AQI的预测装置,可用于执行上述任一实施例所述的空气质量指数AQI的预测方法,其实现原理和技术效果类似,在此不再赘述。
图6为本发明提供的电子设备的硬件结构示意图。如图6所示,本实施例的电子设备可以包括:
存储器601,用于存储程序指令。
处理器602,用于在所述程序指令被执行时实现上述任一实施例所述的空气质量指数AQI的预测方法,具体实现原理可参见上述实施例,本实施例此处不再赘述。
本发明提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例所述的空气质量指数AQI的预测方法。
本发明还提供一种程序产品,所述程序产品包括计算机程序,所述计算机程序存储在可读存储介质中,至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备实施上述任一实施例所述的空气质量指数AQI的预测方法。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
应理解,上述处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种空气质量指数AQI的预测方法,其特征在于,包括:
获取M个网格的空气质量指数AQI;其中,M为正整数;
分别计算M个网格中每个网格和待预测网格之间的距离以及网格相似度;所述网格相似度包括M个网格中每个网格和所述待预测网格之间的兴趣点POI的相似度、交通拥堵度相似度和用户活跃度相似度;
根据所述M个网格的AQI、所述距离、所述网格相似度和预先训练的空间预测模型,确定所述待预测网格的AQI在不同AQI区间的第一概率值;
根据所述待预测网格中目标时刻对应的气象特征参数和预先训练的时序预测模型,确定所述待预测网格的AQI在不同AQI区间的第二概率值;
根据所述第一概率值和所述第二概率值,确定所述待预测网格的AQI。
2.根据权利要求1所述的方法,其特征在于,所述网格相似度包括M个网格中每个网格和所述待预测网格之间的POI的相似度;
计算M个网格中每个网格和待预测网格之间的网格相似度,包括:
分别获取M个网格中每个网格中的POI和所述待预测网格中的POI;
分别确定每个网格中的POI和所述待预测网格中POI的类型;
根据所述每个网格中的POI的类型和所述待预测网格中POI的类型,计算M个网格中每个网格和待预测网格之间的POI的相似度。
3.根据权利要求1或2所述的方法,其特征在于,所述网格相似度包括M个网格中每个网格和所述待预测网格之间的交通拥堵度相似度;
计算M个网格中每个网格和待预测网格之间的网格相似度,包括:
分别获取M个网格中每个网格的第一交通数据和所述待预测网格的第二交通数据;
分别根据所述第一交通数据和所述第二交通数据,确定M个网格中每个网格的第一交通拥堵度和所述待预测网格的第二交通拥堵度;
根据所述第一交通拥堵度和所述第二交通拥堵度,确定M个网格中每个网格和待预测网格之间的交通拥堵度相似度。
4.根据权利要求3所述的方法,其特征在于,所述网格相似度包括M个网格中每个网格和所述待预测网格之间的用户活跃度相似度;
计算M个网格中每个网格和待预测网格之间的网格相似度,包括:
确定M个网格中每个网格的第一用户数量和待预测网格的第二用户数量;
分别根据所述第一用户数量和所述第二用户数量,计算M个网格中每个网格和待预测网格之间的用户活跃度相似度。
5.根据权利要求1所述的方法,其特征在于,所述根据所述待预测网格中目标时刻对应的气象特征参数和预先训练的时序预测模型,确定所述待预测网格的AQI在不同AQI区间的第二概率值,包括:
分别获取待预测网格中目标时刻对应的气象特征参数、所述目标时刻对应的第三交通拥堵度、所述目标时刻对应的第三用户数量;
根据所述气象特征参数、所述第三交通拥堵度、所述第三用户数量和预先训练的时序预测模型,确定所述待预测网格在目标时刻时的AQI在不同AQI区间的第二概率值。
6.根据权利要求1或5所述的方法,其特征在于,所述根据所述第一概率值和所述第二概率值,确定所述待预测网格的AQI,包括:
计算所述第一概率值和对应区间的第二概率值的乘积,得到不同AQI区间对应的乘积结果;
将最大的乘积结果对应的AQI区间确定为所述待预测网格的AQI。
7.根据权利要求5所述的方法,其特征在于,所述气象特征参数包括如下至少一种:气压、湿度、温度、风速或风向。
8.一种空气质量指数AQI的预测装置,其特征在于,包括:
获取模块,用于获取M个网格的空气质量指数AQI;其中,M为正整数;
计算模块,用于分别计算M个网格中每个网格和待预测网格之间的距离以及网格相似度;所述网格相似度包括M个网格中每个网格和所述待预测网格之间的兴趣点POI的相似度、交通拥堵度相似度和用户活跃度相似度;
确定模块,用于根据所述M个网格的AQI、所述距离、所述网格相似度和预先训练的空间预测模型,确定所述待预测网格的AQI;
所述确定模块,具体用于:
根据所述M个网格的AQI、所述距离、所述网格相似度和预先训练的空间预测模型,确定所述待预测网格的AQI在不同AQI区间的第一概率值;
根据所述待预测网格中目标时刻对应的气象特征参数和预先训练的时序预测模型,确定所述待预测网格的AQI在不同AQI区间的第二概率值;
根据所述第一概率值和所述第二概率值,确定所述待预测网格的AQI。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来实现权利要求1-7任一项所述的方法。
CN201811429242.7A 2018-11-27 2018-11-27 空气质量指数aqi的预测方法和装置 Active CN111222672B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811429242.7A CN111222672B (zh) 2018-11-27 2018-11-27 空气质量指数aqi的预测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811429242.7A CN111222672B (zh) 2018-11-27 2018-11-27 空气质量指数aqi的预测方法和装置

Publications (2)

Publication Number Publication Date
CN111222672A CN111222672A (zh) 2020-06-02
CN111222672B true CN111222672B (zh) 2023-01-31

Family

ID=70830482

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811429242.7A Active CN111222672B (zh) 2018-11-27 2018-11-27 空气质量指数aqi的预测方法和装置

Country Status (1)

Country Link
CN (1) CN111222672B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113837496B (zh) * 2021-11-04 2024-05-14 长春嘉诚信息技术股份有限公司 一种秸秆焚烧对空气质量影响的模型预测方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488317A (zh) * 2014-09-17 2016-04-13 日本电气株式会社 用于预测空气质量的系统和方法
CN106156844A (zh) * 2015-03-23 2016-11-23 日本电气株式会社 用于构建时空神经网络和利用其进行预测的方法和设备
CN108351866A (zh) * 2015-11-12 2018-07-31 国际商业机器公司 超短时空气污染预报

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488317A (zh) * 2014-09-17 2016-04-13 日本电气株式会社 用于预测空气质量的系统和方法
CN106156844A (zh) * 2015-03-23 2016-11-23 日本电气株式会社 用于构建时空神经网络和利用其进行预测的方法和设备
CN108351866A (zh) * 2015-11-12 2018-07-31 国际商业机器公司 超短时空气污染预报

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Spatial prediction based on Third Law of Geography;A‐Xing Zhu 等;《Annals of GIS》;20181019;第24卷(第4期);第225-240页 *
基于城市大数据的细粒度空气质量预测与推测模型研究及应用;蔡韬;《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅰ辑》;20210315(第3期);第B027-574页 *

Also Published As

Publication number Publication date
CN111222672A (zh) 2020-06-02

Similar Documents

Publication Publication Date Title
CN107038478B (zh) 路况预测方法及装置、计算机设备与可读介质
CN111460076B (zh) 驾驶路线熟悉度确定方法、装置、计算机设备和存储介质
CN113769519A (zh) 一种建筑工地的智能降尘控制方法及系统
CN109543907B (zh) 一种复杂地形风资源评估方法及其装置
CN112669190B (zh) 污染源异常排放行为的检测方法、装置及计算机设备
CN109191408B (zh) 快速循环地面气象融合方法、装置及服务器
CN110689055B (zh) 一种顾及格网单元属性分级的跨尺度统计指标空间化方法
CN114896783A (zh) 空气质量改善效果的评估方法和装置
CN111222672B (zh) 空气质量指数aqi的预测方法和装置
CN110210774B (zh) 滑坡风险评价方法及系统
CN113465734B (zh) 一种结构振动的实时估计方法
CN113125635A (zh) 一种大气污染预警方法、装置及可读存储介质
CN114022035A (zh) 一种城市热岛效应内建筑物碳排放评估方法
CN114596709A (zh) 数据处理方法、装置、设备以及存储介质
CN110716998A (zh) 一种精细尺度人口数据空间化方法
CN114118613A (zh) 一种焦化土壤污染空间分布预测优化方法及系统
EP2580772B1 (en) A method computer program and system to analyze mass spectra
CN113705693A (zh) 一种电网雷电预警方法、装置、记录媒体及系统
CN113269805A (zh) 降水事件引导的遥感降水反演训练样本自适应选取方法
CN109376689B (zh) 人群分析方法及装置
CN114546841B (zh) 基于云计算的软件质量评估方法
CN111783883A (zh) 一种异常数据的检测方法及装置
CN115983329A (zh) 空气质量及气象条件的预测方法、装置、设备及存储介质
CN112801156B (zh) 用于人工智能机器学习的业务大数据采集方法及服务器
CN112632469A (zh) 业务交易数据的异常检测方法、装置及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant