CN112765229B - 一种基于多层注意力机制的空气质量推断方法 - Google Patents

一种基于多层注意力机制的空气质量推断方法 Download PDF

Info

Publication number
CN112765229B
CN112765229B CN202011563544.0A CN202011563544A CN112765229B CN 112765229 B CN112765229 B CN 112765229B CN 202011563544 A CN202011563544 A CN 202011563544A CN 112765229 B CN112765229 B CN 112765229B
Authority
CN
China
Prior art keywords
data
air quality
area
layer
time sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011563544.0A
Other languages
English (en)
Other versions
CN112765229A (zh
Inventor
韩启龙
张玉颖
宋洪涛
王也
李丽洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN202011563544.0A priority Critical patent/CN112765229B/zh
Publication of CN112765229A publication Critical patent/CN112765229A/zh
Application granted granted Critical
Publication of CN112765229B publication Critical patent/CN112765229B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0004Gaseous mixtures, e.g. polluted air
    • G01N33/0009General constructional details of gas analysers, e.g. portable test equipment
    • G01N33/0062General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method or the display, e.g. intermittent measurement or digital display
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0004Gaseous mixtures, e.g. polluted air
    • G01N33/0009General constructional details of gas analysers, e.g. portable test equipment
    • G01N33/0062General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method or the display, e.g. intermittent measurement or digital display
    • G01N33/0068General constructional details of gas analysers, e.g. portable test equipment concerning the measuring method or the display, e.g. intermittent measurement or digital display using a computer specifically programmed
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Educational Administration (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Food Science & Technology (AREA)
  • Fuzzy Systems (AREA)
  • Pathology (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Marketing (AREA)
  • Combustion & Propulsion (AREA)

Abstract

本发明公开了一种基于多层注意力机制的空气质量推断方法,属于环境空气质量监测领域。本发明将城市划分成大小相同的网格,每个网格的空气质量受到相邻网格区域的影响,为了推断未部署空气质量监测传感器区域准确的空气质量,利用待推断区域、待推断区域周围的网格区域以及已部署传感器区域的时序数据和非时序数据,通过多层注意力机制,自适应地对不同的站点、网格区域、历史时间片数据赋予不同的权值,大大提升模型对空气质量推断的精度。

Description

一种基于多层注意力机制的空气质量推断方法
技术领域
本发明涉及一种基于多层注意力机制的空气质量推断方法,属于环境空气质量监测领域。
背景技术
由于城市空气污染对人类健康的不利影响,其这些年备受关注,因此准确知道某区域的准确的空气质量至关重要。现阶段利用神经网络对城市未来的空气质量的预测已经非常成熟且准确,但有绝大多数的研究只是针对已经部署传感器监测的空间区域进行处理(预测、实时展示、分析等),由于受实际部署的限制,通常传感器覆盖粒度较粗,对其临近区域效果较好,但对距离部署站点较远的区域,无法真实反映其实际情况。本发明将城市划分成大小相同的网格,每个网格的空气质量受相邻区域网格的影响,为了推断未部署空气质量监测传感器区域准确的空气质量,利用待推断区域、待推断区域周围的网格区域以及已部署传感器区域的时序数据和非时序数据,通过多层注意力机制,自适应的对不同的站点、网格区域、历史时间片数据进行调整,提升模型对空气质量推断的表现。
发明内容
本发明的目的是提出一种基于多层注意力机制的空气质量推断方法,以解决现有技术中影响空气质量因素考虑不充分,特征提取采用经验主义抽取和人工定义,传统的神经网络没有考虑到局部空间特征的问题。
一种基于多层注意力机制的空气质量推断方法,所述空气质量推断方法包括以下步骤:
S100、将城市划分为大小相同的网格区域,对于网格内没有部署空气质量监测传感器的区域划分为待推断区域,待推断区域的周围八个网格区域作为局部区域,已部署空气质量监测传感器的区域作为全局区域;
S200、获取影响空气质量数据相关的时序数据和非时序数据,所述获取影响空气质量数据相关的时序数据包括:历史空气质量数据、气象数据和天气预报数据,所述空气质量的非时序数据包括:城市的路网数据和城市兴趣点数据;
S300、对时序数据和非时序数据进行数据处理,对于时序数据,去除会影响模型推断能力的部分突变值,对于时序数据的缺失值采用滑动窗口进行填充,对于非时序数据的缺失值采用平均值进行填充;
S400、构建多层注意力机制神经网络模型,所述多层注意力机制神经网络模型包括混合注意力层、空间注意力层、融合层和推断层;
S500、将处理完的数据输入到多层注意力机制神经网络模型中,进行训练;
S600、对待推断区域进行推断。
进一步的,S100具体包括以下步骤:
S110、将城市进行网格区域划分,将城市区域划分为边长为c的相互不相交的正方形网格Ri,每个网格区域的周围八个相邻的网格区域作为局部空间区域,其他已经部署传感器的区域作为全局区域;
S120、将每个网格区域的中心点的经纬度作为网格坐标,将所述网格坐标作为待推断的基本单元。
进一步的,S200具体包括以下步骤:
S210、采用爬虫程序定时对天气网的天气数据进行爬取,获得城市空气质量数据,将爬取得到的历史空气质量数据持久化存储到数据库中,记网格区域Ri的空气质量数据为
Figure BDA0002859952770000021
S220、用爬虫程序定时对中国天气网的天气数据进行爬取,获取城市的气象数据,将爬取得到的气象数据持久化至数据库存储,所述气象数据包括历史气象数据和实时气象数据,所述气象数据具体为:温度、湿度、风速以及风向,记历史时间网格区域Ri的气象数据为历史气象数据
Figure BDA0002859952770000022
S230、采用爬虫程序定时对天气网的天气数据进行爬取,获取天气预测数据,将爬取得到的天气预测数据持久化至数据库存储,记t时刻网格区域Ri天气预测数据为WFt Ri
S240、获取城市的路网结构数据,所述路网结构数据包括道路的条数、长度和类别,记网格区域Ri的路网结构数据为RoadRi
S250、获取城市的兴趣点数据,所述兴趣点数据包括特定点的集合和属性集,所述集合包括学校、医院和商场,所述属性集包括名称、类别和坐标,记网格区域Ri的城市兴趣点数据为POIRi
进一步的,S300具体包括以下步骤:
S310、采用统计学中的pettitt算法,对空气质量中的时序突变值进行检测并且进行去除,采用相邻48小时的时间片的平均值进行填充;
S320、对于时序数据的缺失值,采用该时刻当日的平均值进行填充;
S330、对于非时序数据的缺失值,采用该数据类型的众数进行填充。
进一步的,S400具体包括以下步骤:
S410、所述混合注意力层,该层包括时间注意力和全连接神经网络两个部分,对于时序数据,将其输入到LSTM中,并且通过注意力层对各个LSTM的不同的隐藏层进行加权作为最终时序数据的输出值;对于非时序数据,将其输入到全连接神经网络中,最后的输出和时间注意力的输入进行融合;
S420、所述空间注意力层,该层包括局部空间注意力层和全局空间注意力层,局部空间注意力层用于对局部空间区域特征进行输入,并且通过待推断区域经过混合注意力层得到的特征对局部空间区域特征进行打分并且加权求和作为局部空间区域的特征;相似的,全局空间注意力层用于对已经部署空气监测站点区域的特征进行输入,并且通过待推断区域经过混合注意力层得到的特征对全局空间区域进行打分并且加权求和作为全局空间区域的特征;
S430、所述融合层,该层将经过空间注意力层的局部空间特征和全局空间特征以及待推断区域的特征输入到全连接层;
S440、所述推断层,该层将融合层的数据作为空气质量推断的输入,将输出值也就是对该区域的空气质量推断值,通过损失函数得到与真实值的误差,将误差经过模型反向传播,不断迭代,调整模型参数,得到训练后的神经网络模型。
本发明的主要优点是:本发明的一种基于多层注意力机制的空气质量推断方法,针对现存模型只针对已部署空间检测站点的研究,增加了对待推断区域周围网格区域的数据,并且通过注意力机制可以自适应地调整对各个区域的不同重要程度,提高模型的表现能力,针对历史时间片也采用注意力机制,对历史数据进行调整不同时间的重要程度,这对于空气质量这种涉及到大量时序数据的场景具有很好的效果。
本发明能够为城市内进行细粒度空气质量推断,为政府环境治理提供科学有效且精确地支持。
附图说明
图1是一种基于多层注意力机制的空气质量推断方法的方法流程图;
图2是基于多层注意力机制的空气质量推断模型框架图;
图3是时间注意力层模型框架图;
图4是城市网格区域划分图;
图5是局部空间区域图。
具体实施方式
下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
以下为本发明的一种基于多层注意力机制的空气质量推断方法的一实施例,用以对本发明进行详细说明。
具体实施例一:
按照图1所示,本发明提供一种基于多层注意力机制的空气质量推方法,包括以下步骤:
S100、如图2所示,将城市划分为大小相同的网格区域,对于网格内没有部署空气质量监测传感器的区域划分为待推断区域,待推断区域的周围相邻的八个网格区域作为局部空间区域记作,已部署空气质量监测传感器的区域作为全局空间区域标记作Si;
S110、将城市进行网格区域划分,将城市区域划分为边长为c的相互不相交的正方形网格Ri,已经部署传感器的区域作为全局区域每个网格区域的周围八个相邻的网格区域作为局部空间区域(如图3所示);
S120、将每个网格区域的中心点的经纬度作为网格坐标,所述网格坐标作为待推断空气质量的基本单元。
S200、获取影响空气质量数据相关的时序数据和非时序数据,所述获取影响空气质量数据相关的时序数据包括:历史空气质量数据、气象数据、天气预报数据,所述空气质量的非时序数据包括:城市的路网数据和城市的兴趣点数据;
S210、采用爬虫程序定时对中国天气网的天气数据进行爬取,获得城市空气质量数据,将爬取得到的历史空气质量数据持久化存储到数据库中,记网格区域Ri的空气质量数据为
Figure BDA0002859952770000051
S220、用爬虫程序定时对中国天气网的天气数据进行爬取,获取城市的气象数
据,将爬取得到的气象数据持久化至数据库存储,所述气象数据包括历史气象数据和实时气象数据,所述气象数据具体为:温度、湿度、风速以及风向,记t时刻网格区域Ri的实时气数据为历史气象数据
Figure BDA0002859952770000052
S230、采用爬虫程序定时对中国天气网的天气数据进行爬取,获取天气预测数据,将爬取得到的天气预测数据持久化至数据库存储,记t时刻网格区域Ri天气预测数据为WFt Ri
S240、通过openstreetmap网站,根据限定城市及路网级别,获取城市的路网结构数据,路网属性分为道路的条数、长度和类别。网格区域Ri的路网结构数据RoadRi
S250、通过openstreetmap网站,获取城市的兴趣点数据,所述兴趣点数据包括特定点的集合和属性集,所述集合包括学校、医院和商场,所述属性集包括名称、类别和坐标,记网格区域Ri的城市兴趣点数据为POIRi
S300、对时序数据和非时序数据进行数据清洗。
S310、对于时序数据而言,某些突变值会影响模型的推断能力,需要进行去除。本文采用pettitt算法,对空气质量中的时序突变值进行检测并且进行去除,采用突变时间前三个小时的平均值作为该突变时刻的值。
S320、对于时序数据的缺失值,采用该时刻当日的平均值进行填充;
S330、对于非时序数据的缺失值,采用该数据类型的众数进行填充。
S400、如图4所示,整个网络构建多层注意力机制神经网络模型,模型主要包括混合注意力层、空间注意力层、融合层、推测层;
S410、混合注意力层,该层包括时间注意力和全连接神经网络两个部分,对于时序数据,如图5所示,将时序数据输入到LSTM中,并且通过注意力层对各个LSTM的不同的隐藏层进行加权作为最终时序数据的输出值;对于非时序数据,将其输入到全连接神经网络中,最后的输出和时间注意力的输入进行融合;
S420、空间注意力层,该层包括局部空间注意力层和全局空间注意力层,局部空间注意力层主要是对待推断区域周围八个网格区域特征进行输入,并且通过待推断区域经过混合注意力层得到的特征对周围八个网格区域(局部空间区域)特征进行打分并且加权求和作为局部空间区域的特征;相似的,全局空间注意力层主要是对已经部署空气监测站点区域(全局空间区域)的特征进行输入,并且通过待推断区域经过混合注意力层得到的特征对全局空间区域进行打分并且加权求和作为全局空间区域的特征;
S430、融合层,该层将经过空间注意力层的局部空间特征和全局空间特征以及待推断区域的特征进行输入,将输入到全连接层,最后输出;
S440、推断层,该层将融合层的数据作为空气质量推断的数据,通过均方根误差函数对真实值和推断值的误差得到损失函数,以训练模型。
S500、将处理完的数据输入到多层注意力机制神经网络模型中,进行训练;
S600、利用训练完的模型对待推断区域推断,得到待推断区域的空气质量值。
以上所述仅是一种基于多层注意力机制的空气质量推断方法的优选实施方式,一种基于多层注意力机制的空气质量推断方法的保护范围并不仅局限于上述实施例,凡属于该思路下的技术方案均为本发明的保护范围。应当指出,对于本领域的技术人员来说,在不脱离本发明原理前提下的若干改进和变化,这些改进和变化也应视为本发明的保护范围。

Claims (4)

1.一种基于多层注意力机制的空气质量推断方法,其特征在于,所述空气质量推断方法包括以下步骤:
S100、将城市划分为大小相同的网格区域,对于网格内没有部署空气质量监测传感器的区域划分为待推断区域,待推断区域的周围八个网格区域作为局部区域,已部署空气质量监测传感器的区域作为全局区域;
S200、获取影响空气质量数据相关的时序数据和非时序数据,所述获取影响空气质量数据相关的时序数据包括:历史空气质量数据、气象数据和天气预报数据,所述空气质量的非时序数据包括:城市的路网数据和城市兴趣点数据;
S300、对时序数据和非时序数据进行数据处理,对于时序数据,去除会影响模型推断能力的部分突变值,对于时序数据的缺失值采用滑动窗口进行填充,对于非时序数据的缺失值采用平均值进行填充;
S400、构建多层注意力机制神经网络模型,所述多层注意力机制神经网络模型包括混合注意力层、空间注意力层、融合层和推断层;
S500、将处理完的数据输入到多层注意力机制神经网络模型中,进行训练;
S600、对待推断区域进行推断,
其中,S400具体包括以下步骤:
S410、所述混合注意力层,该层包括时间注意力和全连接神经网络两个部分,对于时序数据,将其输入到LSTM中,并且通过注意力层对各个LSTM的不同的隐藏层进行加权作为最终时序数据的输出值;对于非时序数据,将其输入到全连接神经网络中,最后的输出和时间注意力的输入进行融合;
S420、所述空间注意力层,该层包括局部空间注意力层和全局空间注意力层,局部空间注意力层用于对局部空间区域特征进行输入,并且通过待推断区域经过混合注意力层得到的特征对局部空间区域特征进行打分并且加权求和作为局部空间区域的特征;全局空间注意力层用于对已经部署空气监测站点区域的特征进行输入,并且通过待推断区域经过混合注意力层得到的特征对全局空间区域进行打分并且加权求和作为全局空间区域的特征;
S430、所述融合层,该层将经过空间注意力层的局部空间特征和全局空间特征以及待推断区域的特征输入到全连接层;
S440、所述推断层,该层将融合层的数据作为空气质量推断的输入,将输出值也就是对该区域的空气质量推断值,通过损失函数得到与真实值的误差,将误差经过模型反向传播,不断迭代,调整模型参数,得到训练后的神经网络模型。
2.根据权利要求1所述的一种基于多层注意力机制的空气质量推断方法,其特征在于,S100具体包括以下步骤:
S110、将城市进行网格区域划分,将城市区域划分为边长为c的相互不相交的正方形网格Ri,每个网格区域的周围八个相邻的网格区域作为局部空间区域,其他已经部署传感器的区域作为全局区域;
S120、将每个网格区域的中心点的经纬度作为网格坐标,将所述网格坐标作为待推断的基本单元。
3.根据权利要求1所述的一种基于多层注意力机制的空气质量推断方法,其特征在于,S200具体包括以下步骤:
S210、采用爬虫程序定时对天气网的天气数据进行爬取,获得城市空气质量数据,将爬取得到的历史空气质量数据持久化存储到数据库中,记网格区域Ri的空气质量数据为
Figure FDA0003734113670000021
S220、用爬虫程序定时对中国天气网的天气数据进行爬取,获取城市的气象数据,将爬取得到的气象数据持久化至数据库存储,所述气象数据包括历史气象数据和实时气象数据,所述气象数据具体为:温度、湿度、风速以及风向,记历史时间网格区域Ri的气象数据为历史气象数据
Figure FDA0003734113670000022
S230、采用爬虫程序定时对天气网的天气数据进行爬取,获取天气预测数据,将爬取得到的天气预测数据持久化至数据库存储,记t时刻网格区域Ri天气预测数据为WFt Ri
S240、获取城市的路网结构数据,所述路网结构数据包括道路的条数、长度和类别,记网格区域Ri的路网结构数据为RoadRi
S250、获取城市的兴趣点数据,所述兴趣点数据包括特定点的集合和属性集,所述集合包括学校、医院和商场,所述属性集包括名称、类别和坐标,记网格区域Ri的城市兴趣点数据为POIRi
4.一种基于多层注意力机制的空气质量推断方法,其特征在于,所述空气质量推断方法包括以下步骤:
S100、将城市划分为大小相同的网格区域,对于网格内没有部署空气质量监测传感器的区域划分为待推断区域,待推断区域的周围八个网格区域作为局部区域,已部署空气质量监测传感器的区域作为全局区域;
S200、获取影响空气质量数据相关的时序数据和非时序数据,所述获取影响空气质量数据相关的时序数据包括:历史空气质量数据、气象数据和天气预报数据,所述空气质量的非时序数据包括:城市的路网数据和城市兴趣点数据;
S310、采用统计学中的pettitt算法,对空气质量中的时序突变值进行检测并且进行去除,采用相邻48小时的时间片的平均值进行填充;
S320、对于时序数据的缺失值,采用当前时刻当日的平均值进行填充;
S330、对于非时序数据的缺失值,采用所述非时序数据类型的众数进行填充;
S400、构建多层注意力机制神经网络模型,所述多层注意力机制神经网络模型包括混合注意力层、空间注意力层、融合层和推断层;
S500、将处理完的数据输入到多层注意力机制神经网络模型中,进行训练;
S600、对待推断区域进行推断,
其中,S400具体包括以下步骤:
S410、所述混合注意力层,该层包括时间注意力和全连接神经网络两个部分,对于时序数据,将其输入到LSTM中,并且通过注意力层对各个LSTM的不同的隐藏层进行加权作为最终时序数据的输出值;对于非时序数据,将其输入到全连接神经网络中,最后的输出和时间注意力的输入进行融合;
S420、所述空间注意力层,该层包括局部空间注意力层和全局空间注意力层,局部空间注意力层用于对局部空间区域特征进行输入,并且通过待推断区域经过混合注意力层得到的特征对局部空间区域特征进行打分并且加权求和作为局部空间区域的特征;全局空间注意力层用于对已经部署空气监测站点区域的特征进行输入,并且通过待推断区域经过混合注意力层得到的特征对全局空间区域进行打分并且加权求和作为全局空间区域的特征;
S430、所述融合层,该层将经过空间注意力层的局部空间特征和全局空间特征以及待推断区域的特征输入到全连接层;
S440、所述推断层,该层将融合层的数据作为空气质量推断的输入,将输出值也就是对该区域的空气质量推断值,通过损失函数得到与真实值的误差,将误差经过模型反向传播,不断迭代,调整模型参数,得到训练后的神经网络模型。
CN202011563544.0A 2020-12-25 2020-12-25 一种基于多层注意力机制的空气质量推断方法 Active CN112765229B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011563544.0A CN112765229B (zh) 2020-12-25 2020-12-25 一种基于多层注意力机制的空气质量推断方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011563544.0A CN112765229B (zh) 2020-12-25 2020-12-25 一种基于多层注意力机制的空气质量推断方法

Publications (2)

Publication Number Publication Date
CN112765229A CN112765229A (zh) 2021-05-07
CN112765229B true CN112765229B (zh) 2022-08-16

Family

ID=75694500

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011563544.0A Active CN112765229B (zh) 2020-12-25 2020-12-25 一种基于多层注意力机制的空气质量推断方法

Country Status (1)

Country Link
CN (1) CN112765229B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114994294B (zh) * 2022-05-20 2023-04-18 燕山大学 基于注意力与窗口选通机制的水泥熟料游离钙软测量方法
JP7381672B1 (ja) 2022-08-04 2023-11-15 エヌ・ティ・ティ・コミュニケーションズ株式会社 情報処理装置、情報処理方法、及び情報処理プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018214060A1 (zh) * 2017-05-24 2018-11-29 北京质享科技有限公司 一种城市小尺度空气质量指数预测方法与系统
CA3032182A1 (en) * 2018-01-31 2019-07-31 Royal Bank Of Canada Pre-training neural netwoks with human demonstrations for deep reinforcement learning
CN109063908B (zh) * 2018-07-30 2020-10-27 浙江鸿程计算机系统有限公司 一种基于深度多任务学习的城市aqi预测与空间细粒度aqi等级估计方法
CN110377913B (zh) * 2019-07-24 2022-08-30 腾讯科技(深圳)有限公司 一种情感分析方法及其装置、电子设备和存储介质
CN110598953A (zh) * 2019-09-23 2019-12-20 哈尔滨工程大学 一种时空相关的空气质量预测方法
CN111161535B (zh) * 2019-12-23 2021-03-02 山东大学 基于注意力机制的图神经网络交通流量预测方法及系统
CN111461410B (zh) * 2020-03-10 2022-08-26 北京邮电大学 一种基于迁移学习的空气质量的预测方法及装置

Also Published As

Publication number Publication date
CN112765229A (zh) 2021-05-07

Similar Documents

Publication Publication Date Title
CN112905560B (zh) 一种多源时空大数据深度融合的空气污染预测方法
CN108227041B (zh) 基于站点实测数据和模式结果的水平能见度预报方法
CN112765229B (zh) 一种基于多层注意力机制的空气质量推断方法
CN110009037B (zh) 一种基于物理信息耦合的工程风速短时预测方法及系统
CN113222283B (zh) 一种基于数字孪生的山洪预报预警方法及系统
JP4719893B2 (ja) 制御装置、制御方法、及びそのプログラム
CN113553764B (zh) 一种基于深度学习网络的山火预测方法
CN112016831A (zh) 一种基于ai智能预报的城市内涝落区的识别方法
CN112287294A (zh) 一种基于深度学习的时空双向土壤含水量插值方法
CN109978275B (zh) 一种混合cfd和深度学习的极端大风风速预测方法及系统
CN114240000A (zh) 一种基于时空图卷积网络的空气质量预测方法
CN112884243A (zh) 一种基于深度学习和贝叶斯模型的空气质量分析预测方法
CN114049545B (zh) 一种基于点云体素的台风定强方法、系统、设备及介质
CN110533239A (zh) 一种智慧城市空气品质高精度测量方法
CN116596321B (zh) 基于神经网络的建筑风险监测与评估方法和系统
CN115422766B (zh) 一种基于数字孪生技术的泥石流监测方法及系统
CN114694767B (zh) 基于时空图常微分方程网络的pm2.5浓度预测方法
CN115629160A (zh) 一种基于时空图的空气污染物浓度预测方法及系统
CN115100819B (zh) 基于大数据分析的滑坡灾害预警方法、装置及电子设备
CN117649156B (zh) 高城镇化河网全自动水环境监测方法及系统
Lo et al. Recurrent learning on PM 2.5 prediction based on clustered airbox dataset
CN115420690A (zh) 近地表痕量气体浓度反演模型及反演方法
Zhao et al. Airnet: a machine learning dataset for air quality forecasting
CN115544706A (zh) 一种小波和XGBoost模型集成的大气细颗粒物浓度估算方法
CN117219183A (zh) 多云雨地区的高覆盖度近地面no2浓度估算方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant