CN111612055A - 天气形势的分型方法、空气污染状况的预测方法及装置 - Google Patents

天气形势的分型方法、空气污染状况的预测方法及装置 Download PDF

Info

Publication number
CN111612055A
CN111612055A CN202010414950.4A CN202010414950A CN111612055A CN 111612055 A CN111612055 A CN 111612055A CN 202010414950 A CN202010414950 A CN 202010414950A CN 111612055 A CN111612055 A CN 111612055A
Authority
CN
China
Prior art keywords
typing
data
clustering
clustered
weather
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010414950.4A
Other languages
English (en)
Other versions
CN111612055B (zh
Inventor
任华荣
秦东明
孙明生
易志安
李诗瑶
马培翃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zhongke Sanqing Environmental Technology Co ltd
3Clear Technology Co Ltd
Original Assignee
Beijing Zhongke Sanqing Environmental Technology Co ltd
3Clear Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zhongke Sanqing Environmental Technology Co ltd, 3Clear Technology Co Ltd filed Critical Beijing Zhongke Sanqing Environmental Technology Co ltd
Priority to CN202010414950.4A priority Critical patent/CN111612055B/zh
Publication of CN111612055A publication Critical patent/CN111612055A/zh
Application granted granted Critical
Publication of CN111612055B publication Critical patent/CN111612055B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23211Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with adaptive number of clusters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种天气形势的分型方法、空气污染状况的预测方法及装置。天气形势的分型方法包括:从历史气象数据中选取分型区域的分型因子,作为待聚类数据;对所述待聚类数据进行滤波;对滤波后的待聚类数据进行聚类,建立分型模型;迭代更新所述分型模型;利用分型模型对预报天气形势进行分型。本申请提供的天气形势的分型方法,通过更合理的方式确定初始簇中心,可有效减少聚类误差,各类间相似度增加,不同类之间差异明显;改进相似度度量指标,通过计算各行、各列的相似度,充分考虑了局部差异情况,贴合气象场分布特征,分型结果实用性增强、分型结果精确。

Description

天气形势的分型方法、空气污染状况的预测方法及装置
技术领域
本申请涉及环境监测技术领域,具体涉及一种天气形势的分型方法、空气污染状况的预测方法及装置。
背景技术
污染事件和大尺度天气形势密切相关,天气形势演变决定了污染物的空间分布及随时间变化特征,直接影响污染过程的持续时间、污染程度。污染天气形势分析总结对于理解天气系统的特征和建立预报思路非常重要,开展污染天气形势的分型研究,识别典型的污染天气形势,分析不同天气型下污染物传输扩散情况,对于开展空气质量预警预报具有重要意义。
现有技术中,对天气形势的分型方法常采用K-means聚类法,在选取初始簇中心时采取随机法生成,初始簇中心在后续的聚类算法中具有非常重要的意义,目前的随机法生成的簇中心不能代表样本情况。在聚类算法中用于判别样本与簇中心相似度的度量方法考虑的是两者的整体相似性,而在现有技术的天气形势分型研究中,局部空间范围气象场分布的差异未加以考虑。
发明内容
本申请的目的是提供一种天气形势的分型方法、空气污染状况的预测方法及装置。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
根据本申请实施例的一个方面,提供一种天气形势的分型方法,包括:
从历史气象数据中选取分型区域的分型因子,作为待聚类数据;
对所述待聚类数据进行滤波;
对滤波后的待聚类数据进行聚类,建立分型模型;
迭代更新所述分型模型;
利用更新完成的分型模型对预报天气形势进行分型。
进一步地,所述从历史气象数据中选取分型因子包括:从历史气象数据中选取每日若干时次的高度场、海平面气压场作为分型因子。
进一步地,所述对所述待聚类数据进行滤波,包括:通过高斯滤波法对所述待聚类数据进行平滑,去除日变化,得到滤波后的待聚类数据。
进一步地,所述对滤波后的待聚类数据进行聚类,建立分型模型,包括:
计算所述滤波后的待聚类数据中的每个样本与其他样本之间的距离;
根据所述距离找出各个样本的相似样本;
找出具有最多相似样本的中心样本,由所述中心样本及其所有相似样本组成一个簇,从而完成第一次分簇;
继续对剩余的样本进行分簇,直至获取初始若干个聚类中心;
计算各个所述簇的聚类中心,得到一组初始聚类中心,由所述初始聚类中心构成分型模型;其中,每一所述聚类中心对应一种天气型。
进一步地,所述迭代更新所述分型模型,包括:
A)重新计算每个样本与各聚类中心的列距离、行距离和整体距离;
B)计算每个样本与各聚类中心的列距离相关系数、行距离相关系数和整体距离的相关系数;
C)增加所述行距离、所述列距离、所述行距离相关系数和所述列距离相关系数所占的权重,计算每个样本与各聚类中心的相似度度量;
D)根据所述相似度度量将每个样本进行重新分簇;
E)计算重新分簇后的各簇的聚类中心;
重复步骤A)至步骤E),直到聚类中心不再变化,聚类结束,得到优化完成的分型模型。
进一步地,所述利用更新完成的分型模型对预报天气形势进行分型,包括:
依据预报区域未来若干天的气象场,提取高度场、海平面气压场数据,插值到分型区域的经纬线网格点上;
将插值后得到的分型区域的分型因子输入所述优化完成的分型模型中,得到未来若干天的天气形势分型结果。
根据本申请实施例的另一个方面,提供一种空气污染状况的预测方法,其特征在于,包括上述的方法;以及
根据所述优化完成的分型模型与历史空气污染数据,确定天气型与空气污染状况之间的关联关系;
根据未来的天气形势分型结果和所述关联关系,预测未来若干天的空气污染状况。
进一步地,所述空气污染状况包括首要污染物和污染等级。
根据本申请实施例的另一个方面,提供一种天气形势的分型装置,包括:
选择模块,用于从历史气象数据中选取分型区域的分型因子,作为待聚类数据;
滤波模块,用于对所述待聚类数据进行滤波;
聚类模块,用于对滤波后的待聚类数据进行聚类,建立分型模型;
优化模块,用于迭代更新所述分型模型;
分型模块,用于利用更新完成的分型模型对预报天气形势进行分型。
根据本申请实施例的另一个方面,提供一种空气污染状况的预测装置,其特征在于,包括上述的天气形势的分型装置,以及
关联模块,用于根据所述优化完成的分型模型与历史空气污染数据,确定天气型与空气污染状况之间的关联关系;
预测模块,用于根据未来的天气形势分型结果和所述关联关系,预测未来若干天的空气污染状况。
根据本申请实施例的另一个方面,提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现上述的方法。
根据本申请实施例的另一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以实现上述的方法。
本申请实施例的其中一个方面提供的技术方案可以包括以下有益效果:
本申请实施例提供的天气形势的分型方法,通过更合理的方式确定初始簇中心,簇中心能很好地代表样本情况,可有效减少聚类误差,各类间相似度增加,不同类之间差异明显;改进相似度度量指标,通过计算各行、各列的相似度,充分考虑了局部空间范围气象场分布差异情况,贴合气象场分布特征,分型结果实用性增强、分型结果精确。
本申请的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者,部分特征和优点可以从说明书中推知或毫无疑义地确定,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请的一个实施例的天气形势的分型方法流程图;
图2示出了本申请一实施方式中的9种天气型850hPa高度场分布(dagpm)图;
图3示出了本申请一实施方式中的9种天气型海平面气压分布(hPa)图;
图4示出了本申请的一个实施例提供的一种天气形势的分型装置结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,下面结合附图和具体实施例对本申请做进一步说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
如图1所示,本申请的一个实施例提供了一种天气形势的分型方法,基于改进的K-means原理实现,具体步骤包括:
步骤一:从历史气象数据中选取分型区域的分型因子,作为待聚类数据;所有待聚类数据组成待聚类数据集。
下载一段时间内的NCEP FNL(National Centers for EnvironmentalPrediction Final Operational Global Analysis data)全球气象再分析资料作为历史气象数据,从中选取每日4个时次的850hPa高度场、海平面气压场作为分型因子,选择合适的空间范围作为分型区域。分型区域的分型因子作为待聚类数据,构成待聚类数据集。待聚类数据为矩阵。
具体地,下载2016年-2018年9-11月首要污染物为PM2.5和O3每日4个时次(02/08/14/20时)的FNL再分析资料,将整个分型区域划分为1°×1°的经纬度网格,分型区域为100°E-130°E、20°N-50°N。由于地面污染物浓度主要受地面气压场影响,而850hPa高度场对于地面场具有引导作用,因此选用850hPa高度场、海平面气压场作为分型因子。
步骤二:对待聚类数据进行滤波,消除时间尺度变化。
气象要素的时间序列变化中包含一些时间尺度变化,通常需要去除某些频率成分,本实施例通过高斯滤波法对待聚类数据进行平滑,去除日变化。
首先,依据高斯公式
Figure BDA0002494648430000051
其中u代表中间数据的位置,一般取0;x代表该数据距离中间数的距离,σ代表高斯分布曲线的宽度,计算各参与平滑项权重,权重系数遵从高斯分布,即越靠近中心权重越大。再依据各项权重系数,对待聚类数据进行平滑,即平滑处理后的数据
Figure BDA0002494648430000052
(wk为权重系数,N代表用于平滑的数据长度的半径,y代表平滑数据,下标代表数据的位置序号),
得到滤波后的待聚类数据,用于后续天气形势分型。
具体地,在本实施例中采用5点高斯滤波法,即各项系数权重分布遵从高斯分布。根据高斯公式计算各项系数,本实施例取σ=1,则中间数的系数为
Figure BDA0002494648430000061
距离中间数1个距离的左右2个位置的系数为
Figure BDA0002494648430000062
距离中间数2个距离的左右2个位置的系数为
Figure BDA0002494648430000063
其次计算各项权重系数,即
f′(±)=0.40,f′(±)=0.25,f′(±)=0.05;
最后,求算加权求和值,即
yi′=0.05*yi-2+0.25*yi-1+0.4*yi+0.25*yi+1+0.05*yi+2
使用MATLAB对待聚类数据进行高斯滤波处理。
滤波后的待聚类数据为一系列n行m列的n*m矩阵,该数据集中包括多个样本,n与m均为正整数,分别代表行数与列数。
步骤三:针对滤波后的待聚类数据进行聚类,建立分型模型。
针对滤波后得到的n*m矩阵,分别计算每个矩阵样本与其他矩阵样本之间的距离,即
Figure BDA0002494648430000064
其中,y1和y2分别代表一个样本,j和i分别代表样本在矩阵中的行数和列数;
当d小于某一设定阈值时即认为这两个样本相似,例如可以设定阈值0.7。
根据计算结果,通过计算找到具有最多相似样本的样本,该具有最多相似样本的样本可称之为中心样本,该中心样本及其所有相似样本组成一个簇,计算该簇的平均质心,即
Figure BDA0002494648430000065
(t为该型样本数量),
得到第一个簇中心(簇中心即聚类中心)。
之后,排除已经分到簇中的样本,针对剩余的样本进行上述分簇处理,依次找出第二个簇中心、第三个簇中心…第K-1个簇中心,最后一组作为第K个簇中心,得到一组共K个初始聚类中心(簇中心即聚类中心),即分型模型。每一聚类中心对应一个天气型。
步骤四:迭代更新分型模型,直至各簇中的聚类中心不再变化为止,得到更新完成的分型模型。
具体地,不断调整各聚类中心,直至聚类中心不再变化为止,得到优化完成的分型模型。优化完成的分型模型包括天气形势分型结果。天气形势分型结果包括K个天气型,每一个聚类中心对应一个天气型。其中K可以是预先设定的值。
具体地,步骤四包括以下步骤:
步骤(1):重新计算每个样本与各簇聚类中心的距离,该距离包括各列距离、各行距离和整体距离。每个样本即每个时次的850hPa高度场数据和海平面气压场数据。
重新计算每个样本与聚类中心的距离,包括
计算每个样本与聚类中心的列距离
Figure BDA0002494648430000071
计算每个样本与聚类中心的行距离
Figure BDA0002494648430000072
计算每个样本与聚类中心的整体距离
Figure BDA0002494648430000073
步骤(2):计算每个样本与聚类中心的列距离相关系数、每个样本与聚类中心的行距离相关系数和每个样本与聚类中心的整体距离的相关系数。
列距离相关系数的计算公式为
Figure BDA0002494648430000074
行距离相关系数计算公式为
Figure BDA0002494648430000081
整体距离的相关系数计算公式为
Figure BDA0002494648430000082
步骤(3):增加行距离、列距离、行距离相关系数和列距离相关系数所占的权重,计算相似度度量。
相似度度量的计算公式为
Figure BDA0002494648430000083
Figure BDA0002494648430000084
相似度度量用于判断样本与聚类中心相似度。
步骤(4):当S取最小值时,则该样本与对应簇聚类中心最相似,将该样本归为该簇。这样将得到一组新的聚类结果,再计算新的聚类中心。
步骤(5):重复步骤(1)至步骤(4),直到聚类中心不再变化,聚类结束,得到更新完成的分型模型;更新完成的分型模型包括天气形势分型结果,天气形势分型结果包括K种天气型。
步骤五:利用更新完成的分型模型对预报天气形势进行分型。
具体地,依据中尺度数值天气预报模式WRF(weather research report)预报研究区域未来7天的气象场,提取850hPa高度场、海平面气压场数据,插值到分型区域的经纬线网格点上。
将经过插值后得到的分型区域的分型因子输入分型模型中,得到未来7天的天气形势分型结果。
具体地利用新一代中尺度数值预报模式WRF预报研究区域未来7天气象场,提取每个时次850hPa高度场、海平面气压场数据,插值到1°×1°经纬度网格点。使用最小距离法将未来一周天气形势进行分型。
本申请实施例采用新的方法步骤确定簇中心,找出具有最多相似样本的中心样本,中心样本及其所有相似样本组成一个簇,然后计算出该簇的质心作为初始聚类中心;改进了判断相似度的计算方法,通过计算行距离、列距离、相关关系以及整体的距离、相关关系,综合评估样本与簇中心的相似度。
本申请实施例提供的天气形势的分型方法,通过更合理的方式确定初始簇中心,簇中心能很好地代表样本情况,可有效减少聚类误差,各类间相似度增加,不同类之间差异明显;改进相似度度量指标,通过计算各行、各列的相似度,充分考虑了局部空间范围气象场分布差异情况,贴合气象场分布特征,分型结果实用性增强、分型结果精确。
本申请的另一个实施例提供了一种空气污染状况的预测方法,包括步骤一-步骤五;以及
步骤六:根据所述优化完成的分型模型与历史空气污染数据,确定天气型与空气污染状况之间的关联关系;空气污染状况包括首要污染物和污染等级。
具体地,依据天气形势分型结果绘制各类天气型海平面气压场、850hPa高度场分布图,总结各类天气型流场特征,气象要素分布变化情况,掌握不同天气型之间的分布和差异。结合污染数据,总结确定天气型与空气污染状况之间的关联关系。空气污染状况包括污染型与污染等级两个指标。表1列举了天气型与污染型之间的关联关系。表2列举了天气型与污染等级之间的关联关系。天气型与空气污染状况之间的关联关系可以根据优化完成的分型模型与历史空气污染数据进行确定。例如,根据首污日数多少来确定污染型,如表1中所示,天气型1所对应的PM2.5首污日数为19天,远远大于O3首污日数,所以确定天气型1对应的污染型为PM2.5型;天气型5所对应的PM2.5首污日数为2天,远远小于O3首污日数12天,所以确定天气型1对应的污染型为O3型;天气型9所对应的PM2.5首污日数为8天,O3首污日数为6天,二者相差不超过预设阈值,所以确定天气型1对应的污染型为混合型。由此建立起9种天气型所对应的污染型。
具体地,如图2和图3所示,2016-2018年9-11月污染天气型共分为9种类型,各天气型日数、PM2.5和O3作为首要污染物日数以及各等级污染日数统计如下(表1、表2),本实施例中的污染型包括PM2.5型、O3型和混合型三种,其中表1中有5种天气型(第1、2、3、4和7种)对应的是PM2.5型,3种天气型(第5、6和8种)对应的是O3型,1种天气型(第9种)对应的是混合型。表2中示出了不同天气型对应的不同污染等级的天数。例如,天气型1所对应的PM2.5污染等级为良、轻度污染、中度污染和重度污染的天数分别为11、7、1和0,则可以得出污染型为天气型1时,污染等级为良的概率为11/(11+7+1)=11/19,污染等级为轻度污染的概率为7/(11+7+1)=7/19,污染等级为中度污染的概率为1/(11+7+1)=1/19。
表1各天气型日数及PM2.5、O3作为首要污染物日数(单位:d)
Figure BDA0002494648430000101
表2各天气型下PM2.5和O3各等级污染日数(单位:d)
Figure BDA0002494648430000102
Figure BDA0002494648430000111
图2、图3为9种天气型850hPa高度场和海平面气压场分布。选取其中污染天数最多的3型(PM2.5型)和8型(O3型)作为典型天气型进行分析。
3型(PM2.5型):此型为地面高后型。500hPa高度场为西偏北气流,无明显冷空气活动,850hPa高度场为高压环流中心前部,伴随下沉气流,抑制污染物垂直扩散,温度在7-8℃,地面气压场为高压后部,流场辐合有利于污染物水平聚集。
8型(O3型):此型为地面倒槽型。500hPa高度场为偏西平直气流,无明显冷空气活动,850hPa高度场为高压环流中心后部,伴随下沉气流,抑制污染物垂直扩散,温度场存在暖脊,温度在16-17℃,明显高于PM2.5型,地面气压场为倒槽前部,流场辐合有利于污染物水平聚集。
步骤七:根据未来的天气形势分型结果和所述关联关系,预测未来若干天(例如可以是7天)的空气污染状况。
具体地,可以将未来的天气形势分型结果与表1与表2所列举的内容进行比对,得到未来若干天的空气污染状况。例如,若未来若干天的天气形势分型结果为天气型1,则可以预测未来若干天的污染型为PM2.5型,污染等级为良的概率为11/(11+7+1)=11/19,污染等级为轻度污染的概率为7/(11+7+1)=7/19,污染等级为中度污染的概率为1/(11+7+1)=1/19。
根据历史天气形势分型总结结论,经验判断各天气型下的主要气象条件特征及变化情况、污染状况,用于指导未来一周污染预报,极大地提升了预报精度。
如图4所示,本申请的另一个实施例提供了一种天气形势的分型装置,包括:
选择模块,用于从历史气象数据中选取分型区域的分型因子,作为待聚类数据;所有待聚类数据组成待聚类数据集;
滤波模块,用于对所述待聚类数据进行滤波;
聚类模块,用于对滤波后的待聚类数据进行聚类,建立分型模型;
优化模块,用于迭代更新所述分型模型;
分型模块,用于利用更新完成的分型模型对预报天气形势进行分型。
本申请的另一个实施例提供了一种空气污染状况的预测装置,包括上述的天气形势的分型装置,以及
关联模块,用于根据所述优化完成的分型模型与历史空气污染数据,确定天气型与空气污染状况之间的关联关系;
预测模块,用于根据未来的天气形势分型结果和所述关联关系,预测未来若干天的空气污染状况。
本申请的另一个实施例提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现上述的天气形势的分型方法或空气污染状况的预测方法。
本申请的另一个实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以实现上述的天气形势的分型方法或空气污染状况的预测方法。
需要说明的是:
术语“模块”并非意图受限于特定物理形式。取决于具体应用,模块可以实现为硬件、固件、软件和/或其组合。此外,不同的模块可以共享公共组件或甚至由相同组件实现。不同模块之间可以存在或不存在清楚的界限。
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本申请也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本申请的内容,并且上面对特定语言所做的描述是为了披露本申请的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本申请的示例性实施例的描述中,本申请的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本申请的单独实施例。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上所述实施例仅表达了本申请的实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (12)

1.一种天气形势的分型方法,其特征在于,包括:
从历史气象数据中选取分型区域的分型因子,作为待聚类数据;
对所述待聚类数据进行滤波;
对滤波后的待聚类数据进行聚类,建立分型模型;
迭代更新所述分型模型;
利用更新完成的分型模型对预报天气形势进行分型。
2.根据权利要求1所述的方法,其特征在于,所述从历史气象数据中选取分型因子包括:从历史气象数据中选取每日若干时次的高度场、海平面气压场作为分型因子。
3.根据权利要求1所述的方法,其特征在于,所述对所述待聚类数据进行滤波,包括:通过高斯滤波法对所述待聚类数据进行平滑,去除日变化,得到滤波后的待聚类数据。
4.根据权利要求1所述的方法,其特征在于,所述对滤波后的待聚类数据进行聚类,建立分型模型,包括:
计算所述滤波后的待聚类数据中的每个样本与其他样本之间的距离;
根据所述距离找出各个样本的相似样本;
找出具有最多相似样本的中心样本,由所述中心样本及其所有相似样本组成一个簇,从而完成第一次分簇;
继续对剩余的样本进行分簇,直至获取初始若干个聚类中心;
计算各个所述簇的聚类中心,得到一组初始聚类中心,由所述初始聚类中心构成分型模型;其中,每一所述聚类中心对应一种天气型。
5.根据权利要求4所述的方法,其特征在于,所述迭代更新所述分型模型,包括:
A)重新计算每个样本与各聚类中心的列距离、行距离和整体距离;
B)计算每个样本与各聚类中心的列距离相关系数、行距离相关系数和整体距离的相关系数;
C)增加所述行距离、所述列距离、所述行距离相关系数和所述列距离相关系数所占的权重,计算每个样本与各聚类中心的相似度度量;
D)根据所述相似度度量将每个样本进行重新分簇;
E)计算重新分簇后的各簇的聚类中心;
重复步骤A)至步骤E),直到聚类中心不再变化,聚类结束,得到优化完成的分型模型。
6.根据权利要求1所述的方法,其特征在于,所述利用更新完成的分型模型对预报天气形势进行分型,包括:
依据预报区域未来若干天的气象场,提取高度场、海平面气压场数据,插值到分型区域的经纬线网格点上;
将插值后得到的分型区域的分型因子输入所述优化完成的分型模型中,得到未来若干天的天气形势分型结果。
7.一种空气污染状况的预测方法,其特征在于,包括权利要求1-6中的任一项所述的方法;以及
根据所述优化完成的分型模型与历史空气污染数据,确定天气型与空气污染状况之间的关联关系;
根据未来的天气形势分型结果和所述关联关系,预测未来若干天的空气污染状况。
8.根据权利要求7所述的方法,其特征在于,所述空气污染状况包括首要污染物和污染等级。
9.一种天气形势的分型装置,其特征在于,包括:
选择模块,用于从历史气象数据中选取分型区域的分型因子,作为待聚类数据;
滤波模块,用于对所述待聚类数据进行滤波;
聚类模块,用于对滤波后的待聚类数据进行聚类,建立分型模型;
优化模块,用于迭代更新所述分型模型;
分型模块,用于利用更新完成的分型模型对预报天气形势进行分型。
10.一种空气污染状况的预测装置,其特征在于,包括权利要求9所述的天气形势的分型装置,以及
关联模块,用于根据所述优化完成的分型模型与历史空气污染数据,确定天气型与空气污染状况之间的关联关系;
预测模块,用于根据未来的天气形势分型结果和所述关联关系,预测未来若干天的空气污染状况。
11.一种电子设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-8中任一所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以实现如权利要求1-8中任一所述的方法。
CN202010414950.4A 2020-05-15 2020-05-15 天气形势的分型方法、空气污染状况的预测方法及装置 Active CN111612055B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010414950.4A CN111612055B (zh) 2020-05-15 2020-05-15 天气形势的分型方法、空气污染状况的预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010414950.4A CN111612055B (zh) 2020-05-15 2020-05-15 天气形势的分型方法、空气污染状况的预测方法及装置

Publications (2)

Publication Number Publication Date
CN111612055A true CN111612055A (zh) 2020-09-01
CN111612055B CN111612055B (zh) 2020-12-04

Family

ID=72200237

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010414950.4A Active CN111612055B (zh) 2020-05-15 2020-05-15 天气形势的分型方法、空气污染状况的预测方法及装置

Country Status (1)

Country Link
CN (1) CN111612055B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112597237A (zh) * 2020-12-16 2021-04-02 中科三清科技有限公司 基于b/s架构的天气分型可视化方法、系统、电子设备及介质
CN112990355A (zh) * 2021-04-15 2021-06-18 中科三清科技有限公司 污染天气的分型方法、装置、电子设备及存储介质
CN114048614A (zh) * 2021-11-16 2022-02-15 中科三清科技有限公司 一种预测环境污染的方法和装置
CN114066059A (zh) * 2021-11-16 2022-02-18 中科三清科技有限公司 一种预测环境污染的方法和装置
CN114332009A (zh) * 2021-12-28 2022-04-12 中科三清科技有限公司 相似天气形势识别方法、装置、设备及存储介质
CN114518611A (zh) * 2021-12-24 2022-05-20 山东省青岛生态环境监测中心(中国环境监测总站黄海近岸海域环境监测分站) 一种基于相似案例判别分析的臭氧预报方法
CN116739191A (zh) * 2023-08-14 2023-09-12 中科三清科技有限公司 热点网格识别方法、装置、存储介质及电子设备
CN118295045A (zh) * 2024-06-06 2024-07-05 贵州省邮电规划设计院有限公司 一种基于大数据的气象监测报警系统及方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100275111A1 (en) * 2009-04-28 2010-10-28 Perceptive Software, Inc. Automatic forms processing systems and methods
CN103163278A (zh) * 2013-01-31 2013-06-19 北京工业大学 基于数值模式与统计分析结合的大气重污染预报方法
CN106339775A (zh) * 2016-08-23 2017-01-18 北京市环境保护监测中心 基于天气分型和气象要素聚类的空气重污染案例判别方法
CN107292417A (zh) * 2017-05-09 2017-10-24 北京市环境保护监测中心 基于重污染序列案例库的区域重污染判别预报方法及装置
CN107748940A (zh) * 2017-11-16 2018-03-02 国网上海市电力公司 一种节电潜力量化预测方法
CN109101661A (zh) * 2018-09-13 2018-12-28 东软集团股份有限公司 一种数据样本集合中异常点的检测方法和装置
CN110363347A (zh) * 2019-07-12 2019-10-22 江苏天长环保科技有限公司 基于决策树索引的神经网络预测空气质量的方法
US20200104648A1 (en) * 2018-09-28 2020-04-02 Wipro Limited Apparatus and method for detecting and removing outliers using sensitivity score
CN110994702A (zh) * 2019-12-26 2020-04-10 孝感科先电力工程咨询设计有限责任公司 一种基于功率-电压灵敏度的配电网分区电压控制方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100275111A1 (en) * 2009-04-28 2010-10-28 Perceptive Software, Inc. Automatic forms processing systems and methods
CN103163278A (zh) * 2013-01-31 2013-06-19 北京工业大学 基于数值模式与统计分析结合的大气重污染预报方法
CN106339775A (zh) * 2016-08-23 2017-01-18 北京市环境保护监测中心 基于天气分型和气象要素聚类的空气重污染案例判别方法
CN107292417A (zh) * 2017-05-09 2017-10-24 北京市环境保护监测中心 基于重污染序列案例库的区域重污染判别预报方法及装置
CN107748940A (zh) * 2017-11-16 2018-03-02 国网上海市电力公司 一种节电潜力量化预测方法
CN109101661A (zh) * 2018-09-13 2018-12-28 东软集团股份有限公司 一种数据样本集合中异常点的检测方法和装置
US20200104648A1 (en) * 2018-09-28 2020-04-02 Wipro Limited Apparatus and method for detecting and removing outliers using sensitivity score
CN110363347A (zh) * 2019-07-12 2019-10-22 江苏天长环保科技有限公司 基于决策树索引的神经网络预测空气质量的方法
CN110994702A (zh) * 2019-12-26 2020-04-10 孝感科先电力工程咨询设计有限责任公司 一种基于功率-电压灵敏度的配电网分区电压控制方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
JAIDEEP VAIDYA 等: ""Privacy-preserving k-means clustering over vertically partitioned data"", 《KDD "03: PROCEEDINGS OF THE NINTH ACM SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING》 *
SHIWANI RANA 等: ""Application of Hierarchical Clustering Algorithm to Evaluate Students Performance of an Institute"", 《2016 SECOND INTERNATIONAL CONFERENCE ON COMPUTATIONAL INTELLIGENCE & COMMUNICATION TECHNOLOGY (CICT)》 *
李梅莲: ""基于密度分布的K-Means初始聚类中心选择算法"", 《许昌学院学报》 *
翁佳烽 等: ""基于K-means聚类分析法的肇庆市干季PM2.5污染天气分型研究"", 《环境科学学报》 *
韩凌波: ""基于密度的K-means初始聚类中心选取算法"", 《电子科技》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112597237A (zh) * 2020-12-16 2021-04-02 中科三清科技有限公司 基于b/s架构的天气分型可视化方法、系统、电子设备及介质
CN112990355A (zh) * 2021-04-15 2021-06-18 中科三清科技有限公司 污染天气的分型方法、装置、电子设备及存储介质
CN114048614A (zh) * 2021-11-16 2022-02-15 中科三清科技有限公司 一种预测环境污染的方法和装置
CN114066059A (zh) * 2021-11-16 2022-02-18 中科三清科技有限公司 一种预测环境污染的方法和装置
CN114048614B (zh) * 2021-11-16 2023-01-10 中科三清科技有限公司 一种预测环境污染的方法和装置
CN114518611A (zh) * 2021-12-24 2022-05-20 山东省青岛生态环境监测中心(中国环境监测总站黄海近岸海域环境监测分站) 一种基于相似案例判别分析的臭氧预报方法
CN114332009A (zh) * 2021-12-28 2022-04-12 中科三清科技有限公司 相似天气形势识别方法、装置、设备及存储介质
CN114332009B (zh) * 2021-12-28 2022-11-08 中科三清科技有限公司 相似天气形势识别方法、装置、设备及存储介质
CN116739191A (zh) * 2023-08-14 2023-09-12 中科三清科技有限公司 热点网格识别方法、装置、存储介质及电子设备
CN116739191B (zh) * 2023-08-14 2023-11-07 中科三清科技有限公司 热点网格识别方法、装置、存储介质及电子设备
CN118295045A (zh) * 2024-06-06 2024-07-05 贵州省邮电规划设计院有限公司 一种基于大数据的气象监测报警系统及方法

Also Published As

Publication number Publication date
CN111612055B (zh) 2020-12-04

Similar Documents

Publication Publication Date Title
CN111612055B (zh) 天气形势的分型方法、空气污染状况的预测方法及装置
CN111260111B (zh) 基于气象大数据的径流预报改进方法
CN112131731B (zh) 一种基于空间特征向量滤波的城市生长元胞模拟方法
CN109920248B (zh) 一种基于gru神经网络的公交到站时间预测方法
CN112180471B (zh) 天气预报方法、装置、设备及存储介质
CN113435630B (zh) 一种产流模式自适应的流域水文预报方法及系统
CN115394358A (zh) 基于深度学习的单细胞测序基因表达数据插补方法和系统
CN111612245A (zh) 大气污染状况预测方法、装置、电子设备及存储介质
CN114611608A (zh) 基于深度学习模型的海表面高度数值预报偏差订正方法
CN115755221B (zh) 一种基于数理不确定性分析的多源降水数据融合方法
Lee et al. An efficient prediction for heavy rain from big weather data using genetic algorithm
CN112819246A (zh) 基于布谷鸟算法优化神经网络的能源需求预测方法
CN113449802A (zh) 基于多粒度互信息最大化的图分类方法及装置
CN116187835A (zh) 一种基于数据驱动的台区理论线损区间估算方法及系统
CN116205508A (zh) 一种分布式光伏发电异常诊断方法和系统
CN116822743A (zh) 一种基于两阶段分解重构与误差校正的风电功率预测方法
CN117408394B (zh) 电力系统的碳排放因子预测方法、装置及电子设备
CN114882373A (zh) 基于深度神经网络的多特征融合沙尘暴预测方法
CN109034462B (zh) 玉米群体种植结构优化方法及装置
CN117892162A (zh) 一种基于非负矩阵分解和机器学习的流域径流预报方法
CN113792480A (zh) 一种极端气候与复合极端气候综合预警系统的预警方法
CN117058433A (zh) 一种基于高斯混合聚类算法的生态水文分区方法
CN116525135B (zh) 基于气象因素的时空模型对疫情发展态势进行预测的方法
CN117434235A (zh) 基于水质监测的水华预警方法、装置、设备及介质
CN117290673A (zh) 一种基于多模型融合的船舶能耗高精度预测系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant