CN108062454A - 污染物时空分布不确定性特征分析方法、系统及存储介质 - Google Patents
污染物时空分布不确定性特征分析方法、系统及存储介质 Download PDFInfo
- Publication number
- CN108062454A CN108062454A CN201810055163.8A CN201810055163A CN108062454A CN 108062454 A CN108062454 A CN 108062454A CN 201810055163 A CN201810055163 A CN 201810055163A CN 108062454 A CN108062454 A CN 108062454A
- Authority
- CN
- China
- Prior art keywords
- space
- time
- pollutant
- spatial
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/0004—Gaseous mixtures, e.g. polluted air
Abstract
本发明公开了一种污染物时空分布不确定性特征分析方法、系统及存储介质,根据已有的污染物监测数据,将时间属性加入到空间坐标系统中,形成时空坐标系统;根据预设的阈值,对时空坐标系统中各个坐标点处污染物的浓度值进行指示化,采用时空指示克里格算法对指示化数据进行处理,获取污染物监测数据的时空分布情况,进而得出时空预测立方体数据;通过对时空预测立方体数据进行数据挖掘,得到污染物的时空分布不确定性特征的分析数据。本发明通过对污染物达到特定质量等级进行概率性分析,提高分析结果的可信度。
Description
技术领域
本发明涉及污染物监测分析技术领域,具体的说,是涉及一种污染物时空分布不确定性特征分析方法、系统及存储介质。
背景技术
当前,对大气、土壤等地理环境中的污染物分布特征分析主要包括对污染物的空间分布特征分析和时空分布特征分析。其中,空间分布特征分析是指忽略污染物的时间属性,运用基本数学统计方法和空间预测方法,对污染物监测浓度数据值进行处理,得到污染物的基本统计特征值和污染物浓度的空间分布图,进而获取污染物的空间分布情况,在实际应用中,该方法适合监测数据时间跨度小的监测数据;时空分布特征分析包括两种处理方法:(1)对具有一定时间跨度的污染物监测数据值,按照一定的时间单位,将数据分为多个部分,对分离后的各部分数据分别运用“空间分布特征分析”方法处理,最终将各部分结果进行综合,最终得到污染物的时空分布特征;(2)对具有一定时间跨度的污染物监测数据值,将其时间属性作为一个新的坐标维度加入到空间坐标系统中,形成一个时空坐标系,然后在时空坐标系统中运用地统计学方法,对时空变量的空间坐标和时间坐标同时进行预测,得到污染物的时空分布图,进而挖掘出污染物的时空分布特征,这种方法在实际应用中,适合于时间跨度大的监测数据。
伴随着人民对自然进程的不断探索与认知,对于获取的信息格式基准从二维平面空间基准逐步演变到三维空间基准,再由三维空间基准演变到反应自然进程时空分布的四维时空基准,尤其是在气象领域,大气变化的自然过程往往伴随着时间维度信息,“空间分布特征分析”在运用的过程中,仅关注于研究对象的空间变化特征,缺少对于研究对象的时间维度考虑,其所得分析结果可靠性不高;“时空分布特征分析”虽然考虑了研究对象的时间维度,但方法(1)将连续的时间属性人为的划分开来,并且将时间属性仅用于对研究对象进行分类,其处理过程几乎等同于“空间分布特征分析”;方法(2)虽然将时间属性作为一个新的维度将入空间坐标系统中,形成时空坐标系统,并运用时空预测方法获取研究对象的时空分布图,但该方法着力于对污染物监测数据值进行分析,属于“确定性”分析范畴,而污染物的浓度变化受温度、湿度等因素影响较大,若仅对污染物的浓度值做“确定性”分析,而缺少对于污染物达到特定质量等级的概率性分析,不仅会使得分析结果不够严谨,同时也不利于环保部门对污染物来源的探索以及对污染防治措施的制定。
综上,现有的对污染物组分分布特征进行分析的方法存在如下缺陷:
1、缺少对于研究对象的时间维度考虑,其所得分析结果可靠性不高;
2、缺少对于污染物达到特定质量等级的概率性分析,分析结果不够严谨。
因此,针对上述技术问题,有必要对现有技术进行改进。
发明内容
本发明的目的是提供一种污染物时空分布不确定性特征分析方法、系统及存储介质,结合时空坐标系统,对污染物达到特定质量等级进行概率性分析,提高分析结果的可信度。
为解决上述技术问题,本发明提供一种污染物时空分布不确定性特征分析方法,该方法包括如下步骤:
根据已有的污染物监测数据,将时间属性加入到空间坐标系统中,形成时空坐标系统;
根据预设的阈值,对时空坐标系统中各个坐标点处污染物的浓度值进行指示化,采用时空指示克里格算法对指示化数据进行处理,获取污染物监测数据的时空分布情况,进而得出时空预测立方体数据;
通过对时空预测立方体数据进行数据挖掘,得到污染物的时空分布不确定性特征的分析数据。
优选的,该方法进一步包括:
根据所述阈值对各个坐标点处污染物的浓度值进行划分,得到对应指示值,从而实现指示化。该方法进一步包括:
若所述的浓度值大于所述阈值,则对应指示值为0,否则,指示值为1;
或者,上述指示化过程也可以为:若所述浓度值小于所述阈值,则对应指示值为1,否则,其对应指示值为0。
优选的,该方法进一步包括:
计算指示化数据的时空经验半方差值,对所述时空经验半方差值进行处理,得出时空经验半方差函数散点图,并依此选择时空理论变异函数模型;
采用遗传算法对所述时空理论变异函数模型的参数进行拟合估计,结合指示化数据得出时空预测立方体数据。
相应的,该方法进一步包括:
分别设定各个坐标点之间的空间间隔和时间间隔,并计算任意两个坐标点之间的时间欧式距离、空间欧式距离以及指标值的差平方数;
计算所述时间欧式距离和空间欧式距离的滞后级别,结合指标值的差平方数,形成三维数组;
挑选所有时间滞后级别和空间滞后级别均相同的坐标点,根据其各自的指标差平方数,经过运算得到对应的时空经验半方差函数值。
相应的,该方法进一步包括:
将各个时间滞后级别和空间滞后级别分别乘以相应的时间间隔和空间间隔,得到各时间滞后距离和空间滞后距离,进而得到时空经验半方差函数散点值;
将不同时间滞后级别和空间滞后级别的时空经验半方差函数散点值绘制在三维坐标中,得到时空经验半方差函数散点图。
优选的,该方法进一步包括:
设定时间预测范围、空间预测范围、时间预测间隔和空间预测间隔,结合指示化数据对各个特定时空点进行预测。
相应的,该方法进一步包括:
搜索该特定时空点的时间域和空间域内的监测数据集;
计算所述监测数据集之间的时间距离、空间距离以及监测数据集与时空预测点之间的时间距离和空间距离;
将上述计算结果代入到拟合得到的时空理论变异函数模型中,得到对应时空点的时空变异函数值;
计算各个时空点对应的时空变异函数值的权重,进而得到该时空点对应的时空预测值。
优选的,该方法进一步包括:
采用基本数据统计法或年均概率分布法对时空预测立方体数据进行数据挖掘。
优选的,上述方法应用于对大气或土壤的污染物组分不确定性特征分析中。
此外,本发明还提供一种污染物时空分布不确定性特征分析系统,该系统包括:
数据监测单元,包括多个数据监测点,用于获取地理环境污染物数据,所述地理环境包括大气或土壤;
数据处理单元,内置数据处理软件,用于对所采集到的污染物浓度数据进行处理,得出时空预测立方体数据,通过对时空预测立方体数据进行数据挖掘,得到污染物的时空分布不确定性特征的分析数据。
优选的,该系统进一步包括显示单元,用于显示数据处理过程中的图像及数据分析结果。
此外,本发明还提供一种存储介质,该存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现如上述分析方法的步骤。
与现有技术相比,本发明的有益效果为:
(1)本发明根据已有的污染物监测数据,将时间属性加入到空间坐标系统中,形成时空坐标系统,实现对污染物监测数据进行时间和空间距离的统一衡量,进而得出时空预测立方体数据,提高了分析结果的可靠性;
(2)本发明通过采用数据特征挖掘技术,根据预测得到时空立方体数据,准确无误的挖掘出时空立方体数据所蕴含的污染物时空分布不确定特征的分析数据;
(3)本申请基于数据特征挖掘技术,可以科学、合理、准确、快速的分析出研究区域内污染物的时空分布不确定特征的数据信息;
(4)间接地,本申请分析得出的时空分布特征中蕴含的特征信息,可为制定相关的防止措施提供依据。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的限定。
图1是实施例中污染物时空分布不确定性特征的分析方法流程图;
图2是山东省空气监测站点监测到的PM2.5分布数据直方图;
图3是山东省空气监测站点监测到的PM2.5分布指示化后的数据直方图;
图4(a)是时间滞后距离为14天,空间滞后距离为100Km时,立体视角下的时空经验半方差函数散点图;
图4(b)是时间滞后距离为14天,空间滞后距离为100Km时,时间视角下的时空经验半方差函数散点图;
图4(c)是时间滞后距离为14天,空间滞后距离为100Km时,空间视角下的时空经验半方差函数散点图;
图5是时空理论变异函数拟合效果图;
图6是时间间隔为1天,空间间隔为2km*2km时预测的时空立方体数据;
图7是时空立方体基本数据统计特征分析结果;
图8是PM2.5年均概率分布图;
图9(a)-图9(l)分别是山东省1-12月的PM2.5月均概率分布图;
图10是山东省部分城市PM2.5日均概率百分比占比图。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
本发明的核心是提供一种污染物时空分布不确定性特征分析方法,结合时空坐标系统,对污染物达到特定质量等级进行概率性分析,提高分析结果的可信度。本发明的另一核心是提供一种污染物时空分布不确定特性分析系统及存储介质。
为了使本技术领域的人员更好的理解本发明的技术方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
实施例一
本实施例以对山东省的大气质量监测分析为例,详细的说明技术方案,图1本发明污染物时空分布不确定性特征的分析方法流程图,对大气污染物时空分布不确定性特征分析的具体方法包括:
步骤S10:根据已有的污染物监测数据,将时间属性t加入到空间坐标系统中,形成时空坐标系统(x,y,t,value);
本步骤的目的是通过时间属性加入到空间坐标系统中,形成时空坐标系统,进而实现对污染物监测数据进行时间和空间距离的统一衡量,即时空各向异性的确定。时空各向异性不仅反映了研究区域内大气污染物空间维度和时间维度之间的不一致性关系,也直接决定了时空预测立方体结果;而数据特征挖掘技术则可以根据预测得到的时空立方体数据,准确无误的挖掘出时空立方体数据所蕴含的特征信息。
步骤S11:根据预设的阈值,对时空坐标系统中各个坐标点处污染物的浓度值进行指示化,采用时空指示克里格算法对指示化数据进行处理,获取污染物监测数据的时空分布情况,进而得出时空预测立方体数据;
根据相关大气污染物空气质量标准(如我国PM2.5日均浓度值的准则值为75ug/m3),设定其数据值75ug/m3为阈值,然后对大气污染物浓度数据值进行分析,若数据值小于或等于阈值,那么其对应指示值为1;若数据值大于阈值,则其对应指示值为0。
当然,对大气污染物浓度数据值进行指示化的过程还可以为:若数据值大于阈值,则其对应指示值为0,否则,其对应指示值为1。
表1为时空坐标系下,75ug/m3时数据对应的指示值:
X | Y | 时间 | PM2.5质量浓度 | 指示值 |
935338 | 4140374 | 1 | 55 | 1 |
935338 | 4140374 | 2 | 124 | 0 |
935338 | 4140374 | 3 | 205 | 0 |
935338 | 4140374 | 4 | 84 | 0 |
935338 | 4140374 | 5 | 80 | 0 |
935338 | 4140374 | 6 | 327 | 0 |
935338 | 4140374 | 7 | 48 | 1 |
935338 | 4140374 | 8 | 200 | 0 |
935338 | 4140374 | 9 | 89 | 0 |
935338 | 4140374 | 10 | 25 | 1 |
935338 | 4140374 | 11 | 160 | 0 |
对于指示化后的的数据,其时空经验半方差函数值计算过程如下:
(1)设置空间间隔为Sstep,时间间隔为Tstep,计算任意两点之间的时间欧式距离、空间欧式距离、指示值差平方IDTS;
(2)用时间欧式距离除以时间间隔(向上取整),得到时间滞后级别NT,空间欧式距离除以空间间隔(向上取整),得到空间滞后级别NS,形成三维数组(NT,NS,IDTS);
(3)待所有数据点计算完成后,将各时间滞后级别和空间滞后级别(NT,NS)均相同的数据点之间的IDTS分别进行累加求和统计对应的数量Num,然后用除以2倍的Num,得到(NT,NS)对应的时空经验半方差函数值I’DTS;
(4)将各时间滞后级别(NT)和空间滞后级别(NS)分别乘以相应的时间间隔(SStep)和空间间隔(Tstep),得到各时间滞后距离hT和空间滞后距离hS,最后得到时空经验半方差函数散点值(hT,hS,I’DTS);
(5)将不同时间和空间滞后级别的时空经验半方差函数值(hT,hS,I’DTS)绘制在三维坐标中,得到时空经验半方差函数散点图,具体的,图4(a)、(b)、(c)分别为立体、时间、空间视角下,时间滞后距离为14天,空间滞后距离为100km时,时空经验半方差函数的散点图。
由图4可知,在空间距离大于100km时,其时空指示克里格变异函数值仍有增大趋势,说明山东省PM2.5浓度变化的空间自相关范围(DTSS)大于100km;在时间距离在3天时,各变异函数值已趋于稳定,说明山东省PM2.5浓度变化的时间自相关范围(DTST)为3天左右。
对于时空理论变异函数模型,时空坐标系统中的时空变量由于在时间和空间上的度量方式和变异程度不同,导致所需构建的理论模型比较复杂。一般而言,主要将时空理论变异模型分为时空分离型模型和时空非分离型模型两类。其中,时空分离模型将时空变量分别在时间和空间上的变异各用一个空间模型拟合(如球状模型、高斯模型等),再将其用乘积、线性组合、乘积和等方式组合起来;而时空非分离模型则将时空变量在时间和空间上的变异统一考虑,一般基于数学模型产生,如随机微分方程、极限理论、谱密度函数等,结构稍显复杂,种类也多种多样。
需要说明的是,在选择时空理论变异函数模型时,理论上,应该选择时空非分离模型,但在实际运用中,对于某些情况,时空分离模型对于时空经验半方差函数的拟合效果要优于时空非分离模型;此外,从模型的复杂度而言,时空分离模型相较于时空非分离模型不仅简单、直接,而且时空分离模型也更容易体现出时间维度变换和空间维度变化对整个模型的影响,运用遗传算法求解时,其参数范围的也更容易确定。因此,在运用过程中,首先,可根据研究对象的空间属性与时间属性之间相互关联的程度来选择,若时间属性与空间属性之间的相互关联程度高,则选择时空非分离模型;若相关关联程度低,则可选择时空分离模型。其次,若对于待研究对象的特征属性足够了解,能够快速的确定时空非分离模型中各参数范围,则可选择时空非分离模型;若不能够快速的确定时空非分离模型中各参数的数值范围,则可选择时空分离模型。最后,若时空分离模型和时空非分离模型均可,则可选择拟合效果较优的模型。
对于选择的时空理论变异函数模型,运用遗传算法进行模型拟合。遗传算法是一种借鉴与生物界的进化规律(适者生存,不适者淘汰的优胜劣汰遗传机制)的随机化搜索方法,传统的遗传算法主要包括以下几个模块:
(1)个体编码与解码
基本遗传算法是通过使用一定长度的二进制符号串来示群体中的每一个个体,其等位基因由二值符号集{0,1}组成(如:01001001001表示等位基因长度为11的一个个体)。在对个体进行编码时,首先需要确定基因长度,具体操作为:根据参数表示的物理意义,确定参数(个体)的取值范围[umin,umax],设定编码精度pre,运用公式log2{(umax-umin)/pre}(所得结果向上取整)求出个体的编码长度λ,然后随机生成长度为λ且由{0,1}数据集组成的二进制符号串即可得到个体的编码结果。
与编码类似,在计算当前个体的适应度时,适应度函数不能对软色体基因进行处理,需要将当前软色体基因进行解译,得到不同软色体基因所代表的生物体属性值。即通过一定的解码公式,将个体由二进制表示的遗传基因变换为具有物理意义的十进制数值。
式(1)中,λ表示个体基因长度,bi表示等位基因(数值为0或者1),x为解码后的十进制数。
(2)个体适应度评价
遗传算法是根据个体在当前进化过程中的适应度来计算当前群体中该个体遗传到下一代群体中的概率大小。为精确计算这个概率,必需要求所有个体的适应度为非负数。因此,根据研究对象的不同,需要事先确定好目标评价函数值大小与个体适应度优劣之间的变换规则,特别是当目标函数值存在负数时,若转换规则设置不当,会使得适应度高的个体被淘汰,而适应度低的个体被保留,从而造成进化完成后,参数拟合结果并非最优,甚至较差。
一般而言,遗传算法可直接将目标评价函数值f(x)当做为个体的适应度F(x)。但对于模型拟合,衡量模型拟合精度的好坏一般可用均方根误差(RMSE)来表示,RMSE值越小,模型拟合精度越高。因此,对于一般模型拟合而言,其适应度函数可用如下公式表示:
式(2)中,Cmax为预先设定的一个较大的正数,f(Xi)为模型估计值,为实际值。
(3)遗传算子
基本遗传算法使用下述三种遗传算子:
选择运算:将优秀个体遗传到下一代中,一般是按照一定的比例,将当前优秀个体中的部分个体遗传到下一代。
交叉运算:将两个个体的部分等位基因进行交换,得到两个新的个体。一般使用单点交叉算子,即将个体自某一个等位基因之后的所有等位基因进行交换,基本操作如下:
(a)确定当代个体中用于交叉运算的群体,并对群体中的个体进行两两随机配对。
(b)每一对相互配对的个体,按照基因的长度λ,随机产生λ个[0,1]之间的随机数组R,并将R中每一个随机数依次与交叉概率(Pc)进行比较,直到找到第一个随机数Ri使得Ri<Pc,并设定当前基因位为基因交叉位。
(c)对需要进行交叉配对的个体,在确定基因交叉位后,相互交换交叉位后的染色体,得到出两个新的个体。
如将“01010001011”和“10110110110”两个个体自第5个基因开始交换,得到个体“01010110110”和“10110001011”。
变异运算:将部分个体的某个等位基因值作出变动,即将“0”变为“1”,将“1”变为“0”,一般使用基本位变异算子(如将“01010001011”的第10个等位基因由“1”变为“0”,得到新个体“01010001001”)。对于当前待变异个体,其基因变异位的确定与交叉运算中基因交叉位确定相同,通过产生[0,1]随机数组R,并依次与变异概率Pm进行比较,直到搜索到第一个Ri,使得Ri<Pc,停止搜索,确定其为基因变异位,并进行变异操作。
然而,基本遗传算法只能对单个目标参数进行寻优求解,而时空理论变异函数模型拟合为多参数综合寻优。此外,基本遗传算法在寻优求解时,将各数据点均等考虑,即对于模型而言,所有数据点的“重要性”相同,而对于时空变异函数模型而言,其时间距离和空间距离较小的点“重要性”大于时间距离和空间距离较大的点,因此我们需要对基本遗传算法的进行改进,即对遗传算法的编码与解码过程和适应度评价函数进行改进,使其能够同时对多个目标参数进行寻优求解,并且在对个体进行适应度评价时有所“侧重”。改进思路为:
(1)在编码时,先分别对单个参数进行“编码”操作得到子个体,然后将子个体体按照一定的顺序组合成为一个母个体。
(2)在解码时,先对母个体进行分割,得到多个子个体,然后分别运用解码公式分别对子个体进行解码。
(3)在对个体进行适应度评价时,将当前点对的时空滞后距离进行反向加权,得到如下适应度函数:
式(3)中,为各时空模型在(hs,hT)的估计值,为对应的实际值,为时空距离,Cmax为给定的一个较大的正数。
在运用遗传算法进行模型拟合求解时,还需要设定如下基本运行参数:
N:群体大小,一般选定为200~500;
T:进化代数,一般选定为150~300;
Pc:交叉概率,一般选定为0.4-0.99;
Pm:变异概率,一般选定为0.001~0.1;
四个参数均为遗传算法运行的基本参数,对遗传算法的寻优求解效率和结果都有影响。
在进行时空预测时,设定待预测的时间预测范围、空间预测范围、时间预测间隔和空间预测间隔,从而实现对待研究的区域时空连续预测。对于指定的时空预测点Z0(x,y,t,value)来说,其预测过程如下:
(1)搜索出指定时间域和空间域内的监测数据集Z集合(Z1,Z2,…,Zn);
(2)分别计算监测数据集Z集合之间的时间距离(取绝对值)、空间距离和Z集合与时空预测点Z0之间的时间距离(取绝对值)和空间距离;
(3)将上一步中计算得到的时间距离和空间距离分别代入到拟合得到的时空理论变异函数模型中,得到时空变异函数值γ(hS,hT)。
(4)根据下列矩阵,求出Z集合中各数据点的权重λ。
(5)运用得到Z0的时空预测值。
对研究区域数据进行预测后,以时空立方体的形式展示出研究区域内研究对象的时空分布情况(图6为时间间隔为1天,空间间隔为2km*2km时预测的时空立方体数据)。
S12:通过对时空预测立方体数据进行数据挖掘,得到污染物的时空分布不确定性特征的分析数据。
在对预测得到的时空立方体数据进行挖掘分析,主要用到以下方法:
(1)基本数据统计特征分析
表2为时空立方体基本数据统计特征分析结果:
阈值 | 平均数 | 标准差 | 偏度 | 峰度 | 第三四分位 | 四分位距 |
Zc=75μg/m3 | 0.4945 | 0.3944 | 0.0065 | 1.3728 | 0.9273 | 0.8782 |
图7为根据表2中的时空立方体基本数据统计特征分析结果饼状图。
由表2和图7可知,时空立方体数据值的平均值为0.4945,第三四分位位0.9273,四分位距为0.8782,时空立方体数据值小于0.2的百分占比和大于0.8的百分占比均为34%,其余三个统计层次的概率值均为10%左右,说明时空立方体数据值分布较为对称,离散程度高,说明山东省境内全年空气质量波动大,以超过0.8的概率达到和超过我国大气污染物空气质量标准(PM2.5)的时空占比均为34%。
(2)年均概率分布不确定性分析
根据图6的时空预测立方体数据,获取各空间点位的日概率值,按获取年平均值,绘制PM2.5年均概率分布图(图8)。
由图8可知,山东省西北部(聊城)达到我国大气污染物空气质量标准(PM2.5)的年均概率最小,仅为0.3~0.4,其次为中西部(济南、德州、聊城)、西南部(菏泽)等地区,其年均概率为0.4~0.5,中部其它地区(东营、枣庄、临沂等)其年均概率为0.5~0.6;最高为东部沿海地区潍坊、青岛、烟台、威海等),其年均概率达0.7~0.8。整体上,从西部到东部沿海,达到我国大气污染物空气质量标准(PM2.5)的年均概率值逐渐增大。同时,结合山东省地理位置及地理环境,造成此现象原因主要有如下两点:
(a)由山东省地势情况分布可知,东部地区地势低,且相对平缓,受海陆风影响,气体流动较快,使得空气中的粉尘扩散速度较快;中部地区突起,丘陵较多,且西部临近泰山,气体流动相对较缓,使得空气中的粉尘扩散速度较慢;
(b)受大气气流运输的影响,山东省内空气质量在一定程度上受外省的影响。西部地区与河北、河南接壤,且河北省空气质量污染严重,从而导致山东省西部PM2.5达到我国大气污染物空气质量标准(PM2.5)的年均概率低;而东部则临海,距离河南河北等省较远,外省气流抵达东部区域时,空气中的颗粒物经过自然沉降后,气流携带颗粒物浓度降低,造成东部受到外省污染情况的影响远小于西部。
(3)月均概率分布不确定性分析
根据图6中时空预测立方体数据,获取各空间点位的日概率值,按月取平均值,对1-12月分别绘制相应的PM2.5月均概率分布图,请参见图9(a)-图9(l),其中,图9(a)-图9(l)分别为对应于山东省1-12月的PM2.5月均概率分布图,其颜色标度参照图8的上栏对比图,不难看出,颜色越深,说明概率值越大,也就是达到我国大气污染物空气质量标准(PM2.5)的可能性越大。
实际分析过程中,从空间上,各月份达到我国大气污染物空气质量标准(PM2.5)的最小概率均位于西部区域(如菏泽、聊城、济宁等),尤其是在1月份,部分城市概率小于0.1;各月份概率最大位于东部沿海区域(青岛、烟台、威海等),绝大部分月份概率超过0.6;中部为过渡区域,不同月份概率变化较大整体上呈现出从西至东,概率值逐渐增大,说明山东省空气质量从西至东,污染程度逐渐减轻,具有明显的空间分布特征。
从时间上,山东省境内达到我国大气污染物空气质量标准(PM2.5)的概率值最大为7、8月份,大部分地域概率值大于0.6,部分地域概率超过0.9;概率值最小为1月份,大部分地域概率小于0.2,局部地域介于0.5到0.6之间。整体上,从1月到12月,概率值先增大后减小。说明山东省空气污染程度从1月到12月,先减轻后加剧,具有明显的时间分布特征。
(4)部分城市日均概率不确定性分析
根据山东省行政区划和城市经济排名,依次在山东省北部、西部、中部、南部、中东部以及东部沿海各选择一个城市作为PM2.5日均质量浓度不确定性分析观测点(北部选择东营市,西部选择济宁市,中部选择济南市,南部选择临沂市,中东部选择潍坊市,东部沿海选择烟台市),获取各城市城区范围的日均概率值,并绘制相应的百分比占比图,如图10。
由图10可知,六个城市全年日均概率大于0.75的占比中,最高为烟台市,超过70%,最低为济南市,仅为36%,说明烟台、东营、济宁、临沂、潍坊和济南六个城市全年的空气污染程度以0.75的概率达到我国大气污染物空气质量标准(PM2.5)的天数最高为烟台市,260天左右,最低为济南市,仅有130天;全年日均概率小于0.25的占比中,除烟台市(13%)以外,其余五个城市比例均高于30%(东营市最高,为41%),说明全年空气污染程度以大于0.75的概率达到我国大气污染物空气质量标准(PM2.5)的天数依次为48天、150天、139天、130天和105天。各城市空气污染程度依次为:烟台<东营<潍坊<济南<济宁≈临沂,大致符合从西至东,空气污染逐渐减轻的特点。
在时空预测时,对于不同的时空点位,在空气监测站点密集区域,其搜索到的时空点位数目较多,在空气监测站点稀疏区域,其搜索到的点位数据较少,甚至为零。而从预测本身角度而言,运用较少的样点数据进行预测,其预测结果明显不具备高的可靠性,而运用较多的样点数据进行预测,其预测结果可靠性虽高,但会增加系统的运算量,降低系统的预测效率。因此,对于搜索到的样点数据,还需要经过如下处理:
(1)对于各时空点位,设定用于预测的样本数据的数目为N估;
(2)若搜索到的样点数据个数小于N估,则需要增加搜索范围(包括空间范围和时间范围),直到搜索范围内包含的样点数据个数符合要求;
(3)若搜索到的样点数据个数大于N估,则按照各样点数据与待预测点的时空距离大小,由近及远,依次选择,直到样点数据的个数符合要求;
在时空点搜索过程中,我们需要计算各样点数据与待预测点位的时空距离,本发明中,定义时空距离为其中h为空间欧式距离,t为时间欧式距离,为时空各向异性系数,用于衡量时间尺度和空间尺度的不一致性。
在对时空预测立方体进行分析时,本发明仅提到了部分分析手段,其它时空数据分析手段,如时空属性表(以时间和空间作为行与列,表格内容为时空属性值,用于记录时空节点的预测值)、时间序列专题图(以日、周或其它时间单位为节点,制作特定的专题地图,本发明中已列出了以月为单位的时间序列图)、概率分布曲线图(局部地区日、周或其它时间单位的时间序列曲线图)、概率动态变化差异程度分布图(对各空间点位的所有时序预测值进行分析,得到各空间点位的变化差异程度,并绘制成二维平面图)、确定大气污染物来源的空间分布(对日均概率值分析,找出全年中相对于周边地区,概率值均较大的区域,初步确定污染源的空间分布情况)等也均适用于时空预测立方体数据,用户可根据需要,对时空数据进行不确定性挖掘分析。
综上,本实施例基于时空不确定性预测和时空立方体数据特征挖掘技术,科学、合理、准确、快速的分析出研究区域内大气污染物的时空分布特征,利于本领域技术人员对大气污染物时空动态分布特征的认知,利于初步确定大气污染物来源的空间分布情况。
实施例二
在实施例一中对于污染物时空分布不确定性特征分析方法的实施例进行了详细的描述,本发明还提供一种与该方法对应的污染物时空分布不确定性特征分析系统,包括:
数据监测单元,包括布局于山东省境内的99个数据监测点,用于获取山东各地的污染物数据;
数据处理单元,内置数据处理软件,用于对所采集到的污染物浓度数据进行处理,得出时空预测立方体数据,通过对时空预测立方体数据进行数据挖掘,得到污染物的时空分布不确定性特征的分析数据;
还包括显示单元,用于显示数据处理过程中的图像及数据分析结果。
此外,上述实施例均是针对大气污染物的时空分布不确定性特征进行的分析,需要说明的是:本发明中提到的研究对象及分析方法,不仅仅只局限于大气污染物(空气质量指数、PM2.5、CO、SO2、NO等),对于其它具有时间维度属性的空间数据,如土壤重金属、有机碳、N含量,水质中微量元素含量等要素的动态监测也同样适用。同时,对于研究对象的时空坐标(x,y,t,value)可用其它坐标属性数据进行替换,如研究对象的空间坐标与高程组成的三维立体坐标(x,y,z,value),或研究对象的其它特征属性值;对于仅有空间坐标的研究对象(x,y,value),本发明提到的预测及分析方法同样适用。具体做法:将空间坐标中加入一个时间维度,其值设置为一个常数C,得到时空坐标(x,y,C,value),然后运用时空预测及分析方法对研究对象的不确定性分布情况进行分析。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (10)
1.一种污染物时空分布不确定性特征分析方法,其特征在于,包括如下步骤:
根据已有的污染物监测数据,将时间属性加入到空间坐标系统中,形成时空坐标系统;
根据预设的阈值,对时空坐标系统中各个坐标点处污染物的浓度值进行指示化,采用时空指示克里格算法对指示化数据进行处理,获取污染物监测数据的时空分布情况,进而得出时空预测立方体数据;
通过对时空预测立方体数据进行数据挖掘,得到污染物时空分布不确定性特征的分析数据。
2.根据权利要求1所述的一种污染物时空分布不确定性特征分析方法,其特征在于,根据预设的阈值,对时空坐标系统中各个坐标点处污染物的浓度值进行指示化的方法为:根据所述阈值对各个坐标点处污染物的浓度值进行划分,得到对应指示值,从而实现指示化。
3.根据权利要求2所述的一种污染物时空分布不确定性特征分析方法,其特征在于,若所述的浓度值大于所述阈值,则对应指示值为0,否则,指示值为1;
或者,所述浓度值小于所述阈值,则对应指示值为1,否则,指示值为0。
4.根据权利要求1所述的一种污染物时空分布不确定性特征分析方法,其特征在于,采用时空指示克里格算法对指示化数据进行处理的具体方法包括以下步骤:
计算指示化数据的时空经验半方差值,对所述时空经验半方差值进行处理,得出时空经验半方差函数散点图,并依此选择时空理论变异函数模型;
采用遗传算法对所述时空理论变异函数模型的参数进行拟合估计,结合指示化数据得出时空预测立方体数据。
5.根据权利要求4所述的一种污染物时空分布不确定性特征分析方法,其特征在于,计算指示化数据的时空经验半方差值的方法包括以下步骤:
分别设定各个坐标点之间的空间间隔和时间间隔,并计算任意两个坐标点之间的时间欧式距离、空间欧式距离以及指标值的差平方数;
计算所述时间欧式距离和空间欧式距离的滞后级别,结合指标值的差平方数,形成三维数组;
挑选所有时间滞后级别和空间滞后级别均相同的坐标点,根据其各自的指标差平方数,经过运算得到对应的时空经验半方差函数值。
6.根据权利要求5所述的一种污染物时空分布不确定性特征分析方法,其特征在于,对所述时空经验半方差值进行处理,得出时空经验半方差函数散点图的具体方法包括以下步骤:
将各个时间滞后级别和空间滞后级别分别乘以相应的时间间隔和空间间隔,得到各时间滞后距离和空间滞后距离,进而得到时空经验半方差函数散点值;
将不同时间滞后级别和空间滞后级别的时空经验半方差函数散点值绘制在三维坐标中,得到时空经验半方差函数散点图。
7.根据权利要求1所述的一种污染物时空分布不确定性特征分析方法,其特征在于,采用基本数据统计法或年均概率分布法对时空预测立方体数据进行数据挖掘。
8.根据权利要求1-7中任一项所述的污染物时空分布不确定特征分析方法,其特征在于,应用于对大气或土壤的污染物组分不确定性特征分析中。
9.一种污染物时空分布不确定性特征分析系统,其特征在于,包括:
数据监测单元,包括多个数据监测点,用于获取地理环境污染物数据,所述地理环境包括大气或土壤;
数据处理单元,内置数据处理软件,用于对所采集到的污染物浓度数据进行处理,得出时空预测立方体数据,通过对时空预测立方体数据进行数据挖掘,得到污染物的时空分布不确定性特征的分析数据;
显示单元,用于显示数据处理过程中的图像及数据分析结果。
10.一种存储介质,其特征在于,存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的分析方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810055163.8A CN108062454A (zh) | 2018-01-19 | 2018-01-19 | 污染物时空分布不确定性特征分析方法、系统及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810055163.8A CN108062454A (zh) | 2018-01-19 | 2018-01-19 | 污染物时空分布不确定性特征分析方法、系统及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108062454A true CN108062454A (zh) | 2018-05-22 |
Family
ID=62141564
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810055163.8A Pending CN108062454A (zh) | 2018-01-19 | 2018-01-19 | 污染物时空分布不确定性特征分析方法、系统及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108062454A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109324155A (zh) * | 2018-10-31 | 2019-02-12 | 中国石油天然气股份有限公司 | 炼化装置尾气污染物在线监测数据预警方法及装置 |
CN109444232A (zh) * | 2018-12-26 | 2019-03-08 | 苏州同阳科技发展有限公司 | 一种多通道智能化污染气体监测装置与扩散溯源方法 |
CN109523066A (zh) * | 2018-10-29 | 2019-03-26 | 东华理工大学 | 一种基于克里金插值的pm2.5新增移动站点选址方法 |
CN110544304A (zh) * | 2019-07-18 | 2019-12-06 | 长春市万易科技有限公司 | 基于时空推理的场地污染数字化与图形化展示系统及方法 |
CN110929793A (zh) * | 2019-11-27 | 2020-03-27 | 谢国宇 | 用于生态环境监测的时空域模型建模方法及系统 |
CN111766347A (zh) * | 2020-07-24 | 2020-10-13 | 苍龙集团有限公司 | 一种室内空气质量实时监测方法和装置 |
CN112697113A (zh) * | 2020-12-10 | 2021-04-23 | 四川长虹电器股份有限公司 | 海量传感器地灾数据变化情况展示方法 |
CN112765886A (zh) * | 2021-01-19 | 2021-05-07 | 中国矿业大学 | 时空点气象数据确定方法、装置、计算机设备及存储介质 |
CN113720639A (zh) * | 2021-08-31 | 2021-11-30 | 湘潭大学 | 一种污染场地调查补充采样的方法 |
CN114443982A (zh) * | 2021-05-06 | 2022-05-06 | 中南大学 | 一种大区域土壤重金属检测与时空分布特征分析方法及系统 |
CN115980281A (zh) * | 2023-03-16 | 2023-04-18 | 深圳奥雅设计股份有限公司 | 一种基于碳中和的碳源检测方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101718775A (zh) * | 2009-11-12 | 2010-06-02 | 上海交通大学 | 围垦地土壤中重金属含量的空间变异分布图生成方法 |
KR20100105117A (ko) * | 2009-03-20 | 2010-09-29 | 부경대학교 산학협력단 | 지시크리깅을 이용한 지하수 오염가능성 평가 방법 및 시스템 |
CN102636632A (zh) * | 2012-04-25 | 2012-08-15 | 上海交通大学 | 围垦地土壤重金属污染综合评价图生成方法 |
CN103810376A (zh) * | 2014-01-17 | 2014-05-21 | 浙江大学 | 基于卫星遥感与回归克里格的地面日降雨量预测方法 |
CN104850734A (zh) * | 2015-04-21 | 2015-08-19 | 武大吉奥信息技术有限公司 | 一种基于时空分布特征的空气质量指数预测方法 |
CN106484997A (zh) * | 2016-10-10 | 2017-03-08 | 南京林业大学 | 一种基于克里金插值的水岸带淤泥厚度计算及出图方法 |
CN106570334A (zh) * | 2016-11-09 | 2017-04-19 | 上海市政工程设计研究总院(集团)有限公司 | 一种地统计学模型计算城市降雨径流污染负荷的方法 |
CN106600534A (zh) * | 2016-12-12 | 2017-04-26 | 中国石油大学(华东) | 一种基于多尺度小波支持向量机优化的克里金空间插值方法 |
CN107391951A (zh) * | 2017-08-03 | 2017-11-24 | 江苏卓易信息科技股份有限公司 | 一种基于环形邻域梯度排序的空气污染溯源方法 |
-
2018
- 2018-01-19 CN CN201810055163.8A patent/CN108062454A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20100105117A (ko) * | 2009-03-20 | 2010-09-29 | 부경대학교 산학협력단 | 지시크리깅을 이용한 지하수 오염가능성 평가 방법 및 시스템 |
CN101718775A (zh) * | 2009-11-12 | 2010-06-02 | 上海交通大学 | 围垦地土壤中重金属含量的空间变异分布图生成方法 |
CN102636632A (zh) * | 2012-04-25 | 2012-08-15 | 上海交通大学 | 围垦地土壤重金属污染综合评价图生成方法 |
CN103810376A (zh) * | 2014-01-17 | 2014-05-21 | 浙江大学 | 基于卫星遥感与回归克里格的地面日降雨量预测方法 |
CN104850734A (zh) * | 2015-04-21 | 2015-08-19 | 武大吉奥信息技术有限公司 | 一种基于时空分布特征的空气质量指数预测方法 |
CN106484997A (zh) * | 2016-10-10 | 2017-03-08 | 南京林业大学 | 一种基于克里金插值的水岸带淤泥厚度计算及出图方法 |
CN106570334A (zh) * | 2016-11-09 | 2017-04-19 | 上海市政工程设计研究总院(集团)有限公司 | 一种地统计学模型计算城市降雨径流污染负荷的方法 |
CN106600534A (zh) * | 2016-12-12 | 2017-04-26 | 中国石油大学(华东) | 一种基于多尺度小波支持向量机优化的克里金空间插值方法 |
CN107391951A (zh) * | 2017-08-03 | 2017-11-24 | 江苏卓易信息科技股份有限公司 | 一种基于环形邻域梯度排序的空气污染溯源方法 |
Non-Patent Citations (1)
Title |
---|
梅杨: "时空克里格方法关键技术及其应用研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109523066A (zh) * | 2018-10-29 | 2019-03-26 | 东华理工大学 | 一种基于克里金插值的pm2.5新增移动站点选址方法 |
CN109523066B (zh) * | 2018-10-29 | 2023-06-20 | 东华理工大学 | 一种基于克里金插值的pm2.5新增移动站点选址方法 |
CN109324155A (zh) * | 2018-10-31 | 2019-02-12 | 中国石油天然气股份有限公司 | 炼化装置尾气污染物在线监测数据预警方法及装置 |
CN109444232A (zh) * | 2018-12-26 | 2019-03-08 | 苏州同阳科技发展有限公司 | 一种多通道智能化污染气体监测装置与扩散溯源方法 |
CN109444232B (zh) * | 2018-12-26 | 2024-03-12 | 苏州同阳科技发展有限公司 | 一种多通道智能化污染气体监测装置与扩散溯源方法 |
CN110544304B (zh) * | 2019-07-18 | 2023-03-14 | 长春市万易科技有限公司 | 基于时空推理的场地污染数字化与图形化展示系统及方法 |
CN110544304A (zh) * | 2019-07-18 | 2019-12-06 | 长春市万易科技有限公司 | 基于时空推理的场地污染数字化与图形化展示系统及方法 |
CN110929793A (zh) * | 2019-11-27 | 2020-03-27 | 谢国宇 | 用于生态环境监测的时空域模型建模方法及系统 |
CN111766347B (zh) * | 2020-07-24 | 2023-08-29 | 苍龙集团有限公司 | 一种室内空气质量实时监测方法和装置 |
CN111766347A (zh) * | 2020-07-24 | 2020-10-13 | 苍龙集团有限公司 | 一种室内空气质量实时监测方法和装置 |
CN112697113A (zh) * | 2020-12-10 | 2021-04-23 | 四川长虹电器股份有限公司 | 海量传感器地灾数据变化情况展示方法 |
CN112765886A (zh) * | 2021-01-19 | 2021-05-07 | 中国矿业大学 | 时空点气象数据确定方法、装置、计算机设备及存储介质 |
CN114443982A (zh) * | 2021-05-06 | 2022-05-06 | 中南大学 | 一种大区域土壤重金属检测与时空分布特征分析方法及系统 |
CN113720639A (zh) * | 2021-08-31 | 2021-11-30 | 湘潭大学 | 一种污染场地调查补充采样的方法 |
CN113720639B (zh) * | 2021-08-31 | 2024-04-02 | 湘潭大学 | 一种污染场地调查补充采样的方法 |
CN115980281A (zh) * | 2023-03-16 | 2023-04-18 | 深圳奥雅设计股份有限公司 | 一种基于碳中和的碳源检测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108062454A (zh) | 污染物时空分布不确定性特征分析方法、系统及存储介质 | |
Hengl et al. | SoilGrids250m: Global gridded soil information based on machine learning | |
US10168141B2 (en) | Method for identifying air pollution sources based on aerosol retrieval and glowworm swarm algorithm | |
Jat et al. | Modelling of urban growth using spatial analysis techniques: a case study of Ajmer city (India) | |
Li et al. | A systematic sensitivity analysis of constrained cellular automata model for urban growth simulation based on different transition rules | |
Jafari et al. | Spatial prediction of soil great groups by boosted regression trees using a limited point dataset in an arid region, southeastern Iran | |
Yang et al. | Precise estimation of soil organic carbon stocks in the northeast Tibetan Plateau | |
Yang et al. | An integrative hierarchical stepwise sampling strategy for spatial sampling and its application in digital soil mapping | |
Pebesma et al. | Interactive visualization of uncertain spatial and spatio‐temporal data under different scenarios: an air quality example | |
Wang et al. | The spatial statistic trinity: A generic framework for spatial sampling and inference | |
Anderson et al. | Occupancy modeling and estimation of the holiday darter species complex within the Etowah River system | |
Gholami et al. | A new integrated data mining model to map spatial variation in the susceptibility of land to act as a source of aeolian dust | |
CN107133686A (zh) | 基于时空数据模型的城市级pm2.5浓度预测方法 | |
Hengl et al. | Geomorphometry—a key to landscape mapping and modelling | |
CN108764527B (zh) | 一种土壤有机碳库时空动态预测最优环境变量筛选方法 | |
Feng et al. | Impervious surface extraction based on different methods from multiple spatial resolution images: a comprehensive comparison | |
Zhu et al. | Loess terrain segmentation from digital elevation models based on the region growth method | |
Paramasivam | Merits and demerits of GIS and geostatistical techniques | |
Pisati | Spatial Data Analysis in Stata an Overview | |
Stanislawski et al. | An open source high-performance solution to extract surface water drainage networks from diverse terrain conditions | |
Mosleh et al. | Identifying sources of soil classes variations with digital soil mapping approaches in the Shahrekord plain, Iran | |
Yang et al. | Identifying China’s polycentric cities and evaluating the urban centre development level using Luojia-1A night-time light data | |
Zeng et al. | A methodology to quantify the neighborhood decay effect of urban cellular automata models | |
CN114398951A (zh) | 一种基于随机森林和众源地理信息的土地利用变化驱动因子挖掘方法 | |
Remm | An online calculator for spatial data and its applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180522 |
|
RJ01 | Rejection of invention patent application after publication |