CN116680518B - 用于地表水环境的时空态势分析方法 - Google Patents
用于地表水环境的时空态势分析方法 Download PDFInfo
- Publication number
- CN116680518B CN116680518B CN202310976274.3A CN202310976274A CN116680518B CN 116680518 B CN116680518 B CN 116680518B CN 202310976274 A CN202310976274 A CN 202310976274A CN 116680518 B CN116680518 B CN 116680518B
- Authority
- CN
- China
- Prior art keywords
- water environment
- data
- time
- space
- variable
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 27
- 239000002352 surface water Substances 0.000 title claims abstract description 20
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 153
- 230000000694 effects Effects 0.000 claims abstract description 14
- 238000011160 research Methods 0.000 claims abstract description 8
- 230000006870 function Effects 0.000 claims description 31
- 238000000034 method Methods 0.000 claims description 31
- 230000001419 dependent effect Effects 0.000 claims description 27
- 239000010410 layer Substances 0.000 claims description 14
- 238000012544 monitoring process Methods 0.000 claims description 11
- 239000003344 environmental pollutant Substances 0.000 claims description 7
- 231100000719 pollutant Toxicity 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 6
- 239000011229 interlayer Substances 0.000 claims description 6
- 230000002776 aggregation Effects 0.000 claims description 5
- 238000004220 aggregation Methods 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 238000007635 classification algorithm Methods 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 238000011985 exploratory data analysis Methods 0.000 claims description 4
- 244000144972 livestock Species 0.000 claims description 4
- 238000000692 Student's t-test Methods 0.000 claims description 3
- 239000000809 air pollutant Substances 0.000 claims description 3
- 231100001243 air pollutant Toxicity 0.000 claims description 3
- 230000009021 linear effect Effects 0.000 claims description 3
- 238000012417 linear regression Methods 0.000 claims description 3
- 238000001556 precipitation Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 3
- 238000012353 t test Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 claims description 2
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims description 2
- 210000003743 erythrocyte Anatomy 0.000 claims 1
- 244000144977 poultry Species 0.000 claims 1
- 238000007405 data analysis Methods 0.000 abstract description 3
- 238000004088 simulation Methods 0.000 abstract description 3
- 238000011156 evaluation Methods 0.000 abstract description 2
- 238000001514 detection method Methods 0.000 description 5
- 230000007613 environmental effect Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000001052 transient effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 2
- 239000010865 sewage Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Mathematical Analysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Mathematical Optimization (AREA)
- Tourism & Hospitality (AREA)
- Life Sciences & Earth Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Evolutionary Biology (AREA)
- Mathematical Physics (AREA)
- Computational Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Remote Sensing (AREA)
- Operations Research (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及水环境数据分析技术领域,尤其涉及一种用于地表水环境的时空态势分析方法,步骤S1,获取水环境数据和水环境影响因子数据,并按时间维度对数据进行统计分类;步骤S2,根据所述水环境数据集构建时空立方体;步骤S3,通过地理探测器探测水环境软知识;步骤S4,应用分布滞后非线性模型,分析各变量对水环境变化的滞后效应;步骤S5,应用贝叶斯最大熵进行时空插值;本发明通过将综合考虑水环境的时间和空间两个维度的,结合水动力学模型,对研究区内的水环境态势进行场景模拟,有效的通过时间和空间两个维度以及多种水环境影响因素分析水环境的时空态势,能够对水环境进行实际场景模拟,提高水环境评估准确性。
Description
技术领域
本发明涉及水环境数据分析技术领域,尤其涉及一种用于地表水环境的时空态势分析方法。
背景技术
水环境污染问题已成为很多城市共同面临的问题,严重损害了人居环境和城市形象,并已成为制约、影响人类社会健康发展的关键问题。
现有技术中已经存在引进基于量子点光谱传感技术助力水环境监管,河流上布设水质监测点,能够实时掌握沿途监测点的地表水水质状况,能够监测入河排水口、污水处理站退水、国家考核断面、河道断面、区界/河界断面、闸口、区考断面的温度、浊度、COD、BOD及TOC等水质参数,并具有上传功能。
中国专利公开号CN 112800038 B公开了一种水环境数据分析方法,包括:基线确定方法;梯度线确定方法;检测点数据时间插值方法;稳态查找方法;递增暂态查找方法;递减暂态查找方法;波峰、波谷暂态查找方法;周期性暂态查找方法;时空延迟计算方法;基线插值计算方法;流域检测指标展示方法。本发明通过河流监控截面污染物情况以及排污口的排放情况,通过插值算法把断面区间的数值进行插值,形成整个流域完整的污染物分布情况,并通过不同时间污染物变化情况,通过大数据预测方法,给出未来一段时间的污染物浓度预期数值。
由此可见,现有的时空态势分析中普遍存在以下不足之处:关注大尺度如年际尺度的演变规律,而水环境是一个极易受周围环境影响,如一场降雨、一次排污的现象,因此更细尺度的演变规律急需引起关注;只单独针对时间或者空间维度,对水污染事件进行研究,较少综合考虑时间和空间两个维度的,结合水动力学模型,对研究区内的水环境态势进行场景模拟。
发明内容
为此,本发明提供一种用于地表水环境的时空态势分析方法,用以克服现有技术中只针对单个时间或空间维度对水环境问题进行分析存在的无法对实际场景中综合有多种维度因素的水环境态势进行模拟的问题。
为实现上述目的,一方面,本发明提供一种用于地表水环境的时空态势分析方法,包括以下步骤:
步骤S1,获取水环境数据和水环境影响因子数据,并按时间维度对数据进行统计分类;
步骤S2,根据所述水环境数据集构建时空立方体;
步骤S3,通过地理探测器探测水环境软知识;
步骤S4,应用分布滞后非线性模型,分析各变量对水环境变化的滞后效应;分布滞后非线性模型的计算公式如下:
其中,t为时间,Xj为自变量,fj为自变量的各种基函数,μtk为其他混杂因素的线性效应,βj为Xj的系数,Yk为μt的系数;
步骤S5,应用贝叶斯最大熵进行时空插值;
其中,所述变量为影响所述水环境数据的因素,自变量Xj为水环境中各污染物浓度、逐日空气污染物浓度、温度、相对湿度以及流量。
进一步地,在所述步骤S1中,获取水环境数据,并按时间维度对水环境数据进行统计分类的具体步骤包括:
S11,获取水环境数据作为因变量,水环境数据包括研究区域的地表水环境实时监测数据,并将获取的水环境按时间维度整理为因变量数据集,统计分类的时间维度包括小时、天、月、季度、水文年,其中,水文年还包括枯水期、丰水期和平水期;
S12,获取水环境影响因子数据作为自变量,水环境影响因子数据包括排污口排放情况、畜禽养殖场、人口密度、气象数据、水网分布、DEM、流量;
S13,将所述水环境影响因子数据按所述水环境数据对应的时间维度进行整理形成自变量数据集;
其中,所述气象数据包括降水数据、风向数据和风速数据。
进一步地,在所述步骤S1中,还包括S14,对各水环境数据的采集站点进行编码,并记录各站点的位置信息、数据采集时间和站点属性;
其中,所述位置信息为各站点的经度坐标和纬度坐标。
进一步地,在所述步骤S2中,根据所述水环境数据集构建时空立方体的步骤包括:
S21,将所述水环境数据根据时间和空间构建时空立方体,时空立方体中包括若干站点在时间和空间上采集的水环境信息;
S22,通过对水环境数据的聚合处理,获取所述时空立方体的时空特征;
S23,根据所述时空特征压缩水环境数据的数据量;
其中,所述空间为对应站点的位置。
进一步地,在所述步骤S3中,通过地理探测器探测水环境软知识的具体步骤包括:
S31,数据处理,将所述自变量转化为分类变量,其中,若单个自变量为数值量,则对该单个自变量进行分组或分层以使其满足第一预设条件;
S32,将转化完成的所述分类变量的数据和对应的所述因变量的数据导入所述地理探测器,进行运算并输出结果;
S33,采用显著性水平为0.05的t检验对输出结果进行检验,查看风险因子q值的计算结果;
S34,根据q值确定水环境各变量的影响权重,并选取q值最高对应的变量作为水环境的软知识;
其中,所述分类变量为对所述因变量的单个分类或针对因变量的解释变量,第一预设条件为进行分组的单个自变量满足组内方差最小且组间方差最大,或分层的单个自变量满足层内方差最小且层间方差最大。
进一步地,在所述步骤S31中,当单个自变量为数值量时,对该单个自变量进行分组或分层,分组或分层使用的分类方法包括根据专家知识进行分类和根据分类算法进行分类,且针对单个自变量分类后形成的各组或各层中至少包含两个所述因变量;
其中,所述分类算法包括k-means算法和排序后等分算法。
进一步地,在所述步骤S32中,所述结果包括变量的空间分异性q值、自变量对因变量Y的解释力或层间均值比较结果;
其中,所述解释力表示为100×q%,所述层间均值比较结果为因变量在自变量的当前层的均值与因变量在自变量当前层的相邻层的均值的大小关系。
进一步地,在所述步骤S4中,应用分布滞后非线性模型,分析各变量对水环境变化的滞后效应的具体步骤包括:
S41,建立所述水环境数据中各水环境参数与影响因素的最小二乘线性回归模型,通过逐步回归方法,基于AIC准则选取因素组合,并基于方差膨胀系数进行共线性检验,确保方差膨胀系数小于10,进而确定引入各所述分布滞后非线性模型的影响因素;
S42,在所述分布滞后非线性模型构建中,水环境数据的基函数选择自然样条函数,滞后维度的基函数选择多项式函数,各影响因素选用对应预设函数进行拟合,通过分别拟合不同滞后周期的分布滞后非线性模型并计算赤池信息准则和贝叶斯信息准则2个指标,选择其中指标值最小时所对应的滞后期作为分布滞后非线性模型的最大滞后期;
S43,应用分布滞后非线性模型并采用三维图形表达滞后效应的估计结果;
其中,各所述预设函数与各所述影响因素有关,且各预设函数均不相同;
其中,各所述预设函数设置为自由度不同的自然样条函数。
进一步地,在所述步骤S5中,应用贝叶斯最大熵进行时空插值的具体步骤包括:
S51,根据需分析的区域水环境设置数据字段,以确定数据文件中需要分析的列;
S52,根据确定的所述列采用设定方式对数据分布情况进行查看,其中,若数据中存在零值或负值,则对零值或负值进行对数变换;
S53,探索性数据分析,分别展示数据的时间序列特征和空间分布特征;其中,时间序列特征针对单个空间位置,空间分布特征针对单个时间点;
S54,整体平均趋势分析,并根据第一判定规则判定是否使用去掉平均趋势后的数据,如若使用去掉平均趋势后的数据,则采用平均趋势对原始趋势进行处理以生成去掉平均趋势后的残差数据,并使用残差数据进行分析;
S55,时空协方差分析,设置时间和空间滞后数量,确定协方差结构的数量,再分别选择时间和空间成分的模型及参数,计算实际数据的实验协方差,并获得选定的协方差模型的曲线;
S56,采用贝叶斯最大熵对所选区域水环境进行估计,展示估计的所选区域水环境参数的均值和误差方差的空间分布以及估计的对应站点的水环境参数的时间序列特征;
其中,所述设定方式为描述性统计结果和/或直方图,第一判定规则为整体平均趋势的趋势特征值与预设趋势特征值进行比对,所述曲线区分时间成分和空间成分。
进一步地,在所述步骤S56中,采用贝叶斯最大熵进行估计的过程中,包括:
对于空间分布估计,需选定待估计的时间、以自变量为X轴、以因变量为Y轴的坐标上需估计的节点的数量,以及待计算和展示的空间范围;
对于时间分布估计,需选定待估计的监测站点和时间范围。
与现有技术相比,本发明的有益效果在于,本发明通过将综合考虑水环境的时间和空间两个维度的,结合水动力学模型,对研究区内的水环境态势进行场景模拟,有效地通过时间和空间两个维度以及多种水环境影响因素分析水环境的时空态势,能够对水环境进行实际场景模拟,提高水环境评估准确性。
进一步地,本发明通过将数据导入地理探测器进行运算,能够比较不同水环境自变量对因变量的影响是否有显著的差异,以及自变量对因变量影响的交互作用,有效的将时间和空间维度中决定水环境空间格局最主要的环境因子进行选取,作为水环境的软知识。
进一步地,本发明同时考虑了水环境数据在时间和空间维度上的变化特征;利用了不同精度的数据,包括具有精确监测值的硬数据和服从均匀分布的软数据。相比只能使用硬数据进行分析的传统的统计学方法,BME由于具有合理、有效的融合软数据的能力,其估计结果的精度更高。
附图说明
图1为本发明用于地表水环境的时空态势分析方法的步骤示意图;
图2为本发明步骤S5的分步示意图。
具体实施方式
为了使本发明的目的和优点更加清楚明白,下面结合实施例对本发明作进一步描述;应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不用于限定本发明。
下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非在限制本发明的保护范围。
需要说明的是,在本发明的描述中,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系,这仅仅是为了便于描述,而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,还需要说明的是,在本发明的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可根据具体情况理解上述术语在本发明中的具体含义。
请参阅图1所示,其为本发明用于地表水环境的时空态势分析方法的步骤示意图,本发明用于地表水环境的时空态势分析方法,包括:
步骤S1,数据的收集与整理,获取水环境数据和水环境影响因子数据,并按时间维度对数据进行统计分类;
具体而言,步骤S1包括:
S11,整理水环境数据集(作为因变量Y);获取研究区域的地表水环境实时监测数据集,并按照小时、天、月、季、水文年和年不同时间维度,其中水文年中包括枯水期、丰水期和平水期,做统计分析;
存储水环境数据的采集站点的编码ID、空间变量、时间变量值和属性变量值,保存为CSV格式,其中,空间变量包括经度坐标和纬度坐标;
S12,整理水环境影响因子数据集(作为自变量X),按照与水环境对应的时间维度,存储数据;
借助参考文献及专家知识,搜集影响水环境的变量,如排污口排放情况、畜禽养殖场、人口密度、气象(降水、风向/风速等)、水网分布、DEM、流量等。
步骤S2,根据水环境数据集构建时空立方体,用以挖掘研究区水环境的时空分布规律;
具体而言,步骤S2包括:
S21,将所述水环境数据根据时间和空间构建时空立方体,时空立方体中包括若干站点在时间和空间上采集的水环境信息;
S22,通过对水环境数据的聚合处理,获取所述时空立方体的时空特征;
S23,根据所述时空特征压缩水环境数据的数据量;
具体而言,根据水环境数据集构建时空立方体,时空立方体包括多个站点的时间、空间的水环境信息;构建水环境数据的时空立方体,提取其时空特征。
在实施中,能够将研究区近三年实时水环境的时空分布规律,一次性、直观呈现,进而通过对水环境时空数据的聚合处理,压缩水环境时空数据集的存储空间,为其时空分布的可视化表达提供数据支撑。
步骤S3,通过地理探测器探测水环境软知识;
具体而言,步骤S3包括:
步骤S31,数据处理:将自变量X全部变成分类变量;
具体而言,这里分类变量X可以是对因变量Y的某个分类,也可以是Y的解释变量;
具体而言,X应为类型量,如果X为数值量,则需要对其进行分组或分层,使组内方差最小,组间方差最大;
实施中,分组数目的确定应考虑分组的物理含义,同一组可以出现在不相邻的多个区域,分组可以基于专家知识,也可以使用分类算法,如k-means,或者排序后等分,并且应保证各组或层X中至少有Y的两个样本单元,从而可以计算该层的均值及方差;
步骤S32,将样本(Y,X)数据导入地理探测器,进行运算;
具体而言,输出结果包括:变量r的空间分异性q值,或者自变量X对因变量Y的解释力100*q%,以及,比较因变量在层h的均值是否显著大于在层r(>h)的均值;
在实施中,比较不同自变量对因变量的影响是否有显著的差异;这些自变量对因变量影响的交互作用;
步骤S33,采用显著性水平为0.05的t检验,查看所有风险因子q值的计算结果;
实施中,以具有最高的q值的变量为例,说明该变量是决定水环境空间格局最主要的环境因子;生态探测结果,解释为就水环境空间分布的作用而言,变量之间存在的显著差异;交互探测的结果,显示两两变量交互作用后的q值;
步骤S34,选取q值最高的变量,作为水环境的软知识。
步骤S4,应用DLNM(分布滞后非线性模型Distributed Lag Non-Linear Model,简称DLNM)模型,分析变量对水环境变化的滞后效应;
在实施中,自变量Xj通常为逐日空气污染物浓度、温度、相对湿度、流量等环境因素; fj表示自变量(水环境中各污染物浓度)的各种基函数,μk为其他混杂因素的线性效应,Yk为其系数。在实际应用中,常常采用 DLNM 的思想来控制环境因素的混杂作用。
具体而言,步骤S4包括:
步骤S41,考虑到q值高的变量之间可能存在多重共线性,且各水环境指标并非均与所有变量相关,为了保证DLNM模型构建时参数选择的合理性,先建立各水环境参数与影响因素的最小二乘线性回归模型;
通过逐步回归方法,基于AIC准则选取因素组合,并基于方差膨胀系数进行共线性检验,确保方差膨胀系数小于10,在排除多重共线性的同时保证模型具有较好的解释性,进而确定引入各个DLNM模型的影响因素;
步骤S42,在DLNM模型构建中,水环境数据的基函数选择自然样条函数,滞后维度的基函数选择多项式函数,各影响因素选用不同函数进行拟合,其中,各影响因素选用的函数能够根据使用场景进行设置,例如选取自由度不同的自然样条函数;
通过分别拟合不同滞后周期的DLNM模型并计算赤池信息准则和贝叶斯信息准则2个指标,选择其中指标值最小时所对应的滞后期作为DLNM模型的最大滞后期;
步骤S43,借助R环境dlnm程序包,并采用三维图形表达滞后效应的估计结果,通过为特定滞后时间与暴露组合设定一个网格,随着这两个坐标变化的效应值就构成一个形象直观的3D图。
步骤S5,应用BME进行时空插值;
本发明应用BME进行时空插值,同时考虑了水环境数据在时间和空间维度上的变化特征;利用了不同精度的数据,包括具有精确监测值的硬数据和服从均匀分布的软数据。相比只能使用硬数据进行分析的传统的统计学方法,BME由于具有合理、有效的融合软数据的能力,其估计结果的精度更高。
具体而言,步骤S5包括:
步骤S51,设置数据字段,以确定数据文件中需要分析的列;
步骤S52,查看数据分布情况。对原始数据和对数变换后的数据,展示描述性统计结果和直方图;
具体而言,可根据需要对零和负值进行对数变换;
步骤S53,探索性数据分析,分别展示数据的时间序列特征和空间分布特征。时间序列特征针对某一空间位置(如水环境监测站点),而空间分布特征针对某一时间点;
步骤S54,整体平均趋势分析。可根据具体情况决定是否使用去掉平均趋势后的数据,如若使用,在后续分析中将使用去掉平均趋势后的残差数据;
具体而言,根据第一判定规则判定是否使用去掉平均趋势后的数据,第一判定规则为整体平均趋势的趋势特征值与预设趋势特征值进行比对,趋势特征值为表征整体平均趋势平缓程度的特征,趋势越平缓,趋势特征值越小,预设趋势特征值能够根据实际的检测情况进行设定。
步骤S55,时空协方差分析。设置时间和空间滞后数量,计算实际数据的实验协方差;
时间和空间滞后参数,时空协方差模型和参数(先确定协方差结构的数量,再分别选择时间和空间成分的模型及参数),获得选定的协方差模型的曲线(区分空间成分和时间成分);
步骤S56,BME估计,结果展示估计的所选区域水环境参数的均值和误差方差的空间分布及估计的某监测站水环境参数的时间序列特征;
对于空间分布,还需要选定待估计的时间,X、Y轴上要估计的节点(其下游节点)的数量,以及要计算和展示的空间范围;
对于时间分布,需要选择要估计的监测站点和时间范围。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
以上所述仅为本发明的优选实施例,并不用于限制本发明;对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种用于地表水环境的时空态势分析方法,其特征在于,包括以下步骤:
步骤S1,获取水环境数据和水环境影响因子数据,并按时间维度对数据进行统计分类;
步骤S2,根据所述水环境数据集构建时空立方体,即通过对水环境数据的聚合处理,获取包括若干站点在时间和空间上采集的水环境信息的时空立方体的时空特征;
步骤S3,通过地理探测器探测水环境软知识,即选取水环境各变量中风险因子最高的变量作为水环境的软知识;
步骤S4,应用分布滞后非线性模型,分析各变量对水环境变化的滞后效应,水环境数据的基函数选择自然样条函数,滞后维度的基函数选择多项式函数,各影响因素选用对应预设函数进行拟合,通过分别拟合不同滞后周期的分布滞后非线性模型并计算赤池信息准则和贝叶斯信息准则2个指标,选择其中指标值最小时所对应的滞后期作为分布滞后非线性模型的最大滞后期;
其中,t为时间,Xtj为自变量,fj为Xtj的各种基函数,μtk为其他混杂因素的线性效应,βj为Xtj的系数,Yk为μtk的系数;
其中,所述变量为包括排污口排放情况、畜禽养殖场、人口密度、气象数据、水网分布、DEM、流量在内的影响所述水环境数据的因素,自变量Xtj为水环境中各污染物浓度、逐日空气污染物浓度、温度、相对湿度以及流量;
步骤S5,应用贝叶斯最大熵进行时空插值,即根据需分析的区域水环境设置数据字段,进行探索性数据分析、整体平均趋势分析和时空协方差分析,然后采用贝叶斯最大熵对所选区域水环境进行估计,展示估计的所选区域水环境参数的均值和误差方差的空间分布以及估计的对应站点的水环境参数的时间序列特征。
2.根据权利要求1所述的用于地表水环境的时空态势分析方法,其特征在于,在所述步骤S1中,获取水环境数据,并按时间维度对水环境数据进行统计分类的具体步骤包括:
S11,获取水环境数据作为因变量,水环境数据包括研究区域的地表水环境实时监测数据,并将获取的水环境按时间维度整理为因变量数据集,统计分类的时间维度包括小时、天、月、季度、水文年,其中,水文年还包括枯水期、丰水期和平水期;
S12,获取水环境影响因子数据作为自变量,水环境影响因子数据包括排污口排放情况、畜禽养殖场、人口密度、气象数据、水网分布、DEM、流量;
S13,将所述水环境影响因子数据按所述水环境数据对应的时间维度进行整理形成自变量数据集;
其中,所述气象数据包括降水数据、风向数据和风速数据。
3.根据权利要求2所述的用于地表水环境的时空态势分析方法,其特征在于,在所述步骤S1中,还包括S14,对各水环境数据的采集站点进行编码,并记录各站点的位置信息、数据采集时间和站点属性;
其中,所述位置信息为各站点的经度坐标和纬度坐标。
4.根据权利要求3所述的用于地表水环境的时空态势分析方法,其特征在于,在所述步骤S2中,根据所述水环境数据集构建时空立方体的步骤包括:
S21,将所述水环境数据根据时间和空间构建时空立方体,时空立方体中包括若干站点在时间和空间上采集的水环境信息;
S22,通过对水环境数据的聚合处理,获取所述时空立方体的时空特征;
S23,根据所述时空特征压缩水环境数据的数据量;
其中,所述空间为对应站点的位置。
5.根据权利要求4所述的用于地表水环境的时空态势分析方法,其特征在于,在所述步骤S3中,通过地理探测器探测水环境软知识的具体步骤包括:
S31,数据处理,将所述自变量转化为分类变量,其中,若单个自变量为数值量,则对该单个自变量进行分组或分层以使其满足第一预设条件;
S32,将转化完成的所述分类变量的数据和对应的所述因变量的数据导入所述地理探测器,进行运算并输出结果;
S33,采用显著性水平为0.05的t检验对输出结果进行检验,查看风险因子q值的计算结果;
S34,根据q值确定水环境各变量的影响权重,并选取q值最高对应的变量作为水环境的软知识;
其中,所述分类变量为对所述因变量的单个分类或针对因变量的解释变量,第一预设条件为进行分组的单个自变量满足组内方差最小且组间方差最大,或分层的单个自变量满足层内方差最小且层间方差最大。
6.根据权利要求5所述的用于地表水环境的时空态势分析方法,其特征在于,在所述步骤S31中,当单个自变量为数值量时,对该单个自变量进行分组或分层,分组或分层使用的分类方法包括根据专家知识进行分类和根据分类算法进行分类,且针对单个自变量分类后形成的各组或各层中至少包含两个所述因变量;
其中,所述分类算法包括k-means算法和排序后等分算法。
7.根据权利要求6所述的用于地表水环境的时空态势分析方法,其特征在于,在所述步骤S32中,所述结果包括变量的空间分异性q值、自变量对因变量Y的解释力或层间均值比较结果;
其中,所述解释力表示为100×q%,所述层间均值比较结果为因变量在自变量的当前层的均值与因变量在自变量当前层的相邻层的均值的大小关系。
8.根据权利要求7所述的用于地表水环境的时空态势分析方法,其特征在于,在所述步骤S4中,应用分布滞后非线性模型,分析各变量对水环境变化的滞后效应的具体步骤包括:
S41,建立所述水环境数据中各水环境参数与影响因素的最小二乘线性回归模型,通过逐步回归方法,基于AIC准则选取因素组合,并基于方差膨胀系数进行共线性检验,确保方差膨胀系数小于10,进而确定引入各所述分布滞后非线性模型的影响因素;
S42,在所述分布滞后非线性模型构建中,水环境数据的基函数选择自然样条函数,滞后维度的基函数选择多项式函数,各影响因素选用对应预设函数进行拟合,通过分别拟合不同滞后周期的分布滞后非线性模型并计算赤池信息准则和贝叶斯信息准则2个指标,选择其中指标值最小时所对应的滞后期作为分布滞后非线性模型的最大滞后期;
S43,应用分布滞后非线性模型并采用三维图形表达滞后效应的估计结果;
其中,各所述预设函数与各所述影响因素有关,且各预设函数均不相同;
其中,各所述预设函数设置为自由度不同的自然样条函数。
9.根据权利要求8所述的用于地表水环境的时空态势分析方法,其特征在于,在所述步骤S5中,应用贝叶斯最大熵进行时空插值的具体步骤包括:
S51,根据需分析的区域水环境设置数据字段,以确定数据文件中需要分析的列;
S52,根据确定的所述列采用设定方式对数据分布情况进行查看,其中,若数据中存在零值或负值,则对零值或负值进行对数变换;
S53,探索性数据分析,分别展示数据的时间序列特征和空间分布特征;其中,时间序列特征针对单个空间位置,空间分布特征针对单个时间点;
S54,整体平均趋势分析,并根据第一判定规则判定是否使用去掉平均趋势后的数据,如若使用去掉平均趋势后的数据,则采用平均趋势对原始趋势进行处理以生成去掉平均趋势后的残差数据,并使用残差数据进行分析;
S55,时空协方差分析,设置时间和空间滞后数量,确定协方差结构的数量,再分别选择时间和空间成分的模型及参数,计算实际数据的实验协方差,并获得选定的协方差模型的曲线;
S56,采用贝叶斯最大熵对所选区域水环境进行估计,展示估计的所选区域水环境参数的均值和误差方差的空间分布以及估计的对应站点的水环境参数的时间序列特征;
其中,所述设定方式为描述性统计结果和/或直方图,第一判定规则为整体平均趋势的趋势特征值与预设趋势特征值进行比对,所述曲线区分时间成分和空间成分。
10.根据权利要求9所述的用于地表水环境的时空态势分析方法,其特征在于,在所述步骤S56中,采用贝叶斯最大熵进行估计的过程中,包括:
对于空间分布估计,需选定待估计的时间、以自变量为X轴、以因变量为Y轴的坐标上需估计的节点的数量,以及待计算和展示的空间范围;
对于时间分布估计,需选定待估计的监测站点和时间范围。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310976274.3A CN116680518B (zh) | 2023-08-04 | 2023-08-04 | 用于地表水环境的时空态势分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310976274.3A CN116680518B (zh) | 2023-08-04 | 2023-08-04 | 用于地表水环境的时空态势分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116680518A CN116680518A (zh) | 2023-09-01 |
CN116680518B true CN116680518B (zh) | 2023-10-20 |
Family
ID=87789526
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310976274.3A Active CN116680518B (zh) | 2023-08-04 | 2023-08-04 | 用于地表水环境的时空态势分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116680518B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113588528A (zh) * | 2021-07-02 | 2021-11-02 | 北京航空航天大学 | 一种考虑自然环境动态特性的金属大气腐蚀预测方法 |
CN113592278A (zh) * | 2021-07-23 | 2021-11-02 | 太原理工大学 | 考虑非期望产出的sbm水环境承载力评价方法 |
CN114840616A (zh) * | 2021-12-28 | 2022-08-02 | 北京航空航天大学 | 一种基于时空插值的动态大气自然环境建模方法 |
CN115050485A (zh) * | 2022-06-30 | 2022-09-13 | 宝略科技(浙江)有限公司 | 一种基于环境因素的健康风险精准预警方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101542266A (zh) * | 2006-02-21 | 2009-09-23 | G.R.G专利有限公司 | 通过调节气流通风来估计和减少空气污染的系统和方法 |
-
2023
- 2023-08-04 CN CN202310976274.3A patent/CN116680518B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113588528A (zh) * | 2021-07-02 | 2021-11-02 | 北京航空航天大学 | 一种考虑自然环境动态特性的金属大气腐蚀预测方法 |
CN113592278A (zh) * | 2021-07-23 | 2021-11-02 | 太原理工大学 | 考虑非期望产出的sbm水环境承载力评价方法 |
CN114840616A (zh) * | 2021-12-28 | 2022-08-02 | 北京航空航天大学 | 一种基于时空插值的动态大气自然环境建模方法 |
CN115050485A (zh) * | 2022-06-30 | 2022-09-13 | 宝略科技(浙江)有限公司 | 一种基于环境因素的健康风险精准预警方法 |
Non-Patent Citations (1)
Title |
---|
阳宗海湖滨湿地环境因素对沉积物砷赋存形态的影响及浓度水平预测;李梦莹;刘云根;侯磊;郑毅;齐丹卉;赵蓉;任伟;;环境科学研究(第09期);72-81 * |
Also Published As
Publication number | Publication date |
---|---|
CN116680518A (zh) | 2023-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106651211B (zh) | 一种不同尺度区域洪水灾害风险评估的方法 | |
Du et al. | Return period and risk analysis of nonstationary low-flow series under climate change | |
Han et al. | A convolutional neural network using surface data to predict subsurface temperatures in the Pacific Ocean | |
Jat et al. | Modelling of urban growth using spatial analysis techniques: a case study of Ajmer city (India) | |
CN112287018B (zh) | 一种台风灾害下10kV杆塔受损风险评估方法及系统 | |
CN101673369A (zh) | 基于投影寻踪的排水管网洪涝风险评价方法 | |
Yan et al. | A stream prediction model based on attention-LSTM | |
CN111079999A (zh) | 一种基于cnn和svm的洪水灾害易发性预测方法 | |
CN117116382B (zh) | 引水工程影响下受水湖泊水质时空预测方法和系统 | |
Tarwidi et al. | An optimized XGBoost-based machine learning method for predicting wave run-up on a sloping beach | |
CN109299208B (zh) | 一种台风灾害下输电杆塔智能可视化风险评估方法 | |
CN108764527B (zh) | 一种土壤有机碳库时空动态预测最优环境变量筛选方法 | |
Karyotis et al. | Deep learning for flood forecasting and monitoring in urban environments | |
Teegavarapu | Changes and trends in precipitation extremes and characteristics: Links to climate variability and change | |
Chen et al. | River ecological flow early warning forecasting using baseflow separation and machine learning in the Jiaojiang River Basin, Southeast China | |
CN117332909B (zh) | 基于智能体的多尺度城市内涝道路交通暴露性预测方法 | |
Qiu et al. | Spatial-temporal analysis and prediction of precipitation extremes: a case study in the Weihe River Basin, China | |
CN117332291A (zh) | 一种面向分布式光伏的区域资源监测布局方法及系统 | |
CN116680518B (zh) | 用于地表水环境的时空态势分析方法 | |
Wang et al. | Early warning of debris flow using optimized self-organizing feature mapping network | |
Noor et al. | Prediction map of rainfall classification using random forest and inverse distance weighted (IDW) | |
Pandey et al. | Geomatics approach for assessment of respiratory disease mapping | |
Keshavarzi et al. | Fuzzy clustering analysis for modeling of soil cation exchange capacity | |
Detenbeck et al. | Watershed-based survey designs | |
Mihai et al. | Analyzing meteorological data using unsupervised learning techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |