CN118229485A - 一种基于arima模型的地下水健康风险预警方法和系统 - Google Patents

一种基于arima模型的地下水健康风险预警方法和系统 Download PDF

Info

Publication number
CN118229485A
CN118229485A CN202410414835.5A CN202410414835A CN118229485A CN 118229485 A CN118229485 A CN 118229485A CN 202410414835 A CN202410414835 A CN 202410414835A CN 118229485 A CN118229485 A CN 118229485A
Authority
CN
China
Prior art keywords
health risk
model
data
groundwater
early warning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410414835.5A
Other languages
English (en)
Inventor
黄蕾
李晓鹏
任富天
黄涛
郭昭
刘凡
马晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Publication of CN118229485A publication Critical patent/CN118229485A/zh
Pending legal-status Critical Current

Links

Abstract

本发明公开了一种基于ARIMA模型的地下水健康风险预警方法和系统,属于地下水健康风险预警领域,其中方法包括以下步骤:S1,收集原始的地下水监测点采样数据;S2,将采样数据按不同监测点和污染物,构建时间序列数据集;S3,对时间序列数据集进行进行相关性分析,选取模型结构,确立模型参数;S4,进行残差分析,检验模型结果;S5,选定地下水环境健康风险值计算模型,计算监测点人体健康风险值;S6,进行插值计算区域人体健康风险;S7,根据预先设定的阈值,对不同的监测点进行健康风险预警。本发明提高了地下水人体健康风险预测精度,有利于工业园区对人体健康的保护,大大提高了防控效率。其次及时的预警防控降低了健康事故发生风险。

Description

一种基于ARIMA模型的地下水健康风险预警方法和系统
技术领域
本发明涉及地下水健康风险预警技术领域,尤其涉及一种基于ARIMA模型的地下水健康风险预警方法和系统。
背景技术
工业园区通常涉及多种工业活动,可能释放有害物质,如化学品和废物。预测地下水某类污染物健康风险有助于早期发现潜在的风险问题,地下水质量的下降可能对园区内工作人员和周边社区的健康造成风险;有助于减轻潜在的人员健康问题。
传统的健康风险值计算和预测,往往利用统计数据进行趋势分析,传统的预警方法很难及时反映地下水人体健康风险趋势和影响,根据ARIMA模型的预测结果结合不同的警级设置可以有效的对疑似的风险进行分级响应处理;极大提高预警的精度和效率。
因此,本发明提出了一种基于ARIMA模型的地下水健康风险预警方法和系统,基于ARIMA模型对获取的健康风险值,对数据进行预处理,通过模型进行地下水健康风险值进行预测,提高预测的准确性和精度,并对工作人员进行预警。
发明内容
为解决上述问题,本发明提供一种基于ARIMA模型的地下水健康风险预警方法和系统,基于ARIMA模型对获取的健康风险值,对数据进行预处理,保证数据的准确性和完整性,提高模型的可靠性,结合历史和实时数据,基于机器学习的方式,通过模型进行地下水健康风险值进行预测,提高预测的准确性和精度,还能够展示目标区域内的人体健康风险的分布情况,及时给管理人员预警,进行地下水污染的治理。
为实现上述目的,本发明提供了一种基于ARIMA模型的地下水健康风险预警方法,包括以下步骤:
S1,收集原始的地下水监测点采样数据并传入数据库;
S2,对采样数据进行预处理,将采样数据按不同监测点和污染物,构建时间序列数据集;
S3,对时间序列数据集进行平稳化检验、差分处理后进行相关性分析,选取模型结构,确立模型参数;
S4,对建立的ARIMA模型进行残差分析,检验模型结果,并进行地下水健康风险预测;
S5,选定地下水环境健康风险值计算模型,计算监测点人体健康风险值;
S6,进行插值计算区域人体健康风险;
S7,根据预先设定的阈值,对不同的监测点进行健康风险预警。
优选的,步骤S1中,收集数据时,每月进行一次采样,从取样点采集的样品进行检测后,获得原始的地下水污染数据,并将初始数据传入数据库当中。
优选的,步骤S3包括步骤S31、步骤S32和步骤S33,
步骤S31:对整理的时间序列数据集进行预处理,去除序列数据中的异常值和缺失值,整理为若干年内每个月选定污染物的时间序列数据。
优选的,步骤S32:绘制时间序列图观察时间序列趋势,通过ADF检验方法,检验序列是否含有平方根来判断时间序列数据是否平稳,判断为符合预设条件的时间序列数据进行下一步的相关性分析,判断为不符合预设条件的时间序列数据进行差分处理,一阶或者多阶差分后,再进行相关性分析。
优选的,步骤S33:通过计算获取数据的自相关系数ACF和偏相关系数PACF,根据ACF和PACF图初步选定预估的自回归阶数和滑动平均阶数作为建模系数结构,设立信息准则AIC选择合适的ARIMA(p,d,q)的阶数后进行模型预测;根据AIC,BIC准则确定的参数值,作为最佳参数建立ARIMA模型。
优选的,步骤S4包括步骤S41、步骤S42,
步骤S41:进行残差分析,判断建立对应ARIMA模型是否满足精度要求;检验残差之间是否是独立的,残差序列的随机性通过自相关函数法来检验,根据残差的自相关函数图,当残值均被包络在函数上下界限中,视为通过模型检验;
步骤S42:输入时间序列数据,对未来的地下水健康风险值进行预测。
优选的,步骤S5中,根据需求选择不同的地下水环境健康风险值计算模型,计算各个监测点关注污染物的人体健康风险值。
优选的,步骤S6中,选择需要的插值模型,用户将监测井点预测结果输入插值模型,预测整个区域尺度的人体健康风险,绘制整个区域的人体健康风险图。
优选的,步骤S7中,预设三种警级指标,分别为轻警、中警、重警,根据风险预测的结果与预警系统预先设置好的阈值进行比对;根据不同的阈值范围,不同的人体健康风险值会触发不同的警级和预警响应措施,及时去预防和处理最可能造成人体健康风险事故的区域。
本发明还提供了一种基于ARIMA模型的地下水健康风险预警系统,包括数据收集处理模块,用于获取到目标区域地下水污染物检测的原始数据,原始数据包括历年各时间段对应的地下水污染物浓度的监测数据,构成时间序列数据;
模型分析模块,用于进行时间序列数据的预处理,时间序列数据的平稳性校验,对不满足条件的数据进行差分处理,对差分后结果进行分析,通过自相关系数和偏相关系数初步估计参数,通过AICF方法,确定ARIMA模型的(p,d,q)参数组合,模型效果校验和预测;
风险预测模块,用于根据预测的结果和选定的地下水健康风险计算模型,计算人体健康风险值,并利用插值模型,绘制整个区域的地下水健康风险分布图;
风险预警模块,用于根据风险值计算结果,结合不同的阈值范围,对区域内人体健康风险进行警级划分,并显示不同的预警响应。
本发明具有以下有益效果:
本发明基于ARIMA模型对获取的健康风险值,对数据进行预处理,可以有效的确保数据的准确性和完整性,提高模型的可靠性,结合历史和实时数据,基于机器学习的方式,通过模型进行地下水健康风险值进行预测,可以提高预测的准确性和精度,可以展示目标园区区域内的人体健康风险的分布情况,可以及时的给管理人员预警,进行地下水污染的治理。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
图1为本发明实施例的方法流程图;
图2为本发明实施例的ARIMA模型分析板块建模流程图;
图3为本发明实施例的人体健康风险分布图;
图4为本发明实施例的人体健康风险预警响应图。
具体实施方式
为了使本发明实施例公开的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明实施例进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本发明实施例,并不用于限定本发明实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。
需要说明的是,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明的描述中,需要说明的是,术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“安装”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
如图1所示,本发明所述的一种基于ARIMA模型的地下水健康风险预警系统,包括:
数据收集处理模块,用于获取到某一时间段目标区域地下水污染物检测的原始数据,原始数据包括历年各时间段对应的地下水污染物浓度的监测数据,构成时间序列数据。
模型分析模块,用于进行时间序列数据的预处理,时间序列数据的平稳性校验,对不满足条件的数据进行差分处理,对差分后结果进行分析,通过自相关系数和偏相关系数初步估计参数,通过AICF方法,确定ARIMA模型的(p,d,q)参数组合,模型效果校验和预测。
风险预测模块,用于根据预测的结果和选定的地下水健康风险计算模型,计算人体健康风险值,并利用插值模型,绘制整个区域的地下水健康风险分布图。
风险预警模块,用于根据风险值计算结果,结合不同的阈值范围,对区域内人体健康风险进行警级划分,并显示不同的预警响应。
如图1、图2所示,本发明提供了一种基于ARIMA模型的地下水健康风险预警方法,包括以下步骤:
S1,收集原始的地下水监测点采样数据并传入数据库。
步骤S1中,收集数据时,每月进行一次采样,从取样点采集的样品进行检测后,获得原始的地下水污染数据,并将初始数据传入数据库当中。
本发明实施例以常州某试点工业园区近三年的地下水监测数据为原始数据为例,收集到该园区近三年的各监测点检测的地下水污染物浓度数据,整理至数据库当中。
S2,进行数据的预处理,将原始数据整理为按照监测点,污染物分类的序列数据,整理为可用的时间序列数据集。整理好的数据集发送到模型分析模块。
本实施例中,设置检测点位,经纬度,检测的污染物浓度,为不同的字段保存至一张表中,方便后续系统调用和查询;每种污染物按照采集时间,间隔为一月,整理成需要的时间序列数据,并将整理好的数据发往模型分析模块。
S3,对时间序列数据集进行平稳化检验、差分处理后进行相关性分析,选取模型结构,确立模型参数。
步骤S31:对整理的时间序列数据集进行预处理,受人为因素影响,去除序列数据中的异常值和缺失值,整理为近3-4年内每个月选定污染物的时间序列数据。
步骤S32:绘制时间序列图来直观的观察时间序列趋势,如果序列数据存在趋势或者周期性变化,可能为非平稳的。系统预设了ADF检验方法,可用来检验序列是否含有平方根,来判断序列数据是否平稳。判断为符合预设条件的时间序列数据进行下一步的相关性分析;同时,将判断为不符合预设条件的时间序列数据进行差分处理,一阶或者多阶差分后,再进行相关性分析。
步骤S33:通过计算获取数据的自相关系数ACF和偏相关系数PACF,根据ACF和PACF图初步选定预估的自回归阶数和滑动平均阶数作为建模系数结构,系统内设立信息准则AIC,BIC可以用以选择合适的ARIMA(p,d,q)的阶数后进行模型预测;根据BIC准则确定的参数值,作为最佳参数建立ARIMA模型。
本实施例中,(1)整理的时间序列数据受人为检测的影响可能存在异常值,去除其中的异常值,并对选定的污染物时间序列数据进行平稳化检验;(2)根据系统默认的ADF单位根检验,产出ADFStatic值,p值,CriticalValues,判断是否满足需求,通常P-value小于0.05时,拒绝原假设的置信度高。对于不满足要求的序列数据进行差分处理,每次差分后进行平稳性检验直到通过为止,确定d的值。(3)ARIMA定阶,p和q通过自相关函数ACF和偏自相关函数PACF来进行判定,判断规则通常采用拖尾和截尾准则,拖尾指序列以指数率单调递减或震荡衰减,而截尾指序列从某个时点变得非常小。
具体规则为
模型序列 AR(P) MA(Q) ARMA(P,Q)
自相关函数 拖尾 第Q个后截尾 拖尾
偏自相关函数 第Q个后截尾 拖尾 拖尾
根据拖尾和截尾规则进行判断带有主观性,系统设置了使用信息准则函数来进行验证,默认有AIC最小化信息量准则和BIC贝叶斯信息准则。根据BIC准则可以获得最佳的ARIMAp,q参数组合。确定ARIMA阶数后进行污染物浓度预测。
S4,对建立的ARIMA模型进行残差分析,检验模型结果,并进行地下水健康风险预测。
步骤S41:进行残差分析,判断建立对应ARIMA模型是否满足精度要求;检验残差之间是否是独立的,残差序列的随机性可以通过自相关函数法来检验,根据残差的自相关函数图,当残值都被包络在函数上下界限中,即视为通过模型检验。
步骤S42:输入时间序列数据,对未来的地下水健康风险值进行预测;将预测结果发送到风险预测板块。
本实施例中,(4)检验残差序列的随机性,即残差之间是独立的残差序列的随机性可以通过自相关函数法来检验,通过残差的自相关函数图,可以判断函数是否符合要求。(5)将模型预测的结果发送风险预测板块,对园区进行人体的健康风险预测。
S5,选定地下水环境健康风险值计算模型,计算监测点人体健康风险值。
步骤S5中,选定地下水环境健康风险值计算模型,可以根据需求选择不同的风险值计算模型。系统预设了多种风险评估模型(美国EPA的风险评估模型,中国地下水标准制定的地下水健康风险计算模型)计算各个监测点关注污染物的人体健康风险。
本实施例中,优选的,园区选定地下水环境监测预警指南规定的健康风险评估模型来计算,园区监测点的地下水人体健康风险,主要包括致癌风险和非致癌风险:
致癌风险计算公式:Risk=CDI×SF
非致癌风险计算公式:
S6,进行插值计算区域人体健康风险。
步骤S6中,选择需要的插值模型如克里金插值模型,反距离插值模型,用户可以将监测井点预测结果输入插值模型,可以预测整个园区尺度的人体健康风险;系统会产生一个整个园区的人体健康风险图,可以提供给管理人员进行分析防控;最后将各监测点的预测结果发送到风险预警模块。
本实施例中,系统会将预测的风险值数据与数据库中存储的监测点位的经纬度作为插值模型的输入值,优选的采用克里金插值模型作为插值模型来计算整个区域的风险值分布,系统绘制出园区的人体健康风险分布一览图。如图3,为常州某工业园区五种特征污染物的人体健康风险预测结果。
S7,根据预先设定的阈值,对不同的监测点进行健康风险预警。
步骤S7中,根据风险预测的结果与预警系统预先设置好的阈值进行比对,系统预设了三种警级指标,分别为轻警,中警,重警;根据不同的阈值范围,不同的人体健康风险值会触发不同的警级和预警响应措施,可以及时去预防和处理最可能造成人体健康风险事故的区域。图4为本实施例的预警响应图。
因此,本发明采用上述一种基于ARIMA模型的地下水健康风险预警方法和系统,基于ARIMA模型对获取的健康风险值,对数据进行预处理,保证数据的准确性和完整性,提高模型的可靠性,结合历史和实时数据,基于机器学习的方式,通过模型进行地下水健康风险值进行预测,提高预测的准确性和精度,还能够展示目标区域内的人体健康风险的分布情况,及时给管理人员预警,进行地下水污染的治理。
最后应说明的是:以上实施例仅用以说明本发明的技术方案而非对其进行限制,尽管参照较佳实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对本发明的技术方案进行修改或者等同替换,而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的精神和范围。

Claims (10)

1.一种基于ARIMA模型的地下水健康风险预警方法,其特征在于:包括以下步骤:
S1,收集原始的地下水监测点采样数据并传入数据库;
S2,对采样数据进行预处理,将采样数据按不同监测点和污染物,构建时间序列数据集;
S3,对时间序列数据集进行平稳化检验、差分处理后进行相关性分析,选取模型结构,确立模型参数;
S4,对建立的ARIMA模型进行残差分析,检验模型结果,并进行地下水健康风险预测;
S5,选定地下水环境健康风险值计算模型,计算监测点人体健康风险值;
S6,进行插值计算区域人体健康风险;
S7,根据预先设定的阈值,对不同的监测点进行健康风险预警。
2.根据权利要求1所述的基于ARIMA模型的地下水健康风险预警方法,其特征在于:步骤S1中,收集数据时,每月进行一次采样,从取样点采集的样品进行检测后,获得原始的地下水污染数据,并将初始数据传入数据库当中。
3.根据权利要求2所述的基于ARIMA模型的地下水健康风险预警方法,其特征在于:步骤S3包括步骤S31、步骤S32和步骤S33,
步骤S31:对整理的时间序列数据集进行预处理,去除序列数据中的异常值和缺失值,整理为若干年内每个月选定污染物的时间序列数据。
4.根据权利要求3所述的基于ARIMA模型的地下水健康风险预警方法,其特征在于:步骤S32:绘制时间序列图观察时间序列趋势,通过ADF检验方法,检验序列是否含有平方根来判断时间序列数据是否平稳,判断为符合预设条件的时间序列数据进行下一步的相关性分析,判断为不符合预设条件的时间序列数据进行差分处理,一阶或者多阶差分后,再进行相关性分析。
5.根据权利要求4所述的基于ARIMA模型的地下水健康风险预警方法,其特征在于:步骤S33:通过计算获取数据的自相关系数ACF和偏相关系数PACF,根据ACF和PACF图初步选定预估的自回归阶数和滑动平均阶数作为建模系数结构,设立信息准则AIC选择合适的ARIMA(p,d,q)的阶数后进行模型预测;根据AIC,BIC准则确定的参数值,作为最佳参数建立ARIMA模型。
6.根据权利要求5所述的基于ARIMA模型的地下水健康风险预警方法,其特征在于:步骤S4包括步骤S41、步骤S42,
步骤S41:进行残差分析,判断建立对应ARIMA模型是否满足精度要求;检验残差之间是否是独立的,残差序列的随机性通过自相关函数法来检验,根据残差的自相关函数图,当残值均被包络在函数上下界限中,视为通过模型检验;
步骤S42:输入时间序列数据,对未来的地下水健康风险值进行预测。
7.根据权利要求6所述的基于ARIMA模型的地下水健康风险预警方法,其特征在于:步骤S5中,根据需求选择不同的地下水环境健康风险值计算模型,计算各个监测点关注污染物的人体健康风险值。
8.根据权利要求7所述的基于ARIMA模型的地下水健康风险预警方法,其特征在于:步骤S6中,选择需要的插值模型,用户将监测井点预测结果输入插值模型,预测整个区域尺度的人体健康风险,绘制整个区域的人体健康风险图。
9.根据权利要求8所述的基于ARIMA模型的地下水健康风险预警方法,其特征在于:步骤S7中,预设三种警级指标,分别为轻警、中警、重警,根据风险预测的结果与预警系统预先设置好的阈值进行比对;根据不同的阈值范围,不同的人体健康风险值会触发不同的警级和预警响应措施,及时去预防和处理最可能造成人体健康风险事故的区域。
10.一种基于ARIMA模型的地下水健康风险预警系统,其特征在于:包括数据收集处理模块,用于获取到目标区域地下水污染物检测的原始数据,原始数据包括历年各时间段对应的地下水污染物浓度的监测数据,构成时间序列数据;
模型分析模块,用于进行时间序列数据的预处理,时间序列数据的平稳性校验,对不满足条件的数据进行差分处理,对差分后结果进行分析,通过自相关系数和偏相关系数初步估计参数,通过AICF方法,确定ARIMA模型的(p,d,q)参数组合,模型效果校验和预测;
风险预测模块,用于根据预测的结果和选定的地下水健康风险计算模型,计算人体健康风险值,并利用插值模型,绘制整个区域的地下水健康风险分布图;
风险预警模块,用于根据风险值计算结果,结合不同的阈值范围,对区域内人体健康风险进行警级划分,并显示不同的预警响应。
CN202410414835.5A 2024-04-08 一种基于arima模型的地下水健康风险预警方法和系统 Pending CN118229485A (zh)

Publications (1)

Publication Number Publication Date
CN118229485A true CN118229485A (zh) 2024-06-21

Family

ID=

Similar Documents

Publication Publication Date Title
CN116186566B (zh) 基于深度学习的扩散预测方法及系统
CN111275333B (zh) 污染数据处理方法和装置
CN108665119B (zh) 一种供水管网异常工况预警方法
CN108918815B (zh) 一种土壤重金属风险预测方法
CN210895538U (zh) 水质智能监管装置和设备
CN104636627A (zh) 一种土壤重金属生态风险评估方法
CN107436277A (zh) 基于相似距离判别的单指标数据质量控制方法
CN116340723B (zh) 基于大数据的乡村水污染快速溯源方法及系统
CN116362570A (zh) 一种基于大数据平台的多维度污染分析方法及系统
CN112198144A (zh) 一种快速污水溯源的方法及系统
CN110781225B (zh) 一种环境介质污染物浓度水平的诊断方法
CN112270633A (zh) 一种基于大数据驱动的公益诉讼线索研判系统和方法
CN116990479A (zh) 一种基于Zigbee技术的水质监测方法、系统、设备及介质
CN117370919B (zh) 污水处理设备远程监控系统
CN117172430B (zh) 一种基于深度学习的水体环境评估与预测方法及系统
Liu et al. Improved method for benthic ecosystem health assessment by integrating chemical indexes into multiple biological indicator species—A case study of the Baiyangdian Lake, China
CN112309506A (zh) 一种基于排序和概率的层次化生态风险评价方法
CN117368434A (zh) 一种基于大数据的水质监测系统
Moral et al. Mapping and hazard assessment of atmospheric pollution in a medium sized urban area using the Rasch model and geostatistics techniques
CN118229485A (zh) 一种基于arima模型的地下水健康风险预警方法和系统
CN115980286A (zh) 一种利用电子鼻对污水处理厂不同阶段废水检测的方法
CN115936192A (zh) 一种土壤环境污染物风险预测方法及系统
Rossouw A review of methods and generic criteria for determining impact significance
CN113990407B (zh) 对多氯萘及其同系物的含量及来源进行解析的解析方法
CN117875573B (zh) 一种基于生物毒性和生物有效性的水环境评价方法和系统

Legal Events

Date Code Title Description
PB01 Publication