预测断面水质参数数据的方法及装置
技术领域
本发明涉及数据处理领域,尤其涉及一种预测断面水质参数数据的方法及装置。
背景技术
在当今形势下,定量定性地了解区域内水质情况,对于合理的制定区域水质优化方案,提高水质治理的质量和效率,有效的治理水质污染,有着显著的现实意义。根据国家环保总局下发的《地表水环境质量标准》(GB 3838-88)文件,各水质参数等级是反映水质是否污染的一项重要指标。但当水质监测站出现故障时,缺失大量数据,这对后续的水质污染分析与监管会造成极大的麻烦,我们需要一种高效准确的方法,来填补缺失的数据。
现有方法中,较为简单的直接使用均值、众数、中位数进行填补,这些方法虽然快速,但与实际数据相差太大,不宜使用。或者使用插值法或时间序列模型来推测缺失数据,但这些方法太过单一,没有较好的鲁棒性。
发明内容
本发明实施例的目的是针对现有技术中存在的缺陷,提供一种预测断面水质参数的方法及装置,以解决现有技术中存在的问题。
第一方面,本发明提供了一种预测断面水质参数数据的方法,所述预测断面水质参数数据的方法包括:
实时获取第一监测站点的第一信息;所述第一信息包括第一监测站点的水质参数、水文参数和雨晴参数;
根据所述第一监测站点的第一信息,获取多个所述第一监测站点构成的汇水区的第二信息;所述第二信息包括汇水区的水质参数、水文参数和雨晴参数;
实时获取断面的第三信息;所述第三信息包括断面的水质参数、水文参数和雨晴参数;
根据预设时长内的所述第二信息和所述第三信息,计算各水质参数的第一相关系数,各所述水质参数与各所述雨晴参数的第二相关系数以及各所述水质参数与各所述水文参数的第三相关系数;多个所述第一相关系数构成第一集合,多个所述第二相关系数构成第二集合,多个所述第三相关系数构成第三集合;
根据预设的第一模型,分别对所述第一集合中的各第一相关系数、所述第二集合中的各第二相关系数和所述第三集合中的各第三相关系数进行拟合,确定其中存在正相关的参数、存在负相关的参数以及无相关性的参数;
如果当前断面的第三信息中,目标参数缺失,确定与所述目标参数无相关性的参数;
根据与所述目标参数无相关性的参数以及预设的第二模型,确定目标参数的数值。
在一种可能的实现方式中,所述根据所述第一监测站点的第一信息,实时获取多个所述第一监测站点构成的汇水区的第二信息,具体包括:
根据预设的间距,对所述汇水区进行划分,得到多个网格;
根据所述第一监测站点所在的网格的第一信息,插值得到其它网格的信息;所述第一监测站点所在的网格的第一信息和所述其它网格的信息,构成第二信息。
在一种可能的实现方式中,所述根据所述第一监测站点所在的网格的第一信息,插值得到其它网格的信息具体包括:
计算所述第一信息中,所述水质参数、所述水文参数和所述雨晴参数中,每种参数的小时均值;
对所述小时均值进行插值,得到其它网格的信息,所述小时均值和所述其它网格的信息,构成所述汇水区的第二信息。
在一种可能的实现方式中,所述根据所述第一监测站点所在的网格的第一信息,插值得到其它网格的信息,具体包括:
在同一时间维度下,对所述第一信息中,所述水质参数、所述水文参数和所述雨晴参数中的每种参数进行插值,得到汇水区的实时第二信息;
计算所述实时第二信息的均值,得到汇水区的第二信息。
在一种可能的实现方式中,所述水质参数包括溶解氧、氨氮、化学需氧量、总氮和PH;所述水文参数包括浊度和径流流速;所述雨晴参数包括降雨量和光照。
在一种可能的实现方式中,所述溶解氧、氨氮与化学需氧量正相关、溶解氧与氨氮负相关、氨氮与总氮正相关、溶解氧与PH正相关、氨氮、化学需氧量与降雨量正相关、溶解氧与光照正相关、浊度与径流流速正相关。
第二方面,本发明提供了一种预测断面水质参数数据的装置,所述预测断面水质参数数据的装置包括:
获取单元,所述获取单元用于,实时获取第一监测站点的第一信息;所述第一信息包括第一监测站点的水质参数、水文参数和雨晴参数;
所述获取单元还用于,根据所述第一监测站点的第一信息,获取多个所述第一监测站点构成的汇水区的第二信息;所述第二信息包括汇水区的水质参数、水文参数和雨晴参数;
所述获取单元还用于,实时获取断面的第三信息;所述第三信息包括断面的水质参数、水文参数和雨晴参数;
计算单元,所述计算单元用于,根据预设时长内的所述第二信息和所述第三信息,计算各水质参数的第一相关系数,各所述水质参数与各所述雨晴参数的第二相关系数以及各所述水质参数与各所述水文参数的第三相关系数;多个所述第一相关系数构成第一集合,多个所述第二相关系数构成第二集合,多个所述第三相关系数构成第三集合;
拟合单元,所述拟合单元用于,根据预设的第一模型,分别对所述第一集合中的各第一相关系数、所述第二集合中的各第二相关系数和所述第三集合中的各第三相关系数进行拟合,确定其中存在正相关的参数、存在负相关的参数以及无相关性的参数;
确定单元,所述确定单元用于,如果当前断面的第三信息中,目标参数缺失,确定与所述目标参数无相关性的参数;
所述确定单元还用于,根据与所述目标参数无相关性的参数以及预设的第二模型,确定目标参数的数值。
第三方面,本发明提供了一种预测断面水质参数数据的设备,包括存储器和处理器,所述存储器用于存储程序,所述处理器用于执行第一方面任一所述的方法。
第四方面,本发明提供了一种包含指令的计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面任一所述的方法。
第五方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一所述的方法。
通过应用本发明提供的预测断面水质参数数据的方法及装置,提高了预测结果的鲁棒性。
附图说明
图1为本发明实施例一提供的预测断面水质参数数据的方法流程示意图;
图2为本发明实施例二提供的预测断面水质参数数据的装置结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1为本发明实施例一提供的预测断面水质参数数据的方法流程示意图。该方法的应用场景为断面的监测设备读数异常,如图1所示,包括以下步骤:
步骤101,实时获取第一监测站点的第一信息;第一信息包括第一监测站点的水质参数、水文参数和雨晴参数;水质参数包括溶解氧、氨氮、化学需氧量、总氮和PH;水文参数包括浊度和径流流速;雨晴参数包括降雨量和光照。
其中,第一监测站点为国家布设的河流监测设备的点位。水质参数是用以表示水环境(水体)质量优劣程度和变化趋势的水中各种物质的特征指标。水质参数包括但不限于:PH值、溶解氧、化学需氧量、氨氮、总氮、总磷、高锰酸盐。水文参数为河流水文特征,包括但不限于:水位、流量、最大流量、汛限水位和流速。雨晴参数包括但不限于降雨量和光照(强度)。
步骤102,根据第一监测站点的第一信息,获取多个第一监测站点构成的汇水区的第二信息;第二信息包括汇水区的水质参数、水文参数和雨晴参数。
其中,汇水区,又称作集水区域、集水盆地、流域盆地,是指地表径流或其他物质汇聚到一共同的出水口的过程中所流经的地表区域,它是一个封闭的区域。在一个汇水区中,第一监测站点的个数是有限的,所产生的数据不足以支持每个汇水区的分析统计,针对第一监测站点少,数据不足等情况,可以通过插值,得到汇水区的第二信息,以保证汇水区的数据充足,减少小概率事件对整体的影响。因此,如果需要确定汇水区的第二信息,可以先对汇水区进行划分,后进行插值。
具体的,可以根据预设的间距,对汇水区进行划分,得到多个网格;最后,根据第一监测站点所在的网格的第一信息,插值得到其它网格的信息;第一监测站点所在的网格的第一信息和其它网格的信息,构成第二信息。
比如,汇水区的面积为1km*1km,预设的间隔可以设置为200m,则可以将汇水区划分为25个网格。可以假设25个网格中,存在两个第一监测站点,根据这两个第一监测站点的监测设备上的信息,插值得到其它网格的信息。由此,得到了汇水区的第二信息。
再进一步的,为了在提高数据精度的同时,减少运算量,提高处理速度,可以先对第一信息计算小时均值,然后对小时均值进行插值,得到其它网格的信息。
再进一步的,还可以在同一时间维度下,对第一信息中,水质参数、水文参数和雨晴参数中的每种参数进行插值,得到汇水区的实时第二信息;计算实时第二信息的均值,得到汇水区的第二信息。
这两种方法都可以达到上述减少运算量,提高处理速度的效果。
步骤103,实时获取断面的第三信息;第三信息包括断面的水质参数、水文参数和雨晴参数。
其中,断面为河流中的断面,在断面处,设有监测设备,用以获取断面处的水质、水文特制以及雨晴参数。
步骤104,根据预设时长内的第二信息和第三信息,计算各水质参数的第一相关系数,各水质参数与各雨晴参数的第二相关系数以及各水质参数与各水文参数的第三相关系数;多个第一相关系数构成第一集合,多个第二相关系数构成第二集合,多个第三相关系数构成第三集合。
其中,预设的模型可以根据历史数据,训练的水动力水质模型。可以根据该模型,计算水质参数中各个参数的相关系数,水质参数与水文参数的相关系数以及水质参数与雨晴参数的相关系数。
比如,可以计算溶解氧、氨氮与化学需氧量的相关系数、溶解氧与氨氮的相关系数、氨氮与总氮的相关系数、溶解氧与PH的相关系数,这些相关系数可以称为第一相关系数,多个第一相关系数构成第一相关系数集。
步骤105,根据预设的第一模型,分别对第一集合中的各第一相关系数、第二集合中的各第二相关系数和第三集合中的各第三相关系数进行拟合,确定其中存在正相关的参数、存在负相关的参数以及无相关性的参数。
接上例,经过计算,可以得到该些存在相关性的参数之间的关系为:溶解氧、氨氮与化学需氧量正相关、溶解氧与氨氮负相关、氨氮与总氮正相关、溶解氧与PH正相关、氨氮、化学需氧量与降雨量正相关、溶解氧与光照正相关、浊度与径流流速正相关。除了存在正相关和负相关的参数,其余相关性低的或者没有相关性的,统一认为无相关性。
步骤106,如果当前断面的第三信息中,目标参数缺失,确定与目标参数无相关性的参数。
步骤107,根据与目标参数无相关性的参数以及预设的第二模型,确定目标参数的数值。
比如,由于设备故障,断面处的数据,缺失溶解氧,根据上述关系可知,溶解氧与总氮、浊度、径流流速、降雨量无关。此时,可以将当前之前以及当前断面处的总氮、浊度、径流流速、降雨量带入第二模型进行训练。根据训练好的模型,带入断面处的总氮、浊度、径流流速、降雨量后,可以得到断面处的溶解氧的具体数值。
第二模型可以是线性回归模型。
通过应用本发明实施例一提供的预测断面水质参数数据的方法,通过第一监测站点的水质、水文和雨晴参数,计算得到汇水区的水质、水文和雨晴参数、接着根据汇水区与断面处的水质、水文和雨晴参数的关系,确定无相关性的参数,最后根据无相关性的参数,确定断面处缺失的参数的数据,提高了预测的断面处参数的鲁棒性。
图2为本发明实施例二提供的预测断面水质参数数据的装置结构示意图。该装置可以应用再预测断面水质参数数据的方法中。如图2所示,该装置包括:获取单元201、计算单元202、拟合单元203和确定单元204。
获取单元201用于,实时获取第一监测站点的第一信息;第一信息包括第一监测站点的水质参数、水文参数和雨晴参数;
获取单元201还用于,根据第一监测站点的第一信息,获取多个第一监测站点构成的汇水区的第二信息;第二信息包括汇水区的水质参数、水文参数和雨晴参数;
获取单元201还用于,实时获取断面的第三信息;第三信息包括断面的水质参数、水文参数和雨晴参数;
计算单元202用于,根据预设时长内的第二信息和第三信息,计算各水质参数的第一相关系数,各水质参数与各雨晴参数的第二相关系数以及各水质参数与各水文参数的第三相关系数;多个第一相关系数构成第一集合,多个第二相关系数构成第二集合,多个第三相关系数构成第三集合;
拟合单元203用于,根据预设的第一模型,分别对第一集合中的各第一相关系数、第二集合中的各第二相关系数和第三集合中的各第三相关系数进行拟合,确定其中存在正相关的参数、存在负相关的参数以及无相关性的参数;
确定单元204用于,如果当前断面的第三信息中,目标参数缺失,确定与目标参数无相关性的参数;
确定单元204还用于,根据与目标参数无相关性的参数以及预设的第二模型,确定目标参数的数值。
本申请实施例二提供的预测断面水质参数数据的装置的具体工作过程和实施例一提供的预测断面水质参数数据的方法相对应,此处不再赘述。
通过应用本发明实施例提供的预测断面水质参数数据的装置,提高了预测的断面处参数的鲁棒性。
本发明实施例三提供了一种预测断面水质参数数据的设备,包括存储器和处理器,存储器用于存储程序,处理器用于执行本发明实施例一提供的方法。
本发明实施例四提供了一种包含指令的计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行本发明实施例一提供的方法。
本发明实施例五提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现本发明实施例一提供的方法。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。