CN111382929A - 一种构建河流硅藻水华预警模型的方法及装置 - Google Patents
一种构建河流硅藻水华预警模型的方法及装置 Download PDFInfo
- Publication number
- CN111382929A CN111382929A CN202010122030.5A CN202010122030A CN111382929A CN 111382929 A CN111382929 A CN 111382929A CN 202010122030 A CN202010122030 A CN 202010122030A CN 111382929 A CN111382929 A CN 111382929A
- Authority
- CN
- China
- Prior art keywords
- river
- early warning
- warning model
- support vector
- vector machine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000012706 support-vector machine Methods 0.000 claims abstract description 80
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims abstract description 39
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 33
- 230000002068 genetic effect Effects 0.000 claims abstract description 29
- 238000004364 calculation method Methods 0.000 claims abstract description 25
- 241000195493 Cryptophyta Species 0.000 claims abstract description 19
- 238000005457 optimization Methods 0.000 claims abstract description 7
- 230000006870 function Effects 0.000 claims description 38
- 230000015654 memory Effects 0.000 claims description 18
- 238000012512 characterization method Methods 0.000 claims description 16
- 238000012549 training Methods 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 7
- 230000004927 fusion Effects 0.000 claims description 6
- 239000000654 additive Substances 0.000 claims description 5
- 230000000996 additive effect Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 description 10
- 241000192710 Microcystis aeruginosa Species 0.000 description 7
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 4
- 238000012851 eutrophication Methods 0.000 description 4
- 229910052760 oxygen Inorganic materials 0.000 description 4
- 239000001301 oxygen Substances 0.000 description 4
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 3
- XKMRRTOUMJRJIA-UHFFFAOYSA-N ammonia nh3 Chemical compound N.N XKMRRTOUMJRJIA-UHFFFAOYSA-N 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 229910052698 phosphorus Inorganic materials 0.000 description 3
- 239000011574 phosphorus Substances 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008020 evaporation Effects 0.000 description 2
- 238000001704 evaporation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 101150084750 1 gene Proteins 0.000 description 1
- 101100272279 Beauveria bassiana Beas gene Proteins 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A20/00—Water conservation; Efficient water supply; Efficient water use
- Y02A20/152—Water filtration
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Bioinformatics & Computational Biology (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Alarm Systems (AREA)
Abstract
本发明公开了一种构建河流硅藻水华预警模型的方法及装置,该方法包括:根据河流水文要素数据、水质要素数据及藻密度进行分析,得到河流硅藻水华预警模型的关键影响因子;根据关键影响因子数据集进行融合,得到支持向量机的样本集;运用遗传算法对支持向量机的参数进行优化计算,得到支持向量机参数的最优解;根据支持向量机的样本集和最优解构建河流硅藻水华预警模型,进行水华预警。通过实施本发明,运用支持向量机算法,可以使得运算更为高效,提升预警时效性,同时采用的遗传算法可以考虑到种群进化的动态性,能够快速准确找到最优解,提高了模型效率和计算精度,具有较好的实用性。
Description
技术领域
本发明涉及水生态技术领域,具体涉及一种构建河流硅藻水华预警模型的方法及装置。
背景技术
水华和富营养化通常发生在湖泊和水库等流速较慢的水体中,在大型流动河流中较为罕见。因此,现有的水华预测技术一般集中于湖库水体,针对大型河流硅藻水华暴发的预测预警相对较少。而真实情景下河流富营养化暴发机理十分复杂,尤其是在气候变化和强人类活动影响下,流域区间降雨以及闸坝调度引起的下泄流量改变,均会导致河道水文情势发生变化,可能会对河流富营养化程度造成不利影响。硅藻水华生成过程具有强非线性、时变性等特性,影响因子较多,仅仅通过建立水华机理模型进行水华预测的效果往往并不理想,如何对其准确预测逐步成为一个国际性难题。
当前多数富营养化和水华预测预警模型是面向湖泊和湖库水华预测模拟,但是传统湖库经验模型对于模拟预测复杂大型河流水华的暴发局限较大,目前多用于湖泊和水库等水流相对静止的水体的半定量化评估手段;此外,虽然水生态动力学模型在河流水华模拟和预测研究中最具有物理内涵,并且还考虑了系统中生态过程及各要素之间的内在变化规律,然而其缺点也十分明显,即需要大量的参数和数据支持,参数的率定和验证也十分繁琐,在当前河流水华暴发成因机理还不十分明确的情况下,模型效率和预测精度不是十分理想。
发明内容
有鉴于此,本发明实施例提供了一种河流硅藻水华预警方法及装置,以解决现有技术中针对大型河流水华预测模型预测精度较低的问题。
本发明提出的技术方案如下:
本发明实施例第一方面提供一种构建河流硅藻水华预警模型的方法,该方法包括如下步骤:根据河流水文要素数据、水质要素数据及藻密度进行分析,得到河流硅藻水华预警模型的关键影响因子;根据所述关键影响因子数据集进行融合,得到支持向量机的样本集;运用遗传算法对支持向量机的参数进行优化计算,得到支持向量机参数的最优解;根据所述支持向量机的样本集和所述最优解构建河流硅藻水华预警模型。
进一步地,根据河流水文要素数据、水质要素数据及藻密度进行分析,得到河流硅藻水华预警模型的关键影响因子,包括:根据河流藻密度确定河流硅藻水华的表征因素;根据河流水文要素数据、水质要素数据确定河流硅藻水华的影响因素;根据广义加性模型计算得到所述影响因素和表征因素之间的相关性;根据所述相关性确定与所述表征因素显著相关的影响因素;根据与所述表征因素显著相关的影响因素确定河流硅藻水华预警模型的关键影响因子。
进一步地,根据所述关键影响因子数据集进行融合,得到支持向量机的样本集,包括:对所述关键影响因子和藻密度进行归一化处理,计算得到支持向量机的样本集。
进一步地,运用遗传算法对支持向量机的参数进行优化计算,得到支持向量机参数的最优解,包括:根据遗传算法参数对支持向量机的惩罚参数和高斯核函数参数所有可能的解进行编码,得到惩罚参数和高斯核函数参数的可疑解;根据所述可疑解计算得到遗传算法每个初始个体的适应度值;根据所述适应度值确定惩罚参数和高斯核函数参数的最优解。
进一步地,根据所述支持向量机的样本集和所述最优解构建河流硅藻水华预警模型,包括:根据支持向量机对所述样本集进行训练,计算得到回归函数;根据结构风险最小化准则对所述回归函数进行计算,得到改进后的回归函数;根据改进后的回归函数、径向基函数及最优解构建河流硅藻水华预警模型。
进一步地,该构建河流硅藻水华预警模型的方法还包括:判断所述河流硅藻水华预警模型是否达到预设精度;当所述河流硅藻水华预警模型不满足预设精度时,再次计算支持向量机的样本集;根据再次计算的支持向量机的样本集和所述最优解构建河流硅藻水华预警模型。
进一步地,该构建河流硅藻水华预警模型的方法还包括:当所述河流硅藻水华预警模型满足预设精度时,根据所述河流硅藻水华预警模型进行河流硅藻水华预警。
本发明实施例第二方面提供一种构建河流硅藻水华预警模型的装置,该装置包括:关键影响因子筛选模块,用于根据河流水文要素数据、水质要素数据及藻密度进行分析,得到河流硅藻水华预警模型的关键影响因子;样本集获取模块,用于根据所述关键影响因子数据集进行融合,得到支持向量机的样本集;最优解计算模块,用于运用遗传算法对支持向量机的参数进行优化计算,得到支持向量机参数的最优解;预警模型构建模块,用于根据所述支持向量机的样本集和所述最优解构建河流硅藻水华预警模型。
本发明实施例第三方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如本发明实施例第一方面及第一方面任一项所述的构建河流硅藻水华预警模型的方法。。
本发明实施例第四方面提供一种构建河流硅藻水华预警模型的系统,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行如本发明实施例第一方面及第一方面任一项所述的构建河流硅藻水华预警模型的方法。
本发明提供的技术方案,具有如下效果:
本发明实施例提供的构建河流硅藻水华预警的模型方法及装置,在关键影响因子的选取上不仅考虑了水质要素数据如pH值、总磷、总氮、氨氮等,还加入了可能导致大型河流水华暴发关键敏感驱动因子水文要素数据如流量、水位、流速、水温等。由于河流较湖库水体流速更快,水文要素在河流硅藻水华的发生中有着重要影响,因此本发明实施例提供的构建河流硅藻水华预警模型的方法构建的预警模型可以用于大型流动河流水体的硅藻水华预测,能够为我国环保和水利部门进行河流水华预警提供技术支撑。
本发明实施例提供的构建河流硅藻水华预警模型的方法及装置,运用遗传算法对支持向量机的参数进行优化选择,获取最佳分类精度的支持向量机参数,并应用于构建河流硅藻水华预警模型当中。在该方法中,运用了支持向量机算法,可以使得运算更为高效,缩短预警时间,提升水华预警的时效性,同时运用的遗传算法可以考虑到种群进化的动态性,能够快速准确找到最优解,提高了模型效率和计算精度,具有较好的实用性。由此可见,本发明实施例提供的构建河流硅藻水华预警模型的方法,能够有效提高河流硅藻水华预测的时效性,减小模型构建过程中的困难,使河流硅藻水华预测更加切实可行,帮助有关部门在应对突发状况时能够快速启动水华预警。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的构建河流硅藻水华预警模型的方法的流程图;
图2是根据本发明另一实施例的构建河流硅藻水华预警模型的方法的流程图;
图3是根据本发明另一实施例的构建河流硅藻水华预警模型的方法的流程图;
图4是根据本发明另一实施例的构建河流硅藻水华预警模型的方法的流程图;
图5是根据本发明另一实施例的构建河流硅藻水华预警模型的方法的流程图;
图6是根据本发明另一实施例的构建河流硅藻水华预警模型的方法的流程图;
图7是根据本发明另一实施例的构建河流硅藻水华预警模型的方法的流程图;
图8是根据本发明实施例的构建河流硅藻水华预警模型的装置的结构框图;
图9是本发明实施例提供的构建河流硅藻水华预警模型的系统的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种构建河流硅藻水华预警模型的方法,如图1所示,该方法包括如下步骤:
步骤S101:根据河流水文要素数据、水质要素数据及藻密度进行分析,得到河流硅藻水华预警模型的关键影响因子。具体地,水文要素数据包括河流流量、水位、流速、水温、降雨量、蒸发量等;水质要素数据包括pH值、总磷、总氮、氨氮、溶解氧、生物需氧量等。本发明只是对水文、水质要素数据进行举例说明,在具体实施中,也可以选取更多的要素数据。
步骤S102:根据关键影响因子数据集进行融合,得到支持向量机的样本集。
步骤S103:运用遗传算法对支持向量机的参数进行优化计算,得到支持向量机参数的最优解。
步骤S104:根据支持向量机的样本集和最优解构建河流硅藻水华预警模型。
本发明实施例提供的构建河流硅藻水华预警模型的方法,在关键影响因子的选取上不仅考虑了水质要素数据,还加入了可能导致大型河流水华暴发关键敏感驱动因子水文要素数据。由于河流较湖库水体流速更快,水文要素在河流硅藻水华的发生中有着重要影响,因此本发明实施例提供的构建河流硅藻水华预警模型的方法构建的预警模型可以用于大型流动河流水体的硅藻水华预测,能够为我国环保和水利部门进行河流水华预警提供技术支撑。
本发明实施例提供的构建河流硅藻水华预警模型的方法,利用遗传算法对支持向量机的参数进行优化选择,获取最佳分类精度的支持向量机参数,并应用于构建河流硅藻水华预警模型当中。在该方法中,运用了支持向量机算法,可以使得运算更为高效,同时采用的遗传算法可以考虑到种群进化的动态性,能够快速准确找到最优解,提高了模型效率和计算精度,具有较好的实用性。由此可见,本发明实施例提供的构建河流硅藻水华预警模型的方法,能够有效提高河流硅藻水华预测的时效性,减小模型构建过程中的困难,使河流硅藻水华预测更加切实可行,帮助有关部门在应对突发状况时能够快速启动水华预警。
在一实施例中,如图2所示,步骤S101根据河流水文要素数据、水质要素数据及藻密度进行分析,得到河流硅藻水华预警模型的关键影响因子,包括:
步骤S201:根据河流藻密度确定河流硅藻水华的表征因素。
步骤S202:根据河流水文要素数据、水质要素数据确定河流硅藻水华的影响因素。具体地,根据上述步骤S101,影响因素具体可以包括河流流量、水位、流速、水温、降雨量、蒸发量、pH值、总磷、总氮、氨氮、溶解氧、生物需氧量等。
步骤S203:根据广义加性模型计算得到影响因素和表征因素之间的相关性。具体地,广义加性模型(Generalized Additive Models,GAM)是一种自由灵活的统计模型,它可以用来探测到非线性回归的影响,也可以称为广义相加模型。采用GAM分析各影响因素与表征因素之间的相关性时,具体可以根据公式(1)进行计算。
其中,s(μ)为影响因素的连续函数,μ为表征因素期望值,选取藻密度对数值;a为恒定截距;fi为各影响因素的平滑函数,描述表征因素与第i个影响因素xi之间的关系。
步骤S204:根据相关性确定与表征因素显著相关的影响因素;具体地,当计算得到各影响因素的相关性之后,可以针对计算结果以相关显著性水平P对各影响因素进行筛选,得到与表征因素显著相关的影响因素,具体可以选择P≤0.05的影响因素。
步骤S205:根据与表征因素显著相关的影响因素确定河流硅藻水华预警模型的关键影响因子。具体地,可以根据该广义相加模型得到针对不同影响因素的解释率,并将步骤S114筛选出的影响因素以步进法输入该广义相加模型,获取解释率最大时的影响因素作为河流硅藻水华预警模型的关键影响因子。
在一实施例中,步骤S102根据关键影响因子数据集进行融合,得到支持向量机的样本集,包括:对关键影响因子和藻密度进行归一化处理,计算得到支持向量机的样本集。具体可以对关键影响因子和藻密度的监测数据进行归一化处理,归一化的计算公式可以用公式(2)表示。
需要说明的是,在进行归一化的过程中,可以针对数据值变化幅度较大的藻密度等指标进行多次开方处理,以降低过低值对于模型拟合的影响,提高模型对藻密度高值的敏感性。
在一实施例中,如图3所示,步骤S103运用遗传算法对支持向量机的参数进行优化计算,得到支持向量机参数的最优解,包括如下步骤:
步骤S301:根据遗传算法参数对支持向量机的惩罚参数和高斯核函数参数所有可能的解进行编码,得到惩罚参数和高斯核函数参数的可疑解;具体地,在进行编码之前,可以设置支持向量机的惩罚参数c和高斯核函数参数g参数的寻优范围为[-10,10],并设置遗传算法的各个参数:最大进化代数为100,种群最大数量为20,交叉概率为10,变异概率为0.9。
在一实施例中,基于所设置的遗传算法参数,通过随机形式对所有可能的解进行编码产生初始种群,获得相应个体的c、g参数的可疑解,每个个体拥有2个染色体,每个染色体携带1个基因,这里基因可以采用二进制编码进行处理。
步骤S302:根据可疑解计算得到遗传算法每个初始个体的适应度值;具体地,在计算种群中每个初始个体的适应度值时,可以通过遗传算法对初始种群进行训练,并根据适应度值来决定选择下一代的个体,采用轮盘赌选择法选取优秀个体,将上一代优秀个体进行选择、交叉、变异产生新个体,判断产生的新个体是否满足终止条件,若不满足,则继续迭代训练。
步骤S303:根据适应度最优个体确定惩罚参数和高斯核函数参数的最优解。具体地,当产生的新个体满足终止条件时,则运算结束。将计算得到的适应度最优的个体输出,并对该个体解码得到c、g参数的最优解。
在一实施例中,如图4所示,步骤S104根据支持向量机的样本集和最优解构建河流硅藻水华预警模型,包括:
步骤S401:根据支持向量机对所样本集进行训练,计算得到回归函数;具体地,可以设置支持向量机类型为v-SVR,基于v-SVR对步骤S102计算得到的训练集进行离散训练,即找到符合某一概率分布的训练数据的输入空间到输出空间的映射f:R→Rn,使y=f(x),将非线性回归映射到高维空间,得到回归函数,该回归函数可以用公式(3)表示。
f(x)=wTφ(x)+b 公式(3)
需要说明的是,支持向量机(SVM)本身是针对二分类问题提出的,而SVR(支持向量回归)是SVM(支持向量机)中的一个重要的应用分支。SVR回归与SVM分类的区别在于,SVR的样本点最终只有一类,它所寻求的最优超平面不是SVM那样使两类或多类样本点分的“最开”,而是使所有的样本点离着超平面的总偏差最小。
步骤S402:根据结构风险最小化对准则回归函数进行计算,得到改进后的回归函数;具体地,根据结构风险最小化计算时,可以引入松弛变量ξi,对回归函数进行改进,将回归函数转化为如公式(4)至公式(6)所示的最小化问题。
f(x)-yi≤ε+ξi 公式(5)
其中,C为惩罚因子,ε为数据到回归平面给定的距离容忍值。
步骤S403:根据改进后的回归函数、径向基函数及最优解构建河流硅藻水华预警模型。具体地,对于改进后回归函数,可以将其中的核函数K(xi,yi)用径向基函数(RBF)表示,因此,核函数K(xi,yi)可以用公式(12)表示。
将公式(12)带入公式(11),并代入步骤303计算得到的c、g参数的最优解,即可得到构建的河流硅藻水华预警模型,也可以称为遗传算法-支持向量机模型。
在一实施例中,如图5所示,该构建河流硅藻水华预警模型的方法,还包括如下步骤:
步骤S105:判断河流硅藻水华预警模型是否达到预设精度。
步骤S106:当河流硅藻水华预警模型不满足预设精度时,再次计算支持向量机的样本集。
步骤S107:根据计算的支持向量机的样本集和最优解计算得到河流硅藻水华预警模型。
步骤S108:当河流硅藻水华预警模型满足预设精度时,根据河流硅藻水华预警模型进行河流硅藻水华预警。
具体地,在构建得到河流硅藻水华预警模型之后,可以对该模型的预测精度进行分析,判断其是否达到设定要求,若不满足预测精度要求,则可以调整支持向量机结构设置,或返回步骤102重新进行数据预处理,重新训练学习。如果该模型满足预测精度要求,则结束运算,说明该预测模型构建成功。之后可以利用模型预测新的或实时获取的数据集进行河流硅藻水华预警,具体地,依据构建的模型对获取的数据进行预警时,可以对预测的结果进行等级划分,实现风险预警。
在一实施例中,如图6所示,本发明实施例提供的构建河流硅藻水华预警模型的方法可以按照以下流程实现:首先可以构建一个大数据分析平台,然后导入各种类型的数据,如水质、水文等影响因素和藻密度等表征因素;根据该大数据分析平台对导入的数据进行训练,并构建初始的支持向量机模型;之后可以采用遗传算法(GA算法)对支持向量机进行改进找到c、g参数的最优解,并通过计算构建河流硅藻水华预警模型即GA-SVM模型;最后可以对该模型的预设精度进行判断,若不满足预测精度要求,则可以调整支持向量机结构设置,或重新进行数据预处理,重新训练学习。如果该模型满足预测精度要求,则结束运算,说明该预测模型构建成功。
在一实施例中,如图7所示,本发明实施例提供的构建河流硅藻水华预警模型的方法中GA-SVM模型的构建方法可以按照以下流程实现:根据输入样本 输出样本确定输入数据,对输入数据进行归一化,并将样本集的70%作为训练集,将样本集的30%作为测试集;然后根据遗传算法设置种群数量为20,设置最大进行代数为200,参数c、g的变化范围为[0,100];通过编码产生初代种群,并计算每个初始个体的适应度值;之后根据其是否满足终止条件进行选择、交叉、变异操作或输出最优参数c、g;最后可以对构建的模型的预测精度进行判断,进而得到GA-SVM模型。
本发明实施例还提供一种构建河流硅藻水华预警模型的装置,如图8所示,该装置包括:
关键影响因子筛选模块1,用于根据河流水文要素数据、水质要素数据及藻密度进行分析,得到河流硅藻水华预警模型的关键影响因子;详细内容参见上述方法实施例中步骤S101的相关描述。
样本集获取模块2,用于根据关键影响因子数据集进行融合,得到支持向量机的样本集;详细内容参见上述方法实施例中步骤S102的相关描述。
最优解计算模块3,用于运用遗传算法对支持向量机的参数进行优化计算,得到支持向量机的最优解;详细内容参见上述方法实施例中步骤S103的相关描述。
预警模型构建模块4,用于根据支持向量机的样本集和最优解构建河流硅藻水华预警模型。详细内容参见上述方法实施例中步骤S104的相关描述。
本发明实施例提供的构建河流硅藻水华预警模型的装置,在关键影响因子的选取上不仅考虑了水质要素数据,还加入了可能导致大型河流水华暴发关键敏感驱动因子水文要素数据。由于河流较湖库水体流速更快,水文要素在河流硅藻水华的发生中有着重要影响,因此本发明实施例提供的构建河流硅藻水华预警模型的装置构建的预警模型可以用于大型流动河流水体的硅藻水华预测,能够为我国环保和水利部门进行河流水华预警提供技术支撑。
本发明实施例提供的构建河流硅藻水华预警模型的装置,利用遗传算法对支持向量机的参数进行优化选择,获取最佳分类精度的支持向量机参数,并应用于构建河流硅藻水华预警模型当中。在该装置中,运用了支持向量机算法,可以使得运算更为高效,同时采用的遗传算法可以考虑到种群进化的动态性,能够快速准确找到最优解,提高了模型效率和计算精度,具有较好的实用性。由此可见,本发明实施例提供的构建河流硅藻水华预警模型的装置,能够有效提高河流硅藻水华预测的时效性,减小模型构建过程中的困难,使河流硅藻水华预测更加切实可行,帮助有关部门在应对突发状况时能够快速启动水华预警。
本发明实施例提供的构建河流硅藻水华预警模型的装置的功能描述详细参见上述实施例中构建河流硅藻水华预警模型的方法描述。
本发明实施例还提供了一种构建河流硅藻水华预警模型的系统,如图9所示,该构建河流硅藻水华预警模型的系统可以包括处理器51和存储器52,其中处理器51和存储器52可以通过总线或者其他方式连接,图9中以通过总线连接为例。
处理器51可以为中央处理器(Central Processing Unit,CPU)。处理器51还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器52作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的对应的程序指令/模块。处理器51通过运行存储在存储器52中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的构建河流硅藻水华预警模型的方法。
存储器52可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器51所创建的数据等。此外,存储器52可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器52可选包括相对于处理器51远程设置的存储器,这些远程存储器可以通过网络连接至处理器51。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器52中,当被所述处理器51执行时,执行如图1-7所示实施例中的构建河流硅藻水华预警模型的方法。
上述构建河流硅藻水华预警模型的系统具体细节可以对应参阅图1至图7所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(RandomAccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (10)
1.一种构建河流硅藻水华预警模型的方法,其特征在于,包括如下步骤:
根据河流水文要素数据、水质要素数据及藻密度进行分析,得到河流硅藻水华预警模型的关键影响因子;
根据关键影响因子数据集进行融合,得到支持向量机的样本集;
运用遗传算法对支持向量机的参数进行优化计算,得到支持向量机参数的最优解;
根据所述支持向量机的样本集和所述最优解构建河流硅藻水华预警模型。
2.根据权利要求1所述的构建河流硅藻水华预警模型的方法,其特征在于,根据河流水文要素数据、水质要素数据及藻密度进行分析,得到河流硅藻水华预警模型的关键影响因子,包括:
根据河流藻密度确定河流硅藻水华的表征因素;
根据河流水文要素数据、水质要素数据确定河流硅藻水华的影响因素;
根据广义加性模型计算得到所述影响因素和表征因素之间的相关性;
根据所述相关性确定与所述表征因素显著相关的影响因素;
根据与所述表征因素显著相关的影响因素确定河流硅藻水华预警模型的关键影响因子。
3.根据权利要求1所述的构建河流硅藻水华预警模型的方法,其特征在于,根据所述关键影响因子数据集进行融合,得到支持向量机的样本集,包括:
对所述关键影响因子和藻密度进行归一化处理,计算得到支持向量机的样本集。
4.根据权利要求1所述的构建河流硅藻水华预警模型的方法,其特征在于,运用遗传算法对支持向量机的参数进行优化计算,得到支持向量机参数的最优解,包括:
根据遗传算法参数对支持向量机的惩罚参数和高斯核函数参数所有解进行编码,得到惩罚参数和高斯核函数参数的可疑解;
根据所述可疑解计算得到遗传算法每个初始个体的适应度值;
根据所述适应度值确定惩罚参数和高斯核函数参数的最优解。
5.根据权利要求1所述的构建河流硅藻水华预警模型的方法,其特征在于,根据所述支持向量机的样本集和所述最优解构建河流硅藻水华预警模型,包括:
根据支持向量机对所述样本集进行训练,计算得到回归函数;
根据结构风险最小化准则对所述回归函数进行计算,得到改进后的回归函数;
根据改进后的回归函数、径向基函数及最优解构建河流硅藻水华预警模型。
6.根据权利要求1所述的构建河流硅藻水华预警模型的方法,其特征在于,还包括:
判断所述河流硅藻水华预警模型是否达到预设精度;
当所述河流硅藻水华预警模型不满足预设精度时,再次计算支持向量机的样本集;
根据再次计算的支持向量机的样本集和所述最优解构建河流硅藻水华预警模型。
7.根据权利要求1所述的构建河流硅藻水华预警模型的方法,其特征在于,还包括:
当所述河流硅藻水华预警模型满足预设精度时,根据所述河流硅藻水华预警模型进行河流硅藻水华预警。
8.一种构建河流硅藻水华预警模型的装置,其特征在于,包括:
关键影响因子筛选模块,用于根据河流水文要素数据、水质要素数据及藻密度进行分析,得到河流硅藻水华预警模型的关键影响因子;
样本集获取模块,用于根据所述关键影响因子数据集进行融合,得到支持向量机的样本集;
最优解计算模块,用于运用遗传算法对支持向量机的参数进行优化计算,得到支持向量机参数的最优解;
预警模型构建模块,用于根据所述支持向量机的样本集和所述最优解构建河流硅藻水华预警模型。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如权利要求1-7任一项所述的构建河流硅藻水华预警模型的方法。
10.一种构建河流硅藻水华预警模型的系统,其特征在于,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行如权利要求1-7任一项所述的构建河流硅藻水华预警模型的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010122030.5A CN111382929A (zh) | 2020-02-26 | 2020-02-26 | 一种构建河流硅藻水华预警模型的方法及装置 |
AU2020103356A AU2020103356A4 (en) | 2020-02-26 | 2020-11-10 | Method and device for building river diatom bloom warning model |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010122030.5A CN111382929A (zh) | 2020-02-26 | 2020-02-26 | 一种构建河流硅藻水华预警模型的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111382929A true CN111382929A (zh) | 2020-07-07 |
Family
ID=71217054
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010122030.5A Pending CN111382929A (zh) | 2020-02-26 | 2020-02-26 | 一种构建河流硅藻水华预警模型的方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111382929A (zh) |
AU (1) | AU2020103356A4 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113054881A (zh) * | 2021-02-22 | 2021-06-29 | 江苏大学 | 外转子定子无铁心无轴承永磁同步电动机控制器构造方法 |
CN116307081A (zh) * | 2023-02-03 | 2023-06-23 | 中国环境科学研究院 | 一种基于机器学习算法预测赤潮发生的方法及系统 |
CN117113735A (zh) * | 2023-10-25 | 2023-11-24 | 湖南大学 | 基于多层次生态模型的藻华智能预警方法与系统 |
CN117829628A (zh) * | 2024-01-04 | 2024-04-05 | 广东工业大学 | 基于递归多步预测的湖泊水华预警方法及装置、电子设备 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113269384B (zh) * | 2021-02-26 | 2022-08-23 | 河海大学 | 一种对河流系统健康状态进行预警的方法 |
CN113642268B (zh) * | 2021-07-15 | 2024-03-15 | 中国环境科学研究院 | 一种河流水华预测方法及系统 |
CN114814136B (zh) * | 2022-04-14 | 2024-05-28 | 水利部交通运输部国家能源局南京水利科学研究院 | 一种rue界定城市河网水华程度方法及其应用 |
CN114626771B (zh) * | 2022-05-18 | 2022-08-02 | 中山大学 | 一种城市区域水生态状态反应器构建方法、装置及反应器 |
CN115728463A (zh) * | 2022-12-01 | 2023-03-03 | 哈尔滨工业大学 | 一种基于半嵌入式特征选择的可解释性水质预测方法 |
CN116485045A (zh) * | 2023-06-21 | 2023-07-25 | 中科三清科技有限公司 | 一种建立水华预测模型的方法、水华预测方法及装置 |
CN116756522B (zh) * | 2023-08-14 | 2023-11-03 | 中科三清科技有限公司 | 概率预报方法、装置、存储介质及电子设备 |
CN117228853B (zh) * | 2023-11-16 | 2024-02-02 | 苏州北控环保科技有限公司 | 一种河道生态修复方法及系统 |
CN117370900B (zh) * | 2023-12-08 | 2024-03-26 | 天津市扬天环保科技有限公司 | 一种环境保护监测用水质监测系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090228516A1 (en) * | 2008-03-10 | 2009-09-10 | The Hong Kong Polytechnic University | Harmful algae indexing (HaiDex) method |
CN103886218A (zh) * | 2014-04-08 | 2014-06-25 | 北京工商大学 | 基于多元非平稳时间序列分析与神经网络及支持向量机补偿的湖库藻类水华预测方法 |
CN103984996A (zh) * | 2014-05-26 | 2014-08-13 | 北京工商大学 | 基于禁忌搜索和遗传算法的湖库藻类水华生成机理时变模型优化及预测方法 |
CN109858132A (zh) * | 2019-01-24 | 2019-06-07 | 北京工商大学 | 基于突变理论和改进布谷鸟算法的蓝藻水华暴发预警方法 |
-
2020
- 2020-02-26 CN CN202010122030.5A patent/CN111382929A/zh active Pending
- 2020-11-10 AU AU2020103356A patent/AU2020103356A4/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090228516A1 (en) * | 2008-03-10 | 2009-09-10 | The Hong Kong Polytechnic University | Harmful algae indexing (HaiDex) method |
CN103886218A (zh) * | 2014-04-08 | 2014-06-25 | 北京工商大学 | 基于多元非平稳时间序列分析与神经网络及支持向量机补偿的湖库藻类水华预测方法 |
CN103984996A (zh) * | 2014-05-26 | 2014-08-13 | 北京工商大学 | 基于禁忌搜索和遗传算法的湖库藻类水华生成机理时变模型优化及预测方法 |
CN109858132A (zh) * | 2019-01-24 | 2019-06-07 | 北京工商大学 | 基于突变理论和改进布谷鸟算法的蓝藻水华暴发预警方法 |
Non-Patent Citations (2)
Title |
---|
WANG YANJIE 等: "Algal bloom prediction by support vector machine and relevance vector machine with genetic algorithm optimization in freshwater reservoirs", 《ENGINEERING COMPUTATIONS》 * |
易仲强: "基于ANN和SVM的三峡水库香溪河库湾富营养化预测研究", 《中国优秀硕士学位论文全文数据库(工程科技Ⅰ辑)》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113054881A (zh) * | 2021-02-22 | 2021-06-29 | 江苏大学 | 外转子定子无铁心无轴承永磁同步电动机控制器构造方法 |
CN116307081A (zh) * | 2023-02-03 | 2023-06-23 | 中国环境科学研究院 | 一种基于机器学习算法预测赤潮发生的方法及系统 |
CN117113735A (zh) * | 2023-10-25 | 2023-11-24 | 湖南大学 | 基于多层次生态模型的藻华智能预警方法与系统 |
CN117113735B (zh) * | 2023-10-25 | 2024-01-02 | 湖南大学 | 基于多层次生态模型的藻华智能预警方法与系统 |
CN117829628A (zh) * | 2024-01-04 | 2024-04-05 | 广东工业大学 | 基于递归多步预测的湖泊水华预警方法及装置、电子设备 |
Also Published As
Publication number | Publication date |
---|---|
AU2020103356A4 (en) | 2021-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111382929A (zh) | 一种构建河流硅藻水华预警模型的方法及装置 | |
CN109902801B (zh) | 一种基于变分推理贝叶斯神经网络的洪水集合预报方法 | |
CN109142171B (zh) | 基于特征扩张的融合神经网络的城市pm10浓度预测方法 | |
Bowden et al. | Input determination for neural network models in water resources applications. Part 1—background and methodology | |
Chen et al. | Accurate discharge coefficient prediction of streamlined weirs by coupling linear regression and deep convolutional gated recurrent unit | |
CN109583565B (zh) | 基于注意力模型长短时记忆网络的洪水预测方法 | |
CN108549770B (zh) | 基于qga-mmrvm的堆石坝材料参数自适应反演方法 | |
Yang et al. | A large-scale comparison of Artificial Intelligence and Data Mining (AI&DM) techniques in simulating reservoir releases over the Upper Colorado Region | |
CN108921339B (zh) | 基于分位数回归的遗传支持向量机光伏功率区间预测方法 | |
Li et al. | A novel combined prediction model for monthly mean precipitation with error correction strategy | |
CN113657668A (zh) | 基于lstm网络的电力负荷预测方法及系统 | |
CN113807562A (zh) | 海洋表面温度的预测方法 | |
CN111723523B (zh) | 一种基于级联神经网络的河口余水位预测方法 | |
CN115018193A (zh) | 基于lstm-ga模型的时间序列风能数据预测方法 | |
CN113435124A (zh) | 一种基于长短时记忆和径向基函数神经网络的水质时空关联预测方法 | |
CN113868938A (zh) | 基于分位数回归的短期负荷概率密度预测方法、装置及系统 | |
Yang et al. | Predictor selection method for the construction of support vector machine (SVM)‐based typhoon rainfall forecasting models using a non‐dominated sorting genetic algorithm | |
Yu et al. | A novel time-frequency recurrent network and its advanced version for short-term wind speed predictions | |
Kosana et al. | Hybrid wind speed prediction framework using data pre-processing strategy based autoencoder network | |
CN115329930A (zh) | 一种基于混合深度学习模型的洪水过程概率预报方法 | |
Ortiz-Lopez et al. | Machine learning models with potential application to predict source water quality for treatment purposes: a critical review | |
Xu et al. | Two-stage hybrid model for hydrological series prediction based on a new method of partitioning datasets | |
Jin et al. | Using EEMD mode decomposition in combination with machine learning models to improve the accuracy of monthly sea level predictions in the coastal area of China | |
CN112307536B (zh) | 一种大坝渗流参数反演方法 | |
CN111612648A (zh) | 光伏发电预测模型的训练方法、装置和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200707 |