CN112434466A - 一种基于遗传支持向量机的河口盐度预报模型 - Google Patents

一种基于遗传支持向量机的河口盐度预报模型 Download PDF

Info

Publication number
CN112434466A
CN112434466A CN202011312718.6A CN202011312718A CN112434466A CN 112434466 A CN112434466 A CN 112434466A CN 202011312718 A CN202011312718 A CN 202011312718A CN 112434466 A CN112434466 A CN 112434466A
Authority
CN
China
Prior art keywords
salinity
model
support vector
vector machine
estuary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011312718.6A
Other languages
English (en)
Inventor
方艺辉
吴国祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujian Business University
Original Assignee
Fujian Business University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujian Business University filed Critical Fujian Business University
Priority to CN202011312718.6A priority Critical patent/CN112434466A/zh
Publication of CN112434466A publication Critical patent/CN112434466A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/06Multi-objective optimisation, e.g. Pareto optimisation using simulated annealing [SA], ant colony algorithms or genetic algorithms [GA]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Physiology (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于遗传支持向量机的河口盐度预报模型,包括如下步骤:步骤一、设计基于遗传支持向量机的耦合模型;步骤二、通过对咸潮入侵物理过程影响因素的分析和模型的反复实验,确定了以径流量、高潮位和前期盐度为影响盐度变化的主要因素,该三方面因素的组合作为训练样本特征向量X,以目标盐度作为对应训练样本标签Y,形成训练模型;步骤三、使用遗传算法对SVM参数进行优化;其技术要点为,本发明分析了盐度变化影响因素,设计了遗传支持向量机耦合模型,提出了基于遗传支持向量机的河口盐度预报模型,实现了对河口盐度预报;该模型能够根据高潮位、径流量和前期盐度成功地对河口盐度进行预报,预报精度高的同时模型运行速度快。

Description

一种基于遗传支持向量机的河口盐度预报模型
技术领域
本发明属于数据预报模型技术领域,具体是一种基于遗传支持向量机的河口盐度预报模型。
背景技术
近年来,由于河床不断下切,咸潮入侵越来越严重,严重地威胁到下游城市用水安全,此时就需要工作人员对河口的盐度进行实时预测。目前,河口盐度预报主要有两大途径,一是基于盐度变化动力学过程建立的动力学模型;二是采用统计学或数据挖掘方法,通过分析盐度与其影响因素之间的关系建立预报模型。前者是基于过程的“白盒子”分析方法,较为复杂且对资料要求较高。而后者被视为“黑盒子”的分析方法,对资料要求较低,具有更强的实用性;其中,以神经网络方法应用最为广泛。但神经网络方法容易产生过拟合,泛化风险大,预报精度较低。支持向量机根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以求获得最好的泛化能力;对小样本、非线性和高维度的问题取得较好的效果,在多个不同领域中都有成功的应用。
然而,支持向量机的运行结果的准确度很大程度上依赖于参数惩罚因子(C)和核函数(δ)的选择,对参数的选择具有很强的敏感性;参数的选择主要有经验选择法,交叉验证法和网格搜索法等,极大地制约了预报的准确度和泛化能力的提高;遗传算法是建立在生物学中优胜劣汰的生物进化规则基础上,旨在通过全局搜索获得最优解,同时对问题空间中的多个解进行评估,减少了陷入局部最优的风险。
发明内容
本发明的目的在于克服现有技术的缺陷,提供一种基于遗传支持向量机的河口盐度预报模型。
为实现上述目的,本发明采用了如下技术方案:
一种基于遗传支持向量机的河口盐度预报模型,包括如下步骤:
步骤一、设计基于遗传支持向量机的耦合模型,设定包含遗传算法的参数,并设置包含支持向量机算法的惩罚因子C和核函数参数δ在内参数的取值范围,经过编码设计和判断,解码最优染色体,解析出C和δ作为支持向量机的参数,并用测试数据对该模型进行验证;
步骤二、通过对咸潮入侵物理过程影响因素的分析和模型的反复实验,确定了以径流量、高潮位和前期盐度为影响盐度变化的主要因素,该三方面因素的组合作为训练样本特征向量X,以目标盐度作为对应训练样本标签Y,形成训练模型;
步骤三、使用遗传算法对模型参数进行优化,解码染色体获得最优参数C、δ,作为模型参数,最终构建基于遗传支持向量机的河口盐度预报模型。
优选的,在所述步骤一中,其耦合模型的具体流程为:
(1)使用最小值最大值范式对数据标准化预处理,构造向量;
(2)设定遗传算法的种群规模、最大进化代数、种群交叉率以及种群变异率的参数,并设置支持向量机算法的惩罚因子C和核函数参数δ参数的取值范围;
(3)采用二进制编码初始化种群染色体,单个染色体由C、δ二进制字符串连接生成,C、δ二进制字符串由随机数产生;
(4)选取相关系数作为适应度函数,计算种群中各个体适应度函数值;
(5)判断是否收敛;若收敛,则输出最优染色体个体,进入步骤(7);否则转至步骤(6);
(6)通过选择、复制、交叉和变异的操作,进化出新的种群;返回步骤(4);
(7)解码最优染色体,解析出C和δ作为支持向量机的参数,并用测试数据对模型进行验证。
优选的,在所述耦合模型的具体流程中,步骤(5)中判断是否收敛的具体依据为:循环次数是否大于最大进化代数。
优选的,在所述步骤二中,形成训练模型的具体流程为:
(1)预报第t天自来水厂断面目标盐度影响因素为:第t天和t-1天的高潮位(Lt,Lt-1)、第t-1和t-2天的径流量(Qt-1,Qt-2)、自来水厂断面的盐度(Ct-1,Ct-2),函数表达式如下:
Ct=F(Ct-1,Ct-2,Qt-1,Qt-2,Lt,Lt-1);
(2)以高潮位(Lt,Lt-1)、径流量(Qt-1,Qt-2)和前期盐度(Ct-1,Ct-2)三方面因素的组合作为训练样本特征向量X,以目标盐度作为对应训练样本标签Y,训练模型;
(3)使用遗传算法对SVM参数进行优化,解码染色体获得最优参数C、δ,作为GA-SVM模型的参数,构建基于遗传支持向量机的河口盐度预报模型。
优选的,在形成训练模型的具体流程中,步骤(3)后需要进行后续操作:
输入高潮位(Lt,Lt-1)、径流量(Qt-1,Qt-2)和前期盐度(Ct-1,Ct-2)测试样本特征向量X,使用构建好模型预报第t天目标盐度。
与现有技术相比,本发明提供了一种基于遗传支持向量机的河口盐度预报模型,具有如下有益效果:
一是本发明分析了盐度变化影响因素,设计了遗传支持向量机耦合模型,提出了基于遗传支持向量机的河口盐度预报模型,实现了对河口盐度预报;
二是提出了应用于感潮河口盐度预报的基于遗传支持向量机的耦合模型(GA-SVM),设计耦合模型算法流程并编程开发应用程序;该模型能够根据高潮位、径流量和前期盐度成功地对河口盐度进行预报,预报精度高;
三是整体模型运行速度快,为了验证GA-SVM模型的有效性,针对同一的数据源,采用网格搜索法,运用SVM模型进行训练和测试,并和GA-SVM模型进行比较,经过实验数据表明,GA-SVM模型的精度和运行速度比SVM模型都有明显的改进,具有较强的可行性和实用性。
附图说明
图1是本发明中基于遗传支持向量机的河口盐度预报模型算法流程图;
图2是本发明中河口盐度预报结果数据示意图。
具体实施方式
以下结合附图1,进一步说明本发明一种基于遗传支持向量机的河口盐度预报模型的具体实施方式。本发明一种基于遗传支持向量机的河口盐度预报模型不限于以下实施例的描述。
实施例1
本实施例给出一种基于遗传支持向量机的河口盐度预报模型的具体结构,如图1所示,一种基于遗传支持向量机的河口盐度预报模型,其特征在于,包括如下步骤:
步骤一、设计基于遗传支持向量机的耦合模型,设定包含遗传算法的参数,并设置包含支持向量机算法的惩罚因子C和核函数参数δ在内参数的取值范围,经过编码设计和判断,解码最优染色体,解析出C和δ作为支持向量机的参数,并用测试数据对该模型进行验证;
步骤二、通过对咸潮入侵物理过程影响因素的分析和模型的反复实验,确定了以径流量、高潮位和前期盐度为影响盐度变化的主要因素,该三方面因素的组合作为训练样本特征向量X,以目标盐度作为对应训练样本标签Y,形成训练模型;
步骤三、使用遗传算法对模型参数进行优化,解码染色体获得最优参数C、δ,作为模型参数,最终构建基于遗传支持向量机的河口盐度预报模型;本发明分析了盐度变化影响因素,设计了遗传支持向量机耦合模型,提出了基于遗传支持向量机的河口盐度预报模型,实现了对河口盐度预报。
如图1所示,在步骤一中,其耦合模型的具体流程为:
(1)使用最小值最大值范式对数据标准化预处理,构造向量;
(2)设定遗传算法的种群规模、最大进化代数、种群交叉率以及种群变异率的参数,并设置支持向量机算法的惩罚因子C和核函数参数δ参数的取值范围;
(3)采用二进制编码初始化种群染色体,单个染色体由C、δ二进制字符串连接生成,C、δ二进制字符串由随机数产生;
(4)选取相关系数作为适应度函数,计算种群中各个体适应度函数值;
(5)判断是否收敛;若收敛,则输出最优染色体个体,进入步骤(7);否则转至步骤(6);
(6)通过选择、复制、交叉和变异的操作,进化出新的种群;返回步骤(4);
(7)解码最优染色体,解析出C和δ作为支持向量机的参数,并用测试数据对模型进行验证。
如图1所示,在耦合模型的具体流程中,步骤(5)中判断是否收敛的具体依据为:循环次数是否大于最大进化代数。
如图1所示,在步骤二中,形成训练模型的具体流程为:
(1)预报第t天自来水厂断面目标盐度影响因素为:第t天和t-1天的高潮位(Lt,Lt-1)、第t-1和t-2天的径流量(Qt-1,Qt-2)、自来水厂断面的盐度(Ct-1,Ct-2),函数表达式如下:
Ct=F(Ct-1,Ct-2,Qt-1,Qt-2,Lt,Lt-1);
(2)以高潮位(Lt,Lt-1)、径流量(Qt-1,Qt-2)和前期盐度(Ct-1,Ct-2)三方面因素的组合作为训练样本特征向量X,以目标盐度作为对应训练样本标签Y,训练模型;
(3)使用遗传算法对SVM参数进行优化,解码染色体获得最优参数C、δ,作为GA-SVM模型的参数,构建基于遗传支持向量机的河口盐度预报模型。
如图1所示,在形成训练模型的具体流程中,步骤(3)后需要进行后续操作:
输入高潮位(Lt,Lt-1)、径流量(Qt-1,Qt-2)和前期盐度(Ct-1,Ct-2)测试样本特征向量X,使用构建好模型预报第t天目标盐度。
实施例2
如图2所示,以闽江河口为例,通过对日盐度时间序列数据的分析和实验测试,表明以第t天和第t-1天高潮位,第t-1天和t-2天径流量和盐度等六个因素,预报第t天盐度,实验结果最优。
据此构建的闽江河口盐度预报GA-SVM模型,用于预报年度的典型盐度过程。GA-SVM预报结果表明ENS系数为84.16%,相关系数为92.39%,均方根误差为39.36mg/L,该模型能够根据高潮位、径流量和前期盐度成功地对闽江河口盐度进行预报,预报精度高。
为了验证GA-SVM模型的有效性,针对同一的数据源,采用网格搜索法,运用SVM模型进行训练和测试,并和GA-SVM模型进行比较。
结果如表2所示,GA-SVM模型的运算时间大约为SVM模型的一半,而且准确度比SVM模型显著提高了。实验表明,GA-SVM模型的精度和运行速度比SVM模型都有明显的改进,具有较强的可行性和实用性。
表2 GA-SVM与SVM运行结果对比
Figure BDA0002790040040000051
Figure BDA0002790040040000061
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (5)

1.一种基于遗传支持向量机的河口盐度预报模型,其特征在于,包括如下步骤:
步骤一、设计基于遗传支持向量机的耦合模型,设定包含遗传算法的参数,并设置包含支持向量机算法的惩罚因子C和核函数参数δ在内参数的取值范围,经过编码设计和判断,解码最优染色体,解析出C和δ作为支持向量机的参数,并用测试数据对该模型进行验证;
步骤二、通过对咸潮入侵物理过程影响因素的分析和模型的反复实验,确定了以径流量、高潮位和前期盐度为影响盐度变化的主要因素,该三方面因素的组合作为训练样本特征向量X,以目标盐度作为对应训练样本标签Y,形成训练模型;
步骤三、使用遗传算法对模型参数进行优化,解码染色体获得最优参数C、δ,作为模型参数,最终构建基于遗传支持向量机的河口盐度预报模型。
2.如权利要求1所述的一种基于遗传支持向量机的河口盐度预报模型,其特征在于:在所述步骤一中,其耦合模型的具体流程为:
(1)使用最小值最大值范式对数据标准化预处理,构造向量;
(2)设定遗传算法的种群规模、最大进化代数、种群交叉率以及种群变异率的参数,并设置支持向量机算法的惩罚因子C和核函数参数δ参数的取值范围;
(3)采用二进制编码初始化种群染色体,单个染色体由C、δ二进制字符串连接生成,C、δ二进制字符串由随机数产生;
(4)选取相关系数作为适应度函数,计算种群中各个体适应度函数值;
(5)判断是否收敛;若收敛,则输出最优染色体个体,进入步骤(7);否则转至步骤(6);
(6)通过选择、复制、交叉和变异的操作,进化出新的种群;返回步骤(4);
(7)解码最优染色体,解析出C和δ作为支持向量机的参数,并用测试数据对模型进行验证。
3.如权利要求1所述的一种基于遗传支持向量机的河口盐度预报模型,其特征在于:在所述耦合模型的具体流程中,步骤(5)中判断是否收敛的具体依据为:循环次数是否大于最大进化代数。
4.如权利要求1所述的一种基于遗传支持向量机的河口盐度预报模型,其特征在于:在所述步骤二中,形成训练模型的具体流程为:
(1)预报第t天自来水厂断面目标盐度影响因素为:第t天和t-1天的高潮位(Lt,Lt-1)、第t-1和t-2天的径流量(Qt-1,Qt-2)、自来水厂断面的盐度(Ct-1,Ct-2),函数表达式如下:
Ct=F(Ct-1,Ct-2,Qt-1,Qt-2,Lt,Lt-1);
(2)以高潮位(Lt,Lt-1)、径流量(Qt-1,Qt-2)和前期盐度(Ct-1,Ct-2)三方面因素的组合作为训练样本特征向量X,以目标盐度作为对应训练样本标签Y,训练模型;
(3)使用遗传算法对SVM参数进行优化,解码染色体获得最优参数C、δ,作为GA-SVM模型的参数,构建基于遗传支持向量机的河口盐度预报模型。
5.如权利要求4所述的一种基于遗传支持向量机的河口盐度预报模型,其特征在于:在形成训练模型的具体流程中,步骤(3)后需要进行后续操作:
输入高潮位(Lt,Lt-1)、径流量(Qt-1,Qt-2)和前期盐度(Ct-1,Ct-2)测试样本特征向量X,使用构建好模型预报第t天目标盐度。
CN202011312718.6A 2020-11-20 2020-11-20 一种基于遗传支持向量机的河口盐度预报模型 Pending CN112434466A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011312718.6A CN112434466A (zh) 2020-11-20 2020-11-20 一种基于遗传支持向量机的河口盐度预报模型

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011312718.6A CN112434466A (zh) 2020-11-20 2020-11-20 一种基于遗传支持向量机的河口盐度预报模型

Publications (1)

Publication Number Publication Date
CN112434466A true CN112434466A (zh) 2021-03-02

Family

ID=74694452

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011312718.6A Pending CN112434466A (zh) 2020-11-20 2020-11-20 一种基于遗传支持向量机的河口盐度预报模型

Country Status (1)

Country Link
CN (1) CN112434466A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113903458A (zh) * 2021-10-26 2022-01-07 北京大学第三医院(北京大学第三临床医学院) 急性肾损伤早期预测方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102005135A (zh) * 2010-12-09 2011-04-06 上海海事大学 基于遗传算法优化的支持向量回归船舶交通流量预测方法
CN106971237A (zh) * 2017-02-27 2017-07-21 中国水利水电科学研究院 一种基于细菌觅食优化算法的中长期径流预报方法
CN110163444A (zh) * 2019-05-28 2019-08-23 河北工程大学 一种基于gasa-svr的需水预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102005135A (zh) * 2010-12-09 2011-04-06 上海海事大学 基于遗传算法优化的支持向量回归船舶交通流量预测方法
CN106971237A (zh) * 2017-02-27 2017-07-21 中国水利水电科学研究院 一种基于细菌觅食优化算法的中长期径流预报方法
CN110163444A (zh) * 2019-05-28 2019-08-23 河北工程大学 一种基于gasa-svr的需水预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
方艺辉: "闽江河口水环境数值模拟与决策支持系统", 《中国博士学位论文全文数据库工程科技Ⅰ辑》, 15 September 2019 (2019-09-15) *
方艺辉等: "基于GA-SVM盐度预报模型的河口水环境决策支持系统", 《福建师范大学学报(自然科学版)》, vol. 33, no. 02, 20 March 2017 (2017-03-20), pages 18 - 24 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113903458A (zh) * 2021-10-26 2022-01-07 北京大学第三医院(北京大学第三临床医学院) 急性肾损伤早期预测方法及装置

Similar Documents

Publication Publication Date Title
Liu et al. A sequence-to-sequence air quality predictor based on the n-step recurrent prediction
Ha et al. Prediction of Yangtze River streamflow based on deep learning neural network with El Niño–Southern Oscillation
CN106650767B (zh) 基于聚类分析和实时校正的洪水预报方法
Liu et al. A rolling grey model optimized by particle swarm optimization in economic prediction
CN104318325B (zh) 多流域实时智能水质预测方法及系统
CN110147877A (zh) 基于卷积长短时网络的pm2.5预测方法
Bourel et al. Machine learning methods for imbalanced data set for prediction of faecal contamination in beach waters
CN117035201B (zh) 平原河网水工程集群多目标调度规则制定方法及系统
Fisichella et al. Can deep learning improve technical analysis of forex data to predict future price movements?
CN104951847A (zh) 一种基于核主成分分析和基因表达式编程的降水预报方法
CN110956309A (zh) 基于crf和lstm的流程活动预测方法
Zhang et al. Downstream water level prediction of reservoir based on convolutional neural network and long short-term memory network
CN106056244A (zh) 一种股票价格优化预测方法
CN114358213A (zh) 非线性时序数据预测的误差消融处理方法及系统与介质
CN116976529A (zh) 基于供需预测动态校正的跨流域调水方法和系统
Aldrees et al. Evolutionary and ensemble machine learning predictive models for evaluation of water quality
Duncan The analysis and application of artificial neural networks for early warning systems in hydrology and the environment
CN112434466A (zh) 一种基于遗传支持向量机的河口盐度预报模型
CN114186412A (zh) 基于自注意力机制的水电站水轮机顶盖长序列水位预测系统及方法
CN115760127A (zh) 一种基于规则注意力机制的交易欺诈检测方法及系统
Nikoo et al. Wave height prediction using artificial immune recognition systems (AIRS) and some other data mining techniques
Nkoana Artificial neural network modelling of flood prediction and early warning
CN111310974A (zh) 一种基于ga-elm的短期需水预测方法
Jiang et al. Hybrid genetic algorithm and support vector regression performance in CNY exchange rate prediction
Murgatroyd et al. Regulation of freshwater use to restore ecosystems resilience

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210302