CN114611840A - 基于rs粗糙集和cpa算法的稻虾水质预测方法 - Google Patents

基于rs粗糙集和cpa算法的稻虾水质预测方法 Download PDF

Info

Publication number
CN114611840A
CN114611840A CN202210392279.7A CN202210392279A CN114611840A CN 114611840 A CN114611840 A CN 114611840A CN 202210392279 A CN202210392279 A CN 202210392279A CN 114611840 A CN114611840 A CN 114611840A
Authority
CN
China
Prior art keywords
prey
water quality
attribute
population
rice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210392279.7A
Other languages
English (en)
Inventor
张青春
王刚
孟凡东
刘晓洋
周玲
吴峥
文张源
张洪源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaiyin Institute of Technology
Original Assignee
Huaiyin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaiyin Institute of Technology filed Critical Huaiyin Institute of Technology
Priority to CN202210392279.7A priority Critical patent/CN114611840A/zh
Publication of CN114611840A publication Critical patent/CN114611840A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/06Investigating concentration of particle suspensions
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/18Water
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/18Water
    • G01N33/1806Biological oxygen demand [BOD] or chemical oxygen demand [COD]
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/18Water
    • G01N33/1813Specific cations in water, e.g. heavy metals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/11Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Food Science & Technology (AREA)
  • Strategic Management (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • Biomedical Technology (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Operations Research (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Linguistics (AREA)
  • Computational Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Agronomy & Crop Science (AREA)
  • Mining & Mineral Resources (AREA)

Abstract

本发明涉及水质预测技术领域,公开了一种基于RS粗糙集和CPA算法的稻虾水质预测方法,包括测量六项指标并对其进行预处理,通过RS粗糙集结合遗传算对数据进行属性约简,找出几组最简属性集,将其代入RBF神经网络进行MSE比较,得出一组最优属性集,确定RBF神经网络的拓扑结构,将RBF神经网络的径向基函数的中心、宽度以及隐层到输出层的权值作为CPA算法的初始种群,利用CPA算法优化后得到最优的中心、宽度和权值并将其作为RBF神经网络模型的参数,进而得到网络模型的最优参数,构建优化网络模型。与现有技术相比,本发明降低了不确定数据对数据融合的影响,简化输入特征,提高对稻虾水质预测的抗干扰性和准确性。

Description

基于RS粗糙集和CPA算法的稻虾水质预测方法
技术领域
本发明涉及水质预测技术领域,具体涉及一种基于RS粗糙集和CPA算法的稻虾水质预测方法。
背景技术
我国是一个农业大国,现代农业在科技不断进步的推动下,智慧农业便应需而生,由于智慧农业的科学养殖理念,出现了一批农作物共作的养殖系统,稻虾共作便是其中之一。稻虾水质是共作系统重要指标之一,直接影响稻虾的产量与经济的收益,使得稻虾水质预测成为研究的热点问题。传统的水质预测模型主要包括神经网络模型、灰色系统理论模型、回归分析模型以及证据理论预测模型等。但是现有的单一预测技术存在精度不高,抗干扰性低等问题。
发明内容
发明目的:针对现有技术中存在的问题,本发明提供一种基于RS粗糙集和CPA算法的稻虾水质预测方法,减低了不确定数据对数据融合的影响,简化输入特征,提高对稻虾水质预测的抗干扰性和准确性,具有一定的推广和应用价值。
技术方案:本发明提供了一种基于RS粗糙集和CPA算法的稻虾水质预测方法,包括如下步骤:
步骤1:对稻虾水域随机两块区域进行测量PH值、浑浊度、气压、温度、氨氮以及溶解氧六项指标,各区域每次重复测量一组,一天测量多次,分别记为A1-A12和A13-A24
步骤2:对测量的水质数据预处理,将数据归一化以文本的形式存储,将数据转换至0-1之间;
步骤3:根据稻虾对不同水质的生存情况,将指标划分等级;
步骤4:通过RS粗糙集对A1-A24属性约简,找出几组最简属性集;
步骤5:将步骤4几组最简属性集代入RBF神经网络进行MSE比较,得出一组最优属性集,并将一组最优属性集的属性分为训练集和测试集;
步骤6:确定RBF神经网络的拓扑结构,将RBF神经网络的径向基函数的中心、宽度以及隐层到输出层的权值作为CPA算法的初始种群,使用CPA算法进行优化得到优化后的中心、权值和宽度;
步骤7:最终得出优化模型,利用该优化模型及步骤5中划分的训练集和测试集进行预测虾稻水质。
进一步地,所述A1-A12为两组六参数水质指标,A1-A12为同一块区域,A13-A24为另一块区域两组六参数水质指标。
进一步地,所述步骤3中指标划分为:I(优)、II(良)、III(差)三个等级。
进一步地,所述步骤4对对A1-A24的属性约简步骤如下:
步骤1)将预处理之后的水质数据按照各个属性对应的区间进行划分,并进行编号,获得试验数据决策表;
步骤2)通过遗传算法,对试验数据决策表进行约简;
步骤3)根据公式γc(D)=|posc(D)|/|U|,计算出决策属性D({d1,d2,d3,…di})对条件属性C({c1,c2,c3,…cj})的依赖度γc(d),其中,d1,d2,d3,…di表示所有决策属性集合,c1,c2,c3,…cj表示所有条件属性集合,d表示决策属性,U表示论域;
步骤4)定义rduct(C)=C-{cj}为条件属性C的约简集,将条件属性cj逐个去除,比较γreduct(C)(d)与γC(d)的大小,若γreduct(d)=γC(d),则终止运算;若不等,将执行步骤1);
步骤5)使用染色体编码方法,根据公式
Figure BDA0003595401030000021
其中,X表示对象子集,x表示对象,U表示论域,将每个条件属性对每个个体编码,通过二进制字符串[0,1]的形式;若条件属性属于本个体,就表示为1;否则表示0;从而得到个体适应度F(r)值:
F(r)=(l-lτ)/l+γC(d)
其中,编码1的染色体个数为lτ,条件属性个数为l;初始种群由Pop_size的长度为|C|的二进制个体构成,且Pop_size=2|C|
步骤6)计算下一代种群个体的适应度值,通过轮盘赌法从中选择,使用交叉概率PC来表示交叉点处染色体交叉概率,某个等位属性编码值反转概率用Pm表示,也就是变异概率;
步骤7)选择最优个体,将它代入下一代种群,观察适应度,若不再变化或迭代步数到最大值,将最优个体输出,否则跳转执行步骤6)。
进一步地,所述步骤6中CPA算法优化步骤为:
1)初始化:初始化待求解问题的可能解,这里待求解问题的可能解分别为RBF神经网络的径向基函数的中心、宽度以及隐层到输出层的权值,随机初始化n个CPlant食肉植物和n个Prey猎物个体,位置表示如下:
Figure BDA0003595401030000031
其中,d为变量个数,n为nCPlant和nPrey总和,每个个体使用下式随机初始化:
Individuali,j=Lbj+(Ubj-Lbj)×rand
其中,Lb和Ub分别为自变量的最小值和最大值,i∈[1,2,...,n],j∈[1,2,...,d],rand为[0,1]之间的随机数;
对于第i个个体,通过将每一行作为适应度函数的输入来评估适应度值,计算得到的适应度值存在如下矩阵中:
Figure BDA0003595401030000032
2)分类与分组:每个个体按照其适应度值升序排序,排在前面的n个CPlant食肉植物作为食肉植物CP,剩余的nPrey作为猎物Prey,排序后的适应度值和种群通过下列两式表示:
Figure BDA0003595401030000033
Figure BDA0003595401030000041
分组的过程模拟每个肉食植物以及猎物的环境,将适合度最高的猎物分配给排名第一的食肉植物,类似地,第二名和第三名猎物属于第二和第三肉食植物;以此类推,直到排名nCPlant的猎物分配给第nCPlant的肉食植物,然后在猎物多余的情况下,nCPlant+1名猎物分配给第一名肉食植物;
3)成长:每一个种群都随机选择一个猎物,如果吸引率高于随机生成的数字,食肉植物就会捕获猎物并消化生长,食肉植物成长模型为:
NewCPi,j=growth×CPi,j+(1-growth)×Preyv,j
growth=growth_rate×randi,j
其中,CPi,j是排名第i的食肉植物,Preyv,j为随机选择的猎物,成长率growth_rate为预定义的值,rand为[0,1]之间的随机数,每一个种群内部只有一个食肉植物,而猎物的数量必须多于两个,如果吸引率低于产生的随机值,则猎物逃跑并成长,表示为:
NewPreyi,j=growth×Preyu,j+(1-growth)×Preyv,j,u≠v
Figure BDA0003595401030000042
其中,Preyu,j是第i个种群中随机选择的另一个猎物;食肉植物和猎物生长过程持续到group_iter代(预定义值),且两式将新的解向高质量解空间方向指导;
4)繁殖:排名第一的食肉植物,才允许繁殖,最优食肉植物繁殖过程如下:
NewCPi,j=CP1,j+Reproduction_rate×randi,j×matei,j
Figure BDA0003595401030000043
其中,CP1,j为最优解,CPv,j为随机选择的食肉植物,繁殖率Reproduction_rate是预定义的值,繁殖过程重复nCPlant次,繁殖过程中,每个维度j都随机选择一个食肉植物v;
5)适应度更新和合并:将新生成的食肉植物和猎物和之前的种群合并,得到新的维度种群,按照适应度值升序排序,选择排名前n的个体作为新的候选解,保准种群大小不变;
6)重复1)到4)过程,每一次重复的结果作为RBF神经网络的最优三参数,直到满足停止准则。
进一步地,通过RS粗糙集对A1-A24属性约简时,所抽取的数据量大于24。
有益效果:
1、本发明通过RS粗糙集挖掘输入影响因子和数据特征,结合遗传算法对数据进行属性约简,减少由于电子干扰和环境等不确定因素对系统的影响,将CPA算法用于RBF神经网络参数的优化,进而得到网络模型的最优参数,最后构建网络模型。该方法很大程度减低了不确定数据对数据融合的影响,简化输入特征,提高对稻虾水质预测的抗干扰性和准确性,具有一定的推广和应用价值。
2、本发明使用RBF神经网络模型进行稻虾水质预测,其具有局部逼近特点以及训练速度快,可以较好的解决实时性应用,为水质预测提供了实效性,同时将全局优化特点明显的CPA算法应用于RBF神经网络三参数(径向基函数的中心、宽度以及隐层到输出层的权值)的优化,优化的模型极大的提高了准确度。
附图说明
图1为本发明基于RS粗糙集和CPA算法的稻虾水质预测方法流程图;
图2为本发明稻虾水质数据的最小约简MSE;
图3为本发明的模型误差对比图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
如图1所示,本发明公开了一种基于RS粗糙集和CPA算法的稻虾水质预测方法,包括以下步骤:
步骤1:对稻虾水域随机两块区域进行测量溶解氧、高锰酸钾、化学需氧量、氨氮、生化需氧、总氮六项指标,各区域每次重复测量一组,一天测量多次,分别记为A1-A12和A13-A24,A1-A12为两组六参数水质指标,A1-A12为同一块区域,A13-A24为另一块区域两组六参数水质指标。为了说明算法的有效性和准确性,下面以江苏淮安盱眙某稻虾养殖基地所采集的水质数据为例,建立预测模型。
步骤2:对测量的水质数据预处理,将数据归一化以文本的形式存储,将数据转换至0-1之间。
步骤3:根据稻虾对不同水质的生存情况,将指标划分等级,指标划分为:I(优)、II(良)、III(差)三个等级。
步骤4:通过RS粗糙集对A1-A24(6个指标)属性约简,找出最简几组最简属性集。
约简按照以下步骤进行:
1)将预处理之后的传感器水质数据按照各个属性对应的区间进行划分,并进行编号,获得试验数据决策表;
2)通过遗传算法,对试验数据决策表进行约简;
3)根据公式γc(D)=|posc(D)|/|U|,计算出决策属性D({d1,d2,d3,…di})对条件属性C({c1,c2,c3,…cj})的依赖度γc(d),其中,d1,d2,d3,…di表示所有决策属性集合,c1,c2,c3,…cj表示所有条件属性集合,d表示决策属性,U表示论域;
4)定义reduct(C)=C-{cj}为条件属性C的约简集,将条件属性cj逐个去除,比较γreduct(C)(d)与γC(d)的大小,若γreduct(C)(d)=γC(d),则终止运算;若不等,将执行步骤1);
5)使用染色体编码方法,根据公式
Figure BDA0003595401030000061
其中,X表示对象子集,x表示对象,U表示论域,将每个条件属性对每个个体编码,通过二进制字符串[0,1]的形式。若条件属性属于本个体,就表示为1;否则表示0;从而得到个体适应度F(r)值。
F(r)=(l-lτ)/l+γC(d)
其中,编码1的染色体个数为lτ,条件属性个数为l;初始种群由Pop_size的长度为|C|的二进制个体构成,且Pop_size=2|C|
6)计算下一代种群个体的适应度值,通过轮盘赌法从中选择,使用交叉概率PC来表示交叉点处染色体交叉概率,某个等位属性编码值反转概率用Pm表示,也就是变异概率;
7)选择最优个体,将它代入下一代种群,观察适应度,若不再变化或迭代步数到最大值,将最优个体输出,否则跳转执行6)。最后得到如表1所示的数据约简集:
表1
Figure BDA0003595401030000071
步骤5:将几组最简属性集代入RBF神经网络模型求MSE,融合结果取1-3表示稻虾水质等级,比较得出一组最优属性集,得到如图2所示数据约简集MSE。并将一组最优属性集的属性分为训练集和测试集。
步骤6:确定RBF神经网络的拓扑结构,将RBF神经网络的径向基函数的中心、宽度以及隐层到输出层的权值作为CPA算法的初始种群,利用CPA算法优化后得到最优的中心、宽度和权值,步骤如下:
1)初始化:初始化待求解问题的可能解,这里待求解问题的可能解分别为RBF神经网络的径向基函数的中心、宽度以及隐层到输出层的权值,随机初始化n个CPlant食肉植物和n个Prey猎物个体,位置表示如下:
Figure BDA0003595401030000072
其中,d为变量个数,n为nCPlant和nPrey总和,每个个体使用下式随机初始化:
Individuali,j=Lbj+(Ubj-Lbj)×rand
其中,Lb和Ub分别为自变量的最小值和最大值,i∈[1,2,...,n],j∈[1,2,...,d],rand为[0,1]之间的随机数。
对于第i个个体,通过将每一行作为适应度函数(取均方误差作为适应度函数)的输入来评估适应度值,计算得到的适应度值存在如下矩阵中:
Figure BDA0003595401030000073
2)分类与分组:每个个体按照其适应度值升序排序,排在前面的n个CPlant食肉植物作为食肉植物CP,剩余的nPrey作为猎物Prey,排序后的适应度值和种群通过下列两式表示:
Figure BDA0003595401030000081
Figure BDA0003595401030000082
分组的过程模拟每个肉食植物以及猎物的环境,将适合度最高的猎物分配给排名第一的食肉植物,类似地,第二名和第三名猎物属于第二和第三肉食植物。以此类推,直到排名nCPlant的猎物分配给第nCPlant的肉食植物,然后nCPlant+1名猎物分配给第一名肉食植物(在猎物多余的情况下)。
3)成长:每一个种群都随机选择一个猎物,如果吸引率高于随机生成的数字,食肉植物就会捕获猎物并消化生长。食肉植物成长模型为:
NewCPi,j=growth×CPi,j+(1-growth)×Preyv,j
growth=growth_rate×randi,j
其中,CPi,j是排名第i的食肉植物,Preyv,j为随机选择的猎物,成长率growth_rate为预定义的值,rand为[0,1]之间的随机数。在CPA中,每一个种群内部只有一个食肉植物,而猎物的数量必须多于两个,CPA的吸引率一般设置为0.8.
如果吸引率低于产生的随机值,则猎物逃跑并成长,表示为:
NewPreyi,j=growth×Preyu,i+(1-growth)×Preyv,j,u≠v
Figure BDA0003595401030000091
其中,Preyu,j是第i个种群中随机选择的另一个猎物。食肉植物和猎物生长过程持续到group_iter代(预定义值),且两式将新的解向高质量解空间方向指导。
4)繁殖:排名第一的食肉植物(种群最好的解),才允许繁殖。最优食肉植物繁殖过程如下:
NewCPi,j=CP1,j+Re production_rate×randi,j×matei,j
Figure BDA0003595401030000092
其中,CP1,j为最优解,CPv,j为随机选择的食肉植物,繁殖率Re production_rate是预定义的值。繁殖过程重复nCPlant次,繁殖过程中,每个维度j都随机选择一个食肉植物v。
5)适应度更新和合并:将新生成的食肉植物和猎物和之前的种群合并,得到新的维度种群,按照适应度值升序排序,选择排名前n的个体作为新的候选解,保准种群大小不变。
6)重复1)到4)过程,每一次重复的结果作为RBF网络的最优三参数,直到满足停止准则(预设定)。
经过上述步骤,得出优化RBF网络模型,利用该优化RBF网络模型去预测虾稻水质。
如图3所示模型试验对比图,本发明分别以RBF神经神经网络模型、RS-RBF神经网络模型以及本发明优化模型进行试验对比,发现本发明优化模型的试验误差最小,其在进行水质预测时,精确度、准确度会更高。
上述实施方式只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所做的等效变换或修饰,都应涵盖在本发明的保护范围之内。

Claims (6)

1.一种基于RS粗糙集和CPA算法的稻虾水质预测方法,其特征在于,包括如下步骤:
步骤1:对稻虾水域随机两块区域进行测量PH值、浑浊度、气压、温度、氨氮以及溶解氧六项指标,各区域每次重复测量一组,一天测量多次,分别记为A1-A12和A13-A24
步骤2:对测量的水质数据预处理,将数据归一化以文本的形式存储,将数据转换至0-1之间;
步骤3:根据稻虾对不同水质的生存情况,将指标划分等级;
步骤4:通过RS粗糙集对A1-A24属性约简,找出几组最简属性集;
步骤5:将步骤4几组最简属性集代入RBF神经网络进行MSE比较,得出一组最优属性集,并将一组最优属性集的属性分为训练集和测试集;
步骤6:确定RBF神经网络的拓扑结构,将RBF神经网络的径向基函数的中心、宽度以及隐层到输出层的权值作为CPA算法的初始种群,使用CPA算法进行优化得到优化后的中心、权值和宽度;
步骤7:最终得出优化模型,利用该优化模型及步骤5中划分的训练集和测试集进行预测虾稻水质。
2.根据权利要求1所述的基于RS粗糙集和CPA算法的稻虾水质预测方法,其特征在于,所述A1-A12为两组六参数水质指标,A1-A12为同一块区域,A13-A24为另一块区域两组六参数水质指标。
3.根据权利要求1所述的基于RS粗糙集和CPA算法的稻虾水质预测方法,其特征在于,所述步骤3中指标划分为:I(优)、II(良)、III(差)三个等级。
4.根据权利要求1所述的基于RS粗糙集和CPA算法的稻虾水质预测方法,其特征在于,所述步骤4对对A1-A24的属性约简步骤如下:
步骤1)将预处理之后的水质数据按照各个属性对应的区间进行划分,并进行编号,获得试验数据决策表;
步骤2)通过遗传算法,对试验数据决策表进行约简;
步骤3)根据公式γc(D)=|posc(D)|/|U|,计算出决策属性D({d1,d2,d3,…di})对条件属性C({c1,c2,c3,…cj})的依赖度γc(d),其中,d1,d2,d3,…di表示所有决策属性集合,c1,c2,c3,…cj表示所有条件属性集合,d表示决策属性,U表示论域;
步骤4)定义rduct(C)=C-{cj}为条件属性C的约简集,将条件属性cj逐个去除,比较γreduct(C)(d)与γC(d)的大小,若γreduct(d)=γC(d),则终止运算;若不等,将执行步骤1);
步骤5)使用染色.体编码方法,根据公式
Figure FDA0003595401020000021
其中,X表示对象子集,x表示对象,U表示论域,将每个条件属性对每个个体编码,通过二进制字符串[0,1]的形式;若条件属性属于本个体,就表示为1;否则表示0;从而得到个体适应度F(r)值:
F(r)=(l-lτ)/l+γC(d)
其中,编码1的染色体个数为lτ,条件属性个数为l;初始种群由Pop_size的长度为|C|的二进制个体构成,且Pop_size=2|C|
步骤6)计算下一代种群个体的适应度值,通过轮盘赌法从中选择,使用交叉概率γC来表示交叉点处染色体交叉概率,某个等位属性编码值反转概率用Pm表示,也就是变异概率;
步骤7)选择最优个体,将它代入下一代种群,观察适应度,若不再变化或迭代步数到最大值,将最优个体输出,否则跳转执行步骤6)。
5.根据权利要求1所述的基于RS粗糙集和CPA算法的稻虾水质预测方法,其特征在于,所述步骤6中CPA算法优化步骤为:
1)初始化:初始化待求解问题的可能解,这里待求解问题的可能解分别为RBF神经网络的径向基函数的中心、宽度以及隐层到输出层的权值,随机初始化n个CPlant食肉植物和n个Prey猎物个体,位置表示如下:
Figure FDA0003595401020000031
其中,d为变量个数,n为nCPlant和nPrey总和,每个个体使用下式随机初始化:
Individuali,j=Lbj+(Ubj-Lbj)×rand
其中,Lb和Ub分别为自变量的最小值和最大值,i∈[1,2,...,n],j∈[1,2,...,d],rand为[0,1]之间的随机数;
对于第i个个体,通过将每一行作为适应度函数的输入来评估适应度值,计算得到的适应度值存在如下矩阵中:
Figure FDA0003595401020000032
2)分类与分组:每个个体按照其适应度值升序排序,排在前面的n个CPlant食肉植物作为食肉植物CP,剩余的nPrey作为猎物Prey,排序后的适应度值和种群通过下列两式表示:
Figure FDA0003595401020000033
Figure FDA0003595401020000041
分组的过程模拟每个肉食植物以及猎物的环境,将适合度最高的猎物分配给排名第一的食肉植物,类似地,第二名和第三名猎物属于第二和第三肉食植物;以此类推,直到排名nCPlant的猎物分配给第nCPlant的肉食植物,然后在猎物多余的情况下,nCPlant+1名猎物分配给第一名肉食植物;
3)成长:每一个种群都随机选择一个猎物,如果吸引率高于随机生成的数字,食肉植物就会捕获猎物并消化生长,食肉植物成长模型为:
NewCPi,j=growth×CPi,j+(1-growth)×Preyv,j
growth=growth_rate×randi,j
其中,CPi,j是排名第i的食肉植物,Preyv,j为随机选择的猎物,成长率growth_rate为预定义的值,rand为[0,1]之间的随机数,每一个种群内部只有一个食肉植物,而猎物的数量必须多于两个,如果吸引率低于产生的随机值,则猎物逃跑并成长,表示为:
NewPreyi,j=growth×Preyu,j+(1-growth)×Preyv,j,u≠v
Figure FDA0003595401020000042
其中,Preyu,j是第i个种群中随机选择的另一个猎物;食肉植物和猎物生长过程持续到group_iter代(预定义值),且两式将新的解向高质量解空间方向指导;
4)繁殖:排名第一的食肉植物,才允许繁殖,最优食肉植物繁殖过程如下:
NewCPi,j=CP1,j+Re production_rate×randi,j×matei,j
Figure FDA0003595401020000051
其中,CP1,j为最优解,CPv,j为随机选择的食肉植物,繁殖率Reproduction_rate是预定义的值,繁殖过程重复nCPlant次,繁殖过程中,每个维度j都随机选择一个食肉植物v;
5)适应度更新和合并:将新生成的食肉植物和猎物和之前的种群合并,得到新的维度种群,按照适应度值升序排序,选择排名前n的个体作为新的候选解,保准种群大小不变;
6)重复1)到4)过程,每一次重复的结果作为RBF神经网络的最优三参数,直到满足停止准则。
6.根据权利要求1至5任一所述的基于RS粗糙集和CPA算法的稻虾水质预测方法,其特征在于,通过RS粗糙集对A1-A24属性约简时,所抽取的数据量大于24。
CN202210392279.7A 2022-04-14 2022-04-14 基于rs粗糙集和cpa算法的稻虾水质预测方法 Pending CN114611840A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210392279.7A CN114611840A (zh) 2022-04-14 2022-04-14 基于rs粗糙集和cpa算法的稻虾水质预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210392279.7A CN114611840A (zh) 2022-04-14 2022-04-14 基于rs粗糙集和cpa算法的稻虾水质预测方法

Publications (1)

Publication Number Publication Date
CN114611840A true CN114611840A (zh) 2022-06-10

Family

ID=81868785

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210392279.7A Pending CN114611840A (zh) 2022-04-14 2022-04-14 基于rs粗糙集和cpa算法的稻虾水质预测方法

Country Status (1)

Country Link
CN (1) CN114611840A (zh)

Similar Documents

Publication Publication Date Title
CN108920812B (zh) 一种机械加工表面粗糙度预测方法
CN112966805A (zh) 一种基于图卷积神经网络和nsga-ⅱ算法的水库调度多目标优化方法
Yadav et al. An overview of genetic algorithm and modeling
CN110442143A (zh) 一种基于组合多目标鸽群优化的无人机态势数据聚类方法
CN110674965A (zh) 基于动态特征选取的多时间步长风功率预测方法
CN111292124A (zh) 一种基于优化组合神经网络的需水预测方法
CN115391385A (zh) 一种基于蚁群遗传动态融合算法的数据库查询优化方法
CN113722980A (zh) 海洋浪高预测方法、系统、计算机设备、存储介质、终端
CN115293400A (zh) 一种电力系统负荷预测方法及系统
CN113971517A (zh) 一种基于ga-lm-bp神经网络的水质评价方法
CN116702937A (zh) 一种基于K-means均值聚类及优化BP神经网络的光伏出力日前预测方法
CN106845696B (zh) 一种智能优化水资源配置方法
CN111275074A (zh) 基于栈式自编码网络模型的电力cps信息攻击辨识方法
CN114580762A (zh) 一种基于XGBoost的水文预报误差校正方法
CN113221447A (zh) 一种基于改进遗传算法优化bp神经网络的土壤湿度预测方法
CN113282747A (zh) 一种基于自动机器学习算法选择的文本分类方法
CN111652413B (zh) 基于多Agent分布式海量数据处理的工业电力负荷预测方法
CN117454765A (zh) 基于ipso-bp神经网络铜熔炼炉喷枪寿命预测方法
CN111310974A (zh) 一种基于ga-elm的短期需水预测方法
CN114611840A (zh) 基于rs粗糙集和cpa算法的稻虾水质预测方法
CN110276478B (zh) 基于分段蚁群算法优化svm的短期风电功率预测方法
CN109359671B (zh) 一种水电站水库调度规则的分类智能提取方法
CN115394381A (zh) 一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置
CN112183843B (zh) 一种基于混合智能算法的火电厂负荷优化分配方法
CN114997475A (zh) 一种基于Kmeans的融合模型光伏发电短期预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination