CN115310664A - 基于基因调控遗传算法的rbf神经网络训练方法及预测系统 - Google Patents
基于基因调控遗传算法的rbf神经网络训练方法及预测系统 Download PDFInfo
- Publication number
- CN115310664A CN115310664A CN202210773467.4A CN202210773467A CN115310664A CN 115310664 A CN115310664 A CN 115310664A CN 202210773467 A CN202210773467 A CN 202210773467A CN 115310664 A CN115310664 A CN 115310664A
- Authority
- CN
- China
- Prior art keywords
- neural network
- rbf neural
- genetic algorithm
- population
- gene regulation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 132
- 230000002068 genetic effect Effects 0.000 title claims abstract description 81
- 238000012549 training Methods 0.000 title claims abstract description 70
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 67
- 230000033228 biological regulation Effects 0.000 title claims abstract description 56
- 238000000034 method Methods 0.000 title claims abstract description 52
- 108020004414 DNA Proteins 0.000 claims abstract description 49
- 238000005457 optimization Methods 0.000 claims abstract description 34
- 230000003044 adaptive effect Effects 0.000 claims abstract description 31
- 238000013518 transcription Methods 0.000 claims abstract description 22
- 230000035897 transcription Effects 0.000 claims abstract description 22
- 108091023040 Transcription factor Proteins 0.000 claims abstract description 20
- 102000040945 Transcription factor Human genes 0.000 claims abstract description 20
- 230000035772 mutation Effects 0.000 claims description 45
- 238000012360 testing method Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 15
- 102000053602 DNA Human genes 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 14
- 239000012634 fragment Substances 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims description 7
- 238000003860 storage Methods 0.000 claims description 7
- 239000004065 semiconductor Substances 0.000 claims description 6
- 230000006798 recombination Effects 0.000 claims description 5
- 238000005215 recombination Methods 0.000 claims description 5
- 238000010187 selection method Methods 0.000 claims description 4
- 108091026890 Coding region Proteins 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 238000006073 displacement reaction Methods 0.000 claims description 3
- 238000009826 distribution Methods 0.000 claims description 3
- 231100000221 frame shift mutation induction Toxicity 0.000 claims description 3
- 230000037433 frameshift Effects 0.000 claims description 3
- 238000003780 insertion Methods 0.000 claims description 3
- 230000037431 insertion Effects 0.000 claims description 3
- 230000001124 posttranscriptional effect Effects 0.000 claims description 3
- 230000001105 regulatory effect Effects 0.000 claims 4
- 238000004519 manufacturing process Methods 0.000 abstract description 17
- 238000002347 injection Methods 0.000 abstract description 16
- 239000007924 injection Substances 0.000 abstract description 16
- 230000006872 improvement Effects 0.000 abstract description 5
- 238000011160 research Methods 0.000 abstract description 5
- 239000000243 solution Substances 0.000 abstract description 4
- 238000013459 approach Methods 0.000 abstract description 3
- 238000004088 simulation Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 238000003062 neural network model Methods 0.000 description 5
- 239000003129 oil well Substances 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000002028 premature Effects 0.000 description 2
- 150000003254 radicals Chemical class 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 230000008304 DNA mechanism Effects 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 206010036590 Premature baby Diseases 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008303 genetic mechanism Effects 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000008844 regulatory mechanism Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/086—Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Development Economics (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Game Theory and Decision Science (AREA)
- Physiology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Educational Administration (AREA)
- Agronomy & Crop Science (AREA)
- Animal Husbandry (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Primary Health Care (AREA)
Abstract
本发明提供一种基于基因调控遗传算法的RBF神经网络训练方法及预测系统,采用四进制DNA编码方式,针对遗传算法中选择、转录和变异这3个操作环节进行深入优化,提升了遗传算法的整体性能,并用该遗传优化算法对传统RBF神经网络梯度下降的寻优方式进行改进,将优化后RBF神经网络算法应用到油田注采的建模和产油量预测中,得到一套行之有效的RBF神经网络预测系统。所述训练方法通过自适应转录因子有效地避免种群早熟和局部最优解的情况,结合所述自适应变异因子增强遗传算法的局部寻优能力。同时仿真实验结果也表明基于基因调控遗传算法优化的RBF神经网络的预测系统,在逼近能力和预测精度都有明显改善,为提高油田注采过程中产油量的预测精度提供了新的研究途径。
Description
技术领域
本发明涉及生物智能优化算法,尤其是涉及一种基于基因调控遗传算法的RBF神经网络的训练方法及预测系统。
背景技术
为了解决传统数学模型非线性不足、预测油田产量精度低的问题,许多的专家学者将支持向量机、机器学习、神经网络等技术应用到有油田注采建模和产油量预测中。其中神经网络模型的应用最为广泛,如韩荣、樊灵等人针对油田产量的预测问题提出了一种BP神经网络预测方法,通过对油田产量的影响因素进行分析,建立了油田注采的BP神经网络预测模型,对油田产量进行了预测,但是预测精度有待提高。为了更好地克服注采过程中各影响因素之间的非线性,有学者对采集到的数据先通过小波变换进行分析处理,然后再通过BP神经网络模型进行油田产量的预测,提高了产量预测的精度,但是模型在优化过程中训练效率较低且易陷入局部最优值。
为了进一步提升传统神经网络预测精度,很多学者将智能优化算法应用到神经网络的训练过程中,如徐辰华等人将遗传优化算法引入BP神经网络模型,有效克服了传统BP神经网络的缺陷,但是传统遗传算法容易出现早熟和局部最优值的问题。祁浩等人在此基础上将量子算法引入免疫遗传系统,有效避免了算法的冗余问题,但是算法的精度有待进一步提升。随着生物智能算法的发展,以DNA调控为核心的基因调控网络模型为传统优化算法的改进提供了新的研究思路。如受启发于生物DNA的遗传机理,丁永生等人将遗传算法和DNA机理相结合,提出了基于DNA编码的遗传算法,但是仅仅改变了遗传算法的编码方式。李志刚等人通过运用DNA遗传算法对某生产模型进行求解和寻优,验证了该算法的可行性。但是上述研究仅改变编码方式并不能很好地解决遗传算法的早熟现象,算法的收敛精度难以得到保证。
为了更好地解决生物智能优化算法存在的问题,提高算法性能,受生物基因DNA分子的复制、转录和基因突变机制启发,本发明提出一种基于基因调控遗传算法(DNA-GA)的RBF神经网络的训练方法,用该算法对传统RBF神经网络梯度下降的寻优方式进行了改进,并对遗传算法(GA)中的选择操作、转录操作和变异操作均进行了优化,并将优化后RBF神经网络算法应用到油田注采的建模和产油量预测中。仿真实验结果表明了基于基因调控遗传算法的RBF神经网络的预测系统,在逼近能力和预测精度都有明显改善,为提高油田注采过程中产油量的预测精度提供了新的研究途径。
发明内容
本发明公开一种基于基因调控遗传算法的RBF神经网络训练方法,包括以下步骤:
步骤1:初始化RBF神经网络,采用动量梯度优化训练对所述RBF神经网络的参数优化,获得优化参数;
步骤2:基于基因调控遗传算法采用四进制DNA编码方式将所述优化参数编码后产生初代种群;所述DNA编码的长度L=5·(2+I)*J,所述初代种群X=(X1,X2,X3,...,XN);
步骤3:确定种群的适应度值,基于基因调控遗传算法,根据所述适应度值确定自适应转录因子和自适应变异因子,对所述种群进行选择操作、转录操作和变异操作,产生新一代种群;
步骤4:确定所述新一代种群的适应度值,如果满足终止条件,则进入步骤5;否则返回步骤3;
步骤5:输出最优适应度值的所述DNA编码,对所述DNA编码进行解码得到所述RBF神经网络的最优参数,构建RBF神经网络最优模型;
步骤6:采集样本数据,并采用小波降噪法对所述样本数据进行滤波及归一化处理,再按预设比例将处理后的样本数据分为训练集和测试集;使用所述训练集对所述RBF神经网络最优模型进行优化训练;再通过所述测试集测试后得到RBF神经网络最终模型;
步骤7:输入待预测数据到RBF神经网络最终模型,得到预测结果。
其中,I代表所述RBF神经网络输入节点的个数,J表示所述RBF神经网络隐含层节点的个数,N代表所述种群中包含的个体数。
进一步的,所述动量梯度优化训练具体为:
bj(k)=bj(k-1)+Δbj(k)+α[bj(k-1)-bj(k-2)];
cij(k)=cij(k-1)+Δcij(k)+α[cij(k-1)-cij(k-2)];
wj(k)=wj(k-1)+Δwj(k)+α[wj(k-1)-wj(k-2)];
其中,X=(x1,x2,x3,...,xi)表示输入数据,cij表示隐含层高斯函数的中心点坐标向量,与所述输入数据的维数相同,||X-cij||2为所述输入数据和所述中心点坐标向量之间的欧氏距离,bj表示所述隐含层高斯函数的宽度;i=1,2,3....I,表示所述RBF神经网络输入节点的序号;j=1,2,3...J,表示所述RBF神经网络隐含层节点的序号;hj表示所述隐含层高斯函数的输出值:
α∈(0,1)为动量因子;k为动量梯度序号;Ek表示误差性指标函数,wj表示所述隐含层到输出层的权值。
优选的,所述选择操作具体为:
前R次算法迭代时,采用轮盘赌选择法选择所述父代个体;以及
从R+1次算法迭代开始,将所有所述个体按照所述适应度值从大到小进行降序排列,被选择为所述父代个体的概率p(xs)为:
其中,R为一预设正整数值,s表示按照适应度排序后个体的序号,q表示平均适应度选择概率;
其中,o表示适应度排序前个体序号,fit(xo)为所述目标函数在xo上所取得的适应度值,fitavg为所述适应度值fit(xo)的平均值。
优选的,所述转录操作具体为:
令待转录DNA基因片段的起始位置为第d个编码,所述待转录DNA基因片段表示为:
X=Xd+1,Xd+2,...,Xd+n;
进一步的,所述自适应转录因子具体为:
其中,p0表示初始转录因子且0<p0<0.4,fit表示所述个体变异前的适应度值,fitmax表示所述种群中的最大个体适应度值,fitmin表示所述种群中的最小个体适应度值,fitavg表示所述种群中个体适应度的平均值。
优选的,所述变异操作具体为:
待变异片段DNA基因的编码表示为XL-b,XL-b+1,...,XL,所述变异操作通过所述自适应变异因子确定变异长度;变异长度为b=L·qc,并向下取整;其中qc表示自适应变异因子;
所述变异操作包括移位变异和重组变异,采用随机数来确定所述变异操作的类型;
取所述随机数m∈(0,1],选择取值区间内的中间值0.5作为划分点;
若0<m≤0.5,则采用所述移位变异;若0.5<m≤1,则采用所述重组变异;
所述移位变异是根据基因插入突变的原理,在所述个体编码的基础上,在变异起始位置随机插入单个编码X,之后的编码依次向后移位;其中X为四进制编码0,1,2,3中的任一个数字;
所述重组变异则是根据基因随机移码突变的原理,将所述变异片段的编码顺序打乱,然后再随机进行组合形成新的变异片段。
进一步的,所述自适应变异因子具体为:
其中,q0表示初始变异因子,Δfitmax表示所述种群中最大个体适应度值的变化量,ΔS表示所述种群与最近一次最大适应度发生变化的种群之间相隔的代数,且
本发明还公开一种基于基因调控遗传算法的RBF神经网络预测系统,应用于油田产量预测领域,包括:
数据获取模块,用于采用样本数据,并采用小波降噪法对所述样本数据进行滤波及归一化处理,再按预设比例将处理后的所述样本数据分为训练集和测试集;
优化模块,采用基于基因调控遗传算法对RBF神经网络进行优化,输出所述RBF神经网络的最优参数,用于构建RBF神经网络最优模型;
训练模块,使用所述训练集对所述RBF神经网络最优模型优化训练,再通过所述测试集测试后得到RBF神经网络最终模型;
预测模块,输入待预测数据,经过所述RBF神经网络最终模型,得到预测结果。
进一步的,所述采用基于基因调控遗传算法对RBF神经网络进行优化,具体为:
步骤1:初始化RBF神经网络,采用动量梯度优化训练对所述RBF神经网络的参数优化,得到优化参数;
步骤2:基于基因调控遗传算法采用四进制DNA编码方式将所述优化参数编码后产生初代种群;
步骤3:计算种群的适应度值,基于基因调控遗传算法,根据所述适应度值确定自适应转录因子和自适应变异因子,对所述种群进行选择操作、转录操作和变异操作,产生新一代种群;
步骤4:计算所述新一代种群的适应度值,如果满足终止条件,则进入步骤5;否则返回步骤3;
步骤5:输出最优适应度值的所述DNA编码,对所述DNA编码进行解码得到所述RBF神经网络的最优参数,完成RBF神经网络最优模型的构建。
进一步的,所述预测系统还包括计算机可读存储介质,其上存储有计算机程序。
所述预测系统还包括:
非易失性的半导体存储元件,用于读取数据获取模块采集的数据信息;所述数据信息至少包括训练集和测试集中的样本数据,以及待预测数据;
数据处理单元,通过处理电路调用所述计算机程序执行并实现如前面所述基于基因调控遗传算法的RBF神经网络训练方法的步骤;
数据分配电路,对从所述非易失性的半导体存储元件读取的待预测数据按每一处理单位经数据处理单元处理后,将得到的预测结果发送至一条或多条CAN总线,以通过网关发送至外部设备。
本发明提供一种基于基因调控遗传算法的RBF神经网络训练方法及预测系统,采用四进制DNA编码方式,针对遗传算法中选择、转录和变异这3个操作环节进行深入优化,提升了遗传算法的整体性能,并用该遗传优化算法对传统RBF神经网络梯度下降的寻优方式进行改进,将优化后RBF神经网络算法应用到油田注采的建模和产油量预测中,得到一套行之有效的预测系统。
本发明的有益效果在于,通过所述自适应转录因子有效地避免种群早熟和局部最优解的情况,结合所述自适应变异因子增强算法的局部寻优能力。同时仿真实验结果也表明基于基因调控遗传算法优化的RBF神经网络模型,在逼近能力和预测精度都有明显改善,为提高油田注采过程中产油量的预测精度提供了新的研究途径。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明所述基于基因调控遗传算法的RBF神经网络训练方法的流程图;
图2是本发明所述基于基因调控遗传算法的RBF神经网络训练方法的四进制DNA编码示意图;
图3是本发明所述基于基因调控遗传算法的RBF神经网络训练方法的转录操作示意图;
图4是本发明所述基于基因调控遗传算法的RBF神经网络训练方法的移位变异操作示意图;
图5是本发明所述基于基因调控遗传算法的RBF神经网络训练方法的重组变异操作示意图;
图6是本发明所述基于基因调控遗传算法的RBF神经网络训练方法应用于RBF神经网络训练的结构图;
图7是本发明所述基于基因调控遗传算法的RBF神经网络预测系统的迭代误差图。
图8是本发明所述基于基因调控遗传算法的RBF神经网络预测系统的误差对比图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步说明。在此需要说明的是,对于这些实施方式的说明用于帮助理解本发明,但并不构成对本发明的限定。此外,下面所描述的本发明各个实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互组合。
针对传统RBF神经网络在处理非线性、迟滞性等复杂问题时出现的收敛速度慢、容易陷入局部最小值等问题,本发明公开一种基于基因调控遗传算法的RBF神经网络训练方法,整体思路如图1所示,包括以下步骤:
步骤1:初始化RBF神经网络,采用动量梯度优化训练对所述RBF神经网络的参数优化,获得优化参数;
进一步的,所述动量梯度优化训练具体为:
bj(k)=bj(k-1)+Δbj(k)+α[bj(k-1)-bj(k-2)];
cij(k)=cij(k-1)+Δcij(k)+α[cij(k-1)-cij(k-2)];
wj(k)=wj(k-1)+Δwj(k)+α[wj(k-1)-wj(k-2)];
其中,X=(x1,x2,x3,...,xi)表示输入数据,cij表示隐含层高斯函数的中心点坐标向量,与所述输入数据的维数相同,||X-cij||2为所述输入数据和所述中心点坐标向量之间的欧氏距离,bj表示所述隐含层高斯函数的宽度;i=1,2,3....I,表示所述RBF神经网络输入节点的序号;j=1,2,3...J,表示所述RBF神经网络隐含层节点的序号;hj表示所述隐含层高斯函数的输出值:
α∈(0,1)为动量因子;k为动量梯度序号;Ek表示误差性指标函数,wj表示所述隐含层到输出层的权值。
步骤2:基于基因调控遗传算法采用四进制DNA编码方式将所述优化参数编码后产生初代种群;所述DNA编码的长度为L=5·(2+I)*J,所述初代种群X=(X1,X2,X3,...,XN);
所述编码方式具体为:生物学中,基因表达调控一般在转录水平上进行,通过DNA分子的复制转录和翻译过程,将遗传信息不断传递下去,控制生物体的生长发育。DNA分子是一种双螺旋结构的高分子化合物,由四种核苷酸组成:腺嘌呤脱氧核苷酸(A)、胞嘧啶脱氧核苷酸(C)、鸟嘌呤脱氧核苷酸(G)、胸腺嘧啶有脱氧核苷酸(T)。因此DNA的单链可以看作是4个不同字母A、G、C和T组成的串。
采用基于DNA链条中碱基的编码方式,单个DNA分子可以表达为4个字母的集合:{A、T、C、G}。因此,采用四进制DNA编码方式对个体进行编码,数字0代表碱基A,数字1代表碱基C,数字2代表碱基G,数字3代表碱基T。初始个体可以用随机四进制数字序列表示,如X=203103210322031就可表示一个长度为15的个体。若种群中包含的个体数为N,则第k个(1≤k≤N)个体的结构如图2所示,图中L表示个体编码的长度,X1,X2,X3,...,XL-1,XL表示参数值,其中,0≤Xi≤3(1≤i≤L)且为整数值。
其中,i代表所述RBF神经网络输入节点的个数,j表示所述RBF神经网络隐含层节点的个数,N代表所述种群中包含的个体数。
本发明采用的四进制DNA编码方式是根据基因调控机制中DNA分子的编码方式进行的,个体编码随机且不考虑碱基的顺序和个数。在此基础上,将基因表达中DNA的复制、转录以及突变的过程引入遗传算法选择、转录和变异操作中,按照碱基对互补的原则对信息进行操作。
步骤3:确定种群的适应度值,基于基因调控遗传算法,根据所述适应度值确定自适应转录因子和自适应变异因子,对所述种群进行选择操作、转录操作和变异操作,产生新一代种群;
所述选择操作具体为:前R次算法迭代时,采用轮盘赌选择法选择所述父代个体;以及从R+1次算法迭代开始,将所有所述个体按照所述适应度值从大到小进行降序排列,被选择为所述父代个体的概率p(xs)为:
其中,R为一预设正整数值,s表示按照适应度排序后个体的序号,q表示平均适应度选择概率;
其中,o表示适应度排序前个体序号,fit(xo)为所述目标函数在xo上所取得的适应度值,fitavg为所述适应度值fit(xo)的平均值。
这是因为选择操作模仿的是自然界中优胜劣汰的过程,保留适应度值较大的个体,体现算法的全局寻优能力。传统遗传算法采用的是轮盘赌选择法随机选择复制个体,该方法能够保证下一代种群的多样性;但是在进化后期,适应度值差别较小时会出现收敛速度慢的问题。所以所述算法保留轮盘赌的优点,在进行后期对选择算子进行改进,克服收敛速度慢的问题。
所述转录操作具体为:如图3所示,令待转录DNA基因片段的起始位置为第d个编码,所述待转录DNA基因片段表示为:X=Xd+1,Xd+2,...,Xd+n;转录后DNA基因片段表示为:
进一步的,所述自适应转录因子具体为:
其中,p0表示初始转录因子且0<p0<0.4,fit表示所述个体变异前的适应度值,fitmax表示所述种群中的最大个体适应度值,fitmin表示所述种群中的最小个体适应度值,fitavg表示所述种群中个体适应度的平均值。
可见,自适应转录因子pc是跟随种群和自身的适应度值发生变化的,这会导致每个个体的所述转录长度是不一致的,且每次迭代时,若所述种群的fitmax和fitmin发生变化时,所述转录长度也会发生变化,所述自适应转录因子一直处于一种动态调整的过程中,更有效地避免种群早熟和局部最优解的情况。
优选的,所述变异操作具体为:
待变异片段DNA基因的编码表示为XL-b,XL-b+1,...,XL,所述变异操作通过所述自适应变异因子确定变异长度;变异长度为b=L·qc,并向下取整;其中qc表示自适应变异因子;
所述变异操作包括移位变异和重组变异,采用随机数来确定所述变异操作的类型;
取所述随机数m∈(0,1],选择取值区间内的中间值0.5作为划分点;
若0<m≤0.5,则采用所述移位变异;若0.5<m≤1,则采用所述重组变异;
如图4所示,所述移位变异是根据基因插入突变的原理,在所述个体编码的基础上,在变异起始位置随机插入单个编码X,之后的编码依次向后移位;其中X为四进制编码0,1,2,3中的任一个数字;
如图5所示,所述重组变异则是根据基因随机移码突变的原理,将所述变异片段的编码顺序打乱,然后再随机进行组合形成新的变异片段。
进一步的,所述自适应变异因子具体为:
其中,q0表示初始变异因子,Δfitmax表示所述种群中最大个体适应度值的变化量,ΔS表示所述种群与最近一次最大适应度发生变化的种群之间相隔的代数,且
同理,自适应变异因子qc也是跟随种群和自身的适应度值发生变化的,这会导致每个个体的所述变异长度是不一致的,且每次迭代时,所述种群的fitmax和ΔS发生变化时,所述变异长度也会发生变化,所述自适应变异因子一直处于一种动态调整的过程中,可防止优良种群被破坏,保持种群的多样性,增强算法的局部寻优能力。
步骤4:确定所述新一代种群的适应度值,如果满足终止条件,则进入步骤5;否则返回步骤3;
所述终止条件是指所述适应度值达到预设的误差值要求;还包括,在一定的迭代次数中,最好个体的适应度值都无明显改善,或种群的平均适应度值没有明显改善,或者采用以上这些条件的组合停止算法的条件。
所述算法是在原始遗传算法的基础上,改进个体的编码方式、选择、转录和变异过程,提高算法的整体性能,尤其是在收敛速度和精度方面提升较大。本发明的具体改进主要是基于个体的适应度值,优化算法的选择、转录和变异操作,而且改进后的操作是在迭代过程中动态调整的,并非原始遗传算法的固定算法操作。
步骤5:输出最优适应度值的所述DNA编码,对所述DNA编码进行解码得到所述RBF神经网络的最优参数,用于构建RBF神经网络最优模型;
所述RBF神经网络最优模型如图6所示。RBF神经网络的训练过程是权值的寻优过程,本发明用遗传优化算法对RBF神经网络的训练过程进行优化改进,能够进一步提高RBF神经网络的收敛速度和精度。
步骤6:采集样本数据,并采用小波降噪法对所述样本数据进行滤波及归一化处理,再按预设比例将处理后的样本数据分为训练集和测试集;使用所述训练集对所述RBF神经网络最优模型进行优化训练;再通过所述测试集测试后得到RBF神经网络最终模型;
步骤7:输入待预测数据到RBF神经网络最终模型,得到预测结果。
优选的,本发明还公开一种基于基因调控遗传算法的RBF神经网络预测系统,应用于油田产量预测领域,包括:
数据获取模块,用于采用样本数据,并采用小波降噪法对所述样本数据进行滤波及归一化处理,再按预设比例将处理后的所述样本数据分为训练集和测试集;
优化模块,采用基于基因调控遗传算法对RBF神经网络进行优化,输出所述RBF神经网络的最优参数,用于构建RBF神经网络最优模型;
训练模块,使用所述训练集对所述RBF神经网络最优模型优化训练,再通过所述测试集测试后得到RBF神经网络最终模型;
预测模块,输入待预测数据,经过所述RBF神经网络最终模型,得到预测结果。
进一步的,所述采用基于基因调控遗传算法对RBF神经网络进行优化,具体为:
步骤1:初始化RBF神经网络,采用动量梯度优化训练对所述RBF神经网络的参数优化,得到优化参数;
步骤2:基于基因调控遗传算法采用四进制DNA编码方式将所述优化参数编码后产生初代种群;
步骤3:计算种群的适应度值,基于基因调控遗传算法,根据所述适应度值确定自适应转录因子和自适应变异因子,对所述种群进行选择操作、转录操作和变异操作,产生新一代种群;
步骤4:计算所述新一代种群的适应度值,如果满足终止条件,则进入步骤5;否则返回步骤3;
步骤5:输出最优适应度值的所述DNA编码,对所述DNA编码进行解码得到所述RBF神经网络的最优参数,完成RBF神经网络最优模型的构建;
进一步的,将训练好的RBF神经网络应用于油井产油量的预测方面。
本发明具体实施为:对国内某油田区块的2000余口油水井中的部分注采井组的注水采油数据进行研究,取其中某注采井组从2015年1月到2016年12月期间24个月的注水采油数据,共整理得到700组输入输出数据;选取其中600组数据作为训练数据,采用基于基因调控遗传算法对RBF神经网络进行训练,剩余的100组数据作为测试样本,进行验证。为了消除量纲的影响,提高模型训练的效率,本实施例采用小波降噪法对数据进行了滤波及归一化处理,预测完成后再进行反归一化。
油井产油量的影响因素有很多,本实施例选择原始井网注水量Qin1(k)、一次加密井网注水量Qin2(k)、二次加密井网注水量Qin3(k)、套管压力Pg(k)4个重要因素作为特征量,油井产油量Qout(k)作为神经网络的输出量,上述4个特征量加上神经网络的状态输出反馈Qout(k-1)、Qout(k-2),作为神经网络的6个输入,使用基于基因调控遗传算法训练后的三层RBF神经网络。
RBF神经网络模型的架构是:输入层6个神经元,隐含层7个神经元,输出层1个神经元,学习率η=0.5,动量因子α=0.05网络训练的目标误差E=0.0001,最大迭代次数为500;标准遗传算法的参数设置为:交叉概率p=0.6,变异概率q=0.05;基于基因调控遗传算法的RBF神经网络训练方法的参数设置为:转录因子控制参数p0=0.3,初始的变异因子q0=0.05,种群规模N均为40,最大迭代次数G均为100,分别对RBF神经网络参数进行寻优,实验效果如图7所示,从图7中可以看出,本发明所述RBF神经网络最终模型既提高了种群寻优的速度,又能避免早熟的现象。
为了体现基因调控遗传算法的优势,本实施例分别采用经典BP神经网络、传统RBF神经网络、遗传算法优化RBF神经网络和基因调控遗传算法优化RBF神经网络的预测系统构建油井注采模型,对产油量进行预测,实验效果中训练误差如图8所示,对比可知,基因调控遗传算法优化的RBF神经网络预测系统,其逼近能力有了明显改善,预测精度也更高。
进一步的,所述预测系统还包括一种计算机可读存储介质,其上存储有计算机程序,其上存储有计算机程序,还包括:
非易失性的半导体存储元件,用于读取数据获取模块采集的数据信息;所述数据信息至少包括训练集和测试集中的样本数据,以及待预测数据;
以及数据处理单元,通过处理电路调用所述计算机程序执行并实现如前面所述基于基因调控遗传算法的RBF神经网络训练方法的步骤;
还有数据分配电路,对从所述非易失性的半导体存储元件读取的待预测数据按每一处理单位经数据处理单元处理后,将得到的预测结果发送至一条或多条CAN总线,以通过网关发送至外部设备。
以上结合附图对本发明的实施方式作了详细说明,但本发明不限于所描述的实施方式。对于本领域的技术人员而言,在不脱离本发明原理和精神的情况下,对这些实施方式进行多种变化、修改、替换和变型,仍落入本发明的保护范围内。
Claims (10)
1.一种基于基因调控遗传算法的RBF神经网络训练方法,其特征在于,包括以下步骤:
步骤1:初始化RBF神经网络,采用动量梯度优化训练对所述RBF神经网络的参数优化,获得优化参数;
步骤2:基于基因调控遗传算法采用四进制DNA编码方式将所述优化参数编码后产生初代种群;所述DNA编码的长度L=5·(2+I)*J,所述初代种群X=(X1,X2,X3,...,XN);
步骤3:确定种群的适应度值,基于基因调控遗传算法,根据所述适应度值确定自适应转录因子和自适应变异因子,对所述种群进行选择操作、转录操作和变异操作,产生新一代种群;
步骤4:确定所述新一代种群的适应度值,如果满足终止条件,则进入步骤5;否则返回步骤3;
步骤5:输出最优适应度值的所述DNA编码,对所述DNA编码进行解码得到所述RBF神经网络的最优参数,构建RBF神经网络最优模型;
步骤6:采集样本数据,并采用小波降噪法对所述样本数据进行滤波及归一化处理,再按预设比例将处理后的样本数据分为训练集和测试集;使用所述训练集对所述RBF神经网络最优模型进行优化训练;再通过所述测试集测试后得到RBF神经网络最终模型;
步骤7:输入待预测数据到RBF神经网络最终模型,得到预测结果。
其中,I代表所述RBF神经网络输入节点的个数,J表示所述RBF神经网络隐含层节点的个数,N代表所述种群中包含的个体数。
2.根据权利要求1所述的基于基因调控遗传算法的RBF神经网络训练方法,其特征在于,所述动量梯度优化训练具体为:
bj(k)=bj(k-1)+Δbj(k)+α[bj(k-1)-bj(k-2)];
cij(k)=cij(k-1)+Δcij(k)+α[cij(k-1)-cij(k-2)];
wj(k)=wj(k-1)+Δwj(k)+α[wj(k-1)-wj(k-2)];
其中,X=(x1,x2,x3,...,xI)表示输入数据,cij表示隐含层高斯函数的中心点坐标向量,与所述输入数据的维数相同,||X-cij||2为所述输入数据和所述中心点坐标向量之间的欧氏距离,bj表示所述隐含层高斯函数的宽度;i=1,2,3....I,表示所述RBF神经网络输入节点的序号;j=1,2,3...J,表示所述RBF神经网络隐含层节点的序号;hj表示所述隐含层高斯函数的输出值:
α∈(0,1)为动量因子;k为动量梯度序号;Ek表示误差性指标函数,wj表示所述隐含层到输出层的权值。
6.根据权利要求5所述的基于基因调控遗传算法的RBF神经网络训练方法,其特征在于,所述变异操作具体为:
待变异片段DNA基因的编码表示为XL-b,XL-b+1,...,XL,所述变异操作通过所述自适应变异因子确定变异长度;变异长度为b=L·qc,并向下取整;其中qc表示自适应变异因子;所述变异操作包括移位变异和重组变异,采用随机数来确定所述变异操作的类型;
取所述随机数m∈(0,1],选择取值区间内的中间值0.5作为划分点;
若0<m≤0.5,则采用所述移位变异;若0.5<m≤1,则采用所述重组变异;
所述移位变异是根据基因插入突变的原理,在所述个体编码的基础上,在变异起始位置随机插入单个编码X,之后的编码依次向后移位;其中X为四进制编码0,1,2,3中的任一个数字;
所述重组变异则是根据基因随机移码突变的原理,将所述变异片段的编码顺序打乱,然后再随机进行组合形成新的变异片段。
8.一种基于基因调控遗传算法的RBF神经网络预测系统,应用于油田产量预测领域,其特征在于,所述系统包括:
数据获取模块,用于采用样本数据,并采用小波降噪法对所述样本数据进行滤波及归一化处理,再按预设比例将处理后的所述样本数据分为训练集和测试集;
优化模块,采用基于基因调控遗传算法对RBF神经网络进行优化,输出所述RBF神经网络的最优参数,用于构建RBF神经网络最优模型;
训练模块,使用所述训练集对所述RBF神经网络最优模型优化训练,再通过所述测试集测试后得到RBF神经网络最终模型;
预测模块,输入待预测数据,经过所述RBF神经网络最终模型,得到预测结果。
9.根据权利要求8所述的基于基因调控遗传算法的RBF神经网络预测系统,其特征在于,所述采用基于基因调控遗传算法对RBF神经网络进行优化,具体为:
步骤1:初始化RBF神经网络,采用动量梯度优化训练对所述RBF神经网络的参数优化,得到优化参数;
步骤2:基于基因调控遗传算法采用四进制DNA编码方式将所述优化参数编码后产生初代种群;
步骤3:计算种群的适应度值,基于基因调控遗传算法,根据所述适应度值确定自适应转录因子和自适应变异因子,对所述种群进行选择操作、转录操作和变异操作,产生新一代种群;
步骤4:计算所述新一代种群的适应度值,如果满足终止条件,则进入步骤5;否则返回步骤3;
步骤5:输出最优适应度值的所述DNA编码,对所述DNA编码进行解码得到所述RBF神经网络的最优参数,完成RBF神经网络最优模型的构建。
10.根据权利要求9所述的基于基因调控遗传算法的RBF神经网络预测系统,其特征在于,还包括:
计算机可读存储介质,且其上存储有计算机程序;
非易失性的半导体存储元件,用于读取数据获取模块采集的数据信息;所述数据信息至少包括训练集和测试集中的样本数据,以及待预测数据;
数据处理单元,通过处理电路调用所述计算机程序执行并实现如权利要求1-7任一项所述基于基因调控遗传算法的RBF神经网络训练方法的步骤;
和数据分配电路,对从所述非易失性的半导体存储元件读取的待预测数据按每一处理单位经数据处理单元处理后,将得到的预测结果发送至一条或多条CAN总线,以通过网关发送至外部设备。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210773467.4A CN115310664A (zh) | 2022-07-01 | 2022-07-01 | 基于基因调控遗传算法的rbf神经网络训练方法及预测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210773467.4A CN115310664A (zh) | 2022-07-01 | 2022-07-01 | 基于基因调控遗传算法的rbf神经网络训练方法及预测系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115310664A true CN115310664A (zh) | 2022-11-08 |
Family
ID=83856604
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210773467.4A Pending CN115310664A (zh) | 2022-07-01 | 2022-07-01 | 基于基因调控遗传算法的rbf神经网络训练方法及预测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115310664A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115879638A (zh) * | 2022-12-30 | 2023-03-31 | 东北石油大学 | 一种油田接转站系统碳排放预测方法 |
CN116644662A (zh) * | 2023-05-19 | 2023-08-25 | 之江实验室 | 一种基于知识嵌入神经网络代理模型的布井优化方法 |
CN116976221A (zh) * | 2023-08-10 | 2023-10-31 | 西安理工大学 | 基于冲蚀特性的堰塞体溃决峰值流量预测方法及存储介质 |
-
2022
- 2022-07-01 CN CN202210773467.4A patent/CN115310664A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115879638A (zh) * | 2022-12-30 | 2023-03-31 | 东北石油大学 | 一种油田接转站系统碳排放预测方法 |
CN116644662A (zh) * | 2023-05-19 | 2023-08-25 | 之江实验室 | 一种基于知识嵌入神经网络代理模型的布井优化方法 |
CN116644662B (zh) * | 2023-05-19 | 2024-03-29 | 之江实验室 | 一种基于知识嵌入神经网络代理模型的布井优化方法 |
CN116976221A (zh) * | 2023-08-10 | 2023-10-31 | 西安理工大学 | 基于冲蚀特性的堰塞体溃决峰值流量预测方法及存储介质 |
CN116976221B (zh) * | 2023-08-10 | 2024-05-17 | 西安理工大学 | 基于冲蚀特性的堰塞体溃决峰值流量预测方法及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115310664A (zh) | 基于基因调控遗传算法的rbf神经网络训练方法及预测系统 | |
CN111898689A (zh) | 一种基于神经网络架构搜索的图像分类方法 | |
WO2011135410A1 (en) | Optimization technique using evolutionary algorithms | |
CN112085161B (zh) | 一种基于随机信息传递的图神经网络方法 | |
CN115186769B (zh) | 一种基于nlp的突变基因分类方法 | |
CN115510963A (zh) | 一种增量式设备故障诊断方法 | |
CN112084877B (zh) | 基于nsga-net的遥感图像识别方法 | |
CN113724790B (zh) | 基于卷积去噪自编码机的piRNA-疾病关联关系预测方法 | |
CN113449930A (zh) | 一种基于bp神经网络的光纤预制棒制备质量预测方法 | |
CN116383912A (zh) | 一种提高控制精度的微型电机结构优化方法及系统 | |
CN113222165A (zh) | 一种基于遗传算法的量子线路优化方法 | |
CN110633868A (zh) | 遗传算法优化神经网络进行探井试油层油气性质预测方法 | |
JP6884143B2 (ja) | 階層的転置索引表を使用したdnaアラインメント | |
CN114792126A (zh) | 一种基于遗传算法的卷积神经网络设计方法 | |
CN108509764B (zh) | 一种基于遗传属性约简的古生物谱系演化分析方法 | |
CN114241267A (zh) | 基于结构熵采样的多目标架构搜索骨质疏松图像识别方法 | |
CN114004341A (zh) | 一种基于遗传算法及bp神经网络的光纤预制棒制备工艺优化方法 | |
CN114021432A (zh) | 一种应力腐蚀开裂裂纹扩展速率预测方法及系统 | |
CN113257359A (zh) | 一种基于CNN-SVR的CRISPR/Cas9向导RNA编辑效率预测方法 | |
CN114943866B (zh) | 基于进化神经网络结构搜索的图像分类方法 | |
CN115908909A (zh) | 基于贝叶斯卷积神经网络的进化神经架构搜索方法及系统 | |
CN116305939A (zh) | 陆地生态系统碳水通量高精度反演方法、系统及电子设备 | |
CN110705704A (zh) | 一种基于相关性分析的神经网络自组织遗传进化算法 | |
Sun | Bounds on edit metric codes with combinatorial dna constraints | |
CN110162704B (zh) | 基于多因子遗传算法的多规模关键用户提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |