CN104616062B - 一种基于多目标遗传规划的非线性系统辨识方法 - Google Patents

一种基于多目标遗传规划的非线性系统辨识方法 Download PDF

Info

Publication number
CN104616062B
CN104616062B CN201510082381.7A CN201510082381A CN104616062B CN 104616062 B CN104616062 B CN 104616062B CN 201510082381 A CN201510082381 A CN 201510082381A CN 104616062 B CN104616062 B CN 104616062B
Authority
CN
China
Prior art keywords
tree
individuality
individual
nonlinear system
chromosome
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201510082381.7A
Other languages
English (en)
Other versions
CN104616062A (zh
Inventor
魏爽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN201510082381.7A priority Critical patent/CN104616062B/zh
Publication of CN104616062A publication Critical patent/CN104616062A/zh
Application granted granted Critical
Publication of CN104616062B publication Critical patent/CN104616062B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Feedback Control In General (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于多目标遗传规划的非线性系统辨识方法。主要针对传统辨识方法在非线性系统的结构未知的情况下,辨识精度低和求解速度慢的缺点。提出同时最优化非线性系统结构和系统参数的多个目标优化函数模型,采用一种新颖的多目标遗传规划方法求解该模型。该方法提出了一种新的针对多个优化目标的评价方法,可以将决策过程融合在优化过程中而不需要计算多个Pareto最优解,其评价过程更高效。该方法可以有效的挖掘大量输入输出数据之间的非线性关系,提高辨识效率和准确度。

Description

一种基于多目标遗传规划的非线性系统辨识方法
技术领域
本发明非线性系统辨识方法领域,非线性系统用于自动化工业控制、生物医学数据建模、化学演变过程、灾后管理与决策等,具体涉及一种基于多目标遗传规划的非线性系统辨识方法。
背景技术
非线性系统辨识广泛应用于各种领域中挖掘未知而复杂的数据关系,例如:自动化工业控制,生物医学数据建模,化学演变过程,灾后管理与决策等。在这些问题中,通过传感器、网络等方式可以获得海量的各种数据信息,这些数据间存在的某些非线性关系对提高预测能力、决策能力和流程优化能力有积极作用。本文提出的非线性系统辨识方法旨在挖掘大量输入输出数据之间的非线性关系或模型,提高辨识效率和准确度,这在当前大数据的背景下是有重要的现实应用意义的。
现有的非线性系统辨识方法主要是求解非线性模型中的未知参数,这就要求模型的结构是已知的,或是可通过已知信息推理得到,这显然具有局限性。本文提出的方法不仅可以求解系统的未知参数,还可以辨识未知的非线性模型结构。因此,该方法的适用性更广泛。由于遗传规划可以对未知的结构进行优化,该方法采用一种基于多目标遗传规划的优化方法同时求解非线性系统的未知结构和未知参数,设计三个优化目标函数作为求解模型。
不过,遗传规划的求解过程是一个在海量的解空间中搜索最优解的过程,通常存在耗时较长和容易陷入局部最优解的弊病。特别是,当非线性系统的结构和参数都未知的情况下,容易陷入某一个目标函数的局部最优解,而不容易找到多个目标函数同时达到最优的全局最优解。为了克服以上不足,提高求解效率,该方法提出一种全新的多目标优化的求解方法,利用这三个目标之间的内在规律设计搜索方案,加快获得全局最优解的收敛速度,从而提高非线性系统结构未知条件下的辨识能力,挖掘海量数据中潜在的非线性关系。
发明内容
本发明的目的在于克服上述问题,提供一种提高在噪声条件下的非线性系统辨识能力、适用广泛、计算复杂度低、不容易陷入模型误差小而结构冗余的局部最优解的基于多目标遗传规划的非线性系统辨识方法。
为了实现上述目的,本发明所采用的技术方案为:一种基于多目标遗传规划的非线性系统辨识方法,包括如下步骤:
(1)初始化:采用树表示染色体个体的结构分量g,定义用于生成初始树结构的内部节点集合和叶子节点集合,设置树结构的最大深度Deptmax;其中染色体个体的参数分量c的矢量长度由结构分量g中因式项的个数决定;
(2)多目标评价:P0个染色体个体初始树构成初始种群,根据每个染色体个体的树结构和参数值计算f1,f2,f3三个目标函数的值,f1,f2,f3分别为输出量均方误差的最小化、选中的输入变量数量的最小化、以及系统结构复杂度的最小化;将每个染色体个体计算得到的目标函数值进行对比,根据优化排序方法对每个个体进行排序,得出每个个体的适应度;
(3)迭代步骤:初始迭代次数为0,迭代次数逐渐累加,假设当前迭代次数为k,本次迭代的种群中包含Pk个染色体,首先判断迭代收敛终止的条件是否满足,即迭代次数是否达到最大迭代数、或是输出量的均方误差是否小于指定阀值、或是三次以上迭代获得的最优解是否不变,若满足则结束,若不满足,则通过优化排序方法在Pk个染色体中选择迭代的个体生成染色体交配池,将交配池中的染色体个体分成三部分,分别用于复制、交叉和变异的进化操作;在复制操作中,利用优化排序方法获得的个体适应度进行判断,将适应度值较小的较优个体直接复制进入下一次迭代的种群;剩下的个体进行交叉和变异的进化操作,先通过进化操作获得子代,再采用基于竞争决策的精英培养机制,将母代和其对应的子代综合评价,从中选择较优的个体进入下一次迭代的种群;
(4)迭代后的染色体个体的多目标评价:采用正交最小二乘方法OLS对含有冗余分支树的个体进行剔除处理,根据优化排序方法得出新的种群中每个个体的适应度值;再次执行步骤(3)。
所述的优化排序方法具体如下:定义u和v为优化搜索空间中的任意两个个体所对应的目标值,每个目标值都是由三个分量构成的矢量,即:u=(u1,u2,u3),v=(v1,v2,v3);这三个分量分别是个体对应的三个目标函数(f1,f2,f3)计算得到的值;
定义任意两个个体所对应的目标值之间在第i个分量上的相对距离Δdi(u,v)如下:
定义任意两个个体所对应的目标值之间的比较距离如下:
定义选择优化个体的排序准则如下:
(1)如果duv>0且dvu<0,那么u的排序在v的排序之后,也就是说,v要优于u;
(2)如果duv<0且dvu>0,那么u的排序在v的排序之前,也就是说,u要优于v;
(3)如果duv<0且dvu<0,duv<dvu,那么u的排序在v的排序之前,也就是说,u要优于v;
(4)如果duv=0且dvu=0,那么u的排序和v的排序一样;
在选择优化个体时,根据以上排序准则给所有个体进行排序,其序号即为该个体的适应度值,排序越靠前,序号越小,即适应度值越小,其对应的个体是最优解的可能性越高。
多目标评价步骤中的f1,f2,f3三个目标函数的计算公式为:
式(2)
式(3)
c*为非线性系统的参数的最优解,g*为非线性系统的结构的最优解,x*为非线性系统输入变量集合的最优解;g为非线性系统结构的集合;g表示非线性系统的结构,c表示非线性系统的参数矢量,x=(x1,x2,...,xn)表示非线性系统的输入数据,其中n表示非线性系统的原始输入变量集合中变量的数目;y=[y(1) y(2) ... y(m)]T表示非线性系统的输出数据,y(1)表示第1个时间长度所观测的输出值,m表示输出数据的观测长度,以此类推;m(g)表示系统模型中因式项的总数,mnonlinear(g)表示系统模型中非线性因式项的个数。
在步骤(4)中对含有冗余分支树的个体进行剔除处理时,按照树个体的所有因式项由加号连接,假设某个树个体由s个分支树构成,这些分支树所对应的因式设为z1,z2,z3,......,zs,由此获得的输出矢量可
表示为
其中,ci表示第i个分支树对应的参数;采用最小二乘方LS方法求解c,如下c=(zTz)-1zTy
对矢量Z=[z1,z2,...,zs]进行QR分解,表示为Z=Q*R,其中Q为正交矩阵,矩阵中的元素为qi,R为上三角矩阵;定义一个辅助参数矩阵p,矩阵中的元素为pi,其表达式为p=D-1QTy
其中,D=QTQ正对角矩阵;一个分支树zi对模型误差降低的比率可以按照以下方式计算
对每一个分支树zi计算erri,当某分支树的该比率低于某个阀值errthreshold的时候,该分支树被剔除;反之,保留该分支树;
在完成剔除冗余分支树之后,通过最小二乘法重新计算每个分支树的参数c;然后,将每个树个体分别代入式(3)计算f1,f2,f3三个目标函数的值,根据优化排序方法对所有个体进行排序,排序序号即为每个个体的适应度值;适应度值越小,其对应的个体是最优解的可能性越高。
在步骤(3)中,交配池的生成方法是在原有的染色体个体中采用比赛竞争方式进行选择,将两两个体进行竞争对比,采用优化排序方法对两个体进行排序,较优的个体放入交配池中。交配池中个体的数目是原有种群中个体数目的一半;交叉操作是在成对的树个体之间进行,分别在两个树个体中随意选择某一分支树进行交换;变异操作是对于选定的一个树个体随意选择一个分支树进行替换,重新使用初始树的生成方式生成新的用于替换的分支树;在通过交叉和变异进化获得子代后,为了在每次迭代过程中能尽量保留染色体中的有效基因,还将采用基于竞争决策的精英培养机制,将母代和其对应的子代综合评价;即:对于进行交叉操作的每一对个体而言,进行过交叉操作之后有两个母代和对应的两个子代,将这四个个体采用优化排序方法排序,排序前两位的个体被认为具有更多精英基因,进入下一次迭代的种群;对于进行变异操作的每一个个体而言,进行过变异操作之后有一个母代和对应的一个子代,将这两个个体采用优化排序方法排序,排序靠前的那一个个体被认为具有更多精英基因,进入下一次迭代的种群。
初始树的生成方法是:每个初始树的一半采用最大深度的满树,其满树的叶子节点随机选择输入变量;每个初始树的另一半不采用满树,其深度是随机生成且不超过最大深度,其节点从内部节点集合和叶子节点集合中随机选择。
在步骤(3)的进化操作和选择较优个体操作之间,需要进行一个检验流程,确保其内部节点都是数学运算符,叶子节点都是输入变量。
在步骤(1)中,初始树需要进行一个检验流程,确保其内部节点都是数学运算符,叶子节点都是输入变量。
在步骤(1)中,还设置了初始种群中染色体个体的数目为P0、最大迭代次数G、收敛终止条件、模型误差降低的比率阀值errthreshlod、交叉概率和变异概率。
基于多目标遗传规划的非线性系统辨识方法,在初期随机设定多个非线性系统的结构和参数,在搜索空间中通过多次迭代的方式,选择符合多目标优化函数的结构和参数,迭代中运用优化排序方法选择同时满足三个目标函数优化的可行解,每一次迭代后解对应的排序更靠前,即目标函数结果越优化,最终获得最优的非线性系统结构和其对应的各项参数。
本发明具有如下有益效果:
(1)该方法可以在没有关于非线性系统结构的任何已知信息的情况进行求解,适用性更加广泛。
(2)由于基于遗传规划的方法对非线性系统辨识不需要采用传统的解析算法中矩阵求逆的计算,而是采用多样性和收敛性能并重的迭代方法。因此该方法具有计算复杂度低的优点。
(3)该方法采用系统参数和结构同步搜索的方式,并在每次迭代中对冗余结构及时处理,这样不容易陷入模型误差小而结构冗余的局部最优解。
(4)现实中的很多非线性系统辨识都存在噪声因素或是模糊数据的问题,该方法采用对可行解空间的全局搜索,比传统方法采用的确定性方向搜索更具有容错性和鲁棒性。因此,该方法可以提高在噪声条件下的非线性系统辨识能力。
附图说明
图1为本发明的基于多目标遗传规划的非线性系统辨识方法的流程图;
图2为三种方法的多目标优化收敛曲线图;
图3为三种方法的模型误差优化收敛曲线图;
图4为三种方法的系统结构优化收敛曲线图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明。
1数学描述
非线性系统可以用如下数学模型表示:
y=g(c,x).式(1)
其中y=[y(1) y(2) ... y(m)]T表示非线性系统的输出数据,m表示输出数据的观测长度,y(1)表示第1个时间长度所观测的输出值,以此类推,g表示非线性系统的结构,c表示非线性系统的参数矢量,x=(x1,x2,...,xn)表示非线性系统的输入数据,n表示非线性系统的原始输入变量集合中变量的个数。在没有任何先验信息的情况下,非线性系统的结构和参数都是待求的。而且,丰富的输入变量不一定每一个都和输出变量有关系,在系统辨识过程中要考虑选择那些对非线性系统有意义的输入变量,所以,系统的输入变量个数也是待求的。因此,该辨识方法可以求解以下三种变量:(1)非线性系统的参数c*;(2)非线性系统的结构g*;(3)非线性系统中有意义的输入变量集合相应地,非线性系统辨识问题转化为求解三个优化目标函数的数学模型:输出量均方误差的最小化(MSE)、选中的输入变量数量的最小化、以及系统结构复杂度的最小化。数学表达式如下:
式(2)
式(3)
c*为非线性系统的参数的最优解,g*为非线性系统的结构的最优解,x*为非线性系统输入变量集合的最优解;m(g)表示系统模型中因式项的总数,mnonlinear(g)表示系统模型中非线性因式项的个数。l(x)为选中的输入变量数量,取值为1到n之间的正整数。
其中,系统的结构复杂度是通过计算模型中因式项的个数和非线性因式项的比重之和,m(g)表示系统模型中因式项的总数,mnonlinear(g)表示系统模型中非线性因式项的个数。
该发明采用遗传规划的框架求解该多目标优化模型,在初期随机设定多个非线性系统的结构和参数,在搜索空间中通过多次迭代的方式,选择符合多目标优化函数的结构和参数,迭代中运用优化排序方法选择同时满足三个目标函数优化的可行解,每一次迭代后解对应的排序更靠前,即目标函数结果更优化,最终获得最优的非线性系统结构和其对应的各项参数。
2求解方法
基于遗传规划的方法求解该多目标优化模型的过程由初始化、评价优化个体和基于进化理论的迭代三个部分构成。其中,评价优化个体的部分需要对模型中的三个目标进行综合评价,依据一定的排序准则设置个体的适应度值。本发明就是在这个部分提出创新,提出一种新的选择优化个体的评价方案。该方案不同于传统的多目标优化方法需要获得多个Pareto解,而是利用三个目标函数直接的内部特征将决策过程融入在优化过程中,其评价得到的最优解比Pareto解集更精简。
定义u和v为优化搜索空间中的任意两个个体所对应的目标值,每个目标值都是由三个分量构成的矢量,即:u=(u1,u2,u3),v=(v1,v2,v3)。这三个分量分别是个体对应的三个目标函数(f1,f2,f3)计算得到的值。
定义任意两个个体所对应的目标值之间在第i个分量上的相对距离Δdi(u,v)如下:
定义任意两个个体所对应的目标值之间的比较距离如下:
定义选择优化个体的排序准则如下:
(1)如果duv>0且dvu<0,那么u的排序在v的排序之后,也就是说,v要优于u。
(2)如果duv<0且dvu>0,那么u的排序在v的排序之前,也就是说,u要优于v。
(3)如果duv<0且dvu<0,duv<dvu,那么u的排序在v的排序之前,也就是说,u要优于v。
(4)如果duv=0且dvu=0,那么u的排序和v的排序一样。
在新的选择优化个体的方案中,根据以上排序准则给所有个体进行排序,其序号即为该个体的适应度值,并选择排序最前面的目标值对应的个体进行下一次的迭代。
3技术方案
一种基于多目标遗传规划的非线性系统辨识方法,包括:
(1)初始化染色体个体,包括个体的结构和参数的设置方式以及搜索范围
(a)染色体个体的结构分量g采用树的形式表示,每一个内部节点为数学运算符,每一个叶子节点为系统表达式中的输入变量。设置的内部节点集合包括所有可能的数学运算符,叶子节点集合包括所有可能的输入变量(x1,x2,...,xn).
(b)染色体个体的参数分量c采用实数表示,其矢量的长度由结构分量中因式项的个数决定,所以其初始化在结构分量g的初始化之后,由后者的初始树决定。
(c)染色体个体的初始树采用斜坡一半的编码方式。在树结构的初始化中,设置树结构的最大深度Deptmax。每个初始树的一半采用最大深度的满树,其满树的叶子节点随机选择输入变量;每个初始树的另一半深度是随机可变的,不超过最大深度,其节点也是从两个初始集合中随机选择。不过,为了保证所有的树结构都有意义,所有的初始树都需要通过一个检验流程,确保其内部节点都是数学运算符,叶子节点都是输入变量。如果某个内部节点是输入变量,那么该节点下面的所有子树全部删除。
(2)初始迭代时计算并评价每个染色体个体的多个目标函数
根据(1)产生P0个染色体个体形成了初始种群,根据每个染色体个体的树结构和参数值带入式(3)中分别计算f1,f2,f3三个目标函数的值。
将每个个体计算得到的目标值进行对比,根据2求解方法中提出的排序准则对每个个体进行排序,目标值的排序越靠前,其对应的个体是最优解的可能性越高。这样,每个个体对应一个排序序号,这个序号即代表个体的适应度。
(3)染色体个体的迭代步骤
假设当前迭代次数为k(初始迭代次数为0),本次迭代的种群中包含Pk个染色体个体,这些染色体个体将通过进化迭代操作生成新的染色体个体。具体来说,进化迭代操作包括选择,复制,交叉和变异几种操作。
首先,对Pk个染色体个体进行选择操作组成染色体交配池,用于随后的复制,交叉,变异操作。设定交配池中染色体个体的数目为Pk/2。在原有的染色体个体中采用比赛竞争方式进行选择,将两两个体进行竞争对比,采用2求解方法中选择优化个体的方案对两个体进行排序,较优的个体放入交配池中。
然后,为了使迭代过程具有多样性,将交配池中的所有染色体个体分为三部分,分别用于复制,交叉和变异三种进化操作。先采用复制操作,采用2求解方法计算每个个体的适应度,将适应度值较小的较优个体直接复制进入下一次迭代的种群,被选的较优个体的数量根据复制概率计算;剩下的个体进行交叉和变异的进化操作,根据交叉概率和变异概率分别计算进入交叉操作和变异操作的个体数量。交叉操作是在成对的树个体之间进行,分别在两个树个体中随意选择某一分支树进行交换。变异操作是对于选定的一个树个体随意选择一个分支树进行替换,重新使用初始树的生成方式生成新的用于替换的分支树。通常,复制概率为0到0.1之间任意实数,交叉概率为0到0.7之间的任意实数,变异概率为0到0.3之间的任意实数。
在通过交叉和变异进化获得子代后,为了在每次迭代过程中能尽量保留染色体中的有效基因,还将采用基于竞争决策的精英培养机制,将母代和其对应的子代综合评价,评价的方案仍然采用2求解方法。具体的操作方法是:对于进行交叉操作的每一对个体而言,进行过交叉操作之后有两个母代和对应的两个子代,将这四个个体采用2求解方法排序,排序前两位的个体被认为具有更多精英基因,进入下一次迭代的种群;对于进行变异操作的每一个个体而言,进行过变异操作之后有一个母代和对应的一个子代,将这两个个体采用2求解方法排序,排序靠前的那一个个体被认为具有更多精英基因,进入下一次迭代的种群。
在这些进化操作完成后,某一些树的内部节点可能不是数学运算符。为了修正这些没有意义的树个体,进化操作之后还需要运行树结构的检验过程。
(4)迭代后的染色体个体的多目标评价
在对每一次迭代后的染色体个体进行评价之前,先采用正交最小二乘方法(OLS)对含有冗余分支树的个体进行处理。其原理是:通过一个评价函数计算一个树个体中的所有分支树对降低模型误差的贡献,如果某个分支树的存在对降低模型误差的效果很小,那么这个分支树就被认为是冗余的。因此,这些冗余分支树可以在对染色体个体评价之前先剔除,这样对模型精确度的影响很小,但可以大大降低模型复杂度,既可以降低整个方法的计算复杂度,也可以进一步提高树个体的优化性能。
按照树个体的所有因式项由加号连接,假设某个树个体由s个分支树构成,这些分支树所对应的因式设为z1,z2,z3,......,zs,由此获得的输出矢量可表示为
其中,ci表示第i个分支树对应的参数。虽然分支树中存在非线性结构,不过这些分支树之间是线性关系,可以采用最小二乘方(LS)方法求解c,如下
c=(zTz)-1zTy
对矢量Z=[z1,z2,...,zs]进行QR分解,表示为Z=Q*R,其中Q为正交矩阵(矩阵中的元素为qi),R为上三角矩阵。定义一个辅助参数矩阵p,矩阵中的元素为pi,其表达式为
p=D-1QTy
其中,D=QTQ为正对角矩阵。那么,一个分支树zi对模型误差降低的比率可以按照以下方式计算
因此,对每一个分支树zi计算erri,当某分支树的该比率低于某个阀值errthreshold的时候,该分支树被剔除;反之,保留该分支树。
在完成剔除冗余分支树之后,通过最小二乘法重新计算每个分支树的参数c。然后,将每个树个体分别代入式(3)计算f1,f2,f3三个目标函数的值,根据2求解方法对所有个体进行排序,排序序号即为每个个体的适应度值。适应度值越小,其对应的个体是最优解的可能性越高。
4具体实施例
一种基于多目标遗传规划的非线性系统辨识方法,包括:
(1)初始化参数:
设置用于生成树结构的内部节点集合和叶子节点集合,初始树的最大深度Deptmax,以及初始种群中染色体个体的数目为P0,最大迭代次数G,收敛终止条件,模型误差降低的比率阀值errthreshold,交叉概率,变异概率。
(2)评价个体的适应度:
采用2求解方法中的方法对种群中的每个树个体进行多目标函数评价,计算适应度值。
(3)选择迭代的个体
采用竞争选择方法生成交配池,然后给交配池中的个体分配三种不同的进化操作:复制,交叉和变异。分配的原则按照初始化中定义的交叉概率和变异概率而定。
(4)个体迭代:
对每个个体实施相应的进化操作,生成子个体,采用2求解方法计算适应度。随后,综合母个体和子个体生成中间代,对中间代中的个体再排序,获得最终的子代个体进入下一代。
(5)迭代后采用OLS剔除树个体中的冗余分支树,再次更新种群中的树个体,再评价个体的适应度。根据计算得到的种群适应度值,再次执行步骤(3-4),直到满足收敛条件。
该方法的流程框图如图1所示。
5仿真实验
本发明的效果可通过下面的仿真实例进一步说明。
该仿真实验的内容是对2003年Bam地震震后数据进行数据挖掘。该数据包含106个时间片中76种不同的输入信息。这些输入信息包括重建工程进展的数据,例如:震后待建的房屋数,震后待修缮的房屋数,震后已修缮而未投入使用的房屋数,震后已修缮并投入使用的房屋数等;还包括重建过程中可用的人员,物资和资金等资源数据,例如:工程师数目,装载机数目,已获得贷款数目等。本发明设定这76种数据信息为x=(x1,x2,...,x76),重建工程进展的数据为y,采用辨识方法求解这些数据之间存在的非线性关系。
初始化中参数设定如下:生成树结构的内部节点集合{+,*},叶子节点集合(x1,x2,...,x76),初始树的最大深度Deptmax=5,染色体个体的数目为P0=200,最大迭代次数G=100,交叉概率0.7,变异概率0.3,冗余分支树对模型误差降低的比率阈值errthreshold0.01,收敛终止条件为输出量的均方误差小于10-5或连续三次迭代的最优解不变或迭代次数达到最大迭代次数。
本发明的结果与传统的单目标遗传规划、NSGAII多目标遗传规划在收敛性能和精确度方面进行了对比,其仿真结果如图2-4。在对比图2-4中,图2选取多个目标之和为评价基准,可以看出本发明的方法可以同时兼顾非线性系统的参数优化和结构优化,而其他方法容易陷入局域最优而难以达到全局的最优。而且,本发明方法的收敛速度也表现优秀。进一步观察图3和图4,分别展示了收敛过程中模型误差和系统结构两方面的优化性能,由此可以看出:相比于本发明的方法,其他的方法在获得模型误差的最优化的同时容易造成系统结构的冗余和复杂,特别是对于有噪声干扰的情况下容易造成模型的过度拟合问题。因此,本发明的方法相对于现有的方法可以提高在噪声干扰条件下非线性系统的辨识能力。
上述实施例不以任何形式限制本发明,凡采用等同替换或等效变换的方式所获得的技术方案,均落在本发明的保护范围。

Claims (10)

1.一种基于多目标遗传规划的非线性系统辨识方法,包括如下步骤:(1)初始化:采用树表示染色体个体的结构分量g,定义用于生成初始树结构的内部节点集合和叶子节点集合,设置树结构的最大深度Deptmax;其中染色体个体的参数分量c的矢量长度由结构分量g中因式项的个数决定;
(2)多目标评价:P0个染色体个体初始树构成初始种群,根据每个染色体个体的树结构和参数值计算f1,f2,f3三个目标函数的值,f1,f2,f3分别为输出量均方误差的最小化、选中的输入变量数量的最小化、以及系统结构复杂度的最小化;将每个染色体个体计算得到的目标函数值进行对比,根据优化排序方法对每个个体进行排序,得出每个个体的适应度;
(3)迭代步骤:初始迭代次数为0,迭代次数逐渐累加,假设当前迭代次数为k,本次迭代的种群中包含Pk个染色体,首先判断迭代收敛终止的条件是否满足,即迭代次数是否达到最大迭代数、或是输出量的均方误差是否小于指定阀值、或是三次以上迭代获得的最优解是否不变,若满足则结束,若不满足,则通过优化排序方法在Pk个染色体中选择迭代的个体生成染色体交配池,将交配池中的染色体个体分成三部分,分别用于复制、交叉和变异的进化操作;在复制操作中,利用优化排序方法获得的个体适应度进行判断,将适应度值较小的较优个体直接复制进入下一次迭代的种群;剩下的个体进行交叉和变异的进化操作,先通过进化操作获得子代,再采用基于竞争决策的精英培养机制,将母代和其对应的子代综合评价,从中选择较优的个体进入下一次迭代的种群;
(4)迭代后的染色体个体的多目标评价:采用正交最小二乘方法OLS对含有冗余分支树的个体进行剔除处理,根据优化排序方法得出新的种群中每个个体的适应度值;再次执行步骤(3)。
2.根据权利要求1所述的一种基于多目标遗传规划的非线性系统辨识方法,其特征在于,所述的优化排序方法具体如下:定义u和v为优化搜索空间中的任意两个个体所对应的目标值,每个目标值都是由三个分量构成的矢量,即:u=(u1,u2,u3),=(v1,v2,v3);这三个分量分别是个体对应的三个目标函数(f1,f2,f3)计算得到的值;
定义任意两个个体所对应的目标值之间在第i个分量上的相对距离Δdi(u,v)如下:
定义任意两个个体所对应的目标值之间的比较距离如下:定义选择优化个体的排序准则如下:
(1)如果duv>0且dvu<0,那么u的排序在v的排序之后,也就是说,v要优于u;
(2)如果duv<0且dvu>0,那么u的排序在v的排序之前,也就是说,u要优于v;
(3)如果duv<0且dvu<0,duv<dvu,那么u的排序在v的排序之前,也就是说,u要优于v;
(4)如果duv=0且dvu=0,那么u的排序和v的排序一样;
在选择优化个体时,根据以上排序准则给所有个体进行排序,其序号即为该个体的适应度值,排序越靠前,序号越小,即适应度值越小,其对应的个体是最优解的可能性越高。
3.根据权利要求1或2所述的一种基于多目标遗传规划的非线性系统辨识方法,其特征在于,多目标评价步骤中的f1,f2,f3三个目标函数的计算公式为:
c*为非线性系统的参数的最优解,g*为非线性系统的结构的最优解,x*为非线性系统输入变量集合的最优解;为非线性系统结构的集合;g表示非线性系统的结构,c表示非线性系统的参数矢量,x=(x1,x2,…,xn)表示非线性系统的输入数据,其中n表示非线性系统的原始输入变量集合中变量的数目;y=[y(1) y(2) … y(m)]T表示非线性系统的输出数据,y(1)表示第1个时间长度所观测的输出值,m表示输出数据的观测长度,以此类推;m(g)表示系统模型中因式项的总数,mnonlinear(g)表示系统模型中非线性因式项的个数。
4.根据权利要求3所述的一种基于多目标遗传规划的非线性系统辨识方法,其特征在于,在步骤(4)中对含有冗余分支树的个体进行剔除处理时,按照树个体的所有因式项由加号连接,假设某个树个体由s个分支树构成,这些分支树所对应的因式设为z1,z2,z3,……,zs,由此获得的输出矢量可表示为
其中,ci表示第i个分支树对应的参数;采用最小二乘方LS方法求解c,如下c=(zTz)- 1zTy
对矢量Z=[z1,z2,…,zs]进行QR分解,表示为z=Q*R,其中Q为正交矩阵,矩阵中的元素为qi,R为上三角矩阵;定义一个辅助参数矩阵p,矩阵中的元素为pi,其表达式为p=D-1QTy
其中,D=QTQ为正对角矩阵;一个分支树zi对模型误差降低的比率可以按照以下方式计算
err i = p i 2 q i T q i y T y
对每一个分支树zi计算erri,当某分支树的该比率低于某个阀值errthreshold的时候,该分支树被剔除;反之,保留该分支树;
在完成剔除冗余分支树之后,通过最小二乘法重新计算每个分支树的参数c;然后,将每个树个体分别代入式(3)计算f1,f2,f3三个目标函数的值,根据优化排序方法对所有个体进行排序,排序序号即为每个个体的适应度值;适应度值越小,其对应的个体是最优解的可能性越高。
5.根据权利要求1或2所述的一种基于多目标遗传规划的非线性系统辨识方法,其特征在于,在步骤(3)中,交配池的生成方法是在原有的染色体个体中采用比赛竞争方式进行选择,将两两个体进行竞争对比,采用优化排序方法对两个体进行排序,较优的个体放入交配池中,交配池中个体的数目是原有种群中个体数目的一半;交叉操作是在成对的树个体之间进行,分别在两个树个体中随意选择某一分支树进行交换;变异操作是对于选定的一个树个体随意选择一个分支树进行替换,重新使用初始树的生成方式生成新的用于替换的分支树;在通过交叉和变异进化获得子代后,为了在每次迭代过程中能尽量保留染色体中的有效基因,还将采用基于竞争决策的精英培养机制,将母代和其对应的子代综合评价;即:对于进行交叉操作的每一对个体而言,进行过交叉操作之后有两个母代和对应的两个子代,将这四个个体采用优化排序方法排序,排序前两位的个体被认为具有更多精英基因,进入下一次迭代的种群;对于进行变异操作的每一个个体而言,进行过变异操作之后有一个母代和对应的一个子代,将这两个个体采用优化排序方法排序,排序靠前的那一个个体被认为具有更多精英基因,进入下一次迭代的种群。
6.根据权利要求1所述的一种基于多目标遗传规划的非线性系统辨识方法,其特征在于,在步骤(1)中,初始树的生成方法为:每个初始树的一半采用最大深度的满树,其满树的叶子节点随机选择输入变量;每个初始树的另一半不采用满树,其深度是随机生成且不超过最大深度,其节点从内部节点集合和叶子节点集合中随机选择。
7.根据权利要求5所述的一种基于多目标遗传规划的非线性系统辨识方法,其特征在于,在步骤(3)的进化操作和选择较优个体操作之间,需要进行一个检验流程,确保其内部节点都是数学运算符,叶子节点都是输入变量。
8.根据权利要求6所述的一种基于多目标遗传规划的非线性系统辨识方法,其特征在于,在步骤(1)中,初始树需要进行一个检验流程,确保其内部节点都是数学运算符,叶子节点都是输入变量。
9.根据权利要求1所述的一种基于多目标遗传规划的非线性系统辨识方法,其特征在于,在步骤(1)中,还设置了初始种群中染色体个体的数目为P0、最大迭代次数G、收敛终止条件、模型误差降低的比率阀值errthreshold、交叉概率和变异概率。
10.根据权利要求1、2、6或9所述的一种基于多目标遗传规划的非线性系统辨识方法,其特征在于,在初期随机设定多个非线性系统的结构和参数,在搜索空间中通过多次迭代的方式,选择符合多目标优化函数的结构和参数,迭代中运用优化排序方法选择同时满足三个目标函数优化的可行解,每一次迭代后解对应的排序更靠前,即目标函数结果更优化,最终获得最优的非线性系统结构和其对应的各项参数。
CN201510082381.7A 2015-02-15 2015-02-15 一种基于多目标遗传规划的非线性系统辨识方法 Expired - Fee Related CN104616062B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510082381.7A CN104616062B (zh) 2015-02-15 2015-02-15 一种基于多目标遗传规划的非线性系统辨识方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510082381.7A CN104616062B (zh) 2015-02-15 2015-02-15 一种基于多目标遗传规划的非线性系统辨识方法

Publications (2)

Publication Number Publication Date
CN104616062A CN104616062A (zh) 2015-05-13
CN104616062B true CN104616062B (zh) 2017-03-29

Family

ID=53150498

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510082381.7A Expired - Fee Related CN104616062B (zh) 2015-02-15 2015-02-15 一种基于多目标遗传规划的非线性系统辨识方法

Country Status (1)

Country Link
CN (1) CN104616062B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105117326A (zh) * 2015-07-01 2015-12-02 湖州师范学院 一种基于组合混沌序列的测试用例集生成方法
CN106406082B (zh) * 2015-07-27 2021-02-12 华为技术有限公司 一种系统控制方法、装置,控制器及控制系统
CN107958304B (zh) * 2017-11-20 2021-07-16 上海交通大学 一种兼顾性能改善与预算效用的路面维护与翻新时序安排方法
CN109446657B (zh) * 2018-10-30 2022-11-25 重庆大学 电动车动态无线供电导轨系统及其参数设计方法
CN109948828B (zh) * 2019-01-23 2021-06-11 北京航空航天大学 工序排序优化方法及装置
CN110610264B (zh) * 2019-09-05 2022-10-14 大连理工大学 一种针对不确定性情景下供水管网调控的单目标优化方法
CN111679651B (zh) * 2020-06-08 2021-05-25 中国人民解放军火箭军工程大学 用于故障引起的变结构变参数系统的辨识方法及系统
CN112198434B (zh) * 2020-09-29 2023-05-19 蜂巢能源科技有限公司 电池容量衰减模型参数的辨识方法、系统、设备、装置及介质
WO2022205181A1 (zh) * 2021-03-31 2022-10-06 华为数字能源技术有限公司 功率半导体模组散热系统的配置方法及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101707000A (zh) * 2009-10-26 2010-05-12 北京交通大学 城市道路交通多目标优化控制方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101707000A (zh) * 2009-10-26 2010-05-12 北京交通大学 城市道路交通多目标优化控制方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《基于多目标遗传规划的软测量建模方法》;吴燕玲等;《传感技术学报》;20070930;第20卷(第9期);第2029-2034页 *
《改进遗传规划算法在系统辨识中的应用》;商秀芹等;《东南大学学报》;20090930;第39卷;第22-26页 *

Also Published As

Publication number Publication date
CN104616062A (zh) 2015-05-13

Similar Documents

Publication Publication Date Title
CN104616062B (zh) 一种基于多目标遗传规划的非线性系统辨识方法
Abdel-Basset et al. A novel whale optimization algorithm integrated with Nelder–Mead simplex for multi-objective optimization problems
Li et al. Rules-based heuristic approach for the U-shaped assembly line balancing problem
CN106779372A (zh) 基于改进免疫禁忌算法的农机调度方法
Pholdee et al. Hybridisation of real-code population-based incremental learning and differential evolution for multiobjective design of trusses
CN108334949A (zh) 一种优化深度卷积神经网络结构的快速进化方法
CN104914835A (zh) 一种柔性作业车间调度多目标的方法
Chang et al. Learning to simulate and design for structural engineering
CN101617328A (zh) 在问题解决环境中用于超启发式算法的自动配置的方法和装置
Zhang et al. An enhanced genetic algorithm for the distributed assembly permutation flowshop scheduling problem
CN105203097A (zh) 一种适用于灾后环境的多机器人多目标点救援路径规划方法
Liu et al. Versatile black-box optimization
CN103440377B (zh) 基于改进并行de算法的飞行器气动外形优化设计方法
CN113094988A (zh) 一种基于数据驱动的浆液循环泵运行优化方法及系统
CN105512755A (zh) 一种基于分解的多目标分布估计优化方法
CN104463328A (zh) 求解旅行商问题的顺序交叉多子代遗传算法
Sahoo et al. An enhanced moth flame optimization with mutualism scheme for function optimization
CN104732067A (zh) 一种面向流程对象的工业过程建模预测方法
CN101853202B (zh) 一种基于遗传算法和带权匹配算法的测试案例自动生成方法
Videau et al. Multi-objective genetic programming for explainable reinforcement learning
CN109074348A (zh) 用于对输入数据集进行迭代聚类的设备和迭代方法
Illetskova et al. Improving performance of CDCL SAT solvers by automated design of variable selection heuristics
Liu et al. A quantum computing based numerical method for solving mixed-integer optimal control problems
CN114004065A (zh) 基于智能算法和环境约束下的变电站工程多目标优化方法
Serdyukov et al. Using genetic algorithm for generating optimal data sets to automatic testing the program code

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170329

Termination date: 20200215