CN115543556A - 一种基于多任务遗传编程算法的自适应符号回归方法 - Google Patents

一种基于多任务遗传编程算法的自适应符号回归方法 Download PDF

Info

Publication number
CN115543556A
CN115543556A CN202211061344.4A CN202211061344A CN115543556A CN 115543556 A CN115543556 A CN 115543556A CN 202211061344 A CN202211061344 A CN 202211061344A CN 115543556 A CN115543556 A CN 115543556A
Authority
CN
China
Prior art keywords
population
individuals
task
adaptive
individual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211061344.4A
Other languages
English (en)
Inventor
钟竞辉
缪志斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202211061344.4A priority Critical patent/CN115543556A/zh
Publication of CN115543556A publication Critical patent/CN115543556A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于多任务遗传编程算法的自适应符号回归方法,该方法包括以下步骤:首先构建一种可伸缩的基因表达编码方式用于对多个不同问题进行统一编码,根据该编码方式初始化种群个体,并在所有任务上进行评估;之后,根据交叉参数选择对种群进行选型交叉操作或者进行引导变异操作,这个过程中通过对交叉参数采取自适应控制策略,调整进化行为以提高搜索效率;接下来执行连接选择操作选择出进入下一代个体,通过构建自适应的计算资源重分配机制使得表现相对落后的任务可以得到更多计算资源。本发明通过在进化过程中自适应调节交叉变异操作,并对不同问题所占据计算资源进行自适应重分配,从而同时高效处理多个复杂符号回归问题。

Description

一种基于多任务遗传编程算法的自适应符号回归方法
技术领域
本发明涉及智能计算和多任务优化技术领域,尤其涉及一种基于多任务遗传编程算法的自适应符号回归方法。
背景技术
符号回归同时搜索给定问题的函数和参数集的最优形式,当模型结构或者数据分布的先验知识很少时,它是一种强大的回归技术。作为一个监督学习问题,符号回归旨在找到一个符号形式的数学公式来建立给定的输入和输出变量之间的关系。它的函数模型结构和相关参数都是在学习进化过程中自动搜索得到的,具有更广泛的可拓展性,便于挖掘出数据集中不易被人所发现的潜在规律。
遗传编程算法是目前解决符号回归问题的主流方法。然而,传统的遗传编程算法只能在一次独立运行中解决一个任务,这在需要同时解决多个任务的情况下是效率低下的。在这种情况下,多因子优化作为一种新的进化多任务处理范式被提出。它试图在一个独立的运行中对多个任务同时进行搜索。在实际应用场景中,问题很少孤立存在,而且问题往往包含有用的信息,如果适当利用,当遇到另一个相关问题时,可以导致增强的问题解决过程。例如,如果两个问题碰巧有一个共同的全局最优,解决一个问题的同时将得以解决另一个问题。一个实际工业应用中的例子便是云服务。随着云计算的快速发展,当下的云服务面临着同时接收多个用户的多个优化任务的问题,这些任务既可以具有相似的属性,也可以属于完全不同的领域。因此,云计算并发处理多个客户端的组合要求的需求也是促使多任务优化快速兴起的主要推力。
多因子优化是一种将多任务优化框架运用于进化计算领域的针对单一种群群体的进化多任务处理的优化范式,主要目的是在不同优化任务对应的多个并发搜索空间上同时执行进化搜索。由于MFO对多个任务只保留一个种群,不同任务的有用信息可以通过交叉重组过程在个体之间隐形转移。
目前对于同时求解多个符号回归问题的实践研究还处于初步阶段,使用多任务范式搜索多个问题还停留在初步应用阶段,对于具体的操作步骤的按研究还不深入,在不同任务个体间进行的交叉重组操作缺乏有效的引导。在使用基于多任务优化范式的遗传编程算法求解符号回归问题时,缺乏对并发搜索过程中的不同任务间的计算资源分配的处理。在相对固定的资源配给下,如何平衡分配给各个任务的计算资源从而使得所有任务都尽可能的达到更好的结果一直是一个需要着重考虑的课题。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,提供一种基于多任务遗传编程算法的自适应符号回归方法。
本发明的目的可以通过采取如下技术方案达到:
一种基于多任务遗传编程算法的自适应符号回归方法,包括以下步骤:
S1、构建可伸缩的基因表达编码方式形成统一的搜索空间,用于对多个不同的符号回归问题进行统一编码;根据该编码方式初始化种群中所有个体;通过将统一的可伸缩的基因表达编码表示转换为特定任务的染色体编码方式的解码操作,对每个个体在所有任务上都进行多因子评估;
S2、根据交叉参数IR选择对种群进行选型交叉操作或者进行引导变异操作,逐一对种群中每个个体进行以上操作,产生新一代的后代种群;
S3、将新生成的后代种群与父代种群进行混合连接操作,形成一个临时种群,并在临时种群中重新进行多因子评估和计算标量适应度,其中,混合连接操作包括连接操作和选择操作;根据标量适应度在父代个体和子代个体之间进行一对一选择,选择出进入下一代种群的个体;构建自适应的计算资源重分配机制使得表现相对落后的任务所属的种群个体更多的进入下一代种群中;
S4、统计下一代种群中每个任务的最佳个体的操作来源,对交叉参数IR采取自适应控制策略完成调整进化行为;
S5、判定所有任务所规定的精度条件或者适应度评估次数是否达到所规定的最大次数,若满足终止进化,输出最后种群中每个任务所对应的最佳个体的解决方案;否则继续返回步骤S2至步骤S5的进化流程进行种群循环进化搜索。
进一步地,所述步骤S1中可伸缩的基因表达编码方式如下:(1)采用固定长度的字符串作为个体染色体;(2)包含一个主要函数和多个自动定义函数ADF;(3)统一使用整数来表示函数和终端,使用单个整数表示不同任务的各种符号。这样,不同任务可能具有的独特函数和终端符号可以在同一编码方式下进行编码,形成统一的公共搜索空间,方便不同任务间进行信息迁移操作。
进一步地,所述步骤S1中将统一的染色体编码表示转换为特定任务的染色体的解码过程具体如下:
S11、通过检查统一编码方式的染色体中每个维度上的整数x所属的范围,找出每个维度所代表的相应符号类型;
S12、根据特定任务定义的类型的所属整数范围对整数x进行缩放操作,得到在特定任务定义范围中的整数x’,即:
Figure BDA0003826358870000041
其中,Lx和Ux分别是步骤S11中发现的元素对应类型的数值范围内的最小值和最大值,Nx是对应类型元素中的所用的最大整数,
Figure BDA0003826358870000042
是对a向下取整运算符,返回不大于a的最大整数;上述步骤将整数x被映射到0到Nx-1之间的整数x’,使用缩放后的值x’作为索引,将x映射到特定任务的有意义的符号。将公共搜索空间中的染色体编码结构解码转化为某个具体任务的搜索空间中的染色体编码结构,形成特定于该任务的一个解决方案,便于进行在该任务上的适应度评估。
进一步地,所述步骤S2中选型交叉操作具体如下:
使用单点交叉,通过将随机选择的父代个体Xr1和Xi交叉操作来生成子代个体Ui,其中Xr1表示随机选取的个体,Xi是种群中第i个执行单点交叉的个体;对子代个体Ui进行统一的变异操作,且生成的子代个体Ui的技能因子采用垂直文化传播的方式,以相同的概率随机从父代双亲之一继承。由于两个父代个体可能有各自单独的技能因子,这种交叉操作增强了不同任务中发现的有用遗传信息的相互转移。
进一步地,所述步骤S2中引导变异操作具体如下:
采用差分进化算法中的“DE/current-to-best/1”突变策略,对Xi执行变异操作以产生后代个体Ui,其中Xi是种群中第i个执行引导变异操作的个体,后代个体Ui染色体有n个维度,每个维度上的值ui,j由以下公式计算得到:
Figure BDA0003826358870000043
其中,j表示Ui染色体中第j个维度,ti,j是随机生成的值,CR是0和1范围内的用户定义的突变因子,k是1和n之间的随机整数,ui,j和xi,j分别是Ui和Xi中的第j维变量,rand(0,1)返回0—1之间的随机数,突变概率参数
Figure BDA0003826358870000051
的值通过以下公式计算:
Figure BDA0003826358870000052
其中F是用户定义的缩放因子,xbest,j是当前种群中Xi的技能因子所代表的任务的最佳个体Xbest的染色体中第j维的值,xr2,j和xr3,j分别是在父代种群中随机选取的两个不同个体Xr2和Xr3的染色体中第j维的值,[a]′表示艾弗森(Iverson)括号,如果括号内的条件a为真,则返回1,否则返回0。通过控制该突变参数来确定ui,j被分配一个新的值而不是xi,j的概率。此外,ui,j是根据当前种群中每个函数和终端的出现频率来分配,即更经常出现在种群个体中的元素更有可能被选择并分配给ui,j
进一步地,所述步骤S4中对交叉参数IR采取的自适应控制策略具体如下:
在每一代生成新一代的种群时,通过统计分析当前所有并行任务的最佳个体的来源确定参数IR的自适应更新操作,更新公式如下:
Figure BDA0003826358870000053
其中ρ是衰减因子,在自适应控制策略中,根据每个任务的最佳个体的生成途径来确定对应的更新规则。如果新一代种群的所有最佳个体中,来自于选型交叉操作的个体占比最多,则参数IR的值趋向于1,增加不同个体间的交叉概率,提高不同任务间的有用信息的传递频率。同理,如果大部分的最佳个体来自于引导变异操作的随机变异,则参数IR趋向于0,降低交叉频率的同时提高每个个体在自己的局部范围内的变异搜索频率。如果大部分的最佳个体没有进行更新,参数IR则谨慎地趋向于0.3,保持选型交叉和引导变异操作处于相对均衡的状态。
进一步地,所述步骤S3中连接操作和选择操作过程如下:
新生成的后代种群newpop与父种群pop混合连接在一起,形成一个临时种群temppop,temppop中的个体根据每个个体相应的适应度评估值在每个任务上进行排序,更新每个个体的技能因子和标量适应度;在temppop中采用一对一选择策略进行选择,每个子代个体Ui都与其对应的父代个体Xi进行比较,即
Figure BDA0003826358870000061
其中φ(X)返回个体X的标量适应度值,当存在另一个与Xi完全相同的单独的Xk,且k<i时,Xi被认为是多余的。
进一步地,所述步骤S3中自适应的计算资源重分配机制如下:
S31、判断是否达到进行资源重分配的条件,进化过程中所有并发执行的K个任务中如果已经有K-1个任务已经达到了预设的任务精度阈值,则继续执行接下来的步骤S32至步骤S34,否则正常进行选择操作过程;
S32、通过比较每个任务所属的表现最好个体的该任务的适应度值,从而找出表现最差的任务;
S33、在该表现最差任务所属的个体中选择因子排名前M个个体进行保留,直接进入下一代种群中,如果该任务所属个体的数量m不足M个,则全部保留,其余的则循环复制排名前M-m项个体;
S34、临时种群temppop中剩下的个体继续执行选择操作。
通过上述的步骤,本发明所提出的方法既不会耽误其他任务的搜索,也会在一定程度上对变现较差任务进行计算资源倾斜,使得所有任务都尽可能得到更好的结果。此外,在搜索表现较好的任务精度达到预设标准后将其多余的计算资源分配给其他任务,也提高计算资源的利用率和任务整体的搜索效率。
本发明相对于现有技术具有如下的优点及效果:
1、本发明通过对交叉重组操作中的交叉参数IR采取自适应控制策略,在进化过程中兼顾任务间的知识转移和提高局部区域中的解决方案的搜索质量,降低无关联任务之间发生无效的交叉重组的概率。通过此操作来调整进化行为以提高搜索效率。
2、本发明设计了一种自适应的计算资源重分配机制,用于均衡不同任务,使得表现相对落后的任务可以得到更多的计算资源分配,从而让并发执行的所有任务都尽可能的得到最优解。此外,在搜索表现较好的任务精度达到预设标准后,可以将其多余的计算资源分配给其他任务,提高资源的利用率和任务整体的搜索效率。
3、本发明提供的多任务符号回归方法不仅可以在一次执行中同时搜索多个任务,有效节约了计算开销,而且可以充分利用不同任务之间的关联性阿赫互补信息,相互促进不同任务各自的搜索,加快问题的求解速度。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明中可伸缩的基因表达编码方式的使用演示示例图;
图2是本发明中基于多任务遗传编程算法的自适应符号回归方法流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
假设有K个符号回归任务同时求解,其中第i个任务的函数集和终端集分别是Fi和Ti。这些终端元素与函数元素共同构成解的元素集。遗传编程算法在给定的构建元素集中找到满足训练数据与目标函数的最优公式。
如图2所示,本实施例是基于多任务遗传编程算法的自适应符号回归方法,包括以下步骤:
T1、构建可伸缩的基因表达编码方式并初始化种群。
对多个不同的符号回归问题进行统一编码。在该可伸缩的基因编码表示方案中,采用固定长度的字符串作为个体染色体的编码方式,其包含一个主要函数和多个自动定义函数ADF。此外,由于跨域的不同任务可能具有独特的函数和终端,为了解决这个问题,在可伸缩的基因表达编码方式中,统一使用整数来表示各个函数和终端符号。
为了确保种群中每个染色体都能正确地转换为对应任务的有效的表达式树,头部长度h和尾部长度l受到以下限制:
Figure BDA0003826358870000081
其中,§(f)返回函数f的参数个数,Fk表示第k个函数,max{a}返回集合a中的最大值。
在确定染色体的长度后,之后是用整数来表示每个染色体的中的元素。首先,表示每个染色体中ADF的数目和每个ADF中输入参数的数目分别为Na和Ng。之后,定义了四个整数范围来分别表示这些元素,即函数、终端、ADF和输入参数,它们是[0、A-1]、[A、B-1]、[B、C-1]和[C、D-1]。其中A、B、C和D的值是由以下公式确定:
Figure BDA0003826358870000091
B=A+Na
Figure BDA0003826358870000092
D=C+Ng
其中,|Fi|返回集合Fi中的元素个数,max{a}返回集合a中的最大值。有了这种共同的染色体表示后,就可以将统一的共同染色体转换为特定任务的染色体,之后再进行解码评估。
确定好可伸缩的基因表达编码方式后,进行搜索种群的初始化。此步骤随机生成初始的种群pop,种群大小为N。每个个体都由一个使用该编码表示方法的整数向量来表示,即
X=[x1,x2,…,xn]
其中,n是每个个体染色体向量的长度,xn是可行值范围内的整数。初始化时,在{函数,ADF,终端,输入参数}之中随机选择一个对应位置可行的类型来初始化对应的X维度类型。接下来,xn在所选类型的可行值范围内被设置为一个随机整数。
根据该编码方式初始化种群,并对每个个体在所有问题上都进行多因子评估。本实施例中,将统一的染色体编码表示转换为特定任务的染色体的解码过程具体如下:(1)通过检查统一编码方式的染色体中每个维度上的整数x所属的范围,找出每个维度所代表的相应符号类型;(2)根据特定任务定义的类型的所属整数范围对整数x进行缩放操作,得到在特定任务定义范围中的整数x’,即:
Figure BDA0003826358870000093
其中,Lx和Ux分别是步骤(1)中发现的元素对应类型的数值范围内的最小值和最大值,Nx是对应类型元素中的所用的最大整数,
Figure BDA0003826358870000101
是向下取整运算符,返回不大于a的最大整数;上述步骤将整数x被映射到0到Nx-1之间的整数x’,使用缩放后的值x’作为索引,将x映射到特定任务的有意义的符号。
图1是一个使用可伸缩的基因表达编码方式进行解码的演示例子。在图1中,两个符号回归任务同时求解,它们的函数集、ADFs、终端集和输入参数分别定义为{+、-、*、/}、{G1}、{x1、x2、x3}和{T1、T2},以及{+、-、*、/,sin,cos}、{G1}、{x1、x2}和{T1、T2}。因此,这两个问题的函数、终端、ADFs和输入参数的最大数目分别是6、1、3和2。基于所提出的S-ADF表达表示,因此,我们有A=6,B=7,C=10,D=12。在本例中,染色体的结构被设置为拥有一个ADF,且其主函数和ADF的头部和尾部长度分别设置为(4,5)和(2,3)。假设[1,5,6,2,7,7,9,8,9,0,2,10,11,10]成为S-ADF编码染色体的一个例子。在该例子下,可以根据前九个维度(即[1,5,6,2,7,7,9,8,9])获得主函数的表达式,而ADF则根据剩下维度(即[0,2,10,11,10])来得到。之后,为了将染色体转化为对应符号回归问题的一个解,染色体的每个维度必须根据定义的函数、终端和ADFs的数量映射到一个对于该问题有意义的符号。接下来,首先是识别xi的类型,之后根据在第一阶段得到的相应的类型,将正确的符号分配给xi。比如,对于第一个符号回归问题,第一维的值是1,属于[0,A-1],所以第一维的元素类型是函数。然后,我们通过计算该元素放缩后的值,将正确的函数符号分配给xi。由于(1-0)/(6-0)*3=0,我们将xi设置为第一个函数(+)。这样,我们就可以将染色体翻译成第一个符号回归问题所对应的一个解[+,*,G1,-,x1,x1,x2,x1,x2,+,*,T1,T2,T1],它可以进一步解码为最终表达式。
T2、根据交叉参数IR来选择对种群进行选型交叉操作或者进行引导变异操作。
通过统计当前每个任务的最佳个体的操作来源,来对控制参数IR采取自适应控制策略,从而调整进化行为。这个过程中逐一对每个个体进行该操作,产生新一代的后代种群。
选型交叉操作使用单点交叉,通过将随机选择的父代个体Xr1和Xi交叉操作来生成子代个体Ui,其中Xr1表示随机选取的个体,Xi是种群中第i个执行单点交叉的个体;对子代个体Ui进行统一的变异操作,且生成的子代个体Ui的技能因子采用垂直文化传播的方式,以相同的概率随机从父代双亲之一继承。
另一方面,引导变异操作采用差分进化算法中的“DE/current-to-best/1”突变策略,对Xi执行变异操作以产生后代个体Ui,其中Xi是种群中第i个执行引导变异操作的个体,后代个体Ui染色体有n个维度,每个维度上的值ui,j由以下公式计算得到:
Figure BDA0003826358870000111
其中,j表示Ui染色体中第j个维度,ti,j是随机生成的值,CR是0和1范围内的用户定义的突变因子,k是1和n之间的随机整数,ui,j和xi,j分别是Ui和Xi中的第j维变量,rand(0,1)返回0—1之间的随机数,突变概率参数
Figure BDA0003826358870000112
的值通过以下公式计算:
Figure BDA0003826358870000113
其中F是用户定义的缩放因子,xbest,j是当前种群中Xi的技能因子所代表的任务的最佳个体Xbset的染色体中第j维的值,xr2,j和xr3,j分别是在父代种群中随机选取的两个不同个体Xr2和Xr3的染色体中第j维的值,[a]′表示艾弗森(Iverson)括号,如果括号内的条件a为真,则返回1,否则返回0。通过控制该突变条件来确定ui,j被分配一个新的值而不是xi,j的概率。
最后,对交叉参数IR采取的自适应控制策略的作用是用来控制种群是选择选型交配重组方式还是变异方式来生成子代个体。
T3、连接和选择操作选出下一代种群个体。
将新生成的后代种群与父代种群进行混合连接操作,形成一个临时种群,并在临时种群中重新计算各任务对应的因子排名和标量适应度;之后根据标量适应度在父代个体和子代个体之间进行一对一选择,选择出进入下一代种群的个体;这个过程中通过构建自适应的计算资源重分配机制使得表现相对落后的任务所属的种群个体可以更多的进入下一代种群中,获得更多的计算资源分配。
连接操作中,新生成的后代种群newpop与父种群pop混合连接在一起,形成一个临时种群temppop。随后,temppop中的个体根据其相应的因子开销独立地在每个任务上进行排序。之后,更新每个个体的技能因子和标量适应度。
之后是在temppop中采用一对一选择策略进行选择,每个子代个体Ui都与其对应的父代个体Xi进行比较,即
Figure BDA0003826358870000121
其中φ(X)返回个体X的标量适应度值,当存在另一个与Xi完全相同的单独的Xj,且j<i时,Xi被认为是多余的。
最后,自适应的计算资源重分配机制通过平衡分配给各个任务的计算资源从而使得所有任务都尽可能的达到更好的搜索结果,提高算法整体的资源利用率。首先是判断是否达到进行资源重分配的条件。进化过程中,在所有并发执行的K个任务中如果已经有K-1个任务已经达到了预设的任务精度阈值,则继续执行接下来的步骤,否则正常进行搜索过程。接下来的操作主要分为三个步骤。第一步是通过比较每个任务所属的表现最好个体的该任务的适应度值,从而找出表现最差的任务。第二步是在该表现最差任务所属的个体中选择因子排名前M个个体进行保留,直接进入下一代种群中。如果该任务所属个体的数量m不足M个,则全部保留,其余的则循环复制排名前M-m项个体。第三步是在剩下的个体中继续执行选择操作。
T4、对交叉参数IR进行自适应更新操作。
在每一代生成新一代的种群时,通过统计分析当前所有并行任务的最佳个体的来源确定参数IR的自适应更新操作,更新公式如下:
Figure BDA0003826358870000131
其中ρ是衰减因子,在自适应控制策略中,根据每个任务的最佳个体的生成途径来确定对应的更新规则。如果当前这一代的所有最佳个体中,来自于选型交叉操作的选型交配重组的个体占比最多,则交叉参数IR的值趋向于1,增加不同个体间的交叉概率,提高不同任务间的有用信息的传递频率。同理,如果最多的最佳个体来自于引导变异操作的随机变异,则交叉参数IR趋向于0,降低交叉频率的同时提高每个个体在自己的局部范围内的变异搜索。如果所有最佳个体中最多的是没有更新,则交叉参数IR谨慎的趋向于0.3,保持选型交叉和变异操作处于相对均衡的状态。
T5、终止条件判断。
若满足所有任务所规定的精度条件或者适应度评估次数达到所规定的最大次数,则终止进化,输出最后种群中每个任务所对应的最佳个体的解决方案;否则继续返回步骤T2—T6的进化流程进行种群循环搜索。
为了验证和评估本实施例的算法框架的性能,本实施例以5个符号回归基准测试问题数据集进行仿真实验验证。本实施例将同时对这5个符号回归任务进行多任务并发执行,如步骤T1--T5所示。本实施例的具体参数设置为:种群大小都为N=100,染色体结构中主函数的头部长度为h=10;ADF的数量设置为1,且ADF中的头部长度为h′=3,交叉控制参数IR=0.3,衰减因子ρ=0.8,保留个体数目M=45。表1列出了这5个符号回归基准测试问题的表达式,每个问题狙击包含500条数据。
本实施例中采用均方根误差RMSE作为每个个体在所有任务上进行的适应度评估方式。将本发明所提出的多任务方法和已有的单一任务搜索的SLGEP算法进行搜索精度评估,实验结果如表2所示。
从表2的结果可以得出,本发明所提出的方法在仿真测试中搜索精度要好于一般的单任务搜索算法,结果精度明显更高,这说明本发明所提出的方法在提高遗传编程算法对多个符号回归问题的搜索能力上是有效的。
表1. 5个符号回归基准测试函数表达式明细表
Figure BDA0003826358870000141
表2.实施例1中的实验结果RMSE对比明细表
F<sub>1</sub> F<sub>2</sub> F<sub>3</sub> F<sub>4</sub> F<sub>5</sub>
实施例1 0.0427 0.0101 0.312 0.00780 0.01
SLGEP 0.0633 0.0528 0.356 0.0142 0.0107
实施例2
为进一步验证本发明所提出方法的有效性,在实施例2中将不采用对交叉参数IR的自适应控制策略,其余步骤和实施例1中保持一致。本实施例主要包括以下步骤:
P1—P4:参照实施例1中的步骤T1—T4。
P5、终止条件判断。
若满足所有任务所规定的精度条件或者适应度评估次数达到所规定的最大次数,则终止进化,输出最后种群中每个任务所对应的最佳个体的解决方案;否则继续返回步骤P2—P5的进化流程进行种群循环搜索。
本实施例同样以表1中的这5个符号回归基准测试问题数据集进行仿真实验验证。具体的试验参数设置和实施例1保持一致。将本实施例的实验结果和实施例1中的实验结果以及单一任务搜索的SLGEP算法的实验结果进行精度对比,实验结果如表3所示。
表3.实施例2中的实验结果RMSE对比明细表
F<sub>1</sub> F<sub>2</sub> F<sub>3</sub> F<sub>4</sub> F<sub>5</sub>
实施例2 0.0478 0.0277 0.326 0.0105 0.0112
实施例1 0.0427 0.0101 0.312 0.00780 0.01
SLGEP 0.0633 0.0528 0.356 0.0142 0.0107
从表3中可以看出,在不采用对交叉参数IR的自适应控制策略后,实施例2的实验精度有所下降,表现不如实施例1。这说明了本发明所提出的交叉参数自适应控制策略的有效性。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (8)

1.一种基于多任务遗传编程算法的自适应符号回归方法,其特征在于,所述自适应符号回归方法包括以下步骤:
S1、构建可伸缩的基因表达编码方式形成统一的搜索空间,用于对多个不同的符号回归问题进行统一编码;根据该编码方式初始化种群中所有个体;通过将统一的可伸缩的基因表达编码表示转换为特定任务的染色体编码方式的解码操作,对每个个体在所有任务上都进行多因子评估;
S2、根据交叉参数IR选择对种群进行选型交叉操作或者进行引导变异操作,逐一对种群中每个个体进行以上操作,产生新一代的后代种群;
S3、将新生成的后代种群与父代种群进行混合连接操作,形成一个临时种群,并在临时种群中重新进行多因子评估和计算标量适应度,其中,混合连接操作包括连接操作和选择操作;根据标量适应度在父代个体和子代个体之间进行一对一选择,选择出进入下一代种群的个体;构建自适应的计算资源重分配机制使得表现相对落后的任务所属的种群个体更多的进入下一代种群中;
S4、统计下一代种群中每个任务的最佳个体的操作来源,对交叉参数IR采取自适应控制策略完成调整进化行为;
S5、判定所有任务所规定的精度条件或者适应度评估次数是否达到所规定的最大次数,若满足终止进化,输出最后种群中每个任务所对应的最佳个体的解决方案;否则继续返回步骤S2至步骤S5的进化流程进行种群循环进化搜索。
2.根据权利要求1所述的一种基于多任务遗传编程算法的自适应符号回归方法,其特征在于,所述步骤S1中可伸缩的基因表达编码方式如下:(1)采用固定长度的字符串作为个体染色体;(2)包含一个主要函数和多个自动定义函数ADF;(3)统一使用整数来表示函数和终端,使用单个整数表示不同任务的各种符号。
3.根据权利要求2所述的一种基于多任务遗传编程算法的自适应符号回归方法,其特征在于,所述步骤S1中将统一的染色体编码表示转换为特定任务的染色体的解码过程具体如下:
S11、通过检查统一编码方式的染色体中每个维度上的整数x所属的范围,找出每个维度所代表的相应符号类型;
S12、根据特定任务定义的类型的所属整数范围对整数x进行缩放操作,得到在特定任务定义范围中的整数x’,即:
Figure FDA0003826358860000021
其中,Lx和Ux分别是步骤S11中发现的元素对应类型的数值范围内的最小值和最大值,Nx是对应类型元素中的所用的最大整数,
Figure FDA0003826358860000022
是对a向下取整运算符,返回不大于a的最大整数;上述步骤将整数x被映射到0到Nx-1之间的整数x’,使用缩放后的值x’作为索引,将x映射到特定任务的有意义的符号。
4.根据权利要求1所述的一种基于多任务遗传编程算法的自适应符号回归方法,其特征在于,所述步骤S2中选型交叉操作具体如下:
使用单点交叉,通过将随机选择的父代个体Xr1和Xi交叉操作来生成子代个体Ui,其中Xr1表示随机选取的个体,Xi是种群中第i个执行单点交叉的个体;对子代个体Ui进行统一的变异操作,且生成的子代个体Ui的技能因子采用垂直文化传播的方式,以相同的概率随机从父代双亲之一继承。
5.根据权利要求4所述的一种基于多任务遗传编程算法的自适应符号回归方法,其特征在于,所述步骤S2中引导变异操作具体如下:
采用差分进化算法中的“DE/current-to-best/1”突变策略,对Xi执行变异操作以产生后代个体Ui,其中Xi是种群中第i个执行引导变异操作的个体,后代个体Ui染色体有n个维度,每个维度上的值ui,j由以下公式计算得到:
Figure FDA0003826358860000031
其中,j表示Ui染色体中第j个维度,ti,j是随机生成的值,CR是0和1范围内的用户定义的突变因子,k是1和n之间的随机整数,ui,j和xi,j分别是Ui和Xi中的第j维变量,rand(0,1)返回0—1之间的随机数,突变概率参数
Figure FDA0003826358860000034
的值通过以下公式计算:
Figure FDA0003826358860000032
其中F是用户定义的缩放因子,xbset,j是当前种群中Xi的技能因子所代表的任务的最佳个体Xbset的染色体中第j维的值,xr2,j和xr3,j分别是在父代种群中随机选取的两个不同个体Xr2和Xr3的染色体中第j维的值,[a]′表示艾弗森括号,如果括号内的条件a为真,则返回1,否则返回0。
6.根据权利要求1所述的一种基于多任务遗传编程算法的自适应符号回归方法,其特征在于,所述步骤S4中对交叉参数IR采取的自适应控制策略具体如下:
在每一代生成新一代的种群时,通过统计分析当前所有并行任务的最佳个体的来源确定参数IR的自适应更新操作,更新公式如下:
Figure FDA0003826358860000033
其中ρ是衰减因子,在自适应控制策略中,根据每个任务的最佳个体的生成途径来确定对应的更新规则。
7.根据权利要求1所述的一种基于多任务遗传编程算法的自适应符号回归方法,其特征在于,所述步骤S3中连接操作和选择操作过程如下:
新生成的后代种群newpop与父种群pop混合连接在一起,形成一个临时种群temppop,temppop中的个体根据每个个体相应的适应度评估值在每个任务上进行排序,更新每个个体的技能因子和标量适应度;在temppop中采用一对一选择策略进行选择,每个子代个体Ui都与其对应的父代个体Xi进行比较,即
Figure FDA0003826358860000041
其中φ(X)返回个体X的标量适应度值,当存在另一个与Xi完全相同的单独的Xk且k<i时,Xi被认为是多余的。
8.根据权利要求1所述的一种基于多任务遗传编程算法的自适应符号回归方法,其特征在于,所述步骤S3中自适应的计算资源重分配机制如下:
S31、判断是否达到进行资源重分配的条件,进化过程中所有并发执行的K个任务中如果已经有K-1个任务已经达到了预设的任务精度阈值,则继续执行接下来的步骤S32至步骤S34,否则正常进行选择操作过程;
S32、通过比较每个任务所属的表现最好个体的该任务的适应度值,从而找出表现最差的任务;
S33、在该表现最差任务所属的个体中选择因子排名前M个个体进行保留,直接进入下一代种群中,如果该任务所属个体的数量m不足M个,则全部保留,其余的则循环复制排名前M-m项个体;
S34、临时种群temppop中剩下的个体继续执行选择操作。
CN202211061344.4A 2022-09-01 2022-09-01 一种基于多任务遗传编程算法的自适应符号回归方法 Pending CN115543556A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211061344.4A CN115543556A (zh) 2022-09-01 2022-09-01 一种基于多任务遗传编程算法的自适应符号回归方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211061344.4A CN115543556A (zh) 2022-09-01 2022-09-01 一种基于多任务遗传编程算法的自适应符号回归方法

Publications (1)

Publication Number Publication Date
CN115543556A true CN115543556A (zh) 2022-12-30

Family

ID=84726021

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211061344.4A Pending CN115543556A (zh) 2022-09-01 2022-09-01 一种基于多任务遗传编程算法的自适应符号回归方法

Country Status (1)

Country Link
CN (1) CN115543556A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117217150A (zh) * 2023-09-13 2023-12-12 华南理工大学 一种基于遗传算法符号回归的dtco公式建模方法
CN117422114A (zh) * 2023-12-19 2024-01-19 电子科技大学(深圳)高等研究院 Ai加速器的优化方法及ai加速器
CN117539520A (zh) * 2024-01-10 2024-02-09 深圳市东莱尔智能科技有限公司 固件自适应升级方法、系统以及设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117217150A (zh) * 2023-09-13 2023-12-12 华南理工大学 一种基于遗传算法符号回归的dtco公式建模方法
CN117217150B (zh) * 2023-09-13 2024-05-17 华南理工大学 一种基于遗传算法符号回归的dtco公式建模方法
CN117422114A (zh) * 2023-12-19 2024-01-19 电子科技大学(深圳)高等研究院 Ai加速器的优化方法及ai加速器
CN117422114B (zh) * 2023-12-19 2024-04-09 电子科技大学(深圳)高等研究院 Ai加速器的优化方法及ai加速器
CN117539520A (zh) * 2024-01-10 2024-02-09 深圳市东莱尔智能科技有限公司 固件自适应升级方法、系统以及设备
CN117539520B (zh) * 2024-01-10 2024-03-19 深圳市东莱尔智能科技有限公司 固件自适应升级方法、系统以及设备

Similar Documents

Publication Publication Date Title
CN115543556A (zh) 一种基于多任务遗传编程算法的自适应符号回归方法
Eiben et al. Introduction to evolutionary computing
Gao et al. Hierarchical multi-agent optimization for resource allocation in cloud computing
Li et al. Memetic Harris Hawks Optimization: Developments and perspectives on project scheduling and QoS-aware web service composition
Noman et al. Accelerating differential evolution using an adaptive local search
Zhengying et al. Bandwidth-delay-constrained least-cost multicast routing based on heuristic genetic algorithm
CN109840154B (zh) 一种移动云环境下基于任务依赖的计算迁移方法
CN111325356A (zh) 一种基于演化计算的神经网络搜索分布式训练系统及训练方法
CN105869053A (zh) 基于两阶段memetic的社交网络影响最大化方法
CN110008023B (zh) 基于遗传算法的云计算系统预算约束随机任务调度方法
Elsayed et al. Fuzzy rule-based design of evolutionary algorithm for optimization
Choi et al. Advanced Cauchy mutation for differential evolution in numerical optimization
Lissovoi et al. Computational complexity analysis of genetic programming
Feng et al. Neighborhood matters: Influence maximization in social networks with limited access
Wang et al. Automatic hierarchical reinforcement learning for efficient large-scale service composition
US20080154809A1 (en) Use and construction of categorical interactions using a rule gene in a predictive model
Dorronsoro et al. Evolutionary algorithms based on game theory and cellular automata with coalitions
CN114840326B (zh) 资源调度方法、装置、电子设备及存储介质
CN114980216A (zh) 基于移动边缘计算的依赖型任务卸载系统及方法
Rahman et al. An extensive Karnaugh mapping tool for Boolean expression simplification
CN114064235A (zh) 多任务教与学优化方法、系统及设备
Garshasbi et al. High performance scheduling in parallel heterogeneous multiprocessor systems using evolutionary algorithms
CN109102122A (zh) 一种基于nsgaii分组处理大规模带容量约束的方法及系统
Hevia Fajardo Runtime analysis of success-based parameter control mechanisms for evolutionary algorithms on multimodal problems
Panicker et al. Distributed query plan generation using multiobjective genetic algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination