CN115543556A

CN115543556A - 一种基于多任务遗传编程算法的自适应符号回归方法

Info

Publication number: CN115543556A
Application number: CN202211061344.4A
Authority: CN
Inventors: 钟竞辉; 缪志斌
Original assignee: South China University of Technology SCUT
Current assignee: South China University of Technology SCUT
Priority date: 2022-09-01
Filing date: 2022-09-01
Publication date: 2022-12-30

Abstract

本发明公开了一种基于多任务遗传编程算法的自适应符号回归方法，该方法包括以下步骤：首先构建一种可伸缩的基因表达编码方式用于对多个不同问题进行统一编码，根据该编码方式初始化种群个体，并在所有任务上进行评估；之后，根据交叉参数选择对种群进行选型交叉操作或者进行引导变异操作，这个过程中通过对交叉参数采取自适应控制策略，调整进化行为以提高搜索效率；接下来执行连接选择操作选择出进入下一代个体，通过构建自适应的计算资源重分配机制使得表现相对落后的任务可以得到更多计算资源。本发明通过在进化过程中自适应调节交叉变异操作，并对不同问题所占据计算资源进行自适应重分配，从而同时高效处理多个复杂符号回归问题。

Description

一种基于多任务遗传编程算法的自适应符号回归方法

技术领域

本发明涉及智能计算和多任务优化技术领域，尤其涉及一种基于多任务遗传编程算法的自适应符号回归方法。

背景技术

符号回归同时搜索给定问题的函数和参数集的最优形式，当模型结构或者数据分布的先验知识很少时，它是一种强大的回归技术。作为一个监督学习问题，符号回归旨在找到一个符号形式的数学公式来建立给定的输入和输出变量之间的关系。它的函数模型结构和相关参数都是在学习进化过程中自动搜索得到的，具有更广泛的可拓展性，便于挖掘出数据集中不易被人所发现的潜在规律。

遗传编程算法是目前解决符号回归问题的主流方法。然而，传统的遗传编程算法只能在一次独立运行中解决一个任务，这在需要同时解决多个任务的情况下是效率低下的。在这种情况下，多因子优化作为一种新的进化多任务处理范式被提出。它试图在一个独立的运行中对多个任务同时进行搜索。在实际应用场景中，问题很少孤立存在，而且问题往往包含有用的信息，如果适当利用，当遇到另一个相关问题时，可以导致增强的问题解决过程。例如，如果两个问题碰巧有一个共同的全局最优，解决一个问题的同时将得以解决另一个问题。一个实际工业应用中的例子便是云服务。随着云计算的快速发展，当下的云服务面临着同时接收多个用户的多个优化任务的问题，这些任务既可以具有相似的属性，也可以属于完全不同的领域。因此，云计算并发处理多个客户端的组合要求的需求也是促使多任务优化快速兴起的主要推力。

多因子优化是一种将多任务优化框架运用于进化计算领域的针对单一种群群体的进化多任务处理的优化范式，主要目的是在不同优化任务对应的多个并发搜索空间上同时执行进化搜索。由于MFO对多个任务只保留一个种群，不同任务的有用信息可以通过交叉重组过程在个体之间隐形转移。

目前对于同时求解多个符号回归问题的实践研究还处于初步阶段，使用多任务范式搜索多个问题还停留在初步应用阶段，对于具体的操作步骤的按研究还不深入，在不同任务个体间进行的交叉重组操作缺乏有效的引导。在使用基于多任务优化范式的遗传编程算法求解符号回归问题时，缺乏对并发搜索过程中的不同任务间的计算资源分配的处理。在相对固定的资源配给下，如何平衡分配给各个任务的计算资源从而使得所有任务都尽可能的达到更好的结果一直是一个需要着重考虑的课题。

发明内容

本发明的目的是为了解决现有技术中的上述缺陷，提供一种基于多任务遗传编程算法的自适应符号回归方法。

本发明的目的可以通过采取如下技术方案达到：

一种基于多任务遗传编程算法的自适应符号回归方法，包括以下步骤：

S1、构建可伸缩的基因表达编码方式形成统一的搜索空间，用于对多个不同的符号回归问题进行统一编码；根据该编码方式初始化种群中所有个体；通过将统一的可伸缩的基因表达编码表示转换为特定任务的染色体编码方式的解码操作，对每个个体在所有任务上都进行多因子评估；

S2、根据交叉参数IR选择对种群进行选型交叉操作或者进行引导变异操作，逐一对种群中每个个体进行以上操作，产生新一代的后代种群；

S3、将新生成的后代种群与父代种群进行混合连接操作，形成一个临时种群，并在临时种群中重新进行多因子评估和计算标量适应度，其中，混合连接操作包括连接操作和选择操作；根据标量适应度在父代个体和子代个体之间进行一对一选择，选择出进入下一代种群的个体；构建自适应的计算资源重分配机制使得表现相对落后的任务所属的种群个体更多的进入下一代种群中；

S4、统计下一代种群中每个任务的最佳个体的操作来源，对交叉参数IR采取自适应控制策略完成调整进化行为；

S5、判定所有任务所规定的精度条件或者适应度评估次数是否达到所规定的最大次数，若满足终止进化，输出最后种群中每个任务所对应的最佳个体的解决方案；否则继续返回步骤S2至步骤S5的进化流程进行种群循环进化搜索。

进一步地，所述步骤S1中可伸缩的基因表达编码方式如下：(1)采用固定长度的字符串作为个体染色体；(2)包含一个主要函数和多个自动定义函数ADF；(3)统一使用整数来表示函数和终端，使用单个整数表示不同任务的各种符号。这样，不同任务可能具有的独特函数和终端符号可以在同一编码方式下进行编码，形成统一的公共搜索空间，方便不同任务间进行信息迁移操作。

进一步地，所述步骤S1中将统一的染色体编码表示转换为特定任务的染色体的解码过程具体如下：

S11、通过检查统一编码方式的染色体中每个维度上的整数x所属的范围，找出每个维度所代表的相应符号类型；

S12、根据特定任务定义的类型的所属整数范围对整数x进行缩放操作，得到在特定任务定义范围中的整数x’，即：

其中，L_x和U_x分别是步骤S11中发现的元素对应类型的数值范围内的最小值和最大值，N_x是对应类型元素中的所用的最大整数，

是对a向下取整运算符，返回不大于a的最大整数；上述步骤将整数x被映射到0到N_x-1之间的整数x’，使用缩放后的值x’作为索引，将x映射到特定任务的有意义的符号。将公共搜索空间中的染色体编码结构解码转化为某个具体任务的搜索空间中的染色体编码结构，形成特定于该任务的一个解决方案，便于进行在该任务上的适应度评估。

进一步地，所述步骤S2中选型交叉操作具体如下：

使用单点交叉，通过将随机选择的父代个体X_r1和X_i交叉操作来生成子代个体U_i，其中X_r1表示随机选取的个体，X_i是种群中第i个执行单点交叉的个体；对子代个体U_i进行统一的变异操作，且生成的子代个体U_i的技能因子采用垂直文化传播的方式，以相同的概率随机从父代双亲之一继承。由于两个父代个体可能有各自单独的技能因子，这种交叉操作增强了不同任务中发现的有用遗传信息的相互转移。

进一步地，所述步骤S2中引导变异操作具体如下：

采用差分进化算法中的“DE/current-to-best/1”突变策略，对X_i执行变异操作以产生后代个体U_i，其中X_i是种群中第i个执行引导变异操作的个体，后代个体U_i染色体有n个维度，每个维度上的值u_i,j由以下公式计算得到：

其中，j表示U_i染色体中第j个维度，t_i,j是随机生成的值，CR是0和1范围内的用户定义的突变因子，k是1和n之间的随机整数，u_i,j和x_i,j分别是U_i和X_i中的第j维变量，rand(0,1)返回0—1之间的随机数，突变概率参数

的值通过以下公式计算：

其中F是用户定义的缩放因子，x_best,j是当前种群中X_i的技能因子所代表的任务的最佳个体X_best的染色体中第j维的值，x_r2,j和x_r3,j分别是在父代种群中随机选取的两个不同个体X_r2和X_r3的染色体中第j维的值，[a]′表示艾弗森(Iverson)括号，如果括号内的条件a为真，则返回1，否则返回0。通过控制该突变参数来确定u_i,j被分配一个新的值而不是x_i,j的概率。此外，u_i,j是根据当前种群中每个函数和终端的出现频率来分配，即更经常出现在种群个体中的元素更有可能被选择并分配给u_i,j。

进一步地，所述步骤S4中对交叉参数IR采取的自适应控制策略具体如下：

在每一代生成新一代的种群时，通过统计分析当前所有并行任务的最佳个体的来源确定参数IR的自适应更新操作，更新公式如下：

其中ρ是衰减因子，在自适应控制策略中，根据每个任务的最佳个体的生成途径来确定对应的更新规则。如果新一代种群的所有最佳个体中，来自于选型交叉操作的个体占比最多，则参数IR的值趋向于1，增加不同个体间的交叉概率，提高不同任务间的有用信息的传递频率。同理，如果大部分的最佳个体来自于引导变异操作的随机变异，则参数IR趋向于0，降低交叉频率的同时提高每个个体在自己的局部范围内的变异搜索频率。如果大部分的最佳个体没有进行更新，参数IR则谨慎地趋向于0.3，保持选型交叉和引导变异操作处于相对均衡的状态。

进一步地，所述步骤S3中连接操作和选择操作过程如下：

新生成的后代种群newpop与父种群pop混合连接在一起，形成一个临时种群temppop，temppop中的个体根据每个个体相应的适应度评估值在每个任务上进行排序，更新每个个体的技能因子和标量适应度；在temppop中采用一对一选择策略进行选择，每个子代个体U_i都与其对应的父代个体X_i进行比较，即

其中φ(X)返回个体X的标量适应度值，当存在另一个与X_i完全相同的单独的X_k，且k<i时，X_i被认为是多余的。

进一步地，所述步骤S3中自适应的计算资源重分配机制如下：

S31、判断是否达到进行资源重分配的条件，进化过程中所有并发执行的K个任务中如果已经有K-1个任务已经达到了预设的任务精度阈值，则继续执行接下来的步骤S32至步骤S34，否则正常进行选择操作过程；

S32、通过比较每个任务所属的表现最好个体的该任务的适应度值，从而找出表现最差的任务；

S33、在该表现最差任务所属的个体中选择因子排名前M个个体进行保留，直接进入下一代种群中，如果该任务所属个体的数量m不足M个，则全部保留，其余的则循环复制排名前M-m项个体；

S34、临时种群temppop中剩下的个体继续执行选择操作。

通过上述的步骤，本发明所提出的方法既不会耽误其他任务的搜索，也会在一定程度上对变现较差任务进行计算资源倾斜，使得所有任务都尽可能得到更好的结果。此外，在搜索表现较好的任务精度达到预设标准后将其多余的计算资源分配给其他任务，也提高计算资源的利用率和任务整体的搜索效率。

本发明相对于现有技术具有如下的优点及效果：

1、本发明通过对交叉重组操作中的交叉参数IR采取自适应控制策略，在进化过程中兼顾任务间的知识转移和提高局部区域中的解决方案的搜索质量，降低无关联任务之间发生无效的交叉重组的概率。通过此操作来调整进化行为以提高搜索效率。

2、本发明设计了一种自适应的计算资源重分配机制，用于均衡不同任务，使得表现相对落后的任务可以得到更多的计算资源分配，从而让并发执行的所有任务都尽可能的得到最优解。此外，在搜索表现较好的任务精度达到预设标准后，可以将其多余的计算资源分配给其他任务，提高资源的利用率和任务整体的搜索效率。

3、本发明提供的多任务符号回归方法不仅可以在一次执行中同时搜索多个任务，有效节约了计算开销，而且可以充分利用不同任务之间的关联性阿赫互补信息，相互促进不同任务各自的搜索，加快问题的求解速度。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明中可伸缩的基因表达编码方式的使用演示示例图；

图2是本发明中基于多任务遗传编程算法的自适应符号回归方法流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1

假设有K个符号回归任务同时求解，其中第i个任务的函数集和终端集分别是F_i和T_i。这些终端元素与函数元素共同构成解的元素集。遗传编程算法在给定的构建元素集中找到满足训练数据与目标函数的最优公式。

如图2所示，本实施例是基于多任务遗传编程算法的自适应符号回归方法，包括以下步骤：

T1、构建可伸缩的基因表达编码方式并初始化种群。

对多个不同的符号回归问题进行统一编码。在该可伸缩的基因编码表示方案中，采用固定长度的字符串作为个体染色体的编码方式，其包含一个主要函数和多个自动定义函数ADF。此外，由于跨域的不同任务可能具有独特的函数和终端,为了解决这个问题，在可伸缩的基因表达编码方式中，统一使用整数来表示各个函数和终端符号。

为了确保种群中每个染色体都能正确地转换为对应任务的有效的表达式树，头部长度h和尾部长度l受到以下限制：

其中，§(f)返回函数f的参数个数,F_k表示第k个函数，max{a}返回集合a中的最大值。

在确定染色体的长度后，之后是用整数来表示每个染色体的中的元素。首先，表示每个染色体中ADF的数目和每个ADF中输入参数的数目分别为N_a和N_g。之后，定义了四个整数范围来分别表示这些元素，即函数、终端、ADF和输入参数，它们是[0、A-1]、[A、B-1]、[B、C-1]和[C、D-1]。其中A、B、C和D的值是由以下公式确定：

B＝A+N_a

D＝C+N_g

其中，|F_i|返回集合F_i中的元素个数,max{a}返回集合a中的最大值。有了这种共同的染色体表示后，就可以将统一的共同染色体转换为特定任务的染色体，之后再进行解码评估。

确定好可伸缩的基因表达编码方式后，进行搜索种群的初始化。此步骤随机生成初始的种群pop，种群大小为N。每个个体都由一个使用该编码表示方法的整数向量来表示，即

X＝[x₁,x₂,…,x_n]

其中，n是每个个体染色体向量的长度,x_n是可行值范围内的整数。初始化时，在{函数，ADF，终端，输入参数}之中随机选择一个对应位置可行的类型来初始化对应的X维度类型。接下来，x_n在所选类型的可行值范围内被设置为一个随机整数。

根据该编码方式初始化种群，并对每个个体在所有问题上都进行多因子评估。本实施例中，将统一的染色体编码表示转换为特定任务的染色体的解码过程具体如下：(1)通过检查统一编码方式的染色体中每个维度上的整数x所属的范围，找出每个维度所代表的相应符号类型；(2)根据特定任务定义的类型的所属整数范围对整数x进行缩放操作，得到在特定任务定义范围中的整数x’，即：

其中，L_x和U_x分别是步骤(1)中发现的元素对应类型的数值范围内的最小值和最大值，N_x是对应类型元素中的所用的最大整数，

是向下取整运算符，返回不大于a的最大整数；上述步骤将整数x被映射到0到N_x-1之间的整数x’，使用缩放后的值x’作为索引，将x映射到特定任务的有意义的符号。

图1是一个使用可伸缩的基因表达编码方式进行解码的演示例子。在图1中，两个符号回归任务同时求解，它们的函数集、ADFs、终端集和输入参数分别定义为{+、-、*、/}、{G1}、{x1、x2、x3}和{T1、T2}，以及{+、-、*、/，sin，cos}、{G1}、{x1、x2}和{T1、T2}。因此，这两个问题的函数、终端、ADFs和输入参数的最大数目分别是6、1、3和2。基于所提出的S-ADF表达表示，因此，我们有A＝6，B＝7，C＝10，D＝12。在本例中，染色体的结构被设置为拥有一个ADF，且其主函数和ADF的头部和尾部长度分别设置为(4，5)和(2，3)。假设[1，5，6，2，7，7，9，8，9，0，2，10，11，10]成为S-ADF编码染色体的一个例子。在该例子下，可以根据前九个维度(即[1，5，6，2，7，7，9，8，9])获得主函数的表达式，而ADF则根据剩下维度(即[0，2，10，11，10])来得到。之后，为了将染色体转化为对应符号回归问题的一个解，染色体的每个维度必须根据定义的函数、终端和ADFs的数量映射到一个对于该问题有意义的符号。接下来，首先是识别x_i的类型，之后根据在第一阶段得到的相应的类型，将正确的符号分配给x_i。比如，对于第一个符号回归问题，第一维的值是1，属于[0，A-1]，所以第一维的元素类型是函数。然后，我们通过计算该元素放缩后的值，将正确的函数符号分配给x_i。由于(1-0)/(6-0)*3＝0，我们将xi设置为第一个函数(+)。这样，我们就可以将染色体翻译成第一个符号回归问题所对应的一个解[+，*，G1，-，x1，x1，x2，x1，x2，+，*，T1，T2，T1]，它可以进一步解码为最终表达式。

T2、根据交叉参数IR来选择对种群进行选型交叉操作或者进行引导变异操作。

通过统计当前每个任务的最佳个体的操作来源，来对控制参数IR采取自适应控制策略，从而调整进化行为。这个过程中逐一对每个个体进行该操作，产生新一代的后代种群。

选型交叉操作使用单点交叉，通过将随机选择的父代个体X_r1和X_i交叉操作来生成子代个体U_i，其中X_r1表示随机选取的个体，X_i是种群中第i个执行单点交叉的个体；对子代个体U_i进行统一的变异操作，且生成的子代个体U_i的技能因子采用垂直文化传播的方式，以相同的概率随机从父代双亲之一继承。

另一方面，引导变异操作采用差分进化算法中的“DE/current-to-best/1”突变策略，对X_i执行变异操作以产生后代个体U_i，其中X_i是种群中第i个执行引导变异操作的个体，后代个体U_i染色体有n个维度，每个维度上的值u_i,j由以下公式计算得到：

的值通过以下公式计算：

其中F是用户定义的缩放因子，x_best,j是当前种群中X_i的技能因子所代表的任务的最佳个体X_bset的染色体中第j维的值，x_r2,j和x_r3,j分别是在父代种群中随机选取的两个不同个体X_r2和X_r3的染色体中第j维的值，[a]′表示艾弗森(Iverson)括号，如果括号内的条件a为真，则返回1，否则返回0。通过控制该突变条件来确定u_i,j被分配一个新的值而不是x_i,j的概率。

最后，对交叉参数IR采取的自适应控制策略的作用是用来控制种群是选择选型交配重组方式还是变异方式来生成子代个体。

T3、连接和选择操作选出下一代种群个体。

将新生成的后代种群与父代种群进行混合连接操作，形成一个临时种群，并在临时种群中重新计算各任务对应的因子排名和标量适应度；之后根据标量适应度在父代个体和子代个体之间进行一对一选择，选择出进入下一代种群的个体；这个过程中通过构建自适应的计算资源重分配机制使得表现相对落后的任务所属的种群个体可以更多的进入下一代种群中，获得更多的计算资源分配。

连接操作中，新生成的后代种群newpop与父种群pop混合连接在一起，形成一个临时种群temppop。随后，temppop中的个体根据其相应的因子开销独立地在每个任务上进行排序。之后，更新每个个体的技能因子和标量适应度。

之后是在temppop中采用一对一选择策略进行选择，每个子代个体U_i都与其对应的父代个体X_i进行比较，即

其中φ(X)返回个体X的标量适应度值，当存在另一个与X_i完全相同的单独的X_j，且j<i时，X_i被认为是多余的。

最后，自适应的计算资源重分配机制通过平衡分配给各个任务的计算资源从而使得所有任务都尽可能的达到更好的搜索结果，提高算法整体的资源利用率。首先是判断是否达到进行资源重分配的条件。进化过程中，在所有并发执行的K个任务中如果已经有K-1个任务已经达到了预设的任务精度阈值，则继续执行接下来的步骤，否则正常进行搜索过程。接下来的操作主要分为三个步骤。第一步是通过比较每个任务所属的表现最好个体的该任务的适应度值，从而找出表现最差的任务。第二步是在该表现最差任务所属的个体中选择因子排名前M个个体进行保留，直接进入下一代种群中。如果该任务所属个体的数量m不足M个，则全部保留，其余的则循环复制排名前M-m项个体。第三步是在剩下的个体中继续执行选择操作。

T4、对交叉参数IR进行自适应更新操作。

其中ρ是衰减因子，在自适应控制策略中，根据每个任务的最佳个体的生成途径来确定对应的更新规则。如果当前这一代的所有最佳个体中，来自于选型交叉操作的选型交配重组的个体占比最多，则交叉参数IR的值趋向于1，增加不同个体间的交叉概率，提高不同任务间的有用信息的传递频率。同理，如果最多的最佳个体来自于引导变异操作的随机变异，则交叉参数IR趋向于0，降低交叉频率的同时提高每个个体在自己的局部范围内的变异搜索。如果所有最佳个体中最多的是没有更新，则交叉参数IR谨慎的趋向于0.3，保持选型交叉和变异操作处于相对均衡的状态。

T5、终止条件判断。

若满足所有任务所规定的精度条件或者适应度评估次数达到所规定的最大次数，则终止进化，输出最后种群中每个任务所对应的最佳个体的解决方案；否则继续返回步骤T2—T6的进化流程进行种群循环搜索。

为了验证和评估本实施例的算法框架的性能，本实施例以5个符号回归基准测试问题数据集进行仿真实验验证。本实施例将同时对这5个符号回归任务进行多任务并发执行，如步骤T1--T5所示。本实施例的具体参数设置为：种群大小都为N＝100，染色体结构中主函数的头部长度为h＝10；ADF的数量设置为1，且ADF中的头部长度为h′＝3，交叉控制参数IR＝0.3，衰减因子ρ＝0.8，保留个体数目M＝45。表1列出了这5个符号回归基准测试问题的表达式，每个问题狙击包含500条数据。

本实施例中采用均方根误差RMSE作为每个个体在所有任务上进行的适应度评估方式。将本发明所提出的多任务方法和已有的单一任务搜索的SLGEP算法进行搜索精度评估，实验结果如表2所示。

从表2的结果可以得出，本发明所提出的方法在仿真测试中搜索精度要好于一般的单任务搜索算法，结果精度明显更高，这说明本发明所提出的方法在提高遗传编程算法对多个符号回归问题的搜索能力上是有效的。

表1. 5个符号回归基准测试函数表达式明细表

表2.实施例1中的实验结果RMSE对比明细表

	F<sub>1</sub>	F<sub>2</sub>	F<sub>3</sub>	F<sub>4</sub>	F<sub>5</sub>
						实施例1	0.0427	0.0101	0.312	0.00780	0.01
SLGEP	0.0633	0.0528	0.356	0.0142	0.0107

实施例2

为进一步验证本发明所提出方法的有效性，在实施例2中将不采用对交叉参数IR的自适应控制策略，其余步骤和实施例1中保持一致。本实施例主要包括以下步骤：

P1—P4：参照实施例1中的步骤T1—T4。

P5、终止条件判断。

若满足所有任务所规定的精度条件或者适应度评估次数达到所规定的最大次数，则终止进化，输出最后种群中每个任务所对应的最佳个体的解决方案；否则继续返回步骤P2—P5的进化流程进行种群循环搜索。

本实施例同样以表1中的这5个符号回归基准测试问题数据集进行仿真实验验证。具体的试验参数设置和实施例1保持一致。将本实施例的实验结果和实施例1中的实验结果以及单一任务搜索的SLGEP算法的实验结果进行精度对比，实验结果如表3所示。

表3.实施例2中的实验结果RMSE对比明细表

	F<sub>1</sub>	F<sub>2</sub>	F<sub>3</sub>	F<sub>4</sub>	F<sub>5</sub>
						实施例2	0.0478	0.0277	0.326	0.0105	0.0112
实施例1	0.0427	0.0101	0.312	0.00780	0.01
						SLGEP	0.0633	0.0528	0.356	0.0142	0.0107

从表3中可以看出，在不采用对交叉参数IR的自适应控制策略后，实施例2的实验精度有所下降，表现不如实施例1。这说明了本发明所提出的交叉参数自适应控制策略的有效性。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种基于多任务遗传编程算法的自适应符号回归方法，其特征在于，所述自适应符号回归方法包括以下步骤：

2.根据权利要求1所述的一种基于多任务遗传编程算法的自适应符号回归方法，其特征在于，所述步骤S1中可伸缩的基因表达编码方式如下：(1)采用固定长度的字符串作为个体染色体；(2)包含一个主要函数和多个自动定义函数ADF；(3)统一使用整数来表示函数和终端，使用单个整数表示不同任务的各种符号。

3.根据权利要求2所述的一种基于多任务遗传编程算法的自适应符号回归方法，其特征在于，所述步骤S1中将统一的染色体编码表示转换为特定任务的染色体的解码过程具体如下：

是对a向下取整运算符，返回不大于a的最大整数；上述步骤将整数x被映射到0到N_x-1之间的整数x’，使用缩放后的值x’作为索引，将x映射到特定任务的有意义的符号。

4.根据权利要求1所述的一种基于多任务遗传编程算法的自适应符号回归方法，其特征在于，所述步骤S2中选型交叉操作具体如下：

使用单点交叉，通过将随机选择的父代个体X_r1和X_i交叉操作来生成子代个体U_i，其中X_r1表示随机选取的个体，X_i是种群中第i个执行单点交叉的个体；对子代个体U_i进行统一的变异操作，且生成的子代个体U_i的技能因子采用垂直文化传播的方式，以相同的概率随机从父代双亲之一继承。

5.根据权利要求4所述的一种基于多任务遗传编程算法的自适应符号回归方法，其特征在于，所述步骤S2中引导变异操作具体如下：

的值通过以下公式计算：

其中F是用户定义的缩放因子，x_bset,j是当前种群中X_i的技能因子所代表的任务的最佳个体X_bset的染色体中第j维的值，x_r2,j和x_r3,j分别是在父代种群中随机选取的两个不同个体X_r2和X_r3的染色体中第j维的值，[a]′表示艾弗森括号，如果括号内的条件a为真，则返回1，否则返回0。

6.根据权利要求1所述的一种基于多任务遗传编程算法的自适应符号回归方法，其特征在于，所述步骤S4中对交叉参数IR采取的自适应控制策略具体如下：

其中ρ是衰减因子，在自适应控制策略中，根据每个任务的最佳个体的生成途径来确定对应的更新规则。

7.根据权利要求1所述的一种基于多任务遗传编程算法的自适应符号回归方法，其特征在于，所述步骤S3中连接操作和选择操作过程如下：

其中φ(X)返回个体X的标量适应度值，当存在另一个与X_i完全相同的单独的X_k且k<i时，X_i被认为是多余的。

8.根据权利要求1所述的一种基于多任务遗传编程算法的自适应符号回归方法，其特征在于，所述步骤S3中自适应的计算资源重分配机制如下：

S34、临时种群temppop中剩下的个体继续执行选择操作。