CN103198359A - 基于nsga-ⅱ优化改进的模糊回归模型构造方法 - Google Patents
基于nsga-ⅱ优化改进的模糊回归模型构造方法 Download PDFInfo
- Publication number
- CN103198359A CN103198359A CN 201310116177 CN201310116177A CN103198359A CN 103198359 A CN103198359 A CN 103198359A CN 201310116177 CN201310116177 CN 201310116177 CN 201310116177 A CN201310116177 A CN 201310116177A CN 103198359 A CN103198359 A CN 103198359A
- Authority
- CN
- China
- Prior art keywords
- fuzzy
- regression model
- chromosome
- population
- nsga
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本发明公开了一种基于NSGA-Ⅱ优化改进的模糊回归模型构造方法,减少模糊集合、模糊规则及其前件的冗余,提高模糊回归模型的解释性。首先通过三角隶属函数和WM(WangandMendel)算法构造初始模糊回归模型;然后基于NSGA-Ⅱ优化模糊回归模型,减少了模糊集合数,优化了模糊集合参数,同时通过对模糊规则及其前件的选择来删除模糊规则中的冗余,从而提高了模糊回归模型的精确性和解释性。
Description
技术领域
本发明涉及数据挖掘和人工智能的技术领域,尤其是一种基于第二代非支配排序遗传算法(Non-dominated sorting genetic algorithm Ⅱ, NSGA-Ⅱ)优化改进的模糊回归模型构造方法。
背景技术
模糊回归模型的知识表达形式和推理机制符合人类思维习惯,其结构和模糊集合隶属函数参数具有明显的物理意义。人们可通过易于理解的模糊规则洞察回归模型的内部运行机理,即解释性是模糊回归模型最显著的特征。
随着回归问题维数和复杂性的提高,利用传统的方法构造模糊回归模型主要存在以下几个问题而使模型不具备解释性:1)特征变量的维数存在冗余;2)模糊规则数比实际需要的多;3)模糊规则前件数比实际需要的多;4)模糊集合的数量与参数设计不合理。为克服以上问题,诸多学者对在保证系统精确性时如何提高模型的解释性进行了相关研究。“J. Casillas, O. Cordon, M.J. del Jesus, F. Herrera. Genetic tuning of fuzzy rule deep structures preserving interpretability and its interaction with fuzzy rule set reduction. IEEE Trans. Fuzzy Systems. 2005(13): 13-29”在模糊规则中采用了模糊限制语,利用遗传算法实现了模糊规则和隶属函数参数的优化,但是该方法模糊规则及其前件仍存在冗余。“R. Alcala, J. Alcalaa-Fdez, M J Gacto,et al. A Multi-Objective Evolutionary Algorithm for Rule Selection and Tuning on Fuzzy Rule-Based Systems.Proceeding of 2007 IEEE International Conference onFuzzy Systems, London, IEEE Press. 2007: 1367-1372”和“M.J. Gacto, R. Alcala, F. Herrera. Adaptation andApplication of Multi-Objective Evolutionary Algorithmsfor Rule Reduction and Parameter Tuning of Fuzzy Rule-Based Systems. Soft Computing. 2009(13): 419-436”采用二进制编码进行规则选择,采用实数编码进行隶属函数参数优化,但该方法的规则为等长度,未涉及规则前件的优化。
上述技术均对模糊回归模型进行了优化,不同程度地提高了模型的解释性,但是模糊规则及其前件冗余的情况仍然存在。
发明内容
本发明的目的在于提供一种基于NSGA-Ⅱ优化改进的模糊回归模型构造方法,减少模糊集合、模糊规则及其前件的冗余,提高模糊回归模型的解释性。首先通过三角隶属函数和WM(Wang and Mendel)算法构造初始模糊回归模型;然后基于NSGA-Ⅱ优化模糊回归模型,减少了模糊集合数,优化了模糊集合参数,同时通过对模糊规则及其前件的选择来删除模糊规则中的冗余,从而提高了模糊回归模型的精确性和解释性。
实现本发明目的的技术解决方案为:一种基于NSGA-Ⅱ优化改进的模糊回归模型构造方法,包括以下步骤:
步骤一、构造初始模糊回归模型
根据样本输入输出数据,利用三角隶属函数和WM算法构造初始模糊回归模型。
步骤二、设定进化参数
给定所需的种群规模L、最大迭代次数MAXTER、当前迭代次数t、交叉率pc、变异率pm。
步骤三、产生初始代种群
将初始模糊回归模型直接编码产生第一条染色体,定义模糊回归模型编码方式如下:
CH=CSCT
CS=(cs1,cs2,…,csR)
csr=(d1,r,d2,r,…,dn+1,r)
CT=(ct1,ct2,…,ctn+1)
其中CH表示染色体,CS为模糊回归模型的规则库中所有规则编码,csr为单条规则编码,r=1,2,…,R,R为规则库中的规则数;di,r为规则r中变量i的编码,取值为0或者1,i=1,2,…,n+1,n为输入变量数;CT为模糊集合参数编码,cti代表变量i的模糊集合参数编码,mi表示变量i的模糊集合数。
第一条染色体中CS所有基因值均取1,模糊集合参数由初始模糊回归模型的模糊集合参数实数编码得到。剩下的L-1条染色体,CS中所有基因值也都取1,CT以第一条染色体的CT为中心在搜索空间内随机均匀生成。这L条染色体构成初始代种群。
步骤四、定义适应度函数
定义如下适应度函数:
F1=MSE,F2=R,F3=rc
步骤五、全局搜索最优个体并输出
利用NSGA-Ⅱ算法全局搜索最优个体,将最优个体反编码为模糊回归模型并输出,初始迭代次数t=0。
步骤一中,利用三角隶属函数和WM算法构造初始模糊回归模型的过程如下:
(1) 采用了强模糊划分将每个输入输出论域空间均匀划分为f个三角模糊集合,f为给定的每个变量的初始模糊集合数。
(2) 每个输入输出样本数据构造一条模糊规则,模糊前件中的模糊集合为输入样本对应的最大隶属函数值所在集合,模糊后件中的模糊集合为输出样本的最大隶属函数值所在集合。
(3)计算每条规则的模糊推理输出wr,公式如下:
其中r=1,2,…,R,R为模糊规则数,μri为规则r中输入变量i的隶属函数值,n为输入变量数,∧为取小算子。若有多条规则模糊前件相同,则仅保留模糊推理输出最大的那条规则。
(4) 通过中心解模糊方法计算模型输出:
步骤三中,剩下的L-1条染色体,CT以第一条染色体的CT为中心在搜索空间内随机均匀生成,其中搜索空间为:
其中, (aji,bji,cji)为初始模糊回归模型的模糊集合参数,i=1,2,…,n,j=1,2,…,mi。
步骤五中,利用NSGA-Ⅱ算法全局搜索最优个体的过程如下:
(1)对种群进行遗传操作:采用二进制锦标赛选择;对染色体CT部分进行BLX-0.5交叉,对染色体CS部分进行HUX交叉,交叉率为pc;CS和CT在进行交叉后各有两个子代,结合它们得到四条子代染色体,对这四条子代染色体进行概率为pm的单点变异操作,即在CS和CT中各随机选择一个基因进行变异;将变异后的四条染色体反编码为对应的模糊回归模型,计算它们的适应度函数值,留下准确性最高的两条染色体作为子代。第t代种群在遗传操作完成后得到子代种群。
(2)混合第t代种群及其子代种群得到个体数为2L的新种群。
(3)将新种群中的个体反编码为对应的模糊回归模型,计算每个模型的适应度函数值,对新种群中的所有个体进行非支配水平排序与密集度评估。
(4)采用比较运算符对新种群中所有个体的适应度函数值进行排序,取前L个个体作为下一代种群。
(5)迭代次数t加1,若t<MAXTER,则返回1),否则,算法终止。
(6)当前种群中非支配水平最高个体中精确性最高的个体即为最优个体。
本发明与现有技术相比,其显著优点:(1)利用NSGA-Ⅱ算法优化初始模糊回归模型,优化了模糊集合参数,提高了模型的精确性;(2)对模糊规则及其前件进行选择,减少了模糊规则及其前件的冗余,提高了模型的解释性。
附图说明
附图是基于NSGA-Ⅱ算法优化改进的模糊回归模型构造方法的流程图。
具体实施方式
下面结合附图和实施例对本发明作进一步详细描述。
本发明基于NSGA-Ⅱ优化改进的模糊回归模型构造方法过程如下:
步骤一、构造初始模糊回归模型
根据样本输入输出数据,利用三角隶属函数和WM算法构造初始模糊回归模型,构造过程如下:
(1)采用了强模糊划分将每个输入输出论域空间均匀划分为f个三角模糊集合,f为给定的每个变量的初始模糊集合数。
(2)每个输入输出样本数据构造一条模糊规则,模糊前件中的模糊集合为输入样本对应的最大隶属函数值所在集合,模糊后件中的模糊集合为输出样本的最大隶属函数值所在集合。
(3)计算每条规则的模糊推理输出wr,公式如下:
其中r=1,2,…,R,R为模糊规则数,μri为规则r中输入变量i的隶属函数值,n为输入变量数,∧为取小算子。若有多条规则模糊前件相同,则仅保留模糊推理输出最大的那条规则。
(4)通过中心解模糊方法计算模型输出:
步骤二、设定进化参数
给定所需的种群规模L、最大迭代次数MAXTER、当前迭代次数t、交叉率pc、变异率pm。
步骤三、初始化种群
将初始模糊回归模型直接编码产生第一条染色体,定义模糊回归模型编码方式如下:
CH=CSCT
CS=(cs1,cs2,…,csR)
csr=(d1,r,…,dn,r,dn+1,r)
CT=(ct1,ct2,…,ctR)
其中CH表示染色体,CS为模糊回归模型的规则库中所有规则编码,csr为单条规则编码,r=1,2,…,R,R为规则库中的规则数;di,r为规则r中变量i的编码,取值为0或者1,目的是实现对模糊规则及其前件的选择,i=1,2…,n+1,n为输入变量数;CT为模糊集合参数编码,cti代表变量i的模糊集合参数编码,mi表示变量i的模糊集合数。
第一条染色体中CS所有基因值均取1,模糊集合参数由初始模糊回归模型的模糊集合参数实数编码得到。剩下的L-1条染色体,CS中所有基因值也都取1,CT以第一条染色体的CT为中心在搜索空间内随机均匀生成,搜索空间为:
其中,初始模糊回归模型的模糊集合参数为(aji,bji,cji),j=1,2,…,mi,i=1,2,…,n。这L条染色体构成初始代种群。
步骤四、定义适应度函数
为保证回归的精确性和解释性,定义如下适应度函数:
F1=MSE,F2=R,F3=rc
步骤五、全局搜索最优个体并输出
初始迭代次数t=0,利用NSGA-Ⅱ算法全局搜索最优个体,将最优个体反编码为模糊回归模型并输出:
(1)对种群进行遗传操作:采用二进制锦标赛选择;对染色体CT部分进行BLX-0.5交叉,对染色体CS部分进行HUX交叉,交叉率为pc;CS和CT在进行交叉后各有两个子代,结合它们得到四条子代染色体,对这四条子代染色体进行概率为pm的单点变异操作,即在CS和CT中各随机选择一个基因进行变异;将变异后的四条染色体反编码为对应的模糊回归模型,计算它们的适应度函数值,留下准确性最高的两条染色体作为子代。第t代种群在遗传操作完成后得到子代种群。
(2)混合第t代种群及其子代种群得到个体数为2L的新种群。
(3)将新种群中的个体反编码为对应的模糊回归模型,计算每个模型的适应度
函数值,对新种群中的所有个体进行非支配水平排序与密集度评估。
(4)采用比较运算符对新种群中所有个体的适应度函数值进行排序,取前L个个体作为下一代种群。
(5)迭代次数t加1,若t<MAXTER,则返回1),否则,算法终止。
(6)当前种群中非支配水平最高个体中精确性最高的个体即为最优个体,将最优个体反编码为模糊回归模型并输出,该模型的精确性和解释性均较好。
实施例
以下实施例选择模糊规则数、规则前件总数和均方误差来评价模型回归效果。
一般来讲,均方误差越小,模糊回归模型精确性越高,模糊规则数、规则前件总数越小,模糊回归模型解释性越好。
实验采用MATLAB语言编程实现,采用小镇中压线路维修费用估计问题(estimating the maintenance costs of medium voltagelines in a town,ELE)这个知名数据集作为测试样本集。其中ELE数据集包含1059个4维的输入向量。随机选取ELE数据中80%的样本作为训练数据,剩下20%的样本作为测试数据。参数设置如下:种群规模61,最大迭代次数1300,交叉率1,变异率0.2。算法运行十次,将评价回归效果的指标求得平均值,运行结果如表1所示。
表1回归结果比较
从表1可以看出:
(1)本发明构造的模糊回归模型模糊规则数与其他方法相比,对于ELE数据是最少的,因此模糊规则冗余较少。
(2)本发明构造的模糊回归类模型规则前件总数与其它方法相比,对于ELE数据是最少的,有效减少了规则前件的冗余。
(3)本发明构造的模糊回归类模型的训练均方误差和检验均方误差与其它方法相比,对于ELE数据都是最小的,因此本发明能够保证模糊回归模型的精确性。
实验表明相比现有技术,本发明能够较好地克服传统方法构造模糊回归模型的缺点,在保证模型精确性的同时提高模型的解释性。
Claims (4)
1.一种基于NSGA-Ⅱ优化改进的模糊回归模型构造方法,其特征在于包括以下步骤:
步骤一、构造初始模糊回归模型
根据样本输入输出数据,利用三角隶属函数和WM算法构造初始模糊回归模型;
步骤二、设定进化参数
给定所需的种群规模L、最大迭代次数MAXTER、当前迭代次数t、交叉率pc、变异率pm;
步骤三、产生初始代种群
将初始模糊回归模型直接编码产生第一条染色体,定义模糊回归模型编码方式如下:
CH=CSCT
CS=(cs1,cs2,…,csR)
csr=(d1,r,…,dn,r,dn+1,r)
CT=(ct1,ct2,…,ctn+1)
其中,CH表示染色体,CS为模糊回归模型的规则库中所有规则编码,csr为单条规则编码,r=1,2,…,R,R为规则库中的规则数;di,r为规则r中变量i的编码,取值为0或者1,i=1,2,…,n+1,n为输入变量数;CT为模糊集合参数编码,cti代表变量i的模糊集合参数编码,mi表示变量i的模糊集合数;
第一条染色体中CS所有基因值均取1,模糊集合参数由初始模糊回归模型的模糊集合参数实数编码得到;剩下的L-1条染色体,CS中所有基因值也都取1,CT以第一条染色体的CT为中心在搜索空间内随机均匀生成;这L条染色体构成初始代种群;
步骤四、定义适应度函数
定义如下适应度函数:
F1=MSE,F2=R,F3=rc
步骤五、全局搜索最优个体并输出
利用NSGA-Ⅱ算法全局搜索最优个体,将最优个体反编码为模糊回归模型并输出,初始迭代次数t=0。
2.根据权利要求1所述的基于NSGA-Ⅱ优化改进的模糊回归模型构造方法,其特征在于,所述步骤一中,利用三角隶属函数和WM算法构造初始模糊回归模型的过程如下:
1.1 采用强模糊划分将每个输入输出论域空间均匀划分为f个三角模糊集合,f为给定的每个变量的初始模糊集合数;
1.2 每个输入输出样本数据构造一条模糊规则,模糊前件中的模糊集合为输入样本对应的最大隶属函数值所在集合,模糊后件中的模糊集合为输出样本的最大隶属函数值所在集合;
1.3计算每条规则的模糊推理输出wr,公式如下:
其中,r=1,2,…,R,R为模糊规则数,μri为规则r中输入变量i的隶属函数值,n为输入变量数,∧为取小算子;若有多条规则模糊前件相同,则仅保留模糊推理输出最大的那条规则;
1.4通过中心解模糊方法计算模型输出:
3.根据权利要求1所述的基于NSGA-Ⅱ优化改进的模糊回归模型构造方法,其特征在于,所述步骤三中,剩下的L-1条染色体,CT以第一条染色体的CT为中心在搜索空间内随机均匀生成,其中搜索空间为:
其中, (aji,bji,cji)为初始模糊回归模型的模糊集合参数,i=1,2,…,n,j=1,2,…,mi。
4.根据权利要求1所述的基于NSGA-Ⅱ优化改进的模糊回归模型构造方法,其特征在于,所述步骤五中,利用NSGA-Ⅱ算法全局搜索最优个体的过程如下:
5.1对种群进行遗传操作:采用二进制锦标赛选择;对染色体CT部分进行BLX-0.5交叉,对染色体CS部分进行HUX交叉,交叉率为pc;每两条染色体的CS和CT在进行交叉后各有两个子代,结合它们得到四条子代染色体,对这四条子代染色体进行概率为pm的单点变异操作,即在CS和CT中各随机选择一个基因进行变异;将变异后的四条染色体反编码为对应的模糊回归模型,计算它们的适应度函数值,留下准确性最高的两条染色体作为子代;第t代种群在遗传操作完成后得到子代种群;
5.2 混合第t代种群及其子代种群得到个体数为2L的新种群;
5.3将新种群中的个体反编码为对应的模糊回归模型,计算每个模型的适应度函数值,对新种群中的所有个体的适应度函数值进行非支配水平排序与密集度评估;
5.4采用比较运算符对新种群中所有个体的适应度函数值进行排序,取前L
个个体作为下一代种群;
5.5 迭代次数t加1,若t<MAXTER,则返回5.1,否则,算法终止;
5.6 当前种群中非支配水平最高个体中精确性最高的个体即为最优个体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201310116177 CN103198359A (zh) | 2013-04-03 | 2013-04-03 | 基于nsga-ⅱ优化改进的模糊回归模型构造方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201310116177 CN103198359A (zh) | 2013-04-03 | 2013-04-03 | 基于nsga-ⅱ优化改进的模糊回归模型构造方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103198359A true CN103198359A (zh) | 2013-07-10 |
Family
ID=48720884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201310116177 Pending CN103198359A (zh) | 2013-04-03 | 2013-04-03 | 基于nsga-ⅱ优化改进的模糊回归模型构造方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103198359A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103678924A (zh) * | 2013-12-18 | 2014-03-26 | 南京理工大学 | 轨道交通车辆关键部件故障模式风险优先数的确定方法 |
CN108633697A (zh) * | 2018-05-15 | 2018-10-12 | 重庆科技学院 | 一种基于植物日常数据分析与云技术的智能植物养培方法 |
CN109543247A (zh) * | 2018-11-01 | 2019-03-29 | 广州大学 | 基于nsga-ⅱ的模拟集成电路参数优化设计方法及装置 |
CN110069498A (zh) * | 2019-04-16 | 2019-07-30 | 江南大学 | 基于多目标演化算法的高质量模式挖掘方法 |
CN111203887A (zh) * | 2020-02-23 | 2020-05-29 | 陕西理工大学 | 一种基于nsga-ii模糊逻辑推理的机器人控制系统优化方法 |
-
2013
- 2013-04-03 CN CN 201310116177 patent/CN103198359A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103678924A (zh) * | 2013-12-18 | 2014-03-26 | 南京理工大学 | 轨道交通车辆关键部件故障模式风险优先数的确定方法 |
CN108633697A (zh) * | 2018-05-15 | 2018-10-12 | 重庆科技学院 | 一种基于植物日常数据分析与云技术的智能植物养培方法 |
CN109543247A (zh) * | 2018-11-01 | 2019-03-29 | 广州大学 | 基于nsga-ⅱ的模拟集成电路参数优化设计方法及装置 |
CN109543247B (zh) * | 2018-11-01 | 2023-01-20 | 广州大学 | 基于nsga-ⅱ的模拟集成电路参数优化设计方法及装置 |
CN110069498A (zh) * | 2019-04-16 | 2019-07-30 | 江南大学 | 基于多目标演化算法的高质量模式挖掘方法 |
CN111203887A (zh) * | 2020-02-23 | 2020-05-29 | 陕西理工大学 | 一种基于nsga-ii模糊逻辑推理的机器人控制系统优化方法 |
CN111203887B (zh) * | 2020-02-23 | 2022-08-23 | 陕西理工大学 | 一种基于nsga-ii模糊逻辑推理的机器人控制系统优化方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109086817B (zh) | 一种基于深度信念网络的高压断路器故障诊断方法 | |
CN108334949B (zh) | 一种基于优化深度卷积神经网络结构快速进化的图像分类器构建方法 | |
CN103198359A (zh) | 基于nsga-ⅱ优化改进的模糊回归模型构造方法 | |
CN106067066A (zh) | 基于遗传算法优化装袋算法的电力变压器故障诊断方法 | |
CN102663499B (zh) | 基于模拟退火遗传算法的网络社区划分方法 | |
Soltanian et al. | Artificial neural networks generation using grammatical evolution | |
CN102622515A (zh) | 一种天气预测方法 | |
Jaddi et al. | Taguchi-based parameter designing of genetic algorithm for artificial neural network training | |
Gavrilis et al. | Selecting and constructing features using grammatical evolution | |
Zhao et al. | A hybrid learning method for constructing compact rule-based fuzzy models | |
Liu et al. | Selective ensemble learning method for belief-rule-base classification system based on PAES | |
Ho et al. | Neuroevolution-based efficient field effect transistor compact device models | |
CN104680023B (zh) | 基于多目标决策的抽油机参数优化方法 | |
Castro et al. | Focusing on interpretability and accuracy of a genetic fuzzy system | |
CN103198357A (zh) | 基于nsga-ⅱ优化改进的模糊分类模型构造方法 | |
CN106503793A (zh) | 一种基于改进差分算法的神经网络短期风速预测方法 | |
CN104598657A (zh) | 一种基于memetic算法的基因模体重构技术 | |
Weihong et al. | A fuzzy classifier based on Mamdani fuzzy logic system and genetic algorithm | |
CN115713144A (zh) | 基于组合cgru模型的短期风速多步预测方法 | |
Pedrycz et al. | OR/AND neurons and the development of interpretable logic models | |
Semenkin et al. | Integration of Intelligent Information Technologies Ensembles with Self-Configuring Genetic Programming Algorithm | |
Rivero et al. | Modifying genetic programming for artificial neural network development for data mining | |
Liu et al. | Participatory genetic learning in fuzzy system modeling | |
Ünal et al. | Neural Logic Circuits: An evolutionary neural architecture that can learn and generalize | |
Qu et al. | Two-stage coevolution method for deep CNN: A case study in smart manufacturing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20130710 |