CN117911799B - 一种基于多策略改进鳌虾算法的特征分类方法 - Google Patents
一种基于多策略改进鳌虾算法的特征分类方法 Download PDFInfo
- Publication number
- CN117911799B CN117911799B CN202410309215.5A CN202410309215A CN117911799B CN 117911799 B CN117911799 B CN 117911799B CN 202410309215 A CN202410309215 A CN 202410309215A CN 117911799 B CN117911799 B CN 117911799B
- Authority
- CN
- China
- Prior art keywords
- algorithm
- strategy
- shrimp
- formula
- specifically
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 113
- 238000000034 method Methods 0.000 title claims abstract description 52
- 241000238557 Decapoda Species 0.000 title claims abstract description 33
- 230000006870 function Effects 0.000 claims abstract description 33
- 241000238017 Astacoidea Species 0.000 claims abstract description 21
- 230000000739 chaotic effect Effects 0.000 claims abstract description 15
- 230000007246 mechanism Effects 0.000 claims abstract description 11
- 230000009466 transformation Effects 0.000 claims abstract description 5
- 238000007689 inspection Methods 0.000 claims abstract description 4
- 230000035772 mutation Effects 0.000 claims description 14
- 230000003044 adaptive effect Effects 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 4
- 238000002790 cross-validation Methods 0.000 claims description 4
- 230000002431 foraging effect Effects 0.000 claims description 4
- 230000006872 improvement Effects 0.000 claims description 4
- 206010019345 Heat stroke Diseases 0.000 claims description 3
- 208000007180 Sunstroke Diseases 0.000 claims description 3
- 230000002265 prevention Effects 0.000 claims description 3
- 241000238565 lobster Species 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 17
- 230000008901 benefit Effects 0.000 abstract description 10
- 238000004364 calculation method Methods 0.000 abstract description 4
- 239000003795 chemical substances by application Substances 0.000 description 29
- 238000005457 optimization Methods 0.000 description 9
- 238000011156 evaluation Methods 0.000 description 6
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000010187 selection method Methods 0.000 description 3
- 241000282461 Canis lupus Species 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000009191 jumping Effects 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 241000283153 Cetacea Species 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000013505 freshwater Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000009182 swimming Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于多策略改进鳌虾算法的特征分类方法,包括:获得零件图像数据并分割数据;初始化种群及参数,应用转化函数;计算适应度函数值;进入主循环,设置迭代终止条件;使用自适应螺旋精英贪婪反向学习策略获得精英反向解,并进行贪婪选择;使用鳌虾算法的各个温度控制的位置更新策略,更新代理位置;使用混沌变异机制的位置更新策略;进行所有个体、所有维度的边界检查;更新全局最优代理位置和适应度值;当迭代次数达到预设的最大迭代次数时,退出循环,并输出结果;提取选择的特征,通过K‑邻近分类器进行分类准确度评估。本发明采用的方法,在特征选择的过程中,展现了分类精度好、收敛性强、鲁棒性高、计算代价小等优点。
Description
技术领域
本发明涉及机器学习和数据分析技术领域,尤其涉及装配领域里面的零件图像处理的一种基于改进鳌虾算法的特征选择方法。
背景技术
数据量的爆炸式增长现象贯穿在整个数据时代发展进程的关键节点上。面对各领域内庞大的数据体量,如何简化以及有效的进行处理,挖掘潜在规律和有利信息是人工智能领域的重要挑战。尤其是在机械装配方面,通过人工智能技术对大量零件图像数据的处理对于算法的要求越来越高。
对于输入的文本,图像,语音等高维数据,特征选择技术能够在保留最相关特征的基础上降低数据分析的难度。特征选择问题的本质是在原始数据中找到最具相关性、最具预测能力、最具解释性的特征子集。合理的特征选择技术能够帮助减少维度灾难的影响,增强模型的泛化性和解释性。
事实上,特征选择问题是一个组合优化问题,现存的解决方案有穷举法,动态规划法,贪婪算法,支持向量机,元启发式算法等。现存的较为成熟的集成式特征选择技术主要分为三种:封装式特征选择、过滤式特征选择、嵌入式特征选择。
封装式往往具有分类精度高的优点,但是其计算过程较为复杂繁琐。过滤式是将特征选择作为一个预处理过程,简单易行,时间复杂度低。嵌入式则试图利用前两种模型的优点,在不同的搜索阶段采用不同的评价准则(“一种启发式的局部随机特征选择算法”,刘景华等,计算机工程与应用,2016年)。
尽管现存的解决特征选择问题的方案各有长处,但在另一些方面存在各自的局限性,往往很难平衡求解质量和求解代价。而近年来,随着元启发式算法的发展,许多研究内容揭示了该类算法在特征选择上应用的独特优势。该类算法能够很好的平衡求解质量和求解代价,使得计算复杂度和近似最优解的精度都在可接受的范围内。例如,中国专利CN111177010A公开了一种软件缺陷报告严重程度识别方法,该方法基于卷积神经网络来实现缺陷报告严重程度的识别,利用元启发式算法—遗传算法进行特征选择来提高预测的性能。
尽管通过将元启发式算法融入封装式的特征选择技术,能够在可接受的分类准确度上挑选出最优的特征子集,已经在许多同类发明中得到了验证。然而,普遍性存在的问题是,元启发式算法容易陷入局部最优。
鳌虾算法是近期提出的新颖的元启发式算法,与许多优秀的元启发式算法(如粒子群算法,蚁群算法,灰狼优化算法,鲸鱼优化算法等)相似,有着精简的结构,较高的并行性和鲁棒性。同样地,虽然螯虾算法收敛速度很快,但其存在容易陷入局部最优,搜索范围减少,种群多样性不足等问题。
发明内容
本发明的目的是针对现有的鳌虾算法存在的一些问题,提出一种基于多策略改进鳌虾算法的特征分类方法,以解决机械装配中的零件图像特征分类问题。
本发明的一个方面,是在最新提出的一种元启发式算法——鳌虾优化算法的基础上,对算法的结构进行了重新设计。鳌虾算法是一种启发式搜索算法,它的灵感来源于鳌虾(一种淡水虾类)在觅食和逃避天敌时表现出的行为特点。这种算法通过模拟鳌虾的行为,包括随机游动、跟随食物源和避免障碍等,来解决优化问题。
在优化问题的背景下,鳌虾算法被设计用来寻找问题的最优解或近似最优解。它通常包括多个鳌虾个体(即算法中的搜索代理),这些个体在解空间中移动,并根据目标函数的值调整自己的移动策略。通过迭代更新鳌虾的位置和状态,算法逐渐逼近问题的最优解。
具体的,本发明设计了三种改进策略,分别是:
(1)搜索-躲藏策略;(2)自适应螺旋精英贪婪反向学习策略;(3)组合混沌变异。
本发明改进的鳌虾算法能够在一定程度上避免局部最优解,同时提高了搜索范围和收敛速度。基于该算法设计的封装式特征选择器表现出了更为高效的分类准确度和更强的子集关联性。
本发明的完整技术方案至少包括如下步骤:
获得零件图像数据并分割数据;初始化种群及参数,应用转化函数;计算适应度函数值并定义当前迭代次数内的最优代理位置CfG、种群所有个体中的最优位置CfL和最优代理位置对应的最优值fitbest;进入主循环,设置迭代终止条件;使用自适应螺旋精英贪婪反向学习策略获得精英反向解,并进行贪婪选择;使用鳌虾算法的各个温度控制的位置更新策略,更新代理位置;使用混沌变异机制的位置更新策略;进行所有个体、所有维度的边界检查;更新全局最优代理位置和适应度值;当迭代次数达到预设的最大迭代次数时,退出循环,并输出结果;提取选择的特征,通过K-邻近分类器进行分类准确度评估。
在以上步骤中,获得零件图像数据并分割数据包括提取数据集中的特征数据,使用K-折交叉验证分割特征子集。K-折交叉验证是一种有效的模型评估方法,它不仅能够充分利用数据集,减少过拟合,提高评估稳定性,还可以用于模型选择和参数调优。K值的选择需要根据具体问题和数据集的特性来确定,过大的K值可能会增加计算开销,而过小的K值可能无法充分评估模型的性能。
其中,应用转化函数是将初始化种群以及参数转换成二进制数据,获得二进制代理。在鳌虾算法中,将代理转化为二进制形式并获得二进制代理的主要目的是为了更好地适应离散问题的求解,并优化搜索过程。许多优化问题,特别是组合优化问题,其解空间是离散的。二进制编码能够直接表示这些离散解,使得鳌虾算法能够直接在这些离散空间中进行搜索。二进制编码简化了搜索过程中的操作,如交叉、变异等。这些操作在二进制编码下变得更加直观和高效,提高了算法的搜索能力。
而且,二进制编码使得搜索空间的大小得到了明确的界定,这有助于算法更有效地探索解空间。同时,二进制编码的固定长度和固定值域使得算法在搜索过程中能够更精确地控制搜索步长和搜索方向。二进制编码使得鳌虾算法可以更容易地与其他基于二进制编码的算法进行集成,从而可以利用其他算法的优点来进一步提高鳌虾算法的性能。
在一些实施例中,以上过程是这样实现的:包括:
使用公式(1)获得初始化种群:
(1);
其中Cfi,j表示种群中第i个个体在第j维的位置,i=1,2,3…,N,j=1,2,3…dim;ubj和1bj分别表示搜索空间第j维的上下界;rand表示[0,1]之间的随机数,不包含1;
使用公式(2)将种群中的个体转化为二进制形式,获得二进制代理,具体为:
(2)。
进一步的,需要计算适应度函数值并定义当前迭代次数内的最优代理位置CfG、种群所有个体中的最优位置CfL和最优代理位置对应的最优值fitbest。其中,计算适应度函数值的目的是评估每个代理(或称为个体、解)在优化问题中的性能。适应度函数是一个衡量代理对问题求解质量的指标,它根据问题的特定要求定义,并用于指导算法的搜索过程。通过计算适应度函数值,算法可以比较不同代理之间的优劣,并根据这些值进行代理的选择、交叉、变异等操作。
在一些实施例中,使用如下公式(3)计算适应度函数值:
(3);
其中,fit_fun表示适应度函数值;feat_num指被选中的特征数量;feat_max指总的特征数量;,/>表示权重系数,其值分别为0.99和0.01;error表示分类错误率;
使用K-邻近算法定义的预测分类准确度,由公式(4)定义,具体为:
(4);
其中,Acc表示分类准确度,是由cc表示测试集数据的分类正确数;uc表示测试集数据的分类错误数。
更进一步的,作为本发明的关键步骤之一,在完成适应度函数值的计算后,使用自适应螺旋精英贪婪反向学习策略获得精英反向解,并进行贪婪选择。该策略通过结合螺旋搜索和精英贪婪选择机制,能够在全局范围内寻找问题的最优解。螺旋搜索方式有助于算法在解空间中以螺旋状的路径进行搜索,增加了搜索的多样性和广度,从而更容易找到全局最优解。
具体而言,该步骤的实现可以细分为如下步骤:
S6.1 精英定位,使用公式(5),具体为:
(5);
其中;a用来表征螺线中的起始位置;b用来控制螺距大小;t为当前迭代次数;T=max_it;ub,1b分别是搜索空间的上界和下界;rand是[0,1]之间的随机数;h为常数8;Cffood=CfG;Cfshade=(CfG+ CfL)/2;
S6.2 应用自适应螺旋反向学习获得备选解Cfin,定义起始位置为a,螺距为b,具体为公式(6):
(6);
其中,eps为接近0的极小常数;
S6.3 使用转换函数将备选解进行转换,如公式(7),具体为:
(7);
S6.4使用公式(8)执行贪婪选择,具体为:
(8);
其中,fit(Cfin)表示该备选解的适应度值,fit(Cfj)表示当前循环中某个代理第j维位置的适应度值。
另外,本发明中,根据温度控制因子temp选择鳌虾算法的位置更新策略;包括:当温度控制因子temp>=35时,改进鳌虾算法执行竞争阶段的位置更新策略;当温度控制因子30<=temp<35时,改进鳌虾算法执行避暑阶段的位置更新策略;当温度控制因子20<=temp<30时,改进鳌虾算法执行觅食阶段的位置更新策略;当temp<20时,算法进入搜索-躲藏策略。
其中,搜索-躲藏策略的实现过程如下:
使用公式(19)更新代理位置,具体为:
(19);
其中,c1,c2,代表当前种群随机个体的索引;K3由公式(20)定义,具体为:
(20);
其中,e为自然对数的底,H1为常数3。
作为本发明另一个关键步骤,使用混沌变异机制的位置更新策略。混沌变异利用混沌变量的遍历性,在搜索空间中产生具有混沌特性的扰动量,这使得算法能够在整个解空间中进行全局搜索,避免陷入局部最优解,提高了找到全局最优解的可能性。由于混沌运动的遍历性和随机性,混沌变异机制能够快速地在搜索空间中定位到接近最优解的区域,从而加速了算法的收敛速度。而且,混沌变异机制对于问题的初始条件和参数设置不敏感,具有较强的鲁棒性。这意味着算法在不同的问题和场景下都能保持稳定的性能,减少了因参数调整不当导致的算法失效风险。
在一些实施例中,混沌变异机制的实现过程包括:
S11.1定义当前适应度的平均值avgf;
S11.2对于当前所有个体,如果存在某个个体的适应度值小于当前适应度平均值,即fit(Cfi) < avgf,则对该代理使用公式(21)进行混沌变异操作,具体为:
(21);
其中,Cs是混沌系数,Gm为高斯变异算子,由公式(22)和公式(23)定义,具体为:
(22);
(23);
其中,为缩放因子,这里取为常数0.5;Gd是服从高斯分布的随机数;
S11.3同样地,将变异操作后得到的备选解使用公式(7)进行转换;
S11.4使用公式(8)执行贪婪选择得到Cfj。
进一步的,在一些实施例中,还包括进行所有个体、所有维度的边界检查;通过边界检查,可以确保算法在搜索过程中始终产生符合问题要求的解,避免无效解对算法性能产生负面影响。无效解通常不会为算法的搜索过程提供有价值的信息,甚至可能导致算法陷入死循环或产生错误的搜索方向。通过边界检查,可以及时发现并处理这些无效解,避免计算资源的浪费。
更进一步的,更新全局最优代理的位置和适应度值的目的是记录和追踪算法在搜索过程中找到的最佳解,以便在算法结束时能够输出最优解,并作为后续搜索过程的参考。具体来说,全局最优代理是指在所有搜索过的代理中具有最佳适应度函数值的代理。适应度函数值是衡量代理对问题求解质量的指标,较低的适应度函数值通常表示更好的解。通过不断更新全局最优代理的位置和适应度值,算法可以确保在搜索过程中始终跟踪并记录当前找到的最优解。
本发明的另一个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被执行时实现前述的基于多策略改进鳌虾算法的特征分类方法。
本发明的另一个方面,还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行所述程序时实现前述的基于多策略改进鳌虾算法的特征分类方法。
本发明的有益效果:
本发明采用了基于三种改进策略的鳌虾算法,通过K-邻近算法的评估,提高了特征选择技术的分类准确度和算法收敛性。通过搜索-躲藏策略,增强了算法的搜索能力,提高了算法遍历性;通过自适应螺旋精英贪婪反向学习策略,迅速增加了算法的收敛速度;通过混沌变异机制,增加了算法的种群多样性和跳出局部最优的能力。本发明采用的方法,在进行机械装配的零件图像特征选择的过程中,展现了分类精度好、收敛性强、鲁棒性高、计算代价小等优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本发明的范畴。
图1 本发明的一个实施例的提供的基于改进鳌虾算法的特征选择方法的流程图。
具体实施方式
以下将结合附图对本发明的较佳实施例进行详细说明,以便更清楚理解本发明的目的、特点和优点。应理解的是,附图所示的实施例并不是对本发明范围的限制,而只是为了说明本发明技术方案的实质精神。
在下文的描述中,出于说明各种公开的实施例的目的阐述了某些具体细节以提供对各种公开实施例的透彻理解。但是,相关领域技术人员将认识到可在无这些具体细节中的一个或多个细节的情况下来实践实施例。在其它情形下,与本申请相关联的熟知的装置、结构和技术可能并未详细地示出或描述从而避免不必要地混淆实施例的描述。
在整个说明书中对“一个实施例”或“一实施例”的提及表示结合实施例所描述的特定特点、结构或特征包括于至少一个实施例中。因此,在整个说明书的各个位置“在一个实施例中”或“在一实施例”中的出现无需全都指相同实施例。另外,特定特点、结构或特征可在一个或多个实施例中以任何方式组合。
实施例1:
一种基于改进鳌虾算法的零件图像特征选择方法,包括以下步骤:
S1获取数据集中待选择的特征数据,得到特征向量;使用5-折交叉验证函数将数据分割成5个子集。
S2根据数据形式定义种群大小N,最大迭代次数max_it,运行次数runtime,维度dim。
S3随机初始化种群,获得二进制代理,具体如下:
S3.1使用公式(1)获得初始化种群;
(1);
其中Cfi,j表示种群中第i个个体在第j维的位置,i=1,2,3…,N,j=1,2,3…dim;ubj和1bj分别表示搜索空间第j维的上下界;rand表示[0,1]之间的随机数,不包含1。
S3.2使用公式(2)将种群中的个体转化为二进制形式,即获得二进制代理,具体为:
(2);
S4计算适应度值,定义当前迭代次数内的最优代理位置CfG;种群所有个体中的最优位置CfL;最优代理位置对应的最优值fitbest。
S4.1使用公式(3)计算适应度函数值。具体为:
(3);
其中,fit_fun表示适应度函数值;feat_num指被选中的特征数量;feat_max指总的特征数量;,/>表示权重系数,其值分别为0.99和0.01;error表示分类错误率。
S4.2使用K-邻近算法定义的预测分类准确度,由公式(4)定义,具体为:
(4);
其中,Acc表示分类准确度,是由cc表示测试集数据的分类正确数;uc表示测试集数据的分类错误数。
S5进入主循环,设置迭代终止条件,即当迭代次数t大于最大迭代次数max_it时,跳出循环。
S6应用新增的自适应螺旋精英贪婪反向学习策略,具体为:
S6.1精英定位,精英定位搜索是围绕当前循环中的最优位置展开的随机定位,用于控制螺旋搜索的边界,使用公式(5),具体为:
(5);
其中;a用来表征螺线中的起始位置;b用来控制螺距大小;t为当前迭代次数;T=max_it;ub,lb分别是搜索空间的上界和下界;rand是[0,1]之间的随机数(在此说明书中,每个rand代表每次都使用一次rand指令。所以,每个rand的值大概率是不同的);h为常数8;Cffood=CfG;Cfshade=(CfG+ CfL)/2。
S6.2应用自适应螺旋反向学习获得备选解Cfin,定义起始位置为a,螺距为b,具体为公式(6):
(6);
其中,eps为接近0的极小常数。
S6.3使用转换函数将备选解进行转换,如公式(7),具体为:
(7);
S64使用公式(8)执行贪婪选择,具体为:
(8);
其中,fit(Cfin)表示该备选解的适应度值,fit(Cfj)表示当前循环中某个代理第j维位置的适应度值。
S7当温度控制因子temp>=35时,改进鳌虾算法执行竞争阶段的位置更新策略,如公式(9),具体为:
(9);
其中,t表示当前迭代次数;z表示种群中随机个体的索引,由公式(10)定义。
(10);
S8当温度控制因子30<=temp<35时,改进鳌虾算法执行避暑阶段的位置更新策略,如公式(10),具体为:
(11);
其中,C'见公式(5)。
S9当温度控制因子20<=temp<30时,改进鳌虾算法执行觅食阶段的位置更新策略。
S9.1使用公式(12)定义食物尺寸参数Q;使用公式(13)定义进食率的温度变量函数p,具体为:
(12);
(13);
其中,fit(Cfi)表示第i个个体的适应度函数值;fit(Cffood)表示食物位置的适应度函数值;E为标准食物尺寸,其值为常数3;p为不同温度下的进食率;代表了最适宜鳌虾觅食的温度,值为常数25;/>和C1用于控制不同温度下鳌虾的进食率,值分别3和0.2。
此外,使用公式(14)更新食物位置,具体为:
(14);
S9.2当P>2时,使用公式(15)更新代理位置,具体为:
(15);
S9.3当P<=2时,使用公式(16)更新代理位置,具体为:
(16);
其中,p和Q已在公式(12)和公式(13)中定义;K1由公式(17)定义;K2由公式公式(18)定义。具体为:
(17);
其中,w为常数,其值为4。
(18);
其中,h为常数,其值为4。
S10当temp<20时,算法进入搜索-躲藏策略,使用公式(19)更新代理位置,具体为:
(19);
其中,c1,c2,代表当前种群随机个体的索引;K3由公式(20)定义,具体为:
(20);
其中,e为自然对数的底,H1为常数3。
S11执行混沌变异机制,具体为:
S11.1定义当前适应度的平均值avgf。
S11.2对于当前所有个体,如果存在某个个体的适应度值小于当前适应度平均值,即fit(Cfi) < avgf,则对该代理使用公式(21)进行混沌变异操作,具体为:
(21);
其中,Cs是混沌系数,Gm为高斯变异算子,由公式(22)和公式(23)定义,具体为:
(22);
(23);
其中,为缩放因子,这里取为常数0.5;Gd是服从高斯分布的随机数。
S11.3同样地,将变异操作后得到的备选解使用公式(7)进行转换。
S11.4使用公式(8)执行贪婪选择得到Cfj。
S12使用公式(7),对所有个体的每个维度位置进行边界检查。
S13更新全局最优解的位置和适应度值,并储存;同时,t+1,返回S5。
S14提取经过算法选择的特征,通过k-邻近算法分类器对特征子集进行效果评估。
以下以UCI数据库中的8个真实来源数据集来验证本发明的有益效果,在计算机上实现本发明方法的程序实验验证,具体为以下方面:
1.数据集的详细信息以及评价指标
本实验使用的数据集信息如表1所示:
表1:数据集的详细信息
;
2.实验设置
在本实验中,设置最大迭代次数为100,为了保证求解结果的公平性,设置10次迭代次数,取最终结果的平均值。使用K-邻近算法分类器对选择的特征进行评估,评价指标具体有:平均适应度值(Avgf)、适应度值标准差(Stdf)、平均特征个数(AvgN)、平均特征个数标准差(StdN)、平均分类准确度(Avgacc%)。
3.实验对象
实验对象为改进的鳌虾算法(MCOA);经典的两种元启发式算法粒子群算法(PSO)和遗传算法(GA);近年来的新颖算法灰狼算法(GWO)、正余弦算法(SCA)、平衡优化(EO)、蝙蝠算法(BA);以及原始的鳌虾算法(COA)。
4. 实验结果比较
为了更好的展示实验结果对比的数据,对平均适应度,适应度值的标准差以及分类准确度的平均值的最优结果予以加粗显示,如表2所示:
表2:实验结果数据
,/>
;
从实验的结果来看,本发明所提供的方法在以上实施例中,均优于所比较的7种算法。对于所有的8个数据集,本发明中的方法均取得了最小的适应度平均值,以及最高的平均分类准确度。从改进后的鳌虾算法与原始鳌虾算法的比较结果来看,改进算法的结果全面领先于原算法,在适应度平均值和标准差以及分类准确度上均有着很大提升。同时,改进算法所选的特征数量结果也优于大部分所比较的算法。最后,从适应度值的标准差来看,改进鳌虾算法在7个数据集上均取得了最小的标准差,验证了其鲁棒性。
实施例2,本实施例还提供了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例1所述方法的步骤。
实施例3,本实施例还提供了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例1所述方法的步骤。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (6)
1.一种基于多策略改进鳌虾算法的特征分类方法,该方法应用于对机械装配的零件图像进行特征分类,其特征在于,包括:获得零件图像数据并分割数据;初始化种群及参数,应用转化函数;计算适应度函数值并定义当前迭代次数内的最优代理位置CfG、种群所有个体中的最优位置CfL和最优代理位置对应的最优值fitbest;进入主循环,设置迭代终止条件;使用自适应螺旋精英贪婪反向学习策略获得精英反向解,并进行贪婪选择;使用鳌虾算法的各个温度控制的位置更新策略,更新代理位置;使用混沌变异机制的位置更新策略;进行所有个体、所有维度的边界检查;更新全局最优代理位置和适应度值;当迭代次数达到预设的最大迭代次数时,退出循环,并输出结果;提取选择的特征,通过K-邻近分类器进行分类准确度评估;
所述使用自适应螺旋精英贪婪反向学习策略获得精英反向解,并进行贪婪选择包括如下步骤:
S6.1 精英定位,使用公式(5),具体为:
(5);
其中;a用来表征螺线中的起始位置;b用来控制螺距大小;t为当前迭代次数;T=max_it;ub,1b分别是搜索空间的上界和下界;rand是[0,1]之间的随机数;h为常数8;Cffood=CfG;Cfshade=(CfG+ CfL)/2;
S6.2 应用自适应螺旋反向学习获得备选解Cfin,定义起始位置为a,螺距为b,具体为公式(6):
(6);
其中,eps为接近0的极小常数;
S6.3 使用转换函数将备选解进行转换,如公式(7),具体为:
(7);
S6.4使用公式(8)执行贪婪选择,具体为:
(8);
其中,fit(Cfin)表示该备选解的适应度值,fit(Cfj)表示当前循环中某个代理第j维位置的适应度值;
根据温度控制因子temp选择鳌虾算法的位置更新策略;包括:当温度控制因子temp>=35时,改进鳌虾算法执行竞争阶段的位置更新策略;当温度控制因子30<=temp<35时,改进鳌虾算法执行避暑阶段的位置更新策略;当温度控制因子20<=temp<30时,改进鳌虾算法执行觅食阶段的位置更新策略;当temp<20时,算法进入搜索-躲藏策略;
所述搜索-躲藏策略的实现过程如下:
使用公式(19)更新代理位置,具体为:
(19);
其中,c1,c2,代表当前种群随机个体的索引;K3由公式(20)定义,具体为:
(20);
其中,e为自然对数的底,H1为常数3;
所述使用混沌变异机制的位置更新策略包括:
S11.1定义当前适应度的平均值avgf;
S11.2对于当前所有个体,如果存在某个个体的适应度值小于当前适应度平均值,即fit(Cfi) < avgf,则对该代理使用公式(21)进行混沌变异操作,具体为:
(21);
其中,Cs是混沌系数,Gm为高斯变异算子,由公式(22)和公式(23)定义,具体为:
(22);
(23);
其中,为缩放因子,这里取为常数0.5;Gd是服从高斯分布的随机数;
S11.3同样地,将变异操作后得到的备选解使用公式(7)进行转换;
S11.4使用公式(8)执行贪婪选择得到Cfj。
2.根据权利要求1所述的基于多策略改进鳌虾算法的特征分类方法,其特征在于,所述获得零件图像数据并分割数据包括提取数据集中的特征数据,使用K-折交叉验证分割特征子集。
3.根据权利要求1所述的基于多策略改进鳌虾算法的特征分类方法,其特征在于,所述应用转化函数是将初始化种群以及参数转换成二进制数据,包括:
使用公式(1)获得初始化种群:
(1);
其中Cfi,j表示种群中第i个个体在第j维的位置,i=1,2,3…,N,j=1,2,3…dim;ubj和1bj分别表示搜索空间第j维的上下界;rand表示[0,1]之间的随机数,不包含1;
使用公式(2)将种群中的个体转化为二进制形式,获得二进制代理,具体为:
(2)。
4.根据权利要求1所述的基于多策略改进鳌虾算法的特征分类方法,其特征在于,使用如下公式(3)计算适应度函数值:
(3);
其中,fit_fun表示适应度函数值;feat_num指被选中的特征数量;feat_max指总的特征数量;,/>表示权重系数,其值分别为0.99和0.01;error表示分类错误率;
使用K-邻近算法定义的预测分类准确度,由公式(4)定义,具体为:
(4);
其中,Acc表示分类准确度,是由cc表示测试集数据的分类正确数;uc表示测试集数据的分类错误数。
5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被执行时实现如权利要求1-4中任意一项所述的基于多策略改进鳌虾算法的特征分类方法。
6.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-4中任意一项所述的基于多策略改进鳌虾算法的特征分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410309215.5A CN117911799B (zh) | 2024-03-19 | 2024-03-19 | 一种基于多策略改进鳌虾算法的特征分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410309215.5A CN117911799B (zh) | 2024-03-19 | 2024-03-19 | 一种基于多策略改进鳌虾算法的特征分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117911799A CN117911799A (zh) | 2024-04-19 |
CN117911799B true CN117911799B (zh) | 2024-05-17 |
Family
ID=90684189
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410309215.5A Active CN117911799B (zh) | 2024-03-19 | 2024-03-19 | 一种基于多策略改进鳌虾算法的特征分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117911799B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110097169A (zh) * | 2019-05-08 | 2019-08-06 | 河南大学 | 一种混合abc和cro的高维特征选择方法 |
WO2020190736A1 (en) * | 2019-03-15 | 2020-09-24 | Rct Studio Inc. | Methods, systems, and apparatuses for production of an interactive movie |
CN112926139A (zh) * | 2021-03-23 | 2021-06-08 | 中国人民解放军火箭军工程大学 | 一种基于混沌映射和黄金正弦策略的改进麻雀智能优化方法 |
CN115662642A (zh) * | 2022-10-23 | 2023-01-31 | 郑州轻工业大学 | 基于改进樽海鞘算法的食管癌生存期预测模型的构建与应用 |
CN115981336A (zh) * | 2023-02-03 | 2023-04-18 | 重庆大学 | 工业机器人轨迹规划中的耦合插值函数选择方法 |
CN116454995A (zh) * | 2023-04-24 | 2023-07-18 | 国网浙江省电力有限公司丽水供电公司 | 基于麻雀搜索算法的微电网能量优化调度方法及设备 |
CN116842337A (zh) * | 2023-06-13 | 2023-10-03 | 国网甘肃省电力公司 | 基于LightGBM优选特征与COA-CNN模型的变压器故障诊断方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10881463B2 (en) * | 2017-08-30 | 2021-01-05 | International Business Machines Corporation | Optimizing patient treatment recommendations using reinforcement learning combined with recurrent neural network patient state simulation |
-
2024
- 2024-03-19 CN CN202410309215.5A patent/CN117911799B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020190736A1 (en) * | 2019-03-15 | 2020-09-24 | Rct Studio Inc. | Methods, systems, and apparatuses for production of an interactive movie |
CN110097169A (zh) * | 2019-05-08 | 2019-08-06 | 河南大学 | 一种混合abc和cro的高维特征选择方法 |
CN112926139A (zh) * | 2021-03-23 | 2021-06-08 | 中国人民解放军火箭军工程大学 | 一种基于混沌映射和黄金正弦策略的改进麻雀智能优化方法 |
CN115662642A (zh) * | 2022-10-23 | 2023-01-31 | 郑州轻工业大学 | 基于改进樽海鞘算法的食管癌生存期预测模型的构建与应用 |
CN115981336A (zh) * | 2023-02-03 | 2023-04-18 | 重庆大学 | 工业机器人轨迹规划中的耦合插值函数选择方法 |
CN116454995A (zh) * | 2023-04-24 | 2023-07-18 | 国网浙江省电力有限公司丽水供电公司 | 基于麻雀搜索算法的微电网能量优化调度方法及设备 |
CN116842337A (zh) * | 2023-06-13 | 2023-10-03 | 国网甘肃省电力公司 | 基于LightGBM优选特征与COA-CNN模型的变压器故障诊断方法 |
Non-Patent Citations (2)
Title |
---|
Chaotic Maps and Meta-heuristic Algorithms;Ali Kaveh等;《Chaotic Meta-heuristic Algorithms for Optimal Design of Structures》;20240130;13-26 * |
Crayfsh optimization algorithm;Heming Jia等;《Artificial Intelligence Review》;20230902;第56卷;1919–1979 * |
Also Published As
Publication number | Publication date |
---|---|
CN117911799A (zh) | 2024-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | A return-cost-based binary firefly algorithm for feature selection | |
Soviany et al. | Curriculum learning: A survey | |
Gosselin et al. | Active learning methods for interactive image retrieval | |
CN110704636B (zh) | 一种改进的基于Node2vec的知识图谱向量表示方法 | |
Wang et al. | SPLBoost: An improved robust boosting algorithm based on self-paced learning | |
US20200074296A1 (en) | Learning to search deep network architectures | |
CN112732864B (zh) | 一种基于稠密伪查询向量表示的文档检索方法 | |
CN110705640A (zh) | 一种基于黏菌算法构建预测模型的方法 | |
Liu et al. | Deep Boltzmann machines aided design based on genetic algorithms | |
CN111079074A (zh) | 一种基于改进的正弦余弦算法构建预测模型的方法 | |
CN110738362A (zh) | 一种基于改进的多元宇宙算法构建预测模型的方法 | |
Szwarcman et al. | Quantum-inspired evolutionary algorithm applied to neural architecture search | |
Weng et al. | Online hashing with bit selection for image retrieval | |
Braik et al. | An improved hybrid chameleon swarm algorithm for feature selection in medical diagnosis | |
CN110751257A (zh) | 一种基于饥饿游戏搜索算法构建预测模型的方法 | |
CN117911799B (zh) | 一种基于多策略改进鳌虾算法的特征分类方法 | |
Peng et al. | Quintuple-media joint correlation learning with deep compression and regularization | |
Hu et al. | PWSNAS: Powering weight sharing NAS with general search space shrinking framework | |
CN114863508A (zh) | 自适应注意力机制的表情识别模型生成方法、介质及设备 | |
CN114662693A (zh) | 一种基于动作采样的强化学习知识图谱推理方法 | |
Xue et al. | Fast and unsupervised neural architecture evolution for visual representation learning | |
CN110727768B (zh) | 一种候选回答语句生成和自然语言选择方法及系统 | |
Punjabi et al. | Enhancing Performance of Lazy Learner by Means of Binary Particle Swarm Optimization | |
Mäntykivi | Genetic Operators in Chain-Structured Neural Architecture Search | |
Sidheekh et al. | Building Expressive and Tractable Probabilistic Generative Models: A Review |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |