CN111523684A - 一种基于支持向量机和杂草算法结合的目标分类方法 - Google Patents

一种基于支持向量机和杂草算法结合的目标分类方法 Download PDF

Info

Publication number
CN111523684A
CN111523684A CN202010300123.2A CN202010300123A CN111523684A CN 111523684 A CN111523684 A CN 111523684A CN 202010300123 A CN202010300123 A CN 202010300123A CN 111523684 A CN111523684 A CN 111523684A
Authority
CN
China
Prior art keywords
support vector
vector machine
parent
weed
population
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010300123.2A
Other languages
English (en)
Inventor
刘磊
赵彦峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Zhuoyu Intelligent Technology Co ltd
Original Assignee
Nanjing Zhuoyu Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Zhuoyu Intelligent Technology Co ltd filed Critical Nanjing Zhuoyu Intelligent Technology Co ltd
Priority to CN202010300123.2A priority Critical patent/CN111523684A/zh
Publication of CN111523684A publication Critical patent/CN111523684A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及机器学习及目标分类领域,具体涉及一种基于支持向量机和杂草算法结合的目标分类方法,包括杂草算法优化步骤、支持向量机进行二分类步骤,杂草算法优化步骤包括种群初始化、生长繁殖、空间扩散、竞争排斥、重复。本发明的有益效果:利用杂草算法不断调优核函数参数的选择,能够快速找到支持向量机核函数的最优参数,从而支持向量机在目标分类过程中精度更高,可靠性高,精度高,适应面广泛。

Description

一种基于支持向量机和杂草算法结合的目标分类方法
技术领域
本发明涉及机器学习及目标分类领域,具体涉及一种基于支持向量机和杂草算法结合的目标分类方法。
背景技术
支持向量机(SVM)是90年代中期发展起来的基于统计学习理论的一种机器学习方法,通过寻求结构化风险最小来提高学习机泛化能力,实现经验风险和置信范围的最小化,从而达到在统计样本量较少的情况下,亦能获得良好统计规律的目的。在机器学习领域用于目标分类中应用较为广泛,在高维数据中以及线性不可分时,还会用到核函数,把低维度数据映射到高维数据空间,但此时核函数的参数选择对分类精度至关重要。支持向量机在人像识别、文本分类等模式识别(pattern recognition)问题中应用广泛。特别是在目标分类中,判断目标物是否出现在图像中,都得到广泛使用,用支持向量机(SVM)进行目标分类依然是学术界热点研究的方向,在实践中,人工智能领域也有众多支持向量机应用的案例。一些线性不可分的问题可能是非线性可分的,即特征空间存在超曲面将正类和负类分开。使用非线性函数可以将非线性可分问题从原始的特征空间映射到更高维的希尔伯特空间。特别是当数据维数较高在平面上利用SVM二分类难以区分时,就要引进核函数,将数据升到更高维度,以让数据可分。而对于核函数的选择,基本靠主管经验给其随意赋值,往往核函数的参数值选择不当,将会大大降低分类精度,导致训练时迭代时间过长。
发明内容
本发明的目的在于克服现有技术中存在的问题,提供一种基于支持向量机和杂草算法结合的目标分类方法,它可以实现至少一定程度上解决现有技术的问题。
为实现上述技术目的,达到上述技术效果,本发明是通过以下技术方案实现的:
一种基于支持向量机和杂草算法结合的目标分类方法,包括:
1)杂草算法优化步骤
1.1)种群初始化,一定数目的杂草以随机方式在D维空间扩散分布;
1.2)生长繁殖,每个杂草种子生长到开花,然后根据其适应性产生种子,父代杂草产生的种子个数与母体的适应度成线性关系;
1.3)空间扩散,以父代为轴线(均值),子代个体以正态分布方式扩散在D维空间中,迭代过程中,每一代的标准差按如下规律进行变化,
Figure BDA0002453672940000021
Figure BDA0002453672940000022
其中:σiter为第iter次迭代的标准差值,σinitial为起始标准差值,σfinal为最终标准差值,itermax为最大迭代次数,n为非线性调和指数;
1.4)竞争排斥,经过数代的繁殖后,克隆产生的后代数目将超过环境资源的承受能力,通过预先设定的最大种群数目确定最大种群大小,当达到最大种群数目时先按前面规则自由繁殖,扩散完成后,再将父代和子代一起进行排列,按适应值大小进行淘汰,以达到种群上限要求;
1.5):重复步骤1.2)至步骤1.4),直至满足设定的最优解条件或者达到最大迭代次数;
2)支持向量机进行二分类步骤
设所求的分类面表达式为:
Figure BDA0002453672940000031
该分类面若能将训练样本线性分开,则:
Figure BDA0002453672940000032
Figure BDA0002453672940000033
对于有限个数的样本,存在ε,s.t.
Figure BDA0002453672940000034
即:
Figure BDA0002453672940000035
Figure BDA0002453672940000036
其中
Figure BDA0002453672940000037
综上所述,线性SVM的数学模型可以描述为:
给定的训练样本集(x1,y1),......,(xl,yl)yi∈{+1,-1}
本质上是求解如下优化问题:
优化目标:
Figure BDA0002453672940000038
约束条件:yi(<w,xi>+b)≥1i=1,2,3,......,l,引进核函数,将内积从<x(i),x>,映射到<φ(x(i)),φ(x)>。
本发明的有益效果:利用杂草算法不断调优核函数参数的选择,能够快速找到支持向量机核函数的最优参数,从而支持向量机在目标分类过程中精度更高,可靠性高,精度高,适应面广泛。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
杂草算法即Invasive Weed Optimization,是伊朗德黑兰大学的A.R.Mehrabian以及C.Lucas在2006于Ecological Informatics杂志上发表论文《A novel numericaloptimization algorithm inspired from weed colonization》中首次提出。所谓杂草是指那些生长力旺盛的、具有入侵性的、对栽培的农作物构成严重威胁的植物。数千年的历史可以说明,杂草是一个“永远的赢家”:人类耕作以及手工除杂草已经有数千年的历史了,但杂草还是存在于地球每个角落;除草剂诞生六十多年了,但杂草还是存在于地球每个角落;杂草具有超强的生存能力以及自我改造能力(近年来除草剂抗性杂草的诞生就是很好的佐证)。
杂草入侵的一般过程是:适应环境、乘机居留、占据地盘、结籽繁殖、扶养种群、随机应变、逐渐密集、适者生存、竞争消亡,适应性好的个体获得更多的生存机会。占据一定区域的杂草克隆行为的一般特征如下:农作物没有充分利用的资源为杂草创造了发展空间;杂草通过种子扩散抓住机会进入地里,进而通过繁殖而不断的殖民,最终控制整块土地;生物多样性使杂草具有很好地夺取有利生存空间的特性,随着时间的推移,通过自然选择和竞争生存,成为本地化改进的杂草;杂草总能在农季开始的最佳时间在植物群落中最大化其适应性。
在杂草的入侵过程中,相邻植株会由于生长年限、植株大小和相对距离而相互影响。因此,植物的出生、成长和繁殖会受到植株密度、种群和植物群的适应性的影响。在植物群落中,适应性的3个主要因素(繁殖、与竞争者进行生存斗争和躲避天敌)是相互矛盾的。适应性的提高可以使植物能够生存更长时间,而对于植物适应性的估计必须考虑以上3个因素。植物的自然进化选择方式有多种,其中有两种选择方式比较重要,分别是r选择和k选择。r选择是要从植物群中选择出能够长得快、繁殖快和消亡快的植物并让这些植物去占据不稳定的和不可预测的环境,k选择是要从植物群中选择出能够长得慢、繁殖慢和消亡慢的具有很强的竞争性的植物去占据一个具有高竞争压力、资源有限、稳定的和可预测的环境。r选择对应于杂草算法的全局探索方式,k选择对应于杂草算法的局部搜索方式。
一种基于支持向量机和杂草算法结合的目标分类方法,包括:
1)杂草算法优化步骤
1.1)种群初始化,一定数目的杂草以随机方式在D维空间扩散分布;
1.2)生长繁殖,每个杂草种子生长到开花,然后根据其适应性产生种子,父代杂草产生的种子个数与母体的适应度成线性关系;
1.3)空间扩散,以父代为轴线(均值),子代个体以正态分布方式扩散在D维空间中,迭代过程中,每一代的标准差按如下规律进行变化,
Figure BDA0002453672940000051
Figure BDA0002453672940000052
其中:σiter为第iter次迭代的标准差值,σinitial为起始标准差值,σfinal为最终标准差值,itermax为最大迭代次数,n为非线性调和指数;
1.4)竞争排斥,经过数代的繁殖后,克隆产生的后代数目将超过环境资源的承受能力,通过预先设定的最大种群数目确定最大种群大小,当达到最大种群数目时先按前面规则自由繁殖,扩散完成后,再将父代和子代一起进行排列,按适应值大小进行淘汰,以达到种群上限要求;
1.5):重复步骤1.2)至步骤1.4),直至满足设定的最优解条件或者达到最大迭代次数;
2)支持向量机进行二分类步骤,支持向量机通俗来讲,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,即支持向量机的学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。
设所求的分类面表达式为:
Figure BDA0002453672940000061
该分类面若能将训练样本线性分开,则:
Figure BDA0002453672940000062
Figure BDA0002453672940000063
对于有限个数的样本,存在ε,s.t.
Figure BDA0002453672940000064
即:
Figure BDA0002453672940000065
Figure BDA0002453672940000066
其中
Figure BDA0002453672940000067
综上所述,线性SVM的数学模型可以描述为:
给定的训练样本集(x1,y1),......,(xl,yl)yi∈{+1,-1}
本质上是求解如下优化问题:
优化目标:
Figure BDA0002453672940000068
约束条件:yi(<w,xi>+b)≥1i=1,2,3,......,l,而在实际中,数据在低维往往是不可分的。为此,需引进核函数,即需要把内积从<x(i),x>,映射到<φ(x(i)),φ(x)>。引入核函数的重要原因是样例可能存在线性不可分的情况,而将特征映射到高维空间后,往往就可分了,引入的高斯核函数
Figure BDA0002453672940000069
也叫做径向基函数(RadialBasis Function简称RBF)。它能够把原始特征映射到无穷维。
根据野草算法初始值的选择,其检测出的分类的正确率会有很大的偏差,当初始值选择在0附近时,其正确率在第二代发生错误。当初始值选择在10附近时,其正确率一直保持在100%,当其值选择在10^4附近时,正确率稳定在56%。由此可见野草算法其初始值的选择对结果影响很大。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims (1)

1.一种基于支持向量机和杂草算法结合的目标分类方法,其特征在于,包括:
1)杂草算法优化步骤
1.1)种群初始化,一定数目的杂草以随机方式在D维空间扩散分布;
1.2)生长繁殖,每个杂草种子生长到开花,然后根据其适应性产生种子,父代杂草产生的种子个数与母体的适应度成线性关系;
1.3)空间扩散,以父代为轴线(均值),子代个体以正态分布方式扩散在D维空间中,迭代过程中,每一代的标准差按如下规律进行变化,
Figure FDA0002453672930000011
Figure FDA0002453672930000012
其中:σiter为第iter次迭代的标准差值,σinitial为起始标准差值,σfinal为最终标准差值,itermax为最大迭代次数,n为非线性调和指数;
1.4)竞争排斥,经过数代的繁殖后,克隆产生的后代数目将超过环境资源的承受能力,通过预先设定的最大种群数目确定最大种群大小,当达到最大种群数目时先按前面规则自由繁殖,扩散完成后,再将父代和子代一起进行排列,按适应值大小进行淘汰,以达到种群上限要求;
1.5):重复步骤1.2)至步骤1.4),直至满足设定的最优解条件或者达到最大迭代次数;
2)支持向量机进行二分类步骤
设所求的分类面表达式为:
Figure FDA0002453672930000013
该分类面若能将训练样本线性分开,则:
Figure FDA0002453672930000014
Figure FDA0002453672930000021
对于有限个数的样本,存在ε,s.t.
Figure FDA0002453672930000022
即:
Figure FDA0002453672930000023
其中
Figure FDA0002453672930000024
综上所述,线性SVM的数学模型可以描述为:
给定的训练样本集(x1,y1),......,(xl,yl)yi∈{+1,-1}
本质上是求解如下优化问题:
优化目标:
Figure FDA0002453672930000025
约束条件:yi(<w,xi>+b)≥1i=1,2,3,......,l,引进核函数,将内积从<x(i),x>,映射到<φ(x(i)),φ(x)>。
CN202010300123.2A 2020-04-16 2020-04-16 一种基于支持向量机和杂草算法结合的目标分类方法 Pending CN111523684A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010300123.2A CN111523684A (zh) 2020-04-16 2020-04-16 一种基于支持向量机和杂草算法结合的目标分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010300123.2A CN111523684A (zh) 2020-04-16 2020-04-16 一种基于支持向量机和杂草算法结合的目标分类方法

Publications (1)

Publication Number Publication Date
CN111523684A true CN111523684A (zh) 2020-08-11

Family

ID=71901344

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010300123.2A Pending CN111523684A (zh) 2020-04-16 2020-04-16 一种基于支持向量机和杂草算法结合的目标分类方法

Country Status (1)

Country Link
CN (1) CN111523684A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112100861A (zh) * 2020-09-22 2020-12-18 河南中烟工业有限责任公司 基于入侵杂草优化算法的卷烟生产物料货位分配方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘自鹏等: "差分杂草算法优化SVM 的模拟电路故障诊断", 《信息技术》, pages 134 - 137 *
李云峰: "混合粒子群算法优化支持向量机电路故障诊断", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 1, pages 30 - 32 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112100861A (zh) * 2020-09-22 2020-12-18 河南中烟工业有限责任公司 基于入侵杂草优化算法的卷烟生产物料货位分配方法
CN112100861B (zh) * 2020-09-22 2024-05-14 河南中烟工业有限责任公司 基于入侵杂草优化算法的卷烟生产物料货位分配方法

Similar Documents

Publication Publication Date Title
Williams Sex and Evolution.(MPB-8), Volume 8
MacARTHUR Patterns of communities in the tropics
Ricklefs et al. Ecology
Hewitt et al. The fishery on Antarctic krill: defining an ecosystem approach to management
Purcell et al. Gradients of precipitation and ant abundance may contribute to the altitudinal range limit of subsocial spiders: insights from a transplant experiment
Krakauer et al. Successfully mating male sage-grouse show greater laterality in courtship and aggressive interactions
HARA Growth of individuals in plant populations
CN111523684A (zh) 一种基于支持向量机和杂草算法结合的目标分类方法
Mousavirad et al. Entropy based optimal multilevel thresholding using cuckoo optimization algorithm
Vandermeer Confronting complexity in agroecology: simple models from Turing to Simon
Firbank What is sustainable agriculture?
Dumonceaux Extraterrestrial Extrapolations of Earthly Organismality
Beattie Investigations into the occurrence of midge plagues in the vicinity of Harderwijk (Netherlands)
Qoni’ah et al. Selection of M5 short-stemmed mutants from 200 gray gamma ray irradiation in Mentik Wangi rice
Freitag Seaweed Farming in Alaska
Zhang et al. An Improved Squirrel Search Algorithm with Reproduction and Competition Mechanisms
El-Masry et al. Automatic liver CT image clustering based on invasive weed optimization algorithm
Mohammadiyan et al. Enhancing the accuracy of firefly algorithm by using the reproduction mechanism
Pyke STUDIES IN THE FORAGING EFFICIENCY OF ANIMALS.
Abdeyazdan et al. An Investigation and Comparison of Invasive Weed, Flower Pollination and Krill Evolutionary Algorithms
Hutt et al. Artificial evolution of visually guided foraging behaviour
Pozza et al. NEURONAL NETWORKS TO DESCRIBE EPIDEMICS OF COCOA WITCHES’BROOM
Gambardella et al. Searching for Designs in-between
Pratama et al. The Dynamics and Harvesting Effect Population One Prey Two Predator with Schooling Behavior
Hargrove et al. Bed fishing for Florida Bass: FA204, 5/2018

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination