CN107527071A - 一种基于花朵授粉算法优化模糊k近邻的分类方法及装置 - Google Patents

一种基于花朵授粉算法优化模糊k近邻的分类方法及装置 Download PDF

Info

Publication number
CN107527071A
CN107527071A CN201710742480.2A CN201710742480A CN107527071A CN 107527071 A CN107527071 A CN 107527071A CN 201710742480 A CN201710742480 A CN 201710742480A CN 107527071 A CN107527071 A CN 107527071A
Authority
CN
China
Prior art keywords
mrow
fuzzy
optimized
msub
pollen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710742480.2A
Other languages
English (en)
Inventor
马超
于成龙
韩丽屏
关键
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Information Technology
Original Assignee
Shenzhen Institute of Information Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Information Technology filed Critical Shenzhen Institute of Information Technology
Priority to CN201710742480.2A priority Critical patent/CN107527071A/zh
Publication of CN107527071A publication Critical patent/CN107527071A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

本发明属于计算机技术领域,提供了一种基于花朵授粉算法优化模糊K近邻的分类方法及装置,方法包括:对收集的数据进行归一化;利用花朵授粉算法优化模糊K近邻的近邻个数k和模糊强度系数m,得到优化后的近邻个数k和优化后的模糊强度系数m;基于优化后的近邻个数k和优化后的模糊强度系数m,构建模糊K近邻的分类模型;根据构建的所述分类模型进行数据分类。通过本发明的技术方案,将花朵授粉算法融入模糊K近邻以找到近邻个数k和模糊强度系数m的最优值,构建出分类精度更高且泛化能力更强的分类模型,提高了分类精度,从而解决了现有技术中难以确定模糊K近邻的近邻个数k和模糊强度系数m,导致分类精度较低的问题。

Description

一种基于花朵授粉算法优化模糊K近邻的分类方法及装置
技术领域
本发明属于计算机技术领域,尤其涉及一种基于花朵授粉算法优化模糊K近邻的分类方法及装置。
背景技术
目前已有的分类方法主要基于人工神经网络、基于贝叶斯网络、基于支持向量机等方法,这些方法都取得了较好的分类效果。其中,基于人工神经网络的方法能够很好地处理非线性数据,因此具有较好的泛化能力,但人工神经网络中的输入层和隐藏层的权重值很难确定,传统采用的梯度下降方法很容易陷入局部极值而找不到全局最优解,参数值较多,需要花费大量时间训练调整。支持向量机使用广泛,其分类结果也较好,这两类是较主流的方法。但是这些模型结构复杂,具有黑箱性质,分类过程缺乏透明度。而模糊K近邻是一种简单、易理解、且能得到较高分类精度的分类方法。相比于人工神经网络,模糊K近邻涉及的参数较少,不需要训练调整那么多输入层和隐藏层的权重值,具有较快的训练速度,基于模糊K近邻的分类精度相比其他方法也更高。
然而,现有研究表明模糊K近邻的性能易受到两个参数的影响,分别是近邻个数和模糊强度系数,近邻个数用于确定其临近样本的数量,所述优化后的模糊强度系数基于近邻的距离为每个类别的样本分配不同的隶属度,离待测样本近的样本比较远的样本具有更大的隶属度。这两个参数在模型构建和分类时需要提前设定,如何选取最优的近邻个数和最优的模糊强度系数,一直是值得研究的问题,并未得到很好的解决。当前通常采用的方法是通过实验多次尝试设定固定的数值,这种方法设定的值如果设置不当会导致分类精度的降低,难以保证分类模型的分类精度达到最优。
发明内容
本发明的目的在于提供一种基于花朵授粉算法优化模糊K近邻的分类方法及装置,旨在解决现有技术中难以确定模糊K近邻的近邻个数和模糊强度系数,导致模型分类精度不高的问题。
本方面的第一方面,提供基于花朵授粉算法优化模糊K近邻的分类方法,包括:
对获取预定数量的数据样本进行归一化处理;
基于归一化后的所述数据样本,利用花朵授粉算法优化模糊K近邻的近邻个数k和模糊强度系数m,得到优化后的近邻个数k和优化后的模糊强度系数m,所述优化后的近邻个数k用于确定其临近样本的数量,所述优化后的模糊强度系数m基于近邻的距离为每个类别的样本分配不同的隶属度,离待测样本近的样本比较远的样本具有更大的隶属度;
基于所述优化后的近邻个数k和模糊强度系数m,构建所述模糊K近邻的分类模型;
根据所述分类模型对未分类数据进行分类。
本发明的第二方面,提供一种基于花朵授粉算法优化模糊K近邻的分类装置,包括:
数据归一化模块,用于对给定的数据集进行归一化处理;
花朵授粉优化模块,用于基于归一化后的所述数据,通过花朵授粉算法优化模糊K近邻的近邻个数k和模糊强度系数m,得到优化后的近邻个数k和优化后的模糊强度系数m,所述优化后的近邻个数k用于确定其临近样本的数量,所述优化后的模糊强度系数m基于近邻的距离为每个类别的样本分配不同的隶属度,离待测样本近的样本比较远的样本具有更大的隶属度;
模型构建模块,用于基于所述优化后的近邻个数k和优化后的模糊强度系数m构建所述模糊K近邻的分类模型;
分类模块,用于根据所述分类模型对未分类数据进行分类。
本发明的第三方面,提供一种计算机终端设备,包括:
存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如前所述基于花朵授粉算法优化模糊K近邻的分类方法的步骤。
本发明的第四方面,提供一种计算机可读存储介质,包括:
所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如前所述基于花朵授粉算法优化模糊K近邻的分类方法的步骤。
本发明与现有技术相比存在的有益效果是:通过将花朵授粉算法融入到模糊K近邻中以确定模糊K近邻的近邻个数和模糊强度系数,由于花朵授粉算法通过模拟自然界中花朵授粉现象设计出的启发式算法,通过异花授粉和自花授粉两种方式的切换权衡全局搜索和局部搜索的比重,从而获得问题的最优解,具有更强的鲁棒性和搜索能力,能够找出模糊K近邻的近邻个数和模糊强度系数的最优值,从而构建出分类精度更高的模糊K近邻分类模型,极大提高分类的准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种基于花朵授粉算法优化模糊K近邻的分类方法的说明图;
图2是本发明实施例提供的一种基于花朵授粉算法优化模糊K近邻的分类方法的详细步骤示意图;
图3是本发明实施例提供的一种基于花朵授粉算法优化模糊K近邻的分类装置的结构示意图;
图4是本发明实施例提供的计算机终端设备的示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清晰,现通过附图和实施例对本发明作进一步的详细描述。应当理解,此处所描述的具体实施仅仅用以解释本方面,并不用于限定本发明。
以下结合具体附图对本发明的实现进行详细的描述。
实施例一:
本发明实施例的前提是已获得了给定数量的数据样本的特征描述以及相应的特征值。
图1为本发明实施例提供的一种基于花朵授粉算法优化模糊K近邻的分类方法的说明图,本实施例主要包括以下步骤:
步骤S101,根据给定的数据集,进行每一个数据属性特征归一化处理,将所有特征值都映射到[0,1]区间内,避免较大特征值对较小特征值造成的扰动,使得归一化处理后的数据样本能够有效的支撑花朵授粉算法的优化运算。
优选地,可以按照如下公式(1)对数据进行归一化处理:
其中,x表示数据样本,并且x的样本容量已提前确定,x(i)’为第i个属性特征归一化后的特征值,x(i)为所述数据样本x的第i个属性特征的特征值,x(i)max为所述数据样本x第i个属性特征的最大值,x(i)min为所述给定数量的x第i个属性特征的最小值。
步骤S102,基于归一化处理后的数据集,利用花朵授粉算法优化模糊K近邻的近邻个数和模糊强度系数,得到有优化后的近邻个数和优化后的模糊强度系数,所述优化后的近邻个数k用于确定其临近样本的数量,所述优化后的模糊强度系数m基于近邻的距离为每个类别的样本分配不同的隶属度,离待测样本近的样本比较远的样本具有更大的隶属度。
优选地,花朵授粉算法的过程是根据归一化后的数据集来计算植物花朵的位置,授粉方式分为异花授粉和自花授粉,异花授粉发生在两株相距很远的花朵间,由蜜蜂等运载花粉完成授粉,自花授粉常见于雌雄同株的植物,异花授粉和自花授粉分别对应算法空间的全局搜索和局部搜索过程,通过切换概率P来权衡两种授粉行为的比重,进而完成植物花朵的位置的更新,每更新一次位置即完成一次迭代过程,并得到植物花朵的新位置集合,反复迭代直到达到最大迭代次数Maxiter为止。
每个花粉的位置由两个参数组成,k和m分别为近邻个数和优化后的模糊强度系数,近邻个数k用于确定其临近样本的数量,模糊强度系数m基于近邻的距离为每个类别的样本分配不同的隶属度。因此,在通过花朵授粉算法得到植物花朵的最终位置集合中,输出的最优花粉位置对应的两个参数即为优化后的近邻个数和优化后的模糊强度系数。
步骤S103,基于优化后的近邻个数和优化后的模糊强度系数来构建模糊K近邻的分类模型。
具体地,基于步骤S102得到的优化后的近邻个数和优化后的模糊强度系数进行模糊K近邻的分类模型的构建。
步骤S104,根据构建的分类模型对未知数据进行分类。
本实施例中,通过将花朵授粉算法融入到模糊K近邻中以确定模糊K近邻的近邻个数和模糊强度系数,由于花朵授粉算法通过模拟自然界中花朵授粉现象设计出的启发式算法,通过异花授粉和自花授粉两种方式的切换权衡全局搜索和局部搜索的比重,从而获得问题的最优解,具有更强的鲁棒性和搜索能力,能够找出模糊K近邻的近邻个数和模糊强度系数的最优值,从而构建出分类精度更高的模糊K近邻分类模型,极大提高分类的准确率。
实施例二:
图2是本发明实施例二提供的一种基于花朵授粉算法优化模糊K近邻的分类方法的详细步骤示意图,详述如下:
步骤S201,根据给定的数据集,进行每一个数据属性特征归一化处理,将所有特征值都映射到[0,1]区间内,避免较大特征值对较小特征值造成的扰动,使得归一化处理后的数据样本能够有效的支撑花朵授粉算法的优化运算。
优选地,可以按照如下公式(2)对样本数据进行归一化处理:
其中,x表示数据样本,并且x的样本容量已提前确定,x(i)’为第i个属性特征归一化后的特征值,x(i)为所述数据样本x的第i个属性特征的特征值,x(i)max为所述数据样本x第i个属性特征的最大值,x(i)min为所述给定数量的x第i个属性特征的最小值。
步骤S202,对花朵授粉算法进行初始化控制参数设置,所述初始化控制参数包括花粉群体规模N、异花粉和自花授粉的切换概率P以及最大迭代次数Maxiter;
具体地,对花朵授粉算法中涉及到的参数进行初始化设置,可以但不限于包括花粉群体规模N、异花粉和自花授粉的切换概率P以及最大迭代次数Maxiter。
步骤S203,根据如下公式(3)计算每一个花粉的位置:
x0=rand·(xmax-xmin)+xmin (3)
其中,x0为花粉初始化产生的位置,xmax为x的最大值,xmin为x的最小值,rand为[0,1]区间随机生成数。
步骤S204,计算每一个花粉对应的适应度值f(g);
具体地,适应度值f(g)即基于花粉位置计算得到的模糊K近邻的分类精度ACC,模糊K近邻的分类精度ACC的计算公式如下所示:
其中,acch为第h次分类准确率,M为重复运行的次数;
步骤S205,进入迭代循环,如果随机产生数rand大于切换概率P,则进行异花授粉,根据如下公式(5)更新当前的花粉位置:
其中,表示花粉i在t时刻的位置,表示花粉i在t+1时刻的位置,g*表示当前种群中最优花粉的位置,控制参数L是授粉强度,其本质是一个服从Levy分布的随机步长,满足如下公式(6)所示分布:
其中,Γ(λ)是标准gamma函数,s表示步长,s0为预先设定的常量值,λ为常量值,并且λ=1.5。
当切换概率P小于随机变量rand时,按照如下公式进行自花授粉,完成对花粉位置的更新,公式(7)如下所示:
其中,表示种群中不同于i的两个花粉随机生成的位置,ε是一个服从均匀分布的比例常数。
花朵授粉算法的核心思想是通过异花授粉和自花授粉分别进行算法中的全局搜索和局部搜索过程,并利用切换概率这种随机扰动来权衡这两种搜索过程的比重,保证了算法在全局搜索的同时又具备较强的局部搜索能力。算法核心思想主要是通过公式(5)和公式(7)实现的,然后进行位置的比较和更新。
步骤S206,判断迭代次数是否达到最大迭代次数Maxiter,若达到,则执行步骤S207,否则,根据更新后的花朵位置返回步骤S204继续执行。
具体地,如果当期迭代次数已达到最大迭代次数Maxiter,则花朵授粉算法优化完成,执行步骤S207,否则,根据更新后的花朵位置返回步骤S204继续执行迭代。
步骤S207,输出得到的适应度值最高的花粉位置x=(k,m)即为问题的最优解,其中k为优化后的近邻个数,m为优化后的模糊强度系数。
具体地,当前迭代次数已经达到最大迭代次数Maxiter时,得到的适应度值最高的花粉位置的参数即为优化后的近邻个数k和优化后的模糊强度系数m,即花朵授粉位置x=(k,m)中,k为优化后的近邻个数,m为优化后的模糊强度系数。
步骤S208,基于优化后的近邻个数k和优化后的模糊强度系数m来构建模糊K近邻的分类模型。
具体地,基于优化后的近邻个数k和优化后的模糊强度系数m,根据如下公式构建模糊K近邻的分类模型:
其中,C(x)为分类模型的分类准确率,C表示数据类目数,k表示优化后的近邻个数,i∈[1,C],j∈[1,k],m为优化后的模糊强度系数,||x-xj||为x与其近邻xj的欧式距离,uij为xj属于类i的隶属度,计算公式如下:
其中,nj为隶属于类j的近邻个数,g为模糊K近邻中K中心点的取值。
步骤S209,根据构建模型进行分类。
本实施例中,通过将花朵授粉算法融入到模糊K近邻中以确定模糊K近邻的近邻个数和模糊强度系数,由于花朵授粉算法通过模拟自然界中花朵授粉现象设计出的启发式算法,通过异花授粉和自花授粉分别进行算法中的全局搜索和局部搜索过程,并利用切换概率这种随机扰动来权衡这两种搜索过程的比重,保证了算法在全局搜索的同时又具备较强的局部搜索能力,从而获得问题的最优解,即近邻个数的最优值和模糊强度系数的最优值,从而构建出分类精度更高的模糊K近邻分类模型,极大提高分类的准确率。
实施例三:
图3是本发明实施例三提供的一种基于花朵授粉算法优化模糊K近邻的分类装置的结构示意图,为了便于说明,仅示出与本发明实施例相关的部分。图3示例的一种基于花朵授粉算法优化模糊K近邻的分类装置可以是前述实施例实施一提供的一种基于花朵授粉算法优化模糊K近邻的分类方法的执行主体。图3示例的集中基于花朵授粉算法优化模糊K近邻的分类装置主要包括:数据归一化模块301,花朵授粉优化模块302,模型构建模块303以及分类模块304。各功能模块详细说明如下:
数据归一化模块,用于对给定的数据集进行归一化处理;
花朵授粉优化模块,用于基于归一化后的所述数据,通过花朵授粉算法优化模糊K近邻的近邻个数k和模糊强度系数m,得到优化后的近邻个数k和优化后的模糊强度系数m,所述优化后的近邻个数k用于确定其临近样本的数量,所述优化后的模糊强度系数m基于近邻的距离为每个类别的样本分配不同的隶属度,离待测样本近的样本比较远的样本具有更大的隶属度;
模型构建模块,用于基于所述优化后的近邻个数k和优化后的模糊强度系数m构建所述模糊K近邻的分类模型;
分类模块,用于根据所述构建模型对未分类数据进行分类。
值得注意的是,上述装置实施例中,所包括的各个模块只是按照功能逻辑进行划分,但并不局限于上述划分,只要能够实现相应的功能即可,另外,各功能模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
实施例四:
图4是本发明实施例四提供的计算机终端设备的示意图。如图4所示,该实施例的计算机终端设备设备4包括:处理器400、存储器401以及存储在所述存储器401中并可在所述处理器400上运行的计算机程序402,例如基于花朵授粉算法优化模糊K近邻的分类的程序。所述处理器400执行所述计算机程序402时实现上述各个基于花朵授粉算法优化模糊K近邻的分类方法实施例中的步骤,例如图1所示的步骤s101至s104。或者,所述处理器400执行所述计算机程序402时实现上述各装置实施例中各模块的功能,例如图3所示模块301至304的功能。
示例性的,所述计算机程序402可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器401中,并由所述处理器400执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序402在所述计算机终端设备4中的执行过程。例如,所述计算机程序402可以被分割成同步模块、汇总模块、获取模块、返回模块(虚拟装置中的模块)。
所述计算机终端设备4可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机终端设备可包括,但不仅限于,处理器400、存储器401。本领域技术人员可以理解,图4仅仅是计算机终端设备4的示例,并不构成对计算机终端设备4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述计算机终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器400可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器401可以是所述计算机终端设备4的内部存储单元,例如计算机终端设备4的硬盘或内存。所述存储器401也可以是所述计算机终端设备4的外部存储设备,例如所述计算机终端设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器401还可以既包括所述计算机终端设备4的内部存储单元也包括外部存储设备。所述存储器401用于存储所述计算机程序以及所述计算机终端设备所需的其他程序和数据。所述存储器401还可以用于暂时地存储已经输出或者将要输出的数据。
另外,本发明中所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于花朵授粉算法优化模糊K近邻的分类方法,其特征在于,包括如下步骤:
对获取预定数量的数据样本进行归一化处理;
基于归一化后的所述数据样本,利用花朵授粉算法优化模糊K近邻的近邻个数k和模糊强度系数m,得到优化后的近邻个数k和优化后的模糊强度系数m,所述优化后的近邻个数k用于确定其临近样本的数量,所述优化后的模糊强度系数m基于近邻的距离为每个类别的样本分配不同的隶属度,离待测样本近的样本比较远的样本具有更大的隶属度;
基于所述优化后的近邻个数k和模糊强度系数m,构建所述模糊K近邻的分类模型;
根据所述分类模型对未分类数据进行分类。
2.根据权利要求1所述的分类方法,其特征在于,所述归一化处理的方法为:
根据如下公式先对数据进行归一化处理,以使得数据能够映射到相同区间内,从而减少大数据样本值对小数据样本值的扰动:
<mrow> <mi>x</mi> <msup> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>,</mo> </msup> <mo>=</mo> <mfrac> <mrow> <mi>x</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>-</mo> <mi>x</mi> <msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mi>min</mi> </msub> </mrow> <mrow> <mi>x</mi> <msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> <mo>-</mo> <mi>x</mi> <msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mi>min</mi> </msub> </mrow> </mfrac> </mrow>
其中,x表示数据样本,并且x的样本容量已提前确定,x(i)’为第i个属性特征归一化后的特征值,x(i)为所述数据样本x的第i个属性特征的特征值,x(i)max为所述数据样本x第i个属性特征的最大值,x(i)min为所述x第i个属性特征的最小值。
3.根据权利要求1所述的分类方法,其特征在于,
对花朵授粉算法进行初始化控制参数设置,所述初始化控制参数包括花粉群体规模N、异花粉和自花授粉之间的切换概率P以及最大迭代次数Maxiter;
根据下述公式初始化花粉的位置:
x0=rand·(xmax-xmin)+xmin
其中,x0为花粉初始化产生的位置,xmax为x的最大值,xmin为x的最小值,rand为[0,1]区间随机生成数。
根据归一化的数据用于计算花粉位置的适应度值,并根据所述的适应度值进行由高至低的排序,根据切换概率P控制自花授粉和异花授粉切换的概率,当机生成数大于切换概率P,进行异花授粉,更新当前花粉位置,当随机生成数小于切换概率P,则进行自花授粉更新花粉位置,对花粉位置进行比较更新,完成一次迭代优化,并根据所述更新后的花粉位置继续进行迭代优化,直到达到所述最大迭代次数为止,得到当前花粉的位置即为所求得的最优解,根据该解得到优化后的近邻个数k和优化后的模糊强度系数m。
4.根据权利要求1所述的分类方法,其特征在于,还包括:
对花朵授粉算法进行初始化控制参数设置,所述初始化控制参数包括花粉群体规模N、异花粉和自花授粉的切换概率P以及最大迭代次数Maxiter;
根据下述公式初始化花粉的位置:
x0=rand·(xmax-xmin)+xmin
其中,x0为花粉初始化产生的位置,xmax为x的最大值,xmin为x的最小值,rand为[0,1]区间随机生成数;
计算所述每个花粉位置的适应度值f(x),所述适应度为基于模糊K近邻计算得到的所述的分类精度ACC,所述分类精度ACC计算公式如下:
<mrow> <mi>A</mi> <mi>C</mi> <mi>C</mi> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>h</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>acc</mi> <mi>h</mi> </msub> </mrow> <mi>M</mi> </mfrac> </mrow>
其中,acch为第h次分类准确率,M为重复运行的次数;
当切换概率P大于随机生成数rand时,按照如下公式进行异花授粉,完成对花粉位置的更新:
<mrow> <msubsup> <mi>x</mi> <mi>i</mi> <mrow> <mi>t</mi> <mo>+</mo> <mn>1</mn> </mrow> </msubsup> <mo>=</mo> <msubsup> <mi>x</mi> <mi>i</mi> <mi>t</mi> </msubsup> <mo>+</mo> <mi>L</mi> <mrow> <mo>(</mo> <msubsup> <mi>x</mi> <mi>i</mi> <mi>t</mi> </msubsup> <mo>-</mo> <msub> <mi>g</mi> <mo>*</mo> </msub> <mo>)</mo> </mrow> </mrow>
其中,xi t表示花粉i在t时刻的位置,xi t+1表示花粉i在t+1时刻的位置,g*表示当前种群中最优花粉的位置,控制参数L是授粉强度,其本质是一个服从Levy分布的随机步长,满足如下公式所示分布:
<mrow> <mi>L</mi> <mo>~</mo> <mfrac> <mrow> <mi>&amp;lambda;</mi> <mi>&amp;Gamma;</mi> <mrow> <mo>(</mo> <mi>&amp;lambda;</mi> <mo>)</mo> </mrow> <mi>s</mi> <mi>i</mi> <mi>n</mi> <mrow> <mo>(</mo> <mi>&amp;pi;</mi> <mi>&amp;lambda;</mi> <mo>/</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow> <mi>&amp;pi;</mi> </mfrac> <mfrac> <mn>1</mn> <msup> <mi>s</mi> <mrow> <mn>1</mn> <mo>+</mo> <mi>&amp;lambda;</mi> </mrow> </msup> </mfrac> <mo>,</mo> <mrow> <mo>(</mo> <mi>s</mi> <mo>&gt;</mo> <mo>&gt;</mo> <msub> <mi>s</mi> <mn>0</mn> </msub> <mo>&gt;</mo> <mo>&gt;</mo> <mn>0</mn> <mo>)</mo> </mrow> </mrow>
其中,Γ(λ)是标准gamma函数,s表示步长,s0为预先设定的常量值,λ为常量值,并且λ取为1.5;
当切换概率P小于随机变量rand时,按照如下公式进行自花授粉,完成对花粉位置的更新:
<mrow> <msubsup> <mi>x</mi> <mi>i</mi> <mrow> <mi>t</mi> <mo>+</mo> <mn>1</mn> </mrow> </msubsup> <mo>=</mo> <msubsup> <mi>x</mi> <mi>i</mi> <mi>t</mi> </msubsup> <mo>+</mo> <mi>&amp;epsiv;</mi> <mrow> <mo>(</mo> <msubsup> <mi>x</mi> <mi>j</mi> <mi>t</mi> </msubsup> <mo>-</mo> <msubsup> <mi>x</mi> <mi>s</mi> <mi>t</mi> </msubsup> <mo>)</mo> </mrow> </mrow>
其中,xj t和xs t表示种群中不同于i的两个花粉随机生成的位置,ε是一个服从均匀分布的比例常数;
按照所述花粉适应度值进行排序,记录最高适应度值对应的花粉位置,若所述当前迭代次数尚未达到最大迭代次数Maxiter,则根据更新后的花粉位置继续进行花粉迭代优化,直到所述当前迭代次数iter达到所述最大迭代次数Maxiter为止;
最后得到的输出的花粉位置x=(k,m),其中k为优化后的近邻个数,m为优化后的模糊强度系数。
5.根据权利要求1所述的分类方法,其特征在于,所述基于优化后的近邻个数k和优化后的模糊强度系数m构建所述模糊K近邻的分类模型包括:
基于所述优化后的近邻个数k和优化后的模糊强度系数m,根据下述公式构建所述模糊K近邻的分类模型:
<mrow> <mi>C</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <msubsup> <mi>arg</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>C</mi> </msubsup> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mrow> <mo>(</mo> <mfrac> <mrow> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <msub> <mi>u</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <msup> <mrow> <mo>(</mo> <mn>1</mn> <mo>/</mo> <mo>|</mo> <mo>|</mo> <mi>x</mi> <mo>-</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>|</mo> <mo>|</mo> <mo>)</mo> </mrow> <mrow> <mn>2</mn> <mo>/</mo> <mrow> <mo>(</mo> <mi>m</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> </msup> </mrow> <mrow> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <msup> <mrow> <mo>(</mo> <mn>1</mn> <mo>/</mo> <mo>|</mo> <mo>|</mo> <mi>x</mi> <mo>-</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>|</mo> <mo>|</mo> <mo>)</mo> </mrow> <mrow> <mn>2</mn> <mo>/</mo> <mrow> <mo>(</mo> <mi>m</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow> </msup> </mrow> </mfrac> <mo>)</mo> </mrow> </mrow>
其中,C(x)为分类模型的分类准确率,C表示数据类目数,k表示优化后的近邻个数,i∈[1,C],j∈[1,k],m为优化后的模糊强度系数,||x-xj||为x与其近邻xj的欧式距离,uij为xj属于类i的隶属度,计算公式如下:
<mrow> <msub> <mi>u</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>0.51</mn> <mo>+</mo> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mi>j</mi> </msub> <mo>/</mo> <mi>g</mi> <mo>)</mo> </mrow> <mo>*</mo> <mn>0.49</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> </mrow> </mtd> <mtd> <mrow> <mi>j</mi> <mo>=</mo> <mi>i</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>(</mo> <msub> <mi>n</mi> <mi>j</mi> </msub> <mo>/</mo> <mi>g</mi> <mo>)</mo> <mo>*</mo> <mn>0.49</mn> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> </mrow> </mtd> <mtd> <mrow> <mi>j</mi> <mo>&amp;NotEqual;</mo> <mi>i</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
其中,nj为隶属于类j的近邻个数,g为模糊K近邻中K中心点的取值。
6.一种基于花朵授粉算法优化模糊K近邻的分类装置,其特征在于,包括:
数据归一化模块,用于对给定的数据集进行归一化处理;
花朵授粉优化模块,用于基于归一化后的所述数据,通过花朵授粉算法优化模糊K近邻的近邻个数k和模糊强度系数m,得到优化后的近邻个数k和优化后的模糊强度系数m,所述优化后的近邻个数k用于确定其临近样本的数量,所述优化后的模糊强度系数m基于近邻的距离为每个类别的样本分配不同的隶属度,离待测样本近的样本比较远的样本具有更大的隶属度;
模型构建模块,用于基于所述优化后的近邻个数k和优化后的模糊强度系数m构建所述模糊K近邻的分类模型;
分类模块,用于根据所述分类模型对未分类数据进行分类。
7.一种计算机终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述方法的步骤。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。
CN201710742480.2A 2017-08-25 2017-08-25 一种基于花朵授粉算法优化模糊k近邻的分类方法及装置 Pending CN107527071A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710742480.2A CN107527071A (zh) 2017-08-25 2017-08-25 一种基于花朵授粉算法优化模糊k近邻的分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710742480.2A CN107527071A (zh) 2017-08-25 2017-08-25 一种基于花朵授粉算法优化模糊k近邻的分类方法及装置

Publications (1)

Publication Number Publication Date
CN107527071A true CN107527071A (zh) 2017-12-29

Family

ID=60682433

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710742480.2A Pending CN107527071A (zh) 2017-08-25 2017-08-25 一种基于花朵授粉算法优化模糊k近邻的分类方法及装置

Country Status (1)

Country Link
CN (1) CN107527071A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109711644A (zh) * 2019-02-25 2019-05-03 安徽大学 基于改进花粉算法的火电机组负荷优化分配方法
CN110309887A (zh) * 2019-07-09 2019-10-08 哈尔滨理工大学 基于改进花朵授粉的模糊c-均值聚类异常检测方法
CN112836718A (zh) * 2020-12-08 2021-05-25 上海大学 一种基于模糊知识神经网络的图像情感识别方法
CN114509704A (zh) * 2022-02-15 2022-05-17 湖南小快智造电子科技有限公司 一种安全用电智能监测仪
CN115765016A (zh) * 2022-11-30 2023-03-07 国网四川省电力公司电力科学研究院 一种分布式光伏出力波动抑制方法及系统
CN116506351A (zh) * 2023-06-21 2023-07-28 杭州海康威视数字技术股份有限公司 MPLS-VPN Qos路由选择方法、装置及设备

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109711644A (zh) * 2019-02-25 2019-05-03 安徽大学 基于改进花粉算法的火电机组负荷优化分配方法
CN109711644B (zh) * 2019-02-25 2023-04-18 安徽大学 基于改进花粉算法的火电机组负荷优化分配方法
CN110309887A (zh) * 2019-07-09 2019-10-08 哈尔滨理工大学 基于改进花朵授粉的模糊c-均值聚类异常检测方法
CN112836718A (zh) * 2020-12-08 2021-05-25 上海大学 一种基于模糊知识神经网络的图像情感识别方法
CN114509704A (zh) * 2022-02-15 2022-05-17 湖南小快智造电子科技有限公司 一种安全用电智能监测仪
CN115765016A (zh) * 2022-11-30 2023-03-07 国网四川省电力公司电力科学研究院 一种分布式光伏出力波动抑制方法及系统
CN115765016B (zh) * 2022-11-30 2024-03-19 国网四川省电力公司电力科学研究院 一种分布式光伏出力波动抑制方法及系统
CN116506351A (zh) * 2023-06-21 2023-07-28 杭州海康威视数字技术股份有限公司 MPLS-VPN Qos路由选择方法、装置及设备
CN116506351B (zh) * 2023-06-21 2023-09-19 杭州海康威视数字技术股份有限公司 MPLS-VPN Qos路由选择方法、装置及设备

Similar Documents

Publication Publication Date Title
CN107527071A (zh) 一种基于花朵授粉算法优化模糊k近邻的分类方法及装置
US20230037908A1 (en) Machine learning model training method and device, and expression image classification method and device
Kang et al. A weight-incorporated similarity-based clustering ensemble method based on swarm intelligence
CN106485230A (zh) 基于神经网络的人脸检测模型的训练、人脸检测方法及系统
CN107305637B (zh) 基于K-Means算法的数据聚类方法和装置
Li et al. Hybrid optimization algorithm based on chaos, cloud and particle swarm optimization algorithm
Fazzolari et al. A study on the application of instance selection techniques in genetic fuzzy rule-based classification systems: Accuracy-complexity trade-off
CN109242002A (zh) 高维数据分类方法、装置及终端设备
CN103488662A (zh) 基于图形处理单元的自组织映射神经网络聚类方法及系统
Wang et al. A novel GCN-based point cloud classification model robust to pose variances
CN113361785A (zh) 配电网短期负荷预测方法、装置、终端及存储介质
WO2019120007A1 (zh) 用户性别预测方法、装置及电子设备
CN109271427A (zh) 一种基于近邻密度和流形距离的聚类方法
CN109960791A (zh) 判断文本情感的方法及存储介质、终端
Zhu et al. A classification algorithm of CART decision tree based on MapReduce attribute weights
He et al. A Method of Identifying Thunderstorm Clouds in Satellite Cloud Image Based on Clustering.
CN105913085A (zh) 一种基于张量模式的多源数据分类优化方法及系统
JP5552023B2 (ja) クラスタリング・システム、方法及びプログラム
CN110457814A (zh) 基于混合高斯模型的多模态交叉熵优化算法
Rani et al. An efficient machine learning regression model for rainfall prediction
CN108229572B (zh) 一种参数寻优方法及计算设备
CN115630772B (zh) 综合能源检测配电方法、系统、设备及存储介质
Du et al. FASTBEE: A fast and self-adaptive clustering algorithm towards to edge computing
Ma Improved k-means algorithm in text semantic clustering
Wang et al. Improved Affinity Propagation Clustering Based on K-Nearest Neighbors and Canopy Algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171229