CN101587545A - 棉花异性纤维目标图像的特征选择方法和系统 - Google Patents

棉花异性纤维目标图像的特征选择方法和系统 Download PDF

Info

Publication number
CN101587545A
CN101587545A CNA2009100873929A CN200910087392A CN101587545A CN 101587545 A CN101587545 A CN 101587545A CN A2009100873929 A CNA2009100873929 A CN A2009100873929A CN 200910087392 A CN200910087392 A CN 200910087392A CN 101587545 A CN101587545 A CN 101587545A
Authority
CN
China
Prior art keywords
cotton
individuality
fitness
target image
segmentation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2009100873929A
Other languages
English (en)
Other versions
CN101587545B (zh
Inventor
李道亮
杨文柱
魏新华
康玉国
李付堂
王金星
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Agricultural University
Original Assignee
China Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Agricultural University filed Critical China Agricultural University
Priority to CN2009100873929A priority Critical patent/CN101587545B/zh
Publication of CN101587545A publication Critical patent/CN101587545A/zh
Application granted granted Critical
Publication of CN101587545B publication Critical patent/CN101587545B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种棉花异性纤维目标图像的特征选择方法及系统。其中方法包括:利用分段式二进制编码方案对棉花异性纤维目标图像的待选择的颜色特征、形状特征和纹理特征进行基因编码并随机生成初始种群;计算所述初始种群中个体的适应度;根据所述适应度对所述初始种群进行选择得出新种群;对所述新种群中的个体进行分段交叉和变异产生新个体并替换原个体,计算新个体的适应度;判断是否符合终止条件;在符合终止条件时,将具有最高适应度的个体解码,得到所述棉花异性纤维目标图像的最优特征子集。本发明实现了对棉花异性纤维目标图像中不同性质特征的覆盖,选择出具有最佳分类能力的最优特征子集,利于后续实现异性纤维的快速正确分类。

Description

棉花异性纤维目标图像的特征选择方法和系统
技术领域
本发明涉及模式识别和机器视觉领域,特别涉及一种棉花异性纤维目标图像的特征选择方法和系统。
背景技术
棉花异性纤维是指在棉花采摘、摊晒、收购等过程中混入棉花中的对棉花及其制品的质量有严重影响的非棉纤维和色纤维,主要包括丙纶丝、麻绳和头发等。异性纤维在皮棉中的含量虽少,但对棉纺织品的质量影响严重,一旦混入并参与纺织将影响纱线强力,且在染色时影响着色,会对棉纺织工业造成重大经济损失。
目前可以通过挑拣异性纤维的方法降低棉花异性纤维的含量,或者将棉花生产的样品进行取样后送到纤维检验机构分析确定异性纤维的含量。但是,根据很多棉花行业专家的一致观点,应该从源头抓起,切断异性纤维混入的途径,让棉农、棉花收购和加工企业都自觉地防范异性纤维混入。而这关键是需要在籽棉收购或交易环节中快速准确地分析籽棉中的异性纤维含量,给销售的籽棉分等定级,并按等级定价,这样就可以促使棉花销售者自觉地降低棉花中异性纤维的含量。如果要实现在籽棉收购或交易环节快速准确地确定籽棉中的异性纤维含量,其基础和关键是将异性纤维快速分类,而从棉花异性纤维目标图像的原始特征集合中选择出最有分类价值的最优特征子集则是异性纤维实现正确快速分类的前提和保障。
发明人在实现本发明的过程中发现,现有技术的特征选择方法至少存在如下技术缺陷:特征选择方法中的两个关键技术“搜索策略”和“评价函数”存在计算量大等缺陷。其中,搜索策略中的遗传算法试图通过随机性来避免陷入局部最优解,并且能够以较大概率获得全局最优解;但是目前的遗传算法还存在一些不足之处,如早熟收敛问题等,尤其是没有考虑对棉花异性纤维目标图像中具有完全不同性质的特征进行局部化管理的合理性和必要性。如果使用上述遗传算法的特征选择方法会使得特征选择的效率较低,异性纤维无法实现快速正确分类,从而无法实现在籽棉收购或交易环节快速准确地确定籽棉中的异性纤维含量,不能通过检测籽棉中的异性纤维含量来影响其收购价格,不能有效切断异性纤维混入的途径,可能对棉纺织工业造成重大经济损失。
发明内容
本发明的目的是提供一种棉花异性纤维目标图像的特征选择方法和系统,实现对棉花异性纤维目标图像中不同性质特征的覆盖,选择出具有最佳分类能力的最优特征子集,以便实现异性纤维的快速正确分类。
本发明实施例提供了一种棉花异性纤维目标图像的特征选择方法,包括:
步骤1、利用分段式二进制编码方案对棉花异性纤维目标图像的待选择的颜色特征、形状特征和纹理特征进行基因编码,随机生成含有多个分别代表不同特征子集的个体的初始种群;每个所述个体表示的特征子集均涵盖所述颜色特征、形状特征和纹理特征;设置进化代数为0;
步骤2、计算所述初始种群中每个个体的适应度;所述适应度是按照所述个体表示的特征子集构造的分类器的分类正确率与所述特征子集的加权大小作差得到的;
步骤3、根据所述适应度对所述初始种群中的多个个体进行选择得到最高适应度个体和用于遗传操作的新种群,所述遗传操作包括分段交叉和分段变异;
步骤4、在所述新种群中随机选择两个个体作为双亲个体,并根据交叉概率进行分段交叉,产生涵盖所述颜色特征、形状特征和纹理特征的两个子个体;并按照步骤2所述的方法计算所述两个子个体的适应度;
步骤5、对所述两个子个体分别根据变异概率进行分段变异,产生涵盖所述颜色特征、形状特征和纹理特征的两个新一代个体并替换所述双亲个体,并按照步骤2所述的方法计算所述两个新一代个体的适应度;重复所述步骤4和步骤5直到所述新种群中的所有个体都进行所述遗传操作后得到新一代种群;所述遗传操作结束后,令所述进化代数加1;
步骤6、判断所述进化代数是否达到指定的最大进化代数或者所述新一代种群中所有个体的平均适应度的差异连续G代都小于指定的阈值T,G和T为经验常数;若是,则继续执行步骤7,否则,继续执行步骤3~步骤5;
步骤7、将所述新一代种群中具有最高适应度的个体解码,得到所述棉花异性纤维目标图像的最优特征子集,所述最优特征子集为从所述棉花异性纤维目标图像的待选择的颜色特征、形状特征和纹理特征中选择得到的特征。
本发明实施例提供了一种棉花异性纤维目标图像的特征选择系统,包括:初始化模块、适应度计算模块、比例选择模块、分段交叉模块、分段变异模块、进化终止判断模块和最优特征子集输出模块;
所述初始化模块,用于利用分段式二进制编码方案对棉花异性纤维目标图像的待选择的颜色特征、形状特征和纹理特征进行基因编码,随机生成含有多个分别代表不同特征子集的个体的初始种群;每个所述个体表示的特征子集均涵盖所述颜色特征、形状特征和纹理特征;设置进化代数为0;
所述适应度计算模块,用于计算所述初始种群中每个个体的适应度;所述适应度是按照所述个体表示的特征子集构造的分类器的分类正确率与所述特征子集的加权大小作差得到的;
所述比例选择模块,用于根据所述适应度对所述初始种群中的多个个体进行选择得到最高适应度个体和用于遗传操作的新种群,所述遗传操作包括分段交叉和分段变异;
所述分段交叉模块,用于在所述新种群中随机选择两个个体作为双亲个体,并根据交叉概率进行分段交叉,产生涵盖所述颜色特征、形状特征和纹理特征的两个子个体;并调用所述适应度计算模块来计算所述两个子个体的适应度;
所述分段变异模块,用于对所述两个子个体分别根据变异概率进行分段变异,产生涵盖所述颜色特征、形状特征和纹理特征的两个新一代个体并替换所述双亲个体,并调用所述适应度计算模块来计算所述两个新一代个体的适应度;重复执行分段交叉模块和分段变异模块直到所述新种群中的所有个体都进行所述遗传操作后得到新一代种群;所述遗传操作结束后,令所述进化代数加1;
所述进化终止判断模块,用于判断所述进化代数是否达到指定的最大进化代数或者所述新一代种群中所有个体的平均适应度的差异连续G代都小于指定的阈值T,G和T为经验常数;若是,则执行最优特征子集输出模块,否则,继续执行所述比例选择模块、分段交叉模块和分段变异模块;
所述最优特征子集输出模块,用于将所述新一代种群中具有最高适应度的个体解码,得到所述棉花异性纤维目标图像的最优特征子集,所述最优特征子集为从所述棉花异性纤维目标图像的待选择的颜色特征、形状特征和纹理特征中选择得到的特征。
本发明实施例通过采用分段式编码管理方案对不同性质的特征进行局部化管理,并对交叉算子和变异算子进行局部化约束,解决了现有遗传算法的特征选择方法中没有考虑对诸如棉花异性纤维目标图像具有完全不同性质的特征进行局部化管理而使得特征选择的效率较低且容易早熟收敛的问题;能够实现对棉花异性纤维目标图像的不同性质特征的覆盖,特征选择的效率较高。
附图说明
图1为本发明实施例一提供的棉花异性纤维目标图像的特征选择方法的流程示意图;
图2是本发明实施例一提供的棉花异性纤维目标图像的特征选择方法中的分段式染色体管理方案示意图;
图3是本发明实施例一提供的棉花异性纤维目标图像的特征选择方法中的分段交叉方案示意图;
图4是本发明实施例一提供的棉花异性纤维目标图像的特征选择方法中的分段变异方案示意图;
图5是本发明实施例二提供的棉花异性纤维目标图像特征选择系统的结构示意图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
本发明实施例的棉花异性纤维目标图像的特征选择方法和系统,前提是用户已经提供了棉花异性纤维目标图像的原始特征集,该原始特征集指的是对棉花异性纤维目标图像进行图像处理后,得到的该目标图像的颜色特征、形状特征和纹理特征;即本发明实施例采用的是棉花异性纤维目标图像的图像处理结果。本发明实施例的目标是从上述的待选择的颜色特征、形状特征和纹理特征中选择出具有最佳分类能力的颜色特征、形状特征和纹理特征即最优特征子集,以利于后续步骤中的实现棉花异性纤维的正确快速分类,从而快速测定棉花异性纤维的含量;即本发明实施例得到的最优特征子集为棉花异性纤维正确快速分类提供基础。
图1为本发明实施例一提供的棉花异性纤维目标图像的特征选择方法的流程示意图,如图1所示,本实施例主要包括以下步骤:
步骤101、利用分段式二进制编码方案对棉花异性纤维目标图像的待选择的颜色特征、形状特征和纹理特征进行基因编码并生成初始种群,该初始种群中包括多个分别代表不同特征子集的个体,每个个体均涵盖所述颜色特征、形状特征和纹理特征。
本实施例中的个体可也称作染色体,分段式二进制编码方案是指将整个染色体进行分段基因编码。下面结合图2具体阐述本步骤中的分段式二进制编码方案,图2是本发明实施例一提供的棉花异性纤维目标图像的特征选择方法中的分段式染色体管理方案示意图,如图2所示,由于本实施例中的棉花异性纤维目标图像的原始特征集包括颜色特征、形状特征和纹理特征三种性质的特征,因此,本实施例中将染色体分为三个子段,第一子段实现对颜色特征的基因编码,表示为C1~CK,K为颜色特征的个数;Ci=1表示第i个颜色特征被选中,Ci=0表示第i个颜色特征落选。第二子段实现对形状特征的基因编码,表示为S1~SM,M为形状特征的个数;Sj=1表示第j个形状特征被选中,Sj=0表示第j个形状特征落选。第三子段实现对纹理特征的基因编码,表示为T1~TN,N为纹理特征的个数;Tk=1表示第k个纹理特征被选中,Tk=0表示第k个纹理特征落选。每个子段的长度分别等于对应特征向量的长度;整个染色体的长度等于三个染色体子段的长度之和,亦等于原始特征空间的维数。
在对上述染色体进行分段式二进制编码的基础上,还需要进行分段式染色体管理,该分段式染色体管理是指需要限制上述染色体中的三个分段的内容不能全部为零来保证整个染色体能够同时涵盖颜色、形状和纹理三种特征;从而就可以实现对多质特征空间的有效搜索。该限制条件表示为公式(1):
Figure A20091008739200111
上述限制条件对初始种群中的染色体进行约束,也同样施加于后续步骤104中分段交叉操作产生的新染色体和步骤105中分段变异操作产生的新染色体;交叉和变异后产生的新染色体同样要满足分段基因不全为零的约束条件。
上述对棉花异性纤维图像的颜色、形状和纹理特征按照不同的条件进行编码,就可以得到多个染色体。例如,对于图2中的染色体,假设颜色特征有4个,形状特征有3个,纹理特征有5个;如果分别只选中三个分段中的第一个基因,则编码后得到的染色体为“100010010000”;如果分别只选中三个分段中的第二个基因,则编码后得到的染色体为“010001001000”。同理,可以通过随机方式得到多个染色体。上述多个染色体组成初始种群。该初始种群的规模PopSize可以根据实际情况进行设置,一般取20≤PopSize≤100;并且要求该初始种群具有单一性,即初始种群中没有完全相同的染色体,每个染色体都分别表示不同的特征子集。
步骤102、将个体代表的特征子集构造的分类器的分类正确率与该特征子集的加权大小作差得到特征个体的适应度。
适应度是衡量特征个体即染色体优劣的唯一指标,是根据单个染色体中的特征子集大小及由此构造的分类器在样本数据集上的分类正确率确定的。特征子集是指单个染色体中为1的基因表示的特征集合。该样本数据集也是由用户预先提供。染色体的适应度可以根据公式(2)计算得出:
f(Xi)=J(Xi)-w|Xi|..............................(2)
上述公式(2)中,Xi为个体i所表示的特征子集,J(Xi)为根据Xi构造的分类器的分类正确率;分类器可以是任何一种分类器,如K-NN分类器、神经网络分类器、模糊分类器等;|Xi|为特征个体i所表示的特征子集的大小(亦即染色体串上“1”的个数);w为权值(0≤w<1)。
步骤103、根据个体的适应度对初始种群中的个体进行比例选择得出包括部分个体的新种群,该新种群用于后续的遗传操作。选择操作使得适应度高的个体可能被选择多次,而适应度低的个体可能一次也没选中,但选出的新个体数目不变,因此新种群的规模仍然等于原始种群的规模。
本步骤是用于选择可以保留下来的个体。根据精英策略将具有最高适应度的个体直接保留到下一代,作为新一代种群中的染色体;轮盘赌法则是根据染色体的选中概率进行选择,使适应度高的个体能以较高的概率被选中以便进行遗传操作,体现了优胜劣汰的进化法则。其中选中概率与染色体的适应度具有公式(3)所示的关系:
P s ( X i ) = f ( X i ) / Σ j = 1 PopSize f ( X j ) . . . . . . . . . . . . . . . . . . . . . . ( 3 )
其中,PopSize为当前种群大小,Ps(Xi)为染色体i的选中概率。
步骤104、在选出的新种群中随机选择两个个体作为双亲并根据交叉概率进行分段交叉,产生涵盖所述颜色特征、形状特征和纹理特征的两个子个体,并按照步骤102所述的方法计算两个子个体的适应度。
在新种群中通过对两个父代染色体进行分段交叉操作,产生两个新的染色体;产生的新染色体需要满足“染色体的每个分段上的基因都不全为零”的约束条件。两个父代染色体的分段交叉是根据交叉概率进行交叉的,该交叉概率是随进化代数不断变化的自适应交叉概率,其可以随着进化代数的不断增加而逐渐变小。该自适应交叉概率可以根据公式(4)~(6)进行定义:
P c = P c 0 / log 2 ( g + 1 ) f max ≥ f ‾ P c 0 f max ≤ f ‾ . . . . . . . . . . . . . . . . . . . ( 4 )
fmax=max(f(Xi),f(Xj))..............................(5)
f ‾ = 1 PopSize Σ i = 1 PopSize f ( X i ) . . . . . . . . . . . . . . . . . . . . . . ( 6 )
其中,Pc0为种群初始化时设置的交叉概率,0.4≤Pc0≤0.9;g为当前进化代数,Xi、Xj为两个父代染色体,fmax为两个父代染色体中的较大适应度,f为父代种群的平均适应度。
下面结合图3具体阐述本步骤中的分段交叉方案,图3是本发明实施例一提供的棉花异性纤维目标图像的特征选择方法中的分段交叉方案示意图,如图3所示,可以依次对染色体中的颜色特征分段、形状特征分段和纹理特征分段进行交叉。例如,对颜色特征分段进行交叉时,对于长度为K的颜色特征分段,首先根据颜色特征分段的长度产生一个1~“K-1”之间的一个随机数a;然后对两个父代染色体的颜色特征分段在第a位以交叉概率Pc做单点交叉;最后判断交叉后的新的颜色特征分段上的基因是否全部为0,如果是,则采用随机反转该颜色特征分段中某个基因的方式进行修正,例如将第a位基因置为“1”,如果不全部为0,则进入下一分段,开始依次对形状特征分段和纹理特征分段进行交叉操作,操作原理同颜色特征分段,在此不再赘述。
步骤105、分别对步骤104产生的两个子个体根据变异概率进行分段变异,产生涵盖所述颜色特征、形状特征和纹理特征的两个新一代个体并替换步骤104选出的双亲,并按照步骤102的方法计算两个新一代个体的适应度;重复步骤103~105直到所有个体完成遗传操作,此时,该新种群为新一代种群,进化代数加1。
对分段交叉后的两个子代个体分别进行分段变异操作,产生两个新一代染色体;产生的新染色体需要满足“染色体的每个分段上的基因都不全为零”的约束条件。对两个子代染色体的分段变异是根据变异概率进行变异的,该变异概率是随进化代数不断变化的自适应变异概率,其可以随着进化代数的不断增加而逐渐变小。该自适应变异概率可以根据公式(7)进行定义:
P m = P m 0 / log 2 ( g + 1 ) f ≥ f ‾ P m 0 f ≤ f ‾ . . . . . . . . . . . . . . . . . . . ( 7 )
其中,Pm0为初始设置的变异概率,0.1≤Pm0≤0.25;g为当前进化代数,f为准备进行变异操作的染色体的适应度,f为父代种群的平均适应度。
下面结合图4具体阐述本步骤中的个体分段交叉方案,图4是本发明实施例一提供的棉花异性纤维目标图像的特征选择方法中的分段变异方案示意图,如图4所示,可以依次并逐位对染色体中的颜色特征分段、形状特征分段和纹理特征分段进行变异。例如,对颜色特征分段进行变异时,可以对该颜色特征分段逐位以概率Pm进行位取反操作,例如图4中对颜色特征分段的第3位和第5位进行了位取反操作;然后判断变异后的新的颜色特征分段上的基因是否全部为0,如果是,则重新进行变异运算,对该颜色特征分段再次逐位以概率Pm进行位取反操作,直到变异成功,即新颜色特征分段上的基因不全部为0。然后可以进入下一分段,开始依次对形状特征分段和纹理特征逐位进行位取反操作,操作原理同颜色特征分段,在此不再赘述。
步骤106、判断进化代数是否达到指定的最大进化代数或者该新一代种群中的个体的平均适应度的差异是否连续G代都小于指定的阈值T,G和T为经验常数;若是,则继续执行步骤107,否则,返回去重新继续执行步骤103~步骤105;
步骤107、将新一代种群中具有最高适应度的个体解码,得到棉花异性纤维目标图像的最优特征子集,该最优特征子集为从棉花异性纤维目标图像的待选择的颜色特征、形状特征和纹理特征中选择得到的最具有分类价值的特征。
本实施例通过采用分段式编码管理方案对不同性质的特征进行局部化管理,并对交叉算子和变异算子进行局部化约束,能够实现对不同性质特征的覆盖,减少搜索次数,加快算法收敛。
图5是本发明实施例二提供的棉花异性纤维目标图像特征选择系统的结构示意图,如图5所示,本实施例的棉花异性纤维目标图像特征选择系统包括初始化模块21、适应度计算模块22、比例选择模块23、分段交叉模块24、分段变异模块25、进化终止判断模块26和最优特征子集输出模块27。
具体实施中,初始化模块21利用分段式二进制编码方案对棉花异性纤维目标图像的待选择的颜色特征、形状特征和纹理特征进行基因编码;随机生成含有多个分别代表不同特征子集的个体的初始种群,所述初始种群中的每个个体均涵盖所述颜色特征、形状特征和纹理特征;此外,还可以设置初始化进化代数、交叉概率、变异概率等参数;
适应度计算模块22将个体表示的特征子集构造的分类器的分类正确率与特征子集的加权大小作差得到所述个体的适应度;
比例选择模块23,根据适应度计算模块22得到的个体的适应度对初始种群中的个体进行比例选择得到用于遗传操作的新种群;利用精英策略将具有最高适应度的个体直接保留到下一代而无须进行遗传操作;
分段交叉模块24在比例选择模块23得到的新种群中随机选择两个个体作为双亲染色体并根据交叉概率进行分段交叉,产生涵盖所述颜色特征、形状特征和纹理特征的两个子个体,并计算所述两个子个体的适应度;
分段变异模块25分别对分段交叉模块24得到的两个子个体根据变异概率进行分段变异,产生涵盖所述颜色特征、形状特征和纹理特征的两个新一代个体并替换双亲染色体,计算两个新一代个体的适应度;当所述新种群中的所有个体都完成了遗传操作后,便完成了一代进化,令进化代数加1;
进化终止判断模块26判断完成了本次进化的新一代种群是否符合进化终止条件,该进化终止条件包括达到指定的最大进化代数或者新一代种群中的特征个体的平均适应度的差异连续G代都小于指定的阈值T,G和T为经验常数;
最优特征子集输出模块27在进化终止判断模块26判断新一代种群符合进化终止条件时,将新一代种群中具有最高适应度的个体解码,得到棉花异性纤维目标图像中的最优特征子集,该最优特征子集为从棉花异性纤维目标图像的待选择的颜色特征、形状特征和纹理特征中选择得到的最具有分类价值的特征。
在上述方案的基础上,进一步的,比例选择模块23包括:精英策略单元,用于将具有最高适应度的个体直接作为新一代种群中的个体;轮盘赌法则单元,用于结合所述个体的选中概率选择部分个体组成新种群以便进行后续的遗传操作,所述选中概率与所述个体的适应度成正比。
进一步的,分段交叉模块24包括第一修正单元,用于在产生不涵盖所述颜色特征、形状特征和/或纹理特征的子个体时,采用随机反转所述子个体中某个基因的方式进行修正,以使得所述子个体涵盖所述颜色特征、形状特征和纹理特征。
进一步的,分段变异模块25包括第二修正单元,用于在产生不涵盖所述颜色特征、形状特征和/或纹理特征的新一代个体时,重新对所述新一代个体根据变异概率进行分段变异,直至所述新一代个体涵盖所述颜色特征、形状特征和纹理特征。
本实施例通过采用分段式编码管理方案对不同性质的特征进行局部化管理,并对交叉算子和变异算子进行局部化约束,能够实现对不同性质特征的覆盖,减少搜索次数,加快算法收敛,选择出具有最佳分类能力的最优特征子集,以便实现异性纤维的快速正确分类。
最后应说明的是:以上实施例仅用以说明本发明的技术方案而非对其进行限制,尽管参照较佳实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对本发明的技术方案进行修改或者等同替换,而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的精神和范围。

Claims (10)

1、一种棉花异性纤维目标图像的特征选择方法,其特征在于,包括:
步骤1、利用分段式二进制编码方案对棉花异性纤维目标图像的待选择的颜色特征、形状特征和纹理特征进行基因编码,随机生成含有多个分别代表不同特征子集的个体的初始种群;每个所述个体表示的特征子集均涵盖所述颜色特征、形状特征和纹理特征;设置进化代数为0;
步骤2、计算所述初始种群中每个个体的适应度;所述适应度是按照所述个体表示的特征子集构造的分类器的分类正确率与所述特征子集的加权大小作差得到的;
步骤3、根据所述适应度对所述初始种群中的多个个体进行选择得到最高适应度个体和用于遗传操作的新种群,所述遗传操作包括分段交叉和分段变异;
步骤4、在所述新种群中随机选择两个个体作为双亲个体,并根据交叉概率进行分段交叉,产生涵盖所述颜色特征、形状特征和纹理特征的两个子个体,并按照步骤2所述的方法计算所述两个子个体的适应度;
步骤5、对所述两个子个体分别根据变异概率进行分段变异,产生涵盖所述颜色特征、形状特征和纹理特征的两个新一代个体并替换所述双亲个体,并按照步骤2所述的方法计算所述两个新一代个体的适应度;重复所述步骤4和步骤5直到所述新种群中的所有个体都进行所述遗传操作后得到新一代种群;所述遗传操作结束后,令所述进化代数加1;
步骤6、判断所述进化代数是否达到指定的最大进化代数或者所述新一代种群中所有个体的平均适应度的差异连续G代都小于指定的阈值T,G和T为经验常数;若是,则继续执行步骤7,否则,继续执行步骤3~步骤5;
步骤7、将所述新一代种群中具有最高适应度的个体解码,得到所述棉花异性纤维目标图像的最优特征子集,所述最优特征子集为从所述棉花异性纤维目标图像的待选择的颜色特征、形状特征和纹理特征中选择得到的特征。
2、根据权利要求1所述的棉花异性纤维目标图像的特征选择方法,其特征在于,所述步骤3包括:
根据精英策略选择具有最高适应度的个体直接作为所述新一代种群中的个体;根据轮盘赌法则结合所述个体的选中概率选出用于遗传操作的新种群,所述选中概率与所述个体的适应度成正比。
3、根据权利要求1所述的棉花异性纤维目标图像的特征选择方法,其特征在于,所述步骤4中的交叉概率为随进化代数不断变化的自适应交叉概率,所述交叉概率随着进化代数的不断增加而逐渐变小。
4、根据权利要求1所述的棉花异性纤维目标图像的特征选择方法,其特征在于,所述步骤5中的变异概率为随进化代数不断变化的自适应变异概率,所述变异概率随着进化代数的不断增加而逐渐变小。
5、根据权利要求1所述的棉花异性纤维目标图像的特征选择方法,其特征在于,所述步骤4还包括:
若产生不涵盖所述颜色特征、形状特征和/或纹理特征的个体,则采用随机反转所述个体中某个基因的方式进行修正,以使得所述个体涵盖所述颜色特征、形状特征和纹理特征。
6、根据权利要求1所述的棉花异性纤维目标图像的特征选择方法,其特征在于,所述步骤5还包括:
若产生不涵盖所述颜色特征、形状特征和/或纹理特征的个体,则重新对所述个体根据变异概率进行分段变异,直至所述个体涵盖所述颜色特征、形状特征和纹理特征。
7、一种棉花异性纤维目标图像的特征选择系统,其特征在于,包括:初始化模块、适应度计算模块、比例选择模块、分段交叉模块、分段变异模块、进化终止判断模块和最优特征子集输出模块;
所述初始化模块,用于利用分段式二进制编码方案对棉花异性纤维目标图像的待选择的颜色特征、形状特征和纹理特征进行基因编码,随机生成含有多个分别代表不同特征子集的个体的初始种群;每个所述个体表示的特征子集均涵盖所述颜色特征、形状特征和纹理特征;设置进化代数为0;
所述适应度计算模块,用于计算所述初始种群中每个个体的适应度;所述适应度是按照所述个体表示的特征子集构造的分类器的分类正确率与所述特征子集的加权大小作差得到的;
所述比例选择模块,用于根据所述适应度对所述初始种群中的多个个体进行选择得到最高适应度个体和用于遗传操作的新种群,所述遗传操作包括分段交叉和分段变异;
所述分段交叉模块,用于在所述新种群中随机选择两个个体作为双亲个体,并根据交叉概率进行分段交叉,产生涵盖所述颜色特征、形状特征和纹理特征的两个子个体;并调用所述适应度计算模块来计算所述两个子个体的适应度;
所述分段变异模块,用于对所述两个子个体分别根据变异概率进行分段变异,产生涵盖所述颜色特征、形状特征和纹理特征的两个新一代个体并替换所述双亲个体,并调用所述适应度计算模块来计算所述两个新一代个体的适应度;重复执行分段交叉模块和分段变异模块直到所述新种群中的所有个体都进行所述遗传操作后得到新一代种群;所述遗传操作结束后,令所述进化代数加1;
所述进化终止判断模块,用于判断所述进化代数是否达到指定的最大进化代数或者所述新一代种群中所有个体的平均适应度的差异连续G代都小于指定的阈值T,G和T为经验常数;若是,则执行最优特征子集输出模块,否则,继续执行所述比例选择模块、分段交叉模块和分段变异模块;
所述最优特征子集输出模块,用于将所述新一代种群中具有最高适应度的个体解码,得到所述棉花异性纤维目标图像的最优特征子集,所述最优特征子集为从所述棉花异性纤维目标图像的待选择的颜色特征、形状特征和纹理特征中选择得到的特征。
8、根据权利要求7所述的棉花异性纤维目标图像的特征选择系统,其特征在于,所述比例选择模块包括:
精英策略单元,用于选择具有最高适应度的个体并直接作为所述新一代种群中的个体;
轮盘赌法则单元,用于结合所述个体的选中概率选择用于遗传操作的新种群,所述选中概率与所述个体的适应度成正比。
9、根据权利要求7所述的棉花异性纤维目标图像的特征选择系统,其特征在于,所述分段交叉模块包括:
第一修正单元,用于在产生不涵盖所述颜色特征、形状特征和/或纹理特征的个体时,采用随机反转所述个体中某个基因的方式进行修正,以使得所述个体涵盖所述颜色特征、形状特征和纹理特征。
10、根据权利要求7所述的棉花异性纤维目标图像的特征选择系统,其特征在于,所述分段变异模块包括:
第二修正单元,用于在产生不涵盖所述颜色特征、形状特征和/或纹理特征的个体时,重新对所述个体根据变异概率进行分段变异,直至所述个体涵盖所述颜色特征、形状特征和纹理特征。
CN2009100873929A 2009-06-19 2009-06-19 棉花异性纤维目标图像的特征选择方法和系统 Expired - Fee Related CN101587545B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009100873929A CN101587545B (zh) 2009-06-19 2009-06-19 棉花异性纤维目标图像的特征选择方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009100873929A CN101587545B (zh) 2009-06-19 2009-06-19 棉花异性纤维目标图像的特征选择方法和系统

Publications (2)

Publication Number Publication Date
CN101587545A true CN101587545A (zh) 2009-11-25
CN101587545B CN101587545B (zh) 2011-08-31

Family

ID=41371787

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009100873929A Expired - Fee Related CN101587545B (zh) 2009-06-19 2009-06-19 棉花异性纤维目标图像的特征选择方法和系统

Country Status (1)

Country Link
CN (1) CN101587545B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105631481A (zh) * 2016-01-07 2016-06-01 西安交通大学 基于遗传编程的铁谱磨粒复合特征构造方法
CN106355192A (zh) * 2016-08-16 2017-01-25 温州大学 一种基于混沌灰狼优化的支持向量机方法
CN108280520A (zh) * 2018-02-24 2018-07-13 北京爱尔达电子设备有限公司 大气廓线计算方法及装置
CN108614591A (zh) * 2018-04-27 2018-10-02 宁波工程学院 一种卷绕张力控制系统辨识方法
CN109977227A (zh) * 2019-03-19 2019-07-05 中国科学院自动化研究所 基于特征编码的文本特征提取方法、系统、装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101320476B (zh) * 2008-07-04 2011-06-08 中国农业大学 一种棉花异性纤维图像处理系统及方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105631481A (zh) * 2016-01-07 2016-06-01 西安交通大学 基于遗传编程的铁谱磨粒复合特征构造方法
CN105631481B (zh) * 2016-01-07 2018-12-07 西安交通大学 基于遗传编程的铁谱磨粒复合特征构造方法
CN106355192A (zh) * 2016-08-16 2017-01-25 温州大学 一种基于混沌灰狼优化的支持向量机方法
CN106355192B (zh) * 2016-08-16 2019-12-31 温州大学 一种基于混沌灰狼优化的支持向量机方法
CN108280520A (zh) * 2018-02-24 2018-07-13 北京爱尔达电子设备有限公司 大气廓线计算方法及装置
CN108280520B (zh) * 2018-02-24 2020-07-17 陈书驰 大气廓线计算方法及装置
CN108614591A (zh) * 2018-04-27 2018-10-02 宁波工程学院 一种卷绕张力控制系统辨识方法
CN109977227A (zh) * 2019-03-19 2019-07-05 中国科学院自动化研究所 基于特征编码的文本特征提取方法、系统、装置

Also Published As

Publication number Publication date
CN101587545B (zh) 2011-08-31

Similar Documents

Publication Publication Date Title
CN101587545B (zh) 棉花异性纤维目标图像的特征选择方法和系统
Zheng et al. Unsupervised evolutionary clustering algorithm for mixed type data
CN110458627A (zh) 一种面向用户动态偏好的商品序列个性化推荐方法
CN101706883B (zh) 数据挖掘方法和装置
CN106355192A (zh) 一种基于混沌灰狼优化的支持向量机方法
CN109558677A (zh) 一种基于数据驱动的热轧板凸度预测方法
CN107545315A (zh) 订单处理方法及装置
CN109886807A (zh) 一种p2p平台上基于风险收益管理的个性化推荐方法
CN101482927B (zh) 基于自动视觉检测的异性纤维模糊分类系统及其方法
CN110147389A (zh) 帐号处理方法和装置、存储介质及电子装置
Majumdar Selection of raw materials in textile spinning industry using fuzzy multi-criteria decision making approach
CN112396301A (zh) 基于能源大数据驱动的电力用户需求响应特性控制方法
Kumari et al. Prediction of stock price using machine learning techniques: A survey
CN112990584B (zh) 一种基于深度强化学习的自动生产决策系统及方法
CN109919688B (zh) 一种考虑市场因素的电子烟产品线规划方法
CN107545323A (zh) 商品的物流配送方法、装置、设备及存储介质
CN114217580B (zh) 基于改进型差分进化算法的功能性纤维生产排产方法
CN107155215A (zh) 一种应用归属服务集群的分配方法和装置
CN101853394B (zh) 基于改进蚁群算法的图像特征优化选择方法与系统
van Laarhoven et al. Problem-specific variators in a genetic algorithm for the optimization of drinking water networks
Shah et al. A multi-objective production inventory model with backorder for fuzzy random demand under flexibility and reliability
CN107767035A (zh) 一种基于遗传算法的电能表检测混合流水线调度方法
CN113762415A (zh) 一种基于神经网络的汽车金融产品智能匹配方法和系统
CN112699271A (zh) 一种提升用户在视频网站留存时间的视频推荐系统方法
Trigueros Extracting earnings information from financial statements via genetic algorithms

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110831

Termination date: 20180619