CN105373812B - 基于组遗传算法的图像属性聚类方法 - Google Patents
基于组遗传算法的图像属性聚类方法 Download PDFInfo
- Publication number
- CN105373812B CN105373812B CN201510938424.7A CN201510938424A CN105373812B CN 105373812 B CN105373812 B CN 105373812B CN 201510938424 A CN201510938424 A CN 201510938424A CN 105373812 B CN105373812 B CN 105373812B
- Authority
- CN
- China
- Prior art keywords
- chromosome
- group
- attribute
- image
- genetic algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/231—Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2111—Selection of the most significant subset of features by using evolutionary computational techniques, e.g. genetic algorithms
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Physiology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于组遗传算法的图像属性聚类方法,包括:第一步骤:针对N幅图像,随机生成N个染色体作为初始种群,其中每个染色体代表一个可能的属性聚类结果,每幅图像有m个属性,并且将图像的属性分成多个组;第二步骤:计算每个染色体的适应度函数值;第三步骤:根据计算出的染色体适应度函数值,使用赌轮选择策略选择下一代N个染色体;第四步骤:对染色体的组部分执行交叉算子;第五步骤:对染色体的属性部分执行变异算子;第六步骤:对染色体的属性部分执行反转算子;第七步骤:重复第二步骤至第六步骤直到完成给定的遗传代数;第八步骤:输出完成给定的遗传代数得到的最优适应度函数值的染色体。
Description
技术领域
本发明涉及图像识别领域,更具体地说,本发明涉及一种基于组遗传算法的图像属性聚类方法。
背景技术
基于学习的图像识别方法在过去的几年中取得了很大进步。对特定的对象类,特别是人脸和汽车,都有比较可靠和高效的基于底层特征(例如SIFT(Scale InvariantFeature Transform)特征或者HOG(Histogram of Oriented Gradient)特征)的识别。但是这些图像的底层特征不能很好地反映图像类别信息。最近新的研究资料提出使用图像固有属性进行分类的方法。属性是指可以由人指定名称并且能在图像中观察到的特性,可以表示图像中对象是否存在,可以描述图像中对象的颜色、形状、材质、部件、类别及功能,也可以表示图像中场景的类别以及上下文信息等。因此基于图像的属性特征进行分类的研究越来越多。表示一个图像的属性特征有很多,如何从这些众多属性特征中找到对于图像分类有价值的属性至关重要。基于图像属性聚类的方法就是一种属性选择的方法,把相似的属性归为一组,这样当缺失某些属性的情况下,可以由同组的其他属性来进行替代。进行属性选择,实施属性聚类的方法有很多种,如有粒子群算法,遗传算法等。
粒子群算法PSO(particle swarm optimization)是由Kennedy和Eberhart在研究鸟类和鱼类的群体行为基础上于1995年提出的一种群智能算法。其思想来源于人工生命和演化计算理论,模仿鸟群飞行觅食行为,通过鸟集体协作使群体达到最优。PSO模拟鸟群的捕食行为,每个优化问题的解都是搜索空间中的一只鸟,称之为“粒子”。所有的粒子都有一个由被优化的函数决定的适应值,每个粒子还有一个速度决定它们飞翔的方向和距离。然后粒子们就追随当前的最优粒子在解空间中进行搜索,直至搜索到最优解。
粒子群算法采用实数求解,并且需要调整的参数较少,易于实现。但是该算法也存在易于陷入局部最优,出现早熟收敛的问题。在计算粒子的速度时,将惯性权重引入算法。通过实验研究表明,该参数对算法的性能有较大的影响。如果w值较大,有利于跳出局部最优,进行全局寻优;而w值较小,有利于局部寻优,加速算法收敛。一般的做法是将w值随着迭代次数的增加而线性减少。但是这样做较依赖于迭代次数,不能反映实际粒子变化的情况,不能反映实际优化搜索过程。
遗传算法来源于达尔文的进化论、魏茨曼的物种选择学说和孟德尔的群体遗传学说。其基本思想是模拟自然界遗传机制和生物进化论而形成的一种过程搜索最优解的算法。它模拟了自然选择和自然遗传过程中发生的繁殖、交配和变异现象,根据适者生存、优胜劣汰的自然法则,通过选择、交叉和变异等遗传算子,使群体一代一代地进行到搜索空间中越来越好的区域,直至获得最优解。
遗传算法有三个基本算子:选择、交叉和变异。这三个算子的实现也有许多参数,如交叉概率和变异概率,并且这些参数的选择严重影响解的品质,而目前这些参数的选择大部分是依靠经验。遗传算法善长全局搜索,然而其局部搜索能力却明显不足,搜索到最优解或满意解的速度太慢,存在易陷入局部最优解和选择压力过大造成的早熟收敛等问题。而且由于交叉变异等操作,不同的染色体可能代表相同的属性聚类结果,这样加大了搜索的范围,浪费了时间。
发明内容
本发明所要解决的技术问题是针对现有技术中存在上述缺陷,提供一种基于组遗传算法的图像属性聚类方法,将组遗传算法运用于图像的属性聚类问题,在遗传算法中加入组的信息,解决了遗传算法进行染色体编码的时候,随机的特性,避免了在搜索过程中,不同的染色体对应同一个属性聚类的结果,缩短了搜索的时间。在遗传算法中遗传算子不能区分哪些染色体是对应同一个属性聚类结果,具有相同聚类结果的染色体通过遗传算子的操作,生成不同的后代染色体,这样增加了属性聚类的难度。组遗传算法使用了不同的编码方式和不同的操作算子解决了这个问题。
为了实现上述技术目的,根据本发明,提供了一种基于组遗传算法的图像属性聚类方法,包括:
第一步骤:针对N幅图像{I1,I2,…,In},随机生成N个染色体作为初始种群,其中每个染色体代表一个可能的属性聚类结果,每幅图像有m个属性并且将图像的属性分成多个组;
第二步骤:计算每个染色体的适应度函数值“Fitness”:
其中,
其中表示属性到同一组中的种子属性之间的距离,Rj表示组,Sepj表示不同组中的种子属性之间的最小距离,同一组中的种子属性随机产生;
第三步骤:根据计算出的染色体适应度函数值,使用赌轮选择策略选择下一代N个染色体;
第四步骤:对染色体的组部分执行交叉算子;
第五步骤:对染色体的属性部分执行变异算子;
第六步骤:对染色体的属性部分执行反转算子;
第七步骤:重复第二步骤至第六步骤直到完成给定的遗传代数MaxGen;
第八步骤:输出完成给定的遗传代数MaxGen得到的最优适应度函数值的染色体。
优选地,在第四步骤中,任意选两个染色体,C1作为基染色体,C2作为插入块染色体;其中,仅仅选择所述两个染色体的组部分以进行组部分的交叉:
在C1中随机生成插入位置P,在C2中随机生成插入块的起始位置S和插入块的长度M;
假设P=2,S=3,M=2,则生成新的染色体为
随后,对新染色体进行去除重复信息处理,即去除第一个双亲染色体组部分的重复信息,|Cnew|表示新染色体中非空组的数目;
如果|Cnew|<4,随机选择一个组,把选择的组分成两个组,而且重复这个过程直到出现4个组为止;
如果|Cnew|>4,进行赌轮选择把选中的组移除,移除组包含的属性被随机分配到其他组里。
优选地,在第五步骤中,随机地选定一个属性,把选定的属性任意分配给另一个组,从而实现变异。
优选地,在第六步骤中,首先随机生成一个介于0-1之间的数,如果这个数大于反转率,则组的顺序重新排列。
附图说明
结合附图,并通过参考下面的详细描述,将会更容易地对本发明有更完整的理解并且更容易地理解其伴随的优点和特征,其中:
图1示意性地示出了根据本发明优选实施例的基于组遗传算法的图像属性聚类方法的流程图。
需要说明的是,附图用于说明本发明,而非限制本发明。注意,表示结构的附图可能并非按比例绘制。并且,附图中,相同或者类似的元件标有相同或者类似的标号。
具体实施方式
为了使本发明的内容更加清楚和易懂,下面结合具体实施例和附图对本发明的内容进行详细描述。
在具体描述本发明之前,先说明基于组遗传算法的属性聚类方法。基于组遗传算法的属性聚类方法包含染色体的编码表示,交叉,变异和反向转换这几部分。具体如下所述:
(1)染色体编码表示
一个染色体包含两部分内容,一个是对象部分,一个是组部分,如一个染色体表示成ABCBADC:ABCD,对象部分ABCBADC代表第1、第5个属性属于A组,第2、第4个属性属于B组,第3、第7个属性属于C组。第6个属性属于D组。组部分ABCD表示这个染色体包含了7个属性,它们分成了4个组。
(2)交叉
组遗传算法的交叉是基于组信息,而不是对象信息。组交叉操作如下:
(a).在第一个双亲染色体的组部分中选择一个交叉点,在另一个双亲染色体的组部分中随机选择一个交叉部分。
(b).把第一个双亲染色体复制到一个空的染色体中,把第二个双亲染色体组部分选定的交叉部分插入第一个双亲染色体的组部分,从选定的交叉点插入。
(c).对新的染色体进行去除重复信息处理,即去除第一个双亲染色体组部分的重复信息。
(d).根据问题的约束条件调整组的结果。如果生成的后代,组的数目小于初始组的数目,则把其中拥有最多属性的组分裂成两组;如果组的数目大于初始组的数目,则这一组要去除,这个组中的属性归并到其他组。
总之要限制组的数目和初始值一致。
(e).把(a)-(d)步骤应用到其他对双亲染色体,生成新的孩子染色体。
(3)变异和反转
变异是指创建一个新的组,消除一个已经存在的组,交换组间信息。反转是指改变组部分基因的顺序,保证组信息有机会传递到下一代。这两个操作都是为了避免陷入局部最优解。
下面具体描述本发明的具体实施例。图1示意性地示出了根据本发明优选实施例的基于组遗传算法的图像属性聚类方法的流程图。其中,所述图像属性聚类方法的输入为m个属性和g个聚类簇;输出为一个合适属性聚类结果。
如图1所示,根据本发明优选实施例的基于组遗传算法的图像属性聚类方法包括:
第一步骤S1:针对N幅图像{I1,I2,…,In},随机生成N个染色体作为初始种群,其中每个染色体代表一个可能的属性聚类结果,每幅图像有m个属性并且将图像的属性分成多个组;
例如,随机生成5个染色体作为初始种群,每个染色体代表一个可能的属性聚类结果。假设N幅图像{I1,I2,…,In},每幅图像有7个属性分成4个组。染色体由两部分构成,属性部分和组部分,如下表所示:
第二步骤S2:计算每个染色体的适应度函数值“Fitness”:
其中,
其中表示属性到同一组中的种子属性之间的距离,Rj表示组,Sepj表示不同组中的种子属性之间的最小距离,同一组中的种子属性随机产生;
第三步骤S3:根据计算出的染色体适应度函数值,使用赌轮选择策略选择下一代N个(例如,5个)染色体。
第四步骤S4:对染色体的组部分执行交叉算子;
具体地,例如,任意选两个染色体,C1作为基染色体,C2作为插入块染色体。只选择它们的组部分,主要进行组部分的交叉。
在C1中随机生成插入位置P,在C2中随机生成插入块的起始位置S和插入块的长度M。
假设P=2,S=3,M=2,则生成新的染色体为
对新染色体进行去除重复信息处理,即去除第一个双亲染色体组部分的重复信息,|Cnew|表示新染色体中非空组的数目。
如果|Cnew|<4,随机选择一个组,把它分成两个组,重复这个过程,直到出现4个组为止。
如果|Cnew|>4,进行赌轮选择把选中的组移除,移除组包含的属性被随机分配到其他组里。一个拥有较少属性的组容易被移除。
第五步骤S5:对染色体的属性部分执行变异算子;其中,随机地选定一个属性,把选定的属性任意分配给另一个组,从而实现变异;
第六步骤S6:对染色体的属性部分执行反转算子;
其中,反转算子是为了帮助交叉算子选择不同的组的混合。例如,首先随机生成一个0-1之间的数,如果这个数大于反转率q,则组的顺序重新排列,对换不同组中的属性值,如将g1组的属性换到g3组中,属于g3组的属性换到g1组中,反转率q=0.2。
第七步骤S7:重复第二步骤S2至第六步骤S6直到完成给定的遗传代数MaxGen;例如令MaxGen=100。
第八步骤S8:在MaxGen遗传代数中,适应度函数值趋于收敛,这时达到最优,由此输出最优适应度函数值的染色体。
根据本发明的基于组遗传算法的图像属性聚类方法的优势在于:1)对染色体编码时,加入的组的信息,为属性聚类提供了依据,减少了冗余,缩小了解的搜索范围。2)对属性进行聚类时,特殊的交叉算子使得孩子染色体继承了双亲染色体的特征。3)算法有着快速的全局寻优能力,能够快速跳出局部极值陷阱。基于以上原因,该算法能很快得到属性聚类结果。
本发明实现了研究方法上的更新,将组遗传算法引入图像属性聚类问题,根据该算法快速全局寻优的特点,能够高效地得到属性聚类的结果。而且,本发明通过属性聚类,处于同一组的属性,有着相似的特征;当某些属性值缺失的情况下,可以由同一组的其他属性替代。由于图像属性众多,可以通过属性聚类的方法,减少属性量,节省了存储空间,对图像分类识别有着积极的意义。
此外,需要说明的是,除非特别说明或者指出,否则说明书中的术语“第一”、“第二”、“第三”等描述仅仅用于区分说明书中的各个组件、元素、步骤等,而不是用于表示各个组件、元素、步骤之间的逻辑关系或者顺序关系等。
可以理解的是,虽然本发明已以较佳实施例披露如上,然而上述实施例并非用以限定本发明。对于任何熟悉本领域的技术人员而言,在不脱离本发明技术方案范围情况下,都可利用上述揭示的技术内容对本发明技术方案作出许多可能的变动和修饰,或修改为等同变化的等效实施例。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。
Claims (4)
1.一种基于组遗传算法的图像属性聚类方法,其特征在于包括:
第一步骤:针对N幅图像{I1,I2,…,In},随机生成N个染色体作为初始种群,其中每个染色体代表一个可能的属性聚类结果,每幅图像有m个属性并且将图像的属性分成多个组;
第二步骤:计算每个染色体的适应度函数值:
其中,
其中表示属性到同一组中的种子属性之间的距离,Rj表示组,Sepj表示不同组中的种子属性之间的最小距离,同一组中的种子属性随机产生;
第三步骤:根据计算出的染色体适应度函数值,使用赌轮选择策略选择下一代N个染色体;
第四步骤:对染色体的组部分执行交叉算子;
第五步骤:对染色体的属性部分执行变异算子;
第六步骤:对染色体的属性部分执行反转算子;
第七步骤:重复第二步骤至第六步骤直到完成给定的遗传代数MaxGen;
第八步骤:输出完成给定的遗传代数MaxGen得到的最优适应度函数值的染色体。
2.根据权利要求1所述的基于组遗传算法的图像属性聚类方法,其特征在于,在第四步骤中,任意选两个染色体,C1作为基染色体,C2作为插入块染色体;其中,仅仅选择所述两个染色体的组部分以进行组部分的交叉:
在C1中随机生成插入位置P,在C2中随机生成插入块的起始位置S和插入块的长度M;
假设P=2,S=3,M=2,则生成新的染色体为
随后,对新染色体进行去除重复信息处理,即去除第一个双亲染色体组部分的重复信息,|Cnew|表示新染色体中非空组的数目;
如果|Cnew|<4,随机选择一个组,把选择的组分成两个组,而且重复这个过程直到出现4个组为止;
如果|Cnew|>4,进行赌轮选择把选中的组移除,移除组包含的属性被随机分配到其他组里。
3.根据权利要求1或2所述的基于组遗传算法的图像属性聚类方法,其特征在于,在第五步骤中,随机地选定一个属性,把选定的属性任意分配给另一个组,从而实现变异。
4.根据权利要求1或2所述的基于组遗传算法的图像属性聚类方法,其特征在于,在第六步骤中,首先随机生成一个介于0-1之间的数,如果这个数大于反转率,则组的顺序重新排列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510938424.7A CN105373812B (zh) | 2015-12-15 | 2015-12-15 | 基于组遗传算法的图像属性聚类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510938424.7A CN105373812B (zh) | 2015-12-15 | 2015-12-15 | 基于组遗传算法的图像属性聚类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105373812A CN105373812A (zh) | 2016-03-02 |
CN105373812B true CN105373812B (zh) | 2019-01-25 |
Family
ID=55375993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510938424.7A Expired - Fee Related CN105373812B (zh) | 2015-12-15 | 2015-12-15 | 基于组遗传算法的图像属性聚类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105373812B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106485658A (zh) * | 2016-09-21 | 2017-03-08 | 湖南子午天地科技文化发展有限公司 | 一种用于图像拼接的最优缝合线搜索方法 |
CN107527152B (zh) * | 2017-08-31 | 2020-11-13 | 广东工业大学 | 一种基于缺件管理的舰船管件排程的方法与装置 |
CN107958055A (zh) * | 2017-11-29 | 2018-04-24 | 上海电机学院 | 一种基于互信息的图像属性关系的表示方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102930291A (zh) * | 2012-10-15 | 2013-02-13 | 西安电子科技大学 | 用于图形图像的k近邻局部搜索遗传自动聚类方法 |
CN103020979A (zh) * | 2013-01-09 | 2013-04-03 | 西安电子科技大学 | 基于稀疏遗传聚类的图像分割方法 |
-
2015
- 2015-12-15 CN CN201510938424.7A patent/CN105373812B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102930291A (zh) * | 2012-10-15 | 2013-02-13 | 西安电子科技大学 | 用于图形图像的k近邻局部搜索遗传自动聚类方法 |
CN103020979A (zh) * | 2013-01-09 | 2013-04-03 | 西安电子科技大学 | 基于稀疏遗传聚类的图像分割方法 |
Non-Patent Citations (3)
Title |
---|
《Hybridized Improed Genetic Algorithm with Variable Length Chromosome for Image Clustering》;Venkatesh Katari 等;《IJCSNS International Journal of Computer Science and Network Security》;20071130;第7卷(第11期);第121-131页 |
《基于改进遗传算法遥感图像非监督分类研究》;陈忠 等;《计算机工程与应用》;20081231;第44卷(第19期);第178-179页,第202页 |
《基于遗传聚类算法和小波变换特征的自动分类》;李霆 等;《计算机工程》;20030228;第29卷(第2期);第153-154页,第254页 |
Also Published As
Publication number | Publication date |
---|---|
CN105373812A (zh) | 2016-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fielding et al. | Evolving image classification architectures with enhanced particle swarm optimisation | |
Du et al. | Search and optimization by metaheuristics | |
Stanley | Compositional pattern producing networks: A novel abstraction of development | |
Hraber et al. | The ecology of Echo | |
Tang et al. | Evolutionary computation | |
Nichele et al. | Ca-neat: evolved compositional pattern producing networks for cellular automata morphogenesis and replication | |
CN106503654A (zh) | 一种基于深度稀疏自编码网络的人脸情感识别方法 | |
CN105373812B (zh) | 基于组遗传算法的图像属性聚类方法 | |
Galletly | An overview of genetic algorithms | |
Zhang et al. | Evolving neural network classifiers and feature subset using artificial fish swarm | |
Akrour et al. | Continuous action reinforcement learning from a mixture of interpretable experts | |
Pigozzi et al. | Factors impacting diversity and effectiveness of evolved modular robots | |
Shariff et al. | Artificial (or) fake human face generator using generative adversarial network (GAN) machine learning model | |
Hong et al. | Modeling and path generation approaches for crowd simulation based on computational intelligence | |
KR102508105B1 (ko) | 외래생물 확산을 예측하는 방법 | |
de Campos et al. | Evolving artificial neural networks through l-system and evolutionary computation | |
Coleman et al. | Automated generation of environments to test the general learning capabilities of ai agents | |
Laxmi et al. | Identification of medicinal plant by fuzzy local binary pattem and multi objective genetic algorithm | |
Sirisin et al. | A new technique Gray scale display of input data using shooting SOM and genetic algorithm | |
Baptista | Complexity and emergence in societies of agents | |
Liu et al. | A role modelling approach for crowd animation in a multi-agent cooperative system | |
Drchal | Evolution of recurrent neural networks | |
Morrison | Co-evolution and genetic algorithms. | |
Pigozzi | Harnessing the Power of Collective Intelligence: the Case Study of Voxel-based Soft Robots | |
Dzwinel et al. | Aging in hostile environment modeled by cellular automata with genetic dynamics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190125 Termination date: 20211215 |