CN104268442A - 一种传感器网络分布式免疫遗传聚类算法 - Google Patents
一种传感器网络分布式免疫遗传聚类算法 Download PDFInfo
- Publication number
- CN104268442A CN104268442A CN201410478397.5A CN201410478397A CN104268442A CN 104268442 A CN104268442 A CN 104268442A CN 201410478397 A CN201410478397 A CN 201410478397A CN 104268442 A CN104268442 A CN 104268442A
- Authority
- CN
- China
- Prior art keywords
- chromosome
- sensor network
- illustrate
- clustering algorithm
- immune genetic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
本发明涉及一种适用于传感器网络的分布式免疫遗传k-means聚类算法。一种传感器网络分布式免疫遗传聚类算法,包括以下步骤:染色体编码、种群初始化、选择、交叉、变异操作。本文无线传感器网络的分布式kmeans聚类算法.针对传统k-means算法的缺点,将免疫机制引入到遗传算法对k-means算法进行改进,提出分布式免疫遗传k-means聚类算法,实验证明了该算法对数据聚类具有明显的优越性能,收敛速度快,收敛精度高,聚类稳定性强准确率也大。
Description
技术领域
本发明涉及一种适用于传感器网络的分布式免疫遗传k-means聚类算法。
背景技术
聚类是数据挖掘的一个重要研究领域,是一种重要的无监督学习方法,其目的是将对象集合分成若干个特征相似的子集合(又叫类或簇) ,簇内对象相似性尽可能大,簇间对象差异性也尽可能大。
无线传感器网络是分布式网络,而现有的传统聚类算法的工作方式都是集中式聚类,根本不合适在无线传感器网络中使用.在WSN 上进行数据聚类采用传统集中式聚类算法会产生大量的数据通信,进而消耗节点能量,最终导致网络寿命降低。
发明内容
本发明旨在提出一种适用于传感器网络的分布式免疫遗传聚类算法。
一种传感器网络分布式免疫遗传聚类算法,包括以下步骤:染色体编码、种群初始化、选择、交叉、变异操作。
优选地,所述染色体编码方案为:k 个簇心构成一条染色体,即Z1 ,Z2 , Zk;由前面传感器数据的组成知Zi 也有q 个属性,即Zi =(zi1,zi2 , ,ziq),(i= 1,2, ,k) ,则每条染色体的浮点码串的长度是k q 。
优选地,所述种群初始化为:随机地从传感器网络数据集合X中选k个数据作为一条初始染色体进行浮点数编码,重复做p次就产生p个初始染色体;初始种群就是由这p 个染色体组成。
或者优选地,所述选择染色体的概率为:
或者优选地,两个父代染色体是否进行交叉操作由父代间的相似程度来决定;只有当两个父代染色体的相似度xs 小于阈值δ 时才能进行交叉;假设有两个父代染色体t1 和t2 ,则这两个染色体的相似度定义如下: XS(i,j)= len/(k q)。
或者优选地,所述一种传感器网络分布式免疫遗传聚类算法,染色体里的基因zij表示第i个簇心的第j维值,则变异后该染色体的基因z’ ij为:
本文无线传感器网络的分布式kmeans聚类算法.针对传统k-means 算法的缺点,将免疫机制引入到遗传算法对k-means 算法进行改进,提出分布式免疫遗传k-means 聚类算法.实验证明了该算法对数据聚类具有明显的优越性能,收敛速度快,收敛精度高,聚类稳定性强准确率也大。
具体实施方式
一种传感器网络分布式免疫遗传聚类算法,包括以下步骤:染色体编码、种群初始化、选择、交叉、变异操作。
鉴于传感器网络数据集合X 中的数据个数n 总是远远比其聚类数目k大,故本文算法使用基于簇中心的浮点数编码方式会更有效。k个簇心构成一条染色体,即Z1 ,Z2 , Zk;由前面传感器数据的组成知Zi也有q个属性,即Zi =(zi1,zi2 , ,ziq),(i= 1,2, ,k) ,则每条染色体的浮点码串的长度是k q 。
随机地从传感器网络数据集合X中选k个数据作为一条初始染色体进行浮点数编码,重复做p次就产生p个初始染色体.初始种群就是由这p个染色体组成。
适应度函数作为染色体遗传进化过程中优胜劣汰的主要根据,是评价染色体性能好坏的指标。,本方法采用的适应度函数为:
t是染色体编号,t ∈[1,p] .当f t 越大,目标函数E越小,簇心间距越大,聚类效果就越好,说明产生的k个簇越紧凑和独立.反之,当ft越小,目标函数E 越大,簇心间距越小,聚类效果就越差.同时在两处用到E,节省了在空间和时间上的消耗。
选择是按照遗传进化中适者生存的原则来开展的操作,适应度越高的染色体得到参加后代繁殖的机会也就越高;所述选择染色体的概率为:
式中,p种群大小,t = 1,2, ,p,针对基于标准遗传的聚类算法在前期收敛速度快,而后期当染色体之间的个体差异变小时则收敛速度变慢,本文研究将免疫系统的浓度概念应用于遗传算法的选择操作,以此来调整染色体个体被选中的概率,从而避免上述不足和缺点。
染色体浓度定义如下:
den=
则得到这d条染色体的个体浓度概率是pden=(1-den)/p,其它的染色体浓度概率是pden=(1-den+den2)/p,全部染色体的浓度概率总和是1。
得到选择染色体t 的最终概率是:
交叉操作是指两个父代染色体交换部分基因而得到新的子代染色体.交叉是产生新染色体的重要方法,同时对算法的全局搜索能力起到直接的影响作用.为确保父代染色体的优良性能保留到子代,本文的交叉策略使用自识别交叉,即两个父代染色体是否进行交叉操作由父代间的相似程度来决定。只有当两个父代染色体的相似度xs小于阈值δ时才能进行交叉。假设有两个父代染色体t1 和t2 ,则这两个染色体的相似度定义如下: XS(i,j)= len/(k q)。
其中len是t1和t2的最长相同子串的长度,k q是染色体的浮点码串的编码长度,i和j是染色体中的基因位置序号,0<i,j<k q ,同时i ≠ j。
阈值δ 定义如下:
式中δ ∈ (1/3,2/3],g是目前进化代数,而gmax是最大进化迭代代数。
变异是一种局部搜索技术,对种群里染色体的多样性有贡献,能避免早熟现象发生.变异操作就是染色体编码串里的基因位上的基因值按变异概率发生随机改变后形成一个新的染色体.本文对基因的变异采用自适应方法。.由编码方案知染色体里的基因zij表示第i个簇心的第j维值,则变异后该染色体的基因z’ ij为:
根据均匀分布原则,λ应在[-(f-fmin )/(fmax -fmin) ,(f-fmin )/(fmax -fmin] 内产生,f 为变异染色体的适应度值,fmin 和fmax 是当代种群里染色体性能最差和最优的染色体个体适应度值.这样不但确保了染色体的多样性,而且极大地提高算法的搜索速度和效率。
Claims (6)
1.一种传感器网络分布式免疫遗传聚类算法,其特征在于:包括以下步骤:染色体编码、种群初始化、选择、交叉、变异操作。
2.如权利要求1所述一种传感器网络分布式免疫遗传聚类算法,其特征在于:所述染色体编码方案为:k 个簇心构成一条染色体,即Z1 ,Z2 , Zk ;由前面传感器数据的组成知Zi也有q 个属性,即Zi =(zi1,zi2 , ,ziq ),(i=1,2, ,k),则每条染色体的浮点码串的长度是k q 。
3.如权利要求1所述一种传感器网络分布式免疫遗传聚类算法,其特征在于:所述种群初始化为:随机地从传感器网络数据集合X中选k个数据作为一条初始染色体进行浮点数编码,重复做p次就产生p个初始染色体;初始种群就是由这p个染色体组成。
4.如权利要求1所述一种传感器网络分布式免疫遗传聚类算法,其特征在于:所述选择染色体的概率为:
。
5.如权利要求1所述一种传感器网络分布式免疫遗传聚类算法,其特征在于:两个父代染色体是否进行交叉操作由父代间的相似程度来决定;只有当两个父代染色体的相似度xs小于阈值δ时才能进行交叉;假设有两个父代染色体t1和t2 ,则这两个染色体的相似度定义如下:xs(i,j)= len/(kq)。
6.如权利要求1所述一种传感器网络分布式免疫遗传聚类算法,其特征在于:染色体里的基因zij表示第i个簇心的第j维值,则变异后该染色体的基因z’ ij为:
。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410478397.5A CN104268442A (zh) | 2014-09-18 | 2014-09-18 | 一种传感器网络分布式免疫遗传聚类算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410478397.5A CN104268442A (zh) | 2014-09-18 | 2014-09-18 | 一种传感器网络分布式免疫遗传聚类算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104268442A true CN104268442A (zh) | 2015-01-07 |
Family
ID=52159963
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410478397.5A Pending CN104268442A (zh) | 2014-09-18 | 2014-09-18 | 一种传感器网络分布式免疫遗传聚类算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104268442A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105634812A (zh) * | 2015-12-31 | 2016-06-01 | 河南科技大学 | 一种基于免疫算法的网络吞吐量优化参数获取方法 |
CN109890040A (zh) * | 2019-03-11 | 2019-06-14 | 中国科学院上海微系统与信息技术研究所 | 面向高可靠低时延无线传感器网络的优化算法 |
-
2014
- 2014-09-18 CN CN201410478397.5A patent/CN104268442A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105634812A (zh) * | 2015-12-31 | 2016-06-01 | 河南科技大学 | 一种基于免疫算法的网络吞吐量优化参数获取方法 |
CN105634812B (zh) * | 2015-12-31 | 2019-05-10 | 河南科技大学 | 一种基于免疫算法的网络吞吐量优化参数获取方法 |
CN109890040A (zh) * | 2019-03-11 | 2019-06-14 | 中国科学院上海微系统与信息技术研究所 | 面向高可靠低时延无线传感器网络的优化算法 |
CN109890040B (zh) * | 2019-03-11 | 2021-09-03 | 中国科学院上海微系统与信息技术研究所 | 面向高可靠低时延无线传感器网络的优化方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105430707B (zh) | 一种基于遗传算法的无线传感网多目标优化路由方法 | |
CN107275801B (zh) | 一种l型阵列天线的基于获得性遗传的阵元排布方法 | |
Rezaeipanah et al. | A Hybrid Approach for Prolonging Lifetime of Wireless Sensor Networks Using Genetic Algorithm and Online Clustering. | |
CN107122843A (zh) | 一种基于改进遗传算法的旅行商问题求解方法 | |
CN104392283A (zh) | 基于人工鱼群算法的交通路径搜索方法 | |
CN104866904A (zh) | 一种基于spark的遗传算法优化的BP神经网络并行化方法 | |
CN105631416B (zh) | 采用新型密度聚类进行人脸识别的方法 | |
CN108882256B (zh) | 一种无线传感器网络节点覆盖优化方法和装置 | |
CN109598092A (zh) | 融合bp神经网络和多父代遗传算法的空气源热泵多目标优化设计方法 | |
CN108737191A (zh) | 面向超密集无线传感器网基于无监督学习的拓扑控制方法 | |
CN104239434A (zh) | 一种基于带有多样化半径技术的小生境遗传算法的聚类方法 | |
CN106789320B (zh) | 一种用于优化无线传感器网络拓扑的多种群协同进化方法 | |
CN103886396A (zh) | 一种人工鱼群与粒子群混合优化的确定方法 | |
CN104268442A (zh) | 一种传感器网络分布式免疫遗传聚类算法 | |
CN110059405A (zh) | X结构下带差分进化的高质量Steiner最小树构建方法 | |
CN105260787A (zh) | 一种基于遗传算法的分拣作业均衡调度方法 | |
CN108830292A (zh) | 数据分类模型优化方法及分类方法 | |
CN104573004A (zh) | 一种基于双阶遗传计算的基因表达数据的双聚类算法 | |
CN103116805B (zh) | 一种更新遗传种群的分段替换方法 | |
CN104732522A (zh) | 一种基于多态蚁群算法的图像分割方法 | |
Zhang et al. | Dpp-based client selection for federated learning with non-iid data | |
Zha et al. | A study of the design and parameters optimization of BP neural network using improved GEP | |
CN109451554B (zh) | 一种无线网络路径优化方法及系统 | |
CN108200623A (zh) | 一种基于遗传算法的集中式路径计算和节能方法 | |
Shankar et al. | Integrated cuckoo and monkey search algorithm for energy efficient clustering in wireless sensor networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20150107 |
|
WD01 | Invention patent application deemed withdrawn after publication |