CN111950598A - 一种基于K-Means算法的梭子蟹群体个性分类方法及应用 - Google Patents

一种基于K-Means算法的梭子蟹群体个性分类方法及应用 Download PDF

Info

Publication number
CN111950598A
CN111950598A CN202010695257.9A CN202010695257A CN111950598A CN 111950598 A CN111950598 A CN 111950598A CN 202010695257 A CN202010695257 A CN 202010695257A CN 111950598 A CN111950598 A CN 111950598A
Authority
CN
China
Prior art keywords
individual
portunids
cluster
personality
shy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010695257.9A
Other languages
English (en)
Inventor
王芳
朱柏杉
杨超
路允良
宿宪朋
刘大鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ocean University of China
Original Assignee
Ocean University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ocean University of China filed Critical Ocean University of China
Priority to CN202010695257.9A priority Critical patent/CN111950598A/zh
Publication of CN111950598A publication Critical patent/CN111950598A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于K‑Means算法的梭子蟹群体个性分类方法及应用,包括梭子蟹的暂养,梭子蟹行为的拍摄,选取勇敢性、活跃性、犹豫性作为个性特征进行量化及统计,基于以上特征利用聚类中心方法对梭子蟹进行分类,将梭子蟹个体分为勇敢型、羞怯型两个类别,并可利用超平面将其表征出来。本发明采用手肘法确定中心数量和最优k值,利用数据本身进行聚类,提高了分类的可靠性。本发明通过聚类分析对原始数据进行更加全面直接地分析,减少中间地带的范围,对梭子蟹个性的分类更加精确。本发明除可以根据个性特征进行分类,还可以评估不同个性特征对梭子蟹个性影响大小,在生产中可应用于梭子蟹优良品种的选育,按照个性对个体进行分类成为新的选育标准。

Description

一种基于K-Means算法的梭子蟹群体个性分类方法及应用
技术领域
本发明属于动物行为学领域,具体说是一种基于K-Means算法的梭子蟹群体个性分类方法及应用。
背景技术
动物表型特征(如形态、行为和生理)在种内水平上表现出变异与多样性,并在不同环境下保持相对 稳定(Biro and Stamps.,2010),这种个体间稳定的表型差异称为个性。动物的个性特征包括勇敢性、开拓 性、活动性、攻击性、社会性和犹豫性等(Brown etal.,2005)。个性差异在物种内部普遍存在,这种差异 能够影响梭子蟹争斗等行为表现和生理响应机制(Careau,et al.,2010),并进而影响到动物对环境的适应。
以往研究中,动物个性差异对自然界或实验室内动物的影响并未引起足够重视,在常见的梭子蟹行为 实验中也极易忽略其个性差异对实验结果的影响。比起行为学其他方面研究的开展,动物个性的研究远远 不足,这主要是与个性分类标准缺乏有关。此外,梭子蟹个性特征对其存活率、生长状况等的影响并未得 到关注。在以往的梭子蟹个性判别及分类中,多采用对已有数据进行人工分类的方法,分类类别的数目和 尺度受主观因素影响极大,同一批次实验梭子蟹在不同实验人员观测和分类时也会有较大差异,对个性分 类中类别之间模糊区域个体的判别很困难。
近年来,对多个个性指标实现综合判别成为梭子蟹个性特征研究的瓶颈。在研究中多采用PCA分析、 相关性分析等方法对其多个个性指标进行分析,然而必须注意到,PCA只是单纯通过对原始数据降维,剔 除一些具有强相关性的因素,并分析得出影响力相对最大的因素,所以PCA并不适用于对个性类型进行 分类。相关性分析只是单纯地描述各实验数据之间的相关性,来描述生物各方面之间的关系特性(Su,et al., 2019),但是无法进行聚类分析,也无法分析多因素对结果的影响权重。
目前的分析方法严重阻碍了梭子蟹个性研究的深入发展。因此,解决分类标准问题,消除分类中的主 观因素,明确模糊区域的个性分类判别,解决多个梭子蟹个性指标的总和判别问题,成为梭子蟹个性研究 中的关键,也为梭子蟹个性的应用和梭子蟹行为学的进一步发展奠定基础。
机器学习是一种对数据结果进行客观性挖掘的重要方法,能够充分利用数据的统计学特征,在基于数 据的内在规律的基础上得出更为科学的结果。近年来,ML在动物行为分析中的作用也日益受到关注 (Valletta,et al.,2017)。研究证实,ML可较经典统计方法能更好地从复杂多维变量中发现动物行为间的关 系(Valletta,et al.,2017)。本发明从数据的客观规律出发,基于机器学习方法,利用无监督学习K-Means 算法对梭子蟹个性进行聚类分析。在聚类分析完成后,进一步利用支持向量机(Support Vector Machine, SVM)算法分析梭子蟹个性特征,以期为提高梭子蟹个性识别的客观性和精确性提供科学参考。
以下给出检索的相关文献:
Biro,P.A.,and Stamps,J.A.2010.Do consistent individual differences inmetabolic rate promote consistent individual differences in behavior?Trendsin Ecology and Evolution,25(11):653-659.
Brown,C.,Jones,F.,and Braithwaite,V.2005.In situ examination ofboldness–shyness traits in the tropical poeciliid,Brachyraphisepiscopi.Animal Behaviour,70(5):1003-1009.
Belgrad,B.A.,Karan,J.,and Griffen,B.D.2017.Individual personalityassociated with interactions between physiological condition and theenvironment.Animal Behaviour,123:277-284.
Brodin,T.,and Drotz,M.K.2014.Individual variation in dispersalassociated behavioral traits of the invasive Chinese mitten crab(Eriocheirsinensis,H.Milne Edwards,1854)during initial invasion of Lake Vanern,Sweden.Current Zoology,60(3):410-416.
Careau,V.,Thomas,D.,Humphries,M.,Reale,D.J.O.,2010.Energy metabolismand animal personality.117, 641-653.
Su,X.,Sun,Y.,Liu,D.,Wang,F.,Liu,J.,Zhu,B.J.J.o.E.B.,2019.Agonisticbehaviour and energy metabolism of bold and shy swimming crabs Portunustrituberculatus.222,jeb188706.
Valletta,J.J.,Torney,C.,Kings,M.,Thornton,A.,Madden,J.J.A.B.,2017.Applications of machine learning in animal behaviour studies.124,203-220.
发明内容
为了给出更好的梭子蟹群体的个性分类方法,本发明提出了一种基于K-Means算法的梭子蟹群体个性 分类方法及应用,以期能有效地根据其个性特征,以及梭子蟹个性类型之间的相关性对梭子蟹进行分类, 总和评判其个性,准确地以个性为标准对梭子蟹进行分类,为梭子蟹个性特征分类提供标准和参考方法。
一种基于K-Means算法的梭子蟹群体个性分类方法,其特征在于包括以下步骤
步骤1实验梭子蟹的暂养,
步骤2梭子蟹行为的拍摄,
预备观察箱(3),观察箱(3)内装有带挡板(4)的箱型遮蔽物(5),在观察箱(3)中加入新鲜砂 滤海水(水深40cm)后,将梭子蟹放入遮蔽物中适应10min,然后打开挡板(4),连续拍摄24h后实验结 束,共计完成s只个体的拍摄,n不少于50;
步骤3梭子蟹个性特征量化及统计,
选取梭子蟹个性特征为勇敢性、活跃性、犹豫性,其中勇敢性为拍摄期间梭子蟹不在遮蔽物下的时间 占比(Belgrad et al.,2017);活跃性为梭子蟹离开遮蔽物后十分钟内的移动次数(Brodin and Drotz,2014); 犹豫性为梭子蟹完全离开遮蔽物的时间减梭子蟹开始离开遮蔽物的时间(Brown et al.,2005);
步骤4基于以上个性特征对梭子蟹进行分类,
步骤4.1生成每个梭子蟹个体的个性特征数据D1=(x1,y1,z1),…,(xi,yi,zi),…,(xs,ys,zs),其中每个个 体的个性特征数据坐标x、y、z分别表示梭子蟹个体的勇敢性、活跃性、犹豫性;
步骤4.2对其勇敢性、活跃性、犹豫性数据进行了Min-max标准化处理,以确保原始数据序列:经变 换后的数值范围统一在[0,1]区间内,从而消除不同个性特征的数值差异。
Min-max标准化变换公式,以勇敢性为例:
Figure BDA0002590797180000021
则梭子蟹勇敢性、活跃性、犹豫性分别得到新的序列
U=u1,u2,……,us
V=v1,v2,……,vs
W=w1,w2,……,ws
并得到梭子蟹个性特征数据集D2=(u1,v1,w1),(u2,v2,w2),…,(us,vs,ws);
步骤4.3:随机生成k个聚类中心,坐标为D3=(a1,b1,c1),···,(aj,bj,cj),…,(ak,bk,ck);其中每个聚 类中心坐标a、b、c分别表示勇敢性、活跃性、犹豫性,aj为百分比,bj自然数,cj为时间,k为1—10 之间的常数,j∈1-k;
步骤4.4:利用手肘法(Elbow Method),通过优化基于欧式距离的簇内误差平方和SSE(within-cluster sum of squared errors)和步骤4.1、4.2中的数据来寻找步骤4.3的最优k值;
本发明中,欧氏距离的平方即:
((xi,yi,zi)-(aj,bj,cj))2=(xi-aj)2+(yi-bj)2+(zi-cj)2
公式中,i∈1—s,j∈1—k;x、y、z以及a、b、c分别代表个性特征中的勇敢性、活跃性、冒险性;
计算每个个体个性特征(xi,yi,zi)与每个聚类中心(aj,bj,cj)的距离,并将该个体的个性特征归于距离最 小的聚类中心(aj,bj,cj),设这种具有个性特征的聚类中心的数量为r,则r≤k;将这r个聚类中心依次重 新排序,得到次聚类中心(a′1,b′1,c′1),···,(a′q,b′q,c′q),…,(a′r,b′r,c′r),记属于(a′q,b′q,c′q)的个性特征的 集合为Pq,q为1-r中的元素;在方案中,k∈1—10;
SSE计算公式如下:
Figure BDA0002590797180000031
在公式中,q为次聚类中心序号(q∈1—r),δ为集合Pq中的个性特征,SSE数值用于评估聚类效果, SSE数值越小,代表着簇内差距越小,聚类效果越好;
在步骤4.3开始计算时,每个聚类中心的初始位置是随即形成的,对于每一个次聚类中心(a′q,b′q,c′q), 计算每一个次聚类中心所对应的个性特征与该次聚类中心(a′q,b′q,c′q)的平均值;
步骤4.5:将所得的SSE重新赋值给每个次聚类中心;
步骤4.6:以步骤4.4的方式重新对个体归属于哪个次聚类中心进行计算,再进行SSE计算;如此重 复步骤4.4,直至聚类中心的位置收敛;从而生成一个SSE与k的关系的折线图;
步骤5:取SSE下降幅度骤减的点为最优聚类;在梭子蟹个性特征分类中,SSE在聚类中心个数为2 时下降幅度骤减,因此确定最优聚类K值为2,即将梭子蟹个体分为两个类别;命名为勇敢型(Bold Type, BP)、羞怯型(Shy Type,SP);从而将梭子蟹群体中的每一只个体进行了个性分类,即将每个梭子蟹个体 划分为勇敢型与羞怯型的其中一类。
经计算,在本实例中,SSE在聚类中心个数为2时下降幅度骤减,因此确定最优聚类K值为2,即将 梭子蟹个体分为两个类别。在本实施例后续分析中将两个类别命名为勇敢型(Bold Type,BP)、羞怯型(Shy Type,SP)。从而将每个梭子蟹个体划分为其中的一类,以+1表示一个梭子蟹个体属于勇敢型(Bold Type, BP),以-1表示一个三疣梭子蟹个体属于羞怯型(Shy Type,SP)。
所述的方法,其特征是所述步骤1实验梭子蟹的暂养如下:
将梭子蟹运回实验室于玻璃水族箱(45cm×30cm×30cm)中暂养两周后开始实验,每个水族箱中放一 只梭子蟹,暂养水温为24±1℃,盐度为30,光照周期为12L:12D,持续充气;每天08:00足量投喂菲律 宾蛤仔(壳长CL:31.0~34.0mm)一次,投喂3h后将粪便及残饵清除,并换水1/3,所换海水提前曝气 24h并调至目标温度。
所述的方法,其特征是所述步骤2梭子蟹行为的拍摄中,观察箱(3)直径为60cm,内部颜色为白色, 箱型遮蔽物(5)为20cm×20cm×20cm的黑色塑料箱,上有可打开的可活动挡板(4);在观察箱(3)中加 入新鲜砂滤海水,水深40cm。
所述的方法,其特征是还包括步骤6:支持向量机对个性特征的统计,
对于梭子蟹个性特征数据样本集D4=(m1,n1),(m2,n2),…,(ms,ns),其中mi分别代表第i个个体的勇 敢性、活跃性、犹豫性数据组成的矩阵;ni为-1或+1,其中ni=+1代表第i个个体属于勇敢型个体, ni=-1代表第i个个体属于羞怯型个体;
利用SVM对数据集D4构建一个最大边距超平面(maximum-margin hyperplane),基于个体的ni值的 正负而使个体位于超平面的上方或下方,从而利用超平面将不同个性类别的样本分成两类;并将超平面作 为结果进行输出。
本发明在生产中可应用于梭子蟹优良品种的选育,按照个性对个体进行分类成为新的选育标准。在之 前的研究中也表明不同个性的动物拥有不同的生存策略,从而影响其生长的过程。梭子蟹生性好斗,在食 物不足或密度过高时,冒险型的个体更倾向通过争斗的方式解决冲突,这引起更高的死亡率,而羞怯型个 体更容忍身边不适宜的环境,主动发起争斗的概率较小,因此羞怯型个体的争斗引起的肢体残缺和死亡更 少。因此在蟹的育种时,适当选择羞怯型个体作为亲本繁育会提高后代的成活率。在养殖过程中,羞怯型 个体占比高的梭子蟹群体存活率更高,从而有更高产量。
所述的方法的应用,其特征是该方法在梭子蟹品种选育中的应用。
所述的方法的应用,其特征是该方法在筛选一个批次梭子蟹中的羞怯型个体中的应用。
所述的方法的应用,其特征是所述方法在筛选一个批次梭子蟹中的羞怯型个体,将羞怯型个体用于亲 本培育,再将其后代用于高密度养殖的应用。
将所得的羞怯型个体作为用于亲本培育的优良个体,其后代为羞怯型的概率更高,当高密度养殖时更 容易提高成活率,降低肢体残缺的概率;而当用勇敢型个体作为亲本培育时,后代为勇敢型的概率更高, 生长速度更快,规格更大,亦可以作为特定情况下低密度养殖的应用。
与之前的梭子蟹个性分类手段相比,本发明的有益效果体现在:
本发明在生成聚类中心时,采用手肘法确定中心数量和最优k值,利用数据本身进行聚类,提高了分 类数目的可靠性。比起传统的分类方法,本发明通过K-Means算法降低了分类的主观性,提高分类的可信 度。传统的分类手段存在对梭子蟹个性中间地带评价模糊的问题,本发明通过聚类分析对原始数据进行更 加全面直接地分析,减少中间地带的范围,对梭子蟹个性的分类更加精确。通过多种梭子蟹个性类型实现 对梭子蟹个性分类的综合评价。本发明除可以根据个性特征对梭子蟹个体进行分类,还可以评估不同个性 特征对梭子蟹个性影响大小。
附图说明
图1为三疣梭子蟹个性特征拍摄系统。
其中,1-显示器、2-摄像机、3-观察箱、4-可活动挡板、5-箱型遮蔽物。
图2为K-Means算法流程示意图。
图3为SSE与k的关系图。
图4为基于三疣梭子蟹个性特征的聚类分析,
其中图4(A)为活跃性的聚类分析、图4(B)为勇敢性的聚类分析、图4(C)为犹豫性的聚类分析。
图5为三疣梭子蟹活跃性、勇敢性、犹豫性的个性聚类示意图。
图6为基于SVM对三疣梭子蟹个性的分析。
具体实施方式
以梭子蟹中最具代表性的、也是养殖最为广泛的三疣梭子蟹为例,本实施例中的三疣梭子蟹个性数据 来源于实验,实验数据采集来源于前期个性行为观测系统,对暂养结束摄食正常、附肢完整且处于蜕皮间 期的梭子蟹进行行为观测(Su,et al.,2019)。
步骤1实验梭子蟹的暂养
将三疣梭子蟹运回实验室于玻璃水族箱(45cm×30cm×30cm)中暂养两周后开始实验,每个水族箱中 放一只梭子蟹,暂养水温为24±1℃,盐度为30,光照周期为12L:12D,持续充气。每天08:00足量投喂 菲律宾蛤仔(壳长CL:31.0~34.0mm)一次,投喂3h后将粪便及残饵清除,并换水1/3,所换海水提前曝 气24h并调至目标温度;
步骤2梭子蟹行为的拍摄
本实施例中的行为拍摄系统如图1所示,由显示器1、摄像机2、观察箱3、可活动挡板4、箱型遮蔽 物5组成。其中观察箱3直径为60cm,内部颜色为白色,箱型遮蔽物5为20cm×20cm×20cm的黑色塑料 箱,上有可打开的可活动挡板4;在观察箱中加入新鲜砂滤海水(水深40cm)后,将梭子蟹放入遮蔽物中 适应10min,然后打开遮蔽物挡板4,连续拍摄24h后实验结束,共计完成88只个体的拍摄。
步骤3梭子蟹个性特征量化及统计。本实施例中选取三疣梭子蟹个性特征为勇敢性、活跃性、犹豫性。 其中勇敢性为拍摄期间梭子蟹不在遮蔽物下的时间占比(Belgrad etal.,2017);活跃性为梭子蟹离开遮蔽物 后十分钟内的移动次数(Brodin and Drotz,2014);犹豫性为梭子蟹完全离开遮蔽物的时间减梭子蟹开始离 开遮蔽物的时间(Brownet al.,2005)。
步骤4.1生成每个梭子蟹个体的个性特征数据D1=(x1,y1,z1),…,(xi,yi,zi),…,(x88,y88,z88)。其中每 个个体的个性特征数据坐标由梭子蟹个体的勇敢性(x)、活跃性(y)、犹豫性(z)组成;
步骤4.2对其勇敢性、活跃性、犹豫性数据进行了Min-max标准化(Min-maxnormalization)处理,以 确保原始数据序列:经变换后的数值范围统一在[0,1]区间内,从而消除不同个性特征的数值差异。
Min-max标准化变换公式,以勇敢性为例:
Figure BDA0002590797180000061
则梭子蟹勇敢性、活跃性、犹豫性对应的新序列
U=u1,u2,……,u88
V=v1,v2,……,v88
W=w1,w2,……,w88
此时得到三疣梭子蟹个性特征数据集D2=(u1,v1,w1),(u2,v2,w2),…,(u88,v88,w88)。
步骤4.3:随机生成k个聚类中心,坐标为D3=(a1,b1,c1),···,(aj,bj,cj),…,(ak,bk,ck)。其中每个聚 类中心坐标由勇敢性、活跃性、犹豫性组成,其中,k∈1—10,aj为百分比,bj自然数,cj为时间,j∈1…k;
步骤4.4:利用手肘法(Elbow Method),通过优化基于欧式距离的簇内误差平方和SSE(within-cluster sum of squared errors)和步骤4.1、4.2中的数据来寻找步骤4.3的最优k值;
本发明中,欧氏距离的平方即:
((xi,yi,zi)-(aj,bj,cj))2=(xi-aj)2+(yi-bj)2+(zi-cj)2
公式中,i∈1—88,j∈1—k;x、y、z以及a、b、c分别代表个性特征中的勇敢性、活跃性、冒险性;
计算每个个体个性特征(xi,yi,zi)与每个聚类中心(aj,bj,cj)的距离,并将该个体的个性特征归于距离最 小的聚类中心(aj,bj,cj),设这种具有个性特征的聚类中心的数量为r,则r≤k;将这r个聚类中心依次重 新排序,得到次聚类中心(a1,b1,c1),···,(aq,bq,cq),…,(ar,br,cr),记属于(aq,bq,cq)的个性特征的集合为 Pq,q为1-r中的元素;在本实例中,k∈1—10;
SSE计算公式如下:
Figure BDA0002590797180000062
在公式中,q为次聚类中心序号(q∈1—r),δ为集合Pq中的个性特征,SSE数值用于评估聚类效果, SSE数值越小,代表着簇内差距越小,聚类效果越好;
在步骤4.3开始计算时,每个聚类中心的初始位置是随即形成的,对于每一个次聚类中心(aq,bq,cq), 计算每一个聚类所对应的个性特征与该次聚类中心(aq,bq,cq)的平均值;
步骤4.5:将所得的SSE重新赋值给每个次聚类中心;
步骤4.6:以步骤4.4的方式重新对个体归属于哪个次聚类中心进行计算,再进行SSE计算;如此重 复步骤4.4,直至聚类中心的位置收敛,此时每个聚类中心的SSE小于设定的阈值;从而生成一个SSE与 k的关系的折线图;本研究实验数据SSE与k关系如图2所示。
步骤5基于以上对三疣梭子蟹勇敢性、犹豫性和活跃性三个个性特征的聚类,以及综合三者的聚类结 果,并参考手肘法分析结果,可以选取SSE下降幅度骤减的点为最优聚类;
经计算,在本实例中,SSE在聚类中心个数为2时下降幅度骤减,因此确定最优聚类K值为2,即将 梭子蟹个体分为两个类别。在本实施例后续分析中将两个类别命名为勇敢型(Bold Type,BP)、羞怯型(Shy Type,SP)。从而将每个三疣梭子蟹个体划分为其中的一类,以+1表示一个三疣梭子蟹个体属于勇敢型(Bold Type,BP),以-1表示一个三疣梭子蟹个体属于羞怯型(Shy Type,SP);
从而将三疣梭子蟹群体中的每一只个体进行了个性分类。
还可以有以下步骤:
步骤6:支持向量机对个性特征的统计
对于三疣梭子蟹个性特征数据样本集D4=(m1,n1),(m2,n2),…,(m88,n88),其中mi分别代表第i个个 体的勇敢性、活跃性、犹豫性数据组成的矩阵;ni为-1或+1,其中ni=+1代表第i个个体属于勇敢型 个体,ni=-1代表第i个个体属于羞怯型个体。
利用SVM对数据集D4构建一个最大边距超平面(maximum-margin hyperplane),基于个体的ni值的 正负而使个体位于超平面的上方或下方,从而利用超平面将不同个性类别的样本分成两类。
该超平面在二维空间中为一条直线,在三维平面中为一个平面。
对于空间中点到平面的距离,可以通过如下线性方程来描述:
WTm+b=0
其中W为法向量,决定了超平面的方向,b为位移量,决定了超平面与原点的距离。假设超平面能够 将训练样本正确分类,即对于训练样本(mi,ni)满足:
Figure BDA0002590797180000071
该公式被称为最大间隔假设,实际上该公式等价于:
ni(WTmi+b)≥+1
首先需要找到距离超平面最近的点,定义距离超平面最近的点到超平面的距离为边缘(margin)距离 超平面最近的几个样本点被称为“支持向量”(Support Vector)。
Figure BDA0002590797180000072
支持向量机的优化目的就是令边缘最大化,即max margin(w,b)。由于在不同的应用里, |WTmi+b|往往是一个确定的值,所以我们需要优化的是W,即我们希望得到一个γ,使得
Figure BDA0002590797180000073
通过分析W的具体数值可以计算出每个维度对分类超平面的权重,从而分析出每个个性特征在个性分 类中的权重,即影响的大小。
在本实施例中,对三疣梭子蟹个性特征数据集D2=(u1,v1,w1),(u2,v2,w2),…,(u88,v88,w88),用支持 向量机进行优化,其中勇敢性、活跃性、犹豫性分别为该空间坐标系中点的u、v、w坐标。输出三疣梭子 蟹个性特征散点图及基于SVM的个性分析结果。
本实施例中,利用K-Means算法对实验数据进行聚类结果如下:
其中基于三疣梭子蟹活跃性(A)、勇敢性(B)、犹豫性(C)的聚类分析如图4所示。基于三疣梭子 蟹活跃性、勇敢性、犹豫性的的个性聚类示意图如图5所示。基于SVM对三疣梭子蟹个性的分析如图5 所示。BP为勇敢型个体,SP为羞怯型个体。可见该方法对每只个体基于个性特征的分类中,将所有个体 均能准确非为BP/SP两类。
表1三疣梭子蟹不同个性特征间相关分析
Figure BDA0002590797180000081
由表1结果可知,三疣梭子蟹的活跃性、勇敢性、犹豫性中,所有的数据点依据簇内差距较小,簇间 差距较大的原则聚为两类,其簇间间隔分别为328、398、175。
其三个个性特征中活跃性vs.犹豫性、勇敢性vs.犹豫性均负相关,活跃性vs.勇敢性为正相关。
综合不同个性特征结果对三疣梭子蟹个性特征进行聚类,结果如图5、6所示。结果中超平面将梭子 蟹个体精确分为勇敢型个体和羞怯型个体。SVM结果显示,勇敢性和活跃性均与个性分类正相关,而犹 豫性与个性分类负相关。其中活跃性、勇敢性、犹豫性占比重分别为3.05、2.988、-0.950,可见活跃性在 梭子蟹个性特征分类中较大。
综合以上结果可综合评价每个个体的活跃性、勇敢性、犹豫性,并精确地按照个性特征将三疣梭子蟹 分为勇敢型和羞怯型两类,分类依据更加科学,比起传统分类的准确程度和效率均有大大提高。
本发明在生产中可应用于梭子蟹优良品种的选育,按照个性对个体进行分类成为新的选育标准。在之 前的研究中也表明不同个性的动物拥有不同的生存策略,从而影响其生长的过程。三疣梭子蟹生性好斗, 在食物不足或密度过高时,冒险型的个体更倾向通过争斗的方式解决冲突,这引起更高的死亡率,而羞怯 型个体更容忍身边不适宜的环境,主动发起争斗的概率较小,因此羞怯型个体的争斗引起的肢体残缺和死 亡更少。因此在蟹的育种时,适当选择羞怯型个体作为亲本繁育会提高后代的成活率。在养殖过程中,羞 怯型个体占比高的梭子蟹群体存活率更高,从而有更高产量。
本发明的方法基于梭子蟹个性的客观现象而得到,因此可以反映梭子蟹的真实状态,为梭子蟹群体选 育提供了一种筛选技术,由该技术可以从一个群体中筛选出两种类型的梭子蟹,经观察测试,所得到的羞 怯型梭子蟹更加适合高密度饲养,也为今后的梭子蟹养殖提供了一种有效途径。

Claims (7)

1.一种基于K-Means算法的梭子蟹群体个性分类方法,其特征在于包括以下步骤
步骤1实验梭子蟹的暂养,
步骤2梭子蟹行为的拍摄,
预备观察箱(3),观察箱(3)内装有带挡板(4)的箱型遮蔽物(5),在观察箱(3)中加入新鲜砂滤海水(水深40cm)后,将梭子蟹放入遮蔽物中适应10min,然后打开挡板(4),连续拍摄24h后实验结束,共计完成s只个体的拍摄,n不少于50;
步骤3梭子蟹个性特征量化及统计,
选取梭子蟹个性特征为勇敢性、活跃性、犹豫性,其中勇敢性为拍摄期间梭子蟹不在遮蔽物下的时间占比(Belgrad et al.,2017);活跃性为梭子蟹离开遮蔽物后十分钟内的移动次数(Brodin and Drotz,2014);犹豫性为梭子蟹完全离开遮蔽物的时间减梭子蟹开始离开遮蔽物的时间(Brown et al.,2005);
步骤4基于以上个性特征对梭子蟹进行分类,
步骤4.1生成每个梭子蟹个体的个性特征数据D1=(x1,y1,z1),…,(xi,yi,zi),…,(xs,ys,zs),其中每个个体的个性特征数据坐标x、y、z分别表示梭子蟹个体的勇敢性、活跃性、犹豫性;
步骤4.2对其勇敢性、活跃性、犹豫性数据进行了Min-max标准化处理,以确保原始数据序列:经变换后的数值范围统一在[0,1]区间内,从而消除不同个性特征的数值差异。
Min-max标准化变换公式,以勇敢性为例:
Figure FDA0002590797170000011
则梭子蟹勇敢性、活跃性、犹豫性分别得到新的序列
U=u1,u2,……,us
V=v1,v2,……,vs
W=w1,w2,……,ws
并得到梭子蟹个性特征数据集D2=(u1,v1,w1),(u2,v2,w2),…,(us,vs,ws);
步骤4.3:随机生成k个聚类中心,坐标为D3=(a1,b1,c1),…,(aj,bj,cj),…,(ak,bk,ck);其中每个聚类中心坐标a、b、c分别表示勇敢性、活跃性、犹豫性,aj为百分比,bj自然数,cj为时间,k为1—10之间的常数,j∈1-k;
步骤4.4:利用手肘法(Elbow Method),通过优化基于欧式距离的簇内误差平方和SSE(within-cluster sum of squared errors)和步骤4.1、4.2中的数据来寻找步骤4.3的最优k值;
本发明中,欧氏距离的平方即:
((xi,yi,zi)-(aj,bj,cj))2=(xi-aj)2+(yi-bj)2+(zi-cj)2
公式中,i∈1—s,j∈1—k;x、y、z以及a、b、c分别代表个性特征中的勇敢性、活跃性、冒险性;
计算每个个体个性特征(xi,yi,zi)与每个聚类中心(aj,bj,cj)的距离,并将该个体的个性特征归于距离最小的聚类中心(aj,bj,cj),设这种具有个性特征的聚类中心的数量为r,则r≤k;将这r个聚类中心依次重新排序,得到次聚类中心(a′1,b′1,c′1),···,(a′q,b′q,c′q),…,(a′r,b′r,c′r),记属于(a′q,b′q,c′q)的个性特征的集合为Pq,q为1-r中的元素;在方案中,k∈1—10;
SSE计算公式如下:
Figure FDA0002590797170000021
在公式中,q为次聚类中心序号,q∈1—r,δ为集合Pq中的个性特征,SSE数值用于评估聚类效果,SSE数值越小,代表着簇内差距越小,聚类效果越好;
在步骤4.3开始计算时,每个聚类中心的初始位置是随即形成的,对于每一个次聚类中心(a′q,b′q,c′q),计算每一个次聚类中心所对应的个性特征与该次聚类中心(a′q,b′q,c′q)的平均值;
步骤4.5:将所得的SSE重新赋值给每个次聚类中心;
步骤4.6:以步骤4.4的方式重新对个体归属于哪个次聚类中心进行计算,再进行SSE计算;如此重复步骤4.4,直至聚类中心的位置收敛;从而生成一个SSE与k的关系的折线图;
步骤5:取SSE下降幅度骤减的点为最优聚类;在梭子蟹个性特征分类中,SSE在聚类中心个数为2时下降幅度骤减,因此确定最优聚类K值为2,即将梭子蟹个体分为两个类别;命名为勇敢型(Bold Type,BP)、羞怯型(Shy Type,SP);从而将梭子蟹群体中的每一只个体进行了个性分类,即将每个梭子蟹个体划分为勇敢型与羞怯型的其中一类。
2.如权利要求1所述的方法,其特征是所述步骤1实验梭子蟹的暂养如下:
将梭子蟹运回实验室于玻璃水族箱(45cm×30cm×30cm)中暂养两周后开始实验,每个水族箱中放一只梭子蟹,暂养水温为24±1℃,盐度为30,光照周期为12L:12D,持续充气;每天08:00足量投喂菲律宾蛤仔(壳长CL:31.0~34.0mm)一次,投喂3h后将粪便及残饵清除,并换水1/3,所换海水提前曝气24h并调至目标温度。
3.如权利要求1所述的方法,其特征是所述步骤2梭子蟹行为的拍摄中,观察箱(3)直径为60cm,内部颜色为白色,箱型遮蔽物(5)为20cm×20cm×20cm的黑色塑料箱,上有可打开的可活动挡板(4);在观察箱(3)中加入新鲜砂滤海水,水深40cm。
4.如权利要求1所述的方法,其特征是还包括步骤6:支持向量机对个性特征的统计,
对于梭子蟹个性特征数据样本集D4=(m1,n1),(m2,n2),…,(ms,ns),其中mi分别代表第i个个体的勇敢性、活跃性、犹豫性数据组成的矩阵;ni为-1或+1,其中ni=+1代表第i个个体属于勇敢型个体,ni=-1代表第i个个体属于羞怯型个体;
利用SVM对数据集D4构建一个最大边距超平面(maximum-margin hyperplane),基于个体的ni值的正负而使个体位于超平面的上方或下方,从而利用超平面将不同个性类别的样本分成两类;并将超平面作为结果进行输出。
5.权利要求1所述的方法的应用,其特征是该方法在梭子蟹品种选育中的应用。
6.权利要求1所述的方法的应用,其特征是该方法在筛选一个批次梭子蟹中的羞怯型个体中的应用。
7.如权利要求6所述应用,其特征是所述方法在筛选一个批次梭子蟹中的羞怯型个体,将羞怯型个体用于亲本培育,再将其后代用于高密度养殖的应用。
CN202010695257.9A 2020-07-19 2020-07-19 一种基于K-Means算法的梭子蟹群体个性分类方法及应用 Pending CN111950598A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010695257.9A CN111950598A (zh) 2020-07-19 2020-07-19 一种基于K-Means算法的梭子蟹群体个性分类方法及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010695257.9A CN111950598A (zh) 2020-07-19 2020-07-19 一种基于K-Means算法的梭子蟹群体个性分类方法及应用

Publications (1)

Publication Number Publication Date
CN111950598A true CN111950598A (zh) 2020-11-17

Family

ID=73340695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010695257.9A Pending CN111950598A (zh) 2020-07-19 2020-07-19 一种基于K-Means算法的梭子蟹群体个性分类方法及应用

Country Status (1)

Country Link
CN (1) CN111950598A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115393659A (zh) * 2022-10-27 2022-11-25 珠海横琴圣澳云智科技有限公司 基于多级决策树的个性化分类流程优化方法和装置
CN116803254A (zh) * 2023-03-14 2023-09-26 上海海洋大学 一种辨别好斗和非好斗中华绒鳌蟹群体的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110084325A (zh) * 2019-05-13 2019-08-02 电子科技大学成都学院 基于区域选取初始聚类中心的K-Means改进算法
CN110837862A (zh) * 2019-11-06 2020-02-25 腾讯科技(深圳)有限公司 用户分类方法及装置
CN111008504A (zh) * 2019-12-18 2020-04-14 武汉大学 一种基于气象模式识别的风电功率预测误差建模方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110084325A (zh) * 2019-05-13 2019-08-02 电子科技大学成都学院 基于区域选取初始聚类中心的K-Means改进算法
CN110837862A (zh) * 2019-11-06 2020-02-25 腾讯科技(深圳)有限公司 用户分类方法及装置
CN111008504A (zh) * 2019-12-18 2020-04-14 武汉大学 一种基于气象模式识别的风电功率预测误差建模方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHAO YANG 等: ""A new method of aquatic animal personality analysis based on machine learning(PAML):Talking swimming crab portunus trituberculatus as an example"", 《FRONTIERS IN MARINE SCIENCE》 *
XIANPENG SU 等: ""Agonistic behavior and energy metabolism of bold and shy swimming crabs portunus trituberculatus"", 《JOURNAL OF EXPERIMENTAL BIOLOGY》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115393659A (zh) * 2022-10-27 2022-11-25 珠海横琴圣澳云智科技有限公司 基于多级决策树的个性化分类流程优化方法和装置
CN115393659B (zh) * 2022-10-27 2023-01-24 珠海横琴圣澳云智科技有限公司 基于多级决策树的个性化分类流程优化方法和装置
CN116803254A (zh) * 2023-03-14 2023-09-26 上海海洋大学 一种辨别好斗和非好斗中华绒鳌蟹群体的方法

Similar Documents

Publication Publication Date Title
Ahmed et al. Rice leaf disease detection using machine learning techniques
Islam et al. Fish survival prediction in an aquatic environment using random forest model
CN111950598A (zh) 一种基于K-Means算法的梭子蟹群体个性分类方法及应用
Raina et al. A study on various techniques for plant leaf disease detection using leaf image
Chen et al. Multi-threshold image segmentation of maize diseases based on elite comprehensive particle swarm optimization and otsu
Frey et al. Growth in cladocera
Castillo‐Vargasmachuca et al. The spotted rose snapper (Lutjanus guttatus Steindachner 1869) farmed in marine cages: review of growth models
Cao et al. Recognition of common insect in field based on deep learning
Kodors et al. Pear and apple recognition using deep learning and mobile
Bijanzadeh et al. Determining the most important features contributing to wheat grain yield using supervised feature selection model
CN113449712B (zh) 一种基于改进Alexnet网络的羊脸识别方法
CN116229254A (zh) 一种近海浮筏和深水养殖区的遥感提取方法
CN115600069A (zh) 一种家蚕母种留种蛾区的选择方法
CN112001641B (zh) 一种扇贝养殖区适宜性遥感评估系统
Huang et al. Application of data augmentation and migration learning in identification of diseases and pests in tea trees
Hsieh et al. A Video Surveillance System for Determining the Sexual Maturity of Cobia
Hindarto et al. Comparison Efficacy of VGG16 and VGG19 Insect Classification Models
Caubet et al. NEIGHBOUR-IN: Image processing software for spatial analysis of animal grouping
Gu et al. Assessing potential driving factors of the ecosystem service value of mariculture shellfish in China using a structural equation modeling approach
Rianasari et al. The classification of mushroom types using Naïve Bayes and principal component analysis
Jiao et al. A Microbial Image Recognition Method Based on Convolutional Neural Networks.
Yang et al. A comparison for patch-level classification of deep learning methods on transparent environmental microorganism images: from convolutional neural networks to visual transformers
CN109460779A (zh) 一种区分花鲈南北方养殖群体的方法
Liu et al. Evaluation model for water environment of Eriocheir sinensis ponds based on AdaBoost classifier
CN118015551B (zh) 应用于野外生态湿地的浮岛式监测系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20201117

WD01 Invention patent application deemed withdrawn after publication