发明内容
本发明的目的在于提供一种基于GPS数据的东方白鹳巢址定位方法,其能够利用GPS数据,结合东方白鹳自身特性,快速准确地确定巢址信息。
为实现上述目的,本发明提供一种基于GPS数据的东方白鹳巢址定位方法,其包括:
步骤1,获取待定位的东方白鹳个体在选定时间内的GPS数据;
步骤2,将步骤1中的GPS数据中不符合条件的数据去除,同时,将剩下的数据按时间依正序排列,每一数据作为一个位点,每一个位点对应的东方白鹳信息包含个体编号、时间、经度坐标和纬度坐标;
步骤3,将步骤2获得的位点进行聚类,并将聚类外的离群的位点标记为噪声;
步骤4,先从步骤3获得的聚类中筛选出位点数量最多的若干聚类,再使用筛选出的聚类的东方白鹳信息,依次计算每一聚类的统计信息以及跟踪路线信息;其中,统计信息包括归一化方差、活动天数和巢址半径;
步骤5,根据步骤4获得的统计信息和跟踪路线信息,进一步筛选出最可能含巢址的聚类,该聚类的聚类中心即为巢址。
进一步地,步骤1中的选定时间包括含月份和日期信息的时间段。
进一步地,步骤2中的不符合条件的数据包括精度低于C和速度不为0的GPS数据。
进一步地,步骤3中聚类的方法具体包括:
步骤3.1,选择一个随机未被访问的位点,并将其标记为已访问;
步骤3.2,搜索步骤3.1标记的位点的邻域,找到所有距离该位点小于预设的距离阈值的位点;
步骤3.3,如果该位点的邻域中的位点数量大于或等于预设的点数阈值MinPts,则将该位点和其邻域中的所有位点归为同一个聚类,并将该聚类中的所有位点标记为已访问;
步骤3.4,如果该位点的邻域中的位点数量小于MinPts,则将该位点标记为噪声点;
步骤3.5,重复步骤3.1-3.4,直到所有的位点都被访问。
进一步地,步骤4中,筛选出的每一聚类的归一化方差包括该聚类内位点经度坐标的归一化方差,由式(1)计算得到:
(1)
式中,为第i个位点的经度坐标,n为筛选出的每一聚类内位点的总数,/>为筛选出的每一聚类内位点经度坐标的平均值。
进一步地,步骤4中,筛选出的每一聚类的活动天数为该聚类内时间最早的位点与时间最晚的位点相差的天数。
进一步地,步骤4中,筛选出的每一聚类的巢址半径的计算方法具体包括:
步骤4.1,将聚类中经度坐标最小对应的位点作为最小凸包的起点,该起点为当前点;
步骤4.2,在聚类中找到与当前点形成的线段具有最小逆时针转角的下一个点作为新的当前点;
步骤4.3,重复步骤4.2,从起点开始依次连接步骤4.2获得的所有的新的当前点,得到闭合的最小凸包,最小凸包构成巢址覆盖的范围;
步骤4.4,按照顺时针或逆时针遍历所有的新的当前点,新的当前点即为最小凸包的顶点,从而得到最小凸包的顶点的经纬度坐标,/>、/>分别为第m个顶点的经度坐标、纬度坐标,/>,M为顶点的总数,则按式(2)计算巢址覆盖的范围的面积S,进而获得巢址半径;
(2)。
进一步地,步骤4中,跟踪路线信息包括跟踪路线图,跟踪路线图的绘制方法具体包括:
根据经度坐标和纬度坐标,用第一符号标出对应聚类中所有位点,并用线段将第一符号按时间顺序依次连接,同时用记号标出聚类中心,从而得到跟踪路线图,跟踪路线图的横轴对应为经度,纵轴对应为纬度。
进一步地,步骤5中进一步筛选出最可能含巢址的聚类的方法具体包括:
若归一化方差大于对应阈值,则判定该聚类不含巢址;若活动天数小于对应阈值,则判定该聚类不含巢址;若巢址半径大于对应阈值,则判定该聚类不含巢址;若跟踪路线信息不满足以候选巢址为中心向四周发射,呈中心辐射状,则判定该聚类不含巢址。
本发明通过对东方白鹳的GPS数据进行分析,运算得到聚类中心经纬度坐标、相关统计信息和跟踪路线信息,进而可依据上述结果确定东方白鹳在该年是否营巢及营巢后的巢址位置。同时,本发明方法所得到的东方白鹳巢址位置,还可以进一步用于如鸟类营巢影响因素等生态学研究。
具体实施方式
在附图中,使用相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面结合附图对本发明的实施例进行详细说明。
在本发明的描述中,术语“中心”、“纵向”、“横向”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明保护范围的限制。
如图1所示,本发明实施例提供的基于GPS数据的东方白鹳巢址定位方法具体包括:
步骤1,获取待定位的东方白鹳个体在选定时间内的GPS数据。其中,GPS数据的获取方法可以是,在东方白鹳个体身上捆绑环志,从而通过捆绑的环志获取相应个体的GPS数据,录入数据库。选定时间包括含月份和日期信息的时间段。本实施例则是以东方白鹳的繁殖时间段作为研究对象,当然,其他时间段也是可以的。
步骤2,数据清洗:将步骤1中的GPS数据中不符合条件的数据去除,同时,将剩下的数据按时间依正序排列,每一数据作为一个位点,每一个位点对应的东方白鹳信息包含个体编号、时间、经度坐标和纬度坐标。其中,不符合条件的数据包括精度低于C和速度不为0的GPS数据。C例如可以但不限于设置为GPS定位误差超过20米。
步骤3,将步骤2获得的位点进行聚类,并将聚类外的离群的位点标记为噪声。
步骤4,先从步骤3获得的聚类中筛选出位点数量最多的若干聚类,该聚类的中心作为候选巢址,候选巢址用作后续的筛选和判断。再使用筛选出的聚类的东方白鹳信息,依次计算每一聚类的统计信息以及跟踪路线信息。其中,统计信息包括归一化方差、活动天数和巢址半径。当然,本领域技术人员还可以根据实际情况,在该统计信息所包含的归一化方差、活动天数和巢址半径的基础之上,进行适当拓展。
步骤5,根据步骤4获得的统计信息和跟踪路线信息,进一步筛选出最可能含巢址的聚类,该聚类的聚类中心即为巢址;若步骤4选出的聚类均不满足条件,则判定该东方白鹳个体在选定时间所在年份没有营巢。
在一个实施例中,步骤3采用的聚类方法为DBSCAN(英文全称为“Density-BasedSpatial Clustering of Applications with Noise”,中文全称为“基于密度的噪声应用空间聚类算法”),具体包括:
步骤3.1,选择一个随机未被访问的位点,并将其标记为已访问。
步骤3.2,搜索步骤3.1标记的位点的邻域,找到所有距离该位点小于预设的距离阈值的位点。
步骤3.3,如果该位点的邻域中的位点数量大于或等于预设的点数阈值MinPts,则将该位点和其邻域中的所有位点归为同一个聚类,并将该聚类中的所有位点标记为已访问。
步骤3.4,如果该位点的邻域中的位点数量小于点数阈值MinPts,则将该位点标记为噪声点。
步骤3.5,重复步骤3.1-3.4,直到所有的位点都被访问。
需要说明的是,距离阈值和点数阈值MinPts均需要预先设置获得,其具体数值的选取可根据计算效果而不断优化,例如,距离阈值/>:10千米;点数阈值MinPts:10。根据设定的距离阈值/>和点数阈值MinPts,对步骤2进行聚类,获得的聚类结果包括:用于计算的所有位点数量、聚类的个数、每个聚类对应的点集、每个聚类中心的经纬度坐标和每个聚类内的位点数量。其中,经纬度坐标包括经度坐标和纬度坐标。
上述实施例中,步骤3也可以在不预先指定聚类的数量的情况下,将步骤2获得的位点进行聚类,并将聚类外的离群点标记为噪声。
在另一个实施例中,步骤3也可以采用K-means聚类算法进行聚类,但该聚类方法需要预先指定聚类个数。步骤3还可以采用现有的其他方法实现,在此不再一一列举。
在一个实施例中,步骤4中,每一聚类的归一化方差包括该聚类内位点经度坐标的归一化方差,由式(1)计算得到:
(1)
式中,为第i个位点的经度坐标,/>为第i个位点的纬度坐标,/>,n为筛选出的每一聚类内位点的总数,/>为筛选出的每一聚类内位点经度坐标的平均值,/>和均为GPS数据本身所具有的信息。
在一个实施例中,步骤4中,筛选出的每一聚类的活动天数为东方白鹳在巢址范围活动的天数,为该聚类内时间最早的位点与时间最晚的位点相差的天数。
在一个实施例中,步骤4采用最小凸多边形算法筛选出的每一聚类的巢址半径,具体包括:
步骤4.1,将聚类中经度坐标最小对应的位点作为最小凸包的起点,该起点为当前点。其中,“凸包”在横轴为经度坐标、纵轴为纬度坐标的二维平面上为凸多边形。最小凸包即包含所有位点的最小凸多边形。
步骤4.2,在聚类中找到与当前点形成的线段具有最小逆时针转角的下一个点作为新的当前点。
步骤4.3,重复步骤4.2,从起点开始依次连接步骤4.2获得的所有的新的当前点,得到闭合的最小凸包,此时的最小凸包构成巢址覆盖的范围。
步骤4.4,按照顺时针或逆时针遍历所有的新的当前点,新的当前点即为最小凸包的顶点,从而得到最小凸包的顶点的经纬度坐标,/>、/>分别为第m个顶点的经度坐标、纬度坐标,/>,M为顶点的总数,则按式(2)计算巢址覆盖的范围的面积S,进而获得巢址半径,式中,/>表示计算绝对值。
(2)
上述步骤中,在获取巢址半径时,最简易的方法是,可以将巢址覆盖的范围的面积S设定为正圆形,由此根据圆的面积公式计算得到巢址半径。当然,也可以将巢址覆盖的范围的面积S设定为其他方式,而获得巢址半径。
在另一个实施例中,步骤4中的筛选出的每一聚类的巢址半径也可以使用核密度估计方法或其他现有方法实现。核密度估计方法中,需要计算聚类中每个位点的概率密度值,从而得到概率密度值最小且不为0的位点,即巢址边界点,聚类中心/巢址到各边界点距离的平均值即可作为巢址半径。
上述实施例中,通过计算归一化方差、活动天数、巢址半径这三项重要的统计信息可以用于判断聚类内位点数量最多的若干个(比如,5个)聚类中哪个聚类包含巢址,并将含巢址的聚类的聚类中心作为候选巢址。
在一个实施例中,步骤4中,跟踪路线信息包括跟踪路线图,跟踪路线图的绘制方法具体包括:
根据经度坐标和纬度坐标,用第一符号标出对应聚类中所有位点,并用线段将第一符号按时间顺序依次连接,同时用记号标出聚类中心,从而得到跟踪路线图,跟踪路线图的横轴对应为经度,纵轴对应为纬度。
由步骤3得到的统计信息和步骤4得到的跟踪路线信息进一步筛选出最可能含巢址的聚类,该聚类的聚类中心即为巢址位置;若五个聚类均不满足条件,则说明该只东方白鹳个体在该年度没有营巢。
在一个实施例中,步骤5中进一步筛选出最可能含巢址的聚类的方法具体包括:
若归一化方差大于对应阈值,例如大于0.7的情形下,则判定该聚类不含巢址;若活动天数小于对应阈值,例如小于30天的情形下,则判定该聚类不含巢址;若巢址半径大于对应阈值,例如大于50米的情形下,则判定该聚类不含巢址;若跟踪路线信息不满足以候选巢址为中心向四周发射,呈中心辐射状,则判定该聚类不含巢址。需要说明的是,该实施例中的阈值的设置,本领域技术人员可以在本实施例公开的数值的基础之上稍作调整。
在一个实施例中,使用多年数据进行运算时,本发明能够依次对每年的数据作以上步骤1-步骤5的处理,从而得到每一年的巢址位置,最后,将多年的巢址坐标绘制为散点图,直观展现巢址的变迁。其中,巢址坐标即经纬度坐标,散点图的横轴对应为经度,纵轴对应为纬度。
下面是上述实施例提供的基于GPS数据的东方白鹳巢址定位方法的具体应用示例,具体包括:
首先,在显示的基于GPS数据的东方白鹳巢址定位方法的页面输入距离阈值和点数阈值MinPts,也就是上述实施例中提到的预先设置距离阈值/>和点数阈值MinPts的具体数值。
再打开鸟类数据库,输入东方白鹳个体编号、时间段和年份,获取待定位的东方白鹳个体在选定时间内的GPS数据。
然后,按照上述实施例中的步骤2进行数据清洗,获得清洗后的数据。
再者,根据预设的距离阈值和点数阈值MinPts,如上述实施例中的步骤3进行DBSCAN聚类算法,获得簇(聚类)内位点数量最多的五个聚类、以及相关运算结果。
其次,按照上述实施例中的步骤4,计算统计信息以及跟踪路线图。
最后,通过浏览器网页展示跟踪路线图。
最后需要指出的是:以上实施例仅用以说明本发明的技术方案,而非对其限制。本领域的普通技术人员应当理解:可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。