一种基于GPS数据的迁徙鸟类轨迹分割方法
技术领域
发明涉及时空数据挖掘与处理技术领域,特别是涉及一种基于GPS(英文全称为“Global Positioning System”,中文全称为“全球定位系统”)数据的迁徙鸟类轨迹分割方法。
背景技术
目前,基于GPS数据进行轨迹分割的方式主要是根据GPS位点的运动状态进行划分,然后根据位点分布,通过人工划分出轨迹分割结果,或是直接使用聚类算法输出轨迹分割结果。该方法中,人工划分的步骤,需要花费大量的时间和精力。而且,不同鸟类的生物习性存在差异,这也在一定程度上影响轨迹分割结果的准确性。
因此,希望有一种技术方案来克服或至少减轻现有技术的上述缺陷中的至少一个。
发明内容
本发明的目的在于提供一种基于GPS数据的迁徙鸟类轨迹分割方法,该方法能够通过分析GPS数据,结合东方白鹳自身特性,快速精准确定迁徙鸟类轨迹分割结果,即迁徙鸟类轨迹中的停留区域位置。
为实现上述目的,本发明提供一种基于GPS数据的迁徙鸟类轨迹分割方法,其包括:
步骤1,获取鸟类个体在选定时间内的GPS数据;
步骤2,将步骤1中的GPS数据中不符合条件的数据去除,同时,将剩下的数据按时间依正序排列,每一数据作为一个位点,每一个位点对应的鸟类信息包含个体编号、时间、经度坐标和纬度坐标,获得的所有位点构成点集;
步骤3,采用自适应的基于密度的噪声应用空间聚类算法将步骤2获得的点集进行聚类,获得多个聚类,再依据相应聚类中位点的运动状态,将聚类中的有效类划分成运动类或静止类,然后计算每一有效类的统计结果;
步骤4,根据步骤2获得的点集,采用停留点检测算法,获得多个类,再依据相应类中位点的运动状态,将该类划分成运动类或静止类,然后计算每一个类的统计结果;
步骤5,对比步骤3和步骤4划分出的运动类和静止类的统计结果,将其中更符合实际中位点的运动状态的运动类和静止类对应的统计结果作为最终的迁徙鸟类轨迹分割结果。
进一步地,步骤1中的选定时间包括含年份、月份和日期信息的时间段。
进一步地,统计结果包括持续时间、起始点经纬度信息与起始点时间。
进一步地,步骤3中,采用自适应的基于密度的噪声应用空间聚类算法将点集进行聚类,获得多个聚类的方法具体包括:
步骤3.1,从未访问序列中取出第一个位点,并标记为已访问;
步骤3.2,按位点对应的时间正向顺序依次访问当前位点后续的位点,直到后续的位点与当前位点的速度超出速度约束区间,将访问过的位点作为一个临时聚类;
步骤3.3,如果该临时聚类中最早位点与最晚位点的时间间隔大于时间阈值,则将该临时聚类作为有效类,同时将该有效类中所有位点标记为已访问;如果该临时聚类中的持续时间小于时间阈值/>,则将该临时聚类中的所有的位点标记为噪声点,同时标记为已访问;
步骤3.4,重复步骤3.1-3.3,直到所有的位点都被访问。
进一步地,步骤3中,将聚类中的有效类划分成运动类或静止类的方法具体包括:
步骤3.5,计算有效类中所有位点两两之间的距离,并记录最大距离,若最大距离大于距离阈值MaxDis,则将该有效类视为运动类;否则为静止类。
进一步地,步骤4中,采用停留点检测算法将点集,获得多个类的方法具体包括:
步骤4.1,从点集中最早的位点开始,按位点对应的时间正向顺序依次访问当前位点后续的位点;
步骤4.2,将当前位点放入当前类中,直到当前类中最早的位点和最晚的位点之间的经纬度坐标的间距大于距离阈值,由此获得当前类;
步骤4.3,若当前类中最早的位点和最晚的位点的时间差值大于时间阈值,则将其标记为静止类,否则标记为运动类;
步骤4.4,继续访问点集中的下一个位点,重复步骤4.2-4.3,直至点集为空集为止。
进一步地,步骤3和步骤4还用于获取点集中所有位点的经度-纬度散点图,点集中所有位点的经度-纬度的散点图的横轴对应为位点的经度坐标,纵轴对应为位点的纬度坐标,将经度-纬度的散点图中的静止类中的位点采用第一颜色或形状进行标记,运动类中的位点采用第二颜色或形状进行标记。
进一步地,步骤3和步骤4还用于获取点集中所有位点的时间-纬度的轨迹图,点集中所有位点的时间-纬度的轨迹图的横轴对应为位点的纬度坐标,纵轴对应为与位点纬度相应的时间坐标,将经度-纬度的散点图中的静止类中的位点采用第一颜色或形状进行标记,运动类中的位点采用第二颜色或形状进行标记。
本发明根据鸟类个体的GPS数据,利用自适应的基于密度的噪声应用空间聚类(英文全称为“Adaptive Density—Based Spatial Clustering of Application withNoise”,英文简称为“ADBSCAN”)算法获得聚类,还利用停留点检测(英文全称为“staypoint detection”,英文简称为“SPD”)算法获得点集,再识别出聚类和点集的运动状态,划分出运动类和静止类,最后根据如上两种划分结果选择其中之一作为最终的迁徙鸟类轨迹分割结果,因此,本发明方法快速精准。此外,本发明得到的最终的迁徙鸟类轨迹分割结果,还可以进一步用于如鸟类迁徙影响因素等生态学研究与开展鸟类保护工作。
附图说明
图1是本发明实施的基于GPS数据的迁徙鸟类轨迹分割方法的流程示意图。
具体实施方式
在附图中,使用相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面结合附图对本发明的实施例进行详细说明。
在本发明的描述中,术语“中心”、“纵向”、“横向”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明保护范围的限制。
如图1所示,本发明实施例提供的基于GPS数据的迁徙鸟类轨迹分割方法具体包括:
步骤1,获取鸟类个体在选定时间内的GPS数据。
其中,GPS数据的获取方法可以是,在选定的鸟类个体身上捆绑环志,从而通过捆绑的环志获取相应的GPS数据,录入数据库。选定时间包括含年份、月份和日期信息的时间段。本实施例优选以鸟类的迁徙时间段作为研究对象,当然,其他时间也是可以的。
步骤2,将步骤1中的GPS数据中不符合条件的数据去除,同时,将剩下的数据按时间依正序排列,每一数据作为一个位点,每一个位点对应的鸟类信息包含个体编号、时间、经度坐标和纬度坐标,此时获得的所有位点构成点集。其中,不符合条件的数据包括精度低于C的GPS数据。C例如可以但不限于设置为GPS定位误差超过20米。
步骤3,采用自适应的基于密度的噪声应用空间聚类算法将步骤2获得的点集进行聚类,获得多个聚类,再依据相应聚类中位点的运动状态,将聚类中的有效类划分成运动类或静止类,然后计算每一有效类的统计结果。
步骤4,根据步骤2获得的点集,采用停留点检测算法,获得多个类,再依据相应类中位点的运动状态,将该类划分成运动类或静止类,然后计算每一个类的统计结果。
步骤5,对比步骤3和步骤4划分出的运动类和静止类的统计结果,将其中更符合实际中位点的运动状态的运动类和静止类对应的统计结果作为最终的迁徙鸟类轨迹分割结果。其中,“更符合实际中位点”可以根据经验进行判定得到。
在一个实施例中,统计结果包括持续时间、起始点经纬度信息与起始点时间。其中,持续时间可以理解为相应聚类中位点的最晚时间与最早时间的时间差。起始点可以理解为相应聚类中时间最早的位点。起始时间可以理解为相应聚类中时间最早的位点对应的时间。
当然,本领域技术人员还可以根据实际情况,在该统计信息所包含的持续时间、起始点经纬度信息与起始点时间的基础之上,进行适当拓展。
在一个实施例中,步骤3和步骤4还用于获取点集中所有位点的经度与纬度的对应关系以及纬度与时间的对应关系,例如点集中所有位点的经度-纬度散点图与时间-纬度的轨迹图,这些图可以通过浏览器网页对用户进行展示。
其中,点集中所有位点的经度-纬度的散点图的横轴可以对应为位点的经度坐标,纵轴可以对应为位点的纬度坐标,当然,也可以反过来,将横轴可以对应为位点的纬度坐标,纵轴可以对应为位点的经度坐标。重点是,将经度-纬度的散点图中的静止类中的位点采用第一颜色或形状进行标记,运动类中的位点采用第二颜色或形状进行标记,第一颜色与第二颜色的颜色不同,例如第一颜色选择红色,第二颜色选择为绿色,第一形状为实心点,第二形状为空心点。
点集中所有位点的时间-纬度的轨迹图的横轴可以对应为位点的纬度坐标,纵轴可以对应为与位点纬度相应的时间坐标,同样,也可以反过来,将纵轴对应为位点的纬度坐标,横轴对应为与位点纬度相应的时间坐标。此外,将经度-纬度的散点图中的静止类中的位点采用第一颜色或形状进行标记,运动类中的位点采用第二颜色或形状进行标记,第一颜色与第二颜色的颜色不同,例如第一颜色选择红色,第二颜色选择为绿色,第一形状为实心点,第二形状为空心点。
在一个实施例中,步骤3中,采用自适应的基于密度的噪声应用空间聚类算法将点集进行聚类,获得多个聚类的方法具体包括:
步骤3.1,从未访问序列中取出第一个位点,并标记为已访问。
步骤3.2,按位点对应的时间正向顺序依次访问当前位点后续的位点,直到后续的位点与当前位点的速度超出速度约束区间,将访问过的位点作为一个临时聚类。
步骤3.3,如果该临时聚类中最早位点与最晚位点的时间间隔大于时间阈值,则将该临时聚类作为有效类,同时将该有效类中所有位点标记为已访问;如果该临时聚类中的持续时间小于时间阈值/>,则将该临时聚类中的所有的位点标记为噪声点,同时标记为已访问。
步骤3.4,重复步骤3.1-3.3,直到所有的位点都被访问。
需要说明的是,速度约束区间中的速度均值与速度标准差/>由已存在类中的位点计算得到,速度区间灵敏度k和时间阈值/>均需要预先设置获得。区间灵敏度k和时间阈值/>的具体数值的选取可根据计算效果而不断优化,例如:速度区间灵敏度k是5,时间阈值可以是48小时。根据设定的区间灵敏度k和时间阈值/>,对点集中所有位点进行自适应的基于密度的噪声应用空间聚类,聚类获得的结果包括:用于计算的所有位点数量、聚类的个数、每个聚类对应的点集、每个聚类的持续时间、每个聚类内的位点数量。其中,各聚类区间的开始与结束点作为聚类区间窗口的左端与右端,便于计算窗口内速度、运动距离等。
在另一个实施例中,步骤3也可以采用K-means聚类算法或现有的其他方法实现,在此不再一一列举。
在一个实施例中,步骤3中,将聚类中的有效类划分成运动类或静止类的方法具体包括:
步骤3.5,计算有效类中所有位点两两之间的距离,并记录最大距离,若最大距离大于距离阈值MaxDis,则将该有效类视为运动类。否则为静止类。其中,距离阈值MaxDis需要预先设置获得,具体数值的选取可根据计算效果而不断优化,例如:50千米。
在一个实施例中,步骤4中,采用停留点检测算法将点集,获得多个类的方法具体包括:
步骤4.1,从点集中最早的位点开始,按位点对应的时间正向顺序依次访问当前位点后续的位点。
步骤4.2,将当前位点放入当前类中,直到当前类中最早的位点和最晚的位点之间的经纬度坐标的间距大于距离阈值,由此获得当前类。其中,距离阈值需要预先设置获得,具体数值的选取可根据计算效果而不断优化,例如50千米。经纬度坐标包括经度坐标和纬度坐标两项。
步骤4.3,若当前类中最早的位点和最晚的位点的时间差值大于时间阈值,则将其标记为静止类,否则,标记为运动类。其中,时间阈值需要预先设置获得,具体数值的选取可根据计算效果而不断优化,例如48小时。
步骤4.4,继续访问点集中的下一个位点,重复步骤4.2-4.3,直至点集为空集为止。
最后需要指出的是:以上实施例仅用以说明本发明的技术方案,而非对其限制。本领域的普通技术人员应当理解:可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。