CN106940718B - 一种获取候鸟迁徙路径描述的方法、装置及服务器 - Google Patents

一种获取候鸟迁徙路径描述的方法、装置及服务器 Download PDF

Info

Publication number
CN106940718B
CN106940718B CN201710148953.6A CN201710148953A CN106940718B CN 106940718 B CN106940718 B CN 106940718B CN 201710148953 A CN201710148953 A CN 201710148953A CN 106940718 B CN106940718 B CN 106940718B
Authority
CN
China
Prior art keywords
time
data
bird
migratory
gps track
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201710148953.6A
Other languages
English (en)
Other versions
CN106940718A (zh
Inventor
邵增珍
陈东
董树霞
魏争争
李彦聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Normal University
Original Assignee
Shandong Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Normal University filed Critical Shandong Normal University
Priority to CN201710148953.6A priority Critical patent/CN106940718B/zh
Publication of CN106940718A publication Critical patent/CN106940718A/zh
Application granted granted Critical
Publication of CN106940718B publication Critical patent/CN106940718B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Remote Sensing (AREA)
  • Position Fixing By Use Of Radio Waves (AREA)

Abstract

本发明公开了一种获取候鸟迁徙路径描述的方法、装置及服务器。其中,获取候鸟迁徙路径描述的方法,包括将鸟类观测点的地址信息转化为GPS轨迹点坐标数据;标准化处理GPS轨迹点坐标数据,形成标准化GPS轨迹点坐标数据序列;对标准化GPS轨迹点坐标数据序列进行密度聚类,获取候鸟迁徙过程中所有的栖息地;对每一个栖息地引入时间因素,获取所有栖息地的周期模式序列;所述周期模式序列由表征栖息地坐标的时空序列和表征候鸟在栖息地出现时间的时间序列构成;按照时间顺序排列所有栖息地的周期模式序列,最终得到的时空序列作为候鸟迁徙路线,时间序列代表候鸟的迁徙方向。

Description

一种获取候鸟迁徙路径描述的方法、装置及服务器
技术领域
本发明属于候鸟迁徙数据处理领域,尤其涉及一种获取候鸟迁徙路径描述的方法、装置及服务器。
背景技术
候鸟是一种在的繁殖区和非繁殖区之间规律性迁徙的鸟类,候鸟在迁徙过程中会对环境和人类的生产生活产生较大影响,追踪鸟类的迁徙,了解鸟类迁徙的规律,有助于预防流行病传播,并为机场选址和航线设立提供科学依据,减少鸟类与飞机相撞事故的发生;反过来气候变化和人类活动也会影响候鸟的迁徙和栖息地的选择,所以,研究候鸟的迁徙及迁徙途中的栖息地,对保护候鸟种群,保护自然环境,维持物种多样性,同样具有重要意义。
为了了解鸟类的迁徙规律,国内外研究者采用和开发了多种方法,从不同方面开展候鸟迁徙的研究工作。(1)定点调查是最早的鸟类迁徙研究方法,对鸟类迁徙的定点调查已连续开展上百年,积累了大量的观测资料,但无法获得鸟类个体的迁徙信息,且监测点地理位置分布不均,数据采集具有一定片面性;(2)环志是目前研究鸟类迁徙最常用、最普及的方法,其优点是简便易行,适用范围广,但监测的周期长,回收难度大,无法在短期内取得显著效果;(3)卫星定位的方法,采集的数据精确,可对个体进行连续追踪,但其成本高昂,难以普及,数据量有限,不适用于小型鸟类;另外还有雷达监测、光敏地理定位等方法,普遍存在精度低,难以普及,数据量有限等问题。
此外,对于采集的候鸟迁徙数据,其利用和分析也引起了国内外研究者的重视。早期鸟类数据分析,只需要凭借生物学家在GIS中标注出轨迹点或利用人工统计出分布点的数目,进而得到候鸟的迁徙地和迁徙路线,但该方法需要通过手工标注才能发现候鸟的迁徙路线,且无法处理候鸟的空间位置信息。
而且,观鸟数据均存在观鸟数量分布不均,第一,观测记录的数量在地域上分布不均;第二,观测记录的数量在时间上分布不均;第三,观测记录的数量在种类上分布不均;不能真实反映不同种类、不同地域、不同时期鸟类的分布状况。
国内外研究人员对候鸟迁徙规律进行了大量研究,也取得了一定进展,但上述研究仍存在大量问题尚未解决,集中体现在:1)采集的数据普遍存在不够全面、精度较低、数据量有限等问题;2)对原始数据的去重、去噪、标准化等工作鲜有涉及,导致数据的可利用性比较低;3)用于分析研究的数据量相对较小;4)候鸟与栖息地的时空关系及迁徙周期鲜有研究;5)鸟类数据利用和处理上存在局限性,未能深入挖掘数据中隐藏的知识和规律。
发明内容
为了解决观鸟数据中存在的重复采样、采样分布不均的问题,本发明的第一目的是提供一种获取候鸟迁徙路径描述的方法,本发明基于鸟类数据时间与空间的关联性,对时间和空间特性分别处理,既保证了数据分析的准确性,又充分挖掘时空数据中隐含的知识,能够准确快速地获取候鸟的迁徙路径。
本发明的一种获取候鸟迁徙路径描述的方法,包括:
将鸟类观测点的地址信息转化为GPS轨迹点坐标数据;
标准化处理GPS轨迹点坐标数据,形成标准化GPS轨迹点坐标数据序列;
对标准化GPS轨迹点坐标数据序列进行密度聚类,获取候鸟迁徙过程中所有的栖息地;
对每一个栖息地引入时间因素,获取所有栖息地的周期模式序列;所述周期模式序列由表征栖息地坐标的时空序列和表征候鸟在栖息地出现时间的时间序列构成;
按照时间顺序排列所有栖息地的周期模式序列,最终得到的时空序列作为候鸟迁徙路线,时间序列代表候鸟的迁徙方向。
进一步的,在标准化处理GPS轨迹点坐标数据的过程中,去除重复的GPS轨迹点坐标数据。
未经预处理的观鸟数据中存在大量的重复采样数据,这是导致观测记录数量在地域、时间和种类上分布不均的重要原因之一,如果不将这些重复数据剔除,会直接影响数据挖掘的质量。所以,在进行数据分析前,首先要对原始候鸟轨迹数据进行数据预处理,以去除重复数据,达到数据标准化的目的,初步解决观鸟记录数量分布不均的问题,为后期分析奠定基础。
进一步的,形成标准化GPS轨迹点坐标数据序列的过程包括:
对待标准化处理的GPS轨迹点坐标数据进行聚类,得到GPS轨迹特征点;
利用GPS轨迹特征点替换重复的GPS轨迹点坐标数据,进而得到标准化GPS轨迹点坐标数据序列。
本发明利用特征点来代替候鸟轨迹中重复的点,既可解决轨迹数据重复记录问题,确保数据挖掘质量,又对海量轨迹数据进行了压缩,减少了冗余,可有效提高后期数据分析的效率和准确性。对GPS轨迹点坐标数据进行标准化,数据分析前的必要准备,极大的提高了数据的可用性,使观鸟记录数量在地域、时间和种类上分布不均的问题得到初步解决。
进一步的,获取候鸟迁徙过程中所有的栖息地的过程包括:
根据标准化GPS轨迹点坐标数据序列的密度聚类,得若干个簇;
以簇内各个GPS轨迹点坐标数据相对应的鸟类观测点所观测到的“鸟类数量”作为权重,计算每个簇的“簇热度”;其中,簇热度为簇内各个GPS轨迹点坐标数据与其权重相乘之和;
计算各离群点的“点热度”,其中,“点热度”为每个观测点实际观测到的鸟类的数量;
将所有的“簇热度”和“点热度”按从大到小的顺序排列,筛选出大于预设热度阈值的区域作为候鸟的栖息地。
在鸟类的迁徙路线上,分布着许多可供利用的中途停歇地,这些停歇地和候鸟的越冬地、繁殖地共同构成候鸟的栖息地。栖息地中鸟类的种群数量往往多于其他地区,同样的,发现的鸟类数量越多,鸟类记录越密集的区域往往对于鸟类也越重要,这样的地区也成为了鸟类潜在的栖息地。本发明通过对标准化GPS轨迹点坐标数据序列进行密度聚类,最终能够快速准确地筛选出候鸟的栖息地。
进一步的,对每一个栖息地引入时间因素,获取所有栖息地的周期模式序列的过程包括:
首先,将每一类候鸟生活在栖息地看作是一个事件;选取其中一个兴趣区域,扫描该区域中时间序列集合,根据预设时间粒度对时间序列进行划分;
其次,找出每个事件发生的时间点,建立区域事件时间位置表;
然后,对区域事件时间位置表检测所有可能的周期;
最终得到所有栖息地的周期模式序列。
候鸟是一种在越冬地与繁殖地周期性迁徙的鸟类,候鸟与栖息地之间存在着一定的时间关联,需要找到每个栖息地中候鸟的时间模式,并生成迁徙路线。其基本思想为:针对每一个频繁区域,把区域内每一类候鸟的时空数据转换为时间序列数据,将每一类候鸟看做一个事件,对每一事件的时间序列进行周期检测,进而发现其周期模式。
本发明的第二目的是提供一种获取候鸟迁徙路径描述的装置。
本发明的一种获取候鸟迁徙路径描述的装置,包括:
数据转化模块,其用于将鸟类观测点的地址信息转化为GPS轨迹点坐标数据;
数据标准化处理模块,其用于标准化处理GPS轨迹点坐标数据,形成标准化GPS轨迹点坐标数据序列;
栖息地获取模块,其用于对标准化GPS轨迹点坐标数据序列进行密度聚类,获取候鸟迁徙过程中所有的栖息地;
周期模式序列获取模块,其用于对每一个栖息地引入时间因素,获取所有栖息地的周期模式序列;所述周期模式序列由表征栖息地坐标的时空序列和表征候鸟在栖息地出现时间的时间序列构成;
迁徙路线及方向获取模块,其用于按照时间顺序排列所有栖息地的周期模式序列,最终得到的时空序列作为候鸟迁徙路线,时间序列代表候鸟的迁徙方向。
进一步的,在所述数据标准化处理模块中,去除重复的GPS轨迹点坐标数据。
未经预处理的观鸟数据中存在大量的重复采样数据,这是导致观测记录数量在地域、时间和种类上分布不均的重要原因之一,如果不将这些重复数据剔除,会直接影响数据挖掘的质量。所以,在进行数据分析前,首先要对原始候鸟轨迹数据进行数据预处理,以去除重复数据,达到数据标准化的目的,初步解决观鸟记录数量分布不均的问题,为后期分析奠定基础。
优选地,数据标准化处理模块还包括:
GPS轨迹特征点获取模块,其用于对待标准化处理的GPS轨迹点坐标数据进行聚类,得到GPS轨迹特征点;
数据替换模块,其用于利用GPS轨迹特征点替换重复的GPS轨迹点坐标数据,进而得到标准化GPS轨迹点坐标数据序列。
本发明利用特征点来代替候鸟轨迹中重复的点,既可解决轨迹数据重复记录问题,确保数据挖掘质量,又对海量轨迹数据进行了压缩,减少了冗余,可有效提高后期数据分析的效率和准确性。对GPS轨迹点坐标数据进行标准化,数据分析前的必要准备,极大的提高了数据的可用性,使观鸟记录数量在地域、时间和种类上分布不均的问题得到初步解决。
进一步的,所述栖息地获取模块包括:
密度聚类模块,其用于根据标准化GPS轨迹点坐标数据序列的密度聚类,得若干个簇;
簇热度计算模块,其用于以簇内各个GPS轨迹点坐标数据相对应的鸟类观测点所观测到的“鸟类数量”作为权重,计算每个簇的“簇热度”;其中,簇热度为簇内各个GPS轨迹点坐标数据与其权重相乘之和;
点热度计算模块,其用于计算各离群点的“点热度”,其中,“点热度”为每个观测点实际观测到的鸟类的数量;
区域筛选模块,其用于将所有的“簇热度”和“点热度”按从大到小的顺序排列,筛选出大于预设热度阈值的区域作为候鸟的栖息地。
在鸟类的迁徙路线上,分布着许多可供利用的中途停歇地,这些停歇地和候鸟的越冬地、繁殖地共同构成候鸟的栖息地。栖息地中鸟类的种群数量往往多于其他地区,同样的,发现的鸟类数量越多,鸟类记录越密集的区域往往对于鸟类也越重要,这样的地区也成为了鸟类潜在的栖息地。本发明通过对标准化GPS轨迹点坐标数据序列进行密度聚类,最终能够快速准确地筛选出候鸟的栖息地。
进一步的,所述周期模式序列获取模块包括:
时间序列划分模块,其用于将每一类候鸟生活在栖息地看作是一个事件;选取其中一个兴趣区域,扫描该区域中时间序列集合,根据预设时间粒度对时间序列进行划分;
区域事件时间位置表建立模块,其用于找出每个事件发生的时间点,建立区域事件时间位置表;
周期检测模块,其用于对区域事件时间位置表检测所有可能的周期,最终得到所有栖息地的周期模式序列。
候鸟是一种在越冬地与繁殖地周期性迁徙的鸟类,候鸟与栖息地之间存在着一定的时间关联,需要找到每个栖息地中候鸟的时间模式,并生成迁徙路线。其基本思想为:针对每一个频繁区域,把区域内每一类候鸟的时空数据转换为时间序列数据,将每一类候鸟看做一个事件,对每一事件的时间序列进行周期检测,进而发现其周期模式。
本发明的第三目的是提供一种候鸟迁徙路径描述服务器。
本发明的一种候鸟迁徙路径描述服务器,包括上述所述的获取候鸟迁徙路径描述的装置。
与现有技术相比,本发明的有益效果是:
(1)本发明分利用了观鸟数据的优势,从候鸟迁徙活动时空变化的角度出发,结合每条观鸟记录中的重要属性——“鸟类数量”,解决了观鸟数据中存在的重复采样、采样分布不均等缺陷,提高了数据的质量,保证了后期分析的准确性;并对时间和空间特性分别处理,充分挖掘出鸟类时空数据中隐含的信息,提升了挖掘的质量,对观鸟数据的利用、处理和分析达到一个新高度,为候鸟迁徙的研究提供了新角度、新思路。
(2)本发明还可以将发现候鸟迁徙过程中的栖息地,作为候鸟保护区和观赏地,探索的候鸟的迁徙路线能够对未来候鸟的活动做简单预测,为机场鸟撞防护、鸟情预报提供理论支持。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1是本发明的一种获取候鸟迁徙路径描述的方法流程图;
图2是重复点集合P’(ej);
图3是特征点图;
图4是候鸟的栖息地示意图;
图5是滑动窗口示意图;
图6是事件潜周期发现过程示意图;
图7(a)是家燕数据中重复点集中的轨迹点;
图7(b)是家燕数据聚类后选取的特征点;
图7(c)是家燕数据中原始的轨迹点;
图7(d)是家燕数据预处理后的轨迹点;
图8(a)是白鹭数据中重复点集中的轨迹点;
图8(b)是白鹭数据聚类后选取的特征点;
图8(c)是白鹭数据中原始的轨迹点;
图8(d)是白鹭数据预处理后的轨迹点;
图9(a)是家燕数据密度聚类后得到的簇;
图9(b)是家燕热分布图;
图9(c)是家燕栖息地;
图10(a)是白鹭密度聚类后得到的簇;
图10(b)是白鹭热分布图;
图10(c)是白鹭栖息地;
图11是本发明的一种获取候鸟迁徙路径描述的装置结构示意图。
具体实施方式
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
本发明所涉及的名词及术语解释如下所述:
(1)候鸟迁徙轨迹:带有时间戳的候鸟空间位置序列称为候鸟迁徙轨迹,表示为P(ej)={p1(ej),p2(ej),…,pu(ej),pu+1(ej),…,pi(ej),…,pv(ej),…,pn(ej)},pi(ej)为鸟类的轨迹点,n为轨迹点数量。其中ej表示鸟类的种类,ej∈E={e1,e2,…,ej,…,eJ},j∈[1,J],J为鸟类的数量。
(2)轨迹点:是对鸟类观测采样点的描述,包括经度,纬度和时间戳三部分,表示为pi(ej)=<(xi,yi),ti,ej>,其中pi(ej)∈P(ej),j∈[1,J],i∈[1,n]。
(3)重复点集DPS:对于某一类鸟类ej的轨迹点集合P(ej)={pu(ej),pu+1(ej),…,pv(ej)},j∈[1,J],i∈[u,v],如果有Distance(pu,pi)≤θr,Distance(pu,pv+1)>θr,且|tv–tu|<θt称为重复点集,记为P’(ej)={pu’(ej),pu+1’(ej),…,pv’(ej)},P’(ej)∈P(ej)。{P1’(ej),P2’(ej),…,Pk’(ej),…,PK’(ej)}称作重复点集的集合,k∈[1,K],K为重复点集的集合的个数。
(4)特征点FP:在重复点集P’(ej)中,一个用以取代P’(ej)的轨迹点,称作特征点,记做sk(ej)=<(xk,yk),tu,tv,ej>,其中tu为起始时间,tv为结束时间;x,y表示当前特征点的中心坐标,k∈[1,K]。
(5)热度:某个点或某个区域的重要程度,称作热度。将“鸟类数量”作为权重,代表每个观测点实际观测到的鸟类的数量,用“点热度”来表示,权重越高,该点的热度越大。一个区域内“点热度”之和越大,该区域的热度越大。
(6)周期模式:候鸟ej的周期模式可表示成Per_Patternsl(ej)=<dl(ej),Tl(ej),Rep>,l∈[1,L],L为兴趣区域的个数,dl(ej)∈D(ej),Tl(ej)=(lengthl(ej),ta(ej),tb(ej)),其中ta(ej)≤tb(ej)且lengthi(ej)>0,其中lengthi(ej)表示周期的长度,ta(ej)表示事件的起始时间点,tb(ej)表示事件的结束时间点,Rep为周期的重复次数。
正如背景技术所介绍的,现有技术中存在1)采集的数据普遍存在不够全面、精度较低、数据量有限等问题;2)对原始数据的去重、去噪、标准化等工作鲜有涉及,导致数据的可利用性比较低;3)用于分析研究的数据量相对较小;4)候鸟与栖息地的时空关系及迁徙周期鲜有研究;5)鸟类数据利用和处理上存在局限性,未能深入挖掘数据中隐藏的知识和规律的问题,为了解决如上的技术问题,本申请提出了一种获取候鸟迁徙路径描述的方法。
图1是本发明的一种获取候鸟迁徙路径描述的方法流程图。
如图1所示,本发明的一种获取候鸟迁徙路径描述的方法,至少包括:
S101:将鸟类观测点的地址信息转化为GPS轨迹点坐标数据。
在具体实施过程中,每一条观鸟记录中都包含了其独有的时空信息,在对其进行挖掘分析前,需要将观鸟记录抽象为带有时间的点,一条记录对应一个点。该点将作为鸟类迁徙行为的一个轨迹点。轨迹点既可以代表一个个体,也可以代表一个群体,用于表现鸟类的分布和迁徙。具体做法为:将每条观鸟记录的“鸟类观测地点”中的文本信息转换为GPS经纬度坐标,以便于后期计算、比较和展示。
S102:标准化处理GPS轨迹点坐标数据,形成标准化GPS轨迹点坐标数据序列。
在具体实施过程中,未经预处理的中国观鸟数据中存在大量的重复采样数据,这是导致观测记录数量在地域、时间和种类上分布不均的重要原因之一,如果不将这些重复数据剔除,会直接影响数据挖掘的质量。所以,在进行数据分析前,首先要对原始候鸟轨迹数据进行数据预处理,以去除重复数据,达到数据标准化的目的,初步解决观鸟记录数量分布不均的问题,为后期分析奠定基础。
在鸟类观测数据集中,存在两类重复性数据:第一类为直观重复数据,表现为时间地点完全相同,即pi(ej)=pi+1(ej),可将该类数据进行简单合并处理;第二类为隐含的重复性数据,不易发现,其表现为同一类鸟类对应多个采样点记录,其时间、地点等具有相似性。当某一种鸟在一个连续的时间段和一个小范围区域内被多次采样,在以θr为邻域的范围,以θt为时间阈值内,就认为这些采样点数据出现重复。
具体地,形成标准化GPS轨迹点坐标数据序列的过程包括:
(1)对待标准化处理的GPS轨迹点坐标数据进行聚类,得到GPS轨迹特征点;
特征点的选取按照如下步骤进行:
Step1:设置参数θr和θt的值;
Step2:在候鸟ej的集合P(ej)={p1(ej),p2(ej),…,pi(ej),…,pn(ej)}中,随机选择一个点pi(ej)作为中心,计算其余各点到pi(ej)的距离;
Step3:If Distance(pother,pi)≤θr&&|tother–ti|<θt,then点pi(ej)加入重复点集合P’(ej)中,如图2所示;
Step4:输出P’(ej);
Step5:对重复点集合P’(ej)使用k-mediods聚类算法,k-mediods算法簇数设置为1,得到的簇中心点作为P’(ej)的特征点sk(ej)=<(xk,yk),tu,tv,ej>;
Step6:对P’(ej)中的所有轨迹点求加权平均数,每个点的“鸟类数量”作为权值,得到的平均数作为特征点sk(ej)的“鸟类数量”;
Step7:对P’(ej)中的每一个点重复Step1-Step4,直到输出所有FP,如图3所示;
Step8:将特征点与不属于重复点集的轨迹点数据重新排列,得到关于ej的新轨迹点序列S(ej)={s1(ej),s2(ej),…,sk(ej),…,sm(ej)},m为新轨迹点个数,输出S(ej)。
数据预处理作为数据分析前的必要准备,极大的提高了数据的可用性,使观鸟记录数量在地域、时间和种类上分布不均的问题得到初步解决。
(2)利用GPS轨迹特征点替换重复的GPS轨迹点坐标数据,进而得到标准化GPS轨迹点坐标数据序列。
本发明利用特征点来代替候鸟轨迹中重复的点,既可解决轨迹数据重复记录问题,确保数据挖掘质量,又对海量轨迹数据进行了压缩,减少了冗余,可有效提高后期数据分析的效率和准确性。
S103:对标准化GPS轨迹点坐标数据序列进行密度聚类,获取候鸟迁徙过程中所有的栖息地。
在鸟类的迁徙路线上,分布着许多可供利用的中途停歇地,这些停歇地和候鸟的越冬地、繁殖地共同构成候鸟的栖息地。栖息地中鸟类的种群数量往往多于其他地区,同样的,发现的鸟类数量越多,鸟类记录越密集的区域往往对于鸟类也越重要,这样的地区也成为了鸟类潜在的栖息地。
具体地,获取候鸟迁徙过程中所有的栖息地的过程包括:
(1)根据标准化GPS轨迹点坐标数据序列的密度聚类,得若干个簇;
(2)以簇内各个GPS轨迹点坐标数据相对应的鸟类观测点所观测到的“鸟类数量”作为权重,计算每个簇的“簇热度”;其中,簇热度为簇内各个GPS轨迹点坐标数据与其权重相乘之和;
(3)计算各离群点的“点热度”,其中,“点热度”为每个观测点实际观测到的鸟类的数量;
(4)将所有的“簇热度”和“点热度”按从大到小的顺序排列,筛选出大于预设热度阈值的区域作为候鸟的栖息地。
栖息地发现的基本步骤:
Step1:对候鸟ej的新轨迹点序列S(ej)={s1(ej),s2(ej),…,sm(ej)},使用DBSCAN算法进行密度聚类,得到关于ej的一系列大小形状各异的簇,记为C(ej)={c1(ej),c2(ej),…,cl(ej),…,cL(ej)},l∈[1,L],L为簇的个数。
Step2:以“鸟类数量”作为权重,计算每个簇的“簇热度”,记做HDC。簇热度计算方法:簇cl(ej)内各点与其权重相乘之和;
Step3:计算各离群点的“点热度”;
Step4:将所有的HDP和HDC按从大到小的顺序排列,筛选出热度较高的区域作为候鸟的栖息地,记作:D(ej)={d1(ej),d2(ej),…,dl(ej),…,dL(ej)},l∈[1,L],L为栖息地的个数;
Step5:分别对每一种候鸟的新轨迹点重复Step1-Step4;
Step6:输出所有候鸟的栖息地,如图4所示。
本发明通过对标准化GPS轨迹点坐标数据序列进行密度聚类,最终能够快速准确地筛选出候鸟的栖息地。
S104:对每一个栖息地引入时间因素,获取所有栖息地的周期模式序列;所述周期模式序列由表征栖息地坐标的时空序列和表征候鸟在栖息地出现时间的时间序列构成。
候鸟是一种在越冬地与繁殖地周期性迁徙的鸟类,候鸟与栖息地之间存在着一定的时间关联,需要找到每个栖息地中候鸟的时间模式,并生成迁徙路线。其基本思想为:针对每一个频繁区域,把区域内每一类候鸟的时空数据转换为时间序列数据,将每一类候鸟看做一个事件,对每一事件的时间序列进行周期检测,进而发现其周期模式。
具体地,本阶段的基本步骤为:首先,选取其中一个兴趣区域dl(ej),扫描该区域中时间序列集合,选取合适的时间粒度,对时间序列进行划分;其次,找出每个事件发生的时间点,建立区域事件时间位置表(E,Time),如表1所示(以e1为例);然后,对区域事件时间位置表(E,Time)检测可能的周期。
表1区域事件时间位置表(E,Time)
Figure BDA0001244972820000101
对区域事件事件位置表进行以下操作:
Step1:扫描区域事件时间位置表,并设置参数:周期次数指针Count_length,初始值为0;最小周期长度Min_length,最大周期长度Max_length,Min_length和Max_length长度由用户设定;最小发生次数min_rep,大小由用户设定;周期模式重复次数指针rep,初始值为0;某一事件发生的时间点的个数Count_Time;
Step2:从该事件的最后一个时间点开始,从后向前建立滑动窗。在滑动窗内比较该事件的任意两次发生时间点的间距,记为length=tα-tβ,α∈[1,Count_Time],β∈[α+1,Count_Time];
Step3:如果Min_length≤length≤Max_length,则Count_length=Count_length+1;否则停止计算,在下一个时间点tα+1处重新建立滑动窗,对该事件的每一个时间点进行上述计算;
Step4:判断每一个周期值length的Count_length,如果有Count_length≥min_rep,则该周期就是一个潜在周期,记为Pot_length={pot_length1,pot_length2,…,pot_lengthλ,…,pot_lengthγ},λ∈[1,γ],γ为潜在周期个数。
Step5:建立周期时间点对应表(E,Pot_length,Time’):重复Step2到Step4,找到该事件所有潜在周期,并建立周期时间对应表(E,Pot_length,Time’),Pot_length记录每一个潜在的周期,Time’记录其对应的时间点Time’∈Time;
Step6:建立哈希链表结构:扫描事件ej的周期时间对应表(E,Pot_length,Time’),对表中该事件的每一个潜在周期长度pot_lengthλ,λ∈[1,γ],求余mod=tα’%pot_lengthλ,tα’∈Time’并建立哈希链表结构;
Step7:输出事件的有效周期模式:如果某一余数的链表满足:链表长度mod_rep>min_rep,且链表中的值为公差是pot_lengthλ的等差数列;则输出pot_lengthλ为有效周期,重复次数Rep=mod_rep-1,该等差数列的第一个值为起始时间点,最后一个值为结束时间点,生成周期模式。
以事件e1为例,Min_length=2,Max_length=7,min_rep=2,Count_Time=13。e1的滑动窗口和周期时间对应表(E,pot_length,Time’),如图5和表2所示。取pot_lengthλ=5,重置min_rep=3,取表1中所对应的时间点,该事件潜周期发现过程的如图6所示;其中0、1、2、3、4是该周期被整除后所对应的所有可能的余数;余数为3时,mod_rep=4>min_rep,且公差为5,所以,e1的有效周期为5,出现的时间点为3,8,13,18;Rep=3。
S105:按照时间顺序排列所有栖息地的周期模式序列,最终得到的时空序列作为候鸟迁徙路线,时间序列代表候鸟的迁徙方向。
表2周期时间对应表(E,Pot_length,Time’)
Figure BDA0001244972820000111
对于候鸟ej,利用上述方法求出其所有栖息地D(ej)的周期模式,按照时间顺序排列各栖息地,得到的时空序列作为候鸟迁徙路线,其时间序列代表候鸟的迁徙方向。
候鸟ej的周期模式可表示成Per_Patternsl(ej)=<dl(ej),Tl(ej),Rep>,l∈[1,L],L为兴趣区域的个数,dl(ej)∈D(ej),Tl(ej)=(lengthl(ej),ta(ej),tb(ej)),其中ta(ej)≤tb(ej)且lengthi(ej)>0,其中lengthi(ej)表示周期的长度,ta(ej)表示事件的起始时间点,tb(ej)表示事件的结束时间点,Rep为周期的重复次数。
为验证本发明的该方法的可行性和有效性,以家燕和白鹭为实验对象,探究其栖息地和迁徙路径;并将数据挖掘的结果同鸟类学权威文献《中国鸟类野外手册》及《中国鸟类分类与分布名录》作对比,以验证本发明的该方法的可行性和有效性。
本实验的运行环境是windows7操作系统,算法编写使用C#语言。软件开发环境为:Microsoft Visual Studio 2010和SQL server 2010。
实验一:数据预处理
利用特征点来代替候鸟轨迹中重复的点,既可解决轨迹数据重复记录问题,确保数据挖掘质量,又对海量轨迹数据进行了压缩,减少了冗余,可有效提高后期数据分析的效率和准确性。
表3为筛选出的家燕轨迹点中部分重复点集数据,时间从2008年5月2日到2008年5月9日;表4为筛选出的白鹭轨迹点中部分重复点集数据,时间从2015年7月12日到2015年7月19日。
表3筛选出的家燕轨迹点中部分重复点集数据
Figure BDA0001244972820000121
表4筛选出的白鹭轨迹点中部分重复点集数据
Figure BDA0001244972820000122
根据观鸟数据的特征,与基于经纬度坐标的球面距离,估计设置以下参数,如表2所示。经过实验测试,当θr=6(km),θt=10时,聚类效果最好,取得的特征点可以更好的代表重复点集的位置和时间,如表5所示。
表5重复点集参数选取表
Figure BDA0001244972820000131
当ej=家燕,将表3中重复点集中的轨迹点(2008年5月2日到2008年5月9日江苏南京附近)标注在地图上,如图7(a);聚类后,得到一个特征点,如图7(b)所示;以此类推找出家燕所有的重复点集,并利用特征点替代,如图7(c)和7(d)所示,可见线框内的轨迹点明显少于原始轨迹点。
当ej=白鹭,将表4中重复点集中的轨迹点(2015年7月12到2015年7月19日上海浦东附近)标注在地图上,如图8(a);聚类后,得到一个特征点,如图8(b)所示;以此类推找出家燕所有的重复点集,并利用特征点替代,如图8(c)和8(d)所示,可见线框内的轨迹点明显少于原始轨迹点。
实验二:栖息地发现
对预处理后候鸟的新轨迹点序列S(ej),利用密度聚类和热度计算得到候鸟迁徙过程中的栖息地。
当ej=家燕,通过聚类得到25个簇C(家燕)如图9(a);计算所有点的热度,用热力图表示,如图9(b),最后得到11个家燕的栖息地D(家燕)={d1,d2,d3,d4,d5,d6,d7,d8,d9,d10,d11},热度分别为{369,1287,1885,1221,287,155,177,159,231,189,122},如图9(c)。
当ej=白鹭,通过聚类得到17个簇C(白鹭)如图10(a);计算所有点的热度,用热力图表示热度,如图10(b),最后得到13个家燕的栖息地D(白鹭)={d1,d2,d3,d4,d5,d6,d7,d8,d9,d10,d11,d12,d13},热度分别为{487,288,62,2881,972,164,327,110,100,72,150,390,257},如图10(c)。
实验三:周期模式挖掘
首先,按照一定的时间粒度,对1970年至2015年的时间序列进行划分,其中,没有观鸟记录的年份将被忽略。我们定义一个年份集合CY={2015,2014,2013,2012,2010,2009,2008,2007,2006,2005,2004,2003,2002,2001,2000,1993,1992,1991,1987,1986,1985,1984,1983,1981,1970},作为研究的时间序列。时间粒度以10天为单位,对集合CY进行划分,将连续的日期划分为离散的数据点,如表6。
表6时间粒度划分表
Figure BDA0001244972820000141
然后,利用实验二中得到的结论,选取一个候鸟的栖息地,挖掘事件的周期模式。
当ej=家燕,选择栖息地d3,对d3建立区域事件时间位置列表(不考虑个别留鸟的情况)如表7。
表7区域事件时间位置表(家燕)
Figure BDA0001244972820000142
当设置最小周期为10,最大周期为108,最小发生次数为4时,对得到的若干潜在周期利用哈希算法生成单个事件在该兴趣区域的有效周期,得到有效周期{36,72}。周期模式为:
Per_Patterns3(家燕)=<d3,T3,23>,T3(家燕)=(36,906,29);
Per_Patterns3(家燕)=<d3,T3,21>,T3(家燕)=(36,892,9);
Per_Patterns3(家燕)=<d3,T3,7>,T3(家燕)=(72,673,169);
由此,可以得出结论,在兴趣区域3中,家燕通常在每年3月中旬左右到达,在10月上旬离开;也会有在2月下旬到达的情况。将家燕的栖息地与其在各栖息地周期模式相关联,即可得到家燕的迁徙路线,家燕每年3月上旬从南方向北方迁徙,沿东、西两条迁徙带迁徙,到9月中旬开始南迁。
当ej=白鹭,选择栖息地d4,对d4建立区域事件时间位置列表(不考虑个别留鸟的情况)如表8。
表8区域事件时间位置表(白鹭)
Figure BDA0001244972820000143
Figure BDA0001244972820000151
当设置最小周期为10,最大周期为108,最小发生次数为4时,对得到的若干潜在周期利用哈希算法生成单个事件在该兴趣区域的有效周期,得到有效周期{37,70,107}。周期模式为:
Per_Patterns4(白鹭)=<d4,T4,22>,T4(白鹭)=(37,873,33);
Per_Patterns4(白鹭)=<d4,T4,21>,T4(白鹭)=(37,812,7);
Per_Patterns4(白鹭)=<d4,T4,9>,T4(白鹭)=(70,736,105);
Per_Patterns4(白鹭)=<d4,T4,4>,T4(白鹭)=(107,665,220);
由此,可以得出结论,在兴趣区域3中,白鹭通常在每年3月下旬左右到达,在10月下旬离开;也会有在11月中旬到12月初离开的情况。将白鹭的栖息地与其在各栖息地周期模式相关联,即可得到家燕的迁徙路线。白鹭部分为留鸟,部分迁徙,迁徙的部分每年2月下旬从南方向北方迁徙,只沿东部迁徙带迁徙,到10月中旬开始南迁。
从实验结果来看,本发明的该方法具有其独有的优势:第一,与现有的数据分析工具(如Spass、MATLAB等)相比,该方法更贴近观鸟数据的数据特点,更符合鸟类数据分析的要求。第二,与现有的研究方法相比,更注重数据预处理方面的工作,并着重分析了鸟类数据时间与空间的关联性,不仅取得了更好的效果,而且提高了算法效率。
利用数据挖掘技术处理和分析鸟类数据,是一种比较先进的思想和手段。我们提出了一种全新的算法去挖掘鸟类数据,而不是利用已有的数据分析工具,如Spass。与以往的方法相比文献,更注重数据预处理方面的工作。另外,着重分析了鸟类数据时间与空间的关联性,对时间和空间特性分别处理,既保证了数据分析的准确性,又充分挖掘时空数据中隐含的知识。利用数据挖掘技术的优势弥补观鸟数据的不足。
图11是本发明的一种获取候鸟迁徙路径描述的装置结构示意图。
如图11所示,本发明的一种获取候鸟迁徙路径描述的装置,包括:
(1)数据转化模块,其用于将鸟类观测点的地址信息转化为GPS轨迹点坐标数据。
在具体实施过程中,每一条观鸟记录中都包含了其独有的时空信息,在对其进行挖掘分析前,需要将观鸟记录抽象为带有时间的点,一条记录对应一个点。该点将作为鸟类迁徙行为的一个轨迹点。轨迹点既可以代表一个个体,也可以代表一个群体,用于表现鸟类的分布和迁徙。具体做法为:将每条观鸟记录的“鸟类观测地点”中的文本信息转换为GPS经纬度坐标,以便于后期计算、比较和展示。
(2)数据标准化处理模块,其用于标准化处理GPS轨迹点坐标数据,形成标准化GPS轨迹点坐标数据序列;
具体地,在所述数据标准化处理模块中,去除重复的GPS轨迹点坐标数据。
未经预处理的观鸟数据中存在大量的重复采样数据,这是导致观测记录数量在地域、时间和种类上分布不均的重要原因之一,如果不将这些重复数据剔除,会直接影响数据挖掘的质量。所以,在进行数据分析前,首先要对原始候鸟轨迹数据进行数据预处理,以去除重复数据,达到数据标准化的目的,初步解决观鸟记录数量分布不均的问题,为后期分析奠定基础。
其中,数据标准化处理模块还包括:
GPS轨迹特征点获取模块,其用于对待标准化处理的GPS轨迹点坐标数据进行聚类,得到GPS轨迹特征点;
数据替换模块,其用于利用GPS轨迹特征点替换重复的GPS轨迹点坐标数据,进而得到标准化GPS轨迹点坐标数据序列。
本发明利用特征点来代替候鸟轨迹中重复的点,既可解决轨迹数据重复记录问题,确保数据挖掘质量,又对海量轨迹数据进行了压缩,减少了冗余,可有效提高后期数据分析的效率和准确性。对GPS轨迹点坐标数据进行标准化,数据分析前的必要准备,极大的提高了数据的可用性,使观鸟记录数量在地域、时间和种类上分布不均的问题得到初步解决。
(3)栖息地获取模块,其用于对标准化GPS轨迹点坐标数据序列进行密度聚类,获取候鸟迁徙过程中所有的栖息地。
具体地,栖息地获取模块包括:
密度聚类模块,其用于根据标准化GPS轨迹点坐标数据序列的密度聚类,得若干个簇;
簇热度计算模块,其用于以簇内各个GPS轨迹点坐标数据相对应的鸟类观测点所观测到的“鸟类数量”作为权重,计算每个簇的“簇热度”;其中,簇热度为簇内各个GPS轨迹点坐标数据与其权重相乘之和;
点热度计算模块,其用于计算各离群点的“点热度”,其中,“点热度”为每个观测点实际观测到的鸟类的数量;
区域筛选模块,其用于将所有的“簇热度”和“点热度”按从大到小的顺序排列,筛选出大于预设热度阈值的区域作为候鸟的栖息地。
在鸟类的迁徙路线上,分布着许多可供利用的中途停歇地,这些停歇地和候鸟的越冬地、繁殖地共同构成候鸟的栖息地。栖息地中鸟类的种群数量往往多于其他地区,同样的,发现的鸟类数量越多,鸟类记录越密集的区域往往对于鸟类也越重要,这样的地区也成为了鸟类潜在的栖息地。本发明通过对标准化GPS轨迹点坐标数据序列进行密度聚类,最终能够快速准确地筛选出候鸟的栖息地。
(4)周期模式序列获取模块,其用于对每一个栖息地引入时间因素,获取所有栖息地的周期模式序列;所述周期模式序列由表征栖息地坐标的时空序列和表征候鸟在栖息地出现时间的时间序列构成;
具体地,周期模式序列获取模块包括:
时间序列划分模块,其用于将每一类候鸟生活在栖息地看作是一个事件;选取其中一个兴趣区域,扫描该区域中时间序列集合,根据预设时间粒度对时间序列进行划分;
区域事件时间位置表建立模块,其用于找出每个事件发生的时间点,建立区域事件时间位置表;
周期检测模块,其用于对区域事件时间位置表检测所有可能的周期,最终得到所有栖息地的周期模式序列。
候鸟是一种在越冬地与繁殖地周期性迁徙的鸟类,候鸟与栖息地之间存在着一定的时间关联,需要找到每个栖息地中候鸟的时间模式,并生成迁徙路线。其基本思想为:针对每一个频繁区域,把区域内每一类候鸟的时空数据转换为时间序列数据,将每一类候鸟看做一个事件,对每一事件的时间序列进行周期检测,进而发现其周期模式。
(5)迁徙路线及方向获取模块,其用于按照时间顺序排列所有栖息地的周期模式序列,最终得到的时空序列作为候鸟迁徙路线,时间序列代表候鸟的迁徙方向。
本发明还提供了一种候鸟迁徙路径描述服务器,包括如图11所示的获取候鸟迁徙路径描述的装置。
本发明分利用了观鸟数据的优势,从候鸟迁徙活动时空变化的角度出发,结合每条观鸟记录中的重要属性——“鸟类数量”,解决了观鸟数据中存在的重复采样、采样分布不均等缺陷,提高了数据的质量,保证了后期分析的准确性;并对时间和空间特性分别处理,充分挖掘出鸟类时空数据中隐含的信息,提升了挖掘的质量,对观鸟数据的利用、处理和分析达到一个新高度,为候鸟迁徙的研究提供了新角度、新思路。
本发明还可以将发现候鸟迁徙过程中的栖息地,作为候鸟保护区和观赏地,探索的候鸟的迁徙路线能够对未来候鸟的活动做简单预测,为机场鸟撞防护、鸟情预报提供理论支持。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (5)

1.一种获取候鸟迁徙路径描述的方法,其特征在于,包括:
将鸟类观测点的地址信息转化为GPS轨迹点坐标数据;
进行数据分析前,首先要对原始候鸟轨迹数据进行数据预处理,以去除重复数据,达到数据标准化的目的;
标准化处理GPS轨迹点坐标数据,形成标准化GPS轨迹点坐标数据序列;
形成标准化GPS轨迹点坐标数据序列的过程包括:
对待标准化处理的GPS轨迹点坐标数据进行聚类,得到GPS轨迹特征点;
利用GPS轨迹特征点替换重复的GPS轨迹点坐标数据,进而得到标准化GPS轨迹点坐标数据序列,如果两个GPS轨迹点之间的距离在以θr为邻域的范围,时间差在以θt为时间阈值内,则认为两个GPS轨迹点数据出现重复;
对标准化GPS轨迹点坐标数据序列进行密度聚类,获取候鸟迁徙过程中所有的栖息地;
基于鸟类数据时间与空间的关联性,对时间和空间特性分别处理,挖掘时空数据中隐含的知识,获取候鸟的迁徙路径;
对每一个栖息地引入时间因素,获取所有栖息地的周期模式序列;所述周期模式序列由表征栖息地坐标的时空序列和表征候鸟在栖息地出现时间的时间序列构成;
按照时间顺序排列所有栖息地的周期模式序列,最终得到的时空序列作为候鸟迁徙路线,时间序列代表候鸟的迁徙方向;
获取候鸟迁徙过程中所有的栖息地的过程包括:
根据标准化GPS轨迹点坐标数据序列的密度聚类,得若干个簇;
以簇内各个GPS轨迹点坐标数据相对应的鸟类观测点所观测到的“鸟类数量”作为权重,计算每个簇的“簇热度”;其中,簇热度为簇内各个GPS轨迹点坐标数据与其权重相乘之和;
计算各离群点的“点热度”,其中,“点热度”为每个观测点实际观测到的鸟类的数量;
将所有的“簇热度”和“点热度”按从大到小的顺序排列,筛选出大于预设热度阈值的区域作为候鸟的栖息地。
2.如权利要求1所述的获取候鸟迁徙路径描述的方法,其特征在于,对每一个栖息地引入时间因素,获取所有栖息地的周期模式序列的过程包括:
首先,将每一类候鸟生活在栖息地看作是一个事件;选取其中一个兴趣区域,扫描该兴趣区域中时间序列集合,根据预设时间粒度对时间序列进行划分;
其次,找出每个事件发生的时间点,建立区域事件时间位置表;
然后,对区域事件时间位置表检测所有周期;
最终得到所有栖息地的周期模式序列。
3.一种获取候鸟迁徙路径描述的装置,其特征在于,包括:
数据转化模块,其用于将鸟类观测点的地址信息转化为GPS轨迹点坐标数据;
数据标准化处理模块,其用于标准化处理GPS轨迹点坐标数据,形成标准化GPS轨迹点坐标数据序列;
栖息地获取模块,其用于对标准化GPS轨迹点坐标数据序列进行密度聚类,获取候鸟迁徙过程中所有的栖息地;
周期模式序列获取模块,其用于对每一个栖息地引入时间因素,获取所有栖息地的周期模式序列;所述周期模式序列由表征栖息地坐标的时空序列和表征候鸟在栖息地出现时间的时间序列构成;基于鸟类数据时间与空间的关联性,对时间和空间特性分别处理,挖掘时空数据中隐含的知识,获取候鸟的迁徙路径;
迁徙路线及方向获取模块,其用于按照时间顺序排列所有栖息地的周期模式序列,最终得到的时空序列作为候鸟迁徙路线,时间序列代表候鸟的迁徙方向;
数据标准化处理模块还包括:
进行数据分析前,首先要对原始候鸟轨迹数据进行数据预处理,以去除重复数据,达到数据标准化的目的;
GPS轨迹特征点获取模块,其用于对待标准化处理的GPS轨迹点坐标数据进行聚类,得到GPS轨迹特征点;
数据替换模块,其用于利用GPS轨迹特征点替换重复的GPS轨迹点坐标数据,进而得到标准化GPS轨迹点坐标数据序列,如果两个GPS轨迹点之间的距离在以θr为邻域的范围,时间差在以θt为时间阈值内,则认为两个GPS轨迹点数据出现重复;
所述栖息地获取模块包括:
密度聚类模块,其用于根据标准化GPS轨迹点坐标数据序列的密度聚类,得若干个簇;
簇热度计算模块,其用于以簇内各个GPS轨迹点坐标数据相对应的鸟类观测点所观测到的“鸟类数量”作为权重,计算每个簇的“簇热度”;其中,簇热度为簇内各个GPS轨迹点坐标数据与其权重相乘之和;
点热度计算模块,其用于计算各离群点的“点热度”,其中,“点热度”为每个观测点实际观测到的鸟类的数量;
区域筛选模块,其用于将所有的“簇热度”和“点热度”按从大到小的顺序排列,筛选出大于预设热度阈值的区域作为候鸟的栖息地。
4.如权利要求3所述的获取候鸟迁徙路径描述的装置,其特征在于,所述周期模式序列获取模块包括:
时间序列划分模块,其用于将每一类候鸟生活在栖息地看作是一个事件;选取其中一个兴趣区域,扫描该兴趣区域中时间序列集合,根据预设时间粒度对时间序列进行划分;
区域事件时间位置表建立模块,其用于找出每个事件发生的时间点,建立区域事件时间位置表;
周期检测模块,其用于对区域事件时间位置表检测所有周期,最终得到所有栖息地的周期模式序列。
5.一种候鸟迁徙路径描述服务器,其特征在于,包括如权利要求3-4中任一项所述的获取候鸟迁徙路径描述的装置。
CN201710148953.6A 2017-03-14 2017-03-14 一种获取候鸟迁徙路径描述的方法、装置及服务器 Expired - Fee Related CN106940718B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710148953.6A CN106940718B (zh) 2017-03-14 2017-03-14 一种获取候鸟迁徙路径描述的方法、装置及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710148953.6A CN106940718B (zh) 2017-03-14 2017-03-14 一种获取候鸟迁徙路径描述的方法、装置及服务器

Publications (2)

Publication Number Publication Date
CN106940718A CN106940718A (zh) 2017-07-11
CN106940718B true CN106940718B (zh) 2020-11-20

Family

ID=59469908

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710148953.6A Expired - Fee Related CN106940718B (zh) 2017-03-14 2017-03-14 一种获取候鸟迁徙路径描述的方法、装置及服务器

Country Status (1)

Country Link
CN (1) CN106940718B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107862030B (zh) * 2017-11-01 2020-07-31 平安科技(深圳)有限公司 出险待命位置确定方法、装置、计算机设备和存储介质
JP7163776B2 (ja) * 2019-01-08 2022-11-01 トヨタ自動車株式会社 情報処理装置、情報処理システム、プログラム、および情報処理方法
CN110188832B (zh) * 2019-05-08 2020-12-08 中国民航科学技术研究院 基于探鸟雷达的机场留鸟活动节律统计分析方法
CN113486940B (zh) * 2021-06-30 2023-10-31 浙江大学 一种基于自适应带宽的候鸟迁徙轨迹重建方法
CN117094177B (zh) * 2023-10-18 2024-01-19 深圳市中大合顺生物科技有限公司 一种基于红火蚁防控的轨迹生成方法及系统
CN117591794B (zh) * 2024-01-18 2024-03-22 吉林省林业科学研究院(吉林省林业生物防治中心站) 基于时间序列的鸟类迁徙轨迹预测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104657424A (zh) * 2015-01-21 2015-05-27 段炼 一种多时空特征融合下的兴趣点轨迹聚类方法
CN104700207B (zh) * 2015-02-28 2017-12-29 中国地质大学(武汉) 一种基于物联网的矿山开采动态实时监测方法与系统

Also Published As

Publication number Publication date
CN106940718A (zh) 2017-07-11

Similar Documents

Publication Publication Date Title
CN106940718B (zh) 一种获取候鸟迁徙路径描述的方法、装置及服务器
Johnston et al. Best practices for making reliable inferences from citizen science data: case study using eBird to estimate species distributions
Ambrosini et al. A quantitative measure of migratory connectivity
Mandal et al. Urban growth dynamics and changing land-use land-cover of megacity Kolkata and its environs
CN109033011B (zh) 计算轨迹频繁度的方法、装置、存储介质及电子设备
CN107133318B (zh) 一种基于手机信令数据的人口识别方法
Joly et al. Objective classification of air quality monitoring sites over Europe
CN106790468B (zh) 一种分析用户WiFi活动轨迹规律的分布式实现方法
Ikanovic et al. An alternative approach to the limits of predictability in human mobility
CN105307121B (zh) 一种信息处理方法及装置
CN111554408B (zh) 城市内部登革热时空预测方法、系统及电子设备
Gage et al. Acoustic patterns at the Samford ecological research facility in South East Queensland, Australia: the peri-urban supersite of the terrestrial ecosystem research network
CN108733774B (zh) 一种基于大数据的失业人口动态监测方法
CN110110025B (zh) 基于特征向量空间滤值的区域人口密度模拟方法
CN109614450A (zh) 基于多维数据的人员去向分析的方法及系统
Blanke et al. Crowdsourced pedestrian map construction for short-term city-scale events
Dong et al. Effect of sample number and location on accuracy of land use regression model in NO2 prediction
Amichi et al. Understanding individuals' proclivity for novelty seeking
CN109146264B (zh) 一种疫苗资源的配置方法和系统
Almquist et al. Point process models for household distributions within small areal units
CN106850777B (zh) 推送信息的方法和装置
Anderson et al. Quantitative methods for current environmental issues
CN111460246B (zh) 基于数据挖掘和密度检测的实时活动异常人员发现方法
CN110213711B (zh) 一种常驻点的估计方法、装置、设备和介质
CN114358375B (zh) 一种基于大数据的人群密度预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20201120