CN109684384B - 一种轨迹数据时空密度分析系统及其分析方法 - Google Patents
一种轨迹数据时空密度分析系统及其分析方法 Download PDFInfo
- Publication number
- CN109684384B CN109684384B CN201811639046.2A CN201811639046A CN109684384B CN 109684384 B CN109684384 B CN 109684384B CN 201811639046 A CN201811639046 A CN 201811639046A CN 109684384 B CN109684384 B CN 109684384B
- Authority
- CN
- China
- Prior art keywords
- time
- point
- space
- track
- density
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Navigation (AREA)
- Position Fixing By Use Of Radio Waves (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种轨迹数据时空密度分析系统及其分析方法,技术方案如下:时空密度分析模块利用轨迹数据预处理模块得到的目标轨迹数据进行计算,得到各个轨迹点的时空密度值,时空分布密度可视化模块将目标轨迹数据以及轨迹点的时空密度值,分别绘制成轨迹散点图和时空密度曲线,呈现给用户;在结果提取模块,针对用户感兴趣的密度分析结果进行提取和保存,最后根据提取结果的经纬度和时间信息在地图上相应位置进行标注。本系统和方法能够服务于更加广泛的应用,计算过程和结果的呈现更加直观,且不需要用户提前对数据进行过多的预处理,系统的操作更加简单。
Description
技术领域
本发明一种轨迹数据时空密度分析系统及其分析方法,属于轨迹数据挖掘技术领域。
背景技术
轨迹数据挖掘是利用数据挖掘的有关技术和方法发现时空轨迹数据中蕴含的有价值的信息或知识的过程。通讯技术的飞速发展,让人们获得了海量的轨迹数据,如何有效利用这批数据,分析并挖掘其中有价值的知识或者模式越来越受到人们的重视。
轨迹数据挖掘中的大部分密度分析方法都是在传统空间数据挖掘领域的基础上发展而来的,这些空间数据的处理方法在处理时空轨迹数据时存在一定的局限性,且这些方法应用范围单一,主要针对于特定的聚类任务而言。目前来说,针对轨迹数据的深入研究的系统缺乏,如何能够统一的针对轨迹数据的时空分布特征进行分析,并将分析结果以可视化的形式呈现给用户,从而使用户能够利用该时空密度分析结果,进一步开展针对轨迹数据的深入研究,比如说,对停止点提取,位置检测,噪声发现和剔除,移动轨迹的语义分析等研究,是亟待解决的方向。
发明内容
为解决现有技术存在的不足,本发明公开了一种轨迹数据时空密度分析系统及其分析方法,该系统时空密度度量精度更高,用途更加多样化的,能够通过轨迹点的移动指标、空间影响因子以及停留时间来计算轨迹点的时空分布密度。
本发明通过以下技术方案实现:
一种轨迹数据时空密度分析系统,包括轨迹数据预处理模块、时空密度计算模块、时空分布密度可视化模块、结果提取模块;
所述数据预处理模块,用于上传轨迹数据并检测数据的合法性,使用合法的数据构造相关的带位置和时间信息的目标数据文件;
所述时空密度计算模块,通过与用户交互,获取用户感兴趣的移动对象停留位置的规模,并利用轨迹点邻居的位置和时间信息,获得该轨迹点邻域半径范围内的移动指标、空间影响因子以及停留时间,进而最终获得各点的时空密度;
所述时空分布密度可视化模块,用于将预处理得到的目标数据的经纬度位置信息,以及时空密度计算模块得到的各个轨迹点的时空密度值,分别绘制成轨迹散点图和时空密度曲线呈现给用户;
所述结果提取模块包括停止点提取、位置检测、噪声发现和剔除三个单元,系统通过用户交互的方式,实现停止点提取、位置检测、噪声发现和剔除;所述结果提取模块还包含了具有GPS定位功能的地图软件,根据提取的结果在地图上进行匹配和标注。
所述轨迹数据预处理模块包括轨迹数据上传单元和数据合法性检测单元。所述轨迹数据上传单元,设定用户通过web上传和读取本地文件的方式获取轨迹数据。所述数据合法性检测单元,用于检测用户上传的轨迹数据文件是否带有与经纬度坐标和时间相关的数据信息。
所述停止点提取单元,提取时空密度曲线中的各个时间跨度满足停留的最短持续时间限制的各个波峰的经纬度和时间信息,并保存。
所述位置检测单元,提示用户输入最小的密度阈值,并将时空密度曲线中满足该最小密度阈值约束的轨迹点的经纬度和时间信息,提取出来,并保存。
所述噪声发现和剔除单元,用于时空密度曲线中,将密度值与其周围小范围内的轨迹点的密度值存在显著差异的轨迹点,进行标记,并按照用户需求从目标数据中剔除。
一种所述轨迹数据时空密度分析系统的分析方法,包括以下步骤:
步骤1:通过轨迹数据预处理模块中的数据上传单元实现轨迹数据上传,包括Web上传方式和本地上传方式;
所述Web上传方式采集数据时,通过监听Web客户端的数据上传请求建立客户端与数据存储服务器的链接。所述本地上传方式,通过用户指定的本地轨迹数据文件的存储地址与数据存储服务器建立链接,然后统一使用Java I/O流将数据集写入到数据存储服务器中文件系统中。
步骤2:读取步骤1中的轨迹数据文件,判断文件是否合法,带有经纬度和时间信息轨迹数据文件为合法文件,所述合法文件进入步骤3;所述轨迹数据文件为非合法文件时,系统提示用户文件非法并返回步骤1;
步骤3:对步骤2中检测合法的轨迹数据文件进行预处理,所述预处理包括删除数据文件中与时空密度分析无关的属性信息、获得带时间标签和经纬度位置信息的目标轨迹数据;
步骤4:提示用户输入半径阈值R,通过时空密度计算模块在用户指定的半径R内寻找各个目标轨迹点的邻居,并利用所述目标轨迹点邻居的经纬度和时间信息,计算该目标轨迹点邻域半径R范围内的移动指标、空间影响因子和停留时间,最后根据所述移动指标、空间影响因子和停留时间三个特征值,确定各轨迹点的时空密度;
步骤5:通过时空分布密度可视化模块获取当前处理轨迹点对应的经纬度信息,绘制成移动对象的轨迹散点图;通过时空密度计算模块计算得到的各个轨迹点的时空密度值,绘制轨迹点的时空密度曲线;将所述轨迹散点图和时空密度曲线在同一个图形用户界面中展示;
步骤6:通过结果提取模块,获取用户需求:
当用户需求为停止点提取时,进入结果提取中的停止点提取单元,执行步骤7;当用户需求为位置检测时,则进入结果提取中的位置检测单元,执行步骤8;当用户需求为噪声点发现和剔除时,则进入结果提取中的噪声点发现和剔除单元,执行步骤9;
步骤7:读取密度曲线中各个波峰位置和时间信息作为停止点的候选点,读取波峰相邻的左右两个波谷的时间信息;
左右波谷的时间差满足轨迹中的最短停留时间限制,则该波峰位置对应的停止点候选点被视为一个真正的停止点,并保存该停止点的位置和时间信息;否则该波峰对应的停止点候选点不能被视为真正的停止点被舍弃;
步骤8:提示用户输入最小密度阈值MDe,将密度曲线中满足MDe约束的点对应的位置和时间信息提取出来并保存;
步骤9:选择密度曲线中,时空密度值与其周围一定范围内点的时空密度值存在显著差异的轨迹点,读取该轨迹点的位置和时间信息,询问用户是否要对该点的数据进行进行删除,并执行相应操作;
步骤10:根据用户提取到的停止点信息和位置信息在地图软件中进行标注。
本发明与现有技术相比具有以下有益效果:
本发明充分分析了各种轨迹数据的时空分布特性,利用轨迹点移动指标反映移动对象运动轨迹中停留区域轨迹点分布的无规律性和轨迹段的不平整性;利用轨迹点的邻居对其产生的影响大小,即空间影响因子,来衡量数据分布的集中程度;利用轨迹点的停留时间来弥补由于特殊原因,如设备故障、环境影响、人为操作失误等原因,产生的长时间间隙空间在空间密度分布的不足,提高特殊提留被发现的概率,并综合上述特性来考察轨迹点的时空密度分布,最后将密度分析结果利用可视化的方式呈现给用户,相对于传统密度分析任务来说本发明能够服务于更加广泛的应用,计算过程和结果的呈现更加直观,且不需要用户提前对数据进行过多的预处理,系统的操作更加简单。同时相对于传统单一利用特定范围内数据点的数量来度量数据点的密度以及将时间和空间分开考察发现不了某些特殊停留的方法,本发明中的轨迹数据的时空密度度量方法的精度更高。
附图说明
下面结合附图对本发明做进一步的说明。
图1为轨迹点Pi的R邻域范围内的邻接轨迹段;
图2为本发明的结构示意图;
图3为本发明的总体流程图。
具体实施方式
下面结合具体实施例对本发明做进一步的详细说明,但是本发明的保护范围并不限于这些实施例,凡是不背离本发明构思的改变或等同替代均包括在本发明的保护范围之内。
一种轨迹数据时空密度分析系统,包括轨迹数据预处理模块、时空密度计算模块、时空分布密度可视化模块、结果提取模块;时空密度分析模块利用轨迹数据预处理模块得到的目标轨迹数据计算得到各个轨迹点的密度,并利用时空分布密度可视化模块将目标轨迹的经纬度信息以及轨迹点的时空密度值分别绘制成轨迹散点图和时空密度曲线呈现给用户,然后在结果提取模块针对用户感兴趣的密度分析结果进行提取和保存,最后根据提取结果的经纬度和时间信息在地图上相应位置进行标注;
所述数据预处理模块,用于上传轨迹数据并检测数据的合法性,使用合法的数据构造相关的带位置和时间信息的目标数据文件;
所述轨迹数据预处理模块包括轨迹数据上传单元和数据合法性检测单元。所述轨迹数据上传单元,设定用户通过web上传和读取本地文件的方式获取轨迹数据。所述数据合法性检测单元,用于检测用户上传的轨迹数据文件是否带有与经纬度坐标和时间相关的数据信息。
所述时空密度计算模块,通过与用户交互,获取用户感兴趣的移动对象停留位置的规模,提示用户输入邻域半径R,通过邻域半径R确定各个轨迹点的邻居,并利用轨迹点邻居的位置和时间信息,获得该轨迹点邻域半径范围内的移动指标、空间影响因子以及停留时间,进而最终获得各轨迹点的时空密度;
所述时空分布密度可视化模块,用于将预处理得到的目标数据的经纬度位置信息,以及时空密度计算模块得到的各个轨迹点的时空密度值,分别绘制成轨迹散点图和时空密度曲线呈现给用户;
所述时空分布密度可视化模块能够根据提取结果,在地图软件上实现访问时间信息在相应地理位置上的标注,从而方便用户分析移动对象的语义特征。
所述结果提取模块包括停止点提取、位置检测、噪声发现和剔除三个单元,系统通过用户交互的方式,实现停止点提取、位置检测、噪声发现和剔除;所述结果提取模块还包含了具有GPS定位功能的地图软件,根据提取的结果在地图上进行匹配和标注。该模块的设置,保证本系统能够根据密度分析结果完成多种轨迹数据分析任务:
所述停止点提取单元,提取时空密度曲线中的各个时间跨度满足停留的最短持续时间限制的各个波峰的经纬度和时间信息,并保存。
所述位置检测单元,提示用户输入最小的密度阈值,并将时空密度曲线中满足该最小密度阈值约束的轨迹点的经纬度和时间信息,提取出来,并保存。
所述噪声发现和剔除单元,用于时空密度曲线中,将密度值与其周围小范围内的轨迹点的密度值存在显著差异的轨迹点,进行标记,并按照用户需求从目标数据中剔除。
如图1所示,本发明涉及的轨迹数据时空密度分析系统,为用户提供了:带时间标签和经纬度位置信息的轨迹数据时空密度分析功能,利用用户上传的轨迹数据和用户指定的半径阈值R,进行轨迹点的时空密度计算,并将该计算结果利用图形用户界面直观的呈现给用户,利用时空密度曲线的分析结果,本发明还具备实现停止点提取、位置检测、噪声发现和剔除、移动轨迹的语义标注等功能,系统能够通过获取用户需求相应的完成上述任务。
本发明提出的系统的核心思想是通过分析轨迹点的时空分布特性计算轨迹点的时空密度,从而获得轨迹的时空密度曲线,利用轨迹的时空密度曲线来开展多种研究,让密度分析的结果能够服务于除聚类以外的更加广泛的应用。
本发明提出系统中时空密度分析模块充分考虑了各种移动轨迹的运动特征,综合利用了轨迹点的邻域范围内的移动指标、空间影响因子、停留时间来度量轨迹点的时空分布密度,能够更加真实的反映轨迹点的时空密度分布情况。
一种所述轨迹数据时空密度分析系统的分析方法,包括以下步骤:
步骤1:通过轨迹数据预处理模块中的数据上传单元实现轨迹数据上传,包括Web上传方式和本地上传方式;
所述Web上传方式采集数据时,通过监听Web客户端的数据上传请求建立客户端与数据存储服务器的链接。所述本地上传方式,通过用户指定的本地轨迹数据文件的存储地址与数据存储服务器建立链接,然后统一使用Java I/O流将数据集写入到数据存储服务器中文件系统中。
步骤2:读取步骤1中的轨迹数据文件,判断文件是否合法,带有经纬度和时间信息轨迹数据文件为合法文件,所述合法文件进入步骤3;所述轨迹数据文件为非合法文件时,系统提示用户文件非法并返回步骤1;
步骤3:对步骤2中检测合法的轨迹数据文件进行预处理,所述预处理包括删除数据文件中与时空密度分析无关的属性信息、获得带时间标签和经纬度位置信息的目标轨迹数据;
步骤4:提示用户输入半径阈值R,通过时空密度计算模块在用户指定的半径R内寻找各个目标轨迹点的邻居,并利用所述目标轨迹点邻居的经纬度和时间信息,计算该目标轨迹点邻域半径R范围内的移动指标、空间影响因子和停留时间,最后根据所述移动指标、空间影响因子和停留时间三个特征值,确定各轨迹点的时空密度;
步骤5:通过时空分布密度可视化模块获取当前处理轨迹点对应的经纬度信息,绘制成移动对象的轨迹散点图;通过时空密度计算模块计算得到的各个轨迹点的时空密度值,绘制轨迹点的时空密度曲线;将所述轨迹散点图和时空密度曲线在同一个图形用户界面中展示,方便用户进行对比分析;
步骤6:通过结果提取模块,获取用户需求:
当用户需求为停止点提取时,进入结果提取中的停止点提取单元,执行步骤7;当用户需求为位置检测时,则进入结果提取中的位置检测单元,执行步骤8;当用户需求为噪声点发现和剔除时,则进入结果提取中的噪声点发现和剔除单元,执行步骤9;
步骤7:读取密度曲线中各个波峰位置和时间信息作为停止点的候选点,读取波峰相邻的左右两个波谷的时间信息;
左右波谷的时间差满足轨迹中的最短停留时间限制,则该波峰位置对应的停止点候选点被视为一个真正的停止点,并保存该停止点的位置和时间信息;否则该波峰对应的停止点候选点不能被视为真正的停止点被舍弃;
步骤8:提示用户输入最小密度阈值MDe,将密度曲线中满足MDe约束的点对应的位置和时间信息提取出来并保存;
步骤9:选择密度曲线中,时空密度值与其周围一定范围内点的时空密度值存在显著差异的轨迹点,读取该轨迹点的位置和时间信息,询问用户是否要对该点的数据进行进行删除,并执行相应操作;
步骤10:根据用户提取到的停止点信息和位置信息在地图软件中进行标注,方便用户直观获得移动对象轨迹数据的语义特征。
实施例1
实际使用中,使用本发明系统进行分析,主要包含以下步骤:
步骤1:读取用户上传的轨迹数据;
步骤2: 判断数据的合法性,即检测数据中是否为含有经纬度坐标和时间信息,检测不合适提示用户重传,否则继续执行步骤3;
步骤3:删除合法轨迹数据中与时空密度计算不相关的属性信息,仅仅保留轨迹点的经纬度和时间信息;数据预处理后得到的目标轨迹数据如表1所示;
表1:目标轨迹数据格式示例
Point | Latitude | Longitude | Time |
1 | 39.984071 | 116.320147 | 2008-10-23, 06:59:39 |
2 | 39.98414 | 116.320122 | 2008-10-23, 06:59:44 |
3 | 39.984167 | 116.320114 | 2008-10-23,06:59:49 |
步骤4:提示用户输入半径R,半径R的范围与实际采集设备的定位精度相关,定位设备的定位精度一般在30-50m左右,系统提示用户输入R值的同时提示建议输入的R值的范围,并对R值的合法性进行检测,合法则可以计算轨迹点的时空密度,否则提示用户重新输入合法的R值。
步骤5:利用用户输入的合法的R值计算各个轨迹点的时空分布密度。具体计算过程为:
步骤5.1:计算轨迹点Pi与其余各轨迹点距离,找到Pi的R半径范围内的所有轨迹点,存入的Pi邻居表中;
步骤5.2:对于Pi邻居表中所有邻居点,依次连接采样时间连续的邻居点得到Pi半径R范围内的多条邻接轨迹段,如图3所示;
步骤5.3:分别计算各条轨迹段的位移(Pdis)和路程(Tdis)的比值,对于点Pi的R邻域存在多条邻接轨迹段的情况(如图3所示),该点的移动指标MST为邻接轨迹段Pdis和Tdis的比值最小值的;具体计算公式如公式(1);
公式(1)中,m为点Pi的R邻域内的邻接轨迹段的数目,如果某个邻接轨迹段的位移Pdis和路程Tdis的比值越接近1,说明该邻接轨迹段的运动路径越平整,该邻接轨迹段越接近直线;反之则运动路径越曲折,移动对象的运动越没有规律性。因此,移动指标MST可以用来区分轨迹中的停留和移动部分。
步骤5.4:计算轨迹点Pi与各邻居点的距离与半径R的比值,并将Pi与所有邻居点上述计算结果累加,得到Pi的R邻域范围内的空间影响因子SI,具体计算公式如公式(2);
公式(2)中,Pjϵ(Pi,R)表示点Pj为点Pi的R邻域范围内的邻居,n为Pi的R邻域内的邻居点的数量。如果Pi的R邻域内的空间影响因子值越小则说明轨迹点在Pi的R邻域范围内分布越集中,反之则越稀疏。
步骤5.4:计算Pi的所有邻居点Pj与Pj后继点的时间差值,判断该时间差是否远大于数据采样频率的众数,如果大于则表明在该区域存在长时间间隙,则增加该区域停留时间的权重,否则该区域的停留时间权重为1,则带权重的停留时间WST的计算公式如公式
公式(3)中SamplingRates为所有时间点采样频率的众数,一般情况下采样间隔为1—5s,T.Pj表示点Pj对应的采样时间,且T.Pj<T.Pj+1。
步骤5.5:综合移动指标MST、空间影响因子SI、带权停留时间WST计算轨迹点时空分布的密度STD,STD的计算方法如公式(4);
公式(4)中,MST和SI与时空密度函数成反比例关系,即Pi的R邻域范围内的邻接轨迹段越曲折,轨迹点分布越集中,移动对象在Pi的R邻域范围内停留的时间越长,Pi为某个特定地理位置的可能性越大。
步骤6:利用预处理得到的目标数据的经纬度信息绘制移动对象的轨迹散点图;利用轨迹点的时空密度值绘制时空密度曲线,并将上述两图像以可视化的方式呈现给用户;
步骤7:获取用户需求,如果用户需求为停止点提取,则进入结果提取中的停止点提取单元,执行步骤8;如果用户需求为位置检测,则进入结果提取中的位置检测单元,执行步骤9;如果用户需求为噪声点发现和剔除,则进入结果提取中的噪声点发现和剔除单元,执行步骤10;
步骤8:读取密度曲线中各个波峰的经纬度和时间信息作为停止点的候选点,读取波峰相邻的左右两个波谷的时间信息,如果该左右波谷的时间差满足轨迹中的最短停留时间限制Min-Duration(MDu)(MDu控制轨迹中停留的规模,一般情况下只有当移动对象在某个区域的停留时间超过MDu的限制时,这个区域才可能表示某一特定的地理位置),则该波峰对应的停止点候选点可以被视为一个真正的停止点,并保存该停止点的经纬度和时间信息,否则该波峰对应的停止点候选点不能被视为真正的停止点被舍弃;
步骤9:提示用户输入最小时空密度阈值MDe,如果某个轨迹点的时空密度值大于MDe,则认为移动对象在该轨迹点对应的时间下可能正在某一位置开展某种活动,将密度曲线中满足MDe约束的点对应的经纬度和时间信息提取出来并保存;
步骤10:读取密度曲线中时空密度值与其周围小范围内轨迹点的时空密度值存在显著差异的轨迹点的经纬度和时间信息,这些与周围点存在显著差异的轨迹点很有可能就是轨迹中的噪声点,询问用户是否要对该点的数据信息进行进行删除并执行相应操作;
步骤11:通过上述提取到的停止点和位置信息的经纬度坐标定位到地图软件中相应地理位置,并在地图软件中的相应位置标注上对应的访问时间,方便用户直观获得移动对象轨迹数据的语义特征,即移动对象在时间点T1从位置PO1出发,运动T2时间到达位置PO2,在PO2位置的一定范围内停留T3时间后离开位置PO2,并在T4时间点到达位置PO3。
本发明系统涉及的方法通过上述处理后能够更加准确的描述轨迹点的时空密度分布,并可以进一步通过时空密度曲线分析获得更多的有价值的信息,从而实现更多的诸如停止点提取,位置检测,噪声发现和剔除,移动轨迹的语义分析等任务。
本发明不会限制于本文所示的实施例,而是要符合与本文所公开的原理和新颖性特点相一致的最宽范围。
Claims (10)
1.一种轨迹数据时空密度分析系统,其特征在于,包括轨迹数据预处理模块、时空密度计算模块、时空分布密度可视化模块、结果提取模块;
所述数据预处理模块,用于上传轨迹数据并检测数据的合法性,使用合法的数据构造相关的带位置和时间信息的目标数据文件;
所述时空密度计算模块,通过与用户交互,获取用户感兴趣的移动对象停留位置的规模,并利用轨迹点邻居的位置和时间信息,获得该轨迹点邻域半径范围内的移动指标、空间影响因子以及停留时间,进而最终获得各轨迹点的时空密度;
提示用户输入半径R,利用用户输入的合法的R值计算各个轨迹点的时空分布密度,具体计算过程为:
计算轨迹点Pi与其余各轨迹点距离,找到Pi的R半径范围内的所有轨迹点,存入的Pi邻居表中;
对于Pi邻居表中所有邻居点,依次连接采样时间连续的邻居点得到Pi半径R范围内的多条邻接轨迹段;
分别计算各条轨迹段的位移(Pdis)和路程(Tdis)的比值,对于点Pi的R邻域存在多条邻接轨迹段的情况,该点的移动指标MST为邻接轨迹段Pdis和Tdis的比值最小值的;具体计算公式如公式(1);
公式(1)中,m为点Pi的R邻域内的邻接轨迹段的数目,如果某个邻接轨迹段的位移Pdis和路程Tdis的比值越接近1,说明该邻接轨迹段的运动路径越平整,该邻接轨迹段越接近直线;反之则运动路径越曲折,移动对象的运动越没有规律性;
计算轨迹点Pi与各邻居点的距离与半径R的比值,并将Pi与所有邻居点上述计算结果累加,得到Pi的R邻域范围内的空间影响因子SI,具体计算公式如公式(2);
公式(2)中,Pj∈(Pi,R)表示点Pj为点Pi的R邻域范围内的邻居,n为Pi的R邻域内的邻居点的数量;
计算Pi的所有邻居点Pj与Pj后继点的时间差值,判断该时间差是否远大于数据采样频率的众数,如果大于则表明在该区域存在长时间间隙,则增加该区域停留时间的权重,否则该区域的停留时间权重为1,则带权重的停留时间WST的计算公式如公式:
公式(3)中SamplingRates为所有时间点采样频率的众数,一般情况下采样间隔为1—5s,T.Pj表示点Pj对应的采样时间,且T.Pj<T.Pj+1;
综合移动指标MST、空间影响因子SI、带权停留时间WST计算轨迹点时空分布的密度STD,STD的计算方法如公式(4);
公式(4)中,MST和SI与时空密度函数成反比例关系,即Pi的R邻域范围内的邻接轨迹段越曲折,轨迹点分布越集中,移动对象在Pi的R邻域范围内停留的时间越长,Pi为某个特定地理位置的可能性越大;
所述时空分布密度可视化模块,用于将预处理得到的目标数据的经纬度位置信息,以及时空密度计算模块得到的各个轨迹点的时空密度值,分别绘制成轨迹散点图和时空密度曲线呈现给用户;
所述结果提取模块包括停止点提取、位置检测、噪声发现和剔除三个单元,系统通过用户交互的方式,实现停止点提取、位置检测、噪声发现和剔除;所述结果提取模块还包含了具有GPS定位功能的地图软件,根据提取的结果在地图上进行匹配和标注。
2.根据权利要求1所述的一种轨迹数据时空密度分析系统,其特征在于,所述轨迹数据预处理模块包括轨迹数据上传单元和数据合法性检测单元。
3.根据权利要求2所述的一种轨迹数据时空密度分析系统,其特征在于,所述轨迹数据上传单元,设定用户通过web上传和读取本地文件的方式获取轨迹数据。
4.根据权利要求2所述的一种轨迹数据时空密度分析系统,其特征在于,所述数据合法性检测单元,用于检测用户上传的轨迹数据文件是否带有与经纬度坐标和时间相关的数据信息。
5.根据权利要求1所述的一种轨迹数据时空密度分析系统,其特征在于,所述停止点提取单元,提取时空密度曲线中的各个时间跨度满足停留的最短持续时间限制的各个波峰的经纬度和时间信息,并保存。
6.根据权利要求1所述的一种轨迹数据时空密度分析系统,其特征在于,所述位置检测单元,提示用户输入最小的密度阈值,并将时空密度曲线中满足该最小密度阈值约束的轨迹点的经纬度和时间信息,提取出来,并保存。
7.根据权利要求1所述的一种轨迹数据时空密度分析系统,其特征在于,所述噪声发现和剔除单元,用于时空密度曲线中,将密度值与其周围小范围内的轨迹点的密度值存在显著差异的轨迹点,进行标记,并按照用户需求从目标数据中剔除。
8.一种轨迹数据时空密度分析系统的分析方法,其特征在于,包括以下步骤:
步骤1:通过轨迹数据预处理模块中的数据上传单元实现轨迹数据上传,包括Web上传方式和本地上传方式;
步骤2:读取步骤1中的轨迹数据文件,判断文件是否合法,带有经纬度和时间信息轨迹数据文件为合法文件,所述合法文件进入步骤3;所述轨迹数据文件为非合法文件时,系统提示用户文件非法并返回步骤1;
步骤3:对步骤2中检测合法的轨迹数据文件进行预处理,所述预处理包括删除数据文件中与时空密度分析无关的属性信息、获得带时间标签和经纬度位置信息的目标轨迹数据;
步骤4:提示用户输入半径阈值R,通过时空密度计算模块在用户指定的半径R内寻找各个目标轨迹点的邻居,并利用所述目标轨迹点邻居的经纬度和时间信息,计算该目标轨迹点邻域半径R范围内的移动指标、空间影响因子和停留时间,最后根据所述移动指标、空间影响因子和停留时间三个特征值,确定各目标轨迹点的时空密度;
提示用户输入半径R,利用用户输入的合法的R值计算各个轨迹点的时空分布密度,具体计算过程为:
计算轨迹点Pi与其余各轨迹点距离,找到Pi的R半径范围内的所有轨迹点,存入的Pi邻居表中;
对于Pi邻居表中所有邻居点,依次连接采样时间连续的邻居点得到Pi半径R范围内的多条邻接轨迹段;
分别计算各条轨迹段的位移(Pdis)和路程(Tdis)的比值,对于点Pi的R邻域存在多条邻接轨迹段的情况,该点的移动指标MST为邻接轨迹段Pdis和Tdis的比值最小值的;具体计算公式如公式(1);
公式(1)中,m为点Pi的R邻域内的邻接轨迹段的数目,如果某个邻接轨迹段的位移Pdis和路程Tdis的比值越接近1,说明该邻接轨迹段的运动路径越平整,该邻接轨迹段越接近直线;反之则运动路径越曲折,移动对象的运动越没有规律性;
计算轨迹点Pi与各邻居点的距离与半径R的比值,并将Pi与所有邻居点上述计算结果累加,得到Pi的R邻域范围内的空间影响因子SI,具体计算公式如公式(2);
公式(2)中,Pj∈(Pi,R)表示点Pj为点Pi的R邻域范围内的邻居,n为Pi的R邻域内的邻居点的数量;
计算Pi的所有邻居点Pj与Pj后继点的时间差值,判断该时间差是否远大于数据采样频率的众数,如果大于则表明在该区域存在长时间间隙,则增加该区域停留时间的权重,否则该区域的停留时间权重为1,则带权重的停留时间WST的计算公式如公式:
公式(3)中SamplingRates为所有时间点采样频率的众数,一般情况下采样间隔为1—5s,T.Pj表示点Pj对应的采样时间,且T.Pj<T.Pj+1;
综合移动指标MST、空间影响因子SI、带权停留时间WST计算轨迹点时空分布的密度STD,STD的计算方法如公式(4);
公式(4)中,MST和SI与时空密度函数成反比例关系,即Pi的R邻域范围内的邻接轨迹段越曲折,轨迹点分布越集中,移动对象在Pi的R邻域范围内停留的时间越长,Pi为某个特定地理位置的可能性越大;
步骤5:通过时空分布密度可视化模块获取当前处理轨迹数据对应的经纬度信息,绘制成移动对象的轨迹散点图;通过时空密度计算模块计算得到的各个轨迹点的时空密度值,绘制轨迹点的时空密度曲线;将所述轨迹散点图和时空密度曲线在同一个图形用户界面中展示;
步骤6:通过结果提取模块,获取用户需求:
当用户需求为停止点提取时,进入结果提取中的停止点提取单元,执行步骤7;当用户需求为位置检测时,则进入结果提取中的位置检测单元,执行步骤8;当用户需求为噪声点发现和剔除时,则进入结果提取中的噪声点发现和剔除单元,执行步骤9;
步骤7:读取密度曲线中各个波峰位置和时间信息作为停止点的候选点,读取波峰相邻的左右两个波谷的时间信息;
左右波谷的时间差满足轨迹中的最短停留时间限制,则该波峰位置对应的停止点候选点被视为一个真正的停止点,并保存该停止点的位置和时间信息;否则该波峰对应的停止点候选点不能被视为真正的停止点被舍弃;
步骤8:提示用户输入最小密度阈值Min-Density(MDe),将密度曲线中满足最小密度阈值Min-Density(MDe)约束的点对应的位置和时间信息提取出来并保存;
步骤9:选择密度曲线中,时空密度值与其周围一定范围内点的时空密度值存在显著差异的轨迹点,读取该轨迹点的位置和时间信息,询问用户是否要对该点的数据进行删除,并执行相应操作;
步骤10:根据用户提取到的停止点信息和位置信息在地图软件中进行标注。
9.根据权利要求8所述的一种轨迹数据时空密度分析系统的分析方法,其特征在于,所述Web上传方式采集数据时,通过监听Web客户端的数据上传请求建立客户端与数据存储服务器的链接。
10.根据权利要求8所述的一种轨迹数据时空密度分析系统的分析方法,其特征在于,所述本地上传方式,通过用户指定的本地轨迹数据文件的存储地址与数据存储服务器建立链接,然后统一使用Java I/O流将数据集写入到数据存储服务器中文件系统中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811639046.2A CN109684384B (zh) | 2018-12-29 | 2018-12-29 | 一种轨迹数据时空密度分析系统及其分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811639046.2A CN109684384B (zh) | 2018-12-29 | 2018-12-29 | 一种轨迹数据时空密度分析系统及其分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109684384A CN109684384A (zh) | 2019-04-26 |
CN109684384B true CN109684384B (zh) | 2023-03-28 |
Family
ID=66190274
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811639046.2A Active CN109684384B (zh) | 2018-12-29 | 2018-12-29 | 一种轨迹数据时空密度分析系统及其分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109684384B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111721312B (zh) * | 2019-05-28 | 2022-05-06 | 腾讯科技(深圳)有限公司 | 一种运行轨迹生成方法和装置 |
CN110334659B (zh) * | 2019-07-08 | 2022-05-10 | 太原科技大学 | 一种基于二分类的双峰发射线数据搜寻方法 |
CN110443287B (zh) * | 2019-07-19 | 2022-01-14 | 北京航空航天大学 | 一种基于稀疏轨迹数据的人群移动流绘制方法 |
CN111275791B (zh) * | 2020-01-20 | 2022-12-30 | 中国电子科技集团公司第十四研究所 | 一种多约束条件下的轨迹线热力图生成方法 |
CN111461766A (zh) * | 2020-03-16 | 2020-07-28 | 佛山青藤信息科技有限公司 | 客户价值评估方法、系统、计算机设备、可读存储介质 |
CN112231389B (zh) * | 2020-10-16 | 2021-08-24 | 中国民用航空华东地区空中交通管理局 | 基于航迹的可视化冲突模型构建方法、装置、电子设备及存储介质 |
CN113486927B (zh) * | 2021-06-15 | 2024-03-01 | 北京大学 | 一种基于先验概率的无监督轨迹访问地点标注方法 |
CN113589338A (zh) * | 2021-07-29 | 2021-11-02 | 成都乐动信息技术有限公司 | 检测用户在运动过程中的停留点的方法、装置及电子设备 |
CN113641773A (zh) * | 2021-08-13 | 2021-11-12 | 中国农业大学 | 一种针对行驶轨迹的农机行为可视化标注方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106600960B (zh) * | 2016-12-22 | 2020-01-24 | 西南交通大学 | 基于时空聚类分析算法的交通出行起讫点识别方法 |
CN106960006B (zh) * | 2017-02-24 | 2020-05-05 | 河海大学 | 一种不同轨迹间相似度度量系统及其度量方法 |
CN107392245A (zh) * | 2017-07-19 | 2017-11-24 | 南京信息工程大学 | 一种出租车载客轨迹聚类算法Tr‑OPTICS |
CN108256560B (zh) * | 2017-12-27 | 2021-05-04 | 同济大学 | 一种基于时空聚类的停驻识别方法 |
CN108920481B (zh) * | 2018-04-20 | 2020-11-27 | 中国地质大学(武汉) | 一种基于手机定位数据的道路网重建方法及系统 |
-
2018
- 2018-12-29 CN CN201811639046.2A patent/CN109684384B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN109684384A (zh) | 2019-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109684384B (zh) | 一种轨迹数据时空密度分析系统及其分析方法 | |
Hasnat et al. | Identifying tourists and analyzing spatial patterns of their destinations from location-based social media data | |
CN106462627B (zh) | 根据多个位置数据报告分析语义地点和相关数据 | |
CN106600960B (zh) | 基于时空聚类分析算法的交通出行起讫点识别方法 | |
US9547866B2 (en) | Methods and apparatus to estimate demography based on aerial images | |
Wu et al. | A voxel-based method for automated identification and morphological parameters estimation of individual street trees from mobile laser scanning data | |
CN110738856B (zh) | 一种基于移动聚类的城市交通拥堵精细识别方法 | |
Huang et al. | Grab-posisi: An extensive real-life gps trajectory dataset in southeast asia | |
CN111212383B (zh) | 区域常住人口数量的确定方法、装置、服务器和介质 | |
CN108566620B (zh) | 一种基于wifi的室内定位方法 | |
US11781976B2 (en) | Methane peak detection | |
US10104494B2 (en) | Marker based activity transition models | |
JP2017102672A (ja) | 地理位置情報特定システム及び地理位置情報特定方法 | |
Ghorpade et al. | An integrated stop-mode detection algorithm for real world smartphone-based travel survey | |
Chatzidiakou et al. | Automated classification of time-activity-location patterns for improved estimation of personal exposure to air pollution | |
CN113821702A (zh) | 一种城市多维空间多元异构信息数据处理方法 | |
CN110636248A (zh) | 目标跟踪方法与装置 | |
Al-Suleiman et al. | Assessment of the effect of alligator cracking on pavement condition using WSN-image processing | |
Hendawi et al. | Noise patterns in GPS trajectories | |
CN112015937B (zh) | 一种图片地理定位方法及系统 | |
Lyu et al. | Movement-aware map construction | |
US20210200237A1 (en) | Feature coverage analysis | |
Karagiorgou et al. | Geosemantic network-of-interest construction using social media data | |
CN115187884A (zh) | 一种高空抛物识别方法、装置、电子设备及存储介质 | |
Bridgelall et al. | Detecting sources of ride roughness by ensemble-connected vehicle signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |