CN114492590A - 一种基于轨迹聚类的边境通道生成方法及装置 - Google Patents
一种基于轨迹聚类的边境通道生成方法及装置 Download PDFInfo
- Publication number
- CN114492590A CN114492590A CN202111640835.XA CN202111640835A CN114492590A CN 114492590 A CN114492590 A CN 114492590A CN 202111640835 A CN202111640835 A CN 202111640835A CN 114492590 A CN114492590 A CN 114492590A
- Authority
- CN
- China
- Prior art keywords
- track
- data
- target
- candidate
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Remote Sensing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开涉及一种基于轨迹聚类的边境通道生成方法及装置,其中,方法包括:获取目标用户的历史轨迹数据和边境线经纬度数据,对历史轨迹数据进行预处理,得到候选轨迹数据,基于候选轨迹数据和边境线经纬度数据进行计算,得到目标轨迹数据,对目标轨迹数据进行聚类处理,得到候选轨迹簇,基于预设策略对候选轨迹簇进行筛选,得到目标轨迹簇,提取目标轨迹簇的中心线,按照预设格式将中心线的位置信息进行存储,通过目标用户的历史轨迹数据及边境线经纬度数据进行处理分析,可以监控到目标人员的轨迹信息、异常行为模式中的跨境行为,为人物监控、边境区域管控等领域提供了保障。
Description
技术领域
本公开涉及数据处理技术领域,尤其涉及一种基于轨迹聚类的边境通道生成方法及装置。
背景技术
通常,边境可以理解为邻近边界、国界的区域范围,非法越境行为通常会产生恶劣后果。
因此,如何获取边境区域的通道路线成为需要解决的技术问题。
发明内容
为了解决上述技术问题,本公开提供了一种基于轨迹聚类的边境通道生成方法及装置。
第一方面,本公开实施例提供了一种基于轨迹聚类的边境通道生成方法,包括:
获取目标用户的历史轨迹数据和边境线经纬度数据;
对历史轨迹数据进行预处理,得到候选轨迹数据;
基于候选轨迹数据和边境线经纬度数据进行计算,得到目标轨迹数据;
对目标轨迹数据进行聚类处理,得到候选轨迹簇;
基于预设策略对候选轨迹簇进行筛选,得到目标轨迹簇;
提取目标轨迹簇的中心线,按照预设格式将中心线的位置信息进行存储。
第二方面,本公开实施例提供了一种基于轨迹聚类的边境通道生成装置,包括:
第一获取模块,用于获取目标用户的历史轨迹数据和边境线经纬度数据;
第一处理模块,用于对历史轨迹数据进行预处理,得到候选轨迹数据;
计算模块,用于基于候选轨迹数据和边境线经纬度数据进行计算,得到目标轨迹数据;
第二处理模块,用于对目标轨迹数据进行聚类处理,得到候选轨迹簇;
筛选模块,用于基于预设策略对候选轨迹簇进行筛选,得到目标轨迹簇;
提取模块,用于提取目标轨迹簇的中心线,按照预设格式将中心线的位置信息进行存储。
本公开实施例提供的技术方案与现有技术相比具有如下优点:
在本公开实施例中,获取目标用户的历史轨迹数据和边境线经纬度数据,对历史轨迹数据进行预处理,得到候选轨迹数据,基于候选轨迹数据和边境线经纬度数据进行计算,得到目标轨迹数据,对目标轨迹数据进行聚类处理,得到候选轨迹簇,基于预设策略对候选轨迹簇进行筛选,得到目标轨迹簇,提取目标轨迹簇的中心线,按照预设格式将中心线的位置信息进行存储,通过目标用户的历史轨迹数据及边境线经纬度数据进行处理分析,可以监控到目标人员异常行为模式中的跨境行为,为人物监控、边境区域管控等领域提供了保障。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的一种基于轨迹聚类的边境通道生成方法流程示意图;
图2为本公开实施例提供的一种对历史轨迹数据进程预处理的方法流程示意图;
图3为本公开实施例提供的另一种基于轨迹聚类的边境通道生成方法流程示意图;
图4为本公开实施例提供的一种对目标轨迹数据进行聚类处理的方法流程示意图;
图5为本公开实施例提供的一种基于轨迹聚类的边境通道生成方法的总流程示意图;
图6为本公开提供的一种基于轨迹聚类的边境通道生成装置结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
图1为本公开实施例提供的一种基于轨迹聚类的边境通道生成方法流程示意图,包括:
步骤101、获取目标用户的历史轨迹数据和边境线经纬度数据。
其中,目标用户的选择可以根据应用场景需要选择设置,比如具有跨越边境历史的用户作为目标用户,以及不同的目标用户可以通过用户标识表示,即通过用户标识表示唯一标识目标用户;历史轨迹数据指的是在历史时间段内各个时间点对应的目标用户移动的轨迹点集合;边境线经纬度数据指的划分一个区域范围与另一个区域范围的线条对应的经纬度。
在本公开实施例中,获取目标用户的历史轨迹数据的方式有很多种,比如通过目标用户携带具有GPS(Global Positioning System,全球定位系统)定位功能的设备记录的历史时间段内的轨迹数据作为目标用户的历史轨迹数据、再比如目标用户手机号码联网移动位置作为目标用户的历史轨迹数据;在本公开另一实施例中,获取边境线经纬度数据的方式有很多种,比如通过GIS(Geographic Information System,地理信息系统)地理信息处理软件,如QGIS(Quantum GIS,桌面地理信息系统)、ArcGIS等提取边境线对应的经纬度作为边境线经纬度数据。
以上对获取目标用户的历史轨迹数据和边境线经纬度数据的方式仅为示例,本公开不对获取目标用户的历史轨迹数据和边境线经纬度数据的具体方式进行限定。
步骤102、对历史轨迹数据进行预处理,得到候选轨迹数据。
在本公开实施例中,为了进一步提高数据的准确性、完整性和一致性,需要对获取的历史轨迹数据进行预处理,在一个实施例方式中,将历史轨迹数据进行序列化即按照时间顺序进行排序,得到目标用户对应的轨迹序列,然后对该轨迹序列中经纬度为零值或空值的异常值进程去除处理,得到候选轨迹数据;在另一个实施方式中,将历史轨迹数据进行序列化即按照时间顺序进行排序,得到目标用户对应的一系列的轨迹点,然后将目标用户在预设时间间隔内与前一个相邻轨迹点距离小于预设距离阈值的轨迹点进行去除处理,得到候选轨迹数据。
作为一种示例,如图2所示,首先将历史轨迹数据进行序列化即按照时间顺序进行排序,得到目标用户对应的轨迹序列,然后对该轨迹序列中经纬度为零值或空值的异常值进行去除处理,重复轨迹点进行去重处理,通过筛选得到候选轨迹数据。
以上对历史轨迹数据进行预处理,得到候选轨迹数据的两种方式仅为示例,本公开不对历史轨迹数据进行预处理得到候选轨迹数据的具体方式进行限定。
需要说明的是,轨迹序列由一系列的轨迹点组成,每个轨迹点包括用户标识、经度、纬度和时间。
步骤103、基于候选轨迹数据和边境线经纬度数据进行计算,得到目标轨迹数据。
在本公开实施例中,目标轨迹数据的获取方式是通过候选轨迹数据和边境线经纬度数据进行计算的,具体地,将候选轨迹数据和边境线经纬度数据通过经纬度大圆距离进行计算,得到大圆距离,并采用统计学方法对候选轨迹数据进行直方图统计,获取候选轨迹数据中每个轨迹点对应的权值,从候选轨迹数据中获取的大圆距离小于等于预设距离阈值并且每个轨迹点对应的权值大于等于预设权值阈值的轨迹点作为目标轨迹数据,进一步提高后续中心点获取的精确性。
步骤104、对目标轨迹数据进行聚类处理,得到候选轨迹簇。
其中,聚类处理指的是运用形态学算子将临近的类似分类区域聚类并合并,具体地,聚类算法可以根据需要选择设置,比如DBSCAN(Density-Based Spatial Clusteringof Applications with Noise,聚类算法)基于密度的聚类算法,将目标轨迹数据按照密度可达性原则分为不同的轨迹簇。
在本公开实施例中,候选轨迹簇可通过对目标轨迹数据进行聚类处理得到,具体地,从目标轨迹数据中随机选择一个轨迹点作为开始轨迹点,获取与开始轨迹点距离预设距离范围之内的所有轨迹点,若所有轨迹点的数量大于等于预设数量阈值,那么将开始轨迹点和所有轨迹点形成一个候选轨迹簇,并将开始轨迹点标记为已访问,然后重复上一步操作对候选轨迹簇内所有未被标记为已访问的轨迹点进行处理;反之,若所有轨迹点的数量小于预设数量阈值,则将开始轨迹点标记为噪声点,需要说明的是,若候选轨迹簇内的所有轨迹点被标记为已访问,继续按照上述操作处理未被访问的点,直至目标轨迹数据中的所有轨迹点已访问,最后得到候选轨迹簇。
步骤105、基于预设策略对候选轨迹簇进行筛选,得到目标轨迹簇。
为了保证边境通道生成的合理性,需对候选轨迹簇通过预设策略进行筛选,得到目标轨迹簇,具体地,预设策略包括:筛选构成用户数量大于预设数量阈值的轨迹序列、筛选最长大圆距离不小于预设距离阈值的轨迹序列及筛选时间跨度不少于预设天数阈值的轨迹序列中的一种或者多种。
作为一种示例,获取候选轨迹簇中每个轨迹簇对应的用户数量,获取用户数量大于预设数量阈值的轨迹簇作为目标轨迹簇。
步骤106、提取目标轨迹簇的中心线,按照预设格式将中心线的位置信息进行存储。
其中,目标轨迹簇的中心线即为目标人员在边境附近的轨迹线,具体地,目标轨迹线的提取是指设定查找窗口,在目标轨迹簇纬度坐标上开始平移,移动过程中记录轨迹点数据集合,依次提取查找窗口内轨迹中心点坐标,生成轨迹中心点坐标集H,根据集合H数据绘制目标轨迹簇的中心线;预设格式指的是将目标轨迹簇的中心线经纬度坐标转换为固定位数的浮点数类型。
在本公开实施例中,设定预设大小的查找窗口,在目标轨迹簇的纬度坐标上开始平移,查找窗口起始纬度记为s,结束纬度记为e,收集移动过程中的轨迹点数据集合Ωi,然后通过滑动查找窗口,依次提取查找窗口内轨迹中心点坐标,生成轨迹中心点坐标集H,根据H对应的数据绘制中心线,再将中心线的经纬度坐标转为固定位数的浮点数类型,计算中心线的中心点坐标,最后查询中心点的地理位置编码和中文地址并将其存储在数据库表单中。
需要说明的是:轨迹点数据集合Ωi计算公式为:Ωi={(x,y)|si≤x≤ei,y∈R},其中,Ωi表示窗口内经纬度坐标集合,窗口起始横坐标位si,终止横坐标为ei;轨迹中心点坐标集H的计算公式为:其中,|Ωj|表示集合中的轨迹点数量,lati表示纬度,loni表示经度。
本公开实施例提供的一种基于轨迹聚类的边境通道生成方案,获取目标用户的历史轨迹数据和边境线经纬度数据,对历史轨迹数据进行预处理,得到候选轨迹数据,基于候选轨迹数据和边境线经纬度数据进行计算,得到目标轨迹数据,对目标轨迹数据进行聚类处理,得到候选轨迹簇,基于预设策略对候选轨迹簇进行筛选,得到目标轨迹簇,提取目标轨迹簇的中心线,按照预设格式将中心线的位置信息进行存储,本公开通过获取目标用户的历史轨迹数据及边境线经纬度数据,并对这些数据进行分析、筛选,从而可以准确地获取目标人员在边境区域的通道路线,能够监控目标人员的轨迹信息、异常行为模式的跨境行为,对于相关人员可及时进行管控,进一步提高边境线管理的安全性。
图3为本公开实施例提供的另一种基于轨迹聚类的边境通道生成方法流程示意图,包括:
步骤301、获取目标用户的历史轨迹数据和边境线经纬度数据。
需要说明的是,步骤301与上述步骤101相同,具体参见对步骤101的描述,此处不再详述。
步骤302、将历史轨迹数据按照时间顺序进行排列,得到目标用户对应的轨迹序列,将轨迹序列中经纬度为零值或空值的轨迹点、以及重复轨迹点进行删除,得到候选轨迹数据。
在本公开实施例中,将目标用户的历史轨迹数据按照时间的顺序进行排序,得到对应的轨迹序列,该轨迹序列包括用户标识、经度、维度及时间4项有效属性,设每个目标用户的轨迹序列的轨迹点为n个,那么此时的轨迹序列应为n×4的矩阵,然后将轨迹序列中经纬度为零值或空值的轨迹点以及重复轨迹点进行删除,得到候选轨迹数据。
具体地,产生重复轨迹点的原因为:目标用户的历史轨迹数据产生的方式、频率、发生地等各种不同因素的干扰与不一致性以及历史轨迹数据采集的不规范,使得相同来源的历史轨迹数据在时间上出现重复,不同来源的历史轨迹数据在时间上出现重叠,导致产生重复轨迹点,该重复轨迹点影响目标用户的历史轨迹的挖掘。在本公开的一个具体实施方式中,可根据数据采集的周期性特点对重复点进行去除,如针对同一来源的历史轨迹数据设定固定时间间隔,如话单数据,设置固定时间间隔为10分钟,那么将10分钟内与前一个相邻轨迹点距离小于500米的轨迹点视为重复点,将其去除。
步骤303、将候选轨迹数据和边境线经纬度数据进行经纬度大圆距离计算,得到大圆距离,对候选轨迹数据进行直方图统计,获取候选轨迹数据中每个轨迹点对应的权值,从候选轨迹数据中获取大圆距离小于等于预设距离阈值且权值大于等于预设权值阈值的轨迹点作为目标轨迹数据。
具体地,通过对候选轨迹数据和边境线经纬度数据进行经纬度大圆距离计算,得到大圆距离,根据该大圆距离可以筛选出一段时间内所有目标用户在边境附近出现的轨迹数据;通过对候选轨迹数据进行直方图统计,使候选轨迹数据中每个轨迹点都带有各自对应的权值,根据此权值可以筛选出一段时间内所有目标用户出现的高频轨迹点,从而筛选出目标轨迹数据。
在本公开一个具体的实施方式中,设预设距离阈值为A,预设权值阈值为B,那么若候选轨迹数据中获取大圆距离小于等于A且权值大于等于B,则说明此候选轨迹数据为目标人员在边境附近地区出现的高频轨迹点,将该候选轨迹数据作为目标轨迹数据。
其中,经纬度大圆距离计算公式为:
Haversine(X,Y)=R×accos(cos(x1-y1)cosx2cosy2+sinx2siny2);
其中,Haversine为半正矢公式,R为地球半径,x1,y1表示点的经度数,x2,y2表示点的纬度数。
步骤304、从目标轨迹数据中随机选择一个轨迹点作为开始轨迹点,获取与开始轨迹点距离预设距离范围之内的所有轨迹点,如果所有轨迹点的数量大于等于预设数量阈值,将开始轨迹点和所有轨迹点形成一个候选轨迹簇,并将开始轨迹点标记为已访问。
具体地,设置预设距离为D,预设数量阈值为E,那么从目标轨迹数据中随机选择一个轨迹点F作为开始轨迹点,获取与开始轨迹点F点距离为D之内的所有轨迹点,即以F为圆心,D为半径的圆内包含的所有轨迹点,若所有轨迹点的数量大于等于E,那么将开始轨迹点F和上述得到的满足条件的所有轨迹点形成一个候选轨迹簇,并将开始轨迹点F标记为已访问。
步骤305,重复上一步操作对候选轨迹簇内所有未被标记为已访问的轨迹点进行处理,如果所有轨迹点的数量小于预设数量阈值,则将开始轨迹点标记为噪声点,如果候选轨迹簇内的所有轨迹点被标记为已访问,继续重复上述操作处理未被访问的点,直到目标轨迹数据中的所有轨迹点已访问,得到候选轨迹簇。
继续重复步骤304的操作,对候选轨迹簇内所有未标记为已访问的轨迹点进行处理,若所有轨迹点的数量小于E,那么将开始轨迹点标记为噪声点,若候选轨迹簇内所有轨迹点被标记为已访问,继续重复步骤304操作处理未被访问的点,直到目标轨迹数据中所有轨迹点已访问,得到候选轨迹簇。
在本公开实施例中,将目标轨迹数据进行聚类处理,具体地如图4所示,首先输入目标轨迹数据、预设距离、预设数量阈值,扫描目标轨迹数据,选择任意轨迹点P,判断P是否已归入某个候选轨迹簇或者是否标记为噪声点,若否,则判断P点预设距离范围内的所有轨迹点是否小于预设数量阈值,若P点预设距离范围内的所有轨迹点小于预设数量阈值,则标记P点为边界点或噪声点,若P点预设距离范围内的所有轨迹点大于等于预设数量阈值,则将P点标记为已访问并建立一个候选轨迹簇,然后将P点预设距离范围内所有轨迹点加入到该候选轨迹簇中,随后检查预设距离范围内未被标记的Q点,最后重复上述操作,直至目标轨迹数据中所有轨迹点已访问,得到候选轨迹簇。
步骤306、筛选构成用户数量大于预设数量阈值的轨迹序列、筛选最长大圆距离不小于预设距离阈值的轨迹序列和筛选时间跨度不少于预设天数阈值的轨迹序列中的一种或者多种。
在本公开实施例中,获取目标轨迹簇的预设策略方式有很多,比如,设置预设数量阈值为L,当构成用户数量大于L时,其轨迹序列为目标轨迹簇;在另一些实施例中,设置预设距离阈值为M,当最长大圆距离不小于M时,其轨迹序列为目标轨迹簇;在又一些实施例中,设置预设天数阈值为N,当时间跨度不小于N时,其轨迹序列为目标轨迹簇。
步骤307、根据公式生成轨迹中心点坐标集,提取目标轨迹簇的中心线。
在本公开实施例中,设定查找窗口大小为h,在目标轨迹簇的维度坐标上进行平移,根据窗口的起止横坐标,收集移动过程中的轨迹点数据集合G,然后通过滑动查找窗口,依次提取查找窗口大小为h的轨迹中心点坐标,生成轨迹中心点坐标集,然后根据中心点坐标集对应的数据绘制目标轨迹簇的中心线。
步骤308、将中心线的经纬度坐标转为固定位数的浮点数类型,计算中心线的中心点坐标,查询中心点的地理位置编码和中文地址存入数据库表单。
为了使通道数据持久化,需将挖掘出的通道数据即中心线的经纬度坐标转换为固定位数的浮点数类型,其中,每条通道数据标签化,轨迹序列为点数据(MultiPoint)类型,计算中心线的中心点坐标,查询中心点的地理位置编码和中文地址存入数据库表单。
步骤309、按照预设周期对中心线的位置信息进行检测,在获取中心线的位置信息的已更新的情况下,获取中心点的更新位置信息对中心线的位置信息进行更新处理。
在本公开实施例中,为确保中心线位置信息的准确性,需要按照预设周期对中心线的位置信息进行检测,如设置预设周期为3天,那么每隔3天就需要对中心线的位置信息进行检测,在检测到中心线的位置信息已更新的情况下,获取中心点的更新位置信息对应的中心线的位置信息进行更新处理。
本公开实施例提供的一种基于轨迹聚类的边境通道生成方案,获取目标用户的历史轨迹数据和边境线经纬度数据,将历史轨迹数据按照时间顺序进行排列,得到目标用户对应的轨迹序列,将轨迹序列中经纬度为零值或空值的轨迹点、以及重复轨迹点进行去重,得到候选轨迹数据,将候选轨迹数据和边境线经纬度数据进行经纬度大圆距离计算,得到大圆距离,对候选轨迹数据进行直方图统计,获取候选轨迹数据中每个轨迹点对应的权值,从候选轨迹数据中获取大圆距离小于等于预设距离阈值且权值大于等于预设权值阈值的轨迹点作为目标轨迹数据,从目标轨迹数据中随机选择一个轨迹点作为开始轨迹点,获取与开始轨迹点距离预设距离范围之内的所有轨迹点,如果所有轨迹点的数量大于等于预设数量阈值,将开始轨迹点和所有轨迹点形成一个候选轨迹簇,并将开始轨迹点标记为已访问,重复上一步操作对候选轨迹簇内所有未被标记为已访问的轨迹点进行处理,如果所有轨迹点的数量小于预设数量阈值,则将开始轨迹点标记为噪声点,如果候选轨迹簇内的所有轨迹点被标记为已访问,继续重复上述操作处理未被访问的点,直到目标轨迹数据中的所有轨迹点已访问,得到候选轨迹簇,筛选构成用户数量大于预设数量阈值的轨迹序列、筛选最长大圆距离不小于预设距离阈值的轨迹序列和筛选时间跨度不少于预设天数阈值的轨迹序列中的一种或者多种,根据公式生成轨迹中心点坐标集,提取目标轨迹簇的中心线,将中心线的经纬度坐标转为固定位数的浮点数类型,计算中心线的中心点坐标,查询中心点的地理位置编码和中文地址存入数据库表单,按照预设周期对中心线的位置信息进行检测,在获取中心线的位置信息的已更新的情况下,获取中心点的更新位置信息对中心线的位置信息进行更新处理,通过对目标轨迹数据进行聚类处理得出目标人员的出行规律,通过预设格式对中心线位置信息进行存储的方式,保证了通道数据的持久性,此外还通过预设周期对中心线位置信息进行检测更新,保证了通道数据的准确性,避免了中心线位置信息更新不及时造成的边境安全问题。
图5为本公开实施例提供的一种基于轨迹聚类的边境通道生成方法的总流程示意图,首先获取历史轨迹数据和边境线经纬度数据,对历史轨迹数据进行预处理得到候选轨迹数据,基于候选轨迹数据与边境线经纬度数据进行计算,得到目标轨迹数据,再通过聚类对目标轨迹数据进行处理得到候选轨迹簇,然后将候选轨迹簇进行筛选,得到目标轨迹簇,最后提取目标轨迹簇的中心线,得到通道数据即中心线位置信息并进行存储。
图6为本公开提供的一种基于轨迹聚类的边境通道生成装置结构示意图,该装置包括第一获取模块601、第一处理模块602、计算模块603、第二处理模块604、筛选模块605、提取模块606,其中,
第一获取模块601,用于获取目标用户的历史轨迹数据和边境线经纬度数据;
第一处理模块602,用于对历史轨迹数据进行预处理,得到候选轨迹数据;
计算模块603,用于基于候选轨迹数据和边境线经纬度数据进行计算,得到目标轨迹数据;
第二处理模块604,用于对目标轨迹数据进行聚类处理,得到候选轨迹簇;
筛选模块605,用于基于预设策略对候选轨迹簇进行筛选,得到目标轨迹簇;
提取模块606,用于提取目标轨迹簇的中心线,按照预设格式将中心线的位置信息进行存储。
可选地,第一处理模块602,具体用于:
将历史轨迹数据按照时间顺序进行排列,得到目标用户对应的轨迹序列;其中,轨迹序列由一系列轨迹点组成,每个轨迹点包括用户标识、经度、纬度和时间;
将轨迹序列中经纬度为零值或空值的轨迹点、以及重复轨迹点进行删除,得到候选轨迹数据;其中,目标用户在预设时间间隔内与前一个相邻轨迹点距离小于预设距离阈值的轨迹点作为重复轨迹点。
可选地,计算模块603,具体用于:
将候选轨迹数据和边境线经纬度数据进行经纬度大圆距离计算,得到大圆距离;
对候选轨迹数据进行直方图统计,获取候选轨迹数据中每个轨迹点对应的权值;
从候选轨迹数据中获取大圆距离小于等于预设距离阈值且权值大于等于预设权值阈值的轨迹点作为目标轨迹数据。
可选地,第二处理模块604,具体用于:
从目标轨迹数据中随机选择一个轨迹点作为开始轨迹点,获取与开始轨迹点距离预设距离范围之内的所有轨迹点,如果所有轨迹点的数量大于等于预设数量阈值,将开始轨迹点和所有轨迹点形成一个候选轨迹簇,并将开始轨迹点标记为已访问;
重复上一步操作对候选轨迹簇内所有未被标记为已访问的轨迹点进行处理;
如果所有轨迹点的数量小于预设数量阈值,则将开始轨迹点标记为噪声点;
如果候选轨迹簇内的所有轨迹点被标记为已访问,继续重复上述操作处理未被访问的点,直到目标轨迹数据中的所有轨迹点已访问,得到候选轨迹簇。
可选地,筛选模块605,具体用于:
筛选构成用户数量大于预设数量阈值的轨迹序列、筛选最长大圆距离不小于预设距离阈值的轨迹序列和筛选时间跨度不少于预设天数阈值的轨迹序列中的一种或者多种。
可选地,提取模块606,具体用于:
设定预设大小的查找窗口,在目标轨迹簇的纬度坐标上开始平移,查找窗口起始纬度记为s,结束纬度记为e,收集移动过程中的轨迹点数据集合Ωi,根据如下公式计算:Ωi={(x,y)|si≤x≤ei,y∈R},其中,Ωi表示窗口内经纬度坐标集合,窗口起始横坐标位si,终止横坐标为ei;
滑动查找窗口,依次提取查找窗口内轨迹中心点坐标,生成轨迹中心点坐标集H,根据H对应的数据绘制中心线,根据如下公式计算:
将中心线的经纬度坐标转为固定位数的浮点数类型;
计算中心线的中心点坐标,查询中心点的地理位置编码和中文地址存入数据库表单。
可选地,所述装置还包括:
检测模块,用于按照预设周期对中心线的位置信息进行检测;
第二获取模块,用于在获取中心线的位置信息的已更新的情况下,获取中心点的更新位置信息对中心线的位置信息进行更新处理。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种基于轨迹聚类的边境通道生成方法,其特征在于,包括:
获取目标用户的历史轨迹数据和边境线经纬度数据;
对所述历史轨迹数据进行预处理,得到候选轨迹数据;
基于所述候选轨迹数据和所述边境线经纬度数据进行计算,得到目标轨迹数据;
对所述目标轨迹数据进行聚类处理,得到候选轨迹簇;
基于预设策略对所述候选轨迹簇进行筛选,得到目标轨迹簇;
提取所述目标轨迹簇的中心线,按照预设格式将所述中心线的位置信息进行存储。
2.根据权利要求1所述的基于轨迹聚类的边境通道生成方法,其特征在于,所述对所述历史轨迹数据进行预处理,得到候选轨迹数据,包括:
将所述历史轨迹数据按照时间顺序进行排列,得到所述目标用户对应的轨迹序列;其中,所述轨迹序列由一系列轨迹点组成,每个轨迹点包括用户标识、经度、纬度和时间;
将所述轨迹序列中经纬度为零值或空值的轨迹点、以及重复轨迹点进行删除,得到候选轨迹数据;其中,所述目标用户在预设时间间隔内与前一个相邻轨迹点距离小于预设距离阈值的轨迹点作为所述重复轨迹点。
3.根据权利要求1所述的基于轨迹聚类的边境通道生成方法,其特征在于,所述基于所述候选轨迹数据和所述边境线经纬度数据进行计算,得到目标轨迹数据,包括:
将所述候选轨迹数据和所述边境线经纬度数据进行经纬度大圆距离计算,得到大圆距离;
对所述候选轨迹数据进行直方图统计,获取所述候选轨迹数据中每个轨迹点对应的权值;
从所述候选轨迹数据中获取所述大圆距离小于等于预设距离阈值且权值大于等于预设权值阈值的轨迹点作为所述目标轨迹数据。
4.根据权利要求3所述的基于轨迹聚类的边境通道生成方法,其特征在于,所述经纬度大圆距离计算公式为:
Haversine(X,Y)=R×accos(cos(x1-y1)cosx2cosy2+sinx2siny2);
其中,R为地球半径,x1,y1表示点的经度数,x2,y2表表示点的纬度数。
5.根据权利要求1所述的基于轨迹聚类的边境通道生成方法,其特征在于,所述对所述目标轨迹数据进行聚类处理,得到候选轨迹簇,包括:
从所述目标轨迹数据中随机选择一个轨迹点作为开始轨迹点,获取与所述开始轨迹点距离预设距离范围之内的所有轨迹点,如果所有轨迹点的数量大于等于预设数量阈值,将所述开始轨迹点和所述所有轨迹点形成一个候选轨迹簇,并将所述开始轨迹点标记为已访问;
重复上一步操作对所述候选轨迹簇内所有未被标记为已访问的轨迹点进行处理;
如果所有轨迹点的数量小于所述预设数量阈值,则将所述开始轨迹点标记为噪声点;
如果所述候选轨迹簇内的所有轨迹点被标记为已访问,继续重复上述操作处理未被访问的点,直到所述目标轨迹数据中的所有轨迹点已访问,得到所述候选轨迹簇。
6.根据权利要求1所述的基于轨迹聚类的边境通道生成方法,其特征在于,所述预设策略包括:
筛选构成用户数量大于预设数量阈值的轨迹序列、筛选最长大圆距离不小于预设距离阈值的轨迹序列和筛选时间跨度不少于预设天数阈值的轨迹序列中的一种或者多种。
8.根据权利要求1所述的基于轨迹聚类的边境通道生成方法,其特征在于,所述按照预设格式将所述中心线的位置信息进行存储,包括:
将所述中心线的经纬度坐标转为固定位数的浮点数类型;
计算所述中心线的中心点坐标,查询中心点的地理位置编码和中文地址存入数据库表单。
9.根据权利要求1所述的基于轨迹聚类的边境通道生成方法,其特征在于,还包括:
按照预设周期对所述中心线的位置信息进行检测;
在获取所述中心线的位置信息的已更新的情况下,获取中心点的更新位置信息对所述中心线的位置信息进行更新处理。
10.一种基于轨迹聚类的边境通道生成装置,其特征在于,包括:
第一获取模块,用于获取目标用户的历史轨迹数据和边境线经纬度数据;
第一处理模块,用于对所述历史轨迹数据进行预处理,得到候选轨迹数据;
计算模块,用于基于所述候选轨迹数据和所述边境线经纬度数据进行计算,得到目标轨迹数据;
第二处理模块,用于对所述目标轨迹数据进行聚类处理,得到候选轨迹簇;
筛选模块,用于基于预设策略对所述候选轨迹簇进行筛选,得到目标轨迹簇;
提取模块,用于提取所述目标轨迹簇的中心线,按照预设格式将所述中心线的位置信息进行存储。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111640835.XA CN114492590A (zh) | 2021-12-29 | 2021-12-29 | 一种基于轨迹聚类的边境通道生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111640835.XA CN114492590A (zh) | 2021-12-29 | 2021-12-29 | 一种基于轨迹聚类的边境通道生成方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114492590A true CN114492590A (zh) | 2022-05-13 |
Family
ID=81508660
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111640835.XA Pending CN114492590A (zh) | 2021-12-29 | 2021-12-29 | 一种基于轨迹聚类的边境通道生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114492590A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115907159A (zh) * | 2022-11-22 | 2023-04-04 | 应急管理部国家减灾中心 | 一种相似路径台风的确定方法、装置、设备及介质 |
CN116136416A (zh) * | 2023-02-07 | 2023-05-19 | 北京甲板智慧科技有限公司 | 基于多特征融合滤波的实时轨迹优化方法和装置 |
-
2021
- 2021-12-29 CN CN202111640835.XA patent/CN114492590A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115907159A (zh) * | 2022-11-22 | 2023-04-04 | 应急管理部国家减灾中心 | 一种相似路径台风的确定方法、装置、设备及介质 |
CN115907159B (zh) * | 2022-11-22 | 2023-08-29 | 应急管理部国家减灾中心 | 一种相似路径台风的确定方法、装置、设备及介质 |
CN116136416A (zh) * | 2023-02-07 | 2023-05-19 | 北京甲板智慧科技有限公司 | 基于多特征融合滤波的实时轨迹优化方法和装置 |
CN116136416B (zh) * | 2023-02-07 | 2023-11-17 | 北京甲板智慧科技有限公司 | 基于多特征融合滤波的实时轨迹优化方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jochem et al. | Identifying residential neighbourhood types from settlement points in a machine learning approach | |
CN114492590A (zh) | 一种基于轨迹聚类的边境通道生成方法及装置 | |
CN109815993B (zh) | 基于gps轨迹的区域特征提取、数据库建立及路口识别方法 | |
CN109684384B (zh) | 一种轨迹数据时空密度分析系统及其分析方法 | |
Hecht et al. | Automatic derivation of urban structure types from topographic maps by means of image analysis and machine learning | |
CN111814596B (zh) | 一种遥感影像与出租车轨迹融合的自动城市功能分区方法 | |
CN107665289B (zh) | 一种运营商数据的处理方法及系统 | |
CN109118766A (zh) | 一种基于交通卡口的同行车辆判别方法及装置 | |
CN110275911B (zh) | 基于频繁序列模式的私家车出行热点路径挖掘方法 | |
Sun et al. | Roads and Intersections Extraction from High‐Resolution Remote Sensing Imagery Based on Tensor Voting under Big Data Environment | |
Chazalon et al. | ICDAR 2021 competition on historical map segmentation | |
CN110798805A (zh) | 基于gps轨迹的数据处理方法、装置及存储介质 | |
CN112309126A (zh) | 车牌检测方法、装置、电子设备及计算机可读存储介质 | |
CN114707616A (zh) | 轨迹间伴随关系的识别方法、装置及设备 | |
CN115862331A (zh) | 考虑卡口网络拓扑结构的车辆出行轨迹重构方法 | |
CN113205134A (zh) | 一种网络安全态势预测方法及系统 | |
WO2018042208A1 (en) | Street asset mapping | |
Herold et al. | A GEOBIA approach to map interpretation-multitemporal building footprint retrieval for high resolution monitoring of spatial urban dynamics | |
CN112883133B (zh) | 基于时序数据和功能演变数据的流量预测方法 | |
CN107798450B (zh) | 业务分配方法和装置 | |
CN112052337A (zh) | 基于时空关联的目标关系探测方法、系统及存储介质 | |
CN115587503B (zh) | 基于多模式仿真的个体出行链还原方法 | |
CN116127337B (zh) | 基于位置和图像的风险挖掘方法、装置、存储介质及设备 | |
CN115563652A (zh) | 轨迹嵌入预防泄露方法及系统 | |
Niccolai et al. | Decision rule-based approach to automatic tree crown detection and size classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |