CN111881242A

CN111881242A - 一种轨迹点的基础语义识别方法及相关设备

Info

Publication number: CN111881242A
Application number: CN202010737113.5A
Authority: CN
Inventors: 王芃森; 孙福宁
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-07-28
Filing date: 2020-07-28
Publication date: 2020-11-03
Anticipated expiration: 2040-07-28
Also published as: CN111881242B

Abstract

本申请提供了一种轨迹点的基础语义识别方法及相关设备，实现了对离散系数轨迹点的基础语义划分方案，数据依赖少，普适性强，可应用于各种时空轨迹数据。该方法包括：获取目标用户对应的N个第一轨迹，其中，N为大于或等于2的正整数，N个第一轨迹中每个轨迹至少包括M个轨迹点，M为大于或等于2的正整数，N个第一轨迹中的每条轨迹均为包含离散稀疏轨迹点的轨迹，N个第一轨迹与所述N个统计周期相对应；对N个第一轨迹中每个第一轨迹的轨迹点进行合并，得到第二轨迹，第二轨迹中包括N个第一轨迹中的所有轨迹点；根据第二轨迹中每个轨迹点的基础语义特征确定第二轨迹中每个轨迹点的基础语义；展示第二轨迹中每个轨迹点的基础语义。

Description

一种轨迹点的基础语义识别方法及相关设备

技术领域

本申请涉及地图领域，尤其涉及一种轨迹点的基础语义识别方法及相关设备。

背景技术

现有的轨迹语义的划分方法多是利用全球定位系统(Global PositioningSystem，GPS)采样的轨迹数据，数据采样周期固定，数据稠密，除此之前往往也会融合其他的地图元素信息或者附加信息。例如融合天气、交通方式等信息进行语义化轨迹的聚类；对均与采样的GPS定位点进行插值扩展，停留点识别，最后通过地图匹配或者空间区域对应最终形成用户语义轨迹信息；或者使用了带兴趣点(Point of Interest，POI)信息的轨迹信息，综合POI信息与用户轨迹信息进行相似性计算以及聚类，得到轨迹语义并分析了不同相似性算法的结果覆盖情况。

但是，现有的方案在识别轨迹语义时，对轨迹数据的质量要求比较高，一般都是均匀采样的GPS数据，采样周期均匀并且较为稠密，难以适用于离散稀疏的轨迹数据。另外轨迹语义往往会依赖一些地图元素信息或者附加信息，比如POI信息、路网信息、位置点的签到信息以及检索信息等。由于附加信息的多样性，使得现有方案不具有通用性和普适性。

发明信息

本申请提供了一种轨迹点的基础语义识别方法及相关设备，实现了对离散系数轨迹点的基础语义划分方案，数据依赖少，普适性强，可应用于各种时空轨迹数据。

本申请第一方面提供了一种轨迹点的基础语义识别方法，包括：

获取目标用户对应的N个第一轨迹，其中，N为大于或等于2的正整数，所述N个第一轨迹中每个轨迹至少包括M个轨迹点，M为大于或等于2的正整数，所述N个第一轨迹中的每条轨迹均为包含离散稀疏轨迹点的轨迹，所述N个第一轨迹与所述N个统计周期相对应；

对所述N个第一轨迹中每个第一轨迹的轨迹点进行合并，得到第二轨迹，所述第二轨迹中包括所述N个第一轨迹中的所有轨迹点；

根据所述第二轨迹中每个轨迹点的基础语义特征确定所述第二轨迹中每个轨迹点的基础语义；

展示所述第二轨迹中每个轨迹点的基础语义。

可选地，所述对所述N个第一轨迹中每个第一轨迹的轨迹点进行合并，得到第二轨迹包括：

对所述N个第一轨迹中每个第一轨迹的轨迹点进行压缩，得到N个第三轨迹；

对所述N个第三轨迹中每个轨迹的轨迹点进行空间位置合并，得到所述第二轨迹。

可选地，所述对所述N个第一轨迹中每个第一轨迹的轨迹点进行压缩，得到N个第三轨迹包括：

确定目标第一轨迹中满足预设条件的目标轨迹点序列，所述目标第一轨迹为所述N个第一轨迹中的任意一个轨迹；

确定所述目标轨迹点序列的中心轨迹点；

根据所述中心轨迹点以及所述目标第一轨迹中除所述目标轨迹点序列之外的其他轨迹点确定目标第二轨迹，所述目标第二轨迹包含于所述N个第三轨迹。

可选地，所述方法还包括：

确定第一截断距离内的第一轨迹点集合，所述第一截断距离为第一轨迹点对应的截断距离，所述第一轨迹点为所述第二轨迹中的任意一个轨迹点；

确定所述第一轨迹点与所述第一轨迹点集合中每个轨迹点的第一距离；

根据所述第一轨迹点集合以及所述第一轨迹点与所述第一轨迹点集合中每个轨迹点的第一距离确定所述第一轨迹点的局部密度；

当所述第一轨迹点的局部密度为所述第二轨迹中局部密度最大的轨迹点时，将第三轨迹点与所述第一轨迹点之间的距离确定为所述第一轨迹点对应的距离特征，所述第三轨迹点为所述第二轨迹中与所述第一轨迹点距离最大的轨迹点；

当所述第一轨迹点的局部密度不为所述第二轨迹中局部密度最大的轨迹点时，确定所述第二轨迹中局部密度大于所述第一轨迹点的局部密度的第二轨迹点集合；

确定所述第二轨迹点集合中与所述第一轨迹点最近的第二轨迹点；

将所述第一轨迹点与所述第二轨迹点之间的距离确定为所述第一轨迹点对应的距离特征；

确定所述第一轨迹点集合对应的统计周期；

基于所述第一轨迹点集合对应的统计周期以及所述N个统计周期确定所述第一轨迹点对应的定位周期比例；

其中，所述第一轨迹点的局部密度、所述第一轨迹点对应的距离特征以及所述第一轨迹点对应的定位周期比距均为所述第一轨迹点的基础语义特征。

可选地，所述方法还包括：

对所述第二轨迹中每个轨迹点的基础语义特征进行归一化处理，得到归一化处理后的所述第二轨迹中每个轨迹点的基础语义特征；

所述根据所述第二轨迹中每个轨迹点的基础语义特征确定所述第二轨迹中每个轨迹点的基础语义包括：

通过归一化处理后的所述第二轨迹中每个轨迹点的基础语义特征确定所述第二轨迹中每个轨迹点的基础语义。

可选地，所述通过归一化处理后的所述第二轨迹中每个轨迹点的基础语义特征确定所述第二轨迹中每个轨迹点的基础语义包括：

确定目标轨迹点基础语义特征之间的相对大小关系，所述目标轨迹点为归一化处理后的所述第二轨迹中的任意一个轨迹点；

根据所述目标轨迹点基础语义特征之间的相对大小关系以及预设时间阈值确定所述目标轨迹点的基础语义。

本申请第二方面提供了一种轨迹点的基础语义识别装置，包括：

获取单元，用于获取目标用户对应的N个第一轨迹，其中，N为大于或等于2的正整数，所述N个第一轨迹中每个轨迹至少包括M个轨迹点，M为大于或等于2的正整数，所述N个第一轨迹中的每条轨迹均为包含离散稀疏轨迹点的轨迹，所述N个第一轨迹与所述N个统计周期相对应；

合并单元，用于对所述N个第一轨迹中每个第一轨迹的轨迹点进行合并，得到第二轨迹，所述第二轨迹中包括所述N个第一轨迹中的所有轨迹点；

确定单元，用于根据所述第二轨迹中每个轨迹点的基础语义特征确定所述第二轨迹中每个轨迹点的基础语义；

展示单元，用于展示所述第二轨迹中每个轨迹点的基础语义。

可选地，所述合并单元具体用于：

可选地，所述合并单元对所述N个第一轨迹中每个第一轨迹的轨迹点进行压缩，得到N个第三轨迹包括：

确定所述目标轨迹点序列的中心轨迹点；

可选地，所述确定单元还用于：

确定所述第一轨迹点集合对应的统计周期；

可选地，所述装置还包括：

归一化处理单元，用于对所述第二轨迹中每个轨迹点的基础语义特征进行归一化处理，得到归一化处理后的所述第二轨迹中每个轨迹点的基础语义特征；

所述确定单元具体用于：

可选地，所述确定单元通过归一化处理后的所述第二轨迹中每个轨迹点的基础语义特征确定所述第二轨迹中每个轨迹点的基础语义包括：

本申请第三方面提供了一种计算机装置，其包括至少一个连接的处理器、存储器和收发器，其中，所述存储器用于存储程序代码，所述程序代码由所述处理器加载并执行以实现上述所述的轨迹点的基础语义识别方法的步骤。

本申请第四方面提供了一种计算机可读存储介质，其包括指令，当指令在计算机上运行时，使得计算机执行上述所述的轨迹点的基础语义识别方法的步骤。

综上所述，可以看出，本申请中，通过将N个轨迹中的轨迹点进行合并得到第二轨迹，并确定出空间位置合并后的第二轨迹中每个轨迹点的基础语义特征，该N个轨迹为包含离散稀疏轨迹点的轨迹，之后根据基础语义特征确定各个轨迹点的基础语义，实现了对离散系数轨迹点的基础语义划分方案，数据依赖少，普适性强，可应用于各种时空轨迹数据。

附图说明

图1为本申请实施例提供的轨迹点的基础语义识别方法的流程示意图；

图2为本申请实施例提供的压缩轨迹点后进行空间位置合并示意图；

图3为本申请实施例提供的对轨迹中的符合预设条件的轨迹点进行压缩合并的示意图；

图4为本申请实施例提供的实际应用中的轨迹中的符合预设条件的轨迹点进行压缩合并的示意图；

图5为本申请实施例提供的轨迹点的初始基础语义划分示意图；

图6为本申请实施例提供的轨迹点的最终基础语义划分示意图；

图7为本申请实施例提供的轨迹点的基础语义识别方法的场景示意图；

图8为本申请实施例提供的轨迹点的基础语义识别装置的虚拟结构示意图；

图9为本申请实施例提供的终端设备的硬件结构示意图；

图10为本申请实施例提供的服务器的硬件结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的信息以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块，本申请中所出现的模块的划分，仅仅是一种逻辑上的划分，实际应用中实现时可以有另外的划分方式，例如多个模块可以结合成或集成在另一个系统中，或一些特征向量可以忽略，或不执行，另外，所显示的或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，模块之间的间接耦合或通信连接可以是电性或其他类似的形式，本申请中均不作限定。并且，作为分离部件说明的模块或子模块可以是也可以不是物理上的分离，可以是也可以不是物理模块，或者可以分布到多个电路模块中，可以根据实际的需要选择其中的部分或全部模块来实现本申请方案的目的。

本申请可以用于基于兴趣区域(Area of Interest，AOI)的特定意图的人群提取，比如提取在某个小区的常驻人群，提取某个商圈的停留人群用于商业分析、广告投放等应用，可以提取某个片区的出行中人群用于评价区域的内的流通性应用于城市规划，其中，在地理信息系统中，一个POI可以是一栋房子、一个商铺、一个邮筒或一个公交站等一个有意义的点，AOI是POI的轮廓扩展。

本申请将轨迹中轨迹点识别出常驻、停留、出行和偶然类的点，可以用于轨迹的起讫点(origin-destination，OD)划分，用于用户通勤类，规律类以及非规律类的出行的挖掘分析，得到用户更加细致的出行行为与出行模式，可以应用于智慧交通、智慧城市等应用。本申请实施例提供了一种适用于离散稀疏轨迹点的基础语义划分与识别的方法技术，在不依赖其他地图元素的前提下，利用定位点在时间和空间上的关系，判别定位点常驻、停留、出行和偶然这四种轨迹的基础语义，其中：

常驻语义点：是用户多次并且长时间驻留的位置点。

停留语义点：是用户少次或者短暂驻留的位置点。

出行语义点：是用户在出行移动中的位置点。

偶然语义点：在全部轨迹点中的明显远离其他类型点的离散位置点。由于本方案适用于离散稀疏轨迹点，用户一些较远距离的偶然出行在缺少中途轨迹点的情况会判别为偶然语义点。

通过轨迹中定位点的基础语义划分，可以更加精准的判别区域到访以及出行OD的切分。

下面从轨迹点的基础语义识别装置的角度对本申请实施例提供的轨迹点的基础语义识别方法进行说明，该轨迹点的基础语义识别装置可以为终端设备，也可以为服务器，也可以为服务器中的服务单元，具体不做限定。

请参阅图1，图1为本申请实施例提供的轨迹点的基础语义识别方法的流程示意图，包括：

101、获取目标用户对应的N个第一轨迹。

本实施例中，轨迹点的基础语义识别装置可以获取目标用户对应的第一轨迹，其中，N为大于或等于2的正整数，N个第一轨迹中每个轨迹至少包括M个轨迹点，M为大于或等于2的正整数，N个第一轨迹中的每条轨迹均为包含离散稀疏轨迹点的轨迹，其中，N个第一轨迹与N个统计周期相对应。该统计周期可以为天，也可以为周，也可以为月，例如每个第一轨迹即为目标用户每天的轨迹点组成。可以理解的是，此处具体不限定轨迹点的基础语义识别装置获取目标用户对应的N个第一轨迹的方式。

102、对N个第一轨迹中每个第一轨迹的轨迹点进行合并，得到第二轨迹。

本实施例中，轨迹点的基础语义识别装置在得到N个第一轨迹之后，可以对N个第一轨迹中每个第一轨迹的轨迹点进行合并，得到第二轨迹，其中，该第二轨迹中包括N个第一轨迹中的所有轨迹点。

一个实施例中，轨迹点的基础语义识别装置对N个第一轨迹中每个第一轨迹的轨迹点进行合并，得到第二轨迹包括：

对N个第一轨迹中每个第一轨迹的轨迹点进行压缩，得到N个第三轨迹；

对N个第三轨迹中每个轨迹的轨迹点进行空间位置合并，得到第二轨迹。

本实施例中，轨迹点的基础语义确定装置可以对N个第一轨迹中每个第一轨迹的轨迹点进行压缩合并，得到N个第三轨迹；轨迹点的基础语义识别装置在得到压缩后的N个第三轨迹之后，可以将N个第三轨迹中每个轨迹的轨迹点进行空间位置合并，得到第二轨迹，该第二轨迹中包括N个第三轨迹中的所有轨迹点。也就是说，可以将N个第三轨迹点中每个轨迹的轨迹点放置于同一个空间内，请参阅图2，图2为本申请实施例提供的轨迹压缩后轨迹点空间位置合并示意图，如图2中的201，此处以统计周期为天为例，N为5为例进行说明，5天内所有的轨迹点放置于同一个空间上，得到如图2中的202所示的第二轨迹。

需要说明的是，轨迹点的基础语义识别装置通过把轨迹中一些临近轨迹点汇聚，可以辅助进行停留点判别，另外在实际情况中，常驻与停留点的占比很高，通过轨迹压缩可以在精度损失极小的情况下，大幅减少数据的计算量，提高计算效率。

一个实施例中，轨迹点的基础语义识别装置对N个第一轨迹中每个第一轨迹的轨迹点进行压缩，得到N个第三轨迹包括：

确定目标第一轨迹中满足预设条件的目标轨迹点序列，目标第一轨迹为N个第一轨迹中的任意一个轨迹；

确定目标轨迹点序列的中心轨迹点；

根据中心轨迹点以及目标第一轨迹中除目标轨迹点序列之外的其他轨迹点确定目标第二轨迹，目标第二轨迹包含于N个第三轨迹。

本申请，轨迹点的基础语义识别装置在得到N个第一轨迹之后，可以首先确定目标第一轨迹中满足预设条件的目标轨迹点序列，目标轨迹点序列中包括至少2个轨迹点；之后，确定目标轨迹点序列的中心轨迹点；最后，根据中心轨迹点以及目标第一轨迹中除目标轨迹点序列之外的其他轨迹点确定目标第二轨迹。该预设条件为在一个轨迹中，如果两个轨迹点之间的轨迹点(p_i→…→p_j)中，所有相邻轨迹点的距离小于阈值α(例如10米)，边缘轨迹点p_i以及p_j之间的距离小于阈值β(例如100米)，则这些轨迹点即为可压缩轨迹点序列，也即上述的目标轨迹点序列，轨迹点的基础语义识别装置可以根据该预设条件对N个第一轨迹中的每个第一轨迹进行压缩合并，取满足预设条件的最长轨迹子串可形成最长可压缩轨迹序列。以最长可压缩轨迹序列的中心点(可以理解的是此处最长可压缩轨迹序列的中心点可以取两个边缘轨点的距离中心，若该两个边缘轨迹点之间的距离中心点没有轨迹点，则以距离中心点最近的轨迹点作为最长可压缩轨迹序列的中心点，若最长可压缩轨迹序列的中心点有两个或以上时，可以从中任选一个作为最长可压缩轨迹序列的中心点)代替最长可压缩轨迹序列完成轨迹压缩，得到压缩后的N个第三轨迹。下面结合图3对轨迹点的压缩进行说明：

请参阅图3，图3为本申请实施例中提供的对轨迹中的符合预设条件的轨迹点进行压缩合并的示意图，为了减少轨迹压缩的信息损失，压缩的轨迹点记录对应原始轨迹序列的点数量作为权重weight，记录第一个轨迹点的时间作为起始时间time_start，记录最后一个轨迹点的时间作为终止时间time_end。对于一组最长可压缩轨迹序列(p_i→…→p_j)，压缩后的点可表示为(p_k，weight，time_start，time_end)，其中p_k为(p_i→…→p_j)的中心点；对于单个无法压缩的孤立点，同样用(p_k，weight，time_start，time_end)的形式表示该点，其中p_k为该点本身位置，weight为1，time_start和time_end为该点的时间。对整个轨迹的所有最长可压缩轨迹序列进行压缩并以(p_k，weight，time_start，time_end)的形式重新表示每个压缩后的点，最终得到最后的轨迹压缩结果。如图3所示，对于轨迹(p₁→…→p₇)，有相邻点距离最小阈值α，边缘点最小距离阈值β。在阈值限定下，可以得到(p₁→…→p₆)满足可压缩条件，如图3中的301找到p1至p6点为满足预设条件的轨迹点序列，由于p₆和p₇之间的距离大于α，轨迹(p₁→…→p₆)为最长可压缩轨迹序列，可以确定轨迹(p₁→…→p₆)的中心点，最后计算得到的中心店距离轨迹点p₄最近，则将轨迹点p₄作为轨迹(p₁→…→p₆)的中心点，如图3中的302，将p4点作为中心点，6作为压缩后轨迹点的权重，p₁的时间作为压缩后起始时间，p₆时间作为压缩后终止时间，点p₇不进行压缩，但是变换存储格式为(p₇，1，time_p7，time_p7)，最终压缩后轨迹变为(p₄，6，time_p1，time_p6)→(p₇，1，time_p7，time_p7)，如图3中的303，该轨迹压缩之后，得到p₄以及p₇两个轨迹点。采用该种方式，可以将N个第一轨迹中每个第一轨迹的轨迹点进行压缩，得到N个第三轨迹。图4为本申请实施例提供的具体应用中轨迹点压缩的示意图，如图4中的401为压缩前的轨迹点，通过本申请提供的方法对401中的轨迹点进行压缩，得到如402所示的压缩后的轨迹点。由此，通过轨迹压缩可以在精度损失极小的情况下，大幅减少数据的计算量，提高计算效率。可以理解的是，上述对轨迹点进行压缩合并的方式仅为举例说明，当然也还可以采用的其他的方式，例如可以用密度聚类的方式进行轨迹点汇聚压缩，只要能符合预设条件的轨迹点记性压缩，且压缩后的中心点可以代表压缩前的轨迹点的含义即可，具体不做限定。

103、根据第二轨迹中每个轨迹点的基础语义特征确定第二轨迹中每个轨迹点的基础语义。

本实施例中，轨迹点的基础语义识别装置可以根据第二轨迹中每个轨迹点的基础语义特征确定第二轨迹中每个轨迹点的基础语义，也即确定该轨迹点是停留点、还是常驻点、还是出行点等等。具体的，为了便于计算，可以首先对第二轨迹中每个轨迹点的基础语义进行归一化处理，之后通过归一化处理后第二轨迹中每个轨迹点的基础语义特征计算第二轨迹中每个轨迹点的基础语义。

一个实施例中，轨迹点的基础语义识别装置通过归一化处理后的第二轨迹中每个轨迹点的基础语义特征确定第二轨迹中每个轨迹点的基础语义包括：

确定目标轨迹点基础语义特征之间的相对大小关系，目标轨迹点为归一化处理后的第二轨迹中的任意一个轨迹点；

根据目标轨迹点基础语义特征之间的相对大小关系以及预设时间阈值确定目标轨迹点的基础语义。

本实施例中，对于基础语义特征的初始基础语义判别，可以根据每个轨迹点的轨迹基础语义特征ρ、δ和α的相关大小关系，将语义空间划分为8个部分，其中有2个在统计意义上有逻辑冲突，因此最终得到6个基础语义的划分空间。如表1所示：1.当ρ、δ和α都高时，表示该点为最常停留类型点，则该点更大可能是常驻点，计算判别可以用ρ*δ*α表示；2.当ρ、δ高，α低时，表示局部停留，但是没有持续多天，因此是暂时停留点，计算判别可以用ρ*δ/(1+α)表示；3.当ρ、α高，δ低时，表示该点处于密度高的常驻点周围，因此也是常驻点，计算判别可以用α*ρ/(1+δ)表示；4.当ρ高，δ、α低时，表示该点处于密度高的停留点周围，因此也是停留点，计算判别可以用ρ/(1+δ)/(1+α)表示；5.当ρ、δ、α都低时，表示点的聚集程度低，距离密度大点不远，天数少，很可能是刚刚离开常驻或者停留类的点，因此为出行点，计算判别可以用1/(1+ρ)(1+δ)/(1+α)表示；6.当δ高，ρ、α低时，表示该点聚集程度低，聚集密度大的点远，天数少，可能是出行点或者偶然点，计算判别可以用δ/(1+α)/(1+ρ)表示。7.当α高，ρ、δ低时，表示该点出现天数多，聚集程度低，由于出现天数和聚集密度会呈现正相关关系，因此该类型逻辑冲突，不做判断；8.当α、δ高，ρ低时，表示该点出现天数多，聚集程度低，同类型7逻辑冲突，不做判断。也就是说，此处可以将归一化处理后的第二轨迹中的每个轨迹点的基础语义特征套入表1中的序号1至6中的公式中，得到最高的值即为该轨迹点的初始基础语义。

表1

通过轨迹点的基础语义特征计算，可以将N个统计周期内合并压缩后的轨迹点进行初始基础语义识别，得到如图5所示的初始基础语义划分示意图，得到如图5所示的划分结果，其中，501代表类型1，502代表类型2，503代表类型3，504代表类型4，505代表类型5，506代表类型6。

最后利用轨迹点的前后时序关系判别出轨迹点的最终基础语义，可以设置停留点时间阈值为st，当初始基础语义为出行点以及偶然点，且该轨迹点的time_end-time_start大于st，该轨迹点最终确定为停留点；可以设置最长出行时间阈值tt，当常驻或停留点间的时间小于tt时，且初始判别为出行点以及偶然点，则该轨迹点的最终基础语义为出行点，当常驻或停留点间的时间小于tt时，且初始判别为出行点以及偶然点，则该轨迹点的最终基础语义为偶然。

需要说明的是，在根据第二轨迹中每个轨迹点的基础语义特征确定第二轨迹中每个轨迹点的基础语义之前，轨迹点的基础语义确定装置还需要确定第二轨迹中每个轨迹点的基础语义特征，具体如下：

轨迹点的基础语义识别装置可以确定第一截断距离内的第一轨迹点集合，第一截断距离为第一轨迹点对应的截断距离，第一轨迹点为第二轨迹中的任意一个轨迹点；

确定第一轨迹点与第一轨迹点集合中每个轨迹点的第一距离；

根据第一轨迹点集合以及第一轨迹点与第一轨迹点集合中每个轨迹点的第一距离确定第一轨迹点的局部密度；

当第一轨迹点的局部密度为第二轨迹中局部密度最大的轨迹点时，将第三轨迹点与第一轨迹点之间的距离确定为第一轨迹点对应的距离特征，第三轨迹点为第二轨迹中与第一轨迹点距离最大的轨迹点；

当第一轨迹点的局部密度不为第二轨迹中局部密度最大的轨迹点时，确定第二轨迹中局部密度大于第一轨迹点的局部密度的第二轨迹点集合；

确定所述第二轨迹点集合中与第一轨迹点最近的第二轨迹点；

将第一轨迹点与第二轨迹点之间的距离确定为第一轨迹点对应的距离特征；

确定第一轨迹点集合对应的统计周期；

基于第一轨迹点集合对应的统计周期以及N个统计周期确定第一轨迹点对应的定位周期比例；

其中，第一轨迹点的局部密度、第一轨迹点对应的距离特征以及第一轨迹点对应的定位周期比距均为第一轨迹点的基础语义特征。

也就是说，本申请通过了一种新颖的聚类方法，其中聚类参照指标为局部密度ρ和距离局部密度更大点的最近距离和距离特征δ，通过两者乘积排序可以得到候选的聚类中心点，这种聚类特征ρ和δ可以很好的表示空间中聚集点的关系；此处，以ρ表示当前轨迹点截断距离d_c下的局部密度(该截断距离为以当前轨迹点为中心的一个区域，如以当前轨迹点为中心，半径为100米的范围)，δ表示轨迹点距离局部密度更大点的最近距离表示轨迹点对应的距离特征(此处的δ为所有轨迹点中局部密度比当前轨迹点的局部密度大，且距离该当前轨迹点最近的轨迹点之间的距离，若该当前轨迹点的局部密度最大，则该δ为当前轨迹点与第二轨迹中距离最远的轨迹点之间的距离)，α表示轨迹点截断距离d_c下的定位周期比例(例如以统计周期为天为例进行说明，该当前轨迹点的截断距离范围之内有5个轨迹点，这5个轨迹点分别在3天内出现，N个统计周期为10天，则该当前轨迹点的定位周期比例α即为3/10)，ρ、δ和α即为轨迹点的基础语义特征，截断距离d_c缩小参与计算的数据范围，消除大量长尾数据可能带来的影响，并且减少计算，提高数据效率。

下面详细对每个轨迹点的基础语义特征进行介绍。

基础语义特征ρ表示当前轨迹点(也即第一轨迹点)截断距离d_c下的局部密度，即在当前轨迹点的截断距离d_c的范围内，以高斯函数的计算方式得到ρ，对于第一轨迹点i，局部密度ρ_i公式如下：

其中P_dc表示在第一轨迹点i的截断距离d_c范围内的第一轨迹点集合，P_dc\{i}表示去除第一轨迹点i后的轨迹点集合，d_ij表示第一轨迹点i和轨迹点j的距离，其中，轨迹点j为第一轨迹点集合中的任意一个轨迹点，d_gc表示高斯函数的密度距离。直接呈现的数据表现为与第一轨迹点i距离的轨迹点越多，第一轨迹点的局部密度ρ_i越大。可以理解的是，局部密度也可以用简单的截断距离内轨迹点的数量来表示，以此来减少计算开销。

基础语义特征δ表示第一轨迹点对应的距离特征，表示距离第一轨迹点局部密度更大点的最近距离，其中，若该第一轨迹点为第二轨迹中局部密度最大的轨迹点，则定义δ为最远的两个轨迹点之间的距离，若该第一轨迹点不为第二轨迹中局部密度最大的轨迹点，则该第一轨迹点的δ_i的计算分为两步，第一步找到所有局部密度比第一轨迹点i高的第二轨迹点集合J，第二步在第二轨迹点集合J中找到距离第一轨迹点i最近的第二轨迹点j，第一轨迹点i和第二轨迹点j的距离d_ij即为第一轨迹点的δ_i。

基础语义特征α表示第一轨迹点i在截断距离d_c下的定位天数比例，即在d_c范围内，所有轨迹点出现的周期占总周期的比例。由此，可以得到第三轨迹中每个轨迹点的基础语义特征ρ、δ以及α。

可以理解的是，局部密度ρ表示了轨迹点在空间的聚集程度，距离特征δ表示了轨迹点在空间上和其他轨迹点的关系，定位周期比例α表示了轨迹点在时间的广泛程度。为了更改体现3个轨迹语义特征的相对大小关系，轨迹点的基础语义识别装置可以对第二轨迹中每个轨迹点的基础语义特征进行归一化处理，得到归一化处理后的第二轨迹中每个轨迹点的基础语义特征，也就是说，可以对第二轨迹中的每个轨迹点的基础语义特征进行归一化处理，在实际计算过程中，发现它们的数据分布呈现指数衰减，因此可以先对原始数据取对数log处理，然后用min-max标准化进行数据0-1的标准化处理，当然也还可以采用其他的方式进行归一化处理，具体不做限定。

104、展示第二轨迹中每个轨迹点的基础语义，

本实施例中，轨迹点的基础语义识别装置在得到第二轨迹中每个轨迹点的基础语义之后，可以展示该第二轨迹中每个轨迹点的基础语义，如图6，图6为对图5中各个轨迹点的初始基础语义进行最终判别，得到的最终基础语义的展示示意图，可得到最终的轨迹基础语义的划分结果，其中601表示常驻点，602表示停留点，603表示出行点，604表示偶然点。

请参阅图7，图7为本申请实施例轨迹点的基础语义识别方法的应用场景示意图，通过在腾讯定位软件开发工具包(Software Development Kit，SDK)上报的非均匀低采样形式的轨迹数据集下，选取有定位信号且定位速度大于4m/s的轨迹点作为出行类点的评测，以有连接Wi-Fi的轨迹点作为常驻停留类点的评测，最终结果如表2所示：

表2

基础语义判别	准确率	样本集
			常驻、停留类	98.21％	5414192
出行类	88.50％	433935

选取某用户在统计周期内的轨迹，最终得到常驻类以及停留类的轨迹点的基础语义判别的准确率在98.21％，出行类的轨迹点的基础语义判别的准确率为88.50％。基础语义判别后效果如图7所示，如图7所示，将轨迹点的基础语义定位为常驻、停留、出行以及偶发，并通过对各个轨迹点进行语义特征计算，得到各个轨迹点的基础语义，这样，实现了对离散系数轨迹点的基础语义划分方案，数据依赖少，普适性强，可应用于各种时空轨迹数据。

上面从的轨迹点的基础语义识别方法的角度对本申请进行说明，下面从轨迹点的基础语义识别装置的角度对本申请进行说明。

请参阅图8，图8为本申请实施例提供的一种轨迹点的基础语义识别装置的虚拟结构示意图，包括：

获取单元801，用于获取目标用户对应的N个第一轨迹，其中，N为大于或等于2的正整数，所述N个第一轨迹中每个轨迹至少包括M个轨迹点，M为大于或等于2的正整数，所述N个第一轨迹中的每条轨迹均为包含离散稀疏轨迹点的轨迹，所述N个第一轨迹与所述N个统计周期相对应；

合并单元802，用于对所述N个第一轨迹中每个第一轨迹的轨迹点进行合并，得到第二轨迹，所述第二轨迹中包括所述N个第一轨迹中的所有轨迹点；

确定单元803，用于根据所述第二轨迹中每个轨迹点的基础语义特征确定所述第二轨迹中每个轨迹点的基础语义；

展示单元804，用于展示所述第二轨迹中每个轨迹点的基础语义。

可选地，所述合并单元802具体用于：

可选地，所述合并单元802对所述N个第一轨迹中每个第一轨迹的轨迹点进行压缩，得到N个第三轨迹包括：

确定所述目标轨迹点序列的中心轨迹点；

根据所述中心轨迹点以及所述目标第一轨迹中除所述目标轨迹点序列之外的其他轨迹点确定目标第二轨迹，所说目标第二轨迹包含于所述N个第三轨迹。

可选地，所述确定单元803还用于：

确定所述第一轨迹点集合对应的统计周期；

可选地，所述装置还包括：

归一化处理单元805，用于对所述第二轨迹中每个轨迹点的基础语义特征进行归一化处理，得到归一化处理后的所述第二轨迹中每个轨迹点的基础语义特征；

所述确定单元803具体用于：

可选地，所述确定单元803通过归一化处理后的所述第二轨迹中每个轨迹点的基础语义特征确定所述第二轨迹中每个轨迹点的基础语义包括：

本申请实施例还提供了另一种轨迹点的基础语义识别装置，如图9所示，为了便于说明，仅示出了与本申请实施例相关的部分，具体技术细节未揭示的，请参照本申请实施例方法部分。该轨迹点的基础语义识别装置可以为终端，该终端可以为包括手机、平板电脑、PDA(Personal Digital Assistant，个人数字助理)、POS(Point of Sales，销售终端)、车载电脑等任意终端设备，以终端为手机为例：

图9示出的是与本申请实施例提供的终端相关的手机的部分结构的框图。参考图9，手机包括：射频(Radio Frequency，RF)电路910、存储器920、输入单元930、显示单元940、传感器950、音频电路960、无线保真(wireless fIDelity，WiFi)模块970、处理器980、以及电源990等部件。本领域技术人员可以理解，图9中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图9对手机的各个构成部件进行具体的介绍：

RF电路910可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器980处理；另外，将设计上行的数据发送给基站。通常，RF电路910包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier，LNA)、双工器等。此外，RF电路910还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统(GlobalSystem of Mobile communication，GSM)、通用分组无线服务(General Packet RadioService，GPRS)、码分多址(Code Division Multiple Access，CDMA)、宽带码分多址(WIDeband Code Division Multiple Access，WCDMA)、长期演进(Long Term Evolution，LTE)、电子邮件、短消息服务(Short Messaging Service，SMS)等。

存储器920可用于存储软件程序以及模块，处理器980通过运行存储在存储器920的软件程序以及模块，从而执行手机的各种功能应用以及数据处理。存储器920可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器920可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元930可用于接收输入的数字或字符信息，以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地，输入单元930可包括触控面板931以及其他输入设备932。触控面板931，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板931上或在触控面板931附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板931可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器980，并能接收处理器980发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板931。除了触控面板931，输入单元930还可以包括其他输入设备932。具体地，其他输入设备932可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元940可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元940可包括显示面板941，可选的，可以采用液晶显示器(LiquID CrystalDisplay，LCD)、有机发光二极管(Organic Light-Emitting Diode，OLED)等形式来配置显示面板941。进一步的，触控面板931可覆盖显示面板941，当触控面板931检测到在其上或附近的触摸操作后，传送给处理器980以确定触摸事件的类型，随后处理器980根据触摸事件的类型在显示面板941上提供相应的视觉输出。虽然在图9中，触控面板931与显示面板941是作为两个独立的部件来实现手机的输入和输入功能，但是在某些实施例中，可以将触控面板931与显示面板941集成而实现手机的输入和输出功能。

手机还可包括至少一种传感器950，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板941的亮度，接近传感器可在手机移动到耳边时，关闭显示面板941和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路960、扬声器961，传声器962可提供用户与手机之间的音频接口。音频电路960可将接收到的音频数据转换后的电信号，传输到扬声器961，由扬声器961转换为声音信号输出；另一方面，传声器962将收集的声音信号转换为电信号，由音频电路960接收后转换为音频数据，再将音频数据输出处理器980处理后，经RF电路910以发送给比如另一手机，或者将音频数据输出至存储器920以便进一步处理。

WiFi属于短距离无线传输技术，手机通过WiFi模块970可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图9示出了WiFi模块970，但是可以理解的是，其并不属于手机的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器980是手机的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器920内的软件程序和/或模块，以及调用存储在存储器920内的数据，执行手机的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器980可包括一个或多个处理单元；优选的，处理器980可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器980中。

手机还包括给各个部件供电的电源990(比如电池)，优选的，电源可以通过电源管理系统与处理器980逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出，手机还可以包括摄像头、蓝牙模块等，在此不再赘述。

在本申请实施例中，上述由轨迹点的基础语义识别装置所执行的步骤可以由该终端所包括的处理器980来执行。

图10是本申请实施例提供的一种服务器结构示意图，该服务器1000可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processingunits，CPU)1022(例如，一个或一个以上处理器)和存储器1032，一个或一个以上存储应用程序1042或数据1044的存储介质1030(例如一个或一个以上海量存储设备)。其中，存储器1032和存储介质1030可以是短暂存储或持久存储。存储在存储介质1030的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1022可以设置为与存储介质1030通信，在服务器1000上执行存储介质1030中的一系列指令操作。

服务器1000还可以包括一个或一个以上电源1026，一个或一个以上有线或无线网络接口1050，一个或一个以上输入输出接口1058，和/或，一个或一个以上操作系统1041，例如Windows ServerTM，Mac OS XTM，UnixTM，LinuxTM，FreeBSDTM等等。

上述实施例中由轨迹点的基础语义识别装置所执行的步骤可以基于该图10所示的服务器结构。

本申请实施例还提供了一种计算机可读存储介质，其上存储有程序，该程序被处理器执行时实现上述所述轨迹点的基础语义识别方法的步骤。

本申请实施例还提供了一种处理器，所述处理器用于运行程序，其中，所述程序运行时执行上述所述轨迹点的基础语义识别方法的步骤。

本申请实施例还提供了一种终端设备，设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序，所述程序代码由所述处理器加载并执行以实现上述所述轨迹点的基础语义识别方法的步骤。

本申请还提供了一种计算机程序产品，当在数据处理设备上执行时，适于执行上述所述轨迹点的基础语义识别方法的步骤。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种轨迹点的基础语义识别方法，其特征在于，包括：

展示所述第二轨迹中每个轨迹点的基础语义。

2.根据权利要求1所述的方法，其特征在于，所述对所述N个第一轨迹中每个第一轨迹的轨迹点进行合并，得到第二轨迹包括：

3.根据权利要求2所述的方法，其特征在于，所述对所述N个第一轨迹中每个第一轨迹的轨迹点进行压缩，得到N个第三轨迹包括：

确定所述目标轨迹点序列的中心轨迹点；

4.根据权利要求1至3中任一项所述的方法，其特征在于，所述方法还包括：

确定所述第一轨迹点集合对应的统计周期；

5.根据权利要求1至3中任一项所述的方法，其特征在于，所述方法还包括：

6.根据权利要求5所述的方法，其特征在于，所述通过归一化处理后的所述第二轨迹中每个轨迹点的基础语义特征确定所述第二轨迹中每个轨迹点的基础语义包括：

7.一种轨迹点的基础语义识别装置，其特征在于，包括：

8.根据权利要求7所述的装置，其特征在于，所述合并单元具体用于：

9.一种计算机装置，其特征在于，包括：

至少一个连接的处理器、存储器和收发器；

所述存储器用于存储程序代码，所述程序代码由所述处理器加载并执行以实现上述权利要求1至6中任一项所述轨迹点的基础语义识别方法的步骤。

10.一种计算机可读存储介质，其特征在于，包括：

指令，当所述指令在计算机上运行时，使得所述计算机执行上述权利要求1至6中任一项所述轨迹点的基础语义识别方法的步骤。