CN104270714A

CN104270714A - 确定用户行动轨迹的方法和装置

Info

Publication number: CN104270714A
Application number: CN201410462583.XA
Authority: CN
Inventors: 涂丹丹; 张家劲
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2014-09-11
Filing date: 2014-09-11
Publication date: 2015-01-07
Anticipated expiration: 2034-09-11
Also published as: CN104270714B

Abstract

本发明公开了一种确定用户行动轨迹的方法和装置，属于通信技术领域。所述方法包括：获取至少包含一个用户位置点的待修正的用户行动轨迹；根据用户潜在路点集、用户潜在行动路径集及用户频繁行动路径集确定待修正的用户行动轨迹中每个用户位置点的映射概率；根据用户潜在路点集、用户潜在行动路径集、用户频繁行动路径集及映射概率确定待修正的用户行动轨迹中任意两个用户位置点间的迁移概率；根据迁移概率确定待修正的用户行动轨迹对应的候选路径集合，候选路径集合中至少包含一条候选路径；在候选路径集合中选取最优路径，并将最优路径确定为用户的行动轨迹。本发明通过对用户行动轨迹进行修正，提高了用户行动轨迹的精度。

Description

确定用户行动轨迹的方法和装置

技术领域

本发明涉及通信技术领域，特别涉及一种确定用户行动轨迹的方法和装置。

背景技术

通常情况下，通信设备在与移动终端进行通信时，通信设备可以实时采集到移动终端侧用户的位置数据。然而由于通信设备自身的局限性，通信设备采集到的用户的位置数据精度较低，导致根据用户的位置数据确定的用户行动轨迹的偏差较大，而用户行动轨迹具有重要的使用价值，不仅可为用户进行导航，而且还可为广告商选取广告屏选址、商家选取开店选址、市政交通优化等提供重要参考，因此，如何根据用户的位置数据确定用户行动轨迹，成为本领域技术人员较为关注的问题。

相关技术在确定用户行动轨迹时，采用如下三种方式：

第一种方式：首先，获取通信设备采集到的用户的各个位置数据，将采集到的用户的各个位置数据在电子地图中标注出来，得到用户的各个位置数据对应的用户位置点；其次，计算电子地图中每个用户位置点到与其邻近的道路的距离；再次，将每个用户位置点映射到与其距离最近的道路上，得到每个用户位置点对应的映射点；最后，将各个映射点顺序连接起来，得到用户行动轨迹。

第二种方式：首先，获取通信设备采集到的用户的各个位置数据，并将采集到的用户的各个位置数据在电子地图中标注出来，得到用户各个位置数据对应的用户位置点；其次，将电子地图中任意相邻的两个用户位置点连接组成线段，并计算每一条线段与相交道路之间夹角的余弦值；再次，将每一条线段中的用户位置点拟合到与该线段相交道路中夹角的余弦值最小的道路上；最后，将拟合到各条道路上的用户位置点顺序连接起来，得到用户行动轨迹。

第三种方式：首先，实时获取移动终端的小区信号信息，根据小区信号信息确定移动终端在每一时刻所处的经纬度，并根据移动终端在每一时刻所处的经纬度确定移动终端侧用户的位置数据；其次，将用户的位置数据在电子地图中标注出来，得到用户各个位置数据对应的用户位置点，并将各个用户位置点顺序连接起来，得到一条用户初始行动轨迹；再次，将用户初始行动轨迹与电子地图中的道路序列进行匹配，并将与用户初始行动轨迹匹配的道路序列作为用户行动轨迹。

在实现本发明的过程中，发明人发现相关技术至少存在以下问题：

由于当用户位置点较少时，第一种方式和第二种方式根据较少的用户位置点确定的用户行动轨迹为多条，且很难从多条用户行动轨迹中确定出正确的用户行动轨迹，因此，第一种方式和第二种方式确定的用户行动轨迹精度较低。

由于第三种方式需要将用户初始行动轨迹与电子地图中的道路序列进行匹配，且当电子地图中存在与用户初始行动轨迹匹配的道路序列时，才可确定出用户行动轨迹，因此，采用第三种方式确定用户行动轨迹的精度较低、局限性较大。

发明内容

为了解决相关技术的问题，本发明实施例提供了一种确定用户行动轨迹的方法和装置。所述技术方案如下：

第一方面，提供了一种确定用户行动轨迹的方法，所述方法包括：

获取至少包含一个用户位置点的待修正的用户行动轨迹；

根据用户潜在路点集、用户潜在行动路径集及用户频繁行动路径集确定待修正的用户行动轨迹中每个用户位置点的映射概率，所述用户潜在路点集为由用户的所有历史位置点映射在相邻的道路网格上的映射点组成的集合，所述用户潜在行动路径集为由每个用户潜在路点所在的道路网格组成的集合，所述用户频繁行动路径集为由至少一条用户历史频繁行动路径组成的集合，所述映射概率为将所述待修正的用户行动轨迹中每个用户位置点映射到对应的每个用户潜在路点上的概率；

根据所述用户潜在路点集、所述用户潜在行动路径集、所述用户频繁行动路径集及所述映射概率确定所述待修正的用户行动轨迹中任意两个用户位置点间的迁移概率，所述迁移概率为将所述待修正的用户行动轨迹中的任意两个用户位置点中前一个用户位置点对应的用户潜在路点迁移到后一个用户位置点对应的用户潜在路点上的概率；

根据所述迁移概率确定所述待修正的用户行动轨迹对应的候选路径集合，所述候选路径集合中至少包含一条候选路径；

在所述候选路径集合中选取最优路径，并将所述最优路径确定为所述用户的行动轨迹。

结合第一方面，在第一方面的第一种可能的实现方式中，所述方法还包括：

对多次收集到的用户的历史位置数据进行筛选，得到筛选后的位置数据；

获取道路网格数据，并根据所述道路网格数据构建道路网络；

确定所述道路网络中与筛选后的位置数据对应的用户位置点；

将每个用户位置点映射到所述道路网络中相邻的道路网格上，并将每个用户位置点在相邻的道路网格上的映射点作为用户潜在路点；

获取得到的所有用户潜在路点，得到包括所有用户潜在路点的用户潜在路点集；

将每个用户潜在路点所在的道路网格作为用户潜在行动路径，获取得到的所有用户潜在行动路径，得到包括所有用户潜在行动路径的用户潜在行动路径集。

结合第一方面或第一方面的第一种可能的实现方式，在第一方面的第二种可能的实现方式中，所述方法还包括：

对各个用户位置点进行聚类，得到用户频繁位置点；

根据所述用户频繁位置点确定用户频繁行动路径；

获取得到的所有用户频繁行动路径，得到包括所有用户频繁行动路径的用户频繁行动路径集。

结合第一方面的第二种可能的实现方式，在第一方面的第三种可能的实现方式中，所述对各个用户位置点进行聚类，得到用户频繁位置点，包括：

设定预设数量个聚类中心，根据所述预设数量个聚类中心及各个用户位置点确定预设数量个聚类团簇，并获取每个聚类团簇的中心；

计算每个聚类团簇内的每个用户位置点到对应的聚类中心的误差平方和期望，并将每个聚类团簇内的所有用户位置点到对应的聚类中心的误差平方和期望相加，得到第一误差平方和期望；

计算每个聚类团簇内的每个用户位置点到对应的聚类团簇的中心的误差平方和期望，并将每个聚类团簇内的所有用户位置点到对应的聚类团簇的中心的误差平方和期望相加，得到第二误差平方和期望；

根据每个聚类团簇的第一误差平方和期望和第二误差平方和期望确定用户频繁位置点。

结合第一方面的第三种可能的实现方式，在第一方面的第四种可能的实现方式中，所述根据预设数量个聚类中心及各个用户位置点确定预设数量个聚类团簇，包括：

计算每个用户位置点到各个聚类中心的距离，并根据每个用户位置点到各个聚类中心的距离确定每个用户位置点对应的聚类中心；

将对应同一个聚类中心的用户位置点组成一个聚类团簇，得到预设数量个聚类团簇。

结合第一方面的第三种可能的实现方式，在第一方面的第五种可能的实现方式中，所述根据每个聚类团簇的第一误差平方和期望和第二误差平方和期望确定用户频繁位置点，包括：

比较每个聚类团簇的第一误差平方和期望和第二误差平方和期望的大小；

若每个聚类团簇的第一误差平方和期望小于第二误差平方和期望，则将每个团簇设定的聚类中心作为用户频繁位置点。

结合第一方面的第五种可能的实现方式，在第一方面的第六种可能的实现方式中，所述比较每个聚类团簇的第一误差平方和期望和第二误差平方和期望的大小之后，还包括：

若每个聚类团簇的第一误差平方和期望大于第二误差平方和期望，则将每个聚类团簇的中心作为新的聚类中心，并按照处理设定的聚类中心得到新的聚类中心的方式处理新的聚类中心，依次循环，直至聚类团簇内的每个用户位置点到团簇内处理前的聚类中心和处理后的聚类中心的误差平方和期望不变，将误差平方和期望不变的聚类中心作为用户频繁位置点。

结合第一方面至第一方面的第六种可能的实现方式中，在第一方面的第七种可能的实现方式中，所述根据用户潜在路点集、用户潜在行动路径集及用户频繁行动路径集确定所述待修正的用户行动轨迹中每个用户位置点的映射概率，包括：

在所述用户行动轨迹中任意选取一个用户位置点，计算被选用户位置点到所述被选用户位置点对应的任一用户潜在路点之间的距离，并根据所述距离确定所述被选用户位置点对应的任一用户潜在路点的正态分布概率；

确定所述被选用户位置点对应的任一用户潜在路点的移动方向和道路的夹角；

根据所述用户频繁行动路径集计算所述被选用户位置点对应的任一用户潜在路点的流行度，所述流行度为所述被选用户位置点对应的任一用户潜在路点所在的用户潜在行动路径的数量与所述用户频繁行动路径集中包含的路径数量的比值；

根据所述被选用户位置点对应的任一用户潜在路点的正态分布概率、所述被选用户位置点对应的任一用户潜在路点的移动方向和道路的夹角以及所述被选用户位置点对应的任一用户潜在路点的流行度确定待修正的用户行动轨迹中所述被选用户位置点的映射概率；

按照处理所述被选用户位置点的方式处理所述待修正的用户行动轨迹中的每个用户位置点，得到待修正的用户行动轨迹中每个用户位置点的映射概率。

结合第一方面至第一方面的第七种可能的实现方式，在第一方面的第八种可能的实现方式中，所述根据所述用户潜在路点集、所述用户潜在行动路径集、所述用户频繁行动路径集及所述映射概率确定所述待修正的用户行动轨迹中任意两个用户位置点间的迁移概率，包括：

在所述待修正的用户行动轨迹中选取任意两个用户位置点，根据所述用户潜在路点集、所述用户潜在行动路径集及所述映射概率计算选取的任意两个用户位置点的空间迁移概率因子，并根据所述用户潜在路点集和所述用户潜在行动路径集计算选取的任意两个用户位置点的时间迁移概率因子；

计算选取的任意两个用户位置点在所述用户频繁行动路径集中相邻路段上的流行度；

根据所述空间迁移概率因子、所述时间迁移概率因子及所述流行度确定待修正的用户行动轨迹中任意两个用户位置点间的迁移概率。

结合第一方面至第一方面的第八种可能的实现方式，在第一方面的第九种可能的实现方式中，所述在所述候选路径集合中选取最优路径，包括：

计算每条候选路径的总评分，并将总评分最大的候选路径作为最优路径。

结合第一方面的第九种可能的实现方式，在第一方面的第十种可能的实现方式中，所述计算每条候选路径的总评分，包括：

按照如下公式计算每条候选路径的总评分：

F = (P_{c}) = Σ_{i = 1}^{n} F (c_{i - 1}^{s_{i - 1}} &RightArrow; c_{i}^{s_{i}})

其中，所述F(P_c)为所述P_c的总评分，所述P_c为所述候选路径集合中的任意一条候选路径，所述和所述为组成候选路径P_c的任意两个相邻的用户潜在路点，所述为将所述迁移到所述上的迁移概率

第二方面，提供了一种确定用户行动轨迹的装置，所述装置包括：

第一获取模块，用于获取至少包含一个用户位置点的待修正的用户行动轨迹；

第一确定模块，用于根据用户潜在路点集、用户潜在行动路径集及用户频繁行动路径集确定待修正的用户行动轨迹中每个用户位置点的映射概率，所述用户潜在路点集为由用户的所有历史位置点映射在相邻的道路网格上的映射点组成的集合，所述用户潜在行动路径集为由每个用户潜在路点所在的道路网格组成的集合，所述用户频繁行动路径集为由至少一条用户历史频繁行动路径组成的集合，所述映射概率为将所述待修正的用户行动轨迹中每个用户位置点映射到对应的每个用户潜在路点上的概率；

第二确定模块，用于根据所述用户潜在路点集、所述用户潜在行动路径集、所述用户频繁行动路径集及所述映射概率确定所述待修正的用户行动轨迹中任意两个用户位置点间的迁移概率，所述迁移概率为将所述待修正的用户行动轨迹中的任意两个用户位置点中前一个用户位置点对应的用户潜在路点迁移到后一个用户位置点对应的用户潜在路点上的概率；

第三确定模块，用于根据所述迁移概率确定所述待修正的用户行动轨迹对应的候选路径集合，所述候选路径集合中至少包含一条候选路径；

选取模块，用于在所述候选路径集合中选取最优路径，并将所述最优路径确定为所述用户行动轨迹。

结合第二方面，在第二方面的第一种可能的实现方式中，所述装置还包括：

筛选模块，用于对多次收集到的用户的历史位置数据进行筛选，得到筛选后的位置数据；

第二获取模块，用于获取道路网格数据；

构建模块，用于根据所述道路网格数据构建道路网络；

第四确定模块，用于确定所述道路网络中与筛选后的位置数据对应的用户位置点；

映射模块，用于将每个用户位置点映射到所述道路网络中相邻的道路网格上，并将每个用户位置点在相邻的道路网格上的映射点作为用户潜在路点；

第三获取模块，用于获取得到的所有用户潜在路点，得到包括所有用户潜在路点的用户潜在点集；

第四获取模块，用于将每个用户潜在路点所在的道路网格作为用户潜在行动路径，获取得到的所有用户潜在行动路径，得到包括所有用户潜在行动路径的用户潜在行动路径集。

结合第二方面或第二方面的第一种可能的实现方式，在第二方面的第二种可能的实现方式中，所述装置，还包括：

聚类模块，用于对各个用户位置点进行聚类，得到用户频繁位置点；

第五确定模块，用于根据所述用户频繁位置点确定用户频繁行动路径；

第五获取模块，用于获取得到的所有用户频繁行动路径，得到包括所有用户频繁行动路径的用户频繁行动路径集。

结合第二方面的第二种可能的实现方式，在第二方面的第三种可能的实现方式中，所述聚类模块，包括：

设定单元，用于设定预设数量个聚类中心；

第一确定单元，用于根据所述预设数量个聚类中心及各个用户位置点确定预设数量个聚类团簇；

获取单元，用于获取每个聚类团簇的中心；

第一计算单元，用于计算每个聚类团簇内的每个用户位置点到对应的聚类中心的误差平方和期望，并将每个聚类团簇内的所有用户位置点到对应的聚类中心的误差平方和期望相加，得到第一误差平方和期望；

第二计算单元，用于计算每个聚类团簇内的每个用户位置点到对应的聚类团簇的中心的误差平方和期望，并将每个聚类团簇内的所有用户位置点到对应的聚类团簇的中心的误差平方和期望相加，得到第二误差平方和期望；

第二确定单元，用于根据每个聚类团簇的第一误差平方和期望和第二误差平方和期望确定用户频繁位置点。

结合第二方面的第三种可能的实现方式，在第二方面的第四种可能的实现方式中，所述第一确定单元，用于计算每个用户位置点到各个聚类中心的距离，并根据每个用户位置点到各个聚类中心的距离确定每个用户位置点对应的聚类中心；将对应同一个聚类中心的用户位置点组成一个聚类团簇，得到预设数量个聚类团簇。

结合第二方面的第三种可能的实现方式，在第二方面的第五种可能的实现方式中，所述第二确定子单元，用于比较每个聚类团簇的第一误差平方和期望和第二误差平方和期望的大小；当每个聚类团簇的第一误差平方和期望小于第二误差平方和期望时，将每个团簇设定的聚类中心作为用户频繁位置点。

结合第二方面的第五种可能的实现方式，在第二方面的第六种可能的实现方式中，所述第二确定单元，还用于当每个聚类团簇的第一误差平方和期望大于第二误差平方和期望时，将每个聚类团簇的中心作为新的聚类中心，并按照处理设定的聚类中心得到新的聚类中心的方式处理新的聚类中心，依次循环，直至聚类团簇内的每个用户位置点到团簇内处理前的聚类中心和处理后的聚类中心的误差平方和期望不变，将误差平方和期望不变的聚类中心作为用户频繁位置点。

结合第二方面至第二方面的第六种可能的实现方式，在第二方面的第七种可能的实现方式中，所述第一确定模块，包括：

选取单元，用于在所述用户行动轨迹中任意选取一点；

第一计算单元，用于计算被选点用户位置点到所述被选用户位置点对应的任一用户潜在路点之间的距离；

第一确定单元，用于根据所述距离确定所述被选用户位置对应的任一用户潜在路点的正态分布概率；

第二确定单元，用于确定所述被选用户位置点对应的任一用户潜在路点的移动方向和道路的夹角；

第二计算单元，用于根据所述用户频繁行动路径集计算所述被选用户位置点对应的任一用户潜在路点的流行度，所述流行度为所述被选用户位置点对应的任一用户潜在路点所在的用户潜在行动路径的数量与所述用户频繁行动路径集中包含的路径数量的比值；

第三确定单元，用于根据所述被选用户位置点对应的任一用户潜在路点的正态分布概率、所述被选用户位置点对应的任一用户潜在路点的移动方向和道路的夹角以及所述被选用户位置点对应的任一用户潜在路点的流行度确定待修正的用户行动轨迹中所述被选用户位置点的候选映射概率；

处理单元，用于按照处理所述被选用户位置点的方式处理所述待修正的用户行动轨迹中的每个用户位置点，得到待修正的用户行动轨迹中每个用户位置点的映射概率。

结合第二方面至第二方面的第七种可能的实现方式，在第二方面的第八种可能的实现方式中，所述第二确定模块，包括：

选取单元，用于在所述待修正的用户行动轨迹中选取任意两个用户位置点；

第一计算单元，用于根据所述潜在路点集、所述用户潜在行动路径集及所述映射概率计算选取的任意两个用户位置点的候选映射点的空间迁移概率因子，并根据所述用户潜在路点集和所述用户潜在行动路径集计算选取的任意两个用户位置点的时间迁移概率因子；

第二计算单元，用于计算选取的任意两个用户位置点在所述用户频繁行动路径选集中相邻路段上的流行度；

确定单元，用于根据所述空间迁移概率因子、所述时间迁移概率因子及所述流行度确定待修正的用户行动轨迹中任意两个用户位置点间的迁移概率。

结合第二方面至第二方面的第八种可能的实现方式中，在第二方面的九种可能的实现方式中，所述选取模块，用于计算每条候选路径的总评分，并将总评分最大的候选路径作为最优路径。

结合第二方面的第九种可能的实现方式，在第二方面的第十种可能的实现方式中，所述计算单元，用于按照如下公式计算每条候选路径的总评分：

F = (P_{c}) = Σ_{i = 1}^{n} F (c_{i - 1}^{s_{i - 1}} &RightArrow; c_{i}^{s_{i}})

其中，所述F(P_c)为所述P_c的总评分，所述P_c为所述候选路径集合中的任意一条候选路径，所述和所述为组成候选路径P_c的任意两个相邻的用户潜在路点，所述为将所述迁移到所述上的迁移概率。

本发明实施例提供的技术方案带来的有益效果是：

通过获取待修正的用户行动轨迹，确定出待修正的用户行动轨迹中每个用户位置点的映射概率，并根据映射概率确定出待修正的用户行动轨迹中任意两个用户位置点间的迁移概率，进而根据迁移概率确定出待修正的用户行动轨迹对应的候选路径集合，从而在确定出的候选路径集合中选取一条最优路径，该最优路径即为确定的用户行动轨迹。由于迁移概率可以反应出待修正的用户行动轨迹中前一个用户位置点对应的用户潜在路点迁移到后一个用户位置点对应的潜在路点上的概率，迁移概率越大，表明由前一个用户位置点对应的用户潜在路点及后一个用户位置点对应的用户潜在路点组成的轨迹越有可能为用户的行动轨迹，因此，提高了确定的用户行动轨迹的精度。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例提供的确定用户行动轨迹的实施环境图；

图2是本发明另一实施例提供的一种确定用户行动轨迹的方法流程图；

图3是本发明另一实施例提供的一种确定用户行动轨迹的方法流程图；

图4是本发明另一实施例提供的道路网络图；

图5是本发明另一实施例提供的确定的用户频繁行动路径图；

图6是本发明另一实施例提供的确定的候选路径；

图7是本发明另一实施例提供的一种确定用户行动轨迹的装置结构示意图；

图8是本发明另一实施例提供的一种确定用户行动轨迹的系统架构图；

图9是本发明另一实施例提供的一种确定用户行动轨迹的装置结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

请参考图1，其示出了本发明实施例提供的确定用户行动轨迹的方法的系统架构图。如图1所示，系统架构图由移动终端、基站、通信设备、确定用户行动轨迹的装置、企业用户设备、导航设备组成。其中，用户的移动终端包括但不限于用户的手机、平板电脑等，本实施例不对用户的移动终端作具体的限定。在开机状态下用户的移动终端通过基站在与通信设备进行通信时，通信设备可实时采集用户的位置数据，该位置数据中包含了用户的轨迹信息。然而由于技术条件限制，通信设备采集到的用户的位置数据的精确度不高，需借助确定用户行动轨迹修正的装置对采集到的用户的位置数据进行修正，得到修正后的用户行动轨迹数据，该数据可作为高价值资料提供给企业用户设备，同时也提供给导航设备为用户导航等。

结合图1所示的实施环境，本发明实施例提供了一种确定用户行动轨迹的方法，参见图2，本实施例提供的方法流程包括：

201：获取至少包含一个用户位置点的待修正的用户行动轨迹。

需要说明的是，待修正的用户行动轨迹通常是通信设备，比如基站，实时采集用户的位置数据，该位置数据中包含了用户的轨迹信息，然而由于技术条件限制，通信设备采集到的用户的位置数据的精确度不高，因此需要对该用户行动轨迹进行修正。在本发明实施例中，通信设备采集的原始的用户行动轨迹，也就是需要修正的用户行动轨迹，称为待修正的用户行动轨迹。

202：根据用户潜在路点集、用户潜在行动路径集及用户频繁行动路径集确定待修正的用户行动轨迹中每个用户位置点的映射概率，用户潜在路点集为由用户的所有历史位置点映射在相邻的道路网格上的映射点组成的集合，用户潜在行动路径集为由每个用户潜在路点所在的道路网格组成的集合，用户频繁行动路径集为由至少一条用户历史频繁行动路径组成的集合，映射概率为将待修正的用户行动轨迹中每个用户位置点映射到对应的每个用户潜在路点上的概率。

作为一种可选的实施例，该方法还包括：

获取道路网格数据，并根据道路网格数据构建道路网络；

确定道路网络中与筛选后的位置数据对应的用户位置点；

将每个用户位置点映射到道路网络中相邻的道路网格上，并将每个用户位置点在相邻的道路网格上的映射点作为用户潜在路点；

作为一种可选的实施例，该方法还包括：

对各个用户位置点进行聚类，得到用户频繁位置点；

根据用户频繁位置点确定用户频繁行动路径；

作为一种可选的实施例，对各个用户位置点进行聚类，得到用户频繁位置点，包括：

设定预设数量个聚类中心，根据预设数量个聚类中心及各个用户位置点确定预设数量个聚类团簇，并获取每个聚类团簇的中心；

作为一种可选的实施例，根据预设数量个聚类中心及各个用户位置点确定预设数量个聚类团簇，包括：

作为一种可选的实施例，根据每个聚类团簇的第一误差平方和期望和第二误差平方和期望确定用户频繁位置点，包括：

作为一种可选的实施例，比较每个聚类团簇的第一误差平方和期望和第二误差平方和期望的大小之后，还包括：

作为一种可选的实施例，根据用户潜在路点集、用户潜在行动路径集及用户频繁行动路径集确定待修正的用户行动轨迹中每个用户位置点的映射概率，包括：

在用户行动轨迹中任意选取一个用户位置点，计算被选用户位置点到被选用户位置点对应的任一用户潜在路点之间的距离，并根据距离确定被选用户位置点对应的任一用户潜在路点的正态分布概率；

确定被选用户位置点对应的任一用户潜在路点的移动方向和道路的夹角；

根据用户频繁行动路径集计算被选用户位置点对应的任一用户潜在路点的流行度，流行度为被选用户位置点对应的任一用户潜在路点所在的用户潜在行动路径的数量与用户频繁行动路径集中包含的路径数量的比值；

根据被选用户位置点对应的任一用户潜在路点的正态分布概率、被选用户位置点对应的任一用户潜在路点的移动方向和道路的夹角以及被选用户位置点对应的任一用户潜在路点的流行度确定待修正的用户行动轨迹中被选用户位置点的映射概率；

按照处理被选用户位置点的方式处理待修正的用户行动轨迹中的每个用户位置点，得到待修正的用户行动轨迹中每个用户位置点的映射概率。

203：根据用户潜在路点集、用户潜在行动路径集、用户频繁行动路径集及映射概率确定待修正的用户行动轨迹中任意两个用户位置点间的迁移概率，迁移概率为将待修正的用户行动轨迹中的任意两个用户位置点中前一个用户位置点对应的用户潜在路点迁移到后一个用户位置点对应的用户潜在路点上的概率。

作为一种可选的实施例，根据用户潜在路点集、用户潜在行动路径集、用户频繁行动路径集及映射概率确定待修正的用户行动轨迹中任意两个用户位置点间的迁移概率，包括：

在待修正的用户行动轨迹中选取任意两个用户位置点，根据用户潜在路点集、用户潜在行动路径集及映射概率计算选取的任意两个用户位置点的空间迁移概率因子，并根据用户潜在路点集和用户潜在行动路径集计算选取的任意两个用户位置点的时间迁移概率因子；

计算选取的任意两个用户位置点在用户频繁行动路径集中相邻路段上的流行度；

根据空间迁移概率因子、时间迁移概率因子及流行度确定待修正的用户行动轨迹中任意两个用户位置点间的迁移概率。

204：根据迁移概率确定待修正的用户行动轨迹对应的候选路径集合，候选路径集合中至少包含一条候选路径。

205：在候选路径集合中选取最优路径，并将最优路径作为确定为用户的行动轨迹。

作为一种可选的实施例，在候选路径集合中选取最优路径，包括：

作为一种可选的实施例，计算每条候选路径的总评分，包括：

按照如下公式计算每条候选路径的总评分：

F = (P_{c}) = Σ_{i = 1}^{n} F (c_{i - 1}^{s_{i - 1}} &RightArrow; c_{i}^{s_{i}})

其中，F(P_c)为P_c的总评分，P_c为候选路径集合中的任意一条候选路径，和为组成候选路径P_c的任意两个相邻的用户潜在路点，为将迁移到上的迁移概率。

本发明实施例提供的方法，通过获取待修正的用户行动轨迹，确定出待修正的用户行动轨迹中每个用户位置点的映射概率，并根据映射概率确定出待修正的用户行动轨迹中任意两个用户位置点间的迁移概率，进而根据迁移概率确定出待修正的用户行动轨迹对应的候选路径集合，从而在确定出的候选路径集合中选取一条最优路径，该最优路径即为确定的用户行动轨迹。由于迁移概率可以反应出待修正的用户行动轨迹中前一个用户位置点对应的用户潜在路点迁移到后一个用户位置点对应的潜在路点上的概率，迁移概率越大，表明由前一个用户位置点对应的用户潜在路点及后一个用户位置点对应的用户潜在路点组成的轨迹越有可能为用户的行动轨迹，因此，提高了确定的用户行动轨迹的精度。

结合图1所示的实施环境，本发明实施例提供了一种确定用户行动轨迹的方法，参见图3，本实施例提供的方法流程包括：

301：确定用户潜在路点集及用户潜在行动路径集。

其中，用户潜在路点集为由用户的所有历史位置点映射在相邻的道路网格上的映射点组成的集合。用户潜在行动路径集为由每个用户潜在路点所在的道路网格组成的集合。关于确定用户潜在路点集及用户频繁行动路径集的方式，包括但不限于如下步骤：

第一步，对多次收集到的用户的历史位置数据进行筛选，得到筛选后的位置数据；

其中，用户的历史位置数据包括但不限于某一时刻用户所在位置的经纬度等，本实施例不对用户的历史位置数据作具体的限定。多次至少为一次，可以为5次、8次、10次等，本实施例对此不作具体的限定。关于收集用户的历史位置数据的方式，包括但不限于在如下场景中收集：当通信设备在与移动终端进行通信时，通过通信设备实时采集移动终端侧用户的位置数据，确定用户行动轨迹的装置获取通信设备采集到的移动终端侧用户的位置数据，并将获取到的用户的位置数据作为收集到的用户的历史位置数据。

另外，由于收集到的用户的历史位置数据在后续确定用户潜在路点集和用户潜在行动路径集时将继续使用，因此，本实施例提供的方法在收集到用户的历史位置数据之后，还包括将收集到的用户的历史位置数据进行存储的步骤。关于存储收集到的用户的历史位置数据的方式，包括但不限于将收集到的用户的历史位置数据存储到对应的内存、闪存等存储介质中。

进一步地，由于通信设备自身的局限性，导致收集到的用户的历史位置数据中可能存在噪声数据，而噪声数据将影响确定的用户潜在路点集和用户潜在行动路径集的准确性，又由于收集到的用户历史的位置数据中可能存在大量的重复数据等无效数据，而大量的重复数据等无效数据不仅会增加后续确定用户潜在路点集和用户潜在行动路径集的难度，而且还会消耗大量的资源。因此，为了提高确定的用户潜在路点集和用户潜在行动路径集的准确性，同时减小确定用户潜在路点集和用户潜在行动路径集时的资源消耗，本实施例提供的方法在收集到用户的历史位置数据之后，还将对多次收集到的用户的历史位置数据进行筛选，得到筛选后的位置数据。关于对多次收集到的用户的历史位置数据进行筛选的方式，本实施例不作具体限定。具体地，包括但不限于：将多次收集到的用户的历史位置数据中的相同时刻的位置数据及短暂停留数据进行去重，去除噪音数据及超短小轨迹，并将不连续轨迹切割分段等。

第二步，获取道路网格数据，并根据道路网格数据构建道路网络；

其中，道路网格数据包括但不限于所对应的道路的道路标识、经纬度等，本实施例不对道路网格数据作具体的限定。关于获取道路网格数据的方式，包括但不限于通过GPS(Global Positioning System，全球定位系统)采集道路信息，并将采集到的道路信息进行处理，得到道路网格数据。

进一步地，在获取到道路网格数据之后，本实施例提供的方法还将根据道路网格数据构建道路网络。其中，道路网络为由多条道路网格组成的道路拓扑图，通过道路网络可以查找到地图中的任一位置点。

第三步，确定道路网络中与筛选后的位置数据对应的用户位置点；

由于根据筛选后的每个用户的位置数据都可在地图中找到对应的位置，且通过道路网络可以查找到地图中的任一位置点，因此，可以在道路网络中确定出与筛选后的位置数据对应的用户位置点。关于确定道路网络中与筛选后的位置数据对应的用户位置点的方式，本实施例不作具体的限定。具体实施时，包括但不限于获取筛选后的各个位置数据的经纬度，根据筛选后的各个位置数据的经纬度在道路网络中获取相同经纬度的位置点，并将获取到的位置点作为确定出的道路网络中与筛选后的位置数据对应的用户位置点。

第四步，将每个用户位置点映射到道路网络中相邻的道路网格上，并将每个用户位置点在相邻的道路网格上的映射点作为用户潜在路点；

以图4为例，根据筛选后的各个位置数据获取到道路网络中的用户位置点为A、B和C。其中，与用户位置点A相邻的道路网格为道路网格1和道路网格2，与用户位置点B相邻的道路网格为道路网格3和道路网格4，与用户位置点C相邻的道路网格为道路网格2和道路网格5。将用户位置点A映射到道路网格1上的映射点为a₁，将用户位置点A映射到道路网格2上的映射点为a₂，将用户位置点B映射到道路网格3上的映射点为b₁，将用户位置点B映射到道路网格4上的映射点为b₂，将用户位置点C映射到道路网格2上的映射点为c₁，将用户位置点C映射到道路网格5上的映射点为c₂。将每个用户位置点在相邻的道路网格上的映射点作为用户潜在路点，可得到用户潜在路点为a₁、a₂、b₁、b₂、c₁和c₂。

第五步，获取得到的所有用户潜在路点，得到包括所有用户潜在路点的用户潜在路点集；

仍以上述图4中得到的用户潜在路点为例，获取得到的所有用户潜在路点a₁、a₂、b₁、b₂、c₁和c₂，将用户潜在路点a₁、a₂、b₁、b₂、c₁和c₂组成一个集合，该集合即为用户潜在路点集。

第六步，将每个用户潜在路点所在道路作为用户潜在行动路径，获取得到的所有用户潜在行动路径，得到包括所有用户潜在行动路径的用户潜在行动路径集。

在将每个用户位置点映射到道路网络中相邻的道路网格上之后，本实施例提供的方法还将每个用户潜在路点所在的道路网格作为用户潜在行动路径，并根据所有用户潜在行动路径组成用户潜在行动路径集。仍以上述图4为例，在将用户位置点A、B和C映射到相邻的道路网格上之后，用户位置点A的映射点所在的道路网格1和道路网格2、用户位置点B的映射点所在的道路网格3和道路网格4以及用户位置点C的映射点所在的道路网格2和道路网格5即为用户潜在行动路径，将道路网格1、道路网格2、道路网格3、道路网格4和道路网格5组成一个集合，该集合即为用户潜在行动路径集。

302：确定用户频繁行动路径集。

其中，用户频繁行动路径集为由至少一条用户历史频繁行动路径组成的集合。关于确定用户频繁行动路径集的方式，包括但不限如下方式：

第一、对各个用户位置点进行聚类，得到用户频繁位置点；

由于获取到的用户的位置数据的数量较大，根据数量较大的用户的位置数据确定用户行动被选集时的计算量较大，因此，为了简化根据用户位置数据确定用户行动轨迹被选集的计算量，本实施例提供的方法还将对各个用户位置点进行聚类。通过对各个用户位置点进行聚类，得到用户频繁位置点。

具体地，对各个用户位置点进行聚类，得到用户频繁位置点，包括但不限于如下步骤：

1、设定预设数量个聚类中心，根据预设数量个聚类中心及各个用户位置点确定预设数量个聚类团簇，并获取每个聚类团簇的中心；

其中，预设数量可以为2个、3个、4个等，本实施例不对预设数量作具体的限定。

关于根据预设数量个聚类中心及各个用户位置点确定预设数量个聚类团簇，包括但不限于如下方式：

首先，计算每个用户位置点到各个聚类中心的距离，并根据每个用户位置点到各个聚类中心的距离确定每个用户位置点对应的聚类中心；

关于计算每个用户位置点到各个聚类中心的距离的方式，本实施例不作具体的限定。在计算出每个用户位置点到各个聚类中心的距离之后，为了保证对应同一个聚类中心的各个用户位置点之间的差异性最小，可在每个用户位置点到各个聚类中心的距离中选取最小的距离，并将选取的最小距离所对应的聚类中心作为该用户位置点对应的聚类中心。例1，设定聚类中心为A和B，用户位置点为a、b、c、d、e、f、g和h。若计算出用户位置点a到聚类中心A的距离为1厘米、到聚类中心B的距离为2厘米，用户位置点b到聚类中心A的距离为3厘米、到聚类中心B的距离为2.5厘米，用户位置点c到聚类中心A的距离为0.6厘米、到聚类中心B的距离为2.8厘米，用户位置点d到聚类中心A的距离为6厘米、到聚类中心B的距离为1.2厘米，用户位置点e到聚类中心A的距离为2.4厘米、到聚类中心B的距离为3.2厘米，用户位置点f到聚类中心A的距离为1.5厘米、到聚类中心B的距离为4厘米，用户位置点g到聚类中心A的距离为4厘米、到聚类中心B的距离为3.1厘米，用户位置点h到聚类中心A的距离为5.3厘米、到聚类中心B的距离为3.4厘米，则可确定用户位置点a对应聚类中心A、用户位置点b对应聚类中心B、用户位置点c对应聚类中心A、用户位置点d对应聚类中心B、用户位置点e对应聚类中心A、用户位置点f对应聚类中心A、用户位置点g对应聚类中心B、用户位置点h对应聚类中心B。

其次，将对应同一个聚类中心的用户位置点组成一个聚类团簇，得到预设数量个聚类团簇。

在确定出每个用户位置点对应的聚类中心之后，可将对应同一个聚类中心的用户位置点组成一个聚类团簇，进而得到与聚类中心数量相同的聚类团簇。仍以上述例1为例，通过上述分析可得出用户位置点a对应聚类中心A、用户位置点b对应聚类中心B、用户位置点c对应聚类中心A、用户位置点d对应聚类中心B、用户位置点e对应聚类中心A、用户位置点f对应聚类中心A、用户位置点g对应聚类中心B、用户位置点h对应聚类中心B，将对应聚类中心A的用户位置点a、用户位置点c、用户位置点e和用户位置点f组成一个聚类团簇，将对应聚类中心B的用户位置点b、用户位置点d、用户位置点g和用户位置点h组成一个聚类团簇，最终得到两个聚类团簇。

第二步，计算每个聚类团簇内的每个用户位置点到对应的聚类中心的误差平方和期望，并将每个聚类中心内的所有用户位置点到对应的聚类中心的误差平方和期望相加，得到第一误差平方和期望；

具体地，计算每个聚类团簇内的每个用户位置点到对应的聚类中心的误差平方和期望，包括但不限于：

按照如下公式计算每个聚类团簇内的用户位置点到对应的聚类中心的误差平方和期望：

E_{1} ({| | c - x | |}^{2}) = {&Integral;}_{0}^{R 1} {&Integral;}_{0}^{2 π} f (r, θ) (A \cos θ + B \sin θ + C) rdθdr

其中，E₁为每个聚类团簇内的任一用户位置点x到聚类中心c的误差平方和期望，R₁为x到c的距离，f(r，θ)为概率密度函数，r和θ为积分变量，A＝2r(h-p)，B＝2r(k-q),C＝r²+(h-p)²+(k-q)²，p为c的横坐标，q为c的纵坐标，h为x的横坐标，k为x的纵坐标。

对于上述过程，为了便于理解，下面将以一个具体的例子进行详细地解释说明。

例如，设定聚类中心为A和B，用户位置点为a、b、c、d、e、f和g，其中，用户位置点a、b和c为一个聚类团簇，对应聚类中心A，且用户位置点a的坐标为(x₁，y₁)、用户位置点b的坐标为(x₂，y₂)、用户位置点c的坐标为(x₃，y₃)、聚类中心A的坐标为(x₄，y₄)；用户位置点d、e、f和g为一个聚类团簇，对应聚类中心B，且用户位置点d的坐标为(s₁，t₁)、用户位置点e的坐标为(s₂，t₂)、用户位置点f的坐标为(s₃，t₃)、用户位置点g的坐标为(s₄，t₄)、聚类中心B的坐标为(s₅，t₅)。若计算出用户位置点a到聚类中心A的距离为d₁、用户位置点b到聚类中心A的距离为d₂、用户位置点c到聚类中心A的距离为d₃，则用户位置点a到聚类中心A的误差平方和期望为：

E_{1} ({| | A - a | |}^{2}) = {&Integral;}_{0}^{d 1} {&Integral;}_{0}^{2 π} f (r, θ) (A_{1} \cos θ + B_{1} \sin θ + C_{1}) rdθdt,

其中，A₁＝2r(x₁-x₄)，B₁＝2r(y₁-y₄)，C₁＝r²+(x₁-x₄)²+(y₁-y₄)²；用户位置点b到聚类中心A的误差平方和期望为：

E_{1} ({| | A - b | |}^{2}) = {&Integral;}_{0}^{d 2} {&Integral;}_{0}^{2 π} f (r, θ) (A_{2} \cos θ + B_{2} \sin θ + C_{2}) rdθdr,

其中，A₂＝2r(x₂-x₄)，B₂＝2r(y₂-y₄)，C₂＝r²+(x₂-x₄)²+(y₂-y₄)²；用户位置点c到聚类中心A的误差平方和期望为：

E_{1} ({| | A - c | |}^{2}) = {&Integral;}_{0}^{d 3} {&Integral;}_{0}^{2 π} f (r, θ) (A_{3} \cos θ + B_{3} \sin θ + C_{3}) rdθdr,

其中，A₃＝2r(x₃-x₄)，B₃＝2r(y₃-y₄)，C₃＝r²+(x₃-x₄)²+(y₃-y₄)²；将以A为聚类中心的聚类团簇内的所有用户位置点到聚类中心A的误差平方和期望相加，得到第一误差平方和期望为E₁(||A-a||²)+E₁(||A-b||²)+E₁(||A-c||²)。若计算出用户位置点d到聚类中心B的距离为l₁、用户位置点e到聚类中心B的距离为l₂、用户位置点f到聚类中心B的距离为l₃、用户位置点g到聚类中心B的距离为l₄，则用户位置点d到聚类中心B的误差平方和期望为：

E_{1} ({| | A - d | |}^{2}) = {&Integral;}_{0}^{l 1} {&Integral;}_{0}^{2 π} f (r, θ) (A_{4} \cos θ + B_{4} \sin θ + C_{4}) rdθdr,

其中，A₄＝2r(s₁-s₅)，B₄＝2r(t₁-t₅)，C₄＝r²+(s₁-s₅)²+(t₁-t₅)²；用户位置点e到聚类中心B的误差平方和期望为：

E_{1} ({| | B - e | |}^{2}) = {&Integral;}_{0}^{l 2} {&Integral;}_{0}^{2 π} f (r, θ) (A_{5} \cos θ + B_{5} \sin θ + C_{5}) rdθdr,

其中，A₅＝2r(s₂-s₅)，B₅＝2r(t₂-t₅)，C₅＝r²+(s₂-s₅)²+(t₂-t₅)²；用户位置点f到聚类中心B的误差平方和期望为：

E_{1} ({| | B - f | |}^{2}) = {&Integral;}_{0}^{d 1} {&Integral;}_{0}^{2 π} f (r, θ) (A_{6} \cos θ + B_{6} \sin θ + C_{6}) rdθdt,

其中，A₆＝2r(s₃-s₅)，B₆＝2r(t₃-t₅)，C₆＝r²+(s₃-s₅)²+(t₃-t₅)²；户位置点g到聚类中心B的误差平方和期望为：

E_{1} ({| | B - g | |}^{2}) = {&Integral;}_{0}^{d 5} {&Integral;}_{0}^{2 π} f (r, θ) (A_{7} \cos θ + B_{7} \sin θ + C_{7}) rdθdr,

其中，A₇＝2r(s₄-s₅)，B₇＝2r(t₄-t₅)，C₇＝r²+(s₄-s₅)²+(t₄-t₅)²；将以B为聚类中心的聚类团簇内的所有用户位置点到聚类中心B的误差平方和期望相加，得到第一误差平方和期望为E₁(||B-d||²)+E₁(||B-e||²)+E₁(||B-f||²)+E₁(||B-g||²)。

第三步，计算每个聚类团簇内的每个用户位置点到对应的聚类团簇的中心的误差平方和期望，并将每个聚类团簇内的所有用户位置点到对应的聚类团簇的中心的误差平方和期望相加，得到第二误差平方和期望；

由于预先设定的聚类中心为随机选取的，根据随机选取的聚类中心及用户位置点确定的聚类团簇的中心一般不为设定的聚类中心，此时需要确定聚类团簇的中心，进而计算每个聚类团簇内的每个用户位置点到对应的聚类团簇的中心的误差平方和期望。关于确定每个聚类团簇的中心的方法，包括但不限于：计算每个聚类团簇内的任意两个用户位置点之间的距离，在计算得到的任意两个用户位置点之间的距离中选取最大距离，并以最大距离为直径作圆，该圆的圆心即为每个聚类团簇的中心。

关于计算每个聚类团簇内的每个用户位置点到对应的聚类团簇的中心的误差平方和期望的方式，包括但不限于：

按照如下公式计算每个聚类团簇内的用户位置点到对应的聚类团簇的中心的误差平方和期望：

E_{2} ({| | a - y | |}^{2}) = {&Integral;}_{0}^{R} {&Integral;}_{0}^{2 π} f (r, θ) (D \cos θ + E \sin θ + F) rdθdr

其中，E₂为每个聚类团簇内的任一用户位置点x到聚类团簇的中心a的误差平方和期望，R₂为x到a的距离，f(r，θ)为概率密度函数，r和θ为积分变量，D＝2r(m-s)，E＝2r(n-d),F＝r²+(h-s)²+(k-d)²，s为a的横坐标，d为a的纵坐标，m为y的横坐标，n为y的纵坐标。

例如，设定用户位置点为a、b、c、d、e、f和g，其中，用户位置点a、b和c为一个聚类团簇，且聚类团簇的中心A，用户位置点a的坐标为(x₁，y₁)、用户位置点b的坐标为(x₂，y₂)、用户位置点c的坐标为(x₃，y₃)、聚类团簇的中心A的坐标为(x₄，y₄)；用户位置点d、e、f和g为一个聚类团簇，且聚类团簇的中心B，且用户位置点d的坐标为(s₁，t₁)、位置点e的坐标为(s₂，t₂)、用户位置点f的坐标为(s₃，t₃)、用户位置点g的坐标为(s₄，t₄)、聚类团簇的中心B的坐标为(s₅，t₅)。若计算出用户位置点a到聚类团簇的中心A的距离为d₁、用户位置点b到聚类团簇的中心A的距离为d₂、用户位置点c到聚类团簇的中心A的距离为d₃，则用户位置点a到聚类团簇的中心A的误差平方和期望为：

E_{2} ({| | A - a | |}^{2}) = {&Integral;}_{0}^{d 1} {&Integral;}_{0}^{2 π} f (r, θ) (D_{1} \cos θ + E_{1} \cos θ + F_{1}) rdθdr,

其中，D₁＝2r(x₁-x₄)，E₁＝2r(y₁-y₄)，F₁＝r²+(x₁-x₄)²+(y₁-y₄)²；用户位置点b到聚类团簇的中心A的误差平方和期望为：

E_{2} ({| | A - b | |}^{2}) = {&Integral;}_{0}^{d 2} {&Integral;}_{0}^{2 π} f (r, θ) (D_{2} \cos θ + E_{2} \cos θ + F_{2}) rdθdr,

其中，D2＝2r(x₂-x₄)，E₂＝2r(y₂-y₄)，F₂＝r²+(x₂-x₄)²+(y₂-y₄)²；用户位置点c到聚类团簇的中心A的误差平方和期望为：

E_{2} ({| | A - c | |}^{2}) = {&Integral;}_{0}^{d 3} {&Integral;}_{0}^{2 π} f (r, θ) (D_{3} \cos θ + E_{3} \cos θ + F_{3}) rdθdr,

其中，D₃＝2r(x₃-x₄)，E₃＝2r(y₃-y₄)，F₃＝r²+(x₃-x₄)²+(y₃-y₄)²；将以A为聚类团簇的中心的聚类团簇内的所有用户位置点到聚类团簇的中心A的误差平方和期望相加，得到第二误差平方和期望为E₂(||A-a||²)+E₂(||A-b||²)+E₂(||A-c||²)。若计算出用户位置点d到聚类团簇的中心B的距离为l₁、用户位置点e到聚类团簇的中心B的距离为l₂、用户位置点f到聚类团簇的中心B的距离为l₃、用户位置点g到聚类团簇的中心B的距离为l₄，则用户位置点d到聚类团簇的中心B的误差平方和期望为：

E_{2} ({| | B - b | |}^{2}) = {&Integral;}_{0}^{l 2} {&Integral;}_{0}^{2 π} f (r, θ) (D_{4} \cos θ + E_{4} \cos θ + F_{4}) rdθdr,

其中，D₄＝2r(s₁-s₅)，E₄＝2r(t₁-t₅)，F₄＝r²+(s₁-s₅)²+(t₁-t₅)²；用户位置点e到聚类团簇的中心B的误差平方和期望为：

E_{2} ({| | B - e | |}^{2}) = {&Integral;}_{0}^{l 2} {&Integral;}_{0}^{2 π} f (r, θ) (D_{5} \cos θ + E_{5} \cos θ + F_{5}) rdθdr,

其中，D₅＝2r(s₂-s₅)，E₅＝2r(t₂-t₅)，F₅＝r²+(s₂-s₅)²+(t₂-t₅)²；用户位置点f到聚类团簇的中心B的误差平方和期望为：

E_{2} ({| | B - f | |}^{2}) = {&Integral;}_{0}^{l 3} {&Integral;}_{0}^{2 π} f (r, θ) (D_{6} \cos θ + E_{6} \cos θ + F_{6}) rdθdr,

其中，D₆＝2r(s₃-s₅)，E₆＝2r(t₃-t₅)，F₆＝r²+(s₃-s₅)²+(t₃-t₅)²；户位置点g到聚类团簇的中心B的误差平方和期望为：

E_{2} ({| | B - g | |}^{2}) = {&Integral;}_{0}^{l 4} {&Integral;}_{0}^{2 π} f (r, θ) (D_{7} \cos θ + E_{7} \cos θ + F_{7}) rdθdr,

其中，D₇＝2r(s₄-s₅)，E₇＝2r(t₄-t₅)，F₇＝r²+(s₄-s₅)²+(t₄-t₅)²；将以B为聚类团簇的中心的聚类团簇内的所有用户位置点到聚类团簇的中心B的误差平方和期望相加，得到第二误差平方和期望为E₂(||B-d||²)+E₂(||B-e||²)+E₂(||B-f||²)+E₂(||B-g||²)。

第四步，根据每个聚类团簇的第一误差平方和期望和第二误差平方和期望确定用户频繁位置点。

具体地，根据每个聚类团簇的第一误差平方和期望和第二误差平方和期望确定用户频繁位置点，包括但不限于：

例2，将聚类团簇1内的所有用户位置点到对应的聚类中心的误差平方和期望相加得到的第一误差平方和期望为5，将聚类团簇1内的所有用户位置点到对应的聚类团簇的中心的误差平方和期望相加得到的第二误差平方和期望为8。由于第一误差平方和期望5小于第二误差平方和期望8，则将聚类团簇1设定的聚类中心作为用户频繁位置点。

进一步地，在比较每个聚类团簇的第一误差平方和期望和第二误差平方和期望的大小之后，若每个聚类团簇的第一误差平方和期望大于第二误差平方和期望，本实施例提供的方法还将以每个聚类团簇的中心作为新的聚类中心，并计算各个用户位置点到新的聚类中心的距离，进而将到新的聚类中心中距离最小的用户位置点组成更新的聚类团簇，并获取更新的聚类团簇的中心。计算更新的聚类团簇内的每个用户位置点到对应的更新的聚类中心的误差平方和期望，并将每个聚类团簇内的所有用户位置点到对应的更新的聚类中心的误差平方和期望相加，得到第三误差平方和期望。计算更新的聚类团簇内的每个用户位置点到对应的更新的聚类团簇的中心的误差平方和期望，并将每个聚类团簇内的所有用户位置点到对应的更新的聚类团簇的中心的误差平方和期望相加，得到第四误差平方和期望。比较第三误差平方和期望和第四误差平方和期望的大小，若第三误差平方和期望小于第四误差平方和期望，则将更新的聚类中心作为用户频繁位置点，若第三误差平方和期望大于第四误差平方和期望，则将更新的聚类团簇的中心作为最新的聚类中心，并按照处理新的聚类中心得到更新的聚类中心的方式处理更新的聚类中心，依次循环，直至聚类团簇内的每个用户位置点到团簇内处理前的聚类中心和处理后的聚类中心的误差平方和期望不变，此时可将误差平方和期望不变的聚类中心作为用户频繁位置点。

第二、根据用户频繁位置点确定用户频繁行动路径；

在得到用户频繁位置点之后，可采用MPR(Most Popular Route，最流行路径)方法对相邻的用户频繁位置点进行路径搜索，得到用户频繁行动路径。以图5为例，通过对各个用户位置点进行聚类，得到的用户频繁位置点为A、B和C，在采用MPR方法对相邻的用户频繁位置点进行路径搜索，可得到用户频繁行动路径1和用户频繁行动路径2。

第三、获取得的所有用户频繁行动路径，得到包括所有用户频繁行动路径的用户频繁行动路径集。

在得到用户频繁行动路径之后，将得到的用户频繁行动路径组成一个集合，即可得到包括所有用户频繁行动路径的用户频繁行动路径集。仍以上述图5为例，通过采用MPR方法对用户频繁位置点进行路径搜索，得到的用户频繁行动路径为：用户频繁行动路径1和用户频繁行动路径2，将得到的用户频繁行动路径组成一个集合，可得到包含用户频繁行动路径1和用户频繁行动路径2的用户频繁行动路径集。

303：获取至少包含一个用户位置点的待修正的用户行动轨迹。

关于获取待修正的用户行动轨迹的方法，包括但不限于：当通信设备与移动终端进行通信时，通过通信设备采集移动终端侧用户的位置数据，并根据采集到的用户位置数据在道路网络中获取用户位置点，根据获取到的用户位置点生成用户行动轨迹，并获取生成的用户行动轨迹，将获取到的用户行动轨迹作为待修正的用户行动轨迹。

需要说明的是，本实施例提供的方法是通过确定用户潜在行动路径集、用户潜在路点集、用户频繁行动路径集对获取到的待修正的用户行动轨迹进行修正的，因此，不对确定用户潜在行动路径集、用户潜在路点集、用户频繁行动路径集以及获取待修正的用户行动轨迹的先后顺序进行限定，此处仅以先确定用户潜在行动路径集、用户潜在路点，再确定用户频繁行动路径集，最后获取待修正的用户行动轨迹为例进行说明。

304：根据用户潜在路点集、用户潜在行动路径集及用户频繁行动路径集确定待修正的用户行动轨迹中每个用户位置点的映射概率。

其中，映射概率为将待修正的用户行动轨迹中每个用户位置点映射到对应的每个用户潜在路点上的概率。

具体地，根据用户潜在路点集、用户潜在行动路径集及用户频繁行动路径集确定待修正的用户行动轨迹中每个用户位置点的映射概率，包括但不限于如下步骤：

第一步，在用户行动轨迹中任意选取一个用户位置点，计算被选用户位置点到被选用户位置点对应的任一用户潜在路点之间的距离，并根据距离确定被选用户位置点对应的任一用户潜在路点的正态分布概率；

在用户行动轨迹中任意选取一个用户位置点之后，获取被选用户位置点相邻的用户潜在行动路径，并获取被选用户位置点在用户潜在行动路径上的用户潜在路点，进而计算被选用户位置点到被选用户位置点对应的任一用户潜在路点之间的距离。由计算出的被选用户位置点到被选用户位置点对应的任一用户潜在路点之间的距离可以得出，被选用户位置点到被选用户位置点对应的任一用户潜在路点的距离服从正态分布，因此，根据被选用户位置点到被选用户位置点对应的任一用户潜在路点的距离可以确定被选用户位置点对应的任一用户潜在路点的正态分布概率。以被选用户位置点为p_i，被选用户位置点p_i的第j个用户潜在路点为，则被选用户位置点p_i对应的用户潜在路点的正态分布概率为：其中，为被选用户位置点p_i与用户潜在路点之间的最短距离，σ表示标准方差，μ为期望。

第二步，确定被选用户位置点对应的任一用户潜在路点的移动方向和道路的夹角；

第三步，根据用户频繁行动路径集计算被选用户位置点对应的任一用户潜在路点的流行度；

其中，流行度又称为频繁度，流行度为被选用户位置点对应的任一用户潜在路点所在的用户潜在行动路径的数量与用户频繁行动路径集中包含的路径数量的比值。关于根据用户频繁行动路径集计算被选用户位置点对应的任一用户潜在路点的流行度的方法，包括但不限于：获取被选用户位置点对应的用户潜在路点所在的用户潜在行动路径，并获取用户频繁行动路径集中的路径，计算被选用户位置点对应的任一用户潜在位置点所在的用户潜在行动路径的数量与用户频繁行动路径集中包含的路径数量的比值，该比值即为被选用户位置点对应的任一用户潜在路点的流行度。例如，在用户行动轨迹被选集中获取到被选用户位置点对应的任一用户潜在路点所在的用户潜在行动路径为1条，用户频繁行动路径集中包含的路径为10条，则被选用户位置点对应的任一用户潜在路点的流行度为：1/10＝0.1。

第四步，根据被选用户位置点对应的任一用户潜在路点的正态分布概率、被选用户位置点对应的任一用户潜在路点的移动方向和道路的夹角以及被选用户位置点对应的任一用户潜在路点的流行度确定待修正的用户行动轨迹中被选用户位置点的映射概率。

具体地，根据被选用户位置点对应的任一用户潜在路点的正态分布概率、被选用户位置点对应的任一用户潜在路点的移动方向和道路的夹角以及被选用户位置点对应的任一用户潜在路点的流行度确定待修正的用户行动轨迹中被选用户位置点的映射概率，包括但不限于：

按照如下公式根据被选用户位置点对应的任一用户潜在路点的正态分布概率、被选用户位置点对应的任一潜在路点的移动方向和道路的夹角以及被选用户位置点对应的任一用户潜在路点的流行度确定待修正的用户行动轨迹中被选用户位置点的映射概率：

Φ (c_{i}^{j}) = ω_{1} \cdot N (c_{i}^{j}) + ω_{2} \cdot \cos θ + ω_{3} \cdot popularity (c_{i}^{j})

其中，为待修正的用户行动轨迹中被选用户位置点P_i的第j个用户潜在路点，为P_i映射到点的映射概率，为的正态分布概率，θ为的移动方向和道路夹角，为的流行度，ω₁＝e^-Δt,ω₁+ω₂+ω₃＝1，Δt为相邻用户位置点间的时间间隔。

第四步，按照处理被选用户位置点的方式处理待修正的用户行动轨迹中的每个用户位置点，得到待修正的用户行动轨迹中每个用户位置点的映射概率。

305：根据用户潜在路点集、用户潜在行动路径集、用户频繁行动路径集及映射概率确定待修正的用户行动轨迹中任意两个用户位置点间的迁移概率。

其中，迁移概率为将待修正的用户行动轨迹中的任意两个用户位置点中前一个用户位置点对应的用户潜在路点迁移到后一个用户位置点对应的用户潜在路点上的概率。由于用户在行动时具有一定的方向性，移动终端在与通信设备进行通信时，通信设备采集到的用户位置数据也具有先后顺序，因此，本实施例中在计算待修正的用户行动轨迹任意两个用户位置点间的迁移概率时，所计算的迁移概率为将待修正的用户行动轨迹中前一个用户位置点对应的用户潜在路点迁移到后一个用户位置点对应的用户潜在路点上的概率。

具体地，根据用户潜在路点集、用户潜在行动路径集及用户频繁行动路径集确定待修正的用户行动轨迹中任意两个用户位置点间的迁移概率，包括但不限于：

第一步，在待修正的用户行动轨迹中选取任意两个用户位置点，根据用户潜在路点集、用户潜在行动路径集及映射概率计算选取的任意两个用户位置点的空间迁移概率因子，并根据用户潜在路点集和用户潜在行动路径集计算选取的任意两个用户位置点的时间迁移概率因子；

在根据用户潜在路点、用户潜在行动路径集及映射概率计算选取的任一两个用户位置点的空间迁移概率因子时，以在待修正的用户行动轨迹中选取第i-1个用户位置点和第i个用户位置点，并选取第i-1个用户位置点的第t个用户潜在路点以及选取第i个用户位置点的第s个用户潜在路点为例。具体地，根据用户潜在路点集、用户潜在行动路径集及迁移概率计算出的将第i-1个用户位置点的第t个用户潜在路点迁移到第i个用户位置点的第s个用户潜在路点的空间迁移概率为：

F_{s} (c_{i - 1}^{t} &RightArrow; c_{i}^{s}) = Φ (c_{i}^{s}) * V (c_{i - 1}^{t} &RightArrow; c_{i}^{s}), 2 \leq i \leq n,

其中，为将第i个用户位置点映射到第i个用户位置点的第s个用户潜在路点上的映射概率，且d_i-1→i表示第i-1个用户位置点和第i个用户位置点之间的欧几里得距离，w_{(i-1,t)→(i,s)}表示和之间的最频繁路径的距离。

在根据用户潜在行动路径集和用户潜在路点集计算选取的任一两个用户位置点的时间迁移概率因子时，仍以在待修正的用户行动轨迹中选取第i-1个用户位置点和第i个用户位置点，并选取第i-1个用户位置点的第t个用户潜在路点以及选取第i个用户位置点的第s个用户潜在路点为例。具体地，计算出的将第i-1个用户位置点的第t个用户潜在路点迁移到第i个用户位置点的第s个用户潜在路点的时间迁移概率为：

F_{t} (t_{i - 1}^{t} &RightArrow; c_{i}^{s}) = \frac{Σ_{u = 1}^{k} (e_{u}^{'} \cdot v \times {\overset{&OverBar;}{v}}_{(i - 1, t) &RightArrow; (i, s)})}{\sqrt{Σ_{u = 1}^{k} {(e_{u}^{'} \cdot v)}^{2}} \times \sqrt{Σ_{u = 1}^{k} {\overset{&OverBar;}{v}}_{(i - 1, t) &RightArrow; (i, s)}^{2}}},

其中，表示和在和之间的最频繁路径上的平均速度。

第二步，计算选取的任意两个用户位置点在用户频繁行动路径集中相邻路段上的流行度；

关于计算选取的任意两个用户位置点在用户频繁行动路径集中相邻路段上的流行度的方式，包括但不限于：获取任意两个用户位置点对应的用户潜在路点所在的用户潜在行动路径，并获取用户频繁行动路径集中的包含的路径，计算任意两个用户位置点对应的用户潜在路点所在的用户潜在行动路径的数量与用户频繁行动路径集中包含的路径数量的比值，该比值即为选取的任意两个用户位置点在用户频繁行动路径集中相邻路段上的流行度。例如，获取到任意两个用户位置点对应的用户潜在路点所在的用户潜在行动路径为5条，用户频繁行动路径集中包含的路径为20条，则选取的任意两个用户位置点在用户频繁行动路径集中相邻路段上的流行度为：5/20＝0.25。

第三步，根据空间迁移概率因子、时间迁移概率因子及流行度确定待修正的用户行动轨迹中任意两个用户位置点间的迁移概率。

具体地，根据空间迁移概率因子、时间迁移概率因子及流行度确定待修正的用户行动轨迹中任意两个用户位置点间的迁移概率，包括但不限于：

按照如下公式根据空间迁移概率因子、时间迁移概率因子以及流行度确定待修正的用户行动轨迹中任意两个用户位置点间迁移概率：

(c_{i - 1}^{t} &RightArrow; c_{i}^{s}) = F_{s} (c_{i - 1}^{t} &RightArrow; c_{i}^{s}) * F_{t} (c_{i - 1}^{t} &RightArrow; c_{i}^{s}), 2 \leq i \leq n

其中，和为待修正的用户行动轨迹中任意两个用户位置点对应的用户潜在路点，为待修正的用户行动轨迹中将迁移到上的迁移概率，为将迁移到上的空间迁移概率因子，为将迁移到上的时间概率迁移因子，为和的流行度。

306：根据迁移概率确定待修正的用户行动轨迹对应的候选路径集合，在候选路径集合中选取最优路径，并将最优路径确定为用户的行动轨迹。

基于上述步骤304中计算出待修正的用户行动轨迹中任意两个用户位置点间的迁移概率，本步骤将根据待修正的用户行动轨迹中任意两个用户位置点间的迁移概率确定待修正的用户行动轨迹对应的候选映射集合。其中，候选路径集合中至少包含一条候选路径。

具体地，在根据待修正的用户行动轨迹中任意两个用户位置点间的迁移概率确定待修正的用户行动轨迹对应的候选路径集合时，首先获取任意两个用户位置点对应的每个用户潜在路点之间的迁移概率，并获取迁移概率达到第一预设阈值的任意两个用户位置点对应的用户潜在路点，将多个达到第一预设阈值的任意两个用户位置点对应的用户潜在路点相连组成候选路径，并获取得到的所有候选路径，得到至少包括一条候选路径的待修正的用户行动轨迹对应的候选路径集合。其中，第一预设阈值可以为1/3、1/2等，本实施例不对第一预设阈值作具体的限定

对于上述过程，为了便于理解，下面将以图6为例进行详细地解释说明。

参见图6，设定第一预设阈值为1/4。由图6可知，用户位置点P₁对应的用户潜在路点为和用户位置点P₂对应的用户潜在路点为和用户位置点P_n对应的用户潜在路点为和若获取到和之间的迁移概率为1/3，获取到和之间的迁移概率为1/5，获取到和之间的迁移概率为1/6，获取到和之间的迁移概率为1/7，和之间的迁移概率为1/2,和之间的迁移概率为1/10…….,进而确定出用户行动轨迹对应的候选路径集合为等。

进一步地，在候选路径集合中选取最优路径之后，本实施例提供的方法还将计算每条候选路径的总评分，并将总评分最大的候选路径作为最优路径。具体地，计算每条候选路径的总评分，包括但不限于：

按照如下公式计算每条候选路径的总评分：

F = (P_{c}) = Σ_{i = 1}^{n} F (c_{i - 1}^{s_{i - 1}} &RightArrow; c_{i}^{s_{i}})

其中，F(P_c)为P_c的总评分，P_c为候选路径集合中的任意一条候选路径，和为组成候选路径P_c的任意两个相邻的用户潜在路点，为将迁移到上的迁移概率。具体地，在计算每条候选路径的总评分时，先获取组成每条候选路径的任意两个相邻用户潜在路点间的迁移概率，并将获取到的所有用户潜在路点间的迁移概率相加，得到该条候选路径的总评分。例如，候选路径为若之间的迁移概率为1/4,之间的迁移概率为1/3，……..，之间的迁移概率为1/2，则候选路径的总评分为1/4+1/3……..+1/2。

需要说明的是，在进行最优路径搜索时，可基于图广度、图深度优先或者动态规划方法进行最优路径搜索。

进一步地，在对待修正的用户行动轨迹进行修正得到用户的行动路径之后，本实施例提供的方法还将得到的用户行动路径发送至用户的终端显示界面进行显示，以为用户提供导航帮助。

参见图7，本发明实施例提供了一种确定用户行动轨迹的装置，该装置用于执行上述图2或图3所示的实施例中任一实施例所述的确定用户行动轨迹的方法，该装置包括：

第一获取模块701，用于获取至少包含一个用户位置点的待修正的用户行动轨迹；

第一确定模块702，用于根据用户潜在路点集、用户潜在行动路径集及用户频繁行动路径集确定待修正的用户行动轨迹中每个用户位置点的映射概率，用户潜在路点集为由用户的所有历史位置点映射在相邻的道路网格上的映射点组成的集合，用户潜在行动路径集为由每个用户潜在路点所在的道路网格组成的集合，用户频繁行动路径集为由至少一条用户历史频繁行动路径组成的集合，映射概率为将待修正的用户行动轨迹中每个用户位置点映射到用户位置点对应的用户潜在路点上的概率；

第二确定模块703，用于根据用户潜在路点集、用户潜在行动路径集、用户频繁行动路径集及映射概率确定待修正的用户行动轨迹中任意两个用户位置点间的迁移概率，迁移概率为将待修正的用户行动轨迹中的任意两个用户位置点中前一个用户位置点对应的用户潜在路点迁移到后一个用户位置点对应的用户潜在路点上的概率；

第三确定模块704，用于根据迁移概率确定待修正的用户行动轨迹对应的候选路径集合，候选路径集合中至少包含一条候选路径；

选取模块705，用于在候选路径集合中选取最优路径，并将最优路径确定为用户行动轨迹。

作为一种可选的实施例，该装置还包括：

第二获取模块，用于获取道路网格数据；

构建模块，用于根据道路网格数据构建道路网络；

第四确定模块，用于确定道路网络中与筛选后的位置数据对应的用户位置点；

映射模块，用于将每个用户位置点映射到道路网络中相邻的道路网格上，并将每个用户位置点在相邻的道路网格上的映射点作为用户潜在路点；

第三获取模块，用于获取得到的所有用户潜在路点，得到包括所有用户潜在路点的用户潜在路点集；

作为一种可选的实施例，该装置还包括：

第五确定模块，用于根据用户频繁位置点确定用户频繁行动路径；

作为一种可选的实施例，聚类模块，包括：

设定单元，用于设定预设数量个聚类中心；

第一确定单元，用于根据预设数量个聚类中心及各个用户位置点确定预设数量个聚类团簇；

获取单元，用于获取每个聚类团簇的中心；

第一计算单元，用于计算每个聚类团簇内的每个用户位置点到对应的聚类中心的误差平方和期望，并将每个聚类团簇内的所有用户的位置点到对应的聚类中心的误差平方和期望相加，得到第一误差平方和期望；

作为一种可选的实施例，第一确定单元，用于计算每个用户位置点到各个聚类中心的距离，并根据每个用户位置点到各个聚类中心的距离确定每个用户位置点对应的聚类中心；将对应同一个聚类中心的用户位置点组成一个聚类团簇，得到预设数量个聚类团簇。

作为一种可选的实施例，第二确定单元，用于比较每个聚类团簇的第一误差平方和期望和第二误差平方和期望的大小；当每个聚类团簇的第一误差平方和期望小于第二误差平方和期望时，将每个团簇设定的聚类中心作为用户频繁位置点。

作为一种可选的实施例，第二确定单元，还用于当每个聚类团簇的第一误差平方和期望大于第二误差平方和期望时，将每个聚类团簇的中心作为新的聚类中心，并按照处理设定的聚类中心得到新的聚类中心的方式处理新的聚类中心，依次循环，直至聚类团簇内的每个用户位置点到团簇内处理前的聚类中心和处理后的聚类中心的误差平方和期望不变，将误差平方和期望不变的聚类中心作为用户频繁位置点。

作为一种可选的实施例，第一确定模块，包括：

选取单元，用于在用户行动轨迹中任意选取一点；

第一计算单元，用于计算被选用户位置点到被选用户位置点对应的任一用户潜在路点之间的距离；

第一确定单元，用于根据距离确定被选用户位置点对应的任一用户潜在路点正态分布概率；

第二确定单元，用于确定被选用户位置点对应的任一用户潜在路点的移动方向和道路的夹角；

第二计算单元，用于根据用户频繁行动路径集计算被选用户位置点对应的任一用户潜在路点的流行度，流行度为被选用户位置点对应的任一用户潜在路点所在的用户潜在行动路径的数量与用户频繁行动路径集中包含的所有路径的数量的比值；

第三确定单元，用于根据被选用户位置点对应的任一用户潜在路点的正态分布概率、被选用户位置点对应的任一用户潜在路点的移动方向和道路的夹角以及被选用户位置点对应的任一用户潜在路点的流行度确定待修正的用户行动轨迹中被选用户位置点的映射概率；按照处理被选用户位置点的方式处理待修正的用户行动轨迹中的每个用户位置点，得到待修正的用户行动轨迹中每个用户位置点的映射概率。

作为一种可选的实施例，第二确定模块，包括：

选取单元，用于在待修正的用户行动轨迹中选取任意两个用户位置点；

第一计算单元，用于根据用户潜在路点集、用户潜在行动路径集及映射概率计算选取的任意两个用户位置点的空间迁移概率因子，并根据用户潜在路点集和用户潜在行动路径集计算选取的任意两个用户位置点的时间迁移概率因子；

第二计算单元，用于计算选取的任意两个用户位置点在用户频繁行动路径集中相邻路段上的流行度；

确定单元，用于根据空间迁移概率因子、时间迁移概率因子及流行度确定待修正的用户行动轨迹中任意两个用户位置点间的迁移概率。

作为一种可选的实施例，选取模块，用于计算每条候选路径的总评分，并将总评分最大的候选路径作为最优路径。

作为一种可选的实施例，选取模块用于按照如下公式计算每条候选路径的总评分：

F = (P_{c}) = Σ_{i = 1}^{n} F (c_{i - 1}^{s_{i - 1}} &RightArrow; c_{i}^{s_{i}})

综上，本发明实施例提供的装置，通过获取待修正的用户行动轨迹，确定出待修正的用户行动轨迹中每个用户位置点的映射概率，并根据映射概率确定出待修正的用户行动轨迹中任意两个用户位置点间的迁移概率，进而根据迁移概率确定出待修正的用户行动轨迹对应的候选路径集合，从而在确定出的候选路径集合中选取一条最优路径，该最优路径即为确定的用户行动轨迹。由于迁移概率可以反应出待修正的用户行动轨迹中前一个用户位置点对应的用户潜在路点迁移到后一个用户位置点对应的潜在路点上的概率，迁移概率越大，表明由前一个用户位置点对应的用户潜在路点及后一个用户位置点对应的用户潜在路点组成的轨迹越有可能为用户的行动轨迹，因此，提高了确定的用户行动轨迹的精度。

图8是本发明实施例提供的一种确定用户行动轨迹的系统架构图，该系统用于执行上述图2或图3所示的实施例中任一实施例所述的确定用户行动轨迹的方法。该系统由设备层、平台层、数据层和应用层组成。本发明实施例不对设备层中的设备作具体的限定，满足运算能力需求即可。具体应用时，包括但不限于多节点集群、单节点服务器设备、移动设备等。另外，平台层可以为Hadoop、Spark等，本实施例不对平台层作具体的限定，满足实际运算需求的计算机平台均可。数据层中存储的数据包括但不限于用户的位置数据、地图数据及用户行动轨迹数据等，本实施例不对数据层中存储的数据作具体的限定。应用层主要由具有不同处理功能的逻辑单元组成，包括但不限于：预处理单元、概率计算单元、候选路径图构建单元、最优路径计算单元、用户界面及任务调度管理单元等。其中，数据筛选单元和预处理计算单元用于结合地图数据对用户的位置数据进行处理，生成用户潜在路点集、用户潜在行动路径集和用户频繁行动路径集，供后续的位置轨迹拟合使用，具体参见上述步骤301和302。概率计算单元用于根据用户潜在路点集、用户潜在行动路径集和用户频繁行动路径集计算待修正的用户行动轨迹的映射概率及迁移概率，具体参见上述步骤304和305。候选路径图构建单元和最优路径计算单元用于结合待修正的用户行动轨迹的迁移概率及该修正的用户行动轨迹构造候选路径图，并采用最优路径算法，生成修正后的用户行动轨迹，具体参见上述步骤306。任务调度管理单元用于调度各计算单元对数据进行处理，具体参见上述步骤301至306。用户界面用于提供数据操作和展示的用户界面接口，具体参见上述步骤306。

结合上述图8，本实施例还提供了一种确定用户行动轨迹的装置，参见图9，该装置包括：处理器901和存储器902。

其中，存储器902用于存储处理器901执行的指令；

具体地，处理器901所执行的功能与上述图8中预处理单元所执行的功能相同，用于获取至少包含一个用户位置点的待修正的用户行动轨迹；

处理器901所执行的功能与上述图8中概率计算单元所执行的功能相同，用于根据用户潜在路点集、用户潜在行动路径集及用户频繁行动路径集确定待修正的用户行动轨迹中每个用户位置点的映射概率，用户潜在路点集为由用户的所有历史位置点映射在相邻的道路网格上的映射点组成的集合，用户潜在行动路径集为由每个用户潜在路点所在的道路网格组成的集合，用户频繁行动路径集为由至少一条用户历史频繁行动路径组成的集合，映射概率为将待修正的用户行动轨迹上的每个用户位置点映射到用户位置点对应的用户潜在路点上的概率；还用于根据用户潜在路点集、用户潜在行动路径集、用户频繁行动路径集及映射概率确定待修正的用户行动轨迹中任意两个用户位置点间的迁移概率，迁移概率为将待修正的用户行动轨迹中的任意两个用户位置点中前一个用户位置点对应的用户潜在路点迁移到后一个用户位置点对应的用户潜在路点上的概率；

处理器901所执行的功能与上述图8中候选路径图构造单元所执行的功能相同，用于根据迁移概率确定待修正的用户行动轨迹对应的候选路径集合，候选路径集合中至少包含一条候选路径；

处理器901所执行的功能与图8中最优路径计算单元所执行的功能相同，用于在候选路径集合中选取最优路径，并将最优路径确定为用户的行动轨迹。

作为一种可选的实施例，处理器901所执行的功能与图8中的预处理单元所执行的功能相同，还用于对多次收集到的用户的历史位置数据进行筛选，得到筛选后的位置数据；获取道路网格数据，并根据道路网格数据构建道路网络；确定道路网络中与筛选后的位置数据对应的用户位置点；将每个用户位置点映射到道路网络中相邻的道路网格上，并将每个用户位置点在相邻的道路网格上的映射点作为用户潜在路点；获取得到的所有用户潜在路点，得到包括所有用户潜在路点的用户潜在路点集；将每个用户潜在路点所在的道路网格作为用户潜在行动路径，获取得到的所有用户潜在行动路径，得到包括所有用户潜在行动路径的用户潜在行动路径集。

作为一种可选的实施例，处理器901所执行的功能与图8中的预处理单元所执行的功能相同，还用于对各个用户位置点进行聚类，得到用户频繁位置点；根据用户频繁位置点确定用户频繁行动路径；获取得到的所有用户频繁行动路径，得到包括所有用户频繁行动路径的用户频繁行动路径集。

作为一种可选的实施例，处理器901所执行的功能与图8中的预处理单元所执行的功能相同，还用于设定预设数量个聚类中心，根据预设数量个聚类中心及各个用户位置点确定预设数量个聚类团簇，并获取每个聚类团簇的中心；计算每个聚类团簇内的每个用户位置点到对应的聚类中心的误差平方和期望，并将每个聚类团簇内的所有用户位置点到对应的聚类中心的误差平方和期望相加，得到第一误差平方和期望；计算每个聚类团簇内的每个用户位置点到对应的聚类团簇的中心的误差平方和期望，并将每个聚类团簇内的所有用户位置点到对应的聚类团簇的中心的误差平方和期望相加，得到第二误差平方和期望；根据每个聚类团簇的第一误差平方和期望和第二误差平方和期望确定用户频繁位置点。

作为一种可选的实施例，处理器901所执行的功能与图8中的预处理单元所执行的功能相同，还用于计算每个用户位置点到各个聚类中心的距离，并根据每个用户位置点到各个聚类中心的距离确定每个用户位置点对应的聚类中心；将对应同一个聚类中心的用户位置点组成一个聚类团簇，得到预设数量个聚类团簇。

作为一种可选的实施例，处理器901所执行的功能与图8中的预处理单元所执行的功能相同，还用于比较每个聚类团簇的第一误差平方和期望和第二误差平方和期望的大小；当每个聚类团簇的第一误差平方和期望小于第二误差平方和期望时，将每个团簇设定的聚类中心作为用户频繁位置点。

作为一种可选的实施例，处理器901所执行的功能与图8中的预处理单元所执行的功能相同，还用于当每个聚类团簇的第一误差平方和期望大于第二误差平方和期望时，将每个聚类团簇的中心作为新的聚类中心，并按照处理设定的聚类中心得到新的聚类中心的方式处理新的聚类中心，依次循环，直至聚类团簇内的每个用户位置点到团簇内处理前的聚类中心和处理后的聚类中心的误差平方和期望不变，将误差平方和期望不变的聚类中心作为用户频繁位置点。

作为一种可选的实施例，处理器901所执行的功能与图8中的概率计算单元所执行的功能相同，还用于在用户行动轨迹中任意选取一点，计算被选用户位置点到被选用户位置点对应的任一用户潜在路点之间的距离，并根据距离确定被选用户位置点对应的任一用户潜在路点的正态分布概率；确定被选用户位置点对应的任一用户潜在路点的移动方向和道路的夹角；根据用户频繁行动路径集计算被选用户位置点对应的任一用户潜在路点的流行度，流行度为被选用户位置点对应的任一用户潜在路点所在的用户潜在行动路径与用户频繁行动路径集中包含的所有路径的比值；根据被选用户位置点对应的任一用户潜在路点的正态分布概率、被选用户位置点对应的任一用户潜在路点的移动方向和道路的夹角以及被选用户位置点对应的任一用户潜在路点的流行度确定待修正的用户行动轨迹中被选用户位置点的映射概率；按照处理被选用户位置点的方式处理待修正的用户行动轨迹中的每个用户位置点，得到待修正的用户行动轨迹中每个用户位置点的映射概率。

作为一种可选的实施例，处理器901所执行的功能与图8中的概率计算单元所执行的功能相同，还用于在待修正的用户行动轨迹中选取任意两个用户位置点，根据用户潜在路点集、用户潜在行动路径集及映射概率计算选取的任意两个用户位置点的空间迁移概率因子，并根据用户潜在路点集和用户潜在行动路径集计算选取的任意两个用户位置点的时间迁移概率因子；计算选取的任意两个用户位置点在用户频繁行动路径集中相邻路段上的流行度；根据空间迁移概率因子、时间迁移概率因子及流行度确定待修正的用户行动轨迹中任意两个用户位置点间的迁移概率。

作为一种可选的实施例，处理器901所执行的功能与图8中的候选路径图构建单元和最优路径计算单元所执行的功能相同，还用于计算每条候选路径的总评分，并将总评分最大的候选路径作为最优路径。

作为一种可选的实施例，处理器901所执行的功能与图8中的最优路径计算单元所执行的功能相同，还用于按照如下公式计算每条候选路径的总评分：

F = (P_{c}) = Σ_{i = 1}^{n} F (c_{i - 1}^{s_{i - 1}} &RightArrow; c_{i}^{s_{i}})

本发明实施例提供的装置，通过获取待修正的用户行动轨迹，确定出待修正的用户行动轨迹中每个用户位置点的映射概率，并根据映射概率确定出待修正的用户行动轨迹中任意两个用户位置点间的迁移概率，进而根据迁移概率确定出待修正的用户行动轨迹对应的候选路径集合，从而在确定出的候选路径集合中选取一条最优路径，该最优路径即为确定的用户行动轨迹。由于迁移概率可以反应出待修正的用户行动轨迹中前一个用户位置点对应的用户潜在路点迁移到后一个用户位置点对应的潜在路点上的概率，迁移概率越大，表明由前一个用户位置点对应的用户潜在路点及后一个用户位置点对应的用户潜在路点组成的轨迹越有可能为用户的行动轨迹，因此，提高了确定的用户行动轨迹的精度。

需要说明的是：上述实施例提供的确定用户行为轨迹的装置在确定用户行为轨迹时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将确定用户行为轨迹的装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的确定用户行为轨迹的装置及确定用户行为轨迹的方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种确定用户行动轨迹的方法，其特征在于，所述方法包括：

获取至少包含一个用户位置点的待修正的用户行动轨迹；

根据用户潜在路点集、用户潜在行动路径集及用户频繁行动路径集确定所述待修正的用户行动轨迹中每个用户位置点的映射概率，所述用户潜在路点集为由用户的所有历史位置点映射在相邻的道路网格上的映射点组成的集合，所述用户潜在行动路径集为由每个用户潜在路点所在的道路网格组成的集合，所述用户频繁行动路径集为由至少一条用户历史频繁行动路径组成的集合，所述映射概率为将所述待修正的用户行动轨迹中每个用户位置点映射到对应的每个用户潜在路点上的概率；

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

将每个用户位置点映射到所述道路网络中相邻的道路网格上，并将每个用户位置点在相邻的道路网格上的映射点作为用户潜在路点，进而得到包括多个用户潜在路点的用户潜在路点集；

将每个用户潜在路点所在的道路网格作为用户潜在行动路径，进而得到包括多条用户潜在行动路径的用户潜在行动路径集。

3.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：

对各个用户位置点进行聚类，得到用户频繁位置点；

根据所述用户频繁位置点确定用户频繁行动路径，进而得到包括所有多条频繁行动路径的用户频繁行动路径集。

4.根据权利要求3所述的方法，其特征在于，所述对各个用户位置点进行聚类，得到用户频繁位置点，包括：

5.根据权利要求4所述的方法，其特征在于，所述根据预设数量个聚类中心及各个用户位置点确定预设数量个聚类团簇，包括：

6.根据权利要求4所述的方法，其特征在于，所述根据每个聚类团簇的第一误差平方和期望和第二误差平方和期望确定用户频繁位置点，包括：

7.根据权利要求6所述的方法，其特征在于，所述比较每个聚类团簇的第一误差平方和期望和第二误差平方和期望的大小之后，还包括：

8.根据权利要求1至7中任一权利要求所述的方法，其特征在于，所述根据用户潜在路点集、用户潜在行动路径集及用户频繁行动路径集确定所述待修正的用户行动轨迹中每个用户位置点的映射概率，包括：

9.根据权利要求1至8中任一权利要求所述的方法，其特征在于，所述根据所述用户潜在路点集、所述用户潜在行动路径集、所述用户频繁行动路径集及所述映射概率确定所述待修正的用户行动轨迹中任意两个用户位置点间的迁移概率，包括：

10.根据权利要求1至9中任一权利要求所述的方法，其特征在于，所述在所述候选路径集合中选取最优路径，包括：

11.根据权利要求10所述的方法，其特征在于，所述计算每条候选路径的总评分，包括：

按照如下公式计算每条候选路径的总评分：

F = (P_{c}) = Σ_{i = 1}^{n} F (c_{i - 1}^{s_{i - 1}} &RightArrow; c_{i}^{s_{i}})

12.一种确定用户行动轨迹的装置，其特征在于，所述装置包括：

第一确定模块，用于根据用户潜在路点集、用户潜在行动路径集及用户频繁行动路径集确定所述待修正的用户行动轨迹中每个用户位置点的映射概率，所述用户潜在路点集为由用户的所有历史位置点映射在相邻的道路网格上的映射点组成的集合，所述用户潜在行动路径集为由每个用户潜在路点所在的道路网格组成的集合，所述用户频繁行动路径集为由至少一条用户历史频繁行动路径组成的集合，所述映射概率为将所述待修正的用户行动轨迹中每个用户位置点映射到对应的每个用户潜在路点上的概率；

选取模块，用于在所述候选路径集合中选取最优路径，并将所述最优路径确定为所述用户的行动轨迹。

13.根据权利要求12所述的装置，其特征在于，所述装置，还包括：

第二获取模块，用于获取道路网格数据；

构建模块，用于根据所述道路网格数据构建道路网络；

14.根据权利要求12或13所述的装置，其特征在于，所述装置，还包括：

15.根据权利要求14所述的装置，其特征在于，所述聚类模块，包括：

设定单元，用于设定预设数量个聚类中心；

获取单元，用于获取每个聚类团簇的中心；

16.根据权利要求15所述的装置，其特征在于，所述第一确定单元，用于计算每个用户位置点到各个聚类中心的距离，并根据每个用户位置点到各个聚类中心的距离确定每个用户位置点对应的聚类中心；将对应同一个聚类中心的用户位置点组成一个聚类团簇，得到预设数量个聚类团簇。

17.根据权利要求15所述的装置，其特征在于，所述第二确定单元，用于比较每个聚类团簇的第一误差平方和期望和第二误差平方和期望的大小；当每个聚类团簇的第一误差平方和期望小于第二误差平方和期望时，将每个团簇设定的聚类中心作为用户频繁位置点。

18.根据权利要求17所述的装置，其特征在于，所述第二确定单元，还用于当每个聚类团簇的第一误差平方和期望大于第二误差平方和期望时，将每个聚类团簇的中心作为新的聚类中心，并按照处理设定的聚类中心得到新的聚类中心的方式处理新的聚类中心，依次循环，直至聚类团簇内的每个用户位置点到团簇内处理前的聚类中心和处理后的聚类中心的误差平方和期望不变，将误差平方和期望不变的聚类中心作为用户频繁位置点。

19.根据权利要求12至18中任一权利要求所述的装置，其特征在于，所述第一确定模块，包括：

选取单元，用于在所述用户行动轨迹中任意选取一点；

20.根据权利要求12至19中任一权利要求所述的装置，其特征在于，所述第二确定模块，包括：

21.根据权利要求12至20中任一权利要求所述的装置，其特征在于，所述选取模块，用于计算每条候选路径的总评分，并将总评分最大的候选路径作为最优路径。

22.根据权利要求21所述的装置，其特征在于，所述选取模块，还用于按照如下公式计算每条候选路径的总评分：

F = (P_{c}) = Σ_{i = 1}^{n} F (c_{i - 1}^{s_{i - 1}} &RightArrow; c_{i}^{s_{i}})