CN108108808A

CN108108808A - 一种基于深度信念网络的位置预测方法及装置

Info

Publication number: CN108108808A
Application number: CN201810015984.9A
Authority: CN
Inventors: 廖青; 赵晶玲; 吴杰; 李妍
Original assignee: Beijing University of Posts and Telecommunications
Current assignee: Beijing University of Posts and Telecommunications
Priority date: 2018-01-08
Filing date: 2018-01-08
Publication date: 2018-06-01
Anticipated expiration: 2038-01-08
Also published as: CN108108808B

Abstract

本发明实施例提供了一种基于深度信念网络的位置预测方法及装置，涉及位置预测技术领域，解决了现有技术中只使用位置的坐标，利用马尔科夫模型进行位置预测，只使用位置的坐标这一个维度，所考虑的维度不够全面，影响预测位置的精确度的问题。其中基于深度信念网络的位置预测方法包括：将所述多个特征作为深度信念网络的输入，利用所述深度信念网络进行位置预测，将所述深度信念网络的输出值为1对应的神经元所预测的位置，预定为用户在所述兴趣点的位置之后，所要到达的位置；其中，所述深度信念网络为利用包括有与所述多个特征相同类型的特征的样本作为训练集，对深度信念网络进行训练得到的。这样可以提高预测位置的准确度。

Description

一种基于深度信念网络的位置预测方法及装置

技术领域

本发明涉及位置预测技术领域，特别是涉及一种基于深度信念网络的位置预测方法及装置。

背景技术

目前利用用户历史运动轨迹，对该历史运动轨迹之后的位置做出预测，以便基于地理位置为用户提供服务。比如，用户经常出现在健身房和运动场等地方，结合用户去健身房和运动场的频率及时间，可以推测该用户的运动习惯，然后可以预测出用户可能出现的位置，比如，操场。这样可以为用户提供从当前位置到操场的导航，或者推荐关于操场中的运动器械位置。

对于位置预测的问题，常见的方法是马尔科夫模型Markov Model，HMM(HiddenMarkov Model，隐马尔科夫模型)，或者前两者模型的混合预测模型，通过执行如下步骤，对位置进行预测。

首先，将已确定的GPS(global positioning system，全球定位系统)轨迹，该轨迹中包括有多个已确定位置，该一个已确定位置是由多个GPS点的坐标构成的集合。该集合T＝{P₁，P₂…P_n}表示，P₁为第1个GPS点，P₂为第2个GPS点，…，P_n为第n个GPS点，其中，P_n中n的取值为大于1的自然数。GPS点用三目元(lat，lng，time)表示。lat表示GPS点的经度，lng表示GPS点所记录的GPS点的纬度，time表示GPS点所记录的GPS点的时间。由经度和维度，确定所记录的GPS点的坐标；由记录的GPS点的时间是为了确定每个记录的GPS点的坐标之间的先后顺序。

然后，获取已确定的多个GPS点的坐标作为历史数据，将已确定的多个GPS点的坐标各自转换为状态；按照三目元中的时间，确定当前状态转移为相邻的下一状态的转移率：具体的，

对于马尔科夫模型是N阶模型，利用三目元的时间，得到当前第N个过程状态之前的前N-1个过程的所有状态；当前第N个过程状态仅依赖于前N-1个过程所对应的状态，经过前N-1个过程所对应的状态预测出的；N表示马尔科夫模型的阶数，N大于或等于2的自然数；

最终，将预测出的最大转移概率对应的状态，作为当前状态对应的已确定GPS点的坐标转移为相邻的下一状态，并将该下一状态对应的GPS点的坐标作为预测位置。

上述方法虽然能够实现对位置进行预测，然而，发明人在实现本发明的过程中发现，现有技术至少存在如下问题：

上述方法，将位置转换为状态，利用当前状态转移为相邻的下一状态的转移率，最终确定预测位置。也就是说，只使用位置的坐标，利用马尔科夫模型进行位置预测，只使用位置的坐标这一个维度，所考虑的维度不够全面，影响预测位置的精确度。

发明内容

本发明实施例的目的在于提供一种基于深度信念网络的位置预测方法及装置，以提高预测位置的准确度。具体技术方案如下：

第一方面，本发明实施例提供了一种基于深度信念网络的位置预测方法，包括：

获取用户兴趣点的位置对应的多个特征，所述多个特征至少包括：所述兴趣点的位置对应的唯一标识、所述兴趣点的位置的访问时间，在所述兴趣点的位置的停留时间、兴趣点对应的预设功能分区；所述兴趣点的位置由全球定位系统GPS轨迹中的驻足点，通过聚类得到的；所述驻足点为用户在任一位置停留时间超过预设阈值时间的位置；

将所述多个特征作为深度信念网络的输入，利用所述深度信念网络进行位置预测；其中，所述深度信念网络为利用包括有与所述多个特征相同类型的特征的样本作为训练集，对深度信念网络进行训练得到的；

将所述深度信念网络的输出值为1对应的神经元所预测的位置，预定为用户在所述兴趣点的位置之后，所要到达的位置。

进一步的，所述深度信念网络包括：多层显层及多层隐层，所述深度信念网络是通过如下步骤得到的：

将包括有与所述多个特征相同类型的特征的样本作为训练集训练底层显层的输入向量；

将底层显层的输出向量作为相邻的中间隐层的输入向量，训练该相邻的中间隐层；

将当前训练的中间隐层的输出向量作为相邻的下一层中间隐层的输入向量，训练该相邻的下一层中间隐层；

直至训练到预设层，将所述预设层的输出向量作为顶层显层的输入，随机初始化参数；

利用后向传播BP算法及初始化后的参数，从所述顶层显层回归到所述底层显层进行参数优化，得到已优化深度信念网络，其中，该参数包括：网络的权值参数；

将所述已优化深度信念网络作为所述深度信念网络。

进一步的，所述深度信念网络还包括受限波尔兹曼机RBM；所述显层具有显层神经元，所述隐层具有隐层神经元；所述显层神经元和所述隐层神经元之间的连接情况用权重矩阵表示：

其中，W表示权重矩阵；w_ij表示从第i个显层神经元到第j个隐层神经元的权重，i取值为1…a；a大于1的自然数，a代表显层神经元的总数；j的取值为1…b，b大于1的自然数，b代表隐层神经元的总数，w₁₁表示从第1个显层神经元到第1个隐层神经元的权重，w_a1表示从第a个显层神经元到第1个隐层神经元的权重，w_1b表示从第1个显层神经元到第b个隐层神经元的权重，w_ab表示从第a个显层神经元到第b个隐层神经元的权重；

在利用所述已优化的深度信念网络进行位置预测之前，所述方法还包括：

当用户兴趣点的位置对应的多个特征传递到显层时，由所述深度信念网络按照所述权重矩阵W中的权重值w_ij，开启或者关闭隐层神经元。

进一步的，所述获取用户兴趣点的位置对应的多个特征，包括：

获取GPS轨迹中的所有GPS点对应的数据；

对GPS轨迹中的所有GPS点对应的数据进行预处理，得到符合第一预设条件的GPS点对应的数据；

通过具有噪声的基于密度的聚类方法DBSCAN算法，在所述符合第一预设条件的GPS点对应的数据中，得到多个位置区域；

在所述多个位置区域中，确定出用户兴趣点的位置；

获取用户兴趣点的位置对应的多个特征。

进一步的，所述对GPS轨迹中的所有GPS点进行预处理，得到符合第一预设条件的GPS点对应的数据，包括：

将GPS轨迹中的所有GPS点对应的数据中，包括的与预设格式不同的GPS点对应的数据以及符合预设数据规则的GPS点对应的数据，确定为所有GPS点中的异常数据；

删除所有GPS点中的异常数据，将删除所述异常数据以外的数据作为正常数据；

所述通过具有噪声的基于密度的聚类方法DBSCAN算法，在所述符合第一预设条件的GPS点对应的数据中，得到多个位置区域，包括：

遍历所有正常数据所形成的GPS轨迹序列，若第一GPS点对应的节点的节点邻域内的点数大于或等于数量阈值，则将所述第一GPS点对应的节点标记为核心点，该节点领域内的每个节点与所述第一GPS点对应的节点之间的时间差处于时间阈值以内，并且，该节点领域内的每个节点与所述第一GPS点对应的节点之间的距离差处于预设距离阈值内；

针对每个核心点进行聚类，合并范围相同的簇，得到包含各自核心点的聚类簇；

将多个聚类簇作为多个位置区域。

进一步的，在通过具有噪声的基于密度的聚类方法DBSCAN算法，在所述符合第一预设条件的GPS点对应的数据中，得到多个位置区域之前，所述方法还包括：

计算出符合第二预设条件的核心点及所述核心点的节点邻域内的GPS点对应的节点；

将所有核心点形成的核心点集合及所述核心点集合中的核心点各自节点邻域内的GPS点对应的节点，以建立字典的方式进行存储；

通过具有噪声的基于密度的聚类方法DBSCAN算法，在所述符合第一预设条件的GPS点对应的数据中，得到多个位置区域，包括：

在所述核心点集合中，提取出所有GPS点对应的节点，针对每个核心点进行聚类，合并范围相同的簇；

直至将所述核心点集合中不存在数据，得到包含各自核心点的聚类簇；

将多个聚类簇作为多个位置区域。

进一步的，所述在所述多个位置区域中，确定出用户兴趣点的位置，包括：

针对每个位置区域各自对应聚类簇，通过求该聚类簇中每个GPS点对应的节点中的经度的平均值与维度的平均值，确定出该聚类簇的簇中心；

将所述簇中心标记为用户兴趣点的位置。

进一步的，所述针对每个位置区域各自对应聚类簇，通过求该聚类簇中每个GPS点对应的节点中的经度的平均值与维度的平均值，确定出该聚类簇的簇中心，包括：

通过具有噪声的基于密度的聚类方法DBSCAN算法，在所述正常数据中，提取出用户停留时间达到预设阈值时间的点作为驻足点；

判断存在是否属于同一位置区域的驻足点；

若存在，则将属于同一位置区域的驻足点合并入同一聚类簇中，通过求合并后的聚类簇中每个GPS点对应的节点中的经度的平均值与维度的平均值，确定出该聚类簇的簇中心。

第二方面，本发明实施例提供了一种基于深度信念网络的位置预测装置，包括：

获取模块，用于获取用户兴趣点的位置对应的多个特征，所述多个特征至少包括：所述兴趣点的位置对应的唯一标识、所述兴趣点的位置的访问时间，在所述兴趣点的位置的停留时间、兴趣点对应的预设功能分区；所述兴趣点的位置由全球定位系统GPS轨迹中的驻足点，通过聚类得到的；所述驻足点为用户在任一位置停留时间超过预设阈值时间的位置；

处理模块，用于将所述多个特征作为深度信念网络的输入，利用所述深度信念网络进行位置预测；其中，所述深度信念网络为利用包括有与所述多个特征相同类型的特征的样本作为训练集，对深度信念网络进行训练得到的；

确定模块，用于将所述深度信念网络的输出值为1对应的神经元所预测的位置，预定为用户在所述兴趣点的位置之后，所要到达的位置。

将所述已优化深度信念网络作为所述深度信念网络。

第三方面，本发明实施例提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过总线完成相互间的通信；存储器，用于存放计算机程序；处理器，用于执行存储器上所存放的程序，实现第一方面所述的方法步骤。

第四方面，本发明实施例提供了一种计算机可读存储介质，所述存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现第一方面所述的步骤。

本发明实施例提供的一种基于深度信念网络的位置预测方法及装置，可以通过将获取的多个特征作为深度信念网络的输入，利用该深度信念网络进行位置预测，得到多个预测位置的概率值；将所述多个预测位置的概率值中的最大概率值对应的预测位置，作为用户在所述兴趣点的位置之后，所要到达的位置。

通过多个特征并利用深度信念网络进行位置预测，使用用户兴趣点对应的唯一标识、位置的时间、停留时间及功能分区的这些维度，对位置进行预测，可以提高预测位置的精确度。

当然，实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例的深度信念网络的位置预测方法的第一种流程示意图。

图2为本发明实施例的遍历所有正常数据所形成的GPS轨迹序列，得到包含各自核心点的聚类簇的流程示意图。

图3为本发明实施例的得到兴趣点的位置的流程示意图。

图4为本发明实施例的驻足点的示意图。

图5为本发明实施例的深度信念网络的示意图。

图6为本发明实施例的基于深度信念网络的位置预测装置的结构示意图。

图7为本发明实施例的电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他具体实施例，都属于本发明保护的范围。

针对现有技术中只使用位置的坐标，利用马尔科夫模型进行位置预测，只使用位置的坐标这一个维度，所考虑的维度不够全面，影响预测位置的精确度的问题。本发明实施例提供一种基于深度信念网络的位置预测方法及装置，通过多个特征并利用深度信念网络进行位置预测，可以提高预测位置的精确度。

下面首先对本发明实施例所提供的基于深度信念网络的位置预测方法进行介绍。

本发明实施例所提供的一种基于深度信念网络的位置预测方法，可以应用于在多个领域。第一种领域可以为智能交通领域，比如，基于位置预测，可以掌握交通流量和拥堵的预测；第二种领域可以为社交网络或电子商务领域，比如，基于位置预测，可以分析用户行为；基于位置的对用户进行推荐。

本发明实施例所提供的一种基于深度信念网络的位置预测方法，可以应用于在不同的领域的电子设备上，比如智能手机、ipad、智能手表、运动手环、笔记本电脑，以及车载定位设备中。电子设备本身就可以通过GPS(Global Positioning System，全球定位系统)定位、wifiWireless(Fidelity，基于IEEE 802.11b标准的无线局域网)定位和基站定位，可以准确地获悉用户的位置信息，该用户的位置信息包括移动的轨迹、停留的位置以及持续的时间等。利用本发明实施例的基于深度信念网络的位置预测方法，电子设备方便为用户提供预测位置。

在基于深度信念网络的位置预测方法的基础上，后期为用户提供处理其他事项方便。第一种事项是：基于深度信念网络的位置预测方法所得到的位置预测，后期用户可以更好的设计拥堵的解决方案，为车辆运行时候的导航路径规划；

第二种事项是：基于深度信念网络的位置预测方法所得到的位置预测，后期可以分析用户行为在现实世界中的活动，来确定用户的个人喜好和行为习惯。粗粒度的分析能够对用户喜好做出大致的推测，比如该用户经常出现在运动场和健身房等地方，可以推测该用户的运动习惯，并且结合频率和时间，可以对这一运动习惯进行更加细粒度的分析。当然以上事宜只是举例说明，在此不做限定。

参见图1，图1为本发明实施例的深度信念网络的位置预测方法的第一种流程示意图，包括如下步骤：

步骤110，获取用户兴趣点的位置对应的多个特征，所述多个特征至少包括：所述兴趣点的位置对应的唯一标识、所述兴趣点的位置的访问时间，在所述兴趣点的位置的停留时间、兴趣点对应功能分区的类别；所述兴趣点的位置由全球定位系统GPS轨迹中的驻足点，通过聚类得到的；所述驻足点为用户在任一位置停留时间超过预设阈值时间的位置。

每个用户兴趣点POI(Point of interesting，用户兴趣)包含名称、经度、纬度。上述用户兴趣点POI的位置可以由POI的经度和纬度组成。

上述兴趣点POI的唯一标识是用于唯一标识兴趣点的位置兴趣点ID；通过上述唯一标识，可以区分不同POI的名称。

上述兴趣点POI的访问时间用于用户访问该用户兴趣点POI的时间。该时间的单位可以为小时。

用户兴趣点POI对应的预设功能分区包括：休闲地点，工作地点，住宅地点。这些预设功能分区可以通过人工预先标记得到的。

上述用户兴趣点POI表示用户停留时间和GPS采集点数目均超过阈值所对应的位置。用户兴趣点POI可以应用在丰富导航地图的资讯方面。用户兴趣点POI能提醒用户路况的分支及周边建筑的详尽信息，也能方便导航中查到用户所需要的各个位置，选择最为便捷和通畅的道路来进行路径规划，这样可以通过导航地图用户兴趣点POI多少，说明导航的好用程度。

上述GPS轨迹可以包括一系列序列，该序列包括：用户标识、经度、纬度、时间。可以通过提取出用户历史的GPS轨迹之后，对历史的GPS轨迹之后的位置做出预测。

上述阈值及预设阈值时间可以根据用户需要及工业需要进行设置。

在一种具体实施例中，上述步骤101中可以通过如下步骤获取用户兴趣点的位置对应的多个特征：

第一步，获取GPS轨迹中的所有GPS点对应的数据。

首先GPS轨迹中的所有GPS点对应的数据存储在文件中，然后从文件中逐行读取数据，最后由从文件中读取的数据构成GPS轨迹，GPS轨迹中包括有GPS点对应的数据。

第二步，对GPS轨迹中的所有GPS点对应的数据进行预处理，得到符合第一预设条件的GPS点对应的数据。

这里的预处理的作用是为了过滤异常数据，保留正常的数据。在一种具体实施例中，预处理可以通过如下步骤实现：

首先，将GPS轨迹中的所有GPS点对应的数据中，包括的与预设格式不同的GPS点对应的数据以及符合预设数据规则的GPS点对应的数据，确定为所有GPS点中的异常数据。然后，删除所有GPS点中的异常数据，将删除所述异常数据以外的数据作为正常数据。这里异常数据的删除处理，也可以称为抛弃处理。

上述与预设格式不同的GPS点对应的数据包括：数据格式错误，比如，比如，没有按照指定格式或者分割符标记。指定格式可以根据用户进行设置。

上述符合预设数据规则的GPS点对应的数据，包括：不符合数据时间范围的数据，比如该数据超出了年月日超出范围或者明显不可能存在的时间点等问题。

上述符合预设数据规则的GPS点对应的数据，还包括：所述两个相邻GPS点对应的数据之间的速度值大于预设速度值及所述GPS点对应的数据的位置超出位置范围的数据。这样不仅可以对GPS点对应的数据是否合乎经纬度和时间的表示位置范围作出校验，也可以对GPS轨迹中的所有GPS点的速度作校验。

上述对GPS轨迹中的所有GPS点的速度作校验可以通过如下步骤实现：

获取任一两个GPS点对应的位置的坐标，求两个GPS点之间的距离和时间差；将两个GPS点之间的距离差及时间差之间的比值，作为两个GPS点之间的速度值；判断该速度在合理速度范围内，则保留这两个GPS点，若速度超出该合理速度范围，则确定为该两个GPS点为异常数据并删除两个GPS点。这里合理速度范围可以为0km/h到100km/h。如果超过这个合理速度范围，则认为是异常数据，可以将该数据删除。针对GPS轨迹中的每两个相邻GPS点对应的数据，求所述两个相邻GPS点之间的距离差及时间差；

上述求两个GPS点之间的距离可以通过如下步骤实现：

首先，将地球作为以地球的半径R为6378.14km的球面；

然后，将地球上两个GPS点A及GPS点B对应位置的经纬度坐标为(LngA，LatA)、(LngB，LatB)。按照0度经线的基准，东经取经度的正值(Longitude)，西经取经度负值(-Longitude)，北纬取90-纬度值(90-Latitude)，南纬取90+纬度值(90+Latitude)，则经过上述处理过后的两个GPS点A及GPS点B位置的坐标被分别记为(MLngA，MLatA)和(MLngB，MLatB)。那么根据三角推导，可以得到计算GPS点A及GPS点B两点之间的距离，具体三角推导如下：

其中，C＝sin MLatA*sin MLatB*cos(MLngA-MLngB)+cosMLatA*cos MLatB，C为两个GPS点A及GPS点B之间的夹角的余弦值，该夹角C的顶点为地心，R为地球半径，Distance为在地球的球面上的GPS点A及GPS点B两点之间的距离，上述GPS点A及GPS点B两点之间的距离的公式，误差可以在2m以内。

第三步，通过具有噪声的基于密度的聚类方法DBSCAN算法，在所述符合第一预设条件的GPS点对应的数据中，得到多个位置区域。

在一种具体实施例中，上述第三步可以通过DBSCAN算法执行如下步骤得到多个位置区域：

遍历所有正常数据所形成的GPS轨迹序列，若第一GPS点对应的节点的节点邻域内的点数大于或等于数量阈值，则将所述第一GPS点对应的节点标记为核心点，该节点领域内的每个节点与所述第一GPS点对应的节点之间的时间差处于时间阈值以内，并且，该节点领域内的每个节点与所述第一GPS点对应的节点之间的距离差处于预设距离阈值内。针对每个核心点进行聚类，合并范围相同的簇，得到包含各自核心点的聚类簇。将多个聚类簇作为多个位置区域。

上述预设距离阈值和时间阈值可以根据用户进行设定或者根据工业需求进行设定。

上述第一GPS点对应的节点为任一GPS点对应的节点。

具体的，参见图2所示，图2为本发明实施例的遍历所有正常数据所形成的GPS轨迹序列，得到包含各自核心点的聚类簇的流程示意图。具体可以通过执行如下步骤，遍历所有正常数据所形成的GPS轨迹序列，得到包含各自核心点的聚类簇具体步骤如下：

步骤111，按照所有正常数据所形成的GPS轨迹序列从任一GPS点对应的节点进行遍历。

如果该GPS点对应的节点未被访问过，则沿GPS轨迹序列的向GPS点对应的节点的周边延伸进行遍历。此时，步骤112，判断该GPS点对应的节点的节点邻域内的点数大于或等于数量阈值，也就是判断该GPS点对应的节点是否为核心点；若是，则执行步骤113，然后执行步骤115；如果否，则执行步骤114，然后执行步骤115；

步骤113，将该GPS点对应的节点标记为核心点，并由核心点向沿GPS轨迹序列向周边延伸进行遍历，形成各自核心点的聚类簇。其中，核心点向沿GPS轨迹序列向周边延伸进行遍历，该遍历的方式类似于图的深度优先遍历算法，可以合并范围相同的簇。

步骤114，将该GPS点对应的节点标记为非核心点，并沿GPS轨迹序列的向GPS点对应的节点的周边延伸进行遍历。

步骤115，判断是否遍历至GPS轨迹序列的末端；如果否，则执行步骤112；如果是，则结束。

为了降低时间复杂度，在其他具体实施例中，执行下面两个步骤得到多个位置区域：

第一步骤，得到改进后的DBSCAN算法，该算法在上述第三步得到多个位置区域之前，所述深度信念网络的位置预测方法还包括：计算出符合第二预设条件的核心点及所述核心点的节点邻域内的GPS点对应的节点；将所有核心点形成的核心点集合及所述核心点集合中的核心点各自节点邻域内的GPS点对应的节点，以建立字典的方式进行存储。

在一种具体实施例中，上述第二预设条件的核心点按照第一GPS点对应的节点的节点邻域内的点数大于或等于数量阈值进行得到的。

在其他具体实施例中，具体也可以通过如下步骤得到第二预设条件的核心点：

针对一条所述正常数据对应的GPS轨迹进行遍历，针对每一个GPS点对应的节点，若该GPS点对应的节点的节点邻域内的点数大于或等于数量阈值时，则取出该GPS点作为核心点。这样在后续的计算过程中，针对每一个GPS点对应的节点，不需要再遍历所有节点的节点邻域内的GPS点对应的节点进行计算。

第二步骤，在所述核心点集合中，提取出所有GPS点对应的节点，针对每个核心点进行聚类，合并范围相同的簇；直至将所述核心点集合中不存在数据，得到包含各自核心点的聚类簇；将多个聚类簇作为多个位置区域。聚类簇中各GPS点对应的节点具体公式为：{p_n(x_n,y_n)}，p_n表示聚类簇中第n个GPS点对应的节点，x_n表示聚类簇中第n个GPS点对应的节点的横坐标，y_n表示聚类簇中第n个GPS点对应的节点的纵坐标，n表示节点数，n的取值为1至节点总数。

由于上述得到核心点集合，从核心点集合中取出数据点，按照图的深度优先遍历的思想，对簇进行合并操作，直到核心点集合中不存在数据为止。这样就可以得到划分好的各个聚类簇。

在上述具体实施例中，在聚类过程的前期，预先计算符合第二预设条件的核心点，该第二预设条件的核心点的节点邻域内的GPS点对应的节点，然后将两者均以建立字典的方式进行存储。相当于，建立了空间索引。

这里可以以键值对的存储方式进行存储，也就是key-value的形式，作为词典的存储方式。key对应的是核心点，value为核心点的节点邻域内的GPS点对应的节点。这样可以将每次找核心点时，从头到尾遍历一遍GPS轨迹序列，变更为针对每个核心点，在该第二预设条件的核心点的节点邻域内的GPS点对应的节点进行遍历，将时间复杂度降低。从时间复杂度O(n²)降低时间复杂度到O(nm)，其中n为节点总数，m为核心点的数目，n²表示遍历n²次，nm表示遍历nm次。

第四步，在所述多个位置区域中，确定出用户兴趣点的位置。

为了提高提取用户兴趣点的位置的效率，由于用户兴趣点的位置适合测试数据集的特性，可以通过多线程的机制进行提取。如果数据集的格式发生变化，需要重新更改提取的代码。提取出的用户兴趣点的位置存在清单List中，方便传送该清单List和获取该清单List。

在一种具体实施例中，可以通过执行如下步骤可以将多个聚类簇中的簇中心作为多个位置区域：首先，针对每个位置区域各自对应聚类簇，通过求该聚类簇中每个GPS点对应的节点中的经度的平均值与维度的平均值，确定出该聚类簇的簇中心；然后，将所述簇中心标记为用户兴趣点的位置。

参见图3，图3为本发明实施例的得到兴趣点的位置的流程示意图。具体可以通过执行如下步骤，使用改进后的DBSCAN算法替代原有的DBSCAN算法，得到兴趣点：

步骤101，通过具有噪声的基于密度的聚类方法DBSCAN算法，在所述正常数据中，提取出用户停留时间达到预设阈值时间的点作为驻足点。

步骤102，判断存在是否属于同一位置区域的驻足点。如存在，则执行步骤103。如果不存在，则执行步骤105。由于提取的各个驻足点，可能相互靠近但是不完全一致，因此需要判断存在是否属于同一位置区域的驻足点。

步骤103，将属于同一位置区域的驻足点合并入同一聚类簇中，通过求合并后的聚类簇中每个GPS点对应的节点中的经度的平均值与维度的平均值，确定出该聚类簇的簇中心，将簇中心作为兴趣点的位置。

该簇中心做一个序号标记，将簇中心作为兴趣点的位置。

步骤105，保持各自驻足点所属的聚类簇不变，通过求该聚类簇中每个GPS点对应的节点中的经度的平均值与维度的平均值，确定出该聚类簇的簇中心，将簇中心作为兴趣点的位置。

对于不在任何一个簇中GPS点对应的节点，可以直接抛弃处理。

上述发明实施例，通过以上步骤的计算，原始的GPS轨迹变成了用户兴趣点的序列。为之后的位置预测提供了有力的数据支撑。

参见图4，图4为本发明实施例的驻足点的示意图。上述得到兴趣点的位置，具体应用实例举例如下：

驻足点可能是教学楼的教学区、办公室等区域，但是经过第二次聚类后，都会以教学楼为区域的代表，这样做确实会损失一些精确度，但是在现有数据量和预测的目标而言是符合预期的。这样的说明，用户的兴趣点的位置往往是有共性的，也就是不同用户对这个地理位置进行过访问及停留。从上一个例子来说，教学楼是学生上课和自习的地方，可以看出学生的轨迹中很多的驻足点和教学楼有关系。

第五步，获取用户兴趣点的位置对应的多个特征。

根据上述DBSCAN算法，提取出的兴趣点的位置对应的多个特征，将位置对应的多个特征存储到数据库中。数据存储分为两个部分，第一个部分存储用户的兴趣点的，第二个部分存储这些兴趣点的属性。兴趣点对象可以通过如下方式进行定义：

GPSAnalysisPoint{latitude,longitude,startTime,endTime，deltaTime}

其中latitude代表纬度，longitude代表经度，starttime代表用户在这个兴趣点的开始时间，endTime代表用户离开这个兴趣点的时间，deltaTime表示停留时间，便于计算。而兴趣点的位置本身也具有自己的属性，包括经纬度代表的地理位置，以及这个坐标点本身的属性，比如该属性为预设功能分区。可以根据经纬度很方便的查询出地理位置集中的区域。这个属性目前可以依靠人工标记的方法得到。

步骤120，将所述多个特征作为深度信念网络的输入，利用所述深度信念网络进行位置预测；其中，所述深度信念网络为利用包括有与所述多个特征相同类型的特征的样本作为训练集，对深度信念网络进行训练得到的。

上述DBN(Deep Belief Network，深度信念网络)由多层神经元构成。这些神经元又分为显层神经元和隐层神经元。显层神经元主要用途是接收外界的输入，而隐层神经元用于提取特征。最顶层的神经元代表输出的向量，最下层的神经元代表了数据向量。最下层的每个神经元对应输入数据的一个维度。参见图5，图5为本发明实施例的深度信念网络的示意图。最下层的每个神经元对应输入数据的四个维度，分别为兴趣点唯一标识v₁，访问时间v₂，停留时间v₃及兴趣点对应的预设功能分区v₄，最上层输出向量的每个神经元h，具体分别为h₁,h₂,h₃，输出序列是由h₁,h₂,h₃分别对应的数值组成，该输出序列中h₁,h₂,h₃中任一输出值为1所预测的位置，预定为用户在所述兴趣点的位置之后，所要到达的位置。比如，输出序列100。该序列表示h₁对应的位置预定为用户在所述兴趣点的位置之后，所要到达的位置。

在一种具体实施例中，可以使用已经通过样本集训练的深度信念网络。这样方便直接使用。

在其他具体实施例中，也可以通过样本集训练得到的深度信念网络。具体的，通过执行如下六个步骤得到上述深度信念网络：

所述深度信念网络包括：多层显层及多层隐层：

第一步，将包括有与所述多个特征相同类型的特征的样本作为训练集训练底层显层的输入向量。

这里训练时，所输入的每个样本特征对应的维度包括：用户当前时间之前的一个位置、用户访问该位置开始的开始时间、用户在该位置的停留时间和该位置的对应的预设功能分区。

上述用户当前时间之前的一个位置为在预设时间范围内访问的前一位置；上述开始时间的单位精确到小时；该位置的对应的预设功能分区包括：休闲地点，工作地点，住宅地点。这些预设功能分区可以通过人工预先标记得到的。比如，教学楼可以标记为工作地点、宿舍可以标记为休息地点。

第二步，将底层显层的输出向量作为相邻的中间隐层的输入向量，训练该相邻的中间隐层。

第三步，将当前训练的中间隐层的输出向量作为相邻的下一层中间隐层的输入向量，训练该相邻的下一层中间隐层。

第四步，直至训练到预设层，将所述预设层的输出向量作为顶层显层的输入，随机初始化参数。这里DBN是把网络的状态定义为一个能量。DBN的训练就是为了使得这个能量函数达到最小值。

顶层的输出向量是一个输出序列。该输出序列中输出值为1对应的神经元h对应的位置，预定为用户在所述兴趣点的位置之后，所要到达的位置。使用用户兴趣点对应的唯一标识、位置的时间、停留时间及功能分区的这些维度，对位置进行预测，可以提高预测位置的精确度。

第五步，利用后向传播BP算法及初始化后的参数，从所述顶层显层回归到所述底层显层进行参数优化，得到已优化深度信念网络，其中，该参数包括：网络的权值参数，该网络权值参数是针对每个神经元，该神经元的输入是由与该神经元连接的其他神经元的输出加权得到。

上述网络的权值参数，每个神经元的输入是由与输入的该神经元连接的n个神经元的输出加权得到，现在网络自动调节的就是这个参数c_i，也就是各个神经元对该神经元产生的影响。

在上述公式中，y代表输入的值，n为神经元的总数，c_I代表第I个神经元输入的权重，x_I代表第I个神经元输入的数值，I表示n个神经元中的当前的神经元个数，也就是第I个神经元，I的取值由深度信念网络决定。

在上述训练过程，通过人工设定的参数得到网络的权值参数，该人工设定的参数包括：预训练的迭代次数、预训练阶段的学习率、微调阶段的学习率、微调阶段的迭代次数及每批处理的样本的个数等。

在训练好的波尔茨曼机的基础上，需要对深度信念网络进行参数优化。深度神经网络的训练算法都采用Hinton团队提出的贪婪逐层算法。也就是说，该贪婪逐层算法分为两步：第一步，用无标签的数据逐层训练网络；第二步，在预训练结束后，用BP算法自上而下地对参数进行调优。

这种训练算法远远优于过往神经网络直接使用的BP算法。原因在于，经过深度网络的预训练后，整个网络的参数已经得到优化，再用BP算法微调整个网络，只是将已知的参数进行一次局部的搜索，这样，无论效率还是结果都大大地优于原来的BP算法。

第六步，将所述已优化深度信念网络作为所述深度信念网络。

在其他具体实施例中，所述深度信念网络还包括受限波尔兹曼机RBM；所述显层具有显层神经元，所述隐层具有隐层神经元；所述显层神经元和所述隐层神经元之间的连接情况用权重矩阵表示：

其中，W表示权重矩阵；w_ij表示从第i个显层神经元到第j个隐层神经元的权重，i取值为1…a；a大于1的自然数，a代表显层神经元的总数；j的取值为1…b，b大于1的自然数，b代表隐层神经元的总数，w₁₁表示从第1个显层神经元到第1个隐层神经元的权重，w_a1表示从第a个显层神经元到第1个隐层神经元的权重，w_1b表示从第1个显层神经元到第b个隐层神经元的权重，w_ab表示从第a个显层神经元到第b个隐层神经元的权重；i表示a个显层神经元中当前的显层神经元个数，也就是第i个显层神经元；j表示b个隐层神经元中当前的隐层神经元个数，也就是第j个隐层神经元；

上述DBN的组成元件是受限波尔兹曼机(Restricted Boltzmann Machines,RBM)。

在一种具体实施例中，通过如下步骤实现由所述深度信念网络按照所述权重矩阵W中的权重值w_ij，开启隐层神经元：

按照显层神经网络的输入值分别与对应的权重矩阵W中的权重值w_ij加权，通过计算出每个隐层神经元的输入值X；

利用f(X)表示激励函数，计算该隐层神经元的激励值并标准化。在标准化后的隐层神经元的激励值超过该神经元的阈值时，开启隐层神经元，或者，在标准化后的隐层神经元的激励值低于该神经元的阈值时，关闭隐层神经元。

神经元的阈值范围可以是大于0小于1。可选的，在该阈值范围中取神经元的阈值为1/2。具体的，在标准化后的隐层神经元的激励值超过1/2时，开启隐层神经元。或者，在标准化后的隐层神经元的激励值低于1/2时，关闭隐层神经元。

在一种具体实施例中，上述受限波尔兹曼机RBM可以通过该如下步骤进行训练得到：

RBM中的神经元都是布尔型的，状态值为1时候代表激活，状态值为0时候代表抑制。令向量s∈{0,1}ⁿ表示n个神经元的状态，n代表神经元的总数，该n个神经元包括：a个显层神经元和b个隐层神经元，显层神经元的总数为a，隐层神经元的总数为b；i表示a个显层神经元中当前的显层神经元个数，也就是第i个显层神经元；j表示b个隐层神经元中当前的隐层神经元个数，也就是第j个隐层神经元；w_ij代表第i个显层神经元和第j个隐层神经元之间的连接权，s_i表示第i个显层神经元的状态，s_j表示第j个隐层神经元的状态，θ_i表示第i个显层神经元的阈值，则状态s的RBM能量E(s)为：

如果DBN中的神经元进行更新，依赖无序的输入值，则DBN最终将达到波尔茨曼分布对应状态s出现的概率P(s)，将由状态s的RBM能量E(s)和所有可能的状态t的能量E(t)决定，具体公式如下：

RBM的训练过程就是把每个训练样本视为一个状态，使得其出现的概率尽可能大。标准的RBM是一个全连接图，这样使得DBN的训练成本很高，也就是复杂度很高。目前，常常采用受限的RBM来完成任务。这种受限的RBM只是保留了显层和隐层之间的连接，从而将结构转成了二部图，而不是标准的RBM的完全图。

下面介绍受限的RBM的训练方法：

受限的RBM一般采用“对比散度”的方法进行训练。假定DBN中有a个显层神经元和b个隐层神经元，显层神经元的总数为a，隐层神经元的总数为b。令v和h分别代表显层和隐层的状态向量，i表示a个显层神经元中当前的显层神经元个数，也就是第i个显层神经元；j表示b个隐层神经元中当前的隐层神经元个数，也就是第j个隐层神经元；P(v|h)代表在h出现条件下v的条件概率，P(h|v)代表在v出现条件下h的条件概率；P(v_i|h)代表在h出现条件下v_i的条件概率，P(h_j|v)代表在v出现条件下h_j的条件概率，v_i为显层的第i个神经元状态，h_j为隐层第j个神经元状态。由于同一层不存在连接，则有

每个训练样本v，根据上面P(h│v)对应的公式，计算出P(h│v)，得知隐层神经元状态的概率分布；然后利用这个隐层神经元状态的概率分布P(h│v)，根据上面P(v│h)对应的公式，计算出P(v│h)，得知显层神经元状态的概率分布。利用该显层神经元状态的概率分布，获取新的显性状态向量h′；再然后利用新的显性状态向量h′，根据上面P(v│h)对应的公式，利用该显层神经元状态的概率分布，获取新的隐层状态向量v′。类似的从新的显性状态向量h′产生新的隐层状态向量v′，连接权重的变化量的更新公式为

Δw＝η(vh^T-v′h′^T)，其中，Δw表示连接权重的变化量，h^T表示h的转置，h′^T表示h′的转置，η表示学习率，取值为[0,1]的一个正小数，一般取0.1。

最终，以完成受限波尔兹曼机RBM的训练。

步骤130，将所述深度信念网络的输出值为1对应的神经元所预测的位置，预定为用户在所述兴趣点的位置之后，所要到达的位置。

本发明实施例中，通过多个特征并利用深度信念网络进行位置预测，使用用户兴趣点对应的唯一标识、位置的时间、停留时间及功能分区的这些维度，对位置进行预测，可以提高预测位置的精确度。

下面对本发明实施例所提供的基于深度信念网络的位置预测方法进行介绍。

参见图6，图6为本发明实施例的基于深度信念网络的位置预测装置的结构示意图。该基于深度信念网络的位置预测装置具体包括：

获取模块21，用于获取用户兴趣点的位置对应的多个特征，所述多个特征至少包括：所述兴趣点的位置对应的唯一标识、所述兴趣点的位置的访问时间，在所述兴趣点的位置的停留时间、兴趣点对应的预设功能分区；所述兴趣点的位置由全球定位系统GPS轨迹中的驻足点，通过聚类得到的；所述驻足点为用户在任一位置停留时间超过预设阈值时间的位置；

处理模块22，用于将所述多个特征作为深度信念网络的输入，利用所述深度信念网络进行位置预测；其中，所述深度信念网络为利用包括有与所述多个特征相同类型的特征的样本作为训练集，对深度信念网络进行训练得到的；

确定模块23，用于将所述深度信念网络的输出值为1对应的神经元所预测的位置，预定为用户在所述兴趣点的位置之后，所要到达的位置。

将所述已优化深度信念网络作为所述深度信念网络。

表示从第在利用所述已优化的深度信念网络进行位置预测之前，所述装置还包括：

按照显层神经网络的输入值分别与对应的权重矩阵W中的权重值w_ij加权，计算出每个隐层神经元的输入值X；

利用计算该隐层神经元的激励值并标准化，在标准化后的隐层神经元的激励值超过该神经元的阈值时，开启隐层神经元，或者，在标准化后的隐层神经元的激励值低于该神经元的阈值时，关闭隐层神经元。

利用计算该隐层神经元的激励值并标准化，也就是将每个隐层神经元的输入值X映射到0到1数值之间。

神经元的阈值范围可以是大于0小于1。可选的，上述神经元的阈值为1/2。具体的，在标准化后的隐层神经元的激励值超过1/2时，开启隐层神经元。或者，在标准化后的隐层神经元的激励值低于1/2时，关闭隐层神经元。

进一步的，所述获取模块，包括：

第一获取子模块，用于获取GPS轨迹中的所有GPS点对应的数据；

第一得到子模块，用于对GPS轨迹中的所有GPS点对应的数据进行预处理，得到符合第一预设条件的GPS点对应的数据；

第二得到子模块，用于通过具有噪声的基于密度的聚类装置DBSCAN算法，在所述符合第一预设条件的GPS点对应的数据中，得到多个位置区域；

第一确定子模块，用于在所述多个位置区域中，确定出用户兴趣点的位置；

第二获取子模块，用于获取用户兴趣点的位置对应的多个特征。

进一步的，所述第一得到子模块，包括：

所述第二得到子模块，包括：

将多个聚类簇作为多个位置区域。

进一步的，所述装置还包括：

计算模块，用于在通过具有噪声的基于密度的聚类装置DBSCAN算法，在所述符合第一预设条件的GPS点对应的数据中，得到多个位置区域之前，计算出符合第二预设条件的核心点及所述核心点的节点邻域内的GPS点对应的节点；

存储模块，用于将所有核心点形成的核心点集合及所述核心点集合中的核心点各自节点邻域内的GPS点对应的节点，以建立字典的方式进行存储；

所述第二得到子模块，包括：

将多个聚类簇作为多个位置区域。

进一步的，所述第一确定子模块，包括：

将所述簇中心标记为用户兴趣点的位置。

进一步的，所述第一确定子模块具体用于、：

通过具有噪声的基于密度的聚类装置DBSCAN算法，在所述正常数据中，提取出用户停留时间达到预设阈值时间的点作为驻足点；

判断存在是否属于同一位置区域的驻足点；

参见图7，图7为本发明实施例的电子设备的结构示意图。该电子设备包括处理器31、通信接口32、存储器33和通信总线34，其中，处理器31，通信接口32，存储器33通过总线完成相互间的通信；存储器33，用于存放计算机程序；处理器31，用于执行存储器33上所存放的程序，以实现如下步骤：

将所述多个特征作为深度信念网络的输入，利用所述深度信念网络进行位置预测，得到多个预测位置的概率值；其中，所述深度信念网络为利用包括有与所述多个特征相同类型的特征的样本作为训练集，对深度信念网络进行训练得到的；

将所述多个预测位置的概率值中的最大概率值对应的预测位置，作为用户在所述兴趣点的位置之后，所要到达的位置。

上述电子设备提到的通信总线34可以是外设部件互连标准(PeripheralComponent Interconnect，PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，EISA)总线等。该通信总线34可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口32用于上述电子设备与其他设备之间的通信。

存储器33可以包括随机存取存储器33(Random Access Memory，RAM)，也可以包括非易失性存储器33(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器33。可选的，存储器33还可以是至少一个位于远离前述处理器31的存储装置。

上述的处理器31可以是通用处理器31，包括中央处理器31(Central ProcessingUnit，CPU)、网络处理器31(Network Processor，NP)等；还可以是数字信号处理器31(Digital Signal Processing，DSP)、专用集成电路(Application Specific IntegratedCircuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

本发明实施例提供的方法可以应用于电子设备。具体的，该电子设备可以为：台式计算机、便携式计算机、智能移动终端、服务器等。在此不作限定，任何可以实现本发明的电子设备，均属于本发明的保护范围。

相应于上述实施例所提供的深度信念网络的位置预测方法，本发明实施例还提供了一种计算机可读存储介质，用于存储有机器可执行指令，在被处理器调用和执行时，所述机器可执行指令促使所述处理器实现如下步骤：

对于装置、电子设备以及计算机可读存储介质实施例而言，由于其所涉及的方法内容基本相似于前述的方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用对应的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他具体实施例的不同之处。尤其，对于装置、电子设备以及计算机可读存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种基于深度信念网络的位置预测方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述深度信念网络包括：多层显层及多层隐层，所述深度信念网络是通过如下步骤得到的：

将所述已优化深度信念网络作为所述深度信念网络。

3.如权利要求2所述的方法，其特征在于，所述深度信念网络还包括受限波尔兹曼机RBM；所述显层具有显层神经元，所述隐层具有隐层神经元；所述显层神经元和所述隐层神经元之间的连接情况用权重矩阵表示：

4.如权利要求1所述的方法，其特征在于，所述获取用户兴趣点的位置对应的多个特征，包括：

获取GPS轨迹中的所有GPS点对应的数据；

在所述多个位置区域中，确定出用户兴趣点的位置；

获取用户兴趣点的位置对应的多个特征。

5.如权利要求4所述的方法，其特征在于，所述对GPS轨迹中的所有GPS点进行预处理，得到符合第一预设条件的GPS点对应的数据，包括：

将多个聚类簇作为多个位置区域。

6.如权利要求5所述的方法，其特征在于，在通过具有噪声的基于密度的聚类方法DBSCAN算法，在所述符合第一预设条件的GPS点对应的数据中，得到多个位置区域之前，所述方法还包括：

将多个聚类簇作为多个位置区域。

7.如权利要求5或6所述的方法，其特征在于，所述在所述多个位置区域中，确定出用户兴趣点的位置，包括：

将所述簇中心标记为用户兴趣点的位置。

8.如权利要求7所述的方法，其特征在于，所述针对每个位置区域各自对应聚类簇，通过求该聚类簇中每个GPS点对应的节点中的经度的平均值与维度的平均值，确定出该聚类簇的簇中心，包括：

判断存在是否属于同一位置区域的驻足点；

9.一种基于深度信念网络的位置预测装置，其特征在于，包括：

10.如权利要求9所述的装置，其特征在于，所述深度信念网络包括：多层显层及多层隐层，所述深度信念网络是通过如下步骤得到的：

将所述已优化深度信念网络作为所述深度信念网络。