WO2016033901A1

WO2016033901A1 - 一种确定移动用户的常驻点信息的方法和装置

Info

Publication number: WO2016033901A1
Application number: PCT/CN2014/093759
Authority: WO
Inventors: 邢皖甲; 熊磊
Original assignee: 百度在线网络技术（北京）有限公司
Priority date: 2014-09-02
Filing date: 2014-12-12
Publication date: 2016-03-10
Also published as: CN104252527A; CN104252527B

Abstract

本发明提出了一种在计算机设备中确定移动用户的常驻点信息的方法，其中，该方法包括以下步骤：a.获取所述移动用户的多个时空点信息，其中，所述时空点信息用于指示所述移动用户的空间位置以及移动用户位于该空间位置时对应的时间点信息；b.基于聚类算法对所述多个时空点信息进行聚类分析，来确定所述移动用户的多个常驻点信息。根据本发明的方案，可根据移动用户的时空点信息确定移动用户的多个常驻点信息，并确定该等常驻点信息的类型。

Description

一种确定移动用户的常驻点信息的方法和装置

技术领域

本发明涉及计算机技术领域，尤其涉及一种在计算机设备中确定移动用户的常驻点信息的方法和装置。

背景技术

现有技术中，通常仅会获取移动用户的一个当前位置，例如通过移动用户主动上报或者触发移动用户上报等方式，获取移动用户的当前位置。进而，基于该当前位置来进行诸如定位等操作。

发明内容

本发明的目的是提供一种在计算机设备中确定移动用户的常驻点信息的方法和装置。

根据本发明的一个方面，提供一种在计算机设备中确定移动用户的常驻点信息的方法，其中，该方法包括以下步骤：

a.获取所述移动用户的多个时空点信息，其中，所述时空点信息用于指示所述移动用户的空间位置以及移动用户位于该空间位置时对应的时间点信息；

b.基于聚类算法对所述多个时空点信息进行聚类分析，来确定所述移动用户的多个常驻点信息。

根据本发明的另一个方面，还提供了一种在计算机设备中确定移动用户的常驻点信息的装置，其中，该装置包括以下装置：

用于获取所述移动用户的多个时空点信息的装置，其中，所述时空点信息用于指示所述移动用户的空间位置以及移动用户位于该空间位置时对应的时间点信息；

用于基于聚类算法对所述多个时空点信息进行聚类分析，来确定所述移动用户的多个常驻点信息的装置。

与现有技术相比，本发明具有以下优点：1)可通过对移动用户的时空点信息进行聚类分析，来确定移动用户的多个常驻点，从而可更准确地了解移动用户的活动范围以及生活规律；2)可根据移动用户的多个常驻点信息，确定移动用户的每个常驻点的类型，且在一定程度上预测用户在某常驻点区域出现的概率。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1为本发明一个实施例的在计算机设备中确定移动用户的常驻点信息的方法的流程示意图；

图2为本发明另一个实施例的在计算机设备中确定移动用户的常驻点信息的方法的流程示意图；

图3为本发明一个实施例的在计算机设备中确定移动用户的常驻点信息的装置的结构示意图；

图4为本发明另一个实施例的在计算机设备中确定移动用户的常驻点信息的装置的结构示意图。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本发明作进一步详细描述。

图1为本发明一个实施例的在计算机设备中确定移动用户的常驻点信息的方法的流程示意图。

其中，本实施例的方法主要通过计算机设备来实现；所述计算机设备包括网络设备和用户设备。所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云，其中，云计算是分布式计算的一种，由一群松散耦合的计算机集组成的一个超级虚拟计算机；所述网络设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。所述用户设备包括但不限于PC机、平板电脑、智能手机、PDA、IPTV等。

需要说明的是，所述计算机设备仅为举例，其他现有的或今后可能出现的计算设备如可适用于本发明，也应包含在本发明保护范围以内，并以引用方式包含于此。

根据本实施例的方法包括步骤S1和步骤S2。

在步骤S1中，计算机设备获取移动用户的多个时空点信息。

其中，所述时空点信息用于指示所述移动用户的空间位置以及移动用户位于该空间位置时对应的时间点信息。优选地，所述时空点信息可具有多种表现形式，包括但不限于：一个度量的向量、多维空间中的一个点等；更优选地，所述时空点信息为四维空间向量。

例如，移动用户的一个时空点信息为四维空间向量α＝(a，b，c，d)，其中，(a，b，c)为移动用户的空间位置的坐标，d为移动用户位于该空间位置时对应的时间点信息。

具体地，计算机设备可通过多种方式获取移动用户的多个时空点信息。例如，计算机设备接收来自其他计算机设备的、移动用户的多个时空点信息；又例如，移动用户定时向计算机设备上报其时空点信息，则在一段时间内，计算机设备接收移动用户所上报的多个时空点信息等。

需要说明的是，上述举例仅为更好地说明本发明的技术方案，而非对本发明的限制，本领域技术人员应该理解，任何获取移动用户的多个时空点信息的实现方式，均应包含在本发明的范围内。

在步骤S2中，计算机设备基于聚类算法对所述多个时空点信息进行聚类分析，来确定所述移动用户的多个常驻点信息。

其中，所述聚类算法包括任何可用于进行聚类分析的算法，例如，基于密度的聚类算法、EM算法等。优选地，所述聚类算法需要设定聚类中心的数量；更优选地，所述聚类算法为基于密度的聚类算法。

其中，所述常驻点信息包括用于指示移动用户的常驻点的任何信息；优选地，所述常驻点信息包括与移动用户的常驻点相关的任何信息；优选地，可直接将聚类分析获得的聚类结果中的类作为常驻点信息。更优选地，可通过对聚类结果中的类进行统计分析，来确定该类对应的常驻点信息，其中，所述常驻点信息包括位置属性信息和时间属性信息，所述位置属性信息用于指示该常驻点的空间位置或位置范围，所述时间属性信息用于指示移动用户位于该常驻点时的多个时间点信息或时间范围。

具体地，计算机设备基于聚类算法对所述多个时空点信息进行聚类分析，来获得包括多个类的聚类结果，并根据该多个类来确定移动用户的多个常驻点信息。

例如，计算机设备将聚类算法的聚类中心的数量设定为预定数量，如4；计算机设备从所述多个时空点信息中选择4个时空点信息作为聚类中心，对于多个时空点信息中的每个时空点信息，计算机设备计算该时空点信息分别与该4个聚类中心之间的距离，并将该时空点信息归类到最小距离所对应的聚类中心；之后，计算机设备根据聚类结果中的4个类，来确定移动用户的4个常驻点信息。

作为本实施例的一种优选方案，所述聚类算法需要设定聚类中心的数量。

其中，计算机设备基于该需要设定聚类中心的聚类算法，来对所述多个时空点信息进行聚类分析，并确定所述移动用户的多个常驻点信息的方式包括但不限于：

1)聚类算法的聚类中心的数量已预先确定，则计算机设备直接基于已确定的聚类中心的数量，运行聚类算法以对所述多个时空点信息进行聚类分析，并确定所述移动用户的多个常驻点信息。

2)聚类算法的聚类中心的数量并未确定，则在此情况下，计算机设备需要先确定一个合适的聚类中心的数量。

具体地，本实现方式中，计算机设备可从多个假设数量中确定一个合适的假设数量，作为聚类中心的数量。所述步骤S2进一步包括步骤S21和步骤S22。

在步骤S21中，对于多个假设数量的全部或部分中的每个假设数量，计算机设备将所述聚类算法的聚类中心的数量设定为该假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该假设数量对应的聚类结果，并根据多个假设数量分别对应的多个聚类结果，选择一个假设数量。

优选地，计算机设备基于以下至少一项，来根据多个假设数量分别对应的多个聚类结果选择一个假设数量：

-假设数量对应的聚类结果中的类包含的时空点信息的数量。

优选地，类中包含的时空点信息的数量越多，则通常聚类结果越好。

-假设数量对应的聚类结果中的类的离散度。

优选地，类的离散度越低，则通常聚类结果越好。

其中，所述离散度用于指示类的密集程度。其中，计算机设备可采用多种方式来确定所述离散度，如，计算机设备根据类中的所有时空点信息确定类的均值，并计算每个时空点信息与该均值之间的极差、平均差或标准差等来表示该类的离散度。

需要说明的是，所述步骤S21可采用多种方式来实现。例如，步骤S21的实现方式包括但不限于：

a)本实现方式中，所述步骤S21进一步包括步骤S2111、步骤S2112和步骤S2113。

在步骤S2111中，对于所述多个假设数量中一个未确定其对应的聚类结果的假设数量，计算机设备将所述聚类算法的聚类中心的数量设定为该假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该假设数量对应的聚类结果。

在步骤S2112中，当该假设数量对应的聚类结果符合第一预定条件时，计算机设备将该假设数量作为所述所选择的假设数量。

其中，所述第一预定条件包括任何预定的用于选择假设数量的条件。优选地，所述第一预定条件包括但不限于：

-该聚类结果中的类包含的时空点信息的数量超过预定数量阈值。

-该聚类结果中的类的离散度低于预定离散度阈值。

例如，预定数量阈值为100，假设数量对应的聚类结果中包括4个类，该4个类中时空点信息的数量分别为：120、110、108、150。则在步骤S2112中，计算机设备确定假设数量对应的聚类结果的每个类中的时空点信息的数量均超过预定数量阈值，则计算机设备确定该聚类结果符合第一预定条件，且将该假设数量作为所选择的假设数量。

在步骤S2113中，当该假设数量对应的聚类结果不符合所述第一预定条件时，计算机设备重复所述步骤S2111。

具体地，当该假设数量对应的聚类结果不符合第一预定条件时，计算机设备重复步骤S2111，来获得未确定其对应的聚类结果的假设数量所对应的聚类结果；依次类推，直至一个假设数量对应的聚类结果符合第一预定条件时，将该假设数量作为所选择的假设数量，并停止操作。

例如，多个假设数量包括从2至1000的所有自然数。第一次执行步骤S2111时，计算机设备选择的假设数量为2，并在将聚类中心的数量设定为2的情况下，基于聚类算法对所述多个时空点信息进行聚类分析，获得与假设数量“2”对应的聚类结果；接着，计算机设备判断“2”对应的聚类结果不符合所述第一预定条件，在步骤S2113中，计算机设备重复步骤S2111，选择未确定其对应的聚类结果的假设数量“4”，并确定其聚类结果；接着，计算机设备判断“4”对应的聚类结果不符合所述第一预定条件，继续执行步骤S2113；以此类推，直至计算机设备获得符合第一预定条件的假设数量“5”，并执行步骤S2112，将“5”作为所选择的假设数量。

本实现方式中，计算机设备仅需要获得一个符合第一预定条件的假设数量，即可基于该假设数量执行后续操作，而无需遍历并获得所有假设数量的聚类结果。

b)本实现方式中，所述多个假设数量递增或递减，所述步骤S21进一步包括步骤S2121、步骤S2122、步骤S2123和步骤S2124。

在步骤S2121中，计算机设备将所述多个假设数量中的一个假设数量作为当前假设数量，将所述聚类算法的聚类中心的数量设定为该当前假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该当前假设数量对应的聚类结果。

例如，多个假设数量包括从2至1000递增的多个自然数。在步骤S2121中，计算机设备将“2”作为当前假设数量，并将聚类算法的聚类中心的数量设定为“2”，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与“2”对应的聚类结果。

在步骤S2122中，计算机设备将所述聚类算法的聚类中心的数量设定为该当前假设数量的下一个假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该下一个假设数量对应的聚类结果。

例如，计算机设备将聚类算法的聚类中心的数量设定为“2”的下一个假设数量“3”，并基于聚类算法对所述多个时空点信息进行聚类分析，获得与该下一个假设数量对应的聚类结果。

在步骤S2123中，当所述下一个假设数量对应的聚类结果差于该当前假设数量对应的聚类结果时，计算机设备将该当前假设数量作为所述所选择的假设数量。

优选地，可根据聚类结果中类的离散度和/或类包含的时空信息点的数量来确定下一个假设数量对应的聚类结果是否差于该当前假设数量对应的聚类结果。

例如，可计算下一个假设数量对应的聚类结果中类之间的方差E1，以及当前假设数量对应的聚类结果中类之间的方差E₂，并比较E₁和E₂，当E₁大于E₂，计算机设备可确定下一个假设数量对应的聚类结果差于该当前假设数量对应的聚类结果；当E₁小于E₂，计算机设备可确定下一个假设数量对应的聚类结果优于该当前假设数量对应的聚类结果。

在步骤S2124中，当所述下一个假设数量对应的聚类结果优于该当前假设数量对应的聚类结果时，计算机设备将该下一个假设数量作为该当前假设数量，重复所述步骤S2122。

例如，当前假设数量为“2”，且“2”的下一个假设数量为“3”，且“3”对应的聚类结果优于“2”对应的聚类结果，则计算机设备将“3”作为当前假设数量，并重复步骤S2122，获得“4”的聚类结果；接着，若“4”对应的聚类结果优于“3”对应的聚类结果，则计算机设备将“4”作为当前假设数量，继续重复步骤S2122；以此类推，直至下一个假设数量对应的聚类结果差于该当前假设数量对应的聚类结果时，在步骤S2123中，计算机设备将该当前假设数量作为所述所选择的假设数量。

由于当多个假设数量呈现出递增或递减关系时，一个最佳的假设数量对应的聚类结果，会优于其相邻两个假设数量对应的聚类结果，因此，本实现方式中，计算机设备可获得最佳的假设数量。并且，由于获得最佳假设数量后即可基于该假设数量执行后续操作，而无需继续获取其他假设数量的聚类结果，故通常情况下，本实现方式无需遍历并获得所有假设数量的聚类结果。

c)所述步骤S21进一步包括步骤S2131和步骤S2132。

在步骤2131中，对于多个假设数量中的每个假设数量，计算机设备将所述聚类算法的聚类中心的数量设定为该假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该假设数量对应的聚类结果。

例如，存在4个假设数量：2、3、4、5。计算机设备基于所述聚类算法分别获得聚类中心的数量为2时的聚类结果、聚类中心的数量为3时的聚类结果、聚类中心的数量为4时的聚类结果、以及聚类中心的数量为5时的聚类结果。

在步骤2132中，计算机设备根据所述多个假设数量分别对应的多个聚类结果，选择一个假设数量。

其中，计算机设备根据多个假设数量分别对应的多个聚类结果选择一个假设数量的实现方式已在前文中予以详述，在此不再赘述。

需要说明的是，多个假设数量可表现为集合的形式，如为集合[2，3，4，...，1000]，则计算机设备可直接从该集合中读取假设数量。或者，多个假设数量可表现为公式的形式，如k＝K+nΔ；其中，k表示假设数量，K为基数(通常K可取2)，Δ＝1，n＝0，1，2，...，998；则计算机设备可通过该公式来计算得到其需要的假设数量。

需要说明的是，上述举例仅为更好地说明本发明的技术方案，而非对本发明的限制，本领域技术人员应该理解，任何对于多个假设数量的全部或部分中的每个假设数量，将所述聚类算法的聚类中心的数量设定为该假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该假设数量对应的聚类结果，并根据多个假设数量分别对应的多个聚类结果，选择一个假设数量的实现方式，均应包含在本发明的范围内。

在步骤S22中，计算机设备根据所选择的假设数量对应的聚类结果，确定所述移动用户的多个常驻点信息。

其中，计算机设备可采用多种方式根据所选择的假设数量对应的聚类结果，确定所述移动用户的多个常驻点信息。

例如，计算机设备可直接将聚类结果的多个类作为移动用户的多个常驻点信息。

又例如，对于聚类结果中的每个类，计算机设备可通过对该类进行统计分析，如分别对该类中的所有时空点信息的空间位置和时间点信息进行统计，来确定该类对应的常驻点信息。

需要说明的是，上述举例仅为更好地说明本发明的技术方案，而非对本发明的限制，本领域技术人员应该理解，任何根据所选择的假设数量对应的聚类结果，确定所述移动用户的多个常驻点信息的实现方式，均应包含在本发明的范围内。

根据本实施例的方案，可通过对移动用户的时空点信息进行聚类分析，来确定移动用户的多个常驻点，从而可更准确地了解移动用户的活动范围以及生活规律。

图2为本发明另一个实施例的在计算机设备中确定移动用户的常驻点信息的方法的流程示意图。本实施例的方法主要由计算机设备来实现，其中，参照图1所示实施例中对计算机设备所做的任何说明，均以引用的方式包含于此。

根据本实施例的方法包括步骤S1、步骤S2和步骤S3。其中，所述步骤S1和步骤S2已在参照图1所示实施例中予以详述，在此不再赘述。

在步骤S3中，计算机设备根据所述多个常驻点信息，确定所述多个常驻点信息中的每个常驻点信息的类型

其中，所述常驻点信息的类型用于指示移动用户的常驻点的性质，如家、餐厅、娱乐场所、工作地等。

具体地，对于每个常驻点信息，计算机设备通过分析该常驻点信息，确定该常驻点信息的类型。

例如，根据常驻点信息以及地图，计算机设备确定该常驻点信息所对应的位置范围在一个居民区内，则计算机设备确定该常驻点信息的类型为家。

优选地，所述步骤S3进一步包括对所述多个常驻点信息中的每个执行的步骤S31和步骤S32。

在步骤S31中，计算机设备获取该常驻点信息的位置属性信息和时间属性信息。

其中，计算机设备可采用多种方式获取该常驻点信息的位置属性信息和时间属性信息。

例如，当所述常驻点信息为聚类结果中的类时，计算机设备对该类中的所有时空点信息进行统计分析，来根据所有时空点信息中的空间位置获得该常驻点信息的位置属性信息，并根据所有时空点信息中的时间点信息获得该常驻点信息的时间属性信息。

又例如，当所述常驻点信息是通过对聚类结果中的类进行统计分析来得到的时，计算机设备可直接从该常驻点信息中提取该常驻点信息的位置属性信息和时间属性信息。

需要说明的是，上述举例仅为更好地说明本发明的技术方案，而非对本发明的限制，本领域技术人员应该理解，任何获取该常驻点信息的位置属性信息和时间属性信息的实现方式，均应包含在本发明的范围内。

在步骤S32中，计算机设备根据所述位置属性信息和时间属性信息，确定该常驻点信息的类型。

例如，常驻点信息的时间属性信息指示移动用户位于该常驻点时的时间范围集中在每周周一至周五的9：00至18：00，且该常驻点信息的位置属性信息指示该常驻点的位置为一个办公楼，则计算机设备确定该常驻点信息的类型为工作地。

又例如，常驻点信息的时间属性信息指示移动用户位于该常驻点时的时间范围集中在周末的21：00至24：00，且该常驻点信息的位置属性信息指示该常驻点位于商业区附近，则计算机设备确定该常驻点信息的类型为娱乐场所。

需要说明的是，上述举例仅为更好地说明本发明的技术方案，而非对本发明的限制，本领域技术人员应该理解，任何根据所述位置属性信息和时间属性信息，确定该常驻点信息的类型的实现方式，均应包含在本发明的范围内。

根据本实施例的方案，可根据移动用户的多个常驻点信息，确定移动用户的每个常驻点的类型，且在一定程度上预测用户在某常驻点区域出现的概率。

图3为本发明一个实施例的在计算机设备中确定移动用户的常驻点信息的装置的结构示意图。根据本实施例的确定移动用户的常驻点信息的装置包括用于获取所述移动用户的多个时空点信息的装置(以下简称“第一获取装置1”)以及用于基于聚类算法对所述多个时空点信息进行聚类分析，来确定所述移动用户的多个常驻点信息的装置(以下简称“第一确定装置2”)。

第一获取装置1获取移动用户的多个时空点信息。

具体地，第一获取装置1可通过多种方式获取移动用户的多个时空点信息。例如，第一获取装置1接收来自其他计算机设备的、移动用户的多个时空点信息；又例如，移动用户定时向计算机设备上报其时空点信息，则在一段时间内，第一获取装置1接收移动用户所上报的多个时空点信息等。

第一确定装置2基于聚类算法对所述多个时空点信息进行聚类分析，来确定所述移动用户的多个常驻点信息。

具体地，第一确定装置2基于聚类算法对所述多个时空点信息进行聚类分析，来获得包括多个类的聚类结果，并根据该多个类来确定移动用户的多个常驻点信息。

例如，第一确定装置2将聚类算法的聚类中心的数量设定为预定数量，如4；第一确定装置2从所述多个时空点信息中选择4个时空点信息作为聚类中心，对于多个时空点信息中的每个时空点信息，第一确定装置2计算该时空点信息分别与该4个聚类中心之间的距离，并将该时空点信息归类到最小距离所对应的聚类中心；之后，第一确定装置2根据聚类结果中的4个类，来确定移动用户的4个常驻点信息。

其中，第一确定装置2基于该需要设定聚类中心的聚类算法，来对所述多个时空点信息进行聚类分析，并确定所述移动用户的多个常驻点信息的方式包括但不限于：

1)聚类算法的聚类中心的数量已预先确定，则第一确定装置2直接基于已确定的聚类中心的数量，运行聚类算法以对所述多个时空点信息进行聚类分析，并确定所述移动用户的多个常驻点信息。

2)聚类算法的聚类中心的数量并未确定，则在此情况下，第一确定装置2需要先确定一个合适的聚类中心的数量。

具体地，本实现方式中，第一确定装置2可从多个假设数量中确定一个合适的假设数量，作为聚类中心的数量。第一确定装置2进一步包括用于对于多个假设数量的全部或部分中的每个假设数量，将所述聚类算法的聚类中心的数量设定为该假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该假设数量对应的聚类结果，并根据多个假设数量分别对应的多个聚类结果，选择一个假设数量的装置(图未示，以下简称“选择装置”)以及用于根据所选择的假设数量对应的聚类结果，确定所述移动用户的多个常驻点信息的装置(图未示，以下简称“第一子确定装置”)。

对于多个假设数量的全部或部分中的每个假设数量，选择装置将所述聚类算法的聚类中心的数量设定为该假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该假设数量对应的聚类结果，并根据多个假设数量分别对应的多个聚类结果，选择一个假设数量。

优选地，选择装置基于以下至少一项，来根据多个假设数量分别对应的多个聚类结果选择一个假设数量：

-假设数量对应的聚类结果中的类包含的时空点信息的数量。

-假设数量对应的聚类结果中的类的离散度。

优选地，类的离散度越低，则通常聚类结果越好。

其中，所述离散度用于指示类的密集程度。其中，选择装置可采用多种方式来确定所述离散度，如，计算机设备根据类中的所有时空点信息确定类的均值，并计算每个时空点信息与该均值之间的极差、平均差或标准差等来表示该类的离散度。

需要说明的是，选择装置可采用多种方式来实现。例如，选择装置的实现方式包括但不限于：

a)本实现方式中，选择装置进一步包括用于对于所述多个假设数量中一个未确定其对应的聚类结果的假设数量，将所述聚类算法的聚类中心的数量设定为该假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该假设数量对应的聚类结果的装置(图未示，以下简称“第一聚类装置”)、用于当该假设数量对应的聚类结果符合第一预定条件时，将该假设数量作为所述所选择的假设数量的装置(图未示，以下简称“第一设定装置”)以及用于当该假设数量对应的聚类结果不符合所述第一预定条件时，触发所述第一聚类装置重复执行操作的装置(图未示，以下简称“第一触发装置”)。

对于所述多个假设数量中一个未确定其对应的聚类结果的假设数量，第一聚类装置将所述聚类算法的聚类中心的数量设定为该假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该假设数量对应的聚类结果。

当该假设数量对应的聚类结果符合第一预定条件时，第一设定装置将该假设数量作为所述所选择的假设数量。

-该聚类结果中的类的离散度低于预定离散度阈值。

例如，预定数量阈值为100，假设数量对应的聚类结果中包括4个类，该4个类中时空点信息的数量分别为：120、110、108、150。则第一设定装置确定假设数量对应的聚类结果的每个类中的时空点信息的数量均超过预定数量阈值，则第一设定装置确定该聚类结果符合第一预定条件，且将该假设数量作为所选择的假设数量。

当该假设数量对应的聚类结果不符合所述第一预定条件时，第一触发装置触发所述第一聚类装置重复执行操作。

具体地，当该假设数量对应的聚类结果不符合第一预定条件时，第一触发装置触发所述第一聚类装置重复执行操作，来获得未确定其对应的聚类结果的假设数量所对应的聚类结果；依次类推，直至一个假设数量对应的聚类结果符合第一预定条件时，第一设定装置将该假设数量作为所选择的假设数量，并停止操作。

例如，多个假设数量包括从2至1000的所有自然数。第一聚类装置第一次执行操作时，选择的假设数量为2，并在将聚类中心的数量设定为2的情况下，基于聚类算法对所述多个时空点信息进行聚类分析，获得与假设数量“2”对应的聚类结果；接着，由于“2”对应的聚类结果不符合所述第一预定条件，第一触发装置触发所述第一聚类装置重复执行操作，选择未确定其对应的聚类结果的假设数量“4”，并确定其聚类结果；接着，由于“4”对应的聚类结果不符合所述第一预定条件，第一触发装置继续触发所述第一聚类装置重复执行操作；以此类推，直至获得符合第一预定条件的假设数量“5”，第一设定装置将“5”作为所选择的假设数量。

b)本实现方式中，所述多个假设数量递增或递减，选择装置进一步包括用于将所述多个假设数量中的一个假设数量作为当前假设数量，将所述聚类算法的聚类中心的数量设定为该当前假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该当前假设数量对应的聚类结果的装置(图未示，以下简称“第二聚类装置”)、用于将所述聚类算法的聚类中心的数量设定为该当前假设数量的下一个假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该下一个假设数量对应的聚类结果的装置(图未示，以下简称“第三聚类装置”)、用于当所述下一个假设数量对应的聚类结果差于该当前假设数量对应的聚类结果时，将该当前假设数量作为所述所选择的假设数量的装置(图未示，以下简称“第二设定装置”)以及用于当所述下一个假设数量对应的聚类结果优于该当前假设数量对应的聚类结果时，将该下一个假设数量作为该当前假设数量，触发所述用于获得与该下一个假设数量对应的聚类结果的装置重复执行操作的装置(图未示，以下简称“第二触发装置”)。

第二聚类装置将所述多个假设数量中的一个假设数量作为当前假设数量，将所述聚类算法的聚类中心的数量设定为该当前假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该当前假设数量对应的聚类结果。

例如，多个假设数量包括从2至1000递增的多个自然数。第二聚类装置将“2”作为当前假设数量，并将聚类算法的聚类中心的数量设定为“2”，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与“2”对应的聚类结果。

第三聚类装置将所述聚类算法的聚类中心的数量设定为该当前假设数量的下一个假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该下一个假设数量对应的聚类结果。

例如，第三聚类装置将聚类算法的聚类中心的数量设定为“2”的下一个假设数量“3”，并基于聚类算法对所述多个时空点信息进行聚类分析，获得与该下一个假设数量对应的聚类结果。

当所述下一个假设数量对应的聚类结果差于该当前假设数量对应的聚类结果时，第二设定装置将该当前假设数量作为所述所选择的假设数量。

例如，可计算下一个假设数量对应的聚类结果中类之间的方差E1，以及当前假设数量对应的聚类结果中类之间的方差E₂，并比较E₁和E₂，当E₁大于E₂，第二设定装置可确定下一个假设数量对应的聚类结果差于该当前假设数量对应的聚类结果；当E₁小于E₂，第二设定装置可确定下一个假设数量对应的聚类结果优于该当前假设数量对应的聚类结果。

当所述下一个假设数量对应的聚类结果优于该当前假设数量对应的聚类结果时，第二触发装置触发第三聚类装置重复执行操作。

例如，当前假设数量为“2”，且“2”的下一个假设数量为“3”，且“3”对应的聚类结果优于“2”对应的聚类结果，则第二触发装置将“3”作为当前假设数量，并触发第三聚类装置重复执行操作，获得“4”的聚类结果；接着，若“4”对应的聚类结果优于“3”对应的聚类结果，则第二触发装置将“4”作为当前假设数量，继续触发第三聚类装置重复执行操作；以此类推，直至下一个假设数量对应的聚类结果差于该当前假设数量对应的聚类结果时，第二设定装置将该当前假设数量作为所述所选择的假设数量。

由于当多个假设数量呈现出递增或递减关系时，一个最佳的假设数量对应的聚类结果，会优于其相邻两个假设数量对应的聚类结果，因此，本实现方式中，可获得最佳的假设数量。并且，由于获得最佳假设数量后即可基于该假设数量执行后续操作，而无需继续获取其他假设数量的聚类结果，故通常情况下，本实现方式无需遍历并获得所有假设数量的聚类结果。

c)选择装置进一步包括用于对于多个假设数量中的每个假设数量，将所述聚类算法的聚类中心的数量设定为该假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该假设数量对应的聚类结果的装置(图未示，以下简称“第四聚类装置”)以及用于根据所述多个假设数量分别对应的多个聚类结果，选择一个假设数量的装置(图未示，以下简称“子选择装置”)。

对于多个假设数量中的每个假设数量，第四聚类装置将所述聚类算法的聚类中心的数量设定为该假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该假设数量对应的聚类结果。

例如，存在4个假设数量：2、3、4、5。第四聚类装置基于所述聚类算法分别获得聚类中心的数量为2时的聚类结果、聚类中心的数量为3时的聚类结果、聚类中心的数量为4时的聚类结果、以及聚类中心的数量为5时的聚类结果。

子选择装置根据所述多个假设数量分别对应的多个聚类结果，选择一个假设数量。

其中，子选择装置根据多个假设数量分别对应的多个聚类结果选择一个假设数量的实现方式，与前文中选择装置根据多个假设数量分别对应的多个聚类结果选择一个假设数量的实现方式相似，在此不再赘述。

第一子确定装置根据所选择的假设数量对应的聚类结果，确定所述移动用户的多个常驻点信息。

其中，第一子确定装置可采用多种方式根据所选择的假设数量对应的聚类结果，确定所述移动用户的多个常驻点信息。

例如，第一子确定装置可直接将聚类结果的多个类作为移动用户的多个常驻点信息。

又例如，对于聚类结果中的每个类，第一子确定装置可通过对该类进行统计分析，如分别对该类中的所有时空点信息的空间位置和时间点信息进行统计，来确定该类对应的常驻点信息。

图4为本发明另一个实施例的在计算机设备中确定移动用户的常驻点信息的装置的结构示意图。根据本实施例的确定移动用户的常驻点信息的装置包括第一获取装置1、第一确定装置2和用于根据所述多个常驻点信息，确定所述多个常驻点信息中的每个常驻点信息的类型的装置(以下简称“第二确定装置3”)。其中，所述第一获取装置1和第一确定装置2已在参照图3所示实施例中予以详述，在此不再赘述。

第二确定装置3根据所述多个常驻点信息，确定所述多个常驻点信息中的每个常驻点信息的类型

具体地，对于每个常驻点信息，第二确定装置3通过分析该常驻点信息，确定该常驻点信息的类型。

例如，根据常驻点信息以及地图，第二确定装置3确定该常驻点信息所对应的位置范围在一个居民区内，则第二确定装置3确定该常驻点信息的类型为家。

优选地，所述第二确定装置3进一步包括用于获取该常驻点信息的位置属性信息和时间属性信息的装置(图未示，以下简称“第二获取装置”)以及用于根据所述位置属性信息和时间属性信息，确定该常驻点信息的类型的装置(图未示，以下简称“第二子确定装置”)。

第二获取装置获取该常驻点信息的位置属性信息和时间属性信息。

其中，第二获取装置可采用多种方式获取该常驻点信息的位置属性信息和时间属性信息。

例如，当所述常驻点信息为聚类结果中的类时，第二获取装置对该类中的所有时空点信息进行统计分析，来根据所有时空点信息中的空间位置获得该常驻点信息的位置属性信息，并根据所有时空点信息中的时间点信息获得该常驻点信息的时间属性信息。

又例如，当所述常驻点信息是通过对聚类结果中的类进行统计分析来得到的时，第二获取装置可直接从该常驻点信息中提取该常驻点信息的位置属性信息和时间属性信息。

第二子确定装置根据所述位置属性信息和时间属性信息，确定该常驻点信息的类型。

例如，常驻点信息的时间属性信息指示移动用户位于该常驻点时的时间范围集中在每周周一至周五的9：00至18：00，且该常驻点信息的位置属性信息指示该常驻点的位置为一个办公楼，则第二子确定装置确定该常驻点信息的类型为工作地。

又例如，常驻点信息的时间属性信息指示移动用户位于该常驻点时的时间范围集中在周末的21：00至24：00，且该常驻点信息的位置属性信息指示该常驻点位于商业区附近，则第二子确定装置确定该常驻点信息的类型为娱乐场所。

需要注意的是，本发明可在软件和/或软件与硬件的组合体中被实施，例如，本发明的各个装置可采用专用集成电路(ASIC)或任何其他类似硬件设备来实现。在一个实施例中，本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地，本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中，例如，RAM存储器，磁或光驱动器或软磁盘及类似设备。另外，本发明的一些步骤或功能可采用硬件来实现，例如，作为与处理器配合从而执行各个步骤或功能的电路。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

Claims

一种在计算机设备中确定移动用户的常驻点信息的方法，其中，该方法包括以下步骤：

a.获取所述移动用户的多个时空点信息，其中，所述时空点信息用于指示所述移动用户的空间位置以及移动用户位于该空间位置时对应的时间点信息；

b.基于聚类算法对所述多个时空点信息进行聚类分析，来确定所述移动用户的多个常驻点信息。
根据权利要求1所述的方法，其中，所述聚类算法需要设定聚类中心的数量。
根据权利要求2所述的方法，其中，所述步骤b包括以下步骤：

b1对于多个假设数量的全部或部分中的每个假设数量，将所述聚类算法的聚类中心的数量设定为该假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该假设数量对应的聚类结果，并根据多个假设数量分别对应的多个聚类结果，选择一个假设数量；

b2根据所选择的假设数量对应的聚类结果，确定所述移动用户的多个常驻点信息。
根据权利要求3所述的方法，其中，所述步骤b1包括以下步骤：

b111对于所述多个假设数量中一个未确定其对应的聚类结果的假设数量，将所述聚类算法的聚类中心的数量设定为该假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该假设数量对应的聚类结果；

b112当该假设数量对应的聚类结果符合第一预定条件时，将该假设数量作为所述所选择的假设数量；

b113当该假设数量对应的聚类结果不符合所述第一预定条件时，重复所述步骤b111。
根据权利要求3所述的方法，其中，所述多个假设数量递增或递减，所述步骤b1包括以下步骤：

b121将所述多个假设数量中的一个假设数量作为当前假设数量，将所述聚类算法的聚类中心的数量设定为该当前假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该当前假设数量对应的聚类结果；

b122将所述聚类算法的聚类中心的数量设定为该当前假设数量的下一个假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该下一个假设数量对应的聚类结果；

b123当所述下一个假设数量对应的聚类结果差于该当前假设数量对应的聚类结果时，将该当前假设数量作为所述所选择的假设数量；

b124当所述下一个假设数量对应的聚类结果优于该当前假设数量对应的聚类结果时，将该下一个假设数量作为该当前假设数量，重复所述步骤b122。
根据权利要求3所述的方法，其中，所述步骤b1包括以下步骤：

-对于多个假设数量中的每个假设数量，将所述聚类算法的聚类中心的数量设定为该假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该假设数量对应的聚类结果；

-根据所述多个假设数量分别对应的多个聚类结果，选择一个假设数量。
根据权利要求3至6中任一项所述的方法，其中，基于以下至少一项，来根据多个假设数量分别对应的多个聚类结果选择一个假设数量：

-假设数量对应的聚类结果中的类包含的时空点信息的数量；

-假设数量对应的聚类结果中的类的离散度。
根据权利要求1至7中任一项所述的方法，其中，该方法还包括以下步骤：

x根据所述多个常驻点信息，确定所述多个常驻点信息中的每个常驻点信息的类型。
根据权利要求8所述的方法，其中，所述步骤x包括对所述多个常驻点信息中的每个执行的以下步骤：

-获取该常驻点信息的位置属性信息和时间属性信息；

-根据所述位置属性信息和时间属性信息，确定该常驻点信息的类型。
根据权利要求1至9中任一项所述的方法，其中，所述时空点信息为四维空间向量。
一种在计算机设备中确定移动用户的常驻点信息的装置，其中，该装置包括以下装置：

用于获取所述移动用户的多个时空点信息的装置，其中，所述时空点信息用于指示所述移动用户的空间位置以及移动用户位于该空间位置时对应的时间点信息；

用于基于聚类算法对所述多个时空点信息进行聚类分析，来确定所述移动用户的多个常驻点信息的装置。
根据权利要求11所述的装置，其中，所述聚类算法需要设定聚类中心的数量。
根据权利要求12所述的装置，其中，所述用于确定多个常驻点信息的装置包括以下装置：

用于对于多个假设数量的全部或部分中的每个假设数量，将所述聚类算法的聚类中心的数量设定为该假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该假设数量对应的聚类结果，并根据多个假设数量分别对应的多个聚类结果，选择一个假设数量的装置；

用于根据所选择的假设数量对应的聚类结果，确定所述移动用户的多个常驻点信息的装置。
根据权利要求13所述的装置，其中，所述用于选择一个假设数量的装置包括以下装置：

用于对于所述多个假设数量中一个未确定其对应的聚类结果的假设数量，将所述聚类算法的聚类中心的数量设定为该假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该假设数量对应的聚类结果的装置；

用于当该假设数量对应的聚类结果符合第一预定条件时，将该假设数量作为所述所选择的假设数量的装置；

用于当该假设数量对应的聚类结果不符合所述第一预定条件时，触发所述用于对于所述多个假设数量中一个未确定其对应的聚类结果的假设数量，获得与该假设数量对应的聚类结果的装置重复执行操作的装置。
根据权利要求13所述的装置，其中，所述多个假设数量递增或递减，所述用于选择一个假设数量的装置包括以下装置：

用于将所述多个假设数量中的一个假设数量作为当前假设数量，将所述聚类算法的聚类中心的数量设定为该当前假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该当前假设数量对应的聚类结果的装置；

用于将所述聚类算法的聚类中心的数量设定为该当前假设数量的下一个假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该下一个假设数量对应的聚类结果的装置；

用于当所述下一个假设数量对应的聚类结果差于该当前假设数量对应的聚类结果时，将该当前假设数量作为所述所选择的假设数量的装置；

用于当所述下一个假设数量对应的聚类结果优于该当前假设数量对应的聚类结果时，将该下一个假设数量作为该当前假设数量，触发所述用于获得与该下一个假设数量对应的聚类结果的装置重复执行操作的装置。
根据权利要求13所述的装置，其中，所述用于选择一个假设数量的装置包括以下装置：

用于对于多个假设数量中的每个假设数量，将所述聚类算法的聚类中心的数量设定为该假设数量，并基于所述聚类算法对所述多个时空点信息进行聚类分析，获得与该假设数量对应的聚类结果的装置；

用于根据所述多个假设数量分别对应的多个聚类结果，选择一个假设数量的装置。
根据权利要求13至16中任一项所述的装置，其中，基于以下至少一项，来根据多个假设数量分别对应的多个聚类结果选择一个假设数量：

-假设数量对应的聚类结果中的类包含的时空点信息的数量；

-假设数量对应的聚类结果中的类的离散度。
根据权利要求11至17中任一项所述的装置，其中，该装置还包括以下装置：

用于根据所述多个常驻点信息，确定所述多个常驻点信息中的每个常驻点信息的类型的装置。
根据权利要求18所述的装置，其中，所述用于确定常驻点信息的类型的装置包括对所述多个常驻点信息中的每个执行操作的以下装置：

用于获取该常驻点信息的位置属性信息和时间属性信息的装置；

用于根据所述位置属性信息和时间属性信息，确定该常驻点信息的类型的装置。
根据权利要求11至19中任一项所述的装置，其中，所述时空点信息为四维空间向量。
一种非易失性计算机存储介质，所述非易失性计算机存储介质存储有计算机指令，当所述计算机指令被执行时，如权利要求1至10中任一项所述的方法被执行。
一种计算机程序产品，当所述计算机程序产品被运行时，如权利要求1至10中任一项所述的方法被执行。
一种计算机设备，所述计算机设备包括：

一个或者多个处理器；

存储器；

一个或者多个程序，所述一个或者多个程序存储在所述存储器中，当被所述一个或者多个处理器执行时，如权利要求1至10中任一项所述的方法被执行。