CN113449217A - 迁移轨迹、热力图生成及网点确定的方法、设备 - Google Patents

迁移轨迹、热力图生成及网点确定的方法、设备 Download PDF

Info

Publication number
CN113449217A
CN113449217A CN202010229588.3A CN202010229588A CN113449217A CN 113449217 A CN113449217 A CN 113449217A CN 202010229588 A CN202010229588 A CN 202010229588A CN 113449217 A CN113449217 A CN 113449217A
Authority
CN
China
Prior art keywords
migration
time
track
tracks
position points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010229588.3A
Other languages
English (en)
Inventor
王骏亚
刘金昊
谢冬辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Banma Zhixing Network Hongkong Co Ltd
Original Assignee
Banma Zhixing Network Hongkong Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Banma Zhixing Network Hongkong Co Ltd filed Critical Banma Zhixing Network Hongkong Co Ltd
Priority to CN202010229588.3A priority Critical patent/CN113449217A/zh
Publication of CN113449217A publication Critical patent/CN113449217A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Navigation (AREA)

Abstract

本申请实施例提供了一种迁移轨迹以及热力图的生成方案,该方案在生成迁移轨迹时,能够利用多个行为周期的数据对迁移轨迹进行校正,即使获取的位置点数据是不连续的,也可以获得较为准确的迁移轨迹,对数据质量的要求较低,并且在生成热力图时可以利用前述的方式获得大量用户的迁移轨迹和对应的迁移时间,进而生成轨迹迁移区域在预设时间段内的热力图,准确性高且对数据质量的要求较低。

Description

迁移轨迹、热力图生成及网点确定的方法、设备
技术领域
本申请涉及信息技术领域,尤其涉及一种迁移轨迹、热力图生成及网点确定的方法、设备。
背景技术
共享出行运营商在对一个城市进行运营时,需要在城市中选择若干个点作为网点的布局,来停放车辆。而运营商当前选址的手段主要是在城市中观察哪里人多,即将网点选择在哪里。此方法无数据依据,仅靠人工分析,不够准确。若需要依赖于数据进行分析,则需要获取用户的迁移轨迹,并通过迁移轨迹判断哪里人多,为网点的选择提供数据支持。
目前能够获得用户迁移轨迹的方案主要是地图厂商的用户轨迹系统。但是此类系统在获取用户轨迹时,所使用的数据是用户的导航数据,由于用户往往仅在路线不熟悉的时候才会使用导航,因此此类数据具有不连续性,无法形成用户有效的迁移轨迹。
发明内容
本申请的一个目的是提供一种迁移轨迹、热力图生成及网点确定的方法、设备,用以解决无法形成用户有效的迁移轨迹,并基于有效的迁移轨迹实现热力图生成以及网点确定的问题。
本申请实施例提供了一种迁移轨迹生成方法,该方法包括:
获取用户多个行为周期的位置点以及所述位置点对应的定位时间,所述定位时间为记录所述位置点的时间;
对所述位置点进行聚类处理,获取轨迹迁移区域,每个轨迹迁移区域对应于聚类处理获得的一个类别;
基于不同轨迹迁移区域中具有相邻定位时间的位置点,确定不同轨迹迁移区域之间的迁移轨迹和迁移时间,所述迁移轨迹的迁移时间为所述相邻定位时间;
根据同类迁移轨迹在每个行为周期中的迁移时间,对所述同类迁移轨迹的迁移时间进行校正,所述同类迁移轨迹为起止轨迹迁移区域相同的迁移轨迹。
本申请实施例还提供了一种确定车辆网点的方法,该方法包括:
根据前述的迁移轨迹生成方法获取多个用户的迁移轨迹和迁移时间;
根据所述迁移轨迹和迁移时间,确定预设时间段内关于迁移轨迹的轨迹迁移区域的热度信息,所述热度信息为用户进入和/或离开轨迹迁移区域的次数;
根据所述热度信息,确定车辆的网点地址以及所述网点地址的车辆数量。
本申请实施例还提供了一种热力图生成方法,该方法包括:
根据前述的迁移轨迹生成方法获取多个用户的迁移轨迹和迁移时间;
根据所述迁移轨迹和迁移时间,确定预设时间段内关于迁移轨迹的轨迹迁移区域的热度信息,所述热度信息为用户进入和/或离开轨迹迁移区域的次数;
根据所述热度信息,生成所述轨迹迁移区域在预设时间段内的热力图。
本申请实施例还提供了一种迁移轨迹生成设备,该设备包括:
数据获取模块,用于获取用户多个行为周期的位置点以及所述位置点对应的定位时间,所述定位时间为记录所述位置点的时间;
聚类模块,用于对所述位置点进行聚类处理,获取轨迹迁移区域,每个轨迹迁移区域对应于聚类处理获得的一个类别;
轨迹生成模块,用于基于不同轨迹迁移区域中具有相邻定位时间的位置点,确定不同轨迹迁移区域之间的迁移轨迹和迁移时间,所述迁移轨迹的迁移时间为所述相邻定位时间;
校正模块,用于根据同类迁移轨迹在每个行为周期中的迁移时间,对所述同类迁移轨迹的迁移时间进行校正,所述同类迁移轨迹为起止轨迹迁移区域相同的迁移轨迹。
本申请实施例还提供了一种确定车辆网点的设备,该设备包括:
数据获取模块,用于获取用户多个行为周期的位置点以及所述位置点对应的定位时间,所述定位时间为记录所述位置点的时间;
聚类模块,用于对所述位置点进行聚类处理,获取轨迹迁移区域,每个轨迹迁移区域对应于聚类处理获得的一个类别;
轨迹生成模块,用于基于不同轨迹迁移区域中具有相邻定位时间的位置点,确定不同轨迹迁移区域之间的迁移轨迹和迁移时间,所述迁移轨迹的迁移时间为所述相邻定位时间;
校正模块,用于根据同类迁移轨迹在每个行为周期中的迁移时间,对所述同类迁移轨迹的迁移时间进行校正,所述同类迁移轨迹为起止轨迹迁移区域相同的迁移轨迹;
信息处理模块,用于根据所述迁移轨迹和迁移时间,确定预设时间段内关于迁移轨迹的轨迹迁移区域的热度信息,所述热度信息为用户进入和/或离开轨迹迁移区域的次数;
网点确定模块,用于根据所述热度信息,确定车辆的网点地址以及所述网点地址的车辆数量。
本申请实施例还提供了一种热力图生成设备,该设备包括:
数据获取模块,用于获取用户多个行为周期的位置点以及所述位置点对应的定位时间,所述定位时间为记录所述位置点的时间;
聚类模块,用于对所述位置点进行聚类处理,获取轨迹迁移区域,每个轨迹迁移区域对应于聚类处理获得的一个类别;
轨迹生成模块,用于基于不同轨迹迁移区域中具有相邻定位时间的位置点,确定不同轨迹迁移区域之间的迁移轨迹和迁移时间,所述迁移轨迹的迁移时间为所述相邻定位时间;
校正模块,用于根据同类迁移轨迹在每个行为周期中的迁移时间,对所述同类迁移轨迹的迁移时间进行校正,所述同类迁移轨迹为起止轨迹迁移区域相同的迁移轨迹;
信息处理模块,用于根据所述迁移轨迹和迁移时间,确定预设时间段内关于迁移轨迹的轨迹迁移区域的热度信息,所述热度信息为用户进入和/或离开轨迹迁移区域的次数;
图形生成模块,用于根据所述热度信息,生成所述轨迹迁移区域在预设时间段内的热力图。
本申请的一些实施例还提供了一种计算设备,其中,该设备包括用于存储计算机程序指令的存储器和用于执行计算机程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发所述设备执行前述的迁移轨迹生成方法、热力图生成方法或者是确定车辆网点的方法。
本申请的另一些实施例还提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机可读指令可被处理器执行以实现所述的迁移轨迹生成方法或热力图生成方法或者是确定车辆网点的方法。
本申请实施例提供的迁移轨迹生成方案中,在获取用户多个行为周期的位置点以及所述位置点对应的定位时间后,然后对所述位置点进行聚类处理,获取轨迹迁移区域,并基于不同轨迹迁移区域中具有相邻定位时间的位置点,确定不同轨迹迁移区域之间的迁移轨迹和迁移时间,并且可以根据同类迁移轨迹在每个行为周期中的迁移时间,对所述同类迁移轨迹的迁移时间进行校正。由于本方案能够利用多个行为周期的数据对迁移轨迹进行校正,即使获取的位置点数据是不连续的,也可以获得较为准确的迁移轨迹,对数据质量的要求较低。
而本申请实施例提供的热力图生成方案中,利用了前述迁移轨迹生成方案来获得的大量用户的迁移轨迹和对应的迁移时间,进而生成轨迹迁移区域在预设时间段内的热力图,准确性高且对数据质量的要求较低。此外,本申请实施例提供的确定车辆网点的方案能够为车辆网点的选择提供准确的数据支持,从而能够选取准确地网点地址,并在这些网点地址处投放上恰当数量的车辆。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1为本申请实施例提供的一种迁移轨迹生成方法的处理流程图;
图2为本申请实施例中的一种位置点的分布示意图;
图3为本申请实施例中的另一种位置点的分布示意图;
图4为本申请实施例中确定轨迹迁移区域时的处理流程图;
图5为本申请实施例中一条迁移轨迹的示意图;
图6为本申请实施例中基于位置点确定候选迁移轨迹的示意图;
图7为本申请实施例中排除噪声位置点后确定迁移轨迹的示意图;
图8为本申请实施例中对迁移轨迹的迁移时间进行校正时的处理流程图;
图9为本申请实施例中迁移轨迹path_n1的迁移时间分布直方图;
图10为本申请实施例中迁移轨迹path_n2的迁移时间分布直方图;
图11为本申请实施例中迁移轨迹path_n3的迁移时间分布直方图;
图12为本申请实施例中的一种总体迁移时间分布的直方图;
图13为本申请实施例中的另一种总体迁移时间分布的直方图;
图14为本申请实施例提供的一种热力图生成方法的处理流程图;
图15为本申请实施例中生成的一个热力图的示意图;
图16为本申请实施例提供的一种迁移轨迹生成设备的结构示意图;
图17为本申请实施例提供的一种计算设备的结构示意图;
图18为本申请实施例中部分geohash区域的示意图;
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本申请作进一步详细描述。
在本申请一个典型的配置中,终端、服务网络的设备均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的装置或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
本申请实施例提供了一种迁移轨迹生成方法,该方法在获取用户多个行为周期的位置点以及所述位置点对应的定位时间后,生成用户在每个行为周期中的迁移轨迹和迁移时间,能够利用多个行为周期的数据对迁移轨迹进行校正,即使获取的位置点数据是不连续的,也可以获得较为准确的迁移轨迹,对数据质量的要求较低。
在实际场景中,该方法的执行主体可以是用户设备、网络设备或者用户设备与网络设备通过网络相集成所构成的设备,此外也可以是运行于上述设备中的程序。所述用户设备包括但不限于计算机、手机、平板电脑等各类终端设备;所述网络设备包括但不限于如网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现。在此,云由基于云计算(Cloud Computing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟计算机。
图1示出了本申请实施例提供的一种迁移轨迹生成方法的处理流程,该方法至少包括以下处理流程:
步骤S101,获取用户多个行为周期的位置点以及所述位置点对应的定位时间。所述位置点即为用户通过其所使用的终端设备所记录的位置信息,实际可以采用经纬度、geohash区域编码等各类形式,而所述定位时间则是记录这些位置点的时间。例如手机在2019-1-1的22:22:22开始,每隔10分钟记录一次位置点,位置点采用geohash区域编码的形式表示,由此可以获取到如下的数据:
位置点1:WX4EQR,定位时间:2019-1-1,22:22:22
位置点2:WX4EQX,定位时间:2019-1-1,22:32:22
位置点3:WX4EQV,定位时间:2019-1-1,22:42:22
位置点3:WX4EQV,定位时间:2019-1-1,22:52:22
……
本实施例中,需要获取多个行为周期的数据,所述行为周期可以是根据实际场景的需求确定,例如需要对用户每天的行为进行分析获得用户在一天中的迁移轨迹,则可以将行为周期设定为一天,在获取用户的位置点和定位时间的数据时,可以获取多天的数据进行后续处理。例如,本实施例中,可以获取用户在10天、20天甚至一个月中的所有位置点及其对应的定位时间。
在本申请的一些实施中,所获取的数据可以来自于用户所使用的终端设备中各类应用程序所上报的用户行为日志,每条用户行为日志中包含了用户唯一标识、位置信息和定位时间,在用户的终端设备在使用任意与地理位置相关的功能时,记录用户唯一标识以及当前的定位信息和时间即可生成本方案所需的数据。例如,用户打开任意获取了定位权限的应用程序时,即可记录相关信息以实现本方案所需数据的采集。
步骤S102,对所述位置点进行聚类处理,获取轨迹迁移区域。其中,每个轨迹迁移区域对应于聚类处理获得的一个类别,例如,图2示出了11个位置点的分布示意图,对这些位置点进行聚类处理之后,获得三个聚类的类别,分别为类别g1、g2和g3,由此获取三个轨迹迁移区域a、b、c,分别对应于聚类处理获得的三个类别g1、g2和g3。
在实际场景中,根据输入的位置点以及聚类算法的区别,聚类结果也会存在区别。为了使得结果更加准确,可以将包含位置点少于预设值的类别认定为是噪声数据,例如,本实施例中该预设值可以是3个,即少于三个位置点的类别即为噪声数据。图3示出了另一个位置点的分布示意图,对其进行聚类处理之后,获得4个聚类的类别g4、g5、g6和g7,其中,类别g5中仅包含2个位置点,而g6仅包含一个位置点,则将类别g5和g6确定为噪声数据,由此获得两个轨迹迁移区域d、e,分别对应于聚类处理获得的两个类别g4和g7。
在本申请的一些实施例中,采用了基于geohash改进的DBSCAN算法(Density-Based Spatial Clustering of Applications with Noise,采用具有噪声的基于密度的聚类算法)。该算法与常规的DBSCAN算法的区别在于:在确定对象(即位置点)的邻域集时,是将所述位置点的相关geohash区域中所包含的位置点作为邻域集。图4示出了本申请实施例中基于geohash改进的DBSCAN算法确定轨迹迁移区域时的处理流程,包括以下的处理步骤:
步骤S401,随机选取一个位置点N。
步骤S402,判断位置点N是否遍历过,若为是,则返回步骤S401,若为否,则执行步骤S403。
步骤S403,判断位置点N是否为噪声位置点,若为是,则返回步骤S401,若为否,则执行步骤S404。
步骤S404,将位置点N标记为遍历过。
步骤S405,获取位置点N的相关geohash区域中所包含的位置点,作为领域集T。其中,相关geohash区域所涉及的具体geohash区域可以根据实际场景的需求设定,相当于常规DBSCAN算法设定不同的邻域半径,例如,相关geohash区域可以仅是位置点N所在的geohash区域,图18所示,若位置点N位于区域WX4EQW,则此时的相关geohash区域即为区域WX4EQW。或者,相关geohash区域也可以是所述位置点所属的中心geohash区域以及与所述中心geohash区域相邻的8个相邻geohash区域,仍以图18为例,位置点N的相关geohash区域即为中心区域WX4EQW以及8个相邻区域WX4EQR、WX4EQX、WX4EQZ、WX4EQQ、WX4EQY、WX4EQM、WX4EQT、WX4EQT。
步骤S406,将邻域集T加入点集C。
步骤S407,判断点集C中的位置点的数量是否小于预设值,若为是,则执行步骤S408,否则,执行步骤S409。
步骤S408,将位置点N标记为噪声位置点,噪声位置点即为离群点,不会划分至聚类的类别中。
步骤S409,将位置点N加入到类别g1。
步骤S410,从点集C中随机选取位置点M。
步骤S411,判断位置点M是否遍历过,若为是,则返回步骤S410,若为否,则执行步骤S412。
步骤S412,将位置点M标记为遍历过。
步骤S413,获取位置点M的相关geohash区域中所包含的位置点,作为领域集M。
步骤S414,判断邻域集U中的位置点的数量是否小于预设值,若为是,则返回步骤S410,否则,执行步骤S415。
步骤S415,将邻域集U加入点集C。
步骤S416,判断位置点M是否属于其它类别,若为是,则返回步骤S410,否则执行步骤S417。
步骤S417,将位置点M加入类别g1。
由此,通过步骤S410至S417直至遍历点集C中的所有位置点。在遍历点集C中的所有位置点之后,即可获得聚类获得一个类别g1,然后重新返回步骤S401,尝试聚类获得其它的类别,直至遍历输入的所有位置点。由于在聚类算法中引入了geohash方式建立的区域编码,可以提高对位置进行检索时的效率,并且能够与地理信息系统中的POI(Point ofInformation,信息点)更加紧密的结合,相较于直接基于距离进行聚类的方式,处理效率更高且方便各类实际应用的接入。
步骤S103,基于不同轨迹迁移区域中具有相邻定位时间的位置点,确定不同轨迹迁移区域之间的迁移轨迹和迁移时间。由于在获取数据时,位置点具有对应的定位时间,此时可以基于定位时间对这些位置点进行排序,若不同轨迹迁移区域中的两个不同位置点在排序时相邻,即这两个位置点具有相邻定位时间,则可以确定一条迁移轨迹,该迁移轨迹由时间排序在前的位置点所属的轨迹迁移区域指向时间排序在后的位置点所属的轨迹迁移区域,而对应的迁移时间则是这两个位置点所对应的定位时间。
以图2所示的场景为例,位置点的编号表示其定位时间的先后顺序,即位置点1和位置点2即为具有相邻定位时间的两个位置点,而位置点2和位置点3也同样是具有相邻定位时间的两个位置点。由于位置点1和位置点2属于同一个轨迹迁移区域a,而位置点2和位置点3则分别属于不同的轨迹迁移区域a和b,由此可以确定一条迁移轨迹path2,如图5所示。该迁移轨迹path2由轨迹迁移区域a指向轨迹迁移区域b,且其迁移时间从位置点2的定位时间起始并至位置点3的定位时间终止。若位置点2的定位时间为2019-1-1的22:32:22,位置点3的定位时间为2019-1-1的22:42:22,此时,该迁移轨迹path2可以表示该用户在2019-1-1的22:32:22至22:42:22的时间中,从轨迹迁移区域a移动到了轨迹迁移区域b。
本申请的一些实施例在确定迁移轨迹时,可以先基于具有相邻定位时间的两个位置点,确定候选迁移轨迹。例如,基于图2中的所有具有响铃定位时间的位置点确定候选迁移轨迹后,可以获取到10条候选迁移轨迹,分别为path1~path10,如图6所示。然后,将起止位置点分别属于不同轨迹迁移区域的候选迁移轨迹,确定为不同轨迹迁移区域之间的迁移轨迹,并将起止位置点的相邻定位时间确定为所述迁移轨迹的迁移时间。在候选迁移轨迹path1~path10中,有三条候选迁移轨迹的起止位置点分别属于不同轨迹迁移区域,即path2的起止位置点2和3分别属于轨迹迁移区域a和b,path5的起止位置点5和6分别属于轨迹迁移区域b和c,以及path9的起止位置点9和10分别属于轨迹迁移区域c和a。由此,可以将path2、path5和path9确定为本方案所需的迁移轨迹,并基于其所涉及的起止位置点确定迁移时间。
此外,在实际场景中输入的数据中,可能会存在一些噪声位置点,这些噪声位置点为不属于任意一个轨迹迁移区域。例如,以图3所示的场景为例,其中的位置点3、5和9即为噪声位置点,在在基于具有相邻定位时间的两个位置点,确定候选迁移轨迹之前,可以先排除这些排除噪声位置点,使得确定候选迁移轨迹时跳过这些噪声位置点。如图3中,位置点2和3之间理论上可以形成一条候选迁移轨迹,但是由于位置点3是噪声位置点,不予考虑,在确定候选迁移轨迹时,排除该位置点3,确定的迁移轨迹直接在位置点2和4之间形成。同理,排除位置点5和9,并考虑位置点所属的轨迹迁移区域,可以确定此场景中的迁移轨迹如图7所示。
步骤S104,根据同类迁移轨迹在每个行为周期中的迁移时间,对所述同类迁移轨迹的迁移时间进行校正。可以将起止的轨迹迁移区域均相同迁移轨迹可以认定为同类迁移轨迹,例如,path_n1和path_n2都是由轨迹迁移区域a指向轨迹迁移区域b,由此,可以将path_n1和path_n2认为是同类迁移轨迹path_ab
实际场景中,对于有一定周期性行动规律的用户,会在每个周期的相似时间产生相同的迁移轨迹,例如用户会会每天早上都会在从家里出发到达单位,因此以每日为行为周期划分数据时,每天都会存在一条由家里指向单位的迁移轨迹。但是在实际场景中,数据采集可能是稀疏的,因此使用户在每个行为周期中按照相同轨迹行动,记录位置点的定位时间也可能存在区别。由此,可以对所述同类迁移轨迹的迁移时间进行校正,通过长时间内多周期的数据对稀疏的数据进行补充,使其迁移时间更加准确。
由于输入的数据涉及到多个行为周期,进行后续处理时,可以将数据按照行为周期划分之后,按照行为周期的粒度分别单独处理,也可以将多个行为周期的数据一起处理之后,再将处理结果按照行为周期进行划分。例如,在通过聚类确定轨迹迁移区域以及确定迁移轨迹时,可以按照行为周期对输入数据进行分组,单独处理每组数据,以此分别获得每个行为周期的迁移轨迹和迁移时间。或者,在通过聚类确定轨迹迁移区域以及确定迁移轨迹时,可以基于所有的输入数据一起处理,在获得确定迁移轨迹和迁移时间之后,再将数据按照行为周期进行分组。
图8示出了一种对迁移轨迹的迁移时间进行校正的方式,包括以下的处理步骤:
步骤S801,对同类迁移轨迹在每个行为周期中的迁移时间,按照预设时间粒度进行离散化处理,获得同类迁移轨迹在每个行为周期中的迁移时间分布。
例如,本实施中可以将行为周期设定为日,而预设时间粒度则可以是小时,对于一个迁移时间为2019-1-1的6:32:22至2019-1-1的8:42:17的迁移轨迹path_n1,其迁移时间涉及6点钟、7点钟和8点钟,可以表示为[6,7,8],图9为其对应的直方图,图中涉及到的时间标记为1,未涉及的时间标记为0。若迁移轨迹path_n2和path_n3为同类迁移轨迹,迁移时间分别为[7,8,9]和[2,3,4,5,6,7,8],对应的直方图分别为图10和图11。
步骤S802,对所述同类迁移轨迹在每个行为周期中的迁移时间分布进行叠加处理,获得所述同类迁移轨迹的总体迁移时间分布。以前述的三个同类迁移轨迹path_n1、path_n2和path_n3为例,对其进行叠加处理之后,获得总体迁移时间分布可以表示为如下的序列:[0,1,1,1,1,2,3,2,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0],对应的直方图为图12。
步骤S803,根据所述同类迁移轨迹的总体迁移时间分布,对所述同类迁移轨迹的迁移时间进行校正。从总体迁移时间分布中可以看出该同类迁移轨迹的迁移时间中的涉及哪一段时间的概率更高,由此可以将该段时间作为核心时间段对迁移时间进行校正。
在本申请的一些实施例中,可以根据所述迁移轨迹的总体迁移时间分布,将分布值大于第一阈值的时间区间确定核心时间段,然后根据所述核心时间段,确定所述同类迁移轨迹的迁移时间。所述第一阈值可以与分布最大值相关,例如设定为分布最大值的1/2,以图12所示的总体迁移时间分布中,分布最大值为3,则第一阈值为1.5。而分布值大于1.5的时间为6点钟、7点钟和8点钟,分别为2、3和2。因此,将6点钟、7点钟和8点钟确定为核心时间段,记为6-8,将其确定为该同类迁移轨迹的迁移时间。
在实际场景中,由于数据采集是稀疏的,在确定的核心时间段时,可能会产生非连续的时间段。因此,若所述核心时间段为连续的时间段,则将所述连续时间段所覆盖的时间确定为所述同类迁移轨迹的迁移时间即可。例如前述场景中核心时间段为6点钟、7点钟和8点钟,则将所述核心时间段所覆盖的时间,即6点钟至8点钟,确定为所述同类迁移轨迹的迁移时间。若所述核心时间段为非连续的时间段,例如当同类迁移轨迹的总体迁移时间分布如图13所示时,其对应的序列可以是[0,0,1,1,3,2,1,3,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0]。由此可知,核心时间段为5点钟、6点钟和8点钟,为非连续的时间段,因此可以将所述核心时间段的起始时间(5点钟)至截止时间(8点钟)所覆盖的时间,即5点钟至8点钟,确定为所述同类迁移轨迹的迁移时间。
由此,本方案无需依赖连续的用户定位数据,只需较为稀疏的用户定位数据,通过多周期校正的方式就能完成对用户迁移轨迹的有效挖掘,数据质量要求低,计算代价小,运行速度快,能够适应海量数据的场景。
此外,本申请实施例还提供了一种热力图生成方法,该方法的处理流程如图14所示,包括以下的处理步骤:
步骤S1401,采用前述的迁移轨迹生成方法确定多个用户的迁移轨迹和迁移时间。
步骤S1402,然后根据所述迁移轨迹和迁移时间,确定预设时间段内关于迁移轨迹的轨迹迁移区域的热度信息。本申请实施例中,热度信息可以是用户进入和/或离开轨迹迁移区域的次数,由于迁移轨迹是从一个轨迹迁移区域指向另一个轨迹迁移区域,通过迁移轨迹和迁移时间即可确定,一个用户经常会在什么时间离开某一区域,又会在什么时间到达某一区域。而所述预设时间段可以根据实际场景的需求设定,例如当想要了解8点钟至9点钟这一时间段的某市的人口流出热力图时,可以获取迁移时间与该时间段相关的迁移轨迹,由此即可确定8点钟至9点钟这一时间段内用户离开某市各个轨迹迁移区域的次数。
步骤S1403,根据所述热度信息,生成所述轨迹迁移区域在预设时间段内的热力图。例如,热力图中可以采用色彩区分各个轨迹迁移区域的热度信息,以前述某市的人口流出热力图为例,即预设时间段内用户离开轨迹迁移区域的次数不同,则在热力图中该轨迹迁移区域采用的颜色也不同,如图15即本实施例中预设时间段内某市的人口流出热力图,其中带起止点的线段即为部分迁移轨迹。
由于本方案利用了前述迁移轨迹生成方案来获得的大量用户的迁移轨迹和对应的迁移时间,进而生成轨迹迁移区域在预设时间段内的热力图,因此,准确性高且对数据质量的要求较低。
在本申请的另一些实施中,还可以将前述迁移轨迹生成方法获得的数据用于车辆投放网点以及投放数量的选取,例如车辆分时租赁领域中,运营商需要根据区域中人流的分布来选择车辆投放的网点的位置以及在这些网点中所投放的车辆数量,以提高这些车辆的利用效率,降低运营成本。
本实施例提供的一种确定车辆网点的方法中,首先可以采用前述的迁移轨迹生成方法确定多个用户的迁移轨迹和迁移时间,而后可以根据所述迁移轨迹和迁移时间,确定预设时间段内关于迁移轨迹的轨迹迁移区域的热度信息。在确定热度信息之后,可以根据热度信息确定车辆的网点地址和网点地址的车辆数量。
例如,若所述热度信息为一时间段内用户离开某市各个轨迹迁移区域的次数,通过该热度信息可以发现在该段时间内用户离开几个轨迹迁移区域(如轨迹迁移区域a、d、f和j)的次数特别多,那么这几个轨迹迁移区域中用户对于车辆的租赁使用需求也可能较高,因此将车辆投放的网点设置在这几个轨迹迁移区域中,这些车辆的使用效率应当会较高。由此,可以将车辆的网点地址确定为这几个轨迹迁移区域。
而在每个网点地址处所投放的车辆数量也可以根据热度信息确定,例如对于一个网点而言,通过热度信息可以确定该网点所对应的轨迹迁移区域在一段时间内用户离开和/或进入的次数。对于车辆分时租赁的场景而言,用户离开某一区域的次数越多,则表示用户从该区域租赁车辆并离开的可能性越高,这一区域车辆减少的可能性也就越高。而用户进入某一区域的次数越多,则表示用户从其它区域租赁车辆并进入该区域的可能性越高,这一区域车辆增加的可能性也就越高。在实际场景中,可以根据车辆的形式、该地区用户对车辆的使用习惯等因素,建立轨迹迁移区域的热度信息与车辆增减的相关关系,由此可以根据热度信息确定网点地址处所投放的车辆数量,使得车辆投放后的利用效率更高,降低运营成本。
基于同一发明构思,本申请实施例中还提供了一种迁移轨迹生成设备和热力图生成设备,所述设备对应的方法分别是前述实施例中的迁移轨迹生成方法和热力图生成方法,并且其解决问题的原理与该方法相似。
本申请实施例提供的迁移轨迹生成设备,该设备在获取用户多个行为周期的位置点以及所述位置点对应的定位时间后,生成用户在每个行为周期中的迁移轨迹和迁移时间,能够利用多个行为周期的数据对迁移轨迹进行校正,即使获取的位置点数据是不连续的,也可以获得较为准确的迁移轨迹,对数据质量的要求较低。
在实际场景中,所述迁移轨迹生成设备可以是用户设备、网络设备或者用户设备与网络设备通过网络相集成所构成的设备,此外也可以是运行于上述设备中的程序。所述用户设备包括但不限于计算机、手机、平板电脑等各类终端设备;所述网络设备包括但不限于如网络主机、单个网络服务器、多个网络服务器集或基于云计算的计算机集合等实现。在此,云由基于云计算(Cloud Computing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个虚拟计算机。
图16示出了本申请实施例提供的一种迁移轨迹生成设备的结构,包括数据获取模块1610、聚类模块1620、轨迹生成模块1630和校正模块1640。其中,数据获取模块1610用于获取用户多个行为周期的位置点以及所述位置点对应的定位时间;聚类模块1620用于对所述位置点进行聚类处理,获取轨迹迁移区域;轨迹生成模块1630用于基于不同轨迹迁移区域中具有相邻定位时间的位置点,确定不同轨迹迁移区域之间的迁移轨迹和迁移时间;校正模块1640用于根据同类迁移轨迹在每个行为周期中的迁移时间,对所述同类迁移轨迹的迁移时间进行校正。
所述位置点即为用户通过其所使用的终端设备所记录的位置信息,实际可以采用经纬度、geohash区域编码等各类形式,而所述定位时间则是记录这些位置点的时间。例如手机在2019-1-1的22:22:22开始,每隔10分钟记录一次位置点,位置点采用geohash区域编码的形式表示,由此可以获取到如下的数据:
位置点1:WX4EQR,定位时间:2019-1-1,22:22:22
位置点2:WX4EQX,定位时间:2019-1-1,22:32:22
位置点3:WX4EQV,定位时间:2019-1-1,22:42:22
位置点3:WX4EQV,定位时间:2019-1-1,22:52:22
……
本实施例中,需要获取多个行为周期的数据,所述行为周期可以是根据实际场景的需求确定,例如需要对用户每天的行为进行分析获得用户在一天中的迁移轨迹,则可以将行为周期设定为一天,在获取用户的位置点和定位时间的数据时,可以获取多天的数据进行后续处理。例如,本实施例中,可以获取用户在10天、20天甚至一个月中的所有位置点及其对应的定位时间。
在本申请的一些实施中,所获取的数据可以来自于用户所使用的终端设备中各类应用程序所上报的用户行为日志,每条用户行为日志中包含了用户唯一标识、位置信息和定位时间,在用户的终端设备在使用任意与地理位置相关的功能时,记录用户唯一标识以及当前的定位信息和时间即可生成本方案所需的数据。例如,用户打开任意获取了定位权限的应用程序时,即可记录相关信息以实现本方案所需数据的采集。
聚类模块1620获得的每个轨迹迁移区域对应于聚类处理获得的一个类别,例如,图2示出了11个位置点的分布示意图,对这些位置点进行聚类处理之后,获得三个聚类的类别,分别为类别g1、g2和g3,由此获取三个轨迹迁移区域a、b、c,分别对应于聚类处理获得的三个类别g1、g2和g3。
在实际场景中,根据输入的位置点以及聚类算法的区别,聚类结果也会存在区别。为了使得结果更加准确,可以将包含位置点少于预设值的类别认定为是噪声数据,例如,本实施例中该预设值可以是3个,即少于三个位置点的类别即为噪声数据。图3示出了另一个位置点的分布示意图,对其进行聚类处理之后,获得4个聚类的类别g4、g5、g6和g7,其中,类别g5中仅包含2个位置点,而g6仅包含一个位置点,则将类别g5和g6确定为噪声数据,由此获得两个轨迹迁移区域d、e,分别对应于聚类处理获得的两个类别g4和g7。
在本申请的一些实施例中,采用了基于geohash改进的DBSCAN算法(Density-Based Spatial Clustering of Applications with Noise,采用具有噪声的基于密度的聚类算法)。该算法与常规的DBSCAN算法的区别在于:在确定对象(即位置点)的邻域集时,是将所述位置点的相关geohash区域中所包含的位置点作为邻域集。图4示出了本申请实施例中基于geohash改进的DBSCAN算法确定轨迹迁移区域时的处理流程,包括以下的处理步骤:
步骤S401,随机选取一个位置点N。
步骤S402,判断位置点N是否遍历过,若为是,则返回步骤S401,若为否,则执行步骤S403。
步骤S403,判断位置点N是否为噪声位置点,若为是,则返回步骤S401,若为否,则执行步骤S404。
步骤S404,将位置点N标记为遍历过。
步骤S405,获取位置点N的相关geohash区域中所包含的位置点,作为领域集T。其中,相关geohash区域所涉及的具体geohash区域可以根据实际场景的需求设定,相当于常规DBSCAN算法设定不同的邻域半径,例如,相关geohash区域可以仅是位置点N所在的geohash区域,图18所示,若位置点N位于区域WX4EQW,则此时的相关geohash区域即为区域WX4EQW。或者,相关geohash区域也可以是所述位置点所属的中心geohash区域以及与所述中心geohash区域相邻的8个相邻geohash区域,仍以图18为例,位置点N的相关geohash区域即为中心区域WX4EQW以及8个相邻区域WX4EQR、WX4EQX、WX4EQZ、WX4EQQ、WX4EQY、WX4EQM、WX4EQT、WX4EQT。
步骤S406,将邻域集T加入点集C。
步骤S407,判断点集C中的位置点的数量是否小于预设值,若为是,则执行步骤S408,否则,执行步骤S409。
步骤S408,将位置点N标记为噪声位置点,噪声位置点即为离群点,不会划分至聚类的类别中。
步骤S409,将位置点N加入到类别g1。
步骤S410,从点集C中随机选取位置点M。
步骤S411,判断位置点M是否遍历过,若为是,则返回步骤S410,若为否,则执行步骤S412。
步骤S412,将位置点M标记为遍历过。
步骤S413,获取位置点M的相关geohash区域中所包含的位置点,作为领域集M。
步骤S414,判断邻域集U中的位置点的数量是否小于预设值,若为是,则返回步骤S410,否则,执行步骤S415。
步骤S415,将邻域集U加入点集C。
步骤S416,判断位置点M是否属于其它类别,若为是,则返回步骤S410,否则执行步骤S417。
步骤S417,将位置点M加入类别g1。
由此,通过步骤S410至S417直至遍历点集C中的所有位置点。在遍历点集C中的所有位置点之后,即可获得聚类获得一个类别g1,然后重新返回步骤S401,尝试聚类获得其它的类别,直至遍历输入的所有位置点。由于在聚类算法中引入了geohash方式建立的区域编码,可以提高对位置进行检索时的效率,并且能够与地理信息系统中的POI(Point ofInformation,信息点)更加紧密的结合,相较于直接基于距离进行聚类的方式,处理效率更高且方便各类实际应用的接入。
由于在获取数据时,位置点具有对应的定位时间,此时可以基于定位时间对这些位置点进行排序,若不同轨迹迁移区域中的两个不同位置点在排序时相邻,即这两个位置点具有相邻定位时间,则可以确定一条迁移轨迹,该迁移轨迹由时间排序在前的位置点所属的轨迹迁移区域指向时间排序在后的位置点所属的轨迹迁移区域,而对应的迁移时间则是这两个位置点所对应的定位时间。
以图2所示的场景为例,位置点的编号表示其定位时间的先后顺序,即位置点1和位置点2即为具有相邻定位时间的两个位置点,而位置点2和位置点3也同样是具有相邻定位时间的两个位置点。由于位置点1和位置点2属于同一个轨迹迁移区域a,而位置点2和位置点3则分别属于不同的轨迹迁移区域a和b,由此可以确定一条迁移轨迹path2,如图5所示。该迁移轨迹path2由轨迹迁移区域a指向轨迹迁移区域b,且其迁移时间从位置点2的定位时间起始并至位置点3的定位时间终止。若位置点2的定位时间为2019-1-1的22:32:22,位置点3的定位时间为2019-1-1的22:42:22,此时,该迁移轨迹path2可以表示该用户在2019-1-1的22:32:22至22:42:22的时间中,从轨迹迁移区域a移动到了轨迹迁移区域b。
本申请的一些实施例在确定迁移轨迹时,轨迹生成模块可以先基于具有相邻定位时间的两个位置点,确定候选迁移轨迹。例如,基于图2中的所有具有响铃定位时间的位置点确定候选迁移轨迹后,可以获取到10条候选迁移轨迹,分别为path1~path10,如图6所示。然后,轨迹生成模块将起止位置点分别属于不同轨迹迁移区域的候选迁移轨迹,确定为不同轨迹迁移区域之间的迁移轨迹,并将起止位置点的相邻定位时间确定为所述迁移轨迹的迁移时间。在候选迁移轨迹path1~path10中,有三条候选迁移轨迹的起止位置点分别属于不同轨迹迁移区域,即path2的起止位置点2和3分别属于轨迹迁移区域a和b,path5的起止位置点5和6分别属于轨迹迁移区域b和c,以及path9的起止位置点9和10分别属于轨迹迁移区域c和a。由此,可以将path2、path5和path9确定为本方案所需的迁移轨迹,并基于其所涉及的起止位置点确定迁移时间。
此外,在实际场景中输入的数据中,可能会存在一些噪声位置点,这些噪声位置点为不属于任意一个轨迹迁移区域。例如,以图3所示的场景为例,其中的位置点3、5和9即为噪声位置点,在在基于具有相邻定位时间的两个位置点,确定候选迁移轨迹之前,可以先排除这些排除噪声位置点,使得确定候选迁移轨迹时跳过这些噪声位置点。如图3中,位置点2和3之间理论上可以形成一条候选迁移轨迹,但是由于位置点3是噪声位置点,不予考虑,在确定候选迁移轨迹时,排除该位置点3,确定的迁移轨迹直接在位置点2和4之间形成。同理,排除位置点5和9,并考虑位置点所属的轨迹迁移区域,可以确定此场景中的迁移轨迹如图7所示。
校正模块在进行校正时,可以将起止的轨迹迁移区域均相同迁移轨迹可以认定为同类迁移轨迹,例如,path_n1和path_n2都是由轨迹迁移区域a指向轨迹迁移区域b,由此,可以将path_n1和path_n2认为是同类迁移轨迹path_ab
实际场景中,对于有一定周期性行动规律的用户,会在每个周期的相似时间产生相同的迁移轨迹,例如用户会会每天早上都会在从家里出发到达单位,因此以每日为行为周期划分数据时,每天都会存在一条由家里指向单位的迁移轨迹。但是在实际场景中,数据采集可能是稀疏的,因此使用户在每个行为周期中按照相同轨迹行动,记录位置点的定位时间也可能存在区别。由此,可以对所述同类迁移轨迹的迁移时间进行校正,通过长时间内多周期的数据对稀疏的数据进行补充,使其迁移时间更加准确。
由于输入的数据涉及到多个行为周期,进行后续处理时,可以将数据按照行为周期划分之后,按照行为周期的粒度分别单独处理,也可以将多个行为周期的数据一起处理之后,再将处理结果按照行为周期进行划分。例如,在通过聚类确定轨迹迁移区域以及确定迁移轨迹时,可以按照行为周期对输入数据进行分组,单独处理每组数据,以此分别获得每个行为周期的迁移轨迹和迁移时间。或者,在通过聚类确定轨迹迁移区域以及确定迁移轨迹时,可以基于所有的输入数据一起处理,在获得确定迁移轨迹和迁移时间之后,再将数据按照行为周期进行分组。
图8示出了一种对迁移轨迹的迁移时间进行校正的方式,包括以下的处理步骤:
步骤S801,校正模块对同类迁移轨迹在每个行为周期中的迁移时间,按照预设时间粒度进行离散化处理,获得同类迁移轨迹在每个行为周期中的迁移时间分布。
例如,本实施中可以将行为周期设定为日,而预设时间粒度则可以是小时,对于一个迁移时间为2019-1-1的6:32:22至2019-1-1的8:42:17的迁移轨迹path_n1,其迁移时间涉及6点钟、7点钟和8点钟,可以表示为[6,7,8],图9为其对应的直方图,图中涉及到的时间标记为1,未涉及的时间标记为0。若迁移轨迹path_n2和path_n3为同类迁移轨迹,迁移时间分别为[7,8,9]和[2,3,4,5,6,7,8],对应的直方图分别为图10和图11。
步骤S802,校正模块对所述同类迁移轨迹在每个行为周期中的迁移时间分布进行叠加处理,获得所述同类迁移轨迹的总体迁移时间分布。以前述的三个同类迁移轨迹path_n1、path_n2和path_n3为例,对其进行叠加处理之后,获得总体迁移时间分布可以表示为如下的序列:[0,1,1,1,1,2,3,2,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0],对应的直方图为图12。
步骤S803,校正模块根据所述同类迁移轨迹的总体迁移时间分布,对所述同类迁移轨迹的迁移时间进行校正。从总体迁移时间分布中可以看出该同类迁移轨迹的迁移时间中的涉及哪一段时间的概率更高,由此可以将该段时间作为核心时间段对迁移时间进行校正。
在本申请的一些实施例中,校正模块可以根据所述迁移轨迹的总体迁移时间分布,将分布值大于第一阈值的时间区间确定核心时间段,然后根据所述核心时间段,确定所述同类迁移轨迹的迁移时间。所述第一阈值可以与分布最大值相关,例如设定为分布最大值的1/2,以图12所示的总体迁移时间分布中,分布最大值为3,则第一阈值为1.5。而分布值大于1.5的时间为6点钟、7点钟和8点钟,分别为2、3和2。因此,将6点钟、7点钟和8点钟确定为核心时间段,记为6-8,将其确定为该同类迁移轨迹的迁移时间。
在实际场景中,由于数据采集是稀疏的,在确定的核心时间段时,可能会产生非连续的时间段。因此,若所述核心时间段为连续的时间段,则将所述连续时间段所覆盖的时间确定为所述同类迁移轨迹的迁移时间即可。例如前述场景中核心时间段为6点钟、7点钟和8点钟,则将所述核心时间段所覆盖的时间,即6点钟至8点钟,确定为所述同类迁移轨迹的迁移时间。若所述核心时间段为非连续的时间段,例如当同类迁移轨迹的总体迁移时间分布如图13所示时,其对应的序列可以是[0,0,1,1,3,2,1,3,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0]。由此可知,核心时间段为5点钟、6点钟和8点钟,为非连续的时间段,因此可以将所述核心时间段的起始时间(5点钟)至截止时间(8点钟)所覆盖的时间,即5点钟至8点钟,确定为所述同类迁移轨迹的迁移时间。
由此,本方案无需依赖连续的用户定位数据,只需较为稀疏的用户定位数据,通过多周期校正的方式就能完成对用户迁移轨迹的有效挖掘,数据质量要求低,计算代价小,运行速度快,能够适应海量数据的场景。
此外,本申请实施例还提供了一种热力图生成设备,该设备包括数据获取模块、聚类模块、轨迹生成模、校正模块、信息处理模块和网点确定模块。首先,由数据获取模块、聚类模块、轨迹生成模、校正模块,采用前述的迁移轨迹生成方案确定多个用户的迁移轨迹和迁移时间,而后由信息处理模块根据所述迁移轨迹和迁移时间,确定预设时间段内关于迁移轨迹的轨迹迁移区域的热度信息。图形生成模块可以根据所述热度信息,生成所述轨迹迁移区域在预设时间段内的热力图。
本申请实施例中,热度信息可以是用户进入和/或离开轨迹迁移区域的次数,由于迁移轨迹是从一个轨迹迁移区域指向另一个轨迹迁移区域,通过迁移轨迹和迁移时间即可确定,一个用户经常会在什么时间离开某一区域,又会在什么时间到达某一区域。而所述预设时间段可以根据实际场景的需求设定,例如当想要了解8点钟至9点钟这一时间段的某市的人口流出热力图时,可以获取迁移时间与该时间段相关的迁移轨迹,由此即可确定8点钟至9点钟这一时间段内用户离开某市各个轨迹迁移区域的次数。
热力图中可以采用色彩区分各个轨迹迁移区域的热度信息,以前述某市的人口流出热力图为例,即预设时间段内用户离开轨迹迁移区域的次数不同,则在热力图中该轨迹迁移区域采用的颜色也不同,如图15即本实施例中预设时间段内某市的人口流出热力图,其中带起止点的线段即为部分迁移轨迹。
利用了前述迁移轨迹生成方案来获得的大量用户的迁移轨迹和对应的迁移时间,进而生成轨迹迁移区域在预设时间段内的热力图,准确性高且对数据质量的要求较低。
在本申请的另一些实施中,还可以将前述迁移轨迹生成方案获得的数据用于车辆投放网点以及投放数量的选取,例如车辆分时租赁领域中,运营商需要根据区域中人流的分布来选择车辆投放的网点的位置以及在这些网点中所投放的车辆数量,以提高这些车辆的利用效率,降低运营成本。
本实施例提供的一种确定车辆网点的设备可以包括数据获取模块、聚类模块、轨迹生成模、校正模块、信息处理模块和网点确定模块。首先,由数据获取模块、聚类模块、轨迹生成模、校正模块,采用前述的迁移轨迹生成方案确定多个用户的迁移轨迹和迁移时间,而后由信息处理模块根据所述迁移轨迹和迁移时间,确定预设时间段内关于迁移轨迹的轨迹迁移区域的热度信息。在确定热度信息之后,可以由网点确定模块根据热度信息确定车辆的网点地址和网点地址的车辆数量。
例如,若所述热度信息为一时间段内用户离开某市各个轨迹迁移区域的次数,通过该热度信息可以发现在该段时间内用户离开几个轨迹迁移区域(如轨迹迁移区域a、d、f和j)的次数特别多,那么这几个轨迹迁移区域中用户对于车辆的租赁使用需求也可能较高,因此将车辆投放的网点设置在这几个轨迹迁移区域中,这些车辆的使用效率应当会较高。由此,可以将车辆的网点地址确定为这几个轨迹迁移区域。
而在每个网点地址处所投放的车辆数量也可以根据热度信息确定,例如对于一个网点而言,通过热度信息可以确定该网点所对应的轨迹迁移区域在一段时间内用户离开和/或进入的次数。对于车辆分时租赁的场景而言,用户离开某一区域的次数越多,则表示用户从该区域租赁车辆并离开的可能性越高,这一区域车辆减少的可能性也就越高。而用户进入某一区域的次数越多,则表示用户从其它区域租赁车辆并进入该区域的可能性越高,这一区域车辆增加的可能性也就越高。在实际场景中,可以根据车辆的形式、该地区用户对车辆的使用习惯等因素,建立轨迹迁移区域的热度信息与车辆增减的相关关系,由此可以根据热度信息确定网点地址处所投放的车辆数量,使得车辆投放后的利用效率更高,降低运营成本。
另外,本申请的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本申请的方法和/或技术方案。而调用本申请的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据程序指令运行的计算机设备的工作存储器中。在此,根据本申请的一些实施例包括一个如图17所示的计算设备,该设备包括存储有计算机可读指令的一个或多个存储器1710和用于执行计算机可读指令的处理器1720,其中,当该计算机可读指令被该处理器执行时,使得所述设备执行基于前述本申请的多个实施例的方法和/或技术方案。
此外,本申请的一些实施例还提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机可读指令可被处理器执行以实现前述本申请的多个实施例的方法和/或技术方案。
需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一些实施例中,本申请的软件程序可以通过处理器执行以实现上文步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (22)

1.一种确定车辆网点的方法,其中,该方法包括:
获取用户多个行为周期的位置点以及所述位置点对应的定位时间,所述定位时间为记录所述位置点的时间;
对所述位置点进行聚类处理,获取轨迹迁移区域,每个轨迹迁移区域对应于聚类处理获得的一个类别;
基于不同轨迹迁移区域中具有相邻定位时间的位置点,确定不同轨迹迁移区域之间的迁移轨迹和迁移时间,所述迁移轨迹的迁移时间为所述相邻定位时间;
根据同类迁移轨迹在每个行为周期中的迁移时间,对所述同类迁移轨迹的迁移时间进行校正,所述同类迁移轨迹为起止轨迹迁移区域相同的迁移轨迹;
根据所述迁移轨迹和迁移时间,确定预设时间段内关于迁移轨迹的轨迹迁移区域的热度信息,所述热度信息为用户进入和/或离开轨迹迁移区域的次数;
根据所述热度信息,确定车辆的网点地址以及所述网点地址的车辆数量。
2.一种迁移轨迹生成方法,其中,该方法包括:
获取用户多个行为周期的位置点以及所述位置点对应的定位时间,所述定位时间为记录所述位置点的时间;
对所述位置点进行聚类处理,获取轨迹迁移区域,每个轨迹迁移区域对应于聚类处理获得的一个类别;
基于不同轨迹迁移区域中具有相邻定位时间的位置点,确定不同轨迹迁移区域之间的迁移轨迹和迁移时间,所述迁移轨迹的迁移时间为所述相邻定位时间;
根据同类迁移轨迹在每个行为周期中的迁移时间,对所述同类迁移轨迹的迁移时间进行校正,所述同类迁移轨迹为起止轨迹迁移区域相同的迁移轨迹。
3.一种热力图生成方法,其中,该方法包括:
获取用户多个行为周期的位置点以及所述位置点对应的定位时间,所述定位时间为记录所述位置点的时间;
对所述位置点进行聚类处理,获取轨迹迁移区域,每个轨迹迁移区域对应于聚类处理获得的一个类别;
基于不同轨迹迁移区域中具有相邻定位时间的位置点,确定不同轨迹迁移区域之间的迁移轨迹和迁移时间,所述迁移轨迹的迁移时间为所述相邻定位时间;
根据同类迁移轨迹在每个行为周期中的迁移时间,对所述同类迁移轨迹的迁移时间进行校正,所述同类迁移轨迹为起止轨迹迁移区域相同的迁移轨迹;
根据所述迁移轨迹和迁移时间,确定预设时间段内关于迁移轨迹的轨迹迁移区域的热度信息,所述热度信息为用户进入和/或离开轨迹迁移区域的次数;
根据所述热度信息,生成所述轨迹迁移区域在预设时间段内的热力图。
4.根据权利要求1至3中任一项所述的方法,其中,对所述位置点进行聚类处理,获取轨迹迁移区域,包括:
采用具有噪声的基于密度的聚类算法,对所述位置点进行聚类处理,获取轨迹迁移区域,其中,所述具有噪声的基于密度的聚类算法中位置点的邻域集为所述位置点的相关geohash区域中所包含的位置点。
5.根据权利要求4所述的方法,其中,所述相关geohash区域为所述位置点所属的中心geohash区域,以及与所述中心geohash区域相邻的8个相邻geohash区域。
6.根据权利要求1至3中任一项所述的方法,其中,基于不同轨迹迁移区域中具有相邻定位时间的位置点,确定不同轨迹迁移区域之间的迁移轨迹和迁移时间,所述迁移轨迹的迁移时间为所述相邻定位时间,包括:
基于具有相邻定位时间的两个位置点,确定候选迁移轨迹;
将起止位置点分别属于不同轨迹迁移区域的候选迁移轨迹,确定为不同轨迹迁移区域之间的迁移轨迹,并将起止位置点的相邻定位时间确定为所述迁移轨迹的迁移时间。
7.根据权利要求6所述的方法,其中,在基于具有相邻定位时间的两个位置点,确定候选迁移轨迹之前,还包括:
排除噪声位置点,所述噪声位置点为不属于任一轨迹迁移区域的位置点。
8.根据权利要求1至3中任一项所述的方法,其中,根据同类迁移轨迹在每个行为周期中的迁移时间,对所述同类迁移轨迹的迁移时间进行校正,包括:
对同类迁移轨迹在每个行为周期中的迁移时间,按照预设时间粒度进行离散化处理,获得同类迁移轨迹在每个行为周期中的迁移时间分布;
对所述同类迁移轨迹在每个行为周期中的迁移时间分布进行叠加处理,获得所述同类迁移轨迹的总体迁移时间分布;
根据所述同类迁移轨迹的总体迁移时间分布,对所述同类迁移轨迹的迁移时间进行校正。
9.根据权利要求8所述的方法,其中,根据所述迁移轨迹的总体迁移时间分布,对所述同类迁移轨迹的迁移时间进行校正,包括:
根据所述同类迁移轨迹的总体迁移时间分布,将分布值大于第一阈值的时间区间确定核心时间段;
根据所述核心时间段,确定所述同类迁移轨迹的迁移时间。
10.根据权利要求9所述的方法,其中,根据所述核心时间段,确定所述同类迁移轨迹的迁移时间,包括:
若所述核心时间段为连续的时间段,则将所述核心时间段所覆盖的时间确定为所述同类迁移轨迹的迁移时间;
若所述核心时间段为非连续的时间段,则将所述核心时间段的起始时间至截止时间所覆盖的时间确定为所述同类迁移轨迹的迁移时间。
11.一种确定车辆网点的设备,其中,该设备包括:
数据获取模块,用于获取用户多个行为周期的位置点以及所述位置点对应的定位时间,所述定位时间为记录所述位置点的时间;
聚类模块,用于对所述位置点进行聚类处理,获取轨迹迁移区域,每个轨迹迁移区域对应于聚类处理获得的一个类别;
轨迹生成模块,用于基于不同轨迹迁移区域中具有相邻定位时间的位置点,确定不同轨迹迁移区域之间的迁移轨迹和迁移时间,所述迁移轨迹的迁移时间为所述相邻定位时间;
校正模块,用于根据同类迁移轨迹在每个行为周期中的迁移时间,对所述同类迁移轨迹的迁移时间进行校正,所述同类迁移轨迹为起止轨迹迁移区域相同的迁移轨迹;
信息处理模块,用于根据所述迁移轨迹和迁移时间,确定预设时间段内关于迁移轨迹的轨迹迁移区域的热度信息,所述热度信息为用户进入和/或离开轨迹迁移区域的次数;
网点确定模块,用于根据所述热度信息,确定车辆的网点地址以及所述网点地址的车辆数量。
12.一种迁移轨迹生成设备,其中,该设备包括:
数据获取模块,用于获取用户多个行为周期的位置点以及所述位置点对应的定位时间,所述定位时间为记录所述位置点的时间;
聚类模块,用于对所述位置点进行聚类处理,获取轨迹迁移区域,每个轨迹迁移区域对应于聚类处理获得的一个类别;
轨迹生成模块,用于基于不同轨迹迁移区域中具有相邻定位时间的位置点,确定不同轨迹迁移区域之间的迁移轨迹和迁移时间,所述迁移轨迹的迁移时间为所述相邻定位时间;
校正模块,用于根据同类迁移轨迹在每个行为周期中的迁移时间,对所述同类迁移轨迹的迁移时间进行校正,所述同类迁移轨迹为起止轨迹迁移区域相同的迁移轨迹。
13.一种热力图生成设备,其中,该设备包括:
数据获取模块,用于获取用户多个行为周期的位置点以及所述位置点对应的定位时间,所述定位时间为记录所述位置点的时间;
聚类模块,用于对所述位置点进行聚类处理,获取轨迹迁移区域,每个轨迹迁移区域对应于聚类处理获得的一个类别;
轨迹生成模块,用于基于不同轨迹迁移区域中具有相邻定位时间的位置点,确定不同轨迹迁移区域之间的迁移轨迹和迁移时间,所述迁移轨迹的迁移时间为所述相邻定位时间;
校正模块,用于根据同类迁移轨迹在每个行为周期中的迁移时间,对所述同类迁移轨迹的迁移时间进行校正,所述同类迁移轨迹为起止轨迹迁移区域相同的迁移轨迹;
信息处理模块,用于根据所述迁移轨迹和迁移时间,确定预设时间段内关于迁移轨迹的轨迹迁移区域的热度信息,所述热度信息为用户进入和/或离开轨迹迁移区域的次数;
图形生成模块,用于根据所述热度信息,生成所述轨迹迁移区域在预设时间段内的热力图。
14.根据权利要求11至13中任一项所述的设备,其中,所述聚类模块,用于采用具有噪声的基于密度的聚类算法,对所述位置点进行聚类处理,获取轨迹迁移区域,其中,所述具有噪声的基于密度的聚类算法中位置点的邻域集为所述位置点的相关geohash区域中所包含的位置点。
15.根据权利要求14所述的设备,其中,所述相关geohash区域为所述位置点所属的中心geohash区域,以及与所述中心geohash区域相邻的8个相邻geohash区域。
16.根据权利要求11至13中任一项所述的设备,其中,所述轨迹生成模块,用于基于具有相邻定位时间的两个位置点,确定候选迁移轨迹;将起止位置点分别属于不同轨迹迁移区域的候选迁移轨迹,确定为不同轨迹迁移区域之间的迁移轨迹,并将起止位置点的相邻定位时间确定为所述迁移轨迹的迁移时间。
17.根据权利要求16所述的设备,其中,所述轨迹生成模块,还用于在基于具有相邻定位时间的两个位置点,确定候选迁移轨迹之前,排除噪声位置点,所述噪声位置点为不属于任一轨迹迁移区域的位置点。
18.根据权利要求11至13中任一项所述的设备,其中,所述校正模块,用于对同类迁移轨迹在每个行为周期中的迁移时间,按照预设时间粒度进行离散化处理,获得同类迁移轨迹在每个行为周期中的迁移时间分布;对所述同类迁移轨迹在每个行为周期中的迁移时间分布进行叠加处理,获得所述同类迁移轨迹的总体迁移时间分布;根据所述同类迁移轨迹的总体迁移时间分布,对所述同类迁移轨迹的迁移时间进行校正。
19.根据权利要求18所述的设备,其中,所述校正模块,用于根据所述同类迁移轨迹的总体迁移时间分布,将分布值大于第一阈值的时间区间确定核心时间段;根据所述核心时间段,确定所述同类迁移轨迹的迁移时间。
20.根据权利要求19所述的设备,其中,所述校正模块,用于在所述核心时间段为连续的时间段时,将所述核心时间段所覆盖的时间确定为所述同类迁移轨迹的迁移时间;以及在所述核心时间段为非连续的时间段时,将将所述核心时间段的起始时间至截止时间所覆盖的时间确定为所述同类迁移轨迹的迁移时间。
21.一种计算设备,其中,该设备包括用于存储计算机程序指令的存储器和用于执行计算机程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发所述设备执行权利要求1至10中任一项所述的方法。
22.一种计算机可读介质,其上存储有计算机程序指令,所述计算机可读指令可被处理器执行以实现如权利要求1至10中任一项所述的方法。
CN202010229588.3A 2020-03-27 2020-03-27 迁移轨迹、热力图生成及网点确定的方法、设备 Pending CN113449217A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010229588.3A CN113449217A (zh) 2020-03-27 2020-03-27 迁移轨迹、热力图生成及网点确定的方法、设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010229588.3A CN113449217A (zh) 2020-03-27 2020-03-27 迁移轨迹、热力图生成及网点确定的方法、设备

Publications (1)

Publication Number Publication Date
CN113449217A true CN113449217A (zh) 2021-09-28

Family

ID=77807785

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010229588.3A Pending CN113449217A (zh) 2020-03-27 2020-03-27 迁移轨迹、热力图生成及网点确定的方法、设备

Country Status (1)

Country Link
CN (1) CN113449217A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114020858A (zh) * 2021-11-05 2022-02-08 安徽宇呈数据技术有限公司 一种实现步骑行地图数据采集、更新的方法及系统
CN115601393A (zh) * 2022-09-29 2023-01-13 清华大学(Cn) 轨迹生成方法、装置、设备和存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI226010B (en) * 2003-11-25 2005-01-01 Inst Information Industry System and method for object tracking path generation and computer-readable medium thereof
CN103729446A (zh) * 2013-12-30 2014-04-16 广州金山网络科技有限公司 一种用户操作数据的处理方法、处理装置及服务器
CN105243525A (zh) * 2015-09-02 2016-01-13 深圳市金立通信设备有限公司 一种用户提醒方法及终端
US20160240063A1 (en) * 2013-10-25 2016-08-18 Beijing Qihoo Technology Company Limited Position information prompting method, device and system
CN106790468A (zh) * 2016-12-10 2017-05-31 武汉白虹软件科技有限公司 一种分析用户WiFi活动轨迹规律的分布式实现方法
WO2017092418A1 (zh) * 2015-12-04 2017-06-08 杭州海康威视数字技术股份有限公司 过车记录处理方法和装置
CN107491895A (zh) * 2017-08-30 2017-12-19 国信优易数据有限公司 一种共享单车停放点的确定方法及装置
CN110910054A (zh) * 2018-09-17 2020-03-24 北京京东尚科信息技术有限公司 轨迹的确定方法和装置、时间的推荐方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI226010B (en) * 2003-11-25 2005-01-01 Inst Information Industry System and method for object tracking path generation and computer-readable medium thereof
US20160240063A1 (en) * 2013-10-25 2016-08-18 Beijing Qihoo Technology Company Limited Position information prompting method, device and system
CN103729446A (zh) * 2013-12-30 2014-04-16 广州金山网络科技有限公司 一种用户操作数据的处理方法、处理装置及服务器
CN105243525A (zh) * 2015-09-02 2016-01-13 深圳市金立通信设备有限公司 一种用户提醒方法及终端
WO2017092418A1 (zh) * 2015-12-04 2017-06-08 杭州海康威视数字技术股份有限公司 过车记录处理方法和装置
CN106790468A (zh) * 2016-12-10 2017-05-31 武汉白虹软件科技有限公司 一种分析用户WiFi活动轨迹规律的分布式实现方法
CN107491895A (zh) * 2017-08-30 2017-12-19 国信优易数据有限公司 一种共享单车停放点的确定方法及装置
CN110910054A (zh) * 2018-09-17 2020-03-24 北京京东尚科信息技术有限公司 轨迹的确定方法和装置、时间的推荐方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
谢青成;毛嘉莉;刘婷;: "城市共享单车的动态调度策略", 华东师范大学学报(自然科学版), no. 06 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114020858A (zh) * 2021-11-05 2022-02-08 安徽宇呈数据技术有限公司 一种实现步骑行地图数据采集、更新的方法及系统
CN115601393A (zh) * 2022-09-29 2023-01-13 清华大学(Cn) 轨迹生成方法、装置、设备和存储介质
CN115601393B (zh) * 2022-09-29 2024-05-07 清华大学 轨迹生成方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
CN106649331B (zh) 商圈识别方法及设备
CN107766377B (zh) 一种监控数据查询方法及装置
US20220101350A1 (en) Information pushing method and apparatus
EP0290679A1 (fr) Dispositif de réception et de traitement de messages d'information routière
CN110221959B (zh) 应用程序的测试方法、设备以及计算机可读介质
CN113449217A (zh) 迁移轨迹、热力图生成及网点确定的方法、设备
CN108694237A (zh) 处理车辆位置数据的方法、设备、可视化系统和用户终端
CN108734325A (zh) 规划路径的评价方法及装置
CN111597279B (zh) 基于深度学习的信息预测方法及相关设备
CN103793439A (zh) 一种实时检索信息获取方法、装置及服务器
CN103488525A (zh) 确定与情景相关的用户偏好
CN111488414A (zh) 道路任务匹配方法、装置与设备
US8156162B2 (en) Storage method and search method for mark event on two-dimensional space
CN109544238A (zh) 用户行为追踪方法、装置、服务器和存储介质
CN108804507A (zh) 用户的住址位置确定方法及系统
CN114780556A (zh) 用于地图的更新频率确定方法及装置
US9710487B2 (en) Location-based ranking
CN108391235B (zh) 一种数据分析方法及装置
CN108875032B (zh) 区域类型确定方法及装置
CN117435819A (zh) 时空动态感知的兴趣点推荐方法、系统和存储介质
CN107270919B (zh) 公交路线分级方法、装置以及公交路线导航方法、装置
CN113176599A (zh) 地理位置确定方法、装置、设备及存储介质
CN114091727A (zh) 碳排放核算方法、装置、电子设备及可读取存储介质
CN109246623B (zh) 一种通信号码补全方法、装置及存储介质
CN111127065B (zh) 用户职住地的获取方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination